Files

StellaOps Bot 7e384ab610 feat: Implement IsolatedReplayContext for deterministic audit replay

- Added IsolatedReplayContext class to provide an isolated environment for replaying audit bundles without external calls.
- Introduced methods for initializing the context, verifying input digests, and extracting inputs for policy evaluation.
- Created supporting interfaces and options for context configuration.

feat: Create ReplayExecutor for executing policy re-evaluation and verdict comparison

- Developed ReplayExecutor class to handle the execution of replay processes, including input verification and verdict comparison.
- Implemented detailed drift detection and error handling during replay execution.
- Added interfaces for policy evaluation and replay execution options.

feat: Add ScanSnapshotFetcher for fetching scan data and snapshots

- Introduced ScanSnapshotFetcher class to retrieve necessary scan data and snapshots for audit bundle creation.
- Implemented methods to fetch scan metadata, advisory feeds, policy snapshots, and VEX statements.
- Created supporting interfaces for scan data, feed snapshots, and policy snapshots.

2025-12-23 07:46:40 +02:00

10 KiB

Raw Blame History

SPRINT_7000_0001_0003 - Explainability with Assumptions & Falsifiability

Sprint Metadata

Field	Value
Sprint ID	7000.0001.0003
Topic	Explainability with Assumptions & Falsifiability
Duration	2 weeks
Priority	HIGH
Status	DONE
Owner	Scanner Team + Policy Team
Working Directory	`src/Scanner/__Libraries/StellaOps.Scanner.Explainability/`, `src/Policy/__Libraries/StellaOps.Policy.Explainability/`

Objective

Implement auditor-grade explainability that answers four non-negotiable questions for every finding:

What exact evidence triggered this finding?
What code or binary path makes it reachable?
What assumptions are being made?
What would falsify this conclusion?

This addresses the advisory gap: "No existing scanner answers #4."

Prerequisites

Sprint 3500 (Score Proofs) complete
StellaOps.Scanner.EntryTrace.Risk module available
DSSE predicate schemas accessible

Delivery Tracker

ID	Task	Status	Assignee	Notes
7000.0003.01	Design assumption-set model (compiler flags, runtime config, feature gates)	DONE	Agent	Assumption.cs with enums
7000.0003.02	Implement `AssumptionSet` record in findings	DONE	Agent	AssumptionSet.cs, IAssumptionCollector.cs
7000.0003.03	Design falsifiability criteria model	DONE	Agent	FalsifiabilityCriteria.cs with enums
7000.0003.04	Add "what would disprove this?" to `RiskExplainer` output	DONE	Agent	FalsifiabilityGenerator.cs, RiskReport.cs
7000.0003.05	Implement evidence-density confidence scorer	DONE	Agent	EvidenceDensityScorer.cs with 8 factors
7000.0003.06	Add assumption-set to DSSE predicate schema	DONE	Agent	finding-explainability-predicate.schema.json + ExplainabilityPredicateSerializer
7000.0003.07	UI: Explainability widget with assumption drill-down	TODO		Deferred - Angular

Task Details

7000.0003.01: Assumption-Set Model Design

Description: Design the data model for tracking assumptions made during analysis.

Deliverables:

Assumption domain model:

public record Assumption(
    AssumptionCategory Category,
    string Key,
    string AssumedValue,
    string? ObservedValue,
    AssumptionSource Source,
    ConfidenceLevel Confidence
);

public enum AssumptionCategory
{
    CompilerFlag,          // -fstack-protector, -D_FORTIFY_SOURCE
    RuntimeConfig,         // Environment variables, config files
    FeatureGate,           // Feature flags, build variants
    LoaderBehavior,        // LD_PRELOAD, RPATH, symbol versioning
    NetworkExposure,       // Port bindings, firewall rules
    ProcessPrivilege       // Capabilities, seccomp, AppArmor
}

public enum AssumptionSource { Static, Dynamic, Inferred, Default }

AssumptionSet aggregate:

public record AssumptionSet(
    ImmutableArray<Assumption> Assumptions,
    int TotalCount,
    int VerifiedCount,
    int InferredCount,
    double AssumptionRisk   // Higher = more unverified assumptions
);

Acceptance Criteria:

All assumption categories covered
Confidence levels defined
Risk score derivable from assumptions

7000.0003.02: AssumptionSet in Findings

Description: Integrate assumption tracking into finding records.

Deliverables:

Update VulnerabilityFinding to include AssumptionSet

Assumption collector during scan:

public interface IAssumptionCollector
{
    void RecordAssumption(Assumption assumption);
    AssumptionSet Build();
}

Wire into Scanner Worker pipeline

Acceptance Criteria:

Every finding has AssumptionSet
Assumptions collected during analysis
Deterministic ordering

7000.0003.03: Falsifiability Criteria Model

Description: Design model for expressing what would disprove a finding.

Deliverables:

FalsifiabilityCriteria model:

public record FalsifiabilityCriteria(
    ImmutableArray<FalsificationCondition> Conditions,
    string HumanReadable
);

public record FalsificationCondition(
    FalsificationCategory Category,
    string Description,
    string? VerificationCommand,     // CLI command to verify
    string? VerificationQuery        // API query to verify
);

public enum FalsificationCategory
{
    CodeRemoved,           // "Vulnerable function call removed"
    PackageUpgraded,       // "Package upgraded past fix version"
    ConfigDisabled,        // "Vulnerable feature disabled via config"
    PathUnreachable,       // "Call path no longer reachable from entrypoint"
    RuntimeGuarded,        // "Runtime check prevents exploitation"
    SymbolUnresolved       // "Vulnerable symbol not linked"
}

Falsifiability generator per finding type

Acceptance Criteria:

Every finding has falsifiability criteria
Human-readable description
Verification command where applicable

7000.0003.04: RiskExplainer Enhancement

Description: Extend RiskExplainer to output falsifiability and assumptions.

Deliverables:

Update RiskReport to include:

public record RiskReport(
    RiskAssessment Assessment,
    string Explanation,
    ImmutableArray<string> Recommendations,
    AssumptionSet Assumptions,           // NEW
    FalsifiabilityCriteria Falsifiability // NEW
);

Natural language generation for:
- "This finding assumes..."
- "To disprove this finding, verify that..."

Acceptance Criteria:

Explanation includes assumptions
Explanation includes falsifiability
Language is auditor-appropriate

7000.0003.05: Evidence-Density Confidence Scorer

Description: Implement confidence scoring based on evidence density, not CVSS.

Deliverables:

EvidenceDensityScorer:

public interface IEvidenceDensityScorer
{
    ConfidenceScore Score(EvidenceBundle evidence, AssumptionSet assumptions);
}

public record ConfidenceScore(
    double Value,                  // 0.0 - 1.0
    ConfidenceTier Tier,           // Confirmed, High, Medium, Low, Speculative
    ImmutableArray<string> Factors // What contributed to score
);

public enum ConfidenceTier { Confirmed, High, Medium, Low, Speculative }

Scoring factors:
- Evidence count
- Evidence diversity (static + dynamic + runtime)
- Assumption penalty (more unverified = lower confidence)
- Corroboration bonus (multiple sources agree)

Acceptance Criteria:

Confidence derived from evidence, not CVSS
Deterministic scoring
Factors explainable

7000.0003.06: DSSE Predicate Schema Update

Description: Add assumption-set and falsifiability to DSSE predicate.

Deliverables:

Schema: stellaops.dev/predicates/finding@v2

{
  "$schema": "...",
  "type": "object",
  "properties": {
    "finding": { "$ref": "#/definitions/Finding" },
    "assumptions": {
      "type": "array",
      "items": { "$ref": "#/definitions/Assumption" }
    },
    "falsifiability": {
      "type": "object",
      "properties": {
        "conditions": { "type": "array" },
        "humanReadable": { "type": "string" }
      }
    },
    "evidenceConfidence": {
      "type": "object",
      "properties": {
        "value": { "type": "number" },
        "tier": { "type": "string" },
        "factors": { "type": "array" }
      }
    }
  }
}

Migration path from v1 predicates

Acceptance Criteria:

Schema validates
Backward compatible
Registered in predicate registry

Description: Angular component for assumption and falsifiability drill-down.

Deliverables:

<stellaops-finding-explainer> component
Tabs: Evidence | Assumptions | "How to Disprove"
Assumption table with confidence indicators
Falsifiability checklist with verification commands
Copy-to-clipboard for verification commands

Acceptance Criteria:

Renders for all finding types
Assumptions sortable/filterable
Verification commands copyable
Accessible (WCAG 2.1 AA)

Testing Requirements

Test Type	Location	Coverage
Unit tests	`StellaOps.Scanner.Explainability.Tests/`	Models, scorers
Integration tests	`StellaOps.Scanner.WebService.Tests/Explainability/`	API endpoints
UI tests	`src/Web/StellaOps.Web/tests/explainability/`	Component tests
Golden fixtures	`src/Scanner/__Tests/Fixtures/Explainability/`	Deterministic output

Documentation Updates

Document	Update Required
`docs/explainability/assumption-model.md`	CREATE - Assumption-set design
`docs/explainability/falsifiability.md`	CREATE - Falsifiability guide
`docs/schemas/finding-predicate-v2.md`	CREATE - Schema documentation
`docs/api/scanner-findings-api.md`	UPDATE - Explainability fields

Decisions & Risks

ID	Decision/Risk	Status	Resolution
D1	How to handle assumptions for legacy findings?	OPEN	Propose: empty set with "legacy" flag
D2	Falsifiability verification commands: shell or API?	OPEN	Propose: both where applicable
R1	Performance impact of assumption collection	OPEN	Profile and optimize

Execution Log

Date (UTC)	Update	Owner
2025-12-22	Sprint created from advisory gap analysis	Agent
2025-12-22	Tasks 1-6 complete: Assumption models, AssumptionCollector, Falsifiability models, FalsifiabilityGenerator, EvidenceDensityScorer, RiskReport, DSSE predicate schema with serializer. 93 tests passing. Task 7 (Angular UI) deferred.	Agent

Required Reading

src/Scanner/__Libraries/StellaOps.Scanner.EntryTrace/Risk/AGENTS.md
docs/modules/scanner/architecture.md
docs/product-advisories/archived/*/19-Dec-2025 - Benchmarking Container Scanners Against Stella Ops.md (Section 4: Explainability)

10 KiB Raw Blame History

SPRINT_7000_0001_0003 - Explainability with Assumptions & Falsifiability

Sprint Metadata

Objective

Prerequisites

Delivery Tracker

Task Details

7000.0003.01: Assumption-Set Model Design

7000.0003.02: AssumptionSet in Findings

7000.0003.03: Falsifiability Criteria Model

7000.0003.04: RiskExplainer Enhancement

7000.0003.05: Evidence-Density Confidence Scorer

7000.0003.06: DSSE Predicate Schema Update

7000.0003.07: UI Explainability Widget

Testing Requirements

Documentation Updates

Decisions & Risks

Execution Log

Required Reading

10 KiB

Raw Blame History