← Esperimento

Quadro della gravità media della Teoria del filamento di energia (Energy Filament Theory, EFT), a confronto con il riferimento NFW minimo per materia oscura fredda (DM)

Autore: Guanglin Tu
Email: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Affiliazione: Gruppo di lavoro EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Cina)
Versione: v1.1 | Data: 2026-02-14

Preprint (non sottoposto a peer review) | Questa versione è destinata alla diffusione pubblica e alla verifica riproducibile; non rappresenta la versione finale di una rivista.

Licenza: rapporto (CC BY-NC-ND 4.0); pacchetto completo di riproduzione (CC BY 4.0).

Rapporto in versione pubblicabile (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Pacchetto completo di riproduzione (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Sommario esecutivo (Executive Summary)

Questo rapporto è una versione completa archiviata su Zenodo (edizione d’archivio). Offre una catena integrata e verificabile che va dai dati al registro dei modelli, dal confronto equo al test di chiusura, fino ai materiali di riproduzione. L’Appendice B (P1A) funge da supplemento di robustezza: concentra un test di pressione basato su “una riferimento DM più standard + un errore sistematico chiave del lensing”, per valutare quanto le conclusioni principali siano sensibili a una modellizzazione DM più realistica e al trattamento degli errori sistematici del lensing.

Conclusioni principali (quattro frasi direttamente citabili; vedi sezione 2.4):

(1) Nel fit delle curve di rotazione (RC), la famiglia EFT supera in modo netto DM_RAZOR in tutte le combinazioni di funzioni kernel e prior; il miglioramento tipico è Δlog𝓛_RC ≈ 10^3 (vedi Tabella S1a).
(2) Nel test di chiusura RC→GGL, EFT mostra una trasferibilità predittiva più forte tra sonde: l’intensità di chiusura Δlog𝓛_closure (True−Perm) è significativamente superiore a quella di DM_RAZOR, e la differenza rimane robusta rispetto alle scansioni di shrinkage della covarianza, R_min e σ_int (vedi Figura S3 e Tabella S1b).
(3) Nel fit congiunto (RC+GGL), EFT mantiene un vantaggio stabile; inoltre, nel controllo negativo che distrugge la mappatura condivisa, tale vantaggio collassa, sostenendo l’interpretazione secondo cui “l’effetto gravitazionale medio” proviene dalla mappatura condivisa e non da una coincidenza di fit (vedi Figura S4).
(4) L’Appendice B (P1A), senza aumentare in modo rilevante la dimensionalità, sottopone il lato DM a un test di pressione con moduli di riferimento DM più standard e un parametro nuisance per un errore sistematico chiave del lensing; questi miglioramenti non eliminano il vantaggio di chiusura di EFT (vedi Tabella B1 e Figura B1).

Disponibilità di dati e codice: rapporto Concept DOI 10.5281/zenodo.18526334; pacchetto completo di riproduzione Concept DOI 10.5281/zenodo.18526286. Per l’Appendice B (P1A), i tag corrispondenti sono run_tag=20260213_151233, closure_tag=20260213_161731 e joint_tag=20260213_195428.

1 Abstract

Confrontiamo quantitativamente due quadri teorici sugli stessi dati e con lo stesso protocollo statistico: il modello di “correzione gravitazionale media” proposto dalla Teoria del filamento di energia (Energy Filament Theory, EFT; da non confondere con il comune acronimo Effective Field Theory) e il modello baseline di aloni NFW di materia oscura fredda (DM_RAZOR). DM_RAZOR è scelto deliberatamente come “riferimento DM minima”: alone NFW + relazione c–M fissata (senza halo-to-halo scatter), così da offrire un confronto auditabile e riproducibile. Va inoltre precisato che, in questo lavoro, EFT è trattata come una parametrizzazione fenomenologica, di tipo MOND, di Campo effettivo/risposta efficace, da testare entro un protocollo statistico unificato; non se ne deriva qui il principio microscopico primo.

I dati includono: 2295 punti di velocità delle curve di rotazione SPARC (104 galassie, 20 RC-bin), dopo preprocessing e binning uniformi, e la densità superficiale equivalente ΔΣ(R) del lensing debole galassia-galassia (GGL) da KiDS-1000 (4 bin di massa stellare × 15 punti R per bin, per un totale di 60 punti, con covarianza completa).

Eseguiamo in sequenza l’inferenza RC-only, il test di chiusura RC→GGL (closure), l’inferenza GGL-only e l’inferenza congiunta RC+GGL; un audit di coerenza garantisce la tracciabilità di tutti i valori citati. Sotto un registro parametrico rigoroso e vincoli di mappatura condivisa (DM: 20 parametri log M200_bin; EFT: 20 parametri log V0_bin + 1 scala globale log ℓ), la famiglia EFT supera nettamente DM_RAZOR nel fit congiunto: ΔlogL_total = 1155–1337 rispetto a DM_RAZOR. Ancora più importante, il test di chiusura mostra che il posteriore RC possiede un potere predittivo non banale sui dati GGL: EFT raggiunge ΔlogL_closure = 172–281, contro 127 per DM_RAZOR. Quando la mappatura RC-bin→GGL-bin viene randomizzata per gruppi, il segnale di chiusura collassa a 6–23, confermando che non si tratta di una coincidenza statistica né di un bias d’implementazione. Nelle scansioni sistematiche su σ_int, R_min e shrinkage della covarianza, il vantaggio relativo di EFT rimane positivo e di ordine stabile. Per rispondere alla critica comune secondo cui “la riferimento DM è troppo debole / gli errori sistematici vengono scambiati per fisica”, l’Appendice B (P1A) introduce un test di pressione DM più standard, ma ancora a bassa dimensione e auditabile, con scatter c–M gerarchico + prior, proxy core a un parametro, lensing m e modello combinato DM_STD; con lo stesso protocollo di chiusura, questi rafforzamenti non eliminano il vantaggio di EFT (vedi Tabella B1/Figura B1).

Parole chiave: curve di rotazione; lensing debole galassia-galassia; test di chiusura; EFT; materia oscura fredda; inferenza bayesiana

2 Introduzione e panoramica dei risultati

Le curve di rotazione (RC) e il lensing debole galassia-galassia (GGL) sono due sonde gravitazionali complementari: le RC vincolano il potenziale dinamico nel piano del disco e la relazione tra accelerazione radiale (RAR), mentre il GGL misura la distribuzione di massa proiettata e la risposta gravitazionale alla scala degli aloni. Per qualsiasi teoria candidata, il punto decisivo non è se riesca a fittare separatamente i due insiemi di dati, ma se riesca a spiegarli in modo coerente sotto la stessa mappatura tra insiemi di dati e gli stessi vincoli condivisi.

Per questo motivo il protocollo statistico centrale del lavoro è il “test di chiusura (closure test)”: prima si usa il posteriore RC-only per predire in avanti il GGL, poi lo si confronta con un controllo negativo ottenuto permutando la mappatura RC-bin→GGL-bin (permutation / shuffle). In questo modo si valuta la trasferibilità predittiva tra dataset (predictive transferability) e si esclude un falso segnale dovuto a bias d’implementazione o fit accidentale.

Posizionamento teorico e ambito: questo articolo non mira a fornire una derivazione microscopica di primo principio di EFT (Teoria del filamento di energia), né una formulazione relativistica completa. Al contrario, trattiamo EFT come una parametrizzazione efficace/di risposta efficace, a bassa dimensione e di tipo MOND, descritta da una funzione kernel f(x) e da una scala globale ℓ; sotto un registro parametrico rigoroso, ne testiamo la coerenza tra insiemi di dati e la capacità predittiva trasferibile tramite il test di chiusura RC→GGL.

Piano di ricerca e dichiarazione d’ambito: questo lavoro fa parte di un programma osservativo P-series in corso. Nei dati disponibili alla scala galattica cerchiamo due possibili contributi efficaci di fondo: (i) un “fondo gravitazionale” (mean gravity floor) descrivibile come risposta gravitazionale media dopo coarse-graining, e (ii) un “fondo di rumore” (stochastic/noise floor) associato a fluttuazioni di processi microscopici. In questo articolo (P1) ci concentriamo solo sul primo: senza introdurre alcuna ipotesi su un meccanismo microscopico di produzione, usiamo il test di chiusura RC→GGL per cercare tracce osservative del fondo gravitazionale medio e confrontarlo con una riferimento DM auditabile sotto un protocollo uniforme. Come immagine fisica euristica, se esistono gradi di libertà a vita breve, il loro decadimento/annichilazione può convertire massa a riposo in energia e momento trasportati da altri gradi di libertà; a livello efficace ciò corrisponde naturalmente a una decomposizione “contributo medio + contributo fluttuante”. Qui però non modelliamo quantitativamente tale immagine microscopica.

Per evitare sovrainterpretazioni, i confini dell’articolo sono i seguenti:
• Cosa fa l’articolo: misura la trasferibilità predittiva tra insiemi di dati con un test di chiusura sotto un registro parametrico e una mappatura condivisa rigorosi, confrontando in modo riproducibile la risposta gravitazionale media EFT e una riferimento DM.
• Cosa non fa: non discute meccanismi microscopici di produzione, abbondanze, tempi di vita o vincoli cosmologici; non modella il termine stocastico corrispondente al “fondo di rumore”.
• Cosa non sostiene: non mira a “confutare la materia oscura”; P1 non emette un verdetto finale sull’esistenza del fondo, ma riporta un’evidenza di fase: nel dominio di misura robusto scelto qui, i dati preferiscono modelli che includono una risposta gravitazionale media.

Precisiamo inoltre che DM_RAZOR rappresenta solo una baseline NFW minima e auditabile (c–M fissata e senza scatter; senza Adiabatic Contraction, feedback core, non sfericità o termini ambientali). La conclusione principale del testo è quindi delimitata con rigore: sotto questa baseline minima e i vincoli severi di registro parametrico/mappatura, EFT mostra una coerenza tra insiemi di dati più forte. Per rispondere a una domanda ricorrente — se una baseline ΛCDM più standard e una modellizzazione degli errori sistematici chiave del lensing cambierebbero in modo sostanziale il risultato — raccogliamo nell’Appendice B (P1A: test di pressione di standardizzazione della riferimento DM) moduli DM rafforzati e una nuisance sul lato lensing, mantenendo esattamente lo stesso protocollo di mappatura condivisa e chiusura del testo principale (vedi Tabella B1/Figura B1).

2.1 Tab S1a–S1b: riepilogo degli indicatori chiave (Strict)

La Tabella S1a riporta i principali indicatori del fit congiunto (RC+GGL: logL, ΔlogL, AICc, BIC); la Tabella S1b riporta gli indicatori di chiusura e robustezza (closure, controllo negativo shuffle, intervalli delle scansioni σ_int / R_min / cov-shrink). Tutti i valori provengono dalla tabella di riepilogo rigorosa Tab_Z1_master_summary e sono tracciabili voce per voce nel pacchetto archiviato.

Tabella S1a | Principali indicatori di confronto del fit congiunto (RC+GGL, Strict).

Modello (workspace)

Kernel W

k

logL_total congiunta (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabella S1b | Indicatori di chiusura e robustezza (Strict).

Modello (workspace)

ΔlogL di chiusura (true–perm)

ΔlogL dopo shuffle del controllo negativo

Intervallo ΔlogL nella scansione σ_int

Intervallo ΔlogL nella scansione R_min

Intervallo ΔlogL nella scansione cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: intensità di chiusura (RC-only → predizione GGL)

L’intensità di chiusura è definita come ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: sui campioni posteriori RC-only si predice in avanti il GGL e si confronta il risultato con il controllo negativo ottenuto permutando la mappatura RC-bin→GGL-bin.

Figura S3 | Intensità di chiusura (più alta è meglio): vantaggio medio di log-verosimiglianza nella predizione RC-only → GGL.


2.3 Fig S4: confronto principale del fit congiunto (RC+GGL)

Il vantaggio nel fit congiunto è definito come ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). A parità di dati, mappatura e dimensione parametrica approssimativamente simile, la famiglia EFT ottiene una log-verosimiglianza congiunta molto più alta.

Figura S4 | Vantaggio del fit congiunto (più alto è meglio): best logL_total di RC+GGL rispetto a DM_RAZOR.


2.4 Quattro conclusioni (citabili direttamente)

(1) Nell’analisi congiunta uniforme delle curve di rotazione SPARC e del lensing debole KiDS-1000, i modelli del quadro EFT di gravità media superano sistematicamente DM_RAZOR sotto un protocollo di confronto rigoroso: ΔlogL_total = 1155–1337 rispetto a DM_RAZOR.

(2) Il test di chiusura RC→GGL mostra una coerenza predittiva più forte per EFT: ΔlogL_closure = 172–281, contro 127 per DM_RAZOR; inoltre, quando la mappatura RC-bin→GGL-bin viene randomizzata per gruppi, il segnale di chiusura collassa a 6–23, indicando che esso dipende dalla corretta mappatura tra insiemi di dati e non da un fit accidentale.

(3) Le scansioni sistematiche di σ_int, R_min e shrinkage della covarianza non cambiano né il segno né l’ordine di grandezza di “EFT > DM_RAZOR”, mostrando che la conclusione è robusta rispetto a perturbazioni sistematiche comuni.

(4) L’Appendice B (P1A) rafforza la riferimento DM in modo “standardizzato e auditabile” sotto lo stesso protocollo di chiusura: mantiene tre miglioramenti legacy a un parametro (SCAT/AC/FB) e aggiunge scatter c–M gerarchico + prior, proxy core a un parametro e calibrazione dello shear del lensing m (con il modello combinato DM_STD). I risultati mostrano che solo il ramo feedback/core produce un piccolo guadagno netto nell’intensità di chiusura (122.21→129.45, ΔΔlogL_closure≈+7.25); gli altri miglioramenti contribuiscono poco o negativamente alla chiusura. Dunque la conclusione principale non dipende dall’ipotesi che DM_RAZOR sia troppo debole.

3 Dati e preprocessing

Questo studio usa due tipi di dati pubblici e completa download, verifica (sha256) e preprocessing con script tracciabili all’interno del progetto. Per garantire un confronto equo tra modelli, tutti i workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) condividono esattamente gli stessi prodotti di dati e la stessa mappatura di binning.


3.1 Curve di rotazione (RC, SPARC)

I dati RC provengono dai file Rotmod_LTG del database SPARC (175 file rotmod). Dopo il preprocessing, il campione modellato comprende 104 galassie, 2295 punti (r, V_obs) e una suddivisione in 20 RC-bin secondo massa stellare e altre regole. Ogni punto contiene il raggio r (kpc), la velocità osservata V_obs (km/s), l’errore σ_obs e le componenti di velocità di gas, disco e bulge (V_gas, V_disk, V_bul).


3.2 Lensing debole (GGL, KiDS-1000 / Brouwer+2021)

I dati GGL usano la densità superficiale equivalente ΔΣ(R) ricavata da Brouwer et al. (2021) su KiDS-1000, Fig. 3 (4 bin di massa stellare, 15 punti R per bin), insieme alla covarianza completa fornita dagli autori. Nel progetto la covarianza long-form originale viene ricostruita come matrice 15×15 per ogni bin; l’audit Stage-B ne verifica dimensioni e ragionevolezza numerica.


3.3 Mappatura RC-bin → GGL-bin e dimensione totale del campione

I 4 bin di massa del GGL sono collegati ai 20 bin RC tramite una mappatura fissa: ogni GGL-bin corrisponde a 5 RC-bin, e il contributo dei RC-bin viene mediato con pesi proporzionali al numero di galassie. La mappatura resta invariata in tutti i modelli ed è il vincolo centrale per il confronto equo tra test di chiusura e fit congiunto. Il numero finale di punti dati congiunti è n_total = 2355 (RC=2295, GGL=60).

4 Modelli e metodi statistici


4.1 Specifica matematica minima di EFT e DM (auditabile/testabile)

Questa sezione fornisce la specifica matematica minima direttamente corrispondente all’implementazione.

(a) Modello delle curve di rotazione (RC)

Per ogni punto RC (r, V_obs, σ_obs) usiamo una somma di componenti: V_mod²(r) = V_bar²(r) + V_extra²(r). Qui V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Nei risultati principali adottiamo Υ_d = Υ_b = 0.5, in linea con la raccomandazione empirica SPARC e utile anche a ridurre libertà non necessarie.

(b) Correzione gravitazionale media EFT (EFT)

Il termine extra di EFT è parametrizzato come “velocità quadratica media”: V_extra²(r) = V0_bin² · f(r/ℓ). Qui V0_bin è il parametro di ampiezza di ciascun RC-bin (20 parametri), ℓ è la scala globale (1 parametro) e f(x) è una funzione kernel adimensionale. Le forme kernel confrontate in questo articolo, tutte senza ulteriori libertà continue, sono:

Motivazione fisica (estesa): EFT interpreta la risposta gravitazionale extra su scala galattica come una risposta efficace ottenuta per coarse-graining/media su scala finita di interazioni più microscopiche. In questo lavoro non assumiamo un meccanismo microscopico specifico; adottiamo invece una parametrizzazione minima e auditabile per condurre un confronto controllato sotto un protocollo statistico uniforme.

Per renderlo più intuitivo, il termine extra può essere scritto in forma di accelerazione: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Quando r≫ℓ, f→1 e V_extra→V0_bin, producendo un contributo di velocità extra quasi piatto nelle regioni esterne; quando r≪ℓ e f(x)≈x, si può introdurre una scala di accelerazione caratteristica a0,bin≈V0_bin²/ℓ, a meno di un fattore O(1) del kernel. Ciò fornisce un’intuizione di scala, in stile MOND, per la transizione interno-esterno.

La famiglia discreta di kernel usata qui (none/exponential/yukawa/powerlaw_tail) può essere vista come un proxy a bassa dimensione di diverse “pendenze iniziali / rapidità di transizione / code a lungo raggio” — per esempio una schermatura Yukawa-like contro una risposta a coda più lunga. Essa serve come test di pressione di robustezza, non come esplorazione esaustiva dello spazio dei modelli. Per il lensing debole costruiamo da V_avg(r) massa e densità di inviluppo equivalenti, poi le proiettiamo per ottenere ΔΣ(R); tale densità equivalente va intesa come descrizione efficace del potenziale di lensing sotto l’ipotesi di simmetria sferica e mappatura di campo debole (i dettagli completi sono spostati nell’Appendice A).

Tutte le forme kernel precedenti soddisfano f(x)→1 per x→∞, cioè V_extra²→V0² per saturazione; per x≪1 producono invece una crescita lineare o sublineare: per esempio exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Di conseguenza, i diversi kernel presentano differenze osservabili nel raggio piccolo, nella rapidità di transizione e nella coda esterna, distinguibili tramite il fit congiunto e il test di chiusura RC+GGL.

La predizione EFT di ΔΣ(R) nel lensing debole viene ottenuta risalendo da V_avg(r) a massa e densità di inviluppo, e poi integrando in proiezione: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). L’implementazione numerica usa una griglia logaritmica e un raffinamento adattivo in caso di anomalie, per garantire stabilità e riproducibilità.

(c) DM_RAZOR: baseline NFW di aloni di materia oscura fredda

Precisiamo inoltre che DM_RAZOR rappresenta solo una baseline NFW minima e auditabile (c–M fissata e senza scatter; senza Adiabatic Contraction, feedback core, non sfericità o termini ambientali). Per ridurre il rischio di una “strawman baseline”, non affermiamo che tali effetti siano inesistenti; al contrario, li includiamo in modo a bassa dimensione e auditabile nell’Appendice B (P1A) come test di pressione: trattamento gerarchico dello scatter c–M, proxy core e nuisance di calibrazione dello shear nel lensing.


4.2 Registro dei modelli e confronto equo (parametri condivisi = definizione di chiusura)

Il numero di parametri dell’insieme di confronto principale è: DM_RAZOR k=20; famiglia EFT k=21, con 1 parametro extra per la scala globale log ℓ. Tutti i modelli condividono gli stessi dati RC, gli stessi dati GGL e la stessa covarianza, la stessa mappatura RC-bin→GGL-bin, lo stesso termine barionico e le stesse conversioni di unità. Inoltre, le forme kernel (none / exponential / yukawa / powerlaw_tail) sono scelte discrete e non introducono parametri continui aggiuntivi; così si evita di ottenere un vantaggio semplicemente grazie a “un grado di libertà in più”.


4.3 Likelihood, prior e campionatore

La likelihood RC è gaussiana diagonale: σ_eff² = σ_obs² + σ_int²; nei risultati principali fissiamo σ_int=5 km/s e la scansioniamo in Run-5. La likelihood GGL è gaussiana con covarianza completa per ciascun bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). L’obiettivo congiunto è logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). I prior sono soprattutto vincoli di fattibilità fisica, cioè intervalli su log ℓ, log V0 e log M200; quando si attivano Υ e σ_int liberi, si usano prior debolmente informativi (vedi dettagli dell’implementazione e del pacchetto release).

Il campionatore usa una random walk Metropolis adattiva a blocchi: a ogni passo aggiorna solo un sottoblocco casuale dello spazio dei parametri, aumentando l’accettazione in alta dimensione; la dimensione del passo viene adattata leggermente tramite il tasso di accettazione su finestra, con target intorno a 0.25. I risultati principali usano la modalità quick (per esempio n_steps=800), e per ogni workspace producono trace, residui e grafici PPC per audit manuale e script.


4.4 Test di chiusura e controllo negativo (definizione)

Il test di chiusura (Run-2) verifica, senza rifittare GGL, se il posteriore RC-only sia in grado di predire GGL. La procedura è: dai campioni posteriori RC-only si generano in avanti i 4 GGL-bin di ΔΣ(R) e si calcola logL_true con la covarianza completa; quindi si permuta la mappatura di gruppo RC-bin→GGL-bin per ottenere logL_perm. L’intensità di chiusura è definita come ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Inoltre, Run-10 riassegna casualmente i 20 RC-bin in 4×5 gruppi (shuffle) e ricalcola la chiusura, per testare la dipendenza del segnale dalla mappatura corretta.

5 Risultati principali e interpretazione


5.1 Risultati principali del fit congiunto (RC+GGL)

Il best logL_total del fit congiunto e il vantaggio relativo ΔlogL_total rispetto a DM_RAZOR sono riportati nella Tabella S1a e nella Figura S4. Nell’insieme di confronto principale, EFT_BIN ottiene il vantaggio congiunto più alto (ΔlogL_total=1337.210), mentre gli altri kernel EFT mantengono anch’essi vantaggi significativi (1154.827–1294.442). Anche secondo i criteri informativi (AICc/BIC), la famiglia EFT supera nettamente DM_RAZOR, mostrando che il vantaggio non deriva da un bias nel numero di parametri.

Nota: il contributo principale a ΔlogL_total≈1337 proviene dal termine RC (nella decomposizione joint, ΔlogL_RC≈1065, circa l’80%). Questo si può interpretare come un miglioramento moderato, pari a circa Δχ²≈0.90 per punto su N=2295 dati RC, che sotto una likelihood gaussiana diagonale si accumula naturalmente in un vantaggio dell’ordine di 10^3. Allo stesso tempo, GGL e il test di chiusura offrono vincoli indipendenti tra dataset, e l’ordinamento rimane stabile nei test di pressione su σ_int, R_min e cov-shrink (vedi sezione 6 e Tabella S1b).


5.2 Risultati del test di chiusura (RC-only → GGL)

La quantità chiave del test di chiusura, ΔlogL_closure, è riportata nella Tabella S1b e nella Figura S3. La famiglia EFT raggiunge intensità di chiusura pari a 171.977–280.513, superiori a 126.678 per DM_RAZOR. Ciò significa che, senza alcuna libertà tra insiemi di dati aggiuntiva, i campioni posteriori ottenuti da EFT sui dati RC possiedono una capacità predittiva trasferibile più forte sui dati GGL.

Il controllo negativo rafforza ulteriormente la rilevanza fisica del segnale di chiusura: quando la mappatura RC-bin→GGL-bin viene randomizzata, l’intensità di chiusura EFT scende a 6–15 (con piccole differenze tra kernel), mentre la chiusura originaria era 172–281. Questo “collasso del segnale” esclude che il vantaggio sia spurio e dovuto a implementazione numerica, errori di unità o trattamento improprio della covarianza.

Figura R1 | Controllo negativo: dopo lo shuffle dei gruppi il segnale di chiusura diminuisce nettamente (disegnato a partire dagli indicatori Tab_Z1).


5.3 Significato e limiti dei risultati

La conclusione dello studio è: “in questo dataset e con questo protocollo, la correzione gravitazionale media EFT supera la riferimento DM_RAZOR testata”. Va sottolineato che il lato DM usa soltanto una baseline NFW minima con relazione c(M) fissata, senza includere core, non sfericità, termini ambientali o modelli più complessi di connessione galassia-alone. Questo articolo, quindi, non pretende di escludere tutte le famiglie di modelli DM; offre invece una baseline di confronto riproducibile e centrata sul test di chiusura, utile a valutare se RC e GGL possano essere spiegati dalla stessa parametrizzazione tra insiemi di dati e dalla stessa mappatura.

Per rispondere a questa obiezione comune, abbiamo completato un’estensione indipendente, P1A (vedi Appendice B), che rafforza la riferimento DM in modo “standardizzato e auditabile” senza modificare la mappatura condivisa RC-bin→GGL-bin né il quadro di audit. Oltre ai tre miglioramenti a un parametro (SCAT/AC/FB), P1A aggiunge: (i) scatter c–M gerarchico + prior massa-concentrazione (DM_HIER_CMSCAT), (ii) proxy core baryonic-feedback a un parametro (DM_CORE1P), (iii) nuisance m di calibrazione dello shear nel lensing debole (DM_RAZOR_M), e infine il modello combinato DM_STD; EFT_BIN rimane come riferimento di confronto.

• DM_RAZOR_SCAT (c–M scatter) — introduce il parametro di dispersione di concentrazione halo-to-halo σ_logc, per verificare se una relazione c(M) fissata sottostimi sistematicamente la capacità esplicativa della DM;
• DM_RAZOR_AC (Adiabatic Contraction) — usa un singolo parametro α_AC per interpolare tra “nessuna contrazione” e “contrazione standard”, catturando con costo minimo la tendenza di contrazione interna indotta dai barioni;
• DM_RAZOR_FB (Feedback / core) — usa una scala core, per esempio log r_core, per descrivere la soppressione della curva di rotazione nell’area interna dovuta a core feedback, mantenendo l’approssimazione NFW alla scala del lensing debole.

La scoreboard quantitativa di P1A è riportata nell’Appendice B, Tabella B1 / Figura B1, generate automaticamente da Tab_S1_P1A_scoreboard. Sull’indicatore di chiusura, DM_RAZOR_FB produce un piccolo guadagno netto (122.21→129.45, +7.25); gli altri miglioramenti contribuiscono poco o negativamente alla chiusura. Sul lato del fit congiunto, l’aggiunta del prior gerarchico c–M scatter (DM_HIER_CMSCAT) o del modello combinato (DM_STD) può migliorare significativamente joint logL, ma non produce un miglioramento dell’intensità di chiusura: ciò suggerisce che il guadagno principale sia flessibilità di fit congiunto, non trasferibilità predittiva tra sonde. La conclusione centrale va quindi intesa così: sotto una mappatura condivisa rigorosa e un vincolo di chiusura, il vantaggio di coerenza tra insiemi di dati di EFT non deriva dalla scelta di una riferimento DM “troppo debole”. Il pacchetto P1A relativo all’Appendice B (tabelle/figure supplementari e full_fit_runpack) sarà incorporato come file aggiuntivo nello stesso Zenodo Concept DOI del full_fit_runpack di questo articolo: https://doi.org/10.5281/zenodo.18526286.

6 Robustezza ed esperimenti di controllo


6.1 Scansione di σ_int (Run-5)

Eseguiamo una scansione sistematica della dispersione intrinseca RC, σ_int; per ogni valore ripetiamo l’inferenza congiunta e calcoliamo ΔlogL_total rispetto a DM_RAZOR. I valori minimo/massimo di ΔlogL_total nell’intervallo scansionato sono riportati nella Tabella S1b.

Figura R2 | Intervallo di ΔlogL_total nella scansione σ_int (più alto è meglio).


6.2 Scansione di R_min (Run-6)

Per testare l’impatto di errori sistematici nei dati centrali, come moti non circolari, risoluzione o modellizzazione barionica insufficiente, tagliamo i dati RC con una soglia R_min e ripetiamo l’inferenza congiunta. Il vantaggio della famiglia EFT rimane positivo e di ordine stabile lungo la scansione R_min.

Figura R3 | Intervallo di ΔlogL_total nella scansione R_min (più alto è meglio).


6.3 Scansione cov-shrink (Run-7)

Per testare l’incertezza della covarianza GGL, applichiamo a ogni matrice di covarianza di bin di massa uno shrinkage C_α=(1−α)C+α·diag(C), scansionando α. I risultati indicano che il vantaggio della famiglia EFT è poco sensibile a questo trattamento.

Figura R4 | Intervallo di ΔlogL_total nella scansione cov-shrink (più alto è meglio).


6.4 Scala di ablation (Run-8)

All’interno di EFT_BIN eseguiamo una ablation nidificata: dal modello minimale (senza parametri liberi), a versioni con poche libertà residue, fino alla versione completa con 20 ampiezze bin + scala globale. AICc/BIC mostrano che EFT_BIN completa è significativamente necessaria per spiegare i dati.

Figura R5 | Scala di ablation di EFT_BIN (AICc; più basso è meglio).


6.5 Predizione leave-out (Run-9)

Eseguiamo inoltre un test leave-one-bin-out (LOO): tra i 4 bin di massa GGL, ne lasciamo fuori uno alla volta, rifittiamo usando gli altri bin e tutti i dati RC, quindi valutiamo la log-verosimiglianza di test sul bin escluso. Gli indicatori riassuntivi sono riportati nella tabella supplementare Tab_R3_leave_one_bin_out (prodotto Run-9; la sezione 8.2 elenca i pattern dei file chiave). La famiglia EFT rimane nettamente superiore a DM_RAZOR anche nel caso di holdout peggiore.

Figura R6 | LOO: distribuzione della log-verosimiglianza sul bin escluso (da prodotti Run-9).


6.6 Controllo negativo: RC-bin shuffle (Run-10)

Run-10 riassegna casualmente i 20 RC-bin in gruppi 4×5 e ricalcola la chiusura mantenendo invariato il posteriore RC-only. I risultati mostrano che, rispetto alla mappatura originale, lo shuffle riduce nettamente mean logL_true e ΔlogL_closure (vedi Tabella S1b e Figura R1), sostenendo ulteriormente l’interpretabilità del segnale di chiusura.

Figura R7 | Controllo negativo: la mappatura shuffle riduce chiaramente mean logL_true della chiusura (da prodotti Run-10).

7 Tracciabilità e audit di coerenza (Provenance)

Tutti i valori citati nell’articolo sono tracciabili voce per voce nelle tabelle di riepilogo rigorose e nei registri di audit archiviati. Per rendere la lettura del testo principale più fluida, la catena completa di provenienza — liste di tag, tabelle di audit, checksum e modalità di verifica — è stata spostata nell’Appendice A.

8 Riproducibilità e archivio Zenodo (Reproducibility & Archive)

Dichiarazione sulla disponibilità di dati e codice: le curve di rotazione SPARC e i dati di lensing debole KiDS-1000 usati in questo articolo sono pubblici. Il rapporto in versione pubblicabile è archiviato su Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334); il pacchetto completo di riproduzione è archiviato su Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). I dettagli su esecuzione, dipendenze, inventario d’archivio e verifica hash sono nell’Appendice A; la progettazione, i tag di run e i prodotti del test di pressione di standardizzazione della riferimento DM (P1A) sono nell’Appendice B.

Sotto lo stesso full_fit_runpack Concept DOI (https://doi.org/10.5281/zenodo.18526286), forniamo due ingressi riproducibili per usi diversi:
• P1 (testo principale) full_fit_runpack: riproduce RC-only / closure / joint e le scansioni di robustezza per EFT vs DM_RAZOR, generando le Tabelle S1a/S1b e le Figure S3/S4 del testo principale;
• P1A (Appendice B) full_fit_runpack: riproduce il test di pressione di standardizzazione della riferimento DM (SCAT/AC/FB + prior gerarchico c–M scatter + core1p + lensing m + DM_STD, con confronto EFT_BIN), generando la Tabella B1 e la Figura B1 dell’appendice.
Le tabelle/figure supplementari di P1A e il full_fit_runpack saranno incorporati come file aggiuntivi nello stesso Concept DOI, mantenendo un unico punto d’archivio.

9 Ringraziamenti e dichiarazioni


9.1 Ringraziamenti

Ringraziamo i team SPARC e KiDS-1000 per aver fornito dati e documentazione pubblici; ringraziamo inoltre i partecipanti al processo di ricostruzione e audit del progetto.


9.2 Contributi dell’autore

Guanglin Tu è responsabile dell’ideazione concettuale dello studio, della progettazione del protocollo, dell’implementazione ingegneristica, della cura dei dati, dell’analisi formale, dell’implementazione del workflow riproducibile e dell’audit, nonché della stesura dell’articolo.


9.3 Fonti di finanziamento

Autofinanziamento personale dell’autore Guanglin Tu (nessun finanziamento esterno / nessun numero di grant).


9.4 Interessi concorrenti

L’autore Guanglin Tu è affiliato al “Gruppo di lavoro EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Cina)”; non dichiara altri interessi concorrenti.


9.5 Assistenza AI

Sono stati usati OpenAI GPT-5.2 Pro e Gemini 3 Pro per rifinitura linguistica, editing strutturato e organizzazione del workflow di riproduzione; non sono stati usati per generare o modificare dati, risultati, figure, tabelle o codice; non sono stati usati per generare citazioni. L’autore si assume la piena responsabilità per il contenuto integrale e l’accuratezza delle citazioni.

10 Riferimenti

Appendice A: dettagli di tracciabilità e riproducibilità

Questa appendice riassume le informazioni di tracciabilità e riproducibilità destinate all’archiviazione di lungo periodo — tag di run, risultati di audit, inventario d’archivio e punti di controllo — così che i lettori possano verificare e riprodurre secondo necessità.


A.1 Dettagli di tracciabilità e audit

Per garantire tracciabilità a lungo termine, il progetto assegna timestamp tag a ogni run e a ogni output, conservando i prodotti storici senza sovrascriverli. I valori centrali citati nell’articolo provengono dal riepilogo rigoroso (compile_tag=20260205_035929) e hanno superato i seguenti audit di coerenza:

• Tutte le tabelle intermedie includono run_tag e tag di fase; lo script di riepilogo rigoroso seleziona da report/tables le fonti canonical “complete e coerenti”.

• I valori di Tab_Z1_master_summary e Tab_Z2_conclusion_highlights sono confrontati voce per voce con le tabelle canonical selezionate.

• Durante la generazione del PDF viene eseguito un audit dei tag delle tabelle/figure citate, per garantire che non siano mescolati prodotti obsoleti.

Tag chiave (per localizzare tutti i prodotti intermedi): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Risultato dell’audit di coerenza: Tab_AUDIT_checks_strict mostra pass=9, fail=0, skip=0 (vedi pacchetto release).


A.2 Passaggi di riproducibilità e inventario d’archivio

Questo studio adotta un sistema di riproduzione composto da “rapporto in versione pubblicabile + materiale supplementare di tabelle e figure + runpack completo rieseguibile”. I lettori possono consultare direttamente il Tables & Figures Supplement per verificare tutte le tabelle e figure citate; per riprodurre i valori e l’intera catena di audit da zero, possono usare il full_fit_runpack, scaricare i dati e rieseguire l’intero processo (al termine, lo script interno di confronto con le reference table verifica la coerenza dei valori tabellari).


A.2.1 Quickstart di riproduzione (RUN_FULL, Windows PowerShell)

Questa sezione fornisce un percorso di riproduzione più breve (Windows PowerShell). Per un controllo rapido si consiglia di consultare direttamente il Tables & Figures Supplement, verificando una per una tabelle e figure citate nel testo. Per una riproduzione end-to-end con generazione di tutte le tabelle/figure e dei prodotti di audit, usare il full_fit_runpack: seguire README/ONE_PAGE_REPRO_CHECKLIST del pacchetto ed eseguire verify_checksums.ps1 e RUN_FULL.ps1 (Mode=full consigliato).

Ingresso dell’archivio Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tag della catena principale di questo articolo: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.2.2 Materiali archiviati e punti chiave di controllo (Packages & checks)

L’archivio Zenodo fornisce 3 classi di materiali complementari: (1) rapporto in versione pubblicabile (questo articolo, v1.1, con Appendice B: test di pressione di standardizzazione della riferimento DM P1A); (2) Tables & Figures Supplement (materiale supplementare di tabelle e figure che copre tutti gli asset citati nel testo, separatamente per P1 e P1A); (3) full_fit_runpack (pacchetto completo di riproduzione: scarica i dati da zero e riesegue l’intero workflow, separatamente per P1 e P1A). Le classi (1)–(2) supportano lettura rapida e controllo indipendente; la classe (3) offre riproduzione end-to-end completa.

Categoria del materiale

Nome file (esempio)

Uso e ruolo (ordine consigliato ai lettori)

Rapporti in versione pubblicabile (cinese e inglese)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Rapporto completo archiviato su Zenodo; il testo principale presenta conclusioni e audit di robustezza, mentre l’Appendice B presenta P1A (test di pressione di standardizzazione della riferimento DM).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Tutte le tabelle (CSV) e le figure (PNG) citate nel testo principale, inclusi script di generazione e file di tag.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Tutte le tabelle e le figure citate nell’Appendice B (P1A), incluse Tab_S1_P1A_scoreboard e Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Riproduzione end-to-end completa: scarica i dati da zero e riesegue RC-only/closure/joint e le scansioni di robustezza.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Riproduzione end-to-end completa (Appendice B): riesegue DM 7+1 + DM_STD (con confronto EFT_BIN) e genera gli asset dell’appendice; il pacchetto include uno script di confronto con reference table per verificare la coerenza dei valori tabellari.

Suggerimento di citazione: quando si cita questo articolo o il materiale di riproduzione allegato, indicare il Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Dopo la riproduzione, i prodotti chiave attesi e confrontabili includono:

Appendice B: P1A — test di pressione di standardizzazione della riferimento DM (DM 7+1 + DM_STD; con confronto EFT)

Questa appendice documenta un’estensione P1A coerente con il protocollo di chiusura del testo principale, denominata “test di pressione di standardizzazione della riferimento DM”. La sua funzione è rafforzare il DM_RAZOR minimo usato nel testo (NFW + c–M fissata, senza scatter/contrazione/core), rendendolo più vicino alla pratica astrofisica e più resistente alle obiezioni comuni, senza introdurre molte libertà e senza modificare la mappatura condivisa RC-bin→GGL-bin o il quadro di audit. P1A copre e supera i precedenti tre rami di stress test: conserva SCAT/AC/FB e aggiunge scatter c–M gerarchico + prior, proxy core a un parametro e nuisance m di calibrazione dello shear nel lensing; fornisce inoltre il modello combinato DM_STD, mantenendo EFT_BIN come riferimento di confronto.

Nota supplementare: le intensità di chiusura e gli altri valori dell’Appendice B (P1A) usano un budget Monte Carlo più alto, per esempio ndraw=400 e nperm=24, diverso dal budget quick usato nel testo principale per coprire l’intera famiglia di kernel EFT, per esempio ndraw=60 e nperm=12. Di conseguenza, i valori assoluti possono presentare drift di campionamento dell’ordine O(10); tuttavia il confronto tra modelli all’interno della stessa tabella e con lo stesso budget è equo, e segno e ordine del vantaggio restano stabili tra budget diversi.


B.1 Scopo e posizionamento (Why P1A, and why as an Appendix)

P1A non tenta di esaurire tutte le possibili modellizzazioni di aloni ΛCDM, come non sfericità, dipendenze ambientali, connessioni galassia-alone complesse o fisica barionica ad alta dimensione. Al contrario, P1A segue il principio “bassa dimensione, auditabilità, riproducibilità”: ogni modulo migliorativo introduce al massimo un parametro efficace chiave e continua a rispettare i tre vincoli duri di questo articolo:
(i) registro parametrico: ogni nuovo parametro deve essere esplicitamente contabilizzato e riportato insieme ai criteri informativi (AICc/BIC);
(ii) mappatura condivisa: si usa ancora la stessa mappatura a gruppi RC-bin→GGL-bin, senza permettere ‘aggiustamenti di mappatura’ per un singolo dataset;
(iii) test di chiusura: ogni miglioramento deve mostrare un guadagno reale nella trasferibilità predittiva RC→GGL, non solo un miglior fit RC-only.


B.2 DM 7+1 + DM_STD: definizione dei moduli, parametri e ingresso nel posteriore congiunto

Come runpack indipendente, P1A fornisce 8 workspace DM (DM 7+1) e 1 confronto EFT. Partendo da DM_RAZOR come baseline, costruisce tre miglioramenti legacy a un parametro (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), aggiunge tre moduli difensivi più standard (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) e infine propone il modello combinato DM_STD. L’obiettivo comune è coprire, con il minor aumento dimensionale possibile, le tre obiezioni più frequenti: (a) come scatter e prior della relazione c–M entrino in un modello gerarchico; (b) se l’effetto principale del baryonic feedback possa essere rappresentato da un proxy core a un parametro; (c) se un errore sistematico chiave del lensing possa essere scambiato per segnale fisico.

Workspace

dm_model

Nuovi parametri (≤1)

Motivazione fisica (nucleo)

Principio di implementazione (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

Baseline minima e auditabile di aloni ΛCDM; usata per il confronto rigoroso con EFT

Mappatura condivisa fissa; registro parametrico rigoroso; baseline usata solo per confronto relativo

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

La relazione c–M presenta dispersione; approssimata con scatter log-normale a un parametro

≤1 nuovo parametro; usa ancora la mappatura condivisa; il guadagno di chiusura è criterio di accettazione

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

L’infall barionico può causare contrazione adiabatica dell’alone; approssimata con intensità a un parametro

≤1 nuovo parametro; non cambia la mappatura; riporta variazioni AICc/BIC e guadagno di chiusura

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Il feedback può formare un core interno; approssimato con una scala core a un parametro

≤1 nuovo parametro; stessa metrica per chiusura/controllo negativo; non usa il miglioramento RC-only come unico obiettivo

DM_HIER_CMSCAT

Scatter c–M gerarchico + prior

σ_logc(hier)

Struttura gerarchica più standard c_i∼logN(c(M_i),σ_logc); influenza insieme il posteriore congiunto RC e GGL

Prior esplicito; marginalizzazione dei c_i latenti; resta a bassa dimensione e auditabile

DM_CORE1P

Proxy core a 1 parametro (ispirato a coreNFW/DC14)

log r_core

Usa un proxy core a un parametro per il principale effetto di baryonic feedback, evitando dettagli di formazione stellare ad alta dimensione

Riferimenti standard; ≤1 nuovo parametro; legato al test di chiusura

DM_RAZOR_M

NFW + nuisance di calibrazione dello shear nel lensing

m_shear(GGL)

Assorbe un errore sistematico chiave del lensing debole tramite un parametro efficace, riducendo il rischio di scambiare sistema per fisica

Nuisance esplicitamente registrata; non può retroagire su RC; il risultato è giudicato soprattutto dalla robustezza di chiusura

DM_STD

Baseline DM standardizzata (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Integra in una baseline ancora a bassa dimensione le tre obiezioni più frequenti

Riporta registro parametrico e criteri informativi; chiusura come metrica principale; confronto difensivo DM più forte

Nota: i nomi dei parametri seguono l’implementazione ingegneristica, per esempio σ_logc, α_AC, log r_core, m_shear. Il punto di P1A è “rendere un po’ più forte la riferimento DM, ma mantenerla auditabile”, non trasformare il lato DM in un fitter ad alta dimensione incontrollabile. In particolare, DM_HIER_CMSCAT introduce lo scatter c–M in forma gerarchica: per la concentrazione c_i di ogni alone si assume una dispersione log-normale attorno a c(M_i), vincolata dalla σ_logc globale e dal prior c(M); tale struttura gerarchica influenza simultaneamente il posteriore congiunto RC e GGL.


B.3 Protocollo statistico e prodotti coerenti con il testo principale

P1A riutilizza tutti i prodotti di dati, la mappatura condivisa e il quadro di audit del testo principale. La sequenza di esecuzione e la nomenclatura dei prodotti rimangono coerenti:
(1) Run-1: inferenza RC-only (output posterior_samples.npz e metrics.json);
(2) Run-2: test di chiusura RC→GGL (output closure_summary.json e permuted baseline);
(3) Run-3: fit congiunto RC+GGL (output joint_summary.json).
Tutti i numeri citati provengono dalla tabella di riepilogo automatica Tab_S1_P1A_scoreboard e possono essere verificati rieseguendo l’intero processo nel P1A full_fit_runpack e usando lo script interno di confronto con la reference table.


B.4 Risultati principali, ingresso a tabelle/figure e piano di archiviazione (stesso DOI)

Questa sezione riporta le conclusioni quantitative centrali di P1A. La Tabella B1 riassume gli indicatori chiave di RC-only, chiusura RC→GGL e fit congiunto RC+GGL; le parentesi indicano le differenze rispetto alla riferimento DM_RAZOR. L’intensità di chiusura è definita come ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (più alta è meglio). La Figura B1 visualizza la stessa scoreboard. I punti principali sono:
• tra i tre rami legacy, solo DM_RAZOR_FB (feedback/core) porta un piccolo guadagno netto nell’intensità di chiusura: 122.21→129.45 (+7.25); SCAT e AC non portano guadagno netto;
• i nuovi DM_HIER_CMSCAT e DM_RAZOR_M hanno impatto molto piccolo (~0) sulla chiusura; anche DM_CORE1P non mostra un guadagno netto significativo;
• il modello combinato DM_STD migliora fortemente joint logL, avvicinandosi all’ottimo del fit congiunto, ma riduce l’intensità di chiusura; ciò indica che il miglioramento principale proviene da flessibilità di fit congiunto, non da trasferibilità predittiva cross-probe;
• EFT_BIN, come confronto, mantiene un vantaggio netto sia nella chiusura sia nel fit congiunto; di conseguenza la conclusione principale del testo è robusta all’introduzione di una “riferimento DM più forte + nuisance lensing”.

Per agevolare il confronto diretto con la comparazione principale, le Tabelle S1a–S1b del testo riassumono il confronto rigoroso tra famiglia EFT e DM_RAZOR: i modelli EFT aumentano ΔlogL_total di circa 1155–1337 rispetto a DM_RAZOR nel fit congiunto e raggiungono ΔlogL_closure=172–281 nel test di chiusura. P1A serve solo a rendere più difficile il confronto sul lato DM; il suo scopo è ridurre obiezioni come “strawman baseline” o “systematics-as-physics”, non sostituire il confronto principale.

Tabella B1 | P1A scoreboard (più alto è meglio; le parentesi indicano la differenza rispetto alla riferimento DM_RAZOR).

Ramo del modello (workspace)

Δk

RC-only best logL_RC (Δ)

Intensità di chiusura ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Figura B1 | P1A scoreboard: ΔlogL di chiusura e fit congiunto rispetto alla baseline (più alto è meglio).

I tag di esempio per una serie di run P1A già completati sono i seguenti, utili a localizzare prodotti intermedi, tabelle e figure:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Modalità di citazione consigliata (Appendix citation note)

Quando i lettori devono citare il “test di pressione di standardizzazione della riferimento DM” oltre alla conclusione principale, si consiglia di citare il testo principale e aggiungere: “See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”