← प्रयोग

P1_RC_GGL: आकाशगंगा गतिकी और कमज़ोर लेंसिंग का कठोर क्लोज़र परीक्षण (घूर्णन वक्र + GGL)

EFT औसत-गुरुत्व ढाँचा बनाम शीत अंधकार पदार्थ (DM) के लिए न्यूनतम NFW आधाररेखा

लेखक: Guanglin Tu
ईमेल: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
संबद्धता: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (चीन)
संस्करण: v1.1 | दिनांक: 2026-02-14

प्रीप्रिंट (सहकर्मी-समीक्षित नहीं) | यह संस्करण सार्वजनिक प्रसार और पुनरुत्पादनशीलता के लिए है, और यह जर्नल में प्रकाशित अंतिम संस्करण का प्रतिनिधित्व नहीं करता।

लाइसेंस: रिपोर्ट (CC BY-NC-ND 4.0); पूर्ण पुनरुत्पादन पैकेज (CC BY 4.0)।

प्रकाशन-स्तरीय रिपोर्ट (Concept DOI): https://doi.org/10.5281/zenodo.18526334 पूर्ण पुनरुत्पादन पैकेज (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 कार्यकारी सारांश

यह रिपोर्ट Zenodo पर जमा किया गया प्रकाशन-स्तरीय अभिलेख संस्करण है। यह डेटा, मॉडल लेजर, निष्पक्ष तुलना, क्लोज़र परीक्षण और पुनरुत्पादन सामग्री को समेटने वाली एकीकृत तथा ऑडिट-योग्य शृंखला प्रदान करती है। परिशिष्ट B (P1A) robustness पूरक के रूप में कार्य करता है। यह “अधिक मानक DM आधाररेखा + एक प्रमुख लेंसिंग-सिस्टेमैटिक” वाले तनाव परीक्षणों पर केंद्रित है, जिनका उपयोग अधिक यथार्थवादी DM मॉडलिंग और लेंसिंग-सिस्टेमैटिक्स उपचार के प्रति मुख्य निष्कर्षों की संवेदनशीलता आँकने के लिए किया गया है।

मुख्य निष्कर्ष (चार सीधे उद्धृत किए जा सकने वाले कथन; अनुभाग 2.4 देखें):

(1) घूर्णन-वक्र (RC) फिटिंग में, EFT परिवार सभी कर्नेल/प्रायर संयोजनों में DM_RAZOR से उल्लेखनीय रूप से बेहतर प्रदर्शन करता है; सामान्य सुधार Δlog𝓛_RC ≈ 10^3 है (तालिका S1a देखें)।
(2) RC→GGL क्लोज़र परीक्षण में, EFT अधिक मज़बूत क्रॉस-प्रोब स्थानांतरण-क्षमता दिखाता है: क्लोज़र शक्ति Δlog𝓛_closure (True−Perm) DM_RAZOR से काफ़ी अधिक है, और यह अंतर covariance shrinkage, R_min तथा σ_int स्कैनों के तहत robust बना रहता है (चित्र S3 और तालिका S1b देखें)।
(3) संयुक्त फिट (RC+GGL) में, EFT स्थिर बढ़त बनाए रखता है; साझा मैपिंग को तोड़ने वाले नकारात्मक नियंत्रण में यह बढ़त ढह जाती है, जिससे यह व्याख्या समर्थित होती है कि “औसत-गुरुत्व प्रभाव” आकस्मिक फिट से नहीं, बल्कि साझा मैपिंग से आता है (चित्र S4 देखें)।
(4) आयामिता को बहुत अधिक बढ़ाए बिना, परिशिष्ट B (P1A) DM पक्ष को अधिक मानक DM आधाररेखा मॉड्यूलों और एक प्रमुख लेंसिंग-सिस्टेमैटिक्स nuisance के साथ तनाव-परीक्षण करता है। ये संवर्धन EFT की क्लोज़र बढ़त को समाप्त नहीं करते (तालिका B1 और चित्र B1 देखें)।

डेटा और कोड उपलब्धता: रिपोर्ट Concept DOI 10.5281/zenodo.18526334; पूर्ण पुनरुत्पादन पैकेज Concept DOI 10.5281/zenodo.18526286। परिशिष्ट B (P1A) से संबंधित टैग हैं run_tag=20260213_151233, closure_tag=20260213_161731, और joint_tag=20260213_195428।

1 सारांश

हम समान डेटा और समान सांख्यिकीय प्रोटोकॉल के तहत दो सैद्धांतिक ढाँचों की पुनरुत्पाद्य मात्रात्मक तुलना करते हैं: ऊर्जा फिलामेंट सिद्धांत (Energy Filament Theory, EFT; effective field theory के सामान्य संक्षेप से भिन्न) द्वारा प्रस्तावित “औसत-गुरुत्व सुधार” मॉडल, और शीत अंधकार पदार्थ (DM) का आधाररेखा NFW halo मॉडल (DM_RAZOR)। DM_RAZOR को जानबूझकर “न्यूनतम DM आधाररेखा” के रूप में चुना गया है: स्थिर c–M संबंध वाला NFW halo (halo-to-halo scatter के बिना), जो ऑडिट-योग्य और पुनरुत्पाद्य नियंत्रण का कार्य करता है। यह भी स्पष्ट करना आवश्यक है कि यह लेख EFT को एक phenomenological, MOND-सदृश effective-field/effective-response parameterization के रूप में देखता है जिसे एकीकृत सांख्यिकीय प्रोटोकॉल में परखा गया है; इस कार्य में इसके सूक्ष्म प्रथम सिद्धांतों की व्युत्पत्ति नहीं की गई है।

डेटा में SPARC घूर्णन वक्रों (RC) से 2,295 वेग डेटा बिंदु शामिल हैं, जिन्हें समान रूप से preprocessed और binned किया गया है (104 आकाशगंगाएँ, 20 RC bins), साथ ही KiDS-1000 आकाशगंगा–आकाशगंगा कमज़ोर-लेंसिंग (GGL) की excess surface density ΔΣ(R) शामिल है (4 stellar-mass bins × प्रत्येक bin में 15 R बिंदु, कुल 60 बिंदु, full covariance के साथ)।

हम क्रमशः RC-only inference, RC→GGL क्लोज़र परीक्षण, GGL-only inference, और संयुक्त RC+GGL inference करते हैं, तथा consistency audits का उपयोग करते हैं ताकि उद्धृत प्रत्येक संख्यात्मक मान traceable रहे। कठोर parameter ledger और shared-mapping constraints के तहत (DM: 20 log M200_bin पैरामीटर; EFT: 20 log V0_bin पैरामीटर + 1 वैश्विक log ℓ), संयुक्त फिट में EFT परिवार DM_RAZOR से उल्लेखनीय रूप से बेहतर प्रदर्शन करता है: DM_RAZOR की तुलना में ΔlogL_total = 1155–1337। इससे भी अधिक महत्वपूर्ण यह है कि क्लोज़र परीक्षण दिखाता है कि RC posterior में GGL के लिए nontrivial predictive power है: EFT की closure strength ΔlogL_closure = 172–281 है, जो DM_RAZOR के 127 से अधिक है। जब RC-bin→GGL-bin grouping को यादृच्छिक रूप से shuffled किया जाता है, तो closure signal 6–23 तक ढह जाता है, जिससे पुष्टि होती है कि संकेत न तो सांख्यिकीय संयोग है और न implementation artifact। σ_int, R_min, और covariance shrinkage के systematic scans में EFT की सापेक्ष बढ़त धनात्मक और परिमाण में स्थिर रहती है। “DM baseline बहुत कमजोर है” या “systematics को physics समझ लिया गया है” जैसी सामान्य चिंताओं का उत्तर देने के लिए परिशिष्ट B (P1A) अधिक मानक लेकिन फिर भी low-dimensional और auditable DM-baseline stress test देता है, जिसमें hierarchical c–M scatter + prior, एक-parameter core proxy, lensing m, और संयुक्त DM_STD model शामिल हैं। उसी closure protocol के तहत, ये संवर्धन EFT की closure advantage को समाप्त नहीं करते (तालिका B1/चित्र B1 देखें)।

कीवर्ड: घूर्णन वक्र; आकाशगंगा–आकाशगंगा कमज़ोर लेंसिंग; क्लोज़र परीक्षण; EFT; शीत अंधकार पदार्थ; Bayesian inference

2 परिचय और परिणामों का अवलोकन

घूर्णन वक्र (RC) और आकाशगंगा–आकाशगंगा कमज़ोर लेंसिंग (GGL) दो परस्पर-पूऱक गुरुत्वीय probes हैं: RC disk plane में dynamical potential और radial acceleration relation (RAR) को constrain करता है, जबकि GGL projected mass distribution और halo-scale gravitational response को मापता है। किसी भी candidate theory के लिए मुख्य प्रश्न यह नहीं है कि क्या वह दोनों datasets को अलग-अलग fit कर सकती है, बल्कि यह है कि क्या वह समान cross-data mapping और shared constraints के तहत उन्हें consistent रूप से समझा सकती है।

इसी कारण यह लेख “closure test” को अपना मुख्य statistical protocol मानता है: पहले RC-only posterior से GGL को forward-predict किया जाता है, फिर इसकी तुलना उस negative control से की जाती है जिसमें RC-bin→GGL-bin mapping को permuted/shuffled किया जाता है। इससे cross-data predictive transferability का मूल्यांकन होता है और implementation bias या accidental fitting से उत्पन्न false signals को हटाया जाता है।

सैद्धांतिक स्थिति और scope: यह लेख EFT (Energy Filament Theory, EFT) की microscopic first-principles derivation या relativistically complete formulation प्रस्तुत करने का प्रयास नहीं करता। इसके बजाय, हम EFT को low-dimensional, MOND-जैसी effective-field/effective-response parameterization के रूप में लेते हैं (kernel f(x) और global scale ℓ द्वारा वर्णित), और strict parameter ledger के तहत RC→GGL closure test के माध्यम से उसकी cross-data consistency और transfer predictive power की जाँच करते हैं।

अनुसंधान कार्यक्रम और scope statement: यह लेख ongoing P-series observational retrieval program का हिस्सा है। मौजूदा galaxy-scale data में हम दो संभावित effective background contributions खोजते हैं: (i) coarse-grained mean gravitational response से वर्णनीय “mean gravity floor”, और (ii) microscopic processes की fluctuations से जुड़ा “stochastic/noise floor”। इस लेख (P1) में हम केवल पहले पर केंद्रित हैं: microscopic production mechanisms के बारे में कोई hypothesis प्रस्तुत किए बिना, हम RC→GGL closure test का उपयोग mean gravity floor के observational indications को retrieve करने और unified control protocol के तहत auditable DM baseline से तुलना करने के लिए करते हैं। heuristic physical picture के रूप में, यदि अल्पायु degrees of freedom मौजूद हों, तो उनका decay/annihilation rest mass को अन्य degrees of freedom द्वारा वहन किए गए energy-momentum में बदल सकता है, जो effective level पर “mean contribution + fluctuation contribution” decomposition से स्वाभाविक रूप से जुड़ता है; हालांकि यह लेख उस microscopic picture को quantitatively model नहीं करता।

अतिव्याख्या से बचने के लिए, इस लेख की scope boundaries इस प्रकार हैं:
• यह लेख क्या करता है: strict parameter-ledger और shared-mapping constraints के तहत, यह closure testing के द्वारा cross-data predictive transferability को मापता है और EFT mean-gravity response तथा DM baseline के बीच reproducible comparison करता है।
• यह लेख क्या नहीं करता: यह microscopic production mechanisms, abundances/lifetimes, या cosmological constraints पर चर्चा नहीं करता; यह “noise floor” से संबंधित stochastic term को model नहीं करता।
• यह लेख क्या दावा नहीं करता: इसका लक्ष्य dark matter को उखाड़ फेंकना नहीं है; P1 यह अंतिम निर्णय नहीं देता कि कोई “floor” मौजूद है या नहीं, बल्कि stage-level evidence रिपोर्ट करता है—कि यहाँ चुने गए robust measurement domain में डेटा mean gravitational response वाले models को प्राथमिकता देता है।

साथ ही, हम स्पष्ट करते हैं कि DM_RAZOR केवल न्यूनतम और auditable NFW baseline को दर्शाता है (fixed c–M और no scatter; कोई adiabatic contraction, feedback core, nonsphericity या environmental terms नहीं)। इसलिए मुख्य पाठ का निष्कर्ष सख्ती से इस कथन तक सीमित है: न्यूनतम baseline और strict parameter-ledger/mapping constraints के तहत, EFT अधिक मज़बूत cross-data consistency दिखाता है। यह सामान्य प्रश्न संबोधित करने के लिए कि क्या अधिक मानक ΛCDM baseline और प्रमुख lensing-systematics modeling निष्कर्ष को substantially बदलेंगे, हम अधिक मानक लेकिन फिर भी low-dimensional और auditable DM enhancements तथा lensing-side nuisance को Appendix B में एकत्र करते हैं (P1A: DM-baseline standardization stress test), जबकि मुख्य पाठ जैसा ही shared mapping और closure-test protocol अपरिवर्तित रखा गया है (तालिका B1/चित्र B1 देखें)।

2.1 तालिका S1a–S1b: प्रमुख metrics का सारांश (Strict)

तालिका S1a संयुक्त फिट (RC+GGL) के मुख्य comparison metrics देती है: logL, ΔlogL, AICc, और BIC। तालिका S1b closure-test और robustness-scan metrics देती है: closure, shuffle negative control, और σ_int / R_min / cov-shrink scan ranges। सभी मान strict master summary table Tab_Z1_master_summary से आते हैं और release archive package में item-by-item trace किए जा सकते हैं।

तालिका S1a | मुख्य संयुक्त-फिट comparison metrics (RC+GGL, Strict)।

मॉडल (workspace)

W कर्नेल

k

संयुक्त logL_total (best)

DM की तुलना में ΔlogL_total

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

तालिका S1b | Closure और robustness metrics (Strict)।

मॉडल (workspace)

क्लोज़र ΔlogL (true-perm)

shuffle के बाद negative-control ΔlogL

σ_int scan ΔlogL range

R_min scan ΔlogL range

cov-shrink scan ΔlogL range

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 चित्र S3: Closure Strength (RC-only → Predicted GGL)

Closure strength को ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ के रूप में परिभाषित किया गया है: RC-only posterior samples पर GGL को forward-predict किया जाता है और negative control से तुलना की जाती है जिसमें RC-bin→GGL-bin mapping permuted होती है।

चित्र S3 | Closure strength (जितना अधिक, उतना बेहतर): RC-only → GGL prediction का mean log-likelihood advantage।


2.3 चित्र S4: मुख्य संयुक्त-फिट तुलना (RC+GGL)

Joint-fit advantage को ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) के रूप में परिभाषित किया गया है। समान डेटा, समान mapping और लगभग समान parameter scale के तहत, EFT परिवार स्पष्ट रूप से अधिक joint log-likelihood प्राप्त करता है।

चित्र S4 | Joint-fit advantage (जितना अधिक, उतना बेहतर): DM_RAZOR के सापेक्ष RC+GGL के लिए best logL_total।


2.4 चार निष्कर्ष (सीधे उद्धरण योग्य)

(1) SPARC घूर्णन वक्रों और KiDS-1000 कमज़ोर लेंसिंग के unified joint analysis में, EFT mean-gravity framework model strict control protocol के तहत systematic रूप से DM_RAZOR से बेहतर प्रदर्शन करता है: DM_RAZOR की तुलना में ΔlogL_total = 1155–1337।

(2) RC→GGL closure test EFT के लिए अधिक मज़बूत predictive consistency दिखाता है: ΔlogL_closure = 172–281, जबकि DM_RAZOR के लिए 127 है। जब RC-bin→GGL-bin grouping यादृच्छिक रूप से shuffled की जाती है, तो closure signal 6–23 तक ढह जाता है, जिससे संकेत मिलता है कि यह signal accidental fitting के बजाय सही cross-data mapping पर निर्भर है।

(3) σ_int, R_min और covariance shrinkage के systematic scans “EFT outperforms DM_RAZOR” के sign या scale को नहीं बदलते, जिससे पता चलता है कि निष्कर्ष common systematic perturbations के प्रति robust है।

(4) उसी closure protocol के तहत, Appendix B (P1A) “standardized and auditable” तरीके से DM baseline को मज़बूत करता है: यह तीन one-parameter enhancements (SCAT/AC/FB) को बनाए रखता है और hierarchical c–M scatter + prior, एक-parameter core proxy, तथा lensing-side shear-calibration m (और उनका संयुक्त DM_STD model) जोड़ता है। परिणाम बताते हैं कि केवल feedback/core branch closure strength में एक छोटा net improvement देती है (122.21→129.45, ΔΔlogL_closure≈+7.25); अन्य enhancements closure strength में insignificant या negative योगदान देते हैं। इसलिए मुख्य निष्कर्ष इस पर निर्भर नहीं करता कि DM_RAZOR बहुत कमजोर baseline है।

3 डेटा और preprocessing

यह अध्ययन दो public datasets का उपयोग करता है। engineering workflow में downloading, checksum verification (sha256), और preprocessing traceable scripts से पूरे किए गए हैं। fair cross-model comparison सुनिश्चित करने के लिए, सभी workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) बिल्कुल समान data products और bin mappings साझा करते हैं।


3.1 घूर्णन वक्र (RC, SPARC)

RC डेटा SPARC database की Rotmod_LTG files (175 rotmod files) से आते हैं। preprocessing के बाद, modeling sample में 104 galaxies और 2,295 (r, V_obs) data points शामिल हैं, जिन्हें stellar mass और संबंधित criteria के अनुसार 20 RC bins में बाँटा गया है। प्रत्येक data point में radius r (kpc), observed velocity V_obs (km/s), observational error σ_obs, और gas/disk/bulge component velocities (V_gas, V_disk, V_bul) शामिल हैं।


3.2 कमज़ोर लेंसिंग (GGL, KiDS-1000 / Brouwer+2021)

GGL डेटा Brouwer et al. (2021) के Fig. 3 से लिए गए KiDS-1000 आधारित excess surface density ΔΣ(R) का उपयोग करते हैं (4 stellar-mass bins, प्रति bin 15 R points), साथ में उपलब्ध full covariance। engineering workflow में, मूल long-form covariance को प्रत्येक bin के लिए 15×15 matrix में reconstruct किया गया है, और Stage-B audits dimensional तथा numerical reasonableness की पुष्टि करते हैं।


3.3 RC-bin → GGL-bin Mapping और कुल sample size

4 GGL mass bins और 20 RC bins को fixed mapping द्वारा जोड़ा गया है: प्रत्येक GGL bin 5 RC bins से संबंधित है, और RC-bin contributions को galaxies की संख्या से weight किया गया है। यह mapping सभी models में fixed रखी गई है और closure testing तथा joint fitting में fair comparison के लिए core constraint है। अंतिम संयुक्त dataset में n_total = 2355 points हैं (RC=2295, GGL=60)।

4 Models और Statistical Methods


4.1 EFT और DM के लिए न्यूनतम गणितीय विनिर्देश (Auditable/Testable)

यह अनुभाग न्यूनतम गणितीय विनिर्देश देता है जो सीधे implementation से map करता है।

(a) Rotation-curve (RC) model

प्रत्येक RC data point (r, V_obs, σ_obs) के लिए, हम component superposition का उपयोग करते हैं: V_mod²(r) = V_bar²(r) + V_extra²(r)। यहाँ V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r)। इस लेख के मुख्य परिणाम Υ_d = Υ_b = 0.5 अपनाते हैं, जो SPARC empirical recommendations के अनुरूप है और अनावश्यक degrees of freedom को घटाने में उपयोगी है।

(b) EFT mean-gravity correction (EFT)

EFT extra term को “mean velocity squared” के रूप में parameterized किया गया है: V_extra²(r) = V0_bin² · f(r/ℓ)। यहाँ V0_bin प्रत्येक RC bin के लिए amplitude parameter है (20 parameters), ℓ global scale है (1 parameter), और f(x) dimensionless kernel shape function है। इस लेख में तुलना किए गए kernel shapes (जिनमें कोई अतिरिक्त continuous degree of freedom नहीं जुड़ता) ये हैं:

भौतिक प्रेरणा (विस्तृत): EFT galaxy scales पर extra gravitational response को finite scales पर अधिक सूक्ष्म actions के coarse-graining/scale-averaging से प्राप्त effective response के रूप में व्याख्यायित करता है। इस लेख में हम कोई विशिष्ट microscopic mechanism नहीं मानते; इसके बजाय controlled comparison और unified statistical protocol के तहत testing के लिए minimal और auditable parameterization का उपयोग करते हैं।

अंतर्ज्ञान के लिए, extra term को acceleration form में लिखा जा सकता है: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ)। जब r≫ℓ, f→1 और V_extra→V0_bin होता है, जिससे outer region में लगभग flat extra velocity contribution बनता है। जब r≪ℓ और f(x)≈x, तब characteristic acceleration scale a0,bin≈V0_bin²/ℓ प्रस्तुत किया जा सकता है (O(1) kernel-function factor तक), जो inner-to-outer transition scale के लिए MOND-like intuition देता है।

यहाँ प्रयुक्त discrete kernel family (none/exponential/yukawa/powerlaw_tail) को अलग-अलग “initial slopes / transition speeds / long-range tails” के low-dimensional proxies के रूप में देखा जा सकता है (उदाहरण के लिए Yukawa-like screening बनाम longer-tailed response)। इनका उपयोग model space को exhaust करने के लिए नहीं, बल्कि robustness stress testing के लिए किया गया है। weak-lensing component में हम V_avg(r) से effective envelope mass और density बनाते हैं, फिर उन्हें project करके ΔΣ(R) प्राप्त करते हैं। इस effective density को spherical symmetry और weak-field mapping की assumptions के तहत lensing potential का effective description समझना चाहिए (पूर्ण विवरण Appendix A में स्थानांतरित हैं)।

ऊपर दिए गए सभी kernel shapes x→∞ पर f(x)→1 संतुष्ट करते हैं (अर्थात saturation V_extra²→V0²), जबकि x≪1 के लिए linear या sublinear growth देते हैं: उदाहरण के लिए exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x। इसलिए छोटे radius की “initial slope,” transition speed, और outer tail में अलग-अलग kernel shapes के observable differences होते हैं, जिन्हें joint RC+GGL और closure tests से अलग किया जा सकता है।

weak-lensing ΔΣ(R) के लिए EFT prediction V_avg(r) से envelope mass और density infer करके, फिर projection integrals से प्राप्त किया जाता है: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, और ΔΣ(R)=Σ̄(<R)−Σ(R)। numerical implementation logarithmic grid का उपयोग करता है और stability तथा reproducibility सुनिश्चित करने के लिए exceptional cases में adaptive refinement करता है।

(c) DM_RAZOR: NFW cold-dark-matter halo baseline

साथ ही, हम स्पष्ट करते हैं कि DM_RAZOR केवल minimal, auditable NFW baseline का प्रतिनिधित्व करता है (fixed c–M और no scatter; कोई adiabatic contraction, feedback core, nonsphericity या environmental terms नहीं)। “strawman baseline” के जोखिम को घटाने के लिए, यह लेख यह दावा नहीं करता कि ऐसे effects मौजूद नहीं हैं। इसके बजाय, Appendix B (P1A) में इन्हें low-dimensional और auditable stress tests के रूप में शामिल किया गया है, जिनमें c–M scatter का hierarchical treatment, core proxy, और lensing-side shear-calibration nuisance शामिल हैं।


4.2 Model Ledger और Fair Comparison (Shared Parameters = Closure की परिभाषा)

मुख्य comparison set में parameters की संख्या है: DM_RAZOR k=20; EFT family k=21 (extra parameter global log ℓ है)। सभी models समान RC data, समान GGL data और covariance, समान RC-bin→GGL-bin mapping, समान baryonic terms, और समान unit conversions साझा करते हैं। इसके अतिरिक्त, kernel shape (none / exponential / yukawa / powerlaw_tail) discrete choice है और कोई अतिरिक्त continuous parameter नहीं जोड़ता, जिससे “one extra degree of freedom” से advantage पाने की संभावना रुकती है।


4.3 Likelihood, Priors, और Sampler

RC likelihood diagonal Gaussian है: σ_eff² = σ_obs² + σ_int²। मुख्य परिणाम σ_int=5 km/s fix करते हैं, और Run-5 σ_int scan करता है। GGL likelihood प्रत्येक bin के लिए full-covariance Gaussian का उपयोग करता है: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b)। संयुक्त objective है logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ)। priors मुख्यतः physically feasible boundaries encode करते हैं (log ℓ, log V0, और log M200 पर interval constraints); जब free Υ और σ_int enabled होते हैं, weakly informative priors उपयोग किए जाते हैं (विवरण के लिए implementation और release-package configuration देखें)।

Sampler adaptive block Metropolis random walk का उपयोग करता है: प्रत्येक step parameter space के केवल random sub-block को update करता है ताकि high dimensions में acceptance rate सुधरे, और step size को windowed acceptance rate द्वारा हल्के रूप में adapt किया जाता है (target acceptance rate लगभग 0.25)। मुख्य परिणाम quick mode का उपयोग करते हैं (जैसे n_steps=800), और प्रत्येक workspace manual तथा scripted audits के लिए traces, residuals, और PPC plots output करता है।


4.4 Closure Test और Negative Control (परिभाषा)

Closure test (Run-2) जाँचता है कि RC-only posterior GGL को refit किए बिना predict कर सकता है या नहीं। विशेष रूप से, यह RC-only posterior samples से 4 GGL bins के लिए ΔΣ(R) forward-generate करता है और full covariance से logL_true compute करता है; फिर RC-bin→GGL-bin group mapping को randomly permute करके logL_perm प्राप्त करता है। Closure strength को ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ के रूप में परिभाषित किया गया है। इसके अतिरिक्त, Run-10 20 RC bins को यादृच्छिक रूप से 4×5 (shuffle) में regroup करता है और closure recompute करता है, जिससे जाँचा जाता है कि closure signal सही mapping पर कितना निर्भर है।

5 मुख्य परिणाम और व्याख्या


5.1 मुख्य संयुक्त-फिट परिणाम (RC+GGL)

joint fit से best logL_total और relative advantage ΔlogL_total (DM_RAZOR के सापेक्ष) तालिका S1a और चित्र S4 में दिखाए गए हैं। मुख्य comparison set में EFT_BIN की joint advantage सबसे बड़ी है (ΔlogL_total=1337.210), जबकि अन्य EFT kernel shapes भी महत्वपूर्ण advantages बनाए रखते हैं (1154.827–1294.442)। information criteria (AICc/BIC) के तहत भी EFT परिवार DM_RAZOR से स्पष्ट रूप से बेहतर है, जिससे संकेत मिलता है कि advantage parameters की संख्या से आए bias के कारण नहीं है।

नोट: ΔlogL_total≈1337 में मुख्य योगदान RC term से आता है (joint decomposition में ΔlogL_RC≈1065, लगभग 80%)। इसे N=2295 RC data points पर प्रति point लगभग Δχ²≈0.90 के modest improvement के रूप में समझा जा सकता है, जो diagonal Gaussian likelihood के तहत स्वाभाविक रूप से 10^3 order की advantage में संचित होता है। साथ ही, GGL और closure test independent cross-dataset constraints देते हैं, और ranking σ_int, R_min, और cov-shrink stress tests के तहत stable रहती है (अनुभाग 6 और तालिका S1b देखें)।


5.2 Closure Test परिणाम (RC-only → GGL)

मुख्य closure-test quantity ΔlogL_closure तालिका S1b और चित्र S3 में रिपोर्ट की गई है। EFT परिवार की closure strengths 171.977–280.513 हैं, जो DM_RAZOR की 126.678 से अधिक हैं। इसका अर्थ है कि किसी अतिरिक्त cross-data degrees of freedom की अनुमति दिए बिना, RC data से EFT द्वारा प्राप्त posterior samples में GGL data के लिए अधिक transferable predictive power है।

Negative control closure signal की physical relevance को और समर्थन देता है: जब RC-bin→GGL-bin grouping यादृच्छिक रूप से shuffled की जाती है, EFT की closure strength 6–15 तक गिरती है (kernels के बीच छोटे अंतर के साथ), जबकि baseline closure strength 172–281 जितनी ऊँची है। यह “signal collapse” numerical implementation, unit errors, या improper covariance handling से उत्पन्न false advantages को बाहर करता है।

चित्र R1 | Negative control: shuffle grouping के बाद closure signal उल्लेखनीय रूप से गिरता है (Tab_Z1 metrics से plotted)।


5.3 परिणामों का अर्थ और सीमाएँ

इस अध्ययन का निष्कर्ष है कि “इस dataset और इस protocol के तहत, EFT mean-gravity correction tested DM_RAZOR baseline से बेहतर प्रदर्शन करता है।” इस पर ज़ोर देना आवश्यक है कि DM पक्ष केवल fixed c(M) relation वाला minimal NFW baseline उपयोग करता है, जिसमें core formation, nonsphericity, environmental terms, या अधिक complex galaxy–halo connection models शामिल नहीं हैं। इसलिए यह manuscript सभी DM model families को exclude करने का दावा नहीं करता। इसके बजाय, यह मूल्यांकन करने के लिए reproducible, closure-test-centered control baseline देता है कि क्या RC और GGL को समान cross-data parameters और mapping से consistently समझाया जा सकता है।

इस सामान्य चिंता को संबोधित करने के लिए, हमने एक स्वतंत्र extension project, P1A (Appendix B देखें), पूरा किया। RC-bin→GGL-bin shared mapping या audit framework को बदले बिना, यह DM baseline को “standardized and auditable” तरीके से मजबूत करता है: तीन one-parameter enhancements (SCAT/AC/FB) से आगे, यह (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) one-parameter baryonic-feedback core proxy (DM_CORE1P), और (iii) weak-lensing-side shear-calibration nuisance m (DM_RAZOR_M) जोड़ता है, तथा combined model DM_STD रिपोर्ट करता है; EFT_BIN को control reference के रूप में रखा गया है।

• DM_RAZOR_SCAT (c–M scatter) — halo-to-halo concentration-scatter parameter σ_logc प्रस्तुत करता है ताकि परखा जा सके कि fixed c(M) DM की explanatory power को systematic रूप से underestimate करता है या नहीं;
• DM_RAZOR_AC (Adiabatic Contraction) — एकल parameter α_AC का उपयोग “no contraction” और “standard contraction” के बीच continuous interpolation के लिए करता है, जिससे baryons की inner halo को minimal cost पर contract करने की प्रवृत्ति पकड़ी जाती है;
• DM_RAZOR_FB (Feedback/core) — core scale (उदा., log r_core) का उपयोग करके बताता है कि inner-core formation rotation curves को कैसे suppress करता है, जबकि weak-lensing scales पर NFW approximation बनाए रखता है।

Quantitative P1A scoreboard Appendix B, Table B1 / Fig. B1 में दी गई है (Tab_S1_P1A_scoreboard से automatically generated)। closure metric में, DM_RAZOR_FB छोटा net improvement देता है (122.21→129.45, +7.25), जबकि अन्य enhancements closure strength में insignificant या negative योगदान देते हैं। joint-fit side पर, hierarchical c–M scatter prior (DM_HIER_CMSCAT) या combined model (DM_STD) जोड़ना joint logL को काफी सुधार सकता है, पर closure strength को नहीं सुधारता, जिससे संकेत मिलता है कि यह मुख्यतः joint-fit flexibility जोड़ता है, cross-probe transferability नहीं। इसलिए main text का core conclusion इस प्रकार पढ़ा जाना चाहिए: strict shared-mapping और closure-test constraints के तहत, EFT की cross-data consistency advantage DM side पर “overly weak baseline” चुनने से उत्पन्न नहीं होती। Appendix B से संबंधित P1A release package (supplementary tables/figures और full_fit_runpack) इस paper के full_fit_runpack के समान Zenodo Concept DOI के अंतर्गत additional files के रूप में शामिल किया जाएगा: https://doi.org/10.5281/zenodo.18526286

6 Robustness और Control Experiments


6.1 σ_int Scan (Run-5)

हम intrinsic RC scatter σ_int को systematic रूप से scan करते हैं और प्रत्येक σ_int पर joint inference दोहराते हैं, DM_RAZOR के सापेक्ष ΔlogL_total compute करते हैं। scan range में प्रत्येक model के minimum/maximum ΔlogL_total मान तालिका S1b में रिपोर्ट किए गए हैं।

चित्र R2 | σ_int scan के तहत ΔlogL_total की range (जितना अधिक, उतना बेहतर)।


6.2 R_min Scan (Run-6)

central-region data में systematics (जैसे noncircular motion, resolution, और insufficient baryonic modeling) के प्रभाव को जाँचने के लिए, हम RC पर R_min threshold cuts लागू करते हैं और joint inference दोहराते हैं। R_min scan के तहत EFT परिवार की advantage positive और scale में stable रहती है।

चित्र R3 | R_min scan के तहत ΔlogL_total की range (जितना अधिक, उतना बेहतर)।


6.3 cov-shrink Scan (Run-7)

GGL covariance में uncertainty को जाँचने के लिए, हम प्रत्येक mass bin की covariance matrix पर shrinkage लागू करते हैं: C_α=(1−α)C+α·diag(C), और α को scan करते हैं। परिणाम दिखाते हैं कि EFT परिवार की advantage इस treatment के प्रति insensitive है।

चित्र R4 | cov-shrink scan के तहत ΔlogL_total की range (जितना अधिक, उतना बेहतर)।


6.4 Ablation Ladder (Run-8)

EFT_BIN के भीतर, हम nested ablations करते हैं: minimal model (कोई free parameters नहीं) से शुरू करके, केवल छोटे degrees of freedom वाली versions तक, और अंततः complete 20-bin amplitude + global scale model तक। AICc/BIC दिखाते हैं कि complete EFT_BIN model डेटा द्वारा strongly required है।

चित्र R5 | EFT_BIN ablation ladder (AICc; जितना कम, उतना बेहतर)।


6.5 Holdout Prediction (Run-9)

हम आगे leave-one-bin-out (LOO) test चलाते हैं: 4 GGL mass bins में से हर बार एक bin hold out किया जाता है; बाकी bins (और सभी RC) का उपयोग करके inference फिर से किया जाता है, और फिर held-out bin पर test log-likelihood का मूल्यांकन होता है। Summary metrics supplementary table Tab_R3_leave_one_bin_out में दिए गए हैं (Run-9 product; file path patterns अनुभाग 8.2 की key-product list में दिए गए हैं)। worst held-out case में भी EFT परिवार DM_RAZOR से स्पष्ट रूप से superior रहता है।

चित्र R6 | LOO: held-out bin के लिए log-likelihood distribution (Run-9 products से)।


6.6 Negative Control: RC-bin Shuffle (Run-10)

Run-10 20 RC bins को यादृच्छिक रूप से 4×5 में regroup करता है और RC-only posterior को अपरिवर्तित रखते हुए closure recompute करता है। परिणाम दिखाते हैं कि original mapping की तुलना में shuffling closure mean logL_true और ΔlogL_closure दोनों को उल्लेखनीय रूप से घटाता है (तालिका S1b और चित्र R1 देखें), जिससे closure signal की interpretability और समर्थित होती है।

चित्र R7 | Negative control: shuffle mapping closure mean logL_true में स्पष्ट गिरावट लाती है (Run-10 products से)।

7 Traceability और Consistency Audit (Provenance)

इस paper में उद्धृत सभी numerical values release archive की strict summary tables और audit records में item by item trace की जा सकती हैं। main text को अधिक पठनीय रखने के लिए, full provenance chain (tag list, audit tables, checksum list, और verification method) Appendix A में स्थानांतरित कर दी गई है।

8 Reproducibility और Zenodo Archive

Data and code availability statement: इस paper में उपयोग किए गए SPARC rotation-curve data और KiDS-1000 weak-lensing data public datasets हैं। publication-grade report Zenodo पर archive की गई है (Concept DOI: https://doi.org/10.5281/zenodo.18526334), और full reproduction package भी Zenodo पर archive किया गया है (Concept DOI: https://doi.org/10.5281/zenodo.18526286)। विस्तृत execution steps, dependency environment, archive inventory, और hash-verification जानकारी Appendix A में दी गई है; DM-baseline standardization stress test (P1A) का design, run tags, और outputs Appendix B में दिए गए हैं।

उसी full-reproduction-package Concept DOI (https://doi.org/10.5281/zenodo.18526286) के तहत, हम use case के अनुसार दो reproducible entry points प्रदान करते हैं: • P1 (main text) full_fit_runpack: EFT vs DM_RAZOR के लिए RC-only / closure / joint analyses और robustness scans को reproduce करता है, तथा Tables S1a/S1b और Figs. S3/S4 सहित main-text assets generate करता है; • P1A (Appendix B) full_fit_runpack: DM-baseline standardization stress test (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD, EFT_BIN control सहित) को reproduce करता है, और Appendix Table B1 तथा Fig. B1 generate करता है। एक single archive entry point बनाए रखने के लिए P1A की supplementary tables/figures और full_fit_runpack उसी Concept DOI के अंतर्गत additional files के रूप में शामिल किए जाएँगे।

9 आभार और घोषणाएँ


9.1 आभार

हम SPARC और KiDS-1000 teams को public data और documentation उपलब्ध कराने के लिए, तथा इस project के reconstruction और audit workflow में भाग लेने वालों को धन्यवाद देते हैं।


9.2 Author Contributions

Guanglin Tu conceptual proposal, study design, engineering implementation, data curation, formal analysis, reproducibility workflow implementation and audit, तथा manuscript writing के लिए जिम्मेदार थे।


9.3 Funding

लेखक Guanglin Tu द्वारा self-funded (कोई external funding / कोई grant number नहीं)।


9.4 Competing Interests

लेखक Guanglin Tu “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)” से संबद्ध हैं; कोई अन्य competing interests घोषित नहीं किए गए।


9.5 AI Assistance

OpenAI GPT-5.2 Pro और Gemini 3 Pro का उपयोग भाषा polishing, structural editing, और reproducibility workflow के organization के लिए किया गया। इनका उपयोग data, results, figures, tables, या code generate या modify करने के लिए, या citations generate करने के लिए नहीं किया गया। पूरे manuscript की सामग्री और citation accuracy की पूरी जिम्मेदारी लेखक पर है।

10 References

Appendix A: Traceability और Reproducibility Details

यह appendix traceability और reproducibility के लिए long-term archive information का सार देता है, जिसमें run tags, audit results, archive inventories, और key verification points शामिल हैं, ताकि readers आवश्यकता के अनुसार work को check और reproduce कर सकें।


A.1 Traceability और Audit Details

long-term traceability सुनिश्चित करने के लिए, यह project प्रत्येक run और output के लिए timestamped tags उपयोग करता है और historical products को overwrite किए बिना सुरक्षित रखता है। इस manuscript में उद्धृत core values strict compilation (compile_tag=20260205_035929) से आती हैं और निम्न consistency audits से पास हुई हैं:

• सभी stage-level tables में run_tag और stage tags होते हैं; strict compilation script report/tables से “complete and consistent” canonical table sources चुनती है।

• Tab_Z1_master_summary और Tab_Z2_conclusion_highlights के मान selected canonical tables के विरुद्ध item by item compare किए जाते हैं।

• PDF generation के दौरान, “referenced table/figure tags” पर tag audit किया जाता है ताकि outdated products mix न हों।

Key tags (सभी intermediate products locate करने के लिए): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442।

Consistency-audit result: Tab_AUDIT_checks_strict pass=9, fail=0, skip=0 रिपोर्ट करता है (विवरण के लिए release package देखें)।


A.2 Reproducibility Execution Steps और Archive Inventory

यह अध्ययन “publication-grade report + tables/figures supplement + fully rerunnable run package” से बनी reproducibility system अपनाता है। readers सीधे Tables & Figures Supplement देखकर paper में cited सभी table/figure assets verify कर सकते हैं; numerical values और audit chain को scratch से reproduce करने के लिए वे full_fit_runpack का उपयोग data download करने और complete workflow rerun करने में कर सकते हैं। completion के बाद, package का built-in reference-table comparison script table-value consistency verify करने के लिए उपयोग किया जा सकता है।


A.2.1 Reproduction Quickstart (RUN_FULL, Windows PowerShell)

यह अनुभाग छोटा reproduction path देता है (Windows PowerShell)। quick checks के लिए readers को सलाह दी जाती है कि वे सीधे Tables & Figures Supplement देखें और cited tables तथा figures को item by item verify करें। end-to-end reproduction और सभी tables, figures, तथा audit products generate करने के लिए full_fit_runpack उपयोग करें: package README/ONE_PAGE_REPRO_CHECKLIST का पालन करते हुए verify_checksums.ps1 और RUN_FULL.ps1 चलाएँ (Mode=full recommended)।

Zenodo archive entry (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
इस paper के main-chain tags: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442।


A.2.2 Archive Materials और Key Verification Points (Packages & checks)

Zenodo archive तीन complementary categories की सामग्री देता है: (1) publication-grade report (यह paper, v1.1; Appendix B: P1A DM-baseline standardization stress test सहित); (2) Tables & Figures Supplement (इस paper में cited सभी table/figure assets को cover करने वाली supplementary tables और figures, P1 तथा P1A के लिए अलग-अलग); और (3) full_fit_runpack (full reproduction package: scratch से data download करता है और complete workflow rerun करता है, P1 और P1A के लिए अलग-अलग)। Items (1)–(2) quick reading और independent verification को support करते हैं; item (3) end-to-end full reproducibility प्रदान करता है।

सामग्री श्रेणी

फ़ाइल नाम (उदाहरण)

उद्देश्य और स्थान-निर्धारण (अनुशंसित उपयोग क्रम)

प्रकाशन-स्तरीय रिपोर्ट (चीनी और अंग्रेज़ी)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Zenodo पर archive की गई complete report; main text core conclusions और robustness audits देता है, जबकि Appendix B P1A (DM-baseline standardization stress test) देता है।

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

main text में cited सभी tables (CSV) और figures (PNG), generation scripts और tag files सहित।

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Appendix B (P1A) में cited सभी tables और figures, Tab_S1_P1A_scoreboard और Fig_S1_P1A_scoreboard सहित।

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

End-to-end full reproduction: scratch से data download करें और RC-only/closure/joint तथा robustness scans rerun करें।

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

End-to-end full reproduction (Appendix B): DM 7+1 + DM_STD (EFT_BIN control सहित) rerun करें और appendix assets generate करें; package table-value consistency verify करने के लिए reference-table comparison script शामिल करता है।

Citation recommendation: इस paper या accompanying reproducibility materials का citation करते समय कृपया Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334) cite करें।

Reproduction के बाद दिखाई देने और compare किए जा सकने वाले key products में शामिल हैं:

Appendix B: P1A—DM-Baseline Standardization Stress Test (DM 7+1 + DM_STD; EFT Control सहित)

यह appendix “DM-baseline standardization stress testing” के लिए extension project (P1A) का documentation देता है, जो main text के closure protocol से consistent है। इसका role main text में प्रयुक्त minimal DM_RAZOR baseline (NFW + fixed c–M, no scatter / no contraction / no core) को ऐसी DM baseline set में upgrade करना है जो astrophysical practice के अधिक निकट हो और common critiques के प्रति अधिक resistant हो, बिना बड़ी संख्या में degrees of freedom जोड़े और बिना RC-bin→GGL-bin shared mapping या audit framework बदले। P1A पहले के three-branch stress test को cover करता है और उसका superset है: यह SCAT/AC/FB को बनाए रखता है, साथ में hierarchical c–M scatter + prior, one-parameter core proxy, और lensing-side shear-calibration nuisance m जोड़ता है; यह combined model DM_STD भी देता है। EFT_BIN control reference के रूप में रखा गया है।

Supplementary note: Appendix B (P1A) में closure strengths और संबंधित values main text में full EFT kernel family को cover करने के लिए प्रयुक्त quick budget (उदाहरण, ndraw=60, nperm=12) की तुलना में larger Monte Carlo budget (उदाहरण, ndraw=400, nperm=24) उपयोग करती हैं। इसलिए absolute values में O(10)-level sampling drift दिख सकता है। हालांकि, समान budget/table के भीतर model-to-model comparisons fair हैं, और advantage का sign तथा scale budgets में stable रहता है।


B.1 Purpose और Positioning (P1A क्यों, और Appendix के रूप में क्यों)

P1A सभी संभावित ΛCDM halo modeling choices को exhaust करने का प्रयास नहीं करता (जैसे nonsphericity, environmental dependence, complex galaxy–halo connections, या high-dimensional baryon physics)। इसके बजाय, P1A “low-dimensional, auditable, reproducible” principle का पालन करता है: प्रत्येक enhancement module केवल ≤1 key effective parameter प्रस्तुत करता है और इस paper की तीन hard constraints के अधीन रहता है:
(i) Parameter ledger: हर नया parameter explicitly record किया जाना चाहिए और information criteria (AICc/BIC) के साथ report होना चाहिए;
(ii) Shared mapping: वही RC-bin→GGL-bin grouping map अभी भी उपयोग किया जाता है; single dataset के लिए अलग से “mapping tune” करना allowed नहीं है;
(iii) Closure test: किसी भी enhancement को RC→GGL transfer prediction में genuine gain दिखाना चाहिए, केवल बेहतर RC-only fitting नहीं।


B.2 DM 7+1 + DM_STD: Module Definitions, Parameters, और Joint Posterior में Entry

एक independent runpack के रूप में, P1A 8 DM workspaces (DM 7+1) plus 1 EFT control देता है: DM_RAZOR baseline से शुरू करते हुए, यह तीन legacy one-parameter enhancements (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB) बनाता है, तीन और standard defensive modules (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) जोड़ता है, और फिर combined model DM_STD देता है। इन modules का साझा लक्ष्य तीन सबसे common critiques को कम-से-कम dimensionality increase के साथ cover करना है: (a) c–M scatter और priors hierarchical model में कैसे enter करते हैं; (b) क्या baryonic feedback का मुख्य प्रभाव one-parameter core proxy से capture किया जा सकता है; और (c) क्या key lensing-side systematics को physical signal समझ लिया जा सकता है।

Workspace

dm_model

नए parameter(s) (≤1)

भौतिक प्रेरणा (core)

Implementation principle (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

न्यूनतम, auditable ΛCDM halo baseline; EFT के साथ strict comparison के लिए उपयोग

Shared mapping fixed; strict parameter ledger; केवल relative comparison के baseline के रूप में उपयोग

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

c–M relation में scatter होता है; one-parameter log-normal scatter से approximated

≤1 नया parameter; shared mapping retained; closure gain acceptance criterion के रूप में उपयोग

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Baryonic infall halo adiabatic contraction induce कर सकता है; one-parameter strength से approximated

≤1 नया parameter; mapping unchanged; AICc/BIC changes और closure gain report करें

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback inner region में core बना सकता है; one-parameter core scale से approximated

≤1 नया parameter; same closure/negative-control protocol; RC-only improvement sole target नहीं

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

अधिक standard hierarchical c_i∼logN(c(M_i),σ_logc); RC और GGL दोनों के joint posterior को affect करता है

Explicit prior; latent c_i marginalized; फिर भी low-dimensional और auditable

DM_CORE1P

1-parameter core proxy (coreNFW/DC14-inspired)

log r_core

Baryonic feedback के main effect के लिए one-parameter core proxy, high-dimensional star-formation details से बचते हुए

Standard literature cite करता है; ≤1 नया parameter; closure test से tied

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

एक key weak-lensing systematic को effective parameter के रूप में absorb करता है, systematics को physics समझने का risk घटाता है

Nuisance explicitly recorded; RC को backward affect नहीं कर सकता; results mainly closure robustness से judged

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

तीन सबसे common critique classes को अब भी low-dimensional standard baseline में शामिल करता है

Parameter ledger + information criteria reported; closure primary metric है; सबसे मजबूत DM defensive control के रूप में उपयोग

नोट: ऊपर के parameter names engineering implementation का पालन करते हैं (उदाहरण, σ_logc, α_AC, log r_core, और m_shear)। P1A का design focus है “DM baseline को कुछ stronger बनाना और फिर भी auditable रखना,” न कि DM side को uncontrollable high-dimensional fitter बना देना। विशेष रूप से, DM_HIER_CMSCAT c–M scatter को hierarchically प्रस्तुत करता है: प्रत्येक halo की concentration c_i को c(M_i) के आसपास log-normal scatter दिया जाता है, जिसे global σ_logc और c(M) prior constrain करते हैं; यह hierarchical structure RC और GGL दोनों के joint posterior को affect करता है।


B.3 Main Text से Consistent Statistical Protocol और Product Conventions

P1A main text से सभी data products, shared mapping, और audit framework पुनः उपयोग करता है। execution order और product conventions consistent रहते हैं:
(1) Run‑1: RC-only inference (posterior_samples.npz और metrics.json output करता है);
(2) Run‑2: RC→GGL closure test (closure_summary.json और permuted baseline output करता है);
(3) Run‑3: RC+GGL joint fit (joint_summary.json output करता है)।
सभी quoted numbers automatically compiled table (Tab_S1_P1A_scoreboard) से आते हैं और P1A full_fit_runpack में built-in reference-table comparison script का उपयोग करके full P1A workflow rerun करने के बाद check किए जा सकते हैं।


B.4 Main Results, Table/Figure Entry Points, और Archive Plan (Same DOI)

यह अनुभाग P1A के core quantitative conclusions देता है। Table B1 RC-only, RC→GGL closure, और RC+GGL joint fitting के key metrics का सार देता है (parentheses DM_RAZOR baseline के सापेक्ष differences देते हैं)। Closure strength को ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ के रूप में परिभाषित किया गया है (जितना अधिक, उतना बेहतर)। Fig. B1 उसी scoreboard को visualize करता है। मुख्य बिंदु इस प्रकार हैं:
• तीन legacy branches में, केवल DM_RAZOR_FB (feedback/core) closure strength में छोटा net improvement देता है: 122.21→129.45 (+7.25); SCAT और AC कोई net improvement नहीं देते;
• नए जोड़े गए DM_HIER_CMSCAT और DM_RAZOR_M का closure strength पर बहुत छोटा प्रभाव (~0) है, और DM_CORE1P भी कोई significant net improvement नहीं दिखाता;
• combined model DM_STD joint logL को substantially improve कर सकता है (joint-fit optimum के निकट), पर इसकी closure strength घटती है, जिससे संकेत मिलता है कि इसका gain मुख्यतः joint-fit flexibility से आता है, cross-probe transferability से नहीं;
• control के रूप में, EFT_BIN closure strength और joint fitting दोनों में स्पष्ट advantage बनाए रखता है। इसलिए मुख्य निष्कर्ष “stronger DM baseline + lensing nuisance” पेश किए जाने पर भी robust है।

main-text results से सीधी तुलना के लिए, Tables S1a–S1b EFT family और DM_RAZOR के बीच strict comparison का सार देती हैं: EFT models DM_RAZOR के सापेक्ष joint fit को ΔlogL_total≈1155–1337 तक improve करते हैं और closure test में ΔlogL_closure=172–281 तक पहुँचते हैं। P1A केवल DM side पर “harder control” बनाता है; इसका उद्देश्य “strawman baseline” या “systematics-as-physics” जैसी चिंताओं को कम करना है, मुख्य comparison को replace करना नहीं।

Table B1 | P1A scoreboard (जितना अधिक, उतना बेहतर; parentheses DM_RAZOR baseline के सापेक्ष differences दिखाते हैं)।

Model branch (workspace)

Δk

RC-only best logL_RC (Δ)

Closure strength ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Fig. B1 | P1A scoreboard: baseline के सापेक्ष closure और joint ΔlogL (जितना अधिक, उतना बेहतर)।

इस appendix से संबंधित completed run set के example tags इस प्रकार हैं (P1A intermediate products और tables/figures locate करने के लिए उपयोग किए जाते हैं):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Suggested Citation (Appendix Citation Note)

जब readers paper के main conclusions के अतिरिक्त “DM-baseline standardization stress test” cite करना चाहें, तो सुझाव है कि वे main conclusion के साथ यह note cite करें: “standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance) के लिए Appendix B (P1A) देखें, उसी closure protocol के तहत।”