← प्रयोग

P1_RC_GGL: आकाशगंगा गतिकी और कमजोर लेंसिंग का कठोर समापन परीक्षण (v1.1) पर आधारित जन-पाठक मार्गदर्शिका

मूल रिपोर्ट: Guanglin Tu | संस्करण आधार: P1 v1.1 | स्थिति: सार्वजनिक व्याख्यात्मक लेख / सहकर्मी-समीक्षित शोधपत्र नहीं
संबंधित अभिलेख: रिपोर्ट DOI 10.5281/zenodo.18526334 | पुनरुत्पादन पैकेज DOI 10.5281/zenodo.18526286

पठन टिप्पणी

यह एक explainer है, अलग academic report नहीं। यह मूल P1 report पर आधारित है, मुख्य figures और tables को बनाए रखता है, और हर प्रमुख चरण पर “इसका अर्थ क्या है” की सामान्य भाषा वाली व्याख्या जोड़ता है।

यह दस्तावेज़ केवल उन निष्कर्षों की व्याख्या करता है जिन्हें P1 अपने घोषित datasets, parameter ledger और statistical protocol के अंतर्गत पहुँचता है: galaxy rotation curves (RC) और galaxy-galaxy weak lensing (GGL) के संयुक्त test में EFT का mean gravitational response model यहाँ परखे गए minimal DM_RAZOR baseline से स्पष्ट रूप से आगे है।

यह दस्तावेज़ P1 को “अंधकार पदार्थ को उलट दिया” जैसी घोषणा के रूप में नहीं पढ़ता। P1, P-series experiments का केवल पहला कदम है। यह EFT के एक अवलोकनीय layer—“mean gravity floor”—को test करता है, पूरी EFT framework को नहीं।

0 | पाँच मिनट में P1 को समझें: यह परीक्षण असल में क्या कर रहा है?

P1 को आप एक “क्रॉस-प्रोब सत्य-जाँच” की तरह समझ सकते हैं। यह केवल यह नहीं पूछता कि कोई मॉडल एक डेटा-समुच्चय को फिट कर सकता है या नहीं। यह दो बहुत अलग गुरुत्वीय पठन को एक ही ऑडिट मंच पर रखता है: घूर्णन वक्र (RC) आकाशगंगा डिस्क के भीतर की गतिकी पढ़ते हैं, जबकि आकाशगंगा–आकाशगंगा कमजोर लेंसिंग (GGL) बड़े पैमानों पर प्रक्षेपित गुरुत्वीय प्रतिक्रिया पढ़ती है।

P1 का मुख्य वाक्य

P1 तुलना की कसौटी को “क्या यह एक probe को अच्छी तरह fit करता है?” से बढ़ाकर “क्या यह probes के पार close करता है?” तक ले जाता है। सही mapping के तहत मजबूत performance और shuffled mapping के बाद signal collapse यही संकेत देता है कि मॉडल RC और GGL के बीच साझा गुरुत्वीय संरचना पकड़ रहा हो सकता है।

तालिका 0 | P1 के मुख्य आँकड़े और सामान्य भाषा में उनका पाठ

मापदंड

P1 / P1A में reading

सामान्य भाषा में अर्थ

संयुक्त-fit ΔlogL_total

मुख्य तुलना में EFT, DM_RAZOR से 1155–1337 ऊपर है

दोनों datasets के पार कुल score gap; अधिक होना बेहतर overall explanation को दिखाता है।

बंदता-बल ΔlogL_closure

मुख्य तुलना में EFT 172–281 है; DM_RAZOR 127 है

केवल RC से inference के बाद GGL predict करने की क्षमता; अधिक होना अधिक cross-probe self-consistency का संकेत है।

नकारात्मक-control shuffle

RC-bin→GGL-bin shuffle करने के बाद EFT का closure signal 6–23 तक गिरता है

यदि सही correspondence टूटे, तो advantage गायब होना चाहिए; गिरावट जितनी तेज़, spurious signal को उतना अधिक बाहर करती है।

P1A बहु-DM तनाव-परीक्षण

DM 7+1 + DM_STD, और EFT_BIN control के रूप में सुरक्षित

P1A केवल minimal DM_RAZOR को नहीं देखता; वह multiple low-dimensional, auditable DM enhancement branches को उसी closure protocol के नीचे रखता है।


1 | P1 क्यों चलाएँ? आकाशगंगा-पैमाने की ब्रह्माण्ड-विज्ञान कहाँ अटकती है

आकाशगंगा-पैमाने की समस्याएँ इसलिए कठिन बनी रहती हैं क्योंकि “अतिरिक्त गुरुत्व/द्रव्यमान” की आवश्यकता केवल घूर्णन-वक्र की घटना नहीं है। अनेक अवलोकन दिखाते हैं कि आकाशगंगाओं में दिखने वाले बैरियोनिक पदार्थ और वास्तविक गतिशील या लेंसिंग पठन के बीच कसा हुआ संबंध है। अंधकार-पदार्थ मार्ग के लिए इसका अर्थ है कि अंधकार हैलो, बैरियोनिक फीडबैक, आकाशगंगा-निर्माण इतिहास और अवलोकन-जनित व्यवस्थित त्रुटियों को बहुत सावधानी से समन्वित करना होगा। गैर-अंधकार-पदार्थ गुरुत्व मार्गों के लिए इसका अर्थ है कि मॉडल केवल RC पर अच्छा दिखकर नहीं बच सकता; उसे कमजोर लेंसिंग, जनसंख्या-स्तरीय माप-नियमों और ऋणात्मक नियंत्रणों में भी टिकना होगा।

यही कारण है कि P1 को रचा गया। यह “अंधकार पदार्थ गलत है” या “EFT अवश्य सही है” से शुरू नहीं करता। यह एक जाँचयोग्य दावे को ऑडिट मंच पर रखता है: क्या EFT की औसत गुरुत्वीय प्रतिक्रिया RC→GGL क्रॉस-प्रोब समापन में पुनरुत्पाद्य और स्थानांतरित हो सकने वाला संकेत छोड़ती है?

बाहरी साहित्य पृष्ठभूमि: RC+GGL window क्यों महत्वपूर्ण है?

McGaugh, Lelli और Schombert (2016) द्वारा प्रस्तावित radial acceleration relation (RAR) दिखाता है कि rotation curves से trace की गई observed acceleration और baryonic matter से predicted acceleration के बीच tight, low-scatter correlation है। इससे baryon–gravitational-response coupling galaxy-scale theory के लिए अपरिहार्य बन जाता है।

Brouwer et al. (2021) ने KiDS-1000 weak lensing का उपयोग करके RAR को lower accelerations और larger radii तक फैलाया, और MOND, Verlinde emergent gravity तथा LambdaCDM models की तुलना की। उन्होंने यह भी बताया कि early-/late-type galaxy differences, gas halos और galaxy–halo connections अब भी key explanatory issues हैं।

Mistele et al. (2024) ने weak lensing से isolated galaxies के circular velocity curves का आगे inference किया और सैकड़ों kpc से लेकर लगभग 1 Mpc तक कोई स्पष्ट decline न होने की रिपोर्ट दी, जो BTFR से मेल खाता है। यह दिखाता है कि weak lensing galaxy-scale gravitational response को test करने का महत्वपूर्ण external readout बन रहा है।

इसलिए P1 का मूल्य यह नहीं है कि उसने पहली बार RC और GGL को साथ रखा। उसका मूल्य यह है कि वह उन्हें एक ऑडिटयोग्य प्रोटोकॉल में रखता है, जिसमें स्थिर मैपिंग, पैरामीटर लेखा, RC-only→GGL समापन, shuffle ऋणात्मक नियंत्रण और P1A बहु-DM दबाव-परीक्षण शामिल हैं।


2 | P1 में EFT का क्या अर्थ है? यह प्रभावी क्षेत्र सिद्धांत नहीं है

यहाँ EFT का अर्थ ऊर्जा फिलामेंट सिद्धांत (Energy Filament Theory) है; यह भौतिकी में परिचित प्रभावी क्षेत्र सिद्धांत (Effective Field Theory) नहीं है। P1 तकनीकी रिपोर्ट में EFT को जानबूझकर सीमित रूप में उपयोग किया गया है। इसे पूर्ण अंतिम सिद्धांत के रूप में प्रतियोगिता में नहीं उतारा गया; पहले इसे “औसत गुरुत्वीय प्रतिक्रिया” की एक अवलोकनीय, फिट-योग्य और खंडनीय पैरामीटराइज़ेशन में संकुचित किया गया है।

साधारण भाषा में कहें तो P1 अभी अतिरिक्त गुरुत्व के हर सूक्ष्म स्रोत की चर्चा नहीं करता, न ही वह पूरी EFT रूपरेखा को एक ही कदम में सिद्ध करने की कोशिश करता है। वह एक संकरा और कठोर प्रश्न पूछता है: यदि आकाशगंगा पैमानों पर किसी प्रकार की औसत अतिरिक्त गुरुत्वीय प्रतिक्रिया मौजूद है, तो क्या वह पहले RC को समझा सकती है और फिर GGL की भविष्यवाणी कर सकती है?

P1 EFT के किस हिस्से की जाँच करता है?

P1 “mean gravity floor” की जाँच करता है: एक statistical रूप से स्थिर average contribution जो samples के पार transfer कर सकता है।

P1 अभी stochastic / noise floor को address नहीं करता: ऐसे random terms, object-to-object variation या extra scatter जो अधिक microscopic fluctuation processes से पैदा हो सकते हैं।

P1 full microscopic mechanism, abundance, lifetime या global cosmological constraints पर भी चर्चा नहीं करता। यह P-series experiments का पहला कदम है, अंतिम verdict नहीं।


3 | P1 श्रृंखला की योजना: “औसत आधार” से शुरुआत क्यों?

P श्रृंखला को EFT के अवलोकनात्मक पुनर्प्राप्ति कार्यक्रम के रूप में समझा जा सकता है। यह हर दावा एक साथ मेज पर नहीं रखती। इसके बजाय, पहले उस हिस्से को अलग करती है जिसे सार्वजनिक डेटा सबसे सीधे जाँच सकते हैं। P1 औसत पद से शुरू करता है: यदि औसत गुरुत्वीय प्रतिक्रिया RC→GGL को बंद नहीं कर सकती, तो अधिक जटिल शोर पदों या सूक्ष्म तंत्रों पर चर्चा का कोई ठोस प्रवेश-बिंदु नहीं बचेगा।

तालिका 1 | P श्रृंखला की परत-दर-परत स्थिति

परत

पूछा गया प्रश्न

P1 में भूमिका

P1

क्या mean gravitational response RC→GGL को close कर सकती है?

वर्तमान report का मुख्य प्रश्न

P1A

यदि DM side को मजबूत किया जाए, तो क्या conclusion स्थिर रहता है?

परिशिष्ट B: DM 7+1 + DM_STD तनाव-परीक्षण

बाद का P-series work

क्या protocol अधिक data, अधिक probes और अधिक जटिल systematics तक extend हो सकता है?

भविष्य कार्य दिशा

गहरे प्रश्न

mean term, noise term और microscopic mechanism कैसे जुड़ते हैं?

P1 के conclusion scope से बाहर


4 | डेटा क्या हैं? RC और GGL अलग-अलग क्या बताते हैं?


4.1 घूर्णन वक्र (RC): डिस्क का गति-मापक

घूर्णन वक्र दर्ज करता है कि आकाशगंगा के केंद्र से अलग-अलग त्रिज्याओं पर गैस और तारे कितनी तेजी से परिक्रमा करते हैं। वे जितनी तेजी से चलते हैं, उस त्रिज्या पर उतना ही अधिक अभिकेन्द्रीय बल चाहिए, जिसका अर्थ है अधिक प्रभावी गुरुत्वीय खिंचाव। P1 SPARC डेटाबेस का उपयोग करता है; पूर्व-प्रसंस्करण के बाद इसमें 104 आकाशगंगाएँ, 2,295 वेग डेटा-बिंदु और 20 RC-bin शामिल हैं।


4.2 कमजोर लेंसिंग (GGL): बड़े पैमानों पर गुरुत्वीय तराजू

आकाशगंगा–आकाशगंगा कमजोर लेंसिंग मापती है कि अग्रभूमि आकाशगंगाएँ पृष्ठभूमि आकाशगंगाओं के प्रकाश को कैसे हल्के से मोड़ती हैं। यह बड़े, हैलो-जैसे पैमानों पर प्रक्षेपित गुरुत्वीय प्रतिक्रिया से जुड़ी है और आकाशगंगा डिस्कों में गैस गतिकी के विवरण पर निर्भर नहीं करती। P1 KiDS-1000 / Brouwer et al. 2021 के सार्वजनिक GGL डेटा का उपयोग करता है: चार तारकीय-द्रव्यमान bin, प्रत्येक bin में 15 त्रिज्यीय बिंदु, कुल 60 डेटा-बिंदु, और पूर्ण covariance matrix।


4.3 स्थिर मैपिंग: 20 RC-bin → 4 GGL-bin क्यों महत्वपूर्ण है

P1 20 RC-bin को 4 GGL-bin से एक स्थिर नियम द्वारा जोड़ता है: प्रत्येक GGL-bin पाँच RC-bin से मेल खाता है और आकाशगंगा-संख्या भारों के साथ औसत किया जाता है। यह मैपिंग हर मॉडल के लिए अपरिवर्तित रखी जाती है, इसलिए समापन परीक्षण और निष्पक्ष तुलना दोनों के लिए यह कठोर बाध्यता है।

Mapping को बाद में tune क्यों नहीं कर सकते?

यदि बाद में चुना जा सके कि कौन से RC-bins किस GGL-bins से मेल खाते हैं, तो model correspondence को rearrange करके closure बना सकता है। P1 20→4 mapping को पहले से lock करता है और फिर shuffle negative control से उसे जानबूझकर तोड़ता है, ताकि जाँचा जा सके कि closure signal सचमुच भौतिक रूप से उचित correspondence पर निर्भर है या नहीं।


5 | मॉडल और विधि: P1 असल में किसकी तुलना कर रहा है?


5.1 EFT पक्ष: निम्न-आयामी औसत गुरुत्वीय प्रतिक्रिया

EFT पक्ष पर, औसत गुरुत्वीय प्रतिक्रिया को बताने के लिए एक निम्न-आयामी अतिरिक्त वेग पद उपयोग किया जाता है। अतिरिक्त पद का आकार आयामरहित kernel function f(r/ℓ) से नियंत्रित होता है, जहाँ ℓ एक वैश्विक पैमाना है, और amplitude RC-bin के अनुसार दी जाती है। अलग-अलग kernels अलग आरंभिक ढाल, संक्रमण गति और दीर्घ-पल्लवी पूँछों का प्रतिनिधित्व करते हैं, और उन्हें robustness stress tests के रूप में उपयोग किया जाता है।


5.2 DM पक्ष: मुख्य तुलना और Appendix P1A को अलग-अलग पढ़ें

मुख्य तुलना में DM_RAZOR एक न्यूनतम, ऑडिटयोग्य NFW baseline है: यह स्थिर c–M relation का उपयोग करता है और इसमें halo-to-halo scatter, adiabatic contraction, feedback core, nonsphericity या environmental term शामिल नहीं है। इसका लाभ है नियंत्रित स्वतंत्रता और आसान पुनरुत्पादन; सीमा यह है कि यह हर LambdaCDM या हर अंधकार-पदार्थ halo model का प्रतिनिधि नहीं हो सकता।

इसी कारण Appendix B (P1A) DM पक्ष को मानकीकृत दबाव-परीक्षणों के एक समूह में बदलता है। साझा मैपिंग या समापन प्रोटोकॉल बदले बिना, यह SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m और संयुक्त baseline DM_STD जैसे निम्न-आयामी enhancement branches को क्रमशः जोड़ता है, जबकि EFT_BIN को control के रूप में रखता है। P1A को इस तरह पढ़ें: केवल एक न्यूनतम DM baseline से तुलना करने के बजाय, यह कई सामान्य और ऑडिटयोग्य DM तंत्रों को उसी “समापन मापदंड” के नीचे रखता है।

यहाँ उपयोग की गई सटीक conclusion wording

Main text: EFT series मुख्य तुलना में minimal DM_RAZOR से स्पष्ट रूप से बेहतर प्रदर्शन करती है।

Appendix B / P1A: कई low-dimensional, auditable DM enhancement branches और DM_STD stress test के पार, कुछ DM joint fits बेहतर होते हैं, पर closure strength EFT_BIN के advantage को मिटाती नहीं।

इसलिए सबसे सुरक्षित wording यह है: P1/P1A के data, mapping, parameter ledger और closure protocol के भीतर EFT की mean gravitational response अधिक मजबूत cross-data consistency दिखाती है; यह सभी dark-matter models को बाहर कर देने के समान नहीं है।


5.3 समापन परीक्षण: P1 का सबसे महत्वपूर्ण प्रयोगात्मक तर्क

1. केवल RC पर मॉडल फिट करें और RC-only पश्च-वितरण नमूनों का एक समूह प्राप्त करें।

2. GGL पर दोबारा समायोजन न करें; RC पश्च-वितरण को सीधे GGL की भविष्यवाणी के लिए उपयोग करें।

3. पूर्ण सहप्रसरण का उपयोग करके सही मैपिंग के तहत GGL पूर्वानुमान स्कोर logL_true की गणना करें।

4. RC-bin→GGL-bin मिलान को यादृच्छिक रूप से फेरबदल करें और नकारात्मक-नियंत्रण स्कोर logL_perm की गणना करें।

5. दोनों को घटाकर समापन शक्ति प्राप्त करें: ΔlogL_closure = <logL_true> − <logL_perm>.

सरल उपमा

Closure test एक cross-room retest जैसा है। Model पहले RC exam room में pattern सीखता है, फिर GGL exam room में उत्तर देता है। यदि उसने local trick के बजाय shared rule सीखा है, तो room बदलने के बाद भी उसे अच्छा प्रदर्शन करना चाहिए। यदि exam-room correspondence को जानबूझकर scramble किया जाए, तो advantage गायब होना चाहिए।


5.4 तकनीकी तालिकाएँ पढ़ने से पहले: पहले ये चार प्रवेश-बिंदु पकड़ें

तालिका 5.4 | अगली landscape तकनीकी तालिकाओं को पढ़ने का मार्ग

प्रवेश-बिंदु

क्या देखना है

यह क्यों महत्वपूर्ण है

तालिका S1a

कुल RC+GGL joint-fit score

उत्तर देता है: दोनों datasets को साथ देखने पर किसकी overall explanation अधिक मजबूत है?

तालिका S1b

बंदता-बल, shuffle और मजबूती scans

उत्तर देता है: क्या RC से सीखी चीज़ GGL तक transfer कर सकती है?

तालिका B0

P1A में multiple DM enhancement branches की definitions

P1 को “सिर्फ minimal DM_RAZOR से तुलना” में घटाने से बचाता है।

तालिका B1

P1A closure और joint scoreboard

जाँचता है कि DM को मजबूत करने के बाद closure advantage गायब होता है या नहीं।

लेआउट टिप्पणी

अगले page से landscape layout उपयोग होता है ताकि original report की wide tables बिना columns हटाए या unreadable compression के सुरक्षित रहें। Main text ने plain-language reading पहले ही दे दी है; landscape technical tables उन readers के लिए हैं जिन्हें numbers और model branches verify करने हैं।

चित्र 0.1 | P1 के समापन-परीक्षण workflow को एक नज़र में समझें

टिप्पणी: ऊपरी श्रृंखला “समापन परीक्षण” है (केवल RC से fit → RC posterior से GGL की भविष्यवाणी); निचली श्रृंखला “संयुक्त fit” है (RC+GGL को साथ score करना)। दाईं ओर, true mapping की तुलना shuffled mapping से करके समापन शक्ति ΔlogL प्राप्त की जाती है।


6 | मुख्य तकनीकी तालिकाएँ: मुख्य रिपोर्ट तालिकाएँ और P1A तालिकाएँ

तालिका S1a | मुख्य संयुक्त-fit तुलना संकेतक (RC+GGL, Strict; मूल रिपोर्ट से सुरक्षित)

मॉडल (workspace)

W kernel

k

संयुक्त logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

तालिका S1b | समापन और robustness संकेतक (Strict; मूल रिपोर्ट से सुरक्षित)

मॉडल (workspace)

बंदता ΔlogL (true-perm)

shuffle के बाद नकारात्मक-control ΔlogL

σ_int scan में ΔlogL range

R_min scan में ΔlogL range

cov-shrink scan में ΔlogL range

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

तालिका B0 | P1A में DM enhancement branches की परिभाषाएँ (मूल रिपोर्ट के Appendix B से सुरक्षित)

Workspace

DM मॉडल

नए parameters (≤1)

भौतिक motivation (core)

कार्यान्वयन सिद्धांत (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimal, auditable LambdaCDM halo baseline; EFT से strict comparison के लिए उपयोग

Fixed shared mapping; strict parameter ledger; relative comparison के लिए केवल baseline के रूप में उपयोग

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

c–M relation में scatter की अनुमति; one-parameter log-normal scatter से approximate

≤1 नया parameter; shared mapping बरकरार; closure gain acceptance criterion है

DM_RAZOR_AC

NFW + adiabatic contraction (legacy)

α_AC

Baryonic infall halo adiabatic contraction चला सकता है; one strength parameter से approximate

≤1 नया parameter; mapping unchanged; AICc/BIC changes और closure gain report करें

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback inner core बना सकता है; one-parameter core scale से approximate

≤1 नया parameter; समान closure/negative-control protocol; RC-only improvement sole target नहीं

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

अधिक standard hierarchical c_i∼logN(c(M_i), σ_logc); joint RC और GGL posterior को प्रभावित करता है

Explicit prior; latent c_i marginalized; low-dimensional और auditable बना रहता है

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

मुख्य baryonic-feedback effect के लिए one-parameter core proxy, ताकि high-dimensional star-formation details से बचा जा सके

Standard literature references; ≤1 नया parameter; closure test से tied

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear (GGL)

Weak-lensing systematic को effective parameter से absorb करता है, जिससे systematics को physics मान लेने का जोखिम घटता है

Nuisance स्पष्ट ledgered है; RC में feedback नहीं कर सकता; results मुख्यतः closure robustness से judge होते हैं

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

तीन सबसे common objections को एक still-low-dimensional standardized baseline में रखता है

Parameter ledger और information criteria दोनों report; closure main metric है; strongest DM defense control के रूप में उपयोग

तालिका B1 | P1A scoreboard (जितना बड़ा उतना बेहतर; मूल रिपोर्ट के Appendix B से सुरक्षित)

मॉडल branch (workspace)

Δk

RC-only best logL_RC (Δ)

बंदता-बल ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Table B1 (P1A scoreboard) को कैसे पढ़ें

• Δk: नई degrees of freedom; बड़ा होना अधिक complex model बताता है, अपने-आप better model नहीं।

• दो columns पर ध्यान दें: closure strength ΔlogL_closure(Δ) (बड़ा मतलब अधिक transfer self-consistency) और Joint best logL_total(Δ) (कुल joint-fit score)।

• Parentheses में दिया (Δ), DM_RAZOR के सापेक्ष difference देता है ताकि direct comparison आसान हो।

• यह table मुख्यतः पूछती है कि जब DM baseline को reasonably strengthened किया जाता है, तो क्या closure advantage disappears करता है।

• Reading hint: DM_STD joint score को काफी सुधारता है, लेकिन closure strength घटती है; EFT_BIN closure strength में अब भी higher रहता है।

एक-वाक्य सार: इस low-dimensional, auditable DM enhancement set के भीतर joint fit सुधारना अपने-आप stronger closure नहीं देता; closure, यानी transferability, मुख्य criterion बना रहता है।


7 | मुख्य परिणामों को कैसे पढ़ें?


7.1 संयुक्त fit: दोनों डेटा-समुच्चयों को साथ देखने पर मुख्य तुलना में EFT का score अधिक है

तालिका S1a और चित्र S4 दिखाते हैं कि समान डेटा, समान shared mapping और लगभग समान parameter scale के तहत EFT series का joint ΔlogL_total, DM_RAZOR की तुलना में 1155–1337 है। सामान्य पाठ यह है: RC और GGL को साथ लेकर एक ही scoring rule में, मुख्य तुलना वाले EFT models अधिक कुल score प्राप्त करते हैं।


7.2 समापन परीक्षण: P1 का मुख्य जोर transferability पर है

उच्च समापन शक्ति का अर्थ है कि केवल RC से अनुमानित parameters, GGL को फिर से देखे बिना, GGL की बेहतर भविष्यवाणी कर सकते हैं। P1 रिपोर्ट में EFT का ΔlogL_closure 172–281 है, जबकि DM_RAZOR का 127 है। यह “हर मॉडल अपने डेटा को ठीक fit करता है” कहने से अधिक महत्वपूर्ण है, क्योंकि यह दूसरी डेटा-समुच्चय पर मॉडल की स्वतंत्रता सीमित करता है।


7.3 ऋणात्मक नियंत्रण: “signal collapse” अच्छा संकेत क्यों है?

जब P1 RC-bin→GGL-bin grouping correspondence को यादृच्छिक रूप से shuffle करता है, तब EFT का closure signal 6–23 की श्रेणी तक गिर जाता है। सामान्य पाठक के लिए यह एक anti-cheating check है: यदि closure advantage केवल code, units, covariance handling या fitting luck का उप-उत्पाद होता, तो shuffled correspondence में भी लाभ दिख सकता था। लेकिन वास्तविक परिणाम में लाभ ढह जाता है, जिससे पता चलता है कि वह सही mapping पर निर्भर है।

चित्र S3 | समापन शक्ति (जितनी बड़ी उतनी बेहतर): RC-only → GGL prediction के लिए औसत log-likelihood advantage।

इस figure को कैसे पढ़ें

यह figure P1 का केंद्र है। Bar जितनी ऊँची, RC से सीखी information उतनी बेहतर GGL तक transfer होती है।

EFT series कुल मिलाकर DM_RAZOR से ऊँची है, जो “पहले RC सीखो, फिर GGL predict करो” experiment में stronger cross-probe closure दिखाती है।

चित्र S4 | संयुक्त-fit advantage (जितना बड़ा उतना बेहतर): RC+GGL best logL_total relative to DM_RAZOR।

इस figure को कैसे पढ़ें

यह figure RC और GGL के jointly fitted होने के बाद total score दिखाता है।

सभी EFT variants शून्य से काफी ऊपर हैं, जिससे पता चलता है कि मुख्य comparison में EFT advantage कोई local one-point effect नहीं, बल्कि joint analysis का overall behavior है।

चित्र R1 | ऋणात्मक नियंत्रण: shuffled grouping के बाद closure signal तेज़ी से घटता है।

इस figure को कैसे पढ़ें

यह figure दिखाता है कि correct RC↔GGL binning relationship shuffle होते ही closure signal तेज़ी से गिरता है।

इससे P1 result किसी भी mapping से मिलने वाले numerical coincidence के बजाय data mapping के पार real consistency जैसा दिखता है।


8 | Robustness और controls: P1 केवल parameter tuning जैसा दिखने से कैसे बचता है?

किसी भी तकनीकी रिपोर्ट पर स्वाभाविक प्रश्न होते हैं: क्या लाभ किसी एक noise setting, किसी central-region data segment, किसी covariance treatment या overfitting से आता है? P1 इसका उत्तर कई pressure tests से देता है।

तालिका 2 | P1 के robustness tests और negative controls को कैसे पढ़ें

परीक्षण

यह किस शंका को बाहर करना चाहता है

पठन

σ_int scan

यदि RC में additional unknown scatter हो, तो क्या conclusion stable है?

RC errors को loosen करने के बाद EFT ranking और advantage scale stable रहते हैं।

R_min scan

यदि galaxy central region पर पूरा भरोसा न हो, तो क्या conclusion stable है?

Central region cut करने के बाद भी EFT positive advantage रखता है।

cov-shrink scan

यदि GGL covariance estimate uncertain हो, तो क्या conclusion stable है?

Covariance को diagonal की ओर shrink करने के बाद advantage insensitive रहता है।

Ablation ladder

क्या EFT अनावश्यक complexity से लाभ पा रहा है?

Information criteria के तहत full EFT_BIN आवश्यक है।

LOO held-out prediction

क्या model केवल seen data को ही explain करता है?

Held-out GGL bins में भी अपेक्षाकृत मजबूत generalization दिखता है।

RC-bin shuffle

क्या closure true mapping से आता है?

Grouping shuffle करने के बाद closure गिरता है, जो mapping dependence को support करता है।

चित्र R2 | σ_int scan के तहत ΔlogL_total की range (जितनी बड़ी उतनी बेहतर)।

इस figure को कैसे पढ़ें

जाँचता है कि assumed intrinsic RC scatter बदलने के बाद भी EFT की lead रहती है या नहीं।

चित्र R3 | R_min scan के तहत ΔlogL_total की range (जितनी बड़ी उतनी बेहतर)।

इस figure को कैसे पढ़ें

जाँचता है कि complex central region trim करने के बाद EFT का advantage stable रहता है या नहीं।

चित्र R4 | cov-shrink scan के तहत ΔlogL_total की range (जितनी बड़ी उतनी बेहतर)।

इस figure को कैसे पढ़ें

जाँचता है कि weak-lensing covariance handling बदलने पर ranking sensitive है या नहीं।

चित्र R5 | EFT_BIN के लिए ablation ladder (AICc; जितना छोटा उतना बेहतर)।

इस figure को कैसे पढ़ें

जाँचता है कि full EFT_BIN data explanation के लिए necessary है या केवल parameters जोड़ रहा है।

चित्र R6 | LOO: held-out bins के log-likelihood distribution।

इस figure को कैसे पढ़ें

जाँचता है कि model unseen GGL bins की prediction अब भी कर सकता है या नहीं।

चित्र R7 | ऋणात्मक नियंत्रण: shuffled mapping से closure mean logL_true में स्पष्ट गिरावट आती है।

इस figure को कैसे पढ़ें

mean logL_true perspective से आगे दिखाता है कि closure correct cross-data mapping पर निर्भर है।


9 | P1A: Appendix में कई DM models होना महत्वपूर्ण सुधार क्यों है?

यह खंड यह नहीं पूछता कि “क्या EFT ने केवल एक न्यूनतम DM_RAZOR को हराया?” वह पूछता है कि जब DM baseline को निम्न-आयामी, पुनरुत्पाद्य और स्पष्ट parameter ledger वाली setting (P1A) में मजबूत किया जाता है, तो क्या closure-test और joint-fit निष्कर्ष बदलते हैं। दूसरे शब्दों में, P1A इस आलोचना को कम करता है कि तुलना ने बहुत कमजोर DM baseline चुना था, और चर्चा को इस ओर ले जाता है कि ऑडिटयोग्य DM enhancements के समूह के तहत भी closure performance में अंतर बचता है या नहीं।

P1A हर संभव LambdaCDM halo modeling को समाप्त करने की कोशिश नहीं करता, न ही DM पक्ष को उच्च-आयामी, अनऑडिटेबल fitter में बदलता है। वह स्पष्ट parameter ledger वाले निम्न-आयामी, पुनरुत्पाद्य enhancements चुनता है: concentration scatter, adiabatic contraction, feedback core, hierarchical c–M scatter prior, one-parameter core proxy, weak-lensing shear-calibration nuisance, और संयुक्त DM_STD branch।

P1A की मुख्य reading

तीन legacy branches में, केवल feedback/core closure strength में छोटा net gain देता है; SCAT और AC net closure gain नहीं देते।

DM_HIER_CMSCAT, DM_RAZOR_M और DM_CORE1P closure strength पर बहुत कम effect डालते हैं या significant net gain नहीं दिखाते।

DM_STD joint logL को काफी सुधार सकता है, लेकिन उसकी closure strength घटती है; यह संकेत देता है कि वह मुख्यतः joint-fit flexibility बढ़ाता है, RC→GGL transfer-prediction power नहीं।

P1A Table B1 में EFT_BIN अब भी higher closure strength और joint-fit advantage रखता है। इसलिए P1 का core claim “इसने केवल minimal DM_RAZOR को हराया” में simplify नहीं होना चाहिए।

चित्र B1 | P1A scoreboard: baseline के सापेक्ष closure और joint ΔlogL (जितना बड़ा उतना बेहतर)।

इस figure को कैसे पढ़ें

यह figure दिखाता है कि multiple DM enhancement branches baseline के सापेक्ष कैसा perform करते हैं।

इसका अर्थ “all DM excluded” नहीं है। यह दिखाता है कि P1A द्वारा चुने गए low-dimensional, auditable DM enhancements के भीतर DM को मजबूत करने से EFT_BIN का closure advantage नहीं मिटता।


10 | P1 प्रयोग क्यों करने योग्य है?


10.1 पद्धतिगत महत्व: cross-probe closure को single-probe fitting से ऊपर रखना

आकाशगंगा-पैमाने का सिद्धांत अक्सर इस बहस में अटकता है कि कोई मॉडल rotation curves के एक set को fit कर सकता है या नहीं। P1 प्रश्न को एक स्तर ऊपर उठाता है: क्या RC से सीखे गए parameters, GGL पर फिर से tuning किए बिना weak lensing की भविष्यवाणी कर सकते हैं? इससे P1 fitting contest से transfer-prediction test बन जाता है।


10.2 पारदर्शिता का महत्व: पुनरुत्पाद्य chain को परिणाम का हिस्सा मानना

P1 का एक महत्वपूर्ण योगदान यह है कि वह data, tables और figures, run labels, negative controls, reproduction package और audit chain को साथ जारी करता है। समर्थकों और आलोचकों दोनों के लिए यह महत्वपूर्ण है: चर्चा slogans की तुलना करने के बजाय उसी सार्वजनिक data, उसी mapping, उसी scripts और उन्हीं metrics पर लौट सकती है।


10.3 भौतिक महत्व: non-dark-matter gravity के लिए मजबूत pressure test

non-dark-matter gravity में कई models rotation-curve या RAR phenomenology के किसी हिस्से को समझा सकते हैं। कठिन काम है कि उसी समय weak-lensing readouts भी पार हों और negative controls से दिखे कि signal सही mapping पर निर्भर है। P1 का महत्व है कि उसने EFT की mean gravitational response को एक “बाहरी परीक्षा” जैसे protocol में रखा: RC training field है, GGL transfer field है, और shuffle anti-cheating field है।


10.4 क्या यह non-dark-matter gravity क्षेत्र का महत्वपूर्ण प्रयोग है?

सावधानी से कहा जाए तो: यदि P1 का data handling, reproduction package और closure protocol बाहरी समीक्षा के बाद भी टिके, तो इसे non-dark-matter gravity / modified-gravity research में गंभीरता से लेने योग्य RC+GGL closure experiment माना जा सकता है। इसका महत्व “अंधकार पदार्थ को गिरा दिया” जैसे दावे में नहीं, बल्कि इस बात में है कि यह एक cross-probe criterion देता है जिसे पुनरुत्पादित, चुनौती दी और विस्तारित किया जा सकता है।

क्या पहले से equally strong RC+GGL predictive-closure framework मौजूद है?

संबंधित frameworks और observational traditions पहले से मौजूद हैं। MOND/RAR बहुत-सी rotation-curve phenomena को अच्छी तरह organize करता है; KiDS-1000 weak-lensing RAR work ने MOND, Verlinde emergent gravity और LambdaCDM models की तुलना भी की है। LambdaCDM भी galaxy–halo connections, gas halos और feedback modeling के माध्यम से weak-lensing/dynamical phenomenology के कुछ हिस्से समझा सकता है।

लेकिन P1 का precise claim यह नहीं है कि कोई दूसरा framework RC+GGL को explain नहीं कर सकता। दावा यह है कि P1 के अपने सार्वजनिक fixed mapping, RC-only→GGL closure, shuffle negative control, parameter ledger और P1A multi-DM stress-test protocol के तहत EFT stronger closure performance report करता है।

दूसरे शब्दों में, P1 में बाहरी परीक्षण के सबसे योग्य चीज़ उसका concrete, reproducible comparison protocol है। बहुत उपयोगी अगला कदम यह होगा कि MOND/RAR, LambdaCDM/HOD, hydrodynamical simulations या अन्य modified-gravity frameworks उसी protocol के तहत equal या higher closure scores हासिल कर सकते हैं या नहीं।


11 | P1 क्या निष्कर्ष निकाल सकता है, और क्या नहीं?

तालिका 3 | P1 के निष्कर्षों की सीमाएँ

निष्कर्ष निकाला जा सकता है

P1 के RC+GGL data, fixed mapping और main comparison protocol के तहत EFT series minimal DM_RAZOR की तुलना में higher joint-fit और closure strength रखती है।

निष्कर्ष निकाला जा सकता है

P1A के low-dimensional, auditable DM enhancement range के भीतर multiple DM enhancements EFT_BIN का closure advantage नहीं मिटाते।

निष्कर्ष निकाला जा सकता है

Shuffle negative control दिखाता है कि closure signal correct cross-data mapping पर निर्भर करता है और arbitrary mappings से प्राप्त नहीं किया जा सकता।

निष्कर्ष नहीं निकाला जा सकता

P1 सभी dark-matter models को overturn नहीं करता। P1A अब भी nonsphericity, environmental dependence, complex galaxy–halo connections, high-dimensional feedback या full cosmological simulations को exhaust नहीं करता।

निष्कर्ष नहीं निकाला जा सकता

P1 complete EFT theory को first principles से prove नहीं करता। यह केवल mean gravitational response की phenomenological layer को test करता है।

निष्कर्ष नहीं निकाला जा सकता

P1 सभी systematics को rule out नहीं करता। यह listed stress tests और audit scope के भीतर ही robustness evidence देता है।


12 | सामान्य पाठकों के अक्सर पूछे जाने वाले प्रश्न

Q1: क्या इसका मतलब है कि “अंधकार पदार्थ मौजूद नहीं है”?

नहीं। P1 के निष्कर्षों को यहाँ उपयोग किए गए data, protocol और comparison models तक सीमित रखना होगा। P1A minimal DM_RAZOR baseline से आगे जाता है, पर वह अब भी हर संभव dark-matter model का प्रतिनिधित्व नहीं करता।

Q2: क्या इसका मतलब है कि “EFT सिद्ध हो चुका है”?

नहीं। P1 EFT को mean gravitational response की parameterization के रूप में test करता है और RC→GGL closure पर अधिक मजबूत performance दिखाता है। Microscopic mechanisms और full theory P1 के निष्कर्ष नहीं हैं।

Q3: सीधे σ significance value क्यों नहीं दी जाती?

P1 unified likelihood scores, information criteria और closure differences का उपयोग करता है। ΔlogL एक ही scoring rule के तहत relative advantage है; यह किसी single σ value के समान नहीं है।

Q4: RC-bin→GGL-bin mapping को shuffle क्यों करते हैं?

यह negative control है। एक वास्तविक cross-probe signal को सही mapping पर निर्भर होना चाहिए। यदि signal shuffling के बाद भी उतना ही मजबूत रहता, तो वह implementation bias या statistical artifact का संकेत होता।

Q5: P1 का अगला सबसे जरूरी कदम क्या होना चाहिए?

उसी protocol को अधिक data, अधिक DM controls, अधिक जटिल systematics और अधिक modified-gravity frameworks तक फैलाना—विशेषकर ऐसे रूप में जिससे बाहरी teams उसी closure metric के तहत उसे फिर से जाँच सकें।


13 | लघु शब्दावली

तालिका 4 | लघु शब्दावली

शब्द

एक-वाक्य व्याख्या

घूर्णन वक्र (RC)

Galaxy disk में radius–velocity relation; disk plane के भीतर effective gravity infer करने के लिए उपयोग।

कमज़ोर लेंसिंग (GGL)

Background-galaxy shapes में statistical distortions के माध्यम से foreground galaxies के आसपास average gravitational/mass distribution को मापता है।

बंदता-परीक्षण

RC posterior से GGL predict करता है, फिर shuffled-mapping negative control से तुलना करता है।

नकारात्मक नियंत्रण

मुख्य structure को जानबूझकर तोड़ता है ताकि देखा जा सके कि signal गायब होता है या नहीं; spurious signals को rule out करने के लिए उपयोग।

NFW halo

Cold-dark-matter models में सामान्यतः उपयोग होने वाला dark-matter halo density profile।

c–M संबंध

Halo concentration c और mass M का संबंध; scatter की अनुमति model flexibility को प्रभावित करती है।

DM_STD

P1A में standardized DM stress-test branch, जो multiple low-dimensional DM enhancements को lensing nuisance parameter के साथ जोड़ती है।

ΔlogL

एक ही scoring rule के तहत दो models के बीच log-likelihood difference; positive value का अर्थ है कि पहला model बेहतर perform करता है।

सहप्रसरण

Data points के बीच correlations का matrix description; weak-lensing data में आम तौर पर full covariance matrix की आवश्यकता होती है।


14 | सुझाया गया reading route और citation entry points

1. पहले Sections 0–2 पढ़ें, ताकि P1 का प्रश्न और P1 में EFT की सीमित भूमिका समझ में आए।

2. फिर Fig. S3, Fig. S4 और Tables S1a/S1b देखें, ताकि closure strength, joint fitting और negative controls समझ में आएँ।

3. यदि आपको चिंता है कि DM baseline बहुत कमजोर है, तो सीधे Section 9 और Table B1 / Fig. B1 देखें।

4. तकनीकी समीक्षा के लिए P1 technical report v1.1, Tables & Figures Supplement और full_fit_runpack पर लौटें।

मुख्य archive entry points

P1 तकनीकी रिपोर्ट (release-level, Concept DOI): 10.5281/zenodo.18526334

P1 पूर्ण reproduction package (Concept DOI): 10.5281/zenodo.18526286

EFT संरचित knowledge base (optional, Concept DOI): 10.5281/zenodo.18853200

License note: technical report CC BY-NC-ND 4.0 का उपयोग करता है; full reproduction package CC BY 4.0 का उपयोग करता है (technical report और Zenodo archive records के अधीन)।


15 | संदर्भ और बाहरी पृष्ठभूमि

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.