जनवरी में, चीनी AI स्टार्टअप DeepSeek ने अपने किफायती और अत्याधुनिक AI मॉडल DeepSeek-V3 और DeepSeek-V1 लॉन्च कर टेक जगत में हलचल मचा दी थी। इन मॉडलों ने OpenAI और Google के प्रमुख मॉडलों को चुनौती दी, वह भी बहुत ही कम लागत में। अब, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के शोधकर्ताओं द्वारा विकसित एक नया AI मॉडल, S1, AI समुदाय में चर्चा का विषय बन गया है। इस मॉडल को मात्र $50 (लगभग ₹4400) की क्लाउड कंप्यूट क्रेडिट लागत में प्रशिक्षित किया गया है।
S1-32B एक ओपन-सोर्स एडवांस्ड भाषा मॉडल है जो खासतौर पर तर्क (Reasoning) से जुड़े सवालों के लिए डिज़ाइन किया गया है। इस मॉडल की सबसे बड़ी खासियत इसका ‘Test Time Scaling’ तकनीक है, जिससे यह परीक्षण के दौरान गतिशील रूप से अतिरिक्त कंप्यूटेशनल संसाधनों का उपयोग कर यह सवालों के जवाब देते समय खुद को सुधार सकता है और बेहतर जवाब दे सकता है। यह मॉडल OpenAI के O1 मॉडल का सीधा प्रतिद्वंद्वी माना जा रहा है, क्योंकि यह उत्तर उत्पन्न करने से पहले संबंधित प्रश्नों पर विचार कर अपनी प्रतिक्रियाओं को जांचने की क्षमता रखता है।
उदाहरण के लिए, यदि मॉडल से पूछा जाए कि iPhones को Android टैबलेट्स से बदलने की लागत कितनी होगी, तो यह प्रश्न को कई छोटे भागों में विभाजित करेगा। जैसे कि वर्तमान में कितने लोग iPhone उपयोग कर रहे हैं और Android टैबलेट बनाने में कितना खर्च आएगा।
S1 मॉडल को एक खास तरह के डेटासेट S1K के आधार पर प्रशिक्षित किया गया है। इस डेटासेट में 1,000 अच्छे, कठिन और विविध प्रकार के उच्च-गुणवत्ता वाले प्रश्न शामिल हैं। इसमें गणित, विज्ञान और तर्क से जुड़े कठिन प्रश्नों को शामिल किया गया है। इस मॉडल को प्रशिक्षित करने के लिए Supervised Fine-Tuning (SFT) तकनीक का उपयोग किया गया, जिसमें मात्र 26 मिनट का समय लगा और यह 16 NVIDIA H100 GPUs पर चलाया गया।
बावजूद इसके कि डेटासेट छोटा था, S1 ने उच्च तर्कशक्ति (reasoning accuracy) हासिल की। इसका कारण यह है कि S1 पहले से प्रशिक्षित Qwen2.5-32B-Instruct मॉडल पर आधारित है। यह मॉडल Google के Gemini 2.0 Flash Thinking Experimental से प्रेरित है, जिससे इसे गहरी सोचने और जवाब देने की क्षमता मिली है।
S1 मॉडल को तीन प्रमुख परीक्षाओं पर परखा गया—AIME24, MATH500, और GPQA Diamond। परीक्षण के दौरान, इस मॉडल ने सटीकता में सुधार दिखाया और OpenAI के O1 Preview मॉडल को भी पीछे छोड़ दिया। खासतौर पर, गणितीय प्रतियोगिता की समस्याओं में S1 ने 27% तक बेहतर प्रदर्शन किया।
जहाँ अन्य मॉडलों को विशाल डेटासेट और रीइन्फोर्समेंट लर्निंग की आवश्यकता होती थी, वहीं S1-32B ने साबित किया कि केवल 1,000 उच्च-गुणवत्ता वाले प्रश्नों के साथ भी एक बेहतरीन तर्कशील AI मॉडल बनाया जा सकता है।
S1 मॉडल ने यह साबित किया है कि दुनिया में पारदर्शिता (transparency) और ओपन-सोर्स तकनीकों का कितना बड़ा योगदान हो सकता है। इसकी विकास प्रक्रिया सार्वजनिक रूप से उपलब्ध कराई गई है, जिससे और भी शोधकर्ता और डेवलपर मिलकर इसे और बेहतर बना सकते हैं।
शोधकर्ताओं ने यह भी सुझाव दिया है कि टेस्ट-टाइम स्केलिंग की सीमाओं को पार करने के लिए नए तरीकों को खोजना होगा और रीइन्फोर्समेंट लर्निंग तकनीकों का प्रयोग कर S1 की तार्किक क्षमताओं को और बेहतर किया जा सकता है।
S1 AI मॉडल एक बड़ी उपलब्धि है जो कम लागत में कुशल प्रशिक्षण, टेस्ट-टाइम स्केलिंग और ओपन-सोर्स सिद्धांतों को एक साथ लाता है। इसका विकास AI समुदाय को यह संदेश देता है कि उच्च स्तरीय मॉडल तैयार करने के लिए बड़े बजट की आवश्यकता नहीं है, बल्कि सही रणनीति और संसाधनों का उपयोग करके बेहतरीन मॉडल तैयार किए जा सकते हैं।