चीन के DeepSeek ने उड़ाए सबके होश! AI मॉडल ट्रेनिंग का खुलासा हुआ खर्च

Follow Us On instagram Follow Now
Subscribe Youtube Channel subscribe Now

चीनी AI डेवलपर DeepSeek ने अपने R1 मॉडल को ट्रेन करने में सिर्फ $294,000 (करीब 2.45 करोड़ रुपये) खर्च किए हैं। यह जानकारी एक रिसर्च पेपर में सामने आई है और इससे यह बहस फिर से गर्म हो गई है कि AI की दौड़ में चीन की स्थिति कितनी मजबूत है।

अमेरिकी प्रतिद्वंद्वियों की तुलना में यह रकम बहुत कम है। हैंग्ज़ौ स्थित कंपनी की यह पहली आधिकारिक घोषणा है और यह जानकारी बुधवार को प्रतिष्ठित अकादमिक जर्नल ‘नेचर’ में प्रकाशित एक आर्टिकल में सामने आई।

जनवरी में DeepSeek के कम लागत वाले AI सिस्टम लॉन्च करने के बाद दुनिया भर के निवेशकों में हड़कंप मच गया था। उन्हें डर था कि यह नए मॉडल Nvidia जैसे AI दिग्गजों की बाजार में हावी होने की स्थिति को चुनौती दे सकते हैं।

उसके बाद से कंपनी और इसके संस्थापक लियांग वेनफेंग जनता की नजरों से काफी हद तक ओझल हो गए थे, सिवाय कुछ प्रोडक्ट अपडेट के।

US AI giant OpenAI के CEO सैम अल्टमैन ने 2023 में कहा था कि फाउंडेशनल मॉडल्स की ट्रेनिंग की लागत “$100 मिलियन (करीब 83 करोड़ रुपये) से कहीं अधिक” थी। हालांकि, उनकी कंपनी ने अपने किसी भी मॉडल के लिए विस्तृत आंकड़े नहीं दिए हैं।

नेचर आर्टिकल, जिसमें लियांग को सह-लेखकों में से एक बताया गया है, में कहा गया है कि DeepSeek के R1 मॉडल को ट्रेन करने में $294,000 का खर्च आया और इसमें 512 Nvidia H800 चिप्स का इस्तेमाल किया गया।

DeepSeek द्वारा अपनी विकास लागत और इस्तेमाल की गई तकनीक के बारे में दिए गए कुछ बयानों पर अमेरिकी कंपनियों और अधिकारियों ने सवाल उठाए हैं।

कंपनी ने पहली बार स्वीकार किया है कि उसके पास A100 चिप्स हैं और उनका इस्तेमाल डेवलपमेंट की तैयारी के चरणों में किया गया था। शोधकर्ताओं ने लिखा, “DeepSeek-R1 पर हमारे शोध के regarding, हमने एक छोटे मॉडल के साथ experiments की तैयारी के लिए A100 GPU का utilized किया।”

DeepSeek ने पहली बार जवाब दिया है, हालांकि सीधे तौर पर नहीं, उन दावों पर जिनमें कहा गया था कि उसने जानबूझकर OpenAI के मॉडल्स को अपने मॉडल्स में ‘डिस्टिल’ (शुद्ध/सार निकाला) किया है।

Copy of Untitled 2 5

कंपनी ने नेचर में कहा कि इसके V3 मॉडल के लिए ट्रेनिंग डेटा में ऐसे वेब पेज शामिल थे जिनमें “OpenAI-मॉडल-जनरेटेड जवाबों की एक significant संख्या थी, जो base मॉडल को अन्य शक्तिशाली मॉडलों से indirectly ज्ञान हासिल करने के लिए प्रेरित कर सकती है।” लेकिन इसने कहा कि यह जानबूझकर नहीं, बल्कि संयोगवश हुआ।


3 FAQs (अक्सर पूछे जाने वाले प्रश्न)

1. क्या DeepSeek का मॉडल वास्तव में OpenAI जैसे दिग्गजों से सस्ता है?

जी हां, DeepSeek के दावे के अनुसार उन्होंने अपना R1 मॉडल ट्रेन करने में महज $294,000 (लगभग 2.45 करोड़ रुपये) खर्च किए, जबकि OpenAI के CEO के अनुसार उनके मॉडल्स की ट्रेनिंग पर $100 मिलियन (लगभग 83 करोड़ रुपये) से अधिक का खर्च आता है। यह एक बहुत बड़ा अंतर है और अगर सही है, तो यह AI विकास में एक game-changer साबित हो सकता है।

2. ‘मॉडल डिस्टिलेशन’ क्या है और क्या DeepSeek ने OpenAI की नकल की है?

मॉडल डिस्टिलेशन एक ऐसी technique है जिसमें एक नया AI सिस्टम किसी मौजूदा और advanced AI मॉडल से सीखता है। इससे नए मॉडल को उतना समय और पैसा खर्च किए बिना ही पुराने मॉडल के फायदे मिल जाते हैं। DeepSeek ने स्वीकार किया है कि उसके ट्रेनिंग डेटा में OpenAI मॉडल्स द्वारा जनरेट किए गए जवाब शामिल थे, लेकिन उनका कहना है कि यह जानबूझकर नहीं हुआ। इसलिए इसे सीधे तौर पर ‘नकल’ कहना ठीक नहीं होगा।

3. कम खर्च में AI मॉडल बनाने के क्या फायदे हैं?

कम खर्च में AI मॉडल बनाने के दो बड़े फायदे हैं:

पहुंच: यह छोटी कंपनियों और शोधकर्ताओं के लिए भी advance AI टेक्नोलॉजी develop करना और उसका उपयोग करना आसान बना देता है।

नवाचार: जब development cost कम होती है, तो experiments करना और नए ideas को आजमाना ज्यादा आसान हो जाता है, जिससे पूरे ecosystem में innovation को बढ़ावा मिल सकता है।

5 thoughts on “चीन के DeepSeek ने उड़ाए सबके होश! AI मॉडल ट्रेनिंग का खुलासा हुआ खर्च”

Leave a Comment