एक अल्पज्ञात चीनी एआई स्टार्टअप, डीपसीक ने आर1 की रिलीज के साथ कृत्रिम बुद्धिमत्ता पर सिलिकॉन वैली की पकड़ को बाधित कर दिया है, एक तर्क मॉडल जो ओपनएआई के चैटजीपीटी ओ1 को प्रतिद्वंद्वी करता है।
उन्नत चिप्स पर अमेरिका द्वारा लगाए गए निर्यात प्रतिबंधों की बाधाओं के तहत काम करने के बावजूद, डीपसीक ने एक ओपन-सोर्स मॉडल विकसित किया है जिसकी दक्षता और पहुंच के लिए प्रशंसा की जाती है।
हांग्जो स्थित कंपनी का दावा है कि R1 गणित और कोडिंग सहित जटिल तर्क की आवश्यकता वाले कार्यों में अग्रणी AI सिस्टम से बेहतर प्रदर्शन करता है। डीपसीक ने R1 के छोटे संस्करणों का भी अनावरण किया, जो लैपटॉप जैसे स्थानीय उपकरणों पर चलने में सक्षम है, जिससे उन्नत AI उपकरण सीमित संसाधनों वाले शोधकर्ताओं और डेवलपर्स के लिए अधिक सुलभ हो गए हैं।
बाधाओं के बीच नवाचार
अर्धचालकों पर अमेरिकी निर्यात नियंत्रण द्वारा लगाई गई सीमाओं को देखते हुए डीपसीक की सफलता और भी प्रभावशाली है। ये प्रतिबंध चीन को एनवीडिया के H100s जैसे उच्च-प्रदर्शन वाले चिप्स प्राप्त करने से रोकते हैं। हालाँकि, डीपसीक ने अपने मॉडलों को प्रशिक्षित करने के लिए प्रतिबंधों से पहले हासिल किए गए पुराने एनवीडिया ए100 चिप्स और कम क्षमता वाले एच800 चिप्स के भंडार का लाभ उठाया।
इन हार्डवेयर सीमाओं को पार करने के लिए, डीपसीक इंजीनियरों ने कम मेमोरी और कम्प्यूटेशनल पावर का उपयोग करने के लिए अपनी प्रशिक्षण प्रक्रियाओं को अनुकूलित किया। इस दक्षता-प्रथम दृष्टिकोण ने उन्हें कहीं अधिक संसाधनों के साथ निर्मित प्रणालियों के प्रदर्शन से मेल खाने की अनुमति दी।
कार्नेगी एंडोमेंट फॉर इंटरनेशनल पीस के एआई शोधकर्ता मैट शीहान ने कहा, “अमेरिकी निर्यात नियंत्रण ने अनिवार्य रूप से चीनी कंपनियों को एक ऐसे कोने में समर्थन दिया है जहां उन्हें कहीं अधिक साधन संपन्न होना चाहिए।” “यह नवप्रवर्तन की ओर ले गया है।”
वैश्विक मान्यता
माइक्रोसॉफ्ट के सीईओ सत्या नडेला ने दावोस में वर्ल्ड इकोनॉमिक फोरम में डीपसीक की उपलब्धियों पर प्रकाश डाला। “यह बहुत प्रभावशाली है कि उन्होंने कितने प्रभावी ढंग से एक गणना-कुशल, ओपन-सोर्स मॉडल बनाया है। डीपसीक जैसे विकास को बहुत गंभीरता से लिया जाना चाहिए, ”उन्होंने कहा।
मॉडल ChatGPT o1 के समान “विचार की श्रृंखला” तर्क दृष्टिकोण को नियोजित करता है, समस्याओं को चरण दर चरण हल करता है। अन्य प्रणालियों के विपरीत, R1 प्रत्येक तार्किक चरण का विवरण देने के बजाय सटीक उत्तरों पर जोर देता है, जिससे गुणवत्ता से समझौता किए बिना गणना समय कम हो जाता है।
माइक्रोसॉफ्ट के एक प्रमुख शोधकर्ता दिमित्रिस पपेलिओपोलोस ने इसकी सादगी के लिए मॉडल की प्रशंसा की। उन्होंने कहा, “डीपसीक ने मुख्य प्रदर्शन पर ध्यान केंद्रित किया, जिसने प्रभावशीलता बनाए रखते हुए लागत में काफी कटौती की।”
बढ़ती प्रतिस्पर्धा
डीपसीक का उदय चीन के एआई क्षेत्र में व्यापक रुझान को दर्शाता है, जिसने ओपन-सोर्स सिद्धांतों को अपनाया है। मिनिमैक्स और 01.एआई जैसे स्टार्टअप ने सार्वजनिक उपयोग के लिए अपने मॉडल जारी किए हैं, जबकि अलीबाबा जैसे तकनीकी दिग्गजों ने 100 से अधिक ओपन-सोर्स एआई समाधान लॉन्च किए हैं।
चाइना एकेडमी ऑफ इंफॉर्मेशन एंड कम्युनिकेशंस टेक्नोलॉजी के अनुसार, चीन अब वैश्विक AI भाषा मॉडल का 36% हिस्सा है, जो संयुक्त राज्य अमेरिका के बाद दूसरे स्थान पर है।
टफ्ट्स विश्वविद्यालय के प्रोफेसर थॉमस कितोंग काओ का कहना है कि यह बदलाव चीनी शोधकर्ताओं की एक नई पीढ़ी द्वारा संचालित है जो ओपन-सोर्स सहयोग को महत्व देते हैं। उन्होंने कहा, “युवा शोधकर्ताओं को ओपन-सोर्स संस्कृति से काफी फायदा हुआ है और वे इसमें योगदान दे रहे हैं।”
एआई प्रतियोगिता का भविष्य
डीपसीक की स्थापना 2023 में झेजियांग विश्वविद्यालय के पूर्व छात्र और हेज फंड हाई-फ्लायर के संस्थापक लियांग वेनफेंग ने की थी। एआई में उद्यम करने का लिआंग का निर्णय उनकी फर्म द्वारा हासिल किए गए चिप भंडार की क्षमता को पहचानने से उपजा था।
“चीनी कंपनियों ने समान परिणाम प्राप्त करने के लिए ऐतिहासिक रूप से अधिक कम्प्यूटेशनल शक्ति का उपयोग किया है। हमारा लक्ष्य नवाचार के माध्यम से उन अंतरालों को बंद करना है, ”लियांग ने 2024 के एक साक्षात्कार में कहा।
जैसे-जैसे एआई क्षेत्र में प्रतिस्पर्धा तेज होती जा रही है, विश्लेषकों को और अधिक समेकन और सहयोग की उम्मीद है। अलीबाबा ने हाल ही में “औद्योगिक बड़े मॉडल प्रयोगशाला” स्थापित करने के लिए काई-फू ली के 01.AI के साथ साझेदारी की है, जो संसाधन साझा करने की दिशा में एक रणनीतिक कदम का संकेत है।