दीपसेक ने R2 के लिए कोई सार्वजनिक समयरेखा की पेशकश नहीं की है। कंपनी ने शोध पत्रों और मॉडल अपडेट से थोड़ा परे खुलासा किया है, जो सोशल मीडिया अटकलों द्वारा भरी गई जानकारी के एक वैक्यूम को ईंधन देता है
और पढ़ें
चीनी एआई स्टार्टअप दीपसेक ने अपने गणित-केंद्रित भाषा मॉडल के लिए एक आश्चर्यजनक उन्नयन को गिरा दिया है, जो कि आगामी अगली पीढ़ी के तर्क प्रणाली के आसपास अटकलें लगाती है, जिसे केवल आर 2 के रूप में जाना जाता है।
जबकि कंपनी नए मॉडल के बारे में तंग हो गई है, प्रोवर-वी 2 की अचानक रिलीज, गणितीय प्रमाण-समाधान के लिए 671-बिलियन-पैरामीटर मॉडल ठीक-ट्यून, डेवलपर और निवेशक समुदायों में समान रूप से ऑनलाइन चैटर पर शासन किया है।
डीपसेक के वी 3 फाउंडेशन पर आधारित नया मॉडल बुधवार (30 अप्रैल) को चुपचाप खुला था। यह प्रोवर-वी 1.5 पर बनाता है, जिसने पिछले अगस्त में लॉन्च किया और शिक्षाविदों और प्रतिस्पर्धी गणित के मंडलियों से रुचि आकर्षित की।
जबकि प्रोवर-वी 2 लंबे समय से प्रतीक्षित आर 2 नहीं है, इसे व्यापक रूप से एक प्रमुख कदम पत्थर के रूप में व्याख्या किया गया है। एक्स और रेडिट पर उपयोगकर्ता इसे एक गणित की क्षमता अपग्रेड कर रहे हैं, जो चीन के सबसे अधिक देखे जाने वाले एआई स्टार्टअप से तर्क-केंद्रित एलएलएम में अगली छलांग के लिए ग्राउंडवर्क बिछा सकता है,
दक्षिण चीन मॉर्निंग पोस्ट सूचना दी।
2023 में लियांग वेनफेंग द्वारा अपने मात्रात्मक हेज फंड हाई-फ्लाईर के स्पिनआउट के रूप में स्थापित, दीपसेक ने जनवरी में लॉन्च किए गए आर 1 मॉडल के साथ जल्दी से वैश्विक ध्यान आकर्षित किया। R1 ने कम संसाधनों का उपयोग करते हुए, लागत के एक अंश पर Openai के O1-स्तरीय प्रदर्शन से मिलान करके AI दुनिया को चौंका दिया। उस सफलता ने जो कुछ भी आगे आता है, उसके लिए आकाश-उच्च उम्मीदें निर्धारित करते हैं।
R2 के लिए कोई समयरेखा नहीं
हालांकि, दीपसेक ने R2 के लिए कोई सार्वजनिक समयरेखा की पेशकश नहीं की है। कंपनी ने शोध पत्रों और मॉडल अपडेट से थोड़ा परे खुलासा किया है, जो सोशल मीडिया अटकलों द्वारा भरी गई जानकारी के एक वैक्यूम को ईंधन दे रहा है। एक दीपसेक शोधकर्ता के एक वायरल पोस्ट ने प्रोवर-वी 2 की घोषणा की, जिससे आर 2 रिलीज के लिए दलील देने वाले उत्तरों का एक झरना हुआ। “R2 R2 R2 कृपया,” एक उपयोगकर्ता ने लिखा।
इससे भी अधिक चर्चा जियुयंगोंगशे जैसे चीनी स्टॉक-ट्रेडिंग मंचों से आई, जहां एक आसन्न आर 2 ड्रॉप की अफवाहें पश्चिमी प्लेटफार्मों में फैल गईं। एक उल्लेखनीय अमेरिकी उद्यम पूंजी निवेशक ने व्यापक निवेशक हलकों में समाचार को प्रेरित करते हुए, एक्स पर बकबक उठाया। “डीपसेक” और “आर 2” के लिए खोज पिछले एक सप्ताह में Google रुझानों पर बढ़ी है।
साज़िश में जोड़कर, दीपसेक अब चुपचाप काम पर रखने से रैंप कर रहा है। कंपनी ने हाल ही में बीजिंग या हांग्जो में स्थित अपने पहले उत्पाद और डिजाइन लीड के लिए उद्घाटन पोस्ट किया है। नौकरी विवरण एलएलएम टेक में निहित “अगली पीढ़ी के बुद्धिमान उत्पाद अनुभव” के निर्माण के लिए कहता है। स्टार्टअप भी सक्रिय रूप से एक मुख्य वित्तीय अधिकारी और मुख्य परिचालन अधिकारी की भर्ती कर रहा है।
चीन में प्रतिस्पर्धा बढ़ती
यह उसी तरह आता है जैसे अन्य प्रमुख चीनी फर्म अपने खेल को बढ़ा रही हैं। मंगलवार को, अलीबाबा ने QWEN3 का अनावरण किया, जो कि मॉडल के अपने नवीनतम परिवार हैं, जो कंपनी कहती हैं कि कई मैट्रिक्स पर डीपसेक-आर 1 से बेहतर प्रदर्शन किया गया। घोषणा को कुछ लोगों ने धनुष के पार एक शॉट के रूप में देखा था, एक अनुवर्ती देने के लिए दीपसेक पर दबाव को बढ़ाते हुए।
इस बीच, संयुक्त राज्य अमेरिका में, Openai ने हाल ही में O3 और O4-Mini को जारी किया, उन्हें इसके “अब तक के सबसे सक्षम मॉडल” के रूप में टाल दिया। जबकि डीपसेक में अमेरिकी निर्यात प्रतिबंधों के कारण अत्याधुनिक एनवीडिया चिप्स तक पहुंच का अभाव है, इसने विवश हार्डवेयर पर प्रदर्शन को अधिकतम करने के लिए एक प्रतिष्ठा बनाई है, जो टेक्नोलॉजिस्ट और नीति निर्माताओं से रुचि रखते हैं।
प्रोवर-वी 2 का लॉन्च वह पीढ़ीगत छलांग नहीं हो सकता है जिसकी कुछ उम्मीद कर रहे थे, लेकिन यह सुझाव देता है कि डीपसेक निष्क्रिय से दूर है। कंपनी को स्केल करने और तेजी से भवन बनाने के साथ, अब सवाल यह नहीं है कि क्या R2 आ रहा है, लेकिन हम इसे कार्रवाई में देखने के कितने करीब हैं।