बीएमएस, बस, औद्योगिक, इंस्ट्रूमेंटेशन केबल के लिए।

जैसे-जैसे वसंत महोत्सव करीब आ रहा है, डीपसीक को लेकर उत्साह बना हुआ है। हाल ही में हुई छुट्टियों ने टेक उद्योग के भीतर प्रतिस्पर्धा की एक महत्वपूर्ण भावना को उजागर किया, जिसमें कई लोग इस "कैटफ़िश" पर चर्चा और विश्लेषण कर रहे हैं। सिलिकॉन वैली में अभूतपूर्व संकट का अनुभव हो रहा है: ओपन-सोर्स के समर्थक फिर से अपनी राय व्यक्त कर रहे हैं, और यहां तक कि ओपनएआई भी इस बात का पुनर्मूल्यांकन कर रहा है कि क्या इसकी क्लोज्ड-सोर्स रणनीति सबसे अच्छा विकल्प थी। कम कम्प्यूटेशनल लागत के नए प्रतिमान ने Nvidia जैसे चिप दिग्गजों के बीच एक चेन रिएक्शन को ट्रिगर किया है, जिससे अमेरिकी शेयर बाजार के इतिहास में एक दिन के बाजार मूल्य में रिकॉर्ड गिरावट आई है, जबकि सरकारी एजेंसियां डीपसीक द्वारा उपयोग किए जाने वाले चिप्स के अनुपालन की जांच कर रही हैं। विदेशों में डीपसीक की मिश्रित समीक्षाओं के बीच, घरेलू स्तर पर, यह असाधारण वृद्धि का अनुभव कर रहा है। R1 मॉडल के लॉन्च के बाद, संबंधित ऐप ने ट्रैफ़िक में उछाल देखा है, जो दर्शाता है कि एप्लिकेशन क्षेत्रों में वृद्धि समग्र AI पारिस्थितिकी तंत्र को आगे बढ़ाएगी। सकारात्मक पहलू यह है कि डीपसीक एप्लिकेशन संभावनाओं को व्यापक बनाएगा, यह सुझाव देता है कि भविष्य में चैटजीपीटी पर निर्भर रहना उतना महंगा नहीं होगा। यह बदलाव ओपनएआई की हाल की गतिविधियों में परिलक्षित हुआ है, जिसमें डीपसीक आर1 के जवाब में मुफ्त उपयोगकर्ताओं के लिए ओ3-मिनी नामक एक तर्क मॉडल का प्रावधान शामिल है, साथ ही बाद के उन्नयन ने ओ3-मिनी की विचार श्रृंखला को सार्वजनिक कर दिया। कई विदेशी उपयोगकर्ताओं ने इन विकासों के लिए डीपसीक का आभार व्यक्त किया, हालांकि यह विचार श्रृंखला एक सारांश के रूप में कार्य करती है।
आशावादी रूप से, यह स्पष्ट है कि डीपसीक घरेलू खिलाड़ियों को एकीकृत कर रहा है। प्रशिक्षण लागत को कम करने पर अपने फोकस के साथ, विभिन्न अपस्ट्रीम चिप निर्माता, मध्यवर्ती क्लाउड प्रदाता और कई स्टार्टअप सक्रिय रूप से पारिस्थितिकी तंत्र में शामिल हो रहे हैं, जिससे डीपसीक मॉडल का उपयोग करने के लिए लागत दक्षता बढ़ रही है। डीपसीक के कागजात के अनुसार, V3 मॉडल के पूर्ण प्रशिक्षण के लिए केवल 2.788 मिलियन H800 GPU घंटे की आवश्यकता होती है, और प्रशिक्षण प्रक्रिया अत्यधिक स्थिर होती है। 405 बिलियन मापदंडों वाले लामा 3 की तुलना में MoE (विशेषज्ञों का मिश्रण) आर्किटेक्चर दस गुना तक प्री-ट्रेनिंग लागत को कम करने के लिए महत्वपूर्ण है। वर्तमान में, V3 पहला सार्वजनिक रूप से मान्यता प्राप्त मॉडल है जो MoE में इतनी उच्च विरलता प्रदर्शित करता है। इसके अतिरिक्त, MLA (मल्टी लेयर अटेंशन) विशेष रूप से तर्क पहलुओं में तालमेल से काम करता है। चुआनजिंग टेक्नोलॉजी के एक शोधकर्ता ने AI टेक्नोलॉजी रिव्यू के विश्लेषण में कहा, "MoE जितना विरल होगा, कम्प्यूटेशनल पावर का पूरा उपयोग करने के लिए तर्क के दौरान बैच आकार उतना ही बड़ा होगा, जिसमें KVCache का आकार मुख्य सीमित कारक होगा; MLA KVCache के आकार को काफी कम कर देता है।" कुल मिलाकर, DeepSeek की सफलता विभिन्न तकनीकों के संयोजन में निहित है, न कि केवल एक में। उद्योग के अंदरूनी लोग DeepSeek टीम की इंजीनियरिंग क्षमताओं की प्रशंसा करते हैं, समानांतर प्रशिक्षण और ऑपरेटर अनुकूलन में उनकी उत्कृष्टता को देखते हुए, हर विवरण को परिष्कृत करके अभूतपूर्व परिणाम प्राप्त करते हैं। DeepSeek का ओपन-सोर्स दृष्टिकोण बड़े मॉडलों के समग्र विकास को और बढ़ावा देता है, और यह अनुमान लगाया जाता है कि यदि समान मॉडल छवियों, वीडियो और अधिक में विस्तारित होते हैं, तो यह पूरे उद्योग में मांग को काफी हद तक बढ़ाएगा।
तृतीय-पक्ष रीजनिंग सेवाओं के लिए अवसर
डेटा से पता चलता है कि रिलीज़ होने के बाद से, DeepSeek ने सिर्फ़ 21 दिनों के भीतर 22.15 मिलियन दैनिक सक्रिय उपयोगकर्ता (DAU) अर्जित किए हैं, जो ChatGPT के उपयोगकर्ता आधार का 41.6% है और Doubao के 16.95 मिलियन दैनिक सक्रिय उपयोगकर्ताओं को पार कर गया है, इस प्रकार यह दुनिया भर में सबसे तेज़ी से बढ़ने वाला एप्लिकेशन बन गया है, जो 157 देशों/क्षेत्रों में Apple ऐप स्टोर में सबसे ऊपर है। हालाँकि, जब उपयोगकर्ताओं की संख्या में वृद्धि हुई, तो साइबर हैकर लगातार DeepSeek ऐप पर हमला कर रहे थे, जिससे इसके सर्वर पर काफी दबाव पड़ रहा था। उद्योग विश्लेषकों का मानना है कि यह आंशिक रूप से DeepSeek द्वारा प्रशिक्षण के लिए कार्ड तैनात करने के कारण है, जबकि तर्क के लिए पर्याप्त कम्प्यूटेशनल शक्ति की कमी है। उद्योग के एक अंदरूनी सूत्र ने AI Technology Review को बताया, "अक्सर सर्वर की समस्याओं को शुल्क लगाकर या अधिक मशीनें खरीदने के लिए वित्तपोषण करके आसानी से हल किया जा सकता है; अंततः, यह DeepSeek के निर्णयों पर निर्भर करता है।" यह प्रौद्योगिकी बनाम उत्पादीकरण पर ध्यान केंद्रित करने में एक समझौता प्रस्तुत करता है। डीपसीक ने आत्मनिर्भरता के लिए काफी हद तक क्वांटम क्वांटाइजेशन पर भरोसा किया है, क्योंकि उसे बहुत कम बाहरी फंडिंग मिली है, जिसके परिणामस्वरूप अपेक्षाकृत कम नकदी प्रवाह दबाव और एक शुद्ध तकनीकी वातावरण है। वर्तमान में, उपर्युक्त समस्याओं के मद्देनजर, कुछ उपयोगकर्ता सोशल मीडिया पर डीपसीक से उपयोग सीमा बढ़ाने या उपयोगकर्ता की सुविधा बढ़ाने के लिए सशुल्क सुविधाएँ शुरू करने का आग्रह कर रहे हैं। इसके अतिरिक्त, डेवलपर्स ने अनुकूलन के लिए आधिकारिक API या तृतीय-पक्ष API का उपयोग करना शुरू कर दिया है। हालाँकि, डीपसीक के खुले प्लेटफ़ॉर्म ने हाल ही में घोषणा की, "वर्तमान सर्वर संसाधन दुर्लभ हैं, और API सेवा रिचार्ज को निलंबित कर दिया गया है।"
यह निस्संदेह AI इंफ्रास्ट्रक्चर क्षेत्र में तीसरे पक्ष के विक्रेताओं के लिए अधिक अवसर खोलता है। हाल ही में, कई घरेलू और अंतर्राष्ट्रीय क्लाउड दिग्गजों ने डीपसीक के मॉडल API लॉन्च किए हैं - विदेशी दिग्गज Microsoft और Amazon जनवरी के अंत में शामिल होने वाले पहले लोगों में से थे। घरेलू नेता, Huawei Cloud ने पहला कदम उठाया, 1 फरवरी को सिलिकॉन-आधारित Flow के सहयोग से DeepSeek R1 और V3 रीजनिंग सेवाएँ जारी कीं। AI टेक्नोलॉजी रिव्यू की रिपोर्ट बताती है कि सिलिकॉन-आधारित Flow की सेवाओं में उपयोगकर्ताओं की आमद देखी गई है, जिसने प्रभावी रूप से प्लेटफ़ॉर्म को "क्रैश" कर दिया है। बड़ी तीन टेक कंपनियों- BAT (Baidu, Alibaba, Tencent) और ByteDance- ने भी 3 फरवरी से कम लागत वाले, सीमित समय के ऑफ़र जारी किए, जो पिछले साल के क्लाउड विक्रेता मूल्य युद्धों की याद दिलाते हैं जो DeepSeek के V2 मॉडल लॉन्च द्वारा प्रज्वलित किए गए थे, जहाँ DeepSeek को "मूल्य कसाई" कहा जाने लगा था। क्लाउड विक्रेताओं की उन्मत्त कार्रवाइयाँ Microsoft Azure और OpenAI के बीच पहले के मज़बूत संबंधों को प्रतिध्वनित करती हैं, जहाँ 2019 में, Microsoft ने OpenAI में $1 बिलियन का पर्याप्त निवेश किया और 2023 में ChatGPT के लॉन्च के बाद लाभ उठाया। हालाँकि, मेटा द्वारा Llama को ओपन-सोर्स करने के बाद यह घनिष्ठ संबंध कमज़ोर होने लगा, जिससे Microsoft Azure पारिस्थितिकी तंत्र के बाहर के अन्य विक्रेताओं को उनके बड़े मॉडलों के साथ प्रतिस्पर्धा करने का मौक़ा मिला। इस उदाहरण में, DeepSeek ने न केवल उत्पाद की लोकप्रियता के मामले में ChatGPT को पीछे छोड़ दिया है, बल्कि o1 रिलीज़ के बाद ओपन-सोर्स मॉडल भी पेश किए हैं, जो GPT-3 के Llama के पुनरुद्धार के आस-पास के उत्साह के समान है।
हकीकत में, क्लाउड प्रदाता भी खुद को AI अनुप्रयोगों के लिए ट्रैफ़िक गेटवे के रूप में स्थापित कर रहे हैं, जिसका अर्थ है कि डेवलपर्स के साथ संबंधों को गहरा करना अग्रिम लाभ में तब्दील हो जाता है। रिपोर्ट्स बताती हैं कि Baidu स्मार्ट क्लाउड के पास मॉडल के लॉन्च के दिन Qianfan प्लेटफॉर्म के माध्यम से DeepSeek मॉडल का उपयोग करने वाले 15,000 से अधिक ग्राहक थे। इसके अतिरिक्त, कई छोटी फर्में समाधान पेश कर रही हैं, जिनमें सिलिकॉन-आधारित फ्लो, ल्यूचेन टेक्नोलॉजी, चुआनजिंग टेक्नोलॉजी और विभिन्न AI इंफ्रा प्रदाता शामिल हैं जिन्होंने DeepSeek मॉडल के लिए समर्थन शुरू किया है। AI टेक्नोलॉजी रिव्यू ने सीखा है कि DeepSeek की स्थानीयकृत तैनाती के लिए वर्तमान अनुकूलन अवसर मुख्य रूप से दो क्षेत्रों में मौजूद हैं: पहला है, हाइब्रिड GPU/CPU अनुमान का उपयोग करते हुए 671 बिलियन पैरामीटर MoE मॉडल को स्थानीय रूप से तैनात करने के लिए मिश्रित तर्क दृष्टिकोण का उपयोग करके MoE मॉडल की विरलता विशेषताओं के लिए अनुकूलन करना। चुआनजिंग टेक्नोलॉजी के एक शोधकर्ता ने कहा, "मॉडल के आकार और कई मापदंडों के कारण, अनुकूलन वास्तव में जटिल है, खासकर स्थानीय परिनियोजन के लिए जहां प्रदर्शन और लागत के बीच एक इष्टतम संतुलन प्राप्त करना चुनौतीपूर्ण होगा।" सबसे महत्वपूर्ण बाधा मेमोरी क्षमता सीमाओं पर काबू पाने में है। उन्होंने आगे बताया, "हम CPU और अन्य कम्प्यूटेशनल संसाधनों का पूरी तरह से उपयोग करने के लिए एक विषम सहयोग दृष्टिकोण अपनाते हैं, उच्च-प्रदर्शन CPU ऑपरेटरों का उपयोग करके प्रसंस्करण के लिए CPU/DRAM पर केवल विरल MoE मैट्रिक्स के गैर-साझा भागों को रखते हैं, जबकि सघन भाग GPU पर रहते हैं।" रिपोर्ट बताती है कि चुआनजिंग का ओपन-सोर्स फ्रेमवर्क KTransformers मुख्य रूप से एक टेम्पलेट के माध्यम से मूल ट्रांसफॉर्मर कार्यान्वयन में विभिन्न रणनीतियों और ऑपरेटरों को इंजेक्ट करता है, जो CUDAGraph जैसी विधियों का उपयोग करके अनुमान की गति को काफी बढ़ाता है। डीपसीक ने इन स्टार्टअप्स के लिए अवसर पैदा किए हैं, क्योंकि विकास लाभ स्पष्ट हो रहे हैं; कई फर्मों ने डीपसीक एपीआई लॉन्च करने के बाद उल्लेखनीय ग्राहक वृद्धि की सूचना दी है, पिछले ग्राहकों से अनुकूलन की तलाश में पूछताछ प्राप्त की है। उद्योग के अंदरूनी सूत्रों ने उल्लेख किया है, "अतीत में, कुछ हद तक स्थापित क्लाइंट समूह अक्सर बड़ी कंपनियों की मानकीकृत सेवाओं में बंद हो जाते थे, जो पैमाने के कारण उनके लागत लाभों से कसकर बंधे होते थे। हालाँकि, स्प्रिंग फेस्टिवल से पहले डीपसीक-आर1/वी3 की तैनाती पूरी करने के बाद, हमें अचानक कई जाने-माने क्लाइंट से सहयोग के अनुरोध मिले, और यहाँ तक कि पहले से निष्क्रिय क्लाइंट ने भी हमारी डीपसीक सेवाओं को पेश करने के लिए संपर्क शुरू किया।" वर्तमान में, ऐसा प्रतीत होता है कि डीपसीक मॉडल अनुमान प्रदर्शन को तेजी से महत्वपूर्ण बना रहा है, और बड़े मॉडलों के व्यापक रूप से अपनाए जाने के साथ, यह एआई इंफ्रा उद्योग में विकास को महत्वपूर्ण रूप से प्रभावित करना जारी रखेगा। यदि डीपसीक-स्तरीय मॉडल को कम लागत पर स्थानीय रूप से तैनात किया जा सकता है, तो यह सरकार और उद्यम डिजिटल परिवर्तन प्रयासों में बहुत मदद करेगा। हालाँकि, चुनौतियाँ बनी रहती हैं, क्योंकि कुछ क्लाइंट बड़े मॉडल क्षमताओं के बारे में उच्च अपेक्षाएँ रख सकते हैं, जिससे यह अधिक स्पष्ट हो जाता है कि व्यावहारिक तैनाती में प्रदर्शन और लागत को संतुलित करना महत्वपूर्ण हो जाता है।
यह मूल्यांकन करने के लिए कि क्या डीपसीक चैटजीपीटी से बेहतर है, उनके मुख्य अंतर, ताकत और उपयोग के मामलों को समझना आवश्यक है। यहाँ एक व्यापक तुलना दी गई है:
विशेषता/पहलू | डीपसीक | चैटGPT |
---|---|---|
स्वामित्व | एक चीनी कंपनी द्वारा विकसित | ओपनएआई द्वारा विकसित |
स्रोत मॉडल | खुला स्त्रोत | संपदा |
लागत | उपयोग करने के लिए निःशुल्क; सस्ते API एक्सेस विकल्प | सदस्यता या प्रति उपयोग भुगतान मूल्य निर्धारण |
अनुकूलन | अत्यधिक अनुकूलन योग्य, जिससे उपयोगकर्ता इसमें सुधार कर सकते हैं और इसे बेहतर बना सकते हैं | सीमित अनुकूलन उपलब्ध |
विशिष्ट कार्यों में प्रदर्शन | डेटा एनालिटिक्स और सूचना पुनर्प्राप्ति जैसे कुछ क्षेत्रों में उत्कृष्टता | रचनात्मक लेखन और संवादात्मक कार्यों में मजबूत प्रदर्शन के साथ बहुमुखी |
भाषा समर्थन | चीनी भाषा और संस्कृति पर विशेष ध्यान | व्यापक भाषा समर्थन लेकिन अमेरिका-केंद्रित |
प्रशिक्षण लागत | कम प्रशिक्षण लागत, दक्षता के लिए अनुकूलित | उच्च प्रशिक्षण लागत, जिसके लिए पर्याप्त कम्प्यूटेशनल संसाधनों की आवश्यकता होती है |
प्रतिक्रिया भिन्नता | संभवतः भू-राजनीतिक संदर्भ से प्रभावित होकर अलग-अलग प्रतिक्रियाएं दी जा सकती हैं | प्रशिक्षण डेटा पर आधारित सुसंगत उत्तर |
लक्षित दर्शक | लचीलापन चाहने वाले डेवलपर्स और शोधकर्ताओं पर लक्षित | संवादात्मक क्षमताओं की तलाश करने वाले सामान्य उपयोगकर्ताओं के लिए लक्षित |
उपयोग के मामले | कोड निर्माण और त्वरित कार्यों के लिए अधिक कुशल | पाठ तैयार करने, प्रश्नों का उत्तर देने और संवाद में शामिल होने के लिए आदर्श |
"एनवीडिया को बाधित करने" पर एक महत्वपूर्ण परिप्रेक्ष्य
वर्तमान में, हुआवेई के अलावा, मूर थ्रेड्स, मक्सी, बीरन टेक्नोलॉजी और तियानक्सू ज़िक्सिन जैसे कई घरेलू चिप निर्माता भी डीपसीक के दो मॉडलों को अपना रहे हैं। एक चिप निर्माता ने AI टेक्नोलॉजी रिव्यू को बताया, "डीपसीक की संरचना नवाचार को प्रदर्शित करती है, फिर भी यह एक LLM बनी हुई है। डीपसीक के लिए हमारा अनुकूलन मुख्य रूप से तर्क अनुप्रयोगों पर केंद्रित है, जिससे तकनीकी कार्यान्वयन काफी सरल और त्वरित हो जाता है।" हालाँकि, MoE दृष्टिकोण को भंडारण और वितरण के मामले में उच्च माँगों की आवश्यकता होती है, साथ ही घरेलू चिप्स के साथ तैनाती करते समय संगतता सुनिश्चित करना, कई इंजीनियरिंग चुनौतियाँ पेश करता है जिन्हें अनुकूलन के दौरान समाधान की आवश्यकता होती है। व्यावहारिक अनुभव के आधार पर एक उद्योग व्यवसायी ने कहा, "वर्तमान में, घरेलू कम्प्यूटेशनल शक्ति प्रयोज्यता और स्थिरता में Nvidia से मेल नहीं खाती है, जिसके लिए सॉफ़्टवेयर वातावरण सेटअप, समस्या निवारण और मूलभूत प्रदर्शन अनुकूलन के लिए मूल फ़ैक्टरी भागीदारी की आवश्यकता होती है।" साथ ही, "डीपसीक आर1 के बड़े पैरामीटर स्केल के कारण, घरेलू कम्प्यूटेशनल पावर को समानांतरीकरण के लिए अधिक नोड्स की आवश्यकता होती है। इसके अतिरिक्त, घरेलू हार्डवेयर विनिर्देश अभी भी कुछ हद तक पीछे हैं; उदाहरण के लिए, Huawei 910B वर्तमान में डीपसीक द्वारा पेश किए गए FP8 अनुमान का समर्थन नहीं कर सकता है।" डीपसीक V3 मॉडल की एक मुख्य विशेषता FP8 मिश्रित परिशुद्धता प्रशिक्षण ढांचे की शुरूआत है, जिसे एक बहुत बड़े मॉडल पर प्रभावी रूप से मान्य किया गया है, जो एक महत्वपूर्ण उपलब्धि है। पहले, Microsoft और Nvidia जैसे प्रमुख खिलाड़ियों ने संबंधित कार्य का सुझाव दिया था, लेकिन व्यवहार्यता के बारे में उद्योग के भीतर संदेह बना हुआ है। यह समझा जाता है कि INT8 की तुलना में, FP8 का प्राथमिक लाभ यह है कि प्रशिक्षण के बाद परिमाणीकरण अनुमान की गति को महत्वपूर्ण रूप से बढ़ाते हुए लगभग दोषरहित परिशुद्धता प्राप्त कर सकता है। FP16 की तुलना में, FP8 Nvidia के H20 पर दो गुना त्वरण और H100 पर 1.5 गुना से अधिक त्वरण प्राप्त कर सकता है। उल्लेखनीय रूप से, घरेलू कम्प्यूटेशनल शक्ति और घरेलू मॉडलों के चलन के बारे में चर्चाएँ जोर पकड़ रही हैं, इस बारे में अटकलें लगाई जा रही हैं कि क्या Nvidia को बाधित किया जा सकता है, और क्या CUDA खाई को बायपास किया जा सकता है, जो तेजी से प्रचलित हो रहा है। एक निर्विवाद तथ्य यह है कि डीपसीक ने वास्तव में Nvidia के बाजार मूल्य में पर्याप्त गिरावट का कारण बना है, लेकिन यह बदलाव Nvidia की उच्च-स्तरीय कम्प्यूटेशनल शक्ति अखंडता के बारे में सवाल उठाता है। पूंजी-संचालित कम्प्यूटेशनल संचय के बारे में पहले से स्वीकृत आख्यानों को चुनौती दी जा रही है, फिर भी प्रशिक्षण परिदृश्यों में Nvidia को पूरी तरह से प्रतिस्थापित करना मुश्किल है। डीपसीक के CUDA के गहन उपयोग के विश्लेषण से पता चलता है कि लचीलापन - जैसे संचार के लिए SM का उपयोग करना या सीधे नेटवर्क कार्ड में हेरफेर करना - नियमित GPU के लिए समायोजित करना संभव नहीं है। उद्योग के दृष्टिकोण इस बात पर जोर देते हैं कि Nvidia की खाई केवल CUDA के बजाय पूरे CUDA पारिस्थितिकी तंत्र को शामिल करती है, और PTX (समानांतर थ्रेड निष्पादन) निर्देश जो डीपसीक नियोजित करता है, वे अभी भी CUDA पारिस्थितिकी तंत्र का हिस्सा हैं। "अल्पावधि में, Nvidia की कम्प्यूटेशनल शक्ति को नजरअंदाज नहीं किया जा सकता है - यह प्रशिक्षण में विशेष रूप से स्पष्ट है; हालांकि, तर्क के लिए घरेलू कार्ड तैनात करना अपेक्षाकृत आसान होगा, इसलिए प्रगति संभवतः तेज होगी। घरेलू कार्ड का अनुकूलन मुख्य रूप से अनुमान पर केंद्रित है; कोई भी अभी तक घरेलू कार्ड पर डीपसीक के प्रदर्शन के मॉडल को बड़े पैमाने पर प्रशिक्षित करने में कामयाब नहीं हुआ है," एक उद्योग विश्लेषक ने AI प्रौद्योगिकी समीक्षा पर टिप्पणी की। कुल मिलाकर, एक अनुमान के दृष्टिकोण से, घरेलू बड़े मॉडल चिप्स के लिए परिस्थितियाँ उत्साहजनक हैं। अनुमान के दायरे में घरेलू चिप निर्माताओं के लिए अवसर प्रशिक्षण की अत्यधिक उच्च आवश्यकताओं के कारण अधिक स्पष्ट हैं, जो प्रवेश में बाधा डालते हैं। विश्लेषकों का तर्क है कि केवल घरेलू अनुमान कार्ड का उपयोग करना पर्याप्त है; यदि आवश्यक हो, तो एक अतिरिक्त मशीन प्राप्त करना संभव है, जबकि प्रशिक्षण मॉडल अद्वितीय चुनौतियाँ पेश करते हैं - मशीनों की बढ़ी हुई संख्या का प्रबंधन बोझिल हो सकता है, और उच्च त्रुटि दर प्रशिक्षण परिणामों को नकारात्मक रूप से प्रभावित कर सकती है। प्रशिक्षण में विशिष्ट क्लस्टर स्केल आवश्यकताएँ भी होती हैं, जबकि अनुमान के लिए क्लस्टर पर माँगें उतनी कठोर नहीं होती हैं, इस प्रकार GPU आवश्यकताओं को आसान बनाता है। वर्तमान में, Nvidia के एकल H20 कार्ड का प्रदर्शन Huawei या कैम्ब्रियन से बेहतर नहीं है; इसकी ताकत क्लस्टरिंग में निहित है। कम्प्यूटेशनल पावर मार्केट पर समग्र प्रभाव के आधार पर, ल्यूचेन टेक्नोलॉजी के संस्थापक, यू यांग ने AI टेक्नोलॉजी रिव्यू के साथ एक साक्षात्कार में कहा, "डीपसीक अस्थायी रूप से अल्ट्रा-बड़े प्रशिक्षण कम्प्यूटेशनल क्लस्टर की स्थापना और किराये को कमजोर कर सकता है। लंबे समय में, बड़े मॉडल प्रशिक्षण, तर्क और अनुप्रयोगों से जुड़ी लागतों को काफी कम करके, बाजार की मांग में उछाल आने की संभावना है। इस पर आधारित AI के बाद के पुनरावृत्तियों से कम्प्यूटेशनल पावर मार्केट में निरंतर मांग बढ़ेगी।" इसके अतिरिक्त, "डीपसीक की तर्क और फाइन-ट्यूनिंग सेवाओं की बढ़ी हुई मांग घरेलू कम्प्यूटेशनल परिदृश्य के साथ अधिक संगत है, जहां स्थानीय क्षमताएं अपेक्षाकृत कमजोर हैं, जो क्लस्टर स्थापना के बाद निष्क्रिय संसाधनों से अपशिष्ट को कम करने में मदद करती हैं; यह घरेलू कम्प्यूटेशनल पारिस्थितिकी तंत्र के विभिन्न स्तरों पर निर्माताओं के लिए व्यवहार्य अवसर पैदा करता है।" ल्यूचेन टेक्नोलॉजी ने घरेलू कम्प्यूटेशनल शक्ति पर आधारित डीपसीक आर1 सीरीज रीजनिंग एपीआई और क्लाउड इमेजिंग सेवाओं को लॉन्च करने के लिए हुआवेई क्लाउड के साथ सहयोग किया है। यू यांग ने भविष्य के बारे में आशा व्यक्त की: "डीपसीक घरेलू रूप से उत्पादित समाधानों में विश्वास पैदा करता है, जिससे आगे चलकर घरेलू कम्प्यूटेशनल क्षमताओं में अधिक उत्साह और निवेश को बढ़ावा मिलता है।"

निष्कर्ष
डीपसीक चैटजीपीटी से "बेहतर" है या नहीं, यह उपयोगकर्ता की विशिष्ट आवश्यकताओं और उद्देश्यों पर निर्भर करता है। लचीलेपन, कम लागत और अनुकूलन की आवश्यकता वाले कार्यों के लिए, डीपसीक बेहतर हो सकता है। रचनात्मक लेखन, सामान्य पूछताछ और उपयोगकर्ता के अनुकूल संवादात्मक इंटरफेस के लिए, चैटजीपीटी अग्रणी हो सकता है। प्रत्येक उपकरण अलग-अलग उद्देश्यों को पूरा करता है, इसलिए चुनाव काफी हद तक उस संदर्भ पर निर्भर करेगा जिसमें उनका उपयोग किया जाता है।
नियंत्रण केबल
संरचित केबलिंग प्रणाली
नेटवर्क और डेटा, फाइबर-ऑप्टिक केबल, पैच कॉर्ड, मॉड्यूल, फेसप्लेट
अप्रैल 16-18, 2024 मध्य-पूर्व-ऊर्जा दुबई में
16-18 अप्रैल, 2024 मॉस्को में सेकुरिका
9 मई, 2024 शंघाई में नए उत्पादों और प्रौद्योगिकियों का लॉन्च कार्यक्रम
22-25 अक्टूबर, 2024 सुरक्षा चीन बीजिंग में
19-20 नवंबर, 2024 कनेक्टेड वर्ल्ड KSA
पोस्ट करने का समय: फरवरी-10-2025