चीन का DeepSeek-V3 AI मॉडल दे सकता है OpenAI की बादशाहत को चुनौती, जाने क्या है इसकी खासियत

kushagra tripathi January 3, 2025

2 minutes read

DeepSeek-V3: कुछ दिन पहले OpenAI ने अपने नए o3 मॉडल का अनावरण किया, जिसने अद्भुत बेंचमार्क परिणामों के साथ आर्टिफिशियल जनरल इंटेलिजेंस (AGI) के करीब पहुंचने की बहस को जन्म दिया. लेकिन इसी दौरान चीन के AI लैब DeepSeek का DeepSeek-V3 मॉडल विषय का चर्चा बन गया. यह मॉडल न केवल OpenAI के GPT-4o और Anthropic के Claude 3.5 Sonnet को बेंचमार्क में पीछे छोड़ रहा है, बल्कि कम लागत और उच्च दक्षता के साथ AI की दुनिया में क्रांति ला रहा है.

क्या है DeepSeek-V3?

DeepSeek-V3 एक ओपन-सोर्स AI मॉडल है, जिसे केवल $5.5 मिलियन की लागत में विकसित किया गया है. इसकी तुलना में, GPT-4o को बनाने में लगभग $100 मिलियन खर्च हुए. यह Mixture-of-Experts (MoE) आर्किटेक्चर पर आधारित है, जिसमें कई विशेषज्ञ मॉडल मिलकर कार्य करते हैं. इस मॉडल में 671 बिलियन पैरामीटर हैं, लेकिन किसी भी कार्य के लिए केवल 37 बिलियन सक्रिय होते हैं, जिससे यह अत्यधिक प्रभावी और लागत-कुशल बनता है.

यह मॉडल 14.8 ट्रिलियन टोकन के उच्च-गुणवत्ता वाले डेटा पर प्रशिक्षित है और Multi-Head Latent Attention (MLA) व auxiliary-loss-free load balancing जैसी तकनीकों का उपयोग करता है. NVIDIA H800 चिप्स पर आधारित यह मॉडल सीमित संसाधनों के बावजूद शानदार परिणाम देता है.

खासियतें (DeepSeek-V3)

लंबे संदर्भ को समझने की क्षमता: यह मॉडल एक ही संदर्भ में 1,28,000 टोकन तक प्रोसेस कर सकता है, जो इसे कानूनी दस्तावेजों और अकादमिक अनुसंधान जैसे क्षेत्रों में श्रेष्ठ बनाता है.
मल्टी-टोकन प्रेडिक्शन: यह एक समय में कई शब्दों की भविष्यवाणी कर सकता है, जिससे इसकी गति 1.8 गुना बढ़ जाती है.
खुला उपयोग: DeepSeek-V3 का ओपन-सोर्स होना इसे छोटे और मध्यम डेवलपर्स के लिए भी सुलभ बनाता है, जिससे बड़ी कंपनियों के साथ प्रतिस्पर्धा करना संभव होता है.

प्रदर्शन

बेंचमार्क परीक्षणों में, DeepSeek-V3 ने गणित और कोडिंग जैसे क्षेत्रों में MATH-500 और LiveCodeBench पर प्रतिस्पर्धियों को पछाड़ दिया. विशेष रूप से, चीनी भाषा के कार्यों में इसका प्रदर्शन उत्कृष्ट रहा. हालांकि, इसकी रियल-टाइम इन्फरेंस क्षमता और अंग्रेजी तथ्यात्मक कार्यों में सुधार की जरूरत बताई जा रही है.

AI की दौड़ में नया मोड़

अमेरिका और चीन के बीच AI क्षेत्र में प्रतिस्पर्धा तेज हो रही है. अमेरिकी प्रतिबंधों ने चीन की उन्नत NVIDIA AI चिप्स तक पहुंच सीमित की है, लेकिन DeepSeek-V3 ने इन प्रतिबंधों के प्रभाव को कम कर दिया है. यह मॉडल दिखाता है कि उच्च प्रदर्शन वाले AI मॉडल अब बड़े बजट के बिना भी बनाए जा सकते हैं.

DeepSeek-V3 का ओपन-सोर्स होना न केवल AI अनुसंधान को democratize करता है, बल्कि यह बंद स्रोत मॉडलों के लिए एक बड़ी चुनौती भी पेश करता है.

DeepSeek-V3 ने साबित किया है कि सीमित संसाधनों के साथ भी AI में नई ऊंचाइयों को छुआ जा सकता है. यह मॉडल न केवल OpenAI जैसे दिग्गजों के वर्चस्व को चुनौती दे रहा है, बल्कि AI की दुनिया में एक नया अध्याय भी लिख रहा है.

kushagra tripathi January 3, 2025

2 minutes read

चीन का DeepSeek-V3 AI मॉडल दे सकता है OpenAI की बादशाहत को चुनौती, जाने क्या है इसकी खासियत

खासियतें (DeepSeek-V3)

AI की दौड़ में नया मोड़

kushagra tripathi

जमोड़ी पुलिस ने गुम नाबालिग बालिका को दस्तयाब कर परिजनों को सौंपा

स्व- सहायता समूह का कुकिंग कंपटीशन चुरहट में आयोजित

तेंदूपत्ता संग्रह की राशि पर आदिवासियों का हक-अजय सिंह

खासियतें (DeepSeek-V3)

AI की दौड़ में नया मोड़

kushagra tripathi

With Product You Purchase

Subscribe to our mailing list to get the new updates!

समाजवादी पार्टी द्वारा मनाया गया माता सावित्रीबाई फुले की जन्म जयंती

Paatal Lok 2 का टीजर हुआ रिलीज, कीड़े की कहानी सुनाते दिखे

Related Articles

अंतरराष्ट्रीय अज्ञात नंबरों से आ रही हैं कॉल? जानें, ऐसे स्कैमर्स से कैसे रहें सुरक्षित

10,000 से भी कम में यह है 5G स्मार्टफोन

भारत में साइबर हमलों में हुई 55% की वृद्धि

अब व्हाट्सएप में मिलेगा बिल्ट-इन डॉक्यूमेंट स्कैनर

जमोड़ी पुलिस ने गुम नाबालिग बालिका को दस्तयाब कर परिजनों को सौंपा

स्व- सहायता समूह का कुकिंग कंपटीशन चुरहट में आयोजित

तेंदूपत्ता संग्रह की राशि पर आदिवासियों का हक-अजय सिंह