Mar 09 2024, 09:09
गूगल के 'अविश्वसनीय' जेमिनी ने एलएलएम को कम आंका। क्या मेटा, माइक्रोसॉफ्ट बेहतर करेंगे?
Google जेमिनी की हालिया गिरावट ने माइक्रोसॉफ्ट और मेटा पर ध्यान आकर्षित किया है। विशेषज्ञों का मानना है कि 'फर्स्ट मूवर' का खिताब जीतने के लिए एलएलएम को दौड़ाने का 'बेक-फास्ट, ब्रेक-फास्ट' दृष्टिकोण सुर्खियां बटोर सकता है, लेकिन दर्शकों को त्रुटियों और पूर्वाग्रहों का आधा-अधूरा व्यंजन परोसता है। क्या इन जटिल भाषा मॉडलों में महारत हासिल करना बिग टेक की आरंभिक अपेक्षा से अधिक कठिन है?
Google के सितारे वस्तुतः मिथुन राशि के साथ संरेखित नहीं लगते हैं। ज्योतिष में, मिथुन राशि चक्र का तीसरा चिन्ह है, लेकिन Google के लिए यह कृत्रिम बुद्धिमत्ता (एआई) की अभी भी विकसित हो रही दुनिया में अपनी उपस्थिति महसूस कराने के लिए पहला बड़ा कदम है।
जैसा कि चीजें सामने आईं, Google अब अपने प्रमुख LLM (बड़े भाषा मॉडल) जेमिनी में गंभीर खामियों से जूझ रहा है।
शर्मनाक घटनाओं की एक श्रृंखला के बाद - नस्लवादी छवि निर्माण से लेकर भारतीय प्रधान मंत्री को "फासीवादी" करार देने तक - परियोजना के भविष्य और यहां तक कि सीईओ सुंदर पिचाई के नेतृत्व के बारे में सवाल घूम रहे हैं।
3 मार्च को सैन फ्रांसिस्को के एजीआई हाउस में हाल ही में जेमिनी हैकथॉन के दौरान Google के सह-संस्थापक सर्गेई ब्रिन ने दबे स्वर में स्वीकार किया, "हमने निश्चित रूप से छवि निर्माण में गड़बड़ी की है।" यह स्वीकारोक्ति पिचाई के 29 फरवरी के ज्ञापन के बाद आई है, जिसमें उन्होंने कहा था स्वीकार करते हैं, "हमें यह सब गलत लगा"।
जब Google, दुनिया की अग्रणी तकनीकी दिग्गज, अपने प्रमुख LLM के साथ लड़खड़ाती है, तो यह एक महत्वपूर्ण प्रश्न उठाता है: क्या इन जटिल भाषा मॉडलों में महारत हासिल करना बिग टेक की शुरुआत में अनुमानित तुलना में अधिक कठिन है?
भाषा को समझना शब्दावली और व्याकरण से कहीं आगे तक जाता है। इस कौशल को विकसित करने में मनुष्यों को हजारों साल लग गए, और यहाँ तक कि उस्ताद भी गलतियाँ करते हैं। अल मॉडलों से यह अपेक्षा करना कि वे संदर्भ, व्यंग्य, संस्कृति और इरादे की बारीकियों को तुरंत समझ लें, एक अनुचित मांग है। हमने इन सूक्ष्मताओं को पकड़ने के लिए पर्याप्त परिष्कृत एल्गोरिदम नहीं बनाया है।
खैर, OpenAI ने 2015 में ChatGPT पर काम करना शुरू किया, नवंबर 2022 में लॉन्च करने से पहले इसे प्रशिक्षित करने में वर्षों का निवेश किया। लेकिन Google ने पीछे छूट जाने के डर से, मार्च 2023 में चार महीने के भीतर बार्ड को लॉन्च किया। इसने इसके लिए गुंजाइश और समय कहां छोड़ा था मॉडल को व्यापक प्रशिक्षण से गुजरना होगा?
प्रथम होने का दबाव कंपनियों को एलएलएम को दरवाजे से बाहर करने के लिए प्रेरित कर रहा है। जैसा कि सांता क्लारा यूनिवर्सिटी के ब्रायन ग्रीन कहते हैं, "बढ़ती प्रतिस्पर्धा के कारण एलएलएम में जल्दबाजी की जा रही है।" इसका मतलब अक्सर यह होता है कि उपयोगकर्ताओं को बग का सामना करना पड़ता है और कंपनियां तुरंत उन्हें ठीक करने के लिए संघर्ष करती हैं। हालाँकि यह तेजी से बग फिक्स की अनुमति देता है, "जोखिम यह है कि उनका अधूरा उत्पाद उन्हें मूर्ख बना देता है"।
बड़े पैमाने पर वास्तविक दुनिया के टेक्स्ट डेटा पर प्रशिक्षित जेमिनी और चैटजीपीटी को अपने पूर्वाग्रह और सीमाएं विरासत में मिल सकती हैं। इससे रूढ़िवादिता को बनाए रखने, आपत्तिजनक भाषा उत्पन्न करने या यहां तक कि कुछ पहचानों और संस्कृतियों को समझने में असफल होने का जोखिम होता है। जबकि तकनीकी कंपनियां डेटा क्यूरेशन और विविध प्रतिनिधित्व के लिए प्रयास करती हैं, वास्तविक समावेशिता प्राप्त करना एक निरंतर संघर्ष बना हुआ है।
"वर्षों से, बिग टेक, जिसे मैं आधे-मजाक में सिलिकॉन वैली आचार संहिता कहता हूं - तेजी से आगे बढ़ें, चीजों को तोड़ें, बाद में माफी मांगें - का पालन करते हुए हर चीज पर गति को प्राथमिकता दी गई है। यह दृष्टिकोण, हालांकि ईमेल या सोशल मीडिया जैसे कम प्रभावशाली अनुप्रयोगों के लिए प्रभावी है , अल की व्यापक क्षमताओं के साथ समस्याग्रस्त हो जाता है," अल नैतिकतावादी और प्रमुख जिबू एलियास कहते हैं
इंडियाएआई के वास्तुकार और अनुसंधान और सामग्री प्रमुख - भारतीय का राष्ट्रीय एआई पोर्टल
सरकार।
मामले को और अधिक जटिल बनाते हुए, प्रशिक्षण डेटा स्वयं पक्षपाती, अधूरा या विरोधाभासी हो सकता है। एलएलएमएस को पूर्वाग्रहों को बनाए रखने या तथ्यात्मक त्रुटियां पैदा करने से बचने के लिए इस डेटा को प्रभावी ढंग से फ़िल्टर और विश्लेषण करने की आवश्यकता है। हालाँकि, मौजूदा मॉडलों में उनके तर्क में पारदर्शिता की कमी है, जिससे छिपे हुए पूर्वाग्रहों और संभावित त्रुटियों के बारे में चिंताएँ बढ़ रही हैं।
उपयोगकर्ता अपनी विशिष्ट आवश्यकताओं के अनुरूप सटीक, सम्मानजनक और विविध आउटपुट चाहते हैं। लेकिन इस कार्य की जटिलता, भयंकर प्रतिस्पर्धा के साथ मिलकर, तकनीकी दिग्गजों को एलएलएम कोड को वास्तव में क्रैक करने के लिए आवश्यक अनुसंधान एवं विकास और दीर्घकालिक प्रतिबद्धता को कम आंकने के लिए प्रेरित कर सकती है।
एलियास कहते हैं, ''भारत में अल की तीव्र प्रगति के लिए न केवल बहुभाषावाद की चुनौतियों का सामना करना पड़ता है, बल्कि नवाचार की वास्तविक संस्कृति को बढ़ावा देना भी चुनौतियों का सामना करना पड़ता है।'' उन्होंने आगे कहा कि, भारतीय तकनीकी परिदृश्य, जो अपने सेवा-केंद्रित दृष्टिकोण के लिए जाना जाता है, अक्सर वैश्विक प्रतिस्पर्धियों से पीछे रह जाता है। अग्रणी सफलताएँ।
भारत जैसे विविध उपयोगकर्ता बाजारों का आकर्षण बिग टेक को शामिल करने की होड़ में स्पष्ट है
स्थानीय भाषाओं को उनके अल मॉडल में। कुछ के नाम बताएं- A14भारत और भारत विकास केंद्र (IDC) के साथ माइक्रोसॉफ्ट की जुगलबंदी परियोजना, Google की वाणी परियोजना।
बेंगलुरु स्थित एएल और रोबोटिक्स टेक्नोलॉजी पार्क (एआरटीपार्क) और भारतीय विज्ञान संस्थान (आईएससी) और हाल ही में मेटा सर्वम अल के साथ मिलकर एक जनरेटिव एएल बन गया है।
source: et
Mar 10 2024, 10:01