भाषा अनुवाद: कैसे AI डिजिटल सेवाओं को 121 भाषाओं में लाने में मदद कर रहा है

कृत्रिम बुद्धिमत्ता (एआई) तकनीक के कई उपयोग मामले हैं और उनमें से एक पहुंच प्रदान करना है डिजिटल सेवाएँ अपनी मातृभाषाओं में. भारत जैसे विशाल देश में जहां लोग 121 से अधिक भाषाएं बोलते हैं, उन्हें उनकी मातृभाषा में डिजिटल सेवाएं प्रदान करना एक कठिन काम है।
सरकार इसके माध्यम से भाषा डेटासेट बनाती है बशीनीएआई के नेतृत्व वाला भाषा का अनुवाद संगठन, जो एआई उपकरण बनाने के लिए स्थानीय भाषाओं में ओपन-सोर्स डेटासेट बनाता है, का लक्ष्य इसके बजाय डिजिटल रूप से अधिक सेवाएं प्रदान करना है।
भाषाओं को ऑनलाइन लाने में AI की भूमिका
विशेष रूप से, इन 121 भाषाओं में से केवल कुछ ही प्राकृतिक भाषा प्रसंस्करण (एनएलपी) द्वारा समर्थित हैं, जो कृत्रिम बुद्धिमत्ता की एक शाखा है जो कंप्यूटर को पाठ और बोले गए शब्दों को समझने में मदद करती है। इसका मतलब यह है कि करोड़ों भारतीय उपयोगी जानकारी से वंचित हैं।
प्रमुख शोधकर्ता कालिका पाउली ने रॉयटर्स समाचार एजेंसी के हवाले से कहा, “हर किसी के लिए काम करने के लिए एआई टूल्स को उन लोगों के लिए सुलभ होना चाहिए जो अंग्रेजी या फ्रेंच या स्पेनिश नहीं बोलते हैं।” माइक्रोसॉफ्ट रिसर्च इंडियाजैसा कि कहा जाता है।
“लेकिन अगर हम भारतीय भाषाओं पर उतना ही डेटा इकट्ठा करना चाहते हैं जितना हम जीपीटी जैसे बड़े भाषा मॉडल के लिए गए हैं, तो हमें अगले 10 साल इंतजार करना होगा। इसलिए हम जो कर सकते हैं वह है सैटजीबीटी या लामा जैसे जेनरेटिव एआई मॉडल के शीर्ष पर परतें बनाना,” पॉली ने कहा।
एआई मॉडल को कैसे प्रशिक्षित किया जाता है
एआई मॉडल को लिखित पाठ जैसे कुछ डेटासेट पर प्रशिक्षित किया जाता है। हालाँकि, कई भारतीय भाषाओं में मुख्य रूप से मौखिक परंपरा है, जिसका अर्थ है कि पाठ्य रिकॉर्ड प्रचुर मात्रा में नहीं हैं, जिससे कम आम भाषाओं के लिए डेटा संग्रह मुश्किल हो जाता है।
बाशिनी एक क्राउड-सोर्सिंग पहल के साथ आती है जो लोगों को विभिन्न भाषाओं में वाक्यों का योगदान करने, दूसरों द्वारा लिखित ऑडियो या पाठ को सत्यापित करने, ग्रंथों का अनुवाद करने और छवियों को लेबल करने की अनुमति देती है।
भारतीय भाषा प्रौद्योगिकी प्रयोगशाला के संगणना प्रमुख पुष्पक भट्टाचार्य ने कहा, “सरकार भारतीय भाषाओं में बड़े भाषा मॉडलों के प्रशिक्षण के लिए डेटासेट विकसित करने पर बहुत जोर दे रही है और इनका उपयोग पहले से ही शिक्षा, पर्यटन और अदालतों में अनुवाद उपकरणों में किया जा रहा है।” मुंबई में यह कहते हुए उद्धृत किया गया।
मेटा का निर्बाध M4D मॉडल
इस साल की शुरुआत में, मेटा के सीईओ मार्क जुकरबर्ग ने एआई-पावर्ड स्पीच ट्रांसलेशन मॉडल की घोषणा की, जो 100 भाषाओं में स्पीच का अनुवाद और ट्रांसक्राइब कर सकता है। जुकरबर्ग ने कहा कि एआई मॉडल स्पीच-टू-टेक्स्ट, टेक्स्ट-टू-स्पीच, स्पीच-टू-स्पीच, टेक्स्ट-टू-टेक्स्ट ट्रांसलेशन और स्पीच रिकग्निशन कर सकता है।
यह मॉडल लोगों के लिए अपरिचित भाषाओं में जानकारी संप्रेषित करने और समझने के लिए उपयोगी है, विशेष रूप से ऐसी भाषाएं जिनमें व्यापक रूप से उपयोग की जाने वाली लेखन प्रणाली नहीं है या एआई मॉडल को प्रशिक्षित करने के लिए कोई पाठ नहीं है।

(टैग्सटूट्रांसलेट)माइक्रोसॉफ्ट रिसर्च इंडिया(टी)भाषा अनुवाद(टी)डिजिटल सेवाएं(टी)भाषिणी(टी)एआई प्रौद्योगिकी

यह भी पढ़े:  सैमसंग: सैमसंग ने CES 2024 के लिए तीन नए ओडिसी OLED गेमिंग मॉनिटर की पुष्टि की है