अब अंग्रेजी नहीं जानने वालों काे चुकाना पड़ रहा ‘लैंग्वेज टैक्स’
नई दिल्ली। आर्टिफिशियल इंटेलिजेंस टूल्स का उपयोग करते हैं और अंग्रेजी नहीं जानते तो आप ‘लैंग्वेज टैक्स’ दे रहे हैं। एक रिसर्च में पता चला है कि एआई टूल्स को अंग्रेजी से ज्यादा अन्य भाषाओं को समझने में मेहनत लगती है। तकनीकी रूप से इसे टोकन्स (Tokens) का खर्च होना कहते हैं। टोकन्स वो छोटी इकाइयां होती हैं जिनका उपयोग कोई भी एआई टूल किसी टेक्स्ट को पढ़ने और समझने में करता है। अंग्रेजी के मुकाबले अन्य भाषा को समझने में एआई टूल्स को ज्यादा टोकन्स खर्च करने पड़ते हैं। फिर चाहे वह हिंदी हो, चीनी या अरबी भाषा। रिसर्चर्स इस समस्या को लैंग्वेज टैक्स (Linguistic Tax) कह रहे हैं।
कैसे सामने आई Ai की यह समस्या
रिपोर्ट के अनुसार, हाल ही में OpenAi के एक रिसर्चर अरन कोमात्सुजाकी ने एक्सपेरिमेंट किया। उन्होंने पता लगाया कि OpenAi और एंथ्रोपिक के सिस्टम कैसे अलग-अलग भाषाओं को प्रोसेस करते हैं। अरन ने एक आर्टिकल को कई भाषाओं में Ai से ट्रांसलेट करवाया।
अनुवाद के बाद रिसर्चर ने पता लगाया कि एआई ने काम में कितने टोकन्स खर्च किए।
अंग्रेजी और अन्य भाषाओं में खर्च किए टोकन्स के बीच एक बड़ा अंतर पाया गया।
OpenAi के एआई मॉडल को हिंदी टेक्स्ट समझने के लिए अंग्रेजी के मुकाबले 1.37 गुना अधिक टोकन की जरूरत हुई।
क्लॉड एआई को हिंदी समझने में और मेहनत लगी। यह अंतर 3.24 गुना तक बढ़ गया।
इसी तरह अरबी भाषा के लिए 2.86 गुना और चीनी भाषा के लिए 1.71 गुना ज़्यादा टोकन खर्च हुए।
रिपोर्ट के अनुसार, अगर कोई अंग्रेजी बोलने वाला यूजर अपनी बात कहने के लिए 100 टोकन खर्च करता है, तो एक हिंदी यूजर को क्लॉड Ai पर उसी बात को समझाने के लिए 300 से भी अधिक टोकन खर्च करने होंगे। (REF. )
ये खबर भी पढ़े : व्हाट्सऐप की कमान अब भारतीय उद्यमी कुनाल शाह के हाथों में, विल कैथकार्ट ने छोड़ा पदAi क्यों करता है अधिक टोकन्स खर्च?
रिपोर्ट के अनुसार, इसकी वजह एआई मॉडल का किसी भी टेक्स्ट को छोटे टुकड़ों में तोड़ना है।
कोई भी मॉडल अपने यूजर की बात को समझने के लिए लिखे गए वाक्यों को छोटे हिस्सों में तोड़ता है, जिसे टोकनाइजर कहते हैं।
सभी Ai टूल्स को अंग्रेजी में ट्रेनिंग दी गई है। एआई सिस्टम अंग्रेजी को आसानी से प्रोसेस कर लेते हैं।
हिंदी और अन्य भाषाओं को तोड़ने में उन्हें अधिक टोकन खर्च करने होते हैं, क्योंकि इन भाषाओं की लिखावट अलग है।
हालांकि इसका यह मतलब बिलकुल नहीं है कि एआई को हिंदी समझने में कोई परेशानी होती है।
Ai कब सुलझा पाएगा यह समस्या?
रिपोर्टों के अनुसार, यह समस्या कब तक सुलझ पाएगी, इसकी कोई ना तो टाइमलाइन है। ना ही इसका कोई उपाय तलाशा गया है।
रिसर्चर्स का कहना है कि एआई कंपनियों को अपने एआई मॉडल्स की ट्रेनिंग पर ध्यान देना होगा। ऐसे सिस्टम तैयार करने होंगे जो अन्य भाषाओं को हैंडल कर पाएं।
संबंधित खबरें
लेखक के बारे में
‘तरुणमित्र’ श्रम ही आधार, सिर्फ खबरों से सरोकार। के तर्ज पर प्रकाशित होने वाला ऐसा समचाार पत्र है जो वर्ष 1978 में पूर्वी उत्तर प्रदेश के जौनपुर जैसे सुविधाविहीन शहर से स्व0 समूह सम्पादक कैलाशनाथ के श्रम के बदौलत प्रकाशित होकर आज पांच प्रदेश (उत्तर प्रदेश, बिहार, महाराष्ट्र, मध्य प्रदेश और उत्तराखण्ड) तक अपनी पहुंच बना चुका है।
