आर्टिफिशियल इंटेलिजेंस (AI) को लेकर सबसे बड़ा सवाल हमेशा यही रहा है कि आखिर ये मशीनें इतनी जानकारी लाती कहां से हैं। स्टेटिस्टा की हालिया रिपोर्ट ने इस रहस्य पर से पर्दा उठा दिया है। रिपोर्ट के मुताबिक, इंटरनेट ही एआई का सबसे बड़ा क्लासरूम है जहां से यह सीखता है। इस अध्ययन में करीब 5,000 रैंडम कीवर्ड्स और 1.5 लाख उद्धरणों का विश्लेषण किया गया। नतीजों ने दिखाया कि रेडिट एआई के लिए सबसे बड़ा डेटा स्रोत है, जिसकी हिस्सेदारी 40.1% है। रेडिट पर मौजूद लाखों चर्चाएं और सवाल-जवाब एआई को वास्तविक मानवीय बातचीत और अनुभव सिखाने में मदद करते हैं।

विकिपीडिया और यूट्यूब भी बने बड़े शिक्षक
रिपोर्ट में दूसरे और तीसरे नंबर पर विकिपीडिया (26.3%) और यूट्यूब (23.5%) को पाया गया। विकिपीडिया की सबसे बड़ी ताकत उसका फैक्ट-बेस्ड कंटेंट है, जहां हजारों वॉलंटियर्स लगातार जानकारी अपडेट करते हैं। वहीं, यूट्यूब पर मौजूद वीडियोस एआई को विजुअल और ऑडियो डेटा सिखाने में मदद करते हैं। यही वजह है कि आज कई एआई टूल्स वीडियो स्क्रिप्ट, कंटेंट क्रिएशन और यहां तक कि वीडियो जनरेशन में भी सक्षम हो गए हैं।
इसके अलावा, अन्य प्रमुख स्रोतों में गूगल (23.3%), येल्प (21.0%), फेसबुक (20.0%), अमेजन (18.7%), ट्रिपएडवाइजर (12.5%), मेपबॉक्स (11.3%), और ओपनस्ट्रीटमैप (11.3%) भी शामिल हैं। इन प्लेटफॉर्म्स से एआई को रिव्यूज, लोकेशन डेटा, सोशल मीडिया इंटरैक्शन और यूजर जेनरेटेड कंटेंट मिलता है।
डेटा पर बढ़ रही है बहस
हालांकि, इस पूरे मुद्दे का दूसरा पहलू भी है। इंटरनेट से लिए गए डेटा को लेकर कॉपीराइट और प्राइवेसी की बहस तेज हो रही है। कई कंटेंट क्रिएटर्स और कंपनियां सवाल उठा रही हैं कि उनकी मेहनत से बनाया गया कंटेंट एआई कंपनियां बिना अनुमति इस्तेमाल कर रही हैं। यही वजह है कि अब कई देशों की सरकारें एआई ट्रेनिंग के लिए नियम-कानून बनाने पर जोर दे रही हैं।
फिर भी, यह साफ हो गया है कि एआई का दिमाग इंटरनेट से ही पोषित होता है। हर पोस्ट, हर आर्टिकल, हर वीडियो और हर रिव्यू एआई को और ज्यादा स्मार्ट बनाता है। यानी जितना इंटरनेट पर डेटा बढ़ेगा, उतना ही एआई और ताकतवर होता जाएगा।