मेटा, फेसबुक की मूल कंपनी, एक क्लास एक्शन मुकदमे में उलझी हुई है, जिसमें कॉपीराइट उल्लंघन और अनुचित प्रतिस्पर्धा के तकनीकी दिग्गजों पर आरोप लगाया गया है, जिसमें लामा सहित अपने कृत्रिम खुफिया मॉडल को प्रशिक्षित करने में पायरेटेड सामग्री के उपयोग से संबंधित है।
कोर्ट रिकॉर्ड, वीएक्स-अंडरग्राउंड द्वारा प्राप्त किया गया और एक एक्स (पूर्व में ट्विटर) पोस्ट में प्रकट हुआ, यह दर्शाता है कि मेटा ने कथित तौर पर अन्ना के आर्काइव, जेड-लाइब्रेरी और लिबगेन जैसे छाया पुस्तकालयों से 81.7TB पायरेटेड डेटा डाउनलोड किया।
फोटो: x पर @vxunderground
आंतरिक संचार से तैयार किए गए साक्ष्य, ऐसी सामग्रियों के उपयोग के बारे में मेटा के भीतर चिंताओं पर प्रकाश डालते हैं।
अक्टूबर 2022 में, एक वरिष्ठ एआई शोधकर्ता ने असुविधा व्यक्त करते हुए कहा, “मुझे नहीं लगता कि हमें पायरेटेड सामग्री का उपयोग करना चाहिए। मुझे वास्तव में यहां एक लाइन खींचने की जरूरत है।
“एक अन्य शोधकर्ता ने इसी तरह की चिंताओं को प्रतिध्वनित किया, जिसमें कहा गया है,” पायरेटेड सामग्री का उपयोग करना हमारी नैतिक सीमा से परे होना चाहिए, “और स्कीहब, रिसर्चगेट, और लिबजेन जैसे प्लेटफार्मों की तुलना पाइरेसी साइटों जैसे कि बिना अनुमति के कॉपीराइट-संरक्षित सामग्री वितरित करने के लिए।
जनवरी 2023 में, मार्क जुकरबर्ग ने कथित तौर पर एक बैठक में भाग लिया, जिसमें उन्होंने “इस सामान को आगे बढ़ाने” के लिए धक्का दिया और पायरेटेड सामग्रियों के उपयोग को अनब्लॉक करने का एक तरीका खोजा।
अप्रैल 2023 तक, एक मेटा कर्मचारी ने पाइरेट सामग्री को लोड करने के लिए कंपनी के कॉर्पोरेट आईपी पते के उपयोग पर चिंता जताई, यह देखते हुए कि “एक कॉर्पोरेट लैपटॉप से टोरेंटिंग सही नहीं लगता है,” एक हंसी इमोजी के बाद।
अदालत के दस्तावेजों से पता चलता है कि मेटा ने अपनी भागीदारी को छुपाने के लिए जानबूझकर कार्रवाई की, यह सुनिश्चित करते हुए कि इसका बुनियादी ढांचा सीधे पायरेटेड डाउनलोड या सीडिंग गतिविधि से जुड़ा नहीं था।
यह मामला एआई क्षेत्र में कानूनी लड़ाई के एक बड़े पैटर्न का हिस्सा है।
2023 में, ओपनई ने अपने भाषा मॉडल को प्रशिक्षित करने के लिए अपनी पुस्तकों का उपयोग करने के लिए उपन्यासकारों द्वारा मुकदमा दायर किया था, और न्यूयॉर्क टाइम्स ने दिसंबर में सूट का पालन किया। इसी तरह, NVIDIA ने अपने NEMO मॉडल को प्रशिक्षित करने के लिए 196,000 से अधिक पुस्तकों का उपयोग करने के बाद लेखकों से कानूनी कार्रवाई का सामना किया।
एनवीडिया के एक पूर्व कर्मचारी ने यह भी खुलासा किया कि कंपनी ने एआई प्रशिक्षण उद्देश्यों के लिए रोजाना 426,000 घंटे से अधिक का वीडियो स्क्रैप किया।
Openai यह भी आरोपों की जांच कर रहा है कि दीपसेक के पास CHATGPT से अवैध रूप से खट्टा डेटा हो सकता है।
मेटा के खिलाफ कानूनी कार्यवाही जारी है, और यह देखा जाना बाकी है कि क्या कंपनी कॉपीराइट उल्लंघन के लिए उत्तरदायी पाई जाएगी।
मेटा के वित्तीय संसाधनों को देखते हुए, यह उम्मीद की जाती है कि कंपनी किसी भी प्रतिकूल फैसले की अपील करेगी, जो वर्षों के लिए महीनों के लिए अंतिम निर्णय में देरी कर सकती है।