Apple का AI बाज़ार में एकमात्र कानूनी रूप से प्रशिक्षित हो सकता है

चूंकि कॉपीराइट संबंधी चिंताएं जेनरेटिव एआई के क्षेत्र को परेशान कर रही हैं, इसलिए ऐप्पल विवाद से बचते हुए, भाषा सीखने के तरीकों के लिए नवीन प्रशिक्षण विधियों के माध्यम से गोपनीयता और वैधता को संरक्षित करना चाहता है।

हाल के वर्षों में, कॉपीराइट कानून के संबंध में जेनरेटिव एआई का प्रश्न अपेक्षाकृत महत्वपूर्ण और जटिल मुद्दा बना हुआ है।जैसे-जैसे भाषा सीखने के मॉडल (एलएलएम) और जेनेरिक एआई ऐप्स की लोकप्रियता बढ़ रही है, कॉपीराइट मुद्दे बिना किसी सार्थक समाधान के बढ़ते जा रहे हैं।

समस्याएँ तब उत्पन्न होती हैं जब कंपनियाँ अपने जेनेरिक एआई सॉफ़्टवेयर के प्रशिक्षण में कॉपीराइट किए गए कार्यों का उपयोग करती हैं, और जब उक्त एआई सॉफ़्टवेयर के आउटपुट में कॉपीराइट सुरक्षा के तहत कार्यों के अनुभाग शामिल होते हैं।

कॉपीराइट किए गए कार्यों को उनकी संपूर्णता में कॉपी करना या जेनेरिक एआई सॉफ़्टवेयर के प्रशिक्षण के लिए ऐसे कार्यों के महत्वपूर्ण खंडों का उपयोग करना कॉपीराइट का उल्लंघन है।मॉडलों को प्रशिक्षित करने वाली कंपनियां क्या कहती हैं या विश्वास करती हैं, इसके बावजूद एआई प्रशिक्षण के लिए कोई "उचित उपयोग" नहीं है।

दिसंबर 2023 के अंत में, OpenAI और Microsoftमुकदमा किया गयाद्वारादी न्यू यौर्क टाइम्सकॉपीराइट उल्लंघन के लिए.मुकदमे में यह दावा किया गया कि दोनों कंपनियों ने प्रकाशित लाखों लेखों का उपयोग करके अपने जेनरेटिव एआई सॉफ्टवेयर को प्रशिक्षित कियादी न्यू यौर्क टाइम्स.

यह पहली बार नहीं था जब OpenAi को मॉडल प्रशिक्षण के बारे में मुकदमे का सामना करना पड़ा।सितंबर 2023 में कंपनी थीमुकदमा भी कियाकई प्रमुख लेखकों द्वारा, जिनमें जॉर्ज आर.आर. मार्टिन, माइकल कोनेली और जोनाथन फ्रेंज़ेन शामिल हैं।

जेनेरिक एआई और कॉपीराइट मुद्दों का इतिहास और भी पुराना है, जुलाई 2023 में 15000 से अधिकलेखकों ने हस्ताक्षर कियेअल्फाबेट, ओपनएआई, मेटा, माइक्रोसॉफ्ट और अन्य सहित कई प्रमुख कंपनियों को संबोधित एक खुला पत्र।

पत्र में अनुरोध किया गया कि लेखकों को उनके काम के लिए उचित श्रेय दिया जाए और मुआवजा दिया जाए, जिसका उपयोग जेनेरिक एआई और भाषा सीखने के मॉडल के प्रशिक्षण में किया गया था।

कॉपीराइट उल्लंघन का आरोप लगाने वाला एक और समान वर्ग-कार्रवाई मुकदमादायर किया गया थानॉन-फिक्शन लेखकों निकोलस बासबेन्स और निकोलस गेज द्वारा ओपनएआई के खिलाफ।मुकदमा जनवरी 2024 में दायर किया गया था।

अप्रैल 2024 के अंत में, AI से संबंधित एक और मुकदमादायर किया गया था, इस बार अमेज़न के खिलाफ।मुकदमे में आरोप लगाया गया है कि अमेज़ॅन के एक कर्मचारी को जानबूझकर कॉपीराइट कानून की अनदेखी और उल्लंघन करने का निर्देश दिया गया था ताकि अमेज़ॅन प्रतिद्वंद्वी उत्पादों और सेवाओं के खिलाफ अधिक प्रभावी ढंग से प्रतिस्पर्धा कर सके।

मुकदमे में, अमेज़ॅन की एक पूर्व कर्मचारी का दावा है कि कॉपीराइट का उल्लंघन करने वाले एआई प्रशिक्षण के बारे में एक पर्यवेक्षक ने उसे बताया था कि "बाकी सभी लोग ऐसा कर रहे हैं" - जिसका अर्थ है कि प्रतिद्वंद्वी कंपनियों के लोग जानबूझकर कॉपीराइट उल्लंघन में शामिल थे।

और, यह बिल्कुल स्पष्ट है कि वे हैं।

कॉपीराइट सामग्री के पुनरुत्पादन के बारे में एआई और प्रकाशकों की चिंताएँ

एआई को कई मौकों पर कॉपीराइट सामग्री को पुन: पेश करने के लिए जाना जाता है, और समस्या की गंभीरता ने कंपनियों को ऐसा होने की आवृत्ति का विश्लेषण करने के लिए प्रेरित किया है।

एआई चैटबॉट किस दर से कॉपीराइट-संरक्षित सामग्री उत्पन्न करते हैं, इसकी बेहतर समझ हासिल करने के लिए, कंपनी पेट्रोनसएआई ने इस मामले पर गौर करने का फैसला किया।कंपनी, जो जेनरेटिव एआई मॉडल का मूल्यांकन करती है,चार की तुलना कीप्रमुख एआई मॉडल - ओपनएआई का चैटजीपीटी-4, मेटा का लामा 2, मिस्ट्रल का मिक्सट्रल और एंथ्रोपिक का क्लाउड 2.1।

पैट्रोनस एआई ने पाया कि एआई द्वारा कॉपीराइट सामग्री तैयार करने की दर अंततः मॉडल के आधार पर भिन्न थी, लेकिन कॉपीराइट सामग्री निर्माण की दर अधिक थी।कंपनी ने अपना स्वयं का टूल भी जारी किया, जिसे के नाम से जाना जाता हैकॉपीराइटकैचर, जो एलएलएम में संभावित कॉपीराइट उल्लंघनों का पता लगाएगा।

जबकि कॉपीराइट सामग्री के निर्माण के गंभीर निहितार्थ हैं, प्रकाशक भाषा सीखने के मॉडल के प्रशिक्षण में कॉपीराइट सामग्री के उपयोग को लेकर भी चिंतित हैं।

An Adobe Firefly-generated image of a wizard mouse.

विज़ार्ड माउस की Adobe Firefly-जनित छवि।निश्चित रूप से डिज़्नी के 'फैंटासिया' का मिकी नहीं

मार्च 2024 में,वॉल स्ट्रीट जर्नल सूचना दीप्रमुख प्रकाशक जेनेरिक एआई मॉडल के प्रशिक्षण में अपने कॉपीराइट कार्यों के उपयोग की जांच कर रहे थे।प्रकाशक चाहते थे कि उनके काम के उपयोग के लिए एआई द्वारा भुगतान किया जाए।

जेनेरेटिव एआई और कॉपीराइट से संबंधित मुकदमों की संख्या और प्रकाशकों द्वारा व्यक्त की गई चिंताओं की गंभीरता को देखते हुए, यह समझ में आता है कि ऐप्पल जैसी कंपनी किसी भी संभावित कानूनी मुद्दे से बचने की पूरी कोशिश करेगी।

अपने स्वयं के जेनरेटिव एआई सॉफ़्टवेयर के प्रशिक्षण के दौरान समान कॉपीराइट मुद्दों से बचने के एक तरीके के रूप में, ऐप्पल कथित तौर पर प्रमुख समाचार प्रकाशनों के कार्यों को लाइसेंस दे रहा है।

दिसंबर 2023 में, यहरिपोर्ट किया गया थाApple ने इसके प्रकाशक कोंडे नास्ट से कार्यों को आज़माने और लाइसेंस देने की योजना बनाई हैप्रचलनऔरन्यू यॉर्क वाला.कंपनी ने लगभग 50 मिलियन डॉलर का सौदा करने के प्रयास में IAC और NBC न्यूज़ से भी बात की थी।

जबकि Apple ने बेसिक के साथ अपना भाषा सीखने का मॉडल विकसित किया, जिसे आंतरिक रूप से Ajax के नाम से जाना जाता हैऑन-डिवाइस कार्यक्षमता, कंपनी ने अधिक उन्नत सुविधाओं के लिए एक अलग दृष्टिकोण अपनाया।Apple ने इंटरनेट कनेक्शन की आवश्यकता वाले अधिक जटिल कार्यों के लिए Google जेमिनी जैसे सॉफ़्टवेयर को लाइसेंस देने पर विचार किया।

इस रणनीति को अपनाकर, Apple का स्पष्ट रूप से कॉपीराइट मुद्दों से बचने का इरादा था।सशुल्क लाइसेंसिंग के साथ, ऐप्पल Google जेमिनी जैसे सॉफ़्टवेयर के कारण होने वाले या किए गए कॉपीराइट उल्लंघन के लिए ज़िम्मेदार नहीं होगा।

में प्रकाशित एक शोध पत्र मेंमार्च 2024, Apple ने खुलासा किया कि उसने अपने इन-हाउस LLM को प्रशिक्षित करने के लिए छवियों, छवि-पाठ और पाठ-आधारित इनपुट के सावधानीपूर्वक तैयार किए गए मिश्रण का उपयोग किया।Apple द्वारा उपयोग की जाने वाली विधि एक ही समय में बेहतर छवि कैप्शनिंग, बहु-चरणीय तर्क और गोपनीयता को संरक्षित करने की अनुमति देती है।

An example of an image from an Apple generative AI graphic tool.

Apple जेनरेटिव AI ग्राफ़िक टूल से एक छवि का एक उदाहरण।

उद्योग सूत्रों ने हमें बताया कि एप्पल का अजाक्स एलएलएम गोपनीयता बरकरार रखता है क्योंकि इसमें बुनियादी पाठ विश्लेषण के लिए इंटरनेट कनेक्शन की आवश्यकता नहीं होती है।इसका मतलब यह है कि ऑन-डिवाइस एलएलएम डेटाबेस से कनेक्ट नहीं हो सकता है और ऑफ़लाइन मोड में कॉपीराइट की गई सामग्री की पहचान नहीं कर सकता है, हालांकि टेक्स्ट-जनरेशन जैसी अधिक उन्नत सुविधाओं में ऐसे चेक और कनेक्शन की सुविधा होगी।

रिपोर्टिंग और दस्तावेज़ीकृत परियोजनाओं के अलावा, गार्ड रेल और लाइसेंसिंग तभी सुरक्षित हैं जब उन्हें लागू किया जाए।Apple के AI परीक्षण वातावरण से परिचित सूत्र बोल रहे हैंAppleInsiderपता चला है कि ऑन-डिवाइस परीक्षण वातावरण के लिए इनपुट में किसी को कॉपीराइट सामग्री का उपयोग करने से रोकने के लिए बहुत कम या कोई प्रतिबंध नहीं था।

कॉपीराइट-उल्लंघन प्रशिक्षण को रोकने के लिए Apple के अंदर के नियमों के बारे में हमारा स्रोत स्पष्ट नहीं था।हालाँकि, कॉपीराइट सामग्री के शब्द-दर-शब्द पुनरुत्पादन से बचने के लिए आउटपुट को अधिक विनियमित होने की संभावना है।

Apple को अपनी जनरेटिव AI तकनीक को इस दौरान लॉन्च करना चाहिएडब्ल्यूडब्ल्यूडीसीजो 10 जून से शुरू हो रहा है.