जेनेरिक एआई के प्रति एप्पल का दृष्टिकोण कॉपीराइट मुद्दों से बचना चाहता है

2024-04-26 14:31:10

चूंकि कॉपीराइट संबंधी चिंताएं जेनरेटिव एआई के क्षेत्र को परेशान कर रही हैं, इसलिए ऐप्पल विवाद से बचते हुए, भाषा सीखने के तरीकों के लिए नवीन प्रशिक्षण विधियों के माध्यम से गोपनीयता और वैधता को संरक्षित करना चाहता है।

Apple का AI बाज़ार में एकमात्र कानूनी रूप से प्रशिक्षित हो सकता है

हाल के वर्षों में, कॉपीराइट कानून के संबंध में जेनरेटिव एआई का प्रश्न अपेक्षाकृत महत्वपूर्ण और जटिल मुद्दा बना हुआ है।जैसे-जैसे भाषा सीखने के मॉडल (एलएलएम) और जेनेरिक एआई ऐप्स की लोकप्रियता बढ़ रही है, कॉपीराइट मुद्दे बिना किसी सार्थक समाधान के बढ़ते जा रहे हैं।

समस्याएँ तब उत्पन्न होती हैं जब कंपनियाँ अपने जेनेरिक एआई सॉफ़्टवेयर के प्रशिक्षण में कॉपीराइट किए गए कार्यों का उपयोग करती हैं, और जब उक्त एआई सॉफ़्टवेयर के आउटपुट में कॉपीराइट सुरक्षा के तहत कार्यों के अनुभाग शामिल होते हैं।

कॉपीराइट किए गए कार्यों को उनकी संपूर्णता में कॉपी करना या जेनेरिक एआई सॉफ़्टवेयर के प्रशिक्षण के लिए ऐसे कार्यों के महत्वपूर्ण खंडों का उपयोग करना कॉपीराइट का उल्लंघन है।मॉडलों को प्रशिक्षित करने वाली कंपनियां क्या कहती हैं या विश्वास करती हैं, इसके बावजूद एआई प्रशिक्षण के लिए कोई "उचित उपयोग" नहीं है।

जेनरेटिव एआई और कॉपीराइट उल्लंघन के मुकदमे

दिसंबर 2023 के अंत में, OpenAI और Microsoftमुकदमा किया गयाद्वारादी न्यू यौर्क टाइम्सकॉपीराइट उल्लंघन के लिए.मुकदमे में यह दावा किया गया कि दोनों कंपनियों ने प्रकाशित लाखों लेखों का उपयोग करके अपने जेनरेटिव एआई सॉफ्टवेयर को प्रशिक्षित कियादी न्यू यौर्क टाइम्स.

यह पहली बार नहीं था जब OpenAi को मॉडल प्रशिक्षण के बारे में मुकदमे का सामना करना पड़ा।सितंबर 2023 में कंपनी थीमुकदमा भी कियाकई प्रमुख लेखकों द्वारा, जिनमें जॉर्ज आर.आर. मार्टिन, माइकल कोनेली और जोनाथन फ्रेंज़ेन शामिल हैं।

जेनेरिक एआई और कॉपीराइट मुद्दों का इतिहास और भी पुराना है, जुलाई 2023 में 15000 से अधिकलेखकों ने हस्ताक्षर कियेअल्फाबेट, ओपनएआई, मेटा, माइक्रोसॉफ्ट और अन्य सहित कई प्रमुख कंपनियों को संबोधित एक खुला पत्र।

पत्र में अनुरोध किया गया कि लेखकों को उनके काम के लिए उचित श्रेय दिया जाए और मुआवजा दिया जाए, जिसका उपयोग जेनेरिक एआई और भाषा सीखने के मॉडल के प्रशिक्षण में किया गया था।

कॉपीराइट उल्लंघन का आरोप लगाने वाला एक और समान वर्ग-कार्रवाई मुकदमादायर किया गया थानॉन-फिक्शन लेखकों निकोलस बासबेन्स और निकोलस गेज द्वारा ओपनएआई के खिलाफ।मुकदमा जनवरी 2024 में दायर किया गया था।

अप्रैल 2024 के अंत में, AI से संबंधित एक और मुकदमादायर किया गया था, इस बार अमेज़न के खिलाफ।मुकदमे में आरोप लगाया गया है कि अमेज़ॅन के एक कर्मचारी को जानबूझकर कॉपीराइट कानून की अनदेखी और उल्लंघन करने का निर्देश दिया गया था ताकि अमेज़ॅन प्रतिद्वंद्वी उत्पादों और सेवाओं के खिलाफ अधिक प्रभावी ढंग से प्रतिस्पर्धा कर सके।

मुकदमे में, अमेज़ॅन की एक पूर्व कर्मचारी का दावा है कि कॉपीराइट का उल्लंघन करने वाले एआई प्रशिक्षण के बारे में एक पर्यवेक्षक ने उसे बताया था कि "बाकी सभी लोग ऐसा कर रहे हैं" - जिसका अर्थ है कि प्रतिद्वंद्वी कंपनियों के लोग जानबूझकर कॉपीराइट उल्लंघन में शामिल थे।

और, यह बिल्कुल स्पष्ट है कि वे हैं।

कॉपीराइट सामग्री के पुनरुत्पादन के बारे में एआई और प्रकाशकों की चिंताएँ

एआई को कई मौकों पर कॉपीराइट सामग्री को पुन: पेश करने के लिए जाना जाता है, और समस्या की गंभीरता ने कंपनियों को ऐसा होने की आवृत्ति का विश्लेषण करने के लिए प्रेरित किया है।

एआई चैटबॉट किस दर से कॉपीराइट-संरक्षित सामग्री उत्पन्न करते हैं, इसकी बेहतर समझ हासिल करने के लिए, कंपनी पेट्रोनसएआई ने इस मामले पर गौर करने का फैसला किया।कंपनी, जो जेनरेटिव एआई मॉडल का मूल्यांकन करती है,चार की तुलना कीप्रमुख एआई मॉडल - ओपनएआई का चैटजीपीटी-4, मेटा का लामा 2, मिस्ट्रल का मिक्सट्रल और एंथ्रोपिक का क्लाउड 2.1।

पैट्रोनस एआई ने पाया कि एआई द्वारा कॉपीराइट सामग्री तैयार करने की दर अंततः मॉडल के आधार पर भिन्न थी, लेकिन कॉपीराइट सामग्री निर्माण की दर अधिक थी।कंपनी ने अपना स्वयं का टूल भी जारी किया, जिसे के नाम से जाना जाता हैकॉपीराइटकैचर, जो एलएलएम में संभावित कॉपीराइट उल्लंघनों का पता लगाएगा।

जबकि कॉपीराइट सामग्री के निर्माण के गंभीर निहितार्थ हैं, प्रकाशक भाषा सीखने के मॉडल के प्रशिक्षण में कॉपीराइट सामग्री के उपयोग को लेकर भी चिंतित हैं।

विज़ार्ड माउस की Adobe Firefly-जनित छवि।निश्चित रूप से डिज़्नी के 'फैंटासिया' का मिकी नहीं

मार्च 2024 में,वॉल स्ट्रीट जर्नल सूचना दीप्रमुख प्रकाशक जेनेरिक एआई मॉडल के प्रशिक्षण में अपने कॉपीराइट कार्यों के उपयोग की जांच कर रहे थे।प्रकाशक चाहते थे कि उनके काम के उपयोग के लिए एआई द्वारा भुगतान किया जाए।

जेनेरेटिव एआई और कॉपीराइट से संबंधित मुकदमों की संख्या और प्रकाशकों द्वारा व्यक्त की गई चिंताओं की गंभीरता को देखते हुए, यह समझ में आता है कि ऐप्पल जैसी कंपनी किसी भी संभावित कानूनी मुद्दे से बचने की पूरी कोशिश करेगी।

जेनेरिक एआई, भाषा सीखने के मॉडल और कॉपीराइट मुद्दों के लिए एप्पल का अनूठा दृष्टिकोण

अपने स्वयं के जेनरेटिव एआई सॉफ़्टवेयर के प्रशिक्षण के दौरान समान कॉपीराइट मुद्दों से बचने के एक तरीके के रूप में, ऐप्पल कथित तौर पर प्रमुख समाचार प्रकाशनों के कार्यों को लाइसेंस दे रहा है।

दिसंबर 2023 में, यहरिपोर्ट किया गया थाApple ने इसके प्रकाशक कोंडे नास्ट से कार्यों को आज़माने और लाइसेंस देने की योजना बनाई हैप्रचलनऔरन्यू यॉर्क वाला.कंपनी ने लगभग 50 मिलियन डॉलर का सौदा करने के प्रयास में IAC और NBC न्यूज़ से भी बात की थी।

जबकि Apple ने बेसिक के साथ अपना भाषा सीखने का मॉडल विकसित किया, जिसे आंतरिक रूप से Ajax के नाम से जाना जाता हैऑन-डिवाइस कार्यक्षमता, कंपनी ने अधिक उन्नत सुविधाओं के लिए एक अलग दृष्टिकोण अपनाया।Apple ने इंटरनेट कनेक्शन की आवश्यकता वाले अधिक जटिल कार्यों के लिए Google जेमिनी जैसे सॉफ़्टवेयर को लाइसेंस देने पर विचार किया।

इस रणनीति को अपनाकर, Apple का स्पष्ट रूप से कॉपीराइट मुद्दों से बचने का इरादा था।सशुल्क लाइसेंसिंग के साथ, ऐप्पल Google जेमिनी जैसे सॉफ़्टवेयर के कारण होने वाले या किए गए कॉपीराइट उल्लंघन के लिए ज़िम्मेदार नहीं होगा।

में प्रकाशित एक शोध पत्र मेंमार्च 2024, Apple ने खुलासा किया कि उसने अपने इन-हाउस LLM को प्रशिक्षित करने के लिए छवियों, छवि-पाठ और पाठ-आधारित इनपुट के सावधानीपूर्वक तैयार किए गए मिश्रण का उपयोग किया।Apple द्वारा उपयोग की जाने वाली विधि एक ही समय में बेहतर छवि कैप्शनिंग, बहु-चरणीय तर्क और गोपनीयता को संरक्षित करने की अनुमति देती है।

Apple जेनरेटिव AI ग्राफ़िक टूल से एक छवि का एक उदाहरण।

उद्योग सूत्रों ने हमें बताया कि एप्पल का अजाक्स एलएलएम गोपनीयता बरकरार रखता है क्योंकि इसमें बुनियादी पाठ विश्लेषण के लिए इंटरनेट कनेक्शन की आवश्यकता नहीं होती है।इसका मतलब यह है कि ऑन-डिवाइस एलएलएम डेटाबेस से कनेक्ट नहीं हो सकता है और ऑफ़लाइन मोड में कॉपीराइट की गई सामग्री की पहचान नहीं कर सकता है, हालांकि टेक्स्ट-जनरेशन जैसी अधिक उन्नत सुविधाओं में ऐसे चेक और कनेक्शन की सुविधा होगी।

रिपोर्टिंग और दस्तावेज़ीकृत परियोजनाओं के अलावा, गार्ड रेल और लाइसेंसिंग तभी सुरक्षित हैं जब उन्हें लागू किया जाए।Apple के AI परीक्षण वातावरण से परिचित सूत्र बोल रहे हैंAppleInsiderपता चला है कि ऑन-डिवाइस परीक्षण वातावरण के लिए इनपुट में किसी को कॉपीराइट सामग्री का उपयोग करने से रोकने के लिए बहुत कम या कोई प्रतिबंध नहीं था।

कॉपीराइट-उल्लंघन प्रशिक्षण को रोकने के लिए Apple के अंदर के नियमों के बारे में हमारा स्रोत स्पष्ट नहीं था।हालाँकि, कॉपीराइट सामग्री के शब्द-दर-शब्द पुनरुत्पादन से बचने के लिए आउटपुट को अधिक विनियमित होने की संभावना है।

Apple को अपनी जनरेटिव AI तकनीक को इस दौरान लॉन्च करना चाहिएडब्ल्यूडब्ल्यूडीसीजो 10 जून से शुरू हो रहा है.