蘋果的人工智慧可能是市場上唯一經過合法訓練的人工智慧

由於版權問題困擾著生成式人工智慧領域,蘋果尋求透過創新的語言學習方法訓練方法來保護隱私和合法性,同時避免爭議。

近年來,與版權法相關的生成人工智慧問題仍然是一個相對重要且複雜的問題。隨著語言學習模型(LLM)和生成式人工智慧應用越來越受歡迎,版權問題不斷堆積,但沒有任何有意義的解決方案。

當公司使用受版權保護的作品來訓練其生成式人工智慧軟體時,以及當所述人工智慧軟體的輸出包含受版權保護的作品的部分時,就會出現問題。

完整複製受版權保護的作品或使用此類作品的重要部分來訓練生成人工智慧軟體均屬侵犯版權。無論訓練模型的公司怎麼說或相信什麼,人工智慧訓練都不存在「合理使用」的例外。

2023 年 12 月下旬,OpenAI 與微軟被起訴經過紐約時報對於侵犯版權。在訴訟中,據稱兩家公司使用了紐約時報

這並不是 OpenAi 第一次面臨有關模型訓練的訴訟。2023年9月,公司被還起訴了由幾位著名作家撰寫,其中包括喬治·R·R·馬丁、邁克爾·康納利和喬納森·弗蘭岑。

生成式人工智慧和版權問題的歷史可以追溯到更早的時候,截至 2023 年 7 月,超過 15,000作者簽名一封致幾家知名公司的公開信,包括 Alphabet、OpenAI、Meta、微軟等。

這封信要求對作者的工作給予適當的認可和補償,這些工作用於產生人工智慧和語言學習模型的培訓。

另一起類似的集體訴訟,指控侵害著作權已歸檔非小說作家 Nicholas Basbanes 和 Nicholas Gage 反對 OpenAI。該訴訟於 2024 年 1 月提起。

2024年4月下旬,又一起人工智慧相關訴訟已歸檔,這次是對亞馬遜。訴訟稱,一名亞馬遜員工被指示故意忽視並違反版權法,以便亞馬遜能夠更有效地與競爭對手的產品和服務競爭。

在訴訟中,一名前亞馬遜員工聲稱,一名主管就侵犯版權的人工智慧培訓告訴她,「其他人都在這樣做」——這意味著競爭對手公司的人故意參與侵犯版權的行為。

而且,很明顯它們是。

人工智慧和出版商對複製受版權保護的內容的擔憂

眾所周知,人工智慧會多次複製受版權保護的內容,問題的嚴重性促使公司分析這種情況發生的頻率。

為了更了解人工智慧聊天機器人產生受版權保護內容的速度,PatronusAI 公司決定調查此事。該公司評估生成式人工智慧模型,比較了四個主要人工智慧模型 - OpenAi 的 ChatGPT-4、Meta 的 Llama 2、Mistral 的 Mixtral 和 Anthropic 的 Claude 2.1。

Patronus AI 發現,人工智慧產生受版權保護的內容的速度最終會根據模型的不同而有所不同,但受版權保護的內容產生率很高。該公司還發布了自己的工具,稱為版權捕手,這將檢測法學碩士中潛在的版權侵犯行為。

雖然受版權保護內容的產生具有嚴重影響,但出版商也擔心在訓練語言學習模式時使用受版權保護的資料。

An Adobe Firefly-generated image of a wizard mouse.

Adobe Firefly 產生的嚮導滑鼠影像。絕對不是迪士尼「幻想曲」中的米奇

2024 年 3 月,華爾街日報 報道知名出版商正在調查其受版權保護的作品在生成人工智慧模型訓練中的使用情況。出版商希望透過人工智慧使用他們的作品獲得報酬。

考慮到與生成人工智慧和版權相關的訴訟數量以及出版商所表達的擔憂的嚴重性,像蘋果這樣的公司會盡力避免任何潛在的法律問題是有道理的。

據報道,為了避免在訓練自己的生成式人工智慧軟體時出現類似的版權問題,蘋果一直在授權主要新聞出版物的作品。

2023 年 12 月,被檢舉蘋果計劃嘗試從康泰納仕出版社(Conde Nast)獲得作品授權時尚紐約客。該公司還與 IAC 和 NBC News 進行了交談,試圖達成一項價值約 5000 萬美元的交易。

Apple 開發了其語言學習模型,內部稱為 Ajax,具有基本的設備上的功能,該公司對更高級的功能採取了不同的方法。蘋果考慮授權軟體(例如 Google Gemini)來執行需要網路連線的更複雜的任務。

透過採用這項策略,蘋果顯然是想避免版權問題。透過付費許可,Apple 不對 Google Gemini 等軟體造成或實施的版權侵權負責。

在發表於的一篇研究論文中2024年3月,蘋果公司透露,它使用精心策劃的圖像、圖像文字和基於文字的輸入的混合來培訓其內部法學碩士。蘋果使用的方法可以同時實現更好的圖像字幕、多步驟推理和保護隱私。

An example of an image from an Apple generative AI graphic tool.

來自 Apple 產生 AI 圖形工具的圖像範例。

產業消息人士告訴我們,Apple 的 Ajax LLM 保護隱私,因為它不需要網路連線即可進行基本文字分析。這意味著設備上的 LLM 無法連接到資料庫並在離線模式下識別受版權保護的內容,儘管文字生成等更高級的功能可能會具有此類檢查和連接。

除了報告和記錄項目之外,護欄和許可只有執行才同樣安全。熟悉蘋果人工智慧測試環境的消息人士表示蘋果內幕透露,似乎幾乎沒有任何限制來阻止某人在設備測試環境的輸入中使用受版權保護的材料。

我們的消息來源並不清楚蘋果內部防止侵犯版權的培訓的規定。然而,輸出可能會受到更多監管,以避免逐字複製受版權保護的資料。

蘋果應該在期間內推出其生成式人工智慧技術全球開發者大會從 6 月 10 日開始。