新穎的人工智慧框架從無到有生成圖像

2024-01-11 18:38:28

一種名為「Blackout Diffusion」的新型潛在革命性人工智慧框架從完全空的圖片中產生影像，這意味著與其他生成擴散模型不同，機器學習演算法不需要啟動「隨機種子」即可開始。

Blackout Diffusion 在最近的國際機器學習會議上提出，它產生的樣本與目前的擴散模型（例如 DALL-E 或 Midjourney）相當，但所需的運算資源比這些模型更少。

「生成建模正在帶來下一次工業革命，它能夠協助許多任務，例如產生軟體程式碼、法律文件，甚至藝術，」洛斯阿拉莫斯國家實驗室的人工智慧研究員、《Blackout Diffusion》的合著者哈維爾·桑托斯 (Javier Santos) 說道。

「可以利用生成模型來製作科學發現，我們團隊的工作為將生成擴散模型應用於本質上不連續的科學問題奠定了基礎和實用演算法。

擴散模型創建與其訓練資料相似的樣本。他們的工作原理是拍攝圖像並反覆添加噪聲，直到圖像無法識別。在整個過程中，模型嘗試學習如何將其恢復到原始狀態。

目前的模型需要輸入噪聲，這意味著它們需要某種形式的資料才能開始生成影像。

「我們證明 Blackout Diffusion 產生的樣本品質與目前型號使用更小的運算空間，」負責 Blackout Diffusion 合作的洛斯阿拉莫斯物理學家 Yen-Ting Lin 說。

Blackout Diffusion 的另一個獨特之處是它工作的空間。然而，在連續空間中工作限制了它們的科學應用潛力。

「為了運行現有的生成擴散模型，從數學上講，擴散必須存在於連續域中；它不能是離散的，」林說。

另一方面，該團隊的理論框架適用於離散空間（意味著空間中的每個點都與其他點隔離一定距離），這為各種應用（例如文本和科學應用）提供了機會。

該團隊在許多標準化資料集上測試了 Blackout Diffusion，其中包括修改後的國家標準與技術研究所資料庫；CIFAR-10 資料集，包含 10 個不同類別的物件影像；CelebFaces 屬性資料集，包含超過 200,000 張人臉影像。

此外，該團隊還利用 Blackout Diffusion 的離散性質來澄清關於內部擴散模型的幾個廣泛存在的誤解，從而提供對生成擴散模型的批判性理解。

他們還提供設計原則以供未來的科學應用。林說：“這展示了關於離散狀態擴散模型的第一個基礎研究，並為未來離散數據的科學應用指明了道路。”

團隊解釋說，生成擴散建模可以大大加快在超級電腦上運行許多科學模擬的時間，這不僅可以支持科學進步，還可以減少計算科學的碳足跡。他們提到的一些不同的例子包括地下儲層動力學、化學模型藥物發現，以及單分子和單細胞基因表達，以了解活生物體的生化機制。

該研究是發表於arXiv預印本伺服器。

更多資訊：Javier E Santos 等人，Blackout Diffusion：離散狀態空間中的生成擴散模型，arXiv（2023）。DOI：10.48550/arxiv.2305.11089

期刊資訊： arXiv

引文:新穎的人工智慧框架從無到有生成影像（2024 年，1 月 11 日）檢索日期：2024 年 1 月 11 日取自 https://techxplore.com/news/2024-01-ai-framework-generates-images.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外，不得未經書面許可，不得複製部分內容。所提供的內容僅供參考。