Google Gemini
图片来源:Pixabay/CC0 公共领域

2023 年 12 月,谷歌宣布推出其新的大语言模型(LLM)命名为双子座。Gemini 现在为 Google 产品提供人工智能 (AI) 基础;它也是直接竞争对手OpenAI 的 GPT-4

但为什么谷歌将 Gemini 视为如此重要的里程碑,这对谷歌服务的用户意味着什么?一般来说,在当前人工智能超快发展的背景下,这意味着什么?

人工智能无处不在

谷歌押注 Gemini 将通过增强现有功能并为搜索、Gmail、YouTube 及其办公生产力套件等服务创建新功能来改造其大部分产品。这也将改善他们的在线广告业务(他们的主要收入来源)以及 Android 手机软件,并在容量有限的硬件上运行精简版的 Gemini。

对于用户来说,双子座意味着新的功能和改进的能力,这将使谷歌服务更难以回避,从而加强在搜索引擎等领域已经占据主导地位的地位。鉴于谷歌的大部分软件都是可轻松升级的云服务,因此谷歌的潜力和机会是巨大的。

但巨大的和意想不到的成功ChatGPT 的发布引起了广泛关注,增强了 OpenAI 的可信度。Gemini 将让谷歌重新成为人工智能领域的主要参与者。谷歌是人工智能领域的巨头,拥有庞大而强大的研究团队,是过去十年许多重大进步​​的起源。

公众对这些新技术进行了讨论,包括它们提供的好处以及它们在教育、设计和医疗保健等领域造成的破坏。

强化人工智能

双子座的核心依赖于变压器网络。最初由 Google 的一个研究团队设计,相同的技术也用于支持其他 LLM,例如 GPT-4。

Gemini 的一个独特之处在于它能够处理不同的数据模式:文本、音频、图像和视频。这提供了人工智能能够以多种方式执行任务,例如回答有关图像内容的问题或对播客中讨论的特定类型的内容进行关键字搜索。

来自谷歌的视频重点介绍了双子座的能力。

但更重要的是,与针对每种模态独立训练的不同模型相比,这些模型可以处理不同的模态,从而能够训练全局优越的人工智能模型。事实上,这种多模态模型被认为更强大,因为它们暴露于同一概念的不同视角。

例如,通过学习鸟类的文字描述、发声、图像和视频,可以更好地理解鸟类的概念。多模态变压器模型的这一想法已在先前的研究 在谷歌Gemini 是该方法的第一个成熟的商业实施。

这样的模型被视为朝着更强大的通用人工智能模型方向迈出的一步,也称为通用人工智能(通用人工智能)。

AGI 的风险

鉴于人工智能的发展速度,对在不久的将来设计出具有超人能力的通用人工智能的期望在研究界和更广泛的社会中引起了讨论。

一方面,一些人预计如果强大的通用人工智能落入恶意团体手中,可能会出现灾难性事件的风险,并要求事态发展将放缓

其他人则声称我们距离这种可操作的通用人工智能还很远,当前的方法允许对智能进行浅层建模,模仿他们接受训练的数据,并且缺乏实现人类水平智能所需的有效世界模型——对实际现实的详细理解。

另一方面,人们可能会认为,将对话重点放在存在风险上会分散人们对人工智能最新进展所带来的更直接影响的注意力,包括持续存在偏见,产生不正确和误导性的内容 –促使谷歌暂停其 Gemini 图像生成器,日益增加的环境影响强化大型科技公司的主导地位

遵循的路线介于所有这些考虑因素之间。我们距离可操作的通用人工智能的到来还很遥远——需要额外的突破,包括引入更强的符号建模和推理能力。

与此同时,我们不应忽视现代人工智能的重要伦理和社会影响。这些考虑因素很重要,应该由具有不同专业知识、跨越技术和社会科学背景的人来解决。

然而,尽管这不是一个短期威胁,但实现具有超人能力的人工智能却是一个令人担忧的问题。重要的是,当达到这一重要里程碑时,我们必须集体做好准备,负责任地管理通用人工智能的出现。

本文转载自对话根据知识共享许可。阅读原创文章The Conversation

引文:谷歌的 Gemini 展示了更强大的技术,但我们距离超人人工智能还很遥远(2024 年 3 月 5 日)检索日期:2024 年 3 月 5 日来自 https://techxplore.com/news/2024-03-google-gemini-showcases-powerful-technology.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。