谷歌Gemini 2.0 :为了人工智能代理时代的新AI模型

4 个月前 语言模型 107

Google和Alphabet首席执行官Sundar Pichai 2004年12月11日表示:

信息是人类进步的核心。这就是为什么我们26多年来一直专注于组织世界信息并使其易于访问和有用的使命。这就是为什么我们继续推动人工智能的前沿,在每个输入中组织这些信息,并使其可以通过任何输出访问,以便它对您真正有用。

那是我们的愿景 我们在去年12月推出了Gemini 1.0.第一个构建为原生多模态的模型,Gemini 1.0和1.5推动了多模态和长上下文的巨大进步,以理解跨文本,视频,图像,音频和代码的信息,并处理更多信息。

现在,数百万开发人员正在使用Gemini进行开发。它帮助我们重新构想所有产品-包括拥有20亿用户的所有7款产品-并创建新产品。 NotebookLM 是一个很好的例子,说明了多模态和长上下文可以为人们带来什么,以及为什么它受到如此多的人的喜爱。

在过去的一年里,我们一直在投资开发更多的代理模型,这意味着他们可以更多地了解你周围的世界,提前考虑多个步骤,并在你的监督下代表你采取行动。

今天,我们很高兴推出为这个新的代理时代打造的下一个时代的模型:介绍我们迄今为止最强大的模型Gemini 2.0。随着多模态(如原生图像和音频输出)以及原生工具的使用,它将使我们能够构建新的AI代理,使我们更接近我们对通用助手的愿景。

今天,我们正在将2.0交到开发人员和值得信赖的测试人员手中。我们正在迅速将其融入我们的产品,以Gemini和Search为首。从今天开始,我们的Gemini 2.0 Flash实验模型将提供给所有Gemini用户。我们还推出了一项新功能,称为深度研究,它使用高级推理和长上下文功能作为研究助手,代表您探索复杂的主题并编写报告。它现在在Gemini Advanced中可用。

没有任何产品比搜索更多地受到AI的影响。我们的人工智能概述现在覆盖了10亿人,使他们能够提出全新类型的问题-很快成为我们有史以来最受欢迎的搜索功能之一。作为下一步,我们将Gemini 2.0的高级推理能力引入AI概述,以解决更复杂的主题和多步骤问题,包括高级数学公式,多模态查询和编码。我们本周开始进行有限的测试,明年初将更广泛地推广。明年,我们将继续将AI概述带给更多国家和语言。

2.0的进步是由我们在AI创新方面的差异化全栈方法长达十年的投资支撑的。它建立在定制硬件上,例如我们的第六代TPU Trillium。TPU为Gemini 2.0训练和推理提供了100%的支持。今天Trillium General Availability开放给用户,用户可以使用它。

如果说Gemini 1.0是为了组织和理解信息,那么Gemini 2.0则是为了让信息变得更有用。我迫不及待地想看看下一个时代会带来什么。

相关资讯