谷歌Gemini 2.0 ：为了人工智能代理时代的新AI模型

5 个月前语言模型 123

Google和Alphabet首席执行官Sundar Pichai 2004年12月11日表示：

信息是人类进步的核心。这就是为什么我们26多年来一直专注于组织世界信息并使其易于访问和有用的使命。这就是为什么我们继续推动人工智能的前沿，在每个输入中组织这些信息，并使其可以通过任何输出访问，以便它对您真正有用。

那是我们的愿景我们在去年12月推出了Gemini 1.0.第一个构建为原生多模态的模型，Gemini 1.0和1.5推动了多模态和长上下文的巨大进步，以理解跨文本，视频，图像，音频和代码的信息，并处理更多信息。

现在，数百万开发人员正在使用Gemini进行开发。它帮助我们重新构想所有产品-包括拥有20亿用户的所有7款产品-并创建新产品。 NotebookLM 是一个很好的例子，说明了多模态和长上下文可以为人们带来什么，以及为什么它受到如此多的人的喜爱。

在过去的一年里，我们一直在投资开发更多的代理模型，这意味着他们可以更多地了解你周围的世界，提前考虑多个步骤，并在你的监督下代表你采取行动。

今天，我们很高兴推出为这个新的代理时代打造的下一个时代的模型：介绍我们迄今为止最强大的模型Gemini 2.0。随着多模态（如原生图像和音频输出）以及原生工具的使用，它将使我们能够构建新的AI代理，使我们更接近我们对通用助手的愿景。

今天，我们正在将2.0交到开发人员和值得信赖的测试人员手中。我们正在迅速将其融入我们的产品，以Gemini和Search为首。从今天开始，我们的Gemini 2.0 Flash实验模型将提供给所有Gemini用户。我们还推出了一项新功能，称为深度研究，它使用高级推理和长上下文功能作为研究助手，代表您探索复杂的主题并编写报告。它现在在Gemini Advanced中可用。

没有任何产品比搜索更多地受到AI的影响。我们的人工智能概述现在覆盖了10亿人，使他们能够提出全新类型的问题-很快成为我们有史以来最受欢迎的搜索功能之一。作为下一步，我们将Gemini 2.0的高级推理能力引入AI概述，以解决更复杂的主题和多步骤问题，包括高级数学公式，多模态查询和编码。我们本周开始进行有限的测试，明年初将更广泛地推广。明年，我们将继续将AI概述带给更多国家和语言。

2.0的进步是由我们在AI创新方面的差异化全栈方法长达十年的投资支撑的。它建立在定制硬件上，例如我们的第六代TPU Trillium。TPU为Gemini 2.0训练和推理提供了100%的支持。今天Trillium General Availability开放给用户，用户可以使用它。

如果说Gemini 1.0是为了组织和理解信息，那么Gemini 2.0则是为了让信息变得更有用。我迫不及待地想看看下一个时代会带来什么。