Gemini-谷歌发布的多模态AI大模型

AI模型
24年9月29日
编辑

admin

Google Gemini是什么？

AIHub 12 月 6 日消息，谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态大模型Gemini。意味着它可以理解、操作和结合不同类型的信息，包括文本、代码、音频、图像和视频。

根据谷歌给出的基准测试结果，Gemini 在许多测试中都表现出了「最先进的性能」，甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

Google官方介绍视频

Google Gemini有什么？

谷歌针对不同场景发布了三种不同版本：Gemini Ultra、Gemini Pro 和 Gemini Nano。这些不同的版本也将适用于不同的场景和案例：

Gemini Ultra – 用于处理高度复杂任务的最强、最大的模型。
Gemini Pro – 用于扩展各种任务的最佳模型。
Gemini Nano – 用于手机等设备的最高效模型。

1、Gemini Nano 的更轻版本，旨在在 Android 设备上本地离线运行。

Gemini Nano 对于设备上的任务非常高效。 Android 开发者可以通过 Android AICore 注册 Gemini Nano 的抢先体验计划，Pixel 8 Pro 用户已经可以看到它在录音机中的汇总和 Gboard 中的智能回复等功能中推出，以及更多即将推出的功能！

2、Gemini Pro 的更强大版本，它将很快为许多 Google AI 服务提供支持，并且从今天开始成为 Bard 的支柱。

现在，Gemini Pro 今天在 Bard 迄今为止最大的更新中推出（在 170 个国家/地区提供英语），在响应中提供了更高级的推理和理解。 Bard Advanced with Ultra 是我们用于高度复杂任务的最通用、最强大的模型，将于明年初推出。

从 12 月 13 日开始，开发者和企业客户将可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 的 Gemini API。

3、还有一个功能更强大的模型，称为 Gemini Ultra，它是 Google 迄今为止创建的最强大的大模型，主要是为数据中心和企业应用程序设计的。

Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈，并计划于明年初向开发者和企业客户推出。

Google Gemini性能表现

Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中的 30 个上超过了当前最先进的水平。 Gemini Ultra 的得分为 90.0%，是第一个在 MMLU 上超越人类专家的模型。

Gemini Ultra 的得分率为 90.0%，是第一个在 MMLU（大规模多任务语言理解）测试中超过人类专家的模型，MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目，用于测试世界知识和解决问题的能力。

在图像基准测试中，Gemini Ultra 在不使用对象字符识别 (OCR) 系统来提取图像中的文本进行下一步处理的情况下，表现优于以前最好的模型。这些基准测试凸显了 Gemini 的原生多模态性，并显示出了 Gemini 具有更复杂推理能力的潜力。

Gemini 目前仅提供英语版本，其他语言显然很快就会推出。该模型最终将被整合到谷歌的搜索引擎、广告产品、Chrome 浏览器等世界各地。

Gemini官方测试视频

如何使用Google Gemini？

个人用户

对于普通用户，现在可以去Google bard免费使用Gemini了。使用地址：https://bard.google.com/

为了使用Gemini Pro模型，您需要满足以下条件:

您的Bard界面语言必须为英语
您的Bard节点必须位于美国
您必须使用最新版本的Bard

如果您满足上述条件，您可以通过以下步骤来启用Gemini Pro模型:

1.打开Bard界面
2.点击“设置”图标
3.点击“模型”
4选择“Gemini Pro”
5.点击“保存”

完成这些步骤后，Bard将开始使用GeminiPro模型。您可以通过以下方法来验证是否已成功启用GeminiPro模型

1.点击“帮助”图标
2.点击“关于Bard”
3.查看“模型”部分

如果“模型”部分显示“Gemini Pro”则表示您已成功启用Gemini Pro模型

开发者和企业用户

今天（12月14日）， Google 的 Gemini Pro 通过 Gemini API 上线，并且提供了 API 访问，同时还有一个开发者的利好：

目前 Gemini Pro 可免费使用！ Gemini API 地址：http://ai.google.dev

Gemini API支持32k上下文窗口，在一定限制内可免费使用，具有函数调用、嵌入、语义检索和自定义知识基础以及聊天功能，支持全球180多个国家和地区、38种语言，支持文本、图像输入和文本输出，提供SDK（软件开发工具包）。

现在可在在线免费开发者工具Google AI Studio、云托管AI平台Vertex AI上使用该模型。

定价方面，免费版本支持每分钟最多60个请求，但输入输出数据将被用于改善谷歌的模型。之后将推出付费计划，每千字符输入定价0.00025美元（约合人民币0.0018元），每张图像输入定价0.0025美元（约合人民币0.018元），每千字符输出定价0.0005美元（约合人民币0.0036元）。

了解更多详情：

官方中文内容：https://www.aihub.cn/news/google-gemini/

官方英文博客：https://blog.google/technology/ai/google-gemini-ai/

→想免费在线AI绘画，点此立即使用！

温馨提示：

文章标题：Gemini-谷歌发布的多模态AI大模型

文章链接：https://yuntunft.cn/10737.html

更新时间：2024年09月29日

给TA打赏

共{{data.count}}人

人已打赏

Gemini Google gemini 多模态大模型谷歌

Google Gemini是什么？ AIHub 12 月 6 日消息，谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态大模型Gemini。意味着它可以理解、操作和结合不同类型的信息，包括文本、代码、音频、图像和视频。根据谷歌给出的基准测试结果，Gemini 在许多测试中都表现出了「最先进的性能」，甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。 Google官方介绍视频 Google Gemini有什么？谷歌针对不同场景发布了三种不同版本：Gemini Ultra、Gemini Pro 和 Gemini Nano。这些不同的版本也将适用于不同的场景和案例： Gemini Ultra - 用于处理高度复杂任务的最强、最大的模型。 Gemini Pro - 用于扩展各种任务的最佳模型。 Gemini Nano - 用于手机等设备的最高效模型。 1、Gemini Nano 的更轻版本，旨在在 Android 设备上本地离线运行。 Gemini Nano 对于设备上的任务非常高效。 Android 开发者可以通过 Android AICore 注册 Gemini Nano 的抢先体验计划，Pixel 8 Pro 用户已经可以看到它在录音机中的汇总和 Gboard 中的智能回复等功能中推出，以及更多即将推出的功能！ 2、Gemini Pro 的更强大版本，它将很快为许多 Google AI 服务提供支持，并且从今天开始成为 Bard 的支柱。现在，Gemini Pro 今天在 Bard 迄今为止最大的更新中推出（在 170 个国家/地区提供英语），在响应中提供了更高级的推理和理解。 Bard Advanced with Ultra 是我们用于高度复杂任务的最通用、最强大的模型，将于明年初推出。从 12 月 13 日开始，开发者和企业客户将可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 的 Gemini API。 3、还有一个功能更强大的模型，称为 Gemini Ultra，它是 Google 迄今为止创建的最强大的大模型，主要是为数据中心和企业应用程序设计的。 Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈，并计划于明年初向开发者和企业客户推出。 Google Gemini性能表现 Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中的 30 个上超过了当前最先进的水平。 Gemini Ultra 的得分为 90.0%，是第一个在 MMLU 上超越人类专家的模型。 Gemini Ultra 的得分率为 90.0%，是第一个在 MMLU（大规模多任务语言理解）测试中超过人类专家的模型，MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目，用于测试世界知识和解决问题的能力。在图像基准测试中，Gemini Ultra 在不使用对象字符识别 (OCR) 系统来提取图像中的文本进行下一步处理的情况下，表现优于以前最好的模型。这些基准测试凸显了 Gemini 的原生多模态性，并显示出了 Gemini 具有更复杂推理能力的潜力。 Gemini 目前仅提供英语版本，其他语言显然很快就会推出。该模型最终将被整合到谷歌的搜索引擎、广告产品、Chrome 浏览器等世界各地。 Gemini官方测试视频如何使用Google Gemini？个人用户对于普通用户，现在可以去Google bard免费使用Gemini了。使用地址：https://bard.google.com/ 为了使用Gemini Pro模型，您需要满足以下条件: 您的Bard界面语言必须为英语您的Bard节点必须位于美国您必须使用最新版本的Bard 如果您满足上述条件，您可以通过以下步骤来启用Gemini Pro模型: 1.打开Bard界面 2.点击“设置”图标 3.点击“模型” 4选择“Gemini Pro” 5.点击“保存” 完成这些步骤后，Bard将开始使用GeminiPro模型。您可以通过以下方法来验证是否已成功启用GeminiPro模型 1.点击“帮助”图标 2.点击“关于Bard” 3.查看“模型”部分如果“模型”部分显示“Gemini Pro”则表示您已成功启用Gemini Pro模型开发者和企业用户今天（12月14日）， Google 的 Gemini Pro 通过 Gemini API 上线，并且提供了 API 访问，同时还有一个开发者的利好：目前 Gemini Pro 可免费使用！ Gemini API 地址：http://ai.google.dev Gemini API支持32k上下文窗口，在一定限制内可免费使用，具有函数调用、嵌入、语义检索和自定义知识基础以及聊天功能，支持全球180多个国家和地区、38种语言，支持文本、图像输入和文本输出，提供SDK（软件开发工具包）。现在可在在线免费开发者工具Google AI Studio、云托管AI平台Vertex AI上使用该模型。定价方面，免费版本支持每分钟最多60个请求，但输入输出数据将被用于改善谷歌的模型。之后将推出付费计划，每千字符输入定价0.00025美元（约合人民币0.0018元），每张图像输入定价0.0025美元（约合人民币0.018元），每千字符输出定价0.0005美元（约合人民币0.0036元）。了解更多详情：官方中文内容：https://www.aihub.cn/news/google-gemini/ 官方英文博客：https://blog.google/technology/ai/google-gemini-ai/ →想免费在线AI绘画，点此立即使用！

24年7月2日027

谷歌日前发布了AlphaCode2，这是一款由Gemini模型驱动的AI编程工具，是对前代AlphaCode的改进版本。与Gemini模型同时亮相，AlphaCode2在编程竞赛中表现出色，尤其在动态规划等复杂问题上具备更强大的能力。研究人员通过在CodeForces竞赛网站上收集的约15000个问题和3000万份人类编写的代码的数据集上对Gemini Pro系统进行精细调整，为AlphaCode2的问题解决能力提供了强大支持。根据谷歌在Codeforces平台上的数据，AlphaCode2在涵盖Python、Java、C++和Go等多语言的编程竞赛中，平均胜过了约85%的竞争对手，相较于前代，这是一次显著的提升。在技术白皮书中指出，在12场最近的竞赛中，AlphaCode2解决了77个问题中的43%，而前代仅在25%的问题上获得成功。动态规划是编程竞赛中常见的复杂问题之一，而AlphaCode2展现出其在这方面的卓越表现。DeepMind研究科学家Rémi Leblond在一段预录视频中解释说，AlphaCode2不仅知道何时正确实施动态规划策略，还知道在何处使用它。这对于原始AlphaCode在处理需要动态规划的编程问题时曾经遇到的困难而言，是一项显著的进步。 AlphaCode2的工作原理涉及一系列“策略模型”，这些模型为每个问题生成多个代码样本。不符合问题描述的代码样本被过滤掉，然后通过聚类算法将“语义相似的代码样本”分组，以避免冗余。最终，AlphaCode2内的评分模型确定每个最大代码样本“簇”中的最佳候选答案。尽管AlphaCode2在编程竞赛中表现出色，但白皮书指出其存在一些缺陷。例如，AlphaCode2需要大量的试错，运营成本较高，且过于依赖于过滤明显错误的代码样本。据猜测，迁移到更强大的Gemini版本，如Gemini Ultra，可能会缓解这些问题。 Google DeepMind相信，通过使用Gemini Ultra，一个比Gemini Pro更大更强大的大型语言模型，他们可以构建一个更出色的代码编写模型，并表示正在努力将其能力提供给开发者。团队希望将AlphaCode2的独特能力引入基础Gemini模型，使这种新的编程范式成为所有人的首选。关于AlphaCode2是否会成为产品的问题，DeepMind的产品副总裁Eli Collins在一次简报中暗示了这一可能性。他表示:“关于最新结果最让我兴奋的事情之一是，当程序员与[由Gemini提供动力的] AlphaCode2合作时，通过定义代码应遵循的某些属性，[模型]的性能会变得更好。” 他进一步指出:“在未来，我们预见程序员将利用高度 capable 的AI模型作为协作工具，从问题推理到辅助实施，助力整个软件开发过程。”

24年7月1日019

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部