2024-07-19 17:49:03,
GPT-4o mini是什么?
GPT-4o mini是由OpenAI最新推出的高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。GPT-4o mini 在 MMLU 上的得分率为 82%,目前在 LMSYS 排行榜的聊天偏好方面优于 GPT-4。它的价格为每百万输入tokens15 美分,每百万输出tokens 60美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini 以其低成本和低延迟实现了各种任务,如连锁或并行多个模型调用(如调用多个应用程序接口)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。
目前,GPT-4o mini的API服务支持文本和视觉能力,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K tokens,每个请求最多支持 16K 输出tokens,知识期限到 2023 年 10 月。由于改进了与 GPT-4o 共享的标记器,现在处理非英语文本更加经济高效。
GPT-4o mini的评测结果
GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他学术基准上的小型模型,并支持与GPT-4o相同的语言范围。
- 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 中的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
- 数学和编码能力:GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上以前的小型机型。在测量数学推理的 MGSM 中,GPT-4o mini 的得分率为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 中,GPT-4o mini 的得分率为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
- 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
如何使用GPT-4o mini?
- 个人用户:免费用户、Plus会员 和 Team 用户已经可以在ChatGPT中使用GPT-4o mini。
- 开发者:开发者用户可以在Assistants API、Chat Completions API和Batch API三个API服务中调用GPT-4o mini的文本和视觉能力。
了解更多GPT-4o mini:https://OpenAI.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/