在多模态推理评估基准MMMU上,GPT-4o Mini取得了令人瞩目的成绩,得分高达59.4%,领先于Gemini Flash和Claude Haiku等同类模型。
据悉,GPT-4o Mini的商用价格为每百万输入token 15美分,每百万输出token 60美分。这一价格比之前的SOTA模型便宜一个数量级,比OpenAI此前的最便宜GPT-3.5 Turbo还要便宜60%以上。这使得更多企业和项目能够轻松使用这项先进技术。
为了保证GPT-4o Mini的安全性,OpenAI对其进行了严格的评估。70多名来自社会心理学、错误信息等领域的专家对GPT-4o进行了测试,以确定潜在风险。这些问题的解决方法将在即将发布的GPT-4o system card和Preparedness记分卡中分享。
目前,GPT-4o Mini已在Assistant API、Chat Completions API和Batch API中作为文本和视觉模型使用。这将为不同领域的发展带来新的机遇,如自然语言处理、图像识别等。
测试指标 | GPT-4o Mini | 同类模型 |
---|---|---|
MMLU | 82.0% | 77.9% - 73.8% |
MGSM | 87.0% | 75.5% - 71.7% |
HumanEvalji'zhun | 87.2% | 71.5% - 75.9% |
MMMU | 59.4% | 56.1% - 50.2% |
数据来源:OpenAI官方网站
学校名称 | 应用场景 | 效果评估 |
---|---|---|
智慧校园A | 个性化学习辅导 | 学生成绩提升10%,学习效率提高15% |
智慧校园A利用GPT-4o Mini,为学生提供了个性化的学习辅导服务。通过分析学生的学习数据,GPT-4o Mini能够为学生推荐合适的学习资源和练习题,从而提高学生的学习效率。
公司名称 | 应用场景 | 效果评估 |
---|---|---|
科技企业B | 智能客服系统 | 客户满意度提升20%,响应时间缩短30% |
科技企业B将GPT-4o Mini应用于智能客服系统,通过自然语言处理技术,系统能够快速理解并响应客户的问题,有效提升了客户满意度,并缩短了客服人员的响应时间。
医院名称 | 应用场景 | 效果评估 |
---|---|---|
医疗中心C | 辅助诊断系统 | 诊断准确率提升5%,诊断时间缩短10% |
媒体平台D | 应用场景 | 效果评估 |
---|---|---|
内容创作平台 | 创意生成与编辑 | 创意产出增加15%,编辑效率提升20% |
金融机构E | 应用场景 | 效果评估 |
---|---|---|
风险管理部门 | 风险评估与预测 | 风险预测准确率提高8%,决策效率提升10% |