阿里云发布千亿级参数的通义千问2.0模型，引领AI语言模型新高度

2025-04-28 20:21:01 财经资讯 facai888

28|0条评论

揭开阿里云通义千问2.0的神秘面纱

图：通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4

在人工智能领域，每一次技术的突破都伴因为行业的颠覆性变革。近日，阿里云发布了千亿级参数的通义千问2.0模型，这一举措无疑为AI语言模型领域带来了新的活力。

开源战略，推动模型创新

周靖人透露，阿里云计划近期开源通义千问72B版本，此前，阿里云已先后开源7B和14B版本模型，模型累计下载量超过100万。这一开源战略不仅体现了阿里云对技术的开放态度，更推动了模型和应用创新。

性能飞跃，引领AI语言模型新高度

技术优化，提升用户体验

通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化，能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能，支持图片输入、文档解析等细分任务。

八大行业模型，覆盖多个垂直场景

与此同时，基于通义大模型训练的8大行业模型组团上线，他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景，使用领域数据进行专门训练。

阿里云发布千亿级参数的通义千问2.0模型，引领AI语言模型新高度

落地应用，助力各行各业

截至10月，阿里云已与60多个行业头部伙伴进行深度合作，推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

中英文理解能力，全面超越Llama-2-70B

中英文理解能力是大语言模型的基本功。英语任务方面，通义千问2.0在MMLU基准的得分是82.5，仅次于GPT-4。通过大幅增加参数量，通义千问2.0能更好地理解和处理复杂的语言结构和概念；中文任务方面，通义千问2.0以明显优势在C-Eval基准获得最高得分。

数学推理、代码理解，展现强大能力

在数学推理、代码理解等领域，通义千问2.0进步明显。在推理基准测试GSM8K中，通义千问排名第二，展示了强大的计算和逻辑推理能力；在HumanEval测试中，通义千问得分紧跟GPT-4和GPT-3.5。

全面超越，与GPT-4差距进一步缩小

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上，通义千问2.0的得分整体超越Meta的Llama-2-70B，相比OpenAI的Chat-3.5是九胜一负，相比GPT-4则是四胜六负，与GPT-4的差距进一步缩小。

从最初的开源7B和14B版本，到如今即将开源的72B版本，通义千问的每一次升级，都让其在AI语言处理领域更上一层楼。这不仅是一个技术的进步，更是对现有应用场景的深度挖掘和创新。

这些行业模型的出现，不仅丰富了通义千问的应用范围，也为开发者提供了更多的选择。用户可以在官网直接体验模型功能，开发者则可以通过网页嵌入、API/SDK调用等方式，将模型能力集成到自己的大模型应用和服务中。

这些合作案例不仅展示了通义千问在各个行业的应用潜力，也为其他行业提供了宝贵的参考和借鉴。通过这些合作，通义千问正在逐步实现其“千行百业，智绘未来”的愿景。

因为通义千问2.0的发布，我们可以预见，AI语言处理领域将迎来一个全新的纪元。通义千问的每一次升级，都为这个领域带来了新的可能性和挑战。

阿里云CTO周靖人提出打造AI时代最开放的云，旨在构建一个全面开放的云平台 IBM发布AI编程助手Watsonx，旨在缓解COBOL程序员短缺问题

股市动态

MORE>

热门推荐网友点评

搜索: Search

最近发表