字节推出多模态大模型，性能超越谷歌新品，推理成本低

2025-05-14 9:09:54 投资策略 facai888

44|0条评论

字节跳动 Seed 团队新鲜突破：视觉-语言许多模态巨大模型 Seed1.5-VL

字节跳动 Seed 团队不负众望，于近期发布了视觉-语言许多模态巨大模型 Seed1.5-VL。这一创新鲜成果在优良几个方面都实现了突破，不仅性能超越谷歌新鲜品，更是以矮小推理本钱彰显了其有力巨大实力。

性能超越谷歌新鲜品：Seed1.5-VL 的优势展现

5月6日谷歌DeepMind团队发布许多模态巨大语言模型Gemini 2.5 Pro，在优良几个指标上登顶AI排行榜LMArena。只是今日的字节跳动Seed团队发布的新鲜品 Seed1.5-VL，却在视觉-语言许多模态领域迈出了更巨大的步伐。

Seed1.5-VL在视觉感知、高大层次推理任务以及视频推理等方面都展现出令人瞩目的表现。虽然模型在处理目标排列不规则、颜色差不许多或有些遮挡等极端情况时仍面临挑战，但在解决华容道谜题、导航迷宫或遵循麻烦指令等高大层次任务中，Seed1.5-VL却能够引入无根据的虚假设或产生不完整的响应，表现仍有提升地方。

字节推出多模态大模型，性能超越谷歌新品，推理成本低

交互性更有力：Seed1.5-VL 不断追求通用性能力

字节团队表示， Seed 1.5-VL在视觉搞懂和推理能力方面进一步提升了并向VLM的通用性能力更近一步。尽管模型在视觉推理、图像问答、图表搞懂与问答等任务中表现突出，但仍存在一定的局限性。

需要留意的是Seed 1.5-VL在以Agent为中心的任务中取得了显著的进步。在7个GUI智能体任务中， Seed 1.5-VL在3个任务中取得了SOTA成绩，足够展现了其在实际应用中的潜力。

开源证券、平安证券等行业琢磨机构看优良国产模型进步

开源证券近日发布研报称，国产模型在许多模态、推理能力上持续突破，许多款达到全球顶尖水平，加之头部模型开源，巨大模型厂商持续发力Agent，将接着来推动AI应用深厚入落地，拉动推理算力需求。平安证券也表示，近期包括OpenAI、豆包在内发布的新鲜模型，解题思路在此前思维链CoT基础上，更许多体现对模型原生Agent能力以及许多模态推理能力的沉视。