DeepSeek发布全新模型，非预期DeepSeek-V4或R2

2025-07-15 6:23:33 投资策略 facai888

606|0条评论

还记得那个让人翘首以盼的DeepSeek-V4或R2吗？没想到，DeepSeek这次却给了我们一个意外的惊喜——全新的DeepSeek-V4！是的，你没有听错，就在大年二十九的除夕夜，DeepSeek放了个大招，发布了这个让人眼前一亮的版本。

Janus-Pro：文生图领域的黑马

这次发布的Janus-Pro多模态大模型，简直是个文生图领域的黑马。在GenEval和DPG-Bench基准测试中，Janus-Pro-7B不仅击败了OpenAI的DALL-E 3，还超越了Stable Diffusion、Emu3-Gen等热门模型。更让人惊喜的是，Janus-Pro采用MIT开源协议，这意味着它可以无限制地用于商业场景。

DeepSeek-V2：性能碾压，价格亲民

在模型架构上，DeepSeek也进行了创新，采用了自研的MLA和Sparse结构，大幅减少了模型计算量和推理显存。从公布的性能指标来看，DeepSeek-V2的中文综合能力超越了一众开源模型，与GPT-4-Turbo、文心4.0等闭源模型同处第一梯队。DeepSeek-V2的性能达到了GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。

DeepSeekLLM：优化性能，超越LLaMA

DeepSeekLLM，一种开源大语言模型，通过深入研究缩放规律，优化了模型性能和应用。作者使用2万亿字符的双语数据集，通过监督微调和直接偏好优化创建了DeepSeekChat模型，超越了LLaMA。研究还探讨了模型和数据规模与性能的关系，以及超参数的选择和模型/数据缩放策略。

DeepSeek：不断突破，引领AI新潮流

从DeepSeek-V3到Janus-Pro，再到DeepSeekLLM，DeepSeek一直在不断突破，引领着AI新潮流。虽然这次没有发布市场期待的DeepSeek-V4或R2，但DeepSeek-V4的表现已经足够惊艳。我们期待DeepSeek在未来能带给我们更多的惊喜。

值得一提的是，这次DeepSeek-V4的发布，也让DeepSeek在Hugging Face上迅速登上了Trending榜单。看来，DeepSeek的实力已经得到了市场的认可。

总的来说，DeepSeek的这次更新，虽然有些意外，但却充满了惊喜。让我们一起期待DeepSeek在未来能带给我们更多的创新和突破吧！

金融监管总局发布《养老金融高质量发展实施方案》黄金筑底反弹，谨慎买入，关注市场动态

股市动态

MORE>

热门推荐网友点评

搜索: Search

最近发表