活动现场,美图公司创始人、董事长兼首席执行官吴欣鸿向我们揭示了AI视觉大模型的本质——“一个无穷无尽的视觉创意库”。这一观点不仅揭示了视觉大模型的核心价值,也为我们理解其应用普及提供了新的视角。
尽管国内众多团队在研发视觉大模型,但真正将大模型与生产环节结合的企业数量相对较少。在吴欣鸿看来,大模型在生产端的普及需要解决三个关键问题:垂直领域极致效果、工作流整合、变现能力。
吴欣鸿表示,视觉大模型应用普及将分为三个阶段:探索期、高速发展期、成熟期。2024年之前是探索期,厂商进行不断探索,效果勉强及格;2024-2025年进入高速发展期,效果逐步精进,有着明确的场景,带来工作流的升级;2026-2030年进入成熟期,视觉大模型的生成效果会非常出色,成为设计与创意的标配。
美图公司正式发布MiracleVision3.0版本,主打“奇思妙想”和“智能创作”。通过“提示词智能联想”、“提示词精准控制”等功能,用户的各种奇思妙想将得以实现所想即所得。
吴欣鸿认为,AI视觉大模型带来的改变不止限于视觉效果的提升,更重要的是对工作流的改造和创新。当前,AI视觉大模型主要被运用于生成各类艺术作品,包括绘画、摄影和设计图稿为主,但这只是起点。
在深度参与视觉大模型建设的过程中,吴欣鸿重温了自己年少学画的时光。他认为,训练AI也有共通之处,AI会学习各种不同的绘画风格和技巧。通过充分的训练,AI也能创作出具有独特性的原创作品。
美图公司自研的AI视觉大模型MiracleVision,经过100天的不断迭代,已经展现出令人惊喜的成长速度。吴欣鸿透露,三个月前,MiracleVision的绘画水平还处于初级阶段,如今已经能够描绘出真实细腻的画面细节,令人叹为观止。
吴欣鸿透露,MiracleVision接下来将助力电商、广告、游戏、动漫、影视等行业的工作流提效,推动AI视觉大模型的应用普及。这一举措有望为我国相关行业带来翻天覆地的变化。