如果说过去几年,我们疯狂追求模型最强,那从这一刻起,我开始思考:未来真正的关键,或许是谁能让模型在真实场景中活下来,活得久、有用、有价值。于是,我把那晚的思考、访谈里的闪光观点,以及后续观察融合成这篇文章,希望可以帮你一起看清方向。
所以先说结论吧,我认为:AI的下半场,是场景驱动的时代,“模型是工具,场景才是方向盘” —— 在这个时代,算法不是终点,落地才是核心。
在 AI 热潮里,模型驱动曾经称王。但我越来越觉得,那条路正走到尽头。我们进入了一个新的阶段:模型能力已成为基础设施,而场景开始主导能力演进。下面,我从几个角度向你拆这个转变。
一、模型驱动时代的隐蔽危机
曾经,人们相信:把模型做到极致,世界自然向你俯首。但那条路,如今显得越来越吃力。以下是我看到的几种危机:
(1)能力差距被快速压平
随着技术扩散,越来越多团队能跑出不错的模型。那些极端差距正在变小, 一个模型比另一个好一些,可能带不来质变。
(2)“做得到” ≠ “用得到”
一个模型可以生成画面,但用户在使用时却嫌操作复杂、结果不稳定、误差多。这种从“能做”到“可用”的落差太常见。
(3)资源 / 成本 / 效率掣肘
模型训练、推理、存储、带宽诸多成本在现实里咬人。再强的模型,如果不能高频、低成本地参与场景,就停留在实验室的光环里。
访谈中,陈冕一句话特别让我印象深刻:“产品不能只是把模型铺过去,还要让它在画布里能被指点、调动、反馈。”
他在强调:能力若只是停留在技术层面,而不能被用户“碰一碰、调一调、校正”,那它不过是一个炫技片段,而不是产品能力。
所以,我开始认为:模型加码已过香甜时期,下半场的核心,是把目光拉回场景。
二、Sora2:模型与场景开始融合的标志节点
在我看来,Sora2 的发布,不只是一次模型升级,更像是一面分水岭,向我们昭示了“场景驱动”不仅是概念,而是正在成为现实。
模型能力的升级不可忽视
Sora2 在多个维度做了强化:物理合理性更好、画面更真实、音画同步更严密、控制性更强。OpenAI 在其 System Card 中直接把“物理准确性 / 音画一致性 / 更可控的风格切换”列为其核心能力。
在实际演示中,Sora2 可以让人物动作符合重力规律、让多镜头场景保持连贯性、让声音与角色嘴型更同步。
这说明:在能力层面,Sora2 是一次重要跃迁。
更关键的:它把场景信号写进模型 + 产品设计
Sora2 被包装成一个社交视频工具,而不仅仅是一个背后的引擎。用户可以滑动观看 AI 视频流(类似 TikTok 式的交互体验)——视频由模型即时生成。
它还支持 Cameo 功能:用户允许后,可以把自己或朋友的头像 / 形象 /声音“插入”AI视频里,成为其中角色。
这代表:视频生成不再是幕后跑一跑,而是被做成“可分享、可 remix、可合拍”的场景入口。
在访谈里,曹越说,他在模型路线抉择时,会反复用一个问题考量:这条能力在真实场景里有没有差异?有没有被用户“拉起来”的可能?他并不是被动地追随技术,而是让场景牵引能力走向。
因此我认为:Sora2是一个信号,它让行业看到:能力 + 场景结合,才是真正可行的方向。
三、场景驱动:我的三层思路模型
“场景驱动”如果只说口号,那它很容易变空话。为了让它更具操作性,我把它拆成三层:场景先行 → 能力适配 → 输出闭环。以下是我对每层的理解与落地建议:
1.场景先行:让痛点去牵引能力方向
很多团队的思路是:训练模型、看模型做什么、再去找场景。但我越来越倾向于反过来:先观察场景,找痛点,再用能力去回应。
比如你想做“短视频社交”场景,你可以把眼光放在:
1、切镜头 / 转场不生硬
2、多角色 / 多视角的一致性
3、音频与口型 / 动作同步
4、节奏控制、情绪表达
把这些拆出来,从痛点出发,让模型优先去服务这些场景。
在访谈里,曹越谈到他选择AR / 自回归路线时,说正是因为他在“时间控制 / 多镜头一致性 /节奏控制”这些场景里看到了差异和价值。这就正是一种场景优先的思考。
2.能力要被“驯化”为产品语言
能力训练出来不等于就是产品。场景驱动意味着能力要被“包装”、要被 “接口化 / 模块化 / 界面化”,才能让用户触达。
正如陈冕提到的:不能只是“对话 → 生成”,要有“画布 + 工具箱 + 对话”的混合交互。用户要能点、调、纠错、反馈。能力要被降维到可操作层。
举个例子:假设模型里有个“镜头过渡”模块,这个模块背后可能算法非常复杂,但在产品里你可以给用户一个滑块,让用户调节过渡节奏、风格,而不是让用户直接写 prompt去控制。那才是真正把能力带入可用层面。
3.输出不止一次,而是可演化的闭环
能力要落地,还得在使用中持续被“激活”与“进化”。我认为真正的场景驱动系统,一定会设计这种闭环机制:
用户触发 → 模型输出 → 用户校正 / 反馈 → 系统学习 / 模型迭代 → 再输出 → ……
在这个闭环里,还要有商业机制支撑:付费机制 / 增值模块 / 重复调用权 / 模型升级服务。你不能只做一个酷炫的demo,而要让能力在真实使用里被撑起来。
四、互联网时代的类比:为什么场景驱动更像必然进化
在听完访谈后,我常自问:“这个转变,怎么让人更快看懂?”于是我搜集了一下互联网时代的路径:
当年互联网初期靠通道能力(连接、带宽、协议)打基础;接着是流量红利阶段;随后竞争焦点转移到内容 / 服务 /平台;再后来是平台化 + 生态化的竞争逻辑。
AI的发展,有很像的节奏:
1、前期是能力 / 模型红利期
2、中期是能力趋同、模型门槛降低
3、接下来,是场景红利期:谁能让能力被贴入体验、让用户留存、让业务落地
4、长远来看,是能力 + 场景融合的能力平台 / 生态入口
在互联网时代,当连接能力不再具备差异后,内容 / 服务才成为人们拼的对象;在AI时代,当模型能力不再有极大差距后,场景 / 使用体验 /闭环才成为新的竞争焦点。
这个类比不是说AI要完全照搬互联网发展,而是为了让大家看到:能力层面的红利会被消化,场景层面的竞争才是下一波主战场。
五、几个我还在思考 / 保留的边界
在把这些理解往深里推的时候,我也会遇到很多模糊之处。以下是我还在纠结 / 保留判断的点:
(1)场景判断 / 拆解的误导风险
如果你对场景的痛点判断错了,那么能力被提错方向也是浪费。场景牵引能力是机会也是陷阱。
(2)资源 / 效率的折中
在很多落地场景里,模型要够轻、推理要够快。不可能每个场景都用最强模型。如何在能力与效率之间折中,是一道难题。
(3)场景路径的集中化竞争
如果未来所有人都去做热门视频 / 社交场景,那能差异化的空间可能被压缩。跳出热点、挖细分,可能是更稳妥的选择。
(4)组织 / 协作 / 对齐的鸿沟
场景驱动要求产品 / 模型 / 设计 / 交互高度融合。访谈里两位都反复提:混坐、快速对齐、沟通带宽。这些在现实里常常是软肋。
结语·这是一个刚刚开始的战场
我相信,AI的下半场,不是看谁模型最强,而是谁能让模型能力真正插上场景,成为日常的可触手可及的工具。那样的能力才可能被用、被改、被进化,被商业化。其实,这也正是一个创业者的机会——当模型能力与场景深度融合的门槛还未被完全闯开,谁能率先在中间搭好那座桥梁,谁就可能成为下个时代的入口。
与此同时我认为,也许AI产品经理的角色正在被重塑
在这个场景驱动时代,我也在思考:AI 产品经理 会不会因此迎来新的高光期?或许他们将不只是连接用户需求与产品结构的人,而是场景与能力之间的“桥梁建构师”。
在未来,AI 产品经理可能需要兼具以下能力:
场景感知能力:不仅要能理解业务场景与用户痛点,还要能预见那些未被满足的“隐性场景”,用场景意向去牵引能力研发方向。
能力表达能力:要把模型能力拆解、模块化、映射成界面 / 功能 /操作,让用户能“看懂、用得起、调得动”。
跨界沟通能力:要在产品 / 算法 /设计 /交互各方之间快速对齐,让能力、交互、体验三块合拍。
闭环经营意识:要从一开始就把能力放在可复用、可付费、可增长的路径上思考,而不仅仅做一个极致demo。
所以我觉得,在下半场里,AI产品经理可能是那个最具“混角色属性”的角色:既要懂技术(一个能力能做什么),也要懂体验(如何让用户操控能力),还要懂价值(怎样让能力在场景里复用、被商业化)。他们会比以往任何时候都更关键,因为他们站在“模型与场景的中间”,是让能力真正落地的那把钥匙。
京公网安备11010502056287号