Sora2：AI视频的“GPT-3.5”时刻

公众号改版了，大家可能无法及时接收到文章推送，不想错过精彩文章的可以点击公众号主页右上角的三个点，将我们的公众号设置为“星标”，便于收阅，以免错过及时的信息！

一、开发者大会引领AI应用新生态，大模型迭代转向应用侧探索

开发者大会APP生态：构建流量分发新范式:OpenAI开发者大会推出的APP类似微信小程序或苹果AppStore的流量分发机制。目前有11位业内知名合作伙伴，如Uber、TripAdvisor等。基于MCP协议，能快速对接大模型企业与业内产品的应用逻辑和界面，不仅局限于简单交互对话，返回内容拓展，如选旅游目的地可返回相关美食酒店照片等，该生态已较为成熟，想象空间巨大。

AI应用趋势：大模型迭代趋缓，应用侧探索加速:大模型本身迭代趋缓，主要在知识更新、降本增效和推理方式上有明确路子，在超级人工智能基于物理规律的探索有更多分支问题。而应用侧探索更多，如通过开发者生态或推出C端产品进行迭代，SoraAPP就是探索过程，但不会短时间成为如TikTok般的巨大社交产品。

二、AI开发工具革新，大幅提升编程效率与应用构建速度

AIagent插件：实现拖拽式编程，人效提升超20倍:OpenAI的AIagent插件实现了拖拽式编程方式，在发布会上现场示例显示，一人能在不到7分钟内做出可部署且完全跑通的应用，而人工正常做最快需三个人一周时间，人效提升20倍以上。它面向智能体交互界面，能加速应用市场繁荣和B端企业构建AI应用的速度。

CodeX工具：为通用人工智能奠定代码基础:CodeX工具背后逻辑认为通用AI或超级人工智能离不开代码。当遇到如供给级不够、数据权限不够等问题时，可通过代码解决，它为巨型智能、自动驾驶和通用人工智能等做准备，面向更高级的通用人工智能方向。

三、Sora2重塑视频生成格局，多领域应用前景广阔

Sora2产品背景与改进：解决视频生成时长难题:Sora2分为普通版和PRO版，做了差异化定价。它与提供高质量视频的数据企业合作，研发时解决了视频生成时长问题，如训练时让视频有3-5秒重叠，以应对短视频或短剧场景下视频模型生成时长拓展效果变差的问题。

Sora2应用场景与市场竞争：多领域显价值，与VU3持续竞争:Sora2在电商、品牌广告、创意视频、教育等领域有较大应用价值，如满足教育培训场景中讲师复用需求。它与谷歌的VU3类似，都主打视频真实性和音频同步，但在单次视频时长、分辨率、原声音频等方面各有优劣，价格上Sora2单次付费，VU3按月付费且较贵。未来二者会在视频生成领域持续竞争，Sora2可能寻求与Talk等合作，且降价后面向C端的作用会更出众。

Sora2对国内市场影响：C端B端均有机会，国内生成方式待变革:Sora2对国内市场，C端可助力快速做出社交媒体爆款，B端在AI带货信息流、AI短剧等领域有机会，如可实现每天制作几百条换脸不同风格的视频。但Sora2目前价格昂贵，模型还有提升空间，国内行业之前习惯的图片转视频生成方式后期需更改。

四、行业竞争加剧，企业需积极应对新挑战

Sora对其他产品冲击：分走部分预算，各有优劣难占优:Sora推出可能会分走可林、VU3等的部分预算。Sora在原声音频、物理一致性方面比可林强，但分辨率可能低一点，生成速度慢一些，风格上与可林各有特点，整体在企业场景客户中未必占优。

软件企业应对策略：变身入口类模块，提前布局应对挑战:OpenAI下场做应用，其SDK等工具可能影响软件企业，尤其是国外软件企业生态。软件企业可将自己变成GMCP的可比较模块，成为别人的入口类东西，提前布局以应对影响。

Q&A

Q1:大模型发布众多工具和APP，是否意味着大模型的迭代，模型能力本身的迭代越来越趋缓，未来所有模型厂商是否会把资源往应用端去进行配置，对本身大模型行业的发展有什么指导性意义？

A1:现在的趋势是大模型本身迭代会减慢，模型本身学到的知识已基本饱和，主要的迭代集中在知识更新、推理速度的降本增效、推理方式（预训练和后训练）上。在testtime阶段，通过算力自适应与模型做对应生成的领域探索方向较为明确，探索空间不大。不过，在与超级人工智能结合、基于物理规律的探索领域还有较多可挖掘之处。而应用侧的探索会更多，无论是通过开发者生态推动应用迭代，还是推出C端产品进行迭代，都是可行的探索方向。例如Sora的APP就是一个探索过程，但它不会短时间成为像TikTok那样的巨大社交产品。这意味着未来模型厂商可能会将更多资源配置到应用端，对大模型行业而言，发展方向会更加侧重于应用领域的拓展。

Q2:可林海外业务会不会受到Sora的冲击？

A2:可林海外业务可能会受到Sora的冲击。可林采用工具加场景的方式，适合想通过AI做视频的企业，它既提供丰富工具，又能将产品转化为场景，弥补用户对工具不了解的不足。而Sora推出后降低了视频生成门槛，可能会分走可林一部分预算。在与可林的对比中，Sora在原声音频、物理一致性方面更强，但分辨率可能低一点，生成速度慢一些，风格方面与可林打成平手。不过，Sora价格比可林高出好几倍，可林目前的生产方式符合用户对视频生成精确控制一致性的要求，能较好地保持画面一致性和精确控制，且价格便宜。因此，短期内用户不会大面积切换到Sora，但会去尝试。长期来看，可林等几家企业实力都不弱，可林的原声音频功能也即将上线，与Sora的差距会缩小。

Q3:您怎么看Sora2和GPT-3.5的对比？快手这一波到底是利好还是利空，是否看好快手？

A3:文本未提及Sora2和GPT-3.5的对比内容；看好快手，因为视频生成领域难以一家独大，可林等几家企业实力循环轮回，都不弱。

Q4:Sora2的出现给国内视频处理行业带来怎样的发展机遇？

A4:Sora2的出现给国内视频处理行业带来的发展机遇需从C端和B端分别分析。C端用户希望快速制作出10-30秒左右的社交媒体爆款，Sora2的肖像替换功能容易产生爆款逻辑，能满足C端快速落地的需求。B端对版权、价格、计费模式和一致性更为敏感，Sora2价格昂贵，虽模型较优秀，但仍存在一些bug。在国内，Sora2可应用于多个领域：一是在AI带货信息流领域，能使带货视频更加真实，可快速制作大量不同风格的视频；二是在AI短剧领域会出现不错的机会；三是在垂直领域，如房产、金融、加密货币等领域，可利用Sora2的prompt工作流导出相关内容。总体而言，Sora2带来的机遇可归纳为四个方向：垂直领域的视频配置细分领域、短剧及造梗流行、肖像或声音替换、定制化赋能。

Q5:Sora的出现对影视行业是否有深远影响，尤其是AI短剧和AI电影方向？

A5:Sora的出现对影视行业有深远影响。早期AI只能制作很短的切片，到VU3出现能制作1-3分钟的预告类片子，Sora的出现进一步推动了影视行业的发展，能减少分镜师的工作量。此前的视频工具在多镜头一致性上存在欠缺，而Sora在多镜头层面表现出色，与很多知名影视公司和大师合作进行影视及动画领域的探索，目前已接近替代预告片。对于AI短剧，制作三五分钟的短剧不是问题，发展前景较好；而完全的电影化生成还需等待技术进一步发展。

Q6:OpenAI自己下场做应用、APP，后面有可能会做浏览器，怎么看未来它可能潜在的下场去做的一些应用方向？

A6:OpenAI一直试图培养用户习惯，从最初的插件形态到后来将大模型融合，不断改变用户与模型的交互方式。虽然近期在基础模型领域进展较慢，但它通过推出新的产品和功能，逐渐让用户形成依赖。OpenAI想把自己做成一个大的入口，未来可能会继续扩大入口规模，不仅局限于手机APP或网页入口，还可能拓展到硬件入口，如眼镜、耳机等。它会继续进行产品探索，加强与企业的联动，包括社交领域，以进一步培养用户习惯，让用户更加依赖其产品。

Q7:大模型企业在未来生态中吞噬一些软件企业，b端的软件企业是否会受到影响，生存空间是否会受到挤压，怎么看待大模型吞噬软件这个观点？

A7:大模型企业的发展会对B端软件企业产生影响。从去年到今年，企业推ToB解决方案的方式发生了变化。过去国内企业需要通过cos平台先演示流程，客户满意后再开发；现在OpenAI提供了完善的SDK和agent，企业可以直接使用，省略了中间的开发环节。对于国外软件生态，这种影响更为明显，因为OpenAI在接入数据等方面具有巨大优势，接入合作伙伴多且成本低。对于B端软件企业而言，生存空间会受到一定挤压。不过，软件企业可以采取应对措施，将自己变成入口类的东西，比如将业务封装成标准的模块，如招聘、客户关系管理系统等，加入大模型企业的生态，成为其一部分，以适应市场变化。