一、开发者大会引领AI应用新生态,大模型迭代转向应用侧探索
开发者大会APP生态:构建流量分发新范式:OpenAI开发者大会推出的APP类似微信小程序或苹果AppStore的流量分发机制。目前有11位业内知名合作伙伴,如Uber、TripAdvisor等。基于MCP协议,能快速对接大模型企业与业内产品的应用逻辑和界面,不仅局限于简单交互对话,返回内容拓展,如选旅游目的地可返回相关美食酒店照片等,该生态已较为成熟,想象空间巨大。
AI应用趋势:大模型迭代趋缓,应用侧探索加速:大模型本身迭代趋缓,主要在知识更新、降本增效和推理方式上有明确路子,在超级人工智能基于物理规律的探索有更多分支问题。而应用侧探索更多,如通过开发者生态或推出C端产品进行迭代,SoraAPP就是探索过程,但不会短时间成为如TikTok般的巨大社交产品。
二、AI开发工具革新,大幅提升编程效率与应用构建速度
AIagent插件:实现拖拽式编程,人效提升超20倍:OpenAI的AIagent插件实现了拖拽式编程方式,在发布会上现场示例显示,一人能在不到7分钟内做出可部署且完全跑通的应用,而人工正常做最快需三个人一周时间,人效提升20倍以上。它面向智能体交互界面,能加速应用市场繁荣和B端企业构建AI应用的速度。
CodeX工具:为通用人工智能奠定代码基础:CodeX工具背后逻辑认为通用AI或超级人工智能离不开代码。当遇到如供给级不够、数据权限不够等问题时,可通过代码解决,它为巨型智能、自动驾驶和通用人工智能等做准备,面向更高级的通用人工智能方向。
三、Sora2重塑视频生成格局,多领域应用前景广阔
Sora2产品背景与改进:解决视频生成时长难题:Sora2分为普通版和PRO版,做了差异化定价。它与提供高质量视频的数据企业合作,研发时解决了视频生成时长问题,如训练时让视频有3-5秒重叠,以应对短视频或短剧场景下视频模型生成时长拓展效果变差的问题。
Sora2应用场景与市场竞争:多领域显价值,与VU3持续竞争:Sora2在电商、品牌广告、创意视频、教育等领域有较大应用价值,如满足教育培训场景中讲师复用需求。它与谷歌的VU3类似,都主打视频真实性和音频同步,但在单次视频时长、分辨率、原声音频等方面各有优劣,价格上Sora2单次付费,VU3按月付费且较贵。未来二者会在视频生成领域持续竞争,Sora2可能寻求与Talk等合作,且降价后面向C端的作用会更出众。
Sora2对国内市场影响:C端B端均有机会,国内生成方式待变革:Sora2对国内市场,C端可助力快速做出社交媒体爆款,B端在AI带货信息流、AI短剧等领域有机会,如可实现每天制作几百条换脸不同风格的视频。但Sora2目前价格昂贵,模型还有提升空间,国内行业之前习惯的图片转视频生成方式后期需更改。
四、行业竞争加剧,企业需积极应对新挑战
Sora对其他产品冲击:分走部分预算,各有优劣难占优:Sora推出可能会分走可林、VU3等的部分预算。Sora在原声音频、物理一致性方面比可林强,但分辨率可能低一点,生成速度慢一些,风格上与可林各有特点,整体在企业场景客户中未必占优。
软件企业应对策略:变身入口类模块,提前布局应对挑战:OpenAI下场做应用,其SDK等工具可能影响软件企业,尤其是国外软件企业生态。软件企业可将自己变成GMCP的可比较模块,成为别人的入口类东西,提前布局以应对影响。
Q&A
Q1:大模型发布众多工具和APP,是否意味着大模型的迭代,模型能力本身的迭代越来越趋缓,未来所有模型厂商是否会把资源往应用端去进行配置,对本身大模型行业的发展有什么指导性意义?

A1:现在的趋势是大模型本身迭代会减慢,模型本身学到的知识已基本饱和,主要的迭代集中在知识更新、推理速度的降本增效、推理方式(预训练和后训练)上。在testtime阶段,通过算力自适应与模型做对应生成的领域探索方向较为明确,探索空间不大。不过,在与超级人工智能结合、基于物理规律的探索领域还有较多可挖掘之处。而应用侧的探索会更多,无论是通过开发者生态推动应用迭代,还是推出C端产品进行迭代,都是可行的探索方向。例如Sora的APP就是一个探索过程,但它不会短时间成为像TikTok那样的巨大社交产品。这意味着未来模型厂商可能会将更多资源配置到应用端,对大模型行业而言,发展方向会更加侧重于应用领域的拓展。
Q2:可林海外业务会不会受到Sora的冲击?
A2:可林海外业务可能会受到Sora的冲击。可林采用工具加场景的方式,适合想通过AI做视频的企业,它既提供丰富工具,又能将产品转化为场景,弥补用户对工具不了解的不足。而Sora推出后降低了视频生成门槛,可能会分走可林一部分预算。在与可林的对比中,Sora在原声音频、物理一致性方面更强,但分辨率可能低一点,生成速度慢一些,风格方面与可林打成平手。不过,Sora价格比可林高出好几倍,可林目前的生产方式符合用户对视频生成精确控制一致性的要求,能较好地保持画面一致性和精确控制,且价格便宜。因此,短期内用户不会大面积切换到Sora,但会去尝试。长期来看,可林等几家企业实力都不弱,可林的原声音频功能也即将上线,与Sora的差距会缩小。
Q3:您怎么看Sora2和GPT-3.5的对比?快手这一波到底是利好还是利空,是否看好快手?
A3:文本未提及Sora2和GPT-3.5的对比内容;看好快手,因为视频生成领域难以一家独大,可林等几家企业实力循环轮回,都不弱。
Q4:Sora2的出现给国内视频处理行业带来怎样的发展机遇?
A4:Sora2的出现给国内视频处理行业带来的发展机遇需从C端和B端分别分析。C端用户希望快速制作出10-30秒左右的社交媒体爆款,Sora2的肖像替换功能容易产生爆款逻辑,能满足C端快速落地的需求。B端对版权、价格、计费模式和一致性更为敏感,Sora2价格昂贵,虽模型较优秀,但仍存在一些bug。在国内,Sora2可应用于多个领域:一是在AI带货信息流领域,能使带货视频更加真实,可快速制作大量不同风格的视频;二是在AI短剧领域会出现不错的机会;三是在垂直领域,如房产、金融、加密货币等领域,可利用Sora2的prompt工作流导出相关内容。总体而言,Sora2带来的机遇可归纳为四个方向:垂直领域的视频配置细分领域、短剧及造梗流行、肖像或声音替换、定制化赋能。
Q5:Sora的出现对影视行业是否有深远影响,尤其是AI短剧和AI电影方向?
A5:Sora的出现对影视行业有深远影响。早期AI只能制作很短的切片,到VU3出现能制作1-3分钟的预告类片子,Sora的出现进一步推动了影视行业的发展,能减少分镜师的工作量。此前的视频工具在多镜头一致性上存在欠缺,而Sora在多镜头层面表现出色,与很多知名影视公司和大师合作进行影视及动画领域的探索,目前已接近替代预告片。对于AI短剧,制作三五分钟的短剧不是问题,发展前景较好;而完全的电影化生成还需等待技术进一步发展。
Q6:OpenAI自己下场做应用、APP,后面有可能会做浏览器,怎么看未来它可能潜在的下场去做的一些应用方向?
A6:OpenAI一直试图培养用户习惯,从最初的插件形态到后来将大模型融合,不断改变用户与模型的交互方式。虽然近期在基础模型领域进展较慢,但它通过推出新的产品和功能,逐渐让用户形成依赖。OpenAI想把自己做成一个大的入口,未来可能会继续扩大入口规模,不仅局限于手机APP或网页入口,还可能拓展到硬件入口,如眼镜、耳机等。它会继续进行产品探索,加强与企业的联动,包括社交领域,以进一步培养用户习惯,让用户更加依赖其产品。
Q7:大模型企业在未来生态中吞噬一些软件企业,b端的软件企业是否会受到影响,生存空间是否会受到挤压,怎么看待大模型吞噬软件这个观点?
A7:大模型企业的发展会对B端软件企业产生影响。从去年到今年,企业推ToB解决方案的方式发生了变化。过去国内企业需要通过cos平台先演示流程,客户满意后再开发;现在OpenAI提供了完善的SDK和agent,企业可以直接使用,省略了中间的开发环节。对于国外软件生态,这种影响更为明显,因为OpenAI在接入数据等方面具有巨大优势,接入合作伙伴多且成本低。对于B端软件企业而言,生存空间会受到一定挤压。不过,软件企业可以采取应对措施,将自己变成入口类的东西,比如将业务封装成标准的模块,如招聘、客户关系管理系统等,加入大模型企业的生态,成为其一部分,以适应市场变化。
本篇文章来源于: 风口报告
评论列表 (0条):
加载更多评论 Loading...