就在刚刚,Vidu Q2 终于放出了它真正的王炸功能「参考生」!
我们暂且不说新功能,就说 Vidu Q2 这个模型,本身文戏人物微表情和情绪就很到位,而且武戏也非常能打。
现在,Vidu 把它的看家本领「参考生」功能,正式升级搭载到了这个演技炸裂的新模型上。
说起参考生,Vidu 才是真正的开创者,早在去年9月,它在全球首次提出了这个概念。
这次升级,就等于给一个天赋异禀的顶级演员,配上了经验老道的金牌导演。它的核心,就是来解决 AI 视频最头疼,也最关键的一致性问题。
为什么我敢说它是王炸?
因为它能同时理解多达 7 个不同类型的参考图,而目前的 Sora 2,只支持1个。

它意味着,你对画面的控制力,达到了前所未有的程度。 内容可控、语义可懂、多主体保持一致。
接下来,我们就把这个参考生功能,掰开揉碎了聊。

杀手锏
我们先用人话解释一下,参考生到底是个啥。
早期的 AI 视频,就像开盲盒。
你输入一段文字,AI给你生成什么,全凭运气。但参考生功能,彻底解决了这个问题,你可以直接扔给 AI 参考图。
比如,一个特定长相的演员,一个你们公司设计的 IP 形象,或者一款刚上市的新品。
AI 会精准识别这张图里的核心元素,并让它在视频里动起来。
而且,最新版的 Vidu Q2,生成的视频时长已经可以达到8秒,主体的连贯性和画质效果表现非常好。

我们来看一个具体的案例,你就懂了。
假设,我们想给一个新上市的咖啡品牌,做一条广告片。
传统方式,得组建团队、找演员、租场地、拍摄、剪辑,一套下来,没个十天半月搞不定。
现在用 Vidu Q2 参考生怎么做?
第一步,我们上传一张女主角的照片。
第二步,上传一张咖啡产品的特写图。
第三步,再上传一张巴黎街头咖啡馆的场景图。

然后,输入一句话指令。Vidu 有个独创玩法,直接@图片或者将提示词框中的「图1」、「图2」、「图3」标签拖到词组对应的区域即可精准控制。

Vidu Q2 会把这三个你指定的元素,完美融合在一个视频里。
女主角就是你选的那个演员,产品就是你的那款咖啡,场景就是你想要的巴黎风情。 人物、产品、场景,三者都牢牢锁定,精准可控。
整个过程,可能只需要几十秒。(据悉,Vidu Q2 在内容一致性进一步提升的同时,其推理生成的速度对比上个版本 的 Vidu Q1 参考生提升3倍,价格也更加优惠。)
这就是参考生功能的威力,它让视频创作的门槛,从专业级,一下子降到了人人可玩的程度。
这背后,是AI对画面语义的深度理解。
它知道哪个是人,哪个是物,哪个是背景。 并且能让这些元素在动态的视频里,始终保持高水准的一致性和稳定性。
对于电商、广告、动画这些行业从业者而言,简直太爽了。
内容生产的效率,将迎来一次史诗级的提升。
我们先拿电商举个例子,这个感受最直接。
假设我们要推广一款降噪耳机。
我们只需要上传两张图:一张品牌代言人的高清半身照,和一张耳机的产品精修图。

我们甚至不需要准备场景图。 直接用提示词告诉 Vidu 这段视频呈现的是什么效果。

瞬间,Vidu 就为我们生成了一段质感堪比电影的广告片。 代言人形象完美还原,产品无缝融入。
但这还只是开始。除了故事片,电商还需要纯粹、高级的产品渲染视频。Vidu Q2 参考生同样能轻松搞定,而且方式更简单。
这一次,我们只上传一张图:就是那张耳机的产品精修图。然后用提示词,让 AI 生成产品渲染图。

Vidu 几乎是凭空将一张 2D 的平面产品图,变成了一段拥有流畅动态、高级光影的3D渲染视频。
这意味着什么?
想象一下,在过去,完成我们刚刚做的这两段视频,至少需要一个导演团队、摄影师、灯光师、场景搭建、再加上一个专业的三维动画师,前后花费数周时间。
而现在,只需要一个运营人员,拿着代言人和产品的两张图,一个下午就能全部搞定。
不只是效率提升了10%或20%,这是对整个电商内容生产流程的彻底颠覆。
聊完电商,我们再看看它对内容创作,尤其是短剧国漫行业的赋能。
国漫修仙题材,一直是大热门,但制作门槛非常高。 一个角色御剑飞行的几秒钟镜头,背后可能是动画师数十个小时的辛勤工作。
现在,情况完全不同了。 创作者只需要把自己的角色设计稿、仙气缭绕的场景原画,作为参考图输入给 Vidu Q2 参考生。

然后输入指令,我们还可以将「AI 配音」功能打开(目前ViduQ2已支持音视频同出功能,可自由选择生成人声/音效)。

Vidu Q2 不仅能生成一段极具东方美学神韵的动画短片,它还会自动匹配上低沉的雷鸣和能量的嗡鸣声,一个有声有色的电影级片段瞬间完成。
如果说宏大场面是国漫的骨架,那细腻的人物互动就是国漫的灵魂。这一点,Vidu Q2 同样能驾驭,而且方式更简单。
这一次,我们只上传男主角和女主角两张角色图,不提供任何场景。 我们用提示词描述一个互动场景。

Vidu 凭空生成了意境宏大的璀璨星空,还精准还原了两个角色的形象。
单人特效、多人互动,角色的形象、服装,场景的画风,都能保持高度的一致性。
这等于直接打通了从原画设定到动画成片的关键环节。
对于无数拥有好故事,但缺乏资金和技术团队的独立创作者来说,这扇门,终于被打开了。
一个全民创作优质国漫的时代,真的不远了。

参考生功能让视频内容精准可控,而 Vidu 的另一个新功能「视频延长」,解决了视频叙事连贯性的问题。
AI 视频的一大痛点,就是时长太短。几秒钟的片段,很难讲好一个完整的故事。
而 Vidu 也很好地解决了这个问题,它搭载的视频延长模式,让故事可以被完整地讲述出来。

我们可以通过两个场景,来直观感受它的强大之处。
比如在一个动漫片段里,输入的指令是:两个小孩将手中的杯子放下,起身向屋外走去。

在生成的续写片段里,两个小孩的形象、服饰、包括周围的环境,都保持了惊人的一致性。 从放下杯子,到转身,再到迈步,整个动作自然连贯,没有任何的突兀感。
这证明 Vidu 延长功能对人物主体和动作的理解非常到位。
而在另一个更复杂的动画场景里,挑战升级了。 原始视频是一段8秒的动画:男子在欢呼声中将棒球扔出去。
然后,让 AI 进行延长,指令里特别加了一句:镜头跟随棒球。
最终,原来生成的8秒视频,在「延长功能」选项中选择延长6秒后,视频被完美地延长到了14秒。
① 它精准还原了棒球飞行的物理轨迹,那个弧线非常真实。
② 第二,也是更关键的,AI 竟然真的理解了「镜头跟随」这种影视语言。

这也说明 Vidu 延长功能不只生成画面,AI 还像一位专业的摄影师理解如何拍摄画面,这一点就非常夸张了…
更夸张的是,它的延长功能,还给了你导演级别的剪辑权。
它允许你把一段生成的视频,看作一条可以随意剪开的时间线。你可以从中间截取最精彩的几秒,从这里,让 AI 给你一个新的故事分支。

而且,这个功能还针对不同用户群体,设定阶梯式的视频时长上限:
① 免费用户最长可延长至30秒。
② 标准版用户上限为1分钟。
③ 专业版用户可延长至3分钟。
④ 而为深度创作者设计的旗舰版用户,则最高可享有5分钟的延长权限。
但真正的王牌,其实是这套组合拳:「参考生」+「视频延长」功能,前者保证主体像不像,后者决定视频够不够完整。
未来,我们完全可以期待,通过不断地延长和组合,用 AI 生成一部拥有完整情节的动画片,甚至一部微电影。
人人都是导演的可能性,被无限放大了…

全新升级的 Vidu App
聊完了技术,我们再来看看产品。这也是 Vidu 这次升级,最让我惊喜的地方。
最近很多人都在聊 Sora 2 的App,说它是 AI 版的抖音。而拥有丰富国产元素的Vidu或许更值得期待。
打开最新版Vidu AI App,你会立刻进入一个沉浸式的视频 Feed 流。
对,就是我们最熟悉的那种上下刷的模式。

这个设计,彻底打通了内容生产、互动和内容分发三个环节。
你在这里,可以边刷别人的作品寻找灵感,边进行自己的创作,然后一键发布,无缝衔接。
看到好的作品,可以直接把它作为参考,进行二次创作,玩转与不同角色、场景的合拍,整个社区的创意就像滚雪球一样,越滚越大。
创作、社交、分发,被完美地融合在了一起。

在规划上, Vidu 想得更深一层。它从一开始,瞄准的就是一个完整的 AI 原生内容生态。
在这里,每个人既是创作者,也是消费者,更是传播者。
这种 AI 原生、生态先行的思路,才是它真正可怕的护城河。
毫无疑问,Vidu Q2 的这次亮相,给整个 AI 视频行业,都带来了巨大的震撼。
精准的「参考生」,强大的延长功能,以及一个完整的App生态,很清晰地指出了AI视频的下一个进化方向:
真正好用、人人可用的生产力工具。
现在,这个能力已经向所有人开放。升级后的参考生功能,已经正式登陆 Vidu Q2 模型,网页端和全新升级的 App 均可使用,无需等待,即刻体验。
地址在这:
vidu.cn
还可以去各大应用平台下载Vidu AI APP,体验全新的AI内容社交方式。

Vidu提供的,不仅仅是领先的技术,更是让创意自由流动、碰撞、再生的全新内容生态。
将创造的权力,真正交还到大家手里。
如果让你来当导演,你最想创作一个什么样的故事?
本篇文章来源于: 优设AIGC
评论列表 (0条):
加载更多评论 Loading...