最近你要问我什么最火,我可能会毫不犹豫地告诉你:Sora 2。
这玩意以一种不讲武德的姿态,短短7天狂飙62.7万下载量,把前辈GPT都拍在了沙滩上,直接登顶了App Store的榜首。

连奥特曼都亲自下场盖章,说这是创意领域的GPT 3.5时刻。
不过假期的时间那么宝贵,肯定有很多朋友还没详细了解Sora 2有多强。

官方也终于出了一版超详细的Sora 2提示词指南,一出现就传疯了。
今天我就带大家回顾这些天可能错过的重要信息,再总结提炼一下这份抄作业指南,用大白话分享给你。

懂物理了!
还记得 Sora 1刚出来那会儿吗?大家更多是图个新鲜,哇,AI也能做视频了!
酷是挺酷的,但后来回看,那股子AI味实在是太冲了。
但Sora 2,我必须说,它完全是另一个次元的产物。
看到奥特曼和网友们晒出的那些视频时,我惊了。

人物自然的重心转移,衣料迎风摆动的褶皱,甚至连光线的反射,都真实得不像话。
物理规律没有穿帮,声音和画面原生同步,多镜头的叙事也没了之前生硬的割裂感
我感觉我不是在看AI生成的东西,像在看一部经过专业摄影指导精心编排过的短片。
OpenAI在声明里,给Sora 2的定位是“最先进的视频和音频生成模型”。
我觉得他们这次算是谦虚了。
网友们也用Sora 2 App上的奥特曼形象做了各种玩梗视频。


搞得现在大家看到奥特曼真人上播客都有点不习惯了…
还可以生成视频让奥特曼夸夸自己,比如这样:
甚至还有人直接拼接生成了整部短剧。
在我看来,Sora 2最牛的突破,就是对物理世界的精确模拟,似乎真的开始逐渐理解这个真实的世界。

好了,终于到了核心环节。怎么才能让 Sora 2 听懂你的话,生成想要的神级视频?
答案全在他们这份提示词指南里,我给大家提炼其中适合新手的部分,保证让你少走弯路,直接上手,体验一把当AI导演的快乐!

写提示词这事儿,文档里给了个特别形象的比喻:就当是在跟一位从未见过你故事板的电影摄影师沟通。
把细节说得越清楚,Sora 2拍出来的就越接近你想要的。
但反过来,如果故意留些空白,这位摄影师就会即兴发挥,可能会带来意想不到的惊喜。
想精准复刻脑中画面,那就把提示词写得详细再详细。
想来点创意碰撞,那就写得简单点,给模型留出创作空间。
1. 先定好框架:写在提示词之外的硬规矩
有些基础设定,光在提示词里喊是没用的,比如“把视频弄长一点!”。
这些必须在API参数里明确设置好,它们构成了视频的“容器”。
模型 (model):sora-2 或 sora-2-pro
尺寸 (size):比如 1280×720 (横屏), 720×1280 (竖屏)。Pro版支持的分辨率更高。分辨率越高,细节和动态一致性越好。
时长 (seconds):目前支持4、8、12秒。这里有个小技巧:生成两个4秒的短片再剪辑到一起,效果通常比直接生成一个8秒的长镜头要稳定得多。
把这些框架定好,剩下的内容,就全靠提示词来填充了。
2. 提示词的骨架。
对于新手或者想要快速出片的朋友,一个简洁的提示词就足够了。
比如文档中的这个例子:
In a 90s documentary-style interview, an old Swedish man sits in a study and says, “I still remember when I was young.”
(在一次90年代纪录片风格的采访中,一位瑞典老人坐在书房里说道:“我还记得我年轻的时候。”)
这个提示词写得非常聪明:
90s documentary 直接定下了视频的整体风格(影调、镜头感、灯光)。
an old Swedish man sits in a study 描述了主体和场景,但留下了大量细节(长相、年龄、书房样式)让Sora去自由发挥。
and says, “…” 清晰地给出了对话内容。
用这种方法,能稳定地得到符合要求的视频。
虽然可能不完全是想象中的样子(比如没说天气、穿着、机位),但Sora会用它的审美帮我们补全。
如果想追求电影级别的质感,或者需要在多个镜头间保持风格统一,那就可以试试下面这种导演式的写法。就像在给摄影组或特效团队开会,用的是行业术语。
这里直接上一个天花板级别的例子,大家感受一下:
格式与画面风格:时长4秒;180度快门;模拟65毫米胶片对比度;细腻颗粒感…
镜头与滤镜:32毫米/50毫米球面定焦;1/4黑柔滤镜…
调色/色调:高光是干净的晨光带琥珀色;中间调均衡,阴影带青色…
灯光与氛围:左侧低角度自然光(早上7:30);轨道旁有银色反光板补光…
地点与构图:黎明时分的通勤站台;前景是黄色安全线和咖啡杯…
声音 (Sound):仅画内音,微弱的铁轨摩擦声、刹车嘶嘶声、远处模糊的广播…
(由于原文过长,这里仅展示结构,具体细节大家可以参考指南文档)
这种写法把每一个环节都拆解了,从光圈快门到滤镜型号,再到补光方式和声音的响度。
Sora拿到这样的剧本,想拍砸都难。
虽然我们普通玩家不一定需要这么复杂,但这个思路非常值得借鉴,把需求拆解得越细,Sora就越懂你。
一个好的提示词,应该像画分镜脚本一样清晰。
3、想让画面更出彩?记住这几个黄金法则。
不管是简单还是复杂的提示词,还有几个点是共通的,掌握了它们,你的视频质感就能再上一个台阶。
风格先行:先用一句话定下基调。是“1970年代的电影感”,还是“史诗级IMAX航拍”,或是“16毫米黑白纪录片”?先把这个框架搭好,Sora才能在正确的轨道上填充细节。
描述要具体:别说“一条美丽的街道”,要说“湿漉漉的沥青路面、斑马线、霓虹灯的倒影”。别说“快速移动”,要说“慢跑三步,然后在路边停下”。指向具体、可见事物的词语,总能带来更清晰的结果。
用镜头语言思考:广角、低角度能强调空间感;眼平高度的特写则聚焦于情感。浅景深能突出主体,深景深则让前后景都清晰。这些都是可以直接写进提示词里的指令。
光线就是情绪:柔和、温暖的窗光营造温馨,单一、锐利的硬光则带来戏剧张力。与其说“明亮的房间”,不如说“柔和的窗光为主光源,辅以温暖的台灯补光,走廊透出冷色的轮廓光”。
动作要带节奏:“演员走过房间”太空泛了,Sora不知道该怎么走。但如果说“演员向窗户迈出四步,停顿了一下,在最后一秒拉上了窗帘”,这个动作就变得精确、可执行了。
本篇文章来源于: 优设AIGC
评论列表 (0条):
加载更多评论 Loading...