Sora一夜刷屏,这只是开始!

虽然Sora模型尚未面向公众开放,但是已经有人感叹:视频生产颠覆性革命来了。

胡炜 | 02/18 13:55 | 阅读: A+

文/胡炜 (新京报传媒研究院)

Sora一夜之间刷屏。

作为OpenAI发布的首个AI文(图)生视频模型,Sora带给人们的感受是炸裂级的:根据输入的文字提示,能生成效果逼真的60秒视频,而且是可以一镜到底那种。

这意味着,继文本、图像之后,OpenAI将其先进的AI技术拓展到了视频领域。

虽然Sora模型尚未面向公众开放,但是已经有人感叹:视频生产颠覆性革命来了……

也有人预测:一大批视频从业人员要失业了……

然而,事情就这么简单吗?

 01 
Sora能做什么?

OpenAI在官网陆续公布了几十段长短不一的视频,均根据文字提示生成。

其中第一段视频的文字提示为:

一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。

这一分钟视频在网上广为流传,可以视为Sora的代表作,其展示的信息量极大,从主要人物到背景人物,从远处的街景以及地面,看起来十分逼真,镜头切换也非常流畅自然。

从这张全景画面截图,可以看到和主人公同时走动的路人,湿漉漉的地面,眼花缭乱的霓虹灯和招牌。

图片

再看后面几个特写镜头:女主脸上斑点、脖纹清晰可见,显得非常真实,还有墨镜里的反射的街景,这些细节都没放过。

图片

官网还展示了一条电影预告片,文字提示为:

电影预告片,讲述了 30 岁的太空人戴着红色羊毛针织摩托车头盔的冒险经历,蓝天,盐沙漠,电影风格,用 35 毫米胶片拍摄,色彩鲜艳。

Sora根据提示生成的视频如下:

我们再来看看Sora生成的其他作品:

中国龙年舞龙的视频:

图片

穿过东京郊区的火车窗外的倒影:

图片

赛博朋克背景下机器人的生活故事:

图片

几只巨大的毛茸茸的猛犸象正踏着白雪皑皑的草地走来:

图片

随着Sora发布更多的制作精美的作品,不少人感叹:人类都未必拍得出来!
 
马斯克在X上两次转发网友评论时写道:“AI增强的人类将创造出最好的作品”、“人类认赌服输”。

 02 

Sora牛在什么地方?

这些看上去足可以假乱真的视频,Sora是怎么做到的?

根据OpenAI官方介绍,用户可以通过使用自然语言提示词(Prompt),生成长达1分钟的视频。Sora模型对语言有深刻的理解,因而能够准确地理解提示词,并生成令人信服的人物,而且可以在一个生成的视频中创建多个镜头,在这些镜头中准确地保持角色和视觉风格的一致性。

360创始人周鸿祎对Sora给予了极高的评价,他在社交平台发文:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。

在他看来,Sora只是小试牛刀,它展现的不仅仅是一个视频制作能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。他认为,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。

中央民族大学新闻与传播学院教授郭全中在接受新京报传媒研究采访时说,相比Chatgpt,Sora有了质的飞跃:

一是Sora具备推理能力,人类长期以来孜孜以求的AGI(通用人工智能)成为可能,估计不久之后就会到来,而ChatGPT只是让我们看到了曙光。

二是在当今视频时代,Sora作为图生视频的利器将助力传媒业降本增效,极大地扩大能力范围和能力边界,给传媒业带来的影响远远超过ChatGPT。    

DCCI互联网研究院院长刘兴亮在接受新京报贝壳财经记者采访时表示,Sora模型的发布标志着AI技术在内容创作领域的一个新纪元,“通过简短的文本提示或一张静态图片,Sora能够生成持续一分钟左右的1080P高清视频,涵盖多个角色、不同类型的动作和背景细节等,几乎达到了电影级别的逼真场景。”

他认为,这种能力不仅为内容创作者提供了前所未有的工具,使他们能够以更低的成本和更快的速度将创意变为现实,而且为观众带来了更丰富和多样化的视觉体验。技术创新的这一巨大飞跃,预示着AI在未来人类生活的各个方面都将发挥更加重要的作用。

中国人民大学吴玉章讲席教授、国家发展与战略研究院研究员刘永谋在新京报评论撰文认为,Sora的AI视频效果,几乎和人工拍摄不相上下。也因此,虽不是从0到1的原始创新,却已足够令人震惊。

他预测,未来,各种不同用途的Sora短视频,或许会很快充斥各种视频社交平台,其对现实的影响与改变,不可不谓之巨大。

从业界到学界,几乎是异口同声认为,Sora将会深度改变视频相关领域,从影视、传媒到社交平台,内容生产将会发生巨变。

03 

Sora带来的两大挑战

当然,Sora并非完美,毕竟才刚刚诞生。

OpenAI在官网表示,目前Sora模型也有弱点:

它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。

比如在一个样片中,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,正小心翼翼地挖掘和除尘”,Sora生成的视频出现了椅子变形、自动行走等诡异的场景。

图片

另外,OpenAI还需要花更多精力检查、拦截违反使用政策的文本输入提示,例如极端暴力、色情内容、名人肖像等。

对于传媒从业者来说,则有两大挑战值得思考:一就是对视频内容生产的颠覆,或导致大量人员失业;二就是对新闻传播伦理的挑战,模糊了真实与虚拟的边界。

1. 又有一批人要失业?

刘永谋认为,当前的短视频时代,Sora既然可与人工媲美,制造短视频的专门团队可能就面临下岗危险。要知道,短视频的摄影、导演、剪辑等任务,Sora“一个人”费点电就全包了。

“这可能导致大量的影视等相关行业从业者失业,更是不可忽视的重大社会风险。”

刘永谋在文中提醒,关于AI大规模应用可能引发的失业问题,已经有汗牛充栋的深入研究,也提出了很多应对方案,包括延缓AI技术的应用速度,帮助再就业,征收AI税等。

“现在,Sora一夜刷屏提醒我们,要将这些措施稳步细化实施,而不能再仅仅停留在刷屏上了。”

对于可能导致的部分人员失业,中央民族大学新闻与传播学院教授郭全中在接受新京报传媒研究采访时说:任何创新事物出现,肯定会带来结构性失业,即不能适应创新的人要失业。但是,创新事物也会带来大量新就业机会,关键是看自己能否通过自我提升,与新事物共生共成长。

2. 新闻传播伦理再面临挑战

真实是新闻的生命,但是更多高科技的出现,很多人模糊了真实与虚假的界限。

刘永谋认为,在AI短视频建构的世界中,显然不能将眼睛看到的东西作为判断依据了。Sora的应用,无疑将进一步加剧当代社会的后真相状况,真实与虚拟的边界进一步模糊,甚至完全被消解。“这需要我们高度警惕”。

“不管Sora是否'理解'世界,也不管Sora视频多么逼真,始终仍是数字模拟,而不是真实拍摄的现实。”

郭全中也认为,Sora的出现,会导致视频生产门槛大大降底,新闻伦理肯定会受到很大冲击。

他说,Sora不但会大规模应用于娱乐内容的生产和传播,同样也必然会给新闻生产带来巨大挑战,我们之前的新闻生产方式和流程会被颠覆,新闻的定义也会发生变化,如大量的技术手段应用等。

从新闻传播发展来看,图文时代,都说“有图有真相”,结果发现图可以P;再到视频时代,又有人说“有视频有真相”,结果现在视频也可以AI生成。

郭全中预计,Sora未来更重大的挑战在于会导致假新闻的泛滥,给新闻伦理和新闻治理带来巨大挑战。

此外,刘兴亮还认为,“随着AI生成内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术的健康发展,同时保护个人和社会的利益不受侵害”。

结语:科技尤其是人工智能,还会以什么样的速度改变传媒行业和人类,身处其中,我们既有期待,也有些许忐忑。

推荐阅读