12月10日凌晨,OpenAI的12天特别活动的第3天,备受外界期待的视频生成工具Sora终于正式登场。
Sora的首次预告是在2月16日,当时OpenAI提供了数十个演示视频,展示了一个令人惊叹的未来:任何人都可以通过在计算机程序中输入简单的文本提示来制作高质量的短片。
然而,在随后的300天内,Sora始终停留在预告阶段,未能面世。而在这期间,包括Meta、谷歌和亚马逊在内的几家大型科技公司都展示了自己的视频生成模型,国内的可灵和海螺也在海外大放异彩,成为外网一度讨论最热烈的视频生成模型。
采用最新发布的Sora Turbo,用户可以通过文字、图像或其他视频素材,生成长达20秒的视频。目前,该工具已在美国和其他部分市场面向ChatGPT Plus和Pro用户开放。
Sora官网上线后,用户蜂拥而入,火爆的需求很快就导致网站崩溃,公司CEO山姆·奥尔特曼(Sam Altman)表示:“我们严重低估了Sora的需求,要让每个人都能访问还需要一段时间。”
而拿到访问权限的用户也在网上陆续分享Sora生成的视频,不难看出,Sora还是有不少惊喜,但有用户也反馈称,Sora对物理规律的理解并不够好,仍会出现人的手部不自然、文字乱码、动物跑着跑着就飞起来等情况。
目前,http://sora.com网站已经上线,美国及其他市场的ChatGPT付费用户可以通过该网站开始使用Sora,但在欧洲大部分地区和英国还需要一段时间才能使用。相比最初预告的Sora版本,Sora Turbo模型增加了文本生成视频、动画图像和混合视频等功能。
OpenAI表示,ChatGPT Plus订阅用户可以生成最多50个视频,分辨率最高可达720p,时长为5秒。而通过上周推出的“史上最贵”的、每月收费200美元的ChatGPT Pro服务,用户最多可以生成500个视频,可以同时生成5个视频,时长为20秒,分辨率最高为1080p,并且,订阅者可以下载没有水印的视频。
OpenAI重点介绍了一项名为“故事板”的功能,该功能可让用户根据一系列提示生成视频,以及将照片转换为视频。OpenAI还演示了一个“混合”工具,可让您使用文本提示调整Sora的输出,还可以将两个场景“混合”在一起生成一个新的场景。
针对之前一直被提及的安全问题,OpenAI表示,使用Sora生成的视频将带有可见的水印和C2PA元数据,以表明它们是使用AI制作的。在将图像或视频上传到Sora之前,OpenAI会提示您勾选一项协议,该协议规定您上传的内容不包含未成年人、露骨或暴力内容以及受版权保护的材料。OpenAI表示,“滥用媒体上传”可能会导致帐户被禁止或暂停。
Sora的产品负责人Rohan Sahai表示:“我们面临着巨大的压力,我们希望防止Sora的非法活动,但我们也希望在创造性表达与非法活动之间取得平衡。”
奥尔特曼在直播中表示,对于OpenAI而言,Sora不仅仅是一项技术,更是一种赋能创意人士的工具。在OpenAI的文化基因中,用AI激发人类创造力也很重要。通过Sora,OpenAI看到了AI和人类共同创造的全新协作模式。文本曾是人机交互主要形式,但他们坚信这远远不够,视频能够传递更多的情感和细节。同时,Sora对于OpenAI而言,不仅仅是一个视频生成工具,更是AGI(通用人工智能)之路的重要里程碑。
会不会再过几年放一部小说进去能输出影视剧了 传统影视圈的狼终于来了。。。。。。