日前,Open AI的Sora团队在一档播客节目中接受采访,透露Sora模型可能的发布时间。他们表示,目前Sora还处于研究和优化阶段,暂时不会面向公众,仅对部分行业专业人士开放。
不过,最近OpenAI CTO(OpenAI首席技术官)Mira Murati在接受华尔街日报科技专栏作家采访时透露到,预计在今年内会正式面向全世界推出Sora,但也需要等几个月。
小编不禁悄悄疑惑,在今年2月19日,一经上线便引起业内轰动的文生视频模型,为何迟迟不向公众开放?
要知道Sora模型生成的视频在视频时长、内容逻辑、画面连贯方面,都远超市场上已有的文生视频模型,获得了众多影像、动画、游戏制作行业的关注,在短视频平台上更是获得了一大波的热度。
PS:关于Sora模型详细的优劣势分析,感兴趣的伙伴可以戳以下文章阅读!
Sora的火爆程度,在Open AI入驻TikTok平台的表现中得到验证。使用Sora生成的视频发布后的短短四天就获得50万赞,Open AI的TikTok账号也涨粉10万。时间线拉到3月14日,Open AI在TikTok平台上已经累积了23.5万的粉丝和140万点赞量,影响力不可小觑。
既然如此,如此强大的文生视频模型,还有哪些需要优化的地方吗?
的确有的!
Sora模型优化方向一:提升模型安全性
正是由于Sora模型极其强大,为防止被有心之人利用危害社会,Sora模型正式发布之前,“需要听听安全专家的一键,如何让这项技术对世界安全。”Open AI的Sora项目研究负责人Tim Brooks表示。同时,OpenAI CTO Mira Murati也表示,Open AI正在和艺术家合作来平衡Sora模型创作视频的边界线,比如裸露内容等。
另一方面,Sora生成的视频真实度极高,足以达到以假乱真的效果,人们担心虚拟视频会混淆视听,造成错误认知。对于这方面的技术优化,Open AI CTO接受记者采访时提到,Sora生成的视频需要嵌入数字水印以便溯源。
Sora模型优化方向二:优化Sora推理所需算力
在生成式人工智能领域,视频生成模型的训练和推理的过程中,对算力的需求远大于图片和文本生成模型。Open AI CTO在接受记者采访时表示,“ChatGPT和DALLE是针对公众使用优化之后的产品,而 Sora目前只是研究成果,消耗非常非常多的算力(much much more expensive),OpenAI 还需要优化Sora模型所需的资源。”
据悉,在Sora发布的一段时间后,OpenAI创始人奥特曼正在从中东地区筹集高达7万亿美元的资金,以支持公司的一项半导体计划,减少训练人工智能在算力资源方面投入的巨额成本。要知道,OpenAI旗下的ChatGPT-4都有对话数量限制,可见Open AI能开放给公众的算力非常有限,如果将来Sora模型面向全世界的用户,OpenAI需要确保Sora模型推理所需的算力资源能进一步优化,或者有足够多的算力以提供给Sora用户使用。
在算力资源稀缺的时代,人工智能企业、大模型开发者和使用者需要巨大的算力支持,在今天算力云平台为有算力需求的用户提供了一个免费获得算力资源的通道,仅需在百家号等新媒体平台宣传算力云,即可获得超高天花板的体验金,用来购买算力资源。
Sora模型优化方向三:提高用户在视频生成中的参与度
Sora模型是通过用户输入文本提示,生成虚拟视频。然而,模型生成的视频并不能百分百符合用户需求,甚至不符合物理世界的逻辑。因此在Sora模型发布之初,许多早期用户的反馈便是:希望对视频生成有更多的控制,而不仅仅是文本提示。
针对此类反馈,Open AI正在计划添加用户编辑Sora生成视频的功能,帮助用户在Sora生成视频的基础上进行二次创作,获得更好的视频效果和准确的内容表达。另外,OpenAI还计划在Sora中加入音频生成功能,让生成的视频拥有更加沉浸式的表现。
今日的人工智能行业知识分享到这,欢迎评论参与互动!