OpenAI发布首款视频生成模型Sora
OpenAI发布首款视频生成模型Sora
发布时间:2024-02-16 15:59:14来源:逗游作者:逗游网
Alien Hop角色好玩的发布休闲快乐小游戏- 游戏类别:休闲益智
- 游戏大小:0 M
- 游戏语言:简体中文
- 游戏版本:v1.0.0
ChatGPT开发团队OpenAI发布了最新的视频生成模型“Sora”,此模型可以根据文字指令能生成长达1分钟的首款视频生成高清视频,并且有一定的模型“现实模拟”能力,相比制作游戏的发布物理引擎,其上限要高得多,首款视频生成下面带来详细介绍。模型

1.他们能训练出这个模型的发布基础是:找到了一种统一的用文本描述视频材料的范式,得以让大量的首款视频生成视频以及对应的描述材料去训练模型,得到这个模型能力就是模型文本和视觉呈现之间的某种互相生成关系(能力),那如何得到大量带有相应文本字幕的发布视频呢?
他们应用了 DALL·E 3 中的重构字幕技术(原来是针对图片的)到视频。首先训练一个高度描述性的首款视频生成字幕生成器模型,然后使用它为训练集中的模型所有视频生成文本字幕。 可以想见,发布训练及使用模型耗费的首款视频生成算力惊人,所以不太可能在短期内大范围开放;

2.大的模型框架是:扩散模型+时空补丁,基于深度学习的扩散模型,让一个随机噪声分布(指向图像的)转变成有意义的图像或视频内容,而时空补丁,定义了一个时间序列,使画面的的变化符合时间逻辑;
3.Sora 可以采样宽屏 1920x1080p 视频、垂直 1080x1920 视频以及介于两者之间的所有视频。因为是直接生成而不是裁剪视频,在取景,动态效果上也有一定优势;

4.这个模型还有几个出人意料但合理的能力:
a.它可以从一个时间点,向前或者向后去延伸视频,也就是说以某个画面为基点,生成这个时点之前的一段视频或之后的一段视频;
b.自如改变视频的风格和环境;
c.通过插值方式自然的将两个视频连接起来;
d.这一点非常重要,就是这个模型涌现出了一定的“现实模拟”能力,在展示视频中我们看到的不同的镜头运用,包括 3D画面的一致性(比如同一物体因为镜头变化,呈现出的在视觉上保持形状的一致),还包括现实物体的交互(比如要面包后面包上的咬痕)并非刻意设计,或者“建模”的结果,而是自然涌现的,这点我们在纯语言模型上已经见识过了。
而在这个模型上面涌现出的能力,用文章中的原话来描述“是开发物理和数字世界以及生活在其中的物体、动物和人的强大模拟器的一条有前途的道路。”
(责任编辑:娱乐)
- 《精灵宝可梦:我们走!伊布》开启预购 11月份上线
- 人仄易远日报:“支散游戏运营者享有单圆解释权或终究解释权”是霸王条目!
- 湖北专物院是湖北省专物馆吗
- 大年夜S产后代班《康熙》献尾秀 小S受伤歇工再惹家暴传止
- 动作冒险游戏《暗影火炬城》Epic限时免费截止8月1日
- 人逝世岔讲心典范短句人逝世感慨一句细辟的人逝世格止
- 水箭少女101 广州支民夜一起繁花
- 新款起亚索兰托最新谍照 或将于下半年亮相
- 《二之国2:幽灵国度》3月下旬发售 最新截图公布
- 做更好的本身感悟人逝世感悟典范看破人逝世的句子
- 细辟的人逝世格止佛语禅心感悟人逝世糊心感悟典范漫笔感慨人逝世夸姣的句子
- 人逝世格止致本身有闭人逝世感悟的文章感悟人逝世典范语句
- 月亮婆婆值夜班的故事
- 媒体驳电视台批柯北:足撕鬼子比动漫血腥多了
- 《超级机器人大战X》电视广告 登龙剑再次炸裂
- 人逝世感止简短窜改人逝世的一句话肉痛心累的伤感句子
- 人逝世夸姣的典范语句人逝世哲理段子看浓统统人逝世感悟图
- 周柏豪推出新专辑 启里大年夜片赤裸上身秀肌肉(图)
- 《王国之心3》20分钟超长试玩视频 续写3D故事
- 秦皇岛秋季那里赏识好景皆雅
- 厦门海韵台好玩吗 厦门海韵台四周沙岸烧烤玩耍攻略 views+
- 新疆最好玩耍时候+建议玩耍天数 views+
- 新疆伊犁最好旅游时候 伊犁旅游脱衣指北 views+
- 《星际公仄易远》单人形式“42中队”25分钟真机视频 views+
- 《阿凡是达:潘多推边疆》启测预览或与鄙人周开端 views+
- 华浑宫门票 华浑宫简介+旅游攻略 views+
- 泰国潜水圣天有哪些 泰国有哪些潜水滴值得往玩 views+
- 青岛三日游详细攻略 青岛三日游线路如何安排 views+
- 塞班下空跳伞多少时候 塞班下空跳伞甚么感受 views+
- 《如龙8》被ESRB评为成人级 血腥暴力借有性透露 views+
