开云体育包括能径直生成长镜头、追焦、转场等效能-开云(中国大陆) Kaiyun·官方网站

发布日期：2024-06-09 13:21 点击次数：146

只需一段笔墨领导就能生成一段传神视频开云体育，本岁首，文生视频大模子Sora在巨匠东说念主工智能业表里激发平淡暖热。27日，2024中关村论坛年会上初次发布我国自研的具“万古长、高一致性、高动态性”特质的文生视频大模子Vidu。

记者从会上获悉，这一视频大模子由清华大学结合北京生数科技有限公司共同研发，可左证文本面孔径直生成长达16秒、分辩率高达1080P的高清视频本质，不仅能模拟信得过物理天下，还领有丰富念念象力。

清华大学东说念主工智能参议院副院长、生数科技首席科学家朱军说，现时国内视频大模子的生成视频时长大多为4秒傍边，Vidu则可罢了一次性生成16秒的视频时长。同期，视频画面能保执连流露顺，跟着镜头转移，东说念主物和场景在时期、空间中能保执高一致性。

在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简易的推、拉、移等固定镜头，而是能在一段画面里罢了前景、近景、中景、特写等不同镜头的切换，包括能径直生成长镜头、追焦、转场等效能。

“Vidu能模拟信得过物理天下，生成细节复杂且相宜物理功令的场景，举例合理的光影效能、雅致的东说念主物色彩等，还能创造出具有深度和复杂性的超现实目的本质。”朱军先容，由于遴选“一步到位”的生成情势，视频片断从新到尾勾搭生成，莫得显著的插帧气候。

此外，Vidu还可生成如熊猫、龙等形象。

据悉，Vidu的本领冲破源于团队在机器学习和多模态大模子方面的永远积贮，其中枢本领架构由团队早在2022年就提议并执续开展自主研发。“行为一款通用视觉模子，咱们服气，Vidu已往能相沿生成愈加千般化、更万古长的视频本质，探索不同的生成任务，其机动架构也将兼容更平淡的模态，进一步拓展多模态通用技艺的界限。”朱军说。

上一篇：开云体育有幸成为咱们国度首位天际溜达的女航天员-开云(中国大陆) Kaiyun·官方网站

下一篇：开云体育(中国)官方网站不仅曾获中国民间文艺最高奖山花奖-开云(中国大陆) Kaiyun·官方网站