阿里巴巴推出高保真图生视频框架 AtomoVideo ，兼容多种文生图模型

2024 年 3 月 7 日

阿里巴巴 AtomoVideo 研究团队近期提出了一种新的高保真图生视频框架 AtomoVideo，该框架可以从静态图像生成高质量的视频内容，并且能够与各种文生图模型兼容。AtomoVideo 具有高保真度、运动一致性、视频帧预测、兼容性和高语义可控性等特性。该框架以预先训练好的 T2I 模型为基础，通过添加一维时空卷积和注意力模块来提升视频的保真度，同时通过 Cross-Attention 注入高级图像语义，实现更高的图像语义可控性。目前，该框架的论文和演示视频已经发布，但尚未提供在线体验地址，官方 GitHub 账户仅用于网站托管，未上传相关代码。

阿里巴巴推出 AtomoVideo 高保真图生视频框架，兼容多种文生图模型

IT 之家

阿里巴巴推出高保真图生视频框架 AtomoVideo ，兼容多种文生图模型

品玩

阿里巴巴推出 AtomoVideo 高保真图生视频框架，兼容多种文生图模型

凤凰科技

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。