3 月 7 日
阿里巴巴 AtomoVideo 研究团队近期提出了一种新的高保真图生视频框架 AtomoVideo,该框架可以从静态图像生成高质量的视频内容,并且能够与各种文生图模型兼容。AtomoVideo 具有高保真度、运动一致性、视频帧预测、兼容性和高语义可控性等特性。该框架以预先训练好的 T2I 模型为基础,通过添加一维时空卷积和注意力模块来提升视频的保真度,同时通过 Cross-Attention 注入高级图像语义,实现更高的图像语义可控性。目前,该框架的论文和演示视频已经发布,但尚未提供在线体验地址,官方 GitHub 账户仅用于网站托管,未上传相关代码。
话题追踪
2024-03-08
阿里巴巴集团 CEO 吴泳铭:通义千问正加快追赶 GPT-42024-03-07
阿里巴巴推出高保真图生视频框架 AtomoVideo ,兼容多种文生图模型2023-11-09
阿里巴巴 CEO 吴泳铭:即将开源国内最大的 720 亿参数大模型2023-08-18
阿里将推出大模型数学工具 MindOpt Copilot2023-07-31
阿里达摩院推出 AI 框架 HQTrack,可实现视频高质量跟踪2021-07-12
阿里云视频云全景创新峰会落幕2020-07-29
6813 个户型,细节丰富,阿里巴巴联合学界开源大型 3D 场景数据集2020-06-24
阿里获 CVPR 2020 四项世界冠军,新研究实现像素级视频分割2019-05-28
印度短视频应用 VMate 获阿里巴巴亿级美元投资