智谱技术团队发布开源文生图模型 CogView3 及其升级版 CogView3-Plus-3B,后者基于 DiT 框架和 Zero-SNR 扩散噪声调度,提高了性能并降低了训练推理成本。CogView3 通过三级扩散过程生成图像,分辨率从 512x512 逐级提高至 2048x2048。该模型在人工评估中表现优于 SDXL 模型,推理时间仅为后者的十分之一。模型已集成至 「智谱清言」 App。开源仓库及模型已发布于 github 和 Hugging Face。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验
分享