2 月 8 日
苹果公司发布了名为 MGIE 的开源人工智能模型,能根据自然语言指令编辑图像。MGIE 利用多模态大型语言模型 MLLM 解释用户指令并执行像素级操作,能进行 Photoshop 风格的修改、全局照片优化和局部编辑等操作。MGIE 将 MLLMs 集成到图像编辑过程中,通过推导出富有表现力的指令和生成视觉想象力来实现编辑。该模型可以处理各种编辑情况,并可以根据用户偏好执行全局和局部编辑。MGIE 是一个开源项目,用户可以在 GitHub 上找到代码、数据和预训练模型,并提供了一个演示笔记本展示如何使用 MGIE 完成各种编辑任务。
苹果展示 AI 新模型 MGIE,可一句话精修图片
搜狐科技 / IT 之家 / 新浪科技
苹果推出开源 AI 大模型 MGIE,能根据自然语言指令进行多种图像编辑
腾讯网 / 麻省理工科技评论 / 搜狐科技
展开全部报道
话题追踪
2024-04-22
苹果研发设备端大型语言模型,提升 AI 响应与隐私保护2024-04-02
苹果开发出新款 AI:可 「看懂」 屏幕内容并语音回复2024-03-20
摩根大通推测苹果 AI 发展策略:立足本地小模型,管理大语言模型2024-02-08
苹果展示 AI 新模型 MGIE,可一句话精修图片2023-12-25
苹果开放 AI 研究成果,发布多模态 LLM 模型 Ferret2023-12-21
苹果发表论文:在手机内存上运行大模型2023-11-09
消息称苹果正利用大语言模型改造 Siri,有望明年推出2023-09-07
苹果正提高 Siri 「智力」:iOS 18 见,重点改善执行复杂任务能力2023-06-17
苹果新专利获批,暗示 Face ID 将进入 Mac 设备查看更多