华为技术有限公司公开了一项关于人工智能模型量化的新专利。该专利通过将量化矩阵分割成多个分块量化矩阵,并基于计算单元的处理粒度进行量化处理,以减少 AI 模型占用的内存。量化矩阵可以是权重矩阵或激活矩阵,且该方法可以实现对权重矩阵和激活矩阵的实时量化。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验
分享