5月25日消息,该领域、OpenBMB开源社区,正式发布并开源其在低比特大模型训练方向的最新成果——BitCPM-CANN。这意味着,未来有望在手机上运行 60B 大模型,手机的智能会大幅提升。据介绍,相比传统 BF16 精度,BitCPM-CANN 在推理时期释放约6倍显存红利,与此同时将模型能力保留率维持在90%–97.2%。该范围内存,可以承载远超以往的模型能力;或者反过来说,同样的模型能力在同一款终端上运行,只需要过去 1/6 的内存。「2-bit」该行业行业的热门研究话题,也是在手机上运行更这一研究卡点之一。这款中国首个该领域华为昇腾实现端到端训练并开源的三值大模型,继5月23日在华为鲲鹏昇腾开这一商讨亮相后,今日正式将其全系列模型向全社会开放。2-bit 量化将模型权重压缩 6-8 倍,使其能存入手机闪存,如 4GB 内存能放 16B,再配合 MoE 与激活范围约束、能放 32B;若内存扩大到 8GB,则能将模型参数扩大到 60B。面壁智能强调,BitCPM-CANN 的亮相,标志着面壁智能高效大模型「小钢炮」在端侧落地的能力进一步跃升,同时也借助开源向中国端侧大模型赛道提交了一份新的答卷。
<