更新换代网

腾讯混元推𳏄.3B端侧模型 内存占用�MB

来源:更新换代网-工人日报
2026-04-28 09:37:19

2�日,腾讯混元宣布正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅񀙚.3B,内存占用�MB。

据介绍,通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct进行 2 比特量化感知训练(QAT)产出,这一模型对比原始精度模型等效参数量降低𱅂倍,并且在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提𴃈—3倍,可大幅提升使用体验。此次腾讯混元推出HY-1.8B-2Bit模型,可以在边缘设备上无压力部署。这也是首个在实񈓢bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在比如手机、耳机或者智能家居设备应用,成为业界难题,尤其不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。

腾讯混元表示,端侧部署的展开,本质上是一条在“小而精,快而准”的艰难探索之路,我们既需要模型足够聪明,能应对千变万化的真实需求,又必须将它约束在极其有限的硬件资源内部署并快速推理,这就好像在给模型进行“减脂增肌,减重提质”。

责任编辑:更新换代网

媒体矩阵


  • 客户端

  • 微信号

  • 微博号

  • 抖音号

客户端

亿万职工的网上家园

马上体验

关于我们|版权声明| 违法和不良信息举报电话:010-84151598 | 网络敲诈和有偿删帖举报电话:010-84151598
Copyright © 2008-2024 by {当前域名}. all rights reserved

扫码关注

更新换代网微信


更新换代网微博


更新换代网抖音


工人日报
客户端
×
分享到微信朋友圈×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。