威尼斯人营救33种谈话！腾讯混元推出极致量化压缩版块翻译模子

发布时间：2026-05-10 浏览次数：181 来源：未知作者：admin

智通财经APP获悉，4月29日，腾讯混元推出极致量化压缩版块翻译模子 Hy-MT1.5-1.8B-1.25bit，把营救 33 种谈话的翻译大模子压缩至 440MB，无需联网，下载即可径直在手机土产货运转，翻译质料优于谷歌翻译。

基于混元翻译大模子Hy-MT1.5打造，翻译成果并列商用翻译模子

Hy-MT1.5 是腾讯混元团队打造的专科翻译大模子，原生营救 33 种谈话、5 种方言/民汉及 1056 个翻译标的。从常见的中英互译，到法语、日语、阿拉伯语、俄语，以致藏语、蒙古语等少数民族谈话，它都能洋洋纚纚地惩办。

仅以 1.8B 参数目，Hy-MT1.5 达成了并列生意翻译 API 和 235B 级大模子的翻译成果。在严格的评测基准中，其翻译质料不仅高出了谷歌翻译等主流系统，更证实了在高效优化下，轻量级模子大要迸发出令东谈主印象深入的翻译智力。

最极致的量化压缩，把模子装进手机

量化压缩，简短来说即是：把模子里原来用16位数字(16-bit)暗示的参数转用更低位数字储存。这就像把一幅高清相片压缩成缩略图，文献小了好多，但你照旧能看明晰内部的内容。针对不同的手机用户，腾讯很是推出了2-bit 与 1.25-bit 两种极致的量化压缩决策。

不同大小的模子在FLORES-200中外互译的成果评分

2-bit模子：性能与质料的均衡(适用：中高端机型)

2-bit 模子继承了业内顶尖的拉伸弹性量化(SEQ)，将模子参数目化至{-1.5，澳门威尼斯人(中国)Venetian Macao-0.5，0.5，1.5}，并都集量化感知蒸馏，在将模子体积压缩至 574MB 的同期，达成了实在无损的翻译质料，成果高出上百GB的大模子。在营救 Arm SME2 时间的移动成就上，2-bit 模子大要达成更快速、更高效的推理。

1.25-bit模子：Sherry 极致压缩(适用：全系机型)

为了达成极致的轻量化，腾讯推出了基于 Sherry(寥落高效三值量化) 时间的 1.25-bit 模子。该时间决策如故被NLP顶级学术会议ACL 2026拜托。

Sherry 压缩决策的中枢逻辑在于“细粒度寥落”战略：每4个模子参数，3个最弥留的用 1-bit 储存，1个用0储存，平均每个参数仅需 1.25-bit。

合营腾讯特意为手机 CPU 运筹帷幄的 STQ内核，该决策达成了对 SIMD 教导集的齐备适配。最终，3.3GB 的原始模子被进一步压缩至 440MB，落拓常驻后台，让内存焦灼的等闲手机也能顺滑进行高质料离线翻译。

本次开源不仅包含模子权重，还很是制作了一个试验可用的腾讯混元翻译Demo版，很是适配了“后台取词步地”。无论是在土产货搜检邮件照旧浏览网页，混元翻译都能随叫随到。无需网罗，无需订阅，澈底土产货惩办、不波及个东谈主信息的网络和上传威尼斯人，一次下载长久使用。

亚搏体育官方网站 - YABO

威尼斯人 营救33种谈话！腾讯混元推出极致量化压缩版块翻译模子

威尼斯人营救33种谈话！腾讯混元推出极致量化压缩版块翻译模子