news 2026/4/3 3:04:03

教程上新| 腾讯混元开源端侧翻译工具HY-MT1.5,1.8B模型仅需1G内存

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
教程上新| 腾讯混元开源端侧翻译工具HY-MT1.5,1.8B模型仅需1G内存

在机器翻译领域,传统的高性能模型往往面临两个核心难题。对于主流语言,闭源商业模型效果出众但调用成本高,模型参数量动辄百亿级别,需要高昂的算力支持,难以在手机等消费级设备上部署。另一方面,对于数据稀缺的低资源小语种,以及包含专业术语、文化特定表达的文本,模型翻译质量常常不佳,容易出现幻觉问题或语义偏差。这导致用户在日常和移动场景下,常常在高质量、高成本的云端服务与本地化、轻量化但效果不足的方案之间难以抉择。

基于此,腾讯混元团队近日正式开源了全新翻译模型 HY-MT1.5。本次开源包含两个参数规模的版本:专为移动端设计的 Tencent-HY-MT1.5-1.8B 和面向高性能场景的 Tencent-HY-MT1.5-7B,支持 33 个语种的互译及 5 种中国少数民族语言/方言与汉语的互译,除中、英、日等常见语种外,涵盖捷克语、冰岛语等多个小语种。

* HY-MT1.5-1.8B:

经过量化后,该模型仅需约 1GB 内存即可在手机等端侧设备流畅运行,支持离线实时翻译。模型效率突出,处理 50 tokens 的平均耗时仅 0.18 秒,在 Flores200 等权威测试集上,其效果全面超越中等尺寸开源模型和主流商用 API,达到顶尖闭源模型的 90 分位水平。

* HY-MT1.5-7B:

该模型是腾讯此前在 WMT25 国际翻译比赛中斩获 30 个语种冠军的升级版,重点提升了翻译准确率,并大幅减少了译文夹带无关注释或语种混杂的问题。

具体而言,HY-MT1.5 的创新性在于通过独创的技术方案,有效解决了「轻量化部署」与「高精度翻译」之间的矛盾。其采用了 「On-Policy Distillation(大尺寸模型蒸馏)」策略,即令效果更强的 7B 模型作为「教师」,在训练过程中实时引导参数规模为 1.8B 的「学生」模型,纠正其预测偏差,从而让小模型从错误中学习,而非死记硬背。这使得小参数模型获得了超越自身规模的翻译能力。

目前,「HY-MT1.5-1.8B:多语言翻译模型」已上线 OpenBayes 公共教程板块,快来开启你的创作之旅吧!

教程链接:

https://go.openbayes.com/Yq0Im

Demo 运行

01

Demo 运行阶段

1.登录 OpenBayes.com,在「公共教程」页面,选择「HY-MT1.5-1.8B:多语言翻译模型」教程。

2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

3.选择「NVIDIA GeForce RTX 5090」以及「PyTorch」镜像,按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 5090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

https://go.openbayes.com/9S6Dr

4.等待分配资源,当状态变为「运行中」后,点击「打开工作空间」进入 Jupyter Workspace。

02

效果演示

1.页面跳转后,点击左侧 README 页面,进入后点击上方 Run(运行)。

2.待运行完成,即可点击右侧 API 地址跳转至 demo 页面

教程链接:

https://go.openbayes.com/Yq0Im

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 12:32:19

FactoryBluePrints蓝图选择:3步解决你的戴森球计划布局难题

FactoryBluePrints蓝图选择:3步解决你的戴森球计划布局难题 【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库 项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 还在为戴森球计划中复杂的工厂布局而烦恼吗&#xf…

作者头像 李华
网站建设 2026/4/1 1:18:39

鸣潮自动化工具:游戏时光的智能管家

鸣潮自动化工具:游戏时光的智能管家 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸上锁合成 自动肉鸽 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 你是否曾经在深夜盯着屏幕…

作者头像 李华
网站建设 2026/4/2 2:25:39

Qwen2.5-0.5B-Instruct部署教程:4步完成网页推理环境搭建

Qwen2.5-0.5B-Instruct部署教程:4步完成网页推理环境搭建 1. 引言 1.1 学习目标 本文将指导您从零开始,快速部署阿里云开源的轻量级大语言模型 Qwen2.5-0.5B-Instruct,并构建一个可交互的网页推理环境。完成本教程后,您将能够&…

作者头像 李华
网站建设 2026/4/1 21:04:51

Zotero效率革命:Ethereal Style智能管理完全攻略

Zotero效率革命:Ethereal Style智能管理完全攻略 【免费下载链接】zotero-style zotero-style - 一个 Zotero 插件,提供了一系列功能来增强 Zotero 的用户体验,如阅读进度可视化和标签管理,适合研究人员和学者。 项目地址: http…

作者头像 李华
网站建设 2026/4/2 23:59:40

戴森球计划终极工厂蓝图库:3步快速配置效率翻倍攻略

戴森球计划终极工厂蓝图库:3步快速配置效率翻倍攻略 【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库 项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 还在为戴森球计划中复杂的工厂布局而头疼吗?&am…

作者头像 李华
网站建设 2026/4/3 1:35:03

RevokeMsgPatcher防撤回工具终极指南:一键拦截所有被撤回消息

RevokeMsgPatcher防撤回工具终极指南:一键拦截所有被撤回消息 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://git…

作者头像 李华