腾讯混元OCR模型宣布开源：参数量1B 支持14种小语种翻译

我要久久发-全国品牌广告发布+百万流量精准拓客

发布时间：2025-11-25 19:00

11月25日，腾讯混元于11月25日推出开源OCR模型HunyuanOCR，该模型参数量为1B，基于混元原生多模态架构构建，在多项OCR应用评测中取得当前最优效果。

腾讯混元OCR模型宣布开源：参数量1B 支持14种小语种翻译

该模型采用端到端训练推理范式，通过单次前向推理即可完成多项任务，相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。

在性能方面，HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分，超过谷歌Gemini3-pro等模型；在涵盖文档、街景、手写等九大场景的测试集上，其文字检测与识别能力领先同类开源及商业模型。同时，该模型支持14种小语种翻译，并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。

目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景，并正式对外开放源代码。

特别声明：以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”，本平台仅提供信息存储服务。

上一篇：边缘AI爆发前夜！AMD自适应和嵌入式产品如何撬动新一轮智能化爆发？下一篇：“老登”俞敏洪，不背用员工血汗钱旅游的“锅”