腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译
11月25日,腾讯混元于11月25日推出开源OCR模型HunyuanOCR,该模型参数量为1B,基于混元原生多模态架构构建,在多项OCR应用评测中取得当前最优效果。

该模型采用端到端训练推理范式,通过单次前向推理即可完成多项任务,相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。
在性能方面,HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分,超过谷歌Gemini3-pro等模型;在涵盖文档、街景、手写等九大场景的测试集上,其文字检测与识别能力领先同类开源及商业模型。同时,该模型支持14种小语种翻译,并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。
目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景,并正式对外开放源代码。
特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1000个官方媒体网站发布广告,每天百万人次曝光,帮您客户覆盖全国,业绩翻倍!
- 茂名市区新麦当劳、大型影院来了!3万平商业体!
- 周度销冠丨门头沟长安华曦府·金安取得3.25亿销售额
- 密云二手房热门小区,榜单曝光!
- 丰台一安置房项目有新通告!
- 北京昌平发现罕见辽金时期水利遗址
- 黄金仍猛涨 有吊坠一夜涨1.9万
- 火锅店用鱼缸养鲨鱼供观赏
- 机器狗和真狗“打架”
- 炒完金条银条 投资铜条火了
- 金饰克价创新高
- 2026建筑装饰材料流行趋势发布大会暨2025京闻·创响杯颁奖典礼在京举行
- 2025全屋定制TOP10品牌推荐:顾家家居以一体化整家引领行业!
- 德施曼(DESSMANN)指纹锁官方服务上线全天候服务
- 华南理工大学2026年招收台湾高中毕业生招生简章
- 北京本科高校今年将扩招!15所市属高校新校区最新进展来了
- 孩子成绩好不好,先看父母稳不稳
- 初中孩子如何才能学好英语,单词记不住怎么办?靠一法破局
- 马斯克称特斯拉将转型为机器人公司
- 年轻人开始琢磨怎么在家养母鸡