腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译
11月25日,腾讯混元于11月25日推出开源OCR模型HunyuanOCR,该模型参数量为1B,基于混元原生多模态架构构建,在多项OCR应用评测中取得当前最优效果。

该模型采用端到端训练推理范式,通过单次前向推理即可完成多项任务,相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。
在性能方面,HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分,超过谷歌Gemini3-pro等模型;在涵盖文档、街景、手写等九大场景的测试集上,其文字检测与识别能力领先同类开源及商业模型。同时,该模型支持14种小语种翻译,并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。
目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景,并正式对外开放源代码。
特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1000个官方媒体网站发布广告,每天百万人次曝光,帮您客户覆盖全国,业绩翻倍!
- 义乌爆单!全球采购商蜂拥而至
- 中药手串是真养生还是纯噱头
- 猛降20℃!全国乱穿衣地图出炉
- 华莱士正式宣布退市
- 何小鹏:应该向华为苹果等企业学习
- “龙虾”全网刷屏 劝你不要盲目跟风
- 7旬老人7天跑遍7大洲:目标跑到100岁
- 别把早午餐二合一
- 36岁,能开上这3款车就算小有成就
- 10万级SUV对决:宋Pro DM-i与埃安AION i60谁是优选?
- 投资人下班疯狂补习“养龙虾”
- 大学生寒假无休送外卖收入过万
- 中传一口气砍掉16个本科专业
- 黄金品牌涨价 50克金手镯贵了5万
- 超8成胖东来员工拒绝“降薪增假”
- Ella展示“真空腹” 震惊观众
- 初二男生贴助长贴一年长高11厘米
- 为什么中年男人去哪都要开车
- 包书皮真有必要吗