突破AI产业落地卡点,蚂蚁韦韬:数据是变革关键
蚂蚁密算创新全链路密态的隐私保护计算技术,以技术突破信任壁垒,实现数据规模化低成本可信流通,服务超千万级用户。”日前,蚂蚁密算获得“世界互联网大会杰出贡献奖”,颁奖词着重强调了“数据规模化低成本可信流通”的价值。
大模型进入产业落地前夜的当下,蚂蚁密算获得权威认可,在外界看来是一个信号。某种程度,它反映了这家年轻的公司围绕着数据流通和人工智能产业落地卡点的探索关注,在AI时代已成为行业普遍性议题——
一方面,数据驱动的模型对高质量数据产生了前所未有的需求,数据要素的跨主体、跨行业、跨区域的低成本、高性能、高安全流通变得更为迫切。另外,大模型带来的智能变革似乎近在眼前,但它距离千百倍的行业变革仍然有距离。
而蚂蚁密算的解法,由此也产生了更大的行业借鉴意义。无论是提出密态计算还是发布致力解决大模型在专业应用中的可靠性困境的高阶程序(High-Order Program, HOP),在“数模一体”的新时代,正为解决高质量数据缺乏背景下的数据治理产能不足、推进高价值高敏感数据跨主体融合利用、加速人工智能的产业应用,贡献了一份自己的力量。
图片
蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬在沟通会现场直言,“AI时代,蚂蚁密算所选择的方向正得到产业界认同,整个行业发展正迎来一个重要的战略窗口期和规模化应用机会。”
01
密态计算正进入规模化应用元年
“数据是AI时代的新石油”,这句诞生在AI 1.0时代的断言,在大模型时代含金量还在进一步上升。
今年6月,Meta以约143亿美元对数据标注领域头部公司Scale AI 49%股份的天价收购案,某种程度上反映出,AI时代数据在模型智能及大模型的竞争中呈现出巨头卡位的重要性。
这背后是当下AI数据领域的现实挑战:目前,可用于通用模型训练的互联网公开数据在基模训练里几乎已消耗殆尽,这一方面使得大模型训练早已从数据参数规模扩展,转向数据语料的质量上。同时,不在公开渠道流转的高敏数据以及包含了垂类场景知识的专业数据,正对大模型智能提升以及行业应用产生越来越大的影响。
这一行业现状也让产业界对更加畅通的数据要素安全流通机制有切实需求。以Scale AI收购案为例,在Meta发出收购信息后,一大批与Meta的模型存在竞争关系的厂商纷纷开始切断与Scale AI的合作,背后就是对数据安全相关的担忧。
但现实是,拥有稀缺的高质量数据的企业和各类主体,出于安全等各种顾虑,很难放心让数据跨域去流通、流转。IDC在今年4月的一份报告中就指出,当前数据市场供需不旺,主要原因对数据流通的不信任。
韦韬观察,AI时代“数模一体”,数据的可信安全流通还多了一重新的迫切性。
大模型作为数据驱动的知识汇聚技术,只有大量的数据和专业知识,才能构建大模型。同时,模型即数据,数据上所承载的专业价值、商业的秘密都会展现在模型里面。
韦韬认为,大模型一旦流通应用,数据上所要做的保障,在模型层也需要做相关的保障。模型本身也需要诞生在能保障数据、智能体高效流动、应用和融合的密态计算基础设施之上。
这些都意味着,密态计算的市场空间正进一步打开。
实际上,过去两年来,密态计算领域经历了快速的发展演进。
图片
一年半以前,蚂蚁集团成立了蚂蚁密算,将蚂蚁过去十年在下一代隐私保护计算领域积累的技术能力对外输出。当时密态计算领域正如韦韬所言,“去年但凡谈密算,大家都觉得是蚂蚁一家在做。”
但随着密态计算技术升级,成本大幅降低至明文分布式计算的1.5倍以内,这项新兴技术开始在医疗、金融等领域规模化落地,比如帮助超1300万农户获得贷款,让75%新能源车主平均下降8%保费。据相关合作单位估算,在密算上投入100万,整个行业收益100倍以上,一年电费能耗不到5000元。
韦韬提到,这些落地进展让行业确信,密算真的能让产业界敢于注入高敏高价值数据,并且基于密算保障的数据流通后,业务能真正获得显著效果。
与产业落地进程同步,密态计算的相关国家标准也在同步推进中,同时更多的行业玩家进入这一市场。
就在乌镇举行的世界互联网大会的前一天,韦韬还参与了国家数标委WG6(国家数据标准化委员会数据基础设施标准工作组)成立的SG2密态计算研究组,他看到已经有超过20家单位加入工作组,密态计算正加速进入行业共建阶段。
叠加上AI时代对数据安全流通产生的强烈需求,韦韬认为,“今年是密态计算的市场化规模应用启动元年”。当下行业处于高敏高价值行业先行投入阶段,随着行业基建完善,未来整个互联网上无法公开传输的数据都可以基于密算承载,这将是一个巨大的市场。
02
“数模一体”,加速AI时代数据价值释放
数据流通安全问题经由密态计算技术得到保障后,专业数据要真正在产业应用流通里真正“用得好”并不是那么“理所当然”。
韦韬观察到,蚂蚁密算在与国家部委的合作里发现,那些从来没有参与跨主体、跨域流通和供给的数据的质量,与真实产业场景应用的要求之间存在不小的差距。
“大量数据缺乏治理、缺乏标准化,以及此前汇聚传输过程中可能累积了很多错误,这使得它很难快速被用起来,去产生应用价值”,韦韬说。
实际上,这一现象过去几年里在明文数据的治理领域也是一个通行问题。为解决高质量数据缺乏现状,国家在顶层设计层面也已经出台了大量的政策,牵引和推动高质量数据集的建设工作。
但不可否认,传统的基于人工来处理数据治理工作,依然有不小的产能局限。中国信通院在《数据标注产业发展研究报告(2025)》中指出,人才培养机构输出的标注工程师年均缺口超30%。高端专业领域的标注和治理人才稀缺,已是共识。
涉及到高敏高价值的数据场景,产能缺口就更大。比如金融机构的联合风控场景,数据不能出域,为构建更好的模型,多方针对业务指标数据的清洗、治理、对齐等需要数周,并且能去做相关工作的专家资源很难找。
图片
特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1024程序员节京东开放“零帧起手”数字人技术
- 内置24000转/分钟风扇!红魔11 Pro图赏
- W47单品销量,小米17 Pro Max真牛,同档国产全没上榜
- 红魔11 Air证件照公布:骁龙8至尊版、7000mAh电池
- 贝尔金发布70W氮化镓三口快充头,售316元
- 英特尔Nova Lake曝光:旗舰52核怪兽,性能核IPC涨15%
- 一张图看懂智驾"安全公开课"嘉宾精彩观点
- 灵隐寺免门票首日入园名额已约满
- 黄河壶口瀑布现“彩虹横卧”景观
- 两个“1980” 苏翊鸣强势夺金
- 男子花1年定制2米高可通话摩托罗拉
- 长沙连续17年获中国最具幸福感城市
- 刘强东:未来机器人会完成所有工作
- 300元滑雪服被冻哭的年轻人焊身上了
- 退休老人不抢鸡蛋抢起了船票
- 大脑“断崖式衰老”的3个年龄
- 老君山景区拒绝用无人机取代挑山工
- 解读智己LS9,标配520线激光雷达+Thor芯片,究竟有啥不同?
- 联想提出RNL技术,通过多维感知等解决AI训练中的难题
- 曝特斯拉曾拆解多款中国电动汽车