首页 > 实用技巧 > 干货教程 > 微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

发布时间:2025-05-01 22:45:41来源: 13041198719

5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。

IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。

该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。

Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。

Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。

两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和
DeepSeek-R1-Distill-Llama-70B
,甚至在 AIME 2025(美国数学奥林匹克资格赛)中击败 6710 亿参数的 DeepSeek-R1 满血模型。

Phi-4-mini-reasoning 专为计算资源有限的环境设计,是一款基于 Transformer 的紧凑型语言模型,优化用于数学推理。

干货教程更多>>

具备纯正北欧设计,全新沃尔沃XC70工信部亮相 雷克萨斯 NX:豪华与实用的 “双面娇娃”?深度测评来啦! 2025款雷克萨斯ES300h选哪款?三大理由告诉你“臻享版”是真香! 配置堆得多就好用吗?试完全新智己L6我有了答案 都市新宠登场!全新智己L6试驾体验全记录 都市白领的早高峰救星?试驾全新智己L6后我悟了 几乎完美的4款MPV车型 10 款最佳赛道跑车:风儿透过敞开的车窗呼啸而过 SUV也有了,小米汽车还缺什么? 深度实测领克900:大六座SUV的三大反常识真相 从保时捷到特斯拉,最终选择极氪001的真实体验 699 元,这个 Mini 新机是来捣乱的吧? 速腾VS思域:15万级家用车该怎么选?真实体验对比 24款迈腾B9:优缺点大起底,看看值不值得入手! 雅阁降价到12万,日系车安全差?销量却狂飙 深度解析:起亚K5驾控进阶之路:技术流B级车的突围法则 东风华为联手“软件定义汽车”,中国品牌要当全球智能汽车领路人 中国品牌的共生力量!东风与华为的“智联”棋局下得有多大? 上汽通用五菱申请激光焊接生产线相关专利,提高主生产线单位时间利用率 开宝骏=升职加速器? 超大空间+硬核四驱 新哈弗H5:家庭出游神器,性价比首选(很润) 日产终于找回节奏,新玛驰发布续航超400,颜值足以叫板海鸥星愿 历史性时刻!比亚迪欧洲纯电车销量首次超越特斯拉 实拍2025款奔驰GLE!367马力+四驱,凭啥卖七八十万? 宝马下一代终级跑车现身,概念跑车 Concept RR 上汽奥迪AUDI品牌首款车型E5 Sportback完成申报 合资算力新高度——一汽丰田bZ5到店体验 蔚来取得一种冷却板、电池包及车辆专利,提高电池包内的空间利用率 文博会上,“例外\"联袂“广汽”让千年国潮驶入未来 三台大五座SUV谁最划算?传祺GS8、瑞虎9、红旗HS5实测对比