国外办了场AI投资实盘大赛,国产大模型目前断档式领先
如果说DeepSeek是巴菲特的投资信徒,那Gemini2.5pro则像极了心神不宁的散户,它是所有大模型中操作最频繁的选手,平均持仓时间仅有2小时29分钟。”
图片
文 / 巴九灵
“谁如果把这个AI交易工具给做出来了,我马上投!”
最近,国外一家叫做nof1的人工智能实验室,发起了一个叫做“Alpha Arena”的项目,该项目将全球六大顶尖AI模型:DeepSeek、Grok、ChatGPT、Gemini、Qwen、Claude汇聚在一起,投入金融市场进行残酷的“实盘交易”。
按规则,每一个AI大模型掌控一个独立的1万美元账户,六大模型自己拟定投资策略进行实盘交易,全部投资过程和决策完全公开,而且账户信息公开透明,杜绝弄虚作假,所有人都可以进行查询。
比赛一开始就引发了AI和数字货币圈层的热议。
截至10月25日凌晨1点,参赛的两款国产大模型在比赛中碾压四款国外大模型。Qwen3 MAX以49%收益率目前保持断崖式领先(最高时收益率达60%以上),DeepSeek以13%收益率紧随其后(最高时35%),而其他四位对手的收益率惨不忍睹。
Claude Sonnet 4.5收益率为-14%,马斯克的Grok 4为-17%,谷歌的Gemini 2.5 Pro录得-67%,垫底的GPT-5最惨,账户净值暴跌-75%。
图片
截至10月24日,账户收益率实时变动中
这场AI大模型的“实弹演习”可谓极富戏剧性。从整个过程来看,开赛当天大家波澜不惊,随后DeepSeek开始领先,而GPT-5、谷歌Gemini则出现大溃败。近日,Qwen3 MAX上演了强势逆袭。
图片
金融,智能的终极测试
本次投资比赛中,六大参赛模型是基于完全相同的市场数据和初始指令,自行掌控10000美元的初始资金,在去中心化交易所上,进行永续合约交易。
评判标准有且只有一个:收益率。
在前置条件完全相同的情况下,影响投资收益率的主要原因,在于这些大模型的“思维方式”。
我们先来回顾下这几天的交易情况。
10月18日当天,大多数人工智能的波动范围在正负2%之间,似乎正在熟悉市场信息,对交易市场进行测试,表现最好的Deepseek拿到了4%的利润,而表现最差的是QWEN3-MAX亏损了5.26%。
但到了10月20日,DeepSeek净值曲线一路走高,收益率飙升到25.33%,而表现最差的谷歌Gemini暴跌-39.38%,两者收益率相差60%,市场出现巨大分化。
图片
10月20日,DeepSeek异军突起
转折点出现在10月22日。当时,六只大模型的收益率全部告负,号称最强大模型的GPT-5的亏损率超过60%,AI驱动交易的实验一度要接近失败。
而就在这时,DeepSeek和以及此前表现不佳的Qwen3 MAX纷纷自动改写了投资策略,在其他4个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨,Qwen3 MAX更是趁机超过DeepSeek,暂时问鼎收益冠军。
图片
特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1000个官方媒体网站发布广告,每天百万人次曝光,帮您客户覆盖全国,业绩翻倍!
- 存好!想在四川找“铁饭碗”,死盯这些央国企
- 一加 15T或为骁龙 8E5小屏旗舰,预计3月发布,电池突破7500mAh
- 小米REDMI Turbo 5 Max首发天玑9500s芯片,本月见
- iQOO Z11 Turbo 评测:黄金中屏兼顾更全能的体验
- 战斗精灵降临!iQOO Z11 Turbo定义中屏新标杆
- 无需ROOT!支持温控调节和自定义频率,真我Neo8配置曝光
- 泡泡玛特“牵手”荣耀 潮玩手机下周一发布
- TCL A400 Pro实测:艺术电视也能兼顾画质与实用
- 苹果推出Apple Creator Studio订阅服务,买断版与订阅版可共存
- 力压苹果!华为手机2025年重返中国第一背后:还没完全发力 仍有上涨空间
- vivo总裁兼首席执行官沈炜入选“2025年度手机行业六大杰出人物”
- 干掉防窥膜!国外博主体验三星S26 Ultra,称隐私显示功能太强大
- 三星显示启动8.6代OLED量产
- 三星确认Galaxy AI基础功能继续免费,覆盖通话助手、写作助手等服务
- 三星优化产线布局,年内关闭一座8英寸晶圆代工厂
- 多地省考放宽35岁年龄限制
- 16G内存条的价格涨幅超过3倍
- 观致汽车厂再流拍 6万人围观1人报名
- 新能源汽车废旧动力电池新规来了