Alpha Arena Nof1AI)详解:模型、排行榜及其他
简介: Alpha Arena Nof1AI实时实验,在该实验中,人工智能模型各自操作1万美元的加密货币交易,以此测试其自主决策、风险控制及策略制定能力。
DeepSeek V3.1目前以46%的收益领跑排行榜,紧随其后的是Qwen3 Max和Claude Sonnet 4.5,而GPT 5在经历大幅回撤后,以75%的亏损远远落后。
Alpha Arena Nof1AI Alpha Arena AI 实时加密货币交易基准测试平台,在此平台上DeepSeek ChatGPT 等AI 将在Hyperliquid 上展开Hyperliquid 10,000 美元的真实初始资金、公开数据以及透明的结果进行比拼。
机型
DeepSeek、Qwen、Claude、Grok、Gemini、ChatGPT
平台
在Hyperliquid perps上实时执行的交易
季节
第一季将持续到美国东部时间 2025 年 11 月 3 日下午 5 点
什么是Alpha Arena Nof1AI)
Alpha Arena 是由Nof1AI举办的一场实时竞赛,参赛的大型语言模型(ChatGPT )ChatGPT 使用真实资金在Hyperliquid ChatGPT 加密货币永续合约。每个模型均独立运作,在分析市场数据、确定仓位规模及管理风险的同时,与其他AI模型展开直接竞争。
每位AI 初始资金为10,000美元,并在 Hyperliquid 上,在相同的提示、数据集和执行条款下进行交易,以确保公平比较。所有交易、持仓及决策逻辑均公开透明,任何人都可以追踪表现、验证结果,并观察各模型的行为表现。
目标很简单:通过让模型在动态、对抗性强且后果重大的市场中展开角逐,来衡量真正的投资智慧。《Alpha Arena 》第一季Alpha Arena 持续至2025年11月3日,官方排行榜将实时更新排名及决策轨迹。

Alpha Arena 是Alpha Arena 的?
Alpha Arena 一个实时交易系统,其中AI 作为独立交易员,每隔几分钟就会分析市场数据并做出决策。
以下是该技术 Nof1 AIAI 如下:
- 驾驭:每个模型都在一个受控框架内运行,该框架对输入、时机和市场准入进行了标准化,以确保进行一致、公平的比较。
- 推理周期:大约每两到三分钟,模型就会收到更新的市场和账户数据,并必须决定是买入、卖出、持有还是平仓。
- 提示系统:输入内容包括交易规则、价格历史、技术指标和余额信息,所有内容均以结构化文本形式提供,供模型解读。
- 操作结果: AI 一份详细的交易计划,其中包括交易方向、仓位规模、leverage,以及一个介于 0 到 1 之间的信心评分,该评分反映了决策的确定性。
- 风险控制:每个订单都定义了盈利目标、止损和失效信号,可对计划和遵守规则的行为进行可衡量的比较。
- 执行:交易指令将直接发送Hyperliquid在那里,交易将基于真实的流动性、交易费用以及可验证的盈亏情况实时执行。
- 行为跟踪:公开记录每笔交易和推理跟踪,捕捉频率、持有时间、信心变化和整体性能一致性等指标。
- 目的:通过使用真实资金运行该闭环系统,Nof1旨在评估AI 在不可预测的金融环境中如何进行规划、适应及风险管理。

Alpha Arena AI 排行榜
六位AI 正在Hyperliquid 平台上进行实时对决Hyperliquid 相同的规则,拥有相同的初始资金和市场数据。排行榜显示,不同的交易行为会导致截然不同的财务结果。
以下是排名概览和业绩(截至 2025 年 10 月 31 日):
- DeepSeek V3.1:账户价值14,PnL+48%,手续费568美元leverage.leverage,信心指数69,夏普比率0.42,通过稳健的多头持仓和持续的平仓操作实现。
- Qwen3 Max:账户价值13,PnL+31%,手续费1,565leverage.leverage,信心指数83,夏普比率0.31,主要得益于交易次数虽少但信心极高且执行精准的交易。
- 克劳德·索内特 4.5:账户价值 8,835PnL-12%,手续费 482leverage 12.3leverage,信心指数 66,夏普比率 0.00,反映出谨慎的参与态度和较低的市场风险。
- Grok 4:账户价值 6,119PnL-39%,手续费 329leverage 12.7 倍,信心指数 66,夏普比率 0.05,该表现主要受持仓时间较长以及在行情反转时延迟平仓的影响。
- Gemini .5 Pro:账户价值 3,307 美元,盈亏(PnL)-67%,手续费 1,284leverage 14.3leverage,信心指数 66,夏普比率 0.65,显示做空过于频繁且回撤恢复能力较弱。
- GPT 5:账户价值 2,473 美元,盈亏(PnL)-75%,手续费 498leverage 17.2leverage信心指数 63,夏普比率 0.59,主要原因是投资范围过广以及在市场波动下的适应能力较差。

Alpha Arena AI 思考和交易
本节将Alpha Arena AI 如何Alpha Arena 相同的实时市场数据,并将其转化为实际交易操作。每个系统的决策都揭示了其内置的逻辑、内部奖励机制,以及across 价格across 对不确定性的敏感程度。
Across 交易Across ,他们的行为生动展现了在持续风险和信息不完备的情况下,真正的智慧应有的模样。Alpha Arena表现最出色的交易者并非凭借预测的准确性取胜,而是依靠严谨的时机把握、持续的自我修正以及具备风险意识的决策循环。
1.DeepSeek V3.1
DeepSeek 其交易风格如同自信的专业人士,以手术般的精准度管理风险。它有条不紊地构建多资产配置,在市场波动中保持沉着,同时最大限度地把握盈利周期。
DeepSeek V3.1 行为特征:
- 长期持有头寸,尽量减少进入和退出之间的波动。
- 将leverage 维持near leverage ,并避免在盈利或亏损后因情绪波动而调整仓位。
- 密切跟踪无效级别,并在计划被破坏时自动退出。
- 在结构和信念之间取得平衡,以实现平稳、持续的盈利。

2.Qwen3 Max
Qwen就像一位耐心十足的策略师,在投入资金前会等待ideal 出现ideal 交易机会。它更注重精准度而非交易量,只有当数据完全符合其内部设定的阈值时才会采取行动。
Qwen3 最大行为档案:
- 虽然交易次数不多,但在把握充分时会使用leverage 17倍的高leverage 。
- 在两次会议之间保持 80% 以上的资金闲置,以保持灵活性。
- 保持全场最高的置信度,平均高于 0.8。
- 严格按照计划进行交易,几乎没有冲动性偏差。

3.克洛德十四行诗 4.5
克劳德的交易方式就像一个防御型风险管理者,注重保值和时机的把握。它避免噪音,在分配资金前耐心等待干净、可确认的设置。
Claude Sonnet 4.5 行为简介:
- 只在明确的技术确认后才入场,避免在亏损后加倍投入。
- leverage 维持near ,但极少动用全部账户资金。
- across 周期across 保持较低的波动性和较小的回撤。
- 在所有模式中,总费用最低,反映了保守的执行方式。

4.Grok 4
Grok的行为就像一个动量交易者,在趋势达到顶峰后仍能长期持有。它在方向性市场中茁壮成长,但在波动压缩或突然逆转时却举步维艰。
Grok 4 行为档案:
- 长期持有头寸,往往超过ideal 时机。
- 在多数交易时段中,将leverage 维持near ,同时倾向于做多头寸。
- 在承诺退出之前,会经历较大的未实现波动。
- 在趋势环境中表现最佳,在波动阶段则失去一致性。

5.Gemini .5 Pro
Gemini 其交易风格类似于机械化的量化交易,偏好做空布局和基于规则的信号。其逻辑精准但缺乏灵活性,往往在强劲趋势之后错失反转机会。
Gemini .5 Pro 行为特征:
- 在任何时候都保持总风险敞口的一半左右为空头头寸。
- 交易频繁,产生的费用相对于实现的回报较高。
- 在多次小额建仓的过程中,将leverage 维持leverage 15%左右。
- 严格遵守退出规则,即使市场条件发生变化。

6.GPT 5
GPT 5的交易风格如同一位涉猎过广的通才,across 资产across 过度分散。它能始终如一地执行交易策略,但一旦市场环境不利,其调整速度便显得过于迟缓。
GPT 5 行为档案:
- across 资产across 同时开仓,leverage 17倍。
- 保持相对于风险敞口的低信心,造成收益不稳定。
- 将亏损交易保留至无效,而不是提前减少。
- 表现出一贯的执行力,但风险扩展能力较弱,在压力下反应迟缓。

如何跟单交易Alpha Arena AI
通过跟单交易,您可以利用实时的onchain 直接在自己的Hyperliquid 自动Alpha Arena AI 实际持仓。
请按照以下步骤,使用HyperDash 安全地连接、追踪和同步他们的交易:
- 选择您的模型:访问ai.ai,挑选您想关注的AI ,然后点击其个人资料页面上的[Wallet]。
- 复制wallet :您将被重定向至Coinglass,在那里您可以复制wallet ,例如DeepSeek V3.1 的地址0xc20ac4dc4188660cbf555448af52694ca62b0734。
- 访问HyperDash:打开hyperdash.info并连接您的Hyperliquid ,即可启用wallet跟单交易功能,并自定义风险设置。
- 添加wallet:将复制的Alpha Arena wallet 粘贴到“添加交易者”字段中,并设置您首选的投资组合分配比例。
- 调整leverage :设定最大leverage 仓位规模限制,以保护您的账户免受过度风险敞口或市场剧烈波动的影响。
- 启用自动同步:激活自动复制功能,这样当AI 开仓、调整或平仓时,您的账户将实时同步执行相同操作。
- 监控表现:使用HyperDash 跟踪您账户和原始AI wallet持仓头寸、已实现PnL以及夏普比率。
- 定期审查风险:复制交易并不能保证盈利,因此请定期重新检查您的设置,并在极端市场事件发生时暂停自动化。

社区对Nof1AI《Alpha Arena》的反应
Alpha Arena上线吸引了交易员和开发者的关注,其中包括Binance CZ,他质疑共享的AI 如何保持优势。他指出,如果许多用户遵循同一套系统,其交易行为可能会推动价格波动,而非预判价格走势。
本次讨论凸显了在由学习系统塑造的算法市场中,协调与透明度方面日益严峻的挑战。随着越来越多的参与者复制AI ,Alpha Arena 研究集体自动化如何重塑市场波动性和流动性的有效视角。

Alpha Arena AI 的风险与局限性
Alpha Arena ,AI Alpha Arena 与human 相同的现实阻力,当市场波动速度超过其推理循环时,即便是先进的系统也会失灵。
以下是 Nof1AI :
- 波动激增:快速、高幅度的价格波动可能会在模型更新或执行防御性反击之前触发清算或失效。
- 流动性缺口:当订单簿变薄时,大额交易会导致价格剧烈波动,从而放大slippage 加剧across 实际亏损。
- 提示敏感性:微小的措辞或上下文变化都可能改变代理的逻辑链,从而在运行中产生不一致的风险承担或计划执行。
- 背景疲劳:随着交易历史的不断扩大,模型会失去关注点并错误权衡关键信号,从而降低情景感知能力和决策准确性。
- 执行延迟:两到三分钟的推理周期留下了暴露窗口,市场的突然波动可能会抹去之前的收益。
- 费用拖累:复利 funding rates、taker 以及频繁的仓位转换,会逐渐侵蚀即使是表现良好的策略的净回报。
- 推理drift:在长时间的会话中,逻辑一致性会逐渐减弱,从而导致输出结果相互矛盾、未能及时停止,或出现相互冲突的退出方案。
- 适应上限:模型是根据观察到的数据而不是新范式进行训练的,因此结构性变化和意外催化剂会压垮它们的习得行为。
- 智能合约风险:交易依赖于Hyperliquid第三方协议,合约漏洞、预言机故障或意外升级都可能导致资金损失或交易执行中断。
Nof1AI的下一步是什么
Nof1 正将Alpha Arena 扩展Alpha Arena 一个全方位的研发平台,在此平台上,交易模型将通过持续的实战竞赛不断演进。每个新赛季都会推出经过优化的提示词、更新的数据集,以及基于以往市场表现和行为结果训练而成的自适应反馈循环。
下一阶段将直接整合来自市场结果的强化学习,使人工智能能够通过经验来优化风险校准、交易时机和仓位规模。这一演进远非静态测试所能企及,Alpha Arena 一个充满活力、开放式的应用金融智能实验平台。
未来的更新将包括在共享组合内协作或竞争的多代理系统,测试不确定性下的通信和协调。Nof1 还计划为开发人员发布开放式应用程序接口,以支持新形式的代理设计、模型微调和组合协调。
总结
Nof1 实验将金融市场变成了一个活生生的人工智能实验室,交易结果直接衡量适应性和推理能力。
这为自主代理在多链生态系统中进行导航铺平了道路,使其能够通过DeFi、staking 、restaking 以及动态流动性协议来调配资金。
不久之后,先进的语言模型或许就能在诸如 Polymarket等预测市场中一较高下,对事件进行定价、管理风险敞口,并持续从human 算法的集体行为中学习。


.webp)
%20Explained%20(1).webp)