- A+
IC外汇专家观点:
还记得半年前 DeepSeek 横空出世时的震撼吗?那个用不到 OpenAI 1/20 的成本就训练 蓝莓市场官网 出顶级模型的"神话",不仅让整个硅谷为之侧目,更是给国内的 AI 创业公司上了生动的一课——原来,大模型能够这样玩。
DeepSeek 冲击波下的转型之路
对于被称为"AI 六小龙"的 MINIMAX 来说,DeepSeek 的出现无异于一记当头棒喝。过去的剧本突然就讲不下去了:疯狂烧钱买算力,追着 OpenAI 的脚步跑,今天发个大模型,明天搞个视频生成...看起来很忙,但总感觉在原地打转。
其实,
投资人展开问:"既然 DeepSeek 能用这么少的钱做出这么好的效果,各位们之前烧的那些钱都去哪了?"访客展开问:"既然有免费的 DeepSeek,我为什么还要付费用各位们的 API?"
然而,
但 MINIMAX 的反应出人意料地迅速和果断。他们没有选取继续讲老故事,而是彻底换了剧本:从追逐热点转向硬核技术突破,从商业化优先转向开源优先,从模仿 OpenAI 转向对标 DeepSeek。
事实上,
实际上,MiniMax 在今年 1 月份就推出了开源模型 Minimax-01,其中包括语言模型和视觉模型,但似乎反向平平。
半年的蛰伏与沉淀后,他们暂停了所有非核心项目,把最优秀的工程师都调到了一个神秘的项目上。
说到底,
MiniMax-M1:半年磨一剑的技术突破
说到底,
昨天,MINIMAX 终于交出了答卷——MiniMax-M1,他们宣称这是世界上第一个开源的大规模混合架构的推理模型。这不是一个匆忙的应景之作,而是一次深思熟虑的技术革新。
从某种意义上讲,
🚀 突破一:Lightning Attention - 超长文本处理
M1 原生兼容100 万字符的超长文本处理,处理 10 万字文本时只需要其他模型 25% 的计算资源。这意味着能够一次性分析整本小说或研究报告,而不需要拆分处理。
⚡ 突破二:CISPO 算法 - 更聪明的学习方法
IC外汇行业评论:
传统训练方法会忽略"不寻常"的学习过程,但 CISPO 算法不再丢弃任何"思考片段",充分利用每个思维火花。实验显示,这种方法比传统方法快 2 倍,效果还更好。
令人惊讶的是,
💰 突破三:超低成本训练
可能你也遇到过,
仅用 53.74 万美元就完成了整个强化训练,相比 GPT-4 超过 1 亿美元的成本,M1 几乎是同等能力模型中最便宜的。这不是容易的"省钱",而是技术效率的革命性提升。
需要解释的是,53.74 万美元并非模型的全部训练成本,而仅仅是强化学习阶段的费用。MINIMAX 表示他们仅用 512 块 AVA外汇开户 H800 GPU 训练了三周就完成了这一阶段,这一效率比行业预期至少提升了一个数量级。
大家常常忽略的是,
不过,与 DeepSeek 不同的是,MINIMAX 并未公布模型从预训练到最终完成的完整训练成本(不包括实验费用)。因此,53.74 万美元这个数字虽然令人印象深刻,但可能只是冰山一角。
来自IC外汇官网:
实战表现:数据说话的硬实力
经过半年的技术沉淀,MiniMax-M1 在各个关键领域的表现如何?大家用一张完整的对比表来看看它与顶级模型的真实差距:
从某种意义上讲,
虽然 M1 把训练成本又下调了一个数量级,但在常见的指标测试中,这个模型并无一项能到最优。比较亮眼的是长文本能力,在 MRCR(128K) 测试中得分 73.4,仅次于 Gemini 2.5 Pro 的 76.8,在 LongBench-v2 中更是达到 61.5 的第二名成绩,可见 Lightning Attention 确实非常有效。
值得一提的是,M1 有两项指标超越了 DeepSeek R1,即数学方面的 AIME 2025(76.9 vs 70.0)以及编程能力方面的 LiveCodeBench(65.0 vs 55.9)。这表明 MINIMAX 在核心技术突破上确实有所建树。
可能你也遇到过,
尽管综合来看,这些指标并不算最亮眼,但作为第一款开源模型,在成本控制以及长文本处理方面有这么突出的创新,已经非常难能可贵了。
不可忽视的是,
从跟随者到引领者的华丽转身
说出来你可能不信,
MINIMAX 的转型反映了 AI 行业的变化趋势。从追逐商业化到选取开源路线,从高成本训练到技术效率优化,这种策略调整与当前行业对成本控制和技术创新的重视相符。
说到底,
开源模式正在 AI 领域获得更多关注。DeepSeek 的成功为行业供给了新的发展思路,而 MiniMax-M1 的发布进一步验证了这一方向的可行性。随着更多公司选取开源策略,行业竞争重心可能会从资本投入转向技术创新。
不妨想一想,
从追逐者到开拓者,MINIMAX 用半年时间完成了一次完美的转身。这一转变表明"AI 六小龙"已经展开探索新的发展路径。
IC外汇行业评论:
算力泡沫破灭:一场正在发生的行业洗牌
IC外汇消息:
从 1 亿美金到 50 万美金,训练成本在短短的 1 年时间内的暴跌,正在引发整个算力市场的剧烈震荡。这不仅仅是数字的变化,更是一场颠覆性的行业重构。
值得注意的是,
那些曾经疯狂囤积算力的公司,如今面临着尴尬的现实:昂贵的 GPU 集群突然变成了"负资产"。据业内消息,AI六小龙之中多家已经大量退卡,试图减少损失。
而一些专门供给算力租赁服务的供应商,更可能直接面临破产危机——当客户发现用更少的钱就能获得更好的效果时,谁还会为过时的"算力迷信"买单?
大家常常忽略的是,
这场技术革命告诉大家:真正的护城河从来不是资源的堆砌,而是效率的突破。 在 AI 的下半场,拼的不再是谁烧钱更多,而是谁的技术更聪明。