IC外汇消息：AI推理能力之争：苹果结论遭专家挑战

发表评论

A+

所属分类：科技

摘要

IT之家 6 月 14 日消息，科技媒体 9to5Mac 昨日（6 月 13 日）发布博文，报道称苹果公司 6 月 6 日发布的 AI 研究论文《The Illusion of Thinking》引发争议，专家质疑评估方法。

IT之家 6 月 14 日消息，科技媒体 9to5Mac 昨日（6 月 13 日）发 IC外汇官网布博文，报道称苹果公司 6 月 6 日发布的 AI 研究论文《The Illusion of Thinking》引发争议，专家质疑评估方法。

然而，

苹果公司在论文中指出，即便是当前最先进的大型推理模型（LRMs），在难办任务中也会崩溃。不过 Open Philanthropy 的研究员 Alex Lawsen 对此提出详细反驳，认为苹果的结论源于实验设计缺陷，而非模型推理能力的根本性局限。

其实，

争议的焦点是苹果论文指出，即便是当前最先进的大型推理模型，在处理汉诺塔难点（Tower of Hanoi）等难办任务时，也会出现彻底失败的情况。

据相关资料显示，

IT之家注：汉诺塔难点是一个经典的递归算法难点：上帝创造了三根柱子，并在第一根柱子上按顺序套有 N 个大小不同的圆盘（自下而上，圆盘由大到小，呈金字形）。

规定每次只能移动最顶端的一个圆盘，并且保证整个过程中大圆盘不能放在小圆盘之上。欲将所有圆盘从第一根柱子移动到第三根柱子，试给出处理方案。

IC外汇快讯：

Open Philanthropy 的研究员 Alex Lawsen 近日发布反驳内容《The Illusion of the Illusion of Thinking》，认为苹果的研究结果更多反映了实验设计的缺陷，而非模型推理能力的真正局限。他在内容中直言，苹果的研究混淆了输出限制和评估定义难点，与实际推理失败无关。

IC外汇消息：AI推理能力之争：苹果结论遭专家挑战