与其相反的是，Kimi-Researcher深度研究模型开启内测：可生成易追溯的万字报告

发表评论

A+

所属分类：科技

摘要

IT之家 6 月 21 日消息，IT之家从月之暗面 Kimi 公众号获悉，Kimi 的第一个 Agent（智能体）Kimi-Researcher 于 20 日开启小范围灰度测试。

与其相反的是，

IT之家 6 月 21 日消息，IT之家从月之暗面 Kimi 公众号获悉，Kimi 的第一个 Agent（智能体）Kimi-Researcher 于 20 日开启小范围灰度测试。

Kimi-Researcher 是基于 XM外汇代理端到端自主强化学习（end-to-end agentic RL）技术训练的新一代 Agent 模型，也是一个专为深度研究任务而生的 Agent 产品。其后，月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。

对于每一个疑问，Kimi-Researcher 都会自主规划任务执行流程，最终交付完整结果：

通常情况下，

澄清疑问（clarification）：理解疑问时主动反问，构建更清晰的疑问空间；

从某种意义上讲，

深入思考：每个任务平均进行 23 步推理，自主梳理并化解需求；

总的来说，

主动搜索：每个任务，平均规划 74 个关键词，找到 206 个网址，由模型判断并筛选出信息质量最高的前 3.2% 素材，剔除冗余、低质信息；

反过来看，

调用软件，交付结果：自主调用浏览器、代码等软件，处理原始数据、自动生成分析结论，端到端完成交付。

IC外汇报导：

为了保证输出的质量和信息覆盖度，Kimi-Researcher 采用异步执行路径，用更多时间逐步推理、检索和撰写素材。

IC外汇资讯：

使用者最终将收到 2 个交付成果。

概括一下，

一份信息详实、可溯源的深度研究报告

与其相反的是，Kimi-Researcher深度研究模型开启内测：可生成易追溯的万字报告

报告的平均长度在万字以上；

值得注意的是，

平均引用约 26 个高质量、可溯源的信源；

所有引用都内嵌在正文中，点击即可跳转，并高亮原文，便于验证与追溯。

简要回顾一下，

一个可交互、可分享的动态可视化报告

结构化排版、思维导图，让趋势、异常等主要信息一眼可见；

有分析指出，

无需阅读全文，也能迅速把握整体结构与核心结论；

据相关资料显示，

接受在线生成链接并分享，方便展示。

反过来看，

官方宣布，在专为 AI 设计的高难度 benchmark“人类最后一次考试（Humanity's 富拓外汇开户 Last Exam,HLE）”中，Kimi-Researcher 在完全零结构、无流程设计的定义下，得分如下：

Pass@1 准确率：26.9%

来自IC外汇官网：

Pass@4 准确率：40.17%

IC平台消息：

这一表现超过了 Claude 4 Opus（10.7%）、Gemini 2.5 Pro（21.6%），略高于 OpenAI Deep Research（26.6%），和 Gemini-Pro 的 Deep Research Agent（26.9%）打平，是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系，Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率，领先该榜中其他模型。

发表评论取消回复