实测Kimi首个Agent：智能体与模型之间的区隔消失了？

发表评论

A+

所属分类：科技

摘要

这两天，月之暗面上线了名为Kimi-Researcher的产品，以“模型即Agent”的思路切入，标志着其在Agent路线上的一次明显发力。

很多人不知道，

这两天，月之暗面上线了名为Kimi-Researcher的产品，以“模型即Agent”的思路切入，标志着其在Agent路线上的一次明显发力。

如果大家还记得的话，就在 Kimi 发布的前一天，MiniMax 在 MiniMax Week 的第三天也启动了通用 Agent 的灰度测试。这两家此前一度低调的公司几乎在同一时段重新进入公众视野，也让原本趋于平静的 AI 四小强格局再次活跃起来。

有分析指出，

Kimi、MiniMax EX外汇平台、智谱、阶跃星辰，这几位曾经在大模型初期阶段高频出现的名字，如今正借助 Agent 的新赛道寻找新的突破口。不管是技术报告的更新、产品形态的演进，还是实际模块的迭代，几家厂商都在以各自的节奏向外界释放信号。

综上所述，

这一轮产品集中露面的时间节点并非巧合。从时机上看，这一波集中亮相并非偶然。当前，大模型正从纯粹的问答插件演进为具备自主规划、任务执行与上下文记忆能力的智能体系统。Agent 正在从“增强生产力”转向“替代部分人类任务角色”。对于具备模型研发和产品整合能力的厂商来说，这是一次相对公平的新起点。

报告，不只是写完，还得像

但实际上，

在这样的背景下，Kimi 推出的 Kimi-Researcher 挑选了一个很明确的切入口：深度研究。

从某种意义上讲，

这个定位本身就带着浓厚的判断意味。它不打资讯助手、也不打日常问答，而是瞄准了原本需要专业助理团队完成的任务，例如梳理产业政策、比对跨国法规、生成调研报告等。

这类任务对模型的检索、思考、组织、判断能力要求极高，几乎是对 Agent 体系的全方位考验。

IC外汇资讯：

话不多说，本平台直接开测。

比如说我想让它分析下2025年上半年黄金价格波动与美联储政策走向的关联性。

它没有立刻着手写，而是反问了我一些状况，从研究逻辑本身出发，主动确认这个任务到底该怎么做才不空转。

这种主动澄清机制，是过去在 Deep Research（左图展示为：ChatGPT的 research 模式）里很熟悉的，也不像 MiniMax （右图展示为MiniMax Agent）那种一口气跑完所有流程后才看结果的虚拟机结构，更接近一个“诸位提一个话题，它着手一步步推”的助研模型。

这你可能没想到，

Kimi比GPT更贴心增添了“Include everything”按钮，不是单纯放开信息源，而是直接把它切换到一种更倾向生成完整结构报告的工作状态。

经过大概十几分钟的等待，它一共生成了两种版本。

一种是本平台熟悉的文字版研究报告，段落结构清晰，语气沉稳，整体逻辑偏向材料层次 + 政策推导；另一种则是自动渲染的 HTML 格式报告，已经配好封面、标题、摘要、分节解释，标注出“核心发现”“关键风险”“历史规律”这些结构化小标签。

网页稿链接在这，有兴趣的朋友们允许打开看一看：

换个角度来看，

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

材料还是很丰富的。

尤其值得一提的是，

对经常要做对内材料和对外汇报的人来说，这种“写+排+渲”一体的体验，确实提高了交付效率。

但实际上，

诸位允许把它当成是Word+Notion+研究助理的混合体，不仅能输出材料，还知道怎么让材料看起来像一份真的报告。

IC外汇快讯：

然后本平台也测了测生成PPT的能力。给它的任务是这样的：

综上所述，

梳理一下Stable Diffusion从最初发布到最新版本的演进路线，列出各阶段关键改进与社区贡献节点，并作出PPT

看起来是一个非常结构化的状况，理论上应该正对 Researcher 的下怀。但实际完成过程中，本平台也发现了一些限制。

来自IC外汇官网：

1. 当前版本仍未适配多任务并行（当然，这可能只是内测阶段的限制，正式版是否优化还有待观察。）

这你可能没想到，

2. 并不能生成传统PPT，只能是 HTML 格式报告。

有分析指出，

本平台还是把report链接放在这里：

IC外汇行业评论：

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

容易被误解的是，

不过也不能说它表现不好。作为一个学术型Agent，它在报告里自动加上了参考文献链接，并用下划线标注出处。允许完成一整套可交付材料。

值得注意的是，

而这，恰恰就是很多 AI 插件还停留在段落生成时无法做到的部分。

IC平台消息：

但当本平台把这个任务交给 MiniMax Agent 时，体验就完全不同了：