分享文章
新闻分类
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
据媒体报道,月之暗面(Moonshot AI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。

该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。
Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不同,它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。
例如,它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力始终是任务的实际解决效果。
作为一款深度研究模型,Kimi-Researcher 整合了多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。月之暗面表示,未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。

[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 一定要让老年人有一个幸福的晚年 7904583
- 2 未来五年大量的钱将流向这里 7808725
- 3 全球投资者正以惊人速度从印度撤资 7714440
- 4 十五五规划建议发布 更清晰的方向 7619292
- 5 国台办:决不承诺放弃使用武力 7520201
- 6 美国又有实验用猴跑了 7428738
- 7 拒绝35岁中年人的青旅 00后也不住了 7330080
- 8 这群人用最“土”的办法造出原子弹 7236711
- 9 今年是百年一遇的“晚重阳” 7140106
- 10 生活噪音将归公安管 最高10日拘留 7046218







clairebabe
