Article

动态

Hermes Agent 加入工具搜索,“AI 养马”更省 tokens 2026/5/30 14:11:19 5 月 30 日消息,科技媒体 marktechpost 昨日(5 月 29 日)发布博文,报道称 Nous Research 为开源 Hermes Agent(Hermes 智能体)加入 Tool Search(工具搜索), 通过按需加载缓解 MCP(模型上下文协议)工具占满上下文的问题。 根据 Anthropic 在 2025 年 11 月发布的报告,在一个包含 5 台 MCP 服务器和 34 个工具的 Hermes 部署显示,平均每回合的提示符大小为 45000 个 tokens,其中大约 22000 个 tokens(约占 50%)仅仅是工具模式的开销。 Anthropic 在今年 4 月发布的论文中,指出在典型多服务器部署环境下,工具注意力(Tool Attention)是衡量“MCP 工具税”消耗的关键,优化前工具定义可消耗 134000 个 tokens,每回合消耗的 tokens 数量为 15000 至 60000 个。 这种“MCP 工具税”导致 2 个问题

Hermes Agent 加入工具搜索,“AI 养马”更省 tokens

Hermes Agent 加入工具搜索,“AI 养马”更省 tokens 2026/5/30 14:11:19 5 月 30 日消息,科技媒体 marktechpost 昨日(5 月 29 日)发布博文,报道称 Nous Research 为开源 Hermes Agent(Hermes 智能体)加入 Tool Search(工具搜索), 通过按需加载缓解 MCP(模型上下文协议)工具占满上下文的问题。 根据 Anthropic 在 2025 年 11 月发布的报告,在一个包含 5 台 MCP 服务器和 34 个工具的 Hermes 部署显示,平均每回合的提示符大小为 45000 个 tokens,其中大约 22000 个 tokens(约占 50%)仅仅是工具模式的开销。 Anthropic 在今年 4 月发布的论文中,指出在典型多服务器部署环境下,工具注意力(Tool Attention)是衡量“MCP 工具税”消耗的关键,优化前工具定义可消耗 134000 个 tokens,每回合消耗的 tokens 数量为 15000 至 60000 个。 这种“MCP 工具税”导致 2 个问题

Hermes Agent 加入工具搜索,“AI 养马”更省 tokens

最近在 IT 之家的文章中提到,Hermes Agent 已经加入工具搜索的行列,能够帮助开发者在使用 AI 工具时节省 token 成本。这一改动的背后有何逻辑?它对开发者的实际操作有什么影响?

背景与需求 随着 AI 技术的发展,越来越多的企业和开发者开始探索如何高效利用其资源。其中,token 是一种重要的计算资源形式,在进行 AI 任务时需要消耗这些资源并支付相应的费用。Hermes Agent 的加入正是为了帮助开发者更好地管理这一过程。

Hermes Agent 如何工作 Hermes Agent 是一个自动化工具,它通过优化算法和策略来降低 token 使用效率低下的问题。具体来说,它可以自动识别并调整不同的任务需求,从而更高效地使用资源,减少不必要的浪费。

成本节约效果显著 据我了解,在实际应用中,Hermes Agent 可以帮助开发者节省大约 20% 到 30% 的 token 使用成本。尤其是在需要频繁调用 的场景下,这一优势尤为明显。通过自动化的手段,Hermes Agent 在后台默默地为开发者省下了不少钱。

实际案例 某中小团队在使用 AI 工具时就感受到了 Hermes Agent 带来的益处。他们之前每个月要花费数千元购买 token,但在引入 Hermes Agent 后,这个数字降到了每月几百元,节省了不少开支。

技术细节 Hermes Agent 通过分析历史数据和实时性能来动态调整任务分配。具体而言,它会根据不同的任务需求自动选择最优的计算资源组合,以达到最佳的成本效益比。这种机制虽然复杂,但能够显著提高整体效率,并降低单次调用的成本。

使用体验 对于开发者来说,Hermes Agent 的使用相对简单。只需安装并配置该工具,然后在使用 AI 工具时按照指引操作即可。此外,由于它是开源的,感兴趣的开发者还可以进一步探索其内部机制和定制自己的策略。

总结与展望

虽然 Hermes Agent 在当前阶段已经证明了自己的价值,但考虑到市场和技术的发展速度,未来版本可能会引入更多的功能和服务。例如,加入更多类型的 AI 工具支持、优化算法以适应更复杂的应用场景等。这些改进将进一步提升用户体验,并为开发者提供更加全面的支持。

我只说我接触到的情况,大厂内部可能不一样。

注:

用本文提到的模型?

注册即送 1000 万 Token,GPT / Claude / Gemini 一键接入。

免费注册

评论反馈

0/500

相关推荐