OpenHuman 指南

功能详解

OpenHuman TokenJuice 详解 — 如何降低 80% Token 消耗

2026-05-24约 8 分钟阅读

TokenJuice 是 OpenHuman 内置的智能 Token 压缩引擎。它可以将工具输出和上下文压缩后送入大模型,降低最高 80% 的 Token 消耗。这意味着你的 API 费用直接降至原来的 1/5。

为什么需要 TokenJuice?

AI Agent 环境中一个被忽视的问题:Token 消耗的大头不是对话消息,而是工具返回的结构化数据。当 OpenHuman 调用 Gmail API 获取邮件列表时,原始 JSON 响应可能有几千到几万 Token。如果不压缩,调用一个工具的成本甚至可能超过模型输出的成本。

TokenJuice 的工作原理

  1. 捕获原始输出:截获第三方工具返回的原始数据(JSON/HTML/文本)
  2. 智能压缩:提取关键信息,去除冗余字段,生成结构化摘要
  3. 格式化输出:将摘要转换为≤3k token 的 Markdown 格式
  4. 送入 LLM:压缩后的上下文进入模型推理

TokenJuice 压缩效果

数据源原始大小压缩后压缩率
Gmail 收件箱(50 封)~15,000 tokens~2,500 tokens83%
GitHub PR 列表(20 个)~8,000 tokens~1,500 tokens81%
Notion 页面~5,000 tokens~1,200 tokens76%
Slack 消息历史~12,000 tokens~2,000 tokens83%
Web 页面抓取~20,000 tokens~3,000 tokens85%

费用节省测算

假设你每天用 OpenHuman 处理 500 次工具调用,每次压缩省 5,000 tokens:

  • 无 TokenJuice:2,500,000 tokens/天 ≈ $3.75(GPT-4o-mini)
  • 有 TokenJuice:500,000 tokens/天 ≈ $0.75
  • 每月省钱:约 $90(DeepSeek 模型的话更多)

如何开启 TokenJuice

TokenJuice 默认开启,无需手动配置。但你可以调整压缩级别:

[token_juice]
enabled = true
compression_level = "aggressive" # 可选: mild, balanced, aggressive
max_chunk_tokens = 3000
preserve_structure = true

参数说明

  • enabled:是否启用
  • compression_level:压缩级别,推荐 balanced 或 aggressive
  • max_chunk_tokens:压缩块上限
  • preserve_structure:是否保留 JSON 结构

注意事项

  • 信息损失:压缩必然有取舍,aggressive 模式会丢失部分细节
  • 结构数据:preserve_structure=true 适合需要精确字段的查询
  • 调试时建议用 mild:排查问题时先降低压缩级别

总结

TokenJuice 是 OpenHuman 相比其他 AI Agent 的杀手级功能。默认开启即用,每月帮你省下可观的 API 费用。如果你的模型是自备 Key(BYOK),建议保持 TokenJuice 默认配置,效果已经很好了。