Eval、观测与 LLMOps
AI 应用一旦进入多人协作或线上环境,光有模型和 agent 不够。你还需要 trace、prompt 回归测试、实验记录、成本观察和生产态诊断入口。这一页就是把这些工具按工程任务集中起来。
这类资源解决什么问题
- 帮你快速找到 tracing、prompt regression 和 experiment 平台的稳定入口。
- 把“观测工具”和“生产平台”分开看,避免刚开始就把平台层做过大。
- 让你先补可见性,再回到治理和工作流做落地。
首批精选入口
35 个入口热门 5上升 9
Hermes Agenthermes-agent.nousresearch.comHermes AgentNous Research 的自托管 self-improving agent,强调长期记忆、技能生成、消息入口、模型灵活性和持续运行。研发 · 成熟社区 · 最新热门Self-improving自托管 agentSkillsModel Context Protocolmodelcontextprotocol.ioModel Context ProtocolMCP 的官方协议文档和官方 GitHub 组织入口。研发 · 官方 · 最新热门MCP协议官方OpenAI Agents SDKopenai.github.ioOpenAI Agents SDK轻量官方 SDK,覆盖 agent、tool calling、handoff 和 guardrails。研发 · 官方 · 最新热门官方 SDKHandoffGuardrailsOpenClawopenclaw.aiOpenClaw本地优先的开源个人 AI assistant / autonomous agent,可通过聊天入口管理邮件、日历、浏览器、命令和多 agent 任务。研发 · 成熟社区 · 最新热门个人 AI assistantOpen-source agentLocal-firstVercel AI SDKai-sdk.devVercel AI SDKVercel / Next.js 团队维护的 TypeScript AI 应用开发工具包,覆盖 streaming、tool calling、UI hooks 和 provider 接入。研发 · 官方 · 最新热门TypeScriptStreaming UIWeb AI appBrowser Usebrowser-use.comBrowser Use让 LLM 控制浏览器完成网页任务的开源自动化框架与云服务入口。研发 · 成熟社区 · 快速上升Browser agent自动化
