Langfuse 可观测性与评估管道搭建教程：追踪、提示管理、评分与实验

一句话看懂

Langfuse 开源 LLM 工程平台教程：用真实或模拟 LLM 实现追踪、提示管理、评分与实验的完整管道。

MarkTechPost 发布了一篇 Langfuse 教程，指导开发者从零搭建完整的 LLM 可观测性与评估管道。Langfuse 是一个开源 LLM 工程平台，支持 tracing、prompt management、scoring、datasets 和 experiments。

教程亮点在于：它既可以使用真实的 OpenAI API key，也可以使用内置的确定性 mock LLM，让没有付费模型访问权限的开发者也能学习所有核心功能。

具体步骤包括：

教程代码完整，可直接在 Colab 中运行，适合作为 LLM 工程化的入门实践。

对国内开发者来说，Langfuse 是一个值得关注的工具，原因如下：

无需梯子也能用：Langfuse 支持自托管（self-hosted），你可以部署在自己的服务器上，完全避免数据出境问题。教程中也提供了自托管 URL 的配置选项。
国产平替参考：国内类似平台如 ModelScope 的 DashScope 可观测性、百度千帆的调试工具等，但 Langfuse 的开源和灵活性更高。对于需要自建 LLM 工程管道的团队，Langfuse 是一个轻量级选择。
降低学习门槛：mock LLM 的设计非常贴心，国内开发者如果暂时没有 OpenAI 或国产大模型 API 密钥，也能完整走通流程，理解 tracing、scoring 等概念。
合规友好：数据可以完全留在本地，适合对数据安全要求高的企业场景。

一个尚未被广泛讨论的盲点：Langfuse 的 prompt management 功能与国内流行的提示词管理工具（如 PromptBase、Dify 的提示词管理）相比，更强调版本控制和实验对比，这对需要精细化迭代 prompt 的团队很有价值。

如果你正在寻找一个开源、可自托管的 LLM 可观测性工具，Langfuse 的这套教程是快速上手的绝佳起点。