4266 字

21 分钟

LangChain 底层原理

2026-04-24

LangChain

/

LCEL

/

Runnable

/

原理

LangChain 底层原理#

本篇是 01_LangChain概述与核心架构的延续，将深入 LangChain 框架的三大基石：LCEL 表达式语言、Runnable 协议与回调系统。掌握这些底层机制后，你将具备调试复杂链、自定义组件、以及进行性能优化的能力。

1 为什么需要理解底层原理#

类比：会开车 vs 懂发动机
你可以只学 API 调用来”开车上路”，但当链路报错、Token 消耗异常、流式输出卡顿时，只有理解底层管道和协议的人才能快速定位问题。就像赛车手不只会踩油门，还要理解引擎的工作方式。

理解底层原理带来的具体收益：

场景	只会用 API	理解底层原理
调试	看到报错一头雾水	能沿着 Runnable 链路逐步定位
性能优化	不知道瓶颈在哪	能用回调系统精确测量每一步耗时与 Token 消耗
自定义扩展	只能用现成组件	能实现自定义 Runnable，无缝接入管道
流式输出	不理解为什么某些链不支持流式	理解 `stream` 协议的传播机制
异步并发	不敢用 `ainvoke`	理解同步/异步双轨设计，放心使用高并发模式

2 LCEL（LangChain Expression Language）#

2.1 什么是 LCEL#

LCEL（LangChain Expression Language） 是 LangChain 0.3+ 中构建链（Chain）的声明式语法。它的核心理念借鉴了 Unix 管道：

类比：Unix 管道
在 Shell 中你可以写 cat file.txt | grep "error" | wc -l，数据从左到右依次流经每个命令。LCEL 做的事情完全一样——用 Python 的 | 运算符把多个组件串联起来，上一个组件的输出自动成为下一个组件的输入。

1
Prompt → Model → OutputParser
2
  ↓        ↓         ↓
3
构造提示词  调用LLM   解析输出

2.2 LCEL 的设计动机#

在 LangChain 早期版本（0.1 之前），构建链需要继承 Chain 基类并重写大量方法。这带来了几个痛点：

代码冗长：自定义一个简单链也要写几十行样板代码
流式支持困难：每个 Chain 子类需要单独实现流式逻辑
异步支持不统一：有些 Chain 支持异步，有些不支持
组合性差：把两个 Chain 串联需要手动处理输入输出映射

LCEL 通过统一的 Runnable 协议解决了这些问题——任何实现了 Runnable 接口的组件都自动获得 invoke、stream、batch、ainvoke、astream、abatch 等全套能力。

版本提示
LangChain 0.3+ 已经完全拥抱 LCEL，旧的 LLMChain、SequentialChain 等类已被标记为 Legacy。新项目应始终使用 LCEL 构建链。

2.3 管道操作符 `|` 的工作原理#

Python 中 | 运算符的行为由 __or__ 和 __ror__ 魔术方法定义。LangChain 在 Runnable 基类中重写了这两个方法：

1
# 伪代码：Runnable 中 | 的实现原理
2
class Runnable:
3
    def __or__(self, other):
4
        return RunnableSequence(self, other)
5

6
    def __ror__(self, other):
7
        return RunnableSequence(coerce_to_runnable(other), self)

当你写 prompt | model | parser 时，实际发生的是：

prompt | model → 返回 RunnableSequence([prompt, model])
RunnableSequence([prompt, model]) | parser → 返回 RunnableSequence([prompt, model, parser])

最终得到一个包含三个步骤的 RunnableSequence 对象。调用它的 invoke 方法时，数据会依次流经每个步骤。

2.4 完整示例：构建一个管道#

1
# pip install langchain langchain-openai
2

3
from langchain_core.prompts import ChatPromptTemplate
4
from langchain_core.output_parsers import StrOutputParser
5
from langchain_openai import ChatOpenAI
6

7
# 1. 定义提示模板
8
prompt = ChatPromptTemplate.from_messages([
9
    ("system", "你是一位专业的技术写作助手。"),
10
    ("human", "请用一段话解释什么是 {concept}。")
11
])
12

13
# 2. 定义模型
14
model = ChatOpenAI(model="gpt-4o-mini", temperature=0.3)
15

16
# 3. 定义输出解析器
17
parser = StrOutputParser()
18

19
# 4. 用 LCEL 管道串联
20
chain = prompt | model | parser
21

22
# 5. 调用
23
result = chain.invoke({"concept": "向量数据库"})
24
print(result)

这段代码的数据流：

2.5 LCEL 的核心优势#

流式输出（Streaming）#

1
# 流式输出 —— 逐 token 打印
2
for chunk in chain.stream({"concept": "向量数据库"}):
3
    print(chunk, end="", flush=True)

LCEL 链中的每个 Runnable 都实现了 stream 方法。当你调用链的 stream 时，数据会以流式管道的方式传播：模型每产出一个 token，StrOutputParser 就立即解析并 yield 出来，无需等待完整响应。

异步支持（Async）#

1
import asyncio
2

3
async def main():
4
    result = await chain.ainvoke({"concept": "向量数据库"})
5
    print(result)
6

7
asyncio.run(main())

每个 Runnable 都同时提供同步和异步接口。在 Web 服务（如 FastAPI）中使用异步接口可以显著提升并发性能。

批处理（Batch）#

1
# 批量调用 —— 自动并行
2
results = chain.batch([
3
    {"concept": "向量数据库"},
4
    {"concept": "注意力机制"},
5
    {"concept": "RAG"},
6
], config={"max_concurrency": 3})

batch 方法接收一个输入列表，内部会自动使用线程池（同步）或 asyncio.gather（异步）并行执行，max_concurrency 控制最大并发数。

重试与回退（Retry & Fallback）#

1
from langchain_openai import ChatOpenAI
2

3
# 主模型
4
primary = ChatOpenAI(model="gpt-4o")
5

6
# 回退模型
7
fallback = ChatOpenAI(model="gpt-4o-mini")
8

9
# 当 primary 失败时自动切换到 fallback
10
robust_model = primary.with_fallbacks([fallback])
11

12
# 带重试的链
13
chain_with_retry = (prompt | robust_model | parser).with_retry(
14
    stop_after_attempt=3
15
)

实际场景
在生产环境中，模型 API 可能因为限流、超时而失败。with_fallbacks 和 with_retry 让你不用写一行 try-except 就能实现高可用。如果你还想继续往下掌握 bind()、with_config()、listeners、并发控制等工程化配置能力，详见 05_Runnable绑定、配置与监听。

3 Runnable 协议#

Runnable 协议是 LCEL 的基石。LangChain 中几乎所有组件——Prompt、Model、Parser、Retriever——都实现了这个协议。

3.1 核心方法一览#

方法	说明	输入	输出
`invoke(input)`	同步调用，处理单个输入	`Input`	`Output`
`ainvoke(input)`	异步调用，处理单个输入	`Input`	`Output`
`stream(input)`	同步流式输出	`Input`	`Iterator[Output]`
`astream(input)`	异步流式输出	`Input`	`AsyncIterator[Output]`
`batch(inputs)`	同步批量调用	`List[Input]`	`List[Output]`
`abatch(inputs)`	异步批量调用	`List[Input]`	`List[Output]`
`astream_events(input)`	异步流式事件（包含中间步骤）	`Input`	`AsyncIterator[StreamEvent]`

同步 / 异步双轨设计
每个同步方法都有对应的异步版本（前缀 a）。如果子类只实现了同步版本，异步版本会自动通过线程池代理调用；反之亦然。这保证了所有 Runnable 都天然支持异步。

3.2 Runnable 继承体系#

3.3 RunnablePassthrough —— 数据透传#

RunnablePassthrough 将输入原封不动地传递给下一步，常用于在 RunnableParallel 中保留原始输入。

1
# pip install langchain langchain-openai
2

3
from langchain_core.runnables import RunnablePassthrough, RunnableParallel
4
from langchain_core.prompts import ChatPromptTemplate
5
from langchain_core.output_parsers import StrOutputParser
6
from langchain_openai import ChatOpenAI
7

8
prompt = ChatPromptTemplate.from_template(
9
    "根据以下上下文回答问题。\n上下文: {context}\n问题: {question}"
10
)
11
model = ChatOpenAI(model="gpt-4o-mini")
12

13
# 模拟检索函数
14
def fake_retriever(input_dict):
15
    return "LangChain 是一个用于构建 LLM 应用的框架。"
16

17
# RunnablePassthrough.assign() 可以在透传的同时附加新字段
18
chain = (
19
    RunnablePassthrough.assign(context=lambda x: fake_retriever(x))
20
    | prompt
21
    | model
22
    | StrOutputParser()
23
)
24

25
result = chain.invoke({"question": "什么是 LangChain？"})
26
print(result)

应用场景
在 RAG（检索增强生成）管道中，RunnablePassthrough 极为常用——你需要同时把用户问题和检索到的文档传给 Prompt，而 assign() 方法可以在透传原始输入的同时注入检索结果。如果不使用RunnablePassthrough, 检索完成后会丢失原始输入

3.4 RunnableParallel —— 并行执行#

RunnableParallel 接收一个输入，同时传给多个 Runnable 并行执行，最终将各分支的输出合并为一个字典。

1
# pip install langchain langchain-openai
2

3
from langchain_core.runnables import RunnableParallel
4
from langchain_core.prompts import ChatPromptTemplate
5
from langchain_core.output_parsers import StrOutputParser
6
from langchain_openai import ChatOpenAI
7

8
model = ChatOpenAI(model="gpt-4o-mini")
9

10
# 两个不同的处理分支
11
summary_chain = (
12
    ChatPromptTemplate.from_template("用一句话总结: {text}")
13
    | model
14
    | StrOutputParser()
15
)
16

17
keywords_chain = (
18
    ChatPromptTemplate.from_template("提取3个关键词（逗号分隔）: {text}")
19
    | model
20
    | StrOutputParser()
21
)
22

23
# 并行执行两个分支
24
parallel_chain = RunnableParallel(
25
    summary=summary_chain,
26
    keywords=keywords_chain
27
)
28

29
result = parallel_chain.invoke({
30
    "text": "LangChain 是一个用于构建大语言模型应用的开源框架，"
31
            "提供了模块化的组件和丰富的集成。"
32
})
33

34
print(result)
35
# 输出: {"summary": "...", "keywords": "..."}

3.5 RunnableLambda —— 自定义函数包装#

RunnableLambda 将任意 Python 函数包装成 Runnable，使其可以无缝插入 LCEL 管道。

1
# pip install langchain
2

3
from langchain_core.runnables import RunnableLambda
4

5
# 普通 Python 函数
6
def word_count(text: str) -> dict:
7
    words = text.split()
8
    return {"text": text, "word_count": len(words)}
9

10
# 包装为 Runnable
11
word_counter = RunnableLambda(word_count)
12

13
# 支持完整的 Runnable 协议
14
result = word_counter.invoke("LangChain 是一个强大的框架")
15
print(result)  # {"text": "LangChain 是一个强大的框架", "word_count": 5}
16

17
# 也支持批量调用
18
results = word_counter.batch(["你好世界", "Hello World LangChain"])
19
print(results)

异步函数支持
RunnableLambda 同时接受同步和异步函数。如果你传入 async def 定义的协程函数，ainvoke 会直接调用它，无需线程池代理。
1
async def async_process(text: str) -> str:
2
    # 模拟异步 I/O 操作
3
    return text.upper()
4

5
async_runnable = RunnableLambda(async_process)
6
result = await async_runnable.ainvoke("hello")

3.6 RunnableBranch —— 条件路由#

RunnableBranch 根据条件将输入路由到不同的处理分支，类似于 if-elif-else 逻辑。

1
# pip install langchain langchain-openai
2

3
from langchain_core.runnables import RunnableBranch, RunnableLambda
4
from langchain_core.prompts import ChatPromptTemplate
5
from langchain_core.output_parsers import StrOutputParser
6
from langchain_openai import ChatOpenAI
7

8
model = ChatOpenAI(model="gpt-4o-mini")
9

10
# 定义不同话题的处理链
11
tech_chain = (
12
    ChatPromptTemplate.from_template("你是技术专家。请回答: {question}")
13
    | model | StrOutputParser()
14
)
15

16
general_chain = (
17
    ChatPromptTemplate.from_template("你是通用助手。请回答: {question}")
18
    | model | StrOutputParser()
19
)
20

21
# 话题分类函数
22
def is_tech_question(input_dict: dict) -> bool:
23
    tech_keywords = ["代码", "编程", "API", "框架", "数据库", "算法"]
24
    return any(kw in input_dict["question"] for kw in tech_keywords)
25

26
# 构建条件路由
27
branch = RunnableBranch(
28
    (is_tech_question, tech_chain),   # 条件为 True 时走技术链
29
    general_chain                      # 默认走通用链
30
)
31

32
print(branch.invoke({"question": "如何优化数据库查询？"}))
33
# → 技术专家回答
34

35
print(branch.invoke({"question": "今天天气怎么样？"}))
36
# → 通用助手回答

RunnableBranch vs Router
RunnableBranch 适合简单的条件路由。如果你的路由逻辑需要基于 LLM 判断（语义路由），建议使用 LangChain 的 RouterRunnable 或自定义一个 LLM 分类器作为路由层。

3.7 RouterRunnable —— 语义路由#

RouterRunnable 通过 LLM 对输入进行语义分类，再将其分发到对应的处理链，适合路由逻辑无法用简单关键词判断的场景。

1
# pip install langchain langchain-openai
2

3
from langchain_core.runnables import RunnableLambda
4
from langchain_core.prompts import ChatPromptTemplate
5
from langchain_core.output_parsers import StrOutputParser
6
from langchain_openai import ChatOpenAI
7

8
model = ChatOpenAI(model="gpt-4o-mini")
9

10
# 各领域处理链
11
math_chain = (
12
    ChatPromptTemplate.from_template("你是数学专家。请解答: {question}")
13
    | model | StrOutputParser()
14
)
15

16
history_chain = (
17
    ChatPromptTemplate.from_template("你是历史学家。请解答: {question}")
18
    | model | StrOutputParser()
19
)
20

21
general_chain = (
22
    ChatPromptTemplate.from_template("你是通用助手。请回答: {question}")
23
    | model | StrOutputParser()
24
)
25

26
# 路由表：分类标签 → 对应的 Runnable
27
route_map = {
28
    "math":    math_chain,
29
    "history": history_chain,
30
    "general": general_chain,
31
}
32

33
# 第一步：LLM 分类器，输出路由标签
34
classifier_prompt = ChatPromptTemplate.from_template(
35
    "请判断以下问题属于哪个类别，只输出一个单词：math / history / general\n"
36
    "问题: {question}"
37
)
38
classifier = classifier_prompt | model | StrOutputParser()
39

40
# 第二步：根据标签查表分发
41
def route(input_dict: dict) -> str:
42
    label = classifier.invoke(input_dict).strip().lower()
43
    # 未知标签兜底到 general
44
    return route_map.get(label, general_chain).invoke(input_dict)
45

46
router_chain = RunnableLambda(route)
47

48
print(router_chain.invoke({"question": "微积分的基本定理是什么？"}))
49
# → 数学专家回答
50

51
print(router_chain.invoke({"question": "第一次世界大战的导火索是什么？"}))
52
# → 历史学家回答

两阶段执行流程

1
输入: {question: ...}
2
        │
3
        ▼
4
  LLM 分类器
5
  (classifier_prompt | model | StrOutputParser)
6
        │
7
        ▼ label: "math" / "history" / "general"
8
        │
9
  route_map 查表
10
        │
11
   ┌────┴────┬──────────┐
12
   ▼         ▼          ▼
13
math_chain  history_chain  general_chain
14
   └────┬────┴──────────┘
15
        ▼
16
     最终输出

RouterRunnable vs RunnableBranch 对比

维度	RunnableBranch	RouterRunnable（LLM 路由）
路由依据	确定性条件函数（关键词、规则）	LLM 语义理解
适用场景	分类边界清晰、规则可枚举	意图模糊、分类维度复杂
额外开销	无	多一次 LLM 调用
可扩展性	新增分支需修改条件函数	只需扩充路由表和提示词

应用场景

在多智能体（Multi-Agent）或客服系统中，RouterRunnable 常作为意图识别层——用户输入经过 LLM 分类后，自动分发给售前、售后、技术支持等不同的专业子链，无需为每个意图手写判断规则。路由标签也可扩展为结构化 JSON，同时携带置信度等元数据供下游链使用。

4 回调系统（Callbacks）#

4.1 回调的作用#

回调系统是 LangChain 的可观测性基础设施。每当 Runnable 执行关键操作时，会触发对应的回调事件，你可以通过注册回调处理器（Callback Handler）来监听这些事件。

常见用途：

日志记录：记录每一步的输入输出
性能监控：测量每个组件的执行耗时
Token 计数：统计 LLM 调用的 Token 消耗和费用
链路追踪：与 LangSmith 等平台集成
自定义 Hook：在特定事件发生时执行自定义逻辑（如发送通知、写入数据库）

4.2 BaseCallbackHandler 的关键方法#

所有回调处理器都继承自 BaseCallbackHandler，它定义了一组生命周期钩子：

方法	触发时机
`on_llm_start`	LLM 调用开始
`on_llm_new_token`	LLM 产出新 token（流式时）
`on_llm_end`	LLM 调用结束
`on_llm_error`	LLM 调用出错
`on_chain_start`	Chain / Runnable 执行开始
`on_chain_end`	Chain / Runnable 执行结束
`on_chain_error`	Chain / Runnable 执行出错
`on_tool_start`	Tool 调用开始
`on_tool_end`	Tool 调用结束
`on_retriever_start`	Retriever 检索开始
`on_retriever_end`	Retriever 检索结束

异步回调
如果你的回调处理器需要执行异步操作（如写入异步数据库），可以继承 AsyncCallbackHandler 并实现以 a 开头的异步版本方法。

4.3 内置回调 vs 自定义回调#

LangChain 提供了几个开箱即用的回调处理器：

内置回调	用途
`StdOutCallbackHandler`	将事件打印到标准输出，适合开发调试
`StreamingStdOutCallbackHandler`	流式打印 LLM 输出的每个 token
`LangChainTracer`	将链路追踪数据发送到 LangSmith

1
# pip install langchain langchain-openai
2

3
from langchain_openai import ChatOpenAI
4
from langchain_core.callbacks import StdOutCallbackHandler
5

6
model = ChatOpenAI(model="gpt-4o-mini")
7

8
# 方式 1：在 invoke 时传入回调
9
result = model.invoke(
10
    "你好",
11
    config={"callbacks": [StdOutCallbackHandler()]}
12
)
13

14
# 方式 2：在构造时绑定回调
15
model_with_cb = ChatOpenAI(
16
    model="gpt-4o-mini",
17
    callbacks=[StdOutCallbackHandler()]
18
)

4.4 实战：自定义 Token 计数回调#

下面的示例实现一个自定义回调，用于在每次 LLM 调用后统计 Token 消耗：

1
# pip install langchain langchain-openai
2

3
from langchain_core.callbacks import BaseCallbackHandler
4
from langchain_core.outputs import LLMResult
5
from langchain_openai import ChatOpenAI
6
from typing import Any
7

8

9
class TokenCounterCallback(BaseCallbackHandler):
10
    """自定义回调：统计 Token 消耗"""
11

12
    def __init__(self):
13
        self.total_prompt_tokens = 0
14
        self.total_completion_tokens = 0
15
        self.total_cost = 0.0
16
        self.call_count = 0
17

18
    def on_llm_end(self, response: LLMResult, **kwargs: Any) -> None:
19
        """LLM 调用结束时触发"""
20
        self.call_count += 1
21

22
        # 从 response 中提取 token 使用信息
23
        if response.llm_output:
24
            token_usage = response.llm_output.get("token_usage", {})
25
            prompt_tokens = token_usage.get("prompt_tokens", 0)
26
            completion_tokens = token_usage.get("completion_tokens", 0)
27

28
            self.total_prompt_tokens += prompt_tokens
29
            self.total_completion_tokens += completion_tokens
30

31
            print(f"\n--- 第 {self.call_count} 次调用 ---")
32
            print(f"  Prompt tokens:     {prompt_tokens}")
33
            print(f"  Completion tokens: {completion_tokens}")
34
            print(f"  Total tokens:      {prompt_tokens + completion_tokens}")
35

36
    def report(self) -> str:
37
        """打印累计统计报告"""
38
        total = self.total_prompt_tokens + self.total_completion_tokens
39
        return (
40
            f"\n===== Token 使用统计 =====\n"
41
            f"总调用次数:       {self.call_count}\n"
42
            f"总 Prompt tokens:  {self.total_prompt_tokens}\n"
43
            f"总 Completion tokens: {self.total_completion_tokens}\n"
44
            f"总 Token 数:       {total}\n"
45
        )
46

47

48
# 使用示例
49
counter = TokenCounterCallback()
50
model = ChatOpenAI(model="gpt-4o-mini")
51

52
# 多次调用
53
model.invoke("什么是 LCEL？", config={"callbacks": [counter]})
54
model.invoke("什么是 Runnable？", config={"callbacks": [counter]})
55

56
# 打印累计报告
57
print(counter.report())

生产建议
在生产环境中，建议将 Token 计数持久化到数据库或监控平台（如 Prometheus），并结合各模型的计费标准自动计算成本。LangSmith 自身也提供了完善的 Token 追踪功能，详见 03_开发环境与LangSmith监控。

4.5 回调的传播机制#

回调在 LCEL 链中是自动传播的。当你在链的 invoke 调用中传入 callbacks 参数时，链内部的每个 Runnable 都会接收到这些回调：

1
# pip install langchain langchain-openai
2

3
from langchain_core.prompts import ChatPromptTemplate
4
from langchain_core.output_parsers import StrOutputParser
5
from langchain_openai import ChatOpenAI
6

7
chain = (
8
    ChatPromptTemplate.from_template("解释 {topic}")
9
    | ChatOpenAI(model="gpt-4o-mini")
10
    | StrOutputParser()
11
)
12

13
# counter 会收到链中每个步骤的事件
14
counter = TokenCounterCallback()
15
chain.invoke({"topic": "Transformer"}, config={"callbacks": [counter]})

5 类型系统与序列化#

5.1 消息类型体系#

LangChain 使用统一的消息类型来表示对话中的不同角色。这些类型定义在 langchain_core.messages 中：

消息类型	说明	对应角色
`SystemMessage`	系统指令，设定模型行为	system
`HumanMessage`	用户输入	user
`AIMessage`	模型回复	assistant
`ToolMessage`	工具调用的返回结果	tool
`FunctionMessage`	函数调用结果（Legacy，建议用 ToolMessage）	function

1
# pip install langchain-core
2

3
from langchain_core.messages import (
4
    SystemMessage,
5
    HumanMessage,
6
    AIMessage,
7
    ToolMessage,
8
)
9

10
messages = [
11
    SystemMessage(content="你是一个有帮助的助手。"),
12
    HumanMessage(content="北京今天天气怎么样？"),
13
    AIMessage(
14
        content="",
15
        additional_kwargs={
16
            "tool_calls": [{
17
                "id": "call_abc123",
18
                "type": "function",
19
                "function": {
20
                    "name": "get_weather",
21
                    "arguments": '{"city": "北京"}'
22
                }
23
            }]
24
        }
25
    ),
26
    ToolMessage(
27
        content='{"temp": 22, "condition": "晴"}',
28
        tool_call_id="call_abc123"
29
    ),
30
    AIMessage(content="北京今天天气晴朗，气温约 22 度。"),
31
]

消息的可序列化性
所有消息类型都继承自 BaseMessage，支持 dict() / json() 序列化，方便持久化到数据库或通过 API 传输。如果你想继续理解这些消息对象如何通过 BaseChatMessageHistory 持久化，并被 RunnableWithMessageHistory 自动注入 Prompt，详见 04_Prompt编排与会话历史。

5.2 Runnable 的输入输出类型推断#

每个 Runnable 都声明了自己的输入类型（InputType）和输出类型（OutputType）。当多个 Runnable 通过 | 组合成 RunnableSequence 时，LangChain 会自动推断整条链的输入输出类型：

1
# pip install langchain langchain-openai
2

3
from langchain_core.prompts import ChatPromptTemplate
4
from langchain_core.output_parsers import StrOutputParser
5
from langchain_openai import ChatOpenAI
6

7
chain = (
8
    ChatPromptTemplate.from_template("翻译成英文: {text}")
9
    | ChatOpenAI(model="gpt-4o-mini")
10
    | StrOutputParser()
11
)
12

13
# 查看链的输入输出 Schema
14
print(chain.input_schema.model_json_schema())
15
# {'properties': {'text': {'title': 'Text', 'type': 'string'}},
16
#  'required': ['text'], 'title': 'PromptInput', 'type': 'object'}
17

18
print(chain.output_schema.model_json_schema())
19
# {'title': 'StrOutputParserOutput', 'type': 'string'}