2499 字

12 分钟

国内外大模型 API 调用

2026-04-24

LangChain

/

API

/

OpenAI

/

Anthropic

/

通义千问

/

Deepseek

国内外大模型 API 调用#

上一篇 01_大模型选择与私有化部署解决了”选什么模型、怎么本地跑”的问题。本篇聚焦 云端 API 调用——通过 LangChain 的统一抽象层，用几乎相同的代码接入 OpenAI、Anthropic、通义千问、Deepseek 等国内外主流大模型。

1 LangChain 的模型抽象层#

1.1 通俗理解#

万能充电器类比
LangChain 就像一个万能充电器——不管你的手机是 iPhone（OpenAI）、三星（Anthropic）还是小米（通义千问），只要插上对应的转接头（Provider 类），充电接口（调用方式）都一样：model.invoke("你好")。

这意味着：

切换模型不改业务逻辑：把 ChatOpenAI 换成 ChatAnthropic，上下游代码零修改。
链（Chain）和智能体（Agent）天然兼容：LCEL 管道中的 Model 环节可以随时热插拔。
流式、批量、异步全部开箱即用，不需要为每个模型单独写适配代码。

1.2 BaseChatModel 接口统一了什么#

LangChain 通过 BaseChatModel 抽象基类定义了所有 Chat Model 的公共契约：

方法	说明
`invoke(messages)`	同步调用，返回 `AIMessage`
`ainvoke(messages)`	异步调用
`stream(messages)`	同步流式输出，逐 token 返回
`astream(messages)`	异步流式输出
`batch(messages_list)`	批量调用
`bind_tools(tools)`	绑定工具（Function Calling）

关键认知
不管底层是 GPT-4o、Claude 3.5 还是 Qwen-Max，上层代码只面向 BaseChatModel 的这几个方法编程。这就是依赖倒置在 LLM 应用中的体现。

1.3 继承关系一览#

1
BaseChatModel（抽象基类）
2
├── ChatOpenAI          → OpenAI GPT 系列
3
├── ChatAnthropic       → Anthropic Claude 系列
4
├── ChatTongyi          → 阿里通义千问
5
├── ChatOllama          → 本地 Ollama 模型
6
├── ChatZhipuAI         → 智谱 GLM 系列
7
├── QianfanChatEndpoint → 百度文心一言
8
└── ...更多社区集成

每个子类只需实现 _generate() 或 _stream() 等底层方法，就自动获得上面表格中的全部能力。详见 01_LangChain概述与核心架构。

2 OpenAI 系列模型调用#

2.1 API Key 获取与配置#

前往 OpenAI Platform 注册并创建 API Key，通过环境变量配置：

1
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

安全提醒
永远不要将 API Key 提交到 Git 仓库。建议使用 .env + python-dotenv 管理。

2.2 ChatOpenAI 核心参数#

1
pip install langchain-openai

参数	类型	说明
`model`	str	模型标识，如 `"gpt-4o"`、`"gpt-4o-mini"`
`temperature`	float	取值 0-2，越高输出越随机；事实类任务建议 0，创意类 0.7-1.0
`max_tokens`	int	限制输出长度，防止模型”话太多”消耗额度
`streaming`	bool	设为 `True` 配合 `stream()` 方法使用
`timeout`	int	请求超时秒数
`max_retries`	int	API 调用失败时自动重试次数

2.3 代码示例#

基础调用#

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4
from langchain_core.messages import HumanMessage, SystemMessage
5

6
llm = ChatOpenAI(model="gpt-4o", temperature=0)
7

8
messages = [
9
    SystemMessage(content="你是一位资深 Python 工程师。"),
10
    HumanMessage(content="用三句话解释什么是装饰器。"),
11
]
12

13
response = llm.invoke(messages)
14
print(response.content)

流式输出#

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4
from langchain_core.messages import HumanMessage
5

6
llm = ChatOpenAI(model="gpt-4o", temperature=0.7, streaming=True)
7

8
for chunk in llm.stream([HumanMessage(content="给我讲一个关于 AI 的短故事")]):
9
    print(chunk.content, end="", flush=True)

流式输出的价值
在 Web 应用中，流式输出让用户”边生成边看”，显著提升体验。stream() 返回的每个 chunk 是 AIMessageChunk 对象。

3 Anthropic Claude 模型调用#

前往 Anthropic Console 创建 API Key 并设置环境变量 ANTHROPIC_API_KEY。

1
# pip install langchain-anthropic
2

3
from langchain_anthropic import ChatAnthropic
4
from langchain_core.messages import HumanMessage, SystemMessage
5

6
llm = ChatAnthropic(
7
    model="claude-sonnet-4-20250514",
8
    temperature=0,
9
    max_tokens=1024,
10
)
11

12
messages = [
13
    SystemMessage(content="你是一位数据分析专家，回答简洁准确。"),
14
    HumanMessage(content="解释什么是 p-value，给一个实际例子。"),
15
]
16

17
response = llm.invoke(messages)
18
print(response.content)

Claude 的特点

上下文窗口大（Claude 3.5 Sonnet 支持 200K tokens），适合长文档分析。

System Prompt 遵从性强，适合角色扮演和格式化输出场景。

temperature 范围为 0-1（与 OpenAI 的 0-2 不同）。

4 国内模型调用#

4.1 通义千问（Qwen）#

通义千问是阿里云推出的大语言模型，通过 DashScope 平台提供 API。前往阿里云 DashScope 获取 API Key 并设置环境变量 DASHSCOPE_API_KEY。

方式一：使用 ChatTongyi#

1
# pip install langchain-community dashscope
2

3
from langchain_community.chat_models.tongyi import ChatTongyi
4
from langchain_core.messages import HumanMessage
5

6
llm = ChatTongyi(model="qwen-max", temperature=0.7, max_tokens=1024)
7

8
response = llm.invoke([HumanMessage(content="简述唐朝的科举制度。")])
9
print(response.content)

方式二：OpenAI 兼容接口（推荐）#

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4

5
llm = ChatOpenAI(
6
    model="qwen-max",
7
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
8
    api_key="sk-xxxxxxxx",
9
    temperature=0.7,
10
)
11

12
response = llm.invoke("用一句话介绍量子计算。")
13
print(response.content)

4.2 Deepseek#

Deepseek 提供高性价比的大模型 API，原生支持 OpenAI 兼容格式。前往 Deepseek Platform 获取 API Key。

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4

5
llm = ChatOpenAI(
6
    model="deepseek-chat",    # deepseek-chat 或 deepseek-reasoner
7
    base_url="https://api.deepseek.com",
8
    api_key="sk-xxxxxxxx",
9
    temperature=0,
10
    max_tokens=2048,
11
)
12

13
response = llm.invoke("解释梯度下降算法的直觉理解。")
14
print(response.content)

Deepseek-Reasoner
deepseek-reasoner（即 DeepSeek-R1）擅长数学推理和复杂逻辑任务，使用方式完全一致，只需改 model 参数。

4.3 百度文心一言（ERNIE Bot）#

文心一言通过 千帆平台 提供 API。设置环境变量 QIANFAN_AK 和 QIANFAN_SK。

1
# pip install langchain-community qianfan
2

3
from langchain_community.chat_models import QianfanChatEndpoint
4
from langchain_core.messages import HumanMessage
5

6
llm = QianfanChatEndpoint(
7
    model="ERNIE-4.0-8K",
8
    temperature=0.7,
9
)
10

11
response = llm.invoke([HumanMessage(content="介绍一下深度学习的发展历程。")])
12
print(response.content)

千帆平台
百度千帆需要在控制台创建应用并获取 Access Key + Secret Key，与 OpenAI 单 Key 模式不同。

4.4 智谱 GLM（ChatGLM）#

智谱 AI 推出的 GLM 系列模型。前往智谱 AI 开放平台获取 API Key。

方式一：使用 ChatZhipuAI#

1
# pip install langchain-community zhipuai
2

3
import os
4
os.environ["ZHIPUAI_API_KEY"] = "your_api_key"
5

6
from langchain_community.chat_models import ChatZhipuAI
7
from langchain_core.messages import HumanMessage
8

9
llm = ChatZhipuAI(model="glm-4-plus", temperature=0.7)
10

11
response = llm.invoke([HumanMessage(content="什么是 Transformer 架构？")])
12
print(response.content)

方式二：OpenAI 兼容接口#

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4

5
llm = ChatOpenAI(
6
    model="glm-4-plus",
7
    base_url="https://open.bigmodel.cn/api/paas/v4",
8
    api_key="your_api_key",
9
)
10

11
response = llm.invoke("Transformer 中的自注意力机制是如何工作的？")
12
print(response.content)

5 通过 OpenAI 兼容接口统一调用#

5.1 为什么可以统一？#

OpenAI 的 Chat Completions API 已成为事实标准。Deepseek、通义千问、智谱 GLM、月之暗面 Kimi 等国内厂商均实现了兼容端点。

核心优势
只需 langchain-openai 一个包，通过修改 base_url 和 model 参数，就能接入几乎所有主流大模型，无需为每个厂商安装单独的 SDK。

5.2 工厂函数：统一调用模式#

1
# pip install langchain-openai
2

3
from langchain_openai import ChatOpenAI
4

5
def create_llm(provider: str) -> ChatOpenAI:
6
    """工厂函数：根据 provider 创建对应的 LLM 实例"""
7
    configs = {
8
        "openai": {
9
            "model": "gpt-4o",
10
            "base_url": "https://api.openai.com/v1",
11
            "api_key": "sk-xxx",
12
        },
13
        "deepseek": {
14
            "model": "deepseek-chat",
15
            "base_url": "https://api.deepseek.com",
16
            "api_key": "sk-xxx",
17
        },
18
        "qwen": {
19
            "model": "qwen-max",
20
            "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
21
            "api_key": "sk-xxx",
22
        },
23
        "glm": {
24
            "model": "glm-4-plus",
25
            "base_url": "https://open.bigmodel.cn/api/paas/v4",
26
            "api_key": "xxx",
27
        },
28
    }
29
    cfg = configs[provider]
30
    return ChatOpenAI(
31
        model=cfg["model"],
32
        base_url=cfg["base_url"],
33
        api_key=cfg["api_key"],
34
        temperature=0,
35
        max_tokens=1024,
36
    )
37

38
# 切换模型只需改一个字符串
39
llm = create_llm("deepseek")
40
response = llm.invoke("什么是向量数据库？")
41
print(response.content)

5.3 兼容端点汇总#

模型厂商	`base_url`	常用 `model`
OpenAI	`https://api.openai.com/v1`	`gpt-4o`、`gpt-4o-mini`
Deepseek	`https://api.deepseek.com`	`deepseek-chat`、`deepseek-reasoner`
通义千问	`https://dashscope.aliyuncs.com/compatible-mode/v1`	`qwen-max`、`qwen-plus`
智谱 GLM	`https://open.bigmodel.cn/api/paas/v4`	`glm-4-plus`、`glm-4-flash`
月之暗面	`https://api.moonshot.cn/v1`	`moonshot-v1-8k`、`moonshot-v1-128k`
零一万物	`https://api.lingyiwanwu.com/v1`	`yi-large`、`yi-medium`

兼容性注意
“OpenAI 兼容”不代表 100% 功能对齐。部分高级特性（如 Structured Output、Parallel Function Calling）在某些厂商的实现中可能不完整，生产环境需充分测试。

5.4 配合 LCEL 实现模型热切换#

结合 01_LangChain概述与核心架构中介绍的 LCEL，可以在 Chain 中灵活切换模型：

1
# pip install langchain-openai langchain-core
2

3
from langchain_core.prompts import ChatPromptTemplate
4
from langchain_core.output_parsers import StrOutputParser
5

6
prompt = ChatPromptTemplate.from_messages([
7
    ("system", "你是一位{role}。"),
8
    ("human", "{question}"),
9
])
10

11
# 构建 Chain —— 模型部分可随时替换
12
chain = prompt | create_llm("deepseek") | StrOutputParser()
13
result = chain.invoke({"role": "物理学家", "question": "为什么天空是蓝色的？"})
14
print(result)
15

16
# 切换到 Qwen，Chain 结构完全不变
17
chain_qwen = prompt | create_llm("qwen") | StrOutputParser()
18
result_qwen = chain_qwen.invoke({"role": "物理学家", "question": "为什么天空是蓝色的？"})

6 模型调用最佳实践#

6.1 错误处理与重试策略#

LangChain 内置了重试机制，也可用 tenacity 做更精细的控制：

1
# pip install langchain-openai tenacity
2

3
from langchain_openai import ChatOpenAI
4
from langchain_core.messages import HumanMessage
5
from tenacity import retry, stop_after_attempt, wait_exponential
6

7
# 方式一：内置参数
8
llm = ChatOpenAI(model="gpt-4o", max_retries=3, timeout=30)
9

10
# 方式二：手动指数退避
11
@retry(
12
    stop=stop_after_attempt(3),
13
    wait=wait_exponential(multiplier=1, min=2, max=30),
14
)
15
def safe_invoke(llm, messages):
16
    return llm.invoke(messages)
17

18
response = safe_invoke(llm, [HumanMessage(content="Hello")])

指数退避
遇到 429（Rate Limit）错误时，使用指数退避（Exponential Backoff）而非固定间隔重试，可以更优雅地应对限流。

6.2 超时配置#

1
# 简单问答：短超时
2
llm_fast = ChatOpenAI(model="gpt-4o-mini", timeout=15)
3

4
# 长文档生成：长超时
5
llm_slow = ChatOpenAI(model="gpt-4o", timeout=120, max_tokens=4096)

6.3 Token 用量控制#

Token 是 API 计费的基本单位，控制手段：

限制 max_tokens：防止输出过长。
精简 System Prompt：冗长的系统提示词消耗大量输入 token。
使用回调监控用量：

1
# pip install langchain-openai langchain-community
2

3
from langchain_openai import ChatOpenAI
4
from langchain_community.callbacks import get_openai_callback
5
from langchain_core.messages import HumanMessage
6

7
llm = ChatOpenAI(model="gpt-4o", temperature=0)
8

9
with get_openai_callback() as cb:
10
    response = llm.invoke([HumanMessage(content="什么是 LangChain？")])
11
    print(f"输入 Tokens:  {cb.prompt_tokens}")
12
    print(f"输出 Tokens:  {cb.completion_tokens}")
13
    print(f"总 Tokens:    {cb.total_tokens}")
14
    print(f"总费用 (USD): ${cb.total_cost:.6f}")

回调兼容性
get_openai_callback 仅适用于 ChatOpenAI，其他模型需查看 response.response_metadata 获取用量信息。

6.4 费用估算#

1
# pip install tiktoken
2

3
import tiktoken
4

5
def estimate_tokens(text: str, model: str = "gpt-4o") -> int:
6
    """估算文本的 token 数量（仅适用于 OpenAI 模型）"""
7
    encoding = tiktoken.encoding_for_model(model)
8
    return len(encoding.encode(text))
9

10
tokens = estimate_tokens("这是一段需要估算 token 的文本。")
11
print(f"预估 token 数: {tokens}")

6.5 各模型 API 对比#

价格信息
以下价格为截至 2025 年初的参考值，实际价格请以各厂商官网为准。1M = 100 万 tokens。

模型	输入价格（/1M tokens）	输出价格（/1M tokens）	最大上下文	速度
GPT-4o	$2.50	$10.00	128K	中等
GPT-4o-mini	$0.15	$0.60	128K	快
Claude 3.5 Sonnet	$3.00	$15.00	200K	中等
Claude 3.5 Haiku	$0.80	$4.00	200K	快
Qwen-Max	~￥0.02/千tokens	~￥0.06/千tokens	32K	中等
Qwen-Plus	~￥0.004/千tokens	~￥0.012/千tokens	128K	快
Deepseek-Chat（V3）	￥1.00/1M	￥2.00/1M	64K	快
GLM-4-Plus	￥0.05/千tokens	￥0.05/千tokens	128K	中等

性价比策略

开发调试阶段：优先使用 gpt-4o-mini、deepseek-chat、qwen-plus 等低价模型。

生产环境：根据任务复杂度选择模型档次，简单任务无需顶配模型。

批量处理：部分厂商提供 Batch API（如 OpenAI），价格可低至一半。