01 - OpenAI API 概述
第 01 章 · OpenAI API 概述
了解 OpenAI 提供的完整 API 能力、模型体系、定价结构与能力边界,为后续对接打下基础。
1.1 OpenAI API 能力全景
OpenAI 提供的 API 可分为以下几大类:
| 类别 | API | 典型用途 |
|---|---|---|
| 文本生成 | Chat Completions | 对话、写作、摘要、翻译 |
| 图像理解 | Vision | 图片描述、OCR、图表分析 |
| 函数调用 | Function Calling | 结构化输出、工具集成 |
| 向量嵌入 | Embeddings | 语义搜索、RAG、聚类 |
| 助手平台 | Assistants | 多轮对话、文件检索、代码执行 |
| 语音转文字 | Whisper | 音频转录、字幕生成 |
| 文字转语音 | TTS | 语音播报、有声读物 |
| 图像生成 | DALL-E | 创意图片、设计素材 |
| 内容审核 | Moderation | 内容安全、合规检测 |
1.2 模型体系
1.2.1 GPT 系列模型
| 模型 | Model ID | 上下文窗口 | 特点 | 定价 (输入/输出) |
|---|---|---|---|---|
| GPT-4o | gpt-4o | 128K | 多模态旗舰,速度快 | $2.50 / $10.00 per 1M tokens |
| GPT-4o mini | gpt-4o-mini | 128K | 高性价比,日常任务首选 | $0.15 / $0.60 per 1M tokens |
| GPT-4.1 | gpt-4.1 | 1M | 超长上下文,编码能力强 | $2.00 / $8.00 per 1M tokens |
| GPT-4.1 mini | gpt-4.1-mini | 1M | GPT-4.1 轻量版 | $0.40 / $1.60 per 1M tokens |
| GPT-4.1 nano | gpt-4.1-nano | 1M | 极速低成本 | $0.10 / $0.40 per 1M tokens |
| o3 | o3 | 200K | 推理模型旗舰 | $2.00 / $8.00 per 1M tokens |
| o4-mini | o4-mini | 200K | 高效推理模型 | $1.10 / $4.40 per 1M tokens |
注意:模型定价会随时间调整,请以 OpenAI 官方定价页 为准。
1.2.2 专用模型
| 模型 | Model ID | 用途 |
|---|---|---|
| DALL-E 3 | dall-e-3 | 图片生成 |
| DALL-E 2 | dall-e-2 | 图片生成/编辑/变体 |
| Whisper | whisper-1 | 语音转文字 |
| TTS | tts-1 / tts-1-hd | 文字转语音 |
| Text Embedding 3 Large | text-embedding-3-large | 向量嵌入 (3072维) |
| Text Embedding 3 Small | text-embedding-3-small | 向量嵌入 (1536维) |
| Moderation | omni-moderation-latest | 内容审核 |
1.3 如何选择模型
需要什么能力?
│
┌───────────────┼───────────────┐
│ │ │
文本生成 图像/音频 向量/搜索
│ │ │
┌────┴────┐ ┌────┴────┐ Embeddings
│ │ │ │
日常任务 复杂推理 理解 生成
│ │ │ │
4o-mini o3/ Vision DALL-E
4.1-nano o4-mini Whisper TTS
选型决策表:
| 需求场景 | 推荐模型 | 理由 |
|---|---|---|
| 日常对话/客服 | GPT-4o mini | 低成本、低延迟 |
| 复杂分析/写作 | GPT-4o | 质量最佳 |
| 超长文档处理 | GPT-4.1 | 1M 上下文窗口 |
| 数学/编程推理 | o3 / o4-mini | 深度推理能力 |
| 图片理解 | GPT-4o (Vision) | 多模态原生支持 |
| 语音转录 | Whisper | 多语言、高准确率 |
| 语义搜索 | text-embedding-3-large | 3072维高精度 |
1.4 API 调用基础
所有 API 共享统一的 REST 风格接口:
Base URL: https://api.openai.com/v1
认证方式: Bearer Token (API Key)
内容格式: application/json
基本请求示例
curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-4o-mini",
"messages": [
{"role": "user", "content": "你好,请做个自我介绍"}
]
}'
响应格式
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"created": 1717000000,
"model": "gpt-4o-mini-2024-07-18",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "你好!我是一个AI助手..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 12,
"completion_tokens": 50,
"total_tokens": 62
}
}
1.5 能力边界
擅长的领域
- ✅ 自然语言理解与生成
- ✅ 多语言翻译
- ✅ 代码生成与解释
- ✅ 数据分析与总结
- ✅ 创意写作
- ✅ 图像/音频理解
局限性
- ❌ 知识有时效性:训练数据有截止日期,不了解最新事件
- ❌ 可能产生幻觉:会"编造"看似合理但错误的信息
- ❌ 不擅长精确计算:复杂数学建议使用 Code Interpreter
- ❌ 无持久记忆:每次请求独立,需自行管理上下文
- ❌ 不能访问互联网:无法获取实时数据(除非通过 Function Calling 扩展)
重要约束
| 约束项 | 说明 |
|---|---|
| 上下文窗口 | 超出会截断,需控制 token 用量 |
| 速率限制 | 按 Tier 分级,新账户限制较严 |
| 内容策略 | 禁止生成违法/有害内容 |
| 并发限制 | 同时请求数有上限 |
1.6 定价与成本控制
Token 计算规则
- 英文:约 1 token ≈ 4 个字符 / 0.75 个单词
- 中文:约 1 token ≈ 1-2 个汉字
- 图片:根据分辨率和 detail 参数计算
成本估算示例
假设每天 10,000 次 API 调用,平均每次 1000 input + 500 output tokens:
| 模型 | 日成本 | 月成本 |
|---|---|---|
| GPT-4o mini | $1.50 | ~$45 |
| GPT-4o | $25.00 | ~$750 |
| GPT-4.1 | $20.00 | ~$600 |
| o4-mini | $11.00 | ~$330 |
提示:善用
gpt-4o-mini和gpt-4.1-nano处理简单任务,可大幅降低成本。
1.7 速率限制 (Rate Limits)
OpenAI 根据账户 Tier 分级限流:
| Tier | 等级 | RPM (请求/分钟) | TPM (tokens/分钟) |
|---|---|---|---|
| Free | 免费 | 3 | 40,000 |
| Tier 1 | $5 充值 | 500 | 40,000 |
| Tier 2 | $50 充值 | 5,000 | 80,000 |
| Tier 3 | $100 充值 | 5,000 | 160,000 |
| Tier 4 | $250 充值 | 10,000 | 1,000,000 |
| Tier 5 | $1,000 充值 | 10,000 | 2,000,000 |
1.8 业务场景示例
场景一:智能客服系统
- 模型:GPT-4o mini
- 日调用量:50,000 次
- 月成本估算:~$225
场景二:文档智能分析
- 模型:GPT-4.1(利用 1M 上下文)
- 单次分析 500 页 PDF
- 按需调用,成本可控
场景三:内容创作平台
- 模型:GPT-4o(质量优先)
- 结合 DALL-E 生成配图
- 流式输出提升用户体验
1.9 扩展阅读
下一章:02 - 环境搭建与配置 — 获取 API Key、安装 SDK、初始化项目。