强曰为道

与天地相似,故不违。知周乎万物,而道济天下,故不过。旁行而不流,乐天知命,故不忧.
文档目录

01 - OpenAI API 概述

第 01 章 · OpenAI API 概述

了解 OpenAI 提供的完整 API 能力、模型体系、定价结构与能力边界,为后续对接打下基础。


1.1 OpenAI API 能力全景

OpenAI 提供的 API 可分为以下几大类:

类别API典型用途
文本生成Chat Completions对话、写作、摘要、翻译
图像理解Vision图片描述、OCR、图表分析
函数调用Function Calling结构化输出、工具集成
向量嵌入Embeddings语义搜索、RAG、聚类
助手平台Assistants多轮对话、文件检索、代码执行
语音转文字Whisper音频转录、字幕生成
文字转语音TTS语音播报、有声读物
图像生成DALL-E创意图片、设计素材
内容审核Moderation内容安全、合规检测

1.2 模型体系

1.2.1 GPT 系列模型

模型Model ID上下文窗口特点定价 (输入/输出)
GPT-4ogpt-4o128K多模态旗舰,速度快$2.50 / $10.00 per 1M tokens
GPT-4o minigpt-4o-mini128K高性价比,日常任务首选$0.15 / $0.60 per 1M tokens
GPT-4.1gpt-4.11M超长上下文,编码能力强$2.00 / $8.00 per 1M tokens
GPT-4.1 minigpt-4.1-mini1MGPT-4.1 轻量版$0.40 / $1.60 per 1M tokens
GPT-4.1 nanogpt-4.1-nano1M极速低成本$0.10 / $0.40 per 1M tokens
o3o3200K推理模型旗舰$2.00 / $8.00 per 1M tokens
o4-minio4-mini200K高效推理模型$1.10 / $4.40 per 1M tokens

注意:模型定价会随时间调整,请以 OpenAI 官方定价页 为准。

1.2.2 专用模型

模型Model ID用途
DALL-E 3dall-e-3图片生成
DALL-E 2dall-e-2图片生成/编辑/变体
Whisperwhisper-1语音转文字
TTStts-1 / tts-1-hd文字转语音
Text Embedding 3 Largetext-embedding-3-large向量嵌入 (3072维)
Text Embedding 3 Smalltext-embedding-3-small向量嵌入 (1536维)
Moderationomni-moderation-latest内容审核

1.3 如何选择模型

                    需要什么能力?
                         │
         ┌───────────────┼───────────────┐
         │               │               │
      文本生成         图像/音频       向量/搜索
         │               │               │
    ┌────┴────┐     ┌────┴────┐     Embeddings
    │         │     │         │
  日常任务  复杂推理  理解  生成
    │         │     │         │
  4o-mini   o3/   Vision  DALL-E
  4.1-nano  o4-mini Whisper  TTS

选型决策表

需求场景推荐模型理由
日常对话/客服GPT-4o mini低成本、低延迟
复杂分析/写作GPT-4o质量最佳
超长文档处理GPT-4.11M 上下文窗口
数学/编程推理o3 / o4-mini深度推理能力
图片理解GPT-4o (Vision)多模态原生支持
语音转录Whisper多语言、高准确率
语义搜索text-embedding-3-large3072维高精度

1.4 API 调用基础

所有 API 共享统一的 REST 风格接口:

Base URL: https://api.openai.com/v1
认证方式: Bearer Token (API Key)
内容格式: application/json

基本请求示例

curl https://api.openai.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "你好,请做个自我介绍"}
    ]
  }'

响应格式

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1717000000,
  "model": "gpt-4o-mini-2024-07-18",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好!我是一个AI助手..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 50,
    "total_tokens": 62
  }
}

1.5 能力边界

擅长的领域

  • ✅ 自然语言理解与生成
  • ✅ 多语言翻译
  • ✅ 代码生成与解释
  • ✅ 数据分析与总结
  • ✅ 创意写作
  • ✅ 图像/音频理解

局限性

  • 知识有时效性:训练数据有截止日期,不了解最新事件
  • 可能产生幻觉:会"编造"看似合理但错误的信息
  • 不擅长精确计算:复杂数学建议使用 Code Interpreter
  • 无持久记忆:每次请求独立,需自行管理上下文
  • 不能访问互联网:无法获取实时数据(除非通过 Function Calling 扩展)

重要约束

约束项说明
上下文窗口超出会截断,需控制 token 用量
速率限制按 Tier 分级,新账户限制较严
内容策略禁止生成违法/有害内容
并发限制同时请求数有上限

1.6 定价与成本控制

Token 计算规则

  • 英文:约 1 token ≈ 4 个字符 / 0.75 个单词
  • 中文:约 1 token ≈ 1-2 个汉字
  • 图片:根据分辨率和 detail 参数计算

成本估算示例

假设每天 10,000 次 API 调用,平均每次 1000 input + 500 output tokens:

模型日成本月成本
GPT-4o mini$1.50~$45
GPT-4o$25.00~$750
GPT-4.1$20.00~$600
o4-mini$11.00~$330

提示:善用 gpt-4o-minigpt-4.1-nano 处理简单任务,可大幅降低成本。


1.7 速率限制 (Rate Limits)

OpenAI 根据账户 Tier 分级限流:

Tier等级RPM (请求/分钟)TPM (tokens/分钟)
Free免费340,000
Tier 1$5 充值50040,000
Tier 2$50 充值5,00080,000
Tier 3$100 充值5,000160,000
Tier 4$250 充值10,0001,000,000
Tier 5$1,000 充值10,0002,000,000

1.8 业务场景示例

场景一:智能客服系统

  • 模型:GPT-4o mini
  • 日调用量:50,000 次
  • 月成本估算:~$225

场景二:文档智能分析

  • 模型:GPT-4.1(利用 1M 上下文)
  • 单次分析 500 页 PDF
  • 按需调用,成本可控

场景三:内容创作平台

  • 模型:GPT-4o(质量优先)
  • 结合 DALL-E 生成配图
  • 流式输出提升用户体验

1.9 扩展阅读


下一章02 - 环境搭建与配置 — 获取 API Key、安装 SDK、初始化项目。