模型 - OpenAI 中文文档

模型

旗舰模型

GPT 模型
GPT 模型快速、多功能、成本效益高且可定制。

使用 GPT-4o
使用 GPT-4o mini
推理模型
推理模型使用链式思维推理，擅长处理复杂任务。

使用 o1
使用 o3-mini
模型定价详情

模型概述

OpenAI API 由一组具有不同能力和价格点的多样化模型驱动。您还可以通过微调对我们的模型进行自定义，以满足您的特定用例。

模型类型	描述
GPT 模型	我们快速、多功能、高智能的旗舰模型
推理模型	我们的 o 系列推理模型擅长处理复杂的多步骤任务
GPT-4o 实时	能够处理实时文本和音频输入输出的 GPT-4o 模型
GPT-4o 音频	通过 REST API 处理音频输入输出的 GPT-4o 模型
DALL·E	可以根据自然语言提示生成和编辑图像的模型
TTS	可以将文本转换为自然语音的模型集
Whisper	可以将音频转换为文本的模型
Embeddings	可以将文本转换为数值形式的模型集
Moderation	经过微调的模型，可以检测文本是否敏感或不安全
已弃用	已弃用模型的完整列表及其建议的替代品

我们还发布了开源模型，包括 Point-E、Whisper、Jukebox 和 CLIP。

上下文窗口

本页上的模型将列出上下文窗口，指的是单个请求中可以使用的最大令牌数，包括输入、输出和推理令牌。例如，当使用 o1 模型向聊天补全发出 API 请求时，以下令牌计数将计入上下文窗口总数：

输入令牌（您在 messages 数组中包含的输入）
输出令牌（响应您的提示生成的令牌）
推理令牌（模型用于规划响应的令牌）

超过上下文窗口限制生成的令牌可能会在 API 响应中被截断。

上下文窗口可视化

您可以使用令牌化工具估算消息将使用的令牌数量。

模型 ID 别名和快照

在下表中，您将看到可以在 REST API 中使用的模型 ID，例如聊天补全以生成输出。其中一些模型 ID 是别名，指向特定的日期快照。

例如，gpt-4o 模型 ID 是一个别名，指向 GPT-4o 的特定日期快照。这些别名指向的日期快照会定期更新为新快照，通常在新快照发布几个月后更新。下表中的别名模型 ID 会注明它们当前指向的模型 ID。

使用模型别名的 API 请求

import OpenAI from "openai";
const openai = new OpenAI();

const completion = await openai.chat.completions.create({
    model: "gpt-4o",
    messages: [
        { role: "developer", content: "你是一个有帮助的助手。" },
        {
            role: "user",
            content: "写一个关于递归的海鸥鲜花。",
        },
    ],
    store: true,
});

console.log(completion.choices[0].message);

from openai import OpenAI
client = OpenAI()

completion = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "developer", "content": "你是一个有帮助的助手。"},
        {
            "role": "user",
            "content": "写一个关于递归的海鸥鲜花。"
        }
    ]
)

print(completion.choices[0].message)

curl "https://api.openai.com/v1/chat/completions" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $OPENAI_API_KEY" \
    -d '{
        "model": "gpt-4o",
        "messages": [
            {
                "role": "developer",
                "content": "你是一个有帮助的助手。"
            },
            {
                "role": "user",
                "content": "写一个关于递归的海鸥鲜花。"
            }
        ]
    }'

在 API 请求中使用别名作为模型 ID 时，响应体将包含用于生成响应的实际模型 ID。

{
  "id": "chatcmpl-Af6LFgbOPpqu2fhGsVktc9xFaYUVh",
  "object": "chat.completion",
  "created": 1734359189,
  "model": "gpt-4o-2024-08-06",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Code within a loop,  \nFunction calls itself again,  \nInfinite echoes.",
        "refusal": null
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {}
}

当前模型别名

以下是当前模型别名及其更新为新版本的指导（如果有）。

别名	指向的模型
gpt-4o	gpt-4o-2024-08-06
chatgpt-4o-latest	ChatGPT 中使用的最新版本
gpt-4o-mini	gpt-4o-mini-2024-07-18
o1	o1-2024-12-17
o1-mini	o1-mini-2024-09-12
o3-mini	o3-mini-2025-01-31
o1-preview	o1-preview-2024-09-12
gpt-4o-realtime-preview	gpt-4o-realtime-preview-2024-12-17
gpt-4o-mini-realtime-preview	gpt-4o-mini-realtime-preview-2024-12-17
gpt-4o-audio-preview	gpt-4o-audio-preview-2024-12-17

在生产应用程序中，最佳实践是使用日期模型快照 ID，而不是可能定期更改的别名。

GPT-4o

GPT-4o（“o”代表“全能”）是我们多功能、高智能的旗舰模型。它接受文本和图像输入，并生成文本输出（包括结构化输出）。了解如何在我们的文本生成指南中使用 GPT-4o。

chatgpt-4o-latest 模型 ID 持续指向 ChatGPT 中使用的 GPT-4o 版本。当 ChatGPT 的 GPT-4o 模型发生重大变化时，它会频繁更新。

GPT-4o 模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
gpt-4o↳ gpt-4o-2024-08-06	128,000 令牌	16,384 令牌
gpt-4o-2024-11-20	128,000 令牌	16,384 令牌
gpt-4o-2024-08-06	128,000 令牌	16,384 令牌
gpt-4o-2024-05-13	128,000 令牌	4,096 令牌
chatgpt-4o-latest↳ ChatGPT 中使用的 GPT-4o	128,000 令牌	16,384 令牌

GPT-4o mini

GPT-4o mini（“o”代表“全能”）是一个快速、经济的小型模型，适用于专注任务。它接受文本和图像输入，并生成文本输出（包括结构化输出）。它非常适合微调，并且可以从像 GPT-4o 这样的大型模型中蒸馏出类似的结果，以更低的成本和延迟生成类似的结果。

GPT-4o-mini 模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
gpt-4o-mini↳ gpt-4o-mini-2024-07-18	128,000 令牌	16,384 令牌
gpt-4o-mini-2024-07-18	128,000 令牌	16,384 令牌

o1 和 o1-mini

o1 系列模型经过强化学习训练，能够执行复杂的推理。o1 模型在回答之前会进行思考，生成一个长的内部思维链，然后再响应用户。在我们的推理指南中了解 o1 模型的功能。

o1 推理模型旨在解决跨领域的难题。o1-mini 是一个更快、更经济的推理模型，但我们建议使用更新的 o3-mini 模型，它在相同的延迟和价格下具有更高的智能。

最新的 o1 模型支持文本和图像输入，并生成文本输出（包括结构化输出）。o1-mini 目前仅支持文本输入和输出。

o1 和 o1-mini 模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
o1↳ o1-2024-12-17	200,000 令牌	100,000 令牌
o1-2024-12-17	200,000 令牌	100,000 令牌
o1-mini↳ o1-mini-2024-09-12	128,000 令牌	65,536 令牌
o1-mini-2024-09-12	128,000 令牌	65,536 令牌
o1-preview↳ o1-preview-2024-09-12	128,000 令牌	32,768 令牌
o1-preview-2024-09-12	128,000 令牌	32,768 令牌

o3-mini

o3-mini 是我们最新的小型推理模型，在相同的成本和延迟目标下提供高智能。o3-mini 还支持关键的开发者功能，如结构化输出、函数调用、批处理 API 等。与 o 系列的其他模型一样，它擅长科学、数学和编码任务。

o3-mini 模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
o3-mini↳ o3-mini-2025-01-31	200,000 令牌	100,000 令牌
o3-mini-2025-01-31	200,000 令牌	100,000 令牌

GPT-4o 和 GPT-4o-mini 实时

Beta

这是 GPT-4o 和 GPT-4o-mini 实时模型的预览版本。这些模型能够通过 WebRTC 或 WebSocket 接口实时响应音频和文本输入。在实时 API 指南中了解更多信息。

GPT-4o 实时模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
gpt-4o-realtime-preview↳ gpt-4o-realtime-preview-2024-12-17	128,000 令牌	4,096 令牌
gpt-4o-realtime-preview-2024-12-17	128,000 令牌	4,096 令牌
gpt-4o-realtime-preview-2024-10-01	128,000 令牌	4,096 令牌
gpt-4o-mini-realtime-preview↳ gpt-4o-mini-realtime-preview-2024-12-17	128,000 令牌	4,096 令牌
gpt-4o-mini-realtime-preview-2024-12-17	128,000 令牌	4,096 令牌

GPT-4o 和 GPT-4o-mini 音频

Beta

这是 GPT-4o 音频模型的预览版本。这些模型接受音频输入和输出，并可以在聊天补全 REST API 中使用。了解更多。

GPT-4o 音频模型的知识截止日期为 2023 年 10 月。

模型	上下文窗口	最大输出令牌
gpt-4o-audio-preview↳ gpt-4o-audio-preview-2024-12-17	128,000 令牌	16,384 令牌
gpt-4o-audio-preview-2024-12-17	128,000 令牌	16,384 令牌
gpt-4o-audio-preview-2024-10-01	128,000 令牌	16,384 令牌
gpt-4o-mini-audio-preview↳ gpt-4o-mini-audio-preview-2024-12-17	128,000 令牌	16,384 令牌
gpt-4o-mini-audio-preview-2024-12-17	128,000 令牌	16,384 令牌

GPT-4 Turbo 和 GPT-4

GPT-4 是高智能 GPT 模型的旧版本，可在聊天补全中使用。在文本生成指南中了解更多信息。最新 GPT-4 Turbo 版本的知识截止日期为 2023 年 12 月。

模型	上下文窗口	最大输出令牌
gpt-4-turbo↳ gpt-4-turbo-2024-04-09	128,000 令牌	4,096 令牌
gpt-4-turbo-2024-04-09	128,000 令牌	4,096 令牌
gpt-4-turbo-preview↳ gpt-4-0125-preview	128,000 令牌	4,096 令牌
gpt-4-0125-preview	128,000 令牌	4,096 令牌
gpt-4-1106-preview	128,000 令牌	4,096 令牌
gpt-4↳ gpt-4-0613	8,192 令牌	8,192 令牌
gpt-4-0613	8,192 令牌	8,192 令牌
gpt-4-0314	8,192 令牌	8,192 令牌

GPT-3.5 Turbo

GPT-3.5 Turbo 模型可以理解和生成自然语言或代码，并已针对使用聊天补全 API 的聊天进行了优化，但也适用于非聊天任务。

截至 2024 年 7 月，应使用 gpt-4o-mini 代替 gpt-3.5-turbo，因为它更便宜、功能更强、多模态且速度相同。gpt-3.5-turbo 仍可在 API 中使用。

模型	上下文窗口	最大输出令牌	知识截止日期
gpt-3.5-turbo-0125	16,385 令牌	4,096 令牌	2021 年 9 月
gpt-3.5-turbo	16,385 令牌	4,096 令牌	2021 年 9 月
gpt-3.5-turbo-1106	16,385 令牌	4,096 令牌	2021 年 9 月
gpt-3.5-turbo-instruct	4,096 令牌	4,096 令牌	2021 年 9 月

DALL·E

DALL·E 是一个可以根据自然语言描述生成和编辑图像的人工智能系统。DALL·E 3 目前支持根据提示创建特定大小的新图像。DALL·E 2 还支持编辑现有图像或创建用户提供图像的变体。

DALL·E 3 可通过我们的图像 API 以及 DALL·E 2 使用。您可以通过 ChatGPT Plus 试用 DALL·E 3。

模型	描述
dall-e-3	最新的 DALL·E 模型，发布于 2023 年 11 月。了解更多。
dall-e-2	前一个版本的 DALL·E，发布于 2022 年 11 月。第二代 DALL·E 模型，比原始模型生成的图像更真实、更准确，分辨率提高了 4 倍。

文字转语音 (TTS)

TTS 是一个将文本转换为自然语音的 AI 模型。我们提供了两个版本：tts-1 优化了实时文本转语音的应用，而 tts-1-hd 优化了语音质量。这些模型可以与音频 API 中的语音接口一起使用。

模型	描述
tts-1	最新的文字转语音模型，优化了速度。
tts-1-hd	最新的文字转语音模型，优化了语音质量。

Whisper

Whisper 是一个通用的语音识别模型，经过大量的多语言语音数据训练，支持语音识别、语音翻译和语言识别等多任务。Whisper v2-large 模型通过 whisper-1 名称在 API 中提供。

目前，API 中的 Whisper 模型与开源版本没有差异，但我们提供了优化的推理过程，使得通过 API 调用 Whisper 时，比通过其他方式运行要更快。有关 Whisper 的更多技术细节，可以阅读论文。

嵌入 (Embeddings)

嵌入是文本的数值表示，可以用于衡量两段文本的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。可以在公告博客文章中了解我们最新的嵌入模型。

模型	输出维度
text-embedding-3-large	最强大的嵌入模型，适用于英文和非英文任务
text-embedding-3-small	比第二代 ada 嵌入模型性能更强
text-embedding-ada-002	最强大的第二代嵌入模型，替代了 16 个第一代模型

内容审核 (Moderation)

内容审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类能力，用于检测仇恨言论、自残、色情内容、暴力等类别的内容。可以在我们的内容审核指南中了解更多关于文本和图像审核的信息。

模型	最大令牌数
omni-moderation-latest	当前指向 omni-moderation-2024-09-26 版本。
omni-moderation-2024-09-26	最新的多模态内容审核模型，能够分析文本和图像。
text-moderation-latest	当前指向 text-moderation-007 版本。
text-moderation-stable	当前指向 text-moderation-007 版本。
text-moderation-007	前一代文本审核模型。我们预计 omni-moderation-* 模型将是未来的默认选择。

GPT 基础模型

GPT 基础模型可以理解和生成自然语言或代码，但未经过指令跟随训练。这些模型是原始 GPT-3 基础模型的替代品，使用遗留的 Completions API。大多数客户应选择 GPT-3.5 或 GPT-4。

模型	最大令牌数	知识截止日期
babbage-002	替代 GPT-3 ada 和 babbage 基础模型。	16,384 令牌
davinci-002	替代 GPT-3 curie 和 davinci 基础模型。	16,384 令牌

数据使用

您的数据属于您自己。

自 2023 年 3 月 1 日起，发送到 OpenAI API 的数据不会用于训练或改进 OpenAI 模型（除非您明确选择与我们共享数据）。

为了帮助识别滥用行为，API 数据最多会保留 30 天，之后将被删除（除非法律要求另行保留）。对于需要零数据保留的信任客户，可以提供零数据保留选项。使用零数据保留时，请求和响应主体不会被持久化到任何日志机制中，仅存在于内存中以服务请求。

请注意，此数据政策不适用于 OpenAI 的非 API 消费者服务，如 ChatGPT 或 DALL·E Labs。

默认使用政策按端点

端点	用于训练的数据	默认保留期	是否可零数据保留
/v1/chat/completions*	无	30天	是，除了 (a) 图像输入、(b) 提供的结构化输出的架构，或 (c) 音频输出。*
/v1/assistants	无	30天	否
/v1/threads	无	30天	否
/v1/threads/messages	无	30天	否
/v1/threads/runs	无	30天	否
/v1/vector_stores	无	30天	否
/v1/threads/runs/steps	无	30天	否
/v1/images/generations	无	30天	否
/v1/images/edits	无	30天	否
/v1/images/variations	无	30天	否
/v1/embeddings	无	30天	是
/v1/audio/transcriptions	无	零数据保留	-
/v1/audio/translations	无	零数据保留	-
/v1/audio/speech	无	30天	是
/v1/files	无	客户删除前	否
/v1/fine_tuning/jobs	无	客户删除前	否
/v1/batches	无	客户删除前	否
/v1/moderations	无	零数据保留	-
/v1/completions	无	30天	是
/v1/realtime (beta)	无	30天	是

模型端点兼容性

端点	最新模型
/v1/assistants	所有 o 系列，所有 GPT-4o（除 chatgpt-4o-latest 外），GPT-4o-mini，GPT-4 和 GPT-3.5 Turbo 模型。检索工具需要 gpt-4-turbo-preview（及其后续版本）或 gpt-3.5-turbo-1106（及其后续版本）。
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/audio/speech	tts-1, tts-1-hd
/v1/chat/completions	所有 o 系列，GPT-4o（除了实时预览），GPT-4o-mini，GPT-4 和 GPT-3.5 Turbo 模型及其日期版本。chatgpt-4o-latest 动态模型。经过微调的 gpt-4o，gpt-4o-mini，gpt-4，gpt-3.5-turbo。
/v1/completions (遗留)	gpt-3.5-turbo-instruct，babbage-002，davinci-002
/v1/embeddings	text-embedding-3-small，text-embedding-3-large，text-embedding-ada-002
/v1/fine_tuning/jobs	gpt-4o，gpt-4o-mini，gpt-4，gpt-3.5-turbo
/v1/moderations	text-moderation-stable，text-moderation-latest
/v1/images/generations	dall-e-2，dall-e-3
/v1/realtime (beta)	gpt-4o-realtime-preview，gpt-4o-realtime-preview-2024-10-01

此列表排除了所有的已废弃模型。