模型

旗舰模型

模型概述

OpenAI API 由一组具有不同能力和价格点的多样化模型驱动。您还可以通过微调对我们的模型进行自定义,以满足您的特定用例。

模型类型描述
GPT 模型我们快速、多功能、高智能的旗舰模型
推理模型我们的 o 系列推理模型擅长处理复杂的多步骤任务
GPT-4o 实时能够处理实时文本和音频输入输出的 GPT-4o 模型
GPT-4o 音频通过 REST API 处理音频输入输出的 GPT-4o 模型
DALL·E可以根据自然语言提示生成和编辑图像的模型
TTS可以将文本转换为自然语音的模型集
Whisper可以将音频转换为文本的模型
Embeddings可以将文本转换为数值形式的模型集
Moderation经过微调的模型,可以检测文本是否敏感或不安全
已弃用已弃用模型的完整列表及其建议的替代品

我们还发布了开源模型,包括 Point-EWhisperJukeboxCLIP

上下文窗口

本页上的模型将列出上下文窗口,指的是单个请求中可以使用的最大令牌数,包括输入、输出和推理令牌。例如,当使用 o1 模型聊天补全 发出 API 请求时,以下令牌计数将计入上下文窗口总数:

  • 输入令牌(您在 messages 数组中包含的输入)
  • 输出令牌(响应您的提示生成的令牌)
  • 推理令牌(模型用于规划响应的令牌)

超过上下文窗口限制生成的令牌可能会在 API 响应中被截断。

上下文窗口可视化

您可以使用 令牌化工具 估算消息将使用的令牌数量。

模型 ID 别名和快照

在下表中,您将看到可以在 REST API 中使用的模型 ID,例如 聊天补全 以生成输出。其中一些模型 ID 是别名,指向特定的日期快照

例如,gpt-4o 模型 ID 是一个别名,指向 GPT-4o 的特定日期快照。这些别名指向的日期快照会定期更新为新快照,通常在新快照发布几个月后更新。下表中的别名模型 ID 会注明它们当前指向的模型 ID。

使用模型别名的 API 请求

import OpenAI from "openai";
const openai = new OpenAI();

const completion = await openai.chat.completions.create({
    model: "gpt-4o",
    messages: [
        { role: "developer", content: "你是一个有帮助的助手。" },
        {
            role: "user",
            content: "写一个关于递归的海鸥鲜花。",
        },
    ],
    store: true,
});

console.log(completion.choices[0].message);
from openai import OpenAI
client = OpenAI()

completion = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "developer", "content": "你是一个有帮助的助手。"},
        {
            "role": "user",
            "content": "写一个关于递归的海鸥鲜花。"
        }
    ]
)

print(completion.choices[0].message)
curl "https://api.openai.com/v1/chat/completions" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $OPENAI_API_KEY" \
    -d '{
        "model": "gpt-4o",
        "messages": [
            {
                "role": "developer",
                "content": "你是一个有帮助的助手。"
            },
            {
                "role": "user",
                "content": "写一个关于递归的海鸥鲜花。"
            }
        ]
    }'

在 API 请求中使用别名作为模型 ID 时,响应体将包含用于生成响应的实际模型 ID。

{
  "id": "chatcmpl-Af6LFgbOPpqu2fhGsVktc9xFaYUVh",
  "object": "chat.completion",
  "created": 1734359189,
  "model": "gpt-4o-2024-08-06",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Code within a loop,  \nFunction calls itself again,  \nInfinite echoes.",
        "refusal": null
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {}
}

当前模型别名

以下是当前模型别名及其更新为新版本的指导(如果有)。

别名指向的模型
gpt-4ogpt-4o-2024-08-06
chatgpt-4o-latestChatGPT 中使用的最新版本
gpt-4o-minigpt-4o-mini-2024-07-18
o1o1-2024-12-17
o1-minio1-mini-2024-09-12
o3-minio3-mini-2025-01-31
o1-previewo1-preview-2024-09-12
gpt-4o-realtime-previewgpt-4o-realtime-preview-2024-12-17
gpt-4o-mini-realtime-previewgpt-4o-mini-realtime-preview-2024-12-17
gpt-4o-audio-previewgpt-4o-audio-preview-2024-12-17

在生产应用程序中,最佳实践是使用日期模型快照 ID,而不是可能定期更改的别名。

GPT-4o

GPT-4o(“o”代表“全能”)是我们多功能、高智能的旗舰模型。它接受文本和图像输入,并生成文本输出(包括结构化输出)。了解如何在我们的文本生成指南中使用 GPT-4o。

chatgpt-4o-latest 模型 ID 持续指向 ChatGPT 中使用的 GPT-4o 版本。当 ChatGPT 的 GPT-4o 模型发生重大变化时,它会频繁更新。

GPT-4o 模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
gpt-4o↳ gpt-4o-2024-08-06128,000 令牌16,384 令牌
gpt-4o-2024-11-20128,000 令牌16,384 令牌
gpt-4o-2024-08-06128,000 令牌16,384 令牌
gpt-4o-2024-05-13128,000 令牌4,096 令牌
chatgpt-4o-latest↳ ChatGPT 中使用的 GPT-4o128,000 令牌16,384 令牌

GPT-4o mini

GPT-4o mini(“o”代表“全能”)是一个快速、经济的小型模型,适用于专注任务。它接受文本和图像输入,并生成文本输出(包括结构化输出)。它非常适合微调,并且可以从像 GPT-4o 这样的大型模型中蒸馏出类似的结果,以更低的成本和延迟生成类似的结果。

GPT-4o-mini 模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
gpt-4o-mini↳ gpt-4o-mini-2024-07-18128,000 令牌16,384 令牌
gpt-4o-mini-2024-07-18128,000 令牌16,384 令牌

o1 和 o1-mini

o1 系列模型经过强化学习训练,能够执行复杂的推理。o1 模型在回答之前会进行思考,生成一个长的内部思维链,然后再响应用户。在我们的推理指南中了解 o1 模型的功能。

o1 推理模型旨在解决跨领域的难题。o1-mini 是一个更快、更经济的推理模型,但我们建议使用更新的 o3-mini 模型,它在相同的延迟和价格下具有更高的智能。

最新的 o1 模型支持文本和图像输入,并生成文本输出(包括结构化输出)。o1-mini 目前仅支持文本输入和输出。

o1 和 o1-mini 模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
o1↳ o1-2024-12-17200,000 令牌100,000 令牌
o1-2024-12-17200,000 令牌100,000 令牌
o1-mini↳ o1-mini-2024-09-12128,000 令牌65,536 令牌
o1-mini-2024-09-12128,000 令牌65,536 令牌
o1-preview↳ o1-preview-2024-09-12128,000 令牌32,768 令牌
o1-preview-2024-09-12128,000 令牌32,768 令牌

o3-mini

o3-mini 是我们最新的小型推理模型,在相同的成本和延迟目标下提供高智能。o3-mini 还支持关键的开发者功能,如结构化输出函数调用批处理 API 等。与 o 系列的其他模型一样,它擅长科学、数学和编码任务。

o3-mini 模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
o3-mini↳ o3-mini-2025-01-31200,000 令牌100,000 令牌
o3-mini-2025-01-31200,000 令牌100,000 令牌

GPT-4o 和 GPT-4o-mini 实时

Beta

这是 GPT-4o 和 GPT-4o-mini 实时模型的预览版本。这些模型能够通过 WebRTC 或 WebSocket 接口实时响应音频和文本输入。在实时 API 指南中了解更多信息。

GPT-4o 实时模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
gpt-4o-realtime-preview↳ gpt-4o-realtime-preview-2024-12-17128,000 令牌4,096 令牌
gpt-4o-realtime-preview-2024-12-17128,000 令牌4,096 令牌
gpt-4o-realtime-preview-2024-10-01128,000 令牌4,096 令牌
gpt-4o-mini-realtime-preview↳ gpt-4o-mini-realtime-preview-2024-12-17128,000 令牌4,096 令牌
gpt-4o-mini-realtime-preview-2024-12-17128,000 令牌4,096 令牌

GPT-4o 和 GPT-4o-mini 音频

Beta

这是 GPT-4o 音频模型的预览版本。这些模型接受音频输入和输出,并可以在聊天补全 REST API 中使用。了解更多

GPT-4o 音频模型的知识截止日期为 2023 年 10 月

模型上下文窗口最大输出令牌
gpt-4o-audio-preview↳ gpt-4o-audio-preview-2024-12-17128,000 令牌16,384 令牌
gpt-4o-audio-preview-2024-12-17128,000 令牌16,384 令牌
gpt-4o-audio-preview-2024-10-01128,000 令牌16,384 令牌
gpt-4o-mini-audio-preview↳ gpt-4o-mini-audio-preview-2024-12-17128,000 令牌16,384 令牌
gpt-4o-mini-audio-preview-2024-12-17128,000 令牌16,384 令牌

GPT-4 Turbo 和 GPT-4

GPT-4 是高智能 GPT 模型的旧版本,可在聊天补全中使用。在文本生成指南中了解更多信息。最新 GPT-4 Turbo 版本的知识截止日期为 2023 年 12 月

模型上下文窗口最大输出令牌
gpt-4-turbo↳ gpt-4-turbo-2024-04-09128,000 令牌4,096 令牌
gpt-4-turbo-2024-04-09128,000 令牌4,096 令牌
gpt-4-turbo-preview↳ gpt-4-0125-preview128,000 令牌4,096 令牌
gpt-4-0125-preview128,000 令牌4,096 令牌
gpt-4-1106-preview128,000 令牌4,096 令牌
gpt-4↳ gpt-4-06138,192 令牌8,192 令牌
gpt-4-06138,192 令牌8,192 令牌
gpt-4-03148,192 令牌8,192 令牌

GPT-3.5 Turbo

GPT-3.5 Turbo 模型可以理解和生成自然语言或代码,并已针对使用聊天补全 API 的聊天进行了优化,但也适用于非聊天任务。

截至 2024 年 7 月,应使用 gpt-4o-mini 代替 gpt-3.5-turbo,因为它更便宜、功能更强、多模态且速度相同。gpt-3.5-turbo 仍可在 API 中使用。

模型上下文窗口最大输出令牌知识截止日期
gpt-3.5-turbo-012516,385 令牌4,096 令牌2021 年 9 月
gpt-3.5-turbo16,385 令牌4,096 令牌2021 年 9 月
gpt-3.5-turbo-110616,385 令牌4,096 令牌2021 年 9 月
gpt-3.5-turbo-instruct4,096 令牌4,096 令牌2021 年 9 月

DALL·E

DALL·E 是一个可以根据自然语言描述生成和编辑图像的人工智能系统。DALL·E 3 目前支持根据提示创建特定大小的新图像。DALL·E 2 还支持编辑现有图像或创建用户提供图像的变体。

DALL·E 3 可通过我们的图像 API 以及 DALL·E 2 使用。您可以通过 ChatGPT Plus 试用 DALL·E 3。

模型描述
dall-e-3最新的 DALL·E 模型,发布于 2023 年 11 月。了解更多。
dall-e-2前一个版本的 DALL·E,发布于 2022 年 11 月。第二代 DALL·E 模型,比原始模型生成的图像更真实、更准确,分辨率提高了 4 倍。

文字转语音 (TTS)


TTS 是一个将文本转换为自然语音的 AI 模型。我们提供了两个版本:tts-1 优化了实时文本转语音的应用,而 tts-1-hd 优化了语音质量。这些模型可以与 音频 API 中的语音接口 一起使用。

模型描述
tts-1最新的文字转语音模型,优化了速度。
tts-1-hd最新的文字转语音模型,优化了语音质量。

Whisper


Whisper 是一个通用的语音识别模型,经过大量的多语言语音数据训练,支持语音识别、语音翻译和语言识别等多任务。Whisper v2-large 模型通过 whisper-1 名称在 API 中提供。

目前,API 中的 Whisper 模型与开源版本没有差异,但我们提供了优化的推理过程,使得通过 API 调用 Whisper 时,比通过其他方式运行要更快。有关 Whisper 的更多技术细节,可以 阅读论文

嵌入 (Embeddings)


嵌入是文本的数值表示,可以用于衡量两段文本的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。可以在 公告博客文章 中了解我们最新的嵌入模型。

模型输出维度
text-embedding-3-large最强大的嵌入模型,适用于英文和非英文任务
text-embedding-3-small比第二代 ada 嵌入模型性能更强
text-embedding-ada-002最强大的第二代嵌入模型,替代了 16 个第一代模型

内容审核 (Moderation)


内容审核模型旨在检查内容是否符合 OpenAI 的 使用政策。这些模型提供分类能力,用于检测仇恨言论、自残、色情内容、暴力等类别的内容。可以在我们的 内容审核指南 中了解更多关于文本和图像审核的信息。

模型最大令牌数
omni-moderation-latest当前指向 omni-moderation-2024-09-26 版本。
omni-moderation-2024-09-26最新的多模态内容审核模型,能够分析文本和图像。
text-moderation-latest当前指向 text-moderation-007 版本。
text-moderation-stable当前指向 text-moderation-007 版本。
text-moderation-007前一代文本审核模型。我们预计 omni-moderation-* 模型将是未来的默认选择。

GPT 基础模型


GPT 基础模型可以理解和生成自然语言或代码,但未经过指令跟随训练。这些模型是原始 GPT-3 基础模型的替代品,使用遗留的 Completions API。大多数客户应选择 GPT-3.5 或 GPT-4。

模型最大令牌数知识截止日期
babbage-002替代 GPT-3 ada 和 babbage 基础模型。16,384 令牌
davinci-002替代 GPT-3 curie 和 davinci 基础模型。16,384 令牌

数据使用


您的数据属于您自己。

自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据不会用于训练或改进 OpenAI 模型(除非您明确选择与我们共享数据)。

为了帮助识别滥用行为,API 数据最多会保留 30 天,之后将被删除(除非法律要求另行保留)。对于需要零数据保留的信任客户,可以提供零数据保留选项。使用零数据保留时,请求和响应主体不会被持久化到任何日志机制中,仅存在于内存中以服务请求。

请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPTDALL·E Labs

默认使用政策按端点

端点用于训练的数据默认保留期是否可零数据保留
/v1/chat/completions*30天是,除了 (a) 图像输入、(b) 提供的结构化输出的架构,或 (c) 音频输出。*
/v1/assistants30天
/v1/threads30天
/v1/threads/messages30天
/v1/threads/runs30天
/v1/vector_stores30天
/v1/threads/runs/steps30天
/v1/images/generations30天
/v1/images/edits30天
/v1/images/variations30天
/v1/embeddings30天
/v1/audio/transcriptions零数据保留-
/v1/audio/translations零数据保留-
/v1/audio/speech30天
/v1/files客户删除前
/v1/fine_tuning/jobs客户删除前
/v1/batches客户删除前
/v1/moderations零数据保留-
/v1/completions30天
/v1/realtime (beta)30天

模型端点兼容性

端点最新模型
/v1/assistants所有 o 系列,所有 GPT-4o(除 chatgpt-4o-latest 外),GPT-4o-mini,GPT-4 和 GPT-3.5 Turbo 模型。检索工具需要 gpt-4-turbo-preview(及其后续版本)或 gpt-3.5-turbo-1106(及其后续版本)。
/v1/audio/transcriptionswhisper-1
/v1/audio/translationswhisper-1
/v1/audio/speechtts-1, tts-1-hd
/v1/chat/completions所有 o 系列,GPT-4o(除了实时预览),GPT-4o-mini,GPT-4 和 GPT-3.5 Turbo 模型及其日期版本。chatgpt-4o-latest 动态模型。经过微调的 gpt-4o,gpt-4o-mini,gpt-4,gpt-3.5-turbo。
/v1/completions (遗留)gpt-3.5-turbo-instruct,babbage-002,davinci-002
/v1/embeddingstext-embedding-3-small,text-embedding-3-large,text-embedding-ada-002
/v1/fine_tuning/jobsgpt-4o,gpt-4o-mini,gpt-4,gpt-3.5-turbo
/v1/moderationstext-moderation-stable,text-moderation-latest
/v1/images/generationsdall-e-2,dall-e-3
/v1/realtime (beta)gpt-4o-realtime-preview,gpt-4o-realtime-preview-2024-10-01

此列表排除了所有的 已废弃模型

Was this page helpful?