模型
旗舰模型
模型概述
OpenAI API 由一组具有不同能力和价格点的多样化模型驱动。您还可以通过微调对我们的模型进行自定义,以满足您的特定用例。
模型类型 | 描述 |
---|---|
GPT 模型 | 我们快速、多功能、高智能的旗舰模型 |
推理模型 | 我们的 o 系列推理模型擅长处理复杂的多步骤任务 |
GPT-4o 实时 | 能够处理实时文本和音频输入输出的 GPT-4o 模型 |
GPT-4o 音频 | 通过 REST API 处理音频输入输出的 GPT-4o 模型 |
DALL·E | 可以根据自然语言提示生成和编辑图像的模型 |
TTS | 可以将文本转换为自然语音的模型集 |
Whisper | 可以将音频转换为文本的模型 |
Embeddings | 可以将文本转换为数值形式的模型集 |
Moderation | 经过微调的模型,可以检测文本是否敏感或不安全 |
已弃用 | 已弃用模型的完整列表及其建议的替代品 |
我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。
上下文窗口
本页上的模型将列出上下文窗口,指的是单个请求中可以使用的最大令牌数,包括输入、输出和推理令牌。例如,当使用 o1 模型 向 聊天补全 发出 API 请求时,以下令牌计数将计入上下文窗口总数:
- 输入令牌(您在
messages
数组中包含的输入) - 输出令牌(响应您的提示生成的令牌)
- 推理令牌(模型用于规划响应的令牌)
超过上下文窗口限制生成的令牌可能会在 API 响应中被截断。
您可以使用 令牌化工具 估算消息将使用的令牌数量。
模型 ID 别名和快照
在下表中,您将看到可以在 REST API 中使用的模型 ID,例如 聊天补全 以生成输出。其中一些模型 ID 是别名,指向特定的日期快照。
例如,gpt-4o
模型 ID 是一个别名,指向 GPT-4o 的特定日期快照。这些别名指向的日期快照会定期更新为新快照,通常在新快照发布几个月后更新。下表中的别名模型 ID 会注明它们当前指向的模型 ID。
使用模型别名的 API 请求
import OpenAI from "openai";
const openai = new OpenAI();
const completion = await openai.chat.completions.create({
model: "gpt-4o",
messages: [
{ role: "developer", content: "你是一个有帮助的助手。" },
{
role: "user",
content: "写一个关于递归的海鸥鲜花。",
},
],
store: true,
});
console.log(completion.choices[0].message);
from openai import OpenAI
client = OpenAI()
completion = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "developer", "content": "你是一个有帮助的助手。"},
{
"role": "user",
"content": "写一个关于递归的海鸥鲜花。"
}
]
)
print(completion.choices[0].message)
curl "https://api.openai.com/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-4o",
"messages": [
{
"role": "developer",
"content": "你是一个有帮助的助手。"
},
{
"role": "user",
"content": "写一个关于递归的海鸥鲜花。"
}
]
}'
在 API 请求中使用别名作为模型 ID 时,响应体将包含用于生成响应的实际模型 ID。
{
"id": "chatcmpl-Af6LFgbOPpqu2fhGsVktc9xFaYUVh",
"object": "chat.completion",
"created": 1734359189,
"model": "gpt-4o-2024-08-06",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Code within a loop, \nFunction calls itself again, \nInfinite echoes.",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {}
}
当前模型别名
以下是当前模型别名及其更新为新版本的指导(如果有)。
别名 | 指向的模型 |
---|---|
gpt-4o | gpt-4o-2024-08-06 |
chatgpt-4o-latest | ChatGPT 中使用的最新版本 |
gpt-4o-mini | gpt-4o-mini-2024-07-18 |
o1 | o1-2024-12-17 |
o1-mini | o1-mini-2024-09-12 |
o3-mini | o3-mini-2025-01-31 |
o1-preview | o1-preview-2024-09-12 |
gpt-4o-realtime-preview | gpt-4o-realtime-preview-2024-12-17 |
gpt-4o-mini-realtime-preview | gpt-4o-mini-realtime-preview-2024-12-17 |
gpt-4o-audio-preview | gpt-4o-audio-preview-2024-12-17 |
在生产应用程序中,最佳实践是使用日期模型快照 ID,而不是可能定期更改的别名。
GPT-4o
GPT-4o(“o”代表“全能”)是我们多功能、高智能的旗舰模型。它接受文本和图像输入,并生成文本输出(包括结构化输出)。了解如何在我们的文本生成指南中使用 GPT-4o。
chatgpt-4o-latest
模型 ID 持续指向 ChatGPT 中使用的 GPT-4o 版本。当 ChatGPT 的 GPT-4o 模型发生重大变化时,它会频繁更新。
GPT-4o 模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
gpt-4o↳ gpt-4o-2024-08-06 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-2024-11-20 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-2024-08-06 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-2024-05-13 | 128,000 令牌 | 4,096 令牌 |
chatgpt-4o-latest↳ ChatGPT 中使用的 GPT-4o | 128,000 令牌 | 16,384 令牌 |
GPT-4o mini
GPT-4o mini(“o”代表“全能”)是一个快速、经济的小型模型,适用于专注任务。它接受文本和图像输入,并生成文本输出(包括结构化输出)。它非常适合微调,并且可以从像 GPT-4o 这样的大型模型中蒸馏出类似的结果,以更低的成本和延迟生成类似的结果。
GPT-4o-mini 模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
gpt-4o-mini↳ gpt-4o-mini-2024-07-18 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-mini-2024-07-18 | 128,000 令牌 | 16,384 令牌 |
o1 和 o1-mini
o1 系列模型经过强化学习训练,能够执行复杂的推理。o1 模型在回答之前会进行思考,生成一个长的内部思维链,然后再响应用户。在我们的推理指南中了解 o1 模型的功能。
o1 推理模型旨在解决跨领域的难题。o1-mini 是一个更快、更经济的推理模型,但我们建议使用更新的 o3-mini 模型,它在相同的延迟和价格下具有更高的智能。
最新的 o1 模型支持文本和图像输入,并生成文本输出(包括结构化输出)。o1-mini 目前仅支持文本输入和输出。
o1 和 o1-mini 模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
o1↳ o1-2024-12-17 | 200,000 令牌 | 100,000 令牌 |
o1-2024-12-17 | 200,000 令牌 | 100,000 令牌 |
o1-mini↳ o1-mini-2024-09-12 | 128,000 令牌 | 65,536 令牌 |
o1-mini-2024-09-12 | 128,000 令牌 | 65,536 令牌 |
o1-preview↳ o1-preview-2024-09-12 | 128,000 令牌 | 32,768 令牌 |
o1-preview-2024-09-12 | 128,000 令牌 | 32,768 令牌 |
o3-mini
o3-mini 是我们最新的小型推理模型,在相同的成本和延迟目标下提供高智能。o3-mini 还支持关键的开发者功能,如结构化输出、函数调用、批处理 API 等。与 o 系列的其他模型一样,它擅长科学、数学和编码任务。
o3-mini 模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
o3-mini↳ o3-mini-2025-01-31 | 200,000 令牌 | 100,000 令牌 |
o3-mini-2025-01-31 | 200,000 令牌 | 100,000 令牌 |
GPT-4o 和 GPT-4o-mini 实时
Beta
这是 GPT-4o 和 GPT-4o-mini 实时模型的预览版本。这些模型能够通过 WebRTC 或 WebSocket 接口实时响应音频和文本输入。在实时 API 指南中了解更多信息。
GPT-4o 实时模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
gpt-4o-realtime-preview↳ gpt-4o-realtime-preview-2024-12-17 | 128,000 令牌 | 4,096 令牌 |
gpt-4o-realtime-preview-2024-12-17 | 128,000 令牌 | 4,096 令牌 |
gpt-4o-realtime-preview-2024-10-01 | 128,000 令牌 | 4,096 令牌 |
gpt-4o-mini-realtime-preview↳ gpt-4o-mini-realtime-preview-2024-12-17 | 128,000 令牌 | 4,096 令牌 |
gpt-4o-mini-realtime-preview-2024-12-17 | 128,000 令牌 | 4,096 令牌 |
GPT-4o 和 GPT-4o-mini 音频
Beta
这是 GPT-4o 音频模型的预览版本。这些模型接受音频输入和输出,并可以在聊天补全 REST API 中使用。了解更多。
GPT-4o 音频模型的知识截止日期为 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
gpt-4o-audio-preview↳ gpt-4o-audio-preview-2024-12-17 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-audio-preview-2024-12-17 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-audio-preview-2024-10-01 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-mini-audio-preview↳ gpt-4o-mini-audio-preview-2024-12-17 | 128,000 令牌 | 16,384 令牌 |
gpt-4o-mini-audio-preview-2024-12-17 | 128,000 令牌 | 16,384 令牌 |
GPT-4 Turbo 和 GPT-4
GPT-4 是高智能 GPT 模型的旧版本,可在聊天补全中使用。在文本生成指南中了解更多信息。最新 GPT-4 Turbo 版本的知识截止日期为 2023 年 12 月。
模型 | 上下文窗口 | 最大输出令牌 |
---|---|---|
gpt-4-turbo↳ gpt-4-turbo-2024-04-09 | 128,000 令牌 | 4,096 令牌 |
gpt-4-turbo-2024-04-09 | 128,000 令牌 | 4,096 令牌 |
gpt-4-turbo-preview↳ gpt-4-0125-preview | 128,000 令牌 | 4,096 令牌 |
gpt-4-0125-preview | 128,000 令牌 | 4,096 令牌 |
gpt-4-1106-preview | 128,000 令牌 | 4,096 令牌 |
gpt-4↳ gpt-4-0613 | 8,192 令牌 | 8,192 令牌 |
gpt-4-0613 | 8,192 令牌 | 8,192 令牌 |
gpt-4-0314 | 8,192 令牌 | 8,192 令牌 |
GPT-3.5 Turbo
GPT-3.5 Turbo 模型可以理解和生成自然语言或代码,并已针对使用聊天补全 API 的聊天进行了优化,但也适用于非聊天任务。
截至 2024 年 7 月,应使用 gpt-4o-mini
代替 gpt-3.5-turbo
,因为它更便宜、功能更强、多模态且速度相同。gpt-3.5-turbo
仍可在 API 中使用。
模型 | 上下文窗口 | 最大输出令牌 | 知识截止日期 |
---|---|---|---|
gpt-3.5-turbo-0125 | 16,385 令牌 | 4,096 令牌 | 2021 年 9 月 |
gpt-3.5-turbo | 16,385 令牌 | 4,096 令牌 | 2021 年 9 月 |
gpt-3.5-turbo-1106 | 16,385 令牌 | 4,096 令牌 | 2021 年 9 月 |
gpt-3.5-turbo-instruct | 4,096 令牌 | 4,096 令牌 | 2021 年 9 月 |
DALL·E
DALL·E 是一个可以根据自然语言描述生成和编辑图像的人工智能系统。DALL·E 3 目前支持根据提示创建特定大小的新图像。DALL·E 2 还支持编辑现有图像或创建用户提供图像的变体。
DALL·E 3 可通过我们的图像 API 以及 DALL·E 2 使用。您可以通过 ChatGPT Plus 试用 DALL·E 3。
模型 | 描述 |
---|---|
dall-e-3 | 最新的 DALL·E 模型,发布于 2023 年 11 月。了解更多。 |
dall-e-2 | 前一个版本的 DALL·E,发布于 2022 年 11 月。第二代 DALL·E 模型,比原始模型生成的图像更真实、更准确,分辨率提高了 4 倍。 |
文字转语音 (TTS)
TTS 是一个将文本转换为自然语音的 AI 模型。我们提供了两个版本:tts-1
优化了实时文本转语音的应用,而 tts-1-hd
优化了语音质量。这些模型可以与 音频 API 中的语音接口 一起使用。
模型 | 描述 |
---|---|
tts-1 | 最新的文字转语音模型,优化了速度。 |
tts-1-hd | 最新的文字转语音模型,优化了语音质量。 |
Whisper
Whisper 是一个通用的语音识别模型,经过大量的多语言语音数据训练,支持语音识别、语音翻译和语言识别等多任务。Whisper v2-large 模型通过 whisper-1
名称在 API 中提供。
目前,API 中的 Whisper 模型与开源版本没有差异,但我们提供了优化的推理过程,使得通过 API 调用 Whisper 时,比通过其他方式运行要更快。有关 Whisper 的更多技术细节,可以 阅读论文。
嵌入 (Embeddings)
嵌入是文本的数值表示,可以用于衡量两段文本的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。可以在 公告博客文章 中了解我们最新的嵌入模型。
模型 | 输出维度 |
---|---|
text-embedding-3-large | 最强大的嵌入模型,适用于英文和非英文任务 |
text-embedding-3-small | 比第二代 ada 嵌入模型性能更强 |
text-embedding-ada-002 | 最强大的第二代嵌入模型,替代了 16 个第一代模型 |
内容审核 (Moderation)
内容审核模型旨在检查内容是否符合 OpenAI 的 使用政策。这些模型提供分类能力,用于检测仇恨言论、自残、色情内容、暴力等类别的内容。可以在我们的 内容审核指南 中了解更多关于文本和图像审核的信息。
模型 | 最大令牌数 |
---|---|
omni-moderation-latest | 当前指向 omni-moderation-2024-09-26 版本。 |
omni-moderation-2024-09-26 | 最新的多模态内容审核模型,能够分析文本和图像。 |
text-moderation-latest | 当前指向 text-moderation-007 版本。 |
text-moderation-stable | 当前指向 text-moderation-007 版本。 |
text-moderation-007 | 前一代文本审核模型。我们预计 omni-moderation-* 模型将是未来的默认选择。 |
GPT 基础模型
GPT 基础模型可以理解和生成自然语言或代码,但未经过指令跟随训练。这些模型是原始 GPT-3 基础模型的替代品,使用遗留的 Completions API。大多数客户应选择 GPT-3.5 或 GPT-4。
模型 | 最大令牌数 | 知识截止日期 |
---|---|---|
babbage-002 | 替代 GPT-3 ada 和 babbage 基础模型。 | 16,384 令牌 |
davinci-002 | 替代 GPT-3 curie 和 davinci 基础模型。 | 16,384 令牌 |
数据使用
您的数据属于您自己。
自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据不会用于训练或改进 OpenAI 模型(除非您明确选择与我们共享数据)。
为了帮助识别滥用行为,API 数据最多会保留 30 天,之后将被删除(除非法律要求另行保留)。对于需要零数据保留的信任客户,可以提供零数据保留选项。使用零数据保留时,请求和响应主体不会被持久化到任何日志机制中,仅存在于内存中以服务请求。
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·E Labs。
默认使用政策按端点
端点 | 用于训练的数据 | 默认保留期 | 是否可零数据保留 |
---|---|---|---|
/v1/chat/completions* | 无 | 30天 | 是,除了 (a) 图像输入、(b) 提供的结构化输出的架构,或 (c) 音频输出。* |
/v1/assistants | 无 | 30天 | 否 |
/v1/threads | 无 | 30天 | 否 |
/v1/threads/messages | 无 | 30天 | 否 |
/v1/threads/runs | 无 | 30天 | 否 |
/v1/vector_stores | 无 | 30天 | 否 |
/v1/threads/runs/steps | 无 | 30天 | 否 |
/v1/images/generations | 无 | 30天 | 否 |
/v1/images/edits | 无 | 30天 | 否 |
/v1/images/variations | 无 | 30天 | 否 |
/v1/embeddings | 无 | 30天 | 是 |
/v1/audio/transcriptions | 无 | 零数据保留 | - |
/v1/audio/translations | 无 | 零数据保留 | - |
/v1/audio/speech | 无 | 30天 | 是 |
/v1/files | 无 | 客户删除前 | 否 |
/v1/fine_tuning/jobs | 无 | 客户删除前 | 否 |
/v1/batches | 无 | 客户删除前 | 否 |
/v1/moderations | 无 | 零数据保留 | - |
/v1/completions | 无 | 30天 | 是 |
/v1/realtime (beta) | 无 | 30天 | 是 |
模型端点兼容性
端点 | 最新模型 |
---|---|
/v1/assistants | 所有 o 系列,所有 GPT-4o(除 chatgpt-4o-latest 外),GPT-4o-mini,GPT-4 和 GPT-3.5 Turbo 模型。检索工具需要 gpt-4-turbo-preview(及其后续版本)或 gpt-3.5-turbo-1106(及其后续版本)。 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1, tts-1-hd |
/v1/chat/completions | 所有 o 系列,GPT-4o(除了实时预览),GPT-4o-mini,GPT-4 和 GPT-3.5 Turbo 模型及其日期版本。chatgpt-4o-latest 动态模型。经过微调的 gpt-4o,gpt-4o-mini,gpt-4,gpt-3.5-turbo。 |
/v1/completions (遗留) | gpt-3.5-turbo-instruct,babbage-002,davinci-002 |
/v1/embeddings | text-embedding-3-small,text-embedding-3-large,text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-4o,gpt-4o-mini,gpt-4,gpt-3.5-turbo |
/v1/moderations | text-moderation-stable,text-moderation-latest |
/v1/images/generations | dall-e-2,dall-e-3 |
/v1/realtime (beta) | gpt-4o-realtime-preview,gpt-4o-realtime-preview-2024-10-01 |
此列表排除了所有的 已废弃模型。