POST
这是 OpenAI 最早、最经典的对话协议,目前兼容性最好,几乎所有厂商与 SDK 都支持。
但它的能力相对有限,OpenAI 新推出的模型有许多新特性更倾向在 Responses 协议 中提供。如果只是轻量对话与基础流式输出,用它就足够。
https://api.poixe.com/v1/chat/completions认证与授权
所有 API 请求都必须在 HTTP Header 中包含您的 API 密钥。Bearer Token。格式为
Bearer YOUR_API_KEY。必须设置为
application/json。请求参数
以下是构建对话请求时最常用的核心参数。请求的模型名称。例如:
gpt-4o, gpt-4o-mini 等。对话消息列表。
是否流式输出。开启后,服务器将通过 SSE (Server-Sent Events) 逐字发送 Token。
采样温度(0~2)。较低的值(如 0.2)使输出更聚焦且确定;较高的值(如 0.8)使输出更具创意和随机性。
核采样(nucleus sampling)。通常与
temperature 二选一调整即可。模型生成内容的最大 Token 限制(包含推理 Token)。建议用于替代已弃用的
max_tokens。返回多少个候选回复(choices)。为降低成本建议保持
1。话题惩罚(-2~2):鼓励生成新话题(更少重复)。
频率惩罚(-2~2):降低重复用词/句子的概率。
工具列表(函数调用)。
工具调用策略:
none / auto / required,或强制指定某个 tool。输出格式控制。
响应结构
接口返回一个包含生成结果及消耗统计的对象。本次请求的唯一标识符。
对象类型,通常为
chat.completion。创建时间(Unix 秒级时间戳)。
实际处理请求的模型名称。
生成结果列表(通常只有 1 条)。
Token 用量统计(如有返回)。