POST
这是 OpenAI 新一代的统一响应协议(推荐优先使用),用于替代传统的 Chat Completions。
它更适合承载新模型的能力(如更强的工具调用、更一致的多模态输入/输出、更好的结构化输出等)。
https://api.poixe.com/v1/responses认证与授权
所有 API 请求都必须在 HTTP Header 中包含您的 API 密钥。Bearer Token。格式为
Bearer YOUR_API_KEY。必须设置为
application/json。请求参数
以下是构建 Responses 请求时最常用的核心参数(覆盖 80% 场景)。请求的模型名称。例如:
gpt-4.1、gpt-4.1-mini 等。输入内容。最常见是字符串文本;也支持结构化输入(例如包含多段内容、图片等的数组)。
可选:系统级指令(类似 Chat Completions 的
system 消息),用于约束风格/规则。是否流式输出。开启后,服务器将通过 SSE (Server-Sent Events) 实时推送增量内容。
采样温度(0~2)。较低更稳定,较高更发散。
核采样(nucleus sampling)。通常与
temperature 二选一调整即可。最大输出 Token 数限制(用于控制长度与成本)。
工具列表(函数调用 / 内置工具)。
工具调用策略:
none / auto / required,或强制指定某个工具。输出格式控制(用于结构化输出/严格 JSON)。
可选:自定义元数据(用于标记与检索)。
响应结构
接口返回一个 Response 对象,包含生成结果、状态与 Token 消耗信息。本次请求的唯一标识符。
对象类型,通常为
response。创建时间(Unix 秒级时间戳)。
实际处理请求的模型名称。
请求状态。常见:
completed(已完成)/ in_progress(处理中)/ failed(失败)。输出内容列表。通常包含模型消息与(可选的)工具调用结果。
Token 用量统计(如有返回)。