Google Gemini Content 协议

curl "https://api.poixe.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "x-goog-api-key: $POIXE_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Hello!"
          }
        ]
      }
    ]
  }'

{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "Hello there! How can I help you today?"
          }
        ],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 2,
    "candidatesTokenCount": 10,
    "totalTokenCount": 35,
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 2
      }
    ],
    "thoughtsTokenCount": 23
  },
  "modelVersion": "gemini-2.5-flash",
  "responseId": "9h9hae6BBJy8vr0PoczKOA"
}

POST 非流 https://api.poixe.com/v1beta/models/gemini-2.5-flash:generateContentPOST 流式 https://api.poixe.com/v1beta/models/gemini-2.5-flash:streamGenerateContent?alt=sse

这是 Google 面向开发者提供的统一生成式能力接口体系：它用一致的输入/输出结构覆盖文本、多模态与工具增强等场景。

流式调用（SSE）

Gemini 的非流式与流式是 两个不同的接口，并且 请求 URL 中包含模型名称（例如 .../models/gemini-2.5-flash:xxx），不是像部分协议那样仅在 body 里填 model。

非流式：POST ...:generateContent
流式：POST ...:streamGenerateContent?alt=sse

鉴权与请求头

所有请求都必须在 HTTP Header 中携带 API Key。

x-goog-api-key

string

必填

Google API Key。格式示例：$POIXE_API_KEY。

Content-Type

string

必填

必须设置为 application/json。

请求参数

以下是最常用、最核心的请求字段（覆盖单轮文本、多轮对话、常见采样控制）。

contents

object[]

必填

对话内容（或单轮输入）。Gemini 使用 contents[] 表示“对话历史 + 本轮输入”。

显示 contents[] 字段

role

string

角色。常见：user / model。多数情况下你只需要传 user；历史回复可用 model 回填。

parts

object[]

必填

内容片段列表。

显示 parts[] 字段

text

string

文本内容（最常用）。

systemInstruction

object

系统指令（可选）。用于放置“开发者/系统级约束”，本质上也是一个 Content（通常只包含 text）。

generationConfig

object

生成参数（可选），用于控制采样、长度与输出格式。

显示 generationConfig 字段

temperature

number

采样温度。越低越确定，越高越发散。

topP

number

核采样（nucleus sampling）。通常与 temperature 二选一调整即可。

maxOutputTokens

integer

最大输出 token 数（限制输出长度）。

stopSequences

string[]

停止序列（最多 5 个）。命中后将停止生成（停止序列本身不会出现在输出中）。

responseMimeType

string

输出 MIME（可选）。常见：text/plain（默认） / application/json（需要稳定 JSON 输出时）。

responseSchema

object

输出 Schema（可选）。配合 responseMimeType: "application/json" 使用，用于结构化输出（JSON Schema 子集）。

tools

object[]

工具列表（可选）。用于函数调用/代码执行等能力（不同模型与能力支持情况可能不同）。

toolConfig

object

工具配置（可选）。用于指定工具选择策略、约束等（通常与 tools 搭配使用）。

safetySettings

object[]

安全设置（可选）。用于覆盖默认的内容安全阈值策略（按类别配置）。

响应结构

非流式请求返回一个 GenerateContentResponse 对象；流式请求会以 SSE 返回多段 GenerateContentResponse（你会持续收到多条 data: {...} JSON）。

candidates

object[]

候选结果列表（通常取 candidates[0] 即可）。

显示 candidates[] 字段

index

integer

候选索引

content

object

生成内容（role + parts[]）。

显示 content 字段

role

string

通常为 model

parts

object[]

输出片段数组，最常见为 [{ "text": "..." }]。

finishReason

string

结束原因（例如 STOP）。

safetyRatings

object[]

安全评分（如有返回）。

promptFeedback

object

提示词安全反馈（如有返回）。当 prompt 触发过滤/阻断时通常可从这里定位原因。

usageMetadata

object

Token 用量统计（输出字段）。Gemini 的计费口径建议按以下方式理解与落库： input_tokens = promptTokenCount + toolUsePromptTokenCount， output_tokens = candidatesTokenCount + thoughtsTokenCount， total_tokens = input_tokens + output_tokens（通常与 totalTokenCount 对齐）。

显示 usageMetadata 字段

promptTokenCount

integer

提示词输入 Token 数

toolUsePromptTokenCount

integer

工具回填到上下文的输入 Token 数（如有）

candidatesTokenCount

integer

可见输出 Token 数

thoughtsTokenCount

integer

思考 Token 数（如有）

totalTokenCount

integer

总 Token 数

modelVersion

string

实际使用的模型版本（输出字段）。

responseId

string

响应唯一标识（输出字段）。

官方文档：Text generation（Gemini API）

查看 Gemini 文本生成说明、示例与最佳实践。

API 参考

文本接口

Google Gemini Content 协议

流式调用（SSE）

鉴权与请求头

请求参数

响应结构

官方文档：Text generation（Gemini API）

API 参考

文本接口

​流式调用（SSE）

​鉴权与请求头

​请求参数

​响应结构

官方文档：Text generation（Gemini API）

流式调用（SSE）

鉴权与请求头

请求参数

响应结构