聚合API接口文档
  1. Gemini原生格式
聚合API接口文档
  • 常用请求
    • 获取模型
      • 获取模型
      • 获取模型 - gemini
    • 文本嵌入
      • 文本嵌入
      • 文本嵌入 - gemini
    • 令牌余额查询
      GET
    • 基本请求
      POST
    • 流式请求
      POST
    • 连续对话
      POST
    • 识图请求 - url
      POST
    • 识图请求 - base64
      POST
    • 工具(函数)调用
      POST
    • 文档重排序
      POST
    • 流式出图/视频
      POST
    • gpt-5.1开思考显示
      POST
    • codex模型请求
      POST
    • chat兼容思考显示
      POST
    • 视频识别
      POST
    • PDF识别
      POST
    • 结构化输出
      POST
  • 图片/视频生成
    • OpenAI chat格式
      • 流式出图/视频(推荐)
      • 流式出图/视频 - 带图生成
    • Google 生图 - nano banana
      • Google Gemini生图
      • Google Gemini改图
      • Google Gemini生图 流式
    • OpenAI image格式
      • 生成图像
      • 编辑图像
    • OpenAI sora格式
      • 创建视频
      • 获取视频任务状态
      • 获取视频内容
    • Midjourney绘图
      • 任务提交
        • 文生图 - Imagine
        • 关联按钮动作 - Action
        • 图生文 - Describe
        • 图像混合 - Blend
        • 局部重绘 - Modal
      • 任务查询
        • 多任务查询 - ListByCondition
        • 单任务查询 - FetchFromTask
        • Seed查询 - ImageSeed
  • 音频转录
    • 音频转录
    • 音频翻译
    • 文本转语音
    • Gemini 生成音频(TTS)
  • 高阶用法
    • Gemini原生格式
      • 普通对话
        POST
      • 开启思考
        POST
      • 流式请求
        POST
      • 结构化输出
        POST
      • 函数调用
        POST
      • PDF识别
        POST
      • 图像识别
        POST
      • 视频识别
        POST
    • Anthropic原生格式
      • 普通对话
      • 流式请求
      • 开启思考
      • 图像识别
      • 函数调用
      • 内置联网
    • 对话完整传参示例
      • OpenAI对话格式 - chat
      • OpenAI对话格式 - responses
      • Claude对话格式 - messages
      • Gemini对话格式 - v1beta
  • 在代码工具使用
    • 在codex中使用
    • 在gemini cli中使用
    • 在claudecode中使用
  • 数据模型
    • Schemas
      • ErrorResponse
      • ModelsResponse
      • GeminiModelsResponse
      • ChatCompletionRequest
      • ChatCompletionResponse
      • CompletionRequest
      • CompletionResponse
      • ResponsesRequest
      • ResponsesResponse
      • ClaudeRequest
      • ClaudeResponse
      • EmbeddingRequest
      • EmbeddingResponse
      • ImageGenerationRequest
      • ImageResponse
      • AudioTranscriptionResponse
      • SpeechRequest
      • RerankRequest
      • RerankResponse
      • VideoRequest
      • ModerationRequest
      • VideoResponse
      • ModerationResponse
      • VideoTaskResponse
      • GeminiRequest
      • GeminiResponse
      • OpenAIVideoError
      • Model
      • Message
      • MessageContent
      • ToolCall
      • Tool
      • ResponseFormat
      • Usage
      • ClaudeMessage
      • VideoTaskMetadata
      • VideoTaskError
      • ChatCompletionStreamResponse
      • ResponsesStreamResponse
      • ImageEditRequest
      • AudioTranscriptionRequest
      • AudioTranslationRequest
      • OpenAIVideo
  1. Gemini原生格式

PDF识别

POST
{{url}}/v1beta/models/gemini-2.5-flash:generateContent
最后修改时间:2025-11-29 15:39:51

请求参数

Query 参数

Header 参数

Body 参数application/json

示例
{
    "contents": [
        {
            "parts": [
                {
                    "text": "介绍文档内容"
                },
                {
                    "inline_data": {
                        "mime_type": "application/pdf",
                        "data": "输入Base64"
                    }
                }
            ]
        }
    ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'http://api.example.com/v1beta/models/gemini-2.5-flash:generateContent?key=sk-xxx' \
--header 'Content-Type: application/json' \
--data-raw '{
    "contents": [
        {
            "parts": [
                {
                    "text": "介绍文档内容"
                },
                {
                    "inline_data": {
                        "mime_type": "application/pdf",
                        "data": "输入Base64"
                    }
                }
            ]
        }
    ]
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "该文档内容主要包含以下几个方面:\n\n1.  **图表展示(Figure 2)**:\n    *   展示了在多种任务(如编程、创意写作、文档处理、多语言、指令遵循、诚实度、视觉指令遵循、无害性)中,不同版本的 Claude 模型(Claude 3.5 Sonnet (新版), Claude 3.5 Haiku, Claude 3 Opus, Claude 3 Sonnet, Claude 3 Haiku)相对于基线模型(Claude 3.5 Sonnet,其胜率为50%)的人类偏好胜率。\n    *   这些图表用于比较不同模型在常见用例和对抗性场景下的性能表现。\n\n2.  **提示注入(Prompt Injection)防护(3.1.2节)**:\n    *   详细介绍了 Claude 3.5 Sonnet 和 Claude 3.5 Haiku 在识别和抵抗提示注入攻击方面的能力提升。\n    *   提示注入被定义为恶意用户试图改变模型预期行为的攻击。新模型通过内部测试集和对抗性交互训练,能更好地识别恶意提示并与系统提示保持一致。\n    *   文档还推荐了在使用计算机时预防提示注入的额外措施,例如使用专用虚拟机、限制敏感数据访问、限制互联网访问以及在敏感任务中保持人工干预。\n\n3.  **计算机使用红队测试(Computer Use Red-Teaming)(3.1.3节)**:\n    *   简要提及为识别计算机使用能力相关的潜在滥用途径,进行了专门的信任与安全红队测试。\n    *   识别出了一些与计算机使用功能相关的潜在风险,但该句子的结尾内容未在当前页面显示。"
                    }
                ]
            },
            "finishReason": "STOP",
            "avgLogprobs": -0.73908665224949732
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 1293,
        "candidatesTokenCount": 373,
        "totalTokenCount": 2374,
        "trafficType": "ON_DEMAND",
        "promptTokensDetails": [
            {
                "modality": "TEXT",
                "tokenCount": 3
            },
            {
                "modality": "DOCUMENT",
                "tokenCount": 1290
            }
        ],
        "candidatesTokensDetails": [
            {
                "modality": "TEXT",
                "tokenCount": 373
            }
        ],
        "thoughtsTokenCount": 708
    },
    "modelVersion": "gemini-2.5-flash",
    "createTime": "2025-11-29T15:39:56.012239Z",
    "responseId": "zBMrac9fyoT33w_bqNWJBg"
}
修改于 2025-11-29 15:39:51
上一页
函数调用
下一页
图像识别
Built with