PDF识别

POST

{{url}}/v1beta/models/gemini-2.5-flash:generateContent

最后修改时间：2025-11-29 15:39:51

请求参数

Query 参数

Header 参数

Body 参数application/json

示例

{
    "contents": [
        {
            "parts": [
                {
                    "text": "介绍文档内容"
                },
                {
                    "inline_data": {
                        "mime_type": "application/pdf",
                        "data": "输入Base64"
                    }
                }
            ]
        }
    ]
}

请求示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location --globoff 'http://api.example.com/v1beta/models/gemini-2.5-flash:generateContent?key=sk-xxx' \
--header 'Content-Type: application/json' \
--data '{
    "contents": [
        {
            "parts": [
                {
                    "text": "介绍文档内容"
                },
                {
                    "inline_data": {
                        "mime_type": "application/pdf",
                        "data": "输入Base64"
                    }
                }
            ]
        }
    ]
}'

返回响应

🟢200成功

application/json

Bodyapplication/json

示例

{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "该文档内容主要包含以下几个方面：\n\n1.  **图表展示（Figure 2）**:\n    *   展示了在多种任务（如编程、创意写作、文档处理、多语言、指令遵循、诚实度、视觉指令遵循、无害性）中，不同版本的 Claude 模型（Claude 3.5 Sonnet (新版), Claude 3.5 Haiku, Claude 3 Opus, Claude 3 Sonnet, Claude 3 Haiku）相对于基线模型（Claude 3.5 Sonnet，其胜率为50%）的人类偏好胜率。\n    *   这些图表用于比较不同模型在常见用例和对抗性场景下的性能表现。\n\n2.  **提示注入（Prompt Injection）防护（3.1.2节）**:\n    *   详细介绍了 Claude 3.5 Sonnet 和 Claude 3.5 Haiku 在识别和抵抗提示注入攻击方面的能力提升。\n    *   提示注入被定义为恶意用户试图改变模型预期行为的攻击。新模型通过内部测试集和对抗性交互训练，能更好地识别恶意提示并与系统提示保持一致。\n    *   文档还推荐了在使用计算机时预防提示注入的额外措施，例如使用专用虚拟机、限制敏感数据访问、限制互联网访问以及在敏感任务中保持人工干预。\n\n3.  **计算机使用红队测试（Computer Use Red-Teaming）（3.1.3节）**:\n    *   简要提及为识别计算机使用能力相关的潜在滥用途径，进行了专门的信任与安全红队测试。\n    *   识别出了一些与计算机使用功能相关的潜在风险，但该句子的结尾内容未在当前页面显示。"
                    }
                ]
            },
            "finishReason": "STOP",
            "avgLogprobs": -0.73908665224949732
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 1293,
        "candidatesTokenCount": 373,
        "totalTokenCount": 2374,
        "trafficType": "ON_DEMAND",
        "promptTokensDetails": [
            {
                "modality": "TEXT",
                "tokenCount": 3
            },
            {
                "modality": "DOCUMENT",
                "tokenCount": 1290
            }
        ],
        "candidatesTokensDetails": [
            {
                "modality": "TEXT",
                "tokenCount": 373
            }
        ],
        "thoughtsTokenCount": 708
    },
    "modelVersion": "gemini-2.5-flash",
    "createTime": "2025-11-29T15:39:56.012239Z",
    "responseId": "zBMrac9fyoT33w_bqNWJBg"
}

修改于 2025-11-29 15:39:51

函数调用

图像识别