一句话结论
API易 Gemini 原生端点完整支持 Google 官方联网搜索:使用/v1beta generateContent + google_search 工具,gemini-3.5-flash、gemini-3.1-flash-lite、gemini-3.1-pro-preview 实测均真实联网、返回带来源引用的最新信息。默认分组的 KEY 即可使用,无需任何特殊开通。
真实可用性(实测数据,2026-06-11)
| 模型 | 联网结果 | groundingMetadata | 单次问答搜索次数 | 延迟 |
|---|---|---|---|---|
| gemini-3.5-flash | ✅ 当周真实新闻,多查询交叉检索 | ✅ 完整 | 4–7 次 | 24–45s |
| gemini-3.1-flash-lite | ✅ 当周真实新闻 | ✅(偶发缺失,见注意事项) | 2 次 | ~5s |
| gemini-3.1-pro-preview | ✅ 当周真实新闻,深思考后精准检索 | ✅ | 1 次 | ~45s |
快速上手
cURL
Python(google-genai SDK)
怎么确认搜索真的执行了
成功联网时,响应candidates[0].groundingMetadata 包含以下字段;没有这些字段就是没搜:
| 字段 | 含义 |
|---|---|
webSearchQueries | 模型实际执行的搜索词数组(数组长度 = 搜索次数) |
groundingChunks | 检索到的来源(URI + 标题) |
groundingSupports | 回答正文片段与来源的对应关系(startIndex/endIndex) |
searchEntryPoint | 渲染 Google 搜索建议所需的 HTML/CSS |
计费说明(重要)
联网搜索会收取工具调用费用,由两部分组成:| 项目 | 价格 | 说明 |
|---|---|---|
| 工具调用费 | $14 / 1000 次($0.014/次) | 工具名:google_search;按实际执行的搜索次数计费,即 groundingMetadata.webSearchQueries 数组长度——一次提问可能触发多次搜索(实测 pro-preview 1 次、flash-lite 2 次、3.5-flash 4–7 次) |
| 模型 token 费 | 按模型标准价 | 与 OpenAI 联网不同,检索内容不注入 input token(实测联网前后 promptTokenCount 几乎不变,31–43 token);大头是 thinking + output token(3.5-flash 一次深度联网问答消耗 thoughts 3500–4900 token,按 output 价计费) |
单次联网问答总开销参考(搜索费 + token 费):flash-lite ≈ $0.03;3.5-flash ≈ $0.08–0.16;3.1-pro-preview ≈ $0.06。如需控制成本,可在提示词中约束搜索行为(如”最多搜索 2 次”),或选用搜索次数少的模型。
注意事项
- 必须走原生端点:OpenAI 兼容模式的所有搜索声明都被静默忽略且不报错。用 OpenAI SDK 的项目改用 google-genai SDK(
base_url设为https://api.apiyi.com,不带/v1)即可。 - 以 groundingMetadata 为准判断联网:实测 flash-lite 偶发(4 次中 1 次)不返回 groundingMetadata。严格场景请校验该字段存在性,缺失时重试。
- 思考型模型给足
maxOutputTokens(建议 ≥4096):3.5-flash / 3.1-pro-preview 联网时 thinking 消耗 1900–4900 token,上限过小会截断回答。 - 工具声明
{"google_search": {}}与 camelCase{"googleSearch": {}}均可用;旧版google_search_retrieval是 Gemini 1.5 时代的工具,当前模型一律用google_search。 - 联网搜索可与 URL Context 等工具组合使用(Google 官方文档:
ai.google.dev/gemini-api/docs/google-search)。
FAQ
Q:怎么确认这次回答真的联网了? A:检查candidates[0].groundingMetadata 是否存在、webSearchQueries 是否非空、groundingChunks 是否包含来源 URI。只有正文、没有这些字段的,是模型凭训练数据回答。
Q:需要换分组或特殊 KEY 吗?
A:不需要。Gemini 系列模型使用默认分组的 KEY 即可直接调用联网搜索(与 OpenAI 联网搜索一致;区别于 Claude 原生搜索需要 ClaudeOfficial 内测分组)。
Q:搜索次数怎么看、不同模型差异大吗?
A:数 groundingMetadata.webSearchQueries 数组长度。同一问题实测差异很大:pro-preview 1 次、flash-lite 2 次、3.5-flash 4–7 次。
Q:支持哪些模型?
A:gemini-3.5-flash、gemini-3.1-flash-lite、gemini-3.1-pro-preview 已实测验证。其他 Gemini 2.5+ 模型理论上同样支持 google_search 工具,使用前建议按上面 FAQ 的方法做一次验证。
相关文档
Gemini 原生调用
google-genai SDK 配置、流式输出、thinking 控制
Gemini Function Calling
自定义工具调用,可与联网搜索组合使用