code_execution 工具在沙箱里跑 Python。本页示例默认使用 原生调用 的客户端配置。
图片理解
图片可以直接传 PIL Image 对象,SDK 自动处理编码:types.Part.from_bytes 显式传入:
音频理解
视频理解
media_resolution 控费
媒体输入的 token 消耗和分辨率挂钩。对”看个大概”的任务(分类、是否包含某元素),降分辨率能明显省钱:| 档位 | 适用 |
|---|---|
LOW | 分类、粗粒度识别,最省 |
MEDIUM | 一般描述与理解(默认均衡选择) |
HIGH | OCR、小字、细节密集型任务 |
支持的格式
| 类型 | 格式 | 传入方式 |
|---|---|---|
| 图片 | JPG、PNG、WebP | PIL Image 或 Part.from_bytes |
| 音频 | MP3、WAV | Part.from_bytes |
| 视频 | MP4、MOV | Part.from_bytes |
代码执行(code_execution)
声明code_execution 工具后,模型会自己写 Python、在沙箱里执行、再基于结果回答 —— 适合计算、数据分析类任务:
代码执行的限制:仅 Python;沙箱环境无法访问网络和你的文件系统;有执行时长上限。需要调用你自己的外部服务时,用 FC函数调用。