跳转到主要内容
API易 支持 300+ 主流 AI 模型,本页面提供详细的模型信息、定价和使用说明。
企业级专业稳定的AI大模型API中转站
本站均为官方源头转发,价格八折(叠加充值加赠和汇率优势),聚合各种优秀大模型。不限速,不过期,不惧封号,按量计费,长期可靠服务。

🔥 当前推荐模型

以下为当前稳定供给的热门模型,完整模型列表和实时价格请访问 API易控制台定价页面

模型分类

🤖 OpenAI 系列

推理模型(Reasoning Models)

模型名称模型ID特点推荐场景
GPT-5.4 🔥gpt-5.4原生计算机操控,100 万上下文,GDPval 83%复杂智能体、专业工作流
GPT-5.4 Pro 🔥gpt-5.4-pro最强推理性能,错误率降低 33%顶级推理、科研
GPT-5.2 Progpt-5.2-proARC-AGI-1 首个突破 90%,专业知识登顶复杂推理、科研,仅支持 /v1/responses 调用
GPT-5.2 🔥gpt-5.2GDPval 70.9% 超越专业人士,40 万上下文编程规划、结构化任务
GPT-5.2 Instant 🔥gpt-5.2-chat-latest快速响应版本,保持顶级推理能力快速写作、信息检索
GPT-5gpt-5旗舰稳定版,超强推理能力顶级推理、复杂任务
GPT-5 Minigpt-5-miniGPT-5 轻量版,性能优异平衡性能与成本
GPT-5 Nanogpt-5-nanoGPT-5 超轻量版大批量处理
o3o3最新推理模型,已大幅降价,性价比极高复杂推理、数学、编程
o4-minio4-mini轻量级推理模型编程任务首选
GPT-5 系列使用注意事项
  1. 温度参数 temperature 必须设置为 1(只支持 1)
  2. 使用 max_completion_tokens 替代 max_tokens
  3. 不要传递 top_p 参数

GPT 系列

模型名称模型ID上下文长度特点推荐场景
GPT-5.1 🔥gpt-5.1128K智能与速度平衡,SWE-bench 76.3%,24小时缓存综合应用、编程
GPT-5.1 Chat Latest 🔥gpt-5.1-chat-latest128K对话优化版,更温暖友好的语调对话场景
GPT-5 Chat Latestgpt-5-chat-latest128K对标 ChatGPT 网页版 GPT-5需要最新特性
GPT-4.1gpt-4.1128K速度快,主力模型之一综合应用
GPT-4.1 Minigpt-4.1-mini128K更便宜的轻量版本成本敏感场景
GPT-4ogpt-4o128K综合能力平衡,多模态支持通用场景
GPT-4o Minigpt-4o-mini128K轻量快速版本快速响应
GPT-5.1 系列特性:动态自适应推理,简单任务速度提升 2-5 倍,Token 消耗降低 70-88%,缓存保留时间延长至 24 小时。新增 Apply_Patch 和 Shell 工具支持。

Codex 编程专用系列

模型名称模型ID计费模式特点推荐场景
GPT-5.1 Codex 🔥gpt-5.1-codex按量/按次SWE-bench 76.3%,长时编程任务专用复杂编程、代码审查
GPT-5.1 Codex Mini 🔥gpt-5.1-codex-mini按量/按次轻量编程,性能接近 SOTA,价格仅 1/4日常编程任务
GPT-5 Codex Highgpt-5-codex-high按量/按次对标 GPT-5,编程能力最强复杂编程任务
GPT-5 Codex Mediumgpt-5-codex-medium按量/按次中等性能,价格适中常规编程任务
GPT-5 Codex Lowgpt-5-codex-low按量/按次轻量版本,成本最低简单代码生成
Codex 系列双重计费模式
  • 按量计费:适合小 Tokens 对话场景
  • 按次计费:适合大上下文编程场景,更加划算
GPT-5.1 Codex 新特性:专为 AI 智能体和编程任务优化,支持审慎决策,性能接近顶级水平。

图像生成模型

模型名称模型ID支持尺寸特点价格
GPT Image 1.5 🔥gpt-image-1.5低/中/高速度提升 4 倍,精准编辑,文本渲染增强低 $0.01,中 $0.04,高 $0.17
Nano Banana Progemini-3-pro-image-preview1K/2K/4K支持 4K 高清,业界最佳文本渲染,强大局部编辑统一 $0.05(低至官网 2 折)
SeeDream 4.5 🔥seedream-4-5-2511284K高清12 亿参数,4K 画质提升,最佳文本渲染$0.035/张
Nano Banana (正式版)gemini-2.5-flash-image10种宽高比谷歌最强图像模型,支持分辨率自定义$0.025/张
Nano Banana (预览版)gemini-2.5-flash-image-preview多种尺寸谷歌图像模型预览版$0.025/张
SeeDream 4.0seedream-4-0-2508284K高清BytePlus火山方舟合作,高品质出图$0.025/张
Sora Imagesora_image多种尺寸逆向模型,模拟官网对话出图详见文档
GPT-4o Imagegpt-4o-image多种尺寸逆向模型,对话式生图详见文档
DALL·E 3dall-e-31024×1024等经典图像生成模型按尺寸计费
Nano Banana Pro 特价:1K-4K 所有分辨率统一价格 $0.05/张,官方 4K 价格为 $0.24/张,低至官网 2 折!查看详情
图像生成测试工具 访问 imagen.apiyi.com 体验各种图像生成模型的效果。详细文档:

视频生成模型

模型名称模型ID支持分辨率特点价格
Sora 2 竖屏 🔥sora_video2704×1280OpenAI革命性视频模型,音视频同步$0.15/次(10秒)
Sora 2 横屏 🔥sora_video2-landscape1280×704横屏视频,适合电影级效果$0.15/次(10秒)
Sora 2 Pro 🔥sora-2-pro1024×1792Pro高清版本,支持15秒$1/次
Sora 2 核心特性
  • 业界首个音视频同步生成
  • 无水印输出(官网有水印)
  • 支持文生视频和图生视频
  • 详细文档:Sora 2 使用指南

🎭 Claude 系列 (Anthropic)

Claude 4 系列(最新)

模型名称模型ID上下文长度特点推荐场景
Claude Opus 4.6 🔥claude-opus-4-61M (Beta)Terminal-Bench 2.0 登顶,智能体团队协作,128K 输出顶级编程、复杂智能体
Claude Opus 4.6 Thinking 🔥claude-opus-4-6-thinking1M (Beta)自适应思维链,深度推理增强顶级推理任务
Claude Sonnet 4.6 🔥claude-sonnet-4-61M (Beta)全面升级,性能媲美 Opus 4.5,性价比极高编程首选、智能体开发
Claude Sonnet 4.6 Thinking 🔥claude-sonnet-4-6-thinking1M (Beta)思维链模式,深度推理复杂编程推理任务
Claude Opus 4.5claude-opus-4-5-20251101200KSWE-bench 80.9%,价格降至前代 1/3复杂编程、顶级推理
Claude Sonnet 4.5claude-sonnet-4-5-20250929200K世界级编码模型,SWE-bench 77.2%代码生成、智能体开发
Claude Sonnet 4.5 Thinkingclaude-sonnet-4-5-20250929-thinking200K思维链模式,深度推理复杂编程推理任务
Claude Haiku 4.5 🔥claude-haiku-4-5-20251001200K高性价比编码模型,SWE-bench 73.3%,速度2倍实时聊天、结对编程
Claude 4 Sonnetclaude-sonnet-4-20250514200K稳定版本,编程首选代码生成、分析
Claude 4 Sonnet Thinkingclaude-sonnet-4-20250514-thinking200K思维链模式复杂推理
Claude Opus 4.1claude-opus-4-1-20250805200K迭代升级版,编程优化高要求编程任务
Claude Opus 4.1 Thinkingclaude-opus-4-1-20250805-thinking200K思维链模式,推理增强顶级推理任务
最新推荐:Claude Opus 4.6 以 Terminal-Bench 2.0 登顶,支持 1M 上下文和智能体团队协作。Sonnet 4.6 性能媲美 Opus 4.5,已成为 claude.ai 默认模型,性价比极高。Haiku 4.5 提供高性价比编程支持,速度提升 2 倍以上。

🌟 Google Gemini 系列

模型名称模型ID上下文长度特点推荐场景
Gemini 3.1 Pro Preview 🔥gemini-3.1-pro-preview1MARC-AGI-2 77.1%(3 Pro 的 2 倍+),最强推理模型复杂推理、多模态分析
Gemini 3 Flash Preview 🔥gemini-3-flash-preview1MSWE-bench 78% 超越 3 Pro,速度快 3 倍,价格仅 1/4编程首选、性价比之王
Gemini 3 Flash Thinking 🔥gemini-3-flash-preview-thinking1M强制推理模式,显示完整思考过程复杂编程、深度推理
Gemini 3 Flash NoThinking 🔥gemini-3-flash-preview-nothinking1M快速响应模式,最低延迟简单任务、实时应用
Gemini 3 Pro Previewgemini-3-pro-preview1MLMArena 1501 Elo 全球第一,SWE-bench 76.2%顶级多模态、复杂推理
Gemini 3 Pro Preview Thinkinggemini-3-pro-preview-thinking1M思维链模式,显示完整推理过程深度推理、复杂编程
Gemini 2.5 Progemini-2.5-pro2M正式版,编程优势,多模态能力强长文本、编程、多模态
Gemini 2.5 Pro Previewgemini-2.5-pro-preview-06-052M预览版本测试新特性
Gemini 2.5 Flashgemini-2.5-flash1M速度快,成本低快速响应场景
Gemini 2.5 Flash Preview 09-2025 🔥gemini-2.5-flash-preview-09-20251M最新日期版本(2025年9月版)最新性能优化
Gemini 2.5 Flash Litegemini-2.5-flash-lite1M超轻量版本,更快更便宜大批量简单任务
最新推荐:Gemini 3.1 Pro Preview 推理能力翻倍(ARC-AGI-2 77.1%),是谷歌最先进推理模型。Gemini 3 Flash Preview 以 SWE-bench 78% 继续领跑编程性价比。注意:Gemini 3 Pro Preview 将于 2026 年 3 月 9 日停止服务,请迁移至 3.1 Pro Preview。

🚀 xAI Grok 系列

Grok 标准系列

模型名称模型ID特点推荐场景
Grok 4grok-4最新官方版本综合任务
Grok 3grok-3官方稳定版本日常使用
Grok 3 Minigrok-3-mini带推理能力的小模型轻量任务

Grok 联网系列

模型名称模型ID上下文长度特点推荐场景
Grok 4 All 🔥grok-4-all标准原生联网,无需工具调用需要实时信息场景
Grok 3 Allgrok-3-all标准原生联网增强版新闻资讯、市场分析

Grok Fast 系列(超长上下文)

模型名称模型ID上下文长度特点推荐场景
Grok 4 Fast Reasoning 🔥grok-4-fast-reasoning200K推理模式,显示思考过程复杂推理任务
Grok 4 Fast Non-Reasoninggrok-4-fast-non-reasoning200K非推理模式,快速响应大上下文场景
Grok 4 Fast Reasoning Latestgrok-4-fast-reasoning-latest200K推理模式最新版最新推理能力
Grok 4 Fast Latestgrok-4-fast-latest200K最新标准版最新性能

Grok Code 系列(编程专用)

模型名称模型ID上下文长度特点推荐场景
Grok Code Fast 1grok-code-fast-1256KSWE-bench 70.8%,高速生成代码生成、智能体编程
Grok Fast 系列价格优势
  • 相比 Grok-4 系列降价 93%+
  • 输入:$0.20/1M tokens,输出:$0.50/1M tokens
  • 业界领先的性价比,适合超长上下文场景

🔍 DeepSeek 系列

模型名称模型ID上下文长度特点推荐场景
DeepSeek V3.2 🔥deepseek-v3.2128K性能比肩 GPT-5,工具调用融入推理,IMO 金牌复杂推理、编程、智能体
DeepSeek V3.2 Speciale 🔥deepseek-v3.2-speciale128K高算力版本,超越 GPT-5,推理媲美 Gemini 3 Pro顶级推理任务
DeepSeek V3.1deepseek-v3-1-250821128K混合推理模式,Think/Non-Think 双模式智能推理、编程
DeepSeek R1deepseek-r164K推理模型数学、推理
DeepSeek V3deepseek-v3128K综合能力强通用场景

🐘 国产模型系列

智谱 AI (GLM)

模型名称模型ID上下文长度特点推荐场景
GLM-5 🔥glm-5200K744B 参数(40B 激活),编程对齐 Claude Opus 4.5,开源复杂编程、系统工程、智能体
GLM-4.6glm-4.6200K代码与推理增强版编程、推理、智能体
GLM-4.5glm-4.5128K标准版本,综合能力强通用场景
GLM-4.5 Airglm-4.5-air128K轻量版本,速度快快速响应
GLM-5 特性
  • 744B 参数(40B 激活),预训练数据 28.5T
  • 编程能力对齐 Claude Opus 4.5,超越 Gemini 3 Pro
  • 全新 Slime 框架,支持长时序智能体强化学习
  • 开源模型中编程能力最强,性价比极高

阿里通义千问 (Qwen)

模型名称模型ID上下文长度特点
Qwen 3.5-Plus 🔥qwen3.5-plus1M397B(17B 激活),支持 201 种语言,自称超越 GPT-5.2智能体、多语言、长文本
Qwen Maxqwen-max32K最强版本
Qwen Plusqwen-plus32K增强版本
Qwen Turboqwen-turbo32K快速版本

Moonshot Kimi 系列

模型名称模型ID上下文长度特点
Kimi K2.5 🔥kimi-k2.5200K1T 参数(32B 激活),原生多模态,Agent Swarm 100 智能体协作
Kimi K2 正式版kimi-k2-250711200K火山引擎官方合作,稳定性强

🌐 MiniMax 系列

模型名称模型ID上下文长度特点推荐场景
MiniMax M2.5 🔥minimax-m2.5标准230B(10B 激活),SWE-bench 80.2%,$1/小时极致性价比编程、智能体、办公自动化
MiniMax M2.5 特性
  • SWE-bench 80.2%,编程能力顶级,速度比 M2.1 快 37%
  • 仅 $1/小时持续运行,业界最低成本前沿模型
  • 支持 10+ 编程语言,20 万+ 真实环境训练
  • 模型权重已完全开源

💰 定价说明

计费方式

  • 按量计费:根据实际使用的 Token 数量计费
  • 无最低消费:充多少用多少,余额永不过期
  • 实时扣费:每次调用后立即从余额扣除费用

价格优势

  • 官方源头转发,价格略有优势
  • 批量使用可联系客服获取更优惠价格
  • 新用户注册送 300万 Token 测试额度

查看实时价格

访问 API易控制台定价页面 查看所有模型的最新价格。

🛠️ 使用建议

模型选择指南

编程开发
  • 顶级性能:Claude Opus 4.6(Terminal-Bench 2.0 登顶)、GPT-5.4(GDPval 83%)、Claude Sonnet 4.6(媲美 Opus 4.5)
  • 高性价比:Gemini 3 Flash Preview(SWE-bench 78%,价格仅 1/4)、Claude Sonnet 4.6、MiniMax M2.5(SWE-bench 80.2%,$1/小时)、GLM-5
  • 备选:GPT-5.2 系列、DeepSeek V3.2、Kimi K2.5、Qwen 3.5-Plus、o4-mini
文本创作
  • 首选:GPT-5.4、GPT-5.2 系列、Gemini 3.1 Pro Preview、Claude Opus 4.6、Claude Sonnet 4.6
  • 备选:GPT-5.1 Chat Latest、Claude Sonnet 4.5、GPT-4.1、GPT-4o、Claude Haiku 4.5、GLM-4.6
快速响应
  • 首选:Gemini 3 Flash NoThinking(极致速度)、Claude Haiku 4.5(速度快 2 倍)、GPT-4o Mini
  • 备选:Gemini 2.5 Flash、Gemini 2.5 Flash Lite、GLM-4.5 Air、Grok 3 Mini、GPT-4.1 Mini
图像生成
  • 最新推荐:GPT Image 1.5(速度提升 4 倍,精准编辑,低 $0.01 起)
  • 专业设计:SeeDream 4.5(12 亿参数,4K 画质,$0.035/张)、Nano Banana Pro(4K 高清,最佳文本渲染)
  • 高性价比:Nano Banana 正式版(10 种宽高比,$0.025/张)、SeeDream 4.0($0.025/张)
  • 逆向、价格最便宜:sora_image、gpt-4o-image
视频生成
  • 首选:Sora 2 系列(音视频同步,无水印,$0.15/次起)
  • 竖屏:sora_video2,横屏:sora_video2-landscape,高清:sora-2-pro
长文本处理
  • 超长上下文:Gemini 2.5 Pro(2M)、Grok 4 Fast 系列(200K)、Grok Code Fast 1(256K)
  • 编程场景:GLM-4.6(200K)、Claude 4 系列(200K)、Kimi K2(200K)
联网搜索
  • 原生联网:Grok 4 All、Grok 3 All(无需工具调用)
  • 适合场景:实时信息、新闻资讯、市场动态分析

成本优化建议

  1. 分级使用:简单任务用便宜模型,复杂任务用高级模型
  2. 测试优化:先用小模型测试,确定需求后再用大模型
  3. 批量处理:大量相似任务可以选择 Nano 或 Mini 版本
  4. 缓存复用:对重复查询结果进行缓存

🔗 相关资源

模型列表持续更新中,我们会及时添加最新发布的优秀模型。如需使用特定模型或有批量需求,请联系客服。