更新日志 Changelog
欢迎来到 API易 的更新日志页面。在这里,您可以了解到我们的最新模型上线、价格调整、功能更新等重要信息。我们致力于为您提供最优质、最具性价比的 AI 服务。订阅更新:关注我们的公告,第一时间获取模型上新和优惠信息,不错过任何重要更新!
🔥 最新动态
最近更新的重要内容:- 10/20 Claude Haiku 4.5 世界级编码模型上线!SWE-bench 73.3%,速度翻倍,成本降至1/3!
- 10/12 Gemini 2.5 Flash 最新版 gemini-2.5-flash-preview-09-2025 上线!最新日期版本!
- 10/03 Gemini 图像正式版 Nano Banana 升级!10种宽高比,支持分辨率自定义!
- 10/01 Sora 2 视频生成 OpenAI 革命性视频模型上线!音视频同步,$0.15/次起,无水印!
- 10/01 GLM-4.6 发布 智谱 AI 最新版本,200K 上下文,代码与推理能力全面提升!
- 09/30 Claude Sonnet 4.5 世界最强编码模型上线!SWE-bench 77.2%,支持 Claude Code!
- 09/29 DeepSeek-V3.2-exp 最新实验版本抢鲜上线,第一时间接入,价格低于官网!
- 09/26 GLM-4.5 系列 三个版本全面上线,定价低于智谱官网,性价比极高!
- 09/25 Grok 联网模型 grok-4-all 和 grok-3-all 上线,原生联网能力,无需工具调用!
- 09/24 Grok-4-fast 系列 超长上下文 20万Tokens,推理/非推理双模式,史低价格!
- 09/24 Grok Code Fast 1 代码专用模型上线,SWE-Bench 70.8%,性价比之王!
- 09/16 OpenAI Codex 系列 gpt-5-codex 系列上线,专为编程优化,支持双重计费模式!
- 09/11 SeeDream 4.0 API seedream-4-0-250828 上线,火山引擎方舟战略合作,官网65折优惠!
- 08/27 Gemini 图像生成 gemini-2.5-flash-image-preview 上线,谷歌最强图像模型,当下火爆,API易半价优惠!
- 08/26 DeepSeek V3.1 混合推理模式上线,支持 Think/Non-Think 双模式
- 08/25 Kimi K2 正式版 kimi-k2-250711 接入,火山引擎官方合作版本,稳定好用
- 08/08 GPT-5 全系列 正式上线,官网同价,充值加赠+汇率优势约8折
- 08/07 Claude Opus 4.1 性能升级版上线,加量不加价
- 08/06 OpenAI 开源模型 gpt-oss-120b 和 gpt-oss-20b 上线,价格低于 DeepSeek R1/V3
- GPT-4.5-Preview 模型下线,请切换至 GPT-4.1
- Kimi K2 模型上线,官网7折优惠
- Claude 全系降价 20%
- O3 模型降价 80%,史上最大降幅
📅 2025年10月
⚡ Claude Haiku 4.5 震撼上线
2025年10月20日Claude Haiku 4.5 - Anthropic 高性价比编码模型
-
🚀 新增模型:
claude-haiku-4-5-20251001 -
💰 价格优势:
- 输入价格:$1 / 1M tokens
- 输出价格:$5 / 1M tokens
- 与 Anthropic 官网价格完全一致
- 充值加赠活动,低至 8 折优惠
- 相比 Claude Sonnet 4.5,成本降低至 1/3
-
🏆 世界级编码性能:
- SWE-bench Verified 73.3%:世界顶尖编码模型之一
- 媲美 Claude Sonnet 4 的代码生成质量
- 速度提升超过 2倍
- 成本效率 SOTA(业界领先)
-
🧠 核心特性:
- 200K 超长上下文窗口:支持处理大型代码库
- 64K 输出 tokens:生成长篇代码无压力
- 首个支持扩展思维的 Haiku:深度推理能力
- 电脑使用能力(Computer Use):支持自主操作
- 上下文感知:更精准的代码理解
-
🌟 多模态支持:
- 同时处理文本和图像
- 支持代码截图理解
- UI 设计转代码
- 图表和架构图分析
-
⚡ 性能亮点:
- 实时低延迟响应,适合聊天助手和客服
- 结对编程体验极佳
- 大幅降低成本的同时保持高智能水平
- 完美兼容 Anthropic API 格式
-
🛠️ 推荐场景:
- AI 聊天助手和客服机器人
- 实时代码生成与补全
- 结对编程助手
- 批量代码处理任务
- 需要高性价比的智能体应用
Claude Haiku 4.5 是 Anthropic 于 10 月 15 日发布的高性价比编码模型,提供与 Sonnet 4 相近的编码性能,但速度提升 2 倍以上,成本降低至 1/3。支持提示缓存(节省 90% 成本)和批处理 API(节省 50% 成本)。详细信息请参考:Anthropic 官方公告
✨ Gemini 2.5 Flash 最新日期版本上线
2025年10月12日Gemini 2.5 Flash Preview 09-2025 - 谷歌最新版本
-
🚀 新增模型:
gemini-2.5-flash-preview-09-2025 -
📅 版本说明:
- 这是 Gemini 2.5 Flash 的最新日期版本(2025年9月版)
- 谷歌官方发布的 Gemini 2.5 Flash 系列最新迭代
- 包含最新的性能优化和功能改进
-
🌟 核心特性:
- 延续 Gemini 2.5 Flash 系列的强大能力
- 支持超长上下文处理
- 多模态理解能力(文本、图像、视频)
- 谷歌最新技术优化和性能提升
-
💰 价格优势:
- API易提供极具竞争力的定价
- 结合充值加赠活动更优惠
- 官方最新版本,性能更强
-
🛠️ 调用方式:
- 使用标准对话补全端点:
/v1/chat/completions - 完全兼容 OpenAI API 格式
- 替换模型名称即可使用
- 使用标准对话补全端点:
gemini-2.5-flash-preview-09-2025 是谷歌官方最新发布的 Gemini 2.5 Flash 日期版本,建议使用最新版本以获得最佳性能和体验。更多信息请参考:谷歌官方文档
🍌 Gemini 2.5 Flash Image 正式版发布
2025年10月3日Gemini 2.5 Flash Image - 谷歌图像生成正式版
-
🚀 模型更新:
- 新模型名:
gemini-2.5-flash-image - 旧模型名:
gemini-2.5-flash-image-preview(仍可继续使用)
- 新模型名:
-
💰 价格保持:
- API易定价:0.039)
- 相比官网节省约 36%
- 继续保持性价比优势
-
🌟 核心升级:
- 10 种宽高比支持:从电影级横屏到社交媒体竖屏
- 分辨率自定义:支持指定输出分辨率
- 正式生产可用:从预览版升级为正式版
- 仅图像输出:支持纯图像输出模式
-
🎨 强大能力:
- 无缝融合多张图片
- 保持角色一致性,丰富故事叙述
- 自然语言精准编辑
- 结合 Gemini 丰富的世界知识
-
🛠️ 调用方式:
- 推荐使用新模型名:
gemini-2.5-flash-image - 旧模型名
gemini-2.5-flash-image-preview仍可使用 - 其他调用方法保持不变
- 完全兼容现有代码
- 推荐使用新模型名:
新版本支持 10 种宽高比和分辨率自定义功能,推荐使用
gemini-2.5-flash-image 以获得最佳体验。旧模型名仍可继续使用。🎬 Sora 2 视频生成 API 上线
2025年10月1日晚Sora 2 - OpenAI 革命性视频生成模型
-
🚀 新增模型:
sora_video2- 竖屏视频(704×1280)sora_video2-landscape- 横屏视频(1280×704)sora-2-pro-all- Pro 高清版本(1024×1792)
-
💰 超值定价:
- 标准版本:$0.15/次(10秒视频)
- Pro 版本:$0.20/次(支持 15秒、高清)
- 结合充值加赠,约 ¥0.8/次起
-
🎥 核心特性:
- 音视频同步:业界首个音视频同步生成
- 物理真实性提升:大幅提升视频真实感
- 无水印输出:生成视频无水印(官网有水印)
- 长视频支持:最长支持 16 秒连贯叙事
-
🛠️ 生成方式:
- 文生视频:纯文字描述生成视频
- 图生视频:支持 1 张图片垫图生成
- 支持 URL 和 Base64 图片上传
- 完整的流式输出进度反馈
-
🌟 技术亮点:
- 调用端点:
/v1/chat/completions - 标准 OpenAI API 格式
- 支持流式输出查看进度
- 无需邀请码,即刻使用
- 调用端点:
Sora 2 是 OpenAI 于 10 月 1 日发布的革命性视频生成模型,定位为视频生成的”GPT-3.5 时刻”。API易第一时间接入官方 API,价格仅 $0.15/次起,无需邀请码。详细文档:Sora 2 使用指南
💻 GLM-4.6 强势发布
2025年10月1日GLM-4.6 - 智谱 AI 代码与推理增强版
-
🚀 新增模型:
glm-4.6 -
💰 价格优势:
- 提示价格:$0.50 / 1M tokens
- 补全价格:$1.75 / 1M tokens
- 性价比极高,仅为 Claude 的 1/7 价格
-
🧠 核心升级:
- 200K 超长上下文:从 128K 扩展到 20万 Tokens
- 代码能力提升:在 Claude Code、Cline、Roo Code 等 IDE 中表现优异
- 高级推理:推理性能显著提升,支持推理过程中的工具使用
- 智能体增强:在工具调用和搜索型智能体中表现更强
-
🌟 性能亮点:
- 编程:95.0% 准确率,排名第 95 百分位
- 数学:96.0% 准确率,排名第 98 百分位
- 与 Claude Sonnet 4 接近(48.6% 胜率)
- 明显优于开源基准模型
-
⚡ 写作优化:
- 更符合人类偏好的风格和可读性
- 角色扮演场景表现更自然
- 前端页面生成视觉效果更佳
GLM-4.6 是智谱 AI(现更名为 Z.AI)于 9 月 30 日发布的最新版本,相比 GLM-4.5 在代码生成、推理能力和智能体框架集成方面都有显著提升。
📅 2025年9月
🚀 Claude Sonnet 4.5 震撼上线
2025年9月30日Claude Sonnet 4.5 - Anthropic 最强编码模型
-
🚀 新增模型:
claude-sonnet-4-5-20250929- 标准版本claude-sonnet-4-5-20250929-thinking- 推理模式
-
💰 价格优势:
- 与 Anthropic 官网价格完全一致
- 充值 $100 以上享受加赠活动
- 结合加赠优惠,约合官网 8折起
- 定价:15 per 1M tokens(输入/输出)
-
🏆 世界级编码能力:
- SWE-bench Verified 77.2%:全球最强编码模型
- OSWorld 61.4%:真实计算机任务测试领先
- 支持 Claude Code,开发体验极佳
- 构建复杂智能体的首选模型
-
🧠 核心升级:
- 自主运行 30 小时:相比 Opus 4 的 7 小时大幅提升
- 推理和数学能力显著增强
- 支持复杂多步骤任务持续专注
- 安全性训练全面升级
-
🌟 实际应用:
- Devin 规划性能提升 18%
- 端到端评估分数提升 12%
- 适合构建自主软件开发系统
- 企业级复杂业务流程自动化
-
🛠️ 调用方式:
- 标准版:常规对话和编码任务
- Thinking 模式:需要深度推理的复杂问题
- 完全兼容 Anthropic API 格式
Claude Sonnet 4.5 是 Anthropic 于 9 月 29 日发布的最强 AI 模型,被誉为”世界最佳编码模型”,能够自主运行长达 30 小时处理复杂任务。API易官网同价,充值享 8 折起优惠。
🧠 DeepSeek-V3.2-exp 抢鲜上线
2025年9月29日DeepSeek-V3.2-exp - DeepSeek 最新实验版本
-
🚀 新增模型:
deepseek-v3.2-exp -
💰 价格优势:
- 提示价格:0.28)
- 补全价格:0.42)
- 相比官网节省约 7%
- 人民币计价更优惠(官网 ¥2/¥3)
-
🌟 核心特性:
- 官网直连版本,稳定可靠
- 第一时间上线,满足客户需求
- DeepSeek 最新实验性能力
- 持续迭代优化中
-
🛠️ 调用方式:
- 使用标准 Chat 端点:
/v1/chat/completions - 兼容 OpenAI API 格式
- 按量计费,简单透明
- 使用标准 Chat 端点:
DeepSeek-V3.2-exp 是 DeepSeek 今日发布的最新实验版本,API易第一时间接入官网直连版本,以略低于官网的价格提供服务。
🤖 GLM-4.5 系列模型上线
2025年9月26日GLM-4.5 - 智谱 AI 高性能语言模型
-
🚀 新增模型:
glm-4.5- 标准版本glm-4.5-air- 轻量版本glm-4.5v- 多模态版本
-
💰 价格优势:
- 全系定价低于智谱官网
- 在保障稳定性的前提下,提供更优性价比
- 按量计费模式
-
🌟 核心特性:
- 全面覆盖不同性能需求场景
- 优秀的中文理解和生成能力
- 稳定可靠的 API 服务
- 兼容标准 OpenAI API 格式
GLM-4.5 系列是智谱 AI 的高性能语言模型,API易提供低于官网的优惠价格,在模型覆盖全面性和性价比方面持续为用户提供更好的选择。
🌐 Grok 联网模型正式上线
2025年9月25日Grok-4-all / Grok-3-all - 自带联网能力的智能模型
-
🚀 新增模型:
grok-4-all- Grok-4 联网增强版grok-3-all- Grok-3 联网增强版
-
💰 统一定价:
- 提示价格:$1.50 / 1M tokens
- 补全价格:$7.50 / 1M tokens
- 按量计费,简单透明
-
🌟 核心特性:
- 原生联网能力:无需工具调用,模型自带联网功能
- 实时信息获取:直接访问最新网络数据
- 稳定可靠:逆向方案但运行稳定
- 即插即用:无需额外配置 Web Search 工具
-
🛠️ 调用方式:
- 使用标准 Chat 端点:
/v1/chat/completions - 兼容 OpenAI API 格式
- 模型自动处理联网请求,无需手动调用工具
- 使用标准 Chat 端点:
-
⚡ 适用场景:
- 需要实时信息的问答场景
- 新闻资讯类应用
- 市场动态分析
- 事实核查和验证
- 任何需要最新网络数据的任务
Grok-4-all 和 Grok-3-all 是具备原生联网能力的模型,相比传统的工具调用方式更加便捷,适合需要频繁访问网络信息的应用场景。
⚡ Grok-4-fast 系列震撼上线
2025年9月24日Grok-4-fast - xAI 超长上下文推理模型
-
🚀 新增模型:
grok-4-fast-reasoning- 推理模式,显示完整思考过程grok-4-fast-non-reasoning- 非推理模式,快速响应grok-4-fast-reasoning-latest- 推理模式最新版本grok-4-fast-latest- 最新标准版本
-
💰 超低价格:
- 提示价格:$0.20 / 1M tokens
- 补全价格:$0.50 / 1M tokens
- 相比 Grok-4 系列降价 93%+
- 史上最具性价比的超长上下文模型
-
🧠 核心特性:
- 200K 超长上下文:支持高达 20万 Tokens 上下文窗口
- 双模式架构:统一模型权重,通过系统提示词切换推理模式
- 高效推理:相比 Grok-4,平均节省 40% 思考 Tokens
- SOTA 成本效率:业界领先的性价比表现
-
🌟 技术亮点:
- 端到端工具使用强化学习训练
- 支持 Web 搜索和 X(Twitter)搜索能力
- 内置代码执行能力
- 推理和非推理模式无缝切换
-
🛠️ 调用方式:
- 使用标准 Chat 端点:
/v1/chat/completions - 兼容 OpenAI API 格式
- 按量计费,简单透明
- 使用标准 Chat 端点:
Grok-4-fast 是 xAI 推出的高性价比长上下文模型,在保持与 Grok-4 相当性能的同时,大幅降低使用成本,非常适合需要处理大量上下文的应用场景。
💻 Grok Code Fast 1 代码专用模型上线
2025年9月24日Grok Code Fast 1 - xAI 代码生成与智能体编程模型
-
🚀 新增模型:
grok-code-fast-1 -
💰 极致性价比:
- 提示价格:$0.20 / 1M tokens
- 补全价格:$1.50 / 1M tokens
- 缓存价格:$0.02 / 1M tokens
- 专为代码场景优化的定价策略
-
🧠 核心特性:
- 256K 超长上下文:足够处理大型代码库
- SWE-Bench 70.8%:在 SWE-Bench Verified 全集上表现卓越
- 高速生成:约 92 tokens/秒 的吞吐量
- MoE 架构:约 3140亿参数混合专家模型
-
🌟 技术亮点:
- 全新架构设计,专为代码任务优化
- 支持多种编程语言:TypeScript、Python、Java、Rust、C++、Go
- 优化的工具集成:grep、终端操作、文件编辑等
- 智能缓存技术:合作伙伴工作流中缓存命中率超 90%
-
🛠️ 推荐场景:
- 从零开始构建项目
- 代码库问题解答
- Bug 修复和代码重构
- 智能体自主编程(Agentic Coding)
- IDE 集成开发
-
⚡ 可见推理过程:
- 响应中包含推理轨迹(Reasoning Traces)
- 开发者可以引导 Grok Code 实现高质量工作流
- 提升代码生成的可控性和透明度
Grok Code Fast 1 是 xAI 专为编程场景打造的高性能模型,已集成到 GitHub Copilot、Cursor、Cline、Windsurf 等主流 IDE 和编程工具中。
💻 OpenAI Codex 系列模型上线
2025年9月16日GPT-5 Codex - 专为编程场景优化的代码生成模型
-
🚀 新增模型:
gpt-5-codex-high- 高性能版本,对标 GPT-5gpt-5-codex-medium- 中等性能版本gpt-5-codex-low- 轻量级版本
-
💰 双重计费模式:
按量计费(适合小 Tokens 对话):
- High: 10.00/1M 输出
- Medium: 4.80/1M 输出
- Low: 2.40/1M 输出
- High: $0.025/次
- Medium: $0.020/次
- Low: $0.015/次
-
🛠️ 调用方式:
- 使用 Chat 端点调用
- 支持按量付费和按次付费两种模式
- 根据上下文长度灵活选择计费方式
-
🌟 核心特性:
- 专门针对编程任务优化
- 代码生成质量媲美 GPT-5
- 支持多种编程语言和框架
- 价格更加实惠,性价比极高
选择建议:如果您的上下文 Tokens 较大,选择按次计费更划算;如果是短对话场景,按量计费更经济。
🎨 SeeDream 4.0 API 正式上线
2025年9月11日SeeDream 4.0 - BytePlus 火山方舟高品质图像生成
-
🚀 新增模型:
seedream-4-0-250828 - 🤝 战略合作:源自 BytePlus火山方舟海外版,API易达成官方战略合作
-
💰 价格优势:
- API易定价:0.03美金/张)
- 相比官网节省 35%
- 结合充值加赠15%:约 ¥0.14/张
- 价格持平 Nano Banana (gemini-2.5-flash-image-preview)
-
🛠️ 调用方式:
- 使用标准 OpenAI 图像生成端点:
/v1/images/generations - 完全兼容 OpenAI Image API 格式
- 按次计费,简单透明
- 使用标准 OpenAI 图像生成端点:
-
🌟 核心特性:
- 高品质图像生成能力:高清 4K 出图
- 官方合作资源可靠稳定
- 视觉一致性优秀,生成图片快 15s 左右一张图
详细使用文档请参考:SeeDream 4.0 使用指南
📅 2025年8月
🎨 Gemini 2.5 Flash 图像生成模型上线
2025年8月27日Gemini 2.5 Flash Image Preview - 谷歌最强图像生成模型
-
🚀 新增模型:
gemini-2.5-flash-image-preview - 🏷️ 模型代号:Nano Banana 模型
-
💰 价格优势:
- API易定价:0.04/张)
- 结合充值加赠+汇率优势:约 ¥0.14/张
- 相比官网节省约 50%(官网5折优惠)
-
💸 竞争对比:
- 比 gpt-image-1 更有优势
- 价格持平 flux-kontext-pro
- 高于逆向出图 sora_image
-
⚡ 性能优势:
- 生成速度快,平均仅需 10 秒
- 比 OpenAI 系列更快的响应时间
- 谷歌最新、最强的图像生成/编辑技术
-
🛠️ 调用方式:
- 使用对话补全端点,与 gpt-4o-image 兼容
- 直接替换模型名称即可使用
- 完美兼容 sora_image 调用方式
详细使用文档请参考:Gemini 图像生成使用指南
🧠 DeepSeek V3.1 混合推理模式上线
2025年8月26日DeepSeek V3.1-250821 - 革命性混合推理模式
-
🚀 新增模型:
deepseek-v3-1-250821 -
💰 价格优势:
- 提示价格:0.56)
- 补全价格:1.68)
- 相比官网价格节省约 11%
- 支持双模式调用,灵活计费
-
🧠 核心特性:
- Think 模式:深度推理,显示完整思维过程
- Non-Think 模式:快速响应,适合日常任务
- 128K 超长上下文窗口
- 支持 Anthropic API 格式兼容
-
🌟 技术亮点:
- 8400亿 token 持续预训练优化
- 全新 tokenizer,编码效率提升
- Beta Function Calling 工具调用支持
- 增强的智能体和工具使用能力
-
⚡ 模式切换:
deepseek-chat- Non-Think 快速模式deepseek-reasoner- Think 推理模式- 官网支持 “DeepThink” 一键切换
DeepSeek V3.1 是首个支持混合推理模式的大模型,让用户可以根据任务复杂度灵活选择推理深度,兼顾效率与质量。
🤖 Kimi K2 正式版接入
2025年8月25日Kimi K2-250711 - 火山引擎官方合作版本
-
🚀 新增模型:
kimi-k2-250711 -
🔄 替换模型:取代
kimi-k2-0711-preview预览版 -
🤝 官方合作:
- 火山引擎官方授权合作版本
- 直连官方接口,稳定性大幅提升
- 告别 preview 版本的不稳定性
-
💰 价格优势:
- 继续保持比官网低 15% 的优势
- 结合充值加赠,相当于官网 7折优惠
- 正式版性能,预览版价格
-
🌟 核心特性:
- 优秀的中文理解和生成能力
- 长文本处理能力强
- API 响应更加稳定可靠
- 完全兼容原有调用方式
Kimi K2-250711 是火山引擎官方合作的正式版本,相比预览版在稳定性和性能方面都有显著提升,推荐用户及时切换。
🚀 GPT-5 全系列震撼上线
2025年8月8日GPT-5 全系列正式发布 - OpenAI 最强模型
- 🎯 全系列型号:
gpt-5- 旗舰版本gpt-5-2025-08-07- 特定版本gpt-5-chat-latest- 最新对话版本gpt-5-mini/gpt-5-mini-2025-08-07- 轻量级版本gpt-5-nano/gpt-5-nano-2025-08-07- 超轻量版本
- 💰 价格优势:
- 与 OpenAI 官网价格完全一致
- 充值加赠 + 汇率优势,约合官网 8折
- 提示价格:0.05 / 1M tokens
- 补全价格:0.40 / 1M tokens
- 🛠️ 技术特性:
- 支持官网文档
/v1/responses端点调用 - 温度参数
temperature需设置为 1 或不传(官方限制) - 使用
max_completion_tokens替代max_tokens gpt-5-chat-latest通过/v1/chat/completions调用
- 支持官网文档
- ⚡ 性能亮点:
- 全面超越 GPT-4 系列的推理能力
- 更强的上下文理解和长文本处理
- 显著提升的代码生成质量
- 多语言能力达到新高度
重要提示:GPT-5 系列模型对参数有特定要求,请按照上述技术特性配置,确保正常调用。
🎨 Claude Opus 4.1 性能升级版上线
2025年8月7日Claude Opus 4.1 - 代码能力再突破
-
🚀 新增模型:
claude-opus-4-1-20250805 -
💰 加量不加价:
- 价格与 Anthropic 官网完全一致
- 结合充值加赠,性价比更高
- 相同价格,享受更强性能
-
🌟 核心升级:
- SWE-bench Verified 达到 74.5%,代码能力显著提升
- 相比 Opus 4,推理能力和代码生成质量大幅增强
- 保持 200K 超长上下文窗口
- 多语言理解和生成能力进一步优化
-
⚡ 性能亮点:
- 代码调试和修复能力领先业界
- 复杂推理任务准确率提升 15%+
- API 响应速度保持业界顶级水平
- 完美兼容 Claude 系列所有功能
Claude Opus 4.1 是基于 Opus 4 的迭代优化版本,在保持原有强大能力的基础上,针对代码生成和推理任务进行了专项优化。
🎯 OpenAI 开源模型正式上线
2025年8月6日OpenAI 首次开源大模型震撼发布
- 🚀 新增模型:
gpt-oss-120b- 1170亿参数,媲美 o4-mini 性能gpt-oss-20b- 210亿参数,可在边缘设备运行
- 💰 价格优势:
- 定价显著低于 DeepSeek R1 和 V3
- 结合充值加赠,性价比极高
- 企业级使用成本大幅降低
- 🌟 核心特性:
- 128K 超长上下文窗口
- 支持低/中/高三级推理模式
- MoE 架构,推理效率极高
- Apache 2.0 开源协议
- ⚡ 性能亮点:
- gpt-oss-120b 仅需单张 80GB 显卡即可运行
- gpt-oss-20b 支持 16GB 内存设备部署
- 在编程、数学、工具调用等任务上表现卓越
这是 OpenAI 自 GPT-2 以来首次发布开源模型,标志着 AI 开放生态的重要里程碑。
📅 2025年7月
⚠️ GPT-4.5-Preview 模型下线
2025年7月14日GPT-4.5-Preview 正式停止服务
- 📌 下线模型:
gpt-4.5-preview - 🔄 推荐替代:
gpt-4.1 - 📅 生效时间:2025年7月14日
- 📖 官方公告:OpenAI Deprecations
请开发者尽快更新代码,将
gpt-4.5-preview 替换为 gpt-4.1,避免服务中断。🚀 Kimi K2 模型上新
2025年7月15日Kimi K2 预览版正式上线
- 📌 模型名称:
kimi-k2-0711-preview - 💰 价格优势:比官网低 15%
- 🎁 结合充值加赠,相当于官网 7折优惠
- 🌟 特色:更优秀的中文理解和生成能力
🤖 Grok-4 模型上线
2025年7月12日xAI Grok-4 正式接入
- 📌 调用名称:
grok-4 - 🧠 特色功能:自带推理模式
- 📖 建议查看官方文档了解详细使用方法
💸 Claude 全系降价 20%
2025年7月8日Claude 模型大幅优惠
- 🎉 全系列模型降价 20%
- ✅ 不限速、不封号
- 💱 汇率优势 + 充值加赠
- 🚀 为用户提供更经济的 AI 服务
📅 2025年6月
🌟 Gemini 2.5 正式版发布
2025年6月18日Gemini 2.5 系列全新升级
- 📌 推荐模型:
gemini-2.5-pro/gemini-2.5-flash - ⚡ 性能更稳定,建议替换 preview 或 exp 版本
- 🎯 2M 超长上下文支持
🎊 O3 模型大幅降价 80%
2025年6月13日O3 模型史上最大降幅
- 💥 降价幅度:80%
- 💰 新价格:
- 输入:$3/M Tokens
- 输出:$12/M Tokens
- 🆕 新增
o3-pro模型 - 📍 仅限端点
/v1/responses调用
🖼️ GPT-Image-1 价格下调
2025年6月7日图像生成更实惠
- 📌 模型:
gpt-image-1 - 💸 价格大幅下调,提供更具竞争力的图像生成服务
- 🎨 保持高质量输出的同时降低成本
🔔 订阅更新
📊 更新统计
本月亮点(2025年10月)
- ⚡ 高性价比:Claude Haiku 4.5 震撼上线,SWE-bench 73.3%,速度翻倍,成本降至 1/3
- ✨ 版本更新:Gemini 2.5 Flash 最新日期版本 preview-09-2025 上线,谷歌最新优化
- 🍌 图像升级:Gemini 2.5 Flash Image 正式版,10种宽高比,支持分辨率自定义
- 🎬 视频革命:Sora 2 视频生成上线,音视频同步,无水印输出,$0.15/次起
- 💻 智能升级:GLM-4.6 强势发布,200K 上下文,代码与推理能力全面提升
上月亮点(2025年9月)
- 🚀 世界最强:Claude Sonnet 4.5 震撼上线,SWE-bench 77.2%,全球最佳编码模型
- 🧠 快速响应:DeepSeek-V3.2-exp 抢鲜上线,第一时间接入最新实验版本
- 🤖 国产力量:GLM-4.5 系列全面上线,低于官网定价
- 🌐 联网能力:Grok-4-all / Grok-3-all 上线,原生联网,无需工具调用
- ⚡ 超长上下文:Grok-4-fast 系列上线,20万 Tokens 上下文,价格降低 93%+
- 💻 代码专用:Grok Code Fast 1 发布,SWE-Bench 70.8%,集成主流 IDE
- 💻 编程优化:OpenAI Codex 系列上线,专为编程场景优化,支持双重计费模式
- 🎨 图像生成:SeeDream 4.0 正式上线,BytePlus 火山方舟战略合作,官网65折优惠
历史里程碑(2025年8月)
- 🎨 图像生成:Gemini 2.5 Flash Image Preview 上线,谷歌最强图像模型,官网7折优惠
- 🧠 创新突破:DeepSeek V3.1 混合推理模式,首个支持 Think/Non-Think 双模式的大模型
- 🤖 官方合作:Kimi K2-250711 正式版上线,火山引擎官方授权,稳定性大幅提升
- 🚀 新增模型:GPT-5 全系列正式上线,官网同价享8折优惠
- 🎨 性能升级:Claude Opus 4.1 性能升级版,加量不加价
- 🎯 重磅发布:OpenAI 首次开源大模型(gpt-oss-120b、gpt-oss-20b)
- 💸 价格优势:新模型定价低于 DeepSeek R1/V3
- 🚀 性能突破:开源模型达到商用级别性能
- 🌐 生态扩展:支持本地部署和边缘计算
历史里程碑
- 2025年10月:Claude Haiku 4.5 震撼上线,高性价比编码模型;Gemini 2.5 Flash 最新日期版本 preview-09-2025 上线;Gemini 2.5 Flash Image 正式版发布;Sora 2 视频生成上线,OpenAI 革命性视频模型;GLM-4.6 强势发布,智谱 AI 代码与推理增强版
- 2025年9月:Claude Sonnet 4.5 震撼上线,世界最强编码模型;DeepSeek-V3.2-exp 抢鲜上线;GLM-4.5 系列全面上线;Grok 联网模型上线,原生联网能力;xAI Grok-4-fast 系列上线,20万超长上下文史低价;Grok Code Fast 1 代码专用模型发布;OpenAI Codex 系列发布,专为编程优化;SeeDream 4.0 正式上线,BytePlus 火山方舟战略合作达成
- 2025年8月:Gemini 2.5 Flash Image Preview 谷歌最强图像模型上线;DeepSeek V3.1 混合推理模式上线;Kimi K2 正式版接入;GPT-5 全系列震撼上线;首次接入 OpenAI 开源模型;Claude Opus 4.1 性能升级版发布
- 2025年7月:突破 200+ 模型支持
- 2025年6月:O3 模型史上最大降价
- 2025年5月:支持 Gemini 2.5 系列
更新频率:本页面会定期更新,建议收藏并经常查看。所有价格调整和模型更新都会第一时间在此公告。
小贴士:新模型上线初期通常会有特别优惠,建议及时试用体验。同时,我们会根据市场反馈不断优化价格策略。