北京时间2026年4月24日,OpenAI正式发布了其迄今为止最智能、最直观的AI模型——GPT-5.5。这款新模型不仅标志着AI能力的一次重大飞跃,更在运算效率和成本控制上实现了显著突破,旨在彻底改变用户使用计算机完成工作的方式。

GPT-5.5的核心升级在于其强大的Agent(智能体)能力。与以往需要用户精细指导每一步的模型不同,GPT-5.5能够理解用户模糊、复杂的多部分指令,并自主进行任务规划、调用工具、检查结果并持续推进,直至完成。

OpenAI总裁格雷格·布罗克曼(Greg Brockman)强调,这意味着用户无需再事无巨细地管理每个步骤,只需将复杂任务交给GPT-5.5,它便能像一个真正的“研究伙伴”或“初级工程师”一样独立工作。

尽管模型能力大幅增强,GPT-5.5在性能与效率上却实现了“鱼与熊掌兼得”的优化:运算速度更快:通过与英伟达(NVIDIA)的深度合作,GPT-5.5针对GB200/GB300 NVL72系统进行了联合设计。在实际服务中,其每个Token的延迟与GPT-5.4持平,但通过模型自身优化的负载均衡算法,Token生成速度反而提升了超过20%。Token成本大降:这是GPT-5.5的一大亮点。由于模型逻辑更精准,完成相同任务所需的Token数量显著减少。在与英伟达的合作中,基于GB200 NVL72系统运行,百万Token的成本降低至前代系统的三十五分之一,每兆瓦的Token输出量更是提升了50倍。智能水平更高:在多个权威基准测试中,GPT-5.5均展现出超越前代及竞品的智能水平。例如,在衡量复杂终端操作的Terminal-Bench 2.0测试中,其准确率高达82.7%(GPT-5.4为75.1%);在评估GitHub问题解决的SWE-Bench Pro中达到58.6%。

GPT-5.5的强大能力已在多个专业领域得到验证,在Artificial Analysis的Coding Index中,它以竞争模型一半的成本提供了最先进的智能水平。早期测试者反馈,该模型在理解系统架构、定位故障及预测审查需求方面能力显著增强,能将原本耗时数天的调试周期缩短至数小时。在生物信息学基准测试BixBench中,GPT-5.5取得了80.5%的领先成绩。更令人瞩目的是,一个内部版本的模型甚至协助发现了关于组合数学中“拉姆齐数”(Ramsey Numbers)的新证明,并通过了形式化验证工具Lean的确认,展现了其在纯数学前沿领域的原创贡献潜力。OpenAI内部财务团队已利用该模型审核了超过7万页税务文件,效率提升显著。

参与内测的用户给予了极高评价。一位英伟达工程师甚至表示,失去GPT-5.5的访问权限,“感觉就像肢体被截肢了一样”。

目前,GPT-5.5已逐步向ChatGPT Plus、Pro、Business和Enterprise用户开放。其API版本也即将上线,定价如下:

模型版本

输入定价 (每百万Token)

输出定价 (每百万Token)

GPT-5.5

5美元

30美元

GPT-5.5 Pro

30美元

180美元