GPT4.5发布：期待与失望并存,且贵的离谱是DeepSeek的200多倍

# GPT4.5发布：期待与失望并存,且贵的离谱是DeepSeek的200多倍

凌晨4点，OpenAI的GPT 4.5终于在专场直播中亮相

大家等得够久了吧？曾经的GPT 4发布，简直是整个行业的“天降神兵”，令无数人惊叹：“卧槽，太强了！”然而，今天的GPT 4.5发布，虽然在期待中姗姗来迟，但它的表现却让人有些意外。

从2023年年末开始，行业的期待值飙升，大家都在预测GPT的下一代模型会在2024年年初发布。但谁知，等了一整年，多模态4.0发布了，推理模型o1发布了，可真正的GPT基座模型却始终未见踪影。今天，距GPT 4发布整整两年，GPT 4.5终于来了。

不过，这次的发布让人感到有些失望——没有奥特曼的震撼登场，也没有那种让人眼前一亮的演示。直播就像去年的那个专场一样，简单朴素，完全没有此前令人惊叹的视觉冲击。先看看参数。

回想当年，GPT 4发布时，布罗克曼做的那段惊艳的多模态演示让我至今难忘。那时，他在本子上画了一个网站草图，然后拍个照给GPT 4，没过多久，前端界面和HTML代码就生成出来了——那一刻真的是大开眼界！

如今，时间过得真快，转眼已经是两年过去了。回到今天的GPT 4.5，参数看起来比4.0强，根据AIME 2024的基准测试，GPT 4.5得分36.7%，GPT 4.0却只有9.3%。

OpenAI这次的重点之一，就是强调GPT 4.5在准确度和幻觉率方面的提升。坦白说，4.5在这些方面确实做得不错，至少是OpenAI发布过的最准确的模型。

他们自己设计了一道有趣的题目，让从GPT-1到GPT-4.5的模型来回答：“人类的第一种语言是什么？”从GPT-1到GPT-4，大家的回答都很抽象，但GPT 4.5的回答倒是诚实的：“我不知道，这是一个未解之谜。”至少在这一点上，GPT 4.5显得更加实事求是。

至于代码和推理的能力，GPT 4.5并没有惊艳表现。毕竟，它并不是推理模型，所以大家对它的表现并没有抱太大期待。根据第三方的基准测试，GPT 4.5的能力虽然可以，但还是不如Claude 3.7。

在经典的物理小球问题上，GPT 4.5的表现还不错，至少在这方面没有太大问题。不过，打不过Claude 3.7也是可以理解的，毕竟Claude可是专注于推理的。

ps:如果国内想用Claude 3.7的强大的代码推理能力，国内需要使用虚拟卡充值，本人推荐虚拟卡，这款虚拟卡简单好用，使用支付宝充值。

虚拟卡官网：https://yeka.ai/i/GPT310 (opens new window)

如果说GPT 4.5有让人不解的地方，那就是它的定价——真的是贵到离谱！每百万输入要75美元，每百万输出要150美元。你没看错，Claude 3.7每百万输入才3美元，输出15美元，而GPT 4.5的价格是它的25倍和10倍。

这一定价真是让人傻眼了，OpenAI到底凭什么？DeepSeek v3的价格你知道吗？它的每百万输入只要2元人民币，输出8元人民币，这才是性价比。

如果想升级ChatGPT Plus国内推荐这款虚拟卡平台 (opens new window)，其他的国内支付都过不去。

目前，GPT 4.5已经对Pro会员开放，预计几天后会对Plus和Team用户开放。我也第一时间拿到了体验资格。

体验下来，GPT 4.5支持识图、搜索和画布等功能，但它在语音、视频、共享屏幕方面却有所退步。特别是有些史实性问题，它会强制开启搜索，这让我觉得非常不合理。

而在情商方面，GPT 4.5的提升是明显的。比如，当问到：“朋友总是爽约，我想发短信表达愤怒但又不想绝交，我该怎么回复？”时，GPT 4.5的回答显得更加有情商，不像4.0那样冷冰冰的。但在一些简单的逻辑问题上，GPT 4.5却直接“懵了”，一直在理解情绪，结果完全答不上来。

我自己做了些写作测试，结果实在不尽如人意。GPT 4.5的写作速度慢得让我想吐，简直像回到了GPT 4的时代，每个字都慢得让人抓狂。相比Claude 3.7和Grok 3，它的写作能力显然还是差了一些。

坦率地说，对OpenAI的期望有多高，失望也就有多大。当前的GPT 4.5虽然有一些进步，但整体表现依然没有打破预期。我个人觉得，未来DeepSeek更值得关注，而对OpenAI保持低预期似乎更为明智。

奥特曼自己也表示，GPT 4.5是他们的最后一个基座模型。未来的GPT 5可能会整合o3模型，成为一个混合模型。希望下一次，OpenAI能给我们带来更大的惊喜，或者……AI真的只是一个漫长的长跑。

上次更新: 2/28/2025, 10:07:12 AM