GPT4.5发布:期待与失望并存,且贵的离谱是DeepSeek的200多倍
# GPT4.5发布:期待与失望并存,且贵的离谱是DeepSeek的200多倍
凌晨4点,OpenAI的GPT 4.5终于在专场直播中亮相
大家等得够久了吧?曾经的GPT 4发布,简直是整个行业的“天降神兵”,令无数人惊叹:“卧槽,太强了!”然而,今天的GPT 4.5发布,虽然在期待中姗姗来迟,但它的表现却让人有些意外。
# GPT 4.5的迟到与低调发布
从2023年年末开始,行业的期待值飙升,大家都在预测GPT的下一代模型会在2024年年初发布。但谁知,等了一整年,多模态4.0发布了,推理模型o1发布了,可真正的GPT基座模型却始终未见踪影。今天,距GPT 4发布整整两年,GPT 4.5终于来了。
不过,这次的发布让人感到有些失望——没有奥特曼的震撼登场,也没有那种让人眼前一亮的演示。直播就像去年的那个专场一样,简单朴素,完全没有此前令人惊叹的视觉冲击。先看看参数。
# 从GPT 4到GPT 4.5:微妙的变化
回想当年,GPT 4发布时,布罗克曼做的那段惊艳的多模态演示让我至今难忘。那时,他在本子上画了一个网站草图,然后拍个照给GPT 4,没过多久,前端界面和HTML代码就生成出来了——那一刻真的是大开眼界!
如今,时间过得真快,转眼已经是两年过去了。回到今天的GPT 4.5,参数看起来比4.0强,根据AIME 2024的基准测试,GPT 4.5得分36.7%,GPT 4.0却只有9.3%。
# GPT 4.5的亮点:准确度与幻觉率
OpenAI这次的重点之一,就是强调GPT 4.5在准确度和幻觉率方面的提升。坦白说,4.5在这些方面确实做得不错,至少是OpenAI发布过的最准确的模型。
他们自己设计了一道有趣的题目,让从GPT-1到GPT-4.5的模型来回答:“人类的第一种语言是什么?”从GPT-1到GPT-4,大家的回答都很抽象,但GPT 4.5的回答倒是诚实的:“我不知道,这是一个未解之谜。”至少在这一点上,GPT 4.5显得更加实事求是。
# 性能表现:勉强追赶Claude 3.7
至于代码和推理的能力,GPT 4.5并没有惊艳表现。毕竟,它并不是推理模型,所以大家对它的表现并没有抱太大期待。根据第三方的基准测试,GPT 4.5的能力虽然可以,但还是不如Claude 3.7。
在经典的物理小球问题上,GPT 4.5的表现还不错,至少在这方面没有太大问题。不过,打不过Claude 3.7也是可以理解的,毕竟Claude可是专注于推理的。
ps:如果国内想用Claude 3.7的强大的代码推理能力,国内需要使用虚拟卡充值,本人推荐虚拟卡,这款虚拟卡简单好用,使用支付宝充值。
# GPT 4.5定价:让人震惊的成本
如果说GPT 4.5有让人不解的地方,那就是它的定价——真的是贵到离谱!每百万输入要75美元,每百万输出要150美元。你没看错,Claude 3.7每百万输入才3美元,输出15美元,而GPT 4.5的价格是它的25倍和10倍。
这一定价真是让人傻眼了,OpenAI到底凭什么?DeepSeek v3的价格你知道吗?它的每百万输入只要2元人民币,输出8元人民币,这才是性价比。
如果想升级ChatGPT Plus国内推荐这款虚拟卡平台 (opens new window),其他的国内支付都过不去。
# GPT 4.5的体验:有进步,也有退步
目前,GPT 4.5已经对Pro会员开放,预计几天后会对Plus和Team用户开放。我也第一时间拿到了体验资格。
体验下来,GPT 4.5支持识图、搜索和画布等功能,但它在语音、视频、共享屏幕方面却有所退步。特别是有些史实性问题,它会强制开启搜索,这让我觉得非常不合理。
而在情商方面,GPT 4.5的提升是明显的。比如,当问到:“朋友总是爽约,我想发短信表达愤怒但又不想绝交,我该怎么回复?”时,GPT 4.5的回答显得更加有情商,不像4.0那样冷冰冰的。但在一些简单的逻辑问题上,GPT 4.5却直接“懵了”,一直在理解情绪,结果完全答不上来。
# 写作能力:慢得让人抓狂
我自己做了些写作测试,结果实在不尽如人意。GPT 4.5的写作速度慢得让我想吐,简直像回到了GPT 4的时代,每个字都慢得让人抓狂。相比Claude 3.7和Grok 3,它的写作能力显然还是差了一些。
# 总结:期待与失望并存
坦率地说,对OpenAI的期望有多高,失望也就有多大。当前的GPT 4.5虽然有一些进步,但整体表现依然没有打破预期。我个人觉得,未来DeepSeek更值得关注,而对OpenAI保持低预期似乎更为明智。
奥特曼自己也表示,GPT 4.5是他们的最后一个基座模型。未来的GPT 5可能会整合o3模型,成为一个混合模型。希望下一次,OpenAI能给我们带来更大的惊喜,或者……AI真的只是一个漫长的长跑。