订阅
编辑:定慧 好困 【新智元导读】GPT-5背后的真正野心并非单纯追求性能,而是通过「自动路由」与「思考配额」开启「单位token经济学」。这一机制让高价值请求直连交易闭环,免费流量首次具备现金流。与此同时,顶级AI的普及让十亿人几乎零成本接触博士级智能,「大众智能」正在成新的历史拐点。 直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。 未来不是「谁最聪明」的模型竞赛,而是如何能把高价值意图精准接到可抽佣闭环的一方,如何能够让每一个token的生成都伴随巨大的经济价值。
另一方面是,参考对比的模型和之前不同了。 俗话说得好,「没有对比,就没有伤害」。 虽然GPT-5在关键能力上的提升,与当年GPT-4超越GPT-3时的情景如出一辙。 但问题是,这两代模型的发布节奏完全不同。 在GPT-3到GPT-4之间,OpenAI自己的重磅更新只有GPT-3.5。 然而到了GPT-5这里,光OpenAI自己就发了好几款SOTA模型。 再加上其他前沿AI实验室的成果,那种一次性巨大飞跃所带来的震撼,早已不复存在。
OpenAI打算用GPT-5验证商业模式 OpenAI一开始就没有打算用GPT-5来继续拉高全球科技狂热者和无数用户对于AGI的追求预期。 GPT-5的关键不是AGI、性能、参数等等「硬核指标」,而在于GPT自带的「自动路由」与「思考时长管理」。 「自动路由」让OpenAI来决定用户的问题到底被发送到哪个模型,比如「为什么天空是蓝色」就无需调用Pro模型。 而「思考时长管理」让所有用户不能再额外占用模型的算力,GPT-5发布前,很多专业用户都长期使用o3或者o3-pro。 在最新一期的a16z的访谈节目中,请来了SemiAnalysis创始人Dylan Patel。
Dylan Patel,和他创办的SemiAnalysis是有关人工智能和半导体领域最权威的机构。
Dylan Patel认为GPT-5的关键并非参数增大,而是自动路由与「思考时长配额」管理。 高价值请求走昂贵链路,低价值请求交给轻模型,在不牺牲体验的前提下OpenAI能够实现降本增效。 对于免费用户,变现路径是通过把「高价值意图」(购物、法律、出行等)直连交易与抽佣闭环。 这让ChatGPT上的免费流量首次具备现金流。 免费用户的低价值查询则通过路由机制,弹性降级来控制成本。
逼得厂商从「无限/包月」转向速率与按量结合。 企业更偏好「可预测账单」的固定费率,消费者侧则难以回避用量差异。 所以OpenAI在发布GPT-5后,淡化了模型的概念,淡化了思考和非思考的概念,而是变为自动、极速、短思考、认真思考和专业模式。
这种转变的背后,藏着OpenAI的野心,他们希望能够主动给你分配算力和配额,而不是让用户肆意的浪费和占用。 另一方面,由于GPT-5策略的转变,现在免费用户是最大受益者。 GPT-5发布前,免费用户很难接触使用思考和专业模型,但是现在,欢迎来到「大众智能」时代。 大众智能时代 从GPT-5到纳米香蕉,强AI人人可得 如今,全球有至少十几亿人,都在定期使用AI。 ChatGPT每周活跃用户超7亿,再加上Gemini及其他顶尖AI,用户总数又增加了数亿。 通常,我们关注的都是AI技术领域的重大突破,但这其实掩盖了一场更宏大、酝酿已久的变革: 我们正在进入一个「大众智能」(MassIntelligence)时代。 在这个时代,强大的AI正变得像谷歌搜索一样触手可及。 强大的AI正变得唾手可得 过去,对大多数用户而言,接触强大的AI有两大障碍。 其一是「选择困境」。 很少有人知道该如何挑选AI模型,更少有人知道,在ChatGPT的菜单里选择o3模型能让他们用上顶级的推理AI,而选择看起来数字更大的4o,得到的能力却要逊色得多。 据OpenAI透露,即便是付费用户中,也只有不到7%的人会定期选择o3模型,这意味着大量高级用户也错过了推理模型的强大功能。 其二是成本。 由于顶级模型运行成本高昂,免费用户通常无法使用,或者只能在极为有限的情况下体验。 谷歌率先向免费用户开放了部分顶级模型,但OpenAI表示,在GPT-5推出前,其免费用户几乎无缘使用推理模型。 GPT-5的提出,正是为了解决上述两个问题:
所以,当你向「GPT-5」提问时,你其实是在和一个「路由模型」对话,它会自动判断你的问题该由小而快的模型处理,还是需要动用更强大的推理模型。 ![]() |
10 人收藏 |
![]() 鲜花 |
![]() 握手 |
![]() 雷人 |
![]() 路过 |
![]() 鸡蛋 |
收藏
邀请