Sora“世纪大关门”后,全网热议OpenAI此举背后动机,本以为这是为了IPO而进行的战略收缩。 结果联创兼总裁Greg Brockman直接放料——其实是为了一个“蓄谋已久”的Super App。…
Sora“世纪大关门”后,全网热议OpenAI此举背后动机,本以为这是为了IPO而进行的战略收缩。
结果联创兼总裁Greg Brockman直接放料——其实是为了一个“蓄谋已久”的Super App。
而且不止告诉你这个Super App长啥样,连即将到来的新模型“Spud”(中文名土豆?)也没憋住。
等等,如果你和我一样,以为“Spud”不过是又一个“GPTxxx”,那就大错特错了!
Greg已经说了,这是个重新预训练的模型,凝聚了OpenAI过去两年的心血智慧——等上手你就会意识到,它将变得有多聪明且“顺从”。
还没完,Greg还聊到了OpenAI今年的大笔融资、和A社家对B端用户的争夺……
以下为播客实录精校(感谢AI),在不改变原意的基础上做了适当编辑。
主持人:现在外界看到你们放弃Sora转向Super App,为什么?
Greg:过去我们一直在两条线并进:一是研发深度学习技术,看它能否产生我们设想的积极影响;二是尝试部署这项技术,为业务提供支撑,积累真实世界的落地经验。
现在我们到了一个节点——技术已经验证可行,不再只是跑benchmark、做智力演示,而是必须进入真实世界,通过人们实际使用来获得反馈,才能继续推进。
所以这是一个更大的战略调整,不是因为我们要从消费端转向B2B,而是因为我们不能什么都做。我们要聚焦那些能形成协同、真正产生影响力、能帮助每个人的应用。
主持人:你曾把OpenAI比作迪士尼,以模型为核心(像米老鼠),然后衍生出视频、助理、企业服务等。现在是无法兼顾了吗?
Greg:实际上这个比喻依然成立,而且某种程度上反而更适用。但从技术层面看,Sora视频模型与GPT系列(核心推理模型)是技术树上不同的分支。
我们确实还在继续做Sora的研究,但它是放在机器人领域里推进的——机器人目前仍处在研究阶段,还没成熟到未来一年就能在知识工作领域大规模落地。
所以我们当前的战略是:把主要精力放在GPT系列上,这不仅包括文本,也包括语音等交互,这些都是在同一个模型上做微调,而不是另起新枝。在算力有限的情况下,同时推进两个差异巨大的产品分支非常困难。
主持人:那你为什么不押注Sora这条路?视频生成进步这么大。
Greg:现在最大的问题是机会太多。我们在OpenAI很早就发现,只要逻辑在数学上成立,几乎所有想法都能奏效,这就是深度学习的迷人之处。
但重点在于排序和时机。我们已经确信文本模型可以走向AGI——AGI就在眼前,今年还会有更强的模型。
比如最近,一位物理学家研究了很久的难题,OpenAI模型在12小时内就给出了解决方案。这种“思考”的能力让我们必须加倍下注。这不是说哪个方向不重要,而是OpenAI肩负的使命是把AGI带给世界,我们要做的就是把这条技术树推到底。
主持人:DeepMind的哈萨比斯曾说,图像生成器最接近他心中的AGI,因为它们必须理解物体间的互动。OpenAI会不会因为只押注一条路径而错失什么?
Greg:在这个领域你必须做出选择。OpenAI从一开始就决定了自己相信的AGI路径。而且,图像生成也是ChatGPT的重要功能,但我们是基于GPT架构而非扩散模型来实现它的。
所以我们要做的是尽可能统一技术栈,这样才能支撑起整个经济——OpenAI做的是“通用”人工智能,G就代表这个意思。
主持人:那Super App具体会是什么样?
Greg:它将整合编程、浏览器和ChatGPT。我们希望为你构建一个能让你体验AGI力量的端点应用。它不仅是一个工具,更是你的“个人助理”,它了解你、与你的目标一致、值得信任。
以前Codex只是软件工程师的工具,现在它将变成每个人的工具。你想让电脑做什么,直接告诉它就行,电脑会顺应人类,而不是人类顺应电脑。
主持人:这不仅是针对商业,也针对个人生活?
Greg:没错,就像你的笔记本电脑既用于工作也用于生活。未来的Super App会有记忆,它连接你的邮件、日历,知道你的偏好,从而更深层次地帮你达成目标。
Greg:未来几个月会分步推进。起点就是Codex应用——它既是通用的智能体框架,能调用各种工具,又擅长写软件。这个通用框架可以接入电子表格、Word文档,帮你完成知识工作。在OpenAI内部,我们已经看到很多人自发用它来做这些事。第一步就是让Codex对普通知识工作更友好,后面还有很多步。
主持人:像Anthropic已经有了Claude Code等类似Super App的功能。OpenAI觉得自己赶上来了吗?
Greg:如果回看12到18个月前,OpenAI一直很重视编程这个方向,在各种编程竞赛上成绩最好。但当时没怎么投入“最后一公里”的易用性——AI虽然能解竞赛题,但没接触过真实世界的代码库,那些代码杂乱无章,不像它训练时遇到的那样规整。
本文转载自量子位,版权归原作者所有
评论