OpenAI一夜改写历史GPT-4o干翻所有语音助手！丝滑如真人引爆全网

转载:https://www.toutiao.com/article/7368598164711965247/

原创2024-05-1405:33·新智元编辑：编辑部

【新智元导读】OpenAI说要改变历史，他们做到了！今夜的发布会上，「Her」彻底成真。GPT-4o加持的ChatGPT，和人类的对话丝滑得像个真人，惊掉在场所有观众的下巴。眼看着科幻中的设想一件件成真，活在这个奇点临近的时代，我们何其幸运。

传说，这一夜，OpenAI要改变历史。

看完发布会的观众们，久久未从巨大的震惊中走出——科幻电影中的「Her」，在此刻成真了！

在全场欢呼中，CTOMiraMurati走到台上，为全世界揭晓了OpenAI神秘新产品的面纱——

GPT-4o，在千呼万唤中登场了。

现场演示中，它的表现仿佛一个人正坐在旁边，和人类的对话节奏自然、融洽，完全听不出是个AI。

从今夜之后，人机交互彻底进入新的时代！

这也正呼应着它名字中的玄机：「o」代表着「omni」，意味着OpenAI朝着更自然的人机交互迈出了重要一步。

在短短232毫秒内，GPT-4o就能对音频输入做出反应，平均为320毫秒。这个反应时间，已经达到了人类的级别！

并且，它可以将文本、音频、图像任何组合作为输入和输出。

而在英语文本和代码基准测试中，GPT-4o的性能与GPT-4Turbo不相上下，并在非英语文本得到显著改进。

更值得一提的是，这款全新的AI模型，免费向所有人提供GPT-4级别的AI。

（是的，上周在LMSYS模型竞技场上引起整个AI圈疯狂试用的那个gpt2，就是它！）

现在，进入ChatGPT页面，Plus用户可以抢先体验「最新、最先进的模型」GPT-4o。

SamAltman亲自在x上发起了产品介绍。

Altman介绍道「GPT-4o是OpenAI有史以来最好的模型，它很聪明，速度很快，是天然的多模态。」

而且，所有ChatGPT用户都可以使用，完全免费！

Altman特意强调，此前虽然只有按月付费的用户才能使用GPT-4级别的模型，但这可不是OpenAI的本意哦。

「我们的初心，就是把最出色的AI工具，交到每个人的手中。」

（还想着，这场重要的发布会，奥特曼怎么没有现身，原来在观众席中）

而即将召开年度I/O大会的谷歌，不甘示弱，也开启了语音助手的demo实时演示。

谷歌DeepMin的CEODemisHassabis激动地表示，自己将首次在I/O大会上演讲，并分享他们所做的工作。

两大巨头正面刚起来了！明天还有好戏要看，已经闻到硝烟味了。

一夜颠覆语音助手：全新旗舰GPT-4o登场

当然，这次发布会的压轴主角，就是OpenAI推出的旗舰模型GPT-4o了。

这个带着光环登场的模型，其最大意义就在于，把GPT-4级别的智能，带给了OpenAI的每一位用户！

从此以后，无论你是付费用户，还是免费用户，都能通过它体验GPT-4了。

唯一不同的是，ChatGPTPlus的消息限制是免费用户的5倍。

并且，GPT-4o不仅提供与GPT-4同等程度的模型能力，推理速度还更快，还能提供同时理解文本、图像、音频等内容的多模态能力。

注意，GPT-4o接下来要放大招了。

实时语音对话：ChatGPT完美变身Moss研发负责人MarkChen首先展示的，是全新ChatGPT的关键功能之一——实时语音对话。

他向它问道：「我正在台上，给大家做现场演示呢，我有点紧张，该怎么办呀？」

ChatGPT非常体贴地表示：「你在台上做演示吗，那你真的太棒了！深呼吸一下吧，记得你是个专家！」

Mark疯狂地大喘气几次，问ChatGPT能给自己什么建议吗。（此处全场笑声）

它惊讶地说道：「放松啊Mark，慢点呼吸，你可不是个吸尘器！」（它的幽默感，也再次引起全场哄笑）

注意，在这个过程中，ChatGPT和Mark的互动几乎无延迟，随时接梗，共情能力满分。

而且，模型能够理解人类在对话中适时「打断」的习惯，会及时停下来听你说话，并给出相应的回复，而且也不会「断片」。

比如，Mark表示自己要再试一遍深呼吸，此时ChatGPT也恰到好处地插进来接话说「慢慢呼气」。

整个过程，自然连贯得仿佛它是个坐在你对面的人类，完全没有AI的机械感和僵硬感！

相比反应迟钝、没法打断还缺少情商的Siri等语音助手，这局ChatGPT完胜。

这，才是人类最理想AI语音助手的样子啊，Moss果然成真了！

不仅如此，ChatGPT的「高情商」也让观众们惊呼太顶了！

对话中，它可以听懂用户说话时不同的语调、语气，还能根据自己的台词生成不同语气的语音，完全没有「机械感」。

扮演不同角色，给任性的人类讲睡前故事接下来，ChatGPT被要求讲一个睡前故事，主题是「恋爱中的机器人」。

ChatGPT没讲几秒，就被人类粗暴地打断了：「多点情绪，故事里来点戏剧性行不？」

ChatGPT表示ok，用更起伏的声调、更夸张的语气开始讲起了故事。

结果没几秒，它又被再次打断：「不行不行，再多点情感，给我最大程度的表达可以吗？」

接下来，我们听到一个仿佛在舞台上表演莎剧的ChatGPT，语气夸张到仿佛是个戏剧演员。

随后，它又多次被打断，并且耐心地按照人类的要求，依次变成了机器人声和唱歌模式。

ChatGPT听到要求自己唱歌时，甚至叹了口气，然后开始亮起了优美的歌喉。

这也就是ChatGPT脾气好，要是真人，估计要被暴打了。不过它无奈叹气的那个瞬间，一瞬间的确san值狂掉——真的好像人啊！

视频实时互动解方程秀完情商，ChatGPT要开始秀智商了。

下一个任务，另一位研发负责人Barret手写了一个方程，并打开摄像头拍给ChatGPT，让它扮演「在线导师」的角色帮助自己解题，而且只能给提示，不能直接说答案。

接到任务的ChatGPT，甚至开心大叫：「Oops，我好兴奋啊！」

小哥在纸上写下这样一个方程：3x+1=4。然后问ChatGPT自己写的是什么方程，ChatGPT语调自然地回答出来了。

随后，在小哥的要求下，它一步一步说出了解题步骤。

最厉害的是，随着小哥在摄像头中解题，ChatGPT实时地就给出了鼓励和引导