当OpenAI首席技术官米拉·穆拉提发布桌面版本的ChatGPT和新的旗舰模型—GPT-4o,OpenAI的发展,进入到了一个真正意义上的奇点时刻。
OpenAI的短短26分钟的发布会,却依然引发了不少波澜。
无论是ChatGPT-4o的完全免费,抑或是推出PC桌面版的ChatGPT,无一不为我们显示出OpenAI的领先。
然而,如果仅仅只是一味地尬吹OpenAI的领先,必然是没有太多裨益的。
原因在于,OpenAI的确在很多方面具备着相对领先的优势,这样一种领先,并不仅仅只是体现在它与谷歌的差距上,同样还体现在它与中国AI玩家们的差距上。
透过OpenAI的发布会,我们需要更多地看到的是,时下的AI行业,正在发生着的深刻变化,并由此来找到适合当下发展趋势的新机会。
如果一定要找到OpenAI的这场短短发布会带给我们的启示的话,我更加愿意将其看成是AI正走在互联网道路上的一种直接体现。
以此为开端,AI将会真正从一个局限于实验室里的存在,成为一个被越来越多的大众所认识、所使用、所接受的存在。
如果我们将ChatGPT-4o之前的OpenAI,看成是一个布道者的话,那么,ChatGPT-4o之后的OpenAI,则更像是一个实践者。
一句话,OpenAI正在open AI。
未来,我们将会看到越来越多的场景和行业当中,开始出现AI的影子,我们将会看到越来越多的玩家们,开始加入到普及与落地AI的过程当中。
认识到这一点,我们或许才能更好地把握OpenAI这样一个短短26分钟的发布会,带给我们的更深层次的意义。
一
OpenAI这样一个发布会扔出的「王炸」,其实就是推出了ChatGPT-4o这样一个完全免费的应用。
从表面上来看,OpenAI之所以会进行完全免费,其中一个很重要的原因在于,它的用户的增长业已进入到瓶颈期,为了拓展更多的用户,OpenAI便开始通过免费的方式来获得新的用户。
自去年ChatGPT推出后,在2023年5月达到流量峰值,网络访问量达到18亿次,但之后流量出现下滑情况。2024年3月,ChatGPT的访问量依然稳定在了18亿次,不再有明显增长。
当OpenAI通过ChatGPT-4o完全免费进一步降低使用门槛,首先起到立竿见影效果的,便是用户量的增长。
对于业已陷入到用户增长瓶颈期的OpenAI来讲,无疑是一个非常不错的尝试。
如果我们将ChatGPT-4o的完全免费,看成是OpenAI为了提升用户量所做的一次尝试的话,那么,ChatGPT-4o此次将更多的场景应用到端侧模式以及代码生成能力的场景应用,则是将OpenAI的用户量的增长拓展到了更为广阔的领域之中。
这其实是和互联网行业的发展,有着异曲同工之处的。
我们都知道,早在互联网尚未风靡的时候,人们对于互联网的使用,并不是像现在这样普及,甚至在很多情况下,人们对于互联网的使用,如同现在人们对于AI的使用一样,必须要付费。
很显然,通过付费的方式,很难让互联网释放出更大的发展潜能,很难成就一个叫做「互联网」的时代的。
于是,为了让互联网释放出更大的发展潜能,为了让互联网真正成就一个时代,必然需要做的,便是将以往收费的互联网服务进行免费,并且真正用这样一种方式来实现互联网的最大限度的普及。在此基础上,我们再去寻找「互联网+」的商业模式。
可以说,免费,真正让互联网成为了一种「基础设施」,而免费同样促进了「互联网+」模式的不断成熟和完善。
对标到AI的身上,其实同样如此。
毋庸置疑的是,OpenAI通过ChatGPT让我们看到了AI的强大,让我们看到了对于效率提升的积极影响。
然而,在很多时候,人们对于AI的感知依然是在收费的情况下完成的,依然是受到收费的掣肘的。
在这样一种情况下,AI很难成为一种基础设施,更加难以释放出新的更大的发展潜能的。
因此,如果一定要找到AI走在互联网上道路上的具体表现的话,完全免费,并以此来促成AI最大限度的普及,并以此来孕育出更多新的商业模式,无疑是最直接的表现。
当OpenAI撕开了免费的口子,我们或许还将会在未来看到更多玩家加入其中,从而真正将人们带入到人人皆可使用AI,万物皆可AI的全新发展阶段。
二
除了ChatGPT-4o的完全免费之外,OpenAI在发布会上更多地为我们展示的是,GPT-4o的模型能力、基准测试、模型安全性和局限性。
模型能力上,在GPT-4o之前,ChatGPT语音模式对话的平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。
如今借助 GPT-4o,OpenAI跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。
传统基准测试层面上,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上均处于高位。
在5次MMLU(常识问题) 上,GPT-4o创下了87.2%的新高分,远超谷歌Gemini Pro 1.5、Ultra 1.0,以及自己的GPT-4T和GPT-4等。
模型安全性和局限性上,GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术,在跨模式设计中内置了安全性。以及创建了新的安全系统,为语音输出提供防护。
根据对网络安全、CBRN、说服力和模型自主性的评估表明,GPT-4o 在这些类别中的任何类别中的得分都不高于中等风险,而且团队继续降低发现的新风险。
如果要找到ChatGPT-4o这些特征为我们传递出来的信息的话,说到底,就是为了让更多的用户可以更加快速、更加安全、更加高效地使用ChatGPT-4o。
简单来讲,OpenAI在ChatGPT-4o上的这些进化,正是为了其产品更好地进行商业化。
透过这一点,我们同样可以看出,AI的发展,正走在互联网的道路上。
我们都知道,在互联网时代,我们经历了DOS系统,Windows系统以及后来的iOS系统、安卓系统等操作系统。
如果对这些操作系统进行总结和定义的话,说到底,它们进行不断地升级的一个终极目的,就是为了让互联网可以更好地商业化,可以让互联网更好地与商业场景结合在一起。
当互联网有了这样的进化,我们才看到了衍生于互联网的门户网站、「互联网+」应用以及移动互联网时代所诞生出来的各式各样的应用。
可以说,互联网的不断的迭代和升级所带来的一个最为直接的结果,便是互联网的商业化的普及。
对于AI来讲,其实,同样是在遵循这样一种发展脉络。
说到底,AI最终还会要落脚在商业化上,才能够真正将自身的发展潜能释放到最大。
否则,所谓的AI,依然仅仅只是一个讲给资本市场听的美好的故事,当资本的热情不再,特别是当AI的发展真正需要自我造血的时候,它的发展,依然还是会面临这样那样的问题。
无论是百度的李彦宏,还是360的周鸿祎,乃至是金沙江创投的朱啸虎,其实都在不同的场合表达过对于AI的这样一种看法。
说到底,他们所表达的观点,其实都是一个中心思想。
这样一个中心思想,其实就是让AI更多地聚焦场景和应用,更多聚焦在商业化上,而不仅仅只是一个停留在实验室里,并不仅仅只是局限于有限场景之中的小众存在。
透过ChatGPT-4o的发布,我们可以看出,OpenAI在探索和实践商业化的方式和方法,以此为开端,我们将会看到更多有关AI沿着互联网的道路发展的新迹象的出现。
三
回顾互联网的发展,不难看出,互联网之所以会获得如此大的发展,之所以会成为人们的一种生活方式,其中一个很重要的原因在于,互联网得到了最大限度的普及。
时至今日,互联网,业已成为了几乎所有人的生活方式。
以直播、短视频为主导的全新时代的来临,更是将互联网的普及率,带入到了一个全新的高度。
对于AI来讲,欲要获得新的发展,欲要成为一种全新的生活方式,必然需要重新演绎以往互联网所走过的道路,必然让以往互联网所做的普及的动作,重新在自己的身上得到演绎。
如果我们要寻找OpenAI这样一场发布会提供给我们的新启示的话,它不断地让AI进行普及,不断地将AI成为一个被B端和C端都能够接受的存在,或许才是值得关注的另外一个方面。
当OpenAI以ChatGPT的聊天机器人出现在人们的面前,它仅仅只是在聊天这样一个场景下存在,它仅仅只是解决的是较为简单的逻辑推理的能力。
时至今日,ChatGPT早已不再是简单意义上的聊天机器人,它不仅可以聊天对话、文生图片,还能文生视频,甚至还可以像人的反应速度一样与人们进行交互。
OpenAI表示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。
GPT-4o可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。
它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
说到底,OpenAI其实就是通过不断地提升ChatGPT的交互能力来提升人与AI沟通和交流的门槛,不断地让OpenAI的产品更好地进行普及。
如果将OpenAI在交互上的提升与互联网以往的发展脉络进行总结和定义的话,它们共同的终极目的,其实就是为了让AI可以更好地普及,并且真正让AI成为一种全新的生活方式。
因此,如果我们要找到OpenAI的发布会给我们的新启示的话,不断地让AI普及,不断地沿着互联网的方向前进,无疑是另外一个最值得我们关注的方面。
正如OpenAI CEO奥特曼在发布会后的博客里所说的那样:
「我为我们能在ChatGPT中免费提供世界上最先进的模型感到非常自豪,这一切都没有广告或其他干扰。最初,OpenAI的设想是开发AI技术,并利用它为全球带来益处。然而,现实是我们开发了AI技术,而其他人则利用这些技术创造了令全世界受益的杰出成果。作为一家企业,我们有很多服务是需要收费的,但不妨碍我们支持向全球数十亿用户提供免费的顶尖AI服务。」
「新推出的语音(及视频)模式是我使用过的最佳计算界面。它给人一种电影中AI的感觉,让人不禁惊叹这竟是真的。达到与人类相似的响应速度和表达能力,标志着一个重大的转变。最初的ChatGPT已经展示了语言界面的潜力;而这一新技术则在体验上有了质的飞跃。它反应迅速、智能、有趣、自然且实用。以前,我与计算机对话从未感觉如此自然;但现在,我终于有了这种感觉。随着我们逐步增加个性化选项、获取个人信息的权限、代表用户执行操作的能力等功能,我真的可以预见到一个激动人心的未来:我们能够利用计算机完成以往无法想象的更多事务。」
结语
如果一定要寻找OpenAI这样一场短短26分钟的发布会传递出来的信息的话,OpenAI正走在互联网的道路上,无疑是再清晰不过的了。
可以说,通过这样一场发布会,OpenAI完成了从AI布道者向实践者的完美转身。
对于AI来讲,其实是需要这样一场免费化、普适化和商业化的。
至此,OpenAI开始open AI。
原因在于,只有经历了这样一场普及和商业化,AI的发展,才不仅仅只是一个停留在实验室里的存在,才不仅仅只是一个小众化的存在,而是成为了一个类似互联网的,可以与万千场景,千行百业都实现了 融合的存在。
以此为开端,ChatGPT才能真正成为英伟达CEO黄仁勋口中的「iPhone时刻」,而GPT-4o,无疑是OpenAI的奇点时刻。
—完—
作者:孟永辉,资深撰稿人,专栏作家,行业观察家,知名KOL,数字经济学者。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。