大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸

sxkk20082年前智能百科279
据广大网友们的反馈,似乎人们普遍认为GPT-4变得有些愚笨了。距离OpenAI最初发布GPT-4已经过去了将近四个月。然而,随着时间的推移,最近网络上开始出现了一些质疑声,认为世界上最强大的GPT-4似乎变得不那么强大了。

据广大网友们的反馈,似乎人们普遍认为GPT-4变得有些愚笨了。距离OpenAI最初发布GPT-4已经过去了将近四个月。然而,随着时间的推移,最近网络上开始出现了一些质疑声,认为世界上最强大的GPT-4似乎变得不那么强大了。

一些业内人士认为,这可能与OpenAI对该系统进行重大重新设计有关。实际上,在最近几周,我们或多或少地在网络上看到了一些GPT-4用户对其性能下降的怨声。有用户称这个模型相比先前的推理能力和其他输出变得"懒散"和"愚笨"。

而且,不仅如此,在Twitter和OpenAI的在线开发者论坛中,用户们也表达了对这一问题的不满。例如,他们认为GPT-4的逻辑能力减弱了,回答错误增多了,对提供的信息追踪能力丧失了…

对于GPT-4究竟发生了什么,让我们来看看网友们的反馈:

一位使用GPT-4进行网站开发的网友写道:"现在的GPT-4真是让人失望。感觉就像你开了一个月的法拉利,突然它变成了一辆破旧的皮卡车。按照这种趋势,我不确定我是否愿意为此付费了。"

还有用户表示:"我使用ChatGPT有一段时间了,自从GPT-4发布以来,我一直是GPT Plus的付费用户。最近几天,GPT-4似乎在之前擅长的事情上遇到了困难。以前,它似乎能很好地理解我的请求。现在,它对信息的追踪能力下降了,给出的信息有误,并且经常误解我的问题。"


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


Roblox的产品负责人Peter Yang在Twitter上声称,GPT-4的输出速度变快了,但质量却降低了。例如,在让它输出更清晰、简洁和有创意的文本任务时,GPT-4给出的结果质量下降了。

"GPT-4开始反复输出代码和其他信息,就像它大脑死亡一样。如果你没有真正经历过它之前的能力,你可能不会注意到。但对于那些之前充分使用过GPT-4的人来说,他们明显感觉到它变得更愚蠢了。"另一位用户抱怨道。


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


"我对GPT-4的回答质量也有同样的问题,有人知道如何解决或纠正这种情况吗?"

"我确实注意到了这一点。在一天中的某些时候,它似乎只记得最近的提示。但在一整天的使用中,GPT-4的性能似乎有波动,在不同的时间尝试时,感觉它的表现也不一样。"


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸

通过网友的反馈,可以看出大家都有感受到GPT-4变得愚笨的事实。

自OpenAI在去年年底发布ChatGPT,这一举动震惊了整个人工智能界。最初,ChatGPT是建立在GPT-3和GPT-3.5基础之上的。而在三月中旬,GPT-4发布后,迅速成为开发者和其他科技行业人士的首选模型。

GPT-4被认为是广泛可用的最强大的人工智能模型,具备多模态功能,可以理解图像和文本的输入。根据创业公司Lamini首席执行官Sharon Zhou的说法,它虽然速度较慢,但非常精准。

然而,几周前,情况开始发生变化。尽管GPT-4的速度变快了,但性能却明显下降了。这引发了整个人工智能社区的讨论。根据Sharon Zhou和其他专家的说法,这意味着着发生了重大的变革。

他们认为,OpenAI正在创建一些较小的GPT-4模型,这些模型在功能上类似于大型模型,但运行成本更低。

几天前,SemiAnalysis发布的一篇付费订阅内容也涉及到这一点。文章中提到,OpenAI通过使用混合专家(MoE)模型来维持可行的成本。他们在模型中使用了16个专家模型,每个专家模型大约有111B个参数。这些专家模型中的两个被路由到每个前向传递。

"这些较小的专家模型针对不同的任务和领域进行了训练。可能有一个专门用于生物学的小型GPT-4,以及其他用于物理学、化学等领域的小型模型。当一个GPT-4用户提问时,新系统就会知道向哪个专家模型发送该查询。新系统可能会决定将查询发送给两个或多个专家模型,然后将结果合并起来。"Sharon Zhou解释道。

开发者兼黑客George Hotz在最近的一个播客中描述了GPT-4是运行8个混合模型。需要提到的是,艾伦人工智能研究所创始CEO Oren Etzioni在看到这些信息后,通过邮件向Business Insider表示:“我『推测』这些猜测大致准确,但我没有证据。”


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


Oren Etzioni认为,采用混合模型的目的在于提升生成式模型的输出质量、降低成本并提高响应速度。


eEtzioni进一步补充道:"恰当地使用混合模型可以同时满足上述需求,但通常需要在成本与质量之间做出权衡。有传言称OpenAI正在为了降低成本而牺牲一部分质量,但这只是无根据的传闻。"


据实际情况,2022年,OpenAI的总裁Greg Brockman与几位同事合作撰写了一篇有关MoE方法的文章。该文中提到:"采用MoE方法,在不增加计算成本的前提下,模型可以支持更多参数。"


Sharon Zhou表示:"与训练和OpenAI推出的小型专家GPT-4模型有关,GPT-4近几周的性能下降是很可能的。当用户对其进行测试时,我们会提出各种不同的问题。尽管它的回答可能不理想,但它会从我们那里收集数据,并不断改进和学习。"


相关文章

脚踩midjourney手撕ChatGPT 这五个好用的AI工具不用钱

脚踩midjourney手撕ChatGPT 这五个好用的AI工具不用钱

AI工具的广泛应用正在各个领域中愈发普及,为我们的生活和工作带来了许多便捷。然而,许多AI工具的付费要求和海外手机号注册流程既增加了使用成本,又带来了不便。因此,扩展迷为大家整理了五款我常用的免费AI...

人人争当“学霸”,贝壳搏学大考引领房产经纪人职业化新风尚

人人争当“学霸”,贝壳搏学大考引领房产经纪人职业化新风尚

 最近,杭州的房产经纪门店都变成了学习教室,经纪人们拿着教材反复阅读,还建起了学习小组相互PK,为的就是在“搏学大考”上搏出好成绩。 “搏学...

美的空调携百位设计师,共创全屋智慧空气美好生活

美的空调携百位设计师,共创全屋智慧空气美好生活

12月20日,美的空调·空气美学挚友百人计划设计师盛典于广东圆满举办。众多位优秀设计师与行业专家汇聚一堂,现场对家装、家电融合设计趋势以及美居生态环境进行深度交流探讨,同时杰出设计...

海信激光电视2024德国柏林消费电子展“炫技”连连,超百吋巨幕体验值爆表

海信激光电视2024德国柏林消费电子展“炫技”连连,超百吋巨幕体验值爆表

当地时间9月6日,IFA2024如期而至,各种新奇的产品上演了一场技术大秀。作为激光显示赛道的创领者,海信激光电视一出场便“炸场”,带来了全球首款8K屏幕发声激光电...

海尔全屋家居亮相中国品牌博览会,理念创新高端品质体验再升级

海尔全屋家居亮相中国品牌博览会,理念创新高端品质体验再升级

 5月10日-14日,由国家发展改革委、国资委、市场监管总局、国家知识产权局共同主办的2024年中国品牌博览会在上海盛大开幕。 作为第8个中国品牌日系列活动之一,今年中国品博会...

CITE2024 | TCL华星又上大分!前沿屏实力带你探显未来

CITE2024 | TCL华星又上大分!前沿屏实力带你探显未来

2.8K印刷OLED笔电惊艳逼人,120Hz高刷电竞屏流畅丝滑,85"极致画质TV巨幕沉浸,健康护眼平板自动监测调光,2K LTPO极窄边框手机屏视野无界…&hel...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。