工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客1年前AI生活101

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

助力大湾区世界级机场群建设,广东机场集团、阿里云联合启动数据治理与中台建设

助力大湾区世界级机场群建设,广东机场集团、阿里云联合启动数据治理与中台建设

3月17日消息,广东机场集团在广州举行数据治理和中台建设项目启动会。这是中国民航业内首个基于数据治理和中台驱动的智慧机场建设项目。项目由阿里云...

独家丨Temu入局东南亚,上演「四国杀 」

独家丨Temu入局东南亚,上演「四国杀 」

8月27日,Temu上线菲律宾,拉开了征讨东南亚的序幕。 小编独家获悉,Temu或将在9月陆续登陆马来西亚、泰国、越南、新加坡。 行业人士阿...

新基建对智慧工地的影响有多大?

新基建对智慧工地的影响有多大?

建筑行业是我国国民支柱产业,得益于经济的快速发展,行业规模在稳定增长。但近10年来中国建筑业产值利润率远低于其他产业,研发投入不到1...

奇绩创坛创始人陆奇近期将在深圳做大模型相关主题分享

奇绩创坛创始人陆奇近期将在深圳做大模型相关主题分享

活动简介: 本次活动中,奇绩创始人兼CEO陆奇博士将剖析以大模型为代表的新范式的历史发展、动力引擎和关键路径;探讨它所催生的新时代,在全球范围...

卷王实锤!广汽传祺4月销量同比劲增45.3%

卷王实锤!广汽传祺4月销量同比劲增45.3%

在过去的一季度,各大车企纷纷出台消费政策,极大提振了车市信心,面对汽车行业的加速内卷,广汽传祺用销量实力巩固了自身的“卷王”地位,一季度市占...

泡泡玛特探索服务零售,首个潮玩主题乐园十一评论量上涨83%

泡泡玛特探索服务零售,首个潮玩主题乐园十一评论量上涨83%

主题乐园、潮玩展等正成为年轻人假期消费的新打卡地。刚刚过去的十一假期,不愿出门“看人”的北京年轻人们有了潮玩新去处。 9月26日,位于北京朝阳...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。