工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客1年前AI生活170

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

英伟达「三芯」策略初步奏效 | ISC 2022

英伟达「三芯」策略初步奏效 | ISC 2022

相比几年前谈论的重点只有GPU,在拥有CPU和DPU之后,英伟达作为系统公司能够谈论的话题更加丰富。 在刚刚过去的Computex和时隔两年重...

Meta元宇宙「寒气」逼人,数字人用「内功」驱寒

Meta元宇宙「寒气」逼人,数字人用「内功」驱寒

引语: 终于有人承认,自己对“元宇宙”的前景太过于乐观。 不过令人大跌眼镜的是,说出这话的人,是“元宇宙教父”——马克·扎克伯格,而这句话的...

5G+速 移路领先 南京5G“驾驶”无人车开进主城区

5G+速 移路领先 南京5G“驾驶”无人车开进主城区

 坐在自动驾驶公交巴士里的安全员,全程只需关注突发情况,为行车安全保驾护航。 石头城下,梅子洲头,历经蜕变的古老金陵迸发出智慧的火花。当...

筑牢数据安全底座 我国高标准星基增强技术实现“零的突破”

筑牢数据安全底座 我国高标准星基增强技术实现“零的突破”

作为我国首个具备自主知识产权、高标准高可用的星基增强服务,千寻位置星基增强服务(XStar)从 2021 年 5 月商用以来,通过地球同步轨道...

TikTok与环球音乐达成新授权协议

当地时间5月1日,TikTok与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的录制音乐和词曲版权库将重返TikT...

“科技春晚“2024 CES圆满落幕 开普勒人形机器人“首秀“广获好评

“科技春晚“2024 CES圆满落幕 开普勒人形机器人“首秀“广获好评

作为一年一度全球消费电子领域的"科技春晚",2024美国拉斯维加斯消费电子展CES在大洋彼岸圆满落幕。1月9日-12日,这场为期四天的全球科技盛会吸引了全球逾4000家的厂商参展,...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。