工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客2年前AI生活201

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

即刻开启零信任网络之旅,绎云推出永久免费的轻量级零信任网络产品

即刻开启零信任网络之旅,绎云推出永久免费的轻量级零信任网络产品

绎云推出永久免费的轻量级零信任网络产品——信域安全云网Lite(以下称信域Lite),帮助企业在碎片化的物理网络之上构建一张点对点虚拟网络,用...

从“小家”到“大家”,中国移动智家中心温暖守护团圆年

从“小家”到“大家”,中国移动智家中心温暖守护团圆年

年是一条回家的路,也是一群守护的人。新春佳节,家的归属感越发凸显,智慧家庭业务需求量不断增多,中国移动智慧家庭运营中心迅速开启“保驾护航”模...

这场百万奖金大赛,你们不来参加?

这场百万奖金大赛,你们不来参加?

“再挖点特征出来吧。” “看看还有没有超车的机会。” “终于找到隐藏BUG了。” “提交成功了!” 在这场持续 60 小时的极限挑战中,24...

刷脸时代,智能支付安全需完善!

刷脸时代,智能支付安全需完善!

互联网已经成为我国当下经济发展中的重要举措,在推动各行业快速发展的同时,也为市场交易安全起到促进作用。随着AI智能技术水平的不断提高...

规模与利润并重策略连续三个季度奏效,小米迎来全面跨越

既要规模又要利润,小米在Q3做到了。 11月20日晚间,小米公布今年三季度财报,前三季度,小米集团营收人民币709亿元,经调净利人民币60亿元...

对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

走进融新科技中心A座23层,映入眼帘的是绿植、野营桌椅帐篷,在如此轻松的环境下,小编见到了APUS创始人李涛,他着一身休闲装,显得尤为放松。...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。