工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客2年前AI生活248

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

Gartner报告:腾讯企点蝉联中国CRM市场份额本土厂商第一

今日获悉, Gartner发布《市场份额分析:2022年全球软件行业市场规模》。报告显示,腾讯企点持续领跑中国客户关系管理(CRM)市场,市场...

人工智能图库

人工智能图库

人工智能图库是指通过人工智能技术生成的图片素材库。这些图片可用于各种场景,包括但不限于设计、广告、营销、自媒体等。以下是一些常见的人工智能图库:Pexels:Pexels是一个免费高质量的图片和视频素...

国家级安全智能终端研发公司京数科技落户金桥

国家级安全智能终端研发公司京数科技落户金桥

近日,深圳瓦戈技术全资子公司京数科技(上海)有限公司在金桥智立方正式落地,金桥智能终端产业又添一员“猛将”。 瓦戈技术是一家提供全方位网络与...

以赛引才,2022杭州全球人工智能技术创新大赛-算法挑战赛收官

以赛引才,2022杭州全球人工智能技术创新大赛-算法挑战赛收官

11月26日,2022杭州全球人工智能技术创新大赛-算法挑战赛颁奖典礼在杭州未来科技城举行,为大赛划上圆满句号。 据统计,自今年2月底...

驭势科技吴甘沙:L4的旅途是马拉松加决斗赛,到达终点的是成长型选手

驭势科技吴甘沙:L4的旅途是马拉松加决斗赛,到达终点的是成长型选手

在近日召开的“智启未来—2023中国人工智能投融资峰会” 之“自动驾驶,新阶伊始” 主题论坛上,驭势科技的创始人吴甘沙表示,L4的旅途是马拉松...

华为发布业界首款心率体温双测TWS耳机,引领行业差异化发展

华为发布业界首款心率体温双测TWS耳机,引领行业差异化发展

随着消费者对便捷生活方式的追求越来越高,市场上主流手机已经陆续取消了耳机插孔,TWS耳机市场也随之迅速成长起来。苹果作为第一款推出TWS耳机的...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。