通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客2年前AI生活154

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

GAS/GAS

NEO中内置两种原生代币,NEO(缩写符号NEO)和 NeoGas(缩写符号GAS)。 NEO是管理代币,总量1亿份,用于实现对NEO 网络的管理权。管理权包括投票进行记账人选举,NEO网络参数更改...

孙正义陷入「贪利」危机

孙正义陷入「贪利」危机

以前的孙正义,曾在软银内部工作会议中告诉员工:创业公司的估值仍在飙升,你们的投资还不够激进。 然而就在今年的8月8日,64岁的孙正义作为软银C...

五射频设计,锐捷Wi-Fi 7新品RG-AP9850-R打造高密无线好体验

五射频设计,锐捷Wi-Fi 7新品RG-AP9850-R打造高密无线好体验

2023年11月,锐捷网络搭载新一代Wi-Fi 7(802.11be)技术的高密无线AP 新品RG-AP9850-R正式上市,该产品适用于无...

大中华区首家云管理服务提供商成立!平安云和GitHub达成战略合作!

大中华区首家云管理服务提供商成立!平安云和GitHub达成战略合作!

2018年10月17日,平安云发布会在深圳举行。会上正式宣布平安云与全球知名代码托管及开源社区平台GitHub达成战略合作,未来,将通过平安...

一口气发布L8、L7两款新车,李想「杀」疯了

一口气发布L8、L7两款新车,李想「杀」疯了

15点整,发布会准时开始,在预热阶段理想汽车视频号的直播间已经涌入了超过1万人。 但大家很难料到,除了预先官宣的新车L8,李想还会在这场发布...

科沃斯推出全新基站式擦窗机器人窗宝W2 PRO,擦窗机器人2.0时代来临

科沃斯推出全新基站式擦窗机器人窗宝W2 PRO,擦窗机器人2.0时代来临

 中国,北京,12月4日——科沃斯全新基站式擦窗机器人WINBOT W2PRO今日正式上市,目前已于科沃斯官网、京东、天猫官方旗舰店等平台同步开启预售,首发到手价为3299元,预售...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。