通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客2年前AI生活130

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

以科技之名升级公益计划,海尔科技少年创新大赛正式启动

以科技之名升级公益计划,海尔科技少年创新大赛正式启动

初夏的陕西商洛还十分凉爽,但山阳县高坝海尔希望小学的学生们对新校园的喜爱却十分炽热。5月31日,海尔集团携手中国青少年发展基金会、新华社齐聚秦...

宇视科技发布首款户外电源产品,正式进军储能行业

宇视科技发布首款户外电源产品,正式进军储能行业

近期,宇视科技(uniview)发布首款户外便携电源产品ES-S1000,正式进军储能市场。该款产品最大支持1000W的输出功率(瞬时功率可达...

只需四个阶段训练,就能打造通用视觉模型!

只需四个阶段训练,就能打造通用视觉模型!

家人们,你们有没有这种苦恼? 搬一次家就换一次家具,那些又贵又重的家具既不好搬运,又不好全部带走。 下一次又重新购置一遍家具,浪费钱不说,关...

以IoT引领低碳生活趋势,IFA 2023“Tuya Day”打造绿色未来加速度

以IoT引领低碳生活趋势,IFA 2023“Tuya Day”打造绿色未来加速度

全球化IoT开发者平台涂鸦智能(NYSE: TUYA,HKEX: 2391)以“Driving Low-carbon Living with...

今天才知道,铅酸、石墨烯、钠电池、锂电池区别多大,价格是多少

今天才知道,铅酸、石墨烯、钠电池、锂电池区别多大,价格是多少

我们常说电动车有三大件,分别是电机、控制器、电池,其中电机负责动力,控制器负责各种指令发出,而电池是储存电能的装置,也只有电动车具备电池,电...

腾讯李强:立足数字科技,助力全球贸易发展

腾讯李强:立足数字科技,助力全球贸易发展

“当前全球贸易复苏依旧面临众多的不确定性。不过,‘充分发挥数字科技力量’,是能够推动全球贸易发展的确定性路径之一。”5月8日,腾讯集团副总裁、...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。