通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活106

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

Temu「诺曼底登陆」:亮相超级碗始末

Temu「诺曼底登陆」:亮相超级碗始末

“要不咱们公司也亮相超级碗?今年蕾哈娜复出!” 2023年1月的一个寒冷冬日,Temu的美国办公室里,一群人正在热火朝天地讨论产品。 这句分...

Unitree B1正式发售!持续引领行业四足机器人的实践与探索

Unitree B1正式发售!持续引领行业四足机器人的实践与探索

人们真实的生活中,经常会遇到一些特殊的、复杂的活动和场景,如救援、勘测、排爆等,严重威胁参与人员的生命和健康;另一方面,作业效率和任务完成度非常低。时代和行业急需能够代替人工操作的...

金融壹账通发布2019年第四季度及全年财报!

金融壹账通发布2019年第四季度及全年财报!

2020年2月19日早上9点,金融壹账通在其官网上发布了2019年第四季度及全年财报。 据悉,金融壹账通于2019年12月13日在美国...

平安银行App 6.0上线:“简单”背后的科技看点

平安银行App 6.0上线:“简单”背后的科技看点

想看一家银行的科技成色到底几何,没有比App更直观、也更深刻的窗口了。在数字化时代,App是银行触达用户的“排头兵”,也是零售业务乃至全行业...

人工智能产业的长足发展呈现出三大新趋势!

近年来,以互联网、信息化为代表的浅层次、低层次的数字化,正在逐渐加快转型到以人工智能、智能化为代表的深层次、高层次的数字化。在这一背景下,如...

蚂蚁SOFAStack、mPaaS入选金融信创优秀解决方案

蚂蚁SOFAStack、mPaaS入选金融信创优秀解决方案

近日,金融信创生态实验室公布了第二期金融信创优秀解决方案,蚂蚁集团旗下金融级分布式架构解决方案SOFAStack和移动开发平台mPaaS成功入...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。