通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活86

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

小算力也可以“踏云”来到数字世界——东软睿驰与吉利汽车携手打造的“云空间”正式上线

小算力也可以“踏云”来到数字世界——东软睿驰与吉利汽车携手打造的“云空间”正式上线

东软睿驰携手吉利汽车打造的“云空间”正式上线,作为一款先进强大的车云交互一体化平台,通过算力上云为用户带来更智能、更便捷、更丰富的用车体验。...

福龙马助力第十二届全国少数民族传统体育运动会

福龙马助力第十二届全国少数民族传统体育运动会

 11月22日,第十二届全国少数民族传统体育运动会在海南三亚盛大开幕。作为此次活动的重要保障力量,来自福龙马的FLMSD15无人清扫机器人和FLMSD22智能扫路机负责龙舟和独竹...

2019年蔚来销量不降反升,新能源汽车正处于新的拐点!

2019年蔚来销量不降反升,新能源汽车正处于新的拐点!

“我个人认为,新能源轿车正在处于新的拐点。曩昔都是靠政策驱动,补助在销量里面起到很大的促进作用。但补助退坡之后会进入一个新时期,进入...

AI 究竟能否抓住推理的本质,对分布在元素之间的远距离关系实现认知?

AI 究竟能否抓住推理的本质,对分布在元素之间的远距离关系实现认知?

AI 终究能否捉住推理的实质,也便是,对散布在多个现实或回忆中的元素之间的远距离联系完结认知?  为此,Alphabet 子公司 De...

解锁Z世代潮流密码!Leader亮相广州设计周

解锁Z世代潮流密码!Leader亮相广州设计周

Z世代向往的生活是什么样?觉得客厅的墙有点冷清,那就拿起画笔涂个鸦吧;突然想叫朋友来喝上一杯,那就立刻在家攒个局吧……Z世代追求的潮流生活,就...

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

“我父母都是化学家,在学校教了一辈子书。父亲今年已经90岁了,照片上还挺健康的。这些年的研究,我从一个计算机科学老师,慢慢成了生物化学老师,终...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。