通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活95

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

全面自主可控!首个全链路国产化操作系统OpenCloudOS发布源社区项目

全面自主可控!首个全链路国产化操作系统OpenCloudOS发布源社区项目

中国的操作系统企业正从开源的使用者向贡献者,甚至是技术的引领者转变。 6月22日,在2022 OpenCloudOS 社区开放日上,国产开源操...

业内专家论述:机器人与人工智能的关系!

业内专家论述:机器人与人工智能的关系!

01 机器人的人工智能 机器人是由什么组成的,它与机器又有什么不同呢?这个问题的答案在过去80年间已经发生了变化。类人自动机,...

网信办等三部门确认目标:2024年末IPv6活跃用户数达到8亿

网信办等三部门确认目标:2024年末IPv6活跃用户数达到8亿

4月20日消息,中央网信办、国家发展改革委、工业和信息化部近日联合印发《深入推进IPv6规模部署和应用2024年工作安排》。 明确以下工...

库克表示:AR影响苹果未来的发展!

库克表示:AR影响苹果未来的发展!

苹果 CEO 蒂姆 · 库克今天接受了记者 Kara Swisher 的 Sway 播客采访。苹果 CEO 谈到了他对特斯拉及其在电动汽车领...

海康“科学防疫情”这场应该仗怎么打?

海康“科学防疫情”这场应该仗怎么打?

人工智能、大数据在这次疫情防控中提供了强大的技术支撑。在当前一手抓生产、一手抓防疫的过程中,科技手段仍是我们打赢这场防控“持久战”的好帮手。...

元宇宙加快落实步伐,相关岗位已成脉友热门选择

元宇宙加快落实步伐,相关岗位已成脉友热门选择

  随着AR、5G等技术的发展,元宇宙已经不再停留在概念阶段,而是加快了落地脚步。其实元宇宙作为真实和虚拟世界连接的载体,应用范围还是非常广...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。