通义千问开源320亿参数模型，已实现7款大语言模型全开源

访客2年前 (2024-04-18)AI生活155

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡，例如，相比14B模型，32B在智能体场景下能力更强；相比72B，32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异，性能接近通义千问720亿参数模型，远超其他300亿级参数模型。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言，在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

本站部分文章来自互联网，文章版权归原作者所有。如有疑问请联系QQ：362580117！

返回列表

上一篇：波士顿动力公司开发的 Spot 机器人成功“入职”石油公司 AkerBP！

下一篇：疫情当前，设立临床诊断意见是非常必要的！

相关文章

2024 全球开发者先锋大会即将强势开启，科技狂欢盛典再燃上海

2024 全球开发者先锋大会即将强势开启，科技狂欢盛典再燃上海

备受瞩目的2024全球开发者先锋大会（2024 GDC）将于2024年3月23日至24日在上海徐汇滨江隆重举行。全球开发者先锋大会（GDC...

金山办公「规模之道」：超1500亿个文档上云，办公软件迈入云原生时代

金山办公「规模之道」：超1500亿个文档上云，办公软件迈入云原生时代

8月26日，金山办公在珠海举办以「规模之道」为主题的 2022 年技术开放日活动。活动一开始，金山办公首先介绍三个重要的数字：第一个数字...

腾讯业内首发数字孪生云，四大核心技术加速万物孪生

腾讯业内首发数字孪生云，四大核心技术加速万物孪生

数字技术和实体产业融合演进，跨时空连接带来了数实融合全新体验，数字孪生正日益在产业转型深化阶段发挥重要作用。 2022年12月1日，腾讯在数字...

三翼鸟落地再提速！2023年建成3300+智慧生活体验馆

三翼鸟落地再提速！2023年建成3300+智慧生活体验馆

2020年9月的北京，海尔智家发布了全球首个场景品牌三翼鸟，将智能家居带入一站式智慧定制时代。 2年后，这个新物种有何成长，未来又将飞向何处？...

烟火气回归，旅游、零售、餐饮等行业率先吹响经济复苏号角

正月初八，开工大吉。兔年春节，整个中国的烟火气回来了。节日期间，商户交易活跃、线上咨询与成交激增、旅游景点人气爆棚、院线持续升温，行业经济复苏...

打造中国版 ChatGPT，国内有哪些学术力量能抢滩？

打造中国版 ChatGPT，国内有哪些学术力量能抢滩？

OpenAI 现已经成为全球人工智能领域的追击目标。继谷歌献上「Bard」后，中国科技圈也开始沸腾，原本苦哈哈的自然语言处理科研团队，如今...

发表评论