腾讯“混元”AI大模型登顶CLUE总榜,彰显自然语言理解领域强大实力

访客1年前AI生活185

5月24日,腾讯“混元”AI大模型在CLUE(中文语言理解评测集合)总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶,一举打破三项纪录。

据了解,CLUE总榜由分类任务和阅读理解任务构成。腾讯“混元”AI大模型在一个月内先后实现分类任务、阅读理解双佳绩,最终以 84.730的成绩取得总榜第一。

腾讯“混元”AI大模型登顶CLUE总榜,彰显自然语言理解领域强大实力

作为中文最具权威的自然语言理解榜单之一,CLUE共开设了包含文本相似度、分类、上下文推理、阅读理解在内的9项子任务,旨在推动NLP(自然语言处理预)训练模型技术的不断进步和突破。

NLP(自然语言处理)技术是人工智能领域的一个核心研究方向,其目的是使得计算机具备人类的听、说、读、写等能力,并利用知识和常识进行推理和决策。目前,越来越多的科技企业和研发机构投入到该领域的研究当中,在CLUE等业界榜单的竞争也十分激烈。

在预训练阶段,除常规公开数据集之外,“混元”大模型还学习了商业领域特有的文本数据集。因此,相较于业界其他AI大模型,“混元”能够更好地理解各种长度文本信息,应对搜索、广告、新闻、问答等多样化的场景任务,在阅读理解、知识图谱相关的下游任务中也更加具有优势。

除性能提升之外,“混元”大模型通过借助数据及模型课程学习、多短句合并掩码、改进PowerSGD(优化通信算法)等方法,有效压缩低带宽环境下GPU节点训练的通信数据量和通信耗时,实现训练效率的大幅提升。

目前,腾讯“混元”AI大模型研发团队已经将改进的PowerSGD方法贡献给PyTorch开源社区,将在PyTorch下个版本中正式上线。

得益于“混元”AI大模型在自然语言理解、跨模态检索领域强大的技术能力,自今年4月以来,该模型已成功斩获MSR-VTT、MSVD、CLUE等各大权威AI榜单榜首,这意味着,腾讯在人工智能领域的技术研发已取得突破性进展。

目前,“混元“NLP大模型已经应用于腾讯内部多个业务,并在腾讯广告的数据挖掘任务中带来超过5%的指标提升,提升广告推荐的精准度,优化用户体验。未来,腾讯混元AI大模型研发团队将根据具体场景需求持续推进大模型的研究和优化,加速AI技术在各个产业的应用和落地。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

进博会展品密集入境参展 上海海关已完成146批次展品进境通关放行

进博会展品密集入境参展 上海海关已完成146批次展品进境通关放行

从上海海关获悉,自9月21日顺利验放第六届进博会首票进境展品以来,上海海关已完成146批次、759.8万美元展品进境通关放行。预计接下来的十...

移动生态再升级!联发科天玑AI先锋计划携手生态伙伴推动生成式AI发展

移动生态再升级!联发科天玑AI先锋计划携手生态伙伴推动生成式AI发展

在深圳隆重举行的联发科天玑开发者大会2024(MDDC),以“AI予万物”为主题,吸引了诸多移动生态领域领军企业和开发者共襄盛举。在本次盛会...

跨境电商步入“繁花期”:300+城市产业带联手SHEIN远征

跨境电商步入“繁花期”:300+城市产业带联手SHEIN远征

导语:部分工厂产线通过SHEIN精益化生产改造,原材料损耗降低25%。 与SHEIN远征,繁花盛开。 相关数据表明,十多年的发展,跨境独角兽...

智汇“京”开 锡创未来–京东科技2023年首期孵化沙龙系列活动圆满举行

智汇“京”开 锡创未来–京东科技2023年首期孵化沙龙系列活动圆满举行

6月13日下午,“智汇‘京’开,锡创未来–京东科技2023年首期孵化沙龙系列活动”在无锡经开雪浪小镇成功举办,本次活动由江苏无锡经济开发区管...

深圳联通深汕云数据中心再次入选国家绿色数据中心

深圳联通深汕云数据中心再次入选国家绿色数据中心

近日,工信部、国家发改委等六部门联合发布“2022年度国家绿色数据中心”名单,深圳联通深汕云数据中心(腾讯鹅埠数据中心2号楼)成功入选,是继...

游戏大神御用上分神装降临 腾讯ROG游戏手机6天玑系列天玑系列的五大“秘技”

游戏大神御用上分神装降临 腾讯ROG游戏手机6天玑系列天玑系列的五大“秘技”

 万千信仰玩家期待的ROG6天玑系列已和大家正式见面。作为ROG首款搭载联发科天玑处理器的机型,其在硬件配置及设计上有何亮点,实际使用时可实...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。