阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活214
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

诺和诺德天津工厂部署5台MiR500自主移动机器人优化仓储物流效率!

诺和诺德天津工厂部署5台MiR500自主移动机器人优化仓储物流效率!

名傲移动机器人(以下简称为MiR)为诺和诺德天津工厂部署了5台MiR500自主移动机器人,提高其仓储物流效率。诺和诺德是一家丹麦生物制药公司...

上半年我国机器人产业总体保持稳定增长态势

上半年我国机器人产业总体保持稳定增长态势

工业和信息化部装备工业一司副司长汪宏日前在2023世界机器人大会新闻发布会上说,今年上半年,我国机器人产业总体保持稳定增长态势,工业机器人产...

科大讯飞AI学习机T20 Pro重磅发布,科学匹配三大学龄段

科大讯飞AI学习机T20 Pro重磅发布,科学匹配三大学龄段

2月6日,科大讯飞发布全面升级的学习机新品——科大讯飞AI学习机T20 Pro。为进一步满足不同学龄段不同孩子差异化学习需求,科大讯飞AI学...

腾讯文档推出业内首个双核编辑引擎,核心产品能力全面升级

腾讯文档推出业内首个双核编辑引擎,核心产品能力全面升级

9月7日,2023腾讯全球数字生态大会——腾讯文档2023年度新品发布会在线举办。会上,腾讯文档发布多款云智一体生态新品:独家自研双核编辑引擎...

腾讯云发布AIGC全栈解决方案,加速AI落地千行百业

腾讯云发布AIGC全栈解决方案,加速AI落地千行百业

9月8日,在2023腾讯全球数字生态大会互联网AIGC应用专场上,腾讯云正式发布AIGC全栈解决方案,为企业提供可信、可靠、可用的AIGC全链...

光启慧语发布光语医疗大模型,联合上海中山医院探索智慧医疗新模式

光启慧语发布光语医疗大模型,联合上海中山医院探索智慧医疗新模式

10月31日,在杭州云栖大会上,光启慧语正式发布了与复旦大学附属中山医院(以下简称“中山医院”)联合开发的多模态医疗大模型–“光语医疗大模型”...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。