阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客2年前AI生活317
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

华为又被外国人盯上了,这次是海思芯片!

华为又被外国人盯上了,这次是海思芯片!

华为又被外国人盯上了,这次是海思芯片。 海思的 SoC 有后门? 2 月 5 日,俄罗斯安全研究员 Vladislav Yarm...

Pico 产品设计思维转变:以前是技术和硬件驱动,现在是体验和内容驱动!

Pico 产品设计思维转变:以前是技术和硬件驱动,现在是体验和内容驱动!

2019 年有一段时间其实是我们最迷茫的时候,当时的 Pico 有点迷失了方向。 谈及创办 Pico 五年来最艰难的时候,Pico 创始...

额温枪的缺货情况将会在3月中下旬得到缓解!

额温枪的缺货情况将会在3月中下旬得到缓解!

新冠肺炎的突然爆发,给全球数个产业链的增长都带来了负面影响。但疫情也让平时需求量稳定的防疫物资突然成了紧俏商品,比如口罩、酒精、消毒水。如今...

腾讯丁珂谈企业安全面临三大变量,要正视变化、掌握变化

腾讯丁珂谈企业安全面临三大变量,要正视变化、掌握变化

80年代个人电脑开始在全世界售卖时,除了军事、政府或科研用途的系统,没人觉得安全会是一个基本组件。然而,随着90年代早期互联网开始席卷世界,情...

ITU拟为元宇宙制定国际技术标准 邀请各方就元宇宙互操作性开展合作

ITU拟为元宇宙制定国际技术标准 邀请各方就元宇宙互操作性开展合作

日前,国际电信联盟(ITU)已成立一个专家焦点组,致力于为元宇宙制定国际技术标准。 该焦点组提供了针对相关技术标准着手奠定基础的平台,此类技...

Forrester发布中国企业区块链平台报告 蚂蚁链唯一入选领导者象限

Forrester发布中国企业区块链平台报告 蚂蚁链唯一入选领导者象限

近日,全球权威研究机构Forrester发布《中国企业区块链平台2022年Q3报告》(以下简称《报告》),华为云、腾讯云、趣链科技等6家厂商位...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。