阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客2年前AI生活348
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

正齐半导体年产6万颗高阶功率模块研发生产项目落地萧山经济技术开发区

正齐半导体年产6万颗高阶功率模块研发生产项目落地萧山经济技术开发区

距离投资百亿元的合盛新能源材料和器件模组制造项目开工仅3个多月,近日,又一重量级半导体项目——正齐半导体年产6万颗高阶功率模块研发生产项目落...

AI 大牛 Michael Jordan 获 2022 年顶科协“智能科学或数学奖”

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!...

宇宙猜想AR地球仪,让我们与世界零距离

宇宙猜想AR地球仪,让我们与世界零距离

是否幻想过有一天足不出户就可以看尽这世间的繁华?是否幻想过有一天只要指尖轻轻的跃动就可以领略世间山川的雄伟?在过去这是不敢想象的。然而如今A...

陶圣加入库萨科技担任CTO,进军无人环卫行业

陶圣加入库萨科技担任CTO,进军无人环卫行业

小编获悉,前芯驰科技AI算法业务负责人陶圣正式加盟无人环卫公司“库萨科技”,成为联合创始人,并任CTO。 陶圣在2007年博士毕业于清华大学,...

国行iPhone14存在重大设计缺陷,苹果放弃600万增产计划;罗永浩卸任锤子科技法人

国行iPhone14曝存在重大设计缺陷,苹果放弃600万增产计划 近日,有消息称,苹果官网已推迟发货部分iPhone 14 Pro系列,因为大...

高通携手生态伙伴推动5G+AI创新,助力各行各业数字化转型

高通携手生态伙伴推动5G+AI创新,助力各行各业数字化转型

在5G、AI、物联网等基础技术的协同发展下,数字经济正向更深层次、更广领域探索,并与实体经济加速融合,成为推动产业数字化升级、助力经济高质量发...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。