ATEC“数星”计划发布,开源亿级工业数据集

访客2年前AI生活315

9月8日,ATEC前沿科技探索社区在外滩大会见解论坛现场正式宣布,启动ATEC“数星”计划。这是业内首个基于真实工业场景的大规模研究性数据集开放计划。该计划首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)。入口:www.atecup.cn/ods

9月8日,ATEC前沿科技探索社区在外滩大会见解论坛现场正式宣布,启动ATEC“数星”计划。这是业内首个基于真实工业场景的大规模研究性数据集开放计划。该计划首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)。

ATEC“数星”计划发布,开源亿级工业数据集

清华大学计算机系副系主任、ATEC前沿科技探索社区发起人徐恪教授

清华大学计算机系副系主任、ATEC前沿科技探索社区发起人徐恪教授指出, “数星”计划是ATEC社区在科技赛事、高校实训之后的又一项重要举措。数字技术的研究和发展离不开真实应用的数据土壤,亿级规模工业数据集,将成为人机智能等创新技术的关键燃料,推动机器智能等新一代数字技术的新范式发展。社区将在符合国家法律法规及个人隐私保护的前提下,积极推进数据集的开源工作,支持行业技术研究及教学。

ATEC“数星”计划发布,开源亿级工业数据集

数据集下载入口:https://www.atecup.cn/ods

亿级规模 填补行业空白

“数星”计划首批发布的两大数据集之一,“ATEC2022赛事数据集(农村金融风险预测)”包含了涉农经营者的信贷风险信息及用户的历史多源交互数据。

如何利用数字化技术识别农村经营者的经营状况和经营风险,是帮助农村经营者进行融资的基础能力之一。但由于农村地区数字化程度普遍偏低,其数据基础较薄,如何打通数字生态内多方的信息,破除数据孤岛的困境,成为支持金融科技发展、提升农村金融效率的关键命题。

该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。

ATEC“数星”计划发布,开源亿级工业数据集

 蚂蚁集团多场景多模态点击率预估数据集(AntM2C)是此次发布的另一个重要数据集。该数据集覆盖支付宝内多个业务场景,包含广告、营销、搜索和推荐真实场景中不同类型商品的CTR数据,整体数据规模达到10亿(第一阶段发布1700万规模的数据)。该数据集的发布填补了行业内,多场景多模态点击率预估问题的数据集空白。

ATEC“数星”计划发布,开源亿级工业数据集

愿聚星火 照亮研途

“数星”计划首批公开的两个脱敏的超大规模工业数据集均来自蚂蚁集团的真实业务场景。未来,“数星”计划也欢迎更多的企业、组织和个人投身数据集合规分享,共同促进技术研究的进步。

清华大学教授、计算机系副系主任、ATEC前沿科技探索社区发起人徐恪,清华大学网络科学与网络空间研究院副教授、ATEC2022评审委员会主席李琦,蚂蚁集团副总裁王志荣,蚂蚁集团商业营销技术部总监莫林剑,蚂蚁集团技术战略发展部技术运营部总监、ATEC前沿科技探索计划发起人宋宠,蚂蚁集团机器智能部技术总监、ATEC2022赛题组负责人张志强等嘉宾共同出席了“数星”计划发布仪式。

ATEC“数星”计划发布,开源亿级工业数据集

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

小马智行乘用车业务正式亮相,三大产品线均已量产交付

昔日阳春白雪的L4玩家已经面朝黄土,干起了L2+量产的活儿。这个趋势在2022年底-2023年初有了更实质性的典型案例: 1月11日,小马智...

上海地铁5G系统建设正式上马,探索5G创新应用!

上海地铁5G系统建设正式上马,探索5G创新应用!

5月18日,申通地铁集团与上海电信、上海移动、上海联通、上海铁塔签署战略合作框架协议,在上海地铁5G系统建设与融合应用方面展开合作,...

GAIR Live 预告| 小鹏汽车的智能驾驶之路

GAIR Live 预告| 小鹏汽车的智能驾驶之路

近年来,依靠高精地图的领航辅助驾驶功能(NOA)成为行业关注的热门话题。 为了能够深入了解NOA 市场的最新进展,小编新智驾频道策划了主题为...

把AI+科研普及到每个研究人员手边,需要什么条件?

把AI+科研普及到每个研究人员手边,需要什么条件?

导语: AI发展七十余年,每一技术性突破都将给人类未来开辟新一种可能性。而它与科学研究的深度融合,则会裂变出无数或无穷种可能性。 正文:...

“边缘安全+加速平台”,腾讯安全在出海市场中错位竞争

“边缘安全+加速平台”,腾讯安全在出海市场中错位竞争

当下,数字经济成为全球经济增长新引擎。国内竞争白热化、市场饱和的背景下,越来越多以互联网为阵地的工具、游戏、电商、内容社交走出去寻找新型的互联...

5年25万参赛者,2023阿里巴巴全球数学竞赛进入决赛时刻

一年一度的全球数学尖峰时刻即将到来。6月7日消息,2023阿里巴巴全球数学竞赛公布决赛名单,全球5万多报名者仅有685人入围决赛,占比1.3%...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。