何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

访客2年前AI生活127

又一名 AI 大神有了新动向!

当地时间3月13日下午3点,何恺明在MIT做学术演讲。据现场网友所述,即便自己提前半小时去到现场,但仍挤不进会场,仅排队就拐了几个弯,MIT CSAIL 还临时开了隔壁会议室投屏,许多人是挤在小角落里听完全程的。

据 MIT CSAIL 实验室此前发布公告显示,本次何恺明的演讲主题是 “In Pursuit of Visual Intelligence”(追求视觉智能)。
 
在现场演讲中,何恺明按时间线顺序回顾其之前的几篇工作,主要包括了 ResNet、Faster R-CNN、Mask R-CNN、MoCo 和 MAE。据何恺明所言,“在 ResNet 出现以前,Deep learning 的大厦上空漂浮着一朵乌云,而 ResNet 去掉了这朵乌云。
此外,何恺明也在现场透露了接下来的研究方向会是 AI for science,将聚焦视觉和 NLP 大一统做 self-supervised X+AI。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

会议室爆满(图源:知乎)

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

MIT CSAIL 隔壁会议室满座图源知乎@睡不醒的芋泥

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science图源知乎@睡不醒的芋泥
1

何恺明将回归学术界?

何恺明是 CV 领域的翘楚,其谷歌学术被引用次数已经突破40万次,在2022年人工智能全球最具影响力学者榜单中,何恺明获得第一名。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

自3月9日何恺明将在 MIT 进行 Job talks(求职演讲)的消息传出后,很快引起 AI 圈的关注。Job talks 是学术界的一个传统,多集中在每年的三四月份进行,申请博士或教职的学者会到高校内做学术报告,演讲内容多为自己的研究成果。

随后杜克大学教授陈怡然也在微博上发声,表示“一直听说何恺明在Market上,靴子终于落了地。”

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

值得一提的是,如果何恺明确认加入 MIT,那他将会成为全校被引用次数最高的学者。目前 MIT 全校被引用量最高的是化学与生物医学工程系的 Robert Langer,总引用量超过38万次。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

有网友表示,何恺明能够进入到 MIT 的 Job talks 阶段,说明他已通过简历筛选,其研究成果和能力上得到 MIT 的认可,但这并不意味着何恺明最终会选择加入 MIT。
 
2

从高考状元到 CV 大神

何恺明是广东人,从小在广州长大,在广州执信中学读书时曾获得全国物理竞赛和省化学竞赛的一等奖。2003年5月,何恺明获得保送清华的资格,同年他以满分900分的成绩,成为当年广东省9位满分状元之一。进入清华大学以后,何恺明放弃保送的机械工程及其自动化专业转向基础科学班。

2007年,还未毕业的何恺明进入微软亚洲研究院实习,出于对计算机图形图像课程的兴趣,他选择加入了视觉计算组。头两年里,何恺明尝试做过不少各种各样的课题,但一直发不了论文,这对此前头顶着高考满分状元光环的他来说,无疑是个不小的打击。

何恺明花了更多时间在问题研究上,甚至在电脑游戏里找灵感。不鸣则已,一鸣惊人。2009 年,汤晓鸥、何恺明以及孙剑凭借论文“Single Image Haze Removal Using Dark Channel Prior ”,获得该年度 CVPR 的最佳论文奖,这也是该会议 30 年以来第一次(也是唯一一次)颁发给亚洲研究学者。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science汤晓鸥(左)和何恺明(右)

2011年,何恺明从香港中文大学多媒体实验室(MMLab)博士毕业,后加入微软亚洲研究院工作;2016年8月,他离开微软亚洲研究院,转而加入 Facebook AI 研究院(FAIR)。

2015年,由何恺明提出的深度残差网络 ResNet ,在 ILSVRC 2015 分类任务竞赛中,首次超越人类水平,斩获竞赛第一名,该工作还拿到了 2016 年 CVPR 最佳论文。

ResNets 也成为计算机视觉领域的流行架构,并被用于机器翻译、语音合成、语音识别和 AlphaGo 的研发上。目前,何恺明谷歌学术被引用量已经超过40万次,其中引用量最高的,也是这篇工作,单篇引用量在2021年底突破10万次,目前已涨至15万次。

在 FAIR 期间,何恺明和团队在计算机视觉领域取得了不少亮眼的成绩,包括 Faster R-CNN、Mask R-CNN 等系列研究。其中,Mask R-CNN 解决了图片中的实例级对象分割问题,不仅能将照片中的人、动物等对象单一检测,还可为其每个对象实例生成一个高质量分隔遮罩,该工作获得了 ICCV 2017 的最佳论文奖。

而在去年火热的 AIGC 领域,何恺明团队在原有的 CLIP 架构基础上,使用掩码方法,不仅实现新模型速度3.7倍的提升,模型性能也得到了一定程度的优化。

3
离开大厂的 AI 大牛再添一员

事实上,早在去年 Meta 第一波裁员时,就有消息传出何恺明也在被裁名单中,但彼时阿里巴巴副总裁贾扬清在相关知乎问题下对这一消息进行了否认。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

何恺明所在的 Facebook AI Research 自去年以来,已经发生过几次重大调整。

其中,图灵奖得主杨立昆(Yann LeCun)负责基础研究,Jerome Pesenti 负责管理整理 AI 部门的技术、产品赋能、运营等工作。但自2022年6月开始,FAIR 被并入至元宇宙部门Reality Labs,杨立昆转向该部门的首席科学家 Andrew Bosworth 汇报。

后续的调整也是围绕“去中心化组织结构”进行,重点在削减对基础研究的投入。

可以看到,即便如 Facebook 这样的巨头在整体预算整体收缩之际,AI 研究院率先面临了被边缘化的困局。

预算缩减、人心涣散,直接导致了优秀人才的离职频发。这些离开的 AI 大牛有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。

就在半月前,亚马逊机器学习部门原杰出科学家/VP Alex Smola 与首席科学家李沐师徒二人离职,进军大模型方向创业,此次何恺明前往 MIT 面试教职的消息,也再次引发外界对大厂 AI 实验室和 AI 人员的讨论和思考。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

想当「话事人」的魏牌高山,能否定义MPV?

想当「话事人」的魏牌高山,能否定义MPV?

纵观长城汽车的发展史,当好某个汽车品类的“话事人”,或者品类的定义者,是其一直以来的“制胜关键”:在大家对于SUV还没有确切认知的时候,长城用...

给手术配上GPS   北京协和医院与腾讯联合发布国产手术导航系统

给手术配上GPS 北京协和医院与腾讯联合发布国产手术导航系统

7月5日,北京协和医院联合腾讯AI Lab,共同发布了具有完全自主知识产权的便携式、智能化手术导航系统,临床初步应用取得成功。 该系统由导航平...

“360智脑”再答“GPT测评黄冈卷”,场景和用户训练优势显著

“360智脑”再答“GPT测评黄冈卷”,场景和用户训练优势显著

4月26日,民生证券人工智能高峰论坛上,三六零(601360.SH,下称“360”)集团创始人周鸿祎参会,时隔一个月再度公开演示“360智脑“...

进击的“端到端”,与迎头赶上的中国企业

进击的“端到端”,与迎头赶上的中国企业

2024年伊始,特斯拉FSD V12正式开始推送。对于广大国内智驾企业来说,这或许意味着一次“暴击”。 自特斯拉的FSD V12问世以来,有许...

超半数导航已由北斗主导,高德正式推出北斗卫星定位查询系统

超半数导航已由北斗主导,高德正式推出北斗卫星定位查询系统

近日,高德地图上线了北斗卫星定位查询系统,用户在定位导航时可查看当前所调用的北斗卫星数量,以及具体编号、方位角、高度角、频点、信号强度相关详细...

2020年中国智慧医疗行业发展现状分析,未来发展空间可观!

2020年中国智慧医疗行业发展现状分析,未来发展空间可观!

一、智慧医疗行业概况 智慧医疗是指在诊断、治疗、康复、支付、卫生管理等各环节,基于物联网、云计算等高科技技术,建设医疗信息完整...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。