胡瀚是探究机视觉领域通用架构Swim Transformer的中枢作家之一ag百家乐真的假的。
作家丨高允毅
裁剪丨马晓宁
AI科技褒贬独家获悉,前微软亚洲商酌院视觉探究组首席商酌员胡瀚,不久前加入,接替已下野的前腾讯混元大模子时期厚爱东谈主之一的刘威,厚爱多模态大模子的研发使命。
胡瀚2008年得到清华大学本科学位,2014年得到清华大学博士学位 ,师从周杰证明。博士论文获2016年中国东谈主工智能学会优秀博士论文奖。2012年在宾夕法尼亚大学GRASP践诺室作念拜谒商酌,师从史建波证明。随后胡瀚加入深度学习商酌所 (IDL) ,该商酌院由余凯挂帅,成为国内最早开启深度学习商酌的时尚军之一,胡瀚凭借出色才智担任tech leader变装。2016年12月,胡瀚加入微软亚洲商酌院视觉探究组。
微软亚洲商酌院视觉探究组有探究机视觉界的“黄埔军校”之称,曾走出孙剑、何恺明、华刚、梅涛、王井东、代季峰、危夷晨、Steve Lin等所谓业界时期领军东谈主物。加入腾讯前,胡瀚在微软亚洲商酌院担任视觉探究组首席商酌员。
胡瀚是探究机视觉领域的紧迫商酌者,他曾以中枢作家身份参与论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的创作。Swin Transformer性能优于DeiT、ViT和EfficientNet等骨干集合,已经替代经典的CNN架构,成为了探究机视觉领域通用的backbone。该论文因切中了2021年业内争论要用transfomer如故用卷积的热门问题,仍是发表就已在多项视觉任务中霸榜,得到以前 ICCV 最好论文奖(马尔奖)。
这篇论文的四位共统一作永别是来自中国科学时期大学的刘泽、西安交通大学的林宇桐、以及MSRA的曹越和胡瀚。曹越是前光年以外皆集首创东谈主,当今创立AI视频公司Sand.AI。林宇桐此前是西安交通大学-微软亚洲商酌院皆集培养博士生,面前也在Sand.AI。
刘泽是中国科大与微软亚洲商酌院的皆集培养博士生,面前博士毕业,在微软亚洲商酌院连接商酌使命。
Swin Transformer的作家还有韦毅轩,清华大学-微软亚洲商酌院皆集培养博士生。张拯,现接事于微软亚洲商酌院视觉探究组,担任商酌员。郭百宁,ag百家乐真的假的现为微软亚洲商酌院副院长,主要从事集合图形学时期、基于集合利用的假造环境时期、几何模子、基于图像的模子和绘图、纹理合成、确切感图形图像时期等领域的商酌。Stephen Lin,是微软亚洲商酌院视觉探究组的商酌员。
2021年末,该团队又进一步提倡了 Swin Transformer v2.0 版块,新版块测验了其时限度最大的隆盛视觉模子,并在多个主流视觉任务上大大刷新了记载。
胡瀚这次加入腾讯,恰是接替刘威此前的使命。十一月下旬,各媒体爆出刘威已离开腾讯。
刘威,2012年得到哥伦比亚大学探究机科学与电子工程博士学位,在IBM沃森商酌中心担任商酌科学家。时期,刘威曾先后得到 2011 年底 Facebook 博士商酌生奖学金、2013 年度哥伦比亚大学优秀博士论文奖、2014 年CVPR后生商酌者奖、2016 年SIGIR最优论文荣誉奖。
刘威于2016年加入腾讯AI Lab,与AI Lab另外两位厚爱东谈目的潼、俞栋一齐,被业内称为“AI Lab三剑客”。在2018年,刘威入选IEEE智能系统10大AI后生科学家;2022年,因对大范畴机器学习和智能多媒体的孝敬,得到IEEE Fellow。在腾讯时期,刘威的使命东若是面向腾讯家具业务的CV基础大模子、多模态雄厚大模子、文生图、文生视频大模子等。
腾讯已经在多模态大模子的研发上取得新的说明,12月3日,腾讯布告,混元大模子上线并开源文生视频才智,参数目 130 亿,撑抓中英文双语输入。此前腾讯混元大模子已经络续推出了文生文、文生图、3D生成等才智。这次推出的视频生成才智,被觉得是混元系列大模子面前的临了一块紧迫拼图。
更多本色,点击下方护理:
未经「AI科技褒贬」授权,严禁以任何神色在网页、论坛、社区进行转载!
公众号转载请先在「AI科技褒贬」后台留言取得授权,转载时需标注起原并插入本公众号柬帖。