陈启峰:人工智能生成图像技术,未来或能取代电影特效 | 35岁以下科技创新35人榜单人物专栏

科学
陈启峰:人工智能生成图像技术,未来或能取代电影特效 | 35岁以下科技创新35人榜单人物专栏
麻省理工科技评论 2019-03-12

2019-03-12

陈启峰在中学时期就接触到了编程,从此他对计算机科学的热爱便一发不可收拾。
35岁以下科技创新35人
陈启峰在中学时期就接触到了编程,从此他对计算机科学的热爱便一发不可收拾。

2019年1月21日,《麻省理工科技评论》公布了2018年“35岁以下创新35人”(Innovators Under 35 China)中国区榜单。从榜单中,我们看到更多中国创新科研力量的崛起,也看到跨学科、跨领域、并且对落地应用有更强烈企图心与使命感的科研创新,这其中涵盖人工智能研究与应用、NLP、脑科学、新材料、新能源、生命科学、生物科技、自动驾驶等多个不同领域。我们将陆续发出对35位获奖者的独家专访,介绍他们的科技创新成果与经验,以及他们对科技趋势的理解与判断。

关于Innovators Under 35 China榜单

自 1999 年起,《麻省理工科技评论》每年都会推出“35岁以下创新35人”(Innovators Under 35 China)榜单,旨在于全球范围内评选出被认为最有才华、最具创新精神,以及最有可能改变世界的 35 位年轻技术创新者或企业家,共分为发明家、创业家、远见者、人文关怀者及先锋者五类。2017年,该榜单正式推出中国区评选,遴选中国籍的青年科技创新者。

陈启峰:人工智能生成图像技术,未来或能取代电影特效 |榜单人物

陈启峰在中学时期就接触到了编程,从此他对计算机科学的热爱便一发不可收拾。

2008年,陈启峰拿到了香港科技大学提供的54万奖学金,开启了本科生涯。那时的他并未过多关注计算机视觉领域,直到两年后的密西根大学交换之旅,才让他发现了其中的美妙之处,并且将其锁定为未来的研究方向。

在回归香港科技大学后,陈启峰选择了多门计算机视觉课程,甚至包括一些研究生水平课程。最终他以22门计算机课程满分的傲人成绩毕业,获得了香港科技大学本科生科研冠军奖,还在2011年ACM-ICPC国际大学生编程总决赛中斩获金牌(全球第二名)。

“他是我在科大过去十七年所见过的最杰出的本科生,”香港科技大学教授Chi Keung Tang对陈启峰给予了高度评价。

事实上,陈启峰在2012年发表的“KNN Matting” CVPR论文已经获得了超过百次引用,是引用最多的自然图像抠图论文之一。这也是他科研初期的主要研究方向,其中讨论了将Alpha Matting推广至多图像层估算,并且不需要复杂的采样策略或限制性的典型颜色模型假设。他推导出了一种封闭形式的解决方案,使相关算法变得更加简单快速。

这也印证了陈启峰博士导师Vladlen Koltun的看法,“他是一位异常强大且富有洞察力的科研人员,总是能够切入问题的本质。”

在斯坦福大学攻读博士期间,陈启峰在图像合成与分解,三维重建,MRF优化和光流算法等方面取得了颠覆性成果,多篇论文被ICCV和CVPR连续多年收录并选为口头报告。他的很多研究成果甚至推翻了传统解决方案,在业界引发轰动。

回归问题本质,剥离所有复杂性并找出简单优雅的解决方案,是陈启峰最显著的研究特点。

其中一个例子是,陈启峰将MRF优化应用于三维表面的非刚性匹配问题(nonrigid registration)。这两个看似完全不同领域,却被他联系起来,通过重新思考一个被其他研究人员所忽视的经典公式算法,颠覆了非刚性图像匹配过去十年的研究成果——算法精确度提高了三倍,远超现有模型,业界后续的研究工作也因此转变。

近年来,陈启峰的研究转向了深度学习与图像处理,开始将神经网络应用于图像处理和合成。“我认为图像识别技术是很多计算机视觉应用的入口,只有图像清晰,才能获取更多的信息,”陈启峰在采访中表示。

以此为核心,他提出了多个创新性研究课题,研究如何利用深度学习革新图像处理算法,比如在极端黑暗的环境中生成高质量的图像,以及在给定某场景语义布局的情况下,计算机是否能够生成准确描绘此场景的图像?这些图像是否能够做到以假乱真的地步?更进一步讲,机器是否具备想象力?是否可以自动创建动画?

陈启峰对此十分自信,“我的研究显示,答案是肯定的。”他启发性地首创基于多个分辨率倍增模块的级联优化网络,能够以200万像素的分辨率合成高分辨率图像,相关论文被ICCV 2017和CVPR 2018收录并被选为口头报告。研究成果演示视频在网上广为流传,其表现有望开启视频和图像处理的新篇章。

他对未来技术的发展充满想象,“我更关注的一个应用方向是,希望可以做出一套基于计算机视觉的AI工具,提升电影特效的真实性,降低其整体制作成本。如果再进一步,人们只需要输入一些场景的文字描述或者剧本,比如主角的样貌,AI工具就可以自动合成电影中的部分场景。”

除了学术研究,陈启峰还以联合创始人和首席科学家的身份,创办了区块链直播平台Lino Network。他用顶尖的编程技术,帮忙搭建了去中心化直播平台的后端和服务器。目前该平台已经获得了超过2000万美元的融资,月活用户超过100万人,估值超过1.2亿美元。

陈启峰:人工智能生成图像技术,未来或能取代电影特效 |榜单人物

陈启峰认为,对于科学研究而言,最重要的是提出一些具有启发性的想法,而不是直接拿来别人的成果。因此在他看来,以助理教授的身份重返香港科技大学,能够帮助他继续在计算机视觉领域深入探索,是继续推动人工智能技术创新和前沿发展的好机会。

“希望借此机会能够贡献更多高质量的研究成果和产品,”陈启峰教授如是说。

麻省理工科技评论

From Tech to Deeptech