视觉技术不止4小龙,腾讯优图手握700项专利,已形成技术输出链条

科学
视觉技术不止4小龙,腾讯优图手握700项专利,已形成技术输出链条
麻省理工科技评论 2019-09-04

2019-09-04

腾讯优图试图打造 AI 视觉技术落地产业的另一种范本。
技术 人工智能
腾讯优图试图打造 AI 视觉技术落地产业的另一种范本。

深度学习让计算机视觉技术在过去几年的发展势如破竹,从实验室创新突破走向各行各业,计算机视觉赛道更成为明星 AI 企业一大聚集地。业界公认的“AI四小龙”(商汤、旷视、依图、云从)是其中的重要代表,冲在计算机视觉技术落地产业的第一线。

但实际上,诸如腾讯优图这样的团队,也同样动作连连,试图打造 AI 视觉技术落地产业的另一种范本。

外界认为,随着 2018 年的腾讯“930”整体战略升级+组织架构调整、明确铺开“消费互联网、产业互联网”之后,腾讯几大 AI 团队才开始兼顾技术研究和产业落地,但事实并非如此。

“我们从一开始就非常强调产品落地。优图最大的特点就是我们能做落地的研究,研究和落地结合得非常紧密”,腾讯优图实验室总经理吴运声在接受包括 DeepTech 在内的媒体采访时表示。

图丨优图实验室总经理吴运声 (来源:2018中国计算机大会)

腾讯的视觉 AI 技术初期主要成长动力源于支撑腾讯的内部业务,也就是说,和一些AI创企不同的是,优图视觉 AI 技术的发展有比较明显的公司业务场景驱动的色彩。据了解,优图现已有超过 15 个行业解决方案,接入超过 90 项腾讯明星产品业务合作。

不过,尚不清楚优图研发的技术能给腾讯带来的业务上的具体经济效益,因为这些行业解方案往往是腾讯整体 AI 能力的打包,或涉及来自其他部门的支持。目前腾讯也并未给优图划定具体的营收指标,组织架构调整后,优图更多的是和腾讯云深度融合,打造各行各业的智能解决方案。

随着其技术持续在产业中验证,这支成立近 7 年的研发团队也有了细微的变化,例如所涉及的计算机视觉技术方向已经不再限于人脸识别,优图甚至还推出了一款针对各种场景的 AI 视觉模组 VisionSeed ,以期降低 AI 视觉产品的开发门槛。

图丨优图推出的VisionSeed AI视觉模组,集成了优图的视觉算法和英特尔的Movidius MyriadX (来源:腾讯)

整体解决方案仍是行业竞争重点

近日,优图在上海世界人工智能大会上宣布其在步态识别上的最新成果——提出“OGFN(Ordered Gait Fusion Network)算法”,可提升步态识别精度。

据吴运声介绍,对比已经被人们广泛知晓的人脸识别技术,步态识别通过捕捉人类行走模式进行身份识别,即使是在换装、换场景、面部遮挡等情境下,也可以准确识别,在刑侦安防、医疗康复等领域具备很强的应用性。具体到优图的最新步态识别进展上,该算法刷新了步态识别领域两大核心数据集 CASIA-B 数据集和 OU-ISIR MVLP 成绩,部分情景识别准确度提升 11.3%。

另一个新的变化在于,腾讯优图联合英特尔发布了基于 Movidius MyriadX 芯片的 AI 视觉模组 VisionSeed ,内置了优图人脸识别算法,接入即可实现人脸检测、属性分析、姿态估计、人脸识别等功能,让普通开发者也可以探索其功能, DIY 各种智能产品。通过不断开放软硬件技术能力,惠及更多的AI爱好者们。尽管 VisionSeed 这一 AI 视觉模组更多地定位在助力 AI 青年开发者上,但也反映出腾讯在输出 AI 视觉能力上正在做新的尝试。

对于在加速 AI 视觉技术落地产业上有何优势,吴运声分析,优图的优势更多在于结合腾讯云为客户打包完整的解决方案。

在介绍优图的优势时,他也点出目前 AI 落地产业的一大困境,即单独的算法突破很多时候对客户而言没有价值,客户需要的是能够帮助它解决具体问题的完整能力。“在算法层面上,大家都达到了比较高、也比较接近的水平”,他说。

因此,优图会与腾讯云、微信 AI 、腾讯 AI Lab (后两者为腾讯的另两大 AI 研发团队)协同,结合自然语言处理、语音识别等视觉以外的 AI 技术,形成完整的解决方案,包括帮助客户梳理业务流程、提供配套的大数据分析业务等。至于技术链条后端的集成工作,腾讯会根据具体的案例选择合作伙伴作为集成方或者自己做。

图丨腾讯的4大AI实验室(来源:DeepTech)

技术之外,新业务场景还需新逻辑

据介绍,优图搭建了产学研用相结合的人才矩阵,在计算机视觉领域级别最高的研究会议 CVPR 上,仅 2019 年就有 25 篇论文被收录;此外,优图已拥有超过 700 项专利技术,并形成了专利产出的完整链条。例如,优图自研的人脸识别技术支撑了腾讯在金融、安防、身份识别等领域的应用,如腾讯征信、微众银行和财付通、QQ、广点通等。

在工业领域的解决方案上,优图已经帮助国内面板大厂华星光电使用人工智能算法,对生产过程中器件图片进行智能缺陷分类与识别,并在面板智能质检上建立可复制型工业自动化排查系统;同时,在电网智能巡检场景中,协同无人机通过图像识别技术自动定位关键原件,对设备缺陷进行识别标注,比传统人工排查效率提升 3 倍。

整体来看,视觉 AI 落地规模化效应已经初步显现,预计今年中国市场规模将突破 328 亿元,无论是腾讯优图还是计算机视觉领域的其他玩家,市场空间仍然巨大,行业卡位战开始之前,更重要的是找到自身真正能够帮助实体经济发展的价值。

(来源:DeepTech)

以 AI 赋能制造业为例,今年,不少行业人士指出该方向将是一个明显的新的行业爆发点,不少 AI 公司也在进行相关的业务布局。

不过,吴运声认为,在工业场景运用计算机技术的商业逻辑和 C 端运用人脸识别技术有非常大的不同。

“人脸识别算法有一定的技术门槛,可基于 100 个人开发出来的人脸算法,之后可以用到每一个人脸上进行试错迭代。但是,以面板检测为例,一个面板就有数百道工序,每个工序都不一样。做完了这道工序的模型,并不能直接用到第二道工序,第二道工序还需要从 0 开始,其中的工作量会非常大。

一方面要做不同的模型去适配解决不同工序的问题。另一方面不能靠堆人去实现它。

所以,工业场景还需要抽象去看行业技术上的共同点,能把行业整体共通的部分做出来,可以实现第一套工序开发模型一个月,第二套工序的时间可以缩短到二十天。

我们未来想法是打造一个平台,直接让客户按照我们的规则,可能自己就能训练模型。我们要做的是把这个门槛降低,这和人脸识别其实是两种不同的路径”,吴运声说。


麻省理工科技评论

From Tech to Deeptech