TensorFlow 等“开源陷阱",会掐住中国 AI 企业的命门吗?

互联网
TensorFlow 等“开源陷阱",会掐住中国 AI 企业的命门吗?
麻省理工科技评论 2019-06-10

2019-06-10

对于部分开源(Open source) 的资源,未来是不是也会受到美国出口管制条例的限制,这将是另一个值得关注的重点。
人工智能 互联网
对于部分开源(Open source) 的资源,未来是不是也会受到美国出口管制条例的限制,这将是另一个值得关注的重点。

近来美国基于出口管制条例(EAR)规范,要求多个不同领域的企业、组织不得与特定的中国企业往来,这其中除了已为外界所知的原料、芯片、零部件、软件以外,也包括不同形式的技术标准与产业联盟组织。这些企业或组织与中国企业之间的往来,多半还是基于封闭式条件环境下的往来关系,通过商业协议或是申请加入组织的条件。但相较于此,对于部分开源(Open source) 的资源,未来是不是也会受到美国出口管制条例的限制,这将是另一个值得关注的重点。

美国出口管制阴影笼罩,开源架构不等于自主可控

在所谓的开源资源中,以开源项目的主体来看,只要是注册在美国本土的开源基金会或开源项目提供者,就有可能受到美国法令的管制。以 Linux 基金会网站上的资料显示,其旗下的部分开发项目确实各自依其不同的规范提报申请出口审查、并取得许可。另外在 Apache 基金会的部分,则是原本就规范所有项目都必须遵守美国出口管制规定。

图丨 Linux 基金会网页上对于旗下开源项目受出口管制规定限制的申请状况(来源:Linux 基金会)

而除了开源基金会的项目外,在所谓的开源码托管平台上的项目,也同样会受到美国出口管制规定的限制,特别是由美国企业所拥有的平台,例如去年被微软收购的 GitHub。前不久,GitHub 就在其使用规范中调整凸显相关文字,强调 GitHub 上的使用与相关活动必须遵守美国出口管制规范。

另外,在其他的开源项目部分,也依循同样的思维模式,也就是若其所属主体,或者是拥有此一开源项目的企业受到美国出口管制的规范,则这些开源项目也同样受限,例如 Google 的 TensorFlow。

以此就延伸出一个问题,这些过去被认为是“开源”的技术资源,其最大的优势与特性,就在于开放架构,但在如今美国动用了极端手段的情况下,原本开源项目最大的特性——“开放”被戳破了,原本合理使用就不存在侵权问题的开发项目或产品技术,突然暴露在可能侵权的风险中。这牵涉到的一个问题就在于,原本是以所谓的“自主可控”为出发点、选择采用开源架构所开发的技术与产品,但到最后居然还是逃不过被掐住脖子的陷阱吗?

以现在的发展状况来看,虽然表面上只有华为受到影响,但长期来看,在未来中国企业发展自有核心能力技术产品解决方案的道路上,原本基于全球技术开发共生体系所运行的开源合作项目,也可能随时因为美国或其他国家的一纸禁令,就让部分企业开发的产品陷入开发源码技术升级断炊,甚至可能遭控不当使用的侵权风险。

曾经在百度、华为负责 AI 自有架构技术开发项目的第四范式创始人、CEO 戴文渊在接受 DeepTech 专访时就认为,国内企业在使用开源系统开发产品时,应该关注到开源系统的背后是什么?必须要理解的是,并不是开源就是“自主可控”。

事实上,在 2017 年 Facebook 修改其 React 开源框架协议,就曾经在国内互联网业界造成很大的震动,因为,国内有许多互联网公司的产品都是使用 React 框架进行开发。戴文渊表示,在开源系统背后,也要看到底是一个民主的社区,还是背后其实是存在一个巨头的操控,如果是由巨头企业操控的开源社区,包括像 GitHub 类似的事件就是如此,这也会触动更多人进而去思考“开源”与“自主可控”之间的关系。

大量使用开源的中国 AI 应用,会是下一个被卡住的吗?

过去几年中国 AI 的快速发展受到全球瞩目,从 2018 年开始,就持续有不同单位的研究统计报告指出,从论文数、论文引用数、甚至是 AI 技术专利申请数量来看,中国即将、甚至是已经超越美国。但即使如此,在近来的科技封锁禁令风波中,还是凸显了一个值得深究的问题:中国 AI 研究与应用科技的发展已经脱离了被“卡脖子”的阶段了吗?而若以当前开源项目也可能随时受到出口禁令影响的状况来看,下一个被波及的会是中国的 AI 企业吗?

图丨第四范式创始人、CEO 戴文渊:2017 年《麻省理工科技评论》“35 岁以下创新 35 人”(Innovators Under 35 China)中国区榜单获奖者

戴文渊在专访中特别提到:“中国在过去的十年时间里,在 AI 领域建立了一个领先优势,但最近我发现有一定的问题,这个问题来自于什么?其实是我们可能更偏实用主义一些,10 年前我们为了去做一个应用,因为那时候没有任何的基础设施,没有 TensorFlow、甚至连 Spark 都没有,而那时我们在百度,为了把百度的凤巢系统做出来,需要从底层一行一行地写代码,最后才把一个应用做出来。从这一点来看,其实中国的开发者是有能力从底层一层层往上写的。但是当我们有现成的东西可以直接拿来用的时候,比如 TensorFlow,出于实用主义大家可能就不太愿意去关注底层了,就直接拿过来,把应用做出来。”

但相较于当年,近几年有越来越多的开源工具可以快速导入开发应用,许多开发者很自然地会选择开源工具,加快应用开发的速度,这原本应该是科技发展进步的推动力,只是走到现在这个时点上,强调快速导入开发的“实用主义”似乎反而让中国开发者、甚至是中国的科技企业落入了另一个失去自主可控权的难题中。

对此,过去曾经参与过百度、华为重要自有底层技术项目开发的戴文渊表示担忧:“我看到最近这几年的趋势,当 TensorFlow 出来了以后,越来越少的企业去从底层开始考虑,越来越少的企业对自己的技术是自主可控的,这其实有很大的风险。”

事实上,近年中国企业有许多的应用是建构在美国大型企业所掌控的开源架构上,例如像是 TensorFlow、Caffe 等等,这些看似开放的开源架构,但在实际运作上却还是有许多规则的限制。戴文渊以他的实际经验提到:“比方说我们想去提交代码,虽然说它是一个社区,但是这个社区是有一个巨头所掌控,其他的人可以在这个社区里活动,但你想去改 TensorFlow 的核心代码,巨头一定是不会同意的。并且他想封锁,完全取决于他自己的策略。”

以目前国内 AI 企业的动作来看,不论是第四范式或者是商汤等其他企业,都曾对自有架构提出过明确的主张与想法,这些企业的最主要概念都在于,要提供一个不受外在变数影响、能够稳定提供应用服务的产品,而要做到这一点,就不只是单纯地求快、求方便,而是基于更长期的发展需求。

戴文渊回顾过去第四范式选择从底层自己一路开发的作法,他认为关键在于希望能够保持算法的灵活度,特别是有些算法如果要在 TensorFlow 上实现,是需要去改 TensorFlow 的底层,但这其实是不被容许的,但如果是自有的底层框架,自然是想改就能改。

除了灵活度外,还有另一个值得注意的关键在于对客户负责,特别是要对客户运营的安全性负责。戴文渊表示,第四范式的客户很多都是国计民生行业的头部企业,如金融、能源等,源代码如果暴露在外面,黑客就有机会针对一个防伪冒的系统,根据其获得的数据以及代码的计算逻辑,去探测出模型可能长什么样,然后进行攻击。基于对客户负责的角度来看,提供从底层开始自主可控的服务是经过多方面考虑的结果。

根据业界一个非正式的统计数字,在现有的中国开发者群体中使用 TensorFlow 的占比大概超过 70%,但戴文渊认为,实际上会受影响的应用产品比例可能低于这个数字,因为有些大型企业所提供的应用服务,其实都是更早之前就已经搭建完成的,特别是一些目前在市场上应用较为广泛、市场份额较大的应用,多半都不是使用 TensorFlow 之类的开源框架,因为这些应用开发的时间远早于这些开源项目推出的时间,但不可否认,有些应用在后来可能会开始用一些 TensorFlow 进行开发。

不可否认的是,TensorFlow 或其他开源框架的使用其实已经相当普遍,面对应用产品可能出现的问题,其实也已经有企业开始思考如何补漏,以第四范式为例,就已开始研究能让 TensorFlow 代码在第四范式自主开发的“先知平台”引擎上运行,但上层看起来仍然是 TensorFlow 的 Script。

对于很多 AI 解决方案供应商而言,目前已经导入企业客户运行的应用产品不能就此中断或完全替换,因此必须要能够提供另一条路径,未来若真出现被封锁的状况,还能够让客户把所有代码迁移到自主开发的系统里,但不可否认的是,这将会有非常大的工作量。

中国 AI 软件领先优势,将撬动中国 AI ASIC、服务器硬件全新机遇

对比中国与美国的 AI 框架的先进程度,戴文渊认为,中国国产框架技术和美国比是没有任何劣势的,即使是和 TensorFlow 比,主要的差别还是在于使用人数的多寡,TensorFlow 的使用者数量确实是比较大。

但相较于对中国国产 AI 框架技术能力抱持乐观看法,戴文渊认为影响中国 AI 或者是整体科技发展最大的风险还是在硬件上,因为中国与美国之间的差距确实比较明显,但这不代表中国就没有机会了,反而是在 AI 科技应用发展上,因为中国的 AI 框架软件技术等等都有一定的竞争力,所以,如果能够与硬件有更好的整合,特别是在像是 AI 服务器的发展上。

戴文渊认为:“中国要能够赶上美国,要做出像英特尔(Intel)这样水平的 CPU,恐怕还是有一定难度的。虽说现在也有国产 CPU,但还是有一定的差距,甚至这个差距可能并不是一年两年能追得上的,但如果就 AI 计算来看,我们发现对 CPU 的依赖其实会越来越少,CPU 原来是一个通用的计算单元和一个中央处理器,中央处理器的价值依然还在,但通用计算单元的价值则变得越来越低,因为越来越多的计算可以放到 ASIC 上去算。”

观察国内 AI 企业在过去 1 年多来的发展路径,可以发现 AI 算法应用与硬件的融合是非常明显的方向,不论是通过开发自有 ASIC,或者是开发自有的加速卡、服务器等等,都是许多 AI 企业看准的趋势。外界或许会将此解读为更容易商业化落地实现收入的作法,但就技术发展的层次来看,AI 的软硬整合确实有其既有技术发展的逻辑。

戴文渊就以第四范式自身的例子说明这个逻辑:“为什么我们能做加速卡,原因是我们能做软件,我们了解软件,所以可以把它硬件化,而且这是个未来趋势。因为 AI 系统是非常有套路的,不像编程语言,可以任意地去写,AI 是按照步骤的,有非常固定的计算模式。如果说今天让我们去真的做一个通用服务器,短期内仍有很大的差距,但这是我看到这个 AI 时代最大的机会,也是中国有可能赶上的最大机会,因为这样的 AI 服务器来自一个软件驱动的硬件设计,不是硬件系统的硬件设计,而中国在软件部分现在是领先的,所以在做软件驱动的硬件设计时,能够获得一定的领先优势。目前第四范式的软件与国内硬件厂商合作所取得的性能效果,并不亚于 TensorFlow+美国硬件,硬件的差距在靠软件和加速芯片追回。”

戴文渊就说:“到今天,我们走的这条路也是必经之路。因为,当我们开始去改造一些企业场景时,一旦牵涉到大量的场景被改造,马上就意味着算力不够用了,算力不够用,也意味着必须要去优化硬件,但这不是说去买一个更好的 CPU、GPU 就可以的,因为 CPU 和 GPU 并不知道你的软件长成什么样,我们见过的很多 GPU 服务器跑 AI 应用是没有性能提升的。因为,很多时候瓶颈并不在 GPU 算力的问题上,它可能在网络上、也可能在读写上,因此必须要有一个软硬件联合的优化,才能充分地将性能发挥出来,所以这条路是必须要走的。”

当我们站在当前的转折点上,面对技术开发道路的抉择,“自主可控”不是清谈议论的理想,而将是影响技术产品开发成功与否的长期关键因素。这一波美国出口管制禁令掀翻的滔天巨浪,不只冲刷出长期存在、只是隐而未现的缺口,从另一个角度来看,这也可能为中国科技产业的发展冲出一个新的机会,身处其中,中国 AI 企业将有机会迎来一波新的升级蜕变。

麻省理工科技评论

From Tech to Deeptech