华为麒麟980手机芯片细节提前曝光?一文谈尽全球手机AI方案战局

移动
华为麒麟980手机芯片细节提前曝光?一文谈尽全球手机AI方案战局
麻省理工科技评论 2018年8月16日

2018年8月16日

华为即将在 8 月底 IFA 大会上发布新一代麒麟 980,其相关参数已经有部分泄漏至网络媒体上,虽然还有些问题,但据传已经相当接近最终规格。
手机 华为 手机芯片
华为即将在 8 月底 IFA 大会上发布新一代麒麟 980,其相关参数已经有部分泄漏至网络媒体上,虽然还有些问题,但据传已经相当接近最终规格。

华为即将在 8 月底 IFA 大会上发布新一代麒麟 980,其相关参数已经有部分泄漏至网络媒体上,虽然还有些问题,但据传已经相当接近最终规格。

当然,作为旗舰方案,如麒麟 980 在 8 月底抢先业界竞争者发布,有其指标性意义,去年麒麟 970 依靠领先全球发布的 AI 硬件功能,抢走了不少消费者的眼光。不过在经过这一年智能手机对人工智能定义与硬件功能的演化,麒麟 980 面临的竞争也明显增加,无法像其前辈麒麟 970 般如入无人之境,毕竟竞争者也将站上同一起跑点,在 7nm 工艺,以及整合 AI 功能等一致诉求下,以各自的技术优势同台竞技。



AI 方案各家着眼点不同,中低端的布局也同样重要


手机上的终端 AI 应用于 2017 年由苹果及华为带起一波浪潮,二者几乎同时在其主打方案,也就是 A11 Bionic 与麒麟 970 中引入了 NPU 硬件神经计算网路单元,大幅加速终端与边缘 AI 计算落地时程。

同时期的其他方案供应商,多半只能通过软件来模拟 AI 功能,这导致一来计算性能不足,使得 AI 场景在应用时明显会感觉到迟滞,无法随心所欲;二来,AI 计算包含了复杂的数学与逻辑计算,需要处理大量的数据,因此缺乏硬件设计的方案在功耗及发热等层面的表现亦更为疲弱;最后,如果是以丢回云端处理再回传结果的作法,除了延迟问题,云端存储个人的学习模型,又有隐私泄漏疑虑,也因此,像苹果或华为之类的本地端 AI 方案也就成为手机 AI 发展主流。

以硬件 NPU 而言,A11 Bionic 的神经网络专用加速模块比较特殊,目前只用在了 Face ID 人脸解锁上,没有开放给第三方。而华为基于寒武纪的 NPU 则是支持了标准 AI 框架,并且对第三方开发者开放,这也可以看出华为极力打造自有 AI 生态的野心。

即将在 2018 下半年推出的新款手机方案中,硬件 AI 计算单元基本上已经是必备要件,苹果和华为可以说引领手机 AI 潮流,也必定会在此处持续加强,但联发科等追随者也不甘示弱,AI 计算单元成为其主流芯片方案中的标配功能,但联发科将采用与高通同样走 GPU 与 DSP 混合计算,这种设计虽然弹性高,但能耗表现并不漂亮,而高通则传言未来将全面走向硬件 AI 计算设计,因此,联发科在手机 AI 市场能否打出漂亮成绩,亦或可能出师不利,仍值得观察。

虽然我们习惯把眼光重点摆在最新最强大的架构上,也就是即将面世的 7nm 手机方案,但对整体移动产业而言,真正的重头戏应该是在 10nm、12nm 甚至 16/14nm 等成熟工艺推动的中低端手机 AI 方案,这些方案的推出,代表手机 AI 生态即将全民化,往后不具备 AI 功能的手机就如过去的功能机一般,将会被主流市场淘汰。



他傻瓜你聪明的背后隐藏商机


为什么要重视 AI 在手机上的发展?各家厂商或方案公司之所以争先恐后要推出相关产品,主要就是因为手机是作为日常陪伴用户时间最长的消费类电子产品,其上捆绑的应用已经成为用户黏著性最高的商业接口,不论是游戏,或者是智能语音服务,其对接的是庞大无比的商机,任何对此趋势有基本认知的厂商都不会轻易放过这块市场大饼。

也因此,如何让消费者更自然而然的接触、并依赖相关接口,就是这些手机厂商努力的方向,而 AI 就成为让这些构想成真的启动装置。

这些所谓的 AI 功能,其目的之一就是为了带给消费者更便利的日常生活,尽量用最少的程序就可以完成最大多数的工作步骤,很多关键问题的判断就是交由 AI 来处理。换言之,通过 AI 辅助,麻烦琐碎的工作都交由手机来代劳,使用者只要动动手,甚至连动手都不用,动口就好。

然而 AI 并不是先天就什么都懂,它必须通过训练才能获得处理这些工作流程的“知识”,在主流的 AI 神经网络框架中,我们可以通过对庞大样本的观察与学习,训练出可解决特定应用问题的模型。

而以下就是两大类主要的 AI 应用。

数字自我的验证与延伸:

系统(这边的情境主要是具备 AI 功能的手机)可以通过学习,来判断使用者的身份,包括脸部识别、虹膜识别或指纹识别等,通过这些手段,系统确认使用者的身份后,就可以接入背后的庞大系统。

比如说手机可以记录你全天的生活,并且分析出使用者所处的场景,通过各类传感器的定位与互动,以及与 IoT 网络的结合,能在正确的时间点和正确的设备进行互动,让使用者的心思可以全部放在工作或学习中,不需分心处理其他任务。

而整个系统生态的布建,包含软件与硬件设备和相关资源的推动,就成为隐含庞大利益的商机。

情绪、语言与视觉理解能力:

配备了 AI 能力的手机,可以依照使用者的日常说话语调或用词,判断出使用者的正确意图,而语音助手的引入,让用户不必手动输入,仅通过简单的语音指令就能实现手机唤醒、调动应用程序或进行信息查询等多种操作。而语音助手也能视为另一种门户,可以将用户引导至各种商业服务接口,实现更智能的商业服务工作。

在主流语音助手方面,如苹果的语音助手 Siri,三星的语音助手 Bixby,华为的语音助手小 E,熄屏唤醒、自定义唤醒词、翻译,设闹钟、刷微博、导航打车购物等多项任务,小米方面也刚将小爱同学接入到手机产品上。

语音助手的引入给用户带来了更多贴心服务的同时,也能一定程度降低智能机用户的使用门槛。而自然语言理解能力除了可作为语音助手理解使用者命令的核心技术外,亦可作为万能翻译机,使用者只要有一支手机,配合足够优秀的离线翻译模型,理论上就能无障碍走遍全球。

另外,视觉理解能力可以应用在地点识别、物体识别、人脸识别、照相场景匹配等功能上,甚至配合未来的 AR 外设,达成科幻影片中虚实合一的境地。



2018下半年各家 AI 手机市场与方案布局


不论自用,或者是对外销售,目前一线手机方案厂商大多已经开始用上台积电的最新工艺,也就是 7nm,而根据目前得知的产品时程,华为将于八月底发布,时间最早,而苹果则是紧追在华为后面,而高通也因为转用时程较早的台积电 7nm 工艺,而非过去一直合作的三星,因此在产品时程上也有可能提早到今年发表,提供客户采用,而非像过去要等到隔年第一季。

但放弃高端方案,转而回归中低端性价比诉求的联发科,就没有跟上 7nm 的脚步,而是使用代工价格较为合理的 12nm 工艺来打造其 2018 年新 AI 方案。

而以下 DT 君就从各家供应商的市场竞争来为读者解说目前的状况,而评价的内容主要还是以各自 AI 的生态布局为主。

华为的自研之路其实已经走了非常久的时间,早在 2G 时代,华为就曾推出自有的基带与手机芯片方案,然而从推出到堪用,足足花了五年的时间打磨。而华为逐渐掌握手机芯片设计的诀窍之后,也期望能够从这方面取得市场竞争优势,而不是只能作为目的是降低成本的跟风之作。

麒麟芯片整合寒武纪 AI 计算单元带给业界相当大的震撼,过去多数手机厂商虽然在其产品中导入了类似 AI 处理的辅助功能,但有没有专用硬件处理,在执行效率上可以说天差地远。

华为更抢在苹果之前进行全球行销战,硬是把首款 AI 手机这个名号从苹果的手中抢夺过来,让华为在后续的产品行销战中一直处于强势地位。

不过麒麟方案的研发与推展,对华为而言是痛与快乐并陈,由于研发所投入的资金极为庞大,基本上很难回收,且过去很长一段时间麒麟芯片的采用与相关终端出货规模其实也不足以支撑获利,对华为手机部门而言,麒麟极为昂贵,甚至不下于高通的高端方案,因此早期采用麒麟芯片的终端比重都相当小。

当然,到了麒麟 960、970,相关终端占华为出货比重也逐渐增加,到了麒麟 970,甚至已经占到华为季度出货约 2 成。这是个相当大的比重,尤其华为基于高通、联发科方案的中低端手机出货量极大的情况之下,高达 20% 的比重已然是非常可观的数字。

主力手机 AI 方案:麒麟 970 这款在 2017 下半年推出的芯片对华为而言极具有战略意义,其推动的华为产品布局与 AI 应用生态,夺走了许多消费者的眼光,也顺势推动华为的许多产品的销售。

然而,从麒麟 970 的设计理念中,还是能看出华为为了节省成本而做的努力。首先,其 CPU 架构采用 4 个 Cortex-A73 搭配 4 个 Cortex-A53,是当时的主流高端架构,但是在 GPU 方面,却只采用了 12 核心的 Mali G72,并通过提升运行频率来提升其性能表现。这种作法相当简单粗暴,但是对于降低芯片面积以及 IP 授权成本有一定的效果,只不过还是有些副作用出现,首先,由于频率较高,很容易突破架构和工艺本身的功耗墙,一旦突破,那么功耗和温度将直线上升,影响持续性能输出表现和稳定性,手机也会明显发热。

当然,后来华为利用软件优化手段,也就是 GPU-Turbo 手法,针对性的瞄准特定游戏应用来优化其功耗与性能表现,当然,华为宣称其是从 Android 系统底层进行的彻底优化,但以简单的逻辑来推论,若是系统层的优化,何以不能直接套用到所有游戏软件中,而必须个别优化?

当然,DT 君这次不讨论其具体优化手段为何,但这个优化作法,对其行销的确发挥了不错的效果,甚至高通也希望仿效这种作法来改善及硬件的表现,对业界整体而言,华为的确带起了一波技术革新与示范作用,不论其背后包装的真相如何。

而麒麟 970 的另一个重点在于全球首发的 AI 硬件 NPU 设计,其来自中国 AI 芯片大厂寒武纪的架构,可以在 1W 功耗下达到 4TOPS 的性能表现,不止相关应用的性能与效果超出高通的异构计算,甚至苹果的 NPU 也要自叹不如,而其他的“纯软件模拟 AI 方案”就更不用说了。

展望未来的麒麟 980 架构,其可能采用的是 Cortex-A75,毕竟 Cortex-A76 是在今年 6 月才发布,即便华为是 A 级客户,能提早市场至少一季接触新架构,但应该还是来不及,当因为华为的授权形式,可能会在 Cortex-A75 的基础上进行一定的改善。而 GPU 方面也可能还是维持采用 Mali-G72,但核心数量可能扩大一倍以上,借此与麒麟 970 拉开距离,不要落后市场主流太多。

而重点的 AI 单元,华为将继续使用来自寒武纪的方案,其最新的方案相较上一代的寒武纪-1A 在效率上有著相当一定程度的改进,而且其设计原生为 7nm 工艺优化,更能适合麒麟 980 的设计方向。

优势:华为方案可以说与自家的所有生态紧紧捆绑,并相互辉映,由于华为同时已是全球最大移动网络基站设备供应商,要针对自家基站来优化手机芯片的无线技术,自然具有相对优势,毕竟技术细节只有自己最了解,这点甚至要比高通更有优势。

另外,由于麒麟芯片已经成为华为推动移动生态的核心示范架构,为了确保竞争优势,华为肯定也会愿意投入更多的成本来确保其技术特定能够领先对手,或至少不要落后。

劣势:成本问题一直是麒麟芯片的最大软肋,研发一款规模如此庞大,且牵扯生态又极为复杂的芯片方案,所投入的资本可以算得上是天价,而这些成本对华为而言其实回收难度相当高,未来投入 7nm 工艺的麒麟 980,成本恐怕又将进一步拉高又。不过,幸好华为还有获利丰厚的其他事业可以支撑其手机布局,因此短期间之内麒麟芯片的生态仍会持续壮大,仍有机会以时间换取空间,进一步发掘出更多获利模式。

另一方面要考虑的不利因素,则来自于国际市场的不确定性,除了电信网络设备外,终端出货是否也可能受到牵连影响,将是值得观察的重点。而也必须考虑到的是,华为的 AI 生态很大一部份都是针对国内的商业云端服务而来,无法照样搬移至国外市场,这与苹果、高通这种真正从研发之初就针对国际市场的企业相较之下,还是显得较为逊色。

另外,虽然华为在高端方案下了重本,推出可能是目前最强大的 AI 方案,但是在中端方案,比如说新近推出的麒麟 700 系列,却把这个特色拿掉,相较起注重 AI 性能的高通骁龙 700 系列,以及直接主打 AI 应用的联发科 P60,华为在中端方案的规划可能显得就不够周延,使得采用该方案的终端产品可能会明显缺乏竞争力。

联发科在遭遇客户转向,市场明显萎缩的情况下,毅然决然放弃高端计算方案,转而回头经营擅长的中低端高性价比产品,在面对市场的需求下,也同样加入 AI 计算单元,但与苹果、华为不同的是,联发科选择采用 DSP 架构,并与商汤、旷视等 AI 方案伙伴合作,推出包含视觉、自然语言、人脸解锁、物体检测等高端 AI 应用,以过去其擅长的 TurnKey 概念来串起 AI 生态,客户只需要完成硬件设计,在 AI 环境方面只需要花费最少的功夫就能建构完成。

主力手机 AI 方案: 联发科 2018 年主打的 AI 手机方案 P60,具备 AI 专用计算模块的 APU(AI specialized Processing Unit),基于 DSP 计算架构,而 CPU 则是采用 Cortex-A73 搭配 Cortex-A53 的四大四小设计,虽然不是采用最新的 Cortex-A76,但性能表现仍有一定水准,GPU 方案则是使用 Mali-G72 这款相当稳定的 GPU 架构,不过可惜的是,联发科为了成本考量,只采用 MP3 配置,并以高频率运作来补足性能表现,因此在运行游戏时,可能会对电池寿命产生负面影响。目前 P60 已经被应用在包含 OPPO 等多款手机产品当中。

客户:目前中国前几大手机厂商都是联发科的客户,产品多分布在中低端,包含华为、OPPO、VIVO、小米、魅族,以及其他二三线厂商,基本上都摆脱不了联发科,毕竟中低端手机中具备成本优势,产品线完整且技术更新还能跟上市场脚步,且能提供最好技术支持服务的,就属联发科了。而在前两年,联发科也打入三星的供应链,通过使用一定比重的三星芯片代工工艺服务,三星也在其低端手机中采用联发科的方案作为交换。

优势:联发科的方案成本相对较低,且过去在包裹 TurnKey 服务方面口碑极好,在中国的支持人力也最广泛,虽然是 AI 生态的后进者,但是在商汤等 AI 大公司的协助之下,或许第一时间就能够提出够成熟的语音与视觉 AI 方案,对客户而言,联发科一直都是便宜又大碗的选择。

劣势:联发科通常为了成本考量,比较不舍得在芯片中堆料,换言之,其通常都采用一些特殊方式来达到节省成本的目的,比如说用比较少核数的 GPU,但拉到比较高的频率,借此来达到成本与性能兼顾,但实际上往往都会产生其他如功耗控制或者是性能表现不稳定的问题。而在其 AI 方案中,由于采用 DSP 作为 AI 加速架构,在性能或者是功耗表现上不如华为或苹果等竞争对手,而因为成本考量,可能也没办法与同样使用 DSP 架构的中端高通方案相提并论。

作为全球最大的手机方案供应商,高通过去通过 Hexagon 与 GPU、CPU 协同工作,达成对主流 AI 框架的计算加速能力,虽然在效率上还是明显落后苹果与华为的硬件方案,但总是给市场一个交代。

然而,异构计算 (Heterogeneous computing) 虽然弹性高,且可以有效利用芯片中的不同类型计算架构,但目前手机等移动终端上 AI 计算方案讲求的是更高的能效表现,虽然高通的异构计算已经属于相当高效的技术,但仍与 ASIC 有一定的落差,也因此,在使用针对 AI 加速框架进行性能的评比应用时,高通很明显要落后采用硬件 NPU 的竞争对手,未来如果 AI 模型往更复杂的方向发展,或者是同时需要执行多种 AI 服务,那么在发展空间上就可能会明显不如竞争对手了。

不过,高通也不是不知应变,根据市场传闻,其在下一代中高端方案骁龙 700 系列中,将引入硬件 NPU 设计,而如果成真,其下一代高端方案,也就是骁龙 855,也将可能沿用同样的方式。

主力手机 AI 方案:目前高通的 AI 方案普遍以中高端方案为主,包含骁龙 600 系列、700 系列以及 800 系列,600 系列是比较古早的架构,包含 CPU、GPU 及 AI 性能方面也最弱,工艺则是使用 28nm。700 系列则是 2018 年才推出的新分类,主要沿用从旧款高端方案下放的规格,并且改以 10nm 生产,而未来小改款的 700 系列,根据市场信息指出,有可能会将原先的异构软件 AI 加速设计,改而使用硬件混合软件的形式,借此取得和苹果、华为、三星等可以一较高下的实力。

高通在 AI 生态方面,从过去只开放给客户,也开始转而开放给第三方开发者,这些措施包括提供骁龙神经处理引擎(NPE,Neural Processing Engine)的软件开发包 SDK,随后也推出包含软硬件两部分的 AI 引擎(AI Engine),在骁龙核心架构上搭载了神经处理引擎(Neural Processing Engine,NPE)、Android NN API、Hexagon 神经网络库等软件,这对其相关生态的成熟有一定的帮助。

而目前高通也引进了包含商汤等多家 AI 算法设计公司所设计出来的应用框架,想要快速冲刺相关市场,不过高通目前的 AI 性能还有相当大的改善空间,如果要负载更复杂、多元的 AI 计算,恐怕还是要等到下一世代的 AI 设计问世。

客户:做为全球公认的无线技术领先者,基本上采用高通的方案就确保了进入国际市场的基本门票。也因此,全球除了苹果以外,几乎都是高通的客户。即便是拥有麒麟芯片的华为,也都还是有相当大比例的产品使用高通的方案。

优势:高通不只在基带拥有世界一流的技术,在 CPU 与 GPU 方面的设计能力也是举世有目共睹,以移动 GPU 架构而言,甚至可和 NVIDIA 分庭抗礼,且不落于下风,而以高通在全球市场的布局,客户要进入全球市场,基本上就只能选择高通方案。

劣势:虽然高通占据全球手机芯片市场最大份额,全球有接近一半的智能手机芯片出自高通,但目前高通在 AI 生态方面并没有太多优势,且因为使用的是异构计算,在调用系统资源或者是决定负责计算工作的单元时,效率表现上可能比较差,虽然高通在最新款的骁龙芯片中强化了 AI 计算性能,但根据根据苏黎世联邦理工学院的研究人员开发的 AI Benchmark 应用测试,高通的 AI 性能表现和华为的硬件方案仍有相当可观的差距。这对未来 AI 应用的复杂化与普及化有著负面的影响,高通需在现有框架上整合硬件 AI 计算单元才有机会改善。

苹果以单一企业囊括整体手机产业的绝大部分利润,近来其市值更是超过一万亿美元,已经超过全球许多国家的产值,这样的企业投入 AI 生态的发展,却是令人意外的保守。

由于苹果是美国企业,对于个人隐私有著较高的要求,因此强调不把个人数据用于云端建立自己的模型,并积极进入终端 AI 技术的发展。在其自用的芯片方案中引入硬件 AI 处理单元 NPU,苹果虽然已经开放 AI 开发套件给第三方开发者,但主要能取用的计算资源还是在 GPU 加速部分,硬件 NPU 其实还没有完全开放给开发者。

苹果对于使用者数据的使用极为小心,这也是造成其语音助理 Siri 之所以在聪明程度上逐渐落后于主流对手的原因之一,不过苹果并没有放弃 Siri,而是希望通过更好的机器学习算法,希望即便不使用涉及隐私的大众数据,也要能做到从声音表现,到后端服务的整合都做到更开放、聪明的程度。

而苹果在今年 WWDC 上发布的 Core ML 与 Create ML,增加了更多元的框架支持以及应用场景,同时也希望降低由第三方开发者部署自订 AI 模型到手机应用上的难度,让开发者在其生态中能够更得心应手的取用各种计算资源,改善 AI 软件的体验。

主力手机 AI 方案:苹果基本的手机芯片布局是每年一款,当然,为了配合如平板电脑或者是手表等其他终端的产品时程,也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的 A11 Bionic,内建的硬件 NPU 是最大特色。而苹果在其芯片中往往都使用较少的核心,相较对手都已经走到 8 核以上,苹果 A11 还只是个 4 核产品,但其表现出来的性能数据却远远超越所有竞争对手,其原因包括苹果对其使用的 Arm 架构深度定制化,并舍得为了特定性能目的来堆加更多晶体管,因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售,并创造更高的获利,因此每一代方案苹果也就更舍得堆料,形成正向发展。

A11 使用的是台积电 10nm 工艺,这也是少数几次没有使用到三星代工工艺的苹果芯片,由于目前苹果的开发套件中,只开放 GPU 计算能力给开发者,而 GPU 也负担包括第三方 AI 应用的训练或推理的工作,对苹果而言,GPU 的份量也越来越重要,这也是之所以苹果要推动自有 GPU 架构的发展。

虽然目前所采用的 PowerVR 架构在性能与功能表现上相当出色,该公司也愿意配合苹果进行高度定制工作,但这对于苹果而言仍远远不足,而展望未来苹果对其 GPU 架构的布局,将可能是个结合绘图、计算以及推理的全功能 AI 优化设计,当然,为了能耗表现,推理工作可能还是维持独立的 NPU 单元来进行。

而未来 A12 将会如何?其实在现阶段也只能猜测,但根据过去的惯例,性能的增长肯定是不能忽略的,毕竟对手也都在积极追赶,今年对手的主流方案都已经在整体性能上有相当大的改善,也拉近了与 A11 的距离,A12 肯定会在 CPU 与 GPU 方面进行更深度的改造,不论是增加更多的处理管线,更优化 CPU 或 GPU 内部的流水线设计,亦或者粗暴的堆加核心,都是可能的作法。

至于在关键的 AI 硬件单元方面,除了强化效率以外,也可能就规模方面进行扩展,借以压制华为或高通等即将面世的下一代 AI 方案。

优势:作为全球最有钱的手机公司,苹果在前后端甚至芯片本身所能负担的成本远不是其他相似企业所能比较的,好比华为,同为自研方案,但华为在成本方面的控管其实非常明显,毕竟以手机产品本身而言,苹果真的能赚钱,但华为其实还赚不了钱。

其次,苹果聚集了全球最聪明的人才与最优秀的商业模式,App Store 更是让开发者赚最多钱的 APP 商店,不论在生态或技术,苹果都有能力持续发展与茁壮。

劣势:目前苹果手机产品的出货增长已经陷入停顿,而因为其产品的高价化,未来也很难有成长的空间,而我们知道,终端的数量其实与生态的发展息息相关,当然,苹果也有可能推出更多采用其 AI 技术的各类型终端来扩增其生态,但难度很高。

另一方面,苹果与高通的专利争议,对苹果而言也是芒刺在背,由于高通一旦退让,就等于是否定自己的营收模式,因此肯定会和苹果怼到底,对苹果而言,目前的营收成长有一部份是来自于其对高通专利费用的拒交,加上若高通如果赢了官司,未来这两年苹果通过售价的拉抬而增加的获利,恐怕就会被吃掉一大部分。

三星作为全球最大的手机厂商,其势力涵盖终端、消费、云端服务、半导体制造与设计等领域,而其中,手机市场是其最重视的一块,而为了推动其手机市场的布局,三星过去亦步亦趋的追随包含苹果与高通的步伐,并将学习到的设计精髓转化为自有的方案设计。

目前三星主要的芯片来源包含了自行设计的 Exynos 系列、高通的骁龙系列、联发科的低端 MT 系列,以及展讯的 SC 系列,市场从最高端,到最低等级,甚至是可能会被我们直接当作电子垃圾的产品,几乎都有覆盖。

当然,Exynos 与高通方案主要肩负了三星中高端市场的任务,过去其 AI 方案也都围绕著这两大方案发展,而基本上,高通过去提供怎样的 AI 应用,三星就会复制一套过去用在 Exynos 平台上,当然,高通是很保护自己的 IP 的,三星通常得另辟蹊径,务求在不同平台上能呈现出一样的功能,且效能落差不要太明显。毕竟三星的高端产品中,很多是同一型号但使用了不同的芯片方案,如果使用体验落差太大,那么就很难说服消费者。

Exynos 架构的发展非常早,其前身其实是三星早期供应给苹果的芯片逐渐转化而来,关于这一点,可能很多人会以为看错了,但这是早期一段快要被遗忘的发展历史,早期苹果手机的芯片是直接采用三星所设计的方案,后来苹果也开始参与芯片的设计过程,并给了一些建议,而三星也就毫不客气的将二者合作的成果直接套用到自家手机上。

后来苹果不想再被三星耍著玩,转而自行设计芯片方案,虽然还是在三星的代工厂投产,但三星不敢再抄,如果这种情况下还敢抄,一来芯片代工厂的生意往后也不需要做了,二来,来自苹果的天价求偿恐怕很难侥幸躲过。此后三星只好以过去和苹果合作的基础,逐渐发展自有的设计,当然,三星早期自行设计方案,除了降低成本,一来也是要磨练代工厂业务,毕竟半导体工艺技术、良率都是从实际操作中粹炼出来的,没有捷径可言。

目前 Exynos 的设计也走向与高通类似的方向,那就是核心架构的高度定制化,并且搭配异构的计算架构,提供包含日常应用或者是 AI 应用所需要的计算性能。

主力手机 AI 方案:目前 Exynos 9810 是三星的主力高端产品,今年的 Galaxy S9 系列、Note9 系列都可见到其身影,其采用的 AI 计算方式与高通类似,主要是通过 DSP、GPU 与 CPU 的协同计算,不过三星有个特殊的作法,那就是视觉相关的处理交由硬件,而非异构计算。

目前的 9810 采用脱胎自 Cortex-A75 的 M3 定制架构,并搭配 Cortex-A55 作为小核心,而与华为最大的不同是,三星在 GPU 规模上相当舍得下工本,其 Mali-G72 核心数量配置高达 18 个,比麒麟 970 多出 6 个,虽然芯片成本会较高,但可以在较低的时钟水频达到更稳定、更好的效能表现,换言之,能效也更好。

而 9810 中有个 VPU 计算单元,顾名思义,是用来处理视觉方面的计算工作,这个单元应该是硬件设计,但只能用来处理比较固定的功能,三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

而其他的 AI 计算工作就如高通般,是使用异构计算,统 GPU 与 CPU 来达成,这方面可能主要是沿用 Arm 的软件资源,三星也同样没有发布任何相关的开发套件给第三方开发者。

而下一代方案,也就是 Exynos 9820,将会采用 ARM DynamIQ 架构设计,并且将以“2+2+4”三丛集形式打造,其中两组大核将采用三星第四代自主架构“M4”,第二道两组大核则以 ARM Cortex-A75 构成 (也可能以 Cortex-A76 取代),而小核部分则将以 4 组 ARM Cortex-A55 构成。

AI 部分则将可能维持 9810 的作法,那就是采用 VPU 硬件处理单元来处理部分视觉计算工作,并搭配既有的异构计算方式来处理标准 AI 计算框架,也就是半软半硬的方式。

最后,9810 采用的是三星 10nm 工艺,而 9820 将可能是三星 7nm 方案首发,但因为三星的 7nm 采用 EUV 技术,目前还在调试中,真正量产最快也要今年底或明年初,这也可能让 9820 成为最晚推出的次世代 AI 手机芯片方案。

优势:三星自有的 Exynos 方案在多年发展之后已经越来越具备一线高端方案的水准,除了基本的性能表现以外,基带技术也基本达到华为、英特尔的技术水平,之所以没有以之全面取代高通的方案,主要是还有作为与高通的合作筹码之用,高通愿意在三星的芯片代工厂下单,有部分也是害怕三星手机产品全面采用自有 Exynos 方案,毕竟三星也是高通高端方案的最大客户,如果不配合,掉单也是很有可能的事情。

而除了作为商业策略的武器之外,Exynos 的技术发展还是相当到位,也逐渐走向如高通般高度定制的道路,甚至也曾传出三星将会自行打造 GPU 架构的信息。

作为三星的亲儿子,就如麒麟之于华为,Exynos 的发展也是非常重要,在同质化越来越高的市场中,要能够达到差异化,自有方案的发展已经是不可或缺的手段。

劣势:在 AI 布局方面,目前三星走的是封闭道路,不像高通、华为或苹果般提供第三方开发者相关的开发套件,也不见其在主流 AI 框架的支持上有什么明显的动作,相较华为的积极布局,并争取第三方开发者的支持,三星在这方面明显不怎么用心,不过三星自身也有许多关于 AI 方案的关系企业,并进行了不少相关移植工作的推动,所以当全球都走向开放环境,只有三星坚持自己的道路,逆潮流而行。但毕竟使用者关注的还是体验,若三星能提供足够优秀的体验,那么开不开放可能就无所谓。

但即便三星如何家大业大,毕竟以一家之力,要覆盖各种类 AI 应用其实还是力有未逮,因此,将全球第三方开发者都排除在外并不是聪明的作法,或许三星之后会有新的市场布局和作法。

麻省理工科技评论

From Tech to Deeptech