三星开发者大会揭露AI庞大布局,借智能语音服务贯穿生活与商业生态核心

计算
三星开发者大会揭露AI庞大布局,借智能语音服务贯穿生活与商业生态核心
麻省理工科技评论 2017-10-20

2017-10-20

从今年的动向看来,Bixby 已经成为三星连结所有智能终端和云端的通用接口。
三星 人工智能
从今年的动向看来,Bixby 已经成为三星连结所有智能终端和云端的通用接口。

北京时间 10 月 19 日凌晨一点,三星的开发者大会在美国旧金山开幕,一系列最新的技术发展也终于浮出了水面,包括经过重大升级之后的智能语音助手 Bixby 2.0 版。

从今年的动向看来,Bixby 已经成为三星连结所有智能终端和云端的通用接口。在此次大会上,三星不仅推出可把普通音箱转换成智能音箱的小盒子,也展示了 Bixby 语音如何连接家庭娱乐应用、智能家居,以及推出开发工具,秉持开放的精神,希望能够吸引到更多开发者针对 Bixby 平台推出更多网络服务。

JJtKEey0hPZeOGcEZ7p2iamz2Cek0Xflsn5uLl3Hz0y5WdQvxU3SyZpc7zhrd0Eicv2KV8WGtbfygHfdicYD9iaueA.jpg

图丨2017 三星开发者大会(SDC)

实际上,三星也有意把 Bixby 转化成他们针对人工智能与机器学习的共通标签,不仅发表了 Bixby 2.0 版及相关的 SDK,甚至还推出 Bixby Vision 计划,主要是针对 AR 应用中所需要的图像辨识等机器学习能力,未来应该也会延伸到更多与影像相关的机器学习应用上。乍看上去,三星在移动AI芯片大战中完全失去了存在感,被苹果和华为领先一大截。但三星悉心经营的智能语音入口 Bixby 在沉寂一段时间后,在今年下半年突然发力,将触角伸向生活、商业,甚至将 VR、AR 也纳入该体系。

如果说移动端的AI芯片是“造桥”,那么三星以 Bixby 为核心的 AI 布局更像是“挖渠”。既然三星的半导体部门如此赚钱,何不慢慢把 AI 生态养起来,静待“水到渠成”的那一天。这样看来,三星在AI硬件方面不紧不慢的态度似乎就可以解释了。本次三星开发者大会的主题演讲部分还有一个亮点,在演讲的最后环节,三星请到 Google 的 AR 专家,发布其在三星手机平台上的 AR 开发计划。Google 未来也将把三星高端手机当作 Google 的 AR 技术示范平台。

 

三星今年起开始大幅修正AI策略

如果想要知道一家公司的策略,从投资项目来看,大概就八九不离十。从 2014 年-2016 年,三星集团内部有 32 个重点研究计划,其中 6 个跟 AI 有关、 4 个是 IoT。2017 年截至目前三星收购了 4 家公司,其中三家分别是希腊科学家成立的语音技术公司 Innoetics、智能家居监测平台初创公司 Perch、纽约的 VR 社交初创公司 VRB,所以答案其实已经很清楚了。 

从三星电子的布局做分析,迎接下一波科技竞争的核心战略应是 Connected Future(互联未来),由于三星与苹果同样都具备庞大的硬件产品出货量作为服务接口的优势,通过三个技术浪潮切入,分别是 AI(例如 Connect 云计算平台、 Bixby 智能语音助理)、 IoT(包含各种智能装置、智能家庭产品)、以及 AR/VR(增强现实/虚拟现实),借此串连起各种终端装置与应用,全面覆盖消费者的未来生活。

 

三星的“互联未来”

“计划在 2020 年之前,所有三星电子的产品都会相互连接,并和外界伙伴打造一个 IoT 生态圈。”三星电子消费产品部门总裁尹富根(Boo-Keun Yoon)说,并将其称为是“未来的超互联”(hyper connectivity of the future)。

过去,外界在评论三星的崛起,无不提到三星集团在设备及元器件领域的垂直整合优势,包括先进的内存芯片、面板技术、电池、相机模块,不仅成为三星开发高阶终端产品的后盾,偶尔也能协助制约对手,例如苹果将 iPhone 改采 OLED 面板时也难免有些心里没底。

2.jpg

图丨未来三星电视将会内建 Bixby 自然语言秘书功能

不过,随着新技术及应用崛起,三星多少也感受到危机意识,积极打造一个内部+外部创新的模式,例如三星为了强化 AI 领域的布局,调整战略及组织、积极打造实验室及研究中心,同时也通过合并和收购(M&A)把外部技术注入技术及产品开发上。

先前三星在 AI 的布局看似是以 Bixby 为中心,但事实上,三星从今年起就已经大幅修正策略。据外媒报导,三星已经在内部设置一个 AI 委员会负责统筹,取代过去各事业部以 Bixby 为中心的产品开发方式。除在总部设立直属 AI 委员会,旗下的三星先进技术研究院(Samsung Advanced Institute of Technology,SAIT)也在全球 AI 重镇加拿大蒙特利尔大学(University of Montreal)设立人工智能实验室。

更重要的是,三星将与拥有“神经网络三巨头之一”称号的计算机科学教授 Yoshua Bengio 展开密切合作(其他两位巨头为 Geoffrey Hinton、Yann LeCun)。Yoshua Bengio 透露,双方将专注开发用于语音/影像辨识、翻译、自动驾驶和机器人的算法,同时也会协助招募全球人才来强化三星的 AI 技术。三星先进技术研究院也计划和首尔国立大学合作建立神经处理研究中心(Neural Processing Research Center),将加速进攻 AI 处理器的研发。 

另一方面,则是花钱投资、收购毫不手软,三星不惜动用高达 10 亿美元的资金,收购及投资专攻 AI 技术的策略,摊开三星对于 AI 的投资案例来看果然是一长串,包括 2013-2015 年投资人工智能初创公司 Reactor Labs、Idibon、Vicarious、家用机器人初创公司 Jibo、2016 年买下主导苹果 Siri 研发的 Viv Labs、2017 年则收购 Innoetics、以及投资 AI 语音初创公司 SoundHound。而先前投资的人工智能对话公司 Mind Meld 和深度学习公司 Maluuba 后来则分别被思科、微软收购。

日前,三星电子公布第三季度财报也交出了一份优异的成绩单,收入和利润率都创下新高。但仔细一看不难发现,最大功臣其实是半导体部门,贡献了三星电子将近 7 成的获利,财报亮眼则是受惠于内存价格涨翻天,因此三星的消费类产品该如何持续创造新的增长点,就是一个很重要的议题,这也正是三星为何对新技术应用领域,包括 AI、IoT、AR/VR 展现很强企图心的原因了。

  

三星的 AI 布局

与苹果、华为等抢着把 AI 处理单元装进手机的公司不同,三星看起来却是一副气定神闲的样子,没有跟风推出类似芯片或手机产品。但三星在 AI 应用方面绝非一片空白,其竞争厂商先从 AI 硬件下手,三星则反而是把 AI 软件生态摆在优先位置。相较于手机产品竞争对手开始把图像识别当作重点功能,三星的 AI 布局却是先落到了语音上,而且不只是在手机端,甚至也要把相关技术导入到商务应用中,通过子公司三星 SDS 的三大 AI 布局,意图成为业界最大的商业人工智能服务公司。 

人类与人类沟通的方式主要就是通过语音,但在过去,人类想要与机器沟通,一般都必须透过键盘、功能键或特定的可视化操作接口,这些方式虽也获得不断的改良,但总是不够直观,如果我们可以用与人说话的方式直接向机器下命令,甚至可以用”沟通”让机器更了解我们的需求,从而协助我们解决问题,而机器也可以模仿人类的反应方式,让整个操作过程更显得“人味”十足,那对操作体验将可大大改善。为了达到这个目的,通过技术研发、让机器能够更精准的判断人类习以为常的日常对话就成了关键。 

目前,诸如 IBM、微软、百度等公司在语音识别方面,通过使用组合模型,不断提升语音识别性能。微软基于 6 个不同的深度神经网络构成的声学模型,以及 4 个不同的深度神经网络构成的语言模型,取得了超越人类的识别准确率。

科大讯飞则基于深度全序列卷积神经网络语音识别框架,取得了实用级的识别性能。云知声、捷通华声、思必驰等智能语音创业公司亦不断打磨自己的识别引擎,并能够把自己的技术落地到产业中。关于智能语音技术,可说是兵家必争之地。然而这些产品或技术概念多半在应用层次上受到局限,也还达不到普及的地步。但三星的智能语言服务则是抢先业界一步,已经使用在自家手机产品,甚至是商业服务当中。 

JJtKEey0hPZsQMj3jerzLLvniaLv20Y502PaoKmg2ZUTiaOLtrTLmekAoZmmCrSFdxeGvQC3ydtibQKlIV5WqARCw.jpg

图丨Bixby 将推出 2.0 版,强调个人化,并以开放生态期待更多应用开发者加入

虽然三星目前在手机硬件都还是维持现有的计算架构,没有额外增加类似 NPU 之类的神经网络加速单元,但三星在 AI 的市场应用恐怕要比所有的手机厂商都要走的更远,事实上目前三星集团针对 AI 应用的开发人员,已经超过数千人以上,规模要远大于其他号称 AI 服务或应用公司。而且,三星的 Bixby 也是业界最早的手机自然语言处理平台之一。 

首先在手机上,Bixby 来自于三星所收购,苹果 Siri 之父所创办的 Viv Labs,因为非韩文语系支持还不够完整,目前 Bixby 在海外版的三星手机上只能算是残废版。也因此,DT 君虽有三星手机,然而基本上 Bixby 开启的机会少之又少。但是从三星刻意为 Bixby 功能设计了硬件按键来看,三星的确非常重视这个功能。可惜的是,截至目前为止,只有韩国本地能享用完整功能,国际用户根本感受不到这个功能的真正魅力。

不过回到正题,既然三星如此看重 Bixby,那么其与 Siri 最大的不同何在?首先,与 Siri 这种单纯针对关键词、或者有明确结构的语音命令式语音助手相比,Bixby 只要自然的跟手机说话,大部分的情况下 Bixby 就能直接从你的话语中理解命令。当然,如果 Bixby 真的听不懂,它也会跳出提醒,希望使用者能提供更进一步的工作描述。这就是苹果、华为一再强调的自然语言辨识能力概念,三星则是已经将概念化为实际服务。当然,通过硬件 AI 的学习机制,理论上可以做到更复杂的自然语言解析,但语音相较于图像辨识,其计算负载要低非常多,三星目前高端手机采用的芯片方案虽不具备神经网络专用处理单元,但处理这类计算仍属绰绰有余。

另外,提早发布并导入这种 AI 语音应用其实有个好处,那就是一开始的应用环境比较单纯,系统计算负担低,三星有余地把使用体验、语音学习模型打磨到完美的地步,配合未来 AI 计算单元的加入,就可以快速在现有的使用基础上拓展应用复杂度,提供更优秀的系统或秘书功能集成。Bixby 也不会仅是守在手机上,相反的,它会以手机上的技术与应用发展为基础,扩展到不同应用领域,比如说,智能家庭中的家电产品将来可能都会和 Galaxy S8 一样,有专属的 Bixby 按键,甚至未来的自动驾驶,都可能把 Bixby 做进去,直接用语音和车辆沟通,甚至进行路线指引。 

另外,在企业端,三星也有利用 Bixby 技术延伸而来的智能服务系统规划。这就是 Bixby 的进化版本、针对企业用户的 Brity。如果把三星看做一家单纯做手机的厂商,那就太小看三星了,苹果及华为在应用和市场的触及广度方面,其实无法和三星相提并论。实际上,Bixby 是由三星电子以收购来的 Viv 技术为基础所开发,而三星旗下的信息服务公司三星 SDS 则是以 Bixby 为基础,在九月针对企业客户推出了商用智慧平台 Brity,能够处理一般商务会谈、商业数据、查询出货、合约、订货、预约,甚至医院的咨询、初步问诊等等功能,并仍在持续扩展应用层面。

用个比较粗浅的比喻 Brity,那等于就是淘宝的小蜜可以直接和消费者对话,并理解相关需求,而一切都不需要透过结构化的命令,或事先安排好的指令,而是通过自然语言交谈完成,而客户感觉上也会好像是和真人互动般,更有亲切感。 目前,Brity 只提供韩文版,英文版还在开发中。另外,值得一提的是,三星 SDS 的三大 AI 产品策略中,Brity 是作为与人沟通的接口,在学习和图像识别方面,也都有相关的方案。机器学习方面,由着重数据分析的 Analysis AI,机器视觉方面,则拥有具备机器视觉、能找出瑕疵品或其他识别应用的 Visual AI。

目前,三星在手机上的 AI 应用虽然只有 Bixby 一款,其他如华为在 Mate 10 上强调的照相场景 AI 技术,以及其他图像识别技术,都还没有什么明显动作,但这不代表三星就放弃了相关技术的发展。事实上,三星在相关的图像识别技术早就已经非常成熟,并应用到包括医学领域之中,手机的图像识别对三星而言并不是太困难的事情,但由于图像类的应用对专用硬件的需求要比语音应用更高,目前还没有合适芯片方案的三星自然也不会太快把这类应用放到手机上。 

而为强化手机上的 AI 生态与应用竞争力,根据业界信息,三星也已经投入研发类似 NPU 的 AI 计算单元有一段时间了,预估 2018 年就会面世。三星对此架构的期许也正如华为对 NPU 的期许,通过专用计算硬件,让本地端的脱机数据处理可以达到理想的效能,并且避免数据在云端与本地端的迁移所造成的延迟现象。

  

三星的 VR/AR/MR 布局

根据调研机构的统计,三星从 2016 年推出首款 VR(虚拟现实)设备开始,就稳居所有 VR 设备的销售量冠军。三星目前仍主打配合手机硬件的 Gear VR 产品,通过与手机搭配销售的策略,出货量至今已经超过 400 万部,相比之下,Oculus 仅卖约 60 万部,hTC VIVE 则是达到约 70 万的出货量。 

作为增加手机附加值的周边产品,Gear VR 的表现可说恰如其份,但三星在选择 Gear VR 的内容来源时,却不介意与“竞争对手”Oculus 合作,主要原因有两个。

首先,三星在推出 Gear VR 时,市场针对 VR 的应用内容非常贫乏,移动平台上虽有 Google 在推动相关生态,也在 Youtube 上开放 VR 视频播放功能,也提出不少应用开发上的构想,但是在 Daydream 推出前,市场上还是各做各的,没有统一的内容平台,导致内容形式和兼容性都非常混乱。因此,作为 VR 头显的最大出货商,三星需要一个共通的应用平台,让开发者可以很轻易的推出应用,且用户能够在单一接口下轻松取得自己想要的内容。因为被 Facebook 收购,承载着母公司对虚拟社交应用的期待,而且又对移动 VR 非常感兴趣的 Oculus,自然就成为绝佳合作对象。

其次,为了推动 VR 生态,Oculus 刚好也与各家 3D 绘图标准供货商合作,推出可大幅降低在 VR 设备上进行 3D 绘图计算负载的开发标准,过去的 VR 由于必须针对不同眼睛绘出不同角度的 3D 场景,所以硬件水平要够高才能够达到足够的流畅性,否则容易造成头晕呕吐。

通过 Oculus 与业界合作开发的标准 API,系统只要绘制一次 3D 画面,API 就能自动针对左右眼处理成不同角度的立体画面,大幅降低系统负载。而三星构想中的 VR 设备必须搭配手机,因此 3D 画面的绘制会造成手机计算上的严苛挑战,为维持显示流畅性,并且把功耗控制在合理程度,采用当时 Oculus 提出的方案就成为最有效的方式。Oculus 和三星在移动 VR 方面有着坚定的合作关系,毕竟对三星而言,Oculus 可以提供硬件设计和应用平台;而对 Oculus 来说,三星手机产品的庞大销售量更是带动 Oculus 以及母公司 Facebook 增加相关应用使用人群的最快途径。二者是各取所需。

虽然目前 VR 应用还比较短缺,但作为未来推动硬件生态升级的重头戏之一,三星对 VR,甚至 AR 的发展一直都是作为核心策略发展方向,而这部分的市场策略可分为移动端和 PC 端。在移动端方面,Gear VR 的发展还是会继续,作为协同手机生态发展的重要武器,能够直接引用未来 Facebook 将投入的社群互动资源,以及 Oculus 在线应用生态,三星无论如何都不会放掉这个已经在产业造成影响力的有力平台。 

目前 Gear VR 市售版已经是第三版,如果加上两个开发版,从 2014 年到现在短短不到三年间,就已经发布了五个版本,而架构设计上也从单纯显示,到后来也增加了操作杆的互动能力,这也能看出三星对此款产品的定位仍不断演化。Gear VR 代表的是移动终端的生态,然而在 VR 重点平台之一的 PC 端,三星目前还没有任何建树,难道这意味着三星要放弃 PC 平台?

当然不会!与 Gear VR 的发展路径不同,PC 上的 VR 生态三星决定要走微软体系,而且不只 VR,甚至把 AR 也一起做进去,直接达到 MR(混合现实)。那么,三星为何在 PC 端上不继续选择与 Oculus 合作?Oculus 明明也是 PC 上的一大 VR 设备供货商,2017 年第二季第三季的销售量也因降价而成功反超 hTC,风头正劲啊?其实关键原因在于,Oculus 在 PC 平台上并没有如 Gear VR 般成功的应用商店。Facebook 虽有钱,但在 PC 游戏生态上也帮不上忙。相比之下,hTC 有 Steam 这个装满高质量游戏的大平台当靠山,而 Oculus 基本上处于孤立无援的状态,什么都得都靠自己。 

JJtKEey0hPZsQMj3jerzLLvniaLv20Y5044FEHME7cia3dVdhzNoE9KxujpRr9via0FEtQhWt1fgqo3kaxJhcMtEg.jpg

图丨Samsung Knox 将成为整个 Samsung 云服务的信息安全核心

同样,三星在 PC 游戏上也拿不出什么可以吸引开发者的东西。为求快速发展,且要和既有的 PC VR 设备生态有所区别,和微软这个拥有 Windows 应用商店这个安装基数不下于 Steam 的应用平台合作,可能是最聪明的方法。当然,微软急着要把 Windows 商店的生意做大,所以也不只找了三星,包括戴尔、华硕等厂商也是其合作伙伴,毕竟确保设备供货稳定,以及让合作伙伴之间有一定程度竞争压力,产品才会更快臻于完善。 

当然,面对竞争,三星也有其杀手锏:即将于 11 月公开销售的 Odyssey 与另外两家竞争者相比,最大的差别在于使用了 AMOLED 面板,而不是 LCD 面板,所以理论上颜色表现会更出色,且机构设计也可以更轻薄。另外还有一个重要的特性,AMOLED 由于其有机自发光特性,白光是透过 RGB 混合调配出来的,而不是像一般 LED 背光直接使用蓝光波长透过染料去激发白光,所以蓝光强度比 LCD 面板常用的 LED 背光低了不少,对眼睛的伤害也比较低。

根据调研机构预测,2020 年 PC 上的 VR 设备总销售量将达到 2,000 万部,以目前 Oculus 加上 hTC 一年也不过两百万部的规模来看,剩下的量恐怕还是要通过微软平台才有办法达成,而三星凭借优势产品架构设计,肯定能在市场上占有一席之地。除了 VR 部分,在三星目前进行中的 AR 计划中,最特别的就是外形类似太阳镜的 Monitorless。其实它是一部无线控制的 VR/AR 混合装置,内建 CPU、投影机、电池、扬声器等组件,并具备 Wi-Fi 功能,能通过无线网络来连接手机和计算机,并显示相应内容。

戴上 Monitorless 的用户可直接看到计算机上的影像画面,手机则可当成控制器来操作。当然,增加额外的周边操作产品也是有可能。Monitorless 的显示内容可任意在 VR 与 AR 模式之间切换,换言之,用户既可选择 AR 模式透视现实背景,亦可使用 VR 沉浸式的全黑背景。不过由于其结构设计,决定了其与外界的隔绝度就不会像 Odyssey 这么高,毕竟三星还是希望用户把这款产品当作 AR 设备来使用。Monitorless 目前还是一款概念产品,有无上市计划仍要视公司策略而定。

ar.jpg

图丨AR 是未来的应用核心

大家看到这里,除了继续推进VR、AR头显的开发计划,可能会觉得还少了些什么。没错,那就是手机端的 AR 功能。苹果已经通过最新的 iPad 和 iPhone 系列产品向消费者展示了手机端 AR 的魅力,并同步推出了苹果专属的开发环境ARKit。而搭载安卓操作系统的三星系列手机要选择一个合适的 AR 开发环境,似乎也非 Google 的 ARCore 莫属了。 ARCore 可以说是 DayDream 的 AR 专属版本开发环境,ARCore 为移动终端定义了包含追踪动作(Motion Tracking)、掌握环境(Environmental Understanding)、测量亮度(Light Estimation)三种功能标准,导入这些功能后,使用者可通过侦测手机移动方向、环境特征、以及配合环境调整虚拟物体的位置和亮度,让虚拟物体看起来更具真实感。

Google 之前也宣称,已经和包含华为、LG 在内的手机大厂进行 ARCore 应用开发的合作。但是在 SDC2017 中,Google 则是宣布首批完整集成 ARcore 框架的手机会是由三星推出的 Galaxy S8 系列与 Note 8。因为 ARCore 专精于移动端的 AR 布局,而未来 PC 端的 AR 应用则将走微软生态,但二者针对的市场面向不同,互补意味要大于冲突。

壹伴上传_17-9-27 11-08-25.jpg

麻省理工科技评论

From Tech to Deeptech