上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

科学
上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士
麻省理工科技评论 2020-09-04

2020-09-04

8 月 1 日,英国皇家物理学会 Physics World 杂志在头条版面,报道了这位准博士毕业生的研究成果。
科学
8 月 1 日,英国皇家物理学会 Physics World 杂志在头条版面,报道了这位准博士毕业生的研究成果。

生于 89 年的上海女孩乔璐枫,通过自学量子力学,跨专业考入了上海交大学物理系,并加入了金贤敏教授的集成量子信息技术研究中心。

8 月 1 日,英国皇家物理学会 Physics World 网站发表头条文章,报道了这位准博士毕业生的研究成果。

上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

图 | 乔璐枫(来源:受访者)

乔璐枫告诉 DeepTech,本次论文工作耗时将近 3 年,论文最终版本和最初版完全不一样。

期间经历实验技术的飞跃、上百篇文献的阅读、文字撰写和图表绘制等。比如,论文中的一个装置图就修改过不下 20 次,好在结果令人满意。

这篇论文最终以《量子围棋机》(Quantum Go Machine)为题发表在 arXiv 预印本平台,乔璐枫是第一作者,她的导师——上海交通大学物理与天文学院教授金贤敏,则是论文的通讯作者。

金贤敏带领的集成量子信息技术研究中心一直致力于光子集成芯片、量子信息和人工智能的研究研发。

围棋游戏是对现实世界的简化

对于论文研究背景,乔璐枫表示,长期以来研究人员都热衷用游戏来测试 AI 算法,这是因为游戏通过使用确定规则,描述出一个闭合世界,事实上这一过程是对现实世界的简化。

自 2016 年谷歌 AlphaGo 战胜世界围棋冠军李世石后,不少研究者将测试 AI 算法的研究方向、转向具备非确定性和非完美信息的游戏(即游戏双方并不完全掌握对方持有的既定信息的游戏),如扑克、麻将、Dota2 和星际争霸 II 等。

游戏中的不确定性,非常适合量子物理学中的叠加和纠缠等特征。而量子围棋的可调整维度,比传统围棋要大很多,它可以模拟各种难度的游戏。

在此背景下,量子 AI 正在兴起,相关研究人员已提出量子版本的机器学习算法,有的已进入实验流程。

而本次研究的主要思路,是把量子效应加入游戏中,最终发现了量子物理和游戏这两个领域中的相似变量。

研究使用的棋子,是以光子纠缠模拟处于量子叠加状态的棋子,即量子棋子。

传统棋子只能占据棋盘中的一个位置,而量子棋子能同时占据棋盘上的两个位置,这两个位置一般称为 A 和 B。

棋子具体在 A 位置还是 B 位置,只有测量后才能确定。为此,该团队使用了一对极化纠缠光子对,即在某个自由度上、处于纠缠状态的两个光子。

测量时,当一个光子呈现水平极化,则另一个光子必定处于垂直极化,这时把测试结果编码为“0”。同样,当一个光子呈现垂直极化,则另一个光子必定处于水平极化,这时把测试结果编码为“1”。

处于叠加态的量子棋子被测量后,塌缩到 A 或者 B 位置时,就可以用 “0” 事件或 “1” 事件来决定。

上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

图 | 量子围棋机草图(来源:受访者)

从量子围棋机草图中可以看到,量子围棋机由纠缠光子的产生模块,测量模块,单光子时间飞行存储模块以及虚拟棋盘组成。那么用于模拟量子棋子的纠缠光子对是如何产生的呢?

上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

图 | 量子纠缠光源(来源:受访者)

上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

接下来,生成的纠缠光子会在测量模块被测量其极化信息。而单光子时间飞行存储模块则会记录每个光子到来的时间信息,通过分析不同通道间的相对时间,设置一定大小的符合窗口,便可以在环境噪声中很好的识别出纠缠光子对的符合事件,达到很高的信噪比。

乔璐枫表示,之所以选择量子围棋,是因为该游戏的规则,更接近现实世界。

其所在团队发现,通过引入纠缠和塌缩,量子围棋可横跨确定性 - 非完美信息、非确定性 - 完美信息和非确定性 - 非完美信息等三个游戏类型。这种多样性的好处,是可以为 AI 算法提供通用测试平台。

上海交大量子围棋问世,英国皇家物理学会“点赞”论文一作女博士

图 | 传统围棋和量子围棋的区别(来源:受访者)

目前,该团队正在采用量子围棋和传统围棋混合的系统,来研发量子围棋机器,以期实现超大棋盘上的游戏。

届时,玩家在下量子围棋时,也能在普通棋盘上玩,但需要一台计算机来记录棋局的状态,并通过相应设备来生成一对量子纠缠的光子。

计算机在记录棋子变化时,会记录棋子在棋盘上所占据的两个位置、以及玩家对这两个位置的选择。

当棋子出现在两个位置的连接处,就会进入塌缩测量阶段,这时计算机会从存储的时间序列中,取出纠缠光子对的测量结果。

值得注意的是,取出方式可以按顺序取出,也可以按玩家的要求随机取出,每个结果在使用后都会被销毁,以避免重复使用。

量子围棋和普通围棋的两大区别

谈及量子围棋和普通围棋的区别,乔璐枫举例称,以一个 19*19 大小棋盘的量子围棋游戏为例,玩家不仅能获知游戏存在的状态数量,还能知道最多可达到的信息集平均大小,信息集平均大小是在非完美信息游戏中的一个衡量指标,它可以反映玩家隐藏信息的多少。

概括来说,量子围棋和普通围棋主要有两大区别:第一,相比普通围棋,量子围棋可通过量子态塌缩,将不确定因素加进来。传统围棋棋局结果,完全由玩家水平决定,量子围棋则加入运气成分,其结果要看棋子具体塌缩到哪个位置。

第二,当使用某些量子态,来模拟量子棋子时,玩家会比其他人获取更多信息,这时量子围棋中的棋子,就有点像打牌时手上拿着的暗牌。

产生上述两种不同的原因是,该团队把常见的棋子变成量子棋子,并加入量子力学特有的叠加态、以及测量后塌缩的特性。

有望扩展量子光子学的应用范围

对于本次研究的意义,乔璐枫给出三点总结。

第一,当游戏可以被量子化,量子围棋游戏就能成为传统机器学习算法和量子机器学习算法的测试平台。

第二,本次研究结果建立了利用固有量子特征和资源,来发明具有量子使能的新游戏范例。

第三,量子围棋将为量子麻将等其他游戏的研发铺平道路。

对于量子围棋的应用,乔璐枫说传统机器人的开发周期,之所以比网络机器人慢,是因为现实环境比人工环境复杂得多。而游戏是对现实世界的简化,简化则是解决难题的常用途径。

由于棋盘游戏都有明确、且简单的规则,玩家在下棋时可以快速得到反馈,这非常有利于 AI 神经网络算法的学习和进化。

具体来说,开发者通过编写游戏程序,可获得有关 AI 的启发,这些启发又可用于降低游戏程序的训练成本,比如将 AI 应用到高度模拟现实世界的游戏,如《我的世界》(Minecraft)、《第二人生》(Second Life)等。

此外,量子围棋也非常适合强化学习。此前强化学习为评估机器人的任务完成能力,需要反复运行程序。但不足之处在于,如果在周围有建筑物的环境中训练机器人,机器人会有撞倒物品、或跌落损坏的风险。

而在使用量子围棋时,机器人能在运行环境中进行计算机模拟,这可避免让未经训练的机器人、在现实世界中跑来跑去的风险,同时也省去对机器人内部高精度零件的维护。

量子围棋距离大众并不遥远

近日,清华大学 AI 研究院院长张钹表示:“深度学习触及天花板,在语音识别、图像识别、围棋三个领域外,短期很难再获得发展。”

而乔璐枫所研究的量子围棋,正好在张钹所述的三大领域之内。事实上,量子围棋在 AI 产品中的应用,离我们并不遥远。

她举例称,AlphaGo 正是把卷积神经网络运用在围棋游戏上的经典案例,这种做法可以省去海量样本标注工作,且有助于深度学习的普及。

以前,人们都喜欢用 AI 来解决棋盘游戏中的难题,而围棋是最难的传统棋盘游戏,因此备受关注。在 AlphaGo 面世之前,人们普遍认为,AI 在短时间内无法战胜人类围棋冠军。

但事实上,围棋分为很多段位,有业余段和专业段,业余段又有 1 到 8 段,职业段有一到九段。基于此,研究者们利用不同方法,开发过各种围棋 AI 程序。

早在 2006 年,法国计算机围棋专家雷米 · 库洛姆(Rémi Coulom),使用蒙特卡洛树搜索的随机抽样方式,让计算机程序达到业余 1 段以上的水平。

在 Online-go 等在线围棋平台上,机器人注册一个账号,就能进行 AI 与人、AI 与 AI 之间的对战。通过对战,开发者可通过 AI 程序的段位,来测试算法能力。

对于 AI 来说,那些非完美信息的游戏则要比棋盘游戏难掌握得多,但这类游戏更接近人类世界,AI 在掌握上述游戏后,可利用 “迁移学习” 方法来解决现实世界中的问题。

比如,谷歌旗下 DeepMind 公司的研究人员,通过使用 “迁移学习” 方法,可让神经网络从 A 游戏中获得的经验知识,迁移到 B 游戏中,即像人类一样能同时学会多个游戏。还有研究者让 AI 玩《侠盗猎车手 5》,借此学会识别停车标志,并能用于自动驾驶场景。

乔璐枫表示,该研究也可以用于大众科普。目前部分公众对量子力学感兴趣,但却缺乏基础知识,导致市面上出现不少打着量子旗号的骗子“产品”。

此外,围棋作为最古老的棋类游戏之一,在全世界拥有大量“粉丝”。不同于传统围棋需要有棋子和棋盘等硬件,量子围棋可开发出在线版本,用户无需购买棋具,直接在网上就能玩。

另据悉,乔璐枫所在团队正在利用强化学习,来开发和训练量子围棋程序。据她介绍,这种程序可以自己和自己下棋,还能不断进化自身能力和经验知识。

“乘风破浪”的科研女生

乔璐枫的导师金贤敏告诉 DeepTech,她的考学经历非常励志,完全靠自学考入该校读研,而她本科学的是计算机。

谈及对于科研的热爱,乔璐枫认为,这主要归功于上海这座城市的文化底蕴、以及家庭教育。

她父母从来不刻意要求她做什么,也不会说女孩子该做什么、不该做什么。母亲是理科出身,受益于这样的家庭氛围,她从小最喜欢看的电视节目,是上海卫视的纪实频道和 CCTV 的科普频道。

小时候,从《新发现 SCIENCE&VIE》中国版创刊她就买来阅读,《科学美国人》杂志也是她常看的书籍。

从中学开始,乔璐枫就很喜欢物理学,她告诉 DeepTech:“量子力学像谜一样的存在尤其吸引着我。”

高考报志愿时,4 个平行志愿,3 个填的都是物理学,但是分数正好取到计算机专业,考入大连海事学院后,虽然不是理想专业,但是考上了就认真学。不过她对做科研却日发向往,这也让她决心跨专业考研。

考研备考时,她把量子力学教学名师钱伯初的整套 70 多节课的视频,从头到尾看了 3 遍。

考研前,她还在上海一家船舶公司做了半年的虚拟现实研发。之后辞职复习半年左右,并一次性考入上海交通大学物理系。她自己用 “幸运” 来形容考研经历,但更多是她本身的不放弃。

这位生于 1989 年 11 月 11 日 11 点的姑娘,30 岁才博士毕业,似乎不太符合人们爱看的 “天才少年” 的叙事方式。

但乔璐枫认为:“现在很多报道都是宣传年少有为的,但像《乘风破浪的姐姐》里面讲述的 30 岁以上的姐姐们,她们的故事也得到了很多人共鸣。科研是一个长线工作,是可以做一辈子的工作,像钱伯初老先生这样的前辈更让人感动。”

麻省理工科技评论

From Tech to Deeptech