和华为同台争艳,这款中国“网红”开源软件火遍GitHub

互联网
和华为同台争艳,这款中国“网红”开源软件火遍GitHub
麻省理工科技评论 2020-06-08

2020-06-08

“修下水道”的开源者。
互联网 技术
“修下水道”的开源者。

64912 的贡献量!

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | 2019 CNCF 年度报告对 PingCAP 的报道

该排名来自美国 Linux 基金会旗下的云原生计算基金会(CNCF)。自 2015 年成立以来,PingCAP 以 64912 的贡献量,位居贡献总榜单第七名。

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | CNCF 自成立以来的成员贡献量排行

可在五年前, “国外人能做,你们肯定做不出来”,这是黄东旭创业伊始,听到最多的声音。

2015 年 4 月 19 日,他的合伙人 PingCAP CEO 刘奇发了条招人微博,阅读量 47 万多,但却没收到一封简历,批评声倒是雪片般飞来。

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | 刘奇创业后的首条微博

由于 PingCAP 要做的是开源数据库,很多网友觉得这事很不“中国”,一听就像是国外的事,还有人劝他说数据库是个大坑。

更有人怼他:“如果本职工作都没做好,一味忙活开源、框架,以提高影响力,那未必说明他就是技术大牛,也更未必是创业企业所需要的人。”

在这条微博下,黄东旭也在留言区鼓励大家投简历。和黄东旭以及刘奇,同为创始人的还有崔秋,他们相识于前东家豌豆荚。

当被问到三人职位是怎么划分的,黄东旭开玩笑说:“我们仨当时约定,谁技术能力最强,谁就当 CEO。”

说完他又补充称,也没有这么简单,分工主要综合了三人的性格、优势偏好等。最后,黄东旭和崔秋,分别成为 CTO 和 CFO。

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | 崔秋、刘奇、黄东旭(从左至右,受访者供图)

数据库是 IT 行业的“基础设施”,一个安全、可靠的国产数据库,是大家盼望已久的事情。PingCAP 的创立,给这个事情带来了一些想象。

他们要做的数据库,最早想法启发于 Google 的分布式关系型数据库 F1 和 Spanner 的论文。青出于蓝的地方在于,黄东旭要把数据库开源。

他很喜欢毛泽东《关于领导方法的若干问题》中的一段话:“凡属正确的领导,必须是从群众中来,到群众中去......然后再从群众中集中起来,再到群众中坚持下去,如此无限循环,一次比一次地更正确、更生动、更丰富。”

他觉得,这段话完美解释了开源软件生命力的来源。

而对于开源分布式数据库的定义,黄东旭告诉 DeepTech:“我们的工作,好比修下水道。一般人看不见,但是下水道堵了,整个生活就会受影响。”

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | 黄东旭

第一个客户是朋友

出来创业前,黄东旭是分布式开源缓存产品 Codis 的作者之一。如果产品也有基因,开源正是 PingCAP 公司流淌在骨髓里的东西。

PingCAP 的开源数据库叫 TiDB,名字中的“Ti”,是钛元素的符号,命名的初衷,是因为他们希望产品和钛元素一样“抗糟”。

回想当初,生 TiDB 难,养 TiDB 更难。公司成立两年半,都已经 B 轮融资,到账收入仍是 0。

2018 年,黄东旭的朋友、盖娅互娱的 CTO 说,他们的 MySQL 数据库出 Bug 了,整个系统卡顿到无法使用。

黄东旭对朋友说:“反正你横竖都是死,要不试试 TiDB,它跟你的数据库完全兼容。万一把你救活了呢?”朋友抱着死马当活马医的心态,一试,结果真的医好了:原来用 MySQL 20 分钟才能跑出数据,用 TiDB 几分钟就够了。

据了解,盖娅互娱主要使用数据库,来统计各渠道的广告投放、带来的游戏玩家数据,并通过查看数据、来优化广告,换上 TiDB 后,正好满足了其日益增长的数据需求。

2016 年 4 月 22 日,是世界地球日,那天,摩拜单车第一辆共享单车正式付用。两年后,在美团收购摩拜单车、《摩拜创始人胡玮炜套现 15 亿:你的同龄人正在抛弃你》的文章火爆全网时,胡玮炜或许应该感激 TiDB。

自 2017 年初摩拜单车部署 TiDB 后,每次开关锁过程中,TiDB 先把日志做汇总和分析,然后把用户行为,规整为人、车两大维度,并把日志存放到 TiDB 中,最终统计出各个维度的开锁成功率。

TiDB,也成为日后摩拜单车用户量激增近十倍的促因之一。黄东旭和同事估计,光这件小事,一年的业务量就多达数百亿。

“本该切阑尾,结果切了胃”

TiDB 的开源属性,使得其用户分为免费和付费两大类。黄东旭告诉 DeepTech,付费和免费的区别,好比买保险和不买保险的区别。

不管你买不买大病险,都有可能生大病,但是买保险的人,如果真得了大病,就能得到一笔救命钱。类比到 TiDB,就是付费用户在使用中能够更加的放心和安心。

对于数据库产品来说,传统金融场景是要求最高挑战最大的领域之一,如果没能被银行相中,那还真算不上成功。如今,北京银行的案例,成为黄东旭逢人必讲的故事。如果你是北京银行用户,当你刷二维码付费时,背后支撑这笔交易的数据库正是 TiDB。

2018 年,北京银行有几十台服务器,在使用 TiDB 数据库。有一次,服务器出现硬件故障,硬件服务商到数据中心更换内存时,又把服务器关错了。好比给一个阑尾炎病人做手术,结果却把人家的胃给切了。

但因为 TiDB 可以自我修复,就像皮肤划伤后,自己会长好。因此,即便服务器被拔错,银行业务却没受到任何影响。银行的技术负责人知道后,把TiDB夸成了一朵花。

如果是一般数据库,这件事肯定会让开发部门“鸡飞狗跳”,996 估计都不够。而让开发者有更多睡觉时间,是 TiDB 从诞生时,就定下的使命。

截止到目前,已经近 1000 家用户将 TiDB 用于线上生产环境,涉及全球各个行业的头部公司,这些公司会把自己在 TiDB 使用及实践整理成为案例对外分享,一些头部公司如国内的美团、知乎、京东等等都在 TiDB 社区活跃贡献着。

诞生于中国,但不局限于中国

《我们诞生于中国》,是陆川于 2016 年拍摄的一部动物纪录片,讲述了中国独有的四川大熊猫、三江源雪豹和川金丝猴。

黄东旭也曾用“我们诞生在中国”,来形容 TiDB。但他也说,因为开源无国界,所以 TiDB 生在中国,却绚烂在全球。

2019 年初,还是创业公司的 PingCAP,罕见地进军硅谷。由于 TiDB 在研发过程中,使用到 Rust 语言。同时,Rust 的两位前核心成员,也是 TiDB 的开源贡献者。

这两位作者,如果说之前他们给 TiDB 义务做开源贡献,是在和黄东旭他们“谈恋爱”,那么成为黄东旭的同事,就好比是“扯证结婚”。如今,TiDB 在美国的办公室,已经有十来位开发者。

不会弹琴的编辑不是好 CTO

黄东旭本人,算是 CTO 中的“另类”,除了技术外,还热爱音乐和艺术。

他会在偶尔有空的时候,即兴弹奏吉他。虽是即兴弹奏,却也是雁过不留声。弹了,就忘了,从未想着记下曲谱。

美术上,PingCAP 的 LOGO 雏形就是他设计的。

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | PingCAP LOGO

写作上,他能写论文、能写故事,最近还给某国际顶级会议提交过一篇论文,这篇论文已经通过审核,评委们认为这篇论文可以引领一个方向。他在前两天举办的每年一度的 TiDB Devcon 大会上聊到这么论文时还难掩兴奋。

作为一名技术创业者,黄东旭十分低调,他表示不喜欢把自己过多的暴露于大众下,只想要关注自己的专长,但一聊到技术,他整个人就兴奋,特别是碰上志同道合的技术小伙伴。和很多技术从业者一样,黄东旭接触编程很早,但是让他印象深刻并且对现在的创业产生影响的是在他高中的时候。

高中时,黄东旭接触到 Linux,这款开源产品,让他不出家门就能拥抱世界。如今,他也用 TiDB,让别人不出家门就能拥抱世界。

如果说高中时接触 Linux,是他后来做开源数据库的先兆,那么大学毕业后在豌豆荚和刘奇做 Codis,则是 TiDB 的绪论。这让他们从创业初始,就决心做开源产品,黄东旭也自称是个“开源信徒”。

开源,就等于向全世界敞开,所以他们还开了 Twitter 账号。最近,TiDB 使用 Go 语言做的一个小成绩,被 Go 语言负责人 Russ Cox 转发,这让他们兴奋不已。

和华为同台争艳,这款中国“网红”开源软件火遍GitHub

图 | Go 语言负责人转推 PingCAP

如今,PingCAP 的 Twitter 下面,经常有国外开源贡献者留言。从当初创业的那条微博被很多人 Diss,到如今的枝繁叶茂,开源功不可没。

由于开源自带病毒传播特性,他们在几乎零市场成本的情况下,就已完成国内开发者社区的覆盖。

黄东旭曾撰文称:“开源软件,本质上是通过放弃一部分通过信息不对称产生的潜在利润,换取极其高效的传播和场景触及效率。”

PingCAP 从成立之初就选择的国际化的道路,对于启于本土的公司来说并不容易,但在开源的加持下,目前国际化进展非常好,在不同的国家都有头部的客户。

比如日本最大的支付公司 paypay,视频公司 U-Next, 越南的独角兽 VNG,以及支付公司 Zalopay, 印度的 zomato,BookMyShow,东南亚最大的电商 Shopee,法国最大的视频互联网公司 Dailymotion,还有美国和德国的用户等。

2020 年 5 月,PingCAP 上榜 CBI 中国企服数据库榜单。把一个别人不看好的孩子养大且养好,这让黄东旭颇为自豪。

而凭借开源,自 2018 年底至今,六成 TiDB 代码,已经发生改变,强大换血能力,来自全球四百多位开源贡献者手下。

一个来自韩国三星的贡献者 Jun-Seok Heo,曾帮助 TiDB 实现了一个重要功能,并大幅提升了具体场景下的性能。

而 TiDB 作为来自中国、并走向世界的“网红”开源软件,也印证着中国开发者将逐渐从追随国外、到引领世界的趋势。

如今,有国外开发者在 GitHub 上感慨,怎么中国人的项目越来越多?黄东旭的 TiDB 告诉我们,未来中国的开源项目只会更多。

因为,中国工程师一点也不比国外工程师差。

麻省理工科技评论

From Tech to Deeptech