刘奇:开源是 PingCAP 不会撕下来的标签

2020-11-17
优秀的企业长什么样,成功的牛人都有哪些特质?

编者按:本文来自微信公众号华创资本(ID: ChinaGrowthCapital),创业邦经授权转载。

优秀的企业长什么样,成功的牛人都有哪些特质?在他们的奋斗路上,有哪些需要注意的“坑”,最重要的改变是什么?

创·问向一些优秀的华创派、投资人、业界牛人抛出问题,也希望分享他们的想法给你。

本期主角是 PingCAP 创始人 兼 CEO 刘奇,就在今天,PingCAP 宣布完成 2.7 亿美元的 D 轮融资,这也创造了全球数据库历史新的里程碑。

作为一家企业级开源分布式数据库厂商,PingCAP 为全球行业用户提供稳定高效、安全可靠、开放兼容的新型数据基础设施,解放企业生产力,加速企业数字化转型升级。

本文中,刘奇独家分享了他心中 PingCAP 的发展秘籍,在他看来,开源是 PingCAP 不断高速成长并实现愿景的源动力,“坚持一直做开源,最后会变成 PingCAP 的一个标签,变成一个根本不可能撕下来的标签,这就是所谓的真正的战略。”

全文分享如下:

Q: 华创资本

A: PingCAP 创始人 兼 CEO 刘奇

本文约4300字,建议阅读时间12分钟

01

关于创业

Q1:PingCAP 成立已经五年了,如何理解技术发展变化与市场需求变化与 PingCAP 当时创业 timing 选择的关系?

刘奇:以往,行业内可供选择的数据库方案只有两种——传统关系型数据库与 NoSQL 数据库:

-传统关系型数据库在面对企业业务数据量激增的情况下的扩展问题,对企业 DBA 团队是个极大的挑战甚至折磨;

-NoSQL 虽然解决了水平扩展的问题,但其无法处理交易类数据及复杂的业务逻辑的特性,对于金融、电信、电力等行业极不友好。

当时行业内没有一款完美的数据库解决方案,我们三个人在创业之前,对于数据存储行业的痛点就有着切肤之痛,我们创业的梦想就是打造一款能够从根本上解决行业问题的数据库方案。

与此同时,学术界也有一些突破性进展:Google 在 2012 发表的 Spanner 及 F1 的论文,F1 在 Google 内部正是用来替换 MySQL Sharding 方案的;到了 2014 年 Deigo 关于 Raft 的博士论文发表,社区第一次可以绕开 Paxos 实现等价的工业级别的分布式一致性协议。

至此整个理论基本齐备了,具体设计也想得差不多了,于是我们三个人一起在 2015 年成立了 PingCAP,国内第一家开源的新型分布式关系型数据库公司,通过研发分布式关系型数据库 TiDB,让基础软件不再成为企业业务发展的桎梏。

Q2:PingCAP 是如何吸引到海外顶级工程师加入团队的?

刘奇:我们大多数的团队成员基本都有丰富的互联网基础架构大数据、以及开源的一些经验,我们使用的编程语言是 Rust,2017年 4 月,Rust 语言核心开发团队的几位成员就来参加我们举办的社区专场 Meetup,与近百位中国 Rust 社区成员进行了深度的技术分享和交流互动。后来,Rust 核心团队里的 Brian Anderson、Nick Carmeron先后加入了我们,我们应该是中国第一个把自己在用的编程语言的作者团队之一的人撬到自己团队的公司。还包括 Haskell 编程语言社区知名开发者 Greg Weber 等等,有不少海外顶级技术产品大牛加入 PingCAP。

我们认为,PingCAP 作为一个比较年轻,同时是一个专注新一代分布式和分布式存储的技术团队,和顶级工程师是一种互相吸引的关系。

Q3:PingCAP的愿景是什么?这个愿景在创业过程中有过迭代吗?

刘奇:从创业第一天我们的愿景就是要做“全球 database 领域最好的数据库”,这个愿景从来没有改变。

02

关于商业化及融资

Q4:PingCAP 成立已经五年了,如何理解技术发展变化与市场需求变化与 PingCAP 当时创业 timing 选择的关系?

刘奇:有句话“不要浪费每一场危机”,我觉得这个其实还是蛮贴切的。今年大家可以看到可能有很多公司发展遇到了一些困难,但像今年比较猛的在线教育,感觉今年一年的发展速度远远超越以往七、八年的发展。类似所有现在看起来在数字化这块比较成功的公司或者说他天生就是一个数字化的公司,比如互联网公司,因为是完全线上的业务所以受到疫情的影响很小,另一方面因为线下实体经营的业务很少,受到的影响也很小,因此整体发展的速度显得比较快。PingCAP 也是在这种情况下得到了很多客户的支持,这些客户基本上也是线上做的特别好的公司。像美团,规模一直在持续的扩大;日本排名第一的支付公司 PayPay ,也是在疫情期间,业务量一直在往上涨;美国我们的客户Square,应该是金融领域在线支付领域的第二名,也是高速增长的。

换一个角度看,能看到一部分确实是今年压力非常大的公司,也能看到另外一部分在高速增长的公司。实际上,在高速增长的公司对于 TiDB 的需求比较大,这个可能是我们在今年实现高速发展的一个原因。另外还有一点,在国内可能确实大家以前没怎么见过,就是一个发源于中国的公司,起家于中国的公司,最后在日本、美国、新加坡能够拿到当地最头部的客户,能打赢全球最强的竞争对手,这可能是大家之前没怎么见过的,这类 To B 的公司,在基础软件领域。这可能是现在我们比较受到客户和投资方青睐的原因。

Q5:PingCAP的这轮融资创造了全世界数据库领域最大金额融资,这对公司和这个行业意味着什么?

刘奇:这其实是一个定位的问题。以前很多中国 To B 公司的定位就是做中国的 To B,做中国某一个细分领域的前几名,PingCAP 在这里面有一个机会是要做全球 database 领域最好的数据库,也是这样一个机会让一些投资方发现了我们,更关注我们。

事实上过去几年我们也会讲全球化是基础软件的出路,因为软件天然有一个特点,它复制成本很低,传播成本很低,相对于其他集装箱货物来说,可以很快地到达全世界。但是,前提是整个东西的易用性要很强,能够让大家快速用起来。

与此同时,过去几年也发生了一些变化,使我们的全球化路径变为可能——那就是云的普及。如果没有云的普及,在今天一个美国的公司、一个日本的公司、一个新加坡的公司、一个欧洲的公司说我要用你的软件,虽然很容易下载,但是我还需要做部署,部署的成本,中间各种各样的环境适配花费的成本比较高,这是第一。第二我还是要人做本地化的服务支持,这个成本也会非常高,对于全球的复制和扩张来说,代价很大,效率也比较低,云普及的好处就是所有的(应用)都在云上,可能用户提供系统的部分日志,我们的工程师就知道这个问题怎么去解决 ,甚至可以给很精确的命令帮助用户来快速解决问题。如果是像传统的基于U盘的一个物理拷贝,必须要人工的去现场做支持,这个成本就非常高了,基于云提供的服务在效率上面取得了巨大的进步。

现在投资人都看到了这一点,因为今年大家看到我们确实在全球不同的地方,头部的客户的突破,PingCAP 成为一家全球化的公司去服务全球的行业客户,去使用全球化的人才,一起去建立全球化的社区,这是这一轮投资人为什么愿意投资我们,为什么看好我们的原因。

03

关于产品技术

Q6:TiDB 的产品和技术领先性体现在哪些方面?

刘奇:首先其实 TiDB 核心的设计理念,我们的定位其实是一个 HTAP 型的数据库。首先它100% 是一个 OLTP 数据库,但现在大家知道,传统的数据库领域其实很难去调和分布式加上金融级别的可靠性、高性能,再加上分布式 SQL 的能力,所以其实我们用了很多领先的技术去把这几个看似不可能的功能融合在一起。第二,随着用户越来越多,渐渐地观察到很多用户不仅是在把 TiDB 当做一个纯的 OLTP 业务在使用,同时有很多业务层做实时分析的需求,这两年我们通过 TiFlash 这样的技术去打通了 OLTP 跟 OLAP 之间的边界,同时也在 VLDB 学术会议上发表了论文。所以,我们其实在 HTAP 数据库方面做出了理论和应用上的创新,TiDB 也是这一系列创新下的产物。

Q7:TiDB作为引领新一代实时 HTAP 数据库解决方案,对于企业客户意味着什么?

刘奇:HTAP 对于圈外的朋友来说可能是一个新的词,但是背后代表的一个数据库的产品的一种新的方向。我们过去经常对于传统的数据库有两个分类,一类是 OLTP 数据库,偏向于在线交易,比如银行转账,后台提供服务的是在线交易型数据库,而 OLAP 是偏向数据分析型的数据库,可以关联一些数据做分析,从中获取商业洞察。TiDB 的目标是希望能设计一种新的模型去打破这两者之间的界限,现在发生在行业用户里面的趋势就是 OLTP 的业务,比如一些在线交易的场景越来越需要提供实时的商业洞察,使得本身两种不同的工作负载之间的边界越来越模糊。这是由于行业用户对于业务的实时性要求变得越来越高导致的,过去一些方案就是必须得把数据库的数据都搬到 Hadoop 或者类似的大数据处理平台上,这个搬的过程其实是非常痛苦的,所以 TiDB 希望成为一个一体化的平台,能够同时服务 OLTP 与 OLAP 的业务场景。

做一个不太恰当的类比,可能我们 10 年前在使用手机的时候用诺基亚,传统手机就是打电话,拍照就用佳能数码相机。在过去这个时代,大家发现一张照片传到手机上很困难,还要拷来拷去,但现在想想平时拍照,百分之八九十的场景都是一台智能手机就搞定了,我觉得 TiDB 在做的事情类比过来就是:我们希望做大数据和基础架构这个时代的 iPhone。

04

关于开源软件及开源社区

Q8:怎样理解开源软件与商业软件之间的矛盾与协同?

刘奇:“你有哪些特性能够让用户愿意从开源版本转为企业版本”,这个问题几乎所有做开源的同学都会被问到。我发现这个问题很有意思,因为几乎每个人都会这么想。但是大家这么想的依据是什么,我们基本上很难找到一个真正的、非常成功的案例是用这种方法实现的,但是几乎每个人都会这么想:开源产品必须要有一个开源版本里没有的企业级特性,这个特性是吸引用户从开源版本转到企业版本的原因。事实上,我们很难找到一个成功的案例:Linux 领域里面有一些开源商业化比较成功的例子,但是 Red Hat 企业版的功能特性比开源版要少,用户并不是觉得企业版有开源版没有的功能特性,所以才转过来,相反企业版本提供给用户的是稳定性,企业版是经过了很多的测试和场景验证,保留了最稳定的功能特性,所以它不是一个加法,而是一个减法。

另外一个很重要的要素就是 Kubernetes 的普及和云的普及。在整个未来 PingCAP的规划里面,我们绝大部分营收都会来自于提供云数据库服务。特别是在五年之后,我们相信五年之后云会更加普及,更加大众化。不管是公有云、私有云或者是混合云,TiDB 在架构层面是可以跨各种云进行部署和提供服务,并且与 Kubernetes 无缝兼容,这是TiDB 相较于其他数据库产品有差异化特点的地方。

Q9:运营一个活跃且让贡献者和使用者都感到自豪的开源社区的成功关键是什么?

刘奇:这是很好的问题,简单回答就是一条:那就是选择把开源作为战略还是战术?这是根本的差别。如果把开源当成一个战术那可能只能使用一次,但如果将开源作为战略就要长期坚持下去,而且持续很多年。PingCAP的发展战略就是拥抱开源,我们坚定的认为开源是当前全球化背景下基础软件在全球范围取得成功的最优路径。在硅谷,从金融巨头、IT 软件乃至政府、服务公司,都围绕基于开源社区的技术打造核心业务。

如果你选择开源作为战略,意味着所有与开源有冲突的都需要为开源让路。首先就是投入,PingCAP 在成立的前三年是没有营收的,在华创资本领投 B 轮时我们是没有收入的,但我们依然坚持不懈地在开源社区投入。因为我们认为单纯依靠一个团队开发力量并不能创造出完美的解决方案,一个好的产品应该敢于将自己的代码开放出来,不闭门造车,及时和社区沟通、交流,让整个社区参与进来。截止 2020 年 10 月 TiDB 项目在 GitHub 上共计获得超过 25000 Star,集合了近 1200 位贡献者,这就是我们长期投入开源社区的收获。坚持一直做开源,最后会变成 PingCAP 的一个标签,变成一个根本不可能撕下来的标签,这就是所谓的真正的战略。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。