专访 | 刘奇:几个不愿妥协的工程师探索心目中“完美”的数据库
9 月 12 日,分布式关系型数据库公司 PingCAP 宣布获得 C 轮 5000 万美元融资,据悉这是目前新型分布式关系型数据库领域的最大笔融资。该轮融资公布前,亿欧采访了创始人刘奇,本文将揭秘为何今日头条、饿了么以及摩拜等知名企业放弃知名产品当做数据库服务提供商,而是选择了 PingCAP 这家创新型的企业?
文/杨晓鹤 亿欧专栏作者
9 月 12 日,分布式关系型数据库公司 PingCAP 宣布获得 C 轮 5000 万美元融资,据悉这是目前新型分布式关系型数据库领域的最大笔融资。本轮融资由复星、晨兴资本领投,华创资本、云启资本、经纬中国等多家投资机构跟投,融资将主要用于技术研发和全球化生态建设。
PingCAP 成立于 2015 年,成立 3 年来相继获得经纬天使轮融资,A 轮获得云启资本的数百万美元融资,B 轮获得华创资本等机构 1500 万美元融资。
在 C 轮融资公布前 PingCAP 创始人刘奇接受了亿欧专访,揭秘今日头条、饿了么、摩拜等知名企业背后的数据库服务提供商,为何不是 Oracle、微软等世界知名企业的产品,而是选择了国内一家创新型企业——PingCAP。
刘奇 PingCAP 联合创始人兼 CEO
早年刘奇在京东任职的时候,就被数据存储行业两个难题困扰:一个是当时的缓存服务数据库不支持水平线性扩展;另一个是数据量越来越大,读写速度和吞吐受到很大挑战,没有一款数据库提供足够弹性的业务支撑能力。
在刘奇加入豌豆荚之后,在分布式缓存方面,刘奇写出了 Codis,并把它开源了出来,解决了第一个问题。第二个挑战是实现理想的分布式数据库,这件事是向数据库的最高峰发起挑战,很具有想象力。
那时心怀“Hacker”精神的刘奇决定出来创业,尽管这是一件 Oracle、Google 也正在探索的事业,刘奇同样意识到了这件事的难度。“其实初心也很简单,最开始只不过是几个不愿妥协的分布式系统工程师对心目中'完美'的数据库的探索。”刘奇这样轻描淡写当时的“野心”。
在分布式关系型数据库领域,目前市场上还没有一个公认的事实标准产品,给了 PingCAP 充分的发展空间。要知道 Google 其实是最大的数据库用户,一直在探索实现新型的分布式关系型(NewSQL)数据库。
Google 在 2012、2013 年分别发表了 Spanner 及 F1 的论文,F1 在 Google 内部正是用来替换 MySQL Sharding 方案的;到了 2014 年 Diego 关于 Raft 的博士论文发表,社区第一次可以绕开 Paxos 实现等价的工业级别的分布式一致性协议。两个重要事件为 PingCAP 的创造性发展打下了理论基础。
刘奇向亿欧介绍道,TiDB 作为新一代开源分布式关系型数据库实现了在线弹性伸缩,强一致性的分布式事务,以及基于 Raft 算法的多副本复制等重要特性。TiDB 是将 HTAP 这个概念从实验室和论文里带到现实的产品之一。
“在我们之前,很多人认为分布式 OLTP 和 OLAP 融合几乎是不可能的事情,”但是科技的进步让不可能成为可能,PingCAP 抓住了技术领域的正确方向,得以完善地解决了这个问题。
值得一提的是,TiDB 还具有区别国外同类型项目的优势。在全球分布式关系型数据库潮流中,TiDB 并不像 CockroachDB 那样选择将 SQL 和 KV 融合,而是像 Spanner 和 F1 一样选择分离。这样分层的思想也是贯穿整个 TiDB 项目始终,这个架构对于项目测试、滚动升级以及各层的复杂度控制会比较方便。
新型分布式关系型数据库,相比传统 SQL 和 NoSQL 一大特点是把 ACID 事务和扩展性相融合,适合数据大规模增长的科技创新型企业。“做 TiDB 的初衷并不是想要在小数据量下取代 MySQL,而是尝试去解决基于单机数据库解决不了的一些问题。”
因此 PingCAP 天生适合业务快速增长的公司,摩拜、腾讯、转转、美团、今日头条、饿了么、去哪儿、同程旅游、秒拍、美图、VIPKID 等都已经在使用 TiDB。
在 2017 年的时候,TiDB 在数据库行业发展的如火如荼。恰逢饿了么的归档环境存在前述问题,自然而然的就注意到了 TiDB。TiDB 可以简单地添加节点,提高集群整体的计算和存储能力。
目前,TiDB 产品的应用会影响饿了么全平台 80% 的流量,包括从用户选餐下单到订单配送整个饿了么流程。这半年的稳定运行,饿了么取得了非常良好的应用效果。
另一家应用 TiDB 的企业是摩拜,摩拜每天产生的骑行数据数十 TB,飞速增长的业务使摩拜面临数据库扩展与运维的挑战。摩拜应用 TiDB 来解决海量数据的在线存储、大规模实时数据分析和处理。
比如摩拜仅开关锁业务一年的量在数百亿,使用单机的 MySQL 库处理这个业务需要频繁的进行归档,在有限人力下会变成 IT 灾难。TiDB 可以灵活增减节点,保证不管摩拜业务量如何激增,业务需求如何变化,都可以很方便地升级支持。
TiDB 在饿了么、摩拜等企业中处理相关数据方面的良好变现,促使 PingCAP 获得了很多客户的亲睐。截止目前 TiDB 已有准生产测试(POC)用户 1400 余家,其中 300 余家企业已经将其应用在实际生产环境中,涉及互联网、游戏、银行、证券、保险、第三方支付、政府、电信、航空、制造业、新零售、快消等多个领域。
不论从产品技术、业务模式还是资本层面,PingCAP 都已经获得充分认可。应该说 PingCAP 正在成为数据库,甚至 B 端项目中的黑马,要知道过去国内数据库领域,鲜有能以此姿态出现的创业公司。刘奇总结 PingCAP 的发展,认为两个选择对 PingCAP 来说至关重要:
第一是选择开源
在刘奇看来,“单纯依靠一个团队开发力量并不能创造出完美的解决方案,开源的精神就是依靠社区的力量不断完善产品,而不是闭门造车。”
开源社区可以吸引来自各行各业的测试用户,带来丰富的测试场景,便于产品的品质保证和快速迭代;同时,开源社区为了保证产品的完整性,各个不同厂商或者个人开发者在开源软件上开发的新的功能,都会积极提交给原厂的主干分支,相当于开源在利用整个社区和生态的力量来加速产品的完善和成熟。
除了研发支持外,PingCAP 早期用户也都天然的来源于社区,早期的铁杆用户作为中立的成功案例非常具有说服力,很多技术负责人就是在社区了解到 TiDB,使得 PingCAP 在早期只有一个销售的情况下,依旧获得了足够多企业负责人或是 CTO 的关注,这对没有销售基因的 PingCAP 创始团队来说,简直是个福音。
第二是选择拥抱 MySQL 的生态
刘奇谈到选择拥抱 MySQL 的生态,对 PingCAP 来说是最贴近用户实际场景的选择。TiDB 选择了兼容 MySQL 的协议和语法,那么 MySQL 社区的 ORM 框架、运维工具,直接可以应用在 TiDB 上。
“现在回过头看来,兼容 MySQL 协议这件事可以说是团队做的非常慎重的一个判断”,刘奇认为这是 PingCAP 做的最重要的商业抉择之一。
因为一个新型数据库项目冷启动,让企业放心把核心业务数据存在你的产品上,十分不容易。现实是已经有大量企业的业务正在使用 MySQL,这些企业熟悉 MySQL 的语法、测试工具,兼容 MySQL 有助于企业业务数据平滑迁移到 TiDB 上,从而降低用户的迁移成本以及 PingCAP 的推广成本。
数据库一直被誉为数据处理皇冠上的明珠,尤其在1990年之后出现的开源数据库 MySQL 和 PostgreSQL 等产品,支撑起了 Oracle、IBM 等企业巨头的主要营收。如今情况正在悄悄改变,Google、AWS 等新型技术企业正在对传统数据库软件发起猛烈攻击,AWS 在 2014 年推出 Aurora 关系型数据库,Google 则开发出了 Cloud Spanner 等数据库。
国内除了早期阿里的 Cobar、TDDL、360 开源的 Atlas 等数据库中间件产品引起过关注外,数据库市场一直波澜不兴。然而随着云计算、大数据时代的来临,传统关系型数据库与 NoSQL 数据库在业务数据量激增的情况下,水平扩展、复杂业务逻辑的处理都不够好,国内迫切需要新型数据库满足他们的需求。分布式关系型数据库公司 PingCAP 适时出现,正在满足这些企业的需求。
能够满足市场广泛的痛点需求,也是很多知名资本多轮融资中持续跟进 PingCAP 的原因。
复星新技术与新经济产业集团副总裁丛永罡说:“在 PingCAP 持续 3 年的产品打磨和不断实践验证后,TiDB 成为早期将 HTAP 这个概念从实验室带到现实的产品之一。其 TiDB 开源项目获得业内认可,并已将国内大多数互联网独角兽企业揽为用户,也是业内高度认可的体现。”
晨兴资本副总裁刘凯表示:“一直以来,数据库领域都是产品研发能力和商业运营能力的最高级竞技场,PingCAP 持续深耕互联网领域客户,已成为规模互联网企业和金融企业的主流选择,晨兴愿与 PingCAP 共同打造开源软件生态。”
基于 PingCAP 是独立第三方开源数据库的属性,腾讯云、UCloud、京东云等云计算企业纷纷和 PingCAP 展开云数据库合作。据悉 PingCAP 在海外的公有云布局也在逐步落地当中。
从服务客户和合作企业的质量和数据来看,PingCAP 在短短 3 年时间发展确实足够快。未来深入垂直行业、传统企业提供数据库服务,将是 PingCAP 面临的重要考验。另外 PingCAP 也已经在硅谷设立了办公室,回到数据库的起源地竞争,也是 PingCAP 未来具有想象空间的挑战。
原文:https://m.iyiou.com/p/81123