如果你喜欢MatrixOne,请在Github上为它点亮⭐️吧!

数据库资深“学霸”再启程,专访数据库初创公司矩阵起源全球 CTO 田丰博士

师出门,工业界履历从大厂首席工程师到创业公司 CTO,并能一直从事底层系统的核心研发工作,可能是很多优秀技术人向往的光鲜履历。不过抛弃大厂的光鲜稳定工作和成功的创业项目,再次加入初创公司,则需要比常人更大的魄力和勇气。

过去几年间技术发展进程中,许多新数据库诞生并打开市场,现在,数据库呈现了爆发式增长,CSDN 的《新程序员》杂志第二期也做了主题为“新数据库时代”的系列专题报道。最近,师从数据库元老级前辈 David DeWitt 的田丰博士,宣布正式加入了刚刚成立一年多的数据库初创公司矩阵起源任 Global CTO,CSDN 专访了田丰博士,让我们一同了解他对于数据库与技术人生的思考与选择。


Part.01


资深“学霸”之路:师从数据库元老,

SIGMOD十年间影响最深远 paper   


从中科大到加州大学圣地亚哥分校,一直从事数学专业研究的田丰博士,因为导师投身工业界(加入微软)的启发,从数学“改行”到计算机,跟随威斯康星大学数据库前辈 David DeWitt 做非结构化与并行数据库的研究。博士期间,田丰博士从事的是在 XML 格式数据库上做非结构化查询、流处理、并行化的研究,多篇论文入选数据库领域国际顶级会议 SIGMOD、VLDB。

Image


田丰博士

在 2000 年田丰博士与团队发表了一篇重要的论文,这篇论文中的核心思路,是第一次设计了查询与数据的“翻转”,即让用户查询变为数据,数据流变为查询动作,在这个基础上去提升数据查询的性能,以及定义查询、抽取、记录等流数据中的变化。这个思路影响了后来很多流数据处理系统的设计思路,甚至在 2010 年被 SIGMOD 评为了上一个十年对工业界影响最大的一篇论文。

一转眼 20 多年过去,回顾自己学术研究中最大的收获,田丰博士表示,在他转去数据库领域研究时,他的导师 David DeWitt 那时已经功成名就,但这些前辈们仍然对最前沿的技术与新生事物保持着非常高的热情,并持续钻研,对他也产生了深远的影响。不过同时,团队的科研是务实的,所有工作都会反映到工业界实践中,在实际系统有没有产生影响与价值,也是研究生毕业的一个重要考量。

当然,研究中田丰博士要面临和解决太多工程上很艰难的问题,他的经验是做好充分的前期理论和调研,明确最重要和绕不开的问题,然后咬牙坚持做下去,以解决科研与工作中客户的难题。博士毕业后,田丰博士历任微软/Greenplum/VMware Aurora/Snowflake 首席工程师,以及原 Vitesse Data 创始人兼 CTO,推出了业界最快最稳定的 Greenplum——Deepgreen DB。


Part.02


重新启程数据库下一站,

打造 AP、TP、流与异构基础设施的“超融合”   


在每一段工作中,田丰博士都是与数据打交道,并且是数据在各类不同系统的应用,如数据库索引 index、虚拟化和云上数据管理等等。从 IBM 事务型数据分析开始,再到数据增多,田丰博士的导师 David DeWitt 开创了并行分析型的数据库,企业的数据被割裂为了事务处理(TP)与自我分析(AP)两部分各自为战。云计算与 IoT 兴起之后,企业需要在流数据上实时的处理与分析,以往 TP 与 AP 数据库的时延,已经无法满足实时性需求。

以往工作中田丰博士已经接触和看到 TP、AP、流数据各类系统,在客户使用中存在着各自的问题,现在多个系统揉合到一起,客户的痛点不仅没有消失,反而会更明显。所以,矩阵起源提供的超融合数据系统,希望统一实现 AP、TP、流等不同类型数据和支持不同异构基础设施的应用,保证性能与简便管理。矩阵起源想做的事情吸引了田丰博士,在和矩阵起源技术团队充分交流后,田丰博士最终决定加入。

虽然提供给客户的是统一和易用的系统,但超融合数据系统内部研发的复杂性极高。矩阵起源所做的超融合引擎、异构云原生、极致性能,每一场都是硬仗。现在的 0.2 版本中,通过计算层的向量化执行引擎和因子化加速模型等技术突破,性能测试(如 SSB,Star Schema Benchmark)已经表现优异。田丰博士表示,今年团队将首先重点研发分布式系统上的 AP 与 TP 融合数据库,具备安全与重要性能,能够满足大多数客户的通用场景和重要工作负载。

Image


成为 CTO,田丰博士仍然不会脱离技术和 code,他表示现在每周保留 10-15%的工作时间用于写代码。田丰博士也向 CSDN 的读者推荐了 Jim Gray《事务处理》(《Transaction Processing ——Concepts and Techniques》),虽然这是数据库领域的经典读物之一,对于不从事数据库研发的读者来说读起来会很痛苦,但是田丰博士仍然向开发者推荐本书的前三章,Jim Gray从很高的角度阐述了整个计算机系统性能与稳定性,以及系统出错的原因,其中硬件、人为操作失败的占比。前三章充满故事性与易读性,适合所有开发者去了解学习。

从 2020 年 1024 程序员节与《新程序员》杂志开始,CSDN 持续关注了中国底层软件与系统的发展与崛起。现在,从事数据库研发 20 年的资深技术老兵田丰博士加入优秀的初创公司矩阵起源,是值得欣喜的事。让我们共同期待更多的优秀技术人与公司能够在底层软件扎实研发,持续创新,CSDN 也将持续关注与报道。

                         

官网

matrixorigin.cn

源码

github.com/matrixorigin/matrixone

Slack

matrixoneworkspace.slack.com

Image

扫码加入MatrixOne技术交流群