✦
✦
滴滴滴~ MatrixOne今年再次参与由中科院软件所“开源软件供应链点亮计划”发起的开源之夏啦!
希望这个夏天,MatrixOne 能陪伴同学们一起参与开源软件的开发维护,培养和发掘出更多的优秀在校开发者,也希望能吸引更多同学陪伴我们一同成长~
加入MatrixOne开源项目,您可以深入了解数据库产品架构知识,近距离学习如何从零打造数据库软件,更有机会与MO技术大牛一起并肩作战,共同开发一个数据库模块,成为社区的核心贡献者!
↑↑↑
加入MatrixOne社区开源之夏沟通群,
一起交流探讨~
开源之夏MatrixOne项目主页: https://summer-ospp.ac.cn/org/orgdetail/b4dd2fe5-5dd5-4d2e-b46b-26db21c8a01d?lang=zh Github项目仓库: https://github.com/matrixorigin/matrixone 或点击文末“阅读原文”,一键直达 ▌MatrixOne项目介绍 在2023开源之夏活动中,我们准备了3个项目。成功通关结项的同学可以获得奖金与荣誉证书,同时也有可能掉落工作机会哦~
项目01 将 Python 嵌入到 MatrixOne 数据库中,使 Python 能够与数据库执行引擎通信,从而实现在数据库中使用ML/AI。Python 将在容器/沙箱中运行,以实现安全性和资源管理。 Python 工作负载将成为 MatrixOne 数据库的一等公民,这意味着查询优化器/执行器将像关系型数据库操作符一样优化/调度 Python,在并行/分布式环境中运行。 *Bonus:如果能够创建开发环境,使开发人员能够在 VSCode 中编码/调试,并且一键部署在TB级数据的数据库中,则会获得额外加分。 项目难度:进阶 产出要求: 实现定义和管理 Python UDF 的 SQL 语法; 实现在沙箱中安全地执行 Python UDF; (Bonus) 支持在 IDE 中调试和部署 Python UDF。 技术要求: 熟悉 Golang 和 Python; 了解容器技术。 导师信息: 吴叶磊 📫:wuyelei@matrixorigin.cn 申请链接: https://summer-ospp.ac.cn/org/prodetail/23b4d0427
项目02 基于当前业界混沌测试相关的理论以及相关开源工具,实现基于分布式系统的混沌测试自动化能力,主要包括如下核心模块和能力: 故障注入模块,基于开源或定制开发的故障注入工具,可实现基于配置策略,自动向被测系统进行故障/错误注入,故障/错误恢复以及详细的持久化日志记录。 执行器模块,提供一些列标准的接口或配置等,实现一个统一的执行器可执行、监控各种异构的测试工具和测试场景。 结果分析模块,对故障注入/恢复数据、测试场景执行过程和结果数据进行分析并进行可视化展示。 项目难度:基础 产出要求: 项目成果至少满足可执行分布式MO的混沌测试,其他分布式系统可暂不做强要求; 详细的使用/实施文档,包括环境配置要求、详细安装/部署/配置手册等。 技术要求: 编程能力不限制,熟悉go/java/python任意即可,最好熟悉go编程; 了解容器云相关技术栈,如k8s、docker等。 导师信息: 苏动 📫:sudong@matrixorigin.cn 申请链接: https://summer-ospp.ac.cn/org/prodetail/23b4d0428
项目03 设计并实现GIS、时间序列的数据存储格式及核心函数(这些功能后续将被集成到一个流式数据框架中)。要求存储格式能支持非常高的流量;能够加载数千条(或更多)的输入数据流;支持高效的查询技术(例如 GIS 中的距离和交集,以及时间序列数据的流算法);能基于流数据开发高级在线草图算法。 项目难度:进阶 产出要求: 研究和学习:鼓励参与学生研究和学习现有的GIS和时间序列数据格式、存储系统和查询技术。这将帮助他们了解当前的技术水平,并找到可以改进的领域。 设计存储格式:一同设计一个可以高效处理大量GIS和时间序列数据的存储格式。该格式应在存储空间和查询性能方面进行优化。 实现查询技术(取决于进度):帮助参与学生开发GIS和时间序列数据的高效查询技术。这可能涉及实现距离和交集计算的算法,以及时间序列数据的流式算法。 测试和评估:协助参与学生测试和评估存储格式和查询技术的性能。这可能涉及与现有解决方案进行基准测试,并找到改进的领域。 文档编写:鼓励参与学生记录他们的工作,包括存储格式的设计、实现的查询技术和开发的草图算法。这将使其他人更容易理解和基于他们的工作进行构建。 技术要求: 熟悉 Golang; 最好熟悉流计算和time-series data。 导师信息: 岳远源 📫:gyue@outlook.com 申请链接: https://summer-ospp.ac.cn/org/prodetail/23b4d0456 ▌MatrixOne社区介绍 MatrixOne是一款面向未来的超融合异构云原生数据库管理系统。通过全新设计和研发的统一分布式数据库引擎,能够同时灵活支持OLTP、OLAP、 Streaming等不同工作负载的数据管理和应用,用户可以在公有云、自建数据中心和边缘节点上无缝部署和运行。