“初雪”与“向量化”| StarRocks Hacker Meetup 小记
StarRocks Hacker Meetup 是 StarRocks 社区组织的面向开发者的线下活动,旨在通过面对面的交流帮助开发者深入了解 StarRocks 核心功能的实现原理,和开发者共同探讨数据库领域的前沿技术。
第一季 Hacker Meetup 共 4 期,将持续 2 个月,每两周探讨一个 StarRocks 的核心功能。欢迎大家持续关注。第二期 Hacker Meetup 将在 11 月 20 日与大家见面!
上周六,北京迎来了 2021 年的初雪。StarRocks 社区也迎来了第一期 Hacker Meetup:向量化编程的精髓。尽管雨雪交加,但开发者们热情不减,现场座无虚席。小伙伴们对这次的活动都感觉收获满满:
干货回顾
在本次 Meeup 上,康凯森同学深入浅出的从几个方面向大家介绍了数据库向量化编程的要点:
·How to build a fast database
如何构建一个性能卓越的数据库?凯森分别从预处理 VS 现场处理、架构、数据流、系统资源 4 个角度进行了回答。
·The basics of CPU vectorization
凯森用 Top-down 的性能分析方法介绍了影响 CPU 性能的关键点,然后介绍了 CPU 向量化的基本概念和 6 种向量化编程的方式。
·The key points of database vectorization
数据库的向量化不仅仅是 CPU 指令的向量化,而是一个巨大的性能优化工程。凯森首先介绍了数据库向量化的关键点:数据组织方式、算子和表达式的向量化,SIMD 如何加速 Filter、Agg 和 Join,然后通过具体实例介绍了数据库单核 CPU 性能优化的几个关键点:数据结构和算法、自适应策略、SIMD 优化、内存管理优化、C++Low
Level 优化和 CPU Cache 优化等,最后推荐了一些好用的性能优化工具。
·Thinking of StarRocks vectorization
凯森介绍了 StarRocks 向量化工程的一些思考和总结。
即使顶着风雪也要相见的开发者们,期待下次相聚!
下期预告
数据驱动的前提是能够快速、准确地获取和分析数据。为了满足业务日益增长的实时更新需求,StarRocks 重新设计并开发了存储引擎,在保持查询性能不受影响的前提下支持实时更新,并在单表简单查询下获得了 10 倍以上的性能提升。
下一期,将由 StarRocks 核心研发、Apache Kudu PMC 常冰琳带来【列式存储中实时更新与查询性能如何兼得】。本次 Meetup,冰琳会详细解读 StarRocks 2.0 版本中最新发布的实时更新引擎,快快扫描下方海报二维码报名,一起来一探究竟吧!
时间:2021 年 11 月 20 日 14:00-17:00
地点:拓荒族三层(中关村创业大街 10 号楼)
演讲嘉宾:常冰琳(StarRocks 核心研发,Apache Kudu PMC)
* 受疫情影响的原因,本次 Meetup 入场券有限,先到先得。社区将会审核您的报名信息,StarRocks 项目的 Contributor 拥有优先通过权,请以报名成功的短信通知为准。
这个冬天,让 StarRocks 陪你尽数领略技术之美!
2022-05-06 14:05:28