ClickHouse 教程
ClickHouse 是开源的列式 OLAP 数据库,专为海量数据实时分析而设计,具备极高的查询性能和数据压缩比。本教程共 28 章,从安装部署到生产实战,全面掌握 ClickHouse。
🟢 基础入门(第 1-10 章)
| 章节 | 标题 | 难度 |
|---|---|---|
| 01 | ClickHouse 简介与架构 | 🟢 |
| 02 | 安装与部署 | 🟢 |
| 03 | 数据类型详解 | 🟢 |
| 04 | 表引擎:MergeTree 家族 | 🟢 |
| 05 | SQL 基础(SELECT/INSERT) | 🟢 |
| 06 | 分区与排序键设计 | 🟡 |
| 07 | 索引系统(主键/跳数索引) | 🟡 |
| 08 | 数据压缩与编码 | 🟡 |
| 09 | 数据导入(CSV/JSON/Parquet) | 🟢 |
| 10 | 集合函数与窗口函数 | 🟡 |
🟡 进阶开发(第 11-18 章)
| 章节 | 标题 | 难度 |
|---|---|---|
| 11 | 表引擎深入(Replacing/Summing/Aggregating) | 🟡 |
| 12 | JOIN 详解 | 🟡 |
| 13 | 物化视图与投影 | 🟡 |
| 14 | 数据库引擎(Atomic/Memory/Lazy) | 🟡 |
| 15 | 分布式表与集群 | 🔴 |
| 16 | 副本与数据一致性 | 🔴 |
| 17 | 数据 TTL 与生命周期管理 | 🟡 |
| 18 | 事务与并发控制 | 🔴 |
🔴 高级运维与实战(第 19-28 章)
| 章节 | 标题 | 难度 |
|---|---|---|
| 19 | 性能优化与调优 | 🔴 |
| 20 | 查询分析(EXPLAIN/Query Log) | 🟡 |
| 21 | 用户权限与安全 | 🟡 |
| 22 | 监控与告警(Prometheus/Grafana) | 🟡 |
| 23 | 备份与恢复 | 🟡 |
| 24 | ClickHouse 与 Kafka 实时导入 | 🔴 |
| 25 | ClickHouse 与数据湖(S3/HDFS) | 🔴 |
| 26 | ClickHouse Keeper(替代 ZooKeeper) | 🔴 |
| 27 | Docker/Kubernetes 部署 | 🟡 |
| 28 | 实战:构建实时分析平台 | 🔴 |
核心特性速查
| 特性 | 说明 |
|---|---|
| 列式存储 | 按列存储,高压缩比,OLAP 查询极快 |
| 向量化执行 | SIMD 指令加速,CPU 利用率高 |
| MergeTree 引擎 | 核心引擎,支持分区/排序/索引/TTL |
| 数据压缩 | LZ4/ZSTD,默认压缩比 10:1 以上 |
| 分布式查询 | 分片+副本,支持分布式 JOIN |
| 实时写入 | 支持高吞吐实时写入(百万行/秒) |
| SQL 兼容 | 类 SQL 语法,支持 JOIN/子查询/窗口函数 |