强曰为道

与天地相似,故不违。知周乎万物,而道济天下,故不过。旁行而不流,乐天知命,故不忧.
文档目录

Prometheus 完全指南

Prometheus 完全指南

从零开始掌握云原生时代最主流的监控系统

前言

Prometheus 是由 SoundCloud 于 2012 年发起的开源监控系统,2016 年加入 CNCF(Cloud Native Computing Foundation),成为继 Kubernetes 之后第二个毕业项目。如今,它已成为云原生生态中事实上的监控标准。

本教程共 18 章,从基础概念到生产实践,涵盖安装部署、数据模型、查询语言、告警管理、长期存储、可视化集成等全方位内容。适合运维工程师、SRE、后端开发人员系统学习。

目录

章节标题简介
01Prometheus 简介历史背景、Pull vs Push 模型、适用场景
02安装与部署二进制安装、Docker 部署、配置文件详解
03架构与原理TSDB 存储引擎、抓取模型、服务发现
04指标类型Counter、Gauge、Histogram、Summary
05PromQL 基础选择器、运算符、聚合函数
06PromQL 进阶子查询、预测函数、录制规则
07告警管理Alertmanager、路由、抑制、静默
08告警规则编写规则语法、模板、常见告警示例
09录制规则预聚合、性能优化
10服务发现静态配置、Consul、Kubernetes、DNS
11Exporter 生态Node、MySQL、Redis、Blackbox、自定义
12Pushgateway短期任务、批处理监控
13联邦集群跨集群聚合、分层架构
14Thanos长期存储、全局查询、降采样
15容器化部署Docker Compose、Kubernetes 部署
16Grafana 集成数据源配置、Dashboard、告警
17故障排查常见问题、TSDB 排查、性能调优
18最佳实践指标命名、标签设计、容量规划

学习路线建议

入门: 01 → 02 → 03 → 04 → 05
进阶: 06 → 07 → 08 → 09 → 10 → 11
实战: 12 → 13 → 14 → 15 → 16
运维: 17 → 18

环境要求

组件最低版本推荐版本
Prometheus2.40+2.52+
Go(自编译)1.20+1.22+
Docker20.10+25.0+
Kubernetes1.25+1.29+
Grafana9.0+10.4+

参考资源