Rancher 2.6 全新 Monitoring 快速入门

作者：微信小助手

发布时间：2022-06-23T00:17:06

作者简介

万绍远，CNCF 基金会官方认证 Kubernetes CKA&CKS 工程师，云原生解决方案架构师。对 ceph、Openstack、Kubernetes、prometheus 技术和其他云原生相关技术有较深入的研究。参与设计并实施过多个金融、保险、制造业等多个行业 IaaS 和 PaaS 平台设计和应用云原生改造指导。

软件	版本
Rancher	2.6.4
Kubernetes	1.22.7+rke2r2

概述

Rancher 2.6 监控启用方式与之前版本存在较大差异，属于原生的 Prometheus-Operator，通过抽象化一些 Kubernetes CRD 资源，可以更好地把监控告警功能整合起来，提高易用性。Prometheus-operator 包括以下 CRD 资源对象：

PrometheusRules：定义告警规则
Alert Managers：Altermanager 启动 CRD，用于 Altermanager 启动副本
Receivers：配置告警接收媒介 CRD
Routers：将告警规则和告警媒介进行匹配
ServiceMonitor：定义 Prometheus 采集的监控指标地址
Pod Monitor：更细粒化的对 POD 进行监控

配置使用

启用监控

切换到对应集群，选择左下角 clusterTools 启用 Prometheus：

部署到 System 项目中，勾选自定义 helm 参数：

根据实际需求修改部署要求：

如果需要对接远端存储（如 infuxdb），就需要修改 yaml 配置，并配置指向 influxdb：

 
  
  
  remoteRead:  - url: http://192.168.0.7:8086/api/v1/prom/read?db=prometheusremoteWrite:  - url: http://192.168.0.7:8086/api/v1/prom/write?db=prometheus

默认 node-exporter 资源 limit 配置较低，长时间运行后容易被 OOM KILL 掉，需要修改默认的内存限制为 150Mi：

 
  
  
   podLabels:    jobLabel: node-exporter  resources:    limits:      cpu: 200m      memory: 150Mi    requests:      cpu: 100m      memory: 30Mi

可以点击如�