Rancher 2.6 全新 Monitoring 快速入门

作者:微信小助手

发布时间:2022-06-23T00:17:06


作者简介

万绍远,CNCF 基金会官方认证 Kubernetes CKA&CKS 工程师,云原生解决方案架构师。对 ceph、Openstack、Kubernetes、prometheus 技术和其他云原生相关技术有较深入的研究。参与设计并实施过多个金融、保险、制造业等多个行业 IaaS 和 PaaS 平台设计和应用云原生改造指导。



软件 版本
Rancher 2.6.4
Kubernetes 1.22.7+rke2r2


概 述


Rancher 2.6 监控启用方式与之前版本存在较大差异,属于原生的 Prometheus-Operator,通过抽象化一些 Kubernetes CRD 资源,可以更好地把监控告警功能整合起来,提高易用性。Prometheus-operator 包括以下 CRD 资源对象:

  • PrometheusRules:定义告警规则
  • Alert Managers:Altermanager 启动 CRD,用于 Altermanager 启动副本
  • Receivers:配置告警接收媒介 CRD
  • Routers:将告警规则和告警媒介进行匹配
  • ServiceMonitor:定义 Prometheus 采集的监控指标地址
  • Pod Monitor:更细粒化的对 POD 进行监控


配置使用


启用监控

切换到对应集群,选择左下角 clusterTools 启用 Prometheus:



部署到 System 项目中,勾选自定义 helm 参数:



根据实际需求修改部署要求:





如果需要对接远端存储(如 infuxdb),就需要修改 yaml 配置,并配置指向 influxdb:
 
remoteRead:  - url: http://192.168.0.7:8086/api/v1/prom/read?db=prometheusremoteWrite:  - url: http://192.168.0.7:8086/api/v1/prom/write?db=prometheus

默认 node-exporter 资源 limit 配置较低,长时间运行后容易被 OOM KILL 掉,需要修改默认的内存限制为 150Mi:
 
 podLabels:    jobLabel: node-exporter  resources:    limits:      cpu: 200m      memory: 150Mi    requests:      cpu: 100m      memory: 30Mi

可以点击如�