Docker 容器监控Cadvisor+Prometheus+Grafana

网友投稿 624 2022-11-02


Docker 容器监控Cadvisor+Prometheus+Grafana

监控系统概述

cAdvisor (Container Advisor) :用于收集正在运行的容器资源使用和性能信息。​​stats的问题(存储、展示),谷歌开源的cadvisor诞生了,cadvisor不仅可以搜集一台机器上所有运行的容器信息,还提供基础查询界面和+ Prometheus + grafna搭配使用。

cAdvisor可以对节点机器上的资源及容器进行实时监控和性能数据采集,包括CPU使用情况、内存使用情况、网络吞吐量及文件系统使用情况

Cadvisor使用Go语言开发,利用Linux的cgroups获取容器的资源使用信息,在K8S中集成在Kubelet里作为默认启动项,官方标配。

谷歌开发的容器资源采集信息,cadvisor也用到了k8s当中,采集pod容器信息。

运行cadvisor以docker容器的方式运行,运行起来就可以通过ip 端口进行访问了

docker run -d \--volume=/:/rootfs:ro \--volume=/var/run:/var/run:ro \--volume=/sys:/sys:ro \--volume=/var/lib/docker/:/var/lib/docker:ro \--volume=/dev/disk/:/dev/disk:ro \--publish=8080:8080 \--detach=true \--name=cadvisor \google/cadvisor:latest

Cadviosr是Google用来监测单节点的资源信息的监控工具。虽然Docker提供了一些CLI的命令行的功能,但是在一个看图的时代,基本的功能是很难满足人民群众日益增长的物质文化需求,Cadvisor提供了一目了然的单节点多容器的资源监控功能。Google的Kubernetes中也缺省地将其作为单节点的资源监控工具,各个节点缺省会被安装上Cadvisor。在免费的世界里,Cadvisor作为一个很不错的工具,越来越多的引起很多人过渡性的关注。

安装

使用二进制部署

下载二进制: -port=8080 &>>/var/log/cadvisor.log

使用docker部署

docker run -d \--volume=/:/rootfs:ro \--volume=/var/run:/var/run:ro \--volume=/sys:/sys:ro \--volume=/var/lib/docker/:/var/lib/docker:ro \--volume=/dev/disk/:/dev/disk:ro \--publish=8080:8080 \--detach=true \--name=cadvisor \google/cadvisor:latest[root@localhost ~]# docker psCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMESafd8196a70d8 google/cadvisor:latest "/usr/bin/cadvisor -…" 4 minutes ago Up 4 minutes 0.0.0.0:8080->8080/tcp 注意:在Ret Hat,CentOS, Fedora 等发行版上需要传递如下参数,因为 SELinux 加强了安全策略:--privileged=true 启动后访问:的主要功能,总结起来主要两点:

展示 Host 和容器两个层次的监控数据展示历史变化数据

由于 cAdvisor 提供的操作界面略显简陋,而且需要在不同页面之间跳转,并且只能监控一个 host,这不免会让人质疑它的实用性。但 cAdvisor 的一个亮点是它可以将监控到的数据导出给第三方工具,由这些工具进一步加工处理。

我们可以把 cAdvisor 定位为一个监控数据收集器,收集和导出数据是它的强项,而非展示数据。

下图为cAdvisor的web界面,数据实时刷新但是不能存储。

Docker container详细信息

整体使用状况

CPU详细状况

内存详细状况

Network

FileSystem和Subcontainer

Cad实际上暴露的普罗米修斯的指标,也就是要被普罗米修斯监控,那么暴露出来的指标要符合普罗米修斯的指标格式,下面是要搭建监控系统,普罗米修斯在任何机器部署也行,主要能够从advisor里面获取数据即可

可以看到这就是cad暴露的指标,这些指标可以被普罗米修斯识别认可的。如果时其他格式就识别不了不能存储,这些指标由指标名称和标签,也就是key value的形式体现的。标签越多监控的维度越多。

Prometheus(普罗米修斯)

随着容器技术的迅速发展,Kubernetes 已然成为大家追捧的容器集群管理系统。Prometheus 作为生态圈 Cloud Native Computing Foundation(简称:CNCF)中的重要一员,其活跃度仅次于 Kubernetes, 现已广泛用于 Kubernetes 集群的监控系统中。Prometheus 简介 Prometheus 是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,由工作在 SoundCloud 的 google 前员工在 2012 年创建,作为社区开源项目进行开发,并于 2015 年正式发布。2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。 作为新一代的监控框架,Prometheus 具有以下特点:     强大的多维度数据模型:

时间序列数据通过 metric 名和键值对来区分。所有的 metrics 都可以设置任意的多维标签。数据模型更随意,不需要刻意设置为以点分隔的字符串。可以对数据模型进行聚合,切割和切片操作。支持双精度浮点类型,标签可以设为全 unicode。

灵活而强大的查询语句(PromQL):在同一个查询语句,可以对多个 metrics 进行乘法、加法、连接、取分数位等操作。     易于管理: Prometheus server 是一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。     高效:平均每个采样点仅占 3.5 bytes,且一个 Prometheus server 可以处理数百万的 metrics。     使用 pull 模式采集时间序列数据,这样不仅有利于本机测试而且可以避免有问题的服务器推送坏的 metrics。     可以采用 push gateway 的方式把时间序列数据推送至 Prometheus server 端。     可以通过服务发现或者静态配置去获取监控的 targets。     有多种可视化图形界面。     易于伸缩。 需要指出的是,由于数据采集可能会有丢失,所以 Prometheus 不适用对采集数据要 100% 准确的情形。但如果用于记录时间序列数据,Prometheus 具有很大的查询优势,此外,Prometheus 适用于微服务的体系架构 Prometheus 组成及架构 Prometheus 生态圈中包含了多个组件,其中许多组件是可选的:

Prometheus Server: 用于收集和存储时间序列数据。Client Library: 客户端库,为需要监控的服务生成相应的 metrics 并暴露给 Prometheus server。当 Prometheus server 来 pull 时,直接返回实时状态的 metrics。Push Gateway: 主要用于短期的 jobs。由于这类 jobs 存在时间较短,可能在 Prometheus 来 pull 之前就消失了。为此,这次 jobs 可以直接向 Prometheus server 端推送它们的 metrics。这种方式主要用于服务层面的 metrics,对于机器层面的 metrices,需要使用 node exporter。Exporters: 用于暴露已有的第三方服务的 metrics 给 Prometheus。Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去除重复数据,分组,并路由到对收的接受方式,发出报警。常见的接收方式有:电子邮件,pagerduty,OpsGenie, webhook 等。一些其他的工具。

Prometheus 架构图

cadvisor 与 Prometheus 集成

主要内容:

cadvisor 与 Prometheus 集成在 Prometheus 中查看容器的 CPU,内存,网络流量等信息

数据的采集从agent采集,也即是cadvisor存储的数据采集起来,通过普罗米修斯的简单UI查看里面的数据

Step1:启动简单启动容器和端口就可以

[root@localhost ~]# docker run -d --name=prometheus -p 9090:9090 prom/prometheus9bb7d60a70269a8c314794ff822dfec25d7c9230e1f5a19e5553cbf6f2a3c6e7[root@localhost ~]# docker psCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES9bb7d60a7026 prom/prometheus "/bin/prometheus --c…" 10 seconds ago Up 6 seconds 0.0.0.0:9090->9090/tcp prometheusafd8196a70d8 google/cadvisor:latest "/usr/bin/cadvisor -…" 18 minutes ago Up 18 minutes 0.0.0.0:8080->8080/tcp cadvisor

Step2: 修改 Prometheus 配置信息,添加 cadvisor 访问地址:

现在要实现通过普罗米修斯收集cad采集的数据,现在部署的这两个组件时没有任何关系的,即普罗米修斯还没有去采集cad的数据。

被监控端有两个概念,一个时job分组,比如web服务器是一组,mysql是一组,这样在使用promql的时候就可以筛选分组。

[root@localhost ~]# docker exec -it prometheus sh/prometheus $ vi /etc/prometheus/prometheus.yml scrape_configs: - job_name: 'prometheus' # metrics_path defaults to '/metrics' # scheme defaults to ' static_configs: - targets: ['localhost:9090'] - job_name: 'webserver' basic_auth: username: prometheus password: 123456 static_configs: - targets: ['192.168.179.99:9100'] - job_name: 'docker' static_configs: - targets: ['192.168.179.99:8080','192.168.179.100:8080']#这样就添加了被监控端

如果要添加多个

- targets: ['192.168.179.99:8080','xxx.xxx.xxx.xxx']

Step3: 重新加载配置,访问 ​​~]# docker restart prometheusPrometheus

Step4: 此时访问 Prometheus 的 graph 页面 ​​------> 普罗米修斯主动去从cadvisor里面去采集(数据收集与存储) ------> grafana展示(从普罗米修斯里面可视化展示)

问题 如果仪表不出数据

时间没有同步,被采集单数据的时间要和监控服务器的时间保持一致或者promql写的有问题,可能普罗米修斯版本和grafana版本不兼容普罗米修斯里面没有数据


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Kubernetes 初始化容器InitContainer
下一篇:Nginx content阶段的index模块和auto index模块
相关文章

 发表评论

暂时没有评论,来抢沙发吧~