Contents
前言
在上篇(搭建篇)中,我们成功部署了wgcloud的server端和agent端(参见文章:家庭数据中心系列 通过wgcloud部署自己的运维监控系统(上):搭建篇)经过了一段时间的实际运行,终于可以来总结一下wgcloud的功能和基本配置了,毕竟运维还是要看看实际效果,咱也是奉行实践出真知这个准则的。
监测功能介绍
监控概要
这里可以看到wgcloud所有监控项的一个概要以及使用资源的一个总体统计数据:
资源管理
资源管理是最重要的部分,我们平时重点关注的监控目标都在这项目下面:
主机管理
这里可以看到所有部署了agent的主机的详细的系统信息,包括cpu、内存、上下行速率、连接数量、进程数量等,如下图:
红框中的主机是我的腾讯云轻量云主机,是通过tailscale的地址进行添加的。右边红框中的系统和图表可以很详细的看到被监控主机的详细信息,以下是系统和图表的部分内容。
系统:
图表:
如果被监控主机是linux设备,在右边的更多下还能直接进行web ssh,还是很贴心的,如下图:
注:主机管理里面的主机无法手动添加,都是由agent端自动注册添加进来的,所以需要保证agent和server端之间的通信。
主机异常进程
这里可以看到各个主机上一些消耗内存或者cpu资源较多的进程,比如在我的腾讯云轻量服务器上,java进程占用了56.16%的cpu资源,所以被判定为异常进程:
不过可能和判定方式有关,这个其实未必准确,还是要结合目标主机上的实际情况来看。
进程监控
这里可以自行添加主机管理中已有的主机上自己关注的重点进程,只需要点击上方红框中的添加即可,如下图:
进入添加界面按下图方式添加进程:
例如,我添加了魔兽世界服务器上的authserver和worldserver这2个关键进程的监控:
端口监测
这里可以添加主机管理中已有的主机上的特定端口的监测。其实如果只是一些对外开放的端口监测,利用uptime-kuma之类的方案也可以做到,但是,wgcloud上端口监测最重要的作用,是对主机上localhost地址上端口的监测,这些是无法通过外部监测的方式来实现的。
点击上方红框中的"添加":
根据你需要监测端口所在的主机上的端口信息进行添加,比如,我用腾讯云轻量服务器上warp proxy的端口为例:
添加成功后即可看到端口状态:
日志监控
这里可以指定查看某个主机上的日志并指定其告警关键字,需要对主机上应用的日志文件位置、日志内容有一定了解,我这里就不演示了,暂时没这种需要,大家看看监控设置界面就好:
文件防篡改
这个有天朝特色的功能我就不多做介绍了,和日志监控的设置类似,大家看看界面就懂了:
docker监测
这里可以对部署在各个主机上的docker进行监测,依旧是点击上方红框中的"添加"按钮:
然后如下图所示填写需要监测的docker的信息:
我实际监测的docker:
数据监控
数据监控部分是针对数据库,其中,数据源管理是针对具体的"库",而数据表监测是针对具体的"库"中某个"表":
数据源管理
配置很简单,按照下面图片教程操作即可:
实际效果展示:
数据表管理
这部分主要是监控某个库中某个表中的某数值的变化情况,我没需求,所以没设置,大家根据自己的需要配置即可,界面如下:
服务接口监测
这部分可以使用指定的方式访问服务对应的URL,并根据返回的状态码来判断其健康情况:
展示看板
数通监测
这部分功能比较简单,就是通过2种方式:ping、snmp监测设备:
PING监测
以这种方式监测,需要被监测主机能响应ICMP查询,可能需要开启对应设备上的防火墙,这种方式只能监测目标是否在线。添加方式和前面类似,我就不重复了,就展示一下效果:
snmp监测
这种方式通过snmp协议的方式监测目标,监测内容除了主机是否在线,还能监测出入设备的流量、速率、cpu、内存、温度、电压等,不过需要被监测目标支持snmp协议,且不同的功能可能需要支持不同的snmp版本(例如,如果需要验证功能,就需要snmp v3)。
添加监测目标的界面如下:
监控效果如下:
FTP/SFTP监测
这一部功能很简单,就是监测FTP和SFTP服务器,和前面一样,需要手动添加待监测的FTP/SFTP服务器,最终效果如下:
中间件监测
这部分可以对以下类型的内容进行监测,不过需要一台既能访问wgcloud server端,又能访问到监测内容的主机,安装一个类似于agent的名为"server-backup"的组件来作为辅助工具,我就没折腾了,大家有兴趣自行研究吧。
运维功能介绍
巡检报告
wgcloud默认会生成巡检日报、周报和月报:
内容比较简单,以下是日报的部分内容:
系统管理
这部分有2个内容,系统日志和指令下发,如下图:
系统日志会显示各个监控主机上的一些报警:
指令下发可以通过agent,让选择的监控主机运行命令,例如数据库备份。可以立即运行命令,也可以定时(多次)执行:
告警设置
这部分内容很简单,分3个部分,大家看看这3部分的配置页面就明白。
邮件告警,设置接受告警的邮箱信息:
脚本告警:
自定义告警,自定义监控主机的告警项目和阈值:
资产管理
提供简单的资产管理功能:
设备账号管理
提供简单的设备账号管理功能:
总结
总的来讲,wgcloud还是很符合国人的使用习惯的,而且个人免费版提供的功能也足够一般人使用了,唯一遗憾的是,监控目标数量10个的限制略微少了点。
另:10个是针对每个功能项的限制:比如10个监控主机,10个监测进程,10个监测docker。。。只考虑重点监控目标,规划一下的话,对一般人还是足够用了。