Contents
前言
在上篇(搭建篇)中,我们成功部署了wgcloud的server端和agent端(参见文章:家庭数据中心系列 通过wgcloud部署自己的运维监控系统(上):搭建篇)经过了一段时间的实际运行,终于可以来总结一下wgcloud的功能和基本配置了,毕竟运维还是要看看实际效果,咱也是奉行实践出真知这个准则的。
监测功能介绍
监控概要

这里可以看到wgcloud所有监控项的一个概要以及使用资源的一个总体统计数据:

资源管理

资源管理是最重要的部分,我们平时重点关注的监控目标都在这项目下面:

主机管理
这里可以看到所有部署了agent的主机的详细的系统信息,包括cpu、内存、上下行速率、连接数量、进程数量等,如下图:

红框中的主机是我的腾讯云轻量云主机,是通过tailscale的地址进行添加的。右边红框中的系统和图表可以很详细的看到被监控主机的详细信息,以下是系统和图表的部分内容。
系统:

图表:

如果被监控主机是linux设备,在右边的更多下还能直接进行web ssh,还是很贴心的,如下图:

注:主机管理里面的主机无法手动添加,都是由agent端自动注册添加进来的,所以需要保证agent和server端之间的通信。
主机异常进程
这里可以看到各个主机上一些消耗内存或者cpu资源较多的进程,比如在我的腾讯云轻量服务器上,java进程占用了56.16%的cpu资源,所以被判定为异常进程:

不过可能和判定方式有关,这个其实未必准确,还是要结合目标主机上的实际情况来看。
进程监控
这里可以自行添加主机管理中已有的主机上自己关注的重点进程,只需要点击上方红框中的添加即可,如下图:

进入添加界面按下图方式添加进程:

例如,我添加了魔兽世界服务器上的authserver和worldserver这2个关键进程的监控:

端口监测
这里可以添加主机管理中已有的主机上的特定端口的监测。其实如果只是一些对外开放的端口监测,利用uptime-kuma之类的方案也可以做到,但是,wgcloud上端口监测最重要的作用,是对主机上localhost地址上端口的监测,这些是无法通过外部监测的方式来实现的。
点击上方红框中的"添加":

根据你需要监测端口所在的主机上的端口信息进行添加,比如,我用腾讯云轻量服务器上warp proxy的端口为例:

添加成功后即可看到端口状态:

日志监控
这里可以指定查看某个主机上的日志并指定其告警关键字,需要对主机上应用的日志文件位置、日志内容有一定了解,我这里就不演示了,暂时没这种需要,大家看看监控设置界面就好:


文件防篡改
这个有天朝特色的功能我就不多做介绍了,和日志监控的设置类似,大家看看界面就懂了:


docker监测
这里可以对部署在各个主机上的docker进行监测,依旧是点击上方红框中的"添加"按钮:

然后如下图所示填写需要监测的docker的信息:

我实际监测的docker:

数据监控
数据监控部分是针对数据库,其中,数据源管理是针对具体的"库",而数据表监测是针对具体的"库"中某个"表":

数据源管理
配置很简单,按照下面图片教程操作即可:


实际效果展示:

数据表管理
这部分主要是监控某个库中某个表中的某数值的变化情况,我没需求,所以没设置,大家根据自己的需要配置即可,界面如下:


服务接口监测
这部分可以使用指定的方式访问服务对应的URL,并根据返回的状态码来判断其健康情况:



展示看板


数通监测

这部分功能比较简单,就是通过2种方式:ping、snmp监测设备:

PING监测
以这种方式监测,需要被监测主机能响应ICMP查询,可能需要开启对应设备上的防火墙,这种方式只能监测目标是否在线。添加方式和前面类似,我就不重复了,就展示一下效果:

snmp监测
这种方式通过snmp协议的方式监测目标,监测内容除了主机是否在线,还能监测出入设备的流量、速率、cpu、内存、温度、电压等,不过需要被监测目标支持snmp协议,且不同的功能可能需要支持不同的snmp版本(例如,如果需要验证功能,就需要snmp v3)。
添加监测目标的界面如下:


监控效果如下:

FTP/SFTP监测
这一部功能很简单,就是监测FTP和SFTP服务器,和前面一样,需要手动添加待监测的FTP/SFTP服务器,最终效果如下:

中间件监测
这部分可以对以下类型的内容进行监测,不过需要一台既能访问wgcloud server端,又能访问到监测内容的主机,安装一个类似于agent的名为"server-backup"的组件来作为辅助工具,我就没折腾了,大家有兴趣自行研究吧。

运维功能介绍
巡检报告

wgcloud默认会生成巡检日报、周报和月报:

内容比较简单,以下是日报的部分内容:

系统管理
这部分有2个内容,系统日志和指令下发,如下图:

系统日志会显示各个监控主机上的一些报警:

指令下发可以通过agent,让选择的监控主机运行命令,例如数据库备份。可以立即运行命令,也可以定时(多次)执行:


告警设置
这部分内容很简单,分3个部分,大家看看这3部分的配置页面就明白。

邮件告警,设置接受告警的邮箱信息:

脚本告警:

自定义告警,自定义监控主机的告警项目和阈值:


资产管理
提供简单的资产管理功能:


设备账号管理
提供简单的设备账号管理功能:


总结
总的来讲,wgcloud还是很符合国人的使用习惯的,而且个人免费版提供的功能也足够一般人使用了,唯一遗憾的是,监控目标数量10个的限制略微少了点。
另:10个是针对每个功能项的限制:比如10个监控主机,10个监测进程,10个监测docker。。。只考虑重点监控目标,规划一下的话,对一般人还是足够用了。