家庭数据中心系列 通过wgcloud部署自己的运维监控系统(下):功能篇
本文最后更新于 290 天前,其中的信息可能已经有所发展或是发生改变,如有失效可到评论区留言。

前言

在上篇(搭建篇)中,我们成功部署了wgcloud的server端和agent端(参见文章:家庭数据中心系列 通过wgcloud部署自己的运维监控系统(上):搭建篇)经过了一段时间的实际运行,终于可以来总结一下wgcloud的功能和基本配置了,毕竟运维还是要看看实际效果,咱也是奉行实践出真知这个准则的。

监测功能介绍

监控概要

image.png

这里可以看到wgcloud所有监控项的一个概要以及使用资源的一个总体统计数据:
image.png

资源管理

image.png

资源管理是最重要的部分,我们平时重点关注的监控目标都在这项目下面:
image.png

主机管理

这里可以看到所有部署了agent的主机的详细的系统信息,包括cpu、内存、上下行速率、连接数量、进程数量等,如下图:

image.png

红框中的主机是我的腾讯云轻量云主机,是通过tailscale的地址进行添加的。右边红框中的系统和图表可以很详细的看到被监控主机的详细信息,以下是系统和图表的部分内容。
系统:
image.png

图表:
image.png

如果被监控主机是linux设备,在右边的更多下还能直接进行web ssh,还是很贴心的,如下图:
image.png

注:主机管理里面的主机无法手动添加,都是由agent端自动注册添加进来的,所以需要保证agent和server端之间的通信。

主机异常进程

这里可以看到各个主机上一些消耗内存或者cpu资源较多的进程,比如在我的腾讯云轻量服务器上,java进程占用了56.16%的cpu资源,所以被判定为异常进程:

image.png

不过可能和判定方式有关,这个其实未必准确,还是要结合目标主机上的实际情况来看。

进程监控

这里可以自行添加主机管理中已有的主机上自己关注的重点进程,只需要点击上方红框中的添加即可,如下图:

image.png

进入添加界面按下图方式添加进程:
image.png

例如,我添加了魔兽世界服务器上的authserver和worldserver这2个关键进程的监控:
image.png

端口监测

这里可以添加主机管理中已有的主机上的特定端口的监测。其实如果只是一些对外开放的端口监测,利用uptime-kuma之类的方案也可以做到,但是,wgcloud上端口监测最重要的作用,是对主机上localhost地址上端口的监测,这些是无法通过外部监测的方式来实现的。
点击上方红框中的"添加":

image.png

根据你需要监测端口所在的主机上的端口信息进行添加,比如,我用腾讯云轻量服务器上warp proxy的端口为例:
image.png

添加成功后即可看到端口状态:
image.png

日志监控

这里可以指定查看某个主机上的日志并指定其告警关键字,需要对主机上应用的日志文件位置、日志内容有一定了解,我这里就不演示了,暂时没这种需要,大家看看监控设置界面就好:

image.png

image.png

文件防篡改

这个有天朝特色的功能我就不多做介绍了,和日志监控的设置类似,大家看看界面就懂了:

image.png

image.png

docker监测

这里可以对部署在各个主机上的docker进行监测,依旧是点击上方红框中的"添加"按钮:

image.png

然后如下图所示填写需要监测的docker的信息:
image.png

我实际监测的docker:
image.png

数据监控

数据监控部分是针对数据库,其中,数据源管理是针对具体的"库",而数据表监测是针对具体的"库"中某个"表":

image.png

数据源管理

配置很简单,按照下面图片教程操作即可:

image.png

image.png

实际效果展示:
image.png

数据表管理

这部分主要是监控某个库中某个表中的某数值的变化情况,我没需求,所以没设置,大家根据自己的需要配置即可,界面如下:

image.png

image.png

服务接口监测

这部分可以使用指定的方式访问服务对应的URL,并根据返回的状态码来判断其健康情况:

image.png

image.png

image.png

展示看板

image.png

image.png

数通监测

image.png

这部分功能比较简单,就是通过2种方式:ping、snmp监测设备:
image.png

PING监测

以这种方式监测,需要被监测主机能响应ICMP查询,可能需要开启对应设备上的防火墙,这种方式只能监测目标是否在线。添加方式和前面类似,我就不重复了,就展示一下效果:

image.png

snmp监测

这种方式通过snmp协议的方式监测目标,监测内容除了主机是否在线,还能监测出入设备的流量、速率、cpu、内存、温度、电压等,不过需要被监测目标支持snmp协议,且不同的功能可能需要支持不同的snmp版本(例如,如果需要验证功能,就需要snmp v3)。
添加监测目标的界面如下:

image.png

image.png

监控效果如下:
image.png

FTP/SFTP监测

这一部功能很简单,就是监测FTP和SFTP服务器,和前面一样,需要手动添加待监测的FTP/SFTP服务器,最终效果如下:

image.png

中间件监测

这部分可以对以下类型的内容进行监测,不过需要一台既能访问wgcloud server端,又能访问到监测内容的主机,安装一个类似于agent的名为"server-backup"的组件来作为辅助工具,我就没折腾了,大家有兴趣自行研究吧。

image.png

运维功能介绍

巡检报告

image.png

wgcloud默认会生成巡检日报、周报和月报:
image.png

内容比较简单,以下是日报的部分内容:
image.png

系统管理

这部分有2个内容,系统日志和指令下发,如下图:

image.png

系统日志会显示各个监控主机上的一些报警:
image.png

指令下发可以通过agent,让选择的监控主机运行命令,例如数据库备份。可以立即运行命令,也可以定时(多次)执行:
image.png

image.png

告警设置

这部分内容很简单,分3个部分,大家看看这3部分的配置页面就明白。

image.png

邮件告警,设置接受告警的邮箱信息:
image.png

脚本告警:
image.png

自定义告警,自定义监控主机的告警项目和阈值:
image.png

image.png

资产管理

提供简单的资产管理功能:

image.png

image.png

设备账号管理

提供简单的设备账号管理功能:

image.png

image.png

总结

总的来讲,wgcloud还是很符合国人的使用习惯的,而且个人免费版提供的功能也足够一般人使用了,唯一遗憾的是,监控目标数量10个的限制略微少了点。

另:10个是针对每个功能项的限制:比如10个监控主机,10个监测进程,10个监测docker。。。只考虑重点监控目标,规划一下的话,对一般人还是足够用了。

博客内容均系原创,转载请注明出处!更多博客文章,可以移步至网站地图了解。博客的RSS地址为:https://blog.tangwudi.com/feed,欢迎订阅;如有需要,可以加入Telegram群一起讨论问题。
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇
       
error:
zh_CN
春节
快乐