本文将向你介绍Ganglia,它是一个便于扩充的监控系统。使用它可以实时查看Linux服务器和集群(图形化展示)中的各项性能指标。
--GabrielCánepa
本文导航
编译自:
从系统管理员接手服务器和主机管理以来,像应用监控这样的工具就成了她们的好帮手。其中比较有名的有Nagios[1]、Zabbix[2]、Icinga[3]和Centreon。以上这种是重量级的监控工具,让一个菜鸟管理员来设置,并使用其中的中级特点是有些困难的。
Ganglia才能让你以集群(按服务器组)和网格(按地理位置)的方法更好地组织服务器。
这样linux 网络性能监控,我们可以创建一个包含所有远程主机的网格linux deepin,之后将这些机器依照其它标准分组成小的集合。
据悉,Ganglia的web页面对联通设备进行过优化,也容许你导入csv和.json格式的数据。
我们的测试环境包括一个安装Ganglia的主节点服务器CentOS7(IP地址192.168.0.29),和一个作为被监控端的Ubuntu14.04主机(192.168.0.32)。我们将通过Ganglia的Web页面来监控这台Ubuntu主机。
下边的事例可以给你们提供参考,CentOS7作为主节点,Ubuntu作为被监控对象。
安装和配置Ganglia
请遵守以下步骤,在主节点服务器安装监控工具。
1、启用EPEL库房[4],之后安装Ganglia和相关工具:
# yum update && yum install epel-release
# yum install ganglia rrdtool ganglia-gmetad ganglia-gmond ganglia-web
在前面这步随Ganglia将安装一些应用,它们的功能如下:
假如你想了解更多中级安全机制,请参阅Apache文档的授权与认证[5]部份。
为完成这个目标,我们须要创建一个用户名并设定一个密码,以访问被Apache保护的资源。在本例中,我们先来创建一个叫adminganglia的用户名,之后给它分配一个密码,它将被储存在/etc/httpd/auth.basic(可以随便选择另一个目录和/或文件名,只要Apache对此有读取权限就可以。)
# htpasswd -c /etc/httpd/auth.basic adminganglia
给adminganglia输入两次密码完成密码设置。
3、修改配置文件/etc/httpd/conf.d/ganglia.conf:
Alias /ganglia /usr/share/ganglia
AuthType basic
AuthName "Ganglia web UI"
AuthBasicProvider file
AuthUserFile "/etc/httpd/auth.basic"
Require user adminganglia
4、编辑/etc/ganglia/gmetad.conf:
首先linux应用程序,使用gridname指令来为网格设置一个描述性名称。
gridname "Home office"
之后,使用data_source指令,前面跟集群名(服务器组)、轮询时间间隔(秒)、主节点主机和被监控节点的IP地址:
data_source "Labs" 60 192.168.0.29:8649 # 主节点
data_source "Labs" 60 192.168.0.32 # 被监控节点
5、编辑/etc/ganglia/gmond.conf。
a)确保集群的配置类似下边。
cluster {
name = "Labs" # gmetad.conf 中的 data_source 指令的名字
owner = "unspecified"
latlong = "unspecified"
url = "unspecified"
}
b)在udp_send_chanel中,注释掉mcast_join:
udp_send_channel {
# mcast_join = 239.2.11.71
host = localhost
port = 8649
ttl = 1
}
c)在udp_recv_channel中,注释掉mcast_join和bind部份:
udp_recv_channel {
# mcast_join = 239.2.11.71 ## comment out
port = 8649
# bind = 239.2.11.71 ## comment out
}
保存并退出。
6、打开8649/udp端口,使用SELinux确保php脚本(通过Apache运行)才能联接到网路:
# firewall-cmd --add-port=8649/udp
# firewall-cmd --add-port=8649/udp --permanent
# setsebool -P httpd_can_network_connect 1
7、重启Apache、gmetad、gmond,并确保它们启用了“开机启动”。
# systemctl restart httpd gmetad gmond
# systemctl enable httpd gmetad httpd
至此,我们如今才能打开Ganglia的Web页面并用步骤2中设置的账簿登入。
][5]
GangilaWeb页面
8、在Ubuntu主机上,只需安装Ganglia-monitor,等同于CentOS上的ganglia-gmond:
$ sudo aptitude update && aptitude install ganglia-monitor
9、编辑被监控主机的/etc/ganglia/gmond.conf文件。与主节点主机上是相同的文件,不仅被注释掉的cluster,udp_send_channel,udp_recv_channel这儿不应被注释:
cluster {
name = "Labs" # The name in the data_source directive in gmetad.conf
owner = "unspecified"
latlong = "unspecified"
url = "unspecified"
}
udp_send_channel {
mcast_join = 239.2.11.71
host = localhost
port = 8649
ttl = 1
}
udp_recv_channel {
mcast_join = 239.2.11.71 ## comment out
port = 8649
bind = 239.2.11.71 ## comment out
}
然后重启服务。
$ sudo service ganglia-monitor restart
10、刷新页面,你将在Homeofficegrid/Labscluster中见到两台主机的各类统计及图形化的展示(用下拉菜单选择集群,本例中为Labs):
Ganglia中Homeoffice网格报告
使用菜单按键(如上强调的),你可以获取到每台服务器和集群的信息。还可以使用对比主机CompareHosts选项卡来比较集群中所有服务器的状态。
可以使用正则表达式选择一组服务器linux 网络性能监控,立即就可以看见它们性能的对比:
Ganglia服务器信息
我最喜欢的一个特征是对联通端有友好的总结界面,可以通过Mobile选项来访问。选择你感兴趣的集群,之后选中一个主机。
Ganglia联通端总结截图
总结
本篇文章向你们介绍了Ganglia,它是一个功能强悍、扩展性挺好的监控工具,主要拿来监控集群和网格。它可以随便安装,方便的组合各类功能(你甚至可以尝试一下官方网站[6]提供的Demo)。
此时,你可能会发觉许多著名的IT或非IT的企业在使用Ganglia。不仅我们在文章中提到的之外,还有好多理由这样做,其中易用性,统计的图形化(在名子旁附上下颚相片更清晰,不是吗)可能是最重要的诱因。
并且请不要屈从于本篇文章,尝试一下自己去做。假如你有任何问题,欢迎给我留言。
本文由LCTT[8]组织编译,Linux中国荣誉推出
[5]: