3 Zabbix报警机制
· 自定义的监控项默认不会自动报警
· 首页也不会提示错误
· 需要配置触发器与报警动作才可以自动报警
3.1 概念介绍
** 触发器(trigger)**
-表达式,如内存不足300M,用户超过30个等
-当触发条件发生后,会导致一个触发事件
-触发事件会执行某个动作
** 动作(action)**
-触发器的条件被触发后的行为
-可以是发送右键,也可以是重启某个服务等
3.2 配置监控报警
** 3.2.1 创建触发器 **
· 通过 配置 -> 模板
· 选择模板点击后面的 触发器 -> 创建触发器
-强烈建议使用英文创建(中文翻译不敢恭维)
** 触发器表达式 **
· Expression表达式:触发异常的条件
{<server>:<key>.<function>(<parameter>)}<operator><constant>
{主机:key.函数(参数)}<表达式>常数
· Expression表达式案例1
{web1:system.cpu.load[all,avg1].last(0)}>5 #0为最新数据
#如果web1主机最新的CPU平均负载值大于5,则触发器状态Problem
{vfs.fs.size[/,free].max(5m)}<10G #5m为最近5分钟
#根分区,最近5分钟的最大容量小于10G,则状态进入Problem
{vfs.file.cksum[/etc/passwd].diff(0)}>0 #0为最新数据
#最新一次校验/etc/passwd如果与上一次有变化,则状态进入Problem
· Expression表达式案例2
-大多数函数使用秒作为参数,使用#代表不同含义
-avg,count,last,min and max 函数支持额外的第二个参数time_shift(时间偏移量)
-这个参数允许从过去一段时间内引用数据
| 函数内容 | 描述 |
| sum(600) | 600秒内所有值的总和 |
| sum(#5) | 最后5个值的总和 |
| last(20) | 最后20秒的值 |
| last(#5) | 倒数第5个值 |
| avg(1h,1d) | 一天前的1小时的平均值 |
配置触发器
· 设置触发器名称,点击add添加表达式
· 填写表达式
-监控项为账户数量,最近300秒账户数量大于53
** 3.2.2 创建动作 **
** 设置邮件服务器 **
· 设置邮件服务器
-管理 -> 报警媒介类型 -> 选择Email邮件
-设置邮件服务器信息
** 创建 Media **
· 为账户添加Media
-在 管理 -> 用户 中找到选择admin账户
-选择Media菜单 -> 点击更新添加报警媒介
-在 Meida Type中填写报警类型,收件人,时间等信息
** 创建动作 **
· Action(动作)
-定义当触发器被触发时,执行什么Action
-通过配置 -> 动作 -> 创建动作
-配置动作(填写名称)
-配置导致动作的触发条件(账户大于53)
-配置动作的具体操作行为(发送信息或执行远程命令)
-无线次数发送邮件,60秒1次,发送给Admin用户
** 效果测试 **
· 在被监控主机创建账户
· 登陆监控端Web页面,在仪表盘中查看问题
· 在zabbix服务器上查看是否收到邮件
[root@zabbix-server ~]# su - zabbix
[zabbix@zabbix-server ~]# mail
Heirloom Mail version 12.5 7/5/10. Type ? for help.
"/var/spool/mail/zabbix": 2 messages 2 new
>N 1 root Thu Jul 16 20:50 20/820 "Hello word"
N 2 root@localhost.local Thu Jul 16 21:41 20/815 "big53"
&
2
Message 2:
From root@localhost.localdomain Thu Jul 16 21:41:26 2020
Return-Path: <root@localhost.localdomain>
X-Original-To: zabbix@localhost
Delivered-To: zabbix@localhost.localdomain
From: <root@localhost.localdomain>
To: <zabbix@localhost.localdomain>
Date: Thu, 16 Jul 2020 21:41:25 +0800
Subject: big53
Content-Type: text/plain; charset="UTF-8"
Status: R
Problem started at 21:41:24 on 2020.07.16
Problem name: cfq1
Host: agent-1
Severity: Disaster
Original problem ID: 22
评论区