主從模式的弊端就是不具備高可用性,當(dāng)master掛掉以后,Redis將不能再對外提供寫入操作,因此sentinel模式應(yīng)運(yùn)而生。sentinel中文含義為哨兵,顧名思義,它的作用就是監(jiān)控redis集群的運(yùn)行狀況,此模式具有如下一些特點(diǎn):
- sentinel模式是建立在主從模式的基礎(chǔ)上,如果只有一個Redis節(jié)點(diǎn),sentinel就沒有任何意義;
- 當(dāng)master掛了以后,sentinel會在slave中選擇一個做為master,并修改它們的配置文件,其他slave的配置文件也會被修改,比如slaveof屬性會指向新的master;
- 當(dāng)master重新啟動后,它將不再是master,而是做為slave接收新的master的同步數(shù)據(jù);
- sentinel因為也是一個進(jìn)程,所以有掛掉的可能,所以sentinel也會啟動多個形成一個sentinel集群;
- 多sentinel配置的時候,sentinel之間也會自動監(jiān)控;
- 當(dāng)主從模式配置密碼時,sentinel也會同步將配置信息修改到配置文件中;
- 一個sentinel或sentinel集群可以管理多個主從Redis,多個sentinel也可以監(jiān)控同一個redis;
- sentinel最好不要和Redis部署在同一臺機(jī)器,不然Redis的服務(wù)器掛了以后,sentinel也可能會掛掉。
下面是Sentinel(哨兵)模式的工作的原理圖:
其工作的流程如下所示:
- 每個sentinel以每秒鐘一次的頻率向它所知的master,slave以及其他sentinel實(shí)例發(fā)送一個 PING 命令;
- 如果一個實(shí)例距離最后一次有效回復(fù) PING 命令的時間超過 down-after-milliseconds 選項所指定的值, 則這個實(shí)例會被sentinel標(biāo)記為主觀下線;
- 如果一個master被標(biāo)記為主觀下線,則正在監(jiān)視這個master的所有sentinel要以每秒一次的頻率確認(rèn)master的確進(jìn)入了主觀下線狀態(tài);
- 當(dāng)有足夠數(shù)量的sentinel(大于等于配置文件指定的值)在指定的時間范圍內(nèi)確認(rèn)master的確進(jìn)入了主觀下線狀態(tài), 則master會被標(biāo)記為客觀下線;
- 在一般情況下, 每個sentinel會以每 10 秒一次的頻率向它已知的所有master,slave發(fā)送 INFO 命令; - 當(dāng)master被sentinel標(biāo)記為客觀下線時,sentinel向下線的master的所有slave發(fā)送 INFO 命令的頻率會從 10 秒一次改為 1 秒一次;
- 若沒有足夠數(shù)量的sentinel同意master已經(jīng)下線,master的客觀下線狀態(tài)就會被移除;若master重新向sentinel的 PING 命令返回有效回復(fù),master的主觀下線狀態(tài)就會被移除。
#環(huán)境說明
IP | 主機(jī)名 | 角色 |
---|---|---|
192.168.182.110 | local-168-182-110 | master, sentinel |
192.168.182.111 | local-168-182-111 | slave1, sentinel |
192.168.182.112 | local-168-182-112 | slave2, sentinel |
同時,為了保證能夠最小可能的碟機(jī)事件,sentinel 最好跟redis部署在不同的機(jī)器上,sentinel 端口:26379。
#配置sentinel
因為哨兵模式是基于主從模式的,所以redis的相關(guān)配置就不多說明。我們只需要在主從模式的基礎(chǔ)上直接修改sentinel配置文件,配置3個哨兵即可,哨兵的配置可以參考如下內(nèi)容。
# 三個節(jié)點(diǎn)創(chuàng)建存儲目錄
mkdir /opt/software/redis-7.0.3/sentinel
mkdir /opt/software/redis-7.0.3/sentinel ; chown -R redis:redis /opt/software/redis-7.0.3/
cat >/usr/local/redis/sentinel.conf<<EOF
daemonize yes
logfile "/usr/local/redis/sentinel.log"
# sentinel工作目錄
dir "/opt/software/redis-7.0.3/sentinel"
# 判斷master失效至少需要2個sentinel同意,建議設(shè)置為n/2+1,n為sentinel個數(shù)
# sentinel monitor <master-name> <ip> <port> <count>
sentinel monitor mymaster 192.168.182.110 6379 2
sentinel auth-pass mymaster 123456
# 判斷master主觀下線時間,默認(rèn)30s
sentinel down-after-milliseconds mymaster 30000
EOF
#啟動sentinel
啟動sentinel模式的命令如下:
/usr/local/bin/redis-sentinel /usr/local/redis/sentinel.conf
netstat -tnlp|grep 26379
#故障模擬測試
為了模擬故障,我們將master停掉。
# 停掉master
systemctl stop redis
redis-cli -h 192.168.182.111 -a 123456 info replication
可以看到,Redis發(fā)現(xiàn)master節(jié)點(diǎn)出現(xiàn)問題后,會自動切換到其它節(jié)點(diǎn)。接下來,我們再測試一下讀寫。
[root@local-168-182-110 redis-7.0.3]# redis-cli -h 192.168.182.112 -a 123456
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
192.168.182.112:6379> set k2 v2
OK
可以看到,新的master節(jié)點(diǎn)讀寫能力都是正常的,接下來就是恢復(fù)故障,看能否正常。
redis-cli -h 192.168.182.112 -a 123456 info replication
可以看到,和之前預(yù)定的sentinel模式的工作流程是一樣的:原先的master節(jié)點(diǎn)在恢復(fù)后并不會主動切換到master角色,而是作為slave角色繼續(xù)服務(wù)。