Redis集群方式

单节点数据持久化：通过RDB和AOF持久化机制能将数据持久化到硬盘上。

集群方式:

主从复制、哨兵模式，以及 Redis 集群。

三种模式比较

主从复制

将一台Redis（master）服务的数据，复制到其他Redis（slave）服务器上，分担读压力，类似于Mysql的主从复制，分为全量同步和增量同步。

redis 策略是，首先会尝试进行增量同步，如不成功，要求从机进行全量同步。

主从模式不具备自动容错和恢复功能，主节点故障，集群则无法进行工作，可用性比较低，从节点升主节点需要人工手动干预。

主要作用

数据备份(故障恢复)：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复。
读写分离(负载均衡)：提高服务器的负载能力，由主节点提供写服务，由从节点提供读服务，可随时改变从库的数量，和 myql 基本保持一样。
高可用：主从复制是Redis高可用的基础，哨兵和集群都是基于此模式进行。

全量同步

一般发生在Slave初始化阶段，这时Slave需要将Master上的所有数据都复制一份。

全量同步基本流程：

slave 通过 psync命令同步数据,与master建立socket长连接
master 收到psync命令,执行bgsave语句,生成rdb快照；开始做rdb之后新数据的缓存,其实就是一些写数据
master 发送rdb数据
slave 清空数据,并加载master发来的rdb数据
master 把生成rdb文件过程中的修改数据从repl buffer发送到slave
slave 执行接收到的修改命令
master通过socket长连接持续把写命令发送给从节点,保证主从一致性

增量同步

指Slave初始化后，Master发生的写操作同步到从服务器的过程。

如果出现网络闪断或者命令丢失等异常情况时，当主从连接恢复后，由于从节点之前保存了自身已复制的偏移量和主节点的运行ID。因此会把它们当作psync参数发送给主节点，要求进行部分复制操作，格式为psync {runId} {offset}。

增量同步基本流程：

slave 连接断开
master最近数据的修改命令的缓存
slave 重新建立Socket长连接到master
slave psync命令同步数据(offset偏移量控制)
master 判断 salve的offset如果在repl backlog buffer中,则master会将缓存中从salve的offset之后,数据一次性同步给salve节点,否则会全量同步
master通过socket长连接持续把写命令发送给从节点,保证主从一致性

如何配置

redis.conf

# Redis默认不是以守护进程的方式运行，可以通过该配置项修改，使用yes启用守护进程
daemonize yes
# slave 服务器 新版本为 replicaof
slaveof 192.168.1.100 6379  
# slave 只读，master 写，实现读写分离
slave-read-only  yes  
# slave 复制超时时间
repl-timeout 60 
# slave 离线之后，master 会把离线之后的写入命令存储在一个特定大小的队列中，避免短时间断开服务却进行全量同步的问题
repl-backlog-size 1M 
# 无盘复制，主从全量同步时，主库并不会在本地创建RDB 文件，而是创建一个子进程通过Socket将RDB文件写入到从服务器，节约IO资源
repl-diskless-sync yes 
# 客户端输出缓冲区配置。每个客户端连接（包括从库）后都会申请一个buffer空间，通过该选项限制可以避免buffer持续增长消耗内存。如果超过限制主库会强制断开连接，也就是说从库处理慢导致主库buffer积压达到限制后主库会强制断开从库的连接，此时主从复制会中断，中断后如果从库再次发起复制请求还会继续被断开导致恶性循环，引发复制风暴。调为0则不限制
client-output-buffer-limit slave 256mb 64mb 60  
# 当master服务设置了密码保护时，slav服务连接master的密码
masterauth <master-password>
# Redis连接密码，如果配置了连接密码，客户端在连接Redis时需要通过AUTH <password>命令提供密码，默认关闭
requirepass 123456

哨兵模式

使用 Redis 主从服务的时候，会有一个问题，就是当 Redis 的主从服务器出现故障宕机时，需要手动进行恢复，为了解决这个问题，Redis 增加了哨兵模式（因为哨兵模式做到了可以监控主从服务器，并且提供自动容灾恢复的功能）。

哨兵模式因为sentinel的存在, 可以定时向redis主从架构发送心跳包, 并且在出现主节点宕机的时候, 选举出一个从节点作为对外服务的窗口,从而解决Redis宕机的问题。

但是因为只有一个写节点,所以支持的并发量并不高(5-10W的QPS),并且单机的内存并不大(单机Redis <10G)。并且存在主从切换的瞬间访问瞬断的风险。

哨兵模式核心还是主从复制，只不过在相对于主从模式在主节点宕机导致不可写的情况下，多了一个竞选机制：从所有的从节点竞选出新的主节点。竞选机制的实现，是依赖于在系统中启动一个sentinel进程。

哨兵模式并不是真正的集群方案：

每台 Redis 服务器都存储相同的数据。
当数据量较大时，主从同步时会影响master性能。
master宕机时，salve选举期间，直到新的master恢复，期间服务是不可用。
只有一个Redis主机来接收和处理写请求，写操作还是受单机瓶颈影响，并不是真正的分布式架构。

Cluster 集群模式

redis cluster主要是针对海量数据+高并发+高可用的场景，海量数据，数据量不是很大时，使用sentinel就够了。

Redis Cluster 是一种分布式去中心化的运行模式，是在 Redis 3.0 版本中推出的 Redis 集群方案，它将数据分布在不同的服务器上，以此来降低系统对单主节点的依赖，从而提高 Redis 服务的读写性能。

主从节点群组成的分布式服务器群，它具有复制、高可用和分片特性。Redis集群不需要sentinel哨兵也能完成节点移除和故障转移的功能。可以部分解决哨兵模式的瞬断问题。

Redis集群脑裂问题：

redis集群没有过半机制会有脑裂问题，网络分区导致脑裂后多个主节点对外提供写服务，一旦网络分区恢复，会将其中一个主节点变为从节点，这时会有大量数据丢失。

解决方案: （不能完全保障数据不丢失） min-slaves-to-write ：1

含义：如果配置了min-slaves-to-write，健康的slave的个数小于配置项N，mater就禁止写入。

master最少得有多少个健康的slave存活才能执行写命令。这个配置虽然不能保证N个slave都一定能接收到master的写操作，但是能避免没有足够健康的slave的时候，master不能写入来避免数据丢失。

设置为0关闭该功能。

Redis Cluster采用的是类一致性哈希算法实现节点选择的：

Redis Cluster将自己分成了16384个Slot（槽位）
哈希槽类似于数据分区，每个键值对都会根据它的 key，被映射到一个哈希槽中。
- 根据键值对的 key，按照 CRC16 算法计算一个 16 bit 的值。
- 再用 16bit 值对 16384 取模，得到 0~16383 范围内的模数，每个模数代表一个相应编号的哈希槽。
  节点处理槽位
  A 0-5000
  B 5001 - 10000
  C 10001 - 16383
  这样就实现了cluster节点的选择。

节点	处理槽位
A	0-5000
B	5001 - 10000
C	10001 - 16383

要点

哨兵模式归根节点还是主从模式，在主从模式下我们可以通过增加salve节点来扩展读并发能力，但是没办法扩展写能力和存储能力，存储能力只能是master节点能够承载的上限。所以为了扩展写能力和存储能力，我们就需要引入集群模式。