一、分区

分区是将数据分布在多个Redis实例（Redis主机）上，以至于每个实例只包含一部分数据

1.1 分区的意义

性能的提升

单机Redis的网络I/O能力和计算资源是有限的，将请求分散到多台机器，充分利用多台机器的计算能力可网络带宽，有助于提高Redis总体的服务能力。

存储能力的横向扩展

即使Redis的服务能力能够满足应用需求，但是随着存储数据的增加，单台机器受限于机器本身的存储容量，将数据分散到多台机器上存储使得Redis服务可以横向扩展。

1.2 分区的方式

1.2.1 范围分区

根据id数字的范围比如1–10000、100001–20000…..90001-100000，每个范围分到不同的Redis实例中

好处：

实现简单，方便迁移和扩展

缺陷：

热点数据分布不均，性能损失

非数字型key，比如uuid无法使用(可采用雪花算法替代

1.2.2 hash分区

利用简单的hash算法即可：

Redis实例=hash(key)%N key:要进行分区的键，比如user_id N:Redis实例个数(Redis主机)

好处：

支持任何类型的key

热点分布较均匀，性能较好

缺陷：

迁移复杂，需要重新计算，扩展较差（利用一致性hash环）

1.3 client端分区

对于一个给定的key，客户端直接选择正确的节点来进行读写。许多Redis客户端都实现了客户端分区 (JedisPool)，也可以自行编程实现。

部署方案

客户端选择算法

（1）hash

优势：实现简单，热点数据分布均匀

缺陷：节点数固定，扩展的话需要重新计算

（2）一致性hash

我们有3台缓存服务器，服务器A、服务器B、服务器C，那么，在生产环境中，这三台服务器肯定有自己的IP地址，我们使用它们各自的IP地址进行哈希计算，使用哈希后的结果对2^32取模，
使用如下公式： hash（服务器的IP地址） % 2^32

1.4 官方cluster分区

Redis3.0之后，Redis官方提供了完整的集群解决方案。方案采用去中心化的方式，包括：sharding（分区）、replication（复制）、failover（故障转移）。称为RedisCluster。

Redis5.0前采用redis-trib进行集群的创建和管理，需要ruby支持。

Redis5.0可以直接使用Redis-cli进行集群的创建和管理。

部署架构

去中心化

RedisCluster由多个Redis节点组构成，是一个P2P无中心节点的集群架构，依靠Gossip协议传播的集群。

Gossip协议

Gossip协议是一个通信协议，一种传播消息的方式。

起源于：病毒传播

Gossip协议基本思想就是：

一个节点周期性(每秒)随机选择一些节点，并把信息传递给这些节点。这些收到信息的节点接下来会做同样的事情，即把这些信息传递给其他一些随机选择的节点

通过gossip协议，cluster可以提供集群间状态同步更新、选举自助failover等重要的集群功能

slot

redis-cluster把所有的物理节点映射到[0-16383]个slot上,基本上采用平均分配和连续分配的方式。比如上图中有5个主节点，这样在RedisCluster创建时，slot槽可按下表分配

比如：

set name zhaoyun hash("name")采用crc16算法，

得到值：1324203551%16384=15903

根据上表15903在13088-16383之间，所以name被存储在Redis5节点。

RedisCluster的优势

高性能

Redis Cluster 的性能与单节点部署是同级别的。

多主节点、负载均衡、读写分离

高可用

Redis Cluster 支持标准的主从复制配置来保障高可用和高可靠

Redis Cluster 也实现了一个类似 Raft 的共识方式，来保障整个集群的可用性。

易扩展

向Redis Cluster 中添加新节点，或者移除节点，都是透明的，不需要停机。

水平、垂直方向都非常容易扩展。

数据分区，海量数据，数据存储

原生

部署 Redis Cluster 不需要其他的代理或者工具，而且 Redis Cluster 和单机 Redis 几乎完全兼容。

二、集群搭建

RedisCluster最少需要三台主服务器，三台从服务器。端口号分别为：7001~7006
mkdir redis-cluster/7001 make install PREFIX=/var/redis-cluster/7001 cp /var/redis-5.0.5/redis.conf /var/redis-cluster/7001/bin
修改redis.conf配置文件，打开cluster-enable yes

第三步：复制7001，创建7002~7006实例，注意端口修改。

cp -r /var/redis-cluster/7001/* /var/redis-cluster/7002

cp -r /var/redis-cluster/7001/* /var/redis-cluster/7003

cp -r /var/redis-cluster/7001/* /var/redis-cluster/7004

cp -r /var/redis-cluster/7001/* /var/redis-cluster/7005

cp -r /var/redis-cluster/7001/* /var/redis-cluster/7006

第四步：创建start.sh，启动所有的实例
cd 7001/bin ./redis-server redis.conf cd .. cd .. cd 7002/bin ./redis-server redis.conf cd .. cd .. cd 7003/bin ./redis-server redis.conf cd .. cd .. cd 7004/bin ./redis-server redis.conf cd .. cd .. cd 7005/bin ./redis-server redis.conf cd .. cd .. cd 7006/bin ./redis-server redis.conf cd .. cd .. chmod u+x start.sh (赋写和执行的权限) ./start.sh(启动RedisCluster) 
第五步：创建Redis集群（创建时Redis里不要有数据）

./redis-cli –cluster create 192.168.72.128:7001 192.168.72.128:7002 192.168.72.128:7003 192.168.72.128:7004 192.168.72.128:7005 192.168.72.128:7006 –cluster-replicas 1

cd 7001

/redis-cli -h 127.0.0.1 -p 7001 -c

查看集群状态

cluster info

查看集群中的节点：

cluster nodes

2.1 扩容

mkdir redis-cluster/7007 make install PREFIX=/var/redis-cluster/7007 ./redis-cli --cluster add-node 192.168.72.128:7007 192.168.72.128:7001 #查看集群结点发现7007已添加到集群中 cluster nodes 添加完主节点需要对主节点进行hash槽分配，这样该主节才可以存储数据。 查看集群中槽占用情况 cluster nodes 给刚添加的7007结点分配槽 ./redis-cli --cluster reshard 192.168.72.128:7007 输入要分配的槽数量 How many slots do you want to move (from 1 to 16384)? 3000 输入接收槽的结点id What is the receiving node ID? 这里准备给7007分配槽，通过cluster nodes查看7007结点id为： 50b073163bc4058e89d285dc5dfc42a0d1a222f2 输入源结点iD 输入：all 输入yes开始移动槽到目标结点id yes 查看结果 cluster nodes 添加从节点 添加7008从结点，将7008作为7007的从结点 (50b073163bc4058e89d285dc5dfc42a0d1a222f2是7007结点的id) ./redis-cli --cluster add-node 192.168.72.128:7008 192.168.72.128:7007 -- cluster-slave --cluster-master-id 6ff20bf463c954e977b213f0e36f3efc02bd53d6 查看集群中的结点，刚添加的7008为7007的从节点： ./redis-cli -h 127.0.0.1 -p 7001 -c cluster nodes

2.2 缩容

./redis-cli --cluster del-node 192.168.127.128:7008 6be94480315ab0dd2276a7f70c82c578535d6666

三、容灾（failover）

3.1 故障检测

集群中的每个节点都会定期地（每秒）向集群中的其他节点发送PING消息如果在一定时间内(cluster-node-timeout)，发送ping的节点A没有收到某节点B的pong回应，则A将B 标识为pfail。 A在后续发送ping时，会带上B的pfail信息，通知给其他节点。如果B被标记为pfail的个数大于集群主节点个数的一半（N/2 + 1）时，B会被标记为fail，A向整个集群广播，该节点已经下线。其他节点收到广播，标记B为fail。

3.2 主从切换

raft，每个从节点，都根据自己对master复制数据的offset，来设置一个选举时间，offset越大（复制数据越多）的从节点，选举时间越靠前，优先进行选举。 slave 通过向其他master发送FAILVOER_AUTH_REQUEST 消息发起竞选， master 收到后回复FAILOVER_AUTH_ACK 消息告知是否同意。 slave 发送FAILOVER_AUTH_REQUEST 前会将currentEpoch 自增，并将最新的Epoch 带入到 FAILOVER_AUTH_REQUEST 消息中，如果自己未投过票，则回复同意，否则回复拒绝。

所有的Master开始slave选举投票，给要进行选举的slave进行投票，如果大部分master node（N/2 + 1）都投票给了某个从节点，那么选举通过，那个从节点可以切换成master。 RedisCluster失效的判定： 1、集群中半数以上的主节点都宕机（无法投票） 2、宕机的主节点的从节点也宕机了（slot槽分配不连续）

所有的Master开始slave选举投票，给要进行选举的slave进行投票，如果大部分master node（N/2 + 1）都投票给了某个从节点，那么选举通过，那个从节点可以切换成master。 RedisCluster失效的判定： 1、集群中半数以上的主节点都宕机（无法投票） 2、宕机的主节点的从节点也宕机了（slot槽分配不连续）

3.3 副本漂移

我们知道在一主一从的情况下，如果主从同时挂了，那整个集群就挂了。为了避免这种情况我们可以做一主多从，但这样成本就增加了。 Redis提供了一种方法叫副本漂移，这种方法既能提高集群的可靠性又不用增加太多的从机。

Master1宕机，则Slaver11提升为新的Master1 集群检测到新的Master1是单点的（无从机） 集群从拥有最多的从机的节点组（Master3）中，选择节点名称字母顺序最小的从机（Slaver31）漂移 到单点的主从节点组(Master1)。

注：以上为本人小小总结，如果对您起到了一点点帮助，请给予我一点鼓励，在下方点个小小的赞，谢谢，如有错误之处，望不吝指出，非常感谢！

原文链接：https://blog.csdn.net/li1019865596/article/details/118071764

原创文章，作者：优速盾-小U，如若转载，请注明出处：https://www.cdnb.net/bbs/archives/16522

redis(3)(2)

一、分区

1.1 分区的意义

1.2 分区的方式

1.2.1 范围分区

1.2.2 hash分区

1.3 client端分区

部署方案

客户端选择算法

1.4 官方cluster分区

部署架构

去中心化

Gossip协议

slot

RedisCluster的优势

二、集群搭建

2.1 扩容

2.2 缩容

三、容灾（failover）

3.1 故障检测

3.2 主从切换

3.3 副本漂移

发表回复

redis(3)(2)

一、分区

1.1 分区的意义

1.2 分区的方式

1.2.1 范围分区

1.2.2 hash分区

1.3 client端分区

部署方案

客户端选择算法

1.4 官方cluster分区

部署架构

去中心化

Gossip协议

slot

RedisCluster的优势

二、集群搭建

2.1 扩容

2.2 缩容

三、容灾（failover）

3.1 故障检测

3.2 主从切换

3.3 副本漂移

相关推荐

发表回复

分享到：