ETCD

一、简介

CoreOS团队于2013年6月发起的开源项目。

etcd是一个高可用的 Key/Value 存储系统，主要用于共享配置和服务发现。基于Go语言实现。

类似的常见的有Consul、ZooKeeper等等。

二、为什么需要etcd？

单点存储模型下，存储服务宕机，整个存储服务就挂了
而高级一点的，主从存储模型，基于日志异步去处理数据，主写从读，会有同步延迟。主库宕机，一般会做主从故障自动切换，但切换是需要一定时间的，可能造成数据丢失，如转账，记录没同步到从机

三、特点&优势

简单：支持curl方式的用户API
安全：支持使用SSL客户端证书认证
快速：单实例可达每秒10000次写操作
可靠：使用Raft算法来实现分布式

总结下来就是：分布式、高可用、强一致性

在分布式系统中，各个服务的配置信息的管理共享和服务发现是一个很基本、也是很重要的问题。

1、配置共享

etcd可以集中管理配置信息，服务端将配置信息存储于etcd，客户端通过etcd得到服务配置信息，etcd监听配置信息的改变，发现变更通知客户端。

为了防止单点故障，还可以启动多个etcd组成集群。etcd集群使用Raft一致性算法处理日志复制，保证多节点之间数据的强一致性。

2、服务健康检查

在etcd中注册服务，并且对注册的服务配置key的TTL，定时保持服务的心跳以达到监控健康状态的效果。

3、查找和连接服务

通过在etcd指定主题下注册的服务，也能在对应的主题下查找到。

为了确保连接，我们可以在每个服务机器节点上都部署一个proxy模式的etcd，这样就可以确保访问etcd集群的服务都能够互相连接。

四、应用场景

参考：https://www.jianshu.com/p/372e76a27cc3

服务发现
消息发布与订阅
负载均衡
分布式通知与协调
分布式锁
分布式队列
集群监控与LEADER竞选

五、etcd结构

etcd结构

etcd主要分为四部分：

HTTP Server：用于处理用户发送的API请求以及其它etcd节点的同步与心跳信息请求
Store：为用户提供API支持。用于处理etcd支持的各类功能的事务，包括数据索引、节点状态变更、监控与反馈、事件处理与执行等等，是etcd对用户提供的大多数API功能的具体实现。
Raft：Raft状态机，强一致性算法的具体实现，是etcd的核心。
WAL：Write Ahead Log（预写式日志），是etcd的数据存储方式。除了在内存中记录所有数据的状态以及节点的索引以外，etcd还通过WAL进行持久化存储。WAL中，所有的数据提交前都会事先记录日志。Snapshot是为了防止数据过多而进行的状态快照；Entry则表示存储的具体日志内容。

六、Raft协议

为了保证高可用，可以使用多个节点组成集群。通常是3个及以上的单数节点。比如集群有3个节点，那么可以容忍其中一个出现故障（半数以上节点是健康的），系统依旧可以正常运行。

Raft

上图是正常工作状态的三节点Raft集群：

1、一个Raft集群有一个Leader节点，其余都是Follower节点

2、客户端只允许和Leader节点进行交互

3、Follower节点只允许从Leader节点接收日志数据

4、Leader节点将客户端发来的请求同步给所有Follower节点，至少有一半节点同步成功时，才可以将日志commit，并返回给客户端成功

5、Leader节点定期向Follower节点发送心跳信息，告诉Follower自己依然健康

Raft关键在于抽屉理论，二阶段提交，选举约束，一共3个部分

抽屉理论

又称大多数协议，举个例子：假设有5个人，把一个秘密分享给其中3人，那么随机挑选3个人，至少有1个人知道这个秘密！

二阶段提交

假设集群节点数为2N+1，leader处理请求分4步：

把日志复制给半数以上节点，如果复制失败则无限重试
只要有N+1个节点复制成功，则本地commit提交（写提交日志，执行业务逻辑）
返回客户端告知成功
leader异步的把commit事件广播给follower们

上述操作先执行复制，再广播提交，对于follower们就是2阶段。

一句话概括：如果一共有2n+1个节点，有大多数follower(n+1)复制完leader就给调用者返回，之后leader再异步通知follower完成提交

选举约束

如果Leader节点由于异常原因无法提供服务了，这是会从Follower中选举新的Leader。从Follower的角度来看，当它接收不到Leader节点的心跳时，就可以认为Leader节点不在了。

Follower的选举过程如下：

1、节点由Follower变为Candidate，同时设置当前的Term（任期）

2、Candidate节点给自己投一票，同时向其它节点发送拉票请求

3、Follower只能向大于自己term的Candidate进行投票；term相等的情况下，选择记录了最新log的

4、Candidate等待投票结果，可能的结果如下： a）赢得选举，节点状态变为Leader b）其它节点赢得选举，节点状态变为Follower c）本轮选举未产生结果，节点状态保持为Candidate

三种投票结果说明：

自己赢得选举

只有当一个Candidate得到过半的选票时才能赢得选举，每一个节点按照先到先得的方式，最多投票给一位Candidate。

在Candidate赢得选举后，自己变为Leader，同时向所有节点发送心跳信息以使其他节点变为Follower，开始下一任任期。

他人赢得选举

在等待投票结果的过程中，如果Candidate收到其他节点发送的心跳信息，并检查心跳信息中的任期不比自己小，则自己变为Follower，听从新上任的Leader的指挥。

未产生结果

举个例子：当有多个Candidate同时竞选时，由于每个人先为自己投一票，导致没有任何一个人的选票数量过半。

当这种情况出现时，每一位Candidate都开始准备下一任竞选：将Term+1，同时再次发送拉票请求。为了防止出现长时间选不出新Leader的情况，Raft采用了两个方法：

1、Follower认为Leader不可用的超时时间，是一个随机值，这首先防止了所有的Follower都在同一时刻发现Leader不可用的情况，从而让先发现的Follower顺利当选

2、即使出现多个Candidate同时竞选的情况，再发送拉票请求时，也有一段随机的延迟，来保证大家不是同时发送拉票请求

七、区别

注册中心的区别

功能特性	etcd	Consul	zookeeper
服务健康检查	连接心跳	服务状态，内存，硬盘等	(弱)长连接，keepalive
多数据中心	—	支持	—
kv存储服务	支持	支持	支持
一致性	raft	raft	paxos
cap	cp	ca	cp
使用接口(多语言能力)	http/grpc	支持http和dns	客户端
watch支持	支持 long polling	全量/支持long polling	支持
自身监控	metrics	metrics	—
安全	https支持（弱）	acl /https	acl
spring cloud集成	已支持	已支持	已支持

延伸：CAP原则

CAP原则又称CAP定理，指的是在一个分布式系统中， Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性），三者不可兼得。

一致性（C）：在分布式系统中的所有数据备份，在同一时刻是否同样的值。（等同于所有节点访问同一份最新的数据副本）
可用性（A）：保证每个请求不管成功或者失败都有响应。
分区容错性（P）：系统中任意信息的丢失或失败不会影响系统的继续运作。

CAP

分布式锁的区别

功能特性	redis	etcd	zookeeper
一致性算法	无	raft	paxos
CAP	AP	CP	CP
高可用	主从	N+1可用	N+1可用
接口类型	客户端	http/grpc	客户端
实现	setNX	restful API	createEphemeral

redis分布式锁

实现简单，市面上也有许多的开源框架。但从根本上来说，它并不适合于分布式锁。因为分布式锁从业务场景上来说，是CP的，但Redis是AP的。

redis依靠主从，一旦主节点宕机，数据没有同步到从节点中，会出现再次上锁的问题。如果业务一定需要数据的一致性，在高并发的场景下是不建议选择redis锁的实现

ZK分布式锁

依靠的是创建临时顺序节点和watch监听机制，它的效率和扩展能力都是比较低的，因此，也较少人使用。

etcd分布式锁

不同于Redis，在一致性和集群方面，借鉴了Zookeeper，使得它的集群能力和一致性能力都是比较强的。

在使用方面，又采用restful API这种比较简单的使用方式，有点像ES。其实etcd是比较适合用来做分布式锁的。

八、安装

源码包安装


15
1
# 获取安装包
2
wget https://github.com/etcd-io/etcd/releases/download/v3.4.14/etcd-v3.4.14-linux-amd64.tar.gz
3

4
# 解压
5
tar -zxvf etcd-v3.4.14-linux-amd64.tar.gz
6

7
# 移动到常用的安装目录
8
mv etcd-v3.4.14-linux-amd64 /usr/local/etcd
9

10
# 后台启动
11
cd /usr/local/etcd
12
nohup /usr/local/etcd/etcd --name my-etcd-1  --listen-client-urls 'http://0.0.0.0:2379' --advertise-client-urls 'http://0.0.0.0:2379' &
13

14
# 查看是否启动成功
15
less nohup.out

Docker部署etcd集群

Zone	IP	同伴通信Port	对外服务Port
etcd-node-1	10.110.2.9	2380	2379
etcd-node-2	10.110.2.10	2380	2379
etcd-node-3	10.110.2.11	2380	2379


41
1
# For node 1
2
docker run \
3
  -p 2379:2379 \
4
  -p 2380:2380 \
5
  --volume=/var/lib/etcd:/etcd-data \
6
  --name etcd quay.io/coreos/etcd:latest \
7
  /usr/local/bin/etcd \
8
  --data-dir=/etcd-data --name etcd-node-1 \
9
  --initial-advertise-peer-urls http://10.110.2.9:2380 --listen-peer-urls http://0.0.0.0:2380 \
10
  --advertise-client-urls http://10.110.2.9:2379 --listen-client-urls http://0.0.0.0:2379 \
11
  --initial-cluster etcd-node-1=http://10.110.2.9:2380,etcd-node-2=http://10.110.2.10:2380,etcd-node-3=http://10.110.2.11:2380 \
12
  --initial-cluster-state new \
13
  --initial-cluster-token my-etcd-token
14

15
# For node 2
16
docker run \
17
  -p 2379:2379 \
18
  -p 2380:2380 \
19
  --volume=/var/lib/etcd:/etcd-data \
20
  --name etcd quay.io/coreos/etcd:latest \
21
  /usr/local/bin/etcd \
22
  --data-dir=/etcd-data --name etcd-node-2 \
23
  --initial-advertise-peer-urls http://10.110.2.10:2380 --listen-peer-urls http://0.0.0.0:2380 \
24
  --advertise-client-urls http://10.110.2.10:2379 --listen-client-urls http://0.0.0.0:2379 \
25
  --initial-cluster etcd-node-1=http://10.110.2.9:2380,etcd-node-2=http://10.110.2.10:2380,etcd-node-3=http://10.110.2.11:2380 \
26
  --initial-cluster-state new \
27
  --initial-cluster-token my-etcd-token
28

29
# For node 3
30
docker run \
31
  -p 2379:2379 \
32
  -p 2380:2380 \
33
  --volume=/var/lib/etcd:/etcd-data \
34
  --name etcd quay.io/coreos/etcd:latest \
35
  /usr/local/bin/etcd \
36
  --data-dir=/etcd-data --name etcd-node-3 \
37
  --initial-advertise-peer-urls http://10.110.2.11:2380 --listen-peer-urls http://0.0.0.0:2380 \
38
  --advertise-client-urls http://10.110.2.11:2379 --listen-client-urls http://0.0.0.0:2379 \
39
  --initial-cluster etcd-node-1=http://10.110.2.9:2380,etcd-node-2=http://10.110.2.10:2380,etcd-node-3=http://10.110.2.11:2380 \
40
  --initial-cluster-state new \
41
  --initial-cluster-token my-etcd-token

参数说明：

name 节点名称
data-dir 指定节点的数据存储目录，这些数据包括节点ID，集群ID，集群初始化配置，Snapshot文件，若未指定—wal-dir，还会存储WAL文件；
initial-advertise-peer-urls 其它节点监听的本节点地址。会告知给集群其它节点.
listen-peer-urls 和同伴通信的地址，用于与其它节点通信
advertise-client-urls 对外提供服务的地址，也就是服务的url
initial-cluster 集群中所有节点
initial-cluster-state 新建集群的时候，这个值为 new；假如已经存在的集群，这个值为 existing
initial-cluster-token 集群的ID


7
1
docker ps -a
2

3
# 进入其中一个节点
4
docker exec -it etcd bin/sh
5

6
# 查看集群成员
7
etcdctl member list

九、使用

数据库操作

set


2
1
$ etcdctl set /dir/key "Hello world"
2
Hello world

支持的选项有： --ttl value 该键值的超时时间(单位为秒)，不配置(默认为0)则永不超时 --swap-with-value value 若该键现在的值是value，则进行设置操作 --swap-with-index value 若该键现在的索引值是指定索引，则进行设置操作

get


2
1
$ etcdctl get /dir/key
2
Hello world

支持的选项有： --sort 对结果进行排序 --consistent 将请求发给主节点，保证获取内容的一致性。

注意：key不存在时会报错

update


2
1
$ etcdctl update /dir/key "Hello"
2
Hello

支持的选项有： --ttl value 超时时间(单位为秒)，不配置(默认为 0)则永不超时。

注意：key不存在时会报错

rm


2
1
$ etcdctl rm /dir/key
2
PrevNode.Value: Hello

支持的选项有： --dir 如果键是个空目录或者键值对则删除 --recursive 删除目录和所有子键 --with-value value 检查现有的值是否匹配 --with-index value 检查现有的index是否匹配

注意：key不存在时会报错

其它命令

mk、mkdir、setdir、updatedir、rmdir等等，具体用法使用命令 etcdctl help 可以查看。

API文档

https://etcd.io/docs/v2.3/api/

GO操作etcd


65
1
package main
2

3
import (
4
  "context"
5
  "fmt"
6
  "time"
7

8
  "github.com/coreos/etcd/clientv3"
9
)
10

11
func main() {
12
  // 连接etcd
13
  cli, err := clientv3.New(clientv3.Config{
14
    Endpoints: []string{"10.110.2.9:2379", "10.110.2.10:2379", "10.110.2.11:2379"},
15
    DialTimeout: 5 * time.Second,
16
  })
17
  if err != nil {
18
    fmt.Println("connect failed, error: ", err)
19
    return
20
  }
21

22
  fmt.Println("connect success")
23
  defer cli.Close()
24

25

26
  key, value := "/logagent/conf/", "sample_value"
27

28
  // put写入kv
29
  putResp, err := cli.Put(context.TODO(), key, value)
30
  if err != nil {
31
    fmt.Println("put to etcd failed, error: ", err)
32
    return
33
  }
34
  fmt.Printf("revision: %d, value: %s\n", putResp.Header.Revision, putResp.Header.String())
35

36
  // get读取kv
37
  ctx, cancel := context.WithTimeout(context.Background(), time.Second)
38
  getResp, err := cli.Get(ctx, key)
39
  cancel()
40
  if err != nil {
41
    fmt.Println("get to etcd failed, error: ", err)
42
    return
43
  }
44
  for _, ev := range getResp.Kvs {
45
    fmt.Printf("%s:%s\n", ev.Key, ev.Value)
46
  }
47

48
  // get读取目录下的所有kv
49
  getAllResp, err := cli.Get(context.TODO(), "/logagent/", clientv3.WithPrefix())
50
  if err != nil {
51
    fmt.Println("get all to etcd failed, error: ", err)
52
    return
53
  }
54
  fmt.Println(getAllResp.Kvs)
55

56
  // delete删除kv
57
  delResp, err := cli.Delete(context.TODO(), key)
58
  if err != nil {
59
    fmt.Println("del to etcd failed, error: ", err)
60
    return
61
  }
62
  fmt.Println(delResp.Deleted)
63
}
64

65

GO实现分布式锁


x
1
120
1
117
1
package main
2

3
import (
4
  "context"
5
  "fmt"
6
  "time"
7

8
  "github.com/coreos/etcd/clientv3"
9
)
10

11
func main() {
12
  // 客户端配置
13
  config := clientv3.Config{
14
    Endpoints:   []string{"127.0.0.1:2379"},
15
    DialTimeout: 5 * time.Second,
16
  }
17

18
  // 建立连接
19
  cli, err := clientv3.New(config)
20
  if err != nil {
21
    fmt.Println("connect to etcd failed, err: ", err)
22
    return
23
  }
24

25
  fmt.Println("connect to etcd success")
26
  defer cli.Close()
27

28
  // lease实现锁自动过期
29
  // op操作
30
  // txn事务：if else then
31

32
  // 1.上锁(创建租约，自动续租，拿着租约去抢占一个key)
33
  lease := clientv3.NewLease(cli)
34
  // 创建一个5秒的租约
35
  leaseGrantResp, err := lease.Grant(context.TODO(), 5)
36
  if err != nil {
37
    fmt.Println("lease create failed， err: ", err)
38
    return
39
  }
40

41
  // 拿到租约的ID
42
  leaseID := clientv3.LeaseID(leaseGrantResp.ID)
43

44
  // 准备一个用于取消自动续租的context
45
  ctx, cancelFun := context.WithCancel(context.TODO())
46

47
  // 确保函数退出后，自动续租会停止
48
  defer cancelFun()
49
  defer lease.Revoke(context.TODO(), leaseID)
50

51
  // 5秒后会取消自动续租
52
  keepRespChan, err := lease.KeepAlive(ctx, leaseID)
53
  if err != nil {
54
    fmt.Println(err)
55
    return
56
  }
57

58
  // 处理续约应答的协程
59
  go func() {
60
    for {
61
      select {
62
      case keepResp := <-keepRespChan:
63
        if keepRespChan == nil {
64
          fmt.Println("租约已经失效了")
65
          goto END
66
        } else { // 每秒会续租一次，所以就会收到一次应答
67
          fmt.Println("收到自动续租应答：", keepResp.ID)
68
        }
69
      }
70
    }
71
  END:
72
  }()
73

74
  // 创建事务
75
  txn := cli.Txn(context.TODO())
76
  // if不存在key，then设置它，else抢锁失败
77
  txn.If(clientv3.Compare(clientv3.CreateRevision("/cron/jobs/job02"), "=", 0)).
78
    Then(clientv3.OpPut("/cron/jobs/job02", "XXX", clientv3.WithLease(leaseID))).
79
    Else(clientv3.OpGet("/cron/jobs/job02")) // 否则抢锁失败
80

81
  // 提交事务
82
  txnResp, err := txn.Commit()
83
  if err != nil {
84
    fmt.Println(err)
85
    return // 没有问题
86
  }
87

88
  // 判断是否抢到了锁
89
  if !txnResp.Succeeded {
90
    fmt.Println("锁被占用：", string(txnResp.Responses[0].GetResponseRange().Kvs[0].Value))
91
    return
92
  }
93

94
  // 2，处理业务
95
  fmt.Println("处理任务")
96
  time.Sleep(5 * time.Second)
97

98
  // 3.释放锁(取消自动续租，释放租约)
99
  // defer 会把租约释放掉，关联的KV就被删除了
100

101
}
102

103
/*
104
终端一
105
$ go run etcd-lock.go
106
connect to etcd succ
107
处理任务
108
收到自动续租应答： 522271907470425639
109
收到自动续租应答： 522271907470425639
110
收到自动续租应答： 522271907470425639
111

112
终端二
113
$ go run etcd-lock.go
114
connect to etcd succ
115
锁被占用： XXX
116
收到自动续租应答： 522271907470425642
117
*/

ETCD

一、简介

二、为什么需要etcd？

三、特点&优势

1、配置共享

2、服务健康检查

3、查找和连接服务

四、应用场景

五、etcd结构

六、Raft协议

抽屉理论

二阶段提交

选举约束

三种投票结果说明：

自己赢得选举

他人赢得选举

未产生结果

七、区别

注册中心的区别

分布式锁的区别

redis分布式锁

ZK分布式锁

etcd分布式锁

八、安装

源码包安装

Docker部署etcd集群

九、使用

数据库操作

set

get

update

rm

其它命令

API文档

GO操作etcd

GO实现分布式锁

十、资源