为人人设计的分布式key-value系统架构[原创]

8.10 增加dev4server组里esx大侠提出的几个性问题

这个架构的产生，是为了公司的一个新项目，而后来慢慢变成了解决整个公司的所有问题的一个架构，期间经yahoo的angentZh先生、dev4server组里张立冰先生、盛大的许式伟先生推荐研究了bigtable、Dynamo等很有性的分布式架构。

如下图所示：

总体：底层以key-value存储，每个节点内作主主互备，节点以一致性哈希存取，哈希所使用的key为relation-key，非直接存取时的key。

step 0：连接客户端收到一个key为relatioin-key_id的存取请求，取出relation-key进行一致性哈希计算，这里是为了让相关的内容都能存在一个节点上，类似bigtable的tablet；

step 1：连接客户端读取最新的配置文件，server.conf。

step 2：根据配置文件寻找正确的节点。

step 3：在B节点之间增加了一个节点A的时候，A前的虚拟节点将寻找不到数据，此时连接客户端会重新读取老的配置文件server.conf.1，根据老的配置，这里的数据会去B节点读取原来的数据，读到的数据会转移到新增加的节点A中。

step 4：增加节点A后，服务器端会同时运行手动的转移脚本，转移脚本直接将B节点中符合A节点的存取规则的数据全部转移，转移结束将作server.conf.1，进行删除老配置文件的作。

这个架构的特点：

1.底层的key-value引擎并不特指某种，用cabinet或者是mysql都是可以的；

2.增加或者删除节点都可以是半自动+半手动或者是全手动处理；

3.适合大多数大型网站任何业务。

这个架构的名字：未命名

1. 速度：relation-key存储的方式，使相关性强的数据都在一起，保障批量的速度；

2.容灾：底层master-master同步的DB保障了其中一台出现故障不会影响整个系统；

3.扩展：手动加自动的方式使扩展节点应对自如。

Q:如何发现是找不到数据，而不是数据本来就没有？

A:系统中有server.conf server.conf.1 server.conf.2....只检测配置文件，如果手动迁移数据结束，配置文件将被删除。
Q:节点A进入时，是否能有选择的向B所要数据？

A:这里的确是忽略了同一个key的数据的版本控制的问题。如果先执行了手动脚本再存到A结点是正常的，如果先存到A再执行手动脚本，会出现老数据盖了新数据。不知有啥好的idea没?
Q:所要数据后，何时算完成？因为B可能一直在有新数据生成。

A:如果是新的配置文件上来了，写入B的数据应该就已经是新的规则了，这样，只需要手动执行的脚本循环当前的数据一圈，其中的数据自然是正确无误的了。手动脚本完成后删除老的配置文件标志迁移结束。
Q:完成后，节点A如何生效？

A:老的配置文件删除前，读数据作是半生效状态（逐步恢复）；老的配置文件被删除后，A节点的读写都自然生效了。
Q:容灾，如果节点A掉了，那B上是否有A所保存的信息？

A:一个节点下有至少两个物理实际节点做主主备份，上面是一个带网络检测和自动选取连接的工具，虚拟成一个节点，换句话说，A节点两台机器全部坏掉的可能性这里视为零。

原创文章如转载，请注明：转载自五四陈科学院[http://www.54chen.com]