关于
我的项目
相关阅读
热度排行
- [转] 宫崎骏用动漫教给我们的人生哲理,每一句都能说到心里! - (日期:[八月 24, 2013] 点击:[53,383])
- Google 网页爬虫报告无法连接站点解决办法 - (日期:[七月 20, 2014] 点击:[38,647])
- 架设Tiny Tiny RSS(TTRSS)阅读器,找回Google Reader! - (日期:[九月 27, 2013] 点击:[27,779])
- SkyDrive、DropBox和Google Drive三大公有云存储服务对比 - (日期:[六月 25, 2013] 点击:[25,595])
- 升级到至强E5440后,与i5 CPU笔记本性能对比 - (日期:[二月 18, 2014] 点击:[23,734])
- 公钥私钥加密解密数字证书数字签名详解 - (日期:[四月 19, 2014] 点击:[22,966])
- 本站建站技术合集 - (日期:[九月 20, 2013] 点击:[22,515])
- 使用OpenerDNS解决无法访问Google的问题 - (日期:[七月 5, 2014] 点击:[21,810])
- WordPress博客添加“返回顶部”按钮 - (日期:[七月 14, 2013] 点击:[21,219])
- Linux文件系统基础之inode和dentry - (日期:[三月 13, 2015] 点击:[20,179])
- 云存储中的HTTP鉴权算法分析 - (日期:[二月 7, 2014] 点击:[18,646])
- 存储基础知识之——磁盘阵列原理及操作实战 - (日期:[二月 9, 2014] 点击:[17,503])
- 精选37条强大的常用linux shell命令组合 - (日期:[九月 4, 2013] 点击:[17,434])
- DNS原理、架构和配置详解 - (日期:[九月 6, 2013] 点击:[16,814])
- Netty和Jetty的Java NIO 网络框架模型分析 - (日期:[七月 13, 2013] 点击:[16,337])
- CoreOS 初识之安装 - (日期:[十一月 16, 2014] 点击:[16,183])
- Windows与Linux文件系统互访的几种方法 - (日期:[八月 21, 2014] 点击:[15,737])
- Dijkstra算法求解最短路径分析 - (日期:[七月 12, 2014] 点击:[14,930])
- NAS解决方案实现多媒体文件共享播放 - (日期:[十二月 21, 2014] 点击:[13,933])
- 简介 - (日期:[九月 1, 2012] 点击:[13,765])
- 如何编程实现 2 + 2 = 5? - (日期:[六月 2, 2014] 点击:[13,273])
- 搭建了一个iNews程序 - (日期:[十月 15, 2013] 点击:[13,245])
- 2014年9月曝出的Bash ShellShock漏洞简析 - (日期:[九月 26, 2014] 点击:[13,143])
- 彻底解决WordPress博客垃圾评论的问题 - (日期:[八月 5, 2013] 点击:[13,095])
- 如何使用1M的内存排序100万个8位数 - (日期:[三月 27, 2014] 点击:[12,560])
- 全部日志列表 - (日期:[十一月 11, 2012] 点击:[12,346])
- 关于回调函数和this指针探讨 - (日期:[八月 24, 2014] 点击:[12,218])
- 给定一个long型常量,其值为x,给定long型变量a,要求a & x 的取值集合 - (日期:[九月 8, 2012] 点击:[11,711])
- 开源好用的电子书管理服务Talebook(Calibre网络版)安装使用指南 - (日期:[四月 23, 2022] 点击:[11,429])
- WordPress建站必备实用插件 - (日期:[八月 7, 2014] 点击:[11,363])
分类目录
文章归档
- 2025年一月 (1)
- 2024年十二月 (1)
- 2024年四月 (1)
- 2024年二月 (1)
- 2023年九月 (1)
- 2023年一月 (1)
- 2022年十月 (1)
- 2022年八月 (2)
- 2022年四月 (1)
- 2022年三月 (1)
- 2021年十二月 (2)
- 2021年十月 (2)
- 2021年九月 (1)
- 2021年八月 (1)
- 2021年五月 (1)
- 2021年三月 (2)
- 2021年一月 (2)
- 2020年十二月 (5)
- 2020年十一月 (2)
- 2020年十月 (2)
- 2020年九月 (1)
- 2020年八月 (5)
- 2020年七月 (2)
- 2019年九月 (1)
- 2018年八月 (1)
- 2018年七月 (1)
- 2018年六月 (1)
- 2018年五月 (1)
- 2018年三月 (1)
- 2018年二月 (1)
- 2018年一月 (2)
- 2017年十二月 (3)
- 2017年十月 (4)
- 2017年九月 (1)
- 2017年七月 (1)
- 2017年六月 (1)
- 2016年十二月 (1)
- 2016年十月 (1)
- 2016年九月 (1)
- 2016年七月 (2)
- 2016年六月 (1)
- 2016年二月 (3)
- 2015年十二月 (3)
- 2015年十一月 (2)
- 2015年十月 (1)
- 2015年八月 (2)
- 2015年七月 (4)
- 2015年六月 (1)
- 2015年三月 (2)
- 2015年二月 (1)
- 2015年一月 (4)
- 2014年十二月 (2)
- 2014年十一月 (2)
- 2014年十月 (5)
- 2014年九月 (8)
- 2014年八月 (11)
- 2014年七月 (17)
- 2014年六月 (7)
- 2014年五月 (15)
- 2014年四月 (16)
- 2014年三月 (14)
- 2014年二月 (5)
- 2013年十二月 (5)
- 2013年十一月 (3)
- 2013年十月 (13)
- 2013年九月 (13)
- 2013年八月 (13)
- 2013年七月 (9)
- 2013年六月 (8)
- 2013年五月 (1)
- 2013年三月 (3)
- 2013年一月 (1)
- 2012年十一月 (1)
- 2012年九月 (12)
- 2012年八月 (3)
- 2011年二月 (1)
- 2009年三月 (1)
- 2009年二月 (1)
- 2008年十一月 (1)
- 2008年六月 (1)
- 2008年四月 (1)
- 2008年三月 (1)
一致哈希(Consistent Hashing)简介
一致哈希 是一种特殊的哈希算法。在使用一致哈希算法后,哈希表槽位数(大小)的改变平均只需要对 K/n个关键字重新映射,其中 K是关键字的数量n是槽位数量。然而在传统的哈希表中,添加或删除一个槽位的几乎需要对所有关键字进行重新映射。一致哈希的算法最早在如下论文中被提出:
一致哈希在分布式计存储架构中无处不在。是被证明的可以解决经典哈希视图发生变化时,数据搬迁尽可能少的算法。最早是在分布式缓存中提出,参考如下文档,这里提供原文的下载链接:《Consistent Hashing and Random Trees: Distributed Caching Protocols for Relieving Hot Spots on the World Wide Web》。
经典的哈希使用场景为,在使用n台缓存服务器时,一种常用的负载均衡方式是,对资源o的请求使用hash(o) mod n来映射到某一台缓存服务器。当增加或减少一台缓存服务器时这种方式可能会改变所有资源对应的hash值,也就是所有的缓存都失效了,这会使得缓存服务器大量集中地向原始内容服务器更新缓存。因此需要一致哈希算法来避免这样的问题。
一致哈希尽可能使同一个资源映射到同一台缓存服务器。这种方式要求增加一台缓存服务器时,新的服务器尽量分担存储其他所有服务器的缓存资源。减少一台缓存服务器时,其他所有服务器也可以尽量分担存储它的缓存资源。 一致哈希算法的主要思想是将每个缓存服务器与一个或多个哈希值域区间关联起来,其中区间边界通过计算缓存服务器对应的哈希值来决定。(定义区间的哈希函数不一定和计算缓存服务器哈希值的函数相同,但是两个函数的返回值的范围需要匹配。)如果一个缓存服务器被移除,则它所对应的区间会被并入到邻近的区间,其他的缓存服务器不需要任何改变。
一致哈希将每个对象映射到圆环边上的一个点,系统再将可用的节点机器映射到圆环的不同位置。查找某个对象对应的机器时,需要用一致哈希算法计算得到对象对应圆环边上位置,沿着圆环边上查找直到遇到某个节点机器,这台机器即为对象应该保存的位置。 当删除一台节点机器时,这台机器上保存的所有对象都要移动到下一台机器。添加一台机器到圆环边上某个点时,这个点的下一台机器需要将这个节点前对应的对象移动到新机器上。 更改对象在节点机器上的分布可以通过调整节点机器的位置来实现。
下面两张图直观呈现了上述一致哈希的思想:
同样减少节点时,也只影响哈希空间的下一个节点。这样能做到节点加入和退出时挪动的数据量最少。
上述算法存在一个明显的数据分布不均衡的问题,如果N个节点分割好了哈希环,那么加入第N+1个节点时,必然会将一个原有的1/N的空间再一分为2,有N和N+1两个节点来分享,这样,如果数据在环上的分布是均衡的话,那么这两个节点上的数据量是其他节点一半,并且这两个节点在以后的业务中接到的数据也是其他节点的一半,不能完全发挥这两个节点的性能,也就失去了新增节点的意义。
如何解决一致哈希中数据在节点间分布不均匀的问题?算法中引入了虚拟节点的概念。将整个0-2^32的哈希空间分割成一定数量的虚拟节点空间。每个物理节点认领其中的若干个空间。如将整个哈希环分割成1152个虚拟节点,当节点数为32时,每个节点认领1152 / 32 = 36个虚拟节点。当扩容时,假设一次性扩容4个节点,则修改为每个节点认领1152 / 36 = 32个虚拟节点,这样每个物理节点只需要让出4个虚拟节点空间给新加入的第五个节点即可。如果希望整个哈希空间的分配绝对均衡,那么对节点数、扩容步长和虚拟节点总数将有严格的要求。一般而言难以达到,我们只需要确保虚拟节点数足够多,那么扩容或者故障节点时,数据分配仍然能保持大致均衡。