伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 站长资讯 » 文章详细 订阅RssFeed

面试官:你了解过Redis对象底层实现吗

来源:本站原创 浏览:137次 时间:2021-08-10

推荐阅读(点击即可跳转阅读)

  1. 淘宝服务端高并发分布式架构演进之路

  2. IntelliJ IDEA 从入门到上瘾教程,2019图文版!

  3. 高并发场景下缓存处理的一些思路

  4. 权限设计的一些想法和思考

上一章我们讲了Redis的底层数据结构,不了解的人可能会有疑问:这个和平时用的五大对象有啥关系呢?这一章我们就主要解释他们所建立的联系。

看这个文件之前,如果对ziplist、skiplist、intset等数据结构不熟悉的话,建议先回顾一下上一章节:面试官:你看过Redis数据结构底层实现吗?

0. 五类对象分别是什么

五类对象就是我们常用的string、list、set、zset、hash

1. 为什么要有对象

我们平时主要是通过操作对象的api来操作redis,而不是通过它的调用它底层数据结构来完成(外观模式)。但我们还需要了解其底层,只有这样才能写最优化高效的代码。
1.
跟java一样,对象使开发更方便简洁,降低开发门槛。开发者不需要了解其复杂的底层API,直接调用高层接口即可实现开发。

2.
Redis根据对象类型来判断命令是否违法,如果你set key value1 value2就报错。

3.
对象下可以包含多种数据结构,使数据存储更加多态化。(下面主讲)

4.
Reids基于对象做了垃圾回收(引用计数法)。

5.
对象带有更丰富的属性,来帮助redis实现更高级的功能。(比如对象的闲置时间)。

  1. Redis对象(RedisObject)源码分析
typedef struct redisObject {    // 类型    unsigned type:4;    // 编码    unsigned encoding:4;    // 指向底层实现数据结构的指针    void *ptr;    // ...} robj;type字段

记录对象类型。

我们平时用的命令type <key>,其实就是返回这个字段的属性。

127.0.0.1:6379> set hello worldOK127.0.0.1:6379> type hellostring127.0.0.1:6379> rpush list 1 2 3(integer) 3127.0.0.1:6379> type listlist...

那type有多少中类型呢?看下面这个表:

encoding字段

记录对象使用的编码(数据结构),Reids中称数据结构为encoding。

我们可以这样查看我们redis对象中的encoding:

127.0.0.1:6379> object encoding hello"embstr"127.0.0.1:6379> object encoding list"quicklist"...

既然它是标明该redisObject是使用的什么数据结构,那肯定也有个对应的表:

我们可以看到,Redis对对象的底层encoding分的很细,String类型就有三个,其它四个对象都分别有两种不同的底层数据结构的实现。他们有一规律,就是用ziplist、intset、embstr来实现少量的数据,数据量一旦庞大,就会升级到skiplist、raw、linkedlist、ht来实现,后面我会仔细讲解。

3. 分别分析各个对象的底层编码实现(数据结构)

3.1 字符串(string)

字符串编码有三个:int、raw、embstr。

3.1.1 int

当string对象的值全部是数字,就会使用int编码。

127.0.0.1:6379> set number 123455OK127.0.0.1:6379> object encoding number"int"

3.1.2 embstr

字符串或浮点数长度小于等于39字节,就会使用embstr编码方式来存储,embstr存储内存一般很小,所以redis一次性分配且内存连续(效率高)。

127.0.0.1:6379> set shortStr "suwe suwe suwe"OK127.0.0.1:6379> object encoding shortStr"embstr"

3.1.2 raw

当一个字符串或浮点数长度大于39字节,就使用SDS来保存,编码为raw,由于不确定值的字节大小,所以键和值各分配各的,所以就分配两次内存(回收也是两次),同理它一定不是内存连续的。

127.0.0.1:6379> set longStr "hello everyone, we dont need to sleep around to go aheard! do you think?"OK127.0.0.1:6379> object encoding longStr"raw"

3.1.3 编码转换

前面说过,Redis会自动对编码进行转换来适应和优化数据的存储。

int->raw

条件:数字对象进行append字母,就会发生转换。

127.0.0.1:6379> object encoding number"int"127.0.0.1:6379> append number " is a lucky number"(integer) 24127.0.0.1:6379> object encoding number"raw"embstr->raw

条件:对embstr进行修改,redis会先将其转换成raw,然后才进行修改。所以embstr实际上是只读性质的。

127.0.0.1:6379> object encoding shortStr"embstr"127.0.0.1:6379> append shortStr "(hhh"(integer) 18127.0.0.1:6379> object encoding shortStr"raw"

3.2 列表(list)

列表对象编码可以是:ziplist或linkedlist。
1.
ziplist压缩列表不知道大家还记得不,就是zlbytes zltail zllen entry1 entry2 ..end结构,entry节点里有pre-length、encoding、content属性,忘记的可以返回去看下。

2.
linkedlist,类似双向链表,也是上一章的知识。

3.2.1 编码转换

ziplist->linkedlist

条件:列表对象的所有字符串元素的长度大于等于64字节 & 列表元素数大于等于512. 反之,小于64和小于512会使用ziplist而不是用linkedlist。

这个阈值是可以修改的,修改选项:list-max-ziplist-value和list-max-�������,µµ��Ϊziplist-entriess

3.3 哈希(hash)

哈希对象的编码有:ziplist和hashtable

3.3.1 编码转换

ziplist->hashtable

条件:哈希对象所有键和值字符串长度大于等于64字节 & 键值对数量大于等于512

这个阈值也是可以修改的,修改选项:hash-max-ziplist-value和hash-max-ziplist-entriess

3.4. 集合(set)

集合对象的编码有:intset和hashtable

3.4.1 intset
1.
集合对象所有元素都是整数

2.
集合对象元素数不超过512个

3.4.2 编码转换

intset->hashtable

条件:元素不都是整数 & 元素数大于等于512

3.5. 有序集合(zset)

有序集合用到的编码:ziplist和skiplist

大家可能很好奇阿,ziplist的entry中只有属性content可以存放数据,集合也是key-value形式,那怎么存储呢?

第一个节点保存key、第二个节点保存value 以此类推...

3.5.1 为什么要用这两个编码
1.
如果只用ziplist来实现,无法做到元素的排序,不支持范围查找,能做到元素的快速查找。

2.
如果只用skiplist来实现,无法做到快速查找,但能做到元素排序、范围操作。

3.5.2 编码转换

ziplist->skiplist

条件:有序集合元素数 >= 128 & 含有元素的长度 >= 64

这个阈值也是可以修改的,修改选项:zset-max-ziplist-value和zset-max-ziplist-entriess

4. 垃圾回收

为什么要说内存回收呢,因为redisObject有一个字段:

typedef struct redisObject {    // ...    // 引用计数    int refcount;    // ...} robj;

redis的垃圾回收采用引用计数法(和jvm一样),底层采用一个变量对对象的使用行为进行计数。

初始化为1


对象被引用,+1


对象引用消除,-1


计数器==0, 回收对象

5. 对象共享

5.1 对象共享的体现
1.
redis中,值是整数值且相等的两个对象,redis会将该对象进行共享,且引用计数+1

2.
redis启动会自动生成0-9999的整数值放到内存中来共享。

5.2 为什么要对象共享

节约内存

5.3 为什么不对字符串进行共享

成本太高。

验证整数相等只需要O(1)的时间复杂度,而验证字符串要O(n).

6. 对象的空闲时长

最后,redisObject还有一个字段,记录了对象最后一次被访问的时间:

typedef struct redisObject {    // ...    unsigned lru:22;    // ...} robj;

因为这个字段记录对象最后一次被访问的时间,所以它可以用来查看该对象多久未使用,即:用当前时间-lru

127.0.0.1:6379> object idletime hello(integer) 5110

它还关系到redis的热点数据实现,如果我们选择lr算法,当内存超出阈值后会对空闲时长较高的对象进行释放,回收内存。

  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net