2

学习HashMap红黑树操作原理,染色、旋转、与2-3树的关联

 3 years ago
source link: https://my.oschina.net/itstack/blog/4521233
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
学习HashMap红黑树操作原理,染色、旋转、与2-3树的关联 - 小傅哥 - OSCHINA - 中文开源技术交流社区

持续坚持原创输出,点击蓝字关注我吧

de9da684-dab0-4b75-92ee-afed5315e64b.png

作者:小傅哥
博客:https://bugstack.cn

沉淀、分享、成长,让自己和他人都能有所收获!😜

  • 二、面试题

  • 三、2-3树与红黑树的等价性

    • 1. 为什么既有2-3树要有红黑树

    • 2. 简单2-3树转红黑树

    • 3. 复杂2-3树转红黑树

  • 四、红黑树

    • 1. 平衡操作

    • 2. 旋转+染色运用案例

    • 3. 删除操作

红黑树,是一种高效的自平衡二叉查找树

Rudolf Bayer 于1978年发明红黑树,在当时被称为对称二叉 B 树(symmetric binary B-trees)。后来,在1978年被 Leo J. Guibas 和 Robert Sedgewick 修改为如今的红黑树

红黑树具有良好的效率,它可在近似O(logN) 时间复杂度下完成插入、删除、查找等操作,因此红黑树在业界也被广泛应用,比如 Java 中的 TreeMap,JDK 1.8 中的 HashMap、C++ STL 中的 map 均是基于红黑树结构实现的。

死记硬背,很难学会

红黑树的结构和设计都非常优秀,也同样在实现上有着复杂的处理逻辑,包括插入或者删除节点时;颜色变化、旋转操作等操作。但如果只把这些知识点硬背下来,什么时候染色、什么时候旋转,是没有多大意义的,用不了多久也就忘记了。「所以这部分的学习,了解其根本更重要。」

二、面试题

「谢飞机」,考你几个红黑树的知识点🦀

  1. 红黑树的数据结构都用在哪些场景,有什么好处?
  2. 红黑树的时间复杂度是多少?
  3. 红黑树中插入新的节点时怎么保持平衡?

🤥飞机,2-3树是不没看,回去等消息吧!

三、2-3树与红黑树的等价性

在上一章节《讲解2-3平衡树「红黑树的前身」》,使用了大量图例讲解了2-3树,并在标题处写出它是红黑树的前身。阅读后更容易理解红黑树相关知识。

「红黑树规则」

1. 根节点是黑色2. 节点是红黑或者黑色3. 所有子叶节点都是黑色(叶子是NIL节点,默认没有画出来)4. 每个红色节点必须有两个黑色子节点(也同样说明一条链路上不能有链路的红色节点)5. 黑高,从任一节点到齐每个叶子节点,经过的路径都包含相同数目的黑色节点

那么,这些规则是怎么总结定义出来的呢?接下里我们一步步分析讲解。

1. 为什么既有2-3树要有红黑树

首先2-3树(读法:二三树)就是一个节点有1个或者2个元素,而实际上2-3树转红黑树是由概念模型2-3-4树转换而来的。-4叉就是一个节点里有3个元素,这在2-3树中会被调整,但是在概念模型中是会被保留的。

虽然2-3-4树也是具备2-3树同样的平衡树的特性,但是如果直接把这样的模型用代码实现就会很麻烦,且效率不高,这里的复杂点包括;

  1. 2-叉、3-叉、4-叉,三种结构的节点类型,互相转换复杂度较高
  2. 3-叉、4-叉,节点在数据比较上需要进行多次,不像2-叉节点,直接布尔类型比较即可 非左即右
  3. 代码实现上对每种差异,都需要有额外的代码,规则不够标准化

「所以」,希望找到一种平衡关系,既保持2-3树平衡和O(logn)的特性,又能在代码实现上更加方便,那么就诞生了红黑树。

2. 简单2-3树转红黑树

2-3树转红黑树,也可以说红黑树是2-3树2-3-4树的另外一种表现形式,也就是更利于编码实现的形式。

「简单转换示例;」

1f8e00b6-e350-4005-9c21-7b87c2581a19.png 2-叉、3-叉、4-叉,转换红黑树示意图

从上图可以看出,2-3-4树与红黑树的转换关系,包括;

  1. 2-叉节点,转换比较简单,只是把原有节点转换为黑色节点
  2. 3-叉节点,包括了2个元素,先用红色线把两个节点相连,之后拆分出来,最后调整高度 黑色节点在上
  3. 4-叉节点,包括了3个元素,分别用红黑线连接,之后拆分出来拉升高度。 这个拉升过程和2-3树调整一致,只是添加了颜色

「综上」,就是2-3-4树的节点转换,总结出来的规则,如下;

  1. 将2-3-4树,用二叉树的形式表示
  2. 3-叉、4-叉节点,使用红色、黑色连线进行连接
  3. 另外,3-叉节点有两种情况,导致转换成二叉树,就有左倾和右倾

3. 复杂2-3树转红黑树

简单2-3树转换红黑树的过程中,了解到一个基本的转换规则右旋定义,接下来我们在一个稍微复杂一点的2-3树与红黑树的对应关系,如下图;

4c5b85d5-fa58-4dd4-9b11-8eb120fb0bb0.png 复杂2-3树转换红黑树

上图是一个稍微复杂点的2-3树,转换为红黑树的过程,是不这样一张图让你对红黑树更有感觉了,同时它也满足一下条件;

  1. 从任意节点到叶子节点,所经过的黑色节点数目相同
  2. 黑色节点保持着整体的平衡性,也就是让整个红黑树接近于O(logn)时间复杂度
  3. 其他红黑树的特点也都满足,可以对照红黑树的特性进行比对

四、红黑树

1. 平衡操作

通过在上一章节2-3树的学习,在插入节点时并不会插到空位置,而是与现有节点融合以及调整,保持整个树的平衡。

而红黑树是2-3-4树的一种概念模型转换而来,在插入节点时通过红色链接相连,也就是插入红色节点。插入完成后进行调整,以保持树接近平衡。

那么,为了让红黑树达到平衡状态,主要包括染色、↔左右旋转、这些做法其实都是从2-3树演化过来的。接下来我们就分别讲解几种规则的演化过程,以此更好了解红黑树的平衡操作。

1.1 左旋转

「左旋定义:」 把一个向右倾斜的红节点链接(2-3树,3-叉双元素节点),转化为左链接。

2a10004c-7377-4fe3-9060-ca6c0e5dc751.png

背景:顺序插入元素,1、2、3,2-3树保持平衡,红黑树暂时处于右倾斜。

接下来我们分别对比两种树结构的平衡操作;

  1. 2-3树,所有插入的节点都会保持在一个节点上,之后通过调整节点位置,保持平衡。
  2. 红黑树,则需要通过节点的左侧旋转,将元素2拉起来,元素1和元素3,分别成为左右子节点。

红黑树的左旋,只会处理与之对应的2-3树节点进行操作,不会整体改变。

1.2 右旋转

「右旋定义:」 把一个向左倾斜的红节点连接(2-3树,3-叉双元素节点),转换为右连接。

81bb0095-8298-473c-80a9-e785d0395321.png

背景:顺序插入元素,3、1、1,2-3树保持平衡,红黑树暂时处于左倾斜。

接下来我们分别对比两种树结构的平衡操作;

  1. 2-3树,所有插入的节点都会保持在一个节点上,之后通过调整节点位置,保持平衡。
  2. 红黑树,则需要通过节点的右侧旋转,将元素2拉起来,元素1和元素3,分别成为左右子节点。

「你会发现,左旋与右旋是相互对应的,但在2-3树中是保持不变的」

1.3 左右旋综合运用

左旋、右旋,我们已经有了一个基本的概念,那么接下来我们再看一个可以综合左右旋以及对应2-3树的演化案例,如下;

3340b8a6-0947-4f94-a4e0-b580210116bd.png

以上的例子分别演示了一个元素插入的三种情况,如下;

  1. 1、3,插入0,左侧底部插入,与2-3树相比,需要右旋保持平衡
  2. 1、3,插入2,中间位置插入,首先进行左旋调整元素位置,之后进行右旋进行树平衡
  3. 1、3,插入5,右侧位置插入,此时正好保持树平衡,不需要调整

1.4 染色

在2-3树中,插入一个节点,为了保持树平衡是不插入到空位置上的,当插入节点后元素数量有3个后则需要调整中间元素向上,来保持树平衡。与之对应的红黑树则需要调整颜色,来保证红黑树的平衡规则,具体参考如下;

79b2971e-9d2f-41cd-8d59-f409d6627b98.png

2. 旋转+染色运用案例

接下来我们把上面讲解到的旋转染色,运用到一个实际案例中,如下图;

c3c41d93-4741-4849-91b7-c9ccaa9f8068.png
  • 首先从左侧开始,是一个按照顺序插入生产出来的红黑树,插入顺序; 7、2、8、1、4、3、5
  • α,向目前红黑树插入元素6,插入后右下角有三个红色节点; 3、5、6
  • β,因为右下角满足染色条件,变换后;黑色节点(3、5)、红色节点(4、6)。
  • γ,之后看被红色连线链接的节点 7、4、2,最小节点在中间,左旋平衡树结构。
  • δ,左旋完成后,红色链接线的 7、4、2为做倾顺序节点,因此需要做右旋操作。
  • ε,左旋、右旋,调整完成后,又满足了染色操作。到此恢复红黑树平衡。

注意,所有连接红色节点的,都是是红色线。以此与2-3树做对应。

3. 删除操作

根据2-3-4树模型的红黑树,在删除的时候基本是按照2-3方式进行删除,只不过在这个过程中需要染色和旋转操作,以保持树平衡。删除过程主要可以分为如图四种情况,如下;

5fdee1f0-a6b8-4fdd-a7aa-f434a71482d9.png

3.1 删除子叶红色节点

红色子叶节点的删除并不会破坏树平衡,也不影响树高,所以直接删除即可,如下;

6b147736-6c94-4e81-b374-4fc670ca06fc.png

3.2 删除左侧节点

3.2.1 被删节点兄弟为黑色&含右子节点
c884fd18-8e92-4ad0-ba71-72197e56e15a.png
3.2.2 被删节点兄弟为黑色&含左子节点
9769c8ea-dbdc-4ac7-911c-68d0da165ccf.png
3.2.3 被删节点兄弟为黑色&含双子节点(红)
ec721918-3a3a-4387-a1dd-e6e535481485.png
3.2.4 被删节点兄弟为黑色&不含子节点
47ecb28d-6d41-4c4f-8d3f-1b9e3d85a7a0.png
3.2.5 被删节点兄弟为黑色&含双黑节点(黑)
fc047973-3e98-4f05-9872-1d50674311c6.png

3.3. 删除右侧节点

3.3.1 被删节点兄弟为黑色&含左子节点
0607d1cb-f316-46bc-b0b7-97899e20d3f9.png
3.3.2 被删节点兄弟为黑色&含右子节点
dc42cefa-fec8-4266-9465-f15cfdd56196.png
3.3.3 被删节点兄弟为黑色&含双子节点(红)
bca546fe-3df2-422f-8bd5-aa142bbd8bb7.png
3.2.4 被删节点兄弟为黑色&不含子节点
15db4dd2-5435-45b6-a3f6-19670285eb11.png
3.2.5 被删节点兄弟为黑色&含双黑节点(黑)
f4fe57e2-1331-4b24-97de-894b19b9aa97.png
  • 从2-3树到解释2-3-4树概念推导出红黑树,从元素的在2-3树中的插入删除对照到红黑树中保持平衡操作,从原理解析到各项情况实际操作等,以及把绝大部分红黑树内容全部介绍完成。
  • 红黑树的原理理解要比背概念更重要,这是一种数据结构的学习,更重要的是技术迁移学习,而不是为了面试背几道题。可能这个学习过程非常烧脑,但适合学习根本。
  • 在编写本篇文章时,参考了大量的资料进行校正,包括优秀文章;
    • 红黑树可视化:https://www.cs.usfca.edu/~galles/visualization/RedBlack.html
    • 做倾红黑树论文:Left-leaning Red-Black Trees

bugstack虫洞栈

沉淀、分享、成长,让自己和他人都能有所收获!

作者小傅哥多年从事一线互联网Java开发,从19年开始编写工作和学习历程的技术汇总,旨在为大家提供一个较清晰详细的核心技能学习文档。如果本文能为您提供帮助,请给予支持(关注、点赞、分享)!1f0cb508-3d1d-4c34-be55-63f47eb4db5f.png

4ac658c2-88d8-4946-b345-3c28239298d0.png

感谢支持小傅哥原创,欢迎点击在看转发8c4cbb4c-9d97-4869-a3bf-096df046037e.gif

本文分享自微信公众号 - bugstack虫洞栈(bugstack)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK