翼度科技»论坛 云主机 LINUX 查看内容

Linux内核数据管理利器--红黑树

7

主题

7

帖子

21

积分

新手上路

Rank: 1

积分
21
目录

写在前面

本文通过两个方面让读者可以深入理解Linux内核中红黑树RB Tree的实现以及使用,读完此文章,你可以收获:

  • 红黑树的特性
  • 红黑树的插入、删除、查询操作
  • 在Linux内核代码中如何使用RB Tree库函数,这一部分通过一个实验带读者体会
1. 红黑树的原理

红黑树RB Tree是二叉树的一种,作为一种自平衡二叉树(一些情况下不是完全平衡的),它在最坏的情况下查询复杂度为\(O(logN)\)。与AVL树类似,尽管RB Tree查询效率不如AVL树(因为RB Tree左右子树高度差距最多接近两倍,而AVL树始终保持左右子树高度最多不超过1),但其插入删除效率高,适合用于大数据量且更新频繁的场景,例如内核IO调度算法。
红黑树在二叉树的基础上做了如下约束:

  • 树种全部节点要么是黑色要么是红色
  • 树的根节点是黑色的
  • 叶节点(指NULL节点)颜色为黑色
  • 红色节点之间不能相邻
  • 一个节点的左子树和右子树高度(只统计黑色节点)相同
在介绍红黑树的操作前,我们先说明以下几点惯例:

  • 所有节点在插入的时候都将是红色节点(不包括根节点,其插入时是黑色的),这样有一个好处是可以不违反约束1,2,3和5,对于约束1,2和3是显然的,对于5,由于添加红色节点并不会影响其父节点及以上节点左右子树黑色节点数量,故不违反约束5。因此,在插入节点后,只需判断是否违反约束4。
  • 一颗红黑树中,某一节点左右子树节点高度差不会超过2倍,考虑一种极限情况:左子树黑色节点高度为x,且最长路径中不存在红色节点,这是允许的,右子树有黑色节点高度为x,这样满足约束5,除此之外,右子树最长路径黑色几点之间都由红色节点隔开(满足约束4),故右子树总高度为2x-1,约等于2x。
2. 红黑树操作

在Linux内核代码中仅提供了红黑树节点链接、索引、调整、删除等基础操作,不包含特定含义的查询、插入等操作:

  • void rb_insert_color(struct rb_node *, struct rb_root *);,检查调整一个指定节点,通常与rb_link_node搭配使用;
  • void rb_erase(struct rb_node *, struct rb_root *);,从树中删除一个指定节点;
  • struct rb_node *rb_next(struct rb_node *);,返回一个节点的下一个节点(顺序的);
  • struct rb_node *rb_prev(struct rb_node *);,返回一个节点的上一个节点(顺序的);
  • struct rb_node *rb_first(struct rb_root *);,返回树中的第一个节点(顺序的);
  • struct rb_node *rb_last(struct rb_root *);,返回树中的最后一个节点(顺序的);
  • void rb_replace_node(struct rb_node *victim, struct rb_node *new, struct rb_root *root);,用new替换节点victim;
  • inline void rb_link_node(struct rb_node * node, struct rb_node * parent, struct rb_node ** rb_link),将一个节点链接到树中指定位置,parent是父节点,rb_link指定了链接父节点的位置是左还是右。
2.1 红黑树的节点插入

根据第一个部分我们所讲的内容可知,一个节点插入RB Tree时会被染成红色,因此只需要检查插入时是否违反规则4,既插入节点与其父节点是否都是红色,然后做出相应的调整,这些工作由rb_insert_color函数完成,其主要分以下三种情况,第一种是父节点为黑色,那么不需要做任何事情,插入红节点后该树仍然符合所有规则。
  1. void rb_insert_color(struct rb_node *node, struct rb_root *root)
  2. {
  3.     struct rb_node *parent, *gparent;
  4.     while ((parent = node->rb_parent) && parent->rb_color == RB_RED)
  5.     {
  6.         ... // 检查与处理
  7.     }
  8.     root->rb_node->rb_color = RB_BLACK; // 保证根节点是黑色的
  9. }
复制代码
由代码可知,只要父节点为黑色那么可以直接退出。第二种情况是父节点为红色,此时违反规则4,但是其叔父节点(父节点的父节点的另一个子节点)也是红色,如下图所示,左边四个树包含了全部这种情况,A是祖父,B是插入节点的父节点,E是插入节点。

这种情况下,可以直接将父节点和叔父节点染成黑色,祖父节点染成红色,这样插入节点的父节点解决了规则4,同时祖父节点左右子树黑色节点高度仍然相同,例如上图中的第5棵树,之后将祖父节点作为插入节点继续向上检查,下面的代码执行的正是这一步骤:
  1. void rb_insert_color(struct rb_node *node, struct rb_root *root)
  2. {
  3.     struct rb_node *parent, *gparent;
  4.     while ((parent = node->rb_parent) && parent->rb_color == RB_RED)
  5.     {
  6.         gparent = parent->rb_parent; // 祖父节点
  7.         if (parent == gparent->rb_left)
  8.         {
  9.             {
  10.                 register struct rb_node *uncle = gparent->rb_right;
  11.                 if (uncle && uncle->rb_color == RB_RED)
  12.                 {
  13.                     uncle->rb_color = RB_BLACK;
  14.                     parent->rb_color = RB_BLACK;
  15.                     gparent->rb_color = RB_RED;
  16.                     node = gparent;
  17.                     continue;
  18.                 }
  19.             }
  20.             ... // 其他检查和处理
  21.         } else {
  22.             {
  23.                 register struct rb_node *uncle = gparent->rb_left;
  24.                 if (uncle && uncle->rb_color == RB_RED)
  25.                 {
  26.                     uncle->rb_color = RB_BLACK;
  27.                     parent->rb_color = RB_BLACK;
  28.                     gparent->rb_color = RB_RED;
  29.                     node = gparent;
  30.                     continue;
  31.                 }
  32.             }
  33.             ... // 其他检查和处理
  34.         }
  35.     }
  36.     root->rb_node->rb_color = RB_BLACK;
  37. }
复制代码
第三种情况最为复杂,由于叔父节点不再是红色,故不能只靠染色来解决,其可分为以下四种:

  • 插入节点为父节点的右节点,父节点为祖父节点的左节点;
  • 插入节点为父节点的左节点,父节点为祖父节点的左节点;
  • 插入节点为父节点的右节点,父节点为祖父节点的右节点;
  • 插入节点为父节点的左节点,父节点为祖父节点的右节点;
在这四种中,第2种(左左)和第3种(右右)需要先进行一次染色解决规则4冲突,然后经过旋转解决染色后的规则5冲突。以左左为例,先将父节点染成黑色,祖父节点染成红色,此时不再有颜色冲突,但是规则5出现冲突,因为左子树显然多出一个黑色节点,所以接下来祖父节点右旋,将父节点作为祖父节点,这样就完成了两个恰到好处的事情:1)祖父节点位置的颜色再次变为黑色,这必然使得祖父不会破坏规则4;2)由于原祖父节点染成红色,所以即使其变成了右子树的节点也不影响规则5。下图展示了这一过程:

对于右右,其与左左区别在于使用左旋,原理可以参考左左自行推断。
对于第1种(右左)和第4种(左右),需要多增加一个旋转,使其变为左左或者右右,然后便可按照左左/右右的规则调整RB Tree,下图展示了右左的调整过程。

需要注意的是,不论是这四种中的哪种,最后操作的结果实际上都是在祖父节点和叔父节点直接新插入了红色节点,祖父节点颜色并没有改变,而且黑色节点数量也没有改变,所以在调整结束后无需继续向上检查。下面是内核中关于第三种情况的处理:
  1. static void __rb_rotate_left(struct rb_node *node, struct rb_root *root)
  2. {
  3.     struct rb_node *right = node->rb_right;
  4.     if ((node->rb_right = right->rb_left))
  5.         right->rb_left->rb_parent = node;
  6.     right->rb_left = node;
  7.     if ((right->rb_parent = node->rb_parent))
  8.     {
  9.         if (node == node->rb_parent->rb_left)
  10.             node->rb_parent->rb_left = right;
  11.         else
  12.             node->rb_parent->rb_right = right;
  13.     }
  14.     else
  15.         root->rb_node = right;
  16.     node->rb_parent = right;
  17. }
  18. static void __rb_rotate_right(struct rb_node *node, struct rb_root *root)
  19. {
  20.     struct rb_node *left = node->rb_left;
  21.     if ((node->rb_left = left->rb_right))
  22.         left->rb_right->rb_parent = node;
  23.     left->rb_right = node;
  24.     if ((left->rb_parent = node->rb_parent))
  25.     {
  26.         if (node == node->rb_parent->rb_right)
  27.             node->rb_parent->rb_right = left;
  28.         else
  29.             node->rb_parent->rb_left = left;
  30.     }
  31.     else
  32.         root->rb_node = left;
  33.     node->rb_parent = left;
  34. }
  35. void rb_insert_color(struct rb_node *node, struct rb_root *root)
  36. {
  37.     struct rb_node *parent, *gparent;
  38.     while ((parent = node->rb_parent) && parent->rb_color == RB_RED)
  39.     {
  40.         gparent = parent->rb_parent;
  41.         if (parent == gparent->rb_left)
  42.         {
  43.             {
  44.                 register struct rb_node *uncle = gparent->rb_right;
  45.                 ... // 叔父为红色的处理
  46.             }
  47.             if (parent->rb_right == node)
  48.             {
  49.                 register struct rb_node *tmp;
  50.                 __rb_rotate_left(parent, root);
  51.                 tmp = parent;
  52.                 parent = node;
  53.                 node = tmp;
  54.             }
  55.             parent->rb_color = RB_BLACK;
  56.             gparent->rb_color = RB_RED;
  57.             __rb_rotate_right(gparent, root);
  58.         } else {
  59.             {
  60.                 register struct rb_node *uncle = gparent->rb_left;
  61.                 ... // 叔父为红色的处理
  62.             }
  63.             if (parent->rb_left == node)
  64.             {
  65.                 register struct rb_node *tmp;
  66.                 __rb_rotate_right(parent, root);
  67.                 tmp = parent;
  68.                 parent = node;
  69.                 node = tmp;
  70.             }
  71.             parent->rb_color = RB_BLACK;
  72.             gparent->rb_color = RB_RED;
  73.             __rb_rotate_left(gparent, root);
  74.         }
  75.     }
  76.     root->rb_node->rb_color = RB_BLACK;
  77. }
复制代码
在Linux内核中,如果需要插入一个节点到RB Tree中,需要执行以下几步:

  • 遍历RB Tree,找到新节点插入位置;
  • 调用rb_link_node将节点链接到1找到的位置;
  • 调用rb_insert_color调整RB Tree,使其符合规则。
2.2 红黑树的节点删除

红黑树的删除比插入操作更为复杂,其分为两个阶段,第一个阶段先删除节点,其技巧为:如果删除节点只有一个孩子或者没孩子,那么直接删除该节点,并链接父节点和孩子节点,代码如下:
  1. void rb_erase(struct rb_node *node, struct rb_root *root)
  2. {
  3.     struct rb_node *child, *parent;
  4.     int color;
  5.     if (!node->rb_left)
  6.         child = node->rb_right;
  7.     else if (!node->rb_right)
  8.         child = node->rb_left;
  9.     else
  10.     {
  11.         ... // 有两个孩子的操作
  12.     }
  13.     parent = node->rb_parent;
  14.     color = node->rb_color;
  15.     // 链接父节点和孩子节点
  16.     if (child)
  17.         child->rb_parent = parent;
  18.     if (parent)
  19.     {
  20.         if (parent->rb_left == node)
  21.             parent->rb_left = child;
  22.         else
  23.             parent->rb_right = child;
  24.     }
  25.     else
  26.         root->rb_node = child;
  27. color: // 第二阶段:调整
  28.     if (color == RB_BLACK)
  29.         __rb_erase_color(child, parent, root);
  30. }
复制代码
如果有两个孩子,那么选择删除节点的顺序下一个节点替换删除节点,既删除位置变到了删除节点的顺序下一个节点的原先位置,这样可以保证删除节点只有一个右子树(因为删除节点的顺序下一个节点是删除节点的右子树的最左边的叶子节点),代码如下:
  1. void rb_erase(struct rb_node *node, struct rb_root *root)
  2. {
  3.     struct rb_node *child, *parent;
  4.     int color;
  5.     if (!node->rb_left)
  6.         ...
  7.     else if (!node->rb_right)
  8.         ...
  9.     else
  10.     {
  11.         struct rb_node *old = node, *left;
  12.         node = node->rb_right;
  13.         while ((left = node->rb_left) != NULL)
  14.             node = left;
  15.         // 此时 node 为 删除节点的顺序下一个节点(只有右子树或者无孩子),old 为原删除节点
  16.         child = node->rb_right;
  17.         parent = node->rb_parent;
  18.         color = node->rb_color;
  19.         // 链接删除节点的顺序下一个节点的孩子节点和父节点
  20.         if (child)
  21.             child->rb_parent = parent;
  22.         if (parent)
  23.         {
  24.             if (parent->rb_left == node)
  25.                 parent->rb_left = child;
  26.             else
  27.                 parent->rb_right = child;
  28.         }
  29.         else
  30.             root->rb_node = child;
  31.         if (node->rb_parent == old) // 由于 old 是待删除节点,而 parent 此时指向 old,所以要将 parent 指向新的 node
  32.             parent = node;
  33.         // node 节点替换原删除节点
  34.         node->rb_parent = old->rb_parent;
  35.         node->rb_color = old->rb_color;
  36.         node->rb_right = old->rb_right;
  37.         node->rb_left = old->rb_left;
  38.         // 将新 node 链接到原删除节点 old 的父节点上
  39.         if (old->rb_parent)
  40.         {
  41.             if (old->rb_parent->rb_left == old)
  42.                 old->rb_parent->rb_left = node;
  43.             else
  44.                 old->rb_parent->rb_right = node;
  45.         } else
  46.             root->rb_node = node;
  47.         // 将新 node 链接到原删除节点 old 的子节点上
  48.         old->rb_left->rb_parent = node;
  49.         if (old->rb_right) // 可能删除的右子树只有一个节点,删除后变为NULL
  50.             old->rb_right->rb_parent = node;
  51.         goto color;
  52.     }
  53. color: // 第二阶段:调整
  54.     if (color == RB_BLACK)
  55.         __rb_erase_color(child, parent, root);
  56. }
复制代码
第二阶段
当在第一阶段确定了删除节点位置(通常其只有一个子树或者没有子树)后,将会检查是否要进行调色和旋转使得节点删除后的RB Tree再次符合规则。我们在下面通过5种大的情况来讲解这一操作。
(1) 最简单的情况是:我们删除的节点颜色是红色的,这意味着节点删除后,子树连接到其父节点后黑色节点高度不变,因此无需调整,这点可以在rb_erase函数的最后印证,因为只有删除节点为黑色才需要执行__rb_erase_color函数。
(2) 稍微复杂的一种情况是:我们删除的节点B颜色是黑色,同时其父节点的另一个孩子节点C颜色也是黑色且其左右孩子节点E/F也为黑色。由于父节点A的一边少了一个黑色节点,所以应该把另一边的黑色节点染成红色,这样父节点A的左右黑色节点高度相同,而且C和E/F节点颜色不冲突。对于父节点A,如果其为红色,那正好,将其染色为黑色,这样以A为根的子树高度又恢复原样,且颜色也不会冲突;如果A为黑色,那么就要继续向上检查调整,代码如下:
  1. static void __rb_erase_color(struct rb_node *node, struct rb_node *parent,
  2.                  struct rb_root *root)
  3. {
  4.     struct rb_node *other;
  5.     while ((!node || node->rb_color == RB_BLACK) && node != root->rb_node)
  6.     {
  7.         if (parent->rb_left == node)
  8.         {
  9.             other = parent->rb_right;
  10.             if (other->rb_color == RB_RED)
  11.             {
  12.                 ...
  13.             }
  14.             if ((!other->rb_left ||
  15.                  other->rb_left->rb_color == RB_BLACK)
  16.                 && (!other->rb_right ||
  17.                 other->rb_right->rb_color == RB_BLACK))
  18.             {
  19.                 other->rb_color = RB_RED;
  20.                 node = parent;
  21.                 parent = node->rb_parent;
  22.             }
  23.             else
  24.             {
  25.                 ...
  26.             }
  27.         }
  28.         else
  29.         {
  30.             other = parent->rb_left;
  31.             if (other->rb_color == RB_RED)
  32.             {
  33.                 ...
  34.             }
  35.             if ((!other->rb_left ||
  36.                  other->rb_left->rb_color == RB_BLACK)
  37.                 && (!other->rb_right ||
  38.                 other->rb_right->rb_color == RB_BLACK))
  39.             {
  40.                 other->rb_color = RB_RED;
  41.                 node = parent;
  42.                 parent = node->rb_parent;
  43.             }
  44.             else
  45.             {
  46.                 ...
  47.             }
  48.         }
  49.     }
  50.     if (node)
  51.         node->rb_color = RB_BLACK;
  52. }
复制代码
下面以删除节点为左子树为例展示了调色过程:

(3) 我们删除的节点B颜色是黑色的,同时其父节点A的另一个孩子节点C颜色是黑色的,而C左孩子节点E为黑色,右孩子节点F为红色。对于这种情况,可以将父节点染色成黑色左旋/右旋使得删除节点一侧增加一个黑色节点,对于另一边,因为C因为旋转变成了子树根节点,所以其应该继承原先子树根节点颜色。除此之外,由于C不再是子树节点,所以少了一个黑色节点,所以要把F染成黑色,代码如下:
  1. static void __rb_erase_color(struct rb_node *node, struct rb_node *parent,
  2.                  struct rb_root *root)
  3. {
  4.     struct rb_node *other;
  5.     while ((!node || node->rb_color == RB_BLACK) && node != root->rb_node)
  6.     {
  7.         if (parent->rb_left == node)
  8.         {
  9.             other = parent->rb_right;
  10.             if (other->rb_color == RB_RED)
  11.             {
  12.                 ...
  13.             }
  14.             if ((!other->rb_left ||
  15.                  other->rb_left->rb_color == RB_BLACK)
  16.                 && (!other->rb_right ||
  17.                 other->rb_right->rb_color == RB_BLACK))
  18.             {
  19.                 ...
  20.             }
  21.             else
  22.             {
  23.                 if (!other->rb_right ||
  24.                     other->rb_right->rb_color == RB_BLACK)
  25.                 {
  26.                     ...
  27.                 }
  28.                 other->rb_color = parent->rb_color;
  29.                 parent->rb_color = RB_BLACK;
  30.                 if (other->rb_right)
  31.                     other->rb_right->rb_color = RB_BLACK;
  32.                 __rb_rotate_left(parent, root);
  33.                 node = root->rb_node;
  34.                 break;
  35.             }
  36.         }
  37.         else
  38.         {
  39.             other = parent->rb_left;
  40.             if (other->rb_color == RB_RED)
  41.             {
  42.                 ...
  43.             }
  44.             if ((!other->rb_left ||
  45.                  other->rb_left->rb_color == RB_BLACK)
  46.                 && (!other->rb_right ||
  47.                 other->rb_right->rb_color == RB_BLACK))
  48.             {
  49.                 ...
  50.             }
  51.             else
  52.             {
  53.                 if (!other->rb_left ||
  54.                     other->rb_left->rb_color == RB_BLACK)
  55.                 {
  56.                     ...
  57.                 }
  58.                 other->rb_color = parent->rb_color;
  59.                 parent->rb_color = RB_BLACK;
  60.                 if (other->rb_left)
  61.                     other->rb_left->rb_color = RB_BLACK;
  62.                 __rb_rotate_right(parent, root);
  63.                 node = root->rb_node;
  64.                 break;
  65.             }
  66.         }
  67.     }
  68.     if (node)
  69.         node->rb_color = RB_BLACK;
  70. }
复制代码
下面以删除节点为左子树为例展示了调色过程:

(4) 我们删除的节点B颜色是黑色的,同时其父节点A的另一个孩子节点C颜色是黑色的,而C左孩子节点E为红色,右孩子节点F为黑色。对于这种情况,应该先经过染色和旋转将其变为情况(3)。其过程为将C染成红色右旋,这样C原先这颗子树左右子树黑色节点高度不变,只是C和E颜色冲突,不过这不用担心,按照(3)的方法,C最后变成黑色,而E变成了原先A的颜色,代码如下:
  1.                  struct rb_root *root)
  2. {
  3.     struct rb_node *other;
  4.     while ((!node || node->rb_color == RB_BLACK) && node != root->rb_node)
  5.     {
  6.         if (parent->rb_left == node)
  7.         {
  8.             other = parent->rb_right;
  9.             if (other->rb_color == RB_RED)
  10.             {
  11.                 ...
  12.             }
  13.             if ((!other->rb_left ||
  14.                  other->rb_left->rb_color == RB_BLACK)
  15.                 && (!other->rb_right ||
  16.                 other->rb_right->rb_color == RB_BLACK))
  17.             {
  18.                 ...
  19.             }
  20.             else
  21.             {
  22.                 if (!other->rb_right ||
  23.                     other->rb_right->rb_color == RB_BLACK)
  24.                 {
  25.                     register struct rb_node *o_left;
  26.                     if ((o_left = other->rb_left))
  27.                         o_left->rb_color = RB_BLACK;
  28.                     other->rb_color = RB_RED;
  29.                     __rb_rotate_right(other, root);
  30.                     other = parent->rb_right;
  31.                 }
  32.                 other->rb_color = parent->rb_color;
  33.                 parent->rb_color = RB_BLACK;
  34.                 if (other->rb_right)
  35.                     other->rb_right->rb_color = RB_BLACK;
  36.                 __rb_rotate_left(parent, root);
  37.                 node = root->rb_node;
  38.                 break;
  39.             }
  40.         }
  41.         else
  42.         {
  43.             other = parent->rb_left;
  44.             if (other->rb_color == RB_RED)
  45.             {
  46.                 ...
  47.             }
  48.             if ((!other->rb_left ||
  49.                  other->rb_left->rb_color == RB_BLACK)
  50.                 && (!other->rb_right ||
  51.                 other->rb_right->rb_color == RB_BLACK))
  52.             {
  53.                 ...
  54.             }
  55.             else
  56.             {
  57.                 if (!other->rb_left ||
  58.                     other->rb_left->rb_color == RB_BLACK)
  59.                 {
  60.                     register struct rb_node *o_right;
  61.                     if ((o_right = other->rb_right))
  62.                         o_right->rb_color = RB_BLACK;
  63.                     other->rb_color = RB_RED;
  64.                     __rb_rotate_left(other, root);
  65.                     other = parent->rb_left;
  66.                 }
  67.                 other->rb_color = parent->rb_color;
  68.                 parent->rb_color = RB_BLACK;
  69.                 if (other->rb_left)
  70.                     other->rb_left->rb_color = RB_BLACK;
  71.                 __rb_rotate_right(parent, root);
  72.                 node = root->rb_node;
  73.                 break;
  74.             }
  75.         }
  76.     }
  77.     if (node)
  78.         node->rb_color = RB_BLACK;
  79. }
复制代码
下面以删除节点为左子树为例展示了调色过程:

(5) 我们删除的节点B颜色是黑色的,同时其父节点A的另一个孩子节点C颜色是红色的。对于这种情况,意味着父节点A必定为黑色的,而C的E/F孩子节点为黑色的,因此我们可以通过将A染成红色左旋/右旋,然后C染成黑色,这样,这颗子树黑色节点高度不变,同时删除节点一侧的子树变成了(3)或者(4)的情况,因为经过旋转,A的右节点变成了黑色,代码如下:
  1.                  struct rb_root *root)
  2. {
  3.     struct rb_node *other;
  4.     while ((!node || node->rb_color == RB_BLACK) && node != root->rb_node)
  5.     {
  6.         if (parent->rb_left == node)
  7.         {
  8.             other = parent->rb_right;
  9.             if (other->rb_color == RB_RED)
  10.             {
  11.                 other->rb_color = RB_BLACK;
  12.                 parent->rb_color = RB_RED;
  13.                 __rb_rotate_left(parent, root);
  14.                 other = parent->rb_right;
  15.             }
  16.             ...
  17.         }
  18.         else
  19.         {
  20.             other = parent->rb_left;
  21.             if (other->rb_color == RB_RED)
  22.             {
  23.                 other->rb_color = RB_BLACK;
  24.                 parent->rb_color = RB_RED;
  25.                 __rb_rotate_right(parent, root);
  26.                 other = parent->rb_left;
  27.             }
  28.             ...
  29.         }
  30.     }
  31.     if (node)
  32.         node->rb_color = RB_BLACK;
  33. }
复制代码
下面以删除节点为左子树为例展示了调色过程:

2.3 红黑树的查询操作

Linux内核中红黑树库提供的功能没有特定某一种排序方法,所以也没有给出查询接口。由于红黑树也是二叉排序树的一种,以升序为例,我们只需要按照以下流程即可进行查询操作:
  1. Query x:
  2. node = root
  3. while node is not null and node.value != x:
  4.     if node.value < x:
  5.         node = node.right
  6.     else:
  7.         node = node.left
  8. Return node
复制代码
3. 红黑树操作实验

实验介绍:有一种对象Item,里面包含:1)树节点,用于管理RB Tree;2)数值,表示了对象的实际内容;3)出现次数,由于我们希望节点随机产生,因此可能存在重复的情况,该值用于统计相同节点的数量。我们先随机num个Item,然后使用这些Item构建出红黑树。最后通过输入要擦除的对象,我们将其从树中删除并显示。
下图时代码运行后的效果,每个节点打印含义为[数值,出现次数,节点颜色],最左边为根节点,左节点在右节点上方。

附录A: 实验代码
  1. main.c :
  2. #include <stdio.h>
  3. #include <stdlib.h>
  4. #include <time.h>
  5. #include "rbtree.h"
  6. typedef struct _Item
  7. {
  8.     int val;
  9.     int num; // appear num
  10.     struct rb_node node;
  11. }Item;
  12. static int print_num = 0;
  13. static int print_level = 0;
  14. Item* GenerateItem();
  15. void DFS(struct rb_node *node);
  16. int main()
  17. {
  18.     int num = 0;
  19.     Item *item, *cur, *prev = NULL;
  20.     struct rb_node **link;
  21.     struct rb_root root = RB_ROOT;
  22.    
  23.     srand(time(NULL));
  24.     printf("Test item num: ");
  25.     scanf("%d", &num);
  26.    
  27.     print_num = 0;
  28.     printf("Generate Item[%d]:\n", num);
  29.     /* generate a random rb tree with [num] node */
  30.     while (num > 0)
  31.     {
  32.         /* randomize a rb tree node */
  33.         item = GenerateItem();
  34.         if (print_num == 16)
  35.         {
  36.             printf("\n");
  37.             print_num = 0;
  38.         }
  39.         printf("%d\t", item->val);
  40.         /* insert a rb tree node to rb tree */
  41.         if (!root.rb_node) // empty rb tree
  42.         {
  43.             root.rb_node = &(item->node);
  44.             rb_insert_color(&(item->node), &root);
  45.             goto next_loop;
  46.         }
  47.         cur = rb_entry(root.rb_node, Item, node);
  48.         /* 1. find insert position */
  49.         while (cur)
  50.         {
  51.             if (cur->val == item->val) // the same item
  52.             {
  53.                 cur->num++;
  54.                 free(item);
  55.                 goto next_loop;
  56.             }
  57.             else if (cur->val > item->val)
  58.             {
  59.                 prev = cur;
  60.                 link = &(cur->node.rb_left);
  61.                 if (cur->node.rb_left == NULL)
  62.                 {
  63.                     break;
  64.                 }
  65.                 cur = rb_entry(cur->node.rb_left, Item, node);
  66.             }
  67.             else
  68.             {
  69.                 prev = cur;
  70.                 link = &(cur->node.rb_right);
  71.                 if (cur->node.rb_right == NULL)
  72.                 {
  73.                     break;
  74.                 }
  75.                 cur = rb_entry(cur->node.rb_right, Item, node);
  76.             }
  77.         }
  78.         /* 2. link node */
  79.         rb_link_node(&(item->node), &(prev->node), link);
  80.         /* 3. adjust */
  81.         rb_insert_color(&(item->node), &root);
  82. next_loop:
  83.         num--;
  84.     }
  85.    
  86.     /* print a generated rb tree */
  87.     print_num = 0;
  88.     print_level = 0;
  89.     printf("\nsort result:\n");
  90.     DFS(root.rb_node);
  91.     printf("\n");
  92.     /* testing erase some rb tree node */
  93.     printf("\nTest Erase, input node value to erase its node, or input negative value to exit\n");
  94.     while (1)
  95.     {
  96.         /* get the node need to erase */
  97.         printf(">>");
  98.         scanf("%d", &num);
  99.         if (num < 0)
  100.         {
  101.             break;
  102.         }
  103.         /* 1. find insert position */
  104.         if (!root.rb_node) // empty rb tree
  105.         {
  106.             printf("empty tree\n");
  107.             break;
  108.         }
  109.         cur = rb_entry(root.rb_node, Item, node);
  110.         while (cur)
  111.         {
  112.             if (cur->val == num) // the same item
  113.             {
  114.                 break;
  115.             }
  116.             else if (cur->val > num)
  117.             {
  118.                 if (cur->node.rb_left == NULL)
  119.                 {
  120.                     cur = NULL;
  121.                     break;
  122.                 }
  123.                 cur = rb_entry(cur->node.rb_left, Item, node);
  124.             }
  125.             else
  126.             {
  127.                 if (cur->node.rb_right == NULL)
  128.                 {
  129.                     cur = NULL;
  130.                     break;
  131.                 }
  132.                 cur = rb_entry(cur->node.rb_right, Item, node);
  133.             }
  134.         }
  135.         /* 2. do erase function */
  136.         if (cur)
  137.         {
  138.             printf("erase %d\n", num);
  139.             rb_erase(&(cur->node), &root);
  140.             free(cur);
  141.             DFS(root.rb_node);
  142.             printf("\n");
  143.         }
  144.         else
  145.         {
  146.             printf("not exist\n");
  147.         }
  148.         printf("===================================================================\n");
  149.     }
  150.    
  151.     return 0;
  152. }
  153. Item* GenerateItem()
  154. {
  155.     Item *item = (Item*)malloc(sizeof(Item));
  156.    
  157.     item->val = rand() % 1000;
  158.     item->num = 1;
  159.    
  160.     item->node.rb_parent = NULL;
  161.     item->node.rb_left = NULL;
  162.     item->node.rb_right = NULL;
  163.    
  164.     return item;
  165. }
  166. void DFS(struct rb_node *node)
  167. {
  168.     Item *item;
  169.     int i;
  170.    
  171.     if (node)
  172.     {
  173.         print_level++;
  174.         DFS(node->rb_left);
  175.         if (print_num == 4)
  176.         {
  177.             printf("\n");
  178.             print_num = 0;
  179.         }
  180.         item = rb_entry(node, Item, node);
  181.         for (i = 1; i < print_level; i++)
  182.         {
  183.             printf("            ");
  184.         }
  185.         printf("[%3d,%3d,%c]\n", item->val, item->num, (item->node.rb_color == RB_RED) ? 'R' : 'B');
  186.         print_num++;
  187.         DFS(node->rb_right);
  188.         print_level--;
  189.     }
  190. }
  191. rbtree.h :
  192. /*
  193.   Red Black Trees
  194.   (C) 1999  Andrea Arcangeli <andrea@suse.de>
  195.   
  196.   This program is free software; you can redistribute it and/or modify
  197.   it under the terms of the GNU General Public License as published by
  198.   the Free Software Foundation; either version 2 of the License, or
  199.   (at your option) any later version.
  200.   This program is distributed in the hope that it will be useful,
  201.   but WITHOUT ANY WARRANTY; without even the implied warranty of
  202.   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  203.   GNU General Public License for more details.
  204.   You should have received a copy of the GNU General Public License
  205.   along with this program; if not, write to the Free Software
  206.   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  207.   linux/include/linux/rbtree.h
  208.   To use rbtrees you'll have to implement your own insert and search cores.
  209.   This will avoid us to use callbacks and to drop drammatically performances.
  210.   I know it's not the cleaner way,  but in C (not in C++) to get
  211.   performances and genericity...
  212.   Some example of insert and search follows here. The search is a plain
  213.   normal search over an ordered tree. The insert instead must be implemented
  214.   int two steps: as first thing the code must insert the element in
  215.   order as a red leaf in the tree, then the support library function
  216.   rb_insert_color() must be called. Such function will do the
  217.   not trivial work to rebalance the rbtree if necessary.
  218. -----------------------------------------------------------------------
  219. static inline struct page * rb_search_page_cache(struct inode * inode,
  220.                          unsigned long offset)
  221. {
  222.     struct rb_node * n = inode->i_rb_page_cache.rb_node;
  223.     struct page * page;
  224.     while (n)
  225.     {
  226.         page = rb_entry(n, struct page, rb_page_cache);
  227.         if (offset < page->offset)
  228.             n = n->rb_left;
  229.         else if (offset > page->offset)
  230.             n = n->rb_right;
  231.         else
  232.             return page;
  233.     }
  234.     return NULL;
  235. }
  236. static inline struct page * __rb_insert_page_cache(struct inode * inode,
  237.                            unsigned long offset,
  238.                            struct rb_node * node)
  239. {
  240.     struct rb_node ** p = &inode->i_rb_page_cache.rb_node;
  241.     struct rb_node * parent = NULL;
  242.     struct page * page;
  243.     while (*p)
  244.     {
  245.         parent = *p;
  246.         page = rb_entry(parent, struct page, rb_page_cache);
  247.         if (offset < page->offset)
  248.             p = &(*p)->rb_left;
  249.         else if (offset > page->offset)
  250.             p = &(*p)->rb_right;
  251.         else
  252.             return page;
  253.     }
  254.     rb_link_node(node, parent, p);
  255.     return NULL;
  256. }
  257. static inline struct page * rb_insert_page_cache(struct inode * inode,
  258.                          unsigned long offset,
  259.                          struct rb_node * node)
  260. {
  261.     struct page * ret;
  262.     if ((ret = __rb_insert_page_cache(inode, offset, node)))
  263.         goto out;
  264.     rb_insert_color(node, &inode->i_rb_page_cache);
  265. out:
  266.     return ret;
  267. }
  268. -----------------------------------------------------------------------
  269. */
  270. #ifndef    _LINUX_RBTREE_H
  271. #define    _LINUX_RBTREE_H
  272. // #include <linux/kernel.h>
  273. // #include <linux/stddef.h>
  274. #include <stdlib.h>
  275. #define offsetof(TYPE, MEMBER) ((size_t) &((TYPE*)0)->MEMBER)
  276. #define container_of(ptr, type, member) ({            \
  277.         const typeof( ((type *)0)->member ) *__mptr = (ptr);    \
  278.         (type *)( (char *)__mptr - offsetof(type,member) );})
  279. struct rb_node
  280. {
  281.     struct rb_node *rb_parent;
  282.     int rb_color;
  283. #define    RB_RED        0
  284. #define    RB_BLACK    1
  285.     struct rb_node *rb_right;
  286.     struct rb_node *rb_left;
  287. };
  288. struct rb_root
  289. {
  290.     struct rb_node *rb_node;
  291. };
  292. #define RB_ROOT    (struct rb_root) { NULL, }
  293. #define    rb_entry(ptr, type, member) container_of(ptr, type, member)
  294. extern void rb_insert_color(struct rb_node *, struct rb_root *);
  295. extern void rb_erase(struct rb_node *, struct rb_root *);
  296. /* Find logical next and previous nodes in a tree */
  297. extern struct rb_node *rb_next(struct rb_node *);
  298. extern struct rb_node *rb_prev(struct rb_node *);
  299. extern struct rb_node *rb_first(struct rb_root *);
  300. extern struct rb_node *rb_last(struct rb_root *);
  301. /* Fast replacement of a single node without remove/rebalance/add/rebalance */
  302. extern void rb_replace_node(struct rb_node *victim, struct rb_node *new,
  303.                 struct rb_root *root);
  304. static inline void rb_link_node(struct rb_node * node, struct rb_node * parent,
  305.                 struct rb_node ** rb_link)
  306. {
  307.     node->rb_parent = parent;
  308.     node->rb_color = RB_RED;
  309.     node->rb_left = node->rb_right = NULL;
  310.     *rb_link = node;
  311. }
  312. #endif    /* _LINUX_RBTREE_H */
  313. rbtree.c :
  314. /*
  315.   Red Black Trees
  316.   (C) 1999  Andrea Arcangeli <andrea@suse.de>
  317.   (C) 2002  David Woodhouse <dwmw2@infradead.org>
  318.   
  319.   This program is free software; you can redistribute it and/or modify
  320.   it under the terms of the GNU General Public License as published by
  321.   the Free Software Foundation; either version 2 of the License, or
  322.   (at your option) any later version.
  323.   This program is distributed in the hope that it will be useful,
  324.   but WITHOUT ANY WARRANTY; without even the implied warranty of
  325.   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  326.   GNU General Public License for more details.
  327.   You should have received a copy of the GNU General Public License
  328.   along with this program; if not, write to the Free Software
  329.   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  330.   linux/lib/rbtree.c
  331. */
  332. // #include <linux/rbtree.h>
  333. // #include <linux/module.h>
  334. #include "rbtree.h"
  335. static void __rb_rotate_left(struct rb_node *node, struct rb_root *root)
  336. {
  337.     struct rb_node *right = node->rb_right;
  338.     if ((node->rb_right = right->rb_left))
  339.         right->rb_left->rb_parent = node;
  340.     right->rb_left = node;
  341.     if ((right->rb_parent = node->rb_parent))
  342.     {
  343.         if (node == node->rb_parent->rb_left)
  344.             node->rb_parent->rb_left = right;
  345.         else
  346.             node->rb_parent->rb_right = right;
  347.     }
  348.     else
  349.         root->rb_node = right;
  350.     node->rb_parent = right;
  351. }
  352. static void __rb_rotate_right(struct rb_node *node, struct rb_root *root)
  353. {
  354.     struct rb_node *left = node->rb_left;
  355.     if ((node->rb_left = left->rb_right))
  356.         left->rb_right->rb_parent = node;
  357.     left->rb_right = node;
  358.     if ((left->rb_parent = node->rb_parent))
  359.     {
  360.         if (node == node->rb_parent->rb_right)
  361.             node->rb_parent->rb_right = left;
  362.         else
  363.             node->rb_parent->rb_left = left;
  364.     }
  365.     else
  366.         root->rb_node = left;
  367.     node->rb_parent = left;
  368. }
  369. void rb_insert_color(struct rb_node *node, struct rb_root *root)
  370. {
  371.     struct rb_node *parent, *gparent;
  372.     while ((parent = node->rb_parent) && parent->rb_color == RB_RED)
  373.     {
  374.         gparent = parent->rb_parent;
  375.         if (parent == gparent->rb_left)
  376.         {
  377.             {
  378.                 register struct rb_node *uncle = gparent->rb_right;
  379.                 if (uncle && uncle->rb_color == RB_RED)
  380.                 {
  381.                     uncle->rb_color = RB_BLACK;
  382.                     parent->rb_color = RB_BLACK;
  383.                     gparent->rb_color = RB_RED;
  384.                     node = gparent;
  385.                     continue;
  386.                 }
  387.             }
  388.             if (parent->rb_right == node)
  389.             {
  390.                 register struct rb_node *tmp;
  391.                 __rb_rotate_left(parent, root);
  392.                 tmp = parent;
  393.                 parent = node;
  394.                 node = tmp;
  395.             }
  396.             parent->rb_color = RB_BLACK;
  397.             gparent->rb_color = RB_RED;
  398.             __rb_rotate_right(gparent, root);
  399.         } else {
  400.             {
  401.                 register struct rb_node *uncle = gparent->rb_left;
  402.                 if (uncle && uncle->rb_color == RB_RED)
  403.                 {
  404.                     uncle->rb_color = RB_BLACK;
  405.                     parent->rb_color = RB_BLACK;
  406.                     gparent->rb_color = RB_RED;
  407.                     node = gparent;
  408.                     continue;
  409.                 }
  410.             }
  411.             if (parent->rb_left == node)
  412.             {
  413.                 register struct rb_node *tmp;
  414.                 __rb_rotate_right(parent, root);
  415.                 tmp = parent;
  416.                 parent = node;
  417.                 node = tmp;
  418.             }
  419.             parent->rb_color = RB_BLACK;
  420.             gparent->rb_color = RB_RED;
  421.             __rb_rotate_left(gparent, root);
  422.         }
  423.     }
  424.     root->rb_node->rb_color = RB_BLACK;
  425. }
  426. static void __rb_erase_color(struct rb_node *node, struct rb_node *parent,
  427.                  struct rb_root *root)
  428. {
  429.     struct rb_node *other;
  430.     while ((!node || node->rb_color == RB_BLACK) && node != root->rb_node)
  431.     {
  432.         if (parent->rb_left == node)
  433.         {
  434.             other = parent->rb_right;
  435.             if (other->rb_color == RB_RED)
  436.             {
  437.                 other->rb_color = RB_BLACK;
  438.                 parent->rb_color = RB_RED;
  439.                 __rb_rotate_left(parent, root);
  440.                 other = parent->rb_right;
  441.             }
  442.             if ((!other->rb_left ||
  443.                  other->rb_left->rb_color == RB_BLACK)
  444.                 && (!other->rb_right ||
  445.                 other->rb_right->rb_color == RB_BLACK))
  446.             {
  447.                 other->rb_color = RB_RED;
  448.                 node = parent;
  449.                 parent = node->rb_parent;
  450.             }
  451.             else
  452.             {
  453.                 if (!other->rb_right ||
  454.                     other->rb_right->rb_color == RB_BLACK)
  455.                 {
  456.                     register struct rb_node *o_left;
  457.                     if ((o_left = other->rb_left))
  458.                         o_left->rb_color = RB_BLACK;
  459.                     other->rb_color = RB_RED;
  460.                     __rb_rotate_right(other, root);
  461.                     other = parent->rb_right;
  462.                 }
  463.                 other->rb_color = parent->rb_color;
  464.                 parent->rb_color = RB_BLACK;
  465.                 if (other->rb_right)
  466.                     other->rb_right->rb_color = RB_BLACK;
  467.                 __rb_rotate_left(parent, root);
  468.                 node = root->rb_node;
  469.                 break;
  470.             }
  471.         }
  472.         else
  473.         {
  474.             other = parent->rb_left;
  475.             if (other->rb_color == RB_RED)
  476.             {
  477.                 other->rb_color = RB_BLACK;
  478.                 parent->rb_color = RB_RED;
  479.                 __rb_rotate_right(parent, root);
  480.                 other = parent->rb_left;
  481.             }
  482.             if ((!other->rb_left ||
  483.                  other->rb_left->rb_color == RB_BLACK)
  484.                 && (!other->rb_right ||
  485.                 other->rb_right->rb_color == RB_BLACK))
  486.             {
  487.                 other->rb_color = RB_RED;
  488.                 node = parent;
  489.                 parent = node->rb_parent;
  490.             }
  491.             else
  492.             {
  493.                 if (!other->rb_left ||
  494.                     other->rb_left->rb_color == RB_BLACK)
  495.                 {
  496.                     register struct rb_node *o_right;
  497.                     if ((o_right = other->rb_right))
  498.                         o_right->rb_color = RB_BLACK;
  499.                     other->rb_color = RB_RED;
  500.                     __rb_rotate_left(other, root);
  501.                     other = parent->rb_left;
  502.                 }
  503.                 other->rb_color = parent->rb_color;
  504.                 parent->rb_color = RB_BLACK;
  505.                 if (other->rb_left)
  506.                     other->rb_left->rb_color = RB_BLACK;
  507.                 __rb_rotate_right(parent, root);
  508.                 node = root->rb_node;
  509.                 break;
  510.             }
  511.         }
  512.     }
  513.     if (node)
  514.         node->rb_color = RB_BLACK;
  515. }
  516. void rb_erase(struct rb_node *node, struct rb_root *root)
  517. {
  518.     struct rb_node *child, *parent;
  519.     int color;
  520.     if (!node->rb_left)
  521.         child = node->rb_right;
  522.     else if (!node->rb_right)
  523.         child = node->rb_left;
  524.     else
  525.     {
  526.         struct rb_node *old = node, *left;
  527.         node = node->rb_right;
  528.         while ((left = node->rb_left) != NULL)
  529.             node = left;
  530.         child = node->rb_right;
  531.         parent = node->rb_parent;
  532.         color = node->rb_color;
  533.         if (child)
  534.             child->rb_parent = parent;
  535.         if (parent)
  536.         {
  537.             if (parent->rb_left == node)
  538.                 parent->rb_left = child;
  539.             else
  540.                 parent->rb_right = child;
  541.         }
  542.         else
  543.             root->rb_node = child;
  544.         if (node->rb_parent == old)
  545.             parent = node;
  546.         node->rb_parent = old->rb_parent;
  547.         node->rb_color = old->rb_color;
  548.         node->rb_right = old->rb_right;
  549.         node->rb_left = old->rb_left;
  550.         if (old->rb_parent)
  551.         {
  552.             if (old->rb_parent->rb_left == old)
  553.                 old->rb_parent->rb_left = node;
  554.             else
  555.                 old->rb_parent->rb_right = node;
  556.         } else
  557.             root->rb_node = node;
  558.         old->rb_left->rb_parent = node;
  559.         if (old->rb_right)
  560.             old->rb_right->rb_parent = node;
  561.         goto color;
  562.     }
  563.     parent = node->rb_parent;
  564.     color = node->rb_color;
  565.     if (child)
  566.         child->rb_parent = parent;
  567.     if (parent)
  568.     {
  569.         if (parent->rb_left == node)
  570.             parent->rb_left = child;
  571.         else
  572.             parent->rb_right = child;
  573.     }
  574.     else
  575.         root->rb_node = child;
  576. color:
  577.     if (color == RB_BLACK)
  578.         __rb_erase_color(child, parent, root);
  579. }
  580. /*
  581. * This function returns the first node (in sort order) of the tree.
  582. */
  583. struct rb_node *rb_first(struct rb_root *root)
  584. {
  585.     struct rb_node  *n;
  586.     n = root->rb_node;
  587.     if (!n)
  588.         return NULL;
  589.     while (n->rb_left)
  590.         n = n->rb_left;
  591.     return n;
  592. }
  593. struct rb_node *rb_last(struct rb_root *root)
  594. {
  595.     struct rb_node  *n;
  596.     n = root->rb_node;
  597.     if (!n)
  598.         return NULL;
  599.     while (n->rb_right)
  600.         n = n->rb_right;
  601.     return n;
  602. }
  603. struct rb_node *rb_next(struct rb_node *node)
  604. {
  605.     /* If we have a right-hand child, go down and then left as far
  606.        as we can. */
  607.     if (node->rb_right) {
  608.         node = node->rb_right;
  609.         while (node->rb_left)
  610.             node=node->rb_left;
  611.         return node;
  612.     }
  613.     /* No right-hand children.  Everything down and left is
  614.        smaller than us, so any 'next' node must be in the general
  615.        direction of our parent. Go up the tree; any time the
  616.        ancestor is a right-hand child of its parent, keep going
  617.        up. First time it's a left-hand child of its parent, said
  618.        parent is our 'next' node. */
  619.     while (node->rb_parent && node == node->rb_parent->rb_right)
  620.         node = node->rb_parent;
  621.     return node->rb_parent;
  622. }
  623. struct rb_node *rb_prev(struct rb_node *node)
  624. {
  625.     /* If we have a left-hand child, go down and then right as far
  626.        as we can. */
  627.     if (node->rb_left) {
  628.         node = node->rb_left;
  629.         while (node->rb_right)
  630.             node=node->rb_right;
  631.         return node;
  632.     }
  633.     /* No left-hand children. Go up till we find an ancestor which
  634.        is a right-hand child of its parent */
  635.     while (node->rb_parent && node == node->rb_parent->rb_left)
  636.         node = node->rb_parent;
  637.     return node->rb_parent;
  638. }
  639. void rb_replace_node(struct rb_node *victim, struct rb_node *new,
  640.              struct rb_root *root)
  641. {
  642.     struct rb_node *parent = victim->rb_parent;
  643.     /* Set the surrounding nodes to point to the replacement */
  644.     if (parent) {
  645.         if (victim == parent->rb_left)
  646.             parent->rb_left = new;
  647.         else
  648.             parent->rb_right = new;
  649.     } else {
  650.         root->rb_node = new;
  651.     }
  652.     if (victim->rb_left)
  653.         victim->rb_left->rb_parent = new;
  654.     if (victim->rb_right)
  655.         victim->rb_right->rb_parent = new;
  656.     /* Copy the pointers/colour from the victim to the replacement */
  657.     *new = *victim;
  658. }
复制代码
2024-3-23 created by chegxy
<a href="https://www.cnblogs.com/chegxy" target="_blank" rel="noopener">

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具