我们知道,二叉查找树相对来说比较容易形成最坏的链表情况,所以前辈们想尽了各种优化策略,包括AVL,红黑,以及今天要讲的Treap树。Treap树算是一种简单的优化策略,这名字大家也能猜到,树和堆的合体,其实原理比较简单,在树中维护一个"优先级“,”优先级“采用随机数的方法,但是”优先级“必须满足根堆的性质,当然是“大根堆”或者“小根堆”都无所谓,比如下面的一棵树:
从树中我们可以看到:
节点中的key满足“二叉查找树”。
节点中的“优先级”满足小根堆。
#region Treap树节点
/// <summary>
/// Treap树
/// </summary>
/// <typeparam name="K"></typeparam>
/// <typeparam name="V"></typeparam>
public class TreapNode<K, V>
{
/// <summary>
/// 节点元素
/// </summary>
public K key;
/// <summary>
/// 优先级(采用随机数)
/// </summary>
public int priority;
/// <summary>
/// 节点中的附加值
/// </summary>
public HashSet<V> attach = new HashSet<V>();
/// <summary>
/// 左节点
/// </summary>
public TreapNode<K, V> left;
/// <summary>
/// 右节点
/// </summary>
public TreapNode<K, V> right;
public TreapNode() { }
public TreapNode(K key, V value, TreapNode<K, V> left, TreapNode<K, V> right)
{
//KV键值对
this.key = key;
this.priority = new Random(DateTime.Now.Millisecond).Next(0,int.MaxValue);
this.attach.Add(value);
this.left = left;
this.right = right;
}
}
#endregion
节点里面定义了一个priority作为“堆定义”的旋转因子,因子采用“随机数“。
2:添加首先我们知道各个节点的“优先级”是采用随机数的方法,那么就存在一个问题,当我们插入一个节点后,优先级不满足“堆定义"的时候我们该怎么办,前辈说此时需要旋转,直到满足堆定义为止。旋转有两种方式,如果大家玩转了AVL,那么对Treap中的旋转的理解轻而易举。
- 左左情况旋转
从图中可以看出,当我们插入“节点12”的时候,此时“堆性质”遭到破坏,必须进行旋转,我们发现优先级是6<9,所以就要进行左左情况旋转,最终也就形成了我们需要的结果。
- 右右情况旋转
既然理解了”左左情况旋转“,右右情况也是同样的道理,优先级中发现“6<9",进行”右右旋转“最终达到我们要的效果。
#region 添加操作
/// <summary>
/// 添加操作
/// </summary>
/// <param name="key"></param>
/// <param name="value"></param>
public void Add(K key, V value)
{
node = Add(key, value, node);
}
#endregion
#region 添加操作
/// <summary>
/// 添加操作
/// </summary>
/// <param name="key"></param>
/// <param name="value"></param>
/// <param name="tree"></param>
/// <returns></returns>
public TreapNode<K, V> Add(K key, V value, TreapNode<K, V> tree)
{
if (tree == null)
tree = new TreapNode<K, V>(key, value, null, null);
//左子树
if (key.CompareTo(tree.key) < 0)
{
tree.left = Add(key, value, tree.left);
//根据小根堆性质,需要”左左情况旋转”
if (tree.left.priority < tree.priority)
{
tree = RotateLL(tree);
}
}
//右子树
if (key.CompareTo(tree.key) > 0)
{
tree.right = Add(key, value, tree.right);
//根据小根堆性质,需要”右右情况旋转”
if (tree.right.priority < tree.priority)
{
tree = RotateRR(tree);
}
}
//将value追加到附加值中(也可对应重复元素)
if (key.CompareTo(tree.key) == 0)
tree.attach.Add(value);
return tree;
}
#endregion
3:删除跟普通的二叉查找树一样,删除结点存在三种情况。
1) 叶子结点跟普通查找树一样,直接释放本节点即可。
2)单孩子结点跟普通查找树一样操作。
3)满孩子结点其实在treap中删除满孩子结点有两种方式。
- 第一种:跟普通的二叉查找树一样,找到“右子树”的最左结点(15),拷贝元素的值,但不拷贝元素的优先级,然后在右子树中删除“结点15”即可,最终效果如下图。
- 第二种:将”结点下旋“,直到该节点不是”满孩子的情况“,该赋null的赋null,该将孩子结点顶上的就顶上,如下图:
当然从理论上来说,第二种删除方法更合理,这里我写的就是第二种情况的代码。
#region 删除当前树中的节点
/// <summary>
/// 删除当前树中的节点
/// </summary>
/// <param name="key"></param>
/// <returns></returns>
public void Remove(K key, V value)
{
node = Remove(key, value, node);
}
#endregion
#region 删除当前树中的节点
/// <summary>
/// 删除当前树中的节点
/// </summary>
/// <param name="key"></param>
/// <param name="tree"></param>
/// <returns></returns>
public TreapNode<K, V> Remove(K key, V value, TreapNode<K, V> tree)
{
if (tree == null)
return null;
//左子树
if (key.CompareTo(tree.key) < 0)
{
tree.left = Remove(key, value, tree.left);
}
//右子树
if (key.CompareTo(tree.key) > 0)
{
tree.right = Remove(key, value, tree.right);
}
/*相等的情况*/
if (key.CompareTo(tree.key) == 0)
{
//判断里面的HashSet是否有多值
if (tree.attach.Count > 1)
{
//实现惰性删除
tree.attach.Remove(value);
}
else
{
//有两个孩子的情况
if (tree.left != null && tree.right != null)
{
//如果左孩子的优先级低就需要“左旋”
if (tree.left.priority < tree.right.priority)
{
tree = RotateLL(tree);
}
else
{
//否则“右旋”
tree = RotateRR(tree);
}
//继续旋转
tree = Remove(key, value, tree);
}
else
{
//如果旋转后已经变成了叶子节点则直接删除
if (tree == null)
return null;
//最后就是单支树
tree = tree.left == null ? tree.right : tree.left;
}
}
}
return tree;
}
#endregion
4:总结treap树在CURD中是期望的logN,由于我们加了”优先级“,所以会出现”链表“的情况几乎不存在,但是他的Add和Remove相比严格的平衡二叉树有更少的旋转操作,可以说性能是在”普通二叉树“和”平衡二叉树“之间,一个非常值得了解的树结构。