JAVA十大排序算法之堆排序详解

网友投稿 307 2022-10-03


JAVA十大排序算法之堆排序详解

目录堆排序知识补充二叉树满二叉树完全二叉树二叉堆代码实现时间复杂度算法稳定性思考总结

堆排序

这里的堆并不是JVM中堆栈的堆,而是一种特殊的二叉树,通常也叫作二叉堆。它具有以下特点:

它是完全二叉树

堆中某个结点的值总是不大于或不小于其父结点的值

知识补充

二叉树

树中节点的子节点不超过2的有序树

满二叉树

二叉树中除了叶子节点,每个节点的子节点都为2,则此二叉树为满二叉树。

完全二叉树

如果对满二叉树的结点进行编号,约定编号从根结点起,自上而下,自左而右。则深度为k的,有n个结点的二叉树,当且仅当其每一个结点都与深度为k的满二叉树中编号从1至n的结点一一对应时,称之为完全二叉树。

特点:叶子结点只能出现在最下层和次下层,且最下层的叶子结点集中在树的左部。需要注意的是,满二叉树肯定是完全二叉树,而完全二叉树不一定是满二叉树。

二叉堆

二叉堆是一种特殊的堆,可以被看做一棵完全二叉树的数组对象,而根据其性质又可以分为下面两种:

大根堆:每一个根节点都大于等于它的左右孩子节点,也叫最大堆

小根堆:每一个根节点都小于等于它的左右孩子节点,也叫最小堆

如果把一个数组通过大根堆的方式来表示(数组元素的值是可变的),如下:

由此可以推出:

对于位置为 k 的节点,其子节点的位置分别为,左子节点 = 2k + 1,右子节点 = 2(k + 1)

如:对于 k = 1,其节点的对应数组为 5

左子节点的位置为 3,对应数组的值为 3

右子节点的位置为 4,对应数组的值为 2

最后一个非叶子节点的位置为 (n/2) - 1,n为数组长度

如:数组长度为6,则 (6/2) - 1 = 2,即位置 2 为最后一个非叶子节点

给定一个随机数组[35,63,48,9,86,24,53,11],将该数组视为一个完全二叉树:

从上图很明显的可以看出,这个二叉树不符合大根堆的定义,但是可以通过调整,使它变为最大堆。如果从最后一个非叶子节点开始,从下到上,从右往左调整,则:

通过上面的调整,该二叉树为最大堆,这个时候开始排序,排序规则:

将堆顶元素和尾元素交换交换

后重新调整元素的位置,使之重新变成二叉堆

代码实现

public class HeapSort {

public static final int[] ARRAY = {35, 63, 48, 9, 86, 24, 53, 11};

public static int[] sort(int[] array) {

//数组的长度

int length = array.length;

if (length < 2) return array;

//首先构建一个最大堆

buildMaxHeap(array);

//调整为最大堆之后,顶元素为最大元素并与微元素交换

while (length > 0) {//当lenth <= 0时,说明已经到堆顶

//交换

swnpYrcqsUap(array, 0, length - 1);

length--;//交换之后相当于把树中的最大值弹出去了,所以要--

//交换之后从上往下调整使之成为最大堆

adjustHeap(array, 0, length);

}

return array;

}

//对元素组构建为一个对应数组的最大堆

private static void buildMaxHeap(int[] array) {

//在之前的分析可知,最大堆的构建是从最后一个非叶子节点开始,从下往上,从右往左调整

//最后一个非叶子节点的位置为:array.length/2 - 1

for (int i = array.length / 2 - 1; i >= 0; i--) {

//调整使之成为最大堆

adjustHeap(array, i, array.length);

}

}

/**

* 调整

* @param parent 最后一个非叶子节点

* @param length 数组的长度

*/

private static void adjustHeap(int[] array, int parent, int length) {

//定义最大值的索引

int maxIndex = parent;

//parent为对应元素的位置(数组的索引)

int left = 2 * parent + 1;//左子节点对应元素的位置

int right = 2 * (parent + 1);//右子节点对应元素的位置

//判断是否有子节点,再比较父节点和左右子节点的大小

//因为parent最后一个非叶子节点,所以如果有左右子节点则节点的位置都小于数组的长度

if (left < length && array[left] > array[maxIndex]) {//左子节点如果比父节点大

http:// maxIndex = left;

}

if (right < length && array[right] > array[maxIndex]) {//右子节点如果比父节点大

maxIndex = right;

}

//maxIndex为父节点,若发生改变则说明不是最大节点,需要交换

if (maxIndex != parent) {

swap(array, maxIndex, parent);

//交换之后递归再次调整比较

adjustHeap(array, maxIndex, length);

}

}

//交换

private static void swap(int[] array, int i, int j) {

int temp = array[i];

array[i] = array[j];

array[j] = temp;

}

public static void print(int[] array) {

for (int i : array) {

System.out.print(i + " ");

}

System.out.println("");

}

public static void main(String[] args) {

print(ARRAY);

System.out.println("============================================");

print(sort(ARRAY));

}

}

时间复杂度

堆的时间复杂度是 O(nlogn)

参考:堆排序的时间复杂度分析

算法稳定性

堆的结构为,对于位置为 k 的节点,其子节点的位置分别为,左子节点 = 2k + 1,右子节点 = 2(k + 1),最大堆要求父节点大于等于其2个子节点,最小堆要求父节点小于等于其2个子节点。

在一个长为n的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(最大堆)或者最小(最大堆),这3个元素之间的选择当然不会破坏稳定性。但当为n/2-1,n/2-2,… 1 这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法。

思考

对于快速排序来说,其平均复杂度为O(nlogn),堆排序也是O(nlogn),怎么选择?如下题:

leetcode:数组中的第K个最大元素

此题的意思是对于一个无序数组,经过排序后的第 k 个最大的元素。

我们知道快速排序是需要对整个数组进行排序,这样才能取出第 k 个最大的元素。

如果使用堆排序,且是最大堆的方式,则第k次循环即可找出第 k 个最大的元素,并不需要吧整个数组排序。

所以对于怎么选择的问题,要看具体的场景,或者是两者都可。

总结

本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注我们的更多内容!


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:ssl证书保障网站信息安全是否可靠?(ssl证书不安全)
下一篇:SQL注入攻击原理
相关文章

 发表评论

暂时没有评论,来抢沙发吧~