从当前元素继续寻找_云漫圈 | 寻找无序数组的第k大元素
发布日期:2021-06-24 15:58:59 浏览次数:2 分类:技术文章

本文共 3376 字,大约阅读时间需要 11 分钟。

戳蓝字“CSDN云计算”关注我们哦!

作者:小灰

来源:程序员小灰

   本期封面作者:泰勒太乐

f7cbdcc84d3b99a3c956afb21d50927c.png

02b55e4ab00f77b43ecaacff82d9a569.png

—————  第二天  —————

949346ae36c2169e64b3929e354ad62d.png

668ce31e67ebdc86df318176c821811e.png

b994014970555b9388a2016deb3d3d48.png

题目是什么意思呢?比如给定的无序数组如下:

2ff1aa3acc9051c373226b3528e5d7c8.png

如果 k=6,也就是要寻找第6大的元素,这个元素是哪一个呢?

显然,数组中第一大的元素是24,第二大的元素是20,第三大的元素是17 ...... 第6大的元素是9

4f65cb9593f2a4b92228e3cf1df9f3a4.png

8d1ddc8596443fa530237718766a2472.png

ab238a3e2086c68de6e27506a38f1810.png

方法一:排序法

这是最容易想到的方法,先把无序数组从大到小进行排序,排序后的第k个元素,自然就是数组中的第k大元素。

2fbbb81dda1e14992c5d925aa94dd7a0.png

1714859098a02a22240677c530f392f7.png

8d1ddc8596443fa530237718766a2472.png

05e545a534c930218ecee817b40ab8a7.png

方法二:插入法

维护一个长度为k的数组A的有序数组,用于存储已知的k个较大的元素。

接下来遍历原数组,每遍历到一个元素,和数组A中最小的元素相比较,如果小于等于数组A的最小元素,继续遍历;如果大于数组A的最小元素,则插入到数组A中,并把曾经的最小元素“挤出去”。

比如k=3,先把最左侧的7,5,15三个数有序放入数组A当中,代表当前最大的三个数。

dacc6595f793c276870dae45c4868e06.png

这时候,遍历到3, 由于3<5,继续遍历。

d080c1d9c6e22aef93d7e53267719543.png

接下来遍历到17,由于17>5,插入到数组A的合适位置,类似于插入排序,并把原先最小的元素5“挤出去”。

c203e84ccd6b105e7d27c14f75d0a1d9.png

继续遍历原数组,一直遍历到数组的最后一个元素......

最终,数组A中存储的元素是24,20,17,代表着整个数组中最大的3个元素。此时数组A中的最小的元素17就是我们要寻找的第k大元素。

c41f4f80debb00cadaff1d666eda327f.png

2e39cbab9c9eac484336cbdce3ae62f9.png

a0655e477829de88b254cf8825976e28.png

bc4ca98ce53aacafa6e7ee54de5ed454.png

————————————

37486ad94434db4bfd3a8513c02d8cca.png

9d6693c7b631ec2f0b6e05b3270c9f67.png

f8be1a8149d016940f499f848f2cade1.png

91e49420a42d8124b720f0986adb41d4.png

什么是二叉堆?不太了解的小伙伴可以先看看这一篇:漫画:什么是二叉堆?(修正版)

简而言之,二叉堆是一种特殊的完全二叉树,它包含大顶堆和小顶堆两种形式。

其中小顶堆的特点,是每一个父节点都大于等于自己的子节点。要解决这个算法题,我们可以利用小顶堆的特性。

644e25b10e61060f4f0ee50c2e2dd8cc.png

ca6ed67038803b8d482f9a40d31c9d5c.png

方法三:小顶堆法

维护一个容量为k的小顶堆,堆中的k个节点代表着当前最大的k个元素,而堆顶显然是这k个元素中的最小值

遍历原数组,每遍历一个元素,就和堆顶比较,如果当前元素小于等于堆顶,则继续遍历;如果元素大于堆顶,则把当前元素放在堆顶位置,并调整二叉堆(下沉操作)。

遍历结束后,堆顶就是数组的最大k个元素中的最小值,也就是第k大元素

假设k=5,具体的执行步骤如下:

1.把数组的前k个元素构建成堆。

c1f00aee44e306d46b2653cc5e97db54.png

2.继续遍历数组,和堆顶比较,如果小于等于堆顶,则继续遍历;如果大于堆顶,则取代堆顶元素并调整堆。

遍历到元素2,由于 2<3,所以继续遍历。

45d6ac11527c7c6dd72b91237d80c349.png

遍历到元素20,由于 20>3,20取代堆顶位置,并调整堆。

cf4b176b93ed37e2881c68833a194c5b.png

acc829eb57628b943941771bb429a192.png

遍历到元素24,由于 24>5,24取代堆顶位置,并调整堆。

9ed2ada5e9508c2dff1a92c24ec220ed.png

2d3f7e87771d1e5b25c878b9cb504403.png

以此类推,我们一个一个遍历元素,当遍历到最后一个元素8的时候,小顶堆的情况如下:

824849406f188819ce082712e5e48cfd.png

3.此时的堆顶,就是堆中的最小值,也就是数组中的第k大元素。

3045105c2ad3a94b5d1d48c486877161.png

这个方法的时间复杂度是多少呢?

1.构建堆的时间复杂度是 O(k)

2.遍历剩余数组的时间复杂度是O(n-k)

3.每次调整堆的时间复杂度是 O(logk)

其中2和3是嵌套关系,1和2,3是并列关系,所以总的最坏时间复杂度是O((n-k)logk + k)。当k远小于n的情况下,也可以近似地认为是O(nlogk)

这个方法的空间复杂度是多少呢?

刚才我们在详细步骤中把二叉堆单独拿出来演示,是为了便于理解。但如果允许改变原数组的话,我们可以把数组的前k个元素“原地交换”来构建成二叉堆,这样就免去了开辟额外的存储空间。

因此,方法的空间复杂度是O(1)

bf2a026a69c434ad932f5e81434353c0.png

a74796f57ec048588cc0743d3359fe7c.png

 

/**

* 寻找第k大的元素

* @param array  待调整的堆

* @param k  第几大

*/

public static int findNumberK(int[] array, int k){

   //1.用前k个元素构建小顶堆

   buildHeap(array, k);

   //2.继续遍历数组,和堆顶比较

   for(int i=k; i<array.length;i++){

       if(array[i] > array[0]){

           array[0] = array[i];

           downAdjust(array, 0, k);

       }

   }

   //3.返回堆顶元素

   return array[0];

}

/**

* 构建堆

* @param array  待调整的堆

* @param length  堆的有效大小

*/

private static void buildHeap(int[] array, int length) {

   // 从最后一个非叶子节点开始,依次下沉调整

   for (int i = (length-2)/2; i >= 0; i--) {

       downAdjust(array, i, length);

   }

}

/**

* 下沉调整

* @param array     待调整的堆

* @param index    要下沉的节点

* @param length    堆的有效大小

*/

private static void downAdjust(int[] array, int index, int length) {

   // temp保存父节点值,用于最后的赋值

   int temp = array[index];

   int childIndex = 2 * index + 1;

   while (childIndex < length) {

       // 如果有右孩子,且右孩子小于左孩子的值,则定位到右孩子

       if (childIndex + 1 < length && array[childIndex + 1] < array[childIndex]) {

           childIndex++;

       }

       // 如果父节点小于任何一个孩子的值,直接跳出

       if (temp <= array[childIndex])

           break;

       //无需真正交换,单向赋值即可

       array[index] = array[childIndex];

       index = childIndex;

       childIndex = 2 * childIndex + 1;

   }

   array[index] = temp;

}

public static void main(String[] args) {

   int[] array = new int[] {

7,5,15,3,17,2,20,24,1,9,12,8};

   System.out.println(findNumberK(array, 5));

}

8954a0501e6895be0825ccd404c1b6d9.png

方法四:分治法

大家都了解快速排序,快速排序利用分治法,每一次把数组分成较大和较小的两部分。

我们在寻找第k大元素的时候,也可以利用这个思路,以某个元素A为基准,把大于于A的元素都交换到数组左边,小于A的元素都交换到数组右边。

比如我们选择以元素7作为基准,把数组分成了左侧较大,右侧较小的两个区域,交换结果如下:

3b7970f45ee48c9294490612e0274bf7.png

包括元素7在内的较大元素有8个,但我们的k=5,显然较大元素的数目过多了。于是我们在较大元素的区域继续分治,这次以元素12位基准:

4a977f3af30b99c61324446a15d41b2d.png

这样一来,包括元素12在内的较大元素有5个,正好和k相等。所以,基准元素12就是我们所求的。

这就是分治法的大体思想,这种方法的时间复杂度甚至优于小顶堆法,可以达到O(n)。有兴趣的小伙伴可以尝试用代码实现一下。

fe66d95aa3b8faace46421db33a4cd36.png

1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

2.征稿:

投稿邮箱:liudan@csdn.net;微信号:color_ld。请备注投稿+姓名+公司职位。

推荐阅读

  • 有问有答 | 分布式服务框架精华问答

  • 深入理解与应用Hadoop中的MapReduce

  • 等了20年的物联网,这次真的会成功吗?

  • 云要闻 | 腾讯在华南建云计算基地;致敬Larry Roberts

  • 网友们票选的2018 Best Paper,你pick谁?

  • 程序员有话说 | 大专生毕业 6 年月薪 3W+:不从众也不普通

  • Windows 10 终于干掉了 Windows 7!

  • 比特币拒绝第340次“被死亡”

程序员抢票的正确姿势 ↓↓交朋友还能抢票?

7ea39e8eb611f9a10966e79ad36d7890.png

为交流学习,请备注抢票+姓名+公司职位

ec2fb25cb5a5f92671d1e490a438725d.gif点击“阅读原文”,打开 CSDN App 阅读更贴心!

9e0b92a6c771f1ad339fff625e760fc8.png 喜欢就点击“好看”吧!

转载地址:https://blog.csdn.net/weixin_33701632/article/details/112644345 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:控制是否展示_现场展示板管理不在于看,而在于管!
下一篇:字符串是单一字符的无序组合吗_Python学习笔记(八)组合数据类型

发表评论

最新留言

网站不错 人气很旺了 加油
[***.192.178.218]2024年04月18日 02时25分03秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章