【剑指offer】063-数据流中的中位数

题目

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

方法

方法:双堆方法
参考:https://www.cnblogs.com/easonliu/p/4441916.html
时间复杂度:nlogn,比常规的n^2小

思路

对于数据流,就需要在线算法,每次插入新的数据都需要对整个数组进行调整
题目需要找出数据流的中位数,简单的办法就是一个数组存放数据流,每进入一个数,就插入到相应的位置,保持数组的升序,这样的方法复杂度在n^2

可以使用两个堆,分别存放一半的数据,来实现快速查找中位数的效果。
假设有n个数据,一个最大堆,存放小的n/2个数据;一个最小堆,存放大的n/2个数据。当需要获取n个数的中位数的时候,如果n是奇数,直接取最小堆的堆顶;如果是偶数,则取两个堆的堆顶的平均值

在这个方法中,有2个点需要注意:
第一点:如何保证最大堆和最小堆的数据数量平衡?在插入某个数据的时候,判断一下当前n是奇数或者偶数,插入到不同的堆中的即可。这里,当n是奇数的时候,我插入到最大堆中,反之插入最小堆
第二点:如何保证最大堆的所有数据都比最小堆的所有数据小?在第一点的基础上,在插入最大堆之前,判断该数是否比最小堆的堆顶大,是则先将该数插入到最小堆中,然后将最小堆的堆顶拿出,插入到最大堆中,这样就可以保证插入最大堆一定小于最小堆;同理,插入最小堆之前,也做类似判断

注意:
因为此题的关键,在于对堆的应用,而c++的vector有现成的堆排序库函数可以使用,这里我就直接使用c++完成本题代码,而不用js重写堆排序和堆插入等操作

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
class Solution {
private:
    vector<intmin;
    vector<intmax;
public:
    void Insert(int num) {
        // 现在数字总个数为奇数,num插入最大堆中
        if (max.size() + min.size() & 1) {
            //  为了保证最大堆的所有数字都比最小堆小
            // 如果num > 最小堆中的最小值,那么num先插入最小堆,之后取出最小堆的堆顶,插入到最大堆
            if (min.size() > 0 && num > min[0]) {
                min.push_back(num);
                push_heap(min.begin(), min.end(), greater<int>());
                num = min[0];
                pop_heap(min.begin(), min.end(), greater<int>());
                min.pop_back();
            }
            max.push_back(num);
            push_heap(max.begin(), max.end(), less<int>());
        } else {
            // 同理,如果num < 最大堆的堆顶,那么num先插入最大堆,之后取出最大堆的堆顶,插入到最小堆
            if (max.size() > 0 && num < max[0]) {
                max.push_back(num);
                push_heap(max.begin(), max.end(), less<int>());
                num = max[0];
                pop_heap(max.begin(), max.end(), less<int>());
                max.pop_back();
            }
            min.push_back(num);
            push_heap(min.begin(), min.end(), greater<int>());
        }
    }
    double GetMedian() 
        // 奇数,返回
        if (max.size() + min.size() & 1) {
            return min[0];
        } else {
            return (max[0] + min[0]) * 1.0 / 2;
        }
    }
};
文章作者: ptp
文章链接: https://youyingjie114.github.io/2019/11/07/jz-offer/jz-offer-063/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 PTP'S BLOG