题目描述
中位数 是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。
- 例如
arr = [2,3,4]
的中位数是3
。 - 例如
arr = [2,3]
的中位数是(2 + 3) / 2 = 2.5
。
实现 MedianFinder
类:
MedianFinder()
初始化MedianFinder
对象。void addNum(int num)
将数据流中的整数num
添加到数据结构中。double findMedian()
返回到目前为止所有元素的中位数。与实际答案相差 $10^{-5}$ 以内的答案将被接受。
样例
输入:
["MedianFinder", "addNum", "addNum", "findMedian", "addNum", "findMedian"]
[[], [1], [2], [], [3], []]
输出:
[null, null, null, 1.5, null, 2.0]
解释:
MedianFinder medianFinder = new MedianFinder();
medianFinder.addNum(1); // arr = [1]
medianFinder.addNum(2); // arr = [1, 2]
medianFinder.findMedian(); // 返回 1.5 ((1 + 2) / 2)
medianFinder.addNum(3); // arr[1, 2, 3]
medianFinder.findMedian(); // return 2.0
限制
-10^5 <= num <= 10^5
- 在调用
findMedian
之前,数据结构中至少有一个元素。 - 最多
5 * 10^4
次调用addNum
和findMedian
。
算法
(双堆) $O(n \log n)$
- 建立一个大根堆,一个小根堆。大根堆存储小于当前中位数,小根堆存储大于等于当前中位数,且大根堆中的数字个数永远都比小根堆多 1 或相等。
- 根据上述定义,我们每次可以通过大根堆的堆顶或者两个堆的堆顶元素的平均数求出中位数。
- 维护时,如果新加入的元素小于等于大根堆的堆顶,则加入大根堆;否则加入小根堆。然后如果发现两个堆的大小关系不满足上述要求,则可以通过弹出一个堆的元素放到另一个堆中。
时间复杂度
- 每次维护堆的时间为 $O(\log n)$,取出中位数的时间为 $O(1)$。故总时间复杂度为 $O(n \log n)$。
空间复杂度
- 需要额外 $O(n)$ 的空间存储堆。
C++ 代码
class MedianFinder {
private:
priority_queue<int> smaller;
priority_queue<int, vector<int>, greater<int>> larger;
public:
MedianFinder() {
}
void addNum(int num) {
if (smaller.empty() || num <= smaller.top())
smaller.push(num);
else
larger.push(num);
if (smaller.size() == larger.size() + 2) {
int top = smaller.top();
smaller.pop();
larger.push(top);
} else if (larger.size() == smaller.size() + 1) {
int top = larger.top();
larger.pop();
smaller.push(top);
}
}
double findMedian() {
if (smaller.size() == larger.size())
return (smaller.top() + larger.top()) / 2.0;
return smaller.top();
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/
‘小根堆的大小永远都比大根堆大1或相等’ 不应该是 ‘大根堆的大小永远都比小根堆大1或相等’吗?
大根堆是 smaller, smaller(大根堆) 永远都比 larger (小根堆) 大1或相等
已修正~