数据流中的中位数
数据流中的中位数
问题陈述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例1:
1 | 输入: |
思路分析
可将数据流保存在一个列表中,并将其有序排列,在添加元素时保持有序,中位数即其中间元素。
进一步,可考虑使用堆来优化时间复杂度。
建立一个小堆顶A,一个大堆顶B,各保存列表的一半元素。且规定:
-
A保存较大的一部分,长度为n/2,n为偶数;长度为n+1/2,n为奇数。
-
B保存较小的一部分,长度为n/2,n为偶数;长度为n-1/2,n为奇数。
中位数返回堆顶元素的和的一半即得。
增加元素
设元素总数为 N = m + n ,其中 m 和 n 分别为 A 和 B 中的元素个数。
- 当 m=n,即N为偶数:需向A添加一个元素。实现方法:将新元素放入B,并将B的堆顶元素(大的数)放入A。
- 当N为奇数,需向B添加一个元素(因为B少一个)。实现方法:将新元素放入A,并将A的堆顶元素(小的数)放入B。
代码实现
1 | class MediumFinder{ |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 淋竹调!
评论