数据流中的中位数
题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
分析
Java中存在集合PriorityQueue
,优先级队列。其通过二叉树最小堆原理实现。
对于本题,需要中位数,可以构建一个大顶堆,一个小顶堆。大顶堆负责存储较小的数、小顶堆负责存储较大的数。中位数即为大顶堆的根节点与小顶堆的根节点和的平均数(偶数个数)或小顶堆顶点。
问题就在于如何将数据正确平均分配到堆中。前提是小顶堆元素数量 >= 大顶堆数量。
- 当个数为偶数,先入大顶堆,将大顶堆最大的数插入小顶堆。
- 当个数为奇数,先入小顶堆,将小顶堆最小的数插入大顶堆。
实现
//小顶堆
private PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>();
//大顶堆
private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(15, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1;
}
});
int count = 0;
public void Insert(Integer num) {
//个数为偶数的话,则先插入到大顶堆,然后将大顶堆中最大的数插入小顶堆中
if(count % 2 != 0){
maxHeap.offer(num);
int max = maxHeap.poll();
minHeap.offer(max);
}else{
//个数为奇数的话,则先插入到小顶堆,然后将小顶堆中最小的数插入大顶堆中
minHeap.offer(num);
int min = minHeap.poll();
maxHeap.offer(min);
}
count++;
}
public Double GetMedian() {
//当前为偶数个,则取小顶堆和大顶堆的堆顶元素求平均
if(count % 2 == 0){
return new Double(minHeap.peek() + maxHeap.peek())/2;
}else{
//当前为奇数个,则直接从小顶堆中取元素即可
return new Double(maxHeap.peek());
}
}