题目描述
追逐影子的人,自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:$s_i$ 不是 $s_j$ 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。
其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
注意:请使用64位整数进行输入输出、储存和计算。
样例
输入样例:
4 2
1
1
2
2
输出样例:
12
2
算法1
(贪心+堆) $O(nlogn)$
首先明确题意,需要求最小的哈夫曼树。但是这题可以至多取m个。
上一题的贪心会造成错误,因为如果每次取k个的话,会有$n \% (m - 1) != 1$, 那么贪心就会出错。
解释下为什么这样贪心会出错:
我们可以在最低层取 $n \% (m - 1)$ ,这样结果显然更小。(在代码中实现的话,直接push({0ll, 0};
)
第二问:求最长的哈夫曼路径最短。
只要在每次合并的时候选择depth较短的即可。
时间复杂度
参考文献
C++ 代码
#include <iostream>
#include <queue>
#include <algorithm>
using namespace std;
const int N = 100010;
typedef long long LL;
typedef pair<LL, int> PLI;
int n, m;
int main(){
cin >> n >> m;
priority_queue<PLI, vector<PLI>, greater<PLI>> heap;
for (int i = 0; i < n; i ++){
LL x;
cin >> x;
heap.push({x ,0});
}
while ((n - 1) % (m - 1) ) {
heap.push({0ll, 0});
n ++;
}
LL res = 0;
while (heap.size() > 1){
LL sum = 0;
int depth = 0;
for (int i = 0; i < m; i ++){
sum += heap.top().first;
depth = max(depth, heap.top().second);
heap.pop();
}
heap.push({sum, depth + 1});
res += sum;
}
cout << res << endl << heap.top().second << endl;
return 0;
}