1.用途
高效的存储和查找字符串集合的数据结构, 一般题目的字符串全部是小(大)写字母、数字等特征;注意题目所有节点的范围,数据范围太大不能用二维数组的形式存储
插入和查找的复杂度是O(n), n是单词长度
思想:利用字符串的公共前缀来降低查询的开销
2. 代码模板
int son[N][26], cnt[N], idx;
void insert(char str[])
{
int p = 0;
for(int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if(!son[p][u]) son[p][u] = ++idx;
p = son[p][u];
}
cnt[p] ++;
}
int query(char str[])
{
int p = 0;
for(int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if(!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
题目描述举例
维护一个字符串集合,支持两种操作:
“I x”向集合中插入一个字符串x;
“Q x”询问一个字符串在集合中出现了多少次。
共有N个操作,输入的字符串总长度不超过 105
,字符串仅包含小写英文字母。
输入格式
第一行包含整数N,表示操作数。
接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。
输出格式
对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗104
样例
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
C 代码
#include<stdlib.h>
#include<stdio.h>
#define N 100010
int son[N][26], cnt[N], idx;
void insert(char str[])
{
int p = 0;
for(int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if(!son[p][u]) son[p][u] = ++idx;
p = son[p][u];
}
cnt[p] ++;
}
int query(char str[])
{
int p = 0;
for(int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if(!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main()
{
int n = 0;
scanf("%d", &n);
while(n--){
char op[2], str[100];
scanf("%s%s", op, str);
if(op[0] == 'I'){
insert(str);
}else{
printf("%d\n", query(str));
}
}
}