Tire树相关知识
高效的存储和查找字符串集合的DS。
原理就是从根节点开始不断进行字母的存储,在每一个字符串末尾进行标记。
题目描述
维护一个字符串集合,支持两种操作:
- “I x”向集合中插入一个字符串x;
- “Q x”询问一个字符串在集合中出现了多少次。
共有N个操作,输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。
格式
输入格式
第一行包含整数N,表示操作数。
接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。
输出格式
对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。
每个结果占一行。
样例
输入
5
I abc
Q abc
Q ab
I ab
Q ab
输出
1
0
1
算法1
结合图像很好理解的一个代码。由于两个函数基本操作类似,所以只提取关键语句进行解释。
int u=str[i]-'a';
if(!son[p][u])son[p][u]=++idx;
本条语句意思就是先找到根节点延伸的头部节点,如果没有那么新增一个,再进行后续节点的插入。u就是存放字母映射后的数字的值。
p=son[p][u];
p指向当前存放的节点,从而进行for loop的下一个操作。
C++ 代码
#include<iostream>
using namespace std;
const int N=1e5+10;
char str[N];
//son存每个点的所有儿子
//cnt存的是以当前这个点结尾的单词有多少个
//idx存当前用到的下标,下标为0的点,即是根节点,也是空节点
int son[N][26],cnt[N],idx;
void insert(char str[])
{
int p=0;
for(int i=0;str[i];i++)
{
int u=str[i]-'a';
if(!son[p][u])son[p][u]=++idx;//如果没有路,建一条路
p=son[p][u];//p只是一个指针,由根节点往外指着不同的字符
}
cnt[p]++;
}
int query(char str[])
{
int p=0;
for(int i=0;str[i];i++)
{
int u=str[i]-'a';
if(!son[p][u]) return 0;
p=son[p][u];
}
return cnt[p];
}
int main()
{
int n;
scanf("%d",&n);
while(n--)
{
char op[2];
scanf("%s%s",op,str);
if(op[0]=='I') insert(str);
else printf("%d\n",query(str));
}
return 0;
}