写了下yxc老师视频里提到的三种方法
题目描述
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,”ace”是”abcde”的一个子序列,而”aec”不是)。
后续挑战 :
如果有大量输入的 S,称作S1, S2, … , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
样例
示例 1:
s = "abc", t = "ahbgdc"
返回 true.
示例 2:
s = "axc", t = "ahbgdc"
返回 false.
算法1 很显然的扫描t串的方法
扫描一遍t串即可,然后看能不能让指向s串的指针一直移动到最后
C++ 代码
class Solution {
public:
bool isSubsequence(string s, string t) {
int i=0;
for(int j=0;j<t.length();j++){
if(s[i]==t[j])
i++;
}
if(i==s.length())
return true;
else
return false;
}
};
下面两个算法主要是为了题目中的那个后续挑战写的,如何在多个s串的情况下节省匹配时间
算法2 扫描一遍t串,做出26个有序的vector,然后利用二分去匹配s串
扫描一遍t串,然后将每个字母的位置放入相应的26个字母的vector中(因为是按顺序扫描t串所以26个vector必定是有序的)
后面就扫描s串,s串是什么字符就对应到哪个字符的vector中去lower_bound二分,然后将代表位置的变量更新
C++ 代码
class Solution {
public:
vector<int> v[26];
bool isSubsequence(string s, string t) {
for(int i=0;i<26;i++) v[i].clear();
for(int i=0;i<t.length();i++)
v[t[i]-'a'].push_back(i);
int pos=0;
for(auto c:s){
if(!v[c-'a'].size())
return false;
else{
auto it=lower_bound(v[c-'a'].begin(),v[c-'a'].end(),pos);
if(it==v[c-'a'].end())
return false;
else
pos=(*it)+1;
}
}
return true;
}
};
算法3 直接打一个超大的表,表示t串的每个位置26个字母每个出现的下一个位置
根据yxc老师的思路开了一个a[26][500000],首先将整个表赋值成-1代表初始状态
然后还是去扫描t串,不过我是从后往前扫描,利用val[26]记住每个字母在后面出现的位置,然后每走到一个字符就更新val[26]中那个字符的值,再利用val[26]去给表赋值
打完表之后只要扫描s串然后查表就可以了,省去了上面算法中二分的时间
C++ 代码
int a[26][600000];
int val[26];
class Solution {
public:
bool isSubsequence(string s, string t) {
memset(a,-1,sizeof(a));
memset(val,-1,sizeof(val));
for(int i=t.length()-1;i>=0;i--){
val[t[i]-'a']=i;
for(int j=0;j<26;j++)
a[j][i]=val[j];
}
int pos=0;
for(int i=0;i<s.length();i++){
//cout << a[s[i]-'a'][pos] << endl;
if(a[s[i]-'a'][pos]==-1)
return false;
else{
pos=a[s[i]-'a'][pos];
pos++;
}
}
return true;
}
};
Tql
大家好这是我花五毛钱买的水军QAQ