leetcode每日一题187. 重复的DNA序列 字符串哈希与滑动窗口的巧妙结合 你学费了没?
写在前面
因为作者对于字符串的算法有点拉胯,今日的每日一题,不是我个算法小白能吃明白的,所幸按照三叶姐姐的思路一点点补补字符串相关的算法吧~
题目
所有 DNA 都由一系列缩写为 'A','C','G' 和 'T' 的核苷酸组成,
例如:"ACGAATTCCG"。
在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,
且在 DNA 字符串 s 中出现次数超过一次。
很多小伙伴读不懂题:
那我来给他描述的生动一些,就是给了你个由ACGT这四个字母按照不同数量组成的一个字符串,然后给了我们一个长度为10的检测标准,让我们从这个字符串s中找到重复出现两次标准的一个子字符串,这样子应该了解了噻~
示例
示例1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例2:
输入:s = 输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
思路
字符串哈希与滑动窗口的结合
1)我们需要维护一个hashmap用来唯一确定其是否重复
2)滑动窗口大小为当前 位置 + 10 给定的子串长度进行遍历
3)如果当前的数量重复后就添加到结果当中
代码实现
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
List<String> res = new ArrayList<>();
//维护一个hashmap用来字符串哈希
Map<String ,Integer> map = new HashMap<>();
for (int i = 0; i + 10 <= s.length();i++){
//获取当前的窗口大小的字符串
String str = s.substring(i,i+10);
//查看其是否在map中存在
int cnt = map.getOrDefault(str,0);
//如果是重复的就添加到res中
if (cnt == 1)res.add(str);
//将其记录添加到hashmap中进行哈希验证
map.put(str,cnt+1);
}
return res;
}
}
执行结果
写在最后
从简入难 不乏是进步夯实的一种最佳方案,
不能一蹴而就是吧
咱们弄简单点,一点点来,肯定不会有大问题的
今个就说这么多,加油打卡每日一题!
最后
每天进步点 每天收获点
愿诸君 事业有成 学有所获
如果觉得不错 别忘啦一键三连哦~