博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
KMP算法的实现(Java语言描述)
阅读量:6704 次
发布时间:2019-06-25

本文共 3036 字,大约阅读时间需要 10 分钟。

标签:it

KMP算法是模式匹配专用算法。

它是在已知模式串的nextnextval数组的基础上执行的。如果不知道它们二者之一,就没法使用KMP算法,因此我们需要计算它们。

KMP算法由两部分组成:

第一部分,计算模式串的nextnextval数组。

第二部分,利用计算好的模式串的nextval数组,进行模式匹配。

KMP算法中有next数组和nextval数组之分。他们代表的意义和作用完全一样,完全可以混用。唯一不同的是,next数组在一些情况下有些缺陷,而nextval是为了弥补这个缺陷而产生的。一、求解next

步骤:next数组值的程序设计求解方法:首先可以肯定的是第一位的next值为0,第二位的next值为1,后面求解每一位的next值时,根据前一位进行比较。首先将前一位与其next值对应的内容进行比较,如果相等,则该位的next值就是前一位的next值加上1;如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值即为1

举例:

模式串 a b a a bc a c

next 0 1 1 2 2 3 1 2

1.前两位必为01

2.计算第三位的时候,看第二位bnext值,为1,则把b1对应的a进行比较,不同,则第三位anext的值为1,因为一直比到最前一位,都没有发生比较相同的现象。

3.计算第四位的时候,看第三位anext值,为1,则把a1对应的a进行比较,相同,则第四位anext的值为第三位anext值加上1,为2。因为是在第三位实现了其next值对应

的值与第三位的值相同。

4.计算第五位的时候,看第四位anext值,为2,则把a2对应的b进行比较,不同,则再将b对应的next1对应的a与第四位的a进行比较,相同,则第五位的next值为第二位b

next值加上1,为2。因为是在第二位实现了其next值对应的值与第四位的值相同。

5.计算第六位的时候,看第五位bnext值,为2,则把b2对应的b进行比较,相同,则第六位cnext值为第五位bnext值加上1,为3,因为是在第五位实现了其next值对应的

值与第五位相

6.计算第七位的时候,看第六位cnext值,为3,则把c3对应的a进行比较,不同,则再把第3anext1对应的a与第六位c比较,仍然不同,则第七位的next值为1

7.计算第八位的时候,看第七位anext值,为1,则把a1对应的a进行比较,相同,则第八位cnext值为第七位anext值加上1,为2,因为是在第七位和实现了其next值对应的值与第七位相同。

二、求解nextval

nextval数组值有两种方法,一种是不依赖next数组值直接用观察法求得,一种方法是根据next数组值进行推理,两种方法均可使用,视更喜欢哪种方法而定。 本文主要分析nextval数组值的第二种方法:

  模式串 a b a ab c a c

  next 0 1 1 2 2 3 1 2

  nextval 0 1 0 2 1 3 0 2

  1.第一位的nextval值必定为0,第二位如果于第一位相同则为0,如果不同则为1

  2.第三位的next值为1,那么将第三位和第一位进行比较,均为a,相同,则,第三位的nextval值为0

  3.第四位的next值为2,那么将第四位和第二位进行比较,不同,则第四位的nextval值为其next值,为2

  4.第五位的next值为2,那么将第五位和第二位进行比较,相同,第二位的next值为1,则继续将第二位与第一位进行比较,不同,则第五位的nextval值为第二位的next值,为1

  5.第六位的next值为3,那么将第六位和第三位进行比较,不同,则第六位的nextval值为其next值,为3

  6.第七位的next值为1,那么将第七位和第一位进行比较,相同,则第七位的nextval值为0

  7.第八位的next值为2,那么将第八位和第二位进行比较,不同,则第八位的nextval值为其next值,为2

三、nextnextval比较

Next数组的缺陷举例如下:

比如主串是“aab…..” 省略号代表后面还有字符。

模式串“aac”

通过计算aacnext数组为012(另外,任何字符串的第二位字符的next总是1,因此你可以认为他固定为1

当模式串在字符c上失配时,会跳到第2个字符,然后再和主串当前失配的字符重新比较,即此处用模式串的第二个a和主串的b比较

aab aac

显然a也不等于b。然后会跳到1,接着比,然后又失配,直到最后才使主串后移一位。

“aac”nextval数组为002 当在c失配时会跳到2,若还失配就直接跳到0,比next数组少比较了1次。

在如果模式串很长的话,那可以省去很多比较,因此你应该使用nextval数组。

public class KMP {		public static void main(String agrs []){			String s = "abbabbbbcab"; // 主串			String t = "bbcab"; // 模式串			char[] ss = s.toCharArray();			char[] tt = t.toCharArray();			System.out.println(KMP_Index(ss, tt)); // KMP匹配字符串		}				public static int[] next(char[] t) {			int[] next = new int[t.length];			next[0] = -1;			int i = 0;			int j = -1;			while (i < t.length - 1) {				if (j == -1 || t[i] == t[j]) {					i++;					j++;					if (t[i] != t[j]) {						next[i] = j;					} else {						next[i] = next[j];					}				} else {					j = next[j];				}			}			return next;		}				public static int KMP_Index(char[] s, char[] t) {			int[] next = next(t);			int i = 0;			int j = 0;			while (i <= s.length - 1 && j <= t.length - 1) {				if (j == -1 || s[i] == t[j]) {					i++;					j++;				} else {					j = next[j];				}			}			if (j < t.length) {				return -1;			} else				return i - t.length; // 返回模式串在主串中的头下标		}}

 

转载地址:http://hfflo.baihongyu.com/

你可能感兴趣的文章
我所遭遇过的游戏中间件---SpeedTree
查看>>
android:versionCode和android:versionName 用途(转)
查看>>
Fragment Transactions & Activity State Loss
查看>>
jQuery插件 -- 表单验证插件jquery.validate.js
查看>>
我的MYSQL学习心得(十四) 备份和恢复
查看>>
nodejs express 安装
查看>>
flume-ng-elasticsearch 索引时间命名问题(时区和时间格式)
查看>>
PE文件结构学习
查看>>
在对listctrl的控件进行重载的过程中,GetHeaderCtrl()返回NULL的问题
查看>>
WEB网站前端性能分析相关
查看>>
sql server2008系统表详细说明sys.开头的表
查看>>
Python基础(9)--正则表达式
查看>>
解决Installation error: INSTALL_FAILED_VERSION_DOWNGRADE错误
查看>>
os 计算机的启动
查看>>
C++Vector使用方法
查看>>
字符串逆序输出
查看>>
[LeetCode] Length of Last Word 求末尾单词的长度
查看>>
[PHP100]留言板(一)
查看>>
boost::asio实现一个echo服务器
查看>>
标准差(standard deviation)和标准误差(standard error)你能解释清楚吗?
查看>>