C++数据结构之kmp算法中求Next()函数的算法怎么实现

发布时间：2023-05-16 00:16:10

1. 基本概念

在KMP算法中，next()函数是一个重要的辅助函数，用于寻找目标字符串中的特殊子串，在匹配字符串中寻找相同的子串。它的主要作用是当字符串中出现不匹配的情况时，快速找到模式串中下一次匹配开始的位置。具体来说，next()函数会在模式串中找到一个最长的相同前缀和后缀的长度，这个长度就是对应位置的next值。

2. 求next()函数的算法流程

（1）首先，我们利用0到i-1位匹配的结果来求第i位的next值，因此需要知道模式串的当前长度i。

（2）接着，我们需要找到一个位置j（j<i），使得0到j-1位与i-j到i-1位完全相同。

（3）找到j的过程就是利用next数组来进行匹配的过程，从next[i-1]开始向前寻找，直到找到一个位置k（k>=0，k<j），使得模式串的0到k-1位与i-k到i-1位完全相同。

（4）最后，我们将j赋值为k+1，即可求出当前位置i的next值。

例如，在求解“ABCDABD”这个模式串的next值时，我们可以按照以下的流程进行计算：

（1）将j初始化为0，i初始化为1。

（2）比较模式串的第j位和第i位，发现相同，因此j+1，i+1。

（3）比较模式串的第j位和第i位，发现相同，因此j+1，i+1。

（4）比较模式串的第j位和第i位，发现不同，因此需要将j回溯到最后一个匹配的位置，即j=next[1]=0。

（5）比较模式串的第j位和第i位，发现不同，因此需要将j回溯到最后一个匹配的位置，即j=next[0]=-1。

（6）注意到j=-1时，需要将j赋值为0，因此i+1，j+1。

（7）比较模式串的第j位和第i位，发现相同，因此j+1，i+1。

（8）比较模式串的第j位和第i位，发现不同，因此需要将j回溯到最后一个匹配的位置，即j=next[3]=0。

（9）比较模式串的第j位和第i位，发现相同，因此j+1，i+1。

（10）比较模式串的第j位和第i位，发现不同，因此需要将j回溯到最后一个匹配的位置，即j=next[4]=2。

（11）比较模式串的第j位和第i位，发现相同，因此j+1，i+1。

（12）最终得到next数组为[-1,0,0,0,2,0,2]。

3. 求next()函数的算法实现

（1）使用循环来遍历所有位置，计算当前位置的next值。

（2）对于每个i位置，使用循环来找到它的最长相等前缀后缀长度k。

（3）在查找k的过程中，利用next数组来跳转，如果当前字母相等，j和i同时向前移动，否则将j更新为next[j]，直到找到一个最大的k。

（4）将k+1赋值给next[i]，即为当前位置的next值。

例如，在求解“ABCDABD”这个模式串的next值时，我们可以按照以下的代码进行实现：

void getNext(string pattern, vector<int>& next) {
    int len = pattern.size();
    next[0] = -1;
    int j = -1, i = 0;
    while (i < len - 1) {
        if (j == -1 || pattern[i] == pattern[j]) {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
}

4. 算法复杂度分析

KMP算法中求解next()函数的时间复杂度为O(n)，其中n为模式串的长度。因为每次求解next()函数只需要进行一次遍历，并利用next数组的信息来查找相同的前缀和后缀，因此时间复杂度为O(n)。空间复杂度也为O(n)，因为需要保存next数组的所有元素。