范围最值查询

范围最值查询(英语:Range Minimum Query),是针对数据集的一种条件查询。若给定一个数组{\displaystyle A[1,n]},范围最值查询指定一个范围条件{\displaystyle i}{\displaystyle j},要求取出{\displaystyle A[i,j]}中最大/小的元素。

{\displaystyle A=[3,5,2,5,4,3,1,6,3]},条件为{\displaystyle [3,8]}的范围最值查询返回1,它是子数组{\displaystyle A[3,8]=[2,5,4,3,1,6]}中最小的元素。

通常情况下,数组A是静态的,即元素不会变化,例如插入、删除和修改等,而所有的查询是以在线的方式给出的,即预先并不知道所有查询的参数。

RMQ问题有预处理{\displaystyle O(n)}之后每次查询{\displaystyle O(1)}的算法。

范围最值查询问题(RMQ)与最近公共祖先(LCA)问题有直接联系,它们可以互相转化。RMQ的算法常常应用在严格或者近似子串匹配等问题的处理中。

算法

Sparse Table

创建一个二维数组 {\displaystyle F[1\dots N][0\dots O(\log _{2}N)]} 的整数值。

在这个数组中 {\displaystyle F[i][j]} 表示范围 {\displaystyle [i,i+2^{j}-1]} 中的最大值(例如 {\displaystyle [2,5]} 中的最大值被计为 {\displaystyle F[2][2]})。

创建数组的过程可以在 {\displaystyle O(N\log N)}时间内完成。具体算法类似于动态规划。以下是 C++ 语言描述的代码,数组约定从 0 开始:

void Initialise(vector<int> &Array)
{
    int Length = (int)Array.size();

    // 长度为 0 时,表示数据自身。
    for (int i = 0; i < Length; ++i) F[i][0] = Array[i];

    for (int j = 1; (1 << j) <= Length; ++j)
        for (int i = 0; i + (1 << j) - 1 < Length; ++i)
            F[i][j] = min(
                F[i][j - 1], F[i + (1 << (j - 1))][j - 1]
            ); // 分成长度相等的两段
}

当我们需要计算一个区间中的最大值(例如 {\displaystyle [3,8]} 时),我们先求出这个区间的长度(即 8 - 3 + 1 = 6)。

然后我们算出不大于它的最大 {\displaystyle 2^{k}} 值的指数(即 2)。我们要查询分别以 3 开头,和以 8 结尾的两个长度为 {\displaystyle 2^{2}} 的区间的最大值。

显然 {\displaystyle F[3][2]}{\displaystyle F[5][2]} 也就是({\displaystyle [3,6]}{\displaystyle [5,8]})的最大值就是 {\displaystyle [3,8]} 的最大值。查询的时间是常数,代码如下:

int Query(int Left, int Right)
{
    int i = 0;

    while (1 << (i + 1) <= Right - Left + 1) ++i;

    return min(
        F[Left][i], F[Right - (1 << i) + 1][i]
    );
}

程序预处理的时间复杂度是 {\displaystyle O(N\log N)}的,单次询问的时间复杂度是{\displaystyle O(1)}的。整个程序的空间复杂度是{\displaystyle O(N\log N)}

Method of Four Russians

Method of Four Russians先对数组进行分块,再预处理出每个块里的ST表,以及每个块的最值构成的数组的ST表。然后每次查询时,只需算出中间连续几个块的最小值与两边不完整的块的最小值的最小值。程序预处理的时间复杂度是 {\displaystyle O(N\log \log N)}的,单次询问的时间复杂度是{\displaystyle O(1)}的。整个程序的空间复杂度是{\displaystyle O(N\log \log N)}。还可以再优化,使预处理的时间复杂度是 {\displaystyle O(N)}的,单次询问的时间复杂度是{\displaystyle O(1)}的,空间复杂度是{\displaystyle O(N)}

数据结构

如果使用线段树等数据结构,则可以做到预处理的时间复杂度是 {\displaystyle O(N\log N)},单次询问的时间复杂度是{\displaystyle O(\log N)}。整个程序的空间复杂度是{\displaystyle O(N)}。优点是可以支持动态修改。

应用

在Fischer和Heun(2007)中可以找到一些应用。

计算树中的最近公共祖先

范围最值查询可被用于解决最近公共祖先问题。有根树S中的节点v与w的最近公共祖先是在从根到w和v的路径上最深的公共节点u(其可能是v或w)。 Gabow, Bentley和Tarjan(1984)表明,最近公共祖先问题可以在线性时间内规约到范围最值查询问题。由此可见,与范围最值查询问题一样,最近公共祖先问题可以在常数时间内进行单次查询,并仅使用线性空间。

原文地址:
https://zh.wikipedia.org/wiki/%E8%8C%83%E5%9B%B4%E6%9C%80%E5%80%BC%E6%9F%A5%E8%AF%A2

知识共享 署名-相同方式共享 3.0协议之条款下提供

文章作者: 张拓
文章链接: http://www.xssl.online/%e8%8c%83%e5%9b%b4%e6%9c%80%e5%80%bc%e6%9f%a5%e8%af%a2/
版权声明: 本博客所有文章除特别声明外,均采用CC BY-NC-SA 4.0 许可协议。转载请注明来自 张拓的博客
浏览次数: 508

张拓

陕西西安蓝田张拓QQ1070410059。一生所求不过“心安”二字。 然,尘世多纷扰。

发表回复