On the Expected Subword Complexity of Random Words
In this article, we study the expected subword complexity of random words and some of its properties.
On the Expected Subword Complexity of Random Words
In this article, we study the expected subword complexity of random words and some of its properties.
本篇文章研究了随机字符串期望的本质不同子串个数及其相关的性质。
给定字符串 $S$,多次询问,每次给出字符串 $T$,问 $S$ 有多少个本质不同的字串以 $T$ 结尾。
求长度为 $n$、字符集大小为 $m$ 的随机字符串的期望本质不同子串个数。
$1\le n\le 20$,$1\le m\le 5\cdot 10^6$
给定字符串 $S$,求 $S$ 所有非空子串的本质不同子串个数之和。
$1\le|S|\le 2\cdot10^5$
[题解] [Mivik 的字符串公开赛] Mivik 的标题
给定 $n$、$m$ 和字符串 $S$,问长度为 $n$、字符集大小为 $m$ 的随机字符串中包含 $S$ 作为子串的概率。答案对 $998244353$ 取模。
$1\le |S|\le n\le 10^5$,$1\le m\le 10^8$
给定 $n$ ,代表有 $n$ 种字符。再给出多个数组 $a$ ,记其长度为 $m$,$1\le a_i\le n$。每次随机写下出一个字符,求第一次写下这个数组(即写下的字符串后缀为该数组)期望要写多少个字符。
$1\le n,m\le 10^5$
一篇论文是由许多单词组成,但小张发现一个单词会在论文中出现很多次,问每个单词分别在论文中出现了多少次。
$1\le n \le 200$,单词总长度不超过 $10^6$
tar[x][c]
:SAM 转移
pre[x]
:常用名有 link
、fail
等 (反正就那个东西)
len[x]
:结点 x
代表的最长字符串的长度
广义后缀自动机(下文用广义 SAM 指代),即用多个字符串的后缀建出的一个后缀自动机,拥有和后缀自动机相似的性质。
有三种较流传广泛的广义后缀自动机写法:
在上一篇文章里面我们介绍了 $FFT/IFFT$ 的基本原理和应用,今天我们来了解一下 $FFT$ 在字符串匹配中的神奇应用