分治法

1. 定义

为了解决一个问题，可以将原问题分解成几个规模较小但类似与原问题的子问题，然后递归地求解子问题，最后将子问题的解合并成原问题的解。

分治模式在每层递归时有三个步骤：

分解：将原问题分解为若干子问题，这些子问题是原问题的规模较小的实例。
解决：递归地求解子问题。
合并：将子问题的解合并成原问题的解。

当子问题足够大，需要递归求解时，称为递归情况，当子问题足够小，不需要递归求解时，递归已经触底，称为基本情况。

2. 示例：归并排序

归并排序 算法遵循上述的分治模式。它的三个步骤可以表述如下：

分解：将乱序的 $n$ 个元素的数组划分为两个长度为 $\frac{n}{2}$ 的子数组。
解决：使用归并排序递归地排序这两个子数组。
合并：将两个已经排好序的数组合并成一个排好序的大数组。

递归触底：当每个子数组长度为 1 时，这个数组已经排好序 😃。这时不再需要继续分解数组。

归并排序的关键操作是合并这步，想法很简单：

看两个数组的第一个元素，比较大小，如果数组 A 的第一个元素小于 B 的第一个元素，就把 A 的第一个元素抽出来，反之就把 B 的第一个元素抽出来；
重复第一步，直到有一个数组空了，就把另一个数组剩下的元素直接并到大数组结尾就好。
实际操作中，判断数组是否空这步有一个好方法：
1. 在 A B 数组的最后各塞一个无穷大的数，重复第一步
2. 当真的有一个数组空的时候，就不需要采取别的操作，因为 B 数组的任何数都比无穷大小，因此总能把未空的数组的所有元素全部合并

代码实现：

实现 merge_sort() 函数
1. 传入一个数组，以及要排序的元素的起始下标和终止下标
2. 如果起始下标等于终止下标，则递归触底，直接返回；
3. 否则，把这个区间分成两半（注意两半不能有交叉），分别对这两半进行归并排序，最后调用 merge() 函数进行合并
c
```
void merge_sort(int A[], int p, int r)
{
    if (p < r) {
        int mid = (p + r) / 2;
        merge_sort(A, p, mid);
        merge_sort(A, mid + 1, r);
        merge(A, p, mid, r);
    }
}
```
1
2
3
4
5
6
7
8
9

实现 merge() 函数

开辟新数组，把数组元素复制一份到新数组，以便稍后移动回原来的数组；
1. 确定数组大小：第一个数组存储从 p 到 mid 的元素，第二个数组存储从 mid + 1 到 r 的元素
  定义两个对象 n1 和 n2，分别表示第一个数组和第二个数组的元素个数
  c
```
const int n1 = mid - p + 1;
const int n2 = r - mid;
```
  1
  2
2. 开辟数组：使用 malloc() 函数因为末尾要放一个无穷大的数，所以要多开一个位置
  c
```
int* L = malloc((n1 + 1) * sizeof(int));
int* R = malloc((n2 + 1) * sizeof(int));
```
  1
  2
3. 复制元素到新数组
  c
```
for (int i = 0; i < n1; i++) {
    L[i] = A[p + i];
}
L[n1] = INT_MAX;
for (int i = 0; i < n2; i++) {
    R[i] = A[(mid + 1) + i];
}
R[n2] = INT_MAX;
```
  1
  2
  3
  4
  5
  6
  7
  8

依次比较大小，把较小的元素放入原数组；因为一共只有从 r 到 p 这些数，定义一个对象 k 从 r 循环到 p，把大数放到原数组中

int i = 0, j = 0;
for (int k = p; k <= r; k++) {
    if (L[i] <= R[j]) {
        A[k] = L[i];
        i += 1;
    } else {
        A[k] = R[j];
        j += 1;
    }
}

释放内存
c
```
free(L);
free(R);
```
1
2

merge() 函数全部代码：

void merge(int A[], const int p, const int mid, const int r)
{
    const int n1 = mid - p + 1;
    const int n2 = r - mid;
    int* L = malloc((n1 + 1) * sizeof(int));
    int* R = malloc((n2 + 1) * sizeof(int));
    for (int i = 0; i < n1; i++) {
        L[i] = A[p + i];
    }
    L[n1] = INT_MAX;
    for (int i = 0; i < n2; i++) {
        R[i] = A[(mid + 1) + i];
    }
    R[n2] = INT_MAX;
    int i = 0, j = 0;
    for (k = p; k <= r; k++) {
        if (L[i] <= R[j]) {
            A[k] = L[i];
            i += 1;
        } else {
            A[k] = R[j];
            j += 1;
        }
    }
    free(L);
    free(R);
}

测试代码

int N[10] = { 13, 5, 9, 6, 11, 2, 4, 7, 1, 8 };

int main(void)
{
    merge_sort(N, 0, 9);
    for (int i = 0; i < 10; i++) {
        printf("%d ", N[i]);
    }
    return 0;
}

4. 用递归式分析分治算法

4.1 递归式

递归式，顾名思义就是用一个递归的式子描述算法的运行时间。
以前面的分治算法为例：

对于数组长度为 1 的基本情况，我们不做任何操作
对于长度为 2 的递归情况，我们把它分解成两个规模为 $\frac{n}{2}$ 的子问题，再加一步 $Θ (n)$ 的合并操作。
即： $T (n) = {\begin{cases} Θ (1) & n = 1 \\ 2 T (n / 2) + Θ (n) & n > 1 \end{cases}$ 用主定理可方便求得此递归式的结果是 $Θ (n \lg n)$ 。我们将在 4.4 讲述主定理。

4.2 代入法

代入法求解分为两步：

猜测解的形式
用数学归纳法求出解中的常数，并验证解的正确性

示例：对于递归式 $T (n) = 2 T ⌊ \frac{n}{2} ⌋ + n$ :

猜测解的形式： $T (n) = O (n \lg n)$
用数学归纳法证明该式子，即证明对于足够大的常数 $c$ ，有 $T (n) \leq c n \lg n$ ：
1. 假设对 $⌊ \frac{n}{2} ⌋$ 成立：代入，得 $\begin{aligned} T (n) & \leq 2 (c ⌊ \frac{n}{2} ⌋ \lg ⌊ \frac{n}{2} ⌋) + n \\ \leq c n \lg (\frac{n}{2}) + n \\ = c n \lg n - c n \lg 2 + n \\ = c n \lg n - c n + n \\ \leq c n \lg n \end{aligned}$ 对于任何 $c \geq 1$ 成立。得到：若对于 $⌊ n / 2 ⌋$ 成立，则对于 $n$ 成立。
2. 证明对于 $n = 2$ 和 $n = 3$ 成立：当 $n = 2$ 时， $T (2) = 2 T (1) + 2 = 4$ ，此时可以找到一个足够大的 $c$ （比如取 2），使 $T (2) \leq 2 c \lg 2$ 成立。同理可证 $n = 3$ 成立。
3. 由上面两步，因为在正整数 $n$ 只有等于 2 或 3 时， $⌊ \frac{n}{2} ⌋$ 才等于 1，所以我们证明了（为什么？） $T (n) = 2 T ⌊ n / 2 ⌋ + n$ 的上界是 $O (n \lg n)$ 。

有时复杂的递归式可以通过换元法化简。

示例： $T (n) = 2 T (\sqrt{n}) + \lg n$ ：

令 $m = \lg n$ ，则有 $T (2^{m}) = 2 T (2^{m / 2}) + m$ ；
令 $S (m) = T (2^{m})$ ，则有 $S (m) = 2 S (m / 2) + m$ ；
根据上面的示例，可得 $S (m) = O (m \lg m)$ ；
代回原式，得 $T (n) = T (2^{m}) = S (m) = O (m \lg m) = O (\lg n \lg \lg n)$ 。

4.3 递归树

4.4 主方法和主定理

4.4.1 概念

主方法是用主定理来解某种递归式的通用的方法，分为三种情况。
它适合求解以下形式的递归式：

T (n) = a T (\frac{n}{b}) + f (n)

这个递归式描绘了一种算法的运行时间：每个子问题规模相同； $f (n)$ 是分解和合并的运行时间。

4.4.2 主定理

令 $a \geq 1$ 和 $b > 1$ 是常数， $f (n)$ 是一个函数， $T (n)$ 是一个递归式：

T (n) = a T (\frac{n}{b}) + f (n)

其中 $\frac{n}{b}$ 可以看作 $⌊ \frac{n}{b} ⌋$ 或 $⌈ \frac{n}{b} ⌉$ ，不影响渐进性质。

若 $\exists ϵ > 0$ ， $f (n) = O (n^{\log_{b} a - ϵ})$ ，则 $T (n) = Θ (n^{\log_{b} a})$ 。
若 $f (n) = Θ (n^{\log_{b} a})$ ，则 $T (n) = Θ (n^{\log_{b} a} \lg n)$ 。（这一点有个扩展版本：若 $f (n) = Θ (n^{\log_{b} a} \log^{k} n)$ 对某个常数 $k \geq 0$ 成立，则 $T (n) = Θ (n^{\log_{b} a} \log^{k + 1} n)$ 。）
若 $\exists ϵ > 0$ ， $f (n) = Ω (n^{\log_{b} a + ϵ})$ ，且 $\exists c < 1, \exists n_{0} \in N^{*}, \forall n > n_{0}, a f (\frac{n}{b}) < c f (n)$ ，则 $T (n) = Θ (f (n))$

4.4.3 使用主定理

4.4.4 证明主定理

对 b 的幂证明
1. 为什么是 b 的幂？
  如果 n 是 b 的幂，那么在递归的任意一层中， $\frac{n}{b}$ （在结果大于 1 时）都是正整数。
  在第二点中会对 $\frac{n}{b}$ 可能不是正整数的情况进行证明。
2. 引理 1：
  若 $a \geq 1$ ， $b > 1$ ， $f (n)$ 是定义在 b 的幂上的非负函数， $T (n)$ 是定义在 b 的幂上的递归式：
  $T (n) = {\begin{cases} Θ (1) & n = 1 \\ a T (\frac{n}{b}) + f (n) & n = b^{i} \end{cases}$
  其中 i 是正整数。那么：
  $T (n) = Θ (n^{\log_{b} a}) + \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
3. 引理 1 的证明： 设 $n = b^{k}$ 对于某个非负整数 $k$ 成立。这意味着 $k = \log_{b} n$ 。通过迭代展开来求解 $T (n)$ 。
  - 第 0 层 (初始调用): $T (n) = a T (n / b) + f (n)$
  - 第 1 层 (展开 $T (n / b)$ ):
    $T (n) = a [a T (\frac{n}{b^{2}}) + f (\frac{n}{b})] + f (n)$
    $T (n) = a^{2} T (\frac{n}{b^{2}}) + a f (\frac{n}{b}) + f (n)$
  - 第 2 层 (展开 $T (n / b^{2})$ ):
    $T (n) = a^{2} [a T (\frac{n}{b^{3}}) + f (\frac{n}{b^{2}})] + a f (\frac{n}{b}) + f (n)$
    $T (n) = a^{3} T (\frac{n}{b^{3}}) + a^{2} f (\frac{n}{b^{2}}) + a f (\frac{n}{b}) + f (n)$
  观察这个模式，在第 $j$ 次迭代（或者说在递归树的第 $j$ 层，根为第 0 层）之后，我们可以得到：
  $T (n) = a^{j} T (\frac{n}{b^{j}}) + \sum_{i = 0}^{j - 1} a^{i} f (\frac{n}{b^{i}})$
  (注意求和的上限是 $j - 1$ ，因为 $f (n) = a^{0} f (n / b^{0})$ 是第 0 项)
  递归会持续进行，直到子问题的规模达到 1，即当 $\frac{n}{b^{j}} = 1$ 时。
  因为 $n = b^{k}$ ，所以 $\frac{b^{k}}{b^{j}} = 1 ⟹ b^{k - j} = 1 ⟹ k - j = 0 ⟹ j = k$ 。
  所以，递归的深度是 $k = \log_{b} n$ 。
  当 $j = k = \log_{b} n$ 时，我们代入上面的通用公式：
  $T (n) = a^{\log_{b} n} T (\frac{n}{b^{\log_{b} n}}) + \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
  现在我们来处理这两个部分。
4. 第一部分（递归终止项）： $a^{\log_{b} n} T (\frac{n}{b^{\log_{b} n}})$
  我们知道 $b^{\log_{b} n} = n$ (对数的定义)，所以， $\frac{n}{b^{\log_{b} n}} = \frac{n}{n} = 1$ 。
  因此，这一项变为 $a^{\log_{b} n} T (1)$ 。
  根据对数换底公式的一个性质 $x^{\log_{y} z} = z^{\log_{y} x}$ ，我们有 $a^{\log_{b} n} = n^{\log_{b} a}$ 。
  因为 $T (1) = Θ (1)$ (表示 $T (1)$ 是一个常数或者被常数界定)，所以 $a^{\log_{b} n} T (1) = n^{\log_{b} a} \cdot Θ (1) = Θ (n^{\log_{b} a})$ 。
5. 第二部分（各层代价之和）： $\sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
  这部分保持不变，它代表了递归过程中在每一层（除了最底层的基础情况）合并子问题解或分解问题所产生的代价之和。
  将这两部分结合起来，我们就得到了引理的结果：
  $T (n) = Θ (n^{\log_{b} a}) + \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
  至此，引理 1 证明完毕。这个引理是主定理证明的核心步骤：它将递归式 $T (n)$ 分解为了两部分：一部分是所有叶子节点（基础情况）的总代价，另一部分是所有内部节点的总代价（即所有 $f (n / b^{j})$ 项的总和）。主定理的三种情况实际上就是比较这两部分哪一个在渐近意义上占主导地位。
6. 证明主定理的三种情况
  引理 1 告诉我们，对于 $n = b^{k}$ ：
  $T (n) = Θ (n^{\log_{b} a}) + \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
  我们将这个和式记为 $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$ 。
  主定理的三种情况取决于函数 $f (n)$ 相对于 $n^{\log_{b} a}$ 的增长速度，这实质上是在比较 $S (n)$ 与 $Θ (n^{\log_{b} a})$ 的大小。
  - 情况 1: 若 $f (n) = O (n^{\log_{b} a - ε})$ 对某个常数 $ε > 0$ 成立。
    这意味着存在正常数 $c_{1}$ 和 $n_{0}$ ，使得对于所有 $n \geq n_{0}$ 且 $n$ 是 $b$ 的幂， $f (n) \leq c_{1} n^{\log_{b} a - ε}$ 。我们需要估计 $S (n)$ :
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
    代入 $f (n)$ 的上界：
    $S (n) \leq \sum_{j = 0}^{\log_{b} n - 1} a^{j} c_{1} {(\frac{n}{b^{j}})}^{\log_{b} a - ε}$ $S (n) \leq c_{1} n^{\log_{b} a - ε} \sum_{j = 0}^{\log_{b} n - 1} a^{j} {(\frac{1}{b^{j}})}^{\log_{b} a - ε}$ $S (n) \leq c_{1} n^{\log_{b} a - ε} \sum_{j = 0}^{\log_{b} n - 1} a^{j} \frac{1}{(b^{\log_{b} a})^{j} (b^{- ε})^{j}}$
    因为 $b^{\log_{b} a} = a$ ，上式变为：
    $S (n) \leq c_{1} n^{\log_{b} a - ε} \sum_{j = 0}^{\log_{b} n - 1} a^{j} \frac{1}{a^{j} (b^{ε})^{- j}} = c_{1} n^{\log_{b} a - ε} \sum_{j = 0}^{\log_{b} n - 1} (b^{ε})^{j}$
    这是一个等比数列求和，公比 $r = b^{ε}$ 。因为 $b > 1$ 且 $ε > 0$ ，所以 $b^{ε} > 1$ 。
    $\sum_{j = 0}^{\log_{b} n - 1} (b^{ε})^{j} = \frac{(b^{ε})^{\log_{b} n} - 1}{b^{ε} - 1} = \frac{(b^{\log_{b} n})^{ε} - 1}{b^{ε} - 1} = \frac{n^{ε} - 1}{b^{ε} - 1}$
    因此，
    $S (n) \leq c_{1} n^{\log_{b} a - ε} \cdot \frac{n^{ε} - 1}{b^{ε} - 1} = c_{1} \frac{n^{\log_{b} a} - n^{\log_{b} a - ε}}{b^{ε} - 1}$
    因为 $b^{ε} - 1$ 是一个正的常数，且 $n^{\log_{b} a - ε}$ 是低阶项，所以
    $S (n) = O (n^{\log_{b} a})$
    将其代回引理 1 的结果：
    $T (n) = Θ (n^{\log_{b} a}) + O (n^{\log_{b} a})$
    因此， $T (n) = Θ (n^{\log_{b} a})$ 。
    (更严格地说，因为 $f (n)$ 是非负的，所以 $S (n) \geq 0$ 。如果 $f (n) = Ω (1)$ ，那么 $S (n)$ 至少是某个小的正项，但其上界是 $O (n^{\log_{b} a})$ ，所以最终由 $Θ (n^{\log_{b} a})$ 主导。)
  - 情况 2: 若 $f (n) = Θ (n^{\log_{b} a} \log^{k} n)$ 对某个常数 $k \geq 0$ 成立。
    我们先考虑 $k = 0$ 的情况： $f (n) = Θ (n^{\log_{b} a})$ 。
    这意味着存在正常数 $c_{1}, c_{2}$ 和 $n_{0}$ ，使得 $c_{1} n^{\log_{b} a} \leq f (n) \leq c_{2} n^{\log_{b} a}$ 对 $n \geq n_{0}$ 。
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
    代入 $f (n)$ 的 $Θ$ 界：
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} Θ ({(\frac{n}{b^{j}})}^{\log_{b} a})$ $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} Θ (\frac{n^{\log_{b} a}}{(b^{\log_{b} a})^{j}}) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} Θ (\frac{n^{\log_{b} a}}{a^{j}})$ $S (n) = \sum_{j = 0}^{\log_{b} n - 1} Θ (n^{\log_{b} a})$
    这个和式中有 $\log_{b} n$ 项，每一项都是 $Θ (n^{\log_{b} a})$ 。
    因此， $S (n) = Θ (n^{\log_{b} a} \log_{b} n) = Θ (n^{\log_{b} a} \log n)$ 。
    将其代回引理 1 的结果：
    $T (n) = Θ (n^{\log_{b} a}) + Θ (n^{\log_{b} a} \log n)$
    因此， $T (n) = Θ (n^{\log_{b} a} \log n)$ 。
    如果 $k \geq 0$ :
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} Θ ({(\frac{n}{b^{j}})}^{\log_{b} a} \log^{k} (\frac{n}{b^{j}}))$ $S (n) = \sum_{j = 0}^{\log_{b} n - 1} Θ (n^{\log_{b} a} \log^{k} (\frac{n}{b^{j}}))$
    $\log (n / b^{j}) = \log n - j \log b$ 。当 $j$ 接近 $\log_{b} n$ 时，这一项接近 0。当 $j$ 较小时，这一项接近 $\log n$ 。
    下面证明这个和式的结果是 $Θ (n^{\log_{b} a} \log^{k + 1} n)$ ：
    为简化符号，设 $L = \log_{b} n$ 。因为 $n = b^{L}$ ，则 $n / b^{j} = b^{L - j}$ 。
    则 $\log (n / b^{j}) = \log (b^{L - j}) = (L - j) \log b$ 。
    因此，和式中的项可以写为 $Θ (n^{\log_{b} a} ((L - j) \log b)^{k})$ .
    因为 $\log b$ 是一个常数，我们可以将其吸收到 $Θ$ 符号中：
    $S (n) = \sum_{j = 0}^{L - 1} Θ (n^{\log_{b} a} (L - j)^{k})$
    我们可以将 $n^{\log_{b} a}$ 因子提出来：
    $S (n) = Θ (n^{\log_{b} a} \sum_{j = 0}^{L - 1} (L - j)^{k})$
    现在，我们需要计算和式 $H (L) = \sum_{j = 0}^{L - 1} (L - j)^{k}$ ，这是一个关于 $L - j$ 的 $k$ 次幂的和。
    令 $m = L - j$ 。当 $j = 0$ , $m = L$ 。当 $j = L - 1$ , $m = 1$ 。
    所以，和式可以改写为：
    $H (L) = \sum_{m = 1}^{L} m^{k}$
    我们知道：
    $\sum_{m = 1}^{L} m^{k} \approx \int_{1}^{L} x^{k} d x = {[\frac{x^{k + 1}}{k + 1}]}_{1}^{L} = \frac{L^{k + 1}}{k + 1} - \frac{1}{k + 1} = Θ (L^{k + 1})$
    因此， $\sum_{m = 1}^{L} m^{k} = Θ (L^{k + 1})$
    因为 $L = \log_{b} n$ ，所以 $H (L) = Θ ((\log_{b} n)^{k + 1})$ .
    因为 $\log_{b} n = \frac{\log n}{\log b}$ ，所以 $(\log_{b} n)^{k + 1} = Θ ((\log n)^{k + 1})$ 。
    因此，
    $\sum_{j = 0}^{L - 1} (L - j)^{k} = Θ (\log^{k + 1} n)$
    将这个结果代回 $S (n)$ 的表达式：
    $S (n) = Θ (n^{\log_{b} a} \cdot Θ (\log^{k + 1} n)) = Θ (n^{\log_{b} a} \log^{k + 1} n)$
    所以 $T (n) = Θ (n^{\log_{b} a}) + Θ (n^{\log_{b} a} \log^{k + 1} n) = Θ (n^{\log_{b} a} \log^{k + 1} n)$ 。
  - 情况 3: 若 $f (n) = Ω (n^{\log_{b} a + ε})$ 对某个常数 $ε > 0$ 成立，并且若 $a f (n / b) \leq c f (n)$ 对某个常数 $c < 1$ 和所有足够大的 $n$ (正则性条件) 成立。
    正则性条件 $a f (n / b) \leq c f (n)$ 可以被迭代应用：
    $a^{j} f (n / b^{j}) \leq c a^{j - 1} f (n / b^{j - 1}) \leq c^{2} a^{j - 2} f (n / b^{j - 2}) \leq \dots \leq c^{j} f (n)$
    现在看和式 $S (n)$ :
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$
    因为 $f (n)$ 是非负的，我们只关注上界。
    $S (n) = f (n) + a f (n / b) + a^{2} f (n / b^{2}) + \dots + a^{\log_{b} n - 1} f (n / b^{\log_{b} n - 1})$
    我们知道 $a^{j} f (n / b^{j}) \leq c^{j} f (n)$ 。
    所以， $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}})$ .
    我们需要证明这个和式由 $f (n)$ (即 $j = 0$ 的项) 主导。
    $S (n) = a^{0} f (n / b^{0}) + a^{1} f (n / b^{1}) + \dots = f (n) + a f (n / b) + a^{2} f (n / b^{2}) + \dots$
    我们从后往前看。设 $m_{j} = n / b^{j}$ . 则 $a f (m_{j + 1}) \leq c f (m_{j})$ 。
    $S (n) = f (n) + a f (n / b) + \dots$
    因为 $a f (n / b) \leq c f (n)$ ，所以 $a^{2} f (n / b^{2}) = a \cdot (a f ((n / b) / b)) \leq a \cdot c f (n / b) \leq c (a f (n / b)) \leq c \cdot (c f (n)) = c^{2} f (n)$ .
    一般地， $a^{j} f (n / b^{j}) \leq c^{j} f (n)$ 。
    所以
    $S (n) = \sum_{j = 0}^{\log_{b} n - 1} a^{j} f (\frac{n}{b^{j}}) \leq \sum_{j = 0}^{\log_{b} n - 1} c^{j} f (n) = f (n) \sum_{j = 0}^{\log_{b} n - 1} c^{j}$
    因为 $0 \leq c < 1$ ，这是一个收敛的几何级数（即使项数趋于无穷也收敛）。
    $\sum_{j = 0}^{\log_{b} n - 1} c^{j} < \sum_{j = 0}^{\infty} c^{j} = \frac{1}{1 - c} = const$
    因此， $S (n) \leq f (n) \cdot \frac{1}{1 - c} = O (f (n))$ 。
    因为 $f (n)$ 本身就是和式中的第一项（当 $j = 0$ 时， $a^{0} f (n / b^{0}) = f (n)$ ），且所有项非负，所以 $S (n) = Ω (f (n))$ 。
    因此， $S (n) = Θ (f (n))$ 。
    将其代回引理 1 的结果：
    $T (n) = Θ (n^{\log_{b} a}) + Θ (f (n))$
    在情况 3 中，条件 $f (n) = Ω (n^{\log_{b} a + ε})$ 意味着 $f (n)$ 的增长速度快于 $n^{\log_{b} a}$ 。
    因此， $n^{\log_{b} a} = o (f (n))$ 。
    因此， $T (n) = Θ (f (n))$ 。
证毕。
对所有正整数证明：向上取整和向下取整

4.5 Akra-Bazzi 方法

4.5.1 简介

Akra-Bazzi 方法求解以下形式的递归式：

T (n) = {\begin{cases} Θ (1) & 1 \leq n \leq n_{0} \\ \sum_{i = 1}^{k} a_{i} T (b_{i} n) + f (n) & n > n_{0} \end{cases}

其中：

$x \geq 1$ 是一个实数，
$x_{0}$ 是一个常数，使得对于 $1 \leq i \leq k$ ， $x_{0} \geq 1 / b_{i}$ 且 $x_{0} \geq 1 / (1 - b_{i})$ ,
对于 $1 \leq i \leq k$ ， $a_{i} > 0$ 是一个常数，
对于 $1 \leq i \leq k$ ， $b_{i} \in (0, 1)$ 是一个常数，
$k \geq 1$ 是一个常数，且
$g (x)$ 是一个满足下面指定的多项式增长条件的非负函数。

多项式增长条件

定义：如果存在正常数 $c_{1}, c_{2}$ ，使得对于所有 $x > 1$ ，所有 $1 \leq i \leq k$ ，以及所有 $u \in [b_{i} x, x]$ ， $c_{1} g (x) \leq g (u) \leq c_{2} g (x)$ ，则称 $g (x)$ 满足多项式增长条件。

注：如果 $| g^{'} (x) |$ 在 $x$ 中以多项式为上界，则 $g (x)$ 满足多项式增长条件。例如，对于任何常数 $α, β \in R$ ， $g (x) = x^{α} \log^{β} x$ 满足多项式增长条件。

总能找到唯一实数 $p$ ，使得 $\sum_{i = 1}^{k} a_{i} b_{i}^{p} = 1$ 。

递归式的解为：

T (n) = Θ (n^{p} (1 + \int_{1}^{n} \frac{f (u)}{u^{p + 1}} d u))

例子：

若 $T (x) = 2 T (x / 4) + 3 T (x / 6) + Θ (x \log x)$ ，则 $p = 1$ 且 $T (x) = Θ (x \log^{2} x)$ 。
若 $T (x) = 2 T (x / 2) + \frac{3}{2} T (3 x / 4) + Θ (x^{2} / \log x)$ ，则 $p = 2$ 且 $T (x) = Θ (x^{2} / \log \log x)$ 。
若 $T (x) = T (x / 2) + Θ (\log x)$ ，则 $p = 0$ 且 $T (x) = Θ (\log^{2} x)$ 。
若 $T (x) = \frac{1}{2} T (x / 2) + Θ (1 / x)$ ，则 $p = - 1$ 且 $T (x) = Θ ((\log x) / x)$ 。
若 $T (x) = 4 T (x / 2) + Θ (x)$ ，则 $p = 2$ 且 $T (x) = Θ (x^{2})$ 。

4.5.2 使用 Akra-Bazzi 方法

4.5.3 证明 Akra-Bazzi 方法

放一个简单的归纳证明，参考 Tom Leighton 的 Notes on Better Master Theorems for Divide-and-Conquer Recurrences。

T (x) = {\begin{cases} Θ (1) & 若 1 \leq x \leq x_{0} \\ \sum_{i = 1}^{k} a_{i} T (b_{i} x) + g (x) & 若 x > x_{0} \end{cases} (1)

定理 1： 给定一个由方程 (1) 指定形式的递归式，令 $p$ 为满足 $\sum_{i = 1}^{k} a_{i} b_{i}^{p} = 1$ 的唯一实数，则

T (x) = Θ (x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u))

定理 1 的证明利用了以下来自微积分的简单引理。

引理 1： 如果 $g (x)$ 是一个满足多项式增长条件的非负函数，则存在正常数 $c_{3}, c_{4}$ ，使得对于 $1 \leq i \leq k$ 且所有 $x \geq 1$ ，

c_{3} g (x) \leq x^{p} \int_{b_{i} x}^{x} \frac{g (u)}{u^{p + 1}} d u \leq c_{4} g (x)

证明： 从多项式增长条件可得：

x^{p} \int_{b_{i} x}^{x} \frac{g (u)}{u^{p + 1}} d u \leq x^{p} (x - b_{i} x) \frac{c_{2} g (x)}{min {(b_{i} x)^{p + 1}, x^{p + 1}}} = \frac{(1 - b_{i}) c_{2}}{min {1, b_{i}^{p + 1}}} g (x) \leq c_{4} g (x)

其中定义 $c_{4}$ 为满足以下条件的常数：

c_{4} \geq \frac{(1 - b_{i}) c_{2}}{min {1, b_{i}^{p + 1}}}

其中 $1 \leq i \leq k$ 。

类似地，

x^{p} \int_{b_{i} x}^{x} \frac{g (u)}{u^{p + 1}} d u \geq x^{p} (x - b_{i} x) \frac{c_{1} g (x)}{max {(b_{i} x)^{p + 1}, x^{p + 1}}} = \frac{(1 - b_{i}) c_{1}}{max {1, b_{i}^{p + 1}}} g (x) \geq c_{3} g (x)

其中我们定义 $c_{3}$ 为满足以下条件的常数：

c_{3} \geq \frac{(1 - b_{i}) c_{1}}{max {1, b_{i}^{p + 1}}}

其中 $1 \leq i \leq k$ 。

使用归纳法来证明定理 1：将 $x$ 的定义域划分为区间 $I_{0} = [1, x_{0}]$ 和 $I_{j} = (x_{0} + j - 1, x_{0} + j]$ （对于 $j \geq 1$ ）。

根据 $x_{0}$ 的定义，我们知道如果 $x \in I_{j}$ 对于某个 $j \geq 1$ ，则对于 $1 \leq i \leq k$ ， $b_{i} x \in I_{j^{'}}$ 对于某个 $j^{'} < j$ 。这是因为 $b_{i} x > b_{i} (x_{0} + j - 1) \geq b_{i} x_{0} \geq 1$ ，并且因为 $b_{i} x \leq b_{i} (x_{0} + j) \leq x_{0} + j - (1 - b_{i}) x_{0} \leq x_{0} + j - 1$ 。因此，我们知道在 $[1, x_{0}]$ 之后的任何区间中 $T$ 的值仅取决于 $T$ 在先前区间中的值。

定理 1 的证明： 首先证明存在一个正常数 $c_{5}$ ，使得对于所有 $x > x_{0}$ ，

T (x) \geq c_{5} x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u)

对包含 $x$ 的区间 $I_{j}$ 进行归纳。当 $j = 0$ 时，基本情况成立，因为当 $x \in [1, x_{0}]$ 时， $T (x) = Θ (1)$ （前提是我们选择足够小的 $c_{5}$ ）。

归纳步骤的论证如下：

\begin{aligned} T (x) & = \sum_{i = 1}^{k} a_{i} T (b_{i} x) + g (x) \\ \geq \sum_{i = 1}^{k} a_{i} c_{5} (b_{i} x)^{p} (1 + \int_{1}^{b_{i} x} \frac{g (u)}{u^{p + 1}} d u) + g (x) (根据归纳假设) \\ = c_{5} x^{p} \sum_{i = 1}^{k} a_{i} b_{i}^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \int_{b_{i} x}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) \\ \geq c_{5} x^{p} ((1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) \sum_{i = 1}^{k} a_{i} b_{i}^{p} - \sum_{i = 1}^{k} a_{i} b_{i}^{p} \int_{b_{i} x}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) \\ \geq c_{5} x^{p} ((1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) - \frac{c_{4}}{x^{p}} g (x)) + g (x) (根据引理 1 及 \sum a_{i} b_{i}^{p} = 1) \\ = c_{5} x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) - c_{5} c_{4} g (x) \\ \geq c_{5} x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) \end{aligned}

前提是 $c_{5} \leq 1 / c_{4}$ 。

还需证明上界，即存在一个正常数 $c_{6}$ 使得对于所有 $x > x_{0}$ ，

T (x) \leq c_{6} x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u)

上界与下界的证明几乎完全相同，不再完整复述。我们只需要确保 $c_{6}$ 选择得足够大，以便满足基本情况，并且 $c_{6} \geq 1 / c_{3}$ 。因此，我们可以得出结论：

T (x) = Θ (x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u))

注：如果 $g (x)$ 的增长速度快于 $x$ 的任何多项式，则 $T (x) = Θ (g (x))$ 。因此，如果 $g (x)$ 不满足多项式增长条件，则定理 1 不一定成立。

变种：

虽然上面分析的递归式类别相当广泛，但在实践中出现的递归式通常与方程 (1) 中指定的类别略有不同。例如，在算法设计中，以下形式的递归式很常见：

T (x) \leq \sum_{i = 1}^{k} a_{i} T (⌊ b_{i} x ⌋) + g (x)

一般来说，在递归式中包含取整函数（floor 和 ceiling）并不会显著改变解的性质，但证明这一事实的过程往往相当繁琐且具有特殊性。接下来，我们将会描述一类通用的变种（包括取整函数），并表明该类中的变种不影响递归式的解（除了常数项）。特别地，定理 1 的解对于以下形式的所有递归式都成立：

T (x) = {\begin{cases} Θ (1) & 若 1 \leq x \leq x_{0} \\ \sum_{i = 1}^{k} a_{i} T (b_{i} x + h_{i} (x)) + g (x) & 若 x > x_{0} \end{cases} (2)

其中

$x, x_{0}, a_{i}, b_{i}, k,$ 和 $g (x)$ 都满足上面指定的条件，
存在某个常数 $ϵ > 0$ ，使得当 $x \geq x_{0}$ 时，对于 $1 \leq i \leq k$ ， $| h_{i} (x) | \leq x / (\log^{1 + ϵ} x)$ ,
存在正常数 $c_{1}$ 和 $c_{2}$ ，使得对于所有 $x \geq 1$ ，所有 $1 \leq i \leq k$ ，以及所有 $u \in [b_{i} x + h_{i} (x), x]$ ， $c_{1} g (x) \leq g (u) \leq c_{2} g (x)$ , 且
$x_{0}$ 为足够大的常数，使得对于任何 $i \leq k$ 和任何 $x \geq x_{0}$ ， (a) ${(1 - \frac{1}{b_{i} \log^{1 + ϵ} x})}^{p} (1 + \frac{1}{\log^{ϵ / 2} (b_{i} x + x / \log^{1 + ϵ} x)}) \geq 1 + \frac{1}{\log^{ϵ / 2} x}$ (b) ${(1 + \frac{1}{b_{i} \log^{1 + ϵ} x})}^{p} (1 - \frac{1}{\log^{ϵ / 2} (b_{i} x + x / \log^{1 + ϵ} x)}) \leq 1 - \frac{1}{\log^{ϵ / 2} x}$ (c) $\frac{1}{2} (1 + \frac{1}{\log^{ϵ / 2} x}) \leq 1$ (d) $2 (1 - \frac{1}{\log^{ϵ / 2} x}) \geq 1$ .

可以使用标准的泰勒级数展开和渐近分析来证明存在这样一个常数 $x_{0}$ 。

例如，可以选择 $h_{i} (x)$ 使得 $h_{i} (x) = ⌈ b_{i} x ⌉ - b_{i} x$ ，从而将定理 1 扩展到处理向上取整函数。在这种情况下， $| h_{i} (x) | < 1$ 。也可以使用大得多的函数。例如，对于 $x > 1$ ，可以设置 $h_{i} (x) = - \sqrt{x}$ 或 $h_{i} (x) = x / (\log^{2} x)$ 。

为了分析更一般的递归式，需要下面这个和引理 1 相似的引理。

引理 2： 存在正常数 $c_{3}, c_{4}$ ，使得对于 $1 \leq i \leq k$ 且所有 $x \geq 1$ ，

c_{3} g (x) \leq x^{p} \int_{b_{i} x + h_{i} (x)}^{x} \frac{g (u)}{u^{p + 1}} d u \leq c_{4} g (x)

引理 2 的证明与引理 1 的证明相同，只是使用上面第 3 节的约束 3 来代替第 2 节的多项式增长条件。

定理 2： 给定一个方程 (2) 中指定的形式的递归式，令 $p$ 为满足 $\sum_{i = 1}^{k} a_{i} b_{i}^{p} = 1$ 的唯一实数。则

T (x) = Θ (x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u))

证明： 证明与定理 1 的证明非常相似，主要区别在于使用了一个稍微更强的归纳假设。特别地，首先证明存在一个正常数 $c_{5}$ ，使得对于所有 $x > x_{0}$ ，

T (x) \geq c_{5} x^{p} (1 + \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u)

通过对包含 $x$ 的区间 $I_{j}$ 进行归纳。当 $j = 0$ 时，基本情况由 $T (x) = Θ (1)$ 当 $x \in [1, x_{0}]$ 时成立（前提是我们选择足够小的 $c_{5}$ ）。

归纳步骤的论证如下：

\begin{aligned} T (x) & = \sum_{i = 1}^{k} a_{i} T (b_{i} x + h_{i} (x)) + g (x) \\ \geq \sum_{i = 1}^{k} a_{i} c_{5} (b_{i} x + h_{i} (x))^{p} (1 + \frac{1}{\log^{ϵ / 2} (b_{i} x + h_{i} (x))}) (1 + \int_{1}^{b_{i} x + h_{i} (x)} \frac{g (u)}{u^{p + 1}} d u) + g (x) (根据归纳假设) \\ \geq \sum_{i = 1}^{k} a_{i} b_{i}^{p} c_{5} x^{p} {(1 - \frac{1}{b_{i} \log^{1 + ϵ} x})}^{p} (1 + \frac{1}{\log^{ϵ / 2} (b_{i} x + x / \log^{1 + ϵ} x)}) \times (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \int_{b_{i} x + h_{i} (x)}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) (根据 h_{i} (x) 的界限) \\ \geq \sum_{i = 1}^{k} a_{i} b_{i}^{p} c_{5} x^{p} (1 + \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \frac{c_{4}}{x^{p}} g (x)) + g (x) (根据 x_{0} 上的约束 4(a) 和引理 2) \\ = c_{5} x^{p} (1 + \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \frac{c_{4}}{x^{p}} g (x)) \sum_{i = 1}^{k} a_{i} b_{i}^{p} + g (x) (因为 \sum a_{i} b_{i}^{p} = 1) \\ = c_{5} x^{p} (1 + \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) - c_{5} c_{4} (1 + \frac{1}{\log^{ϵ / 2} x}) g (x) \\ \geq c_{5} x^{p} (1 + \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) \end{aligned}

前提是 $c_{5} \leq 1 / (2 c_{4})$ （根据 $x_{0}$ 上的约束 4(c)）。

上界的证明非常相似。在这种情况下，我们通过归纳证明存在一个正常数 $c_{6}$ ，使得对于所有 $x > x_{0}$ ，

T (x) \leq c_{6} x^{p} (1 - \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u)

基本情况如前所述。归纳步骤的论证如下：

\begin{aligned} T (x) & = \sum_{i = 1}^{k} a_{i} T (b_{i} x + h_{i} (x)) + g (x) \\ \leq \sum_{i = 1}^{k} a_{i} c_{6} (b_{i} x + h_{i} (x))^{p} (1 - \frac{1}{\log^{ϵ / 2} (b_{i} x + h_{i} (x))}) (1 + \int_{1}^{b_{i} x + h_{i} (x)} \frac{g (u)}{u^{p + 1}} d u) + g (x) (根据归纳假设) \\ \leq \sum_{i = 1}^{k} a_{i} b_{i}^{p} c_{6} x^{p} {(1 + \frac{1}{b_{i} \log^{1 + ϵ} x})}^{p} (1 - \frac{1}{\log^{ϵ / 2} (b_{i} x + x / \log^{1 + ϵ} x)}) \times (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \int_{b_{i} x + h_{i} (x)}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) (根据 h_{i} (x) 的界限) \\ \leq \sum_{i = 1}^{k} a_{i} b_{i}^{p} c_{6} x^{p} (1 - \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \frac{c_{3}}{x^{p}} g (x)) + g (x) (根据 x_{0} 上的约束 4(b) 和引理 2) \\ = c_{6} x^{p} (1 - \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u - \frac{c_{3}}{x^{p}} g (x)) \sum_{i = 1}^{k} a_{i} b_{i}^{p} + g (x) (因为 \sum a_{i} b_{i}^{p} = 1) \\ = c_{6} x^{p} (1 - \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) + g (x) - c_{3} c_{6} (1 - \frac{1}{\log^{ϵ / 2} x}) g (x) \\ \leq c_{6} x^{p} (1 - \frac{1}{\log^{ϵ / 2} x}) (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u) \end{aligned}

前提是 $c_{6} \geq 2 / c_{3}$ （根据 $x_{0}$ 上的约束 4(d)）。

因此，我们可以得出结论：

T (x) = Θ (x^{p} (1 + \int_{1}^{x} \frac{g (u)}{u^{p + 1}} d u))

备注： 值得注意的是，对 $| h_{i} (x) |$ 大小的 $x / \log^{1 + ϵ} x$ 限制几乎是紧的，因为以下递归式的解

T (x) = {\begin{cases} Θ (1) & 若 1 \leq x \leq x_{0} \\ 2 T (x / 2 + x / \log x) & 若 x > x_{0} \end{cases}

是 $T (x) = x \log^{Θ (1)} x$ ，这与没有 $x / \log x$ 项的递归式的解 $Θ (x)$ 不同。

5. 常见的分治算法

5.0 归并排序

上面介绍过，不再赘述。

5.1 Karatsuba 大数乘法

Karatsuba 算法是一种用于快速计算两个大整数乘积的算法。它比传统的小学乘法算法（按位相乘再相加）具有更好的渐近时间复杂度。

5.1.1 传统大数乘法算法

假设我们要计算两个 $n$ 位大整数 $X$ 和 $Y$ 的乘积。为了方便分析，我们设 $n$ 是 2 的幂：

我们可以将每个数分成两半，每半大约有 $n / 2$ 位：

X = A \cdot B^{m} + C

Y = D \cdot B^{m} + E

其中 $B$ 是基数（例如 $B = 10$ 对于十进制数，或 $B = 2$ 对于二进制数内部表示）， $m \approx n / 2$ 。 $A, C, D, E$ 是大约 $n / 2$ 位的整数。

那么， $X \cdot Y = (A \cdot B^{m} + C) (D \cdot B^{m} + E) = A D \cdot B^{2 m} + (A E + C D) \cdot B^{m} + C E$ 。

这个过程需要计算 4 个 $n / 2$ 位整数的乘积（ $A D, A E, C D, C E$ ），以及若干次加法和移位（乘以 $B^{m}$ 或 $B^{2 m}$ 相当于移位）。

加法和移位操作的时间复杂度是 $O (n)$ 。

因此，递归式为：

T (n) = 4 T (n / 2) + O (n)

根据主定理，其中 $a = 4, b = 2, f (n) = O (n)$ ， $\log_{b} a = \log_{2} 4 = 2$ 。

由于 $f (n) = O (n) = O (n^{2 - ε})$ 其中 $ε = 1 > 0$ ，属于主定理情况 $1$ ，所以 $T (n) = Θ (n^{2})$ 。

这就是传统算法的时间复杂度。

5.1.2 Karatsuba 算法的描述

Karatsuba 算法的核心思想是通过巧妙的代数变换，将 4 次 $n / 2$ 位乘法减少到 3 次，代价是增加一些加减法。

与上面类似，我们将 $X$ 和 $Y$ 分解：

X = A \cdot B^{m} + C

Y = D \cdot B^{m} + E

我们需要计算 $A D$ , $C E$ , 和 $A E + C D$ 。

Karatsuba 观察到 $(A + C) (D + E) = A D + A E + C D + C E$ ，所以，关键的中间项 $A E + C D$ 可以表示为：

A E + C D = (A + C) (D + E) - A D - C E

这样，我们只需要计算三次 $n / 2$ 位（或略大于 $n / 2$ 位，因为 $A + C$ 可能比 $A$ 或 $C$ 多一位）的乘法：

$P_{1} = A D$
$P_{2} = C E$
$P_{3} = (A + C) (D + E)$

然后，最终结果是： $X \cdot Y = P_{1} \cdot B^{2 m} + (P_{3} - P_{1} - P_{2}) \cdot B^{m} + P_{2}$

算法步骤：

分解： 将 $n$ 位数 $X, Y$ 分解为 $A, C, D, E$ ，每个约 $n / 2$ 位。 $X = A \cdot B^{n / 2} + C$ $Y = D \cdot B^{n / 2} + E$ （这里假设 $n$ 是偶数，如果不是，可以补零或者取 $m = ⌊ n / 2 ⌋$ ）
计算和： 计算 $S_{A} = A + C$ 和 $S_{D} = D + E$ 。这些是 $O (n)$ 的加法。
递归计算乘积：
- $P_{1} = Karatsuba (A, D)$
- $P_{2} = Karatsuba (C, E)$
- $P_{3} = Karatsuba (S_{A}, S_{D})$
组合结果：
- 计算 $K = P_{3} - P_{1} - P_{2}$ （两次 $O (n)$ 的减法）
- $X \cdot Y = P_{1} \cdot B^{n} + K \cdot B^{n / 2} + P_{2}$ （两次移位和两次 $O (n)$ 的加法）

5.1.3 Karatsuba 算法的时间复杂度

得到递归式： 算法进行了 3 次 $n / 2$ 位整数的乘法，以及常数次的 $O (n)$ 的加法、减法和移位操作。
$T (n) = {\begin{cases} Θ (1) & if n = 1 (或小于某个阈值) \\ 3 T (n / 2) + Θ (n) & if n > 1 \end{cases}$
使用主定理：（其中 $a = 3, b = 2$ ）
$f (n) = Θ (n)$ ， $\log_{b} a = \log_{2} 3 \approx 1.585$ 。
比较 $f (n)$ 与 $n^{\log_{b} a} = n^{\log_{2} 3}$ ：
$f (n) = Θ (n) = O (n^{\log_{2} 3 - ε})$ ，其中 $ε = \log_{2} 3 - 1 \approx 0.585 > 0$ 。
这符合主定理的情况 1，因此， $T (n) = Θ (n^{\log_{b} a}) = Θ (n^{\log_{2} 3})$ 。

由于 $\log_{2} 3 \approx 1.585 < 2$ ，Karatsuba 算法的 $Θ (n^{\log_{2} 3})$ 优于传统算法的 $Θ (n^{2})$ 。

5.2 Strassen 矩阵乘法

为了方便起见，我们只考虑方阵，且矩阵边长为 2 的幂。

5.2.1 矩阵乘法的定义

给定两个矩阵 $A$ 和 $B$ ，其中 $A = (a_{i k})$ 是 $m \times n$ 的矩阵， $B = (b_{k j})$ 是 $n \times p$ 的矩阵，那么它们的积 $C = A B$ 是 $m \times p$ 的矩阵 $C = (c_{i j})$ 。其中，对于 $i = 1, 2, . . ., m$ ，对于 $j = 1, 2, . . ., p$ ，有

c_{i j} = \sum_{k = 1}^{n} a_{i k} b_{k j}

5.2.2 普通的矩阵乘法算法及时间复杂度

对于两个 $n \times n$ 的方阵 $A$ 和 $B$ ，其乘积 $C = A B$ 也是一个 $n \times n$ 的方阵。根据定义，计算 $C$ 中的每一个元素 $c_{i j}$ 需要 $n$ 次乘法和 $n - 1$ 次加法：

c_{i j} = a_{i 1} b_{1 j} + a_{i 2} b_{2 j} + \dots + a_{i n} b_{n j}

由于矩阵 $C$ 有 $n^{2}$ 个元素，所以总共需要的乘法次数是 $n^{2} \cdot n = n^{3}$ ，总共需要的加法次数是 $n^{2} \cdot (n - 1) = n^{3} - n^{2}$ 。

因此，普通矩阵乘法算法的时间复杂度是 $Θ (n^{3})$ 。

如果进行普通的分治算法：

如果将 $n \times n$ 矩阵 $A, B, C$ 均分解为 4 个 $\frac{n}{2} \times \frac{n}{2}$ 的子矩阵：

A = (\begin{matrix} A * 11 & A * 12 \\ A * 21 & A * 22 \end{matrix}), B = (\begin{matrix} B * 11 & B * 12 \\ B * 21 & B * 22 \end{matrix}), C = (\begin{matrix} C * 11 & C * 12 \\ C * 21 & C * 22 \end{matrix})

则

$C_{11} = A_{11} B_{11} + A_{12} B_{21}$
$C_{12} = A_{11} B_{12} + A_{12} B_{22}$
$C_{21} = A_{21} B_{11} + A_{22} B_{21}$
$C_{22} = A_{21} B_{12} + A_{22} B_{22}$

这需要 8 次 $\frac{n}{2} \times \frac{n}{2}$ 规模的矩阵乘法和 4 次 $\frac{n}{2} \times \frac{n}{2}$ 规模的矩阵加法。矩阵加法的时间复杂度是 $Θ ((n / 2)^{2}) = Θ (n^{2})$ ，递归式为 $T (n) = 8 T (n / 2) + Θ (n^{2})$ 。

根据主定理， $a = 8, b = 2, f (n) = Θ (n^{2})$ 。

$\log_{b} a = \log_{2} 8 = 3$ 。

$f (n) = Θ (n^{2}) = O (n^{3 - ε})$ 其中 $ε = 1 > 0$ 。属于主定理情况 1。

所以， $T (n) = Θ (n^{3})$ ，和普通矩阵乘法算法时间复杂度一致。

5.2.3 Strassen 矩阵乘法算法的描述

核心：让递归树的分支减少一个：递归进行 7 次而不是 8 次 $\frac{n}{2} \times \frac{n}{2}$ 矩阵乘法。
步骤：
1. 把每个输入矩阵分解为 4 个 $\frac{n}{2} \times \frac{n}{2}$ 的子矩阵： $A_{11}, A_{12}, A_{21}, A_{22}, B_{11}, B_{12}, B_{21}, B_{22}$ ；
2. 创建 10 个 $\frac{n}{2} \times \frac{n}{2}$ 的矩阵 $S_{i}$ ，其中 $i = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10$ ，每个矩阵保存步骤 1 中创建的矩阵的和或差。
3. 通过步骤 1 和 2 创建的 18 个矩阵，计算出 7 个 $\frac{n}{2} \times \frac{n}{2}$ 矩阵的乘积 $P_{i}$ ，其中 $i = 1, 2, 3, 4, 5, 6, 7$ ；
4. 将 $P_{1}, P_{2}, P_{3}, P_{4}, P_{5}, P_{6}, P_{7}$ 中的不同组合相加或相减，得到结果矩阵的四个部分 $C_{11}, C_{12}, C_{21}, C_{22}$ 。
5. 将上述四个矩阵拼接成一个 $n \times n$ 的矩阵 $C$ 。
详细过程：
1. 步骤 2： $S_{1} = B_{12} - B_{22}$
  $S_{2} = A_{11} + A_{12}$
  $S_{3} = A_{21} + A_{22}$
  $S_{4} = B_{21} - B_{11}$
  $S_{5} = A_{11} + A_{22}$
  $S_{6} = B_{11} + B_{22}$
  $S_{7} = A_{12} - A_{22}$
  $S_{8} = B_{21} + B_{22}$
  $S_{9} = A_{11} - A_{21}$
  $S_{10} = B_{11} + B_{12}$
2. 步骤 3： $P_{1} = A_{11} \cdot S_{1}$
  $P_{2} = S_{2} \cdot B_{22}$
  $P_{3} = S_{3} \cdot B_{11}$
  $P_{4} = A_{22} \cdot S_{4}$
  $P_{5} = S_{5} \cdot S_{6}$
  $P_{6} = S_{7} \cdot S_{8}$
  $P_{7} = S_{9} \cdot S_{10}$
3. 步骤 4： $C_{11} = P_{5} + P_{4} - P_{2} + P_{6}$
  $C_{12} = P_{1} + P_{2}$
  $C_{21} = P_{3} + P_{4}$
  $C_{22} = P_{1} + P_{5} - P_{3} - P_{7}$
可以看到，我们用了 7 次 $\frac{n}{2} \times \frac{n}{2}$ 的矩阵乘法和 18 次 $\frac{n}{2} \times \frac{n}{2}$ 的矩阵加法，完成了 $n \times n$ 的矩阵乘法！😃（~~将一次乘法优化成 18 次加法 😦~~）

5.2.4 Strassen 矩阵乘法算法的时间复杂度

得到递归式：
1. 步骤 1. 花费 $Θ (1)$ 时间，步骤 2. 4. 均花费 $Θ (n^{2})$ 时间，步骤 3. 进行 7 次 $\frac{n}{2} \times \frac{n}{2}$ 的矩阵乘法，得到如下递归式： $T (n) = {\begin{cases} Θ (1) & n = 1 \\ 7 T (n / 2) + Θ (n^{2}) & n > 1 \end{cases}$
使用主定理（其中 $a = 7$ ， $b = 2$ ）
$\log_{b} a = \log_{2} 7 \approx 2.807$ 。
比较 $f (n)$ 与 $n^{\log_{b} a} = n^{\log_{2} 7}$ ： $f (n) = Θ (n^{2})$ 。
因为 $\log_{2} 7 > 2$ ，所以存在 $ε = \log_{2} 7 - 2 > 0$ ，使得 $f (n) = Θ (n^{2}) = O (n^{\log_{2} 7 - ε})$ ，这符合主定理的情况 1。
因此， $T (n) = Θ (n^{\log_{2} 7})$ 。
因为 $\log_{2} 7 \approx 2.807 < 3$ ，所以 Strassen 算法的 $Θ (n^{\log_{2} 7})$ 优于普通矩阵乘法的 $Θ (n^{3})$ 。

5.3 快速数论变换 (Fast Number Theoretic Transformation, NTT)

快速数论变换 (NTT) 是一种在特定有限域（通常是整数模素数 $p$ 的环 $Z_{p}$ ）中进行的离散傅里叶变换 (DFT)。它与快速傅里叶变换 (FFT) 具有非常相似的算法结构，但所有运算都在模 $p$ 意义下进行，从而避免了 FFT 中的浮点数精度问题，并能得到精确的整数结果。NTT 主要用于高效地计算两个大整数（或系数为整数的两个多项式）的卷积。

5.3.1 背景：多项式乘法与卷积

两个多项式 $A (x) = \sum_{i = 0}^{m - 1} a_{i} x^{i}$ 和 $B (x) = \sum_{i = 0}^{k - 1} b_{i} x^{i}$ 的乘积 $C (x) = A (x) B (x) = \sum_{j = 0}^{m + k - 2} c_{j} x^{j}$ 的系数 $c_{j}$ 可以表示为卷积形式：

c_{j} = \sum_{i = 0}^{j} a_{i} b_{j - i}

(其中，如果 $i \geq m$ ，则 $a_{i} = 0$ ；如果 $j - i \geq k$ ，则 $b_{j - i} = 0$ )。

直接计算卷积需要 $O (m k)$ 次运算。如果 $m \approx k \approx N$ , 则复杂度为 $O (N^{2})$ 。利用 DFT (或 NTT)，我们可以将多项式乘法的复杂度降低到 $O (N \log N)$ 。

其原理是：

点值表示： 将多项式 $A (x)$ 和 $B (x)$ 分别在 $N$ 个选定的点上求值，得到它们点值表示 $(x_{s}, A (x_{s}))$ 和 $(x_{s}, B (x_{s}))$ 。 $N$ 必须大于等于 $m + k - 1$ (结果多项式的次数加 1)。
点值乘法： 对于每个点 $x_{s}$ ，计算 $C (x_{s}) = A (x_{s}) \cdot B (x_{s})$ 。这需要 $O (N)$ 次乘法。
插值： 从 $C (x)$ 的 $N$ 个点值表示 $(x_{s}, C (x_{s}))$ 中恢复出系数表示 $C (x) = \sum c_{j} x^{j}$ 。

DFT (以及 FFT 作为其快速算法) 使用复数域中的 $N$ 次单位根作为求值点。NTT 则使用有限域中的 $N$ 次“原根” (primitive $N$ -th root of unity)。

5.3.2 NTT 的数学基础

有限域/环： NTT 在整数模素数 $p$ 的环 $Z_{p} = {0, 1, \dots, p - 1}$ 中进行运算。
原根 (Primitive Root of Unity)： 为了使 NTT 能够顺利进行，我们需要一个元素 $ω \in Z_{p}$ 满足：
- $ω^{N} \equiv 1 (\mod p)$
- $ω^{k} ≢ 1 (\mod p)$ for $1 \leq k < N$
- $N$ 是变换的长度，通常取为大于等于结果多项式次数的最小的 2 的幂。这样的 $ω$ 称为 $Z_{p}$ 中的 $N$ 次原根。为了存在 $N$ 次原根，素数 $p$ 必须满足 $p - 1$ 是 $N$ 的倍数 (即 $N | (p - 1)$ )。这样的素数称为 NTT-friendly prime。例如，对于 $N = 2^{20}$ ， $p = 998244353 = 119 \cdot 2^{23} + 1$ 是一个常用的 NTT 素数，其一个 $N$ 次原根 (对于合适的 $N$ ) 可以是 $g^{(p - 1) / N} (\mod p)$ ，其中 $g$ 是 $p$ 的一个原根 (primitive root modulo $p$ )，例如 $g = 3$ 对于 $p = 998244353$ 。
逆元： 在进行逆变换 (INTT) 时，需要计算 $N^{- 1} (\mod p)$ 。这要求 $N$ 与 $p$ 互素，由于 $p$ 是素数且通常 $N < p$ ，这个条件一般都满足。

5.3.3 NTT 和逆 NTT (INTT) 的定义

给定一个序列 (多项式系数) $A = (a_{0}, a_{1}, \dots, a_{N - 1})$ ，其 NTT 结果为序列 $\hat{A} = ({\hat{a}}_{0}, {\hat{a}}_{1}, \dots, {\hat{a}}_{N - 1})$ ，定义为：

{\hat{a}}_{k} = NTT (A)_{k} = \sum_{j = 0}^{N - 1} a_{j} ω^{j k} (\mod p) for k = 0, 1, \dots, N - 1

逆 NTT (INTT) 定义为：

a_{j} = INTT (\hat{A})_{j} = N^{- 1} \sum_{k = 0}^{N - 1} {\hat{a}}_{k} ω^{- j k} (\mod p) for j = 0, 1, \dots, N - 1

其中 $ω^{- 1}$ 是 $ω$ 在模 $p$ 意义下的逆元。

5.3.4 使用 NTT 计算多项式乘法（卷积）的步骤

设要计算 $A (x) \cdot B (x) = C (x)$ 。

选择参数：
- 确定结果多项式 $C (x)$ 的最大可能次数 $d_{C} = \deg (A) + \deg (B)$ 。
- 选择变换长度 $N$ ，为大于 $d_{C}$ 的最小的 2 的幂。
- 选择一个素数 $p$ 使得 $N | (p - 1)$ ，且 $p$ 足够大以容纳 $C (x)$ 的系数（即 $C (x)$ 的任何系数 $c_{j}$ 的绝对值都小于 $p / 2$ ，如果系数可能为负；或者 $c_{j} < p$ 如果系数非负）。
- 找到 $Z_{p}$ 中的一个 $N$ 次原根 $ω$ 。
填充： 将多项式 $A (x)$ 和 $B (x)$ 的系数序列用 0 填充到长度 $N$ 。
正变换： 计算 $\hat{A} = NTT (A)$ 和 $\hat{B} = NTT (B)$ 。这使用类似 Cooley-Tukey FFT 的分治算法，时间复杂度为 $O (N \log N)$ 次模 $p$ 运算。
点值乘法： 计算点值乘积序列 $\hat{C}$ ，其中 ${\hat{c}}_{k} = {\hat{a}}_{k} \cdot {\hat{b}}_{k} (\mod p)$ for $k = 0, \dots, N - 1$ 。这需要 $O (N)$ 次模 $p$ 乘法。
逆变换： 计算 $C = INTT (\hat{C})$ 。这也是 $O (N \log N)$ 次模 $p$ 运算。序列 $C = (c_{0}, c_{1}, \dots, c_{N - 1})$ 的前 $d_{C} + 1$ 个元素就是乘积多项式 $C (x)$ 的系数。

5.3.5 NTT 的时间复杂度

NTT 和 INTT 的分治实现（如 Cooley-Tukey 算法）都具有 $O (N \log N)$ 的时间复杂度，其中 $N$ 是变换长度。每次运算都是模 $p$ 的加法、减法或乘法。步骤如下：

参数选择和填充： $O (N)$ 。
两次 NTT： $2 \cdot O (N \log N) = O (N \log N)$ 。
点值乘法： $O (N)$ 。
一次 INTT： $O (N \log N)$ 。因此，使用 NTT 计算两个次数近似为 $N / 2$ 的多项式乘法的总时间复杂度是 $Θ (N \log N)$ 。

这比 Karatsuba 算法的 $Θ (N^{\log_{2} 3})$ 对于足够大的 $N$ 更优，并且由于是精确整数运算，在某些领域比 FFT 更受欢迎。

6. 常见的用分治法解决的问题

6.1 最近点对问题

在一个平面上的 $n$ 个点中，找到欧氏距离最小的两个点。

6.2 最大子数组和问题

给定一个整数数组（可正可负），找到一个具有最大和的连续子数组。

此问题有更优解法

对于这个问题来说，分治算法的时间复杂度为 $O (n \log n)$ 。

然而，存在更优的解法（动态规划或贪心），时间复杂度为 $O (n)$ 。

6.3 凸包问题

给定平面上 $n$ 个点，找到一个最小的凸多边形，使其包含所有这些点。

此问题有更优解法

对于这个问题来说，分治算法的时间复杂度为 $O (n \log n)$ 。

然而，存在更优的解法：Jarvis 算法的时间复杂度为 $O (n H)$ ，当 $H << n$ 的时候更优；Melkman 算法的时间复杂度为 $O (n)$ 。

习题

20401 [2.2] 使用主定理，求解以下递归式，并指出运用了主定理的哪种情况。
- (a) $T (n) = 9 T (n / 3) + n^{2}$
- (b) $T (n) = T (2 n / 3) + Θ (1)$
- (c) $T (n) = 3 T (n / 4) + n \lg n$
- (d) $T (n) = 7 T (n / 2) + Θ (n^{2})$
- (e) $T (n) = 2 T (n / 2) + n^{3}$
- (f) $T (n) = 4 T (n / 2) + Θ (n^{2})$
- (g) [4.3M] $T (n) = 2 T (n / 2) + n / \lg n$ (思考：这个递归式能直接用主定理的三种基本情况求解吗？为什么？)
对于递归式 $T (n) = T (n - 1) + n$ ，使用代入法证明其解为 $T (n) = O (n^{2})$ 。
对于归并排序的递归式 $T (n) = 2 T (n / 2) + Θ (n)$ ，请：
- (a) 画出其递归树。
- (b) 计算出树的每一层的代价总和。
- (c) 计算树的高度，并求出所有层代价的总和，从而得出 $T (n)$ 的渐近界。
使用换元法，求解递归式 $T (n) = T (\sqrt{n}) + Θ (\lg \lg n)$ 的时间复杂度。
本教程 6.2 节提到了最大子数组和问题。请设计一个分治算法来解决它。

(a) 分解：如何将数组分成子问题？
(b) 解决：子问题的解是什么？
(c) 合并：这是最关键的一步。一个最大和的子数组可能存在于三个地方：① 完全在左半部分；② 完全在右半部分；③ 跨越了中点。请详细描述如何在线性时间 $Θ (n)$ 内找到跨越中点的最大子数组，并结合左右子问题的解，得到原问题的解。
(d) 写出该分治算法的递归式并求解其时间复杂度。

在一个数组 $A [1 \dots n]$ 中，如果存在 $i < j$ 且 $A [i] > A [j]$ ，则称 $(i, j)$ 是一个逆序对。请设计一个分治算法来计算一个数组中逆序对的总数。
- 提示：尝试修改归并排序算法。在 merge() 过程中，当右边子数组的元素 R[j] 被复制回原数组时，左边子数组 L 中还剩下多少个元素？这与逆序对有什么关系？
- 分析你的算法的时间复杂度。
本教程 5.1 节描述的 Karatsuba 算法中，我们把一个大数乘法分解成 3 个规模为 $n / 2$ 的乘法。那我们是否可以继续优化，比如把问题分解成 5 个规模为 $n / 3$ 的子问题？如果可以，那么时间复杂度会是多少？它会比 Karatsuba 算法更好吗？
在本教程的 merge() 函数实现中，使用了宏 INT_MAX。如果不允许使用这个值，你将如何修改 merge() 函数中的主循环来完成合并操作？

3. 基本概念

3.2 对象

3.6 标识符

4. 表达式

4.1 运算符

4.2 常量和字面量

4.3 求值

5. 语句

5.3 选择语句

5.4 循环语句

5.5 跳转语句

6. 函数

7. 派生类型

9. 对象

9.2 对象表示

9.4 声明

10. 预处理器

12. 标准库中的宏

13. 错误处理

14. 输入输出

16. 字符/字符串库

17. 数学库

21. 程序支持

22. 并发支持

MdrOS

番外

分治法 ​

1. 定义 ​

2. 示例：归并排序 ​

4. 用递归式分析分治算法 ​

4.1 递归式 ​

4.2 代入法 ​

4.3 递归树 ​

4.4 主方法和主定理 ​

4.4.1 概念 ​

4.4.2 主定理 ​

4.4.3 使用主定理 ​

4.4.4 证明主定理 ​

4.5 Akra-Bazzi 方法 ​

4.5.1 简介 ​

4.5.2 使用 Akra-Bazzi 方法 ​

4.5.3 证明 Akra-Bazzi 方法 ​

5. 常见的分治算法 ​

5.0 归并排序 ​

5.1 Karatsuba 大数乘法 ​

5.1.1 传统大数乘法算法 ​

5.1.2 Karatsuba 算法的描述 ​

5.1.3 Karatsuba 算法的时间复杂度 ​

5.2 Strassen 矩阵乘法 ​

5.2.1 矩阵乘法的定义 ​

5.2.2 普通的矩阵乘法算法及时间复杂度 ​

5.2.3 Strassen 矩阵乘法算法的描述 ​

5.2.4 Strassen 矩阵乘法算法的时间复杂度 ​

5.3 快速数论变换 (Fast Number Theoretic Transformation, NTT) ​

5.3.1 背景：多项式乘法与卷积 ​

5.3.2 NTT 的数学基础 ​

5.3.3 NTT 和 逆 NTT (INTT) 的定义 ​

5.3.4 使用 NTT 计算多项式乘法（卷积）的步骤 ​

5.3.5 NTT 的时间复杂度 ​

6. 常见的用分治法解决的问题 ​

6.1 最近点对问题 ​

6.2 最大子数组和问题 ​

6.3 凸包问题 ​

习题 ​

分治法