Lecture 5. Greedy Algorithm

【例 1】（活动选择问题）有 $n$ 项活动 $a_1,a_2,\cdots,a_n$ 对应开始结束时间 $[s_1,t_1),\cdots,[s_n,t_n)$ ，从所有活动中选出最多数量的活动满足不相互重叠活动时间的要求。

【解】优先选择结束时间最早的活动。贪心算法的正确性证明：如果一个最优解不符合要求，那么一定可以通过交换使其符合要求。

【例 2】（最大独立集问题）对 $n$ 个点 $m$ 条边的图 $G=(V,E)$ ，求一个点集的子集 $V'\subseteq V$ ，使得 $V'$ 中任意两点没有边相连，最大化 $|V'|$ 。

【解】这个问题是一个 NP-hard 问题，因此我们采用贪心算法求近似解。

（贪心算法）优先选择度数小的点，删除该点、以及相邻点的子图后继续选择。

【定理 1】令 $\delta = m/n$ 表示图 $G$ 的密度，那么使用上面贪心算法获得的点的数量满足

m_{Gr}(G)\ge\frac{n}{2\delta+1}

【证明】假设第 $i$ 步选择了点 $v_i$ ，其当前度数为 $d(v_i)$ ，那么我们这一步将会删除 $d(v_i)+1$ 个点和至少 $d(v_i)(d(v_i)+1)/2$ 条边（刚好的情况下，这些点构成了一个团），于是

\sum_{i=1}^{m_{Gr}(G)}(d(v_i)+1)=n \\ \sum_{i=1}^{m_{Gr}(G)}\frac{d(v_i)(d(v_i)+1)}{2}\leq m=n\delta

令下式 * 2 加到上式中，有

\sum_{i=1}^{m_{Gr}(G)} (d(v_i)+1)^2\leq n(2\delta+1)

根据 Cauchy-Schwarz 不等式，有

\begin{aligned}\small m_{Gr}(G)\sum_{i=1}^{m_{Gr}(G)}(d(v_i)+1)^2=\sum_{i=1}^{m_{Gr}(G)} (d(v_i)+1)^2 \cdot \sum_{i=1}^{m_{Gr}(G)}1^2\ge \left(\sum_{i=1}^{m_{Gr}(G)}(d(v_i)+1)\cdot 1\right)^2=n^2\end{aligned}

从而

\frac{n^2}{m_{Gr}(G)}\leq n(2\delta+1)

于是，

m_{Gr}(G)\ge \frac{n}{2\delta+1}

【定理 2】若 $m^*(G)$ 为图 $G$ 的最大独立集数（最优解），那么

\frac{m^*(G)}{m_{Gr}(G)} \leq \delta+1

【证明】假设 $V^*$ 是一个最优解。考虑每次删点时，假设删除的 $d(v_i)+1$ 个点中有 $k_i$ 个 $V^*$ 中的点，那么：

\sum_{i=1}^{m_{Gr}(G)}(d(v_i)+1)=n \\ \sum_{i=1}^{m_{Gr}(G)}k_i=m^*(G)

在删边时，在贪心算法时我们提到过最少情况下，这些点构成了一个团，至少删去 $d(v_i)(d(v_i)+1)/2$ 条边。但是在这里，有 $k_i$ 个 $V^*$ 中的点，他们之间不可能有边相连，因此应该去掉他们之间连的边，即 $k_i(k_i-1)/2$ 条边；但同时需要满足他们的度数依然不比 $d(v_i)$ 小，于是这 $k_i$ 个点每个点需要从外面补上 $k_i-1$ 条边，即需要多删除 $k_i(k_i-1)$ 条边，因此总共来说，至少删去了

\frac{d(v_i)(d(v_i)+1)}{2}-\frac{k_i(k_i-1)}{2}+k_i(k_i-1)=\frac{d(v_i)(d(v_i)+1)}{2}+\frac{k_i(k_i-1)}{2}

条边，于是类似地有

\sum_{i=1}^{m_{Gr}(G)}\frac{d(v_i)(d(v_i)+1)}{2}+\frac{k_i(k_i-1)}{2}\leq m=n\delta

用和定理 1 类似的方法，我们可以得到：

\sum_{i=1}^{m_{Gr}(G)} (d(v_i)+1)^2+k_i^2\leq n(2\delta+1)+m^*(G)

同样的，利用柯西不等式有

\sum_{i=1}^{m_{Gr}(G)} (d(v_i)+1)^2 \ge \frac{n^2}{m_{Gr}(G)}, \quad \sum_{i=1}^{m_{Gr}(G)}k_i^2\ge \frac{m^*(G)^2}{m_{Gr}(G)}

于是，

\frac{n^2+m^*(G)^2}{m_{Gr}(G)} \leq n(2\delta+1)+m^*(G)

故，

\begin{aligned}m_{Gr}(G)&\ge \frac{n^2+m^*(G)^2}{n(2\delta+1)+m^*(G)}\\&=\frac{n+m^*(G)^2/n}{(2\delta+1)+m^*(G)/n} \\ &=\frac{n/m^*(G)+m^*(G)/n}{(2\delta+1)/m^*(G)+1/n} \\ &\ge\frac{2}{(2\delta+1)/m^*(G)+1/n}\end{aligned}

于是，

\frac{m^*(G)}{m_{Gr}(G)} \leq \frac{(2\delta+1)+m^*(G)/n}{2} \leq \frac{(2\delta+1)+1}{2}=\delta+1

【例 3】（最小生成树问题）

验证方法：cut-and-paste，对于任意 cut $(V',V\backslash V')$ ，原图中 cut 的边的最小值应该等于最小生成树中对应 cut 的边权。

Kruskal 算法：初始 $E'=\emptyset$ ，每次选择两个未连通的分量之间连通所需的最小边权对应的边 $e$ 加入 $E'$ 中，重复至 $|E'|=|V|-1$ ，即得最小生成树 $(V,E')$ ；

Krim 算法：初始点集合 $V'=\{v_i\}, E=\emptyset$ （从任意一个点出发），每次找到连接 $V'$ 和 $V\backslash V'$ 所需要的最小边权对应的边 $e$ 加入 $E'$ 中，并将 $e$ 的属于 $V\backslash V'$ 的顶点加入 $V'$ 中，重复至 $V'=V$ 即得最小生成树 $(V,E')$ 。

【例 4】（背包问题贪心算法）有 $n$ 个物品，背包容量 $W$ ，每个物品重量 $w_1,w_2,\cdots,w_n$ ，价值 $p_1,p_2,\cdots,p_n$ ，在重量不超过 $W$ 的情况下最大化价值和。

【解】在原有启发式算法优先选择 $p_i/w_i$ 更大物品的基础上，最后返回

m_H(X)=\max(m_{Gr}(X),p_{\max})

【定理 3】背包问题贪心算法得到的 $m_H(X)$ 满足：

\frac{m^*(X)}{m_H(X)}<2

【证明】假设物品已经按照 $p_i/w_i$ 从大到小排序，并重编号为 $1,2,\cdots,n$ ，假设：

w_i+\sum_{k=1}^{i-1}w_k>W, \quad \sum_{k=1}^{i-1}w_k\leq W

那么，当前剩余空间为 $W-\sum_{k=1}^{i-1}w_k<w_i$ ，于是有：

\begin{aligned}m^*(X)&<\sum_{k=1}^{i-1}p_k +\left(W-\sum_{k=1}^{i-1}w_k\right)\frac{p_i}{w_i} \\&< \sum_{k=1}^{i-1}p_k+p_i\\&\leq m_{Gr}(X)+p_{\max} \\ &\leq 2m_H(X)\end{aligned}

于是，

\frac{m^*(X)}{m_H(X)}<2

【定理 4】（The Stein-Lovasz Theorem，SL 定理）设 $A$ 是一个 $N\times M$ 的 0-1 矩阵，每行至少 $v$ 个 1，每列最多 $a$ 个 1，则存在一个 $N\times K$ 的子矩阵不包含全 0 行，且

K\leq \frac{N}{a}+\frac{M}{v}\ln a\leq\frac{M}{v}(1+\ln a)

可以理解为，挑选 $K$ 列完成对 $N$ 行的覆盖。

【证明】贪心。假设初始 $N\times M$ 矩阵为 $A_a$ ，其中每行至少 $v$ 个 1，每列最多 $a$ 个 1。记 $K_a$ 表示这个矩阵中每列恰有 $a$ 个 1、且有 1 的位置互不相交的列的个数。找到这 $K_a$ 个列并删除之，同时删除其中含有的 1 对应的所有行，得到新矩阵 $A_{a-1}$ ，其中每行至少 $v$ 个 1，每列最多 $a-1$ 个 1，并且我们可以计算出此时 $A_{a-1}$ 的大小应该为 $(N-aK_a)\times(M-K_a)$ 。如此递归进行，直到全被覆盖，我们可以得到 $A_i$ 的大小应该为：

\left(N- \sum_{t=i+1}^a tK_t\right)\times\left(M-\sum_{t=i+1}^a K_t\right)

那么考虑令 $k_i=N-\sum_{t=i}^a tK_t$ ，即为 $A_{i-1}$ 的行数，那么我们知道

k_{i+1}-k_i=iK_i,\quad k_{a+1}=N,\quad k_1=0

于是，

\begin{aligned}K&=\sum_{i=1}^a K_i \\&= \frac{k_2-k_1}{1}+\frac{k_3-k_2}{2}+\cdots+\frac{k_{a+1}-k_a}{a}\\ &=\frac{N}{a}+\sum_{i=2}^a\left(\frac{1}{i-1}-\frac{1}{i}\right)k_i \\ &=\frac{N}{a}+\sum_{i=2}^a \frac{k_i}{(i-1)i}\end{aligned}

我们考虑对 $A_i$ 进行双计数，根据上述定义，其大小为 $k_{i+1}\times(M-\sum_{t=i+1}^a K_t)$ ，且其中每行至少 $v$ 个 1，每列最多 $i$ 个 1，于是对 1 的个数进行双计数，有

k_{i+1}v\leq i\left(M-\sum_{t=i+1}^a K_t\right)<Mi \quad \Longrightarrow \quad \frac{k_{i+1}}{i}<\frac{M}{v}

于是有

K=\frac{N}{a}+\sum_{i=2}^a \frac{k_i}{(i-1)i}<\frac{N}{a}+\frac{M}{v}\sum_{i=2}^a \frac{1}{i}<\frac{N}{a}+\frac{M}{v}\ln a

又，对 $A$ 双计数有 $Nv \leq Ma$ ，即 $N/a \leq M/v$ ，于是

K<\frac{N}{a}+\frac{M}{v}\ln a<\frac{M}{v}(1+\ln a)

注：SL 定理有许多应用，比如【例 5】、【例 6】。

【例 5】（完美哈希族）一个 $(n,m,w)$ 完美哈希族是一组函数 $F$ ，其中 $Y=\{1,2,\cdots,n\}$ ， $|Y|=n,|X|=m$ ，对于所有的 $f\in F$ 有 $f:Y\rightarrow X$ ，对任意的 $C\subseteq\{1,2,\cdots,n\}$ 且 $|C|=w$ ，存在一个函数 $f\in F$ 使得 $f|C$ （ $f$ 在定义与 $C$ 上）是单射。当 $|F|=N$ 时，一个 $(n,m,w)$ 完美哈希族可以表示为 $PHF(N;n,m,w)$ .

【定理 5】存在一个 $PHF(N;n,m,w)$ 满足

N\leq\frac{m^w}{w!\binom{m}{w}}\left(1+\ln\binom{n}{w}\right)

【证明】（SL 定理）我们将 SL 定理中的 $N,M,a,v$ 在本题中进行一个映射。

$N:=\binom{n}{w}$ 表示有多少个 $w$ 元子集合；

$M:=m^n$ 表示有多少种映射关系；

那么，我们需要对每一行（每个 $w$ 元子集合），选择尽量少的函数完成单射；矩阵第 $i$ 行第 $j$ 列若为 1，则表示第 $i$ 个 $w$ 元子集合能否在第 $j$ 种映射关系下形成单射。

$v$ ：每一行的 1 至少有多少个，相当于每个 $w$ 元子集合（至少）有多少个不同的单射？
- 从 $m$ 个元素的集合 $X$ 中选出 $w$ 个用来完成单射，即 $\binom{m}{w}$ ；
- 这 $w$ 个元素可以全排列，即 $w!$ ；
- 剩下的 $n-w$ 个元素可以任意映射，即 $m^{n-w}$ ；
- 综上所述，即为 $\binom{m}{w}w!m^{n-w}$ 。

$a$ ：每一列的 1 最多有多少个，相当于每个映射关系（最多）能将多少个子集映射成单射？
- 最多的子集数量为 $N$ ，即 $\binom{n}{w}$ ；

于是，至少存在一个 $N\times K$ 的子矩阵不包含全 0 的行，即每个 $w$ 元子集合都能被覆盖，根据 SL 定理，有

K \leq \frac{M}{v}\left(1+\ln a\right)=\frac{m^n}{\binom{m}{w}w!m^{n-w}}\left(1+\ln\binom{n}{w}\right)=\frac{m^w}{w!\binom{m}{w}}\left(1+\ln\binom{n}{w}\right)

即

N\leq \frac{m^w}{w!\binom{m}{w}}\left(1+\ln\binom{n}{w}\right)

【定理 5（改）】存在一个 $PHF(N;n,m,w)$ 满足

N\leq 1+\frac{-\ln\binom{n}{w}}{\ln\left(1-\frac{\binom{m}{w}w!}{m^w}\right)}

【证明】（概率方法）共有 $m^n$ 个函数，随机选择 $N$ 个函数，对一个固定的 $w$ -元子集合，则其中一个随机的函数使得子集合为单射的概率为

P=\frac{\binom{m}{w}w!m^{n-w}}{m^n}=\binom{m}{w}w!m^{-w}

那么，这 $N$ 个函数都无法完成单射的概率为 $(1-P)^N$ 。总共有 $\binom{n}{w}$ 个 $w$ 元子集合，那么没有完成单射的子集合数期望为 $\binom{n}{w}(1-P)^N$ 。根据平均值原理，必然有一个方案，没有完成单射的子集合数至多为 $\binom{n}{w}(1-P)^N$ ，于是我们只要保证 $\binom{n}{w}(1-P)^N<1$ ，那么由于“没有完成单射的子集合数”是非负整数，其只能等于 0，也就是说对所有子集合都能完成单射。于是条件为：

N>\frac{-\ln\binom{n}{w}}{\ln\left(1-\frac{\binom{m}{w}w!}{m^w}\right)}

只要满足这个条件，就必然存在对应的 $PHF(N;n,m,w)$ 。那么定理显然得证。

【例 6】（分割系统）设 $n,t$ 为偶数且 $0<t<n$ ，一个 $(n,t)$ 分割系统是 $(X,\{B_i\})$ ，满足：

$|X|=n$ ，且 $B_i$ 为 $X$ 的 $n/2$ 元子集合 $B_i\subseteq X,|B_i|=n/2$ ，我们把 $B$ 称为“块”；

对每个 $X$ 的 $t$ 元子集合 $Y\subseteq X,|Y|=t$ ，都存在一个块 $B$ 满足 $|B\cap Y|=t/2$ 。

问题是选择最少的 $|\{B_i\}|$ 满足条件。

【解 1】（SL 定理）我们将 SL 定理中的 $N,M,a,v$ 在本题中进行一个映射。

$N:=\binom{n}{t}$ 表示有多少个 $t$ 元子集合 $Y$ 。

$M:=\binom{n}{n/2}$ 表示有多少个可能的块 $B$ 。

矩阵 $A$ 的第 $i$ 行第 $j$ 列表示第 $j$ 个块能不能满第 $i$ 个子集合的要求，那么我们需要选择一个 $N\times K$ 的子矩阵（选择 $K$ 个块）。满足每一行（每一个 $t$ 元子集合），都有一个 1（都有一个块满足要求）。

$v$ ：每一行的 1 至少有多少个，即每个 $t$ 元集合 $Y$ （至少）能有多少个块 $B$ 满足要求。
- 从每个 $t$ 元集合中选出 $t/2$ 个元素作为公共元素，即 $\binom{t}{t/2}$ ；
- 从剩下 $n-t$ 个元素中选出 $n/2-t/2$ 个元素作为 $B$ 的剩余元素，即 $\binom{n-t}{(n-t)/2}$ ；
- 那么 $v:=\binom{t}{t/2}\binom{n-t}{(n-t)/2}$ 。

$a$ ：每一列的 1 最多有多少个，即每个块 $B$ （最多）能有多少个 $Y$ 满足要求。
- 类似地，从每个块中选出 $t/2$ 个元素作为公共元素，即 $\binom{n/2}{t/2}$ ；
- 从剩下 $n-n/2=n/2$ 个元素中选出 $t/2$ 个元素作为 $Y$ 的剩余元素，即 $\binom{n/2}{t/2}$ ；
- 那么 $a:=\binom{n/2}{t/2}\binom{n/2}{t/2}$ 。

于是，根据 SL 定理，有

K\leq\frac{M}{v}(1+\ln a)=\frac{\binom{n}{n/2}}{\binom{t}{t/2}\binom{n-t}{(n-t)/2}}\left(1+2\ln\binom{n/2}{t/2}\right)

【解 2】（概率方法）共有 $\binom{n}{n/2}$ 个函数，随机选择 $K$ 个函数，对于一个固定的 $t$ 元子集合 $Y$ ，被一个随机的 $n/2$ 元子集合分割的概率为：

P=\frac{\binom{t}{t/2}\binom{n-t}{(n-t)/2}}{\binom{n}{n/2}}

那么，这 $K$ 个函数都无法分割的概率为 $(1-P)^K$ 。总共有 $\binom{n}{t}$ 个集合，因此没有被分割的 $t$ 元集合的期望个数为 $\binom{n}{t}(1-P)^K$ ，与【定理 5（改）】证明类似地，我们只需要满足

\binom{n}{t}(1-P)^K <1\quad \Longrightarrow\quad K\ge \frac{-\ln\binom{n}{t}}{\ln(1-P)}=\frac{-\ln\binom{n}{t}}{\ln\left(1-\frac{\binom{t}{t/2}\binom{n-t}{(n-t)/2}}{\binom{n}{n/2}}\right)}

【定理 6】（Mantel 定理）在一个不含 3-圈 (triangle-free) 的 $2n$ 个点的图中，最多有 $n^2$ 条边。

💡

Mantel 定理的等价表述：

在 $2n$ 个顶点和 $n^2+1$ 条边的图中，必然含有 3-圈

在一个不含 3-圈 (triangle-free) 的 $n$ 个点的图中，最多有 $n^2/4$ 条边。

在一个不含 3-团 (3-clique) 的 $n$ 个点的图中，最多有 $n^2/4$ 条边。

【证明 1】（数学归纳法）设 $n-1$ 情况成立，下证明 $n$ 情况也成立。即我们知道 $2(n-1)$ 个点，包含 $(n-1)^2+1$ 条边的图中必然含有 3-圈。考虑 $2n$ 个和 $n^2+1$ 条边时，取出两个点 $(u,v)\in E$ ，剩下的图为 $H$ 。若存在 $w\in H$ 使得 $(u,v,w)$ 为 3-圈，那么显然成立；若不存在，则 $H$ 的每一个点最多只能与 $u,v$ 其一连边，因此 $(u,v)$ 与 $H$ 间最多有 $2(n-1)$ 条边，于是 $H$ 至少有 $n^2+1-2(n-1)-1=n^2-2n+2=(n-1)^2+1$ 条边，则根据归纳假设，一定存在 3-圈。综上，根据归纳法，原命题成立。

【证明 2】任取一条边 $(u,v)\in E$ ，一定不会出现 $w\in G$ 且 $w$ 为 $u,v$ 的公共邻居，那么剩下每个点最多只能与 $u,v$ 其一连边，于是 $d(u)+d(v)\leq 2n$ 。

根据 Lecture 2 【例 3】，我们有

\sum_{v\in V}d^2(v)=\sum_{(u,v)=e\in E}d(u)+d(v) \leq 2n |E|

又根据 Cauchy-Schwarz 不等式有，

\sum_{v\in V}d^2(v) \ge \frac{1}{2n}\left(\sum_{v\in V}d(v)\right)^2=\frac{(2|E|)^2}{2n}=\frac{2|E|^2}{n}

于是，

\frac{2|E|^2}{n} \leq 2n|E| \quad \Longrightarrow \quad |E|\leq n^2

【证明 3】（最大独立集）设 $A$ 为最大独立集，令 $B=V\backslash A$ 。则对任意 $x$ 的邻居点集为独立集（因为不存在 3-圈），独立集大小为 $d(x)$ ，于是有 $d(x)\leq |A|,\forall x$ ，故

|E|\leq \sum_{x\in B}d(x) \leq |A||B| \leq \left(\frac{|A|+|B|}{2}\right)^2=n^2

【定理 7】（Turan 定理）对于一个含有 $n$ 个点的图 $G=(V,E)$ ，若图中不存在 $(k+1)$ -团 $(k\ge 2)$ ，那么有：

|E|\leq \left(1-\frac{1}{k}\right)\frac{n^2}{2}

【证明 1】（数学归纳法）假设结论对 $\le n-1$ 均成立，下面证明 $n$ 也成立。假设图的边数达到最多，那么图中已经存在 $k$ -团（若不存在可以加边使其存在，但不满足变数最多的假设）。记这个 $k$ -团为 $A$ ，剩下部分 $B=V\backslash A$ ，那么：

$A$ 中的边数为 $\binom{k}{2}$ ；

$B$ 中的边数根据归纳假设不超过
$\left(1-\frac{1}{k}\right)\frac{(n-k)^2}{2}$

连接 $A,B$ 的边数：由于 $B$ 中每个点最多只能连 $(k-1)$ 个 $A$ 中的点（否则就出现了 $(k+1)$ -团），所以不超过 $(n-k)(k-1)$ 。

综上，

\begin{aligned}|E|&\leq \binom{k}{2}+\left(1-\frac{1}{k}\right)\frac{(n-k)^2}{2}+(n-k)(k-1)\\&=\frac{k(k-1)}{2}+\left(1-\frac{1}{k}\right)\frac{(n+k)(n-k)}{2}\\ &=\frac{1}{2}\left(k^2-k+\frac{k-1}{k}(n^2-k^2)\right)\\ &=\frac{1}{2}\frac{k-1}{k}n^2 \\ &=\left(1-\frac{1}{k}\right)\frac{n^2}{2}\end{aligned}

【证明 2】（等价关系思想）假设图中边数已经最多，且不存在 $(k+1)$ -团，【证明 1】中说明了一定存在 $k$ -团，那么我们首先证明 $(u,v)\notin E$ 这个关系是等价关系，即：

自反性，由于图中没有自环，因此显然 $(u,u)\notin E$ ；

对称性，由于是无向图，因此 $(u,v)\notin E$ 自然有 $(v,u)\notin E$ ；

传递性，对于 $(u,v)\notin E,(v,w)\notin E$ ，一定有 $(u,w)\notin E$ ；
【证明】反证，假设 $(u,v)\notin E, (v,w)\notin E$ 但 $(u,w)\in E$ ；
- 若 $d(u)>d(v)$ ，则删除 $v$ ，新增一个 $u$ 的拷贝 $u'$ （连边方式和 $u$ 完全相同），但 $u$ 和 $u'$ 不连边，则新图的边数为 $|E|-d(v)+d(u')=|E|+(d(u)-d(v))>|E|$ ，与图中边数最多矛盾。
- 若 $d(w)>d(v)$ ，则类似可导出矛盾。
- 若 $d(u)\leq d(v),d(w)\leq d(v)$ ，那么删除 $u,w$ ，添加 $v$ 的两个拷贝 $v',v''$ ，但 $v,v',v''$ 三点之间不连边，则新图的边数为
  $\small |E|-(d(u)+d(w)-1)+2d(v)=|E|+1+(2d(v)-2d(u)-d(w))>|E|$
  同样导出矛盾。
综上，传递性成立。

因此 $(u,v)\notin E$ 这个关系是等价关系，且图中存在 $k$ -团，不存在 $(k+1)$ -团，故需要 $k$ 个等价类。下面说明等价类是平均的，即每个等价类的个数之间至多差 1：若两个等价类 $A,B$ 出现 $|A|\ge |B|+2$ ，那么从 $|A|$ 移动 1 个点到 $|B|$ 中，边数变化 $|A|-1-|B|\ge 1$ ，增加边数，与图中边数已经最多矛盾。因此，边数为：

|E|=\underbrace{k}_{k \text{ classes}}\cdot \underbrace{\frac{n}{k}}_{\text{\#node/class}}\cdot \underbrace{\left(n-\frac{n}{k}\right)}_{\text{link to other nodes except the same class}}\cdot \underbrace{\frac{1}{2}}_\text{duplicate} = \left(1-\frac{1}{k}\right)\frac{n^2}{2}

【证明 3】（团数定理）Lecture 3 中【定理 4】阐述了最大团 $\omega(G)$ 和图 $G$ 的关系：

\omega(G)\ge\sum_{v\in V}\frac{1}{n-d(v)}

那么，

k(n^2-2|E|)\ge\omega(G)(n^2-2|E|)\ge\left(\sum_{v\in V}\frac{1}{n-d(v)}\right)\left(\sum_{u\in V}(n-d(u))\right)\ge n^2

这是因为：

$\omega(G)\leq k$

$\sum_{u\in V}(n-d(u))= n^2-2|E|$

当 $u=v$ 时 $\frac{n-d(u)}{n-d(v)}=1$ ；当 $u\ne v$ 时考虑 $(u,v),(v,u)$ ，于是 $\frac{n-d(u)}{n-d(v)}+\frac{n-d(v)}{n-d(u)}\ge 2$ ；因此对于所有 $(u\in V,v\in V)$ ，求和大于等于 $n^2$ 。

化简得：

|E|\leq\left(1-\frac{1}{k}\right)\frac{n^2}{2}

【证明 4】（Turan 图结构）假设图中边数已经最多，且不存在 $(k+1)$ -团，【证明 1】中说明了一定存在 $k$ -团。令 $v_m\in V$ 为 $G$ 中度数最大的点，令 $S$ 为 $v_m$ 点邻居集合，于是 $|S|=d(v_m)$ ，设剩下的点集合为 $T=V\backslash S$ 。那么我们把 $T$ 内部的边全部删除，然后把 $T$ 中的所有点与 $S$ 中的所有点都连起来。

下面我们说明：

这样操作后仍然不会有 $(k+1)$ -团。首先 $S$ 中一定不存在 $k$ -团（若存在，加上 $v_m$ 就是 $(k+1)$ -团）。其次，操作后 $T$ 中所有点都是 $v_m$ 的拷贝，因此原来不存在 $(k+1)$ -团，现在也不存在 $(k+1)$ -团。

这样操作后边数不会减少。在新图中 $S$ 中每一个点连的边不会减少，因此度数没有减少；同时 $T$ 中每一个点的度数直接设为了最大度数 $d(v_m)$ ，因此度数也不会减少；根据握手定理，图的总度数没有减少，那么边数一定不会减少。

操作之后得到一个新的独立集 $T$ ，我们接下来对 $S$ 这个子图继续做同样的事情即可，直到图 $G$ 变成一个 Turan 图结构，即包含若干独立集的“完全图”。接着，用【证明 2】一样的思路说明 (1) 独立集个数为 $k$ ；(2) 独立集之间平均，接着计算边数即可。

【证明 5】（概率分布）对每一个点 $u$ 分配一个概率 $p_u\in[0,1]$ 满足 $\sum_{u\in V}p_u=1$ ，问题是如何分配概率使得 $\sum_{(u,v)\in E}p_up_v$ 最大，即转化为下面的优化问题：

\max_{\{p_u\}_{u\in V}} F=\sum_{(u,v)\in E}p_up_v\\\text{s.t. }\ p_u\in[0,1],\forall u\\\sum_{u\in V}p_u=1

下面我们说明：

概率分布向团集中。对于两个点 $u,v$ ，设其邻居节点的概率和为 $S(u),S(v)$ ，不妨 $S(u)\ge S(v)$ ，那我们可以把 $p_v$ 全部转移给 $p_u$ 而不会让优化目标变得更差，即 $p_u\leftarrow p_u+p_v$ ，且 $p_v\leftarrow 0$ ：
$\Delta F=p_vS(u)-p_vS(v)\ge 0$

概率分布在团上均匀分配。假如在 $r$ -团上两个点 $u,v$ 满足 $p_u>p_v$ ，那么 $S(u)=S+p_v, S(v)=S+p_u$ ，其中 $S$ 为团上除了 $u,v$ 两个点外其他点的概率，那我们可以将 $p_u,p_v$ 均调整至 $(p_u+p_v)/2$ 使目标增大：
$\begin{aligned}\Delta F&= \frac{p_u+p_v}{2}(S(u)+S(v))-p_uS(u)-p_vS(v)\\ &=\frac{p_u+p_v}{2}(2S+p_u+p_v)-p_u(S+p_v)-p_v(S+p_u)\\ &= \frac{1}{2}(p_u-p_v)^2> 0\end{aligned}$

因此，概率在最大的 $r$ -团上均匀分配时目标最大，此时

F=\left(\frac{1}{r}\right)^2\binom{r}{2}=\frac{1}{2}\left(1-\frac{1}{r}\right)

并且 $r$ 越大 $F$ 越大；又因为 $r$ 最大为 $k$ ，因此

F_{\max}=\frac{1}{2}\left(1-\frac{1}{k}\right)

这样分配一定大于在 $|E|$ 上均匀分配，于是

\frac{1}{2}\left(1-\frac{1}{k}\right)\ge |E|\frac{1}{n^2} \quad \Longrightarrow \quad |E|\leq\left(1-\frac{1}{k}\right)\frac{n^2}{2}