这里 表示向量 的第一个元素


若信道矩阵的行是可排列的,但是列不可排列,如

此时最优输入分布是均匀分布

推导

条件熵 对于所有输入 都相等,所以总条件熵与输入分布无关

此时只需要最大化

但是由于 中各列不具有可排列性,要使 ,则可能使输入概率分布的某项概率出现负值,这是办不到的。为了在 非负的情况下使其最大,可将 中的 项分成 个子集 每个子集分别有 个元素,则

令第 个集合中概率的平均值

因为 ,这里采用放缩

所以有

两边加上负号

所以把子集 中的 变成其均值 ,将使第 个子集中的熵达到最大。因为子矩阵具有可排列性,只要信源 X 呈等概率分布,即可使第 k 个子集中的输出概率相等,即达到其均值。而且每一项都达到最大值,则输出的熵也达到最大

我怎么感觉怪怪的?这里好像没有考虑到子集之间的关系,就直接默认他们相等了


  1. 最优输入分布是均匀分布,即 对所有 成立。

\mathbf{p_a}^* = \frac{1}{n} \mathbf{1_n}

2. 条件熵 $H(Y|X=a_i)$ 对所有输入 $a_i$ 都是相同的。我们称这个值为 $H_0$。 $H_0 = H(Y|X=a_1) = -\sum_{k=1}^m p(b_k|a_1) \log_2 p(b_k|a_1)$。 用矩阵表示(取第一行计算 $H_0$):

H_0 = - ((\mathbf{P} \odot \log_2 \mathbf{P}) \mathbf{1_m})_1

这里 $((\mathbf{P} \odot \log_2 \mathbf{P}) \mathbf{1_m})_1$ 表示向量 $(\mathbf{P} \odot \log_2 \mathbf{P}) \mathbf{1_m}$ 的第一个元素。 2. 当输入为均匀分布时,输出概率分布 $\mathbf{q} = (q_j)$ 为:

\mathbf{q} = \frac{1}{n} \mathbf{P}^T \mathbf{1_n}

4. 此时的输出熵 $H(Y)_{\text{unif\_in}}$ 为:

H(Y)_{\text{unif_in}} = - \mathbf{q}^T (\log_2 \mathbf{q}) = - \left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right)^T \log_2\left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right)

5. 信道容量 $C = H(Y)_{\text{unif\_in}} - H_0$。

C = - \left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right)^T \log_2\left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right) - \left( - ((\mathbf{P} \odot \log_2 \mathbf{P}) \mathbf{1_m})_1 \right)

C = - \left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right)^T \log_2\left(\frac{1}{n} \mathbf{P}^T \mathbf{1_n}\right) + ((\mathbf{P} \odot \log_2 \mathbf{P}) \mathbf{1_m})_1