🪴 Cyril

❯

❯

冗余度、自然语信源及信息变差

冗余度、自然语信源及信息变差

2025年5月23日1分钟阅读

假设英文中每个字符出现的概率完全相等，并且字符之间没有任何联系的情况下，每个字符所能携带的最大信息量：

lo g_{2} 27 \approx 4.75

零阶近似熵
考虑英文中单个字符出现的频率，计算每个字符的平均信息量。它假设每个字符的出现是独立的，但是考虑到出现概率的差异
$H_{0} = - \sum p (x_{i}) lo g_{2} p (x_{i})$ 指向原始笔记的链接

这里的

H_{0} = 4.76 (bi t / s i g n)

一阶近似熵
在已知前一个字符的情况下，当前字符的条件熵。

反映了单个字符对下一个字符的影响
$H_{1} = H (x_{i} ∣ x_{i - 1})$
同理二阶则为：
$H_{2} = H (x_{i} ∣ x_{i - 1} x_{i - 2})$ 指向原始笔记的链接

信源熵的相对率
$η = \frac{H _{\infty}}{H _{0}}$
衡量信源的有效信息密度。告诉我们有多少比例的信息是“非冗余的”，越小说明可压缩性越高。
指向原始笔记的链接

信源的冗余度
$ξ = 1 - η$
信源熵的相对率
指向原始笔记的链接

信息变差
$I_{0\infty} = H_{0} - H_{\infty}$
只考虑单个字符频率与考虑所有上下文关联之间的信息量差异
指向原始笔记的链接

关系图谱

最近笔记

信源熵
2025年6月04日
学习方法论
2025年6月04日

反向链接

唯一解距离
离散信息源

Created with Quartz v4.5.1 © 2025

GitHub
Friends
BiliBili