![智能搜索和推荐系统:原理、算法与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/810/35781810/b_35781810.jpg)
上QQ阅读APP看书,第一时间看更新
1.3.5 信息熵
简单地说,熵是信息论中对不确定性和无序程度的一种测度。熵越大,代表信息越混乱和不确定。反过来,熵越小,代表信息更有序、规则。
熵:已知离散型随机变量X的概率p(x)=P(X=x)(x∈R),则X的熵H(X)为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/016-2-i.png?sign=1738870921-m9JY4STPbukixTiw6aBaLJOfoH6sBRDL-0-d78869c4c9bf6eeab3a471a412378be6)
假设0≤p(x)≤1,一个二元信息熵可以简单表示为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/016-3-i.png?sign=1738870921-oMRBICDGRngdeVhnDXKlloPP0cZPwfoL-0-1a35f5713e09df737438d1aea9c3e241)
从图1-11可以看出,当p(x)=0.5时,熵达到最大,不确定性达到最大;当p(x)=0或者p(x)=1时,熵最小,不确定性最小。
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/t1-11-i.jpg?sign=1738870921-ymZv7HTXGAEFSJR4H0VzhNJix4eM0a2d-0-a7188c46b74186109a9cd32d6a6cb2d8)
图1-11 二元信息熵曲线
随机变量的熵小于等于随机变量取值个数的对数值:H(x)≤log2|x|。当且仅当概率平均分布时,H(x)的最大值为p(x)=1/|x|。
信息熵可以应用于有监督学习算法。决策树ID3、C4.5就是以熵作为测度的分类算法。
联合熵:如果(X,Y)表示一对离散随机变量的不确定性,即X,Y~p(x,y),则它们的联合熵H(X,Y)为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/017-i.png?sign=1738870921-Fth79iDSwpEB4CYpR8xU5QScNaCvcq2l-0-4ef9b0d2035ef73a758bebc7921c855a)
联合熵是一对随机变量所需信息量的平均测度。
条件熵:在给定随机变量X的情况下,随机变量Y的条件熵定义为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/017-2-i.png?sign=1738870921-1v5idnZFKE65hnOM7CoEHh9UyUzIct1u-0-88ab9725de56aadf55812cd7487bf92b)
自信息:表示事件X发生的不确定性,也用来表示事件所包含的信息量,可表示为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/017-3-i.png?sign=1738870921-PfiUXEqIsM7sS6CGf9iGucJkEvr4u7kY-0-5680ba3dde54f4a32481254515b380ee)
互信息:事件X、Y之间的互信息等于X的自信息减去Y条件下X的自信息,可表示为
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/018-i.png?sign=1738870921-p5kBQGehsyB1iW51D0KTOWMuS30pRZ47-0-0d64ebc0d68cd26e86586b5894706d36)
互信息I(X;Y)是已知Y值后X不确定性的减少量。
联合熵、条件熵和互信息间的对应关系如图1-12所示。
![](https://epubservercos.yuewen.com/153798/19106523408254006/epubprivate/OEBPS/Images/t1-12-i.jpg?sign=1738870921-NIqCu5RhZrl6kbXdRoXhwTKfBIJSqlTV-0-caee0ff930816096ad5af7614c3e6b21)
图1-12 联合熵、条件熵和互信息间的对应关系