什么是互信息?
互信息是信息论里一种有用的信息度量,它是指两个事件集合之间的相关性。互信息可以用于度量特征对于主题的区分度,并且在计算语言学模型分析中经常使用。互信息的定义与交叉熵近似。互信息是两个随机变量统计相关性的测度。在特征抽取中,互信息被用作特征词和类别之间的测度,通常情况下,如果一个特征词属于某个类别,它们之间的互信息量会比较大。互信息不需要对特征词和类别之间关系的性质作任何假设,因此非常适合于文本分类的特征和类别的配准工作。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请您通过400-62-96871或关注我们的公众号与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!







请先 登录后发表评论 ~