半监督学习

2023-08-23 11:00:00 · bal · 乐小管

半监督学习（Semi-Supervised Learning，SSL）半监督学习是机器学习（machine learning）中的一种训练方式/学习方式。介于监督学习和无监督学习之间。是监督学习与无监督学习相结合的一种学习方法，半监督学习使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。

半监督学习（Semi-Supervised Learning，SSL）

什么是半监督学习

　　半监督学习是机器学习（machine learning）中的一种训练方式/学习方式。介于监督学习和无监督学习之间。是监督学习与无监督学习相结合的一种学习方法，半监督学习使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。

　　对于半监督学习，其训练数据的一部分是有标签的，另一部分没有标签，而没标签数据的数量常常极大于有标签数据数量（这也是符合现实情况的）。隐藏在半监督学习下的基本规律在于：数据的分布必然不是完全随机的，通过一些有标签数据的局部特征，以及更多没标签数据的整体分布，就可以得到可以接受甚至是非常好的分类结果。^[1]

半监督学习的分类

　　半监督学习可进一步划分为纯（pure）半监督学习和直推学习（transductive learning），前者假定训练数据中的未标记样本并非待测的数据，而后者则假定学习过程中所考虑的未标记样本恰是待预测数据，学习的目的就是在这些未标记样本上获得最优泛化性能。

　　直推学习（Transductive learning）：没有标记的数据是测试数据，这个时候可以用test的数据进行训练。这里需要注意，这里只是用了test数据中的feature而没有用label，所以并不是一种欺骗的方法。

　　归纳学习（Inductive learning）：没有标签的数据不是测试集。 ^[2]

半监督学习与监督学习区别

　　处在监督学习和无监督学习之间的是半监督学习。半监督学习使用的训练数据库，有一部分是标记过的，而大部分是没有标记的。因此和监督学习相比，半监督学习的成本较低，但又能达到较高的准确度。

参考文献

_{免责声明：本内容来源于第三方作者授权、网友推荐或互联网整理，旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有，其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况，请您通过400-62-96871或关注我们的公众号与我们取得联系，我们将尽快进行相关处理与修改。感谢您的理解与支持！}

名词术语

信息管理术语

综合条目

阅读全文

半监督学习

什么是半监督学习

半监督学习的分类

半监督学习与监督学习区别

相关条目

参考文献