渐进式半监督多分类器学习,计算机外文翻译,半监督学习,集成学习
文档价格: | 100 金币 立即充值 | 文章语言: | 英语-中文 | 原文出处: | 请在文档内查看 | |||||
译文字数: | 6760 字 (节选翻译) | 译文格式: | Doc.docx (Word) | 更新时间: | 2018-02-02 |
渐进式半监督多分类器学习,计算机外文翻译,半监督学习,集成学习,迁移学习
译文(字数:6760):
半监督学习通常用来处理很少标记的样本的数据集。然而,传统的半监督集成学习方法有2点局限:
1)大多数方法在高维且有限的标签的数据集时不能得到满意的效果
2)他们通常没有考虑如何用优化过程来扩大训练集。
在这篇论文中,我们提出了一个渐进式半监督集成学习(PSEMISEL)的方法来解决以上局限性和处理有限标记样本的数据集。当和传统的半监督集成学习方法比较时,PSEMISEL有两个特点:
1)它采用了随机子空间技术来研究数据集的子空间结构
2)一种渐进的训练集的迭代过程和一种自进化的样本选择过程被提出用来扩大训练集
我们也用了一系列非参数的测试来比较不同的半监督集成学习方法在各种数据集上的表现。在来自于加州大学的Irvine机器学习仓库的18 real-world数据集上的实验,显示PSEMISEL在大多数18 real-world数据集上表现地很好,相对于其他的最先进的方法,在18个数据集中的10个数据集上面表现更好。
索引术语-集成学习,机器学习,优化,随机子空间,半监督学习
介绍:
当越来越多的数据从不同的数据源收集,很难获得最新的标记数据,因为花费人力去标注数据是十分费时间的并且很昂贵。这引起了一个有关于如何处理只有有限标签的数据集的问题。在最近几年,不同的半监督学习方法[1]-[4]在处理这个有挑战性的任务,充分利用有限的已标记样例和被选择的没有标记的数据去产生最后的结果。半监督学习方法已经被成功运用于不同的研究领域[5]-[10],例如数据挖掘[5]。模式识别[6][7],语音处理[8],和生物信息学[9],[10]。
原文(未统计字数):