用于对象识别的卷积结构中汇聚运算的评估,计算机外文翻译,深度学习
文档价格: | 100 金币 立即充值 | 文章语言: | 英语-中文 | 原文出处: | 请在文档内查看 | |||||
译文字数: | 5265 字 (节选翻译) | 译文格式: | Doc.docx (Word) | 更新时间: | 2018-07-22 |
用于对象识别的卷积结构中汇聚运算的评估,计算机外文翻译,深度学习,卷积神经网络,图像分类
译文(字数:5265):
摘要:在对象识别中获得不变特征的一种常见方法模型是在一个小邻域聚集多个低级别的特征获得不变特征。但是,这些模型存在不同,导致比较不同的聚合函数的性能比较难。本文的目标是通过在几种常见的对象识别任务中直接比较一个固定的结构,获得洞察不同聚合函数性能的能力。以多次试验结果为依据,表明了最大限度的汇聚运算显著地优于采样操作。尽管他们具有较平滑的性能,重叠的汇聚窗口性能却不会显著优于非重叠的汇聚窗口性能。通过应用这些知识,我们使用目前最先进的技术在NORB标准化的统一数据集中出现了4.57%的错误率,在NORB不稳定的杂乱数据中出现而了5.6%的错误率。
1介绍
近年来许多的物体识别策略是根据Hubel和Wiesel提出的哺乳动物视觉皮层机构的原理发展而来。根据Hubel和Wiesel的发现,哺乳动物视觉区域V1包含了许许多多简单的细胞和复杂的细胞。哺乳动物视觉区域中简单的细胞提供一种特征提取的功能,而复杂的细胞则将许多这些特征在一个有限的空间里聚集成一个局部特征。根据Hubel和Wiesel的推测,这个局部的区域对于获取不变的特征很关键。
这些研究中发现的备受关注模型就是神经认知机和卷积神经网络(Convolutional Neural Networks(CNNs))。近年来许多国家的最先进的研究表明,他们使用类似聚合技术实现的特征提取器得到了很好地成果,其中就包括定向梯度直方图(Histograms of Oriented Gradients(HOG))、软件实现容错(SIFT)描述符、Gist和人脸识别中的HMAX模型。
原文(PDF格式,未统计字数):