avatar avatar 我的文献 基于机器学习的数字信息处理技术研究与实现 作者 浦海晨 单位 南京航空航天大学 导师 万晓冬 关键词 数字信息处理; 机器学习; 向量空间模型; 特征选择; 遗传算法; 人工神经网络
摘要
在过去几十年时间里,数字信号处理(DSP)已经在诸多领域得到了广泛应用。但是随着计算机和信息技术的发展,DSP技术也存在很多局限性,比如面对种类丰富的数字信息的处理显得力不从心,因此需要对DSP技术进行延伸和扩展以满足新的要求。机器学习作为一种成熟的DSP技术,将其延伸到数字信息处理中来具有重要的研究价值。本文以电子邮件这种常见的数字信息媒介为研究对象,通过基于机器学习的邮件数字信息处理技术研究,实现对邮件数字信息的智能处理,提高邮件数字信息分类识别的准确性,以满足邮件网关对垃圾邮件准确过滤的要求。本文首先对数字信息处理技术和机器学习在数字信息处理中的应用进行了分析,在此基础上研究了如何将机器学习技术应用于邮件数字信息处理。接着研究设计了对邮件数字信息的特征选择算法和分类算法。邮件数字信息特征空间维数巨大,为了降低特征维数,使机器学习算法可行,运用了基于特征选择度量函数的特征选择算法,在此基础上提出了基于遗传算法和特征选择度量函数相结合的特征选择算法。同时为了实现对邮件数字信息的智能处理,提高分类识别效果,设计了BP神经网络分类器,并采用遗传算法对BP网络进行了优化改进,实现了GABP网络分类器。最后设计开发了基于机器学习的邮件数字信息处理系统,并用实例样本对系统进行了测试分析,得出了比较理想的实验结果。通过实验说明利用机器学习技术进行邮件数字信息处理是可行的和有效的。
下载 cnki {{liketext}}
©2018 - iData {{ message }} 关闭