基于粗糙集和遗传算法的选择性集成分类器文献综述
2021-09-27 00:10:37
毕业论文课题相关文献综述
一、研究背景和意义
随着科技的快速发展,软件新技术发展的重要趋势是智能化技术,而机器学习是实现智能化的重要途径之一。机器学习是计算机科学中研究让机器具有学习能力的分支。集成学习是机器学习的研究热点之一,是机器学习的一种新的范式。机器学习方法在生产、科研和生活中有着广泛应用,目前,已经在科学研究、手写识别、人脸识别、语音识别、数据挖掘、游戏、情感识别等领域之中得到应用。随着机器学习方法的普及,集成学习的研究也越来越热门。
集成学习(EnsembleLearning)是机器学习的一种新的范式,是使用多个同质或非同质的学习器来解决同一个问题的一个学习系统,通常是使用同质的多个学习器来解决同一个问题,它能够显著的提高学习系统的泛化能力,所以成为近年来机器学习界一个重要的研究方向,国际上有很多学者都已经加入到相应的研究行列之中,并且研究出了不少有用的理论和应用成果。目前仍然存在许多问题需要解决。如何设计出更加有效的方法,如何有效的设计出分类器集成系统来提高整个学习器的泛化能力,将这些理论成果应用到实际应用中去,这些都是集成学习中需要研究的热点问题。
分类器选择集成方法的应用越来越广泛,已经深入到很多的领域,比如在语音识别、人脸识别、情感识别、文本分类、数据挖掘、游戏、遥感图像分类、医疗诊断等,在这些方向上受到了广泛应用。分类器集成利用不同分类器之间的互补性,提高集成后分类器的性能,并且在各自分类性能上分类器集成充分发挥了每个成员分类器的优势,得到比单个成员分类器都好的分类识别率,其目的是通过对多个互补的分类器识别结果的集成来得到一个高性能的识别系统。具有很大的研究价值,并且也具有很广的实际应用前景。
1、二、粗糙集理论
粗糙集理论是一种能够有效分析和处理不精确、不一致、不完整信息的数学方法。该理论与概率论、模糊集理论和证据理论等其它处理不确定性问题的方法相比,不需要提供解决问题所需的数据集以外的先验知识。该理论是建立在分类机制基础上的,它将知识与分类联系起来,认为知识就是对对象的分类能力,而知识库是分类方法的集合。它的主要思想是利用已知的知识库中的知识来近似表示不确定或不精确的未知目标(知识)。该理论与其它处理不确定性问题理论的最显著的区别是它无需任何先验知识和附加信息,仅利用数据集合自身的信息,所以对问题的不确定性的描述和处理是比较客观的。由于粗糙集理论不包含处理不精确或不确定原始数据的机制,所以该理论与概率论、模糊数学和证据理论等其它处理不确定或不精确问题的理论有很强的互补性。因此,粗糙集理论和其他理论相结合的研究也是粗糙集理论研究的重点之一。
三、遗传算法
遗传算法是基于生物进化的概念设计了一系列过程来达到优化的目的。这些过程包
括:基因组合、交叉、变异、自然选择。在这些过程中,通过优胜劣汰的原则来淘汰掉解较差的基因,使得解朝着好的方向发展。遗传算法从一组初始可行解出发在只需要目标函数这一信息的条件下实现对可行域的全局高效搜索并以概率1收敛到全局最优解,这种良好的特性使得遗传算法成为组合优化和函数优化的有力工具,并成为计算智能领域的研究热点.
2、四、选择性集成算法的分类
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。