文献综述
1.本课题研究现状及其发展趋势
数据预测与分类是数据挖掘领域非常重要的研究课题,长期来受到了广泛的关注。数据预测与分类理论是管理科学、经济、数学、计算机等不同学科相互交叉结合的结晶,并已经被广泛应用于能源价格市场分析、金融市场价格预测和风险控制、生物信息识别、商务智能客户行为分析等众多领域。近年来,随着信息技术、互联网技术的迅猛发展,云计算、大数据分析的逐步成熟,复杂数据预测与分类研究充满了机遇与挑战,一方面,随着上述新兴技术、产业的发展与推广,大量实时在线数据的快速收集得实现,数据预测与分类为代表的数据挖掘技术将在更多的领域中发挥更大的作用。另一方面,从数据维度、数据类型及数据体量等不同层面来看,数据对象正变的越来越多样化、复杂化,这极大的增加了精准化和精细化挖掘的难度,同时也从知识获取的准确性、合理性、可靠性及实用性等多个方面对数据预测与分类研究提出了更高要求。在20世纪后半叶,在数据模型预测领域,各种数据预测系统的理论和方法不断涌现,如Dempster于70年代提出的求参数极大似然估计的算法理论,Rubin教授70年代末提出的多重插补的思想,邓聚龙教授于80年代创立的灰色系统理论,Stekhoven提出的非参数缺失森林预测算法等,这些理论都是数据预测研究领域的重要成果,从不同角度、不同侧面论述了处理各类数据预测问题的理论和方法。
灰色系统理论是一种研究少数据、贫信息不确定性问题的新方法,该理论以“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。灰色预测建模技术是灰色系统理论最重要的组成部分之一,也是预测理论体系中一个新的研究分支,主要针对现实世界中大量存在的灰色不确定性预测问题,利用少量有效数据和灰色不确定性数据,通过序列的累加生成,揭示系统的未来发展趋势。经过20多年的发展,灰色预测模型已经在工业、农业、社会、经济、能源、交通、石油等众多领域得到广泛应用,成功地解决了生产、生活和科学研究中的大量实际问题,灰色预测模型也由原始的GM(1, 1)扩展出GM(1,N)、GM(2, 1)、DGM(1, 1)、Verhulst、GM(1, 1)幂模型等多种新的预测模型类别,预测类型也拓展到数列预测、区间预测、灰色灾变预测、波形预测、系统预测等,展现出了重要的理论价值和实际应用价值。
2.本课题研究的意义和价值
经过近30年的发展,灰色系统理论无论在实际应用还是理论研究方面,都取得了较大的发展,其有效性和实用性已得到广泛证明,但作为一门新兴横断学科,其理论体系还有待于进一步丰富和完善。本文的研究成果对促进灰色系统基础理论的研究、丰富与完善灰色预测模型理论体系、改善灰色模型对特殊序列的模拟及预测效果、拓展灰色预测模型的应用范围,促进灰色预测模型与实际问题的有效对接,均具有重要意义。
目前可以进行数据预测的方法可以概括为整例删除、期望最大化、回归预测、多重填补以及缺失森林算法。然而这些算法对于数据模型的分布以及数据种类的数目各有不同的要求。目前常见的数据预测算法,计算的准确度与数据的样本数量息息相关,通常而言当数据的样本量越大时,数据预测的准确度越高。但数据的采集以及数据带来的噪声,会给结果带来很大的影响。异常的数据会导致预测的结果发生不可控的变化。而本课题通过学习灰模型理论相关算法,并在对算法有一定了解的基础上进行改良,优化对医学数据的预测研究,对于数据的要求比传统的数据预测算法低很多。仅仅需要少量的数据就可以对后面的数据进行预测研究,且通常结果表现良好。在如今大数据时代,对数据预测提供了新的可能和方向。
3.参考文献
[1]Akbar K Waljee, AshinMukherjee, mit G Singal, et al.Comparison of imputation methods for missinglaboratory data in medicine[J].Author affiliations, 2013,3(8):2047.
[2] Junninen H, Niska H, Tuppurainen K, et al. Methods forimputation of missing values in air quality data sets[J]. AtomsphericEnvironment, 2004, 38(18):2895-2907.
以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。