基于云平台的数据异常检测文献综述

 2022-08-03 15:17:26

文献综述

1.云计算

云计算快速发展,为我们提供了分布式计算的能力,使数据的处理更加高效、便捷。

云计算动态供应硬件、软件和数据集,以此方式按需应用一个拥有弹性资源的虚拟化平台。其目的是通过在数据中心使用服务器集群和巨型数据库而将桌面计算转移到一个面向服务的平台。云计算充分利用其低成本与简单的特性既惠及用户也惠及提供商。机器虚拟化使这样的成本效益成为可能。云计算意在同时满足许多用户应用程序的需要。云生态系统必须设计得具有安全性、可信性和可靠性。有些计算机用户将云视为一个集中式资源池,而另外一些计算机用户则认为云是一个在所用的各个服务器上实行分布式计算的服务器集群。

传统上,一个分布式计算系统往往由一个自主管理域(如一个研究实验室或公司)为内部计算需要而拥有和使用。然而,这些传统系统遭遇数个性能瓶颈:系统维护需要不断进行;利用率差;与硬件/软件升级有关的费用日益增长。作为一种按需计算范式,云计算可解决这些问题或可使我们摆脱这些问题。

2.异常检测

异常检测是对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外 。

异常检测作为机器学习的一个小分支,在各行业中有广泛的应用。并且提出了很多针对异常检测的算法,高斯分布的异常检测、KNN,LOF,SVM等经典的算法。

在国外的研究基础上,国内提出了很多改进的算法。虽然我国的研究相对国外较晚,但也有一些著名的算法,在工业生产上非常实用。比如:南京大学周志华老师在2010年提出一个异常检测算法Isolation Forest,时间效率高,能有效处理高维数据和海量数据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。