基于计算机与软件考试的时空挖掘方法研究
(文献综述)
随着计算机与网络技术的快速发展,数据的积累呈着爆炸性的增长,在数据库中的知识发现和数据挖掘(knowledge discovery and data mining,简称KDDM)受到当今国际人工智能与数据库界的广泛重视。KDDM的目的是从海量的数据中提取人们感兴趣的,有价值的知识和重要信息,其中,时间序列数据越来越普及,如股市交易指数,气象观测等。时间序列数据挖掘(time series data mining)将会是一个非常自然而又重要的方向,所以对时间序列数据的研究是非常有必要的。
1 时间序列
1.1 定义
对某一个或某一组变量x(t)进行观察测量,将在一系列时刻t1,t1,,,tn得到的离散数据组成序列集合{x(t1),x(t2),,,x(tn)},记为X={x(t1),x(t2),,,x(tn)}。X时间序列数据。若对象x(t)有两个或两个以上的变量,则X为多元时间序列。
1.2 时间序列的预处理
时间序列数据与普通的静态数据相比较,具有规模大、维数高等特点,直接对原始时间序列进行计算不仅数据处理量大,而且受到冗余信息的干扰,算法的可靠性和准确性也会降低。为了更好的描述时间序列,做到在对时间序列降低维度压缩的同时还能保留原始序列的主要形态特征。在很多应用领域中,人们关心的是时间序列在某个时间段内的变化模式和规律,时间序列模式表示恰恰能满足这类领域的要求。对时间序列的表示应根据具体实际问题而定,选择合适的时间序列表示方法不仅能够在大幅度降低时间序列数据维度的同时,对时间序列做进一步分析,还可以更简单的刻画出时间序列的本质,例如,时间序列的极值点、趋势变化、波动频率、幅度等特征。此方法大大加深对时间序列的理解和把握,为进一步分析、比较奠定了基础,目前已经提出了许多时间序列表示方法,如离散小波变换(Discrete Wavelet Transform,DWT)、分段聚合近似(Piecewise Aggregate Appruximation,PAA)、分段线性化(Pecewise Linear Appruximation,PLA)、转折点技术(Landmarks)等。
1)DWT是最常用的一种时间序列表示方法,Haar小波变换则是DWT变换中研究最深入的一种。由于Haar小波变换基函数的不平滑性,它对时间序列的表示则近似梯形结构。时间序列从时域由此方法采用小波变换映射到频域,它用很少的低频系数表示原始时间序列,小波变换主要是对时间序列进行时间轴上的降维。然而,时间序列即使历时较短,变换过后仍然会存在大量的低频系数,且其不直观,对噪声也敏感。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。