在线学习和通用预测的问题文献综述

 2022-09-26 17:10:53

  1. 文献综述(或调研报告):

摘要:随着信息技术的迅猛发展,尤其是互联网行业的广泛应用,越来越多的领域出现了对海量、高速到达的数据实施处理需求。如何从浩瀚的“数据海洋”中挖掘出有用的知识变得尤为重要。传统批处理模式的机器学习算法在面临大数据时变得力不从心,而在线学习通过流式计算框架,在内存中直接对数据进行实施运算,为大数据的学习提供了有力的工具,这类在线学习框架有望应对大数据下机器学习任务面临的困境与挑战。本文总结了经典和主流的在线学习算法,主要包括:(1)在线线性学习算法;(2)基于核的在线学习算法;(3)其他经典的在线学习算法;本文介绍了在线学习于深度学习结合方法的研究现状,展望了在线学习下一步的研究方向。

关键词:在线学习;核;深度学习

引言

随着自媒体、物联网和云计算等新兴技术的快速发展,产生了类别繁多,形态各异的海量数据,各类应用正全面进入大数据时代。各行各业的业务数据大多数情况下可以看作动态到达的流式数据。与传统数据相比较,流式数据具有如下特点:动态性,无序性,无限性,突发性,体积大。传统学习方法归根结底是对某一静态数据分布的学习,没有提供学习数据分布变化规律的方法。这类分布随时间变化的数据称为非稳定数据或演化数据。

针对此类呈数据流形态到达的数据,传统的批处理式学习方法存在如下问题

(1)学习时间长、学习效率低

(2)难以针对增量数据有效地更新模型,导致难以有效地使模型适应数据中发生的概念迁移和概念演化问题

而在线学习算法的流式计算模式则非常契合这类数据的特点,在大规模流式数据的处理中非常有效。一方面,为提高海量数据的学习效率,在线学习鉴定训练数据是连续到达的,每次训练只利用当前到达的样本更新模型,从而降低学习复杂度;另一方面,通过读取一次片段数据并在训练完后保留少量的样本、按照时间先后次序利用数据流对模型进行更新,从而保留最新的类别信息。在线学习自提出以来已经发展出许多算法及其变种,根据模型是线性还是非线性模型,将在线学习算法分为两大类:在线线性学习算法和基于核的在线学习算法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。