文献综述(或调研报告):
上市公司新闻对其股价趋势的影响研究:基于文本分析
摘要:股票市场作为金融市场的重要组成部分,在金融领域中具有举足轻重的地位。无论是在学术领域还是股票投资领域,人们都对股票市场的预测研究充满极大兴趣。本文主要介绍了关于股票市场预测的相关理论以及新闻对股市预测的影响的国内外研究现状。以期在前人研究的基础上,为股市预测提供新思路,提升其准确率。
关键词: 新闻;股票市场;数据挖掘;股市预测
有效市场假说是与价格预测相关的主要金融理论(Fama, 1970)[1]。这个假说认为,股票价格受到一股强大的矫正力量的影响,即时反映了所有可获得的信息,如果价格不能很好地反映公众信息,那么理性的投资者就会以此获得利益。因此,预测股票收益是不可能的。然而,自上世纪90年代以来,越来越多的行为金融学研究者提出的实证表明,股票市场是能够由投资者心理驱动的,正如理性投资者通过交易套利来消除错误定价,非理性投资者也能通过交易套利来消除合理定价[2]。这一发现在行为金融学中有多种解释,例如,错误归因偏差,它认为人们会根据自己的情绪状态做出风险决定(Johnson amp; Tversky, 1983)[3]。
预测股价趋势是一个难题,因为股价本质上是对随机变量的反应,而随机变量又代表了投资者对公司价值的未来预期。为了更好预测股价,国内外学者做了大量研究。股票市场预测领域主流的研究大致分为计量经济学建模和基于数据挖掘的预测方法。国内外众多学者尝试使用数据挖掘的方法对股票市场进行预测。于志军等(2015)[4]通过灰色神经网络模型初步预测股票收益率,然后引入指数广义自回归条件异方差模型,对预测误差进行 矫正。张贵生等(2016)[5]在广义自回归条件异方差模型的基础上,利用 SVM 来处理高维非线性的股票数据。Ding 等(2017)[6]在利用小波分解处理数据的基础上,使用多层神经网络模型进行训练,最后通过小波重构模型进行股票价格预测。
随着金融理论指出,股票价格的变化是对新信息的回应,市场价格代表投资者对公司未来价值的预期,越来越多人认为新闻文章的意见可能代表外生变量作用于短期价格预测。国外针对基于财经新闻文本的股票预测研究较为丰富。2007年,Tetlock[7]利用华尔街日报“Abreast of the Market”专栏的文章发现,媒体的高度悲观情绪预测了短期内股票价格将承受下行压力,随后会回归基本面,并且异常悲观或异常乐观影响着市场交易量的高低。2008年[8],他又利用Harvard-IV-4心理词典对新闻媒体的报道进行情感分类,进而研究其与股票收益之间的关系。Kaplanski[9]发现情绪愉快的投资者对股票市场有着更为积极的态度、更高的收益预期以及更低的风险预期。Makrehchi等(2013)[10]提出了一种能够自动识别社交媒体文本倾向标签的方法,在整合每日情感倾向的基础上开展股票收益预测。Puri等(2017)[11]利用N-Gram提取词汇,通过匹配情感词典得到每个词汇的情感倾向,最终得到新闻文本的整体情感倾向。Audrino 等(2020)[12]通过扩展异质性自回归(HAR)模型,通过增加情绪、注意力和一组全面的经济变量构建HAR,经济-HAR和情感-HAR模型,来实现对股市波动的预测。
相比而言,国内相关研究虽然起步较晚,但对这个领域的研究也日益深入。陈海文等(2016)[13]通过统计新闻文本中的金融情感词词频来计算情感倾向值,并融入金融品种的历史价格序列等变量,从而提出了一种基于财经新闻信息挖掘的金融市场价格走势预测的方法。陈晓红等(2016)[14]基于新浪微博文本数据,运用情感分析技术构建了情绪指数,进而分别考察了情绪指数对股票收盘价格和交易量的影响。武慧锋(2017)[15]运用词频统计法,从词汇的情感角度对收集的 98 万篇新闻报道进行了统计分析,探讨了新闻中正负面词汇的出现频率对股票价格的影响,结论显示,正面词汇出现频率高的股票能获得更高的超额收益。李正辉等(2018)[16]运用Fama-French三因子模型计算沪深300指成份股的特质波动率,并将媒体信息的关注度、媒体情感、媒体关注度与媒体情感的交互作用纳入统一的计量分析模型中,综合探究媒体信息对金融资产价格波动的影响。岑咏华等(2019)[17]引入基于长短期记忆模型的深度学习方法挖掘文本情感,提取财经媒介信息情感倾向性以及波动性指标,与此同时, 基于上证指数和沪深 300指数的收盘价对数增量和成交量及其对数增量构建相关指标,在此基础上构建自回归分布滞后模型和面板数据模型, 通过模型比较、系数分析等对财经媒介信息与股票市场表现和个股价格间的关联影响进行揭示和讨论。
基于文本情感分析的投资者情绪研究主要以新闻文章和社交媒体信息等不同类型的媒介为数据来源,运用基于情感词典或基于机器学习的分析方法挖掘文本情感,进而研究投资者情绪对资产价格和股票市场的影响。然而,已有文本情感与股票市场表现关联影响的研究仍然存在一些问题:(1)已有研究大多使用单一种类的文本数据对文本情感与股票市场的关系进行研究,情感数据样本选择的局限性可能带来结果的偏差;(2)实际股票市场中发布的新闻,很多都不包含鲜明的情感倾向,多是对客观事件的总结和报道,对于这类新闻,难以分析其蕴含的情绪;(3)文本情感分析普遍基于词典的情感词简单抽取和频次统计方法或者传统的分类模型。基于词典的情感词,在不同语境下可能包含不同的情感、指向不同的对象,简单抽取情感词可能给新闻的情感分析带来噪音;(4)鉴于新闻的时效与股市的变动,需要设置一个较短的时间窗口,比如单交易日甚至更短的时间,而相当一部分已有研究对于这一问题的处理存在不足;(5)媒介情感与股票市场表现的相关性仍然存在一定争议。尽管上述许多研究证实了媒介信息所蕴涵情绪信号对于股票市场格的预测能力,仍有一些研究并没有发现媒介信息情感对股票价格走势的显著影响效应,如Kim 等(2014)[18]通过使用91家公司在雅虎上发布的超过3200万条信息的大数据集,在2005年1月至2010年12月期间,发现没有证据表明投资者情绪预测未来的股票回报。
综上,有关媒介信息对于金融市场价格以及投资者交易行为的作用效应尚需在全面的数据来源、精细的情感分析方法、及时的情感反应机制基础上以及在宏观和微观等不同层面结合中国国情补充新的实证证据。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。