基于时间序列与用户情感分析的产品评分与评论的文献综述
摘要:物联网兴起之后,电商也走进了大众的世界,消费者对该商品或服务给出了自己的评价与评分,而如何利用该信息来分析产品声誉趋势去确定未来销售方式以及分析评分与评论的关系成为了一件很有研究意义的事情,对于此类相关为题,有学者提出来从满意度角度入手,建立声誉维度评价矩阵,基于时间序列进行分析,提出了融合评分矩阵和评论文本的HFT推荐模型以及DTMF模型。故本研究将结合相关理论,对2020年美国大学生数学建模比赛中提供的数据进行分析。
关键词:时间序列 声誉维度评价矩阵 HFT推荐模型 DTMF模型
一、文献综述
笔者有幸参加2020年举办的美国大学生数学建模比赛,并对C题——A Wealth of Data进行了自己的思考与完成。三组数据过于庞大,时间跨度达,各个产品评论数量相差较大,在短短的比赛时间内完成是件极其匆忙的事,并由于考虑完成度,所选模型虽合适但较为简单。故在此对改进模型与更加完善利用数据,尤其是评论数据进行进一步完善与提高。
(一)基于时间度量,研究产品声誉趋势
题目要求“在每个数据集中识别并讨论基于时间的度量和模式,这些度量和模式可能表明产品在在线市场中的声誉在上升或下降。”则最终的目的是找到一个可度量的标准来体现该商品在在线市场中的声誉变化趋势,以此来确定未来的销售。对此,程晓根基于此类相似问题,程晓根从满意度的角度出发,客户对该商品越满意则代表它越好。以此来确定未来的销售情况。并用因子分析找出关联度最高的几个因素作为最终的度量标准来体现满意度。[1]
对商品的评价分为评分与评论两大方面,且评分受限制,可选项不多,评论虽然复杂多样,但更能代表消费者的想法,则如何对待与利用评论也是极其重要的,消费者各种词汇的评价汇合在一起构成了产品的声誉。Ghose et al首次提出Web2.0时代大量存在的在线评论可以应用到声誉领域研究中,并提供了基于在线评论测度卖家声誉的基本研究设想,其研究工作主要分为三个步骤:首先通过文本挖掘和语义分析抽取声誉的所有维度,然后针对每条评论抽取这 些维度及其评价词,如:假设维度1是发货速度,维度2是包装,维度3是服务,那么针对评论“我对快速交货印象深刻!服务真好!', 可以编码为:(快速,无,好),对某一产品的每一条评论均执行此类操作后,获得这个产品的声誉维度评价矩阵M(si),这是一个nxp的矩阵。其中n是属性维度数,p是评论数量。其次是计算声誉各维度的得分,这涉及到单条评论的权重问题,Ghose et al认为潜在购买者一般情况下均只查看前几页的在线评论,因而应对最近发表的评论赋于更高的权重,其提出的评论权重计算公式为:
(1)
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。