近几年,情感分析和观点挖掘成为热门的研究之一,这些研究均假设观点资源是真实可信的。然而,在很多产品评论网站,评论者们可能书写虚假的评论——即包含错误的正向或者恶意的负向观点的评论,这引起了国内外相关学者的广泛关注。目前,国内外已经开展了针对产品垃圾评论识别的研究工作,并取得了一定的成果。但是,这些工作却忽略了产品垃圾评论的两个特性:模型的稳定性及语料的不平衡性。这两个特性均会对垃圾评论的识别产生影响,忽略它们将导致识别精度降低。因此,本文针对产品垃圾评论识别展开研究,设计了融合多特征的产品垃圾评论识别原型系统,并对系统的每个功能模块进行了简要描述。该系统有效结合了显著性特征与随机森林模型的优点,克服了使用全部评论特征易引起过度拟合以及数据集不平衡引起分类误差较大的问题。
书籍详述: |
|
ISBN-13: |
978-3-639-73828-5 |
ISBN-10: |
3639738284 |
EAN: |
9783639738285 |
书籍语言: |
中文 |
By (author) : |
敏 吴 |
页数 : |
60 |
出版于: |
29.03.2016 |
分类: |
Informatics, IT |