CN107392654A - 一种电子商务产品评论质量鉴别系统 - Google Patents
一种电子商务产品评论质量鉴别系统 Download PDFInfo
- Publication number
- CN107392654A CN107392654A CN201710536714.8A CN201710536714A CN107392654A CN 107392654 A CN107392654 A CN 107392654A CN 201710536714 A CN201710536714 A CN 201710536714A CN 107392654 A CN107392654 A CN 107392654A
- Authority
- CN
- China
- Prior art keywords
- comment
- similar
- module
- false
- quality discrimination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种电子商务产品评论质量鉴别系统,包括:评论文档构建模块、相似评论筛选模块、相似ID提取模块以及评论质量鉴别模块;评论文档构建模块,用于抓取评论数据,同时将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;相似评论筛选模块,用于从产品评论文档内筛选相似评论;相似ID提取模块,用于从产品评论文档内提取出相似ID;评论质量鉴别模块,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID,能够鉴别出目标商品评价中的虚假评论,判断结果可靠性高。
Description
技术领域
本发明属于电子商务领域,尤其涉及一种电子商务产品评论质量鉴别系统。
背景技术
在当代,随着互联网的普及,电子商务已经成为一种被广泛利用的商业贸易方式。买卖双方主要是通过电商的网页或者是软件进行交易活动。由于电子商务没有传统的实体店面,对销售人员的数量要求也不高,所以相比传统交易模式更能够控制运营成本,因而有着更大的价格优势。但是,有很多不法商家为了提高自己的销量从而雇佣专业刷评价团队也制造大量的虚假评论来对自己的商品进行虚假的宣传,从而欺骗消费者来提高自己的真实销量。
目前电子商务的发展迅猛,体量巨大,电商环境中的卖家数量众多,用户在进行购买决定时难以判断商品描述的真实性,对商品评价的依赖度很高,由于卖家评价作弊而造成的商品的性能好评度虚高的情况引起的买家利益损失的情况严重。在这样的情况下,如何对电子商务中商家的评价作弊行为进行识别和判断成电子商务发展过程中亟待解决的问题;在判断虚假评论过程中如何提高判断的准确性,避免误判情况的发生也是十分重要的考量因素;目前现有技术中还缺乏准确有效的相关设备实现产品评论质量的鉴别。
发明内容
本发明实施例提供一种电子商务产品评论质量鉴别系统,旨在解决现有技术中还缺乏准确有效的相关设备实现产品评论质量的鉴别的问题。
本发明实施例是这样实现的,一种电子商务产品评论质量鉴别系统,包括:评论文档构建模块、相似评论筛选模块、相似ID提取模块以及评论质量鉴别模块;其中,所述评论文档构建模块,用于抓取评论数据,同时将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;所述相似评论筛选模块,用于从产品评论文档内筛选出相似评论;所述相似ID提取模块,用于从产品评论文档内提取出相似ID;所述评论质量鉴别模块,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。
优选地,所述评论文档构建模块输出端分别与所述相似评论筛选模块、所述相似ID提取模块的输入端连接;所述评论质量鉴别模块分别与所述显示评论筛选模块、所述相似ID提取模块的输出端连接。
优选地,所述评论质量鉴别模块,包括:
接收单元,用于接收相似评论筛选模块筛选出的相似评论和相似ID提取模块提取出的相似ID;
匹配单元,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配;以及
虚假评论标识单元,用于根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。
优选地,所述系统还包括:标识起始时间录入模块,用于对评论质量鉴别模块内标识的虚假ID录入标识起始时间。
优选地,所述系统还包括:存储模块,用于存储已标识的虚假ID。
优选地,所述系统还包括:虚假ID定时删除模块,用于根据虚假ID录入的标识起始时间和当前系统时间,计算出该虚假ID在存储模块内存储的时间值,并将该时间值与预设的时间阈值进行比对,当该时间值大于预设的时间阈值时,则从存储模块内删除该虚假ID。
优选地,所述时间阈值为30~60天。
优选地,所述系统还包括:数据冗余判断模块,与所述评论质量鉴别模块、所述虚假ID存储模块连接,用于判断评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID是否相同。
优选地,所述系统还包括:相同虚假ID删除模块,用于当评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID相同时,则删除评论质量鉴别模块内标识的虚假ID。
本发明实施例提供的电子商务产品评论质量鉴别系统,通过评论文档构建模块抓取评论数据,将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;并通过相似评论筛选模块从产品评论文档内筛选出相似评论;相似ID提取模块,从产品评论文档内提取出相似ID;最后通过评论质量鉴别模块根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID,能够鉴别出目标商品评价中的虚假评论,判断结果可靠性高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
以下附图仅旨在于对本发明做示意性说明和解释,并不限定本发明的范围。
图1是本发明实施例提供的一种电子商务产品评论质量鉴别系统的结构示意图;
图2是本发明实施例提供的评论质量鉴别模块的结构示意图;
图3是本发明实施例提供的另一种电子商务产品评论质量鉴别系统的结构示意图;
图4是本发明实施例提供的又一种电子商务产品评论质量鉴别系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供的电子商务产品评论质量鉴别系统,通过评论文档构建模块抓取评论数据,将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;并通过相似评论筛选模块从产品评论文档内筛选出相似评论;相似ID提取模块,从产品评论文档内提取出相似ID;最后通过评论质量鉴别模块根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID,能够鉴别出目标商品评价中的虚假评论,判断结果可靠性高。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,在本发明实施例中,一种电子商务产品评论质量鉴别系统100,包括:评论文档构建模块110、相似评论筛选模块120、相似ID提取模块130以及评论质量鉴别模块140;其中,所述评论文档构建模块110,用于抓取评论数据,同时将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;所述相似评论筛选模块120,用于从产品评论文档内筛选出相似评论;所述相似ID提取模块130,用于从产品评论文档内提取出相似ID;所述评论质量鉴别模块140,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。能够鉴别出目标商品评价中的虚假评论,判断结果可靠性高。
在本发明实施例中,所述评论文档构建模块110输出端分别与所述相似评论筛选模块120、所述相似ID提取模块130的输入端连接;所述评论质量鉴别模块140分别与所述显示评论筛选模块120、所述相似ID提取模块130的输出端连接。
在本发明实施例中,如图2所示,所述评论质量鉴别模块140,包括:接收单元141,用于接收相似评论筛选模块筛选出的相似评论和相似ID提取模块提取出的相似ID;匹配单元142,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配;以及虚假评论标识单元143,用于根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。
在本发明实施例中,如图3所示,所述系统100还包括:标识起始时间录入模块150、存储模块160和虚假ID定时删除模块170。其中,所述标识起始时间录入模块150,用于对评论质量鉴别模块内标识的虚假ID录入标识起始时间。所述存储模块160,用于存储已标识的虚假ID。所述虚假ID定时删除模块170,用于根据虚假ID录入的标识起始时间和当前系统时间,计算出该虚假ID在存储模块内存储的时间值,并将该时间值与预设的时间阈值进行比对,当该时间值大于预设的时间阈值时,则从存储模块内删除该虚假ID。
在本实施例中,所述时间阈值可为30~60天。例如,当所述时间阈值为30天,所述标识起始时间录入模块对评论质量鉴别模块内标识的一虚假ID录入的标识起始时间为2011-06-06,当前系统时间为2011-07-06,则所述虚假ID定时删除模块删除存储模块内存储的改虚假ID;又如,当所述时间阈值为45天,所述所述标识起始时间录入模块对评论质量鉴别模块内标识的一虚假ID录入的标识起始时间为2011-06-06,当前系统时间为2011-07-21,则所述虚假ID定时删除模块删除存储模块内存储的改虚假ID;再如,当所述时间阈值为60天,所述所述标识起始时间录入模块对评论质量鉴别模块内标识的一虚假ID录入的标识起始时间为2011-06-06,当前系统时间为2011-08-06,则所述虚假ID定时删除模块删除存储模块内存储的改虚假ID。
在本发明实施例中,如图4所示,所述系统100还包括:数据冗余判断模块180和相同虚假ID删除模块190。其中,所述数据冗余判断模块180,与所述评论质量鉴别模块、所述虚假ID存储模块连接,用于判断评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID是否相同。所述相同虚假ID删除模块190,用于当评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID相同时,则删除评论质量鉴别模块内标识的虚假ID。例如,当存储模块内存储有一虚假ID为123456,所述数据库冗余模块识别出评论质量鉴别模块内标识的虚假ID为123456,则相同虚假ID删除模块将评论质量鉴别模块内标识的虚假ID中ID为123456的虚假ID删除。
上述发明实施例提供的电子商务产品评论质量鉴别系统,通过评论文档构建模块抓取评论数据,将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;并通过相似评论筛选模块从产品评论文档内筛选出相似评论;相似ID提取模块,从产品评论文档内提取出相似ID;最后通过评论质量鉴别模块根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID,能够鉴别出目标商品评价中的虚假评论,判断结果可靠性高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种电子商务产品评论质量鉴别系统,其特征在于,包括:评论文档构建模块、相似评论筛选模块、相似ID提取模块以及评论质量鉴别模块;其中,所述评论文档构建模块,用于抓取评论数据,同时将评论数据按商品类别进行分类构建与商品相对应的产品评论文档;所述相似评论筛选模块,用于从产品评论文档内筛选出相似评论;所述相似ID提取模块,用于从产品评论文档内提取出相似ID;所述评论质量鉴别模块,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配,并根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。
2.如权利要求1所述的电子商务产品评论质量鉴别系统,其特征在于,所述评论文档构建模块输出端分别与所述相似评论筛选模块、所述相似ID提取模块的输入端连接;所述评论质量鉴别模块分别与所述显示评论筛选模块、所述相似ID提取模块的输出端连接。
3.如权利要求1所述的电子商务产品评论质量鉴别系统,其特征在于,所述评论质量鉴别模块,包括:
接收单元,用于接收相似评论筛选模块筛选出的相似评论和相似ID提取模块提取出的相似ID;
匹配单元,用于根据产品评论文档将筛选出的相似评论和提取出的相似ID进行匹配;以及
虚假评论标识单元,用于根据匹配结果抓取出ID和评论都相似的产品评论,并将抓取的ID和评论都相似的产品评论标识为虚假评论,以及将所述虚假评论对应的ID标识为虚假评论ID。
4.如权利要求3所述的电子商务产品评论质量鉴别系统,其特征在于,还包括:标识起始时间录入模块,用于对评论质量鉴别模块内标识的虚假ID录入标识起始时间。
5.如权利要求4所述的电子商务产品评论质量鉴别系统,其特征在于,还包括:存储模块,用于存储已标识的虚假ID。
6.如权利要求5所述的电子商务产品评论质量鉴别系统,其特征在于,还包括:虚假ID定时删除模块,用于根据虚假ID录入的标识起始时间和当前系统时间,计算出该虚假ID在存储模块内存储的时间值,并将该时间值与预设的时间阈值进行比对,当该时间值大于预设的时间阈值时,则从存储模块内删除该虚假ID。
7.如权利要求6所述的电子商务产品评论质量鉴别系统,其特征在于,所述时间阈值为30~60天。
8.如权利要求7所述的电子商务产品评论质量鉴别系统,其特征在于,还包括:数据冗余判断模块,与所述评论质量鉴别模块、所述虚假ID存储模块连接,用于判断评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID是否相同。
9.如权利要求8所述的电子商务产品评论质量鉴别系统,其特征在于,还包括:相同虚假ID删除模块,用于当评论质量鉴别模块内标识的虚假ID与存储模块内存储的虚假ID相同时,则删除评论质量鉴别模块内标识的虚假ID。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710536714.8A CN107392654A (zh) | 2017-07-04 | 2017-07-04 | 一种电子商务产品评论质量鉴别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710536714.8A CN107392654A (zh) | 2017-07-04 | 2017-07-04 | 一种电子商务产品评论质量鉴别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107392654A true CN107392654A (zh) | 2017-11-24 |
Family
ID=60335032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710536714.8A Pending CN107392654A (zh) | 2017-07-04 | 2017-07-04 | 一种电子商务产品评论质量鉴别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392654A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874768A (zh) * | 2018-05-16 | 2018-11-23 | 山东科技大学 | 一种基于主题情感联合概率的电子商务虚假评论识别方法 |
WO2019006642A1 (zh) * | 2017-07-04 | 2019-01-10 | 深圳齐心集团股份有限公司 | 一种电子商务产品评论质量鉴别系统 |
WO2020117249A1 (en) * | 2018-12-06 | 2020-06-11 | Visa International Service Association | Systems and methods for intelligent product reviews |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150378A (zh) * | 2013-03-13 | 2013-06-12 | 珠海市君天电子科技有限公司 | 一种鉴定微博广告中虚假好评的方法 |
CN104867017A (zh) * | 2015-05-16 | 2015-08-26 | 成都数联铭品科技有限公司 | 电子商务客户虚假评价识别系统 |
-
2017
- 2017-07-04 CN CN201710536714.8A patent/CN107392654A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150378A (zh) * | 2013-03-13 | 2013-06-12 | 珠海市君天电子科技有限公司 | 一种鉴定微博广告中虚假好评的方法 |
CN104867017A (zh) * | 2015-05-16 | 2015-08-26 | 成都数联铭品科技有限公司 | 电子商务客户虚假评价识别系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019006642A1 (zh) * | 2017-07-04 | 2019-01-10 | 深圳齐心集团股份有限公司 | 一种电子商务产品评论质量鉴别系统 |
CN108874768A (zh) * | 2018-05-16 | 2018-11-23 | 山东科技大学 | 一种基于主题情感联合概率的电子商务虚假评论识别方法 |
CN108874768B (zh) * | 2018-05-16 | 2019-04-16 | 山东科技大学 | 一种基于主题情感联合概率的电子商务虚假评论识别方法 |
WO2020117249A1 (en) * | 2018-12-06 | 2020-06-11 | Visa International Service Association | Systems and methods for intelligent product reviews |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Heydari et al. | Detection of fake opinions using time series | |
WO2019091177A1 (zh) | 风险识别模型构建和风险识别方法、装置及设备 | |
TWI673666B (zh) | 資料風險控制的方法及裝置 | |
US11663655B2 (en) | Augmenting online transaction statements using e-commerce receipts | |
AU2002244117B2 (en) | System and method for depicting on-line transactions | |
WO2020143377A1 (zh) | 一种行业识别模型确定方法和装置 | |
Schouten et al. | Finding implicit features in consumer reviews for sentiment analysis | |
CN103577988A (zh) | 一种识别特定用户的方法和装置 | |
CN107392654A (zh) | 一种电子商务产品评论质量鉴别系统 | |
CN109409964B (zh) | 优质品牌的识别方法及装置 | |
CN107358502A (zh) | 一种电子商务信息推送系统 | |
CN107818295A (zh) | 物品读取装置及控制方法、终端设备 | |
US20130304539A1 (en) | User recommendation method and device | |
CN107220239A (zh) | 一种基于大数据处理的电子商务中有效评论的特征提取方法 | |
JP6947185B2 (ja) | 異常検出装置、制御方法、及びプログラム | |
Sadman et al. | Detect review manipulation by leveraging reviewer historical stylometrics in amazon, yelp, facebook and google reviews | |
WO2017032056A1 (zh) | 基于销售终端套现的确定方法及装置 | |
JP6141677B2 (ja) | 電子ジャーナルデータの分析システム | |
KR102206001B1 (ko) | 사용자 행위에 기반한 전자서적 추천 장치 및 방법 | |
US20150363786A1 (en) | Methods, systems, and articles of manufacture for fingerprinting signatures and enhanced signature capturing for charge card transactions on mobile communication devices | |
US20130290107A1 (en) | Behavior based bundling | |
CN106339872A (zh) | 数据处理方法及装置 | |
CN108921568A (zh) | 一种区块链数字货币中欺诈行为的检测方法及系统 | |
CN115049411A (zh) | 刷单用户检测方法、装置、设备及存储介质 | |
CN105046511B (zh) | 基于信息采集盒的商品交易信息在线采集系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171124 |