CN109670542A - 一种基于评论外部信息的虚假评论检测方法 - Google Patents
一种基于评论外部信息的虚假评论检测方法 Download PDFInfo
- Publication number
- CN109670542A CN109670542A CN201811508152.7A CN201811508152A CN109670542A CN 109670542 A CN109670542 A CN 109670542A CN 201811508152 A CN201811508152 A CN 201811508152A CN 109670542 A CN109670542 A CN 109670542A
- Authority
- CN
- China
- Prior art keywords
- comment
- vector
- word
- false
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种基于评论外部信息的虚假评论检测方法,该方法通过对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,将评论及其标签数据组按照4:1的比例分割成训练组与测试组,然后对训练组与测试组进行文本预处理,建立虚假评论检测模型,利用卷积神经网络来提取外部属性向量,利用加入注意力机制的长短期记忆网络提取评论内容向量,并在特征提取之后将在线性组合层中将提取的特征进行线性组合。本方法可以实现所有国际电商英文评论的虚假检测,具有较好的通用性,本检测方法的精度达到了81.4%,能够胜任大部分的检测任务。
Description
技术领域
本发明涉及服务计算技术领域,具体涉及一种基于评论外部信息的虚假评论检测方法。
背景技术
随着互联网业务的发展,为了可以让用户根据自己的意图和其他消费者的评价来决定购买意向,各大电子商务平台开发了各种用户反馈机制,其中产品评价系统是最普及一种。由于许多用户在电商平台上倾向于在做出购买决定之前阅读相关的产品评论,所以某些不法者在电商平台利用评价系统注入大量虚假评论来左右产品的销量以达到盈利的目的。根据一些研究人员的统计,虚假评论占Yelp网站的14-20%,在Tripadvisor,Orbitz,Priceline和Expedia中有2-6%的假评论。在这种情况下,要有效识别虚假评论已成为一个中心问题,确保网上评论成为值得信赖的意见材料,提供发展健康有序的产品反馈环境。为了有效识别这类评论,一些学者使用基于浅层、显性语义特征的方法,虽然取得了一定成果,但是检测效果不尽人意。
因此,在互联网商品信息、用户评论数量的飞速增长下,提供一个准确的虚假评论检测方法可以解决产品评价系统检测的关键技术问题。
发明内容
针对现有的虚假评论检测方法存在的检测准确度不高的问题,本发明提供了一种基于评论外部信息的虚假评论检测方法。
本发明采用以下的技术方案:
一种基于评论外部信息的虚假评论检测方法,包括以下步骤:
步骤1:收集商品评论文档,对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,评论及其标签数据组包括评论内容集、外部属性集和标签集,将评论及其标签数据组按照4:1的比例分割成训练组与测试组;
步骤2:对训练组与测试组进行文本预处理:使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one-hot向量;
步骤3:将卷积神经网络与加入注意力机制的长短期记忆网络通过向量连接操作建立虚假评论检测模型,使用步骤2中训练组得到的评论内容词向量和外部属性词向量训练虚假评论检测模型,不断修改虚假评论检测模型参数使分类效果达到最优;
利用虚假评论检测模型对测试组得到的评论内容词向量和外部属性词向量进行分类,验证虚假评论检测模型准确度。
优选地,步骤1中对评论内容加标签的过程为:将虚假嫌疑大的评论内容标注为“0”,虚假嫌疑大评论内容是指评论内容具有非常规特征,非常规特征包括评论内容的长度过长或过短、评价星级过低或过高、有价值的反馈过少和存在大量重复内容;将其它评论内容标注为“1”,利用人工对标记好的评论进行微调。
优选地,所述步骤2,具体包括以下子步骤:
步骤2.1:使用Word2Vec模型训练训练组和测试组,得到每个单词的向量表示,所有单词的向量表示成为字典;
步骤2.2:基于步骤2.1中得到的向量表示进行映射,遍历训练组与测试组中的每一个单词,如果单词在字典中,则直接使用字典中对应的向量表示替换该单词;如果单词没有在词典中对应的向量表示,则将该单词丢弃;
经过多次迭代将评论内容集和外部属性集分别转化为评论内容词向量和外部属性词向量,从而将单词的向量特征嵌入空间,为基于评论外部信息的虚假评论检测模型构建输入。
优选地,所述步骤3包括将步骤2中的训练组得到的外部属性词向量输入到卷积神经网络内,将步骤2中的训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,提取特征向量后进行整合并分类,具体包括以下步骤:
步骤3.1:将训练组得到的外部属性词向量输入到卷积神经网络内:将句子中的第i个词表示为n维单词向量为xi∈Rn,令xi∈Rn+L表示输入的词向量,其中L是句子的长度;令K为滤波器的长度,向量Fi∈RK*n表示为卷积运算的第i个滤波器,对于输入向量j中的每个位置设置窗口向量Wj,将此位置的连续的k个单词向量表示为Wj={xi,xi+1,…,xi+k-1},则经过卷积运算得到每个窗口的特征向量rij=f(Fi*Wj+bi),其中bi是偏置量,N个窗口的特征向量为其中表示向量的列连接操作;
步骤3.2:在步骤3.1的同时,将训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,其工作流程是通过双向长短期记忆网络将输入的词向量处理成序列,设表示正向长短期记忆网络的输出序列,则表示反向长短期记忆网络输出序列,其中xtj表示输入的第t个句子St的第j个词向量;设Ctj是htj经过单层多层感知器得到的隐层输出;
Ctj=tanh(W*htj+b) (1)
其中,h代表词向量矩阵,W代表权重矩阵,b代表偏移量;
然后用向量uw来衡量每个单词的重要性,其中uw的参数是随机设置并自学习的,然后利用Softmax函数计算出每个词向量的权重值αtj,αtj控制不同单词向量对其分类结果的影响程度,计算如公式(2)所示:
其中,Ctj T代表Ctj的转置;
最后,乘以每个单词的权重矢量并输出整个句子St特征序列Bt=∑j(αtjhtj);
步骤3.3:在得到步骤3.1与步骤3.2提取的评论内容特征和评论外部属性特征后,需要有效的合并由两个分类器提取的特征,使用线性连接方法,如式(3)所示:
其中,A表示由卷积神经网络提取的外部属性特征,Bt表示由加入注意力机制的长短期记忆网络提取的评论内容特征,C表示在内容特征和属性特征相连接后的总特征向量,符号表示向量列连接操作;
步骤3.4:步骤3.3之后,由于虚假评论检测问题是一个二分类分体,所以使用sigmoid函数将总特征向量映射到0,1之间,映射函数如公式(4)所示:
步骤3.5:在步骤3.4之后,将sigmoid函数映射的结果与one-hot标签向量进行比对,若不相同,则通过反向传播算法对模型的参数进行调整;若相同,则参数不变,经过迭代后训练出最优参数。
本发明具有的有益效果是:
(1)可以实现所有国际电商英文评论的虚假检测,具有较好的通用性;
(2)单纯的基于评论内容的虚假检测方法效果不准确,本方法通过利用外部属性来增强评论的向量特征,外部属性包括长度、时间、标题、有价值的反馈数目等,提高了检测结果的准确性;
(3)利用提取独立特征的卷积神经网络来提取外部属性向量,让适用提取文本上下文特征的加入注意力机制的长短期记忆网络提取评论内容向量,可以保证提取特征的丰富性与准确性;
(4)使用线性列连接的方法将两个分类器提取的特征合理的组合,不会混乱或丢失特征。
(5)本检测方法的精度达到了81.4%,能够胜任大部分的检测任务。
附图说明
图1为基于评论外部信息的虚假评论检测方法的结构示意图。
图2为加入注意力机制的长短期记忆网络的注意力机制示意图。
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式做进一步说明:
结合图1至图2,一种基于评论外部信息的虚假评论检测方法,包括以下步骤:
步骤1:收集商品评论文档,对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,评论及其标签数据组包括评论内容集、外部属性集和标签集,将评论及其标签数据组按照4:1的比例分割成训练组与测试组;
外部属性集包括长度、时间、标题、有价值的反馈数目等。
其中,对评论内容加标签的过程为:将虚假嫌疑大的评论内容标注为“0”,虚假嫌疑大评论内容是指评论内容具有非常规特征,非常规特征包括评论内容的长度过长或过短、评价星级过低或过高、有价值的反馈过少和存在大量重复内容;将其它评论内容标注为“1”,利用人工对标记好的评论进行微调。
步骤2:对训练组与测试组进行文本预处理:使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one-hot向量;
所述步骤2,具体包括以下子步骤:
步骤2.1:使用Word2Vec模型训练训练组和测试组,得到每个单词的向量表示,所有单词的向量表示成为字典;
步骤2.2:基于步骤2.1中得到的向量表示进行映射,遍历训练组与测试组中的每一个单词,如果单词在字典中,则直接使用字典中对应的向量表示替换该单词;如果单词没有在词典中对应的向量表示,则将该单词丢弃;
经过多次迭代将评论内容集和外部属性集分别转化为评论内容词向量和外部属性词向量,从而将单词的向量特征嵌入空间,为基于评论外部信息的虚假评论检测模型构建输入。
步骤3:将卷积神经网络与加入注意力机制的长短期记忆网络通过向量连接操作建立虚假评论检测模型,使用步骤2中训练组得到的评论内容词向量和外部属性词向量训练虚假评论检测模型,不断修改虚假评论检测模型参数使分类效果达到最优;
利用虚假评论检测模型对测试组得到的评论内容词向量和外部属性词向量进行分类,验证虚假评论检测模型准确度。
步骤3包括将步骤2中的训练组得到的外部属性词向量输入到卷积神经网络(CNN)内,将步骤2中的训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络(AT-LSTM)内,提取特征向量后进行整合并分类,具体包括以下步骤:
步骤3.1:将训练组得到的外部属性词向量输入到卷积神经网络内:将句子中的第i个词表示为n维单词向量为xi∈Rn,令xi∈Rn+L表示输入的词向量,其中L是句子的长度;令K为滤波器的长度,向量Fi∈RK*n表示为卷积运算的第i个滤波器,对于输入向量j中的每个位置设置窗口向量Wj,将此位置的连续的k个单词向量表示为Wj={xi,xi+1,…,xi+k-1},则经过卷积运算得到每个窗口的特征向量rij=f(Fi*Wj+bi),其中bi是偏置量,N个窗口的特征向量为其中表示向量的列连接操作;
步骤3.2:在步骤3.1的同时,将训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,其工作流程是通过双向长短期记忆网络将输入的词向量处理成序列,设表示正向长短期记忆网络的输出序列,则表示反向长短期记忆网络输出序列,其中xtj表示输入的第t个句子St的第j个词向量;设Ctj是htj经过单层多层感知器得到的隐层输出;
Ctj=tanh(W*htj+b) (1)
其中,h代表词向量矩阵,W代表权重矩阵,b代表偏移量;
然后用向量uw来衡量每个单词的重要性,其中uw的参数是随机设置并自学习的,然后利用Softmax函数计算出每个词向量的权重值αtj,αtj控制不同单词向量对其分类结果的影响程度,计算如公式(2)所示:
其中,Ctj T代表Ctj的转置;
最后,乘以每个单词的权重矢量并输出整个句子St特征序列Bt=∑j(αtjhtj);
步骤3.3:在得到步骤3.1与步骤3.2提取的评论内容特征和评论外部属性特征后,需要有效的合并由两个分类器提取的特征,使用线性连接方法,如式(3)所示:
其中,A表示由卷积神经网络提取的外部属性特征,Bt表示由加入注意力机制的长短期记忆网络提取的评论内容特征,C表示在内容特征和属性特征相连接后的总特征向量,符号表示向量列连接操作;
步骤3.4:步骤3.3之后,由于虚假评论检测问题是一个二分类分体,所以使用sigmoid函数将总特征向量映射到0,1之间,映射函数如公式(4)所示:
步骤3.5:在步骤3.4之后,将sigmoid函数映射的结果与one-hot标签向量进行比对,若不相同,则通过反向传播算法对模型的参数进行调整;若相同,则参数不变,经过迭代后训练出最优参数。
实施例1
下面是应用本发明具体实施例:
使用黄金标准数据集来验证本方法。该评论数据集是从某网站收集的,共包含580万条评论和670万条产品,并且基于该数据集随机抽取20万条评论作为基本数据集。
执行步骤1,首先利用种子词“fake”定位到基本评论数据中的5个位置,然后在每个位置的上部和下部区间中各取500个数据,总共获得5000条数据。这些数据有较大的虚假嫌疑。然后从基本数据集中随机选择5,000条评论数据,这些数据由于随机选取所以虚假性较低。然后采用人工分类10,000个数据。分类标准取决于评论的文字内容和评论属性,评论属性包括有用反馈的数量,反馈的总数,评分,评论的时间长度,评论日期和标题共计6项。通过上述步骤,我们收集了10,000个带标签的评论数据,其中6037份为真正的评论,3963份为假评论。在训练模型时,我们将数据分成训练集和测试集,使用80/20进行分割,然后分割句子并使用NLTK2进行校正。
执行步骤2,使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one-hot向量。在使用Word2vec之后,每个单词都获得一个连续向量的表达。例如“书”的向量表示为[2.74845356e-01 1.56477005e+00 1.48353190e+00 2.04618478e-01...]。
步骤3,利用步骤2训练好的词向量输入到模型,其中模型参数如表1所示:
表1模型参数设置
在步骤3之后,模型参数基本固定后,用测试集对模型进行评价,评价结果如表2所示:
表2测试结果
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (4)
1.一种基于评论外部信息的虚假评论检测方法,其特征在于,包括以下步骤:
步骤1:收集商品评论文档,对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,评论及其标签数据组包括评论内容集、外部属性集和标签集,将评论及其标签数据组按照4∶1的比例分割成训练组与测试组;
步骤2:对训练组与测试组进行文本预处理:使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one-hot向量;
步骤3:将卷积神经网络与加入注意力机制的长短期记忆网络通过向量连接操作建立虚假评论检测模型,使用步骤2中训练组得到的评论内容词向量和外部属性词向量训练虚假评论检测模型,不断修改虚假评论检测模型参数使分类效果达到最优;
利用虚假评论检测模型对测试组得到的评论内容词向量和外部属性词向量进行分类,验证虚假评论检测模型准确度。
2.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,步骤1中对评论内容加标签的过程为:将虚假嫌疑大的评论内容标注为“0”,虚假嫌疑大评论内容是指评论内容具有非常规特征,非常规特征包括评论内容的长度过长或过短、评价星级过低或过高、有价值的反馈过少和存在大量重复内容;将其它评论内容标注为“1”,利用人工对标记好的评论进行微调。
3.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,所述步骤2,具体包括以下子步骤:
步骤2.1:使用Word2Vec模型训练训练组和测试组,得到每个单词的向量表示,所有单词的向量表示成为字典;
步骤2.2:基于步骤2.1中得到的向量表示进行映射,遍历训练组与测试组中的每一个单词,如果单词在字典中,则直接使用字典中对应的向量表示替换该单词;如果单词没有在词典中对应的向量表示,则将该单词丢弃;
经过多次迭代将评论内容集和外部属性集分别转化为评论内容词向量和外部属性词向量,从而将单词的向量特征嵌入空间,为基于评论外部信息的虚假评论检测模型构建输入。
4.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,所述步骤3包括将步骤2中的训练组得到的外部属性词向量输入到卷积神经网络内,将步骤2中的训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,提取特征向量后进行整合并分类,具体包括以下步骤:
步骤3.1:将训练组得到的外部属性词向量输入到卷积神经网络内:将句子中的第i个词表示为n维单词向量为xi∈Rn,令xi∈Rn+L表示输入的词向量,其中L是句子的长度;令K为滤波器的长度,向量Fi∈RK*n表示为卷积运算的第i个滤波器,对于输入向量j中的每个位置设置窗口向量Wj,将此位置的连续的k个单词向量表示为Wj={xi,xi+1,...,xi+k-1},则经过卷积运算得到每个窗口的特征向量rij=f(Fi*Wj+bi),其中bi是偏置量,N个窗口的特征向量为其中表示向量的列连接操作;
步骤3.2:在步骤3.1的同时,将训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,其工作流程是通过双向长短期记忆网络将输入的词向量处理成序列,段表示正向长短期记忆网络的输出序列,则表示反向长短期记忆网络输出序列,其中xtj表示输入的第t个句子St的第j个词向量;设Ctj是htj经过单层多层感知器得到的隐层输出;
Ctj=tanh(W*htj+b) (1)
其中,h代表词向量矩阵,W代表权重矩阵,b代表偏移量;
然后用向量uw来衡量每个单词的重要性,其中uw的参数是随机设置并自学习的,然后利用Softmax函数计算出每个词向量的权重值αtj,αtj控制不同单词向量对其分类结果的影响程度,计算如公式(2)所示:
其中,Ctj T代表Ctj的转置;
最后,乘以每个单词的权重矢量并输出整个句子St特征序列Bt=∑j(αtjhtj);
步骤3.3:在得到步骤3.1与步骤3.2提取的评论内容特征和评论外部属性特征后,需要有效的合并由两个分类器提取的特征,使用线性连接方法,如式(3)所示:
其中,A表示由卷积神经网络提取的外部属性特征,Bt表示由加入注意力机制的长短期记忆网络提取的评论内容特征,C表示在内容特征和属性特征相连接后的总特征向量,符号表示向量列连接操作;
步骤3.4:步骤3.3之后,由于虚假评论检测问题是一个二分类分体,所以使用sigmoid函数将总特征向量映射到0,1之间,映射函数如公式(4)所示:
步骤3.5:在步骤3.4之后,将sigmoid函数映射的结果与one-hot标签向量进行比对,若不相同,则通过反向传播算法对模型的参数进行调整;若相同,则参数不变,经过迭代后训练出最优参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811508152.7A CN109670542A (zh) | 2018-12-11 | 2018-12-11 | 一种基于评论外部信息的虚假评论检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811508152.7A CN109670542A (zh) | 2018-12-11 | 2018-12-11 | 一种基于评论外部信息的虚假评论检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109670542A true CN109670542A (zh) | 2019-04-23 |
Family
ID=66143570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811508152.7A Pending CN109670542A (zh) | 2018-12-11 | 2018-12-11 | 一种基于评论外部信息的虚假评论检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670542A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259140A (zh) * | 2020-01-13 | 2020-06-09 | 长沙理工大学 | 一种基于lstm多实体特征融合的虚假评论检测方法 |
CN111415171A (zh) * | 2020-02-24 | 2020-07-14 | 柳州达迪通信技术股份有限公司 | 一种基于sdh传输系统的数据采集校验系统 |
CN111428513A (zh) * | 2020-05-11 | 2020-07-17 | 安徽理工大学 | 一种基于卷积神经网络的虚假评论分析方法 |
CN111445271A (zh) * | 2020-03-31 | 2020-07-24 | 携程计算机技术(上海)有限公司 | 模型生成方法、作弊酒店的预测方法、系统、设备和介质 |
CN111737455A (zh) * | 2019-12-02 | 2020-10-02 | 北京京东尚科信息技术有限公司 | 文本识别方法、装置、电子设备和介质 |
CN112200638A (zh) * | 2020-10-30 | 2021-01-08 | 福州大学 | 一种基于注意力机制与双向gru网络的水军评论检测系统及方法 |
CN112417099A (zh) * | 2020-11-20 | 2021-02-26 | 南京邮电大学 | 一种基于图注意力网络的欺诈用户检测模型构建方法 |
CN112528010A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 知识推荐方法、装置、计算机设备及可读存储介质 |
CN112732921A (zh) * | 2021-01-19 | 2021-04-30 | 福州大学 | 一种虚假用户评论检测方法及系统 |
CN112765313A (zh) * | 2020-12-31 | 2021-05-07 | 太原理工大学 | 一种基于原文和评论信息分析算法的虚假信息检测方法 |
CN113076754A (zh) * | 2021-03-23 | 2021-07-06 | 山东师范大学 | 一种基于知识集成的虚假评论检测方法及系统 |
CN113393276A (zh) * | 2021-06-25 | 2021-09-14 | 食亨(上海)科技服务有限公司 | 评论数据的分类方法、装置和计算机可读介质 |
CN113592407A (zh) * | 2021-08-10 | 2021-11-02 | 深圳职业技术学院 | 一种商品售卖及配送方法和系统 |
CN115099888A (zh) * | 2022-06-14 | 2022-09-23 | 中国矿业大学(北京) | 一种基于注意力机制的用户评论有效性分析方法 |
CN117076812B (zh) * | 2023-10-13 | 2023-12-12 | 西安康奈网络科技有限公司 | 一种网络信息发布传播平台智能监测管理系统 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150497A1 (en) * | 2007-12-06 | 2009-06-11 | Mcafee Randolph Preston | Electronic mail message handling and presentation methods and systems |
CN102339445A (zh) * | 2010-07-23 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 对网络交易用户的可信度进行评价的方法和系统 |
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN104699766A (zh) * | 2015-02-15 | 2015-06-10 | 浙江理工大学 | 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法 |
CN105354305A (zh) * | 2015-11-05 | 2016-02-24 | 北京邮电大学 | 一种网络谣言的识别方法及装置 |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
CN107085616A (zh) * | 2017-05-31 | 2017-08-22 | 东南大学 | Lbsn中一种基于多维属性挖掘的虚假评论可疑地点检测方法 |
CN107256257A (zh) * | 2017-06-12 | 2017-10-17 | 上海携程商务有限公司 | 基于业务数据的异常用户生成内容识别方法及系统 |
CN107608956A (zh) * | 2017-09-05 | 2018-01-19 | 广东石油化工学院 | 一种基于cnn‑grnn的读者情绪分布预测算法 |
CN107818173A (zh) * | 2017-11-15 | 2018-03-20 | 电子科技大学 | 一种基于向量空间模型的中文虚假评论过滤方法 |
CN108345587A (zh) * | 2018-02-14 | 2018-07-31 | 广州大学 | 一种评论的真实性检测方法与系统 |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
CN108427670A (zh) * | 2018-04-08 | 2018-08-21 | 重庆邮电大学 | 一种基于语境词向量和深度学习的情感分析方法 |
CN108804417A (zh) * | 2018-05-21 | 2018-11-13 | 山东科技大学 | 一种基于特定领域情感词的文档级情感分析方法 |
CN108829801A (zh) * | 2018-06-06 | 2018-11-16 | 大连理工大学 | 一种基于文档级别注意力机制的事件触发词抽取方法 |
-
2018
- 2018-12-11 CN CN201811508152.7A patent/CN109670542A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150497A1 (en) * | 2007-12-06 | 2009-06-11 | Mcafee Randolph Preston | Electronic mail message handling and presentation methods and systems |
CN102339445A (zh) * | 2010-07-23 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 对网络交易用户的可信度进行评价的方法和系统 |
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN104699766A (zh) * | 2015-02-15 | 2015-06-10 | 浙江理工大学 | 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法 |
CN105354305A (zh) * | 2015-11-05 | 2016-02-24 | 北京邮电大学 | 一种网络谣言的识别方法及装置 |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
CN107085616A (zh) * | 2017-05-31 | 2017-08-22 | 东南大学 | Lbsn中一种基于多维属性挖掘的虚假评论可疑地点检测方法 |
CN107256257A (zh) * | 2017-06-12 | 2017-10-17 | 上海携程商务有限公司 | 基于业务数据的异常用户生成内容识别方法及系统 |
CN107608956A (zh) * | 2017-09-05 | 2018-01-19 | 广东石油化工学院 | 一种基于cnn‑grnn的读者情绪分布预测算法 |
CN107818173A (zh) * | 2017-11-15 | 2018-03-20 | 电子科技大学 | 一种基于向量空间模型的中文虚假评论过滤方法 |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
CN108345587A (zh) * | 2018-02-14 | 2018-07-31 | 广州大学 | 一种评论的真实性检测方法与系统 |
CN108427670A (zh) * | 2018-04-08 | 2018-08-21 | 重庆邮电大学 | 一种基于语境词向量和深度学习的情感分析方法 |
CN108804417A (zh) * | 2018-05-21 | 2018-11-13 | 山东科技大学 | 一种基于特定领域情感词的文档级情感分析方法 |
CN108829801A (zh) * | 2018-06-06 | 2018-11-16 | 大连理工大学 | 一种基于文档级别注意力机制的事件触发词抽取方法 |
Non-Patent Citations (3)
Title |
---|
张恒: "基于深度学习的虚假评论识别方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
皮琪: "基于深度学习的虚假评论识别系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
胡朝举等: "基于词向量技术和混合神经网络的情感分析", 《计算机应用研究》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737455A (zh) * | 2019-12-02 | 2020-10-02 | 北京京东尚科信息技术有限公司 | 文本识别方法、装置、电子设备和介质 |
CN111259140A (zh) * | 2020-01-13 | 2020-06-09 | 长沙理工大学 | 一种基于lstm多实体特征融合的虚假评论检测方法 |
CN111259140B (zh) * | 2020-01-13 | 2023-07-28 | 长沙理工大学 | 一种基于lstm多实体特征融合的虚假评论检测方法 |
CN111415171A (zh) * | 2020-02-24 | 2020-07-14 | 柳州达迪通信技术股份有限公司 | 一种基于sdh传输系统的数据采集校验系统 |
CN111445271A (zh) * | 2020-03-31 | 2020-07-24 | 携程计算机技术(上海)有限公司 | 模型生成方法、作弊酒店的预测方法、系统、设备和介质 |
CN111428513A (zh) * | 2020-05-11 | 2020-07-17 | 安徽理工大学 | 一种基于卷积神经网络的虚假评论分析方法 |
CN112200638A (zh) * | 2020-10-30 | 2021-01-08 | 福州大学 | 一种基于注意力机制与双向gru网络的水军评论检测系统及方法 |
CN112417099B (zh) * | 2020-11-20 | 2022-10-04 | 南京邮电大学 | 一种基于图注意力网络的欺诈用户检测模型构建方法 |
CN112417099A (zh) * | 2020-11-20 | 2021-02-26 | 南京邮电大学 | 一种基于图注意力网络的欺诈用户检测模型构建方法 |
CN112528010A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 知识推荐方法、装置、计算机设备及可读存储介质 |
CN112765313A (zh) * | 2020-12-31 | 2021-05-07 | 太原理工大学 | 一种基于原文和评论信息分析算法的虚假信息检测方法 |
CN112732921A (zh) * | 2021-01-19 | 2021-04-30 | 福州大学 | 一种虚假用户评论检测方法及系统 |
CN112732921B (zh) * | 2021-01-19 | 2022-06-14 | 福州大学 | 一种虚假用户评论检测方法及系统 |
CN113076754A (zh) * | 2021-03-23 | 2021-07-06 | 山东师范大学 | 一种基于知识集成的虚假评论检测方法及系统 |
CN113393276A (zh) * | 2021-06-25 | 2021-09-14 | 食亨(上海)科技服务有限公司 | 评论数据的分类方法、装置和计算机可读介质 |
CN113393276B (zh) * | 2021-06-25 | 2023-06-16 | 食亨(上海)科技服务有限公司 | 评论数据的分类方法、装置和计算机可读介质 |
CN113592407A (zh) * | 2021-08-10 | 2021-11-02 | 深圳职业技术学院 | 一种商品售卖及配送方法和系统 |
CN115099888A (zh) * | 2022-06-14 | 2022-09-23 | 中国矿业大学(北京) | 一种基于注意力机制的用户评论有效性分析方法 |
CN115099888B (zh) * | 2022-06-14 | 2023-01-06 | 中国矿业大学(北京) | 一种基于注意力机制的用户评论有效性分析方法 |
CN117076812B (zh) * | 2023-10-13 | 2023-12-12 | 西安康奈网络科技有限公司 | 一种网络信息发布传播平台智能监测管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670542A (zh) | 一种基于评论外部信息的虚假评论检测方法 | |
Pham et al. | Semantic labeling: a domain-independent approach | |
CN108874768B (zh) | 一种基于主题情感联合概率的电子商务虚假评论识别方法 | |
CN105279495B (zh) | 一种基于深度学习和文本总结的视频描述方法 | |
CN103903164B (zh) | 基于领域信息的半监督方面自动提取方法及其系统 | |
CN107315738B (zh) | 一种文本信息的创新度评估方法 | |
CN105550269A (zh) | 一种有监督学习的产品评论分析方法及系统 | |
Chang et al. | Research on detection methods based on Doc2vec abnormal comments | |
CN109492105B (zh) | 一种基于多特征集成学习的文本情感分类方法 | |
CN106599032A (zh) | 一种结合稀疏编码和结构感知机的文本事件抽取方法 | |
Fan et al. | Multi-task neural learning architecture for end-to-end identification of helpful reviews | |
CN111401040A (zh) | 一种适用于word文本的关键词提取方法 | |
CN102880631A (zh) | 一种基于双层分类模型的中文作者识别方法及其装置 | |
Scrivens et al. | Sentiment-based classification of radical text on the web | |
Lu et al. | Exploring the sentiment strength of user reviews | |
Arya et al. | News web page classification using url content and structure attributes | |
CN106649264A (zh) | 一种基于篇章信息的中文水果品种信息抽取方法及装置 | |
CN101213539A (zh) | 交叉描述符学习系统、方法及其程序产品 | |
TWM584469U (zh) | 理財新聞可信度評價裝置 | |
Stöckl | Detecting Satire in the News with Machine Learning | |
Vogel et al. | Bot and Gender Identification in Twitter using Word and Character N-Grams. | |
CN110019814B (zh) | 一种基于数据挖掘与深度学习的新闻信息聚合方法 | |
Meng et al. | Regional bullying text recognition based on two-branch parallel neural networks | |
Verma et al. | Opinion mining considering roman words using Jaccard similarity algorithm based on clustering | |
Iftikhar et al. | Fake news detection using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190423 |