CN113779276A - 用于检测评论的方法和装置 - Google Patents
用于检测评论的方法和装置 Download PDFInfo
- Publication number
- CN113779276A CN113779276A CN202110040853.8A CN202110040853A CN113779276A CN 113779276 A CN113779276 A CN 113779276A CN 202110040853 A CN202110040853 A CN 202110040853A CN 113779276 A CN113779276 A CN 113779276A
- Authority
- CN
- China
- Prior art keywords
- comment
- attribute information
- detected
- similarity
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000013598 vector Substances 0.000 claims abstract description 183
- 238000013528 artificial neural network Methods 0.000 claims abstract description 75
- 230000002159 abnormal effect Effects 0.000 claims abstract description 73
- 238000001514 detection method Methods 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000012552 review Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 13
- 230000004927 fusion Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/381—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using identifiers, e.g. barcodes, RFIDs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例公开了用于检测评论的方法和装置。该方法的一具体实施方式包括:利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。该实施方式有助于提升检测结果的准确性。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于检测评论的方法和装置。
背景技术
随着移动终端和支付技术的不断发展,电商也随之稳步发展,越来越多的用户开始通过在电商平台进行消费以获取日常所需的各种物品或服务。目前的电商模式下,用户还不能亲自体验物品或服务,一般都是通过浏览其它消费者针对物品或服务的评论来判断该物品或服务是否符合自身的需求。
由于消费者对物品或服务的评论的重要性,使得电商平台或用户因为利益关系发布一些虚假评论。例如,商家通过好评返现或免费赠送礼品等方式,吸引消费者发表虚假评论,从而提升物品或服务的好评率,进而促进物品或服务的销售量等。此外,还有一些商家为了打压对手,通过雇佣个人或团体针对对手的物品或服务发布大量的评分较低的评论,以降低对手的物品或服务的好评率。虚假评论会严重影响电商平台秩序,也会误导消费者,对一些正常商家造成负面影响。
目前,常用的虚假评论的检测方法包括基于文本特征的检测。具体地,基于文本特的检测一般是根据评论文本训练词向量,然后利用深度学习等方法对评论文本进行检测。然而,许多虚假评论的发布者会故意模仿真实用户的评论发布虚假评论,导致基于本文特征越来越难区分真实评论和虚假评论。
发明内容
本公开的实施例提出了用于检测评论的方法和装置。
第一方面,本公开的实施例提供了一种用于检测评论的方法,该方法包括:利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在一些实施例中,图神经网络的训练数据通过如下步骤得到:将关系网络对应的节点对象集拆分为有标签对象集和无标签对象集,其中,对象的标签用于指示对象是否为异常评论的关联对象;对于无标签对象集中的对象,根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签;使用节点对象集中的各对象分别对应的标签作为训练数据。
在一些实施例中,节点对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在一些实施例中,节点对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及无标签对象集中的无标签对象的评论属性信息与有标签对象集中的有标签对象的评论属性信息之间的相似度通过如下步骤确定:确定无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度作为第一相似度;确定无标签对象的元属性信息与有标签对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
在一些实施例中,上述根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签,包括:确定该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度中的最大相似度;确定最大相似度对应的对象的标签作为该对象的标签。
在一些实施例中,上述利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,包括:根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,其中,目标对象集由待检测评论的关联对象在关系网络中的相邻节点表示的对象组成;确定从目标对象集中选取的对象对应的节点作为待检测评论的关联对象对应的节点的有效相邻节点;通过聚合有效相邻节点的特征信息和待检测评论的关联对象对应的节点的特征信息,得到待检测评论的关联对象的特征向量。
在一些实施例中,目标对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与关系网络对应的节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在一些实施例中,目标对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及对于目标对象集中的对象,该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度通过如下步骤确定:确定该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度作为第一相似度;确定该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
在一些实施例中,根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,包括:从目标对象集中的选取对应的相似度大于预设阈值的对象。
在一些实施例中,上述利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,包括:利用基于第一关系网络训练得到的第一图神经网络提取发布待检测评论的对象的第一特征向量,其中,第一关系网络中的节点表示发布评论的对象,第一关系网络中的边表示所连接的两个对象具有针对同一对象的评论;利用基于第二关系网络训练得到的第二图神经网络提取待检测评论所评论的对象的第二特征向量,其中,第二关系网络中的节点表示被评论的对象,第二关系网络中的边表示所连接的两个对象具有同一对象发布的评论。
在一些实施例中,上述根据关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果,包括:获取待检测评论的特征向量;根据第一特征向量、第二特征向量和待检测评论的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在一些实施例中,上述根据第一特征向量、第二特征向量和待检测评论的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果,包括:融合第一特征向量、第二特征向量和待检测评论的特征向量,得到融合后的特征向量;将融合后的特征向量输入至预先训练的评论检测模型,得到待检测评论的检测结果。
第二方面,本公开的实施例提供了一种用于检测评论的装置,该装置包括:提取单元,被配置成利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;生成单元,被配置成根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在一些实施例中,图神经网络的训练数据通过如下步骤得到:将关系网络对应的节点对象集拆分为有标签对象集和无标签对象集,其中,对象的标签用于指示对象是否为异常评论的关联对象;对于无标签对象集中的对象,根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签;使用节点对象集中的各对象分别对应的标签作为训练数据。
在一些实施例中,节点对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在一些实施例中,节点对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及无标签对象集中的无标签对象的评论属性信息与有标签对象集中的有标签对象的评论属性信息之间的相似度通过如下步骤确定:确定无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度作为第一相似度;确定无标签对象的元属性信息与有标签对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
在一些实施例中,上述根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签,包括:确定该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度中的最大相似度;确定最大相似度对应的对象的标签作为该对象的标签。
在一些实施例中,上述提取单元进一步被配置成:根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,其中,目标对象集由待检测评论的关联对象在关系网络中的相邻节点表示的对象组成;确定从目标对象集中选取的对象对应的节点作为待检测评论的关联对象对应的节点的有效相邻节点;通过聚合有效相邻节点的特征信息和待检测评论的关联对象对应的节点的特征信息,得到待检测评论的关联对象的特征向量。
在一些实施例中,目标对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与关系网络对应的节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在一些实施例中,目标对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及对于目标对象集中的对象,该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度通过如下步骤确定:确定该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度作为第一相似度;确定该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
在一些实施例中,根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,包括:从目标对象集中的选取对应的相似度大于预设阈值的对象。
在一些实施例中,上述提取单元进一步被配置成:利用基于第一关系网络训练得到的第一图神经网络提取发布待检测评论的对象的第一特征向量,其中,第一关系网络中的节点表示发布评论的对象,第一关系网络中的边表示所连接的两个对象具有针对同一对象的评论;利用基于第二关系网络训练得到的第二图神经网络提取待检测评论所评论的对象的第二特征向量,其中,第二关系网络中的节点表示被评论的对象,第二关系网络中的边表示所连接的两个对象具有同一对象发布的评论。
在一些实施例中,上述生成单元进一步被配置成:获取待检测评论的特征向量;根据第一特征向量、第二特征向量和待检测评论的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在一些实施例中,上述生成单元进一步被配置成:融合第一特征向量、第二特征向量和待检测评论的特征向量,得到融合后的特征向量;将融合后的特征向量输入至预先训练的评论检测模型,得到待检测评论的检测结果。
第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的用于检测评论的方法和装置,通过基于关系网络预先训练的图神经网络提取待检测评论所评论的对象或发布待检测评论的对象的特征向量,然后再根据得到的关联对象的特征向量对待检测评论进行检测。由于关系网络可以表征不同对象的历史评论之间的预设关联,从而基于图神经网络的特征提取方法可以更全面地考虑到评论和评论的发布者或评论所评论的对象之间的关联关系,再结合虚假评论等异常评论的一些如评论时间较集中,被评论的对象具有大量异常评论、许多异常评论的发布者可能相同等特点,使得利用基于图神经网络的特征提取的特征向量可以较好地区分正常评论与异常评论,从而提升检测结果的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的用于检测评论的方法的一个实施例的流程图;
图3是根据本公开的实施例中的图神经网络的训练数据的获取方法的一个实施例的示意图;
图4是根据本公开的实施例中的图神经网络提取待检测评论的关联对象的特征向量的方法的一个实施例的示意图;
图5是根据本公开的用于检测评论的方法的又一个实施例的流程图;
图6是根据本公开的用于检测评论的方法的一个应用场景的示意图;
图7是根据本公开的用于检测评论的装置的一个实施例的结构示意图;
图8是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的用于检测评论的方法或用于检测评论的装置的实施例的示例性架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用。例如,浏览器类应用、购物类应用、社交类应用、即时通信工具等等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如为终端设备101、102、103提供支持的后端服务器。服务器105可以接收终端设备101、102、103发送的待检测评论,然后对待检测评论进行检测,得到检测结果。之后,服务器105可以将检测结果反馈给终端设备101、102、103。
需要说明的是,上述待检测评论也可以直接存储在服务器105的本地,服务器105可以直接提取本地所存储的待检测评论并进行处理,此时,可以不存在终端设备101、102、103和网络104。
需要说明的是,本公开的实施例所提供的用于检测评论的方法一般由服务器105执行,相应地,用于检测评论的装置一般设置于服务器105中。
还需要指出的是,终端设备101、102、103中也可以安装有评论检测类工具。此时,用于检测评论的方法也可以由终端设备101、102、103执行,相应地,用于检测评论的装置也可以设置于终端设备101、102、103中。此时,示例性系统架构100可以不存在服务器105和网络104。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本公开的用于检测评论的方法的一个实施例的流程200。该用于检测评论的方法包括以下步骤:
步骤201,利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量。
在本实施例中,关系网络中的节点可以表示对象,关系网络中的边可以表示所连接的两个对象的历史评论具有预设关联。关系网络可以预先由技术人员根据实际需求构建。例如,可以根据从一个或多个电商平台采集的历史评论构建关系网络,也可以从一些公开的数据集构建关系网络。
其中,关系网络中不同节点所表示的对象可以是不同评论的关联对象。每个评论的关联对象可以包括发布该评论的对象和/或该评论所评论的对象。例如,一个针对物品的评论,则该评论的关联对象可以包括该评论的发布者和/或该评论所评论的物品。
在不同的应用场景下,评论的关联对象的粒度可以不同。例如,发布评论的对象可以包括但不限于:用户、单位、第三方平台等等。评论所评论的对象可以包括但不限于:物品、服务、商家、店铺等等。
需要说明的是,关系网络中的各节点通常是相同类型的节点。换言之,关系网络中的节点可以均表示发布评论的对象,也可以均表示评论所评论的对象。
其中,预设关联可以根据实际的应用需求或应用场景预先设置的评论之间所具有的任意关联。例如,预设关联可以指两条评论的发布时间的时间差小于预设阈值。
可选地,预设关联可以指两条评论具有相同的关联对象。具体地,发布两条评论的对象可以相同,或者,两条评论所评论的对象可以相同。
由于许多异常评论(如虚假评论等)可能都是同一发布者所发布的,而且不同发布者可能针对同一对象发布大量的异常评论。因此,通过关系网络记录两条评论具有相同的关联对象,可以更好地训练图神经网络提取评论之间的这一关联关系,从而使得图神经网络的提取结果可以更准确地区分正常评论和异常评论。
图神经网络(Graph Neural Networks,GNN)是一类基于深度学习的处理图域信息的方法。图神经网络可以直接作用于图结构上,可以将整个图、图中的每个节点、每条边都转化为向量表示,再结合深度学习完成各种任务。例如,图神经网络可以用于节点分类。具体地,图神经网络可以学习每个节点的向量表示,以此确定每个节点对应的关联标签即类别。
在本实施例中,待检测评论可以是根据应用需求确定的任意评论。待检测评论的关联对象可以包括发布待检测评论的对象和/或待检测评论所评论的对象。待检测评论的特征向量(embedding)可以是用于表征待检测评论的特征。
预先训练得到的图神经网络可以对包括指示待检测评论的节点的关系网络进行处理,以提取到指示待检测评论的节点的特征向量即为待检测评论的特征向量。
需要说明的是,待检测评论的关联对象仅包括发布待检测评论的对象时,可以利用基于第一关系网络训练得到的第一图神经网络提取用于表征发布待检测评论的对象的特征的第一特征向量。其中,第一关系网络中的不同节点可以表示不同评论的发布者,第一关系网络中的边可以表示所连接两个发布者具有针对同一对象的评论,即两个发布者发布过针对同一对象的评论。举例来说,两个节点之间存在边可以表示两个节点分别指示的发布者针对同一物品或服务发布过评论。
待检测评论的关联对象仅包括待检测评论所评论的对象时,可以利用基于第二关系网络训练得到的第二图神经网络提取用于表征待检测评论所评论的对象的特征的第二特征向量。其中,第二关系网络中的不同节点可以表示不同评论所评论的对象,第二关系网络中的边可以表示所连接的两个对象具有同一对象发布的评论,即两个对象被同一发布者评论过。举例来说,两个节点之间存在边可以表示两个节点分别指示的物品或服务被同一用户评论过。
待检测评论的关联对象包括发布待检测评论的对象和待检测评论所评论的对象时,可以利用上述第一图神经网络和第二图神经网络分别提取发布待检测评论的对象的特征向量和待检测评论所评论的对象的特征向量。
还需要说明的是,上述第一关系网络、第二关系网络、第一图神经网络、第二图神经网络、第一特征向量、第二特征向量只是用于区分不同的关系网络、图神经网络、特征向量等,并不对关系网络、图神经网络、特征向量构成特殊限定。
在本实施例中,图神经网络可以基于预先获取的训练数据,利用机器学习的方法训练得到。例如,训练数据可以包括图神经网络中的每个节点表示的对象的类别标签,然后训练利用图神经网络学习节点的特征向量,并根据节点的特征向量对节点进行分类,同时以训练数据中每个节点的类别标签所指示的类别作为期望输出,训练得到图神经网络。
其中,训练数据中的类别标签可以预先从第三方数据平台或由人工标注的方式得到。以上述第一图神经网络作为示例,其对应的训练数据中的类别标签可以用于指示第一关系网络中的每个节点所表示的发布评论的对象是否发布过异常评论。以上述第二图神经网络作为示例,其对应的训练数据中的类别标签可以用于指示第二关系网络中的每个节点所表示的评论所评论的对象是否具有异常评论。
其中,训练所使用的图神经网络的类型和结构可以由技术人员根据实际的应用需求预先设置。例如,初始图神经网络可以是未经训练的或现有的未训练完成的图卷积网络。
步骤202,根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在本实施例中,异常评论的类型可以预先根据时间的应用需求或应用场景灵活设置。例如异常评论包括但不限于:虚假评论、带有强烈的个人偏见的评论、为了增加评论总数而发布的无关评论等等。
在得到待检测评论的关联对象的特征向量之后,可以灵活采用各种方法生成待检测评论的检测结果。
例如,可以预先采集若干异常评论的关联对象的特征向量,然后分别确定待检测评论的关联对象的特征向量与预先采集的各个异常评论的关联对象的特征向量之间的相似度,并确定得到的各个相似度的平均值。若得到的平均值的大于预设阈值,可以认为待检测评论为异常评论。对应地,若得到的平均值不大于预设阈值,可以认为待检测评论为正常评论。
可选地,可以利用预先训练的评论检测模型对待检测评论的关联对象的特征向量进行处理,以得到待检测评论的检测结果。其中,评论检测模型可以用于表征评论的关联对象的特征向量与评论的检测结果之间的对应关系。
评论检测模型可以基于预先获取的训练数据,利用机器学习的方法训练得到。例如,训练数据可以包括若干异常评论的特征向量和若干正常评论的特征向量。初始评论检测模型可以是技术人员构建的或现有的一些分类模型等,然后将训练数据中的特征向量作为初始评论检测模型的输入,将输入的特征向量对应的评论类别(如正常或异常)作为期望输出,基于梯度下降和反向传播等算法训练得到评论检测模型。
可选地,可以获取用于表征待检测评论的特征的特征向量,然后根据得到的待检测评论的关联对象的特征向量和待检测评论的特征向量生成待检测评论的检测结果。例如,可以利用预先训练的评论检测模型对待检测评论的特征向量和待检测评论的关联对象的特征向量进行处理,得到待检测评论的检测结果。
又例如,可以先融合待检测评论的特征向量和待检测评论的关联对象的特征向量,然后根据融合结果得到待检测评论的检测结果。其中,可以采用现有的各种特征融合方法对待检测评论的特征向量和待检测评论的关联对象的特征向量进行融合。例如,可以直接拼接将待检测评论的特征向量和待检测评论的关联对象的特征向量,得到融合结果。在得到融合结果之后,可以利用预先训练的评论检测模型对融合结果进行处理,得到待检测评论的检测结果。
由此可以结合待检测评论本身的特征和待检测评论的关联对象的特征,更全面地对待检测评论进行检测分析,从而有助于提升检测结果的准确性。
需要说明的是,在待检测评论的关联对象包括发布待检测评论的对象和待检测评论所评论的对象时,可以得到用于表征发布待检测评论的对象的特征的第一特征向量和用于表征待检测评论所评论的对象的特征的第二特征向量。此时,可以结合第一特征向量和第二特征向量,生成待检测评论的检测结果。
本公开的上述实施例提供的方法根据异常评论具有的一些如评论时间较集中,被评论的对象具有大量异常评论、许多异常评论的发布者可能相同等特点,利用基于关系网络预先训练的图神经网络学习评论和评论的发布者或评论所评论的对象之间的关联关系,由此来提升针对异常评论的检测结果的准确性。
继续参见图3,图3是本公开的实施例中的图神经网络的训练数据的获取方法的一个实施例的示意图300。图神经网络的训练数据可以通过如下步骤得到:
步骤301,将关系网络对应的节点对象集拆分为有标签对象集和无标签对象集。
在本实施例中,关系网络对应的节点对象集可以由关系网络中的各个节点分别表示的对象组成。对象的标签可以用于指示对象是否为异常评论的关联对象。在一些情况下,如一些电商平台具有海量的评论数据,但是这些评论数据中只有少量的评论数据可以确定是异常评论或不是异常评论,大部分的评论数据都无法判断其是否是异常评论。
在异常评论的关联对象包括发布待检测评论的对象时,有标签对象集中的各对象可以具有对应的标签,即可以确定有标签对象集中的每个对象历史发布过异常评论或没有发布过异常评论。无标签对象集中的各对象则没有对应的标签,即还无法确定无标签对象集中的每个对象是否发布过异常评论。
在异常评论的关联对象包括待检测评论所评论的对象时,有标签对象集中的各对象可以具有对应的标签,即可以确定有标签对象集中的每个对象的历史评论中包括异常评论或不包括异常评论。无标签对象集中的各对象则没有对应的标签,即还无法确定无标签对象集中的每个对象的历史评论中是否包括异常评论。
步骤302中,对于无标签对象集中的对象,根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签。
在本实施例中,节点对象集中的对象的评论属性信息可以用于表示对象的各种属性。根据对象的不同或应用场景、应用需求的不同,对象的评论属性信息可以不同。一般地,可以根据异常评论的特点设置对象的评论属性信息。
例如,一般地,发布异常评论的对象会集中在某段时间内发布大量评论,因此这些对象发布的评论通常具有评论总数较少、好评率较高、差评率较低、最近一次发布的评论与首次发布的评论的发布时间差较短等特点。
基于此,对象为发布评论的对象时,对象的评论属性信息可以包括但不限于:对象发布过的评论的总数目、对象发布的评论对应的好评率(即对象发布的表示好评的评论总数与发布过的评论总数的商)和差评率(即对象发布的表示差评的评论总数与发布过的评论总数的商)、对象最近一次发布的评论与该对象首次发布的评论的发布时间差等。
又例如,一般地,异常评论所评论的对象通常好评率较高、差评率较低、并且接收到的最新的评论与接收到的第一条评论的发布时间差较短、历史时间段内针对该对象的交易数目较少等特征。
基于此,对象为评论所评论的对象时,对象的评论属性信息可以包括但不限于:对象接收到的最新的评论与接收到的第一条评论的发布时间差、接收到的评论的好评率和差评率、历史时间段内针对该对象的交易数目等等。
需要说明的是,具体所使用的评论属性信息可以根据实际的应用场景进行设置。例如,不同的电商平台的异常评论可能具有不同的特点,同一个电商平台在不同时间段的异常评论也可能具有不同的特点。因此,所使用的评论属性信息可以灵活设置。
可选地,节点对象集中的对象的评论属性信息可以包括关联属性信息。其中,节点对象集中的每个对象的关联属性信息可以表示该对象的历史评论分别与节点对象集中的其它各对象的历史评论之间是否具有预设关联。
预设关联可以指根据实际的应用需求或应用场景预先设置的评论之间所具有的任意关联。可选地,预设关联可以指关系网络中的边所对应的预设关系。
在关系网络中的每个节点表示发布评论的对象时,对象的历史评论可以包括该对象历史发布过的评论。此时,预设关联可以指两条评论所评论的对象(如物品或服务)相同。对于节点对象集中的每个对象,该对象的关联属性信息可以表示该对象分别与节点对象集中的其它各个对象是否针对同一对象(如物品或服务)发布过评论。
例如,节点对象集包括对象A、B、C和D,对于对象A,对象A与B针对物品X都发布过评论,则对象A和B之间具有预设关联。对象A与C针对物品Y都发布过评论,则对象A与C之间具有预设关联。对象A与D没有针对同一物品发布过评论,则对象A和D之间不具有预设关联。
在关系网络中的每个节点表示评论所评论的对象时,对象的历史评论可以包括该对象具有的各历史评论。此时,预设关联可以指两条评论的发布者相同。对于节点对象集中的每个对象,该对象的关联属性信息可以表示该对象分别与节点对象集中的其它各个对象是否具有同一发布者所发布的评论。
例如,节点对象集包括对象E、F、G和H,对于对象E,对象E与F都具有发布者M发布的评论,则对象E和F之间具有预设关联。对象E与G都具有发布者N发布的评论,则对象E和G之间具有预设关联。对象E与H没有同一发布者所发布的评论,则对象E和H之间不具有预设关联。
可选地,节点对象集中的对象的评论属性信息除了上述关联属性信息之外,还可以包括元属性信息。需要说明的是,元属性信息不包括关联属性信息。
其中,元属性信息可以指对象发布过的历史评论所具有的一些基本属性。例如,对象为发布评论的对象时,元属性信息包括但不限于:对象发布过的评论的总数目、对象发布的评论对应的好评率和差评率、对象最近一次发布的评论与该对象首次发布的评论的发布时间差等。对象为评论所评论的对象时,对象的元属性信息可以包括但不限于:对象接收到的最新的评论与接收到的第一条评论的发布时间差、接收到的评论的好评率和差评率、历史时间段内针对该对象的交易数目等等。
对于无标签对象集中的每个对象,可以利用现有的各种相似度计算方法(如余弦相似度、欧式距离等等)计算该对象分别与有标签对象集中的各对象的评论属性信息之间的相似度,得到相似度集。
可选地,在节点对象集中的对象的评论属性信息包括关联属性信息和元属性信息时,对于无标签对象集中的每个无标签对象,可以通过如下步骤确定该无标签对象的评论属性信息与有标签对象集中的每个有标签对象的评论属性信息之间的相似度:
步骤一,确定无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度作为第一相似度。
在本步骤中,可以利用现有的各种相似度计算方法计算无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度。例如,可以使用基于欧式距离的相似度计算方法计算无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度。
步骤二,确定无标签对象的元属性信息与有标签对象的元属性信息之间的相似度作为第二相似度。
在本步骤中,可以利用现有的各种相似度计算方法计算无标签对象的元属性信息与有标签对象的元属性信息之间的相似度。例如,可以使用基于余弦相似度的相似度计算方法计算无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度。
步骤三,根据第一相似度与第二相似度的加权和,确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
在本步骤中,可以先获取针对关联属性信息和元属性信息分别设置的权重,然后计算第一相似度与第二相似度的加权和。在得到第一相似度与第二相似度的加权和之后,可以根据实际的应用场景灵活根据计算得到的加权和确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
例如,可以直接使用得到的第一相似度与第二相似度的加权和作为无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。又例如,可以对得到的第一相似度与第二相似度的加权和进一步处理(如乘以预设的经验值等),并使用进一步得到的处理结果作为无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
在得到相似度集后,可以根据得到的相似度集和实际的应用需求,灵活采用各种方法确定该对象的标签。
例如,可以根据有标签对象集中的各对象具有的标签,将有标签对象集划分为第一对象集和第二对象集,其中,第一对象集中的对象具有的标签可以指示对象为异常评论的关联对象。第二对象集中的对象具有的标签可以指示对象不是异常评论的关联对象。
然后,从得到的相似度集中选取第一对象集中的各对象分别对应的相似度得到第一相似度集,并计算第一相似度集中的各相似度的平均值。同时从得到的相似度集中选取第二对象集中的各对象分别对应的相似度得到第二相似度集,并计算第二相似度集中的各相似度的平均值。然后确定两个平均值中的最大值,若第一相似度集对应的平均值大于第二相似度集对应的平均值,则使用第一对象集对应的标签作为无标签对象集中的该对象的标签。若第一相似度集对应的平均值不大于第二相似度集对应的平均值,则使用第二对象集对应的标签作为无标签对象集中的该对象的标签。
可选地,可以先确定得到的相似度集中的最大相似度,然后确定最大相似度对应的对象的标签作为该对象的标签。
步骤303,使用节点对象集中的各对象分别对应的标签作为训练数据。
在本步骤中,在得到无标签对象集中的各对象分别对应的标签之后,就可以利用有标签对象集和无标签对象集中的所有对象以及各对象的标签作为训练数据,基于关系网络训练得到图神经网络以提取关系网络中的节点的特征向量。
本公开的上述实施例提供过的方法通过利用带有标签的训练数据对无标签的训练数据进行标签标注,从而有效增加了训练数据的数量,且不需要花费过高的成本。对于一些大量的评论都无法确定对应标签,只有少量评论具有对应标签的情况,可以采用这种方法快速地扩充训练数据的数量,从而提升图神经网络的训练效果。另外,在对无标签数据进行标注时,根据异常评论具有的一些特点,选取评论的对象的一些评论属性信息进行相似度计算,并根据相似度计算结果进行标签标注,可以提升针对无标签数据的标注结果的准确度。
进一步参考图4,图4是本公开的实施例中的图神经网络提取待检测评论的关联对象的特征向量的方法的一个实施例的示意图400。图神经网络提取待检测评论的关联对象的特征向量的方法包括如下步骤:
步骤401,根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象。
在本实施例中,目标对象集可以由待检测评论的关联对象在关系网络中对应的节点的相邻节点分别表示的对象组成。其中,对于关系网络中的每个节点,该节点的相邻节点可以指与该节点之间具有边的节点。
对象的评论属性信息可以用于表示对象的各种属性。根据对象的不同或应用场景、应用需求的不同,对象的属性信息可以不同。一般地,可以根据异常评论的特点设置对象的评论属性信息。
例如,一般地,发布异常评论的对象会集中在某段时间内发布大量评论,因此这些对象发布的评论通常具有评论总数较少、好评率较高、差评率较低、最近一次发布的评论与首次发布的评论的发布时间差较短等特点。
基于此,对象为发布评论的对象时,对象的评论属性信息可以包括但不限于:对象发布过的评论的总数目、对象发布的评论对应的好评率(即对象发布的表示好评的评论总数与发布过的评论总数的商)和差评率(即对象发布的表示差评的评论总数与发布过的评论总数的商)、对象最近一次发布的评论与该对象首次发布的评论的发布时间差等。
又例如,一般地,异常评论所评论的对象通常好评率较高、差评率较低、并且接收到的最新的评论与接收到的第一条评论的发布时间差较短、历史时间段内针对该对象的交易数目较少等特征。
基于此,对象为评论所评论的对象时,对象的评论属性信息可以包括但不限于:对象接收到的最新的评论与接收到的第一条评论的发布时间差、接收到的评论的好评率和差评率、历史时间段内针对该对象的交易数目等等。
可选地,待检测评论的关联对象的评论属性信息和目标对象集中的对象的评论属性信息可以包括关联属性信息。其中,每个对象的关联属性信息可以表示该对象的历史评论分别与关系网络对应的节点对象集中的其它各对象的历史评论之间是否具有预设关联。
预设关联可以指根据实际的应用需求或应用场景预先设置的评论之间所具有的任意关联。可选地,预设关联可以指关系网络中的边所对应的预设关系。
在关系网络中的每个节点表示发布评论的对象时,对象的历史评论可以包括该对象历史发布过的评论。此时,预设关联可以指两条评论所评论的对象(如物品或服务)相同。对于待检测评论的关联对象或目标对象集中的每个对象,该对象的关联属性信息可以表示该对象分别与节点对象集中的其它各个对象是否针对同一对象(如物品或服务)发布过评论。
在关系网络中的每个节点表示评论所评论的对象时,对象的历史评论可以包括该对象具有的各历史评论。此时,预设关联可以指两条评论的发布者相同。对于待检测评论的关联对象或目标对象集中的每个对象,该对象的关联属性信息可以表示该对象分别与节点对象集中的其它各个对象是否具有同一发布者所发布的评论。
可选地,待检测评论的关联对象的评论属性信息和目标对象集中的对象的评论属性信息除了上述关联属性信息之外,还可以包括元属性信息。需要说明的是,元属性信息不包括关联属性信息。
其中,元属性信息可以指对象发布过的历史评论所具有的一些基本属性。例如,对象为发布评论的对象时,元属性信息包括但不限于:对象发布过的评论的总数目、对象发布的评论对应的好评率和差评率、对象最近一次发布的评论与该对象首次发布的评论的发布时间差等。对象为评论所评论的对象时,对象的元属性信息可以包括但不限于:对象接收到的最新的评论与接收到的第一条评论的发布时间差、接收到的评论的好评率和差评率、历史时间段内针对该对象的交易数目等等。
在本实施例中,可以灵活采用现有的各种相似度计算方法(如余弦相似度、欧式距离等等)计算待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,得到相似度集。
可选地,在待检测评论的关联对象的评论属性信息和目标对象集中的对象的评论属性信息包括关联属性信息和元属性信息时,对于目标对象集中的每个对象,可以通过如下步骤确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度:
步骤一,确定该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度作为第一相似度。
在本步骤中,可以利用现有的各种相似度计算方法计算该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度。例如,可以使用基于欧式距离的相似度计算方法计算该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度。
步骤二,确定该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度作为第二相似度。
在本步骤中,可以利用现有的各种相似度计算方法计算该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度。例如,可以使用基于余弦相似度的相似度计算方法计算该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度。
步骤三,根据第一相似度与第二相似度的加权和,确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
在本步骤中,可以先获取针对关联属性信息和元属性信息分别设置的权重,然后计算第一相似度与第二相似度的加权和。在得到第一相似度与第二相似度的加权和之后,可以根据实际的应用场景灵活根据计算得到的加权和确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
例如,可以直接使用得到的第一相似度与第二相似度的加权和作为该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。又例如,可以对得到的第一相似度与第二相似度的加权和进一步处理(如乘以预设的经验值等),并使用进一步得到的处理结果作为该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
在计算出待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度之后,可以根据实际的应用需求使用各种方法从目标对象集中选取对象。例如,可以按照对应的相似度从大到小的顺序从目标对象集中选取预设数目个对象,其中,预设数目可以为目标对象集包括的对象的总数目的三分之二。
可选地,可以从目标对象集中选取对应的相似度大于预设阈值的对象。其中,预设阈值可以由技术人员预先设置。
步骤402,确定从目标对象集中选取的对象对应的节点作为待检测评论的关联对象对应的节点的有效相邻节点。
步骤403,通过聚合有效相邻节点的特征信息和待检测评论的关联对象对应的节点的特征信息,得到待检测评论的关联对象的特征向量。
在本实施例中,图神经网络在对关系网络中的每个节点时,可以通过聚合该节点的特征信息和该节点的有效相邻节点的特征信息,并根据聚合结果生成该节点的特征向量。其中,节点的特征信息可以指用于表示节点的特征的各种信息。例如,特征信息可以是各种形式的特征向量。
对于待检测评论的关联对象在关系网络中对应的节点,同样可以通过聚合该节点的特征信息和该节点的有效相邻节点的特征信息,并根据聚合结果生成该节点的特征向量。
需要说明的是,图神经网络根据需求可以执行一次或多次上述特征信息的聚合,并将最终的聚合结果作为节点的特征向量。
一般情况下,异常评论的数量是远远小于正常评论的数量的,因此,使用现有的随机选取相邻节点或选取所有相邻节点的方法时,对于异常评论对应的节点,很容易聚合到真实评论对应的节点的特征信息,从而导致图神经网络的特征提取结果不稳定。针对该问题,本公开的上述实施例提供的方法中图神经网络在提取关系网络中的每个节点的特征向量时,根据异常评论的特点,选取节点对应的评论属性信息并计算评论属性信息的相似度,然后根据相似度计算结果选取相邻节点,使用选取的相邻节点的特征信息和该节点的特征信息进行聚合生成该节点的特征向量,由此可以使得对于异常评论对应的节点,能够聚合到异常评论对应的节点的特征信息,从而提升图神经网络的特征提取结果的稳定性和准确度。
继续参考图5,其示出了用于检测评论方法的又一个实施例的流程500。该用于检测评论方法的流程500,包括以下步骤:
步骤501,利用基于第一关系网络训练得到的第一图神经网络提取发布待检测评论的对象的第一特征向量。
在本实施例中,第一关系网络中的不同节点可以表示不同评论的发布者,第一关系网络中的边可以表示所连接两个发布者具有针对同一对象的评论,即两个发布者发布过针对同一对象的评论。举例来说,两个节点之间存在边可以表示两个节点分别指示的发布者针对同一物品或服务发布过评论。
步骤502,利用基于第二关系网络训练得到的第二图神经网络提取待检测评论所评论的对象的第二特征向量。
在本实施例中,第二关系网络中的不同节点可以表示不同评论所评论的对象,第二关系网络中的边可以表示所连接的两个对象具有同一对象发布的评论,即两个对象被同一发布者评论过。举例来说,两个节点之间存在边可以表示两个节点分别指示的物品或服务被同一用户评论过。
步骤503,获取待检测评论的特征向量。
在本实施例中,待检测评论的特征向量可以用于表征待检测评论的特征。具体地,可以利用现有的各种自然语言处理方法提取待检测评论的特征向量。例如,可以利用预先训练的词向量提取模型提取待检测评论的特征向量。
根据不同的应用需求或应用场景,待检测评论的特征向量可以表征待检测评论的不同特征。例如,待检测评论的特征向量所表示的特征包括但不限于:待检测评论的发布时间、评分、文本特征。其中,待检测评论的文本特征包括但不限于:待检测评论中第一人称的词的使用频率、预设标点符号(如感叹号、问号等等)的使用比例、客观描述词的使用比例、待检测评论的长度等等。
步骤504,根据第一特征向量、第二特征向量和待检测评论的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在本实施例中,可以综合分析得到的第一特征向量、第二特征向量和待检测评论的特征向量,生成待检测评论的检测结果。
例如,可以利用预先训练的评论检测模型对第一特征向量、第二特征向量和待检测评论的特征向量进行处理,以得到待检测评论的检测结果。此时,评论检测模型用于表征待检测评论的发布者的第一特征向量、待检测评论所评论的对象的第二特征向量和待检测评论的特征向量,与待检测评论的检测结果之间的对应关系。
可选地,可以先融合第一特征向量、第二特征向量和待检测评论的特征向量,得到融合后的特征向量,然后,将融合后的特征向量输入至预先训练的评论检测模型,得到待检测评论的检测结果。
具体地,可以采用现有的各种特征融合方法对第一特征向量、第二特征向量和待检测评论的特征向量进行融合。例如,可以直接拼接第一特征向量、第二特征向量和待检测评论的特征向量得到融合结果。
在得到融合结果之后,再根据用于表征待检测评论的发布者的第一特征向量、待检测评论所评论的对象的第二特征向量和待检测评论的特征向量的融合结果与待检测评论的检测结果之间的对应关系的评论检测模型对待检测评论进行检测,从而得到检测结果。
继续参见图6,图6是根据本实施例的用于检测评论的方法的一个示意性的应用场景600。在图6的应用场景中,服务器602可以从终端601中的购物应用中获取用户B针对物品A发布的评论C。然后,利用基于该购物应用中的各评论的发布者构建的第一关系网络训练得到的第一图神经网络603得到表征用户B的特征的特征向量606,同时,利用基于该购物应用中被评论的个物品构建的第二关系网络训练得到的第二图神经网络604得到表征物品A的特征的特征向量607,另外,利用预先训练的用于提取文本向量的文本向量提取模型605提取评论C的特征向量608。
之后,可以对得到的特征向量606、特征向量607和特征向量608进行特征融合,得到融合结果609,然后将融合结果609输入至预先训练的评论检测模型610,得到针对评论C的检测结果611,接着可以将检测结果611发送至终端601,以使终端601对应的用户可以了解评论C是否是虚假评论。若评论C是虚假评论,终端601对应的用户可以删除评论C,并对物品A对应的商家和用户B发送相应提示。
本公开的上述实施例提供的方法利用针对评论的发布者和评论所评论的对象分别构建的关系网络训练得到第一图神经网络和第二图神经网络,然后利用第一图神经网络和第二图神经网络分别得到用于表征待检测评论的发布者的特征的特征向量和用于表征待检测评论所评论的对象的特征的特征向量,同时再结合用于表征待检测评论本身的特征的特征向量,对这三个特征向量进行融合,根据融合结果生成待检测评论的检测结果,由于异常评论在评论本身,以及评论的发布者和评论所评论的对象等方面都具有一些特点,因此,通过融合上述三个特征向量,可以更全面表征待检测评论的特征,并区分正常评论和异常评论,从而可以提升待检测评论的检测结果的准确性。
进一步参考图7,作为对上述各图所示方法的实现,本公开提供了用于检测评论的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图7所示,本实施例提供的用于检测评论的装置700包括提取单元701和生成单元702。其中,提取单元701被配置成利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;生成单元702被配置成根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在本实施例中,用于检测评论的装置700中:提取单元701和生成单元702的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201和步骤202的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,图神经网络的训练数据通过如下步骤得到:将关系网络对应的节点对象集拆分为有标签对象集和无标签对象集,其中,对象的标签用于指示对象是否为异常评论的关联对象;对于无标签对象集中的对象,根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签;使用节点对象集中的各对象分别对应的标签作为训练数据。
在本实施例的一些可选的实现方式中,节点对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在本实施例的一些可选的实现方式中,节点对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及无标签对象集中的无标签对象的评论属性信息与有标签对象集中的有标签对象的评论属性信息之间的相似度通过如下步骤确定:确定无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度作为第一相似度;确定无标签对象的元属性信息与有标签对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
在本实施例的一些可选的实现方式中,上述根据该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签,包括:确定该对象的评论属性信息分别与有标签对象集中的各对象的评论属性信息之间的相似度中的最大相似度;确定最大相似度对应的对象的标签作为该对象的标签。
在本实施例的一些可选的实现方式中,上述提取单元701进一步被配置成:根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,其中,目标对象集由待检测评论的关联对象在关系网络中的相邻节点表示的对象组成;确定从目标对象集中选取的对象对应的节点作为待检测评论的关联对象对应的节点的有效相邻节点;通过聚合有效相邻节点的特征信息和待检测评论的关联对象对应的节点的特征信息,得到待检测评论的关联对象的特征向量。
在本实施例的一些可选的实现方式中,目标对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与关系网络对应的节点对象集中的其它各对象的历史评论之间是否具有预设关联。
在本实施例的一些可选的实现方式中,目标对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及对于目标对象集中的对象,该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度通过如下步骤确定:确定该对象的关联属性信息与待检测评论的关联对象的关联属性信息之间的相似度作为第一相似度;确定该对象的元属性信息与待检测评论的关联对象的元属性信息之间的相似度作为第二相似度;根据第一相似度与第二相似度的加权和,确定该对象的评论属性信息与待检测评论的关联对象的评论属性信息之间的相似度。
在本实施例的一些可选的实现方式中,根据待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从目标对象集中选取对象,包括:从目标对象集中的选取对应的相似度大于预设阈值的对象。
在本实施例的一些可选的实现方式中,上述提取单元801进一步被配置成:利用基于第一关系网络训练得到的第一图神经网络提取发布待检测评论的对象的第一特征向量,其中,第一关系网络中的节点表示发布评论的对象,第一关系网络中的边表示所连接的两个对象具有针对同一对象的评论;利用基于第二关系网络训练得到的第二图神经网络提取待检测评论所评论的对象的第二特征向量,其中,第二关系网络中的节点表示被评论的对象,第二关系网络中的边表示所连接的两个对象具有同一对象发布的评论。
在本实施例的一些可选的实现方式中,上述生成单元702进一步被配置成:获取待检测评论的特征向量;根据第一特征向量、第二特征向量和待检测评论的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
在本实施例的一些可选的实现方式中,上述生成单元702进一步被配置成:融合第一特征向量、第二特征向量和待检测评论的特征向量,得到融合后的特征向量;将融合后的特征向量输入至预先训练的评论检测模型,得到待检测评论的检测结果。
本公开的上述实施例提供的装置,通过提取单元利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;生成单元根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果,从而可以基于异常评论具有的一些如评论时间较集中,被评论的对象具有大量异常评论、许多异常评论的发布者可能相同等特点,使用基于关系网络预先训练的图神经网络学习评论和评论的发布者或评论所评论的对象之间的关联关系,从而提升针对异常评论的检测结果的准确性。
下面参考图8,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器或终端设备)800的结构示意图。图8示出的服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图8中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象;根据待检测评论的关联对象的特征向量,生成用于指示待检测评论是否属于异常评论的检测结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括提取单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,提取单元还可以被描述为“利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量的单元,其中,关系网络中的节点表示对象,关系网络中的边表示所连接的两个对象的历史评论具有预设关联,待检测评论的关联对象包括发布待检测评论的对象和/或待检测评论所评论的对象”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (15)
1.一种用于检测评论的方法,包括:
利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,所述关系网络中的节点表示对象,所述关系网络中的边表示所连接的两个对象的历史评论具有预设关联,所述待检测评论的关联对象包括发布所述待检测评论的对象和/或所述待检测评论所评论的对象;
根据所述待检测评论的关联对象的特征向量,生成用于指示所述待检测评论是否属于异常评论的检测结果。
2.根据权利要求1所述的方法,其中,所述图神经网络的训练数据通过如下步骤得到:
将所述关系网络对应的节点对象集拆分为有标签对象集和无标签对象集,其中,对象的标签用于指示对象是否为异常评论的关联对象;
对于所述无标签对象集中的对象,根据该对象的评论属性信息分别与所述有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签;
使用所述节点对象集中的各对象分别对应的标签作为训练数据。
3.根据权利要求2所述的方法,其中,所述节点对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与所述节点对象集中的其它各对象的历史评论之间是否具有预设关联。
4.根据权利要求3所述的方法,其中,所述节点对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及
所述无标签对象集中的无标签对象的评论属性信息与所述有标签对象集中的有标签对象的评论属性信息之间的相似度通过如下步骤确定:
确定无标签对象的关联属性信息与有标签对象的关联属性信息之间的相似度作为第一相似度;
确定无标签对象的元属性信息与有标签对象的元属性信息之间的相似度作为第二相似度;
根据所述第一相似度与所述第二相似度的加权和,确定无标签对象的评论属性信息与有标签对象的评论属性信息之间的相似度。
5.根据权利要求2所述的方法,其中,所述根据该对象的评论属性信息分别与所述有标签对象集中的各对象的评论属性信息之间的相似度,确定该对象的标签,包括:
确定该对象的评论属性信息分别与所述有标签对象集中的各对象的评论属性信息之间的相似度中的最大相似度;
确定所述最大相似度对应的对象的标签作为该对象的标签。
6.根据权利要求1所述的方法,其中,所述利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,包括:
根据所述待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从所述目标对象集中选取对象,其中,所述目标对象集由所述待检测评论的关联对象在所述关系网络中的相邻节点表示的对象组成;
确定从所述目标对象集中选取的对象对应的节点作为所述待检测评论的关联对象对应的节点的有效相邻节点;
通过聚合所述有效相邻节点的特征信息和所述待检测评论的关联对象对应的节点的特征信息,得到所述待检测评论的关联对象的特征向量。
7.根据权利要求6所述的方法,其中,所述目标对象集中的对象的评论属性信息包括关联属性信息,其中,对象的关联属性信息表示该对象的历史评论分别与所述关系网络对应的节点对象集中的其它各对象的历史评论之间是否具有预设关联。
8.根据权利要求7所述的方法,其中,所述目标对象集中的对象的评论属性信息还包括元属性信息,其中,元属性信息不包括关联属性信息;以及
对于所述目标对象集中的对象,该对象的评论属性信息与所述待检测评论的关联对象的评论属性信息之间的相似度通过如下步骤确定:
确定该对象的关联属性信息与所述待检测评论的关联对象的关联属性信息之间的相似度作为第一相似度;
确定该对象的元属性信息与所述待检测评论的关联对象的元属性信息之间的相似度作为第二相似度;
根据所述第一相似度与所述第二相似度的加权和,确定该对象的评论属性信息与所述待检测评论的关联对象的评论属性信息之间的相似度。
9.根据权利要求6所述的方法,其中,所述根据所述待检测评论的关联对象的评论属性信息分别与目标对象集中的各对象的评论属性信息之间的相似度,从所述目标对象集中选取对象,包括:
从所述目标对象集中的选取对应的相似度大于预设阈值的对象。
10.根据权利要求1所述的方法,其中,所述利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,包括:
利用基于第一关系网络训练得到的第一图神经网络提取发布所述待检测评论的对象的第一特征向量,其中,所述第一关系网络中的节点表示发布评论的对象,所述第一关系网络中的边表示所连接的两个对象具有针对同一对象的评论;
利用基于第二关系网络训练得到的第二图神经网络提取所述待检测评论所评论的对象的第二特征向量,其中,所述第二关系网络中的节点表示被评论的对象,所述第二关系网络中的边表示所连接的两个对象具有同一对象发布的评论。
11.根据权利要求10所述的方法,其中,所述根据所述关联对象的特征向量,生成用于指示所述待检测评论是否属于异常评论的检测结果,包括:
获取所述待检测评论的特征向量;
根据所述第一特征向量、第二特征向量和所述待检测评论的特征向量,生成用于指示所述待检测评论是否属于异常评论的检测结果。
12.根据权利要求11所述的方法,其中,所述根据所述第一特征向量、第二特征向量和所述待检测评论的特征向量,生成用于指示所述待检测评论是否属于异常评论的检测结果,包括:
融合所述第一特征向量、第二特征向量和所述待检测评论的特征向量,得到融合后的特征向量;
将所述融合后的特征向量输入至预先训练的评论检测模型,得到所述待检测评论的检测结果。
13.一种用于检测评论的装置,包括:
提取单元,被配置成利用基于关系网络训练得到的图神经网络提取待检测评论的关联对象的特征向量,其中,所述关系网络中的节点表示对象,所述关系网络中的边表示所连接的两个对象的历史评论具有预设关联,所述待检测评论的关联对象包括发布所述待检测评论的对象和/或所述待检测评论所评论的对象;
生成单元,被配置成根据所述待检测评论的关联对象的特征向量,生成用于指示所述待检测评论是否属于异常评论的检测结果。
14.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-12中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110040853.8A CN113779276A (zh) | 2021-01-13 | 2021-01-13 | 用于检测评论的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110040853.8A CN113779276A (zh) | 2021-01-13 | 2021-01-13 | 用于检测评论的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113779276A true CN113779276A (zh) | 2021-12-10 |
Family
ID=78835383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110040853.8A Pending CN113779276A (zh) | 2021-01-13 | 2021-01-13 | 用于检测评论的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113779276A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434933A (zh) * | 2023-04-14 | 2023-07-14 | 酒泉海容网络科技有限公司 | 基于智慧医疗的智能护理远程数据处理方法及系统 |
KR102667631B1 (ko) * | 2023-11-28 | 2024-05-22 | 한화시스템(주) | 다출처데이터 계보관계 분석 시스템 및 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170358006A1 (en) * | 2016-06-13 | 2017-12-14 | Alibaba Group Holding Limited | Methods and systems for processing and displaying review data based on one or more stored relationship associations and one or more rule sets |
CN109829733A (zh) * | 2019-01-31 | 2019-05-31 | 重庆大学 | 一种基于购物行为序列数据的虚假评论检测系统和方法 |
CN110009430A (zh) * | 2019-04-11 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 作弊用户检测方法、电子设备及计算机可读存储介质 |
CN111861546A (zh) * | 2020-06-28 | 2020-10-30 | 浪潮(北京)电子信息产业有限公司 | 一种评论质量的判断方法、装置、设备及存储介质 |
-
2021
- 2021-01-13 CN CN202110040853.8A patent/CN113779276A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170358006A1 (en) * | 2016-06-13 | 2017-12-14 | Alibaba Group Holding Limited | Methods and systems for processing and displaying review data based on one or more stored relationship associations and one or more rule sets |
CN109829733A (zh) * | 2019-01-31 | 2019-05-31 | 重庆大学 | 一种基于购物行为序列数据的虚假评论检测系统和方法 |
CN110009430A (zh) * | 2019-04-11 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 作弊用户检测方法、电子设备及计算机可读存储介质 |
CN111861546A (zh) * | 2020-06-28 | 2020-10-30 | 浪潮(北京)电子信息产业有限公司 | 一种评论质量的判断方法、装置、设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434933A (zh) * | 2023-04-14 | 2023-07-14 | 酒泉海容网络科技有限公司 | 基于智慧医疗的智能护理远程数据处理方法及系统 |
CN116434933B (zh) * | 2023-04-14 | 2023-10-24 | 湖南提奥医疗科技有限公司 | 基于智慧医疗的智能护理远程数据处理方法及系统 |
KR102667631B1 (ko) * | 2023-11-28 | 2024-05-22 | 한화시스템(주) | 다출처데이터 계보관계 분석 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729937B (zh) | 用于确定用户兴趣标签的方法及装置 | |
WO2020001106A1 (zh) | 分类模型的训练方法、店铺分类的方法及装置 | |
CN111371767B (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
CN105787133B (zh) | 广告信息过滤方法及装置 | |
US11803872B2 (en) | Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection | |
Paolanti et al. | Visual and textual sentiment analysis of brand-related social media pictures using deep convolutional neural networks | |
CN110070076B (zh) | 用于选取训练用样本的方法和装置 | |
CN113379449B (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN113779276A (zh) | 用于检测评论的方法和装置 | |
CN110913354A (zh) | 短信分类方法、装置及电子设备 | |
CN110674300B (zh) | 用于生成信息的方法和装置 | |
CN108512674B (zh) | 用于输出信息的方法、装置和设备 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN113392920B (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
WO2022017082A1 (zh) | 用于检测虚假交易订单的方法和装置 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
KR20210097204A (ko) | 정보를 출력하는 방법 및 장치 | |
WO2022100401A1 (zh) | 基于图像识别的价格信息处理方法、装置、设备和介质 | |
CN113780318B (zh) | 用于生成提示信息的方法、装置、服务器和介质 | |
CN111178974B (zh) | 一种提高多平台融合性的方法和装置 | |
JP7139270B2 (ja) | 推定装置、推定方法及び推定プログラム | |
US10217019B2 (en) | Associating a comment with an object in an image | |
CN111523929A (zh) | 一种商户信息管理方法及系统 | |
CN111369315A (zh) | 资源对象推荐方法及装置,数据预测模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |