CN110688455A - 基于人工智能过滤无效评论的方法、介质及计算机设备 - Google Patents

基于人工智能过滤无效评论的方法、介质及计算机设备 Download PDF

Info

Publication number
CN110688455A
CN110688455A CN201910857668.0A CN201910857668A CN110688455A CN 110688455 A CN110688455 A CN 110688455A CN 201910857668 A CN201910857668 A CN 201910857668A CN 110688455 A CN110688455 A CN 110688455A
Authority
CN
China
Prior art keywords
comment
information
invalid
comment information
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910857668.0A
Other languages
English (en)
Inventor
吕小立
刘丽珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910857668.0A priority Critical patent/CN110688455A/zh
Publication of CN110688455A publication Critical patent/CN110688455A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于人工智能过滤无效评论的方法、装置、介质及计算机设备,所述方法包括:获取社区的评论信息;对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;依据判断的结果从社区过滤所述无效评论。本发明通过将人工智能中的自然语言处理算法与预设的无效性判定规则相结合,实现对评论信息的智能过滤。

Description

基于人工智能过滤无效评论的方法、介质及计算机设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于人工智能过滤无效评论的方法、介质及计算机设备。
背景技术
目前,市面上软件中心或是购物App等大多需要用户给予评论。正因为如此,当今的互联网时代的用户越来越倾向于从网络上获取评论信息以做参考。一般情况下,用户参考商品的评论信息来了解商品的质量问题,或是商家的信誉问题,例如,某衣服是否有色差,某电子产品是否是一次性的等。然而,这些用户给出的评论质量良莠不齐,其中甚至存在部分虚假或无效的评论信息,例如,有些并非是用户真心的,而是随意评论,甚至恶意差评等,不具备真实性,容易误导其他用户,导致带来其他用户的损失。如何自动鉴别评论信息是否有效是一个亟待解决的问题。
现有技术中,在进行评论信息是否有效的识别过程中,至少存在如下缺陷:
1,判断评论是否有效的规则不够灵活;
2,无法更精准的剔除无效的评论;
3,展示评论信息时不够直观。
发明内容
本发明提供一种基于人工智能过滤无效评论的方法及相应的系统,其主要实现了基于人工智能的自然语言分析算法对评论信息进行分析,并通过预设的无效性判定规则将无效评论过滤。
本发明还提供一种用于执行本发明的基于人工智能过滤无效评论的方法的计算机设备及可读存储介质。
为解决上述问题,本发明采用如下各方面的技术方案:
第一方面,本发明提供一种基于人工智能过滤无效评论的方法,所述方法包括:
获取社区的评论信息;
对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;
依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;
依据判断的结果从社区过滤所述无效评论。
具体的,所述获取社区的评论信息,包括:
获取所述评论信息、所述评论信息对应的评论对象信息以及所述评论信息对应的发起评论的账户信息,其中,所述评论对象信息包括评论对象的所属领域以及评论对象的外形特征信息,所述发起评论的账户信息包括发起评论的账户所使用的IP地址、发起评论的账户的注册信息以及发起评论的时间。
具体的,所述特征信息包括图片信息以及关键词,所述对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息,包括:
利用自然语言处理算法对所述评论信息进行句法分析以及情感分析提取所述关键词;
获取所述评论信息中的所述图片信息并利用图像识别方法对所述图片信息进行处理。
优选的,所述依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论,包括:
计算所述关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论;
若所述第一匹配度大于等于第一预设阈值,计算所述评论对象的外形特征信息与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论;
若所述第二匹配度大于等于第二预设阈值,为所述评论信息设置情感标签,将所述情感标签与第一预设词库中的表征无效情感的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论;
若匹配成功的情感标签的数量小于等于第三预设阈值,将所述关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。
优选的,所述依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论,包括:
计算所述评论信息与所述社区预置时间段内的其他评论信息的第一相似度;
计算所述评论信息对应的发起评论的账户信息与所述社区预置时间段内的其他发起评论的账户信息的第二相似度;
若所述第一相似度大于第一预设相似度阈值,同时,第二相似度大于第二相似度预设阈值,则判断所述评论信息为无效评论。
具体的,所述依据判断的结果从社区过滤所述无效评论,包括:
依据所述第一匹配度、所述第二匹配度以及与第二参考标签匹配成功的关键词的数量计算所述评论信息的有效性分值;
将所述有效性分值展示于用户界面。
具体的,所述依据判断的结果从社区过滤所述无效评论,包括:
对所述无效评论进行合并处理或者删除处理。
第二方面,本发明提供一种基于人工智能过滤无效评论的装置,所述装置包括:
获取模块,用于获取社区的评论信息;
处理模块,用于对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;
判断模块,用于依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;
过滤模块,用于依据判断的结果从社区过滤所述无效评论。
第三方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现第一方面中任一项所述基于人工智能过滤无效评论的方法的步骤。
第四方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如第一方面中任一项权利要求所述基于人工智能过滤无效评论的方法的步骤。
相对于现有技术,本发明的技术方案至少具备如下优点:
1、本发明提供一种基于人工智能过滤无效评论的方法,通过获取社区的评论信息;对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;依据判断的结果从社区过滤所述无效评论。本发明通过将人工智能中的自然语言处理算法与预设的无效性判定规则相结合,实现对评论信息的智能过滤。
2、本发明提供了多种无效性的判定规则,提高了所述评论信息的无效性判断的灵活度以及精准度。具体而言,其一、本发明可以基于人工智能中的自然语言处理算法对评论信息进行情感分析,为评论信息设置情感标签,将所述情感标签与第一预设词库中的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论。其二、本发明可以通过图像识别识别评论信息中的图片信息,计算所述评论对象的外形特征信息与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论。其三、本发明可以提取所述评论信息中领域相关的关键词,并计算所述关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论。其四、本发明还可以将提取出的关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。
3、本发明还提供了计算所述评论信息有效性分值的机制。该机制可以确定各评论的有效性分值并将其展示于用户界面以便用户可以参考该有效性分值判断当前评论的可信度。具体而言,本发明可以依据所述第一匹配度、所述第二匹配度以及匹配成功的关键词的数量计算所述评论信息的有效性分值,并将所述有效性分值展示于用户界面。
附图说明
图1为一个实施例中基于人工智能过滤无效评论的方法流程图;
图2为一个实施例中基于人工智能过滤无效评论的装置结构框图;
图3为一个实施例中计算机设备的内部结构框图。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S11、S12 等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
本领域普通技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本领域普通技术人员可以理解,除非另外定义,这里使用的所有术语 (包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例提供一种基于人工智能过滤无效评论的方法,如图1所示,所述方法包括以下步骤:
S11、获取社区的评论信息。
本发明实施例中,所述评论信息为针对某个指定的评论对象的评论文本以及图片信息。其中,所述评论对象可以为产品、卖家、食品店以及旅游景点等。
本发明实施例中,在获取所述评论信息时还获取评论信息对应的评论对象的信息以及发起评论的账户信息。其中,所述评论对象的信息至少包括评论对象的所属领域、评论对象的图片以及评论对象的外形特征信息。所述发起评论的账户信息至少包括:评论时间、发起评论的账户所使用的 IP地址以及发起评论的账户的注册信息等。本发明可以通过查询预先存储了评论信息的数据库,或通过一定的接口与指定网站交互来获取所述评论信息。
S12、对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息。
本发明实施例中,所利用的自然语言处理为利用计算机为工具,对书面实行或者口头形式进行各种各样的处理和加工的技术,是人工智能的主要内容。其中,自然语言处理涉及到多种算法,例如,句法分析、情感分析以及深度学习。
本发明实施例中,所述特征信息至少包括所述评论信息中的关键词以及所述评论信息中的图片信息。本发明利用所述自然语言处理算法中的句法分析以及情感分析提取所述评论信息中的关键词,利用图像识别获取所述评论信息中的图片信息并进行图像分析处理。其中,所述关键词至少包括领域相关的关键词、情感相关的关键词、无效评论相关的关键词以及其他关键词。所述领域相关的关键词,如A型号的车、B品牌的服装以及C 商家的食品等;情感相关的关键词,如,“好”、“好喜欢”、“体验差”等表征情感的关键词;无效评论相关的关键词,如包含打广告的词语,例如有微信号字样、有手机号字样以及领券字样等的词。图片信息为用户发表完评论文字时上传的图片。
一种可能的设计中,本发明可以采取如下步骤提取所述关键词:
a,对所述评论信息进行分词处理;
b,对分出的各个词进行语义分析及情感分析并统计各个词出现的次数;
c,依据语义分析及情感分析的结果提取所需要的关键词。
另一种实施例中,也可以为所述评论信息计算情感分值,所述情感分值可用于后续为所述评论信息设置情感标签。其具体的步骤如下:
a1,对所述评论信息进行分词处理;
b1,对各个分词进行情感分析,根据每个词计算总体的情感分值,公式如:-1^(否定词的个数)*程度词的分值*评价词的分值;
c1,根据正负判断情感标签。
例如,“难道非要我给差评么?”中,难道和非都算否定词,这样分值就是(-1)^2*1*-1=-1,结论是负面评价。再比如,“难道这产品还能算不好吗?”中,难道和不都是否定词,分值为(-1)^2*1*1=1,结论是正面评价。
本发明实施例中,所述情感分析为对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其利用机器提取人们对某人或事物的态度,从而发现潜在的问题用于改进或预测。
本发明实施例中,还进一步利用图像识别方法提取所述评论信息中的图片信息并识别所述图片信息中的特征物,所述特征物可以为物品、人、表情或者包含文字图片等。所述识别出的图片信息可以用于后续与所述评论信息的评论对象进行匹配以作为判断所述评论信息是否有效的依据之一。
S13、依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论。
本发明实施例中,所述依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论,具体包括如下步骤:
计算提取出的关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论,若所述第一匹配度大于等于第一预设阈值,则利用以下规则进一步判断所述评论信息是否有效:
计算所述评论对象的外形特征信息或者所述评论对象的图片与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论,若所述第二匹配度大于等于第二预设阈值,则利用以下规则进一步判断所述评论信息是否有效:
依据对所述评论信息的情感分析结果为所述评论信息设置情感标签,将所述情感标签与第一预设词库中的表征无效情感的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论,若匹配成功的情感标签的数量小于等于第三预设阈值,则利用以下规则进一步判断所述评论信息是否有效:
将所述关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。
其中,所述第一预设词库中包含若干个表征无效情感的第一参考标签,例如,表达一些过激情感的标签。所述第二预设词库中包含若干个表征无效评论的第二参考标签,例如,一些包含打广告的词语,如有微信号字样、有手机号字样以及领券字样等参考标签。
本发明实施例中,在对所述评论信息设置情感标签时,可以采取如下方案:
A2,对所述评论信息进行分词处理;
B2,对分出的各个词进行情感分析并统计各个词出现的次数;
C2,依据情感分析的结果为所述评论信息设置情感标签。其中,所述情感标签至少包括:“好评”、“差评”、“中评”、“正面评价”、“负面评价”、“恶意差评”以及“过激差评”等。其中,“恶意差评”以及“过激差评”则可用于判断该评论信息为无效评论。
具体而言,本发明提供了以上四项无效性判断规则判断所述评论信息是否有效。本发明采用先判断所述评论信息的领域是否与评论对象匹配,当匹配通过时,判断所述评论信息的图片是否与评论对象匹配,当匹配成功时,判断所述评论信息是否包含一些过激情感表达,当判断不包含时,判断所述评论信息中是否包含一些无效评论的标签,当以上各个规则均通过时,则判断所述评论信息为有效的评论信息,当所述评论信息有一项无效性判定规则不通过时,则判断所述评论信息为无效评论。
举例说明,例如,评论对象是电子产品,而评论信息的内容是食品,那么该评论信息与所述评论对象的领域不匹配,该评论信息为无效评论。再例如,所述评论对象为服装,评论的图片信息为食品,则该评论信息的图片也评论对象不匹配,则该评论信息为无效评论。
需要说明的是,利用以上四项无效性判定规则判断所述评论信息是否有效时,其顺序可以根据实际情况设定,并非仅限于以上一种顺序。
在本发明的另一种实施例中,还提供了如下无效性判定规则:
其一、计算所述评论信息与所述社区预置时间段内的其他评论信息的第一相似度;计算所述评论信息对应的发起评论的账户信息与所述社区预置时间段内的其他发起评论的账户信息的第二相似度;若所述第一相似度大于第一预设相似度阈值,同时,第二相似度大于第二相似度预设阈值,则判断所述评论信息为无效评论。例如,两个评论账户的账号相同,并且该两个账户所发起的针对同一商品的评论信息相似度较高,则判断所述评论信息为无效评论信息。在例如,两个评论账户所使用的IP地址相同,并且该两个账户所发起的针对同一商品的评论信息相似度高于预设相似度阈值,则判断所述评论信息为无效评论信息。
其二、对所述评论信息进行分词处理,先判断其是否为一个完整个的句子;然后统计各个词出现的次数,若某个词出现的次数超过预设次数阈值,且出现的位置之间的距离小于预设距离阈值,则判断所述评论信息为无效评论。
其三、当发起评论的账户所使用的IP地址为预设黑名单中的地址时,则判断该评论信息为无效评论。
其四、当发起评论的账户为未经过实名认证,并且,所述评论信息中某个词出现的次数大于预设阈值,则判断所述评论信息为无效评论。
本发明实施例中,提供以上多种无效性判定规则,多种规则可以自由搭配使用,使用的规则越多,判断的精度就越高,其判断顺序可以各级实际需要灵活设定,在此不做具体限定。
S14、依据判断的结果从社区过滤所述无效评论。
本发明实施例中,在过滤所述无效评论时,还可以计算有效的评论信息的有效性分值。该有效性分值用于展示于用户界面,用户可根据所述有效性分值评判当前评论信息的可信度。
具体的,本发明可以依据所述第一匹配度、所述第二匹配度、以及匹配成功的关键词的数量计算所述评论信息的有效性分值;并将所述有效性分值展示于用户界面。
一种可能的设计中,本发明可采用如下具体方案计算所述有效性分值:
其一、分别为所述第一匹配度、第二匹配度、与第二参考标签匹配成功的关键词设置权重。分别设置为权重1、权重2以及权重3。
其二、将从所述评论信息中提取的总的关键词数量M减去与第二参考标签匹配成功的关键词数量得到未匹配成功的关键词的数量N;将N除以总的关键词数量M得到N/M的比值。
其三、所述评论信息的有效性分值=第一匹配度*权重1+第二匹配度* 权重2+N/M*权重3
本发明提供有效性分值的计算与展示机制,便于用户对评论信息的可信度进行判断,使得所述评论信息更具备参考价值,提升用户体验。
本发明实施例中,所述依据判断的结果从社区过滤所述无效评论,包括:对所述无效评论进行合并处理或者删除处理。例如,将同一IP地址的账户发起的多条相似度较高的评论信息进行合并处理,将图片信息与评论对象不相符合的评论信息删除。
请参考图2,在另一种实施例中,本发明提供了一种基于人工智能过滤无效评论的装置,包括:
获取模块11,用于获取社区的评论信息;
处理模块12,用于对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;
判断模块13,用于依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;
过滤模块14,用于依据判断的结果从社区过滤所述无效评论。
进一步的,所述获取模块11中进一步包括:
获取单元,用于获取所述评论信息、所述评论信息对应的评论对象信息以及所述评论信息对应的发起评论的账户信息,其中,所述评论对象信息包括评论对象的所属领域以及评论对象的外形特征信息,所述发起评论的账户信息包括发起评论的账户所使用的IP地址、发起评论的账户的注册信息以及发起评论的时间。
所述处理模块12中,具体包括:
处理单元,用于利用自然语言处理算法对所述评论信息进行句法分析以及情感分析提取所述关键词;获取所述评论信息中的所述图片信息并利用图像识别方法对所述图片信息进行处理。
所述判断模块13中,具体包括:
第一判断单元,用于计算所述关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论;若所述第一匹配度大于等于第一预设阈值,计算所述评论对象的外形特征信息与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论;若所述第二匹配度大于等于第二预设阈值,为所述评论信息设置情感标签,将所述情感标签与第一预设词库中的表征无效情感的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论;若匹配成功的情感标签的数量小于等于第三预设阈值,将所述关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。
所述判断模块13中,具体包括:
第二判断单元,用于计算所述评论信息与所述社区预置时间段内的其他评论信息的第一相似度;计算所述评论信息对应的发起评论的账户信息与所述社区预置时间段内的其他发起评论的账户信息的第二相似度;若所述第一相似度大于第一预设相似度阈值,同时,第二相似度大于第二相似度预设阈值,则判断所述评论信息为无效评论。
所述过滤模块14中,具体包括:
计算单元,用于依据所述第一匹配度、所述第二匹配度以及与第二参考标签匹配成功的关键词的数量计算所述评论信息的有效性分值;将所述有效性分值展示于用户界面。
过滤单元,用于对所述无效评论进行合并处理或者删除处理。
在另一种实施例中,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现任一项技术方案所述的基于人工智能过滤无效评论的方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-OnlyMemory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。
本发明实施例提供的一种计算机可读存储介质,可实现通过获取社区的评论信息;对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;依据判断的结果从社区过滤所述无效评论。本发明通过将人工智能中的自然语言处理算法与预设的无效性判定规则相结合,实现对评论信息的智能过滤。
此外,在又一种实施例中,本发明提供了一种计算机设备,如图3所示,所述计算机设备包括处理器303、存储器305、输入单元307以及显示单元309等器件。本领域技术人员可以理解,图3示出的结构器件并不构成对所有计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器305可用于存储应用程序301以及各功能模块,处理器303运行存储在存储器305的应用程序301,从而执行设备的各种功能应用以及数据处理。存储器305可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U 盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器305只作为例子而非作为限定。
输入单元307用于接收信号的输入,以及接收用户输入的关键字。输入单元307可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元309可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元309可采用液晶显示器、有机发光二极管等形式。处理器303是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器303内的软件程序和/ 或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。图 3中所示的一个或多个处理器303能够执行、实现图2中所示的获取模块 11、处理模块12、判断模块13以及过滤模块14的功能。
在一种实施方式中,所述计算机设备包括存储器305和处理器303,所述存储器305中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器303执行以上实施例所述的一种基于人工智能过滤无效评论的方法的步骤。
本发明实施例提供的一种计算机设备,可实现通过获取社区的评论信息;对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;依据判断的结果从社区过滤所述无效评论。本发明通过将人工智能中的自然语言处理算法与预设的无效性判定规则相结合,实现对评论信息的智能过滤。
另一种实施例中,本发明还可以计算所述关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论;若所述第一匹配度大于等于第一预设阈值,计算所述评论对象的外形特征信息与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论;若所述第二匹配度大于等于第二预设阈值,为所述评论信息设置情感标签,将所述情感标签与第一预设词库中的表征无效情感的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论;若匹配成功的情感标签的数量小于等于第三预设阈值,将所述关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。本发明提供了多种无效性的判定规则,提高了所述评论信息的无效性判断的灵活度以及精准度。
本发明实施例提供的计算机可读存储介质可以实现上述基于人工智能过滤无效评论的方法的实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于人工智能过滤无效评论的方法,其特征在于,所述方法包括:
获取社区的评论信息;
对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;
依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;
依据判断的结果从社区过滤所述无效评论。
2.根据权利要求1所述的基于人工智能过滤无效评论的方法,其特征在于,所述获取社区的评论信息,包括:
获取所述评论信息、所述评论信息对应的评论对象信息以及所述评论信息对应的发起评论的账户信息,其中,所述评论对象信息包括评论对象的所属领域以及评论对象的外形特征信息,所述发起评论的账户信息包括发起评论的账户所使用的IP地址、发起评论的账户的注册信息以及发起评论的时间。
3.根据权利要求1所述的基于人工智能过滤无效评论的方法,其特征在于,所述特征信息包括图片信息以及关键词,所述对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息,包括:
利用自然语言处理算法对所述评论信息进行句法分析以及情感分析提取所述关键词;
获取所述评论信息中的所述图片信息并利用图像识别方法对所述图片信息进行处理。
4.根据权利要求2所述的基于人工智能过滤无效评论的方法,其特征在于,所述依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论,包括:
计算所述关键词与所述评论对象的所属领域的第一匹配度,若所述第一匹配度小于第一预设阈值,则判断所述评论信息为无效评论;
若所述第一匹配度大于等于第一预设阈值,计算所述评论对象的外形特征信息与所述图片信息的第二匹配度,若所述第二匹配度小于第二预设阈值,则判断所述评论信息为无效评论;
若所述第二匹配度大于等于第二预设阈值,为所述评论信息设置情感标签,将所述情感标签与第一预设词库中的表征无效情感的第一参考标签进行匹配,若匹配成功的情感标签的数量大于第三预设阈值,则判断所述评论信息为无效评论;
若匹配成功的情感标签的数量小于等于第三预设阈值,将所述关键词与第二预设词库中的表征无效评论的第二参考标签进行匹配,若匹配成功的关键词的数量大于第四预设阈值,则判断所述评论信息为无效评论。
5.根据权利要求4所述的基于人工智能过滤无效评论的方法,其特征在于,所述依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论,包括:
计算所述评论信息与所述社区预置时间段内的其他评论信息的第一相似度;
计算所述评论信息对应的发起评论的账户信息与所述社区预置时间段内的其他发起评论的账户信息的第二相似度;
若所述第一相似度大于第一预设相似度阈值,同时,第二相似度大于第二相似度预设阈值,则判断所述评论信息为无效评论。
6.根据权利要求3所述的基于人工智能过滤无效评论的方法,其特征在于,所述依据判断的结果从社区过滤所述无效评论,包括:
依据所述第一匹配度、所述第二匹配度以及与第二参考标签匹配成功的关键词的数量计算所述评论信息的有效性分值;
将所述有效性分值展示于用户界面。
7.根据权利要求1所述的基于人工智能过滤无效评论的方法,其特征在于,所述依据判断的结果从社区过滤所述无效评论,包括:
对所述无效评论进行合并处理或者删除处理。
8.一种基于人工智能过滤无效评论的装置,其特征在于,所述装置包括:
获取模块,用于获取社区的评论信息;
处理模块,用于对所述评论信息采用人工智能中的自然语言处理算法进行处理,提取所述评论信息中的特征信息;
判断模块,用于依据预设的无效性判定规则以及所述特征信息判断所述评论信息是否为无效评论;
过滤模块,用于依据判断的结果从社区过滤所述无效评论。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至7中任一项所述基于人工智能过滤无效评论的方法的步骤。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述基于人工智能过滤无效评论的方法的步骤。
CN201910857668.0A 2019-09-09 2019-09-09 基于人工智能过滤无效评论的方法、介质及计算机设备 Pending CN110688455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910857668.0A CN110688455A (zh) 2019-09-09 2019-09-09 基于人工智能过滤无效评论的方法、介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910857668.0A CN110688455A (zh) 2019-09-09 2019-09-09 基于人工智能过滤无效评论的方法、介质及计算机设备

Publications (1)

Publication Number Publication Date
CN110688455A true CN110688455A (zh) 2020-01-14

Family

ID=69108979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910857668.0A Pending CN110688455A (zh) 2019-09-09 2019-09-09 基于人工智能过滤无效评论的方法、介质及计算机设备

Country Status (1)

Country Link
CN (1) CN110688455A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354334A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音输出方法、装置、设备和介质
CN111782761A (zh) * 2020-05-12 2020-10-16 北京达佳互联信息技术有限公司 评论信息的确定方法、装置、电子设备及存储介质
CN112184323A (zh) * 2020-10-13 2021-01-05 上海风秩科技有限公司 评价标签生成方法和装置、存储介质及电子设备
CN112364154A (zh) * 2020-11-10 2021-02-12 北京乐学帮网络技术有限公司 一种评论内容显示方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354334A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音输出方法、装置、设备和介质
CN111354334B (zh) * 2020-03-17 2023-09-15 阿波罗智联(北京)科技有限公司 语音输出方法、装置、设备和介质
CN111782761A (zh) * 2020-05-12 2020-10-16 北京达佳互联信息技术有限公司 评论信息的确定方法、装置、电子设备及存储介质
CN111782761B (zh) * 2020-05-12 2023-10-31 北京达佳互联信息技术有限公司 评论信息的确定方法、装置、电子设备及存储介质
CN112184323A (zh) * 2020-10-13 2021-01-05 上海风秩科技有限公司 评价标签生成方法和装置、存储介质及电子设备
CN112364154A (zh) * 2020-11-10 2021-02-12 北京乐学帮网络技术有限公司 一种评论内容显示方法及装置

Similar Documents

Publication Publication Date Title
CN110688455A (zh) 基于人工智能过滤无效评论的方法、介质及计算机设备
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN107437038B (zh) 一种网页篡改的检测方法及装置
CN107833082B (zh) 一种商品图片的推荐方法和装置
CN108984530A (zh) 一种网络敏感内容的检测方法及检测系统
CN104462152B (zh) 一种网页的识别方法及装置
US20120083294A1 (en) Integrated image detection and contextual commands
CN103605691B (zh) 用于处理社交网络中发布内容的装置和方法
CN108319888B (zh) 视频类型的识别方法及装置、计算机终端
CN108256537A (zh) 一种用户性别预测方法和系统
US10489637B2 (en) Method and device for obtaining similar face images and face image information
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
CN108171243B (zh) 一种基于深度神经网络的医疗图像信息识别方法及系统
CN103678460B (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统
CN106537387B (zh) 检索/存储与事件相关联的图像
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN114648392B (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN111797820A (zh) 一种视频数据处理方法、装置、电子设备及存储介质
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
CN111695357A (zh) 文本标注方法及相关产品
CN115577172A (zh) 物品推荐方法、装置、设备及介质
CN111125561A (zh) 一种网络热度的展示方法及装置
CN112434173B (zh) 搜索内容输出方法、装置、计算机设备及可读存储介质
CN110674388A (zh) 推送项目的配图方法、装置、存储介质和终端设备
CN111797904A (zh) 网页页面特征的篡改检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination