CN110084373A - 信息处理方法、装置、计算机可读存储介质和计算机设备 - Google Patents

信息处理方法、装置、计算机可读存储介质和计算机设备 Download PDF

Info

Publication number
CN110084373A
CN110084373A CN201910322954.7A CN201910322954A CN110084373A CN 110084373 A CN110084373 A CN 110084373A CN 201910322954 A CN201910322954 A CN 201910322954A CN 110084373 A CN110084373 A CN 110084373A
Authority
CN
China
Prior art keywords
information
target information
target
negative reviews
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910322954.7A
Other languages
English (en)
Other versions
CN110084373B (zh
Inventor
徐宗瑜
王晨琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910322954.7A priority Critical patent/CN110084373B/zh
Publication of CN110084373A publication Critical patent/CN110084373A/zh
Application granted granted Critical
Publication of CN110084373B publication Critical patent/CN110084373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种信息处理方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取目标信息;确定所述目标信息的负面评论信息;根据所述目标信息的负面评论信息确定负面评论信息的权重;当所述目标信息的负面评论信息的权重大于或等于权重阈值时,则确定所述目标信息为可疑信息。本申请提供的方案可以解决机器模型无法识别垂类领域的信息是否存在明显错误的问题。

Description

信息处理方法、装置、计算机可读存储介质和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息处理方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着计算机技术的不断发展,互联网信息使人们的工作和生活发生巨大的改变。在信息大数据时代,人们可以交换和共享信息。但随着信息的交换和共享,很多低质量信息被传播,带来很多负面影响。为了避免低质量信息带来的负面影响,目前主要是通过机器学习模型识别低质量信息并排除。
但是目前机器处理比较常见的识别能力包括色情识别、广告营销识别、标题党识别和错别字识别等,主要针对一些通识共性低质问题。而在垂类领域中,机器无法准确识别信息的正确性。
发明内容
基于此,有必要针对目前机器模型无法识别垂类领域的低质量信息的技术问题,提供一种信息处理方法、装置、计算机可读存储介质和计算机设备。
一种信息处理方法,包括:
获取目标信息;
确定所述目标信息的负面评论信息;
根据所述目标信息的负面评论信息确定负面评论信息的权重;
当所述目标信息的负面评论信息的权重大于或等于权重阈值时,则确定所述目标信息为可疑信息。
一种信息处理装置,所述装置包括:
获取模块,用于获取目标信息;
所述获取模块,还用于确定所述目标信息的负面评论信息;
权重确定模块,用于根据所述目标信息的负面评论信息确定负面评论信息的权重;
可疑信息确定模块,用于当所述目标信息的负面评论信息的权重大于或等于权重阈值时,则确定所述目标信息为可疑信息。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。
上述信息处理方法、装置、计算机可读存储介质和计算机设备,通过获取目标信息,并确定目标信息的负面评论信息,再根据负面评论信息确定目标信息的负面评论信息的权重,可计算出该目标信息的负面评论信息所占的比重。当目标信息的负面评论信息的权重大于或等于权重阈值时,认为负面评论信息所占的比重超出了正常范围,则可确定该目标信息存在问题,将该目标信息作为可疑信息。通过使用目标信息的评论信息的权重确定该目标信息是否存在问题,解决了传统的机器识别方式无法识别某些垂类领域的信息是否存在明显错误的问题。
附图说明
图1为一个实施例中信息处理方法的应用环境图;
图2为一个实施例中信息处理方法的流程示意图;
图3为一个实施例中确定属性类型的步骤的流程示意图;
图4为一个实施例中积累训练样本的界面图;
图5为一个实施例中确定负面评论信息的权重步骤的流程示意图;
图6为一个实施例中展示对目标信息的评论信息的界面图;
图7为一个实施例中处理目标信息的步骤的流程示意图;
图8为一个实施例中待处理页面中的界面图;
图9为另一个实施例中处理目标信息的步骤的流程示意图;
图10为一个实施例中信息处理方法的流程示意图;
图11为另一个实施例中信息处理装置的结构框图;
图12为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中信息处理方法的应用环境图。该文本处理方法应用于信息处理系统。该信息处理系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端110具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在本实施例中,终端110可将目标信息和对应的评论信息发送给服务器120,由服务器120通过识别模型识别该目标信息是否为可疑信息的操作。终端110也可以直接通过识别模型识别该目标信息是否为可疑信息。
终端110确定待处理的目标信息,并获取目标信息的每条评论信息,提取每条评论信息中的特征词。接着,终端110将每条评论的特征词与预设的属性词进行匹配。当匹配成功时,终端确定与特征词匹配成功的属性词所对应的属性类型,将与特征词匹配成功的属性词所对应的属性类型作为该评论信息的属性类型。接着,终端110根据目标信息的评论信息的属性类型获取目标信息的负面评论信息,得到该目标信息的所有负面评论信息。终端110确定每条负面评论信息的点赞数,根据每条负面评论信息的点赞数,确定每条负面评论信息的权重,从而确定目标信息的所有负面评论信息的权重。当目标信息的负面评论信息的权重大于或等于权重阈值时,终端110确定目标信息为可疑信息。
接着,终端110将确定为可疑信息的目标信息添加到待复核进程中,并对目标信息进行复核,确定目标信息所属的类别。当目标信息存在安全隐患时,终端110从推荐池以及该目标信息的原始页面删除该目标信息。当目标信息不存在安全隐患且达到推送标准时,终端110保持对目标信息的推送。当目标信息达到推送标准且内容不符合预设要求时,终端110设置目标信息设置的内容标签,并确定设置内容标签后的目标信息的目标推送对象,接着终端110将设置标签后的目标信息推送给目标推送对象。从而能够根据目标信息的评论信息的权重确定该目标信息是否存在问题,存在问题时对存在的问题进行明确分类,并按照目标信息中存在问题的严重程度进行不同的处理,从而对可疑信息进行更专业地评判和处理。解决了传统的识别方式中因不具备专业知识背景而无法识别某些领域的信息是否存在明显错误的问题。
如图2所示,在一个实施例中,提供了一种信息处理方法。本实施例主要以该方法应用于上述图1中的终端110来举例说明。参照图2,该信息处理方法具体包括如下步骤:
步骤202,获取目标信息。
步骤204,确定该目标信息的负面评论信息。
其中,目标信息是指展示在社交应用上的信息,目标信息包括但不限于文本、音乐、视频、图片、网页和链接等。负面评论信息是指用户对该目标信息所表现出的不赞同的观点。
具体地,终端确定要识别的目标信息,并获取用户对该展示在某社交应用上的目标信息的评论信息。接着,终端从该目标信息的评论信息中提取出负面的评论信息。
在本实施例中,终端可预先设置获取目标信息的负面评论信息的时间。具体地,当目标信息开始展示在某社交应用上时,终端开始计时,当目标信息在在该社交应用上的展示时间达到指定时长时,终端获取该目标信息的负面评论信息。例如,终端设置该目标信息在某社交应用上展示时长达到24小时时,获取目标信息的负面评论信息。通过设置获取目标信息的负面评论信息的时间,能够获取经过一段时间内累计的负面评论信息,使得得到的负面评论信息量较多,得到的信息更可靠。
步骤206,根据目标信息的负面评论信息确定该负面评论信息的权重。
步骤208,当该目标信息的负面评论信息的权重大于或等于权重阈值时,则确定该目标信息为可疑信息。
其中,权重是指某一因素或指标相对于整体的重要程度,权重强调的是因素或指标相对整体的贡献度。负面评论信息的权重是指负面评论信息相对于整体评论信息的重要程度。权重阈值是指预先设置的权重的值,该权重阈值可根据具体需求修改。
具体地,终端可根据目标信息的负面评论信息计算所有负面评论信息的总权重。接着,终端获取权重阈值,将目标信息的所有负面评论信息的总权重与权重阈值进行对比。当该目标信息的负面评论信息的权重大于或等于权重阈值时,确定该目标信息存在问题,则将该目标信息作为可疑信息。
在本实施例中,当该目标信息的负面评论信息的权重小于权重阈值时,结束对该目标信息的处理。具体地,当该目标信息的负面评论信息的权重小于权重阈值时,确定该目标信息不存在问题,则结束当前对该目标信息的处理,并保持该目标信息的展示和推送。
上述信息处理方法,通过获取目标信息,并确定目标信息的负面评论信息,再根据负面评论信息确定目标信息的负面评论信息的权重,可计算出该目标信息的负面评论信息所占的比重。当目标信息的负面评论信息的权重大于或等于权重阈值时,认为负面评论信息所占的比重超出了正常范围,则可确定该目标信息存在问题,将该目标信息作为可疑信息。通过使用目标信息的评论信息的权重确定该目标信息是否存在问题,解决了传统的机器识别方式无法识别某些垂类领域的信息是否存在明显错误的问题。
在一个实施例中,如图3所示,在确定所述目标信息的负面评论信息之前,还包括:
步骤302,获取该目标信息的每条评论信息,提取每条评论信息中的特征词。
其中,特征词是指能够体现该评论信息的主要观点的词。特征词可以是表达用户情绪、情感和态度的词语。
具体地,终端可获取该目标信息的一条评论信息,并从该评论信息中提取更代表该评论信息的特征词。从该评论信息中提取的特征词可以为至少一个,所提取的特征词最大限度地保留了该评论信息的关键内容。类似地,终端获取该目标信息的每条评论信息,并从每条评论信息中提取特征词。一条评论信息对应从该评论信息中提取出的特征词。
步骤304,将该特征词与预设的属性词进行匹配。
步骤306,当匹配成功时,确定与该特征词匹配成功的属性词所对应的属性类型。
步骤308,将与该特征词匹配成功的属性词所对应的属性类型作为该评论信息的属性类型。
其中,属性类型包括正面属性、中性属性和负面属性。预设的属性词是指某种属性类型对应的词,即预设的能够代表某种属性的词。预设的属性词分为代表正面属性的词、代表中性属性的词和代表负面属性的词。
具体地,终端获取一条评论信息对应的特征词,并获取预设的属性词。将该评论信息对应的特征词分别与预设的属性词进行匹配。进一步地,终端获取一类预设的属性词,将该评论信息对应的特征词分别与该类预设的属性词进行匹配。当该评论信息对应的特征词与该类预设的属性词中存在相同的词或存在近义词时,确定匹配成功,则将该类预设的属性词对应的属性类型作为该评论信息的属性类型。当该评论信息对应的特征词与终端获取一类预设的属性词中不存在相同的词或近义词时,终端从剩余的预设的属性词中获取另一类属性词。将该评论信息对应的特征词与该类属性词进行匹配,并确定是否匹配成功。
类似地,终端使用相同的方式提取每一条评论信息的特征词,并将每条评论信息的特征词与每一类预设的属性词匹配,匹配成功的属性词对应的属性类型则为该评论信息的属性类型。
上述信息处理方法中,通过提取评论信息的特征词,可得到代表该评论信息的观点的关键词。将该评论信息的特征词与预先设置的属性类别对应的属性词进行匹配,匹配成功则可确定该特征词对应的评论信息的属性类型。从而能够更准确地识别该评论信息的所表达的观点。
在一个实施例中,在该获取目标信息的负面评论信息之前,还包括:获取训练样本对应的词向量;将目标信息的评论信息进行分词,得到每个词对应的向量;将每个词对应的向量与训练样本对应的词向量进行匹配,得到每条评论信息对应的属性类型。
具体地,终端获取该目标信息的每条评论信息,并将该目标信息的每条评论信息输入训练好的识别模型。识别模型将按照预设规则将每条评论信息进行分词,得到每条评论信息对应的词。接着,将每条评论信息对应的词转换为词向量,得到每条评论信息对应的词向量。接着,识别模型将每条评论信息对应的词向量与训练样本对应的词向量进行匹配。每个训练样本都标注了对应的正面、中性或负面的属性类型。当匹配成功时,与一条评论信息的词向量匹配成功的词向量对应的训练样本所标注的属性类型即为该评论信息的属性类型。
上述信息处理方法,将目标信息的评论信息输入已训练好的识别模型中,将评论信息对应的词向量与训练样本的词向量进行匹配,能够快速准确地识别出大量评论信息中每条评论信息所对应的属性类型,提高识别的效率,从而提升对该目标信息的处理效率。
如图4所示,为一个实施例中终端通过标注工具积累训练样本的界面图。终端通过大量线上评论数据标注,可以采样到大量用户层反馈的对于文章的正面和负面情绪的样本。该评论标注平台的界面至少包括文章信息和评论两部分。文章信息中包括评论来源文章、作者、文章一级分类、文章二级分类、文章标签、文章PV量(page view页面浏览量,简称PV量)、文章评论量、文章评论比例、文章质量分、发文媒体分、账号体系-账号分和账号体系-账号等级等信息。评论中包括评论的情感倾向,即正面、负面和中性。正面的情感倾向包括但不限于表达喜欢/支持/夸奖,表达开心/好笑,很强/厉害、赞同,体现文章正能量(感动等),表扬文章质量(不错/有道理)、表扬作者等。负面的情感倾向包括但不限于认为是标题党、认为是谣言/瞎编/文章有错误,批评文章质量差(错别字/抄袭/不知所云),攻击作者,对文章内容质疑/不认可,批评文章描写的事件/现象,表达惊吓/害怕/悲观/恶心/消极情绪(文章负能量),表达讨厌/不满/嫌弃/厌恶(黑粉),互怼/争论/辩护等。中性即保持中立态度,无明显情感倾向。评论部分还包括评论的标签,标签包括但不限于广告、骗赞和语句不通等。
在一个实施例中,该获取目标信息的负面评论信息之前,还包括:终端获取训练样本,并使用训练样本训练识别模型,得到训练好的识别模型。
具体地,终端获取输入的样本,使用预训练的词典进行分词,并基于样本训练词向量,最终得到适用于评论的分词词典和词向量词典,全面覆盖评论常用语。对于输入的样本,对评论信息进行分词并将评论信息向量化,将评论信息转化为向量形态。并将已标注好的正面、负面和中性的样本转为0,1,2的矩阵。向量化的评论信息和标注好的属性类型的矩阵将作为模型训练的训练样本。
接着,终端使用文本分类模型进行训练。由于卷积神经网络对输入向量的局部特征比较敏感,因此在进行训练时,使用不同个数的卷积核对输入样本进行处理,之后对所有的输出做最大池化处理,得到池化后输出的向量。通过全连接层将输出的向量转化为三种属性类型的结果。训练时修改每次训练的样本集合数,并动态调整学习率,使用正则方式减少过拟合,最终得到满足准确率要求的模型。
在本实施例中,终端可以使用长短期记忆网络对识别模型进行训练。长短期记忆网络模型可以对文本的上下文的关联关系进行识别,由于评论中存在负面情绪的特定词语,因此对于较长的评论文本,使用长短期记忆网络有较好的识别效果。通过对样本进行向量化处理,长短期记忆网络使用门控状态学习向量间的组合关系,最终得到在长文本上识别效果较好的识别模型。
在实际应用中,终端可采用投票机制综合卷积神经网络识别模型和长短期记忆网络识别模型识别的结果,根据两个识别模型的识别结果对同一条评论信息进行分类,以确定该评论信息的属性类型。通过综合两种识别模型的识别结果能够更准确地确定评论信息的属性类型。
在一个实施例中,该确定该目标信息的负面评论信息,包括:根据该目标信息的评论信息的属性类型获取该目标信息的负面评论信息。
具体地,终端按照属性类型将该目标信息的评论信息进行分类,得到正面属性的评论信息、中性属性的评论信息和负面评论的属性信息。接着,终端根据负面属性类型获取该目标信息的负面评论信息。按照目标信息的评论信息的属性类型可将评论信息分类,实现每类评论信息的分离,再根据负面属性可快速准确地得到该目标信息的所有负面评论信息。
在一个实施例中,如图5所示,该根据该目标信息的负面评论信息确定负面评论信息的权重,包括:
步骤502,确定每条负面评论信息的点赞数。
其中,点赞是指用户对某条目标信息或评论信息的赞同的观点。点赞数是指对某条目标信息或评论信息的持赞同观点的用户数量。用户对目标信息和对该目标信息的正面评论信息的点赞表示该用户对该目标信息或正面评论信息的赞同。用户对该目标信息的负面评论信息的点赞表示该用户对该负面评论信息的赞同,同时也表示对该目标信息的不赞同的观点。
具体地,当用户看到目标信息时,经常会翻看其它用户对该目标信息的评论。当用户发现某条评论信息符合自己的观点或符合自己内心想表达的情绪时,用户往往会使用点赞表达自己的态度。则为了正确检测用户对目标信息所表达出的不赞同观点,终端需要确定每一条负面评论信息的点赞数量,以确定目标信息的平面评论的数量。
步骤504,根据每条负面评论信息的点赞数,确定每条负面评论信息的权重。
具体地,终端确定一条负面评论信息的点赞数后,使用指数稀释负面评论信息的点赞数量,并使用一系数与指数的结果相乘,取其相乘结果的倒数得到该条负面评论信息的权重。其中,该系数为经过多次训练得到用于计算评论信息的权重的常数。类似地,终端可使用相同的方式计算出该目标信息的每条负面评论信息的权重。
步骤506,根据每条负面评论信息的权重确定该目标信息的负面评论信息的权重。
具体地,终端计算出每条负面评论信息的权重后,可将每条负面评论信息的权重求和,得到总权重。该总权重即为该目标信息的负面评论信息的权重。
例如,终端可按照公式wn=k*exp-0.1*c计算出每一条负面评论信息的权重,其中,wn为一条负面评论信息的权重,c为该负面评论信息的点赞数。k为计算出每一条负面评论信息的权重的系数,k可以为0.3。终端计算出每条负面评论信息的权重后,可根据每一条负面评论信息的权重计算出所有负面评论信息的权重,即W=w1+w2+…+wn。W即为该目标信息的负面评论信息的权重。
上述信息处理方法中,通过确定目标信息每条负面评论的点赞数,可得到每条评论信息的权重,避免了仅计算负面评论信息的数量而忽略用户对负面评论信息的点赞数,导致对该目标信息是否为可疑信息的判断失误的问题。通过每条负面评论信息的权重,可计算出目标信息的所有负面评论信息的权重,使用权重而不直接使用数量表示用户对该目标信息的观点,能够避免因负面评论信息的点赞数过多,影响对该目标信息的整体评价的问题。
如图6所示,为一个实施例中展示对目标信息的评论信息的界面图。终端在该界面图中确定每条评论信息的属性类型。在该界面图中,用户1对目标信息的评论信息为“小学文化不如,乱写字”,可判定该评论信息为负面评论信息。对该负面评论信息的点赞数为149,终端可根据该点赞数149计算出该负面评论信息的权重。终端获取用户2的评论信息,该评论信息为“标题党”,终端根据该评论信息提取特征词,将特征词“标题党”与预设的属性词匹配,可确定该评论信息为评论信息。接着,终端获取该负面评论信息的点赞数,根据点赞数计算该负面评论信息的权重。接着,根据每个负面评论信息的权重可计算出该目标信息的负面评论信息的总权重,从而可判断该目标信息是否为可疑信息。
在一个实施例中,如图7所示,在确定该目标信息为可疑信息之后,该方法还包括:
步骤702,通过识别模型提取确定为可疑信息的目标信息,该识别模型是根据目标信息的负面评论信息的权重识别该目标信息是否为可疑信息的模型。
具体地,识别模型是根据目标信息的负面评论信息的权重识别该目标信息是否为可疑信息的模型。终端将该目标信息的评论信息输入识别模型后,得到该各评论信息对应的属性类型。根据属性类型可得到负面评论信息,并通过负面评论信息的权重确定该目标信息是否为可疑信息。确定该目标信息为可疑信息后,识别模型可将该目标信息提取出来。接着,终端可将该目标信息添加到待处理页面中,以对该目标信息进行进一步处理。
步骤704,将该目标信息进行复核,确定该目标信息所属的类别。
其中,复核是指将目标信息进行再次检测,以确定该目标信息是否符合要求。目标信息所属的类别包括存在安全隐患的、未达到推送标准的、不存在安全隐患且达到推送标准,以及达到推送标准且内容不符合预设要求的类别。
具体地,终端检测目标信息的内容,根据目标信息的内容确定该目标信息中是否存在安全隐患,确定该目标信息是否达到平台推送的标准,确定该目标信息是否不存在安全隐患且达到推送标准,以及确定该目标信息是否达到推送标准但内容不符合预设要求,从而确定该目标信息所属的类别。
步骤706,将该目标信息按照所属的类别进行相应的处理。
具体地,终端确定该目标信息所属的类别后,获取该目标信息所属类别对应的处理方式,按照该目标信息所属类别对应的处理方式对该目标信息进行进一步处理。
上述信息处理方法中,根据提取确定为可疑信息的目标信息,并对该目标信息进行复核,以确定该目标信息的所属类别,按照对应类别的处理方式对该目标信息进行处理。使得能够将确定为可疑信息的目标信息进行分类,按照不同类别的方式对目标信息进行不同的处理,从而能够更专业更有效对可疑信息进行处理。同时避免了因不具备某些专业知识而无法识别目标信息中存在的问题的情况。
在一个实施例中,终端确定该目标信息为可疑信息后,还包括:确定该目标信息的所属领域;将该目标信息添加到待复核进程中该目标信息所属领域的进程中。
其中,目标信息的所属的领域可以是社会类、汽车类、游戏类、军事类和动漫类等。目标信息的领域包括但不限于上述举例的几个领域。
具体地,终端可将待复核的进程按照不同的领域分类。终端确定该目标信息为可疑信息后,可根据该目标信息的内容确定该目标信息属于哪个领域。接着,终端将目标信息添加到待复核的进程中该目标信息所属的领域内。通过将确定为可疑信息的目标信息归类到所属的领域中,以便根据该领域的专业知识对该目标信息进行分析,从而能够对该目标信息进行专业的处理。
在一个实施例中,终端将待复核的目标信息发送给权限级别为审核员的第一账户对应的第一终端处理;接收第一终端执行目标信息的复核任务时上传的复核结果信息;当复核结果信息中存在待处理标识时,将待复核的目标信息发送至权限级别为编辑团队的第二账户对应的第二终端;接收权限级别为编辑团队的第二账户对应的第二终端上传的复核结果信息,根据复核结果信息对该目标信息进行相应地处理。
其中,审核员为具有某些领域的专业知识的审核人员。待处理标识是指该目标信息中还存在审核员无法处理的问题。
具体地,终端根据识别目标信息的内容,确定目标信息所属的领域,将待复核的目标信息发送给该目标信息所属领域的权限级别为审核员的第一账户对应的第一终端。由具有该领域的专业知识背景的审核员对该目标信息的内容进行检测,以确定该目标信息中是否存在问题。并根据检测的结果生成复核结果信息,返回给终端。例如,该目标信息属于历史领域,则将该目标信息发送给历史领域的权限级别为审核员的第一账户对应的第一终端。由具有历史领域知识背景的审核员对该目标信息进行检测,以确定该目标信息中是否存在不符合历史史实等问题。
接着,终端接收第一终端执行目标信息的处理任务时上传的复核结果信息。该复核结果信息中包括所属领域的审核员根据对该目标信息的检测生成的结果。例如,复核结果信息中包括该目标信息中存在的问题,即该目标信息中是否存在安全隐患、该目标信息是否达到推送标准和该目标信息是否达到推送标准但内容不符合预设要求等。终端接收第一终端上传的复核结果信息,根据复核结果信息中记录的该目标信息存在的问题进行相应地处理。例如,当该目标信息存在安全隐患时,终端删除该目标信息。当该目标信息未达到推送标准时,终端撤销对该目标信息的推送。当该目标信息不存在安全隐患且达到推送标准时,终端可以保持对该目标信息的推送。当该目标信息达到推送标准且内容不符合预设要求时,终端可设置该目标信息设置的内容标签,并确定设置内容标签后的目标信息的目标推送对象。接着,终端将该设置标签后的目标信息推送给该目标推送对象。
当终端检测到该复核结果信息中存在待处理标识时,表明该目标信息中还存在未能识别或审核人员无法确定的问题。则终端将待复核的目标信息发送至权限级别为编辑团队的第二账户对应的第二终端,由编辑团队检测该目标信息中存在的问题,以及需要采取的措施。编辑团队检测该目标信息中存在的问题,并整理生成复核结果信息,通过第二账户对应的第二终端将该编辑团队整理的复核结果信息上传至终端。终端接收该第二账号对应的第二终端上传的复核结果信息,根据复核结果信息对该目标信息进行相应地处理。
上述信息处理方法中,将目标信息发送给权限级别为审核员的第一账户对应的第一终端处理,通过具有专业知识背景的审核员对该目标信息进行复核,能够确定该目标信息中是否存在所属领域的低质量或虚假问题,解决了因不具备某领域的专业知识背景而无法检测目标信息中存在的问题的情况。并且,将该目标信息所属领域的审核员也无法处理的问题交由编辑团队把关,由编辑团队确定最终的处理方案。通过多层管理人员的配合,对可疑信息进行明确分类,从而明确该目标信息的最终处理手段。
在一个实施例中,该信息处理方法还包括:通过规则引擎和权重阈值,对目标信息进行处理。
其中,规则引擎是指使用预先定义的语义模块编写业务决策,规则引擎能够根据业务规则做出业务决策。规则引擎可包括关键词、正则规则和内容特征等。
具体地,识别模型通过训练样本经过反复训练才能够识别目标信息是否为可疑信息。当线上出现新的情况,例如,出现的新的网络用语等,识别模型还未针对新的情况进行学习,无法识别新出现的网络用语是否存在问题。这种情况下,可以通过运营人员使用运营工具配置规则引擎,包括设置关键词、正则规则和内容特征等,并设定权重阈值,满足运营配置的规则和权重阈值后的目标信息内容也会被确定为可疑信息处理。配置的规则能够立即生效,对于线上新出现的情况,能够立即进行处理。
在一个实施例中,该信息处理方法还包括:获取积累的新样本,将该新样本作为训练样本;根据该训练样本对识别模型进行训练。
其中,新样本是指通过人工运营配置的规则引擎和权重阈值提取出来的评论信息。
具体地,终端获取运营人员通过配置的规则引擎和权重阈值提取出来的评论信息。该评论信息中存在新出现的词使得识别模型无法识别该评论信息所属的属性类型,因而无法识别该评论信息对应的目标信息是否存在问题。则终端将该评论信息进行分词,并获取对应的词向量,将标注好属性类型的评论信息和词向量作为新的训练样本输入到识别模型中。属性类型是评论信息属于正面评论信息、中性评论信息或负面评论信息中的一种。终端使用标注好属性类型的评论信息和词向量的训练样本训练识别模型,在训练修改训练的样本集合数,并动态调整学习率,使用L2正则减少过拟合,最终能够识别新出现的词的识别模型。通过将人为干预提取出的评论信息作为新的训练样本,以训练识别模型,从而提升识别模型的识别能力,不断优化识别模型。
如图8所示,为一个实施例中,终端将确定为可疑信息的目标信息提取到待处理页面中的界面图。该待处理页面中显示的被提取的目标信息的内容,触发该目标信息被添加到该待处理页面的信息,该目标信息的分类,发布该目标信息的账号,该目标信息的标签、页面浏览量(PV量)、点击率、评论量和分发出去的次数(BIU次数)等。该待处理页面包括热文复核领单、我的挂起、我的审核数据和审核管理等进程,用于展示被添加到该页面中的各个目标信息的处理进程。该界面中提供了监控纬度选项,分类选项以及添加到该待处理页面的日期。终端将确定为可疑信息的目标信息提添加到该待处理页面中,以对该目标信息进行复核处理。
在一个实施例中,该将该目标信息按照所属的类别进行相应的处理,包括:当该目标信息存在安全隐患时,删除该目标信息。
其中,安全隐患是指目标信息中存在涉及政治敏感、色情、暴力倾向和违反法律等内容。
具体地,终端检测出该目标信息中存在涉及政治敏感、色情、暴力倾向和违反法律等内容时,确定该目标信息存在安全隐患。则终端将该目标信息从推荐池内删除,并且将之前推荐给用户的该目标信息也进行删除,删除后可在原页面显示:该页面内容已删除的提示信息。通过复核检测该目标信息是否存在安全隐患,当存在安全隐患时删除该目标信息,以避免存在问题的信息在线上传播,危害网络安全。
在本实施例中,终端可获取白名单和黑名单中的至少一种,将该目标信息与白名单或黑名单中的至少一种进行对比。
其中,白名单中记录了不存在安全隐患的词或句子,黑名单中记录了存在安全隐患的词或句子。
具体地,终端将不存在安全隐患的词或句子整合为白名单。将存在政治敏感、色情、暴力倾向和违反法律等词整合为存在安全隐患的黑名单。终端确定该目标信息为可疑信息后,可获取白名单或黑名单,或同时获取白名单和白名单。接着,终端可将目标信息进行分词,并提取该目标信息中的关键词,将该目标信息中的关键词与白名单或黑名单进行对比。当该目标信息中的关键词与黑名单中的词的相似度大于或等于相似度阈值时,可判定该目标信息存在安全隐患。当该目标信息中的关键词与白名单中的词的相似度大于或等于相似度阈值时,可判定该目标信息不存在安全隐患。终端也可将目标信息拆分为多个句子,并提取该目标信息中的关键句子,将该目标信息中的关键句子与黑名单中的句子进行对比。当该目标信息中的关键句子与黑名单中的句子的相似度大于或等于相似度阈值时,可判定该目标信息存在安全隐患。当该目标信息中的关键句子与白名单中的句子的相似度大于或等于相似度阈值时,可判定该目标信息不存在安全隐患。该目标信息的关键词与白名单中的词的相似度阈值、目标信息的关键词与黑名单中的词的相似度阈值、该目标信息的关键句子与白名单中的句子的相似度阈值,以及目标信息的关键句子与黑名单中的句子的相似度阈值可以相同,也可以不相同。
在一个实施例中,该将该目标信息按照所属的类别进行相应的处理,包括:当该目标信息未达到推送标准时,撤销对该目标信息的推送。
其中,推送标准是指该目标信息的内容不涉及安全隐患,并且语句通顺、逻辑清晰、错别字少于指定数量,配图清晰等要求。
具体地,当终端检测出该目标信息不涉及安全隐患时,可进一步检测该目标信息的内容是否存在错别字,语句是否通顺、逻辑是否清晰和配图是否清晰等问题。当存在错别字时,检测错别字的数量是否少于指定数量,该指定数量可以根据目标信息的总字数决定。例如,可将错别字的指定数量设置为该目标信息的百分之十等。当终端检测到该目标信息未达到推送标准时,从推荐池中撤回该目标信息,以撤销平台对该目标信息的推送。但之前已推送的该目标信息不会从原有页面删除。通过当该目标信息未达到推送标准时,撤销对该目标信息的推送,使得能够对目标信息存在的内容进行明确分类,并按照目标信息中存在问题的严重程度进行不同的处理,从而对可疑信息进行更专业地评判和处理。
在一个实施例中,该将该目标信息按照所属的类别进行相应的处理,包括:当该目标信息不存在安全隐患且达到推送标准时,保持对该目标信息的推送。
具体地,当终端检测到目标信息不存在涉及政治敏感、色情、暴力倾向和违反法律等内容,并且,达到该目标信息的语句通顺、逻辑清晰、错别字少于指定数量和配图清晰的标准时,确定该目标信息的内容不存在任何可疑内容,已达到推送标准。则终端保持之前对该目标信息的推送,并且可以通过推送平台加大对该目标信息的推送,以便将优质的信息推送给更多的用户,有利于信息的传播。
在一个实施例中,如图9所示,该将该目标信息按照所属的类别进行相应的处理,包括:
步骤902,当该目标信息达到推送标准且内容不符合预设要求时,设置该目标信息设置的内容标签。
其中,内容标签是根据目标信息的内容为目标信息设置的标注。例如,对某些领域的研究和研读等不够专业的目标信息,可为该目标信息设置专业度不足的标签。对于某些涉及漫画的目标信息,可设置漫画党等内容标签。预设要求可以是指目标信息是否达到可推送给所有的用户的要求,例如,有些目标信息适合推送给所有用户,某些目标信息只适合推送给部分用户。
具体地,当终端检测到目标信息不存在涉及政治敏感、色情、暴力倾向和违反法律等内容,并且,达到该目标信息的语句通顺、逻辑清晰、错别字少于指定数量和配图清晰的标准时,确定该目标信息的内容不存在任何可疑内容,已达到推送标准。接着,终端可对该目标信息的内容进行识别,判断该目标信息是否可以或者是否有必要推送给所有的用户。接着,当终端确定该目标信息不适合推送给所有的用户时,可根据该目标信息的内容,为该目标信息设置对应的内容标签。
步骤904,确定设置内容标签后的目标信息的目标推送对象。
步骤906,将该设置标签后的目标信息推送给该目标推送对象。
其中,目标推送对象是指将目标信息的接收方。
具体地,当终端可进一步对该目标信息的内容进行识别,为该目标信息设置不同的目标推送对象。例如,某些军事类的目标信息可推送给经常关注军事类资讯新闻的用户,美妆等目标信息可推送给所有女生等。终端为设置内容标签后的目标信息设置目标推送对象后,可由推送平台将该设置标签后的目标信息推送给对应的目标推送对象。
上述信息处理方法,当目标信息达到推送标准且内容不符合预设要求,设置目标信息的内容标签,并确定该设置内容标签后的目标信息的目标推送对象,将设置标签后的目标信息推送给所述目标推送对象。使得目标信息能够有效地传播,将目标信息推送给可能感兴趣的对象,使得信息得到有效的利用,能够给潜在的用户提供资源。
在一个实施例中,在将该目标信息按照所属的类别进行相应的处理之后,该方法还包括:获取该目标信息的评论信息中未识别出属性类型的评论信息;将该未识别出属性类型的评论信息作为训练样本;根据该训练样本更新该识别模型。
具体地,将确定为可疑信息的目标信息按照存在的问题进行处理后,终端可获取识别模型无法识别出属性类型的评论信息。识别模型无法识别出属性类型的评论信息可能是因为该评论信息中出现了识别模型之前未学习过的新的词语。识别模型无法识别出属性类型的评论信息可经人工标注好每一条评论信息的属性类型后,将标注好属性类型的评论信息作为训练样本。将该训练样本输入到该识别模型中,终端使用标注好属性类型的评论信息训练识别模型,在训练中修改训练的样本集合数,并动态调整学习率,使用L2正则减少过拟合,最终能够识别新出现的词的识别模型。通过将识别模型无法识别出属性类型的评论信息作为新的训练样本,以训练识别模型,从而提升识别模型的识别能力,不断优化识别模型。
如图10所示,为一个实施例中,该信息处理方法的流程示意图。终端将目标信息和用户的评论信息输入到识别模型中,通过识别模型识别用户评论信息的情感为偏正面、无明显情感倾向或偏负面,即评论信息的属性类型。当用户对目标信息的负面评论信息的权重大于或等于权重阈值时,终端从推荐池中召回该目标信息,并复核该目标信息是否存在问题,以及具体存在的问题。另外,对于某些识别模型无法识别的目标信息,可通过产品运营人工设定评论关键词通道,能够实时丰富更新通道,使之快速作用于线上,同时可以作为识别模型能力的补充。当目标信息的评论信息满足设定的规则条件时,终端从推荐池中召回该目标信息,并通过人工复核该目标信息是否存在问题,以及具体存在的问题。经过复核后确定用户舆论情况差的低质量的目标信息下架。另外,将复核的目标信息对应的评论信息形成样本库,通过样本库再次训练识别模型,从而提高识别模型的识别能力。
在一个实施例中,该信息处理方法包括:
终端获取目标信息,并获取目标信息的每条评论信息,提取每条评论信息中的特征词。
接着,终端将特征词与预设的属性词进行匹配。
接着,当匹配成功时,终端确定与特征词匹配成功的属性词所对应的属性类型。
进一步地,终端将与特征词匹配成功的属性词所对应的属性类型作为该评论信息的属性类型。
接着,终端根据目标信息的评论信息的属性类型获取目标信息的负面评论信息。
接着,终端确定每条负面评论信息的点赞数。
接着,终端根据每条负面评论信息的点赞数,确定每条负面评论信息的权重。
进一步地,终端根据每条负面评论信息的权重确定目标信息的负面评论信息的权重。
接着,当目标信息的负面评论信息的权重大于或等于权重阈值时,终端确定目标信息为可疑信息。
进一步地,终端提取确定为可疑信息的目标信息。
接着,终端将目标信息进行复核,确定目标信息所属的类别。
可选地,当目标信息存在安全隐患时,终端删除目标信息。
可选地,当目标信息未达到推送标准时,终端撤销对目标信息的推送。
可选地,当目标信息不存在安全隐患且达到推送标准时,终端保持对目标信息的推送。
可选地,当目标信息达到推送标准且内容不符合预设要求时,终端设置目标信息设置的内容标签。
进一步地,终端确定设置内容标签后的目标信息的目标推送对象。
接着,终端将设置标签后的目标信息推送给目标推送对象。
上述信息处理方法,通过提取评论信息的特征词,可得到代表该评论信息的观点的关键词。将该评论信息的特征词与预先设置的属性类别对应的属性词进行匹配,匹配成功则可确定该特征词对应的评论信息的属性类型。从而能够更准确地识别该评论信息的所表达的观点。按照目标信息的评论信息的属性类型可将评论信息分类,实现每类评论信息的分离,再根据负面属性可快速准确的得到该目标信息的所有负面评论信息。
通过确定目标信息每条负面评论的点赞数,可得到每条评论信息的权重,避免了仅计算负面评论信息的数量而忽略用户对负面评论信息的点赞数,导致对该目标信息是否为可疑信息的判断失误的问题。通过每条负面评论信息的权重,可计算出目标信息的所有负面评论信息的权重,使用权重而不直接使用数量表示用户对该目标信息的观点,能够避免因负面评论信息的点赞数过多,影响对该目标信息的整体评价的问题。
当目标信息的负面评论信息的权重大于或等于权重阈值时,认为负面评论信息所占的比重超出了正常范围,则可确定该目标信息存在问题,将该目标信息作为可疑信息。
根据提取确定为可疑信息的目标信息,并对该目标信息进行复核,以确定该目标信息的所属类别,按照对应类别的处理方式对该目标信息进行处理。使得能够将确定为可疑信息的目标信息进行分类,按照不同类别的方式对目标信息进行不同的处理,从而能够更专业更有效对可疑信息进行处理。同时避免了因不具备某些专业知识而无法识别目标信息中存在的问题的情况。
通过复核检测该目标信息是否存在安全隐患,当存在安全隐患时删除该目标信息,以避免存在问题的信息在线上传播,危害网络安全。当该目标信息未达到推送标准时,撤销对该目标信息的推送,使得能够对目标信息存在的内容进行明确分类,并按照目标信息中存在问题的严重程度进行不同的处理,从而对可疑信息进行更专业地评判和处理。
当该目标信息不存在安全隐患且达到推送标准时,保持之前对该目标信息的推送,并且可以通过推送平台加大对该目标信息的推送,以便将优质的信息推送给更多的用户,有利于信息的传播。
本方案通过使用目标信息的评论信息的权重确定该目标信息是否存在问题,存在问题时采取相应地处理方式,解决了传统的识别方式中因不具备专业知识背景而无法识别某些领域的内容是否存在明显错误的问题。
图2-图9为一个实施例中信息处理方法的流程示意图。应该理解的是,虽然图2-图9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图9中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种信息处理装置,该装置包括:获取模块1102、权重确定模块1104和可疑信息确定模块1106。
获取模块1102,用于获取目标信息;
该获取模块1102还用于确定该目标信息的负面评论信息;
权重确定模块1104,用于根据该目标信息的负面评论信息确定负面评论信息的权重;
可疑信息确定模块1106,用于当该目标信息的负面评论信息的权重大于或等于权重阈值时,则确定该目标信息为可疑信息。
上述信息处理装置,通过获取目标信息,并确定目标信息的负面评论信息,再根据负面评论信息确定目标信息的负面评论信息的权重,可计算出该目标信息的负面评论信息所占的比重。当目标信息的负面评论信息的权重大于或等于权重阈值时,认为负面评论信息所占的比重超出了正常范围,则可确定该目标信息存在问题,将该目标信息作为可疑信息。通过使用目标信息的评论信息的权重确定该目标信息是否存在问题,解决了传统的识别方式中因不具备专业知识背景而无法识别某些领域的内容是否存在明显错误的问题。
在一个实施例中,该信息处理装置还包括:属性类型确定模块。属性类型确定模块用于:获取该目标信息的每条评论信息,提取该每条评论信息中的特征词;将该特征词与预设的属性词进行匹配;当匹配成功时,确定与该特征词匹配成功的属性词所对应的属性类型;将与该特征词匹配成功的属性词所对应的属性类型作为该评论信息的属性类型。通过提取评论信息的特征词,可得到代表该评论信息的观点的关键词。将该评论信息的特征词与预先设置的属性类别对应的属性词进行匹配,匹配成功则可确定该特征词对应的评论信息的属性类型。从而能够更准确地识别该评论信息的所表达的观点。
在一个实施例中,属性类型确定模块还用于:根据该目标信息的评论信息的属性类型获取该目标信息的负面评论信息。按照目标信息的评论信息的属性类型可将评论信息分类,实现每类评论信息的分离,再根据负面属性可快速准确的得到该目标信息的所有负面评论信息。
在一个实施例中,权重确定模块1104还用于:确定每条负面评论信息的点赞数;根据该每条负面评论信息的点赞数,确定该每条负面评论信息的权重;根据该每条负面评论信息的权重确定该目标信息的负面评论信息的权重。通过确定目标信息每条负面评论的点赞数,可得到每条评论信息的权重,避免了仅计算负面评论信息的数量而忽略用户对负面评论信息的点赞数,导致对该目标信息是否为可疑信息的判断失误的问题。通过每条负面评论信息的权重,可计算出目标信息的所有负面评论信息的权重,使用权重而不直接使用数量表示用户对该目标信息的观点,能够避免因负面评论信息的点赞数过多,影响对该目标信息的整体评价的问题。
在一个实施例中,该信息处理装置还包括:训练理模块。该训练模块用于:获取目标信息的评论信息中未识别出属性类型的评论信息;将该未识别出属性类型的评论信息作为训练样本;根据该训练样本更新该识别模型。通过将识别模型无法识别出属性类型的评论信息作为新的训练样本,以训练识别模型,从而提升识别模型的识别能力,不断优化识别模型。
在一个实施例中,该信息处理装置还包括:处理模块。该处理模块用于:提取确定为可疑信息的目标信息;将该目标信息进行复核,确定该目标信息所属的类别;将该目标信息按照所属的类别进行相应的处理。根据提取确定为可疑信息的目标信息,并对该目标信息进行复核,以确定该目标信息的所属类别,按照对应类别的处理方式对该目标信息进行处理。使得能够将确定为可疑信息的目标信息进行分类,按照不同类别的方式对目标信息进行不同的处理,从而能够更专业更有效对可疑信息进行处理。同时避免了因不具备某些专业知识而无法识别目标信息中存在的问题的情况。
在一个实施例中,该处理模块还用于:当该目标信息存在安全隐患时,删除该目标信息。通过复核检测该目标信息是否存在安全隐患,当存在安全隐患时删除该目标信息,以避免存在问题的信息在线上传播,危害网络安全。
在一个实施例中,该处理模块还用于:当该目标信息未达到推送标准时,撤销对该目标信息的推送。通过当该目标信息未达到推送标准时,撤销对该目标信息的推送,使得能够对目标信息存在的内容进行明确分类,并按照目标信息中存在问题的严重程度进行不同的处理,从而对可疑信息进行更专业地评判和处理。
在一个实施例中,该处理模块还用于:当该目标信息不存在安全隐患且达到推送标准时,保持对该目标信息的推送。当该目标信息的内容不存在任何可疑内容,已达到推送标准时,保持之前对该目标信息的推送,并且可以通过推送平台加大对该目标信息的推送,以便将优质的信息推送给更多的用户,有利于信息的传播。
在一个实施例中,该处理模块还用于:当该目标信息达到推送标准且内容不符合预设要求时,设置该目标信息设置的内容标签;确定设置内容标签后的目标信息的目标推送对象;将该设置标签后的目标信息推送给该目标推送对象。当目标信息达到推送标准且内容不符合预设要求,设置目标信息的内容标签,并确定该设置内容标签后的目标信息的目标推送对象,将设置标签后的目标信息推送给所述目标推送对象。使得目标信息能够有效地传播,将目标信息推送给可能感兴趣的对象,使得信息得到有效的利用,能够给潜在的用户提供资源。
图12示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图12所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现信息处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行信息处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的信息处理装置可以实现为一种计算机程序的形式,计算机程序可在如图12所示的计算机设备上运行。计算机设备的存储器中可存储组成该信息处理装置的各个程序模块,比如,图11所示的获取模块、权重确定模块和可疑信息确定模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的信息处理方法中的步骤。
例如,图12所示的计算机设备可以通过如图11所示的信息处理装置中的获取模块1102执行获取目标信息;还执行确定该目标信息的负面评论信息的步骤。计算机设备可通过权重确定模块1104执行根据目标信息的负面评论信息确定确定该负面评论信息的权重的步骤。计算机设备可通过可疑信息确定模块1106执行当该目标信息的负面评论信息的权重大于或等于权重阈值时,则确定该目标信息为可疑信息的步骤。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述信息处理方法的步骤。此处信息处理方法的步骤可以是上述各个实施例的信息处理方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述信息处理方法的步骤。此处信息处理方法的步骤可以是上述各个实施例的信息处理方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (13)

1.一种信息处理方法,包括:
获取目标信息;
确定所述目标信息的负面评论信息;
根据所述目标信息的负面评论信息确定所述负面评论信息的权重;
当所述目标信息的负面评论信息的权重大于或等于权重阈值时,则确定所述目标信息为可疑信息。
2.根据权利要求1所述的方法,其特征在于,在所述确定所述目标信息的负面评论信息之前,还包括:
获取所述目标信息的每条评论信息,提取所述每条评论信息中的特征词;
将所述特征词与预设的属性词进行匹配;
当匹配成功时,确定与所述特征词匹配成功的属性词所对应的属性类型;
将与所述特征词匹配成功的属性词所对应的属性类型作为所述评论信息的属性类型。
3.根据权利要求2所述的方法,其特征在于,所述确定所述目标信息的负面评论信息,包括:
根据所述目标信息的评论信息的属性类型获取所述目标信息的负面评论信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标信息的负面评论信息确定所述负面评论信息的权重,包括:
确定每条负面评论信息的点赞数;
根据所述每条负面评论信息的点赞数,确定每条负面评论信息的权重;
根据所述每条负面评论信息的权重确定所述目标信息的负面评论信息的权重。
5.根据权利要求1所述的方法,其特征在于,在确定所述目标信息为可疑信息之后,所述方法还包括:
通过识别模型提取确定为可疑信息的目标信息,所述识别模型是根据所述目标信息的负面评论信息的权重识别所述目标信息是否为可疑信息的模型;
将所述目标信息进行复核,确定所述目标信息所属的类别;
将所述目标信息按照所属的类别进行相应的处理。
6.根据权利要求5所述的方法,其特征在于,所述将所述目标信息按照所属的类别进行相应的处理,包括:
当所述目标信息存在安全隐患时,删除所述目标信息。
7.根据权利要求5所述的方法,其特征在于,所述将所述目标信息按照所属的类别进行相应的处理,包括:
当所述目标信息未达到推送标准时,撤销对所述目标信息的推送。
8.根据权利要求5所述的方法,其特征在于,所述将所述目标信息按照所属的类别进行相应的处理,包括:
当所述目标信息不存在安全隐患且达到推送标准时,保持对所述目标信息的推送。
9.根据权利要求5所述的方法,其特征在于,所述将所述目标信息按照所属的类别进行相应的处理,包括:
当所述目标信息达到推送标准且内容不符合预设要求时,设置所述目标信息设置的内容标签;
确定设置内容标签后的目标信息的目标推送对象;
将所述设置标签后的目标信息推送给所述目标推送对象。
10.根据权利要求5所述的方法,其特征在于,在将所述目标信息按照所属的类别进行相应的处理之后,所述方法还包括:
获取所述目标信息的评论信息中未识别出属性类型的评论信息;
将所述未识别出属性类型的评论信息作为训练样本;
根据所述训练样本更新所述识别模型。
11.一种信息处理装置,其特征在于,所述装置包括:
获取模块,用于获取目标信息;
所述获取模块,还用于确定所述目标信息的负面评论信息;
权重确定模块,用于根据所述目标信息的负面评论信息确定负面评论信息的权重;
可疑信息确定模块,用于当所述目标信息的负面评论信息的权重大于或等于权重阈值时,则确定所述目标信息为可疑信息。
12.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
CN201910322954.7A 2019-04-22 2019-04-22 信息处理方法、装置、计算机可读存储介质和计算机设备 Active CN110084373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910322954.7A CN110084373B (zh) 2019-04-22 2019-04-22 信息处理方法、装置、计算机可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910322954.7A CN110084373B (zh) 2019-04-22 2019-04-22 信息处理方法、装置、计算机可读存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN110084373A true CN110084373A (zh) 2019-08-02
CN110084373B CN110084373B (zh) 2021-08-24

Family

ID=67415913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910322954.7A Active CN110084373B (zh) 2019-04-22 2019-04-22 信息处理方法、装置、计算机可读存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110084373B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090813A (zh) * 2019-12-20 2020-05-01 腾讯科技(深圳)有限公司 一种内容处理方法、装置和计算机可读存储介质
CN111400437A (zh) * 2020-02-19 2020-07-10 北京三快在线科技有限公司 互联网信息响应方法、装置、电子设备和计算机可读介质
CN112417258A (zh) * 2020-12-02 2021-02-26 深圳市罗湖医院集团 健康知识搜索引擎中谣言信息的粉碎方法、平台及终端

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536980A (zh) * 2014-12-05 2015-04-22 百度在线网络技术(北京)有限公司 一种确定候评项的质量信息的方法与装置
CN104899309A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 展示事件评论观点的方法和装置
CN105354305A (zh) * 2015-11-05 2016-02-24 北京邮电大学 一种网络谣言的识别方法及装置
CN105872593A (zh) * 2016-03-21 2016-08-17 乐视网信息技术(北京)股份有限公司 弹幕推送方法及装置
CN106156004A (zh) * 2016-07-04 2016-11-23 中国传媒大学 基于词向量的针对电影评论信息的情感分析系统及方法
CN107729538A (zh) * 2017-10-31 2018-02-23 广东欧珀移动通信有限公司 评论信息处理方法、装置、终端设备及存储介质
CN107844992A (zh) * 2017-10-31 2018-03-27 广东欧珀移动通信有限公司 评论信息处理方法、装置、终端设备及存储介质
CN107911448A (zh) * 2017-11-14 2018-04-13 北京金山安全软件有限公司 一种内容推送方法及装置
CN109086422A (zh) * 2018-08-08 2018-12-25 武汉斗鱼网络科技有限公司 一种机器弹幕用户的识别方法、装置、服务器和存储介质
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109614541A (zh) * 2018-12-04 2019-04-12 北京艾漫数据科技股份有限公司 一种事件识别方法、介质、装置以及计算设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536980A (zh) * 2014-12-05 2015-04-22 百度在线网络技术(北京)有限公司 一种确定候评项的质量信息的方法与装置
CN104899309A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 展示事件评论观点的方法和装置
CN105354305A (zh) * 2015-11-05 2016-02-24 北京邮电大学 一种网络谣言的识别方法及装置
CN105872593A (zh) * 2016-03-21 2016-08-17 乐视网信息技术(北京)股份有限公司 弹幕推送方法及装置
CN106156004A (zh) * 2016-07-04 2016-11-23 中国传媒大学 基于词向量的针对电影评论信息的情感分析系统及方法
CN107729538A (zh) * 2017-10-31 2018-02-23 广东欧珀移动通信有限公司 评论信息处理方法、装置、终端设备及存储介质
CN107844992A (zh) * 2017-10-31 2018-03-27 广东欧珀移动通信有限公司 评论信息处理方法、装置、终端设备及存储介质
CN107911448A (zh) * 2017-11-14 2018-04-13 北京金山安全软件有限公司 一种内容推送方法及装置
CN109086422A (zh) * 2018-08-08 2018-12-25 武汉斗鱼网络科技有限公司 一种机器弹幕用户的识别方法、装置、服务器和存储介质
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109614541A (zh) * 2018-12-04 2019-04-12 北京艾漫数据科技股份有限公司 一种事件识别方法、介质、装置以及计算设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090813A (zh) * 2019-12-20 2020-05-01 腾讯科技(深圳)有限公司 一种内容处理方法、装置和计算机可读存储介质
CN111090813B (zh) * 2019-12-20 2021-09-28 腾讯科技(深圳)有限公司 一种内容处理方法、装置和计算机可读存储介质
CN111400437A (zh) * 2020-02-19 2020-07-10 北京三快在线科技有限公司 互联网信息响应方法、装置、电子设备和计算机可读介质
CN112417258A (zh) * 2020-12-02 2021-02-26 深圳市罗湖医院集团 健康知识搜索引擎中谣言信息的粉碎方法、平台及终端

Also Published As

Publication number Publication date
CN110084373B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
US11494648B2 (en) Method and system for detecting fake news based on multi-task learning model
Li et al. Mining opinion summarizations using convolutional neural networks in Chinese microblogging systems
Polignano et al. A comparison of word-embeddings in emotion detection from text using bilstm, cnn and self-attention
Potha et al. Cyberbullying detection using time series modeling
Bu et al. A hybrid deep learning system of CNN and LRCN to detect cyberbullying from SNS comments
Volkova et al. Identifying effective signals to predict deleted and suspended accounts on twitter across languages
Lo et al. An unsupervised multilingual approach for online social media topic identification
Scrivens et al. Searching for extremist content online using the dark crawler and sentiment analysis
CN110084373A (zh) 信息处理方法、装置、计算机可读存储介质和计算机设备
Nguyen et al. Statistical approach for figurative sentiment analysis on social networking services: a case study on twitter
Chamberlain Groupsourcing: Distributed problem solving using social networks
Alawneh et al. Sentiment analysis-based sexual harassment detection using machine learning techniques
WO2020252982A1 (zh) 文本情绪分析方法及装置、电子设备和计算机非易失性可读存储介质
Lin et al. Rumor detection with hierarchical recurrent convolutional neural network
CN113342972A (zh) 舆情识别模型训练方法、系统以及舆情风险监测方法和系统
Kedzie et al. Real-time web scale event summarization using sequential decision making
Kaghazgaran et al. Wide-ranging review manipulation attacks: Model, empirical study, and countermeasures
Guy et al. Identifying informational vs. conversational questions on community question answering archives
CN113704459A (zh) 一种基于神经网络的在线文本情感分析方法
Al-Tai et al. Deep learning for fake news detection: Literature review
Fadel et al. A sentiment analysis model for terrorist attacks reviews on twitter
MacDermott et al. Using deep learning to detect social media ‘trolls’
De Kock et al. Leveraging Wikipedia article evolution for promotional tone detection
Zhang et al. Cyberbullying detection with birnn and attention mechanism
Bhaumik et al. Adapting emotion detection to analyze influence campaigns on social media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant