CN110309421B - 一种ugc内容质量评估方法、装置及电子设备 - Google Patents

一种ugc内容质量评估方法、装置及电子设备 Download PDF

Info

Publication number
CN110309421B
CN110309421B CN201910535860.8A CN201910535860A CN110309421B CN 110309421 B CN110309421 B CN 110309421B CN 201910535860 A CN201910535860 A CN 201910535860A CN 110309421 B CN110309421 B CN 110309421B
Authority
CN
China
Prior art keywords
filtering
keyword
ugc content
preset
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910535860.8A
Other languages
English (en)
Other versions
CN110309421A (zh
Inventor
张骏杰
宋忠良
李阳幸子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910535860.8A priority Critical patent/CN110309421B/zh
Publication of CN110309421A publication Critical patent/CN110309421A/zh
Application granted granted Critical
Publication of CN110309421B publication Critical patent/CN110309421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种UGC内容质量评估方法、装置及电子设备,应用于互联网技术领域,所述方法包括:获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行评价操作的次数;根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词,如果包含,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度;根据评价操作的次数、评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值。本发明可提高对UGC内容质量评估的准确性。

Description

一种UGC内容质量评估方法、装置及电子设备
技术领域
本发明涉及互联网技术领域,特别是涉及一种UGC内容质量评估方法、装置及电子设备。
背景技术
在互联网应用中,用户可以将自己原创的内容通过互联网平台进行展示或者提供给其他用户。UGC(User Generated Content,用户原创内容)包括:社交网络中的发表的日志、照片、视频等。目前对UGC内容质量的评估方法中,可以将含有涉政、反动和不和谐等关键词的UGC内容认为是低质量的UGC内容。由于通过关键词对UGC内容质量评估的准确性较低,仍然存在很多低质量的UGC内容,导致用户体验较差。
发明内容
本发明实施例的目的在于提供一种UGC内容质量评估方法、装置及电子设备,以提高对UGC内容质量评估的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种UGC内容质量评估方法,所述方法包括:
获取待评估的UGC内容,以及浏览所述UGC内容的用户对所述UGC内容进行评价操作的次数,所述评价操作包括:正面评价操作和负面评价操作;
根据预先建立的过滤关键词库,判断所述UGC内容中是否包含所述过滤关键词库中的过滤关键词,所述过滤关键词库包括各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度;
如果所述UGC内容中包含所述过滤关键词库中的过滤关键词,将所述UGC内容中包含的所述过滤关键词库中的过滤关键词作为目标关键词,获取所述过滤关键词库中每个目标关键词的可信度;
根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值。
可选的,在所述根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值之后,所述方法还包括:
如果判断所述UGC内容的质量值小于预设过滤阈值,将所述UGC内容删除。
可选的,所述正面评价操作为顶操作,所述负面评价操作为踩操作,所述评价操作的次数包括:顶操作的次数和踩操作的次数,所述评价操作对应的预设操作评分包括:顶操作对应的预设操作评分和踩操作对应的预设操作评分。
可选的,所述根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值,包括:
所述UGC内容的质量值=所述顶操作的次数×所述顶操作对应的预设操作评分-所述踩操作的次数×所述踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。
可选的,所述过滤关键词库的建立方法包括:
获取各用户设置的各过滤关键词,并确定设置所述各过滤关键词的用户个数;
针对每个过滤关键词,根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度;
建立所述各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度的对应关系。
可选的,所述根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度,包括:
若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比;
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,所述预设权重系数为0~1之间的数。
第二方面,本发明实施例还提供了一种UGC内容质量评估装置,所述装置包括:
获取模块,用于获取待评估的UGC内容,以及浏览所述UGC内容的用户对所述UGC内容进行评价操作的次数,所述评价操作包括:正面评价操作和负面评价操作;
判断模块,用于根据预先建立的过滤关键词库,判断所述UGC内容中是否包含所述过滤关键词库中的过滤关键词,所述过滤关键词库包括各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度;
目标关键词确定模块,用于如果所述UGC内容中包含所述过滤关键词库中的过滤关键词,将所述UGC内容中包含的所述过滤关键词库中的过滤关键词作为目标关键词,获取所述过滤关键词库中每个目标关键词的可信度;
质量确定模块,用于根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值。
可选的,本发明实施例的UGC内容质量评估装置,还包括:
UGC内容删除模块,用于如果判断所述UGC内容的质量值小于预设过滤阈值,将所述UGC内容删除。
可选的,所述正面评价操作为顶操作,所述负面评价操作踩操作,所述评价操作的次数包括:顶操作的次数和踩操作的次数,所述评价操作对应的预设操作评分包括:顶操作对应的预设操作评分和踩操作对应的预设操作评分。
可选的,所述质量确定模块,具体用于所述UGC内容的质量值=所述顶操作的次数×所述顶操作对应的预设操作评分-所述踩操作的次数×所述踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。
可选的,本发明实施例的UGC内容质量评估装置,还包括:
过滤关键词库建立模块,用于获取各用户设置的各过滤关键词,并确定设置所述各过滤关键词的用户个数;针对每个过滤关键词,根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度;建立所述各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度的对应关系。
可选的,所述过滤关键词库建立模块包括:
可信度计算单元,用于若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比;
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,所述预设权重系数为0~1之间的数。
第三方面,本发明实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现上述任一所述的UGC内容质量评估方法的步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的UGC内容质量评估方法的步骤。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的UGC内容质量评估方法的步骤。
本发明实施例提供的UGC内容质量评估方法、装置及电子设备,由于过滤关键词库包括各过滤关键词以及设置各过滤关键词的用户个数,用户设置各过滤关键词表示用户对各过滤关键词的反馈,即用户将包含过滤关键词的UGC内容过滤掉。而浏览UGC内容的用户对UGC内容的评价操作,也表示用户对UGC内容的反馈。这样,根据过滤关键词库以及用户对UGC内容的评价操作计算UGC内容的质量值,即根据用户的反馈计算UGC内容的质量值,可以提高对UGC内容质量评估的准确性。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例的UGC内容质量评估方法的一种流程图;
图2为本发明实施例的UGC内容质量评估方法的另一种流程图;
图3为本发明实施例的UGC内容质量评估装置的一种结构图;
图4为本发明实施例的电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了解决相关技术中对UGC内容质量评估的准确性较低问题,本发明实施例提供了一种UGC内容质量评估方法、装置及电子设备,以提高对UGC内容质量评估的准确性。
下面首先对本发明实施例所提供的UGC内容质量评估方法进行详细介绍。
参见图1,图1为本发明实施例的UGC内容质量评估方法的一种流程图,包括以下步骤:
S101,获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行评价操作的次数,评价操作包括:正面评价操作和负面评价操作。
S102,根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词,过滤关键词库包括各过滤关键词、设置各过滤关键词的用户个数以及各过滤关键词的可信度。如果是,执行S103。
S103,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度。
S104,根据评价操作的次数、评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值。
图1所示实施例的有益效果在于,由于过滤关键词库包括各过滤关键词和设置各过滤关键词的用户个数,用户设置各过滤关键词表示用户对各过滤关键词的反馈,即用户将包含过滤关键词的UGC内容过滤掉。而浏览UGC内容的用户对UGC内容的评价操作,也表示用户对UGC内容的反馈。这样,根据过滤关键词库以及用户对UGC内容的评价操作计算UGC内容的质量值,即根据用户的反馈计算UGC内容的质量值,可以提高对UGC内容质量评估的准确性。
参见图2,图2为本发明实施例的UGC内容质量评估方法的另一种流程图,包括以下步骤:
S201,获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行顶操作和踩操作的次数。
具体的,UGC内容(例如,帖子、微博、朋友圈、弹幕等)指用户在互联网中公开分享的内容,UGC内容质量的高低存在差异,低质量的内容影响其他用户的体验。UGC内容在被分享之后,其他用户可以浏览UGC内容,并在浏览之后对UGC内容进行正面评价操作和负面评价操作,正面评价操作可以是顶操作(例如点赞),负面评价操作可以是踩操作(例如点踩)。顶操作表示其他用户喜欢该UGC内容,即UGC内容的质量较高,踩操作表示其他用户不喜欢该UGC内容,即UGC内容的质量较低。因此,在获取UGC内容之后,可以根据浏览UGC内容的用户对UGC内容进行顶操作和踩操作的次数对UGC内容的质量进行评估。
S202,根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词。
本发明实施例中,过滤关键词库的构建可以采纳用户的集体反馈。过滤关键词库中包括用户设置的各过滤关键词、设置各过滤关键词的用户个数以及各过滤关键词的可信度。每个过滤关键词的可信度是根据该过滤关键词的长度以及在过滤关键词库中设置该过滤关键词的用户个数的占比计算得到的,下文将对计算方法进行详细介绍。判断UGC内容中是否包含过滤关键词库中的过滤关键词的方法可以是,将过滤关键词库中的每个过滤关键词跟UGC内容进行对比,如果UGC内容中包含过滤关键词库中的过滤关键词,执行S203。
S203,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度。
具体的,由于过滤关键词库是预先建立的比较全面的过滤关键词库,如果UGC内容中包含过滤关键词库中的某些过滤关键词,此时,可以将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,根据过滤关键词库可以获取每个目标关键词的可信度。
S204,根据顶操作的次数、踩操作的次数、顶操作对应的预设操作评分、踩操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值。
本发明实施例中,UGC内容的质量值=顶操作的次数×顶操作对应的预设操作评分-踩操作的次数×踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。其中,顶操作和踩操作是用户的主动操作,对UGC内容的顶操作和踩操作,对该UGC内容的质量影响,可以大于目标关键词的影响。因此,UGC内容每被顶操作一次,其对应的预设操作评分可以为2;UGC内容每被踩操作一次,其对应的预设操作评分可以为2,预设关键词评分可以为1。当然,本发明对顶操作和踩操作对应的预设操作评分的大小以及预设关键词评分的大小不做限定。
S205,如果判断UGC内容的质量值小于预设过滤阈值,将UGC内容删除。
具体的,UGC内容的质量值越大,表示UGC内容质量越高,UGC内容的质量值越小,表示UGC内容质量越低。因此可以判断UGC内容的质量值是否小于预设过滤阈值,预设过滤阈值可以是根据经验设置的值,如果小于预设过滤阈值,表示UGC内容质量较低,可以将UGC内容删除。这样,可以过滤掉低质量的UGC内容。例如,UGC内容可以包括用户观看视频时分享的弹幕,那么在用户观看视频时,可以过滤掉低质量的弹幕,提升用户体验。
本发明实施例的UGC内容质量评估方法,在获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行顶操作和踩操作的次数后,根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词,如果包含,获取过滤关键词库中每个目标关键词的可信度;根据顶操作的次数、踩操作的次数、顶操作对应的预设操作评分、踩操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值;在判断UGC内容的质量值小于预设过滤阈值时,将UGC内容删除。可见,本发明基于过滤关键词库中的过滤关键词和顶踩操作对UGC内容的质量进行评估,也就是根据用户的反馈对UGC内容的质量进行评估,可以提高对UGC内容质量评估的准确性。并且,删除低质量UGC内容,可以提升用户体验。
可选的,图1实施例S102和图2实施例S202中,过滤关键词库的建立方法包括以下步骤:
第一步,获取各用户过滤的每个关键词,并确定设置每个关键词的用户个数。
具体的,若用户设置了某过滤关键词,系统提取该用户设置的该过滤关键词,设置该过滤关键词的用户个数为1。如果其他用户也设置了该过滤关键词,那么,设置该过滤关键词的用户个数加1,以此类推。
第二步,针对每个过滤关键词,根据该过滤关键词的长度以及在过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度。
本发明实施例中,过滤关键词库中被越多用户设置的过滤关键词,其可信度越高。在实际应用中,单字不成词的关键字,容易过滤掉大量的且质量无关的UGC内容,其可信度较低,过滤关键词的长度较长,UGC内容不容易被过滤掉,其可信度也较低。本发明的一种实现方式中,若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=过滤关键词库中设置该过滤关键词的用户个数的占比;预设长度可以是5或6等,在此不做限定。对于过滤关键词库中设置目标关键词的用户个数的占比,若过滤关键词库中包括的过滤关键词包括:“自古弹幕出人才”、“富贵色”、“坑一个”、“气人”和“脑子”,对应的设置该过滤关键词的用户个数依次为:1、3、4、6和8。那么,在此以过滤关键词“富贵色”进行举例说明,设置“富贵色”的用户个数为3,设置所有过滤关键词的用户个数为1+3+4+6+8=22,那么,过滤“富贵色”的用户个数占比为3/22。
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,预设权重系数设置为0~1之间的数。其中,不同的过滤关键词长度,对应的预设权重系数可以不同,过滤关键词长度越长,对应的预设权重系数越小,即预设权重系数与过滤关键词的长度成负相关。例如,如果预设长度为5,过滤关键词的长度为6时,对应的预设权重系数可以是0.9,过滤关键词的长度为7时,对应的预设权重系数可以是0.8。
第三步,建立各过滤关键词、设置各过滤关键词的用户个数以及各过滤关键词的可信度的对应关系。
本发明实施例中,还可以对各过滤关键词设置关键词ID,如果预设长度为5,关键词的长度为7时,对应的预设权重系数可以是0.8,得到的过滤关键词库可参见表1。
表1
Figure BDA0002101153450000091
这样,在建立过滤关键词库之后,可以根据过滤关键词库判断UGC内容中是否包含过滤关键词库中的过滤关键词,并在UGC内容中包含过滤关键词库中的过滤关键词时,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度。
相应于上述方法实施例,本发明实施例还提供了一种UGC内容质量评估装置,参见图3,图3为本发明实施例的UGC内容质量评估装置的一种结构图,包括:
获取模块301,用于获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行评价操作的次数,评价操作包括:正面评价操作和负面评价操作;
判断模块302,用于根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词,过滤关键词库包括各过滤关键词、设置各过滤关键词的用户个数以及各过滤关键词的可信度;
目标关键词确定模块303,用于如果UGC内容中包含过滤关键词库中的过滤关键词,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度;
质量确定模块304,用于根据评价操作的次数、评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值。
本发明实施例的UGC内容质量评估装置,由于过滤关键词库包括各过滤关键词和设置各过滤关键词的用户个数,用户设置各过滤关键词表示用户对各过滤关键词的反馈,即用户将包含过滤关键词的UGC内容过滤掉。而浏览UGC内容的用户对UGC内容的评价操作,也表示用户对UGC内容的反馈。这样,根据过滤关键词库以及用户对UGC内容的评价操作计算UGC内容的质量值,即根据用户的反馈计算UGC内容的质量值,可以提高对UGC内容质量评估的准确性。
可选的,本发明实施例的UGC内容质量评估装置,还包括:
UGC内容删除模块,用于如果判断UGC内容的质量值小于预设过滤阈值,将UGC内容删除。
可选的,正面评价操作为顶操作,负面评价操作为踩操作,评价操作的次数包括:顶操作的次数和踩操作的次数,评价操作对应的预设操作评分包括:顶操作对应的预设操作评分和踩操作对应的预设操作评分。
可选的,质量确定模块,具体用于UGC内容的质量值=顶操作的次数×顶操作对应的预设操作评分-踩操作的次数×踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。
可选的,本发明实施例的UGC内容质量评估装置,还包括:
过滤关键词库建立模块,用于获取各用户过滤的每个关键词,并确定设置每个过滤关键词的用户个数;针对每个过滤关键词,根据该过滤关键词的长度以及在过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度;建立各过滤关键词、设置各过滤关键词的用户个数以及各过滤关键词的可信度的对应关系。
可选的,过滤关键词库建立模块包括:
可信度计算单元,用于若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=过滤关键词库中设置该过滤关键词的用户个数的占比;
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,预设权重系数为0~1之间的数。
需要说明的是,本发明实施例的装置是应用上述UGC内容质量评估方法的装置,则上述UGC内容质量评估方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,参见图4,图4为本发明实施例的电子设备的结构图,包括:处理器401、通信接口402、存储器403和通信总线404,其中,处理器401、通信接口402、存储器403通过通信总线404完成相互间的通信;
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现上述实施例中任一UGC内容质量评估方法的步骤。
本发明实施例的电子设备中,处理器通过执行存储器上所存放的程序,获取待评估的UGC内容,以及浏览UGC内容的用户对UGC内容进行评价操作的次数;根据预先建立的过滤关键词库,判断UGC内容中是否包含过滤关键词库中的过滤关键词;如果UGC内容中包含过滤关键词库中的过滤关键词,将UGC内容中包含的过滤关键词库中的过滤关键词作为目标关键词,获取过滤关键词库中每个目标关键词的可信度;根据评价操作的次数、评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算UGC内容的质量值。由于过滤关键词库包括各过滤关键词和设置各过滤关键词的用户个数,用户设置各过滤关键词表示用户对各过滤关键词的反馈,即用户将包含过滤关键词的UGC内容过滤掉。而浏览UGC内容的用户对UGC内容的评价操作,也表示用户对UGC内容的反馈。这样,根据过滤关键词库以及用户对UGC内容的评价操作计算UGC内容的质量值,即根据用户的反馈计算UGC内容的质量值,可以提高对UGC内容质量评估的准确性。
需要说明的是,上述电子设备提到的通信总线404可以是PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。通信总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口402用于上述电子设备与其他设备之间的通信。
存储器403可以包括RAM(Random Access Memory,随机存取存储器),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器403还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器401可以是通用处理器,包括:CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital SignalProcessing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一UGC内容质量评估方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一UGC内容质量评估方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置及电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种UGC内容质量评估方法,其特征在于,所述方法包括:
获取待评估的用户原创内容UGC内容,以及浏览所述UGC内容的用户对所述UGC内容进行评价操作的次数,所述评价操作包括:正面评价操作和负面评价操作;
根据预先建立的过滤关键词库,判断所述UGC内容中是否包含所述过滤关键词库中的过滤关键词,所述过滤关键词库包括各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度;
如果所述UGC内容中包含所述过滤关键词库中的过滤关键词,将所述UGC内容中包含的所述过滤关键词库中的过滤关键词作为目标关键词,获取所述过滤关键词库中每个目标关键词的可信度;
根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值;
所述过滤关键词库的建立方法包括:
获取各用户设置的各过滤关键词,并确定设置所述各过滤关键词的用户个数;
针对每个过滤关键词,根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度;
建立所述各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度的对应关系。
2.根据权利要求1所述的UGC内容质量评估方法,其特征在于,在所述根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值之后,所述方法还包括:
如果判断所述UGC内容的质量值小于预设过滤阈值,将所述UGC内容删除。
3.根据权利要求1或2所述的UGC内容质量评估方法,其特征在于,所述正面评价操作为顶操作,所述负面评价操作为踩操作,所述评价操作的次数包括:顶操作的次数和踩操作的次数,所述评价操作对应的预设操作评分包括:顶操作对应的预设操作评分和踩操作对应的预设操作评分。
4.根据权利要求3所述的UGC内容质量评估方法,其特征在于,所述根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值,包括:
所述UGC内容的质量值=所述顶操作的次数×所述顶操作对应的预设操作评分-所述踩操作的次数×所述踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。
5.根据权利要求1所述的UGC内容质量评估方法,其特征在于,所述根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度,包括:
若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比;
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,所述预设权重系数为0~1之间的数。
6.一种UGC内容质量评估装置,其特征在于,所述装置包括:
获取模块,用于获取待评估的用户原创内容UGC内容,以及浏览所述UGC内容的用户对所述UGC内容进行评价操作的次数,所述评价操作包括:正面评价操作和负面评价操作;
判断模块,用于根据预先建立的过滤关键词库,判断所述UGC内容中是否包含所述过滤关键词库中的过滤关键词,所述过滤关键词库包括各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度;
目标关键词确定模块,用于如果所述UGC内容中包含所述过滤关键词库中的过滤关键词,将所述UGC内容中包含的所述过滤关键词库中的过滤关键词作为目标关键词,获取所述过滤关键词库中每个目标关键词的可信度;
质量确定模块,用于根据所述评价操作的次数、所述评价操作对应的预设操作评分、所有目标关键词的可信度和预设关键词评分,计算所述UGC内容的质量值;
所述装置还包括:
过滤关键词库建立模块,用于获取各用户设置的各过滤关键词,并确定设置所述各过滤关键词的用户个数;针对每个过滤关键词,根据该过滤关键词的长度以及在所述过滤关键词库中设置该过滤关键词的用户个数的占比,计算该过滤关键词的可信度;建立所述各过滤关键词、设置所述各过滤关键词的用户个数以及所述各过滤关键词的可信度的对应关系。
7.根据权利要求6所述的UGC内容质量评估装置,其特征在于,所述装置还包括:
UGC内容删除模块,用于如果判断所述UGC内容的质量值小于预设过滤阈值,将所述UGC内容删除。
8.根据权利要求6或7所述的UGC内容质量评估装置,其特征在于,所述正面评价操作为顶操作,所述负面评价操作为踩操作,所述评价操作的次数包括:顶操作的次数和踩操作的次数,所述评价操作对应的预设操作评分包括:顶操作对应的预设操作评分和踩操作对应的预设操作评分。
9.根据权利要求8所述的UGC内容质量评估装置,其特征在于,所述质量确定模块,具体用于所述UGC内容的质量值=所述顶操作的次数×所述顶操作对应的预设操作评分-所述踩操作的次数×所述踩操作对应的预设操作评分-所有目标关键词的可信度之和×预设关键词评分。
10.根据权利要求6所述的UGC内容质量评估装置,其特征在于,所述过滤关键词库建立模块包括:
可信度计算单元,用于若该过滤关键词的长度不大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比;
若该过滤关键词的长度大于预设长度,该过滤关键词的可信度=所述过滤关键词库中设置该过滤关键词的用户个数的占比与该过滤关键词的长度对应的预设权重系数的乘积,所述预设权重系数为0~1之间的数。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1~5任一所述的UGC内容质量评估方法的步骤。
CN201910535860.8A 2019-06-20 2019-06-20 一种ugc内容质量评估方法、装置及电子设备 Active CN110309421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910535860.8A CN110309421B (zh) 2019-06-20 2019-06-20 一种ugc内容质量评估方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910535860.8A CN110309421B (zh) 2019-06-20 2019-06-20 一种ugc内容质量评估方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110309421A CN110309421A (zh) 2019-10-08
CN110309421B true CN110309421B (zh) 2021-10-22

Family

ID=68077272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910535860.8A Active CN110309421B (zh) 2019-06-20 2019-06-20 一种ugc内容质量评估方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110309421B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611973B (zh) * 2020-06-01 2023-05-12 广州市百果园信息技术有限公司 目标用户识别的方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797461A (zh) * 2004-12-23 2006-07-05 华为技术有限公司 一种广告业务信息发布系统及其发布方法
CN101304575A (zh) * 2008-06-13 2008-11-12 Tcl天一移动通信(深圳)有限公司 一种自动匹配来电号码或来短信号码的方法及通讯终端
CN102098332A (zh) * 2010-12-30 2011-06-15 北京新媒传信科技有限公司 一种内容审核方法和装置
CN102314443A (zh) * 2010-06-30 2012-01-11 腾讯科技(深圳)有限公司 搜索引擎的修正方法和系统
JP4959621B2 (ja) * 2008-04-04 2012-06-27 株式会社野村総合研究所 キーワード抽出システム
CN102663105A (zh) * 2012-04-13 2012-09-12 北京搜狗科技发展有限公司 号码信息数据库的建立方法及系统
CN104601782A (zh) * 2015-01-09 2015-05-06 深圳市宝尔爱迪科技有限公司 一种防止骚扰电话的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797461A (zh) * 2004-12-23 2006-07-05 华为技术有限公司 一种广告业务信息发布系统及其发布方法
JP4959621B2 (ja) * 2008-04-04 2012-06-27 株式会社野村総合研究所 キーワード抽出システム
CN101304575A (zh) * 2008-06-13 2008-11-12 Tcl天一移动通信(深圳)有限公司 一种自动匹配来电号码或来短信号码的方法及通讯终端
CN102314443A (zh) * 2010-06-30 2012-01-11 腾讯科技(深圳)有限公司 搜索引擎的修正方法和系统
CN102098332A (zh) * 2010-12-30 2011-06-15 北京新媒传信科技有限公司 一种内容审核方法和装置
CN102663105A (zh) * 2012-04-13 2012-09-12 北京搜狗科技发展有限公司 号码信息数据库的建立方法及系统
CN104601782A (zh) * 2015-01-09 2015-05-06 深圳市宝尔爱迪科技有限公司 一种防止骚扰电话的方法及系统

Also Published As

Publication number Publication date
CN110309421A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
US9466071B2 (en) Social media user recommendation system and method
CN107707545B (zh) 一种异常网页访问片段检测方法、装置、设备及存储介质
US20160132904A1 (en) Influence score of a brand
US11275748B2 (en) Influence score of a social media domain
CN111309539A (zh) 一种异常监测方法、装置和电子设备
CN109165691B (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN110175278B (zh) 网络爬虫的检测方法及装置
CN108366012B (zh) 一种社交关系建立方法、装置及电子设备
CN112765400B (zh) 兴趣标签的权重更新方法、内容推荐方法、装置及设备
CN110941738A (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN109190014B (zh) 一种正则表达式生成方法、装置及电子设备
CN112528703B (zh) 一种识别表格结构的方法、装置及电子设备
CN108335131A (zh) 一种预估用户年龄段的方法、装置及电子设备
CN109740621B (zh) 一种视频分类方法、装置及设备
CN110309421B (zh) 一种ugc内容质量评估方法、装置及电子设备
CN112182520B (zh) 非法账号的识别方法、装置、可读介质及电子设备
CN109410198B (zh) 一种时序动作检测方法、装置及设备
CN112883275B (zh) 一种直播间推荐方法、装置、服务器及介质
CN107239542A (zh) 一种数据统计方法、装置、服务器及存储介质
CN117609992A (zh) 一种数据泄密检测方法、装置及存储介质
CN110633804B (zh) 金融产品进件评价方法、服务器和存储介质
CN110996142B (zh) 视频召回方法及装置、电子设备及存储介质
CN110442801B (zh) 一种目标事件的关注用户的确定方法及装置
CN112559743A (zh) 一种政企网络支持度的计算方法、装置、设备及存储介质
CN113076487B (zh) 一种用户兴趣表征及内容推荐方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant