CN110120912A - 富媒体内容处理方法、装置、可读存储介质和计算机设备 - Google Patents

富媒体内容处理方法、装置、可读存储介质和计算机设备 Download PDF

Info

Publication number
CN110120912A
CN110120912A CN201910388429.5A CN201910388429A CN110120912A CN 110120912 A CN110120912 A CN 110120912A CN 201910388429 A CN201910388429 A CN 201910388429A CN 110120912 A CN110120912 A CN 110120912A
Authority
CN
China
Prior art keywords
content
user account
negative feedback
threshold value
rich
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910388429.5A
Other languages
English (en)
Inventor
孙子荀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910388429.5A priority Critical patent/CN110120912A/zh
Publication of CN110120912A publication Critical patent/CN110120912A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/214Monitoring or handling of messages using selective forwarding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及一种富媒体内容处理方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取用户账号对应的内容以及用户账号对应的第一等级;当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。本申请提供的方案可减小富媒体内容的影响力度。

Description

富媒体内容处理方法、装置、可读存储介质和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种富媒体内容处理方法、装置、计算机可读存储介质和计算机设备。
背景技术
伴随富媒体的发展,个性化阅读产品越来越丰富。随着富媒体的发展,低质量文章越来越多,出现了大量的负面的富媒体内容。而这些负面的富媒体内容对社会产生不良影响。传统的方式是通过用户举报富媒体内容之后,对该富媒体内容进行下架处理。然而,目前的内容处理方式,存在影响力度大的问题。
发明内容
基于此,有必要针对富媒体内容的影响力度大的技术问题,提供一种富媒体内容处理方法、装置、计算机可读存储介质和计算机设备。
在一个实施例中,一种富媒体内容处理方法,包括:获取用户账号对应的内容以及用户账号对应的第一等级;当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
在一个实施例中,一种富媒体内容处理装置,包括:获取模块,用于获取用户账号对应的内容以及用户账号对应的第一等级;
曝光模块,用于当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容;
获取模块,还用于获取内容对应的浏览次数以及第一负面反馈次数;
配置模块,用于当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行如下步骤:获取用户账号对应的内容以及用户账号对应的第一等级;当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如下步骤:获取用户账号对应的内容以及用户账号对应的第一等级;当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
上述富媒体内容处理方法、装置、计算机可读存储介质和计算机设备,获取用户账号对应的内容以及用户账号对应的第一等级,当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数,能结合用户账号对应的等级得到用户账号的可信任度等,并根据用户账号对应的等级曝光用户账号对应的内容;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态,通过浏览次数阈值和第一负面反馈次数阈值这两个条件的设置,使富媒体内容呈不可见状态,能提升对富媒体内容质量的鉴别能力,同时在未知富媒体内容的类型的情况下,减小富媒体内容的影响力度。
附图说明
图1为一个实施例中富媒体内容处理方法的应用环境图;
图2为一个实施例中富媒体内容处理方法的流程示意图;
图3位一个实施例中确定用户账号对应的等级为第一等级的流程示意图;
图4为一个实施例中标题党模型的界面示意图;
图5为一个实施例中训练内容识别模型的流程示意图;
图6为另一个实施例中富媒体内容处理方法的流程示意图;
图7为又一个实施例中富媒体内容处理方法的流程示意图;
图8为一个实施例中富媒体内容处理装置的结构框图;
图9为另一个实施例中富媒体内容处理装置的结构框图;
图10为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为另一个实施例中富媒体内容处理方法的应用环境图。该富媒体内容处理方法应用于内容处理系统。该内容处理系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。其中,内容处理程序可应用于图1中的服务器120。在一个实施例中,富媒体内容处理方法的应用环境可以只包括服务器。
在一个实施例中,如图2所示,提供了一种富媒体内容处理方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该富媒体内容处理方法具体包括如下步骤:
步骤202,获取用户账号对应的内容以及所述用户账号对应的第一等级。
其中,用户账号是指某个用户的账号,例如用户账号可以由文字、数字、字母中的一种或多种组成。一个用户可以对应一个用户账号,也可以对应多个用户账号。用户账号对应的内容可以是文本、视频、音频中的至少一种。每个用户账号都有一个等级。内容处理程序可根据用户账号对应的分值划分用户账号对应的等级。等级可以是预先划分的多个等级。例如可按照分值从高到低的顺序划分为多个等级。例如分值最高时对应的等级为最高。第一等级具体可以对应预设的任意一个等级。
具体地,内容处理程序获取用户账号对应的富媒体内容。例如,该用户账号发布的文本、视频和音频等。内容处理程序还可以将用户账号对应的富媒体内容输入至可曝光文章池中。内容处理程序可直接获取用户账号对应的第一等级。
步骤204,当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数。
其中,第一预设等级是指在计算机设备中预设的等级。第一预设等级可以是预先划分的多个等级中的任一等级。曝光可以是指向公众公开。内容对应的浏览次数可以是内容被用户浏览次数。例如,用户点击内容的标题,跳转到该内容的页面,并在终端显示内容,上述过程可记为一次浏览次数。负面反馈具体可以是投诉、举报、不感兴趣、负面评论中的至少一种。负面评论具体可以是“不喜欢”、“骗子”等评论。例如,该富媒体内容被举报一次,则记负面反馈次数为一次;该富媒体内容再被投诉一次,则记负面反馈次数为两次。
具体地,内容处理程序判断用户账号对应的第一等级是否小于第一预设等级。当用户账号对应的第一等级小于第一预设等级时,内容处理程序可根据用户账户对应的等级曝光用户账号对应的富媒体内容。例如用户账号对应的第一等级小于高级账号时,内容处理程序在候选曝光池中曝光用户账号对应的富媒体内容。富媒体内容被曝光后,内容处理程序可获取该富媒体内容对应的浏览次数以及第一负面反馈次数。
步骤206,当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
其中,浏览次数阈值是指内容处理程序预先设置的浏览次数。例如浏览次数阈值可以是1000、2000、3000或10000等不限于此。第一负面反馈阈值是指内容处理程序预先设置的负面反馈次数阈值。例如负面反馈阈值可以是3、4、5或10等不限于此。不可见状态是指用户不可见的状态。例如内容处理程序将用户账号对应的内容下架,则用户账号对应的内容为不可见状态。
具体地,内容处理程序判断内容的浏览次数是否大于浏览次数阈值,并判断第一负面反馈次数是否小于第一负面反馈阈值。当内容处理程序检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容下架,并配置为暂时不可见状态。
例如,浏览次数阈值为1000,第一负面反馈阈值为3。富媒体内容曝光后,当内容处理程序检测到该富媒体内容被举报的次数为3次,同时被浏览次数为900次,则将该富媒体内容配置为不可见状态。
上述富媒体内容处理方法,获取用户账号对应的内容以及用户账号对应的第一等级,当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数,能结合用户账号对应的等级得到用户账号的历史表现情况以及可信任度等,并根据用户账号对应的等级曝光用户账号对应的内容;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态,通过浏览次数阈值和第一负面反馈次数阈值这两个条件的设置,使富媒体内容呈不可见状态,能提升对富媒体内容质量的鉴别能力,同时在未知富媒体内容的类型的情况下,减小富媒体内容的影响力度。
在一个实施例中,曝光用户账号对应的内容,包括:在候选曝光池中曝光用户账号对应的内容,其中,该候选曝光池中的用户为全量曝光池中的部分用户。
其中,候选曝光池中的用户为全量曝光池中随机选取的部分用户。例如候选曝光池中的用户为全量曝光池中随机选取的10%的用户等不限于此。全量曝光池中包含了所有的用户。例如内容处理程序内嵌于某一程序的服务器中,则全量曝光池中可包含注册了该程序的所有用户。
具体地,内容处理程序将用户账号对应的富媒体内容输入至候选曝光池中。内容处理程序在候选曝光池中曝光该用户账号对应的富媒体内容。
本实施例中,不同的级别可对应不同的曝光控制。内容处理程序根据用户账号对应的第一等级在候选曝光池中曝光用户账号对应的内容。等级与曝光池中的用户数量呈正相关。其中,等级越高,候选曝光池中的用户越多;等级越低,候选曝光池中的用户越少。例如低质量账号比普通账号的等级低,普通账号对应10%的用户曝光,低质量账号对应5%的用户曝光等不限于此。
上述富媒体内容处理方法,在候选曝光池中曝光用户账号对应的内容,其中,该候选曝光池中的用户为全量曝光池中的部分用户,能在一定程度上保证富媒体内容的曝光量,同时也减少该富媒体内容的曝光程度,减少富媒体内容的影响力度。
在一个实施例中,如图3所示,为一个实施例中确定用户账号对应的等级为第一等级的流程示意图。在获取用户账号对应的内容之后,该富媒体内容处理方法还包括:
步骤302,获取用户账号对应的第二等级。
其中,用户账号对应的第二等级可高于或等于第一等级。
具体地,内容处理程序获取用户账号对应的内容并获取用户账号对应的第二等级。
步骤304,当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的内容输入至内容识别模型中进行处理,得到用户账号对应的内容的类型,其中,第二预设等级大于第一预设等级。
其中,第二预设等级大于第一预设等级。内容识别模型可用于识别该富媒体内容的类型。例如,该用户账号对应的富媒体内容的类型可以为色情、暴力、政治、赌博、低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养共20种中的至少一种但不限于此。内容识别模型可以通过SVM(Support Vector Machine,支持向量机)算法、逻辑回归算法或者CNN(ConvolutionalNeural Networks,卷积神经网络)算法等训练而成。
具体地,内容处理程序判断用户账号对应的第二等级是否小于第二预设等级。当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的富媒体内容输入至内容识别模型中进行处理。内容识别模型可提取标题文本特征、图片特征、正文文本特征、排版特征、关键词、句子语法、排比句中的一种或多种特征,并根据提取的特征进行处理,得到用户账号对应的内容的类型。例如某些用户摸索出平台的推荐策略,通过明星词能增加文章内容的曝光机会,从而故意写明星的内容,内容识别模型可以识别出这类富媒体内容。例如,标题党类型可如图4所示,图4为一个实施例中标题党模型的界面示意图。其中,ID是身份标识码,也称为用户账号。UIN是指User Information,用户信息。标题党即为通过一些估计夸张的手法,吸引用户阅读,但实际内容却可能与标题不符。例如内容标题为“破产老总向女友求婚被拒,1个月后竟然……”等等。
步骤306,获取用户账号的第二等级对应的分值,根据用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值。
其中,当一个用户账号未发布任何富媒体内容时,用户账号对应的初始分值为80分。不同的级别可对应不同的曝光控制。内容的类型与分值的减值关系如下:
政治、暴力、恐怖、色情、赌博等属于底线质量问题,只要出现直接减去40分。
旧闻、标题党、低俗内容、广告、公文、活动和口水无营养文会造成负面影响的,属于中度质量问题减去20分。
错别字、搬运、图片模糊、社会负面、明星八卦、题文不符、故事党、浅薄等轻度质量问题,减去10分。
每当发布一篇不存在负面类型的内容时,增加5分,100分为最高分。
用户账号的等级对应的分值可如表1所示:
其中,上述低质量账号也可以称为低级账号,高质量也可以称为高级账号,满分账号也可以称为满级账号。
具体地,内容处理程序获取用户账号对应的第二等级对应的分值,根据内容识别模型识别出的用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值。其中,更新后的分值可以与第二等级对应的分值相同。例如第二等级为高质量账号,分值为85分。当内容识别模型检测出该内容的类型为明星八卦时,且明星八卦扣除20分,对85分进行减值处理,则得到更新后的分数为65分。当内容识别模型未识别出该内容的类型,即确定该内容不存在质量问题,则不对用户账号进行减值处理,得到更新后的分值为85分。
步骤308,根据更新后的分值确定用户账号对应的等级为第一等级。
其中,第一等级和第二等级可以相同。
具体地,内容处理程序根据更新后的分值查找对应的等级,确定用户账号对应的等级为第一等级。例如,更新后的分值为65分,则确定用户账号对应的等级为普通账号。或者,更新后的分值仍然为85分,则此时第二等级与第一等级相同,均为高质量账号。
在一个实施例中,例如,当用户账号的等级为普通账号,且用户账号对应的分值为65分时,用户账号的内容为故事党,那么得到65-10=55分,即为小于60分的账号,属于无等级。那么该用户账号将被冷冻,即在预设期限内不可使用该用户账号。当该用户账号解禁后,用户账号对应的分值不变,即为55分。
本实施例中,当内容识别模型中包含检测色情、暴力、政治、赌博、低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养共20种模型时,内容处理程序可按照预设的减值大小将模型进行排列。例如,用户账号对应的富媒体内容先输入至色情、暴力、政治、赌博、恐怖的内容识别模型中,再输入至广告、公文、活动、口水无营养的内容识别模型中,再输入至剩下的内容识别模型中。用户账号对应的内容可串行通过该内容识别模型。若该用户账号对应的内容对应两种类型,则做两次减值处理,且识别出类型的用户账号对应的内容可以不被曝光。
上述富媒体内容处理方法,获取用户账号对应的第二等级,当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的内容输入至内容识别模型中进行处理,得到用户账号对应的内容的类型,其中,第二预设等级大于第一预设等级,能够使用机器模型对富媒体内容进行分类处理;获取用户账号的第二等级对应的分值,根据用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值,根据更新后的分值确定用户账号对应的等级为第一等级,能够根据机器模型的结果直接进行减值处理,减少审核的工作量,自动发现富媒体内容中存在的问题,提高富媒体内容处理的效率。
在一个实施例中,该富媒体内容处理方法还包括:当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,将用户账号对应的内容全量曝光。
具体地,内容处理程序判断浏览次数是否大于浏览次数阈值,以及第一负面反馈次数是否小于第一负面反馈次数阈值。当富媒体内容被浏览的次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,将用户好对应的内容输入至全量曝光池中进行全量曝光。其中,全量曝光池中包含所有用户。例如,浏览次数阈值为1000,负面反馈次数阈值为3,当富媒体内容A的浏览次数大于1000,第一负面反馈次数仅为1时,内容处理程序将用户账户对应的内容全网公开。
上述富媒体内容处理方法,当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,那么该用户账号对应的内容为小概率存在质量问题的内容,再将用户账号对应的内容全量曝光,能减小有质量问题的内容曝光的概率,且无质量问题的内容也能及时曝光,提高曝光的用户账号对应的内容的安全性。
在一个实施例中,该富媒体内容处理方法还包括:当用户账号对应的第一等级大于或等于第一预设等级时,在全量曝光池中将用户账号对应的内容全量曝光。
具体地,内容处理程序判断用户账号对应的第一等级是否大于或等于第一预设等级。当用户账号对应的第一等级大于或等于第一预设等级时,内容处理程序在全量曝光池中将用户账号对应的内容全量曝光。例如,当用户账号对应的第一等级为高质量账号,第一预设等级也为高质量账号,那么用户账号对应的第一等级与第一预设等级相同,将用户账号对应的富媒体内容输入至全量曝光池中,在全量曝光池中将将用户账号对应的内容全网公开。
上述富媒体内容处理方法,当用户账号对应的第一等级大于或等于第一预设等级时,则该用户账号为可信任账号,该用户账号对应的内容大概率为无质量问题的内容,则在全量曝光池中将用户账号对应的内容全量曝光,能及时曝光无质量问题的内容,通过用户账号等级的设置,提高网络内容的安全性。
在一个实施例中,该富媒体内容处理方法还包括:获取全量曝光后,内容对应的第二负面反馈次数;当第二负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态,其中,第二负面反馈次数阈值大于第一负面反馈次数阈值。
其中,第二负面反馈次数阈值大于第一负面反馈次数阈值。例如第一负面反馈次数的阈值为3,第二负面反馈的阈值可为10等不限于此。第二负面反馈次数可与第一负面反馈次数叠加。例如在候选曝光池中的第一负面反馈次数为2次,那么第二负面反馈次数可在2次的基础上进行加值处理。第一负面反馈次数可以是在候选曝光池中得到的负面反馈次数,第二负面反馈次数可以是在全量曝光池中得到的负面反馈次数。
具体地,内容处理程序获取在全量曝光池中全量曝光后,富媒体内容对应的第二负面反馈次数。内容处理程序判断第二负面反馈次数是否大于第二负面反馈次数阈值。当第二负面反馈次数达到第二负面反馈次数阈值时,将该富媒体内容下架,并配置为暂时不可见状态。当第二负面反馈次数未达到第二负面反馈次数阈值时,该用户账号对应的内容仍处于全量曝光状态。
本实施例中,内容处理程序可获取曝光后,内容在预设时间内对应的第二负面反馈次数;当在预设时间内负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态,其中,第二负面反馈次数阈值大于第一负面反馈次数阈值。例如,内容处理程序可获取在30天内的负面反馈次数,当在30天内的负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态。当在30天内的负面反馈次数未达到负面反馈阈值时,则该内容将一直处于全量曝光状态。
上述富媒体内容处理方法,获取全量曝光后,内容对应的第二负面反馈次数;当第二负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态,能阻止有质量问题的富媒体内容的传播,提高网络内容的安全性。
在一个实施例中,当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态,包括:
获取第一负面反馈次数对应的负面反馈类型;当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈阈值时,确定用户账户对应的内容的类型为谣言,将用户账号对应的内容配置为不可见状态。
其中,负面反馈类型中包括谣言,还可以包括旧闻、低俗、标题党中的至少一种。旧闻是指描述一个多月甚至几年前的内容。谣言可以是指描述一些子虚乌有的内容。
具体地,内容处理程序获取第一负面反馈次数对应的负面反馈类型。当内容处理程序检测到满足浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈次数阈值这三个条件时,确定用户账户对应的内容的类型为谣言。例如第一负面反馈次数阈值为3次,第一负面反馈次数为4次,其中,类型为谣言的第一负面反馈次数为3次,类型为低质量的负面反馈次数为1次,那么内容处理程序确定用户账户对应的内容的类型为谣言。内容处理程序将用户账号对应的内容配置为不可见状态。
本实施例中,内容处理程序可根据负面反馈类型为谣言时,对用户账号对应的分值进行扣分处理。
上述富媒体内容处理方法,获取第一负面反馈次数对应的负面反馈类型;当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈阈值时,确定用户账户对应的内容的类型为谣言,通过用户对内容的反馈,能确定内容的类型是否为谣言;将用户账号对应的内容配置为不可见状态,能阻止该谣言对应的内容继续曝光。
在一个实施例中,当第二负面反馈次数达到第二负面反馈次数阈值时,将内容配置为不可见状态,包括:获取第二负面反馈次数对应的负面反馈类型;当该负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第二负面反馈阈值时,确定用户账户对应的内容的类型为谣言,将用户账号对应的内容配置为不可见状态。
上述富媒体内容处理方法,获取第二负面反馈次数对应的负面反馈类型;当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第二负面反馈阈值时,确定用户账户对应的内容的类型为谣言,通过用户对内容的反馈,能确定内容的类型是否为谣言;将用户账号对应的内容配置为不可见状态,能阻止该谣言对应的内容继续曝光。
在一个实施例中,获取内容对应的第一负面反馈次数,包括:获取内容对应的第一负面反馈次数以及该第一负面反馈次数对应的设备标识;当检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数;将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数。
其中,设备标识用于唯一地标识某一台设备,具体可以是IP(Internet Protocol,互联网协议)地址或者MAC(Media Access Control,媒体访问控制)地址等不限于此。
具体地,内容处理程序获取该富媒体内容对应的第一负面反馈次数以及每次数对应的设备标识。内容处理程序检测第一负面反馈次数对应的设备标识中是否包含至少两个相同的设备标识。当内容处理程序检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数。
例如,当在进行负面反馈时,设备或者网络断开后进行重新传输,会导致同一设备标识对应的第一负面反馈次数为至少两次。或者,当用户采用多个用户账户在同一设备上进行负面反馈时,也会导致同一设备标识对应的第一负面反馈次数为至少两次。或者,在同一IP地址的情况下,有多台设备对同一内容进行负面反馈时,也会导致同一设备标识对应的第一负面反馈次数为至少两次。则当内容处理程序检测到2次负面反馈,IP地址分别为10.10.10.101和10.10.10.101时,内容处理程序将第一负面反馈次数记为1次,并更新第一负面反馈次数。内容处理程序将更新后的负面反馈次数为1次作为内容对应的第一负面反馈次数。
上述富媒体内容处理方法中,获取内容对应的第一负面反馈次数以及该第一负面反馈次数对应的设备标识;当检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数;将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数,能有效去重,防止恶意负面反馈,提高负面反馈次数获取以及富媒体内容处理的准确性。
在一个实施例中,该富媒体内容处理方法还包括:获取处于不可见状态的内容以及对应的类型标注;将处于不可见状态的内容以及对应的类型标注作为内容识别模型的训练数据;将训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型。
其中,类型标注具体可以是管理员终端输入的类型标注,也可以是第一负面反馈次数对应的类型标注,还可以是第二负面反馈次数对应的类型标注。类型标注具体可以是暴力、政治、赌博、色情、低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养文、无质量问题中的至少一种但不限于此。处于不可见状态的内容也是向管理员终端发送的,以使管理员终端对该处于不可见状态的内容进行复审的内容。
具体地,内容处理程序获取处于不可见状态的内容以及对应的类型标注。内容处理程序将处于不可见状态的内容以及对应的类型标注作为内容识别模型的训练数据。内容处理程序将训练数据输入至内容识别模型中进行训练。内容识别模型提取标题文本特征、图片特征、正文文本特征、排版特征、关键词、句子语法、排比句中的一种或多种特征,并根据提取的特征进行训练,得到更新后的内容识别模型。
本实施例中,如图5所示,图5为一个实施例中训练内容识别模型的流程示意图。内容处理程序可获取处于不可见状态的内容,即将会复审的数据内容,将复审数据分为正样本集合和负样本集合。其中,正样本集合中可以是有质量问题的富媒体内容,例如存在低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养文等质量问题的富媒体内容。负样本集合中可以是无质量问题的富媒体内容。带有类型标注的正样本集合和负样本集合可用于训练机器学习模型,得到内容识别模型。内容识别模型会根据样本得到0至1的输出值。当富媒体内容对应的输出值大于或等于预设阈值时,该富媒体内容存在质量问题。当富媒体内容对应的输出值小于预设阈值时,该富媒体内容不存在质量问题。若训练得到的内容识别模型与实际结果相差较大,内容处理程序可调整内容识别模型的参数,以提高富媒体内容检测的准确性。当通过预测模型进行富媒体内容的检测时,将富媒体内容输入至内容识别模型中,能得到预测结果。其中,预测结果可包括有质量问题、无质量问题或者质量问题为低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养文等。
上述富媒体内容处理方法,获取处于不可见状态的内容以及类型标注;将处于不可见状态的内容以及类型标注作为内容识别模型的训练数据;将训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型,使用处于不可见状态的内容作为训练数据而得到的内容识别模型,能提高富媒体内容检测的准确性。
在一个实施例中,该富媒体内容处理方法还包括:向管理员终端发送处于不可见状态的内容;获取管理员终端发送的对内容的复审结果;当复审结果为通过时,将内容再次曝光;当复审结果为不通过时,将内容配置为永久不可见状态。
其中,复审结果可包括通过和不通过,还可以包括内容的类型等。
具体地,内容处理程序向管理员终端发送处于不可见状态的内容。即该富媒体内容进入人工复审状态,且该富媒体内容停止曝光即处于暂时不可见状态。管理员终端获取输入的对内容的复审结果,例如该内容审核通过或者该内容审核不通过等。当复审结果为通过时,内容处理程序将内容再次全量曝光。当复审结果为不通过时,内容处理程序将内容配置为永久不可见状态。
本实施例中,配置为用久不可见状态的内容对应的用户账号可通过申诉等方式,使该用户账号对应的内容恢复全量曝光。
本实施例中,当复审结果为不通过时,内容处理程序可获取该用户账号对应的内容类型。例如用户账号对应的内容类型为谣言等。内容处理程序可根据用户账号对应的内容类型对用户账号对应的分值进行减值处理,使得复审结果与用户账号相关联。
上述富媒体内容处理方法,向管理员终端发送处于不可见状态的内容;获取管理员终端发送的对内容的复审结果;当复审结果为通过时,将内容再次曝光;当复审结果为不通过时,将内容配置为永久不可见状态,能够对该内容进行再一次审核,提高富媒体内容处理的准确性。
在一个实施例中,如图6所示,为另一个实施例中富媒体内容处理方法的流程示意图,包括:
步骤602,内容处理程序获取用户账号对应的内容。
步骤604,内容处理程序将用户账号对应的内容输入至可曝光文章池中。
其中,可曝光文章池中包括允许曝光的文章。
步骤606,内容处理程序判断用户账号是否为满分账号。
其中,满分账号可为第二等级。满分账号的划分可见表1。
步骤608,当用户账号不是满分账号时,进行初审。
其中,初审为人工审核,主要审核重度质量问题对应的内容,例如黄色、政治、赌博等。
步骤610,内容处理程序判断初审是否通过。
具体地,内容处理程序接收管理员终端对该内容的初审结果,得到初审是否通过。
步骤612,当初审通过时,内容处理程序判断用户账号是否为高质量账号。
其中,此时用户账号对应的等级可为第一等级。
步骤614,当该用户账号不是高质量账号时,内容处理程序在候选曝光池中曝光该用户账号对应的内容。
步骤616,内容处理程序判断该内容的曝光量是否大于1000次且负反馈次数是否小于3次。
步骤618,当该内容的曝光量大于1000次且负反馈次数小于3次,或者当该用户账号为高质量账号时,或者,当第二负反馈次数小于或等于10次时,内容处理程序在全量曝光池中曝光该用户账号对应的内容。
步骤620,内容处理程序判断第二负面反馈次数是否大于10次。
步骤622,当第二负面反馈次数大于10次时,内容处理程序向管理员终端发送该内容,并获取管理员终端对该内容的复审结果。
步骤624,内容处理程序判断该内容是否存在质量问题。
步骤626,当该内容不存在质量问题时,该内容恢复全量曝光。
步骤628,当该内容存在质量问题时,下架该内容。
上述富媒体内容处理方法,能结合用户账号对应的等级得到用户账号的可信任度等,并根据用户账号对应的等级曝光用户账号对应的内容;通过浏览次数阈值和第一负面反馈次数阈值这两个条件的设置,使富媒体内容呈不可见状态,能提升对富媒体内容质量的鉴别能力,同时在未知富媒体内容的类型的情况下,减小富媒体内容的影响力度以及提升对有质量问题的富媒体内容的鉴别能力。
在一个实施例中,如图7所示,为又一个实施例中富媒体内容处理方法的流程示意图。其中,富媒体内容处理方法的流程包括:离线流程、静态流程和动态流程。离线流程主要用于管理用户账号,给用户账号确定等级。静态流程主要用于对用户账号发布的内容进行模型过滤,对内容进行人工初审。动态流程用于控制用户账号对应的内容的曝光范围以及对内容进行人工复审,例如候选曝光池和全量曝光池。
具体地,离线流程主要有账号等级装置,和账号信用分装置进行交互,得出账号当前的等级。使用静态部分和动态部分的数据,来判断用户账号的等级。实际情况下,一个用户账号如果多次发布有质量问题的文章,那这个用户账号再次发布有质量问题内容的概率,会远远高于发布有质量问题的内容较少的用户账号。离线流程主要根据用户账号对应的内容在静态流程被内容识别模型或者在被人工审核过程中得到内容的类型,则反馈给信用分处理装置,进行扣分处理。
静态流程主要依赖机器算法模型。在静态流程中会使用多个机器模型进行内容检测。通过多个机器模型进行串行处理,当用户账号对应的内容在内容识别模型中得到的输出值大于预设阈值时,禁止曝光该用户账号对应的内容,并且反馈给信用分处理装置,进行扣分处理。同时通过人工复审过程中得到的样本,来进行模型的训练。训练得到的预测模型会在静态流中使用,每一个具体的内容类型对应一个检测模型。复审时可把内容的质量问题分为这些类型:赌博、黄色、政治、低俗、惊悚、广告、公文、活动、招聘、婚恋、外文、社会负面、明星八卦、标题党、套路标题、题文不符、故事党、浅薄、口水无营养文等。
动态流程主要用于谣言这类需要知识库的模型。在内容曝光之后,内容处理程序提供一个入口给用户进行内容的负面反馈的机会。在用户终端的界面上,一篇文章的底部可提供一个举报的入口,用户可以在里面选择文章举报的原因,然后提交。举报的原因主要有:低质量,谣言,低俗,旧闻,标题党等。
上述富媒体内容处理方法,结合账号发布内容的历史表现,给账号质量进行分级,并且通过动态流程监控这些可疑的内容,避免了传统静态机器学习识别和人工审核因为知识不足,无法解决的谣言或者旧闻等问题。通过对账号进行分级处理,既可以减少人工审核量,又通过初审和复审,避免人工审核出现纰漏和错误,提高富媒体内容处理的准确性。
在一个实施例中,富媒体内容处理方法,包括:
步骤(a1),获取用户账号对应的内容。
步骤(a2),获取用户账号对应的第二等级。
步骤(a3),当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的内容输入至内容识别模型中进行处理,得到用户账号对应的内容的类型,其中,第二预设等级大于第一预设等级。
步骤(a4),获取用户账号的第二等级对应的分值,根据用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值。
步骤(a5),根据更新后的分值确定用户账号对应的等级为第一等级。
步骤(a6),当用户账号对应的第一等级小于第一预设等级时,在候选曝光池中曝光用户账号对应的内容,其中,候选曝光池中的用户为全量曝光池中的部分用户。
步骤(a7),获取内容对应的浏览次数。
步骤(a8),获取内容对应的第一负面反馈次数以及第一负面反馈次数对应的设备标识。
步骤(a9),当检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数。
步骤(a10),将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数。
步骤(a11),当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
步骤(a12),当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,将用户账号对应的内容全量曝光。
步骤(a13),当用户账号对应的第一等级大于或等于第一预设等级时,在全量曝光池中将用户账号对应的内容全量曝光。
步骤(a14),获取全量曝光后,内容对应的第二负面反馈次数。
步骤(a15),当第二负面反馈次数达到第二负面反馈次数阈值时,将内容配置为不可见状态,其中,第二负面反馈次数阈值大于第一负面反馈次数阈值。
步骤(a16),向管理员终端发送处于不可见状态的内容。
步骤(a17),获取管理员终端发送的对内容的复审结果。
步骤(a18),当复审结果为通过时,将内容再次曝光。
步骤(a19),当复审结果为不通过时,将内容配置为永久不可见状态。
步骤(a20),获取处于不可见状态的内容以及对应的类型标注。
步骤(a21),将处于不可见状态的内容以及对应的类型标注作为内容识别模型的训练数据。
步骤(a22),将训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型。
上述富媒体内容处理方法,使用处于不可见状态的内容作为训练数据而得到的内容识别模型,能提高富媒体内容检测的准确性;能结合用户账号对应的等级得到用户账号的历史表现情况以及可信任度等,在候选曝光池中曝光用户账号对应的内容,能在一定程度上保证富媒体内容的曝光量,同时也减少该富媒体内容的曝光程度;能够使用机器模型对富媒体内容进行分类处理,能够根据机器模型的结果直接进行减值处理,减少审核的工作量,自动发现富媒体内容中存在的问题,提高富媒体内容处理的效率;将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数,能有效去重,防止恶意负面反馈,提高负面反馈次数获取的准确性;通过浏览次数阈值和第一负面反馈次数阈值这两个条件的设置,使富媒体内容呈不可见状态,能提升对富媒体内容质量的鉴别能力,同时在未知富媒体内容的类型的情况下,减小富媒体内容的影响力度;当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,那么该用户账号对应的内容为小概率存在质量问题的内容,再将用户账号对应的内容全量曝光,能减小有质量问题的内容曝光的概率,且无质量问题的内容也能及时曝光,提高曝光的用户账号对应的内容的安全性。
图2、3和6为一个实施例中富媒体内容处理方法的流程示意图。应该理解的是,虽然图2、3和6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、3和6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,一种富媒体内容处理装置,如图8所示,为一个实施例中富媒体内容处理装置的结构框图,包括获取模块802、曝光模块804和配置模块806,其中:
获取模块802,用于获取用户账号对应的内容以及用户账号对应的第一等级。
曝光模块804,用于当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容。
获取模块802,还用于获取内容对应的浏览次数以及第一负面反馈次数。
配置模块806,用于当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
上述富媒体内容处理装置,获取用户账号对应的内容以及用户账号对应的第一等级,当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容,并获取内容对应的浏览次数以及第一负面反馈次数,能根据用户账号对应的等级得到用户账号的可信任度等,并根据用户账号对应的等级曝光用户账号对应的内容;当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态,通过浏览次数阈值和第一负面反馈次数阈值这两个条件的设置,使富媒体内容呈不可见状态,能在未知富媒体内容的类型的情况下,减小富媒体内容的影响力度。
在一个实施例中,曝光模块804用于在候选曝光池中曝光用户账号对应的内容,其中,该候选曝光池中的用户为全量曝光池中的部分用户。
上述富媒体内容处理装置,在候选曝光池中曝光用户账号对应的内容,其中,该候选曝光池中的用户为全量曝光池中的部分用户,能保证富媒体内容的曝光量,同时也减少该富媒体内容的曝光程度,减少富媒体内容的影响力度。
在一个实施例中,该富媒体内容处理装置还包括处理模块。获取模块802用于获取用户账号对应的第二等级。处理模块用于当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的内容输入至内容识别模型中进行处理,得到用户账号对应的内容的类型,其中,第二预设等级大于第一预设等级。获取模块802用于获取用户账号的第二等级对应的分值。处理模块用于根据用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值。处理模块还用于根据更新后的分值确定用户账号对应的等级为第一等级。
上述富媒体内容处理装置,获取用户账号对应的第二等级,当用户账号对应的第二等级小于第二预设等级时,将用户账号对应的内容输入至内容识别模型中进行处理,得到用户账号对应的内容的类型,其中,第二预设等级大于第一预设等级,能够使用机器模型对富媒体内容进行分类处理;获取用户账号的第二等级对应的分值,根据用户账号对应的内容的类型,对分值进行减值处理,得到更新后的分值,根据更新后的分值确定用户账号对应的等级为第一等级,能够根据机器模型的结果直接进行减值处理,减少审核的工作量,自动发现富媒体内容中存在的问题,提高富媒体内容处理的效率。
在一个实施例中,曝光模块804还用于当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,将用户账号对应的内容全量曝光。
上述富媒体内容处理装置,当浏览次数大于浏览次数阈值,且第一负面反馈次数小于第一负面反馈次数阈值时,那么该用户账号对应的内容为小概率存在质量问题的内容,再将用户账号对应的内容全量曝光,能减小有质量问题的内容曝光的概率,且无质量问题的内容也能及时曝光,提高曝光的用户账号对应的内容的安全性。
在一个实施例中,曝光模块804还用于当用户账号对应的第一等级大于或等于第一预设等级时,在全量曝光池中将用户账号对应的内容全量曝光。
上述富媒体内容处理装置,当用户账号对应的第一等级大于或等于第一预设等级时,则该用户账号为可信任账号,该用户账号对应的内容大概率为无质量问题的内容,则在全量曝光池中将用户账号对应的内容全量曝光,能及时曝光无质量问题的内容,通过用户账号等级的设置,提高网络内容的安全性。
在一个实施例中,获取模块802还用于获取全量曝光后,内容对应的第二负面反馈次数。配置模块804用于当第二负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态,其中,第二负面反馈次数阈值大于第一负面反馈次数阈值。
上述富媒体内容处理装置,获取全量曝光后,内容对应的第二负面反馈次数;当第二负面反馈次数达到第二负面反馈次数阈值时,将该内容配置为不可见状态,能阻止该富媒体内容的传播,提高网络内容的安全性。
在一个实施例中,该富媒体内容处理装置还包括确定模块。获取模块802用于获取第一负面反馈次数对应的负面反馈类型。确定模块用于当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈阈值时,确定用户账户对应的内容的类型为谣言。配置模块806用于将用户账号对应的内容配置为不可见状态。
上述富媒体内容处理装置,获取第一负面反馈次数对应的负面反馈类型;当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈阈值时,确定用户账户对应的内容的类型为谣言,通过用户对内容的反馈,能确定内容的类型是否为谣言;将用户账号对应的内容配置为不可见状态,能阻止该谣言对应的内容继续曝光。
在一个实施例中,该富媒体内容处理装置还包括确定模块。获取模块802用于获取第二负面反馈次数对应的负面反馈类型。确定模块用于当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第二负面反馈阈值时,确定用户账户对应的内容的类型为谣言。配置模块806用于将用户账号对应的内容配置为不可见状态。
上述富媒体内容处理装置,获取第二负面反馈次数对应的负面反馈类型;当检测到浏览次数小于或等于浏览次数阈值,和负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第二负面反馈阈值时,确定用户账户对应的内容的类型为谣言,通过用户对内容的反馈,能确定内容的类型是否为谣言;将用户账号对应的内容配置为不可见状态,能阻止该谣言对应的内容继续曝光。
在一个实施例中,该富媒体内容处理装置还包括更新模块和处理模块。获取模块802用于获取内容对应的第一负面反馈次数以及该第一负面反馈次数对应的设备标识。更新模块用于当检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数。处理模块用于将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数。
上述富媒体内容处理装置中,获取内容对应的第一负面反馈次数以及该第一负面反馈次数对应的设备标识;当检测到第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将相同的设备标识对应的次数记为一次,并更新内容对应的第一负面反馈次数;将更新后的第一负面反馈次数作为内容对应的第一负面反馈次数,能有效去重,防止恶意负面反馈,提高负面反馈次数获取以及富媒体内容处理的准确性。
在一个实施例中,该富媒体内容处理装置包括处理模块和更新模块。获取模块802用于获取处于不可见状态的内容以及对应的类型标注。处理模块用于将处于不可见状态的内容以及对应的类型标注作为内容识别模型的训练数据。更新模块用于将训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型。
上述富媒体内容处理装置,获取处于不可见状态的内容以及类型标注;将处于不可见状态的内容以及类型标注作为内容识别模型的训练数据;将训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型,使用处于不可见状态的内容作为训练数据而得到的内容识别模型,能提高富媒体内容检测的准确性。
在一个实施例中,该富媒体内容处理装置还包括发送模块。发送模块用于向管理员终端发送处于不可见状态的内容。获取模块802用于获取管理员终端发送的对内容的复审结果。曝光模块804用于当复审结果为通过时,将内容再次曝光。配置模块806用于当复审结果为不通过时,将内容配置为永久不可见状态。
上述富媒体内容处理装置,向管理员终端发送处于不可见状态的内容;获取管理员终端发送的对内容的复审结果;当复审结果为通过时,将内容再次曝光;当复审结果为不通过时,将内容配置为永久不可见状态,能够对该内容进行再一次审核,提高富媒体内容处理的准确性。
在一个实施例中,如图9所示,为另一个实施例中富媒体内容处理装置的结构框图,包括内容质量识别系统、内容审核系统、用户反馈手机系统、曝光范围判断装置、信用分装置和账号等级装置。其中,内容质量识别系统中包括内容识别模型,内容审核系统可为内容识别模型提供样本。信用分流水存储在信用分装置中。
内容质量识别系统由一系列的内容识别模型组成,用于通过一系列的内容识别模型对内容进行类型的检测。内容审核系统用于对可疑内容的初审和复审。用户反馈手机系统用于实时收集用户的负面反馈次数和类型等,并输出到信用分装置和曝光范围判断装置。曝光范围判断装置可根据用户的负面反馈次数、负面反馈类型中的一种确定内容的曝光范围,并根据曝光结果扣除对应分数。信用分装置用于管理账号的信用分。账号等级装置用于根据信用分流水判断用户账号等级。
上述富媒体内容处理装置,通过信用分装置和账号等级装置反映用户账号的历史发文表现,得到该用户账号的可信任度等,将内容质量识别系统与负面反馈的结果反馈至信用账号分装置,能够提升对富媒体内容质量的鉴别能力,提高富媒体内容处理的准确性。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图10所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现富媒体内容处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行富媒体内容处理方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的富媒体内容处理装置可以实现为一种计算机程序的形式,计算机程序可在如图1所示的计算机设备上运行。计算机设备的存储器中可存储组成该富媒体内容处理装置的各个程序模块,比如,图8所示的获取模块、曝光模块和配置模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的富媒体内容处理方法中的步骤。
例如,图10所示的计算机设备可以通过如图8所示的富媒体内容处理装置中的获取模块执行获取用户账号对应的内容以及用户账号对应的第一等级和获取内容对应的浏览次数以及第一负面反馈次数。计算机设备可通过曝光模块执行当用户账号对应的第一等级小于第一预设等级时,曝光用户账号对应的内容。计算机设备可通过配置模块执行当检测到浏览次数小于或等于浏览次数阈值,且第一负面反馈次数大于或等于第一负面反馈阈值时,将用户账号对应的内容配置为不可见状态。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述富媒体内容处理方法的步骤。此处富媒体内容处理方法的步骤可以是上述各个实施例的富媒体内容处理方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述富媒体内容处理方法的步骤。此处富媒体内容处理方法的步骤可以是上述各个实施例的富媒体内容处理方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (13)

1.一种富媒体内容处理方法,包括:
获取用户账号对应的内容以及所述用户账号对应的第一等级;
当所述用户账号对应的第一等级小于第一预设等级时,曝光所述用户账号对应的内容,并获取所述内容对应的浏览次数以及第一负面反馈次数;
当检测到所述浏览次数小于或等于浏览次数阈值,且所述第一负面反馈次数大于或等于第一负面反馈阈值时,将所述用户账号对应的内容配置为不可见状态。
2.根据权利要求1所述的方法,其特征在于,所述曝光用户账号对应的内容,包括:
在候选曝光池中曝光所述用户账号对应的内容,其中,所述候选曝光池中的用户为全量曝光池中的部分用户。
3.根据权利要求1或2所述的方法,其特征在于,在所述获取用户账号对应的内容之后,所述方法还包括:
获取用户账号对应的第二等级;
当所述用户账号对应的第二等级小于第二预设等级时,将所述用户账号对应的内容输入至内容识别模型中进行处理,得到所述用户账号对应的内容的类型,其中,所述第二预设等级大于所述第一预设等级;
获取所述用户账号的第二等级对应的分值,根据所述用户账号对应的内容的类型,对所述分值进行减值处理,得到更新后的分值;
根据所述更新后的分值确定所述用户账号对应的等级为第一等级。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述浏览次数大于所述浏览次数阈值,且所述第一负面反馈次数小于第一负面反馈次数阈值时,将所述用户账号对应的内容全量曝光。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述用户账号对应的第一等级大于或等于第一预设等级时,在全量曝光池中将所述用户账号对应的内容全量曝光。
6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:
获取全量曝光后,所述内容对应的第二负面反馈次数;
当所述第二负面反馈次数达到第二负面反馈次数阈值时,将所述内容配置为不可见状态,其中,所述第二负面反馈次数阈值大于所述第一负面反馈次数阈值。
7.根据权利要求1、2、4或5所述的方法,其特征在于,所述当检测到所述浏览次数小于或等于浏览次数阈值,且所述第一负面反馈次数大于或等于第一负面反馈阈值时,将所述用户账号对应的内容配置为不可见状态,包括:
获取所述第一负面反馈次数对应的负面反馈类型;
当检测到所述浏览次数小于或等于浏览次数阈值,和所述负面反馈类型中包括谣言,且谣言对应的负面反馈次数大于或等于第一负面反馈阈值时,确定所述用户账户对应的内容的类型为谣言,将所述用户账号对应的内容配置为不可见状态。
8.根据权利要求1、2、4或5所述的方法,其特征在于,所述获取所述内容对应的第一负面反馈次数,包括:
获取所述内容对应的第一负面反馈次数以及所述第一负面反馈次数对应的设备标识;
当检测到所述第一负面反馈次数对应的设备标识中包含至少两个相同的设备标识时,将所述相同的设备标识对应的次数记为一次,并更新所述内容对应的第一负面反馈次数;
将更新后的第一负面反馈次数作为所述内容对应的第一负面反馈次数。
9.根据权利要求1、2、4或5所述的方法,其特征在于,所述方法还包括:
获取处于不可见状态的内容以及对应的类型标注;
将所述处于不可见状态的内容以及对应的类型标注作为内容识别模型的训练数据;
将所述训练数据输入至内容识别模型中进行训练,得到更新后的内容识别模型。
10.根据权利要求1、2、4或5所述的方法,其特征在于,所述方法还包括:
向管理员终端发送处于不可见状态的内容;
获取所述管理员终端发送的对所述内容的复审结果;
当所述复审结果为通过时,将所述内容再次曝光;
当所述复审结果为不通过时,将所述内容配置为永久不可见状态。
11.一种富媒体内容处理装置,其特征在于,所述装置包括:
获取模块,用于获取用户账号对应的内容以及所述用户账号对应的第一等级;
曝光模块,用于当所述用户账号对应的第一等级小于第一预设等级时,曝光所述用户账号对应的内容;
所述获取模块,还用于获取所述内容对应的浏览次数以及第一负面反馈次数;
配置模块,用于当检测到所述浏览次数小于或等于浏览次数阈值,且所述第一负面反馈次数大于或等于第一负面反馈阈值时,将所述用户账号对应的内容配置为不可见状态。
12.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
CN201910388429.5A 2019-05-10 2019-05-10 富媒体内容处理方法、装置、可读存储介质和计算机设备 Pending CN110120912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910388429.5A CN110120912A (zh) 2019-05-10 2019-05-10 富媒体内容处理方法、装置、可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910388429.5A CN110120912A (zh) 2019-05-10 2019-05-10 富媒体内容处理方法、装置、可读存储介质和计算机设备

Publications (1)

Publication Number Publication Date
CN110120912A true CN110120912A (zh) 2019-08-13

Family

ID=67521916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910388429.5A Pending CN110120912A (zh) 2019-05-10 2019-05-10 富媒体内容处理方法、装置、可读存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110120912A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532331A (zh) * 2019-09-05 2019-12-03 腾讯科技(深圳)有限公司 一种对象类型确定的方法以及相关装置
CN111107057A (zh) * 2019-11-28 2020-05-05 泰康保险集团股份有限公司 异常用户账号检测方法、装置、设备及存储介质
CN112153426A (zh) * 2020-09-21 2020-12-29 腾讯科技(深圳)有限公司 一种内容账号管理方法、装置、计算机设备及存储介质
CN112182258A (zh) * 2020-10-13 2021-01-05 华北科技学院 一种基于计算机网络的新媒体管理平台
CN113207013A (zh) * 2020-02-03 2021-08-03 腾讯科技(深圳)有限公司 多媒体数据发布管理方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605032A (zh) * 2009-04-29 2009-12-16 中兴通讯股份有限公司 一种控制网站访问的方法及系统
US20100036784A1 (en) * 2008-08-07 2010-02-11 Yahoo! Inc. Systems and methods for finding high quality content in social media
US20100306192A1 (en) * 2009-05-28 2010-12-02 Tip Top Technologies, Inc. Method and system for a search engine for user generated content (ugc)
CN103186525A (zh) * 2011-12-31 2013-07-03 腾讯科技(深圳)有限公司 一种控制用户生成内容传播的方法、系统和服务器
CN104462118A (zh) * 2013-09-21 2015-03-25 郑建锋 控制信息传播风险的方法及系统
CN104598501A (zh) * 2014-01-21 2015-05-06 腾讯科技(北京)有限公司 一种媒介交互方法和装置
CN107807941A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 信息处理方法和装置
CN108416684A (zh) * 2017-02-10 2018-08-17 腾讯科技(深圳)有限公司 一种账号主体的可信程度评估方法、装置及服务器
CN108829656A (zh) * 2017-05-03 2018-11-16 腾讯科技(深圳)有限公司 网络信息的数据处理方法及数据处理装置
CN109509014A (zh) * 2018-09-06 2019-03-22 微梦创科网络科技(中国)有限公司 一种媒体信息的投放方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100036784A1 (en) * 2008-08-07 2010-02-11 Yahoo! Inc. Systems and methods for finding high quality content in social media
CN101605032A (zh) * 2009-04-29 2009-12-16 中兴通讯股份有限公司 一种控制网站访问的方法及系统
US20100306192A1 (en) * 2009-05-28 2010-12-02 Tip Top Technologies, Inc. Method and system for a search engine for user generated content (ugc)
CN103186525A (zh) * 2011-12-31 2013-07-03 腾讯科技(深圳)有限公司 一种控制用户生成内容传播的方法、系统和服务器
CN104462118A (zh) * 2013-09-21 2015-03-25 郑建锋 控制信息传播风险的方法及系统
CN104598501A (zh) * 2014-01-21 2015-05-06 腾讯科技(北京)有限公司 一种媒介交互方法和装置
CN107807941A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 信息处理方法和装置
CN108416684A (zh) * 2017-02-10 2018-08-17 腾讯科技(深圳)有限公司 一种账号主体的可信程度评估方法、装置及服务器
CN108829656A (zh) * 2017-05-03 2018-11-16 腾讯科技(深圳)有限公司 网络信息的数据处理方法及数据处理装置
CN109509014A (zh) * 2018-09-06 2019-03-22 微梦创科网络科技(中国)有限公司 一种媒体信息的投放方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532331A (zh) * 2019-09-05 2019-12-03 腾讯科技(深圳)有限公司 一种对象类型确定的方法以及相关装置
CN111107057A (zh) * 2019-11-28 2020-05-05 泰康保险集团股份有限公司 异常用户账号检测方法、装置、设备及存储介质
CN113207013A (zh) * 2020-02-03 2021-08-03 腾讯科技(深圳)有限公司 多媒体数据发布管理方法、装置、设备及存储介质
CN113207013B (zh) * 2020-02-03 2023-11-17 腾讯科技(深圳)有限公司 多媒体数据发布管理方法、装置、设备及存储介质
CN112153426A (zh) * 2020-09-21 2020-12-29 腾讯科技(深圳)有限公司 一种内容账号管理方法、装置、计算机设备及存储介质
CN112153426B (zh) * 2020-09-21 2023-08-29 腾讯科技(深圳)有限公司 一种内容账号管理方法、装置、计算机设备及存储介质
CN112182258A (zh) * 2020-10-13 2021-01-05 华北科技学院 一种基于计算机网络的新媒体管理平台

Similar Documents

Publication Publication Date Title
CN110120912A (zh) 富媒体内容处理方法、装置、可读存储介质和计算机设备
US10929879B2 (en) Method and apparatus for identification of fraudulent click activity
US10162884B2 (en) System and method for auto-suggesting responses based on social conversational contents in customer care services
CN108509477B (zh) 语义识别方法、电子装置及计算机可读存储介质
Sillitoe Trust in development: some implications of knowing in indigenous knowledge
US8768935B2 (en) Bigram suggestions
CN109614476A (zh) 客服系统问答方法、装置、计算机设备及存储介质
CN110377900A (zh) 网络内容发布的审核方法、装置、计算机设备及存储介质
CN107807960B (zh) 智能客服方法、电子装置及计算机可读存储介质
CN107180029A (zh) 一种基于咨询业务的信息处理方法及装置
US10628471B2 (en) Domain-specific stopword removal from unstructured computer text using a neural network
CN109829059A (zh) 推荐知识点的方法、装置、设备及存储介质
CN108073659A (zh) 一种婚恋对象推荐方法及装置
CN107507087A (zh) 一种面向客户的业务信息收集方法及系统
WO2014127673A1 (en) Method and apparatus for acquiring hot topics
CN110308946A (zh) 基于人工智能的跑批处理方法、设备、存储介质及装置
CN109873813A (zh) 文本输入异常监控方法、装置、计算机设备及存储介质
US10902197B1 (en) Vocabulary determination and vocabulary-based content recommendations
CN102567534B (zh) 互动产品用户生成内容拦截系统及其拦截方法
CN107169021A (zh) 用于预测应用功能标签的方法和设备
CN111339436A (zh) 一种数据识别方法、装置、设备以及可读存储介质
CN105045911B (zh) 一种用于用户进行标记的标签生成方法及设备
CN108509476A (zh) 问题联想推送方法、电子装置及计算机可读存储介质
CN107870986A (zh) 基于爬虫数据的用户行为分析方法、应用服务器及计算机可读存储介质
CN107832291A (zh) 人机协作的客服方法、电子装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190813

RJ01 Rejection of invention patent application after publication