CN107197331B - 一种实时监测直播内容的方法及装置 - Google Patents

一种实时监测直播内容的方法及装置 Download PDF

Info

Publication number
CN107197331B
CN107197331B CN201710305638.XA CN201710305638A CN107197331B CN 107197331 B CN107197331 B CN 107197331B CN 201710305638 A CN201710305638 A CN 201710305638A CN 107197331 B CN107197331 B CN 107197331B
Authority
CN
China
Prior art keywords
feature
classifier
level
data
difference value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710305638.XA
Other languages
English (en)
Other versions
CN107197331A (zh
Inventor
陈洁远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710305638.XA priority Critical patent/CN107197331B/zh
Publication of CN107197331A publication Critical patent/CN107197331A/zh
Application granted granted Critical
Publication of CN107197331B publication Critical patent/CN107197331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种实时监测直播内容的方法,其特征在于,所述方法包括:实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;从所述直播数据以及所述观众数据中提取特征数据;分别计算各特征数据对应的分数值;第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果。可见,通过本发明实施例提供的一种实时监测直播内容的方案,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。

Description

一种实时监测直播内容的方法及装置
技术领域
本发明涉及通信技术领域,特别是涉及一种实时监测直播内容的方法及装置。
背景技术
目前随着科技的飞速发展,直播平台的数量也在飞速上涨,网络直播平台用户数量已达到一个庞大的数据。在线直播的门槛非常低,只需要一台电脑和一个账号即可进行直播。由于直播内容千变万化并且无法提前审核,可能会出现色情,暴恐,政治敏感等违规直播内容,因此对直播内容进行实时审核显得尤为重要。
现有的视频内容的审核技术都是在视频上传前的离线审核,使用的过滤技术更多是依靠用户的举报,或者传统的图案检测等方式。传统的图像检测方式是从视频中提取关键帧的内容来决定视频内容是否违规,这个方法只利用了视频帧的静态信息,没有利用帧间的动态信息,并且实时性差。而直播内容一个重要的特点是主播和观众的互动,因此观众的行为也可以作为判断直播内容是否违规的判断依据。但是现有技术中,对直播内容的审核却忽略了观众行为这一判断依据,造成审核结果的不精准。
发明内容
本发明提供了一种实时监测直播内容的方法及装置,以解决由于现有技术中针对直播审核只采用静态的审核方式,因此造成对审核直播内容过程中准确性和实时性低等问题。
为了解决上述问题,本发明公开了一种实时监测直播内容的方法,所述方法包括:实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;从所述直播数据以及所述观众数据中提取特征数据;分别计算各特征数据对应的分数值;第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果。
优选地,所述安全等级包括:第一安全等级、第二安全等级以及第三安全等级,所述第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果的步骤包括:当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值,其中,各分类器以级联的方式连接;将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果;当判断结果为直播内容属于第三安全等级时,计算当前分类器与下一级分类器的第二特征差值;由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果。
优选地,在实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据的步骤之前,所述方法还包括:依据公式
min∑L(f(Xi),Yi)+αT对分类器进行训练;其中,f(Xi)表示整体的决策函数,α表示为超参数,T表示样本平均提取特征时间,Yi为标记样本。
优选地,所述当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值的步骤包括:通过Feature(C2)-Feature(C1)计算得到下一第一特征差值;其中,所述Feature(C2)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(C1)为将第二特征数据集输入所述第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集中的数据。
优选地,所述将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述特征差值判断直播是否属于第一安全等级并输出结果的步骤,包括:下一级分类器获取所述第一特征差值,将所述第一特征差值与第二预设阈值进行比较;当所述第一特征差值大于所述第二预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;当第一特征差值小于或者等于第二预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
优选地,所述当判断结果为直播内容属于第三安全等级时,计算第二特征差值的步骤包括:通过
Figure GDA0002170206990000031
计算得到第二特征差值;其中,所述Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(Ck)为将第二特征数据集输入第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
优选地,所述由下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果的步骤,包括:下一级分类器获取所述第二特征差值,将所述第二特征差值与第三预设阈值进行比较;当所述第二特征差值大于所述第三预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;当所述第二特征值小于或者等于所述第三预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
为了解决上述问题,本发明还公开了一种实时监测直播内容的装置所述装置包括:实时接收模块,用于实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;提取模块,用于从所述直播数据以及所述观众数据中提取特征数据;计算模块,用于分别计算各特征数据对应的分数值;输出结果模块,用于第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果。
优选地,所述输出结果模块包括:第一计算子模块,用于当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值,其中所述安全等级包括:第一安全等级、第二安全等级以及第三安全等级,且各分类器以级联的方式连接;第一判断子模块,用于将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果;第二计算子模块,用于当判断结果为直播内容属于第三安全等级时,计算当前分类器与下一级分类器的第二特征差值;第二判断子模块,用于由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果。
优选地,所述装置还包括:训练模块,用于在所述实时接收模块实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据之前,依据公式min∑L(f(Xi),Yi)+αT对分类器进行训练;其中,f(Xi)表示整体的决策函数,α表示为超参数,T表示样本平均提取特征时间,Yi为标记样本
优选地,所述计算模块具体用于:通过Feature(C2)-Feature(C1)计算得到下一第一特征差值;其中,所述Feature(C2)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(C1)将第二特征数据集输入所述第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集中的数据。
优选地,所述第一判断子模块包括:第一比较单元,用于下一级分类器获取所述第一特征差值,将所述第一特征差值与第二预设阈值进行比较;第一输出单元,用于当所述第一特征差值大于所述第二预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;第二输出单元,用于当第一特征差值小于或者等于第二预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
优选地,所述第二计算子模块具体用于:通过
Figure GDA0002170206990000041
计算得到第二特征差值;其中,所述Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(Ck)为将第二特征数据集输入第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
优选地,所述第二判断模子块包括:第二比较单元,用于下一级分类器获取所述第二特征差值,将所述第二特征差值与第三预设阈值进行比较;第三输出单元,用于当所述第二特征差值大于所述第三预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;第四输出单元,用于当所述第二特征值小于或者等于第三预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
与现有技术相比,本发明具有以下优点:
本发明实施例提供的一种实时监测直播内容的方案,通过实时监测,将直播数据以及观众数据提取特征数据,第一分类器获取任意一个分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果,使得管理人员可以依据判断结果进行后续的工作。可见,通过本发明实施例提供的一种实时监测直播内容的方案,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。
附图说明
图1是本发明实施例一的一种实时监测直播内容的方法的步骤流程图;
图2是本发明实施例二的一种实时监测直播内容的方法的步骤流程图;
图3是本发明实施例三的一种实时监测直播内容的装置的结构框图;
图4是本发明实施例四的一种实时监测直播内容的装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
参照图1,示出了本发明实施例一的一种实时监测直播内容的方法的步骤流程图。
本发明实施例提供的实时监测直播内容的方法包括以下步骤:
步骤101:实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据。
实时接收直播过程的视频、音频以及观众行为的三个流数据。
例如:在直播过程中主播直播的视频内容以及直播的音频内容,以及主播直播过程中由于有观众观看,会在直播过程中与主播互动的观众行为的流数据,将接收的流数据进行解析,生成可以识别的视频帧序列和音频帧,同时解析相应的观众行为数据成为评论数据、送礼行为等的直播数据以及观众数据作为观众流数据。
步骤102:从直播数据以及观众数据中提取特征数据。
将接收的直播数据以及观众数据提取出特征数据。
其中,特征数据包括基于图像的特征,例如:肌肤特征、SIFT(Scale-invariantfeature transform,尺度不变特征变换)特征、纹理特征;基于时域空间的特征,包括:光流特征、运动向量特征、周期性特征等。基于音频的特征包括:静默时间特征、频域能量特征、MFCC(Mel Frequency Cepstrum Coefficient,语音特征)特征等;以及基于用户行为的特征,包括:用户聊天信息特征、用户送礼行为特征以及用户增长速度特征等。
步骤103:分别计算各特征数据对应的分数值。
当第一分类器获取到任一特征数据或者某一类特征数据时,对获取的某一特征数据或者某一类特征数据计算出对应的分数值。
需要说明的是,分数值为特征数据对应的违规概率。
步骤104:第一分类器获取任意一个分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果。
由于不同的特征的提取时间不同,比如观众送礼的频率计算非常快,基于音频或者图像的一些特征需要进行额外的频域变换,耗时较多。而视频帧间的特征例如光流特征等计算时间更长,因此才用级联的分类器模型,级联的分类器依次所使用的特征会越来越多,越来越复杂。
具体地,安全等级包括:第一安全等级、第二安全等级以及第三安全等级。
其中,第一安全等级表示为直播内容不存在违规内容,第二安全等级表示直播内容可能存在一部分违规内容,第三安全等级表示直播内容存在违规内容。
当管理者将第一分类器的第一预设阈值设定为0.8时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值为0.9时,则表示当前的安全等级为第一安全等级,即为当前直播内容为安全内容,不存在违规内容。
当管理者将第一分类起的第一预设阈值设定为1时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值也为1时,则表示当前的安全等级为第三安全等级,即为当前直播内容为违规内容。
当管理者将第一分类起的第一预设阈值设定为0.8时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值为0.6时,则表示当前的安全等级为第二安全等级,即当前直播内容可能存在0.2的违规内容。
本发明实施例提供的一种实时监测直播内容的方法,通过实时监测,将直播数据以及观众数据提取特征数据,分别计算各特征数据对应的分数值;使用第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果使得管理人员可以依据判断结果进行后续的工作。可见,通过本发明实施例提供的一种实时监测直播内容的方法,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。
实施例二
参照图2,示出了本发明实施例二的一种实时监测直播内容的方法的步骤流程图。
本发明实施例提供的实时监测直播内容的方法包括以下内容:
步骤201:依据公式min∑L(f(Xi),Yi)+αT对分类器进行训练。
其中,f(Xi)表示整体的决策函数,αT表示分类器函数,Yi为标记样本。
级联分类器的训练是离线计算的,为了兼顾计算的效率以及检测的准确率,在设定目标函数时同时考虑准确率和计算时间。
使用min∑L(f(Xi),Yi)+αT对分类器进行训练,其中f(Xi)表示整体的决策函数,α表示为超参数,T表示样本平均提取特征时间,Yi为标记样本,用所有样本的特征计算时间总和除以样本数得到,由于只有部分样本需要计算所有的特征,因此平均计算时间小于等于计算所有特征的时间t1+t2+...+tn。α为超参数,用来控制准确率和耗时之间的平衡。训练过程如下:
a)设特征共有n个,将其任意排序。训练n个分类器,Ci利用了1~i个特征进行训练。b)调整各个分类器的阈值P,最小化在当前特征顺序下的目标函数。
c)改变特征顺序,重复a),b)两步,选择目标函数最小的特征顺序及相应的预设阈值。
步骤202:实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据。
实时接收直播过程的视频、音频以及观众行为的三个流数据。
例如:在直播过程中主播直播的视频内容以及直播的音频内容,以及主播直播过程中由于有观众观看,会在直播过程中与主播互动的观众行为的流数据,将接收的流数据进行解析,生成可以识别视频帧序列和音频帧,同时解析相应的观众行为数据成为评论数据、送礼行为等的直播数据以及观众数据。
步骤203:从直播数据以及观众数据中提取特征数据。
将接收的直播数据以及观众数据提取出特征数据。
其中特征数据包括基于图像的特征,例如:肌肤特征、SIFT(Scale-invariantfeature transform,尺度不变特征变换)特征、纹理特征;基于时域空间的特征,包括:光流特征、运动向量特征、周期特征等;基于音频的特征包括:静默时间特征、频域能量特征、MFCC(Mel Frequency Cepstrum Coefficient,语音特征);基于用户行为的特征,包括:用户聊天信息特征、用户送礼行为特征以及用户增长速度特征等。
步骤204:分别计算各特征数据对应的分数值。
当第一分类器获取到任一特征数据或者某一类特征数据时,对获取的某一特征数据或者某一类特征数据计算出对应的分数值。
步骤205:第一分类器获取任意一个分数值与第一预设阈值进行比较,判断直播内容的安全等级。
由于不同的特征的提取时间不同,比如观众送礼的频率计算非常快,基于音频或者图像的一些特征需要进行额外的频域变换,耗时较多。而视频帧间的特征例如光流特征等计算时间更长,因此才用级联的分类器模型,级联的分类器依次所使用的特征会越来越多,越来越复杂。
具体地,安全等级包括:第一安全等级、第二安全等级以及第三安全等级。
其中第一安全等级表示为直播内容不存在违规内容,第二安全等级表示直播内容可能存在一部分违规内容,第三安全等级表示直播内容存在违规内容。
当管理者将第一分类起的第一预设阈值设定为0.8时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值为0.9时,则表示当前的安全等级为第一安全等级,即为当前直播内容为安全内容,不存在违规内容。
当管理者将第一分类起的第一预设阈值设定为1时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值也为1时,则表示当前的安全等级为第三安全等级,即为当前直播内容为违规内容。
当管理者将第一分类起的第一预设阈值设定为0.8时,第一分类器获取的某一特征数据或者某一类特征数据计算出的分数值为0.6时,则表示当前的安全等级为第二安全等级,即当前直播内容可能存在0.2的违规内容。
步骤206:当判断结果为直播内容属于第二安全等级时,通过Feature(C2)-Feature(C1)计算得到下一第一特征差值。
其中,Feature(C2)为将第一特征数据集输入下一级分类器计算得到的特征值,Feature(C1)为将第二特征数据集输入第一分类器计算得到的特征值,第一特征数据集包含第二特征数据集中的数据。
例如:步骤203中提取的特征数据包括A、B以及C,第二特征数据集则可包括A,第一特征数据集包括A的同时还包括B、C中的至少一个。
步骤207:下一级分类器获取第一特征差值,将第一特征差值与第二预设阈值进行比较。
步骤208:当第一特征差值大于第二预设阈值时,则确定直播内容属于第三安全等级,并输出结果。
步骤209:当第一特征差值小于或者等于第二预设阈值时,则确定直播内容属于第一安全等级,并输出结果。
当第一分类器判断结果为直播内容属于第二安全等级时,计算第一特征差值,并将第一特征差值发送至下一分类器判断直播内容是否属于第一安全等级,若判断直播内容不存在违规内容,则表示当前直播内容为正常内容,并将结果输出,以供管理人员进行后续工作,若判断直播内容存在违规内容,则表示当前直播内容存在违规内容,同样将判断结果输出。
步骤210:当判断结果为直播内容属于第三安全等级时,通过
Figure GDA0002170206990000101
计算得到第二特征差值;
其中,Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,
Figure GDA0002170206990000103
为将第二特征数据集输入第一分类器计算得到的特征值,第一特征数据集包含第二特征数据集。
步骤211:下一级分类器获取第二特征差值,将第二特征差值与第三预设阈值进行比较。
步骤212:当第二特征差值大于第三预设阈值时,则确定直播内容属于第三安全等级,并输出结果。
步骤213:当第二特征差值小于或者等于第三预设阈值时,则确定直播内容属于第一安全等级,并输出结果。
当第一分类器判断结果为直播内容属于第三安全等级时,由于第一分类器获取的特征数据只是一种特征数据或者一类特征数据,为了防止第一分类器误判,计算当前分类器即第一分类器的第二特征差值,由下一集分类器依据第二特征差值判断直播内容是否属于第一安全等级,并输出结果。
若判断直播内容不存在违规内容,则表示当前直播内容为正常内容,并将结果输出,以供管理人员进行后续工作,若判断直播内容存在违规内容,则表示当前直播内容存在违规内容,同样将判断结果输出。
将判断结果输出至审核反馈模块,以方便管理人员对直播内容的实时监测。
本发明实施例提供的一种实时监测直播内容的方法,通过实时监测,将直播数据以及观众数据提取特征数据,分别计算各特征数据对应的分数值;使用第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果使得管理人员可以依据判断结果进行后续的工作。可见,通过本发明实施例提供的一种实时监测直播内容的方法,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。
实施例三
参照图3示出,本发明实施例三的一种实时监测直播内容的装置。
本发明实施例提供的实时监测直播内容的装置包括:实时接收模块301,用于实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;提取模块302,用于从所述直播数据以及所述观众数据中提取特征数据;计算模块303,用于分别计算各特征数据对应的分数值;输出结果模块304,用于第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果。
本发明实施例提供的一种实时监测直播内容的装置,通过实时监测,将直播数据以及观众数据提取特征数据,分别计算各特征数据对应的分数值;使用第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果。使得管理人员可以依据判断结果进行后续的工作。可见,通过本发明实施例提供的一种实时监测直播内容的装置,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。
实施例四
参照图4示出,本发明实施例四的一种实时监测直播内容的装置。
本发明实施例提供的实时监测直播内容的装置包括:实时接收模块401,用于实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;提取模块402,用于从所述直播数据以及所述观众数据中提取特征数据;第一计算模块403,用于分别计算各特征数据对应的分数值;输出结果模块404,用于第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果。
优选地,所述输出结果模块404包括:第一计算子模块4041,用于当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值,其中所述安全等级包括:第一安全等级、第二安全等级以及第三安全等级,且各分类器以级联的方式连接;第一判断子模块4042,用于将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果;第二计算子模块4043,用于当判断结果为直播内容属于第三安全等级时,计算当前分类器与下一级分类器的第二特征差值;第二判断子模块4044,用于由所述下一级分类器依据所述特征差值判断直播内容是否属于第一安全等级并输出结果。
优选地,所述装置还包括:训练模块405,用于在所述实时接收模块实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据之前,依据公式min∑L(f(Xi),Yi)+αT对分类器进行训练;其中,f(Xi)表示整体的决策函数,α表示为超参数,T表示样本平均提取特征时间,Yi为标记样本。
优选地,所述计算模块403具体用于:通过Feature(C2)-Feature(C1)计算下一得到第一特征差值;其中,所述Feature(C2)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(C1)为将第二特征数据集输入所述第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
优选地,其特征在于,所述第一判断子模块4042包括:第一比较单元40421,用于下一级分类器获取所述第一特征差值,将所述第一特征差值与第二预设阈值进行比较;第一输出单元40422,用于当第一特征差值大于所述第二预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;第二输出单元40423,用于当第一特征差值小于或者等于第二预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
优选地,所述第二计算子模块4043具体用于:通过
Figure GDA0002170206990000131
计算得到第二特征差值;其中,所述Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(Ck)为将第二特征数据集输入第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
优选地,所述第二判断子模块4044包括:第二比较单元40441用于下一级分类器获取所述第二特征差值,将所述第二特征差值与第三预设阈值进行比较;第三输出单元40442,用于当所述第二特征差值大于所述第三预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;第四输出单元40443,用于当所述第二特征值小于或者等于第三预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
本发明实施例提供的一种实时监测直播内容的装置,通过实时监测,将直播数据以及观众数据提取特征数据,分别计算各特征数据对应的分数值;使用第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,并输出判断结果,使得管理人员可以依据判断结果进行后续的工作。可见,通过本发明实施例提供的一种实时监测直播内容的装置,可以实时结合视频,音频以及观众行为等多种特征对直播内容进行各种检测,能够提升检测的实时性,不仅如此,在检测时通过多个分类器的级联的形式确定最终的检测结果,不仅能够减少运算开销,还能够提升检测结果的准确性。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种实时监测直播内容的方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种实时监测直播内容的方法,其特征在于,所述方法包括:
实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;
从所述直播数据以及所述观众数据中提取特征数据;
分别计算各特征数据对应的分数值,其中,所述分数值为特征数据对应的违规概率;
第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果;
其中,所述安全等级包括:第一安全等级、第二安全等级以及第三安全等级,所述第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果的步骤包括:
当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值,其中,各分类器以级联的方式连接;
将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述第一特征差值判断直播内容是否属于第一安全等级并输出结果;
当判断结果为直播内容属于第三安全等级时,计算当前分类器与下一级分类器的第二特征差值;
由所述下一级分类器依据所述第二特征差值判断直播内容是否属于第一安全等级并输出结果。
2.根据权利要求1所述的方法,其特征在于,在实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据的步骤之前,所述方法还包括:
依据目标函数min∑L(f(Xi),Yi)+αT对分类器进行训练;
其中,f(Xi)表示整体的决策函数,α表示为超参数,用来控制准确率和耗时之间的平衡,T表示样本平均提取特征时间,Yi为标记样本。
3.根据权利要求1所述的方法,其特征在于,所述当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值的步骤包括:
通过Feature(C2)-Feature(C1)计算得到下一第一特征差值;
其中,所述Feature(C2)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(C1)为将第二特征数据集输入所述第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集中的数据。
4.根据权利要求1所述的方法,其特征在于,所述将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述第一特征差值判断直播是否属于第一安全等级并输出结果的步骤,包括:
下一级分类器获取所述第一特征差值,将所述第一特征差值与第二预设阈值进行比较;
当所述第一特征差值大于所述第二预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;
当第一特征差值小于或者等于第二预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
5.根据权利要求1所述的方法,其特征在于,所述当判断结果为直播内容属于第三安全等级时,计算第二特征差值的步骤包括:
通过
Figure FDA0002303113660000021
计算得到第二特征差值;
其中,所述Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述
Figure FDA0002303113660000022
Feature(Ck)为将第二特征数据集输入第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
6.根据权利要求1所述的方法,其特征在于,所述由所述下一级分类器依据所述第二特征差值判断直播内容是否属于第一安全等级并输出结果的步骤,包括:
下一级分类器获取所述第二特征差值,将所述第二特征差值与第三预设阈值进行比较;
当所述第二特征差值大于所述第三预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;
当所述第二特征差值小于或者等于所述第三预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
7.一种实时监测直播内容的装置,其特征在于,所述装置包括:
实时接收模块,用于实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据;
提取模块,用于从所述直播数据以及所述观众数据中提取特征数据;
计算模块,用于分别计算各特征数据对应的分数值,其中,所述分数值为特征数据对应的违规概率;
输出结果模块,用于第一分类器获取任意一个所述分数值与第一预设阈值进行比较,判断直播内容的安全等级,输出判断结果;
其中,所述输出结果模块包括:
第一计算子模块,用于当判断结果为直播内容属于第二安全等级时,计算当前分类器与下一级分类器的第一特征差值,其中所述安全等级包括:第一安全等级、第二安全等级以及第三安全等级,且各分类器以级联的方式连接;
第一判断子模块,用于将所述第一特征差值发送至所述下一级分类器,由所述下一级分类器依据所述第一特征差值判断直播内容是否属于第一安全等级并输出结果;
第二计算子模块,用于当判断结果为直播内容属于第三安全等级时,计算当前分类器与下一级分类器的第二特征差值;
第二判断子模块,用于由所述下一级分类器依据所述第二特征差值判断直播内容是否属于第一安全等级并输出结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
训练模块,用于在所述实时接收模块实时接收并解析直播流数据以及观众流数据,得到直播数据以及观众数据之前,依据目标函数min∑L(f(Xi),Yi)+αT对分类器进行训练;
其中,f(Xi)表示整体的决策函数,α表示为超参数,用来控制准确率和耗时之间的平衡,T表示样本平均提取特征时间,Yi为标记样本。
9.根据权利要求7所述的装置,其特征在于,所述第一计算子模块具体用于:
通过Feature(C2)-Feature(C1)计算得到下一第一特征差值;
其中,所述Feature(C2)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述Feature(C1)将第二特征数据集输入所述第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集中的数据。
10.根据权利要求7所述的装置,其特征在于,所述第一判断子模块包括:
第一比较单元,用于下一级分类器获取所述第一特征差值,将所述第一特征差值与第二预设阈值进行比较;
第一输出单元,用于当所述第一特征差值大于所述第二预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;
第二输出单元,用于当第一特征差值小于或者等于第二预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
11.根据权利要求7所述的装置,其特征在于,所述第二计算子模块具体用于:
通过
Figure FDA0002303113660000041
计算得到第二特征差值;
其中,所述Feature(Ci+1)为将第一特征数据集输入所述下一级分类器计算得到的特征值,所述
Figure FDA0002303113660000042
Feature(Ck)为将第二特征数据集输入第一分类器计算得到的特征值,所述第一特征数据集包含所述第二特征数据集。
12.根据权利要求7所述的装置,其特征在于,所述第二判断子模块包括:
第二比较单元,用于下一级分类器获取所述第二特征差值,将所述第二特征差值与第三预设阈值进行比较;
第三输出单元,用于当所述第二特征差值大于所述第三预设阈值时,则确定所述直播内容属于第三安全等级,并输出结果;
第四输出单元,用于当所述第二特征差值小于或者等于第三预设阈值时,则确定所述直播内容属于第一安全等级,并输出结果。
CN201710305638.XA 2017-05-03 2017-05-03 一种实时监测直播内容的方法及装置 Active CN107197331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710305638.XA CN107197331B (zh) 2017-05-03 2017-05-03 一种实时监测直播内容的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710305638.XA CN107197331B (zh) 2017-05-03 2017-05-03 一种实时监测直播内容的方法及装置

Publications (2)

Publication Number Publication Date
CN107197331A CN107197331A (zh) 2017-09-22
CN107197331B true CN107197331B (zh) 2020-01-31

Family

ID=59873524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710305638.XA Active CN107197331B (zh) 2017-05-03 2017-05-03 一种实时监测直播内容的方法及装置

Country Status (1)

Country Link
CN (1) CN107197331B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2807642C1 (ru) * 2020-12-30 2023-11-20 Биго Текнолоджи Пте. Лтд. Способ и устройство, сервер и носитель данных для модерации прямой трансляции

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108156469B (zh) * 2017-12-15 2021-05-04 北京奇虎科技有限公司 一种直播合法性的检测方法和装置
CN110012302B (zh) * 2018-01-05 2021-09-14 阿里巴巴集团控股有限公司 一种网络直播监测方法及装置、数据处理方法
CN108600775B (zh) * 2018-05-22 2020-11-17 广州虎牙信息科技有限公司 直播视频的监控方法、装置、服务器和存储介质
CN109168019A (zh) * 2018-10-18 2019-01-08 百度在线网络技术(北京)有限公司 直播处理方法、装置、设备及计算机可读介质
CN109831698B (zh) * 2018-12-28 2021-07-23 广州华多网络科技有限公司 信息审核方法、装置、电子设备及计算机可读取存储介质
CN110414471B (zh) * 2019-08-06 2022-02-01 福建省趋普物联科技有限公司 基于双模型的视频识别方法及系统
CN111225234B (zh) * 2019-12-23 2022-07-26 广州市百果园信息技术有限公司 视频审核方法、视频审核装置、设备和存储介质
CN111310026A (zh) * 2020-01-17 2020-06-19 南京邮电大学 一种基于人工智能的涉黄涉恐监测方法
CN111770352B (zh) * 2020-06-24 2021-12-07 北京字节跳动网络技术有限公司 安全检测方法、装置、电子设备及存储介质
CN112788356B (zh) * 2020-12-30 2023-04-28 百果园技术(新加坡)有限公司 一种直播审核的方法、装置、服务器和存储介质
CN113766256A (zh) * 2021-02-09 2021-12-07 北京沃东天骏信息技术有限公司 一种直播风控方法和装置
CN114598911A (zh) * 2022-02-23 2022-06-07 南方电网数字电网研究院有限公司 基于网络直播信息数据传输用的数据同步处理方法
CN114786035A (zh) * 2022-05-25 2022-07-22 上海氪信信息技术有限公司 直播场景的合规质检和互动问答系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359372A (zh) * 2008-09-26 2009-02-04 腾讯科技(深圳)有限公司 分类器的训练方法及装置、识别敏感图片的方法及装置
CN105847852A (zh) * 2016-05-18 2016-08-10 武汉斗鱼网络科技有限公司 一种直播视频控制方法及装置
CN106331695A (zh) * 2016-08-24 2017-01-11 合肥数酷信息技术有限公司 一种基于视频音频检测与数据分析系统
CN106454492A (zh) * 2016-10-12 2017-02-22 武汉斗鱼网络科技有限公司 一种基于延时传送的直播色情内容审核系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110047388A1 (en) * 2009-08-24 2011-02-24 Samsung Electronics Co., Ltd. Method and apparatus for remotely controlling access to pornographic content of an image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359372A (zh) * 2008-09-26 2009-02-04 腾讯科技(深圳)有限公司 分类器的训练方法及装置、识别敏感图片的方法及装置
CN105847852A (zh) * 2016-05-18 2016-08-10 武汉斗鱼网络科技有限公司 一种直播视频控制方法及装置
CN106331695A (zh) * 2016-08-24 2017-01-11 合肥数酷信息技术有限公司 一种基于视频音频检测与数据分析系统
CN106454492A (zh) * 2016-10-12 2017-02-22 武汉斗鱼网络科技有限公司 一种基于延时传送的直播色情内容审核系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2807642C1 (ru) * 2020-12-30 2023-11-20 Биго Текнолоджи Пте. Лтд. Способ и устройство, сервер и носитель данных для модерации прямой трансляции

Also Published As

Publication number Publication date
CN107197331A (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
CN107197331B (zh) 一种实时监测直播内容的方法及装置
Erzin et al. Multimodal speaker identification using an adaptive classifier cascade based on modality reliability
JP2018067304A (ja) ネットワーク侵入検出方法及び装置
Giannakopoulos et al. A multi-class audio classification method with respect to violent content in movies using bayesian networks
US20090274364A1 (en) Apparatus and methods for detecting adult videos
Parida et al. Coordinated joint multimodal embeddings for generalized audio-visual zero-shot classification and retrieval of videos
CN111524527A (zh) 话者分离方法、装置、电子设备和存储介质
CN110120230B (zh) 一种声学事件检测方法及装置
JP5502703B2 (ja) フロー分類方法、システム、およびプログラム
US9043207B2 (en) Speaker recognition from telephone calls
KR101435778B1 (ko) 비디오 기반 시각적 특징과 다단계 통계적 결합을 이용한 유해 동영상 분류 방법 및 장치
CN103985381A (zh) 一种基于参数融合优化决策的音频索引方法
Kukanov et al. Cost sensitive optimization of deepfake detector
Lu et al. Detecting Unknown Speech Spoofing Algorithms with Nearest Neighbors.
JP5626221B2 (ja) 音響画像区間分類装置および方法
Potharaju et al. Classification of ontological violence content detection through audio features and supervised learning
CN114168788A (zh) 音频审核的处理方法、装置、设备及存储介质
Phan et al. Enabling early audio event detection with neural networks
CN114615007B (zh) 一种基于随机森林的隧道混合流量分类方法及系统
Liang et al. GAN-based out-of-domain detection using both in-domain and out-of-domain samples
CN109492124A (zh) 选择性注意线索指导的不良主播检测方法、装置及电子设备
Wang et al. Self-supervised learning of audio representations using angular contrastive loss
Kang Few-shot bioacoustic event detection using good embedding model
Wang et al. Network malicious traffic identification method based on wgan category balancing
Zhang et al. A deepfake video detection method based on multi-modal deep learning method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant