CN103390409A - 电子装置及其侦测色情音频的方法 - Google Patents

电子装置及其侦测色情音频的方法 Download PDF

Info

Publication number
CN103390409A
CN103390409A CN2012101462808A CN201210146280A CN103390409A CN 103390409 A CN103390409 A CN 103390409A CN 2012101462808 A CN2012101462808 A CN 2012101462808A CN 201210146280 A CN201210146280 A CN 201210146280A CN 103390409 A CN103390409 A CN 103390409A
Authority
CN
China
Prior art keywords
pornographic
curve
audio
pitch
audio content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101462808A
Other languages
English (en)
Inventor
吴俊德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2012101462808A priority Critical patent/CN103390409A/zh
Priority to TW101118461A priority patent/TWI479477B/zh
Priority to US13/892,290 priority patent/US20130304470A1/en
Publication of CN103390409A publication Critical patent/CN103390409A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4542Blocking scenes or portions of the received content, e.g. censoring scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种电子装置,用于侦测色情音频内容,主要包括存储器、读取模块、计算模块、对比模块、判读模块。存储器用于存储多个样本色情音频曲线。读取模块用于读取音频内容。计算模块用于计算音频内容的多个音高曲线。对比模块用于将多个音高曲线与所存储的多个样本色情音频曲线进行对比以得出多个音高曲线与所存储的多个样本色情音频曲线的拟合程度。判读模块用于根据拟合程度判断音频内容是否为色情音频。本发明还提供了上述电子装置侦测色情音频的方法。上述电子装置及其侦测色情音频的方法,不需要复杂的演算法,仅对音频进行侦测即可侦测出色情音频。

Description

电子装置及其侦测色情音频的方法
技术领域
本发明涉及音频侦测领域,尤其涉及一种电子装置及其侦测色情音频的方法。
背景技术
随着通信领域突飞猛进的发展,无论是生活、工作和学习都与网络密切相关,但是一些不健康的影音(如色情影音等)也会在网络上传播且很容易获取,这类不健康的影音不仅会诱发犯罪影响社会和谐发展,尤其给青少年的身心带来了极大的伤害。然而目前侦测色情影音的技术都需要通过同时侦测图像及音频来判定是否为色情影音内容,所用的演算法都很复杂,且演算过程很耗时。因此需要一种演算法简单且可快速有效的侦测色情影音内容的方法。
发明内容
有鉴于此,有必要提供一种电子装置,不需要复杂的演算法且可快速有效的侦测色情影音内容。
此外,还有必要提供上述电子装置侦测色情音频的方法,不需要复杂的演算法且可快速有效的侦测色情影音内容。
本发明实施方式中的电子装置,用于侦测色情音频内容,包括存储器、读取模块、计算模块、对比模块、判读模块。存储器用于存储多个样本色情音频曲线。读取模块用于读取音频内容。计算模块用于计算音频内容的多个音高曲线。对比模块用于将多个音高曲线与所存储的多个样本色情音频曲线进行对比以得出多个音高曲线与所存储的多个样本色情音频曲线的拟合程度。判读模块用于根据拟合程度判断音频内容是否为色情音频。
优选地,读取模块还用于对读取音频内容进行复制,然后将复制后的音频内容通过低通滤波器以滤除高频部分的音频,并将滤除高频部分的音频内容取绝对值得到低频能量分布。
优选地,读取模块还用于分析低频能量分布的音量分布,将音量分布小于预设音量门槛值的部分去除,再将声音持续时间不在预设时间范围内的音频内容去除,然后提取去除后的多个可疑音频片段以供计算模块计算音高曲线。
优选地,计算模块还用于去除所述多个音高曲线在女性音高频率范围以外的点。
优选地,对比模块还用于先通过插点的方式将需要对比的音高曲线中缺少音高频点位置补上,获得完整的音高曲线,再计算所述拟合程度。
优选地,对比模块还用于从多个音高曲线中读取一个音高曲线,然后将读取的音高曲线与存储器中所存储的多个样本色情音频曲线逐一进行比对得出多组拟合程度,再提取一个音高曲线的多组拟合程度中的最大值,并依据最大值判断与最大值对应的音高曲线是否为色情曲线。
优选地,对比模块还用于判断多个音高曲线中是否还有未读取的音高曲线,并在有未读取的音高曲线时继续读取下一个进行比对,以及在没有未读取的音高曲线时根据色情曲线的判断结果判断音频内容是否为色情音频。
优选地,判读模块还用于依据每个音高曲线的多组拟合程度的最大值计算出色情指数,并将色情指数与预设指数门限值比对以判读所述音频内容是否为色情音频。
优选地,判读模块还用于在色情指数超出预设指数门限值时自动切断音频或视频信号的输出。
优选地,判读模块还用于依据提取的每个音高曲线得出一个拟合程度的最大值,然后根据每个最大值计算出一个色情点数,并将计算出的多个色情点数进行累加,再根据累加后得出的累加值以算出色情指数。
本发明实施方式中的电子装置侦测色情音频内容的方法,包括:首先预存储多个样本色情音频曲线,然后从影音内容中读取音频内容,计算出音频内容的多个音高曲线。将计算后得到的多个音高曲线与所存储的多个样本色情音频曲线进行对比以得出多个音高曲线与所存储的多个样本色情音频曲线的拟合程度,并根据拟合程度判断音频内容是否为色情音频。
优选地,读取音频内容的步骤包括以下步骤:对读取音频内容进行复制,然后将复制后的音频内容通过低通滤波器以滤除高频部分的音频,并将滤除高频部分的音频内容取绝对值得到低频能量分布。
优选地,读取音频内容的步骤还包括以下步骤:分析频能量分布的音量分布,并将音量分布小于预设音量门槛值的部分去除,再将声音持续时间不在预设时间范围内的音频内容去除,然后提取去除后的多个可疑音频片段以供计算多个音高曲线。
优选地,去除所述多个音高曲线在女性音高频率范围以外的点。
优选地,通过插点的方式将需要对比的音高曲线中缺少音高频点位置补上,获得完整的音高曲线,再计算所述拟合程度。
优选地,根据拟合程度判断音频内容是否为色情音频的步骤包括以下步骤:从多个音高曲线中读取一个音高曲线,然后将读取的音高曲线与所存储的多个样本色情音频曲线逐一进行比对得出多组拟合程度,再提取一个音高曲线的多组拟合程度中的最大值,依据最大值判断与最大值对应的音高曲线是否为色情曲线,判断多个音高曲线中是否还有未读取的音高曲线,若有未读取的音高曲线,则继续读取下一个进行比对,若没有未读取的音高曲线,则根据色情曲线的判断结果判断音频内容是否为色情音频。
优选地,根据色情曲线的判断结果判断音频内容是否为色情音频的步骤包括:依据每个音高曲线的多组拟合程度的最大值计算出色情指数,将色情指数与预设指数门限值比对以判读音频内容是否为色情音频。
优选地,若色情指数超出预设指数门限值,则自动切断音频或视频信号的输出。
优选地,计算色情指数的步骤包括:依据提取的每个音高曲线得出一个拟合程度的最大值,根据每个最大值计算出一个色情点数,将计算出的多个色情点数进行累加,根据累加后得出的累加值算出色情指数。
本发明实施方式中的电子装置及其侦测色情音频的方法仅针对音频内容进行分析,依据简单的演算法,即可快速有效的侦测色情影音内容。
附图说明
图1为本发明电子装置一实施方式之功能模块图。
图2为本发明电子装置侦测色情音频的方法一实施方式的流程图。
图3为本发明实施方式中对读取的音频内容进一步进行处理的流程图。
图4所示为图3对所读取的音频内容做进一步处理的示意图。
图5为本发明实施方式中计算音高曲线的示意图。
图6为本发明实施方式中对音高曲线保留女性音高范围的示意图。
图7为本发明实施方式中与样本曲线的拟合程度很高的音高曲线的示例。
图8为本发明实施方式中将音高频率曲线做进一步处理以得到完整音高曲线的示意图。
图9为图2中步骤S400一实施方式的详细流程图。
图10为图2中步骤S500一实施方式的详细流程图。
图11为本发明实施方式中计算色情指数及判读的示意图。
主要元件符号说明:
电子装置        100
存储器          102
读取模块        104
计算模块        106
对比模块        108
判读模块        110
低通滤波器      112
处理器          114
具体实施方式
参见图1所示,为本发明电子装置100的功能模块图。在本实施方式中,电子装置100可为手机、视频播放器、平板电脑、音响、机顶盒、互联网等娱乐产品,也可为MSNTM、SKYPETM、QQTM等软件视频产品。在本发明一实施方式中,电子装置100储存有多个样本色情音频曲线,当电子装置100要播放音频时先读取音频内容,再计算出音频内容的多个音高曲线。然后,电子装置100将所计算的音高(pitch)曲线与所存储的多个样本色情音频曲线逐一进行对比,计算所计算的音高与所存储的多个样本色情音频曲线的拟合程度,并根据拟合程度判断所述音频内容是否为色情音频。
在本发明一具体实施例中,电子装置100包括处理器114、存储器102、读取模块104、计算模块106、对比模块108及判读模块110。存储器102中存储有多个样本色情音频曲线。在本实施方式中,存储器102是用于存储数据的硬件,如闪存、硬盘、缓冲器、内存等。处理器114执行读取模块104、计算模块106、对比模块108及判读模块110中的软件代码,以实现这些模块的功能。
读取模块104读取音频内容,并存入存储器102中。在本实施例中,存储器102包括音频缓冲器,用于存储读取模块104所读取的原始音频内容。在本实施例中,读取模块104可以先从网上下载音频内容或影音内容,也可从电子装置100所存储的音频文件或影音文件,还可以在网站在线收听音频内容或观看视频,还可以是收听电台广播中读取音频内容。
作为本发明一实施方式的进一步改进,读取模块104还可对音频内容进行进一步的处理,以进一步简化处理方法。比如,读取模块104对读取音频内容进行复制,然后将复制后的音频内容通过低通滤波器112以滤除高频部分的音频,并将滤除高频部分的音频内容取绝对值得到低频能量分布。读取模块104分析低频能量分布的音量分布,将音量分布小于预设音量门槛值的部分去除,再将声音持续时间不在预设时间范围内的音频内容去除,然后提取去除后的多个可疑音频片段作为后续处理所采用的音频内容。举例而言,预设音量门槛值可为最大音量的10%,预设时间范围可为0.4秒-1.2秒。
计算模块106根据读取模块104所获得的音频内容进行计算以得出多个表示频率分布的音高曲线。在本实施方式中,计算模块106计算音高曲线的依据可以是读取模块104直接读取的音频内容,也可以是经过进一步处理后得到的可疑音频片段。然后计算模块106通过音高算法以自相关方式计算出音频内容的多个音高曲线。在发明的一具体实施方式中,计算模块106在计算音高曲线之后还可去除多个音高曲线在女性音高频率范围以外的点。对比模块108将多个音高曲线中的每一个音高曲线与所存储的多个样本色情音频曲线逐一进行对比,得出每一个音高曲线与每一个样本色情音频曲线的拟合程度,并找出拟合程度的最大值。在本实施方式中,对比模块108可以将所读取的音高曲线直接与存储器102中所存储的多个样本色情音频曲线逐一进行对比。在其他实施方式中,对比模块108还可以将所读取的音高曲线做进一步的处理以得到完整音高曲线,再将经过处理后得到的完整音高曲线与存储器102中所存储的多个样本色情音频曲线逐一进行对比。在本实施方式中,对比模块108还可以判断多个音高曲线中是否还有未读取的音高曲线,并在有未读取的音高曲线时继续读取下一个进行比对,直至所有的音高曲线皆已对比完。
当所有的音高曲线皆已对比完,判读模块110根据从对比模块108中得到最大值判断音频内容是否为色情音频。在本实施方式中,当最大值大于预设的基准点(如:可为90%)时判定该音频曲线为色情曲线,当最大值不大于该预设的基准点时判定该音频曲线不是色情曲线。在本实施方式中,判读模块110可以依据色情曲线的数量来确定是否为音频内容。在其他实施方式中,判读模块110还可以对最大值进行其它处理来确定是否为音频内容。判读模块110首先将最大值与预设的基准点进行比对,选出大于预设的基准点的最大值。然后根据每一个选出的最大值计算出一个色情点数。然后判读模块110将所得出的每个色情点数进行函数运算(如:指数函数或线性函数)以判断是否为色情内容。在本实施方式中,当色情点数进行函数运算的结果大于预设指数门限值(如100%)时,就判定为色情内容。判读模块110如何进行函数运算以及如何判断色情内容将在下文中详述。
在本发明的一实施方式中,判读模块110根据色情内容作出相应的动作,比如:切断音频或视频信号输出,将音频输出强制静音及视频输出为黑色画面,或者关掉播放该视频的软件。在本发明的又一实施方式中,判读模块110还可以依据相应的动作来设置解除静音及黑色画面的条件,当达到该条件时将视频及音频信号恢复正常输出,比如:在经过一定预设时间后将视频及音频信号恢复正常输出。
如图2所示,为本发明电子装置100侦测色情音频的方法一实施方式的流程图。本方法应用于图1所示的电子装置100中,且通过图1所示的功能模块完成。
在步骤S 100中,存储器102中预存储多个样本音频曲线。在本实施方式中,存储器102中所存储的样本色情音频曲线为样本色情音高曲线。在步骤S200中,读取模块104从输入电子装置100的音频信号中读取一段音频内容以判断其是否为色情音频。
在其它实施方式中,读取模块104可对音频内容进行进一步的处理,以进一步简化处理方法。图3所示为读取模块104所读取的音频内容的进一步进行处理的流程图。其中,以A表示经读取模块104读取的音频内容的阵列,以B表示滤除高频成份后的音频内容的阵列。在步骤S2002中,A通过低通滤波器112滤除高频部份得到B。在步骤S2004中,提取B的绝对值,得到低频能量分布Energy。在步骤S2006中,将Energy中的音量分布与预设的音量门槛值比对,然后将大于预设的音量门槛值的值记为SlotA。在步骤S2008中,将SlotA中声音持续时间在一预定范围外的区段去除,在本实施方式中,该预定时间范围可设为0.4秒至1.2秒,即将声音持续时间小于0.4秒及声音持续时间大于1.2秒时间的区段去除。在步骤S2010中,依据SlotA去除的结果,将A中可疑音频片段提取出来作为后续处理所使用的音频内容。图4所示为图3对所读取的音频内容做进一步处理的示意图,从图4中可以看出,在后续计算音高曲线时,只需对图4中得到的可疑音频片段的波形进行计算,这样可以简化处理方法,以节省CPU的资源。
请回到图2,在步骤S300中,计算模块106根据读取模块104所获得的音频内容进行计算以得出多个表示频率分布的音高曲线。在本实施方式中,计算模块106计算音高曲线的依据可以是读取模块104直接读取的音频内容,也可以是经过进一步处理后得到的可疑音频片段。计算方法可以采用自相关公式(Autocorrelation Function,即ACF)的计算方法,也可以采用其他方法。由于以自相关公式计算音高曲线是公知技术,故在此不做详述。如图5所示为将得到的可疑音频片段的波形通过计算得到的音高曲线的示意图,从图5中可看出每一个可疑音频片段的波形会得到一个音高曲线。
在其它实施方式中,还可以在步骤S302中,计算模块106将计算出的表示频率分布的多个音高曲线在女性音高范围(如200Hz-550Hz)之外的频点去除。如图6所示为将算出的多个音高曲线保留女性音高范围的示意图。去除男性音高范围而只保留女性音高范围,只将女性发出的带有“啊”及“嗯”特性的呻吟声的音高曲线进行比对,以节省中央处理器(central processingunit,CPU,例如处理器114)的资源。
请回到图2,在步骤S400中,对比模块108从多个音高曲线中读取一个音高曲线,然后将读取的音高曲线与存储器102中所存储的多个样本色情音频曲线逐一进行比对得出多组拟合程度,再提取所述一个音高曲线的多组拟合程度中的最大值,并依据最大值判断与最大值对应的音高曲线是否为色情曲线。其中拟合程度是指两个曲线的相似度,可以通过计算判定系数的方法计算出来,此计算方法为常见的技术,故在此不详述。在本实施方式中,拟合程度越大表示两个曲线的相似度越高。后续过程的拟合程度以R2表示,且完全拟合时R2=100%,图7为与样本曲线的拟合程度很高的音高曲线的示例。
在本实施方式中,对比模块108可以将所读取的音高曲线直接与存储器102中所存储的多个样本色情音频曲线逐一进行对比。在其他实施方式中,对比模块108还可以将所读取的音高曲线做进一步的处理以得到完整音高曲线,再将经过处理后得到的完整音高曲线与存储器102中所存储的多个样本色情音频曲线逐一进行对比。图8所示为将音高频率曲线做进一步处理以得到完整音高曲线的示意图。当读取的音高曲线不完整时,比如有断点等情况,则依据所读取的音高曲线的趋势,将该音高曲线内缺少点数的位置以插点方式补上,以得到完整音高曲线。
图9为步骤S400一实施方式的详细流程图。在本发明的一实施方式中,令所计算出的音高曲线为m个,且在存储器102内所存储的样本色情曲线为i组。令如图9所示,在步骤S4002中,对比模块108读取m个音高曲线中的一个,与存储器102内i组样本色情音频曲线比对,在步骤S4004中,得出Rm 2={R1 2,R2 2,R3 2,R4 2…Ri 2}(其中,m={1,2,3…m})。在步骤S4006中,对比模块108从Rm 2中提取出最大值,并将最大值记为Max{Rm 2},Max{Rm 2}=Max{R1 2,R2 2,R3 2,R4 2…Ri 2}。在步骤S4008中,对比模块108判断m个音高曲线中是否还有未读取的音高曲线。若有未读取的音高曲线,返回到步骤S4002中,继续读取下一个音高曲线进行比对。若没有未读取的音高曲线,说明所有的音高曲线都已完成比对,在步骤S4010中,提取经比对后得到的最大值。
请回到图2,在步骤S500中,判读模块110根据最大值判断音频内容是否为色情音频。在本实施方式中,当最大值大于一预设的基准点时判定该音频曲线为色情曲线,当最大值不大于该基准点时判定该音频曲线不是色情曲线。比如,若预设R2值为90%为基准点,则在R2值小于90%时判断该音高曲线为非色情曲线,在R2值不小于90%时判断该音高曲线为色情曲线。在本实施方式中,判读模块110可以依据色情曲线的数量来确定是否为音频内容。比如,侦测到一个色情曲线,即认为为音频内容。在其他实施方式中,判读模块110也可以对最大值进行其它处理来确定是否为音频内容,比如图10所示的方法。
如图10所示,在步骤S5002,判读模块110将最大值与基准点进行比对,选出大于基准点的最大值。在步骤S5004,且判读模块110根据每一个选出的最大值计算出一个色情点数。其中色情点数是指以基准点为起点,拟合程度的最大值每多1%,在色情点数上就增加10%所计算出来的数值,即为Aincre=(Rm 2 ,max-90%)*10,其中Aincre为色情点数,通过Aincre(Rm 2 ,max-90%)*10可计算出m个Aincre
在步骤S5006,判读模块110将所得出的每个色情点数进行函数运算以判断是否为色情内容。在本实施方式中,当色情点数进行函数运算的结果大于预设指数门限值(如100%)时,就判定为色情内容。其中,所采用的函数可以为随时间下降的函数,比如线性方式Aindex=Aindex-Am×△t下降或指数方式Aindex=Aindex×e{-△At}下降。在本实施方式中,首先将得到的m个Aincre加到Aindex,再通过Aindex=Aindex-Am×△t或指数方式,Aindex=Aindex×e{-△At}这两种计算方式,其中,Aindex等于色情指数的累加器,介于0%-100%之间。
在步骤S5008,首先判读模块110判断Aindex是否小于0,若Aindex小于0,则在步骤S5010中,均将Aindex视为等于0,此时判定读取模块104所读取到的音频内容为非色情音频内容。当Aindex大于0时,在步骤S5012中,然后判读模块110判断Aindex是否大于或等于100%,若Aindex大于或等于100%,则在步骤S5014中,均将Aindex视为100%。当Aindex超出了预设指数门限值100%,此时判定读取模块104所读取到的音频内容为色情音频内容。
为了避免色情内容所带来的危害,在步骤S5016中,判读模块110根据色情内容作出相应的动作,比如:切断音频或视频信号输出,将音频输出强制静音及视频输出为黑色画面,或者关掉播放该视频的软件。在步骤S5018中,判读模块110还可以设置解除静音及黑色画面的条件,当达到该条件时将视频及音频信号恢复正常输出,比如:在经过一定预设时间后将视频及音频信号恢复正常输出。
在本发明一实施方式中,图11所示为计算色情指数及判读的示意图。由图11中能够明显的看出每个音高曲线经由计算方式算出随时间递减的色情指数及将随时间递减后的结果累加的过程。其中,图11中标有>100%的部分表示经累加后超出了预设指数门限值100%,在本实施方式中,此时系统会切断音频或视频信号输出。
本发明的电子装置100及其侦测色情音频的方法,通过只针对影音内容中的音频内容进行分析,并依据简单的演算法,在节省CPU资源的同时可快速有效的侦测色情影音内容。

Claims (19)

1.一种电子装置,其特征在于,包括:
存储器,用于存储多个样本色情音频曲线;
读取模块,用于读取音频内容;
计算模块,用于计算出所述音频内容的多个音高曲线;
对比模块,用于将所述多个音高曲线与所存储的多个样本色情音频曲线进行对比以得出所述多个音高曲线与所存储的多个样本色情音频曲线的拟合程度;
判读模块,用于根据拟合程度判断所述音频内容是否为色情音频。
2.如权利要求1所述的电子装置,其特征在于,所述读取模块还用于对所述读取音频内容进行复制,然后将复制后的音频内容通过低通滤波器以滤除高频部分的音频,并将滤除高频部分的音频内容取绝对值得到低频能量分布。
3.如权利要求2所述的电子装置,其特征在于,所述读取模块还用于分析所述低频能量分布的音量分布,将所述音量分布小于预设音量门槛值的部分去除,再将声音持续时间不在预设时间范围内的音频内容去除,然后提取去除后的多个可疑音频片段以供所述计算模块计算音高曲线。
4.如权利要求1所述的电子装置,其特征在于,所述计算模块还用于去除所述多个音高曲线在女性音高频率范围以外的点。
5.如权利要求1所述的电子装置,其特征在于,所述对比模块还用于先通过插点的方式将需要对比的音高曲线中缺少音高频点位置补上,获得完整的音高曲线,再计算所述拟合程度。
6.如权利要求1所述的电子装置,其特征在于,所述对比模块还用于从所述多个音高曲线中读取一个音高曲线,然后将所述读取的音高曲线与所述存储器中所存储的多个样本色情音频曲线逐一进行比对得出多组拟合程度,再提取所述一个音高曲线的多组拟合程度中的最大值,并依据所述最大值判断与所述最大值对应的音高曲线是否为色情曲线。
7.如权利要求6所述的电子装置,其特征在于,所述对比模块还用于判断所述多个音高曲线中是否还有未读取的音高曲线,并在有未读取的音高曲线时继续读取下一个进行比对,以及在没有未读取的音高曲线时根据色情曲线的判断结果判断所述音频内容是否为色情音频。
8.如权利要求7所述的电子装置,其特征在于,所述判读模块还用于依据所述每个音高曲线的多组拟合程度的最大值计算出色情指数,并将所述色情指数与预设指数门限值比对以判读所述音频内容是否为色情音频。
9.如权利要求8所述的电子装置,其特征在于,所述判读模块还用于在所述色情指数超出所述预设指数门限值时自动切断音频或视频信号的输出。
10.如权利要求8所述的电子装置,其特征在于,所述判读模块还用于依据所述提取的每个音高曲线得出一个拟合程度的最大值,然后根据每个最大值计算出一个色情点数,并将所述计算出的多个色情点数进行累加,再根据所述累加后得出的累加值以算出所述色情指数。
11.一种电子装置侦测色情音频的方法,其特征在于,包括以下步骤:
预存储多个样本色情音频曲线;
读取音频内容;
计算出所述音频内容的多个音高曲线;
将所述多个音高曲线与所存储的多个样本色情音频曲线进行对比以得出所述多个音高曲线与所存储的多个样本色情音频曲线的拟合程度;及
根据所述拟合程度判断所述音频内容是否为色情音频。
12.如权利要求11所述的电子装置侦测色情音频的方法,其特征在于,所述读取音频内容的步骤包括以下步骤:
对所述读取音频内容进行复制;及
将复制后的音频内容通过低通滤波器以滤除高频部分的音频,并将滤除高频部分的音频内容取绝对值得到低频能量分布。
13.如权利要求12所述的电子装置侦测色情音频的方法,其特征在于,所述读取音频内容的步骤还包括以下步骤:
分析所述低频能量分布的音量分布,将所述音量分布小于预设音量门槛值的部分去除;
再将声音持续时间不在预设时间范围内的音频内容去除;及
提取去除后的多个可疑音频片段以供计算多个音高曲线。
14.如权利要求11所述的电子装置侦测色情音频的方法,其特征在于,还包括去除所述多个音高曲线在女性音高频率范围以外的点。
15.如权利要求11所述的电子装置侦测色情音频的方法,其特征在于,通过插点的方式将需要对比的音高曲线中缺少音高频点位置补上,获得完整的音高曲线,再计算所述拟合程度。
16.如权利要求11所述的电子装置侦测色情音频的方法,其特征在于,所述根据所述拟合程度判断音频内容是否为色情音频的步骤包括以下步骤:
从所述多个音高曲线中读取一个音高曲线;
将所述读取的音高曲线与所存储的多个样本色情音频曲线逐一进行比对得出多组拟合程度;
提取所述一个音高曲线的多组拟合程度中的最大值;
依据所述最大值判断与所述最大值对应的音高曲线是否为色情曲线;
判断所述多个音高曲线中是否还有未读取的音高曲线;
若有未读取的音高曲线,则继续读取下一个进行比对;及
若没有未读取的音高曲线,则根据色情曲线的判断结果判断所述音频内容是否为色情音频。
17.如权利要求16所述的电子装置侦测色情音频的方法,其特征在于,根据色情曲线的判断结果判断所述音频内容是否为色情音频的步骤包括:
依据所述每个音高曲线的多组拟合程度的最大值计算出色情指数;及
将所述色情指数与预设指数门限值比对以判读所述音频内容是否为色情音频。
18.如权利要求17所述的电子装置侦测色情音频的方法,其特征在于,还包括:若所述色情指数超出所述预设指数门限值,则自动切断音频或视频信号的输出。
19.如权利要求17所述的电子装置侦测色情音频的方法,其特征在于,计算所述色情指数的步骤包括:
依据所述提取的每个音高曲线得出一个拟合程度的最大值;
根据每个最大值计算出一个色情点数;及
将所述计算出的多个色情点数进行累加,根据所述累加后得出的累加值算出所述色情指数。
CN2012101462808A 2012-05-11 2012-05-11 电子装置及其侦测色情音频的方法 Pending CN103390409A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2012101462808A CN103390409A (zh) 2012-05-11 2012-05-11 电子装置及其侦测色情音频的方法
TW101118461A TWI479477B (zh) 2012-05-11 2012-05-24 電子裝置及其偵測色情音訊的方法
US13/892,290 US20130304470A1 (en) 2012-05-11 2013-05-12 Electronic device and method for detecting pornographic audio data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101462808A CN103390409A (zh) 2012-05-11 2012-05-11 电子装置及其侦测色情音频的方法

Publications (1)

Publication Number Publication Date
CN103390409A true CN103390409A (zh) 2013-11-13

Family

ID=49534655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101462808A Pending CN103390409A (zh) 2012-05-11 2012-05-11 电子装置及其侦测色情音频的方法

Country Status (3)

Country Link
US (1) US20130304470A1 (zh)
CN (1) CN103390409A (zh)
TW (1) TWI479477B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN110853648A (zh) * 2019-10-30 2020-02-28 广州多益网络股份有限公司 一种不良语音检测方法、装置、电子设备及存储介质
CN112423077A (zh) * 2020-10-15 2021-02-26 深圳Tcl新技术有限公司 视频播放方法、装置、设备和存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987003127A1 (en) * 1985-11-08 1987-05-21 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
CN1327573A (zh) * 1999-08-26 2001-12-19 索尼公司 信息检索方法、信息检索设备、信息存储方法和信息存储设备
CN1750121A (zh) * 2004-09-16 2006-03-22 北京中科信利技术有限公司 一种基于语音识别及语音分析的发音评估方法
US20070248327A1 (en) * 2006-04-21 2007-10-25 Cyberlink Corp. Systems and methods for detecting exciting scenes in sports video
CN101199002A (zh) * 2005-06-09 2008-06-11 A.G.I.株式会社 检测音调频率的语音分析器、语音分析方法以及语音分析程序
US7521622B1 (en) * 2007-02-16 2009-04-21 Hewlett-Packard Development Company, L.P. Noise-resistant detection of harmonic segments of audio signals
TW201021024A (en) * 2008-11-19 2010-06-01 Inst Information Industry Method for classifying speech emotion and method for establishing emotional semantic model thereof
CN101751923A (zh) * 2008-12-03 2010-06-23 财团法人资讯工业策进会 语音情绪的分类方法及其情绪语意模型的建立方法
CN101789990A (zh) * 2009-12-23 2010-07-28 宇龙计算机通信科技(深圳)有限公司 一种在通话过程中判断对方情绪的方法及移动终端
CN101819638A (zh) * 2010-04-12 2010-09-01 中国科学院计算技术研究所 色情检测模型建立方法和色情检测方法
CN102073780A (zh) * 2009-11-23 2011-05-25 财团法人资讯工业策进会 信息仿真处理系统、装置及方法
US20110153328A1 (en) * 2009-12-21 2011-06-23 Electronics And Telecommunications Research Institute Obscene content analysis apparatus and method based on audio data analysis
US20110295607A1 (en) * 2010-05-31 2011-12-01 Akash Krishnan System and Method for Recognizing Emotional State from a Speech Signal

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675384B1 (en) * 1995-12-21 2004-01-06 Robert S. Block Method and apparatus for information labeling and control
TWI360802B (en) * 2006-08-30 2012-03-21 Realtek Semiconductor Corp Method and appartaus for indicating status of disp
US8208643B2 (en) * 2007-06-29 2012-06-26 Tong Zhang Generating music thumbnails and identifying related song structure
CN101470897B (zh) * 2007-12-26 2011-04-20 中国科学院自动化研究所 基于音视频融合策略的敏感影片检测方法
TW201127662A (en) * 2010-02-12 2011-08-16 Macauto Ind Co Ltd Sunshade curtain device

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987003127A1 (en) * 1985-11-08 1987-05-21 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
CN1327573A (zh) * 1999-08-26 2001-12-19 索尼公司 信息检索方法、信息检索设备、信息存储方法和信息存储设备
CN1750121A (zh) * 2004-09-16 2006-03-22 北京中科信利技术有限公司 一种基于语音识别及语音分析的发音评估方法
CN101199002A (zh) * 2005-06-09 2008-06-11 A.G.I.株式会社 检测音调频率的语音分析器、语音分析方法以及语音分析程序
US20070248327A1 (en) * 2006-04-21 2007-10-25 Cyberlink Corp. Systems and methods for detecting exciting scenes in sports video
US7521622B1 (en) * 2007-02-16 2009-04-21 Hewlett-Packard Development Company, L.P. Noise-resistant detection of harmonic segments of audio signals
TW201021024A (en) * 2008-11-19 2010-06-01 Inst Information Industry Method for classifying speech emotion and method for establishing emotional semantic model thereof
CN101751923A (zh) * 2008-12-03 2010-06-23 财团法人资讯工业策进会 语音情绪的分类方法及其情绪语意模型的建立方法
CN102073780A (zh) * 2009-11-23 2011-05-25 财团法人资讯工业策进会 信息仿真处理系统、装置及方法
US20110153328A1 (en) * 2009-12-21 2011-06-23 Electronics And Telecommunications Research Institute Obscene content analysis apparatus and method based on audio data analysis
CN101789990A (zh) * 2009-12-23 2010-07-28 宇龙计算机通信科技(深圳)有限公司 一种在通话过程中判断对方情绪的方法及移动终端
CN101819638A (zh) * 2010-04-12 2010-09-01 中国科学院计算技术研究所 色情检测模型建立方法和色情检测方法
US20110295607A1 (en) * 2010-05-31 2011-12-01 Akash Krishnan System and Method for Recognizing Emotional State from a Speech Signal

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN110853648A (zh) * 2019-10-30 2020-02-28 广州多益网络股份有限公司 一种不良语音检测方法、装置、电子设备及存储介质
CN110853648B (zh) * 2019-10-30 2022-05-03 广州多益网络股份有限公司 一种不良语音检测方法、装置、电子设备及存储介质
CN112423077A (zh) * 2020-10-15 2021-02-26 深圳Tcl新技术有限公司 视频播放方法、装置、设备和存储介质

Also Published As

Publication number Publication date
TW201346888A (zh) 2013-11-16
US20130304470A1 (en) 2013-11-14
TWI479477B (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN110475155B (zh) 直播视频热度状态识别方法、装置、设备及可读介质
US8805560B1 (en) Noise based interest point density pruning
CN108563655B (zh) 基于文本的事件识别方法和装置
CN103971681A (zh) 一种语音识别方法及系统
US11785105B2 (en) Methods and apparatus to facilitate meter to meter matching for media identification
US11316603B2 (en) Methods and apparatus for increasing the robustness of media signatures
EP2710587A1 (en) Automated conversation assistance
WO2018229497A1 (en) A method and system for triggering events
CN110111811A (zh) 音频信号检测方法、装置和存储介质
CN106598997B (zh) 一种计算文本主题归属度的方法及装置
CN103390409A (zh) 电子装置及其侦测色情音频的方法
CN115394318A (zh) 一种音频检测方法和装置
US10283129B1 (en) Audio matching using time-frequency onsets
US9213703B1 (en) Pitch shift and time stretch resistant audio matching
CN110888877A (zh) 事件信息显示方法、装置、计算设备及存储介质
CN113033500B (zh) 动作片段检测方法、模型训练方法及装置
CN113076932B (zh) 训练音频语种识别模型的方法、视频检测方法及其装置
CN106340310A (zh) 语音检测方法及装置
CN102970663A (zh) 一种处理短信的方法及装置
CN104657397B (zh) 一种信息处理方法及终端
CN112863548A (zh) 训练音频检测模型的方法、音频检测方法及其装置
CN110110191B (zh) 搜索处理方法和装置及计算机可读存储介质
CN110969189B (zh) 人脸检测方法、装置及电子设备
TWI585757B (zh) 口吃偵測方法與裝置、電腦程式產品
JP2007088523A5 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131113

WD01 Invention patent application deemed withdrawn after publication