TWI479477B - 電子裝置及其偵測色情音訊的方法 - Google Patents

電子裝置及其偵測色情音訊的方法 Download PDF

Info

Publication number
TWI479477B
TWI479477B TW101118461A TW101118461A TWI479477B TW I479477 B TWI479477 B TW I479477B TW 101118461 A TW101118461 A TW 101118461A TW 101118461 A TW101118461 A TW 101118461A TW I479477 B TWI479477 B TW I479477B
Authority
TW
Taiwan
Prior art keywords
audio
pornographic
pitch curve
curve
pitch
Prior art date
Application number
TW101118461A
Other languages
English (en)
Other versions
TW201346888A (zh
Inventor
Chun Te Wu
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201346888A publication Critical patent/TW201346888A/zh
Application granted granted Critical
Publication of TWI479477B publication Critical patent/TWI479477B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4542Blocking scenes or portions of the received content, e.g. censoring scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

電子裝置及其偵測色情音訊的方法
本發明涉及音訊偵測領域,尤其涉及一種電子裝置及其偵測色情音訊的方法。
隨著通訊領域突飛猛進的發展,無論是生活、工作和學習都與網路密切相關,但是一些不健康的影音(如色情影音等)也會在網路上傳播且很容易獲取,這類不健康的影音不僅會誘發犯罪影響社會和諧發展,尤其給青少年的身心帶來了極大的傷害。然而目前偵測色情影音的技術都需要通過同時偵測圖像及音訊來判定是否為色情影音內容,所用的演算法都很複雜,且演算過程很耗時。因此需要一種演算法簡單且可快速有效的偵測色情影音內容的方法。
有鑑於此,有必要提供一種電子裝置,不需要複雜的演算法且可快速有效的偵測色情影音內容。
此外,還有必要提供上述電子裝置偵測色情音訊的方法,不需要複雜的演算法且可快速有效的偵測色情影音內容。
本發明實施方式中的電子裝置,用於偵測色情音訊內容,包括記憶體、讀取模組、計算模組、對比模組、判讀模組。記憶體用於 存儲複數樣本色情音訊曲線。讀取模組用於讀取音訊內容。計算模組用於計算音訊內容的複數音高曲線。對比模組用於將該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度。判讀模組用於根據擬合程度判斷音訊內容是否為色情音訊。
優選地,讀取模組還用於對讀取音訊內容進行複製,然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊,並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。
優選地,讀取模組還用於分析低頻能量分佈的音量分佈,將音量分佈小於預設音量門檻值的部分去除,再將聲音持續時間不在預設時間範圍內的音訊內容去除,然後提取去除後的複數可疑音訊片段以供計算模組計算音高曲線。
優選地,計算模組還用於去除該等音高曲線在女性音高頻率範圍以外的點。
優選地,對比模組還用於先通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上,獲得完整的音高曲線,再計算該擬合程度。
優選地,對比模組還用於從該等音高曲線中讀取一個音高曲線,然後將讀取的音高曲線與記憶體中所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度,再提取一個音高曲線的多組擬合程度中的最大值,並依據最大值判斷與最大值對應的音高曲線是否為色情曲線。
優選地,對比模組還用於判斷該等音高曲線中是否還有未讀取的 音高曲線,並在有未讀取的音高曲線時繼續讀取下一個進行比對,以及在沒有未讀取的音高曲線時根據色情曲線的判斷結果判斷音訊內容是否為色情音訊。
優選地,判讀模組還用於依據每個音高曲線的多組擬合程度的最大值計算出色情指數,並將色情指數與預設指數門限值比對以判讀該音訊內容是否為色情音訊。
優選地,判讀模組還用於在色情指數超出預設指數門限值時自動切斷音訊或視訊訊號的輸出。
優選地,判讀模組還用於依據提取的每個音高曲線得出一個擬合程度的最大值,然後根據每個最大值計算出一個色情點數,並將計算出的複數色情點數進行累加,再根據累加後得出的累加值以算出色情指數。
本發明實施方式中的電子裝置偵測色情音訊內容的方法,包括:首先預存儲複數樣本色情音訊曲線,然後從影音內容中讀取音訊內容,計算出音訊內容的複數音高曲線。將計算後得到的該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度,並根據擬合程度判斷音訊內容是否為色情音訊。
優選地,讀取音訊內容的步驟包括以下步驟:對讀取音訊內容進行複製,然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊,並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。
優選地,讀取音訊內容的步驟還包括以下步驟:分析頻能量分佈 的音量分佈,並將音量分佈小於預設音量門檻值的部分去除,再將聲音持續時間不在預設時間範圍內的音訊內容去除,然後提取去除後的複數可疑音訊片段以供計算複數音高曲線。
優選地,去除該等音高曲線在女性音高頻率範圍以外的點。
優選地,通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上,獲得完整的音高曲線,再計算該擬合程度。
優選地,根據擬合程度判斷音訊內容是否為色情音訊的步驟包括以下步驟:從該等音高曲線中讀取一個音高曲線,然後將讀取的音高曲線與所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度,再提取一個音高曲線的多組擬合程度中的最大值,依據最大值判斷與最大值對應的音高曲線是否為色情曲線,判斷該複數音高曲線中是否還有未讀取的音高曲線,若有未讀取的音高曲線,則繼續讀取下一個進行比對,若沒有未讀取的音高曲線,則根據色情曲線的判斷結果判斷音訊內容是否為色情音訊。
優選地,根據色情曲線的判斷結果判斷音訊內容是否為色情音訊的步驟包括:依據每個音高曲線的多組擬合程度的最大值計算出色情指數,將色情指數與預設指數門限值比對以判讀音訊內容是否為色情音訊。
優選地,若色情指數超出預設指數門限值,則自動切斷音訊或視訊訊號的輸出。
優選地,計算色情指數的步驟包括:依據提取的每個音高曲線得出一個擬合程度的最大值,根據每個最大值計算出一個色情點數,將計算出的複數色情點數進行累加,根據累加後得出的累加值 算出色情指數。
以下結合附圖和具體實施例對本發明進行詳細描述,但不作為對本發明的限定。
100‧‧‧電子裝置
102‧‧‧記憶體
104‧‧‧讀取模組
106‧‧‧計算模組
108‧‧‧對比模組
110‧‧‧判讀模組
112‧‧‧低通濾波器
114‧‧‧處理器
圖1為本發明電子裝置一實施方式之功能模組圖。
圖2為本發明電子裝置偵測色情音訊的方法一實施方式的流程圖。
圖3為本發明實施方式中對讀取的音訊內容進一步進行處理的流程圖。
圖4所示為圖3對所讀取的音訊內容做進一步處理的示意圖。
圖5為本發明實施方式中計算音高曲線的示意圖。
圖6為本發明實施方式中對音高曲線保留女性音高範圍的示意圖。
圖7a及圖7b均為本發明實施方式中與樣本曲線的擬合程度很高的音高曲線的示例。
圖8為本發明實施方式中將音高頻率曲線做進一步處理以得到完整音高曲線的示意圖。
圖9為圖2中步驟S400一實施方式的詳細流程圖。
圖10為圖2中步驟S500一實施方式的詳細流程圖。
圖11為本發明實施方式中計算色情指數及判讀的示意圖。
請參閱圖1,所示為本發明電子裝置100的功能模組圖。在本實施方式中,電子裝置100可為手機、視訊播放機、平板電腦、音響、機上盒、互聯網等娛樂產品,也可為MSNTM、SKYPETM、QQTM等軟體視訊產品。在本發明一實施方式中,電子裝置100儲存有複數樣本色情音訊曲線,當電子裝置100要播放音訊時先讀取音訊內容,再計算出音訊內容的複數音高曲線。然後,電子裝置100將所計算的音高(pitch)曲線與所存儲的該等樣本色情音訊曲線逐一進行對比,計算所計算的音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度,並根據擬合程度判斷該音訊內容是否為色情音訊。
在本發明一具體實施例中,電子裝置100包括處理器114、記憶體102、讀取模組104、計算模組106、對比模組108及判讀模組110。記憶體102中存儲有複數樣本色情音訊曲線。在本實施方式中,記憶體102是用於存儲資料的硬體,如快閃記憶體、硬碟、緩衝器、記憶體等。處理器114執行讀取模組104、計算模組106、對比模組108及判讀模組110中的軟體代碼,以實現這些模組的功能。
讀取模組104讀取音訊內容,並存入記憶體102中。在本實施例中,記憶體102包括音訊緩衝器,用於存儲讀取模組104所讀取的原始音訊內容。在本實施例中,讀取模組104可以先從網上下載音訊內容或影音內容,也可從電子裝置100所存儲的音訊檔或影音檔,還可以在網站線上收聽音訊內容或觀看視訊,還可以收聽電臺廣播中讀取音訊內容。
作為本發明一實施方式的進一步改進,讀取模組104還可對音訊 內容進行進一步的處理,以進一步簡化處理方法。比如,讀取模組104對讀取音訊內容進行複製,然後將複製後的音訊內容通過低通濾波器112以濾除高頻部分的音訊,並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。讀取模組104分析低頻能量分佈的音量分佈,將音量分佈小於預設音量門檻值的部分去除,再將聲音持續時間不在預設時間範圍內的音訊內容去除,然後提取去除後的複數可疑音訊片段作為後續處理所採用的音訊內容。舉例而言,預設音量門檻值可為最大音量的10%,預設時間範圍可為0.4秒-1.2秒。
計算模組106根據讀取模組104所獲得的音訊內容進行計算以得出複數表示頻率分佈的音高曲線。在本實施方式中,計算模組106計算音高曲線的依據可以是讀取模組104直接讀取的音訊內容,也可以是經過進一步處理後得到的可疑音訊片段。然後計算模組106通過音高演算法以自相關方式計算出音訊內容的複數音高曲線。在發明的一具體實施方式中,計算模組106在計算音高曲線之後還可去除複數音高曲線在女性音高頻率範圍以外的點。對比模組108將該等音高曲線中的每一個音高曲線與所存儲的該等樣本色情音訊曲線逐一進行對比,得出每一個音高曲線與每一個樣本色情音訊曲線的擬合程度,並找出擬合程度的最大值。在本實施方式中,對比模組108可以將所讀取的音高曲線直接與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在其他實施方式中,對比模組108還可以將所讀取的音高曲線做進一步的處理以得到完整音高曲線,再將經過處理後得到的完整音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在本實施方式中,對比模組108還可以判斷複數音高曲線中是否 還有未讀取的音高曲線,並在有未讀取的音高曲線時繼續讀取下一個進行比對,直至所有的音高曲線皆已對比完。
當所有的音高曲線皆已對比完,判讀模組110根據從對比模組108中得到最大值判斷音訊內容是否為色情音訊。在本實施方式中,當最大值大於預設的基準點(如:可為90%)時判定該音訊曲線為色情曲線,當最大值不大於該預設的基準點時判定該音訊曲線不是色情曲線。在本實施方式中,判讀模組110可以依據色情曲線的數量來確定是否為音訊內容。在其他實施方式中,判讀模組110還可以對最大值進行其它處理來確定是否為音訊內容。判讀模組110首先將最大值與預設的基準點進行比對,選出大於預設的基準點的最大值。然後根據每一個選出的最大值計算出一個色情點數。然後判讀模組110將所得出的每個色情點數進行函數運算(如:指數函數或線性函數)以判斷是否為色情內容。在本實施方式中,當色情點數進行函數運算的結果大於預設指數門限值(如100%)時,就判定為色情內容。判讀模組110如何進行函數運算以及如何判斷色情內容將在下文中詳述。
在本發明的一實施方式中,判讀模組110根據色情內容作出相應的動作,比如:切斷音訊或視訊訊號輸出,將音訊輸出強制靜音及視訊輸出為黑色畫面,或者關掉播放該視訊的軟體。在本發明的又一實施方式中,判讀模組110還可以依據相應的動作來設置解除靜音及黑色畫面的條件,當達到該條件時將視訊及音訊訊號恢復正常輸出,比如:在經過一定預設時間後將視訊及音訊訊號恢復正常輸出。
圖2為本發明電子裝置100偵測色情音訊的方法一實施方式的流程 圖。本方法應用於圖1所示的電子裝置100中,且通過圖1所示的功能模組完成。
在步驟S100中,記憶體102中預存儲複數樣本色情音訊曲線。在本實施方式中,記憶體102中所存儲的樣本色情音訊曲線為樣本色情音高曲線。在步驟S200中,讀取模組104從輸入電子裝置100的音訊訊號中讀取一段音訊內容以判斷其是否為色情音訊。
在其它實施方式中,讀取模組104可對音訊內容進行進一步的處理,以進一步簡化處理方法。圖3所示為讀取模組104所讀取的音訊內容的進一步進行處理的流程圖。其中,以A表示經讀取模組104讀取的音訊內容的陣列,以B表示濾除高頻成份後的音訊內容的陣列。在步驟S2002中,A通過低通濾波器112濾除高頻部份得到B。在步驟S2004中,提取B的絕對值,得到低頻能量分佈Energy。在步驟S2006中,將Energy中的音量分佈與預設的音量門檻值比對,然後將大於預設的音量門檻值記為SlotA。在步驟S2008中,將SlotA中聲音持續時間在預定時間範圍外的區段去除,在本實施方式中,該預定時間範圍可設為0.4秒至1.2秒,即將聲音持續時間小於0.4秒及聲音持續時間大於1.2秒時間的區段去除。在步驟S2010中,依據SlotA去除的結果,將A中可疑音訊片段提取出來作為後續處理所使用的音訊內容。圖4所示為圖3對所讀取的音訊內容做進一步處理的示意圖,從圖4中可以看出,在後續計算音高曲線時,只需對圖4中得到的可疑音訊片段的波形進行計算,這樣可以簡化處理方法,以節省中央處理器(CPU,例如處理器114)的資源。
請回到圖2,在步驟S300中,計算模組106根據讀取模組104所獲 得的音訊內容進行計算以得出複數表示頻率分佈的音高曲線。在本實施方式中,計算模組106計算音高曲線的依據可以是讀取模組104直接讀取的音訊內容,也可以是經過進一步處理後得到的可疑音訊片段。計算方法可以採用自相關公式(Autocorrelation Function,即ACF)的計算方法,也可以採用其他方法。由於以自相關公式計算音高曲線是公知技術,故在此不做詳述。如圖5所示為將得到的可疑音訊片段的波形通過計算得到的音高曲線的示意圖,從圖5中可看出每一個可疑音訊片段的波形會得到一個音高曲線。
在其它實施方式中,還可以在步驟S302中,計算模組106將計算出的表示頻率分佈的複數音高曲線在女性音高範圍(如200Hz-550Hz)之外的頻點去除。如圖6所示為將算出的該等音高曲線保留女性音高範圍的示意圖。去除男性音高範圍而只保留女性音高範圍,只將女性發出的帶有“啊”及“嗯”特性的呻吟聲的音高曲線進行比對,以節省中央處理器(central processing unit,CPU,例如處理器114)的資源。
請回到圖2,在步驟S400中,對比模組108從複數音高曲線中讀取一個音高曲線,然後將讀取的音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度,再提取該一個音高曲線的多組擬合程度中的最大值,並依據最大值判斷與最大值對應的音高曲線是否為色情曲線。其中擬合程度是指兩個曲線的相似度,可以通過計算判定係數的方法計算出來,此計算方法為常見的技術,故在此不詳述。在本實施方式中,擬合程度越大表示兩個曲線的相似度越高。後續過程的擬合程度以R2表 示,且完全擬合時R2=100%,圖7a與圖7b均為與樣本曲線的擬合程度很高的音高曲線的示例。
在本實施方式中,對比模組108可以將所讀取的音高曲線直接與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在其他實施方式中,對比模組108還可以將所讀取的音高曲線做進一步的處理以得到完整音高曲線,再將經過處理後得到的完整音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。圖8所示為將音高頻率曲線做進一步處理以得到完整音高曲線的示意圖。當讀取的音高曲線不完整時,比如有中斷點等情況,則依據所讀取的音高曲線的趨勢,將該音高曲線內缺少點數的位置以插點方式補上,以得到完整音高曲線。
圖9為步驟S400一實施方式的詳細流程圖。在本發明的一實施方式中,令所計算出的音高曲線為m個,且在記憶體102內所存儲的樣本色情曲線為i組。如圖9所示,在步驟S4002中,對比模組108讀取m個音高曲線中的一個,與記憶體102內i組樣本色情音訊曲線比對,在步驟S4004中,得出Rm2={R12,R22,R32,R42,…Ri2}(其中,m={1,2,3…m})。在步驟S4006中,對比模組108從Rm2中提取出最大值,並將最大值記為Max{Rm2},Max{Rm2}=Max{R12,R22,R32,R42,…Ri2}。在步驟S4008中,對比模組108判斷m個音高曲線中是否還有未讀取的音高曲線。若有未讀取的音高曲線,返回到步驟S4002中,繼續讀取下一個音高曲線進行比對。若沒有未讀取的音高曲線,說明所有的音高曲線都已完成比對,在步驟S4010中,提取經比對後得到的最大值。
請回到圖2,在步驟S500中,判讀模組110根據最大值判斷音訊內 容是否為色情音訊。在本實施方式中,當最大值大於預設的基準點時判定該音訊曲線為色情曲線,當最大值不大於該基準點時判定該音訊曲線不是色情曲線。比如,若預設R2=90%為基準點,則在R2值小於90%時判斷該音高曲線為非色情曲線,在R2值不小於90%時判斷該音高曲線為色情曲線。在本實施方式中,判讀模組110可以依據色情曲線的數量來確定是否為音訊內容。比如,偵測到一個色情曲線,即認為為音訊內容。在其他實施方式中,判讀模組110也可以對最大值進行其它處理來確定是否為音訊內容,比如圖10所示的方法。
如圖10所示,在步驟S5002,判讀模組110將最大值與基準點進行比對,選出大於基準點的最大值。在步驟S5004,判讀模組110根據每一個選出的最大值計算出一個色情點數。其中色情點數是指以基準點為起點,擬合程度的最大值每多1%,在色情點數上就增加10%所計算出來的數值,即為Aincre=(Rm2,max-90%)*10,其中Aincre為色情點數,通過Aincre=(Rm2,max-90%)*10可計算出m個Aincre。
在步驟S5006,判讀模組110將所得出的每個色情點數進行函數運算以判斷是否為色情內容。在本實施方式中,當色情點數進行函數運算的結果大於預設指數門限值(如100%)時,就判定為色情內容。其中,所採用的函數可以為隨時間下降的函數,比如線性方式Aindex=Aindex-Am×△t下降或指數方式Aindex=Aindex×e{-△At}下降。在本實施方式中,首先將得到的m個Aincre加到Aindex,再通過線性方式Aindex=Aindex-Am×△t或指數方式Aindex=Aindex×e{-△At}這兩種計算方式,其中,Aindex等於色 情指數的累加器,介於0%-100%之間。
在步驟S5008,首先判讀模組110判斷Aindex是否小於0%,若Aindex小於0%,則在步驟S5010中,均將Aindex視為等於0,此時判定讀取模組104所讀取到的音訊內容為非色情音訊內容。當Aindex大於0%時,在步驟S5012中,然後判讀模組110判斷Aindex是否大於或等於100%,若Aindex大於或等於100%,則在步驟S5014中,均將Aindex視為100%。當Aindex超出了預設指數門限值100%,此時判定讀取模組104所讀取到的音訊內容為色情音訊內容。
為了避免色情內容所帶來的危害,在步驟S5016中,判讀模組110根據色情內容作出相應的動作,比如:切斷音訊或視訊訊號輸出,將音訊輸出強制靜音及視訊輸出為黑色畫面,或者關掉播放該視訊的軟體。在步驟S5018中,判讀模組110還可以設置解除靜音及黑色畫面的條件,當達到該條件時將視訊及音訊訊號恢復正常輸出,比如:在經過一定預設時間後將視訊及音訊訊號恢復正常輸出。
在本發明一實施方式中,圖11所示為計算色情指數及判讀的示意圖。由圖11中能夠明顯的看出每個音高曲線經由計算方式算出隨時間遞減的色情指數及將隨時間遞減後的結果累加的過程。其中,圖11中標有>100%的部分表示經累加後超出了預設指數門限值100%,在本實施方式中,此時系統會切斷音訊或視訊訊號輸出。
本發明的電子裝置100及其偵測色情音訊的方法,通過只針對影音內容中的音訊內容進行分析,並依據簡單的演算法,在節省CPU資源的同時可快速有效的偵測色情影音內容。
另外,本領域技術人員還可在本發明精神內做其他變化,當然,這些依據本發明精神所做之變化,都應包含在本發明所要求保護之範圍之內。
100‧‧‧電子裝置
102‧‧‧記憶體
104‧‧‧讀取模組
106‧‧‧計算模組
108‧‧‧對比模組
110‧‧‧判讀模組
112‧‧‧低通濾波器
114‧‧‧處理器

Claims (15)

  1. 一種電子裝置,包括:記憶體,用於存儲複數樣本色情音訊曲線;讀取模組,用於讀取音訊內容,並對該讀取音訊內容進行複製,然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊,並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈,同時分析該低頻能量分佈的音量分佈,將該音量分佈小於預設音量門檻值的部分去除,再將聲音持續時間不在預設時間範圍內的音訊內容去除,然後提取去除後的複數音訊片段;計算模組,用於根據該等去除後的音訊片段計算出該音訊內容的複數音高曲線;對比模組,用於將該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度;及判讀模組,用於根據擬合程度判斷該音訊內容是否為色情音訊。
  2. 如申請專利範圍第1項所述之電子裝置,其中,該計算模組還用於去除該等音高曲線在女性音高頻率範圍以外的點。
  3. 如申請專利範圍第1項所述之電子裝置,其中,該對比模組還用於先通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上,獲得完整的音高曲線,再計算該擬合程度。
  4. 如申請專利範圍第1項所述之電子裝置,其中,該對比模組還用於從該等音高曲線中讀取一個音高曲線,然後將該讀取的音高曲線與該記憶體中所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度,再提 取該一個音高曲線的多組擬合程度中的最大值,並依據該最大值判斷與該最大值對應的音高曲線是否為色情曲線。
  5. 如申請專利範圍第4項所述之電子裝置,其中,該對比模組還用於判斷該等音高曲線中是否還有未讀取的音高曲線,並在有未讀取的音高曲線時繼續讀取下一個進行比對,以及在沒有未讀取的音高曲線時根據色情曲線的判斷結果判斷該音訊內容是否為色情音訊。
  6. 如申請專利範圍第5項所述之電子裝置,其中,該判讀模組還用於依據每個音高曲線的多組擬合程度的最大值計算出色情指數,並將該色情指數與預設指數門限值比對以判讀該音訊內容是否為色情音訊。
  7. 如申請專利範圍第6項所述之電子裝置,其中,該判讀模組還用於在該色情指數超出該預設指數門限值時自動切斷音訊或視訊訊號的輸出。
  8. 如申請專利範圍第6項所述之電子裝置,其中,該判讀模組還用於依據該提取的每個音高曲線得出一個擬合程度的最大值,然後根據每個最大值計算出一個色情點數,並將該計算出的複數色情點數進行累加,再根據該累加後得出的累加值以算出該色情指數。
  9. 一種電子裝置偵測色情音訊的方法,包括以下步驟:預存儲複數樣本色情音訊曲線;讀取音訊內容,並對該讀取音訊內容進行複製,然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊,並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈,同時分析該低頻能量分佈的音量分佈,將該音量分佈小於預設音量門檻值的部分去除,再將聲音持續時間不在預設時間範圍內的音訊內容去除,然後提取去除後的複數音訊片段;根據該等去除後的音訊片段計算出該音訊內容的複數音高曲線;將該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度;及 根據該擬合程度判斷該音訊內容是否為色情音訊。
  10. 如申請專利範圍第9項所述之電子裝置偵測色情音訊的方法,其中,還包括去除該等音高曲線在女性音高頻率範圍以外的點。
  11. 如申請專利範圍第9項所述之電子裝置偵測色情音訊的方法,其中,通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上,獲得完整的音高曲線,再計算該擬合程度。
  12. 如申請專利範圍第9項所述之電子裝置偵測色情音訊的方法,其中,該根據該擬合程度判斷音訊內容是否為色情音訊的步驟包括以下步驟:從該等音高曲線中讀取一個音高曲線;將該讀取的音高曲線與所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度;提取該一個音高曲線的多組擬合程度中的最大值;依據該最大值判斷與該最大值對應的音高曲線是否為色情曲線;判斷該複數音高曲線中是否還有未讀取的音高曲線;若有未讀取的音高曲線,則繼續讀取下一個進行比對;及若沒有未讀取的音高曲線,則根據色情曲線的判斷結果判斷該音訊內容是否為色情音訊。
  13. 如申請專利範圍第12項所述之電子裝置偵測色情音訊的方法,其中,根據色情曲線的判斷結果判斷該音訊內容是否為色情音訊的步驟包括:依據該每個音高曲線的多組擬合程度的最大值計算出色情指數;及將該色情指數與預設指數門限值比對以判讀該音訊內容是否為色情音訊。
  14. 如申請專利範圍第13項所述之電子裝置偵測色情音訊的方法,其中,還包括:若該色情指數超出該預設指數門限值,則自動切斷音訊或視訊訊號的輸出。
  15. 如申請專利範圍第13項所述之電子裝置偵測色情音訊的方法,其中,計算該色情指數的步驟包括:依據該提取的每個音高曲線得出一個擬合程度的最大值;根據每個最大值計算出一個色情點數;及將該計算出的複數色情點數進行累加,根據該累加後得出的累加值算出該色情指數。
TW101118461A 2012-05-11 2012-05-24 電子裝置及其偵測色情音訊的方法 TWI479477B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101462808A CN103390409A (zh) 2012-05-11 2012-05-11 电子装置及其侦测色情音频的方法

Publications (2)

Publication Number Publication Date
TW201346888A TW201346888A (zh) 2013-11-16
TWI479477B true TWI479477B (zh) 2015-04-01

Family

ID=49534655

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101118461A TWI479477B (zh) 2012-05-11 2012-05-24 電子裝置及其偵測色情音訊的方法

Country Status (3)

Country Link
US (1) US20130304470A1 (zh)
CN (1) CN103390409A (zh)
TW (1) TWI479477B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN110853648B (zh) * 2019-10-30 2022-05-03 广州多益网络股份有限公司 一种不良语音检测方法、装置、电子设备及存储介质
CN112423077A (zh) * 2020-10-15 2021-02-26 深圳Tcl新技术有限公司 视频播放方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675384B1 (en) * 1995-12-21 2004-01-06 Robert S. Block Method and apparatus for information labeling and control
CN101470897A (zh) * 2007-12-26 2009-07-01 中国科学院自动化研究所 基于音视频融合策略的敏感影片检测方法
CN101819638A (zh) * 2010-04-12 2010-09-01 中国科学院计算技术研究所 色情检测模型建立方法和色情检测方法
TW201127662A (en) * 2010-02-12 2011-08-16 Macauto Ind Co Ltd Sunshade curtain device
TWI360802B (en) * 2006-08-30 2012-03-21 Realtek Semiconductor Corp Method and appartaus for indicating status of disp

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0245252A1 (en) * 1985-11-08 1987-11-19 MARLEY, John System and method for sound recognition with feature selection synchronized to voice pitch
DE60038535T2 (de) * 1999-08-26 2009-07-02 Sony Corp. Verfahren und vorrichtung, speicherverfahren und - vorrichtung zur informationsbeschaffung und verarbeitung
CN100514446C (zh) * 2004-09-16 2009-07-15 北京中科信利技术有限公司 一种基于语音识别及语音分析的发音评估方法
US8738370B2 (en) * 2005-06-09 2014-05-27 Agi Inc. Speech analyzer detecting pitch frequency, speech analyzing method, and speech analyzing program
US8068719B2 (en) * 2006-04-21 2011-11-29 Cyberlink Corp. Systems and methods for detecting exciting scenes in sports video
US7521622B1 (en) * 2007-02-16 2009-04-21 Hewlett-Packard Development Company, L.P. Noise-resistant detection of harmonic segments of audio signals
US8208643B2 (en) * 2007-06-29 2012-06-26 Tong Zhang Generating music thumbnails and identifying related song structure
TWI389100B (zh) * 2008-11-19 2013-03-11 Inst Information Industry 語音情緒的分類方法及其情緒語意模型的建立方法
CN101751923B (zh) * 2008-12-03 2012-04-18 财团法人资讯工业策进会 语音情绪的分类方法及其情绪语意模型的建立方法
CN102073780B (zh) * 2009-11-23 2012-09-19 财团法人资讯工业策进会 信息仿真处理系统、装置及方法
US20110153328A1 (en) * 2009-12-21 2011-06-23 Electronics And Telecommunications Research Institute Obscene content analysis apparatus and method based on audio data analysis
CN101789990A (zh) * 2009-12-23 2010-07-28 宇龙计算机通信科技(深圳)有限公司 一种在通话过程中判断对方情绪的方法及移动终端
US8595005B2 (en) * 2010-05-31 2013-11-26 Simple Emotion, Inc. System and method for recognizing emotional state from a speech signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675384B1 (en) * 1995-12-21 2004-01-06 Robert S. Block Method and apparatus for information labeling and control
TWI360802B (en) * 2006-08-30 2012-03-21 Realtek Semiconductor Corp Method and appartaus for indicating status of disp
CN101470897A (zh) * 2007-12-26 2009-07-01 中国科学院自动化研究所 基于音视频融合策略的敏感影片检测方法
TW201127662A (en) * 2010-02-12 2011-08-16 Macauto Ind Co Ltd Sunshade curtain device
CN101819638A (zh) * 2010-04-12 2010-09-01 中国科学院计算技术研究所 色情检测模型建立方法和色情检测方法

Also Published As

Publication number Publication date
CN103390409A (zh) 2013-11-13
US20130304470A1 (en) 2013-11-14
TW201346888A (zh) 2013-11-16

Similar Documents

Publication Publication Date Title
CN108563655B (zh) 基于文本的事件识别方法和装置
WO2016180100A1 (zh) 一种音频处理的性能提升方法及装置
JP6147873B2 (ja) キーボードのタイピング検出と抑制
TWI479477B (zh) 電子裝置及其偵測色情音訊的方法
CN109672936B (zh) 一种视频评估集的确定方法、装置及电子设备
CN110111811B (zh) 音频信号检测方法、装置和存储介质
CN107358964B (zh) 用于检测在变化的环境中的警戒信号的方法
TW202127376A (zh) 基於圖像的指紋品質評估方法、裝置及電子設備
CN112116927A (zh) 实时检测音频信号中的语音活动
WO2019161768A1 (zh) 异常流量检测
WO2017036175A1 (zh) 一种语音处理的方法及终端
EP2328142A1 (en) Method for detecting audio ticks in a noisy environment
US8737696B2 (en) Human face recognition method and apparatus
CN110556128B (zh) 一种语音活动性检测方法、设备及计算机可读存储介质
CN107889031B (zh) 一种音频控制方法、音频控制装置及电子设备
CN112735481B (zh) Pop音检测方法、装置、终端设备及存储介质
EP3309777A1 (en) Device and method for audio frame processing
CN109857973B (zh) 红外数据滤波方法及装置
JP6341078B2 (ja) サーバ装置、プログラム及び情報処理方法
CN110554791A (zh) 触控面板信号检测方法及装置
US9269370B2 (en) Adaptive speech filter for attenuation of ambient noise
TW201501521A (zh) 基於場景偵測的即時影像記錄系統及方法
CN113779583B (zh) 一种行为检测方法、装置、存储介质及电子设备
JP6675806B2 (ja) 違法コンテンツ検知装置、違法コンテンツ検知方法およびプログラム
CN111611417B (zh) 图像去重方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees