TWI479477B

TWI479477B - 電子裝置及其偵測色情音訊的方法

Info

Publication number: TWI479477B
Application number: TW101118461A
Authority: TW
Inventors: Chun Te Wu
Original assignee: Hon Hai Prec Ind Co Ltd
Priority date: 2012-05-11
Filing date: 2012-05-24
Publication date: 2015-04-01
Also published as: CN103390409A; US20130304470A1; TW201346888A

Description

電子裝置及其偵測色情音訊的方法

本發明涉及音訊偵測領域，尤其涉及一種電子裝置及其偵測色情音訊的方法。

隨著通訊領域突飛猛進的發展，無論是生活、工作和學習都與網路密切相關，但是一些不健康的影音(如色情影音等)也會在網路上傳播且很容易獲取，這類不健康的影音不僅會誘發犯罪影響社會和諧發展，尤其給青少年的身心帶來了極大的傷害。然而目前偵測色情影音的技術都需要通過同時偵測圖像及音訊來判定是否為色情影音內容，所用的演算法都很複雜，且演算過程很耗時。因此需要一種演算法簡單且可快速有效的偵測色情影音內容的方法。

有鑑於此，有必要提供一種電子裝置，不需要複雜的演算法且可快速有效的偵測色情影音內容。

此外，還有必要提供上述電子裝置偵測色情音訊的方法，不需要複雜的演算法且可快速有效的偵測色情影音內容。

本發明實施方式中的電子裝置，用於偵測色情音訊內容，包括記憶體、讀取模組、計算模組、對比模組、判讀模組。記憶體用於存儲複數樣本色情音訊曲線。讀取模組用於讀取音訊內容。計算模組用於計算音訊內容的複數音高曲線。對比模組用於將該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度。判讀模組用於根據擬合程度判斷音訊內容是否為色情音訊。

優選地，讀取模組還用於對讀取音訊內容進行複製，然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊，並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。

優選地，讀取模組還用於分析低頻能量分佈的音量分佈，將音量分佈小於預設音量門檻值的部分去除，再將聲音持續時間不在預設時間範圍內的音訊內容去除，然後提取去除後的複數可疑音訊片段以供計算模組計算音高曲線。

優選地，計算模組還用於去除該等音高曲線在女性音高頻率範圍以外的點。

優選地，對比模組還用於先通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上，獲得完整的音高曲線，再計算該擬合程度。

優選地，對比模組還用於從該等音高曲線中讀取一個音高曲線，然後將讀取的音高曲線與記憶體中所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度，再提取一個音高曲線的多組擬合程度中的最大值，並依據最大值判斷與最大值對應的音高曲線是否為色情曲線。

優選地，對比模組還用於判斷該等音高曲線中是否還有未讀取的音高曲線，並在有未讀取的音高曲線時繼續讀取下一個進行比對，以及在沒有未讀取的音高曲線時根據色情曲線的判斷結果判斷音訊內容是否為色情音訊。

優選地，判讀模組還用於依據每個音高曲線的多組擬合程度的最大值計算出色情指數，並將色情指數與預設指數門限值比對以判讀該音訊內容是否為色情音訊。

優選地，判讀模組還用於在色情指數超出預設指數門限值時自動切斷音訊或視訊訊號的輸出。

優選地，判讀模組還用於依據提取的每個音高曲線得出一個擬合程度的最大值，然後根據每個最大值計算出一個色情點數，並將計算出的複數色情點數進行累加，再根據累加後得出的累加值以算出色情指數。

本發明實施方式中的電子裝置偵測色情音訊內容的方法，包括：首先預存儲複數樣本色情音訊曲線，然後從影音內容中讀取音訊內容，計算出音訊內容的複數音高曲線。將計算後得到的該等音高曲線與所存儲的該等樣本色情音訊曲線進行對比以得出該等音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度，並根據擬合程度判斷音訊內容是否為色情音訊。

優選地，讀取音訊內容的步驟包括以下步驟：對讀取音訊內容進行複製，然後將複製後的音訊內容通過低通濾波器以濾除高頻部分的音訊，並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。

優選地，讀取音訊內容的步驟還包括以下步驟：分析頻能量分佈的音量分佈，並將音量分佈小於預設音量門檻值的部分去除，再將聲音持續時間不在預設時間範圍內的音訊內容去除，然後提取去除後的複數可疑音訊片段以供計算複數音高曲線。

優選地，去除該等音高曲線在女性音高頻率範圍以外的點。

優選地，通過插點的方式將需要對比的音高曲線中缺少音高頻點位置補上，獲得完整的音高曲線，再計算該擬合程度。

優選地，根據擬合程度判斷音訊內容是否為色情音訊的步驟包括以下步驟：從該等音高曲線中讀取一個音高曲線，然後將讀取的音高曲線與所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度，再提取一個音高曲線的多組擬合程度中的最大值，依據最大值判斷與最大值對應的音高曲線是否為色情曲線，判斷該複數音高曲線中是否還有未讀取的音高曲線，若有未讀取的音高曲線，則繼續讀取下一個進行比對，若沒有未讀取的音高曲線，則根據色情曲線的判斷結果判斷音訊內容是否為色情音訊。

優選地，根據色情曲線的判斷結果判斷音訊內容是否為色情音訊的步驟包括：依據每個音高曲線的多組擬合程度的最大值計算出色情指數，將色情指數與預設指數門限值比對以判讀音訊內容是否為色情音訊。

優選地，若色情指數超出預設指數門限值，則自動切斷音訊或視訊訊號的輸出。

優選地，計算色情指數的步驟包括：依據提取的每個音高曲線得出一個擬合程度的最大值，根據每個最大值計算出一個色情點數，將計算出的複數色情點數進行累加，根據累加後得出的累加值算出色情指數。

以下結合附圖和具體實施例對本發明進行詳細描述，但不作為對本發明的限定。

100‧‧‧電子裝置

102‧‧‧記憶體

104‧‧‧讀取模組

106‧‧‧計算模組

108‧‧‧對比模組

110‧‧‧判讀模組

112‧‧‧低通濾波器

114‧‧‧處理器

圖1為本發明電子裝置一實施方式之功能模組圖。

圖2為本發明電子裝置偵測色情音訊的方法一實施方式的流程圖。

圖3為本發明實施方式中對讀取的音訊內容進一步進行處理的流程圖。

圖4所示為圖3對所讀取的音訊內容做進一步處理的示意圖。

圖5為本發明實施方式中計算音高曲線的示意圖。

圖6為本發明實施方式中對音高曲線保留女性音高範圍的示意圖。

圖7a及圖7b均為本發明實施方式中與樣本曲線的擬合程度很高的音高曲線的示例。

圖8為本發明實施方式中將音高頻率曲線做進一步處理以得到完整音高曲線的示意圖。

圖9為圖2中步驟S400一實施方式的詳細流程圖。

圖10為圖2中步驟S500一實施方式的詳細流程圖。

圖11為本發明實施方式中計算色情指數及判讀的示意圖。

請參閱圖1，所示為本發明電子裝置100的功能模組圖。在本實施方式中，電子裝置100可為手機、視訊播放機、平板電腦、音響、機上盒、互聯網等娛樂產品，也可為MSN^TM、SKYPE^TM、QQ^TM等軟體視訊產品。在本發明一實施方式中，電子裝置100儲存有複數樣本色情音訊曲線，當電子裝置100要播放音訊時先讀取音訊內容，再計算出音訊內容的複數音高曲線。然後，電子裝置100將所計算的音高(pitch)曲線與所存儲的該等樣本色情音訊曲線逐一進行對比，計算所計算的音高曲線與所存儲的該等樣本色情音訊曲線的擬合程度，並根據擬合程度判斷該音訊內容是否為色情音訊。

在本發明一具體實施例中，電子裝置100包括處理器114、記憶體102、讀取模組104、計算模組106、對比模組108及判讀模組110。記憶體102中存儲有複數樣本色情音訊曲線。在本實施方式中，記憶體102是用於存儲資料的硬體，如快閃記憶體、硬碟、緩衝器、記憶體等。處理器114執行讀取模組104、計算模組106、對比模組108及判讀模組110中的軟體代碼，以實現這些模組的功能。

讀取模組104讀取音訊內容，並存入記憶體102中。在本實施例中，記憶體102包括音訊緩衝器，用於存儲讀取模組104所讀取的原始音訊內容。在本實施例中，讀取模組104可以先從網上下載音訊內容或影音內容，也可從電子裝置100所存儲的音訊檔或影音檔，還可以在網站線上收聽音訊內容或觀看視訊，還可以收聽電臺廣播中讀取音訊內容。

作為本發明一實施方式的進一步改進，讀取模組104還可對音訊內容進行進一步的處理，以進一步簡化處理方法。比如，讀取模組104對讀取音訊內容進行複製，然後將複製後的音訊內容通過低通濾波器112以濾除高頻部分的音訊，並將濾除高頻部分的音訊內容取絕對值得到低頻能量分佈。讀取模組104分析低頻能量分佈的音量分佈，將音量分佈小於預設音量門檻值的部分去除，再將聲音持續時間不在預設時間範圍內的音訊內容去除，然後提取去除後的複數可疑音訊片段作為後續處理所採用的音訊內容。舉例而言，預設音量門檻值可為最大音量的10%，預設時間範圍可為0.4秒-1.2秒。

計算模組106根據讀取模組104所獲得的音訊內容進行計算以得出複數表示頻率分佈的音高曲線。在本實施方式中，計算模組106計算音高曲線的依據可以是讀取模組104直接讀取的音訊內容，也可以是經過進一步處理後得到的可疑音訊片段。然後計算模組106通過音高演算法以自相關方式計算出音訊內容的複數音高曲線。在發明的一具體實施方式中，計算模組106在計算音高曲線之後還可去除複數音高曲線在女性音高頻率範圍以外的點。對比模組108將該等音高曲線中的每一個音高曲線與所存儲的該等樣本色情音訊曲線逐一進行對比，得出每一個音高曲線與每一個樣本色情音訊曲線的擬合程度，並找出擬合程度的最大值。在本實施方式中，對比模組108可以將所讀取的音高曲線直接與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在其他實施方式中，對比模組108還可以將所讀取的音高曲線做進一步的處理以得到完整音高曲線，再將經過處理後得到的完整音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在本實施方式中，對比模組108還可以判斷複數音高曲線中是否還有未讀取的音高曲線，並在有未讀取的音高曲線時繼續讀取下一個進行比對，直至所有的音高曲線皆已對比完。

當所有的音高曲線皆已對比完，判讀模組110根據從對比模組108中得到最大值判斷音訊內容是否為色情音訊。在本實施方式中，當最大值大於預設的基準點(如：可為90%)時判定該音訊曲線為色情曲線，當最大值不大於該預設的基準點時判定該音訊曲線不是色情曲線。在本實施方式中，判讀模組110可以依據色情曲線的數量來確定是否為音訊內容。在其他實施方式中，判讀模組110還可以對最大值進行其它處理來確定是否為音訊內容。判讀模組110首先將最大值與預設的基準點進行比對，選出大於預設的基準點的最大值。然後根據每一個選出的最大值計算出一個色情點數。然後判讀模組110將所得出的每個色情點數進行函數運算(如：指數函數或線性函數)以判斷是否為色情內容。在本實施方式中，當色情點數進行函數運算的結果大於預設指數門限值(如100%)時，就判定為色情內容。判讀模組110如何進行函數運算以及如何判斷色情內容將在下文中詳述。

在本發明的一實施方式中，判讀模組110根據色情內容作出相應的動作，比如：切斷音訊或視訊訊號輸出，將音訊輸出強制靜音及視訊輸出為黑色畫面，或者關掉播放該視訊的軟體。在本發明的又一實施方式中，判讀模組110還可以依據相應的動作來設置解除靜音及黑色畫面的條件，當達到該條件時將視訊及音訊訊號恢復正常輸出，比如：在經過一定預設時間後將視訊及音訊訊號恢復正常輸出。

圖2為本發明電子裝置100偵測色情音訊的方法一實施方式的流程圖。本方法應用於圖1所示的電子裝置100中，且通過圖1所示的功能模組完成。

在步驟S100中，記憶體102中預存儲複數樣本色情音訊曲線。在本實施方式中，記憶體102中所存儲的樣本色情音訊曲線為樣本色情音高曲線。在步驟S200中，讀取模組104從輸入電子裝置100的音訊訊號中讀取一段音訊內容以判斷其是否為色情音訊。

在其它實施方式中，讀取模組104可對音訊內容進行進一步的處理，以進一步簡化處理方法。圖3所示為讀取模組104所讀取的音訊內容的進一步進行處理的流程圖。其中，以A表示經讀取模組104讀取的音訊內容的陣列，以B表示濾除高頻成份後的音訊內容的陣列。在步驟S2002中，A通過低通濾波器112濾除高頻部份得到B。在步驟S2004中，提取B的絕對值，得到低頻能量分佈Energy。在步驟S2006中，將Energy中的音量分佈與預設的音量門檻值比對，然後將大於預設的音量門檻值記為SlotA。在步驟S2008中，將SlotA中聲音持續時間在預定時間範圍外的區段去除，在本實施方式中，該預定時間範圍可設為0.4秒至1.2秒，即將聲音持續時間小於0.4秒及聲音持續時間大於1.2秒時間的區段去除。在步驟S2010中，依據SlotA去除的結果，將A中可疑音訊片段提取出來作為後續處理所使用的音訊內容。圖4所示為圖3對所讀取的音訊內容做進一步處理的示意圖，從圖4中可以看出，在後續計算音高曲線時，只需對圖4中得到的可疑音訊片段的波形進行計算，這樣可以簡化處理方法，以節省中央處理器(CPU，例如處理器114)的資源。

請回到圖2，在步驟S300中，計算模組106根據讀取模組104所獲得的音訊內容進行計算以得出複數表示頻率分佈的音高曲線。在本實施方式中，計算模組106計算音高曲線的依據可以是讀取模組104直接讀取的音訊內容，也可以是經過進一步處理後得到的可疑音訊片段。計算方法可以採用自相關公式(Autocorrelation Function，即ACF)的計算方法，也可以採用其他方法。由於以自相關公式計算音高曲線是公知技術，故在此不做詳述。如圖5所示為將得到的可疑音訊片段的波形通過計算得到的音高曲線的示意圖，從圖5中可看出每一個可疑音訊片段的波形會得到一個音高曲線。

在其它實施方式中，還可以在步驟S302中，計算模組106將計算出的表示頻率分佈的複數音高曲線在女性音高範圍(如200Hz-550Hz)之外的頻點去除。如圖6所示為將算出的該等音高曲線保留女性音高範圍的示意圖。去除男性音高範圍而只保留女性音高範圍，只將女性發出的帶有“啊”及“嗯”特性的呻吟聲的音高曲線進行比對，以節省中央處理器(central processing unit，CPU，例如處理器114)的資源。

請回到圖2，在步驟S400中，對比模組108從複數音高曲線中讀取一個音高曲線，然後將讀取的音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行比對得出多組擬合程度，再提取該一個音高曲線的多組擬合程度中的最大值，並依據最大值判斷與最大值對應的音高曲線是否為色情曲線。其中擬合程度是指兩個曲線的相似度，可以通過計算判定係數的方法計算出來，此計算方法為常見的技術，故在此不詳述。在本實施方式中，擬合程度越大表示兩個曲線的相似度越高。後續過程的擬合程度以R2表示，且完全擬合時R2=100%，圖7a與圖7b均為與樣本曲線的擬合程度很高的音高曲線的示例。

在本實施方式中，對比模組108可以將所讀取的音高曲線直接與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。在其他實施方式中，對比模組108還可以將所讀取的音高曲線做進一步的處理以得到完整音高曲線，再將經過處理後得到的完整音高曲線與記憶體102中所存儲的該等樣本色情音訊曲線逐一進行對比。圖8所示為將音高頻率曲線做進一步處理以得到完整音高曲線的示意圖。當讀取的音高曲線不完整時，比如有中斷點等情況，則依據所讀取的音高曲線的趨勢，將該音高曲線內缺少點數的位置以插點方式補上，以得到完整音高曲線。

圖9為步驟S400一實施方式的詳細流程圖。在本發明的一實施方式中，令所計算出的音高曲線為m個，且在記憶體102內所存儲的樣本色情曲線為i組。如圖9所示，在步驟S4002中，對比模組108讀取m個音高曲線中的一個，與記憶體102內i組樣本色情音訊曲線比對，在步驟S4004中，得出Rm2={R12,R22,R32,R42,…Ri2}(其中，m={1,2,3…m})。在步驟S4006中，對比模組108從Rm2中提取出最大值，並將最大值記為Max{Rm2}，Max{Rm2}=Max{R12,R22,R32,R42,…Ri2}。在步驟S4008中，對比模組108判斷m個音高曲線中是否還有未讀取的音高曲線。若有未讀取的音高曲線，返回到步驟S4002中，繼續讀取下一個音高曲線進行比對。若沒有未讀取的音高曲線，說明所有的音高曲線都已完成比對，在步驟S4010中，提取經比對後得到的最大值。

請回到圖2，在步驟S500中，判讀模組110根據最大值判斷音訊內容是否為色情音訊。在本實施方式中，當最大值大於預設的基準點時判定該音訊曲線為色情曲線，當最大值不大於該基準點時判定該音訊曲線不是色情曲線。比如，若預設R2=90%為基準點，則在R2值小於90%時判斷該音高曲線為非色情曲線，在R2值不小於90%時判斷該音高曲線為色情曲線。在本實施方式中，判讀模組110可以依據色情曲線的數量來確定是否為音訊內容。比如，偵測到一個色情曲線，即認為為音訊內容。在其他實施方式中，判讀模組110也可以對最大值進行其它處理來確定是否為音訊內容，比如圖10所示的方法。

如圖10所示，在步驟S5002，判讀模組110將最大值與基準點進行比對，選出大於基準點的最大值。在步驟S5004，判讀模組110根據每一個選出的最大值計算出一個色情點數。其中色情點數是指以基準點為起點，擬合程度的最大值每多1%，在色情點數上就增加10%所計算出來的數值，即為Aincre=(Rm2,max-90%)*10，其中Aincre為色情點數，通過Aincre=(Rm2,max-90%)*10可計算出m個Aincre。

在步驟S5006，判讀模組110將所得出的每個色情點數進行函數運算以判斷是否為色情內容。在本實施方式中，當色情點數進行函數運算的結果大於預設指數門限值(如100%)時，就判定為色情內容。其中，所採用的函數可以為隨時間下降的函數，比如線性方式Aindex=Aindex-Am×△t下降或指數方式Aindex=Aindex×e{-△At}下降。在本實施方式中，首先將得到的m個Aincre加到Aindex，再通過線性方式Aindex=Aindex-Am×△t或指數方式Aindex=Aindex×e{-△At}這兩種計算方式，其中，Aindex等於色情指數的累加器，介於0%-100%之間。

在步驟S5008，首先判讀模組110判斷Aindex是否小於0%，若Aindex小於0%，則在步驟S5010中，均將Aindex視為等於0，此時判定讀取模組104所讀取到的音訊內容為非色情音訊內容。當Aindex大於0%時，在步驟S5012中，然後判讀模組110判斷Aindex是否大於或等於100%，若Aindex大於或等於100%，則在步驟S5014中，均將Aindex視為100%。當Aindex超出了預設指數門限值100%，此時判定讀取模組104所讀取到的音訊內容為色情音訊內容。

為了避免色情內容所帶來的危害，在步驟S5016中，判讀模組110根據色情內容作出相應的動作，比如：切斷音訊或視訊訊號輸出，將音訊輸出強制靜音及視訊輸出為黑色畫面，或者關掉播放該視訊的軟體。在步驟S5018中，判讀模組110還可以設置解除靜音及黑色畫面的條件，當達到該條件時將視訊及音訊訊號恢復正常輸出，比如：在經過一定預設時間後將視訊及音訊訊號恢復正常輸出。

在本發明一實施方式中，圖11所示為計算色情指數及判讀的示意圖。由圖11中能夠明顯的看出每個音高曲線經由計算方式算出隨時間遞減的色情指數及將隨時間遞減後的結果累加的過程。其中，圖11中標有>100%的部分表示經累加後超出了預設指數門限值100%，在本實施方式中，此時系統會切斷音訊或視訊訊號輸出。

本發明的電子裝置100及其偵測色情音訊的方法，通過只針對影音內容中的音訊內容進行分析，並依據簡單的演算法，在節省CPU資源的同時可快速有效的偵測色情影音內容。

另外，本領域技術人員還可在本發明精神內做其他變化，當然，這些依據本發明精神所做之變化，都應包含在本發明所要求保護之範圍之內。