TWI597720B - 嬰兒哭聲偵測電路及相關的偵測方法 - Google Patents
嬰兒哭聲偵測電路及相關的偵測方法 Download PDFInfo
- Publication number
- TWI597720B TWI597720B TW106100121A TW106100121A TWI597720B TW I597720 B TWI597720 B TW I597720B TW 106100121 A TW106100121 A TW 106100121A TW 106100121 A TW106100121 A TW 106100121A TW I597720 B TWI597720 B TW I597720B
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- signal
- circuit
- generate
- segment
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims description 35
- 230000005236 sound signal Effects 0.000 claims description 86
- 206010011469 Crying Diseases 0.000 claims description 80
- 238000005070 sampling Methods 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Emergency Alarm Devices (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
本發明係有關於聲音偵測,尤指一種嬰兒哭聲偵測電路及相關的偵測方法。
目前的嬰兒監聽器通常是根據所接收到之聲音的強度大小來判斷是否有嬰兒哭聲出現,舉例來說,嬰兒監聽器可以判斷所接收之聲音訊號的強度是否大於一固定的臨界值,若是大於該臨界值則判斷該聲音訊號是嬰兒哭聲,並發出警示訊號給父母。然而,上述使用臨界值來判斷聲音訊號是否是嬰兒哭聲的方法有可能會受到環境音的影響,因而造成誤判。
因此,本發明的目的之一在於提供一種嬰兒哭聲偵測電路及相關的偵測方法,其可以參考嬰兒的哭聲特性來對所接收之聲音訊號進行分段來產生多個聲音片段,且對每一個聲音片段進行特徵值擷取以及比對,以準確地判斷所接收到的聲音訊號是否為嬰兒哭聲,以解決先前技術中的問題。
在本發明的一個實施例中,揭露了一種嬰兒哭聲偵測電路,其包含有一訊號擷取電路、一特徵擷取電路以及一判斷電路,其中該訊號擷取電路用以於一聲音訊號的強度大於一臨界值時,對該聲音訊號進行擷取以產生一聲音片段訊號,其中該聲音片段訊號對應之一聲音片段的時間長度介於一特定範圍之內;該特徵擷取電路耦接於該訊號擷取電路,且用以擷取出該聲音片段訊號的複數特徵值;以及該判斷電路耦接於該特徵擷取電路,且用以根據該些特徵值來判斷該聲音片段訊號所對應之該聲音片段是否為嬰兒哭聲。
在本發明的另一個實施例中,揭露了一種嬰兒哭聲偵測方法,其包含有:於一聲音訊號的強度大於一臨界值時,對該聲音訊號進行擷取以產生一聲音片段訊號,其中該聲音片段訊號對應之一聲音片段的時間長度介於一特定範圍之內;擷取出該聲音片段訊號的複數特徵值;以及根據該些特徵值來判斷該聲音片段訊號所對應之該聲音片段是否為嬰兒哭聲。
請參考第1圖,其為根據本發明一實施例之嬰兒哭聲偵測電路100的方塊圖。如第1圖所示,嬰兒哭聲偵測電路100包含了一預處理電路110、一訊號擷取電路120、一特徵擷取電路130、一特徵縮放電路140、一聲音片段訊號判斷電路150以及一聲音訊號判斷電路160。在本實施例中,嬰兒哭聲偵測電路100可以設置於任何用於偵測嬰兒哭聲的一電子裝置中,且該電子裝置係用來放置在嬰兒所處的環境中,當偵測到嬰兒哭聲時即透過無線傳輸發送一個警示訊號至另一個電子裝置,以通知父母或是照顧者。
在嬰兒哭聲偵測電路100中,預處理電路110用來對所接收之聲音訊號進行預處理。詳細來說,請參考第2圖,其繪示了本發明一實施例之預處理電路110的方塊圖,其包含了一取樣頻率轉換電路210、一雜訊消除電路220以及一增益電路230。由於不同的嬰兒哭聲偵測電路100所接收之聲音訊號可能為不同的頻率、或者包含多種不同的頻率,為了適應不同的嬰兒哭聲偵測電路100,因此取樣頻率轉換電路210會對所接收之聲音訊號進行取樣頻率的轉換,例如使用一個固定的取樣頻率(例如,8kHz)對聲音訊號進行取樣來產生一取樣頻率轉換後聲音訊號。在另一個實施例中,亦可以直接選用特定的嬰兒哭聲偵測電路100,此時預處理電路110可以不需要取樣頻率轉換電路210。雜訊消除電路220用來對該取樣頻率轉換後聲音訊號進行雜訊消除處理以產生雜訊消除後聲音訊號。增益電路230用來對該雜訊消除後聲音訊號進行增益調整處理,以產生一預處理後聲音訊號。實現上,雜訊消除電路220與增益電路230的順序可以互換。此外,若能容忍較差的處理效果,增益電路230可以被移除。
第1圖所示的預處理電路110係為一可移除(optional)的元件,亦即在本發明之另一個實施例中,預處理電路110可以自嬰兒哭聲偵測電路100中移除,而訊號擷取電路120直接接收該聲音訊號。
請繼續參考第1圖,訊號擷取電路120用來擷取該預處理後聲音訊號的其中一段訊號。詳細來說,擷取電路120偵測該預處理後聲音訊號的強度是否大於一臨界值,且當偵測到該預處理後聲音訊號的強度大於該臨界值時,對該預處理後聲音訊號進行擷取以取得該預處理後聲音訊號的其中一聲音片段訊號,該聲音片段訊號係對應一聲音片段,且該聲音片段的時間長度介於一特定範圍之內。在本實施例中,基於嬰兒哭聲的特性,該特定範圍介於0.5~3秒之間。詳細來說,請參考第3圖,當訊號擷取電路120偵測到該預處理後聲音訊號的強度大於該臨界值時,訊號擷取電路120開始對該預處理後聲音訊號進行擷取,直到該預處理後聲音訊號的強度低於該臨界值或是擷取時間已經到達該特定範圍的上限(例如,本實施例中的3秒),以產生一個聲音片段訊號。在本發明的另一個實施例中,若是該預處理後聲音訊號的強度長時間(例如,大於3秒)高於該臨界值,則訊號擷取電路120會在擷取出一個聲音片段訊號(對應時間長度為3秒的聲音片段)之後,立即緊接著再次開始擷取該預處理後聲音訊號以擷取出下一個聲音片段訊號。
特徵擷取電路130用來擷取每一個聲音片段訊號的多個特徵值。詳細來說,請參考第4圖,本發明一實施例之特徵擷取電路130包含了一預強調(Pre-emphasis)電路410、一音框化(framing)電路420、一窗(window)函數計算電路430、一傅立葉轉換電路440、一梅爾濾波器組450、一離散餘弦轉換電路460以及一分析電路470。在特徵擷取電路130的操作中,首先,預強調電路410對該聲音片段訊號進行高通濾波操作,以產生一預強調訊號,其中預強調電路410的操作可以使用以下公式來作為範例說明:x’[n]=x[n]-0.97x[n-1],其中x[n]為預強調電路410的輸入,而x’[n]為預強調電路410的輸出。由於聲音訊號從發生體(例如嬰兒)發聲到收音設備(例如嬰兒哭聲偵測電路100)的接收過程中,其高頻部分會隨著頻率增加而產生能量衰減的現象,因此透過高通濾波操作能夠補償高頻部分的衰減,或者說,能更加突顯高頻的共振峰。音框化電路420從該預強調訊號取出多個音框,舉例來說,音框化電路420從該預強調訊號(對應一個聲音片段)取出多個時間長度為20~40毫秒(ms)的音框(每個音框對應多個取樣點),且為了避免相鄰兩音框的變化過大,因此令相鄰的音框彼此有部分重疊。接著,窗函數計算電路430將該多個音框分別乘以一個窗函數以分別產生多個窗函數化音框,其中窗函數計算電路430的操作可以使用以下公式來作為範例說明:y[n]=x’[n]*w[n],其中y[n]為窗函數計算電路430的輸出,w[n]為窗函數,而在一實施例中,窗函數
。詳細來說,音框化電路420的操作將訊號處理為每筆音框具有固定長度,因此容易處理,但由於音框內的訊號保留了原來之振幅值,而音框外的訊號則被設定為0,因此造成了不連續的問題,而透過窗函數計算電路430的操作可以有效消除前述不連續的問題,例如透過漢明窗(Hamming Window)函數,其能夠保留訊號中間的部份並壓抑訊號兩端的值,利用此特性再配合相鄰音框的重疊,即可使音框在邊界上不會有明顯的不連續現象。傅立葉轉換電路440用以對該多個窗函數化音框進行離散傅立葉轉換以產生多個傅立葉轉換後音框,其中傅立葉轉換電路440的操作可以使用以下公式來作為範例說明:
。接著,梅爾濾波器組450對該些傅立葉轉換後音框進行濾波,以產生多個濾波後音框,其中梅爾濾波器組450的操作可以使用以下公式來作為範例說明:
。詳細來說,梅爾濾波器組450係包含了M個三角帶通濾波器,且該些三角帶通濾波器在梅爾頻率上平均分佈以模擬人耳聽覺特性。將前述傅立葉轉換後之該多個窗函數化音框的能量頻譜分別透過M個三角帶通濾波器濾波後,即能求出分布於每個梅爾頻率上的的能量。離散餘弦轉換電路460對該多個濾波後音框進行離散餘弦轉換以產生對應於每一個音框的多個特徵參數(亦即,梅爾倒頻譜係數)。最後,分析電路470根據對應於每一個音框的該多個特徵參數來產生該擷取訊號的該多個特徵值。
第4圖所示的預強調電路410以及窗函數計算電路430係為可移除的元件,亦即在本發明之另一個實施例中,預強調電路410及/或窗函數計算電路430可以自特徵擷取電路130中移除。
請參考第5圖,其為特徵擷取電路130中之複數音框以及其所對應之複數特徵參數與複數特徵值的範例。參考第5圖,假設聲音片段訊號被取出了N個音框,而每一個音框具有12個特徵參數C1~C12,此時分析電路470會對每一個音框之相同編號的特徵參數分別進行統計計算,以得到對應於每一個特徵參數C1~C12的一中位數以及四分位差,亦即會得到12個中位數以及12個四分位差。此外,上述的12個中位數以及12個四分位差,加上12個四分位差的一方均根值,再加上該聲音片段訊號被取出之音框的數量(例如N),便可以作為26個特徵參數以作為特徵擷取電路130的輸出。
請繼續參考第1圖,特徵縮放電路140對同一個聲音片段訊號對應的特徵值(例如前述的26個特徵值)進行縮放操作以維持數值範圍的穩定,並產生縮放後特徵值。聲音片段訊號判斷電路150依據一支向機演算法(Support Vector Machines,SVM)針對同一個聲音片段訊號對應之縮放後特徵值(例如前述的26個縮放後特徵值)進行演算來判斷該聲音片段訊號對應之聲音片段是否為嬰兒哭聲。而在一實施例中,該支向機演算法為具有徑向基底函數(Radial Basis Function,RBF)核心的支向機演算法。詳細來說,在工廠端時工程師會先將訓練資料(training data)輸入到一支向機演算法學習模組中,以決定出位於一超平面(hyperplane)上的多個支援向量(support vector),以作為一支向機模型,其中該支向機模型係在二維平面中建立兩個具有最大邊界(margin)的集合;而在實際操作時,聲音片段訊號判斷電路150會判斷同一個聲音片段訊號對應之縮放後特徵值(例如前述的26個縮放後特徵值)屬於哪一個集合,並據以判斷出該聲音片段訊號對應之聲音片段是否為嬰兒哭聲。
此外,特徵縮放電路140本身係為可移除的元件,亦即在本發明之另一個實施例中,特徵縮放電路140可以自嬰兒哭聲偵測電路100中移除。
聲音訊號判斷電路160會根據一靈敏度設定,以根據至少一個聲音片段訊號判斷電路的判斷結果來決定該聲音訊號是否為嬰兒哭聲。舉例來說,當嬰兒哭聲偵測電路100被設定為具有高靈敏度時,只要有一個聲音片段訊號被判斷是嬰兒哭聲,則聲音訊號判斷電路160便會決定該聲音訊號為嬰兒哭聲,嬰兒哭聲偵測電路100據以發送警示訊號給父母或是照顧者;當嬰兒哭聲偵測電路100被設定為具有中等靈敏度時,連續的5個聲音片段訊號中有2個聲音片段訊號被判斷是嬰兒哭聲,聲音訊號判斷電路160便會決定該聲音訊號為嬰兒哭聲;而當嬰兒哭聲偵測電路100被設定為具有低靈敏度時,連續的5個聲音片段中至少要有3個聲音片段訊號被判斷是嬰兒哭聲,聲音訊號判斷電路150才會決定該聲音訊號為嬰兒哭聲。
第1圖中設置聲音片段訊號判斷電路150以及聲音訊號判斷電路160這兩個判斷電路的原因是考量到靈敏度的問題,因此在一實施例中,聲音片段訊號判斷電路150本身即可用來決定該聲音訊號為嬰兒哭聲,而聲音訊號判斷電路160可以自嬰兒哭聲偵測電路100中移除。在另一個實施例中,聲音片段訊號判斷電路150以及聲音訊號判斷電路160可以在同一個電路模組中來實作。
請參考第6圖,其為根據本發明一實施例之嬰兒哭聲偵測方法的流程圖。同時參考第1~5圖之實施例的相關敘述,第6圖所示的流程如下所述。
步驟600:流程開始。
步驟602:偵測一聲音訊號的強度是否大於一臨界值,且當偵測到該聲音訊號的強度大於該臨界值時,對該聲音訊號進行擷取以產生至少一聲音片段訊號,其中該聲音片段訊號對應的聲音片段的時間長度介於一特定範圍之內。
步驟604:計算出該聲音片段訊號的多個特徵值。
步驟606:根據該多個特徵值來判斷該聲音片段訊號是否為嬰兒哭聲。
步驟608:根據該聲音片段訊號是否為嬰兒哭聲的判斷結果以決定該聲音訊號是否為嬰兒哭聲。
簡要歸納本發明,在本發明之嬰兒哭聲偵測電路及相關的方法中,係參考嬰兒的哭聲特性來對所接收之聲音訊號進行分段擷取來產生多個聲音片段訊號,其中每一個聲音片段訊號的時間長度具有一特定範圍,例如0.5~3秒,之後再對每一個聲音片段訊號進行特徵值擷取以及比對,以準確地判斷所接收到的聲音訊號是否為嬰兒哭聲。透過本發明,可以確實降低環境音的影響,提升嬰兒哭聲偵測與判斷的準確性。 以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
100‧‧‧嬰兒哭聲偵測電路
110‧‧‧預處理電路
120‧‧‧訊號擷取電路
130‧‧‧特徵擷取電路
140‧‧‧特徵縮放電路
150‧‧‧聲音片段訊號判斷電路
160‧‧‧聲音訊號判斷電路
210‧‧‧取樣頻率轉換電路
220‧‧‧雜訊消除電路
230‧‧‧增益電路
410‧‧‧預強調電路
420‧‧‧音框化電路
430‧‧‧窗函數計算電路
440‧‧‧傅立葉轉換電路
450‧‧‧梅爾濾波器組
460‧‧‧離散餘弦轉換電路
470‧‧‧分析電路
600~608‧‧‧步驟
110‧‧‧預處理電路
120‧‧‧訊號擷取電路
130‧‧‧特徵擷取電路
140‧‧‧特徵縮放電路
150‧‧‧聲音片段訊號判斷電路
160‧‧‧聲音訊號判斷電路
210‧‧‧取樣頻率轉換電路
220‧‧‧雜訊消除電路
230‧‧‧增益電路
410‧‧‧預強調電路
420‧‧‧音框化電路
430‧‧‧窗函數計算電路
440‧‧‧傅立葉轉換電路
450‧‧‧梅爾濾波器組
460‧‧‧離散餘弦轉換電路
470‧‧‧分析電路
600~608‧‧‧步驟
第1圖為本發明一實施例之嬰兒哭聲偵測電路的方塊圖。 第2圖為本發明一實施例之預處理電路的方塊圖。 第3圖為訊號擷取電路對聲音訊號進行分段擷取以產生聲音片段訊號的示意圖。 第4圖為本發明一實施例之特徵擷取電路的方塊圖。 第5圖為特徵擷取電路中之複數音框以及其所對應之複數特徵參數與複數特徵值的範例。 第6圖為根據本發明一實施例之嬰兒哭聲偵測方法的流程圖。
100‧‧‧嬰兒哭聲偵測電路
110‧‧‧預處理電路
120‧‧‧訊號擷取電路
130‧‧‧特徵擷取電路
140‧‧‧特徵縮放電路
150‧‧‧聲音片段訊號判斷電路
160‧‧‧聲音訊號判斷電路
Claims (24)
- 一種嬰兒哭聲偵測電路,包含: 一訊號擷取電路,用以於一聲音訊號的強度大於一臨界值時,對該聲音訊號進行擷取以產生一聲音片段訊號,其中該聲音片段訊號對應之一聲音片段的時間長度介於一特定範圍之內; 一特徵擷取電路,耦接於該訊號擷取電路,用以擷取該聲音片段訊號的複數特徵值;以及 一判斷電路,耦接於該特徵擷取電路,用以根據該些特徵值來判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中當該聲音訊號的強度大於該臨界值時,該訊號擷取電路開始對該聲音訊號進行擷取,直到該聲音訊號的強度低於該臨界值或是一擷取時間已經到達該特定範圍的上限,以產生該聲音片段訊號。
- 如申請專利範圍第2項所述之嬰兒哭聲偵測電路,其中若是該訊號擷取電路因為擷取時間已經到達該特定範圍的上限而產生該聲音片段訊號時,該訊號擷取電路自該擷取時間到達該特定範圍的上限的時間點開始對該聲音訊號進行擷取以產生下一個聲音片段訊號。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中該特定範圍為0.5秒至3秒之間。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,更包含: 一預處理電路,用以對該聲音訊號進行預處理以產生一預處理後聲音訊號至該訊號擷取電路,且該預處理電路包含: 一取樣頻率轉換電路,用以使用一個固定的取樣頻率來對該聲音訊號進行取樣來產生一取樣頻率轉換後聲音訊號; 一雜訊消除電路,耦接於該取樣頻率轉換電路,用以對該取樣頻率轉換後聲音訊號進行雜訊消除處理以產生一雜訊消除後聲音訊號;以及 一增益電路,耦接於該雜訊消除電路,用以對該雜訊消除後聲音訊號進行增益調整處理,以產生該預處理後聲音訊號。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中該特徵擷取電路包含: 一音框化電路,用以從該聲音片段訊號取出複數音框; 一傅立葉轉換電路,用以對該些音框進行傅立葉轉換以產生複數傅立葉轉換後音框; 一濾波器組,用以對該些傅立葉轉換後音框進行濾波以產生複數濾波後音框; 一離散餘弦轉換電路,用以對該些濾波後音框進行離散餘弦轉換以產生對應於每一個音框的複數特徵參數;以及 一分析電路,用以根據對應於每一個音框的該些特徵參數來產生該聲音片段訊號的該些特徵值。
- 如申請專利範圍第6項所述之嬰兒哭聲偵測電路,其中該特徵擷取電路更包含: 一窗函數計算電路,用以依據一窗函數處理該些音框以產生複數窗函數化音框,且該傅立葉轉換電路係對該些窗函數化音框進行傅立葉轉換以產生該些傅立葉轉換後音框。
- 如申請專利範圍第6項所述之嬰兒哭聲偵測電路,其中該特徵擷取電路更包含: 一預強調電路,用來對該聲音片段進行高通濾波操作,以產生一預強調訊號,且該音框化電路係從該預強調訊號取出該些音框。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中該特徵擷取電路包含: 一音框化電路,用以從該聲音片段訊號取出複數音框,其中該些特徵值係分別對應該些音框,且該判斷電路係根據該些特徵值的複數中位數、複數四分位差以及該些音框的數量判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中該判斷電路係使用一支向機演算法(Support Vector Machines,SVM)來根據該些特徵值以判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第10項所述之嬰兒哭聲偵測電路,其中該支向機演算法為具有徑向基底函數(Radial Basis Function,RBF)核心的支向機演算法。
- 如申請專利範圍第1項所述之嬰兒哭聲偵測電路,其中該訊號擷取電路更用以於該聲音訊號的強度大於該臨界值時,對該聲音訊號進行擷取以產生另一聲音片段訊號,該另一聲音片段訊號與該聲音片段訊號係對應不同之聲音片段,該判斷電路為一第一判斷電路,且該第一判斷電路更用以判斷該另一聲音片段訊號對應之聲音片段是否為嬰兒哭聲,以及該嬰兒哭聲偵測電路更包含有: 一第二判斷電路,耦接於該第一判斷電路,用以根據該些判斷結果決定該聲音訊號是否為嬰兒哭聲。
- 一種嬰兒哭聲偵測方法,包含: 於一聲音訊號的強度大於一臨界值時,對該聲音訊號進行擷取以產生一聲音片段訊號,其中該聲音片段訊號對應之一聲音片段的時間長度介於一特定範圍之內; 擷取出該聲音片段訊號的複數特徵值;以及 根據該些特徵值來判斷該聲音片段訊號所對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中對該聲音訊號進行擷取以產生該聲音片段訊號的步驟包含: 當該聲音訊號的強度大於該臨界值時,開始對該聲音訊號進行擷取,直到該聲音訊號的強度低於該臨界值或是一擷取時間已經到達該特定範圍的上限,以產生該聲音片段訊號。
- 如申請專利範圍第14項所述之嬰兒哭聲偵測方法,其中對該聲音訊號進行擷取以產生該聲音片段訊號的步驟更包含: 若是因為擷取時間已經到達該特定範圍的上限而產生該聲音片段訊號時,自該擷取時間到達該特定範圍的上限的時間點開始對該聲音訊號進行擷取以產生下一個聲音片段訊號。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中該特定範圍為0.5秒至3秒之間。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,更包含: 使用一個固定的取樣頻率來對該聲音訊號進行取樣來產生一取樣頻率轉換後聲音訊號; 對該取樣頻率轉換後聲音訊號進行雜訊消除處理以產生一雜訊消除後聲音訊號;以及 對該雜訊消除後聲音訊號進行增益調整處理,以產生該預處理後聲音訊號; 其中對該聲音訊號進行擷取以產生該聲音片段訊號的步驟係對該預處理後聲音訊號進行擷取以產生該聲音片段訊號。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中擷取該聲音片段訊號的該些特徵值的步驟包含: 從該聲音片段訊號取出複數音框; 對該些音框進行傅立葉轉換以產生複數傅立葉轉換後音框; 對該些傅立葉轉換後音框進行濾波,以產生複數濾波後音框; 對該些濾波後音框進行離散餘弦轉換以產生對應於每一個音框的複數特徵參數;以及 根據對應於每一個音框的該些特徵參數來產生該聲音片段訊號的該些特徵值。
- 如申請專利範圍第18項所述之嬰兒哭聲偵測方法,其中擷取該聲音片段訊號的該些特徵值的步驟更包含: 依據一窗函數處理該些音框以產生複數窗函數化音框; 其中對該些音框進行傅立葉轉換以產生複數傅立葉轉換後音框的步驟包含: 對該些窗函數化音框進行傅立葉轉換以產生該些傅立葉轉換後音框。
- 如申請專利範圍第18項所述之嬰兒哭聲偵測方法,其中擷取該聲音片段訊號的該些特徵值的步驟更包含: 對該聲音片段進行高通濾波操作,以產生一預強調訊號; 其中從該聲音片段訊號取出該些音框的步驟包含: 從該預強調訊號取出該些音框。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中擷取該聲音片段訊號的該些特徵值的步驟包含: 從該聲音片段訊號取出複數音框,其中該些特徵值係分別對應該些音框; 其中根據該些特徵值來判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲的步驟包含: 根據該些特徵值的複數中位數、複數四分位差以及該些音框的數量判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中根據該些特徵值來判斷該聲音片段是否為嬰兒哭聲的步驟包含: 使用一支向機演算法(Support Vector Machines,SVM)來根據該些特徵值以判斷該聲音片段訊號對應之該聲音片段是否為嬰兒哭聲。
- 如申請專利範圍第22項所述之嬰兒哭聲偵測方法,其中該支向機演算法為具有徑向基底函數(Radial Basis Function,RBF)核心的支向機演算法。
- 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,更包含: 於該聲音訊號的強度大於該臨界值時,對該聲音訊號進行擷取以產生另一聲音片段訊號,其中該另一聲音片段訊號與該聲音片段訊號係對應不同之聲音片段; 判斷該另一聲音片段訊號是否為嬰兒哭聲;以及 根據該聲音片段訊號以及該另一聲音片段訊號的嬰兒哭聲判斷結果決定該聲音訊號是否為嬰兒哭聲。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106100121A TWI597720B (zh) | 2017-01-04 | 2017-01-04 | 嬰兒哭聲偵測電路及相關的偵測方法 |
US15/610,756 US20180190298A1 (en) | 2017-01-04 | 2017-06-01 | Baby cry detection circuit and associated detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106100121A TWI597720B (zh) | 2017-01-04 | 2017-01-04 | 嬰兒哭聲偵測電路及相關的偵測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI597720B true TWI597720B (zh) | 2017-09-01 |
TW201826254A TW201826254A (zh) | 2018-07-16 |
Family
ID=60719477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106100121A TWI597720B (zh) | 2017-01-04 | 2017-01-04 | 嬰兒哭聲偵測電路及相關的偵測方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180190298A1 (zh) |
TW (1) | TWI597720B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI687920B (zh) * | 2019-05-10 | 2020-03-11 | 佑華微電子股份有限公司 | 嬰兒哭聲偵測方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11556787B2 (en) | 2020-05-27 | 2023-01-17 | International Business Machines Corporation | AI-assisted detection and prevention of unwanted noise |
CN117037849A (zh) * | 2021-02-26 | 2023-11-10 | 武汉星巡智能科技有限公司 | 基于特征提取与分类的婴幼儿哭声分类方法、装置及设备 |
CN117935843A (zh) * | 2024-03-22 | 2024-04-26 | 浙江芯劢微电子股份有限公司 | 一种低资源场景下的哭声检测方法、系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW256910B (en) * | 1993-09-16 | 1995-09-11 | Ind Tech Res Inst | Baby crying recognizer |
TWM346878U (en) * | 2008-07-14 | 2008-12-11 | Univ Tainan Technology | Wireless system for reminding baby status |
TW201442019A (zh) * | 2013-04-24 | 2014-11-01 | Univ Nat Yunlin Sci & Tech | 嬰兒哭鬧含意判讀模型的建立方法及使用方法 |
TWM508747U (zh) * | 2015-04-17 | 2015-09-11 | Univ Hwa Hsia Technology | 嬰兒安撫裝置 |
TWI503794B (zh) * | 2011-11-25 | 2015-10-11 | Ind Tech Res Inst | 嬰幼兒生理監視與安撫裝置 |
-
2017
- 2017-01-04 TW TW106100121A patent/TWI597720B/zh active
- 2017-06-01 US US15/610,756 patent/US20180190298A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW256910B (en) * | 1993-09-16 | 1995-09-11 | Ind Tech Res Inst | Baby crying recognizer |
TWM346878U (en) * | 2008-07-14 | 2008-12-11 | Univ Tainan Technology | Wireless system for reminding baby status |
TWI503794B (zh) * | 2011-11-25 | 2015-10-11 | Ind Tech Res Inst | 嬰幼兒生理監視與安撫裝置 |
TW201442019A (zh) * | 2013-04-24 | 2014-11-01 | Univ Nat Yunlin Sci & Tech | 嬰兒哭鬧含意判讀模型的建立方法及使用方法 |
TWM508747U (zh) * | 2015-04-17 | 2015-09-11 | Univ Hwa Hsia Technology | 嬰兒安撫裝置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI687920B (zh) * | 2019-05-10 | 2020-03-11 | 佑華微電子股份有限公司 | 嬰兒哭聲偵測方法 |
Also Published As
Publication number | Publication date |
---|---|
US20180190298A1 (en) | 2018-07-05 |
TW201826254A (zh) | 2018-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI597720B (zh) | 嬰兒哭聲偵測電路及相關的偵測方法 | |
CN103578468B (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
US9633654B2 (en) | Low power voice detection | |
US8949118B2 (en) | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise | |
CN106546892A (zh) | 基于深度学习的局部放电超声音频识别方法及系统 | |
CN107402131B (zh) | 一种基于轨边声学信号时频脊线的高速列车运动参数识别方法 | |
CN109991520A (zh) | 一种电缆振荡波局放检测系统用波速计算新方法 | |
CN112700399B (zh) | 缺陷检测视觉化方法及其系统 | |
CN116013276A (zh) | 一种基于轻量化ecapa-tdnn神经网络的室内环境音自动分类方法 | |
CN102988041A (zh) | 心磁信号噪声抑制中的信号选择性平均方法 | |
TWI684912B (zh) | 語音喚醒裝置及方法 | |
JP6337752B2 (ja) | 乳幼児泣き声検出装置 | |
JP2003334679A (ja) | レーザ溶接の診断装置 | |
CN107548007B (zh) | 一种音频信号采集设备的检测方法及装置 | |
CN114996489A (zh) | 新闻数据的违规检测方法、装置、设备及存储介质 | |
CN114882912A (zh) | 一种声信号时域瞬态缺陷的测试方法及装置 | |
Li et al. | Unsupervised Anomalous Sound Detection for Machine Condition Monitoring Using Temporal Modulation Features on Gammatone Auditory Filterbank. | |
CN108335704A (zh) | 婴儿哭声检测电路及相关的检测方法 | |
CN114494321A (zh) | 婴幼儿睡眠呼吸实时监测方法、装置、设备及存储介质 | |
CN203616430U (zh) | 具备自适应抗干扰功能的低成本局部放电在线监测装置 | |
CN210347836U (zh) | 一种电缆振荡波局放检测系统用波速计算装置 | |
CN113723521A (zh) | 一种电机异响识别方法和识别系统 | |
TWI520131B (zh) | Speech Recognition System Based on Joint Time - Frequency Domain and Its Method | |
CN110459197A (zh) | 用于微弱盲信号去噪与提取的信号增强器及方法 | |
TW202042217A (zh) | 嬰兒哭聲偵測方法 |