TWI474315B

TWI474315B - Infant cries analysis method and system

Info

Publication number: TWI474315B
Application number: TW101118767A
Authority: TW
Original assignee: Univ Nat Taiwan Normal
Priority date: 2012-05-25
Filing date: 2012-05-25
Publication date: 2015-02-21
Also published as: US20130317815A1; TW201349224A; US9009038B2; CN103426438B; CN103426438A

Description

嬰兒哭聲分析方法及系統

本發明是有關於一種語音分析方法，特別是指一種兼具快速分析及精確辨識的嬰兒哭聲分析方法。

已知US5668780專利的「Baby cry recognizer」使用零交點(zero crossing)方法分類，藉由脈衝訊號來取樣聲音，由取樣出的強弱訊號之間的關係，和零點相比得到的交錯次數，即所謂的哭聲週期頻率，來判斷哭聲是否正常，是較簡便的方法，但僅能辨識出的嬰兒哭聲的週期頻率，無法進一步提供父母其他相關的資訊，例如嬰兒哭聲的原因為何。

另有US6496115專利的「System and method for analyzing baby cries」使用頻譜分析法分類，利用透過傅立葉轉換將聲音做頻率的組成訊號分析，在頻譜上去找出每個頻率的大小組成，對照在不同哭聲原因下可能的頻率分佈，此方法雖然較為精確的判斷出哭聲的可能原因，但此系統無法提供適用於不同嬰兒，亦無法由使用者對於系統進行修正其類別。

本發明之目的，即在提供一種兼具快速分析及精確辨識的嬰兒哭聲分析方法及系統。

於是，本發明的嬰兒哭聲分析方法是對於嬰兒哭聲的一數位音頻信號進行辨識，該方法包含下列步驟：將該數位音頻信號以頻譜轉換法產生一頻譜資料；依據該頻譜資料的頻率範圍分類為一正常模式或一異常模式；若為正常模式，提供一預先建立的時頻特徵-需求類別的對照表，藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別；若為「異常模式」，提供一訓練完成的時頻特徵-特殊需求類別的類神經分類器，並輸入該數位音頻信號的頻率特徵至該類神經分類器以輸出其對應的特殊需求類別。

較佳的，本發明的嬰兒哭聲分析方法還包括下述步驟：提供初步辨識出的需求類別，若嬰兒仍持續哭泣一段時間，對於對應的時頻特徵-特殊需求類別的相關參數進行修正，並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。

較佳的，本發明的嬰兒哭聲分析方法中，相關參數的調整設定是在該關聯資料庫排除或新增特殊需求類別，再重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。

本發明的嬰兒哭聲分析系統包含一頻譜分析單元、一初始分類器、一判別單元，及一類神經分類器。

該頻譜分析單元將該數位音頻信號以頻譜轉換法產生一頻譜資料；該初始分類器依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」；該判別單元配合一基本分類資料庫，該基本分類資料庫建立有一時頻特徵-需求類別的對照表，若該初始分類器分類為該「正常模式」時，藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別；該類神經分類器配合一時頻特徵資料庫及一關聯資料庫，且具有一訓練完成的時頻特徵-特殊需求類別的類神經分類程式，若該初始分類器分類為該「異常模式」時，輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。

較佳的，本發明的嬰兒哭聲分析系統還包括一輸入單元及一修正單元，該輸入單元用以輸入控制指令；該修正單元用以於提供初步辨識出的需求類別後，若嬰兒仍持續哭泣一段時間，依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的相關參數進行修正，並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。

較佳的，該輸入單元是在該關聯資料庫排除或新增特殊需求類別，該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。

本發明的嬰兒哭聲分析方法之功效在於：利用初始分類區分出「正常模式」或「異常模式」，並依據「正常模式」的哭聲以基本需求分類，且依據「異常模式」的哭聲搭配類神經辨識，由於一般哭聲多數於「正常模式」而可快速辨識出來，異常哭聲較少發生，但是需要較精確的檢測，因此兼具快速分析及精確辨識的優點。

有關本發明之前述及其他技術內容、特點與功效，在以下配合參考圖式之較佳實施例的詳細說明中，將可清楚的呈現。

參閱圖1，本發明之較佳實施例是應用於一具有錄音功能的電子裝置100，電子裝置100包括一麥克風11、一類比數位轉換器12、一記錄單元13、一嬰兒哭聲分析系統1及一輸出單元4，各元件功能分別介紹如下。

麥克風11是接收嬰兒哭泣聲的類比信號；類比數位轉換器12是將類比信號數位化成數位音頻信號資料；記錄單元13是儲存經過類比數位轉換器12轉換後的數位音頻信號資料；嬰兒哭聲分析系統1可利用數位音頻信號資料辨識出不同的需求類別；輸出單元4是一發光裝置、一影像播放器或一語音播放器，可將嬰兒哭聲分析系統1辨識出的需求類別以不同顏色的燈光、不同需求的警示影像，或不同語音提示的警示聲音的方式輸出，藉此達到提醒的效果。

嬰兒哭聲分析系統1包含一頻譜分析單元14、一初始分類器15、一判別單元16、一基本分類資料庫161、一特徵擷取單元21、一時頻特徵資料庫22、一類神經分類器23及一關聯資料庫24；較佳的，嬰兒哭聲分析系統1還包括一輸入單元31及一修正單元32，藉此補強嬰兒哭聲分析系統1的辨識功能。各元件功能如下。

頻譜分析單元14是將類比數位轉換器12轉換後的數位音頻信號以頻譜轉換法產生一頻譜資料，頻譜轉換法可以是快速傅立葉轉換，藉此得到數位音頻信號的頻率分佈範圍。

初始分類器15依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」，本實施例是以高頻或低頻進行區別，例如：未超出10kHz為「正常模式」，超出10kHz為「異常模式」，辨別「正常模式」的哭聲可以馬上滿足寶寶的需求，讓新手父母不會手忙腳亂；判斷「異常模式」的哭聲可以在寶寶有輕微生病並且感覺到不適時及早發現及早治療，避免寶寶有嚴重病症的危險，因為若非正常哭聲，顯示嬰兒可能潛在的身體健康問題，或是更深的心理因素需要進一步探討。因此，若初始分類器15分類為「正常模式」則觸發判別單元16動作，若初始分類器15分類為「異常模式」則觸發類神經分類器23動作。

茲將判別單元16及類神經分類器23的主要動作原理分別說明如下。

判別單元16配合一基本分類資料庫161運作，該基本分類資料庫161建立有一時頻特徵(time-frequency characteristics)-需求類別的對照表，本實施例使用的”時頻特徵”是代表各類別信號經過時頻分析(Time-frequency analysis)後，在時頻平面(time-frequency plane)的各種圖形。

於該「正常模式」時，判別單元16可藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別。

在本實施例是歸類一般小嬰兒的基本需求大致都有下面五大類共同的哭聲類別。

一、飢餓-類似ㄋㄚ、ㄋㄚ、ㄋㄚ的聲音。

二、想睡覺(累了)-類似ㄛ、ㄛ、ㄛ的聲音。

三、不舒服(泛指姿勢不舒服、尿布濕等等原因)-類似ㄏㄟ、ㄏㄟ、ㄏㄟ的聲音。

四、肚子脹氣了-類似ㄟ一、ㄟ一、ㄟ一的聲音。

五、想打嗝了-類似ㄟ、ㄟ、ㄟ的聲音。

因此，判別單元16可將前述基本需求類別以例如赫伯特-黃變換法(Hilbert-Huang Transformation，簡稱HHT)，運算技術可參考美國第6,862,558號專利，其轉換出的特徵影像的優點是包括訊號之頻率、時間、以及能量分佈之情形，特徵影像的x軸代表時間，y軸代表頻率，以不同顏色及深淺代表能量大小(例如：越紅代表能量越強)，然後，再利用基本分類資料庫161內建的對照表內建的時頻特徵的影像模板加以比對出對應的基本需求類別。

類神經分類器23具有一訓練完成的時頻特徵-特殊需求類別的關聯程式(圖未示)，且配合時頻特徵資料庫22已記錄的時頻特徵及關聯資料庫24運作，關聯程式的核心技術採用的是人工類神經網路(Artificial neural network)進行聲音辨識。

人工類神經網路，顧名思義即為模仿人類腦部神經元連結方式之決策系統；人類平時會將學習到的資訊儲存於腦部神經元當中，而在進行思考決策時便會自動將各神經元進行連結，藉由儲存其中之資料進行判斷。

人工類神經網路系統共分三個部分，分別是神經元、層、網路。神經元是此網路的基本組成單位，負責將收到的訊號進行加權處理後送到下一個神經元節點。層級是由數量不等之神經元組成的集合，按照功能性分為輸入層、隱藏層、輸出層等。而網路即為各層之間的組合，類神經網路中各神經元的加權值可視為儲存的資訊。其學習方法即為利用已知輸入與輸出值進行神經元加權值之調整，因此人工類神經網路需要已知的輸入與輸出樣本關係進行訓練。

本實施例在訓練階段是由三百組已知的嬰兒哭聲當作訓練樣本，且已由專業保母判斷得知對應的特殊需求類別，並將各時頻特徵與對應的各需求類別之關聯組成關聯資料庫24，由此關聯資料庫24對人工類神經網路系統進行訓練，以倒傳遞演算法(Back Propagation)進行各神經元加權值之調整。

完成前述訓練的時頻特徵-特殊需求類別的關聯程式後就可應用在實際狀況；於初始分類器15判別出「異常模式」後，觸發類神經分類器23數位音頻信號，利用時頻特徵資料庫22已記錄的異常哭聲的時頻特徵輸入至類神經分類器23內建的關聯程式就可自動辨識出特殊需求類別。

此外，嬰兒哭聲分析系統1還包括回饋修正機制，當使用者利用此系統辨認寶寶的需求之後，滿足需求完畢要觀察寶寶的哭聲是否就此停止，若無停止跡象，便需要剔除先前的需求重新進行類神經網路的計算，重複此步驟直到哭聲停止為止，並且，進行特殊需求類別的神經元權重值之更新，因此本系統可隨著使用者的不同與使用時間的長短而有個人化的趨勢，因此，可比傳統辨識系統較能適應不同嬰兒間哭聲的微妙變化。

本實施例中，使用者可利用輸入單元31輸入一控制指令至修正單元32，修正單元32依據輸入單元31輸入之控制指令對於未辨識出的嬰兒哭聲的時頻特徵-特殊需求類別的相關參數進行修正，並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。例如：輸入剔除先前的特殊需求類別的控制指令，使得類神經分類器23重新輸入數位音頻信號的時頻特徵，然後以重新訓練的類神經網路辨識出其對應的特殊需求類別。

參閱圖2，並配合圖1，本發明的嬰兒哭聲分析方法之較佳實施例中，輸入嬰兒哭聲(步驟201)至麥克風11；然後，類比數位轉換器12將嬰兒哭聲類比數位轉換為一數位音頻信號(步驟202)，並儲存於記錄單元13，同時，特徵擷取單元21會轉換出時頻特徵，並將時頻特徵儲存於時頻特徵資料庫22備用；接著，頻譜分析單元14將該數位音頻信號轉換出一頻譜資料(步驟203)；初始分類器15再依據該頻譜資料的頻率範圍的低高分類(步驟204)，主要是區分出「正常模式」及「異常模式」。

若為「正常模式」，令判別單元16藉由對照表關聯出該時頻特徵對應的基本需求類別(步驟205)，其對照表即存於基本分類資料庫161中，然後，輸出單元4輸出基本需求類別(步驟206)；若為「異常模式」，則由時頻特徵資料庫22輸入時頻特徵至類神經分類器23(步驟207)；類神經分類器23辨識後，即由輸出單元4輸出辨識出的特殊需求類別(步驟208)。

接著，使用者觀察或依系統設定判斷嬰兒仍持續哭泣一段時間(步驟209)？若是，則代表初步辨識出來的是不合適的類別，就需要利用輸入單元31輸入控制指令予修正單元32，修正單元32再對於類神經分類器23的時頻特徵-特殊需求類別的相關參數進行修正(步驟210)，本實施例中是對於關聯資料庫24的初步辨識出來的類別剔除後再重新辨識，直到嬰兒停止哭泣為止，或者，也可依據使用者的判斷(如：嬰兒發燒給予退燒後停止哭泣)而新增類別(如：發燒)至關聯資料庫24。

綜上所述，本發明的嬰兒哭聲分析方法及系統之功效在於：利用初始分類區分出「正常模式」或「異常模式」，並依據「正常模式」的哭聲以基本需求分類，且依據「異常模式」的哭聲搭配類神經辨識，由於一般哭聲多數於「正常模式」而可快速辨識出來，異常哭聲較少發生，但是需要較精確的檢測，因此兼具快速分析及精確辨識的優點，故確實能達成本發明之目的。

惟以上所述者，僅為本發明之較佳實施例而已，當不能以此限定本發明實施之範圍，即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾，皆仍屬本發明專利涵蓋之範圍內。

100‧‧‧電子裝置

1‧‧‧嬰兒哭聲分析系統

11‧‧‧麥克風

12‧‧‧類比數位轉換器

13‧‧‧記錄單元

14‧‧‧頻譜分析單元

15‧‧‧初始分類器

16‧‧‧判別單元

161‧‧‧基本分類資料庫

21‧‧‧特徵擷取單元

22‧‧‧時頻特徵資料庫

23‧‧‧類神經分類器

24‧‧‧關聯資料庫

31‧‧‧輸入單元

32‧‧‧修正單元

4‧‧‧輸出單元

201-210‧‧‧步驟

圖1是一系統方塊圖，說明本發明的嬰兒哭聲分析系統之較佳實施例；及圖2是一流程圖，說明本發明的嬰兒哭聲分析方法之較佳實施例。

201-210‧‧‧步驟

Claims

一種嬰兒哭聲分析方法，用以對於嬰兒哭聲的一數位音頻信號進行辨識，該方法包含下列步驟：(a)將該數位音頻信號以頻譜轉換法產生一頻譜資料；(b)依據該頻譜資料的頻率範圍分類為一屬於小嬰兒的基本需求哭聲頻率範圍的正常模式或一非屬於小嬰兒的基本需求哭聲頻率範圍的異常模式；(c)若為正常模式，提供一預先建立的時頻特徵-需求類別的對照表，藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別；及(d)若為異常模式，提供一經由倒傳遞演算法訓練完成的時頻特徵-特殊需求類別的類神經分類程式，該倒傳遞演算法是設定數個特殊需求類別，訓練時根據多組已知特殊需求類別的嬰兒哭聲及加權權重值運算的輸出結果之間的差異調整權重，藉此建立時頻特徵-特殊需求類別的類神經分類程式，並輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。
依據申請專利範圍第1項所述之嬰兒哭聲分析方法，還包括下述步驟：(e)提供初步辨識出的需求類別，若嬰兒仍持續哭泣一段時間，對於對應的時頻特徵-特殊需求類別的權重值進行修正，並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
依據申請專利範圍第2項所述之嬰兒哭聲分析方法，其中，步驟(e)的相關參數的調整設定是排除或新增特殊需求類別之權重關聯，再重新輸入該數位音頻信號的頻率特徵與時頻特徵至該類神經分類程式進行特殊需求類別的神經元權重值之更新以輸出其對應的特殊需求類別。
一種嬰兒哭聲分析系統，包含：一頻譜分析單元，將該數位音頻信號以頻譜轉換法產生一頻譜資料；一初始分類器，依據該頻譜資料的頻率範圍分類為一屬於小嬰兒的基本需求哭聲頻率範圍的正常模式或一非屬於小嬰兒的基本需求哭聲頻率範圍的異常模式；一判別單元，配合一基本分類資料庫，該基本分類資料庫建立有一時頻特徵-需求類別的對照表，若該初始分類器分類為該正常模式時，藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別；及一類神經分類器，具有一經由倒傳遞演算法訓練完成的時頻特徵-特殊需求類別的類神經分類程式，該倒傳遞演算法是設定數個特殊需求類別，訓練時根據多組已知特殊需求類別的嬰兒哭聲及加權權重值運算的輸出結果之間的差異調整權重，藉此建立時頻特徵-特殊需求類別的類神經分類程式，若該初始分類器分類為該異常模式時，輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。
依據申請專利範圍第4項所述之嬰兒哭聲分析系統，還包括一輸入單元及一修正單元，該輸入單元輸入一控制指令；該修正單元於提供初步辨識出的需求類別後，若嬰兒仍持續哭泣一段時間，依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的神經元權重值進行修正，並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
依據申請專利範圍第5項所述之嬰兒哭聲分析系統，其中，該輸入單元是排除或新增特殊需求類別之權重關聯，該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類程式進行特殊需求類別的神經元權重值之更新以輸出其對應的特殊需求類別。