TWI687920B - 嬰兒哭聲偵測方法 - Google Patents

嬰兒哭聲偵測方法 Download PDF

Info

Publication number
TWI687920B
TWI687920B TW108116218A TW108116218A TWI687920B TW I687920 B TWI687920 B TW I687920B TW 108116218 A TW108116218 A TW 108116218A TW 108116218 A TW108116218 A TW 108116218A TW I687920 B TWI687920 B TW I687920B
Authority
TW
Taiwan
Prior art keywords
sound
crying
fundamental frequency
peak
frame
Prior art date
Application number
TW108116218A
Other languages
English (en)
Other versions
TW202042217A (zh
Inventor
林至善
Original Assignee
佑華微電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 佑華微電子股份有限公司 filed Critical 佑華微電子股份有限公司
Priority to TW108116218A priority Critical patent/TWI687920B/zh
Application granted granted Critical
Publication of TWI687920B publication Critical patent/TWI687920B/zh
Publication of TW202042217A publication Critical patent/TW202042217A/zh

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本揭露提供一種嬰兒哭聲偵測方法,包含下列步驟:萃取一待測聲音訊號的至少一特徵值組,更包括:將該待測聲音訊號進行音框化,以獲得至少一個音框化聲音訊號;計算每個音框化聲音訊號的訊號基頻以得到一音框基頻;將該音框化聲音訊號進行直流移除運算;計算直流移除音框化聲音訊號的訊號強度、以及訊號過零率,以分別得到一音框強度、以及一音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組;以及,根據該特徵值組判斷該待測聲音訊號是否包含一嬰兒哭聲,以得到一偵測結果,更包括:檢測該特徵值組的一音框屬性,再針對該音框屬性判斷該待測聲音訊號是否包含嬰兒哭聲,以得到該偵測結果。

Description

嬰兒哭聲偵測方法
本發明係有關一種嬰兒哭聲偵測方法。
由於智慧電子產品的日益普及,過去常見類似對講機功能的嬰兒監視器(baby monitor)已不敷使用,越來越多的功能,例如,嬰兒哭聲自動偵測功能,也受到許多父母的青睞。在目前已知嬰兒哭聲偵測方法中,常見的方式是透過將聲音裡的過零率當作特徵值,再搭配臨界值及特定判斷規則,來判斷所收到的聲音源中是否含有嬰兒的哭聲。然而,由於聲音裡的過零率受非嬰兒哭聲干擾的影響較大,容易影響判斷的準確性。另一類常見的方式則是透過將倒頻譜係數當作特徵值,再搭配機器學習或樣式辨認(pattern recognition)演算法進行判別;這類方式的缺點是需要收集大量已標註的樣本進行訓練,並且需要執行的運算量較高。
本發明之實施例揭露一種嬰兒哭聲偵測方法,包含下列步驟:萃取特徵值步驟,係將一待測聲音訊號依時序輸入以萃取該待測聲音訊號的至少一特徵值組;以及,特徵值判斷步驟,係將該特徵值組依時序輸入並根據該特徵值組判斷該待測聲音訊號是否包含一嬰兒哭聲,以得到一偵測結果;其中,該萃取特徵值步驟更包括:將該待測聲音訊號進行音框化, 產生至少一音框化聲音訊號;針對每個音框化聲音訊號,計算每個音框化聲音訊號的訊號基頻以得到一音框基頻;將該音框化聲音訊號進行直流移除運算,產生一直流移除音框化聲音訊號;計算該直流移除音框化聲音訊號的訊號強度、以及訊號過零率,以分別得到一音框強度、以及一音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組;以及,該特徵值判斷步驟更包括:檢測該特徵值組的一音框屬性,更包括:對該音框進行強音框檢測,若該音框強度大於一強度門檻,則判定該音框具強音框屬性,反之則判定該音框具弱音框屬性;若該音框具強音框屬性,則再對該音框進行哭聲音框檢測,若該音框過零率落在一過零率上下界之間,或者該音框基頻落在一基頻上下界之間,則判定該音框具哭聲音框屬性;以及,針對該音框屬性判斷該待測聲音訊號是否包含嬰兒哭聲,更包括:累計強音框以及哭聲音框的數量;當檢測到一個具有強音框屬性的音框後緊接著一個具有弱音框屬性的音框時,則檢視當時累計的該強音框計數是否低於一強音框計數門檻,若是低於該強音框計數門檻,則進行哭聲程度檢測;反之則判定偵測結果為非哭聲,各屬性音框計數歸零;其中,該哭聲程度檢測係指:若該哭聲音框計數超過一哭聲音框計數門檻,則判定偵測結果為哭聲,各屬性音框計數歸零;否則,若該哭聲音框計數與該強音框計數之比例高於一哭聲比例門檻,則判定該待測聲音訊號為類哭聲;反之,若該哭聲音框計數與該強音框計數之比例不高於一哭聲比例門檻,則判定偵測結果為非哭聲,各屬性音框計數歸零;若類哭聲出現次數超過一類哭聲計數門檻,則判定偵測結果為哭聲,各屬性音框計數歸零;否則,若相鄰兩次類哭聲之間隔大於一類哭聲間隔門檻,則類哭聲計數歸零,判定偵測結果為非哭聲,各屬性音框計數歸零;反之,若相鄰兩次類哭 聲之間隔不大於一類哭聲間隔門檻,則判定偵測結果為非哭聲,各屬性音框計數歸零。
在一較佳實施例中,計算該待測聲音訊號的訊號強度更包括下列步驟:將該直流移除音框化聲音訊號進行時域能量計算,產生一音框能量;將該音框能量進行能量平滑化運算,即可得該音框強度。
在一較佳實施例中,計算該待測聲音訊號的訊號過零率更包括下列步驟:將該直流移除音框化聲音訊號進行過零次數計算,產生一音框過零次數;將該音框過零次數進行過零次數平滑化運算,即可得該音框過零率。
在一較佳實施例中,計算該待測聲音訊號的訊號基頻更包括下列步驟:根據該音框化聲音訊號產生一能量頻譜;根據該能量頻譜產生一基頻估測值;將該基頻估測值進行基頻估測值平滑化運算,即可得該音框基頻。
在一較佳實施例中,該產生一能量頻譜步驟係包括:將該音框化聲音訊號進行加窗,產生一加窗音框化聲音訊號;將該加窗音框化聲音訊號進行時頻轉換,產生一頻譜;將該頻譜透過頻譜能量計算,產生該能量頻譜。
在一較佳實施例中,該產生一基頻估測值步驟更包括:根據該能量頻譜,產生一區域峰值組,係先在該能量頻譜上,將一個頻點選為一候選峰值,再以該候選峰值為參考點,進行區域能量比較,若該候選峰值在區域能量比較中被判定為勝出,則將該候選峰值標註為一區域峰值,反之則標註為其它,直到該能量頻譜上的所有的頻點都被標註完畢為止,所有該區域峰值之集合即為該區域峰值組,其中該區域能量比較,係指若該候選峰值之能量大於以該候選峰值為中心之一頻率範圍內所有其他頻點 之能量,則將該候選峰值判定為勝出;然後,計算峰值間隔,包含,若該區域峰值組之區域峰值數高於一區域峰值數門檻,則計算該區域峰值組中相鄰峰值之間隔,以產生一峰值間隔組;反之,則判定基頻估測結果為不穩定;以及,計算基頻,根據該峰值間隔組計算基頻,產生一基頻估測結果,更包含:排除異常間隔,係排除峰值間隔組中之異常極值,以得到一正常峰值間隔組;檢測峰值間隔變異度,係計算該正常峰值間隔組中極值之差異,若差異小於一差異門檻,則進行峰值平均間隔計算,反之則判定該基頻估測結果為不穩定;計算峰值平均間隔,係計算該正常峰值間隔組之平均值,以得到一峰值平均間隔;搜尋基頻峰值,係在該能量頻譜上峰值平均間隔處搜尋該基頻峰值;以及基頻加權平均,係將該基頻峰值與其上下頻點之能量較高者進行加權平均,即可得該基頻估測值。
100:萃取特徵值
110:將該待測聲音訊號進行音框化
120:計算每個音框化聲音訊號的音框基頻
130:將音框化聲音訊號進行直流移除運算
140:計算直流移除音框化聲音訊號的音框強度、音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組
200:特徵值判斷
210:檢測特徵值組的音框屬性
220:針對音框屬性判斷是否包含嬰兒哭聲
1301:進行時域能量計算
1302:進行能量平滑化運算
1303:進行過零次數計算
1304:進行過零次數平滑化運算
1305:產生能量頻譜
1306:產生基頻估測值
1307:進行基頻估測值平滑化運算
1305a:進行音框加窗
1305b:進行時頻轉換
1305c:進行頻譜能量計算
1306a:根據能量頻譜,產生區域峰值組
1306b:計算峰值間隔
1306c:計算基頻
2101:進行強音框檢測,判斷是否具強音框屬性
2102:若具強音框屬性,則進行哭聲音框檢測
2201:計算強音框以及哭聲音框的數量
2202:若兩相鄰音框之屬性依序為先強後弱,則進行聲音長度檢測
2203:若通過聲音長度檢測,則進行哭聲程度檢測
2203a:若哭聲音框計數超過一哭聲音框計數門檻
2203b:判定偵測結果為哭聲,各屬性音框計數歸零
2203c:若哭聲音框計數與強音框計數之比例高於一哭聲比例門檻
2203d:判定待測聲音訊號為類哭聲
2203e:若類哭聲出現次數超過一類哭聲計數門檻
2203f:若相鄰兩次類哭聲之間隔大於一類哭聲間隔門檻
2203g:類哭聲計數歸零
2203h:判定偵測結果為非哭聲,各屬性音框計數歸零
圖1為本發明之一種嬰兒哭聲偵測方法的流程示意圖;圖2為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號強度的流程示意圖;圖3為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號過零率的流程示意圖;圖4為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號基頻的流程示意圖;圖5為本發明之一種嬰兒哭聲偵測方法中產生能量頻譜的流程示意圖;圖6為本發明之一種嬰兒哭聲偵測方法中產生基頻估測值的流程示意圖; 圖7為本發明之一種嬰兒哭聲偵測方法中檢測特徵值組的音框屬性的流程示意圖;圖8為本發明之一種嬰兒哭聲偵測方法中針對音框屬性判斷待測聲音訊號是否包含嬰兒哭聲的流程示意圖;圖9為本發明之一種嬰兒哭聲偵測方法中哭聲程度檢測的流程示意圖。
以下藉由特定的具體實施例說明本發明之實施方式,熟悉此技術之人士可由本說明書所揭示之內容輕易地瞭解本發明之其他優點及功效。本發明亦可藉由其他不同的具體實例加以施行或應用,本發明說明書中的各項細節亦可基於不同觀點與應用在不悖離本發明之精神下進行各種修飾與變更。
其中,本說明書所附圖式繪示之結構、比例、大小等,均僅用以配合說明書所揭示之內容,以供熟悉此技術之人士瞭解與閱讀,並非用以限定本發明可實施之限定條件,故不具技術上之實質意義,任何結構之修飾、比例關之改變或大小之調整,在不影響本發明所能產生之功效及所能達成之目的下,均應落在本發明所揭示之技術內容得能涵蓋之範圍內。
如圖1所示,本發明之實施例揭露一種嬰兒哭聲偵測方法,包含:步驟100:萃取特徵值步驟,係將一待測聲音訊號依時序輸入以萃取該待測聲音訊號的至少一特徵值組;以及,步驟200:特徵值判斷步驟,係將該特徵值組依時序輸入並根據該特徵值組判斷該待測聲音訊號是否包含一嬰兒哭聲,以得到一偵測結果;其中,該萃取特徵值步驟更包括:步驟110將該待測聲音訊號進行音框化,產生至少一音框化聲音訊號;步驟120計算每個音框化聲音訊號的訊號基頻以得到一音框基頻;步驟130將該音框化聲音訊號進行直流移除運算,產生一直流移除音框化聲音訊號;步驟140計算該直 流移除音框化聲音訊號的訊號強度、以及訊號過零率,以分別得到一音框強度、以及一音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組;以及,該特徵值判斷步驟更包括:步驟210:檢測該特徵值組的一音框屬性,以及步驟220:再針對該音框屬性判斷該待測聲音訊號是否包含嬰兒哭聲,以得到該偵測結果。
所謂音框(frame)係先將N個取樣點集合成一個觀測單位,稱為音框,通常N的值是256或512,涵蓋的時間約為20~30ms左右。為了避免相鄰兩音框的變化過大,會讓兩相鄰音框之間有一段重疊區域,此重疊區域包含了M個取樣點,通常M的值約是N的一半或1/3。其中,在進行音框化時(步驟110),所產生的各音框之間會有部分重疊。值得說明的是,上述之N值、M值、涵蓋的時間長度、以及音框之間是否重疊皆只是習知用來說明本發明之實施例,但在實際應用時並不限於此。
值得說明的是,在步驟130的主要目的係針對該待測聲音訊號擷取出一組具有嬰兒哭聲辨識度的特徵值;在本發明的設定中該具有嬰兒哭聲辨識度的特徵值組至少包含一訊號強度、一訊號過零率、以及一訊號基頻。其中,該音框強度、音框過零率、以及音框基頻可分別進行計算,其計算順序並無先後之分。
圖2為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號強度的流程示意圖;圖3為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號過零率的流程示意圖;圖4為本發明之一種嬰兒哭聲偵測方法中計算待測聲音訊號的訊號基頻的流程示意圖。
具體來說,如圖2所示,計算該待測聲音訊號的訊號強度更包括:步驟1301、將該直流移除音框化聲音訊號進行時域能量計算,產生一音框能量;步驟1302、將該音框能量進行能量平滑化運算,即可得該音框強度。其中,在 一較佳實施例中,進行時域能量計算時所使用的方法為取用該音框內所有取樣點的絕對值之平均值,但不限於此。同樣地,在一較佳實施例中,進行能量平滑化運算時所使用的方法為:將當前音框能量與前一個音框能量進行加權平均,但也不限於此。
另一方面,如圖3所示,計算該待測聲音訊號的訊號過零率更包括:步驟1303、將該直流移除音框化聲音訊號進行過零次數計算,產生一音框過零次數;步驟1304、將該音框過零次數進行過零次數平滑化運算,即可得該音框過零率。其中,在一較佳實施例中,進行過零次數平滑化運算時所使用的方法為:將當前音框過零次數與前一個音框過零次數進行加權平均,但也不限於此。
同樣地,如圖4所示,計算該待測聲音訊號的訊號基頻更包括:步驟1305、根據該音框化聲音訊號產生一能量頻譜;步驟1306、根據該能量頻譜產生一基頻估測值;步驟1307、將該基頻估測值進行基頻估測值平滑化運算,即可得該音框基頻。
圖5為本發明之一種嬰兒哭聲偵測方法中產生能量頻譜的流程示意圖;圖6為本發明之一種嬰兒哭聲偵測方法中產生基頻估測值的流程示意圖。
承前所述,如圖5所示,該產生一能量頻譜步驟(步驟1305)係包括:步驟1305a、將該音框化聲音訊號進行加窗,產生一加窗音框化聲音訊號;步驟1305b、將該加窗音框化聲音訊號進行時頻轉換,產生一頻譜;步驟1305c、將該頻譜透過頻譜能量計算,產生該能量頻譜。其中,所謂加窗,係指將每一個音框乘上一窗函數,例如,漢寧窗(Hamming window),以增加音框左端和右端的連續性,但不限於此。另一方面,在一較佳實施例中,在時頻轉換時所使用的轉換方法為快速傅立葉轉換,但也不限於此。同樣地,在一較佳實施例中,在頻譜能量計算時所使用的計算函式為絕對值函式,但也不限於此。
如圖6所示,該產生一基頻估測值步驟更包括:步驟1306a、根據該能量頻譜,產生一區域峰值組;步驟1306b、計算峰值間隔;步驟1306c、計算基頻。分別詳述如下:其中,步驟1306a、根據該能量頻譜,產生一區域峰值組,係先在該能量頻譜上,將一個頻點選為一候選峰值;再以該候選峰值為參考點,進行區域能量比較,若該候選峰值在區域能量比較中被判定為勝出,則將該候選峰值標註為一區域峰值,反之則標註為其它,直到該能量頻譜上的所有的頻點都被標註完畢為止。所有該區域峰值之集合即為該區域峰值組,其中該區域能量比較,係指若該候選峰值之能量大於以該候選峰值為中心之一頻率範圍內所有其他頻點之能量,則將該候選峰值判定為勝出。
步驟1306b、計算峰值間隔,更包含:若該區域峰值組之區域峰值數高於一區域峰值數門檻,則計算該區域峰值組中相鄰峰值之間隔,以產生峰值間隔組;反之,則判定基頻估測結果為不穩定。
步驟1306c、計算基頻,係根據該峰值間隔組計算基頻,產生一基頻估測結果,更包含:排除異常間隔,係排除峰值間隔組中之異常極值,以得到一正常峰值間隔組;檢測峰值間隔變異度,係計算該正常峰值間隔組中極值之差異,若差異小於一差異門檻,則進行峰值平均間隔計算,反之則判定該基頻估測結果為不穩定;計算峰值平均間隔,係計算該正常峰值間隔組之平均值,以得到一峰值平均間隔;搜尋基頻峰值,係在該能量頻譜上峰值平均間隔處搜尋該基頻峰值;以及基頻加權平均,係將該基頻峰值與其上下頻點之能量較高者進行加權平均,即可得該基頻估測值。其中,在一較佳實施例中,進行基頻估測值平滑化運算時所使用的方法為:若當前基頻估測值為穩定時,則該音框基頻即為當前基頻估測值;反之,則該音框基頻為前一個音框之基頻。
圖7為本發明之一種嬰兒哭聲偵測方法中檢測特徵值組的音框屬性的流程示意圖。如圖7所示,該檢測該特徵值組的一音框屬性步驟更包括:步驟2101、對該音框進行強音框檢測,若該音框強度大於一強度門檻,則判定該音框具強音框屬性,反之則判定該音框具弱音框屬性;以及,步驟2102、若該音框具強音框屬性,則再對該音框進行哭聲音框檢測,若該音框過零率落在一過零率上下界之間,或者該音框基頻落在一基頻上下界之間,則判定該音框具哭聲音框屬性。
圖8為本發明之一種嬰兒哭聲偵測方法中針對音框屬性判斷待測聲音訊號是否包含嬰兒哭聲的流程示意圖;圖9為本發明之一種嬰兒哭聲偵測方法中哭聲程度檢測的流程示意圖。其中,如圖8所示,該針對該音框屬性判斷該待測聲音訊號是否包含嬰兒哭聲步驟更包括:步驟2201、計算強音框以及哭聲音框的數量;步驟2202、若兩相鄰音框之屬性依序為先強後弱,則進行聲音長度檢測;步驟2203、若通過聲音長度檢測,則進行哭聲程度檢測;反之則判定偵測結果為非哭聲,各屬性音框計數歸零。其中,步驟2202之該聲音長度檢測係指若該強音框計數低於一強音框計數門檻,則視為通過檢測。
如圖9所示,步驟2203中該哭聲程度檢測更包含:步驟2203a、若該哭聲音框計數超過一哭聲音框計數門檻,則執行步驟2203b,判定偵測結果為哭聲,各屬性音框計數歸零;否則,執行步驟2203c、若該哭聲音框計數與該強音框計數之比例高於一哭聲比例門檻,則執行步驟2203d、判定該待測聲音訊號為類哭聲;反之,若該哭聲音框計數與該強音框計數之比例不高於一哭聲比例門檻,則執行步驟2203h、判定該待測聲音訊號為非哭聲,各屬性音框計數歸零;步驟2203e、若類哭聲出現次數超過一類哭聲計數門檻,則執行步驟2203b,判定偵測結果為哭聲,各屬性音框計數歸零;否則,執行步驟2203f、若相鄰兩次類哭聲之間隔大於一類哭聲間隔門檻,則執行步驟2203g、類哭聲計數歸零,再 執行步驟2203h、判定偵測結果為非哭聲,各屬性音框計數歸零;反之,若相鄰兩次類哭聲之間隔不大於一類哭聲間隔門檻,則執行步驟2203h、判定偵測結果為非哭聲,各屬性音框計數歸零。
儘管已參考本申請的許多說明性實施例描述了實施方式,但應瞭解的是,本領域技術人員能夠想到多種其他改變及實施例,這些改變及實施例將落入本公開原理的精神與範圍內。尤其是,在本公開、圖式以及所附申請專利的範圍之內,對主題結合設置的組成部分及/或設置可作出各種變化與修飾。除對組成部分及/或設置做出的變化與修飾之外,可替代的用途對本領域技術人員而言將是顯而易見的。
100:萃取特徵值
110:將該待測聲音訊號進行音框化
120:計算每個音框化聲音訊號的音框基頻
130:將音框化聲音訊號進行直流移除運算
140:計算直流移除音框化聲音訊號的音框強度、音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組
200:特徵值判斷
210:檢測特徵值組的音框屬性
220:針對音框屬性判斷是否包含嬰兒哭聲

Claims (14)

  1. 一種嬰兒哭聲偵測方法,包含下列步驟:萃取特徵值步驟,係將一待測聲音訊號依時序輸入以萃取該待測聲音訊號的至少一特徵值組;以及,特徵值判斷步驟,係將該特徵值組依時序輸入並根據該特徵值組判斷該待測聲音訊號是否包含一嬰兒哭聲,以得到一偵測結果;其中,該萃取特徵值步驟更包括:將該待測聲音訊號進行音框化,產生至少一音框化聲音訊號;針對每個音框化聲音訊號,計算每個音框化聲音訊號的訊號基頻以得到一音框基頻;將該音框化聲音訊號進行直流移除運算,產生一直流移除音框化聲音訊號;計算該直流移除音框化聲音訊號的訊號強度、以及訊號過零率,以分別得到一音框強度、以及一音框過零率,該音框強度、音框過零率、以及音框基頻即構成一特徵值組;該特徵值判斷步驟更包括:檢測該特徵值組的一音框屬性,更包括:對該音框進行強音框檢測,若該音框強度大於一強度門檻,則判定該音框具強音框屬性,反之則判定該音框具弱音框屬性;若該音框具強音框屬性,則再對該音框進行哭聲音框檢測,若該音框過零率落在一過零率上下界之間,或者該音框基頻落在一基頻上下界之間,則判定該音框具哭聲音框屬性;以及,針對該音框屬性判斷該待測聲音訊號是否包含嬰兒哭聲,更包括:累計強音框以及哭聲音框的數量; 當檢測到一個具有強音框屬性的音框後緊接著一個具有若音框屬性的音框時,則檢視當時累計的該強音框計數是否低於一強音框計數門檻,若是低於該強音框計數門檻,則進行哭聲程度檢測;反之則判定偵測結果為非哭聲,各屬性音框計數歸零;其中,該哭聲程度檢測係指:若該哭聲音框計數超過一哭聲音框計數門檻,則判定偵測結果為哭聲,各屬性音框計數歸零;否則,若該哭聲音框計數與該強音框計數之比例高於一哭聲比例門檻,則判定該待測聲音訊號為類哭聲;反之,若該哭聲音框計數與該強音框計數之比例不高於一哭聲比例門檻,則判定偵測結果為非哭聲,各屬性音框計數歸零;若類哭聲出現次數超過一類哭聲計數門檻,則判定偵測結果為哭聲,各屬性音框計數歸零;否則,若相鄰兩次類哭聲之間隔大於一類哭聲間隔門檻,則類哭聲計數歸零,判定偵測結果為非哭聲,各屬性音框計數歸零;反之,若相鄰兩次類哭聲之間隔不大於一類哭聲間隔門檻,則判定偵測結果為非哭聲,各屬性音框計數歸零。
  2. 如申請專利範圍第1項所述之嬰兒哭聲偵測方法,其中,在進行音框化時,所產生的各音框之間會有部分重疊。
  3. 如申請專利範圍第1項所述之嬰兒哭聲偵測方法,其中,計算該待測聲音訊號的訊號強度更包括下列步驟:將該直流移除音框化聲音訊號進行時域能量計算,產生一音框能量;將該音框能量進行能量平滑化運算,即可得該音框強度。
  4. 如申請專利範圍第3項所述之嬰兒哭聲偵測方法,其中,進行時域能量計算時所使用的方法為取用該音框內所有取樣點的絕對值之平均值。
  5. 如申請專利範圍第3項所述之嬰兒哭聲偵測方法,其中,進行能量平滑化運算時所使用的方法為:將當前音框能量與前一個音框能量進行加權平均。
  6. 如申請專利範圍第1項所述之嬰兒哭聲偵測方法,其中,計算該待測聲音訊號的訊號過零率更包括下列步驟:將該直流移除音框化聲音訊號進行過零次數計算,產生一音框過零次數;將該音框過零次數進行過零次數平滑化運算,即可得該音框過零率。
  7. 如申請專利範圍第6項所述之嬰兒哭聲偵測方法,其中,進行過零次數平滑化運算時所使用的方法為:將當前音框過零次數與前一個音框過零次數進行加權平均。
  8. 如申請專利範圍第1項所述之嬰兒哭聲偵測方法,其中,計算該待測聲音訊號的訊號基頻更包括下列步驟:根據該音框化聲音訊號產生一能量頻譜;根據該能量頻譜產生一基頻估測值;將該基頻估測值進行基頻估測值平滑化運算,即可得該音框基頻。
  9. 如申請專利範圍第8項所述之嬰兒哭聲偵測方法,其中,該產生一能量頻譜步驟係包括:將該音框化聲音訊號進行加窗,產生一加窗音框化聲音訊號;將該加窗音框化聲音訊號進行時頻轉換,產生一頻譜;將該頻譜透過頻譜能量計算,產生該能量頻譜。
  10. 如申請專利範圍第8項所述之嬰兒哭聲偵測方法,其中,在進行加窗函數時所使用的函數為漢寧窗。
  11. 如申請專利範圍第8項所述之嬰兒哭聲偵測方法,其中,在時頻轉換時所使用的轉換方法為快速傅立葉轉換。
  12. 如申請專利範圍第8項所述之嬰兒哭聲偵測方法,其中,在頻譜能量計算時所使用的計算函式為絕對值函式。
  13. 如申請專利範圍第8項所述之嬰兒哭聲偵測方法,其中,該產生一基頻估測值步驟更包括:根據該能量頻譜,產生一區域峰值組,係先在該能量頻譜上,將一個頻點選為一候選峰值,再以該候選峰值為參考點,進行區域能量比較,若該候選峰值在區域能量比較中被判定為勝出,則將該候選峰值標註為一區域峰值,反之則標註為其它,直到該能量頻譜上的所有的頻點都被標註完畢為止,所有該區域峰值之集合即為該區域峰值組,其中該區域能量比較,係指若該候選峰值之能量大於以該候選峰值為中心之一頻率範圍內所有其他頻點之能量,則將該候選峰值判定為勝出;然後,計算峰值間隔,包含,若該區域峰值組之區域峰值數高於一區域峰值數門檻,則計算該區域峰值組中相鄰峰值之間隔,以產生峰值間隔組;反之,則判定基頻估測結果為不穩定;以及,計算基頻,根據該峰值間隔組計算基頻,產生一基頻估測結果,更包含:排除異常間隔,係排除峰值間隔組中之異常極值,以得到一正常峰值間隔組;檢測峰值間隔變異度,係計算該正常峰值間隔組中極值之差異,若差異小於一差異門檻,則進行峰值平均間隔計算,反之則判定該基頻估測結果為不穩定;計算峰值平均間隔,係計算該正常峰值間隔組之平均值,以得到 一峰值平均間隔;搜尋基頻峰值,係在該能量頻譜上峰值平均間隔處搜尋該基頻峰值;以及基頻加權平均,係將該基頻峰值與其上下頻點之能量較高者進行加權平均,即可得該基頻估測值。
  14. 如申請專利範圍第13項所述之嬰兒哭聲偵測方法,其中,進行基頻估測值平滑化運算時所使用的方法為:若當前基頻估測值為穩定時,則該音框基頻即為當前基頻估測值;反之,則該音框基頻為前一個音框之基頻。
TW108116218A 2019-05-10 2019-05-10 嬰兒哭聲偵測方法 TWI687920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW108116218A TWI687920B (zh) 2019-05-10 2019-05-10 嬰兒哭聲偵測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108116218A TWI687920B (zh) 2019-05-10 2019-05-10 嬰兒哭聲偵測方法

Publications (2)

Publication Number Publication Date
TWI687920B true TWI687920B (zh) 2020-03-11
TW202042217A TW202042217A (zh) 2020-11-16

Family

ID=70766916

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108116218A TWI687920B (zh) 2019-05-10 2019-05-10 嬰兒哭聲偵測方法

Country Status (1)

Country Link
TW (1) TWI687920B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707180A (zh) * 2021-08-10 2021-11-26 漳州立达信光电子科技有限公司 一种哭叫声音侦测方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881284A (zh) * 2012-09-03 2013-01-16 江苏大学 非特定人语音情感识别方法及系统
CN102915728A (zh) * 2011-08-01 2013-02-06 佳能株式会社 声音分段设备和方法以及说话者识别系统
CN103778916A (zh) * 2013-12-31 2014-05-07 三星电子(中国)研发中心 监控环境声音的方法及系统
TWI474315B (zh) * 2012-05-25 2015-02-21 Univ Nat Taiwan Normal Infant cries analysis method and system
CN105139869A (zh) * 2015-07-27 2015-12-09 安徽清新互联信息科技有限公司 一种基于区间差分特征的婴儿啼哭检测方法
TWI597720B (zh) * 2017-01-04 2017-09-01 晨星半導體股份有限公司 嬰兒哭聲偵測電路及相關的偵測方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915728A (zh) * 2011-08-01 2013-02-06 佳能株式会社 声音分段设备和方法以及说话者识别系统
TWI474315B (zh) * 2012-05-25 2015-02-21 Univ Nat Taiwan Normal Infant cries analysis method and system
CN102881284A (zh) * 2012-09-03 2013-01-16 江苏大学 非特定人语音情感识别方法及系统
CN103778916A (zh) * 2013-12-31 2014-05-07 三星电子(中国)研发中心 监控环境声音的方法及系统
CN105139869A (zh) * 2015-07-27 2015-12-09 安徽清新互联信息科技有限公司 一种基于区间差分特征的婴儿啼哭检测方法
TWI597720B (zh) * 2017-01-04 2017-09-01 晨星半導體股份有限公司 嬰兒哭聲偵測電路及相關的偵測方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707180A (zh) * 2021-08-10 2021-11-26 漳州立达信光电子科技有限公司 一种哭叫声音侦测方法和装置

Also Published As

Publication number Publication date
TW202042217A (zh) 2020-11-16

Similar Documents

Publication Publication Date Title
CN107657088B (zh) 基于mckd算法与支持向量机的滚动轴承故障诊断方法
CN105302383B (zh) 一种电容触摸传感器抗干扰的方法和设备
TWI687920B (zh) 嬰兒哭聲偵測方法
JP2000132177A5 (zh)
CN108169583B (zh) 中性点经电容接地的自耦变压器直流偏磁判别方法及系统
CN106409311B (zh) 副歌提取装置和方法
WO2016004687A1 (zh) 超高频局放信号初始时刻判别方法
CN114740091B (zh) 基于声学分析和机器学习的西瓜成熟度检测方法及系统
CN108324271A (zh) 心电信号识别方法、系统和心电监测设备
CN109991520A (zh) 一种电缆振荡波局放检测系统用波速计算新方法
CN101510423A (zh) 发音检测方法及装置
Deng et al. Selection of optimal wavelet basis for signal denoising
TWI597720B (zh) 嬰兒哭聲偵測電路及相關的偵測方法
TWI766489B (zh) 用於工具機的加工監控方法及加工監控系統
Böck et al. Enhanced peak picking for onset detection with recurrent neural networks
CN104076203A (zh) 一种考虑负频率影响的超低频间谐波检测方法
CN108646091A (zh) 一种多分量多项式相位信号的分离方法
TW201332512A (zh) 量測心率方法及裝置
CN100424692C (zh) 音频快速搜索方法
CN111273101A (zh) 一种故障电弧检测方法、装置及存储介质
CN111524036B (zh) 一种暂态电能质量扰动分类方法
CN107391935A (zh) 基于非延迟代价函数和Grubbs检验的瞬时频率估计方法
TW202103148A (zh) 隨選聲音片段偵測方法
US9069849B1 (en) Methods for enforcing time alignment for speed resistant audio matching
Kou et al. Research on feature Optimization algorithm of Optical Fiber Sensor recognition system