TW201349224A - 嬰兒哭聲分析方法及系統 - Google Patents
嬰兒哭聲分析方法及系統 Download PDFInfo
- Publication number
- TW201349224A TW201349224A TW101118767A TW101118767A TW201349224A TW 201349224 A TW201349224 A TW 201349224A TW 101118767 A TW101118767 A TW 101118767A TW 101118767 A TW101118767 A TW 101118767A TW 201349224 A TW201349224 A TW 201349224A
- Authority
- TW
- Taiwan
- Prior art keywords
- time
- category
- baby
- crying
- frequency
- Prior art date
Links
- 206010011469 Crying Diseases 0.000 title claims abstract description 63
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 230000001537 neural effect Effects 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 238000010183 spectrum analysis Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 7
- 206010037660 Pyrexia Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
一種嬰兒哭聲分析方法,用以對於嬰兒哭聲的一數位音頻信號進行辨識,該方法包含下列步驟:將該數位音頻信號以頻譜轉換法產生一頻譜資料;依據該頻譜資料的頻率範圍分類為正常模式或異常模式;若為正常模式,提供一預先建立的時頻特徵-需求類別的對照表,藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別;若為異常模式,提供一訓練完成的時頻特徵-特殊需求類別的類神經分類器,並輸入該數位音頻信號的頻率特徵至該類神經分類器以輸出其對應的特殊需求類別。
Description
本發明是有關於一種語音分析方法,特別是指一種兼具快速分析及精確辨識的嬰兒哭聲分析方法。
已知US5668780專利的「Baby cry recognizer」使用零交點(zero crossing)方法分類,藉由脈衝訊號來取樣聲音,由取樣出的強弱訊號之間的關係,和零點相比得到的交錯次數,即所謂的哭聲週期頻率,來判斷哭聲是否正常,是較簡便的方法,但僅能辨識出的嬰兒哭聲的週期頻率,無法進一步提供父母其他相關的資訊,例如嬰兒哭聲的原因為何。
另有US6496115專利的「System and method for analyzing baby cries」使用頻譜分析法分類,利用透過傅立葉轉換將聲音做頻率的組成訊號分析,在頻譜上去找出每個頻率的大小組成,對照在不同哭聲原因下可能的頻率分佈,此方法雖然較為精確的判斷出哭聲的可能原因,但此系統無法提供適用於不同嬰兒,亦無法由使用者對於系統進行修正其類別。
本發明之目的,即在提供一種兼具快速分析及精確辨識的嬰兒哭聲分析方法及系統。
於是,本發明的嬰兒哭聲分析方法是對於嬰兒哭聲的一數位音頻信號進行辨識,該方法包含下列步驟:將該數位音頻信號以頻譜轉換法產生一頻譜資料;依據該頻譜資料的頻
率範圍分類為一正常模式或一異常模式;若為正常模式,提供一預先建立的時頻特徵-需求類別的對照表,藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別;若為「異常模式」,提供一訓練完成的時頻特徵-特殊需求類別的類神經分類器,並輸入該數位音頻信號的頻率特徵至該類神經分類器以輸出其對應的特殊需求類別。
較佳的,本發明的嬰兒哭聲分析方法還包括下述步驟:提供初步辨識出的需求類別,若嬰兒仍持續哭泣一段時間,對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
較佳的,本發明的嬰兒哭聲分析方法中,相關參數的調整設定是在該關聯資料庫排除或新增特殊需求類別,再重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
本發明的嬰兒哭聲分析系統包含一頻譜分析單元、一初始分類器、一判別單元,及一類神經分類器。
該頻譜分析單元將該數位音頻信號以頻譜轉換法產生一頻譜資料;該初始分類器依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」;該判別單元配合一基本分類資料庫,該基本分類資料庫建立有一時頻特徵-需求類別的對照表,若該初始分類器分類為該「正常模式」時,藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別;該類神經分類器配合一時頻特徵資料庫及一關聯資料庫,且具有一訓練完成的時頻特徵-特殊需求類別的
關聯程式,若該初始分類器分類為該「異常模式」時,輸入該數位音頻信號的時頻特徵至該關聯程式以輸出其對應的特殊需求類別。
較佳的,本發明的嬰兒哭聲分析系統還包括一輸入單元及一修正單元,該輸入單元用以輸入控制指令;該修正單元用以於提供初步辨識出的需求類別後,若嬰兒仍持續哭泣一段時間,依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
較佳的,該輸入單元是在該關聯資料庫排除或新增特殊需求類別,該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
本發明的嬰兒哭聲分析方法之功效在於:利用初始分類區分出「正常模式」或「異常模式」,並依據「正常模式」的哭聲以基本需求分類,且依據「異常模式」的哭聲搭配類神經辨識,由於一般哭聲多數於「正常模式」而可快速辨識出來,異常哭聲較少發生,但是需要較精確的檢測,因此兼具快速分析及精確辨識的優點。
有關本發明之前述及其他技術內容、特點與功效,在以下配合參考圖式之較佳實施例的詳細說明中,將可清楚的呈現。
參閱圖1,本發明之較佳實施例是應用於一具有錄音功能的電子裝置100,電子裝置100包括一麥克風11、一類比
數位轉換器12、一記錄單元13、一嬰兒哭聲分析系統1及一輸出單元4,各元件功能分別介紹如下。
麥克風11是接收嬰兒哭泣聲的類比信號;類比數位轉換器12是將類比信號數位化成數位音頻信號資料;記錄單元13是儲存經過類比數位轉換器12轉換後的數位音頻信號資料;嬰兒哭聲分析系統1可利用數位音頻信號資料辨識出不同的需求類別;輸出單元4是一發光裝置、一影像播放器或一語音播放器,可將嬰兒哭聲分析系統1辨識出的需求類別以不同顏色的燈光、不同需求的警示影像,或不同語音提示的警示聲音的方式輸出,藉此達到提醒的效果。
嬰兒哭聲分析系統1包含一頻譜分析單元14、一初始分類器15、一判別單元16、一基本分類資料庫161、一特徵擷取單元21、一時頻特徵資料庫22、一類神經分類器23及一關聯資料庫24;較佳的,嬰兒哭聲分析系統1還包括一輸入單元31及一修正單元32,藉此補強嬰兒哭聲分析系統1的辨識功能。各元件功能如下。
頻譜分析單元14是將類比數位轉換器12轉換後的數位音頻信號以頻譜轉換法產生一頻譜資料,頻譜轉換法可以是快速傅立葉轉換,藉此得到數位音頻信號的頻率分佈範圍。
初始分類器15依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」,本實施例是以高頻或低頻進行區別,例如:未超出10kHz為「正常模式」,超出10kHz為「異常模式」,辨別「正常模式」的哭聲可以馬上滿足寶寶的需求,讓新手父母不會手忙腳亂;判斷「異常模式」的
哭聲可以在寶寶有輕微生病並且感覺到不適時及早發現及早治療,避免寶寶有嚴重病症的危險,因為若非正常哭聲,顯示嬰兒可能潛在的身體健康問題,或是更深的心理因素需要進一步探討。因此,若初始分類器15分類為「正常模式」則觸發判別單元16動作,若初始分類器15分類為「異常模式」則觸發類神經分類器23動作。
茲將判別單元16及類神經分類器23的主要動作原理分別說明如下。
判別單元16配合一基本分類資料庫161運作,該基本分類資料庫161建立有一時頻特徵(time-frequency characteristics)-需求類別的對照表,本實施例使用的”時頻特徵”是代表各類別信號經過時頻分析(Time-frequency analysis)後,在時頻平面(time-frequency plane)的各種圖形。
於該「正常模式」時,判別單元16可藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別。
在本實施例是歸類一般小嬰兒的基本需求大致都有下面五大類共同的哭聲類別。
一、飢餓-類似ㄋㄚ、ㄋㄚ、ㄋㄚ的聲音。
二、想睡覺(累了)-類似ㄛ、ㄛ、ㄛ的聲音。
三、不舒服(泛指姿勢不舒服、尿布濕等等原因)-類似ㄏㄟ、ㄏㄟ、ㄏㄟ的聲音。
四、肚子脹氣了-類似ㄟ一、ㄟ一、ㄟ一的聲音。
五、想打嗝了-類似ㄟ、ㄟ、ㄟ的聲音。
因此,判別單元16可將前述基本需求類別以例如赫伯特-黃變換法(Hilbert-Huang Transformation,簡稱HHT),運算技術可參考美國第6,862,558號專利,其轉換出的特徵影像的優點是包括訊號之頻率、時間、以及能量分佈之情形,特徵影像的x軸代表時間,y軸代表頻率,以不同顏色及深淺代表能量大小(例如:越紅代表能量越強),然後,再利用基本分類資料庫161內建的對照表內建的時頻特徵的影像模板加以比對出對應的基本需求類別。
類神經分類器23具有一訓練完成的時頻特徵-特殊需求類別的關聯程式(圖未示),且配合時頻特徵資料庫22已記錄的時頻特徵及關聯資料庫24運作,關聯程式的核心技術採用的是人工類神經網路(Artificial neural network)進行聲音辨識。
人工類神經網路,顧名思義即為模仿人類腦部神經元連結方式之決策系統;人類平時會將學習到的資訊儲存於腦部神經元當中,而在進行思考決策時便會自動將各神經元進行連結,藉由儲存其中之資料進行判斷。
人工類神經網路系統共分三個部分,分別是神經元、層、網路。神經元是此網路的基本組成單位,負責將收到的訊號進行加權處理後送到下一個神經元節點。層級是由數量不等之神經元組成的集合,按照功能性分為輸入層、隱藏層、輸出層等。而網路即為各層之間的組合,類神經網路中各神經元的加權值可視為儲存的資訊。其學習方法即為利用已知輸入與輸出值進行神經元加權值之調整,因此人工類神
經網路需要已知的輸入與輸出樣本關係進行訓練。
本實施例在訓練階段是由三百組已知的嬰兒哭聲當作訓練樣本,且已由專業保母判斷得知對應的特殊需求類別,並將各時頻特徵與對應的各需求類別之關聯組成關聯資料庫24,由此關聯資料庫24對人工類神經網路系統進行訓練,以倒傳遞演算法(Back Propagation)進行各神經元加權值之調整。
完成前述訓練的時頻特徵-特殊需求類別的關聯程式後就可應用在實際狀況;於初始分類器15判別出「異常模式」後,觸發類神經分類器23數位音頻信號,利用時頻特徵資料庫22已記錄的異常哭聲的時頻特徵輸入至類神經分類器23內建的關聯程式就可自動辨識出特殊需求類別。
此外,嬰兒哭聲分析系統1還包括回饋修正機制,當使用者利用此系統辨認寶寶的需求之後,滿足需求完畢要觀察寶寶的哭聲是否就此停止,若無停止跡象,便需要剔除先前的需求重新進行類神經網路的計算,重複此步驟直到哭聲停止為止,並且,進行特殊需求類別的神經元權重值之更新,因此本系統可隨著使用者的不同與使用時間的長短而有個人化的趨勢,因此,可比傳統辨識系統較能適應不同嬰兒間哭聲的微妙變化。
本實施例中,使用者可利用輸入單元31輸入一控制指令至修正單元32,修正單元32依據輸入單元31輸入之控制指令對於未辨識出的嬰兒哭聲的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別
作為完成修正的依據。例如:輸入剔除先前的特殊需求類別的控制指令,使得類神經分類器23重新輸入數位音頻信號的時頻特徵,然後以重新訓練的類神經網路辨識出其對應的特殊需求類別。
參閱圖2,並配合圖1,本發明的嬰兒哭聲分析方法之較佳實施例中,輸入嬰兒哭聲(步驟201)至麥克風11;然後,類比數位轉換器12將嬰兒哭聲類比數位轉換為一數位音頻信號(步驟202),並儲存於記錄單元13,同時,特徵擷取單元21會轉換出時頻特徵,並將時頻特徵儲存於時頻特徵資料庫22備用;接著,頻譜分析單元14將該數位音頻信號轉換出一頻譜資料(步驟203);初始分類器15再依據該頻譜資料的頻率範圍的低高分類(步驟204),主要是區分出「正常模式」及「異常模式」。
若為「正常模式」,令判別單元16藉由對照表關聯出該時頻特徵對應的基本需求類別(步驟205),其對照表即存於基本分類資料庫161中,然後,輸出單元4輸出基本需求類別(步驟206);若為「異常模式」,則由時頻特徵資料庫22輸入時頻特徵至類神經分類器23(步驟207);類神經分類器23辨識後,即由輸出單元4輸出辨識出的特殊需求類別(步驟208)。
接著,使用者觀察或依系統設定判斷嬰兒仍持續哭泣一段時間(步驟209)?若是,則代表初步辨識出來的是不合適的類別,就需要利用輸入單元31輸入控制指令予修正單元32,修正單元32再對於類神經分類器23的時頻特徵-特殊
需求類別的相關參數進行修正(步驟210),本實施例中是對於關聯資料庫24的初步辨識出來的類別剔除後再重新辨識,直到嬰兒停止哭泣為止,或者,也可依據使用者的判斷(如:嬰兒發燒給予退燒後停止哭泣)而新增類別(如:發燒)至關聯資料庫24。
綜上所述,本發明的嬰兒哭聲分析方法及系統之功效在於:利用初始分類區分出「正常模式」或「異常模式」,並依據「正常模式」的哭聲以基本需求分類,且依據「異常模式」的哭聲搭配類神經辨識,由於一般哭聲多數於「正常模式」而可快速辨識出來,異常哭聲較少發生,但是需要較精確的檢測,因此兼具快速分析及精確辨識的優點,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
100‧‧‧電子裝置
1‧‧‧嬰兒哭聲分析系統
11‧‧‧麥克風
12‧‧‧類比數位轉換器
13‧‧‧記錄單元
14‧‧‧頻譜分析單元
15‧‧‧初始分類器
16‧‧‧判別單元
161‧‧‧基本分類資料庫
21‧‧‧特徵擷取單元
22‧‧‧時頻特徵資料庫
23‧‧‧類神經分類器
24‧‧‧關聯資料庫
31‧‧‧輸入單元
32‧‧‧修正單元
4‧‧‧輸出單元
201-210‧‧‧步驟
圖1是一系統方塊圖,說明本發明的嬰兒哭聲分析系統之較佳實施例;及圖2是一流程圖,說明本發明的嬰兒哭聲分析方法之較佳實施例。
201-210‧‧‧步驟
Claims (6)
- 一種嬰兒哭聲分析方法,用以對於嬰兒哭聲的一數位音頻信號進行辨識,該方法包含下列步驟:(a)將該數位音頻信號以頻譜轉換法產生一頻譜資料;(b)依據該頻譜資料的頻率範圍分類為一正常模式或一異常模式;(c)若為正常模式,提供一預先建立的時頻特徵-需求類別的對照表,藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別;及(d)若為異常模式,提供一訓練完成的時頻特徵-特殊需求類別的類神經分類器,並輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
- 依據申請專利範圍第1項所述之嬰兒哭聲分析方法,還包括下述步驟:(e)提供初步辨識出的需求類別,若嬰兒仍持續哭泣一段時間,對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
- 依據申請專利範圍第2項所述之嬰兒哭聲分析方法,其中,步驟(e)的相關參數的調整設定是在該關聯資料庫排除或新增特殊需求類別,再重新輸入該數位音頻信號的頻率特徵與時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
- 一種嬰兒哭聲分析系統,包含: 一頻譜分析單元,將該數位音頻信號以頻譜轉換法產生一頻譜資料;一初始分類器,依據該頻譜資料的頻率範圍分類為一正常模式或一異常模式;一判別單元,配合一基本分類資料庫,該基本分類資料庫建立有一時頻特徵-需求類別的對照表,若該初始分類器分類為該正常模式時,藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別;及一類神經分類器,配合一時頻特徵資料庫及一關聯資料庫,且具有一訓練完成的時頻特徵-特殊需求類別的關聯程式,若該初始分類器分類為該異常模式時,輸入該數位音頻信號的時頻特徵至該關聯程式以輸出其對應的特殊需求類別。
- 依據申請專利範圍第4項所述之嬰兒哭聲分析系統,還包括一輸入單元及一修正單元,該輸入單元輸入一控制指令;該修正單元於提供初步辨識出的需求類別後,若嬰兒仍持續哭泣一段時間,依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
- 依據申請專利範圍第5項所述之嬰兒哭聲分析系統,其中,該輸入單元是在該關聯資料庫排除或新增特殊需求類別,該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101118767A TWI474315B (zh) | 2012-05-25 | 2012-05-25 | Infant cries analysis method and system |
CN201310017809.0A CN103426438B (zh) | 2012-05-25 | 2013-01-17 | 婴儿哭声分析方法及系统 |
US13/899,645 US9009038B2 (en) | 2012-05-25 | 2013-05-22 | Method and system for analyzing digital sound audio signal associated with baby cry |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101118767A TWI474315B (zh) | 2012-05-25 | 2012-05-25 | Infant cries analysis method and system |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201349224A true TW201349224A (zh) | 2013-12-01 |
TWI474315B TWI474315B (zh) | 2015-02-21 |
Family
ID=49622270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101118767A TWI474315B (zh) | 2012-05-25 | 2012-05-25 | Infant cries analysis method and system |
Country Status (3)
Country | Link |
---|---|
US (1) | US9009038B2 (zh) |
CN (1) | CN103426438B (zh) |
TW (1) | TWI474315B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI747392B (zh) * | 2020-07-22 | 2021-11-21 | 國立雲林科技大學 | 嬰兒哭聲辨識修正方法及其系統 |
TWI793149B (zh) * | 2017-11-20 | 2023-02-21 | 日商優你 嬌美股份有限公司 | 育兒支援程式及育兒支援方法 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9240188B2 (en) | 2004-09-16 | 2016-01-19 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
KR101427993B1 (ko) * | 2012-12-17 | 2014-08-08 | 포항공과대학교 산학협력단 | 오디오 신호의 햅틱 신호 변환 방법 및 이를 수행하는 장치 |
JP6337752B2 (ja) * | 2014-11-27 | 2018-06-06 | 株式会社Jvcケンウッド | 乳幼児泣き声検出装置 |
CN105719663A (zh) * | 2014-12-23 | 2016-06-29 | 郑载孝 | 婴儿哭声分析方法 |
CN105118518B (zh) * | 2015-07-15 | 2019-05-10 | 百度在线网络技术(北京)有限公司 | 一种声音的语义分析方法及装置 |
JP6604113B2 (ja) * | 2015-09-24 | 2019-11-13 | 富士通株式会社 | 飲食行動検出装置、飲食行動検出方法及び飲食行動検出用コンピュータプログラム |
US9899035B2 (en) * | 2015-11-04 | 2018-02-20 | Ioannis Kakadiaris | Systems for and methods of intelligent acoustic monitoring |
CN105513610A (zh) * | 2015-11-23 | 2016-04-20 | 南京工程学院 | 一种声音分析方法及装置 |
CN105898219B (zh) * | 2016-04-22 | 2019-05-21 | 北京小米移动软件有限公司 | 对象监控方法及装置 |
GB2552067A (en) * | 2016-05-24 | 2018-01-10 | Graco Children's Products Inc | Systems and methods for autonomously soothing babies |
CN106157945A (zh) * | 2016-05-27 | 2016-11-23 | 辽东学院 | 一种篮球裁判员训练哨子 |
CN107657963A (zh) * | 2016-07-25 | 2018-02-02 | 韦创科技有限公司 | 哭声辨识系统与哭声辨识方法 |
CN106373593A (zh) * | 2016-08-22 | 2017-02-01 | 衣佳鑫 | 基于音频检测婴儿吃奶次数方法及系统 |
US9886954B1 (en) * | 2016-09-30 | 2018-02-06 | Doppler Labs, Inc. | Context aware hearing optimization engine |
WO2018187664A1 (en) * | 2017-04-06 | 2018-10-11 | Brown University | Improved diagnostic instrument and methods |
CN107705786A (zh) * | 2017-09-27 | 2018-02-16 | 努比亚技术有限公司 | 一种语音处理方法、装置及计算机可读存储介质 |
TW201918219A (zh) * | 2017-11-07 | 2019-05-16 | 財團法人資訊工業策進會 | 辨識嬰兒需求的系統及方法 |
WO2019113477A1 (en) * | 2017-12-07 | 2019-06-13 | Lena Foundation | Systems and methods for automatic determination of infant cry and discrimination of cry from fussiness |
CN109065034B (zh) * | 2018-09-25 | 2023-09-08 | 河南理工大学 | 一种基于声音特征识别的婴儿哭声翻译方法 |
CN109065074A (zh) * | 2018-09-25 | 2018-12-21 | 河南理工大学 | 一种婴儿语音声音翻译器 |
CN111276159A (zh) * | 2018-12-05 | 2020-06-12 | 阿里健康信息技术有限公司 | 一种婴儿发音分析方法及服务器 |
CN110070893A (zh) * | 2019-03-25 | 2019-07-30 | 成都品果科技有限公司 | 一种利用婴儿哭声进行情感分析的系统、方法和装置 |
CN111862991A (zh) * | 2019-04-30 | 2020-10-30 | 杭州海康威视数字技术股份有限公司 | 一种婴儿哭声的识别方法及系统 |
TWI687920B (zh) * | 2019-05-10 | 2020-03-11 | 佑華微電子股份有限公司 | 嬰兒哭聲偵測方法 |
CN110243603B (zh) * | 2019-05-30 | 2020-11-24 | 沈阳化工大学 | 基于Welch转换-径向基神经网的滚动轴承故障诊断方法 |
CN111261173A (zh) * | 2020-01-10 | 2020-06-09 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及电器 |
CN113270115B (zh) * | 2020-02-17 | 2023-04-11 | 广东美的制冷设备有限公司 | 婴儿监护设备及其婴儿监护方法、控制装置和存储介质 |
CN113658596A (zh) * | 2020-04-29 | 2021-11-16 | 扬智科技股份有限公司 | 语意辨识方法与语意辨识装置 |
EP3940698A1 (en) | 2020-07-13 | 2022-01-19 | Zoundream AG | A computer-implemented method of providing data for an automated baby cry assessment |
US11670322B2 (en) * | 2020-07-29 | 2023-06-06 | Distributed Creation Inc. | Method and system for learning and using latent-space representations of audio signals for audio content-based retrieval |
CN112382311B (zh) * | 2020-11-16 | 2022-08-19 | 谭昊玥 | 基于混合神经网络的婴儿啼哭声意图识别方法及装置 |
TWI766673B (zh) * | 2021-05-05 | 2022-06-01 | 量子音樂股份有限公司 | 嬰兒哭聲分析方法及其分析裝置 |
CN114863950B (zh) * | 2022-07-07 | 2023-04-28 | 深圳神目信息技术有限公司 | 一种基于异常检测的婴儿哭声检测、网络建立方法和系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW256910B (en) * | 1993-09-16 | 1995-09-11 | Ind Tech Res Inst | Baby crying recognizer |
US5853005A (en) * | 1996-05-02 | 1998-12-29 | The United States Of America As Represented By The Secretary Of The Army | Acoustic monitoring system |
CN2290908Y (zh) * | 1997-06-06 | 1998-09-09 | 周民智 | 婴儿啼哭原因显示器 |
EP0911741B1 (en) * | 1997-08-29 | 2009-01-14 | Sony France S.A. | System adapted to develop conditioned reflexes |
US6968294B2 (en) * | 2001-03-15 | 2005-11-22 | Koninklijke Philips Electronics N.V. | Automatic system for monitoring person requiring care and his/her caretaker |
JP3564501B2 (ja) * | 2001-03-22 | 2004-09-15 | 学校法人明治大学 | 乳幼児の音声解析システム |
CN1564245A (zh) * | 2004-04-20 | 2005-01-12 | 上海上悦通讯技术有限公司 | 婴儿哭声解读方法与装置 |
KR20070048201A (ko) * | 2004-07-23 | 2007-05-08 | 인터큐어 엘티디 | 비접촉 마이크로폰을 사용한 호흡 패턴 판별 장치 및 방법 |
US8938390B2 (en) * | 2007-01-23 | 2015-01-20 | Lena Foundation | System and method for expressive language and developmental disorder assessment |
US7725418B2 (en) * | 2005-01-28 | 2010-05-25 | Honda Motor Co., Ltd. | Responding to situations using multidimensional semantic net and Bayes inference |
CN2816980Y (zh) * | 2005-06-03 | 2006-09-13 | 王晓华 | 婴儿哭声指示器 |
CN2847456Y (zh) * | 2005-10-08 | 2006-12-13 | 陈财明 | 婴儿哭声分析器 |
US9247346B2 (en) * | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8031075B2 (en) * | 2008-10-13 | 2011-10-04 | Sandisk Il Ltd. | Wearable device for adaptively recording signals |
CN101739788A (zh) * | 2008-11-04 | 2010-06-16 | 英业达股份有限公司 | 婴儿看护装置及其方法 |
CN101807396A (zh) * | 2010-04-02 | 2010-08-18 | 陕西师范大学 | 婴儿哭闹自动记录装置及方法 |
-
2012
- 2012-05-25 TW TW101118767A patent/TWI474315B/zh not_active IP Right Cessation
-
2013
- 2013-01-17 CN CN201310017809.0A patent/CN103426438B/zh not_active Expired - Fee Related
- 2013-05-22 US US13/899,645 patent/US9009038B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI793149B (zh) * | 2017-11-20 | 2023-02-21 | 日商優你 嬌美股份有限公司 | 育兒支援程式及育兒支援方法 |
TWI747392B (zh) * | 2020-07-22 | 2021-11-21 | 國立雲林科技大學 | 嬰兒哭聲辨識修正方法及其系統 |
US11380348B2 (en) | 2020-07-22 | 2022-07-05 | National Yunlin University Of Science And Technology | Method and system for correcting infant crying identification |
Also Published As
Publication number | Publication date |
---|---|
TWI474315B (zh) | 2015-02-21 |
US20130317815A1 (en) | 2013-11-28 |
CN103426438B (zh) | 2015-12-09 |
US9009038B2 (en) | 2015-04-14 |
CN103426438A (zh) | 2013-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI474315B (zh) | Infant cries analysis method and system | |
CN110556129B (zh) | 双模态情感识别模型训练方法及双模态情感识别方法 | |
CN106251874B (zh) | 一种语音门禁和安静环境监控方法及系统 | |
JP6435257B2 (ja) | 患者音を処理するための方法および装置 | |
WO2018103028A1 (zh) | 一种音频播放装置、系统及方法 | |
CN105761720A (zh) | 一种基于语音属性分类的交互系统及其方法 | |
US9934426B2 (en) | System and method for inspecting emotion recognition capability using multisensory information, and system and method for training emotion recognition using multisensory information | |
WO2018046595A1 (en) | Classifier ensemble for detection of abnormal heart sounds | |
CA2712447A1 (en) | System and method for expressive language assessment | |
CN107609477A (zh) | 一种基于深度学习与智能手环相结合的摔倒检测方法 | |
TWI666941B (zh) | 多層次狀態偵測系統與方法 | |
WO2019171780A1 (ja) | 個人識別装置および特徴収集装置 | |
Min et al. | Vocal stereotypy detection: An initial step to understanding emotions of children with autism spectrum disorder | |
Zhou et al. | Development and evaluation of methods for assessing tone production skills in Mandarin-speaking children with cochlear implants | |
WO2017143951A1 (zh) | 一种表情反馈方法及智能机器人 | |
CN109903780A (zh) | 哭声原因模型建立方法、系统及哭声原因辨别方法 | |
Reyes-Galaviz et al. | Classification of infant crying to identify pathologies in recently born babies with ANFIS | |
EP4078616A1 (en) | A cough detection system and method | |
WO2015168274A1 (en) | System and method for expressive language, developmental disorder, and emotion assessment | |
Gowda et al. | Affective computing using speech processing for call centre applications | |
TWI747392B (zh) | 嬰兒哭聲辨識修正方法及其系統 | |
Trijatmiko et al. | Voice Classification of Children with Speech Impairment Using MFCC Kernel-Based SVM | |
WO2020259057A1 (zh) | 声音的识别方法及装置、存储介质和电子装置 | |
Liu et al. | HMM and BPNN based speech recognition system for home service robot | |
TW201442019A (zh) | 嬰兒哭鬧含意判讀模型的建立方法及使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |