TWI474315B - Infant cries analysis method and system - Google Patents

Infant cries analysis method and system Download PDF

Info

Publication number
TWI474315B
TWI474315B TW101118767A TW101118767A TWI474315B TW I474315 B TWI474315 B TW I474315B TW 101118767 A TW101118767 A TW 101118767A TW 101118767 A TW101118767 A TW 101118767A TW I474315 B TWI474315 B TW I474315B
Authority
TW
Taiwan
Prior art keywords
category
baby
crying
time
frequency
Prior art date
Application number
TW101118767A
Other languages
English (en)
Other versions
TW201349224A (zh
Original Assignee
Univ Nat Taiwan Normal
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Taiwan Normal filed Critical Univ Nat Taiwan Normal
Priority to TW101118767A priority Critical patent/TWI474315B/zh
Priority to CN201310017809.0A priority patent/CN103426438B/zh
Priority to US13/899,645 priority patent/US9009038B2/en
Publication of TW201349224A publication Critical patent/TW201349224A/zh
Application granted granted Critical
Publication of TWI474315B publication Critical patent/TWI474315B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

嬰兒哭聲分析方法及系統
本發明是有關於一種語音分析方法,特別是指一種兼具快速分析及精確辨識的嬰兒哭聲分析方法。
已知US5668780專利的「Baby cry recognizer」使用零交點(zero crossing)方法分類,藉由脈衝訊號來取樣聲音,由取樣出的強弱訊號之間的關係,和零點相比得到的交錯次數,即所謂的哭聲週期頻率,來判斷哭聲是否正常,是較簡便的方法,但僅能辨識出的嬰兒哭聲的週期頻率,無法進一步提供父母其他相關的資訊,例如嬰兒哭聲的原因為何。
另有US6496115專利的「System and method for analyzing baby cries」使用頻譜分析法分類,利用透過傅立葉轉換將聲音做頻率的組成訊號分析,在頻譜上去找出每個頻率的大小組成,對照在不同哭聲原因下可能的頻率分佈,此方法雖然較為精確的判斷出哭聲的可能原因,但此系統無法提供適用於不同嬰兒,亦無法由使用者對於系統進行修正其類別。
本發明之目的,即在提供一種兼具快速分析及精確辨識的嬰兒哭聲分析方法及系統。
於是,本發明的嬰兒哭聲分析方法是對於嬰兒哭聲的一數位音頻信號進行辨識,該方法包含下列步驟:將該數位音頻信號以頻譜轉換法產生一頻譜資料;依據該頻譜資料的頻 率範圍分類為一正常模式或一異常模式;若為正常模式,提供一預先建立的時頻特徵-需求類別的對照表,藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別;若為「異常模式」,提供一訓練完成的時頻特徵-特殊需求類別的類神經分類器,並輸入該數位音頻信號的頻率特徵至該類神經分類器以輸出其對應的特殊需求類別。
較佳的,本發明的嬰兒哭聲分析方法還包括下述步驟:提供初步辨識出的需求類別,若嬰兒仍持續哭泣一段時間,對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
較佳的,本發明的嬰兒哭聲分析方法中,相關參數的調整設定是在該關聯資料庫排除或新增特殊需求類別,再重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
本發明的嬰兒哭聲分析系統包含一頻譜分析單元、一初始分類器、一判別單元,及一類神經分類器。
該頻譜分析單元將該數位音頻信號以頻譜轉換法產生一頻譜資料;該初始分類器依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」;該判別單元配合一基本分類資料庫,該基本分類資料庫建立有一時頻特徵-需求類別的對照表,若該初始分類器分類為該「正常模式」時,藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別;該類神經分類器配合一時頻特徵資料庫及一關聯資料庫,且具有一訓練完成的時頻特徵-特殊需求類別的 類神經分類程式,若該初始分類器分類為該「異常模式」時,輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。
較佳的,本發明的嬰兒哭聲分析系統還包括一輸入單元及一修正單元,該輸入單元用以輸入控制指令;該修正單元用以於提供初步辨識出的需求類別後,若嬰兒仍持續哭泣一段時間,依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
較佳的,該輸入單元是在該關聯資料庫排除或新增特殊需求類別,該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類器以輸出其對應的特殊需求類別。
本發明的嬰兒哭聲分析方法之功效在於:利用初始分類區分出「正常模式」或「異常模式」,並依據「正常模式」的哭聲以基本需求分類,且依據「異常模式」的哭聲搭配類神經辨識,由於一般哭聲多數於「正常模式」而可快速辨識出來,異常哭聲較少發生,但是需要較精確的檢測,因此兼具快速分析及精確辨識的優點。
有關本發明之前述及其他技術內容、特點與功效,在以下配合參考圖式之較佳實施例的詳細說明中,將可清楚的呈現。
參閱圖1,本發明之較佳實施例是應用於一具有錄音功能的電子裝置100,電子裝置100包括一麥克風11、一類比 數位轉換器12、一記錄單元13、一嬰兒哭聲分析系統1及一輸出單元4,各元件功能分別介紹如下。
麥克風11是接收嬰兒哭泣聲的類比信號;類比數位轉換器12是將類比信號數位化成數位音頻信號資料;記錄單元13是儲存經過類比數位轉換器12轉換後的數位音頻信號資料;嬰兒哭聲分析系統1可利用數位音頻信號資料辨識出不同的需求類別;輸出單元4是一發光裝置、一影像播放器或一語音播放器,可將嬰兒哭聲分析系統1辨識出的需求類別以不同顏色的燈光、不同需求的警示影像,或不同語音提示的警示聲音的方式輸出,藉此達到提醒的效果。
嬰兒哭聲分析系統1包含一頻譜分析單元14、一初始分類器15、一判別單元16、一基本分類資料庫161、一特徵擷取單元21、一時頻特徵資料庫22、一類神經分類器23及一關聯資料庫24;較佳的,嬰兒哭聲分析系統1還包括一輸入單元31及一修正單元32,藉此補強嬰兒哭聲分析系統1的辨識功能。各元件功能如下。
頻譜分析單元14是將類比數位轉換器12轉換後的數位音頻信號以頻譜轉換法產生一頻譜資料,頻譜轉換法可以是快速傅立葉轉換,藉此得到數位音頻信號的頻率分佈範圍。
初始分類器15依據該頻譜資料的頻率範圍分類為一「正常模式」或一「異常模式」,本實施例是以高頻或低頻進行區別,例如:未超出10kHz為「正常模式」,超出10kHz為「異常模式」,辨別「正常模式」的哭聲可以馬上滿足寶寶的需求,讓新手父母不會手忙腳亂;判斷「異常模式」的 哭聲可以在寶寶有輕微生病並且感覺到不適時及早發現及早治療,避免寶寶有嚴重病症的危險,因為若非正常哭聲,顯示嬰兒可能潛在的身體健康問題,或是更深的心理因素需要進一步探討。因此,若初始分類器15分類為「正常模式」則觸發判別單元16動作,若初始分類器15分類為「異常模式」則觸發類神經分類器23動作。
茲將判別單元16及類神經分類器23的主要動作原理分別說明如下。
判別單元16配合一基本分類資料庫161運作,該基本分類資料庫161建立有一時頻特徵(time-frequency characteristics)-需求類別的對照表,本實施例使用的”時頻特徵”是代表各類別信號經過時頻分析(Time-frequency analysis)後,在時頻平面(time-frequency plane)的各種圖形。
於該「正常模式」時,判別單元16可藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別。
在本實施例是歸類一般小嬰兒的基本需求大致都有下面五大類共同的哭聲類別。
一、飢餓-類似ㄋㄚ、ㄋㄚ、ㄋㄚ的聲音。
二、想睡覺(累了)-類似ㄛ、ㄛ、ㄛ的聲音。
三、不舒服(泛指姿勢不舒服、尿布濕等等原因)-類似ㄏㄟ、ㄏㄟ、ㄏㄟ的聲音。
四、肚子脹氣了-類似ㄟ一、ㄟ一、ㄟ一的聲音。
五、想打嗝了-類似ㄟ、ㄟ、ㄟ的聲音。
因此,判別單元16可將前述基本需求類別以例如赫伯特-黃變換法(Hilbert-Huang Transformation,簡稱HHT),運算技術可參考美國第6,862,558號專利,其轉換出的特徵影像的優點是包括訊號之頻率、時間、以及能量分佈之情形,特徵影像的x軸代表時間,y軸代表頻率,以不同顏色及深淺代表能量大小(例如:越紅代表能量越強),然後,再利用基本分類資料庫161內建的對照表內建的時頻特徵的影像模板加以比對出對應的基本需求類別。
類神經分類器23具有一訓練完成的時頻特徵-特殊需求類別的關聯程式(圖未示),且配合時頻特徵資料庫22已記錄的時頻特徵及關聯資料庫24運作,關聯程式的核心技術採用的是人工類神經網路(Artificial neural network)進行聲音辨識。
人工類神經網路,顧名思義即為模仿人類腦部神經元連結方式之決策系統;人類平時會將學習到的資訊儲存於腦部神經元當中,而在進行思考決策時便會自動將各神經元進行連結,藉由儲存其中之資料進行判斷。
人工類神經網路系統共分三個部分,分別是神經元、層、網路。神經元是此網路的基本組成單位,負責將收到的訊號進行加權處理後送到下一個神經元節點。層級是由數量不等之神經元組成的集合,按照功能性分為輸入層、隱藏層、輸出層等。而網路即為各層之間的組合,類神經網路中各神經元的加權值可視為儲存的資訊。其學習方法即為利用已知輸入與輸出值進行神經元加權值之調整,因此人工類神 經網路需要已知的輸入與輸出樣本關係進行訓練。
本實施例在訓練階段是由三百組已知的嬰兒哭聲當作訓練樣本,且已由專業保母判斷得知對應的特殊需求類別,並將各時頻特徵與對應的各需求類別之關聯組成關聯資料庫24,由此關聯資料庫24對人工類神經網路系統進行訓練,以倒傳遞演算法(Back Propagation)進行各神經元加權值之調整。
完成前述訓練的時頻特徵-特殊需求類別的關聯程式後就可應用在實際狀況;於初始分類器15判別出「異常模式」後,觸發類神經分類器23數位音頻信號,利用時頻特徵資料庫22已記錄的異常哭聲的時頻特徵輸入至類神經分類器23內建的關聯程式就可自動辨識出特殊需求類別。
此外,嬰兒哭聲分析系統1還包括回饋修正機制,當使用者利用此系統辨認寶寶的需求之後,滿足需求完畢要觀察寶寶的哭聲是否就此停止,若無停止跡象,便需要剔除先前的需求重新進行類神經網路的計算,重複此步驟直到哭聲停止為止,並且,進行特殊需求類別的神經元權重值之更新,因此本系統可隨著使用者的不同與使用時間的長短而有個人化的趨勢,因此,可比傳統辨識系統較能適應不同嬰兒間哭聲的微妙變化。
本實施例中,使用者可利用輸入單元31輸入一控制指令至修正單元32,修正單元32依據輸入單元31輸入之控制指令對於未辨識出的嬰兒哭聲的時頻特徵-特殊需求類別的相關參數進行修正,並以辨識出嬰兒不再哭泣的需求類別 作為完成修正的依據。例如:輸入剔除先前的特殊需求類別的控制指令,使得類神經分類器23重新輸入數位音頻信號的時頻特徵,然後以重新訓練的類神經網路辨識出其對應的特殊需求類別。
參閱圖2,並配合圖1,本發明的嬰兒哭聲分析方法之較佳實施例中,輸入嬰兒哭聲(步驟201)至麥克風11;然後,類比數位轉換器12將嬰兒哭聲類比數位轉換為一數位音頻信號(步驟202),並儲存於記錄單元13,同時,特徵擷取單元21會轉換出時頻特徵,並將時頻特徵儲存於時頻特徵資料庫22備用;接著,頻譜分析單元14將該數位音頻信號轉換出一頻譜資料(步驟203);初始分類器15再依據該頻譜資料的頻率範圍的低高分類(步驟204),主要是區分出「正常模式」及「異常模式」。
若為「正常模式」,令判別單元16藉由對照表關聯出該時頻特徵對應的基本需求類別(步驟205),其對照表即存於基本分類資料庫161中,然後,輸出單元4輸出基本需求類別(步驟206);若為「異常模式」,則由時頻特徵資料庫22輸入時頻特徵至類神經分類器23(步驟207);類神經分類器23辨識後,即由輸出單元4輸出辨識出的特殊需求類別(步驟208)。
接著,使用者觀察或依系統設定判斷嬰兒仍持續哭泣一段時間(步驟209)?若是,則代表初步辨識出來的是不合適的類別,就需要利用輸入單元31輸入控制指令予修正單元32,修正單元32再對於類神經分類器23的時頻特徵-特殊 需求類別的相關參數進行修正(步驟210),本實施例中是對於關聯資料庫24的初步辨識出來的類別剔除後再重新辨識,直到嬰兒停止哭泣為止,或者,也可依據使用者的判斷(如:嬰兒發燒給予退燒後停止哭泣)而新增類別(如:發燒)至關聯資料庫24。
綜上所述,本發明的嬰兒哭聲分析方法及系統之功效在於:利用初始分類區分出「正常模式」或「異常模式」,並依據「正常模式」的哭聲以基本需求分類,且依據「異常模式」的哭聲搭配類神經辨識,由於一般哭聲多數於「正常模式」而可快速辨識出來,異常哭聲較少發生,但是需要較精確的檢測,因此兼具快速分析及精確辨識的優點,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
100‧‧‧電子裝置
1‧‧‧嬰兒哭聲分析系統
11‧‧‧麥克風
12‧‧‧類比數位轉換器
13‧‧‧記錄單元
14‧‧‧頻譜分析單元
15‧‧‧初始分類器
16‧‧‧判別單元
161‧‧‧基本分類資料庫
21‧‧‧特徵擷取單元
22‧‧‧時頻特徵資料庫
23‧‧‧類神經分類器
24‧‧‧關聯資料庫
31‧‧‧輸入單元
32‧‧‧修正單元
4‧‧‧輸出單元
201-210‧‧‧步驟
圖1是一系統方塊圖,說明本發明的嬰兒哭聲分析系統之較佳實施例;及圖2是一流程圖,說明本發明的嬰兒哭聲分析方法之較佳實施例。
201-210‧‧‧步驟

Claims (6)

  1. 一種嬰兒哭聲分析方法,用以對於嬰兒哭聲的一數位音頻信號進行辨識,該方法包含下列步驟:(a)將該數位音頻信號以頻譜轉換法產生一頻譜資料;(b)依據該頻譜資料的頻率範圍分類為一屬於小嬰兒的基本需求哭聲頻率範圍的正常模式或一非屬於小嬰兒的基本需求哭聲頻率範圍的異常模式;(c)若為正常模式,提供一預先建立的時頻特徵-需求類別的對照表,藉此關聯出該數位音頻信號的時頻特徵對應的基本需求類別;及(d)若為異常模式,提供一經由倒傳遞演算法訓練完成的時頻特徵-特殊需求類別的類神經分類程式,該倒傳遞演算法是設定數個特殊需求類別,訓練時根據多組已知特殊需求類別的嬰兒哭聲及加權權重值運算的輸出結果之間的差異調整權重,藉此建立時頻特徵-特殊需求類別的類神經分類程式,並輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。
  2. 依據申請專利範圍第1項所述之嬰兒哭聲分析方法,還包括下述步驟:(e)提供初步辨識出的需求類別,若嬰兒仍持續哭泣一段時間,對於對應的時頻特徵-特殊需求類別的權重值進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
  3. 依據申請專利範圍第2項所述之嬰兒哭聲分析方法,其 中,步驟(e)的相關參數的調整設定是排除或新增特殊需求類別之權重關聯,再重新輸入該數位音頻信號的頻率特徵與時頻特徵至該類神經分類程式進行特殊需求類別的神經元權重值之更新以輸出其對應的特殊需求類別。
  4. 一種嬰兒哭聲分析系統,包含:一頻譜分析單元,將該數位音頻信號以頻譜轉換法產生一頻譜資料;一初始分類器,依據該頻譜資料的頻率範圍分類為一屬於小嬰兒的基本需求哭聲頻率範圍的正常模式或一非屬於小嬰兒的基本需求哭聲頻率範圍的異常模式;一判別單元,配合一基本分類資料庫,該基本分類資料庫建立有一時頻特徵-需求類別的對照表,若該初始分類器分類為該正常模式時,藉由該對照表關聯出該數位音頻信號的時頻特徵對應的基本需求類別;及一類神經分類器,具有一經由倒傳遞演算法訓練完成的時頻特徵-特殊需求類別的類神經分類程式,該倒傳遞演算法是設定數個特殊需求類別,訓練時根據多組已知特殊需求類別的嬰兒哭聲及加權權重值運算的輸出結果之間的差異調整權重,藉此建立時頻特徵-特殊需求類別的類神經分類程式,若該初始分類器分類為該異常模式時,輸入該數位音頻信號的時頻特徵至該類神經分類程式以輸出其對應的特殊需求類別。
  5. 依據申請專利範圍第4項所述之嬰兒哭聲分析系統,還包括一輸入單元及一修正單元,該輸入單元輸入一控制指 令;該修正單元於提供初步辨識出的需求類別後,若嬰兒仍持續哭泣一段時間,依據該輸入單元輸入之控制指令對於對應的時頻特徵-特殊需求類別的神經元權重值進行修正,並以辨識出嬰兒不再哭泣的需求類別作為完成修正的依據。
  6. 依據申請專利範圍第5項所述之嬰兒哭聲分析系統,其中,該輸入單元是排除或新增特殊需求類別之權重關聯,該修正單元是重新輸入該數位音頻信號的時頻特徵至該類神經分類程式進行特殊需求類別的神經元權重值之更新以輸出其對應的特殊需求類別。
TW101118767A 2012-05-25 2012-05-25 Infant cries analysis method and system TWI474315B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW101118767A TWI474315B (zh) 2012-05-25 2012-05-25 Infant cries analysis method and system
CN201310017809.0A CN103426438B (zh) 2012-05-25 2013-01-17 婴儿哭声分析方法及系统
US13/899,645 US9009038B2 (en) 2012-05-25 2013-05-22 Method and system for analyzing digital sound audio signal associated with baby cry

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101118767A TWI474315B (zh) 2012-05-25 2012-05-25 Infant cries analysis method and system

Publications (2)

Publication Number Publication Date
TW201349224A TW201349224A (zh) 2013-12-01
TWI474315B true TWI474315B (zh) 2015-02-21

Family

ID=49622270

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101118767A TWI474315B (zh) 2012-05-25 2012-05-25 Infant cries analysis method and system

Country Status (3)

Country Link
US (1) US9009038B2 (zh)
CN (1) CN103426438B (zh)
TW (1) TWI474315B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI687920B (zh) * 2019-05-10 2020-03-11 佑華微電子股份有限公司 嬰兒哭聲偵測方法
TWI766673B (zh) * 2021-05-05 2022-06-01 量子音樂股份有限公司 嬰兒哭聲分析方法及其分析裝置

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9240188B2 (en) 2004-09-16 2016-01-19 Lena Foundation System and method for expressive language, developmental disorder, and emotion assessment
KR101427993B1 (ko) * 2012-12-17 2014-08-08 포항공과대학교 산학협력단 오디오 신호의 햅틱 신호 변환 방법 및 이를 수행하는 장치
JP6337752B2 (ja) * 2014-11-27 2018-06-06 株式会社Jvcケンウッド 乳幼児泣き声検出装置
CN105719663A (zh) * 2014-12-23 2016-06-29 郑载孝 婴儿哭声分析方法
CN105118518B (zh) * 2015-07-15 2019-05-10 百度在线网络技术(北京)有限公司 一种声音的语义分析方法及装置
JP6604113B2 (ja) * 2015-09-24 2019-11-13 富士通株式会社 飲食行動検出装置、飲食行動検出方法及び飲食行動検出用コンピュータプログラム
US9899035B2 (en) * 2015-11-04 2018-02-20 Ioannis Kakadiaris Systems for and methods of intelligent acoustic monitoring
CN105513610A (zh) * 2015-11-23 2016-04-20 南京工程学院 一种声音分析方法及装置
CN105898219B (zh) * 2016-04-22 2019-05-21 北京小米移动软件有限公司 对象监控方法及装置
GB2552067A (en) 2016-05-24 2018-01-10 Graco Children's Products Inc Systems and methods for autonomously soothing babies
CN106157945A (zh) * 2016-05-27 2016-11-23 辽东学院 一种篮球裁判员训练哨子
CN107657963A (zh) * 2016-07-25 2018-02-02 韦创科技有限公司 哭声辨识系统与哭声辨识方法
CN106373593A (zh) * 2016-08-22 2017-02-01 衣佳鑫 基于音频检测婴儿吃奶次数方法及系统
US9886954B1 (en) * 2016-09-30 2018-02-06 Doppler Labs, Inc. Context aware hearing optimization engine
WO2018187664A1 (en) * 2017-04-06 2018-10-11 Brown University Improved diagnostic instrument and methods
CN107705786A (zh) * 2017-09-27 2018-02-16 努比亚技术有限公司 一种语音处理方法、装置及计算机可读存储介质
TW201918219A (zh) * 2017-11-07 2019-05-16 財團法人資訊工業策進會 辨識嬰兒需求的系統及方法
JP7246851B2 (ja) * 2017-11-20 2023-03-28 ユニ・チャーム株式会社 プログラム、育児支援方法、及び、育児支援システム
US10529357B2 (en) * 2017-12-07 2020-01-07 Lena Foundation Systems and methods for automatic determination of infant cry and discrimination of cry from fussiness
CN109065034B (zh) * 2018-09-25 2023-09-08 河南理工大学 一种基于声音特征识别的婴儿哭声翻译方法
CN109065074A (zh) * 2018-09-25 2018-12-21 河南理工大学 一种婴儿语音声音翻译器
CN111276159A (zh) * 2018-12-05 2020-06-12 阿里健康信息技术有限公司 一种婴儿发音分析方法及服务器
CN110070893A (zh) * 2019-03-25 2019-07-30 成都品果科技有限公司 一种利用婴儿哭声进行情感分析的系统、方法和装置
CN111862991A (zh) * 2019-04-30 2020-10-30 杭州海康威视数字技术股份有限公司 一种婴儿哭声的识别方法及系统
CN110243603B (zh) * 2019-05-30 2020-11-24 沈阳化工大学 基于Welch转换-径向基神经网的滚动轴承故障诊断方法
CN111261173A (zh) * 2020-01-10 2020-06-09 珠海格力电器股份有限公司 一种电器控制方法、装置、存储介质及电器
CN113270115B (zh) * 2020-02-17 2023-04-11 广东美的制冷设备有限公司 婴儿监护设备及其婴儿监护方法、控制装置和存储介质
CN113658596A (zh) * 2020-04-29 2021-11-16 扬智科技股份有限公司 语意辨识方法与语意辨识装置
EP3940698A1 (en) 2020-07-13 2022-01-19 Zoundream AG A computer-implemented method of providing data for an automated baby cry assessment
TWI747392B (zh) 2020-07-22 2021-11-21 國立雲林科技大學 嬰兒哭聲辨識修正方法及其系統
US11670322B2 (en) * 2020-07-29 2023-06-06 Distributed Creation Inc. Method and system for learning and using latent-space representations of audio signals for audio content-based retrieval
CN112382311B (zh) * 2020-11-16 2022-08-19 谭昊玥 基于混合神经网络的婴儿啼哭声意图识别方法及装置
CN114863950B (zh) * 2022-07-07 2023-04-28 深圳神目信息技术有限公司 一种基于异常检测的婴儿哭声检测、网络建立方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW256910B (en) * 1993-09-16 1995-09-11 Ind Tech Res Inst Baby crying recognizer
US5853005A (en) * 1996-05-02 1998-12-29 The United States Of America As Represented By The Secretary Of The Army Acoustic monitoring system
US6490570B1 (en) * 1997-08-29 2002-12-03 Sony Corporation Hardware or software architecture adapted to develop conditioned reflexes
US6496115B2 (en) * 2001-03-22 2002-12-17 Meiji University Legal Person System and method for analyzing baby cries
US7725418B2 (en) * 2005-01-28 2010-05-25 Honda Motor Co., Ltd. Responding to situations using multidimensional semantic net and Bayes inference
CN101739788A (zh) * 2008-11-04 2010-06-16 英业达股份有限公司 婴儿看护装置及其方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2290908Y (zh) * 1997-06-06 1998-09-09 周民智 婴儿啼哭原因显示器
US6968294B2 (en) * 2001-03-15 2005-11-22 Koninklijke Philips Electronics N.V. Automatic system for monitoring person requiring care and his/her caretaker
CN1564245A (zh) * 2004-04-20 2005-01-12 上海上悦通讯技术有限公司 婴儿哭声解读方法与装置
EP1804649A4 (en) * 2004-07-23 2009-01-28 Intercure Ltd APPARATUS AND METHOD FOR DETERMINING A BREATHING MODEL USING A CONTACTLESS MICROPHONE
US8938390B2 (en) * 2007-01-23 2015-01-20 Lena Foundation System and method for expressive language and developmental disorder assessment
CN2816980Y (zh) * 2005-06-03 2006-09-13 王晓华 婴儿哭声指示器
CN2847456Y (zh) * 2005-10-08 2006-12-13 陈财明 婴儿哭声分析器
US9247346B2 (en) * 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8031075B2 (en) * 2008-10-13 2011-10-04 Sandisk Il Ltd. Wearable device for adaptively recording signals
CN101807396A (zh) * 2010-04-02 2010-08-18 陕西师范大学 婴儿哭闹自动记录装置及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW256910B (en) * 1993-09-16 1995-09-11 Ind Tech Res Inst Baby crying recognizer
US5853005A (en) * 1996-05-02 1998-12-29 The United States Of America As Represented By The Secretary Of The Army Acoustic monitoring system
US6490570B1 (en) * 1997-08-29 2002-12-03 Sony Corporation Hardware or software architecture adapted to develop conditioned reflexes
US6496115B2 (en) * 2001-03-22 2002-12-17 Meiji University Legal Person System and method for analyzing baby cries
US7725418B2 (en) * 2005-01-28 2010-05-25 Honda Motor Co., Ltd. Responding to situations using multidimensional semantic net and Bayes inference
CN101739788A (zh) * 2008-11-04 2010-06-16 英业达股份有限公司 婴儿看护装置及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI687920B (zh) * 2019-05-10 2020-03-11 佑華微電子股份有限公司 嬰兒哭聲偵測方法
TWI766673B (zh) * 2021-05-05 2022-06-01 量子音樂股份有限公司 嬰兒哭聲分析方法及其分析裝置

Also Published As

Publication number Publication date
US20130317815A1 (en) 2013-11-28
TW201349224A (zh) 2013-12-01
US9009038B2 (en) 2015-04-14
CN103426438B (zh) 2015-12-09
CN103426438A (zh) 2013-12-04

Similar Documents

Publication Publication Date Title
TWI474315B (zh) Infant cries analysis method and system
CN110556129B (zh) 双模态情感识别模型训练方法及双模态情感识别方法
CN106251874B (zh) 一种语音门禁和安静环境监控方法及系统
US20200152330A1 (en) Scalable Personalized Treatment Recommendation
JP6435257B2 (ja) 患者音を処理するための方法および装置
Doukas et al. Emergency fall incidents detection in assisted living environments utilizing motion, sound, and visual perceptual components
WO2018103028A1 (zh) 一种音频播放装置、系统及方法
CN105739688A (zh) 一种基于情感体系的人机交互方法、装置和交互系统
CN105761720A (zh) 一种基于语音属性分类的交互系统及其方法
WO2018046595A1 (en) Classifier ensemble for detection of abnormal heart sounds
US9934426B2 (en) System and method for inspecting emotion recognition capability using multisensory information, and system and method for training emotion recognition using multisensory information
CN107609477A (zh) 一种基于深度学习与智能手环相结合的摔倒检测方法
Swarnkar et al. Automatic picking of snore events from overnight breath sound recordings
TWI666941B (zh) 多層次狀態偵測系統與方法
Min et al. Vocal stereotypy detection: An initial step to understanding emotions of children with autism spectrum disorder
Zhou et al. Development and evaluation of methods for assessing tone production skills in Mandarin-speaking children with cochlear implants
Chen et al. Cough detection using selected informative features from audio signals
Bernstein et al. Using deep learning for alcohol consumption recognition
WO2019171780A1 (ja) 個人識別装置および特徴収集装置
US20220409089A1 (en) A cough detection system and method
CN109903780A (zh) 哭声原因模型建立方法、系统及哭声原因辨别方法
Huang et al. An autonomous developmental cognitive architecture based on incremental associative neural network with dynamic audiovisual fusion
TWI747392B (zh) 嬰兒哭聲辨識修正方法及其系統
Cohen-McFarlane et al. Evaluation of respiratory sounds using image-based approaches for health measurement applications
WO2020259057A1 (zh) 声音的识别方法及装置、存储介质和电子装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees