JP4931927B2 - マイクロコントローラーを利用した信号認識法 - Google Patents

マイクロコントローラーを利用した信号認識法 Download PDF

Info

Publication number
JP4931927B2
JP4931927B2 JP2008529649A JP2008529649A JP4931927B2 JP 4931927 B2 JP4931927 B2 JP 4931927B2 JP 2008529649 A JP2008529649 A JP 2008529649A JP 2008529649 A JP2008529649 A JP 2008529649A JP 4931927 B2 JP4931927 B2 JP 4931927B2
Authority
JP
Japan
Prior art keywords
signal
acoustic signal
microcontroller
envelope
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008529649A
Other languages
English (en)
Other versions
JP2009507260A (ja
JP2009507260A5 (ja
Inventor
バズクイズ,ジュオン ペドゥロ バレラ
カスタニー,ルイス ゴンザガ メカ
フラナ,ガブリエル ポンス
Original Assignee
バイループ テクノロジック,エス.エル.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイループ テクノロジック,エス.エル. filed Critical バイループ テクノロジック,エス.エル.
Publication of JP2009507260A publication Critical patent/JP2009507260A/ja
Publication of JP2009507260A5 publication Critical patent/JP2009507260A5/ja
Application granted granted Critical
Publication of JP4931927B2 publication Critical patent/JP4931927B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measurement Of Current Or Voltage (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Lock And Its Accessories (AREA)
  • Feedback Control In General (AREA)

Description

本発明は低計算性能マイクロコントローラーを利用した波形認識法に関する。
信号が時間的に限定され、周期的であれば、例えば異なるタイプの乳児の泣声、機械音その他の音同士間の相違を認識する等、本発明は非常に広範な利用性を有している。
現在、デジタル信号プロセッサー(DSP)として知られる電子装置を使用して波形を認識する方法が知られている。
この種の電子装置は高性能ではあるものの高価であるのが難点である。そのような高性能はファーストフーリエ変換(FFT)による伝統的な信号分析の実行には必要である。
この方法(FFT利用)は時間フィールドから周波数フィールドへ信号を変換し、周波数範囲で信号を分析及び処理する。
音楽領域及び音声領域である音響信号の処理分野では様々な利用法が存在するが、それらは全てデジタル信号プロセッサー(DSP)等を利用するものである。
この種の電子装置は高価であるため、コストが特定装置の存続性判断のための主要考察要素である個人用電子機器分野の装置では利用が限定的である。
本発明は、前記背景技術の問題に鑑みてなされたもので、その目的は、廉価マイクロコントローラーを使用して実行できる波形認識法を提供することにある。その結果、以前には無視されていた全個人用電子装置に本発明を利用することができるようになった。
この方法では分析対象信号が時間的に限定され、反復性であることが必要である。この種の信号の例には、例えば、乳児の泣声、犬の吼声並びに機械音があり、本発明は一般的に人間、動物または物体から発する全反復音を対象とする。
この方法のユニークな点は、周波数フィールドでの信号分析には利用されず、時間フィールドでの信号分析に利用されることである。この違いのみでもファーストフーリエ変換の必要性を省略でき、デジタル信号プロセッサーの使用を省略できる。
本発明の方法は分析対象の信号と比較するためのメモリ内に記憶するパターンの利用を省略する。その代わりに識別プロセスはファジー論理アルゴリズムにより実行される。
このアルゴリズムの利用によって、従来なら対象パターンに合致しないとして無視されるような入力信号内の振幅変動の一部が吸収される。いずれにしろ、分析対象の信号は非常に厳密な動的精度を有さねばならず、分析対象信号の振幅の自動制御は必須である。
本発明の信号分析法はアナログ/デジタルコンバータを使用した廉価マイクロコントローラーの利用に基づいている。
サンプリングは周期的信号の開始が検出されたときに開始する。
このコンバータは信号エンベロープ振幅値の規則的間隔にて一連のサンプル採取をさせる。信号の直接的サンプルは採取されないが、そのエンベロープの波形は前もって入手される。
分析対象信号は類似するが分析が容易である別信号に変換されるため、この相違は計算性能に関する高度な要求をせずに装置を使用させるためには必須である。
信号が反復的であるという事実により、信号の一の反復周期中にのみエンベロープからサンプルは採取される。最初の結果は信号速度の減速である。これは低計算性能マイクロコントローラーの使用を可能にする。
次に、周囲音に関係する高周波数の自動フィルタリングが実行されるため、この方法は旧来の方法と較べれば大きな周囲音抵抗を有する。
続いて、信号の瞬間的周波数に関する情報の必要性が排除される。これで本発明の方法は周波数とは無関係となる。
分析対象信号の低周波数はナイキスト周波数の下限よりもずっと多い数のサンプル採取を可能にする。
ナイキスト周波数の2倍であるサンプル数が冗長比較法を利用するために採取される。
このような分析対象信号の過剰サンプル採取は2つのサンプル配列で分析を反復的に実行させる。
このような分析の反復により、分析されたサンプル配列に従って得られた結果が比較され、異なる有効性アルゴリズムが適用されて最終結果の信頼性が高められる。
一方、連続的サンプルシリーズで得られた結果の冗長性は、パルス型の音によって影響を受けている結果を無視させることができる。
携帯装置にて本方法が利用される場合には電池の消耗で引き起こされるサンプルへの影響を考慮しなければならない。
分析対象の波形は波形の時間パラメータのマトリックスに基づいて特徴付けられる。
マイクロプロセッサーは、採取され、検証され、誤差が補整されたサンプルに基づいて一連の計算を実行し、以下のパラメータを入手する。
1.平均値
2.二乗平均平方根値
3.作業周期
4.一次導関数
5.二次導関数
6.最大値
7.最小値
信号が基準信号のセットに属するか否かを決定するために、信号から入手される要素と異なる基準マトリックスの要素が比較される。
基準グループへ所定マトリックスの属性を提供するため、後者は所定インデックスを超えるマトリックスの全要素間の相関性を示さなければならない。
このインデックスの値は他の基準マトリックスとの関連で計算される。インデックスが予め設定された値を有していないため、外見類似性の非常に異なる値を有するがマトリックスのいくつかの要素において互いに高度の類似性を有する波形を受け入れることができる。
例えば、平均値は基準値とは全く異なるが、残りの要素の値が高い相関性を有している場合には識別できる。
この方法により、信号の平均値の減少を、携帯装置の電池の消耗の結果であるとして自動的に補整できる。
それぞれの分析対象信号のために非常に少数(本件の場合7個)の値だけが使用される。換言すれば、マイクロプロセッサーのRAMの非常に少ない記録が使用されることは本発明の特徴である。
サンプルについては、マイクロコントローラーの内部RAMメモリによって許容される最大数(本件の場合64)、よってメモリ容量に関する要求度は非常に低い。
必要とされる計算性能に関しては、最も単純なマイクロコントローラーに組み込まれた基本の計算操作を実施する必要があるだけである。(本件の場合は8ビットレコードの足し算と引き算であって、掛け算または割り算は必要ではない)。
従って、マイクロプロセッサーの計算性能に関する要求度は非常に低い。
必要とされる低い計算性能及び少量のRAMメモリによって、市場において最小で最も安価なマイクロコントローラーを利用できる。
全プロセスに必要な時間は数十分の1秒以下である。従って、ユーザの視点から見れば分析は瞬間的である。
本発明の特徴をより明確にするため、図面について説明する。図1は信号処理に利用される装置を示している。図2はエンベロープの入手ステップとそのデジタル化ステップを示している。
本明細書で説明する方法は、乳児の泣声を分析するマイクロコントローラー内で実行された。マイクロコントローラーを含む装置は、乳児を世話する人物用として携帯式に設計されている。
装置は、乳児の口から20cmから1mの距離に配置される。
距離限界値は自動レベル制御を実行するブロック装置の性能による。音声の採取は、採取信号のレベルを増幅させる前置アンプ(2)に接続されたマイクロフォン(1)で実行される。必要な信号(12)は、自動レベル制御ブロック装置(3)が最適な信号をエンベロープ検出器(4)へ供給できるように提供される。信号エンベロープ(13)を入手すると、信号の瞬間値(14)のサンプルを入手するアナログ/デジタルコンバータ(5)が適用される。その後、入手した値は、基準マトリックス(15)内に記憶された値とマイクロプロセッサー(6)内で比較される。所定の基準グループへの信号の属性が識別されると、その情報が液晶ディスプレイ(7)に表示される。どのグループについても属性が識別されない場合は、識別エラーメッセージが表示される。
補完的機能として、それぞれの識別状況に適したアドバイスが記録されたメモリ(8)を利用することができる。
信号識別プロセスはユーザ制御ボタン(9)を手段として何時でも再開できる。別の2つのボタンを使用することで、ディスプレーに表示された異なるアドバイス間で進行(10)または後戻り(11)が可能である。
図1は信号処理に利用される装置を示している。 図2はエンベロープの入手ステップとそのデジタル化ステップを示している。
符号の説明
13 エンベロープ
14 瞬間値
15 基準マトリックス

Claims (6)

  1. マイクロコントローラーを利用した、人間、動物、または物体が発する反復性の音響信号を認識する方法であって、
    音響信号(12)を採取するステップと、
    前記音響信号(12)の振幅の時間領域エンベロープ(13)を入手するステップと、
    前記音響信号(12)の一の周期において前記エンベロープ(13)から音響信号(12)の瞬間値(14)のサンプルを採取するステップと、
    前記取得したサンプルに基づいて複数の時間パラメータを入手するステップと、
    前記複数の時間パラメータからなるマトリックスと、複数の種々の基準マトリックス(15)とを比較することで、前記複数の時間パラメータからなるマトリックスの、前記複数の種々の基準マトリックス(15)のうちの1つへの属性を識別することができることを特徴とする方法。
  2. 前記複数の時間パラメータは、信号の平均値、二乗平均平方根値、最大値及び最小値を含んでいることを特徴とする請求項1記載の方法。
  3. 自動調節手段を利用することで、前記信号の平均値の減少を補正することを特徴とする請求項2記載の方法。
  4. 前記マイクロコントローラーは、低メモリ容量のマイクロコントローラーであることを特徴とする請求項1記載の方法。
  5. 前記音響信号(12)を採取するステップに続いて、前記音響信号(12)から入手された前記エンベロープ(13)が、前記音響信号(12)の採取距離とは無関係となるよう入力信号の自動レベル制御装置(3)を利用することを特徴とする請求項1記載の方法。
  6. 結果をリアルタイムで表示するため、単純高速である識別アルゴリズムを提供する高速信号特徴化法を利用することを特徴とする請求項1記載の方法。
JP2008529649A 2005-09-07 2005-09-07 マイクロコントローラーを利用した信号認識法 Expired - Fee Related JP4931927B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/ES2005/000484 WO2007028836A1 (es) 2005-09-07 2005-09-07 Método para el reconocimiento de señales con un mi crocontrolador de bajo coste

Publications (3)

Publication Number Publication Date
JP2009507260A JP2009507260A (ja) 2009-02-19
JP2009507260A5 JP2009507260A5 (ja) 2012-01-19
JP4931927B2 true JP4931927B2 (ja) 2012-05-16

Family

ID=37835396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008529649A Expired - Fee Related JP4931927B2 (ja) 2005-09-07 2005-09-07 マイクロコントローラーを利用した信号認識法

Country Status (11)

Country Link
US (1) US20080284409A1 (ja)
EP (1) EP1950736B1 (ja)
JP (1) JP4931927B2 (ja)
AT (1) ATE488002T1 (ja)
AU (1) AU2005336269A1 (ja)
BR (1) BRPI0520529A2 (ja)
CA (1) CA2620200A1 (ja)
DE (1) DE602005024724D1 (ja)
ES (1) ES2354702T3 (ja)
MX (1) MX2008002313A (ja)
WO (1) WO2007028836A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321209B2 (en) 2009-11-10 2012-11-27 Research In Motion Limited System and method for low overhead frequency domain voice authentication
EP2337023B1 (en) * 2009-11-10 2012-01-04 Research in Motion Limited System and method for low overhead voice authentication
US8775191B1 (en) * 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
GB2552067A (en) 2016-05-24 2018-01-10 Graco Children's Products Inc Systems and methods for autonomously soothing babies

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222792A (ja) * 1993-01-21 1994-08-12 Fuji Xerox Co Ltd 音処理装置
JP2003280682A (ja) * 2002-03-20 2003-10-02 Toyota Motor Corp 音声認識装置及び方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4066844A (en) * 1975-11-13 1978-01-03 Communications Satellite Corporation Adaptable zero order predictor for speech predictive encoding communications systems
US4181813A (en) * 1978-05-08 1980-01-01 John Marley System and method for speech recognition
US4627091A (en) * 1983-04-01 1986-12-02 Rca Corporation Low-energy-content voice detection apparatus
GB2145864B (en) * 1983-09-01 1987-09-03 King Reginald Alfred Voice recognition
US4827519A (en) * 1985-09-19 1989-05-02 Ricoh Company, Ltd. Voice recognition system using voice power patterns
US5150415A (en) * 1989-05-01 1992-09-22 Motorola, Inc. Volume control circuit using pulse modulation
CA2085887A1 (en) * 1990-06-21 1991-12-22 Kentyn Reynolds Method and apparatus for wave analysis and event recognition
US5640490A (en) * 1994-11-14 1997-06-17 Fonix Corporation User independent, real-time speech recognition system and method
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
DE19859174C1 (de) * 1998-12-21 2000-05-04 Max Planck Gesellschaft Verfahren und Vorrichtung zur Verarbeitung rauschbehafteter Schallsignale
US7653002B2 (en) * 1998-12-24 2010-01-26 Verizon Business Global Llc Real time monitoring of perceived quality of packet voice transmission
US6321194B1 (en) * 1999-04-27 2001-11-20 Brooktrout Technology, Inc. Voice detection in audio signals
FI19992351A (fi) * 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Puheentunnistus
FR2805433A1 (fr) * 2000-02-17 2001-08-24 France Telecom Procede et dispositif de comparaison de signaux pour le controle de transducteurs et systeme de controle de transducteurs
DE10043160B4 (de) * 2000-09-01 2009-11-26 Infineon Technologies Ag Tonsignalerkennungsschaltung und Verfahren zur Erkennung von Tonsignalen
US6947869B2 (en) * 2002-03-29 2005-09-20 The United States Of America As Represented By The Secretary Of The Navy Efficient near neighbor search (ENN-search) method for high dimensional data sets with noise
JP4348970B2 (ja) * 2003-03-06 2009-10-21 ソニー株式会社 情報検出装置及び方法、並びにプログラム
US7529670B1 (en) * 2005-05-16 2009-05-05 Avaya Inc. Automatic speech recognition system for people with speech-affecting disabilities
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222792A (ja) * 1993-01-21 1994-08-12 Fuji Xerox Co Ltd 音処理装置
JP2003280682A (ja) * 2002-03-20 2003-10-02 Toyota Motor Corp 音声認識装置及び方法

Also Published As

Publication number Publication date
EP1950736A1 (en) 2008-07-30
CA2620200A1 (en) 2007-03-15
EP1950736B1 (en) 2010-11-10
US20080284409A1 (en) 2008-11-20
ATE488002T1 (de) 2010-11-15
DE602005024724D1 (de) 2010-12-23
AU2005336269A1 (en) 2007-03-15
ES2354702T3 (es) 2011-03-17
WO2007028836A1 (es) 2007-03-15
JP2009507260A (ja) 2009-02-19
BRPI0520529A2 (pt) 2009-09-29
MX2008002313A (es) 2008-04-22

Similar Documents

Publication Publication Date Title
Stowell et al. Bird detection in audio: a survey and a challenge
Zhang et al. Heart sound classification based on scaled spectrogram and partial least squares regression
CN105765656B (zh) 控制计算装置的语音辨识过程
CN101023469B (zh) 数字滤波方法和装置
CN108896878A (zh) 一种基于超声波的局部放电检测方法
Nishimura et al. Eating habits monitoring using wireless wearable in-ear microphone
Deng et al. Online Blind Reverberation Time Estimation Using CRNNs.
CN106233379A (zh) 声音合成设备和用于合成声音的方法
JP4931927B2 (ja) マイクロコントローラーを利用した信号認識法
JP2004191780A5 (ja)
ATE421748T1 (de) Verfahren und anordnung zur spracherkennung
CN113539294A (zh) 一种生猪异常状态声音采集及识别方法
CN115346561B (zh) 基于语音特征的抑郁情绪评估预测方法及系统
Zhang et al. Classifying and ranking audio clips to support bird species richness surveys
CN201683910U (zh) 智能心肺分析仪
CN103077627B (zh) 一种便携式可视化心音听诊教学系统
JP2000166877A5 (ja)
JP2012113173A (ja) 雑音抑制装置、雑音抑制方法、及びプログラム
CN101897578A (zh) 一种动脉压信号逐拍分割方法
CN103239235A (zh) 一种多功能综合耳声发射检测仪
Noh et al. Smart home with biometric system recognition
CN104510492A (zh) 不可听信号的听诊方法及装置
KR100659884B1 (ko) 음악에서의 비브라토 자동 검출방법
Adavanne et al. Convolutional recurrent neural networks for bird audio detection
Pan et al. Tree size estimation from a feller-buncher’s cutting sound

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees