JP2712703B2 - 信号処理装置 - Google Patents

信号処理装置

Info

Publication number
JP2712703B2
JP2712703B2 JP2026506A JP2650690A JP2712703B2 JP 2712703 B2 JP2712703 B2 JP 2712703B2 JP 2026506 A JP2026506 A JP 2026506A JP 2650690 A JP2650690 A JP 2650690A JP 2712703 B2 JP2712703 B2 JP 2712703B2
Authority
JP
Japan
Prior art keywords
analysis section
section
unit
analysis
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2026506A
Other languages
English (en)
Other versions
JPH03231299A (ja
Inventor
明 野原
丈二 加根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2026506A priority Critical patent/JP2712703B2/ja
Priority to US07/637,203 priority patent/US5195138A/en
Priority to AU68688/91A priority patent/AU644124B2/en
Priority to CA002034333A priority patent/CA2034333C/en
Priority to DE69130294T priority patent/DE69130294T2/de
Priority to DE69132148T priority patent/DE69132148T2/de
Priority to NO910221A priority patent/NO306489B1/no
Priority to FI910293A priority patent/FI115569B/fi
Priority to DE69112855T priority patent/DE69112855T2/de
Priority to EP91100598A priority patent/EP0439073B1/en
Priority to EP94107071A priority patent/EP0614171B1/en
Priority to KR1019910000760A priority patent/KR960005739B1/ko
Priority to DE69132147T priority patent/DE69132147T2/de
Priority to EP94107070A priority patent/EP0614170B1/en
Priority to EP94107069A priority patent/EP0614169B1/en
Publication of JPH03231299A publication Critical patent/JPH03231299A/ja
Priority to KR1019940023426A priority patent/KR950001068B1/ko
Priority to HK184795A priority patent/HK184795A/xx
Application granted granted Critical
Publication of JP2712703B2 publication Critical patent/JP2712703B2/ja
Priority to HK98110576A priority patent/HK1010007A1/xx
Priority to HK98110575A priority patent/HK1010006A1/xx
Priority to HK98110577A priority patent/HK1010008A1/xx
Priority to NO992258A priority patent/NO308336B1/no
Priority to NO992257A priority patent/NO308337B1/no
Priority to NO992256A priority patent/NO308335B1/no
Priority to FI20030089A priority patent/FI116595B/fi
Priority to FI20030088A priority patent/FI116594B/fi
Priority to FI20030087A priority patent/FI117953B/fi
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声処理に用いる信号処理装置に関する。
従来の技術 近年、音声信号の処理技術に著しい進歩がある。第2
図は従来の信号処理装置のブロック図である。図に示す
ようにケプストラム算出部16は音声入力のケプストラム
を算出しピーク検出部17に供給する。ピーク検出部17は
ケプストラム算出部16のケプストラムが供給され、その
ピークを検出して音声検出部19に供給する。音声検出部
19はピーク検出部17のピーク信号が供給され、音声の検
出結果をマッチング部20に供給する。音声分析部18は音
声入力の分析を行ってマッチング部20に供給する。マッ
チング部20は音声検出部19から供給される制御信号で制
御されて認識出力を得る構成となっている。
このように構成された従来の信号処理装置についてそ
の動作を説明する。音声入力はケプストラム算出部16で
そのケプストラムが算出される。そしてピーク検出部17
でケプストラムピークが検出される。音声検出部19では
そのケプストラムピークの有無あるいはその大きさで音
声の有無を判定し、マッチング部20へ制御信号として供
給する。また一方、音声入力は音声分析部18においてマ
ッチング部20でのパターンマッチングが行なえるように
分析を行なってマッチング部20に供給する。マッチング
部20では音声検出部19からの制御信号によって、音声分
析部18より供給される信号を基準パターンとマッチング
させ、音声認識を行なって認識出力を得る。ここで、音
声検出部19からの制御信号は、音声が検出された場合に
マッチング部20のマッチング動作を行なうように制御す
る。
発明が解決しようとする課題 しかしながら、このような従来の信号処理装置では、
音声が入力された場合に、常にマッチング動作を行なう
ために音声認識対象外の音声入力に対しても動作し、不
要な信号処理と、そのための不要な処理時間が発生する
とともに、誤認識が多く発生するという不都合が生じ、
また複数の話者の音声の区別ができなかった。
本発明は上記課題を解決するもので、複数の入力信号
に対して登録済みのものだけ認識動作を効率的に行なう
信号処理装置を提供することを目的とする。
課題を解決するための手段 本発明は上記目的を達成するために、音声信号を入力
した音声分析部の分析出力を用いて認識出力を得るマッ
チング部についてその認識動作の実行を制御する第1の
制御信号の入力手段および第2の制御信号の入力手段を
備え、音声信号のケプストラムを算出するケプストラム
算出部と、そのケプストラムのピークを指定された区間
で検出して出力するピーク検出部と、音声検出部を設
け、前記音声検出部は前記ピーク検出部の出力から音声
信号の有無に対応する前記第1の制御信号を出力するも
のとし、分析区間メモリと、前記分析区間を前記ピーク
検出部に指定して出力するとともに前記ケプストラムピ
ークに対応する最適分析区間を算出して出力する分析区
間処理部と、前記最適分析区間を基本に分類処理したが
分析区間を前記分析区間メモリに記憶する分析区間分類
部を備え、前記分析区間処理部がピーク検出部に指定す
る分析区間はモード設定入力に対応して前記分析区間分
類部が指定するものとし、前記分析区間分類部は前記モ
ード設定入力に対応して前記最適区間を前記区間メモリ
の分析区間データと照合して音声信号の認識対象に対応
する第2の制御信号を出力するとともに、前記分析区間
メモリの分析区間データの分類処理と前記分析区間処理
部への分析区間指定を行ない、前記第1および第2の制
御信号による制限は音声信号が有って、かつ音声信号が
認識対象であるときのみ認識を実行するものとする。
作 用 本発明は上記の構成により、音声入力信号はケプスト
ラム算出部とピーク検出部の過程において分析区間処理
部が指定する分析区間でそのケプストラムのピークが検
出される。音声検出部では前記ケプストラムのピークを
もとに音声の有無を判別してマッチング部に第1の制御
信号を供給する。このとき、ピーク検出部に与えられる
分析区間はモード設定入力のモードにより下記の通りと
する。まず、モード設定入力が“登録”である場合、分
析区間処理部はモード検出部にあらかじめ定めた分析区
間を供給するとともにケプストラムピークに対応した最
適の分析区間を算出して分析区間分類部に出力する。分
析区間分類部は下記のように分類処理を行なう。すなわ
ち、分析区間分類部は前記最適の分析区間を分析区間メ
モリーと比較して、メモリーの区間データであって前記
最適分析区間をあらかじめ決めた割合以上に重複して含
む分析区間(これを類似した分析区間と定義する)があ
る場合にはその類似の分析区間を分析区間処理部を通し
てピーク検出部に供給するとともに、下記のように合成
した分析区間を前記メモリーの分析区間に置き換えて記
憶し、ない場合はその最適の分析区間を分析区間メモリ
ーに書き込む。前記合成された分析区間は、前記最適の
分析区間とメモリーデータの与える分析区間の重畳部分
を含み、その下限と上限が前記いずれかの分析区間にあ
るものとする。つぎに、モード設定入力が“認識”の場
合、分析区間処理部はあらかじめ定めた分析区間をピー
ク検出部に供給するとともにそのピークに対応した最適
の分析区間を算出して区間分類部に出力する。分析区間
分類部はその最適の分析区間を分析区間メモリーと比較
する。このとき、前記最適の分析区間と類似した分析区
間がメモリーにある場合は、そのメモリーの分析区間を
分析区間処理部を経てピーク検出部に与えるとともに認
識対象に対応する第2の制御信号を出力し、ない場合
は、ピーク検出部の分析区間はあらかじめ定められた分
析区間がそのまま保持される。
一方、音声入力は音声分析部でマッチング部での分析
処理に対応した分析がなされ、マッチング部であらかじ
め登録されたデータとマッチング処理して認識出力を得
る。このとき、マッチング処理部は前記第1の制御信号
および第2の制御信号がそれぞれ音声信号有りと認識対
象に対応するときのみ実行されるように制御される。
実施例 以下、本発明の一実施例について第1図を参照しなが
ら説明する。
第1図は本発明の一実施例における信号処理装置のブ
ロック図である。図に示すようにケプストラム算出部8
は音声入力からケプストラムを算出してピーク検出部9
に供給し、ピーク検出部9はそのケプストラムからピー
クを検出して分析区間処理部10、音声検出部14へそれぞ
れ供給する。音声検出部14はピーク検出部9から供給さ
れるケプストラムのピークによって音声の有無の検出を
行い、マッチング部15へ音声信号の有無に対応する第1
の制御信号を供給する。分析区間処理部10はピーク検出
部9より供給されるケプストラムのピークに応じた最適
の分析区間を設定して分析区間分類部11に供給するとと
もにモード設定入力に応じて、分析区間メモリ12から供
給される前記類似の分析区間データまたはあらかじめ決
められた分析区間データをピーク検出部9に供給する。
分析区間分類部11は分析区間処理部10から供給される前
記最適の分析区間データと、分析区間メモリ12から供給
される分析区間データとを比較して分類処理を行ない、
モード設定入力に応じて分析区間メモリ12へのデータ記
憶し、または分析区間メモリ12を読み出して分析区間を
制御するとともに、分類結果を第2の制御信号してマッ
チング部15に供給する。また、音声分析部13は音声入力
をマッチング部15で用いる形式に分析してマッチング部
15へ供給する。マッチング部15は音声分析部13で分析さ
れた音声入力と、音声検出部14および分析区間分類部11
からの第1および第2の制御信号が供給され、それらの
制御信号に応じて音声分析部13から供給される分析され
た音声入力をテンプレートと照合し、認識出力を得る構
成となっている。
上記構成において動作を説明する。
音声入力はケプストラム算出部8およびピーク検出部
9を経てケプストラムのピークが検出され、そのケプス
トラムピークは音声検出部14へ供給されて音声の有無が
検出される。音声検出部14は音声の有無に応じてマッチ
ング部15に第1の制御信号を供給する。ここでピーク検
出部9は分析区間処理部10から供給される分析区間に従
ってケプストラムのピークを検出するように動作する。
このとき、ピーク検出部9に供給される分析区間は後述
のようにモード選定入力に対応する。また、音声入力は
マッチング部15でマッチング処理が行なえるように音声
分析部13で分析が行なわれる。ここでモード設定入力が
“登録”の場合と“認識”の場合に分けて動作を考え
る。
まず、モード設定入力が“登録”である場合、分析区
間処理部10はピーク検出部9でのピーク検出の分析区間
をあらかじめ定められたものに設定し、また、ピーク検
出部9から得られるケプストラムのピークに応じて分析
区間を精度良く算出して最適の分析区間を分析区間分類
部11に供給する。分析区間分類部11ではその最適の分析
区間に前記類似した分析区間が分析区間メモリ12に存在
するか否かを調べ、もし存在しなければその最適の分析
区間を新らたに分析区間メモリ12に記憶し、また存在す
る場合にはその分析区間メモリ12の前記類似した分析区
間と前記最適の分析区間とを前記のように合成して分析
区間メモリ12の内容と置きかえて記憶する。
つぎにモード設定入力が“認識”となった場合、分析
区間処理部10はあらかじめ与えられた分析区間のデータ
をピーク検出部9に供給する。ピーク検出部9では音声
入力に応じたケプストラムのピークが検出され、そのピ
ークに対応して分析区間処理部10は最適の分析区間を算
出して分析区間分類部11に供給する。分析区間分類部11
はその与えられた最適の分析区間に前記類似する区間が
分析区間メモリ12に存在するかどうかを調べ、存在する
場合はその類似の分析区間を分析区間処理部10を介して
ピーク検出部9に前記あらかじめ決めた分析区間に置き
かえて供給し、また、存在しない場合はあらかじめ与え
られた分析区間がピーク検出部9に保持して供給され
る。さらに前記類似した分析区間の存在の有無を示す第
2の制御信号をマッチング部15に供給する。そしてマッ
チング部15では音声検出部14から供給される第1の制御
信号、および分析区間分類部11から供給される第2の制
御信号によって、音声入力に実際に音声が存在し、かつ
その音声入力のケプストラムのピークの分析区間があら
かじめ登録されているものと前記のように類似している
場合に、テンプレートとのマッチング動作を行なうもの
である。
このように本発明の実施例の信号処理装置によれば、
音声信号を登録するときに、音声の特徴を表わすピッチ
周波数に対応するケプストラムピークがあり、そのケプ
ストラムピークに対応した分析区間を分類処理してメモ
リーに記憶することにより、登録した複数の音声入力の
うちで類似したものは合成された分析区間に対応し、そ
の他の音声入力は単独の分析区間に対応して記憶され
る。いずれにしても音声を認識処理するときには、任意
の音声入力のケプストラムピークに対応したその分析区
間をメモリーに登録した分析区間と比較して登録済みか
どうかの判定ができる。また、分析区間を設定すること
によりケプストラムピーク検出の分析処理を限定した区
間で行なうことにより処理が速く、音声入力の有無判定
が効率よくできる。さらにケプストラムピークを持たな
い雑音が排除されて誤動作がなくなる。さらに、音声認
識処理を上記の効率的な音声入力の確認と登録済みの確
認の上で行なうようにしたので無駄のない認識処理がで
き、装置の活用も効率的にできる。
また、無駄のない処理動作は装置をマイクロプロセッ
サなどで構成するときに、その素子の処理負担が軽減さ
れるので、多くの処理がこなせるようになり、構成が簡
略化できる効果もある。
発明の効果 以上の実施例から明らかなように本発明の信号処理装
置は、音声信号を入力し、音声分析手段の分析出力を用
いて認識出力を得るマッチング部にその認識動作の実行
を制御する第1の制御信号の入力手段および第2の制御
信号の入力手段を備え、音声信号のケプストラムを算出
して、そのピークを指定された分析区間で検出するピー
ク検出手段と、ピーク検出手段の出力から音声信号の有
無に対応する前記第1の制御信号を出力するものとし、
前記音声入力に対応した最適の分析区間を算出し、その
最適の分析区間を基本とした分析区間を分類してメモリ
ーに記憶およびピーク検出部に供給する手段を設け、任
意の音声入力の認識処理において、その音声入力に対応
した分析区間と前記記憶された分析区間とを比較して第
2の制御信号を出力するものとし、前記第1および第2
の制御信号による制限は音声信号が有って、かつ音声信
号が認識対象であるときの認識を実行する信号処理装置
とすることにより、認識処理に無駄がなく、また分析区
間を設定することによりケプストラムピーク検出の分析
処理が速く、さらにケプストラムピークを持たない雑音
が排除されて誤動作がなくなる。また、無駄のない認識
処理ができて装置の活用も効率的にできる。
また、無駄のない処理動作は装置の素子の処理負担が
軽減されるので、構成が簡略化できる効果もある。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は従来
例のブロック図である。 8……ケプストラム算出部、9……ピーク検出部、10…
…分析区間処理部、11……分析区間分類部、12……分析
区間メモリ、13……音声分析部、14……音声検出部、15
……マッチング部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を入力した音声分析部の分析出力
    を用いて認識出力を得るマッチング部に、その認識動作
    の実行を制御する第1の制御信号の入力手段および第2
    の制御信号の入力手段を備え、音声信号のケプストラム
    を算出するケプストラム算出部と、そのケプストラムの
    ピークを指定された区間で検出して出力するピーク検出
    部と、音声検出部を設け、前記音声検出部は前記ピーク
    検出部の出力から音声信号の有無に対応する前記第1の
    制御信号を出力するものとし、分析区間メモリと、前記
    分析区間を前記ピーク検出部に指定して出力するととも
    に前記ケプストラムピークに対応する最適分析区間を算
    出して出力する分析区間処理部と、前記最適分析区間を
    含むように分類処理した分析区間を前記分析区間メモリ
    ーに記憶する分析区間分類部を備え、前記分析区間処理
    部がピーク検出部に指定する分析区間は、モード設定入
    力のモードに対応して前記分析区間分類部が指定するも
    のとし、前記分析区間分類部は、前記モード設定入力に
    対応して前記最適区間を前記区間メモリの分析区間デー
    タと照合して、音声信号の確認対象に対応する第2の制
    御信号を出力するとともに、前記分析区間メモリの分析
    区間データの分類処理と前記分析区間処理部への分析区
    間指定を行ない、前記第1および第2の制御信号による
    制限は音声信号が有って、かつ音声信号が認識対象であ
    るときのみ認識を実行するものである信号処理装置。
JP2026506A 1990-01-18 1990-02-06 信号処理装置 Expired - Fee Related JP2712703B2 (ja)

Priority Applications (26)

Application Number Priority Date Filing Date Title
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
US07/637,203 US5195138A (en) 1990-01-18 1991-01-03 Voice signal processing device
AU68688/91A AU644124B2 (en) 1990-01-18 1991-01-07 Voice signal processing device
CA002034333A CA2034333C (en) 1990-01-18 1991-01-17 Voice signal processing device
DE69132148T DE69132148T2 (de) 1990-01-18 1991-01-18 Vorrichtung zur Verarbeitung eines Signals
NO910221A NO306489B1 (no) 1990-01-18 1991-01-18 Talesignalbehandlingsanordning
FI910293A FI115569B (fi) 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite
DE69112855T DE69112855T2 (de) 1990-01-18 1991-01-18 Sprachsignalverarbeitungsvorrichtung.
EP91100598A EP0439073B1 (en) 1990-01-18 1991-01-18 Voice signal processing device
EP94107071A EP0614171B1 (en) 1990-01-18 1991-01-18 Signal processing device
KR1019910000760A KR960005739B1 (ko) 1990-01-18 1991-01-18 음성검출장치
DE69132147T DE69132147T2 (de) 1990-01-18 1991-01-18 Signalsteuerungsvorrichtung
EP94107070A EP0614170B1 (en) 1990-01-18 1991-01-18 Signal control device
EP94107069A EP0614169B1 (en) 1990-01-18 1991-01-18 Voice signal processing device
DE69130294T DE69130294T2 (de) 1990-01-18 1991-01-18 Vorrichtung zur Verarbeitung eines Sprachsignals
KR1019940023426A KR950001068B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치
HK184795A HK184795A (en) 1990-01-18 1995-12-07 Voice signal processing device
HK98110577A HK1010008A1 (en) 1990-01-18 1998-09-10 Voice signal processing device
HK98110576A HK1010007A1 (en) 1990-01-18 1998-09-10 Signal control device
HK98110575A HK1010006A1 (en) 1990-01-18 1998-09-10 Signal processing device
NO992258A NO308336B1 (no) 1990-01-18 1999-05-10 Anordning og fremgangsmÕte for signalbehandling
NO992256A NO308335B1 (no) 1990-01-18 1999-05-10 Anordning og fremgangsmÕte for talesignal-deteksjon
NO992257A NO308337B1 (no) 1990-01-18 1999-05-10 Signalstyringsanordning
FI20030089A FI116595B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置

Publications (2)

Publication Number Publication Date
JPH03231299A JPH03231299A (ja) 1991-10-15
JP2712703B2 true JP2712703B2 (ja) 1998-02-16

Family

ID=12195368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2026506A Expired - Fee Related JP2712703B2 (ja) 1990-01-18 1990-02-06 信号処理装置

Country Status (1)

Country Link
JP (1) JP2712703B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
古井 「ディジタル音声処理」 東海大学出版会、1985年,P.44〜48,57〜59

Also Published As

Publication number Publication date
JPH03231299A (ja) 1991-10-15

Similar Documents

Publication Publication Date Title
EP0702351B1 (en) Method and apparatus for analysing audio input events in a speech recognition system
US6826533B2 (en) Speech recognition apparatus and method
JP2964518B2 (ja) 音声制御方式
EP0614169B1 (en) Voice signal processing device
JP2712703B2 (ja) 信号処理装置
US4720864A (en) Speech recognition apparatus
JP2712691B2 (ja) 信号処理装置
KR950001068B1 (ko) 음성신호처리장치
JP2712704B2 (ja) 信号処理装置
JPH07325597A (ja) 情報入力方法およびその方法を実施するための装置
JPH07244494A (ja) 音声認識装置
JP2712708B2 (ja) 音声検出装置
JP2712692B2 (ja) 信号制御装置
JPS6250850B2 (ja)
JPH03200298A (ja) 音声制御装置
JPH03122696A (ja) 音声認識装置
JPH04240899A (ja) 音声認識装置
JPH0264600A (ja) 音声認識装置
JPH0485600A (ja) 音声認識装置
JPS6061409A (ja) 物体の処理装置
JP2844592B2 (ja) 離散単語音声認識装置
JPS59111697A (ja) 音声認識方式
JPH0634234B2 (ja) パターン認識装置
JPS6285393A (ja) リジエクト機能付きパタ−ン認識装置
JPS59176791A (ja) 音声登録方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees