JPH0797280B2 - 情報処理方法 - Google Patents

情報処理方法

Info

Publication number
JPH0797280B2
JPH0797280B2 JP60015436A JP1543685A JPH0797280B2 JP H0797280 B2 JPH0797280 B2 JP H0797280B2 JP 60015436 A JP60015436 A JP 60015436A JP 1543685 A JP1543685 A JP 1543685A JP H0797280 B2 JPH0797280 B2 JP H0797280B2
Authority
JP
Japan
Prior art keywords
voice
pattern
distance
registered
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60015436A
Other languages
English (en)
Other versions
JPS61175698A (ja
Inventor
穆 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP60015436A priority Critical patent/JPH0797280B2/ja
Publication of JPS61175698A publication Critical patent/JPS61175698A/ja
Publication of JPH0797280B2 publication Critical patent/JPH0797280B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [技術分野] 本発明は情報処理方法に関し、特に複数の登録パターン
から入力パターンに対応するパターンを導出する情報処
理方法に関するものである。
[従来技術] 従来、この種の情報処理方法は、入力パターンに対して
登録パターンの全てをパターンマッチングすることによ
り行っていた。
従って、登録パターンが増大するのに伴い、処理時間も
共に増大するという問題が生じていた。
[目的] 本発明は上記従来例に鑑みてなされたもので、その目的
とするところは、登録パターン数が増大してもパターン
マッチングを行うパターン数は少ないもので済み、迅速
かつ正確な処理を実行し得る情報処理方法を提供するこ
とにある。
[実施例] 以下、添付図面に従つて本発明の実施例を詳細に説明す
る。
第1図は本発明に係る実施例の音声認識装置を示すブロ
ツク構成図である。図において、1は音声を入力するマ
イクロホン、2は音声入力信号の特徴パラメータを抽出
する特徴抽出部、3は抽出した特徴パラメータ信号をデ
ジタル変換するA/D変換器、4は入力音声特徴情報と登
録音声特徴情報のパターンマッチング処理をすることに
より音声認識を行うセントラルプロセツシングユニツト
(CPU)である。
CPU4のブロツク中にはプログラムの実行により実現され
る各種機能構成が示されている。5は話者の基準音声パ
ターンを登録しておく登録メモリ、6は入力及び登録音
声パターン間のパターンマツチングにより類似度の距離
計算をする距離計算部、7は基準として選んだ特定の登
録音声パターンと該登録音声パターンを含む残りの登録
音声パターンとの距離を夫々の登録音声パターンに付し
た識別符号と共に保持する距離テーブルメモリ、8は入
力音声と登録音声との間の距離計算結果に従つて入力音
声を識別し、判定結果を符号で出力する音声判定部、9
は上述した各機能ブロツクの処理を進める制御部、SW1
〜SW3は情報の流れを切替えるスイツチ手段である。
第2図(a)〜(c)は本発明の動作原理の説明に係
り、第2図(a)は登録音声パターンが特徴空間上で離
散分布している様子を示す概念図である。ここで、各点
が夫々1つの登録音声パターンを表わしているとする
と、新たに未知の音声パターンxが入力された場合、従
来ではこの入力音声パターンxと空間上の全登録音声パ
ターンνとのパターンマツチングを行い、xに最も近い
点x′の登録音声パターン識別符号をもつて音声認識結
果としていた。従つて、未知音声の入力毎に全登録音声
パターンの数だけパターンマツチング処理が行なわれ、
特に登録語彙数が多い場合は認識に多大の時間を要して
いたことは前述した通りである。
本発明の一態様によれば、第2図(b)に示すように、
予め音声パターン登録時に登録音声パターン中の特定の
1個aを基準音声パターンとし、該基準音声パターンa
と全登録音声パターンν(aを含む)とのパターンマツ
チング処理を行ない、その結果得られた距離を夫々の登
録符号nと共に距離テーブルメモリ7に記憶する。
次に音声認識の際は、まず入力された未知音声パターン
xと基準音声パターンaとの間のパターンマツチング処
理を行ない、その結果得られた距離dに最も値の近い距
離d′を有する登録パターンx′を距離テーブル中から
見つけ、該登録パターンx′の近傍(例えば基準音声パ
ターンaからの距離にして±w/2の範囲内)にある各登
録パターンの登録符号を求め、求めた範囲内の登録音声
パターンについてのみ前記入力音声パターンとのパター
ンマツチング処理を行なう。
第2図(c)は基準音声パターンを2個(図の点a,b)
選んだ場合の他の一態様を示すものである。この場合も
基準音声パターンa,bとの距離から未知入力音声パター
ンxに最も近い登録音声パターンx1′及びx2′を夫々求
め、該登録音声パターンx1′及びx2′と基準音声パター
ンa,bとの間の夫々の距離d1′,d2′の近傍に共に含ま
れる登録音声パターンのみを音声認識の対象とすること
により(図の斜線部)、パターンマツチングの回数を大
幅に減少させることができる。
以下、実施例の動作を説明する。
第3図は音声登録の際の距離テーブル作成処理を示すフ
ローチヤートである。音声登録の際は第1図のSW1〜SW3
の接点Cが全て1側に接続されている。マイクロホン1
から入力された音声信号は特徴抽出部2で特徴ベクトル
が抽出され、A/D変換の後、登録メモリ5に格納され
る。その際、登録メモリ5の格納場所は制御部9出力の
シーケンシヤルアドレス信号Sにより決定される。こう
してN個の音声パターン登録が終了すると、ステツプS1
で登録メモリ5に格納された登録音声パターンの1つを
基準音声パターンとして選び、これを距離計算部6の入
力Aに読み出す。基準音声パターンは距離の原点となる
べきものであるから、例えば「ハイ」,「イイエ」等の
使用頻度の高い重要語を用いる。ステツプS2では登録メ
モリ5内の登録音声パターンを音声符号の順に読み出し
て距離計算部6の入力Bに送る。ステツプS3ではAの基
準音声パターンとBの登録音声パターン間の距離を計算
する。ステツプS4では計算の結果得られた距離情報dを
登録音声パターンの音声符号nと共に距離テーブルに格
納する。ステツプS5では登録メモリ5の全登録音声パタ
ーン(基準パターンも含めて)について距離計算したか
否かを判別する。計算終了であればステツプS6に進み、
距離テーブルに格納された距離情報dと音声符号nとを
距離dの昇べき又は降べきの順に並べ換え、再び距離テ
ーブルに格納する。
第5図にはこうして作成された距離テーブルの一態様を
示す。ここでは全登録音声パターンの個数をN、距離情
報は最大値を1.0として正規化し、距離情報dと音声符
号nとはこの正規化された距離の昇べき順に並べられて
いる。また、基準音声パターンとしては音声「ハイ」に
相当する音声符号(番号)1の登録パターンを使用して
いる。
第4図は音声の認識処理を示すフローチヤートである。
音声認識の際はSW1〜SW3の接点Cが全て2側に接続され
ている。ステツプS11では未知入力音声信号の特徴パタ
ーンが距離計算部6の入力Bに送られる。ステツプS12
では登録メモリ5から基準音声パターンaを読み出し、
距離計算部6の入力Aに入力する。ステツプS13では未
知入力音声パターンと基準音声パターンaの距離dを計
算する。ステツプS14では距離dで距離テーブルに格納
されている距離dに最も近い距離d′を検索し、その近
傍の距離にあるw個の音声符号を得る。テーブル検索は
距離情報が昇べき又は降べきの順に並べられているの
で、二分検索法を使えば周知の如く(log2N+1)回で
済み、極めて短時間に終了する。また、wはN>w≧1
なる整数で、認識処理時間が許容される限り大きな値
(幅)を取るのが望ましい。
第6図には未知入力音声パターンと、音声「ハイ」に相
当する音声符号1の基準音声パターンとの正規化された
距離dが0.725であつた場合の距離テーブル上の位置を
示す。登録音声の総数N=100であり、w=0.3Nとして
距離d=0.725の近傍の30個の音声符号91,49,…,28,60
が得られる。
こうして選択されたw個の登録音声パターンは未知入力
音声パターンの近傍に分布しているから、このw個のみ
を対象として未知入力音声とのパターンマツチングを行
う。即ち、ステツプS14では選択されたw個の登録音声
パターンの中から一つを取り出して距離計算部6のAに
送る。ステツプS15ではB入力の未知入力パターンとの
間の距離lを計算する。ステツプS16では計算結果の距
離lと音声符号nを音声判定部8に送る。こうして計算
処理を繰り返し、ステツプs17で全範囲(w個)の計算
終了と判別するとステツプS18に進み、音声判定部8は
送られたw個の距離lの中で予め定められた閾値以下の
ものがあれば、そのなかで最小値のものを認識結果と
し、対応する音声符号nを外部接続装置(不図示)に出
力する。このようにしてパターンマツチングの回数が大
幅に少くなるから従来よりはるかに高速で認識処理でき
る。
本発明の他の実施例は第2図(c)に示すように基準パ
ターンとして2個の登録音声パターンa,bを選んだ場合
であり、第1図の距離テーブルメモリ7の中に2つの距
離テーブルを格納する点が異なつている。
以下、距離テーブルの作成手順について説明する。全音
声パターンの登録が終了すると、制御部9は登録メモリ
5内の第1の基準パターンaを用いて第1の距離テーブ
ルを作成し、距離テーブルメモリ7に格納する。この動
作は前述したものと同様である。
次に制御部9は登録メモリ5からa以外の登録音声パタ
ーンbを1つ取り出し、これを距離計算部6に送つて全
登録音声パターンとの距離を計算し、第2の距離テーブ
ルを作成して距離テーブルメモリ7に格納する。この場
合に、第2の基準音声パターンbは第2図(c)に示す
様に第1の基準音声パターンaから離れている必要があ
るので、ソート後の第1の距離テーブル上でアドレスが
wより大きいところにある登録音声パターンを選択す
る。第2の実施例では第6図を第1の距離テーブルと
し、このテーブル上で最も第1の基準音声パターンa
(音声登録符号1)から離れたアドレス100(距離1.00
0)にある登録音声パターン(音声登録符号24)を第2
の基準音声パターンとしている。この結果作成された第
2の距離テーブルを第7図に示す。
音声認識時には、特徴抽出部2によりパターン化された
未知入力音声が距離計算部6の入力Bに送られ、制御部
9は第1の基準音声パターンとの距離d1を得て第1の距
離テーブルを検索し、距離d1のパターン近傍のw個の音
声登録符号を得る。次いで制御部9は、登録メモリ5か
ら第2の基準音声パターンを取り出して距離計算部6の
入力Aに送り、未知入力音声パターンとの距離d2を得て
第2の距離テーブルを検索し、距離d2の近傍w個の音声
登録符号を得る。ここで得られた2組の音声登録符号の
論理積的(共通する)集合は第2図(c)の斜線部に相
当するから、距離d1及びd2の近傍に共通に含まれる登録
音声パターンだけを認識処理対象とすればよい。こうし
て得られた音声登録符号に該当する登録パターンのみに
ついて未知入力音声パターンとのパターンマツチングを
行ない、認識処理を行なう。
具体的には登録音声の総数N=100、w=0.3Nで第1の
距離テーブルが第6図の如くであり、正規化された距離
d1が0.725であれば、第1の距離テーブル上で近傍の30
個の音声登録符号91,49,…,28,60が選択される。更に第
2の距離テーブル上で正規化された距離d2が0.550であ
れば、第7図に示すテーブル上で近傍の30個の音声登録
符号93,51,…,60,20が選択され、両者に共通な音声登録
符号として第7図に*印で示した11個の音声登録符号
「…,28,49,85,…,60」が選択され、これらの登録音声
パターンのみが未知入力音声パターンとのパターマツチ
ング対象になり、基準音声パターンが1個の場合の実施
例に比べ、より高速の認識処理が実現される。
[効果] 以上述べたごとく本発明によれば、各登録パターンが、
基準パターンとのパターンマツチングにより得た距離を
対応して記憶しておき、入力パターンとのパターンマッ
チングを行うパターンの検索に用いることにより、従来
に比べ大幅にパターンマッチングの回数を削減でき、認
識率を低下させることなく処理時間を大幅に減少できる
効果がある。
【図面の簡単な説明】
第1図は本発明に係る実施例の音声認識装置を示すブロ
ツク構成図、 第2図(a)〜(c)は本発明の動作原理を説明するた
めの図、 第3図は音声登録の際の距離テーブル作成処理を示すフ
ローチヤート、 第4図は音声の認識処理を示すフローチヤート、 第5図は第1の距離テーブルデータ配列の一態様を示す
図、 第6図は第1の距離テーブルデータ配列の他の一態様を
示す図、 第7図は第2の距離テーブルデータ配列の一態様を示す
図である。 ここで、1……マイクロホン、2……特徴抽出部、3…
…A/D変換器、4……セントラルプロセツシングユニツ
ト(CPU)、5……登録メモリ、6……距離計算部、7
……距離テーブルメモリ、8……音声判定部、9……制
御部、SW1〜SW3……スイツチ手段である。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】基準パターンと複数の登録パターンとのパ
    ターンマッチングにより得られる距離を各登録パターン
    に対応して記憶し、 入力パターンと前記基準パターンとのパターンマッチン
    グにより距離を導出し、 前記導出される距離に従い、前記記憶される登録パター
    ンを検索することを特徴とする情報処理方法。
  2. 【請求項2】前記検索される登録パターンと前記入力パ
    ターンとのパターンマッチングを行うことを特徴とする
    特許請求の範囲第1項に記載の情報処理方法。
JP60015436A 1985-01-31 1985-01-31 情報処理方法 Expired - Fee Related JPH0797280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60015436A JPH0797280B2 (ja) 1985-01-31 1985-01-31 情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60015436A JPH0797280B2 (ja) 1985-01-31 1985-01-31 情報処理方法

Publications (2)

Publication Number Publication Date
JPS61175698A JPS61175698A (ja) 1986-08-07
JPH0797280B2 true JPH0797280B2 (ja) 1995-10-18

Family

ID=11888746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60015436A Expired - Fee Related JPH0797280B2 (ja) 1985-01-31 1985-01-31 情報処理方法

Country Status (1)

Country Link
JP (1) JPH0797280B2 (ja)

Also Published As

Publication number Publication date
JPS61175698A (ja) 1986-08-07

Similar Documents

Publication Publication Date Title
JP2739945B2 (ja) 音声認識方法
EP0109190B1 (en) Monosyllable recognition apparatus
EP0319140A2 (en) Speech recognition
JPH05249990A (ja) パターンマッチング方法およびパターン認識装置
JPH0797280B2 (ja) 情報処理方法
EP0202534B1 (en) Continuous word recognition system
JP3039453B2 (ja) 音声認識装置
US5956677A (en) Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition
JPS62144200A (ja) 連続音声認識装置
JPS60118894A (ja) 音声認識装置
JPH0228160B2 (ja)
JP2577891B2 (ja) 単語音声予備選択装置
JPH0464077B2 (ja)
JPS59173884A (ja) パタ−ン比較装置
JP3011984B2 (ja) パターン照合方法
JP2656239B2 (ja) 音声認識学習方式
JPS62147496A (ja) 連続音声認識装置
JP2995941B2 (ja) 不特定話者用音声認識装置
JPS63148299A (ja) 単語音声認識方法および装置
JPH0570159B2 (ja)
JPS62250498A (ja) 連続単語音声認識装置
JPS6199194A (ja) 候補を抽出する音声認識処理方式
JPH06308994A (ja) 日本語音声認識方法
JPH04212199A (ja) 標準パターン登録方法
JPS5961893A (ja) 標準パタ−ン更新機能付音声入力装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees