JPS6129520B2

JPS6129520B2 -

Info

Publication number: JPS6129520B2
Application number: JP53003702A
Authority: JP
Inventors: Hiroyasu Funakubo; Masataka Shiba
Original assignee: Individual
Current assignee: Individual
Priority date: 1978-01-19
Filing date: 1978-01-19
Publication date: 1986-07-07
Also published as: JPS5497304A

Description

【発明の詳細な説明】この発明は音声信号をコード化することによつ
て動力義手やマニヒユレータ等の機械装置または
電子装置を制御するための音声識別装置に関する
ものである。

従来におけるこの種の方式としては、発呼者か
らの種々なる音声信号を夫々周波数分析し、夫々
の音声信号をパターンとして記憶し、次回発呼者
から発声された音声信号を同じく周波数分析して
上記したパターンと比較し、如何なる音声信号で
あるか否かを判別するものであつた。しかしこの
方法によるものにあつては、発呼者の音声信号
が、日によつてあるいは時間によつて異なるこ
と、すなわち各音節の間隔が違つたりあるいは発
音が違つたりしてパターン比較が非常に困難であ
り、かつまた装置も大型なものとなりコスト的に
も高いものとなつた。

この発明は叙上の点に鑑みて成されたもので、
その第１の目的は、通常の発声あるいはハミング
であつても情報を確認することができる音声識別
装置を提供するにある。

この発明の第２の目的は、パターンマツチング
が単純であるために高い認識率を得ることができ
る音声識別装置を提供するにある。

この発明の第３の目的は、音程パターンとリズ
ムパターンの組合せ、あるいは上記２つの組合せ
と音の強弱との組合せであるために簡単な装置で
あつても多数の命令語の認識が行える音声識別装
置を提供するにある。

次にこの発明の一実施例を図面と共に説明す
る。

Ａは音声検出回路にして、以下の回路１〜８に
より構成されている。１は音声発呼者の気管外壁
等に取付けたマイク、２はマイク１の出力を十分
な大きさに増幅するリミツター等を含む増幅器、
３は約50〜250Hzの音声を通過させるバンドパス
フイルタで、声帯振動の基本周波数であり、発声
時の音階を表わすパラメータであるピツチ成分を
抽出する。４はバンドパスフイルタ３で抽出され
たサイン波を短形波に変換すると共にヒステリシ
ス特性により、さらにピツチ成分以外の波を除去
するシユミツトトリガ回路、５は全体の回路の動
作タイミングを決定するシーケンスコントローラ
にして、音声の入力波形の立上りで動作のトリガ
がかけられる。６は音声信号の振幅の大きさを検
出する包絡線検出器、７は該包絡線検出器６より
の信号において振幅の最大値を検出し、かつ最大
値を保持するピーク値検出器、８は該検出器７よ
りのアナログ値をデイジタル値に変換するアナロ
グ−デイジタル変換器である。

Ｂはカウンタ回路にして、以下の回路９〜１２
により構成されている。９は音声周期をカウント
する正確なクロツクパルスを発生するクロツクパ
ルス発生器、１０は上記シーケンスコントローラ
５よりの制御信号によつて、上記シユミツトトリ
ガ回路４よりの各パルス信号の間、クロツクパル
スをカウントする周期カウンタ、１１はクロツク
パルスを分周、例えば1/20で分周する分周回路、
１２は該分周回路で分周したクロツクで動作し、
音の発せられている時間をカウントするリズムカ
ウンタである。

Ｃはデイジタルバンドパスフイルタにして、以
下の回路１３〜１６により構成されている。１３
は上記した周期カウンタ１０よりの内容を一時ラ
ツチするカウンタバツフアレジスタ、１４は該レ
ジスタ１３の内容と後述するピツチ上限レジスタ
１５、ビツチ下限レジスタ１６の内容とを比較
し、該上下限レジスタ１５，１６の内容の間に上
記レジスタ１３の内容が存在する時に出力を送出
するデイジタルコンパレータ、１５は予じめ定め
られたピツチの上限のカウント数が記憶されてい
るピツチ上限レジスタ、１６は予じめ定められた
ピツチの下限のカウント数が記憶されているピツ
チ下限レジスタにして、バンドパスフイルタ３の
出力波形の周波数一時間変化図（第２図のｂ）に
おけるイ，ロ間に位置する信号のみを通過させ
る。

Ｄはピツチ安定検出部にして、以下に述べる回
路１７〜２０により構成されている。１７は周波
数を音程に変換し、高低差を線形として取扱うた
めの対数変換回路、１８は該対数変換回路１７よ
りのデータを数個（実施例では４個）スタツクし
ておくデータスタツク、１９は該データスタツク
１８内のいくつかのデータの中から代表値を決定
する代表値決定回路、２０は該代表値決定回路１
９で決定した代表値に対し上記データスタツク１
８内の各々のデータがある範囲、例えば半音以内
にあるか否かを判定する間隔コンパレータであ
る。

Ｅはパターン認識部にして、回路２１〜２９に
より構成されている。２１は上記代表値決定回路
で求められたピツチの代表値を音節毎にスタツク
する音程データスタツク、２２は該音程データス
タツク２１にスタツクされたピツチデータをパタ
ーン化する音程パターン化回路、２３は上記した
リズムカウンタ１２よりの出力を対数変換して音
の長さとしたデータをスタツクするリズムデータ
スタツク、２４は該リズムデータスタツク２３に
スタツクされたリズムデータをパターン化するリ
ズムパターン化回路、２５はアナログ−デイジタ
ル変換器８よりの出力を対数変換して音の強弱と
したデータをスタツクする強弱データスタツク、
２６は該強弱データスタツク２５にスタツクされ
た強弱データをパターン化する強弱パターン化回
路、２７は予じめ定めた命令語のパターンデータ
が記憶されている命令語データバンク、２８は上
記音程およびリズム、強弱パターン化回路２２，
２４および２６よりのパターンを合成すると共に
上記命令語データバンク２７内に記憶されている
命令語のパターンとを比較するパターンマツチン
グ回路、２９は該マツチング回路２８よりの出力
命令語信号を外部の機械等を制御できるような信
号に変換する出力変換回路である。

次に上記構成に基いて動作を説明する。

今第２図における音声入力包絡線（第２図の
ａ）のように４つの音節を発呼者が発声したとす
ると、マイク１においてこの情報を気管外壁（喉
仏の真下であつて比較的高周波成分や、声道特性
の影響の少ない部分）でキヤツチし、これを増幅
器２で増幅し、例えば50〜250Hzを通過させるバ
ンドパスフイルタ３でピツチ成分を抽出する。次
いで次段のシユミツトトリガ回路４で該シユミツ
トトリガ回路４のもつヒステリシス特性により、
さらにピツチ成分以外の波は除去し、かつ短形波
（第２図のｃ）に変換される。尚上記フイルタ３
は発呼者が女性である場合、高域側にずらす必要
がある。

一方増幅器２よりの出力は、包絡線検出器６で
振幅の大きさを検出し、そのピーク値の最大値を
ピーク値検出器７で検出し保持する（第２図の
ｄ）。そしてこのピーク値はアナログ−デイジタ
ル変換器８によつてデイジタル値に変換される。

次にシユミツトトリガ回路４よりの出力パルス
の立上りでシーケンスコントローラ５は動作を開
始するが、該コントローラ５のスタートとして
は、上記した音声入力の立上りでスタート（以下
第１スタートという）の外に、周期カウンタ１０
が音節と音節との間でオーバーフロー（例えば50
ｍｓ）した時にスタート（以下第２スタートとい
う）するのと、リズムカウンタ１２が命令語の終
了によつてオーバーフロー（例えば500ｍＳ）し
た時にスタート（以下第３スタートという）する
のとがある。なお音節と音節との区切れ時間とし
て判断するのは、周期カウンタ１０がオーバーフ
ローし、かつリズムカウンタ１２がオーバーフロ
ーしない場合である。

以下第３図以下のフローチヤート図に基いて動
作を説明する。

この機器の状態には音節のスタート待ちの状態
と、データ入力中の状態と、音節の区切れ待ち状
態およびデータが命令語でなくデータをリジエク
トする状態の４通りがあり、夫々をフエイズ０〜
３とする。

シーケンスコントローラ５の第１スタートのス
タート時には、フエイズが０であるので周期カウ
ンタ１０とリズムカウンタ１２がリセツトされ
る。次いでクロツクパルス発生器９の出力が送出
され、クロツクパルスを周期カウンタ１０とリズ
ムカウンタ１２とがカウントを開始する。ここで
音の入力があつたことによりフエイズは０から１
に変わり、スタート待ちの状態となりシーケンス
コントローラ５はホールドされる。

そしてシユミツトトリガ回路４よりの次のパル
スの立上りが入力されると、今度はフエイズが０
でなく１であるので周期カウンタ１０のデータは
カウンタバツフアレジスタ１３にラツチされる。
ピツチデータが入力されると、周期カウンタ１０
のデータをカウンタバツフアレジスタ１３にラツ
チする。次いで同期カウンタ１０をリセツトし
て、該カウンタ１０は再びクロツクパルスのカウ
ントを開始する。次にデイジタルコンパレータ１
４においてカウンタバツフアレジスタ１３にラツ
チされたデータとピツチ上下限レジスタ１５，１
６の予じめ設定されている値、すなわち第２図の
ｂにおけるイとロの値とが比較され、レジスタ１
３よりのデータが、レジスタ１５，１６のデータ
の間にない場合には、次のデータが入力されるま
で待機状態となる。また設定値イ，ロ間にレジス
タ１３よりの値がある場合には対数変換回路１７
においてカウンタバツフアレジスタ１３のデータ
を対数変換し、データスタツク１８にスタツクす
る。以下上記した動作が繰り返し行われデータス
タツク１８内のデータ数が予じめ定められた数に
達しているかを判断し、達していなければ入力待
ちとなりデータ取り込みが繰り返し行われる。そ
して予定数、実施例では４個のデータがスタツク
されると、代表値決定回路１９において平均値が
求められ、これが代表値として間隔コンパレータ
２０に入力される。この間隔コンパレータ２０で
データスタツク１８よりの各データと、上記求め
られた代表値とを比較して、ある範囲外のデータ
が１つでもあれば、最初にスタツクしたデータを
放出して入力待ちとなる。そして上記の動作が行
われて再びデータが入力されると代表値決定回路
１９で平均値を求め、間隔コンパレータ２０で代
表値と各データとを比較し、全てのデータが代表
値のある値の範囲内になるまで繰り返し動作が行
われる。全てのデータの値が代表値と比較してあ
る範囲内になると、その時の代表値が音程データ
スタツク２１に入力されスタツクされる。この状
態で音節の区切れ待ちの状態フエイズ２となつて
次の入力待ちとなる。ここで再びシユミツトトリ
ガ回路４よりのパルスが入力されると、フエイズ
０でなく、かつ１でもないので、周期カウンタ１
０をリセツトするだけでデータは取り込まずに入
力待ちとなる。以下シーケンスコントローラ５の
第２スタートが発生するまで、上記動作を繰り返
し行う。

次にシーケンスコントローラ５の第２スター
ト、すなわち周期カウンタ１０がオーバーフロー
すると、まずフエイズ２であるか否かを判断す
る。ここでフエイズが１であるならば、安定した
ピツチデータが得られなかつたことであり、この
入力された語をリジエクトするためにフエイズ３
とし、入力待ちの状態となる。またフエイズ３の
場合も同様である。

そしてフエイズ２であつた場合には、リズムカ
ウンタ１２のデータを対数変換しリズムデータス
タツク２３へ、またアナログ−デイジタル変換器
８のデータを対数変換し強弱データスタツク２５
に夫々スタツクする。次いで上記した音程データ
スタツク２１、リズムデータスタツク２３および
強弱データスタツク２５のデータが夫々４個以上
であるか否かを判断し、４個以下である場合に
は、周期カウンタ１０はリセツトできると共にカ
ウントがストツプされ、一方リズムカウンタ１２
はリセツトされると共にその後再びカウントを開
始し、入力待ちとなる。

そして再び第１スタートから上記動作を繰り返
し行い、４個以上になつた場合にはデータが命令
語でないとして、入力された語をリジエクトする
ためにフエイズ３とし、入力待ちの状態となる。

次にシーケンスコントローラ５の第３スター
ト、すなわちリズムカウンタ１２がオーバーフロ
ーすると、フエイズ３であるか否か判断し、フエ
イズ３であつた場合には、ジエネラルリセツトし
リセツトする。すなわち全てのレジスタをリセツ
トし、カウンタを停止させ、かつフエイズを０に
し、シーケンスコントローラ５は停止する。

一方フエイズ３でない場合には、音程データス
タツク２１、リズムデータスタツク２３および強
弱データスタツク２５の夫々のデータを音程パタ
ーン化回路２２、リズムパターン化回路２４およ
び強弱パターン化回路２６において夫々のデータ
の相対比較によつてパターン化し、パターンマツ
チング回路２８において合成され第６図のような
パターンが形成される。なお、第６図には４個の
パターンを組合せたものが示されているが、この
パターン数は４個に限定されるものではない。そ
してこのパターンは命令語データバンク２７より
のパターンと上記パターンマツチング回路２８に
おいて比較され、上記発声により得たパターンが
どの命令であるかを判断し、機械等の被制御対象
をどのような動作をさせるかを決定する。この出
力を出力変換回路２９によつて信号変換し被制御
対象の機械に所定動作を行わせる。そしてこの動
作が終了するとジエネラルリセツトが行われ、次
の命令語の待機状態となり入力待ちとなる。

この発明は上記したように、命令語の各語から
音の高低と音の長さおよび音の強弱を検出し、か
つこれらを合成して音符化したことによつて、通
常の発声あるいはハミングであつても高い認識率
が得られると共に簡単なパターンマツチングであ
ることによつて高い認識率が得られ、さらに上記
音の高低、長さ、強弱のパターンを複数個組合せ
ることにより、多数の命令語の認識が行える等の
効果を有するものである。

【図面の簡単な説明】

第１図はこの本発明に係る音声識別装置のブロ
ツク図、第２図は音声検出回路における各回路の
波形図、第３〜５図は動作説明に供するためのフ
ローチヤート図、第６図は命令語をパターン化し
た図である。１……マイク、２……増幅器、５……シーケン
スコントローラ、８……アナログ−デイジタル変
換器、９……クロツクパルス発生器、１０……周
期カウンタ、１２……リズムカウンタ、１３……
カウンタバツフアレジスタ、１４……デイジタル
コンパレータ、１５……ピツチ上限レジスタ、１
６……ピツチ下限レジスタ、１７……対数変換回
路、１８……データスタツク、１９……代表値決
定回路、２０……間隔コンパレータ、２１……音
程データスタツク、２２……音程パターン化回
路、２３……リズムデータスタツク、２４……リ
ズムパターン化回路、２５……強弱データスタツ
ク、２６……強弱パターン化回路、２７……命令
語データバンク、２８……パターンマツチング回
路、２９……出力変換回路。

Claims

【特許請求の範囲】１モーラ毎に区切つて発声した音を身体外壁に
おいてマイクで検出する手段と、検出された各区
間の音より基本の周波数を抽出する手段と、抽出
された基本音の高低変化よりパターンを求める手
段と、上記モーラ毎の音の連続時間よりパターン
を求める手段と、上記両パターンから音符化して
類別する手段とを備えて成る音声識別装置。２モーラ毎に区切つて発声した音を身体外壁に
おいてマイクで検出する手段と、検出された各区
間の音より基本の周波数を抽出する手段と、抽出
された基本音の高低変化よりパターンを求める手
段と、上記モーラ毎の音の連続時間よりパターン
を求める手段と、同じくモーラ毎の音強弱変化よ
りパターンを求める手段と、上記３つのパターン
を合成し強弱のついた音符を求め、これを類別す
る手段とを備えて成る音声識別装置。