JPS6129520B2 - - Google Patents

Info

Publication number
JPS6129520B2
JPS6129520B2 JP53003702A JP370278A JPS6129520B2 JP S6129520 B2 JPS6129520 B2 JP S6129520B2 JP 53003702 A JP53003702 A JP 53003702A JP 370278 A JP370278 A JP 370278A JP S6129520 B2 JPS6129520 B2 JP S6129520B2
Authority
JP
Japan
Prior art keywords
data
pitch
circuit
pattern
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53003702A
Other languages
English (en)
Other versions
JPS5497304A (en
Inventor
Hiroyasu Funakubo
Masataka Shiba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP370278A priority Critical patent/JPS5497304A/ja
Priority to US05/877,394 priority patent/US4178472A/en
Priority to NL7801789A priority patent/NL7801789A/xx
Priority to DE19782806920 priority patent/DE2806920A1/de
Priority to FR7804744A priority patent/FR2381369A1/fr
Priority to GB6753/78A priority patent/GB1594412A/en
Publication of JPS5497304A publication Critical patent/JPS5497304A/ja
Publication of JPS6129520B2 publication Critical patent/JPS6129520B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

【発明の詳細な説明】 この発明は音声信号をコード化することによつ
て動力義手やマニヒユレータ等の機械装置または
電子装置を制御するための音声識別装置に関する
ものである。
従来におけるこの種の方式としては、発呼者か
らの種々なる音声信号を夫々周波数分析し、夫々
の音声信号をパターンとして記憶し、次回発呼者
から発声された音声信号を同じく周波数分析して
上記したパターンと比較し、如何なる音声信号で
あるか否かを判別するものであつた。しかしこの
方法によるものにあつては、発呼者の音声信号
が、日によつてあるいは時間によつて異なるこ
と、すなわち各音節の間隔が違つたりあるいは発
音が違つたりしてパターン比較が非常に困難であ
り、かつまた装置も大型なものとなりコスト的に
も高いものとなつた。
この発明は叙上の点に鑑みて成されたもので、
その第1の目的は、通常の発声あるいはハミング
であつても情報を確認することができる音声識別
装置を提供するにある。
この発明の第2の目的は、パターンマツチング
が単純であるために高い認識率を得ることができ
る音声識別装置を提供するにある。
この発明の第3の目的は、音程パターンとリズ
ムパターンの組合せ、あるいは上記2つの組合せ
と音の強弱との組合せであるために簡単な装置で
あつても多数の命令語の認識が行える音声識別装
置を提供するにある。
次にこの発明の一実施例を図面と共に説明す
る。
Aは音声検出回路にして、以下の回路1〜8に
より構成されている。1は音声発呼者の気管外壁
等に取付けたマイク、2はマイク1の出力を十分
な大きさに増幅するリミツター等を含む増幅器、
3は約50〜250Hzの音声を通過させるバンドパス
フイルタで、声帯振動の基本周波数であり、発声
時の音階を表わすパラメータであるピツチ成分を
抽出する。4はバンドパスフイルタ3で抽出され
たサイン波を短形波に変換すると共にヒステリシ
ス特性により、さらにピツチ成分以外の波を除去
するシユミツトトリガ回路、5は全体の回路の動
作タイミングを決定するシーケンスコントローラ
にして、音声の入力波形の立上りで動作のトリガ
がかけられる。6は音声信号の振幅の大きさを検
出する包絡線検出器、7は該包絡線検出器6より
の信号において振幅の最大値を検出し、かつ最大
値を保持するピーク値検出器、8は該検出器7よ
りのアナログ値をデイジタル値に変換するアナロ
グ−デイジタル変換器である。
Bはカウンタ回路にして、以下の回路9〜12
により構成されている。9は音声周期をカウント
する正確なクロツクパルスを発生するクロツクパ
ルス発生器、10は上記シーケンスコントローラ
5よりの制御信号によつて、上記シユミツトトリ
ガ回路4よりの各パルス信号の間、クロツクパル
スをカウントする周期カウンタ、11はクロツク
パルスを分周、例えば1/20で分周する分周回路、
12は該分周回路で分周したクロツクで動作し、
音の発せられている時間をカウントするリズムカ
ウンタである。
Cはデイジタルバンドパスフイルタにして、以
下の回路13〜16により構成されている。13
は上記した周期カウンタ10よりの内容を一時ラ
ツチするカウンタバツフアレジスタ、14は該レ
ジスタ13の内容と後述するピツチ上限レジスタ
15、ビツチ下限レジスタ16の内容とを比較
し、該上下限レジスタ15,16の内容の間に上
記レジスタ13の内容が存在する時に出力を送出
するデイジタルコンパレータ、15は予じめ定め
られたピツチの上限のカウント数が記憶されてい
るピツチ上限レジスタ、16は予じめ定められた
ピツチの下限のカウント数が記憶されているピツ
チ下限レジスタにして、バンドパスフイルタ3の
出力波形の周波数一時間変化図(第2図のb)に
おけるイ,ロ間に位置する信号のみを通過させ
る。
Dはピツチ安定検出部にして、以下に述べる回
路17〜20により構成されている。17は周波
数を音程に変換し、高低差を線形として取扱うた
めの対数変換回路、18は該対数変換回路17よ
りのデータを数個(実施例では4個)スタツクし
ておくデータスタツク、19は該データスタツク
18内のいくつかのデータの中から代表値を決定
する代表値決定回路、20は該代表値決定回路1
9で決定した代表値に対し上記データスタツク1
8内の各々のデータがある範囲、例えば半音以内
にあるか否かを判定する間隔コンパレータであ
る。
Eはパターン認識部にして、回路21〜29に
より構成されている。21は上記代表値決定回路
で求められたピツチの代表値を音節毎にスタツク
する音程データスタツク、22は該音程データス
タツク21にスタツクされたピツチデータをパタ
ーン化する音程パターン化回路、23は上記した
リズムカウンタ12よりの出力を対数変換して音
の長さとしたデータをスタツクするリズムデータ
スタツク、24は該リズムデータスタツク23に
スタツクされたリズムデータをパターン化するリ
ズムパターン化回路、25はアナログ−デイジタ
ル変換器8よりの出力を対数変換して音の強弱と
したデータをスタツクする強弱データスタツク、
26は該強弱データスタツク25にスタツクされ
た強弱データをパターン化する強弱パターン化回
路、27は予じめ定めた命令語のパターンデータ
が記憶されている命令語データバンク、28は上
記音程およびリズム、強弱パターン化回路22,
24および26よりのパターンを合成すると共に
上記命令語データバンク27内に記憶されている
命令語のパターンとを比較するパターンマツチン
グ回路、29は該マツチング回路28よりの出力
命令語信号を外部の機械等を制御できるような信
号に変換する出力変換回路である。
次に上記構成に基いて動作を説明する。
今第2図における音声入力包絡線(第2図の
a)のように4つの音節を発呼者が発声したとす
ると、マイク1においてこの情報を気管外壁(喉
仏の真下であつて比較的高周波成分や、声道特性
の影響の少ない部分)でキヤツチし、これを増幅
器2で増幅し、例えば50〜250Hzを通過させるバ
ンドパスフイルタ3でピツチ成分を抽出する。次
いで次段のシユミツトトリガ回路4で該シユミツ
トトリガ回路4のもつヒステリシス特性により、
さらにピツチ成分以外の波は除去し、かつ短形波
(第2図のc)に変換される。尚上記フイルタ3
は発呼者が女性である場合、高域側にずらす必要
がある。
一方増幅器2よりの出力は、包絡線検出器6で
振幅の大きさを検出し、そのピーク値の最大値を
ピーク値検出器7で検出し保持する(第2図の
d)。そしてこのピーク値はアナログ−デイジタ
ル変換器8によつてデイジタル値に変換される。
次にシユミツトトリガ回路4よりの出力パルス
の立上りでシーケンスコントローラ5は動作を開
始するが、該コントローラ5のスタートとして
は、上記した音声入力の立上りでスタート(以下
第1スタートという)の外に、周期カウンタ10
が音節と音節との間でオーバーフロー(例えば50
ms)した時にスタート(以下第2スタートとい
う)するのと、リズムカウンタ12が命令語の終
了によつてオーバーフロー(例えば500mS)し
た時にスタート(以下第3スタートという)する
のとがある。なお音節と音節との区切れ時間とし
て判断するのは、周期カウンタ10がオーバーフ
ローし、かつリズムカウンタ12がオーバーフロ
ーしない場合である。
以下第3図以下のフローチヤート図に基いて動
作を説明する。
この機器の状態には音節のスタート待ちの状態
と、データ入力中の状態と、音節の区切れ待ち状
態およびデータが命令語でなくデータをリジエク
トする状態の4通りがあり、夫々をフエイズ0〜
3とする。
シーケンスコントローラ5の第1スタートのス
タート時には、フエイズが0であるので周期カウ
ンタ10とリズムカウンタ12がリセツトされ
る。次いでクロツクパルス発生器9の出力が送出
され、クロツクパルスを周期カウンタ10とリズ
ムカウンタ12とがカウントを開始する。ここで
音の入力があつたことによりフエイズは0から1
に変わり、スタート待ちの状態となりシーケンス
コントローラ5はホールドされる。
そしてシユミツトトリガ回路4よりの次のパル
スの立上りが入力されると、今度はフエイズが0
でなく1であるので周期カウンタ10のデータは
カウンタバツフアレジスタ13にラツチされる。
ピツチデータが入力されると、周期カウンタ10
のデータをカウンタバツフアレジスタ13にラツ
チする。次いで同期カウンタ10をリセツトし
て、該カウンタ10は再びクロツクパルスのカウ
ントを開始する。次にデイジタルコンパレータ1
4においてカウンタバツフアレジスタ13にラツ
チされたデータとピツチ上下限レジスタ15,1
6の予じめ設定されている値、すなわち第2図の
bにおけるイとロの値とが比較され、レジスタ1
3よりのデータが、レジスタ15,16のデータ
の間にない場合には、次のデータが入力されるま
で待機状態となる。また設定値イ,ロ間にレジス
タ13よりの値がある場合には対数変換回路17
においてカウンタバツフアレジスタ13のデータ
を対数変換し、データスタツク18にスタツクす
る。以下上記した動作が繰り返し行われデータス
タツク18内のデータ数が予じめ定められた数に
達しているかを判断し、達していなければ入力待
ちとなりデータ取り込みが繰り返し行われる。そ
して予定数、実施例では4個のデータがスタツク
されると、代表値決定回路19において平均値が
求められ、これが代表値として間隔コンパレータ
20に入力される。この間隔コンパレータ20で
データスタツク18よりの各データと、上記求め
られた代表値とを比較して、ある範囲外のデータ
が1つでもあれば、最初にスタツクしたデータを
放出して入力待ちとなる。そして上記の動作が行
われて再びデータが入力されると代表値決定回路
19で平均値を求め、間隔コンパレータ20で代
表値と各データとを比較し、全てのデータが代表
値のある値の範囲内になるまで繰り返し動作が行
われる。全てのデータの値が代表値と比較してあ
る範囲内になると、その時の代表値が音程データ
スタツク21に入力されスタツクされる。この状
態で音節の区切れ待ちの状態フエイズ2となつて
次の入力待ちとなる。ここで再びシユミツトトリ
ガ回路4よりのパルスが入力されると、フエイズ
0でなく、かつ1でもないので、周期カウンタ1
0をリセツトするだけでデータは取り込まずに入
力待ちとなる。以下シーケンスコントローラ5の
第2スタートが発生するまで、上記動作を繰り返
し行う。
次にシーケンスコントローラ5の第2スター
ト、すなわち周期カウンタ10がオーバーフロー
すると、まずフエイズ2であるか否かを判断す
る。ここでフエイズが1であるならば、安定した
ピツチデータが得られなかつたことであり、この
入力された語をリジエクトするためにフエイズ3
とし、入力待ちの状態となる。またフエイズ3の
場合も同様である。
そしてフエイズ2であつた場合には、リズムカ
ウンタ12のデータを対数変換しリズムデータス
タツク23へ、またアナログ−デイジタル変換器
8のデータを対数変換し強弱データスタツク25
に夫々スタツクする。次いで上記した音程データ
スタツク21、リズムデータスタツク23および
強弱データスタツク25のデータが夫々4個以上
であるか否かを判断し、4個以下である場合に
は、周期カウンタ10はリセツトできると共にカ
ウントがストツプされ、一方リズムカウンタ12
はリセツトされると共にその後再びカウントを開
始し、入力待ちとなる。
そして再び第1スタートから上記動作を繰り返
し行い、4個以上になつた場合にはデータが命令
語でないとして、入力された語をリジエクトする
ためにフエイズ3とし、入力待ちの状態となる。
次にシーケンスコントローラ5の第3スター
ト、すなわちリズムカウンタ12がオーバーフロ
ーすると、フエイズ3であるか否か判断し、フエ
イズ3であつた場合には、ジエネラルリセツトし
リセツトする。すなわち全てのレジスタをリセツ
トし、カウンタを停止させ、かつフエイズを0に
し、シーケンスコントローラ5は停止する。
一方フエイズ3でない場合には、音程データス
タツク21、リズムデータスタツク23および強
弱データスタツク25の夫々のデータを音程パタ
ーン化回路22、リズムパターン化回路24およ
び強弱パターン化回路26において夫々のデータ
の相対比較によつてパターン化し、パターンマツ
チング回路28において合成され第6図のような
パターンが形成される。なお、第6図には4個の
パターンを組合せたものが示されているが、この
パターン数は4個に限定されるものではない。そ
してこのパターンは命令語データバンク27より
のパターンと上記パターンマツチング回路28に
おいて比較され、上記発声により得たパターンが
どの命令であるかを判断し、機械等の被制御対象
をどのような動作をさせるかを決定する。この出
力を出力変換回路29によつて信号変換し被制御
対象の機械に所定動作を行わせる。そしてこの動
作が終了するとジエネラルリセツトが行われ、次
の命令語の待機状態となり入力待ちとなる。
この発明は上記したように、命令語の各語から
音の高低と音の長さおよび音の強弱を検出し、か
つこれらを合成して音符化したことによつて、通
常の発声あるいはハミングであつても高い認識率
が得られると共に簡単なパターンマツチングであ
ることによつて高い認識率が得られ、さらに上記
音の高低、長さ、強弱のパターンを複数個組合せ
ることにより、多数の命令語の認識が行える等の
効果を有するものである。
【図面の簡単な説明】
第1図はこの本発明に係る音声識別装置のブロ
ツク図、第2図は音声検出回路における各回路の
波形図、第3〜5図は動作説明に供するためのフ
ローチヤート図、第6図は命令語をパターン化し
た図である。 1……マイク、2……増幅器、5……シーケン
スコントローラ、8……アナログ−デイジタル変
換器、9……クロツクパルス発生器、10……周
期カウンタ、12……リズムカウンタ、13……
カウンタバツフアレジスタ、14……デイジタル
コンパレータ、15……ピツチ上限レジスタ、1
6……ピツチ下限レジスタ、17……対数変換回
路、18……データスタツク、19……代表値決
定回路、20……間隔コンパレータ、21……音
程データスタツク、22……音程パターン化回
路、23……リズムデータスタツク、24……リ
ズムパターン化回路、25……強弱データスタツ
ク、26……強弱パターン化回路、27……命令
語データバンク、28……パターンマツチング回
路、29……出力変換回路。

Claims (1)

  1. 【特許請求の範囲】 1 モーラ毎に区切つて発声した音を身体外壁に
    おいてマイクで検出する手段と、検出された各区
    間の音より基本の周波数を抽出する手段と、抽出
    された基本音の高低変化よりパターンを求める手
    段と、上記モーラ毎の音の連続時間よりパターン
    を求める手段と、上記両パターンから音符化して
    類別する手段とを備えて成る音声識別装置。 2 モーラ毎に区切つて発声した音を身体外壁に
    おいてマイクで検出する手段と、検出された各区
    間の音より基本の周波数を抽出する手段と、抽出
    された基本音の高低変化よりパターンを求める手
    段と、上記モーラ毎の音の連続時間よりパターン
    を求める手段と、同じくモーラ毎の音強弱変化よ
    りパターンを求める手段と、上記3つのパターン
    を合成し強弱のついた音符を求め、これを類別す
    る手段とを備えて成る音声識別装置。
JP370278A 1977-02-21 1978-01-19 Voice identifying system Granted JPS5497304A (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP370278A JPS5497304A (en) 1978-01-19 1978-01-19 Voice identifying system
US05/877,394 US4178472A (en) 1977-02-21 1978-02-13 Voiced instruction identification system
NL7801789A NL7801789A (nl) 1977-02-21 1978-02-16 Spraakidentificatiestelsel.
DE19782806920 DE2806920A1 (de) 1977-02-21 1978-02-17 Stimmenidentifikationssystem
FR7804744A FR2381369A1 (fr) 1977-02-21 1978-02-20 Systeme d'identification de la voix
GB6753/78A GB1594412A (en) 1977-02-21 1978-02-21 Voiced instruction identification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP370278A JPS5497304A (en) 1978-01-19 1978-01-19 Voice identifying system

Publications (2)

Publication Number Publication Date
JPS5497304A JPS5497304A (en) 1979-08-01
JPS6129520B2 true JPS6129520B2 (ja) 1986-07-07

Family

ID=11564694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP370278A Granted JPS5497304A (en) 1977-02-21 1978-01-19 Voice identifying system

Country Status (1)

Country Link
JP (1) JPS5497304A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4383135A (en) * 1980-01-23 1983-05-10 Scott Instruments Corporation Method and apparatus for speech recognition
JPS57188092A (en) * 1981-05-14 1982-11-18 Ricoh Kk Music making apparatus

Also Published As

Publication number Publication date
JPS5497304A (en) 1979-08-01

Similar Documents

Publication Publication Date Title
CA2020242C (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
EP0077194B1 (en) Speech recognition system
CN100587806C (zh) 语音识别方法和语音识别装置
JPS58102299A (ja) 部分単位音声パタン発生装置
TW487902B (en) Method and apparatus for mandarin Chinese speech recognition by using initial/final phoneme similarity vector
US4178472A (en) Voiced instruction identification system
US5751898A (en) Speech recognition method and apparatus for use therein
JPS6129520B2 (ja)
EP0042590B1 (en) Phoneme information extracting apparatus
JPH0643895A (ja) 音声認識装置
JPH04369698A (ja) 音声認識方式
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JPS6126678B2 (ja)
JP2844592B2 (ja) 離散単語音声認識装置
JP2707552B2 (ja) 単語音声認識装置
CN85100180B (zh) 一种利用计算机对汉语语音进行识别的装置
JPS6131480B2 (ja)
JP2765578B2 (ja) 波形信号制御装置
JPH09281968A (ja) 音声認識によるリズム音発生装置
JPS6120880B2 (ja)
KUMAR High Resolution Property of Group Delay and its Application to Musical Onset Detection on Carnatic Percussion Instruments
JPH0797277B2 (ja) 電子計算機と不特定話者の通信装置
JP2508692B2 (ja) 入力波形信号制御装置
JPS5945160B2 (ja) 音声識別方法
JPH04329599A (ja) ピッチ抽出装置