JPS6129896A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS6129896A
JPS6129896A JP15181484A JP15181484A JPS6129896A JP S6129896 A JPS6129896 A JP S6129896A JP 15181484 A JP15181484 A JP 15181484A JP 15181484 A JP15181484 A JP 15181484A JP S6129896 A JPS6129896 A JP S6129896A
Authority
JP
Japan
Prior art keywords
recognition
word
voice
speech recognition
word speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP15181484A
Other languages
English (en)
Inventor
萩野 輝雄
長倉 恵一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP15181484A priority Critical patent/JPS6129896A/ja
Publication of JPS6129896A publication Critical patent/JPS6129896A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は特定話者用の単語音声認識装置の基本構成と
して音声の分析部と認識部の一対から成り、認識可能な
小話数の増大をはかるために複数組の認識部を用いて構
成する単語音声認識装置に関するものである。
「従来技術」 従来、単語音声認識論理を専用回路化した単語音声認識
LSIが発表されている。しかし認識語数の増大をはか
るためには単語音声認識T、 S Iを複数個組合せて
認識装置を構成することが考えられる。しかしこの場合
はその制御が繁雑になp。
!、た個々の単語音声認識LSIに対して標準ノ々ター
ンを格納するメモリを必要とし、単語音声認識LSIの
個数に比例して装置規模が大きくなるなどの問題が生じ
ると考えられる。
すなわち従来の単語音声認識LSIを複数個組合せたも
のとしては第6図に示すものが考えられる。この装置に
おいては認識部の主な構成は音声分析用プロセッサ11
とDPマツチング用プロセッサ12とから成る。この図
ではマツチング用プロセッサを2個(点線部)で構成し
た例を示している。
話者登録のための学習動作は入力端子13から入力され
た音声を音声分析用プロセッサ11でnチャンネルの帯
域通過フィルタ(B、P、F)で周波数分析を行い、そ
の分析結果をもとに適当な特徴パラメータに変換し、そ
の特徴パラメータを標準パターンとする。作成された標
準パターンはDPマツチング用プロセッサ12を経由し
てパターンメモリ13へ転送される。この時複数個の、
DPマツチング用プロセッサを使用するのであれば、複
数個のパターンメモリ14へ転送する必要がある。
言忍識時の動作は、端子13から入力された音声を音声
分析用プロセッサ11で前記特徴パラメータ列に変換し
、音声区間の終了後(入力音声の終端検出後)DPマツ
チング用プロセッサ12に入力音声の特徴パラメータ列
を転送する。この時複数個のDPマツチング用プロセッ
サ12をf重用するのであれば複数個のDPマツチング
用プロセッサへ転送する必要がある。
入力音声の特徴パラメータ列を分析用プロセッサ11か
らDPマツチング用プロセッサ12が受けると以降の制
御はDPマツチング用プロセッザ12が中心となって行
う。DPマツチング用プロセッサ12の動作は全てプロ
グラマブルになっており、プログラム(インストラクシ
ョン)メモリも内蔵している。ただし内蔵しているプロ
グラムメモリと制御に要するステップ数で(d後者の方
が大きく、処理に応じてメインメモリからプログラムを
転送する必要があり、制御が繁雑である。
このように第6図の構成では各DPマツチング用プロセ
ッサ12にそれぞれ標檗パターンメモリ13を必要とし
、装置規模が大きくなり、かつ制御が繁雑である。
この発明の目的は複数組の音声認識部を用い、従って認
識可能な語数が多く、シかも装置規模が比較的小さく安
価に構成でき、捷た制御が簡弔な用語音声認識装置を提
供することにある。
「問題点を解決するための手段」 この発明によればマイクロホンから人力された音声は音
声入力部で低域通過P波器を通して帯域制限された後、
デジタル信号に変換され、そのデジタル信号の音声信号
は分析部で話者の音声の特徴が分析され、その入力音声
の特徴パターンと、標準パターンメモリ中のその話者の
ために予め作られた標準パターンとの間の類似度が認識
部で計算されるが、その際に互に異なる単語辞書をもつ
認識部を複数用い、これらに対し標準パターンメモリを
共通に用いる。話者登録のだめの学習時には認識部の一
つを用いて行う。
「実施例」 第1図にこの発明の装置の構成例を示す。マイクロホン
21からの入力音声は音声入力部22内で低域通過P波
器により帯域制限を受けた後、デジタル信号に変換され
る。そのデジタル信号の音声は音声認識部23で制御部
24の制御のもとに置などへ出力される。認識結果出力
部26は認識結果を表示して直接操作者に分からせるた
めに使用され、必ずしも必要とはしない。モード選択部
27は学習モード、認識モード々どの動作モードの選択
に使用される。
第1図中の音声認識部23は第2図に示すように、単語
音声認識LSI28a、28+)、標準パターンメモリ
29、単語辞書メモリ31a、31b、タイミングクロ
ック回路32よりなる。単語音声認識LSI28a 、
28biJ:伝えId (先賢(th r 学習機能を
持つ単語音声認識LSIの設計」昭和57年度電子通信
学会総合全国大会第378号)に発表されているものを
用いる。またその認識論理については例えば長島曲「音
韻単位の標準パターンを用いた実時間単語音声認識装置
」音響学会音声研究会878−22で述べられておシ、
この発明の意図するところでないので説明は省略する。
学習動作 モード選択部27で学習が選択されると学習モードが開
始される。その動作の流れを第3図に示す。ステップS
1で制御部24から単語音声認識LSI28aへ学習動
作開始のモード設定信号33を出力することから始まシ
、ステップS2で外部入出力インタフェース部25を通
じて標準パターンメモリ29に標塾パターンを格納し、
またステップS8で単語辞書を単語辞書メモIJ 31
 aに格納する。次にステップS4で一方の単語音声認
識LSI28aに動作開始を指示する。ステップS5で
発声入力された単語音声を音声入力部22で分析し、単
語音声認識LSI28aで入力音声パターンと標準パタ
ーンメモリ29および単語辞書メモリ31aとを参照し
ながら相関関数計算、尤度計算、DPマツチングなどを
行い、類似度和を出力する。
単語音声認識LSI28aよりフレームごとに出力され
る音声パワー情報およびDPパス情報34はステップS
6で制御部24が取込み、ステップS7でそのパワー情
報をもとに制御部24では音声区間の候補検出を行い、
その結果を音声区間制御信号35によシ単語音声認識L
SI28aへ指示する。このステップS6の動作をフレ
ームごとに制御をくりかえし、ステップS7で最後に音
声パワー情報から音声の終端が決定されると制御部24
よシ単語音声認識LSI213aへ音声終端決定の信号
35を送出し、その後単語音声認識LSI28aから制
御部24へ学習の結果36(入力音声と標桑パターンお
よび単語辞書の間の類似度和などから成る)が転送され
、1単語の学習動作が終了する(ステップsg)。ステ
ップS、で単語の発生を指定した単語数だけ終了したか
をチェックし、終了してない場合はステップS5に戻る
。学習はあらかじめ決められた単語を順に発声すること
から行うタメステップ85〜S8の動作を決められた単
語数分だけくりかえす。ステップS、で指定しり臣語数
だけ単語発声を行ったことが検出されるとステップSI
Gに移り話者ごとの標準パターンを作成し、ステップS
llで学習後の標準パターンを標檗パターンメモリ29
へ置換える。これで学習モードは終了する。
なお学習時の標準パターンを作成する処理はこの発明の
意図するところでないので省略する。以上述べたように
学習時はあらかじめ決められた単語について1単語ごと
の発声から制御を行うため複数個の単語音声認識LSI
を用いて認識装置を構成し、第2図に破線で示す信号線
によシ単語音声認識T、 S I 28 bにも接続さ
れているが、実線で接続された完全に特定の1個の単語
音声認識LSI28aで構成していることと等価であり
、制御部24の制御上の負荷を軽減することが可能であ
る。学習モード(はモード選択部27で終了を選択した
場合も終了する。
認識動作 次に第1図に示した装置において単語音声認識LSI2
8a、28bの2個を使用して認識時接続を第4図に示
す。これは第2図の場合と基本的に等価であるが、単語
音声認識L’5I28aおよび28bへ接続される標準
パターンメモリ29、音声入力部22およびタイミング
クロック回路32から出力される信号線は全て共通化さ
れている。
また制御部24と単語音声認識LSI28aおよび28
1〕との間の制御信号についても制御上必要なもののみ
実線で示しである。これらの動作は基本的には学習モー
ドと同様であり、その動作例を第5図に示す。
モード選択部27で認識が選択されると認識モードが開
始されヘステップSlで制御部24かうm語音声認識L
SI28aおよび28bへ認識動作開始のモード設定信
号33a 、33bをそれぞれ出力することから始まり
、ステップS2でその話者に対する標準パターンを標準
パターンメモリ29にロードし、ステップS8で単語辞
書メモリ31a。
31bへ単語辞書全ロードし、ステップS4で両方の音
声認識LSI28a 、28bに動作開始を指示する。
ステップS5でマイクロホン21から単語を発声し、そ
の入力された音声と標準パターンメモリ29および単語
辞書メモ!J 31 aおよび31bとを参照しながら
音声認識LSI28a 、28bはそれぞれ認識動作を
行う。ステップs6でフレームコとにパワー情報の読込
みを行い、ステップs7でフレームごとに制御部24よ
り単語音声認識LSI28aおよび28I〕へ音声区間
の制御を行うことも学習時の動作と同様である。
これらの場合2個の単語音声認識L S I 28 a
 。
281)を使用しているが、これらを同時に起動させる
、すなわち同期動作を行うことにより主要な制御は1個
の場合と等価に制御が可能と1かるさ。3その方法は制
御部24から認識動作のモード設定信号33aおよび3
3bを単語音声認識LSI28aおよび28bに同時に
出力し、タイミングクロック回路32から単語音声認識
LS、I28aおよび28bへ同時にクロックが入力さ
れているため、Ili語音声認識T、 S I 28 
aおよび28b(7)動作は完全に同期する。またマイ
クロホン21から入力される音声も同時に単語音声認識
LSI28aおよび28bへ入力され、その入力をもと
に行われる認識LSI28aおよび28bの内部動作も
完全に同期している。このことから音声が入力されフレ
ームごとに単語音声認識LSI28aおよび28bから
出力される音声パワー情報34aおよび34bは完全に
一致している。このためフレームごとの音声パワー情報
は複数個の単語音声認識L S I 28 a 、 2
81)を接続していても1個の単語音声認識L S I
 28 aからの音声パワー情報のみを使用すれば良い
。また音声区間制御信号35aおよび35bは制御部2
4から単語音声認識LSI28aおよび28bに同時に
出力すれば良い。そして認識動作終了時に得られる認識
結果(単語番号、入力音声と標準パターンおよび単語辞
書との間の類似度和などから成る)37aおよび37b
は接続している単語音声認識LSIの個数分だけデータ
転送をすれば良い(ステップS8)。
ここで学習時の制御の説明の中で述べた学習結果36と
認識結果37aおよび37bとは同じものである(呼称
を変えている)。ステップS9で単語音声認識LSI2
8a 、28bからの認識結果から総合した認識結果を
出力する(ステップSS)。
ステップS□0で認識動作が終了したかチェックし、終
了してない場合はステップS5に戻る。
以上のなかでもつとも制御上の負荷が大きいのは音声パ
ワー情報から音声区間検出制御(制御部24内の処理)
を行うととであり、その制御にぐ〕いて制御部24から
見ると完全に1個の単語音声認識LSIで処理するとと
と等価なため、複数個の単語音声認識LSIを接続I〜
でいても制御が容易になる。また制御部24から単語音
声認識LSI28aおよび28bへ出力する音声区間制
御34aおよび34bを同時でなく順に出力することも
可能であり、時間的な問題もほとんどない。各単語音声
認識LSIでの1フレーム内での処理時間はフレーム長
にくらべ可成り短かく音声区間制御を時間的にずらして
出力してもそれぞれフレーム内での動作が可能である。
これらのことから効果として複数個の単語音声認識LS
Iを使用しても実効的に1個のm語音声認識LSIを制
御する時と同じ負荷で制御可能となる。さらに標準パタ
ーンメモリ29も複数個の単語音声認識LSI28a。
28bが共通に使用するためメモリおよびその周辺回路
の削減が可能である。なお複数個の単語音声認識LSI
に接続する標準パターンメモリを単語音声認識LSI個
々に所有する構成ももちろん可能である。また複数個の
単語音声認識LSIを使用することにより認識可能な単
語数の増大も可能であり、単語音声認識LSIごとに単
語辞書メモリの内容をグループ分けすることにより、認
識結果を選択的に制御すること(音声認識装置を使用し
て特定の業務を運用する時、ある場面では入力されうる
語が制限できる)も可能である。第5図においてステッ
プS2.s8の標準パターン、単語辞書のロードは学習
モードに引き続いて認識動作を行う場合は必要としない
。あるいは以前に学習して作成した標準パターンがある
場合は、フロッピーディスクなどのデータ蓄積部(図示
せず)から読出し、又は外部入出力インクフェースを経
由してホストのデータ処理装置から標準パターンおよび
単語辞書を転送してもよい。認識動作はモード選択部2
7で終了を選択した場合に終了する。
「発明の効果」 以上説明したようにこの発明によれば単語音声認識LS
Iを複数個使用して構成した単語音声認識装置において
、制御の而から見ると、学習時には完全に1個の単語音
声認識LSIで構成しているため負荷は軽く、認識時に
も実効的に1個の単語音声認識LSIで構成しているこ
とと等価なため負荷は軽く、制御が容易になる利点があ
る。また認識時において複数個の単語音声認識LSIを
使用していても標準パターンメモリは共通化が可能なた
めメモリおよびその周辺回路を削減できる利点がある。
【図面の簡単な説明】
第1図はこの発明の音声認識装置を示すブロック図、第
2図はこの発明装置を学習に使用している状態を示すブ
ロック図、第3図はその学習時の動作例を示すブロック
図、第4図はこの発明装置を認識に使用している状態を
示すブロック図、第5図はその認識時の動作例を示すブ
ロック図、第6図は提案されている音声認識装置を示す
ブロック図である。 21:マイクロホン、22:低域フィルタA/I)変換
器等からなる音声入力部、23:音声認識部、24:制
御部、27:モード選択部、28a。 28b:4語音声認識LSI、29:標準パターンメモ
リ、31a、31b:単語辞書メモリ、32:タイミン
グクロック回路。 特許出願人  日本電信電話公社 代  理  人   草  野      卓2171
  図 特開昭61−2989G(7)

Claims (1)

    【特許請求の範囲】
  1. (1)マイク入力された音声を低域ろ波しデジタル信号
    に変換する音声入力部と、話者の音声の特徴を分析する
    分析部と、入力音声と標準パターンとの間の類似度を計
    算する認識部の複数組と、標準パターンを蓄えるメモリ
    と、これらを制御するプロセッサとから構成される特定
    話者用の単語音声認識装置において、学習時は複数組あ
    る認識部のうち特定の1組のみ使用し、認識時は学習時
    に作成した標準パターンおよび当該標準パターンを格納
    するメモリを複数組の認識部が共有するように上記制御
    部が構成されていることを特徴とする単語音声認識装置
JP15181484A 1984-07-20 1984-07-20 単語音声認識装置 Pending JPS6129896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15181484A JPS6129896A (ja) 1984-07-20 1984-07-20 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15181484A JPS6129896A (ja) 1984-07-20 1984-07-20 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS6129896A true JPS6129896A (ja) 1986-02-10

Family

ID=15526890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15181484A Pending JPS6129896A (ja) 1984-07-20 1984-07-20 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS6129896A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142798A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 音声認識方法
JP2012181307A (ja) * 2011-03-01 2012-09-20 Nec Software Hokkaido Ltd 音声処理装置、音声処理方法及び音声処理プログラム
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142798A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 音声認識方法
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム
JP2012181307A (ja) * 2011-03-01 2012-09-20 Nec Software Hokkaido Ltd 音声処理装置、音声処理方法及び音声処理プログラム

Similar Documents

Publication Publication Date Title
US8099290B2 (en) Voice recognition device
JPS60128761A (ja) 電話加入者装置
JPS6129896A (ja) 単語音声認識装置
JPS60158498A (ja) パターン照合装置
US7539258B2 (en) Audio data sync format detecting circuit
JPS6312312B2 (ja)
JPS6135494A (ja) 音声認識処理装置
JPH10333699A (ja) 音声認識および音声合成装置
JPS6332596A (ja) 音声認識装置
KR890000807B1 (ko) 음성 합성 시스템
JPH0283594A (ja) 形態素合成形英単語辞書構成方式
JPS60129795A (ja) 音声認識方式
JPS61137197A (ja) 連続単語音声認識装置
JPS5919999A (ja) 音声出力装置
JPS5946699A (ja) 単語音声登録装置
JPS5923400A (ja) 音声認識装置
AU664217B2 (en) Speech recognition circuit
JPS6070497A (ja) 音声認識装置
JPS63259686A (ja) 音声入力装置
JPS61129791A (ja) プログラム格納用外部記憶媒体及び外部記憶媒体用コンピユ−タシステム
JPS59148097A (ja) 音声認識方式
JPH04151700A (ja) パターンマッチング制御回路
JPS60237494A (ja) パタ−ンマツチング方式
JPS6026399A (ja) 単語認識装置
JPS58189692A (ja) 音声出力装置