JPH02244096A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02244096A
JPH02244096A JP1066613A JP6661389A JPH02244096A JP H02244096 A JPH02244096 A JP H02244096A JP 1066613 A JP1066613 A JP 1066613A JP 6661389 A JP6661389 A JP 6661389A JP H02244096 A JPH02244096 A JP H02244096A
Authority
JP
Japan
Prior art keywords
voice
noise
pattern
signal
white noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1066613A
Other languages
English (en)
Inventor
Kazuma Kaneko
和磨 金子
Mitsuo Shitaya
光生 下谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1066613A priority Critical patent/JPH02244096A/ja
Publication of JPH02244096A publication Critical patent/JPH02244096A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は対雑音性能を向上させた音声認識装置に関する
〔従来の技術〕
第8図は例えば特公昭61−42280号公報等に開示
された従来の特定話者音声!!識装置の主要部分の構成
を示すブロック図である。同図において、1は登録用ス
イッチ、2はコントロール部、5は音声を電気信号Sに
変換するマイクロホン、6はマイクロホン5からの電気
信号Sを分析して入力音声特徴パターンPを出力する分
析部、7は登録時の入力音声特徴パターンPを標準音声
特徴パターンとして記憶する標準パターン用メモリ、8
は認識時の入力音声特徴パターンPを入力音声特徴パタ
ーンとして記憶する入カバターン用メモリ、9は人力音
声特徴パターンと標準音声特徴パターンを比較して入力
音声特徴パターンを認識した結果Rを出力する認識部で
ある。なお、コントロール部2は登録用スイッチlの状
態に応じて符号6〜9で示した要素の制御を音声認識用
に行う。
従来の特定話者音声認識装置は上記のように構成され、
登録モードと認識モードの2種類の動作モードを有する
まず、登録モードの動作について説明する。登録用スイ
ッチ1が押されるとON信号を発生する。
このON信号を入力したコントロール部2は登録動作を
開始する。マイクロホン5は音声を電気信号Sに変換す
る0分析部6はこの電気信号Sを入力し、分析してその
特徴を抽出したデジタルの入力音声特徴パターンPを出
力する。標準パターン用メモリ7はコントロール部2の
指示により分析部6から出力される入力音声特徴パター
ンPを標準音声特徴パターンとして記憶する。予め定め
られた単語数の標準音声特徴パターンを記憶する事によ
り登録が終了する。この登録終了後、認識モードに自動
的に移行する。
次に、認識モードでの動作について説明する。
音声は、マイクロホン5により電気信号Sに音響−電気
信号変換され、分析部6により分析されてその電気信号
Sの特徴が抽出されたデジタルの入力音声特徴パターン
Pとなって分析部6から出力される。この入力音声特徴
パターンPはコントロール部2の指示により入カバター
ン用メモリ8に記憶される。認識部9ば、コントロール
部2の指示により入カバターン用メモリ8に記憶された
入力音声特徴パターンと標準パターン用メモリ7に先に
記憶された標準音声特徴パターンとを比較演算し、標準
音声特徴パターンの中から入力音声特徴パターンに最も
近イ以したパターンの単語を選び出し、この単語のパタ
ーンを認識結果Rとして出力する。
〔発明が解決しようとする!1題〕 従来の音声認識装置は以上のように構成されているので
、認識モードでの音声の入力時に周囲雑音が登録モード
時の周囲雑音より大きい状況においては、特定話者の発
声がその周囲雑音を原因とする心理的影響によって、登
録モード時の発声に比べて著るしく変化したり、または
、その周囲雑音が音声に重畳して入力される。これによ
り入力音声特徴パターンが、本来、近似すべき標準音声
特徴パターンと異なったものになり、認識部9で認識で
きず、音声の認識率が低下する等の課題があった。
本発明は上記のような課題を解決するためになされたも
ので、周囲雑音の影響を受ける事なく、高い認識率を達
成できる音声認識装置を得る事を目的とする。
〔課題を解決するための手段〕
本発明に係る音声認識装置は、標準音声特徴パターンの
登録時に雑音を話者に向けて発生する雑音発生手段を設
け、入力音声特徴パターンと標準音声特徴パターンとを
比較して入力音声パターンを認識するようにしたもので
ある。
〔作 用〕
本発明における音声認識装置は、登録時に雑音発生手段
により雑音を発生させ、認識時に周囲雑音が発生したと
同じ環境下で標準音声特徴パターンを予め登録するため
にそのパターンが入力音声特徴パターンに近似出来、認
識可能となる。
〔実施例〕
以下、本発明の各実施例を図について説明する。
第1図は本発明の一実施例に係る音声認識装置の構成を
示し、同図において、従来装置と同−又は相当部分には
第8図と同じ符号1.5〜9を付しその説明を省略する
。3Aは登録モード時にコントロール部2Aから指示信
号CMを受けて白色雑音電気信号Nを発生する白色雑音
信号発生部、4は白色雑音信号発生部3Aから白色雑音
電気信号Nを入力して白色雑音を発生するスピーカであ
る。
コントロール部2Aは、符号1.6〜9の要素に接続さ
れ、従来装置のコントロール部2と同じ機能を有する他
に、白色雑音信号発生部3Aに指示信号CMを出力する
機能を有している。
第2図は第1図中の白色雑音信号発生部3Aの詳細な構
成を示したブロック図である。第2図において、30は
白色雑音データとしてのコードデータDHを予め記憶し
ている白色雑音データ用読出し専用メモリ(以下、白色
雑音データ用ROMと略称する。)、31は白色雑音デ
ータ用ROM30からのコードデータD8を適応差分パ
ルス符号変調(ADPCM)してアナログの電気信号A
に変換する適応差分パルス符号変調用集積回路(以下、
ADPCM用ICと略称する。)、32ハA D P 
CM用IC31の後段のローパスフィルタ(以下、LP
Fと略称する。)、33はLPF32の後段のスピーカ
用アンプで、スピーカ4に接続されている。また、AD
PCM用IC31はコントロール部2Aにも接続されて
いる。
次に、第1図及び第2図を参照して第1実施例の動作に
ついて説明する。
まず、登録モードでの動作について説明する。
登録用スイッチ1が押されるとコントロール部2Aは登
録動作を開始する。白色雑音信号発生部3Aはコントロ
ール部2人からの指示信号CMを受けて白色雑音電気信
号Nを発生する。この白色雑音信号発生部3Aの詳細な
動作は以下の通りである。
ADPCM用IC31は、コントロール部2Aからの指
示信号CMによって、白色雑音データ用ROM30に記
憶されているコードデータD、を続出して適応差分パル
ス符号変調し、更にアナログ電気信号Al41:変換し
て出力する。このアナログ電気信号AHはLPF32を
通過してその低域が抽出された信号り、Iとなり、更に
スピーカ用アンプ33で増幅されて白色雑音電気信号N
に変換される。この時、コントロール部2Aは白色雑音
データ用ROM30に記憶されているデータの再生時間
長T1毎に指示信号CHをADPCM用Ic31に間歇
的に送り続ける。従って、登録モードの間、白色雑音電
気信号Nは白色雑音信号発生部3Aから連続して出力さ
れる。
スピーカ4は上記白色雑音電気信号Nを白色雑音に変換
して特定話者に向けて出力する。特定話者の音声はスピ
ーカ4からの白色雑音が重畳してマイクロホン5により
音響−電気信号変換される。
このマイクロホン5から出力される電気信号SNは分析
部6を経由して標準音声特徴パターン(入力音声特徴パ
ターンPM )化して標準パターン用メモリ7に記憶さ
れる。予め定められた単語数の標準音声特徴パターンが
標準パターン用メモリ7に記憶されることによって登録
は終了し、スピーカ4からの白色雑音の発生も終了する
。登録終了後、自動的に認識モードに移行する。
次に認識モードでの動作について説明する。認識モード
時にはコントロール部2Aから白色雑音信号発生部3A
に指示信号0.4が出力されない。
従って、白色雑音信号発生部3A及びスピーカ4は動作
しない、この状態でマイクロホン5は音声を電気信号S
2に変換する。この電気信号SNは分析部6、入カバタ
ーン用メモリ8、認識部9により従来装置と同じ処理を
受ける。これにより、認識部9から認識結果RNが出力
される。
本実施例の場合、登録モード時における標準音声特徴パ
ターンは、白色雑音が聞こえている状況時の特定話者の
発声に白色雑音が重畳した音をパターン化している。ま
た、認識モード時における入力音声特徴パターンは、白
色雑音の大きさ程度の周囲雑音が聞こえている状況時の
特定話者の発声に周囲雑音が大なり小なり重畳した音を
パターン化している。従って、同じ単語に対する標準音
声特徴パターンと入力音声特徴パターンとが極めて近似
し、認識部9により認識可能となる。
なお、上記実施例では、ADPCM用ICを備えたもの
を示したが、ADPCM用ICの代わりにデジタル/ア
ナログ(D/A)変換器やPCM用IC等の他の再生用
ICを用いても上記実施例と同様の効果を奏する。
第3図は本発明に係る音声認識装置の他の一実施例を示
し、装置全体の構成は第1図に示した装置と同じである
が、白色雑音信号発生部3Aの構成が第1実施例と異な
る。第3図において、34は白色雑音が磁気テープに記
録された白色雑音用カセットテープ、35は白色雑音用
カセットテープ34を装着し、コントロール部2Aから
指示信号0.4を受けて再生するテープデツキ、33は
テープデツキ35から出力される再生信号を増幅して白
色雑音電気信号Nにしてスピーカ4に出力するスピーカ
用アンプである。登録モード時にテープデツキ35はコ
ントロール部2人からの指示信号CHを受けると白色雑
音用カセットテープ34の再生を開始し、白色雑音用カ
セットテープ34に記録されている磁気信号B8を電気
信号T、に変換する。スピーカ用アンプ33はこの電気
信号T、を増幅して白色雑音電気信号Nにしてスピーカ
4に出力する。
一方、1mモード時には、コントロール部2Aから指示
信号C8が出力されないためにテープデツキ35やスピ
ーカ4は動作しない、その他の動作は第1実施例と同じ
なのでその説明を省略する。
なお、第2実施例ではテープデツキとカセットテープを
使用したが、この代りにコンパクトディスク(CD)プ
レイヤーと白色雑音用CD−ROMを使用しても上記第
2実施例と同様の効果を奏する。
また、第1及び第2実施例では白色雑音を発生するもの
も示したが、ROMやカセットテープにピンク雑音や自
動車走行時の雑音等のデータを記録しておき、ピンク雑
音や自動車走行時の雑音等を発生しても上記実施例と同
様の効果を奏する。
第4図は本発明の第3実施例に係る装置全体の構成を示
し、第4図において、第1実施例と同一部分には第1図
と同符号1.4〜9を付し、その説明を省略する。コン
トロール部2Bは、第1実施例のコントロール部2Aと
同じ機能を有する他に、雑音選択用スイッチ10から雑
音の種類を選択するための雑音選択信号を入力すると選
択雑音信号発生部3Bに雑音選択用の指示信号CMを出
力する機能を有する。この選択雑音信号発生部3Bは指
示信号C8の種類に応じた雑音信号を発生するもので、
その詳細な構成を第5図に示す。
また、スピーカ4は選択雑音信号発生部3Bの出力端子
に接続されている。
第5図において、36−1.36−2・・・36−Jは
第1〜第Jの雑音データ用ROMで、各々が互いに異な
った種類の雑音データを予め記憶している。その他、A
DPCM用IC31、LPF32、スピーカ用アンプ3
3の構成は第2図に示した構成と同じである。但し、A
DPCM用IC31は、コントロール部2Bからの指示
信号0.4の種類に応じて第1〜第Jの雑音データ用R
OM2S−1・・・36−Jのいずれかを選択してデー
タコードDNを続出す。
次に第4図及び第5図を参照して第3実施例の動作につ
いて説明する。登録モード時において、雑音選択用スイ
ッチlOにより雑音の種類が選択されると、この雑音選
択信号を入力したコントロール部2Bは雑音の種類を指
示する指示信号CMを出力する0選択雑音信号発生部3
Bはコントロール部2Bからの指示信号CMによって指
示された雑音の選択雑音信号を発生する。この選択雑音
信号発生部3Bの詳細な動作は以下の通りである。
ADPCM用IC31は、コントロール部2Bからの指
示信号CMの指示に従って、第1〜第Jの雑音データ用
ROM2S−1・・・36−Jのいずれかを選択して雑
音コードデータDHを読出して適応差分パルス符号変調
し、更にアナログ電気信号AMに変換して出力する。こ
のアナログ電気信号AMはLPF32を通過してその低
域が抽出された信号り、となり、更にスピーカ用アンプ
33で増幅されて選択雑音電気信号Nに変換される。こ
の時、コントロール部2Bは、ADPCM用IC31に
コードデータD。の再生時間長T8毎に指示信号C工を
出力する。
この選択雑音信号Nはスピーカ4に供給されて雑音に変
換される。
次に認識モードの場合の動作について説明する。
認識モード時にはコントロール部2Bは指示信号C0を
選択雑音信号発生部3Bに出力しない、従って、選択雑
音信号発生部3B及びスピーカ4は動作せず、雑音を発
生しない。
その他の音声認識の動作については第1実施例の動作と
同じなのでその説明を省略する。
なお、1種類の雑音データを1つのROMに記憶させた
が、複数種類の雑音データを1つのROMに記憶させて
おき、その雑音データのいずれかをアドレス指定により
選択して読出しても良い。
第6図は本発明の第4実施例に係る装置全体の構成を示
し、第6図において、第1実施例と同一部分には第1図
と同符号1.4〜9を付し、その説明を省略する。コン
トロール部2Cは第1実施例のコントロール部2Aと同
じ機能を有する他に、録音用スイッチ11が押された時
の録音モードか、再生モードかを指示する指示信号CN
を雑音信号記録再生部3Cに出力する機能を有する。こ
の雑音信号記録再生部3Cは、スピーカ4や雑音用マイ
クロホン12にも接続され、指示信号C8に応じて雑音
の録音又は再生を行うもので、その詳細な構成を第7図
に示す。
第7図において、37はバックアップ用バッテリ38に
よって電源を供給されているランダムアクセスメモリ(
以下、RAMと略称する。)、31AはADPCM用I
Cで、コードデータD。
をADPCM処理してアナログ電気信号AMに変換した
り、逆にアナログ電気信号AMをコードデータDHに変
換する。マイクロホン12、マイク用アンプ39、LP
F32Aがこの順に接続され、LPF32、スピーカ用
アンプ33、スピーカ4がこの順に接続されている。A
DPCM用IC31AはRAM37、LPF32Aの出
力端子、LPF32の入力端子に接続されていると共に
コントロール部2Cにも接続されている。
次に第6図及び第7図を参照して第4実施例の動作につ
いて説明する。か\る構成の音声認識装置は登録モード
、!!識モードに加えて録音モードを有する。
まず、録音モードの動作について説明する。録音用スイ
ッチ11が押されると、コントロール部2Cは録音モー
ドを指示する指示信号C1Iを雑音信号記録再生部3C
に出力する。これにより雑音信号記録再生部3Cは周囲
雑音の記録を以下の通り開始する。
雑音用マイクロホン12は周囲雑音を電気信号N、Iに
変換する。この電気信号N、は、マイク用アンプ39に
より増幅されて電気信号り、にされ、更にLPF32A
を通過して低域のみのアナログ電気信号A。となる、こ
のアナログ電気信号A。
を入力したADPCM用ICは、コントロール部3Cか
ら録音モードの指示信号C11を入力していれば、この
アナログ電気信号Aイを雑音データとしてのコードデー
タD、lに変換してRAM37に格納する。所定の時間
についてコードデータD。
を記録すると録音モードは終了する。RAM37はバッ
クアップ用バッテリ3日からデータを保持するための必
要な電圧Vの供給を受けているために格納されたデータ
を保持し続ける。
次に登録モード時の場合の動作について説明する。登録
モード時にはそのモードを指示する指示信号C1lを入
力したADPCM用IC31AはRAM37から先に格
納したコードデータD、を読出し、ADPCM処理して
アナログ電気信号AH変換する。このアナログ電気信号
A、はLPF32→スピーカ用アンプ33を経由してス
ピーカ4に供給される。これにより、スピーカ4は録音
された雑音を出力する。
次に認識モード時の場合の動作について説明する。認識
モード時にはコントロール部2Cから指示信号CMが出
力されないために雑音信号録音再生部3C、スピーカ4
が動作せず、録音や再生を行わない。
その他の音声認識の動作については第1実施例で述べた
動作と同じなのでその説明を省略する。
上記第4実施例によれば、音声認識装置を使用する環境
下の雑音を録音でき、その録音した雑音を登録モード時
に発生させることができるので、任意の雑音環境下にお
いても高い認識率を達成することができる。
なお、上記各実施例において、雑音を発生するスピーカ
の代りにヘッドホンを使用し、このヘッドホンにより雑
音を話者に聞かせても上記実施例と同様の効果を奏する
〔発明の効果〕
以上のように、本発明によれば標準音声特徴パターンの
登録時に話者に向けて雑音を発生させ、前記話者の入力
音声パタニンと予め登録された標準音声特徴パターンと
を比較して入力音声パターンを認識するように構成した
ので、周囲雑音の影響を排除することができ、高い音声
認識率を達成できる効果がある。
【図面の簡単な説明】
第1図は本発明の第1実施例に係る音声認識装置のブロ
ック図、第2図は第1図中の白色雑音信号発生部の構成
を示すブロック図、第3図は本発明の第2実施例におけ
る白色雑音信号発生部の構成を示すブロック図、第4図
は本発明の第3実施例に係る音声認識装置のブロック図
、第5図は第4図中の選択雑音信号発生部の構成を示す
ブロック図、第6図は本発明の第4実施例に係る音声認
識装置のブロック図、第7図は第6図中の雑音信号記録
再生部等の構成を示すブロック図、第8図は従来の音声
認識装置のブロック図である。 図中、1・・・登録用スイッチ、2A、2B、2C・・
・コントロール部、3A・・・白色雑音信号発生部、3
B・・・選択雑音信号発生部、3C・・・雑音信号記録
再生部、4・・・スピーカ、5・・・マイクロホン、6
・・・分析部、7・・・標準パターン用メモリ、8・・
・入カバターン用メモリ、9・・・認識部、10・・・
雑音選択用スイッチ、11・・・録音用スイッチ、12
・・・雑音用マイクロホン。 なお、図中同一符号は同一、又は相当部分を示す。 代理人    大  岩  増  雄 第 図 ×  込 (自発) 1、事件の表示 平 特1ml−66613号 事件との関係 特許出願人 住 所    東京都千代田区丸の内二丁目2番3号名
 称  (601)三菱電機株式会社代表者 志 岐 
守 5哉 4、代理人 住 所    東京都千代田区丸の内二丁目2番3号補
正の対象 明細書の「発明の詳細な説明」の欄 6゜ 補正の内容 (1)  明細書第4頁2行目の「単語のパターンjを
「単語」と補正する。 (2)  同第4頁17行目の「受ける事なく、」を「
低減し、」と補正する。 (3)  同第5頁8行目〜同頁11行目の「発生手段
により・・・・・・となる。」を「発生手段が認識時の
周囲雑音を模擬して雑音を発生させるので、登録音声パ
ターンが認識時の入力音声パターンに近づき、認識性能
が向上する。」と補正する。 (4)  同第8頁5行目、同第8頁5行目〜同頁6行
目、同第9頁7行目、同第9頁10行目の「特定話者」
を「話者」と補正する。 (5)  同第166頁2行目「記録」を「録音」と補
正する。 (6)同第188頁9行目「排除」を「低速」と補正す
る。 以  上

Claims (1)

    【特許請求の範囲】
  1. 話者の音声に基づく入力音声特徴パターンと予め登録さ
    れた前記話者の音声に基づく標準音声特徴パターンとを
    比較することにより入力音声パターンを認識する音声認
    識装置において、前記標準音声特徴パターンの登録時に
    雑音を前記話者に向けて発生する雑音発生手段を備えた
    事を特徴とする音声認識装置。
JP1066613A 1989-03-16 1989-03-16 音声認識装置 Pending JPH02244096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1066613A JPH02244096A (ja) 1989-03-16 1989-03-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1066613A JPH02244096A (ja) 1989-03-16 1989-03-16 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02244096A true JPH02244096A (ja) 1990-09-28

Family

ID=13320925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1066613A Pending JPH02244096A (ja) 1989-03-16 1989-03-16 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02244096A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
US7440891B1 (en) 1997-03-06 2008-10-21 Asahi Kasei Kabushiki Kaisha Speech processing method and apparatus for improving speech quality and speech recognition performance
WO2022024188A1 (ja) * 2020-07-27 2022-02-03 日本電気株式会社 音声登録装置、制御方法、プログラム及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440891B1 (en) 1997-03-06 2008-10-21 Asahi Kasei Kabushiki Kaisha Speech processing method and apparatus for improving speech quality and speech recognition performance
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
WO2022024188A1 (ja) * 2020-07-27 2022-02-03 日本電気株式会社 音声登録装置、制御方法、プログラム及び記憶媒体

Similar Documents

Publication Publication Date Title
JP3308567B2 (ja) ディジタル音声処理装置及びディジタル音声処理方法
JPH02244096A (ja) 音声認識装置
JPH06110650A (ja) 音声対話装置
JP3223552B2 (ja) メッセージ出力装置
JP2797644B2 (ja) 発声機能付きカラオケ装置
JP2988358B2 (ja) 音声合成回路
JP2605663B2 (ja) 録音機能付電子機器
KR200143635Y1 (ko) 마이크 입력 음향효과 전자악기
JP3201327B2 (ja) 録音再生装置
JPH0445188Y2 (ja)
JP3114560B2 (ja) 音声メモリ再生装置
JPH1131000A (ja) ボイスレコーダ
JP2799084B2 (ja) Cdプレ−ヤ−のミュ−ト方法
JP2004235979A (ja) 音入出力装置および音入出力方法
JPH075579Y2 (ja) 固体メモリ内蔵再生装置
JP3667578B2 (ja) サウンド制御装置
JP2586152B2 (ja) 録音編集合成装置
JPH04264595A (ja) 音声データ再生装置
JPH06324691A (ja) マイクロホン付音響機器
JPS62187898A (ja) 音声デイジタル記憶,再生方法及び装置
KR19990012715U (ko) 자동 음량 조절 장치
JPS62291777A (ja) ディスク再生装置
JPH0962285A (ja) デジタル再生装置
JPS6257197A (ja) 音声伝言装置
JPS59174092A (ja) 録音機能付ヘツドホ−ン