JPH0876784A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0876784A
JPH0876784A JP6213468A JP21346894A JPH0876784A JP H0876784 A JPH0876784 A JP H0876784A JP 6213468 A JP6213468 A JP 6213468A JP 21346894 A JP21346894 A JP 21346894A JP H0876784 A JPH0876784 A JP H0876784A
Authority
JP
Japan
Prior art keywords
standard pattern
environment
voice recognition
standard
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6213468A
Other languages
English (en)
Inventor
Tomohiro Onoki
智宏 小野木
Akira Nakayama
昭 中山
Tsuneo Nitta
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP6213468A priority Critical patent/JPH0876784A/ja
Publication of JPH0876784A publication Critical patent/JPH0876784A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】標準パターン作成時と音声認識時の使用環境の
相違に起因する認識性能の低下を改善する。 【構成】標準パターン作成モードにおいて、利用者が発
声した音声をマイクロフォン1、ゲイン調整部2を介し
て特徴パラメータ抽出部3に入力してその音声を分析
し、抽出された特徴パラメータから、標準パターン作成
部5にて標準パターンを作成する際に、そのときの装置
の使用環境を示す標準パターン作成環境情報を入力部1
1から入力させて、標準パターンに対応付けて標準パタ
ーン記憶部6に登録しておく構成とする。音声認識モー
ドでは、標準パターン記憶部6に登録されている標準パ
ターン作成環境情報を表示部9に表示して、その際の装
置の使用環境に合った標準パターンを入力部11の操作
により利用者に選択させ、その選択された標準パターン
を音声認識に用いる構成とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、利用者の入力した音声
を認識する音声認識装置に関する。
【0002】
【従来の技術】音声認識の技術は、優れたヒューマンイ
ンタフェースを実現する上で重要な役割を担っている。
音声認識の技術を適用した装置に、特定話者方式の音声
認識装置がある。この特定話者方式の音声認識装置で
は、予め利用者の音声を装置に入力して標準的な音声の
特徴パターンを収集する手続き、即ち標準パターンの作
成が必要となる。この標準パターンは、標準パターンの
作成モードにおいて、利用者の発声した音声を分析して
得られる特徴パラメータから作成されるものである。
【0003】さて、音声認識装置において、利用者の入
力した音声を認識する際には、この作成した標準パター
ンが用いられる。即ち音声認識装置では、利用者が入力
した音声を分析して特徴パラメータを抽出し、この特徴
パラメータと予め作成しておいた標準パターンとの間の
類似度を計算することで、その類似度計算結果から認識
結果が求められる。
【0004】ところが、従来の音声認識装置では、装置
の使用環境、例えば(入力音声のゲインを決定する)入
力ボリューム、使用マイクロフォン、周囲の騒音レベ
ル、使用者(音声の発声者)などが、標準パターン作成
時と音声認識時とで相違することによって、認識性能の
低下を招いていた。即ち、特定話者方式の音声認識装置
の実用化では、利用者が語彙の設定を自由に行うことが
できる反面、標準パターン作成時と音声認識時とで装置
の使用環境に相違が生じることによって認識性能が低下
するという問題があった。
【0005】このように装置の認識性能が低下した場
合、利用者は標準パターンの作成モードを設定して再度
標準パターンを作成する作業が必要となり、装置の使い
勝手を著しく損なわせる原因となっていた。
【0006】また、不特定話者方式の音声認識装置にお
いても、複数の話者の発声した音声から標準パターンを
作成する標準パターン作成時と音声認識時とで周囲の騒
音レベル等の使用環境(音響的な環境)が著しく異なる
場合には、装置の認識性能が低下するという問題があっ
た。
【0007】
【発明が解決しようとする課題】上記したように従来の
音声認識装置では、標準パターンの作成時と音声認識時
(装置使用時)の使用環境の相違に起因する認識性能の
低下という問題が残されており効果的な解決手段がない
のが実状であった。また、利用者にとっては性能低下の
原因が分からないという使い勝手の悪さが生じていた。
これは、装置の実用化に際して重要な問題の1つであっ
た。
【0008】本発明は上記事情を考慮してなされたもの
で、その目的とするところは、標準パターン作成時と音
声認識時(装置使用時)の使用環境の相違に起因する認
識性能の低下が改善された、高精度な認識性能を有する
音声認識装置を提供することにある。
【0009】
【課題を解決するための手段及び作用】本発明の第1の
観点に係る音声認識装置は、標準パターン作成モードで
は利用者が発声した音声から標準的な音声の特徴パター
ンである標準パターンを作成しておき、音声認識モード
では利用者が発声した音声を標準パターン作成モードに
おいて作成された標準パターンを選択使用して認識する
音声認識装置であって、標準パターン作成時の装置の使
用環境を示す標準パターン作成環境情報を、その標準パ
ターンに対応付けて格納するための記憶手段と、この記
憶手段に格納されている標準パターン作成環境情報の示
す使用環境を表示するための表示手段と、音声認識モー
ドでの音声認識に用いる標準パターンを記憶手段に格納
されている標準パターンの中から利用者の選択操作に従
って選択するための選択手段とを備えたことを特徴とす
るものである。
【0010】上記第1の観点に係る音声認識装置におい
ては、標準パターン作成時の装置の使用環境を示す標準
パターン作成環境情報が、当該標準パターンと対応付け
て記憶手段に格納されるため、音声認識モード時(音声
認識を行う際)には、この記憶手段に格納されている標
準パターン作成環境情報を参照して当該環境情報の示す
使用環境を表示することにより、この表示内容から、利
用者は現在の装置の使用環境に合致した環境下で作成さ
れた標準パターンを認識して選択操作することが可能と
なる。
【0011】また、装置の使用環境と同一の使用環境下
で作成された標準パターンがない場合でも、表示されて
いる使用環境の中に、装置の使用環境(例えば音声入力
マイクロフォン)を変更することで使用環境が合致する
ようになるものがあるならば、利用者は、装置の使用環
境を変更(マイクロフォンを交換)して、その変更後の
使用環境に最適な環境下で作成された標準パターンを選
択操作することも可能となる。
【0012】このように、音声認識モード時に、記憶手
段に格納されている標準パターンが作成された際の使用
環境を表示することにより、利用者は、その表示内容を
もとに、装置の環境に合った標準パターンを選択できる
ため、或いは選択した標準パターンの作成時の使用条件
に合った環境で装置を利用できるため、使用環境の相違
が少なくなり、使用環境の相違による認識性能の低下を
回避することが可能となる。
【0013】本発明の第2の観点に係る音声認識装置
は、上記第1の観点に係る音声認識装置における表示手
段に代えて、音声認識モードにおける装置の使用環境を
検出する使用環境検出手段と、記憶手段に格納されてい
る標準パターン作成環境情報の示す使用環境と使用環境
検出手段によって検出された装置の使用環境との相違内
容を利用者に通知する使用環境相違通知手段とを設けた
ことを特徴とする。
【0014】上記第2の観点に係る音声認識装置におい
ては、標準パターン作成環境情報の示す使用環境と現在
(音声認識時)の装置の使用環境との相違内容が利用者
に通知されることから、利用者は、記憶手段に記憶され
ている複数の標準パターンの中から、現在の装置の使用
環境に最適な環境下で作成された標準パターンを簡単に
識別して選択操作することが可能となる。
【0015】また装置の環境に最適な標準パターンがな
い場合でも、環境の相違内容が示されることから、利用
者はこの相違内容をもとに、利用しようとする標準パタ
ーンの作成時と同じ使用環境となるように装置の環境を
設定変更できる。例えば標準パターン作成時と音声認識
時とで音声入力マイクロフォンが異なっている場合に
は、利用者は、通知される相違内容から、標準パターン
作成時にどのマイクロフォンが用いられていたのかを直
接知ることができ、その結果、マイクロフォンを交換す
ることにより、使用したい標準パターンの作成時と同一
の環境に適切に装置の環境を変更できるので、使用環境
の相違がなくなり、認識性能の低下を回避することが可
能となる。
【0016】本発明の第3の観点に係る音声認識装置
は、上記第1の観点に係る音声認識装置に、上記選択手
段により選択された標準パターン作成環境情報をもと
に、装置の使用環境を当該環境情報の示す使用環境に変
更制御する使用環境変更制御手段を追加したことを特徴
とする。
【0017】上記第3の観点に係る音声認識装置におい
ては、利用者の選択した標準パターンと対応付けて記憶
手段に格納されている標準パターン作成環境情報をもと
に、使用環境変更制御手段の制御により、装置の使用環
境が当該環境情報の示す使用環境に自動的に変更される
ため(例えば標準パターン作成時と音声認識時とで音声
入力のボリュームレベルが異なっていた場合に、当該ボ
リュームレベルが標準パターン作成時と同一レベルに自
動的に設定変更されるため)、利用者の手を煩わせるこ
となく使用環境の相違を無くして、認識性能の低下を回
避することが可能となる。
【0018】本発明の第4の観点に係る音声認識装置
は、標準パターン作成時の装置の使用環境を示す標準パ
ターン作成環境情報を、その標準パターンに対応付けて
格納するための記憶手段と、音声認識モードにおける装
置の使用環境を検出する使用環境検出手段と、この使用
環境検出手段によって検出された使用環境をもとに、当
該使用環境に最も近い環境を示す標準パターン作成環境
情報と対応付けて上記記憶手段に格納されている標準パ
ターンを音声認識モードでの音声認識に用いる標準パタ
ーンとして選択する選択手段とを備えたことを特徴とす
る。
【0019】上記第4の観点に係る音声認識装置におい
ては、装置の使用環境に最も適している標準パターンが
自動的に選択されるため、利用者の手を煩わせることな
く、認識性能の低下を回避することができる。
【0020】本発明の第5の観点に係る音声認識装置
は、音声認識モードにおける装置の使用環境を利用者の
操作に従って設定するための使用環境設定手段と、この
使用環境設定手段によって設定された使用環境をもと
に、当該使用環境に最も近い環境下で作成された標準パ
ターンを音声認識モードでの音声認識に用いる標準パタ
ーンとして選択する選択手段とを設けたことを特徴とす
る。
【0021】上記第5の観点に係る音声認識装置におい
ては、利用者の望む装置の使用環境が設定でき、しかも
利用者が設定した装置の使用環境に最も適している標準
パターンが自動的に選択される。
【0022】
【実施例】図1は本発明の一実施例に係る音声認識装置
の概略構成を示すブロック図である。図1において、1
は音声を入力するためのマイクロフォン(音声入力マイ
クロフォン)、2はマイクロフォン1からの入力音声
(入力音声信号)のゲインを調整するゲイン調整部であ
り、アンプ(図示せず)を内蔵する。3はゲイン調整部
2を介して入力された音声を分析して特徴パラメータを
抽出する特徴パラメータ抽出部、4は特徴パラメータ抽
出部3で抽出された特徴パラメータを音声認識の対象と
して用いる音声認識モード及び標準パターンの作成に用
いる標準パターン作成モードのいずれか一方への切り替
えを行うモード切替部である。
【0023】5は標準パターン作成モードにおいて特徴
パラメータ抽出部3で抽出された特徴パラメータから音
声認識に用いる標準パターンを作成する標準パターン作
成部、6は標準パターン作成部5で作成された標準パタ
ーンを記憶(登録)する標準パターン記憶部である。こ
の標準パターン記憶部6に記憶される標準パターンに
は、当該パターンの作成時の装置の作成環境(使用環
境)を表す情報(以下、標準パターン作成環境情報と称
する)が付される。この標準パターン作成環境情報に
は、標準パターン作成者(発声者)の氏名、標準パター
ンの作成年月日、標準パターンの作成場所、標準パター
ン作成者の性別、年齢、使用マイクロフォンの種別、
(ゲイン調整部2の)入力ボリュームレベル、標準パタ
ーン名などが含まれる。
【0024】7は音声認識モードにおいて特徴パラメー
タ抽出部3で抽出された特徴パラメータと標準パターン
記憶部6に記憶されている標準パターンとの間の類似度
を計算する類似度計算部、8は類似度計算部7によって
得られた類似度計算結果をもとに認識結果を出力する認
識結果出力部である。
【0025】9は認識結果や標準パターン作成時及び音
声認識時(装置使用時)の環境情報及びメッセージ等を
表示するための表示部、10は標準パターン作成時に利
用者に音声をフィードバックして聞かせたり、警告音や
音声によるメッセージを出力するためのスピーカであ
る。11はモード切り替えや、設定された使用環境の修
正もしくは設定など、利用者操作による装置への入力を
行うための入力部、12は制御部である。制御部12
は、入力部11からの入力や、標準パターン作成時及び
音声認識時(装置使用時)の環境情報をもとに装置全体
の制御を行う。
【0026】次に、図1の構成の動作を説明する。ま
ず、利用者が、入力部11を用いて標準パターン作成モ
ードを設定するための操作を行ったものとする。この場
合、標準パターン作成モードを設定するための情報が入
力部11から制御部12に入力される。制御部12は、
この情報を受けると、モード切替部4を制御して、標準
パターン作成モードに切り替え設定させる。
【0027】制御部12はまた、標準パターン作成環境
情報の設定入力画面を表示部9に表示して、図2に示す
ような、標準パターン作成者(発声者)の氏名、標準パ
ターンの作成年月日、標準パターンの作成場所、標準パ
ターン作成者の性別、年齢、使用マイクロフォンの種
別、入力ボリュームレベル、標準パターン名などの各環
境項目からなる、装置の使用環境の設定に必要な標準パ
ターン作成環境情報を、利用者の操作により入力部11
から入力させる。なお、上記の標準パターン作成環境情
報中の標準パターン作成者(発声者)の氏名、標準パタ
ーンの作成年月日、標準パターンの作成場所、性別、年
齢は、音声認識モードにおける装置の使用環境を示す利
用者(発声者)の氏名、利用年月日、利用場所、利用者
の性別、年齢に対応する。
【0028】制御部12は、利用者操作により入力部1
1から入力された標準パターン作成環境情報を受け取る
と、その標準パターン作成環境情報を図3に示すような
形式で表示部9に表示する。この標準パターン作成環境
情報の表示形式は、後述する音声認識モードにおいて音
声認識に用いる標準パターンを選択するために表示され
る標準パターン作成環境情報の表示形式と基本的に同一
である。そこで、画面表示される標準パターン作成環境
情報には、標準パターン作成モード或いは音声認識モー
ドのいずれが設定されているかを示すモード情報が付さ
れる。また、標準パターン作成環境情報に付されるメッ
セージ、例えば「環境を確認ください。よろしいですか
?(yes/no)」も共通である。但し、このメッセ
ージは、標準パターン作成モードでは、標準パターン作
成環境情報の格納(登録)案内となり、音声認識モード
では、音声認識に用いる標準パターンの選択案内とな
る。なお、本実施例では、前記した標準パターン作成環
境情報の設定入力時には、このメッセージの表示領域が
標準パターン作成環境情報の設定入力画面として用いら
れている。
【0029】制御部12はまた、入力された標準パター
ン作成環境情報中の入力ボリュームレベルの情報から、
ゲイン調整部2を指定されたレベルに設定する。制御部
12は更に、入力された標準パターン作成環境情報を標
準パターン記憶部6に格納(登録)する。
【0030】制御部12は、以上のようにして、利用者
操作に従う装置の使用環境設定を行ったならば、利用者
による標準パターン作成作業を表示部9或いはスピーカ
10から案内する。
【0031】これを受けて利用者(発声者、標準パター
ン作成者)は、標準パターン作成作業を開始して、登録
すべき語彙の音声をマイクロフォン1に向かって発声す
る。利用者の発声した音声は、マイクロフォン1により
入力され(て音声信号に変換され)、更にゲイン調整部
2にて、上記設定された入力ボリュームレベルのゲイン
に調整されて、特徴パラメータ抽出部3に送られる。特
徴パラメータ抽出部3は、この入力音声を分析してその
特徴パラメータを抽出する。
【0032】特徴パラメータ抽出部3により抽出された
特徴パラメータは、(標準パターン作成モードに設定さ
れている)モード切替部4を介して標準パターン作成部
5に送られる。標準パターン作成部5は、この特徴パラ
メータ(入力音声の特徴パラメータ)から標準パターン
を作成し、当該標準パターンを、先に標準パターン記憶
部6に格納した標準パターン作成環境情報に対応付けて
同じ標準パターン記憶部6に格納する。
【0033】なお、この標準パターン作成時に、利用者
がマイクロフォン1から入力した音声を例えばスピーカ
10から出力して利用者にフィードバックすることで、
入力ボリュームレベルが適切であるか否かを利用者自身
で確認させることも可能である。
【0034】以上の標準パターン作成環境情報と標準パ
ターンの組は、標準パターン記憶部6の容量の許す範囲
内で、複数個作成可能である。次に、利用者が、入力部
11を用いて音声認識モードを設定するための操作を行
った場合について説明する。この場合、音声認識モード
を設定するための情報が入力部11から制御部12に入
力される。制御部12は、この情報を受けてモード切替
部4を制御し、音声認識モードに切り替え設定させる。
【0035】制御部12は、音声認識モードが設定され
ると、そのモードで使用する標準パターンを利用者に選
択させるための処理を次のように行う。制御部12はま
ず、標準パターン記憶部6に格納されている標準パター
ン作成環境情報の中から、例えば格納(登録)順に従っ
て1つを取り出す。そして制御部12は、取り出した標
準パターン作成環境情報を、図3に示した標準パターン
作成時と同一形式で表示部9に表示する。但し、モード
は、作成モード(標準パターン作成モード)でなくて、
認識モード(音声認識モード)となる。
【0036】利用者は、表示部9に表示された標準パタ
ーン作成環境情報から、当該情報の示す使用環境が現在
の装置の環境に合致しているか否かを判断し、その判断
結果をもとに、当該情報の示す環境下で作成された標準
パターン(即ち当該情報と組をなして標準パターン記憶
部6に登録されている標準パターン)を音声認識用に選
択するか否かを決定する。
【0037】もし、選択しない場合には、利用者は、そ
の旨(no)を入力部11から入力する。すると制御部
12は、標準パターン記憶部6に格納されている標準パ
ターン作成環境情報の中から次の標準パターン作成環境
情報を取り出して、表示部9に再度表示する。
【0038】これに対して選択する場合には、利用者
は、その旨(yes)を入力部11から入力する。する
と制御部12は、現在表示部9に表示中の標準パターン
作成環境情報と組をなして標準パターン記憶部6に登録
されている標準パターンを音声認識用に決定(選択)
し、その標準パターン名を類似度計算部7に通知する。
また制御部12は、利用者の選択した標準パターンの標
準パターン作成環境情報に基づいて、複数の環境項目の
うち、装置側で制御可能な項目の状態を、当該情報の示
す状態に変更設定する。ここでは、標準パターン作成環
境情報の示す入力ボリュームレベルに一致するように、
ゲイン調整部2が調整される。一方、利用者は、表示部
9に表示されている(選択した標準パターンの)標準パ
ターン作成環境情報の項目をチェックし、装置側で自動
的に環境設定できない項目で現在の装置の環境と異なる
ものがあれば、この表示されている状態に手動で設定す
る。例えば、装置に接続されているマイクロフォン1
が、表示されているマイクロフォン(即ち、選択した標
準パターンの作成時に使用したマイクロフォン)と異な
る種類であれば、これを表示されているマイクロフォン
と同じ種類のものに交換する。
【0039】なお、標準パターン記憶部6内の格納(登
録)順で標準パターン作成環境情報を表示するのではな
く、現在の(音声認識モードにおける)装置の使用環境
に最も近い環境を示す標準パターン作成環境情報から順
に表示するようにしても構わない。この場合、利用者の
選択効率が向上する。
【0040】但し、本方式を適用するには、標準パター
ン記憶部6内の各標準パターン作成環境情報の示す使用
環境(作成環境)が装置の使用環境にどの程度近いか
(類似度)を調べる必要がある。そのための最も簡便な
方法は、一致する環境項目の数を求めて順位付けを行う
ことである。この際、環境項目毎に重みを付けてもよ
い。また、現在の使用環境のうち、制御部12が認識し
得ない項目、例えば標準パターン作成者に対応する利用
者(発声者)の氏名、性別、年齢、標準パターンの作成
場所に対応する利用場所(本装置の設置場所)、及び使
用マイクロフォンについては、利用者の操作により入力
部11から入力させる必要がある。このうち、氏名、性
別、年齢は、IDカード等から自動的に読み込むことも
可能である。また、標準パターンの作成年月日に対応す
る利用年月日については、本装置にカレンダー機能を持
たせることにより、自動的に検出可能である。この年月
日の項目の一致/不一致の判定は、例えば利用年月日と
作成年月日との差が所定の日数以内なら一致、そうでな
いならば不一致のように行う。
【0041】また、上記のように、標準パターン記憶部
6内の各標準パターン作成環境情報の示す使用環境(作
成環境)と装置の使用環境との類似度を求めるようにし
た場合、制御部12は、各標準パターンの作成時の環境
が、現在の装置の使用環境に適している度合や、各環境
項目毎の相違内容を、例えば表示部9を通して利用者に
通知することが可能となる。利用者は、この通知内容か
ら、現在の装置の使用環境に最も適した標準パターンを
簡単に選択することができる。また、装置の環境を、選
択した標準パターンの作成時の環境に利用者自身が変更
設定する場合に、どの環境項目をどのように変更すれば
よいか視認できるため便利である。
【0042】更に、上記の類似度をもとに、現在の装置
の使用環境に最も適した標準パターンを、制御部12が
自動選択することも可能である。この場合、選択した標
準パターンの作成時の環境と現在の装置の環境につい
て、各環境項目毎の相違内容を利用者に通知すること
で、装置側で自動的に環境設定できない項目で現在の装
置の環境と異なるものがあれば、この通知内容に従って
利用者に環境設定を行わせるようにしてもよい。また、
自動的に環境設定できる項目については、制御部12自
身が変更設定するようにしてもよい。
【0043】その他、利用者が望む環境を利用者自身に
より設定させ、その環境に適した標準パターンを制御部
12が選択するようにしてもよい。いずれの方式でも、
装置の使用環境と、選択された標準パターンの作成時の
使用環境(作成環境)との相違はなくなる(或いは少な
くなる)。
【0044】利用者は、この使用環境下で本装置を利用
する。即ち利用者は、マイクロフォン1に向かって(本
装置で認識させるべき)音声を発声する。この利用者の
発声した音声は、マイクロフォン1により入力され、ゲ
イン調整部2を介して特徴パラメータ抽出部3に送られ
る。
【0045】特徴パラメータ抽出部3は、この入力音声
を分析して特徴パラメータを抽出する。類似度計算部7
は、特徴パラメータ抽出部3により抽出された特徴パラ
メータ(特徴パターン)と、標準パターン記憶部6に登
録されている各標準パターンのうち、制御部12から通
知された標準パターン名を持つ標準パターン(即ち、利
用者が選択した或いは制御部12が自動的に選択した標
準パターン)との間の類似度を計算する。
【0046】認識結果出力部8は、類似度計算部7で計
算された最大類似度を示すカテゴリを認識結果として制
御部12に出力する。制御部12は、表示部9により得
られた認識結果を表示部9に表示する。
【0047】なお、前記実施例では、利用者への応答
(通知)は表示部9を介して行われるものとして説明し
たが、表示部9のみによらず、スピーカ10を用いても
よい。また、環境項目(標準パターン作成時の作成環境
及び装置の使用環境の環境項目)として、(標準パター
ン作成或いは音声認識に)装置が使用される場所の広さ
や残響特性、騒音レベルなどの音響的な環境の特性を含
めるようにしてもよい。この種の音響的な環境の特性が
標準パターン作成時と音声認識時とで相違する場合に
は、不特定話者方式の音声認識装置においても認識性能
が低下する。したがって、環境項目に音響的な環境の特
性を含めることは、特に不特定話者方式の音声認識装置
に適用した場合に効果がある。
【0048】
【発明の効果】以上詳述したように本発明によれば、音
声認識の際に、標準パターンを作成したときの使用条件
に合った環境で装置を利用することができるので、従来
であれば、使用環境の相違を利用者の記憶と個別の記録
によってのみ設定し直すことができたものを、利用者の
記憶に頼ることなく(更には自動的に)設定し直すこと
ができるため、標準パターン作成時と音声認識時の使用
環境の相違に起因する認識性能の低下を利用者に負担を
かけずに簡単に回避することができる。
【0049】また、本発明によれば、標準パターンが作
成されたときの作成環境を示す標準パターン作成環境情
報を利用者に通知することにより、音声入力を行う際の
使用環境と、標準パターン作成時の使用環境との間に相
違が生じる場合に、利用者に警告を与えることができ、
その相違が装置側で自動的に設定できない使用環境であ
っても、利用者を介して間接的に設定することができる
ので、認識性能の低下を確実に回避できる。
【0050】更に本発明によれば、使用環境を変更する
ことが困難な環境においても、その際の使用環境に適し
た標準パターンを選択することができるので、従来のよ
うに標準パターンを作成し直さなくても、認識性能の低
下を回避することができる。
【0051】このように本発明によれば、音声認識時と
標準パターン作成時の使用環境の相違を排除して、使用
環境の相違に起因する認識性能の低下を回避することが
できるようになり、装置の性能向上及び信頼性向上が図
れるなど、実用上多大なる効果が期待できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声認識装置の概略構
成を示すブロック図。
【図2】同実施例で適用される標準パターン作成環境情
報のデータ構造を示す図。
【図3】同実施例で適用される標準パターン作成環境情
報の画面表示例を示す図。
【符号の説明】
1…マイクロフォン、2…ゲイン調整部、3…特徴パラ
メータ抽出部、4…モード切替部、5…標準パターン作
成部、6…標準パターン記憶部、7…類似度計算部、8
…認識結果出力部、9…表示部(表示手段、使用環境相
違通知手段)、10…スピーカ、11…入力部、12…
制御部(選択手段、使用環境検出手段、使用環境相違通
知手段、使用環境変更制御手段、使用環境設定手段)。
フロントページの続き (72)発明者 中山 昭 東京都青梅市新町1381番地1 東芝コンピ ュータエンジニアリング株式会社内 (72)発明者 新田 恒雄 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町工場内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 標準パターン作成モードでは利用者が発
    声した音声から標準的な音声の特徴パターンである標準
    パターンを作成しておき、音声認識モードでは利用者が
    発声した音声を前記標準パターン作成モードにおいて作
    成された標準パターンを選択使用して認識する音声認識
    装置であって、 前記標準パターン作成時の装置の使用環境を示す標準パ
    ターン作成環境情報を、その標準パターンに対応付けて
    格納するための記憶手段と、 この記憶手段に格納されている標準パターン作成環境情
    報の示す使用環境を表示するための表示手段と、 前記音声認識モードでの音声認識に用いる標準パターン
    を前記記憶手段に格納されている標準パターンの中から
    利用者の選択操作に従って選択するための選択手段とを
    具備することを特徴とする音声認識装置。
  2. 【請求項2】 標準パターン作成モードでは利用者が発
    声した音声から標準的な音声の特徴パターンである標準
    パターンを作成しておき、音声認識モードでは利用者が
    発声した音声を前記標準パターン作成モードにおいて作
    成された標準パターンを選択使用して認識する音声認識
    装置であって、 前記標準パターン作成時の装置の使用環境を示す標準パ
    ターン作成環境情報を、その標準パターンに対応付けて
    格納するための記憶手段と、 前記音声認識モードにおける装置の使用環境を検出する
    使用環境検出手段と、 前記記憶手段に格納されている前記標準パターン作成環
    境情報の示す使用環境と前記使用環境検出手段によって
    検出された装置の使用環境との相違内容を利用者に通知
    するための使用環境相違通知手段と、 前記音声認識モードでの音声認識に用いる標準パターン
    を前記記憶手段に格納されている標準パターンの中から
    利用者の選択操作に従って選択するための選択手段とを
    具備することを特徴とする音声認識装置。
  3. 【請求項3】 標準パターン作成モードでは利用者が発
    声した音声から標準的な音声の特徴パターンである標準
    パターンを作成しておき、音声認識モードでは利用者が
    発声した音声を前記標準パターン作成モードにおいて作
    成された標準パターンを選択使用して認識する音声認識
    装置であって、 前記標準パターン作成時の装置の使用環境を示す標準パ
    ターン作成環境情報を、その標準パターンに対応付けて
    格納するための記憶手段と、 この記憶手段に格納されている標準パターン作成環境情
    報の示す使用環境を表示するための表示手段と、 前記音声認識モードでの音声認識に用いる標準パターン
    を前記記憶手段に格納されている標準パターンの中から
    利用者の選択操作に従って選択するための選択手段と、 この選択手段により選択された標準パターンと対応付け
    て前記記憶手段に格納されている標準パターン作成環境
    情報をもとに、装置の使用環境を当該環境情報の示す使
    用環境に変更制御する使用環境変更制御手段とを具備す
    ることを特徴とする音声認識装置。
  4. 【請求項4】 標準パターン作成モードでは利用者が発
    声した音声から標準的な音声の特徴パターンである標準
    パターンを作成しておき、音声認識モードでは利用者が
    発声した音声を前記標準パターン作成モードにおいて作
    成された標準パターンを選択使用して認識する音声認識
    装置であって、 前記標準パターン作成時の装置の使用環境を示す標準パ
    ターン作成環境情報を、その標準パターンに対応付けて
    格納するための記憶手段と、 前記音声認識モードにおける装置の使用環境を検出する
    使用環境検出手段と、 この使用環境検出手段によって検出された使用環境をも
    とに、当該使用環境に最も近い環境を示す標準パターン
    作成環境情報と対応付けて前記記憶手段に格納されてい
    る標準パターンを前記音声認識モードでの音声認識に用
    いる標準パターンとして選択する選択手段とを具備する
    ことを特徴とする音声認識装置。
  5. 【請求項5】 標準パターン作成モードでは利用者が発
    声した音声から標準的な音声の特徴パターンである標準
    パターンを作成しておき、音声認識モードでは利用者が
    発声した音声を前記標準パターン作成モードにおいて作
    成された標準パターンを選択使用して認識する音声認識
    装置であって、 前記標準パターン作成時の装置の使用環境を示す標準パ
    ターン作成環境情報を、その標準パターンに対応付けて
    格納するための記憶手段と、 前記音声認識モードにおける装置の使用環境を利用者の
    操作に従って設定するための使用環境設定手段と、 この使用環境設定手段によって設定された使用環境をも
    とに、当該使用環境に最も近い環境を示す標準パターン
    作成環境情報と対応付けて前記記憶手段に格納されてい
    る標準パターンを前記音声認識モードでの音声認識に用
    いる標準パターンとして選択する選択手段とを具備する
    ことを特徴とする音声認識装置。
JP6213468A 1994-09-07 1994-09-07 音声認識装置 Pending JPH0876784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6213468A JPH0876784A (ja) 1994-09-07 1994-09-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6213468A JPH0876784A (ja) 1994-09-07 1994-09-07 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0876784A true JPH0876784A (ja) 1996-03-22

Family

ID=16639711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6213468A Pending JPH0876784A (ja) 1994-09-07 1994-09-07 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0876784A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034293A (ja) * 1999-06-30 2001-02-09 Internatl Business Mach Corp <Ibm> 音声を転写するための方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034293A (ja) * 1999-06-30 2001-02-09 Internatl Business Mach Corp <Ibm> 音声を転写するための方法及び装置

Similar Documents

Publication Publication Date Title
US7949523B2 (en) Apparatus, method, and computer program product for processing voice in speech
US6385581B1 (en) System and method of providing emotive background sound to text
US6271841B1 (en) Information processor for changing a display in response to an input audio signal
US20090012793A1 (en) Text-to-speech assist for portable communication devices
GB2346001A (en) Communication device and method for screening speech recognizer input
KR20070026452A (ko) 음성 인터랙티브 메시징을 위한 방법 및 장치
JP2006234907A (ja) 音声認識方法
CN108762494A (zh) 显示信息的方法、装置及存储介质
US7302048B2 (en) Printer with speech transcription of a recorded voice message
CN112805734A (zh) 用于唤起对发言禁止用语的注意的演讲辅助装置
JP6749705B2 (ja) プレゼンテーション支援システム
JP2005099418A (ja) オブジェクト表示装置およびプログラム
WO2011122522A1 (ja) 感性表現語選択システム、感性表現語選択方法及びプログラム
JPH10326176A (ja) 音声対話制御方法
JP2008275987A (ja) 音声認識装置および会議システム
JP2001022370A (ja) 音声案内装置
JPH0876784A (ja) 音声認識装置
JP6884442B2 (ja) プレゼンテーション支援システム
KR100716134B1 (ko) 음량조절기능을 갖춘 금융 자동화기기
JP2006163227A (ja) 音声認識装置
JP2008040431A (ja) 音声加工装置
KR102000282B1 (ko) 청각 기능 보조용 대화 지원 장치
JP2000259389A (ja) 対話記録システム及び対話記録合成装置
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
KR102350890B1 (ko) 휴대용 청력검사장치