JP2001092493A - 音声認識修正方式 - Google Patents

音声認識修正方式

Info

Publication number
JP2001092493A
JP2001092493A JP27036999A JP27036999A JP2001092493A JP 2001092493 A JP2001092493 A JP 2001092493A JP 27036999 A JP27036999 A JP 27036999A JP 27036999 A JP27036999 A JP 27036999A JP 2001092493 A JP2001092493 A JP 2001092493A
Authority
JP
Japan
Prior art keywords
correction
character string
voice
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27036999A
Other languages
English (en)
Other versions
JP3718088B2 (ja
Inventor
Tetsuya Fujita
哲也 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP27036999A priority Critical patent/JP3718088B2/ja
Publication of JP2001092493A publication Critical patent/JP2001092493A/ja
Application granted granted Critical
Publication of JP3718088B2 publication Critical patent/JP3718088B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 誤認識された文字を効率良く修正することが
できる音声認識修正方式を提供すること。 【解決手段】 音声認識部12は、音声認識辞書14を
検索することにより、入力音声に対して音声認識処理を
行い、認識結果としての文字列データを特定する。この
文字列データに誤りがある場合に、利用者は、1文字あ
るいはn文字の修正用音声をマイクロホン10に向かっ
て発声し、修正用音声認識部16は、音声認識処理によ
ってこの修正用音声に対応する修正用データを特定す
る。文字置換部20は、文字列データの一部を順次修正
用データに置き換える。認識結果判定部26は、修正用
データに置き換えられた後の文字列データを利用者に通
知し、利用者の選択指示に従って最適な修正結果として
の文字列データを判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識処理の結
果得られた文字列の一部に誤りがある場合にこの誤り部
分の修正を行う音声認識修正方式に関する。
【0002】
【従来の技術】最近の車載用機器、例えばナビゲーショ
ン装置やオーディオ機器に各種の操作指示を与える方法
としては、利用者が操作パネルやリモートコントロール
(リモコン)ユニットに備わった各種のキーを押下する
方法の他に、利用者によって発せられた操作音声の内容
を音声認識することによって行う方法がある。この操作
音声の内容を音声認識する方法によれば、利用者は、各
種の操作キーの配置等を覚える必要がなく、しかも走行
中に車両が振動した状態でキーの操作を行わないですむ
ため、操作の簡略化が可能である。また、操作音声の内
容を音声認識する方法は、特に最近のプロセッサの高速
化等に伴って比較的精度の高い音声認識処理が可能にな
りつつあるため、音声認識を用いた操作指示方法は、車
載用機器についても汎用されている。
【0003】ところで、音声認識の対象となる操作音声
をマイクロホンによって集音する場合に、同時にロード
ノイズやエンジンノイズ等が操作音声とともに集音され
るため、静かな環境下で音声を集音する場合に比べて音
声認識の認識率が低下する。したがって、通常は誤認識
した音声の内容を修正する必要がある。認識結果として
得られた文字列の一部に誤りがあった場合には、利用者
は、再度同じ内容の音声を少し声の調子を変えて、例え
ば明瞭に発音するようにして発声し、2回目の音声認識
処理が行われる。このようにして、同じ音声に対して何
度か音声認識処理を繰り返すことにより、最終的に正し
い認識結果としての文字列が得られるようになる。
【0004】
【発明が解決しようとする課題】ところで、上述した従
来の音声認識結果の修正方法は、利用者が同じ音声を発
声してその内容に対して音声認識処理が繰り返されるた
め、認識率が悪い単語を発声した場合に、何度も同じ音
声の発声を繰り返すことになり、修正に手間がかかると
いう問題があった。例えば、認識結果としての文字列を
表示させ、その中の修正箇所にカーソルを移動して、直
接キーボード等から修正データを入力することができれ
ばこのような不都合は生じないが、車載用機器の操作を
音声認識処理を用いて行う場合には、利用者による50
音等のキー入力が容易ではないため、音声を入力するこ
とによって効率よく認識結果の修正を行う方法が望まれ
ている。
【0005】本発明は、このような点に鑑みて創作され
たものであり、その目的は、誤認識された文字を効率良
く修正することができる音声認識修正方式を提供するこ
とにある。
【0006】
【課題を解決するための手段】上述した課題を解決する
ために、本発明の音声認識修正方式では、第1の音声認
識手段によって、入力音声に対して音声認識処理を行っ
て、複数の文字からなる認識結果としての文字列データ
を得るとともに、第2の音声認識手段によって、この得
られた文字列データの中の誤認識箇所を修正するために
入力された修正用音声に対して音声認識処理を行って、
1文字以上のn文字からなる修正用データを取得してい
る。そして、上述した第1の音声認識手段によって得ら
れた文字列データの一部を、上述した第2の音声認識手
段によって得られた修正用データに置き換えている。誤
認識箇所を修正する際に、上述した第2の音声認識装置
によって音声認識処理を行うことにより、1文字以上の
n文字からなる修正用データを取得しているので、従来
のように、修正用データを入力する際にキーボード等の
操作部を操作する必要がなく誤認識箇所を修正する際の
操作の簡略化が可能となる。また、誤認識された箇所に
対応して修正に必要な音声のみを入力して認識結果の修
正を行っているので、従来のように認識させたい音声を
声の調子等を変えて何度も入力する手間が省け、効率よ
く認識結果の修正を行うことができる。
【0007】また、修正候補通知手段によって、文字列
データの中で修正用データに置き換えが可能な修正箇所
を通知し、修正箇所選択手段によって、この通知された
1あるいは複数の修正箇所の中から、利用者の操作に応
じていずれかを選択することが望ましい。修正用データ
によって置き換えが可能な修正箇所であるか否かの判断
については、例えば、置き換えが行われた文字列データ
が、一般的に用いられる言葉(単語)として存在するか
否かを調べることにより判断すればよい。また、特定の
操作指示等に対応する音声のみを音声認識の対象として
いる場合であれば、特定の操作指示に対応した言葉の中
に、置き換え後の文字列が含まれるか否かを判断しても
よい。このように、文字列データの一部を修正用データ
に置き換えることが可能な修正箇所だけを通知し、置き
換えが不可能な修正箇所については通知しないようにす
ることで、通知する必要のない情報を排除することがで
き、修正箇所に関する通知が煩雑になることを防ぐこと
ができる。また、通知された1あるいは複数の修正箇所
の中から修正箇所として適しているものを利用者の操作
に応じて選択することにより、利用者の意図に沿った修
正内容を確実に反映させることができる。
【0008】また、上述した第1の音声認識手段による
音声認識処理に用いられる音声認識辞書を備え、文字列
置き換え手段によって修正用データの置き換えが行われ
た修正後の文字列データに基づいて、音声認識辞書の内
容を更新することが望ましい。文字列データの修正が行
われたということは、もとの文字列データに対応した音
声に対する認識率が低いということなので、この音声に
対応する音声認識辞書の内容を修正後の文字列データに
基づいて更新することにより、認識率を向上させること
ができる。
【0009】
【発明の実施の形態】以下、本発明の音声認識修正方式
を適用した一実施形態の音声認識装置およびこの音声認
識装置を含んで構成された車載用システムについて図面
を参照しながら説明する。
【0010】〔第1の実施形態〕図1は、第1の実施形
態の車載用システムの構成を示す図である。図1に示す
車載用システムは、利用者から音声により与えられる各
種の入力指示に対応してナビゲーション処理等の各種動
作を行うものであり、利用者が発した音声に対して音声
認識処理を行って利用者の発声した音声に対応する文字
列を特定する音声認識装置1と、自車位置を検出して自
車位置周辺の地図を表示したり、利用者によって選択さ
れた目的地までの経路探索および経路誘導等を行うナビ
ゲーション装置2と、音声認識装置1から出力される音
声認識結果やナビゲーション装置2から出力される自車
位置周辺の地図画像等を表示するディスプレイ装置3
と、音声認識装置1から出力される音声認識結果やナビ
ゲーション装置2から出力される各種の案内音声等を出
力するオーディオ部4とを備えている。
【0011】上述した音声認識装置1は、マイクロホン
10、音声認識部12、音声認識辞書14、修正用音声
認識部16、修正用辞書18、文字列置換部20、修正
候補検索部22、修正候補格納部24、認識結果判定部
26、画像生成部28、辞書更新部30を含んで構成さ
れている。
【0012】マイクロホン10は、利用者から発声され
た音声を集音して電気信号に変換する。音声認識部12
は、音声認識辞書14を検索することにより、マイクロ
ホン10を介して入力された音声信号に対して音声認識
処理を行い、利用者が発声した音声に対応する文字列デ
ータを特定する。
【0013】修正用音声認識部16は、音声認識結果を
修正する際に必要な修正用音声が入力されたときに、修
正用辞書18を検索することにより、この修正用音声に
対して音声認識処理を行い、修正用音声に対応する文字
データ(これを、以後「修正用データ」と称する)を特
定する。本実施形態では、修正用音声として1音の文字
を考えるものとする。
【0014】文字列置換部20は、音声認識部12によ
って特定された文字列データと修正用音声認識部16に
よって特定された修正用データとを取得し、文字列デー
タに含まれる各文字データを修正用データに置換した文
字列データを生成する。具体的には、例えば、音声認識
部12によって特定された文字列データが「たきざわ」
であり、修正用音声認識部16によって特定された修正
用データが「か」であるとすると、文字列置換部20
は、文字列データ「たきざわ」に含まれる文字データ
「た」と修正用データ「か」を置換した文字列データ
「かきざわ」と、文字列データ「たきざわ」に含まれる
文字データ「き」と修正用データ「か」を置換した文字
列データ「たかざわ」と、文字列データ「たきざわ」に
含まれる文字データ「ざ」と修正用データ「か」を置換
した文字列データ「たきかわ」と、文字列データ「たき
ざわ」に含まれる文字データ「わ」と修正用データ
「か」を置換した文字列データ「たきざか」とを生成す
る。
【0015】修正候補検索部22は、音声認識辞書14
を検索し、文字列置換部20によって生成された各文字
列データ(置換処理後の各文字列データ)が、音声認識
の対象となる文字列として音声認識辞書14に登録され
ているか否かを調べる。各文字列データが音声認識辞書
14に登録されていた場合には、修正候補検索部22
は、その文字列データを「修正候補データ」として修正
候補格納部24に格納する。
【0016】認識結果判定部26は、音声認識部12に
よって得られた音声認識結果を利用者に対して通知し、
利用者から与えられる指示入力に基づいて音声認識結果
の適否を判定して出力する。また、音声認識結果が誤っ
ていた場合には、認識結果判定部26は、修正候補検索
部22によって抽出された音声認識結果の修正候補を利
用者に対して通知し、利用者から与えられる指示入力に
基づいて最適な修正結果を判定して出力する。この認識
結果判定部26によって判定された音声認識結果または
最適な修正結果が、音声認識装置1からの出力としてナ
ビゲーション装置2に向けて出力される。
【0017】画像生成部28は、認識結果判定部26か
ら与えられる指示に基づいて、音声認識結果や音声認識
結果の修正候補等の各種画像を表示するための画像デー
タを生成する。画像生成部28によって生成され表示さ
れる画像の具体的な表示例については後述する。
【0018】辞書更新部30は、認識結果判定部26か
ら出力される情報に基づいて音声認識結果に対して修正
が行われたか否かを調べ、修正が行われた場合には、修
正結果に基づいて音声認識辞書14に格納されたデータ
の内容を更新する。
【0019】上述した音声認識部12、音声認識辞書1
4が第1の音声認識手段に、修正用音声認識部16、修
正用辞書18が第2の音声認識手段に、文字列置換部2
0が文字列置き換え手段に、修正候補検索部22、修正
候補格納部24、認識結果判定部26、画像生成部2
8、ディスプレイ装置3が修正候補通知手段に、認識結
果判定部26が修正箇所選択手段に、辞書更新部30が
辞書更新手段にそれぞれ対応している。
【0020】本実施形態の車載用システムは上述した構
成を有しており、次に、音声認識装置1において行われ
る音声認識処理について詳細に説明する。図2および図
3は、音声認識装置1において行われる音声認識処理の
動作を示す流れ図である。例えば、ナビゲーション装置
2に対して、経路探索を行う際の出発地名や目的地名を
音声で入力する場合を考え、利用者により音声入力され
た文字列「かきざわ」が文字列「たきざわ」に誤認識さ
れ、これを文字列「かきざわ」に修正する際の動作につ
いて説明する。
【0021】音声認識部12は、マイクロホン10を介
して利用者から音声入力が行われたか否かを判定する
(ステップ100)。音声入力が行われるまで、ステッ
プ100において否定判断がなされて待機状態となる。
音声入力が行われると、音声認識部12は、音声認識辞
書14を用いて音声認識処理を行い、利用者が発声した
音声に対応する文字列データを特定する(ステップ10
1)。上述した例では、文字列データとして「たきざ
わ」が特定される。音声認識部12によって得られた音
声認識結果は認識結果判定部26に出力される。
【0022】認識結果判定部26は、音声認識結果を表
示するための画像データを生成するよう画像生成部28
に指示を行うとともに、音声認識結果を音声で出力する
ための音声データを生成してオーディオ部4に出力す
る。この結果、ディスプレイ装置3の画面上に音声認識
結果が表示されるとともに、オーディオ部4から音声認
識結果に対応する音声が出力され、音声認識結果が利用
者に対して通知される(ステップ102)。
【0023】図4は、音声認識結果の表示例を示す図で
ある。図4に示すように、ディスプレイ装置3の画面上
に、音声認識結果が「たきざわ」である旨の表示と、こ
の音声認識結果が誤っている場合には修正用音声を入力
するように促す表示とが行われる。また、図4に示した
ような表示と並行して、オーディオ部4から、例えば、
「音声認識結果は「たきざわ」でよろしいですか?」等
のアナウンスが出力される。
【0024】上述したようにして利用者に対して音声認
識結果が通知されると、認識結果判定部26は、一定時
間(例えば、30秒間)が経過したか否かを判定し(ス
テップ103)、一定時間が経過していない場合には、
音声入力が行われたか否かを判定する(ステップ10
4)。音声入力が行われずに一定時間が経過すると、ス
テップ103において肯定判断がなされ、認識結果判定
部26は、音声認識結果をナビゲーション装置2に向け
て出力する(ステップ105)。また、一定時間が経過
する前に利用者によって音声入力が行われた場合には、
ステップ104において肯定判断がなされ、認識結果判
定部26は、入力された音声が一文字であるか否かを判
定する(ステップ106)。例えば、入力された音声が
一文字であるか否かについては修正用音声認識部16が
常に監視しており、認識結果判定部26は、修正用音声
認識部16から得られる情報に基づいて、入力音声が一
文字であるか否かを判定する。
【0025】入力音声が一文字でない場合には、ステッ
プ106において否定判断がなされ、認識結果判定部2
6は、入力された音声は認識結果修正用の音声ではな
く、次の操作指示等に関する音声であると判断し、上述
したステップ101において得られた音声認識結果をナ
ビゲーション装置2に向けて出力する(ステップ10
7)。その後、ステップ101に戻り、次の操作指示等
に関する入力音声(ステップ104での判定処理の対象
となった入力音声)に対して音声認識処理以降の動作を
行う。
【0026】また、入力された音声が一文字であった場
合には、修正用音声認識部16は、入力された音声が認
識結果修正用の音声であると判断し、この音声に対して
修正用辞書18を用いて音声認識処理を行い、この音声
に対応する修正用データを特定する(ステップ10
8)。上述した例では、誤認識されている「たきざわ」
を「かきざわ」に修正するために利用者によって「か」
が音声入力されるので、この音声「か」に対して音声認
識処理が行われ、対応する修正用データが特定される。
【0027】次に、文字列置換部20は、修正対象とな
る文字列データを音声認識部12から取得するととも
に、修正用データを修正用音声認識部16から取得する
(ステップ109)。その後、文字列置換部20は、修
正対象の文字列データに含まれる最初の文字データを修
正用データと置換し、修正候補検索部22に出力する
(ステップ110)。上述した例では、修正対象の文字
列データ「たきざわ」の最初の文字データ「た」が修正
用データ「か」に置換されて生成された文字列データ
「かきざわ」が出力される。
【0028】修正候補検索部22は、音声認識辞書14
を検索し、文字列置換部20から出力された文字列デー
タ(置換後の文字列データ)が音声認識の対象となる文
字列として音声認識辞書14に登録されているか否かを
調べる(ステップ111)。置換後の文字列データが音
声認識辞書14に登録されている場合には、修正候補検
索部22は、この文字列データを修正候補データとして
修正候補格納部24に格納する(ステップ112)。ま
た、置換後の文字列データが音声認識辞書14に登録さ
れていない場合には、ステップ111において否定判断
がなされ、この場合には、修正候補検索部22は、ステ
ップ112に示した修正候補データの格納動作を行わな
い。
【0029】次に、文字列置換部20は、修正対象の文
字列データに含まれる最後の文字データが修正用データ
に置き換えられたか否かを調べることにより、文字列の
置換処理が完了したか否かを判定する(ステップ11
3)。置換処理が完了していない場合には、ステップ1
13において否定判断がなされ、文字列置換部20は、
次に置換処理の対象となる文字データを修正用データと
置換する(ステップ114)。上述した例では、文字列
データ「たきざわ」の2文字目の文字データ「き」が修
正用データ「か」と置換され、文字列データ「たかざ
わ」が出力される。また、2回目以降の処理では、文字
列データ「たきざわ」の3文字目の文字データ「ざ」が
修正用データ「か」と置換された文字列データ「たきか
わ」、および文字列データ「たきざわ」の最後の文字デ
ータ「わ」が修正用データ「か」と置換された文字列デ
ータ「たきざか」がそれぞれ出力される。置換処理が行
われると、ステップ111に戻って、置換後の文字列デ
ータが音声認識辞書14に格納されているか否かの判定
以降の動作が繰り返される。
【0030】置換処理が完了するとステップ113にお
いて肯定判断がなされ、次に、認識結果判定部26は、
修正候補格納部24に修正候補データが格納されている
か否かを判定する(ステップ115)。修正候補データ
が格納されていた場合には、認識結果判定部26は、こ
の修正候補データを読み出し、画像生成部28に指示を
送り、修正候補の表示を行う(ステップ116)。図5
は、修正候補の表示例を示す図であり、修正候補データ
として、「かきざわ」、「たかざわ」、「たきかわ」、
「たきざか」の各々に対応する文字列データが格納され
ていた場合の表示例を示している。図5に示すように、
各修正候補に対して、「1:かきざわ」、「2:たかざ
わ」、「3:たきかわ」、「4:たきざか」というよう
に番号が付加されて表示が行われるとともに、最適な修
正結果に対応する番号を選択するよう利用者に対して促
す表示が行われる。
【0031】表示された修正候補の中から修正結果とし
て適するものが利用者により選択されると、認識結果判
定部26は、選択された修正候補に対応する修正候補デ
ータを音声認識結果としてナビゲーション装置2に向け
て出力する(ステップ117)。上述した例では、1番
の「かきざわ」が利用者によって選択されるものとす
る。なお、利用者による修正候補の選択方法としては、
各修正候補に付加しておいた番号を所定の操作部(図示
せず)を介して利用者に選択させるようにしてもよく、
また、利用者に番号を音声入力してもらい、これに対し
て音声認識処理を行って修正候補を選択するようにして
もよい。
【0032】次に、辞書更新部30は、修正後の音声認
識結果に関する情報を認識結果判定部26から取得し、
この音声認識結果に対応して音声認識辞書14の内容を
更新する(ステップ118)。音声認識辞書14の内容
の更新が行われた後は、ステップ100に戻り、音声入
力が行われたか否かの判定以降の動作が繰り返される。
【0033】また、上述したステップ115において、
修正候補が格納されていなかった場合には、修正対象の
文字列データに2箇所以上の誤認識箇所が含まれている
等の理由により修正候補が抽出不可能であったと考えら
れるので、認識結果判定部26は、画像生成部28に指
示を送り、利用者に対して、音声認識結果の修正ができ
なかったことを知らせ、音声入力を再度行うよう促すエ
ラー通知を表示する(ステップ119)。エラー通知が
行われると、ステップ100に戻り、音声入力が行われ
たか否かの判定以降の動作が繰り返される。
【0034】このように、本実施形態の音声認識装置1
では、音声認識部12によって得られた文字列データに
含まれる誤認識箇所に対する修正を行う場合に、修正用
音声認識部16によって音声認識処理を行って修正用デ
ータを取得し、この修正用データを音声認識部12によ
って得られた文字列データの一部と置き換えることによ
り誤認識箇所の修正を行っている。したがって、従来の
ように認識させたい文字列データに対応する音声を声の
調子等を変えて何度も入力する等の手間がなく、効率よ
く認識結果の修正を行うことができる。また、修正用デ
ータの入力を音声入力により行っているので、キーボー
ド等の操作部を用いる必要がなく、操作を簡略化するこ
とができる。また、音声認識部12によって得られた文
字列データの一部を修正用データと置き換える際に、置
き換えが行われた文字列データが音声認識辞書14に登
録されているか否かを調べることにより、登録されてい
る文字列データだけを抽出して利用者に通知している。
すなわち、文字列データの一部を修正用データに置き換
えることが可能な修正箇所だけを利用者に通知している
ということであり、修正箇所に関する通知内容が煩雑に
なるのを防ぐことができる。また、修正箇所として適し
ているものを利用者の操作に対応して選択しているの
で、利用者の意図に沿った修正を確実に行うことができ
る。しかも、認識結果に対して修正を行った場合には、
この修正結果に対応して音声認識辞書14の内容を更新
しているので、音声認識処理を繰り返し行うことにより
認識率を向上させることができるという利点も有する。
【0035】〔第2の実施形態〕ところで、上述した第
1の実施形態では、音声認識結果に含まれる誤認識箇所
が一文字のみの場合について説明したが、同様な処理手
順により複数の文字が誤認識されている場合についても
音声により修正を行うことができる。
【0036】図6および図7は、図1に示した音声認識
装置1において行われる音声認識処理の動作の変形例を
示す流れ図であり、音声認識処理によって得られた文字
列データの中の一文字以上のn文字について修正を行う
場合の動作手順が示されている。図6および図7に示し
た動作手順は、図2および図3に示した動作手順に対し
て、入力音声が一文字であるか否かを判定するステップ
106の動作を、利用者による修正指示があったか否か
を判定するステップ106Aの動作に置き換えるととも
に、修正対象の文字列データに含まれる最初の文字デー
タを修正用データに置き換えるステップ110の動作
を、文字列データの最初のn文字を修正用データに置き
換えるステップ110Aの動作に置き換えた点が異なっ
ている。
【0037】すなわち、上述した第1の実施形態では、
入力音声が一文字であるか否かを判定することによっ
て、この入力音声が修正用の音声なのか、それとも次の
通常の操作用の音声なのかを区別していたため、修正用
の音声として複数文字が許容される場合には、このよう
な区別を行うことができなくなる。このため、利用者に
よって何らかの修正指示がなされた後に入力された音声
を修正用の音声として取り扱うことにしている。
【0038】修正用音声の入力に先立って、利用者によ
る修正指示がなされない場合には、ステップ106Aの
判定動作において否定判断が行われ、次に、認識結果判
定部26は、入力された音声が認識結果修正用の音声で
はなく、次の操作指示等に関する音声であると判断し、
認識結果をナビゲーション装置2に向けて出力するステ
ップ107以降の動作が行われる。
【0039】一方、修正用音声の入力に先立って、利用
者による修正指示がなされた場合には、ステップ106
Aの判定動作において肯定判断が行われ、次に、修正用
音声認識部16は、入力された音声が認識結果修正用の
音声であると判断し、この音声に対する音声認識処理を
行うステップ108以降の動作が行われる。
【0040】また、利用者によって修正指示を行う具体
的な方法としてはいくつかの方法が考えられる。例え
ば、操作部(図示せず)の特定キーが押下されたときに
修正指示がなされたものと判定したり、利用者が特定の
言葉をマイクロホン10に向かって発声したときに修正
指示がなされたものと判定する場合などが考えられる。
【0041】このように、認識結果としての文字列デー
タの修正を行う際に、利用者に何らかの意思表示をさせ
ることにより、複数文字(一文字であってもよい)を対
象にした修正が可能になる。
【0042】また、利用者によって修正指示がなされた
後に入力される修正用の音声の文字数nは、あらかじめ
設定された固定値を用いることもできるが、その都度自
由に設定するようにしてもよい。例えば、特に修正用文
字の文字数nが設定されておらず、修正用音声に対する
音声認識処理によって得られた修正用データの文字数を
このnの値として採用するようにしてもよい。この場合
には、認識結果としての文字列の誤り箇所を利用者が判
断し、その都度最適な文字数の修正用音声をマイクロホ
ン10に向かって発声すればよいため、さらに効率よく
認識結果の修正を行うことができる。
【0043】なお、本発明は上記実施形態に限定される
ものではなく、本発明の要旨の範囲内において種々の変
形実施が可能である。例えば、上述した実施形態では、
車載用システムにおいて、本発明を適用した音声認識装
置1を用いてナビゲーション装置2に対して所定の指示
入力を行う場合について説明したが、これ以外にも、例
えば、オーディオ装置等の他の車載用機器に対して所定
の指示入力を行うようにしてもよい。また、車載用シス
テム以外の各種システム、例えば、パーソナルコンピュ
ータやワークステーション等の各種コンピュータに対し
て各種の指示入力を行うような場合においても、本発明
を適用することができる。
【0044】
【発明の効果】上述したように、本発明によれば、音声
認識処理の結果得られた文字列の一部に誤認識箇所があ
る場合に、所定文字数の修正用音声を入力し、この修正
用音声に対して音声認識処理を行って修正用データを取
得し、文字列データに含まれる誤認識箇所をこの修正用
データに置き換えることにより認識結果の修正を行って
いるため、従来のように認識させたい文字列データに対
応する音声を声の調子等を変えて何度も入力する等の手
間がなく、効率よく認識結果の修正を行うことができ
る。また、修正用データの入力を音声入力により行って
いるので、キーボード等の操作部を用いる必要がなく、
操作を簡略化することができる。
【図面の簡単な説明】
【図1】第1の実施形態の車載用システムの構成を示す
図である。
【図2】音声認識装置において行われる音声認識処理の
動作を示す流れ図である。
【図3】音声認識装置において行われる音声認識処理の
動作を示す流れ図である。
【図4】音声認識結果の表示例を示す図である。
【図5】修正候補の表示例を示す図である。
【図6】音声認識装置において行われる音声認識処理の
変形例の動作を示す流れ図である。
【図7】音声認識装置において行われる音声認識処理の
変形例の動作を示す流れ図である。
【符号の説明】
1 音声認識装置 2 ナビゲーション装置 3 ディスプレイ装置 4 オーディオ部 10 マイクロホン 12 音声認識部 14 音声認識辞書 16 修正用音声認識部 18 修正用辞書 20 文字列置換部 22 修正候補検索部 24 修正候補格納部 26 認識結果判定部 28 画像生成部 30 辞書更新部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力音声に対して音声認識処理を行っ
    て、複数の文字からなる認識結果としての文字列データ
    を得る第1の音声認識手段と、 入力される修正用音声に対して音声認識処理を行って、
    1文字以上のn文字からなる修正用データを得る第2の
    音声認識手段と、 前記第1の音声認識手段によって得られた前記文字列デ
    ータの一部を前記第2の音声認識手段によって得られた
    前記修正用データに置き換える文字列置き換え手段と、 を備え、前記第1の音声認識手段による認識結果の修正
    を行うことを特徴とする音声認識修正方式。
  2. 【請求項2】 請求項1において、 前記文字列置き換え手段によって、前記文字列データの
    中で前記修正用データに置き換えが可能な修正箇所を通
    知する修正候補通知手段と、 前記修正候補通知手段によって通知された1あるいは複
    数の前記修正箇所の中から、利用者の操作に応じていず
    れかを選択する修正箇所選択手段と、 を備えることを特徴とする音声認識修正方式。
  3. 【請求項3】 請求項1または2において、 前記第1の音声認識手段による音声認識処理に用いられ
    る音声認識辞書と、 前記文字列置き換え手段によって前記修正用データの置
    き換えが行われた修正後の文字列データに基づいて、前
    記音声認識辞書の内容を更新する辞書更新手段と、 を備えることを特徴とする音声認識修正方式。
JP27036999A 1999-09-24 1999-09-24 音声認識修正方式 Expired - Fee Related JP3718088B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27036999A JP3718088B2 (ja) 1999-09-24 1999-09-24 音声認識修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27036999A JP3718088B2 (ja) 1999-09-24 1999-09-24 音声認識修正方式

Publications (2)

Publication Number Publication Date
JP2001092493A true JP2001092493A (ja) 2001-04-06
JP3718088B2 JP3718088B2 (ja) 2005-11-16

Family

ID=17485314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27036999A Expired - Fee Related JP3718088B2 (ja) 1999-09-24 1999-09-24 音声認識修正方式

Country Status (1)

Country Link
JP (1) JP3718088B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208643A (ja) * 2004-01-20 2005-08-04 Microsoft Corp ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
JP2005316022A (ja) * 2004-04-27 2005-11-10 Aisin Aw Co Ltd ナビゲーション装置及びプログラム
JP2008164975A (ja) * 2006-12-28 2008-07-17 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
JP2009210747A (ja) * 2008-03-04 2009-09-17 Nippon Hoso Kyokai <Nhk> 関連文書選択出力装置及びそのプログラム
US8145487B2 (en) 2007-02-16 2012-03-27 Denso Corporation Voice recognition apparatus and navigation apparatus
WO2016137071A1 (ko) * 2015-02-26 2016-09-01 주식회사 큐키 적어도 하나의 의미론적 유닛의 집합을 음성을 이용하여 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US11798558B2 (en) 2019-07-02 2023-10-24 Fujitsu Limited Recording medium recording program, information processing apparatus, and information processing method for transcription

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208643A (ja) * 2004-01-20 2005-08-04 Microsoft Corp ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
JP4657736B2 (ja) * 2004-01-20 2011-03-23 マイクロソフト コーポレーション ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
JP2005316022A (ja) * 2004-04-27 2005-11-10 Aisin Aw Co Ltd ナビゲーション装置及びプログラム
JP2008164975A (ja) * 2006-12-28 2008-07-17 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
US8145487B2 (en) 2007-02-16 2012-03-27 Denso Corporation Voice recognition apparatus and navigation apparatus
JP2009210747A (ja) * 2008-03-04 2009-09-17 Nippon Hoso Kyokai <Nhk> 関連文書選択出力装置及びそのプログラム
WO2016137071A1 (ko) * 2015-02-26 2016-09-01 주식회사 큐키 적어도 하나의 의미론적 유닛의 집합을 음성을 이용하여 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US11798558B2 (en) 2019-07-02 2023-10-24 Fujitsu Limited Recording medium recording program, information processing apparatus, and information processing method for transcription

Also Published As

Publication number Publication date
JP3718088B2 (ja) 2005-11-16

Similar Documents

Publication Publication Date Title
JP3990075B2 (ja) 音声認識支援方法及び音声認識システム
US6012028A (en) Text to speech conversion system and method that distinguishes geographical names based upon the present position
US7310602B2 (en) Navigation apparatus
EP1542207B1 (en) Speech recognition method and apparatus
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP5263875B2 (ja) 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
US6879953B1 (en) Speech recognition with request level determination
JP3104661B2 (ja) 日本語文章作成装置
JP3718088B2 (ja) 音声認識修正方式
JP4604377B2 (ja) 音声認識装置
JP2007286358A (ja) ナビゲーション装置及びその住所入力方法
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
CN111739525A (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2005275228A (ja) ナビゲーション装置
JP3726783B2 (ja) 音声認識装置
JP2000122685A (ja) ナビゲーションシステム
JP4268325B2 (ja) 音声操作語句の提示装置及び提示方法
JPH07319383A (ja) 地図表示装置
JP2008058452A (ja) 音声情報認証装置及び音声情報認証方法
US20110218809A1 (en) Voice synthesis device, navigation device having the same, and method for synthesizing voice message
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP2000056795A (ja) 音声認識装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
WO2019234486A1 (en) Speech recognition system, information processing device and server
JP2001306088A (ja) 音声認識装置及び処理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050901

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080909

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090909

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100909

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100909

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110909

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees