JP2010276869A

JP2010276869A - 自動翻訳対応電話機および自動翻訳対応電話システム

Info

Publication number: JP2010276869A
Application number: JP2009129466A
Authority: JP
Inventors: Katsuhiro Morisada; 克博森貞
Original assignee: Funai Electric Co Ltd
Current assignee: Funai Electric Co Ltd
Priority date: 2009-05-28
Filing date: 2009-05-28
Publication date: 2010-12-09

Abstract

【課題】話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制するとともに、話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能な自動翻訳対応電話機を提供する。
【解決手段】この発信元電話機１０（自動翻訳対応電話機）は、日本語によって話者が発する音声が入力される集音器１２ａと、話者が発する音声に関する情報を予め登録して記憶するためのメモリ１８と、話者が発する音声に関する情報に基づいて、話者が発する音声を日本語に対応する文字として認識するための音声認識部１９と、文字を音声として出力するスピーカ１２ｂと、話者が発する音声に関する情報を登録する際に、話者が発する音声を日本語に対応する文字として認識した結果に基づいて、文字を音声として出力するようにスピーカ１２ｂを制御する制御部１３とを備える。
【選択図】図３

Description

この発明は、自動翻訳対応電話機および自動翻訳対応電話システムに関し、特に、音声を認識する音声認識部を備える自動翻訳対応電話機および自動翻訳対応電話システムに関する。

従来、音声を認識する音声認識部を備える自動翻訳対応電話機などが知られている（たとえば、特許文献１〜５参照）。

上記特許文献１には、ユーザの音声が入力されるマイクロホンと、それ自体で母国語の意味を有する母国語フレーズ、母国語フレーズに対応した外国語フレーズおよび音声認識ソフトウェアが記憶されたメモリと、音声認識ソフトウェアを実行するデジタルプロセッサと、スピーカとを備えた外国語翻訳器が開示されている。上記特許文献１に記載の外国語翻訳器は、ユーザに発声させた母国語フレーズをメモリに記憶させるためのトレーニング機能を有し、ユーザに母国語フレーズを発声させた後に、再度、ユーザに同一の母国語フレーズを発声（復唱）させるように構成されている。この際、両フレーズが一致したとデジタルプロセッサが判断した場合には、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されている。一方、両フレーズが一致しないとデジタルプロセッサが判断した場合には、スピーカを介して、一致しなかった旨を音声によって出力することによってユーザに通知するように構成されている。また、上記特許文献１に記載の外国語翻訳器は、翻訳機能を有し、トレーニング機能において登録された母国語フレーズがマイクロホンに入力された際に、入力された母国語フレーズに対応した外国語フレーズをスピーカを介して音声によって出力するように構成されている。

また、上記特許文献２には、顧客の電話からの音声が入力される通信部と、顧客の電話の位置情報を発信電話番号から取得する位置情報取得処理部と、取得した位置情報を含む地域の方言辞書を選択する辞書選択処理部と、顧客の電話から入力された音声に対して単語を抽出する音声認識処理部と、抽出された単語に方言の単語が含まれるか否かを判定し、選択された方言辞書を用いて方言の単語を標準語の単語へ変換する変換処理部と、変換された標準語の単語を表示するディスプレイとを備えた対話支援装置が開示されている。

また、上記特許文献３には、電話回線から入力される利用者の音声を文字として認識する音声認識装置と、利用者によって入力された通信相手の電話番号に基づいて通話相手の母国語を決定するとともに、認識された文字を通話相手の母国語に翻訳して翻訳データを作成する翻訳装置と、翻訳データを音声にして通話相手に出力するための音声合成装置とを備えた通訳装置が開示されている。

また、上記特許文献４には、発声者の音声の入力を受け付け、入力された音声を音声データに変換する音声データ変換部と、地方情報が記憶された地方情報データベースと、音声データに含まれるイントネーションなどと地方情報とを比較することによって、発声者の出身地を認識するための発声者情報分析部と、認識された出身地を音声データ変換部に入力された音声と合わせてテキストデータとして出力する出力部とを備えたデータ認識システムが開示されている。

また、上記特許文献５には、電話端末からの入力音声情報を受信および送信する通信部と、受信した入力音声情報を認識する音声認識部と、電話端末の市外局番を検出する市外局番検出部と、市外局番ごとにそれぞれ登録された複数の音声情報データベースと、認識した入力音声情報に対応する出力音声情報を市外局番に対応する音声情報データベースの中から検索する音声情報検索部と、検索された出力音声情報を送信部を介して電話端末に送信する音声情報出力部とを備えた音声応答装置が開示されている。上記特許文献５に記載の音声応答装置は、認識した入力音声情報に対応する出力音声情報を、市外局番に対応する音声情報データベースの中から検索して送信することによって、電話端末の位置する地域の言葉（方言）を用いた音声応答サービスを提供することが可能なように構成されている。

特表２００３−５１５８１６号公報特開２００５−３３１６０８号公報特開２００２−７３６０５号公報特開２００２−１１６７８９号公報特開２００４−９６３８１号公報

しかしながら、上記特許文献１に記載の外国語翻訳器では、トレーニング機能において、ユーザが２度発声した母国語フレーズが一致したとデジタルプロセッサが判断した場合、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されており、母国語フレーズが登録された旨が直接的にユーザに通知されないという不都合があると考えられる。このため、トレーニング機能の際に、ユーザの発声した母国語フレーズがどのような母国語フレーズの音声として外国語翻訳器に認識されたかについてユーザに通知されないので、ユーザは、外国語翻訳器における母国語フレーズの音声の認識の状態を確認することができないという問題点がある。

また、上記特許文献２に記載の対話支援装置では、音声認識処理部において顧客の電話から入力された音声に対して単語を抽出する際に、顧客の音声に含まれる顧客の意図する単語が、顧客の意図する単語と異なる単語として誤って認識される場合があるという問題点がある。

また、上記特許文献３に記載の通訳装置では、音声認識装置において利用者の音声を文字として認識する際に、利用者の音声に含まれる利用者の意図する単語が、利用者の意図する単語と異なる単語として誤って認識される場合があるという問題点がある。

また、上記特許文献４に記載のデータ認識システムでは、音声データ変換部において入力された音声を音声データに変換する際に、発声者の音声に含まれる発声者の意図する単語が、発声者の意図する単語と異なる単語として誤って認識される場合があるという問題点がある。

また、上記特許文献５に記載の音声応答装置では、音声認識部において電話端末からの入力音声情報を認識する際に、電話端末からの入力音声情報に含まれる電話端末を用いる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識される場合があるという問題点がある。

この発明は、上記のような課題を解決するためになされたものであり、この発明の１つの目的は、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制するとともに、話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能な自動翻訳対応電話機を提供することである。

課題を解決するための手段および発明の効果

この発明の第１の局面による自動翻訳対応電話機は、第１言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部と、話者が発する音声に関する情報を登録する際に、音声認識部により認識された第１言語の文字を音声として出力する音声出力部と、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を音声として出力するように音声出力部を制御する制御部とを備える。

この発明の第１の局面による自動翻訳対応電話機では、上記のように、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。また、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を音声として出力するように音声出力部を制御することによって、音声出力部から出力される音声により、音声の認識の状態を話者が確認することができる。これによっても、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。

上記第１の局面による自動翻訳対応電話機において、好ましくは、話者が発する音声に関する情報を登録する際に、音声認識部により認識された第１言語の文字に対応して音声出力部により出力された音声が、話者が発した第１言語の文字に対応する音声と異なる場合、音声出力部により出力された音声に対応する文字の修正を受け付ける修正受付手段をさらに備える。このように構成すれば、話者が発する音声に関する情報を登録する際に、音声認識部において、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識された場合に、修正受付手段によって、音声認識部において正しく認識されるように修正することができるので、自動翻訳対応電話機は、より正確な音声に関する情報を得ることができる。これにより、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのをより抑制することができる。

この場合、好ましくは、修正受付手段は、第１言語の文字に対応する修正候補を表示する表示部を含む。このように構成すれば、話者が発する音声に関する情報を登録する際に、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識された場合に、表示部に修正候補を表示することによって、話者は、修正候補を視覚的に認識することができるので、話者は確実に修正候補を認識することができる。これにより、話者は、容易に音声認識部において正しく認識されるように修正することができるので、自動翻訳対応電話機は、より正確な音声に関する情報を得ることができる。この結果、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのをさらに抑制することができる。

上記修正受付手段が修正候補を表示する表示部を含む自動翻訳対応電話機において、好ましくは、制御部は、話者が発する第１言語からなる例文の文節の各々に番号が付された第１言語からなる例文を表示部に表示させるように構成されているとともに、話者によって番号が選択されることに基づいて、選択された番号に対応する文節の少なくとも単語の修正候補を表示部に表示させるように構成されている。このように構成すれば、話者が発する音声に関する情報を登録する際に、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識された場合に、文節の各々に番号が付されることによって区切られた例文を表示部に表示させるとともに、話者により選択された番号に対応する文節の少なくとも単語の修正候補を表示させることによって、話者は、容易に修正箇所を特定することができるとともに、容易に修正候補を選択することができる。

上記選択された番号における修正候補を表示させる自動翻訳対応電話機において、好ましくは、制御部は、さらに、話者によって選択された番号に対応する修正候補を音声として音声出力部に出力させるように構成されている。このように構成すれば、音声出力部から出力される音声により、話者は、正しく修正されたか否かを確認することができる。

上記第１言語の文字に対応する修正候補を表示する表示部を含む自動翻訳対応電話機において、好ましくは、修正受付手段は、話者が発する音声に関する情報を登録する際に、音声認識部により認識された第１言語の同音異義語に対応して音声出力部により出力された音声が、話者が発した第１言語の同音異義語に対応する音声と異なる場合、話者の所定の操作に基づいて、音声出力部により出力された音声に対応する同音異義語の修正候補を表示部に表示させるように構成されている。このように構成すれば、認識が困難な同音異義語の修正候補を表示部に表示することにより、音声認識部において同音異義語が正しく認識されるように、話者は視覚的に容易に修正することができるので、自動翻訳対応電話機は、同音異義語に関してより正確な音声に関する情報を得ることができる。これにより、話者が発する音声に含まれる話者の意図する同音異義語が、話者の意図する同音異義語と異なる同音異義語として誤って認識されるのをより抑制することができる。

この発明の第２の局面による自動翻訳対応電話システムは、第１言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部と、第１言語に対応する文字を第２言語に対応する文字に変換するための文字変換部と、話者が発する音声に関する情報を登録する際に、音声認識部により認識された第１言語の文字を音声として出力する音声出力部と、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を音声として出力するように音声出力部を制御する制御部とを備える。

この発明の第２の局面による自動翻訳対応電話システムでは、上記のように、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。また、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を音声として出力するように音声出力部を制御することによって、音声出力部から出力される音声により、音声の認識の状態を話者が確認することができる。これによっても、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。

本発明の一実施形態による自動翻訳対応電話システムの全体構成を示した図である。図１に示した自動翻訳対応電話システムの構成を示したブロック図である。図１に示した発信元電話機の表示パネルに表示される読み上げ例文を示した図である。図１に示した発信元電話機の表示パネルに表示される修正用例文を示した図である。図１に示した発信元電話機の表示パネルに表示される修正候補を示した図である。図１に示した発信元電話機の表示パネルに表示される登録完了時の表示を示した図である。本発明の一実施形態による１回の音声認識の修正動作によって修正可能な場合を示す図である。本発明の一実施形態による２回の音声認識の修正動作によって修正可能な場合を示す図である。図８に示す２回の音声認識の修正動作によって修正可能な場合において、２回目の音声認識の修正動作において表示パネルに表示される修正候補を示した図である。図１に示した発信元電話機の音声登録時の制御フローを示した図である。図１に示した発信元電話機の音声認識の修正動作時の制御フローを示した図である。図１に示した発信元電話機の音声通話時の制御フローを示した図である。本発明の一実施形態の変形例による自動翻訳対応電話システムの構成を示したブロック図である。

以下、本発明を具体化した実施形態を図面に基づいて説明する。

まず、図１〜図６を参照して、本発明の一実施形態による自動翻訳対応電話システム１の構成について説明する。

本発明の一実施形態による自動翻訳対応電話システム１は、図１に示すように、発信元電話番号が予め割り当てられている発信元電話機１０と、送信先電話番号が予め割り当てられている送信先電話機３０と、発信元電話機１０および送信先電話機３０とそれぞれ接続され、発信元電話機１０と送信先電話機３０との間で音声信号および文字信号を送受信するための電話回線４０および４１と、電話回線４０および４１を接続するための回線交換機５０とから構成されている。この回線交換機５０は、電話回線４０と電話回線４１とを接続した際に、電話回線４０を介して、発信元電話機１０に送信先電話機３０と接続した旨の接続信号を出力するように構成されている。なお、発信元電話機１０は、本発明の「自動翻訳対応電話機」の一例である。

また、話者が発信元電話機１０において後述する操作パネル１６の数字ボタン部１６ｃにより送信先電話番号をダイヤルすることによって、発信元電話機１０は、電話回線４０および４１と回線交換機５０とを介して、送信先電話機３０と接続可能なように構成されている。また、発信元電話機１０と送信先電話機３０とが接続されている状態においては、発信元電話機１０および送信先電話機３０から出力された音声信号および文字信号は、それぞれ、電話回線４０および４１と回線交換機５０とを介して、送信先電話機３０および発信元電話機１０に入力されるように構成されている。また、話者が発信元電話機１０において送信先電話番号をダイヤルすることにより、送信先電話機３０と接続された際には、回線交換機５０から電話回線４０を介して、送信先電話機３０と接続された旨を通知する接続信号が入力されるように構成されている。

また、発信元電話機１０は、筐体１１と、話者が発する音声が入力される集音器１２ａおよび音声が出力されるスピーカ１２ｂが設けられた受話器１２とを備えている。また、発信元電話機１０は、図２に示すように、制御部１３と、集音器１２ａから入力されたアナログの音声をデジタルの音声信号に変換するとともに、デジタルの音声信号をアナログの音声に変換する音声変換器１４と、音声信号および文字信号を電話回線４０を介して外部（送信先電話機３０）に送信（出力）するとともに、外部（送信先電話機３０）から音声信号および文字信号を受信（入力）するための電話回線制御回路１５とを備えている。なお、集音器１２ａは、本発明の「音声入力部」の一例であり、スピーカ１２ｂは、本発明の「音声出力部」の一例である。

また、発信元電話機１０には、図１に示すように、操作パネル１６と表示パネル１７とが設けられている。この操作パネル１６は、１２個のボタンを含むボタン部１６ａと、発信元電話機１０に搭載された複数のメニュープログラムのうちいずれか１つを選択可能に構成されている選択決定ボタン１６ｂとからなる。また、ボタン部１６ａは、数字が付された数字ボタン部１６ｃと、アスタリスク（＊）が付されたアスタリスクボタン１６ｄと、シャープ（♯）が付されたシャープボタン１６ｅとを含んでいる。また、数字ボタン部１６ｃは、「１」〜「９」の数字がそれぞれ付された数字ボタン１６ｆ〜１６ｎと、「０」の数字が付された数字ボタン１６ｏとからなる。また、表示パネル１７は、日本語からなる文字を表示させることが可能なように構成されている。また、発信元電話機１０は、複数のメニュープログラムの１つとして音声登録メニュープログラムが設定されており、制御部１３によって、発信元電話機１０の音声登録メニュープログラムにおいて、話者によって入力された日本語の音声に関する情報が話者が発する音声に関する情報として後述するメモリ１８に登録（音声登録）して記憶されるように構成されている。なお、表示パネル１７は、本発明の「修正受付手段」および「表示部」の一例である。

また、発信元電話機１０は、図２に示すように、話者の音声に関する情報が登録して記憶可能なように構成されているメモリ１８と、音声認識部１９と、翻訳エンジン部２０と、日本語の文字（単語）と英語の文字（単語）とが対応付けられた状態で記憶された電子辞書部２１とをさらに備えている。また、音声認識部１９では、制御部１３によって、話者によりメモリ１８に予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）が話者が発する音声に対応する日本語の文字（文字信号）として認識されるように構成されているとともに、日本語の文字信号を日本語の音声信号に変換するように構成されている。

また、音声認識部１９では、制御部１３によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる話者の音声に関する情報に基づいて、話者の音声が文節に区切って文字として認識されるように構成されている。また、音声認識部１９では、複数の同音異義語のそれぞれに対して、話者のアクセントの強弱（高低）やイントネーションなどの音声に関する情報が予め話者により登録されることにより、音声認識部１９において、同音異義語の単語と、同音異義語の音声とがそれぞれ対応付けられている。また、音声認識部１９では、それぞれの同音異義語に対して予め話者により登録されたアクセントの強弱やイントネーションなどに基づいて、スピーカ１２ｂから音声として出力されるように構成されている。また、音声認識部１９では、制御部１３によって、同音異義語のそれぞれの単語の音声に関する情報の一定範囲が認識範囲（近似範囲）として定められており、その認識範囲（近似範囲）内に含まれる音声信号が同音異義語の所定の単語であると認識されるように構成されている。また、話者の音声に関する情報が話者によりメモリ１８に登録して記憶されていない状態においては、音声認識部１９では、制御部１３によって、発信元電話機１０の製造時に予めデフォルトで登録されている音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）が話者が発する音声に対応する日本語の文字（文字信号）として認識されるように構成されている。

また、翻訳エンジン部２０では、制御部１３によって、電子辞書部２１を用いて、話者が発する音声に対応する日本語の文字信号が、日本語の文字信号に対応する英語の文字信号に変換されるように構成されている。なお、翻訳エンジン部２０および電子辞書部２１は、本発明の「文字変換部」の一例である。また、日本語は、本発明の「第１言語」の一例であり、英語は、本発明の「第２言語」の一例である。

ここで、本実施形態では、話者が発する音声に関する情報が話者により登録（音声登録）される際には、音声登録メニュープログラムにおいて、図３に示すように、制御部１３によって、文章番号が付された日本語の読み上げ例文１７ａ〜１７ｃが表示パネル１７に表示されるとともに、集音器１２ａを介して入力される話者に読み上げられた日本語の読み上げ例文１７ａ〜１７ｃの音声が音声認識部１９（図２参照）において日本語の文字として認識されるとともに、話者が確認可能なように日本語の文字が音声としてスピーカ１２ｂ（図２参照）から出力（再生）されるように構成されている。その後、図４に示すように、読み上げ例文１７ａ〜１７ｃにそれぞれ対応する修正用例文１７ｄ〜１７ｆが、文節ごとに区分可能なように文節ごとに文節番号が付された状態で、表示パネル１７に表示されるように構成されている。そして、話者によって文頭番号と文節番号とが選択されることによって、図５に示すように、選択された文節に対応する修正候補１７ｇおよび１７ｈが、表示パネル１７に表示されるように構成されている。また、音声登録が終了される際には、図６に示すように、音声登録が終了される旨が表示パネル１７に表示されるように構成されている。

また、日本語の例文および修正候補（読み上げ例文１７ａ〜１７ｃと読み上げ例文１７ａ〜１７ｃに対応する修正用例文１７ｄ〜１７ｆと修正候補１７ｇおよび１７ｈ）およびはメモリ１８に複数個記憶されているとともに、同音異義語の関係を有する単語を含む複数の例文が、１つの例文群として音声登録時に用いられるように構成されている。

また、音声認識部１９において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合、話者によって音声認識部１９における音声認識を修正させることが可能なように構成されている。なお、音声認識部１９において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合として、音声認識部１９において認識された日本語の文字が発音と合っていない場合（同音異義語によらない場合）と、音声認識部１９において認識された日本語の文字は合っているが発音が合っておらず、文字の意味する単語が異なる場合（同音異義語による場合）とがある。

同音異義語によらない場合として、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した日本語の例文の音声とが異なる場合（たとえば、話者が「ハシ」と音声入力した箇所において、スピーカ１２ｂから「ハジ」と音声出力された場合）には、本実施形態では、再度、話者に日本語の例文を読み上げさせるように構成されている。

一方、同音異義語による場合として、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した日本語の例文の音声とが、アクセントの強弱やイントネーションなどにおいて異なる場合（たとえば、話者が「橋」を意図して「ハシ」と音声入力した箇所において、スピーカ１２ｂから「端」を意味すると話者にとっては感じられるイントネーションなど（音声に関する情報）によって「ハシ」と音声出力された場合）には、音声認識の修正動作が行われるように構成されている。

次に、図１、図２および図４〜図９を参照して、本発明の一実施形態による自動翻訳対応電話システム１の音声認識の修正動作について説明する。

まず、図７に示す一例のように、音声「ハシ」がアクセントの強弱やイントネーションなどに基づいて「１」から「３」まで区別されており、音声「ハシ」の「１」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部１９（図２参照）にとって「端」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者および音声認識部１９にとって「箸」を意味する場合について説明する。つまり、「１」におけるアクセントの強弱やイントネーションなどと、「２」におけるアクセントの強弱やイントネーションなどとが、話者と音声認識部１９とにおいて異なる場合の音声認識の修正動作について説明する。

話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ１２ｂ（図２参照）から出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、音声認識の修正動作として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「１」が付された数字ボタン１６ｆ（図１参照）と「３」が付された数字ボタン１６ｈ（図１参照）とを順に話者は押下する。これによって、修正箇所（修正用例文１７ｄの（３）の「橋」に関する文節）が選択される。これにより、図５に示すように、「橋」に変更すべき修正候補１７ｇおよび１７ｈが表示パネル１７に表示される。この場合、話者は修正候補１７ｈを選択する。これにより、図７に示すように、音声認識部１９にとって「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するとともに、「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するように入れ替えられる。この際、音声認識部１９にとって「端」と認識するように設定されていた認識範囲（近似範囲）と、「橋」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図７に示すように、音声「ハシ」の「１」〜「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて合致する。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機１０に入力することによって、図６に示すように、音声登録が終了される旨が表示パネル１７に表示され、音声登録が終了される。

次に、図８に示す他の例のように、音声「ハシ」の「１」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部１９にとって「箸」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部１９にとって「端」を意味するように予め登録されている場合について説明する。つまり、「１」、「２」および「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいてそれぞれ異なる場合の音声認識の修正動作について説明する。

話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ１２ｂから出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、第１回目の音声認識の修正動作（１）として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「１」が付された数字ボタン１６ｆと「３」が付された数字ボタン１６ｈとを順に話者は押下する。これによって、修正箇所（修正用例文１７ｄの（３）の「橋」に関する文節）が選択される。これにより、図５に示すように、「橋」に変更すべき修正候補１７ｇおよび１７ｈが表示パネル１７に表示される。この場合、話者は、修正候補１７ｈを選択する。これにより、図８に示すように、音声認識部１９にとって「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するとともに、「箸」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するように入れ替えられる。この際、音声認識部１９にとって「箸」と認識するように設定されていた認識範囲（近似範囲）と、「橋」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。また、この際、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「箸」を意味するとともに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部１９にとって「端」を意味する。つまり、「２」および「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて未だ異なっている。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが未だ一致していないことを認識する。この結果、話者は、第２回目の音声認識の修正動作（２）を行う。

第２回目の音声認識の修正動作（２）として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「２」が付された数字ボタン１６ｇと「２」が付された数字ボタン１６ｇとを順に話者は押下する。これによって、修正箇所（修正用例文１７ｅの（２）の「端」に関する文節）が選択される。これにより、図９に示すように、「端」に変更すべき修正候補１７ｉおよび１７ｊが表示パネル１７に表示される。この場合、話者は修正候補１７ｉを選択する。これにより、図８に示すように、音声認識部１９にとって「箸」を意味するように登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するとともに、「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するように入れ替えられる。この際、音声認識部１９にとって「箸」と認識するように設定されていた認識範囲（近似範囲）と、「端」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図８に示すように、音声「ハシ」の「１」〜「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて合致する。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機１０に入力することによって、図６に示すように、音声登録が終了される旨が表示パネル１７に表示され、音声登録が終了される。

次に、図２〜図６、図１０および図１１を参照して、本発明の一実施形態による自動翻訳対応電話システム１の発信元電話機１０の音声登録時の制御動作について説明する。

まず、図１０に示すように、ステップＳ１において、発信元電話機１０の制御部１３（図２参照）によって、複数のメニュープログラムのうち、選択決定ボタン１６ｂ（図２参照）によって音声登録メニュープログラムが選択されたか否かが判断されるとともに、音声登録メニュープログラムが選択されるまで、ステップＳ１の判断が繰り返される。そして、ステップＳ１において、制御部１３によって、音声登録メニュープログラムが選択されたと判断された場合には、ステップＳ２に進み、制御部１３によって、図３に示すように、話者に通知するために、「１」〜「３」の文章番号がそれぞれ付されているとともに、話者に読み上げさせるための３つの読み上げ例文１７ａ〜１７ｃと、読み終わった後にシャープボタン１６ｅを押下させるメッセージ（「読み終わったら「♯」を押してください。」）と、シャープボタン１６ｅの押下後に音声認識の結果を再生するメッセージ（「音声認識が認識した結果を音声にて再生します。」）とが表示パネル１７に表示される。なお、読み上げ例文１７ａには「橋」、読み上げ例文１７ｂには「端」および読み上げ例文１７ｃには「箸」がそれぞれ含まれており、「橋」、「端」および「箸」は、それぞれ「ハシ」の音を有する同音異義語の関係を有している。そして、ステップＳ３に進む。

そして、ステップＳ３において、制御部１３によって、集音器１２ａに話者が発する日本語の音声が入力されたか否かが判断されるとともに、集音器１２ａに話者が発する日本語の音声が入力されるまで、ステップＳ３の判断が繰り返される。そして、ステップＳ３において、制御部１３によって、集音器１２ａに話者が発する日本語の音声が入力されたと判断された場合には、ステップＳ４において、制御部１３によって、話者が発した日本語の音声を音声変換器１４（図２参照）によって日本語の音声信号に変換した後に、日本語の音声信号が音声認識部１９（図２参照）において文節で区切り日本語の文字信号として認識される。この際、制御部１３によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる発信元電話機１０の製造時に予め登録されている音声に関する情報に基づいて、話者が発した音声が文節で区切られて認識される。

その後、ステップＳ５において、制御部１３によって、シャープボタン１６ｅ（図２参照）が押下されたか否かが判断される。そして、ステップＳ５において、制御部１３によって、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ６に進む。また、ステップＳ５において、制御部１３によって、シャープボタン１６ｅが押下されていないと判断された場合には、ステップＳ３に戻る。

そして、ステップＳ６において、制御部１３によって、図４に示すように、「１」の文章番号が付された読み上げ例文１７ａ（図３参照）を構成する文節ごとに（１）〜（５）の文節番号がそれぞれ付された修正用例文１７ｄと、「２」の文章番号が付された読み上げ例文１７ｂ（図３参照）を構成する文節ごとに（１）〜（５）の文節番号がそれぞれ付された修正用例文１７ｅと、「３」の文章番号が付された読み上げ例文１７ｃ（図３参照）を構成する文節ごとに（１）〜（４）の文節番号がそれぞれ付された修正用例文１７ｆとが表示パネル１７に表示される。また、制御部１３によって、話者に通知するために、間違いがない場合は選択決定ボタン１６ｂを押下させるメッセージ（「間違いがない場合は、選択決定ボタンを押してください。」）と、同音異義語に間違いがあった場合は、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃを押下させた後に、シャープボタン１６ｅを押下させるメッセージ（「同音異義語の間違いがあった場合は、文章番号⇒文節番号の順番に指定して最後に「♯」を押してください。」）と、同音異義語以外に間違いがあった場合は、アスタリスクボタン１６ｄを押下させるメッセージ（「同音異義語以外の間違いがあった場合は、「＊」を押してください。」）とが表示パネル１７に表示される。そして、ステップＳ７に進み、制御部１３によって、音声認識部１９において認識された文字信号が音声信号に変換されるとともに、音声信号が音声変換器１４によってアナログの音声に変換されてスピーカ１２ｂ（図２参照）から出力（再生）される。そして、ステップＳ８の音声認識の修正動作に進む。なお、文節番号は、本発明の「番号」の一例である。

ここで、図１１に示す音声認識の修正動作時では、まず、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂ（図２参照）が押下されたか否かが判断される。そして、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されていないと判断された場合には、ステップＳ８ｂに進む。また、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されたと判断された場合には、ステップＳ８ｈに進む。

また、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄ（図２参照）が押下されたか否かが判断される。そして、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄが押下されたと判断された場合には、図１０に示すステップＳ２に戻る。なお、アスタリスクボタン１６ｄが押下されてステップＳ２に戻ることによって、再度、話者に３つの読み上げ例文１７ａ〜１７ｃを読み上げさせることになる。また、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄが押下されていないと判断された場合には、ステップＳ８ｃに進む。

そして、ステップＳ８ｃにおいて、制御部１３によって、３つの修正用例文１７ｄ〜１７ｆの文頭に付された文章番号（図４参照）と、それぞれの文節ごとに付された文節番号（図４参照）とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されたか否かが判断される。そして、ステップＳ８ｃにおいて、制御部１３によって、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ８ｄに進む。これにより、修正用例文１７ｄ、１７ｅまたは１７ｆのいずれかの修正用例文のいずれかの文節が選択されることによって、修正箇所が選択決定される。また、ステップＳ８ｃにおいて、制御部１３によって、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されていないと判断された場合には、ステップＳ８ａに戻る。

また、ステップＳ８ｄにおいて、制御部１３によって、図５に示すように、選択決定された修正箇所における文章番号と文節番号とに対応する文節に含まれる単語の修正候補１７ｇおよび１７ｈが、修正番号「１」および「２」がそれぞれ付された状態で表示パネル１７に表示される。また、制御部１３によって、話者に通知するために、修正候補の修正番号を押下した後に、シャープボタン１６ｅを押下させるメッセージ（「正しい番号を選択し、「♯」を押してください。」）と、修正結果をスピーカ１２ｂから再生するメッセージ（「修正結果を音声にて再生します。」）とが表示パネル１７に表示される。そして、ステップＳ８ｅに進む。

また、ステップＳ８ｅにおいて、制御部１３によって、修正候補１７ｇに付された修正番号「１」に対応する数字ボタン１６ｆまたは修正候補１７ｈに付された修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されたか否かが判断されるとともに、修正番号「１」に対応する数字ボタン１６ｆまたは修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されるまで、ステップＳ８ｅの判断が繰り返される。そして、ステップＳ８ｅにおいて、制御部１３によって、修正番号「１」に対応する数字ボタン１６ｆまたは修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ８ｆに進む。

そして、ステップＳ８ｆにおいて、制御部１３によって、ステップＳ８ｃにおいて選択された文章番号と文節番号とに対応する文節に含まれる単語が、ステップＳ８ｅにおいて選択された修正番号「１」または「２」を有する修正候補１７ｇまたは１７ｈに含まれる単語であるということが話者の音声に関する情報として認識される。具体的には、話者の意図する音声のアクセントの強弱やイントネーションなどと単語との対応関係と、音声認識部１９における音声のアクセントの強弱やイントネーションなどと単語との対応関係とが合致するように、制御部１３によって、音声認識部１９に登録されていた単語の修正候補１７ｇまたは１７ｈの左側に配置されている単語のアクセントの強弱やイントネーションなどと、右側に配置されている単語のアクセントの強弱やイントネーションなどとが入れ替えられるとともに、音声に関する情報の認識範囲（近似範囲）が入れ替えられることによって、話者の音声に関する情報として認識される。そして、ステップＳ８ｇに進み、制御部１３によって、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。そして、ステップＳ８ａに戻る。

また、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されたと判断された場合、ステップＳ８ｈにおいて、制御部１３によって、話者の音声に関する情報がメモリ１８に記憶される。そして、ステップＳ８ｉに進み、制御部１３によって、図６に示すように、話者に通知するために、話者の音声に関する情報の登録が完了したメッセージ（「登録が完了しました。」）が表示パネル１７に表示される。そして、発信元電話機１０の音声登録時の制御が終了される。

次に、図２および図１２を参照して、本発明の一実施形態による自動翻訳対応電話システム１の発信元電話機１０の音声通話時の制御動作について説明する。

まず、図１２に示すように、ステップＳ１１において、発信元電話機１０の制御部１３（図２参照）によって、受話器１２（図２参照）が話者により持ち上げられることによって、発信元電話機１０が通話可能な状態になったか否かが判断されるとともに、発信元電話機１０が通話可能な状態になるまで、ステップＳ１１の判断が繰り返される。そして、ステップＳ１１において、制御部１３によって、発信元電話機１０が通話可能な状態になったと判断された場合には、ステップＳ１２において、制御部１３によって、操作パネル１６（図２参照）の数字ボタン部１６ｃ（図２参照）が押下されて、送信先電話機３０の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップＳ１２の判断が繰り返される。そして、ステップＳ１２において、制御部１３によって、送信先電話番号がダイヤルされたと判断された場合には、ステップＳ１３に進む。

そして、ステップＳ１３において、制御部１３によって、電話回線制御回路１５（図２参照）から送信先電話番号に関する信号が外部（回線交換機５０（図２参照））に出力される。そして、ステップＳ１４に進み、制御部１３によって、発信元電話機１０と送信先電話機３０（図２参照）とが電話回線４０および４１（図２参照）を介して接続された旨を通知する接続信号が回線交換機５０から電話回線制御回路１５に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップＳ１４の判断が繰り返される。そして、ステップＳ１４において、制御部１３によって、接続信号が入力されたと判断された場合には、ステップＳ１５に進み、制御部１３によって、集音器１２ａ（図２参照）から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップＳ１５の判断が繰り返される。そして、ステップＳ１５において、制御部１３によって、話者が発する音声が入力されたと判断された場合には、ステップＳ１６に進む。

そして、ステップＳ１６において、制御部１３によって、話者が発した日本語の音声が音声変換器１４により音声信号に変換された後に、音声認識部１９（図２参照）において、話者によって音声登録時にメモリ１８に予め登録された情報に基づいて、音声信号が音声認識部１９において文節で区切られて日本語の文字信号として認識される。そして、ステップＳ１７に進み、制御部１３によって、翻訳エンジン部２０（図２参照）により電子辞書部２１（図２参照）を用いて、話者が発する音声に対応する日本語の文字信号が、日本語の文字信号に対応する英語の文字信号に翻訳（変換）される。そして、ステップＳ１８に進む。

そして、ステップＳ１８において、制御部１３によって、音声認識部１９において、英語の文字信号が英語の音声信号に変換される。そして、ステップＳ１９に進み、制御部１３によって、英語の音声信号が、電話回線４０および４１を介して、送信先電話機３０に出力される。そして、発信元電話機１０の音声通話時の制御が終了される。

本実施形態では、上記のように、話者によって予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）を話者が発する音声に対応する日本語の文字（文字信号）として認識するための音声認識部１９を設けることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、制御部１３によって、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。また、制御部１３によって、話者が発する音声に関する情報を登録する際に、話者が発した音声が音声変換器１４によって音声信号に変換された後に、音声信号が音声認識部１９において文字信号として認識した結果に基づいて、音声認識部１９において認識された文字信号を音声信号に変換され、音声信号が音声変換器１４によってアナログの音声に変換してスピーカ１２ｂから出力（再生）されるように制御することによって、スピーカ１２ｂから出力される音声により、音声の認識の状態を話者が確認することができる。これによっても、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識されるのを抑制することができる。

また、本実施形態では、上記のように、話者が発する音声に関する情報を登録する際に、文節の各々に文節番号が付された修正用例文１７ｄ〜１７ｆを表示させるとともに、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した音声とが異なる場合に、話者によって文節番号が選択されることにより、選択された文節番号に対応する日本語に対応する単語の修正候補１７ｇおよび１７ｈを表示する表示パネル１７を備えることによって、話者が発する音声に関する情報を登録する際に、音声認識部１９において、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語として誤って認識された場合に、文節の各々に文節番号が付されることによって区切られた修正用例文１７ｄ〜１７ｆを表示させるとともに、文節番号に対応する修正候補１７ｇおよび１７ｈを表示パネル１７に表示させることによって、話者に文節ごとの修正候補１７ｇおよび１７ｈを視覚的に認識させて修正候補１７ｇおよび１７ｈを選択させることができるので、話者は、容易に修正箇所を特定することができるとともに、容易に修正候補１７ｇおよび１７ｈを選択することができる。これにより、話者は、容易に音声認識部１９において正しく認識されるように修正することができるので、発信元電話機１０は、より正確な音声に関する情報を得ることができる。この結果、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語と異なる単語としてとして誤って認識されるのをより抑制することができる。

また、本実施形態では、上記のように、制御部１３によって、話者によって選択された文節番号に対応する修正候補１７ｇおよび１７ｈが表示パネル１７に表示された後に、選択された修正候補１７ｇまたは１７ｈの文字信号が音声信号に変換され、音声信号が音声変換器１４によってアナログの音声に変換してスピーカ１２ｂから再生されるように制御することによって、スピーカ１２ｂから出力される音声により、話者は、正しく修正されたか否かを確認することができる。

また、本実施形態では、上記のように、同音異義語に関して、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した日本語の例文の音声とが、話者による音声と単語との対応関係において異なる場合、修正箇所が含まれる文節に付された番号に対応する数字ボタン１６ｆ〜１６ｏを話者に押下させることによって、日本語に対応する同音異義語の修正候補１７ｇおよび１７ｈを表示パネル１７に表示させ、話者による音声と単語との対応関係に適合するように、スピーカ１２ｂから音声出力された音声に対応する修正候補１７ｇおよび１７ｈを話者に選択させるように構成することによって、認識が困難な同音異義語の修正候補１７ｇおよび１７ｈを表示パネル１７に表示することにより、音声認識部１９において同音異義語が正しく認識されるように、話者は視覚的に容易に修正することができるので、発信元電話機１０は、同音異義語に関してより正確な音声に関する情報を得ることができる。これにより、話者が発する音声に含まれる話者の意図する同音異義語が、話者の意図する同音異義語と異なる同音異義語として誤って認識されるのをより抑制することができる。

なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。

たとえば、本実施形態では、自動翻訳対応電話システム１の発信元電話機１０に翻訳エンジン部２０および電子辞書部２１を設けた例を示したが、本発明はこれに限らず、図１３に示す本実施形態の変形例のように、自動翻訳対応電話システム１００の発信元電話機１１０に翻訳エンジン部および電子辞書部を設けずに、回線交換機１５０に翻訳エンジン部１５１および電子辞書部１５２を設けるように構成してもよい。その際、回線交換機１５０には、翻訳エンジン部１５１および電子辞書部１５２を制御するための制御部１５３が設けられる。このように構成すれば、翻訳エンジン部１５１および電子辞書部１５２を更新して翻訳に関する新たな情報を追加する際に、回線交換機１５０のみを更新すればよく、個々の発信元電話機１１０のそれぞれを更新させる必要がないので、自動翻訳対応電話システム１００において、翻訳に関する新たな情報を容易に追加することが可能である。これにより、より正確に、話者が発する音声に対応する日本語の文字信号を、日本語の文字信号に対応する英語の文字信号に翻訳（変換）することが可能になる。

また、本実施形態では、自動翻訳対応電話システム１の発信元電話機１０に音声認識部１９、翻訳エンジン部２０および電子辞書部２１を設けた例を示したが、本発明はこれに限らず、発信元電話機に音声認識部、翻訳エンジン部および電子辞書部を設けずに、回線交換機に音声認識部、翻訳エンジン部および電子辞書部のすべてを設けてもよい。このように構成すれば、音声認識部、翻訳エンジン部および電子辞書部を有さないいわゆる一般の発信元電話機を用いた場合においても、話者は、自動翻訳機能を利用することが可能になる。

また、本実施形態では、制御部１３によって、文節ごとに文節番号を付した３つの修正用例文１７ｄ〜１７ｆを表示パネル１７に表示させるとともに、話者に文節番号に対応する数字が付された数字ボタン部１６ｃを押下させることによって、修正箇所を選択決定させた例を示したが、本発明はこれに限らず、文節ごとに文節番号を付さずに、たとえば、文節ごとに選択される際に反転表示されるように修正用例文を表示パネルに表示させるとともに、話者に選択決定ボタンを用いて選択決定させることによって、反転表示された箇所を修正箇所として選択決定させるように構成してもよい。また、単語ごとに単語番号を付した修正用例文を表示するように構成してもよい。

また、本実施形態では、同音異義語以外に関して、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した音声とが異なる場合（たとえば、話者が「ハシ」と音声入力した箇所において、スピーカ１２ｂから「ハジ」と音声出力された場合）には、再度、話者に読み上げさせるように構成した例を示したが、本発明はこれに限らず、同音異義語以外に関して、音声認識部において認識された日本語の文字信号としてスピーカから再生された音声と、話者の発した音声とが異なる場合であっても、同音異義語の場合と同様に、予め想定可能な日本語に対応する修正候補を表示部に表示させて、修正を受け付けるように構成してもよい。

また、本実施形態では、同音異義語に関して、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した音声とが、話者による音声と単語との対応関係において異なる場合（たとえば、話者が「橋」を意図して「ハシ」と音声入力した箇所において、スピーカ１２ｂから「端」を意味すると話者にとって感じられるイントネーション（音声に関する情報）などによって「ハシ」と音声出力された場合）に、日本語に対応する同音異義語の修正候補１７ｇおよび１７ｈを表示パネル１７に表示した例を示したが、本発明はこれに限らず、たとえば、スピーカから出力される日本語の例文を話者が集音器に対して発声し、話者が発した音声に基づいて音声認識部において認識された日本語の文字信号を、文節ごとに番号で区切られた状態で、制御部が番号と共にスピーカによって音声を出力することによって、表示部を用いないように構成してもよい。このように構成すれば、話者は、操作パネル部を用いて修正したい文節の番号を入力することが可能になるので、発信元電話機は、修正を行うことが可能になる。

また、本実施形態では、同音異義語に関して、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した音声とが異なる場合には、読み上げ例文１７ａ〜１７ｃおよび修正用例文１７ｄ〜１７ｆを表示パネル１７に表示させることによって、修正の受け付けを行った例を示したが、本発明はこれに限らず、修正の受け付けを行わずに、同音異義語以外の場合と同様に、再度、話者に日本語の例文を読み上げさせることによって、話者が発する音声に関する情報を登録するように構成してもよい。

また、本実施形態では、表示パネル１７に文章番号「１」〜「３」をそれぞれ付した３つの読み上げ例文１７ａ〜１７ｃを表示した例を示したが、本発明はこれに限らず、たとえば、読み上げ例文が複数個記載された読み上げ表などを発信元電話機に別途書類として付属させることによって、表示パネルに読み上げ例文を表示しないように構成してもよい。

また、本実施形態では、音声認識部１９において、制御部１３によって、話者の音声に関する情報に基づいて、話者の音声を文節に区切られて文字として認識した例を示したが、本発明はこれに限らず、音声認識部において、制御部が、話者の音声に関する情報に基づいて、話者の音声を文節よりも小さな単位である単語に区切って文字として認識するように構成してもよい。

また、本実施形態では、本発明の「第１言語」として日本語を、本発明の「第２言語」として英語をそれぞれ用いた例を示したが、本発明はこれに限らず、「第１言語」および「第２言語」は、日本語および英語に限られず、他の言語でもよい。また、「第１言語」および「第２言語」は、同一の国の言語であってもよく、北京語と広東語とのような同一国内の異なる地域においてそれぞれ用いられる、いわゆる方言からなるように構成してもよい。

また、本実施形態では、本発明の「同音異義語」として、それぞれ「ハシ」の音を有することによって、互いに同音異義語の関係を有する「橋」、「端」および「箸」の単語を用いて例文を構成した例を示したが、本発明はこれに限らず、その他の同音異義語を用いて例文を構成してもよい。たとえば、それぞれ「アメ」の音を有することによって、互いに同音異義語の関係を有する「雨」および「飴」の単語を用いて例文を構成してもよい。

１、１００自動翻訳対応電話システム
１０、１１０発信元電話機（自動翻訳対応電話機）
１２ａ集音器（音声入力部）
１２ｂスピーカ（音声出力部）
１３制御部
１７表示パネル（修正受付手段、表示部）
１７ｇ、１７ｈ、１７ｉ、１７ｊ修正候補
１８メモリ
１９音声認識部
２０、１５１翻訳エンジン部（文字変換部）
２１、１５２電子辞書部（文字変換部）

Claims

第１言語によって話者が発する音声が入力される音声入力部と、
話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
予め登録された前記話者が発する音声に関する情報に基づいて、話者が発する音声を、前記第１言語と異なる第２言語に変換する前の前記第１言語に対応する文字として認識するための音声認識部と、
前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第１言語の文字を音声として出力する音声出力部と、
前記話者が発する音声に関する情報を登録する際に、話者が発する音声を前記第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第１言語に対応する文字を音声として出力するように前記音声出力部を制御する制御部とを備える、自動翻訳対応電話機。
前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第１言語の文字に対応して前記音声出力部により出力された前記音声が、話者が発した前記第１言語の文字に対応する音声と異なる場合、前記音声出力部により出力された前記音声に対応する文字の修正を受け付ける修正受付手段をさらに備える、請求項１に記載の自動翻訳対応電話機。
前記修正受付手段は、前記第１言語の文字に対応する修正候補を表示する表示部を含む、請求項２に記載の自動翻訳対応電話機。
前記制御部は、話者が発する前記第１言語からなる例文の文節の各々に番号が付された前記第１言語からなる例文を前記表示部に表示させるように構成されているとともに、話者によって前記番号が選択されることに基づいて、選択された前記番号に対応する文節の少なくとも単語の修正候補を前記表示部に表示させるように構成されている、請求項３に記載の自動翻訳対応電話機。
前記制御部は、さらに、話者によって選択された前記番号に対応する前記修正候補を音声として前記音声出力部に出力させるように構成されている、請求項４に記載の自動翻訳対応電話機。
前記修正受付手段は、前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第１言語の同音異義語に対応して前記音声出力部により出力された前記音声が、話者が発した前記第１言語の同音異義語に対応する音声と異なる場合、話者の所定の操作に基づいて、前記音声出力部により出力された前記音声に対応する同音異義語の修正候補を前記表示部に表示させるように構成されている、請求項３〜５のいずれか１項に記載の自動翻訳対応電話機。
第１言語によって話者が発する音声が入力される音声入力部と、
話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
予め登録された前記話者が発する音声に関する情報に基づいて、話者が発する音声を、前記第１言語と異なる第２言語に変換する前の前記第１言語に対応する文字として認識するための音声認識部と、
前記第１言語に対応する文字を前記第２言語に対応する文字に変換するための文字変換部と、
前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第１言語の文字を音声として出力する音声出力部と、
前記話者が発する音声に関する情報を登録する際に、話者が発する音声を前記第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第１言語に対応する文字を音声として出力するように前記音声出力部を制御する制御部とを備える、自動翻訳対応電話システム。