JP2010277359A

JP2010277359A - 自動翻訳対応電話システムおよび自動翻訳対応電話機

Info

Publication number: JP2010277359A
Application number: JP2009129440A
Authority: JP
Inventors: Katsuhiro Morisada; 克博森貞
Original assignee: Funai Electric Co Ltd
Current assignee: Funai Electric Co Ltd
Priority date: 2009-05-28
Filing date: 2009-05-28
Publication date: 2010-12-09

Abstract

【課題】話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能であるとともに、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、精度の高い翻訳を行うことが可能な自動翻訳対応電話システムを提供する。
【解決手段】この自動翻訳対応電話システム１は、予め登録された話者が発する音声に関する情報に基づいて、日本語の音声を、日本語の文字として認識するための音声認識部１９と、日本語に含まれる方言に対応する方言辞書２１ｂを有する電子辞書部２１を含み、日本語の文字を英語の文字に変換するための翻訳エンジン部２０と、話者が発する音声に関する情報を登録する際に、話者が確認可能なように日本語の文字を通知するようにスピーカ１２ｂを制御する制御部１３とを備え、制御部１３は、日本語の文字を英語の文字に変換する際に、方言辞書２１ｂを選択して参照するように構成されている。
【選択図】図２

Description

この発明は、自動翻訳対応電話システムおよび自動翻訳対応電話機に関し、特に、音声を認識する音声認識部を備える自動翻訳対応電話システムおよび自動翻訳対応電話機に関する。

従来、音声を認識する音声認識部を備える自動翻訳対応電話システムなどが知られている（たとえば、特許文献１〜５参照）。

上記特許文献１には、顧客の電話からの音声が入力される通信部と、顧客の電話の位置情報を発信電話番号から取得する位置情報取得処理部と、取得した位置情報を含む地域の方言辞書を選択する辞書選択処理部と、顧客の電話から入力された音声に対して単語を抽出する音声認識処理部と、抽出された単語に方言の単語が含まれるか否かを判定し、選択された方言辞書を用いて方言の単語を標準語の単語へ変換する変換処理部と、変換された標準語の単語を表示するディスプレイとを備えた対話支援装置が開示されている。なお、上記特許文献１に記載の対話支援装置は、対話支援装置と顧客の電話とが同一の言語を用いる地域の中に位置する場合を想定している。

また、上記特許文献２には、ユーザの音声が入力されるマイクロホンと、それ自体で母国語の意味を有する母国語フレーズ、母国語フレーズに対応した外国語フレーズおよび音声認識ソフトウェアが記憶されたメモリと、音声認識ソフトウェアを実行するデジタルプロセッサと、スピーカとを備えた外国語翻訳器が開示されている。上記特許文献２に記載の外国語翻訳器は、ユーザに発声させた母国語フレーズをメモリに記憶させるためのトレーニング機能を有し、ユーザに母国語フレーズを発声させた後に、再度、ユーザに同一の母国語フレーズを発声（復唱）させるように構成されている。この際、両フレーズが一致したとデジタルプロセッサが判断した場合には、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されている。一方、両フレーズが一致しないとデジタルプロセッサが判断した場合には、スピーカを介して、一致しなかった旨を音声によって出力することによってユーザに通知するように構成されている。また、上記特許文献２に記載の外国語翻訳器は、翻訳機能を有し、トレーニング機能において登録された母国語フレーズがマイクロホンに入力された際に、入力された母国語フレーズに対応した外国語フレーズをスピーカを介して音声によって出力するように構成されている。

また、上記特許文献３には、電話回線から入力される利用者の母国語の音声を文字として認識する音声認識装置と、利用者によって入力された通信相手の電話番号に基づいて通話相手の母国語を決定するとともに、認識された文字を通話相手の母国語に翻訳して翻訳データを作成する翻訳装置と、翻訳データを音声にして通話相手に出力するための音声合成装置とを備えた通訳装置が開示されている。

また、上記特許文献４には、発声者の音声の入力を受け付け、入力された音声を音声データに変換する音声データ変換部と、地方情報が記憶された地方情報データベースと、音声データに含まれるイントネーションなどと地方情報とを比較することによって、発声者の出身地を認識するための発声者情報分析部と、認識された出身地を音声データ変換部に入力された音声と合わせてテキストデータとして出力する出力部とを備えたデータ認識システムが開示されている。なお、上記特許文献４に記載のデータ認識システムは、データ認識システムと発声者の出身地とが同一の言語を用いる地域の中に位置する場合を想定している。

また、上記特許文献５には、電話端末からの入力音声情報を受信および送信する通信部と、受信した入力音声情報を認識する音声認識部と、電話端末の市外局番を検出する市外局番検出部と、市外局番ごとにそれぞれ登録された複数の音声情報データベースと、認識した入力音声情報に対応する出力音声情報を市外局番に対応する音声情報データベースの中から検索する音声情報検索部と、検索された出力音声情報を送信部を介して電話端末に送信する音声情報出力部とを備えた音声応答装置が開示されている。上記特許文献５に記載の音声応答装置は、認識した入力音声情報に対応する出力音声情報を、市外局番に対応する音声情報データベースの中から検索して送信することによって、電話端末の位置する地域の言葉（方言）を用いた音声応答サービスを提供することが可能なように構成されている。なお、上記特許文献５に記載の音声応答装置は、音声応答装置と電話端末とが同一の言語を用いる地域の中に位置している場合を想定している。

特開２００５−３３１６０８号公報特表２００３−５１５８１６号公報特開２００２−７３６０５号公報特開２００２−１１６７８９号公報特開２００４−９６３８１号公報

しかしながら、上記特許文献１に記載の対話支援装置では、音声認識処理部において顧客の電話から入力された音声に対して単語を抽出する際に、顧客の音声に含まれる顧客の意図する単語が、顧客の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献１に記載の対話支援装置では、対話支援装置と同一の言語を用いる地域の中において、方言を有する地域に顧客の電話が位置している場合を想定しており、顧客の電話が対話支援装置と異なる言語を用いる地域に位置している場合については考慮されていない。このため、顧客の電話が対話支援装置と異なる言語を用いる地域に位置している場合には、顧客の電話から音声が入力されたとしても、対話支援装置の位置する地域の言語に変換することができないという問題点もある。

また、上記特許文献２に記載の外国語翻訳器では、トレーニング機能において、ユーザが２度発声した母国語フレーズが一致したとデジタルプロセッサが判断した場合、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されており、母国語フレーズが登録された旨が直接的にユーザに通知されないという不都合があると考えられる。このため、トレーニング機能の際に、ユーザの発声した母国語フレーズがどのような母国語フレーズの音声として外国語翻訳器に認識されたかについてユーザに通知されないため、音声の認識の状態をユーザが確認することができないという問題点がある。また、上記特許文献２に記載の外国語翻訳器では、ユーザの母国語および外国語については考慮されている一方、ユーザの母国語の方言および外国語の方言については開示も示唆もされていない。このため、ユーザが方言を有する地域に位置している場合やユーザの母国語の音声を外国語の方言に翻訳する場合には、ユーザの音声に含まれるユーザの方言による単語が、ユーザの意図する単語とは異なる単語として誤って認識される場合があるという不都合がある。このため、翻訳の精度が低下するという問題点がある。

また、上記特許文献３に記載の通訳装置では、音声認識装置において利用者の音声を文字として認識する際に、利用者の音声に含まれる利用者の意図する単語が、利用者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献３に記載の通訳装置では、利用者の母国語および通話相手の母国語については考慮されている一方、利用者の母国語の方言および通話相手の母国語の方言については開示も示唆もされていない。このため、利用者が方言を有する地域に位置している場合や通話相手が方言を有する地域に位置している場合には、利用者の音声に含まれる利用者の方言による単語が、利用者の意図する単語とは異なる単語として誤って認識される場合があるという不都合がある。このため、翻訳の精度が低下するという問題点がある。

また、上記特許文献４に記載のデータ認識システムでは、音声データ変換部において入力された音声を音声データに変換する際に、発声者の音声に含まれる発声者の意図する単語が、発声者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献４に記載のデータ認識システムでは、データ認識システムと同一の言語を用いる地域の中において、方言を有する地域に発声者の出身地がある場合を想定しており、発声者の出身地がデータ認識システムと異なる言語を用いる地域である場合については考慮されていない。このため、発声者の出身地がデータ認識システムと異なる言語を用いる地域である場合には、発声者から音声が入力されたとしても、データ認識システムの位置する地域の言語に変換することができないという問題点もある。

また、上記特許文献５に記載の音声応答装置では、音声認識部において電話端末からの入力音声情報を認識する際に、電話端末からの入力音声情報に含まれる電話端末を用いる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献５に記載の音声応答装置では、音声応答装置と同一の言語を用いる地域の中において、方言を有する地域に電話端末が位置している場合を想定しており、電話端末が音声応答装置と異なる言語を用いる地域に位置している場合については考慮されていない。このため、電話端末が音声応答装置と異なる言語を用いる地域に位置している場合には、電話端末から音声が入力されたとしても、音声応答装置の位置する地域の言語に変換することができないという問題点もある。

この発明は、上記のような課題を解決するためになされたものであり、この発明の１つの目的は、話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能であるとともに、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、精度の高い翻訳（言語の変換）を行うことが可能な自動翻訳対応電話システムおよび動翻訳対応電話機を提供することである。

課題を解決するための手段および発明の効果

この発明の第１の局面による自動翻訳対応電話システムは、第１言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者から入力された音声を、第１言語と異なる第２言語に翻訳する前の第１言語に対応する文字として認識するための音声認識部と、第１言語および第２言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、第１言語に対応する文字を第２言語に対応する文字に変換するための文字変換部と、音声認識部により認識された第１言語の文字を出力する第１出力部と、話者が発する音声に関する情報を登録する際に、話者から入力された音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を通知するように第１出力部を制御する制御部とを備え、制御部は、第１言語に対応する文字を第２言語に対応する文字に変換する際に、第１言語および第２言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成されている。

この発明の第１の局面による自動翻訳対応電話システムでは、上記のように、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語の文字を通知するように第１出力部を制御することによって、第１出力部によって話者が確認可能なように第１言語の文字を通知することにより、話者に自動翻訳対応電話システムにおける音声の認識の状態を確認させることができる。また、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、第１言語に対応する文字を第２言語に対応する文字に変換する際に、第１言語および第２言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成することによって、第１言語を発する話者と第２言語を発する通話相手との少なくとも一方が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書を用いることにより、音声認識部を特定された方言に対応させることができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。

上記第１の局面による自動翻訳対応電話システムにおいて、好ましくは、文字変換部により第１言語の文字から変換された第２言語に対応する文字を出力する第２出力部をさらに備え、制御部は、第１言語に含まれる方言を特定する場合には、話者の地域を特定する情報を用い、第２言語に含まれる方言を特定する場合には、第２出力部の出力先の地域を特定する情報を用いるように構成されている。このように構成すれば、話者の地域を特定する情報および第２出力部の出力先の地域を特定する情報を用いることによって、より確実に、第１言語および第２言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。

この場合、好ましくは、制御部は、第１言語に含まれる方言を特定する場合には、話者の電話番号を用い、第２言語に含まれる方言を特定する場合には、第２出力部の出力先の電話番号を用いるように構成されている。このように構成すれば、電話番号を用いることによって、話者と出力先との通話に本発明を利用する際に、話者に通話時に必要な出力先の電話番号の入力以外のその他の特定の操作を要求することなく、第１言語および第２言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。

上記地域を特定する情報を用いて方言を特定する自動翻訳対応電話システムにおいて、好ましくは、制御部は、第１言語に含まれる方言を特定する場合には、話者の全地球測位システムによる情報を用い、第２言語に含まれる方言を特定する場合には、第２出力部の出力先の全地球測位システムによる情報を用いるように構成されている。このように構成すれば、全地球測位システムによる情報を用いることによって、話者に特定の操作を要求することなく、第１言語および第２言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。

上記第１の局面による自動翻訳対応電話システムにおいて、好ましくは、制御部は、第１言語に対応する文字を第２言語に対応する文字に変換する際に、第１言語に含まれる第１方言および第２言語に含まれる第２方言をそれぞれ特定して第１方言および第２方言に対応する電子辞書部の第１方言辞書および第２方言辞書をそれぞれ選択して参照するように構成されている。このように構成すれば、第１言語を発する話者が第１方言を有する地域に位置するとともに、第２言語を発する通話相手が第２方言を有する地域に位置する場合においても、特定された第１方言および第２方言にそれぞれ対応する第１方言辞書および第２方言辞書を用いることにより、音声認識部を第１方言および第２方言の両方に対応させることができる。これにより、話者および通話相手の両方が発する音声に含まれる方言による単語が、話者および通話相手の両方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第１言語から第２言語への変換（翻訳）のみならず、第１言語から第２言語への変換（翻訳）の精度も向上させることができる。

上記第１の局面による自動翻訳対応電話システムにおいて、好ましくは、第１出力部は、話者が発する音声に関する情報を登録する際に、音声認識部において認識された第１言語に対応する文字を、話者が確認可能なように音声として出力する音声出力部を含む。このように構成すれば、音声出力部から出力される音声により、話者は、自動翻訳対応電話システムにおける音声の認識の状態を聴覚によって確認することができる。これにより、話者が発する音声に含まれる単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、これによっても、翻訳の精度を向上させることができる。

この発明の第２の局面による自動翻訳対応電話機は、第１言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者から入力された音声を、第１言語と異なる第２言語に翻訳する前の第１言語に対応する文字として認識するための音声認識部と、第１言語および第２言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、第１言語に対応する文字を第２言語に対応する文字に変換するための文字変換部と、音声認識部により認識された第１言語の文字を出力する出力部と、話者が発する音声に関する情報を登録する際に、話者から入力された音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語に対応する文字を通知するように出力部を制御する制御部とを備え、制御部は、第１言語に対応する文字を第２言語に対応する文字に変換する際に、第１言語および第２言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成されている。

この発明の第２の局面による自動翻訳対応電話機では、上記のように、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第１言語の文字を通知するように出力部を制御することによって、出力部によって話者が確認可能なように第１言語の文字を通知することにより、話者に自動翻訳対応電話システムにおける音声の認識の状態を確認させることができる。また、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第１言語と異なる第２言語に変換する前の第１言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、第１言語に対応する文字を第２言語に対応する文字に変換する際に、第１言語および第２言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成することによって、第１言語を発する話者と第２言語を発する通話相手との少なくとも一方が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書を用いることにより、音声認識部を特定された方言に対応させることができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。

本発明の第１実施形態による自動翻訳対応電話システムの全体構成を示した図である。図１に示した自動翻訳対応電話システムの構成を示したブロック図である。図１に示した発信元電話機の表示パネルに表示される読み上げ例文を示した図である。図１に示した発信元電話機の表示パネルに表示される修正用例文を示した図である。図１に示した発信元電話機の表示パネルに表示される修正候補を示した図である。図１に示した発信元電話機の表示パネルに表示される登録完了時の表示を示した図である。本発明の一実施形態による１回の音声認識の修正動作によって修正可能な場合を示す図である。本発明の一実施形態による２回の音声認識の修正動作によって修正可能な場合を示す図である。図８に示す２回の音声認識の修正動作によって修正可能な場合において、２回目の音声認識の修正動作において表示パネルに表示される修正候補を示した図である。図１に示した発信元電話機の音声登録時の制御フローを示した図である。図１に示した発信元電話機の音声認識の修正動作時の制御フローを示した図である。図１に示した発信元電話機の音声通話時の制御フローを示した図である。本発明の第２実施形態による自動翻訳対応電話システムの全体構成を示した図である。図１３に示した自動翻訳対応電話システムの構成を示したブロック図である。図１３に示した発信元電話機の音声通話時の制御フローを示した図である。図１３に示した回線交換機の音声通話時の制御フローを示した図である。本発明の第３実施形態による自動翻訳対応電話システムの構成を示したブロック図である。図１７に示した発信元電話機の音声通話時の制御フローを示した図である。図１７に示した回線交換機の音声通話時の制御フローを示した図である。

以下、本発明を具体化した実施形態を図面に基づいて説明する。

（第１実施形態）
まず、図１〜図６を参照して、本発明の一実施形態による自動翻訳対応電話システム１の構成について説明する。

本発明の第１実施形態による自動翻訳対応電話システム１は、図１に示すように、日本の方言を有する地域を示す番号を有する発信元電話番号が予め割り当てられている発信元電話機１０と、英語圏の国を示す番号を有する送信先電話番号が予め割り当てられている送信先電話機３０と、発信元電話機１０および送信先電話機３０とそれぞれ接続され、発信元電話機１０と送信先電話機３０との間で音声信号および文字信号を送受信するための電話回線４０および４１と、電話回線４０と電話回線４１とを接続するための回線交換機５０とから構成されている。この回線交換機５０は、電話回線４０と電話回線４１とを接続した際に、電話回線４０を介して、発信元電話機１０に送信先電話機３０と接続した旨の接続信号を出力するように構成されている。また、発信元電話機１０は、日本の方言を有する地域に位置するとともに、送信先電話機３０は、英語圏の地域に位置する。なお、発信元電話機１０は、本発明の「自動翻訳対応電話機」の一例である。

また、話者が発信元電話機１０において後述する操作パネル１６の数字ボタン部１６ｃにより送信先電話番号をダイヤルすることによって、発信元電話機１０は、電話回線４０および４１と回線交換機５０とを介して、送信先電話機３０と接続可能なように構成されている。また、発信元電話機１０と送信先電話機３０とが接続されている状態においては、発信元電話機１０および送信先電話機３０から出力された音声信号および文字信号は、それぞれ、電話回線４０および４１と回線交換機５０とを介して、送信先電話機３０および発信元電話機１０に入力されるように構成されている。また、話者が発信元電話機１０において送信先電話番号をダイヤルすることにより、送信先電話機３０と接続された際には、回線交換機５０から電話回線４０を介して、送信先電話機３０と接続された旨を通知する接続信号が入力されるように構成されている。

また、発信元電話機１０は、筐体１１と、話者が発する音声が入力される集音器１２ａおよび音声が出力されるスピーカ１２ｂが設けられた受話器１２とを備えている。また、発信元電話機１０は、図２に示すように、制御部１３と、集音器１２ａから入力されたアナログの音声をデジタルの音声信号に変換するとともに、デジタルの音声信号をアナログの音声に変換する音声変換器１４と、音声信号および文字信号を電話回線４０を介して外部（送信先電話機３０）に送信（出力）するとともに、外部（送信先電話機３０）から音声信号および文字信号を受信（入力）するための電話回線制御回路１５とを備えている。なお、集音器１２ａは、本発明の「音声入力部」の一例であり、スピーカ１２ｂは、本発明の「第１出力部」、「音声出力部」および「出力部」の一例である。また、電話回線制御回路１５は、本発明の「第２出力部」の一例である。

また、発信元電話機１０には、図１に示すように、操作パネル１６と表示パネル１７とが設けられている。この操作パネル１６は、１２個のボタンを含むボタン部１６ａと、発信元電話機１０に搭載された複数のメニュープログラムのうちいずれか１つを選択可能に構成されている選択決定ボタン１６ｂとからなる。また、ボタン部１６ａは、数字が付された数字ボタン部１６ｃと、アスタリスク（＊）が付されたアスタリスクボタン１６ｄと、シャープ（♯）が付されたシャープボタン１６ｅとを含む。また、数字ボタン部１６ｃは、「１」〜「９」の数字がそれぞれ付された数字ボタン１６ｆ〜１６ｎと、「０」の数字が付された数字ボタン１６ｏとからなる。また、表示パネル１７は、日本語からなる文字を表示させることが可能なように構成されている。また、発信元電話機１０は、複数のメニュープログラムの１つとして音声登録メニュープログラムが設定されており、制御部１３によって、発信元電話機１０の音声登録メニュープログラムにおいて、話者によって入力された日本語の音声に関する情報が後述するメモリ１８に登録されるように構成されている。

また、発信元電話機１０は、図２に示すように、話者の音声に関する情報が登録して記憶可能なように構成されているメモリ１８と、音声認識部１９と、翻訳エンジン部２０をさらに備えている。また、翻訳エンジン部２０には、電子辞書部２１が設けられている。また、音声認識部１９では、制御部１３によって、話者によってメモリ１８に予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）が話者が発する音声に対応する英語に翻訳する前の日本語の文字（翻訳前の文字信号）として認識されるように構成されているとともに、日本語の文字信号が日本語の音声信号に変換されるように構成されている。

また、音声認識部１９では、制御部１３によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる話者の音声に関する情報に基づいて、話者の音声が文節に区切って文字として認識されるように構成されている。また、音声認識部１９では、複数の同音異義語のそれぞれに対して、話者のアクセントの強弱（高低）やイントネーションなどの音声に関する情報が予め話者により登録されることにより、音声認識部１９において、同音異義語の単語と、同音異義語の音声とがそれぞれ対応付けられている。また、音声認識部１９では、それぞれの同音異義語に対して予め話者により登録されたアクセントの強弱やイントネーションなどに基づいて、スピーカ１２ｂから音声として出力されるように構成されている。また、音声認識部１９では、制御部１３によって、同音異義語のそれぞれの単語の音声に関する情報の一定範囲が認識範囲（近似範囲）として定められており、その認識範囲（近似範囲）内に含まれる音声信号が同音異義語の所定の単語であると認識されるように構成されている。また、話者の音声に関する情報が話者によりメモリ１８に登録して記憶されていない状態においては、音声認識部１９では、制御部１３によって、発信元電話機１０の製造時に予めデフォルトで登録されている音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）が話者が発する音声に対応する日本語の文字（翻訳前の文字信号）として認識されるように構成されている。なお、日本語は、本発明の「第１言語」の一例であり、英語は、本発明の「第２言語」の一例である。

ここで、第１実施形態では、電子辞書部２１は、日本語の標準語の文字（単語）と英語の文字（単語）とが対応付けられた状態で記憶された基本辞書２１ａと、日本国内の異なる地域においてそれぞれ用いられる方言の文字と、日本語の標準語の文字とが対応付けられた状態で記憶された複数の方言辞書２１ｂとを含む。また、制御部１３によって、発信元電話機１０の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言が特定されて、特定された方言に対応する方言辞書２１ｂが選択されるように構成されている。なお、翻訳エンジン部２０および電子辞書部２１は、本発明の「文字変換部」の一例である。

また、翻訳エンジン部２０では、制御部１３によって、電子辞書部２１の基本辞書２１ａを用いて、話者が発する音声に対応する日本語の標準語の翻訳前の文字信号が、日本語の文字信号に対応する英語の翻訳後の文字信号に変換されるように構成されている。また、制御部１３によって、電子辞書部２１の方言辞書２１ｂを参照して、話者の音声が文節に区切られて文字として認識される際に、音声認識部１９において認識された日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識した方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。

また、話者が発する音声に関する情報が話者により登録（音声登録）される際には、音声登録メニュープログラムにおいて、図３に示すように、制御部１３によって、文章番号が付された日本語の読み上げ例文１７ａ〜１７ｃが表示パネル１７に表示されるとともに、集音器１２ａを介して入力される話者に読み上げられた日本語の読み上げ例文１７ａ〜１７ｃの音声が音声認識部１９（図２参照）において日本語の文字として認識されるとともに、話者が確認可能なように日本語の文字が音声としてスピーカ１２ｂ（図２参照）から出力（再生）されるように構成されている。その後、図４に示すように、読み上げ例文１７ａ〜１７ｃにそれぞれ対応する修正用例文１７ｄ〜１７ｆが、文節ごとに区分可能なように文節ごとに文節番号が付された状態で、表示パネル１７に表示されるように構成されている。そして、話者によって文頭番号と文節番号とが選択されることによって、図５に示すように、選択された文節に対応する修正候補１７ｇおよび１７ｈが、表示パネル１７に表示されるように構成されている。また、音声登録が終了される際には、図６に示すように、音声登録が終了される旨が表示パネル１７に表示されるように構成されている。

また、日本語の例文および修正候補（読み上げ例文１７ａ〜１７ｃと読み上げ例文１７ａ〜１７ｃに対応する修正用例文１７ｄ〜１７ｆと修正候補１７ｇおよび１７ｈ）およびはメモリ１８に複数個記憶されているとともに、同音異義語の関係を有する単語を含む複数の例文が、１つの例文群として音声登録時に用いられるように構成されている。

また、音声認識部１９において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合、話者によって音声認識部１９における音声認識を修正させることが可能なように構成されている。なお、音声認識部１９において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合として、音声認識部１９において認識された日本語の文字が発音と合っていない場合（同音異義語によらない場合）と、音声認識部１９において認識された日本語の文字は合っているが発音が合っておらず、文字の意味する単語が異なる場合（同音異義語による場合）とがある。

同音異義語によらない場合として、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した日本語の例文の音声とが異なる場合（たとえば、話者が「ハシ」と音声入力した箇所において、スピーカ１２ｂから「ハジ」と音声出力された場合）には、本実施形態では、再度、話者に日本語の例文を読み上げさせるように構成されている。

一方、同音異義語による場合として、音声認識部１９において認識された日本語の文字信号としてスピーカ１２ｂから再生された音声と、話者の発した日本語の例文の音声とが、アクセントの強弱やイントネーションなどにおいて異なる場合（たとえば、話者が「橋」を意図して「ハシ」と音声入力した箇所において、スピーカ１２ｂから「端」を意味すると話者にとっては感じられるイントネーションなど（音声に関する情報）によって「ハシ」と音声出力された場合）には、音声認識の修正動作が行われるように構成されている。

次に、図１、図２および図４〜図９を参照して、本発明の一実施形態による自動翻訳対応電話システム１の音声認識の修正動作について説明する。

まず、図７に示す一例のように、音声「ハシ」がアクセントの強弱やイントネーションなどに基づいて「１」から「３」まで区別されており、音声「ハシ」の「１」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部１９（図２参照）にとって「端」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者および音声認識部１９にとって「箸」を意味する場合について説明する。つまり、「１」におけるアクセントの強弱やイントネーションなどと、「２」におけるアクセントの強弱やイントネーションなどとが、話者と音声認識部１９とにおいて異なる場合の音声認識の修正動作について説明する。

話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ１２ｂ（図２参照）から出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、音声認識の修正動作として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「１」が付された数字ボタン１６ｆ（図１参照）と「３」が付された数字ボタン１６ｈ（図１参照）とを順に話者は押下する。これによって、修正箇所（修正用例文１７ｄの（３）の「橋」に関する文節）が選択される。これにより、図５に示すように、「橋」に変更すべき修正候補１７ｇおよび１７ｈが表示パネル１７に表示される。この場合、話者は修正候補１７ｈを選択する。これにより、図７に示すように、音声認識部１９にとって「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するとともに、「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するように入れ替えられる。この際、音声認識部１９にとって「端」と認識するように設定されていた認識範囲（近似範囲）と、「橋」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図７に示すように、音声「ハシ」の「１」〜「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて合致する。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機１０に入力することによって、図６に示すように、音声登録が終了される旨が表示パネル１７に表示され、音声登録が終了される。

次に、図８に示す他の例のように、音声「ハシ」の「１」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部１９にとって「箸」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部１９にとって「端」を意味するように予め登録されている場合について説明する。つまり、「１」、「２」および「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいてそれぞれ異なる場合の音声認識の修正動作について説明する。

話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ１２ｂから出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、第１回目の音声認識の修正動作（１）として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「１」が付された数字ボタン１６ｆと「３」が付された数字ボタン１６ｈとを順に話者は押下する。これによって、修正箇所（修正用例文１７ｄの（３）の「橋」に関する文節）が選択される。これにより、図５に示すように、「橋」に変更すべき修正候補１７ｇおよび１７ｈが表示パネル１７に表示される。この場合、話者は、修正候補１７ｈを選択する。これにより、図８に示すように、音声認識部１９にとって「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するとともに、「箸」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するように入れ替えられる。この際、音声認識部１９にとって「箸」と認識するように設定されていた認識範囲（近似範囲）と、「橋」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。また、この際、音声「ハシ」の「２」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部１９にとって「箸」を意味するとともに、音声「ハシ」の「３」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部１９にとって「端」を意味する。つまり、「２」および「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて未だ異なっている。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが未だ一致していないことを認識する。この結果、話者は、第２回目の音声認識の修正動作（２）を行う。

第２回目の音声認識の修正動作（２）として、図４に示す修正用例文１７ｄ〜１７ｆを参照して、「２」が付された数字ボタン１６ｇと「２」が付された数字ボタン１６ｇとを順に話者は押下する。これによって、修正箇所（修正用例文１７ｅの（２）の「端」に関する文節）が選択される。これにより、図９に示すように、「端」に変更すべき修正候補１７ｉおよび１７ｊが表示パネル１７に表示される。この場合、話者は修正候補１７ｉを選択する。これにより、図８に示すように、音声認識部１９にとって「箸」を意味するように登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するとともに、「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するように入れ替えられる。この際、音声認識部１９にとって「箸」と認識するように設定されていた認識範囲（近似範囲）と、「端」と認識するように設定されていた認識範囲（近似範囲）とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図８に示すように、音声「ハシ」の「１」〜「３」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部１９とにおいて合致する。

そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力される。ここで、話者は、再度スピーカ１２ｂから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ１２ｂから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機１０に入力することによって、図６に示すように、音声登録が終了される旨が表示パネル１７に表示され、音声登録が終了される。

次に、図２〜図６、図１０および図１１を参照して、本発明の一実施形態による自動翻訳対応電話システム１の発信元電話機１０の音声登録時の制御動作について説明する。

まず、図１０に示すように、ステップＳ１において、発信元電話機１０の制御部１３（図２参照）によって、複数のメニュープログラムのうち、選択決定ボタン１６ｂ（図２参照）によって音声登録メニュープログラムが選択されたか否かが判断されるとともに、音声登録メニュープログラムが選択されるまで、ステップＳ１の判断が繰り返される。そして、ステップＳ１において、制御部１３によって、音声登録メニュープログラムが選択されたと判断された場合には、ステップＳ２に進み、制御部１３によって、図３に示すように、話者に通知するために、「１」〜「３」の文章番号がそれぞれ付されているとともに、話者に読み上げさせるための３つの読み上げ例文１７ａ〜１７ｃと、読み終わった後にシャープボタン１６ｅを押下させるメッセージ（「読み終わったら「♯」を押してください。」）と、シャープボタン１６ｅの押下後に音声認識の結果を再生するメッセージ（「音声認識が認識した結果を音声にて再生します。」）とが表示パネル１７に表示される。なお、読み上げ例文１７ａには「橋」、読み上げ例文１７ｂには「端」および読み上げ例文１７ｃには「箸」がそれぞれ含まれており、「橋」、「端」および「箸」は、それぞれ「ハシ」の音を有する同音異義語の関係を有している。そして、ステップＳ３に進む。

そして、ステップＳ３において、制御部１３によって、集音器１２ａに話者が発する日本語の音声が入力されたか否かが判断されるとともに、集音器１２ａに話者が発する日本語の音声が入力されるまで、ステップＳ３の判断が繰り返される。そして、ステップＳ３において、制御部１３によって、集音器１２ａに話者が発する日本語の音声が入力されたと判断された場合には、ステップＳ４において、制御部１３によって、話者が発した日本語の音声を音声変換器１４（図２参照）によって日本語の音声信号に変換した後に、日本語の音声信号が音声認識部１９（図２参照）において文節で区切り日本語の文字信号として認識される。この際、制御部１３によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる発信元電話機１０の製造時に予め登録されている音声に関する情報に基づいて、話者が発した音声が文節で区切られて認識される。

その後、ステップＳ５において、制御部１３によって、シャープボタン１６ｅ（図２参照）が押下されたか否かが判断される。そして、ステップＳ５において、制御部１３によって、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ６に進む。また、ステップＳ５において、制御部１３によって、シャープボタン１６ｅが押下されていないと判断された場合には、ステップＳ３に戻る。

そして、ステップＳ６において、制御部１３によって、図４に示すように、「１」の文章番号が付された読み上げ例文１７ａ（図３参照）を構成する文節ごとに（１）〜（５）の文節番号がそれぞれ付された修正用例文１７ｄと、「２」の文章番号が付された読み上げ例文１７ｂ（図３参照）を構成する文節ごとに（１）〜（５）の文節番号がそれぞれ付された修正用例文１７ｅと、「３」の文章番号が付された読み上げ例文１７ｃ（図３参照）を構成する文節ごとに（１）〜（４）の文節番号がそれぞれ付された修正用例文１７ｆとが表示パネル１７に表示される。また、制御部１３によって、話者に通知するために、間違いがない場合は選択決定ボタン１６ｂを押下させるメッセージ（「間違いがない場合は、選択決定ボタンを押してください。」）と、同音異義語に間違いがあった場合は、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃを押下させた後に、シャープボタン１６ｅを押下させるメッセージ（「同音異義語の間違いがあった場合は、文章番号⇒文節番号の順番に指定して最後に「♯」を押してください。」）と、同音異義語以外に間違いがあった場合は、アスタリスクボタン１６ｄを押下させるメッセージ（「同音異義語以外の間違いがあった場合は、「＊」を押してください。」）とが表示パネル１７に表示される。そして、ステップＳ７に進み、制御部１３によって、音声認識部１９において認識された文字信号が音声信号に変換されるとともに、音声信号が音声変換器１４によってアナログの音声に変換されてスピーカ１２ｂ（図２参照）から出力（再生）される。そして、ステップＳ８の音声認識の修正動作に進む。なお、文節番号は、本発明の「番号」の一例である。

ここで、図１１に示す音声認識の修正動作時では、まず、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂ（図２参照）が押下されたか否かが判断される。そして、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されていないと判断された場合には、ステップＳ８ｂに進む。また、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されたと判断された場合には、ステップＳ８ｈに進む。

また、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄ（図２参照）が押下されたか否かが判断される。そして、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄが押下されたと判断された場合には、図１０に示すステップＳ２に戻る。なお、アスタリスクボタン１６ｄが押下されてステップＳ２に戻ることによって、再度、話者に３つの読み上げ例文１７ａ〜１７ｃを読み上げさせることになる。また、ステップＳ８ｂにおいて、制御部１３によって、アスタリスクボタン１６ｄが押下されていないと判断された場合には、ステップＳ８ｃに進む。

そして、ステップＳ８ｃにおいて、制御部１３によって、３つの修正用例文１７ｄ〜１７ｆの文頭に付された文章番号（図４参照）と、それぞれの文節ごとに付された文節番号（図４参照）とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されたか否かが判断される。そして、ステップＳ８ｃにおいて、制御部１３によって、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ８ｄに進む。これにより、修正用例文１７ｄ、１７ｅまたは１７ｆのいずれかの修正用例文のいずれかの文節が選択されることによって、修正箇所が選択決定される。また、ステップＳ８ｃにおいて、制御部１３によって、文章番号と文節番号とに対応する数字が付された数字ボタン部１６ｃがそれぞれ押下された後に、シャープボタン１６ｅが押下されていないと判断された場合には、ステップＳ８ａに戻る。

また、ステップＳ８ｄにおいて、制御部１３によって、図５に示すように、選択決定された修正箇所における文章番号と文節番号とに対応する文節に含まれる単語の修正候補１７ｇおよび１７ｈが、修正番号「１」および「２」がそれぞれ付された状態で表示パネル１７に表示される。また、制御部１３によって、話者に通知するために、修正候補の修正番号を押下した後に、シャープボタン１６ｅを押下させるメッセージ（「正しい番号を選択し、「♯」を押してください。」）と、修正結果をスピーカ１２ｂから再生するメッセージ（「修正結果を音声にて再生します。」）とが表示パネル１７に表示される。そして、ステップＳ８ｅに進む。

また、ステップＳ８ｅにおいて、制御部１３によって、修正候補１７ｇに付された修正番号「１」に対応する数字ボタン１６ｆまたは修正候補１７ｈに付された修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されたか否かが判断されるとともに、修正番号「１」に対応する数字ボタン１６ｆまたは修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されるまで、ステップＳ８ｅの判断が繰り返される。そして、ステップＳ８ｅにおいて、制御部１３によって、修正番号「１」に対応する数字ボタン１６ｆまたは修正番号「２」に対応する数字ボタン１６ｇが押下された後に、シャープボタン１６ｅが押下されたと判断された場合には、ステップＳ８ｆに進む。

そして、ステップＳ８ｆにおいて、制御部１３によって、ステップＳ８ｃにおいて選択された文章番号と文節番号とに対応する文節に含まれる単語が、ステップＳ８ｅにおいて選択された修正番号「１」または「２」を有する修正候補１７ｇまたは１７ｈに含まれる単語であるということが話者の音声に関する情報として認識される。具体的には、話者の意図する音声のアクセントの強弱やイントネーションなどと単語との対応関係と、音声認識部１９における音声のアクセントの強弱やイントネーションなどと単語との対応関係とが合致するように、制御部１３によって、音声認識部１９に登録されていた単語の修正候補１７ｇまたは１７ｈの左側に配置されている単語のアクセントの強弱やイントネーションなどと、右側に配置されている単語のアクセントの強弱やイントネーションなどとが入れ替えられるとともに、音声に関する情報の認識範囲（近似範囲）が入れ替えられることによって、話者の音声に関する情報として認識される。そして、ステップＳ８ｇに進み、制御部１３によって、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文１７ａ〜１７ｃがスピーカ１２ｂから音声として出力されるとともに、図４に示す修正用例文１７ｄ〜１７ｆが表示パネル１７に表示される。そして、ステップＳ８ａに戻る。

また、ステップＳ８ａにおいて、制御部１３によって、選択決定ボタン１６ｂが押下されたと判断された場合、ステップＳ８ｈにおいて、制御部１３によって、話者の音声に関する情報がメモリ１８に記憶される。そして、ステップＳ８ｉに進み、制御部１３によって、図６に示すように、話者に通知するために、話者の音声に関する情報の登録が完了したメッセージ（「登録が完了しました。」）が表示パネル１７に表示される。そして、発信元電話機１０の音声登録時の制御が終了される。

次に、図２および図１２を参照して、本発明の第１実施形態による自動翻訳対応電話システム１の発信元電話機１０の音声通話時の制御動作について説明する。

まず、図１２に示すように、ステップＳ１１において、発信元電話機１０の制御部１３（図２参照）によって、受話器１２（図２参照）が話者により持ち上げられることによって、発信元電話機１０が通話可能な状態になったか否かが判断されるとともに、発信元電話機１０が通話可能な状態になるまで、ステップＳ１１の判断が繰り返される。そして、ステップＳ１１において、制御部１３によって、発信元電話機１０が通話可能な状態になったと判断された場合には、ステップＳ１２において、制御部１３によって、操作パネル１６（図２参照）の数字ボタン部１６ｃ（図２参照）が押下されて、送信先電話機３０の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップＳ１２の判断が繰り返される。そして、ステップＳ１２において、制御部１３によって、送信先電話番号がダイヤルされたと判断された場合には、ステップＳ１３に進む。

そして、ステップＳ１３において、制御部１３によって、電話回線制御回路１５（図２参照）から送信先電話番号に関する信号が外部（回線交換機５０（図２参照））に出力される。そして、ステップＳ１４に進み、制御部１３によって、発信元電話機１０と送信先電話機３０（図２参照）とが電話回線４０および４１（図２参照）を介して接続された旨を通知する接続信号が回線交換機５０から電話回線制御回路１５に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップＳ１４の判断が繰り返される。そして、ステップＳ１４において、制御部１３によって、接続信号が入力されたと判断された場合には、ステップＳ１５に進み、制御部１３によって、発信元電話番号に基づいて、電子辞書部２１の複数の方言辞書２１ｂから対応する方言辞書２１ｂが選択される。そして、ステップＳ１６に進む。

また、ステップＳ１６に進み、制御部１３によって、集音器１２ａ（図２参照）から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップＳ１６の判断が繰り返される。そして、ステップＳ１６において、制御部１３によって、話者が発する音声が入力されたと判断された場合には、ステップＳ１７に進む。

次に、ステップＳ１７において、制御部１３によって、話者が発した日本語の音声を音声変換器１４によって日本語の変換前の音声信号に変換した後に、音声認識部１９（図２参照）において、話者によって音声登録時にメモリ１８に予め登録された話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部１９において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップＳ１８に進み、制御部１３によって、翻訳エンジン部２０（図２参照）により選択された方言辞書２１ｂを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる方言が認識されて、標準語の翻訳前の文字信号に変換されるとともに、基本辞書２１ａを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳（変換）される。そして、ステップＳ１９に進む。

そして、ステップＳ１９において、制御部１３によって、音声認識部１９において、英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップＳ２０に進み、制御部１３によって、英語の変換後の音声信号が、電話回線４０および４１を介して、送信先電話機３０に出力される。そして、発信元電話機１０の音声通話時の制御が終了される。

第１実施形態では、上記のように、制御部１３によって、集音器１２ａを介して入力される話者に読み上げられた日本語の例文（読み上げ例文１７ａ〜１７ｃ）の音声が音声認識部１９において日本語の文字として認識されるととともに、話者が確認可能なように日本語の文字が音声としてスピーカ１２ｂから出力（再生）されるように構成することによって、スピーカ１２ｂによって話者が確認可能なように日本語の文字を通知することにより、話者に発信元電話機１０における音声の認識の状態を確認させることができる。また、音声認識部１９では、制御部１３によって、話者によって予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声（音声信号）が話者が発する音声に対応する英語に翻訳する前の日本語の文字（翻訳前の文字信号）として認識されるように構成することによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、制御部１３によって、電子辞書部２１の方言辞書２１ｂを参照して、話者の音声が文節に区切られて文字として認識される際に、音声認識部１９において認識された日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識した方言が日本語の標準語の翻訳前の文字信号に変換されるように構成することによって、日本語を発する話者が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書２１ｂを用いることにより、音声認識部１９を特定された方言に対応させることができる。これにより、話者が発する音声に含まれる方言による単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、日本語を用いる話者と英語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。

また、第１実施形態では、上記のように、制御部１３によって、発信元電話機１０の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言が特定されて、特定された方言に対応する方言辞書２１ｂが選択されるように構成することによって、発信元電話機１０の発信元電話番号を用いることによって、話者に通話時に必要な送信先電話番号の入力以外のその他の特定の操作を要求することなく、日本語に含まれる方言を特定することができる。これにより、話者が発する音声に含まれる方言による単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第１言語を用いる話者と第２言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。

また、第１実施形態では、上記のように、制御部１３によって、音声登録メニュープログラムにおいて、集音器１２ａを介して入力される話者に読み上げられた日本語の例文（読み上げ例文１７ａ〜１７ｃ）の音声が、音声認識部１９において日本語の文字として認識され、話者が確認可能なように認識した日本語の文字が音声としてスピーカ１２ｂから出力（再生）されることによって、スピーカ１２ｂから出力される音声により、話者は、発信元電話機１０における音声の認識の状態を聴覚によって確認することができる。これにより、話者が発する音声に含まれる単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、これによっても、翻訳の精度を向上させることができる。

（第２実施形態）
次に、図１３〜図１６を参照して、第２実施形態について説明する。この第２実施形態による自動翻訳対応電話システム１００では、上記第１実施形態と異なり、発信元電話機１１０のＧＰＳ（全地球測位システム）による位置情報を用いて話者の方言を特定するとともに、自動翻訳対応電話システム１００の回線交換機１５０に翻訳エンジン部１５１および電子辞書部１５２を設ける場合について説明する。

まず、図１３および図１４を参照して、本発明の第２実施形態による自動翻訳対応電話システム１００の構成について説明する。

本発明の第２実施形態による自動翻訳対応電話システム１００では、図１３に示すように、発信元電話機１１０および送信先電話機１３０は、それぞれ、携帯電話によって構成されているとともに、発信元電話機１１０は、ＧＰＳ機能を搭載している。また、発信元電話機１１０から出力される音声信号および文字信号を含む電波は、基地局１６０において受信された後に、電話回線１４０を介して回線交換機１５０に受信されるとともに、回線交換機１５０から出力される音声信号および文字信号は、電話回線１４０を介して基地局１６０において電波として発信された後に、発信元電話機１１０に入力されるように構成されている。これにより、回線交換機１５０により電話回線１４０と電話回線１４１とが接続されることによって、発信元電話機１１０は、送信先電話機１３０と接続可能なように構成されている。また、発信元電話機１１０と送信先電話機１３０とが接続されている状態においては、発信元電話機１１０および送信先電話機１３０から出力された音声信号および文字信号は、それぞれ、送信先電話機１３０および発信元電話機１１０に入力されるように構成されている。また、話者が発信元電話機１１０において送信先電話番号をダイヤルすることにより送信先電話機１３０と接続された際には、回線交換機１５０から電話回線１４０および基地局１６０を介して、接続された旨を通知する接続信号が発信元電話機１１０に入力されるように構成されている。

また、第２実施形態において、発信元電話機１１０には、図１４に示すように、筐体１１と、集音器１２ａと、スピーカ１２ｂと、制御部１３と、音声変換器１４と、電話回線制御回路１５と、１２個のボタンを含むボタン部１６ａおよび選択決定ボタン１６ｂからなる操作パネル１６と、表示パネル１７と、メモリ１８と、音声認識部１９とが設けられている。また、ボタン部１６ａは、数字が付された数字ボタン部１６ｃと、アスタリスクが付されたアスタリスクボタン１６ｄと、シャープが付されたシャープボタン１６ｅとを含む。また、数字ボタン部１６ｃは、「１」〜「９」の数字がそれぞれ付された数字ボタン１６ｆ〜１６ｎと、「０」の数字が付された数字ボタン１６ｏとからなる。また、発信元電話機１１０には、送信先電話機１３０から音声信号および文字信号を含む電波を送受信するためのアンテナ１２２と、ＧＰＳ（全地球測位システム）による位置情報を取得するための位置情報取得部１２３とがさらに設けられている。このＧＰＳによる位置情報によって、発信元電話機１１０の位置する地域が特定されるように構成されている。また、制御部１３によって、アンテナ１２２を介して、回線交換機１５０に送信元電話番号と位置情報取得部１２３において得られたＧＰＳによる位置情報とが出力されるように構成されている。

また、発信元電話機１１０には、上記第１実施形態の発信元電話機１０（図２参照）と異なり、翻訳エンジン部２０（図２参照）および電子辞書部２１（図２参照）が設けられていない。一方、回線交換機１５０は、翻訳エンジン部１５１を備えているとともに、翻訳エンジン部１５１には、基本辞書１５２ａおよび複数の方言辞書１５２ｂを含む電子辞書部１５２が設けられている。また、回線交換機１５０は、翻訳エンジン部１５１および電子辞書部１５２などを制御する制御部１５３を備えている。このように、回線交換機１５０に翻訳エンジン部１５１および電子辞書部１５２を設けることによって、翻訳エンジン部１５１および電子辞書部１５２を更新して翻訳に関する新たな情報を追加する際に、回線交換機１５０のみを更新すればよく、個々の発信元電話機１１０のそれぞれを更新させる必要がないので、自動翻訳対応電話システム１００において、翻訳に関する新たな情報を容易に追加することが可能である。これにより、より正確に、話者が発する音声に対応する日本語の方言の文字信号を、日本語の標準語の文字信号に対応する英語の文字信号に翻訳（変換）することが可能になる。なお、翻訳エンジン部１５１および電子辞書部１５２は、本発明の「文字変換部」の一例である。

ここで、第２実施形態では、制御部１５３によって、発信元電話機１１０から入力された位置情報を用いて、話者の位置する地域の日本語に含まれる方言が特定されるとともに、特定された方言に対応する方言辞書１５２ｂが選択されるように構成されている。また、制御部１５３によって、選択された方言辞書１５２ｂを参照して、日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識された方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。なお、第２実施形態のその他の構成および発信元電話機の音声登録時の制御動作は、上記第１実施形態と同様である。

次に、図１４〜図１６を参照して、本発明の第２実施形態による自動翻訳対応電話システム１００の音声通話時の制御動作について説明する。

まず、図１５に示すように、ステップＳ１１１において、発信元電話機１１０の制御部１３（図１４参照）によって、発信元電話機１１０が通話可能な状態になったか否かが判断されるとともに、発信元電話機１１０が通話可能な状態になるまで、ステップＳ１１１の判断が繰り返される。そして、ステップＳ１１１において、制御部１３によって、発信元電話機１１０が通話可能な状態になったと判断された場合には、ステップＳ１１２において、制御部１３によって、操作パネル１６（図１４参照）の数字ボタン部１６ｃ（図１４参照）が押下されて、送信先電話機１３０の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップＳ１１２の判断が繰り返される。そして、ステップＳ１１２において、制御部１３によって、送信先電話番号がダイヤルされたと判断された場合には、ステップＳ１１３に進む。

そして、ステップＳ１１３において、制御部１３によって、アンテナ１２２（図１４参照）から送信先電話番号と位置情報とに関する信号が回線交換機１５０（図１４参照）に出力される。そして、ステップＳ１１４に進む。

ここで、図１６に示すように、ステップＳ１３１において、回線交換機１５０の制御部１５３（図１４参照）によって、発信元電話機１１０から出力された送信先電話番号と位置情報とに関する信号が受信されたか否かが判断されるとともに、送信先電話番号と位置情報とに関する信号が受信されるまで、ステップＳ１３１の判断が繰り返される。そして、ステップＳ１３１において、制御部１５３によって、送信先電話番号と位置情報とに関する信号が受信されたと判断された場合には、ステップＳ１３２に進み、制御部１５３によって、発信元電話機１１０と送信先電話機１３０とが接続されるように、電話回線１４０と電話回線１４１とが接続される。そして、ステップＳ１３３に進む。

そして、ステップＳ１３３において、制御部１５３によって、発信元電話機１１０に送信先電話機１３０と接続した旨の接続信号が出力される。そして、ステップＳ１３４に進み、制御部１５３によって、翻訳エンジン部１５１（図１４参照）が電話回線１４０と電話回線１４１との間に接続される。そして、ステップＳ１３５に進み、制御部１５３によって、発信元電話機１１０から出力された位置情報に基づいて、電子辞書部１５２の複数の方言辞書１５２ｂから対応する方言辞書１５２ｂが選択される。そして、ステップＳ１３６に進む。

一方、図１５に示すステップＳ１１４において、制御部１３によって、発信元電話機１１０に送信先電話機１３０と接続した旨の接続信号が、回線交換機１５０からアンテナ１２２に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップＳ１１４の判断が繰り返される。そして、ステップＳ１１４において、制御部１３によって、接続信号が入力されたと判断された場合には、ステップＳ１１５に進む。

また、ステップＳ１１５において、制御部１３によって、集音器１２ａ（図１４参照）から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップＳ１１５の判断が繰り返される。そして、ステップＳ１１５において、制御部１３によって、話者が発する音声が入力されたと判断された場合には、ステップＳ１１６に進む。

次に、ステップＳ１１６において、制御部１３によって、話者が発した日本語の音声を音声変換器１４によって日本語の変換前の音声信号に変換した後に、音声認識部１９（図１４参照）において、話者によって音声登録時にメモリ１８に予め登録された話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部１９において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップＳ１１７に進み、制御部１３によって、日本語の翻訳前の文字信号が、基地局１６０および電話回線１４０を介して、回線交換機１５０に出力される。そして、発信元電話機１１０における音声通話時の制御が終了される。

一方、図１６に示すステップＳ１３６において、制御部１５３によって、発信元電話機１１０から出力された日本語の翻訳前の文字信号が受信されたか否かが判断されるとともに、日本語の翻訳前の文字信号が受信されるまで、ステップＳ１３６の判断が繰り返される。そして、ステップＳ１３６において、制御部１５３によって、日本語の翻訳前の文字信号が受信されたと判断した場合には、ステップＳ１３７に進む。

そして、ステップＳ１３７において、制御部１５３によって、翻訳エンジン部１５１（図１４参照）により選択された方言辞書１５２ｂを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる方言が認識されて、日本語の標準語の翻訳前の文字信号に変換されるとともに、基本辞書１５２ａを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳（変換）される。そして、ステップＳ１３８に進み、制御部１５３によって、英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップＳ１３９に進み、制御部１５３によって、英語の変換後の音声信号が、電話回線１４１および基地局１６１を介して、送信先電話機１３０に出力される。そして、回線交換機１５０における音声通話時の制御が終了される。

第２実施形態では、上記のように、制御部１５３によって、発信元電話機１１０から入力されたＧＰＳによる位置情報を用いて、話者の位置する地域の日本語に含まれる方言が特定されるように構成することによって、ＧＰＳによる位置情報を用いることによって、話者に特定の操作を要求することなく、話者の位置する地域の日本語に含まれる方言を特定することができるので、日本語を用いる話者と英語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。なお、第２実施形態のその他の効果は、上記第１実施形態と同様である。

（第３実施形態）
次に、図１７〜図１９を参照して、第３実施形態について説明する。この第３実施形態による自動翻訳対応電話システム２００では、上記第１実施形態と異なり、自動翻訳対応電話システム２００の回線交換機２５０に翻訳エンジン部２５１および電子辞書部２５２を設けるとともに、電子辞書部２５２に、複数の発信元方言辞書２５２ｃと、複数の言語にそれぞれ対応する送信先基本辞書２５２ｅおよび各々の送信先基本辞書２５２ｅに対応する言語の複数の送信先方言にそれぞれ対応する送信先方言辞書２５２ｆを有する送信先辞書部２５２ｄとを設ける場合について説明する。

まず、図１７を参照して、本発明の第３実施形態による自動翻訳対応電話システム２００の構成について説明する。

本発明の第３実施形態による自動翻訳対応電話システム２００の発信元電話機２１０は、日本の方言を有する地域に位置するとともに、送信先電話機３０は、英語圏の方言を有する地域に位置する。また、発信元電話機２１０には、図１７に示すように、上記第１実施形態の発信元電話機１０（図２参照）と異なり、翻訳エンジン部２０（図２参照）および電子辞書部２１（図２参照）が設けられていない。一方、回線交換機２５０は、翻訳エンジン部２５１を備えているとともに、翻訳エンジン部２５１には、電子辞書部２５２が設けられている。また、回線交換機２５０は、翻訳エンジン部２５１および電子辞書部２５２などを制御する制御部２５３を備えている。なお、翻訳エンジン部２５１および電子辞書部２５２は、本発明の「文字変換部」の一例である。

また、電子辞書部２５２には、複数の発信元方言辞書２５２ｃと、送信先辞書部２５２ｄとが設けられている。この発信元方言辞書２５２ｃは、日本国内の異なる地域においてそれぞれ用いられる発信元方言の文字と日本語の標準語の文字とが対応付けられた状態で記憶されている。また、送信先辞書部２５２ｄには、日本語の言語の標準語の文字（単語）と日本語以外の言語の標準語の文字（単語）とが対応付けられた状態でそれぞれ記憶された複数の送信先基本辞書２５２ｅと、各々の送信先基本辞書２５２ｅに対応する言語が用いられる地域内の異なる地域においてそれぞれ用いられる送信先方言の文字と、各々の送信先基本辞書２５２ｅに対応する言語の標準語の文字とが対応付けられた状態で記憶された複数の送信先方言辞書２５２ｆとが設けられている。また、電子辞書部２５２には、発信元電話番号に基づいて、複数の発信元方言辞書２５２ｃから対応する発信元方言辞書２５２ｃを選択するとともに、送信先電話番号に基づいて、複数の送信先基本辞書２５２ｅから対応する送信先基本辞書２５２ｅと、複数の送信先方言辞書２５２ｆから対応する送信先方言辞書２５２ｆとを選択するための辞書選択部２５２ｇが含まれている。なお、発信元方言は、本発明の「第１方言」の一例であり、送信先方言は、本発明の「第２方言」の一例である。また、発信元方言辞書２５２ｃは、本発明の「方言辞書」および「第１方言辞書」の一例であり、送信先方言辞書２５２ｆは、本発明の「方言辞書」および「第２方言辞書」の一例である。

また、第３実施形態では、制御部２５３によって、発信元電話機２１０の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる発信元方言が特定されるとともに、辞書選択部２５２ｇにおいて、特定された発信元方言に対応する発信元方言辞書２５２ｃが選択されるように構成されている。また、制御部２５３によって、送信先電話機３０の送信先電話番号を用いて、辞書選択部２５２ｇにおいて、送信先電話機３０の位置する英語の送信先基本辞書２５２ｅが選択されるとともに、送信先電話機３０の位置する地域の英語に含まれる送信先方言が特定されて、特定された送信先方言に対応する英語の送信先方言辞書２５２ｆが選択されるように構成されている。

ここで、第３実施形態では、制御部２５３によって、電子辞書部２５２の選択された発信元方言辞書２５２ｃを参照して、日本語の翻訳前の文字信号に含まれる発信元方言が認識されるとともに、認識した発信元方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。また、制御部２５３によって、英語の送信先基本辞書２５２ｅおよび英語に含まれる送信先方言に対応する送信先方言辞書２５２ｆを参照して、日本語の標準語の翻訳前の文字信号が英語の標準語の翻訳後の文字信号に変換されるとともに、英語の標準語の翻訳後の文字信号が特定された英語の送信先方言を含む英語の翻訳後の文字信号に変換されるように構成されている。なお、第３実施形態のその他の構成および発信元電話機の音声登録時の制御動作は、上記第１実施形態と同様である。

次に、図１７〜図１９を参照して、本発明の第３実施形態による自動翻訳対応電話システム２００の音声通話時の制御動作について説明する。

まず、図１８に示すように、ステップＳ２１１において、発信元電話機２１０の制御部１３（図１７参照）によって、受話器１２（図１７参照）が話者により持ち上げられることによって、発信元電話機２１０が通話可能な状態になったか否かが判断されるとともに、発信元電話機２１０が通話可能な状態になるまで、ステップＳ２１１の判断が繰り返される。そして、ステップＳ２１１において、制御部１３によって、発信元電話機２１０が通話可能な状態になったと判断された場合には、ステップＳ２１２において、制御部１３によって、操作パネル１６（図１７参照）の数字ボタン部１６ｃ（図１７参照）が押下されて、送信先電話機３０の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップＳ２１２の判断が繰り返される。そして、ステップＳ２１２において、制御部１３によって、送信先電話番号がダイヤルされたと判断された場合には、ステップＳ２１３に進む。

そして、ステップＳ２１３において、制御部１３によって、電話回線制御回路１５（図１７参照）から発信元電話番号と送信先電話番号とに関する信号が回線交換機２５０（図１７参照）に出力される。そして、ステップＳ２１４に進む。

ここで、図１９に示すように、ステップＳ２３１において、回線交換機２５０の制御部２５３（図１７参照）によって、発信元電話機２１０から出力された発信元電話番号と送信先電話番号とに関する信号が受信されたか否かが判断されるとともに、発信元電話番号と送信先電話番号とに関する信号が受信されるまで、ステップＳ２３１の判断が繰り返される。そして、ステップＳ２３１において、制御部２５３によって、発信元電話番号と送信先電話番号とに関する信号が受信されたと判断された場合には、ステップＳ２３２に進み、制御部２５３によって、発信元電話機２１０と送信先電話機３０とが接続されるように、電話回線４０と電話回線４１とが接続される。そして、ステップＳ２３３に進む。

そして、ステップＳ２３３において、制御部２５３によって、発信元電話機２１０に送信先電話機３０と接続した旨の接続信号が出力される。そして、ステップＳ２３４に進み、制御部２５３によって、翻訳エンジン部２５１（図１７参照）が電話回線４０と電話回線４１との間に接続される。そして、ステップＳ２３５に進み、制御部２５３によって、辞書選択部２５２ｇにおいて、発信元電話機２１０から出力された発信元電話番号に基づいて、電子辞書部２５２の複数の発信元方言辞書２５２ｃから対応する発信元方言辞書２５２ｃが選択されるとともに、送信先電話番号に基づいて、複数の送信先基本辞書２５２ｅから対応する送信先基本辞書２５２ｅと、複数の送信先方言辞書２５２ｆから対応する送信先方言辞書２５２ｆとが選択される。そして、ステップＳ２３６に進む。

一方、図１８に示すステップＳ２１４において、制御部１３によって、発信元電話機２１０に送信先電話機３０と接続した旨の接続信号が、回線交換機２５０から電話回線制御回路１５に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップＳ２１４の判断が繰り返される。そして、ステップＳ２１４において、制御部１３によって、接続信号が入力されたと判断された場合には、ステップＳ２１５に進む。

また、ステップＳ２１５において、制御部１３によって、集音器１２ａ（図１７参照）から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップＳ２１５の判断が繰り返される。そして、ステップＳ２１５において、制御部１３によって、話者が発する音声が入力されたと判断された場合には、ステップＳ２１６に進む。

次に、ステップＳ２１６において、制御部１３によって、話者が発した日本語の音声を音声変換器１４によって日本語の変換前の音声信号に変換した後に、音声認識部１９（図１７参照）において、話者によって音声登録時にメモリ１８に予め登録された、話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部１９において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップＳ２１７に進み、制御部１３によって、日本語の翻訳前の文字信号が、電話回線４０を介して、回線交換機２５０に出力される。そして、発信元電話機２１０における音声通話時の制御が終了される。

一方、図１９に示すステップＳ２３６において、制御部２５３によって、発信元電話機２１０から出力された日本語の翻訳前の文字信号が受信されたか否かが判断されるとともに、日本語の翻訳前の文字信号が受信されるまで、ステップＳ２３６の判断が繰り返される。そして、ステップＳ２３６において、制御部２５３によって、日本語の翻訳前の文字信号が受信されたと判断した場合には、ステップＳ２３７に進む。

そして、ステップＳ２３７において、制御部２５３によって、翻訳エンジン部２５１（図１７参照）により選択された発信元方言辞書２５２ｃを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる発信元方言が認識されて、日本語の標準語の翻訳前の文字信号に変換されるとともに、選択された送信先基本辞書２５２ｅを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳（変換）され、選択された送信先方言辞書２５２ｆを用いて、英語の標準語の翻訳後の文字信号が、対応する送信先方言を含む英語の翻訳後の文字信号に変換される。そして、ステップＳ２３８に進み、制御部２５３によって、送信先方言を含む英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップＳ２３９に進み、制御部２５３によって、英語の変換後の音声信号が、電話回線４１を介して、送信先電話機３０に出力される。そして、回線交換機２５０における音声通話時の制御が終了される。

第３実施形態では、上記のように、制御部２５３によって、電子辞書部２５２の選択された発信元方言辞書２５２ｃを参照して、日本語の翻訳前の文字信号に含まれる発信先方言が認識されるとともに、認識した発信先方言が日本語の標準語の翻訳前の文字信号に変換され、英語の送信先基本辞書２５２ｅおよび英語の送信先方言辞書２５２ｆを参照して、日本語の標準語の翻訳前の文字信号が英語の標準語の翻訳後の文字信号に変換されるとともに、英語の標準語の翻訳後の文字信号が特定された英語の送信先方言を含む英語の翻訳後の文字信号に変換されることによって、日本語を発する話者が発信元方言を有する地域に位置するとともに、英語を発する通話相手が送信先方言を有する地域に位置する場合においても、特定された発信元方言および送信先方言にそれぞれ対応する発信元方言辞書２５２ｃおよび送信先方言辞書２５２ｆを用いることにより、音声認識部１９を発信元方言および送信先方言に対応させることができる。これにより、話者の発する音声に含まれる発信元方言および通話相手が発する音声に含まれる送信先方言による単語が、話者および通話相手の両方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、日本語から英語への変換（翻訳）のみならず、日本語から英語への変換（翻訳）の精度も向上させることができる。なお、第３実施形態のその他の効果は、上記第１実施形態と同様である。

なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。

たとえば、第２および第３実施形態では、自動翻訳対応電話システムの発信元電話機に音声認識部を設けた例を示したが、本発明はこれに限らず、発信元電話機に音声認識部を設けずに、回線交換機に音声認識部を設けてもよい。このように構成すれば、音声認識部、翻訳エンジン部および電子辞書部を有しない、より一般的な発信元電話機を用いた場合においても、話者は、自動翻訳機能を利用することが可能になる。

また、第１および第２実施形態では、話者の位置する地域の日本語に含まれる方言を特定した例を示したが、本発明はこれに限らず、話者の位置する地域の日本語に含まれる方言を特定せずに、送信先電話機（通話相手）の地域を特定することによって、送信先電話機の位置する地域の方言を特定してもよい。その際、第２実施形態における送信先電話機は、ＧＰＳ機能を搭載している必要がある。

また、第１実施形態では、発信元電話機１０の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言を特定する例を示すとともに、第２実施形態では、ＧＰＳからの位置情報を用いて、話者の位置する地域の日本語に含まれる方言を特定する例を示したが、本発明はこれに限らず、たとえば、第２実施形態においては、発信元電話機から電波による信号が受信される基地局の位置情報などのような、発信元電話番号およびＧＰＳからの位置情報以外の話者の地域を特定する情報を用いて、話者の位置する地域の日本語に含まれる方言を特定してもよい。

また、第１〜第３実施形態では、本発明の「第１言語」として日本語を、本発明の「第２言語」として英語をそれぞれ用いた例を示したが、本発明はこれに限らず、「第１言語」および「第２言語」は、日本語および英語に限られず、他の国の言葉でもよい。

また、第１〜第３実施形態では、音声登録メニュープログラムにおいて、制御部１３によって、話者に読み上げられた日本語の例文（読み上げ例文１７ａ〜１７ｃ）の音声が音声認識部１９において日本語の文字として認識されるととともに、話者が確認可能なように日本語の文字が音声としてスピーカ１２ｂから出力（再生）されることによって、日本語の文字を話者に通知するように構成した例を示したが、本発明はこれに限らず、音声登録メニュープログラムにおいて、たとえば、音声認識部において認識された日本語の文字を表示パネルに表示することによって、日本語の文字を話者に通知するように構成してもよい。

また、第１〜第３実施形態では、音声認識部１９では、制御部１３によって、話者の音声に関する情報に基づいて、話者の音声が文節に区切って文字として認識された例を示したが、本発明はこれに限らず、音声認識部では、制御部によって、話者の音声に関する情報に基づいて、話者の音声が単語ごとに区切られて文字として認識されるように構成してもよい。

１、１００、２００自動翻訳対応電話システム
１０発信元電話機（自動翻訳対応電話機）
１２ａ集音器（音声入力部）
１２ｂスピーカ（第１出力部、音声出力部、出力部）
１３制御部
１５電話回線制御回路（第２出力部）
１８メモリ
１９音声認識部
２０、１５１、２５１翻訳エンジン部（文字変換部）
２１、１５２、２５２電子辞書部（文字変換部）
２１ｂ、１５２ｂ方言辞書
１５３、２５３制御部
２５２ｃ発信元方言辞書（方言辞書、第１方言辞書）
２５２ｆ送信先方言辞書（方言辞書、第２方言辞書）

Claims

第１言語によって話者が発する音声が入力される音声入力部と、
話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
予め登録された前記話者が発する音声に関する情報に基づいて、話者から入力された音声を、前記第１言語と異なる第２言語に翻訳する前の前記第１言語に対応する文字として認識するための音声認識部と、
前記第１言語および前記第２言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、前記第１言語に対応する文字を前記第２言語に対応する文字に変換するための文字変換部と、
前記音声認識部により認識された前記第１言語の文字を出力する第１出力部と、
前記話者が発する音声に関する情報を登録する際に、話者から入力された音声を前記第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第１言語に対応する文字を通知するように前記第１出力部を制御する制御部とを備え、
前記制御部は、前記第１言語に対応する文字を前記第２言語に対応する文字に変換する際に、前記第１言語および前記第２言語の少なくとも一方に含まれる方言を特定して前記方言に対応する前記電子辞書部の方言辞書を選択して参照するように構成されている、自動翻訳対応電話システム。
前記文字変換部により前記第１言語の文字から変換された前記第２言語に対応する文字を出力する第２出力部をさらに備え、
前記制御部は、前記第１言語に含まれる方言を特定する場合には、話者の地域を特定する情報を用い、前記第２言語に含まれる方言を特定する場合には、前記第２出力部の出力先の地域を特定する情報を用いるように構成されている、請求項１に記載の自動翻訳対応電話システム。
前記制御部は、前記第１言語に含まれる方言を特定する場合には、話者の電話番号を用い、前記第２言語に含まれる方言を特定する場合には、前記第２出力部の出力先の電話番号を用いるように構成されている、請求項２に記載の自動翻訳対応電話システム。
前記制御部は、前記第１言語に含まれる方言を特定する場合には、話者の全地球測位システムによる情報を用い、前記第２言語に含まれる方言を特定する場合には、前記第２出力部の出力先の全地球測位システムによる情報を用いるように構成されている、請求項２に記載の自動翻訳対応電話システム。
前記制御部は、前記第１言語に対応する文字を前記第２言語に対応する文字に変換する際に、前記第１言語に含まれる第１方言および前記第２言語に含まれる第２方言をそれぞれ特定して前記第１方言および前記第２方言に対応する前記電子辞書部の第１方言辞書および第２方言辞書をそれぞれ選択して参照するように構成されている、請求項１〜４のいずれか１項に記載の自動翻訳対応電話システム。
前記第１出力部は、前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第１言語の文字を、話者が確認可能なように音声として出力する音声出力部を含む、請求項１〜５のいずれか１項に記載の自動翻訳対応電話システム。
第１言語によって話者が発する音声が入力される音声入力部と、
話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
予め登録された前記話者が発する音声に関する情報に基づいて、話者から入力された音声を、前記第１言語と異なる第２言語に翻訳する前の前記第１言語に対応する文字として認識するための音声認識部と、
前記第１言語および前記第２言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、前記第１言語に対応する文字を前記第２言語に対応する文字に変換するための文字変換部と、
前記音声認識部により認識された前記第１言語の文字を出力する出力部と、
前記話者が発する音声に関する情報を登録する際に、話者から入力された音声を前記第１言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第１言語に対応する文字を通知するように前記出力部を制御する制御部とを備え、
前記制御部は、前記第１言語に対応する文字を前記第２言語に対応する文字に変換する際に、前記第１言語および前記第２言語の少なくとも一方に含まれる方言を特定して前記方言に対応する前記電子辞書部の方言辞書を選択して参照するように構成されている、自動翻訳対応電話機。