JP2010277359A - 自動翻訳対応電話システムおよび自動翻訳対応電話機 - Google Patents

自動翻訳対応電話システムおよび自動翻訳対応電話機 Download PDF

Info

Publication number
JP2010277359A
JP2010277359A JP2009129440A JP2009129440A JP2010277359A JP 2010277359 A JP2010277359 A JP 2010277359A JP 2009129440 A JP2009129440 A JP 2009129440A JP 2009129440 A JP2009129440 A JP 2009129440A JP 2010277359 A JP2010277359 A JP 2010277359A
Authority
JP
Japan
Prior art keywords
language
speaker
dialect
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009129440A
Other languages
English (en)
Inventor
Katsuhiro Morisada
克博 森貞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2009129440A priority Critical patent/JP2010277359A/ja
Publication of JP2010277359A publication Critical patent/JP2010277359A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能であるとともに、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、精度の高い翻訳を行うことが可能な自動翻訳対応電話システムを提供する。
【解決手段】この自動翻訳対応電話システム1は、予め登録された話者が発する音声に関する情報に基づいて、日本語の音声を、日本語の文字として認識するための音声認識部19と、日本語に含まれる方言に対応する方言辞書21bを有する電子辞書部21を含み、日本語の文字を英語の文字に変換するための翻訳エンジン部20と、話者が発する音声に関する情報を登録する際に、話者が確認可能なように日本語の文字を通知するようにスピーカ12bを制御する制御部13とを備え、制御部13は、日本語の文字を英語の文字に変換する際に、方言辞書21bを選択して参照するように構成されている。
【選択図】図2

Description

この発明は、自動翻訳対応電話システムおよび自動翻訳対応電話機に関し、特に、音声を認識する音声認識部を備える自動翻訳対応電話システムおよび自動翻訳対応電話機に関する。
従来、音声を認識する音声認識部を備える自動翻訳対応電話システムなどが知られている(たとえば、特許文献1〜5参照)。
上記特許文献1には、顧客の電話からの音声が入力される通信部と、顧客の電話の位置情報を発信電話番号から取得する位置情報取得処理部と、取得した位置情報を含む地域の方言辞書を選択する辞書選択処理部と、顧客の電話から入力された音声に対して単語を抽出する音声認識処理部と、抽出された単語に方言の単語が含まれるか否かを判定し、選択された方言辞書を用いて方言の単語を標準語の単語へ変換する変換処理部と、変換された標準語の単語を表示するディスプレイとを備えた対話支援装置が開示されている。なお、上記特許文献1に記載の対話支援装置は、対話支援装置と顧客の電話とが同一の言語を用いる地域の中に位置する場合を想定している。
また、上記特許文献2には、ユーザの音声が入力されるマイクロホンと、それ自体で母国語の意味を有する母国語フレーズ、母国語フレーズに対応した外国語フレーズおよび音声認識ソフトウェアが記憶されたメモリと、音声認識ソフトウェアを実行するデジタルプロセッサと、スピーカとを備えた外国語翻訳器が開示されている。上記特許文献2に記載の外国語翻訳器は、ユーザに発声させた母国語フレーズをメモリに記憶させるためのトレーニング機能を有し、ユーザに母国語フレーズを発声させた後に、再度、ユーザに同一の母国語フレーズを発声(復唱)させるように構成されている。この際、両フレーズが一致したとデジタルプロセッサが判断した場合には、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されている。一方、両フレーズが一致しないとデジタルプロセッサが判断した場合には、スピーカを介して、一致しなかった旨を音声によって出力することによってユーザに通知するように構成されている。また、上記特許文献2に記載の外国語翻訳器は、翻訳機能を有し、トレーニング機能において登録された母国語フレーズがマイクロホンに入力された際に、入力された母国語フレーズに対応した外国語フレーズをスピーカを介して音声によって出力するように構成されている。
また、上記特許文献3には、電話回線から入力される利用者の母国語の音声を文字として認識する音声認識装置と、利用者によって入力された通信相手の電話番号に基づいて通話相手の母国語を決定するとともに、認識された文字を通話相手の母国語に翻訳して翻訳データを作成する翻訳装置と、翻訳データを音声にして通話相手に出力するための音声合成装置とを備えた通訳装置が開示されている。
また、上記特許文献4には、発声者の音声の入力を受け付け、入力された音声を音声データに変換する音声データ変換部と、地方情報が記憶された地方情報データベースと、音声データに含まれるイントネーションなどと地方情報とを比較することによって、発声者の出身地を認識するための発声者情報分析部と、認識された出身地を音声データ変換部に入力された音声と合わせてテキストデータとして出力する出力部とを備えたデータ認識システムが開示されている。なお、上記特許文献4に記載のデータ認識システムは、データ認識システムと発声者の出身地とが同一の言語を用いる地域の中に位置する場合を想定している。
また、上記特許文献5には、電話端末からの入力音声情報を受信および送信する通信部と、受信した入力音声情報を認識する音声認識部と、電話端末の市外局番を検出する市外局番検出部と、市外局番ごとにそれぞれ登録された複数の音声情報データベースと、認識した入力音声情報に対応する出力音声情報を市外局番に対応する音声情報データベースの中から検索する音声情報検索部と、検索された出力音声情報を送信部を介して電話端末に送信する音声情報出力部とを備えた音声応答装置が開示されている。上記特許文献5に記載の音声応答装置は、認識した入力音声情報に対応する出力音声情報を、市外局番に対応する音声情報データベースの中から検索して送信することによって、電話端末の位置する地域の言葉(方言)を用いた音声応答サービスを提供することが可能なように構成されている。なお、上記特許文献5に記載の音声応答装置は、音声応答装置と電話端末とが同一の言語を用いる地域の中に位置している場合を想定している。
特開2005−331608号公報 特表2003−515816号公報 特開2002−73605号公報 特開2002−116789号公報 特開2004−96381号公報
しかしながら、上記特許文献1に記載の対話支援装置では、音声認識処理部において顧客の電話から入力された音声に対して単語を抽出する際に、顧客の音声に含まれる顧客の意図する単語が、顧客の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献1に記載の対話支援装置では、対話支援装置と同一の言語を用いる地域の中において、方言を有する地域に顧客の電話が位置している場合を想定しており、顧客の電話が対話支援装置と異なる言語を用いる地域に位置している場合については考慮されていない。このため、顧客の電話が対話支援装置と異なる言語を用いる地域に位置している場合には、顧客の電話から音声が入力されたとしても、対話支援装置の位置する地域の言語に変換することができないという問題点もある。
また、上記特許文献2に記載の外国語翻訳器では、トレーニング機能において、ユーザが2度発声した母国語フレーズが一致したとデジタルプロセッサが判断した場合、ユーザの発声した母国語フレーズをメモリに登録した後、ユーザに別の母国語フレーズを発声させるように構成されており、母国語フレーズが登録された旨が直接的にユーザに通知されないという不都合があると考えられる。このため、トレーニング機能の際に、ユーザの発声した母国語フレーズがどのような母国語フレーズの音声として外国語翻訳器に認識されたかについてユーザに通知されないため、音声の認識の状態をユーザが確認することができないという問題点がある。また、上記特許文献2に記載の外国語翻訳器では、ユーザの母国語および外国語については考慮されている一方、ユーザの母国語の方言および外国語の方言については開示も示唆もされていない。このため、ユーザが方言を有する地域に位置している場合やユーザの母国語の音声を外国語の方言に翻訳する場合には、ユーザの音声に含まれるユーザの方言による単語が、ユーザの意図する単語とは異なる単語として誤って認識される場合があるという不都合がある。このため、翻訳の精度が低下するという問題点がある。
また、上記特許文献3に記載の通訳装置では、音声認識装置において利用者の音声を文字として認識する際に、利用者の音声に含まれる利用者の意図する単語が、利用者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献3に記載の通訳装置では、利用者の母国語および通話相手の母国語については考慮されている一方、利用者の母国語の方言および通話相手の母国語の方言については開示も示唆もされていない。このため、利用者が方言を有する地域に位置している場合や通話相手が方言を有する地域に位置している場合には、利用者の音声に含まれる利用者の方言による単語が、利用者の意図する単語とは異なる単語として誤って認識される場合があるという不都合がある。このため、翻訳の精度が低下するという問題点がある。
また、上記特許文献4に記載のデータ認識システムでは、音声データ変換部において入力された音声を音声データに変換する際に、発声者の音声に含まれる発声者の意図する単語が、発声者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献4に記載のデータ認識システムでは、データ認識システムと同一の言語を用いる地域の中において、方言を有する地域に発声者の出身地がある場合を想定しており、発声者の出身地がデータ認識システムと異なる言語を用いる地域である場合については考慮されていない。このため、発声者の出身地がデータ認識システムと異なる言語を用いる地域である場合には、発声者から音声が入力されたとしても、データ認識システムの位置する地域の言語に変換することができないという問題点もある。
また、上記特許文献5に記載の音声応答装置では、音声認識部において電話端末からの入力音声情報を認識する際に、電話端末からの入力音声情報に含まれる電話端末を用いる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識される場合があるという問題点がある。また、上記特許文献5に記載の音声応答装置では、音声応答装置と同一の言語を用いる地域の中において、方言を有する地域に電話端末が位置している場合を想定しており、電話端末が音声応答装置と異なる言語を用いる地域に位置している場合については考慮されていない。このため、電話端末が音声応答装置と異なる言語を用いる地域に位置している場合には、電話端末から音声が入力されたとしても、音声応答装置の位置する地域の言語に変換することができないという問題点もある。
この発明は、上記のような課題を解決するためになされたものであり、この発明の1つの目的は、話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能であるとともに、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、精度の高い翻訳(言語の変換)を行うことが可能な自動翻訳対応電話システムおよび動翻訳対応電話機を提供することである。
課題を解決するための手段および発明の効果
この発明の第1の局面による自動翻訳対応電話システムは、第1言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者から入力された音声を、第1言語と異なる第2言語に翻訳する前の第1言語に対応する文字として認識するための音声認識部と、第1言語および第2言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、第1言語に対応する文字を第2言語に対応する文字に変換するための文字変換部と、音声認識部により認識された第1言語の文字を出力する第1出力部と、話者が発する音声に関する情報を登録する際に、話者から入力された音声を第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第1言語に対応する文字を通知するように第1出力部を制御する制御部とを備え、制御部は、第1言語に対応する文字を第2言語に対応する文字に変換する際に、第1言語および第2言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成されている。
この発明の第1の局面による自動翻訳対応電話システムでは、上記のように、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第1言語の文字を通知するように第1出力部を制御することによって、第1出力部によって話者が確認可能なように第1言語の文字を通知することにより、話者に自動翻訳対応電話システムにおける音声の認識の状態を確認させることができる。また、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第1言語と異なる第2言語に変換する前の第1言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、第1言語に対応する文字を第2言語に対応する文字に変換する際に、第1言語および第2言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成することによって、第1言語を発する話者と第2言語を発する通話相手との少なくとも一方が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書を用いることにより、音声認識部を特定された方言に対応させることができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。
上記第1の局面による自動翻訳対応電話システムにおいて、好ましくは、文字変換部により第1言語の文字から変換された第2言語に対応する文字を出力する第2出力部をさらに備え、制御部は、第1言語に含まれる方言を特定する場合には、話者の地域を特定する情報を用い、第2言語に含まれる方言を特定する場合には、第2出力部の出力先の地域を特定する情報を用いるように構成されている。このように構成すれば、話者の地域を特定する情報および第2出力部の出力先の地域を特定する情報を用いることによって、より確実に、第1言語および第2言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。
この場合、好ましくは、制御部は、第1言語に含まれる方言を特定する場合には、話者の電話番号を用い、第2言語に含まれる方言を特定する場合には、第2出力部の出力先の電話番号を用いるように構成されている。このように構成すれば、電話番号を用いることによって、話者と出力先との通話に本発明を利用する際に、話者に通話時に必要な出力先の電話番号の入力以外のその他の特定の操作を要求することなく、第1言語および第2言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。
上記地域を特定する情報を用いて方言を特定する自動翻訳対応電話システムにおいて、好ましくは、制御部は、第1言語に含まれる方言を特定する場合には、話者の全地球測位システムによる情報を用い、第2言語に含まれる方言を特定する場合には、第2出力部の出力先の全地球測位システムによる情報を用いるように構成されている。このように構成すれば、全地球測位システムによる情報を用いることによって、話者に特定の操作を要求することなく、第1言語および第2言語の少なくとも一方に含まれる方言を特定することができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。
上記第1の局面による自動翻訳対応電話システムにおいて、好ましくは、制御部は、第1言語に対応する文字を第2言語に対応する文字に変換する際に、第1言語に含まれる第1方言および第2言語に含まれる第2方言をそれぞれ特定して第1方言および第2方言に対応する電子辞書部の第1方言辞書および第2方言辞書をそれぞれ選択して参照するように構成されている。このように構成すれば、第1言語を発する話者が第1方言を有する地域に位置するとともに、第2言語を発する通話相手が第2方言を有する地域に位置する場合においても、特定された第1方言および第2方言にそれぞれ対応する第1方言辞書および第2方言辞書を用いることにより、音声認識部を第1方言および第2方言の両方に対応させることができる。これにより、話者および通話相手の両方が発する音声に含まれる方言による単語が、話者および通話相手の両方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第1言語から第2言語への変換(翻訳)のみならず、第1言語から第2言語への変換(翻訳)の精度も向上させることができる。
上記第1の局面による自動翻訳対応電話システムにおいて、好ましくは、第1出力部は、話者が発する音声に関する情報を登録する際に、音声認識部において認識された第1言語に対応する文字を、話者が確認可能なように音声として出力する音声出力部を含む。このように構成すれば、音声出力部から出力される音声により、話者は、自動翻訳対応電話システムにおける音声の認識の状態を聴覚によって確認することができる。これにより、話者が発する音声に含まれる単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、これによっても、翻訳の精度を向上させることができる。
この発明の第2の局面による自動翻訳対応電話機は、第1言語によって話者が発する音声が入力される音声入力部と、話者が発する音声に関する情報を予め登録して記憶するためのメモリと、予め登録された話者が発する音声に関する情報に基づいて、話者から入力された音声を、第1言語と異なる第2言語に翻訳する前の第1言語に対応する文字として認識するための音声認識部と、第1言語および第2言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、第1言語に対応する文字を第2言語に対応する文字に変換するための文字変換部と、音声認識部により認識された第1言語の文字を出力する出力部と、話者が発する音声に関する情報を登録する際に、話者から入力された音声を第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第1言語に対応する文字を通知するように出力部を制御する制御部とを備え、制御部は、第1言語に対応する文字を第2言語に対応する文字に変換する際に、第1言語および第2言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成されている。
この発明の第2の局面による自動翻訳対応電話機では、上記のように、制御部が、話者が発する音声に関する情報を登録する際に、話者が発する音声を第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように第1言語の文字を通知するように出力部を制御することによって、出力部によって話者が確認可能なように第1言語の文字を通知することにより、話者に自動翻訳対応電話システムにおける音声の認識の状態を確認させることができる。また、予め登録された話者が発する音声に関する情報に基づいて、話者が発する音声を、第1言語と異なる第2言語に変換する前の第1言語に対応する文字として認識するための音声認識部を備えることによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、第1言語に対応する文字を第2言語に対応する文字に変換する際に、第1言語および第2言語の少なくとも一方に含まれる方言を特定して方言に対応する電子辞書部の方言辞書を選択して参照するように構成することによって、第1言語を発する話者と第2言語を発する通話相手との少なくとも一方が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書を用いることにより、音声認識部を特定された方言に対応させることができる。これにより、話者または通話相手の少なくとも一方が発する音声に含まれる方言による単語が話者または通話相手の少なくとも一方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。
本発明の第1実施形態による自動翻訳対応電話システムの全体構成を示した図である。 図1に示した自動翻訳対応電話システムの構成を示したブロック図である。 図1に示した発信元電話機の表示パネルに表示される読み上げ例文を示した図である。 図1に示した発信元電話機の表示パネルに表示される修正用例文を示した図である。 図1に示した発信元電話機の表示パネルに表示される修正候補を示した図である。 図1に示した発信元電話機の表示パネルに表示される登録完了時の表示を示した図である。 本発明の一実施形態による1回の音声認識の修正動作によって修正可能な場合を示す図である。 本発明の一実施形態による2回の音声認識の修正動作によって修正可能な場合を示す図である。 図8に示す2回の音声認識の修正動作によって修正可能な場合において、2回目の音声認識の修正動作において表示パネルに表示される修正候補を示した図である。 図1に示した発信元電話機の音声登録時の制御フローを示した図である。 図1に示した発信元電話機の音声認識の修正動作時の制御フローを示した図である。 図1に示した発信元電話機の音声通話時の制御フローを示した図である。 本発明の第2実施形態による自動翻訳対応電話システムの全体構成を示した図である。 図13に示した自動翻訳対応電話システムの構成を示したブロック図である。 図13に示した発信元電話機の音声通話時の制御フローを示した図である。 図13に示した回線交換機の音声通話時の制御フローを示した図である。 本発明の第3実施形態による自動翻訳対応電話システムの構成を示したブロック図である。 図17に示した発信元電話機の音声通話時の制御フローを示した図である。 図17に示した回線交換機の音声通話時の制御フローを示した図である。
以下、本発明を具体化した実施形態を図面に基づいて説明する。
(第1実施形態)
まず、図1〜図6を参照して、本発明の一実施形態による自動翻訳対応電話システム1の構成について説明する。
本発明の第1実施形態による自動翻訳対応電話システム1は、図1に示すように、日本の方言を有する地域を示す番号を有する発信元電話番号が予め割り当てられている発信元電話機10と、英語圏の国を示す番号を有する送信先電話番号が予め割り当てられている送信先電話機30と、発信元電話機10および送信先電話機30とそれぞれ接続され、発信元電話機10と送信先電話機30との間で音声信号および文字信号を送受信するための電話回線40および41と、電話回線40と電話回線41とを接続するための回線交換機50とから構成されている。この回線交換機50は、電話回線40と電話回線41とを接続した際に、電話回線40を介して、発信元電話機10に送信先電話機30と接続した旨の接続信号を出力するように構成されている。また、発信元電話機10は、日本の方言を有する地域に位置するとともに、送信先電話機30は、英語圏の地域に位置する。なお、発信元電話機10は、本発明の「自動翻訳対応電話機」の一例である。
また、話者が発信元電話機10において後述する操作パネル16の数字ボタン部16cにより送信先電話番号をダイヤルすることによって、発信元電話機10は、電話回線40および41と回線交換機50とを介して、送信先電話機30と接続可能なように構成されている。また、発信元電話機10と送信先電話機30とが接続されている状態においては、発信元電話機10および送信先電話機30から出力された音声信号および文字信号は、それぞれ、電話回線40および41と回線交換機50とを介して、送信先電話機30および発信元電話機10に入力されるように構成されている。また、話者が発信元電話機10において送信先電話番号をダイヤルすることにより、送信先電話機30と接続された際には、回線交換機50から電話回線40を介して、送信先電話機30と接続された旨を通知する接続信号が入力されるように構成されている。
また、発信元電話機10は、筐体11と、話者が発する音声が入力される集音器12aおよび音声が出力されるスピーカ12bが設けられた受話器12とを備えている。また、発信元電話機10は、図2に示すように、制御部13と、集音器12aから入力されたアナログの音声をデジタルの音声信号に変換するとともに、デジタルの音声信号をアナログの音声に変換する音声変換器14と、音声信号および文字信号を電話回線40を介して外部(送信先電話機30)に送信(出力)するとともに、外部(送信先電話機30)から音声信号および文字信号を受信(入力)するための電話回線制御回路15とを備えている。なお、集音器12aは、本発明の「音声入力部」の一例であり、スピーカ12bは、本発明の「第1出力部」、「音声出力部」および「出力部」の一例である。また、電話回線制御回路15は、本発明の「第2出力部」の一例である。
また、発信元電話機10には、図1に示すように、操作パネル16と表示パネル17とが設けられている。この操作パネル16は、12個のボタンを含むボタン部16aと、発信元電話機10に搭載された複数のメニュープログラムのうちいずれか1つを選択可能に構成されている選択決定ボタン16bとからなる。また、ボタン部16aは、数字が付された数字ボタン部16cと、アスタリスク(*)が付されたアスタリスクボタン16dと、シャープ(♯)が付されたシャープボタン16eとを含む。また、数字ボタン部16cは、「1」〜「9」の数字がそれぞれ付された数字ボタン16f〜16nと、「0」の数字が付された数字ボタン16oとからなる。また、表示パネル17は、日本語からなる文字を表示させることが可能なように構成されている。また、発信元電話機10は、複数のメニュープログラムの1つとして音声登録メニュープログラムが設定されており、制御部13によって、発信元電話機10の音声登録メニュープログラムにおいて、話者によって入力された日本語の音声に関する情報が後述するメモリ18に登録されるように構成されている。
また、発信元電話機10は、図2に示すように、話者の音声に関する情報が登録して記憶可能なように構成されているメモリ18と、音声認識部19と、翻訳エンジン部20をさらに備えている。また、翻訳エンジン部20には、電子辞書部21が設けられている。また、音声認識部19では、制御部13によって、話者によってメモリ18に予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声(音声信号)が話者が発する音声に対応する英語に翻訳する前の日本語の文字(翻訳前の文字信号)として認識されるように構成されているとともに、日本語の文字信号が日本語の音声信号に変換されるように構成されている。
また、音声認識部19では、制御部13によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる話者の音声に関する情報に基づいて、話者の音声が文節に区切って文字として認識されるように構成されている。また、音声認識部19では、複数の同音異義語のそれぞれに対して、話者のアクセントの強弱(高低)やイントネーションなどの音声に関する情報が予め話者により登録されることにより、音声認識部19において、同音異義語の単語と、同音異義語の音声とがそれぞれ対応付けられている。また、音声認識部19では、それぞれの同音異義語に対して予め話者により登録されたアクセントの強弱やイントネーションなどに基づいて、スピーカ12bから音声として出力されるように構成されている。また、音声認識部19では、制御部13によって、同音異義語のそれぞれの単語の音声に関する情報の一定範囲が認識範囲(近似範囲)として定められており、その認識範囲(近似範囲)内に含まれる音声信号が同音異義語の所定の単語であると認識されるように構成されている。また、話者の音声に関する情報が話者によりメモリ18に登録して記憶されていない状態においては、音声認識部19では、制御部13によって、発信元電話機10の製造時に予めデフォルトで登録されている音声に関する情報に基づいて、話者が発する日本語からなる音声(音声信号)が話者が発する音声に対応する日本語の文字(翻訳前の文字信号)として認識されるように構成されている。なお、日本語は、本発明の「第1言語」の一例であり、英語は、本発明の「第2言語」の一例である。
ここで、第1実施形態では、電子辞書部21は、日本語の標準語の文字(単語)と英語の文字(単語)とが対応付けられた状態で記憶された基本辞書21aと、日本国内の異なる地域においてそれぞれ用いられる方言の文字と、日本語の標準語の文字とが対応付けられた状態で記憶された複数の方言辞書21bとを含む。また、制御部13によって、発信元電話機10の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言が特定されて、特定された方言に対応する方言辞書21bが選択されるように構成されている。なお、翻訳エンジン部20および電子辞書部21は、本発明の「文字変換部」の一例である。
また、翻訳エンジン部20では、制御部13によって、電子辞書部21の基本辞書21aを用いて、話者が発する音声に対応する日本語の標準語の翻訳前の文字信号が、日本語の文字信号に対応する英語の翻訳後の文字信号に変換されるように構成されている。また、制御部13によって、電子辞書部21の方言辞書21bを参照して、話者の音声が文節に区切られて文字として認識される際に、音声認識部19において認識された日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識した方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。
また、話者が発する音声に関する情報が話者により登録(音声登録)される際には、音声登録メニュープログラムにおいて、図3に示すように、制御部13によって、文章番号が付された日本語の読み上げ例文17a〜17cが表示パネル17に表示されるとともに、集音器12aを介して入力される話者に読み上げられた日本語の読み上げ例文17a〜17cの音声が音声認識部19(図2参照)において日本語の文字として認識されるとともに、話者が確認可能なように日本語の文字が音声としてスピーカ12b(図2参照)から出力(再生)されるように構成されている。その後、図4に示すように、読み上げ例文17a〜17cにそれぞれ対応する修正用例文17d〜17fが、文節ごとに区分可能なように文節ごとに文節番号が付された状態で、表示パネル17に表示されるように構成されている。そして、話者によって文頭番号と文節番号とが選択されることによって、図5に示すように、選択された文節に対応する修正候補17gおよび17hが、表示パネル17に表示されるように構成されている。また、音声登録が終了される際には、図6に示すように、音声登録が終了される旨が表示パネル17に表示されるように構成されている。
また、日本語の例文および修正候補(読み上げ例文17a〜17cと読み上げ例文17a〜17cに対応する修正用例文17d〜17fと修正候補17gおよび17h)およびはメモリ18に複数個記憶されているとともに、同音異義語の関係を有する単語を含む複数の例文が、1つの例文群として音声登録時に用いられるように構成されている。
また、音声認識部19において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合、話者によって音声認識部19における音声認識を修正させることが可能なように構成されている。なお、音声認識部19において認識された日本語の文字と、話者の発した日本語の例文の音声とが異なる場合として、音声認識部19において認識された日本語の文字が発音と合っていない場合(同音異義語によらない場合)と、音声認識部19において認識された日本語の文字は合っているが発音が合っておらず、文字の意味する単語が異なる場合(同音異義語による場合)とがある。
同音異義語によらない場合として、音声認識部19において認識された日本語の文字信号としてスピーカ12bから再生された音声と、話者の発した日本語の例文の音声とが異なる場合(たとえば、話者が「ハシ」と音声入力した箇所において、スピーカ12bから「ハジ」と音声出力された場合)には、本実施形態では、再度、話者に日本語の例文を読み上げさせるように構成されている。
一方、同音異義語による場合として、音声認識部19において認識された日本語の文字信号としてスピーカ12bから再生された音声と、話者の発した日本語の例文の音声とが、アクセントの強弱やイントネーションなどにおいて異なる場合(たとえば、話者が「橋」を意図して「ハシ」と音声入力した箇所において、スピーカ12bから「端」を意味すると話者にとっては感じられるイントネーションなど(音声に関する情報)によって「ハシ」と音声出力された場合)には、音声認識の修正動作が行われるように構成されている。
次に、図1、図2および図4〜図9を参照して、本発明の一実施形態による自動翻訳対応電話システム1の音声認識の修正動作について説明する。
まず、図7に示す一例のように、音声「ハシ」がアクセントの強弱やイントネーションなどに基づいて「1」から「3」まで区別されており、音声「ハシ」の「1」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部19(図2参照)にとって「端」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「2」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部19にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「3」におけるアクセントの強弱やイントネーションなどが、話者および音声認識部19にとって「箸」を意味する場合について説明する。つまり、「1」におけるアクセントの強弱やイントネーションなどと、「2」におけるアクセントの強弱やイントネーションなどとが、話者と音声認識部19とにおいて異なる場合の音声認識の修正動作について説明する。
話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ12b(図2参照)から出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ12bから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、音声認識の修正動作として、図4に示す修正用例文17d〜17fを参照して、「1」が付された数字ボタン16f(図1参照)と「3」が付された数字ボタン16h(図1参照)とを順に話者は押下する。これによって、修正箇所(修正用例文17dの(3)の「橋」に関する文節)が選択される。これにより、図5に示すように、「橋」に変更すべき修正候補17gおよび17hが表示パネル17に表示される。この場合、話者は修正候補17hを選択する。これにより、図7に示すように、音声認識部19にとって「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するとともに、「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するように入れ替えられる。この際、音声認識部19にとって「端」と認識するように設定されていた認識範囲(近似範囲)と、「橋」と認識するように設定されていた認識範囲(近似範囲)とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図7に示すように、音声「ハシ」の「1」〜「3」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部19とにおいて合致する。
そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文17a〜17cがスピーカ12bから音声として出力されるとともに、図4に示す修正用例文17d〜17fが表示パネル17に表示される。ここで、話者は、再度スピーカ12bから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ12bから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機10に入力することによって、図6に示すように、音声登録が終了される旨が表示パネル17に表示され、音声登録が終了される。
次に、図8に示す他の例のように、音声「ハシ」の「1」におけるアクセントの強弱やイントネーションなどが、話者にとって「橋」を意味する一方、音声認識部19にとって「箸」を意味するように予め登録されている場合を想定する。また、音声「ハシ」の「2」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部19にとって「橋」を意味するように予め登録されている場合を想定する。さらに、音声「ハシ」の「3」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部19にとって「端」を意味するように予め登録されている場合について説明する。つまり、「1」、「2」および「3」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部19とにおいてそれぞれ異なる場合の音声認識の修正動作について説明する。
話者が発する音声に関する情報の登録時に、話者が確認可能なようにスピーカ12bから出力される音声を話者が聞いた際に、上述した音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ12bから音声のアクセントの強弱やイントネーションなどとが異なることを話者が認識した場合、第1回目の音声認識の修正動作(1)として、図4に示す修正用例文17d〜17fを参照して、「1」が付された数字ボタン16fと「3」が付された数字ボタン16hとを順に話者は押下する。これによって、修正箇所(修正用例文17dの(3)の「橋」に関する文節)が選択される。これにより、図5に示すように、「橋」に変更すべき修正候補17gおよび17hが表示パネル17に表示される。この場合、話者は、修正候補17hを選択する。これにより、図8に示すように、音声認識部19にとって「橋」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するとともに、「箸」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「橋」を意味するように入れ替えられる。この際、音声認識部19にとって「箸」と認識するように設定されていた認識範囲(近似範囲)と、「橋」と認識するように設定されていた認識範囲(近似範囲)とが入れ替えられるとともに、話者の音声に関する情報として認識される。また、この際、音声「ハシ」の「2」におけるアクセントの強弱やイントネーションなどが、話者にとって「端」を意味する一方、音声認識部19にとって「箸」を意味するとともに、音声「ハシ」の「3」におけるアクセントの強弱やイントネーションなどが、話者にとって「箸」を意味する一方、音声認識部19にとって「端」を意味する。つまり、「2」および「3」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部19とにおいて未だ異なっている。
そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文17a〜17cがスピーカ12bから音声として出力されるとともに、図4に示す修正用例文17d〜17fが表示パネル17に表示される。ここで、話者は、再度スピーカ12bから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ12bから音声のアクセントの強弱やイントネーションなどとが未だ一致していないことを認識する。この結果、話者は、第2回目の音声認識の修正動作(2)を行う。
第2回目の音声認識の修正動作(2)として、図4に示す修正用例文17d〜17fを参照して、「2」が付された数字ボタン16gと「2」が付された数字ボタン16gとを順に話者は押下する。これによって、修正箇所(修正用例文17eの(2)の「端」に関する文節)が選択される。これにより、図9に示すように、「端」に変更すべき修正候補17iおよび17jが表示パネル17に表示される。この場合、話者は修正候補17iを選択する。これにより、図8に示すように、音声認識部19にとって「箸」を意味するように登録されていたアクセントの強弱やイントネーションなどが、「端」を意味するとともに、「端」を意味するように予め登録されていたアクセントの強弱やイントネーションなどが、「箸」を意味するように入れ替えられる。この際、音声認識部19にとって「箸」と認識するように設定されていた認識範囲(近似範囲)と、「端」と認識するように設定されていた認識範囲(近似範囲)とが入れ替えられるとともに、話者の音声に関する情報として認識される。これにより、図8に示すように、音声「ハシ」の「1」〜「3」におけるアクセントの強弱やイントネーションなどが、話者と音声認識部19とにおいて合致する。
そして、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文17a〜17cがスピーカ12bから音声として出力される。ここで、話者は、再度スピーカ12bから音声として出力された音声を聞くことによって、音声「ハシ」に関する、話者の音声のアクセントの強弱やイントネーションなどと、スピーカ12bから音声のアクセントの強弱やイントネーションなどとが合致したことを認識する。この結果、話者は、音声登録が終了した旨を発信元電話機10に入力することによって、図6に示すように、音声登録が終了される旨が表示パネル17に表示され、音声登録が終了される。
次に、図2〜図6、図10および図11を参照して、本発明の一実施形態による自動翻訳対応電話システム1の発信元電話機10の音声登録時の制御動作について説明する。
まず、図10に示すように、ステップS1において、発信元電話機10の制御部13(図2参照)によって、複数のメニュープログラムのうち、選択決定ボタン16b(図2参照)によって音声登録メニュープログラムが選択されたか否かが判断されるとともに、音声登録メニュープログラムが選択されるまで、ステップS1の判断が繰り返される。そして、ステップS1において、制御部13によって、音声登録メニュープログラムが選択されたと判断された場合には、ステップS2に進み、制御部13によって、図3に示すように、話者に通知するために、「1」〜「3」の文章番号がそれぞれ付されているとともに、話者に読み上げさせるための3つの読み上げ例文17a〜17cと、読み終わった後にシャープボタン16eを押下させるメッセージ(「読み終わったら「♯」を押してください。」)と、シャープボタン16eの押下後に音声認識の結果を再生するメッセージ(「音声認識が認識した結果を音声にて再生します。」)とが表示パネル17に表示される。なお、読み上げ例文17aには「橋」、読み上げ例文17bには「端」および読み上げ例文17cには「箸」がそれぞれ含まれており、「橋」、「端」および「箸」は、それぞれ「ハシ」の音を有する同音異義語の関係を有している。そして、ステップS3に進む。
そして、ステップS3において、制御部13によって、集音器12aに話者が発する日本語の音声が入力されたか否かが判断されるとともに、集音器12aに話者が発する日本語の音声が入力されるまで、ステップS3の判断が繰り返される。そして、ステップS3において、制御部13によって、集音器12aに話者が発する日本語の音声が入力されたと判断された場合には、ステップS4において、制御部13によって、話者が発した日本語の音声を音声変換器14(図2参照)によって日本語の音声信号に変換した後に、日本語の音声信号が音声認識部19(図2参照)において文節で区切り日本語の文字信号として認識される。この際、制御部13によって、話者のアクセント、話者の間の取り方および話者の話す速さなどからなる発信元電話機10の製造時に予め登録されている音声に関する情報に基づいて、話者が発した音声が文節で区切られて認識される。
その後、ステップS5において、制御部13によって、シャープボタン16e(図2参照)が押下されたか否かが判断される。そして、ステップS5において、制御部13によって、シャープボタン16eが押下されたと判断された場合には、ステップS6に進む。また、ステップS5において、制御部13によって、シャープボタン16eが押下されていないと判断された場合には、ステップS3に戻る。
そして、ステップS6において、制御部13によって、図4に示すように、「1」の文章番号が付された読み上げ例文17a(図3参照)を構成する文節ごとに(1)〜(5)の文節番号がそれぞれ付された修正用例文17dと、「2」の文章番号が付された読み上げ例文17b(図3参照)を構成する文節ごとに(1)〜(5)の文節番号がそれぞれ付された修正用例文17eと、「3」の文章番号が付された読み上げ例文17c(図3参照)を構成する文節ごとに(1)〜(4)の文節番号がそれぞれ付された修正用例文17fとが表示パネル17に表示される。また、制御部13によって、話者に通知するために、間違いがない場合は選択決定ボタン16bを押下させるメッセージ(「間違いがない場合は、選択決定ボタンを押してください。」)と、同音異義語に間違いがあった場合は、文章番号と文節番号とに対応する数字が付された数字ボタン部16cを押下させた後に、シャープボタン16eを押下させるメッセージ(「同音異義語の間違いがあった場合は、文章番号⇒文節番号の順番に指定して最後に「♯」を押してください。」)と、同音異義語以外に間違いがあった場合は、アスタリスクボタン16dを押下させるメッセージ(「同音異義語以外の間違いがあった場合は、「*」を押してください。」)とが表示パネル17に表示される。そして、ステップS7に進み、制御部13によって、音声認識部19において認識された文字信号が音声信号に変換されるとともに、音声信号が音声変換器14によってアナログの音声に変換されてスピーカ12b(図2参照)から出力(再生)される。そして、ステップS8の音声認識の修正動作に進む。なお、文節番号は、本発明の「番号」の一例である。
ここで、図11に示す音声認識の修正動作時では、まず、ステップS8aにおいて、制御部13によって、選択決定ボタン16b(図2参照)が押下されたか否かが判断される。そして、ステップS8aにおいて、制御部13によって、選択決定ボタン16bが押下されていないと判断された場合には、ステップS8bに進む。また、ステップS8aにおいて、制御部13によって、選択決定ボタン16bが押下されたと判断された場合には、ステップS8hに進む。
また、ステップS8bにおいて、制御部13によって、アスタリスクボタン16d(図2参照)が押下されたか否かが判断される。そして、ステップS8bにおいて、制御部13によって、アスタリスクボタン16dが押下されたと判断された場合には、図10に示すステップS2に戻る。なお、アスタリスクボタン16dが押下されてステップS2に戻ることによって、再度、話者に3つの読み上げ例文17a〜17cを読み上げさせることになる。また、ステップS8bにおいて、制御部13によって、アスタリスクボタン16dが押下されていないと判断された場合には、ステップS8cに進む。
そして、ステップS8cにおいて、制御部13によって、3つの修正用例文17d〜17fの文頭に付された文章番号(図4参照)と、それぞれの文節ごとに付された文節番号(図4参照)とに対応する数字が付された数字ボタン部16cがそれぞれ押下された後に、シャープボタン16eが押下されたか否かが判断される。そして、ステップS8cにおいて、制御部13によって、文章番号と文節番号とに対応する数字が付された数字ボタン部16cがそれぞれ押下された後に、シャープボタン16eが押下されたと判断された場合には、ステップS8dに進む。これにより、修正用例文17d、17eまたは17fのいずれかの修正用例文のいずれかの文節が選択されることによって、修正箇所が選択決定される。また、ステップS8cにおいて、制御部13によって、文章番号と文節番号とに対応する数字が付された数字ボタン部16cがそれぞれ押下された後に、シャープボタン16eが押下されていないと判断された場合には、ステップS8aに戻る。
また、ステップS8dにおいて、制御部13によって、図5に示すように、選択決定された修正箇所における文章番号と文節番号とに対応する文節に含まれる単語の修正候補17gおよび17hが、修正番号「1」および「2」がそれぞれ付された状態で表示パネル17に表示される。また、制御部13によって、話者に通知するために、修正候補の修正番号を押下した後に、シャープボタン16eを押下させるメッセージ(「正しい番号を選択し、「♯」を押してください。」)と、修正結果をスピーカ12bから再生するメッセージ(「修正結果を音声にて再生します。」)とが表示パネル17に表示される。そして、ステップS8eに進む。
また、ステップS8eにおいて、制御部13によって、修正候補17gに付された修正番号「1」に対応する数字ボタン16fまたは修正候補17hに付された修正番号「2」に対応する数字ボタン16gが押下された後に、シャープボタン16eが押下されたか否かが判断されるとともに、修正番号「1」に対応する数字ボタン16fまたは修正番号「2」に対応する数字ボタン16gが押下された後に、シャープボタン16eが押下されるまで、ステップS8eの判断が繰り返される。そして、ステップS8eにおいて、制御部13によって、修正番号「1」に対応する数字ボタン16fまたは修正番号「2」に対応する数字ボタン16gが押下された後に、シャープボタン16eが押下されたと判断された場合には、ステップS8fに進む。
そして、ステップS8fにおいて、制御部13によって、ステップS8cにおいて選択された文章番号と文節番号とに対応する文節に含まれる単語が、ステップS8eにおいて選択された修正番号「1」または「2」を有する修正候補17gまたは17hに含まれる単語であるということが話者の音声に関する情報として認識される。具体的には、話者の意図する音声のアクセントの強弱やイントネーションなどと単語との対応関係と、音声認識部19における音声のアクセントの強弱やイントネーションなどと単語との対応関係とが合致するように、制御部13によって、音声認識部19に登録されていた単語の修正候補17gまたは17hの左側に配置されている単語のアクセントの強弱やイントネーションなどと、右側に配置されている単語のアクセントの強弱やイントネーションなどとが入れ替えられるとともに、音声に関する情報の認識範囲(近似範囲)が入れ替えられることによって、話者の音声に関する情報として認識される。そして、ステップS8gに進み、制御部13によって、新たに認識した話者の音声に関する情報に基づいて、読み上げ例文17a〜17cがスピーカ12bから音声として出力されるとともに、図4に示す修正用例文17d〜17fが表示パネル17に表示される。そして、ステップS8aに戻る。
また、ステップS8aにおいて、制御部13によって、選択決定ボタン16bが押下されたと判断された場合、ステップS8hにおいて、制御部13によって、話者の音声に関する情報がメモリ18に記憶される。そして、ステップS8iに進み、制御部13によって、図6に示すように、話者に通知するために、話者の音声に関する情報の登録が完了したメッセージ(「登録が完了しました。」)が表示パネル17に表示される。そして、発信元電話機10の音声登録時の制御が終了される。
次に、図2および図12を参照して、本発明の第1実施形態による自動翻訳対応電話システム1の発信元電話機10の音声通話時の制御動作について説明する。
まず、図12に示すように、ステップS11において、発信元電話機10の制御部13(図2参照)によって、受話器12(図2参照)が話者により持ち上げられることによって、発信元電話機10が通話可能な状態になったか否かが判断されるとともに、発信元電話機10が通話可能な状態になるまで、ステップS11の判断が繰り返される。そして、ステップS11において、制御部13によって、発信元電話機10が通話可能な状態になったと判断された場合には、ステップS12において、制御部13によって、操作パネル16(図2参照)の数字ボタン部16c(図2参照)が押下されて、送信先電話機30の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップS12の判断が繰り返される。そして、ステップS12において、制御部13によって、送信先電話番号がダイヤルされたと判断された場合には、ステップS13に進む。
そして、ステップS13において、制御部13によって、電話回線制御回路15(図2参照)から送信先電話番号に関する信号が外部(回線交換機50(図2参照))に出力される。そして、ステップS14に進み、制御部13によって、発信元電話機10と送信先電話機30(図2参照)とが電話回線40および41(図2参照)を介して接続された旨を通知する接続信号が回線交換機50から電話回線制御回路15に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップS14の判断が繰り返される。そして、ステップS14において、制御部13によって、接続信号が入力されたと判断された場合には、ステップS15に進み、制御部13によって、発信元電話番号に基づいて、電子辞書部21の複数の方言辞書21bから対応する方言辞書21bが選択される。そして、ステップS16に進む。
また、ステップS16に進み、制御部13によって、集音器12a(図2参照)から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップS16の判断が繰り返される。そして、ステップS16において、制御部13によって、話者が発する音声が入力されたと判断された場合には、ステップS17に進む。
次に、ステップS17において、制御部13によって、話者が発した日本語の音声を音声変換器14によって日本語の変換前の音声信号に変換した後に、音声認識部19(図2参照)において、話者によって音声登録時にメモリ18に予め登録された話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部19において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップS18に進み、制御部13によって、翻訳エンジン部20(図2参照)により選択された方言辞書21bを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる方言が認識されて、標準語の翻訳前の文字信号に変換されるとともに、基本辞書21aを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳(変換)される。そして、ステップS19に進む。
そして、ステップS19において、制御部13によって、音声認識部19において、英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップS20に進み、制御部13によって、英語の変換後の音声信号が、電話回線40および41を介して、送信先電話機30に出力される。そして、発信元電話機10の音声通話時の制御が終了される。
第1実施形態では、上記のように、制御部13によって、集音器12aを介して入力される話者に読み上げられた日本語の例文(読み上げ例文17a〜17c)の音声が音声認識部19において日本語の文字として認識されるととともに、話者が確認可能なように日本語の文字が音声としてスピーカ12bから出力(再生)されるように構成することによって、スピーカ12bによって話者が確認可能なように日本語の文字を通知することにより、話者に発信元電話機10における音声の認識の状態を確認させることができる。また、音声認識部19では、制御部13によって、話者によって予め登録された話者の音声に関する情報に基づいて、話者が発する日本語からなる音声(音声信号)が話者が発する音声に対応する英語に翻訳する前の日本語の文字(翻訳前の文字信号)として認識されるように構成することによって、人によってそれぞれ異なる音声の癖に対応させるように話者が発する音声に関する情報を活用することができるので、話者が発する音声に含まれる話者の意図する単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができる。また、制御部13によって、電子辞書部21の方言辞書21bを参照して、話者の音声が文節に区切られて文字として認識される際に、音声認識部19において認識された日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識した方言が日本語の標準語の翻訳前の文字信号に変換されるように構成することによって、日本語を発する話者が方言を有する地域に位置する場合においても、特定された方言に対応する方言辞書21bを用いることにより、音声認識部19を特定された方言に対応させることができる。これにより、話者が発する音声に含まれる方言による単語が、話者の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、日本語を用いる話者と英語を用いる通話相手との通話時に、精度の高い翻訳を行うことができる。
また、第1実施形態では、上記のように、制御部13によって、発信元電話機10の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言が特定されて、特定された方言に対応する方言辞書21bが選択されるように構成することによって、発信元電話機10の発信元電話番号を用いることによって、話者に通話時に必要な送信先電話番号の入力以外のその他の特定の操作を要求することなく、日本語に含まれる方言を特定することができる。これにより、話者が発する音声に含まれる方言による単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。
また、第1実施形態では、上記のように、制御部13によって、音声登録メニュープログラムにおいて、集音器12aを介して入力される話者に読み上げられた日本語の例文(読み上げ例文17a〜17c)の音声が、音声認識部19において日本語の文字として認識され、話者が確認可能なように認識した日本語の文字が音声としてスピーカ12bから出力(再生)されることによって、スピーカ12bから出力される音声により、話者は、発信元電話機10における音声の認識の状態を聴覚によって確認することができる。これにより、話者が発する音声に含まれる単語が話者の意図する単語とは異なる単語として誤って認識されるのをより抑制することができるので、これによっても、翻訳の精度を向上させることができる。
(第2実施形態)
次に、図13〜図16を参照して、第2実施形態について説明する。この第2実施形態による自動翻訳対応電話システム100では、上記第1実施形態と異なり、発信元電話機110のGPS(全地球測位システム)による位置情報を用いて話者の方言を特定するとともに、自動翻訳対応電話システム100の回線交換機150に翻訳エンジン部151および電子辞書部152を設ける場合について説明する。
まず、図13および図14を参照して、本発明の第2実施形態による自動翻訳対応電話システム100の構成について説明する。
本発明の第2実施形態による自動翻訳対応電話システム100では、図13に示すように、発信元電話機110および送信先電話機130は、それぞれ、携帯電話によって構成されているとともに、発信元電話機110は、GPS機能を搭載している。また、発信元電話機110から出力される音声信号および文字信号を含む電波は、基地局160において受信された後に、電話回線140を介して回線交換機150に受信されるとともに、回線交換機150から出力される音声信号および文字信号は、電話回線140を介して基地局160において電波として発信された後に、発信元電話機110に入力されるように構成されている。これにより、回線交換機150により電話回線140と電話回線141とが接続されることによって、発信元電話機110は、送信先電話機130と接続可能なように構成されている。また、発信元電話機110と送信先電話機130とが接続されている状態においては、発信元電話機110および送信先電話機130から出力された音声信号および文字信号は、それぞれ、送信先電話機130および発信元電話機110に入力されるように構成されている。また、話者が発信元電話機110において送信先電話番号をダイヤルすることにより送信先電話機130と接続された際には、回線交換機150から電話回線140および基地局160を介して、接続された旨を通知する接続信号が発信元電話機110に入力されるように構成されている。
また、第2実施形態において、発信元電話機110には、図14に示すように、筐体11と、集音器12aと、スピーカ12bと、制御部13と、音声変換器14と、電話回線制御回路15と、12個のボタンを含むボタン部16aおよび選択決定ボタン16bからなる操作パネル16と、表示パネル17と、メモリ18と、音声認識部19とが設けられている。また、ボタン部16aは、数字が付された数字ボタン部16cと、アスタリスクが付されたアスタリスクボタン16dと、シャープが付されたシャープボタン16eとを含む。また、数字ボタン部16cは、「1」〜「9」の数字がそれぞれ付された数字ボタン16f〜16nと、「0」の数字が付された数字ボタン16oとからなる。また、発信元電話機110には、送信先電話機130から音声信号および文字信号を含む電波を送受信するためのアンテナ122と、GPS(全地球測位システム)による位置情報を取得するための位置情報取得部123とがさらに設けられている。このGPSによる位置情報によって、発信元電話機110の位置する地域が特定されるように構成されている。また、制御部13によって、アンテナ122を介して、回線交換機150に送信元電話番号と位置情報取得部123において得られたGPSによる位置情報とが出力されるように構成されている。
また、発信元電話機110には、上記第1実施形態の発信元電話機10(図2参照)と異なり、翻訳エンジン部20(図2参照)および電子辞書部21(図2参照)が設けられていない。一方、回線交換機150は、翻訳エンジン部151を備えているとともに、翻訳エンジン部151には、基本辞書152aおよび複数の方言辞書152bを含む電子辞書部152が設けられている。また、回線交換機150は、翻訳エンジン部151および電子辞書部152などを制御する制御部153を備えている。このように、回線交換機150に翻訳エンジン部151および電子辞書部152を設けることによって、翻訳エンジン部151および電子辞書部152を更新して翻訳に関する新たな情報を追加する際に、回線交換機150のみを更新すればよく、個々の発信元電話機110のそれぞれを更新させる必要がないので、自動翻訳対応電話システム100において、翻訳に関する新たな情報を容易に追加することが可能である。これにより、より正確に、話者が発する音声に対応する日本語の方言の文字信号を、日本語の標準語の文字信号に対応する英語の文字信号に翻訳(変換)することが可能になる。なお、翻訳エンジン部151および電子辞書部152は、本発明の「文字変換部」の一例である。
ここで、第2実施形態では、制御部153によって、発信元電話機110から入力された位置情報を用いて、話者の位置する地域の日本語に含まれる方言が特定されるとともに、特定された方言に対応する方言辞書152bが選択されるように構成されている。また、制御部153によって、選択された方言辞書152bを参照して、日本語の翻訳前の文字信号に含まれる方言が認識されるとともに、認識された方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。なお、第2実施形態のその他の構成および発信元電話機の音声登録時の制御動作は、上記第1実施形態と同様である。
次に、図14〜図16を参照して、本発明の第2実施形態による自動翻訳対応電話システム100の音声通話時の制御動作について説明する。
まず、図15に示すように、ステップS111において、発信元電話機110の制御部13(図14参照)によって、発信元電話機110が通話可能な状態になったか否かが判断されるとともに、発信元電話機110が通話可能な状態になるまで、ステップS111の判断が繰り返される。そして、ステップS111において、制御部13によって、発信元電話機110が通話可能な状態になったと判断された場合には、ステップS112において、制御部13によって、操作パネル16(図14参照)の数字ボタン部16c(図14参照)が押下されて、送信先電話機130の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップS112の判断が繰り返される。そして、ステップS112において、制御部13によって、送信先電話番号がダイヤルされたと判断された場合には、ステップS113に進む。
そして、ステップS113において、制御部13によって、アンテナ122(図14参照)から送信先電話番号と位置情報とに関する信号が回線交換機150(図14参照)に出力される。そして、ステップS114に進む。
ここで、図16に示すように、ステップS131において、回線交換機150の制御部153(図14参照)によって、発信元電話機110から出力された送信先電話番号と位置情報とに関する信号が受信されたか否かが判断されるとともに、送信先電話番号と位置情報とに関する信号が受信されるまで、ステップS131の判断が繰り返される。そして、ステップS131において、制御部153によって、送信先電話番号と位置情報とに関する信号が受信されたと判断された場合には、ステップS132に進み、制御部153によって、発信元電話機110と送信先電話機130とが接続されるように、電話回線140と電話回線141とが接続される。そして、ステップS133に進む。
そして、ステップS133において、制御部153によって、発信元電話機110に送信先電話機130と接続した旨の接続信号が出力される。そして、ステップS134に進み、制御部153によって、翻訳エンジン部151(図14参照)が電話回線140と電話回線141との間に接続される。そして、ステップS135に進み、制御部153によって、発信元電話機110から出力された位置情報に基づいて、電子辞書部152の複数の方言辞書152bから対応する方言辞書152bが選択される。そして、ステップS136に進む。
一方、図15に示すステップS114において、制御部13によって、発信元電話機110に送信先電話機130と接続した旨の接続信号が、回線交換機150からアンテナ122に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップS114の判断が繰り返される。そして、ステップS114において、制御部13によって、接続信号が入力されたと判断された場合には、ステップS115に進む。
また、ステップS115において、制御部13によって、集音器12a(図14参照)から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップS115の判断が繰り返される。そして、ステップS115において、制御部13によって、話者が発する音声が入力されたと判断された場合には、ステップS116に進む。
次に、ステップS116において、制御部13によって、話者が発した日本語の音声を音声変換器14によって日本語の変換前の音声信号に変換した後に、音声認識部19(図14参照)において、話者によって音声登録時にメモリ18に予め登録された話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部19において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップS117に進み、制御部13によって、日本語の翻訳前の文字信号が、基地局160および電話回線140を介して、回線交換機150に出力される。そして、発信元電話機110における音声通話時の制御が終了される。
一方、図16に示すステップS136において、制御部153によって、発信元電話機110から出力された日本語の翻訳前の文字信号が受信されたか否かが判断されるとともに、日本語の翻訳前の文字信号が受信されるまで、ステップS136の判断が繰り返される。そして、ステップS136において、制御部153によって、日本語の翻訳前の文字信号が受信されたと判断した場合には、ステップS137に進む。
そして、ステップS137において、制御部153によって、翻訳エンジン部151(図14参照)により選択された方言辞書152bを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる方言が認識されて、日本語の標準語の翻訳前の文字信号に変換されるとともに、基本辞書152aを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳(変換)される。そして、ステップS138に進み、制御部153によって、英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップS139に進み、制御部153によって、英語の変換後の音声信号が、電話回線141および基地局161を介して、送信先電話機130に出力される。そして、回線交換機150における音声通話時の制御が終了される。
第2実施形態では、上記のように、制御部153によって、発信元電話機110から入力されたGPSによる位置情報を用いて、話者の位置する地域の日本語に含まれる方言が特定されるように構成することによって、GPSによる位置情報を用いることによって、話者に特定の操作を要求することなく、話者の位置する地域の日本語に含まれる方言を特定することができるので、日本語を用いる話者と英語を用いる通話相手との通話時に、より精度の高い翻訳を行うことができる。なお、第2実施形態のその他の効果は、上記第1実施形態と同様である。
(第3実施形態)
次に、図17〜図19を参照して、第3実施形態について説明する。この第3実施形態による自動翻訳対応電話システム200では、上記第1実施形態と異なり、自動翻訳対応電話システム200の回線交換機250に翻訳エンジン部251および電子辞書部252を設けるとともに、電子辞書部252に、複数の発信元方言辞書252cと、複数の言語にそれぞれ対応する送信先基本辞書252eおよび各々の送信先基本辞書252eに対応する言語の複数の送信先方言にそれぞれ対応する送信先方言辞書252fを有する送信先辞書部252dとを設ける場合について説明する。
まず、図17を参照して、本発明の第3実施形態による自動翻訳対応電話システム200の構成について説明する。
本発明の第3実施形態による自動翻訳対応電話システム200の発信元電話機210は、日本の方言を有する地域に位置するとともに、送信先電話機30は、英語圏の方言を有する地域に位置する。また、発信元電話機210には、図17に示すように、上記第1実施形態の発信元電話機10(図2参照)と異なり、翻訳エンジン部20(図2参照)および電子辞書部21(図2参照)が設けられていない。一方、回線交換機250は、翻訳エンジン部251を備えているとともに、翻訳エンジン部251には、電子辞書部252が設けられている。また、回線交換機250は、翻訳エンジン部251および電子辞書部252などを制御する制御部253を備えている。なお、翻訳エンジン部251および電子辞書部252は、本発明の「文字変換部」の一例である。
また、電子辞書部252には、複数の発信元方言辞書252cと、送信先辞書部252dとが設けられている。この発信元方言辞書252cは、日本国内の異なる地域においてそれぞれ用いられる発信元方言の文字と日本語の標準語の文字とが対応付けられた状態で記憶されている。また、送信先辞書部252dには、日本語の言語の標準語の文字(単語)と日本語以外の言語の標準語の文字(単語)とが対応付けられた状態でそれぞれ記憶された複数の送信先基本辞書252eと、各々の送信先基本辞書252eに対応する言語が用いられる地域内の異なる地域においてそれぞれ用いられる送信先方言の文字と、各々の送信先基本辞書252eに対応する言語の標準語の文字とが対応付けられた状態で記憶された複数の送信先方言辞書252fとが設けられている。また、電子辞書部252には、発信元電話番号に基づいて、複数の発信元方言辞書252cから対応する発信元方言辞書252cを選択するとともに、送信先電話番号に基づいて、複数の送信先基本辞書252eから対応する送信先基本辞書252eと、複数の送信先方言辞書252fから対応する送信先方言辞書252fとを選択するための辞書選択部252gが含まれている。なお、発信元方言は、本発明の「第1方言」の一例であり、送信先方言は、本発明の「第2方言」の一例である。また、発信元方言辞書252cは、本発明の「方言辞書」および「第1方言辞書」の一例であり、送信先方言辞書252fは、本発明の「方言辞書」および「第2方言辞書」の一例である。
また、第3実施形態では、制御部253によって、発信元電話機210の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる発信元方言が特定されるとともに、辞書選択部252gにおいて、特定された発信元方言に対応する発信元方言辞書252cが選択されるように構成されている。また、制御部253によって、送信先電話機30の送信先電話番号を用いて、辞書選択部252gにおいて、送信先電話機30の位置する英語の送信先基本辞書252eが選択されるとともに、送信先電話機30の位置する地域の英語に含まれる送信先方言が特定されて、特定された送信先方言に対応する英語の送信先方言辞書252fが選択されるように構成されている。
ここで、第3実施形態では、制御部253によって、電子辞書部252の選択された発信元方言辞書252cを参照して、日本語の翻訳前の文字信号に含まれる発信元方言が認識されるとともに、認識した発信元方言が日本語の標準語の翻訳前の文字信号に変換されるように構成されている。また、制御部253によって、英語の送信先基本辞書252eおよび英語に含まれる送信先方言に対応する送信先方言辞書252fを参照して、日本語の標準語の翻訳前の文字信号が英語の標準語の翻訳後の文字信号に変換されるとともに、英語の標準語の翻訳後の文字信号が特定された英語の送信先方言を含む英語の翻訳後の文字信号に変換されるように構成されている。なお、第3実施形態のその他の構成および発信元電話機の音声登録時の制御動作は、上記第1実施形態と同様である。
次に、図17〜図19を参照して、本発明の第3実施形態による自動翻訳対応電話システム200の音声通話時の制御動作について説明する。
まず、図18に示すように、ステップS211において、発信元電話機210の制御部13(図17参照)によって、受話器12(図17参照)が話者により持ち上げられることによって、発信元電話機210が通話可能な状態になったか否かが判断されるとともに、発信元電話機210が通話可能な状態になるまで、ステップS211の判断が繰り返される。そして、ステップS211において、制御部13によって、発信元電話機210が通話可能な状態になったと判断された場合には、ステップS212において、制御部13によって、操作パネル16(図17参照)の数字ボタン部16c(図17参照)が押下されて、送信先電話機30の送信先電話番号がダイヤルされたか否かが判断されるとともに、送信先電話番号がダイヤルされるまで、ステップS212の判断が繰り返される。そして、ステップS212において、制御部13によって、送信先電話番号がダイヤルされたと判断された場合には、ステップS213に進む。
そして、ステップS213において、制御部13によって、電話回線制御回路15(図17参照)から発信元電話番号と送信先電話番号とに関する信号が回線交換機250(図17参照)に出力される。そして、ステップS214に進む。
ここで、図19に示すように、ステップS231において、回線交換機250の制御部253(図17参照)によって、発信元電話機210から出力された発信元電話番号と送信先電話番号とに関する信号が受信されたか否かが判断されるとともに、発信元電話番号と送信先電話番号とに関する信号が受信されるまで、ステップS231の判断が繰り返される。そして、ステップS231において、制御部253によって、発信元電話番号と送信先電話番号とに関する信号が受信されたと判断された場合には、ステップS232に進み、制御部253によって、発信元電話機210と送信先電話機30とが接続されるように、電話回線40と電話回線41とが接続される。そして、ステップS233に進む。
そして、ステップS233において、制御部253によって、発信元電話機210に送信先電話機30と接続した旨の接続信号が出力される。そして、ステップS234に進み、制御部253によって、翻訳エンジン部251(図17参照)が電話回線40と電話回線41との間に接続される。そして、ステップS235に進み、制御部253によって、辞書選択部252gにおいて、発信元電話機210から出力された発信元電話番号に基づいて、電子辞書部252の複数の発信元方言辞書252cから対応する発信元方言辞書252cが選択されるとともに、送信先電話番号に基づいて、複数の送信先基本辞書252eから対応する送信先基本辞書252eと、複数の送信先方言辞書252fから対応する送信先方言辞書252fとが選択される。そして、ステップS236に進む。
一方、図18に示すステップS214において、制御部13によって、発信元電話機210に送信先電話機30と接続した旨の接続信号が、回線交換機250から電話回線制御回路15に入力されたか否かが判断されるとともに、接続信号が入力されるまで、ステップS214の判断が繰り返される。そして、ステップS214において、制御部13によって、接続信号が入力されたと判断された場合には、ステップS215に進む。
また、ステップS215において、制御部13によって、集音器12a(図17参照)から話者が発する音声が入力されたか否かが判断されるとともに、話者が発する音声が入力されるまで、ステップS215の判断が繰り返される。そして、ステップS215において、制御部13によって、話者が発する音声が入力されたと判断された場合には、ステップS216に進む。
次に、ステップS216において、制御部13によって、話者が発した日本語の音声を音声変換器14によって日本語の変換前の音声信号に変換した後に、音声認識部19(図17参照)において、話者によって音声登録時にメモリ18に予め登録された、話者の音声に関する情報に基づいて、日本語の変換前の音声信号が音声認識部19において文節で区切られて日本語の翻訳前の文字信号として認識される。そして、ステップS217に進み、制御部13によって、日本語の翻訳前の文字信号が、電話回線40を介して、回線交換機250に出力される。そして、発信元電話機210における音声通話時の制御が終了される。
一方、図19に示すステップS236において、制御部253によって、発信元電話機210から出力された日本語の翻訳前の文字信号が受信されたか否かが判断されるとともに、日本語の翻訳前の文字信号が受信されるまで、ステップS236の判断が繰り返される。そして、ステップS236において、制御部253によって、日本語の翻訳前の文字信号が受信されたと判断した場合には、ステップS237に進む。
そして、ステップS237において、制御部253によって、翻訳エンジン部251(図17参照)により選択された発信元方言辞書252cを用いて、話者が発する音声に対応する日本語の翻訳前の文字信号に含まれる発信元方言が認識されて、日本語の標準語の翻訳前の文字信号に変換されるとともに、選択された送信先基本辞書252eを用いて、日本語の標準語の翻訳前の文字信号が、日本語の翻訳前の文字信号に対応する英語の翻訳後の文字信号に翻訳(変換)され、選択された送信先方言辞書252fを用いて、英語の標準語の翻訳後の文字信号が、対応する送信先方言を含む英語の翻訳後の文字信号に変換される。そして、ステップS238に進み、制御部253によって、送信先方言を含む英語の翻訳後の文字信号が英語の変換後の音声信号に変換される。そして、ステップS239に進み、制御部253によって、英語の変換後の音声信号が、電話回線41を介して、送信先電話機30に出力される。そして、回線交換機250における音声通話時の制御が終了される。
第3実施形態では、上記のように、制御部253によって、電子辞書部252の選択された発信元方言辞書252cを参照して、日本語の翻訳前の文字信号に含まれる発信先方言が認識されるとともに、認識した発信先方言が日本語の標準語の翻訳前の文字信号に変換され、英語の送信先基本辞書252eおよび英語の送信先方言辞書252fを参照して、日本語の標準語の翻訳前の文字信号が英語の標準語の翻訳後の文字信号に変換されるとともに、英語の標準語の翻訳後の文字信号が特定された英語の送信先方言を含む英語の翻訳後の文字信号に変換されることによって、日本語を発する話者が発信元方言を有する地域に位置するとともに、英語を発する通話相手が送信先方言を有する地域に位置する場合においても、特定された発信元方言および送信先方言にそれぞれ対応する発信元方言辞書252cおよび送信先方言辞書252fを用いることにより、音声認識部19を発信元方言および送信先方言に対応させることができる。これにより、話者の発する音声に含まれる発信元方言および通話相手が発する音声に含まれる送信先方言による単語が、話者および通話相手の両方の意図する単語とは異なる単語として誤って認識されるのを抑制することができるので、日本語から英語への変換(翻訳)のみならず、日本語から英語への変換(翻訳)の精度も向上させることができる。なお、第3実施形態のその他の効果は、上記第1実施形態と同様である。
なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。
たとえば、第2および第3実施形態では、自動翻訳対応電話システムの発信元電話機に音声認識部を設けた例を示したが、本発明はこれに限らず、発信元電話機に音声認識部を設けずに、回線交換機に音声認識部を設けてもよい。このように構成すれば、音声認識部、翻訳エンジン部および電子辞書部を有しない、より一般的な発信元電話機を用いた場合においても、話者は、自動翻訳機能を利用することが可能になる。
また、第1および第2実施形態では、話者の位置する地域の日本語に含まれる方言を特定した例を示したが、本発明はこれに限らず、話者の位置する地域の日本語に含まれる方言を特定せずに、送信先電話機(通話相手)の地域を特定することによって、送信先電話機の位置する地域の方言を特定してもよい。その際、第2実施形態における送信先電話機は、GPS機能を搭載している必要がある。
また、第1実施形態では、発信元電話機10の発信元電話番号を用いて、話者の位置する地域の日本語に含まれる方言を特定する例を示すとともに、第2実施形態では、GPSからの位置情報を用いて、話者の位置する地域の日本語に含まれる方言を特定する例を示したが、本発明はこれに限らず、たとえば、第2実施形態においては、発信元電話機から電波による信号が受信される基地局の位置情報などのような、発信元電話番号およびGPSからの位置情報以外の話者の地域を特定する情報を用いて、話者の位置する地域の日本語に含まれる方言を特定してもよい。
また、第1〜第3実施形態では、本発明の「第1言語」として日本語を、本発明の「第2言語」として英語をそれぞれ用いた例を示したが、本発明はこれに限らず、「第1言語」および「第2言語」は、日本語および英語に限られず、他の国の言葉でもよい。
また、第1〜第3実施形態では、音声登録メニュープログラムにおいて、制御部13によって、話者に読み上げられた日本語の例文(読み上げ例文17a〜17c)の音声が音声認識部19において日本語の文字として認識されるととともに、話者が確認可能なように日本語の文字が音声としてスピーカ12bから出力(再生)されることによって、日本語の文字を話者に通知するように構成した例を示したが、本発明はこれに限らず、音声登録メニュープログラムにおいて、たとえば、音声認識部において認識された日本語の文字を表示パネルに表示することによって、日本語の文字を話者に通知するように構成してもよい。
また、第1〜第3実施形態では、音声認識部19では、制御部13によって、話者の音声に関する情報に基づいて、話者の音声が文節に区切って文字として認識された例を示したが、本発明はこれに限らず、音声認識部では、制御部によって、話者の音声に関する情報に基づいて、話者の音声が単語ごとに区切られて文字として認識されるように構成してもよい。
1、100、200 自動翻訳対応電話システム
10 発信元電話機(自動翻訳対応電話機)
12a 集音器(音声入力部)
12b スピーカ(第1出力部、音声出力部、出力部)
13 制御部
15 電話回線制御回路(第2出力部)
18 メモリ
19 音声認識部
20、151、251 翻訳エンジン部(文字変換部)
21、152、252 電子辞書部(文字変換部)
21b、152b 方言辞書
153、253 制御部
252c 発信元方言辞書(方言辞書、第1方言辞書)
252f 送信先方言辞書(方言辞書、第2方言辞書)

Claims (7)

  1. 第1言語によって話者が発する音声が入力される音声入力部と、
    話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
    予め登録された前記話者が発する音声に関する情報に基づいて、話者から入力された音声を、前記第1言語と異なる第2言語に翻訳する前の前記第1言語に対応する文字として認識するための音声認識部と、
    前記第1言語および前記第2言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、前記第1言語に対応する文字を前記第2言語に対応する文字に変換するための文字変換部と、
    前記音声認識部により認識された前記第1言語の文字を出力する第1出力部と、
    前記話者が発する音声に関する情報を登録する際に、話者から入力された音声を前記第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第1言語に対応する文字を通知するように前記第1出力部を制御する制御部とを備え、
    前記制御部は、前記第1言語に対応する文字を前記第2言語に対応する文字に変換する際に、前記第1言語および前記第2言語の少なくとも一方に含まれる方言を特定して前記方言に対応する前記電子辞書部の方言辞書を選択して参照するように構成されている、自動翻訳対応電話システム。
  2. 前記文字変換部により前記第1言語の文字から変換された前記第2言語に対応する文字を出力する第2出力部をさらに備え、
    前記制御部は、前記第1言語に含まれる方言を特定する場合には、話者の地域を特定する情報を用い、前記第2言語に含まれる方言を特定する場合には、前記第2出力部の出力先の地域を特定する情報を用いるように構成されている、請求項1に記載の自動翻訳対応電話システム。
  3. 前記制御部は、前記第1言語に含まれる方言を特定する場合には、話者の電話番号を用い、前記第2言語に含まれる方言を特定する場合には、前記第2出力部の出力先の電話番号を用いるように構成されている、請求項2に記載の自動翻訳対応電話システム。
  4. 前記制御部は、前記第1言語に含まれる方言を特定する場合には、話者の全地球測位システムによる情報を用い、前記第2言語に含まれる方言を特定する場合には、前記第2出力部の出力先の全地球測位システムによる情報を用いるように構成されている、請求項2に記載の自動翻訳対応電話システム。
  5. 前記制御部は、前記第1言語に対応する文字を前記第2言語に対応する文字に変換する際に、前記第1言語に含まれる第1方言および前記第2言語に含まれる第2方言をそれぞれ特定して前記第1方言および前記第2方言に対応する前記電子辞書部の第1方言辞書および第2方言辞書をそれぞれ選択して参照するように構成されている、請求項1〜4のいずれか1項に記載の自動翻訳対応電話システム。
  6. 前記第1出力部は、前記話者が発する音声に関する情報を登録する際に、前記音声認識部により認識された前記第1言語の文字を、話者が確認可能なように音声として出力する音声出力部を含む、請求項1〜5のいずれか1項に記載の自動翻訳対応電話システム。
  7. 第1言語によって話者が発する音声が入力される音声入力部と、
    話者が発する音声に関する情報を予め登録して記憶するためのメモリと、
    予め登録された前記話者が発する音声に関する情報に基づいて、話者から入力された音声を、前記第1言語と異なる第2言語に翻訳する前の前記第1言語に対応する文字として認識するための音声認識部と、
    前記第1言語および前記第2言語の少なくとも一方に含まれる方言に対応する方言辞書を有する電子辞書部を含み、前記第1言語に対応する文字を前記第2言語に対応する文字に変換するための文字変換部と、
    前記音声認識部により認識された前記第1言語の文字を出力する出力部と、
    前記話者が発する音声に関する情報を登録する際に、話者から入力された音声を前記第1言語に対応する文字として認識した結果に基づいて、話者が確認可能なように前記第1言語に対応する文字を通知するように前記出力部を制御する制御部とを備え、
    前記制御部は、前記第1言語に対応する文字を前記第2言語に対応する文字に変換する際に、前記第1言語および前記第2言語の少なくとも一方に含まれる方言を特定して前記方言に対応する前記電子辞書部の方言辞書を選択して参照するように構成されている、自動翻訳対応電話機。
JP2009129440A 2009-05-28 2009-05-28 自動翻訳対応電話システムおよび自動翻訳対応電話機 Pending JP2010277359A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009129440A JP2010277359A (ja) 2009-05-28 2009-05-28 自動翻訳対応電話システムおよび自動翻訳対応電話機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009129440A JP2010277359A (ja) 2009-05-28 2009-05-28 自動翻訳対応電話システムおよび自動翻訳対応電話機

Publications (1)

Publication Number Publication Date
JP2010277359A true JP2010277359A (ja) 2010-12-09

Family

ID=43424260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009129440A Pending JP2010277359A (ja) 2009-05-28 2009-05-28 自動翻訳対応電話システムおよび自動翻訳対応電話機

Country Status (1)

Country Link
JP (1) JP2010277359A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013098869A (ja) * 2011-11-02 2013-05-20 Chiba Inst Of Technology 音声システム
JP2016520879A (ja) * 2013-12-19 2016-07-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 地方なまりを区別する音声データ認識方法、装置及びサーバ
WO2021075065A1 (ja) * 2019-10-15 2021-04-22 菊一 西 音声入力機器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013098869A (ja) * 2011-11-02 2013-05-20 Chiba Inst Of Technology 音声システム
JP2016520879A (ja) * 2013-12-19 2016-07-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 地方なまりを区別する音声データ認識方法、装置及びサーバ
WO2021075065A1 (ja) * 2019-10-15 2021-04-22 菊一 西 音声入力機器

Similar Documents

Publication Publication Date Title
US8032383B1 (en) Speech controlled services and devices using internet
US8244540B2 (en) System and method for providing a textual representation of an audio message to a mobile device
US7826945B2 (en) Automobile speech-recognition interface
US20020143548A1 (en) Automated database assistance via telephone
US20070016421A1 (en) Correcting a pronunciation of a synthetically generated speech object
WO2019111346A1 (ja) 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム
JP2003515816A (ja) 音声制御された外国語翻訳デバイスのための方法及び装置
JP2000123013A (ja) 電子会話装置、会話表現収集方法及び会話促進方法
EP1851757A1 (en) Selecting an order of elements for a speech synthesis
WO2008118376A1 (en) Semi-supervised training of destination map for call handling applications
US10143027B1 (en) Device selection for routing of communications
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
JP2010277359A (ja) 自動翻訳対応電話システムおよび自動翻訳対応電話機
EP1555653A1 (en) Location dependent speech recognition search space limitation
EP3241123B1 (en) Voice recognition-based dialing
JP2018087945A (ja) 言語認識システム、言語認識方法、及び言語認識プログラム
JP2010276869A (ja) 自動翻訳対応電話機および自動翻訳対応電話システム
KR20010020871A (ko) 개선된 어구 저장, 사용, 변환, 전달 및 인식을 갖춘 음성제어된 디바이스를 위한 방법 및 장치
KR20040008990A (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
US11172527B2 (en) Routing of communications to a device
CN111652005B (zh) 汉语与乌尔都语同步互译系统及方法
JP2005331608A (ja) 情報処理装置および情報処理方法
EP1187431B1 (en) Portable terminal with voice dialing minimizing memory usage
JP2004007634A (ja) スピード音声ダイアル装置および方法
JP2019053251A (ja) 情報処理装置、言語判定方法及びプログラム