JP5163682B2 - 通訳通話システム - Google Patents

通訳通話システム Download PDF

Info

Publication number
JP5163682B2
JP5163682B2 JP2010086640A JP2010086640A JP5163682B2 JP 5163682 B2 JP5163682 B2 JP 5163682B2 JP 2010086640 A JP2010086640 A JP 2010086640A JP 2010086640 A JP2010086640 A JP 2010086640A JP 5163682 B2 JP5163682 B2 JP 5163682B2
Authority
JP
Japan
Prior art keywords
user
server
language
mobile terminal
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010086640A
Other languages
English (en)
Other versions
JP2010193495A (ja
Inventor
修 浜田
利忠 土井
康治 浅野
浩明 小川
真人 島川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010086640A priority Critical patent/JP5163682B2/ja
Publication of JP2010193495A publication Critical patent/JP2010193495A/ja
Application granted granted Critical
Publication of JP5163682B2 publication Critical patent/JP5163682B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

本発明は、通訳通話システムに関し、特に、機械翻訳をより有効に活用することができるようにした通訳通話システムに関する。
入力された音声を音声認識し、他の言語に変換(翻訳)し、さらにそれを音声で出力する、いわゆる、音声翻訳装置が開発されている。
しかしながら、例えば、電話回線を介して、複数の端末において行われる通話を通訳させる場合、通信が破綻しないように、音声翻訳装置および複数の端末における音声信号の送受信が制限され、これにより、会話のやり取りが不自然になる課題があった。また、制限に即して音声信号を送受信するようにするので、端末の操作が煩雑になり、ユーザに負担がかかる課題があった。
本発明はこのような状況に鑑みてなされたものであり、容易な操作により、かつ、自然な会話になるように、通話の内容を通訳できるようにするものである。
本発明の一側面の通訳通話システムは、端末装置とサーバとからなる通訳通話システムであって、前記端末装置は、音声を収音して第1の音声信号を生成する収音手段と、送話を開始するための第1の操作が行なわれた場合、予め記憶されている第1のユーザIDを前記サーバに送信するユーザID送信手段と、前記第1のユーザIDを前記サーバに送信した後、前記サーバに前記第1の音声信号を送信する第1の音声信号送信手段と、前記サーバから送信されてきた、前記第1の音声信号に対して通訳処理が実行されて得られた第2の音声信号を受信する第1の音声信号受信手段とを備え、前記サーバは、前記端末装置から送信されてきた前記第1のユーザIDを受信し、前記第1のユーザIDに対して予め定められた言語を通訳前の言語とし、前記端末装置が位置する地域に対して予め定められている言語を通訳後の言語として決定する決定手段と、前記端末装置から送信されてきた前記第1の音声信号を受信する第2の音声信号受信手段と、前記決定手段による決定結果に基づいて、前記通訳前の言語が前記通訳後の言語に通訳されるように、前記第1の音声信号に対する前記通訳処理を実行し、前記第2の音声信号を生成する実行手段と、前記第2の音声信号を前記端末装置に送信する第2の音声信号送信手段とを備える。
前記端末装置の前記ユーザID送信手段には、送話を開始するための第2の操作が行なわれた場合、予め記憶されている第2のユーザIDを前記サーバに送信させ、前記端末装置の前記第1の音声信号送信手段には、前記第2のユーザIDを前記サーバに送信した後、前記サーバに前記第1の音声信号を送信させ、前記サーバの前記決定手段には、前記端末装置から前記第2のユーザIDが送信されてきた場合、前記第2のユーザIDを受信させ、前記端末装置が位置する地域に対して予め定められている言語を通訳前の言語とさせ、前記第1のユーザIDに対して予め定められた言語を通訳後の言語として決定させることができる。
本発明の一側面においては、端末装置において、音声が収音されて第1の音声信号が生成され、送話を開始するための第1の操作が行なわれた場合、予め記憶されている第1のユーザIDがサーバに送信され、前記第1のユーザIDが前記サーバに送信された後、前記サーバに前記第1の音声信号が送信され、前記サーバから送信されてきた、前記第1の音声信号に対して通訳処理が実行されて得られた第2の音声信号が受信される。また、前記サーバにおいて、前記端末装置から送信されてきた前記第1のユーザIDが受信され、前記第1のユーザIDに対して予め定められた言語が通訳前の言語とし、前記端末装置が位置する地域に対して予め定められている言語が通訳後の言語として決定され、前記端末装置から送信されてきた前記第1の音声信号が受信され、前記通訳前の言語が前記通訳後の言語に通訳されるように、前記第1の音声信号に対する前記通訳処理が実行されて、前記第2の音声信号が生成され、前記第2の音声信号が前記端末装置に送信される。
本発明の一側面によれば、容易な操作により、かつ、自然な会話になるように、通話の内容を通訳することができる。
本発明を適用した通訳通信システムの第1の実施の形態の構成例を表すブロック図である。 図1の携帯端末11の構成例を表すブロック図である。 図1の携帯端末11の機能的構成例を表すブロック図である。 図1の携帯端末12の機能的構成例を表すブロック図である。 図1の通訳サーバ17の機能的構成例を表すブロック図である。 図1の携帯端末11の通話処理を説明するフローチャートである。 図1の携帯端末12の通話処理を説明するフローチャートである。 図1の通訳サーバ17の通話処理を説明するフローチャートである。 翻訳処理を説明するフローチャートである。 他の翻訳処理を説明するフローチャートである。 本発明を適用した通訳通信システムの第2の実施の形態の構成例を表すブロック図である。 図11の通訳サーバ17の機能的構成例を表すブロック図である。 図11の携帯端末11の通話処理を説明するフローチャートである。 図11の通訳サーバ17の通話処理を説明するフローチャートである。 他の翻訳処理を説明するフローチャートである。 本発明を適用した通訳通信システムの第3の実施の形態の構成例を表すブロック図である。 図16の交換局101の構成例を表すブロック図である。 通信路設定機能を説明するための図である。 通信路設定機能を説明するための他の図である。 本発明を適用した通訳通信システムの第4の実施の形態の構成例を表すブロック図である。 図20の携帯端末11の通話処理を説明するフローチャートである。
図1は、本発明を適用した通訳通話システムの第1の実施の形態の構成例を表している。ユーザAが所有する携帯端末11およびユーザBが所有する携帯端末12のそれぞれは、ユーザIDや、使用言語情報(後述)が記憶されている記録媒体、例えば、SIM(Subscriber Identity Module)カード37(図2)が装着された、電話機能を有する小型装置である。
携帯端末11および携帯端末12のそれぞれは、自分自身が位置する地域の基地局13および基地局14と無線で通信し、電話回線を含むネットワーク15の交換局16により交換接続され、通話(会話)することができる。また、ユーザAの利用する言語(この例においては、日本語)とユーザBの利用する言語(この例においては、英語)が異なる場合、ユーザAおよびユーザBは、その通話を、ネットワーク15に接続されている通訳サーバ17を介して行い、そこで会話の内容を通訳させるようにすることができる。
通訳サーバ17は、音声認識機能、機械翻訳機能、および音声合成機能からなる翻訳機能を有するサーバである。通訳サーバ17は、例えば、ネットワーク15上に回線Lを開設して、携帯端末11からの音声信号を受信したり、携帯端末12からの音声信号に基づく翻訳結果(音声信号)を携帯端末11に送信する。また、通訳サーバ17は、ネットワーク15上に、他の回線Pを開設し、携帯端末12からの音声信号を受信したり、携帯端末11からの音声信号に基づく翻訳結果を携帯端末12に送信する。
図2は、携帯端末11の構成例を表している。インタフェース31は、スピーカ32、表示部33、キーボード34、マイクロフォン35、通信部36などが接続されており、インタフェース31は、それらの入出力のインタフェース処理を実行する。インタフェース31にはまた、SIMカード37に対して情報を記録または再生するドライブ38も接続されている。
CPU39は、ROM40に記憶されているプログラムに従って、各種の処理を実行する。RAM41は、CPU39が各種の処理を実行する上において必要なデータやプログラムを適宜記憶する。
図3は、携帯端末11の機能的構成例を表している。制御部51は、各部を制御する。送話部52は、マイクロフォン35からの入力を制御する。キー入力制御部53は、キーボード34からの入力を制御する。受話部54は、スピーカ32への出力を制御し、表示制御部55は、表示部33への情報の表示を制御する。通信制御部56は、基地局13に対する通信処理を制御する。ユーザ情報記憶部57は、ユーザAのユーザIDや、ユーザAの使用する言語の種類を示す情報(使用言語情報)を記憶する。
図2に示すように、これらの機能を実行する各部のうち、ユーザ情報記憶部57は、SIMカード37に記憶されている。残りの制御部51、送話部52、キー入力制御部53、受話部54、表示制御部55、通信制御部56は、CPU39に保持されている。
図4は、携帯端末12の機能的構成例を表している。その制御部61乃至ユーザ情報記憶部67は、図3の制御部51乃至ユーザ情報記憶部57と同様に構成されているので、その詳細な説明は省略するが、ユーザ情報記憶部67には、ユーザBのユーザIDや、ユーザBの使用言語情報が記憶されている。
図5は、通訳サーバ17の機能的構成例を表している。制御部71は、使用言語情報記憶部72、通信制御部73、および2個の翻訳部74−1,74−2(以下、翻訳部74−1,74−2を個々に区別する必要がない場合、単に、翻訳部74と記述する。他の部分についても同様である)を制御する。使用言語情報記憶部72には、例えば、ユーザAおよびユーザBの使用言語情報が記憶される。通信制御部73は、ネットワーク15に対する通信処理を制御する。
翻訳部74−1の辞書記憶部81−1には、N個の辞書D−1乃至D−Nが記憶されている。辞書D−1乃至D−Nのそれぞれには、言語の種類(使用言語情報)ごとの、音声認識用言語データ、機械翻訳用言語データ、および音声合成用言語データが記憶されている。
音声認識部82−1は、辞書記憶部81−1の辞書Dを参照して、供給される音声信号を音声認識し、対応する言語のテキストデータを生成する。機械翻訳部83−1は、辞書記憶部81−1の辞書Dを参照して、音声認識部82−1により生成されたテキストデータを解析し、対応する言語のテキストデータに変換(翻訳)する。音声合成部84−1は、辞書記憶部81−1の辞書Dを参照して、機械翻訳部83−1により翻訳されたテキストデータを音声信号に変換する。
翻訳部74−2も、翻訳部74−1と同様に構成されている。翻訳部74−2において翻訳部74−1と対応する要素には、対応する番号と数枝に、それぞれ、−2を付して表している。
次に、第1の実施の形態における通訳通話処理の手順を、図6乃至図10のフローチャートを参照して説明する。なお、この例においては、通訳サーバ17における通訳処理は、携帯端末11からのアクセスにより開始されるものとする。
図6のフローチャートには、この例における携帯端末11の通話処理の手順が示されている。ステップS1において、ユーザAは、携帯端末11と携帯端末12を介して行われるユーザBとの通話を通訳サーバ17により通訳させるために、所定の情報をキーボード34を操作して入力する。このとき入力される情報は、この例の場合、通訳サーバ17との回線を確立するための情報(以下、回線確立情報と称する)と、携帯端末12の電話番号など通訳サーバ17における通訳処理に必要とされる情報(以下、必要情報と称する)である。
ステップS2において、制御部51は、ステップS1で入力された回線確立情報に対応して、通信制御部56を制御し、通訳サーバ17との回線(回線L)を確立させる。次に、ステップS3において、制御部51は、ユーザAの使用言語情報を、ユーザ情報記憶部57から読み出し、通信制御部56を介して、ステップS1で入力された必要情報とともに、通訳サーバ17に送信する。
ステップS4において、制御部51は、送話部52、受話部54、および通信制御部56を制御し、通話処理を開始させる。これにより、送話部52は、マイクロフォン35から入力されたユーザAの音声を、音声信号に変換し、通信制御部56に供給する。通信制御部56は、送話部52から供給された音声信号を、通訳サーバ17に送信する。また、通信制御部56は、通訳サーバ17から送信されてきた音声信号を受信し、受話部54に供給する。受話部54は、通信制御部56を介して供給された音声信号を、スピーカ32から出力する。これにより、ユーザAは、通訳サーバ17の通訳処理による通訳を介して、ユーザBと通話することができる。
ステップS5において、制御部51は、ユーザAにより、例えば、キーボード34が操作され、携帯端末12との通話終了を示す信号(以下、通話終了信号と称する)が、キー入力制御部53から入力されるまで待機し、通話終了信号が入力されると、ステップS6に進み、通信制御部56を制御し、通話終了信号を通訳サーバ17に送信させ、通訳サーバ17との回線Lを切断させる。これにより、処理は、終了する。
図7のフローチャートは、この例における携帯端末12の通話処理の手順を表している。通訳サーバ17により携帯端末12に対する発呼動作が行われると、ステップS11において、携帯端末12の制御部61は、例えば、表示制御部65を制御し、通話開始要求があったことをユーザBに通知する。
ステップS12において、ユーザBが、ユーザAとの会話を開始するために、携帯端末2の所定の情報をキーボードを操作して入力すると、すなわち、通話開始要求に応答する信号が、例えば、キー入力制御部63から入力されると、ステップS13において、通信制御部66を制御し、通訳サーバ17との回線(回線P)を確立させる。
次に、ステップS14において、制御部61は、ユーザBの使用言語情報を、ユーザ情報記憶部67から読み出し、通信制御部66を介して、通訳サーバ17に送信する。
ステップS15乃至S17においては、図6のステップS4乃至S6における場合と同様の処理が実行されるので、その説明は省略する。
図8のフローチャートは、この例における通訳サーバ17の通訳処理の手順を示している。ステップS21において、通訳サーバ17の制御部71は、通信制御部73を制御し、携帯端末11との回線Lを確立させると、ステップS22において、携帯端末11より送信されてくる使用言語情報および必要情報(携帯端末12の電話番号などの情報)を受信させる。
ステップS23において、制御部71は、ステップS22で受信された使用言語情報(ユーザAの使用言語情報)を、使用言語情報記憶部72に記憶させる。ステップS24において、制御部71は、ステップS22で受信された携帯端末12の電話番号に対応して、通信制御部73を制御し、発呼動作させ、ステップS25において、携帯端末12との回線Pを確立させる。これにより、回線Lと回線Pがそれぞれ確立される。
次に、ステップS26において、制御部71は、通信制御部73を制御し、携帯端末12より送信されてくる使用言語情報(ユーザBの使用言語情報)を受信させ、それを、ステップS27において、使用言語情報記憶部72に記憶させる。すなわち、これにより、使用言語情報記憶部72には、ユーザAの使用言語情報と、ユーザBの使用言語情報が記憶される。
ステップS28において、制御部71は、通信制御部73により、携帯端末11または携帯端末12からの音声信号が受信されるまで待機し、音声信号が受信されたとき、ステップS29に進む。ステップS29において、制御部71は、ステップS28で受信された音声信号が、回線Lを介して送信されてきたか、または回線Pを介して送信されてきたかを判定する。すなわち、受信された音声信号が、携帯端末11から送信されてきたものか、または携帯端末12から送信されてきたものかが判定され、音声信号が携帯端末11から送信されてきたものであると判定された場合、ステップS30に進む。
ステップS30において、制御部71は、使用言語情報記憶部72に記憶されている、ユーザAの使用言語情報(日本語)およびユーザBの使用言語情報(英語)を把握し、この場合、日本語から英語への翻訳が実行されることを翻訳部74−1に通知し、ステップS31において、翻訳部74−1を制御し、翻訳処理を開始させる。ステップS31において開始された翻訳処理の詳細は、図9のフローチャートに示されている。
すなわち、ステップS41において、音声認識部82−1は、ステップS30で通知された翻訳される言語の種類(この例の場合、日本語)に対応する辞書Dを、辞書記憶部81−1から読み出し、それを参照して、ステップS28で受信された携帯端末11からの音声信号(ユーザAが発音した音声)を音声認識し、対応する言語(日本語)のテキストデータを生成する。
ステップS42において、機械翻訳部83−1は、ステップS30で通知された翻訳されるべき言語の種類(この例の場合、英語)に対応する辞書Dを、辞書記憶部81−1から読み出し、それを参照して、ステップS41で音声認識部82−1により生成されたテキストデータを解析し、変換(翻訳)する。
ステップS43において、音声合成部84−1は、ステップS30で通知された翻訳されるべき言語の種類に対応する辞書D(機械翻訳部83−1により参照された辞書D)を、辞書記憶部81−1から読み出し、それを参照して、機械翻訳部83−1により変換(翻訳)されたテキストデータを音声信号に変換する。その後、処理は終了され、図8のステップS32に進む。
ステップS32において、制御部71は、通信制御部73を制御し、ステップS31における処理により得られた音声信号を、携帯端末12に送信させる。
一方、ステップS29において、通信制御部73により、携帯端末12からの音声信号が受信されたと判定された場合、制御部71は、ステップS33に進み、使用言語情報記憶部72に記憶されている、ユーザAの使用言語情報(日本語)およびユーザBの使用言語情報(英語)を把握し、この場合、英語から日本語への翻訳が行われることを翻訳部74−2に通知し、ステップS34において、翻訳部74−2を制御し、翻訳処理を開始させる。ステップS34において開始された翻訳処理の詳細は、図10のフローチャートに示されている。ステップS51乃至S53においては、図9のステップS41乃至S43における場合と同様の処理が実行されるので、その詳細な説明は省略するが、これにより、ステップS28で受信された携帯端末12から送信されたユーザBの会話の内容(英語)は、日本語に翻訳される。
ステップS53における処理が完了したとき、処理は終了され、図8のステップS35に進む。
ステップS35において、制御部71は、通信制御部73を制御し、ステップS34における処理により得られた音声信号を、携帯端末11に送信させる。
ステップS32およびステップS35における処理が行われた後は、ステップS36に進み、制御部71は、通信制御部73により、通話終了信号が受信されたか否かを判定し、通話終了信号が受信されていないと判定した場合、ステップS28に戻り、それ以降の処理を実行する。ステップS36において、通話終了信号が受信されたと判定した場合、ステップS37に進み、制御部71は、通信制御部73を制御し、回線Lおよび回線Pを切断させる。
以上のように、携帯端末11との回線Lと、携帯端末12との回線Pをそれぞれ別に設定するようにしたので、例えば、ユーザAが発話中であっても、ユーザAの音声(音声信号)に基づく翻訳結果は、随時、携帯端末12に対して送信される。当然、ユーザBが発話中であっても、ユーザBの音声に基づく翻訳結果は、随時、携帯端末11に対して送信される。すなわち、あたかも、同時通訳されているかのようにして、ユーザAとユーザBは会話することができる。
図11は、本発明を適用した通訳通話システムの第2の実施の形態の構成例を表している。なお、図中、図1における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は適宜省略する。この例における通訳サーバ17は、図12に示すように、1個の翻訳部74−1のみを有している。
この例において、交換局16に出力された携帯端末11、携帯端末12、および通訳サーバ17からの音声信号は、マルチパーティコール(会議通話)される。すなわち、例えば、携帯端末11から送信された音声信号は、交換局16により、携帯端末12および通訳サーバ17の両方に供給される。同様に、交換局16により、携帯端末12からの音声信号は、携帯端末11および通訳サーバ17の両方に供給され、通訳サーバ17からの音声信号は、携帯端末11および携帯端末12の両方に供給される。
次に、第2の実施の形態における通訳通話処理の手順を、図13乃至図15のフローチャートを参照して説明する。
図13には、この例における携帯端末11の通話処理の手順が示されている。なお、通訳サーバ17(図12)の使用言語情報記憶部72には、ユーザAおよびユーザBの使用言語情報がすでに記憶されているものとする。そこで、ステップS61において、携帯端末11の制御部51は、交換局16を介して送信されてくる、携帯端末12または通訳サーバ17からの音声信号が、通信制御部56により受信されたか否かを判定し、受信されていないと判定した場合、ステップS62に進む。
次に、ステップS62において、制御部51は、ユーザAにより、送話を開始するための所定の操作が行われたか、例えば、キーボード34の所定のキー(以下、送話開始キーと称する)が操作されたか否かを判定し、送話開始キーが操作されたと判定した場合、ステップS63に進む。
ステップS63において、制御部51は、ユーザAのユーザIDを、ユーザ情報記憶部57から読み出し、通信制御部56を介して、通訳サーバ17に送信する。
次に、ステップS64において、制御部51は、送話部52および通信制御部56を制御し、送話処理を開始させる。これにより、送話部52は、マイクロフォン35から入力されたユーザAの音声を、音声信号に変換し、通信制御部56に供給する。通信制御部56は、送話部52から供給された音声信号を、交換局16に送信する。携帯端末11(通信制御部56)から送信された音声信号は、交換局16により、携帯端末12および通訳サーバ17に送信される。
ステップS61において、通信制御部56により、音声信号が受信されたと判定された場合、ステップS65進み、制御部51は、受話部54と通信制御部56を制御し、受話処理を開始させる。これにより、受話部54は、通信制御部56を介して供給された音声信号を、スピーカ32から出力する。
ステップS62において、送話開始キーが操作されていないと判定された場合、ステップS64における送話処理またはステップS65における受話処理が完了した場合、ステップS66に進み、制御部51は、通話終了信号が、例えば、キー入力制御部53から入力されたか否かを判定し、通話終了信号が入力されていないと判定した場合、ステップS61に戻り、それ以降の処理を実行する。また、通話終了信号が入力されたと判定された場合、ステップS67に進み、制御部51は、通信制御部56を制御し、通話終了信号を交換局16に送信させ、交換局16との回線を切断させる。これにより、処理は、終了される。
なお、この例においては、送話開始キーを操作した場合、ユーザAは、会話を必ず開始するものとする。
なお、この例における携帯端末12における通訳通話処理は、携帯端末11における場合と同様であるので、その説明は省略する。
以上のように、携帯端末11および携帯端末12において、音声信号が受信されているか否かが確認され(ステップS61)、音声信号が受信されている場合、受話処理のみが実行され(ステップS65)、また、音声信号が受信されておらず、ユーザにより送話開始キーが操作された場合においてのみ、送話処理が実行されるようにしたので、通信が破綻されずに、音声信号が1つの回線において送受信される。
図14は、この例における通訳サーバ17(図12)の通訳処理の手順を表している。ステップS81において、通訳サーバ17の制御部71は、通信制御部73により、ネットワーク15を介してユーザIDが受信されるまで待機し、それが受信されると、ステップS82において、受信されたユーザIDに対応して、翻訳される言語の種類を決定し、翻訳部74−1に通知する。このとき、制御部71は、ステップS81で受信されたユーザIDのユーザの使用言語情報と、そのユーザの通話相手とされるユーザの使用言語情報を把握して、翻訳される言語の種類と翻訳されるべき言語の種類を決定する。
例えば、ステップS81でユーザAのユーザIDが受信された場合、後述されるステップS83で携帯端末11からの音声信号が受信されるので、制御部71は、後述するステップS84で行われる翻訳処理は、この例の場合、日本語から英語への翻訳であることを翻訳部74−1に通知する。一方、ステップS81でユーザBのユーザIDが受信された場合、ステップS83で携帯端末12からの音声信号が受信されるので、制御部71は、ステップS84で行われる翻訳処理は、この例の場合、英語から日本語への翻訳であることを翻訳部74−1に通知する。
ステップS83において、制御部71は、通信制御部73を制御し、交換局16を介して送信されてくる音声信号を受信させる。次に、ステップS84において、制御部71は、翻訳部74−1を制御し、翻訳処理を開始させる。ステップS84において開始される翻訳処理の詳細は、図15のフローチャートに示されている。
すなわち、ステップS91において、音声認識部82−1は、ステップS82で通知された翻訳される言語の種類(ステップS81でユーザAのユーザIDが受信された場合、日本語、またユーザBのユーザIDが受信された場合、英語)に対応する辞書Dを、辞書記憶部81−1から読み出し、それを参照して、ステップS83で受信された音声信号を音声認識し、対応する言語のテキストデータを生成する。
ステップS92において、機械翻訳部83−1は、ステップS82で通知された翻訳されるべき言語の種類(ステップS81で、ユーザAのユーザIDが受信された場合、英語、またユーザBのユーザIDが受信された場合、日本語)に対応する辞書Dを、辞書記憶部81−1から読み出し、それを参照して、ステップS91で音声認識部82−1より生成されたテキストデータを解析し、変換(翻訳)する。
ステップS93において、音声合成部84−1は、ステップS82で通知された翻訳されるべき言語の種類に対応する辞書D(機械翻訳部83−1が参照した辞書D)を、辞書記憶部81−1から読み出し、それを参照して、機械翻訳部83−1により変換(翻訳)されたテキストデータを音声信号に変換する。その後、処理は終了され、図14のステップS85に進む。
ステップS85において、制御部71は、通信制御部73を制御し、ステップS84における処理により得られた音声信号を、交換局16に送信させる。これにより、通訳サーバ17からの音声信号は、交換局16により、マルチパーティコールされ、携帯端末11および携帯端末12に送信される。
次に、ステップS86において、制御部71は、通信制御部73により、通話終了信号が受信されたか否かを判定し、通話終了信号が受信されていないと判定した場合、ステップS81に戻り、それ以降の処理を実行する。一方、通話終了信号が受信された場合、制御部71は、通信制御部72を制御し、交換局16との回線を切断させ、処理を終了させる。
図16は、本発明を適用した通訳通話システムの第3の実施の形態の構成例を表している。なお、図中、図11における場合と対応する部分については、同一の符号を付してある。すなわち、交換局16に代えて、交換局101が設けられている。
この例において、通訳サーバ17は、第2の実施の形態における場合と同様に、図12に示す構成を有している。
図17は、交換局101の構成例を表している。通信路A設定部111は、交換局101の交換接続を模擬的に示した図18の実線で示される通信路Aを設定するための交換接続処理を実行する。通信路Aが設定されることより、携帯端末11からの音声信号は、通訳サーバ17に供給され、通訳サーバ17からの翻訳結果が携帯端末12に供給される。
通信路B設定部112は、図19の点線の矢印で示される通信路Bを設定するための交換接続処理を実行する。通信路Bが設定されることより、携帯端末12からの音声信号は、通訳サーバ17に供給され、通訳サーバ17からの翻訳結果が携帯端末11に供給される。
制御部113は、通信制御部114により受信される、例えば、図13のステップS63における処理により送信されてくる、ユーザIDやユーザ情報に基づいて、通信路A設定部111または通信路B設定部112を制御し、通信路Aまたは通信路Bを設定させる。
このように、通信路が交換接続(通信路Aから通信路B、または通信路Bから通信路A)されるようにしたので、通信が破綻されずに、音声信号が1つの回線において送受信され、かつ、ユーザAとユーザBとの会話は、第2の実施の形態における場合に比べ、より同時通訳に近いタイミングで通訳される。
なお、この場合、携帯端末11、携帯端末12、および通訳サーバ17の動作は、第2の実施の形態における場合と同様であり、その説明は省略する。
図20は、本発明を適用した通訳通話システムの第4の実施の形態を表している。なお、図中、図16における場合と対応する部分については、同一の符号を付してある。すなわち、携帯端末12および基地局14は取り除かれている。この例における通訳サーバ17は、第2の実施の形態における通訳サーバ17と同様の構成および機能を有している。
この例では、携帯端末11を共に利用できる場所にいるユーザAおよびユーザBとの会話が、携帯端末11を介して通訳サーバ17に送信され、そこで通訳されるようにするものである。すなわち、交互に行われる、ユーザAまたはユーザBの発話が、携帯端末11を介して通訳サーバ17に送信され、そこで翻訳される。そして、通訳サーバ17における翻訳結果が、再び携帯端末11に送信されるようにして、ユーザAおよびユーザBの会話を通訳するものである。
図21は、この例における携帯端末11の通話処理の手順を示している。なお、この例においては、ユーザ情報記憶部57には、ユーザAのユーザIDおよび使用言語情報の他、ユーザBのユーザIDおよび使用言語情報も記憶されているものとする。ステップS201において、携帯端末11の制御部51は、通信制御部56により、音声信号が受信されたか否かを判定し、受信されていないと判定した場合、ステップS202に進む。
ステップS202において、制御部51は、ユーザAの音声を送話するための所定の操作が行われたか、例えば、キーボード34の所定のキー(以下、ユーザA送話開始キーと称する)が操作されたか、またはユーザBの音声を送話するための所定の操作が行われたか、例えば、キーボード34の所定のキー(以下、ユーザB送話開始キーと称する)の操作されたか否かを判定する。なお、ユーザA送話開始キーとユーザB送話開始キーを個々に区別する必要がない場合、単に、ユーザ送話開始キーと記述する。
ステップS202において、ユーザ送話開始キーが操作されたと判定した場合、ステップS203に進み、制御部51は、操作されたユーザ送話開始キーに対応して、ユーザ情報記憶部57からユーザIDを読み出し、通信制御部56を介して、通訳サーバ17に送信する。例えば、ステップS202でユーザA送話開始キーが操作された場合、ここで、ユーザAのユーザIDが読み出されて送信される。また、ユーザB送話開始キーが操作された場合、ユーザBのユーザIDが読み出されて送信される。
ステップS204乃至S207における処理は、図13のステップS64乃至S67における場合と同様の処理が実行されるのでその説明は省略する。
この例における通訳サーバ17の動作は、図14に示した、第2の実施の形態における通訳サーバ17の動作と同様であるので、その詳細な説明は、省略する。
以上においては、携帯端末11および携帯端末12に記憶されている使用言語情報は、ユーザが使用する言語(翻訳される言語)の種類を示す情報とした場合を例として説明したが、例えば、翻訳されるべき言語の種類を示すようにすることもでき、また、このとき、その使用言語情報が、例えば、ユーザのいる場所により、変わるようにすることもできる。例えば、ユーザがアメリカにいる場合、使用言語情報は、英語を意味し、またフランスにいる場合、フランス語を意味するものになる。
なお、本明細書において、システムの用語は、複数の装置、手段などより構成される全体的な装置を意味するものとする。
また、上記したような処理を行うコンピュータプログラムをユーザに提供する提供媒体としては、磁気ディスク、CD-ROM、固体メモリなどの記録媒体の他、ネットワーク、衛星などの通信媒体を利用することができる。
本発明によれば、使用言語情報を記憶し、サーバに送信するようにしたので、容易に、通訳される音声信号を送信したり、通訳された音声信号を受信したりすることができる。
また、本発明によれば、使用言語情報に基づいて、通訳処理を実行するようにしたので、通話を妨げることなく、通訳する音声信号を送信したり、通訳した音声信号を送信することができる。
さらに本発明によれば、通信路を選択して設定するようにしたので、例えば、第1の端末からの信号の終了を待つことなく、通訳結果を第2の端末に送信することができる。
11 携帯端末, 12 携帯端末, 13 基地局, 14 基地局, 15 ネットワーク, 16 交換局, 17 通訳サーバ, 51 制御部, 52 送話部, 53 キー入力制御部, 54 受話部, 55 表示制御部, 56 通信制御部, 57 ユーザ情報記憶部, 61 制御部, 62 送話部, 63 キー入力制御部, 64 受話部, 65 表示制御部, 66 通信制御部, 67 ユーザ情報記憶部, 71 制御部, 72 使用言語情報記憶部, 73 通信制御部, 74 翻訳部, 81 辞書記憶部, 82 音声認識部, 83 機械翻訳部, 84 音声合成部, 101 交換局, 111 通信路A設定部, 112 通信路B設定部, 113 制御部, 114 通信制御部

Claims (2)

  1. 端末装置とサーバとからなる通訳通話システムであって、
    前記端末装置は、
    音声を収音して第1の音声信号を生成する収音手段と、
    送話を開始するための第1の操作が行なわれた場合、予め記憶されている第1のユーザIDを前記サーバに送信するユーザID送信手段と、
    前記第1のユーザIDを前記サーバに送信した後、前記サーバに前記第1の音声信号を送信する第1の音声信号送信手段と、
    前記サーバから送信されてきた、前記第1の音声信号に対して通訳処理が実行されて得られた第2の音声信号を受信する第1の音声信号受信手段と
    を備え、
    前記サーバは、
    前記端末装置から送信されてきた前記第1のユーザIDを受信し、前記第1のユーザIDに対して予め定められた言語を通訳前の言語とし、前記端末装置が位置する地域に対して予め定められている言語を通訳後の言語として決定する決定手段と、
    前記端末装置から送信されてきた前記第1の音声信号を受信する第2の音声信号受信手段と、
    前記決定手段による決定結果に基づいて、前記通訳前の言語が前記通訳後の言語に通訳されるように、前記第1の音声信号に対する前記通訳処理を実行し、前記第2の音声信号を生成する実行手段と、
    前記第2の音声信号を前記端末装置に送信する第2の音声信号送信手段と
    を備える通訳通話システム。
  2. 前記端末装置の前記ユーザID送信手段は、送話を開始するための第2の操作が行なわれた場合、予め記憶されている第2のユーザIDを前記サーバに送信し、
    前記端末装置の前記第1の音声信号送信手段は、前記第2のユーザIDを前記サーバに送信した後、前記サーバに前記第1の音声信号を送信し、
    前記サーバの前記決定手段は、前記端末装置から前記第2のユーザIDが送信されてきた場合、前記第2のユーザIDを受信し、前記端末装置が位置する地域に対して予め定められている言語を通訳前の言語とし、前記第1のユーザIDに対して予め定められた言語を通訳後の言語として決定する
    請求項1に記載の通訳通話システム。
JP2010086640A 2010-04-05 2010-04-05 通訳通話システム Expired - Fee Related JP5163682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010086640A JP5163682B2 (ja) 2010-04-05 2010-04-05 通訳通話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010086640A JP5163682B2 (ja) 2010-04-05 2010-04-05 通訳通話システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP1026799A Division JP2000206983A (ja) 1999-01-19 1999-01-19 情報処理装置および方法、並びに提供媒体

Publications (2)

Publication Number Publication Date
JP2010193495A JP2010193495A (ja) 2010-09-02
JP5163682B2 true JP5163682B2 (ja) 2013-03-13

Family

ID=42818963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010086640A Expired - Fee Related JP5163682B2 (ja) 2010-04-05 2010-04-05 通訳通話システム

Country Status (1)

Country Link
JP (1) JP5163682B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5461651B2 (ja) * 2011-05-24 2014-04-02 株式会社Nttドコモ サービスサーバ装置、サービス提供方法、サービス提供プログラム
US20160041969A1 (en) * 2013-03-13 2016-02-11 Nec Casio Mobile Communications, Ltd. Terminal device, translation system, communication control method, and program
JP2015060423A (ja) * 2013-09-19 2015-03-30 株式会社東芝 音声翻訳装置、音声翻訳方法およびプログラム
CN113726750B (zh) * 2021-08-18 2023-06-30 中国联合网络通信集团有限公司 语音实时翻译方法、装置和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222248A (ja) * 1994-02-08 1995-08-18 Hitachi Ltd 携帯型情報端末における音声情報の利用方式
JPH0983655A (ja) * 1995-09-14 1997-03-28 Fujitsu Ltd 音声対話システム
JPH09321894A (ja) * 1996-05-31 1997-12-12 Sony Corp 情報処理装置
JP3467160B2 (ja) * 1996-12-13 2003-11-17 ブラザー工業株式会社 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法

Also Published As

Publication number Publication date
JP2010193495A (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
US10255918B2 (en) Command and control of devices and applications by voice using a communication base system
US9280539B2 (en) System and method for translating speech, and non-transitory computer readable medium thereof
JP5355591B2 (ja) ナビゲーション装置
US20220334795A1 (en) System and method for providing a response to a user query using a visual assistant
JP5628749B2 (ja) 通訳端末及び通訳端末間の相互通信を用いた通訳方法
CN111783481B (zh) 耳机控制方法、翻译方法、耳机和云端服务器
JP5163682B2 (ja) 通訳通話システム
CN111325039A (zh) 基于实时通话的语言翻译方法、系统、程序和手持终端
KR20090097292A (ko) 사용자 영상을 이용한 음성인식 시스템 및 방법
JP2000206983A (ja) 情報処理装置および方法、並びに提供媒体
KR20110053749A (ko) 휴대단말에서 긴급모드 운용 방법 및 장치
KR101412657B1 (ko) 두 대 이상의 통역 단말기간 상호 통신을 이용한 통역 방법 및 장치
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
TWI695281B (zh) 翻譯系統、翻譯方法、以及翻譯裝置
CN109348048B (zh) 通话留言方法、终端和具有存储功能的装置
CN111554280A (zh) 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务系统
WO2008118038A1 (fr) Procédé d'échange de messages et dispositif permettant sa mise en oeuvre
CN111274828B (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端
KR20020020585A (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
KR102349620B1 (ko) 사용자 단말을 통해 통번역 서비스를 제공하는 방법 및 그 장치
JP2005331608A (ja) 情報処理装置および情報処理方法
KR101368268B1 (ko) 이동통신 단말기에서 음성인식을 이용한 단문메시지전송방법
KR100774481B1 (ko) 이동통신 단말기의 텍스트 변환 장치 및 방법
JP2000194700A (ja) 情報処理装置および方法、並びに提供媒体
JP2000151827A (ja) 電話音声認識システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees