JP6987124B2

JP6987124B2 - 通訳装置及び方法（ｄｅｖｉｃｅａｎｄｍｅｔｈｏｄｏｆｔｒａｎｓｌａｔｉｎｇａｌａｎｇｕａｇｅ）

Info

Publication number: JP6987124B2
Application number: JP2019506184A
Authority: JP
Inventors: サンギルアン; カンシクジュン; ヒョンテクヨン; ヒョクチョイ
Original assignee: ハイパーコネクトインコーポレイテッド
Priority date: 2016-08-02
Filing date: 2017-08-02
Publication date: 2021-12-22
Anticipated expiration: 2037-08-02
Also published as: JP2019533181A; EP3494489A4; KR101827773B1; US10824820B2; US20180039623A1; WO2018026200A1; EP3494489A1

Description

記載された実施例は、よりスムーズで、反応性が向上した使用者経験を提供することができる通訳装置及び方法に関する。

通信技術が発展し、電子装置が小型化するに伴って個人用端末が一般消費者に広く普及している。特に最近では、スマートフォンやスマートタブレットのような携帯用個人端末が広く普及している。前記端末の大部分は、通信機能を含んでいる。使用者は、端末を用いてインターネットで検索を行ったり、他の使用者とメッセージを送受信することができる。

また、小型カメラ技術、小型マイク技術、小型ディスプレイ技術及び小型スピーカー技術の発展に伴い、スマートフォンのようなほとんどの端末には、カメラ、マイク、ディスプレイ及びスピーカーが含まれている。使用者は、端末を用いて音声を録音したり、音声が含まれている動画を撮影することができる。使用者は、端末に含まれたスピーカーを介して前記録音された音声を確認するか、ディスプレイを介して前記撮影された動画を確認することができる。

また、使用者は、端末の通信機能を用いて、前記録音された音声または前記撮影された動画を他の使用者と共有することができる。使用者は、以前に録音された音声または以前に撮影された動画を他の使用者に伝送することができる。また、使用者は、端末によって現在録音されている音声または現在撮影されている動画をリアルタイムで他の使用者に伝送することができる。

また、同時に、前記他の使用者は、自分の端末によって現在録音されている音声または現在撮影されている動画をリアルタイムで前記使用者に伝送することができる。使用者の端末に含まれたディスプレイは、使用者の端末によって現在撮影されている動画及び他の使用者の端末によって現在撮影されている動画を同時に表示することができる。また、使用者の端末に含まれたスピーカーは、他の使用者の端末によって現在録音されている音声を同時に再生することができる。すなわち、使用者及び他の使用者は、各自の端末を用いて、互いに映像通話（ｖｉｄｅｏｃａｌｌ）を行うことができる。

前記使用者及び他の使用者は、互いにすでに知っている関係であることもあり、互いに知らない関係であることもある。前記使用者の端末及び前記他の使用者の端末を含む複数の端末は、サーバーに連結されることができる。サーバーは、前記使用者の端末及び前記他の使用者の端末の間を仲介することができる。したがって、前記使用者及び他の使用者は、互いに知らない関係であったとしても、サーバーの仲介を介して互いに映像通話をすることができる。

前記使用者が使用する言語は、前記他の使用者が使用する言語と互いに異なることができる。映像通話をする使用者が使用する言語が互いに異なる場合には、相手の音声が使用者の端末のスピーカーを介して再生されても、使用者は相手の話を聞き取れないことがある。

記載された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても各自が相手の話を聞き取るようにすることができる通訳装置及び方法が提供されることができる。

また、実施例によれば、よりスムーズな使用者経験を提供することができる通訳装置及び方法が提供されることができる。

また、実施例によれば、反応性が向上した使用者経験を提供することができる通訳装置及び方法が提供されることができる。

また、実施例によれば、改善された使用者経験を提供することができる通訳装置及び方法が提供されることができる。

実施例に係る通訳方法は、第１端末から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を連続的に表示する段階、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階、及び表示された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。

また、前記受信された音声認識結果を連続的に表示する段階は、前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含み、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、前記音声認識結果を表示する途中に、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得する段階を含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、前記音声認識結果を表示する途中に、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換する段階を含むことができる。

また、前記通訳方法は、前記第１端末から前記音声がエンコードされることによって生成された音声データを連続的に受信する段階、及び前記受信された音声データを用いて前記音声を連続的に再生する段階をさらに含み、前記受信された音声認識結果を連続的に表示する段階は、前記音声を再生する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含むことができる。

また、前記通訳方法は、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階以前に、前記第１言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第２言語の単語に連続的に置換する段階をさらに含むことができる。

また、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。

また、前記第２言語の単語に連続的に置換する段階は、前記第１言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１端末または第１サーバーから受信する段階、及び前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階を含むことができる。

また、前記第２言語の単語に連続的に置換する段階は、前記第１言語で表示された前記それぞれの単語を第１サーバーに伝送する段階、前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバーから受信する段階、及び前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階を含むことができる。

また、前記第２言語の単語に連続的に置換する段階は、第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階、もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第２言語の単語を前記第１データベースから取得する段階、及び前記第１言語で表示された前記照会された単語を前記取得された第２言語の単語に置換する段階を含むことができる。

また、前記第２言語の単語に連続的に置換する段階は、第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階、もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在しない場合、前記照会された単語を第１サーバーに伝送する段階、前記伝送された単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバーから受信する段階、前記伝送された単語及び前記受信された第２言語の単語を前記第１データベース内にキャッシュ（ｃａｃｈｅ）する段階、及び前記第１言語で表示された前記伝送された単語を前記受信された第２言語の単語に置換する段階をさらに含むことができる。

また、前記通訳方法は、前記第１言語の語順及び前記第２言語の語順の間の類似度を算出する段階をさらに含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階以前に、前記算出された類似度が基準値よりも大きければ、前記第１言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第２言語の単語に連続的に置換する段階をさらに含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。

また、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、前記翻訳文を前記第１端末または第２サーバーから受信する段階を含むことができる。

また、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、前記終結した文章を第２サーバーに伝送する段階、及び前記終結した文章の前記第２言語への翻訳文を前記第２サーバーから受信する段階を含むことができる。

また、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、第２データベースにおいて、前記終結した文章を照会する段階、及びもし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在する場合、前記照会の結果として、前記終結した文章に対応する前記第２言語への翻訳文を前記第２データベースから取得する段階を含むことができる。

また、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、第２データベースにおいて、前記終結した文章を照会する段階、もし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在しない場合、前記終結した文章を第２サーバーに伝送する段階、前記終結した文章の前記第２言語への翻訳文を前記第２サーバーから受信する段階、及び前記終結した文章及び前記受信された第２言語への翻訳文を前記第２データベース内にキャッシュ（ｃａｃｈｅ）する段階をさらに含むことができる。

他の実施例に係る通訳方法は、第１端末が第１言語の音声を連続的に受信する段階、前記受信されている音声を連続的にエンコードする段階、前記エンコードされた音声を第１サーバーに連続的に伝送する段階、前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を第２端末に連続的に伝送する段階、前記受信されている音声内から終結した文章を検出する段階、前記検出された文章に対応する前記第１言語のテキストを第２サーバーに伝送する段階、前記第２サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信する段階、及び前記受信された翻訳文を前記第２端末に伝送する段階を含むことができる。

また、前記受信されている音声を連続的にエンコードする段階は、前記音声を受信している途中に、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードする段階を含み、前記エンコードされた音声を第１サーバーに連続的に伝送する段階は、前記音声を受信している途中に、現在までエンコードされた前記音声のうちの少なくとも一部を前記第１サーバーに連続的に伝送する段階を含み、前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階は、前記音声を受信している途中に、前記第１サーバーから前記伝送されたエンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階を含むことができる。

また、前記受信された音声認識結果を第２端末に連続的に伝送する段階は、前記音声を受信している途中に、前記受信された音声認識結果を前記第２端末に連続的に伝送する段階を含み、前記受信されている音声内から終結した文章を検出する段階は、前記音声を受信している途中に、現在まで伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、前記検出された文章に対応する前記第１言語のテキストを第２サーバーに伝送する段階は、前記音声を受信している途中に、前記検出された少なくとも一つ以上の終結した文章に対応する前記第１言語のテキストを前記第２サーバーに伝送する段階を含むことができる。

また、前記第２サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信する段階は、前記音声を受信している途中に、前記第２サーバーから前記伝送されたテキストの前記第２言語への翻訳文を前記第２言語のテキストとして受信する段階を含み、前記受信された翻訳文を前記第２端末に伝送する段階は、前記音声を受信している途中に、前記受信された翻訳文を前記第２端末に伝送する段階を含むことができる。

また、前記通訳方法は、前記エンコードされた音声を前記第２端末に連続的に伝送する段階をさらに含み、前記受信された音声認識結果を第２端末に連続的に伝送する段階は、前記エンコードされた音声を伝送している途中に、前記受信された音声認識結果を前記第２端末に連続的に伝送する段階を含むことができる。

また他の実施例に係る通訳方法は、第１端末から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を第２端末に連続的に伝送する段階、前記受信された音声認識結果内から終結した文章を検出する段階、前記検出された文章の第２言語への翻訳文を取得する段階、及び前記取得された翻訳文を前記第２端末に伝送する段階を含むことができる。

また、前記受信された音声認識結果を第２端末に連続的に伝送する段階は、前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を前記第２端末に連続的に伝送する段階を含み、前記受信された音声認識結果内から終結した文章を検出する段階は、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、前記検出された文章の第２言語への翻訳文を取得する段階は、前記検出された少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得する段階を含み、前記取得された翻訳文を前記第２端末に伝送する段階は、前記音声認識結果を受信する途中に、前記取得された翻訳文を前記第２端末に伝送する段階を含むことができる。

実施例に係る通訳装置は、第１端末から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する通信部、及び前記受信された音声認識結果を連続的に表示する表示部を含み、前記通信部は、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得し、前記表示部は、表示された前記終結した文章を前記取得された翻訳文に置換することができる。

他の実施例に係る通訳装置は、第１言語の音声を連続的に受信する入力部、前記受信されている音声を連続的にエンコードする制御部、及び前記エンコードされた音声を第１サーバーに連続的に伝送する通信部を含み、前記通信部は、前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信し、前記通信部は、前記受信された音声認識結果を第２端末に連続的に伝送し、前記制御部は、前記受信されている音声内から終結した文章を検出し、前記通信部は、前記検出された文章に対応する前記第１言語のテキストを第２サーバーに伝送し、前記通信部は、前記第２サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信し、前記通信部は、前記受信された翻訳文を前記第２端末に伝送することができる。

記載された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても、各自が相手の話を聞き取ることができる。

また、実施例によれば、よりスムーズな使用者経験が提供されることができる。

また、実施例によれば、反応性が向上した使用者経験が提供されることができる。

また、実施例によれば、改善された使用者経験が提供されることができる。

実施例に係る通訳装置が動作する環境を示すネットワーク構成図である。実施例に係る通訳装置の構成を示すブロック図である。実施例に係る第１端末によって通訳方法が行われる過程を示すフローチャートである。実施例に係る第１端末が第１言語の音声を連続的に受信する段階を説明するための参考図である。実施例に係る第２端末によって通訳方法が行われる過程を示すフローチャートである。実施例に係る受信された音声認識結果を連続的に表示する段階を説明するための参考図である。実施例に係る受信された音声認識結果を連続的に表示する段階を説明するための他の参考図である。実施例に係る受信された音声認識結果を連続的に表示する段階を説明するためのまた他の参考図である。実施例に係る表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。他の実施例に係る表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。また他の実施例に係る表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。実施例に係る表示された終結した文章を取得された翻訳文に置換する段階を説明するための参考図である。実施例に係る受信された音声認識結果を連続的に表示する段階を説明するためのまた他の参考図である。実施例に係る表示された終結した文章を取得された翻訳文に置換する段階を説明するための他の参考図である。他の実施例に係る第２端末によって通訳方法が行われる過程を示すフローチャートである。実施例により音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。実施例に係る音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階を説明するための参考図である。実施例に係る音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階を説明するための他の参考図である。実施例に係る音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階を説明するためのまた他の参考図である。他の実施例により音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。また他の実施例により音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。また他の実施例により音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。実施例に係る第２言語の単語に置換された終結した文章を取得された翻訳文に置換する段階を説明するための参考図である。また他の実施例に係る第２端末によって通訳方法が行われる過程を示すフローチャートである。実施例に係るサーバーによって通訳方法が行われる過程を示すフローチャートである。

本発明の利点及び特徴、そしてそれらを達成する方法は、添付した図面と共に詳細に後述されている実施例を参照すると明確になる。しかし、本発明は、以下で開示される実施例に限定されるものではなく、互いに異なる様々な形態で具現されるものであり、単に本実施例は、本発明の開示が完全になるようにして、本発明が属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項の範疇によって定義されるだけである。明細書全体にわたって同一の参照符号は、同一の構成要素を指す。

「第１」または「第２」などが様々な構成要素を記述するために使用されるが、このような構成要素は、前記のような用語によって制限されるものではない。前記のような用語は、単に１つの構成要素を他の構成要素と区別するために使用することができる。したがって、以下に言及される第１構成要素は、本発明の技術的思想内で第２構成要素であることもできる。

本明細書で使用される用語は、実施例を説明するためのものであって、本発明を制限しようとするものではない。本明細書において、単数形は、文句で特に言及しない限り、複数形も含む。明細書で使用される「含む（ｃｏｍｐｒｉｓｅｓ）」または「含んでいる（ｃｏｍｐｒｉｓｉｎｇ）」は、言及された構成要素または段階が１つ以上の他の構成要素または段階の存在または追加を排除しないという意味を内包する。

他の定義がなければ、本明細書で使用されるすべての用語は、本発明が属する技術分野における通常の知識を有する者に共通的に理解され得る意味として解釈されることができる。また、一般的に使用される辞書に定義されている用語は、明白に定義されていない限り理想的にまたは過度に解釈されない。

以下では、図１〜図２５を参照して、実施例に係る通訳装置１００、１５０及び方法について詳細に説明することにする。

図１は、実施例に係る通訳装置１００、１５０が動作する環境を示すネットワーク構成図である。図１を参照すると、通訳装置１００、１５０が動作する環境は、第１通訳装置１００、及び前記第１通訳装置１００と互いに連結された第２通訳装置１５０を含むことができる。

他の実施例によれば、前記通訳装置１００、１５０が動作する環境は、前記第１通訳装置１００または前記第２通訳装置１５０と互いに連結された第１サーバー２００をさらに含むことができる。また他の実施例によれば、前記通訳装置１００、１５０が動作する環境は、前記第１通訳装置１００または前記第２通訳装置１５０と互いに連結された第２サーバー３００をさらに含むことができる。また他の実施例によれば、前記通訳装置１００、１５０が動作する環境は、前記第１通訳装置１００または前記第２通訳装置１５０と互いに連結された第３サーバー４００をさらに含むことができる。

前記通訳装置１００、１５０が動作する環境は、前記第１サーバー２００〜第３サーバー４００のうちのいずれか一つも含まないことができる。他の実施例によれば、前記通訳装置１００、１５０が動作する環境は、前記第１サーバー２００〜第３サーバー４００のうちの少なくとも一部を含むことができる。

第１通訳装置１００は、端末であることができる。以下では、説明の便宜のために、第１通訳装置１００を指す用語として、第１通訳装置１００及び第１端末１００を混用することにする。第１端末１００は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、スマートフォン、スマートタブレット、スマートウォッチ、移動端末、デジタルカメラ、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ）、または携帯用電子機器などであることができる。第１端末１００は、プログラムまたはアプリケーションを実行することができる。

第１端末１００は、通信網に連結されることができる。第１端末１００は、前記通信網を介して、外部の他の装置と互いに連結されることができる。第１端末１００は、互いに連結された他の装置にデータを伝送したり、前記他の装置からデータを受信することができる。

第１端末１００と連結された通信網は、有線通信網、無線通信網、または複合通信網を含むことができる。通信網は、３Ｇ、ＬＴＥ、またはＬＴＥ−Ａなどのような移動通信網を含むことができる。通信網は、ワイファイ（Ｗｉ−Ｆｉ）、ＵＭＴＳ／ＧＰＲＳ、またはイーサネット（Ｅｔｈｅｒｎｅｔ）（登録商標）などのような有線または無線通信網を含むことができる。通信網は、マグネチック保安送信（ＭＳＴ，ＭａｇｎｅｔｉｃＳｅｃｕｒｅＴｒａｎｓｍｉｓｓｉｏｎ）、ＲＦＩＤ（ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩＤｅｎｔｉｆｉｃａｔｉｏｎ）、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）、ジグビー（ＺｉｇＢｅｅ）、Ｚ−Ｗａｖｅ、ブルートゥース（Ｂｌｕｅｔｏｏｔｈ）（登録商標）、低電力ブルートゥース（ＢＬＥ，ＢｌｕｅｔｏｏｔｈＬｏｗＥｎｅｒｇｙ）、または赤外線通信（ＩＲ，ＩｎｆｒａＲｅｄｃｏｍｍｕｎｉｃａｔｉｏｎ）などのような近距離通信網を含むことができる。通信網は、近距離ネットワーク（ＬＡＮ，ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ，ＭｅｔｒｏｐｏｌｉｔａｎＡｒｅａＮｅｔｗｏｒｋ）、またはワイド・エリア・ネットワーク（ＷＡＮ，ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などを含むことができる。

図２は、実施例に係る通訳装置１００、１５０の構成を示すブロック図である。図２を参照すると、実施例に係る通訳装置１００、１５０は、入力部１０１、制御部１０２、保存部１０３、通信部１０４、及び表示部１０５を含むことができる。

入力部１０１は、外部から信号を受信することができる。入力部１０１は、通訳装置１００、１５０の使用者から信号を受信することができる。また、入力部１０１は、外部装置から信号を受信することができる。

入力部１０１は、例えば、マイク、カメラ、キーボード、マウス、トラックボール、タッチスクリーン、ボタン、スイッチ、センサー、ネットワークインターフェース、または、その他の入力装置を含むことができる。入力部１０１は、入力部１０１に含まれたマイクを介して外部から音声を受信することができる。入力部１０１は、通訳装置１００、１５０の使用者から音声を受信することができる。また、入力部１０１は、外部の音声再生装置から音声を受信することができる。

制御部１０２は、通訳装置１００、１５０の動作を制御することができる。制御部１０２は、通訳装置１００、１５０に含まれたそれぞれの構成要素と互いに連結されることができる。制御部１０２は、通訳装置１００、１５０に含まれたそれぞれの構成要素の動作を制御することができる。制御部１０２は、入力部１０１によって受信された信号に対する応答として、通訳装置１００、１５０の動作を制御することができる。

また、制御部１０２は、信号を処理することができる。制御部１０２は、入力部１０１によって受信された信号を処理することができる。例えば、制御部１０２は、入力部１０１に含まれたマイクを介して受信された音声を処理することができる。

また、制御部１０２は、演算を行うことができる。制御部１０２は、入力部１０１によって受信された信号に基づいて演算を行うことができる。制御部１０２は、入力部１０１によって受信された信号または保存部１０３に保存されたデータを用いて演算を行うことができる。例えば、制御部１０２は、入力部１０１に含まれたマイクを介して受信された音声をエンコードすることができる。制御部１０２は、演算結果が保存部１０３に保存されるように制御することができる。制御部１０２は、演算結果が表示部１０５によって表示されるように制御することができる。

制御部１０２は、例えば、中央処理装置（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ，ＣＰＵ）、グラフィック処理装置（ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ，ＧＰＵ）、マイクロコントローラーユニット（ＭｉｃｒｏＣｏｎｔｒｏｌｌｅｒＵｎｉｔ，ＭＣＵ）、またはマイクロプロセッサ（ｍｉｃｒｏｐｒｏｃｅｓｓｏｒ）を含むことができる。

保存部１０３は、データを保存することができる。保存部１０３は、制御部１０２によって行われた演算結果を保存することができる。例えば、保存部１０３は、制御部１０２によってエンコードされた音声を保存することができる。保存部１０３は、通信部１０４を介して外部に伝送するデータを保存したり、通信部１０４を介して外部から受信されたデータを保存することができる。

保存部１０３は、揮発性メモリーまたは非揮発性メモリーを含むことができる。保存部１０３は、例えば、フラッシュ（ｆｌａｓｈ）メモリー、ＲＯＭ、ＲＡＭ、ＥＥＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ハードディスクドライブ（ＨＤＤ，ＨａｒｄＤｉｓｋＤｒｉｖｅ）、またはレジスター（ｒｅｇｉｓｔｅｒ）などを含むことができる。保存部１０３は、例えば、ファイルシステム、データベース、またはエンベデッドデータベースなどを含むことができる。

通信部１０４は、外部にデータを伝送したり、外部からデータを受信することができる。通信部１０４は、他の通訳装置１００、１５０、第１サーバー２００、第２サーバー３００、または第３サーバー４００にデータを伝送することができる。通信部１０４は、他の通訳装置１００、１５０、第１サーバー２００、第２サーバー３００、または第３サーバー４００からデータを受信することができる。通信部１０４は、制御部１０２によって行われた演算結果を外部に伝送することができる。また、通信部１０４は、保存部１０３に保存されたデータを外部に伝送することができる。

通信部１０４によって伝送されるデータまたは通信部１０４によって受信されたデータは、保存部１０３に保存されることができる。例えば、通信部１０４は、保存部１０３に保存されたエンコードされた音声を第１サーバー２００に伝送することができる。また、通信部１０４は、前記送信に対する応答として、前記第１サーバー２００から前記エンコードされた音声に対する音声認識結果を受信することができる。

通信部１０４は、例えば、３Ｇモジュール、ＬＴＥモジュール、ＬＴＥ−Ａモジュール、Ｗｉ−Ｆｉモジュール、ワイギグ（ＷｉＧｉｇ）モジュール、ＵＷＢ（ＵｌｔｒａＷｉｄｅＢａｎｄ）モジュール、またはＬＡＮカードなどのような遠距離用のネットワークインターフェースを含むことができる。また、通信部１０４は、マグネチック保安送信（ＭＳＴ，ＭａｇｎｅｔｉｃＳｅｃｕｒｅＴｒａｎｓｍｉｓｓｉｏｎ）モジュール、ブルートゥースモジュール、ＮＦＣモジュール、ＲＦＩＤモジュール、ジグビー（ＺｉｇＢｅｅ）モジュール、Ｚ−Ｗａｖｅモジュール、または赤外線モジュールなどのような近距離用のネットワークインターフェースを含むことができる。また、通信部１０４は、その他のネットワークインターフェースを含むことができる。

表示部１０５は、画面を表示することができる。制御部１０２は、表示部１０５が画面を表示するように表示部１０５を制御することができる。表示部１０５は、使用者インターフェースを表示することができる。表示部１０５は、使用者からの入力に対する応答として、他の画面を表示することができる。

表示部１０５は、データを表示することができる。表示部１０５は、制御部１０２によって行われた演算結果を表示することができる。表示部１０５は、保存部１０３に保存されたデータを表示することができる。表示部１０５は、通信部１０４によって受信されたデータを表示することができる。例えば、表示部１０５は、第１サーバー２００から受信された音声認識結果を表示することができる。

表示部１０５は、例えば、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）、またはＰＤＰ（ＰｌａｓｍａＤｉｓｐｌａｙＰａｎｅｌ）などの平板表示装置を含むことができる。表示部１０５は、曲面ディスプレイまたはフレクシブルディスプレイ（ｆｌｅｘｉｂｌｅｄｉｓｐｌａｙ）を含むことができる。表示部１０５は、タッチスクリーンを含むことができる。

第２通訳装置１５０は、端末であることができる。以下では、説明の便宜のために、第２通訳装置１５０を指す用語として、第２通訳装置１５０及び第２端末１５０を混用することにする。第２端末１５０は、第１端末１００と互いに同じ種類の端末であることもでき、互いに異なる種類の端末であることもできる。第２端末１５０は、プログラムまたはアプリケーションを実行することができる。

第２端末１５０は、通信網に連結されることができる。第２端末１５０は、前記通信網を介して外部の他の装置と互いに連結されることができる。第２端末１５０は、互いに連結された他の装置にデータを伝送したり、前記他の装置からデータを受信することができる。

第２端末１５０は、前記第１端末１００と互いに連結されることができる。第２端末１５０は、前記通信網を介して前記第１端末１００と互いに連結されることができる。第２端末１５０は、第１端末１００にデータを伝送したり、第１端末１００からデータを受信することができる。

互いに連結された第１端末１００及び第２端末１５０は、互いにメッセージ、ファイル、音声データ、映像、または動画などを送受信することができる。また、第１端末１００及び第２端末１５０は、互いに音声通話または映像通話（ｖｉｄｅｏｃａｌｌ）をすることができる。

第１端末１００及び第２端末１５０は、互いに直接データを送受信することができる。また、第１端末１００及び第２端末１５０は、第１サーバー２００、第２サーバー３００、第３サーバー４００、または他の仲介装置を経由して、互いにデータを送受信することができる。

第１端末１００の使用者が使用する言語及び第２端末１５０の使用者が使用する言語は、互いに同一または互いに異なることができる。第１端末１００の使用者が使用する言語は、第１言語であることができる。第１言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。第２端末１５０の使用者が使用する言語は、第２言語であることができる。第２言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。第１言語及び第２言語は、互いに同一または互いに異なることができる。

第１サーバー２００は、第１端末１００または第２端末１５０と互いに連結されることができる。第１サーバー２００が第１端末１００と互いに連結された場合、第１サーバー２００は、第１端末１００と通信網を介して互いにデータを送受信することができる。第１サーバー２００が第２端末１５０と互いに連結された場合、第１サーバー２００は、第２端末１５０と通信網を介して互いにデータを送受信することができる。

第１サーバー２００は、辞書（ｄｉｃｔｉｏｎａｒｙ）サーバーであることができる。第１サーバー２００は、辞書サービスを提供することができる。第１サーバー２００は、第１端末１００または第２端末１５０から第１言語の単語を受信することができる。第１サーバー２００は、前記受信された第１言語の単語を用いて、前記第１言語の単語の意味と互いに同一または類似の意味を有する第２言語の単語を取得することができる。第１サーバー２００は、前記取得された第２言語の単語を第１端末１００または第２端末１５０に伝送することができる。

第２サーバー３００は、第１端末１００または第２端末１５０と互いに連結されることができる。第２サーバー３００が第１端末１００と互いに連結された場合、第２サーバー３００は、第１端末１００と通信網を介して互いにデータを送受信することができる。第２サーバー３００が第２端末１５０と互いに連結された場合、第２サーバー３００は、第２端末１５０と通信網を介して互いにデータを送受信することができる。

第２サーバー３００は、翻訳サーバーであることができる。第２サーバー３００は、翻訳サービスを提供することができる。第２サーバー３００は、第１端末１００または第２端末１５０から第１言語の文章を受信することができる。第２サーバー３００は、前記受信された第１言語の文章を用いて、前記文章の第２言語への翻訳文を取得することができる。第２サーバー３００は、前記取得された翻訳文を第１端末１００または第２端末１５０に伝送することができる。

第３サーバー４００は、第１端末１００または第２端末１５０と互いに連結されることができる。第３サーバー４００が第１端末１００と互いに連結された場合、第３サーバー４００は、第１端末１００と通信網を介して互いにデータを送受信することができる。第３サーバー４００が第２端末１５０と互いに連結された場合、第３サーバー４００は、第２端末１５０と通信網を介して互いにデータを送受信することができる。

第３サーバー４００は、音声認識サーバーであることができる。第３サーバー４００は、音声認識サービスを提供することができる。第３サーバー４００は、第１端末１００または第２端末１５０からエンコードされた音声を受信することができる。第３サーバー４００は、前記エンコードされた音声を用いて音声認識を行うことができる。第３サーバー４００は、前記音声認識の結果として、前記エンコードされた音声をテキストに変換することができる。第３サーバー４００は、前記変換されたテキストを第１端末１００または第２端末１５０に伝送することができる。

以下では、図３〜図２５を参照して、実施例に係る通訳方法内での通訳装置１００、１５０のより具体的な動作について詳細に説明することにする。

図３は、実施例に係る第１端末１００によって通訳方法が行われる過程を示すフローチャートである。図３を参照すると、実施例に係る通訳方法においては、まず、第１端末１００が第１言語の音声を連続的に受信する段階Ｓ１００が行われることができる。

第１端末１００の使用者は、第１端末１００に向かって第１言語で話をすることができる。また、外部の再生装置は、第１端末１００に向かって第１言語の音声を再生することができる。前記第１言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。

図４は、実施例に係る第１端末１００が第１言語の音声を連続的に受信する段階Ｓ１００を説明するための参考図である。図４に示すように、第１端末１００の使用者は、第１端末１００に向かって英語で話をすることができる。すなわち、前記第１言語は、英語であることができる。使用者は、「Ｉｌｏｖｅｙｏｕ. Ｄｏｙｏｕｌｏｖｅｍｅ？」のように英語の２つの文章を話すことができる。

第１端末１００は、第１端末１００の入力部１０１に含まれたマイクを介して前記第１言語の音声を連続的に受信することができる。第１端末１００は、使用者が話すのと同時に前記音声を受信することができる。使用者が話をすると、第１端末１００は、前記音声をリアルタイムで受信することができる。使用者が継続して話をする場合、第１端末１００は、前記音声を継続して受信することができる。

再び図３を参照すると、次に、前記受信されている音声を連続的にエンコードする段階Ｓ１１０が行われることができる。第１端末１００の制御部１０２は、入力部１０１によって連続的に受信されている前記音声をエンコードすることができる。前記音声が受信されている途中に、第１端末１００の制御部１０２は、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードすることができる。

制御部１０２は、前記音声をエンコードすることによって、アナログ信号である前記音声をデジタル信号であるエンコードされた音声に変換することができる。前記エンコードされた音声は、保存部１０３に保存されることができる。制御部１０２は、アコースティックエコーキャンセレーション（ａｃｏｕｓｔｉｃｅｃｈｏｃａｎｃｅｌｌａｔｉｏｎ）を行うことによって、エコー現象を減らすことができる。

制御部１０２は、前記受信されている音声を連続的にエンコードすることができる。制御部１０２は、前記音声が受信されると同時に前記音声をエンコードすることができる。前記音声が受信されると、制御部１０２は、前記音声をリアルタイムでエンコードすることができる。前記音声が継続して受信されている場合、制御部１０２は、前記音声を継続してエンコードすることができる。

次に、前記エンコードされた音声を第３サーバー４００に連続的に伝送する段階Ｓ１２０が行われることができる。第３サーバー４００は、音声認識サービスを提供するサーバーであることができる。前記音声が受信されている途中に、第１端末１００の通信部１０４は、現在までにエンコードされた前記音声のうちの少なくとも一部を前記第３サーバー４００に連続的に伝送することができる。

第１端末１００の通信部１０４は、前記エンコードされた音声を第３サーバー４００に連続的に伝送することができる。通信部１０４は、前記音声がエンコードされると同時に前記エンコードされた音声を第３サーバー４００に伝送することができる。前記音声がエンコードされると、通信部１０４は、前記エンコードされた音声をリアルタイムで伝送することができる。前記音声が継続してエンコードされている場合、通信部１０４は、前記エンコードされた音声を継続して伝送することができる。

また、追加的に、第１端末１００の通信部１０４は、前記エンコードされた音声を第２端末１５０に連続的に伝送することができる。通信部１０４は、前記音声がエンコードされると同時に前記エンコードされた音声を第２端末１５０に伝送することができる。第２端末１５０は、第１端末１００から前記エンコードされた音声を連続的に受信することができる。第２端末１５０は、前記受信されたエンコードされた音声を連続的にデコードすることができる。第２端末１５０は、前記デコードされた音声を連続的に再生することができる。

次に、前記第３サーバー４００から前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階Ｓ１３０が行われることができる。前記エンコードされた音声の送信に対する応答として、第１端末１００の通信部１０４は、第３サーバー４００から前記エンコードされた音声に対する音声認識結果を受信することができる。前記音声が受信されている途中に、第１端末１００の通信部１０４は、第１サーバー２００から前記音声認識結果を連続的に受信することができる。

通信部１０４は、前記音声認識結果を前記第１言語のテキストとして受信することができる。前記第１言語が英語である場合、通信部１０４は、前記音声認識結果として英語のテキストを受信することができる。

第３サーバー４００は、前記エンコードされた音声が認識されると同時に、前記音声認識結果を第１端末１００に伝送することができる。前記エンコードされた音声が認識されると、第３サーバー４００は、前記音声認識結果をリアルタイムで伝送することができる。前記エンコードされた音声が継続して認識されている場合、第３サーバー４００は、前記音声認識結果を継続して伝送することができる。第１端末１００の通信部１０４は、前記音声認識結果を前記第３サーバー４００から連続的に受信することができる。

次に、前記受信された音声認識結果を第２端末１５０に連続的に伝送する段階Ｓ１４０が行われることができる。前記音声が受信されている途中に、第１端末１００の通信部１０４は、前記受信された音声認識結果を前記第２端末１５０に連続的に伝送することができる。前記エンコードされた音声を伝送している途中に、通信部１０４は、前記音声認識結果を第２端末１５０に連続的に伝送することができる。

第１端末１００の通信部１０４は、前記受信された音声認識結果を第２端末１５０に連続的に伝送することができる。通信部１０４は、前記音声認識結果が受信されると同時に、前記音声認識結果を第２端末１５０に伝送することができる。前記音声認識結果が受信されると、通信部１０４は、前記音声認識結果をリアルタイムで伝送することができる。前記音声認識結果が継続して受信されている場合、通信部１０４は、前記音声認識結果を継続して伝送することができる。

第２端末１５０は、第１端末１００から前記音声認識結果を連続的に受信することができる。第２端末１５０は、前記受信された音声認識結果を連続的に表示することができる。

次に、前記受信されている音声内から終結した文章を検出する段階Ｓ１５０が行われることができる。終結した文章とは、一つの完全な文章が完成するために必要なすべての文章成分を含む文章を指すことができる。前記音声が受信されている途中に、第１端末１００の制御部１０２は、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。前記音声認識結果が第２端末１５０に連続的に伝送される途中に、第１端末１００の制御部１０２は、現在までに伝送された前記音声認識結果内から少なくとも一つ以上の終結した文章を検出することができる。

例えば、現在まで第２端末１５０に伝送された音声認識結果が図４の２つの文章中で「Ｉｌｏｖｅｙｏｕ. Ｄｏ」の部分であると仮定することにする。制御部１０２は、前記の部分で一つの終結した文章として「Ｉｌｏｖｅｙｏｕ.」を検出することができる。

再び図３を参照すると、次に、前記検出された文章に対応する前記第１言語のテキストを第２サーバー３００に伝送する段階Ｓ１６０が行われることができる。前記第２サーバー３００は、翻訳サービスを提供するサーバーであることができる。第１端末１００の通信部１０４は、前記検出された文章を第１言語のテキストとして、第２サーバー３００に伝送することができる。前記音声が受信されている途中に、通信部１０４は、前記検出された少なくとも一つ以上の終結した文章を第２サーバー３００に伝送することができる。例えば、通信部１０４は、英語のテキスト「Ｉｌｏｖｅｙｏｕ.」を第２サーバー３００に伝送することができる。

次に、前記第２サーバー３００から前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信する段階Ｓ１７０が行われることができる。第２サーバー３００は、第１言語の文章を前記文章の第２言語への翻訳文に変換することができる。第２サーバー３００は、前記変換された翻訳文を第１端末１００に伝送することができる。

前記検出された文章の送信に対する応答として、第１端末１００の通信部１０４は、第２サーバー３００から前記検出された文章の第２言語への翻訳文を受信することができる。前記音声が受信されている途中に、第１端末１００の通信部１０４は、第２サーバー３００から前記伝送されたテキストの第２言語への翻訳文を受信することができる。通信部１０４は、前記第２言語への翻訳文として第２言語のテキストを受信することができる。

前記第２言語は、例えば、韓国語であることができる。通信部１０４は、「Ｉｌｏｖｅｙｏｕ.」の第２言語への翻訳文として、「私はあなたを愛しています。」を受信することができる。

次に、前記受信された翻訳文を前記第２端末１５０に伝送する段階Ｓ１８０が行われることができる。第１端末１００の通信部１０４は、前記受信された翻訳文を第２端末１５０に伝送することができる。前記音声が受信されている途中に、第１端末１００の通信部１０４は、前記受信された翻訳文を第２端末１５０に伝送することができる。

第２端末１５０は、第１端末１００から前記第２言語への翻訳文を受信することができる。第２端末１５０は、第１言語で表示されていた音声認識結果に含まれた前記終結した文章を前記受信された翻訳文に置換することができる。

図５は、実施例に係る第２端末１５０によって通訳方法が行われる過程を示すフローチャートである。図５を参照すると、まず、第１端末１００から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階Ｓ２００が行われることができる。

第１端末１００は、第３サーバー４００から受信された音声認識結果を第２端末１５０に連続的に伝送する段階Ｓ１４０を行うことができる。前記音声認識結果の送信に対応して、第２端末１５０の通信部１０４は、第１端末１００から前記音声認識結果を連続的に受信することができる。第１端末１００が前記音声認識結果を継続して伝送する場合、第２端末１５０は、前記音声認識結果を継続して受信することができる。第２端末１５０の保存部１０３は、前記受信された音声認識結果を保存することができる。

次に、前記受信された音声認識結果を連続的に表示する段階Ｓ２１０が行われることができる。前記音声認識結果が受信される途中に、第２端末１５０の表示部１０５は、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示することができる。

第２端末１５０の表示部１０５は、前記音声認識結果を連続的に表示することができる。表示部１０５は、前記音声認識結果が受信されると同時に、前記音声認識結果を表示することができる。前記音声認識結果が受信されると、表示部１０５は、前記音声認識結果をリアルタイムで表示することができる。前記音声認識結果が継続して受信されている場合、表示部１０５は、前記音声認識結果を継続して表示することができる。

また、第２端末１５０の通信部１０４は、第１端末１００から前記音声がエンコードされることによって生成された音声データを連続的に受信することができる。第２端末１５０は、前記受信された音声データをデコードすることができる。第２端末１５０は、前記デコードされた音声を連続的に再生することができる。前記音声が再生する途中に、第２端末１５０の表示部１０５は、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示することができる。

これにより、前記音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する前であっても、第１端末１００の使用者が話した言葉がリアルタイムで第２端末１５０に表示されることができる。前記第１言語の単語の発音と前記第２言語の単語の発音は、互いに全く異なるにもかかわらず、第１言語の単語の表記と前記単語に対応する第２言語の単語の表記が互いに類似していることがあり得る。したがって、第１端末１００の使用者が音声を介して話した言葉を第２端末１５０の使用者が全く理解できない場合であっても、第２端末１５０の使用者は、第２端末１５０に表示された第１言語の単語から助けを受けることができる。

したがって、実施例によれば、前記音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する前であっても、第１端末１００の使用者が話した言葉の意味を第２端末１５０の使用者がより早く理解することができる。すなわち、第１端末１００の使用者が話した言葉の意味を第２端末１５０の使用者が理解できるまで第２端末１５０の使用者が待たなければならない時間が短縮されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。

図６〜図８は、実施例に係る受信された音声認識結果を連続的に表示する段階Ｓ２１０を説明するための参考図である。図６を参照すると、第２端末１５０は、英語の音声の音声認識結果として、「Ｉ」を受信することができる。第２端末１５０の表示部１０５は、「Ｉ」を表示することができる。図７を参照すると、第２端末１５０は、音声認識結果として「Ｌｏｖｅ」を追加的に受信することができる。第２端末の表示部１０５は、「Ｉｌｏｖｅ」を表示することができる。図８を参照すると、第２端末１５０は、音声認識結果として「ｙｏｕｄｏｙｏｕ」を追加的に受信することができる。第２端末の表示部１０５は、「Ｉｌｏｖｅｙｏｕｄｏｙｏｕ」を表示することができる。

再び図５を参照すると、次に、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ２２０が行われることができる。前記音声認識結果が表示される途中に、第２端末１５０は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得することができる。

第１端末１００は、前記音声認識結果に含まれた終結した文章の第２言語への翻訳文を第２端末１５０に伝送する段階Ｓ１８０を行うことができる。前記翻訳文の送信に対する応答として、第２端末１５０は、第１端末１００から前記翻訳文を受信することができる。

また、他の実施例によれば、第２端末１５０は、第１端末１００から前記翻訳文を受信する代わりに、他の方法を用いて、前記翻訳文を取得することができる。例えば、第２端末１５０は、第２サーバー３００から前記翻訳文を受信することによって前記翻訳文を取得することができる。図９は、他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ２２０が行われる過程を示すフローチャートである。

図９を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階Ｓ２２１が行われることができる。第２端末１５０の制御部１０２は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。

例えば、図８を参照すると、現在までに表示された音声認識結果は、「Ｉｌｏｖｅｙｏｕｄｏｙｏｕ」であることができる。第２端末１５０の制御部１０２は、前記音声認識結果内から一つの終結した文章として「Ｉｌｏｖｅｙｏｕ.」を検出することができる。

再び図９を参照すると、次に、前記終結した文章を第２サーバー３００に伝送する段階Ｓ２２２が行われることができる。第２端末１５０の通信部１０４は、前記検出された文章を第２サーバー３００に伝送することができる。第２サーバー３００は、第２端末１５０から前記検出された文章を受信することができる。第２サーバー３００は、前記受信された文章を第２言語に翻訳することができる。第２サーバー３００は、第２言語への翻訳文を第２端末１５０に伝送することができる。

次に、前記終結した文章の前記第２言語への翻訳文を前記第２サーバー３００から受信する段階Ｓ２２３が行われることができる。第２端末１５０の通信部１０４は、第２サーバー３００から前記翻訳文を受信することができる。例えば、第２端末１５０は、韓国語の前記翻訳文として「私はあなたを愛しています。」を受信することができる。

また他の実施例によれば、第２端末１５０は、他の方法を用いて前記翻訳文を取得することができる。例えば、第２端末１５０は、翻訳文データベースから前記翻訳文を取得することができる。図１０は、また他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ２２０が行われる過程を示すフローチャートである。

図１０を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階Ｓ２３１が行われることができる。第２端末１５０の制御部１０２は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。

次に、第２データベースにおいて、前記終結した文章を照会する段階Ｓ２３２が行われることができる。第２端末１５０の保存部１０３は、前記第２データベースを含むことができる。他の実施例によれば、前記第２データベースは、第２端末１５０の外部に配置されることができる。

前記第２データベースは、翻訳文データベースであることができる。前記第２データベースは、第１言語の文章及び前記文章の第２言語への翻訳文が保存されたリレーショナルデータベース（ｒｅｌａｔｉｏｎａｌｄａｔａｂａｓｅ）であることができる。前記第２データベースに含まれたそれぞれのレコードは、第１言語の文章及び前記文章の第２言語への翻訳文を含むことができる。

第２端末１５０の制御部１０２は、前記第２データベースにおいて、第１言語の前記終結した文章を照会することができる。これにより、制御部１０２は、前記終結した文章に対応する翻訳文が前記第２データベース内に存在するか否かを判定することができる。

次に、もし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在する場合、前記照会の結果として、前記翻訳文を前記第２データベースから取得する段階Ｓ２３３が行われることができる。もし前記終結した文章に対応するレコードが前記第２データベースに含まれている場合、第２端末１５０の制御部１０２は、第２データベースから前記翻訳文を取得することができる。

もし前記第２データベースが前記終結した文章に対応するレコードを含まない場合、第２端末１５０は、第２サーバー３００から前記翻訳文を受信することによって前記翻訳文を取得することができる。図１１は、また他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ２２０が行われる過程を示すフローチャートである。

図１１を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階Ｓ２４１が行われることができる。次に、第２データベースにおいて、前記終結した文章を照会する段階Ｓ２４２が行われることができる。

次に、もし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在しない場合、前記終結した文章を第２サーバー３００に伝送する段階Ｓ２４３が行われることができる。第２端末１５０の通信部１０４は、前記終結した文章を第２サーバー３００に伝送することができる。第２サーバー３００は、前記終結した文章を受信することができる。第２サーバー３００は、前記終結した文章を第２言語に翻訳することができる。第２サーバー３００は、前記第２言語への翻訳文を第２端末１５０に伝送することができる。

次に、前記終結した文章の前記第２言語への翻訳文を前記第２サーバー３００から受信する段階Ｓ２４４が行われることができる。第２端末１５０の通信部１０４は、前記翻訳文を第２サーバー３００から受信することができる。

次に、前記終結した文章及び前記受信された第２言語への翻訳文を前記第２データベース内にキャッシュ（ｃａｃｈｅ）する段階Ｓ２４５が行われることができる。第２端末１５０は、前記終結した文章及び前記受信された第２言語への翻訳文を前記第２データベースに保存することができる。第２データベースは、前記終結した文章及び前記受信された翻訳文を含むレコードを新たに生成することができる。これにより、次回に第２データベースにおいて、前記終結した文章が照会されると、第２端末１５０が前記照会の結果として前記翻訳文を取得できるように準備されることができる。

再び図５を参照すると、次に、表示された前記終結した文章を前記取得された翻訳文に置換する段階Ｓ２５０が行われることができる。第２端末１５０の表示部１０５は、表示された前記終結した文章を前記取得された翻訳文に置換することができる。前記音声認識結果が表示される途中に、表示部１０５は、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換することができる。

図１２は、実施例に係る表示された終結した文章を取得された翻訳文に置換する段階Ｓ２５０を説明するための参考図である。図１２に示すように、表示部１０５は、図８に表示された「Ｉｌｏｖｅｙｏｕ」を「私はあなたを愛しています。」に置換することができる。

第２端末１５０の通信部１０４は、その後も継続して第１端末１００から第１言語の音声認識結果を受信することができる。第２端末１５０の表示部１０５は、その後も継続して前記受信された音声認識結果を表示することができる。例えば、図１３に示すように、通信部１０４は、前記音声認識結果として「ｌｏｖｅｍｅ」を追加的に受信することができる。表示部１０５は、「私はあなたを愛しています。ｄｏｙｏｕｌｏｖｅｍｅ」のように表示することができる。

また、第２端末１５０の制御部１０２は、その後も継続して第１言語で表示された前記音声認識結果内から終結した文章を検出することができる。図１３を参照すると、制御部１０２は、「ｄｏｙｏｕｌｏｖｅｍｅ」の部分を一つの終結した文章として検出することができる。制御部１０２は、前記検出された文章の第２言語への翻訳文を取得することができる。第２端末１５０の表示部１０５は、前記検出された文章を前記取得された翻訳文に置換することができる。例えば、図１４に示すように、表示部１０５は、「ｄｏｙｏｕｌｏｖｅｍｅ」の部分を「あなたは私を愛していますか？」に置換することができる。
図１５は、他の実施例に係る、第２端末１５０によって通訳方法が行われる過程を示すフローチャートである。図１５を参照すると、まず、第１端末１００から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階Ｓ３００が行われることができる。次に、前記受信された音声認識結果を連続的に表示する段階Ｓ３１０が行われることができる。

次に、前記第１言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第２言語の単語に連続的に置換する段階Ｓ３２０が行われることができる。第２端末１５０の表示部１０５は、第１言語で表示されたそれぞれの単語を前記第２言語の単語に連続的に置換することができる。

これにより、前記音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する前であっても、第２端末１５０の使用者が意味を理解できる単語が最大限早く表示されることができる。したがって、第１端末１００の使用者が話した言葉の意味を第２端末１５０の使用者が理解できるまで第２端末１５０の使用者が待たなければならない時間が短縮されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。

図１６は、実施例に係る音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階Ｓ３２０が行われる過程を示すフローチャートである。図１６を参照すると、まず、前記第１言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１端末１００または第１サーバー２００から受信する段階Ｓ３２１が行われることができる。

例えば、図６に示すように音声認識結果として現在までに「Ｉ」が受信されて表示されたと仮定することにする。第２端末１５０の通信部１０４は、前記音声認識結果に含まれたそれぞれの単語に対応する第２言語の単語を受信することができる。すなわち、通信部１０４は、「Ｉ」に対応する韓国語の単語である「私は」を受信することができる。

第１端末１００は、第２端末１５０に前記音声認識結果を伝送した後に、前記音声認識結果に含まれたそれぞれの単語に対応する第２言語の単語を第２端末に伝送することができる。通信部１０４は、前記第２言語の単語を前記第１端末１００から受信することができる。

他の実施例によれば、第１端末１００は、第２端末１５０に前記音声認識結果を伝送した後に、前記音声認識結果に含まれたそれぞれの単語を第１サーバー２００に伝送することができる。第１サーバー２００は、辞書（ｄｉｃｔｉｏｎａｒｙ）サービスを提供するサーバーであることができる。第１サーバー２００は、前記音声認識結果に含まれたそれぞれの単語を受信することができる。第１サーバー２００は、前記それぞれの単語を前記単語に対応する第２言語の単語に変換することができる。第１サーバー２００は、前記変換された第２言語の単語を第２端末１５０に伝送することができる。通信部１０４は、前記第２言語の単語を前記第１サーバー２００から受信することができる。

再び図１６を参照すると、次に、前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階Ｓ３２２が行われることができる。第２端末１５０の表示部１０５は、第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換することができる。

図１７〜図１９は、実施例に係る音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階Ｓ３２２を説明するための参考図である。図１７に示すように、第２端末１５０の制御部１０２は、前記音声認識結果に含まれた「Ｉ」を韓国語の単語である「私は」に置換することができる。また、第２端末１５０の通信部１０４は、音声認識結果として「ｌｏｖｅｙｏｕ」を追加的に受信することができる。第２端末１５０の表示部１０５は、前記受信された音声認識結果を追加的に表示することができる。これにより、第２端末１５０の表示部１０５には「私はｌｏｖｅｙｏｕ」が表示されることができる。

図１８を参照すると、第２端末１５０の通信部１０４は、前記第１言語で表示された音声認識結果に含まれた単語のうち、「ｌｏｖｅ」に対応する韓国語の単語である「愛情」を受信することができる。第２端末１５０の表示部１０５は、「Ｌｏｖｅ」を「愛情」に置換することができる。また、第２端末１５０の通信部１０４は、音声認識結果として「ｄｏｙｏｕ」を追加的に受信することができる。第２端末１５０の表示部１０５は、前記受信された音声認識結果を追加的に表示することができる。これにより、第２端末１５０の表示部１０５には、「私は愛情ｙｏｕｄｏｙｏｕ」が表示されることができる。

図１９を参照すると、第２端末１５０の通信部１０４は、前記第１言語で表示された音声認識結果に含まれた単語のうち、「ｙｏｕ」及び「ｄｏ」にそれぞれ対応する韓国語の単語である「あなた」及び「する」を受信することができる。第２端末１５０の表示部１０５は、「ｙｏｕ」を「あなた」に置換し、「ｄｏ」を「する」に置換することができる。また、第２端末１５０の通信部１０４は、音声認識結果として「Ｌｏｖｅ」を追加的に受信することができる。第２端末１５０の表示部１０５は、前記受信された音声認識結果を追加的に表示することができる。これにより、第２端末１５０の表示部１０５には「私は愛情あなたするｙｏｕｌｏｖｅ」が表示されることができる。

図２０は、他の実施例により、音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階Ｓ３３０が行われる過程を示すフローチャートである。図２０を参照すると、まず、前記第１言語で表示された前記それぞれの単語を第１サーバー２００に伝送する段階Ｓ３３１が行われることができる。

第２端末１５０の通信部１０４は、前記第１言語で表示された前記それぞれの単語を第１サーバー２００に伝送することができる。第１サーバー２００は、第２端末１５０から前記それぞれの単語を受信することができる。第１サーバー２００は、前記それぞれの単語を前記単語に対応する第２言語の単語に変換することができる。第１サーバー２００は、前記変換された第２言語の単語を第２端末１５０に伝送することができる。

次に、前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバー２００から受信する段階Ｓ３３２が行われることができる。第２端末１５０の通信部１０４は、前記第２言語の単語を前記第１サーバー２００から受信することができる。

次に、前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階Ｓ３３３が行われることができる。第２端末１５０の表示部１０５は、前記第１言語で表示された単語を前記第２言語の単語に置換することができる。

図２１は、また他の実施例により、音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階Ｓ３３０が行われる過程を示すフローチャートである。図２１を参照すると、まず、第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階Ｓ３４１が行われることができる。

第２端末１５０の保存部１０３は、前記第１データベースを含むことができる。他の実施例によれば、前記第１データベースは、第２端末１５０の外部に配置されることができる。

前記第１データベースは、辞書データベースであることができる。前記第１データベースは、第１言語の単語及び前記単語に対応する第２言語の単語が保存されたリレーショナルデータベースであることができる。前記第１言語の単語の意味及び前記単語に対応する第２言語の単語の意味は、互いに同一または類似することができる。前記第１データベースに含まれたそれぞれのレコードは、第１言語の単語及び前記単語に対応する第２言語の単語を含むことができる。

第２端末１５０の制御部１０２は、前記第１データベースにおいて、前記音声認識結果に含まれた第１言語の単語を照会することができる。これにより、制御部１０２は、前記第１言語の単語に対応する第２言語の単語が前記第１データベース内に存在するか否かを判定することができる。

次に、もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第２言語の単語を前記第１データベースから取得する段階Ｓ３４２が行われることができる。もし、前記第１言語の単語に対応するレコードが前記第１データベースに含まれている場合、第２端末１５０の制御部１０２は、第１データベースから前記第２言語の単語を取得することができる。

次に、前記第１言語で表示された前記照会された単語を前記取得された第２言語の単語に置換する段階Ｓ３４３が行われることができる。第２端末１５０の表示部１０５は、前記第１言語で表示された単語を前記第２言語の単語に置換することができる。

もし、前記第１データベースが前記第１言語の単語に対応するレコードを含まない場合、第２端末１５０は、第１サーバー２００から前記第１言語の単語に対応する第２言語の単語を受信することができる。図２２は、また他の実施例により、音声認識結果に含まれたそれぞれの単語を第２言語の単語に連続的に置換する段階Ｓ３３０が行われる過程を示すフローチャートである。図２２を参照すると、まず、第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階Ｓ３５１が行われることができる。

次に、もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在しない場合、前記照会された単語を第１サーバー２００に伝送する段階Ｓ３５２が行われることができる。第２端末１５０の通信部１０４は、前記第１言語の単語を第１サーバー２００に伝送することができる。

第１サーバー２００は、第２端末１５０から前記第１言語の単語を受信することができる。第１サーバー２００は、前記単語を前記単語に対応する第２言語の単語に変換することができる。第１サーバー２００は、前記変換された第２言語の単語を第２端末１５０に伝送することができる。

次に、前記伝送された単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバー２００から受信する段階Ｓ３５３が行われることができる。第２端末１５０の通信部１０４は、前記第１サーバー２００から前記第２言語の単語を受信することができる。

次に、前記伝送された単語及び前記受信された第２言語の単語を前記第１データベース内にキャッシュ（ｃａｃｈｅ）する段階Ｓ３５４が行われることができる。第２端末１５０は、前記第１言語の単語及び前記受信された第２言語の単語を前記第１データベースに保存することができる。第１データベースは、前記第１言語の単語及び前記受信された第２言語の単語を含むレコードを新たに生成することができる。これにより、次回に第１データベースにおいて、前記第１言語の単語が照会されると、第２端末１５０が前記照会の結果として前記第２言語の単語を取得できるように準備されることができる。

次に、前記第１言語で表示された前記伝送された単語を前記受信された第２言語の単語に置換する段階Ｓ３５５が行われることができる。第２端末１５０の表示部１０５は、前記第１言語で表示された単語を前記第２言語の単語に置換することができる。

再び図１５を参照すると、次に、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ３６０が行われることができる。例えば、第２端末１５０は、前記音声認識結果に含まれた終結した文章である「Ｉｌｏｖｅｙｏｕ」の翻訳文として、「私はあなたを愛しています。」を取得することができる。

次に、少なくとも一部が前記第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階Ｓ３７０が行われることができる。第２端末１５０の表示部１０５は、少なくとも一部がすでに第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換することができる。

例えば、図１９を参照すると、表示部１０５は、前記終結した文章である「Ｉｌｏｖｅｙｏｕ」に対応する「私は愛情あなた」を前記取得された翻訳文に置換することができる。図２３に示すように、表示部１０５は、「私は愛情あなた」の部分を「私はあなたを愛しています。」に置換することができる。

また、第２端末１５０の通信部１０４は、その後も継続して第１端末１００から第１言語の音声認識結果を受信することができる。第２端末１５０の表示部１０５は、その後も継続して前記受信された音声認識結果を表示することができる。第２端末１５０の表示部１０５は、その後も継続して第１言語で表示された単語を前記単語に対応する第２言語の単語に置換することができる。第２端末１５０の表示部１０５は、その後も継続して終結した文章を検出することができる。第２端末１５０の表示部１０５は、その後も継続して前記検出された文章を翻訳文に置換することができる。

例えば、図２３に示すように、通信部１０４は、前記音声認識結果として「ｍｅ」を追加的に受信することができる。表示部１０５は、「ｍｅ」を追加的に表示することができる。表示部１０５は、「ｌｏｖｅ」を「愛情」に置換することができる。制御部１０２は、「ｄｏｙｏｕｌｏｖｅｍｅ」の部分を一つの終結した文章として検出することができる。制御部１０２は、前記検出された文章の第２言語への翻訳文を取得することができる。第２端末１５０の表示部１０５は、「ｄｏｙｏｕｌｏｖｅｍｅ」に対応する「するあなた愛情ｍｅ」の部分を図１４に示すように、「あなたは私を愛していますか？」に置換することができる。

図２４はまた他の実施例に係る第２端末１５０によって通訳方法が行われる過程を示すフローチャートである。図２４を参照すると、まず、第１端末１００から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階Ｓ４００が行われることができる。次に、前記受信された音声認識結果を連続的に表示する段階Ｓ４１０が行われることができる。

次に、前記第１言語の語順及び前記第２言語の語順の間の類似度を算出する段階Ｓ４２０が行われることができる。第２端末１５０の制御部１０２は、前記第１言語の語順及び前記第２言語の語順の間の類似度を算出することができる。

それぞれの言語は、一つの文章内で、主語、目的語、及び他動詞が配列される特定の順序を有することができる。例えば、英語または中国語の文章内で、主語、目的語、及び他動詞は、主語、他動詞、及び目的語の順に配列されることができる。他の例として、韓国語または日本語の文章内で、主語、目的語、及び他動詞は、主語、目的語、及び他動詞の順に配列されることができる。

第２端末１５０の制御部１０２は、第１言語の文章内で、主語、目的語、及び他動詞が配列される順序及び第２言語の文章内で、主語、目的語、及び他動詞が配列される順序を用いて前記類似度を算出することができる。第１言語が英語であり、第２言語が中国語である場合に算出された類似度は、第１言語が英語であり、第２言語が韓国語である場合に算出された類似度に比べて高いことがあり得る。

次に、前記算出された類似度が基準値よりも大きければ、前記第１言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第２言語の単語に連続的に置換する段階Ｓ４３０が行われることができる。逆に、前記算出された類似度が基準値よりも大きくなければ、前記第１言語の単語を前記第２言語の単語に置換する段階Ｓ４３０は、行われないことがある。

もし、第１言語の語順と第２言語の語順が十分に類似していないにもかかわらず、前記第１言語の単語が前記第２言語に置換されたら、第２端末１５０の使用者が経験する可読性が顕著に低いことがあり得る。逆に、もし第１言語の語順と第２言語の語順が十分に類似している場合、前記第１言語の単語が前記第２言語に置換されたら、第２端末１５０の使用者が経験する可読性が十分に確保されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。

前記基準値は、例えば、第１言語が英語であり、第２言語が韓国語である場合に算出された類似度と互いに同一であることができる。したがって、もし第１言語が英語であり、第２言語が中国語である場合、第２端末１５０の表示部１０５は、前記第１言語で表示されたそれぞれの単語を前記単語に対応する第２言語の単語に連続的に置換することができる。

次に、前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階Ｓ４４０が行われることができる。次に、少なくとも一部が前記第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階Ｓ４５０が行われることができる。

図２５は、実施例に係るサーバーによって通訳方法が行われる過程を示すフローチャートである。前記サーバーは、第１サーバー２００、第２サーバー３００、または第３サーバー４００であることができる。また、前記サーバーは、第１サーバー２００、第２サーバー３００、または第３サーバー４００とは互いに異なるサーバーであることができる。前記サーバーは、第１端末１００及び第２端末１５０と互いに連結されることができる。

図２５を参照すると、まず、第１端末１００から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階Ｓ５００が行われることができる。次に、前記受信された音声認識結果を第２端末１５０に連続的に伝送する段階Ｓ５１０が行われることができる。前記音声認識結果が受信される途中に、サーバーは、現在までに受信された前記音声認識結果のうちの少なくとも一部を前記第２端末１５０に連続的に伝送することができる。

次に、前記受信された音声認識結果内から終結した文章を検出する段階Ｓ５２０が行われることができる。サーバーは、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。

次に、前記検出された文章の第２言語への翻訳文を取得する段階Ｓ５３０が行われることができる。サーバーは、前記検出された少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得することができる。

次に、前記取得された翻訳文を前記第２端末１５０に伝送する段階Ｓ５４０が行われることができる。前記音声認識結果が受信される途中に、サーバーは、前記取得された翻訳文を前記第２端末１５０に伝送することができる。

以上で説明された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても、各自が相手の話を聞き取ることができる。また、よりスムーズな使用者経験が提供されることができる。また、反応性が向上した使用者経験が提供されることができる。また、改善された使用者経験が提供されることができる。

以上で説明された実施例は、コンピュータによって実行されるプログラムモジュールのようなコンピュータによって実行可能なコマンドを含む記録媒体の形態でも具現されることができる。コンピュータ判読可能な媒体は、コンピュータによってアクセスすることができる任意の使用可能媒体であることができ、揮発性及び非揮発性媒体、分離型及び非分離型媒体をすべて含むことができる。

また、コンピュータ判読可能な媒体は、コンピュータ保存媒体または通信媒体を含むことができる。コンピュータ保存媒体は、コンピュータ判読可能なコマンド、データ構造、プログラムモジュールまたはその他のデータのような情報の保存のための任意の方法または技術で具現された揮発性及び非揮発性、分離型及び非分離型媒体をすべて含むことができる。通信媒体は、典型的にコンピュータ判読可能なコマンド、データ構造、プログラムモジュール、または搬送波のような変調されたデータ信号のその他のデータ、またはその他の送信メカニズムを含み、任意の情報伝達媒体を含むことができる。

以上、添付された図面を参照して、本発明の実施例を説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明がその技術的思想や必須的な特徴を変更せず、他の具体的な形態で実施できることを理解することができるはずである。したがって、以上で記述した実施例は、あらゆる面で例示的なものであり、限定的ではないことを理解しなければならない。

１００：第１通訳装置、第１端末
１０１：入力部
１０２：制御部
１０３：保存部
１０４：通信部
１０５：表示部
１５０：第２通訳装置、第２端末
２００：第１サーバー
３００：第２サーバー
４００：第３サーバー

Claims

第１端末から第１言語の音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を連続的に表示する段階と、
前記第１言語の語順と第２言語の語順の間の類似度を算出する段階と、
前記算出された類似度が基準値よりも大きければ、前記第１言語の音声認識結果に含まれたそれぞれの単語をそれらと同一または類似の意味を有する第２言語の単語に連続的に置換する段階と、
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階、及び
表示された前記終結した文章を前記取得された翻訳文に置換する段階を含み、
前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第２言語の単語に置換された前記終結した文章を前記取得された翻訳文に連続的に置換する段階を含む通訳方法。
前記受信された音声認識結果を連続的に表示する段階は、
前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含み、
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、
前記音声認識結果を表示する途中に、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得する段階を含み、
前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、
前記音声認識結果を表示する途中に、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換する段階を含む請求項１に記載の通訳方法。
前記第１端末から前記音声がエンコードされることによって生成された音声データを連続的に受信する段階、及び
前記受信された音声データを用いて前記音声を連続的に再生する段階をさらに含み、
前記受信された音声認識結果を連続的に表示する段階は、
前記音声を再生する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含む請求項１に記載の通訳方法。
前記第２言語の単語に連続的に置換する段階は、
前記第１言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１端末または第１サーバーから受信する段階、及び
前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階を含む請求項１に記載の通訳方法。
前記第２言語の単語に連続的に置換する段階は、
前記第１言語で表示された前記それぞれの単語を第１サーバーに伝送する段階と、
前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバーから受信する段階、及び
前記第１言語で表示された前記それぞれの単語を前記受信された第２言語の単語に連続的に置換する段階を含む請求項１に記載の通訳方法。
前記第２言語の単語に連続的に置換する段階は、
第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階と、
もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第２言語の単語を前記第１データベースから取得する段階、及び
前記第１言語で表示された前記照会された単語を前記取得された第２言語の単語に置換する段階を含む請求項１に記載の通訳方法。
前記第２言語の単語に連続的に置換する段階は、
第１データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階と、
もし前記照会された単語に対応する前記第２言語の単語が前記第１データベース内に存在しない場合、前記照会された単語を第１サーバーに伝送する段階と、
前記伝送された単語と同一または類似の意味を有する前記第２言語の単語を前記第１サーバーから受信する段階と、
前記伝送された単語及び前記受信された第２言語の単語を前記第１データベース内にキャッシュ（ｃａｃｈｅ）する段階、及び
前記第１言語で表示された前記伝送された単語を前記受信された第２言語の単語に置換する段階をさらに含む請求項１に記載の通訳方法。
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、
前記翻訳文を前記第１端末または第２サーバーから受信する段階を含む請求項１に記載の通訳方法。
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
前記終結した文章を第２サーバーに伝送する段階、及び
前記終結した文章の前記第２言語への翻訳文を前記第２サーバーから受信する段階を含む請求項１に記載の通訳方法。
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
第２データベースにおいて、前記終結した文章を照会する段階、及び
もし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在する場合、前記照会の結果として、前記終結した文章に対応する前記第２言語への翻訳文を前記第２データベースから取得する段階を含む請求項１に記載の通訳方法。
前記表示された音声認識結果に含まれた終結した文章の第２言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
第２データベースにおいて、前記終結した文章を照会する段階と、
もし前記終結した文章に対応する前記第２言語への翻訳文が前記第２データベース内に存在しない場合、前記終結した文章を第２サーバーに伝送する段階と、
前記終結した文章の前記第２言語への翻訳文を前記第２サーバーから受信する段階、及び
前記終結した文章及び前記受信された第２言語への翻訳文を前記第２データベース内にキャッシュ（ｃａｃｈｅ）する段階をさらに含む請求項１に記載の通訳方法。
請求項１に記載の通訳方法をコンピュータで実行させるプログラムが記録されたコンピュータで読み取り可能な記録媒体。
第１端末が第１言語の音声を連続的に受信する段階と、
前記受信されている音声を連続的にエンコードする段階と、
前記エンコードされた音声を第１サーバーに連続的に伝送する段階と、
前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を第２端末に連続的に伝送する段階と、
前記第１言語の語順と第２言語の語順の間の類似度が基準値よりも大きければ、前記音声認識結果の各単語を第２サーバーに伝送する段階と、
前記伝送された各単語と同一又は類似の意味を有する第２言語の単語を前記第２サーバーから受信する段階と、
前記第２言語の単語を前記第２端末に連続的に伝送する段階と、
前記受信されている音声内から終結した文章を検出する段階と、
前記検出された文章に対応する前記第１言語のテキストを第３サーバーに伝送する段階と、
前記第３サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信する段階、及び
前記受信された翻訳文を前記第２端末に伝送する段階を含む通訳方法。
前記受信されている音声を連続的にエンコードする段階は、
前記音声を受信している途中に、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードする段階を含み、
前記エンコードされた音声を第１サーバーに連続的に伝送する段階は、
前記音声を受信している途中に、現在までエンコードされた前記音声のうちの少なくとも一部を前記第１サーバーに連続的に伝送する段階を含み、
前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階は、
前記音声を受信している途中に、前記第１サーバーから前記伝送されたエンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信する段階を含む請求項１３に記載の通訳方法。
前記受信された音声認識結果を第２端末に連続的に伝送する段階は、
前記音声を受信している途中に、前記受信された音声認識結果を前記第２端末に連続的に伝送する段階を含み、
前記受信されている音声内から終結した文章を検出する段階は、
前記音声を受信している途中に、現在まで伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、
前記検出された文章に対応する前記第１言語のテキストを前記第３サーバーに伝送する段階は、
前記音声を受信している途中に、前記検出された少なくとも一つ以上の終結した文章に対応する前記第１言語のテキストを前記第３サーバーに伝送する段階を含む請求項１４に記載の通訳方法。
前記第３サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信する段階は、
前記音声を受信している途中に、前記第３サーバーから前記伝送されたテキストの前記第２言語への翻訳文を前記第２言語のテキストとして受信する段階を含み、
前記受信された翻訳文を前記第２端末に伝送する段階は、
前記音声を受信している途中に、前記受信された翻訳文を前記第２端末に伝送する段階を含む請求項１５に記載の通訳方法。
前記エンコードされた音声を前記第３サーバーに連続的に伝送する段階をさらに含み、
前記受信された音声認識結果を第２端末に連続的に伝送する段階は、
前記エンコードされた音声を伝送している途中に、前記受信された音声認識結果を前記第２端末に連続的に伝送する段階を含む請求項１３に記載の通訳方法。
第１端末から第１言語の音声に対する音声認識結果を第１言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を第２端末に連続的に伝送する段階と、
前記第１言語の語順と第２言語の語順の間の類似度が基準値よりも大きければ、前記音声認識結果の単語と同一又は類似の意味を有する第２言語の単語を取得する段階と、
前記第２言語の単語を前記第２端末に連続的に伝送する段階と、
前記受信された音声認識結果内から終結した文章を検出する段階と、
前記検出された文章の第２言語への翻訳文を取得する段階、及び
前記取得された翻訳文を前記第２端末に伝送する段階を含む通訳方法。
前記受信された音声認識結果を第２端末に連続的に伝送する段階は、
前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を前記第２端末に連続的に伝送する段階を含み、
前記受信された音声認識結果内から終結した文章を検出する段階は、
現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、
前記検出された文章の第２言語への翻訳文を取得する段階は、
前記検出された少なくとも一つ以上の終結した文章の前記第２言語への翻訳文を取得する段階を含み、
前記取得された翻訳文を前記第２端末に伝送する段階は、
前記音声認識結果を受信する途中に、前記取得された翻訳文を前記第２端末に伝送する段階を含む請求項１８に記載の通訳方法。
第１言語の音声を連続的に受信する入力部と、
前記受信されている音声を連続的にエンコードする制御部、及び
前記エンコードされた音声を第１サーバーに連続的に伝送する通信部を含み、
前記通信部は、前記第１サーバーから前記エンコードされた音声に対する音声認識結果を前記第１言語のテキストとして連続的に受信し、
前記通信部は、前記受信された音声認識結果を第２端末に連続的に伝送し、
前記第１言語の語順と第２言語の語順の間の類似度が基準値よりも大きければ、前記通信部は、前記音声認識結果の各単語を第２サーバーに伝送し、
前記通信部は、前記伝送された各単語と同一又は類似の意味を有する第２言語の単語を前記第２サーバーから受信し、
前記通信部は、前記第２言語の単語を前記第２端末へ連続的に伝送し、
前記制御部は、前記受信されている音声内から終結した文章を検出し、
前記通信部は、前記検出された文章に対応する前記第１言語のテキストを第３サーバーに伝送し、
前記通信部は、前記第３サーバーから前記検出された文章の第２言語への翻訳文を前記第２言語のテキストとして受信し、
前記通信部は、前記受信された翻訳文を前記第２端末に伝送する通訳装置。