WO2018110096A1 - 翻訳装置および翻訳方法 - Google Patents
翻訳装置および翻訳方法 Download PDFInfo
- Publication number
- WO2018110096A1 WO2018110096A1 PCT/JP2017/038441 JP2017038441W WO2018110096A1 WO 2018110096 A1 WO2018110096 A1 WO 2018110096A1 JP 2017038441 W JP2017038441 W JP 2017038441W WO 2018110096 A1 WO2018110096 A1 WO 2018110096A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- language
- word
- translation
- text
- sentence
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
翻訳装置(10)は、第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語取得部(106)と、多義語処理部(107)と、第1言語出力部(111)とを備える。第1言語取得部(106)は、第1言語の文章を取得する。多義語処理部(107)は、文章に含まれる第1言語の単語に対応する第2言語の単語が多義語であるかどうかを判定し、第2言語の単語が多義語であると判定した場合、第2言語の単語に対応する複数の意味候補を取得する。第1言語出力部(111)は、複数の意味候補を出力する。
Description
本開示は、第1言語で入力されたデータを第2言語に自動翻訳するための翻訳装置および翻訳方法に関する。
自動翻訳により第1言語を第2言語に翻訳するとき、第1言語に多義語が含まれている場合、翻訳結果において当該多義語の第2言語による複数の訳語を表示することが知られている(例えば、特許文献1参照)。
第1言語から第2言語に翻訳するとき、第1言語の発話者は通常第2言語を知らない。そのため、第1言語の単語に対する訳語が多義語かどうか判断できない。一方、第2言語の被発話者は第1言語を知らない。そのため、訳語が多義語であっても、第1言語の発話者が意図する意味の訳語を選択することは困難な場合がある。このため、会話に誤解が生じ、コミュニケーションがうまく行かないおそれがある。
本開示は、自動翻訳において、異なる言語話者間における誤解によるリスクを低減し、コミュニケーションを円滑にする翻訳装置および翻訳方法を提供する。
本開示に係る翻訳装置は、第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語取得部と、多義語処理部と、第1言語出力部とを備える。第1言語取得部は、第1言語の文章を取得する。多義語処理部は、文章に含まれる第1言語の単語に対応する第2言語の単語が多義語であるかどうかを判定し、第2言語の単語が多義語であると判定した場合、第2言語の単語に対応する複数の意味候補を取得する。第1言語出力部は、複数の意味候補を出力する。
本開示に係る翻訳方法は、コンピュータを用いて第1言語から第2言語への翻訳を行う翻訳方法であって、第1言語の文章を取得し、文章に含まれる第1言語の単語に対応する第2言語の単語が多義語であるかどうかを判定し、第2言語の単語が多義語であると判定した場合、第2言語の単語に対応する複数の意味候補を記憶部より取得し、複数の意味候補を出力することを含む。
本開示に係る翻訳装置および翻訳方法は、自動翻訳において、異なる言語話者間における誤解によるリスクを低減し、コミュニケーションを円滑にするのに有効である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
本開示に係る翻訳装置は、翻訳を介したコミュニケーションを円滑にするのに有効である。例えば、日本語(第1言語)の「トイレ」を英語(第2言語)の「bathroom」と翻訳した場合、「bathroom」はトイレの他に浴室という意味も含む。このような場合、日本語の発話者が「トイレ」と発話した場合であって「bathroom」と翻訳された場合、英語の被発話者は「浴室」と誤解するおそれがある。本開示に係る翻訳装置は、かかる誤解のおそれを第1言語の発話者に予め認識させ、その後の翻訳を介したコミュニケーションを円滑にするものである。
(実施の形態1)
[1-1.構成]
図1は、本開示の一実施形態に係る翻訳システム1の全体構成を概略的に示す。翻訳システム1は、翻訳装置10と、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70を備える。音声認識サーバ50、翻訳サーバ60、および音声合成サーバ70は、それぞれ、翻訳装置10とネットワークを介して接続可能である。
[1-1.構成]
図1は、本開示の一実施形態に係る翻訳システム1の全体構成を概略的に示す。翻訳システム1は、翻訳装置10と、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70を備える。音声認識サーバ50、翻訳サーバ60、および音声合成サーバ70は、それぞれ、翻訳装置10とネットワークを介して接続可能である。
音声認識サーバ50、翻訳サーバ60、および音声合成サーバ70はそれぞれ、CPU(Central Processing Unit)などのプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、記憶部、および翻訳装置10と通信可能な通信I/F(インタフェース)を備えるコンピュータ装置である。音声認識サーバ50は、翻訳装置10から音声データを受信し、音声認識結果のテキストを生成し、そのテキストを翻訳装置10に送信する。翻訳サーバ60は、翻訳装置10からテキストデータを受信し、それを指定された他言語のテキストデータに翻訳し、そのテキストデータを翻訳装置10に送信する。音声合成サーバ70は、翻訳装置10から翻訳されたテキストデータを受信し、そのテキストデータに対応した音声データを生成して、その音声データを翻訳装置10に送信する。
[1-1-1.翻訳装置の構成]
図1に示すように、翻訳装置10は、CPU11、ROM12、RAM13、入力I/F(インタフェース)14、出力I/F(インタフェース)15、通信I/F(インタフェース)16、入力操作部18、およびディスプレイ19を備えるコンピュータ装置である。翻訳装置10はまた、記憶部17、マイク30およびスピーカ40を備える。
図1に示すように、翻訳装置10は、CPU11、ROM12、RAM13、入力I/F(インタフェース)14、出力I/F(インタフェース)15、通信I/F(インタフェース)16、入力操作部18、およびディスプレイ19を備えるコンピュータ装置である。翻訳装置10はまた、記憶部17、マイク30およびスピーカ40を備える。
CPU11は、所定のプログラムに従って処理を実行するプロセッサ又は回路である。ROM12は、CPU11の処理手順を記述した制御プログラム等を記憶する。RAM13は、ワークメモリとして制御プログラムやデータを一時的に格納する。入力I/F14は、マイク30に接続される接続部であり、マイク30からA/D変換された音声データを受信する。出力I/F15は、スピーカ40に接続される接続部であり、スピーカ40にD/A変換された音声を送信する。通信I/F16は、無線又は有線により音声認識サーバ50、翻訳サーバ60、および音声合成サーバ70とそれぞれ通信するための通信回路である。
入力操作部18は、タッチパネル、キーボード、またはポインティングデバイス(マウス等)によるユーザの入力操作を受け付ける。ディスプレイ19(表示部の一例)は、液晶パネル、有機ELパネル、又はこれらに類似するパネルによって構成され、翻訳結果のテキストデータなどを表示する。
記憶部17は、HDD(ハードディスクドライブ)等の磁気記憶装置や半導体メモリ等の記憶装置であり、アプリケーションやOS等の各プログラムや、各種データを格納する。記憶部17は、後述するように多義語DB(データベース)170を格納する。なお、記憶部17は、翻訳装置10とは別体の記憶装置として接続されていてもよい。また、記憶部17は、インターネットなどを介して翻訳装置10と接続されていてもよい。
図2は、翻訳装置10の一例を示す。マイク30は、翻訳装置10のユーザの発話を音声データとして入力する。ディスプレイ19には、タッチパネルのキーK0~K2が表示される。キーK0は、スタートボタンである。キーK0がゲストに操作されることにより、ゲストが発話する第2言語のマイク30への音声入力が開始または終了される。キーK1は、第1言語のスタートボタン兼言語選択ボタンである。キーK1がホストに操作されることにより、ホストが発話する第1言語のマイク30への音声入力が開始または終了される。キーK2は、第2言語のスタートボタン兼言語選択ボタンである。キーK2がホストに操作されることにより、ゲストが発話する第2言語のマイク30への音声入力が開始または終了される。また、キーK1およびキーK2は、例えば長押し操作されることにより、言語を切り替えることができる。
また、ディスプレイ19の画面は、第1言語の表示エリアA1と、第2言語の表示エリアA2を含む。スピーカ40は、音声合成サーバ70から受信された音声データを出力する。例えば、図2に示すように、マイク30でホストが話した原文章を拾って音声認識した結果である原文テキストL1-1は、表示エリアA1に表示される。原文テキストを翻訳した翻訳テキストL2-1は、表示エリアA2に表示される。翻訳テキストを再翻訳した再翻訳テキストL1-2は、表示エリアA1に表示される。なお、ここでは、原文テキストL1-1と再翻訳テキストL1-2は、同時に表示されている。しかし、原文テキストL1-1を表示せず、再翻訳テキストL1-2のみを表示するようにしてもよい。
[1-1-2.CPUの構成]
図3は、翻訳装置10の構成を示す。翻訳装置10の機能は、主にCPU11がメモリ領域を利用して所定のプログラムを実行することにより実現される。CPU11は、以下の要素またはモジュールを備える。
図3は、翻訳装置10の構成を示す。翻訳装置10の機能は、主にCPU11がメモリ領域を利用して所定のプログラムを実行することにより実現される。CPU11は、以下の要素またはモジュールを備える。
音声取得部101は、第1言語(ここでは、日本語)の発話者により発せられた音声を、マイク30を介して音声データとして取得する。音声取得部101は、取得された音声データを通信I/F16を介して音声認識サーバ50に送信する。音声認識サーバ50は、音声データを音声認識し、テキストデータ(以下、原文テキストと呼ぶ)に変換する。
原文取得部102(第1言語取得部の一例)は、通信I/F16を介して音声認識サーバ50から音声認識結果の原文テキストを取得する。
原文送信部103は、原文テキストを通信I/F16を介して翻訳サーバ60に送信する。翻訳サーバ60は、原文テキストを第2言語(ここでは、英語)に翻訳し、翻訳テキストを生成する。
翻訳取得部104(第2言語取得部の一例)は、通信I/F16を介して翻訳サーバ60からの翻訳テキストを取得する。
翻訳送信部105は、翻訳テキストを通信I/F16を介して翻訳サーバ60に送信する。翻訳サーバ60は、英語の翻訳テキストを日本語に再翻訳し、再翻訳テキストを生成する。
なお、再翻訳テキストを生成するのは、発話者が自身の発話した内容が適切に翻訳されているかどうかを確認するために有効である。
再翻訳取得部106(第1言語取得部の一例)は、通信I/F16を介して翻訳サーバ60からの再翻訳テキストを取得する。
多義語処理部107は、後述する多義語DB170(図4参照)を参照して翻訳テキストに多義語が含まれているかどうかを判定する。多義語処理部107はまた、翻訳テキストに多義語が含まれている場合は、再翻訳テキストを修正する。具体的には、多義語処理部107は、後述するように、多義語に対応する第1言語の単語を複数列挙した再翻訳テキストを生成する。多義語処理部107はまた、ユーザによる入力操作部18からの入力に応じて、翻訳テキストを修正する。具体的には、後述するように、多義語に対応する第1言語の複数の単語のうちユーザが意図する単語を選択すると、多義語処理部107は、多義語DB170を参照する。そして、多義語処理部107は、選択された第1言語の単語に対応する一義的に解釈可能な第2言語の単語を取得し、当該単語を含むように翻訳テキストを修正する。
再翻訳修正部108は、多義語処理部107の指示に応じて、再翻訳テキストを修正する。
翻訳修正部109は、多義語処理部107の指示に応じて、翻訳テキストを修正する。
原文出力部110は、原文取得部102により取得された原文テキストをディスプレイ19に表示させるために、原文テキストを出力する。
再翻訳出力部111(第1言語出力部の一例)は、再翻訳テキストをディスプレイ19に表示させるために、再翻訳テキストを出力する。
翻訳出力部112(第2言語出力部の一例)は、翻訳テキストをディスプレイ19に表示させるために、翻訳テキストを出力する。
音声出力部113は、音声合成サーバ70により翻訳テキストから変換された音声データをスピーカ40に出力する。
[1-1-3.多義語DBの構成]
図4は、本開示の一例に係る多義語DB170の構成を概略的に示す。多義語DB170は、一つの第2言語に係る単語の意味が第1言語において複数ある場合、その第2言語の単語と対応する複数の第1言語による単語とを対応付けて格納するデータベースである。
図4は、本開示の一例に係る多義語DB170の構成を概略的に示す。多義語DB170は、一つの第2言語に係る単語の意味が第1言語において複数ある場合、その第2言語の単語と対応する複数の第1言語による単語とを対応付けて格納するデータベースである。
図4に示すように、複数の第1言語のデータ171,172,173・・・のそれぞれに対し、複数の第2言語のデータ171A,171B,171C,171D・・・が対応付けて格納されている。例えばデータ171Aは、第1言語が日本語で、第2言語が英語の場合の多義語データとなる。各データ171,172,173においては、一つの第2言語の多義語に対し、第1言語による複数の意味候補と、各意味候補に対応する一義解釈可能な第2言語の単語(一義解釈可能訳語)とが対応付けられている。複数の意味候補は、よく使用されるなどの代表データ(代表語または代表画像)と、代表データと同様の概念を意味する類義データ(類義語または類義画像)とを含む。図4では、例えば第2言語である英語の「bathroom」という単語は多義語であり、複数の意味候補である単語W1,W2を有していること、意味候補である単語W1の類義語である複数の単語W3および単語W2の類義語である複数の単語W4も「bathroom」の意味候補であること、単語W1を第2言語で表現した際に一義に解釈できる単語は「toilet」であることなどが記録されている。なお、単語W1は、日本語で「toilet」を意味する。また、単語W2は、日本語で「shower room」を意味する。
複数の第1言語による意味候補の各々は、テキスト(文字列)に限定されず、後述するように写真、絵、記号、マーク、図などの画像データであってもよい。
なお、本実施の形態においては、第1言語を日本語とし、第2言語を英語としているデータ171Aを用いる場合を例にして説明している。
[1-2.動作]
以下、図5に示す、本実施の形態1に係る翻訳装置10により実行される処理について説明する。なお、本例では、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例について説明する。
以下、図5に示す、本実施の形態1に係る翻訳装置10により実行される処理について説明する。なお、本例では、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例について説明する。
S1001:音声取得部101は、マイク30から音声データを取得する。ここでは、発話者により「トイレはあちらです」と発話されたとする。
S1002:音声取得部101は、音声データを音声認識サーバ50に送信する。
S1003:原文取得部102は、音声認識サーバ50によって変換された原文テキストを受信する。
S1004:原文出力部110は、受信された原文テキストをディスプレイ19に出力し、表示させる。ここでは、原文テキストL1-1がディスプレイ19に表示される。なお、ここで音声認識の誤りにより原文テキストに誤りがある場合は、S1001に戻り音声の入力をやり直してもよい。
S1005:原文送信部103は、原文テキストを翻訳サーバ60に送信する。
S1006:翻訳取得部104は、翻訳サーバ60によって生成された翻訳テキストを受信する。ここでは、翻訳取得部104は、図6Aに示すように、「The bathroom is over there」との翻訳テキストを受信する。
S1007:翻訳送信部105は、翻訳テキストを翻訳サーバ60に送信する。
S1008:再翻訳取得部106は、翻訳サーバ60により第2言語の翻訳テキストを第1言語に再翻訳されたテキストを受信する。ここでは、再翻訳取得部106は、図6Aに示すように、再翻訳テキストT1を受信する。
S1009:多義語処理部107は、多義語DB170を参照する。ここでは、上述したように、第1言語を日本語、第2言語を英語とするデータ171Aが選択され、参照される。
S1010:多義語処理部107は、データ171Aにおいて、翻訳テキストに多義語が含まれているかどうかを判定する。ここでは、翻訳テキスト「The bathroom is over there」のうち、bathroomが多義語として検出される。
S1011:多義語処理部107は、「bathroom」に対応する複数の意味候補で再翻訳テキストを検索する。ここでは、図6Aに示すように、再翻訳テキストT1で単語W2が複数の意味候補の一つとして検出される。
なお、ここで意味候補が検出されない場合、例えば、再翻訳テキスト中の単語と複数の意味候補のそれぞれとの間の類似度を計算し、複数の意味候補のうち最も類似している単語を多義語に該当する意味候補としてもよい。
S1012:多義語処理部107の指示に応じて、再翻訳修正部108は、取得した複数の意味候補を列挙するよう再翻訳テキストを修正する。ここでは、多義語処理部107は、単語W2が多義語「bathroom」に対応する訳語と判定して、単語W2を、「bathroom」の「複数の意味候補」の列挙である「{単語W2|単語W1}」に置換して、修正再翻訳テキストT2を出力する。この際、どちらかの単語をユーザが選択できるように出力する。
なお、図6Bの例に示すように、再翻訳テキストT1aに含まれる単語W5がデータ171Aにおいて複数の意味候補のうち類義語に該当する場合は、「複数の意味候補」の列挙には類義語の単語W5ではなく代表語による意味候補である単語W2を用いる。つまり、S1011において取得した多義語に対応する単語が、類義語に含まれている場合であっても、その類義語に対応する代表語による意味候補を出力する。なお、「複数の意味候補」の列挙のために検出された単語である単語W5をそのまま用いて「{単語W5|単語W1}」を含むテキストを修正再翻訳テキストとして出力してもよい。
このように、複数の意味候補を列挙するとは、多義語DB170における類義語を含む「複数の意味候補」から、単語を選択して列挙することである。ここで、多義語のもつ複数の意味を全て網羅できるように単語を列挙してもよい。
S1013:再翻訳出力部111は、修正した再翻訳テキストをディスプレイ19に表示させる。ここでは、図6Aに示すように、{単語W2|単語W1}を含む修正再翻訳テキストT2を表示させる。
S1014:一方、多義語処理部107は、翻訳テキストに多義語が含まれていない場合、翻訳サーバ60より取得した再翻訳テキストを、再翻訳出力部111を介して、ディスプレイ19に表示させる。
S1015:ユーザが入力操作部18を介して再翻訳テキスト中の選択可能な単語のいずれかを選択した場合、S1016に進む。例えば、ユーザは{単語W2|単語W1}のうち単語W1の位置をタッチすることで単語を選択することができる。ユーザが一定時間選択しない場合や選択しないことを示すボタンを選択した場合は単語の選択は行われなかったとみなされ、S1018に進む。
S1016:多義語処理部107は、多義語DB170を検索し、S1015で選択された単語に対応する一義解釈可能な訳語(選択された一つの意味候補に対応する意味を示す要素)を取得する。そして、翻訳修正部109が翻訳テキストを修正する。ここでは、一義解釈可能な訳語として、単語W1に対応する「toilet」が取得され、翻訳テキストにおいて「bathroom」がトイレであることが分かるよう「toilet」を追加または「toilet」に置換することにより翻訳テキストを修正する。
S1017:翻訳出力部112は、修正した翻訳テキストをディスプレイ19に表示させる。ここでは、例えば「toilet」を追加した場合は図6Aに示すように、「The bathroom (toilet) is over there」と表示される。なお、「bathroom」を「toilet」に置換した場合は「The toilet is over there」と表示される。
S1018:S1010において翻訳テキストに多義語が含まれていなかった場合や、S1015においてユーザが再翻訳テキスト中の単語を選択しなかった場合、翻訳サーバ60から取得した翻訳テキスト(ここでは、「The bathroom is over there」)を表示させる。
なお、S1015においてユーザが再翻訳テキストにおける意味候補を選択せずS1018において翻訳テキストがディスプレイ19に表示された後所定時間後、ユーザが再翻訳テキストにおける意味候補を選択した場合は、S1016またはS1017に遷移するようにしてもよい。この場合、ユーザが再翻訳テキスト中の意味候補のいずれかを選択すると、すでに表示されている翻訳テキストも修正され表示される。
[1-3.特徴など]
上記実施の形態に係る翻訳装置10は、第1言語から第2言語に翻訳される内容に第2言語による多義語が含まれているかどうかを判定し、その結果を第1言語で出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
上記実施の形態に係る翻訳装置10は、第1言語から第2言語に翻訳される内容に第2言語による多義語が含まれているかどうかを判定し、その結果を第1言語で出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
特に、第1言語の発話者は、翻訳が正しく行われているかを確認するために再翻訳テキストを見た際に、翻訳テキストに含まれる多義語が本来の意図とは異なる意味に解釈されてしまった場合に、翻訳が正しく行われなかったのではと誤解してしまうことを事前に防ぐことができる。
ユーザは、第1言語の再翻訳テキストにおける複数の意味候補のうち第1言語の発話者が意図する意味候補を選択できる。翻訳装置10は、この選択に応じて第2言語の一義解釈可能な訳語を翻訳テキストに含ませて出力する。よって、第1言語の発話者は、第2言語の被発話者に自身が意図する内容をより確実に伝えることができる。
多義語DB170においては、一つの第2言語による多義語に対し、第1言語による類義語を含む複数の意味候補が対応付けられている。このため、翻訳サーバ60による翻訳結果が多様であっても、多義語に対応する複数の意味候補が検出されることが可能となる。
翻訳装置10による機能は、翻訳サーバ60における翻訳処理を変更することなく、クライアント側である翻訳装置10において実行できることができる。そのため、システムの設計変更やメモリ資源の増加を伴わずに実現できる。
なお、第1言語のテキストに含まれる単語に対応する一以上の第2言語の単語が多義語を含むかどうかを判定することは、第1言語のテキストに含まれる単語に対応する一つの第2言語の単語が多義語であるかどうかを判定すること、および第1言語のテキストに含まれる単語に対応する複数の第2言語の単語のいずれかが多義語であるかどうかを判定することの少なくとも一方を含む。
(実施の形態2)
以下、本開示に係る実施の形態2について説明する。実施の形態1と同様の構成および機能については説明を省略し、同じ図面および符号を参照する場合がある。
以下、本開示に係る実施の形態2について説明する。実施の形態1と同様の構成および機能については説明を省略し、同じ図面および符号を参照する場合がある。
[2-1.構成]
本実施の形態にかかる翻訳システム1、音声認識サーバ50、翻訳サーバ60、音声合成サーバ70、および多義語DB170の構成は、実施の形態1と同様である(図1、図2および図4参照)。
本実施の形態にかかる翻訳システム1、音声認識サーバ50、翻訳サーバ60、音声合成サーバ70、および多義語DB170の構成は、実施の形態1と同様である(図1、図2および図4参照)。
本実施の形態に係る翻訳装置20は、再翻訳テキストではなく原文テキストに関して、第2言語による多義語に対応する複数の第1言語による意味候補を出力する点で、実施の形態1に係る翻訳装置10と異なる。
図7は、本実施の形態2に係る翻訳装置20の構成を示す。翻訳装置20の機能は、主にCPU11がメモリ領域を利用して所定のプログラムを実行することにより実現される。CPU11は、以下の要素またはモジュールを備える。
音声取得部201、原文送信部203、翻訳取得部204、翻訳送信部205、および音声出力部212は、それぞれ、実施の形態1に係る音声取得部101、原文送信部103、翻訳取得部104、翻訳送信部105、および音声出力部113と同様の機能を有する。
原文取得部202(第1言語取得部の一例)は、通信I/F16を介して音声認識サーバ50から音声認識結果の原文テキストを取得する。
多義語処理部207は、多義語DB170を参照して原文テキストに対応する第2言語のテキストに多義語が含まれる可能性があるかどうかを判定する。多義語処理部207はまた、原文テキストに対応する第2言語のテキストに多義語が含まれる可能性がある場合は、原文テキストを修正する。具体的には、多義語処理部207は、後述するように、第2言語の多義語に対応する第1言語の単語を複数列挙した原文テキストを生成する。
原文修正部208は、多義語処理部207の指示に応じて、原文テキストを修正する。
原文出力部209(第1言語出力部の一例)は、修正した原文テキストをディスプレイ19に表示させるために、原文テキストを出力する。
翻訳出力部210(第2言語出力部の一例)は、翻訳取得部204により取得した翻訳テキストをディスプレイ19に表示させるために、翻訳テキストを出力する。
[2-2.動作]
以下、図8に示す、本実施の形態2に係る翻訳装置20(主にCPU11)により実行される処理について説明する。なお、本例では、実施の形態1と同様に、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例を説明する。
以下、図8に示す、本実施の形態2に係る翻訳装置20(主にCPU11)により実行される処理について説明する。なお、本例では、実施の形態1と同様に、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例を説明する。
S2001:音声取得部201は、マイク30から音声データを取得する。ここでは、音声取得部201は、ユーザの日本語の発話者により発せられた音声を取得する。具体的には、図9Aに示すように、発話者により原文テキストT3と発話されたとする。
S2002:音声取得部201は、音声データを音声認識サーバ50に送信する。
S2003:原文取得部202は、音声認識サーバ50によって変換された原文テキストを受信する。
S2004:多義語処理部207は、多義語DB170(図4参照)を参照する。ここでは、上述したように、第1言語を日本語、第2言語を英語とするデータ171Aが選択され、参照される。
S2005:原文テキスト中に、多義語DB170の複数の意味候補のいずれかが含まれているかどうかを判定する。ここでは、原文テキストT3のうち、単語W1が多義語DB170に含まれていると判定される。ここでは、単語W1は多義語であるbathroomに翻訳される可能性があると判断される。
なお、原文テキスト中、多義語DB170の複数の意味候補のうち第1言語の単語が類義語に該当する場合も、同様に判定される。つまり、図9Bに示すように、原文テキストT3aに類義語である単語W6が含まれている場合、単語W6が多義語DB170に含まれていると判定される。
S2006:多義語処理部207は、原文テキストT3において「bathroom」に対応する代表語の複数の意味候補(単語W1および単語W2)を取得する。
なお、多義語に対応する原文テキストの単語が類義語(例えば、単語W6)であった場合、多義語処理部207は、単語W6を取得し、これを代表語の複数の意味候補(単語W1および単語W2)に置換する。
S2007:多義語処理部207の指示に応じて、原文修正部208は、取得した複数の意味候補を列挙するように原文テキストを修正する。ここでは、図9Aに示すように、多義語処理部207は、単語W1を、「複数の意味候補」の列挙である「{単語W1|単語W2}」に置換して、修正原文テキストT4を出力する。
なお、実施の形態1と同様に、「複数の意味候補」の列挙のために検出された単語である単語W6をそのまま用いて{単語W2|単語W6}を含むテキストとして修正原文テキストT4a(図9B参照)を出力してもよい。
S2008:原文出力部209は、修正した原文テキストをディスプレイ19に表示させる。ここでは、原文出力部209は、図9Aに示すように、{単語W1|単語W2}を含む修正原文テキストT4を表示させる。
なお、ここで音声認識の誤りにより原文テキストに誤りがある場合は、S2001に戻り音声の入力をやり直してもよい。
S2009:一方、多義語処理部207は、原文テキストにおいて多義語に対応する単語が含まれる可能性がない場合、原文出力部209を介して、そのまま原文テキストをディスプレイ19に表示させる。なお、ここで音声認識の誤りにより原文テキストに誤りがある場合は、S2001に戻り音声の入力をやり直してもよい。
S2010:原文テキストは翻訳サーバ60に送信される。
S2011:翻訳サーバ60によって生成された翻訳テキストが受信される。
S2012:受信された翻訳テキストはディスプレイ19に表示される。
[2-3.特徴など]
上記実施の形態に係る翻訳装置20は、翻訳サーバ60による翻訳処理を待たずに、第1言語から第2言語に翻訳される内容に多義語が含まれる可能性があるかどうかを判定し、その結果を出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語がある可能性があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
上記実施の形態に係る翻訳装置20は、翻訳サーバ60による翻訳処理を待たずに、第1言語から第2言語に翻訳される内容に多義語が含まれる可能性があるかどうかを判定し、その結果を出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語がある可能性があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
実施の形態1と同様に、多義語DB170においては、一つの第2言語による多義語に対し、第1言語による類義語を含む複数の意味候補が対応付けられている。そのため、翻訳サーバ60による翻訳結果が多様であっても、多義語に対応する複数の意味候補が検出されることが可能となる。
翻訳装置20による機能は、実施の形態1と同様に、翻訳サーバ60における翻訳処理を変更することなく、クライアント側において実行できることができる。そのため、システムの設計変更やメモリ資源の増加を伴わずに実現できる。
[2-4.変形例]
上記実施の形態2に係る翻訳装置20は、多義語がある場合は、実施の形態1と同様に、表示される翻訳テキストにおいて一義語解釈可能な訳語を追記または置換するようにしてもよい。以下、図8におけるS2012を以下の処理に置き換えて、図10を参照して説明する。
上記実施の形態2に係る翻訳装置20は、多義語がある場合は、実施の形態1と同様に、表示される翻訳テキストにおいて一義語解釈可能な訳語を追記または置換するようにしてもよい。以下、図8におけるS2012を以下の処理に置き換えて、図10を参照して説明する。
S2111:図8のS2011において翻訳テキストを受信した後、多義語処理部207は、多義語DB170を参照する。ここでは、データ171A(図4参照)が選択され、参照される。
S2112:多義語処理部207は、データ171Aにおいて、翻訳テキストにS2006で取得した単語に対応する多義語(bathroom)が含まれているかどうかを判定する。ここでは、翻訳テキスト中にbathroomがある場合はS2113に進み、翻訳テキスト中にbathroomがない場合はS2115に進む。
S2113:多義語処理部207は、多義語DB170を検索し、S2112で判定された多義語に対応する一義解釈可能な訳語を取得する。そして、原文修正部208は、実施の形態1の翻訳修正部109と同様に、翻訳テキストを修正する。ここでは、原文修正部208は、一義解釈可能な訳語として「toilet」を取得し、翻訳テキストにおいて「bathroom」がトイレであることが分かるように、「toilet」を追加または「toilet」に置換することにより翻訳テキストを修正する。
S2114:翻訳出力部210は、修正した翻訳テキストをディスプレイ19に表示させる。ここでは、例えば図11に示すように「The bathroom (toilet) is over there」と表示される。なお、「bathroom」を「toilet」に置換した場合は「The toilet is over there」と表示される。
S2115:S2112において翻訳テキスト中に多義語が含まれていない場合、翻訳出力部210は、翻訳サーバ60から受信した翻訳テキスト(ここでは、「The bathroom is over there」)を出力して、ディスプレイ19に表示させる。
ここでは、第1言語の原文テキストに多義語に対応する単語が含まれる可能性があるかどうかを判定したことに基づき、翻訳テキストにおいてその多義語が含まれていると判定した場合、翻訳出力部210は、翻訳テキストに第2言語の一義解釈可能な訳語を含ませて出力する。よって、第1言語の発話者は、第2言語の被発話者に自身が意図する内容をより確実に伝えることができる。
(実施の形態3)
実施の形態1に係る翻訳装置10は、第2言語の単語が多義語であるか否かを判定し、第2言語の単語が多義語であると判定した場合に、複数の意味候補を出力する。すなわち、翻訳装置10のユーザが、複数の意味候補の中から、一つの意味候補を選択する必要がある。
実施の形態1に係る翻訳装置10は、第2言語の単語が多義語であるか否かを判定し、第2言語の単語が多義語であると判定した場合に、複数の意味候補を出力する。すなわち、翻訳装置10のユーザが、複数の意味候補の中から、一つの意味候補を選択する必要がある。
そこで、本実施の形態に係る翻訳装置10は、第2言語の単語が多義語であると判定した場合に、第1言語の一義語を含む文章を翻訳サーバに送信する。翻訳サーバは、この文章について翻訳および再翻訳を行う。これにより、本実施の形態に係る翻訳装置10は、ユーザによる選択なしに、第1言語の原文章と、再翻訳文章との不整合を低減することを可能にしている。
以下、本開示に係る実施の形態3について図1~図3、図12Aおよび図12Bを用いて説明する。実施の形態1と同様の構成および機能については説明を省略し、同じ図面および符号を参照する場合がある。また、実施の形態1と同様に、第1言語が日本語であり、第2言語が英語である例を用いて本実施の形態を説明する。
[3-1.動作]
翻訳装置10の記憶部17は、図12Aに示すような多義語テーブル180を格納している。多義語テーブル180には、日本語の単語W11(トイレを意味する単語)、単語W11に対応する日本語の一義語W12(台所を意味する単語)、単語W12に対応する英語の置換翻訳語W13(kitchen)、および単語W11に対応する英語の翻訳語W14(bathroom)が記憶されている。具体的には、翻訳語W14は、単語W11の英訳語である。また、置換翻訳語W13は、一義語W12の英訳語である。単語W11と一義語W12とは、例えば、同一のカテゴリに属する単語である。ここでは、単語W11と一義語W12とは、場所を意味するカテゴリに属している。一義語W12は、単語W11と同じ意味を有していなくてもよい。さらに、多義語テーブル180には、翻訳語W14の属性が記録されている。ここでは、翻訳語W14の属性として、翻訳語W14が多義語であることが記録されている。ここで、一義語W12は、翻訳サーバ60の翻訳処理において、一義的に置換翻訳語W13であるkitchenに翻訳される単語である。
翻訳装置10の記憶部17は、図12Aに示すような多義語テーブル180を格納している。多義語テーブル180には、日本語の単語W11(トイレを意味する単語)、単語W11に対応する日本語の一義語W12(台所を意味する単語)、単語W12に対応する英語の置換翻訳語W13(kitchen)、および単語W11に対応する英語の翻訳語W14(bathroom)が記憶されている。具体的には、翻訳語W14は、単語W11の英訳語である。また、置換翻訳語W13は、一義語W12の英訳語である。単語W11と一義語W12とは、例えば、同一のカテゴリに属する単語である。ここでは、単語W11と一義語W12とは、場所を意味するカテゴリに属している。一義語W12は、単語W11と同じ意味を有していなくてもよい。さらに、多義語テーブル180には、翻訳語W14の属性が記録されている。ここでは、翻訳語W14の属性として、翻訳語W14が多義語であることが記録されている。ここで、一義語W12は、翻訳サーバ60の翻訳処理において、一義的に置換翻訳語W13であるkitchenに翻訳される単語である。
図3および図12Bを参照しながら、本実施の形態に係る翻訳装置10の動作の詳細を説明する。
まず、翻訳装置10の原文取得部102は、通信I/F16(通信部の一例)を介して、音声認識サーバ50で音声認識された結果である日本語の原文章T11を取得する。ここで、原文章T11には、単語W11が含まれている。
多義語処理部107は、記憶部17に格納された多義語テーブル180を参照して、原文章T11に含まれる単語W11に対応する翻訳語W14が多義語であるか否かを判定する。具体的には、多義語処理部107は、多義語テーブル180を参照して、翻訳語W14の属性を確認する。翻訳語W14の属性において翻訳語W14が多義語であることが記録されていれば、多義語処理部107は、翻訳語W14が多義語であると判定する。多義語処理部107は、翻訳語W14が多義語であると判定した場合、単語W11を一義語W12に置換することにより、日本語の置換文章T12を生成する。
通信I/F16は、置換文章T12を翻訳サーバ60(図1参照)に送信する。
翻訳サーバ60は、置換文章T12を英語に翻訳することにより、英語の置換翻訳文章T13を生成する。ここで、前述したように、置換文章T12に含まれる一義語W12は、翻訳サーバ60の翻訳処理において、一義的に置換翻訳語W13に翻訳される。すなわち、置換翻訳文章T1・BR>Rは、置換翻訳語W13を含む。
翻訳サーバ60は、さらに、置換翻訳文章T13を日本語に再翻訳することにより、置換再翻訳文章T15を生成する。このとき、先ほどと同様に、置換翻訳文章T13に含まれる置換翻訳語W13は、翻訳サーバ60の再翻訳処理において、一義的に一義語W12に再翻訳される。すなわち、置換再翻訳文章T15は、一義語W12を含む。
通信I/F16は、英語の置換翻訳文章T13および日本語の置換再翻訳文章T15を受信する。
再翻訳修正部108は、通信I/F16を介して、日本語の置換再翻訳文章T15を取得する。そして、再翻訳修正部108は、多義語テーブル180を参照して、置換再翻訳文章T15に含まれる一義語W12を単語W11に置換する。これにより、再翻訳修正部108は、日本語の再翻訳文章T16を生成する。再翻訳出力部111は、再翻訳文章T16を出力する。具体的には、再翻訳出力部111は、ディスプレイ19の表示エリアA1に、再翻訳文章T16を表示させる。
翻訳修正部109は、通信I/F16を介して、英語の置換翻訳文章T13を取得する。そして、翻訳修正部109は、多義語テーブル180を参照して、置換翻訳文章T13に含まれる置換翻訳語W13を翻訳語W14に置換する。これにより、翻訳修正部109は、英語の翻訳文章T14を生成する。翻訳出力部112は、翻訳文章T14を出力する。具体的には、翻訳出力部112は、ディスプレイ19の表示エリアA2に、翻訳文章T14を表示させる。
以上のようにして、翻訳装置10は、ユーザによる意味候補の選択なしに、再翻訳文章T16を出力することができる。
[3-2.特徴など]
本実施の形態に係る翻訳装置10は、記憶部17に格納された多義語テーブル180を参照して、第2言語の翻訳語W14が多義語であるか否かを判定する。そして、翻訳語W14が多義語である場合に、翻訳装置10は、翻訳語W14に対応した日本語の単語W11を一義語W12に置換する。これにより、翻訳装置10は、翻訳サーバ60側において翻訳処理を変更することなく、端末側において文章T11と再翻訳文章T16との不整合を低減することができる。
本実施の形態に係る翻訳装置10は、記憶部17に格納された多義語テーブル180を参照して、第2言語の翻訳語W14が多義語であるか否かを判定する。そして、翻訳語W14が多義語である場合に、翻訳装置10は、翻訳語W14に対応した日本語の単語W11を一義語W12に置換する。これにより、翻訳装置10は、翻訳サーバ60側において翻訳処理を変更することなく、端末側において文章T11と再翻訳文章T16との不整合を低減することができる。
(その他実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態1~3を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1~3で説明した各構成要素及び機能を組み合わせて、新たな実施の形態とすることも可能である。
以上のように、本出願において開示する技術の例示として、実施の形態1~3を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1~3で説明した各構成要素及び機能を組み合わせて、新たな実施の形態とすることも可能である。
そこで、以下、他の実施の形態を例示する。
[1]
図13は、上記実施の形態に係る翻訳装置10または翻訳装置20のディスプレイ19の画面例を示す。同画面は、図2に示す画面と同様であり、第1言語の表示エリアA1と、第2言語の表示エリアA2を含む。本例では、複数の意味候補をテキストではなく、図や写真で表示する。
図13は、上記実施の形態に係る翻訳装置10または翻訳装置20のディスプレイ19の画面例を示す。同画面は、図2に示す画面と同様であり、第1言語の表示エリアA1と、第2言語の表示エリアA2を含む。本例では、複数の意味候補をテキストではなく、図や写真で表示する。
例えば、単語W7を含む原文テキストL3-1が取得された場合、単語W7に対応する第2の言語の単語(Nikko)は多義語と判断される。この場合、取得された再翻訳テキスト(または原文テキスト)は、多義語処理部107または多義語処理部207により処理される。そして、「Nikko」に置換されたテキストL3-2とともに、2つのNikkoの意味を表す写真が選択可能なように表示される。図13では、ホテル名を意味するNikkoとそのイメージ写真Aが中段に表示され、観光地を意味するNikkoのイメージ写真B、Cが下段に表示される。第1言語の発話者は、これらのイメージ写真を見ていずれのNikkoを意味するかを選択できる。ここでは、観光地を意味するNikkoのイメージ写真が選択される。この結果、第2言語を使用する被発話者に対し、選択された観光地Nikkoに関連するイメージ写真B,Cや地図などの画像が表示エリアA2において示される。
なお、写真や地図などの他に、絵、マーク、記号などの画像を用いて当該単語が多義語に関連しているということを表示するようにしてもよい。
[2]
実施の形態1において、再翻訳の結果、重複した単語が出力される場合がある。例えば、原文テキストが図14に示す第1言語のテキストT5であり、取得した翻訳テキストが「You will see a toilet on the right side and a bathroom on the left side」であったとする。この場合、再翻訳テキストは、例えば2つの単語W1を含むテキストT6となる可能性がある。この場合、テキストT6に含まれる2つの単語W1のうち、どちらの単語W1がtoiletに相当し、どちらの単語W1がbathroomに相当するか判別できない。
実施の形態1において、再翻訳の結果、重複した単語が出力される場合がある。例えば、原文テキストが図14に示す第1言語のテキストT5であり、取得した翻訳テキストが「You will see a toilet on the right side and a bathroom on the left side」であったとする。この場合、再翻訳テキストは、例えば2つの単語W1を含むテキストT6となる可能性がある。この場合、テキストT6に含まれる2つの単語W1のうち、どちらの単語W1がtoiletに相当し、どちらの単語W1がbathroomに相当するか判別できない。
かかる場合、翻訳装置10は、(1)翻訳サーバ60にアクセスして、各単語の翻訳対応関係情報を取得し、いずれの単語W1がトイレであるかを判定する。あるいは、翻訳装置10は、(2)単語の登場する位置などに基づき、いずれの単語W1がトイレであるかを判定する。これにより、翻訳装置10は、どちらの単語W1がBathroomに翻訳されたものかを判断し、再翻訳テキスト中のBathroomに対応する単語W1を{単語W1|単語W2}と修正する。そして、翻訳装置10は、修正翻訳テキストとして、テキストT7を出力することができる。
[3]
上記実施の形態に係る翻訳装置10または翻訳装置20の各処理機能は、例えば、CPU(又はMPU(Micro Processing Unit)、MCU(Micro Controller Unit)などのマイクロ・コンピュータ)の制御回路上で、その全部又は任意の一部を実行するようにしてもよい。また、各処理機能は、CPU(又はMPU、MCUなどのマイクロ・コンピュータ)で解析実行するプログラム上、又はワイヤードロジックによるハードウェア上で、その全部又は任意の一部を実行するようにしてもよい。
上記実施の形態に係る翻訳装置10または翻訳装置20の各処理機能は、例えば、CPU(又はMPU(Micro Processing Unit)、MCU(Micro Controller Unit)などのマイクロ・コンピュータ)の制御回路上で、その全部又は任意の一部を実行するようにしてもよい。また、各処理機能は、CPU(又はMPU、MCUなどのマイクロ・コンピュータ)で解析実行するプログラム上、又はワイヤードロジックによるハードウェア上で、その全部又は任意の一部を実行するようにしてもよい。
また、翻訳装置10または翻訳装置20は、1つまたは複数のプロセッサまたは回路により構成されていてもよい。翻訳装置10または翻訳装置20は、1つまたは複数の半導体チップにより構成されていてもよい。
[4]
上記実施の形態において、翻訳装置10または翻訳装置20は、第1言語の音声を取得しているが、第1言語のテキストを原文テキストとして直接取得するようにしてもよい。
上記実施の形態において、翻訳装置10または翻訳装置20は、第1言語の音声を取得しているが、第1言語のテキストを原文テキストとして直接取得するようにしてもよい。
[5]
上記実施の形態において、表示されるテキストを修正して意味候補を列挙していたが、音声出力で複数の意味候補を列挙してもよい。
上記実施の形態において、表示されるテキストを修正して意味候補を列挙していたが、音声出力で複数の意味候補を列挙してもよい。
[6]
上記実施の形態において、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70は別体のサーバに限定されない。これら全てまたはその一部が一つのコンピュータ装置に設けられていてもよい。
上記実施の形態において、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70は別体のサーバに限定されない。これら全てまたはその一部が一つのコンピュータ装置に設けられていてもよい。
[7]
上記実施の形態における処理(図5、図8、図10など)の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。
上記実施の形態における処理(図5、図8、図10など)の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。
[8]
本開示に係る翻訳装置10または翻訳装置20は、上記実施の形態により実施されることに限られない。翻訳装置10または翻訳装置20により実行される翻訳方法や、コンピュータプログラム、かかるプログラムを記録したコンピュータ読み取り可能な記録媒体は、本開示の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標)Disc)、半導体メモリを挙げることができる。
本開示に係る翻訳装置10または翻訳装置20は、上記実施の形態により実施されることに限られない。翻訳装置10または翻訳装置20により実行される翻訳方法や、コンピュータプログラム、かかるプログラムを記録したコンピュータ読み取り可能な記録媒体は、本開示の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標)Disc)、半導体メモリを挙げることができる。
上記コンピュータプログラムは、上記記録媒体に記録されたものに限られず、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。
本開示は、翻訳装置または翻訳方法として利用可能である。
1 :翻訳システム
10 :翻訳装置
11 :CPU
12 :ROM
13 :RAM
14 :入力I/F
15 :出力I/F
16 :通信I/F
17 :記憶部
18 :入力操作部
19 :ディスプレイ(表示部)
30 :マイク
40 :スピーカ
50 :音声認識サーバ
60 :翻訳サーバ
70 :音声合成サーバ
101 :音声取得部
102 :原文取得部(第1言語取得部)
103 :原文送信部
104 :翻訳取得部(第2言語取得部)
105 :翻訳送信部
106 :再翻訳取得部(第1言語取得部)
107 :多義語処理部
108 :再翻訳修正部
109 :翻訳修正部
110 :原文出力部
111 :再翻訳出力部(第1言語出力部)
112 :翻訳出力部(第2言語出力部)
113 :音声出力部
20 :翻訳装置
201 :音声取得部
202 :原文取得部(第1言語取得部)
203 :原文送信部
204 :翻訳取得部
205 :翻訳送信部
207 :多義語処理部
208 :原文修正部
209 :原文出力部
210 :翻訳出力部
212 :音声出力部
10 :翻訳装置
11 :CPU
12 :ROM
13 :RAM
14 :入力I/F
15 :出力I/F
16 :通信I/F
17 :記憶部
18 :入力操作部
19 :ディスプレイ(表示部)
30 :マイク
40 :スピーカ
50 :音声認識サーバ
60 :翻訳サーバ
70 :音声合成サーバ
101 :音声取得部
102 :原文取得部(第1言語取得部)
103 :原文送信部
104 :翻訳取得部(第2言語取得部)
105 :翻訳送信部
106 :再翻訳取得部(第1言語取得部)
107 :多義語処理部
108 :再翻訳修正部
109 :翻訳修正部
110 :原文出力部
111 :再翻訳出力部(第1言語出力部)
112 :翻訳出力部(第2言語出力部)
113 :音声出力部
20 :翻訳装置
201 :音声取得部
202 :原文取得部(第1言語取得部)
203 :原文送信部
204 :翻訳取得部
205 :翻訳送信部
207 :多義語処理部
208 :原文修正部
209 :原文出力部
210 :翻訳出力部
212 :音声出力部
Claims (13)
- 第1言語から第2言語への翻訳を行う翻訳装置であって、
前記第1言語の文章を取得する第1言語取得部と、
前記文章に含まれる前記第1言語の単語に対応する前記第2言語の単語が多義語であるかどうかを判定し、前記第2言語の単語が多義語であると判定した場合、前記第2言語の単語に対応する複数の意味候補を取得する多義語処理部と、
前記複数の意味候補を出力する第1言語出力部と、
を備える、翻訳装置。 - 前記複数の意味候補の各々は、画像および前記第1言語の文字列の少なくとも一方である、
請求項1に記載の翻訳装置。 - 表示部を備え、
前記第1言語出力部は、前記複数の意味候補の各々を選択可能な状態で前記表示部に表示させる、
請求項1に記載の翻訳装置。 - 前記文章を前記第2言語に翻訳することにより生成された翻訳文章を取得する第2言語取得部と、
前記翻訳文章を前記表示部に表示させる第2言語出力部と、
をさらに備え、
前記複数の意味候補のうちの一つの意味候補が選択された場合、前記第2言語出力部は、前記一つの意味候補に対応する意味を示す要素を出力する、
請求項3に記載の翻訳装置。 - 前記要素は、画像および前記第2言語のテキストの少なくとも一方である、
請求項4に記載の翻訳装置。 - 前記第1言語の原文章を前記第2言語に翻訳することにより生成された翻訳文章を取得する第2言語取得部をさらに備え、
前記第1言語取得部は、前記翻訳文章をさらに前記第1言語に再翻訳することにより生成された再翻訳文章を前記文章として取得する、
請求項1に記載の翻訳装置。 - 表示部を備え、
前記第1言語出力部は、前記原文章と、前記再翻訳文章とを同時に前記表示部に表示させる、
請求項6に記載の翻訳装置。 - さらに、前記第2言語の単語と、前記複数の意味候補とを含むデータを記憶する記憶部を備え、
前記多義語処理部は、前記データに基づき、前記第2言語の単語が前記多義語であるかどうかを判定する、
請求項1に記載の翻訳装置。 - 前記複数の意味候補は、代表データと、前記代表データに対応する類義データとを含む、
請求項1に記載の翻訳装置。 - 前記第1言語出力部は、前記複数の意味候補である複数の前記第1言語のテキストで前記第1言語の単語を置換することにより生成された修正文章を出力する、
請求項1に記載の翻訳装置。 - 前記第1言語出力部は、前記複数の意味候補である複数の画像とともに前記文章を出力する、
請求項1に記載の翻訳装置。 - 翻訳サーバを用いて、第1言語から第2言語への翻訳を行い、かつ、前記第2言語から前記第1言語への再翻訳を行う翻訳装置であって、
前記第1言語の単語と、前記第1言語の単語に対応する前記第1言語の一義語と、前記一義語に対応する前記第2言語の置換翻訳語と、前記第1言語の単語に対応する前記第2言語の翻訳語とを記憶する記憶部と、
前記第1言語の文章を取得する第1言語取得部と、
前記文章に含まれる前記第1言語の単語に対応する前記翻訳語が多義語であるかどうかを判定し、前記翻訳語が多義語であると判定した場合、前記第1言語の単語を前記一義語に置換することにより前記第1言語の置換文章を生成する多義語処理部と、
前記置換文章を前記翻訳サーバに送信し、前記置換文章を前記第2言語に翻訳することにより生成され、前記置換翻訳語を含む前記第2言語の置換翻訳文章、および、前記置換翻訳文章を前記第1言語に再翻訳することにより生成され、前記一義語を含む前記第1言語の置換再翻訳文章を、前記翻訳サーバから受信する通信部と、
前記置換再翻訳文章に含まれる前記一義語を前記第1言語の単語に置換することにより生成された前記第1言語の再翻訳文章を出力する第1言語出力部と、
前記置換翻訳文章に含まれる前記置換翻訳語を前記翻訳語に置換することにより生成された前記第2言語の翻訳文章を出力する第2言語出力部と、
を備える、翻訳装置。 - コンピュータを用いて第1言語から第2言語への翻訳を行う翻訳方法であって、
前記第1言語の文章を取得し、
前記文章に含まれる前記第1言語の単語に対応する前記第2言語の単語が多義語であるかどうかを判定し、
前記第2言語の単語が多義語であると判定した場合、前記第2言語の単語に対応する複数の意味候補を記憶部より取得し、
前記複数の意味候補を出力する、
ことを含む、翻訳方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018556230A JP6706810B2 (ja) | 2016-12-13 | 2017-10-25 | 翻訳装置および翻訳方法 |
US16/273,182 US10929618B2 (en) | 2016-12-13 | 2019-02-12 | Translation device and translation method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016241704 | 2016-12-13 | ||
JP2016-241704 | 2016-12-13 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US16/273,182 Continuation US10929618B2 (en) | 2016-12-13 | 2019-02-12 | Translation device and translation method |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018110096A1 true WO2018110096A1 (ja) | 2018-06-21 |
Family
ID=62559651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2017/038441 WO2018110096A1 (ja) | 2016-12-13 | 2017-10-25 | 翻訳装置および翻訳方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10929618B2 (ja) |
JP (1) | JP6706810B2 (ja) |
WO (1) | WO2018110096A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991196A (zh) * | 2019-12-18 | 2020-04-10 | 北京百度网讯科技有限公司 | 多义词的翻译方法、装置、电子设备及介质 |
WO2020149069A1 (ja) * | 2019-01-15 | 2020-07-23 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法およびプログラム |
EP3828752A4 (en) * | 2018-07-23 | 2021-07-28 | Fujitsu Limited | GENERATION METHOD, GENERATION PROGRAM AND INFORMATION PROCESSING DEVICE |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210036169A (ko) * | 2019-09-25 | 2021-04-02 | 현대자동차주식회사 | 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법 |
US11908452B1 (en) * | 2021-05-20 | 2024-02-20 | Amazon Technologies, Inc. | Alternative input representations for speech inputs |
CN113723116B (zh) * | 2021-08-25 | 2024-02-13 | 中国科学技术大学 | 文本翻译方法及相关装置、电子设备、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612449A (ja) * | 1992-06-29 | 1994-01-21 | Canon Inc | 機械翻訳装置及びその方法 |
WO2000013102A1 (fr) * | 1998-08-31 | 2000-03-09 | Sony Corporation | Dispositif et procede pour le traitement du langage naturel |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0561908A (ja) | 1991-08-30 | 1993-03-12 | Sharp Corp | 電子翻訳機 |
JPH1153363A (ja) | 1997-07-30 | 1999-02-26 | Fujitsu Ltd | 翻訳機および記録媒体 |
JP4935869B2 (ja) * | 2009-08-07 | 2012-05-23 | カシオ計算機株式会社 | 電子機器及びプログラム |
-
2017
- 2017-10-25 WO PCT/JP2017/038441 patent/WO2018110096A1/ja active Application Filing
- 2017-10-25 JP JP2018556230A patent/JP6706810B2/ja active Active
-
2019
- 2019-02-12 US US16/273,182 patent/US10929618B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612449A (ja) * | 1992-06-29 | 1994-01-21 | Canon Inc | 機械翻訳装置及びその方法 |
WO2000013102A1 (fr) * | 1998-08-31 | 2000-03-09 | Sony Corporation | Dispositif et procede pour le traitement du langage naturel |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3828752A4 (en) * | 2018-07-23 | 2021-07-28 | Fujitsu Limited | GENERATION METHOD, GENERATION PROGRAM AND INFORMATION PROCESSING DEVICE |
WO2020149069A1 (ja) * | 2019-01-15 | 2020-07-23 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法およびプログラム |
CN110991196A (zh) * | 2019-12-18 | 2020-04-10 | 北京百度网讯科技有限公司 | 多义词的翻译方法、装置、电子设备及介质 |
CN110991196B (zh) * | 2019-12-18 | 2021-10-26 | 北京百度网讯科技有限公司 | 多义词的翻译方法、装置、电子设备及介质 |
US11275904B2 (en) | 2019-12-18 | 2022-03-15 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for translating polysemy, and medium |
JP7196145B2 (ja) | 2019-12-18 | 2022-12-26 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 多義語の翻訳方法、多義語の翻訳装置、電子機器及び媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20190171718A1 (en) | 2019-06-06 |
JPWO2018110096A1 (ja) | 2019-02-28 |
US10929618B2 (en) | 2021-02-23 |
JP6706810B2 (ja) | 2020-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6706810B2 (ja) | 翻訳装置および翻訳方法 | |
JP4050755B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
US9053098B2 (en) | Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense | |
JP4058071B2 (ja) | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム | |
US8924195B2 (en) | Apparatus and method for machine translation | |
US9002696B2 (en) | Data security system for natural language translation | |
US7904291B2 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US9411801B2 (en) | General dictionary for all languages | |
US20090326912A1 (en) | Means and a method for training a statistical machine translation system | |
US20140081619A1 (en) | Photography Recognition Translation | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JP2008083994A (ja) | 辞書登録装置、辞書登録方法及び辞書登録プログラム | |
TWI223165B (en) | Japanese virtual dictionary | |
JP5083317B2 (ja) | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 | |
JP4042360B2 (ja) | 自動通訳システム及びその方法並びにプログラム | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
WO2020149069A1 (ja) | 翻訳装置、翻訳方法およびプログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
US20130080144A1 (en) | Machine translation apparatus, a method and a non-transitory computer readable medium thereof | |
JP2011186507A (ja) | 翻訳前換言規則生成システム、翻訳前換言規則生成方法および翻訳前換言規則生成用プログラム | |
JP2008269122A (ja) | 処理単位分割装置、処理単位分割方法、及びプログラム | |
JP2017181727A (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP4021813B2 (ja) | 複合語登録プログラムおよび登録装置 | |
Majrashi | Voice versus keyboard and mouse for text creation on arabic user interfaces. | |
JP5331964B2 (ja) | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ENP | Entry into the national phase |
Ref document number: 2018556230 Country of ref document: JP Kind code of ref document: A |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17880606 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 17880606 Country of ref document: EP Kind code of ref document: A1 |