JPWO2018110096A1 - 翻訳装置および翻訳方法 - Google Patents
翻訳装置および翻訳方法 Download PDFInfo
- Publication number
- JPWO2018110096A1 JPWO2018110096A1 JP2018556230A JP2018556230A JPWO2018110096A1 JP WO2018110096 A1 JPWO2018110096 A1 JP WO2018110096A1 JP 2018556230 A JP2018556230 A JP 2018556230A JP 2018556230 A JP2018556230 A JP 2018556230A JP WO2018110096 A1 JPWO2018110096 A1 JP WO2018110096A1
- Authority
- JP
- Japan
- Prior art keywords
- language
- word
- translation
- text
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
[1−1.構成]
図1は、本開示の一実施形態に係る翻訳システム1の全体構成を概略的に示す。翻訳システム1は、翻訳装置10と、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70を備える。音声認識サーバ50、翻訳サーバ60、および音声合成サーバ70は、それぞれ、翻訳装置10とネットワークを介して接続可能である。
図1に示すように、翻訳装置10は、CPU11、ROM12、RAM13、入力I/F(インタフェース)14、出力I/F(インタフェース)15、通信I/F(インタフェース)16、入力操作部18、およびディスプレイ19を備えるコンピュータ装置である。翻訳装置10はまた、記憶部17、マイク30およびスピーカ40を備える。
図3は、翻訳装置10の構成を示す。翻訳装置10の機能は、主にCPU11がメモリ領域を利用して所定のプログラムを実行することにより実現される。CPU11は、以下の要素またはモジュールを備える。
図4は、本開示の一例に係る多義語DB170の構成を概略的に示す。多義語DB170は、一つの第2言語に係る単語の意味が第1言語において複数ある場合、その第2言語の単語と対応する複数の第1言語による単語とを対応付けて格納するデータベースである。
以下、図5に示す、本実施の形態1に係る翻訳装置10により実行される処理について説明する。なお、本例では、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例について説明する。
上記実施の形態に係る翻訳装置10は、第1言語から第2言語に翻訳される内容に第2言語による多義語が含まれているかどうかを判定し、その結果を第1言語で出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
以下、本開示に係る実施の形態2について説明する。実施の形態1と同様の構成および機能については説明を省略し、同じ図面および符号を参照する場合がある。
本実施の形態にかかる翻訳システム1、音声認識サーバ50、翻訳サーバ60、音声合成サーバ70、および多義語DB170の構成は、実施の形態1と同様である(図1、図2および図4参照)。
以下、図8に示す、本実施の形態2に係る翻訳装置20(主にCPU11)により実行される処理について説明する。なお、本例では、実施の形態1と同様に、ユーザである日本語(第1言語)の発話者が発話した内容を翻訳して英語(第2言語)の被発話者に伝える例を説明する。
上記実施の形態に係る翻訳装置20は、翻訳サーバ60による翻訳処理を待たずに、第1言語から第2言語に翻訳される内容に多義語が含まれる可能性があるかどうかを判定し、その結果を出力する。このため、第1言語の発話者は、第2言語に翻訳された内容に多義語がある可能性があるため、発話者の意図が第2言語の被発話者に伝わらない可能性があることを予め認識できる。よって、第1言語の発話者は、誤解が生じることを予め防止する手段を講じる、あるいは誤解が生じてもその理由を理解し適切な対応を取りやすくなる。そのため、第2言語の被発話者とのコミュニケーションを円滑に進めることができる。
上記実施の形態2に係る翻訳装置20は、多義語がある場合は、実施の形態1と同様に、表示される翻訳テキストにおいて一義語解釈可能な訳語を追記または置換するようにしてもよい。以下、図8におけるS2012を以下の処理に置き換えて、図10を参照して説明する。
実施の形態1に係る翻訳装置10は、第2言語の単語が多義語であるか否かを判定し、第2言語の単語が多義語であると判定した場合に、複数の意味候補を出力する。すなわち、翻訳装置10のユーザが、複数の意味候補の中から、一つの意味候補を選択する必要がある。
翻訳装置10の記憶部17は、図12Aに示すような多義語テーブル180を格納している。多義語テーブル180には、日本語の単語W11(トイレを意味する単語)、単語W11に対応する日本語の一義語W12(台所を意味する単語)、単語W12に対応する英語の置換翻訳語W13(kitchen)、および単語W11に対応する英語の翻訳語W14(bathroom)が記憶されている。具体的には、翻訳語W14は、単語W11の英訳語である。また、置換翻訳語W13は、一義語W12の英訳語である。単語W11と一義語W12とは、例えば、同一のカテゴリに属する単語である。ここでは、単語W11と一義語W12とは、場所を意味するカテゴリに属している。一義語W12は、単語W11と同じ意味を有していなくてもよい。さらに、多義語テーブル180には、翻訳語W14の属性が記録されている。ここでは、翻訳語W14の属性として、翻訳語W14が多義語であることが記録されている。ここで、一義語W12は、翻訳サーバ60の翻訳処理において、一義的に置換翻訳語W13であるkitchenに翻訳される単語である。
本実施の形態に係る翻訳装置10は、記憶部17に格納された多義語テーブル180を参照して、第2言語の翻訳語W14が多義語であるか否かを判定する。そして、翻訳語W14が多義語である場合に、翻訳装置10は、翻訳語W14に対応した日本語の単語W11を一義語W12に置換する。これにより、翻訳装置10は、翻訳サーバ60側において翻訳処理を変更することなく、端末側において文章T11と再翻訳文章T16との不整合を低減することができる。
以上のように、本出願において開示する技術の例示として、実施の形態1〜3を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1〜3で説明した各構成要素及び機能を組み合わせて、新たな実施の形態とすることも可能である。
図13は、上記実施の形態に係る翻訳装置10または翻訳装置20のディスプレイ19の画面例を示す。同画面は、図2に示す画面と同様であり、第1言語の表示エリアA1と、第2言語の表示エリアA2を含む。本例では、複数の意味候補をテキストではなく、図や写真で表示する。
実施の形態1において、再翻訳の結果、重複した単語が出力される場合がある。例えば、原文テキストが図14に示す第1言語のテキストT5であり、取得した翻訳テキストが「You will see a toilet on the right side and a bathroom on the left side」であったとする。この場合、再翻訳テキストは、例えば2つの単語W1を含むテキストT6となる可能性がある。この場合、テキストT6に含まれる2つの単語W1のうち、どちらの単語W1がtoiletに相当し、どちらの単語W1がbathroomに相当するか判別できない。
上記実施の形態に係る翻訳装置10または翻訳装置20の各処理機能は、例えば、CPU(又はMPU(Micro Processing Unit)、MCU(Micro Controller Unit)などのマイクロ・コンピュータ)の制御回路上で、その全部又は任意の一部を実行するようにしてもよい。また、各処理機能は、CPU(又はMPU、MCUなどのマイクロ・コンピュータ)で解析実行するプログラム上、又はワイヤードロジックによるハードウェア上で、その全部又は任意の一部を実行するようにしてもよい。
上記実施の形態において、翻訳装置10または翻訳装置20は、第1言語の音声を取得しているが、第1言語のテキストを原文テキストとして直接取得するようにしてもよい。
上記実施の形態において、表示されるテキストを修正して意味候補を列挙していたが、音声出力で複数の意味候補を列挙してもよい。
上記実施の形態において、音声認識サーバ50と、翻訳サーバ60と、音声合成サーバ70は別体のサーバに限定されない。これら全てまたはその一部が一つのコンピュータ装置に設けられていてもよい。
上記実施の形態における処理(図5、図8、図10など)の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。
本開示に係る翻訳装置10または翻訳装置20は、上記実施の形態により実施されることに限られない。翻訳装置10または翻訳装置20により実行される翻訳方法や、コンピュータプログラム、かかるプログラムを記録したコンピュータ読み取り可能な記録媒体は、本開示の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray(登録商標)Disc)、半導体メモリを挙げることができる。
10 :翻訳装置
11 :CPU
12 :ROM
13 :RAM
14 :入力I/F
15 :出力I/F
16 :通信I/F
17 :記憶部
18 :入力操作部
19 :ディスプレイ(表示部)
30 :マイク
40 :スピーカ
50 :音声認識サーバ
60 :翻訳サーバ
70 :音声合成サーバ
101 :音声取得部
102 :原文取得部(第1言語取得部)
103 :原文送信部
104 :翻訳取得部(第2言語取得部)
105 :翻訳送信部
106 :再翻訳取得部(第1言語取得部)
107 :多義語処理部
108 :再翻訳修正部
109 :翻訳修正部
110 :原文出力部
111 :再翻訳出力部(第1言語出力部)
112 :翻訳出力部(第2言語出力部)
113 :音声出力部
20 :翻訳装置
201 :音声取得部
202 :原文取得部(第1言語取得部)
203 :原文送信部
204 :翻訳取得部
205 :翻訳送信部
207 :多義語処理部
208 :原文修正部
209 :原文出力部
210 :翻訳出力部
212 :音声出力部
Claims (13)
- 第1言語から第2言語への翻訳を行う翻訳装置であって、
前記第1言語の文章を取得する第1言語取得部と、
前記文章に含まれる前記第1言語の単語に対応する前記第2言語の単語が多義語であるかどうかを判定し、前記第2言語の単語が多義語であると判定した場合、前記第2言語の単語に対応する複数の意味候補を取得する多義語処理部と、
前記複数の意味候補を出力する第1言語出力部と、
を備える、翻訳装置。 - 前記複数の意味候補の各々は、画像および前記第1言語の文字列の少なくとも一方である、
請求項1に記載の翻訳装置。 - 表示部を備え、
前記第1言語出力部は、前記複数の意味候補の各々を選択可能な状態で前記表示部に表示させる、
請求項1に記載の翻訳装置。 - 前記文章を前記第2言語に翻訳することにより生成された翻訳文章を取得する第2言語取得部と、
前記翻訳文章を前記表示部に表示させる第2言語出力部と、
をさらに備え、
前記複数の意味候補のうちの一つの意味候補が選択された場合、前記第2言語出力部は、前記一つの意味候補に対応する意味を示す要素を出力する、
請求項3に記載の翻訳装置。 - 前記要素は、画像および前記第2言語のテキストの少なくとも一方である、
請求項4に記載の翻訳装置。 - 前記第1言語の原文章を前記第2言語に翻訳することにより生成された翻訳文章を取得する第2言語取得部をさらに備え、
前記第1言語取得部は、前記翻訳文章をさらに前記第1言語に再翻訳することにより生成された再翻訳文章を前記文章として取得する、
請求項1に記載の翻訳装置。 - 表示部を備え、
前記第1言語出力部は、前記原文章と、前記再翻訳文章とを同時に前記表示部に表示させる、
請求項6に記載の翻訳装置。 - さらに、前記第2言語の単語と、前記複数の意味候補とを含むデータを記憶する記憶部を備え、
前記多義語処理部は、前記データに基づき、前記第2言語の単語が前記多義語であるかどうかを判定する、
請求項1に記載の翻訳装置。 - 前記複数の意味候補は、代表データと、前記代表データに対応する類義データとを含む、
請求項1に記載の翻訳装置。 - 前記第1言語出力部は、前記複数の意味候補である複数の前記第1言語のテキストで前記第1言語の単語を置換することにより生成された修正文章を出力する、
請求項1に記載の翻訳装置。 - 前記第1言語出力部は、前記複数の意味候補である複数の画像とともに前記文章を出力する、
請求項1に記載の翻訳装置。 - 翻訳サーバを用いて、第1言語から第2言語への翻訳を行い、かつ、前記第2言語から前記第1言語への再翻訳を行う翻訳装置であって、
前記第1言語の単語と、前記第1言語の単語に対応する前記第1言語の一義語と、前記一義語に対応する前記第2言語の置換翻訳語と、前記第1言語の単語に対応する前記第2言語の翻訳語とを記憶する記憶部と、
前記第1言語の文章を取得する第1言語取得部と、
前記文章に含まれる前記第1言語の単語に対応する前記翻訳語が多義語であるかどうかを判定し、前記翻訳語が多義語であると判定した場合、前記第1言語の単語を前記一義語に置換することにより前記第1言語の置換文章を生成する多義語処理部と、
前記置換文章を前記翻訳サーバに送信し、前記置換文章を前記第2言語に翻訳することにより生成され、前記置換翻訳語を含む前記第2言語の置換翻訳文章、および、前記置換翻訳文章を前記第1言語に再翻訳することにより生成され、前記一義語を含む前記第1言語の置換再翻訳文章を、前記翻訳サーバから受信する通信部と、
前記置換再翻訳文章に含まれる前記一義語を前記第1言語の単語に置換することにより生成された前記第1言語の再翻訳文章を出力する第1言語出力部と、
前記置換翻訳文章に含まれる前記置換翻訳語を前記翻訳語に置換することにより生成された前記第2言語の翻訳文章を出力する第2言語出力部と、
を備える、翻訳装置。 - コンピュータを用いて第1言語から第2言語への翻訳を行う翻訳方法であって、
前記第1言語の文章を取得し、
前記文章に含まれる前記第1言語の単語に対応する前記第2言語の単語が多義語であるかどうかを判定し、
前記第2言語の単語が多義語であると判定した場合、前記第2言語の単語に対応する複数の意味候補を記憶部より取得し、
前記複数の意味候補を出力する、
ことを含む、翻訳方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016241704 | 2016-12-13 | ||
JP2016241704 | 2016-12-13 | ||
PCT/JP2017/038441 WO2018110096A1 (ja) | 2016-12-13 | 2017-10-25 | 翻訳装置および翻訳方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018110096A1 true JPWO2018110096A1 (ja) | 2019-02-28 |
JP6706810B2 JP6706810B2 (ja) | 2020-06-10 |
Family
ID=62559651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018556230A Active JP6706810B2 (ja) | 2016-12-13 | 2017-10-25 | 翻訳装置および翻訳方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10929618B2 (ja) |
JP (1) | JP6706810B2 (ja) |
WO (1) | WO2018110096A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018433736B2 (en) * | 2018-07-23 | 2022-05-12 | Fujitsu Limited | Generating method, generating program, and information processing apparatus |
JPWO2020149069A1 (ja) * | 2019-01-15 | 2021-11-25 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法およびプログラム |
KR20210036169A (ko) * | 2019-09-25 | 2021-04-02 | 현대자동차주식회사 | 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법 |
CN110991196B (zh) * | 2019-12-18 | 2021-10-26 | 北京百度网讯科技有限公司 | 多义词的翻译方法、装置、电子设备及介质 |
US11908452B1 (en) * | 2021-05-20 | 2024-02-20 | Amazon Technologies, Inc. | Alternative input representations for speech inputs |
CN113723116B (zh) * | 2021-08-25 | 2024-02-13 | 中国科学技术大学 | 文本翻译方法及相关装置、电子设备、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612449A (ja) * | 1992-06-29 | 1994-01-21 | Canon Inc | 機械翻訳装置及びその方法 |
WO2000013102A1 (fr) * | 1998-08-31 | 2000-03-09 | Sony Corporation | Dispositif et procede pour le traitement du langage naturel |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0561908A (ja) | 1991-08-30 | 1993-03-12 | Sharp Corp | 電子翻訳機 |
JPH1153363A (ja) | 1997-07-30 | 1999-02-26 | Fujitsu Ltd | 翻訳機および記録媒体 |
JP4935869B2 (ja) * | 2009-08-07 | 2012-05-23 | カシオ計算機株式会社 | 電子機器及びプログラム |
-
2017
- 2017-10-25 WO PCT/JP2017/038441 patent/WO2018110096A1/ja active Application Filing
- 2017-10-25 JP JP2018556230A patent/JP6706810B2/ja active Active
-
2019
- 2019-02-12 US US16/273,182 patent/US10929618B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612449A (ja) * | 1992-06-29 | 1994-01-21 | Canon Inc | 機械翻訳装置及びその方法 |
WO2000013102A1 (fr) * | 1998-08-31 | 2000-03-09 | Sony Corporation | Dispositif et procede pour le traitement du langage naturel |
Also Published As
Publication number | Publication date |
---|---|
US20190171718A1 (en) | 2019-06-06 |
WO2018110096A1 (ja) | 2018-06-21 |
US10929618B2 (en) | 2021-02-23 |
JP6706810B2 (ja) | 2020-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6706810B2 (ja) | 翻訳装置および翻訳方法 | |
JP4050755B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
US9053098B2 (en) | Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense | |
JP4058071B2 (ja) | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム | |
US9002696B2 (en) | Data security system for natural language translation | |
US20090326912A1 (en) | Means and a method for training a statistical machine translation system | |
US7904291B2 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US8924195B2 (en) | Apparatus and method for machine translation | |
US20150127319A1 (en) | Filled Translation for Bootstrapping Language Understanding of Low-Resourced Languages | |
JP4372133B2 (ja) | 辞書登録装置、辞書登録方法及び辞書登録プログラム | |
JP4859101B2 (ja) | テキストに付与する発音情報の編集を支援するシステム | |
JP5083317B2 (ja) | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 | |
JP4042360B2 (ja) | 自動通訳システム及びその方法並びにプログラム | |
JP5998298B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JPWO2020149069A1 (ja) | 翻訳装置、翻訳方法およびプログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JPWO2016151692A1 (ja) | タグ付与支援装置、方法およびプログラム | |
US20130080144A1 (en) | Machine translation apparatus, a method and a non-transitory computer readable medium thereof | |
JP7295463B2 (ja) | 業務フロー作成支援装置、業務フロー作成支援方法、および、業務フロー作成支援プログラム | |
JP2008269122A (ja) | 処理単位分割装置、処理単位分割方法、及びプログラム | |
JP2018072509A (ja) | 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム | |
Majrashi | Voice versus keyboard and mouse for text creation on arabic user interfaces. | |
JP4021813B2 (ja) | 複合語登録プログラムおよび登録装置 | |
JP2017181727A (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6706810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |