JP6620934B2 - 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム - Google Patents
翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム Download PDFInfo
- Publication number
- JP6620934B2 JP6620934B2 JP2016016025A JP2016016025A JP6620934B2 JP 6620934 B2 JP6620934 B2 JP 6620934B2 JP 2016016025 A JP2016016025 A JP 2016016025A JP 2016016025 A JP2016016025 A JP 2016016025A JP 6620934 B2 JP6620934 B2 JP 6620934B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- translation
- score
- pair
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
Description
図1は、本発明に係る一形態に適用される統計的機械翻訳システム1を説明するブロック図である。統計的機械翻訳システム1は、対訳コーパス2、単言語コーパス3、翻訳モデル4、言語モデル5及びデコーダ6を備える。対訳コーパス2は、領域別、言語ペア別にそれぞれ用意されている。領域とは、例えば、旅行領域、医療領域である。言語ペアとは、例えば、日本語と英語とのペア、日本語と中国語とのペアである。
以下、図面に基づいて本発明の実施の形態を詳細に説明する。第1言語が日本語、第2言語が英語の組み合わせで説明するが、第1言語と第2言語との組み合わせは、これに限定されない。図4は、本実施形態に係る翻訳システム10の機能ブロック図である。翻訳システム10は、統計的機械翻訳を用いて翻訳をする。翻訳システム10は、ユーザー端末11及びサーバー12により構成される。翻訳システム10は、機能ブロックとして、原文入力部13、機械翻訳部14、翻訳候補文出力部15、選択部16、翻訳モデル17、翻訳情報記憶部18、評価部19、スコア調節部20、言語処理部21、再翻訳部22、翻訳結果比較部23、スコア再調節決定部24及び重み設定部25を備える。
2 対訳コーパス
3 単言語コーパス
4 翻訳モデル
5 言語モデル
6 デコーダ
7 フレーズテーブル
10 翻訳システム
11 ユーザー端末
12 サーバー(翻訳支援装置の一例)
13 原文入力部
14 機械翻訳部
15 翻訳候補文出力部
16 選択部
17 翻訳モデル
18 翻訳情報記憶部
19 評価部
20 スコア調節部
21 言語処理部
22 再翻訳部
23 翻訳結果比較部
24 スコア再調節決定部
25 重み設定部
30 データ構造
31 パス
40 翻訳結果情報
50,50a〜50h 形態素
Claims (9)
- 第1言語のフレーズと第2言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第1言語の原文を前記第2言語の翻訳文に翻訳する機械翻訳を支援する方法であって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを備え、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記方法は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択ステップと、
前記選択ステップで選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶ステップで記憶された前記組み合わせ情報を用いて特定する特定ステップと、
前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価ステップと、をさらに備え、
前記評価ステップは、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択ステップで選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援方法。 - 前記記憶ステップは、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせに関するデータ構造、及び、前記データ構造において、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせを得ることができるパスを、前記組み合わせ情報として記憶する請求項1に記載の翻訳支援方法。
- 前記スコアを上げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを上げる第1の処理、及び、前記スコアを下げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを下げる第2の処理のうち、少なくとも一方の処理をするスコア調節ステップを、さらに備える請求項1又は2に記載の翻訳支援方法。
- 前記スコア調節ステップが前記第1の処理をする場合、前記第1の処理がされる前記フレーズペアの前記スコアと、前記第1の処理がされる前記フレーズペアと前記第1言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第1の処理に用いられる第1の所定値を設定する第1の設定ステップを、さらに備え、
前記スコア調節ステップは、前記第1の設定ステップで設定された前記第1の所定値を用いて、前記第1の処理をする請求項3に記載の翻訳支援方法。 - 前記スコア調節ステップが前記第2の処理をする場合、前記第2の処理がされる前記フレーズペアの前記スコアと、前記第2の処理がされる前記フレーズペアと前記第1言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第2の処理に用いられる第2の所定値を設定する第2の設定ステップを、さらに備え、
前記スコア調節ステップは、前記第2の設定ステップで設定された前記第2の所定値を用いて、前記第2の処理をする請求項3又は4に記載の翻訳支援方法。 - 前記記憶ステップは、複数の前記翻訳候補文のそれぞれについて、前記スコアを基にして算出した翻訳結果に関する数値情報を記憶し、
前記翻訳支援方法は、
前記スコア調節ステップ後の前記フレーズテーブルを用いて、前記原文を再翻訳することにより、前記翻訳文の候補となる複数の前記翻訳候補文を再び生成し、再び生成した複数の前記翻訳候補文のそれぞれについて、前記スコア調節ステップ後の前記フレーズテーブルの前記スコアを基にして算出した前記数値情報を生成する再翻訳ステップと、
前記記憶ステップで記憶された前記数値情報と、前記再翻訳ステップで生成された前記数値情報とを比較し、予め定められた基準を満たすか否かを判定する比較ステップと、
前記予め定められた基準を満たすと判定されたとき、前記スコア調節ステップを再び実行する再実行ステップと、をさらに備える請求項3〜5のいずれか一項に記載の翻訳支援方法。 - 第1言語のフレーズと第2言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第1言語の原文を前記第2言語の翻訳文に翻訳する機械翻訳を支援する装置であって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部を備え、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記装置は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択部と、
前記選択部で選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶部に記憶された前記組み合わせ情報を用いて特定し、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価部と、をさらに備え、
前記評価部は、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択部で選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援装置。 - 第1言語のフレーズと第2言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルと、
前記フレーズテーブルを用いて、前記第1言語の原文から前記第2言語の翻訳文を生成するために、前記翻訳文の候補となる複数の翻訳候補文を生成する機械翻訳部と、
前記機械翻訳部が生成した複数の前記翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部と、を備える翻訳装置であって、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記翻訳装置は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択部と、
前記選択部で選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶部に記憶された前記組み合わせ情報を用いて特定し、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価部と、をさらに備え、
前記評価部は、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択部で選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳装置。 - 第1言語のフレーズと第2言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第1言語の原文を前記第2言語の翻訳文に翻訳する機械翻訳を支援するプログラムであって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを、コンピュータに実行させ、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記プログラムは、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択ステップと、
前記選択ステップで選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶ステップで記憶された前記組み合わせ情報を用いて特定する特定ステップと、
前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価ステップと、をさらに、前記コンピュータに実行させ、
前記評価ステップは、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択ステップで選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016016025A JP6620934B2 (ja) | 2016-01-29 | 2016-01-29 | 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム |
CN201611195288.8A CN107066452B (zh) | 2016-01-29 | 2016-12-22 | 翻译辅助方法、翻译辅助装置、翻译装置以及记录介质 |
US15/391,354 US10055404B2 (en) | 2016-01-29 | 2016-12-27 | Translation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016016025A JP6620934B2 (ja) | 2016-01-29 | 2016-01-29 | 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017134754A JP2017134754A (ja) | 2017-08-03 |
JP6620934B2 true JP6620934B2 (ja) | 2019-12-18 |
Family
ID=59386735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016016025A Active JP6620934B2 (ja) | 2016-01-29 | 2016-01-29 | 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10055404B2 (ja) |
JP (1) | JP6620934B2 (ja) |
CN (1) | CN107066452B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407743A (zh) * | 2016-04-08 | 2021-09-17 | 北京三星通信技术研究有限公司 | 物体信息翻译、以及衍生信息获取方法和装置 |
US10318640B2 (en) * | 2016-06-24 | 2019-06-11 | Facebook, Inc. | Identifying risky translations |
US10394965B2 (en) * | 2017-01-13 | 2019-08-27 | Sap Se | Concept recommendation based on multilingual user interaction |
US10769386B2 (en) * | 2017-12-05 | 2020-09-08 | Sap Se | Terminology proposal engine for determining target language equivalents |
US11216617B2 (en) * | 2018-12-18 | 2022-01-04 | King Fahd University Of Petroleum And Minerals | Methods, computer readable media, and systems for machine translation between Arabic and Arabic sign language |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1643511A (zh) * | 2002-03-11 | 2005-07-20 | 南加利福尼亚大学 | 命名实体翻译 |
US20050192802A1 (en) * | 2004-02-11 | 2005-09-01 | Alex Robinson | Handwriting and voice input with automatic correction |
US8265933B2 (en) * | 2005-12-22 | 2012-09-11 | Nuance Communications, Inc. | Speech recognition system for providing voice recognition services using a conversational language model |
US8296123B2 (en) * | 2006-02-17 | 2012-10-23 | Google Inc. | Encoding and adaptive, scalable accessing of distributed models |
JP5011751B2 (ja) * | 2006-02-27 | 2012-08-29 | 富士通株式会社 | 訳語情報出力処理プログラム,処理方法および処理装置 |
US20090326917A1 (en) * | 2006-07-17 | 2009-12-31 | Erich Steven Hegenberger | Computer-Implemented Translation Tool |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
WO2010003117A2 (en) * | 2008-07-03 | 2010-01-07 | Google Inc. | Optimizing parameters for machine translation |
CN101667176A (zh) | 2008-09-01 | 2010-03-10 | 株式会社东芝 | 基于短语的统计机器翻译方法和系统 |
CN102023970A (zh) * | 2009-09-14 | 2011-04-20 | 株式会社东芝 | 获得语言模型概率及构建语言模型的方法和装置 |
US20110131033A1 (en) * | 2009-12-02 | 2011-06-02 | Tatu Ylonen Oy Ltd | Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations |
US20120143593A1 (en) * | 2010-12-07 | 2012-06-07 | Microsoft Corporation | Fuzzy matching and scoring based on direct alignment |
US9043285B2 (en) * | 2011-10-28 | 2015-05-26 | Linkedin Corporation | Phrase-based data classification system |
US9110891B2 (en) * | 2011-12-12 | 2015-08-18 | Google Inc. | Auto-translation for multi user audio and video |
US9465797B2 (en) * | 2012-02-23 | 2016-10-11 | Google Inc. | Translating text using a bridge language |
CN102945232B (zh) * | 2012-11-16 | 2015-01-21 | 沈阳雅译网络技术有限公司 | 面向统计机器翻译的训练语料质量评价及选取方法 |
US9152622B2 (en) * | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9235567B2 (en) * | 2013-01-14 | 2016-01-12 | Xerox Corporation | Multi-domain machine translation model adaptation |
US9047274B2 (en) * | 2013-01-21 | 2015-06-02 | Xerox Corporation | Machine translation-driven authoring system and method |
US9031829B2 (en) * | 2013-02-08 | 2015-05-12 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9183198B2 (en) * | 2013-03-19 | 2015-11-10 | International Business Machines Corporation | Customizable and low-latency interactive computer-aided translation |
US10025778B2 (en) * | 2013-06-09 | 2018-07-17 | Microsoft Technology Licensing, Llc | Training markov random field-based translation models using gradient ascent |
US9582499B2 (en) * | 2014-04-14 | 2017-02-28 | Xerox Corporation | Retrieval of domain relevant phrase tables |
US9606988B2 (en) * | 2014-11-04 | 2017-03-28 | Xerox Corporation | Predicting the quality of automatic translation of an entire document |
US9933177B2 (en) * | 2014-11-04 | 2018-04-03 | Google Llc | Enhanced automated environmental control system scheduling using a preference function |
US9721004B2 (en) * | 2014-11-12 | 2017-08-01 | International Business Machines Corporation | Answering questions via a persona-based natural language processing (NLP) system |
US9442922B2 (en) * | 2014-11-18 | 2016-09-13 | Xerox Corporation | System and method for incrementally updating a reordering model for a statistical machine translation system |
US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
US9519643B1 (en) * | 2015-06-15 | 2016-12-13 | Microsoft Technology Licensing, Llc | Machine map label translation |
US10223742B2 (en) * | 2015-08-26 | 2019-03-05 | Google Llc | Systems and methods for selecting third party content based on feedback |
US10169797B2 (en) * | 2015-12-15 | 2019-01-01 | Costar Realty Information, Inc. | Identification of entities based on deviations in value |
-
2016
- 2016-01-29 JP JP2016016025A patent/JP6620934B2/ja active Active
- 2016-12-22 CN CN201611195288.8A patent/CN107066452B/zh active Active
- 2016-12-27 US US15/391,354 patent/US10055404B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170220562A1 (en) | 2017-08-03 |
US10055404B2 (en) | 2018-08-21 |
CN107066452B (zh) | 2021-11-05 |
CN107066452A (zh) | 2017-08-18 |
JP2017134754A (ja) | 2017-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6620934B2 (ja) | 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム | |
US9836457B2 (en) | Machine translation method for performing translation between languages | |
US10303761B2 (en) | Method, non-transitory computer-readable recording medium storing a program, apparatus, and system for creating similar sentence from original sentences to be translated | |
Green et al. | Human effort and machine learnability in computer aided translation | |
US8010342B2 (en) | Word usage analyzer | |
US8612206B2 (en) | Transliterating semitic languages including diacritics | |
US5214583A (en) | Machine language translation system which produces consistent translated words | |
US10679014B2 (en) | Method for providing translation information, non-transitory computer-readable recording medium, and translation information providing apparatus | |
US10872207B2 (en) | Determining translation similarity of reverse translations for a plurality of languages | |
JP6817556B2 (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
WO2021260554A1 (en) | Domain-specific grammar correction system, server and method for academic text | |
CN110991193B (zh) | 一种基于OpenKiWi的翻译矩阵模型选择系统 | |
US20210312144A1 (en) | Translation device, translation method, and program | |
JP4843596B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
RU2817524C1 (ru) | Способ и система генерации текста | |
KR102523767B1 (ko) | Bleu 스코어를 기초로 유사 문장에 대한 검색을 수행하는 전자 장치 및 그 동작 방법 | |
JP2004264960A (ja) | 用例ベースの文変換装置、およびコンピュータプログラム | |
JPH04305769A (ja) | 機械翻訳装置 | |
JP2005258637A (ja) | 対訳語抽出装置、及び対訳語抽出プログラム | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2000010974A (ja) | 機械翻訳装置および機械翻訳方法ならびに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191106 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6620934 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |