JP6056489B2 - 翻訳支援プログラム、方法、および装置 - Google Patents
翻訳支援プログラム、方法、および装置 Download PDFInfo
- Publication number
- JP6056489B2 JP6056489B2 JP2013004403A JP2013004403A JP6056489B2 JP 6056489 B2 JP6056489 B2 JP 6056489B2 JP 2013004403 A JP2013004403 A JP 2013004403A JP 2013004403 A JP2013004403 A JP 2013004403A JP 6056489 B2 JP6056489 B2 JP 6056489B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- translation
- source language
- sentence
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 261
- 238000000034 method Methods 0.000 title claims description 55
- 238000004458 analytical method Methods 0.000 claims description 51
- 230000000877 morphologic effect Effects 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 23
- 238000012217 deletion Methods 0.000 claims description 21
- 230000037430 deletion Effects 0.000 claims description 21
- 238000003780 insertion Methods 0.000 claims description 19
- 230000037431 insertion Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 230000014616 translation Effects 0.000 description 244
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
発明者らは、まず、編集前の初期状態の機械翻訳では、原文単語と訳文単語の間で対応が付いているため、結果として訳抜けが起きていない状態であることに着目した。ユーザが初期状態の機械翻訳文を編集する際に、挿入・削除・置換等の操作履歴を記録しておく。更に、挿入・削除それぞれの対象文字列について形態素解析を行い、原言語と目標言語の間で対応する形態素の対を見つけることができる。
本実施形態は、以下の処理をコンピュータに実行させる。この処理は、まず、翻訳対象となる原言語文を受け付ける。次に、原言語文に対して翻訳処理を実行して、原言語文に対応する目標言語の翻訳文を生成する。続いて、翻訳文に対する編集操作入力を受け付ける。更に、編集操作入力によって翻訳文に対して編集された編集文字列を抽出する。そして、単語に対して形態論情報を対応付ける形態素解析辞書を参照しながら、編集文字列に対して形態素解析を実行し、編集によって挿入された文字列に対応する第1の形態素列と、編集によって削除された文字列に対応する第2の形態素列とを生成する。次に、目標言語の単語に対して目標言語の同義語を対応付ける同義語辞書を参照しながら、第1の形態素列および第2の形態素列に含まれる各形態素に対して同義語展開を行い、同義語を有する形態素には同義語を併記する。続いて、第1の形態素列の各形態素と、第2の形態素列の各形態素との対応付けを行う。そして、第1の形態素列には含まれず第2の形態素列のみに含まれる形態素を差分の形態素として検知する。更に、目標言語の単語を原言語の単語に対応付ける対訳辞書を参照しながら、検知された差分の形態素に対して対訳辞書検索を行い、差分の形態素の原言語による表記を取得する。続いて、原言語による表記を原言語文と照合し、原言語による表記に対応する原言語文中の単語を訳抜け候補として特定する。最後に、記訳抜け候補を示す情報を出力する。
図1は、第1の実施形態に係る翻訳支援装置100の構成図である。図1に示すように、本実施形態に係る翻訳支援装置100は、入力文受付部101、機械翻訳部102、編集入力受付部103、編集文字列抽出部104、形態素解析辞書105、形態素解析部106、同義語辞書107、同義語展開部108、挿入・削除対応付け部109、差分検知部110、対訳辞書111、対訳辞書検索部112、訳抜け候補特定部113、および訳抜け警告出力部114を備える。
機械翻訳部102は、例えば、図2に示すように、入力文受付部101が受け付けた原言語文に対して翻訳処理を実行し、原言語文に対応する目標言語の翻訳文を生成する。
本実施形態に係る技術は、いかなる二言語間の翻訳に対しても適用可能である。以下の実施例では、翻訳の対象言語として日英翻訳をとりあげて説明する。
1.前半の節と後半の節とを入れ替える。
2.“A, while B”の構文を“While A, B”の構文に書き換える。
3.機械翻訳の訳語“river”を“brook”に、“went”を“walked”に書き換える。
4.上記1〜3の編集のうちに、不注意で“One day”を消してしまう(訳抜け発生)。
以下に、第2の実施形態に係る翻訳支援処理方法について、図13および図14を参照しながら説明する。本実施形態に係る技術は、いかなる二言語間の翻訳に対しても適用可能である。以下の実施例では、翻訳の対象言語として日英翻訳をとりあげて説明する。
(付記1)
翻訳対象となる原言語文を受け付け、
前記原言語文に対して翻訳処理を実行して、前記原言語文に対応する目標言語の翻訳文を生成し、
前記翻訳文に対する編集操作入力を受け付け、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出し、
単語に対して形態論情報を対応付ける形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の形態素列とを生成し、
前記目標言語の単語に対して前記目標言語の同義語を対応付ける同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列に含まれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記し、
前記第1の形態素列の各形態素と、第2の形態素列の各形態素との対応付けを行い、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知し、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書を参照しながら、前記検知された差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の前記原言語による表記を取得し、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文中の単語を訳抜け候補として特定し、
前記訳抜け候補を示す情報を出力する、
処理をコンピュータに実行させる翻訳支援プログラム。
(付記2)
前記翻訳文中の単語が前記編集により異なる単語に置換されている形態素がある場合に、前記置換された単語に対応する前記原言語文中の単語と前記置換された単語とが対訳として現れるインターネットページを検索し、
該当するインターネットページが所定の閾値以上の頻度で検出された場合、前記原言語文中の対応する単語と前記置換された単語との間に対応を付け、前記原言語文中の対応する単語を前記訳抜け候補から除外する、
ことを含む付記1に記載の翻訳支援プログラム。
(付記3)
コンピュータによって実行される翻訳支援方法であって、
翻訳対象となる原言語文を受け付け、
前記原言語文に対して翻訳処理を実行して、前記原言語文に対応する目標言語の翻訳文を生成し、
前記翻訳文に対する編集操作入力を受け付け、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出し、
単語に対して形態論情報を対応付ける形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の形態素列とを生成し、
前記目標言語の単語に対して前記目標言語の同義語を対応付ける同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列に含まれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記し、
前記第1の形態素列の各形態素と、第2の形態素列の各形態素との対応付けを行い、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知し、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書を参照しながら、前記検知された差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の前記原言語による表記を取得し、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文中の単語を訳抜け候補として特定し、
前記訳抜け候補を示す情報を出力する、
ことを特徴とする翻訳支援方法。
(付記4)
前記翻訳文中の単語が前記編集により異なる単語に置換されている形態素がある場合に、前記置換された単語に対応する前記原言語文中の単語と前記置換された単語とが対訳として現れるインターネットページを検索し、
該当するインターネットページが所定の閾値以上の頻度で検出された場合、前記原言語文中の対応する単語と前記置換された単語との間に対応を付け、前記原言語文中の対応する単語を前記訳抜け候補から除外する、
ことを含む付記3に記載の翻訳支援方法。
(付記5)
翻訳対象となる原言語文を受け付ける入力文受付部と、
前記原言語文に対して翻訳処理を実行し、前記原言語文に対応する目標言語の翻訳文を生成する機械翻訳部と、
前記翻訳文に対する編集操作入力を受け付ける編集入力受付部と、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出する編集文字列抽出部と、
単語に対して形態論情報を対応付ける形態素解析辞書と、
該形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の文字列とを生成する形態素解析部と、
前記目標言語の単語に対して前記目標言語中の同義語を対応付ける同義語辞書と、
該同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列に含まれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記する同義語展開部と、
前記第1の形態素列の各形態素と、前記第2の形態素列の各形態素との対応付けを行う挿入・削除対応付け部と、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知する差分検知部と、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書と、
該対訳辞書を参照しながら、前記差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の原言語による表記を取得する対訳辞書検索部と、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文の単語を訳抜け候補として特定する訳抜け候補特定部と、
前記訳抜け候補を示す情報を出力する訳抜け警告出力部と、
を備えることを特徴とする、翻訳支援装置。
(付記6)
前記翻訳文中の単語が前記編集により異なる単語に置換されている形態素がある場合に、前記置換された単語に対応する前記原言語文中の単語と前記置換された単語とが対訳として現れるインターネットページを検索するインターネット検索部を備え、
該当するインターネットページが所定の閾値以上の頻度で検出された場合、訳抜け候補特定部は、前記原言語文中の対応する単語と前記置換された単語との間に対応を付け、前記原言語文中の対応する単語を前記訳抜け候補から除外する、
ことを含む付記5に記載の翻訳支援装置。
101 入力文受付部
102 機械翻訳部
103 編集入力受付部
104 編集文字列抽出部
105 形態素解析辞書
106 形態素解析部
107 同義語辞書
108 同義語展開部
109 挿入・削除対応付け部
110 差分検知部
111 対訳辞書
112 対訳辞書検索部
113 訳抜け候補特定部
114 訳抜け警告出力部
215 インターネット検索部
Claims (3)
- 翻訳対象となる原言語文を受け付け、
前記原言語文に対して翻訳処理を実行して、前記原言語文に対応する目標言語の翻訳文を生成し、
前記翻訳文に対する編集操作入力を受け付け、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出し、
単語に対して形態論情報を対応付ける形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の形態素列とを生成し、
前記目標言語の単語に対して前記目標言語の同義語を対応付ける同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列に含まれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記し、
前記第1の形態素列の各形態素と、第2の形態素列の各形態素との対応付けを行い、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知し、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書を参照しながら、前記差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の前記原言語による表記を取得し、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文中の単語を訳抜け候補として特定し、
前記訳抜け候補を示す情報を出力する、
処理をコンピュータに実行させる翻訳支援プログラム。 - コンピュータによって実行される翻訳支援方法であって、
翻訳対象となる原言語文を受け付け、
前記原言語文に対して翻訳処理を実行して、前記原言語文に対応する目標言語の翻訳文を生成し、
前記翻訳文に対する編集操作入力を受け付け、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出し、
単語に対して形態論情報を対応付ける形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の形態素列とを生成し、
前記目標言語の単語に対して前記目標言語の同義語を対応付ける同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列に含まれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記し、
前記第1の形態素列の各形態素と、第2の形態素列の各形態素との対応付けを行い、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知し、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書を参照しながら、前記差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の前記原言語による表記を取得し、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文中の単語を訳抜け候補として特定し、
前記訳抜け候補を示す情報を出力する、
ことを特徴とする翻訳支援方法。 - 翻訳対象となる原言語文を受け付ける入力文受付部と、
前記原言語文に対して翻訳処理を実行し、前記原言語文に対応する目標言語文からなる翻訳文を得る機械翻訳部と、
前記翻訳文に対する編集操作入力を受け付ける編集入力受付部と、
前記編集操作入力によって翻訳文に対して編集された編集文字列を抽出する編集文字列抽出部と、
単語に対して形態論情報を対応付ける形態素解析辞書と、
該形態素解析辞書を参照しながら、前記編集文字列に対して形態素解析を実行し、前記編集によって挿入された文字列に対応する第1の形態素列と、前記編集によって削除された文字列に対応する第2の文字列とを生成する形態素解析部と、
前記目標言語の単語に対して前記目標言語の同義語を対応付ける同義語辞書と、
該同義語辞書を参照しながら、前記第1の形態素列および前記第2の形態素列にふくまれる各形態素に対して同義語展開を行い、前記同義語を有する形態素には前記同義語を併記する同義語展開部と、
前記第1の形態素列の各形態素と、前記第2の形態素列の各形態素との対応付けを行う挿入・削除対応付け部と、
前記第1の形態素列には含まれず前記第2の形態素列のみに含まれる形態素を差分の形態素として検知する差分検知部と、
前記目標言語の単語を原言語の単語に対応付ける対訳辞書と、
該対訳辞書を参照しながら、前記差分の形態素に対して対訳辞書検索を行い、前記差分の形態素の前記原言語による表記を取得する対訳辞書検索部と、
前記原言語による表記を前記原言語文と照合し、前記原言語による表記に対応する前記原言語文中の単語を訳抜け候補として特定する訳抜け候補特定部と、
前記訳抜け候補を示す情報を出力する訳抜け警告出力部と、
を備えることを特徴とする、翻訳支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013004403A JP6056489B2 (ja) | 2013-01-15 | 2013-01-15 | 翻訳支援プログラム、方法、および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013004403A JP6056489B2 (ja) | 2013-01-15 | 2013-01-15 | 翻訳支援プログラム、方法、および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137613A JP2014137613A (ja) | 2014-07-28 |
JP6056489B2 true JP6056489B2 (ja) | 2017-01-11 |
Family
ID=51415099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013004403A Expired - Fee Related JP6056489B2 (ja) | 2013-01-15 | 2013-01-15 | 翻訳支援プログラム、方法、および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6056489B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107870901B (zh) * | 2016-09-27 | 2023-05-12 | 松下知识产权经营株式会社 | 从翻译源原文生成相似文的方法、记录介质、装置以及系统 |
JP6885319B2 (ja) | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP6885318B2 (ja) | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3969689B2 (ja) * | 1999-08-04 | 2007-09-05 | 株式会社東芝 | 文書作成支援装置、文書作成支援方法及び文書作成支援プログラムを記憶した記憶媒体 |
-
2013
- 2013-01-15 JP JP2013004403A patent/JP6056489B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014137613A (ja) | 2014-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248650B2 (en) | In-context exact (ICE) matching | |
JP3356536B2 (ja) | 機械翻訳装置 | |
JP5235344B2 (ja) | 機械翻訳を行う装置、方法およびプログラム | |
US7774193B2 (en) | Proofing of word collocation errors based on a comparison with collocations in a corpus | |
US9122674B1 (en) | Use of annotations in statistical machine translation | |
WO2005059771A1 (ja) | 対訳判断装置、方法及びプログラム | |
JP2008152760A (ja) | マシンアシスト翻訳ツール | |
US20100332484A1 (en) | Document information creation device, document registration system, computer-readable storage medium and document information creation method | |
AU2018226399A1 (en) | Detecting style breaches in multi-author content or collaborative writing | |
JP2011209941A (ja) | 文書校正支援装置、方法およびプログラム | |
US9098487B2 (en) | Categorization based on word distance | |
US20140156258A1 (en) | Foreign language writing support apparatus and method | |
JP2013105321A (ja) | 文書処理装置、文書構成要素間の関係解析方法およびプログラム | |
KR20180105546A (ko) | 클레임 요소 명사의 요소 명사 참조 번호를 획득하기 위한 요소 명사 참조 번호 획득방법 | |
CN102227723B (zh) | 辅助误译的检测的装置及方法 | |
US20140244676A1 (en) | Discovering Title Information for Structured Data in a Document | |
JP5083317B2 (ja) | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 | |
JP5107556B2 (ja) | 改善された中国語−英語翻訳ツール | |
JP6056489B2 (ja) | 翻訳支援プログラム、方法、および装置 | |
Warburton | Processing terminology for the translation pipeline | |
US11768804B2 (en) | Deep search embedding of inferred document characteristics | |
WO2007041328A1 (en) | Detecting segmentation errors in an annotated corpus | |
JPH06348751A (ja) | 言語変換装置 | |
JP7483085B1 (ja) | 情報処理システム、情報処理装置、情報処理方法、およびプログラム | |
CN109271392B (zh) | 快速判别和抽取关系型数据库实体及属性的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6056489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |