JP2010140381A - 機械翻訳装置及び機械翻訳プログラム - Google Patents
機械翻訳装置及び機械翻訳プログラム Download PDFInfo
- Publication number
- JP2010140381A JP2010140381A JP2008317892A JP2008317892A JP2010140381A JP 2010140381 A JP2010140381 A JP 2010140381A JP 2008317892 A JP2008317892 A JP 2008317892A JP 2008317892 A JP2008317892 A JP 2008317892A JP 2010140381 A JP2010140381 A JP 2010140381A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- original text
- machine
- language
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】翻訳用例検索手段32は翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を翻訳用例データベース29から検索し、差分対応付け手段33は翻訳用例検索手段32で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と翻訳対象原文との差異部分を対応付け、用例優先度付与手段34は差分対応付け手段33で対応付けられた各々の翻訳用例の原文と翻訳対象原文との差異部分について構文上の役割を判定し構文上の役割が同じである割合が高いほど高い優先度を翻訳用例に付与する。
【選択図】 図1
Description
翻訳対象原文と翻訳用例1原文とは一致する単語の割合は(4/6)であり、翻訳対象原文と翻訳用例2原文とは一致する単語の割合は(4/5)である。従って、翻訳用例1原文の類似度は67%、翻訳用例2原文の類似度は80%であり、翻訳用例2原文の優先度が1で翻訳用例1原文の優先度が2となっているので、現状では、翻訳用例2が優先的に使用される。
翻訳対象原文と翻訳用例1原文とは一致する単語の割合は(7/9)であり、翻訳対象原文と翻訳用例2原文とは一致する単語の割合は(7/9)である。従って、翻訳用例1原文の類似度は78%、翻訳用例2原文の類似度は78%であり、翻訳対象原文との類似度は、翻訳用例1と翻訳用例2は同じであるが、翻訳用例1原文が先に検索発見されたので、翻訳用例1の原文の優先度が1で翻訳用例2の原文の優先度が2となっている。これにより、現状では、翻訳用例1の原文が優先的に使用される。
翻訳対象原文と翻訳用例1原文とは一致する単語の割合は(4/5)であり、翻訳対象原文と翻訳用例2原文とは一致する単語の割合は(4/5)である。従って、翻訳用例1原文の類似度は80%、翻訳用例2原文の類似度は80%であり、翻訳対象原文との類似度は、翻訳用例1と翻訳用例2は同じであるが、翻訳用例1原文が先に検索発見されたので、翻訳用例1の原文の優先度が1で翻訳用例2の原文の優先度が2となっている。これにより、現状では、翻訳用例1の原文が優先的に使用される。
翻訳対象原文と翻訳用例1原文とは一致する単語の割合は(10/12)であり、翻訳対象原文と翻訳用例2原文とは一致する単語の割合は(10/12)である。従って、翻訳用例1原文の類似度は83%、翻訳用例2原文の類似度は83%であり、翻訳対象原文との類似度は、翻訳用例1と翻訳用例2は同じであるが、翻訳用例1原文が先に検索発見されたので、翻訳用例1の原文の優先度が1で翻訳用例2の原文の優先度が2となっている。これにより、現状では、翻訳用例1の原文が優先的に使用される。
(b)差分箇所の数
(c)翻訳用例原文の訳語が複数箇所の分離された語句に対応している割合
(d)翻訳用例原文の翻訳用例訳文に対応訳語がない割合
上記の(c)、(d)は、翻訳対象原文に対する翻訳用例原文だけでなく、翻訳用例訳文を使用して訳文を合成する際の合成のし易さをも考慮に入れるものである。
P=(100%−α)・(n/N)・k+α
実施例1においては、構文上の役割0.が一致する差分箇所が類似度αにどれぐらい影響を与えるかを統計的に検証して係数kを定めるようにしてもよいし、差分箇所の数などの要素によって係数kを動的に定めるようにしてもよい。ここでは、例えば、係数kを”0.8”に固定して設定する。
翻訳用例1原文: He attended our meeting last month.
翻訳用例2原文: He attended our meeting unwillingly.
図4のステップS11では、翻訳手段35により、翻訳対象原文”He attended our meeting yesterday.”について構文解析を行い、翻訳用例検索手段32で既に検索で見つけた2つの翻訳用例について、それぞれにS12〜S17の処理が行われる。
P=(100−α)・(1−N/Nmax)+α
実施例2においては、差分箇所Nが多いほど(差分箇所Nの数が最多差分箇所数Nmaxに近づくほど)、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから優先度を低くする。
翻訳用例1原文: The products delivered were much different from the model.
翻訳用例2原文: The finished products delivered were much different from the sample.
図5のステップS11では、翻訳手段35により、”The goods delivered were much different from the sample.”について構文解析を行い、翻訳用例検索手段32で既に検索で見つけた2つの翻訳用例について、それぞれにS12〜S14の処理が行われる。
P=α−(100−α)・(Na/N)
実施例3においては、訳文の複数箇所に対応している差分箇所の数Naが多いほど、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから、(100−α)の係数を(Na/N)としている。この(100−α)の係数である(Na/N)は固定値にしてもよいし、訳文の複数箇所に対応している差分箇所が多い場合に類似度にどれぐらい影響を与えるかを統計的に検証して定めるようにしてもよい。
翻訳用例1原文: He seldom attends our meeting.
翻訳用例2原文: He sometimes attends our meeting.
図6のステップS11では、翻訳手段35により、”He usually attended our meeting.”について構文解析を行い、翻訳用例検索手段32で既に検索で見つけた2つの翻訳用例について、それぞれにS12〜S24の処理が行われる。
P=α−(100−α)・(Nb/N)
実施例4においては、対応する訳文語句がない差分箇所の数Nbが多いほど、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから、(100−α)の係数を(Nb/N)としている。この(100−α)の係数である(Nb/N)は固定値にしてもよいし、対応する訳文語句がない差分箇所が多い場合に類似度にどれぐらい影響を与えるかを統計的に検証して定める構成にしてもよい。
翻訳用例2原文: 昨日彼に手紙を書きました。
図7のステップS11では、翻訳手段35により、”昨日彼に招待状を書きました。”について構文解析を行い、翻訳用例検索手段32で既に検索で見つけた2つの翻訳用例について、それぞれにS12〜S28の処理が行われる。
Claims (8)
- 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で翻訳用例検索で見つけた翻訳用例の原文に対して形態素解析及び構文解析を行い翻訳対象原文及び翻訳用例原文の構文構造を求める翻訳手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には前記翻訳手段で求めた構文構造に基づいて各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分について前記構文構造に基づいて構文上の役割を判定し前記構文上の役割が同じである割合が高いほど高い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分の数が少ないほど高い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中の複数箇所の分離された語句に対応しているか否かを判定し複数箇所の分離された語句に対応している割合が高いほど低い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中のどの語句に対応しているか判定し対応する語句がない割合が高いほど低い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第1言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから翻訳用例が検索された翻訳用例の原文に対して形態素解析及び構文解析を行い翻訳対象原文及び翻訳用例原文の構文構造を求める手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には前記構文構造に基づいて各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分について前記構文構造に基づいて構文上の役割を判定し前記構文上の役割が同じである割合が高いほど高い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第1言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分の数が少ないほど高い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第1言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中の複数箇所の分離された語句に対応しているか否かを判定し複数箇所の分離された語句に対応している割合が高いほど低い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。 - 機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第1言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第1言語の翻訳対象原文を第2言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第1言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中のどの語句に対応しているか判定し対応する語句がない割合が高いほど低い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008317892A JP5032453B2 (ja) | 2008-12-15 | 2008-12-15 | 機械翻訳装置及び機械翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008317892A JP5032453B2 (ja) | 2008-12-15 | 2008-12-15 | 機械翻訳装置及び機械翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010140381A true JP2010140381A (ja) | 2010-06-24 |
JP5032453B2 JP5032453B2 (ja) | 2012-09-26 |
Family
ID=42350455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008317892A Active JP5032453B2 (ja) | 2008-12-15 | 2008-12-15 | 機械翻訳装置及び機械翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5032453B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254881A (ja) * | 1997-03-11 | 1998-09-25 | Sharp Corp | 機械翻訳装置 |
JP2004355204A (ja) * | 2003-05-28 | 2004-12-16 | Oki Electric Ind Co Ltd | 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム |
JP2005202924A (ja) * | 2003-12-15 | 2005-07-28 | Gengo Gijutsu Kenkyusho:Kk | 対訳判断装置、方法及びプログラム |
-
2008
- 2008-12-15 JP JP2008317892A patent/JP5032453B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254881A (ja) * | 1997-03-11 | 1998-09-25 | Sharp Corp | 機械翻訳装置 |
JP2004355204A (ja) * | 2003-05-28 | 2004-12-16 | Oki Electric Ind Co Ltd | 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム |
JP2005202924A (ja) * | 2003-12-15 | 2005-07-28 | Gengo Gijutsu Kenkyusho:Kk | 対訳判断装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5032453B2 (ja) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3969628B2 (ja) | 翻訳支援装置、方法及び翻訳支援プログラム | |
US20080133444A1 (en) | Web-based collocation error proofing | |
US20070233460A1 (en) | Computer-Implemented Method for Use in a Translation System | |
US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
JP5403696B2 (ja) | 言語モデル生成装置、その方法及びそのプログラム | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
JP4431759B2 (ja) | 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2003323425A (ja) | 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム | |
JP5148583B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP2838984B2 (ja) | 汎用参照装置 | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
JP4054353B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JPH0561902A (ja) | 機械翻訳システム | |
JP3244286B2 (ja) | 翻訳処理装置 | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
JPH10149364A (ja) | 訳語選択装置と記憶媒体 | |
JPWO2008123081A1 (ja) | 文字データ処理方法、コンピュータプログラム及び文字データ処理システム | |
JP3884001B2 (ja) | 言語解析システムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110920 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5032453 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |