JP2007004446A - 機械翻訳装置、その方法およびプログラム - Google Patents
機械翻訳装置、その方法およびプログラム Download PDFInfo
- Publication number
- JP2007004446A JP2007004446A JP2005183421A JP2005183421A JP2007004446A JP 2007004446 A JP2007004446 A JP 2007004446A JP 2005183421 A JP2005183421 A JP 2005183421A JP 2005183421 A JP2005183421 A JP 2005183421A JP 2007004446 A JP2007004446 A JP 2007004446A
- Authority
- JP
- Japan
- Prior art keywords
- language
- phrase
- probability
- translation
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】翻訳デコーダ4において、入力された原言語の文を句に分割し、各々の句の対訳となる目的言語の句を句翻訳モデル1から検索し、該検索した目的言語の句を並べ替えることにより目的言語の文を作成し、該作成した目的言語の文の中で、句翻訳モデル1により求められる句翻訳確率と、歪みモデル2により求められる歪み確率と、言語モデル3により求められる言語確率との積が最大となる文を求め、翻訳結果として出力するに当たって、目的言語の隣り合う2つの句に対応する原言語の2つの句の距離の情報とともに少なくとも前後関係の情報を用いて前記歪み確率を求めることにより、文法的に正しくかつ自然な語順の目的言語の文を生成する。
【選択図】図2
Description
原言語の句とこれに対応する目的言語の句を多数記憶するとともに、互いに対訳になっている原言語の句と目的言語の句との組について、目的言語の句が原言語の句へ翻訳される確率を求める句翻訳モデル(句翻訳確率計算手段)1と、
原言語の句と目的言語の句との対応関係の尤もらしさを示す歪み確率を、目的言語の隣り合う2つの句に対応する原言語の2つの句の距離の情報とともに少なくとも前後関係の情報を用いて求める歪みモデル(歪み確率計算手段)2と、
目的言語の任意の単語列が生成される確率を求める言語モデル(言語確率計算手段)3と、
入力された原言語の文(品詞付き単語列)を句に分割し、各々の句の対訳となる目的言語の句を句翻訳モデル1から検索し、該検索した目的言語の句を並べ替えることにより目的言語の文を作成し、該作成した目的言語の文の中で、句翻訳モデル1により求められる句翻訳確率と、歪みモデル2により求められる歪み確率と、言語モデル3により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーダ(翻訳デコーディング手段)4と、
を備える。
従来の句に基づく翻訳における歪みモデルでは、句の並べ替えにおいて、目的言語において隣り合う2つの句に対応する原言語の2つの句の相対的な距離の絶対値しか考慮しないため、日本語と英語のような語順が大きく異なる言語間の翻訳にみられる大局的かつ規則的な語句の並び替えを表現する能力が低く、文法的に正しく自然な語順の目的言語の文を生成することが難しいという問題があった。
本発明の実施の形態の一例における句翻訳モデル1は、従来の「統計的な句に基づく翻訳」と同じである。即ち、互いに対訳になっている原言語と目的言語の句を対訳コーパス11から自動的に抽出し、同じ目的言語の句の対訳となる原言語の句の相対頻度を句翻訳確率とする。
本発明の実施の形態の一例における歪みモデル2は、図6に示すように、対訳コーパス11と句翻訳モデル1から作成する。
・正順(間隙なし):対応する原言語の2つの句は、目的言語の句と同じ順番で、かつ、連接している。
・正順(間隙あり):対応する原言語の2つの句は、目的言語の句と同じ順番で、かつ、連接していない。
・逆順(間隙なし):対応する原言語の2つの句は、目的言語の句とは反対の順番で、かつ、連接している。
・逆順(間隙あり):対応する原言語の2つの句は、目的言語の句とは反対の順番で、かつ、連接していない。
本発明の実施の形態の一例において、原言語の文を翻訳する際には、図6に示すように、まず品詞付与手段7により、入力文の各単語に品詞を付与する。この品詞付き単語列を入力として、翻訳デコーダ4は、句翻訳モデル1、歪みモデル2、言語モデル3を用いて、図3で説明したような流れに従い、句翻訳確率と歪み確率と言語モデル確率と積が最大となるような目的言語の文を出力する。
Claims (9)
- 第1の言語の文を該第1の言語とは別の第2の言語の文に翻訳する機械翻訳装置であって、
第1の言語の句とこれに対応する第2の言語の句を多数記憶するとともに、互いに対訳になっている第1の言語の句と第2の言語の句との組について、第2の言語の句が第1の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第1の言語の句と第2の言語の句との対応関係の尤もらしさを示す歪み確率を、第2の言語の隣り合う2つの句に対応する第1の言語の2つの句の距離の情報とともに少なくとも前後関係の情報を用いて求める歪み確率計算手段と、
第2の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第1の言語の文を句に分割し、各々の句の対訳となる第2の言語の句を前記句翻訳確率計算手段から検索し、該検索した第2の言語の句を並べ替えることにより第2の言語の文を作成し、該作成した第2の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーディング手段とを備えた
ことを特徴とする機械翻訳装置。 - 前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句を構成する単語のうちの少なく1つの単語の表記または品詞のいずれか一方または両方の情報を用いて歪み確率を求める
ことを特徴とする請求項1記載の機械翻訳装置。 - 前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句の先頭の単語の品詞または句の末尾の単語の品詞のいずれか一方もしくは両方の情報を用いて歪み確率を求める
ことを特徴とする請求項1記載の機械翻訳装置。 - コンピュータを用いて第1の言語の文を該第1の言語とは別の第2の言語の文に翻訳する方法であって、
コンピュータは、
第1の言語の句とこれに対応する第2の言語の句を多数記憶するとともに、互いに対訳になっている第1の言語の句と第2の言語の句との組について、第2の言語の句が第1の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第1の言語の句と第2の言語の句との対応関係の尤もらしさを示す歪み確率を、第2の言語の隣り合う2つの句に対応する第1の言語の2つの句の距離の情報とともに少なくとも前後関係の情報を用いて求める歪み確率計算手段と、
第2の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備え、
前記コンピュータが、
入力された第1の言語の文を句に分割し、各々の句の対訳となる第2の言語の句を前記句翻訳確率計算手段から検索し、
該検索した第2の言語の句を並べ替えることにより第2の言語の文を作成し、
該作成した第2の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する
ことを特徴とする機械翻訳方法。 - コンピュータは、前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句を構成する単語のうちの少なく1つの単語の表記または品詞のいずれか一方または両方の情報を用いて歪み確率を求める
ことを特徴とする請求項4記載の機械翻訳方法。 - コンピュータは、前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句の先頭の単語の品詞または句の末尾の単語の品詞のいずれか一方もしくは両方の情報を用いて歪み確率を求める
ことを特徴とする請求項4記載の機械翻訳方法。 - コンピュータに第1の言語の文を該第1の言語とは別の第2の言語の文に翻訳させるプログラムであって、
第1の言語の句とこれに対応する第2の言語の句を多数記憶するとともに、互いに対訳になっている第1の言語の句と第2の言語の句との組について、第2の言語の句が第1の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第1の言語の句と第2の言語の句との対応関係の尤もらしさを示す歪み確率を、第2の言語の隣り合う2つの句に対応する第1の言語の2つの句の距離の情報とともに少なくとも前後関係の情報を用いて求める歪み確率計算手段と、
第2の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備えたコンピュータに、
入力された第1の言語の文を句に分割し、各々の句の対訳となる第2の言語の句を前記句翻訳確率計算手段から検索するステップと、
該検索した第2の言語の句を並べ替えることにより第2の言語の文を作成するステップと、
該作成した第2の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力するステップとを実行させる
ことを特徴とする機械翻訳プログラム。 - コンピュータは、前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句を構成する単語のうちの少なく1つの単語の表記または品詞のいずれか一方または両方の情報を用いて歪み確率を求める
ことを特徴とする請求項7記載の機械翻訳プログラム。 - コンピュータは、前記に加え、第1の言語の文の各単語に品詞を付与する品詞付与手段を備え、
前記歪み確率計算手段は、前記に加え、第1の言語または第2の言語のいずれか一方もしくは両方において、句の先頭の単語の品詞または句の末尾の単語の品詞のいずれか一方もしくは両方の情報を用いて歪み確率を求める
ことを特徴とする請求項7記載の機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005183421A JP4113204B2 (ja) | 2005-06-23 | 2005-06-23 | 機械翻訳装置、その方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005183421A JP4113204B2 (ja) | 2005-06-23 | 2005-06-23 | 機械翻訳装置、その方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007004446A true JP2007004446A (ja) | 2007-01-11 |
JP4113204B2 JP4113204B2 (ja) | 2008-07-09 |
Family
ID=37690023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005183421A Active JP4113204B2 (ja) | 2005-06-23 | 2005-06-23 | 機械翻訳装置、その方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4113204B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011242895A (ja) * | 2010-05-14 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | 機械翻訳装置、機械翻訳方法、およびそのプログラム |
JP2012185622A (ja) * | 2011-03-04 | 2012-09-27 | National Institute Of Information & Communication Technology | 対訳フレーズ学習装置、フレーズベース統計的機械翻訳装置、対訳フレーズ学習方法、および対訳フレーズ生産方法 |
JP2018045686A (ja) * | 2016-09-13 | 2018-03-22 | 株式会社東芝 | 機械翻訳装置及び機械翻訳方法 |
-
2005
- 2005-06-23 JP JP2005183421A patent/JP4113204B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011242895A (ja) * | 2010-05-14 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | 機械翻訳装置、機械翻訳方法、およびそのプログラム |
JP2012185622A (ja) * | 2011-03-04 | 2012-09-27 | National Institute Of Information & Communication Technology | 対訳フレーズ学習装置、フレーズベース統計的機械翻訳装置、対訳フレーズ学習方法、および対訳フレーズ生産方法 |
JP2018045686A (ja) * | 2016-09-13 | 2018-03-22 | 株式会社東芝 | 機械翻訳装置及び機械翻訳方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4113204B2 (ja) | 2008-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5705472B2 (ja) | 一般化された巡回セールスマン問題としてのフレーズ−ベースの統計的機械翻訳 | |
US7797148B2 (en) | Systems and methods for fast and memory efficient machine translation using statistical integrated phase lattice | |
US6233544B1 (en) | Method and apparatus for language translation | |
Garg et al. | Machine translation: a literature review | |
US20090150139A1 (en) | Method and apparatus for translating a speech | |
US20060224378A1 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US20090192781A1 (en) | System and method of providing machine translation from a source language to a target language | |
JP2005521952A (ja) | 統計的機械翻訳用の句間結合確率モデル | |
Knight et al. | Applications of weighted automata in natural language processing | |
Hellsten et al. | Transliterated mobile keyboard input via weighted finite-state transducers | |
KR20160133349A (ko) | 구 표 생성 방법 및 구 표를 이용한 기계 번역 방법 | |
JP5565827B2 (ja) | 統計的機械翻訳のための言語独立な単語セグメント化のための文分離器トレーニング装置、そのためのコンピュータプログラム及びコンピュータ可読媒体。 | |
JP4113204B2 (ja) | 機械翻訳装置、その方法およびプログラム | |
JP2009075795A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JP5180522B2 (ja) | 機械翻訳装置、機械翻訳方法、およびそのプログラムならびに記録媒体 | |
JP4829702B2 (ja) | 機械翻訳装置、機械翻訳方法、および生成規則作成装置、生成規則作成方法、ならびにそれらのプログラムおよび記録媒体 | |
JP2005025474A (ja) | 機械翻訳装置、コンピュータプログラム及びコンピュータ | |
JP2009157888A (ja) | 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム | |
JP5500636B2 (ja) | 句テーブル生成器及びそのためのコンピュータプログラム | |
JP5544518B2 (ja) | 機械翻訳装置、機械翻訳方法、およびそのプログラム | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
JP2006127405A (ja) | バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム | |
JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
EP0992008A1 (en) | FSTs APPROXIMATING HIDDEN MARKOV MODELS AND TEXT TAGGING USING SAME | |
JP2007018462A (ja) | 機械翻訳装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4113204 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110418 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120418 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130418 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140418 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |