JP2002342325A - 対訳確率付与装置、対訳確率付与方法並びにそのプログラム - Google Patents
対訳確率付与装置、対訳確率付与方法並びにそのプログラムInfo
- Publication number
- JP2002342325A JP2002342325A JP2001144337A JP2001144337A JP2002342325A JP 2002342325 A JP2002342325 A JP 2002342325A JP 2001144337 A JP2001144337 A JP 2001144337A JP 2001144337 A JP2001144337 A JP 2001144337A JP 2002342325 A JP2002342325 A JP 2002342325A
- Authority
- JP
- Japan
- Prior art keywords
- language
- word
- probability
- statistic
- bilingual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
2の言語の文例とを用いて、第1の言語の単語を高い精
度で第2の単語に対応させることを可能とする対訳確率
付与装置、対訳確率付与方法ならびにそのプログラムを
実現する。 【解決手段】第1の言語の単語に対する第2の言語の訳
語候補を単語対応対として格納した第1言語第2言語対
訳辞書を有し、対訳辞書の各単語対応対に付与された対
訳確率をパラメータとして、第1の言語の文例集から第
1言語統計量計算モジュールによって求められる統計量
から、第2の言語の単語の出現に関する統計量を推定す
る対訳確率モデルを有し、第2の言語の文例集から第2
言語統計量計算モジュールによって求められた統計量と
対訳確率モデルによって第1の言語から推定された第2
の言語の統計量との差を最小にするようにパラメータを
求める対訳確率付与部を有することを特徴とする対訳確
率付与装置。
Description
ト検索など、異なる言語の間で言葉の対応をとることを
課題とする自然言語処理技術に関する。
異なる言語の間で言葉の対応をとることを課題とする自
然言語処理技術においては、一方の言語の単語を、もう
一方の言語の適切な単語に対応させることは非常に重要
な課題であり、訳語選択の問題と呼ばれている。この課
題が重要な問題であることは、一般にどのような言語対
の場合にも当てはまるが、以下では英語と日本語の場合
を取り上げ、具体例を示して説明する。
般にはそれぞれ異なる日本語の単語に対応する。ところ
が、自然言語処理分野において元の英単語の使われてい
る状況を正しく判断して適切な日本語の単語を選択する
ことは、一般には非常に困難である。たとえば、英語の
単語「term」には「期間」という意味の他に「専門
用語」という意味があるが、どのような場合に「期間」
という意味となり、どのような場合に「専門用語」とい
う意味になるか、という訳語の選択条件を、あらかじめ
明示的に記述することは非常に難しい。
際に使用された例、すなわち実例文を大量に集めてそれ
を利用する方法が提案されている。
天野真家『既存目的言語文書からの訳語の自動学習方
式』情報処理学会第42回全国大会(平成3年)」(先
行技術文献1)では、以下のような方法が提案されてい
る。
で、同じ分野の話題を述べている文例を大量に収集して
おく。次に、一方の言語(たとえば英語)の単語が、相
手言語(たとえば日本語)の訳語候補のうち、どの訳語
に対応するかの確からしさを判定する際に、相手言語の
文例集における、各訳語候補の出現確率の高さを用い
る。たとえば、今、英語の「term」を「期間」と訳
すのが確からしいか「専門用語」と訳すのが確からしい
かを判断するのに、同じ分野の話題を述べている日本語
の文例集の中に出現する「期間」という単語と「専門用
語」という単語の頻度を計測し、その多い方を「ter
m」の訳語とする、という手法である。この手法には、
相手言語の文例集のみを分析すればよいという利点があ
る。
利用した訳語選択のための共起関係の自動抽出』情報処
理学会第39回全国大会(平成元年)」(先行技術文献
2)では、以下のような方法が提案されている。
で、一方が他方の翻訳関係にあるような対訳文例集を用
意する。さらに、二つの言語の間の対訳辞書を用意し、
第1の言語の例文に含まれる単語に対して対訳辞書を引
き、訳語候補を挙げる。その例文と対訳関係にある第2
の言語の例文の中に出現する訳語候補の頻度を計測し、
最も高頻度で現われる訳語候補を、元の単語に対する訳
語とする、という手法である。この手法は、互いに翻訳
関係にある対訳例文が利用できる場合には、高い精度で
訳語を認定できるという利点がある。
術文献1の方法は、相手言語の単語の頻度だけを手がか
りにしているため、相手言語で一般的に高頻度で出現す
る単語が訳語として採用されてしまいやすい、という欠
点がある。
「作る」という訳語の他にも多くの日本語の訳語が相当
する。一例として「make a call」を「電話
をする」と訳すためには「call」を「電話」に対応
するものとし、「make」には「する」という動詞が
対応するものとして辞書を構築するのが通常の手法であ
る。このように辞書を作る時「make」には少なくと
も「作る」と「する」という訳語候補が存在することに
なる。この場合、先行技術文献1の方法に従って、相手
言語、つまり日本語の単語の出現頻度だけを計測する
と、訳語「作る」よりも訳語「する」の方が一般に出現
頻度が高いので、「make」の訳語候補として「す
る」が最も確からしいものとして選択されてしまう。先
行技術文献1には、このように、本来の訳語として適切
かどうかとは無関係に、相手言語で出現頻度の高い訳語
が選択されやすい、という欠点がある。
訳関係にある対訳例文が大量に存在する場合に有効な方
法であるが、実際には、互いに翻訳関係にある対訳例文
の量は極めて限られている。先行技術文献2の方法は対
訳例文が大量に存在しない場合には適用できない、とい
う欠点がある。
記のような問題点を解決し、より確からしい訳語候補を
選択するための方法を提供するところにある。
置は、第1の言語を第2の言語に翻訳する際に用いられ
る対訳確率付与装置であって、第1の言語の文例集と第
2の言語の文例集とを有し、第1の言語の単語に対する
第2の言語の訳語候補を単語対応対として格納した第1
言語第2言語対訳辞書を有し、第1の言語の文例集にお
ける単語の出現に関する統計量を計算する第1言語統計
量計算モジュールを有し、第2の言語の文例集における
単語の出現に関する統計量を計算する第2言語統計量計
算モジュールを有し、対訳辞書の各単語対応対に付与さ
れた対訳確率をパラメータとして、第1の言語の文例集
から第1言語統計量計算モジュールによって求められる
統計量から、第2の言語の単語の出現に関する統計量を
推定する対訳確率モデルを有し、第2の言語の文例集か
ら第2言語統計量計算モジュールによって求められた統
計量と対訳確率モデルによって第1の言語から推定され
た第2の言語の統計量との差を最小にするようにパラメ
ータを求める対訳確率付与部を有することを特徴とす
る。
る統計量から第2の言語の単語の出現に関する統計量を
推定する対訳確率モデルとして、第1の言語の単語E
(i)の出現確率E(i)とその単語E(i)が第2の
言語の訳語J(n)に対応する対応確率S(i,n)と
の積を求め、第1の言語の各単語E(i)に関して上記
の積を可算した和をとることによって第2の言語におけ
る単語J(n)の出現確率J(n)を計算する対訳確率
モデルを用いてもよい。
計量から第2の言語の単語の出現に関する統計量を推定
する対訳確率モデルとして、第1の言語で一つの文の中
に出現する二つの単語のペアの共起確率P(E(i)^
E(J))とその単語ペアを構成する各単語E(i)お
よびE(J)が第2の言語の訳語に対応する対応確率S
(i,m)およびS(J,n)との積を求め、第1の言
語の各単語ペアE(i)およびE(J)に関して上記の
積を可算した和をとることによって第2の言語で一つの
文の中に出現する二つの単語のペアの出現確率P(J
(m)^J(n))を計算する対訳確率モデルを用いこ
とにしてもよい。
計量から第2の言語の単語の出現に関する統計量を推定
する対訳確率モデルとして、第1の言語で構文上の係り
受け関係にある二つの単語のペアの共起確率P(E
(i)^E(J))とその単語ペアを構成する各単語E
(i)およびE(J)が第2の言語の訳語に対応する対
応確率S(i,m)およびS(J,n)との積を求め、
第1の言語の各単語ペアE(i)およびE(J)に関し
て上記の積を可算した和をとることによって第2の言語
で構文上の係り受け関係にある二つの単語のペアの出現
確率P(J(m)^J(n))を計算する対訳確率モデ
ルを用いることにしてもよい。
を参照して説明する。図1は本発明の第1実施の形態の
訳語選択システムの構成を示すブロック図である。
2言語の文例集2、第1の言語の単語に対する第2の言
語の訳語候補を単語対応対として格納した第1言語第2
言語対訳辞書3、第1言語の文例集における単語の出現
に関する統計量を計算する第1言語統計量計算モジュー
ル4、第2言語の文例集における単語の出現に関する統
計量を計算する第2言語統計量計算モジュール5、対訳
辞書の各単語対応対に付与された対訳確率をパラメータ
として、第1の言語の文例集から第1言語統計量計算モ
ジュールによって求められる統計量から、第2の言語の
単語の出現に関する統計量を推定する対訳確率モデルを
格納した対訳確率モデル格納部6、第2の言語の文例集
から第2言語統計量計算モジュールによって求められた
統計量と対訳確率モデルによって第1の言語から推定さ
れた第2の言語の統計量との差を最小にするようにパラ
メータを求める対訳確率付与部7とから構成されてい
る。
明する。第1言語の文例集1には、第1の言語、たとえ
ば英語の実例文が格納されている。第2言語の文例集2
には、第2の言語、たとえば日本語の実例文が格納され
ている。第1言語第2言語対訳辞書3には、第1の言語
の各単語に対する第2の言語の訳語候補を単語対応対と
して格納してある。図2は、第1言語第2言語対訳辞書
3の内容の例を示した図である。この図では、第1言語
の単語E(i)に対応する第2言語の訳語候補として、
J(k)、J(m)、J(n) が存在する場合を示して
いる。
(i)の出現確率、j(k)、j(m)、j(n)はそ
れぞれ第2言語の単語J(k)、J(m)、J(n)の
出現確率を表す。また、S(i,k)、S(i,m)、
S(i,m)は、それぞれ、第1言語の単語E(i)
が、第2言語の単語J(k)、J(m)、J(n)に翻
訳される確率を表す。
言語の文例集1における単語の出現に関する統計量を計
算する。第2言語統計量計算モジュール5は、第2言語
の文例集2における単語の出現に関する統計量を計算す
る。第1言語統計量計算モジュール4および第2言語統
計量計算モジュール5は、必要に応じて、第1言語の文
例集1および第2言語の文例集2に含まれる文を形態素
解析したり構文解析したりして、そこに含まれる単語の
出現に関する統計量を計算する。統計量の例としては、
各単語の出現確率や二つの単語が同時に出現する共起確
率などがある。
の単語の出現に関する統計量から第2の言語の単語の出
現に関する統計量を推定する対訳確率モデルが格納して
ある。この対訳確率モデルは、対訳辞書の各単語対応対
に付与された対訳確率をパラメータとして、第1の言語
の文例集から第1言語統計量計算モジュールによって求
められる統計量から、第2の言語の単語の出現に関する
統計量を推定する。
から第2言語統計量計算モジュールによって求められた
統計量と対訳確率モデルによって第1の言語から推定さ
れた第2の言語の統計量との差を最小にするように、対
訳辞書の各単語対応対に付与された対訳確率パラメータ
を調整する。
明する図である。
態は、入力装置101と、コンピュータから構成される
データ処理装置102と、出力装置103と、記憶装置
104と、訳語選択プログラムを記録した記憶媒体10
5とを備える。記憶媒体105は、磁気ディスク、磁気
テープ、光ディスク、半導体メモリその他の記憶媒体よ
りなる。
らデータ処理装置102の主記憶装置に読み込まれ、デ
ータ処理装置102の動作を制御する。データ処理装置
102は、訳語選択プログラムの制御により以下の処理
を行なう。
01から入力されると、第1言語統計量計算モジュール
4と第2言語統計量計算モジュール5とが起動される。
第1言語統計量計算モジュール4は、第1言語の文例集
1における単語の出現に関する統計量を計算する。第2
言語統計量計算モジュール5は、第2言語の文例集2に
おける単語の出現に関する統計量を計算する。
訳確率付与部7は、第2の言語の文例集から第2言語統
計量計算モジュールによって求められた統計量と対訳確
率モデル格納部6に格納された対訳確率モデルによって
第1の言語から推定された第2の言語の統計量との差を
最小にするように、対訳辞書の各単語対応対に付与され
た対訳確率パラメータを調整する。
値にしたがって、訳語が出力装置103から出力され
る。
対訳確率モデル格納部6に格納されている対訳確率モデ
ルの例を用いて、本願発明の動作を説明する。次の式
は、対訳確率モデルの一例を表す式である。
E(i)の出現確率を表す。またj(m)は第2言語の
m番目の単語J(m)の出現確率を表す。S(i,m)
は、第1言語のi番目の単語E(i)が、第2言語のm
番目の単語J(m)に翻訳される確率を表す。この式
は、第1言語の各単語の出現確率と翻訳確率の積の総和
が第2言語の各単語の出現確率を与えるというモデルを
表している。
モデルにおけるパラメータであり、第1言語の単語E
(i)と第2言語の訳語候補J(m)との単語対応対に
与えられた対訳確率である。このパラメータには、第1
言語の単語は第2言語の単語に必ず対応するという仮定
の下で、
確率を求めるには、第1言語統計量計算モジュール4に
よって、第1言語の文例集1における単語の出現確率e
(i) を計算し、第2言語統計量計算モジュール5に
よって、第2言語の文例集2における単語の出現確率j
(m)を計算し、このようにして求めたe(i)および
j(m)を上記の対訳確率モデルの式に代入して上記の
制約を満たすパラメータS(i,m)を定める。
明と従来方式の差異を説明する。ここでは、例として、
英語の単語を日本語の単語に翻訳する場合を考える。
の英単語「do」と「make」の単語対応対を示して
いる。ここでは簡単のため、英単語「do」は日本語の
単語「する」1語とだけ訳語候補としての単語対応対を
なしており、英単語「make」は日本語の単語の「つ
くる」と「する」の2単語と、訳語候補としての単語対
応対をなしている状況を想定する。
うな、第2言語の文例集における単語の出現頻度だけを
用いて、第1言語の単語の訳語選択を行なう従来方式の
動作を、図3で示した単語対応対の構成をもった「d
o」と「make」を例に挙げて表した図である。図4
は第2言語の文例集における「する」と「つくる」の出
現確率が、仮にそれぞれ、0.20および0.01であ
る状況を示している。この場合、先行技術文献1の従来
方式では、「make」の訳語として、出現確率の高い
単語「する」が単語「つくる」よりも優先されてしま
う。
単語対応対の構成をもった「do」と「make」を例
に挙げて表した図である。図5では、第1言語の文例集
における「do」と「make」の出現確率が、仮にそ
れぞれ、0.18および0.02である状況を示してい
る。第2言語の文例集における「する」と「つくる」の
出現確率は、図4の場合と同様に、それぞれ、0.20
および0.01であるとする。
訳確率モデルを用いて、日本語の同じ単語を訳語として
もつ英単語の影響を考慮した計算を行なう。この方法
で、英単語「make」が「する」に翻訳される確率お
よび「つくる」に翻訳される確率を計算すると、この例
のように「する」の頻度が高くても、その頻度の大部分
は英単語「do」からの翻訳確率に対応するので、「m
ake」から「する」への翻訳確率は低くなる。図5で
は「make」から「つくる」への翻訳確率が0.9、
「make」から「する」への翻訳確率が0.1という
結果が得られた場合を示している。
ている対訳確率モデルの第2の例を用いて、本願発明の
動作を説明する。次に挙げる式は、対訳確率モデルの一
例を表す式である。
言語で単語E(i)と単語E(j)が同時に出現する共
起確率を表す。また、P(J(m)^J(n)) は、
第2言語で単語J(m)と単語J(n)が同時に出現す
る共起確率を表す。この式3は、第1言語における二つ
の単語の共起確率とそれぞれの単語の対訳確率の積の総
和が、第2言語における二つの単語の共起確率を与える
というモデルを表している。
が、この対訳確率モデルにおけるパラメータであり、そ
れぞれ、第1言語の単語 E(i) と第2言語の訳語候
補J(m)との単語対応対に与えられた対訳確率、第1
言語の単語E(J)と第2言語の訳語候補J(n)との
単語対応対に与えられた対訳確率である。このパラメー
タには、第1言語の単語は第2言語の単語に必ず対応す
るという仮定の下で、
確率を求める場合、二つの単語の共起として、何種類か
の共起が考えられる。共起の種類の一つとして、一つの
文の中に二つの単語が共に出現する文内共起がある。
4によって、第1言語の文例集1における二つの単語の
文内共起確率P(E(i)^E(J))を計算し、2言
語統計量計算モジュール5によって、第2言語の文例集
2における二つの単語の文内共起確率P(J(m)^J
(n))を計算し、このようにして求めたP(E(i)
^E(J))およびP(J(m)^J(n))を上記の
対訳確率モデルの式に代入して、上記の制約を満たすパ
ラメータS(i,m) を定める。
が、互いに構文的な係り受け関係にある係り受け共起が
ある。この場合、第1言語統計量計算モジュール4によ
って、第1言語の文例集1における二つの単語の係り受
け共起確率P(E(i)^E(j))を計算し、第2言
語統計量計算モジュール5によって、第2言語の文例集
2における二つの単語の係り受け共起確率P(J(m)
^J(n))を計算し、このようにして求めたP(E
(i)^E(j))およびP(J(m)^J(n))を
上記の対訳確率モデルの式に代入して、上記の制約を満
たすパラメータS(i,m)を定める。
語を定める際、先行技術文献1とは異なり、第1言語と
第2言語の両方の全体の単語の対訳確率を考慮に入れる
ため、第2言語で出現確率の高い単語が訳語に選ばれや
すいという先行技術文献1のもっていた欠点が解消され
ている。
2言語の文例集は互いに翻訳関係にあることを仮定して
いないため、大量に収集することができる。互いに翻訳
関係にある文例集が存在しないと適用できないという先
行技術文献2のもっていた欠点が解消されている。
訳確率を求めるため、単独の単語の対訳確率だけを用い
る場合に比べて、複合語などの場合の翻訳の精度が向上
する。
て対訳確率を求めるため、動詞とその格要素の名詞が組
になって訳語が定まるような場合の翻訳の精度が向上す
る。
の構成を示すブロック図である。
言語対訳辞書3の内容例を表す図である。
1言語第2言語対訳辞書3の内容例を示す図である。
言語対訳辞書3の内容例を示す図である。
言語対訳辞書3の内容例を示す図である。
ステムの構成を示すブロック図である。
Claims (9)
- 【請求項1】第1の言語を第2の言語に翻訳する際に用
いられる対訳確率付与装置であって、第1の言語の文例
集と第2の言語の文例集とを有し、第1の言語の単語に
対する第2の言語の訳語候補を単語対応対として格納し
た第1言語第2言語対訳辞書を有し、第1の言語の文例
集における単語の出現に関する統計量を計算する第1言
語統計量計算モジュールを有し、第2の言語の文例集に
おける単語の出現に関する統計量を計算する第2言語統
計量計算モジュールを有し、対訳辞書の各単語対応対に
付与された対訳確率をパラメータとして、第1の言語の
文例集から第1言語統計量計算モジュールによって求め
られる統計量から、第2の言語の単語の出現に関する統
計量を推定する対訳確率モデルを有し、第2の言語の文
例集から第2言語統計量計算モジュールによって求めら
れた統計量と対訳確率モデルによって第1の言語から推
定された第2の言語の統計量との差を最小にするように
パラメータを求める対訳確率付与部を有することを特徴
とする対訳確率付与装置。 - 【請求項2】請求項1記載の対訳確率付与装置におい
て、第1の言語の単語の出現に関する統計量から第2の
言語の単語の出現に関する統計量を推定する対訳確率モ
デルとして、第1の言語の単語E(i)の出現確率e
(i)とその単語E(i)が第2の言語の訳語J(n)
に対応する対応確率S(i,n)との積を求め、第1の
言語の各単語E(i)に関して上記の積を可算した和を
とることによって第2の言語における単語J(n)の出
現確率j(n)を計算する対訳確率モデルを用いること
を特徴とする対訳確率付与装置。 - 【請求項3】請求項1記載の対訳確率付与装置におい
て、第1の言語の単語の出現に関する統計量から第2の
言語の単語の出現に関する統計量を推定する対訳確率モ
デルとして、第1の言語で一つの文の中に出現する二つ
の単語のペアの共起確率P(E(i)^E(j))とそ
の単語ペアを構成する各単語E(i)および E(j)
が第2の言語の訳語に対応する対応確率S(i,m)お
よびS(j,n)との積を求め、第1の言語の各単語ペ
アE(i)およびE(j)に関して上記の積を可算した
和をとることによって第2の言語で一つの文の中に出現
する二つの単語のペアの出現確率 P(J(m)^J
(n))を計算する対訳確率モデルを用いることを特徴
とする対訳確率付与装置。 - 【請求項4】請求項1記載の対訳確率付与装置におい
て、第1の言語の単語の出現に関する統計量から第2の
言語の単語の出現に関する統計量を推定する対訳確率モ
デルとして、第1の言語で構文上の係り受け関係にある
二つの単語のペアの共起確率P(E(i)^E(J))
とその単語ペアを構成する各単語E(i)およびE
(J)が第2の言語の訳語に対応する対応確率S(i,
m)およびS(J,n)との積を求め、第1の言語の各
単語ペアE(i)およびE(J)に関して上記の積を可
算した和をとることによって第2の言語で構文上の係り
受け関係にある二つの単語のペアの出現確率P(J
(m)^J(n))を計算する対訳確率モデルを用いる
ことを特徴とする対訳確率付与装置。 - 【請求項5】第1の言語の文例集と第2の言語の文例集
とを有し、第1の言語の単語に対する第2の言語の訳語
候補を単語対応対として格納した第1言語第2言語対訳
辞書を有し、(a)第1の言語の文例集における単語の
出現に関する統計量を計算する処理、(b)第2の言語
の文例集における単語の出現に関する統計量を計算する
処理、(c)対訳辞書の各単語対応対に付与された対訳
確率をパラメータとして、第1の言語の文例集から第1
言語統計量計算モジュールによって求められる統計量か
ら、第2の言語の単語の出現に関する統計量を推定する
対訳確率モデルに基づく計算処理、(d)第2の言語の
文例集から第2言語統計量計算モジュールによって求め
られた統計量と対訳確率モデルによって第1の言語から
推定された第2の言語の統計量との差を最小にするよう
にパラメータを求める処理、を実行させることを特徴と
するプログラム。 - 【請求項6】請求項5記載のプログラムにおいて、
(c)第1の言語の単語の出現に関する統計量から第2
の言語の単語の出現に関する統計量を推定する対訳確率
モデルに基づく計算処理として、第1の言語の単語E
(i)の出現確率E(i)と、その単語E(i)が第2
の言語の訳語J(n)に対応する対応確率S(i,n)
との積を求め、第1の言語の各単語E(i)に関して上
記の積を可算した和をとることによって第2の言語にお
ける単語J(n)の出現確率J(n)を計算する対訳確
率モデルを用いた計算処理を行なうことを特徴とするプ
ログラム。 - 【請求項7】請求項5記載の記録媒体において、(c)
第1の言語の単語の出現に関する統計量から第2の言語
の単語の出現に関する統計量を推定する対訳確率モデル
に基づく計算処理として、第1の言語で一つの文の中に
出現する二つの単語のペアの共起確率P(E(i)^E
(J))とその単語ペアを構成する各単語 E(i) お
よび E(J)が第2の言語の訳語に対応する対応確率
S(i,m)および S(J,n)との積を求め、第1
の言語の各単語ペアE(i)およびE(J)に関して上
記の積を可算した和をとることによって第2の言語で一
つの文の中に出現する二つの単語のペアの出現確率P
(J(m)^J(n))を計算する対訳確率モデルを用
いた計算処理を行なうことを特徴とするプログラム。 - 【請求項8】請求項5記載の記録媒体において、(c)
第1の言語の単語の出現に関する統計量から第2の言語
の単語の出現に関する統計量を推定する対訳確率モデル
に基づく計算処理として、第1の言語で構文上の係り受
け関係にある二つの単語のペアの共起確率P(E(i)
^E(J))とその単語ペアを構成する各単語E(i)
およびE(J)が第2の言語の訳語に対応する対応確率
S(i,m)およびS(J,n)との積を求め、第1の
言語の各単語ペアE(i)および E(J)に関して上
記の積を可算した和をとることによって第2の言語で構
文上の係り受け関係にある二つの単語のペアの出現確率
P(J(m)^J(n))を計算する対訳確率モデルを
用いた計算処理を行なうことを特徴とするプログラム。 - 【請求項9】第1の言語の文例集と第2の言語の文例集
とを有し、第1の言語の単語に対する第2の言語の訳語
候補を単語対応対として格納した第1言語第2言語対訳
辞書を有し、(a)第1の言語の文例集における単語の
出現に関する統計量を計算し、(b)第2の言語の文例
集における単語の出現に関する統計量を計算し、(c)
対訳辞書の各単語対応対に付与された対訳確率をパラメ
ータとして、第1の言語の文例集から第1言語統計量計
算モジュールによって求められる統計量から、第2の言
語の単語の出現に関する統計量を推定する対訳確率モデ
ルに基づく計算処理をし、(d)第2の言語の文例集か
ら第2言語統計量計算モジュールによって求められた統
計量と対訳確率モデルによって第1の言語から推定され
た第2の言語の統計量との差を最小にするようにパラメ
ータを求めることを特徴とする対訳確率付与方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001144337A JP4876329B2 (ja) | 2001-05-15 | 2001-05-15 | 対訳確率付与装置、対訳確率付与方法並びにそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001144337A JP4876329B2 (ja) | 2001-05-15 | 2001-05-15 | 対訳確率付与装置、対訳確率付与方法並びにそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002342325A true JP2002342325A (ja) | 2002-11-29 |
JP4876329B2 JP4876329B2 (ja) | 2012-02-15 |
Family
ID=18990301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001144337A Expired - Fee Related JP4876329B2 (ja) | 2001-05-15 | 2001-05-15 | 対訳確率付与装置、対訳確率付与方法並びにそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4876329B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010086294A (ja) * | 2008-09-30 | 2010-04-15 | Casio Computer Co Ltd | 辞書機能を備えた電子装置およびプログラム |
JP2011243087A (ja) * | 2010-05-20 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | 自動単語対応付け装置とその方法とプログラム |
JP2020126493A (ja) * | 2019-02-05 | 2020-08-20 | 富士通株式会社 | 対訳処理方法および対訳処理プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222188A (ja) * | 2000-12-18 | 2002-08-09 | Xerox Corp | 術語翻訳の方法 |
-
2001
- 2001-05-15 JP JP2001144337A patent/JP4876329B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222188A (ja) * | 2000-12-18 | 2002-08-09 | Xerox Corp | 術語翻訳の方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010086294A (ja) * | 2008-09-30 | 2010-04-15 | Casio Computer Co Ltd | 辞書機能を備えた電子装置およびプログラム |
JP2011243087A (ja) * | 2010-05-20 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | 自動単語対応付け装置とその方法とプログラム |
JP2020126493A (ja) * | 2019-02-05 | 2020-08-20 | 富士通株式会社 | 対訳処理方法および対訳処理プログラム |
JP7251181B2 (ja) | 2019-02-05 | 2023-04-04 | 富士通株式会社 | 対訳処理方法および対訳処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4876329B2 (ja) | 2012-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3969628B2 (ja) | 翻訳支援装置、方法及び翻訳支援プログラム | |
US7904291B2 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US6523000B1 (en) | Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database | |
US8543376B2 (en) | Apparatus and method for decoding using joint tokenization and translation | |
US20080306728A1 (en) | Apparatus, method, and computer program product for machine translation | |
US20030158723A1 (en) | Syntactic information tagging support system and method | |
US20090326912A1 (en) | Means and a method for training a statistical machine translation system | |
EP1306775A1 (en) | Machine translation | |
US20020091509A1 (en) | Method and system for translating text | |
US20120022852A1 (en) | Apparatus, system, and method for computer aided translation | |
EP0813156A2 (en) | Method and apparatus for language translation | |
JP2004362249A (ja) | 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体 | |
JP2006012168A (ja) | 翻訳メモリシステムにおいてカバレージおよび質を改良する方法 | |
JP5083317B2 (ja) | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 | |
JP2960936B2 (ja) | 係り受け解析装置 | |
JP4876329B2 (ja) | 対訳確率付与装置、対訳確率付与方法並びにそのプログラム | |
KR100559472B1 (ko) | 영한 자동번역에서 의미 벡터와 한국어 국소 문맥 정보를사용한 대역어 선택시스템 및 방법 | |
JP2005284723A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
US8041556B2 (en) | Chinese to english translation tool | |
US20220004708A1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons | |
KR101721536B1 (ko) | 품사간 정렬 경향을 반영한 통계적 단어 정렬 방법 및 이를 이용한 기계 번역 장치 | |
JP2007058706A (ja) | 文書検索システム、文書検索方法及び文書検索プログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP4088718B2 (ja) | 辞書登録装置,辞書登録方法,およびコンピュータプログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20021204 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050317 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080415 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080612 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20090512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110215 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110418 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111101 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111114 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |