JPH07239852A - 特殊表現抽出方式及び文書作成支援装置 - Google Patents

特殊表現抽出方式及び文書作成支援装置

Info

Publication number
JPH07239852A
JPH07239852A JP6031133A JP3113394A JPH07239852A JP H07239852 A JPH07239852 A JP H07239852A JP 6031133 A JP6031133 A JP 6031133A JP 3113394 A JP3113394 A JP 3113394A JP H07239852 A JPH07239852 A JP H07239852A
Authority
JP
Japan
Prior art keywords
sentence
language
word
special expression
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6031133A
Other languages
English (en)
Inventor
Masayuki Kameda
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6031133A priority Critical patent/JPH07239852A/ja
Publication of JPH07239852A publication Critical patent/JPH07239852A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 適切な機会に利用できるような文や、言い回
し等を与えられた文章より収集し、個人用の用例集を作
成する。 【構成】 与えられた原文と翻訳文とからなる対訳テキ
スト1の中の文章から、原文と翻訳文の類似度を求める
類似度(かい離度)判定手段2を使って特殊な表現をし
ている文を探し、特殊表現抽出手段3により抽出して、
特殊表現用例集4に納める。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、特殊表現抽出方式及び
文書作成支援装置に関し、より詳細には、第1言語の文
と第2言語の文が対となった対訳文章情報から、特殊な
表現を抽方する特殊表現抽出方式及び該特殊表現抽出方
式を用いた文書作成支援装置に関する。
【0002】
【従来の技術】ビジネスの場合でも、私用の場合でも、
文書を作成する際に定型文や用例を参照することは、文
書を効果的に作成するのにとても役立つ。そのため、定
型文集や用例集が組み込まれた文書作成支援システム
が、種々市販されている。例えば、「直子の代筆」
((有)テグレット技術開発)や「Ready Pen」(富士通
(株))などがある。
【0003】
【発明が解決しようとする課題】上記のような、既存の
定型文集や用例集の他に、日常の読書等の中で接し、文
書作成の適切な機会に利用できるような文や言い回し等
を個人用の用例集として収集し、参照することができれ
ば、文書作成に一層効果を上げることができる。更に、
近年の通信手段の発達により、外国との取引が増大し、
ビジネス文書、私文書も多種多用にならざるを得ない。
その結果、実用文書例にでている用例だけでは間に合わ
なくなってきている。本発明では、第1言語(原文)か
ら第2言語(翻訳文)の文書作成時に参照するための用
例集を作成する方式を提供することを目的とし、特に、
対訳において、直訳では得ることができず、意訳を要す
るような特殊な表現(洗練された表現)の抽出を目的と
する。
【0004】
【課題を解決するための手段】本発明は、上記課題を解
決するために、(1)電子化された文章情報から特殊な
表現を抽出する特殊表現抽出方式において、第1言語の
文(原文)と第2言語の文(翻訳文)が対となっている
対訳文章情報を抽出対象とする場合に、前記第1言語の
文と前記第2言語の文を比較し、前記2つの文の類似度
を判定する類似度判定手段と、該類似度判定手段で得ら
れた類似度により、特殊な表現を判定/抽出する特殊表
現抽出手段とを具備すること、更には、(2)前記類似
度判定手段が、第1言語の文を単語分割する手段と、第
2言語の文を単語分割する手段と、第1言語から第2言
語への対訳辞書と、該対訳辞書を用いて前記第1言語の
文を単語分割する手段で得られた各単語に対応する訳語
を付与する手段と、前記訳語と前記第2言語の文を単語
分割して得られた第2言語の単語とを比較する手段とか
らなること、更には、(3)前記第1言語の文を分割し
て得られた単語のうち該単語の第2言語の訳語が前記第
2言語の文を分解して得られた単語に対応する割合をも
って類似度と扱うこと、更には、(4)前記第2言語の
文を分割して得られた単語のうち前記第1言語の文を分
割して得られた単語に対する第2言語の訳語に対応する
割合をもって類似度と扱うこと、更には、(5)前記第
1言語の文を分割して得られた単語のうち該単語の第2
言語の訳語が前記第2言語の文を分割して得られた単語
に対応する割合と、前記第2言語の文を分割して得られ
た単語のうち前記第1言語の文を分割して得られた単語
に対する第2言語の訳語に対応する割合とを用いて類似
度を扱うこと、更には、(6)前記類似度判定手段が、
第1言語の文から第2言語の文へ翻訳する翻訳手段と、
該翻訳手段によって得られた翻訳文と第2言語の文を比
較する手段とからなること、更には、(7)抽出された
特殊な表現に対して、対訳文章情報の出典情報を付与す
る手段を有すること、或いは、(8)第1言語の文(原
文)と第2言語の文(翻訳文)が対となった電子化され
た対訳文章情報から特殊な表現を抽出する特殊表現抽出
方式を具備したことを特徴とする文書作成支援装置。
【0005】
【作用】原文と翻訳文とを比較して類似度を求め、該類
似度が小さい時は特殊な表現と判定、抽出することによ
り、直訳では表せない特殊な表現を効果的に抽出する。
【0006】
【実施例】本発明は、与えられた第1言語と第2言語つ
まり原文と翻訳文の対からなる対訳文章情報(以下、対
訳テキスト)から特殊な表現を抽出するのに、第1言語
の原文と第2言語の翻訳文の類似度、または、かい離度
を用いて特殊な表現を判定するものである。
【0007】図1は、英語に対して、日本語の翻訳が与
えられている英日対訳テキストの例文である。英文作成
において、図1の第1文のような英文(He is a good t
ennis player.)は、比較的簡単であるが、第2文のよう
な英文(He is the better tennis player.)は、こうし
た表現を特に知っていなければ作成することができない
文である。これに対応して、英文翻訳においても、第1
文の翻訳文(彼はすばらしいテニス選手だ。)は、直訳
的に得ることができ、原文と翻訳文の類似度は大きい
(かい離度が小さい)と考えられるが、第2文の翻訳文
(テニスの腕は彼の方が上だ。)は、単純な直訳では得
にくく、原文と翻訳文の類似度が小さい(かい離度が大
きい)と考えられる。
【0008】図2は、本発明の一実施例を説明するため
の要部構成図で、図中、1は対訳テキスト、2は類似度
(かい離度)判定手段、3は特殊表現抽出手段、4は特
殊表現用例集である。本発明は、前述のように、原文と
翻訳文の類似度(かい離度)をもって、特殊な表現とし
て抽出するか否かを判定するものである。以下、第1言
語及び第2言語を種々処理して、上記の類似度(かい離
度)を求める方法を示す。なお、本発明では、類似度
(かい離度)を求めるために、単語分割技術、辞書検索技
術あるいは機械翻訳技術を利用するが、これらの技術は
自然言語処理技術としてはよく知られているものである
ので、詳細な説明は省略する。
【0009】図3は、本発明の一実施例を説明するため
の構成図で、図中、1は対訳テキスト、2は類似度(か
い離度)判定手段、2aは第1言語単語分割手段、2b
は第2言語単語分割手段、2cは対訳辞書、2dは訳語
候補付与手段、2eは単語比較手段、3は特殊表現抽出
手段、4は特殊表現用例集である。以下、図1の対訳テ
キストを例にして、類似度(かい離度)を単語レベルで
判定する例について説明する。
【0010】図1の例文は英日対訳テキストなので、対
訳辞書2cには、英日対訳辞書を用いる。単語分割手段
2a,2bで行う英文の単語分割や日本文の単語分割で
は、英語辞書や日本語辞書も利用するが、英語では空白
による単語の切れ目で基本的な単語分割が可能であり、
日本語では字種を手がかりにある程度の分割が可能であ
る。訳語候補付与手段2dにより、第1文の英文に対し
て、単語分割した後の単語に対して対訳辞書2cによ
り、あるいは、対訳辞書2cを利用した単語分割によ
り、図4(a)のような訳語候補群を得る。一方、対応
する日本文については、図4(b)のような単語分割結
果が得られる。
【0011】単語比較手段2eは、英文とその翻訳文の
類似度(かい離度)を、英文の単語の訳語と翻訳日本文
中の単語とが、どの程度対応するかによって判定する。
ただし、英語と日本語では、英語の冠詞は日本語に反映
されにくい点等を考慮して、一部の品詞の単語について
は無視する等の例外がある。簡単にするために、以下で
は名詞や動詞、形容詞といった自立語レベルの単語での
対応を考える。
【0012】第1文では、図4(a)に示す各単語“h
e”,“is”,“good”,“tennis”,“player”に対
する訳語(「彼」,「だ」,「すばらしい」,「テニス」,
「選手」)が日本語翻訳文中に全て反映されている。ま
た、日本語側から見ても「彼」,「すばらしい」,「テニ
ス」,「選手」,「だ」の何れも対応する英語単語があ
り、類似度は極めて高いといえる。
【0013】図5は、図1の第2文を図1の第1文と同
様の処理を施こしたときの図で、この場合、原文の訳語
候補(図5(a))と翻訳日本文の単語(図5(b))
との対応を見ると、英文中の“he”,“is”,“tenni
s”については翻訳文中で対応する単語(「彼」,
「だ」,「テニス」)があるが、“better”,“playe
r”については対応する単語がない。一方、翻訳日本文
の自立語から見ると「テニス」,「彼」,「だ」は対応
する英単語(“tennis”,“he”,“is”)があるが、
「腕」,「方」,「上」に対応する単語はない。
【0014】図6は、原文と翻訳文との類似度を数値化
した例を示す図である。図6中、A方式とは、第1言語
文の単語(自立語)に対応する第2言語文の単語の割合
を示し、B方式とは、第2言語文の単語(自立語)に対
応する第1言語文の単語の割合である。なお、この数値
化された類似度は、これらA方式、B方式のどちらか一
方に限る必要はなく、両方の類似度を用い、平均値であ
るとか、高い方とか、あるいは低い方とかいったものを
用いてもよい。また、かい離度をもって類似度を考える
ならば、“100%−かい離度=類似度”とすればよ
い。
【0015】図7は、前記A方式の類似度を求めるフロ
ーチャートである。以下、図7のフローチャートを説明
する。step1: 第1言語文の自立語数tと対応する対応数yの
初期値設定する。step2: 第1言語文単語カウンタnの初期値設定をす
る。step3: 第1言語文のn番目の単語Wnを取り出す。も
し、n番目に該当する単語がないならstep15へ。step4: 単語Wnは自立語かどうか判定、自立語でなけ
ればstep14へ。step5: 単語Wnが自立語ならば、自立語数tに1を加
える。
【0016】step6:単語Wnの訳語カウンタmの設定
をする。step7: 単語Wnのm番目の訳語Wnmを取り出す。も
し、m番目に該当する単語がなければstep14へ。step8: 第2言語文単語カウンタkの初期値設定をす
る。step9: 第2言語文のk番目の単語Xkを取り出す。も
し、k番目に該当する単語がなければstep11へ。step10: 単語Wnmと単語Xkを比較する。比較の結
果、WnmとXkが対応してなければ、step13へ。対
応していればstep12へ。step11: step9でk番目に該当する単語がないとき
は、mに1を加え、step7へ。step12: step10でWnmとXkが対応していれば、
yに1を加えstep14へ。step13: step10でWnmとXkが対応していなけれ
ば、kに1を加えstep9へ。step14: step4でWnが自立語でないときか、step7
でWnmがないときか、step12でyに1を加えた後
に、nに1を加えstep3へ。step15: 第1言語文の最後の単語について前述の処理
を終えたら、y/tを求める。
【0017】図8は、前記B方式の類似度を求めるフロ
ーチャートである。以下、図8のフローチャートを説明
する。step1: 第2言語文の自立語数tと対応する対応数yの
初期値設定する。step2: 第2言語文単語カウンタkの初期値設定をす
る。step3: 第2言語文のk番目の単語Xkを取り出す。も
し、k番目に該当する単語がないならstep15へ。step4: 単語Xkは自立語かどうか判定、自立語でなけ
ればstep14へ。step5: 単語Xkが自立語ならば自立語数tに1を加え
る。
【0018】step6:第1言語文単語カウンタnの初期
値を設定する。step7: 第1言語のn番目の単語Wnを取り出す。も
し、n番目に該当する単語がなければstep14へ。step8: 単語Wnの訳語カウンタmの初期値を設定をす
る。step9: 単語Wnのm番目の訳語Wnmを取り出す。も
し、m番目に該当する単語がなければstep11へ。step10: 単語Xkと単語Xnmを比較する。比較の結
果XkとWnmが対応してなければ、step13へ。対応
していればstep12へ。step11: step9でWnmに該当する単語がなければ、
nに1を加え、step7へ。step12: step10でXkとWnmが対応していれば、
yに1を加えstep14へ。 step13: step10でXkとWnmが対応していなけれ
ば、mに1を加えstep9へ。step14: step4でXkが自立語でないか、step7でW
nがないか、step12でyに1を加えた後、kに1を加
えstep3へ。step15: 第2言語文の最後の単語について前述の処理
を終えたらy/tを求める。
【0019】上述のようにして類似度を求めると、図6
に示すように、第1文の場合は、A方式の場合も100
%、B方式の場合も100%となり、第2文の場合は、
A方式の場合は60%、B方式の場合は50%となり、
A方式、B方式のいずれを用いても、第1文の原文と翻
訳文の類似度は極めて高く、第2文のそれは低いという
ことがわかる(類似度を数値で表わせるのでその数値に
より判定を下せる)。そして、この類似度の低い(かい
離度の高い)第2文を特殊な表現として抽出することが
できる。なお、A方式の場合なら、第2言語の文を単語
分割しなくても、翻訳文の文字列中に訳語があるか否か
によって、対応する単語の有無判定することができる。
また、A方式とB方式の両方の値を求める場合、前述の
A方式のフローチャートとB方式のフローチャートの両
方を行う必要は、必ずしもなく、例えば、A方式のフロ
ーチャートを採用した場合、A方式のフローを行った後
に、第2言語の文の自立語数t´を求め、このt´とA
方式のフローチャートで求めた対応数yを用いて、y/
t´を求めればB方式の類似度となる。
【0020】また、他の類似度判定手段として第1言語
から第2言語への機械翻訳技術を利用する方法もある。
以下機械翻訳技術を使った本発明の実施例を説明する。
機械翻訳技術によれば、通常は、原文の直訳的な翻訳文
が得られる。図9は、第1文と第2文の英文について、
英日機械翻訳を行った結果を表している。図10は、図
9で得られた機械翻訳結果文と対訳テキストですでに与
えられている翻訳文との比較を示す。
【0021】同一言語内での文の比較方法、つまり、機
械翻訳で与えられた文とすでに与えられている翻訳文と
の比較としては、新しい機械翻訳方法として注目されて
いる用例ベースの機械翻訳方式(「用例主導型機械翻
訳」隅田、飯田、情報処理学会、自然言語処理研究会資
料 82-5,1991)における、対訳用例データベース中の文
との類似度が利用できる。この方法によれば、与えられ
た文とデータベース中の文の構文構造及び単語の意味分
類を考慮した類似度を計算することができる。この方法
による機械翻訳とすでに与えられた翻訳文の類似度をも
って、本発明でいう類似度(かい離度)とするとよい。
【0022】前述の機械翻訳技術を利用した方法によれ
ば、第1文は明らかに構文構造が同じであり、用いられ
ている単語も同一か類義語であるので、類似度は極めて
高く、第2文は、構文構造が異なり、また、用いられて
いる単語も相違するものが多いので、類似度は低くな
る。
【0023】また、抽出した表現を特殊表現用例集4に
格納する際に、どの文書のどの位置から抽出されたかの
情報(出典情報)を付与すると、本発明による特殊表現
抽出方式を取り入れた文書作成支援装置等を実際に利用
する際に、使用者にとっては、もとの文章を参照した
り、出典を明示したりできるので、使い勝手がよくな
る。
【0024】図11は、電子化された文章情報から特殊
な表現を抽出する手段を具備した文書作成支援装置の構
成の一実施例を示す図で、図中、1は対訳テキスト、4
は特殊表現用例集、5は特殊表現抽出方式、6は文書作
成支援システム、7は各種用例集、8は文書ファイル
で、文書作成支援システム6内に設けられている特殊表
現抽出方式5を用いて、対訳テキスト1から特殊表現を
抽出し、特殊表現用例集4に格納している。
【0025】
【発明の効果】以上の説明から明らかなように、本発明
によれば、対訳テキストから直訳では得られないような
表現を抽出し、用例集を容易に作成することができる。
こうした表現は比較的洗練された表現になっているので
文書作成時に参照する際に有用である。特に、個人が直
接読んだ対訳テキストを対象にして、用例集が作成でき
れば、各個人になじみの深い用例集とすることができ
る。
【図面の簡単な説明】
【図1】 本発明による実施例を説明するために使う対
訳テキストの例である。
【図2】 本発明による特殊表現抽出方式の要部構成を
示した図である。
【図3】 本発明による特殊表現抽出方式の類似度判定
手段の構成を示した図である。
【図4】 図1の第1文の英文を単語分割し、訳語を与
えた図と、図1の第1文の翻訳文を単語分割した図であ
る。
【図5】 図1の第2文の英文を単語分割し、訳語を与
えた図と、図2の第2文の翻訳文を単語分割した図であ
る。
【図6】 類似度の数値化を表した図である。
【図7】 本発明によるA方式の類似度を求めるための
フローチャートである。
【図8】 本発明によるB方式の類似度を求めるための
フローチャートである。
【図9】 図1の第1文及び第2文の英文と英日機械翻
訳結果を表した図である。
【図10】 図1の第1文及び第2文の機械翻訳文と図
1の第1文及び第2文の対訳翻訳文である。
【図11】 文書作成支援システムに本発明による特殊
表現抽出方式を組み込んだときの構成を示す図である。
【符号の説明】
1…対訳テキスト(対訳文章情報)、2…類似度(かい
離度)判定手段、2a…第1言語単語分割手段、2b…
第2言語単語分割手段、2c…対訳辞書、2d…訳語候
補付与手段、2e…単語比較手段、3…特殊表現抽出手
段、4…特殊表現用例集、5…特殊表現抽出方式、6…
文書作成支援システム、7…各種用例集、8…文書ファ
イル。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 電子化された文章情報から特殊な表現を
    抽出する特殊表現抽出方式において、第1言語の文(原
    文)と第2言語の文(翻訳文)が対となっている対訳文
    章情報を抽出対象とする場合に、前記第1言語の文と前
    記第2言語の文を比較し、前記2つの文の類似度を判定
    する類似度判定手段と、該類似度判定手段で得られた類
    似度により、特殊な表現を判定/抽出する特殊表現抽出
    手段とを具備することを特徴とする特殊表現抽出方式。
  2. 【請求項2】 前記類似度判定手段が、第1言語の文を
    単語分割する手段と、第2言語の文を単語分割する手段
    と、第1言語から第2言語への対訳辞書と、該対訳辞書
    を用いて前記第1言語の文を単語分割する手段で得られ
    た各単語に対応する訳語を付与する手段と、前記訳語と
    前記第2言語の文を単語分割して得られた第2言語の単
    語とを比較する手段とからなることを特徴とする請求項
    1記載の特殊表現抽出方式。
  3. 【請求項3】 前記第1言語の文を分割して得られた単
    語のうち該単語の第2言語の訳語が前記第2言語の文を
    分解して得られた単語に対応する割合をもって類似度と
    扱うことを特徴とする請求項2に記載の特殊表現抽出方
    式。
  4. 【請求項4】 前記第2言語の文を分割して得られた単
    語のうち前記第1言語の文を分割して得られた単語に対
    する第2言語の訳語に対応する割合をもって類似度と扱
    うことを特徴とする請求項2に記載の特殊表現抽出方
    式。
  5. 【請求項5】 前記第1言語の文を分割して得られた単
    語のうち該単語の第2言語の訳語が前記第2言語の文を
    分解して得られた単語に対応する単語の割合と、前記第
    2言語の文を分割して得られた単語のうち前記第1言語
    の文を分割して得られた単語に対する第2言語の訳語に
    対応する割合とを用いて類似度を扱うことを特徴とする
    請求項2に記載の特殊表現抽出方式。
  6. 【請求項6】 前記類似度判定手段が、第1言語の文か
    ら第2言語の文へ翻訳する翻訳手段と、該翻訳手段によ
    って得られた翻訳文と第2言語の文を比較する手段とか
    らなることを特徴とする請求項1に記載の特殊表現抽出
    方式。
  7. 【請求項7】 抽出された特殊な表現に対して、対訳文
    章情報の出典情報を付与する手段を有することを特徴と
    する請求項1に記載の特殊表現抽出方式。
  8. 【請求項8】 第1言語の文(原文)と第2言語の文
    (翻訳文)が対となった電子化された対訳文章情報から
    特殊な表現を抽出する特殊表現抽出方式を具備したこと
    を特徴とする文書作成支援装置。
JP6031133A 1994-03-01 1994-03-01 特殊表現抽出方式及び文書作成支援装置 Pending JPH07239852A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6031133A JPH07239852A (ja) 1994-03-01 1994-03-01 特殊表現抽出方式及び文書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6031133A JPH07239852A (ja) 1994-03-01 1994-03-01 特殊表現抽出方式及び文書作成支援装置

Publications (1)

Publication Number Publication Date
JPH07239852A true JPH07239852A (ja) 1995-09-12

Family

ID=12322938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6031133A Pending JPH07239852A (ja) 1994-03-01 1994-03-01 特殊表現抽出方式及び文書作成支援装置

Country Status (1)

Country Link
JP (1) JPH07239852A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7636849B2 (en) 2001-04-24 2009-12-22 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7636849B2 (en) 2001-04-24 2009-12-22 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking

Similar Documents

Publication Publication Date Title
Kitaev et al. Multilingual constituency parsing with self-attention and pre-training
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
Sadat et al. Combination of Arabic preprocessing schemes for statistical machine translation
Azmi et al. A text summarizer for Arabic
US20090326912A1 (en) Means and a method for training a statistical machine translation system
US20090070097A1 (en) User input classification
JP5002271B2 (ja) 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
JP2004280574A (ja) 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
EP1503295A1 (en) Text generation method and text generation device
Sadat et al. Bilingual terminology acquisition from comparable corpora and phrasal translation to cross-language information retrieval
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
Pinnis et al. Developing a neural machine translation service for the 2017-2018 european union presidency
JPH07239852A (ja) 特殊表現抽出方式及び文書作成支援装置
JP4401269B2 (ja) 対訳判断装置及びプログラム
Leng et al. Analysis and research on lexical errors in machine translation in Chinese and Korean translation
Karlgren et al. The challenges of language variation in information access
JP2000339310A (ja) 文書分類方法、文書分類装置、およびプログラムを記録する記録媒体
Li et al. Lexical transfer ambiguity resolution using automatically-extracted concept co-occurrence information
JP2002132789A (ja) 文書検索方法
Ikehara et al. Approaches to disambiguation in ALT-J/E
GOH et al. Word embeddings in place of dictionary lookup in the context of academic writing
KR101742244B1 (ko) 통계적 기계 번역에서 문자 정렬을 이용한 단어 정렬 방법 및 이를 이용한 장치
Lehal et al. Review of techniques for extraction of bilingual lexicon from comparable corpora
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
Sumita Lexical transfer using a vector-space model