JP3066274B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP3066274B2 JP3066274B2 JP7003522A JP352295A JP3066274B2 JP 3066274 B2 JP3066274 B2 JP 3066274B2 JP 7003522 A JP7003522 A JP 7003522A JP 352295 A JP352295 A JP 352295A JP 3066274 B2 JP3066274 B2 JP 3066274B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- translated
- sentence
- original
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
し、さらに詳細には、ターゲット言語の文や語句を、そ
れに対応しているソース言語の文や語句に各々添付する
ような形で翻訳文を出力することが可能な機械翻訳装置
に関するものである。
1文単位で翻訳を実行するが、現状では、1文の長さが
長くなるほど、構文を誤って解析する可能性が高まり、
長い文を1文単位で翻訳すると、意味をなさない翻訳文
を出力する可能性が高かった。また、構文を正しく解析
した場合でも、論理的には正しいが非常に読みにくい翻
訳文を出力することも多い。
用者が後編集をして利用に供するという使用方法が主流
である。このため、翻訳結果を1文単位で出力せずに、
1文よりも小さな単位である単語・句・節などの単位で
翻訳結果を出力する翻訳装置が考案されている。前記し
たような利用形態においては、構文解析が誤っている可
能性が大きい状態で1文単位の翻訳結果が装置から得ら
れるよりも、句の内部での解析誤りが少ない状態で句の
単位で翻訳結果が得られる方が、結果の利用がしやすい
場合が多いからである。
に示されている技術による機械翻訳装置では、構文解析
の際に、最初に句専用の文法規則を用いて、句の単位で
構文構造を一旦構築し、しかる後に、文単位の解析のた
めの文法規則を用いて、文単位での構文構造の構築を試
みる。文単位の構文構造の構築に成功すれば、文単位で
の生成のための生成規則を用いて、文単位で翻訳結果を
出力する。文単位の構文構造の構築に失敗すれば、句専
用の生成規則を用いて、句単位で翻訳結果を出力する。
また、上記文献に記載されている別の実施例では、翻訳
結果を句単位で生成するか全文単位で生成するかを利用
者が選択できるとしている。
る技術による機械翻訳装置では、文法規則や生成規則が
「句単位のものと全文単位のもの」というように分かれ
て管理されている。つまり、文法規則の設計者にとって
は、そのような繁雑な文法規則を作る必要がある。そこ
で、本発明の目的は、文法規則の設計者にとって特殊な
構文解析規則を作る必要がなく、構文解析規則や分割規
則の設計に柔軟性があり、かつ利用者にとっては翻訳結
果の利用がしやすい機械翻訳装置を提供することであ
る。
制御することが可能であり、出力結果が読みやすく、ま
た、部分ごとに訳を出力することによって却って生じて
しまう分かりにくさを解消する能力を有する機械翻訳装
置を提供することである。
に、本発明による機械翻訳装置は、以下の特徴に基づい
て構成されている。
(ソース言語)で表された文章を他の言語(ターゲット
言語)で表された文章に翻訳するために、ソース言語で
表された文の解析・変換を行い、ターゲット言語の生成
を行う解析手段・変換手段・生成手段の各手段と、原文
の各単語と該単語に対応する解析・変換を通じて得られ
た訳文中の訳語の対応関係を記憶する記憶手段と、前記
解析手段により得られた原文の解析構造における句カテ
ゴリの種類に応じて、原文中の1文の内部を文法的なま
とまりに基づいて分割するための分割位置を決定する分
割位置決定手段と、 前記分割位置決定手段により決定
された分割位置で原文が分割された結果として得られ
た、原文中の各々の語句や節の範囲に対応する訳文中の
翻訳語句を組み立てて訳文フレーズを構築する訳フレー
ズ構築手段と、前記生成手段により生 成された訳文中の
翻訳語句を原文中の各々の語句や節に対応させて表示手
段に表示するために出力形式を生成する出力形式生計手
段と、を備えた機械翻訳装置において、前記原文中の1
文の内部を文法的なまとまりに基づいて分割する際に、
まとまりの範囲を細かくするか、あるいは大まかにする
かを設定する分割レベル設定手段を設け、前記分割位置
決定手段は、前記分割レベル設定手段にて設定されたレ
ベルに応じて分割位置を決定することを特徴とする。
ス言語のフレーズ範囲を認定し、それに対応する訳文フ
レーズを対応表示する表示手段において、原文の受けの
語と係りの語とが分割された場合に、その訳文の可読性
を向上させるために、前記分割位置決定手段は、その受
けの語に補助記号を挿入した形でフレーズ訳を生成する
ための補助記号生成位置決定機能を有し、さらに前記フ
レーズごとに補助記号を生成するか否かの情報及びその
生成位置を記憶する分割位置記憶手段と、を備え、原文
中の各々の語句や節の範囲に対応する訳文中の翻訳語句
を組み立てて訳文フレーズを構築する訳フレーズ構築手
段は、前記分割位置記憶手段に格納されている情報に応
じて、補助記号を挿入した形で訳文フレーズを構築する
機能を有することを特徴とする。
力形式整形手段は、原文フレーズと訳文フレーズとの対
応をとって対応表示する際に、ソース言語中の原文フレ
ーズとそれに対応する訳文フレーズの分割単位を前記分
割位置決定手段によって決定された分割位置とし、各分
割位置での原文フレーズと訳文フレーズとの対応関係の
表示において、各分割位置で対応する原文フレーズと訳
文フレーズとを揃った状態で表示するための表示開始位
置を決定するフレーズ開始位置決定手段と、表示手段に
て原文フレーズと訳文フレーズを表示するために各フレ
ーズのイメージを生成するためのイメージ生成手段と、
前記イメージ生成手段にて生成された原文フレーズと訳
文フレーズの各イメージの長さを求めるフレーズ長さ取
得手段と、前記フレーズ長さ取得手段で取得した各フレ
ーズのイメージの長さを比較し、その長い方の長さと前
記フレーズ開始位置決定手段で決定されたフレーズの開
始 位置の情報に基づいてフレーズのイメージの末尾位置
を求めるフレーズ末尾位置取得手段と、を有してなるこ
とを特徴とする。
形式整形手段は、ソース言語中の原文フレーズとそれに
対応する訳文フレーズの分割単位を前記分割位置決定手
段によって決定された分割位置とし、前記フレーズ開始
位置決定手段と前記イメージ生成手段と前記フレーズ長
さ取得手段と前記フレーズ末尾位置取得手段とによっ
て、前記各分割位置で分割された原文フレーズと訳文フ
レーズとを対応付けて前記表示手段に表示させ、その際
前記各分割位置で原文フレーズの範囲が容易に分かるア
ンダーラインを含む態様で表示するように出力形式を生
成するための強調表示手段を備えてなることを特徴とす
る。
ソース言語の文を形態素解析し、次に、従来の多くの機
械翻訳装置と同様に1文単位で構文解析・構文変換を行
い、ターゲット言語生成手段を用いて、1文に対する翻
訳文を構成する単語群を得て訳語バッファに格納する。
同時に、原語単語と訳語単語との対応情報をターゲット
言語生成手段により得て、原語‐訳語対応情報バッファ
に格納する。
手段・フレーズ分割規則データを用いて、原文における
フレーズの単位を決定する。そして、訳フレーズ構築手
段により、このフレーズを構成する各々の原語単語に対
応する訳語を、原語‐訳語対応情報バッファおよび訳語
バッファを参照して得る。そして、得られた訳語から、
訳フレーズ構築手段により、各々の訳文フレーズが構築
される。訳フレーズ構築手段は、そのための特別の規則
を必要とせず、原則としては、1文翻訳の場合の順番を
保存して、フレーズごとに訳語単語を並べるというもの
である。
分割の際に適用するフレーズ分割規則を選択することに
より、フレーズを長めにするか短めにするかを利用者が
指定することが可能になる。
位置決定手段によって決定し、訳フレーズ構築手段によ
って訳文フレーズを構築する際に補助記号とともに生成
することにより、部分ごとに訳を出すことによって却っ
て生じてしまう分かりにくさを解消することが可能にな
る。
式整形手段によって、原文フレーズと訳文フレーズとの
対応関係をわかりやすくするために出力形式が整えら
れ、出力手段に出力される。
を、各種図面を用いてその実施例を説明する。各実施例
では、ソース言語が英語であり、ターゲット言語が日本
語であるような機械翻訳装置を例にとり説明する。
械翻訳装置の構成を示すブロック図である。1は動作制
御手段であり、実際の機器構成においては主としてCP
U(中央処理装置)をもってこれを実現する。
いてはキーボード・マウス・ペン・タブレット・スキャ
ナ・文字認識装置などの入力装置や、通信回線と接続さ
れている通信装置をもってこれを実現する。
いてはCRT(陰極線管)・LCD(液晶表示装置)な
どの表示装置や、プリンターなどの印字装置、または通
信回線と接続されている通信装置をもってこれを実現す
る。
ュールである。6は翻訳用の辞書・文法規則その他翻訳
に必要な規則等のデータ、および、文をフレーズに分割
する際の基準となる規則などのデータを格納している記
憶手段である。7は動作用メインメモリである。
も、図1に示すように、翻訳モジュール5A、出力形式
整形手段5B、分割レベル設定手段5C、位置指定手段
5Dからなる。
析レベルがある。図中左上においてソース言語が入力さ
れると、レベルL1の辞書引き、レベルL2の形態素解析、
レベルL3の構文解析、…と、解析が進められる。
次の2つにわけられる。1つは、レベルL6のソース言語
およびターゲット言語のどちらにも依存しない概念(中
間言語と呼ぶ)まで解析し、そこから、レベルL7の文脈
生成、レベルL8の意味生成、レベルL9の構文生成、レベ
ルL10の形態素生成と生成を進めて、ターゲット言語を
生成していくピボット方式である。
析、レベルL3の構文解析、レベルL4の意味解析およびレ
ベルL5の文脈解析のいずれかまで解析を行ってソース言
語の内部構造を得、次に、この得られたソース言語の内
部構造と同レベルのターゲット言語の内部構造に変換し
た後、ターゲット言語を生成するトランスファー方式で
ある。上記各解析について説明すると以下の通りであ
る。
各形態素列(単語列)に分割し、この各単語に対する品
詞などの文法情報および訳語を得、さらに、時制・人称
・数などを解析する ●構文解析 単語間の係り受けなどの、文章の構造(構造解析木)を
決定する ●意味解析 複数の構文解析の結果から意味的に正しいものとそうで
ないものを判別する ●文脈解析 話題を理解し、省略や曖昧さを取り去る この発明で用いる翻訳モジュール5Aは、少なくとも図
2で説明したレベルL3の構文解析のレベルまでの解析を
行うものとする。
モジュール5Aの構成要素には、図1に示すように、辞
書引き・形態素解析手段5a、構文解析手段5b、構文
変換手段5c、ターゲット言語生成手段5dがある。さ
らに、本発明の機械翻訳装置の翻訳モジュール(5A)
は、翻訳中のデータを参照して文をフレーズに分割する
際の分割位置を決定する分割位置決定手段5eと、ター
ゲット言語生成手段5dにより生成されたターゲット言
語の単語から各フレーズを構築する訳フレーズ構築手段
5fとを備えている。
訳に適した各種の形式で翻訳結果が出力されるように、
原文と翻訳結果から出力イメージを生成する。出力形式
整形手段5Bには、図29に示すように、イメージ生成
手段5B‐1、フレーズ長さ取得手段5B‐2、フレー
ズ末尾位置取得手段5B‐3、フレーズ開始位置決定手
段5B‐4、強調表示手段(1)5B‐5、強調表示手
段(2)5B‐6が含まれる。強調表示手段(1)5B
‐5、強調表示手段(2)5B‐6はそれぞれ異なる態
様で強調表示を行うための手段である。
の部分は、ワードプロセッサやテキストエディタなど、
一般に文書データを扱って画面に表示することができる
コンピュータ応用機器すべてに共通する機能を有する部
分である。
れる出力形式は、本実施形態においては、すべての原文
フレーズと訳文フレーズとの対応関係の表示において、
対応する原文フレーズと訳文フレーズとの始点の位置が
揃った形式である。また、後に説明する他の実施形態
(第2の実施形態)においては、各々の原文フレーズの
範囲が容易に分かる態様で表示する形式や、利用者の意
図する特定の原文フレーズとそれに対応する訳文フレー
ズだけを他の部分とは異なる態様で表示する形式などで
ある。
段5Dは、後に説明する他の実施形態(第2の実施形
態)で使用する。
の進行に応じて、その一部が原文バファ7a、辞書引き
バッファ7b、変換前の構文バッファ7c、変換後の構
文バッファ7d、訳語バッファ7e、原語‐訳語対応情
報バッファ7f、分割位置バッファ7g、フレーズごと
の訳語単語位置バッファ7h、訳フレーズバッファ7
i、出力形式バッファ7jに、それぞれ割り当てられ
る。
形態における機械翻訳装置での翻訳の動作を説明する。
図3は、本実施形態における機械翻訳装置の動作を示す
フローチャートである。
structure used by SHARP-BASIC is random access.”
とする。
から原文が読み込まれ、図4に示すように、単語位置情
報とともに原文バッファ7aに格納される。次にステッ
プs2で、バッファ7aに格納された原文に対して辞書
引き・形態素解析が行われ、その結果がバッファ7bに
格納される。
ように決定されて、構文バッファ7cに格納される。そ
してステップs4で、構文変換手段5cの働きにより、
図5の構造解析木が、図6に示すように日本文に対する
構造に変換され、得られた結果が構文バッファ7dに格
納される。
る訳語 「逐次ファイル」 「に加えて」 「、」 「シャープ‐BASIC」 「によって」 「使われる」 「第2の」 「ファイル」 「構造」 「ランダムアクセス」 「である」 「。」 および、ターゲット言語生成手段5dによって生成され
た助詞 「は」 とが、図7のように訳語バッファにセットされる。
での単語位置情報とともに訳語バッファにセットされ
る。なお、このときの単語位置情報は、フレーズ訳では
なく1文全体を1文として訳すという前提で定められた
位置である。このようにする理由は、本実施形態におけ
る機械翻訳装置を実現するために好都合だからである。
の位置と、その原語単語に対応する訳語単語の訳文内で
の単語位置との対応を示す情報が、図8に示すように原
語‐訳語対応情報バッファにセットされる。
fにより、原文のフレーズへの分割位置が決定される。
分割位置の決定は、構文バッファ7cに格納されている
図5のような構造解析木に対して、メモリ7に格納され
ている図9のような分割規則を適用することにより行わ
れる。
点を所定の順序で探索し、各々の節点でそれぞれの分割
規則が適用可能か否かを調べ、可能なら分割位置設定の
措置を行うというものである。図5に示されている例に
対しては、以下に述べる節点で分割規則の適用を受け
る。
分割規則1『「文」節点の1段下の節点の間は分割す
る』が適用される。ここで、節点番号(1)の「文」節点
の1段下の節点とは、節点番号(2)の「前置詞句」節点
と節点番号(6)の「主節」節点である。これらの2つの
節点の間が分割される結果、原文においては“sequenti
alfiles,”と“the”との間が分割される ・ 節点番号(6)の「主節」節点に関して、分割規則2
『「主節」節点でまとめられている部分は分離する』が
適用される。ここで、節点番号(6)の「主節」節点でま
とめられている部分とは“the second file structure
used by SHARP-BASIC is random access.”を指す。よ
って、やはり“sequential files,”と“the”との間が
分割される ・ 節点番号(7)の「名詞句(主語)」節点に関して、分
割規則6『「主語」節点でまとめられている部分は分離
する』が適用される。ここで、節点番号(7)の「主語」
節点でまとめられている部分とは“the second file st
ructure used by SHARP-BASIC”を指す。よって、やは
り“sequential files,”と“the”との間と、新たに
“SHARP-BASIC”と“is”との間とが分割される ・ 節点番号(13)の「過去分詞句」節点に関して、分割
規則9『「過去分詞句」節点でまとめられている部分は
分離する』が適用される。ここで、節点番号(13)の「過
去分詞句」節点でまとめられている部分とは“used by
SHARP-BASIC”を指す。よって、“structure”と“use
d”との間と、やはり“SHARP-BASIC”と“is”との間と
が分割される。
果、最終的に分割される箇所は “sequential files,”と“the”との間 “structure”と“used”との間 “SHARP-BASIC”と“is”との間 の3箇所である。これを図示したのが図10である。
位置バッファ7gに格納される。分割位置バッファの形
式を図11に示す。図11の「単語位置」欄は、原文が
分割されてできたそれぞれの原文フレーズの開始単語位
置が格納されている。
果できるフレーズは “In addition to sequential files,” “the second file structure” “used by SHARP-BASIC” “is random access.” の4個であり、各々のフレーズの先頭の単語 “In” “the” “used” “is” の原文における単語位置は、図4の原文バッファを参照
すると、それぞれ 1 6 10 13 であることがわかる。これらの値が図11の分割位置バ
ッファの「単語位置」欄に格納されている。
ーズ構築手段5fにより、訳文フレーズが構築される。
れた原語‐訳語対応情報(図8参照)とステップs6で
作成された分割位置情報(図11参照)とに基づいて、
各々のフレーズを構成する訳語単語を得て、訳語バッフ
ァ(図7参照)に格納されているそれらの単語位置を、
図1の「フレーズごとの訳語単語位置バッファ」7hに
格納する。「フレーズごとの訳語単語位置バッファ」の
形式を図12に示す。
ば、1番目のフレーズ “In addition to sequential files,” に関しては、図11の分割位置バッファの連番1の単語
位置欄を参照することにより、原文における開始単語位
置が1であることがわかる。また、同バッファにより2
番目のフレーズの開始単語位置が6であることがわかる
から、1番目のフレーズの終了単語位置は5であること
がわかる。これらにより原文の1番目のフレーズは原文
中の単語位置がそれぞれ 1 2 3 4 5 の単語から成ることがわかる。次に、図8の原語‐訳語
対応情報バッファを参照し、上記の原語単語に対応する
訳語単語の単語位置を得ると、それぞれ 2 2 2 1 1 であることがわかる。これらから重複しているものを除
き、昇順に並べ替えると、 1 2 となる。これらが、原文の1番目のフレーズの訳を構成
する訳語の単語位置であり、これらの値を「フレーズご
との訳語単語位置バッファ」のフレーズ番号1の「訳語
単語位置」欄に格納する。
を構成する訳語の単語位置は、 7 8 9 3番目のフレーズについては 4 5 6 4番目のフレーズについては 12 13 であることがわかり、これらの値を、「フレーズごとの
訳語単語位置バッファ」のそれぞれのフレーズ番号の
「訳語単語位置」欄に格納する。
は、訳語単語のうち、その単語位置の値が「フレーズご
との訳語単語位置バッファ」にまだ格納されていない訳
語単語について、それが属するフレーズを定めて「フレ
ーズごとの訳語単語位置バッファ」の当該フレーズの
「訳語単語位置」欄に格納する。
が、原語‐訳語対応情報バッファの「対応する訳語単語
位置」欄に存在していない。これはすなわち、この単語
が、原語単語のうちのいずれかの訳語として得られたも
のではなく、ターゲット言語生成手段により適宜補われ
て生成された単語であることを意味しており、よって原
語単語のどれとも対応関係がない。この例では、図7の
訳語バッファの10番目の単語「は」がこれにあたる。
うな単語がどのフレーズに属するかを決定する手段とし
て、ここでは、一例として、次のような手段を採用す
る。訳語バッファにおいて当該単語の単語位置より1つ
若い単語位置の値が、原語‐訳語対応情報バッファの、
どの原語単語位置の「対応する訳語単語位置」欄に存在
しているかを調べる。(当該単語の単語位置より1つ若
い単語位置の値も、原語‐訳語対応情報バッファの「対
応する訳語単語位置」欄に存在していないなら、訳語バ
ッファにおいてさらに1つ若い単語番号の値について調
べる。以下、定まるまで繰り返し。また、当該単語の単
語位置より1つ若い単語位置の値が、原語‐訳語対応情
報バッファにおいて複数の原語単語位置の「対応する訳
語単語位置」の欄に存在しているならば、それらの原語
単語位置の中で最も大きい値を採用する。)ここでは、
訳文中の単語「は」の訳語単語位置10より1つ若い9
という単語位置の値が、図8の原語‐訳語対応情報バッ
ファの単語位置9の「対応する訳語単語位置」の欄に存
在しているので、得たい原語単語位置は9である。次
に、こうして得られた原語単語位置がどのフレーズに属
するかを、分割位置バッファを参照して知る。ここで
は、図11により、2番目のフレーズの原語単語範囲が
6から9までであることがわかるので、原語単語位置9
は2番目のフレーズに属することがわかる。このように
して、訳文中の単語のうち原語単語のどれとも対応して
いない単語が属するフレーズを得ることができるので、
その単語の訳語単語位置の値を、「フレーズごとの訳語
単語位置バッファ」の対応するフレーズ番号の「訳語単
語位置」欄に格納する。ここでは訳文中の単語「は」の
訳語単語位置の値10を、「フレーズごとの訳語単語位
置バッファ」のフレーズ番号2の「訳語単語位置」欄に
格納する。この結果、「フレーズごとの訳語単語位置バ
ッファ」は図12に示すようになり、フレーズ番号2の
訳を構成する訳語の単語位置は、 7 8 9 10 になる。
単語のどれとも対応関係がない単語の属するフレーズを
決定する手段はあくまでも一例であり、ソース言語やタ
ーゲット言語それぞれの文法的性質によって適宜定めら
れることが望ましい。
は、ステップs7−s8で作成された「フレーズごとの
訳語単語位置バッファ」の内容に基づき、訳語バッファ
を参照して、フレーズごとの訳を構築して、図1の「訳
フレーズバッファ」7iに格納する。
ば、1番目のフレーズを構成する訳語の訳語単語位置
は、図12の「フレーズごとの訳語単語位置バッファ」
のフレーズ番号1の「フレーズごとの訳語単語位置バッ
ファ」欄により、 1 2 であるとわかる。次に、図7の訳文バッファにより、訳
語単語位置1の訳語は「逐次ファイル」、訳語単語位置
2の訳語は「に加えて」であるとわかる。よって、これ
らの訳語を訳語単語位置の昇順につなげて得られた文字
列「逐次ファイルに加えて」を、訳フレーズバッファの
フレーズ番号1の訳フレーズ欄に格納する。 同様にし
て、2番目のフレーズの訳語は「第2の」「ファイル」
「は」、3番目のフレーズの訳語は「シャープ‐BAS
IC」「によって」「使われる」、4番目のフレーズの
訳語は「ランダムアクセス」「である」であり、これら
をそれぞれつなげて訳フレーズバッファの該当するフレ
ーズ番号の訳フレーズ欄に格納した結果を示したのが図
13である。
れぞれのフレーズに対する訳フレーズが得られ、ステッ
プs10に進み、出力形式整形手段5Bによって、結果
を出力する際の形式が整えられ、図1の出力形式バッフ
ァ7jに格納される。この形式は、例えば図14に示す
ように、それぞれのフレーズの原文と訳文の頭の位置が
揃えられ、原文フレーズとそれを訳した訳文フレーズと
の対応関係が明確にされている。
械翻訳装置は、原文フレーズと訳文フレーズとを対応さ
せて表示させる機能も備えた構成となっている。このこ
とを以下で説明する。
る機械翻訳装置を構成する出力形式整形手段5Bの動作
を示すフローチャートである。なお、この説明では、行
の折り返しやスクロールなど、一般に文書データを扱っ
て画面に表示することができるコンピュータ応用機器の
多くに共通する動作の説明は省略する。
示開始位置が画面の左上隅にセットされる(ステップs
2)。
によって、1番目の原文フレーズの表示開始位置が決定
され、イメージ生成手段5B‐1によって1番目の原文
フレーズのイメージが生成されて、出力形式バッファ7
jの表示開始位置以降の位置に1番目の原文フレーズの
イメージがセットされる(ステップs3)。次に、フレ
ーズ開始位置決定手段5B‐4によって、1番目の訳文
フレーズの表示開始位置が、1番目の原文フレーズの表
示開始位置から真下に一定の距離をおいた点と決定さ
れ、イメージ生成手段5B‐1によって2番目の原文フ
レーズのイメージが生成されて、出力形式バッファ7j
の表示開始位置(1番目の原文フレーズの表示開始位置
から真下に一定の距離をおいた点)以降の位置に1番目
の訳文フレーズのイメージがセットされる(ステップs
4)。
って、1番目の原文フレーズのイメージの長さおよび1
番目の訳文フレーズのイメージの長さが求められる(ス
テップs5、s6)。次に1番目の原文フレーズのイメ
ージの長さと1番目の訳文フレーズのイメージの長さと
が比較される(ステップs7)。今の場合、原文フレー
ズの方が長いので、フレーズ末尾位置取得手段5B‐3
により、出力形式バッファ7j中の1番目の原文フレー
ズのイメージの末尾位置が求められ、その位置が次のフ
レーズの表示開始位置とされる(ステップs9)。
ットしていないフレーズが存在するので(ステップs1
0)、次のフレーズに着目する(ステップs11)。
1番目の訳文フレーズについては、図14に示すよう
に、次の2番目の訳文フレーズの開始位置との間が空い
た形で表示される。
ル構造はについても、原文フレーズのイメージの長さが
訳文フレーズのイメージの長さより長いので、1番目の
フレーズと同様の動作でイメージが出力形式バッファ7
jにセットされる。
ズ used by SHARP-BASIC と、それに対応する訳文フレーズシャープ‐BASIC
によって使われるとでは、画面表示において訳文フレー
ズの長さの方が原文フレーズの長さよりも長い。このよ
うな場合の動作について説明する。
の出力形式バッファ7jへのセットは1番目のフレーズ
の場合と同様に行われる(ステップs3、s4)。
て、原文フレーズのイメージの長さおよび訳文フレーズ
のイメージの長さが求められる(ステップs5、s
6)。次に原文フレーズのイメージの長さと訳文フレー
ズのイメージの長さとが比較される(ステップs7)。
今の場合、訳文フレーズの方が長いので、フレーズ末尾
位置取得手段5B‐3により、出力形式バッファ7j中
の3番目の訳文フレーズのイメージの末尾位置が求めら
れ、その位置から真上に一定の距離をおいた点が次のフ
レーズの表示開始位置とされる(ステップs9)。
ットしていないフレーズが存在するので(ステップs1
0)、次のフレーズに着目する(ステップs11)。
3番目の原文フレーズについては、図14に示すよう
に、次の4番目の原文フレーズの開始位置との間が空い
た形で表示される。
それに対応する訳文フレーズとの組のすべてについて、
原文フレーズと訳文フレーズの頭の位置が揃って表示さ
れることが可能になる。
を、各種図面を用いてその実施例を説明する。
構成は、前記第1の実施形態の図1に示したものとほぼ
同じであるが、前記図1に示した構成要素の他に、本実
施形態特有の構成(実施例2−1)としては、 ・フレーズの単位を大まかにするか細かくにするかを利
用者が該装置に指定する分割レベル設定手段 ・フレーズの単位を大まかにするか細かくにするかに関
する設定値を保持するバッファ ・フレーズの単位を大まかにするか細かくにするかによ
って適用の可否が決まるフレーズ分割規則 ・フレーズの単位を大まかにするか細かくにするかに関
する設定値を参照して動作する分割位置決定手段 を備えていることである。ここではフレーズ分割規則に
ついて詳しく説明する。本実施形態における機械翻訳装
置は、出力されるフレーズの長さの傾向を3段階に調節
できるものとする。このためのフレーズ分割規則は、図
9に示したものに代わり、図15に示すものを用いる。
図15のフレーズ分割規則は、各々の規則に「レベル」
欄があることが特徴である。この「レベル」は、フレー
ズの単位を大まかにするか細かにするかによって適用の
可否を決める値である。
持するバッファに設定されている値が「1」ならば、分
割位置決定の際に、図15のフレーズ分割規則のうちレ
ベルが「1」の規則だけが適用される。そして、設定値
が「2」ならば、図15のフレーズ分割規則のうちレベ
ルが「1」と「2」の規則だけが適用される。設定値が
「3」ならば、図15のフレーズ分割規則のうちすべて
の規則が適用される。本実施形態の機械翻訳装置を用い
て、先の実施例と同じ “In addition to sequential files, the second file
structure used by SHARP-BASIC is random access.” という文を訳した場合について説明する。フレーズの長
さの傾向に関する設定値を「1」にすると、図16に示
すように、分割位置は1箇所になり、フレーズの個数は
2個になる。そしてその翻訳結果は図17に示すように
なる。一方、フレーズの長さの傾向に関する設定値を
「3」にすると、図18に示すように、分割位置は5箇
所になり、フレーズの個数は6個になる。そしてその翻
訳結果は図19に示すようになる。
動作結果は、本実施形態の機械翻訳装置を用いてフレー
ズの長さの傾向に関する設定値を「2」にした場合の動
作結果と同じであり、その翻訳結果は図14に示した通
りである。
別の構成として、たとえば、「原文のTHAT節がフレーズ
として分離した場合は、そのTHAT節の受けの語の訳語の
前に『〜』記号を付けて生成する」という機能を有する
実施例(実施例2−2)について説明する。本構成の特
徴としては、 ・構文や分割位置の条件に応じて「〜」記号の生成位置
を決定する規則 ・上記の規則に従って「〜」記号の生成位置を決定し、
その結果の情報を分割位置バッファに格納する分割位置
決定手段 ・「〜」記号の生成の有無の情報を格納する欄を備える
分割位置バッファ・分割位置バッファに格納されている
「〜」記号の生成の有無の情報に従って、「〜」を生成
することができる訳フレーズ構築手段を備える。
本実施形態における機械翻訳装置での翻訳の動作を説明
する。
unded off.” とする。また、フレーズ分割規則は図15に示したもの
のうち「レベル」が1の規則だけを適用するものとす
る。
での動作は、先に説明した第1の実施形態での実施例に
よる機械翻訳装置の動作と同じである。
fにより、原文のフレーズへの分割位置が決定される。
これと同時に、ここでは、図21に示されているような
規則を用いて、「〜」記号の生成位置も決定される。
に矢印で示したような位置に決定され、その結果は図2
3のように分割位置バッファに格納される。ここで、図
23の分割位置バッファには「『〜』の生成」という欄
がある。ここでは1番目のフレーズの「『〜』の生成」
欄に「有」という値が格納されており、1番目のフレー
ズに「〜」を付けることが指示されている。
s8までの動作は、先に説明した第1の実施形態での実
施例による機械翻訳装置の動作と同じである。次のステ
ップs9で、訳フレーズを構築する動作において、分割
位置バッファの「『〜』の生成」欄に「有」という値が
格納されているフレーズを生成する際には、訳フレーズ
バッファの当該フレーズの訳フレーズ欄に訳語を格納す
る際に「〜」記号も同時に格納する。ここでは、1番目
のフレーズの分割位置バッファの「『〜』の生成」欄に
「有」があるので、1番目の訳文フレーズを構築する際
には、1番目の原文フレーズを構成する原語単語 The reason is に対応する訳語単語(ここでは“The”に対応する訳語
単語は無いとする) 「理由」「である」 およびターゲット原語生成手段が適宜生成した訳文単語 「は」 に、記号「〜」を加えて適宜つなげた 「理由は〜である」 という文字列を、訳フレーズバッファのフレーズ番号1
の訳フレーズ欄に格納する。
た第1の実施形態での実施例による機械翻訳装置の動作
と同様に、出力形式が整えられて出力形式バッファ7j
に格納され、図24のように翻訳結果が出力される。
の実施例(実施例2−3)について説明する。本実施例
の機械翻訳装置の動作結果の出力画面を図25に示す。
ップs10において、図1の出力形式整形手段5Bによ
って出力形式が整えられる際に、それぞれのフレーズの
原文と訳文の頭の位置が揃えられることに加え、原文フ
レーズに沿ってアンダーラインが引かれ、フレーズの切
れ目でアンダーラインも切れるように出力イメージが作
られる。
式整形動作の際、ステップs3で原文フレーズのイメー
ジを出力形式バッファにセットする際に、図29のイメ
ージ生成手段5B‐1と同時に図29の強調表示手段
(1)5B‐5を動作させることにより実現される。
一層明確になる。
の実施例(実施例2−4)について説明する。本実施例
では、出力手段としてCRT(陰極線管)・LCD(液
晶表示装置)などの、利用者の操作に応じて表示内容を
時々刻々変化させることが可能な表示装置、および、そ
の表示装置の表示画面上の任意の箇所を利用者が指し示
すことを可能ならしめる手段(図1の5D。たとえば、
カーソル表示手段および図1の入力手段2に含まれるカ
ーソル移動キー、あるいは、マウスカーソル表示手段お
よび図1の入力手段2に含まれるマウス、など)を備え
ていることが必要である。ここではそのような位置指定
手段として、カーソル表示手段およびカーソル移動キー
を備えているものとして説明する。また、本実施例で
は、基本的な出力形式が、図27や図28に示すよう
に、原文と訳文とが別々の領域に表示されるものである
とする。
本実施形態での機械翻訳装置による翻訳結果表示の動作
を説明する。図26の“start”の時点で、翻訳はすで
に完了して、出力形式バッファには出力形式整形手段に
よって構築された表示画面のイメージがすでに格納され
ているものとする。
されているイメージを表示装置に表示する。その結果の
表示画面はたとえば図27のようになっている。図27
で、カーソルは、原文の1番目のフレーズ“In additio
n to sequential files,”の先頭の文字の位置にある。
このため、原文の1番目のフレーズ全体が、図29の強
調表示手段(2)5B‐6の働きで反転表示されていて、
それに対応する訳文の1番目のフレーズ「逐次ファイル
に加えて」も強調表示手段(2)5B‐6の働きで反転表
示されている。
何らかの入力を待ち受ける状態になる。ステップs2に
進んだ時点で利用者から表示終了の指示が出されていれ
ば、表示を終了する。さもなければステップs3に進
み、利用者がカーソル移動キーを操作することによって
カーソル移動の指示が出されていれば、ステップs4に
進み、さもなければステップs2に戻る。つまりこの時
点で利用者が何の操作もしなければ、ステップs2とs
3を回り続ける。
ようにカーソル移動キーを操作したとする。すると、ス
テップs3からs4に進み、出力形式整形手段はカーソ
ルの新たな位置情報を取得する。今、カーソルの新たな
位置は、原文の2番目のフレーズ“the second file st
ructure”の単語“second”の先頭の文字 s の位置とす
る。
いる原文フレーズがあるかが判定される。ここでは現在
“In addition to sequential files,”のフレーズが反
転表示されているので、ステップs6に進む。ステップ
s6では現在のカーソル位置が上述の反転表示されてい
る領域内であるかが判定される。ここでは現在のカーソ
ル位置は“In addition to sequential files,”のフレ
ーズ内ではないのでステップs6からステップs7に進
む。
ーソル移動を指示した移動先が、その時点で反転表示さ
れている原文フレーズの中であれば、ステップs6から
ステップs13に進む。)ステップs7では、その時点
で反転表示されている原文フレーズとそれに対応する訳
文フレーズとを通常の表示にするように、出力形式バッ
ファに出力イメージがセットされる。ここでは、“In a
ddition to sequential files,”と「逐次ファイルに加
えて」とを通常表示にするようにする。
が原文(すなわち、原文フレーズのいずれか)が表示さ
れている領域内であるかが判定される。ここでは現在の
カーソル位置はフレーズ“the second file structur
e”内であるので、ステップs8からステップs9に進
む。
する原文フレーズと訳文フレーズとを決定する。ステッ
プs9で、現在のカーソル位置にある単語の単語位置情
報を得る。ここでは現在のカーソル位置にある単語は
“second”であり、これは図4の原文バッファを参照す
ると、単語位置の値は7である。次にステップs10
で、その単語が属している原文フレーズの番号を得る。
ここでは図11の分割位置バッファからわかるように、
単語位置7の単語が属しているフレーズは2番目のフレ
ーズ“the second file structure”である。次にステ
ップs11で、その原文フレーズに対する訳文フレーズ
を得る。ここでは、図13の訳フレーズバッファを参照
することにより、2番目の原文フレーズに対応する訳文
フレーズは「第2のファイルは」であることがわかる。
こうして、新たに反転表示するべき原文フレーズと訳文
フレーズがそれぞれ“the second file structure”と
「第2のファイルは」に決定される。
表示されるべき原文フレーズと訳文フレーズとを反転表
示するように、強調表示手段(2)5B‐6が用いられ
て出力形式バッファに出力イメージがセットされる。そ
してステップs13ではカーソルを新たな位置に表示す
るように出力イメージが出力形式バッファにセットされ
る。
ァに格納されている出力イメージが表示装置に再表示さ
れ、その結果、図28に示すように、原文フレーズ“th
e second file structure”とそれに対応する訳文フレ
ーズ「第2のファイルは」とが反転表示され、カーソル
は単語“second”の先頭の文字 s の位置に表示され
る。
翻訳装置では、翻訳結果を1文よりも小さな単位である
句・節などの単位で出力するので、その出力結果を利用
者が後編集をして利用に供するという使用形態に適して
いる。
果を元にしてるので、句・節の単位だけで構文解析を行
うような機械翻訳装置に比較して、係り受けの共起に基
づいた訳語選択の精度が高いという利点を有する。たと
え、その1文単位の解析結果が誤っている場合でも、分
割することにより誤りが解消する可能性が非常に高い。
つまり、全文単位での解析と部分単位での生成の両方の
長所が採り入れられている。
位のもの」などのように分けていないので、規則の設計
者にとっては、そのような繁雑な文法規則を作る必要が
ない。設計者にとっては、構文解析結果を知ることがで
きれば、文法規則とは独立に分割規則を調整することが
でき、より自由度の高い規則を記述することが可能であ
る。
にレベル差を設け、適用するフレーズ分割規則のレベル
を利用者が調節可能とすることにより、出力されるフレ
ーズの長さの傾向を長めにするか短めにするかを利用者
が調節することが可能になる。
は、フレーズ単位で訳を出力することによって却って分
かりにくさが生じてしまう場合に備えては、出力される
訳文フレーズに、状況に応じて「〜」などの補助記号を
挿入することにより、この問題を解消することができ
る。
それぞれのフレーズの原文と訳文の長さの差にかかわら
ず、原文フレーズと訳文フレーズの頭の位置が揃えられ
た形で出力されるので、原文フレーズとそれを訳した訳
文フレーズとの対応関係が明確にされ、原文フレーズと
訳文フレーズとの対応が掴みやすい。
れぞれの原文フレーズに沿ってアンダーラインを引き、
フレーズの切れ目でアンダーラインも切れるようにする
ことにより、原文フレーズと訳文フレーズとの対応がよ
りいっそう掴みやすくすることができる。
である。
における翻訳レベルの説明図である。
理のフローチャートである。
例を示す図である。
を示す図である。
を示す図である。
例を示す図である。
例を示す図である。
容例を示す図である。
ーズ分割処理結果のイメージを示す図である。
ファの内容例を示す図である。
ファの内容例を示す図である。
ファの内容例を示す図である。
力手段への翻訳結果出力の例を示す図である。
るような本発明の機械翻訳装置の一実施例に用いられる
分割規則データの内容例を示す図である。
るよう調節した場合のフレーズ分割処理結果のイメージ
を示す図である。
るよう調節した場合の出力手段への翻訳結果出力の例を
示す図である。
るよう調節した場合のフレーズ分割処理結果のイメージ
を示す図である。
るよう調節した場合の出力手段への翻訳結果出力の例を
示す図である。
が可能な本発明の機械翻訳装置の一実施例の翻訳処理の
フローチャートである。
規則データの内容例を示す図である。
メージを示す図である。
バッファの内容例を示す図である。
の例を示す図である。
ーラインを付して原文フレーズの範囲をわかりやすくし
た本発明の機械翻訳装置の一実施例の出力手段への翻訳
結果出力の例を示す図である。
応する訳文フレーズとが反転表示されるような本発明の
機械翻訳装置の一実施例の反転表示処理の動作を示すフ
ローチャートである。
の例を示す図である。
の例を示す図である。
トである。
調表示手段 5C 分割レベル設定手段 5D 位置指定手段 6 記憶手段 7 動作用メインメモリ 7a 原文バッファ 7b 辞書引きバッファ 7c 変換前の構文バッファ 7d 変換後の構文バッファ 7e 訳語バッファ 7f 原語‐訳語対応情報バッファ 7g 分割位置バッファ 7h フレーズごとの訳語単語位置バッファ 7i 訳フレーズバッファ 7j 出力形式バッファ
Claims (4)
- 【請求項1】 ある言語(ソース言語)で表された文章
を他の言語(ターゲット言語)で表された文章に翻訳す
るために、 ソース言語で表された文の解析・変換を行い、ターゲッ
ト言語の生成を行う解析手段・変換手段・生成手段の各
手段と、 原文の各単語と該単語に対応する解析・変換を通じて得
られた訳文中の訳語の対応関係を記憶する記憶手段と、 前記解析手段により得られた原文の解析構造における句
カテゴリの種類に応じて、原文中の1文の内部を文法的
なまとまりに基づいて分割するための分割位置を決定す
る分割位置決定手段と、 前記分割位置決定手段により決定された分割位置で原文
が分割された結果として得られた、原文中の各々の語句
や節の範囲に対応する訳文中の翻訳語句を組み立てて訳
文フレーズを構築する訳フレーズ構築手段と、 前記生成手段により生成された訳文中の翻訳語句を原文
中の各々の語句や節に対応させて表示手段に表示するた
めに出力形式を生成する出力形式生計手段と、を備えた
機械翻訳装置において、 前記原文中の1文の内部を文法的なまとまりに基づいて
分割する際に、まとまりの範囲を細かくするか、あるい
は大まかにするかを設定するための分割レベル設定手段
を設け、 前記分割位置決定手段は、前記分割レベル設定手段にて
設定されたレベルに応じて分割位置を決定することを 特
徴とする機械翻訳装置。 - 【請求項2】 ソース言語のフレーズ範囲を認定し、そ
れに対応する訳文フレーズを対応表示する表示手段にお
いて、原文の受けの語と係りの語とが分割された場合
に、その訳文の可読性を向上させるために、 前記分割位置決定手段は、その受けの語に補助記号を挿
入した形でフレーズ訳を生成するための補助記号生成位
置決定機能を有し、 さらに前記フレーズごとに補助記号を生成するか否かの
情報及びその生成位置 を記憶する分割位置記憶手段と、
を備え、 原文中の各々の語句や節の範囲に対応する訳文中の翻訳
語句を組み立てて訳文フレーズを構築する訳フレーズ構
築手段は、前記分割位置記憶手段に格納されている情報
に応じて、補助記号を挿入した形で訳文フレーズを構築
する機能を有することを特徴とする 請求項1記載の機械
翻訳装置。 - 【請求項3】 前記出力形式整形手段は、原文フレーズ
と訳文フレーズとの対応をとって対応表示する際に、 ソース言語中の原文フレーズとそれに対応する訳文フレ
ーズの分割単位を前記分割位置決定手段によって決定さ
れた分割位置とし、各分割位置での原文フレーズと訳文
フレーズとの対応関係の表示において、 前記各分割位置で対応する原文フレーズと訳文フレーズ
とを揃った状態で表示するための表示開始位置を決定す
るフレーズ開始位置決定手段と、 前記表示手段にて原文フレーズと訳文フレーズを表示す
るために各フレーズのイメージを生成するためのイメー
ジ生成手段と、 前記イメージ生成手段にて生成された原文フレーズと訳
文フレーズの各イメージの長さを求めるフレーズ長さ取
得手段と、 前記フレーズ長さ取得手段で取得した各フレーズのイメ
ージの長さを比較し、その長い方の長さと前記フレーズ
開始位置決定手段で決定されたフレーズの開始位置の情
報に基づいてフレーズのイメージの末尾位置を求めるフ
レーズ末尾位置取得手段と、 を有してなることを特徴とする請求項1記載 の機械翻訳
装置。 - 【請求項4】 前記出力形式整形手段は、ソース言語中
の原文フレーズとそれに対応する訳文フレーズの分割単
位を前記分割位置決定手段によって決定された分割位置
とし、 前記フレーズ開始位置決定手段と前記イメージ生成手段
と前記フレーズ長さ取得手段と前記フレーズ末尾位置取
得手段とによって、前記各分割位置で分割された原文フ
レーズと訳文フレーズとを対応付けて前記表示手段に表
示させ、 その際前記各分割位置で原文フレーズの範囲が容易に分
かるアンダーラインを含む態様で表示するように出力形
式を生成するための強調表示手段を備えてなる ことを特
徴とする請求項3記載 の機械翻訳装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7003522A JP3066274B2 (ja) | 1995-01-12 | 1995-01-12 | 機械翻訳装置 |
US08/584,361 US5826219A (en) | 1995-01-12 | 1996-01-11 | Machine translation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7003522A JP3066274B2 (ja) | 1995-01-12 | 1995-01-12 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08190563A JPH08190563A (ja) | 1996-07-23 |
JP3066274B2 true JP3066274B2 (ja) | 2000-07-17 |
Family
ID=11559715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7003522A Expired - Fee Related JP3066274B2 (ja) | 1995-01-12 | 1995-01-12 | 機械翻訳装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5826219A (ja) |
JP (1) | JP3066274B2 (ja) |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122606A (en) * | 1996-12-10 | 2000-09-19 | Johnson; William J. | System and method for enhancing human communications |
US6161082A (en) * | 1997-11-18 | 2000-12-12 | At&T Corp | Network based language translation system |
US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
JP4118470B2 (ja) * | 1999-08-30 | 2008-07-16 | 富士通株式会社 | 電子メール装置,電子メール送信方法及び記録媒体 |
US6772413B2 (en) * | 1999-12-21 | 2004-08-03 | Datapower Technology, Inc. | Method and apparatus of data exchange using runtime code generator and translator |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
US20020072914A1 (en) * | 2000-12-08 | 2002-06-13 | Hiyan Alshawi | Method and apparatus for creation and user-customization of speech-enabled services |
JP3969628B2 (ja) * | 2001-03-19 | 2007-09-05 | 富士通株式会社 | 翻訳支援装置、方法及び翻訳支援プログラム |
US20060253784A1 (en) * | 2001-05-03 | 2006-11-09 | Bower James M | Multi-tiered safety control system and methods for online communities |
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
US20030040899A1 (en) * | 2001-08-13 | 2003-02-27 | Ogilvie John W.L. | Tools and techniques for reader-guided incremental immersion in a foreign language text |
WO2003021391A2 (en) * | 2001-08-30 | 2003-03-13 | Umpleby Stuart A | Method and apparatus for translating between two species of one generic language |
US20030061022A1 (en) * | 2001-09-21 | 2003-03-27 | Reinders James R. | Display of translations in an interleaved fashion with variable spacing |
FR2833375B1 (fr) * | 2001-12-07 | 2004-06-04 | Amadeus | Procede, dispositif d'adaptation de fichiers numeriques |
KR100453227B1 (ko) * | 2001-12-28 | 2004-10-15 | 한국전자통신연구원 | 번역 지원 시스템에서의 유사 문장 검색 방법 |
US7356607B2 (en) * | 2002-02-22 | 2008-04-08 | International Business Machines Corporation | Method and system for routing data repository messages between computing devices |
US7620538B2 (en) | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
CN1685313A (zh) * | 2002-09-30 | 2005-10-19 | 陈宁萍 | 由指针发起的对电子文档中文本信息的即时双语注释 |
JP4410486B2 (ja) * | 2003-05-12 | 2010-02-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 機械翻訳装置及びプログラム |
US8548794B2 (en) * | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
JP4076520B2 (ja) * | 2004-05-26 | 2008-04-16 | 富士通株式会社 | 翻訳支援プログラムおよび単語対応付けプログラム |
US8600728B2 (en) | 2004-10-12 | 2013-12-03 | University Of Southern California | Training for a text-to-text application which uses string to tree conversion for training and decoding |
JP4473702B2 (ja) * | 2004-11-02 | 2010-06-02 | 株式会社東芝 | 機械翻訳システム、機械翻訳方法及びプログラム |
US8249854B2 (en) * | 2005-05-26 | 2012-08-21 | Microsoft Corporation | Integrated native language translation |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9471562B2 (en) | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US9189482B2 (en) | 2012-10-10 | 2015-11-17 | Abbyy Infopoisk Llc | Similar document search |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8892423B1 (en) | 2006-10-10 | 2014-11-18 | Abbyy Infopoisk Llc | Method and system to automatically create content for dictionaries |
US9053090B2 (en) | 2006-10-10 | 2015-06-09 | Abbyy Infopoisk Llc | Translating texts between languages |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9588958B2 (en) | 2006-10-10 | 2017-03-07 | Abbyy Infopoisk Llc | Cross-language text classification |
US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8078450B2 (en) * | 2006-10-10 | 2011-12-13 | Abbyy Software Ltd. | Method and system for analyzing various languages and constructing language-independent semantic structures |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8452585B2 (en) * | 2007-06-21 | 2013-05-28 | Microsoft Corporation | Discriminative syntactic word order model for machine translation |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
JP5256654B2 (ja) * | 2007-06-29 | 2013-08-07 | 富士通株式会社 | 文章分割プログラム、文章分割装置および文章分割方法 |
US20090162818A1 (en) * | 2007-12-21 | 2009-06-25 | Martin Kosakowski | Method for the determination of supplementary content in an electronic device |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
CN102369524B (zh) * | 2009-03-30 | 2014-08-13 | 日本电气株式会社 | 语言分析装置和语言分析方法 |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
CN101739395A (zh) * | 2009-12-31 | 2010-06-16 | 程光远 | 机器翻译方法和系统 |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
CN102193912B (zh) * | 2010-03-12 | 2013-11-06 | 富士通株式会社 | 短语划分模型建立方法、统计机器翻译方法以及解码器 |
JP5058280B2 (ja) * | 2010-03-12 | 2012-10-24 | シャープ株式会社 | 翻訳装置、翻訳方法及びコンピュータプログラム |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
JP6226321B2 (ja) * | 2013-10-23 | 2017-11-08 | 株式会社サン・フレア | 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
JP6017409B2 (ja) * | 2013-12-24 | 2016-11-02 | 日本電信電話株式会社 | 翻訳装置、方法、及びプログラム |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
WO2016033617A2 (en) * | 2014-08-28 | 2016-03-03 | Duy Thang Nguyen | Method of asynchronous machine translation |
WO2016033618A2 (en) * | 2014-08-28 | 2016-03-03 | Duy Thang Nguyen | Method of data storage and language conversion |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
JP6709678B2 (ja) * | 2016-05-10 | 2020-06-17 | 日本放送協会 | 読解支援装置及びプログラム |
JP6815184B2 (ja) * | 2016-12-13 | 2021-01-20 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN108763228A (zh) * | 2018-05-21 | 2018-11-06 | 王伟宙 | 一种自然语言辅助处理系统 |
US12086559B2 (en) * | 2021-03-31 | 2024-09-10 | International Business Machines Corporation | Clause extraction using machine translation and natural language processing |
EP4221169A1 (en) * | 2022-01-31 | 2023-08-02 | Koa Health B.V. Sucursal en España | System and method for monitoring communication quality |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5351189A (en) * | 1985-03-29 | 1994-09-27 | Kabushiki Kaisha Toshiba | Machine translation system including separated side-by-side display of original and corresponding translated sentences |
JPS61255468A (ja) * | 1985-05-08 | 1986-11-13 | Toshiba Corp | 機械翻訳処理装置 |
DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
JPS6244877A (ja) * | 1985-08-22 | 1987-02-26 | Toshiba Corp | 機械翻訳装置 |
JP2732563B2 (ja) * | 1986-05-20 | 1998-03-30 | 株式会社東芝 | 機械翻訳方法及び装置 |
US5005127A (en) * | 1987-10-26 | 1991-04-02 | Sharp Kabushiki Kaisha | System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules |
JPH0268662A (ja) * | 1988-09-02 | 1990-03-08 | Sharp Corp | 機械翻訳装置 |
-
1995
- 1995-01-12 JP JP7003522A patent/JP3066274B2/ja not_active Expired - Fee Related
-
1996
- 1996-01-11 US US08/584,361 patent/US5826219A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH08190563A (ja) | 1996-07-23 |
US5826219A (en) | 1998-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3066274B2 (ja) | 機械翻訳装置 | |
JP3220560B2 (ja) | 機械翻訳装置 | |
JP2892548B2 (ja) | 自動翻訳装置 | |
JPH06195373A (ja) | 機械翻訳装置 | |
JPH1083398A (ja) | 文書翻訳方法、文書翻訳システム及び機械読み取り可能媒体 | |
JP2815714B2 (ja) | 翻訳装置 | |
JPH02281372A (ja) | 機械翻訳装置における挿入副詞句処理方法 | |
JPH0261763A (ja) | 機械翻訳装置 | |
JPH0344764A (ja) | 機械翻訳装置 | |
JP2593065B2 (ja) | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 | |
JP3467159B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP3174664B2 (ja) | 機械翻訳装置 | |
JP3353873B2 (ja) | 機械翻訳装置 | |
JP3389313B2 (ja) | 機械翻訳装置 | |
JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
JP3233800B2 (ja) | 機械翻訳装置 | |
JP3467161B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
JP3406462B2 (ja) | 機械翻訳装置 | |
JP5331964B2 (ja) | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム | |
JPH05225232A (ja) | テキスト自動前編集装置 | |
JP2005031922A (ja) | 機械翻訳装置 | |
JPH10187732A (ja) | 多言語対応通信システム | |
JPH10222516A (ja) | 多言語対応通信システム | |
JPH10320395A (ja) | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080512 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090512 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100512 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120512 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120512 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130512 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |