JP3066274B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3066274B2
JP3066274B2 JP7003522A JP352295A JP3066274B2 JP 3066274 B2 JP3066274 B2 JP 3066274B2 JP 7003522 A JP7003522 A JP 7003522A JP 352295 A JP352295 A JP 352295A JP 3066274 B2 JP3066274 B2 JP 3066274B2
Authority
JP
Japan
Prior art keywords
phrase
translated
sentence
original
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7003522A
Other languages
English (en)
Other versions
JPH08190563A (ja
Inventor
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP7003522A priority Critical patent/JP3066274B2/ja
Priority to US08/584,361 priority patent/US5826219A/en
Publication of JPH08190563A publication Critical patent/JPH08190563A/ja
Application granted granted Critical
Publication of JP3066274B2 publication Critical patent/JP3066274B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、機械翻訳装置に関
し、さらに詳細には、ターゲット言語の文や語句を、そ
れに対応しているソース言語の文や語句に各々添付する
ような形で翻訳文を出力することが可能な機械翻訳装置
に関するものである。
【0002】
【従来の技術】現在存在する多くの機械翻訳装置では、
1文単位で翻訳を実行するが、現状では、1文の長さが
長くなるほど、構文を誤って解析する可能性が高まり、
長い文を1文単位で翻訳すると、意味をなさない翻訳文
を出力する可能性が高かった。また、構文を正しく解析
した場合でも、論理的には正しいが非常に読みにくい翻
訳文を出力することも多い。
【0003】現在の機械翻訳装置は、その出力結果を利
用者が後編集をして利用に供するという使用方法が主流
である。このため、翻訳結果を1文単位で出力せずに、
1文よりも小さな単位である単語・句・節などの単位で
翻訳結果を出力する翻訳装置が考案されている。前記し
たような利用形態においては、構文解析が誤っている可
能性が大きい状態で1文単位の翻訳結果が装置から得ら
れるよりも、句の内部での解析誤りが少ない状態で句の
単位で翻訳結果が得られる方が、結果の利用がしやすい
場合が多いからである。
【0004】たとえば、特開昭64−78373号公報
に示されている技術による機械翻訳装置では、構文解析
の際に、最初に句専用の文法規則を用いて、句の単位で
構文構造を一旦構築し、しかる後に、文単位の解析のた
めの文法規則を用いて、文単位での構文構造の構築を試
みる。文単位の構文構造の構築に成功すれば、文単位で
の生成のための生成規則を用いて、文単位で翻訳結果を
出力する。文単位の構文構造の構築に失敗すれば、句専
用の生成規則を用いて、句単位で翻訳結果を出力する。
また、上記文献に記載されている別の実施例では、翻訳
結果を句単位で生成するか全文単位で生成するかを利用
者が選択できるとしている。
【0005】
【発明が解決しようとする課題】上記文献に示されてい
る技術による機械翻訳装置では、文法規則や生成規則が
「句単位のものと全文単位のもの」というように分かれ
て管理されている。つまり、文法規則の設計者にとって
は、そのような繁雑な文法規則を作る必要がある。そこ
で、本発明の目的は、文法規則の設計者にとって特殊な
構文解析規則を作る必要がなく、構文解析規則や分割規
則の設計に柔軟性があり、かつ利用者にとっては翻訳結
果の利用がしやすい機械翻訳装置を提供することであ
る。
【0006】さらに、利用者にも部分訳の動作の傾向を
制御することが可能であり、出力結果が読みやすく、ま
た、部分ごとに訳を出力することによって却って生じて
しまう分かりにくさを解消する能力を有する機械翻訳装
置を提供することである。
【0007】
【課題を解決するための手段】上記の目的を達するため
に、本発明による機械翻訳装置は、以下の特徴に基づい
て構成されている
【0008】請求項1記載の発明によれば、ある言語
(ソース言語)で表された文章を他の言語(ターゲット
言語)で表された文章に翻訳するために、ソース言語で
表された文の解析・変換を行い、ターゲット言語の生成
を行う解析手段・変換手段・生成手段の各手段と、原文
の各単語と該単語に対応する解析・変換を通じて得られ
た訳文中の訳語の対応関係を記憶する記憶手段と、前記
解析手段により得られた原文の解析構造における句カテ
ゴリの種類に応じて、原文中の1文の内部を文法的なま
とまりに基づいて分割するための分割位置を決定する分
割位置決定手段と、 前記分割位置決定手段により決定
された分割位置で原文が分割された結果として得られ
た、原文中の各々の語句や節の範囲に対応する訳文中の
翻訳語句を組み立てて訳文フレーズを構築する訳フレー
ズ構築手段と、前記生成手段により生 成された訳文中の
翻訳語句を原文中の各々の語句や節に対応させて表示手
段に表示するために出力形式を生成する出力形式生計手
段と、を備えた機械翻訳装置において、前記原文中の1
文の内部を文法的なまとまりに基づいて分割する際に、
まとまりの範囲を細かくするか、あるいは大まかにする
かを設定する分割レベル設定手段を設け、前記分割位置
決定手段は、前記分割レベル設定手段にて設定されたレ
ベルに応じて分割位置を決定することを特徴とする
【0009】また、請求項記載の発明によれば、ソー
ス言語のフレーズ範囲を認定し、それに対応する訳文フ
レーズを対応表示する表示手段において、原文の受けの
語と係りの語とが分割された場合に、その訳文の可読性
を向上させるために、前記分割位置決定手段は、その受
けの語に補助記号を挿入した形でフレーズ訳を生成する
ための補助記号生成位置決定機能を有し、さらに前記フ
レーズごとに補助記号を生成するか否かの情報及びその
生成位置を記憶する分割位置記憶手段と、を備え、原文
中の各々の語句や節の範囲に対応する訳文中の翻訳語句
を組み立てて訳文フレーズを構築する訳フレーズ構築手
段は、前記分割位置記憶手段に格納されている情報に応
じて、補助記号を挿入した形で訳文フレーズを構築する
機能を有することを特徴とする
【0010】さらに、請求項記載の発明によれば、
力形式整形手段は、原文フレーズと訳文フレーズとの対
応をとって対応表示する際に、ソース言語中の原文フレ
ーズとそれに対応する訳文フレーズの分割単位を前記分
割位置決定手段によって決定された分割位置とし、各分
割位置での原文フレーズと訳文フレーズとの対応関係の
表示において、各分割位置で対応する原文フレーズと訳
文フレーズとを揃った状態で表示するための表示開始位
置を決定するフレーズ開始位置決定手段と、表示手段に
て原文フレーズと訳文フレーズを表示するために各フレ
ーズのイメージを生成するためのイメージ生成手段と、
前記イメージ生成手段にて生成された原文フレーズと訳
文フレーズの各イメージの長さを求めるフレーズ長さ取
得手段と、前記フレーズ長さ取得手段で取得した各フレ
ーズのイメージの長さを比較し、その長い方の長さと前
記フレーズ開始位置決定手段で決定されたフレーズの開
位置の情報に基づいてフレーズのイメージの末尾位置
を求めるフレーズ末尾位置取得手段と、を有してなるこ
とを特徴とする
【0011】また、請求項記載の発明によれば、出力
形式整形手段は、ソース言語中の原文フレーズとそれに
対応する訳文フレーズの分割単位を前記分割位置決定手
段によって決定された分割位置とし、前記フレーズ開始
位置決定手段と前記イメージ生成手段と前記フレーズ長
さ取得手段と前記フレーズ末尾位置取得手段とによっ
て、前記各分割位置で分割された原文フレーズと訳文フ
レーズとを対応付けて前記表示手段に表示させ、その際
前記各分割位置で原文フレーズの範囲が容易に分かるア
ンダーラインを含む態様で表示するように出力形式を生
成するための強調表示手段を備えてなることを特徴とす
【0012】
【作用】本発明によれば、入力手段を用いて入力された
ソース言語の文を形態素解析し、次に、従来の多くの機
械翻訳装置と同様に1文単位で構文解析・構文変換を行
い、ターゲット言語生成手段を用いて、1文に対する翻
訳文を構成する単語群を得て訳語バッファに格納する。
同時に、原語単語と訳語単語との対応情報をターゲット
言語生成手段により得て、原語‐訳語対応情報バッファ
に格納する。
【0013】次に、構文解析結果に対し、分割位置決定
手段・フレーズ分割規則データを用いて、原文における
フレーズの単位を決定する。そして、訳フレーズ構築手
段により、このフレーズを構成する各々の原語単語に対
応する訳語を、原語‐訳語対応情報バッファおよび訳語
バッファを参照して得る。そして、得られた訳語から、
訳フレーズ構築手段により、各々の訳文フレーズが構築
される。訳フレーズ構築手段は、そのための特別の規則
を必要とせず、原則としては、1文翻訳の場合の順番を
保存して、フレーズごとに訳語単語を並べるというもの
である。
【0014】さらに、利用者の指定によって、フレーズ
分割の際に適用するフレーズ分割規則を選択することに
より、フレーズを長めにするか短めにするかを利用者が
指定することが可能になる。
【0015】このとき、補助記号を挿入する箇所を分割
位置決定手段によって決定し、訳フレーズ構築手段によ
って訳文フレーズを構築する際に補助記号とともに生成
することにより、部分ごとに訳を出すことによって却っ
て生じてしまう分かりにくさを解消することが可能にな
る。
【0016】さらに、翻訳結果の出力の際には、出力形
式整形手段によって、原文フレーズと訳文フレーズとの
対応関係をわかりやすくするために出力形式が整えら
れ、出力手段に出力される。
【0017】
【実施例】[第1の実施形態] 以下、本発明の機械翻訳装置における第1の実施形態
を、各種図面を用いてその実施例を説明する。実施例
では、ソース言語が英語であり、ターゲット言語が日本
語であるような機械翻訳装置を例にとり説明する。
【0018】図1は本発明の第1の実施形態における
械翻訳装置の構成を示すブロック図である。1は動作制
御手段であり、実際の機器構成においては主としてCP
U(中央処理装置)をもってこれを実現する。
【0019】2は入力手段であり、実際の機器構成にお
いてはキーボード・マウス・ペン・タブレット・スキャ
ナ・文字認識装置などの入力装置や、通信回線と接続さ
れている通信装置をもってこれを実現する。
【0020】3は出力手段であり、実際の機器構成にお
いてはCRT(陰極線管)・LCD(液晶表示装置)な
どの表示装置や、プリンターなどの印字装置、または通
信回線と接続されている通信装置をもってこれを実現す
る。
【0021】4はバスライン、5は動作プログラムモジ
ュールである。6は翻訳用の辞書・文法規則その他翻訳
に必要な規則等のデータ、および、文をフレーズに分割
する際の基準となる規則などのデータを格納している記
憶手段である。7は動作用メインメモリである。
【0022】動作プログラムモジュール5は、少なくと
も、図1に示すように、翻訳モジュール5A、出力形式
整形手段5B、分割レベル設定手段5C、位置指定手段
5Dからなる。
【0023】一般に、機械翻訳には図2に示すような解
析レベルがある。図中左上においてソース言語が入力さ
れると、レベルL1の辞書引き、レベルL2の形態素解析、
レベルL3の構文解析、…と、解析が進められる。
【0024】機械翻訳はこの解析レベルにより、大きく
次の2つにわけられる。1つは、レベルL6のソース言語
およびターゲット言語のどちらにも依存しない概念(中
間言語と呼ぶ)まで解析し、そこから、レベルL7の文脈
生成、レベルL8の意味生成、レベルL9の構文生成、レベ
ルL10の形態素生成と生成を進めて、ターゲット言語を
生成していくピボット方式である。
【0025】もう1つは、上述のレベルL2の形態素解
析、レベルL3の構文解析、レベルL4の意味解析およびレ
ベルL5の文脈解析のいずれかまで解析を行ってソース言
語の内部構造を得、次に、この得られたソース言語の内
部構造と同レベルのターゲット言語の内部構造に変換し
た後、ターゲット言語を生成するトランスファー方式で
ある。上記各解析について説明すると以下の通りであ
る。
【0026】●辞書引き、形態素解析 図1に示す記憶手段6の辞書を引き、入力された文章を
各形態素列(単語列)に分割し、この各単語に対する品
詞などの文法情報および訳語を得、さらに、時制・人称
・数などを解析する ●構文解析 単語間の係り受けなどの、文章の構造(構造解析木)を
決定する ●意味解析 複数の構文解析の結果から意味的に正しいものとそうで
ないものを判別する ●文脈解析 話題を理解し、省略や曖昧さを取り去る この発明で用いる翻訳モジュール5Aは、少なくとも図
2で説明したレベルL3の構文解析のレベルまでの解析を
行うものとする。
【0027】この原理による翻訳を実現するため、翻訳
モジュール5Aの構成要素には、図1に示すように、辞
書引き・形態素解析手段5a、構文解析手段5b、構文
変換手段5c、ターゲット言語生成手段5dがある。さ
らに、本発明の機械翻訳装置の翻訳モジュール(5A)
は、翻訳中のデータを参照して文をフレーズに分割する
際の分割位置を決定する分割位置決定手段5eと、ター
ゲット言語生成手段5dにより生成されたターゲット言
語の単語から各フレーズを構築する訳フレーズ構築手段
5fとを備えている。
【0028】出力形式整形手段5Bは、フレーズごとの
訳に適した各種の形式で翻訳結果が出力されるように、
原文と翻訳結果から出力イメージを生成する。出力形式
整形手段5Bには、図29に示すように、イメージ生成
手段5B‐1、フレーズ長さ取得手段5B‐2、フレー
ズ末尾位置取得手段5B‐3、フレーズ開始位置決定手
段5B‐4、強調表示手段(1)5B‐5、強調表示手
段(2)5B‐6が含まれる。強調表示手段(1)5B
‐5、強調表示手段(2)5B‐6はそれぞれ異なる態
様で強調表示を行うための手段である。
【0029】出力形式整形手段5Bのうち上記した以外
の部分は、ワードプロセッサやテキストエディタなど、
一般に文書データを扱って画面に表示することができる
コンピュータ応用機器すべてに共通する機能を有する部
分である。
【0030】この出力形式整形手段5Bによって生成さ
れる出力形式は、本実施形態においては、すべての原文
フレーズと訳文フレーズとの対応関係の表示において、
対応する原文フレーズと訳文フレーズとの始点の位置が
揃った形式である。また、後に説明する他の実施形態
(第2の実施形態)においては、各々の原文フレーズの
範囲が容易に分かる態様で表示する形式や、利用者の意
図する特定の原文フレーズとそれに対応する訳文フレー
ズだけを他の部分とは異なる態様で表示する形式などで
ある。
【0031】分割レベル設定手段5Cおよび位置指定手
段5Dは、後に説明する他の実施形態(第2の実施形
態)で使用する。
【0032】また、動作用メインメモリ7は、翻訳動作
の進行に応じて、その一部が原文バファ7a、辞書引き
バッファ7b、変換前の構文バッファ7c、変換後の構
文バッファ7d、訳語バッファ7e、原語‐訳語対応情
報バッファ7f、分割位置バッファ7g、フレーズごと
の訳語単語位置バッファ7h、訳フレーズバッファ7
i、出力形式バッファ7jに、それぞれ割り当てられ
る。
【0033】以下、図面を用いて、本発明の第1の実施
形態における機械翻訳装置での翻訳の動作を説明する。
図3は、本実施形態における機械翻訳装置の動作を示す
フローチャートである。
【0034】原文は “In addition to sequential files, the second file
structure used by SHARP-BASIC is random access.”
とする。
【0035】まず、図3のステップs1で、入力手段1
から原文が読み込まれ、図4に示すように、単語位置情
報とともに原文バッファ7aに格納される。次にステッ
プs2で、バッファ7aに格納された原文に対して辞書
引き・形態素解析が行われ、その結果がバッファ7bに
格納される。
【0036】ステップs3で、構造解析木が図5に示す
ように決定されて、構文バッファ7cに格納される。そ
してステップs4で、構文変換手段5cの働きにより、
図5の構造解析木が、図6に示すように日本文に対する
構造に変換され、得られた結果が構文バッファ7dに格
納される。
【0037】次に、ステップs5で、原文の単語に対す
る訳語 「逐次ファイル」 「に加えて」 「、」 「シャープ‐BASIC」 「によって」 「使われる」 「第2の」 「ファイル」 「構造」 「ランダムアクセス」 「である」 「。」 および、ターゲット言語生成手段5dによって生成され
た助詞 「は」 とが、図7のように訳語バッファにセットされる。
【0038】このとき各々の訳語単語は、それの訳文内
での単語位置情報とともに訳語バッファにセットされ
る。なお、このときの単語位置情報は、フレーズ訳では
なく1文全体を1文として訳すという前提で定められた
位置である。このようにする理由は、本実施形態におけ
機械翻訳装置を実現するために好都合だからである。
【0039】また、このとき同時に、原語の各々の単語
の位置と、その原語単語に対応する訳語単語の訳文内で
の単語位置との対応を示す情報が、図8に示すように原
語‐訳語対応情報バッファにセットされる。
【0040】次にステップs6で、分割位置決定手段5
fにより、原文のフレーズへの分割位置が決定される。
分割位置の決定は、構文バッファ7cに格納されている
図5のような構造解析木に対して、メモリ7に格納され
ている図9のような分割規則を適用することにより行わ
れる。
【0041】位置決定の実際の動作は、構造解析木の節
点を所定の順序で探索し、各々の節点でそれぞれの分割
規則が適用可能か否かを調べ、可能なら分割位置設定の
措置を行うというものである。図5に示されている例に
対しては、以下に述べる節点で分割規則の適用を受け
る。
【0042】・ 節点番号(1)の「文」節点に関して、
分割規則1『「文」節点の1段下の節点の間は分割す
る』が適用される。ここで、節点番号(1)の「文」節点
の1段下の節点とは、節点番号(2)の「前置詞句」節点
と節点番号(6)の「主節」節点である。これらの2つの
節点の間が分割される結果、原文においては“sequenti
alfiles,”と“the”との間が分割される ・ 節点番号(6)の「主節」節点に関して、分割規則2
『「主節」節点でまとめられている部分は分離する』が
適用される。ここで、節点番号(6)の「主節」節点でま
とめられている部分とは“the second file structure
used by SHARP-BASIC is random access.”を指す。よ
って、やはり“sequential files,”と“the”との間が
分割される ・ 節点番号(7)の「名詞句(主語)」節点に関して、分
割規則6『「主語」節点でまとめられている部分は分離
する』が適用される。ここで、節点番号(7)の「主語」
節点でまとめられている部分とは“the second file st
ructure used by SHARP-BASIC”を指す。よって、やは
り“sequential files,”と“the”との間と、新たに
“SHARP-BASIC”と“is”との間とが分割される ・ 節点番号(13)の「過去分詞句」節点に関して、分割
規則9『「過去分詞句」節点でまとめられている部分は
分離する』が適用される。ここで、節点番号(13)の「過
去分詞句」節点でまとめられている部分とは“used by
SHARP-BASIC”を指す。よって、“structure”と“use
d”との間と、やはり“SHARP-BASIC”と“is”との間と
が分割される。
【0043】以上のように分割規則の適用を受けた結
果、最終的に分割される箇所は “sequential files,”と“the”との間 “structure”と“used”との間 “SHARP-BASIC”と“is”との間 の3箇所である。これを図示したのが図10である。
【0044】実際には分割箇所決定の結果は図1の分割
位置バッファ7gに格納される。分割位置バッファの形
式を図11に示す。図11の「単語位置」欄は、原文が
分割されてできたそれぞれの原文フレーズの開始単語位
置が格納されている。
【0045】つまり、図10の文については、分割の結
果できるフレーズは “In addition to sequential files,” “the second file structure” “used by SHARP-BASIC” “is random access.” の4個であり、各々のフレーズの先頭の単語 “In” “the” “used” “is” の原文における単語位置は、図4の原文バッファを参照
すると、それぞれ 1 6 10 13 であることがわかる。これらの値が図11の分割位置バ
ッファの「単語位置」欄に格納されている。
【0046】次にステップs7−s9で、図1の訳フレ
ーズ構築手段5fにより、訳文フレーズが構築される。
【0047】ステップs7では、ステップs5で作成さ
れた原語‐訳語対応情報(図8参照)とステップs6で
作成された分割位置情報(図11参照)とに基づいて、
各々のフレーズを構成する訳語単語を得て、訳語バッフ
ァ(図7参照)に格納されているそれらの単語位置を、
図1の「フレーズごとの訳語単語位置バッファ」7hに
格納する。「フレーズごとの訳語単語位置バッファ」の
形式を図12に示す。
【0048】ステップs7での動作を説明する。たとえ
ば、1番目のフレーズ “In addition to sequential files,” に関しては、図11の分割位置バッファの連番1の単語
位置欄を参照することにより、原文における開始単語位
置が1であることがわかる。また、同バッファにより2
番目のフレーズの開始単語位置が6であることがわかる
から、1番目のフレーズの終了単語位置は5であること
がわかる。これらにより原文の1番目のフレーズは原文
中の単語位置がそれぞれ 1 2 3 4 5 の単語から成ることがわかる。次に、図8の原語‐訳語
対応情報バッファを参照し、上記の原語単語に対応する
訳語単語の単語位置を得ると、それぞれ 2 2 2 1 1 であることがわかる。これらから重複しているものを除
き、昇順に並べ替えると、 1 2 となる。これらが、原文の1番目のフレーズの訳を構成
する訳語の単語位置であり、これらの値を「フレーズご
との訳語単語位置バッファ」のフレーズ番号1の「訳語
単語位置」欄に格納する。
【0049】同様にして、原文の2番目のフレーズの訳
を構成する訳語の単語位置は、 7 8 9 3番目のフレーズについては 4 5 6 4番目のフレーズについては 12 13 であることがわかり、これらの値を、「フレーズごとの
訳語単語位置バッファ」のそれぞれのフレーズ番号の
「訳語単語位置」欄に格納する。
【0050】次にステップs8に進む。ステップs8で
は、訳語単語のうち、その単語位置の値が「フレーズご
との訳語単語位置バッファ」にまだ格納されていない訳
語単語について、それが属するフレーズを定めて「フレ
ーズごとの訳語単語位置バッファ」の当該フレーズの
「訳語単語位置」欄に格納する。
【0051】このような訳語単語は、その単語位置の値
が、原語‐訳語対応情報バッファの「対応する訳語単語
位置」欄に存在していない。これはすなわち、この単語
が、原語単語のうちのいずれかの訳語として得られたも
のではなく、ターゲット言語生成手段により適宜補われ
て生成された単語であることを意味しており、よって原
語単語のどれとも対応関係がない。この例では、図7の
訳語バッファの10番目の単語「は」がこれにあたる。
【0052】原語単語のどれとも対応関係がないこのよ
うな単語がどのフレーズに属するかを決定する手段とし
て、ここでは、一例として、次のような手段を採用す
る。訳語バッファにおいて当該単語の単語位置より1つ
若い単語位置の値が、原語‐訳語対応情報バッファの、
どの原語単語位置の「対応する訳語単語位置」欄に存在
しているかを調べる。(当該単語の単語位置より1つ若
い単語位置の値も、原語‐訳語対応情報バッファの「対
応する訳語単語位置」欄に存在していないなら、訳語バ
ッファにおいてさらに1つ若い単語番号の値について調
べる。以下、定まるまで繰り返し。また、当該単語の単
語位置より1つ若い単語位置の値が、原語‐訳語対応情
報バッファにおいて複数の原語単語位置の「対応する訳
語単語位置」の欄に存在しているならば、それらの原語
単語位置の中で最も大きい値を採用する。)ここでは、
訳文中の単語「は」の訳語単語位置10より1つ若い9
という単語位置の値が、図8の原語‐訳語対応情報バッ
ファの単語位置9の「対応する訳語単語位置」の欄に存
在しているので、得たい原語単語位置は9である。次
に、こうして得られた原語単語位置がどのフレーズに属
するかを、分割位置バッファを参照して知る。ここで
は、図11により、2番目のフレーズの原語単語範囲が
6から9までであることがわかるので、原語単語位置9
は2番目のフレーズに属することがわかる。このように
して、訳文中の単語のうち原語単語のどれとも対応して
いない単語が属するフレーズを得ることができるので、
その単語の訳語単語位置の値を、「フレーズごとの訳語
単語位置バッファ」の対応するフレーズ番号の「訳語単
語位置」欄に格納する。ここでは訳文中の単語「は」の
訳語単語位置の値10を、「フレーズごとの訳語単語位
置バッファ」のフレーズ番号2の「訳語単語位置」欄に
格納する。この結果、「フレーズごとの訳語単語位置バ
ッファ」は図12に示すようになり、フレーズ番号2の
訳を構成する訳語の単語位置は、 7 8 9 10 になる。
【0053】以上で説明した、訳文中の単語のうち原語
単語のどれとも対応関係がない単語の属するフレーズを
決定する手段はあくまでも一例であり、ソース言語やタ
ーゲット言語それぞれの文法的性質によって適宜定めら
れることが望ましい。
【0054】次にステップs9に進む。ステップs9で
は、ステップs7−s8で作成された「フレーズごとの
訳語単語位置バッファ」の内容に基づき、訳語バッファ
を参照して、フレーズごとの訳を構築して、図1の「訳
フレーズバッファ」7iに格納する。
【0055】ステップs9での動作を説明する。たとえ
ば、1番目のフレーズを構成する訳語の訳語単語位置
は、図12の「フレーズごとの訳語単語位置バッファ」
のフレーズ番号1の「フレーズごとの訳語単語位置バッ
ファ」欄により、 1 2 であるとわかる。次に、図7の訳文バッファにより、訳
語単語位置1の訳語は「逐次ファイル」、訳語単語位置
2の訳語は「に加えて」であるとわかる。よって、これ
らの訳語を訳語単語位置の昇順につなげて得られた文字
列「逐次ファイルに加えて」を、訳フレーズバッファの
フレーズ番号1の訳フレーズ欄に格納する。 同様にし
て、2番目のフレーズの訳語は「第2の」「ファイル」
「は」、3番目のフレーズの訳語は「シャープ‐BAS
IC」「によって」「使われる」、4番目のフレーズの
訳語は「ランダムアクセス」「である」であり、これら
をそれぞれつなげて訳フレーズバッファの該当するフレ
ーズ番号の訳フレーズ欄に格納した結果を示したのが図
13である。
【0056】以上のようにして、入力された文章中のそ
れぞれのフレーズに対する訳フレーズが得られ、ステッ
プs10に進み、出力形式整形手段5Bによって、結果
を出力する際の形式が整えられ、図1の出力形式バッフ
ァ7jに格納される。この形式は、例えば図14に示す
ように、それぞれのフレーズの原文と訳文の頭の位置が
揃えられ、原文フレーズとそれを訳した訳文フレーズと
の対応関係が明確にされている。
【0057】なお、本発明の第1の実施形態における
械翻訳装置は、原文フレーズと訳文フレーズとを対応さ
せて表示させる機能も備えた構成となっている。このこ
とを以下で説明する。
【0058】図30は、本発明の第1の実施形態におけ
る機械翻訳装置を構成する出力形式整形手段5Bの動作
を示すフローチャートである。なお、この説明では、行
の折り返しやスクロールなど、一般に文書データを扱っ
て画面に表示することができるコンピュータ応用機器の
多くに共通する動作の説明は省略する。
【0059】まず1番目の原文フレーズ In addition to sequential files, と、それに対応する1番目の訳文フレーズ 逐次ファイルに加えてが着目され(ステップs1)、表
示開始位置が画面の左上隅にセットされる(ステップs
2)。
【0060】そしてフレーズ開始位置決定手段5B‐4
によって、1番目の原文フレーズの表示開始位置が決定
され、イメージ生成手段5B‐1によって1番目の原文
フレーズのイメージが生成されて、出力形式バッファ7
jの表示開始位置以降の位置に1番目の原文フレーズの
イメージがセットされる(ステップs3)。次に、フレ
ーズ開始位置決定手段5B‐4によって、1番目の訳文
フレーズの表示開始位置が、1番目の原文フレーズの表
示開始位置から真下に一定の距離をおいた点と決定さ
れ、イメージ生成手段5B‐1によって2番目の原文フ
レーズのイメージが生成されて、出力形式バッファ7j
の表示開始位置(1番目の原文フレーズの表示開始位置
から真下に一定の距離をおいた点)以降の位置に1番目
の訳文フレーズのイメージがセットされる(ステップs
4)。
【0061】次に、フレーズ長さ取得手段5B‐2によ
って、1番目の原文フレーズのイメージの長さおよび1
番目の訳文フレーズのイメージの長さが求められる(ス
テップs5、s6)。次に1番目の原文フレーズのイメ
ージの長さと1番目の訳文フレーズのイメージの長さと
が比較される(ステップs7)。今の場合、原文フレー
ズの方が長いので、フレーズ末尾位置取得手段5B‐3
により、出力形式バッファ7j中の1番目の原文フレー
ズのイメージの末尾位置が求められ、その位置が次のフ
レーズの表示開始位置とされる(ステップs9)。
【0062】まだイメージを出力形式バッファ7jにセ
ットしていないフレーズが存在するので(ステップs1
0)、次のフレーズに着目する(ステップs11)。
【0063】この結果、1番目の原文フレーズより短い
1番目の訳文フレーズについては、図14に示すよう
に、次の2番目の訳文フレーズの開始位置との間が空い
た形で表示される。
【0064】2番目の原文フレーズ the second file structure と、それに対応する2番目の訳文フレーズ第2のファイ
ル構造はについても、原文フレーズのイメージの長さが
訳文フレーズのイメージの長さより長いので、1番目の
フレーズと同様の動作でイメージが出力形式バッファ7
jにセットされる。
【0065】一方、3番目のフレーズでは、原文フレー
ズ used by SHARP-BASIC と、それに対応する訳文フレーズシャープ‐BASIC
によって使われるとでは、画面表示において訳文フレー
ズの長さの方が原文フレーズの長さよりも長い。このよ
うな場合の動作について説明する。
【0066】原文フレーズと訳文フレーズとのイメージ
の出力形式バッファ7jへのセットは1番目のフレーズ
の場合と同様に行われる(ステップs3、s4)。
【0067】次にフレーズ長さ取得手段5B‐2によっ
て、原文フレーズのイメージの長さおよび訳文フレーズ
のイメージの長さが求められる(ステップs5、s
6)。次に原文フレーズのイメージの長さと訳文フレー
ズのイメージの長さとが比較される(ステップs7)。
今の場合、訳文フレーズの方が長いので、フレーズ末尾
位置取得手段5B‐3により、出力形式バッファ7j中
の3番目の訳文フレーズのイメージの末尾位置が求めら
れ、その位置から真上に一定の距離をおいた点が次のフ
レーズの表示開始位置とされる(ステップs9)。
【0068】まだイメージを出力形式バッファ7jにセ
ットしていないフレーズが存在するので(ステップs1
0)、次のフレーズに着目する(ステップs11)。
【0069】この結果、3番目の訳文フレーズより短い
3番目の原文フレーズについては、図14に示すよう
に、次の4番目の原文フレーズの開始位置との間が空い
た形で表示される。
【0070】以上のような動作により、原文フレーズと
それに対応する訳文フレーズとの組のすべてについて、
原文フレーズと訳文フレーズの頭の位置が揃って表示さ
れることが可能になる。
【0071】[第2の実施形態] 以下、本発明の機械翻訳装置における第2の実施形態
を、各種図面を用いてその実施例を説明する。
【0072】(1)本実施形態における機械翻訳装置
構成は、前記第1の実施形態の図1に示したものとほぼ
同じであるが、前記図1に示した構成要素の他に、本実
施形態特有の構成(実施例2−1)としては、 ・フレーズの単位を大まかにするか細かくにするかを利
用者が該装置に指定する分割レベル設定手段 ・フレーズの単位を大まかにするか細かくにするかに関
する設定値を保持するバッファ ・フレーズの単位を大まかにするか細かくにするかによ
って適用の可否が決まるフレーズ分割規則 ・フレーズの単位を大まかにするか細かくにするかに関
する設定値を参照して動作する分割位置決定手段 を備えていることである。ここではフレーズ分割規則に
ついて詳しく説明する。本実施形態における機械翻訳装
置は、出力されるフレーズの長さの傾向を3段階に調節
できるものとする。このためのフレーズ分割規則は、図
9に示したものに代わり、図15に示すものを用いる。
図15のフレーズ分割規則は、各々の規則に「レベル」
欄があることが特徴である。この「レベル」は、フレー
ズの単位を大まかにするか細かにするかによって適用の
可否を決める値である。
【0073】フレーズの長さの傾向に関する設定値を保
持するバッファに設定されている値が「1」ならば、分
割位置決定の際に、図15のフレーズ分割規則のうちレ
ベルが「1」の規則だけが適用される。そして、設定値
が「2」ならば、図15のフレーズ分割規則のうちレベ
ルが「1」と「2」の規則だけが適用される。設定値が
「3」ならば、図15のフレーズ分割規則のうちすべて
の規則が適用される。本実施形態の機械翻訳装置を用い
て、先の実施例と同じ “In addition to sequential files, the second file
structure used by SHARP-BASIC is random access.” という文を訳した場合について説明する。フレーズの長
さの傾向に関する設定値を「1」にすると、図16に示
すように、分割位置は1箇所になり、フレーズの個数は
2個になる。そしてその翻訳結果は図17に示すように
なる。一方、フレーズの長さの傾向に関する設定値を
「3」にすると、図18に示すように、分割位置は5箇
所になり、フレーズの個数は6個になる。そしてその翻
訳結果は図19に示すようになる。
【0074】なお、先に述べた第1の実施形態における
動作結果は、本実施形態の機械翻訳装置を用いてフレー
ズの長さの傾向に関する設定値を「2」にした場合の動
作結果と同じであり、その翻訳結果は図14に示した通
りである。
【0075】(2)本実施形態における機械翻訳装置の
別の構成として、たとえば、「原文のTHAT節がフレーズ
として分離した場合は、そのTHAT節の受けの語の訳語の
前に『〜』記号を付けて生成する」という機能を有す
実施例(実施例2−2)について説明する。本構成の特
徴としては、 ・構文や分割位置の条件に応じて「〜」記号の生成位置
を決定する規則 ・上記の規則に従って「〜」記号の生成位置を決定し、
その結果の情報を分割位置バッファに格納する分割位置
決定手段 ・「〜」記号の生成の有無の情報を格納する欄を備える
分割位置バッファ・分割位置バッファに格納されている
「〜」記号の生成の有無の情報に従って、「〜」を生成
することができる訳フレーズ構築手段を備える。
【0076】以下、図20のフローチャートを用いて、
本実施形態における機械翻訳装置での翻訳の動作を説明
する。
【0077】原文は “The reason is that we want these number to be ro
unded off.” とする。また、フレーズ分割規則は図15に示したもの
のうち「レベル」が1の規則だけを適用するものとす
る。
【0078】図20のステップs1からステップs5ま
での動作は、先に説明した第1の実施形態での実施例に
よる機械翻訳装置の動作と同じである。
【0079】次にステップs6で、分割位置決定手段5
fにより、原文のフレーズへの分割位置が決定される。
これと同時に、ここでは、図21に示されているような
規則を用いて、「〜」記号の生成位置も決定される。
【0080】この結果、分割位置は図22の構造解析木
に矢印で示したような位置に決定され、その結果は図2
3のように分割位置バッファに格納される。ここで、図
23の分割位置バッファには「『〜』の生成」という欄
がある。ここでは1番目のフレーズの「『〜』の生成」
欄に「有」という値が格納されており、1番目のフレー
ズに「〜」を付けることが指示されている。
【0081】以下、図20のステップs7からステップ
s8までの動作は、先に説明した第1の実施形態での実
施例による機械翻訳装置の動作と同じである。次のステ
ップs9で、訳フレーズを構築する動作において、分割
位置バッファの「『〜』の生成」欄に「有」という値が
格納されているフレーズを生成する際には、訳フレーズ
バッファの当該フレーズの訳フレーズ欄に訳語を格納す
る際に「〜」記号も同時に格納する。ここでは、1番目
のフレーズの分割位置バッファの「『〜』の生成」欄に
「有」があるので、1番目の訳文フレーズを構築する際
には、1番目の原文フレーズを構成する原語単語 The reason is に対応する訳語単語(ここでは“The”に対応する訳語
単語は無いとする) 「理由」「である」 およびターゲット原語生成手段が適宜生成した訳文単語 「は」 に、記号「〜」を加えて適宜つなげた 「理由は〜である」 という文字列を、訳フレーズバッファのフレーズ番号1
の訳フレーズ欄に格納する。
【0082】そしてステップs10に進み、先に説明し
第1の実施形態での実施例による機械翻訳装置の動作
と同様に、出力形式が整えられて出力形式バッファ7j
に格納され、図24のように翻訳結果が出力される。
【0083】(3)本実施形態による機械翻訳装置の
実施例(実施例2−3)について説明する。本実施例
の機械翻訳装置の動作結果の出力画面を図25に示す。
【0084】図25に示される実施例では、図3のステ
ップs10において、図1の出力形式整形手段5Bによ
って出力形式が整えられる際に、それぞれのフレーズの
原文と訳文の頭の位置が揃えられることに加え、原文フ
レーズに沿ってアンダーラインが引かれ、フレーズの切
れ目でアンダーラインも切れるように出力イメージが作
られる。
【0085】このような動作は、図30で示した出力形
式整形動作の際、ステップs3で原文フレーズのイメー
ジを出力形式バッファにセットする際に、図29のイメ
ージ生成手段5B‐1と同時に図29の強調表示手段
(1)5B‐5を動作させることにより実現される。
【0086】このことにより、個々のフレーズの範囲が
一層明確になる。
【0087】(4)本実施形態による機械翻訳装置の
実施例(実施例2−4)について説明する。本実施例
では、出力手段としてCRT(陰極線管)・LCD(液
晶表示装置)などの、利用者の操作に応じて表示内容を
時々刻々変化させることが可能な表示装置、および、そ
の表示装置の表示画面上の任意の箇所を利用者が指し示
すことを可能ならしめる手段(図1の5D。たとえば、
カーソル表示手段および図1の入力手段2に含まれるカ
ーソル移動キー、あるいは、マウスカーソル表示手段お
よび図1の入力手段2に含まれるマウス、など)を備え
ていることが必要である。ここではそのような位置指定
手段として、カーソル表示手段およびカーソル移動キー
を備えているものとして説明する。また、本実施例で
は、基本的な出力形式が、図27や図28に示すよう
に、原文と訳文とが別々の領域に表示されるものである
とする。
【0088】以下、図26のフローチャートを用いて、
本実施形態での機械翻訳装置による翻訳結果表示の動作
を説明する。図26の“start”の時点で、翻訳はすで
に完了して、出力形式バッファには出力形式整形手段に
よって構築された表示画面のイメージがすでに格納され
ているものとする。
【0089】ステップs1で、出力形式整形手段に格納
されているイメージを表示装置に表示する。その結果の
表示画面はたとえば図27のようになっている。図27
で、カーソルは、原文の1番目のフレーズ“In additio
n to sequential files,”の先頭の文字の位置にある。
このため、原文の1番目のフレーズ全体が、図29の強
調表示手段(2)5B‐6の働きで反転表示されていて、
それに対応する訳文の1番目のフレーズ「逐次ファイル
に加えて」も強調表示手段(2)5B‐6の働きで反転表
示されている。
【0090】ステップs1の次に該装置は利用者からの
何らかの入力を待ち受ける状態になる。ステップs2に
進んだ時点で利用者から表示終了の指示が出されていれ
ば、表示を終了する。さもなければステップs3に進
み、利用者がカーソル移動キーを操作することによって
カーソル移動の指示が出されていれば、ステップs4に
進み、さもなければステップs2に戻る。つまりこの時
点で利用者が何の操作もしなければ、ステップs2とs
3を回り続ける。
【0091】今、利用者がカーソルを下に1行移動する
ようにカーソル移動キーを操作したとする。すると、ス
テップs3からs4に進み、出力形式整形手段はカーソ
ルの新たな位置情報を取得する。今、カーソルの新たな
位置は、原文の2番目のフレーズ“the second file st
ructure”の単語“second”の先頭の文字 s の位置とす
る。
【0092】ステップs5に進み、現在反転表示されて
いる原文フレーズがあるかが判定される。ここでは現在
“In addition to sequential files,”のフレーズが反
転表示されているので、ステップs6に進む。ステップ
s6では現在のカーソル位置が上述の反転表示されてい
る領域内であるかが判定される。ここでは現在のカーソ
ル位置は“In addition to sequential files,”のフレ
ーズ内ではないのでステップs6からステップs7に進
む。
【0093】(もし、ステップs3において利用者がカ
ーソル移動を指示した移動先が、その時点で反転表示さ
れている原文フレーズの中であれば、ステップs6から
ステップs13に進む。)ステップs7では、その時点
で反転表示されている原文フレーズとそれに対応する訳
文フレーズとを通常の表示にするように、出力形式バッ
ファに出力イメージがセットされる。ここでは、“In a
ddition to sequential files,”と「逐次ファイルに加
えて」とを通常表示にするようにする。
【0094】ステップs8に進み、現在のカーソル位置
が原文(すなわち、原文フレーズのいずれか)が表示さ
れている領域内であるかが判定される。ここでは現在の
カーソル位置はフレーズ“the second file structur
e”内であるので、ステップs8からステップs9に進
む。
【0095】ステップs9−s11で、新たに反転表示
する原文フレーズと訳文フレーズとを決定する。ステッ
プs9で、現在のカーソル位置にある単語の単語位置情
報を得る。ここでは現在のカーソル位置にある単語は
“second”であり、これは図4の原文バッファを参照す
ると、単語位置の値は7である。次にステップs10
で、その単語が属している原文フレーズの番号を得る。
ここでは図11の分割位置バッファからわかるように、
単語位置7の単語が属しているフレーズは2番目のフレ
ーズ“the second file structure”である。次にステ
ップs11で、その原文フレーズに対する訳文フレーズ
を得る。ここでは、図13の訳フレーズバッファを参照
することにより、2番目の原文フレーズに対応する訳文
フレーズは「第2のファイルは」であることがわかる。
こうして、新たに反転表示するべき原文フレーズと訳文
フレーズがそれぞれ“the second file structure”と
「第2のファイルは」に決定される。
【0096】そして次のステップs12で、新たに反転
表示されるべき原文フレーズと訳文フレーズとを反転表
示するように、強調表示手段(2)5B‐6が用いられ
て出力形式バッファに出力イメージがセットされる。そ
してステップs13ではカーソルを新たな位置に表示す
るように出力イメージが出力形式バッファにセットされ
る。
【0097】そしてステップs14で、出力形式バッフ
ァに格納されている出力イメージが表示装置に再表示さ
れ、その結果、図28に示すように、原文フレーズ“th
e second file structure”とそれに対応する訳文フレ
ーズ「第2のファイルは」とが反転表示され、カーソル
は単語“second”の先頭の文字 s の位置に表示され
る。
【0098】
【発明の効果】(1)以上のように、本発明による機械
翻訳装置では、翻訳結果を1文よりも小さな単位である
句・節などの単位で出力するので、その出力結果を利用
者が後編集をして利用に供するという使用形態に適して
いる。
【0099】このような利点に加えて、文単位の解析結
果を元にしてるので、句・節の単位だけで構文解析を行
うような機械翻訳装置に比較して、係り受けの共起に基
づいた訳語選択の精度が高いという利点を有する。たと
え、その1文単位の解析結果が誤っている場合でも、分
割することにより誤りが解消する可能性が非常に高い。
つまり、全文単位での解析と部分単位での生成の両方の
長所が採り入れられている。
【0100】また、文法規則を「句単位のものと全文単
位のもの」などのように分けていないので、規則の設計
者にとっては、そのような繁雑な文法規則を作る必要が
ない。設計者にとっては、構文解析結果を知ることがで
きれば、文法規則とは独立に分割規則を調整することが
でき、より自由度の高い規則を記述することが可能であ
る。
【0101】さらに、フレーズ分割位置を決定する規則
にレベル差を設け、適用するフレーズ分割規則のレベル
を利用者が調節可能とすることにより、出力されるフレ
ーズの長さの傾向を長めにするか短めにするかを利用者
が調節することが可能になる。
【0102】()また、本発明による機械翻訳装置で
は、フレーズ単位で訳を出力することによって却って分
かりにくさが生じてしまう場合に備えては、出力される
訳文フレーズに、状況に応じて「〜」などの補助記号を
挿入することにより、この問題を解消することができ
る。
【0103】()また、出力形式整形手段の働きで、
それぞれのフレーズの原文と訳文の長さの差にかかわら
ず、原文フレーズと訳文フレーズの頭の位置が揃えられ
た形で出力されるので、原文フレーズとそれを訳した訳
文フレーズとの対応関係が明確にされ、原文フレーズと
訳文フレーズとの対応が掴みやすい。
【0104】(さらに、出力イメージにおいて、そ
れぞれの原文フレーズに沿ってアンダーラインを引き、
フレーズの切れ目でアンダーラインも切れるようにする
ことにより、原文フレーズと訳文フレーズとの対応がよ
りいっそう掴みやすくすることができる。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の一実施例のブロック図
である。
【図2】本発明の機械翻訳装置の一実施例の、機械翻訳
における翻訳レベルの説明図である。
【図3】本発明の機械翻訳装置の一実施例による翻訳処
理のフローチャートである。
【図4】図1における翻訳処理関係の各バッファの内容
例を示す図である。
【図5】図1における翻訳処理関係の構文解析結果の例
を示す図である。
【図6】図1における翻訳処理関係の構文変換結果の例
を示す図である。
【図7】図1における翻訳処理関係の各バッファの内容
例を示す図である。
【図8】図1における翻訳処理関係の各バッファの内容
例を示す図である。
【図9】図1における記憶手段内の分割規則データの内
容例を示す図である。
【図10】本発明の機械翻訳装置の一実施例によるフレ
ーズ分割処理結果のイメージを示す図である。
【図11】図1におけるフレーズ分割処理関係の各バッ
ファの内容例を示す図である。
【図12】図1におけるフレーズ分割処理関係の各バッ
ファの内容例を示す図である。
【図13】図1におけるフレーズ分割処理関係の各バッ
ファの内容例を示す図である。
【図14】本発明による機械翻訳装置を用いた場合の出
力手段への翻訳結果出力の例を示す図である。
【図15】フレーズ分割の動作傾向を利用者が調節でき
るような本発明の機械翻訳装置の一実施例に用いられる
分割規則データの内容例を示す図である。
【図16】上記実施例においてフレーズを長めに出力す
るよう調節した場合のフレーズ分割処理結果のイメージ
を示す図である。
【図17】上記実施例においてフレーズを長めに出力す
るよう調節した場合の出力手段への翻訳結果出力の例を
示す図である。
【図18】上記実施例においてフレーズを短めに出力す
るよう調節した場合のフレーズ分割処理結果のイメージ
を示す図である。
【図19】上記実施例においてフレーズを短めに出力す
るよう調節した場合の出力手段への翻訳結果出力の例を
示す図である。
【図20】翻訳文中に補助記号を生成して出力すること
が可能な本発明の機械翻訳装置の一実施例の翻訳処理の
フローチャートである。
【図21】上記実施例において用いられる補助記号生成
規則データの内容例を示す図である。
【図22】上記実施例によるフレーズ分割処理結果のイ
メージを示す図である。
【図23】上記実施例に特有なフレーズ分割処理関係の
バッファの内容例を示す図である。
【図24】上記実施例による出力手段への翻訳結果出力
の例を示す図である。
【図25】原文フレーズの境界ごとに切れているアンダ
ーラインを付して原文フレーズの範囲をわかりやすくし
た本発明の機械翻訳装置の一実施例の出力手段への翻訳
結果出力の例を示す図である。
【図26】カーソル位置にある原文フレーズとそれに対
応する訳文フレーズとが反転表示されるような本発明の
機械翻訳装置の一実施例の反転表示処理の動作を示すフ
ローチャートである。
【図27】上記実施例による出力手段への翻訳結果出力
の例を示す図である。
【図28】上記実施例による出力手段への翻訳結果出力
の例を示す図である。
【図29】出力形式生成手段の詳細な構成図である。
【図30】出力形式生成手段の動作を示すフローチャー
トである。
【符号の説明】
1 制御手段 2 入力手段 3 出力手段 4 バスライン 5 動作プログラムモジュール 5A 翻訳モジュール 5a 辞書引き・形態素解析手段 5b 構文解析手段 5c 構文変換手段 5d ターゲット言語生成手段 5e 分割位置決定手段 5f 訳フレーズ構築手段 5B 出力形式整形手段 5B‐1 イメージ生成手段 5B‐2 フレーズ長さ取得手段 5B‐3 フレーズ末尾位置取得手段 5B‐4 フレーズ開始位置決定手段 5B‐5 強調表示手段 5B‐6 5B‐5とは異なる態様で強調表示を行う強
調表示手段 5C 分割レベル設定手段 5D 位置指定手段 6 記憶手段 7 動作用メインメモリ 7a 原文バッファ 7b 辞書引きバッファ 7c 変換前の構文バッファ 7d 変換後の構文バッファ 7e 訳語バッファ 7f 原語‐訳語対応情報バッファ 7g 分割位置バッファ 7h フレーズごとの訳語単語位置バッファ 7i 訳フレーズバッファ 7j 出力形式バッファ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/28 G06F 17/27 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 ある言語(ソース言語)で表された文章
    を他の言語(ターゲット言語)で表された文章に翻訳す
    るために、 ソース言語で表された文の解析・変換を行い、ターゲッ
    ト言語の生成を行う解析手段・変換手段・生成手段の各
    手段と、 原文の各単語と該単語に対応する解析・変換を通じて得
    られた訳文中の訳語の対応関係を記憶する記憶手段と、 前記解析手段により得られた原文の解析構造における句
    カテゴリの種類に応じて、原文中の1文の内部を文法的
    なまとまりに基づいて分割するための分割位置を決定す
    分割位置決定手段と、 前記分割位置決定手段により決定された分割位置で原文
    が分割された結果として得られた、原文中の各々の語句
    や節の範囲に対応する訳文中の翻訳語句を組み立てて訳
    文フレーズを構築する訳フレーズ構築手段と、 前記生成手段により生成された訳文中の翻訳語句を原文
    中の各々の語句や節に対応させて表示手段に表示するた
    めに出力形式を生成する出力形式生計手段と、を備えた
    機械翻訳装置において、 前記原文中の1文の内部を文法的なまとまりに基づいて
    分割する際に、まとまりの範囲を細かくするか、あるい
    は大まかにするかを設定するための分割レベル設定手段
    を設け、 前記分割位置決定手段は、前記分割レベル設定手段にて
    設定されたレベルに応じて分割位置を決定することを
    徴とする機械翻訳装置。
  2. 【請求項2】 ソース言語のフレーズ範囲を認定し、そ
    れに対応する訳文フレーズを対応表示する表示手段にお
    いて、原文の受けの語と係りの語とが分割された場合
    に、その訳文の可読性を向上させるために、 前記分割位置決定手段は、その受けの語に補助記号を挿
    入した形でフレーズ訳を生成するための補助記号生成位
    置決定機能を有し、 さらに前記フレーズごとに補助記号を生成するか否かの
    情報及びその生成位置 を記憶する分割位置記憶手段と、
    を備え、 原文中の各々の語句や節の範囲に対応する訳文中の翻訳
    語句を組み立てて訳文フレーズを構築する訳フレーズ構
    築手段は、前記分割位置記憶手段に格納されている情報
    に応じて、補助記号を挿入した形で訳文フレーズを構築
    する機能を有することを特徴とする 請求項1記載の機械
    翻訳装置。
  3. 【請求項3】 前記出力形式整形手段は、原文フレーズ
    と訳文フレーズとの対応をとって対応表示する際に、 ソース言語中の原文フレーズとそれに対応する訳文フレ
    ーズの分割単位を前記分割位置決定手段によって決定さ
    れた分割位置とし、各分割位置での原文フレーズと訳文
    フレーズとの対応関係の表示において、 前記各分割位置で対応する原文フレーズと訳文フレーズ
    とを揃った状態で表示するための表示開始位置を決定す
    るフレーズ開始位置決定手段と、 前記表示手段にて原文フレーズと訳文フレーズを表示す
    るために各フレーズのイメージを生成するためのイメー
    ジ生成手段と、 前記イメージ生成手段にて生成された原文フレーズと訳
    文フレーズの各イメージの長さを求めるフレーズ長さ取
    得手段と、 前記フレーズ長さ取得手段で取得した各フレーズのイメ
    ージの長さを比較し、その長い方の長さと前記フレーズ
    開始位置決定手段で決定されたフレーズの開始位置の情
    報に基づいてフレーズのイメージの末尾位置を求めるフ
    レーズ末尾位置取得手段と、 を有してなることを特徴とする請求項1記載 の機械翻訳
    装置。
  4. 【請求項4】 前記出力形式整形手段は、ソース言語中
    の原文フレーズとそれに対応する訳文フレーズの分割単
    位を前記分割位置決定手段によって決定された分割位置
    とし、 前記フレーズ開始位置決定手段と前記イメージ生成手段
    と前記フレーズ長さ取得手段と前記フレーズ末尾位置取
    得手段とによって、前記各分割位置で分割された原文フ
    レーズと訳文フレーズとを対応付けて前記表示手段に表
    示させ、 その際前記各分割位置で原文フレーズの範囲が容易に分
    かるアンダーラインを含む態様で表示するように出力形
    式を生成するための強調表示手段を備えてなる ことを特
    徴とする請求項3記載 の機械翻訳装置。
JP7003522A 1995-01-12 1995-01-12 機械翻訳装置 Expired - Fee Related JP3066274B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7003522A JP3066274B2 (ja) 1995-01-12 1995-01-12 機械翻訳装置
US08/584,361 US5826219A (en) 1995-01-12 1996-01-11 Machine translation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7003522A JP3066274B2 (ja) 1995-01-12 1995-01-12 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH08190563A JPH08190563A (ja) 1996-07-23
JP3066274B2 true JP3066274B2 (ja) 2000-07-17

Family

ID=11559715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7003522A Expired - Fee Related JP3066274B2 (ja) 1995-01-12 1995-01-12 機械翻訳装置

Country Status (2)

Country Link
US (1) US5826219A (ja)
JP (1) JP3066274B2 (ja)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6122606A (en) * 1996-12-10 2000-09-19 Johnson; William J. System and method for enhancing human communications
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
JP4118470B2 (ja) * 1999-08-30 2008-07-16 富士通株式会社 電子メール装置,電子メール送信方法及び記録媒体
US6772413B2 (en) * 1999-12-21 2004-08-03 Datapower Technology, Inc. Method and apparatus of data exchange using runtime code generator and translator
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US20020072914A1 (en) * 2000-12-08 2002-06-13 Hiyan Alshawi Method and apparatus for creation and user-customization of speech-enabled services
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
US20060253784A1 (en) * 2001-05-03 2006-11-09 Bower James M Multi-tiered safety control system and methods for online communities
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US20030040899A1 (en) * 2001-08-13 2003-02-27 Ogilvie John W.L. Tools and techniques for reader-guided incremental immersion in a foreign language text
WO2003021391A2 (en) * 2001-08-30 2003-03-13 Umpleby Stuart A Method and apparatus for translating between two species of one generic language
US20030061022A1 (en) * 2001-09-21 2003-03-27 Reinders James R. Display of translations in an interleaved fashion with variable spacing
FR2833375B1 (fr) * 2001-12-07 2004-06-04 Amadeus Procede, dispositif d'adaptation de fichiers numeriques
KR100453227B1 (ko) * 2001-12-28 2004-10-15 한국전자통신연구원 번역 지원 시스템에서의 유사 문장 검색 방법
US7356607B2 (en) * 2002-02-22 2008-04-08 International Business Machines Corporation Method and system for routing data repository messages between computing devices
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
CN1685313A (zh) * 2002-09-30 2005-10-19 陈宁萍 由指针发起的对电子文档中文本信息的即时双语注释
JP4410486B2 (ja) * 2003-05-12 2010-02-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳装置及びプログラム
US8548794B2 (en) * 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
JP4076520B2 (ja) * 2004-05-26 2008-04-16 富士通株式会社 翻訳支援プログラムおよび単語対応付けプログラム
US8600728B2 (en) 2004-10-12 2013-12-03 University Of Southern California Training for a text-to-text application which uses string to tree conversion for training and decoding
JP4473702B2 (ja) * 2004-11-02 2010-06-02 株式会社東芝 機械翻訳システム、機械翻訳方法及びプログラム
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US9189482B2 (en) 2012-10-10 2015-11-17 Abbyy Infopoisk Llc Similar document search
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8078450B2 (en) * 2006-10-10 2011-12-13 Abbyy Software Ltd. Method and system for analyzing various languages and constructing language-independent semantic structures
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8452585B2 (en) * 2007-06-21 2013-05-28 Microsoft Corporation Discriminative syntactic word order model for machine translation
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
JP5256654B2 (ja) * 2007-06-29 2013-08-07 富士通株式会社 文章分割プログラム、文章分割装置および文章分割方法
US20090162818A1 (en) * 2007-12-21 2009-06-25 Martin Kosakowski Method for the determination of supplementary content in an electronic device
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
CN102369524B (zh) * 2009-03-30 2014-08-13 日本电气株式会社 语言分析装置和语言分析方法
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
CN101739395A (zh) * 2009-12-31 2010-06-16 程光远 机器翻译方法和系统
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
CN102193912B (zh) * 2010-03-12 2013-11-06 富士通株式会社 短语划分模型建立方法、统计机器翻译方法以及解码器
JP5058280B2 (ja) * 2010-03-12 2012-10-24 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
KR101762866B1 (ko) * 2010-11-05 2017-08-16 에스케이플래닛 주식회사 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
JP6226321B2 (ja) * 2013-10-23 2017-11-08 株式会社サン・フレア 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
JP6017409B2 (ja) * 2013-12-24 2016-11-02 日本電信電話株式会社 翻訳装置、方法、及びプログラム
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
WO2016033617A2 (en) * 2014-08-28 2016-03-03 Duy Thang Nguyen Method of asynchronous machine translation
WO2016033618A2 (en) * 2014-08-28 2016-03-03 Duy Thang Nguyen Method of data storage and language conversion
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
JP6709678B2 (ja) * 2016-05-10 2020-06-17 日本放送協会 読解支援装置及びプログラム
JP6815184B2 (ja) * 2016-12-13 2021-01-20 株式会社東芝 情報処理装置、情報処理方法、および情報処理プログラム
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理系统
US12086559B2 (en) * 2021-03-31 2024-09-10 International Business Machines Corporation Clause extraction using machine translation and natural language processing
EP4221169A1 (en) * 2022-01-31 2023-08-02 Koa Health B.V. Sucursal en España System and method for monitoring communication quality

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351189A (en) * 1985-03-29 1994-09-27 Kabushiki Kaisha Toshiba Machine translation system including separated side-by-side display of original and corresponding translated sentences
JPS61255468A (ja) * 1985-05-08 1986-11-13 Toshiba Corp 機械翻訳処理装置
DE3616011A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Uebersetzungsgeraet
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH0268662A (ja) * 1988-09-02 1990-03-08 Sharp Corp 機械翻訳装置

Also Published As

Publication number Publication date
JPH08190563A (ja) 1996-07-23
US5826219A (en) 1998-10-20

Similar Documents

Publication Publication Date Title
JP3066274B2 (ja) 機械翻訳装置
JP3220560B2 (ja) 機械翻訳装置
JP2892548B2 (ja) 自動翻訳装置
JPH06195373A (ja) 機械翻訳装置
JPH1083398A (ja) 文書翻訳方法、文書翻訳システム及び機械読み取り可能媒体
JP2815714B2 (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JP2593065B2 (ja) 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP2719453B2 (ja) 機械翻訳装置
JP3174664B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP3389313B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP3467161B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP3406462B2 (ja) 機械翻訳装置
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JPH05225232A (ja) テキスト自動前編集装置
JP2005031922A (ja) 機械翻訳装置
JPH10187732A (ja) 多言語対応通信システム
JPH10222516A (ja) 多言語対応通信システム
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080512

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130512

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees