JPS62163173A - 機械翻訳方法 - Google Patents

機械翻訳方法

Info

Publication number
JPS62163173A
JPS62163173A JP61005570A JP557086A JPS62163173A JP S62163173 A JPS62163173 A JP S62163173A JP 61005570 A JP61005570 A JP 61005570A JP 557086 A JP557086 A JP 557086A JP S62163173 A JPS62163173 A JP S62163173A
Authority
JP
Japan
Prior art keywords
translation
sentence
translated
text
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61005570A
Other languages
English (en)
Inventor
Akira Kumano
明 熊野
Hiroyasu Nogami
野上 宏康
Seiji Miike
誠司 三池
Masaie Amano
天野 真家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61005570A priority Critical patent/JPS62163173A/ja
Priority to EP87300006A priority patent/EP0230339A3/en
Priority to US07/000,133 priority patent/US4821230A/en
Publication of JPS62163173A publication Critical patent/JPS62163173A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野〕 本発明は翻訳処理の効率化を図り、自然性の高い訳文を
得ることのできる機械翻訳装置に関する。
〔発明の技術的背景とその問題点〕
近時、コンピュータを利用して入力原文を自動的に機械
翻訳し、その訳文を求める機械翻訳装置が注目されてい
る。例えば日本語文を入力してその英訳文を求めたり、
逆に英語文を入力してその和訳文を求めたりする自然言
語の機械翻訳装置の開発が種々試みられている。
この種の機械翻訳装置は、基本的には、■入力原文を形
態素解析や構文解析、意味分析して、例えば語(語句)
等の所定の言語処理単位に−1−記入力原文を区分し、
■翻訳処理に必要な知識情報を格納した翻訳辞書を参照
して各言語処理単位毎にその訳語(訳語句)を求め、■
これらの訳語(訳語句)を所定の訳文規則に従って結合
して前記原文に対する訳文を生成する如く構成される。
ところが、自然言語に対する意味的解釈技術が十分に確
立されていない為、−1一連した機械翻訳で自然性の高
い適切な訳文を生成することは非常に困難である。特に
自然言語で表現される文は無限にあり、それらの全てを
機械翻訳にて自然性良く作成することは殆んど不可能で
ある。
そこで少なくとも読み易い訳文を得るべく、原文中に存
在する句読点や区切り記号に対応させて訳文中にも句読
点や区切り記号を入れることが行われている。即ち、入
力原文中の句読点や区切り記号をそのまま、或いは文字
に変換して出力訳文中の相当位置に挿入することが行わ
れている。
しかし入力原文と出力訳文とが構文的に大きく異なる自
然言語である場合、句読点や区切り記号を挿入するべき
出力訳文中の相当位置を確定することすら困難となるこ
ともある。まl〜でその自然言語の形態によっては、句
読点や区切り記号を用いることなく言語表現されるもの
もあり、逆にtす読点や区切り記号を()1用しなけれ
ば非常に読み難い言語表現となる場合もある。
この為、入力原文中の句読点や区切り記号たけに従って
訳文中に句読点や区切り記号を設けても、自然性が高く
、読み易い訳文か得られるとは限らなかった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、入力1θ文中に(F在する句読
点や区切り記号とは独)γに訳文に対する句読点や区切
り記号を生成して、読み易く自然性のある言語表現の訳
文を得ることのできる実用性の高い機械翻訳装置を提供
することにある。
〔発明の概要〕
本発明は、入力部から与えられた原文を翻訳辞書に格納
された知識情報を用いて翻訳処理してその訳文を求める
機械翻訳装置において、入力原文を構文分析して構築さ
れる構文構造から、上記入力原文中に存在する句読点お
よび区切り記号とは独立に、例えば入力原文中の1文を
複数の文に区切ることのできる接続関係や修飾関係を検
出したときに、訳文を構成するに適切な句読点および区
切り記号を生成し、その句読点および区切り記号を前記
入力原文から求められる訳文の上記接続関係や修飾関係
を示す位置に挿入して訳文を生成するようにし、また訳
文中の語句の並びの中で意味的な単位となる文や句の間
に、句読点や区切り記号を挿入するようにしたことを特
徴とするものである。
〔発明の効果〕
かくして本発明によれば、その構文構造に従って、訳文
の言語表現として適切な句読点や区切り記号を原文中の
句読点や区切り記号とは独立に生成するので、句読点や
区切り記号位置の適切な読み易い訳文を自然性良く得る
ことが可能となる。
従って構文構造が大幅に異なる自然言語間の機械翻訳を
非常に良好に行い得る等の実用1−多大なる効果が奏せ
られる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明する
この実施例は英語文を入力し、これを日本語文に機械翻
訳するもので、第1図はその実施例装置の概略構成図で
ある。
第1図において、1はキーボード等からなる入力部であ
り、この入力部1を介して入力される文字列等からなる
英語文は、翻訳処理に供せられる原文として原文記憶部
2に格納される。
翻訳部4は、編集制御部3の制御の下で、翻訳処理に必
要な知識情報を予め格納した翻訳辞書5を参照し、前記
原文記憶部2に格納された原文を順次所定の処理単位で
機械翻訳処理している。この翻訳部4で求められた訳文
(ここでは日本語)は、これを得た原文に対応付けられ
て管理されて訳文記憶部6に格納される。
尚、上記翻訳辞書5に格納された知識情報は、例えば規
則・不規則変化辞書5a、単語(訳語)辞書5b、解析
文法5c、変換文法5d、生成文法5e、および形態素
生成文法5rからなる。
しかして前記編集制御部3は表示制御部7を駆動【7、
前記原文記憶部2に格納された英語文(原文)、および
訳文記憶部6に格納された日本語文(訳文)を相互に対
応付けし、CRTディスプレイ等からなる表示部8にて
同時表示している。この表示部8による原文および訳文
の表示によって、該訳文に対する後編集処理が行われる
。この後編集処理は、例えば前記入力部1から与えられ
る制御情報に従い、また前記翻訳辞書5に格納さた知識
情報を参照する等して行われる。
尚、印刷部9は、上記後編集処理が行イ〕れて完成され
た訳文(日本語文)をハードコピー出力する為のもので
ある。
ところで前記入力部1を構成するキーボードは、例えば
第2図に示すように構成される。即ち、このキーボード
は、例えば文字データ入力用のキ一群1aに加えて、翻
訳指示用のキー1b、編集用キ一群1c、機能制御用キ
一群1dおよび前記表示部8におけるカーソル制御用キ
一群10等を備えて構成される。
また第3図は前記表示部8の画面構成例を示している。
ここではその表示画面の上部に翻訳編集領域8a、画面
の左側部に原文表示領域8b、そして画面の右側部に訳
文表示領域8cを設定してその表示画面が構成されてい
る。
原文表示領域8bは、前記原文記憶部2に格納された入
力原文(英語文)を表示する領域である。
また訳文表示領域8cは前記訳文記憶部6に格納された
訳文(日本語文)を、その訳文を得た原文にそれぞれ対
応して表示する領域である。史に翻訳編集領域8aは、
前記翻訳辞書5から検索された、例えば訳語候補等の翻
訳処理に必要な知識情報を表示する領域である。
第4図はこのように構成iγ実施例装置の基本的な動作
シーケンスを示すものである。
前記編集制御部3は、この第4図に示される動作シーケ
ンスに従い、前記翻訳部4がら与えられる翻訳終了の情
報や前記入力部Iから入力される各種のキー情報を判定
し、対話的にその翻訳・i束処理を制御する。
即ち、編集制御部3は翻訳部4における翻訳処理状態を
監視しくステップA)、翻訳部4が成る1つの原文に対
する翻訳処理を完了したとき、その翻訳処理によって求
められた訳文を訳文記憶部6に格納すると共に、その訳
文を表示部8にて表示している(ステップB)。
また翻訳部4からの翻訳完了信号が得られない場合には
、前記入力部1から与えられるキー情報を判定している
(ステップC,D、E、F)。そのキー情報の判定結果
に応じて、次のような処理をそれぞれ制御している。
具体的には、入力キー情報が「翻訳指示キー」である場
合(ステップC)、編集制御部3は前記原文記憶部2に
格納された入力原文の1つを取出し、これを翻訳部4に
与えてその翻訳処理を開始させている(ステップG)。
この翻訳処理は、例えば第5図にその処理シーケンスを
示すように、先ず翻訳処理対象とする原文を入力しくス
テップa)、その入力原文の言語的形態(形態素)を前
記規則・不規則変化辞書5aを用いて解析する(ステッ
プb)。この形態素解析によって、例えば活用変化や語
尾変化を生じた言語をその原形(基本形)に変換する。
具体的には、過去形や進行形、過去分詞形で表現された
g語を現在形に変換し、また比較級や最」二級で表現さ
れた言語をその原形(原語)に変換する。
次に上記の如く形態素解析された原文の各原語に対して
、前記訳語辞書5bを用いてその訳語や品詞の情報等を
求める(ステップC)。この処理は、上記原語を見出し
語として前記訳語辞書5bを検索することによって行わ
れる。
しかる後、前述した解析文法5cに従う制御の下で(ス
テップd)、前記入力原文の構文解析を行う(ステップ
e)。この構文解析は、1゛、記原文の構文解析が成功
するまで繰返して行われる。そして、この構文解析によ
って前記原文を構成する原語の品詞の並び構造や、その
係り受は関係、時制の態様等が求められる。
その後、この構文解析された原文の構造を、前記変換文
法5dを用いて訳文の構文構造に変換する(ステップf
)。つまり変換文法5dを用いて英語(原文)の構文構
造を日本語(訳文)の構文構造に変換する。尚、この構
文構造の変換に失敗した場合には、前述した原文の構文
解析に誤りがあるとして、その原文の構文解析処理から
やり直す。
しかる後、訳文の構文構造に基いて前記原文の各原語に
ついてそれぞれ求められた訳語候補を、訳文の言語形態
に従った語順に並び変え、前述した原文に対する訳文候
補を得る(ステップg)。
この構文生成処理は、前述した生成文法5rに従って行
われる。
そしてその訳文候補を構成する各訳語候補(基本形)を
、前記原文の構文解析結果と形態素生成文法5fとに従
って活用変形処理、および語尾変形処理し、その訳文を
適切な言語表現として訳文を完成させる(ステップh)
このような一連の翻訳処理によって前記原文に 11一 対する訳文が求められる。尚、1つの原文に対して複数
の訳文が求められた場合、その1つだけを表示し、同時
に他の訳文が存在する旨を表示するようにしておけば好
都合である。
一方、第4図に戻って、前記入力キー情報がr文字キー
」である場合には(ステップD)、その文字キーが示す
文字コードを入力バッファに格納しくステップH)、そ
の文字コートを前記原文記憶部2に格納すると共に、そ
の文字パターンを前記表示部8に表示する(ステップI
)。この入力バッファに格納された文字コードの各文字
パターンの表示によって前記入力部1から入力された文
字列からなる入力原文が表示されることになる。
また入力キー情報が「編集キー」である場合には(ステ
ップE)、その編集キーに対応した編集処理か前記訳文
に対して実行される (ステップJ)。同様にして入力
キー情報が「機能キー」である場合には(ステップF)
、その機能キーに対応した処理が実行される(ステップ
K)。
そしてキー情報の入力がない場合、或いは入力キー情報
が」二連した「キー」以外のものである場合には、その
他の処理(ステップL)、例えば前記訳文記憶部6に得
られた訳文のハードコピー出力等が行われる。
このような編集制御部3の動作シーケンスにより、例え
ばオペレータがキーボードの文字入方用キ一群1aを操
作して文字入力するi、その入力文字の情報は入力バッ
ファに順次セットされ、翻訳処理に供せられる原文とし
て原文記憶部2に順次格納される(ステップD、H)。
そしてその入力原文が前記表示部8の原文表示部8bに
表示される(ステップI)。
しかして文字入力の任意の時点、例えば1文の入力終了
時点で翻訳指示キー11)を操作すると、その入力キー
情報に従って上記入力バッファに格納された入力原文に
対する翻訳処理が開始される(ステップC,G)。
そしてその翻訳処理が完了すると、これによって求めら
れた訳文が前記表示部8の訳文表示領域8cに表示され
ることになる(ステップA、B)。
尚、入力原文の修正か必要な場合には、文字入力用キ一
群1aの操作による原文入力の途中で、例えば前記カー
ソル制御キ一群1eを操作してその修正箇所にカーソル
を合せ、訂正・挿入・削除等の編集キ一群1cを操作す
ることによって、その編集処理が行われる。また係り受
はキーの操作により、例えば補助情報を用いてカーソル
が指示している語句の以外の係り受は候補を表示する等
が行われる。
また訳文に対する編集処理は、機能キーを用いて同様に
行われる。尚、この機能キーにより、例えば「訳語表示
キー」による訳文中の語に対する他の訳語の表示、「辞
書表示キー」による原文中の語に対する辞書の表示、「
辞書登録キー」による単語・熟語の辞書登録、「辞書削
除キー」による辞書登録された単語・熟語の辞書がらの
削除、更にはr部分訳キー」による翻訳処理に失敗した
原文に対する部分訳の表示がそれぞれ行イ)れる。
このようにして機械翻訳処理の基本動作が制御される。
ところで本装置では、前記翻訳部4における翻訳処理の
過程で、訳文に必要な句読点や区切り記号を生成し、こ
れをその訳文の適切な位置に挿入している。
この訳文に必要な句読点や区切り記号は、原文中の句読
点や区切り記号に対応して生成されることは勿論のこと
、上記原文中の句読点や区切り記号とは独立に、例えば
訳文の構文構造に従って生成されるようになっている。
第6図は訳文の構文構造から句読点や区切り記号を新規
に生成する処理の流れを示すものである。
即ち、この処理では訳文(或いは原文)の構文構造から
、その中に接続詞が存在するか否かを調べ(ステップX
)、接続詞が存在する場合には、その接続詞によって文
を意味的に区切ることができるか否かを調べる(ステッ
プY)。
そして、例えば従属接続詞や等位接続詞のように文を意
味的に区切ることのできる接続詞が検出された場合、訳
文に対する接続ルールに従って句読点や区切り記号を生
成し、その接続詞位置に挿大している(ステップZ)。
尚、上記接続ルールは、例えば第7図に示すように文の
接続関係に応じて与えられるものとなっている。例えば
単文(主文)と単文(副文)とを接続する接続ルールは
、副文を生成した後に従属接続詞を再現し、読点「、」
を生成した後に主文を生成して句点「。」にて締括るも
のとなっている。また命令文と平叙文とを接続する接続
ルールは、先ず命令文を生成した後に句点を生成し、そ
の後、接続詞を再現した後に読点を生成し、更に平叙文
を生成した後に句点を生成するものとなっている。
具体的には、例えば2つの114文の間に従属接続詞を
伴った原文を翻訳処理する場合、次のようにして句読点
の生成が行われる。
即ち、第8図(a)に示すように rThe train !+ad gone when
l arrived at the 5tation、
 Jなる原文が入力されると、その構文分析によって同
図(b)に示すような構文構造が求められる。
ここでは、語rgoH行(」が主文(111文)の述語
として、また語r arrive ;着く」が副文(単
文)の述語として求められている。また語r when
Jは」−記主文と副文とを従属な関係に接続する機能語
として解析される。尚、上記各動詞には、(過去完了)
や(過去)等の属性情報がそれぞれ付される。
しかしてこのような入力原文の構文構造から訳文を生成
する場合、前記r whenJが単文と単文とを従属な
関係に接続していることから、前述した第7図に示す単
文と単文との接続に対する接続ルールが適用される。そ
してその翻訳処理が次のようにして行われる。
■ 先ず「私が駅に着いた」として副文の生成を行い、 ■ 「とき」として従属接続詞の再現を行う。
■ その後、上記接続詞に対して「、」なる読点を生成
し、 ■ 主文に対する訳文を「列車は行ってしまった」とし
て生成し、 ■ 主文に対する句点「。」を生成する。
この結果、第8図(C)に示すように 「私が駅に着いたとき、 列車は行ってしまっていた。」 なる訳文が求められる。
ここで文末の句点「。」については、入力原文の末尾の
ピリオド「、」に対応して生成することも可能であるが
、入力原文の分析構造だけからその位置を求めると訳文
中の「私が駅に着いた」なる単文に対して句点が付けら
れることになる。従って訳文に対する構文構造を求める
等して、その句点位置を変更する処理が必要となる。
この点、本装置にあっては、入力原文が単文と単文との
従属な接続により構成されていることがその構文構造か
ら分析できるので、上述した接続ルールに従って、原文
中での区切り記号の存在位置とは独立に、訳文として適
切な位置にその句点を設けることが可能となる。
しかも上述した接続ルールに従うことによって、従属接
続詞の訳語の後に、訳文として適切な読点を新規に生成
することが可能となる。これ故、入力原文とは言語形態
が異なる訳文に対して、適切な読点を付与することが可
能となり、その訳文を意味的理解の容易な読み易いもの
とすることができる。
また第9図は等位接続詞により接続された命令文と平叙
文とからなる原文に対する翻訳処理を示している。この
場合、同図(a)に示すrstudy l+ard o
r you’ll f’all the exam、 
Jなる原文の構文分析結果として、同図(b)に示す構
文構造が求められる。ここで r 5tudy ;勉強する」は第1文の述語で命令の
情報が付与されている。またr rall ;失敗する
」は第2文の述語で推量の情報が付lテされている。こ
の結果、r orJなる接続詞は、上記第1文である命
令文と第2文である平叙文とを等位に接続するものであ
ることが分析される。そしてこの分析結果に従って前述
した第7図に示す命令文と平叙文との接続に対する接続
ルールが適用され、その翻訳処理が次のように行われる
■ 先ず、第1文について「熱心に勉強しなさい」なる
命令文を生成する。
■ 次に上記命令文に対する句点「。」を生成する。
■ その後、r orJなる接続詞を再81. して、
例えば「さもないと」なる訳語を得、 ■ 接続詞に対する読点「、」を生成する。
■ そして、上記接続詞で結ばれる平叙文を「あなたは
試験に失敗するでしょう」として生成し、■ 最後にそ
の平叙文に対する句点「。」を生成する。
この結果、第9図(C)に示すように 「熱心に勉強しなさい。さもないと、 あなたは試験に失敗するでL7よう。」なる訳文を、適
切な句読点を伴って?1することがIIJ能となる。特
に原文では、接続詞r orJによって接続されていた
一文を、その接続関係に従って2つの文に分解し、原文
中には全く存在していない句読点を生成して、2つの文
からなる訳文を生成している。
第10図は訳文中の語句の並びから、句読点や区切り記
号を新規に生成し、これを訳文中に挿入する手続きを示
すものである。
即ち、この処理では訳文中の語句の並びから主語が隣接
するか否かを調べ(ステップP)、主語が隣接する場合
には、前に位置する主語の直後に読点を挿入する(ステ
ップQ)。また主語の次に述語以外の要素がある場合に
は(ステップR)、その要素が埋め込み文で修飾されて
いるが否がを調べ(ステップS)、埋め込み文で修飾さ
れている場合には、主語の直後に読点を挿入する手続き
からなる(ステップT)。
具体的には次のようにして読点の挿入が行われる。例え
ば入力原文 r l know he killed B moth
er、 Jを翻訳処理して、 「私は彼が私の母を殺したのを知っている。」なる訳文
を得た場合、前述した手続きによって「私は」と「彼が
」の2つの主語が隣接していることが検出される。そこ
で前述したステップP。
Qの処理にて、前に位置する主語「仏は」の直後に読点
を挿入し、 「私は、彼が私のノリを殺したのを知っている。」とし
て訳文を完成させる。
また入力原文 r I  hate  a  man  who  k
illed  my  motherJに対して 「私は私の母を殺した男を憎む。」 なる訳文を得た場合には、前述したステップSの処理に
て、「男」が「私の母を殺した」なる埋め込み文で修飾
されていることから、その主語「払」の直後に読点を挿
入し、 「私は、私の母を殺した男を憎む。」 として訳文を完成させる。
このようにして原文(英語文)中には句読点や区切り記
号が含まれない場合でも、訳文([]本語文)中に、そ
の意味構造に応じて読点を挿入することによって、意味
的理解の容易な訳文を求めることか可能となる。
故に、英語とは全く言語表現構造の異なる[」本語の訳
文を、適切な句読点を伴って効果的に得ることが可能と
なり、その読み易さを高めて意味的理解も容易ならしめ
得る。
このように本装置にあっては、原文の構文構造に従って
、意味的に2つの文に分解可能な接続詞を検出し、その
接続詞によって分解される文の接続関係に従って接続ル
ールを適用しながら、また訳文中での語や句や文の隣接
関係によって、訳文言語の性質に基いたルールを適用し
ながら翻訳処理を実行するので、原文中に存在する句読
点や区切り記号とは独立に、訳文として適切な句読点や
区切り記号を生成し、これを付与して訳文を生成するこ
とができる。
従って、適切な位置に句読点や区切り記号を設けた自然
性の高い訳文を生成することが可能となる。しかも、訳
文に対する句読点や区切り記号を、原文中の句読点や区
切り記号とは独立に生成するので、言語形態の異なる原
文に煩わされることなく、適切な句読点や区切り記号の
生成が可能である。故に、その読み易さを高めて訳文の
意味的理解を容易ならしめる等の実用」二多人な効果が
奏せられる。
尚、本発明は−に連した実施例に限定されるものではな
い。ここでは英語から1」本譜への翻訳について説明し
たが、逆向きの翻訳であっても良く、また別の言語間の
翻訳処理についても同様に適用することができる。また
原文中には存在しない新規な句読点や区切り記号の生成
のみならず、原文中に句読点や区切り記号が存在しても
、訳文としてそれが不要な場合には、その生成を行イ〕
ないようにすることも可能である。要するに、II<文
の言語表現型式にとられれることなく、訳文に対して適
切な句読点や区切り記号だけを生成するようにすれば良
い。その他、本発明はその要旨を逸脱しない範囲で種々
変形して実施することかできる。
【図面の簡単な説明】
図は本発明の一実施例装置を示すもので、第1図は実施
例装置の概略構成図、第2図は入力部の構成例を示す図
、第3図は表示画面の構成例を示す図、第4図は実施例
装置の基本的な動作シーヶ= 24− ンスを示す図、第5図は翻訳処理の処理手続きを示す図
、第6図は訳文に対する句読点の生成手続きを示す図、
第7図は接続詞によって結ばれる文の接続ルールの一例
を示す図、第8図および第9図はそれぞれ句読点生成を
伴った翻訳処理の例を示す図、第10図は日本語訳文に
対する読点の挿入手続きを示す図である。 l・・・入力部、2・・・原文記憶部、3・・・編集制
御部、“ 4・・・翻訳部、5・・・翻訳辞書、6・・
・訳文記憶部、7・・・表示制御部、訃・・表示部、9
・・・印刷部。 出願人代理人 弁理士 鈴江武彦 第6図 (a)  The train had gone w
hen I arrived at the 5tat
ion(C)  私が駅についたとき、列車は行ってし
まっていた。 ↑ 第8図 (a)  5tudy hard or you’ll
 fail the exam。 (C)  熱心に勉強しなさい。/ さもないと、あなたは試験に失敗するでしょう。 ↑ 第9図

Claims (3)

    【特許請求の範囲】
  1. (1)翻訳処理に用いる知識情報を格納した翻訳辞書部
    と、入力部から与えられた原文を上記知識情報を用いて
    翻訳処理する翻訳部と、この翻訳部が得た訳文を出力す
    る訳文出力部とを具備し、前記翻訳部は、入力原文を構
    文分析して構築される構文構造から、上記入力原文中に
    存在する句読点および区切り記号とは独立に、訳文を構
    成するに適切な句読点および区切り記号を生成し、その
    句読点および区切り記号を前記入力原文から求められる
    訳文に挿入してなることを特徴とする機械翻訳装置。
  2. (2)訳文を構成するに適切な句読点および区切り記号
    は、入力原文を解析して求められる接続関係を示す構造
    や、修飾関係を示す構造を検出したときに生成されるも
    のであって、上記接続関係や修飾関係に対応する訳文中
    の位置に挿入されるものである特許請求の範囲第1項記
    載の機械翻訳装置。
  3. (3)訳文を構成するに適切な句読点および区切り記号
    は、訳文中での文や句の連続やその前後関係から意味的
    な単位となる文や句を検出したときに生成されるもので
    あって、上記意味的な単位となる文や句の間に挿入され
    るものである特許請求の範囲第2項記載の機械翻訳装置
JP61005570A 1986-01-14 1986-01-14 機械翻訳方法 Pending JPS62163173A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61005570A JPS62163173A (ja) 1986-01-14 1986-01-14 機械翻訳方法
EP87300006A EP0230339A3 (en) 1986-01-14 1987-01-02 Machine translation system
US07/000,133 US4821230A (en) 1986-01-14 1987-01-02 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61005570A JPS62163173A (ja) 1986-01-14 1986-01-14 機械翻訳方法

Publications (1)

Publication Number Publication Date
JPS62163173A true JPS62163173A (ja) 1987-07-18

Family

ID=11614872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61005570A Pending JPS62163173A (ja) 1986-01-14 1986-01-14 機械翻訳方法

Country Status (3)

Country Link
US (1) US4821230A (ja)
EP (1) EP0230339A3 (ja)
JP (1) JPS62163173A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371774A (ja) * 1986-09-12 1988-04-01 Nec Corp 文脈解析方式

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
USRE35464E (en) * 1986-11-28 1997-02-25 Sharp Kabushiki Kaisha Apparatus and method for translating sentences containing punctuation marks
GB2198565A (en) * 1986-11-28 1988-06-15 Sharp Kk Translation apparatus
JPS6466777A (en) * 1987-09-08 1989-03-13 Sharp Kk Mechanical translation device
JPH01234975A (ja) * 1988-03-11 1989-09-20 Internatl Business Mach Corp <Ibm> 日本語文章分割装置
US4907971A (en) * 1988-10-26 1990-03-13 Tucker Ruth L System for analyzing the syntactical structure of a sentence
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
US5070478A (en) * 1988-11-21 1991-12-03 Xerox Corporation Modifying text data to change features in a region of text
JPH02140868A (ja) * 1988-11-22 1990-05-30 Toshiba Corp 機械翻訳システム
JPH02165378A (ja) * 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
JPH02281372A (ja) * 1989-04-24 1990-11-19 Sharp Corp 機械翻訳装置における挿入副詞句処理方法
JPH02308370A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 機械翻訳システム
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
JP2815714B2 (ja) * 1991-01-11 1998-10-27 シャープ株式会社 翻訳装置
US5530644A (en) * 1992-05-20 1996-06-25 Fuji Xerox Co., Ltd. Data processing device
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
US5373442A (en) * 1992-05-29 1994-12-13 Sharp Kabushiki Kaisha Electronic translating apparatus having pre-editing learning capability
WO1994006086A1 (en) * 1992-09-04 1994-03-17 Caterpillar Inc. Integrated authoring and translation system
JPH0728815A (ja) * 1993-02-18 1995-01-31 Matsushita Electric Ind Co Ltd 構文解析装置
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
US5903858A (en) * 1995-06-23 1999-05-11 Saraki; Masashi Translation machine for editing a original text by rewriting the same and translating the rewrote one
US5836771A (en) 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US7672829B2 (en) * 1997-03-04 2010-03-02 Hiroshi Ishikura Pivot translation method and system
JP2001075957A (ja) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> 自然言語構造の表示方法及び装置
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
RU2210809C2 (ru) * 2000-11-21 2003-08-20 Открытое акционерное общество "Московская телекоммуникационная корпорация" Способ упорядочения данных, представленных в текстовых информационных блоках данных
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US20060100849A1 (en) * 2002-09-30 2006-05-11 Ning-Ping Chan Pointer initiated instant bilingual annotation on textual information in an electronic document
AU2003217613A1 (en) * 2003-02-19 2004-09-09 Exploit Systems, Inc A method, apparatus and system for file sharing between computers
US7195409B2 (en) * 2003-08-27 2007-03-27 King Jim Co., Ltd. Apparatus, method and program for producing small prints
WO2005024654A2 (en) * 2003-09-03 2005-03-17 Business Integrity Limited Insertion of symbols in automated documents
GB2405728A (en) * 2003-09-03 2005-03-09 Business Integrity Ltd Punctuation of automated documents
US20110097693A1 (en) * 2009-10-28 2011-04-28 Richard Henry Dana Crawford Aligning chunk translations for language learners
TWI570578B (zh) * 2012-12-19 2017-02-11 英業達股份有限公司 中文詞句的詞彙查詢系統及其方法
US10380263B2 (en) * 2016-11-15 2019-08-13 International Business Machines Corporation Translation synthesizer for analysis, amplification and remediation of linguistic data across a translation supply chain
JP6846666B2 (ja) * 2017-05-23 2021-03-24 パナソニックIpマネジメント株式会社 翻訳文生成方法、翻訳文生成装置及び翻訳文生成プログラム
CN111666776B (zh) * 2020-06-23 2021-07-23 北京字节跳动网络技术有限公司 文档翻译方法和装置、存储介质和电子设备
US12086559B2 (en) * 2021-03-31 2024-09-10 International Business Machines Corporation Clause extraction using machine translation and natural language processing

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6042517B2 (ja) * 1980-04-15 1985-09-24 シャープ株式会社 電子式翻訳機
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS58175074A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 構文分析方式
JPS6084667A (ja) * 1983-10-17 1985-05-14 Mitsubishi Electric Corp 文章組立装置
JPH0630099B2 (ja) * 1984-03-27 1994-04-20 株式会社リコー 日本語処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371774A (ja) * 1986-09-12 1988-04-01 Nec Corp 文脈解析方式

Also Published As

Publication number Publication date
EP0230339A2 (en) 1987-07-29
US4821230A (en) 1989-04-11
EP0230339A3 (en) 1988-08-17

Similar Documents

Publication Publication Date Title
JPS62163173A (ja) 機械翻訳方法
US7707026B2 (en) Multilingual translation memory, translation method, and translation program
JP3189186B2 (ja) パターンに基づく翻訳装置
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2003050797A (ja) スケーラブル機械翻訳システム
JPH0442705B2 (ja)
JPH0351022B2 (ja)
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
JP2006127405A (ja) バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム
JPH0332106B2 (ja)
JPS61278970A (ja) 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JP2626722B2 (ja) 日本語生成装置
JP3236027B2 (ja) 機械翻訳装置
Kozerenko Functional and cognitive aspects in linguistic modelling
JPS62163174A (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
Hussen Enhancing English to Amharic Machine Translation with Prior Knowledge Integration
JPH0550778B2 (ja)
Narayan et al. Pre-Neural Approaches
JP3253311B2 (ja) 言語処理装置および言語処理方法
Morfeq Bayan: A text database management system for Arabic engineering documents
ADJI et al. Annotated disjunct for machine translation
JPS6190268A (ja) 翻訳方式
JPH0332105B2 (ja)
JPS6244872A (ja) 機械翻訳装置