JPH04235672A - 翻訳装置 - Google Patents

翻訳装置

Info

Publication number
JPH04235672A
JPH04235672A JP3001494A JP149491A JPH04235672A JP H04235672 A JPH04235672 A JP H04235672A JP 3001494 A JP3001494 A JP 3001494A JP 149491 A JP149491 A JP 149491A JP H04235672 A JPH04235672 A JP H04235672A
Authority
JP
Japan
Prior art keywords
sentence
break
rules
rule
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3001494A
Other languages
English (en)
Inventor
Youji Fukumochi
福持 陽士
Hidezo Kugimiya
釘宮 秀造
Ichiko Sada
いち子 佐田
Noriyuki Hirai
平井 徳行
Takeshi Kutsumi
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3001494A priority Critical patent/JPH04235672A/ja
Priority to US07/819,500 priority patent/US5299124A/en
Publication of JPH04235672A publication Critical patent/JPH04235672A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、自然な翻訳文を生成
できる翻訳装置に関する。
【0002】
【従来の技術】従来、翻訳装置としは次のようなものが
ある。この翻訳装置は、キーボード等から入力されたソ
ース言語をメインCPUの制御により翻訳モジュールに
入力する。そして、この入力されたソース言語を、メモ
リに格納されている辞書,文法規則および木構造変換規
則等を利用して、翻訳モジュールによってターゲット言
語に翻訳するものである。その際に、上記翻訳モジュー
ルは、次のようにして入力されたソース言語の構文を解
析する。すなわち、読み込まれたソース言語の1文を構
成する単語をバッファに格納する。そして、上記メモリ
に格納された辞書を用いて上記バッファに格納された各
単語の品詞を得る。次に、この得られた各単語の品詞間
をまとめることができる文法規則を上記メモリから捜し
出し、この捜し出された文法規則を用いて上記各単語間
の係り受け関係を示す構造解析木を作り上げる。こうし
て入力されたソース言語における構文解析が実行される
のである。換言すれば、上述の翻訳装置によるソース言
語の構文解析処理は、各単語の品詞および句に係る文法
規則と言う局所的な情報に基づいて、ボトムアップ的に
構文を解析するのである。
【0003】
【発明が解決しようとする課題】このように、上記翻訳
装置によるソース言語の構文解析処理においては、局所
的な情報に基づいてボトムアップ的に実施するので次の
ような問題がある。すなわち、単語間の係り受け構造が
複雑であったり曖昧な文においては、文における句のま
とまりの認識の際に誤認識が生じ易い。このように句の
まとまりに誤認識が生じた場合には、誤認識された句の
まとまりに関して構文解析が実行されるので誤った構文
解析結果が生ずるという問題がある。また、句のまとま
りの誤認識のために構文解析に失敗して構造解析木が得
られない場合には、例えば各句毎に翻訳処理が実施され
て、ターゲット言語の文体を成さないようなばらばらの
翻訳文が出力されてしまうという問題がある。つまり、
ソース言語の例文として、前置詞句とコンマと平叙文と
から成る英文“After independence
 from the U.K.in 1962,the
 country started election
.”が入力された場合、従来は上記例文に基づいて一つ
の構文解析木を構築することができるような文法規則が
上記メモリには格納されていないので、従来の翻訳装置
では構文解析に失敗するのである。その場合には、上記
例文を複数の前置詞句    “After inde
pendence”“from the U.K.” “in 1962” とコンマ          “,” と平叙文          “the countr
y started election.” とに分割して、各句および平叙文について構文解析を実
行するのである。その結果、「独立後‖イギリスから‖
1962年に‖、‖その国は、選挙を開始した。」のよ
うに、ターゲット言語としての日本語の文体を成さない
翻訳文が出力されるのである。
【0004】そこで、この発明の目的は、単語間の係り
受け構造が複雑であったり曖昧な入力文であっても、局
所的な情報に基づいてボトムアップ的に構文解析を実施
して精度の高い翻訳文を得ることができる翻訳装置を提
供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するため
、この発明は、入力されたソース言語による文をメモリ
に格納された辞書を用いて辞書引き形態素解析部で形態
素に分割して各形態素の品詞を得、この得られた各形態
素の品詞に基づいて構文解析部で上記メモリに格納され
た文法規則を用いて上記入力文の構文解析を行い、得ら
れた構文解析結果を変換部でターゲット言語の構文に変
換し、翻訳文生成部でターゲット言語による翻訳文を生
成する翻訳装置において、文の切れ目に関する人間の経
験的知識をルール化して得られた切れ目ルールを格納す
る切れ目ルール格納部と、上記構文解析部による構文解
析が失敗か否かを判別すると共に、構文解析に失敗した
場合には、構文解析に失敗した入力文に対して上記切れ
目ルールに従って適切な位置に切れ目をセットする切れ
目セット部と、上記切れ目セット部によって入力文に切
れ目がセットされた場合に、そのセットされた切れ目を
区切りとして上記入力文を区切った際における句のまと
まり毎に上記構文解析部,変換部および翻訳文生成部を
介して得られたターゲット言語による翻訳文を、上記句
のまとまり毎に格納する翻訳文格納部を備えたことを特
徴としている。
【0006】
【作用】ソース言語による文が入力されると、辞書引き
形態素解析部によって、メモリに格納された辞書を用い
て上記入力文が形態素に分割されて各形態素の品詞が得
られる。そして、得られた各形態素の品詞に基づいて、
構文解析部によって、上記メモリに格納された文法規則
を用いて上記入力文の構文が解析される。そうすると、
切れ目セット部によって、上記構文解析部による入力文
の構文解析が失敗か否かが判別される。その結果失敗で
ない場合には、得られた構文解析結果が変換部でターゲ
ット言語の構文に変換され、翻訳文生成部によってター
ゲット言語による翻訳文が生成される。一方、構文解析
が失敗である場合には、上記切れ目セット部によって、
文の切れ目に関する人間の経験的知識をルール化した切
れ目ルールが切れ目ルール格納部から読み出され、構文
解析に失敗した入力文に対して上記読み出された切れ目
ルールに従って適切な位置に切れ目がセットされる。そ
して、そのセットされた切れ目を区切りとして上記入力
文を区切った際における句のまとまり毎に、上記構文解
析部で構文解析が行われる。こうして、句のまとまり毎
に得られた構文解析結果に基づいて上記変換部および翻
訳文生成部を介してターゲット言語による翻訳文が生成
され、各句のまとまり毎に翻訳文格納部に格納されるの
である。このようにして、総ての句のまとまりのターゲ
ット言語による翻訳文生成が終了すると、上記翻訳文格
納部に格納された総ての句のまとまり毎の翻訳文が読み
出されて、上記構文解析に失敗した入力文1文の翻訳文
が出力される。こうして、単語間の係り受け構造が複雑
/曖昧なために構文解析に失敗するようなソース言語に
よる入力文の場合には、適切な位置に切れ目が自動的に
セットされることによって構文解析が可能となり、ター
ゲット言語に翻訳されるのである。
【0007】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。図1はこの発明の翻訳装置における一実施例
のブロック図である。1はメインCPU(中央処理装置
)、2はメインメモリ、3はCRT(カソード・レイ・
チューブ)、4はキーボード、5は翻訳モジュール、6
は翻訳用の辞書,文法規則,切れ目ルールおよび木構造
変換規則等を格納しているメモリ、7は確定された翻訳
結果を用紙に印字するプリンタである。すなわち、上記
メモリ6によって上記切れ目ルール格納部を構成するの
である。上記翻訳モジュール5は、ソース言語による文
章がキーボード4等から入力されると、それをターゲッ
ト言語による文章に翻訳して出力するものである。すな
わち、キーボード4等から入力されたソース言語による
文章はメインCPU1の制御により翻訳モジュール5に
送られる。翻訳モジュール5はメモリ6に記憶されてい
る辞書,文法規則,切れ目ルールおよび木構造変換規則
等を用いて、入力されたソース言語を後に詳述するよう
にしてターゲット言語に翻訳する。こうして得られた翻
訳結果はプリンタ7に出力されて印字されるのである。 上記メインCPU1はCRT3,キーボード4,翻訳モ
ジュール5およびプリンタ7を制御して翻訳処理を実施
する。 上記メインメモリ2にはメインCPU1用の翻訳処理プ
ログラム等が格納されている。また、上記CRT3には
、入力されたソース言語による文章やターゲット言語に
よる翻訳文章や各種の指示等が表示される。そして、キ
ーボード4によって上記指示に基づく指定等が行われる
【0008】図2は上記翻訳モジュール5の具体的なブ
ロック図である。この翻訳モジュール5は辞書引き形態
素解析部11,構文解析部12,変換部13,翻訳文生
成部14および切れ目セット部15から構成される。以
下、図1および図2に従って上記翻訳モジュール5によ
る翻訳処理について詳細に説明する。まず、読み込まれ
てバッファに格納された入力文は、辞書引き形態素解析
部11によって各形態素列(単語列)に分割される。ま
た、この分割された各単語に対する品詞などの文法情報
および訳語が、メモリ6の辞書を用いて得られる。さら
に、各単語に対する時制・人称・数などが解析される。 以下、このような処理を辞書引き・形態素解析と言う。 次に、構文解析部12によって、メモリ6の辞書と文法
規則を用いて、各単語間の係り受け関係を示す構造解析
木が構築される。以下、このような処理を構文解析と言
う。ここで、入力された文に係る句のまとまりが誤認識
されて構文解析木が得られない場合には、切れ目セット
部15によって入力文における最適位置に自動的に切れ
目をセットして、構文解析部12で再度構文解析が実施
される。次に、変換部13によって、上記メモリ6に格
納された木構造変換規則を用いて、入力されたソース言
語による文の構文解析木の構造がターゲット言語の構文
解析木の構造に変換される。そして、翻訳文生成部14
によってターゲット言語による翻訳文として適切な助詞
や助動詞が付けられて翻訳文が得られる。こうして得ら
れた翻訳文は翻訳モジュール5から出力され、プリンタ
7によって用紙に印字されるのである。
【0009】次に、上記メモリ6に格納された辞書等の
うち、本実施例に係るソース言語の構文解析に関係のあ
る文法規則および切れ目ルールについて詳細に説明する
。上記文法規則は、上述のように、構文解析の際に各単
語の品詞間をまとめて構文解析木を構築するための規則
であり、本実施例においては図3に示すように定められ
ている。すなわち、 文法規則(a)は、文は平叙文と文末とから成ることを
表している。 文法規則(b)は、平叙文は平叙文と従属文とから成る
ことを表している。 文法規則(c)は、平叙文は名詞句と動詞句とから成る
ことを表している。 以下同様に、文法規則(d)〜文法規則(k)は、矢印
の左側に記載された種々の句や文は矢印の右側に記載さ
れた品詞,句,文およびコンマから成ることを表してい
るのである。但し、本実施例における文法規則は上述の
文法規則(a)〜文法規則(k)のみから成るとする。
【0010】次に、上記切れ目ルールについて詳細に説
明する。上記切れ目ルールは、単語間の係り受け構造が
複雑/曖昧なために構文解析木が得られないような入力
文に対して、自動的に最適な位置に切れ目をセットする
際に用いるためのルールである。この切れ目ルールは、
文の切れ目に関する人間の経験的知識をルール化したも
のであり、この切れ目ルールに従って単語間の係り受け
構造が複雑/曖昧な文に自動的に切れ目をセットするこ
とによって、適確な句のまとまりが得られるようになる
のである。上記切れ目ルールは、本実施例においては図
4に一例を示すような形式で表現されている。ここで、
図4における切れ目ルールの表現則について説明する。 上記切れ目ルールは、図4に示すように、一つ以上のサ
ブルールから構成される。そして、各サブルールは次の
ような複数の項目の連鎖形式によって表現されている。 “検索開始位置,検索範囲,検索条件,処理,処理位置
      キー”上記キーは、検索の対象となる品詞
,形態属性,見出しおよび細分類などの属性等である。 一つのサブルールに付きこのキーが複数個ある場合には
コンマを挟んで列挙する。上記検索開始位置は、当該文
において所定のキーを検索する際に検索を開始する位置
である。上記検索範囲は、当該文において所定のキーを
検索する範囲であり、検索開始位置から何単語先まで検
索するかを表す。上記検索条件は、当該文の所定の検索
範囲内における所定のキーに関する検索条件成立の内容
である。上記処理は、所定の検索条件が満たされた場合
に当該文に対して実行される処理の内容である。また、
上記処理位置は、当該文に対して所定の処理を実行する
際の処理位置である。
【0011】図4中に表示されている上記サブルールを
構成する項目の内容を表す文字,記号および数字は、次
のような意味を表す。すなわち、 (1) 検索開始位置 TP:文頭 LK:一つ前の検索条件を満たしたキーの位置(2) 
検索範囲 NR:無制限 1:次の単語の位置まで 0:当該単語のみ (3) 検索条件 +:検索範囲内に検索対象キーが在れば検索条件成立−
:検索範囲内に検索対象キーが無ければ検索条件成立(
4) 処理 空欄:次のサブルールに進む SB:切れ目をセットする (5) 処理位置 −1:直前の単語に対して処理する −2:2つ前の単語に対して処理する
【0012】その結果、図4に示すルール番号“1”の
切れ目ルールは3つのサブルールから成り、各サブルー
ルは夫々次のような内容を表しているのである。 第1サブルール:文頭より無制限に品詞「コンマ」を検
索する。その結果「コンマ」が在れば次の第2サブルー
ルに移る。 第2サブルール:一つ前の検索条件を満たしたキーの位
置から次の単語の位置まで品詞「従属接続詞」を検索す
る。すなわち、第1サブルールにおける検索条件を満た
した「コンマ」の次の単語が「従属接続詞」であるかを
調べるのである。その結果「従属接続詞」であれば次の
第3サブルールに移る。 第3サブルール:一つ前の検索条件を満たしたキーの位
置から次の単語の位置まで、品詞「名詞」であって「主
格」の形態属性を有するもの又は品詞「代名詞」であっ
て「主格」の形態属性を有するもの又は品詞「冠詞」を
検索する。すなわち、第2サブルールにおける検索条件
を満たした「従属接続詞」の次の単語が、「名詞」であ
って「主格」の形態属性を有するもの又は「代名詞」で
あって「主格」の形態属性を有するもの又は「冠詞」で
あるかを調べるのである。その結果、「名詞」であって
「主格」の形態属性を有するもの又は「代名詞」であっ
て「主格」の形態属性を有するもの又は「冠詞」であれ
ば、その単語の2つ前の単語(つまり、「コンマ」)の
位置に切れ目をセットする。
【0013】上記構成の翻訳装置は、以下に述べるよう
にしてソース言語をターゲット言語に翻訳する。図5お
よび図6は図1および図2に示す翻訳モジュール5によ
って実行される1文に係る翻訳処理動作のフローチャー
トである。以下、図5および図6に従って1文に係る翻
訳処理動作について詳細に述べる。ステップS1で、入
力されたソース言語による1文に対して上記辞書引き形
態素解析部11によって辞書引き・形態素解析が行われ
る。ステップS2で、分割フラグの内容がリセットされ
る。ステップS3で、上記ステップS1における辞書引
き・形態素解析の結果得られた各形態素の品詞に基づい
て、上記メモリ6に格納された文法規則を用いて構文解
析が行われる。ステップS4で、上記各形態素間を適確
にまとめるための文法規則がメモリ6に存在して当該文
に係る構文解析木が得られて、構文解析に成功したか否
かが判別される。その結果構文解析に成功した場合には
ステップS5に進み、失敗した場合にはステップS10
に進む。ステップS5で、分割フラグの内容が“1”で
あるか否かが判別される。その結果“1”でなければス
テップS6に進み、“1”であればステップS18に進
む。ステップS6で、当該文は構文解析に成功したので
、ステップS3において得られたソース言語における構
文解析木が変換部13によってターゲット言語における
構文解析木に変換される。ステップS7で、翻訳文生成
部14によって、上記ステップS6において得られた翻
訳文がターゲット言語の翻訳文として適切な文体に校正
されて、翻訳文が生成される。ステップS8で、上記分
割フラグの内容が“1”であるか否かが判別される。そ
の結果“1”でなければステップS9に進む一方、“1
”であればステップS19に進む。ステップS9で、当
該文の翻訳処理は総て終了したので、上記ステップS7
において生成されたターゲット言語による翻訳文がCR
T3等に出力されて、1文に係る翻訳処理動作を終了す
る。上述のステップS1〜ステップS9における翻訳処
理動作は、単語間の係り受け構造が比較的簡単であって
句のまとまりの認識の際に誤認識が生じにくい1文に係
る翻訳処理動作である。
【0014】次に、単語間の係り受け構造が複雑/曖昧
であるために、句のまとまりに誤認識が生じ易い1文に
係る翻訳処理動作について説明する。その場合には、句
のまとまりに誤認識が生じたために、当該文の構文解析
に失敗したとする。したがって、当該文の場合には、上
記ステップS4において構文解析に失敗したと判別され
てステップS10に進む。ステップS10で、上記分割
フラグの内容が“1”にセットされて、当該文における
句のまとまりの認識の際に誤認識が生じないような適確
な位置に切れ目を挿入するための、切れ目セット部15
による処理動作に入る。ステップS11で、ルール番号
に“1”がセットされる。ステップS12で、上記セッ
トされたルール番号の切れ目ルールがメモリ6から読み
出され、この読み出された当該切れ目ルールを構成する
未マッチングの最初のサブルールと当該文とのマッチン
グが行われる。ステップS13で、上記未マッチングの
最初のサブルールの検索条件が成立したか否かが判別さ
れる。 その結果成立した場合にはステップS14に進み、成立
しなければステップS15に進む。ステップS14で、
当該切れ目ルールに次のサブルールが存在するか否かが
判別される。その結果存在する場合にはステップS12
に戻って次のサブルールとのマッチングが実行される。 一方、存在しない場合にはステップS17に進む。ステ
ップS15で、当該切り目ルールの検索条件が成立しな
いので、ルール番号の内容がインクリメントされる。ス
テップS16で、上記ステップS15においてセットさ
れたルール番号の切れ目ルールがメモリ6に格納されて
いるか否かが判別される。その結果、ある場合にはステ
ップS12に戻って次のルール番号の切れ目ルールに対
する処理が実行される。一方、そうでなければ、ステッ
プS17に進む。ステップS17で、ある切れ目ルール
における総てのサブルールの検索条件が成立したので、
その切れ目ルールの最終サブルールに設定された処理(
すなわち、切れ目のセット)が実行される。また、検索
条件が成立する切れ目ルールがメモリ6にない場合には
、文末に対して処理が実行される。すなわち、経験的知
識に基づくルールに従って、当該文における句のまとま
りに誤認識が生じないような適確な位置に切れ目をセッ
トするのである。その後、ステップS3に戻って、上記
切れ目のセットによって適確な句のまとまりが形成され
た当該文に対して再度構文解析が実行されるのである。 そして、上記ステップS3における再度の構文解析の結
果構文解析に成功した場合には、上記ステップS10に
おいて上記分割フラグに“1”がセットされているため
に、上記再構文解析後におけるステップS5においてス
テップS18に進むのである。
【0015】ステップS18で、上記ステップS3にお
ける再構文解析の結果得られた構文解析木を構成する末
尾の形態素の位置が、上記ステップS17においてセッ
トされた切れ目の形態素の位置に一致するか否かが判別
される。その結果、一致しなければステップS3に戻っ
て構文解析木の再構築を行なう。一方、一致すれば上記
ステップS6およびステップS7に進んで、当該文にお
ける上記切れ目までの句のまとまりの構文解析木に対す
る変換処理および生成処理が実行される。そして、上記
ステップS8において分割フラグの内容が“1”である
と判断されて、ステップS19に進むのである。ステッ
プS19で、上記ステップS7において生成された当該
文における上記切れ目までの句のまとまりに対する翻訳
文が、上記翻訳文格納部としてのバッファ(図示せず)
に格納される。 ステップS20で、当該文の中に未翻訳の単語がまだあ
るか否かが判別される。その結果あればステップS21
に進み、なければステップS22に進む。ステップS2
1で、上記ステップS17において実行される処理(す
なわち、ある形態素に対してセットされた切れ目)がリ
セットされる。そして、上記ステップS11に戻って、
当該文における切れ目がリセットされた形態素の後の句
のまとまりに対して、さらなる切れ目セット箇所の検索
が実行される。そして、新たな切れ目セット箇所があれ
ばその切れ目までの新たな句のまとまりに対する構文解
析,変換処理および生成処理が実行されるのである。こ
うして、当該文に対する翻訳処理が進み、上記ステップ
S20で未翻訳の単語がないと判別されると(すなわち
、当該文の文末まで翻訳処理が進むと)上記ステップS
22に進むのである。ステップS22で、上記ステップ
S17においてセットされた各切れ目を境とした各句の
まとまり毎のターゲット言語の翻訳文が、上記バッファ
から読み出されてCRT3等に出力される。こうして、
単語間の係り受け構造が複雑/曖昧であるために構文解
析に失敗するような1文に係る翻訳処理動作を終了する
【0016】このように、本1文に係る翻訳処理動作に
おいては、単語間の係り受け構造が比較的複雑/曖昧な
ソース言語の文が入力されて構文解析に失敗した場合に
は、人間が経験的に持っている切れ目に関する知識に基
づく切れ目ルールを用いて、切れ目セット部15によっ
て入力文中の最適な位置に切れ目を自動的にセットする
のである。その結果、単語間の係り受け構造が比較的複
雑/曖昧な入力文であっても句のまとまりが正しく認識
されるようになり、各句のまとまり毎に正しくターゲッ
ト言語に翻訳できるのである。
【0017】次に、単語間の係り受け構造が比較的簡単
な例文と複雑/曖昧な例文とを上げて、図5および図6
のフローチャートを参照して、上述の翻訳処理動作をよ
り具体的に説明する。この場合のソース言語は英語であ
り、ターゲット言語は日本語である。 (A) 係り受け構造が簡単な例文の場合単語間の係り
受け構造が比較的簡単な例文(イ)“The coun
try started election afte
r independence from the U
.K.in 1962.”が入力されたとする。そうす
ると、上記辞書引き・形態素解析が実施された後、構文
解析において、上記メモリ6に格納された文法規則(f
),文法規則(e),文法規則(g),文法規則(i)
,文法規則(h),文法規則(c)および文法規則(a
)を用いて、例文(イ)の構文解析木が構築される。つ
まり、例文(イ)は解析可能なのである。 …ステップS1〜ステップS3 そして、この構築された英語の構文解析木が日本語の構
文解析木に変換され、日本語の文体として適切な助詞や
助動詞が付けられて、英語による入力例文(イ)の日本
語による翻訳文「その国は、1962年のイギリスから
の独立後、選挙を開始した。」がCRT3等に出力され
る。 …ステップS4〜ステップS9
【0018】(B) 係り受け構造が複雑/曖昧な例文
の場合 単語間の係り受け構造が比較的複雑/曖昧な例文(ロ)
“After independence from 
the U.K.in 1962,the count
ry started election.”が入力さ
れたとする。そうすると、(A)の場合と同様に上記辞
書引き・形態素解析が実施された後、構文解析が実施さ
れる。そして、メモリ6に格納された文法規則(e),
文法規則(f),文法規則(i),文法規則(g),文
法規則(d)および文法規則(c)を用いて、例文(ロ
)の構文が 前置詞句+コンマ+平叙文 と解析される。また、図3から分かるように、メモリ6
には文頭に存在する前置詞句を処理する文法規則として
は文法規則(j)および文法規則(k)が格納されてい
る。この文法規則(j)は、前置詞句が分割用の前置詞
句である場合に適用可能である。また、文法規則(k)
は、コンマが分割用のコンマである場合に適用可能であ
る。ところが、例文(ロ)におけるコンマは分割用のコ
ンマであるか並列用等のコンマであるかが不明であるの
で、この場合には文法規則(j)および文法規則(k)
は適用されないのである。その結果、メモリ6には例文
(ロ)の上記構文に適用可能な文法規則が格納されてい
ないので、例文(ロ)に対する構文解析に失敗する。そ
こで、上記分割フラグの内容に“1”がセットされ、例
文(ロ)におけるコンマを分割用のコンマとする(すな
わち、例文(ロ)に最適な切れ目を自動的にセットする
)分割翻訳処理動作に入るのである。 …ステップS1〜ステップS4,ステップS10
【00
19】上記メモリ6に格納された切れ目ルールがルール
番号“1”の切れ目ルールから順次読み出されて、各切
れ目ルールを構成するサブルールと例文(ロ)とのマッ
チングが実行されるのである。 …ステップS11〜ステップS16 その結果、文頭に前置詞“After”があり、その前
置詞“After”以降にコンマがあり、そのコンマの
次の単語が冠詞“the”であるので、ルール番号“2
”の切れ目ルールの総てのサブルールの検索条件が成立
する。そこで、冠詞“the”の直前の形態素“,”の
位置に切れ目をセットするのである。 …ステップS13,ステップS14,ステップS17そ
の後、再度構文解析が実施される。その場合には、上記
分割フラグの内容に“1”がセットされているので文法
規則(j)および文法規則(k)が使用可能となるので
ある。再構文解析においては、まず、文法規則(e)お
よび文法規則(i)を用いて、句“After ind
ependence”が前置詞句であると構文解析され
る。ところが、この場合には、構文解析木を構成する末
尾の形態素“independence”と切れ目がセ
ットされた形態素“,”とが一致しないので、さらに構
文解析が繰り返される。そして、文法規則(e),文法
規則(f),文法規則(i)および文法規則(d)を用
いて、句“After independence f
rom the U.K.”が前置詞句であると構文解
析される。ところが、この場合にも構文解析木を構成す
る末尾の形態素“U.K.”と切れ目がセットされた形
態素“,”とが一致しないので、さらに構文解析が繰り
返される。そして、文法規則(e),文法規則(f),
文法規則(i),文法規則(d)および文法規則(k)
を用いて、句“After independence
 from the U.K.in 1962,”が文
であると構文解析される。ところが、この場合には構文
解析木を構成する末尾の形態素“,”と切れ目がセット
された形態素“,”とが一致するので、“After 
independence fromthe U.K.
in 1962,”の構文解析木が日本語の構文解析木
に変換され、日本語の文体として適切な助詞や助動詞が
付けられて日本語による翻訳文「1962年のイギリス
からの独立後に、」が上記バッファに格納される。すな
わち、通常の翻訳処理では文法解析に失敗する例文(ロ
)に切れ目ルールに従って最適な位置に切れ目を自動的
にセットすることによって、文頭からその切れ目までの
句のまとまりが正しい句のまとまりとして認識されて、
例文(ロ)の構文解析に成功するのである。 …ステップS3〜ステップS5,ステップS18,ステ
ップS6〜ステップS8,ステップS19
【0020】
また、例文(ロ)中には未翻訳の単語列“thecou
ntry started election.”があ
るので、形態素“,”にセットされた切れ目をリセット
して、再度分割翻訳処理動作を実行する。この場合には
、検索条件が成立する切れ目ルールはもはや存在しない
ので、文末“.”に切れ目がセットされるのである。そ
して、上述の場合と同様にして、句のまとまり“the
 country started election
.”における構文解析木を構成する末尾の形態素“.”
と切れ目がセットされた形態素“.”とが一致するまで
構文解析が繰り返される。 …ステップS20,ステップS21,ステップS11〜
ステップS17, ステップS3〜ステップS5,ステップS18その結果
、文法規則(f),文法規則(e),文法規則(g),
文法規則(c)および文法規則(a)を用いて句のまと
まり“thecountry started ele
ction.”が文であると構文解析される。そして、
この単語列“the country started
 election.”の構文解析木が日本語の構文解
析木に変換され、日本語の文体として適切な助詞や助動
詞が付けられて日本語による翻訳文 「その国は、選挙を開始した。」 が上記バッファに格納される。 …ステップS3〜ステップS5,ステップS18,ステ
ップS6〜ステップS8,ステップS19この後は、例
文(ロ)中に未翻訳の単語列は無いので、上記バッファ
に格納された日本語による2つの翻訳文が、「1962
年のイギリスからの独立の後に、‖その国は、選挙を開
始した。」のように“‖”を挟んで連なって、例文(ロ
)の日本語による翻訳文としてCRT3等に出力される
のである。 …ステップS20,ステップS22
【0021】上述のように、本実施例においては、人間
が経験的に持っている文の切れ目に関する知識に基づい
て検索開始位置,検索範囲,検索条件,処理,処理位置
およびキーの項目から成る切れ目ルールを作成して、メ
モリ6に格納しておく。そして、入力されたソース言語
の文の構文解析に失敗した場合には、切れ目セット部1
5で、総ての検索条件が成立するキーが存在するような
切れ目ルールをメモリ6から読み出す。そして、その切
れ目ルールの最終のサブルールに記述された処理を実行
して、上記処理位置に切れ目をセットするのである。そ
の結果、上記構文解析に失敗したソース言語の入力文は
、上記セットされた切れ目の位置を区切りとして、適切
な句のまとまりが正しく認識されるようになるのである
。 したがって、各句のまとまりの構文解析が可能となり、
各句のまとまり毎に正しくターゲット言語に翻訳できる
のである。
【0022】上記実施例においては、メモリ6に格納さ
れている文法規則を図3に示す文法規則(a)〜文法規
則(k)のみから成るとしている。しかしながら、これ
は説明を簡単にするためであり、実際には他の文法規則
を加えても何等差し支えない。この発明における切れ目
ルールの形式は図4に示すような形式に限定されるもの
ではない。要は、文の切れ目に関する人間の経験的な知
識をルール化したものであればよいのである。上記実施
例においては、切れ目ルール格納部をメモリ6で構成し
ているがメモリ6とは別に設けても何等差し支えない。 この発明における1文に係る翻訳処理動作のアルゴリズ
ムは上記実施例に限定されるものではない。上記実施例
においては、ソース言語を英語とする一方ターゲット言
語を日本語として説明しているが、この発明はこれに限
定されないことは言うまでもない。
【0023】
【発明の効果】以上より明らかなように、この発明の翻
訳装置は、切れ目ルールを格納した切れ目ルール格納部
,切れ目セット部および翻訳文格納部を有しており、入
力されたソース言語による文の構文解析に失敗した場合
には、上記切れ目セット部によって、上記切れ目ルール
に従って入力文の最適な位置に切れ目を自動的にセット
する。そのために、上記入力文は、セットされた切れ目
を区切りとして句のまとまりが正しく認識されて、入力
文を構成する各形態素の品詞や句に係る文法規則等の局
所的な情報を用いて構文解析が可能になる。したがって
、この発明によれば、単語間の係り受け構造が複雑/曖
昧な入力文であっても、局所的な情報に基づいてボトム
アップ的に構文解析を実施して、精度の高い翻訳文を得
ることができるのである。
【図面の簡単な説明】
【図1】この発明の翻訳装置における一実施例のブロッ
ク図である。
【図2】図1における翻訳モジュールのブロック図であ
る。
【図3】文法規則の内容を示す図である。
【図4】切れ目ルールの内容の一例を示す図である。
【図5】1文に係る翻訳処理動作のフローチャートであ
る。
【図6】図5に示す1文に係る翻訳処理動作のフローチ
ャートに続く1文に係る翻訳処理動作のフローチャート
である。
【符号の説明】
1…メインCPU、                
2…メインメモリ、 3…CRT、                   
   4…キーボード、5…翻訳モジュール、    
          6…メモリ、7…プリンタ、  
                  11…辞書引き
形態素解析部、 12…構文解析部、                
13…変換部、14…翻訳文生成部、        
      15…切れ目セット部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力されたソース言語による文をメモ
    リに格納された辞書を用いて辞書引き形態素解析部で形
    態素に分割して各形態素の品詞を得、この得られた各形
    態素の品詞に基づいて構文解析部で上記メモリに格納さ
    れた文法規則を用いて上記入力文の構文解析を行い、得
    られた構文解析結果を変換部でターゲット言語の構文に
    変換し、翻訳文生成部でターゲット言語による翻訳文を
    生成する翻訳装置において、文の切れ目に関する人間の
    経験的知識をルール化して得られた切れ目ルールを格納
    する切れ目ルール格納部と、上記構文解析部による構文
    解析が失敗か否かを判別すると共に、構文解析に失敗し
    た場合には、構文解析に失敗した入力文に対して上記切
    れ目ルールに従って適切な位置に切れ目をセットする切
    れ目セット部と、上記切れ目セット部によって入力文に
    切れ目がセットされた場合に、そのセットされた切れ目
    を区切りとして上記入力文を区切った際における句のま
    とまり毎に上記構文解析部,変換部および翻訳文生成部
    を介して得られたターゲット言語による翻訳文を、上記
    句のまとまり毎に格納する翻訳文格納部を備えたことを
    特徴とする翻訳装置。
JP3001494A 1991-01-10 1991-01-10 翻訳装置 Pending JPH04235672A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3001494A JPH04235672A (ja) 1991-01-10 1991-01-10 翻訳装置
US07/819,500 US5299124A (en) 1991-01-10 1992-01-10 Translation machine capable of analyzing syntactic of sentence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3001494A JPH04235672A (ja) 1991-01-10 1991-01-10 翻訳装置

Publications (1)

Publication Number Publication Date
JPH04235672A true JPH04235672A (ja) 1992-08-24

Family

ID=11503009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3001494A Pending JPH04235672A (ja) 1991-01-10 1991-01-10 翻訳装置

Country Status (2)

Country Link
US (1) US5299124A (ja)
JP (1) JPH04235672A (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JPH0728815A (ja) * 1993-02-18 1995-01-31 Matsushita Electric Ind Co Ltd 構文解析装置
JP2745370B2 (ja) * 1993-02-23 1998-04-28 日本アイ・ビー・エム株式会社 機械翻訳方法及び機械翻訳装置
EP0720106A3 (en) * 1994-12-28 1997-07-23 Canon Kk Device and method for generating natural language information from information defined by concepts
GB2300495A (en) * 1995-04-13 1996-11-06 Canon Kk Language processing
US5737617A (en) * 1995-06-06 1998-04-07 International Business Machines Corporation Method and system for English text analysis
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US5903858A (en) * 1995-06-23 1999-05-11 Saraki; Masashi Translation machine for editing a original text by rewriting the same and translating the rewrote one
US5819260A (en) * 1996-01-22 1998-10-06 Lexis-Nexis Phrase recognition method and apparatus
JP2001505330A (ja) * 1996-08-22 2001-04-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ テキストストリーム中の単語の切れ目を与える方法及び装置
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
US7672829B2 (en) * 1997-03-04 2010-03-02 Hiroshi Ishikura Pivot translation method and system
DE10009153A1 (de) * 2000-02-26 2001-09-13 Bosch Gmbh Robert Vorrichtung zur Bestimmung von zumindest einem Parameter eines strömenden Gas-Flüssigkeitsgemischs bzw. Verwendung eines Strömungsgleichrichters als Kondensationsfalle bzw. Verfahren zur Kondensierung einer Flüssigkeit
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
JP4330285B2 (ja) * 2001-04-16 2009-09-16 沖電気工業株式会社 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
US8028230B2 (en) * 2007-02-12 2011-09-27 Google Inc. Contextual input method
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229472A (ja) * 1986-03-31 1987-10-08 Toshiba Corp 機械翻訳システム
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
JPH02103662A (ja) * 1988-10-12 1990-04-16 Ricoh Co Ltd 文分割方式

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH0717153B2 (ja) * 1989-07-12 1995-03-01 マツダ株式会社 車両のドア構造

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229472A (ja) * 1986-03-31 1987-10-08 Toshiba Corp 機械翻訳システム
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
JPH02103662A (ja) * 1988-10-12 1990-04-16 Ricoh Co Ltd 文分割方式

Also Published As

Publication number Publication date
US5299124A (en) 1994-03-29

Similar Documents

Publication Publication Date Title
US5099425A (en) Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
JP3189186B2 (ja) パターンに基づく翻訳装置
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH04235672A (ja) 翻訳装置
JPS62163173A (ja) 機械翻訳方法
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JPH07282055A (ja) 文解析方法および装置
US5608623A (en) Special cooccurrence processing method and apparatus
JP2815714B2 (ja) 翻訳装置
JPH0261763A (ja) 機械翻訳装置
JPH0332106B2 (ja)
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JP3892227B2 (ja) 機械翻訳システム
JP4531325B2 (ja) 機械翻訳装置および機械翻訳方法
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH01166258A (ja) 機械翻訳装置
JPH0332105B2 (ja)
JP2004086919A (ja) 機械翻訳システム
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07141382A (ja) 外国語文書作成支援装置
JPH103477A (ja) 文書作成方法および文書作成装置
JPH05181854A (ja) 文章校正装置および文章処理装置、ならびに漢字仮名変換装置
JPH04335469A (ja) 翻訳装置
JPH04280369A (ja) 機械翻訳装置
JPH06332938A (ja) 自然言語解析装置および機械翻訳装置