JPH01112367A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH01112367A
JPH01112367A JP62271286A JP27128687A JPH01112367A JP H01112367 A JPH01112367 A JP H01112367A JP 62271286 A JP62271286 A JP 62271286A JP 27128687 A JP27128687 A JP 27128687A JP H01112367 A JPH01112367 A JP H01112367A
Authority
JP
Japan
Prior art keywords
sentence
beginning
analysis unit
translation
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62271286A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Sada
いち子 佐田
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62271286A priority Critical patent/JPH01112367A/ja
Priority to US07/262,314 priority patent/US4931936A/en
Priority to GB8825003A priority patent/GB2211640A/en
Publication of JPH01112367A publication Critical patent/JPH01112367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、文章の先頭に番号が現れる箇条古文を翻訳
することができる機械翻訳装置に関する。
〈従来の技術〉 従来、機械翻訳装置としては次のようなものがある。こ
の機械翻訳装置は、キーボードから入力されたソース言
語を、メインCP Uの制御により翻訳モジュールに入
力し、この入力されたソース言語を、翻訳モジュールに
よってメモリーに記憶されている辞書、文法規則および
木構造変換規則を利用して、ターゲット言語に翻訳する
しのである。
その際に、文章の先頭に番号が現れる箇条古文を翻訳す
る場合には、そのままでは翻訳に失敗してしまうため、
予め人手によって番号の部分を削除する処理を行なった
後に機械翻訳装置で翻゛訳を行なっている。
〈発明が解決しようとする問題点〉 しかしながら、上記従来の機械翻訳装置で翻訳する場合
は、文章の先頭に番号が現われる箇条古文を翻訳する場
合、例えば、上記番号を表イっしている数字が基数であ
るか序数にhjであるかの区別ができない等の理由によ
って、そのままでは翻訳に失敗してしまうため、予め人
手によって番号の部分を削除する処理を行なう必要があ
り、操作者にとって負担になるという問題がある。
そこで、この発明の目的は、文へ中の最初に出てくる形
態素が番号であるか否かを判別ずろことによって、文学
の先頭に番号が表われる箇条古文を、正しく速やかに翻
訳することを可能にする機械翻訳装置を提供することに
ある。
〈問題点を解決するための手段〉 上記目的を達成するため、この発明は、入力された文章
を辞書を用いて形態素に分割して品詞等を解析ずろ形態
素解析部と、上記形態素解析部によって分割された形態
素列の構文を辞書と文法規IIIを用いて解析する構文
解析部と、上記構文解析部で得られた構文の構造を目標
言語における構文の構造に交換する変換部と、」−記変
換部によって得られた目標言語の措文+M造に従って翻
訳文を生成する翻訳文生成部を有する機械翻訳装置にお
いて、」二記形態素解析部において分割された文章中に
最初に出てくる形態素が番号であるか否かを判別する番
号判別手段と、上記番号判別手段が、最初に出てくる形
態素が番号であると′Fi+別した場合には、目標言語
に変換された上記文章の先頭に上記番号をそのまま付加
するために、上記番号は文頭の副詞であるという情報を
ストアさせろメモリ制御手段とを備えたことを特徴とし
ている。
〈作用〉 入力された文章は形態素解析部によって形態素列に分割
され、この分割された形態素が文章中に最初に出てくる
番号であるか否かが、番号判別手段によって判別される
。その結果、番号であると判別された場合には、」二足
番号は文頭の副詞であるという情報がメモリ制御手段に
よってストアされて、この番号に対して品詞解析等のた
めの辞書引き処理が行なわれない。一方、文章中に最初
に出てくる形態素が番号でないと判別された場合には、
品詞解析等のための辞書引き処理が行なわれるφことに
なる。
上記形態素に分割されて、辞書引き処理によって得られ
た形態素の品詞等の情報、または、ストアされている文
頭の副詞であるという情報に基づいて、構文解析部によ
って構文の構造が決定され、変換部によって目標言語に
おける構文の構造に変換され、翻訳文生成部によって上
記目標言語の構文構造に従って翻訳文が生成される。
このように、文頭の番号に対して辞書引き処理を行わな
いので、例えば読み込んだ数字が基数であるか序数詞で
あるかの判別ができないということがなく、文章の先頭
に番号が表イつれる箇条古文を正しく速やかに翻訳する
ことができる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の機械翻訳装置におけろ一実施例のブ
ロック図である。1はメインCPU(中央処理装置)、
2はメインメモリー、3はC11’r(カソード・レイ
・チューブ)、11はキーボード、5は翻訳モジュール
、6は翻訳用の辞書1文法規則および木構造変換規則等
を格納しているメモリーである。
上記翻訳モジュール5は、ソース言語が人力されると、
それを翻訳してターゲット言語を出ノJするしのである
。すなわち、キーボード4から人力されたソース言語は
メインCI) (J Iの制御により翻訳モジュール5
に送られる。翻訳モジュール5はメモリー6に記憶され
ている辞書1文法規則および木構造変換規則等を用いて
、後に詳述するようにして入)Jされたソース言語をタ
ーゲット言語に翻訳する。その結果は、メインメモリー
2に一旦記憶されると共に、CIt i” 3に表示さ
れる。
翻訳モジュール5で行われる自動翻訳には、−数的に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL 、の辞書引き、
レベルL2の形態素解析、レベルL3の構文解析、・・
・と、解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つにわ
けられる。1つは、レベルL。のソース言語およびター
ゲット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL ’rの文脈生成
、レベルL、の意味生成、レベルし、の構文生成、レベ
ルLIOの形態素生成と生成を進めて、ターゲット言語
を生成していくピボット方式である。
もう一つは、上述のレベルし、の形態素解析、レベルL
3の構文解析、レベルL、の意味解析およびレベルI−
5の文脈解析のいずれかまで解析を行ってソース言語の
内部構造を得、次に、この得られたソース言語の内部構
造と同レベルのターゲット言語の内部構造に変換した後
、ターゲット言語を生成するトランスファ一方式である
ここで、上記各解析について説明する。
・辞書引き、形態素解析 一部1図に示すメモリー6の辞書を 引き、人力された文章を各形態素 列(単語列)に分割し、この各単語 に対する品詞などの文法情報およ び訳語を得、さらに、時制・人称 ・数などを解析する。
・h’6文解析−後述するようにして単語間の係り受け
なとの、文章の(1り造(構造解 析木)を決定する。
・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを 判別する。
・文脈解析−話題を理解し、省略やあい味さを取り去る
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図はr’l’his is a pe
n、Jという英文を日本語に翻訳する場合の、第4図に
示す各バッファ八〜Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに格納される。翻訳プログラム16に基ツく
翻訳CI) U I 5の制御の下に、第3図の辞書引
き形態素解析部11により、バッファAに格納された原
文に従ってメモリー6の辞書を用いて各単語の必要な情
報が得られ、第4図のバッファBに洛納される。例えば
、その各情報の一部である品詞情報は、第6図のように
格納される。
ここで、thisは多品詞語であるが、次の第3図の構
文解析部12により一意に決定される。構文解析部12
ではメモリー6の辞書と文法規則にしたがって、各単語
間の係り受は関係を示す構造解析木か第7図に示すよう
に決定されて、第4図のバッファCに格納される。この
構造解析木は、次のようにして決定される。すなわち、
メモリー6の文を実現1円から 文−よ(1<、述部 主部→名詞句 述部−動詞1名詞句 名詞句−代名詞 名詞句一冠洞1名詞 の規則が得られる、この規則は、例えば、1つ目の規則
は“文とは、主部と述部からできている”ということを
表わす。以下、この規1世にしたかって構造解析木が決
定されるのである。
第3図の変換部13では、上述の構文解析部同様、メモ
リー6の本構造変換規則を用いて、人力された英文に対
する構文解析木(第7図参照)の+1■造が、第8図に
示すように日本文に対する+14造に変換される。そし
て、得られた結果が第4図のバッファDに格納される。
第3図の翻訳文生成部14は、得られた日本文字「これ
ペンである。」に適切な助詞「は」や助動詞をつけて、
第9図のような日本語の形にして、第4図のバッファE
に格納する。この日本文「これはペンである。」は、翻
訳モジュール5から出力され、メインメモリー2に洛納
されろと共に、C111” 3に表示される。
上記翻訳処理動作において、読み込まれた原文を辞書引
き形態素解析部11によって形態素(単語)に分割し、
辞書を引いて品詞等の必要な情報を得る際に、箇条書き
文が読み込まれると、その箇条古き文の先頭に表われる
番号を判別して、その番号の辞書引き処理を実行しない
ようにする。
以下、辞書引き形態素解析部11の辞書引き処理動作を
、第1O図のフローヂャートに従って説明する。
ステップS、で、読み込まれた単語が、文章中の1番目
の単語であり、かつ、番号であるか否かが判別される。
その結果、1番目の単語で番号であればステップS、に
進み、そうでなければステップ8つに進む。ここで、番
号であるか否かの判別は次のようにして行う。すなわち
、1.のように数字の後にピリオドがある場合、または
、(1)のように括弧内に数字がある場合に番号と判別
するのである。
ステップS2で、上記ステップS、で番号であると判別
された1番目の単語に対応する第4図のバッファBのア
ダレスに、“文頭の副詞“の情報を格納する。
ステップS、で、読み込まれた次の単語が2番目の単語
であり、かつ、1番口の単語が番号であるか否かが判別
される。その結果、2番目の単語であり1番目の単語が
番号であればステップS。
に進み、そうでなければステップS5に進む。
ステップS4で、2番目の単語を1番目の単語とみなし
て、文頭の単語と同様の辞書引き処理を実行する。すな
わち、単語の先頭の文字が大文字の場合には、小文字に
変換してから辞書引き処理を実行するのである。そして
、得られた品詞等の情報が第4図のバッファBに格納さ
れる。
ステップS、で、通常の辞書引き処理が実行されて、得
られた品詞等の情報が上記バッファBに格納される。
ステップS6で、全ての単語について辞書引き処理が終
了したか否かが判別されろ。その結果、まだ、辞書引き
処理を行っていない単語があればステップS1に戻り、
そうでなければ辞書引き処理動作を終了する。
以上の処理を行うことにより、以後は通常の構文解析、
変換処理および生成処理の翻訳処理を行えばよい、そう
すると、入力された文章の先頭の番号は翻訳文でも先頭
に出力される。
第11図は、本実施例の機械翻訳装置に入力した英文と
、この機械翻訳装置から出力された日本文の例であり、
入力文の先頭の番号2.は出力文においてら先頭に出力
されている。
このように、本実施例において入力英文を日本文に翻訳
する際に、入力英文中に文章の先頭に番号が現われる箇
条古文が存在する場合、この先頭の番号は“文頭の副詞
”であるという情報をバッファBに格納し、2番目の単
語を先頭の単語とみなして辞書引き処理を実行するので
、入力文の先頭の番号は、出力文において乙先頭の番号
として出ツノされ、箇条書き文を正しく速やかに翻訳す
ることが可能となる。
〈発明の効果〉 以上より明らかなように、この発明は、形態素解析部、
構文解析部、変換部および翻訳文生成部を有した機械翻
訳装置に、番号判別手段とメモリ制御手段を設けて、上
記番号判別手段が、最初に出てくる形態素が番号である
と判別した場合には、上記メモリ制御手段によって、」
二足番号は文頭の副詞であるという情報をストアするよ
うにしたので、文章の先頭に番号が表われる箇条古文を
翻訳する場合、予め番号の部分を削除ずろ必要がなく、
正しく速やかに翻訳することができる。
【図面の簡単な説明】
第1図はこの発明の機械翻訳装置の一実施例のブロック
図、第2図は自動翻訳における翻訳レベルの説明図、第
3図は上記実施例における翻訳モジュールの作用構成図
、第4図は上記翻訳モジュールのブロック図、第5図〜
第9図は第4図における各バッファの内容例を示す図、
第10図は辞書引き処理のフローヂャート、第11図は
第1図の機械翻訳装置への入力文例と、それに対する出
力文(rIA訳文)例を示す図である。 1・・・メインCPU、2・・・メインメモリー、3−
CR1’ 、     4−・・キーボード、5・・・
翻訳モジュール、6・・メモリー、11・・・辞書引き
形態素解析部、!2・・・構文解析部、13・・変換部
、   14・・・翻訳文生成部、15・・・翻訳CP
U、+6・・・翻訳プログラム、A−E・・バッファ。 特許出願人  ンヤーブ株式会社 代理人 弁理士  青 山 葆 ほか2名第5区 例文 (This  is  a  pen、1第6■ 第7図 、t(−y 77 C−−−−’X文MFrtMKのべ
”/)7を 第8図 、パ゛、7フ7D−−−一木変埃した紹果のバッファ文 これ  ペン  マ・ある 第9ズ 第1θ図 第11図

Claims (1)

    【特許請求の範囲】
  1. (1)入力された文章を辞書を用いて形態素に分割して
    、品詞等を解析する形態素解析部と、上記形態素解析部
    によって分割された形態素列の構文を辞書と文法規則を
    用いて解析する構文解析部と、上記構文解析部で得られ
    た構文の構造を目標言語における構文の構造に交換する
    変換部と、上記変換部によって得られた目標言語の構文
    構造に従って翻訳文を生成する翻訳文生成部を有する機
    械翻訳装置において、 上記形態素解析部において分割された文章中に最初に出
    てくる形態素が番号であるか否かを判別する番号判別手
    段と、 上記番号判別手段が、最初に出てくる形態素が番号であ
    ると判別した場合には、目標言語に変換された上記文章
    の先頭に上記番号をそのまま付加するために、上記番号
    は文頭の副詞であるという情報をストアさせるメモリ制
    御手段とを備えたことを特徴とする機械翻訳装置。
JP62271286A 1987-10-26 1987-10-26 機械翻訳装置 Pending JPH01112367A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62271286A JPH01112367A (ja) 1987-10-26 1987-10-26 機械翻訳装置
US07/262,314 US4931936A (en) 1987-10-26 1988-10-25 Language translation system with means to distinguish between phrases and sentence and number discrminating means
GB8825003A GB2211640A (en) 1987-10-26 1988-10-26 Machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62271286A JPH01112367A (ja) 1987-10-26 1987-10-26 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH01112367A true JPH01112367A (ja) 1989-05-01

Family

ID=17497945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62271286A Pending JPH01112367A (ja) 1987-10-26 1987-10-26 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH01112367A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0481918A (ja) * 1990-07-25 1992-03-16 Sharp Corp キー入力装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0481918A (ja) * 1990-07-25 1992-03-16 Sharp Corp キー入力装置

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
US5001633A (en) Computer assisted language translating machine with sentence extracting function
JP2815714B2 (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JPS6180362A (ja) 翻訳装置
JPS6190269A (ja) 翻訳方式
JPH01112367A (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPS63136265A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPS6190268A (ja) 翻訳方式
JPH01166258A (ja) 機械翻訳装置
JPH03214355A (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPS63136268A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH05158971A (ja) 機械翻訳装置
JPH10143515A (ja) 機械翻訳装置及び機械翻訳方法