JPH01112368A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH01112368A
JPH01112368A JP62271287A JP27128787A JPH01112368A JP H01112368 A JPH01112368 A JP H01112368A JP 62271287 A JP62271287 A JP 62271287A JP 27128787 A JP27128787 A JP 27128787A JP H01112368 A JPH01112368 A JP H01112368A
Authority
JP
Japan
Prior art keywords
mark
conversion
sentence
input
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62271287A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Sada
いち子 佐田
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62271287A priority Critical patent/JPH01112368A/ja
Priority to US07/262,313 priority patent/US5005127A/en
Priority to GB8825002A priority patent/GB2211639A/en
Publication of JPH01112368A publication Critical patent/JPH01112368A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上のモ1団1分IJI) > この発明は、入力された文章の任意の部分を原文のまま
翻訳文中に出力することができる機械翻訳装置に関する
〈従来の技術〉 従来、機械翻訳装置としては次のようなものがある。こ
の機械翻訳装置は、キーボードから入力されたソース言
語を、メインCPUの制御により翻訳モジュールに入力
し、この入力されたソース言語を、翻訳モジュールによ
ってメモリーに記憶されている辞書、文法規則および本
構造変換規則を利用、して、ターゲット言語に翻訳する
ものである。
〈発明が解決しようとする問題点〉 しかしながら、上記従来の機械翻訳装置によって翻訳を
行う場合、入力された文章の中にそのまま翻訳文中に出
力すべき数式が含まれている場合には、数式の各要素に
ついて解析処理が行われるため、翻訳に時間がかかり、
また、翻訳に失敗してしまう。そこで、予め数式の部分
を削除する等の処理を行う必要が有り、使用者にとって
は負担になるという問題がある。また、入力された文章
中の任意の部分を原文のまま翻訳文中に出力する場合に
も、そのままでは自動的に翻訳されてしまうという問題
がある。
そこで、この発明の目的は、入力原文の任意の部分をマ
ークによって無変換指定することにより、上記入力原文
の無変換指定部分を、正しく速やかに原文のまま翻訳文
中に出力できる機械翻訳装置を提供することにある。
(問題点を解決ずろための手段〉 上記目的を達成するため、この発明は、入力された文章
を辞書を用いて形態素に分割して品詞等の情報を得る形
態素解析部と、上記形態素解析部によって分割された形
態素列の構文を辞書と文法規則を用いて解析する構文解
析部と、上記構文解析部で得られた構文の構造を目標言
語における構文の構造に交換する変換部と、上記変換部
によって得られた目標言語の構文構造に従って翻訳文を
生成する翻訳文生成部を有する機械翻訳装置において、
入力される文章の任意の部分を原文のまま出力すること
を指定するために無変換指定開始マークおよび無変換指
定終了マークを入力するマーク入力手段と、取り込んだ
データが上記無変換指定開始マークあるいは上記無変換
指定終了マークであるか否かを判別するマーク判別手段
と、上記形態素解析部による辞書引き処理において、上
記マーク判′A11手段が取り込んだデータが無変換指
定開始マークであると判別した場合は、入力された文章
の無変換指定終了マークがある箇所まで辞書引き処理を
スキップすると)(に、上記無変換指定開始マークと無
変換指定終了マークとの間の形態素が、名λ51の複合
語であることを表わす特定情報を付与して、メモリに格
納する辞書引きスキップメモリ手段と、上記翻訳文生成
部による生成処理において、上記マーク判別手段が取り
込ん)こデータが無変換指定開始マークであると判別し
た場合は、無変換指定終了マークかある箇所まで生成処
理をスキップすると共に、入力された文章の無変換指定
開始マークと無変換指定終了マークとの間のソース言語
の単語を、そのまま訳語メモリに格納さ仕る生成スキッ
プメモリ手段を備えたことを特徴としている。
く作用〉 入力されろ文章の任きの部分に、この部分を原文のまま
翻訳文中に出力することを指定するために、マーク入力
手段から無変換指定開始マークおよび無変換指定終了マ
ークが入力される。
形態素解析部に上記無変換指定開始マークおよび無変換
指定終了マークが付与された交信が入力されると、この
入力された文章は上記形態素解析部によって形態素列に
分割される。その際に、マーク判別手段が、取り込んだ
データが無変換指定マークであると判別した場合は、辞
書引きスキップメモリ手段によって、入力された文章の
無変換指定終了マークがある箇所まで辞書引き処理がス
キップされると共に、上記無変換指定開始マークと無変
換指定終了マークとの間の形態素が名詞複合語であるこ
とを表わす情報が付与されてメモリに格納される。一方
、上記マーク判別手段か、取り込んだデータが無変換指
定開始マークでないと判別したときは、上記形態素解析
部によって分割された形態素の辞書引き処理が実行され
て品詞等の情報が得られ、上記メモリに格納されること
になる。
上記辞書引き処理によって得られた形態素の品詞等の情
報、または、名詞複合語であるという情報に基づいて、
構文解析部によって形態素列の構文の構造が決定され、
変換部によって目標言語における構文の構造に変換され
る。そして、翻訳文生成部によって上記目標言語の構文
構造に従って翻訳文が生成される。
その際の上記翻訳文生成部による生成処理において、上
記マーク判別手段が、取り込んだデータが無変換指定開
始マークであると判別した場合は、生成スキップメモリ
手段によって、無変換指定終了マークがある箇所まで生
成処理がスキップされると共に、入力された文章の無変
換指定開始マークと無変換指定終了マークとの間のソー
ス言語の単語が、そのまま訳語メモリに格納される。
したがって、入力文章における無変換指定開始マークと
無変換指定終了マークとの間の単語は、翻訳されずに原
文のまま翻訳文中に出力される。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の機械翻訳装置における一実施例のブ
ロック図である。1はメインCPUC中央処理装置)、
2はメインメモリー、3はCrtT(カソード・レイ・
チューブ)、4はキーボード、5は翻訳モジュール、6
は翻訳用の辞書1文法規則および木構造変換規則等を格
納しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲソI・言語を出力するものである
。すなわち、キーボード4から入力されたソース言語は
メインCPU Iの制御により翻訳モジュール5に送ら
れる。翻訳モジコール5はメモリー6に記憶されている
辞書1文法規則および本構造変換規則等を用いて、後に
詳述するようにして入力されたソース言語をターゲット
言語に翻訳する。その結果は、メインメモリー2に一旦
記憶されると共に、CrtT3に表示される。
翻訳モジュール5で行われる自動翻訳には、−数的に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL1の辞書引き、レ
ベルL、の形態素解析、レベルL、の構文解析、・・・
と、解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つにわ
けられる。1つは、レベルL8のソース言語およびター
ゲット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベル【21.の文脈生成
、レベルLllの意味生成、レベルし、の構文生成、レ
ベルIJILIの形態素生成と生成を進めて、ターゲッ
ト言語を生成していくピボット方式である。
らう一つは、上述のレベルI−2の形態素解析、レベル
L3の構文解析、レベルL4のα味解析およびレベルし
、の文脈解析のいずれかまで解析を行ってソース言語の
内部構造を得、次に、この得られたソース言1悟の内部
構造と同レベルのターゲット言語の内部構造に変換した
後、ターゲット言語を生成するトランスファ一方式であ
る。
ここで、上記各解析について説明する。
・辞書引き、形態素解析 一部1図に示すメモリー6の辞書を 引き、入力された文??[を各形態素 列(単語列)に分割し、この各単語 に対する品品1などの文法情報およ び訳語を得、さらに、時制・人称 ・数などを解111する。
・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解 折本)を決定ケろ。
・意味解析−複数の構文解析の結果から0味的に正しい
ものとそうでないしのを 判別する。
・文脈解析−話題を理解し、省略やあい味さを取り去る
この発明で用いろ海1訳モジュール5は、少なくともレ
ベルL3の構文解析のレベルまでの解析を行うものとす
る。すなわち、本実施例の翻訳モジュール5は第3図の
ような部分からなる翻訳モジュールを煮える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図はrThis is a pen、
Jという英文を日本語に翻訳する場合の、第4図に示す
各バッファA−Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに格納される。翻訳プログラム16に基づく
翻訳CPU15の制御の下に、第3図の辞書引き形態素
解析部11により1、バッファ八に格納された原文に従
ってメモリー6の辞書を用いて各単語の必要な情報が得
られ、第4図のバッファ已に格納される。例えば、その
各情報の一部である品詞情報は、第6図のように格納さ
れる。
ここで、thiSは多品&1 語であるが、次の第3図
の構文解析部12により一意に決定される。構文解析部
12ではメモリー6の辞書と文法規則にしたかって、各
単語間の係り受は関係を示す構造解析木が第7図に示す
ように決定されて、第4図のバッファCに格納される。
この構造解析木は、次のようにして決定される。すなわ
ち、メモリー6の文法規則から 文−主部、述部 主部→名詞句 述部→動詞3芯詞句 名詞句−代名詞 名詞句−冠詞5乞詞 の規則が得られる。この規[円は、例えば、1つ目の規
則は“文とは、主部と述部からできている”ということ
を表わす。以下、この規則にしたかって構造解析木が決
定されるのである。
第3図の変換部13では、上述の措文解析部同様、メモ
リー6の本構造変換規則を用いて、入力された英文に対
する措文解析本(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッファDに格納される。第3図の
翻訳文生成部14は、得られた日本文字「これペンであ
る。」に適切な助詞「は」や助動詞をつけて、第9図の
ような日本語の形にして、第4図のバッファEに格納す
る。この日本文[これはペンである。」は、翻訳モジュ
ール5から出力され、メインメモリー2に格納されると
共に、C11’r3に表示される。
上記翻訳処理動作において、入力されtこ原文を辞書引
き形態素解析部2によって形態素(単語)に分割し、辞
書を引いて品詞等の必要な情報を得る際に、無変換指定
開始マークが読み取られると、無変換指定終了マークが
読み取られるまでの単語の辞g5引き処理を実行しない
ようにする。以下、辞書引き形@素解析部11の辞書引
き処理動作を、第10図のフローヂャ−1・に従って説
明する。
ステップS、で、入力された文章の辞書引き形態素解析
部11によって解析される位置を指示するポインタが、
入力文章の先頭の単語にセットされる。
ステップS、で、読み込まれたデータが無変換指定開始
マークか否かが判別される。その結果、無変換指定開始
マークであればステップS3に進み、そうでなければス
テップS4に進む。
ステップS3で、入力された文章の無変換指定終了マー
クがある箇所まで辞書引き処理がスキップされると共に
、上記無変換指定開始マークと無変換指定終了マークと
の間の単語に対応する第4図のバッファBのアドレスに
、“名詞の複合語”の情報が格納される。こうすること
により、後に実行される構文解析処理においては、無変
換指定開始マークと無変換指定終了マークとの間の部分
を普通の名詞複合語として扱うことができるので、通常
の構文解析処理を行えばよい。
ステップS、で、通常の辞書引き処理か実行されて、得
られた品詞等の情報か上記バッファBに格納される。
ステップS、で、全ての単語について辞書引き処理が終
了したか否かが判別される。その結果、まだ、辞書引き
処理を行っていない単語があればステップS2に戻り、
そうでなければ、辞書引き処理動作を終了する。
また、上述の翻訳処理動作において、翻訳文生成部14
によって、正しい日本語を生成する際に、無変換指定開
始マークが読み取られると、無変換指定終了マークが読
み取られるまで生成処理を実行U・ずに、その間だけ入
力原文の無変換指定開始マークと無変換指定終了マーク
との間の単語を原文のまま出力して、第4図のバッファ
Eに格納する。以下、翻訳文生成部14の生成処理動作
を、第11図のフローヂャートに従って説明する。
ステップS I+で、読み込まれたデータが無変換指定
開始マークか否かが判別される。その結果、無変換指定
開始マークであればステップS1.に進み、そうでなけ
ればステップS++に進む。
ステップ5lffiで、無変換指定終了マークがある箇
所まで生成処理がスキップされると共に、入力された文
章の無変換指定開始マークと無変換指定終了マークとの
間のソース言語の単語がそのまま第4図のバッファEの
所定のアドレスに格納される。
ステップS 11で、翻訳文生成部14によって上述の
通常の生成処理が実行され、正しい翻訳文が生成されて
上記バッファEに格納される。
ステップS14で、生成処理動作が終了したか否かが判
別される。その結果、まだ終了していなければステップ
S 11に戻り、そうでなければ生成処理動作を終了す
る。
第12図は、本実施例の機械翻訳装置に入力した英文と
、この機械翻訳装置から出力された日本文の例である。
この例文においては、無変換指定開始マークとして“(
(”を使用し、無変換指定終了マークとして“))”を
使用している。
このように、本実施例において入力英文を日本文に翻訳
する際に、入力英文中に原文のまま出力すべき部分があ
る場合に、予めその部分の前後に無変換指定開始マーク
または無変換指定終了マークを入力し、辞書引き形態素
解析部11による辞書引き処理においては、上記開始、
終了マーク間の単語の辞書引き処理を実行せず、開始、
終了マーク間の単語が“名詞の複合語”である情報をバ
ッファBに格納するようにする。一方、翻訳文生成部1
4による生成処理においては、上記無変換指定開始、終
了マーク間の生成処理を実行せず、その間だけ入力文の
上記開始、終了マーク間の単語をへR文のまま出力して
バッファE1.:格納するので、入力される文章中の上
記無変換指定開始マークと無変換指定終了マークとで指
定された部分を、翻訳Uずに原文のまま翻訳文中に出力
することができる。
」二足実施例では、入力文の無変換部分の指定を無変換
指定開始マークと無変換指定終了マークの2種類のマー
クを使用して行っているが、1種類の無変換指定マーク
のみを使用して、1回目の無変換指定マークを無変換指
定開始マークとし、2回1]の無変換指定マークを無変
換指定終了マークとしてもよい。
〈発明の効果〉 以上より明らかなように、この発明は、形態水解(バ部
、構文解り〒部、変換部および翻訳文生成部を何した機
械翻訳装置に、入力文の任はの部分を原文のまま出力オ
ることを指定する無変換指定開始マークおよび無変換指
定終了マークを入力するマーク入力手段と、マーク判別
手段と、辞書引きスキップメモリ手段と、生成スキップ
メモリ手段を設けて、上記形態素解析部による辞書引き
処理においては、取り込んだデータが無変換指定開始マ
ークである場合は、無変換指定終了マークを取り込むま
で辞書引き処理をスキップし、上記無変換指定開始、終
了両マーク間の形態素が名詞の複合語であることを表わ
す特定情報を付与して、メモリに格納する一方、上記翻
訳文生成部による生成処理においては、取り込んだデー
タが無変換指定開始マークである場合は、無変換指定終
了マークがある箇所まで生成処理をスキップし、入力文
の上記無変換指定開始、終了両マーク間のソース言語の
単語を、そのまま訳語メモリに格納するものである。
したがって、この発明によれば、入力文の任意の部分を
原文のまま翻訳文中に出力する場合、予めその部分を削
除する必要がなく、正しく速やかに入力文の任色部分を
原文のまま翻訳文中に出力することができる。
【図面の簡単な説明】
第1図はこの発明の機械翻訳装置の一実施例のブロック
図、第2図は自動翻訳における翻訳レベルの説明図、第
3図は上記実施例における翻訳モジュールの作用構成図
、第4図は上記翻訳モジュールのブロック図、第5図〜
第9図は第4図における各バッファの内容例を示す図、
第1O図は辞書引き処理のフローチャート、第11図は
生成処理のフローチャート、第12図は第1図の機械翻
訳装置への入力文例と、それに対する出力文(翻訳文)
例を示す図である。 l・・メインCPU、2・・メインメモリー、3・・C
IN T 、     4・・・キーボード、5・・・
翻訳モジュール、6・・・メモリー、11・・・辞書引
き形態素解析部、12・・・構文解析部、I3・・・変
換部、   14・・・翻訳文生成部、15・・翻訳c
pu、16・・翻訳プログラム、A−E・・・バッファ
。 第5面 例文 (This  is  a  pen、トバッ7
アA−一一一原文八−lファ 第6図 第7図 、 ハ+777C−−−−41文解Fr(吉果のベーI
)7文 第8面 、バ5、t 77 [)−−−一木変埃した紹果のバッ
ファ文 これ  ペン  マ・ある 第9図 第1O図

Claims (1)

    【特許請求の範囲】
  1. (1)入力された文章を辞書を用いて形態素に分割して
    品詞等の情報を得る形態素解析部と、上記形態素解析部
    によって分割された形態素列の構文を辞書と文法規則を
    用いて解析する構文解析部と、上記構文解析部で得られ
    た構文の構造を目標言語における構文の構造に交換する
    変換部と、上記変換部によって得られた目標言語の構文
    構造に従って翻訳文を生成する翻訳文生成部を有する機
    械翻訳装置において、 入力される文章の任意の部分を原文のまま出力すること
    を指定するために無変換指定開始マークおよび無変換指
    定終了マークを入力するマーク入力手段と、 取り込んだデータが上記無変換指定開始マークあるいは
    上記無変換指定終了マークであるか否かを判別するマー
    ク判別手段と、 上記形態素解析部による辞書引き処理において、上記マ
    ーク判別手段が、取り込んだデータが無変換指定開始マ
    ークであると判別した場合は、入力された文章の無変換
    指定終了マークがある箇所まで辞書引き処理をスキップ
    すると共に、上記無変換指定開始マークと無変換指定終
    了マークとの間の形態素が、名詞の複合語であることを
    表わす特定情報を付与して、メモリに格納する辞書引き
    スキップメモリ手段と、 上記翻訳文生成部による生成処理において、上記マーク
    判別手段が、取り込んだデータが無変換指定開始マーク
    であると判別した場合は、無変換指定終了マークがある
    箇所まで生成処理をスキップすると共に、入力された文
    章の無変換指定開始マークと無変換指定終了マークとの
    間のソース言語の単語を、そのまま訳語メモリに格納さ
    せる生成スキップメモリ手段を備えたことを特徴とする
    機械翻訳装置。
JP62271287A 1987-10-26 1987-10-26 機械翻訳装置 Pending JPH01112368A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62271287A JPH01112368A (ja) 1987-10-26 1987-10-26 機械翻訳装置
US07/262,313 US5005127A (en) 1987-10-26 1988-10-25 System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
GB8825002A GB2211639A (en) 1987-10-26 1988-10-26 Machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62271287A JPH01112368A (ja) 1987-10-26 1987-10-26 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH01112368A true JPH01112368A (ja) 1989-05-01

Family

ID=17497958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62271287A Pending JPH01112368A (ja) 1987-10-26 1987-10-26 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH01112368A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03222065A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS62203268A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS62203268A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03222065A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
EP0357370A2 (en) Computer assisted language translating machine
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JPH03222065A (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JPH08190562A (ja) 機械翻訳装置
JP2715419B2 (ja) 翻訳装置
JPH0410665B2 (ja)
JPS63136265A (ja) 機械翻訳装置
JPH01112367A (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JPH0439109B2 (ja)
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH01166258A (ja) 機械翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JPS6190268A (ja) 翻訳方式
JPS61134866A (ja) 日本語解析装置
JPH04313158A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH01245358A (ja) 機械翻訳装置