JPH0719260B2 - 機械翻訳装置におけるハイフン合成語処理方法 - Google Patents

機械翻訳装置におけるハイフン合成語処理方法

Info

Publication number
JPH0719260B2
JPH0719260B2 JP1104237A JP10423789A JPH0719260B2 JP H0719260 B2 JPH0719260 B2 JP H0719260B2 JP 1104237 A JP1104237 A JP 1104237A JP 10423789 A JP10423789 A JP 10423789A JP H0719260 B2 JPH0719260 B2 JP H0719260B2
Authority
JP
Japan
Prior art keywords
hyphen
word
compound word
dictionary
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1104237A
Other languages
English (en)
Other versions
JPH02281374A (ja
Inventor
秀造 釘宮
陽士 福持
いち子 中村
徳行 平井
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1104237A priority Critical patent/JPH0719260B2/ja
Priority to US07/513,254 priority patent/US5065318A/en
Priority to EP90304350A priority patent/EP0398513B1/en
Priority to DE69025091T priority patent/DE69025091T2/de
Publication of JPH02281374A publication Critical patent/JPH02281374A/ja
Publication of JPH0719260B2 publication Critical patent/JPH0719260B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は機械翻訳装置のハイフン合成語処理方法に関す
るものである。
<従来技術> 従来の機械翻訳装置において、入力された文章中にハイ
フンで合成された合成語が含まれている場合は、ハイフ
ン合成語が辞書に含まれていないため名詞として処理さ
れ、該合成語をハイフン前後で分割し、ハイフン前とハ
イフン後の単語毎に辞書引きして夫々の訳語を生成し、
該訳語を単に並べて出力していた。
又、別の方法として使用者が予めユーザー辞書にハイフ
ン合成語を登録しておき、該合成語を翻訳する際には前
記ユーザー辞書を参照させる方法があった。
<発明が解決しようとする課題> 上述したように上記機械翻訳装置では入力されたハイフ
ン合成語に対して辞書に含まれていなければ名詞として
処理を行う。それ故、例えばハイフンによって名詞と現
在分詞或いは名詞と過去分詞が合成され、形容詞句とな
るハイフン合成語に対しては、翻訳に失敗して誤まった
結果を出すか、原語のまま出力して正しい翻訳結果が得
られなかった。
一方、ハイフン合成語をユーザー辞書に予め登録してお
けば正しい翻訳結果が得られるものの、この場合使用者
に登録作業の負担がかかり、又出現する合成語の全てを
推測して漏らさずユーザー辞書に登録することは非常に
困難であった。
そこで本発明の目的は、機械翻訳装置において予め辞書
登録しなくてもハイフンによって名詞と現在分詞或いは
名詞と過去分詞が合成されたハイフン合成語を正しく翻
訳できるハイフン合成語処理方法を提供することにあ
る。
<課題を解決するための手段> 本発明は、上記目的を達成するために、 入力された文章中の各単語を辞書引きし、該辞書引き情
報から前記入力文章の形態素列を得る辞書引き形態素解
析部と、 該辞書引き形態素解析部によって得られた形態素列の構
文を辞書と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、 前記辞書引き形態素解析部は、入力された文章中にハイ
フンによって合成されたハイフン合成語があれば、該合
成語をハイフン前後の単語に分割して該分割された2つ
の単語に対して夫々辞書引きを行い、得られた辞書引き
情報を前記合成語に対応させて保持し、 更に前記辞書引きの結果前記合成語の分割されたハイフ
ン前の単語が名詞であり、且つハイフン後の単語が現在
分詞又は過去分詞である場合は、前記合成語に対応させ
て保持した前記辞書引き情報に基づいて、前記ハイフン
前後の単語の順番を置き換えて翻訳を行い、該翻訳結果
を前記合成語に対応させて保持し、 前記翻訳文生成部は、当該翻訳結果を前記合成語の訳語
として出力するものである。
<作 用> 本発明によれば、辞書引き形態素解析部は入力された任
意の文章中にハイフンで合成された合成語があれば該合
成語をハイフン前後の単語に分割して夫々の単語に対し
て辞書引きを行い、得られた情報を前記合成語に対応さ
せて保持する。
そして、上記辞書引きの結果、前記合成語のハイフン前
の単語が名詞でハイフン後の単語が現在分詞或いは過去
分詞であれば、前記合成語に対応させて保持した前記辞
書引き情報に基づいて、前記ハイフン前後の単語の順番
を置き換えて翻訳を行い、該翻訳結果を前記合成語に対
応させて保持する。
翻訳文生成部は前記合成語の訳語を生成する際には前記
辞書引き部が前記合成語に対応して保持する前記翻訳結
果を読み出して訳語を生成する。
<実施例> 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明を適用する機械翻訳装置における一実
施例のブロック図である。1はメインCPU(中央処理装
置)、2はメインメモリー、3はCRT(カソード・レイ
・チューブ)、4はキーボード、5は翻訳モジュール、
6は翻訳用の辞書、文法規則および木構造変換規則等を
格納しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲット言語を出力するものである。
すなわち、キーボード4から入力されたソース言語はメ
インCPU1の制御により翻訳モジュール5に送られる。翻
訳モジュール5は、メモリー6に記憶されている辞書、
文法規則および木構造変換規則等を用いて、後に詳述す
るようにして入力されたソース言語をターゲット言語に
翻訳する。その結果は、メインメモリー2に一旦記憶さ
れると共に、CRT3に表示される。
翻訳モジュール5で行われる機械翻訳には、一般的に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL1の辞書引き、レベ
ルL2の形態素解析、レベルL3の構文解析、…と、解析が
進められる。
機械翻訳はこの解析レベルにより、大きく次の2つに分
けられる。1つは、レベルL6のソース言語およびターゲ
ット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レベ
ルL8の意味生成、レベルL9の構成生成、レベルL10の形
態素生成と生成を進めて、ターゲット言語を生成してい
くピボット方式である。
もう一つは、上述のレベルL2の形態素解析、レベルL3の
構文解析、レベルL4の意味解析およびL5の文脈解析のい
ずれかまで解析を行ってソース言語の内部構造を得、次
に、この得られたソース言語の内部構造と同レベルのタ
ーゲット言語の内部構造に変換した後、ターゲット言語
を生成するトランスファー方式である。
ここで、上記各解析について説明する。
・辞書引き、形態素解析−第1図に示すメモリー6の辞
書を引き、入力された文章を各形態素列(単語列)に分
割し、この各単語に対する品詞などの文法情報および訳
語を得、さらに、時制・人称・数などを解析する。
・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解析木)を決定する。
・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを判別する。
・文脈解析−話題を理解し、省略やある昧さを取り去
る。
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベルまでの解析を行うものとする。
すなわち、本実施例の翻訳モジュール5は第3図のよう
な部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図は「This is a pen.」という英文を
日本語に翻訳する場合の、第4図に示す各バッファA〜
Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに格納される。翻訳プログラム16に基づく翻
訳CPU15の制御の下で、第3図の辞書引き形態素解析部1
1により、バッファAに格納された原文に従ってメモリ
ー6の辞書を用いて各単語の必要な情報が得られ、第4
図のバッファBに格納される。ここで、Thisは多品詞語
であるが、次の第3図の構成解析部12により一意に決定
される。構文解析部12ではメモリー6の辞書と文法規則
にしたがって、各単語間の係り受け関係を示す構造解析
木が第7図に示すように決定されて、第4図のバッファ
Cに格納される。この構造解析木は、次のようにして決
定される。すなわち、メモリー6の文法規則から 文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 の規則が得られる。この規則は、例えば、1つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。
第3図の変換部13では、上述の構文解析部同様、メモリ
ー6の木構造変換規則を用いて、入力された英文に対す
る構文解析木(第7図参照)の構造が、第8図に示すよ
うに日本文に対する構造に変換される。そして、得られ
た結果が第4図のバッファDに格納される。第3図の翻
訳文生成部14は、得られた日本語文字列「これ ペン
である。」に適切な助詞「は」や助動詞をつけて、第9
図のような日本語の形にして、第4図のバッファEに格
納する。この日本文「これはペンである。」は、翻訳モ
ジュール5から出力され、メインメモリー2に格納され
ると共に、CRT3に表示される。
次に本発明に係る辞書引き形態素解析部11のハイフン合
成語の処理動作を第10図のフローチャートに示す。
以下このフローチャートに従って辞書引き形態素解析部
11の処理動作を説明する。
ステップS1において入力された単語がハイフンを含んで
いるか否かを判別する。ハイフンを含んだ合成語であれ
ばステップS3に進みそうでなければステップS2に進む。
ステップS3〜ステップS7においてハイフン合成語をハイ
フンの前後の単語に分割し、夫々の単語毎に辞書引きを
行い、得られた結果を前記合成語に対応させてバッファ
Bに保持する。
そしてステップS8で上記辞書引きした結果、ハイフン前
の単語が名詞で且つハイフン後の単語が現在分詞或いは
過去文詞であればステップS9に進み、そうでなければス
テップS14に進む。ステップS9では上記辞書引きの結果
を保持したバッファBの内容を別のバッファに退避させ
る。ステップS10で別のバッファに退避させた辞書引き
の結果に基づいてハイフン前とハイフン後の単語の順番
を置き換えてこの2つの単語だけで翻訳処理を行い、ス
テップS11でその翻訳結果を前記合成語に対応させてバ
ッファBに保持する。更にステップS12で先に退避させ
ていた辞書引きの結果をバッファBに戻す。
一方、ステップS2においては通常の辞書引きを行ない、
ステップS13でその結果を単語対応させてバッファBに
保持する。
ステップS14において入力文章中の全ての単語に対して
上述した処理を終了したかを判別し、終了していなけれ
ばステップS1に戻り、終了しておれば辞書引き形態素解
析部11の処理を終了する。そして翻訳文生成部14におい
てハイフン合成語の訳語を生成する際には該合成語に対
応してバッファBに保持されている前記翻訳結果情報に
基づいて訳語を出力し、訳文を生成する。
第11図は本実施例の機械翻訳装置に入力したハイフン合
成語を含む文章とこの機械翻訳装置から出力された日本
文の例である。
入力されたハイフン合成語「stem−mounted」はハイフ
ンの前後で分割されて夫々辞書引きされ、順番を置き換
えてこの2つの単語だけを翻訳して「ステムを搭載す
る」という訳語を得て、該訳語を合成語「stem−mounte
d」に対応させてバッファBに保持する。
翻訳文生成部14では上記翻訳結果情報に従って入力文の
翻訳文を生成し、その結果「ステムを搭載したデバイ
ス」という日本文を得る。
<発明の効果> 本発明のハイフン合成語処理方法を適用した機械翻訳装
置においては、入力文章中にハイフンを含む合成語で且
つハイフンによって名詞と現在分詞或いは名詞と過去分
詞が合成されている語を含むものに対してユーザー辞書
に該合成語を登録しなくても正しい翻訳結果が得られて
効率的な翻訳が実現できる。
【図面の簡単な説明】
第1図はこの発明を適用する機械翻訳装置の一実施例の
ブロック図、第2図は自動翻訳における翻訳レベルの説
明図、第3図は上記実施例における翻訳モジュールのブ
ロック図、第5図乃至第9図は第4図における各バッフ
ァの内容例を示す図、第10図はハイフン合成語の処理の
動作を示すフローチャート、第11図は本発明における機
械翻訳装置への入力語例とそれに対する出力語(翻訳
語)例を示す図である。 1……メインCPU、2……メインメモリー、3……CRT、
4……キーボード、5……翻訳モジュール、6……メモ
リ、11……辞書引き形態素解析部、12……構文解析部、
13変換部、14……翻訳文生成部、15……翻訳CPU、16…
…翻訳プログラム、A〜E……バッファ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 平井 徳行 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 (72)発明者 鈴木 等 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力された文章中の各単語を辞書引きし、
    該辞書引き情報から前記入力文章の形態素列を得る辞書
    引き形態素解析部と、 該辞書引き形態素解析部によって得られた形態素列の構
    文を辞書と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
    構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
    前記辞書引き情報から翻訳文を生成する翻訳文生成部と
    を有する機械翻訳装置において、 前記辞書引き形態素解析部は、入力された文章中にハイ
    フンによって合成されたハイフン合成語があれば、該合
    成語をハイフン前後の単語に分割して該分割された2つ
    の単語に対して夫々辞書引きを行い、得られた辞書引き
    情報を前記合成語に対応させて保持し、 更に前記辞書引きの結果前記合成語の分割されたハイフ
    ン前の単語が名詞であり、且つハイフン後の単語が現在
    分詞又は過去分詞である場合は、前記合成語に対応させ
    て保持した前記辞書引き情報に基づいて、前記ハイフン
    前後の単語の順番を置き換えて翻訳を行い、該翻訳結果
    を前記合成語に対応させて保持し、 前記翻訳文生成部は、当該翻訳結果を前記合成語の訳語
    として出力することを特徴とする機械翻訳装置における
    ハイフン合成語処理方法。
JP1104237A 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法 Expired - Fee Related JPH0719260B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法
US07/513,254 US5065318A (en) 1989-04-24 1990-04-20 Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
EP90304350A EP0398513B1 (en) 1989-04-24 1990-04-23 Method and apparatus for translating a sentence including a compound word formed by hyphenation
DE69025091T DE69025091T2 (de) 1989-04-24 1990-04-23 Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法

Publications (2)

Publication Number Publication Date
JPH02281374A JPH02281374A (ja) 1990-11-19
JPH0719260B2 true JPH0719260B2 (ja) 1995-03-06

Family

ID=14375355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1104237A Expired - Fee Related JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法

Country Status (1)

Country Link
JP (1) JPH0719260B2 (ja)

Also Published As

Publication number Publication date
JPH02281374A (ja) 1990-11-19

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JP2815714B2 (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0719260B2 (ja) 機械翻訳装置におけるハイフン合成語処理方法
JP2719453B2 (ja) 機械翻訳装置
JPS62191967A (ja) 文脈処理装置
JP3174664B2 (ja) 機械翻訳装置
JP2947554B2 (ja) 機械翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JP2655922B2 (ja) 機械翻訳装置
KR20110018717A (ko) 중국어 구조조사 오류의 자동정정 장치 및 방법
JPS60247787A (ja) 文章変換装置
JPH03217971A (ja) 機械翻訳装置
JPH05181901A (ja) 機械翻訳装置
JPH05158971A (ja) 機械翻訳装置
JPH05342259A (ja) 機械翻訳システム
JPH04296969A (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JPH04335469A (ja) 翻訳装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0258162A (ja) 機械翻訳装置および機械翻訳方法
JPH05165881A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080306

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090306

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees