JPH02281372A - 機械翻訳装置における挿入副詞句処理方法 - Google Patents

機械翻訳装置における挿入副詞句処理方法

Info

Publication number
JPH02281372A
JPH02281372A JP1104238A JP10423889A JPH02281372A JP H02281372 A JPH02281372 A JP H02281372A JP 1104238 A JP1104238 A JP 1104238A JP 10423889 A JP10423889 A JP 10423889A JP H02281372 A JPH02281372 A JP H02281372A
Authority
JP
Japan
Prior art keywords
word
sentence
information
translation
adverb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1104238A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1104238A priority Critical patent/JPH02281372A/ja
Priority to US07/513,283 priority patent/US5088039A/en
Priority to EP90304351A priority patent/EP0403057B1/en
Priority to DE69025498T priority patent/DE69025498T2/de
Publication of JPH02281372A publication Critical patent/JPH02281372A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は機械翻訳装置の挿入副詞句処理に関し、特に文
章中の任意の位置に挿入されるコンマで挾まれた副詞句
を含む文章を翻訳する際に好適に実施される。
〈従来技術〉 翻訳対象の文章中に副詞句がコンマに挾まれて挿入され
る場合がある。従来の機械翻訳装置にこのような文章を
入力してもその挿入位置が特定の場所(例えば名詞の後
ろ等)に限らず任意の場所であるため、構文解析に失敗
して誤まった翻訳結果を出力していた。
そのため、入力文章中に挿入副詞句がある場合、人手に
よりその挿入副詞句を削除する等して機械翻訳装置へ文
章を入力し、得られた翻訳結果に対して挿入副詞句の訳
文を追加していた。
〈発明が解決しようとする課題〉 上述したように上記の機械翻訳装置において挿入副詞句
を含む文章を翻訳する場合は、人手によイ叡 る作業を必要とし、翻訳処理の効率の戚下を招いていた
そこで本発明は、機械翻訳装置において入力文章中2任
意の場所に挿入された副詞句が含iれていても、正しい
翻訳結果を出方できる挿入副詞句処理方法を提供するこ
とにある。
く課題を解決するための手段〉 本発明は上記目的を達成するために、 入力された文章中の各単語を辞書引きし、該辞書引き情
報から前記入力文章の形態素列を得る辞書引き形態素解
析部と、 該辞書引き形態素解析部によって得られた形態素列の構
文を辞書と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解
析部で辞書引きした結果、文章中の単語が副詞であって
且つ前記文章中の当該単語を含んだ前後の位置にコンマ
が存在すれば、該前後のコンマの間に存在する単語数を
挿入副詞句情報として前方のコンマの直前に存在する単
語に対応させてメモリに保持し、 前記構文解析部は前記メモリを参照して入力された形態
素列中の単語に前記挿入副詞句情報が付加されている場
合、当該単語の直後の単語から前記副詞情報が示す単語
数分の単語を除去して構文解析を行い、 更に前記翻訳文生成部は前記メモリを参照して入力文章
中の単語に前記挿入副詞句情報が付加されている場合、
当該単語の直後の単語から前記挿入副詞句情報が示す単
語数分の単語だけで訳文を生成し、訳文の最後にコンマ
を付けて出力した後に前記入力された構文構造に従って
訳文を出力するものである。
く作用〉 本発明に従えば、辞書引き形態素解析部は入力された文
章中の各単語を辞書引きした結果を単語に対応させてメ
モリに保持し、前記単語の中の1つが副詞であって且つ
当該単語の前後の位置にコンマが存在すれば、該コンマ
に挾まれた単語の数を挿入副詞句情報として前方のコン
マの直前に存在する単語に対応させて前記メモリに保持
する。
構文解析部は入力された形態素列中の単語に前記挿入副
詞句情報が付加されている場合、当該単語の直後の単語
から前記挿入副詞句情報が示す単語数分の単語を除去し
て構文解析を行う。
翻訳文生成部は前記メモリを参照し、入力文章中の単語
に前記挿入副詞句情報が付加されていれば、当該単語の
直後の単語から前記挿入副詞句情報が示す単語数分の単
語だけで訳文を生成し、訳文の最後にコンマを付けて出
力した後に前記入力された構文の構造に従って訳文を生
成出力する。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明を適用する機械翻訳装置における一実
施例のブロック図である。1はメインCPU(中央処理
装置)、2はメインメモIJ−3ハCRT (カソード
・レイ゛・チューブ)、4はキーボード、5は翻訳モジ
ュール、6は翻訳用の辞書、文法規則および木構造変換
規則等を格納しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲ7)言語を出力するものである。
すなわち、キーボード4から入力されたソース言語はメ
インCPUIの制御により翻訳モジュール5に送られる
。翻訳モジュール5は、メモリー6に記憶されている辞
書、文法規則および木構造変換規則等を用いて、後に詳
述するようにして入力されたソース言語をターゲット言
語に翻訳する。その結果は、メンメモリー2に一旦記憶
されると共に、CRT3に表示される。
翻訳モジュール5で行われる機械翻訳には、船釣に第2
図に示すような解析レベルがある。図中左上においてソ
ース言語が入力されると、レベルL1の辞書引き、レベ
ルL2の形態素解析、レベルL3の構文解析、・・・と
、解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つに分
けられる。1つは、レベルL6のソース言語およびター
ゲット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
10の形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
もう一つは、上述のレベルL2の形態素解析、レベルL
3の構文解析、レベルL4の意味解析おヨヒレベ/L/
L5の文脈解析のいずれかまで解析を行ってソース言語
の内部構造を得、次に、この得られたソース言語の内部
構造と同レベルのターゲット言語の内部構造に変換した
後、ターゲット言語を生成するトランスファ一方式であ
る。
ここで、上記各解析について説明する。
・辞書引き、形態素解析 一第11図に示すメモリー6の辞書ヲ 引き、入力された文章を各形態素 列(単語列)に分割し、この各車 語に対する品詞などの文法情報お よび訳語を得、さらに、時制・人 称・数などを解析する。
・構文解析 −後述するようにして単語間の係り受けな
どの、文章の構造(構造解 折本)を決定する。
・意味解析 −複数の構文解析の結果から意味的に正し
いものとそうでないものを 判別する。
・文脈解析 −話題を理解し、省略やあい昧さを取り去
る。
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図は[Th1s is a pen、
jという英文を日本語に翻訳する場合の、第4図に示す
各バッファA、Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに格納される。翻訳プログラム16に基づく
翻訳CPU15の制御の下に、第3図の辞書引き形態素
解析部11により、バッファAに格納された原文に従っ
てメモリー6の辞書を用いて各単語の必要な情報が得ら
れ、第4図のバッファBに格納される。ここで、thi
sは多品詞語であるが、次の第3図の構文解析部12に
より一意に決定される。構文解析部12ではメモリー6
の辞書と文法規則にしたがって、各単語間の係り受は関
係を示す構造解析木が第7図に示すように決定されて、
第4図のバッファCに格納される。この構造解析木は、
次のようにして決定される。すなわち、メモリー6の文
法規則から文−主部、述部 主部−名詞句 述部−動詞、名詞句 名詞句−代名詞 名詞句−冠詞、名詞 の規則が得られる。この規則は、例えば、1つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。
第3図の変換部13では、上述の構文解析部間様、メモ
リー6の木構造変換規則を用いて、入力された英文に対
する構文解析木(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッファDに格納される。第3図に
翻訳文生成部14は、得られた日本語文字列「これペン
である。」に適切な助詞「は」や助動詞をつけて、第9
図のような日本語の形にして、第4因のバッフIEに格
納する。この日本文「これはペンである。」は、翻訳モ
ジュール5から出力され、メインメモリー2に格納され
ると共に、CRT3に表示される。
次に本発明に係る辞書引き形態素解析部11の辞書引き
処理を第10図のフローチャートに基づいて説明する。
まず、ステップSlにおいて入力された文章中の単語を
順に辞書引き処理して、得られた情報をバッファBに保
持する。そしてステップS2において辞書引きした結果
、その単語が副詞であって且つその文章中に当該単語を
含んだ前後の位置にコンマがあるかどうかを判別する。
単語が副詞であり、且つその前後にコンマが存在すれば
ステップS3に進み、そうでなければステップS4に進
む。
ステップS3においてコンマで挾まれた単語の数をカウ
ントしてその単語数を挿入副詞句情報として前方のコン
マの直前の単語に対応させてバッファBに保持する。ス
テップS4において入力文章の全ての単語に対して辞書
引きを行ったかどうかチエツクして、まだ終了していな
ければ、ステップSIに戻シ、終了していれば、辞書引
き処理を終了する。
このように入力された文章中に挿入副詞句が存在すれば
挿入副詞句の直前の単語に対して挿入副詞句情報として
副詞句の単語数がバッファBに保持される。
そして構文解析部12では辞書引き形態素解析部11に
よる形態素列中の単語に前記挿入副詞句情報が付加され
ている単語があれば、当該単語の直後の単語から前記挿
入副詞句情報が示す単語数分の単語を除去して構文解析
を行う。
更に翻訳文生成部14の訳文生成処理を第11図のフロ
ーチャートに基づいて説明する。
まずステップn1において入力文章中に前記挿入副詞句
情報が付加された単語があるか否かをバッフIBを参照
して判別する。そのような単語があればステップn2に
進み、なければステラ7’n4に進む。ステップn3で
は当該単語の直後の単語から前記挿入副詞句情報が示す
単語数分の単語だけでバッフ1Bに保持された辞書引き
の情報をもとに訳文を生成し、ステップn3で該訳文の
後にコンマを生成する。
ステ・フプn4では変換部13による構文の構造に従っ
てバッフIBの辞書引き情報を参照して訳文を生成する
以上のように本発明に係る翻訳文生成部14においては
入力文章中に挿入副詞句がある場合挿入副詞句から先に
翻訳して出力し、コンマを出力した後で残りの単語を翻
訳する。
第12因は本実施例の機械翻訳装置に入力した挿入副詞
句を含む文章とこの機械から出力された日本文の例であ
る。
でこの単語の前後にコンマがあるので、前のコンマの直
前の単語「!」に対して挿入副詞句情報としてコンマの
間に存在する単語数「2」を保持するO 構文解析部12では単語「I」に挿入副詞句情報「2」
が付加されていると判別すると単語「月の直後の単語r
ifJから数えて2個分の単語「1fnecessar
yJ f除去して構文解析を行う。
翻訳文生成部では単語rNに挿入副詞句情報「2」が付
加されていると判別するとまず単語rlJの後の2個の
単語「目 necessaryJだけで訳文「必要なら
/Jを生成し、コンマ「、」を生成する。その後で変換
部13の構文構造に従って訳文を生成し、「私は、それ
を食べる。」を出力する。
〈発明の効果〉 以上のように本発明の挿入副詞句処理方法を適用した機
械翻訳装置は文章中の任意の場所に挿入された挿入副詞
句を含む入力文章に対しても正しい翻訳を行うことがで
き、翻訳の信頼性が向上する。
【図面の簡単な説明】
第1図はこの発明を適用する機械翻訳装置の一実施例の
ブロック図、第2図は自動翻訳における翻訳レベルの説
明図、第3図は丑記実施例における翻訳モジュールのブ
ロック図、第5図乃至第9図は第4図における各バッフ
ァの内容例を示す図、第10図は辞書引き処理のフロー
チャートを示す図、第11図は訳文生成処理のフローチ
ャートを示す図、第12図は本発明を適用した機械翻訳
装置への入力文の例とそれに対する出力文(翻訳文)例
を示す図である。 1・・・メインCPU  2・・・メインメモリー 3
・・・CRT  4・・・キーボード 51.翻訳モジ
ュール6・・メモリー 11・・・辞書引き形態素解析
部 12・・・構文解析部 13・・・変換部 14・
・・翻訳文生成部 15・・・翻訳CPU  16・・
・翻訳プログラムANE・・・バッファ

Claims (1)

  1. 【特許請求の範囲】 1、入力された文章中の各単語を辞書引きし、該辞書引
    き情報から前記入力文章の形態素列を得る辞書引き形態
    素解析部と、 該辞書引き形態素解析部によって得られた形態素列の構
    文を辞書と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
    構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
    前記辞書引き情報から翻訳文を生成する翻訳文生成部と
    を有する機械翻訳装置において、 前記辞書引き形態素解析部で辞書引きした結果、文章中
    の単語が副詞であって且つ前記文章中の当該単語を含ん
    だ前後の位置にコンマが存在すれば、該前後のコンマの
    間に存在する単語数を挿入副詞句情報として前方のコン
    マの直前に存在する単語に対応させてメモリに保持し、
    前記構文解析部は前記メモリを参照して入力された形態
    素列中の単語に前記挿入副詞句情報が付加されていれば
    、当該単語の直後の単語から前記副詞情報が示す単語数
    分の単語を除去して構文解析を行い、 更に前記翻訳文生成部は前記メモリを参照して入力文章
    中の単語に前記挿入副詞句情報が付加されている場合、
    当該単語の直後の単語から前記挿入副詞句情報が示す単
    語数分の単語だけで訳文を生成し、訳文の最後にコンマ
    を付けて出力した後に前記入力された構文構造に従って
    訳文を出力することを特徴とする機械翻訳装置における
    挿入副詞句処理方法。
JP1104238A 1989-04-24 1989-04-24 機械翻訳装置における挿入副詞句処理方法 Pending JPH02281372A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1104238A JPH02281372A (ja) 1989-04-24 1989-04-24 機械翻訳装置における挿入副詞句処理方法
US07/513,283 US5088039A (en) 1989-04-24 1990-04-20 System for translating adverb phrases placed between two commas through a converter using tree-structured conversion rules
EP90304351A EP0403057B1 (en) 1989-04-24 1990-04-23 Method of translating sentence including adverb phrase by using translating apparatus
DE69025498T DE69025498T2 (de) 1989-04-24 1990-04-23 Verfahren und Vorrichtung zur Übersetzung von Sätzen mit adverbialen Sätzen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1104238A JPH02281372A (ja) 1989-04-24 1989-04-24 機械翻訳装置における挿入副詞句処理方法

Publications (1)

Publication Number Publication Date
JPH02281372A true JPH02281372A (ja) 1990-11-19

Family

ID=14375381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1104238A Pending JPH02281372A (ja) 1989-04-24 1989-04-24 機械翻訳装置における挿入副詞句処理方法

Country Status (4)

Country Link
US (1) US5088039A (ja)
EP (1) EP0403057B1 (ja)
JP (1) JPH02281372A (ja)
DE (1) DE69025498T2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
JPH03222065A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置
JP3038079B2 (ja) * 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
JPH06195373A (ja) * 1992-12-24 1994-07-15 Sharp Corp 機械翻訳装置
US5495413A (en) * 1992-09-25 1996-02-27 Sharp Kabushiki Kaisha Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
JP2964831B2 (ja) * 1993-03-31 1999-10-18 富士ゼロックス株式会社 構造データ処理装置
US6766343B1 (en) * 2000-02-04 2004-07-20 Harris Corporation Method and apparatus for coordinate system conversions
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
KR100515641B1 (ko) * 2003-04-24 2005-09-22 우순조 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
US7376552B2 (en) * 2003-08-12 2008-05-20 Wall Street On Demand Text generator with an automated decision tree for creating text based on changing input data
US7774192B2 (en) * 2005-01-03 2010-08-10 Industrial Technology Research Institute Method for extracting translations from translated texts using punctuation-based sub-sentential alignment
US8280718B2 (en) * 2009-03-16 2012-10-02 Xerox Corporation Method to preserve the place of parentheses and tags in statistical machine translation systems
KR20140119841A (ko) * 2013-03-27 2014-10-13 한국전자통신연구원 애니메이션을 이용한 번역 검증 방법 및 그 장치
KR102564008B1 (ko) * 2016-09-09 2023-08-07 현대자동차주식회사 실시간 통역단위문 추출에 기반한 동시통역 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262177A (ja) * 1986-05-08 1987-11-14 Toshiba Corp 機械翻訳システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
GB2197510A (en) * 1986-10-27 1988-05-18 Sharp Kk Translation apparatus
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4964030A (en) * 1986-11-28 1990-10-16 Sharp Kabushiki Kaisha Apparatus for translating sentences containing punctuation marks
JPS6466777A (en) * 1987-09-08 1989-03-13 Sharp Kk Mechanical translation device
US4931936A (en) * 1987-10-26 1990-06-05 Sharp Kabushiki Kaisha Language translation system with means to distinguish between phrases and sentence and number discrminating means
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262177A (ja) * 1986-05-08 1987-11-14 Toshiba Corp 機械翻訳システム

Also Published As

Publication number Publication date
EP0403057B1 (en) 1996-02-28
EP0403057A2 (en) 1990-12-19
DE69025498T2 (de) 1996-07-18
US5088039A (en) 1992-02-11
EP0403057A3 (en) 1992-04-29
DE69025498D1 (de) 1996-04-04

Similar Documents

Publication Publication Date Title
US6463404B1 (en) Translation
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH0644296A (ja) 機械翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JP2815714B2 (ja) 翻訳装置
JPH0261763A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
CA2297905C (en) Interlingual translation system and method
JP3113257B2 (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JPH08190562A (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JPS6180359A (ja) 翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JP3233800B2 (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH01112368A (ja) 機械翻訳装置
JPH05181901A (ja) 機械翻訳装置
Kamei et al. Interlingua developed and utilized in real multilingual MT product systems
JPH04335469A (ja) 翻訳装置
JPH03217971A (ja) 機械翻訳装置
JPH04296969A (ja) 機械翻訳装置
JPH04235671A (ja) 機械翻訳装置
JPH1166069A (ja) 機械翻訳装置