JPH0261763A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH0261763A
JPH0261763A JP63214257A JP21425788A JPH0261763A JP H0261763 A JPH0261763 A JP H0261763A JP 63214257 A JP63214257 A JP 63214257A JP 21425788 A JP21425788 A JP 21425788A JP H0261763 A JPH0261763 A JP H0261763A
Authority
JP
Japan
Prior art keywords
dictionary
sentence
word
buffer
specification code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63214257A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63214257A priority Critical patent/JPH0261763A/ja
Priority to DE68919030T priority patent/DE68919030T2/de
Priority to EP89308613A priority patent/EP0357344B1/en
Publication of JPH0261763A publication Critical patent/JPH0261763A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、より早く正確に翻訳結果を得ることができ
る機械翻訳装置に関する。
〈従来の技術〉 一般に、機械翻訳装置によってソース言語をターゲット
言語に翻訳する場合には、基本辞書だけではなく使用者
が作成するユーザー辞書や専門用語辞書も同時に使用す
ることが多い。その場合に、従来の機械翻訳装置におい
ては、上記各辞書を検索する順序はユーザー辞書が最も
優先され、次が専門用語辞書であり、最後が基本辞書と
いう優先順序になっている。
〈発明か解決しようとする課題〉 上述のように、上記従来の機械翻訳装置における辞書検
索順序は、ユーザー辞書、専門用語辞書および基本辞書
の順になっており、通常の場合には上記優先順序が妥当
である。ところが、このような従来の機械翻訳装置にお
いて翻訳する際に、ある単語(例えば、book)に限
っては、ユーザー辞書の情報(例えば、book=ブッ
ク)ではなく基本辞書の情報(例えば、book=本)
を使用して翻訳しなければならないような場合が生じる
しかしながら、従来の機械翻訳装置ではユーザー辞書の
検索順序が最優先されているため、ユーザー辞書に必要
な情報が登録されていないのが分かっているにも拘わら
ずユーザー辞書から検索を開始して、ユーザー辞書から
得られた誤った情報“book−ブック”に従って翻訳
が実行される。したがって、正確な翻訳結果が得られな
いという問題がある。また、そのため、上記誤った翻訳
結果を訂正しなければならず、翻訳に時相がかかるとい
う問題もある。
そこで、この発明の目的は、ソース言語における文章中
の必要な単語に辞書指定コードを付加することによって
、その単語について辞書引きを行う際に使用する辞書を
指定することができる機械翻訳装置を提供することにあ
る。
〈課題を解決するための手段〉 上記目的を達成するため、この発明は、入力された文章
を複数の辞書を用いて形態素に分割する形@素解析部と
、上記形態素解析部によって分割された形態素列の構文
を辞書と文法規則を用いて解析する構文解析部と、上記
構文解析部で得られた構文の構造を目標言語における構
文の構造に変換する変換部と、上記変換部によって得ら
れた目標言語の構文構造に従って翻訳文を生成する翻訳
文生成部を有する機械翻訳装置において、上記形態素解
析部において辞書引きを行う際に使用する辞書を指定す
る辞書指定コードを、使用辞書を指定する必要がある単
語に付加するために、上記辞書指定コードを入力する辞
書指定コード入力手段と、入力された単語に上記辞書指
定コードが付加されているか否かを判別する辞書指定コ
ード付加判別手段と、上記辞書指定コード付加判別手段
によって、入力された単語に上記辞書指定コードが付加
されていると判別された場合には、上記辞書指定コード
によって指定された辞書を用いて辞書引きを行う一方、
入力された単語に上記辞書指定コードが付加されていな
いと判別された場合には、所定の辞書引き順序に従って
複数の辞書を引く辞書引手段を備えたことを特徴として
いる。
く作用〉 入力される任意の文章中に使用辞書を指定する必要があ
る単語がある場合には、辞書指定コード入力手段から上
記使用辞書を表す辞書指定コードが入力されて、上記単
語に付加される。
上述のようにして辞書指定コードが付加された単語を含
む単語列で構成された文章が形態素解析部に入力される
と、まず形態素に分割され、次に辞書指定コード付加判
別手段によって、入力された単語に上記辞書指定コード
が付加されているか否かが判別される。その結果、上記
辞書指定コードが付加されていると判別された単語の場
合には、辞書引手段によって、上記辞書指定コードによ
って指定された辞書を用いて辞書引きが行われる。
一方、北記辞書指定コードが付加されていないと判別さ
れた単語の場合には、上記辞書引手段によって、所定の
辞書引き順序に従って複数の辞書が弓かれて訳語等の情
報が得られる。このように、単語に辞書指定コードが付
加されている場合には、上記単語の必要な情報が格納さ
れている辞書が最優先して検索される。
次に、この得られた情報と文法規則に基づいて、構文解
析部で形態素列の構文解析が行われる。そして、上記構
文解析部で得られた構文の構造が変換部によって目標言
語の構文の構造に変換され、翻訳文生成部によってこの
目標言語の構文の構造に従って翻訳文が生成される。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の機械翻訳装置における一実施例のブ
ロック図である。IはメインCPU(中央処理装置)、
2はメインメモリー、3はCRT(カソード・レイ・チ
ューブ)、4はキーボード、5は翻訳モジュール、6は
翻訳用の辞書1文法規則および木構造変換規則等を格納
しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してタープ゛・ソト言語を出力するものであ
る。すなわち、キーボード4から入力されたソース言語
はメインCI’ U Iの制御により翻訳モジュール5
に送られる。翻訳モジ<ご−ル5はメモリー6に記憶さ
れている辞書1文法規則および本構造変換規則等を用い
て、後に詳述するようにして入力されたソースL′語を
ターゲット言語に翻訳する。その結果は、メインメモリ
ー2に一旦記憶されると共に、CRT3に表示される。
翻訳モジュール5で行われる自動翻訳には、般的に第2
図に示すような解析レベルがある。図中左上においてソ
ース言語が入力されると、レベルL、の辞書引き、レベ
ルL、の形態素解析、レベルL3の構文解析、・・・と
、解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つにわ
けられる。1つは、レベルL8のソース言語およびター
ゲット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL、の構文生成、レベルL
IOの形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
もう1つは、上述のレベルL、の形態素解析。
レベルL3の構文解析、レベルL、の意味解析およびレ
ベルL5の文脈解析のいずれかまで解析を行ってソース
言語の内部構造を得、次に、この得られたソース言語の
内部構造と同レベルのターゲット言語の内部構造に変換
した後、ターゲット言語を生成するトランスファ一方式
である。
ここで、上記各解析について説明する。
・辞書引き、形態素 解析−第1図に示すメモリー6の辞書を引き、入力され
た文章を各形態素 列(単語列)に分割し5、この各単語 に対する品詞などの文法情報およ び訳語を得、さらに、時制・人称・ 数などを解析する。
・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解 折本)を決定する2゜ ・き味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを 判別する。
・文脈解析−話題を理解し、省略やあい昧さを取り去る
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL、の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図はrThis is a pen、
Jという英文を日本語に翻訳する場合の、第4図に示す
各バッファA−Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに格納される。翻訳プログラム16に基づく
翻訳CPUl5の制御の下に、第3図の辞書引き形態素
解析部11により、バッファAに格納された原文に従っ
てメモリー6の辞書を用いて各単語の必要な情報が得ら
れ、第4図のバッファBに格納される。例えば、その各
情報の一部である品詞情報は、第6図のように格納され
る。
ここで、thisは多品詞語であるが、次の第3図の構
文解析部12により一意に決定される。構文解析部12
ではメモリー6の辞書と文法規則にしたがって、各単語
間の係り受は関係を示す構造解析木が第7図に示すよう
に決定されて、第4図のバッファCに格納される。この
構造解析木は例えば次のようにして決定される。すなわ
ち、メモリ−6の文法規則から 文−主部、述部 主部−名詞句 述部−動詞1呂詞句 名詞句→代名詞 名詞句−冠詞、名詞 の規則が得られる。この規則は、例えば、1つ目の規則
は“文とは、主部と述部からできている”ということを
表わす。以下、この規則にしたがって構造解析木が決定
されるのである。
第3図の変換部13では、上述の構文解析部間様、メモ
リー6の本構造変換規則を用いて、入力された英文に対
する構文解析木(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッファDに格納される。第3図の
翻訳文生成部I4は、得られた日本文字「これペンであ
る。」に適切な助詞「は」や助動詞をつけて、第9図の
ような日本語の形にして、第4図のバッファEに格納す
る。このようにして得られた日本文[これはペンである
。」は翻訳モジュール5から出力され、メインメモリー
2に格納されろと共に、CRT 3に表示されるのであ
る。
その際に、第3図の辞書引き形態素解析部11では、後
に詳述するようにして、この発明に係る辞書引処理が実
行される。この辞書引処理は、予め翻訳の際に使用する
辞書を指定したい単語に、上記辞書を表す辞書指定コー
ドを付加しておく。
そして、辞書指定コードが付加しである単語について辞
書引きを行う場合には、上記辞書指定コードによって指
定された辞書を最優先して引くのである 第1O図はこの発明に係る辞書引処理のフローチャート
である。以下、第1O図にしたがって辞書引処理につい
て説明する。
ステップS、で、入力されたターゲット言語による文章
中に辞書指定コードが付加されているか否かが判別され
る。その結果、辞書指定コードが付加されていればステ
ップS5に進み、そうでなければステップS、に進む。
ステップS2で、ユーザー辞書の辞書引きが行われてス
テップS、に進む。
ステップS、で、専門用語辞書の辞書引きが行われてス
テップS4に進む。
ステップS4で、基本辞書の辞書引きが行われてステッ
プSIlに進む。
ステップS、で、辞書指定コードによって指定された辞
書の辞書引きが行われてステップs6に進む。
ステップS8で、辞書引処理が終了か否がが判別される
。その結果、終了でなければステップS。
に戻り、そうでなければ辞書引処理を終了する。
第11図は、本実施例の機械翻訳装置に入力した英文と
、この機械翻訳装置から出力された日本文の例である。
この例においては、ユーザー辞書には“book−ブッ
ク”という情報が登録されており、基本辞書には“bo
ok=本”という情報が登録されているものとする。そ
うすると、入力1のようにrThis is a bo
ok、Jが入力されると、この場合にはbookに辞書
指定コードが付加されてぃないのでユーザー辞書が最優
先して検索され、得られた“book−ブック”の情報
を用いて翻訳処理が実行されて、出力1のように「これ
は、ブックである。」という翻訳文が出力される。
一方、入力2のようにrThis is a kj b
ook、Jが入力されると、この場合にはbookに辞
書指定コード(本実施例においては、“kj”(基本辞
書を指定))が付加されているので基本辞書が最優先し
て検索され、得られた“book−本”の情報を用いて
翻訳処置が実行されて、出力2のように[これは、本で
ある。Jという翻訳文か出力される。
このように、この発明においては、ソース言語をターゲ
ット言語に翻訳する際において、入力文章中に特定の辞
書に登録されている情報に従って翻訳処理を実行する必
要がある単語が存在する場合には、この単語に上記特定
の辞書を表す辞書指定コードを付加して入力する。そし
て、辞書引き形態素解析部11において辞書引きを実行
する際には、辞書指定コードによって指定された辞書を
最優先して検索することによって、上記単語を翻訳する
際に必要な情報を最先に得られるようにしている。した
がって、この発明によれば正確な翻訳結果をより早く出
力することができる。
上記実施例における機械翻訳装置では、ソース言語とし
て英語を用い、ターゲヅト言語として日本語を用いてい
るが、この発明はこれに限定されるものではないことは
言うまでもない。
〈発明の効果〉 以上より明らかなように、この発明の機械翻訳装置は、
必要な単語に辞書指定コードを付加するために上記辞書
指定コードを入力する辞書指定コード入力手段と、入力
された単語に辞書指定コートか付加されているか否かを
判別する辞書指定コード付加判別手段と、上記辞書指定
コード付加判別手段の判別結果に基づいて、辞書指定コ
ードが付加されている単語の場合には上記辞書指定コー
ドによって指定された辞書を用いて辞書引きを行う一方
、辞書指定コードが付加されていない単語の場合には所
定の辞書引き順序に従って複数の辞書を引く辞書引手段
を備えたので、特定の辞書に登録された情報に従って翻
訳処理を実行する必要のある単語の場合には、上記特定
の辞書を最優先して検索することができ、必要な情報を
最優先に得られる。したがって、この発明によれば正確
な翻訳結果をより早く出力することができる。
【図面の簡単な説明】
第1図はこの発明の機械翻訳装置の一実施例のブロック
図、第2図は自動翻訳における翻訳レベルの説明図、第
3図は上記実施例における翻訳モジュールの作用構成図
、第4図は上記翻訳モジュールのブロック図、第5図乃
至第9図は第4図におIJる各バッファの内容例を示す
図、第10図は辞書引処理のフローヂャート、第11図
は第1図の機械翻訳装置への入ノJ文例とそれに対する
出力文(翻訳文)例を示す図である。 ■・・・メインCPU、2・・メインメモリー3・CR
T、      4・・・キーボード、5・・・翻訳モ
ジュール、6・・・メモリー11・・・辞書引き形態素
解析部、12・・・構文解析部、13・・・変換部、 
  I4・・・翻訳文生成部、15・・・翻訳CPU5
16・・・翻訳プログラム、A−E・・バッファ。

Claims (1)

    【特許請求の範囲】
  1. (1)入力された文章を複数の辞書を用いて形態素に分
    割する形態素解析部と、上記形態素解析部によって分割
    された形態素列の構文を辞書と文法規則を用いて解析す
    る構文解析部と、上記構文解析部で得られた構文の構造
    を目標言語における構文の構造に変換する変換部と、上
    記変換部によって得られた目標言語の構文構造に従って
    翻訳文を生成する翻訳文生成部を有する機械翻訳装置に
    おいて、 上記形態素解析部において辞書引きを行う際に使用する
    辞書を指定する辞書指定コードを、使用辞書を指定する
    必要がある単語に付加するために、上記辞書指定コード
    を入力する辞書指定コード入力手段と、 入力された単語に上記辞書指定コードが付加されている
    か否かを判別する辞書指定コード付加判別手段と、 上記辞書指定コード付加判別手段によって、入力された
    単語に上記辞書指定コードが付加されていると判別され
    た場合には、上記辞書指定コードによって指定された辞
    書を用いて辞書引きを行う一方、入力された単語に上記
    辞書指定コードが付加されていないと判別された場合に
    は、所定の辞書引き順序に従って複数の辞書を引く辞書
    引手段を備えたことを特徴とする機械翻訳装置。
JP63214257A 1988-08-29 1988-08-29 機械翻訳装置 Pending JPH0261763A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63214257A JPH0261763A (ja) 1988-08-29 1988-08-29 機械翻訳装置
DE68919030T DE68919030T2 (de) 1988-08-29 1989-08-24 Computerunterstütztes Übersetzungsgerät.
EP89308613A EP0357344B1 (en) 1988-08-29 1989-08-24 Computer assisted language translating machine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63214257A JPH0261763A (ja) 1988-08-29 1988-08-29 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH0261763A true JPH0261763A (ja) 1990-03-01

Family

ID=16652757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63214257A Pending JPH0261763A (ja) 1988-08-29 1988-08-29 機械翻訳装置

Country Status (3)

Country Link
EP (1) EP0357344B1 (ja)
JP (1) JPH0261763A (ja)
DE (1) DE68919030T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302873A (ja) * 1989-05-18 1990-12-14 Sanyo Electric Co Ltd 機械翻訳装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
WO1997040452A1 (en) * 1996-04-23 1997-10-30 Language Engineering Corporation Automated natural language translation
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
NL9300310A (nl) * 1993-02-19 1994-09-16 Oce Nederland Bv Inrichting en werkwijze voor syntactische signaal-analyse.
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
KR101762866B1 (ko) * 2010-11-05 2017-08-16 에스케이플래닛 주식회사 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US10592614B1 (en) 2017-01-19 2020-03-17 Amdocs Development Limited System, method, and computer program for translating unified ticketing system (UTS) messages

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0176858B1 (en) * 1984-09-18 1993-01-20 Sharp Kabushiki Kaisha Translation system
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302873A (ja) * 1989-05-18 1990-12-14 Sanyo Electric Co Ltd 機械翻訳装置

Also Published As

Publication number Publication date
DE68919030T2 (de) 1995-05-24
DE68919030D1 (de) 1994-12-01
EP0357344A2 (en) 1990-03-07
EP0357344A3 (en) 1990-08-08
EP0357344B1 (en) 1994-10-26

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
US5161105A (en) Machine translation apparatus having a process function for proper nouns with acronyms
JP2892548B2 (ja) 自動翻訳装置
KR20130123037A (ko) 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법
JPH0261763A (ja) 機械翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH03222065A (ja) 機械翻訳装置
JP4114526B2 (ja) 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム
JP2719453B2 (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH01112367A (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH01166258A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH0566630B2 (ja)
JP2004086919A (ja) 機械翻訳システム
JPH05225232A (ja) テキスト自動前編集装置
JPH01112368A (ja) 機械翻訳装置
JPH0410056A (ja) 機械翻訳システム
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JPH03129468A (ja) 英日機械翻訳装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体