JP2766738B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2766738B2
JP2766738B2 JP3049815A JP4981591A JP2766738B2 JP 2766738 B2 JP2766738 B2 JP 2766738B2 JP 3049815 A JP3049815 A JP 3049815A JP 4981591 A JP4981591 A JP 4981591A JP 2766738 B2 JP2766738 B2 JP 2766738B2
Authority
JP
Japan
Prior art keywords
dictionary
headword
lookup
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3049815A
Other languages
English (en)
Other versions
JPH04284569A (ja
Inventor
徳行 平井
陽士 福持
秀造 釘宮
いち子 佐田
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP3049815A priority Critical patent/JP2766738B2/ja
Publication of JPH04284569A publication Critical patent/JPH04284569A/ja
Application granted granted Critical
Publication of JP2766738B2 publication Critical patent/JP2766738B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳装置に関するも
のである。
【0002】
【従来の技術】英語を日本語に翻訳する従来の機械翻訳
装置の一構成例を図6に示す。
【0003】図6に示す機械翻訳装置は、CPU(中央
処理装置)30、メインメモリ31、CRT(カソード・レ
イ・チューブ)32、キーボード33、翻訳モジュール34及
び翻訳用の辞書、文法規則並びに木構造変換規則などが
格納された辞書・規則メモリ35により構成されており、
各構成部分は翻訳モジュール34に接続されている辞書・
規則メモリ35を除いて全てCPU30に接続されている。
【0004】次に上記従来の機会翻訳装置の動作を説明
する。
【0005】ソース言語の文章(原文)が入力される
と、CPU30はそれを翻訳モジュール34に送る。翻訳モ
ジュール34は原文を受け取ると、辞書・規則メモリ35に
格納されている辞書、文法規則及び木構造変換規則を用
いて、原文をターゲット言語の文章(翻訳文)に翻訳す
る。翻訳結果は、メインメモリ31に一旦記憶されると共
にCRT32に表示される。
【0006】上記の翻訳モジュール34の構成を図7に示
す。
【0007】図7において、翻訳モジュール34は、原文
を形態素(単語)に分割し、辞書・規則メモリ35に格納
された辞書を用いて各形態素の品詞などの文法情報及び
訳語を得ると共に、形態素の時制、人称、数などを解析
する。
【0008】構文解析部37は、形態素解析部36により形
態素に分割された文章を、辞書・規則メモリ35に格納さ
れた辞書及び文法規則を用いて解析して文章の構文構造
を得る。変換部38は構文解析部37で得られた構文構造を
ターゲット言語の構文構造に変換する。また、生成部39
は変換部38によって得られた構文構造に基づいて翻訳文
を生成する。
【0009】
【発明が解決しようとする課題】上述の従来の機械翻訳
装置では、基本辞書に登録されている見出し語と意味内
容は同じであるが、綴りが異なる見出し語をユーザ辞書
に登録することが必要である場合には、ユーザ辞書に登
録できる1つの見出し語当りの情報量は一般に基本辞書
より少ないので、2つの見出し語は綴りが異なるだけで
意味内容は同じであるにもかかわらず、ユーザ辞書に登
録する見出し語に対しては十分な情報を登録することが
できないので、原文に異綴りの単語が含まれており、ユ
ーザ辞書の情報をもとに翻訳が行われた場合には、質の
高い翻訳結果が得られないという問題点がある。
【0010】また、基本辞書にあまり用いられない見出
し語や品詞が登録されている場合、あるいは原文の内容
と関連性の低い見出し語や品詞が登録されている場合に
は、解析の誤りが生じるという問題点がある。
【0011】本発明は、上述した従来の機械翻訳装置に
おける問題に鑑み、より質の高い翻訳を得ることができ
る機械翻訳装置を提供する。
【0012】
【課題を解決するための手段】本発明の機械翻訳装置
は、与えられた見出し語に基づいて基本辞書の辞書引き
を行う第1の辞書引き手段と、必要な語を登録すること
ができるユーザ辞書の辞書引きを行う第2の辞書引き手
段と、基本辞書に与えられた見出し語及び与えられた見
出し語に対応する異綴りフラグデータと与えられた見出
し語に対する基本辞書の辞書引きを抑止するための抑止
フラグデータとをユーザ辞書に登録する辞書登録手段
、基本辞書およびユーザ辞書を格納するための辞書・
規則メモリとを備えており、第2の辞書引き手段は、ユ
ーザ辞書を参照して与えられた見出し語に対応する異綴
りフラグデータを検出したときにユーザ辞書に登録され
ている基本辞書の見出し語を第1の辞書引き手段に与え
る見出し語置換手段を有する。
【0013】
【作用】基本辞書に登録されている見出し語と異綴りと
なっている見出し語をユーザ辞書に登録しようとする場
合、ユーザは辞書登録手段によってユーザ辞書に、異綴
りの見出し語と、異綴りフラグデータおよび基本辞書に
登録されている見出し語とを登録する。基本辞書および
ユーザ辞書は、辞書・規則メモリに格納される。そし
て、第2の辞書引き手段による辞書引きのときに、見出
し語置換手段は、与えらえた見出し語にもとづいてユー
ザ辞書を参照したとき、異綴りフラグデータを検出した
場合には、この見出し語に対応させてユーザ辞書に登録
されている基本辞書の見出し語を第1の辞書引き手段に
与える。第1の辞書引き手段はこの見出し語置換手段か
ら与えられた見出し語にもとづいて基本辞書の辞書引き
を行う。
【0014】本発明の機械翻訳装置に係る第2の辞書引
き手段は、ユーザ辞書を参照して抑止フラグデータを検
出したときに与えられた見出し語に対する辞書引きを抑
止するための情報を基本辞書に設定する抑止情報設定手
段を備えていてもよい。
【0015】本発明の機械翻訳装置に係る第1の辞書引
き手段は、与えられた見出し語に対する辞書引きを抑止
する情報が基本辞書に設定されているときに与えられた
見出し語による辞書引きを少なくとも部分的に抑止する
辞書引き制御手段を備えていてもよい。
【0016】
【実施例】以下、図面を参照して本発明の機械翻訳装置
における実施例を詳述する。
【0017】図1に本実施例の機械翻訳装置における主
要部の構成を示す。
【0018】図に示すように、主要部は、辞書引き形態
素解析部10、辞書・規則メモリ11及び辞書登録部12によ
り構成されている。
【0019】上記の辞書・規則メモリ11は、ユーザ辞書
13及び基本辞書14により構成されている。
【0020】辞書登録部12は、ユーザが所定の操作によ
りキーボード(後述する)から辞書・規則メモリ11を構
成しているユーザ辞書13に登録する見出し語、異綴りフ
ラグのデータ、並びに基本辞書14の見出し語を入力する
と、それらをCPU(後述する)を通じて受け取り、ユ
ーザ辞書13の見出し語と、異綴りフラグデータおよび基
本辞書14の見出し語とを対応させてユーザ辞書13に登録
する。
【0021】また、辞書登録部12は、ユーザが所定の操
作によりキーボードから基本辞書14の見出し語及び抑止
フラグのデータを入力すると、それらをCPUを通じて
受け取り、ユーザ辞書13に対応させて登録する。
【0022】辞書引き形態素解析部10は、基本辞書14に
対して辞書引きを行う第1の辞書引き部15と、ユーザ辞
書13に対して辞書引きを行う第2の辞書引き部16とを備
えている。第1の辞書引き手部は辞書引き制御手段17を
備えており、第2の辞書引き部16は処理選択部18、見出
し語置換部19及び抑止情報設定部20をそれぞれ備えてい
る。
【0023】処理選択部18は、与えられた見出し語に基
づいてユーザ辞書13を参照し、その見出し語に対して登
録されている異綴フラグデータ又は抑止フラグデータを
検出する。そして、異綴りフラグデータを検出した場合
には見出し語置換部19を起動し、他方、抑止フラグデー
タを検出した場合には抑止情報設定部20を起動するよう
に構成されている。
【0024】見出し語置換部19は、処理選択部18によっ
て起動されると、与えられた見出し語に対応させてユー
ザ辞書13に登録されている基本辞書14の見出し語を第1
の辞書引き部15に与える。
【0025】抑止情報設定部20は、処理選択部18によっ
て起動されると、与えられた見出し語に対する辞書引き
を抑止するための情報を基本辞書14に設定する。
【0026】辞書引き制御部17は、第1の辞書引き部15
が与えられた見出し語に基づいて基本辞書14の辞書引き
を行うときに、その見出し語に対して基本辞書14に辞書
引きを抑止するための情報が設定されている場合には、
第1の辞書引き部15で与えられた見出し語による辞書引
き又は特定の品詞での辞書引きを抑止する。
【0027】次に、図2に、図1の主要部を備えた本実
施例の機械翻訳装置の構成を示す。図2の機械翻訳装置
は、CPU(中央処理装置)21、メインメモリ22、CR
T(カソード・レイ・チューブ)23、キーボード24、翻
訳用の辞書、文法規則及び木構造変換規則などが格納さ
れた辞書・規則メモリ11、翻訳モジュ−ル25及び辞書登
録部12により構成されている。
【0028】図3に上記翻訳モジュ−ル25の構成を示
す。
【0029】翻訳モジュ−ル25は、辞書引き形態素解析
部10、構文解析部26、変換部27及び生成部28により構成
されている。
【0030】図4及び図5に示すチャートを参照して、
図1に示す本実施例の機械翻訳装置の動作を説明する。
【0031】ユーザは、キーボード24で所定の操作(例
えば英語の見出し語を入力)を行い、その品詞情報なら
びに見出し語のタイプを表すデータ、即ち、異綴りフラ
グデータ又は抑止フラグデータを入力する(ステップS
1a〜S1c)。
【0032】辞書登録部12は、これらのデータを受け取
ると、フラグデータを識別し(ステップS2)、異綴り
フラグデータが含まれている場合には、見出し語と異綴
りフラグデータとを対応させてユーザ辞書13に登録し
(ステップS3a)、その後、ユーザが入力する基本辞
書14の見出し語を受け取って、既に登録した見出し語に
対応させてユーザ辞書13に登録する(ステップS3
b)。
【0033】また、上記ステップS2で抑止フラグデー
タが含まれている場合には、見出し語と抑止フラグデー
タとを対応させてユーザ辞書13に登録する(ステップS
4)。 しかし、上記いずれのフラグデータも含まれて
いない場合には、辞書登録部12は、通常の登録処理を行
う(ステップS5)。
【0034】上述のように登録されたユーザ辞書13に基
づいて第1の辞書引き部15と第2の辞書引き部16は、次
のように動作する。
【0035】形態素解析部10で原文が形態素に分解さ
れ、見出し語が第2の辞書引き部16に与えられると(ス
テップS6)、処理選択部18は与えられた見出し語によ
りユーザ辞書13の辞書引きを行う(ステップS7)。そ
して、参照した見出し語に対して登録されているフラグ
データをチェックし(ステップS8)、異綴りフラグデ
ータが登録されている場合には、見出し語置換部19を起
動する。
【0036】その結果、見出し語置換部19は、この見出
し語に対応してユーザ辞書13に登録されている基本辞書
14の見出し語を第1の辞書引き部15に与える(ステップ
S10)。他方、参照した見出し語に対して抑止フラグデ
ータが登録されている場合には、処理選択部18は抑止情
報設定部20を起動する。そして抑止情報設定部20は基本
辞書14のこの見出し語に対する辞書引きを抑止するため
の情報を基本辞書14に設定する(ステップS11)。
【0037】参照した見出し語に対していずれのフラグ
データも登録されていない場合には、処理選択部18は、
見出し語置換部19及び抑止情報設定部20のいずれも起動
せず、第2の辞書引き部16は、通常の辞書引き処理を行
う(ステップS12)。
【0038】次に、第1の辞書引き部15が与えられた見
出し語を用いて基本辞書14に対する辞書引きを行うが
(ステップS13、S14)、辞書引き制御部17はその際、
見出し語に対して基本辞書14に辞書引きを抑止するため
の情報が設定されている場合には、第1の辞書引き部15
における辞書引きを抑止する。但し、その情報が特定の
品詞を指定するものである場合には、その品詞での辞書
引きを抑止する(ステップS15)。他方、上述のような
抑止情報が設定されていない場合には第1の辞書引き部
15は、通常の辞書引き処理を行う(ステップS16)。ま
た、第1の辞書引き部15は上記ステップS10で、見出し
語置換部19から見出し語が与えられた場合には、その見
出し語を用いて辞書引きを行う。
【0039】
【発明の効果】本発明の機械翻訳装置によれば、与えら
れた見出し語に基づいて基本辞書の辞書引きを行う第1
の辞書引き手段と、必要な語を登録することができるユ
ーザ辞書の辞書引きを行う第2の辞書引き手段と、基本
辞書に与えられた見出し語及び与えられた見出し語に対
応する異綴りフラグデータと与えられた見出し語に対す
る基本辞書の辞書引きを抑止するための抑止フラグデー
タとをユーザ辞書に登録する辞書登録手段と、基本辞書
およびユーザ辞書を格納するための辞書・規則メモリと
を備えており、第2の辞書引き手段は、ユーザ辞書を参
照して与えられた見出し語に対応する異綴りフラグデー
タを検出したときにユーザ辞書に登録されている基本辞
書の見出し語を第1の辞書引き手段に与える見出し語置
換手段を有するので、ユーザ辞書の異綴りの見出し語が
参照された場合には、その情報は基本辞書から取り出さ
れる。従ってユーザ辞書に登録された異綴りの見出し語
に対しても基本辞書に登録されている情報に基づいてよ
り質の高い翻訳結果を得ることが可能となる。また、異
綴りの見出し語をユーザ辞書に登録するときに、基本辞
書にも登録されている見出し語に関する情報を重複して
入力する必要がなくなるので、辞書登録の手間を省くこ
とができる。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の主要部を示すブロック
図である。
【図2】図1の主要部を備えた本発明における機械翻訳
装置の一実施例をしめす図である。
【図3】図1の翻訳モジュ−ルの構成を示す図である。
【図4】図2の機械翻訳装置におけるユ−ザ辞書の登録
プロセスを示すフロ−である。
【図5】図2の機械翻訳装置における辞書引きプロセス
を示すフロ−である。
【図6】従来の機械翻訳装置の一構成例を示すブロック
図である。
【図7】従来の機械翻訳装置の一部を詳しく示すブロッ
ク図である。
【符号の説明】
10 辞書引き形態素解析部 11 辞書・規則メモリ 12 辞書登録部 13 ユーザ辞書 14 基本辞書 15 第1の辞書引き部 16 第2の辞書引き部 17 辞書引き制御部 18 処理選択部 19 見出し語置換部 20 抑止情報設定手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐田 いち子 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 九津見 毅 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 平2−288976(JP,A) 特開 平3−129468(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 15/38

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】与えられた見出し語に基づいて基本辞書の
    辞書引きを行う第1の辞書引き手段と、必要な語を登録
    することができるユーザ辞書の辞書引きを行う第2の辞
    書引き手段と、前記基本辞書に与えられた見出し語及び
    当該与えられた見出し語に対応する異綴りフラグデータ
    と前記与えられた見出し語に対する前記基本辞書の辞書
    引きを抑止するための抑止フラグデータとを前記ユーザ
    辞書に登録する辞書登録手段と、前記基本辞書および前
    記ユーザ辞書を格納するための辞書・規則メモリとを備
    えており、前記第2の辞書引き手段は、前記ユーザ辞書
    を参照して前記与えられた見出し語に対応する前記異綴
    りフラグデータを検出したときに前記ユーザ辞書に登録
    されている前記基本辞書の見出し語を前記第1の辞書引
    き手段に与える見出し語置換手段を有することを特徴と
    する機械翻訳装置。
  2. 【請求項2】前記第2の辞書引き手段は、前記ユーザ辞
    書を参照して前記抑止フラグデータを検出したときに該
    与えられた見出し語に対する辞書引きを抑止するための
    情報を前記基本辞書に設定する抑止情報設定手段を備え
    ていることを特徴とする請求項1に記載の機械翻訳装
    置。
  3. 【請求項3】前記第1の辞書引き手段は、前記与えられ
    た見出し語に対する辞書引きを抑止する情報が前記基本
    辞書に設定されているときに該与えられた見出し語によ
    る辞書引きを少なくとも部分的に抑止する辞書引き制御
    手段を備えていることを特徴とする請求項1又は2に記
    載の機械翻訳装置。
JP3049815A 1991-03-14 1991-03-14 機械翻訳装置 Expired - Lifetime JP2766738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3049815A JP2766738B2 (ja) 1991-03-14 1991-03-14 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3049815A JP2766738B2 (ja) 1991-03-14 1991-03-14 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH04284569A JPH04284569A (ja) 1992-10-09
JP2766738B2 true JP2766738B2 (ja) 1998-06-18

Family

ID=12841620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3049815A Expired - Lifetime JP2766738B2 (ja) 1991-03-14 1991-03-14 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2766738B2 (ja)

Also Published As

Publication number Publication date
JPH04284569A (ja) 1992-10-09

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JP2880601B2 (ja) 言語処理装置
JP2815714B2 (ja) 翻訳装置
US4860206A (en) Translation system allowing user designation of postpositional words
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0351022B2 (ja)
JP2766738B2 (ja) 機械翻訳装置
JP2655922B2 (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JP2807586B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP2871300B2 (ja) 機械翻訳装置
JP2859661B2 (ja) 機械翻訳装置
JP2926745B2 (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP3255294B2 (ja) 機械翻訳装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPH06149867A (ja) 熟語登録装置
JP2004171397A (ja) 翻訳支援装置
JPH05158971A (ja) 機械翻訳装置
JPH04296969A (ja) 機械翻訳装置
JPH05181854A (ja) 文章校正装置および文章処理装置、ならびに漢字仮名変換装置