JP2871300B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2871300B2
JP2871300B2 JP4142737A JP14273792A JP2871300B2 JP 2871300 B2 JP2871300 B2 JP 2871300B2 JP 4142737 A JP4142737 A JP 4142737A JP 14273792 A JP14273792 A JP 14273792A JP 2871300 B2 JP2871300 B2 JP 2871300B2
Authority
JP
Japan
Prior art keywords
word
translation
dictionary
information
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4142737A
Other languages
English (en)
Other versions
JPH05334339A (ja
Inventor
晶子 新美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP4142737A priority Critical patent/JP2871300B2/ja
Publication of JPH05334339A publication Critical patent/JPH05334339A/ja
Application granted granted Critical
Publication of JP2871300B2 publication Critical patent/JP2871300B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳装置に係り、
特にユーザが機械翻訳装置用の電子辞書を構築する際の
辞書編集手段に関するものである。
【0002】
【従来の技術】従来、機械翻訳などのシステムで用いる
電子辞書は予めシステム内に構築してある基本辞書だけ
でなく、ユーザが翻訳業務の中で随時必要な語を登録す
るユーザ辞書の二本立てで構成されている。機械で翻訳
を行うために状況に即したユーザ辞書が不可欠である。
しかし、ユーザ辞書は基本辞書とは異なり、機械翻訳に
対して専門知識の無いユーザが作成するので、ユーザの
手間を必要最低限にするためにもソース語の見出し語と
対訳、または既存の学習用辞書を見ればわかる程度の必
要最低限の情報だけをユーザに入力させ、後はデフォル
ト的に値を補うといった簡易的なユーザ辞書を構築させ
ることが多かった。従って、例えば日本語から英語に翻
訳する際のユーザ辞書を構築する際に、デフォルト的な
値としてそれぞれの言語的特徴を利用している。ユーザ
が用いる訳語が複数の単語から成り立っている複合語に
なった場合の活用は、通常英語の特性からその品詞に依
存してある程度決めることができると言える。例えば、
英語の名詞ならば「パソコン」が "personal computer
(s)" のように最後の単語、動詞ならば「共用する」が"
use(d) in common"のように先頭の単語、という具合い
にその品詞の特徴から活用する単語を決定し、必要なら
ば規則変化、不規則変化などの活用の種類をユーザに入
力させるという手法がとられていた。
【0003】
【発明が解決しようとする課題】しかしながら、実際に
は、システム内で勝手に値を決めてしまうとうまくいか
ないことがある。例えばソース語が日本語で翻訳語が英
語である日英機械翻訳システムにおいて、日本語の「ボ
ケ切れする」に当たる英語を"fray and break"としたと
すると、当然その翻訳語の活用は過去形が"frayed and
broke"、過去分詞形が"frayed and broken" になるはず
なのに、動詞は先頭の単語を活用させるという手法があ
るために"fray"しか活用しない。そのため、過去形が"f
rayed andbreak"、過去分詞形が"frayed and break"と
いうように不自然な動詞の活用ができてしまう。ユーザ
はこれらに対して、翻訳が終了し英文が生成された後で
毎回人手で修正しなくてはならないという問題があっ
た。
【0004】本発明は、上述した問題点を解決するため
になされたものであり、翻訳語が複合語である場合はそ
の翻訳語を構成する単語のうち活用するすべての単語を
正しく活用させるための情報をユーザが任意に指定・設
定できるようにし、その情報を電子辞書に登録するの
で、後編集などのユーザへの付加を軽減する機械翻訳装
置を提供することを目的とする。
【0005】
【課題を解決するための手段】この目的を達成するため
に本発明の機械翻訳装置は、翻訳対象語と翻訳語とが対
応付けられて格納されている電子辞書を備え、前記電子
辞書に基づいて機械翻訳を行う機械翻訳装置であって、
前記電子辞書は、格納される翻訳語のうち、複数の単語
から成り立っている複合語について、その構成要素であ
る単語と、その各単語の品詞を格納するフィールドおよ
び、その単語が活用するか否かの情報を任意に設定・格
納できる活用フィールドを有し、出力されるべき翻訳文
の活用形が指定されたときには、前記電子辞書中の活用
フィールドの記述に基づいて、翻訳文を構成する各翻訳
語を指定された活用形に活用させて出力させるようにし
ている。
【0006】また、本発明の請求項2にかかる機械翻訳
装置は、前記電子辞書に未登録語を登録するために、翻
訳対象語と翻訳語とを入力可能とする入力手段と、前記
入力された翻訳語が複合語であるか否かを自動判別する
判別手段と、前記翻訳語が複合語であった場合、前記翻
訳語を構成する複数の単語のうちから、活用する単語の
指定を要求する指定要求手段と、前記翻訳語を見出し語
とするフィールドを電子辞書に作成し、該見出し語に対
応付けて、前記各単語、該各単語の品詞、及び該各単語
の活用するか否かの情報とを前記フィールドに格納する
格納手段と、を備えている。
【0007】
【作用】上記の構成を有する本発明の機械翻訳装置に於
いては、翻訳語が複合語である場合、その翻訳語につい
て、電子辞書の活用フィールドに、その翻訳語の構成要
素である各単語が活用するか否かの情報を任意に設定・
格納可能となっている。よって、機械翻訳実行時には、
前記電子辞書に格納されたこれらの情報を参照して、翻
訳対象語に対応する翻訳語が複合語であっても、後編集
を行うことなく、前記翻訳語を構成する単語のうち活用
する全ての単語を指定された活用形に正しく活用させ
て、正しい訳文を出力することができる。
【0008】また、請求項2に記載の機械翻訳機に於い
ては、未登録語の登録時に、その入力された翻訳語が複
合語か否かを自動判別し、翻訳語が複合語である場合に
は、その構成要素である各単語が活用するか否かの情報
をユーザによって設定可能となっている。そして、電子
辞書に、未登録語の登録と共にその翻訳語を構成する単
語と、その品詞、活用の有無情報を格納する。よって、
翻訳語を正しく活用させるための情報を、専門知識の無
いユーザが簡単に入力し、電子辞書に登録することがで
きる。
【0009】
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
【0010】図1は、本発明に関する機械翻訳装置のハ
ードウェア構成を概略的に示すブロック図である。同図
に示されるように、この日英機械翻訳装置10は、計算
機で構成されたデータ処理部11と、CRT等で構成さ
れる表示部12と、キーボードなどで構成された入力部
13と、走査型プリンタやレーザープリンタなどで構成
される印刷部14と、ハードディスクや光ディスクなど
に格納された電子辞書15から成る。
【0011】前記電子辞書15は、システムが内部に持
っている基本辞書とユーザが必要なものを登録できるユ
ーザ辞書を包含しており、ソース語としての日本語を解
析するために必要な日本語形態素解析辞書部31と、日
本語構文解析辞書部32と、日本語から翻訳語である英
語へ変換するために必要な変換辞書部33と、翻訳語で
ある英語を生成するために必要な英語構文生成辞書部3
4と、英語形態素生成辞書部35とから成る。
【0012】前記データ処理部11内には、計算機の機
能を利用してソフトウェア的に実現された翻訳処理を行
う翻訳部16と、前記入力部13からの入力、翻訳の前
後の編集や辞書登録を行い、入力文や出力文を前記表示
部12のCRTに送る編集部17と、入出力されるデー
タを一時的に格納するデータ格納部18と、ユーザが前
記編集部17の辞書登録メニューに従って前記入力部1
3より入力した辞書情報を加工し、前記電子辞書15に
登録したり削除する複合語編集部19から成る。
【0013】前記複合語編集部19は、英語複合語中の
スペースを検出するスペース検出部41と、複合語を構
成している各単語に分割して編集を行う単語分割処理部
42と、ユーザが入力した前記各単語が活用するか否か
の情報を取り込みどの単語が活用するかという情報に読
み替えて一時的に格納する格納部43と、前記フィール
ドに活用するという情報が格納されている前記各単語毎
に前記電子辞書15中の前記英語形態素生成辞書部35
を検索し、前記英語形態素生成辞書部35内に活用情報
があるかどうかを確認する辞書検索部44とから成る。
【0014】前記英語形態素生成辞書部35内には、図
2に示すように、見出し語フィールド61と、その見出
し語の品詞62と、見出し語が複合語であれば構成単語
フィールド63と、その構成単語の品詞フィールド64
と、その構成単語が活用することを示す活用フィールド
65からなる複合語情報フィールド60が設けてある。
また、見出し語が一語で構成されている場合に必要であ
る規則活用か不規則活用かを示す値が入る活用形情報フ
ィールド66がある。不規則活用を意味する値が不規則
活用である場合のみ過去形の情報を記述するための過去
形フィールド67と過去分詞形の情報を記述する過去分
詞形フィールド68とに情報が記述される。また、現在
分詞形を作る場合に必要になる語尾の子音を重ねるか規
則変化かを示す値が入る現在分詞形フィールド69があ
る。
【0015】次に、この機械翻訳システムの基本的な動
作について概略的に説明する。
【0016】前記入力部13から入力されたソース語の
入力文は、前記編集部17で必要に応じて適切な形に編
集された後、前記翻訳部16に送られる。前記翻訳部1
6は前記電子辞書15を用いながら入力文を翻訳語に翻
訳し、その結果である出力文を前記データ格納部18に
一時的に格納する。ユーザが前記入力部13から前記編
集部17を起動して必要な出力文を指定すると、前記編
集部17は前記データ格納部18から出力文を取り出し
て前記表示部12に表示したり、あるいは前記印刷部1
4から出力させる。もし、出力文中に辞書情報に誤りが
ある語や、未登録語が見つかれば、次回の翻訳精度を上
げるために、ユーザは随時前記編集部17を起動してユ
ーザ辞書を作成して前記電子辞書15に登録したり、す
でにある辞書内容を修正したりする。
【0017】日英機械翻訳システムで用いる電子辞書で
は、ソース語が一まとまりの単語であれば翻訳語も一ま
とまりとして扱うことが多い。そこでどうしても訳語も
複合語の形態をとることが多くなる。このような複合語
の形態をとる訳語を電子辞書に新規登録したり、修正し
たりする際の処理の流れを、未登録語「ボケ切れする」
が電子辞書内に登録される過程を例にとって、図3に示
す。
【0018】まず、動詞「ボケ切れする」を前記電子辞
書15内に登録するために、図4に示すように、ユーザ
は前記編集部17の辞書登録メニューを前記入力部13
より起動し、登録したい見出し語である「ボケ切れす
る」を、次にその訳語"fray and break"を前記入力部1
3より入力する(S1)。英語は、その言語的特徴か
ら、複合語の多くは主となる語、つまり活用する語の位
置を品詞によって決定することができる。動詞では、例
えば「共用する」の"use(d) in common"のように、先頭
の"use"が活用する語、すなわち主動詞である。ところ
が、「ボケ切れする」の訳語"fray and break"の場合、
上記のルールには当てはまらずに活用は過去形が"fraye
d and broke"、過去分詞形が"frayed and broken" にな
り、主動詞を二つ持っている。
【0019】前記複合語編集部19は前記編集部17か
ら、ユーザに前記入力部13より入力された訳語のデー
タを受け取る。その内部のスペース検出部41は訳語内
にスペースが含まれているかどうかを判断する(S
2)。スペースが含まれていれば複合語であると判断
し、前記単語分割処理部42で複合語処理に入り、スペ
ース毎に各単語に分割する(S3)。
【0020】前記複合語編集部19は複合語処理のため
のメニューに入るように前記編集部17に伝え、前記編
集部17は訳語中の活用する語、すなわち主動詞が何番
目の単語かという質問を前記表示部12に表示させ(S
4)、図5に示すように、ユーザは前記入力部13より
「1」と「3」を入力する。この番号は前記複合語編集
部18内の前記格納部43に送られ、ここで一番目の"f
ray"と三番目の"break"がそれぞれ動詞であり、活用す
る単語であるという情報に読み変えられる。そして前記
格納部43は前記単語分割処理部42で"fray"、"an
d"、"break"に分けられている各単語に、活用する単語
は必ず元の見出し語と同一品詞であるということから、
S5から"fray"と"break"を動詞であるとし、各単語の
見出し語と、その品詞と、活用するという情報を格納す
る(S5)。
【0021】前記複合語編集部19内の辞書検索部44
は前記電子辞書15内の前記英語形態素生成辞書部35
を検索し、"fray"と"break"の個々の辞書情報があるか
どうか調べる(S6)。個々の辞書情報が前記英語形態
素生成辞書部35に存在する場合、構文情報他の辞書情
報を入力する(S8)。個々の辞書情報が前記英語形態
素生成辞書部部35に存在しない場合、前記編集部17
に活用形の情報や不規則変化の場合の分詞形など個々の
辞書の形態素情報を付与させるメニューを前記表示部1
2に表示させる(S7)。
【0022】もし、訳語内にスペースが含まれていなけ
れば複合語処理には入らずに、直接形態素情報を付与さ
せるためのメニューに入る(S7)。
【0023】必要な形態素情報が入力されたら、前記編
集部で他の辞書情報を入力させる(S8)。情報が揃っ
たところで、前記編集部17は、ユーザにより前記入力
部13から入力された前記データ格納部18内の辞書情
報と、前記複合語編集部19内の前記格納部43に格納
してある複合語情報をまとめて前記電子辞書15に登録
する(S9)。
【0024】以下、前記電子辞書15内の前記英語形態
素生成辞書部35に実際に情報が格納される順序を図6
を用いて説明する。「ボケ切れする」の訳語"fray and
break"の場合、前記S5で前記格納部43に格納された
情報から、前記英語形態素生成辞書部35内の各フィー
ルドにそれぞれ以下のように情報が格納される。まず"f
ray and break"が前記見出し語フィールド61に記述さ
れ(S11)、その品詞である"V(動詞)"が前記品詞
フィールド62に記述される(S12)。前記複合語情
報フィールド60内の前記構成単語フィールド63には
前記単語分割処理部42で分割され前記格納部43に格
納されている個々の見出し語である"fray"と"and"と"br
eak"がそれぞれ記述される(S13)。前記品詞フィー
ルド64には前記格納部43に格納されている"fray"
と"break"が動詞であるという情報から"fray"と"break"
に品詞情報を記述し、活用しない"and"については品詞
の情報は不要なので何も記述しない(S14)。前記活
用フィールド65には"fray"と"break"について活用す
ることを示すフラグ"T"がたてられる(S15)。
【0025】個々の単語の情報が前記英語形態素生成辞
書に既に登録されていなければ、前記S7で示されてい
るようにメニューで前記各フィールドに情報を記述して
いくことになる。その場合の格納手順は以下の通りであ
る。前出の"fray"の場合、複合語ではないので前記複合
語情報フィールド60の中は何も記述されない。代わり
に前記活用形情報フィールド66に規則変化を示す値が
記述される(S16)。ここで不規則変化を示す値が記
述されると、前記過去形フィールド67と前記過去分詞
形フィールド68に必要な値が記述される(S1
7)。"break"の場合、前記活用形情報フィールド66
に不規則変化を示す値と、前記過去形フィールド67
に"broke"、前記過去分詞形フィールド68に"broken"
が記述される。その後前記現在分詞形フィールド69に
規則変化を示す値が記述される(S18)。
【0026】以上の例はユーザが登録したい語が電子辞
書内に未登録であった場合を述べた。しかしながら、ユ
ーザがある見出し語の対訳語を変更したい場合であって
も、英訳語が複合語であれば新しい訳語を入力した時点
で同様のスペース検出が行われ、同様の効果が期待でき
る。また、今回の例のような見出し語は小数であるか
ら、ユーザインターフェースとしては品詞によって一応
活用語の候補となる単語を表示してユーザに確認を求
め、必要なものだけ上記のような処理に入るように応用
することも可能である。見出し語の中に"and"や"or"と
いった接続詞が入っていると、この例のように活用する
語が複数含まれている可能性が高いから、該当するもの
のみ今回の処理に優先的にかけてもよい。本発明は機械
翻訳装置で用いる複数言語間の辞書のみならず、言語を
扱う他の自然言語処理用の電子辞書やシソーラス、知識
データベース等の構築にも応用することができる。
【0027】
【発明の効果】以上説明したことから明かなように、本
発明の複合語編集部を有する機械翻訳装置によれば、翻
訳などで用いる電子辞書に、翻訳語が複合語であり活用
する語であった場合でも、その構成要素であるすべての
単語が正しく活用させることができ、後編集などのユー
ザへの付加を軽減することができる。
【0028】また、請求項2にかかる機械翻訳装置によ
れば、複合語である翻訳語を構成するすべての単語を正
しく活用させるための情報を、専門知識の無いユーザが
簡単に入力でき、電子辞書に登録することができる。
【図面の簡単な説明】
【図1】本発明の構成を示すブロック図である。
【図2】本発明に関わる一実施例の電子辞書に格納され
ている辞書情報である。
【図3】本発明に関わる一実施例の未登録語が電子辞書
内に登録される流れを示すフローチャートである。
【図4】本発明に関わる一実施例の日本語の見出し語、
英訳を入力するメニュー画面の図である。
【図5】本発明に関わる一実施例の主動詞の順番を入力
する画面の図である。
【図6】本発明に関わる英語形態素生成辞書に情報を格
納する一実施例の流れを示すフローチャートである。
【符号の説明】
10 日英機械翻訳装置 11 データ処理部 13 入力部 15 電子辞書 19 複合語編集部 35 英語形態素生成辞書部 60 複合語情報フィールド 61 見出し語フィールド 63 構成単語フィールド 64 品詞フィールド 65 活用フィールド

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 翻訳対象語と翻訳語とが対応付けられて
    格納されている電子辞書を備え、前記電子辞書に基づい
    て機械翻訳出力を行う機械翻訳装置であって、前記電子
    辞書は、格納される翻訳語のうち、複数の単語から成り
    立っている複合語について、その構成要素である単語
    と、その各単語の品詞を格納するフィールドおよび、そ
    の単語が活用するか否かの情報を任意に設定・格納でき
    る活用フィールドを有し、 出力されるべき翻訳文の活用形が指定されたときには、
    前記電子辞書中の活用フィールドの記述に基づいて、翻
    訳文を構成する各翻訳語を指定された活用形に活用させ
    て出力させることを特徴とする機械翻訳装置。
  2. 【請求項2】 前記電子辞書に未登録語を登録するため
    に、翻訳対象語と翻訳語とを入力可能とする入力手段
    と、 前記入力された翻訳語が複合語であるか否かを自動判別
    する判別手段と、 前記翻訳語が複合語であった場合、前記翻訳語を構成す
    る複数の単語のうちから、活用する単語の指定を要求す
    る指定要求手段と、 前記翻訳語を見出し語とするフィールドを電子辞書に作
    成し、該見出し語に対応付けて、前記各単語、該各単語
    の品詞、及び該各単語の活用するか否かの情報とを前記
    フィールドに格納する格納手段と、 を備えることを特徴とする請求項1に記載の機械翻訳装
    置。
JP4142737A 1992-06-03 1992-06-03 機械翻訳装置 Expired - Fee Related JP2871300B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4142737A JP2871300B2 (ja) 1992-06-03 1992-06-03 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4142737A JP2871300B2 (ja) 1992-06-03 1992-06-03 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH05334339A JPH05334339A (ja) 1993-12-17
JP2871300B2 true JP2871300B2 (ja) 1999-03-17

Family

ID=15322411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4142737A Expired - Fee Related JP2871300B2 (ja) 1992-06-03 1992-06-03 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2871300B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4035354B2 (ja) 2001-07-11 2008-01-23 富士通株式会社 電子回路設計方法及び装置、コンピュータプログラム及び記憶媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5892063A (ja) * 1981-11-27 1983-06-01 Hitachi Ltd イデイオム処理方式

Also Published As

Publication number Publication date
JPH05334339A (ja) 1993-12-17

Similar Documents

Publication Publication Date Title
US5644774A (en) Machine translation system having idiom processing function
US5088039A (en) System for translating adverb phrases placed between two commas through a converter using tree-structured conversion rules
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP2871300B2 (ja) 機械翻訳装置
JPS6190269A (ja) 翻訳方式
JP4007630B2 (ja) 対訳例文登録装置
JPH03260764A (ja) 翻訳用辞書登録方式
JPS6190272A (ja) 辞書機能を用いた翻訳方式
JP2719453B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP2807586B2 (ja) 機械翻訳装置
JP2002183134A (ja) 翻訳装置
JP3692711B2 (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH09185629A (ja) 機械翻訳方法
JP3233800B2 (ja) 機械翻訳装置
JPH06119373A (ja) 機械翻訳装置
JPH06295310A (ja) 機械翻訳装置
JPH03217970A (ja) 機械翻訳システム
JPH05334340A (ja) 機械翻訳装置
JPH07182342A (ja) 機械翻訳装置
JPH0635964A (ja) 機械翻訳装置
JPH06180713A (ja) 機械翻訳装置
JPH07262194A (ja) 機械翻訳装置
JPH0635965A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080108

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100108

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees