JP2817497B2 - 辞書編集装置 - Google Patents

辞書編集装置

Info

Publication number
JP2817497B2
JP2817497B2 JP4042367A JP4236792A JP2817497B2 JP 2817497 B2 JP2817497 B2 JP 2817497B2 JP 4042367 A JP4042367 A JP 4042367A JP 4236792 A JP4236792 A JP 4236792A JP 2817497 B2 JP2817497 B2 JP 2817497B2
Authority
JP
Japan
Prior art keywords
information
dictionary
translation
sentence
syntax pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4042367A
Other languages
English (en)
Other versions
JPH05216922A (ja
Inventor
神一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4042367A priority Critical patent/JP2817497B2/ja
Publication of JPH05216922A publication Critical patent/JPH05216922A/ja
Application granted granted Critical
Publication of JP2817497B2 publication Critical patent/JP2817497B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電子計算機を利用した機
械翻訳システムにおける辞書編集装置に関するものであ
る。
【0002】
【従来の技術】機械翻訳の精度を向上させるには、辞書
の整備が不可欠であり、そのためのツールとして辞書編
集装置が用意されている。なお、辞書に登録される情報
としては名詞等に関するものも当然に存在するが、本発
明では動詞に関するもののみを対象としている。
【0003】従来の辞書編集装置では、動詞の登録を行
う場合、利用者が原語と訳語とを入力した上で、辞書編
集装置が表示するメニューに対して適宜に選択を行うこ
とにより、辞書情報の作成を行っていた。
【0004】図8は従来の辞書編集装置が表示していた
メニューの項目の例を示したものであり、文型,相情
報,意味分類,訳文文型等の詳細な情報を要求するもの
であった。
【0005】
【発明が解決しようとする課題】上述したように、従来
の辞書編集装置では、利用者が辞書情報として必要な全
てのデータの設定を行わなければならなかったため、次
のような欠点が指摘されていた。
【0006】文型や格要素情報等の文法的な内容につ
き難しい選択判断を要求されることが多く、利用者にか
かる精神的な負担が大きい。
【0007】誤った選択判断を行うことにより、原
文,訳文での用法と適合しない辞書情報を作ってしまう
ことがしばしばあり、その場合は後の翻訳実行時に正し
い翻訳結果が得られなくなり、翻訳精度が低下する。
【0008】本発明は上記の点に鑑み提案されたもので
あり、その目的とするところは、容易に、かつ正確な辞
書情報を作成することのできる辞書編集装置を提供する
ことにある。
【0009】
【課題を解決するための手段】本発明は上記の目的を達
成するため、翻訳に必要な情報を格納する辞書と、この
辞書を用い、原文テキストを解析して訳文を含む対訳情
報を出力する翻訳装置と、出力された対訳情報を分析
し、構文パターン情報を抽出する対訳情報分析装置と、
抽出された構文パターン情報を表示すると共に、この構
文パターン情報に必要な修正を行わせる入出力装置と、
修正後の構文パターン情報である修正情報を分析し、そ
の内容を反映した辞書情報を作成する辞書情報作成装置
と、作成された辞書情報を辞書に書き込む出力装置とを
備えるようにしている。
【0010】
【作用】本発明の辞書編集装置にあっては、翻訳に必要
な情報を格納した辞書を用いて、翻訳装置が原文テキス
トを解析して訳文を含む対訳情報を出力し、出力された
対訳情報を対訳情報分析装置が分析して構文パターン情
報を抽出し、抽出された構文パターン情報を入出力装置
が表示すると共に、この構文パターン情報に必要な修正
を行わせる。修正の後、辞書情報作成装置は修正後の構
文パターン情報である修正情報を分析してその内容を反
映した辞書情報を作成し、出力装置は作成された辞書情
報を辞書に書き込む。
【0011】
【実施例】以下、本発明の実施例につき、図面を参照し
て説明する。
【0012】図1は本発明の辞書編集装置の一実施例を
示す構成図である。
【0013】図1において、本実施例は、これから登録
しようとする辞書情報を特徴付けるのに適するテスト用
の原文を含んだ原文テキスト11と、翻訳に必要な情報
を格納した既存の辞書12と、この辞書12を用い、原
文テキスト11を解析して訳文を含む対訳情報14を出
力する翻訳装置13と、出力された対訳情報14を分析
し、構文パターン情報16を抽出する対訳情報分析装置
15と、抽出された構文パターン情報16をディスプレ
イに表示すると共に、この構文パターン情報に対して利
用者に必要な修正を行わせる入出力装置17と、修正後
の構文パターン情報である修正情報を分析し、その内容
を反映した辞書情報を作成する辞書情報作成装置18
と、作成された辞書情報を辞書12に書き込む出力装置
19とから構成されている。
【0014】以下、具体例を交えて、上記の実施例の動
作を説明する。
【0015】先ず、翻訳装置13は原文テキスト11を
入力し、原文テキスト11を解析し、その過程で辞書1
2を用い、対訳情報14を出力する。
【0016】図2は辞書12に登録されている辞書情報
の例を示したものであり、上段は日英翻訳用の辞書情報
の例であり、下段は英日翻訳用の辞書情報の例である。
図示のように、原語に関する情報と訳語に関する情報と
がそれぞれブロック化されており、対応する原語と訳語
とがリンクされている。また、同じ原語であっても用法
等の違うものは別のブロックとされ、互いにリンクされ
ている。なお、各ブロックには、各種の情報が登録され
ているが、その中でも特に重要なのが文型である。それ
は、文型が誤っていると原文解析あるいは訳文生成の処
理過程で破綻してしまい、正しい訳文が得られなくなる
からである。
【0017】図3は翻訳装置13が出力する対訳情報1
4の例を示したものであり、原文,訳文の他に、原文形
態素,原文文節,原文掛かり受け,訳文形態素等の情報
が含まれている。
【0018】次に、図1において、対訳情報分析装置1
5は、翻訳装置13によって出力された対訳情報14を
分析し、主として、原文の動詞を中心とした掛かり受け
関係の情報を抽出することにより、構文パターン情報1
6を生成する。
【0019】図4は対訳情報分析装置15による対訳情
報14から構文パターン情報16の抽出の例を示したも
のである。なお、ここでは原文として2つの日本語文が
与えられている。
【0020】図4において、対訳情報分析装置15は、
先ず、対訳情報14中の原文形態素の情報を先頭から順
に調べ、品詞が動詞であるものを捜し出す。この例で
は、サ変動詞である「処理」が見つけ出される。
【0021】次いで、その動詞を中心とした掛かり受け
関係を、原文文節,原文掛かり受け等の情報から抽出す
る。第1の原文では、「コンピュータが」と「データ
を」とが抽出される。なお、「高速に」も「処理」に掛
かっているが、形容動詞であるため、対象から除外され
る。従って、第1の原文の構文パターンとしては、
「(コンピュータ)が(データ)を処理する」という形
で抽出される。なお、括弧内は構文に影響しない名詞等
を示している。
【0022】また、第2の原文では、「計算機が」と
「情報を」とが抽出される。ここで、「情報を」は直接
の目的語ではなく、埋め込み文によって修飾された語句
であるが、「処理」の実質的な対象を表しているもので
あるため、抽出の対象となる。従って、構文パターンと
しては、埋め込み文でない形にされ、「(計算機)が
(情報)を処理する」という形で抽出される。なお、埋
め込み文によって修飾された語句については、助詞
「を」が自動的に付加される。
【0023】このように、日本語の場合は、動作の主体
(AGT)を表す「が」,動作の対象(OBJ)を表す
「を」,動作の起点(SOR)を表す「から」,動作の
終点(TAR)を表す「に」,動作の同伴物もしくは内
容を表す「と」,動作の焦点(FCS)を表す「で」等
の助詞を伴う文節と、埋め込み文によって修飾された語
句とが抽出の対象となる。また、英語の場合は、主語,
目的語,補語,前置詞句,不定詞句等が抽出の対象とな
る。
【0024】そして、対訳情報分析装置15は、構文パ
ターン情報16として、 ・対象となっている動詞の原語 ・構文パターンとして抽出した原文 ・対象となっている動詞の訳語 ・構文パターンとして抽出した原文に対応する訳文 を出力する。
【0025】次に、図1において、入出力装置17は、
対訳情報分析装置15によって抽出された構文パターン
情報16をディスプレイに表示すると共に、この構文パ
ターン情報16に対して利用者に必要な修正を行わせ
る。
【0026】次いで、辞書情報作成装置18は、修正後
の構文パターン情報である修正情報を分析し、その内容
を反映した辞書情報を作成する。
【0027】図5は入出力装置17による構文パターン
情報16への修正と辞書情報作成装置18による修正情
報17Aから辞書情報18Aの作成の例を示す図であ
る。
【0028】図5において、利用者は、動詞「処理」の
訳語として「dispose」は適切でないと判断する
と、入出力装置17のキーボード等を用いて、訳語を例
えば「process」に修正し、訳文の中の「dis
poses of」を「processes」に修正す
る。なお、この例では、原文の構文パターンについては
修正していない。このようにして修正された構文パター
ン情報は修正情報17Aとして辞書情報作成装置18に
与えられる。
【0029】この場合、辞書情報作成装置18は、修正
情報17Aの内容を充分に反映した辞書情報として、原
語「処理」,品詞「サ変」,文型「(AGT)が(OB
J)を」に対応する訳語として、訳語「proces
s」,品詞「動詞」,文型「S+V+O,S=AGT,
O=OBJ」の情報を対応付けた辞書情報18Aを生成
する。
【0030】図6は入出力装置17による構文パターン
情報16への修正と辞書情報作成装置18による修正情
報17Aから辞書情報18Aの作成の他の例を示したも
のであり、同一の動詞に複数の訳語が指定された場合の
処理の例を示している。
【0031】図6において、利用者は、「(彼)が起き
る」という場合の動詞「起きる」の訳語としては「oc
cur」でなく「get up」が適切であり、「(事
故)が起きる」という場合は「happen」が適切で
あると判断すると、それぞれの原文に対応する訳語と訳
文とを修正する。
【0032】この場合、辞書情報作成装置18は、2つ
の訳語の文型が同じであるため、格要素の意味分類に違
いがないか否かを調べ、「彼」は人であり、「事故」は
現象であることから、原語「起きる」に対応するブロッ
クを2つ生成して互いにリンクし、一方の格要素を「O
BJ=人」とし、他方の格要素を「OBJ=現象」と
し、他の情報は同じにする。そして、訳語「get u
p」と訳語「happen」のブロックを作成し、対応
する原語のブロックとリンクして、辞書情報18Aを作
成する。このようにして作成された辞書情報を用いて翻
訳を行う場合、「×××が起きる」という原文に対し、
「×××」が人であれば「起きる」は「get up」
と翻訳され、「×××」が現象であれば「happe
n」と翻訳される。例えば、「メアリーが起きる」,
「地震が起きる」はそれぞれ「Marygets u
p.」,「An earthquake happen
s.」と翻訳されることになる。
【0033】図7は英日翻訳における入出力装置17に
よる構文パターン情報16への修正と辞書情報作成装置
18による修正情報17Aから辞書情報18Aの作成の
例を示したものである。
【0034】図7において、利用者は、「(NEC C
orporation) develops (a m
achine translation syste
m).」という文における「develop」の訳語と
しては「発展させる」ではなく「開発する」が適切であ
り、「(A machine translation
system) develops.」という場合は
「発展する」ではなく「成長する」が適切であると判断
すると、それぞれの原文に対応する訳語と訳文とを修正
する。
【0035】この場合、辞書情報作成装置18は、文型
が「S+V+O」のときは「(SUB)が(OBJ)を
開発する」と翻訳し、文型が「S+V」のときは「(S
UB)が成長する」と翻訳するような辞書情報18Aを
生成する。なお、この場合は、文型が互いに異なるた
め、格要素の意味分類による訳し分けの情報は作成しな
い。
【0036】次に、図1において、出力装置19は、辞
書情報作成装置18によって作成された辞書情報(18
A)を辞書12に書き込む。この際、既存の辞書情報と
矛盾が生じないように、不要な情報の削除等も併せて行
う。
【0037】
【発明の効果】以上説明したように、本発明の辞書編集
装置にあっては、次のような効果がある。
【0038】辞書情報を作成しようとする利用者は、
適当なテスト用の原文テキストを用意し、ディスプレイ
に表示された文型,訳語,訳文に必要な修正を加えるだ
けで、その内容を反映した辞書情報が自動的に作成され
るため、従来のようにメニューに従って難しい選択判断
を行う必要がなくなり、精神的な負担が大幅に軽減され
る。
【0039】原文および訳文に即した正しい辞書情報
が作成されるため、翻訳の精度が大幅に向上する。
【図面の簡単な説明】
【図1】本発明の辞書編集装置の一実施例を示す構成図
である。
【図2】辞書の例を示す図である。
【図3】対訳情報の例を示す図である。
【図4】対訳情報分析装置による対訳情報から構文パタ
ーン情報の抽出の説明図である。
【図5】入出力装置による構文パターン情報への修正と
辞書情報作成装置による修正情報から辞書情報の作成の
説明図である。
【図6】構文パターン情報,修正情報,辞書情報の他の
例を示す図である。
【図7】英日翻訳における構文パターン情報,修正情
報,辞書情報の例を示す図である。
【図8】従来の動詞の登録に際して入力要求を行うメニ
ューの例を示す図である。
【符号の説明】
11……原文テキスト 12……辞書 13……翻訳装置 14……対訳情報 15……対訳情報分析装置 16……構文パターン情報 17……入出力装置 17A…修正情報 18……辞書情報作成装置 18A…辞書情報 19……出力装置

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 翻訳に必要な情報を格納する辞書と、 この辞書を用い、原文テキストを解析して訳文を含む対
    訳情報を出力する翻訳装置と、 出力された対訳情報を分析し、構文パターン情報を抽出
    する対訳情報分析装置と、 抽出された構文パターン情報を表示すると共に、この構
    文パターン情報に必要な修正を行わせる入出力装置と、 修正後の構文パターン情報である修正情報を分析し、そ
    の内容を反映した辞書情報を作成する辞書情報作成装置
    と、 作成された辞書情報を辞書に書き込む出力装置とを備え
    たことを特徴とする辞書編集装置。
  2. 【請求項2】 構文パターン情報として、原文中で使わ
    れている動詞と、その構文パターンと、訳語と、訳文と
    を抽出し、表示することを特徴とする請求項1記載の辞
    書編集装置。
  3. 【請求項3】 辞書情報作成装置は、一の動詞に対する
    複数の訳語の文型が同じ場合、意味分類による訳し分け
    の情報を辞書情報の一部として生成することを特徴とす
    る請求項1または2記載の辞書編集装置。
JP4042367A 1992-01-31 1992-01-31 辞書編集装置 Expired - Fee Related JP2817497B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4042367A JP2817497B2 (ja) 1992-01-31 1992-01-31 辞書編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4042367A JP2817497B2 (ja) 1992-01-31 1992-01-31 辞書編集装置

Publications (2)

Publication Number Publication Date
JPH05216922A JPH05216922A (ja) 1993-08-27
JP2817497B2 true JP2817497B2 (ja) 1998-10-30

Family

ID=12634072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4042367A Expired - Fee Related JP2817497B2 (ja) 1992-01-31 1992-01-31 辞書編集装置

Country Status (1)

Country Link
JP (1) JP2817497B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8094711B2 (en) 2003-09-17 2012-01-10 Thomson Licensing Adaptive reference picture generation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8094711B2 (en) 2003-09-17 2012-01-10 Thomson Licensing Adaptive reference picture generation

Also Published As

Publication number Publication date
JPH05216922A (ja) 1993-08-27

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
GB2417103A (en) Natural language translation system
JPH0293866A (ja) 要約生成方法および要約生成装置
JP2817497B2 (ja) 辞書編集装置
JP2838984B2 (ja) 汎用参照装置
JPH07200605A (ja) 翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP3244286B2 (ja) 翻訳処理装置
JP2682048B2 (ja) 文章処理装置
JP2723886B2 (ja) 機械翻訳装置及びその翻訳規則作成方法
JPH09185629A (ja) 機械翻訳方法
JP2947554B2 (ja) 機械翻訳装置
JPH03225468A (ja) 機械翻訳装置
JPH04282764A (ja) 非文訳出装置
JPH04152458A (ja) 文書作成装置
JPH06243163A (ja) 文書解析装置
JPS6180358A (ja) 翻訳装置
JP2002032369A (ja) 辞書作成装置
JPH05282289A (ja) 文書作成装置
JPH04130577A (ja) 自然言語処理装置
JPH01181158A (ja) 翻訳支援装置
JPS6244872A (ja) 機械翻訳装置
JPH02110771A (ja) 電訳機

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070821

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090821

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090821

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100821

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees