JPH03260764A - 翻訳用辞書登録方式 - Google Patents

翻訳用辞書登録方式

Info

Publication number
JPH03260764A
JPH03260764A JP2058546A JP5854690A JPH03260764A JP H03260764 A JPH03260764 A JP H03260764A JP 2058546 A JP2058546 A JP 2058546A JP 5854690 A JP5854690 A JP 5854690A JP H03260764 A JPH03260764 A JP H03260764A
Authority
JP
Japan
Prior art keywords
dictionary
translation
word
words
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2058546A
Other languages
English (en)
Inventor
Norikazu Ito
則和 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2058546A priority Critical patent/JPH03260764A/ja
Publication of JPH03260764A publication Critical patent/JPH03260764A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技生公立 本発明は、翻訳用辞書登録方式に関し、より詳細には、
機械翻訳技術の翻訳用辞書の作成技術としての翻訳用辞
書登録方式に関する。
災米肢生 従来の機械翻訳装置においては、翻訳結果を得るまでは
、辞書に妥当な訳語が登録されているがどうかがよくわ
からない場合があった。また、妥当な訳語が辞書に登録
されている場合でも、文中の用法として正確に把握され
るとは限らないものであった。すなわち、多義、多品側
、多訳語のときは、別の用法、訳語が優先されてしまう
おそれが生じていた。
上記欠点を解消するために、特開昭63−228374
号公報においては、翻訳対象文書の単語の頻度とその単
語の辞書情報から、ある一定の頻度以上の多品側あるい
は多義の単語について、辞書の情報を表示し、必要な情
報を選択して翻訳するようにしているが、多品側・多義
性のある言葉は、特に構文上の位置によって多品側・多
義となっており、情報を限定することが困難なことが少
なくなかった。また、文書中の語の重要度と、多義性は
必ずしも一致するものではなく、翻訳用の辞書において
は、単一の語義(訳語)しかないような語が、分野によ
ってはまったく違う訳語(専門用語等)を必要としてい
るにもかかわらず、望ましい訳語が出ないために誤解を
生じるといった、辞書中の語義の不足に対応できない等
の欠点があった・ 特に、上記特開昭63−228374号公軸においては
、多義の語でその文書中の頻度が高い語について、あら
かじめ抽出し、その抽出された結果をユーザーに提示し
て、修正することによって翻訳の精度を高めるようにし
ているが、■抽出する多義・多品側であることを基準と
しているので、その抽出する語が文書中で誤解されては
いけないような重要語であるとは限らない。例えば、訳
語は数少ないが、間違えるとまったくの誤解を呼ぶよう
な語には対応できない。また、翻訳しようとする分野に
とっては特有の語党で、一般の場合とまったく異なる用
法がある場合(かつ一般の語としての用法が少ない場合
)には対応できないという欠点がある。言いかえれば、
システムが多義と認識していない語でも、システムの辞
書の訳語では非常にまずい場合が存在しえることになる
。■抽出する語を頻度のみに頼っているので、この場合
は頻度は非常に重要な尺度であるが、頻度ばかりではな
く、文書中の位置等、文書中の諸費の重要度を計る基準
は他にも存在する、等の欠点があった・ このように、自然言語間の機械翻訳において用語の訳出
は難しい問題である。英語と日本語間を例にとってみて
も、一つの英語の言葉はいろいろな意味を持つことが少
なくなく、適切な日本語に訳出しなければならない。実
際はなかなかうまく訳し分けられないものである。翻訳
対象文書が専門的になればなるほど訳語の適切さが求め
られる。
そして不適切な訳語を与えると全くわかりにくい訳文に
なることがしばしばある。そこで翻訳対象文書を用いて
キーワード探索を行い、キーとなるような言葉を事前に
半自動的に登録できることが望ましい。このようにする
ことにより、用語の不適切な訳出を抑制することができ
る。
■−−煎 本発明は、上述のごとき実情に鑑みてなされたもので、
抽出されたキーワードが、複数の単語から成る連語であ
る時に、その連語がそのままの形で辞書に入っていない
場合においても、個々の単語部分で辞書引きをして訳語
情報とするようにした翻訳用辞書登録方式を提供するこ
とを目的としてなされたものである。
粟−一双 本発明は、上記目的を達成するために、(1)対象テキ
ストからキーワードを抽出する抽出手段と、該キーワー
ドを翻訳システム用辞書から検索し、該検出された検索
情報を翻訳用辞書登録編集部で表示する表示手段と、該
翻訳用辞書情報を修正できる修正手段とを有することを
特徴とする翻訳用辞書登録方式において、前記抽出され
たキーワードが複数の単語からなる連語であるときは該
連語全体を辞書引きし、その結果該連語全体では辞書登
録されていないときは、前記連語の構成要素である個々
の単語または連語を辞書引きして、単語または連語を組
み合わせることにより抽出されたキーワードの訳語情報
とし、一方、前記構成要素である個々の語または連語を
辞書引きしてないときは、そのままのつづりを訳語情報
とし、該検索情報を翻訳用辞書登録編集部で編集できる
ようにしたこと、更には、(2)前記抽出されたキーワ
ードを辞書引きする辞書を、1つまたはそれ以上指定す
ることができること、更には、(3)前記抽出されたキ
ーワードを辞書引きする辞書を複数指定するとき、該指
定された複数の辞書間の辞書引きの優先順位を指定する
ことができること、更には、(4)前記抽出されたキー
ワードの数を表示すること、更には、(5)前記抽出さ
れたキーワードに関して、キーとなるある単語または連
語の訳語を登録あるいは変更すると、抽出された他のキ
ーワードの構成要素にそのキー単語または連語があると
きに、その訳語が新しく登録あるいは変更された訳語に
一括変換されること、更には、(6)前記新しい登録あ
るいは変更に合わせて一括変換されるキーワードの数を
表示すること、更には、(7)前記新しい登録あるいは
変更に合わせて一括変換されるキーワードおよびその訳
語を順次表示および変更できること、更には、(8)前
記抽出されたキーワードに関して、最優先に辞書引きし
、特に連語であるキーワードに関しては、その連語の構
成要素である個々の単語を辞書引きしないこと、更には
、(9)前記抽出されたキーワードに関して元のテキス
トのキーワードの前後の並びを表示することができるこ
とを特徴としたものである。以下1本発明の実施例に基
づいて説明する。
第1図は1本発明による翻訳用辞書登録方式の一実施例
を説明するための構成図で1図中、1はCRT、2はキ
ーボード、3は0CR14は入力文書、5はスペルチェ
ック部、6は前編集部、7は翻訳本体部、8は後編集部
、9は辞書、1oは文法規則、11は出力文書、12は
プリンタである。
ファイル入力、キーボード入力、OCR入力のいずれか
によって得た入力文は入力文書4として保管され1次に
スペルチェック部5は、辞書9を参照してスペルチェッ
クし、前編集部6を用いて前処理を行える。翻訳本体部
7は、辞書9と文法規則10を用いて翻訳し、その結果
得られた出力文は、後編集部8によって翻訳情報を利用
して編集できる。編集後の出力文は出力文書11に記憶
される。入力文と出力文はプリンタ12を用いて印刷で
きる。
第2図は、第1図における翻訳本体部の4つの処理を示
す図で、図中、13は辞書、14は入力部、15は形態
素解析部、16は構文解析部。
17は変換部、18は生成部、19は出力部、20は文
法規則である。この翻訳本体部の4つの大きな処理とは
■形態素解析部15では、入力テキストの辞書引きを行
なうこと、■構文解析部16では、個々の語の情報を得
て文法規則20に従ってパージングを行い、解析結果か
ら本構造を作成すること、■変換部17では入力言語の
木構造から出力言語の木構造に変形すること、■生成部
18では得られた本構造をノードごとに訳出すること、
である。
第3図は、本発明による翻訳用辞書登録方式の前編集部
(前処理部)の構成図である。図中、21は翻訳用辞書
(複数)手段、22は翻訳用辞書検索手段、23は翻訳
用辞書表示・編集手段、24はキーワード抽出手段、2
5は対象文書である。
対象文書25よりキーワードをキーワード抽出手段24
により抽出し、該キーワードを翻訳用辞書手段21から
翻訳用辞書検索手段22を介して検索し、該検索された
検索情報を翻訳用辞書表示・編集手段23により表示・
編集する。
第4図は、第3図に示した前編集部の処理を示すフロー
チャートである。
以下各ステップに従って順に説明する。なお、二こでは
入力テキストは英文とする。
賎呼ヨ士まず入力されたテキストを対象として、対象テ
キストを指定する。
’”LZe−キーワード抽出を行う。キーワード抽出手
段は任意のものでよく、既存技術でも可能である。
d−抽出された複数のキーワードは、翻訳編集部中の内
部バッファに蓄えられる。そして翻訳エディタの中の辞
書登録機能でこの情報を呼び出す。この辞書登録画面に
抽出されたキーワードの数が表示される。そして内部バ
ッファに蓄えられたキーワードについて5tep 4以
下の処理を進める。
なお、キーワードは翻訳編集部の内部バッファに蓄える
のではなく、外部記憶装置等に蓄えて同等の処理を行う
ことも可能であり、また、キーワード抽出手段と連続的
に結合し、1つのキーワードを抽出するごとに5tep
 4以下の処理を行うことも可能である。
また、5tep 4以下の処理は、いわゆる翻訳システ
ムにおける辞書編集部の機能をそのまま用いるが、通常
は、ユーザーが編集したい見出し語を入力して辞書編集
部で辞書を編集する。これに対して、本発明の辞書登録
方式では、ユーザー人力の見出し語のかわりに、キーワ
ード抽出手段で抽出したキーワードを用いる。すなわち
、各キーワードに対して、辞書編集部を用いて、辞書を
編集する処理を行うようにしたものであると考えること
ができる。
v(EA−L1至1旦」−キーワードを検索キーとして
、翻訳用辞書21を検索し、その検索結果を、例えば、
画面上に表示する。このとき、検索方法としては、キー
ワードが一つの言葉からなる単語であるときは、そのま
まの形で検索する。辞書にあれば、その結果を表示する
。辞書になければキーワードの英文字の綴りのまま表示
する。このとき。
表示するアルファベットは半角文字でも全角文字でもど
ちらでも表示可能である。また、キーワードが2つ以上
の単語からなる連語であるときは、まず、全体の綴りで
検索し、辞書にあるときはそれを表示する。辞書にない
ときは構成要素である個々の単語、あるいは、キーワー
ドが3語以上であれば、構成要素である連語を辞書引き
して訳語を組み合わせ、結果として辞書引きした構成要
素の少ないほうから上位の訳語としてあてる。未知語が
含まれているときは、上述の通り、英文字のままとする
また、このとき、抽出されたキーワードを検索する辞書
は1つである必要はなく、複数指定できる。もちろん、
指定しなくともよく、このときは、システムの基本辞書
だけから辞書引きされる。また、このとき、複数指定し
た辞書間の辞書引きの優先度を指定することも可能であ
る。検索した結果は訳語として与えられる。従って、1
つのキーワードに対して得られた訳語は複数になること
もある。辞書引きの優先度が指定されてあればそれに応
じて複数の訳語の順位が決まるわけである。
5teL旦」−キーワード抽出、および、検索が終了す
れば、画面のいずれかの箇所に検索されたキーワード数
を表示する。
畦吐り上ユーザーは、得られたキーワードとその訳語に
ついて1つずつ呼び出しては画面上に表示されたキーワ
ードの翻訳用辞書情報を確認し、修正すべき情報があれ
ば修正する。例えば、訳語を変更、あるいは追加する。
このとき、画面上では検索結果の種別を表示することも
可能である。すなわち、一番簡単には、辞書にあったか
どうか。
また、どの辞書から検索したか、キーワード全体があっ
たか。ないとしたら、どの部分がどの辞書で検索できた
か、訳語がいくつできたか。などを表示する。
畦吐炙上修正にあたっては、その修正が現在編集中のキ
ーワードを対象とするか、それとも、全キーワードも対
象とするかを選択することができる。
すなわち、全キーワードも対象とするということは、ユ
ーザーがあるキーワードの全体または、部分の訳語を修
正したときに、他のキーワードの中に、その修正に該当
する箇所があるとき、その箇所も同様の変更を受ける意
味である。このとき、かかる変更をうけるキーワードの
数を表示することも可能である。また、この変更をうけ
たキーワードのみのリストを持って、それらとその訳語
のみをまた順次、表示・編集することも可能である。
射」■l」−その後、修正・追加内容を翻訳用辞書に登
録することができるように構成しである。これは、修正
した場合は、元の翻訳用辞書とは別に対象文書専用辞書
を形成し、そこに登録するように構成することも容易に
可能である。
また1元の辞書に登録するが、対象文書専用辞書に登録
するかを選択することができるように構成することも容
易であり、あるいは、登録したい辞書名を指定できるよ
うにすることもまた可能である。
これらの場合、新たに指定した辞書あるいは文書専用辞
書が、元のシステムの辞書に優先して用いられるべきで
あるといったフラグ等を立てるようにすることも可能で
ある。特に連語の場合には、連語の個々の構成要素であ
る単語や連語は一切辞書引きしないようにする。これに
よって連語以外の可能性に解釈されないようにする。
キーワードに該当する翻訳用辞書見出し語(エンI〜す
)が存在しないこととともに、翻訳用辞書編集画面を表
示する。ここで、ユーザーが品詞や訳語の情報を入れた
後、翻訳用辞書エントリがあった場合と同様の処理を行
うようにしている。
また、キーワードの訳語を変更修正するときに、原文で
のキーワードがあった箇所を検索し、例えば、画面上に
一時的なウィンドウを開いて、キーワードを含む前後の
部分を表示する。当該箇所が複数あれば、続けて表示す
る。
1旦LYk」ユ最後のキーワードまで処理したかどうか
判断して、処理してない場合は、5tep 5にもどり
処理が終われば終わる。
第5図は、辞書編集画面を示す図で、連語が辞書にあっ
た場合を表示しである。エントリ:r beaIIls
canning system Jは、キーワード数3
2のうちの1つを示すもので、品詞は名詞で光学用の辞
書にあったことを意味している。訳語として「ビームス
キャニングシステム」が得られる。
辞書にない場合には、ユーザが訳語を与えることになる
。このようにしてユーザ自身の辞書が編集され、その辞
書名を例えばrpatentJと名づけでおくことがで
きる。
劾」−一釆 以上の説明から明らかなように1本発明によると、以下
のような効果がある。
(1)抽出されたキーワードがそのままの形で辞書に入
っていなくとも、その部分で辞書引きするために何等か
の形で訳語を得ることができる場合が多くなり、辞書編
集の効率が向上する。
(2)抽出されたキーワードを複数の辞書から引くこと
ができる。例えば、基本語辞書に加えて対象分野の専門
用語辞書を持っていれば、双方を指定することにより、
より有効にキーワードの訳語を得ることができる。
(3)抽出されたキーワードを複数の辞書から引くとき
、それらの間の優先度を指定できる。これにより、得ら
れるであろう複数の訳語間の順位を規定することができ
る。
(4)抽出されたキーワードの数を把握することができ
る。これにより、編集しようとしている辞書の大きさを
事前に把握することができる。
(5)抽出されたキーワード間の用語の統一を図りやす
くなり、辞書編集の効率が向上する。
(6)ユーザーの変更がキーワードからなる辞書全体に
どの程度影響をおよぼすかを知ることができる。
f7)ユーザーの変更によって変更されるキーワードの
訳語の再確認をすることができ、間違いが少なくなる。
(8)ユーザーの望む訳出結果が得られるとともに、他
の可能性を辞書引きしなくなるので、構文解析効率が向
上する。
(9)原文中のキーワードの前後がすぐに見えるので、
訳語変更の際にユーザーが適切な訳語を与えやすくなる
【図面の簡単な説明】
第1図は、本発明による翻訳用辞書登録方式の一実施例
を説明するための構成図、第2図は、第1図における翻
訳本体部の処理を示す図、第3図は、本発明による翻訳
用辞書登録方式の前編集部(前処理部)の構成図、第4
図は、第3図の前編集部の処理を示すフローチャート、
第5図は、辞書編集画面を示す図である。 1・・・CRT、2・・・キーボード、3・・・0CR
14・・・入力文書、5・・・スペルチェック部、6・
・前編集部、7・・・翻訳本体部、8・・・後編集部、
9・・・辞書、10・・・文法規則、11・・・出力文
書、12・・・プリンタ。

Claims (1)

    【特許請求の範囲】
  1. 1、対象テキストからキーワードを抽出する抽出手段と
    、該キーワードを翻訳システム用辞書から検索し、該検
    出された検索情報を翻訳用辞書登録編集部で表示する表
    示手段と、該翻訳用辞書情報を修正できる修正手段とを
    有することを特徴とする翻訳用辞書登録方式において、
    前記抽出されたキーワードが複数の単語からなる連語で
    あるときは該連語全体を辞書引きし、その結果該連語全
    体では辞書登録されていないときは、前記連語の構成要
    素である個々の単語または連語を辞書引きして、単語ま
    たは連語を組み合わせることにより抽出されたキーワー
    ドの訳語情報とし、一方、前記構成要素である個々の語
    または連語を辞書引きしてないときは、そのままのつづ
    りを訳語情報とし、該検索情報を翻訳用辞書登録編集部
    で編集できるようにしたことを特徴とする翻訳用辞書登
    録方式。
JP2058546A 1990-03-09 1990-03-09 翻訳用辞書登録方式 Pending JPH03260764A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2058546A JPH03260764A (ja) 1990-03-09 1990-03-09 翻訳用辞書登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2058546A JPH03260764A (ja) 1990-03-09 1990-03-09 翻訳用辞書登録方式

Publications (1)

Publication Number Publication Date
JPH03260764A true JPH03260764A (ja) 1991-11-20

Family

ID=13087452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2058546A Pending JPH03260764A (ja) 1990-03-09 1990-03-09 翻訳用辞書登録方式

Country Status (1)

Country Link
JP (1) JPH03260764A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5682543A (en) * 1994-05-16 1997-10-28 Matsushita Electric Industrial Co. Ltd. Dictionary editing apparatus
EP0926604A2 (en) * 1997-12-24 1999-06-30 International Business Machines Corporation Translationmethod and system
US7475005B2 (en) 2003-03-17 2009-01-06 International Business Machines Corporation Translation system, dictionary updating server, translation method, and program and recording medium for use therein
JP2012208754A (ja) * 2011-03-30 2012-10-25 Tokyo Electric Power Co Inc:The 情報処理装置、データベース更新方法およびデータベース更新用プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5682543A (en) * 1994-05-16 1997-10-28 Matsushita Electric Industrial Co. Ltd. Dictionary editing apparatus
EP0926604A2 (en) * 1997-12-24 1999-06-30 International Business Machines Corporation Translationmethod and system
EP0926604A3 (en) * 1997-12-24 2005-11-02 International Business Machines Corporation Translationmethod and system
US7475005B2 (en) 2003-03-17 2009-01-06 International Business Machines Corporation Translation system, dictionary updating server, translation method, and program and recording medium for use therein
JP2012208754A (ja) * 2011-03-30 2012-10-25 Tokyo Electric Power Co Inc:The 情報処理装置、データベース更新方法およびデータベース更新用プログラム

Similar Documents

Publication Publication Date Title
US5321607A (en) Automatic translating machine
WO1997004405A1 (en) Method and apparatus for automated search and retrieval processing
JPS62163173A (ja) 機械翻訳方法
JPH07295986A (ja) イディオム処理機能を持つ機械翻訳装置
JPH0567144A (ja) 前編集支援方法およびその装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH03260764A (ja) 翻訳用辞書登録方式
JPS61248160A (ja) 文書情報登録方式
JP4007630B2 (ja) 対訳例文登録装置
JPH0561902A (ja) 機械翻訳システム
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP2871300B2 (ja) 機械翻訳装置
JP2002183134A (ja) 翻訳装置
JPH0550778B2 (ja)
JPH05225232A (ja) テキスト自動前編集装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH0348366A (ja) 形態素解析、構文解析及び形態素生成方式
JPS6320570A (ja) 機械翻訳システム
JPH02245874A (ja) 機械翻訳装置
JPH05314172A (ja) 機械翻訳装置
JPH08235180A (ja) 機械翻訳装置
JPH06266759A (ja) 単語連語翻訳装置
JPH03217970A (ja) 機械翻訳システム
JPH06332938A (ja) 自然言語解析装置および機械翻訳装置