JPS62271057A - 翻訳装置における辞書登録方式 - Google Patents

翻訳装置における辞書登録方式

Info

Publication number
JPS62271057A
JPS62271057A JP61113533A JP11353386A JPS62271057A JP S62271057 A JPS62271057 A JP S62271057A JP 61113533 A JP61113533 A JP 61113533A JP 11353386 A JP11353386 A JP 11353386A JP S62271057 A JPS62271057 A JP S62271057A
Authority
JP
Japan
Prior art keywords
information
dictionary
registered
input
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61113533A
Other languages
English (en)
Inventor
Masahiro Ito
正博 伊藤
Toshihiko Yokogawa
横川 壽彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61113533A priority Critical patent/JPS62271057A/ja
Publication of JPS62271057A publication Critical patent/JPS62271057A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 技術分野 この発明は、コンピュータシステムを用いた翻訳装置に
おける辞:3F登登録式に関する。
笠米弦亙 近年、コンピュータシステムを用いた自動又は半自動の
翻訳装置が種々開発されている。
このような翻訳装置においては、一般にキーボードや光
学文字読取装置等の入力装置によって入力された原文に
対して、予め辞書ファイルに登録されている辞書情報及
び解析ルールファイルに格納されている解析ルールを使
用して、形態素解析。
摺文解析、構造変換、訳文生成等の翻訳プロセスを実行
して翻訳処理を行ない、その翻訳結果である訳文をディ
スプレイに表示したり、プリンタで印字したりして出力
するようになっている。
そして、このような翻訳装置に使用される辞書には、シ
ステム辞書2分野別辞書、ユーザ辞書。
テンポラリ辞書などがある。
これらのうち、システム辞書は最も基本的な辞書で、通
常使用される相当数の単語に関する辞書的2文法的情報
をg録してあり、一般にメーカサイドで作成して常備し
ている。
分野別辞書は、各種専門分野別にその分野で使用される
用語を登録したものであり、やはリメーカサイドで作成
して、オプションで提供する。
ユーザ、llf書は、ユーザが独自に必要とする単語を
翻訳装置を使用してユーザ辞書ファイルに登録して作成
するものであり、この発明の対象とするものである。
テンポラリ辞書は、やはりユーザが作成するもので、ユ
ーザ辞書に登録はしないが、Wi訳で必要な情報を一時
登録する辞書である。
翻訳装置においては、このようにメーカサイドで予め用
意するシステム辞書や分野別辞書を使用するだけでなく
、ユーザが独自にユーザ辞書を作成して使用することに
よって翻訳精度を高めることができる。その場合、辞書
登録する単語に関して少しでも多くの文法的情報を入力
して登録した方がよい。
しかしながら、従来の翻訳装置において辞iF登録を行
なうには、一般に登録しようとする単語に関する辞書的
1文法的情報を登録項目に従って逐一入力しなければな
らず1例えば名詞の複数形や形容詞の活用形などのよう
に、原形(エントリ)と殆んど同じ文字並びで語尾が少
し変わるような場合でも、ユーザはその語を頭から打鍵
して入力しなければならないことになり、入力効率が悪
いばかりか、専門的な文法の知識を持たないユーザにと
っては煩わしい操作となり、打ち間違いによる入力ミス
の恐れも多かった。
旦−煎 この発明は、このような背景シζ鑑みてなされたもので
あり、翻訳装置おけるユーザ辞書の作成を容易にし、高
度な文法的知識を持たない一般のユーザでも、登録すべ
き情報を比較的簡単に入力できるようにすることを目的
とする。
監−腹 この発明は上記の目的を達成するため、ユーザが辞書フ
ァイルへの単語登録を行なう際に、第1図に示すように
、入力すべき辞書的2文法的情報に対応して、先に入力
された情報から推定できる情報についてはその推定情報
を表示し、その推定情報が正しければそのまま登録し、
正しくなければその推定情報を訂正して登録するように
した辞S登録方式を提供する。
以下、この発明の一実施例に基づいて具体的に説明する
第2図は、この発明を実施した英日自動翻訳装置のシス
テム構成例を示す外観斜視図である。
このシステムは、入力装置として英数字キー。
カナキーなどの文字キー及びカーソル移動キーなどの機
能キーを有し、オペレータの指示を入力するキーボード
と、M稿を光学的に走査して文字を含む画情報をイメー
ジデータとして入力するイメージスキャナ2と、このイ
メージスキャナ2で読取ったイメージデータを文字コー
ドデータに変換する光学文字認識装置3とを備えている
このイメージスキャナ2と光学文字認識装置6とによっ
て光学文字読取袋[(OCR)を構成している。
また、オペレータに対するガイダンスを含む各種情報を
表示するための表示手段であるCRTディスプレイ装置
(以下単に「ディスプレイJという)4と、この翻訳装
置の本体日で翻訳した訳文をプリントアウトする出力装
置であるレーザプリンタ等のプリンタ5とを備えている
本体6はコンピュータ機能を有し、記憶装置としてハー
ドディスク族E (HDD)7及びフロッピディスク装
[(FD[))8を備えている。
第3図は、この英日自動翻訳装置のシステム構成を示す
ブロック図であり1本体6による各機能を[・・・・・
・部Jとして機能ブロックで示している。
制御部10は、このシステム全体の動作を統括制御する
もので、中央処理装置1(CPU)とプログラムメモリ
 (ROM)、データメモリ(RAM)等からなるミニ
コンピユータである。
入力装置11は、日本語に翻訳すべき英文原稿12を入
力する装置であり、第2図に示したキーボード1.イメ
ージスキャナ2と光学文字認識装置223とからなる光
学文字読取袋@(OCR)であり、オペレータによるキ
ー入力あるいは紙に記録された英文を読取って入力する
なお、この入力装置11として本体Sに設けたHDD7
又はFDD8を用いて、磁気ディスクなどの記憶媒体に
記録された英文データを直接読み込むようにすることも
できる。
入力装置11により入力された英文原稿(原文)は、前
編集部13に読み込まれて翻訳の前処理が行なわれる。
ここでは、主として文の認定と未知語の処理を行なう。
これは形態素解析の一部として機能する。
前編集された英文データは、前編集で得られた情報とと
もに形態素解析部14に転送される。形態素解析部14
では、辞書ファイル22に格納されている単語辞書を索
引して入力された英文データを文単位に分割し、その各
英文の形態素を解析する。
すなわち、各文の形態上および語意上の特徴を識別して
構文上のまとまりを判別し、未知語の処理、固有名詞2
時の表現、数の表現などを含む翻訳プロセスの最小単位
となる語の集まりである「ユニット」と、それより大き
い語の集まりである「ブロック」等の各種まとめあげを
行ない、付加疑問、同格の認定などの文全体の処理も行
なう。
その際に使用する形態素解析ルールは、解析ルールファ
イル23に格納されている。
こうして形態素解析された英文データは、形態素解析で
得られた辞書情報とともに構文解析1部15に転送され
る。
この構文解析1部15は1例えば文脈自由文法(con
text−free grammar : cfg文法
)のルールを英文データに適用して1文について表層構
造の解析を行ない、すべての構文的可能性を見つけ出す
機能部である。そして、ここで構文解析(バーズ)され
た英文データは、その解析情報とともに構文解析■部1
日に送られる。
ここでは、構文解析1部15による表層的な解析結果か
ら、構造記述を適用して解を選択する。
それによって英語文の確からしい解析木を作成し。
その構造を作る。その構文解析ルールは、やはり解析ル
ールファイル23に格納されている。
構文解析■部16によって構文解析された英文データは
、解析木のデータとして構造変換部17に転送される。
ここでは、英語文の中間的構造である構文木から対応す
る日本語の構文木を作成し1日本語文を訳出しやすい日
本語基底構造に変換する。
こうして構造変換された日本語の構文木を示す構文木デ
ータは、訳文生成部18に送出されて訳文の生成が行な
われる。これは1日本語の構文木の木構造から日本語の
文を生成する機能である。
まず、語順を日本語のそれに一致させるため。
順序の入換えを行なって木構造を変更する構文生成を行
ない1次に形態素生成を行なって訳文を生成する。
訳文生成された日本語文データ、すなわち訳文データは
後編集部1日に送られる。ここでは、この装置による翻
訳結果である訳文を翻訳処理に使用した情報を利用して
修正し、より正確で自然な日本語文を完成する。
この日本語文データは出力装置20に転送され、翻訳さ
れた日本語文21として出力される。
この出力袋5120は、例えば第1図のプリンタ5、デ
ィスプレイ4.およびHDD7.FDD8などのファイ
ル記憶装置を含む。
これらの一連の翻訳プロセスの流れは、この装置全体の
制御を統括する制御部10によって制御される。
辞書ファイル22は、この実施例では英語および日本語
の単語についての辞書情報が登録されている前述のシス
テム辞書、専門分野辞書、及びユーザ辞書などの単語辞
書によって構成されている。
なお、この第3図では制御部10に操作表示部24が接
続されている。この操作表示部24は、オペレータから
この装置に様々な指示を与える。
たとえば、操作部には翻訳指示キー、カーソル移動キー
などの各種操作キーがあり、表示部には入力英語文、翻
訳結果の日本語文、辞書情報などの中間データやオペレ
ータに対する様々な指示などを可視表示するディスプレ
イを有する。
しかし、この操作表示部24は、第2図に示したように
入力袋[11にキーボードを備えている場合はそのキー
ボード1を、出力装置20にディスプレイ4を何えてい
る場合はそのディろプレイ4をそれぞれ使用することが
できる。
第4図は、上述の英日自動翻訳装置におけるこの発明に
係わる部分のみを示すブロック図である。
これを説明すると、辞書登録機能の指定や登録すべき単
語の各種情報を入力する入力手段としてのキーボード1
と、その入力情報を辞書登録できるように編集する辞書
編集装置25と、その編集内容及びキーボード1からの
入力情報をを表示するディスプレイ4と、辞書編集装置
!25によって編集された辞書データを登録するユーザ
辞書ファイル22Uとによって構成されている。
辞1i編集装置25の機能は、第3図の制御部10を構
成するミニコンピユータによって実行される。
次に、この実施例による辞書登録の具体例を、・第5図
乃至第7図に示すオペレータによる情報入力のフローチ
ャートと、第8図乃至第14図に示すディスプレイ上の
表示を参照して説明する。
オペレータがキーボード1の辞書登録キーを選択すると
、第4図の辞書編集袋5!(辞書エディタ)25が稼働
して辞書登録が可能になる。
そこで、オペレータはキーボード1から第5図のフロー
チャートに示す辞書登録のための情報入力を開始する。
まず、登録語(この例では英語の単語)の原形を入力し
、次にその単語の品詞を入力すると、それらの情報がエ
ントリ(原形)情報及び品詞情報としてユーザ辞書22
Uに書込まれる。
その後の入力処理は、先に入力した品詞が何であったか
によってそれぞれ異なり、名詞の場合には第6図に示す
入力処理へ、形容詞の場合には第7図に示す入力処理へ
進む。他の品詞の場合についてはフローチャートの図示
を省略している。
例えば、登録語として第8図、第S図に示すように(d
oglあるいは(knife)を入力し、その品詞とし
て〔1〕すなわち名詞と入力した場合には、第6図に示
す入力処理へ進み、次に複数形を入力するが、その際オ
ペレータの入力を容易にするために、辞書編集装置t!
25が複数形を〔登録語+S〕と推定してその推定情報
を表示する。
すなわち、複数形の推定情報として第8図の例では(d
ogs〕を、第S図の例では(knifes)を表示し
、第8図の場合のようにそれが正しければ。
オペレータは何も入力せずに改行キーを押すだけでその
推定情報が複数形の情報として登録され。
その行末に改行マーク「p」が表示される。
第9図の場合のように推定情報が正しくないときには、
それを訂正して正しい複数形[kniveslを入力し
て改行キーを押すとそれが登録される。
次に、登録語の訳語(日本語:第8図の例では〔犬〕、
第S図の例では〔ナイフ〕)を入力すると、その訳語の
品詞が登録語と同じ名詞であると推定され、名詞を示す
数字〔1〕が表示される。
そこで、この推定が正しければばそのまま次へ進み、正
しくない時にのみ他の品詞を1〜6の数字キーで選択し
て入力する ここまでで、登録語に関する最少限必要な辞書的2文法
的情報である基本情報の入力による第1段階の登録処理
を終了する。
そして、「詳細情報を入力する?」の問いに対して第S
図のように(N)を選択すると、この辞書登録の処理は
終了する。第8図のように〔・Y〕を選択すると、さら
に詳細な情報を入力して第2段階の登録処理を行なえる
ように、デスプレイ4の表示画面が第10図に示すよう
に変わる。
詳細情報の入力は、第10図の表示内容に従って5先ず
数表現が (a)単数のみ、(b)複数のみ。
(c)両方 のいずれであるかを入力するが、普通は両
方なので推定情報として〔〕内にCが表示されており、
それが正しければ改行キーを押して先へ進み、正しくな
い場合にのみa又はbを英字キーで選択して入力する。
次に、登録語の内在素性を、ディスプレイの画面に表示
されている問いに対して、YESCY〕かNo (N)
で答えることによって順次会話式に入力する。
さらに、動詞との関連情報として、この名詞が主語にな
るときの動詞と、この名詞が目的語になるときの動詞を
それぞれ5つ以内づつ入力する。
最後に、形容詞との関連情報として、この名詞を修飾す
る形容詞を5つ以内入力して詳細情報の入力処理を終了
する。
このようにして入力した各情報は、全てユーザ辞書ファ
イルに登録できるが、これに登録せずに単にテンポラリ
辞書としてメモリに記憶さるようにしてもよい。
第5図に戻って、登録語が例えば(good )のよう
な形容詞であったときには、ディスプレイ4上の表示が
第11図に示すようになり、以後は第7図のフローチャ
ートに従って情報を入力する。
まず、活用形として比較級と最上級を入力するが、それ
を容易にするために、第11図に示すように比較級と最
上級の推定情報として、予めmore及びt、he m
ostの後に原形と同じ[: good )が表示され
ている。
そこで、これが正しければYのキーを押すだけでよいが
、この例では正しくないのでNのキーを押すと、さらに
比較級の推定情報として原形にrerJを付加した[ 
gooder]と最上級の推定情報として七ha+原形
にrest、Jを付加した(goodest)が表示さ
れるので、これが正しければそれぞれ改行キーを押すだ
けで入力を終り、先へ進むことができる。
しかし、この例では正しくないので、訂正入力用の〔〕
内に正しい比較級(bet、t、er )と最上級(b
est )をそれぞれ入力する。
次に訳語としてこの例では〔良い〕を入力する。
続いてこの訳語の品詞を入力するが、それが登録語と同
じ形容詞と推定されて、形容詞を示す数字〔3〕が表示
されるので、それが正しければそのまま次へ進み、正し
くない時にのみ他の品詞の数字を選択して入力する。
さらに、活用型判定のために否定形の推定情報として〔
訳語の語幹+ない〕この例では〔良くない〕が表示され
ているので、正しければYのキーを、正しくなければN
のキーを押せば、基本情報の入力による第1段階の登録
処理を終了する。
そして、「詳細情報を入力するか?」の問いに(N)と
答えればこれで辞書登録の情報入力を終了し、〔Y〕と
答えるとさらに詳細な情報を入力して登録するため、デ
ィスプレイの表示が第12図に示すように変わる。
そこで、まず使用法の情報として (a)前置用法のみ
: 〔原形) + t、hing 、 (b)補語用法
のみ:丁hing is [原形]、(e)両方(普通
) のいずれかを入力するが、普通は両方なので推定情
報として〔〕内にCが表示されており、それが正しけれ
ば改行キーを押して先へ進み、正しくない場合にのみa
又はbを選択して入力すればよい。
次に、後置形容としてthing + [原形]が表示
され、それが可能であると推定されて〔〕内にa(可)
が表示されるので、それが正しければそのまま次へ進み
、正しくなければb(不可)を入力する。
そして、最後にこの形容詞に結びつく名詞を5つ以内入
力して詳細情報の入力を終え、この登録語に関する辞書
登録のための情報入力を完了する。
登録語の品詞が動詞の場合の第6図又は第7図に相当す
るフローチャートは示していないが1例えば第13図に
示すようなディスプレイ上の表示画面に従って基本情報
を入力し、さらに第14図に示すような表示画面に従っ
て詳細な情報を順次入力して、同様に推定情報を利用し
ながら辞書登録を行なうことができる。
固有名詞及び副詞の場合の説明は省略するが。
同様にして登録語の基本情報及び詳細情報を、推定情報
の表示を見ながら比較的容易に入力して辞書登録するこ
とができる。
なお、この発明は英日自動翻訳装置におけるユーザ辞書
の登録に限るものではなく、他の外国語から日本語へ、
あるいは日本語から各種外国語へ自動又は半自動で翻訳
する翻訳装置におけるニー″ザ辞書の登録にも同様に適
用できる。
肱−来 以上説明してきたように、この発明による辞書登録方式
を実施すれば、翻訳装置におけるユーザ辞書ファイルへ
の単語登録に際し、必要な情報全てをオペレータが逐一
キー入力する必要はなくなり、推定情報の表示を見なが
らそれが正しくない場合にのみ訂正すればよい項目が多
くなるので、オペレータの負担が軽くなり、打ち間違い
による入力ミスも少なくなる。
したがって、辞trW録を比較的容易に且つ正確に能率
よく行なうことができ、ユーザ辞書を活用して翻訳精度
を高めることが容易になる。
【図面の簡単な説明】
第1図はこの発明の構成を示すフロー図、第2図はこの
発明を実施した英日自動翻訳装置のシステム構成図、 第3図は同じくその全体のブロック構成図。 第4図は同じくこの発明に係わる部分のブロック図。 第5図乃至第7図はこの発明による辞書登録の具体例を
示すオペレータによる情報入力とその際の装置例での推
定・表示のフロー図、第8図乃至第14図は同じくその
情報入力の際のディスプレイ上の表示画面のそれぞれ異
なる例を示す図である。 1・・・キーボード  2・・・イメージスキャナ3・
・・光学文字認識装置 4・・・CRTディスプレイ装置!(ディスプレイ)5
・・・プリンタ   6・・・本体 7・・・ハードディスク装[(HDD)8・・・フロッ
ピディスク装置1 (FDD)22・・・辞書ファイル 22U・・・ユーザ辞書ファイル 25・・・辞書編集装置 第1図 次の登録処理へ 第4図 第5図 第8図 第9図 第10図 第11図 第12図 第14図

Claims (1)

  1. 【特許請求の範囲】 1 入力された原文に対して予め辞書ファイルに登録さ
    れている辞書情報を用いて翻訳処理を行なう翻訳装置に
    おいて、 前記辞書ファイルへの単語登録を行なう際に、入力すべ
    き辞書的、文法的情報に対応して先に入力された情報か
    ら推定できる情報についてはそれを表示し、その推定情
    報が正しければそのまま登録し、正しくなければ該推定
    情報を訂正して登録するようにしたことを特徴とする辞
    書登録方式。
JP61113533A 1986-05-20 1986-05-20 翻訳装置における辞書登録方式 Pending JPS62271057A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113533A JPS62271057A (ja) 1986-05-20 1986-05-20 翻訳装置における辞書登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113533A JPS62271057A (ja) 1986-05-20 1986-05-20 翻訳装置における辞書登録方式

Publications (1)

Publication Number Publication Date
JPS62271057A true JPS62271057A (ja) 1987-11-25

Family

ID=14614732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113533A Pending JPS62271057A (ja) 1986-05-20 1986-05-20 翻訳装置における辞書登録方式

Country Status (1)

Country Link
JP (1) JPS62271057A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105464A (ja) * 1989-09-20 1991-05-02 Fujitsu Ltd 翻訳装置
JPH04119468A (ja) * 1990-09-10 1992-04-20 Nec Corp 辞書作成支援装置
JPH05181901A (ja) * 1991-12-27 1993-07-23 Sharp Corp 機械翻訳装置
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60163161A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 辞書保守方式
JPS6118072A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 辞書デ−タの自動登録方式
JPS6190270A (ja) * 1984-10-09 1986-05-08 Sharp Corp 辞書機能を用いた翻訳方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60163161A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 辞書保守方式
JPS6118072A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 辞書デ−タの自動登録方式
JPS6190270A (ja) * 1984-10-09 1986-05-08 Sharp Corp 辞書機能を用いた翻訳方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105464A (ja) * 1989-09-20 1991-05-02 Fujitsu Ltd 翻訳装置
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
JPH04119468A (ja) * 1990-09-10 1992-04-20 Nec Corp 辞書作成支援装置
JPH05181901A (ja) * 1991-12-27 1993-07-23 Sharp Corp 機械翻訳装置

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JP2880601B2 (ja) 言語処理装置
EP0310049B1 (en) Document generator and correction support device
JPH05120324A (ja) 言語処理方式
JPS62271057A (ja) 翻訳装置における辞書登録方式
JPS62271056A (ja) 翻訳装置における辞書登録方式
JP2632806B2 (ja) 言語解析装置
L’haire FipsOrtho: A spell checker for learners of French
JP2626722B2 (ja) 日本語生成装置
JP2938897B2 (ja) 文書作成処理装置
JP3692711B2 (ja) 機械翻訳装置
JPH06295309A (ja) 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JP2521435B2 (ja) 日本語生成装置
JPS63136265A (ja) 機械翻訳装置
JPS62271055A (ja) 翻訳文編集方式
JP2901977B2 (ja) 翻訳装置
JP3313810B2 (ja) アスペクト処理装置
JP2000137709A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH1063660A (ja) 機械翻訳装置
JPH10171804A (ja) 機械翻訳装置
JPH11282846A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH061468B2 (ja) 日本語文章校正装置
JPH11282845A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体