JPS62271054A - 翻訳装置における形態素解析結果修正方式 - Google Patents

翻訳装置における形態素解析結果修正方式

Info

Publication number
JPS62271054A
JPS62271054A JP61113530A JP11353086A JPS62271054A JP S62271054 A JPS62271054 A JP S62271054A JP 61113530 A JP61113530 A JP 61113530A JP 11353086 A JP11353086 A JP 11353086A JP S62271054 A JPS62271054 A JP S62271054A
Authority
JP
Japan
Prior art keywords
unit
block
morpheme analysis
morphological analysis
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61113530A
Other languages
English (en)
Inventor
Masahiro Ito
正博 伊藤
Toshihiko Yokogawa
横川 壽彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61113530A priority Critical patent/JPS62271054A/ja
Publication of JPS62271054A publication Critical patent/JPS62271054A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 技術分野 この発明は、コン67タシステムを用いた翻訳装置にお
ける形態素解析結果の表示方式に関する。
皿米且亙 近年、コンピュータシステムを用いた自動又は半自動の
翻訳装置が種々開発されている。
このような翻訳装置によって、例えば英語のような外国
語の原文を日本語の文に翻訳する場合。
一般にキーボードあるいは光学文字読取装置等によって
入力された原文に対して、先ず形態素解析を行なって文
章を一文づつに区切り、その各文の形態状および語當上
の特徴を識別して構文上のまとまりを判別し、翻訳プロ
セスの最小単位となる語の集まりであるユニットと、こ
のユニットよりは大きい語の集まりであるブロックのま
とああげ処理を行なった後、構文解析、構造変換、訳文
生成等の翻訳プロセスを実行している。
その際、従来の自動翻訳装置においては、上述のように
装置内で自動的になされる形態素解析の結果が表示され
ることなく、引き続き翻訳プロセスが実行されていた。
しかしながら、複雑なi造を持つ原文(例えば英文)を
形暦素解析した場合、その構造を正しく把握して上述の
ユニット及びブロックの認定を正しく行なうことができ
ない場合がある。
その場合、翻訳結果も当然正しくなくなるわけであるが
、ある程度の原語(この例では英語)の知識を有する者
であれば、形態素解析の結果を見ることによって、どこ
で誤りが生じたかを知ることができ、訳文解釈の助けに
なる。
且−煎 この発明は、このような要求に鑑みてなされたもので、
翻訳装置における形態素解析の結果をオペレータが見て
、ユニットとブロックの認定を確認することができるよ
うにすることを目的とする。
l−或 この発明は上記の目的を達成するため、前述のような翻
訳装置において、形態素解析を行なった原文をディスプ
レイ上に表示すると共に、そのユニットとブロックの情
報をそれぞれ高輝度2反転。
下線、明滅等の異なる強調表示手段によって明示するこ
とを特徴とする形態素解析結果表示方式を提供する。
以下、この発明の一実施例に基づいて具体的に説明する
第2図は、この発明を実施した英日自動翻訳装置のシス
テム構成例を示す外観斜視図である。
このシステムは、入力装置として英数字キーなどの文字
キー及びカーソル移動キーなどの機能キーを有し、オペ
レータの指示を入力するキーボードと、yX稿を光学的
に走査して文字を含む画情報をイメージデータとして入
力するイメージスキャナ2と、このイメージスキャナ2
で読取ったイメージデータを文字コードデータに変換す
る光学文字認識装置3とを備えている。
このイメージスキャナ2と光学文字認識装置3とによっ
て光学文字読取装置(OCR)を構成している。
また、オペレータに対するガイダンスを含む各種情報を
表示するための表示手段であるCRTディスプレイ装置
装置共下単に「ディスプレイ」という)4と、このシス
テムの本体6で翻訳した訳文をプリントアウトする出力
装置であるレーザプリンタ等のプリンタ5とを備えてい
る。
本体6はコンピュータ機能を有し、記憶装置としてハー
ドディスク装置(HDD)7及びフロッピディスク装置
(FDD)8を備えている。
第3図は、この英日自動翻訳装置のシステム構成を示す
ブロック図であり1本体6による各機能を「・・・・・
・部Jとして機能ブロックで示している。
制御部10は、このシステム全体の動作を統括制御する
もので、中央処理装置(CPU)とプログラムメモリ(
ROM)、データメモリ(RAM)等からなるミニコン
ピユータである。
入力装置111は、日本語に翻訳すべき英文原稿12を
入力する装置であり、第2図に示したキーボード1、イ
メージスキャナ2と光学文字認識装置i!3とからなる
光学文字読取装置i (OCR)であり、オペレータに
よるキー入力あるいは紙に記録された英文を読取って入
力する。
なお、この入力装置11として本体6に設けたH D 
D 7又はFDD9を用いて、磁気ディスクなどの記憶
媒体に記録された英文データを直接読み込むようにする
こともできる。
入力装置11により入力された英文原稿(原文)は、前
編集部13に読み込まれ、翻訳の前処理が行なわれる。
ここでは、主として文の認定と未知語の処理を行なう。
これは形態素解析の一部として機能する。
前編集された英文データは、前編集で得られた情報とと
もに形態素解析部14に転送される。形態素解析部14
では、辞書ファイルに格納されている単語辞書22を索
引して入力された英文データを文単位に分割し、その各
英文の形態素を解析する。
すなわち、各文の形態上および語意上の特徴を識別して
構文上のまとまりを判別し、未知語の処理、固有名詞9
時の表現、数の表現などを含む翻訳プロセスの最小単位
となる語の集まりである「ユニット」と、それより大き
い語の集まりである「ブロック」等の各種まとめあげを
行ない、付加疑問、同格の認定などの文全体の処理も行
なう。
その際に使用する形態素解析ルールは、解析ルールファ
イル23に格納されている。
こうして形態素解析された英文データは、形態素解析で
得られた辞書情報とともに構文解析1部15に転送され
る。
この構文解析1部15は、例えば文脈自由文法(con
t−ext−free gra+nn+ar : cf
g文法)のルールを英文データに適用して、文について
表層構造の解析を行ない、すべての構文的可能性を見つ
け出す機能部である。
構文解析1部15で構文解析(バーズ)された英文デー
タは、その解析情報とともに構文解析■部16に送られ
る。
ここでは、構文解析1部15による表層的な解析結果か
ら、構造記述を適用して解を選択する。
それによって英語文の確からしい解析木を作成し。
その構造を作る。その構文解析ルールは、やはり解析ル
ールファイル23に格納されている。
構文解析■部16によって構文解析された英文データは
、解析木のデータとして構造変換部17に転送される。
ここでは、英語文の中間的構造である構文木から対応す
る日本語の構文木を作成し1日本語文を訳出しやすい日
本語基底構造に変換する。
こうして構造変換された日本語の構文木を示す構文木デ
ータは、訳文生成部18に送出されて訳文の生成が行な
われる。これは1日本語の構文木の木構造から日本語の
文を生成する機能である。
まず1語順を日本語のそれに一致させるため、順序の入
換えを行なって木構造を変更する構文生成を行ない、次
に形態素生成を行なって訳文を生成する。
訳文生成された日本語文データ、すなわち訳文データは
後編集部1日に送られる。後編集部1日では、翻訳処理
に利用した情報を使用し、単語辞書22を索引して訳文
データを修正し、より自然な日本語文を完成する。
この日本語文データは出力装置120に転送され。
翻訳された日本語文21として出力される。
この出力装置20は1例えば第1図のプリンタ5、ディ
スプレイ4.およびHDD7.FDD9などのファイル
記憶装置を含む。
これらの一連の翻訳プロセスの流れは、この装置全体の
制御を統括する制御部10によって制御される。
単語辞書22には、この実施例では英語および日本語の
単語についての辞書データが格納され、解析ルールファ
イル23には、形態素解析および構文解析のルールデー
タが格納されている。
なお、この第3図では制御部10に操作表示部24が接
続されている。この操作表示部24は。
オペレータからこの装置に様々な指示を与える。
たとえば、操作部には翻訳指示キー、カーソル移動キー
などの各種操作キーがあり、表示部には入力英語文、翻
訳結果の日本語文、形態素解析結果や辞書情報などの中
間データやオペレータに対する様々な指示などを可視表
示するディスプレイを有する。
しかし、この操作表示部24は、第2図に示したように
入力装置11にキーボードを備えている場合はそのキー
ボード1を、出力装置20にディスプレイ4を備えてい
る場合はそのディスプレイ4をそれぞれ使用することが
できる。
ところで、形態素解析部14によって形態素解析された
結果、「ユニット」と認定された語の集まりは、構文解
析の際にはこれを一語と同等に扱い、それに含まれる各
構成要素の辞書情報を使用しない。
また「ブロック」と認定された語の集まりに対しては、
その内部での解析を外部における解析より優先させて行
ない、ブロック外に対してはそのブロックをユニットと
同等に扱う。
この「ブロック」は、たとえば節1句などの他。
文脈自由文法で用いる中間的なシンボルに相当するもの
でもよい。また、入れ子になり得るので、ブロック内に
さらにブロックが含まれていてもよい。さらに、ブロッ
クの概念に文9段落2文章全体をも含め5これらをそれ
ぞれ1つのブロックとみなしてもよい。
このように、形態素解析によって「ユニット」と「ブロ
ック」の認定を行なうことにより、構文解析における無
駄な構文解が減少し、解析の効率が向上してより確から
しい解析結果が得られる。
第4図は、上述の英日自動翻訳装置におけるこの発明に
係わる部分のみを示すブロック図である。
これを説明すると、入力装置11によって入力された原
文(英文)を形態素解析部14で形態素解析し、前述の
「ユニット」及び「ブロック」を認定してまとめ上げ処
理を行なう他に、未知語(第3図の単語辞書22に登録
されていない語)の処理、固有名詞2派生語、省略語、
数1時の表現、ハイフォン語、アポストロフィr′」な
どの処理や、同格の推定、付加疑問の処理などの様々な
処理を行なって、形態素解析データを作成し。
それを形態素解析結果メモリ30に格納する。
そして、この形態素解析結果メモリ30に格納された形
態素解析データを読出してディスプレイ4に表示するの
であるが、形態素解析を行なった英文を表示すると共に
、その際ユニット・ブロック情報解読部31によって形
態素解析データからユニットとブロックの情報を解読し
、以下に説明する例では未知語の情報をも解読して1表
示モード変更部32にそれぞれ異なる強調表示モードの
指令を送り、ディスプレイ4上に例えば第1図に示すよ
うな形態素解析結果を表示する。
この例では。
r He 5aid、 ” T yen七仁o the
 White house、”Jという入力文のうち、
rWhite houseJがユニットUと認定されて
他の部分より輝度の高い高輝度表示(図示の都合上枠で
囲んであるが、実際には枠はない)され、rl wen
t to t、he White houseJがブロ
ックBと認定されて下線付表示されている。
また、r And he 5toped sraoki
ng、 Jという入力文のうち、rgtopedJが未
知語Mと認定されて他の部分と明暗を逆転した反転表示
になっている。
この場合、形態素解析データのうちブロック。
ユニット及び未知語に関する情報としては、例えば第5
図に示すように、ブロック開始文字の前にBi(ブロッ
クイン記号)、ブロック終了文字の後にBo(ブロック
アウト記号)、ユニット開始文字の前にU i (ユニ
ットイン記号)、ユニット終了文字の後にU o (ユ
ニットアウト記号)、未知語開始文字の前にMi(未知
語イン記号)、未知語終了文字の後にM o (未知語
アウト記号)がそれぞれ挿入されている。その他のデー
タは図示を省略している。
なお、この各記号Bi、Bo、Ui、Uo、Mi、Mo
は説明を判り易くするために各記号名の略称を大文字と
小文字1字づつの組合せで示したが、実際には通常の英
文には使用されないような記号の組合せによる数バイト
のデータが用いられる。
また、第5図中「−」はスペースを、「り」は文末を示
す記号であり、「1」のあるところは文字間をあけて表
示し、rつ」の次は改行して表示する。
次に、第4図のユニット・ブロック情報解読部31が、
形態素解析データからユニット、ブロック、及び未知語
を判別して表示モード変更部32を制御する処理動作を
、第6図のフローチャートによって説明する。
第4図の形態素解析結果メモリ30から、第5図に示し
たような形態素解析データを、はじめからそれかなくな
るまで1語づつ順次読込む。
、そして、読込んだ語がBiであれば下線付き表示モー
ドを、Mlであれば反転表示モードを。
Uiであれば高輝度表示モードをそれぞれ指令する。ま
た、読込んだ語がUoであれば高輝度表示モードの解除
を、Moであれば反転表示モードの解除を、BOであれ
ば下線付表示モードの解除をそれぞれ指令する。
読込んだ語が上記いずれの記号でもない時には通常モー
ドの表示を行なう。
このようにして、第1図に示したようにブロックとユニ
ット及び未知語の情報を、ディスプレイ上にそれぞれ異
なる強調表示手段によって明示することができる。
なお、この例ではブロックを下線付表示で、ユニットを
高輝度表示で、未知語を反転表示でそれぞれ強調表示す
るようにしたが、これを替えてもよいし、上線付表示、
明滅表示等の他の強調表示手段を用いてもよいことは勿
論である。
また、この発明は、英日自動翻訳装置における英文の形
態素解析結果の表示に限るものではなく。
他の外国語から日本語へ、あるいは日本語から各種外国
語へ自動又は半自動で翻訳する翻訳装置において、自然
言語の入力文CM文)を形態素解析した結果を表示する
のに同様に適用できる。
肱−釆 以上説明してきたように、この発明による形態素解析結
果表示方式を実施すれば、翻訳装置に入力した原文の形
態素解析結果がディスプレイ上に表示され、特にユニッ
トとブロックの認定結果が明示されるので、オペレータ
がそれを確認することができ、訳文の解釈や誤りの修正
が容易になる。
【図面の簡単な説明】
第1図はこの発明の一実施例による形態素解析結果の表
示例を示す図。 第2図はこの発明を実施した英日自動翻訳装置のシステ
ム構成例を示す外観斜視図、 第3図は同じくその全体のブロック構成図。 第4図は同じくこの発明に係わる部分のブロック構成図
、 第5図は形態素解析データの一例を示す説明図。 第6図は第4図のユニット・ブロック情報解読部31に
よる処理動作のフロー図である。 1・・・キーボード   2・・・イメージスキャナ3
・・・光学文字認識装置 4・・・CRTディスプレイ装置 5・・・プリンタ    6・・・本体7・・・ハード
ディスク装置 (HDD)8・・・フロッピディスク装
[(FDD)11・・・入力装置 14・・・形態素解析部 30・・・形態素解析結果メモリ 31・・・ユニット・ブロック情報解読部32・・・表
示モード変更部 第1図 ム

Claims (1)

  1. 【特許請求の範囲】 1 入力された原文に対して形態素解析を行なって、翻
    訳プロセスの最小単位となる語の集まりであるユニット
    と、該ユニットよりは大きい語の集まりであるブロック
    のまとめあげ処理を行なった後、構文解析、構造変換、
    訳文生成等の翻訳プロセスを実行する翻訳装置において
    、 前記形態素解析を行なった原文をディスプレイ上に表示
    すると共に、前記ユニットとブロックの情報をそれぞれ
    高輝度、反転、下線、明滅等の異なる強調表示手段によ
    って明示することを特徴とする形態素解析結果表示方式
JP61113530A 1986-05-20 1986-05-20 翻訳装置における形態素解析結果修正方式 Pending JPS62271054A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113530A JPS62271054A (ja) 1986-05-20 1986-05-20 翻訳装置における形態素解析結果修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113530A JPS62271054A (ja) 1986-05-20 1986-05-20 翻訳装置における形態素解析結果修正方式

Publications (1)

Publication Number Publication Date
JPS62271054A true JPS62271054A (ja) 1987-11-25

Family

ID=14614659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113530A Pending JPS62271054A (ja) 1986-05-20 1986-05-20 翻訳装置における形態素解析結果修正方式

Country Status (1)

Country Link
JP (1) JPS62271054A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230179A (ja) * 1988-10-15 1990-09-12 Ikuo Kudo 機械翻訳による語学教育装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190269A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190269A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230179A (ja) * 1988-10-15 1990-09-12 Ikuo Kudo 機械翻訳による語学教育装置

Similar Documents

Publication Publication Date Title
US5587902A (en) Translating system for processing text with markup signs
US5848386A (en) Method and system for translating documents using different translation resources for different portions of the documents
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US7707026B2 (en) Multilingual translation memory, translation method, and translation program
JPS62163173A (ja) 機械翻訳方法
KR900006671B1 (ko) 언어생성장치
US5608623A (en) Special cooccurrence processing method and apparatus
JPH0344764A (ja) 機械翻訳装置
Hirakawa et al. EJ/JE Machine Translation System ASTRANSAC—Extensions toward Personalization
JPH0332106B2 (ja)
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JP2626722B2 (ja) 日本語生成装置
JP2632806B2 (ja) 言語解析装置
JPS62271057A (ja) 翻訳装置における辞書登録方式
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2521435B2 (ja) 日本語生成装置
JP2715419B2 (ja) 翻訳装置
JPH06295309A (ja) 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JP2938897B2 (ja) 文書作成処理装置
JPS62271053A (ja) 翻訳装置における形態素解析結果修正方式
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH0785057A (ja) 構文解析方法及び装置
JPS62271055A (ja) 翻訳文編集方式
JPH0421169A (ja) 翻訳装置
JPH04130577A (ja) 自然言語処理装置