JPH02224066A - 文書解析装置 - Google Patents

文書解析装置

Info

Publication number
JPH02224066A
JPH02224066A JP1009899A JP989989A JPH02224066A JP H02224066 A JPH02224066 A JP H02224066A JP 1009899 A JP1009899 A JP 1009899A JP 989989 A JP989989 A JP 989989A JP H02224066 A JPH02224066 A JP H02224066A
Authority
JP
Japan
Prior art keywords
analysis
sentence
display
correct
correcting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1009899A
Other languages
English (en)
Inventor
Junko Mizuno
水野 順子
Juhei Nakagaki
寿平 中垣
Yoshihiro Ueda
良寛 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP1009899A priority Critical patent/JPH02224066A/ja
Publication of JPH02224066A publication Critical patent/JPH02224066A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 本発明は文章の正しい解析結果を得るための文書解析装
置に関する。
「従来の技術、J 機械翻訳システムでは、例えば日本語を人力してこれを
英梧等の他の言語に翻訳する処理を行っている。このよ
うな翻訳作業では、対象となる文章が幾つもの解釈を生
じる場合、どの解釈を採るかによって全く異なった訳文
を作成してしまう。
−例を示す。今、「写真をとる。」という簡単な文章が
存在し、その翻訳が行われるものとする。
この文章は、(イ)写真を机の上等から取り上げると解
釈することもできるし、(ロ)写真を作成するために被
写体を撮ると解釈することもできる。
・また(ハ)写真を盗むことと解釈する・二とも可能で
ある。
このように1つの文章に複数の解釈の可能性が存在する
場合には、次の文章あるいはそれ以降の文章を解析rる
ことによって、これらのうちのいずれの解釈が妥当であ
るかを判別することができる場合がある。ところが、こ
のような可能性を後続の文章に継続して持たぜていくの
は、翻訳システムに過大の負荷を与えることになる。ま
た後続の文章を解析しても、先の文章の解釈が定まらな
ければますます解釈の仕方に困る場合も多い。
そこで、文章の処理を行う場合には、その解析を行い、
結果を基にしてより確からしいものに絞り込むことが必
要となる。このためには、〈イ)翻訳を行うシステム側
で色々な知識をデータく一スとして予め蓄えておぎ、最
も確からしいものを選出するようにするか、(ロ)幾つ
かの選択枝を用意しで装置のオペレータに正しいものを
選んでもらう必要があった。あるいは、〈ハ)文章の解
釈を固定させるために、オペレータが文章作成中に適宜
括弧を挿入rる等の前段階の編集を行ったり、(ニ)当
面何らかの基準によって選択した解析結果に基づいて翻
訳を先行させ、それをオペレータが訂正するという後段
階の編集を)定することもあった。
「発明が解決しようとする課題」 と・−ろが(イ)で示した方法の場合には、解析結果を
十分正し、く絞り込むことを前提とする場合には、シス
テム側に膨大な知識を用意してお(必要があった。従っ
て、このよう’/、l:精度の高いシステムを実現する
ことは、現在の技術水準においてかなりの困難さを伴う
ことになった。一方、く口)に示1また方法では1.可
能性のある解釈を装置のオペ1ノー夕にすべて見せて、
このうちから1つを選択させるとすると、オペレータ側
に要求する負担が大きくなりすぎ、また事務効率の上か
らも得策ではないというのが現状であった。更に、(ハ
〉に示した方法では、せっかく前段階の編集作業が行わ
れても、これを基にした文章の解析結果が間違ってしま
うと入力文を修正(9,なければならず、この場合には
かなり無駄な作業を伴うことになった。、最後ににンに
示す方法では、目的言語に精通していることが要求され
ることになり、これ以外の人にはシステムをうすく使い
こなせないという問題があった。
以上、文章の翻訳について説明したが、同−言巧内でも
文章作成者の意図を汲みながら文章の編集を行うような
場合には同様の問題が発生した。
そこで本発明の目的は、文章解析を比較的簡易にかつ正
確に行うことのできる文書解析装置を提供することにあ
る。
「課題を解決するための手段」 本発明では第1図に原理的に示すように、入力文を解析
−rるための解vr手段11と、この解析手段j1の解
析結果としての名詞、助詞、動詞等の品詞の相互関係を
例えば図解的に表示rる表示手段12と、この表示手段
の表示内容に訂正が必要な場合これを訂正丈る訂正手段
13と、訂正手段13の訂正か行われた後、あるいは訂
正が必要でなかった場合のように表示手段の表示内容が
確定した状態でこれを格納する格納手段14とを文書解
析装置に具備させる。
すなわち本発明では、入力文を解析手段11によって取
り敢えず解析し、その文章の構造を表示手段12によっ
″C視覚的あるいは聴覚的に表示させる。文章作成者等
はこれを見聞きし、必要に応じて文章の構造を訂正し、
その内容を格納手段に格納させる。従って、文章の翻訳
等の処理を行う者は、文章構造を知るJ−とによって文
章を簡単かつ正確に把掴するこさができる。
「実施例」 以下実施例につき本発明の詳細な説明する。
第2図は、本実施例の文書解析装置の構成を表わしたも
のである。文書解析装置はCPU(中央処理装置)21
を備えている。cpu21はデータバス等のバス22を
通じて次の各部と接続されている。
(i)ディスク駆動回路23: 文章の解析を行うためのデータベースや、この文書解析
装置の制御を行うためのプログラドを格納したディスク
装置24の駆動を制御するための装置である。ディスク
装置2,4には、文書解析装置の解析結果の格納も行わ
れるようにな2っている。
(ii) RAM25 : ディスク装置124から読み出されたプログラム等のデ
ータや、文書解析装置の制御に必要なデータを一時的に
格納するためのランダム・アクセス・メモリである。
(iii )キーボード26: 解析の対象となる文章を入力したり、各種作業を進行す
る際に使用される入力装置である。このキーボード26
には、ボインティング・デバイスとしてのマウス27が
接続されるようになってぃる。
(iv)通信制御部28: 回線29を介しで図示しないホストコンビコータ等の情
報源から文章の入力を行うような場合には、通信制御部
28がこの制御を行う。
(v)デイスプレィ駆動回路31: CRTからなるデイスプレィ32にデータを表示するだ
めの各種制御を行うための回路である。
第3図は、このような構成の文書解析装置の機能的な構
成を表わしたものである。文書解析装置は、第2図に示
したキーボー・ド26およびマウス27をまとめた入力
部41を備えている。入力部41から人力された文章4
2は、解析部43に入力され、ここで装置側の能力の範
囲内で文章の解析が行われる。解析部43のこの解析結
果44は、解析結果表示部45に表示される。解析結果
表示部45に表示された内容が文章の構造を正しく表わ
しているものであれば、オペレータの指示によってその
結果46が記憶部47に格納されるこ七になる。ここで
解析結果表示部45は第2図に示すデイスプレィ32に
相当するもので、記憶部47は第2図に示し、たRAM
25に相当する。
解析結果表示部45に表示された内容が文章の構造を正
しく表現していない場合、オペレータは人力部41を操
作して修正データ51を入ツノする。
解析結果編集部48は解析部4:3から送られてきた解
析結果52をこの修正データ51で修正し、これによ。
て得られた解析結果53を解析結果表示部45に表示す
る。オペレータはこの表示された文章の構造をチ、ツタ
し、これが正しければ解析結果編集部48の修正したこ
の内容を記憶部47に格納することになる。
第4図は以上説明した文書解析装置の制御動作の概要を
表わしたものである。この制御動作の流れを実際の文章
の解析作業と共に説明する。
まず、この装置では解析の対象となる1つの文を人力す
るくステップ■)。これが「彼と写真をきりま1.た。
」という文であるとする。文書解析装置はこの文に対し
てまず形態素解析を行う(ステップ■)。ここで形態素
解析とは、文章を名詞、動詞等の品詞に区分けする解析
作業をいう。この例で、“彼”は名詞であり、“と”は
助詞であり、パ写真”は名詞であり、“を“は助詞であ
り、“とり″は動詞であり、”まし″は丁寧を表わす助
動詞、“た°は過去を表わす助動詞である。このような
形態岩解析を行うには、名詞、動詞等の品詞に関する辞
書を用意しておき、これを参照することによって行われ
る。
形態素解析が終了したら、装置は次に構文解析を行う(
ステップ■〉。構文解析とは、各品詞のかかり具合を解
析する作業であり、このために文書解析装置には文法規
則が格納されている。構文解析が終了したら、そのうち
の最も優先度の高いものが解析結果として選ばれ、第2
図に示したデイスプレィ32に表示されることになる(
ステップ■)。
第5図は、この例で最初にディスブl、・イに表示され
た内容を表わしたものである。ディス・プレイ12には
、その右上の部分にウィンドウ61が設定されている。
ウィンドウ61の上部左側には「入力テキスト」という
注釈文が記されており、その下の欄には入力文が表示さ
れている。「入力デキス)・」という注釈文の右側には
「確認」という文字が記されている。これは、表示内容
が正しい場合にこれを確認させるためのものである。
デイスプレィ32の他の部分には、入力文の解析結果が
表示されている。この例では、文章作成者が「彼と写真
をとりました。」という文を入力したところ、装置側で
はこの文に主j吾が省略されているという解析を行い、
「私」という3吾を補足している。また、これをまず最
も簡単な構文として、「彼と写真」 「を」 「とりま
した。」という解析を行い、次に「彼と写真Jという語
句が「彼1と「写真」に並列的に分けられたものとの解
析を行っている。また、「とる」という語句は、「(手
に)取る」という解析が行われている。すなわち、この
例で文書解析装置は、「彼」と「写真」を共に手に取っ
たというよ・うに文章の解析を行っている。
もし、この解析結果が正しければ、文章作成者は前記し
た「確認」という文字の記された領域にカーソルを移動
し、マウス27の図示しないボタンをクリックする。こ
の場合には、デイスプレィ32に表示された解析結果が
正しいものと判別される(ステップ■;Y)。そして、
その解析結果がRAM25に一時的に格納され、最終的
にはディスク装置24に格納される(ステップ■)。こ
のように解析結果が正しければ、必要により次の文章の
解析が同様の制御で続行されることになる。
なお、第5図に示したように文章等の解析結果をグラフ
ィックで表示することは、それぞれの品詞間のかかり具
合を特定し、例えば名詞と動詞を楕円の枠で囲み、助詞
を接合部分に表示するというような約束を行えば、技術
的に特に問題なく実現することができる。
どころで、第5図で示した解析が誤っていた場合には(
ステップ■:N〉、解析結果の編集が行われる(ステッ
プ■)。
第6図は文章作成者によるこのような編集作業を表わし
たものである。文章作成者が[とりました」を「(写真
を)撮りました」という文豪として作成した場合には、
装置側の「取る(手に)」という解釈を「撮る(写真を
)」という解釈に変更する必要がある。この場合には、
この第6図に「取る(手に)」と示した領域に図示しな
いカーソルを移動させ、マウス27のボタンをクリック
する。これにより、新たなウィンドウ62が開かれる。
このウィンドウ62は単語「とる」についての同音異義
語や多義語等による各種態様を表示して文書作成者に最
適なものを選択させるためのものである。このウィンド
ウ62には、「取る(手を)」、「取る(選択する)」
、「撮る(写真を)」、「採る(採集する)」、「執る
(事務)」、それに「盗る(ぬすむ)jの各態様が表示
されており、このうち装置が優先度の高いものとして選
択した「取る(手に)」の態様が網点て表示されている
。文章作成者が、マウス27を下方向に移動させると、
網点のかけられた箇所が1つずつ移動していき、「撮る
(写真を)」に網点がかけられた状態でマウス27のボ
タンをクリックすると、この態様が選択される。すると
文書解析装置は、「(写真を)撮る」という状況の下で
の文書の構文解釈を行い、第7図に示したような表示を
行うことになる。この第7図では、助詞「と」が「(彼
)と共に」の意味となっており、第6図で「彼」から出
ていた「と」に対するリンクを「とる」に直接結び付け
られたことになる。
このようにデイスプレィ32に解釈的に表示された語句
からその使用方法の適否を判別し文書の解釈の修正を行
う方法も存在するが、構文解釈の誤りを直接的に修正す
ることも可能であり、この方が寧ろ容易である場合が多
い。第6図ではこの後者の方法も図解している。この方
法では、「彼」と「写真」を並列的に接続した助詞「と
」を、「が」や「を」と同列の位dに移動している。こ
のような操作は、助詞「と」の位置にカーソル(図示せ
ず)を合わせ、助詞の移動モードにしてこれを図示のよ
うに上方に移動させればよい。このようにすると、文書
解析装置はその構文解釈に合った文章の解析結果を表示
することになる(第7図)。
第7図に示したように文章作成者の意図した文章構造に
なったら、文章作成者はカーソルをウィンドウ61内の
「確認jという場所に移動させ、マウス27のボタンを
クリックする。これにより、第4図のステップ■からス
テップ■へと移動し2、その表示状態の文章構造が解析
結果として保存されることになる。もし、この段階でも
文章作成者の意°に沿わない解析が行われていた場合に
は、史に修正作業が続行されることになる・(ステップ
(つN、■)。
第8図は他の例として、単に「写真をとりま1.。
た」という文の人力があった場合の処置の一例を示して
いる。この例では、先の例と同様であるが主語が省略さ
れている。そこで文書解析装置jよ「私」という主語を
優先的に表示しているが1.−れが文章作成者の意図す
るものでない場合があろ4゜この場合には、図示しない
カーソルを「私」という語句の領域に合わせ、マウス2
7のボタンをクリックすることで、主語に関するウィン
ドウ63が開かれる。ここには、「倶」、「我々」、「
私たち」といったそれぞれ主語として可能性のある語句
が表示されている。文章作成者はこのうちの1つを選択
することで、文章の解釈を明確化させることができる。
もちろん、第5図等に示した例でも「(父が)彼と写真
を撮りました」というように主語を「私」以外に変更す
ることは可能である。この修正作業を行う場合には、第
5図の表示状態でカーソルを「私」に合わせ、第8図に
示した主語に関するウィンドウ63を開くことになる。
なお、実施例では形態素解析が正確に行われたことを前
提としで説明したが、入力文がすべて平仮名のような場
合には、品詞への分解方法を誤る場合もある。このよう
な場合には、例えば誤った分解位置にカーソルを合わせ
てウィンドウを開き、他の品詞に解釈を切り換えるよう
に指示することで形態素分析の結果を修正することがで
きる。
また、実施例ではデイスプレィを用いて解析結果を表示
したが、音声出力を行い、これによって結果の適否を判
別させるようにしてもよい。この場合には、いちいち画
面を見なくても解析結果を判別することができ、不自然
なところのみを修正すればよい。従って、装置の解析が
高度化するほど音声による処理の実効性が高まることに
なる。
「発明の効果−1 このように本発明によれば、装置による入力文の解析結
果を修正して正しい解析結果を記憶させることにしたの
′で、これを元の文章と共にデータペース等に格納して
おけば、これを機械翻訳装r等に渡すことで間違いのな
い翻訳あるいは編集を行うことができる。しかもこの場
合には、後編集が不要となるので、全体として事務処理
を効率化することができる。更に、本発明によれば文章
作成者が品詞の相互関係を表示する技術を身に付ければ
、難解な日本譜の文章等の原案を比較的安易に作成する
ことが可能になり、個人の文章作成能力に左右されない
正確な文章処理が可能になる。
【図面の簡単な説明】
第1図は本発明の原理を示すブロック図、第2図〜第8
図は本発明の一実施例を説明するためのもので、このう
ち第2図は文書解析装置の回路構成の概要を示すブロッ
ク図、第3図はこの文書解析装置の機能構成を示すブロ
ック図、第4図はこの装置の動作の流れを示す流れ図、
第5図はある入力文の最初の解析結果を示すデイスプレ
ィの平面図、第6図はこの解析結果についての2゛つの
修正作業を示すデイスプレィの説明図、第7図はこの入
力文についての最終的な解析結果を示すデイスプレィの
平面図、第8図は他の入力文の解析結果について修正作
業を行っている状態を示すデイスプレィの平面図である
。 11・・・・・・解析手段、12・・・・・・表示手段
、13・・・・・・訂正手段、14・・・・・・格納手
段、21・・・・・・CPU、24・・・・・・ディス
ク装置、25・・・・・・RAM、26・・・・・・キ
ーボード、27・・・・・・マウス、32・・・・・・
デイスプレィ、41・・・・・・人力部、43・・・・
・・解析部、45・・・・・・解析結果表示部、47・
・・・・・記憶部、48・・・・・・解析結果編集部。 第1図 第2図 第 3図 第4図 第6図 第5図 \ 第7図

Claims (1)

  1. 【特許請求の範囲】 入力文を解析するための解析手段と、 この解析手段の解析結果としての名詞、助詞、動詞等の
    品詞の相互関係を表示する表示手段と、この表示手段の
    表示内容を必要に応じ訂正する訂正手段と、 表示手段の表示内容が確定した状態でこれを格納する格
    納手段 とを具備することを特徴とする文書解析装置。
JP1009899A 1988-11-15 1989-01-20 文書解析装置 Pending JPH02224066A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1009899A JPH02224066A (ja) 1988-11-15 1989-01-20 文書解析装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP63-286841 1988-11-15
JP28684188 1988-11-15
JP1009899A JPH02224066A (ja) 1988-11-15 1989-01-20 文書解析装置

Publications (1)

Publication Number Publication Date
JPH02224066A true JPH02224066A (ja) 1990-09-06

Family

ID=26344715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1009899A Pending JPH02224066A (ja) 1988-11-15 1989-01-20 文書解析装置

Country Status (1)

Country Link
JP (1) JPH02224066A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (ja) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol 文脈構造表示装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH0713970A (ja) * 1993-05-28 1995-01-17 Nec Corp 機械翻訳装置
WO2022168681A1 (ja) * 2021-02-03 2022-08-11 国立研究開発法人理化学研究所 データ統合装置、データ統合方法及びプログラム、並びにデジタル都市構築システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6118073A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 校正方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS6224359A (ja) * 1985-07-25 1987-02-02 Ricoh Co Ltd 日本語処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6118073A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 校正方式
JPS61278970A (ja) * 1985-06-03 1986-12-09 Hitachi Ltd 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS6224359A (ja) * 1985-07-25 1987-02-02 Ricoh Co Ltd 日本語処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (ja) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol 文脈構造表示装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH0713970A (ja) * 1993-05-28 1995-01-17 Nec Corp 機械翻訳装置
WO2022168681A1 (ja) * 2021-02-03 2022-08-11 国立研究開発法人理化学研究所 データ統合装置、データ統合方法及びプログラム、並びにデジタル都市構築システム

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
JPS63223962A (ja) 翻訳装置
JPH02224066A (ja) 文書解析装置
JP3005634B2 (ja) 機械翻訳対訳表示装置
JPS61282969A (ja) 言語翻訳装置
JP2626174B2 (ja) 翻訳支援装置
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2811747B2 (ja) 言語処理装置
JPS6224359A (ja) 日本語処理装置
JP2737160B2 (ja) 文章処理装置
JPH03148764A (ja) 機械翻訳装置
JPH03244077A (ja) 翻訳支援装置
JPH0619964A (ja) 機械翻訳装置
JPS63137366A (ja) 機械翻訳装置
JPS62211774A (ja) 機械翻訳システム
JPH05197751A (ja) 機械翻訳装置
JPH0746359B2 (ja) 日本語文章処理方式
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPH03282965A (ja) 機械翻訳システム
JPH01303564A (ja) 文書作成支援装置
JPH03157767A (ja) 機械翻訳装置
JPH0478957A (ja) 翻訳装置
JPH05290083A (ja) 文書作成支援装置
JPH03147180A (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置