JPH02112068A - テキスト簡略表示方式 - Google Patents
テキスト簡略表示方式Info
- Publication number
- JPH02112068A JPH02112068A JP63263931A JP26393188A JPH02112068A JP H02112068 A JPH02112068 A JP H02112068A JP 63263931 A JP63263931 A JP 63263931A JP 26393188 A JP26393188 A JP 26393188A JP H02112068 A JPH02112068 A JP H02112068A
- Authority
- JP
- Japan
- Prior art keywords
- text
- sentence
- simplified
- language
- japanese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 claims abstract description 18
- 238000013519 translation Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 31
- 239000000470 constituent Substances 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000001915 proofreading effect Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 241000277269 Oncorhynchus masou Species 0.000 claims description 2
- 238000012937 correction Methods 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 12
- 239000003607 modifier Substances 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 13
- 230000014616 translation Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 1
- 101150060239 MOM1 gene Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、大意のテキストを速読しやすくするためのテ
キスト変換および表示方式に関するものである。
キスト変換および表示方式に関するものである。
大量のテキストの内容を素早く適確に理解ならしめるた
めに、技術文献等では抄録(アブストラクト)が利用さ
れている。しかし、このような抄録は、すべてのドキュ
メントに対して予め設定されているわけではない、そこ
で、従来より、テキスト中のキーワードを抽出してテキ
ストの記述内容をキーワードにより表現する方法や、さ
らに進んで抄録を自動的に生成する方式が提案されてい
る。
めに、技術文献等では抄録(アブストラクト)が利用さ
れている。しかし、このような抄録は、すべてのドキュ
メントに対して予め設定されているわけではない、そこ
で、従来より、テキスト中のキーワードを抽出してテキ
ストの記述内容をキーワードにより表現する方法や、さ
らに進んで抄録を自動的に生成する方式が提案されてい
る。
抄録を自動生成する方式は、長丸 真著「言語工学Jp
p28−29(昭和58年)にも記載されているように
、現状のレベルでは自動抄録方式の決定的な手法は解明
されていない0例えば、特開昭61−1176584+
(r文章抄録装置」)等に代表されるように、テキスト
中から重要な文のみを抽出し、それを繋いで文章の抄録
として扱っているものがある。しかしこのような抄録生
成方式では。
p28−29(昭和58年)にも記載されているように
、現状のレベルでは自動抄録方式の決定的な手法は解明
されていない0例えば、特開昭61−1176584+
(r文章抄録装置」)等に代表されるように、テキスト
中から重要な文のみを抽出し、それを繋いで文章の抄録
として扱っているものがある。しかしこのような抄録生
成方式では。
重要な文の抽出が間違っていれば、抄録の意味がつかめ
なくなるという問題が発生する。
なくなるという問題が発生する。
上記従来技術では、重要な文のみを抽出することにより
抄録として扱うという点に無理がある。
抄録として扱うという点に無理がある。
そもそも、抄録を作成するには1文の大意を理解して、
要点だけを表現しなおす必要がある0文のサンプリング
だけでは、文の流れが把握できない場合も起こりつるた
め、自動的に抄録を作成することは困犀である。
要点だけを表現しなおす必要がある0文のサンプリング
だけでは、文の流れが把握できない場合も起こりつるた
め、自動的に抄録を作成することは困犀である。
本発明の目的は、抄録を自動的に作成することではなく
、大量のテキストを速読しやすくするためのテキスト表
示装置を提供することにある。
、大量のテキストを速読しやすくするためのテキスト表
示装置を提供することにある。
上記目的は、大量のテキストを表示する際に、文を解析
し、文を構成する必須要素となりうる語句とそれ以外の
語句を識別することにより、必須要素のみを用いて文を
簡略文として再構成する手段と、元の文と簡略文との対
応関係を保持させることにより、簡略文のみでは意味が
理解できない場合、対応する完全な文を表示する手段を
備えることにより達成できる。
し、文を構成する必須要素となりうる語句とそれ以外の
語句を識別することにより、必須要素のみを用いて文を
簡略文として再構成する手段と、元の文と簡略文との対
応関係を保持させることにより、簡略文のみでは意味が
理解できない場合、対応する完全な文を表示する手段を
備えることにより達成できる。
上記手段により、大量のテキストを表示する際に、文を
解析し1文を構成する必須要素となりつる語句とそれ以
外の語句を識別し、必須要素のみを用いて文を簡略文と
して再構成することにより。
解析し1文を構成する必須要素となりつる語句とそれ以
外の語句を識別し、必須要素のみを用いて文を簡略文と
して再構成することにより。
冗長な修飾語句を除いた形式で1本来のテキストよりも
量的に少ないテキストを速読の対象とじて利用すること
ができる。さらに、簡略文を読んだだけではテキストの
意味が理解できない場合、簡略文と元のテキストとの対
応関係を保持しているので、対応する完全な文を表示す
ることにより文の大意を把握しながら読み進むことが可
能となる。
量的に少ないテキストを速読の対象とじて利用すること
ができる。さらに、簡略文を読んだだけではテキストの
意味が理解できない場合、簡略文と元のテキストとの対
応関係を保持しているので、対応する完全な文を表示す
ることにより文の大意を把握しながら読み進むことが可
能となる。
さらに、副次的効果として1文の構成要素を依存修飾関
係として認識しているので、構成要素間の関係を利用し
た文の編集操作が可能となり、従来の文字列単位の編集
操作に比べて操作性が向上することが挙げられる。
係として認識しているので、構成要素間の関係を利用し
た文の編集操作が可能となり、従来の文字列単位の編集
操作に比べて操作性が向上することが挙げられる。
以下、本発明を複数の実施例を参照して詳細に説明する
。
。
第1図は1本発明の実施例を示すブロック図を表わす。
図中、1はプロセッサ、2はデイスプレィ装置、3はキ
ーボード等の入力装置、4はメモリ、5は翻訳処理部、
6は日本語構造抽出部、7は英文データファイル、8は
翻訳用英日辞書ファイル、9は日本語解析辞書ファイル
、10は日本文データファイルをそれぞれ示す。メモリ
4で、41は簡略文テーブル、42は対応関係テーブル
。
ーボード等の入力装置、4はメモリ、5は翻訳処理部、
6は日本語構造抽出部、7は英文データファイル、8は
翻訳用英日辞書ファイル、9は日本語解析辞書ファイル
、10は日本文データファイルをそれぞれ示す。メモリ
4で、41は簡略文テーブル、42は対応関係テーブル
。
43は重要語テーブルの格納領域、44は構造化テーブ
ル、45は編集用テーブルをそれぞれ示す。
ル、45は編集用テーブルをそれぞれ示す。
失胤梃よ
実施例として、英語から日本語への翻訳文に対するテキ
スト簡略表示方法について、第1図のブロック図を用い
て述べる。以下1本発明による翻訳処理の流れを第2図
に示す処理フローに従って説明する。
スト簡略表示方法について、第1図のブロック図を用い
て述べる。以下1本発明による翻訳処理の流れを第2図
に示す処理フローに従って説明する。
(201)英文データファイル7より、対象となる英文
テキストを抽出し、翻訳用英日辞書ファイル8を利用し
て、−文ずつ英文解析を行なう。
テキストを抽出し、翻訳用英日辞書ファイル8を利用し
て、−文ずつ英文解析を行なう。
英文解析結果として英文中間表現を抽出する。英文中間
表現は、第5図(a)に示されるように、名詞句(N)
、動詞(V)、前置以句(PNAL)等の構文要素の間
の構文的関係を反映したものである。述部(vp)とし
て認識されたノードは、その構成要素として主語(SU
BJ)や主動詞(G OV)等の必須要素(図中、直線
でリンクされたもの)を持つ、一方、必須要素以外に、
副Mjl的修飾関係を示す前置詞句等の任意要素(図中
。
表現は、第5図(a)に示されるように、名詞句(N)
、動詞(V)、前置以句(PNAL)等の構文要素の間
の構文的関係を反映したものである。述部(vp)とし
て認識されたノードは、その構成要素として主語(SU
BJ)や主動詞(G OV)等の必須要素(図中、直線
でリンクされたもの)を持つ、一方、必須要素以外に、
副Mjl的修飾関係を示す前置詞句等の任意要素(図中
。
波線でリンクされたもの)が存在する。
(202)英文中間表現を日本文中間表現に変換する。
変換に当たっては、翻訳用英日辞書ファイル8に格納さ
れている英語の動詞パターンと日本語の格パターンとの
対応関係を利用する。これらの対応関係は、第6図に示
すように英語の動詞のタイプによって標準の格パターン
を対応づけられるが、さらに第7図に示すように個々の
見出し語の持つ訳語に対応して格パターンを設定するこ
とにより、より精緻な変換が可能となる。
れている英語の動詞パターンと日本語の格パターンとの
対応関係を利用する。これらの対応関係は、第6図に示
すように英語の動詞のタイプによって標準の格パターン
を対応づけられるが、さらに第7図に示すように個々の
見出し語の持つ訳語に対応して格パターンを設定するこ
とにより、より精緻な変換が可能となる。
ここで、日本語の格パターンとして記述された格パター
ンの構成要素は、述部の動詞からみた必須格要素として
扱われる。従って、日本文中間表現としては、第5図(
b)に示すように述部動詞から見た必須的な要素(直線
でリンクされる)と任意の要素(波線でリンクされる)
に分類される。
ンの構成要素は、述部の動詞からみた必須格要素として
扱われる。従って、日本文中間表現としては、第5図(
b)に示すように述部動詞から見た必須的な要素(直線
でリンクされる)と任意の要素(波線でリンクされる)
に分類される。
(203)日本文中間表現から本構造のトップのノード
を主文として捉え、主文の述部の動詞からみた必須格要
素のみを取り出して1日本語文を合成し、簡略文テーブ
ル41にセットする(第5図(Q)参照)。
を主文として捉え、主文の述部の動詞からみた必須格要
素のみを取り出して1日本語文を合成し、簡略文テーブ
ル41にセットする(第5図(Q)参照)。
(204)日本文中間表現から、すべてのノードを辿っ
て日本語文を合成し、日本文データファイル10にセッ
トする(第5図(d)参照)。
て日本語文を合成し、日本文データファイル10にセッ
トする(第5図(d)参照)。
(205)英文データファイル7、日本文データファイ
ルio、@略文テーブル41に格納したデータの対応関
係を対応関係テーブル42にセットする。(206)最
後の英文まで処理を終えたがどうかチエツクし、処理終
了であれば(207)の処理へ移り、処理未終了であれ
ば(201)の処理へ移る。
ルio、@略文テーブル41に格納したデータの対応関
係を対応関係テーブル42にセットする。(206)最
後の英文まで処理を終えたがどうかチエツクし、処理終
了であれば(207)の処理へ移り、処理未終了であれ
ば(201)の処理へ移る。
以上の処理における、英文解析方式および日本文生成方
式については、特開昭56−138586号に開示され
た翻訳処理方式の一部分を用いることが可能であり、こ
こでの説明は省略した。
式については、特開昭56−138586号に開示され
た翻訳処理方式の一部分を用いることが可能であり、こ
こでの説明は省略した。
(207)簡略文をデイスプレィ装置2上に表示する。
画面表示の処理については、第3図の処理フローに従い
説明する。
説明する。
(301)画面表示の初期値を設定する。ここで。
画面表示データは、画面表示モードと表示カレント文番
号の組み合わせにより設定する。画面表示モードは、第
4図に示すように、画面表示エリア内のレイアウトを定
義している6画面表示モードは、変数modeにより管
理する。表示カレント文番号は、対応関係テーブル42
で管理されている簡略文2日本文、英文の対応関係を利
用して1画面に表示する先頭の文番号を変数DCにより
管理する。modeおよびDCの初期値は、ともに1と
する。
号の組み合わせにより設定する。画面表示モードは、第
4図に示すように、画面表示エリア内のレイアウトを定
義している6画面表示モードは、変数modeにより管
理する。表示カレント文番号は、対応関係テーブル42
で管理されている簡略文2日本文、英文の対応関係を利
用して1画面に表示する先頭の文番号を変数DCにより
管理する。modeおよびDCの初期値は、ともに1と
する。
(302) modeの値に従って、簡略文、英文9日
本文の中から表示すべきデータを決定し、DCで示され
る文番号からデータを取り出して画面表示する。
本文の中から表示すべきデータを決定し、DCで示され
る文番号からデータを取り出して画面表示する。
(303)キーボードから入力さ°れる操作キーに従っ
て、それぞれの処理へ移る。操作キーとしては、上下ス
クロールと表示画面モードの変更であり、変数DCとm
odeの値を変更することにより対処できる。
て、それぞれの処理へ移る。操作キーとしては、上下ス
クロールと表示画面モードの変更であり、変数DCとm
odeの値を変更することにより対処できる。
以上の処理を適用した例を第10図に示す。図中、(a
)は英文データ、(b)は英文翻訳結果の簡略文、(c
)は英文翻訳の日本文をそれぞれ示す。
)は英文データ、(b)は英文翻訳結果の簡略文、(c
)は英文翻訳の日本文をそれぞれ示す。
以上が1本発明による翻訳テキスト簡略表示方式の一実
施例である。
施例である。
ここでは、(202)の処理において、格パターン中の
必須格要素を残し、他の任意格要素を削除する実施例に
ついて説明したが、(202)において、さらに、重要
語テーブル44に登録したキーワード(英単語や日本語
語句)や意味コードと合致した句要素を必須格要素と同
等に扱うようにすることも可能である。例えば、ある単
語は必ず抽出して簡略文に反映させたい場合にはキーワ
ードを、場所や時間を表す語句は必ず抽出させたいとい
った場合には意味コードを指定することにより対処でき
る。
必須格要素を残し、他の任意格要素を削除する実施例に
ついて説明したが、(202)において、さらに、重要
語テーブル44に登録したキーワード(英単語や日本語
語句)や意味コードと合致した句要素を必須格要素と同
等に扱うようにすることも可能である。例えば、ある単
語は必ず抽出して簡略文に反映させたい場合にはキーワ
ードを、場所や時間を表す語句は必ず抽出させたいとい
った場合には意味コードを指定することにより対処でき
る。
ヌJ1匿」工
次に日本語文テキストの簡略表示の実施例について第1
図を用いて述べる。
図を用いて述べる。
以下、本発明による日本文テキスト簡略表示処理の流れ
を第9図に示すフローに従って説明する。
を第9図に示すフローに従って説明する。
(901)日本文データファイル10より、対象となる
日本文テキストを抽出し1日本語解析用辞書ファイル9
を利用して、−文ずつ日本文解析を行なう。日本文解析
結果として日本文中間表現を抽出する。解析に当たって
は1日本語解析用辞書ファイル9に格納されている述語
の格パターンを利用する。
日本文テキストを抽出し1日本語解析用辞書ファイル9
を利用して、−文ずつ日本文解析を行なう。日本文解析
結果として日本文中間表現を抽出する。解析に当たって
は1日本語解析用辞書ファイル9に格納されている述語
の格パターンを利用する。
格パターンは、第8図に示すように、述語に相当する個
々の見出し語に対応して設定されており。
々の見出し語に対応して設定されており。
必須格と任意格が明示されている。従って、日本文中間
表現の構成要素としては、第5図(b)に示すように述
語から見て必須的な要素(面縁でリンクされる)と任意
の要素(波線でリンクされる)に分類できる。
表現の構成要素としては、第5図(b)に示すように述
語から見て必須的な要素(面縁でリンクされる)と任意
の要素(波線でリンクされる)に分類できる。
(902)日本文中間表現から木構造のトップのノード
を主文として捉え、主文の述部の動詞からみた必須格要
素のみを取り出して、日本語文を合成し、簡略文テーブ
ル41にセットする。
を主文として捉え、主文の述部の動詞からみた必須格要
素のみを取り出して、日本語文を合成し、簡略文テーブ
ル41にセットする。
(903)日本文データファイル10と簡略文テーブル
41に格納したデータの対応関係を対応関係テーブル4
2にセットする。
41に格納したデータの対応関係を対応関係テーブル4
2にセットする。
(904)最後の日本文まで処理を終えたかどうかチエ
ツクし、処理終了であれば(905)の処理へ移り、処
理未終了であれば(901)の処理へ移る。
ツクし、処理終了であれば(905)の処理へ移り、処
理未終了であれば(901)の処理へ移る。
以上の処理における日本文解析方式については。
藤田他著(日本語の構成処理−日本語文の標準的分解−
」 (電子通信学会論文誌Dvo1.58N。
」 (電子通信学会論文誌Dvo1.58N。
7.1975)や島津他著「格構造モデルに基づいた日
本語文の分析と解析」 (情報処理学会自然言語処理研
究会29−1.1982)等で公知となっている方式を
用いることが可能であり、ここでの説明は省略した。
本語文の分析と解析」 (情報処理学会自然言語処理研
究会29−1.1982)等で公知となっている方式を
用いることが可能であり、ここでの説明は省略した。
(905)簡略文をデイスプレィ装置2上に表示する。
画面表示の処理については、実施例1における第3図の
処理フローと同様にして実現可能である。異なるのは、
画面表示モードが第4図の(a)と(b)の2つに限ら
れている点だけであり、詳細説明は省略する。
処理フローと同様にして実現可能である。異なるのは、
画面表示モードが第4図の(a)と(b)の2つに限ら
れている点だけであり、詳細説明は省略する。
以上の処理を適用した例を第11図に示す。図中、(、
)は日本文データ、(b)は簡略文をそれぞれ示す。
)は日本文データ、(b)は簡略文をそれぞれ示す。
以上が1本発明による日本文テキスト簡略表示方式の一
実施例である。
実施例である。
実施例1および実施例2では、簡略文と対応する日本文
を区別して扱ったが、簡略文は対応する日本中のサブセ
ットであり、第12図に示すように日本文中の簡略文の
要素となる文字列のみを他の文字列と識別して表示する
ことも可能である。
を区別して扱ったが、簡略文は対応する日本中のサブセ
ットであり、第12図に示すように日本文中の簡略文の
要素となる文字列のみを他の文字列と識別して表示する
ことも可能である。
さらに、ffl!Is文として引き締まった形式にする
ために1文末表現を体言止めにする方法や、「です・ま
す」調を「である・だ」調に変更する方法も有効であり
、容易に実現できる。第13図に、第11図(b)の簡
略文に上記文末処理を適用した結果を示す。
ために1文末表現を体言止めにする方法や、「です・ま
す」調を「である・だ」調に変更する方法も有効であり
、容易に実現できる。第13図に、第11図(b)の簡
略文に上記文末処理を適用した結果を示す。
311辺」−
本発明を日本文の校正処理に適用した実施例について第
1図のブロック図を用いて第14図の処理フローに従い
説明する。
1図のブロック図を用いて第14図の処理フローに従い
説明する。
(1401)編集対象の日本文データを日本文データフ
ァイル10より抽出し、編集用テーブルにセットし1画
面表示する。
ァイル10より抽出し、編集用テーブルにセットし1画
面表示する。
(1402)日本文データを画面表示後、編集操作キー
の入力に従い、画面表示された日本文データの編集処理
を行なう0編集操作キーとして、「編集終了キー」が押
下された場合1編集された日本文データを日本文データ
ファイル10に格納してすべての処理を終了する。「構
造化編集キー」が押下された場合、(1403)の処理
へ移る。
の入力に従い、画面表示された日本文データの編集処理
を行なう0編集操作キーとして、「編集終了キー」が押
下された場合1編集された日本文データを日本文データ
ファイル10に格納してすべての処理を終了する。「構
造化編集キー」が押下された場合、(1403)の処理
へ移る。
その他の編集操作キーが押下された場合は。
(1402)へ移り対応する文書編集操作処理を行なう
が、この部分の編集操作処理内容は1文字列の訂正・削
除・挿入等の処理であり、既存のワードプロセッサー等
で公知になっているものをそのまま流用することができ
るので説明は省略する。
が、この部分の編集操作処理内容は1文字列の訂正・削
除・挿入等の処理であり、既存のワードプロセッサー等
で公知になっているものをそのまま流用することができ
るので説明は省略する。
(1403)r構造化編集キー」が押下された時のカー
ソルを含む日本文を取り出し、日本文解析を行ない、日
本文中間表現を抽出する。
ソルを含む日本文を取り出し、日本文解析を行ない、日
本文中間表現を抽出する。
(1404)日本文中間表現から、構造化編集に使う構
造化データを生成し、構造化テーブルにセットする。構
造化データは、格構造による依存修飾関係としてとらえ
られる日本文中間表現から構成要素句の訳語を取り出し
、構成要素句を1つの処理単位として扱い、構成要素旬
間の依存修飾関係を明示したものであり、第15図(a
)にその−例を示す。図中、左端の番号は、構成要素句
の識別番号を示し、右端の矢印と番号が依存修飾光の構
成要素句を示している。さらに、矢印の前の[申」は、
依存修飾光の述部に対する必須構成要素であることを示
す。
造化データを生成し、構造化テーブルにセットする。構
造化データは、格構造による依存修飾関係としてとらえ
られる日本文中間表現から構成要素句の訳語を取り出し
、構成要素句を1つの処理単位として扱い、構成要素旬
間の依存修飾関係を明示したものであり、第15図(a
)にその−例を示す。図中、左端の番号は、構成要素句
の識別番号を示し、右端の矢印と番号が依存修飾光の構
成要素句を示している。さらに、矢印の前の[申」は、
依存修飾光の述部に対する必須構成要素であることを示
す。
(1405)構造化テーブル中の構造化データを画面表
示する。画面表示例は、第15図(a)のようになる。
示する。画面表示例は、第15図(a)のようになる。
(1406)構造化データの編集操作処理を行なう。構
造化データの画面編集処理は、第15図(a)の画面表
示に対して1行革位の削除、移動が行なえる他、行内の
文字列データの編集操作を行なえる。これらの処理の実
現には、既存の行エディタの機能やワードプロセッサの
機能をそのまま流用することができるので、説明は省略
する。
造化データの画面編集処理は、第15図(a)の画面表
示に対して1行革位の削除、移動が行なえる他、行内の
文字列データの編集操作を行なえる。これらの処理の実
現には、既存の行エディタの機能やワードプロセッサの
機能をそのまま流用することができるので、説明は省略
する。
構造化データの編集操作処理が終了すれば、編集操作さ
れた構造化データは、構造化テーブル44に再格納され
、(1407)の処理へ移る。
れた構造化データは、構造化テーブル44に再格納され
、(1407)の処理へ移る。
(1407)構造化テーブル44中の構造化データの構
成要素旬は順番に連結し、日本文を合成し。
成要素旬は順番に連結し、日本文を合成し。
編集用テーブル中の該当日本文と置換した後、画面表示
する。さらに、引き続き、(1402)の処理へ移る。
する。さらに、引き続き、(1402)の処理へ移る。
以上の処理により、日本文を構造化編集することが可能
となる。第15図に構造化編集による画面の推移を示す
、同図(a)に対して、2行目削除を実行すると、同図
(b)となり、さらに、1行目と2行目の文字修正を行
なって同図(c)となる、ここで1gt造化編集を終了
すれば、同図(b)に示すような日本文が再合成される
。
となる。第15図に構造化編集による画面の推移を示す
、同図(a)に対して、2行目削除を実行すると、同図
(b)となり、さらに、1行目と2行目の文字修正を行
なって同図(c)となる、ここで1gt造化編集を終了
すれば、同図(b)に示すような日本文が再合成される
。
以上が、本発明による日本文校正処理方式の実施例であ
る。
る。
以上説明したごとく本発明によれば、大量のテキストを
表示する際に1文を解析し1文を祷成する必須要素とな
りうる語句とそれ以外の語句を識別し、必須要素のみを
用いて文を簡略文として再構成することにより、冗長な
修飾語句を除いた形式で、本来のテキストよりも量的に
少ないテキストを速読の対象として利用することができ
る。さらに、簡略文を読んだだけではテキストの意味が
理解できない場合、簡略文と元のテキストとの対応関係
を保持しているので、対応する完全な文を表示すること
により文の大意を把握しながら読み進むことが可能とな
る。
表示する際に1文を解析し1文を祷成する必須要素とな
りうる語句とそれ以外の語句を識別し、必須要素のみを
用いて文を簡略文として再構成することにより、冗長な
修飾語句を除いた形式で、本来のテキストよりも量的に
少ないテキストを速読の対象として利用することができ
る。さらに、簡略文を読んだだけではテキストの意味が
理解できない場合、簡略文と元のテキストとの対応関係
を保持しているので、対応する完全な文を表示すること
により文の大意を把握しながら読み進むことが可能とな
る。
さらに、副次的効果として、文の構成要素を依存修飾関
係として認識しているので、構成要素間の関係を利用し
た文の編集操作が可能となり、従来の文字列単位の編集
操作に比べて操作性が向上することが挙げられる。
係として認識しているので、構成要素間の関係を利用し
た文の編集操作が可能となり、従来の文字列単位の編集
操作に比べて操作性が向上することが挙げられる。
第1図は本発明の一実施例のシステム構成を示すブロッ
ク図、第2図および第3図は1本発明の一実施例を説明
するための処理フロー図、第4図は本発明の実施例にお
けるデイスプレィ画面表示例の説明図、第5図、第6図
、第7図および第8図は1本発明の一実施例の文章解析
処理の説明図、第9図は1本発明の他の実施例を説明す
るための処理フロー図、第10図、第11図、第12図
及び第13図は、本発明の実施例の文章表示例を示す説
明図、第14図は1本発明のさらに他の実施例を説明す
るための処理フロー図、第15図は、本発明の文書校正
処理の説明図である。 1・・・プロセッサ、2・・・デイスプレィ装置、3・
・・キーボード等の入力装置、4・・・メモリ、5・・
・翻訳処理部、6・・・日本語構造抽出部、7・・・英
文データファイル、8・・・翻訳用英日辞書ファイル、
9・・・日本語解析用辞書ファイル、10・・・日本文
データファイル、41・・・簡略文テーブル、42・・
・対応関係テーブル、43・・・重要語テーブルの格納
領域、44・・・構造化テーブル、45・・・編集用テ
ーブル。 某 1 回 富 2 図 冨 図 ¥ 図 (艮)moム1 (b) mθd、e2 CC) matLe3 (cL) rnotlet (e) mode 5 冨 国 第 図 窩 図 鳴る 主−格(1辺+l:M/猟O場戸午(仕【7つぶ殻皓冨 q 口 ]4− 第 図(a) 纂 図 (b) 第 図 第 皿 図 葛 図 81イ丁目乙2イデ財文字4鉦 I4鼻遁、化県疾
ク図、第2図および第3図は1本発明の一実施例を説明
するための処理フロー図、第4図は本発明の実施例にお
けるデイスプレィ画面表示例の説明図、第5図、第6図
、第7図および第8図は1本発明の一実施例の文章解析
処理の説明図、第9図は1本発明の他の実施例を説明す
るための処理フロー図、第10図、第11図、第12図
及び第13図は、本発明の実施例の文章表示例を示す説
明図、第14図は1本発明のさらに他の実施例を説明す
るための処理フロー図、第15図は、本発明の文書校正
処理の説明図である。 1・・・プロセッサ、2・・・デイスプレィ装置、3・
・・キーボード等の入力装置、4・・・メモリ、5・・
・翻訳処理部、6・・・日本語構造抽出部、7・・・英
文データファイル、8・・・翻訳用英日辞書ファイル、
9・・・日本語解析用辞書ファイル、10・・・日本文
データファイル、41・・・簡略文テーブル、42・・
・対応関係テーブル、43・・・重要語テーブルの格納
領域、44・・・構造化テーブル、45・・・編集用テ
ーブル。 某 1 回 富 2 図 冨 図 ¥ 図 (艮)moム1 (b) mθd、e2 CC) matLe3 (cL) rnotlet (e) mode 5 冨 国 第 図 窩 図 鳴る 主−格(1辺+l:M/猟O場戸午(仕【7つぶ殻皓冨 q 口 ]4− 第 図(a) 纂 図 (b) 第 図 第 皿 図 葛 図 81イ丁目乙2イデ財文字4鉦 I4鼻遁、化県疾
Claims (1)
- 【特許請求の範囲】 1、同一言語内のテキスト変換処理装置において、テキ
ストの中間表現形式を必須構成要素と任意構成要素に識
別する手段と、必須構成要素のみを利用して本来のテキ
ストより短い簡略形のテキストを生成・表示する手段を
有することを特徴とするテキスト簡略表示装置。 2、本来のテキストと変換した簡略形テキストの間の対
応関係を保持する手段を有し、簡略形テキストの表示に
連動して、本来のテキストを表示可能とする手段を有す
る請求項第1項記載のテキスト簡略表示装置。 3、テキストの中間表現形式を必須構成要素と任意構成
要素に識別する手段と、必須構成要素に該当する文字列
を他の任意要素に該当する文字列と識別して表示する手
段を有することを特徴とするテキスト簡略表示装置。 4、第1項記載のテキスト変換装置において、テキスト
の中間表現形式を必須構成要素と任意構成要素に識別す
る方法として、テキスト処理用の言語辞書データとして
述語対応に必須格と任意格から成る格パターンを利用す
る手段と、キーワードや重要意味コードを設定すること
により、テキストの構成句要素として上記キーワードや
重要意味コードを含むものを必須構成要素に移行する手
段を有することを特徴とするテキスト簡略表示装置。 5、テキストの中間表現形式を必須構成要素と任意構成
要素に識別する手段有し、テキストの構成句要素を必須
構成要素に該当する文字列と任意要素に該当する文字列
とに識別して木構造により構造的に表示する手段と、上
記木構造を用いてテキスト中の構成句要素の削除や語順
変更、文字修正等の校正処理を行う手段を有することを
特徴とするテキスト校正処理方式。 6、本来のテキストより短い簡略形のテキストを生成す
る際に、述部の表現形式を「です・ます」調から「であ
る・だ」調に変更する手段を有することを特徴とする請
求項第1項記載のテキスト簡略表示装置。 7、本来のテキストより短い簡略形のテキストを生成す
る際に、述部の表現形式を体言止めに変更する手段を有
することを特徴とする請求項第1項記載のテキスト簡略
表示装置。 8、第1言語で記述されたテキストを第2言語で記述さ
れたテキストに変換する言語間の翻訳処理装置において
、第2言語のテキストの中間表現形式を必須構成要素と
任意構成要素に識別する手段を有し、必須構成要素のみ
を利用して本来のテキストより短い簡略形のテキストを
生成・表示する手段を有することを特徴とする翻訳テキ
スト簡略表示装置。 9、第1言語で記述されたテキストと第2言語で記載さ
れたテキストと簡略形テキストの間の対応関係を保持す
る手段を有し、簡略形テキストの表示に連動して、第1
言語で記載されたテキストと第2言語で記載されたテキ
ストを表示可能とする手段を有する請求項第8項記載の
翻訳テキスト簡略表示装置。 10、第1言語のテキストの中間表現形式を必須構成要
素と任意構成要素に識別する手段を有し、必須構成要素
のみを抽出して、第2言語のテキストの中間表現へ変換
した後、第2言語のテキストを生成・表示する手段をす
ることを特徴とする翻訳テキスト簡略表示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63263931A JPH02112068A (ja) | 1988-10-21 | 1988-10-21 | テキスト簡略表示方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63263931A JPH02112068A (ja) | 1988-10-21 | 1988-10-21 | テキスト簡略表示方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02112068A true JPH02112068A (ja) | 1990-04-24 |
Family
ID=17396250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63263931A Pending JPH02112068A (ja) | 1988-10-21 | 1988-10-21 | テキスト簡略表示方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02112068A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04156663A (ja) * | 1990-10-20 | 1992-05-29 | Fujitsu Ltd | 文章圧縮装置 |
JPH0567107A (ja) * | 1991-09-10 | 1993-03-19 | Toshiba Corp | 文章表示装置 |
US5297027A (en) * | 1990-05-11 | 1994-03-22 | Hitachi, Ltd. | Method of and apparatus for promoting the understanding of a text by using an abstract of that text |
JPH06162080A (ja) * | 1992-11-19 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 機械翻訳装置 |
US5418716A (en) * | 1990-07-26 | 1995-05-23 | Nec Corporation | System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases |
JPH07182373A (ja) * | 1993-03-17 | 1995-07-21 | Toshiba Corp | 文書情報検索装置及び文書検索結果表示方法 |
JPH11282881A (ja) * | 1998-01-27 | 1999-10-15 | Fuji Xerox Co Ltd | 文書要約装置および記録媒体 |
JP2000003126A (ja) * | 1998-03-23 | 2000-01-07 | Xerox Corp | 音声部を使用するテキスト要約方法 |
JP2002132811A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
-
1988
- 1988-10-21 JP JP63263931A patent/JPH02112068A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297027A (en) * | 1990-05-11 | 1994-03-22 | Hitachi, Ltd. | Method of and apparatus for promoting the understanding of a text by using an abstract of that text |
US5418716A (en) * | 1990-07-26 | 1995-05-23 | Nec Corporation | System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases |
JPH04156663A (ja) * | 1990-10-20 | 1992-05-29 | Fujitsu Ltd | 文章圧縮装置 |
JPH0567107A (ja) * | 1991-09-10 | 1993-03-19 | Toshiba Corp | 文章表示装置 |
JPH06162080A (ja) * | 1992-11-19 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 機械翻訳装置 |
JPH07182373A (ja) * | 1993-03-17 | 1995-07-21 | Toshiba Corp | 文書情報検索装置及び文書検索結果表示方法 |
JPH11282881A (ja) * | 1998-01-27 | 1999-10-15 | Fuji Xerox Co Ltd | 文書要約装置および記録媒体 |
JP2000003126A (ja) * | 1998-03-23 | 2000-01-07 | Xerox Corp | 音声部を使用するテキスト要約方法 |
JP2002132811A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7565281B2 (en) | Machine translation | |
US5895446A (en) | Pattern-based translation method and system | |
Hutchins | The origins of the translator's workstation | |
JP3220560B2 (ja) | 機械翻訳装置 | |
US6119077A (en) | Translation machine with format control | |
JP4404211B2 (ja) | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム | |
US20050137853A1 (en) | Machine translation | |
US20050171757A1 (en) | Machine translation | |
JPS6140673A (ja) | 外国語作文用翻訳方法、および翻訳機 | |
US9817887B2 (en) | Universal text representation with import/export support for various document formats | |
JP4304268B2 (ja) | 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム | |
JPH02112068A (ja) | テキスト簡略表示方式 | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JPH03105566A (ja) | 抄録作成方式 | |
JP2626722B2 (ja) | 日本語生成装置 | |
JP2000250913A (ja) | 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体 | |
Nelson | A two-level engine for tagalog morphology and a structured xml output for pc-kimmo | |
JP2521435B2 (ja) | 日本語生成装置 | |
JP2723886B2 (ja) | 機械翻訳装置及びその翻訳規則作成方法 | |
JP2005092616A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Détrez | Methods and tools for automating language engineering | |
JPH04282764A (ja) | 非文訳出装置 | |
JPH04257061A (ja) | 機械翻訳処理方式 | |
EP1306773A1 (en) | Machine translation | |
EP1306774A1 (en) | Machine translation |