JPS6366665A - 文書解析整形装置 - Google Patents
文書解析整形装置Info
- Publication number
- JPS6366665A JPS6366665A JP61209545A JP20954586A JPS6366665A JP S6366665 A JPS6366665 A JP S6366665A JP 61209545 A JP61209545 A JP 61209545A JP 20954586 A JP20954586 A JP 20954586A JP S6366665 A JPS6366665 A JP S6366665A
- Authority
- JP
- Japan
- Prior art keywords
- document
- evolving
- expanded
- hierarchical
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007493 shaping process Methods 0.000 title abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 5
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 2
- 244000171726 Scotch broom Species 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の目的〕
(産業上の利用分野)
本発明は、文書データの主題の展開を示す展開構造を求
め、それに基づき整形を行う文書解析整形装置に関する
。
め、それに基づき整形を行う文書解析整形装置に関する
。
(従来の技術)
文書は、起承転結、導入一本論・結論などの大段落から
構成されている。
構成されている。
論文などの技術交会では「導入」は「序論」、「結論」
は「結びJにあたっている。
は「結びJにあたっている。
又、特許文では、名称・特許請求の範囲・説明のように
、一般の文書とは異なる構成になっている。つまり、一
般文苔とは主題の展開のしかたが異なっている。
、一般の文書とは異なる構成になっている。つまり、一
般文苔とは主題の展開のしかたが異なっている。
このため、例えば論文をそのまま特許文にはできず、そ
の展開を特許文に合わせて変更する必要がある。このと
き、ユーザは論文の「序論」のところの段落は、従来の
技術について触れているから特許文の「従来の技術Jに
該当するというように、論文と特許文の対応をとってい
く。
の展開を特許文に合わせて変更する必要がある。このと
き、ユーザは論文の「序論」のところの段落は、従来の
技術について触れているから特許文の「従来の技術Jに
該当するというように、論文と特許文の対応をとってい
く。
その後、特許文の展開(展開構造)に合うように、論文
の対応部分の並べ換えを行っていく。あるいは、特許文
でも、例えば特許法施行規則を改正に伴い「発明の詳細
な説明Jの展開構造が変更になった。しかし、従来の展
開に慣れている人は無意識のうちに古い展開で書いてし
才う。そのため、書き直しをする必要性がでてくる。
の対応部分の並べ換えを行っていく。あるいは、特許文
でも、例えば特許法施行規則を改正に伴い「発明の詳細
な説明Jの展開構造が変更になった。しかし、従来の展
開に慣れている人は無意識のうちに古い展開で書いてし
才う。そのため、書き直しをする必要性がでてくる。
以上のような場合、手書き文書では切り貼りで対応する
か、全く新しく書き直すかしか方法がない。前者は文書
が汚くなり、後者では作業に手間がかかりすぎ、効率が
悪い。
か、全く新しく書き直すかしか方法がない。前者は文書
が汚くなり、後者では作業に手間がかかりすぎ、効率が
悪い。
ワードプロセッサで作られた文書の場合には、該当部分
を移動して並べかえることで一応対処できる。しかし、
この並へかえの度合が非常に太きいため、作業の進中で
めざす頭圧を見失い、混乱してしまうことが多々ある。
を移動して並べかえることで一応対処できる。しかし、
この並へかえの度合が非常に太きいため、作業の進中で
めざす頭圧を見失い、混乱してしまうことが多々ある。
さらに、移動対象が複数ページにわたっていることが多
く、ページ毎に分けて移動せねばならないため、移動が
頻回になり混乱する原因となる。
く、ページ毎に分けて移動せねばならないため、移動が
頻回になり混乱する原因となる。
(発明が解決しようとする問題点)
上述のように、従来の技術では主題の展開方法を変更す
るにはユーザへの負担が大きく、このため変更に失敗す
る可能性が高かった。
るにはユーザへの負担が大きく、このため変更に失敗す
る可能性が高かった。
本発明は、これらの問題を解決するもので、その目的は
文書データから主題の展開を示す展開構造を抽出し、異
なる展開構造への変換をユーザへの負担少なく行うこと
を可能とする文@解析整形装置を提供することにある。
文書データから主題の展開を示す展開構造を抽出し、異
なる展開構造への変換をユーザへの負担少なく行うこと
を可能とする文@解析整形装置を提供することにある。
(問題点を解決するための手段)
本発明は文書データを解析して、階層構造の解析に必要
な形態要素と、展開構造の解析に必要なキーワードとを
抽出するための手段と、抽出された形態要素を解析して
階層構造を求める手段と、この階層構造とキーワードか
ら展開構造を求める手段と、この展開構造を変換するた
めの変換規則と、この変換規則を参照して抽出された展
開槽、造を整形する手段とをもち、展開構造の変形を行
うものである。
な形態要素と、展開構造の解析に必要なキーワードとを
抽出するための手段と、抽出された形態要素を解析して
階層構造を求める手段と、この階層構造とキーワードか
ら展開構造を求める手段と、この展開構造を変換するた
めの変換規則と、この変換規則を参照して抽出された展
開槽、造を整形する手段とをもち、展開構造の変形を行
うものである。
(作 用)
かくして本発明によれば、与えられた文書データの展開
構造が抽出される。この結果、文書を読者の好みに合わ
せた展開構造に変形して提示することが可能となる。
構造が抽出される。この結果、文書を読者の好みに合わ
せた展開構造に変形して提示することが可能となる。
(実施例)
以下1図面を参照して本発明の一実施例につき説明する
。
。
g1図は、一実施例の概略構成図である。1は装置本体
をなす文書管理部である。2はキーボード等からなる入
力部で、文書データの入力や編集指示などの入力が行わ
れる。入力された文書データは、原文記憶部3に格納さ
れる。と同時に、表示制御部4の制御の下に表示部5に
例えば第2図のように表示される。
をなす文書管理部である。2はキーボード等からなる入
力部で、文書データの入力や編集指示などの入力が行わ
れる。入力された文書データは、原文記憶部3に格納さ
れる。と同時に、表示制御部4の制御の下に表示部5に
例えば第2図のように表示される。
文書管理部1は、基本的には原文記憶部3に格納された
文書データの区切りコード(例えば改行コード)を検出
し、これを1文として以下の処理の管理制御を行う。
文書データの区切りコード(例えば改行コード)を検出
し、これを1文として以下の処理の管理制御を行う。
情報抽出部6は、内容の展開を示すことの多いキーワー
ドを格納した、例えば第3図に示すようなキーワード辞
書8を参照して、上記の1文を解析してキーワードを抽
出する。つまり、情報抽出部6は第3図のキーワードに
該当する語句があるかどうかを捜す。
ドを格納した、例えば第3図に示すようなキーワード辞
書8を参照して、上記の1文を解析してキーワードを抽
出する。つまり、情報抽出部6は第3図のキーワードに
該当する語句があるかどうかを捜す。
例えば、第2図の第2文に関しては、「本発明は〜に関
するJというカテゴリが分野に属するキーワードが含ま
れている。第3図のレベル:呼応は、2つのキーワード
の双方が含まれていなければならない。つまり、[に関
するJや「本発明は」のどちらか一方だけでは、キーワ
ードが含まれていることにはならない。第2文の場合に
は、「本発明はJと「に関する」が両方とも含まれてい
るので、キーワードが合部れでいることになる。
するJというカテゴリが分野に属するキーワードが含ま
れている。第3図のレベル:呼応は、2つのキーワード
の双方が含まれていなければならない。つまり、[に関
するJや「本発明は」のどちらか一方だけでは、キーワ
ードが含まれていることにはならない。第2文の場合に
は、「本発明はJと「に関する」が両方とも含まれてい
るので、キーワードが合部れでいることになる。
第3文にはキーワードがなく、第4文には(カテゴリ:
問題)のキーワード「という問題があった」がある。第
5文には、(カテゴリ:目的)の(レベル:呼応)のキ
ーワード「本発明は」・と「を提供することにある」が
ある。
問題)のキーワード「という問題があった」がある。第
5文には、(カテゴリ:目的)の(レベル:呼応)のキ
ーワード「本発明は」・と「を提供することにある」が
ある。
抽出されたキーワードは例えば、第8図(9)のように
どのカテゴリに属するキーワードだ・うたかが展開構造
記憶部15に格納される。
どのカテゴリに属するキーワードだ・うたかが展開構造
記憶部15に格納される。
階層構造解析部7は見出しの有無、見出しについている
番号(r2、特許請求の範囲Jの「2」)などの形態的
特徴、前後の文の階層構造をもとに章2節などの階層構
造を判定する。第4図は、このような階層構造の解析処
理の流れを示すものである。
番号(r2、特許請求の範囲Jの「2」)などの形態的
特徴、前後の文の階層構造をもとに章2節などの階層構
造を判定する。第4図は、このような階層構造の解析処
理の流れを示すものである。
解析された階層構造は、構造記憶部13の階層構造記憶
部141こ格納される。その結果は、例えば第5図に示
すようになっている。
部141こ格納される。その結果は、例えば第5図に示
すようになっている。
展開構造解析部9は、階層構造記憶部14と展開構造記
憶部15の内容をもとに、展開構造を判定するための規
則が、例えば第7図のような形式で記述され格納されて
いる判別規則辞書10を参照しモ展開構造の判定を行う
。その処理の流れは例えば、第6図に示すようになって
いる。
憶部15の内容をもとに、展開構造を判定するための規
則が、例えば第7図のような形式で記述され格納されて
いる判別規則辞書10を参照しモ展開構造の判定を行う
。その処理の流れは例えば、第6図に示すようになって
いる。
展開構造整形部11は、判定された展開構造が格納され
た展開構造記憶部15の内容をもとに、例えば第9図に
示したような変換則を格納している変換規則辞書12に
基づき、展開構造の表示構造への変換を行い、その結果
を表示制御部4に送る。例えば、変換則A(古い明細書
の書き方)に基づいた結果は第10図(a)、変換則B
(現在の明細書の書き方)に基づいた結果は第10図Φ
)のようになる。
た展開構造記憶部15の内容をもとに、例えば第9図に
示したような変換則を格納している変換規則辞書12に
基づき、展開構造の表示構造への変換を行い、その結果
を表示制御部4に送る。例えば、変換則A(古い明細書
の書き方)に基づいた結果は第10図(a)、変換則B
(現在の明細書の書き方)に基づいた結果は第10図Φ
)のようになる。
以下、第6図の流れ図に沿って展開構造解析部9の処理
の流れを説明する。
の流れを説明する。
第2文が現在文であるとする。その文番号がiiにセッ
トされ(ステップa)に判別規則辞書1゜に格納されて
いる規則(第7図)に合致するものがあるかどうかを探
架する(ステップb)。この場合、第8図(a)及び第
5図から判別側■に一致し、その結果、第2文の展開属
性は分野となる。この結果が、展開構造記憶部15に書
き込まれ、第8図(a)が(6)に変化する(ステップ
d)。
トされ(ステップa)に判別規則辞書1゜に格納されて
いる規則(第7図)に合致するものがあるかどうかを探
架する(ステップb)。この場合、第8図(a)及び第
5図から判別側■に一致し、その結果、第2文の展開属
性は分野となる。この結果が、展開構造記憶部15に書
き込まれ、第8図(a)が(6)に変化する(ステップ
d)。
次に、前方に展開属性の決定されていない文に対しての
処理を行うために、iiを減少させる(ステップC)。
処理を行うために、iiを減少させる(ステップC)。
そして属性がNullのものを探す体テップf)。今は
第1文に判定済みであるので、再びステップCに戻りi
iは0になるので、ステップeの判定で処理が終わる。
第1文に判定済みであるので、再びステップCに戻りi
iは0になるので、ステップeの判定で処理が終わる。
第3文に対しても同様に処理が行われるが、この場合一
致する規則がなく、属性がNullのまま処理が終わる
。
致する規則がなく、属性がNullのまま処理が終わる
。
第4文に対しては、判別側■に一致し、その属性は「問
題Jとなる(ステップd)。その後、属性がNull(
ステップf)の第3文に対して処理が行われ(ステップ
b)、判別側■に一致しその属性が「背景」に決定され
る。
題Jとなる(ステップd)。その後、属性がNull(
ステップf)の第3文に対して処理が行われ(ステップ
b)、判別側■に一致しその属性が「背景」に決定され
る。
第5文に対しても同様に処理が行われ、最終的に展開構
造は第8図(Cンのようになる。
造は第8図(Cンのようになる。
次に、展開構造整形部11の処理について説明する。今
、第9図の変換則Aに沿って展開する例を考える。
、第9図の変換則Aに沿って展開する例を考える。
変換則Aは、まず■に(展開属性二分野)がついている
ものには、そあ展開時に節見出し「〔発明の技術分−野
〕Jを表示し、その後、分野の中味を展開するごとを指
示している。従って、第2図の第2文は展開されると、
第10図(a)の第2文の見出し表示後、第3文として
展開される。
ものには、そあ展開時に節見出し「〔発明の技術分−野
〕Jを表示し、その後、分野の中味を展開するごとを指
示している。従って、第2図の第2文は展開されると、
第10図(a)の第2文の見出し表示後、第3文として
展開される。
次に■に(展開属性:背景)と(展開属性二問題)は両
方あわせて展開し、その節見出しとして「〔発明の〜問
題点〕」を表示することが指示されている。その結果が
第10図(a)の第4〜6文となる。以降、同様に展開
を行う。
方あわせて展開し、その節見出しとして「〔発明の〜問
題点〕」を表示することが指示されている。その結果が
第10図(a)の第4〜6文となる。以降、同様に展開
を行う。
では、次に変換則Bに沿う場合を考える。■では(展開
属性二分野)のやり方が指示されている。
属性二分野)のやり方が指示されている。
ここでは、変換則Aとは「節見出しJが異なる。
同様に変換則Bに沿って展開すると、第10図(b)の
ようになる。第10図(a)とでは、背景と問題に関す
る分は方が違っている。
ようになる。第10図(a)とでは、背景と問題に関す
る分は方が違っている。
以上、本実施例では特許文を例にとりあげたが、キーワ
ード辞書−判別規則辞書・変換規則辞書の内容を変更す
ることfこより、池の技術文書、ビジネス文書あるいは
英文などにも十分適用可能である。
ード辞書−判別規則辞書・変換規則辞書の内容を変更す
ることfこより、池の技術文書、ビジネス文書あるいは
英文などにも十分適用可能である。
又、本実施例では抽出したキーワードのカテゴリを、展
開構造記憶部に格納していたが、これを独立することも
可能である。それとは逆に、原文、階層構造、展開構造
をあわせて記憶することも可能である。
開構造記憶部に格納していたが、これを独立することも
可能である。それとは逆に、原文、階層構造、展開構造
をあわせて記憶することも可能である。
又、本実旅例では原文が入力後に、バッチ的に処理が実
行される例について述べたが、必ずしもこれに限定され
る訳ではない。エディタと組み合わせて、対話的に処理
を行うことも可能である。
行される例について述べたが、必ずしもこれに限定され
る訳ではない。エディタと組み合わせて、対話的に処理
を行うことも可能である。
以上に述べたような、本発明の要旨を逸脱しない範囲の
すべての変形・応用は本発明に含まれる。
すべての変形・応用は本発明に含まれる。
以上、本発明によれば、ユーザは展開構造の指定を行わ
ずに、展開構造の変換を容易に行うことができる。つま
り、ユーザは文書データを1つ作れば後は変換則に沿っ
てたくさんのスタイルの文書を簡単に生成できるので、
その効果は大きい。
ずに、展開構造の変換を容易に行うことができる。つま
り、ユーザは文書データを1つ作れば後は変換則に沿っ
てたくさんのスタイルの文書を簡単に生成できるので、
その効果は大きい。
例えば、読む人にあわせて色々な変換則を用意しておき
、読み手にあわせた展開で色々なスタイルの文書を表示
できるようになるので、多大の効果をあげることができ
る。
、読み手にあわせた展開で色々なスタイルの文書を表示
できるようになるので、多大の効果をあげることができ
る。
第1図は本発明の一実施例の概略構成図、第2図は入力
文書データの一例を示す図、第3図はキーワード辞書の
一例を示す図、第4図は階層構造解析処理のフロー図、
第5図は階層構造記憶部の構成を示す図、第6図は展開
構造解析処理のフロー図、第7図は判別規則辞書の一例
を示す図、第8図は展開構造記憶部の一例を示す図、第
9図は展開規則辞書の一例を示す図、第10図は入力文
書データの整形結果例を示す図である。 1・・・文書管理部、2・・・入力部、3・・・原文記
憶部、4・・・表示制御部、5・・・表示部、6・・・
情報抽出部、7・・・階層構造解析部、8・・・キーワ
ード辞書、9・・・展開構造解析部、10・・・判別規
則辞書、11・・・判別構造整形部、12・・・変換規
則辞書、13・・・構造記憶部、14・・・階層構造記
憶部、15・・・展開構造記憶部。 箒1図 第 2 図 第 3 図 WJ4図 第 5 図 第 8 図 新フU Cb) 蓄 ? 勺 第 8 図 第9図 (a) 請 10G
文書データの一例を示す図、第3図はキーワード辞書の
一例を示す図、第4図は階層構造解析処理のフロー図、
第5図は階層構造記憶部の構成を示す図、第6図は展開
構造解析処理のフロー図、第7図は判別規則辞書の一例
を示す図、第8図は展開構造記憶部の一例を示す図、第
9図は展開規則辞書の一例を示す図、第10図は入力文
書データの整形結果例を示す図である。 1・・・文書管理部、2・・・入力部、3・・・原文記
憶部、4・・・表示制御部、5・・・表示部、6・・・
情報抽出部、7・・・階層構造解析部、8・・・キーワ
ード辞書、9・・・展開構造解析部、10・・・判別規
則辞書、11・・・判別構造整形部、12・・・変換規
則辞書、13・・・構造記憶部、14・・・階層構造記
憶部、15・・・展開構造記憶部。 箒1図 第 2 図 第 3 図 WJ4図 第 5 図 第 8 図 新フU Cb) 蓄 ? 勺 第 8 図 第9図 (a) 請 10G
Claims (3)
- (1)文書データを入力するための入力手段と、文書の
内容的展開に関するキーワードを格納したキーワード辞
書と、前記文書データに対し前記キーワード辞書を参照
してキーワードを抽出する抽出手段と、前記文書データ
に対し形態的特徴に基づいて章、節等の階層構造を生成
する階層構造解析手段と、前記抽出手段より抽出された
キーワード及び前記階層構造解析手段より生成された階
層構造に基いて前記文書データの内容に関する展開構造
を生成する展開構造制御手段と、この展開構造制御手段
により生成された展開構造を記憶するための記憶手段と
を具備したことを特徴とする文書解析整形装置。 - (2)記憶手段は、文書形式に応じて展開構造の変換規
則を格納したものであり、展開構造制御手段は前記変換
規則を参照して展開構造を文書形式に整形するものであ
る特許請求の範囲第1項記載の文書解析整形装置。 - (3)展開構造は、分野、背景、問題、目的、作用、効
果、結論等の文書の内容的展開を示す属性である特許請
求の範囲第1項記載の文書解析整形装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61209545A JPS6366665A (ja) | 1986-09-08 | 1986-09-08 | 文書解析整形装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61209545A JPS6366665A (ja) | 1986-09-08 | 1986-09-08 | 文書解析整形装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6366665A true JPS6366665A (ja) | 1988-03-25 |
Family
ID=16574582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61209545A Pending JPS6366665A (ja) | 1986-09-08 | 1986-09-08 | 文書解析整形装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6366665A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127170A (ja) * | 1989-10-13 | 1991-05-30 | Hitachi Ltd | 文書作成装置における論理構造作成処理方式 |
JPH06259420A (ja) * | 1993-03-10 | 1994-09-16 | Fuji Xerox Co Ltd | 文章編集支援装置 |
-
1986
- 1986-09-08 JP JP61209545A patent/JPS6366665A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127170A (ja) * | 1989-10-13 | 1991-05-30 | Hitachi Ltd | 文書作成装置における論理構造作成処理方式 |
JPH06259420A (ja) * | 1993-03-10 | 1994-09-16 | Fuji Xerox Co Ltd | 文章編集支援装置 |
US5598518A (en) * | 1993-03-10 | 1997-01-28 | Fuji Xerox Co., Ltd. | Text editing apparatus for rearranging sentences |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2783558B2 (ja) | 要約生成方法および要約生成装置 | |
JP3691844B2 (ja) | 文書処理方法 | |
JP3300866B2 (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
US5579224A (en) | Dictionary creation supporting system | |
JPH07325827A (ja) | ハイパーテキスト自動生成装置 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
US20070179932A1 (en) | Method for finding data, research engine and microprocessor therefor | |
JPH0484271A (ja) | 文書内情報検索装置 | |
JPH08129554A (ja) | 関係表現抽出装置および関係表現検索装置 | |
JPH0612447A (ja) | 要約文章作成装置 | |
JPS6366665A (ja) | 文書解析整形装置 | |
JPH0877196A (ja) | 文書情報抽出装置 | |
JPH04160473A (ja) | 事例再利用型翻訳方法および装置 | |
JP2006119697A (ja) | 質問応答システム、質疑応答方法および質疑応答プログラム | |
JP2002132789A (ja) | 文書検索方法 | |
JP2838984B2 (ja) | 汎用参照装置 | |
Johnson | Computer aids for comparative dictionaries | |
JP3302260B2 (ja) | 文書処理システム | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH1115826A (ja) | 文書解析装置及び方法 | |
JPH05282361A (ja) | データベース作成支援装置及び機械翻訳装置 | |
JPH07334526A (ja) | 辞書検索表示装置 | |
JP2893239B2 (ja) | 翻訳支援辞書検索表示システム | |
JP3884001B2 (ja) | 言語解析システムおよび方法 | |
JPH10293811A (ja) | 文書認識装置及び方法並びにプログラム記憶媒体 |