JPS6366665A - 文書解析整形装置 - Google Patents

文書解析整形装置

Info

Publication number
JPS6366665A
JPS6366665A JP61209545A JP20954586A JPS6366665A JP S6366665 A JPS6366665 A JP S6366665A JP 61209545 A JP61209545 A JP 61209545A JP 20954586 A JP20954586 A JP 20954586A JP S6366665 A JPS6366665 A JP S6366665A
Authority
JP
Japan
Prior art keywords
document
evolving
expanded
hierarchical
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61209545A
Other languages
English (en)
Inventor
Miwako Doi
美和子 土井
Isamu Iwai
岩井 勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61209545A priority Critical patent/JPS6366665A/ja
Publication of JPS6366665A publication Critical patent/JPS6366665A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、文書データの主題の展開を示す展開構造を求
め、それに基づき整形を行う文書解析整形装置に関する
(従来の技術) 文書は、起承転結、導入一本論・結論などの大段落から
構成されている。
論文などの技術交会では「導入」は「序論」、「結論」
は「結びJにあたっている。
又、特許文では、名称・特許請求の範囲・説明のように
、一般の文書とは異なる構成になっている。つまり、一
般文苔とは主題の展開のしかたが異なっている。
このため、例えば論文をそのまま特許文にはできず、そ
の展開を特許文に合わせて変更する必要がある。このと
き、ユーザは論文の「序論」のところの段落は、従来の
技術について触れているから特許文の「従来の技術Jに
該当するというように、論文と特許文の対応をとってい
く。
その後、特許文の展開(展開構造)に合うように、論文
の対応部分の並べ換えを行っていく。あるいは、特許文
でも、例えば特許法施行規則を改正に伴い「発明の詳細
な説明Jの展開構造が変更になった。しかし、従来の展
開に慣れている人は無意識のうちに古い展開で書いてし
才う。そのため、書き直しをする必要性がでてくる。
以上のような場合、手書き文書では切り貼りで対応する
か、全く新しく書き直すかしか方法がない。前者は文書
が汚くなり、後者では作業に手間がかかりすぎ、効率が
悪い。
ワードプロセッサで作られた文書の場合には、該当部分
を移動して並べかえることで一応対処できる。しかし、
この並へかえの度合が非常に太きいため、作業の進中で
めざす頭圧を見失い、混乱してしまうことが多々ある。
さらに、移動対象が複数ページにわたっていることが多
く、ページ毎に分けて移動せねばならないため、移動が
頻回になり混乱する原因となる。
(発明が解決しようとする問題点) 上述のように、従来の技術では主題の展開方法を変更す
るにはユーザへの負担が大きく、このため変更に失敗す
る可能性が高かった。
本発明は、これらの問題を解決するもので、その目的は
文書データから主題の展開を示す展開構造を抽出し、異
なる展開構造への変換をユーザへの負担少なく行うこと
を可能とする文@解析整形装置を提供することにある。
〔発明の構成〕
(問題点を解決するための手段) 本発明は文書データを解析して、階層構造の解析に必要
な形態要素と、展開構造の解析に必要なキーワードとを
抽出するための手段と、抽出された形態要素を解析して
階層構造を求める手段と、この階層構造とキーワードか
ら展開構造を求める手段と、この展開構造を変換するた
めの変換規則と、この変換規則を参照して抽出された展
開槽、造を整形する手段とをもち、展開構造の変形を行
うものである。
(作 用) かくして本発明によれば、与えられた文書データの展開
構造が抽出される。この結果、文書を読者の好みに合わ
せた展開構造に変形して提示することが可能となる。
(実施例) 以下1図面を参照して本発明の一実施例につき説明する
g1図は、一実施例の概略構成図である。1は装置本体
をなす文書管理部である。2はキーボード等からなる入
力部で、文書データの入力や編集指示などの入力が行わ
れる。入力された文書データは、原文記憶部3に格納さ
れる。と同時に、表示制御部4の制御の下に表示部5に
例えば第2図のように表示される。
文書管理部1は、基本的には原文記憶部3に格納された
文書データの区切りコード(例えば改行コード)を検出
し、これを1文として以下の処理の管理制御を行う。
情報抽出部6は、内容の展開を示すことの多いキーワー
ドを格納した、例えば第3図に示すようなキーワード辞
書8を参照して、上記の1文を解析してキーワードを抽
出する。つまり、情報抽出部6は第3図のキーワードに
該当する語句があるかどうかを捜す。
例えば、第2図の第2文に関しては、「本発明は〜に関
するJというカテゴリが分野に属するキーワードが含ま
れている。第3図のレベル:呼応は、2つのキーワード
の双方が含まれていなければならない。つまり、[に関
するJや「本発明は」のどちらか一方だけでは、キーワ
ードが含まれていることにはならない。第2文の場合に
は、「本発明はJと「に関する」が両方とも含まれてい
るので、キーワードが合部れでいることになる。
第3文にはキーワードがなく、第4文には(カテゴリ:
問題)のキーワード「という問題があった」がある。第
5文には、(カテゴリ:目的)の(レベル:呼応)のキ
ーワード「本発明は」・と「を提供することにある」が
ある。
抽出されたキーワードは例えば、第8図(9)のように
どのカテゴリに属するキーワードだ・うたかが展開構造
記憶部15に格納される。
階層構造解析部7は見出しの有無、見出しについている
番号(r2、特許請求の範囲Jの「2」)などの形態的
特徴、前後の文の階層構造をもとに章2節などの階層構
造を判定する。第4図は、このような階層構造の解析処
理の流れを示すものである。
解析された階層構造は、構造記憶部13の階層構造記憶
部141こ格納される。その結果は、例えば第5図に示
すようになっている。
展開構造解析部9は、階層構造記憶部14と展開構造記
憶部15の内容をもとに、展開構造を判定するための規
則が、例えば第7図のような形式で記述され格納されて
いる判別規則辞書10を参照しモ展開構造の判定を行う
。その処理の流れは例えば、第6図に示すようになって
いる。
展開構造整形部11は、判定された展開構造が格納され
た展開構造記憶部15の内容をもとに、例えば第9図に
示したような変換則を格納している変換規則辞書12に
基づき、展開構造の表示構造への変換を行い、その結果
を表示制御部4に送る。例えば、変換則A(古い明細書
の書き方)に基づいた結果は第10図(a)、変換則B
(現在の明細書の書き方)に基づいた結果は第10図Φ
)のようになる。
以下、第6図の流れ図に沿って展開構造解析部9の処理
の流れを説明する。
第2文が現在文であるとする。その文番号がiiにセッ
トされ(ステップa)に判別規則辞書1゜に格納されて
いる規則(第7図)に合致するものがあるかどうかを探
架する(ステップb)。この場合、第8図(a)及び第
5図から判別側■に一致し、その結果、第2文の展開属
性は分野となる。この結果が、展開構造記憶部15に書
き込まれ、第8図(a)が(6)に変化する(ステップ
d)。
次に、前方に展開属性の決定されていない文に対しての
処理を行うために、iiを減少させる(ステップC)。
そして属性がNullのものを探す体テップf)。今は
第1文に判定済みであるので、再びステップCに戻りi
iは0になるので、ステップeの判定で処理が終わる。
第3文に対しても同様に処理が行われるが、この場合一
致する規則がなく、属性がNullのまま処理が終わる
第4文に対しては、判別側■に一致し、その属性は「問
題Jとなる(ステップd)。その後、属性がNull(
ステップf)の第3文に対して処理が行われ(ステップ
b)、判別側■に一致しその属性が「背景」に決定され
る。
第5文に対しても同様に処理が行われ、最終的に展開構
造は第8図(Cンのようになる。
次に、展開構造整形部11の処理について説明する。今
、第9図の変換則Aに沿って展開する例を考える。
変換則Aは、まず■に(展開属性二分野)がついている
ものには、そあ展開時に節見出し「〔発明の技術分−野
〕Jを表示し、その後、分野の中味を展開するごとを指
示している。従って、第2図の第2文は展開されると、
第10図(a)の第2文の見出し表示後、第3文として
展開される。
次に■に(展開属性:背景)と(展開属性二問題)は両
方あわせて展開し、その節見出しとして「〔発明の〜問
題点〕」を表示することが指示されている。その結果が
第10図(a)の第4〜6文となる。以降、同様に展開
を行う。
では、次に変換則Bに沿う場合を考える。■では(展開
属性二分野)のやり方が指示されている。
ここでは、変換則Aとは「節見出しJが異なる。
同様に変換則Bに沿って展開すると、第10図(b)の
ようになる。第10図(a)とでは、背景と問題に関す
る分は方が違っている。
以上、本実施例では特許文を例にとりあげたが、キーワ
ード辞書−判別規則辞書・変換規則辞書の内容を変更す
ることfこより、池の技術文書、ビジネス文書あるいは
英文などにも十分適用可能である。
又、本実施例では抽出したキーワードのカテゴリを、展
開構造記憶部に格納していたが、これを独立することも
可能である。それとは逆に、原文、階層構造、展開構造
をあわせて記憶することも可能である。
又、本実旅例では原文が入力後に、バッチ的に処理が実
行される例について述べたが、必ずしもこれに限定され
る訳ではない。エディタと組み合わせて、対話的に処理
を行うことも可能である。
以上に述べたような、本発明の要旨を逸脱しない範囲の
すべての変形・応用は本発明に含まれる。
〔発明の効果〕
以上、本発明によれば、ユーザは展開構造の指定を行わ
ずに、展開構造の変換を容易に行うことができる。つま
り、ユーザは文書データを1つ作れば後は変換則に沿っ
てたくさんのスタイルの文書を簡単に生成できるので、
その効果は大きい。
例えば、読む人にあわせて色々な変換則を用意しておき
、読み手にあわせた展開で色々なスタイルの文書を表示
できるようになるので、多大の効果をあげることができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2図は入力
文書データの一例を示す図、第3図はキーワード辞書の
一例を示す図、第4図は階層構造解析処理のフロー図、
第5図は階層構造記憶部の構成を示す図、第6図は展開
構造解析処理のフロー図、第7図は判別規則辞書の一例
を示す図、第8図は展開構造記憶部の一例を示す図、第
9図は展開規則辞書の一例を示す図、第10図は入力文
書データの整形結果例を示す図である。 1・・・文書管理部、2・・・入力部、3・・・原文記
憶部、4・・・表示制御部、5・・・表示部、6・・・
情報抽出部、7・・・階層構造解析部、8・・・キーワ
ード辞書、9・・・展開構造解析部、10・・・判別規
則辞書、11・・・判別構造整形部、12・・・変換規
則辞書、13・・・構造記憶部、14・・・階層構造記
憶部、15・・・展開構造記憶部。 箒1図 第 2 図 第  3 図 WJ4図 第  5 図 第  8 図 新フU Cb) 蓄 ? 勺 第  8 図 第9図 (a) 請 10G

Claims (3)

    【特許請求の範囲】
  1. (1)文書データを入力するための入力手段と、文書の
    内容的展開に関するキーワードを格納したキーワード辞
    書と、前記文書データに対し前記キーワード辞書を参照
    してキーワードを抽出する抽出手段と、前記文書データ
    に対し形態的特徴に基づいて章、節等の階層構造を生成
    する階層構造解析手段と、前記抽出手段より抽出された
    キーワード及び前記階層構造解析手段より生成された階
    層構造に基いて前記文書データの内容に関する展開構造
    を生成する展開構造制御手段と、この展開構造制御手段
    により生成された展開構造を記憶するための記憶手段と
    を具備したことを特徴とする文書解析整形装置。
  2. (2)記憶手段は、文書形式に応じて展開構造の変換規
    則を格納したものであり、展開構造制御手段は前記変換
    規則を参照して展開構造を文書形式に整形するものであ
    る特許請求の範囲第1項記載の文書解析整形装置。
  3. (3)展開構造は、分野、背景、問題、目的、作用、効
    果、結論等の文書の内容的展開を示す属性である特許請
    求の範囲第1項記載の文書解析整形装置。
JP61209545A 1986-09-08 1986-09-08 文書解析整形装置 Pending JPS6366665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61209545A JPS6366665A (ja) 1986-09-08 1986-09-08 文書解析整形装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61209545A JPS6366665A (ja) 1986-09-08 1986-09-08 文書解析整形装置

Publications (1)

Publication Number Publication Date
JPS6366665A true JPS6366665A (ja) 1988-03-25

Family

ID=16574582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61209545A Pending JPS6366665A (ja) 1986-09-08 1986-09-08 文書解析整形装置

Country Status (1)

Country Link
JP (1) JPS6366665A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127170A (ja) * 1989-10-13 1991-05-30 Hitachi Ltd 文書作成装置における論理構造作成処理方式
JPH06259420A (ja) * 1993-03-10 1994-09-16 Fuji Xerox Co Ltd 文章編集支援装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127170A (ja) * 1989-10-13 1991-05-30 Hitachi Ltd 文書作成装置における論理構造作成処理方式
JPH06259420A (ja) * 1993-03-10 1994-09-16 Fuji Xerox Co Ltd 文章編集支援装置
US5598518A (en) * 1993-03-10 1997-01-28 Fuji Xerox Co., Ltd. Text editing apparatus for rearranging sentences

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
JP3300866B2 (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
US5579224A (en) Dictionary creation supporting system
JPH07325827A (ja) ハイパーテキスト自動生成装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
JPH0484271A (ja) 文書内情報検索装置
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JPH0612447A (ja) 要約文章作成装置
JPS6366665A (ja) 文書解析整形装置
JPH0877196A (ja) 文書情報抽出装置
JPH04160473A (ja) 事例再利用型翻訳方法および装置
JP2006119697A (ja) 質問応答システム、質疑応答方法および質疑応答プログラム
JP2002132789A (ja) 文書検索方法
JP2838984B2 (ja) 汎用参照装置
Johnson Computer aids for comparative dictionaries
JP3302260B2 (ja) 文書処理システム
JPH0561902A (ja) 機械翻訳システム
JPH1115826A (ja) 文書解析装置及び方法
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JPH07334526A (ja) 辞書検索表示装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP3884001B2 (ja) 言語解析システムおよび方法
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体