JPH0410106B2 - - Google Patents

Info

Publication number
JPH0410106B2
JPH0410106B2 JP57085217A JP8521782A JPH0410106B2 JP H0410106 B2 JPH0410106 B2 JP H0410106B2 JP 57085217 A JP57085217 A JP 57085217A JP 8521782 A JP8521782 A JP 8521782A JP H0410106 B2 JPH0410106 B2 JP H0410106B2
Authority
JP
Japan
Prior art keywords
keyword
document
storage means
keywords
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57085217A
Other languages
English (en)
Other versions
JPS58201140A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57085217A priority Critical patent/JPS58201140A/ja
Publication of JPS58201140A publication Critical patent/JPS58201140A/ja
Publication of JPH0410106B2 publication Critical patent/JPH0410106B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明はインデツクス作成のための処理機能を
有してなる文書作成装置に関する。
〔発明の技術的背景とその問題点〕
従来、文書作成装置においては、インデツクス
の作成をすべて人手により行なつていた。すなわ
ち、従来では、インデツクス作成の際、作業者自
身が文書からのキーワードを抽出し、その頁及び
行数を控え、更に、五十音又はアルフアベツト順
に並べ替え、同一キーワードをまとめる等、煩雑
な作業を連続して行なわなければならなかつた。
従つて、従来では、インデツクスの作成作業に
多くの労力並びに時間を要し、又、インデツクス
作成に伴う誤りの発生率が高い等、種々の不都合
が生じていた。
〔発明の目的〕
本発明は上記実情に鑑みなされたもので、イン
デツクス作成に要する労力並びに時間を大幅に削
減でき、しかもインデツクス作成に伴う誤りを無
くすることができて、インデツクス作業を迅速か
つ円滑に、しかも高い信頼性をもつて行なうこと
のできる文書作成装置を提供することを目的とす
る。
〔発明の概要〕
本発明はインデツクス処理用に、インデツクス
を作成するためのキーワードを記憶するキーワー
ド記憶手段と、キーワードに対応した文字列が存
在する文書内の位置情報を記憶するインデツクス
記憶手段と、文書を構成する文字列情報を記憶す
る文書記憶手段とに記憶された文字列情報を、記
憶されたキーワードをもとにサーチし、このキー
ワードに一致する文字列が存在する文書内位置情
報を得て、前記インデツクス記憶手段に記憶せし
める処理手段とを設ける。また、キーワード記憶
手段には、入力手段からキーワードが登録される
か、又は、前記処理手段により前記文書中から抽
出されたキーワードが登録されるようにも構成さ
れ得る。これにより、インデツクス作成処理作業
にかかる労力の削減と、作業時間の大幅な短縮と
が計れ、インデツクスの作成処理を迅速かつ円滑
に、しかも高い信頼性をもつて行なうことができ
る。
〔発明の実施例〕
以下図面を参照して本発明の実施例を説明す
る。第1図は本発明の第1の実施例における要部
の構成を示すブロツク図である。図中、100は
文書情報を貯える文書フアイル部である。101
は上記文書フアイル部100に格納されている文
書中より、予め定義された連続する文字列(例え
ば漢字文字列/片名文字列/アルフアベツト文字
列等)をキーワードとして抽出するキーワード候
補抽出部である。102は上記キーワード候補抽
出部101により抽出された文字列すなわちキー
ワードを記憶するキーワード記憶部である。10
3は上記キーワード記憶部102に記憶されたキ
ーワードを予め定められた規則に従つて並べ替
え、同一のキーワードが2つ以上記憶された際
は、その一つを残して他を記憶解除するキーワー
ド記憶制御部である。104は上記キーワード記
憶部102より、キーワードを一つずつ取出し、
文書フアイル部100に記憶された文書の中か
ら、上記キーワード記憶部102より取出したキ
ーワードと同一の文字列を探索し、その文字列の
存在する頁及び行アドレス(頁ナンバ、行位置情
報〕を出力する頁、行アドレス検出制御部であ
る。105は上記頁、行アドレス検出制御部10
4より出力された頁及び行アドレスを記憶する
頁、行記憶部である。106は上記キーワード記
憶部101に貯えられたキーワード及び上記頁、
行記憶部105に貯えられた頁及び行アドレスを
他装置へ送出制御する出力制御部である。
第2図は上記第1図に示す第1の実施例の動作
を説明するためのフローチヤートである。
ここで、第1図及び第2図を参照して第1の実
施例における動作を説明する。先ず、キーワード
候補抽出部101は、文書フアイル部100に格
納された文書中より、例えば連続する漢字文字
列、又は連続する片仮名文字列、又は連続するア
ルフアベツト文字列等、予め定められた連続する
文字列をキーワード候補として抽出し、その抽出
した文字列をキーワードとして出力する。このキ
ーワード候補抽出部101より出力されたキーワ
ードは、キーワード記憶部102に記憶される。
而して文書フアイル部100に格納された文書全
体に対してのキーワードの抽出及び記憶が終了し
たならば、次にキーワード記憶制御部103の制
御の下に、上記キーワード記憶部102に貯えら
れたキーワードが予め決められた規則に従つて並
び替えられ、更に、この際、同一のキーワード
(文字列)が2つ以上存在する場合は、その一つ
のキーワードを残し、他の同一のキーワードをキ
ーワード記憶部102から削除する。次に、頁、
行アドレス検出制御部104が、上記キーワード
記憶部102に貯えられたキーワードを配列順に
一つずつ読出し、その読出したキーワードと同一
の文字列を上記文書フアイル部100内の文書中
より探索し、その文字列の存在する頁及び行アド
レスを出力する。この頁、行アドレスは順次、
頁、行記憶部105に貯えられる。而して、キー
ワード記憶部102に貯えられたキーワードすべ
てに対して上記した頁、行アドレスの頁、行記憶
部105への記憶が終了したならば、出力制御部
106の制御の下に、キーワード記憶部102、
及び頁、行記憶部105が読出し制御され、キー
ワードとそのキーワードに対応する頁及び行アド
レスが順次出力されて、他の装置又は機能部に送
出される。これによつて、インデツクスの作成作
業にかかる人手が大幅に省け、迅速かつ円滑にイ
ンデツクスの作成処理が実施できるとともに、人
手を介することなく、キーワードの抽出、並び替
え、更には頁及び行数の抽出等が行なわれること
から、インデツクス作成に伴う作業ミスが回避で
き、信頼性が向上される。
次に第3図及び第4図を参照して本発明の第2
の実施例を説明する。第3図は第2の実施例にお
ける要部の構成を示すブロツク図であり、図中、
第1図と同一部分には同一符号を付してその説明
を省略する。この第3図に示す構成が上記第1図
に示す構成と特に異なるところは、前述の第1の
実施例が、キーワード候補抽出部101により、
文書フアイル部100に格納された文書中からキ
ーワード候補となる文字列を抽出し、その抽出し
た文字列をキーワードとしてキーワード記憶部1
02に登録してゆく構成としていたのに対して、
この第3図に示す第2の実施例においては、マニ
ユアル操作入力部又は他装置より、キーワードと
なる文字列(KW)及び制御信号(CC)がキー
ワード受付部200、及びキーワード記憶制御部
103に入力されるものである。
このような構成をなす第2の実施例における動
作フローを第4図に示す。この第2の実施例にお
いても、キーワードの並べ替え、頁及び行数の検
索等がすべて自動的に行なわれることから、イン
デツクス作成にかかる人手が大幅に省け、迅速か
つ円滑に、しかも信頼性の高いインデツクス作成
処理が行なえる。
次に第5図及び第6図を参照して本発明の第3
の実施例を説明する。第5図は第3の実施例にお
ける要部の構成を示すブロツク図であり、図中、
第1図と同一部分には同一符号を付してその説明
を省略する。この第5図に示す構成が、上記第1
図、第3図の構成と特に異なるところは、前述の
第1、第2の実施例が、キーワードをすべて、一
旦、キーワード記憶部102内に記憶し、その
後、キーワード記憶部102内において、同一の
キーワードのうち、1つを残して他を排除する構
成であつたのに対し、第5図に示す第3の実施例
においては、キーワード記憶部102の前後に、
入力されたキーワード(文字列)を一時保持する
キーワード入力バツフア部300を設ける。そし
てキーワード入力バツフア部300に貯えられた
キーワード(文字列)をキーワード記憶制御部1
03xの制御の下に、キーワード入力バツフア部
300に貯えられたキーワードと同一の文字列す
なわちキーワードが既にキーワード記憶部102
に登録されているか否かを調べる。ここで、キー
ワード入力バツフア部300に貯えられたキーワ
ードと同一の文字列すなわちキーワードがキーワ
ード記憶部102に登録されていない場合にの
み、そのキーワード入力バツフア部300に貯え
られたキーワードをキーワード記憶部102に記
憶し、既に登録されている場合は、キーワード記
憶部102への書込みを禁止するものである。
この第3の実施例における動作フローを第6図
に示す。このような処理手段を採ることにより、
上記第1、第2の実施例に比して、キーワード記
憶部102の小容量化が計れるとともに、後処理
が簡素化できる。
〔発明の効果〕
以上詳記したように本発明によれば、インデツ
クス作成に要する労力並びに時間を大幅に削減で
き、しかもインデツクス作成に伴うミスを無くす
ることができて、インデツクス作業を迅速かつ円
滑に、しかも高い信頼性をもつて行なうことので
きる文書作成装置が提供できる。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示すブロツク
図、第2図は上記第1の実施例における動作を示
すフローチヤート、第3図は本発明の第2の実施
例を示すブロツク図、第4図は上記第2の実施例
における動作を示すフローチヤート、第5図は本
発明の第3の実施例を示すブロツク図、第6図は
上記第3の実施例における動作を示すフローチヤ
ートである。 100……文書フアイル部、101……キーワ
ード候補抽出部、102……キーワード記憶部、
103,103x……キーワード記憶制御部、1
04……頁、行アドレス検出制御部、105……
頁、行記憶部、106……出力制御部、200…
…キーワード受付部、300……キーワード入力
バツフア部。

Claims (1)

  1. 【特許請求の範囲】 1 文書を構成する文字列情報を記憶する文書記
    憶手段と、インデツクスを作成するためのキーワ
    ードを記憶するキーワード記憶手段と、キーワー
    ドに対応した文字列が存在する文書内の位置情報
    をキーワードに対応して記憶するためのインデツ
    クス記憶手段と、前記文書記憶手段に記憶された
    文字列情報を、前記キーワード記憶手段に記憶さ
    れたキーワードをもとにサーチし、このキーワー
    ドに一致する文字列が存在する文書内の位置情報
    を得て、前記インデツクス記憶手段に登録する処
    理手段とを具備したことを特徴とする文書作成装
    置。 2 前記インデツクス記憶手段に記憶された文書
    内位置情報をこれに対応する前記キーワードとと
    もに読み出し、出力するインデツクス出力手段を
    具備したことを特徴とする特許請求の範囲第1項
    記載の文書作成装置。 3 文書を構成する文字列情報を記憶する文書記
    憶手段と、インデツクスを作成するためのキーワ
    ードを入力するための入力手段と、この入力手段
    より入力されたキーワードを記憶するキーワード
    記憶手段と、このキーワードに一致する文字列が
    存在する文書内の位置情報をキーワードに対応し
    て記憶するためのインデツクス記憶手段と、前記
    キーワード入力手段から入力されたキーワードの
    前記キーワード記憶手段への登録を行うととも
    に、登録されたキーワードをもとに前記文書記憶
    手段に記憶された文字列情報をサーチし、このキ
    ーワードに一致する文字列が存在する文書内位置
    情報を得て前記インデツクス記憶手段に登録する
    処理手段とを具備したことを特徴とする文書作成
    装置。 4 前記処理手段が、前記キーワード記憶手段に
    記憶されたキーワードをサーチして、重複したキ
    ーワードを削除するとともに、記憶されている前
    記キーワードを予め定められた順序に並べ替える
    ことを特徴とした特許請求の範囲第3項記載の文
    書作成装置。 5 前記処理手段は、前記入力手段から新たなキ
    ーワードが入力されたとき、前記キーワード記憶
    手段を調べ、重複したキーワードが存在する場合
    には、この新たなキーワードを前記キーワード記
    憶手段に登録することを禁止することを特徴とし
    た特許請求の範囲第3項記載の文書作成装置。 6 前記インデツクス記憶手段に記憶された文書
    内位置情報をこれに対応する前記キーワードとと
    もに読み出し、出力するインデツクス出力手段を
    具備したことを特徴とする特許請求の範囲第3項
    乃至第5項記載の文書作成装置。 7 文書を構成する文字列情報を記憶する文書記
    憶手段と、インデツクスを作成するためのキーワ
    ードを記憶するキーワード記憶手段と、このキー
    ワードに対応する文字列が存在する前記文書内の
    位置情報をキーワードに対応して記憶するための
    インデツクス記憶手段と、前記文書記憶手段に記
    憶された文字列情報からインデツクスを作成する
    ためのキーワードを抽出し、前記キーワード記憶
    手段に登録するとともに、前記キーワード記憶手
    段に登録されたキーワードをもとに前記文書記憶
    手段に記憶された文字列情報をサーチし、このキ
    ーワードに一致する文字列が存在する文書内位置
    情報を得て前記インデツクス記憶手段に登録する
    処理手段とを具備したことを特徴とする文書作成
    装置。 8 前記処理手段は、前記キーワード記憶手段に
    記憶されたキーワードをサーチし、重複したキー
    ワードを削除するとともに、記憶されている前記
    キーワードを予め定められた順序に並べ替えるこ
    とを特徴とする特許請求の範囲第7項記載の文書
    作成装置。 9 前記処理手段は、新たなキーワードが抽出さ
    れたとき、前記キーワード記憶手段を調べ、重複
    したキーワードが存在する場合には、この新たな
    キーワードを前記キーワード記憶手段に登録する
    ことを禁止することを特徴とした特許請求の範囲
    第7項記載の文書作成装置。 10 前記インデツクス記憶手段に記憶された文
    書内位置情報をこれに対応する前記キーワードと
    ともに読み出し、出力するインデツクス出力手段
    を具備したことを特徴とする特許請求の範囲第7
    項乃至第9項記載の文書作成装置。
JP57085217A 1982-05-20 1982-05-20 文書作成装置 Granted JPS58201140A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57085217A JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57085217A JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Publications (2)

Publication Number Publication Date
JPS58201140A JPS58201140A (ja) 1983-11-22
JPH0410106B2 true JPH0410106B2 (ja) 1992-02-24

Family

ID=13852398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57085217A Granted JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Country Status (1)

Country Link
JP (1) JPS58201140A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6242229A (ja) * 1985-08-20 1987-02-24 Casio Comput Co Ltd 検索装置
JP2971295B2 (ja) * 1992-11-13 1999-11-02 株式会社リコー 文書作成装置
JP2838972B2 (ja) * 1994-03-22 1998-12-16 日本電気株式会社 自動索引作成装置
WO2010026804A1 (ja) * 2008-09-05 2010-03-11 日本電信電話株式会社 近似照合装置、近似照合方法、プログラム及び記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518772A (en) * 1978-07-26 1980-02-09 Matsushita Electric Ind Co Ltd Auxiliary unit for book retrieval
JPS569867A (en) * 1979-07-04 1981-01-31 Takeshi Matsuoka Literature retrieving method
JPS5672772A (en) * 1979-11-19 1981-06-17 Toshiba Corp Storage retrieval system for picture information
EP0032194A1 (en) * 1979-12-28 1981-07-22 International Business Machines Corporation Method and system for automatically abstracting, storing and retrieving a document in machine readable form
JPS5858647A (ja) * 1981-09-30 1983-04-07 Fujitsu Ltd 索引作成用プロセツサ

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518772A (en) * 1978-07-26 1980-02-09 Matsushita Electric Ind Co Ltd Auxiliary unit for book retrieval
JPS569867A (en) * 1979-07-04 1981-01-31 Takeshi Matsuoka Literature retrieving method
JPS5672772A (en) * 1979-11-19 1981-06-17 Toshiba Corp Storage retrieval system for picture information
EP0032194A1 (en) * 1979-12-28 1981-07-22 International Business Machines Corporation Method and system for automatically abstracting, storing and retrieving a document in machine readable form
JPS5850071A (ja) * 1979-12-28 1983-03-24 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文書抜粋記憶
JPS5858647A (ja) * 1981-09-30 1983-04-07 Fujitsu Ltd 索引作成用プロセツサ

Also Published As

Publication number Publication date
JPS58201140A (ja) 1983-11-22

Similar Documents

Publication Publication Date Title
JP3160201B2 (ja) 情報検索方法、情報検索装置
US5745745A (en) Text search method and apparatus for structured documents
US4580218A (en) Indexing subject-locating method
JPH07244671A (ja) 文書検索装置
KR870011552A (ko) 문서 등록 방식
JPH0410106B2 (ja)
JPH067385B2 (ja) キ−ワ−ド自動抽出方式
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JP2000231560A (ja) 文書自動分類方式
JPH02297282A (ja) 文書処理装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP2880192B2 (ja) 文字列検索方法及び装置
JPS59123071A (ja) 文書フアイル装置
JPH0561758A (ja) 情報リンク装置
JPH0635971A (ja) 文書検索装置
JPH08314970A (ja) キーワード抽出装置
Hollaar Rotating memory processors for the matching of complex textual patterns
JP2967995B2 (ja) 文書処理装置および文書処理方法
JP2751681B2 (ja) 文書検索装置
JPH07160724A (ja) 文書検索装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH0816617A (ja) 文書検索方法及び装置
JP2601139B2 (ja) 文字列検索装置
JPH06223107A (ja) 辞書検索装置
JPH0954777A (ja) 情報検索装置