JPS58201140A - 文書作成装置 - Google Patents

文書作成装置

Info

Publication number
JPS58201140A
JPS58201140A JP57085217A JP8521782A JPS58201140A JP S58201140 A JPS58201140 A JP S58201140A JP 57085217 A JP57085217 A JP 57085217A JP 8521782 A JP8521782 A JP 8521782A JP S58201140 A JPS58201140 A JP S58201140A
Authority
JP
Japan
Prior art keywords
keyword
page
information
document
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57085217A
Other languages
English (en)
Other versions
JPH0410106B2 (ja
Inventor
Hiroshi Ishii
弘 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57085217A priority Critical patent/JPS58201140A/ja
Publication of JPS58201140A publication Critical patent/JPS58201140A/ja
Publication of JPH0410106B2 publication Critical patent/JPH0410106B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明はインデックス作成のための処理機能を有してな
る日本語ワードプロセッサに関スる。
〔発明の技術的背景とその問題点〕
従来、日本語ワードプロセッサにおいては、インデック
スの作成をすべて人手により行なっていた。すなわち、
従来では、インデックス作成の際、作業者自身が文書か
らのキーワードを抽出し、その頁及び行数を控え、更に
、五十音又はアルファベット順に並べ替え、同一キーワ
ードをまとめる等、煩雑な作業を連続して行なわなけれ
ばならなかった。
従って、従来では、インデックスの作成作業に多くの労
力並びに時間を要し、又、インデックス作成に伴う誤シ
の発生率が高い等、種々の不都合が生じていた。
〔発明の目的〕
本発明は上記実情に鑑みなされたもので、インデックス
作成に要する労力差びに時間を大幅に削減でき、しかも
インデックス作成に伴う誤りを無くすことができて、イ
ンデックス作業を迅速かつ円滑に、しかも高い信頼性を
もって行なうことのできる日本語ワードプロセッサを提
供することを目的とする。
〔発明の概要〕
本発明はインデックス処理用に、キーワード記憶部と頁
2行記憶部とを設ける。そして、先ず上記キーワード記
憶部に、マニュアル操作によシ(又は他装置よシ)入力
されたキーワードとしての文字列、又は文書ファイルメ
モリ内に既に貯えられた文書中よシ抽出したキーワード
としての文字列を、同一文字列を排除して予め定められ
た配列順序に従い登録する。次に上記キーワード記憶部
に貯えられた文字列すなわちキーワードを一つずつ読出
して、既に入力されている文書情報の中から、そのキー
ワードと同一の文字列を検索し、その文字列の存在する
頁及び行アドレスを上記頁1行記憶部に登録する。
而してキーワード記憶部に貯えられたキーワードすべて
に対しての該当文字列の頁及び行アドレスの登録したな
らば、上記キーワード記憶部、及び頁9行記憶部を読出
し制御せしめて〜キーワードとそのキーワードに該当す
る頁及び行アドレスを得る。これによシ、インデックス
作成処理作業にかかる労力の削減と、作業時間の大幅な
短縮とが計れ、インデックスの作成処理を迅速かつ円滑
に、しかも高い信頼性をもって行なうことができる〇 〔発明の実施例〕 以下図面を参照して本発明の詳細な説明する。第1図は
本発明の第1の実施例における要5一 部の構成を示すブロック図である。図中、100は文書
情報を貯える文書ファイル部である。
101は上記文書ファイル部100に格納されている文
書中よシ、予め定義された連続する文字列(例えば漢字
文字列/片名文字列/アルファベット文字列等)をキー
ワードとして抽出するキーワード候補抽出部である。1
02は上記キーワード候補抽出部101にょシ抽出され
た文字列すなわちキーワードを記憶するキーワード記憶
部である。103は上記キーワード記憶部102に記憶
されたキーワードを予め定められた規則に従って並べ替
え、同一のキーワードが2つ以上記憶された際は、その
一つを残して他を記憶解除するキーワード記憶制御部で
ある。
104は上記キーワード記憶部102よシ、キーワード
を−っずっ取出し、文書ファイル部100に記憶された
文書の中から、上記キーワード記憶部102よシ取出し
たキーワードと同一の文字列を探索し、その文字列の存
在する頁及び行アドレス(頁ナンバ、行位置情報)を出
6− 力する頁9行アドレス検出制御部である。105は上記
頁9行アドレス検出制御部104よ多出力された頁及び
行アドレスを記憶する頁1行記憶部である。106は上
記キーワード記憶部101に貯えられたキーワード及び
上記頁9行記憶部105に貯えられた頁及び行アドレス
を他装置へ送出制御する出力制御部である。
第2図は上記第1図に示す第1の実施例の動作を説明す
るためのフローチャートである。
ここで、第1図及び第2図を参照して第1の実施例にお
ける動作を説明する。先ず、キーワード候補抽出部10
1は、文書ファイル部100に格納された文書中よシ、
例えば連続する漢字文字列、又は連続する片仮名文字列
、又は連続するアルファベット文字列等、予め定められ
た連続する文字列をキーワード候補として抽出しその抽
出した文字列をキーワードとして出力する。このキーワ
ード候補抽出部101よ多出力されたキーワードは、キ
ーワード記憶部102に記憶される。而して文書ファイ
ル部1θ0に格納された文書全体に対してのキーワード
の抽出及び記憶が終了したならば、次にキーワード記憶
制御部103の制御の下に、上記キーワード記憶部1θ
2に貯えられたキーワードが予め決められた規則に従っ
て並び替えられ、更に、この際・同一のキーワード(文
字列)が2つ以上存在する場合は、その一つのキーワー
ドを残し、他の同一のキーワードをキーワード記憶部1
02から削除する。次に、頁9行アドレス検出制御部1
04が、上記キーワード記憶部102に貯えられたキー
ワードを配列順に一つずつ読出し、その読出したキーワ
ードと同一の文字列を上記文書ファイル部100内の文
書中よシ探索し、その文字列の存在する頁及び行アドレ
スを出力する。この頁1行アドレスは順次、頁。
行記憶部105に貯えられる。而して、キーワード記憶
部102に貯えられたキーワードすべてに対して上記し
た頁1行アドレスの頁1行記憶部105への記憶が終了
したならば、出力制制部106の制御の下に、キーワー
ド記憶部102、及び頁1行記憶部105が読出し制御
され、キーワードとそのキーワードに対応する頁及び行
アドレスが順次出力されて、他の装置又は機能部に送出
される。これによって、インデックスの作成作業にかか
る人手が大幅に省け、迅速かつ円滑にインデックスの作
成処理が実施できるとともに、人手を介することなく、
キーワードの抽出、並び替え、更には頁及び行数の抽出
等が行なわれることから、インデックス作成に伴う作業
ミスが回避でき、信頼性が向上される。
次に第3図及び第4図を参照して本発明の第2の実施例
を説明する。第3図は第2の実施例における要部の構成
を示すブロック図であシ、図中、第1図と同一部分には
同一符号を付してその説明を省略する。この第3図に示
す構成が上記第1図に示す構成と特に異なるところは、
前述の第1の実施例が、キーワード候補抽出部101に
よシ、文書ファイル部100に格納された文書中からキ
ーワード候補となる文字列を9− 抽出し、その抽出した文字列をキーワードとしてキーワ
ード記憶部102に登録してゆく構成としていたのに対
して、この第3図に示す第2の実施例においては、マニ
ュアル操作入力部又は他装置より、キーワードとなる文
字列(KW)及び制御信号(CC)がキーワード受付部
2001及びキーワード記憶制御部103に入力される
ものである。
このような構成をなす第2の実施例における動作フロー
を第4図に示す。この第2の実施例においても、キーワ
ードの並べ替え、頁及び行数の検索等がすべて自製的に
行なわれることから、インデックス作成にかかる人手が
大幅に省け、迅速かつ円滑に、しかも信頼性の高いイン
デックス作成処理が行なえる。
次に第5図及び第6図を参照して本発明の第3の実施例
を説明する。第5図は第3の実施例における要部の構成
を示すブロック図であり、図中、第1図と同一部分には
同一符号を付してその説明を省略する。この第5図に示
す構成が、10− 上記第1図、第3図の構成と特に異なるところは、前述
の第1.第2の実施例が、キーワードをすべて、一旦、
キーワード記憶部102内に記憶し、その後、キーワー
ド記憶部102内において、同一のキーワードのうち、
1つを残して他を排除する構成であったのに対し、第5
図に示す第3の実施例においては、キーワード記憶部1
02の前段に、入力されたキーワード(文字列)を一時
保持するキーワード入力2277部300を設ける。そ
してキーワード入力パッファ部3θOに貯えられたキー
ワード(文字列)をキーワード記憶制御部103xの制
御の下に、キーワード入力2277部300に貯えられ
たキーワードと同一の文字列すなわちキーワードが既に
キーワード記憶部102に登録されているか否かを調べ
る。ここで、キーワード入力2277部300に貯えら
れたキーワードと同一の文字列すなわちキーワードがキ
ーワード記憶部102に登録されていない場合にのみ、
そのキーワード入力2277部300に貯えられたキー
ワードをキーワード記憶部102に記憶し、既に登録さ
れている場合は、キーワード記憶部102への曹込みを
禁止するものである。
この第3の実施例における動作フローを第6図に示す。
このような処理手段を採ることにょシ、上記第1.第2
の実施例に比して、キーワード記憶部102の小容量化
が計れるとともに、後処理が簡素化できる。
〔発明の効果〕
以上詳記したように本発明によれば、インデックス作成
に要する労力並びに時間を大幅に削減でき、しかもイン
デックス作成に伴うミスを無くすことができて、インデ
ックス作業を迅速かつ円滑に、しかも高い信頼性をもっ
て行なうことのできる日本語ワードフロセッサが提供で
きる。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示すブロック図、第2
図は上記第1の実施例における動作を示すフローチャー
ト、第3図は本発明の第2の実施例を示すブロック図、
第4図は上記第2の実施例における動作を示すフローチ
ャート、第5図は本発明の第3の実施例を示すブロック
図、第6図は上記第3の実施例における動作を示すフロ
ーチャートである。 100・・・文書ファイル部、101・・・キーワード
候補伸出部、102・・・キーワード記憶部、103.
103x・・・キーワード記憶制御部、104・・・頁
9行アドレス検出制御部、105・・・頁9行記憶部、
106・・・出力制御部、200・・・キーワード受付
部、300・・・キーワード入力2277部O 出願人代理人  弁理士 鈴 江 武 彦13−

Claims (3)

    【特許請求の範囲】
  1. (1)文書記憶部と、この文書記憶部内の文書情報から
    所定の文字列をキーワードとして抽出する手段、及びそ
    の抽出されたキーワードを記憶するキーワード記憶部と
    、このキーワード記憶部内においてキーワードを予め定
    められた規則に従って並べ替え、整理する手段と、前記
    文書記憶部内の文書情報から前記キーワード記憶部に貯
    えられたキーワードと同一の文字列を抽出し、その文字
    列の頁1行位置情報を得る手段、及びこの頁1行位置情
    報を記憶する頁1行記憶部と、この頁1行記憶部及び前
    記キーワード記憶部に記憶された情報を読出し制御する
    出力手段とを具備してなることを特徴とする日本語ワー
    ドプロセ、す。
  2. (2)  キーワード情報の入力手段、及びこの入力手
    段で入力されたキーワード情報を貯えるキーワード記憶
    部と、このキーワード記憶部内においてキーワードを予
    め定められた規則に従って並べ替え、整理する手段と、
    文書情報を記憶する文書記憶部と、この文書記憶部に記
    憶された文書情報から前記キーワード記憶部に記憶され
    たキーワード情報に該当する情報を抽出し、その情報の
    頁1行位置情報を得る手段、及びこの頁9行位置情報を
    記憶する頁0行記憶部と、この頁9行記憶部及び前記キ
    ーワード記憶部に記憶された情報を読出制御する出力手
    段とを具備してなることを特徴とする日本語ワードプロ
    セッサ0
  3. (3)入力されたキーワード情報を一時記憶する入カパ
    ッファ、及びこの人カパッファに貯えられたキーワード
    情報を選択的に入力し記憶するキーワード記憶部と、前
    記入カパッファに貯えられたキーワード情報が前記キー
    ワード記憶部に格納されたキーワード情報群の中に存在
    する際に前記入カパッファに貯えられたキーワード情報
    の前記キーワード記憶部への書込みを禁止する制御手段
    と、前記キーワード記憶部に格納されたキーワード情報
    に該当する文字列が予め入力された文書情報の何れの頁
    9行に存在するかを検索する手段、及びその頁9行情報
    を貯える位置情報記憶部と、この位置情報記憶部及び前
    記キーワード記憶部に貯えられた情報を読出し制御する
    出力手段とを具備してなることを特徴とする日本語ワー
    ドプロセッサ。
JP57085217A 1982-05-20 1982-05-20 文書作成装置 Granted JPS58201140A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57085217A JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57085217A JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Publications (2)

Publication Number Publication Date
JPS58201140A true JPS58201140A (ja) 1983-11-22
JPH0410106B2 JPH0410106B2 (ja) 1992-02-24

Family

ID=13852398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57085217A Granted JPS58201140A (ja) 1982-05-20 1982-05-20 文書作成装置

Country Status (1)

Country Link
JP (1) JPS58201140A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6242229A (ja) * 1985-08-20 1987-02-24 Casio Comput Co Ltd 検索装置
JPH06203067A (ja) * 1992-11-13 1994-07-22 Ricoh Co Ltd 文書作成装置
JPH07262187A (ja) * 1994-03-22 1995-10-13 Nec Corp 自動索引作成装置
WO2010026804A1 (ja) * 2008-09-05 2010-03-11 日本電信電話株式会社 近似照合装置、近似照合方法、プログラム及び記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518772A (en) * 1978-07-26 1980-02-09 Matsushita Electric Ind Co Ltd Auxiliary unit for book retrieval
JPS569867A (en) * 1979-07-04 1981-01-31 Takeshi Matsuoka Literature retrieving method
JPS5672772A (en) * 1979-11-19 1981-06-17 Toshiba Corp Storage retrieval system for picture information
EP0032194A1 (en) * 1979-12-28 1981-07-22 International Business Machines Corporation Method and system for automatically abstracting, storing and retrieving a document in machine readable form
JPS5858647A (ja) * 1981-09-30 1983-04-07 Fujitsu Ltd 索引作成用プロセツサ

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518772A (en) * 1978-07-26 1980-02-09 Matsushita Electric Ind Co Ltd Auxiliary unit for book retrieval
JPS569867A (en) * 1979-07-04 1981-01-31 Takeshi Matsuoka Literature retrieving method
JPS5672772A (en) * 1979-11-19 1981-06-17 Toshiba Corp Storage retrieval system for picture information
EP0032194A1 (en) * 1979-12-28 1981-07-22 International Business Machines Corporation Method and system for automatically abstracting, storing and retrieving a document in machine readable form
JPS5850071A (ja) * 1979-12-28 1983-03-24 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文書抜粋記憶
JPS5858647A (ja) * 1981-09-30 1983-04-07 Fujitsu Ltd 索引作成用プロセツサ

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6242229A (ja) * 1985-08-20 1987-02-24 Casio Comput Co Ltd 検索装置
JPH06203067A (ja) * 1992-11-13 1994-07-22 Ricoh Co Ltd 文書作成装置
JPH07262187A (ja) * 1994-03-22 1995-10-13 Nec Corp 自動索引作成装置
WO2010026804A1 (ja) * 2008-09-05 2010-03-11 日本電信電話株式会社 近似照合装置、近似照合方法、プログラム及び記録媒体
JP5238034B2 (ja) * 2008-09-05 2013-07-17 日本電信電話株式会社 近似照合装置、近似照合方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
JPH0410106B2 (ja) 1992-02-24

Similar Documents

Publication Publication Date Title
ES2214535T3 (es) Procedimiento y sistema portatil de indexacion de documentos utilizando la descomposicion de palabras en n-grams.
US4580218A (en) Indexing subject-locating method
KR870011552A (ko) 문서 등록 방식
McMahon et al. Unix time-sharing system: Statistical text processing
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JPH067385B2 (ja) キ−ワ−ド自動抽出方式
JPS58201140A (ja) 文書作成装置
JPS60100223A (ja) 索引自動作成機能を有する文書作成・管理装置
JPS6175952A (ja) 文書入力処理方式
JPS61248160A (ja) 文書情報登録方式
JPH02297282A (ja) 文書処理装置
JPH0635971A (ja) 文書検索装置
JP2009181524A (ja) 文書検索システム及び文書検索方法
JPS6162163A (ja) 日本語ワ−ドプロセツサ装置
JPH0668159A (ja) 検索装置
JPH0793345A (ja) 文書検索装置
JPH01106263A (ja) 文書の格納検索装置
JPH11143904A (ja) データベース検索方法,装置およびデータベース検索プログラムを記録した記録媒体
JP2751681B2 (ja) 文書検索装置
JP2967995B2 (ja) 文書処理装置および文書処理方法
JP2570784B2 (ja) 文書リーダ後処理装置
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPS63138479A (ja) 文字認識装置
JPH07109603B2 (ja) 情報検索処理方式および検索ファイル作成装置