JPH03105667A - 索引ページデータ自動作成処理方式 - Google Patents

索引ページデータ自動作成処理方式

Info

Publication number
JPH03105667A
JPH03105667A JP1244580A JP24458089A JPH03105667A JP H03105667 A JPH03105667 A JP H03105667A JP 1244580 A JP1244580 A JP 1244580A JP 24458089 A JP24458089 A JP 24458089A JP H03105667 A JPH03105667 A JP H03105667A
Authority
JP
Japan
Prior art keywords
index
file
page
term
page data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1244580A
Other languages
English (en)
Inventor
Hiroshi Katabami
浩 方波見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1244580A priority Critical patent/JPH03105667A/ja
Publication of JPH03105667A publication Critical patent/JPH03105667A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 データ処理システムにおけるドキュ・メントの索引作或
にあたって,あらかじめ指定tた索引用語により.索引
ページデータを自動的に作成するようにした索引ファイ
ル作成による索引ページデータ自動作成処理方式に間し
, ドキュメントの索引作成の手作業を最小限にし,迅速に
索引ページデータを作或できるようにすることを目的と
し, 索引用語を入力し.索引用語が登録される索引ファイル
を作或・更新する索引ファイル作或・更新処理部と,索
引ファイルに登録された各索引用語について,本文デー
タファイルを検索し,索引用語の記載ページを抽出する
索引用語検索処理部と,索引用語の検索結果に基づいて
.索引ベージデータを持つ索引ページファイルを作成す
る索引ページデータ作或処理部とを備えるように構威す
る。
〔産業上の利用分野〕
本発明は,データ処理システムにおけるドキュメントの
索引作或にあたって,あらかじめ指定した索引用語によ
り9索引ページデータを自動的に作成するようにした索
引ファイル作成による索引ページデータ自動作成処理方
弐に関する。
電子化されたドキュメントの索引作成を効率化するため
に,索引ページデータの自動作或が要求されている。
〔従来の技術〕
日本語ワードプロセッサ等によって作成された文書につ
いて,索引を作成する場合,以前には,人間が,本文デ
ータから索引用語とその記載ぺ一ジを抽出し,索引用語
と記載ページの対応情報を持つ索引ベージデータを,通
常の文書編集と同様に,手作業により作成していた. 従来,この作業を軽減するために.本文データ中におい
て,索引用語l個ずつの前後に,索引用語であることを
示す制御記号を入力させ,その制御記号をもとに,自動
的に索引用語を検索し,索引ページデータを作成する方
式が用いられている。
〔発明が解決しようとする課題〕
しかし,このような従来方式でも,本文データ中の索引
用語の前後に,いちいち制御記号を入力する必要がある
ため,制御記号の入力に時間がかかり.かつ,同じ用語
でも,本文データの異なるページに現れる場合には.そ
れぞれに制御記号を入力する必要があり,手作業に無駄
が多かった。
したがって.ドキュメントの索引作成が迅速にできず.
特に,検索性の良さが求められているマニュアルについ
て,索引を含めたレビューや査読ができず.マニュアル
の「分かりやすさ」を高められないなどという問題が生
じていた。
また,制御記号を本文データ中に埋め込むと,l文字分
のスペースをとるため.画面上で文字ずれが生じて,テ
キストの表示が実際の印刷イメージと異なってくるとい
う問題もあった。
本発明は上記問題点の解決を図り,ドキュメントの索引
作成の手作業を最小限にし,迅速に索引ページデータを
作成できるようにすることを目的としている。
〔課題を解決するための手段〕
第1図は本発明の構戒例を示す。
処理装置IOは,CPUおよびメモリを備えた装置であ
り,通常の汎用プロセッサ.専用のワードブロセノサま
たはワークステーションなどである。入出力装置として
,ディスプレイ11およびキーボード12を持つ。
索引ファイル作成・更新処理部13は,ディスプレイ1
1およびキーボード12を用いて,索引用語を入力し,
索引ファイル1日を作成・更新する処理を行う。索引フ
ァイル18は.索引作成の対象となる索引用語が登録さ
れるファイルである。
索引用語検索処理部14は,この例では,ページ抽出処
理部15と定義文抽出処理部16とを持つ。ページ抽出
処理部15は,索引ファイ・ル18に登録された各索引
用語について,本文データファイル19を検索し,索引
用語の記載ページを抽出する。定義文抽出処理部l6は
,索引用語が用いられている本文データの形式から,′
それが索引用語の定義文になっているかどうかを判別し
,索引用語の定義文を抽出する処理を行う。
索引ページデータ作成処理部17は,索引用語検索処理
部14による索引用語の検索結果に基づいて,各索引用
語がどのページに記載されているかを示す索引ベージデ
ータを持つ索引ページファイル20を作成する。なお,
定義文抽出処理部16が検出した索引用語の定義文を記
載したページについては,そのページ番号を.ゴシック
体等により,他のページ番号と区別するデータ編集を行
う。
〔作用〕
本発明では,人間が行う手作業は.ディスプレイl1お
よびキーボード12によって,索引用語を入力するだけ
であり,本文データファイル19について手を加えない
でも.索引ファイル18に基づいて.自動的に索引ペー
ジファイル20が作成されることになる。
索引ファイル18は.本文データファイル19と独立し
ているため,関連する内容を持つ他の本文データファイ
ルについても,同じ1つの索引ファイルl8を用いて.
索引ページファイル20を自動作或することが可能であ
る. 〔実施例〕 第2図は本発明の一実施例処理フロー.143図は禾発
明の一実施例に係る索引ファイル作成・更新の例,第4
図は本発明の一実施例に係るページ抽出処理の例,第5
図は本発明の一実施例に係る定義文抽出処理の例,第6
図は本発明の一実施例により自動作成された索引ページ
の例を示す.本発明による索引ページデータ自動作成の
処理の流れは,例えば第2図に示すようになる.以下の
説明における■〜■は,第2図に示す処理■〜■に対応
する. ■ 索引用語入力の指定により,索引用語入力画面を表
示し,索引用語と,そのソートのために使用する読みと
を入力する。
■ 入力した索引用語情報により,索・引ファイルを作
成・更新する。この■〜■の処理は,次に述べる■以降
の処理と独立に行うことができる。
■ 索引作成の指示により,本文データファイルを検索
し,索引ファイルに登録されている各索引用語の記載ペ
ージを抽出する。抽出した記載ページを索引ファイルに
おける各索引用語の欄に記入する。
■ また.本文データファイルを検索し.索引用語が現
れた文が,その索引用語の定義文になっているかどうか
を調べ,定義文になっていれば.その記載ページを索引
ファイルに記す。なお,処理■と処理■は,一回の本文
データファイルの検索で,同時に実行してもよい. ■ 次に,索引ページデータを作成するために.索引フ
ァイルの索引用語を.読みに従って.例えば五十音順に
ソートする. ■ 索引ファイルのデータから.各索引用語がどのペー
ジに記載されているかを示す索引ページデータを作成す
る.このとき.索引用語の定義文を記載しているページ
の番号は.ゴシック体や太字などにより.他のページ番
号と区別する態様とする. 次に,具体例に従って.本発明の実施例を説明する。
索引ファイルの作成・更新では.例えば第3図に示すよ
うな索引用語入力画面を用いる.ディスプレイ11およ
びキーボード12を使用し.本客データから抽出したい
索引用語とその読みとを入力する.なお,Wi面分割に
より.本文データを参照しながら索引用語を入力できる
ようにしてもよい。また.表示させた本文データ中の用
語を.カーソルで指示することにより,索引用語を入力
できるようにしてもよい。
この索引用語と読みの入力により.第3図に示す索引フ
ァイルl8が作成される.ここでは.索引用語として「
キーボード」と「検索」の用語が登録された状態を示し
ている.バイナリで用語長,読み長も設定される.ペー
ジ番号のフィールドは,後で行う検索の結果を記入する
フィールドである.一第4図は,本文データファイルを
検,索し,索引用語の記載ページを,索引ファイル18
にセットする様子を示している。
ここでは,5ページ目の本文データP5に,索引ファイ
ルl8中に登録されている「キーボードjと「検索」の
索引用語の記載があり,100ページ目の本文データP
IOOに.「検索」の記載がある。したがって,索引フ
ァイル18における「キーボード」の欄に,ページ番号
r0005」を記入し,「検索」の欄に,ページ番号r
 0005 Jとr0100,を記入する. 本実施例では.特に索引用語についての定義文の自動抽
出も行うようになっている.例えば,「である」調の本
文データの場合.用語の定義文は,通常,「○○とは,
・・・・・・・・・である.」という形で記述される.
すなわち.索引用語がある文において.索引用語の直後
に『とは」があり.最後に「である.」があれば,その
文は定義文であると自動的に判断し,そのページ番号を
他のページ番号と区別する。
第5図は,その定義文抽出処理の例を示している。
本文データP5では,「検索」の索引用語が,「検索と
は,・・・・である。」の定義文の形で現れている。そ
こで,索引ファイル18における「検索」についての出
現ページ番号r0005,に,定義文フラグを立てる。
第5図の例では,ページ番号の先頭を定義文フラグとし
て表し,  ’1.0四,としている。なお,実際には
,ページ番号をパイナリデー夕で表し,その先頭の1ビ
ットを定義文フラグとしている。
索引用語についてのページの抽出と.定義文の抽出が終
了したならば.実際に文書に付加される形の索引ベージ
データの作成に移る。
そのため,索引ファイル18中の索引用語を,読み順に
従ってソートする.なお.このソートは,索引ファイル
エ8の作成・更新時に,あらかじめ行っておくようにし
てもよい.そして,索引ファイル18中の索引用語とペ
ージ番号とから,索引ページを,文書データに組み換え
る。
第6図は,以上のようにして作成さ、れた索引ページを
,実際に印刷したイメージを示している。
ここでは,和文の例を挙げたが,英文等についても,同
様に索引ページの作成が可能である。この場合は,索引
用語の並びは,アルファベット順となる。
〔発明の効果〕
以上説明したように,本発明によれば,ドキュメントの
索引作成の手作業を最小限にし,簡易・迅速に索引を作
成できるようになる。特に,検索性の良さが求められて
いるマニュアル等についての索引を含めたレビューや査
読を,簡単に行うことができるようになるので,分かり
やすいマニュアルの作成に寄与するところが大きい。
【図面の簡単な説明】
第I図は本発明の構戒例, 第2図は本発明の一実施例処理フロー 第3図は本発明の一実施例に係る索引ファイル作成・更
新の例, 第4図は本発明の一実施例に係るページ抽出処理の例, 第5図は本発明の一実施例に係る定義文抽出処理の例, 第6図は本発明の一実施例により自動作成された索引ペ
ージの例を示す。 図中.10は処理装置.11はディスブ,レイ,12は
キーボード,13は索引ファイル作成・更新処理部,1
4は索引用語検索処理部,15はページ抽出処理部,1
6は定義文抽出処理部,17は索引ページデータ作成処
理部,18は索引ファイル,19は本文データファイル
,20は索引ページファイルを表す。

Claims (1)

  1. 【特許請求の範囲】 本文データファイル(19)に格納された本文データに
    ついて、索引を作成するデータ処理システムにおいて、 索引用語を入力し、索引用語が登録される索引ファイル
    (18)を作成・更新する索引ファイル作成・更新処理
    部(13)と、 索引ファイル(18)に登録された各索引用語について
    、本文データファイル(19)を検索し、索引用語の記
    載ページを抽出する索引用語検索処理部(14)と、 索引用語の検索結果に基づいて、索引ページデータを持
    つ索引ページファイル(20)を作成する索引ページデ
    ータ作成処理部(17)とを備えたことを特徴とする索
    引ページデータ自動作成処理方式。
JP1244580A 1989-09-20 1989-09-20 索引ページデータ自動作成処理方式 Pending JPH03105667A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1244580A JPH03105667A (ja) 1989-09-20 1989-09-20 索引ページデータ自動作成処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1244580A JPH03105667A (ja) 1989-09-20 1989-09-20 索引ページデータ自動作成処理方式

Publications (1)

Publication Number Publication Date
JPH03105667A true JPH03105667A (ja) 1991-05-02

Family

ID=17120839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1244580A Pending JPH03105667A (ja) 1989-09-20 1989-09-20 索引ページデータ自動作成処理方式

Country Status (1)

Country Link
JP (1) JPH03105667A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262187A (ja) * 1994-03-22 1995-10-13 Nec Corp 自動索引作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262187A (ja) * 1994-03-22 1995-10-13 Nec Corp 自動索引作成装置

Similar Documents

Publication Publication Date Title
US5077668A (en) Method and apparatus for producing an abstract of a document
EP1271355A2 (en) Auto-index method
JPH08241332A (ja) 全文登録語検索装置および方法
JP2000250908A (ja) 電子書籍の作成支援装置
JP3398729B2 (ja) キーワード自動抽出装置およびキーワード自動抽出方法
JPH03105667A (ja) 索引ページデータ自動作成処理方式
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP6565012B2 (ja) 翻訳支援システム
Chen et al. Automating index preparation
JPS61248160A (ja) 文書情報登録方式
JP3470930B2 (ja) 自然語解析方法及び装置
RU2379748C2 (ru) Способ управления данными в сформированном компьютерном документе и машиночитаемый носитель с записанной на нем программой
JPS6175952A (ja) 文書入力処理方式
JP3239845B2 (ja) 全文検索装置および方法
JPS63201867A (ja) 文書画像自動要約方式
JP3316884B2 (ja) 言語翻訳装置
JPH03122717A (ja) プログラムコメント文生成装置
JPH06266753A (ja) 文書作成装置
JPH0769919B2 (ja) インデックス作成支援装置
JPH04139579A (ja) 単語検索装置
JPH05233714A (ja) 関連語情報作成支援方式
Bird et al. Web‐based Dictionaries for Languages of the South‐west USA
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH08185401A (ja) 文書検索装置
JPH0310372A (ja) 専門用語の原語訳語対応表示処理方式