JPH03105667A - 索引ページデータ自動作成処理方式 - Google Patents
索引ページデータ自動作成処理方式Info
- Publication number
- JPH03105667A JPH03105667A JP1244580A JP24458089A JPH03105667A JP H03105667 A JPH03105667 A JP H03105667A JP 1244580 A JP1244580 A JP 1244580A JP 24458089 A JP24458089 A JP 24458089A JP H03105667 A JPH03105667 A JP H03105667A
- Authority
- JP
- Japan
- Prior art keywords
- index
- file
- page
- term
- page data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000003672 processing method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 6
- 238000012552 review Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
データ処理システムにおけるドキュ・メントの索引作或
にあたって,あらかじめ指定tた索引用語により.索引
ページデータを自動的に作成するようにした索引ファイ
ル作成による索引ページデータ自動作成処理方式に間し
, ドキュメントの索引作成の手作業を最小限にし,迅速に
索引ページデータを作或できるようにすることを目的と
し, 索引用語を入力し.索引用語が登録される索引ファイル
を作或・更新する索引ファイル作或・更新処理部と,索
引ファイルに登録された各索引用語について,本文デー
タファイルを検索し,索引用語の記載ページを抽出する
索引用語検索処理部と,索引用語の検索結果に基づいて
.索引ベージデータを持つ索引ページファイルを作成す
る索引ページデータ作或処理部とを備えるように構威す
る。
にあたって,あらかじめ指定tた索引用語により.索引
ページデータを自動的に作成するようにした索引ファイ
ル作成による索引ページデータ自動作成処理方式に間し
, ドキュメントの索引作成の手作業を最小限にし,迅速に
索引ページデータを作或できるようにすることを目的と
し, 索引用語を入力し.索引用語が登録される索引ファイル
を作或・更新する索引ファイル作或・更新処理部と,索
引ファイルに登録された各索引用語について,本文デー
タファイルを検索し,索引用語の記載ページを抽出する
索引用語検索処理部と,索引用語の検索結果に基づいて
.索引ベージデータを持つ索引ページファイルを作成す
る索引ページデータ作或処理部とを備えるように構威す
る。
本発明は,データ処理システムにおけるドキュメントの
索引作或にあたって,あらかじめ指定した索引用語によ
り9索引ページデータを自動的に作成するようにした索
引ファイル作成による索引ページデータ自動作成処理方
弐に関する。
索引作或にあたって,あらかじめ指定した索引用語によ
り9索引ページデータを自動的に作成するようにした索
引ファイル作成による索引ページデータ自動作成処理方
弐に関する。
電子化されたドキュメントの索引作成を効率化するため
に,索引ページデータの自動作或が要求されている。
に,索引ページデータの自動作或が要求されている。
日本語ワードプロセッサ等によって作成された文書につ
いて,索引を作成する場合,以前には,人間が,本文デ
ータから索引用語とその記載ぺ一ジを抽出し,索引用語
と記載ページの対応情報を持つ索引ベージデータを,通
常の文書編集と同様に,手作業により作成していた. 従来,この作業を軽減するために.本文データ中におい
て,索引用語l個ずつの前後に,索引用語であることを
示す制御記号を入力させ,その制御記号をもとに,自動
的に索引用語を検索し,索引ページデータを作成する方
式が用いられている。
いて,索引を作成する場合,以前には,人間が,本文デ
ータから索引用語とその記載ぺ一ジを抽出し,索引用語
と記載ページの対応情報を持つ索引ベージデータを,通
常の文書編集と同様に,手作業により作成していた. 従来,この作業を軽減するために.本文データ中におい
て,索引用語l個ずつの前後に,索引用語であることを
示す制御記号を入力させ,その制御記号をもとに,自動
的に索引用語を検索し,索引ページデータを作成する方
式が用いられている。
しかし,このような従来方式でも,本文データ中の索引
用語の前後に,いちいち制御記号を入力する必要がある
ため,制御記号の入力に時間がかかり.かつ,同じ用語
でも,本文データの異なるページに現れる場合には.そ
れぞれに制御記号を入力する必要があり,手作業に無駄
が多かった。
用語の前後に,いちいち制御記号を入力する必要がある
ため,制御記号の入力に時間がかかり.かつ,同じ用語
でも,本文データの異なるページに現れる場合には.そ
れぞれに制御記号を入力する必要があり,手作業に無駄
が多かった。
したがって.ドキュメントの索引作成が迅速にできず.
特に,検索性の良さが求められているマニュアルについ
て,索引を含めたレビューや査読ができず.マニュアル
の「分かりやすさ」を高められないなどという問題が生
じていた。
特に,検索性の良さが求められているマニュアルについ
て,索引を含めたレビューや査読ができず.マニュアル
の「分かりやすさ」を高められないなどという問題が生
じていた。
また,制御記号を本文データ中に埋め込むと,l文字分
のスペースをとるため.画面上で文字ずれが生じて,テ
キストの表示が実際の印刷イメージと異なってくるとい
う問題もあった。
のスペースをとるため.画面上で文字ずれが生じて,テ
キストの表示が実際の印刷イメージと異なってくるとい
う問題もあった。
本発明は上記問題点の解決を図り,ドキュメントの索引
作成の手作業を最小限にし,迅速に索引ページデータを
作成できるようにすることを目的としている。
作成の手作業を最小限にし,迅速に索引ページデータを
作成できるようにすることを目的としている。
第1図は本発明の構戒例を示す。
処理装置IOは,CPUおよびメモリを備えた装置であ
り,通常の汎用プロセッサ.専用のワードブロセノサま
たはワークステーションなどである。入出力装置として
,ディスプレイ11およびキーボード12を持つ。
り,通常の汎用プロセッサ.専用のワードブロセノサま
たはワークステーションなどである。入出力装置として
,ディスプレイ11およびキーボード12を持つ。
索引ファイル作成・更新処理部13は,ディスプレイ1
1およびキーボード12を用いて,索引用語を入力し,
索引ファイル1日を作成・更新する処理を行う。索引フ
ァイル18は.索引作成の対象となる索引用語が登録さ
れるファイルである。
1およびキーボード12を用いて,索引用語を入力し,
索引ファイル1日を作成・更新する処理を行う。索引フ
ァイル18は.索引作成の対象となる索引用語が登録さ
れるファイルである。
索引用語検索処理部14は,この例では,ページ抽出処
理部15と定義文抽出処理部16とを持つ。ページ抽出
処理部15は,索引ファイ・ル18に登録された各索引
用語について,本文データファイル19を検索し,索引
用語の記載ページを抽出する。定義文抽出処理部l6は
,索引用語が用いられている本文データの形式から,′
それが索引用語の定義文になっているかどうかを判別し
,索引用語の定義文を抽出する処理を行う。
理部15と定義文抽出処理部16とを持つ。ページ抽出
処理部15は,索引ファイ・ル18に登録された各索引
用語について,本文データファイル19を検索し,索引
用語の記載ページを抽出する。定義文抽出処理部l6は
,索引用語が用いられている本文データの形式から,′
それが索引用語の定義文になっているかどうかを判別し
,索引用語の定義文を抽出する処理を行う。
索引ページデータ作成処理部17は,索引用語検索処理
部14による索引用語の検索結果に基づいて,各索引用
語がどのページに記載されているかを示す索引ベージデ
ータを持つ索引ページファイル20を作成する。なお,
定義文抽出処理部16が検出した索引用語の定義文を記
載したページについては,そのページ番号を.ゴシック
体等により,他のページ番号と区別するデータ編集を行
う。
部14による索引用語の検索結果に基づいて,各索引用
語がどのページに記載されているかを示す索引ベージデ
ータを持つ索引ページファイル20を作成する。なお,
定義文抽出処理部16が検出した索引用語の定義文を記
載したページについては,そのページ番号を.ゴシック
体等により,他のページ番号と区別するデータ編集を行
う。
本発明では,人間が行う手作業は.ディスプレイl1お
よびキーボード12によって,索引用語を入力するだけ
であり,本文データファイル19について手を加えない
でも.索引ファイル18に基づいて.自動的に索引ペー
ジファイル20が作成されることになる。
よびキーボード12によって,索引用語を入力するだけ
であり,本文データファイル19について手を加えない
でも.索引ファイル18に基づいて.自動的に索引ペー
ジファイル20が作成されることになる。
索引ファイル18は.本文データファイル19と独立し
ているため,関連する内容を持つ他の本文データファイ
ルについても,同じ1つの索引ファイルl8を用いて.
索引ページファイル20を自動作或することが可能であ
る. 〔実施例〕 第2図は本発明の一実施例処理フロー.143図は禾発
明の一実施例に係る索引ファイル作成・更新の例,第4
図は本発明の一実施例に係るページ抽出処理の例,第5
図は本発明の一実施例に係る定義文抽出処理の例,第6
図は本発明の一実施例により自動作成された索引ページ
の例を示す.本発明による索引ページデータ自動作成の
処理の流れは,例えば第2図に示すようになる.以下の
説明における■〜■は,第2図に示す処理■〜■に対応
する. ■ 索引用語入力の指定により,索引用語入力画面を表
示し,索引用語と,そのソートのために使用する読みと
を入力する。
ているため,関連する内容を持つ他の本文データファイ
ルについても,同じ1つの索引ファイルl8を用いて.
索引ページファイル20を自動作或することが可能であ
る. 〔実施例〕 第2図は本発明の一実施例処理フロー.143図は禾発
明の一実施例に係る索引ファイル作成・更新の例,第4
図は本発明の一実施例に係るページ抽出処理の例,第5
図は本発明の一実施例に係る定義文抽出処理の例,第6
図は本発明の一実施例により自動作成された索引ページ
の例を示す.本発明による索引ページデータ自動作成の
処理の流れは,例えば第2図に示すようになる.以下の
説明における■〜■は,第2図に示す処理■〜■に対応
する. ■ 索引用語入力の指定により,索引用語入力画面を表
示し,索引用語と,そのソートのために使用する読みと
を入力する。
■ 入力した索引用語情報により,索・引ファイルを作
成・更新する。この■〜■の処理は,次に述べる■以降
の処理と独立に行うことができる。
成・更新する。この■〜■の処理は,次に述べる■以降
の処理と独立に行うことができる。
■ 索引作成の指示により,本文データファイルを検索
し,索引ファイルに登録されている各索引用語の記載ペ
ージを抽出する。抽出した記載ページを索引ファイルに
おける各索引用語の欄に記入する。
し,索引ファイルに登録されている各索引用語の記載ペ
ージを抽出する。抽出した記載ページを索引ファイルに
おける各索引用語の欄に記入する。
■ また.本文データファイルを検索し.索引用語が現
れた文が,その索引用語の定義文になっているかどうか
を調べ,定義文になっていれば.その記載ページを索引
ファイルに記す。なお,処理■と処理■は,一回の本文
データファイルの検索で,同時に実行してもよい. ■ 次に,索引ページデータを作成するために.索引フ
ァイルの索引用語を.読みに従って.例えば五十音順に
ソートする. ■ 索引ファイルのデータから.各索引用語がどのペー
ジに記載されているかを示す索引ページデータを作成す
る.このとき.索引用語の定義文を記載しているページ
の番号は.ゴシック体や太字などにより.他のページ番
号と区別する態様とする. 次に,具体例に従って.本発明の実施例を説明する。
れた文が,その索引用語の定義文になっているかどうか
を調べ,定義文になっていれば.その記載ページを索引
ファイルに記す。なお,処理■と処理■は,一回の本文
データファイルの検索で,同時に実行してもよい. ■ 次に,索引ページデータを作成するために.索引フ
ァイルの索引用語を.読みに従って.例えば五十音順に
ソートする. ■ 索引ファイルのデータから.各索引用語がどのペー
ジに記載されているかを示す索引ページデータを作成す
る.このとき.索引用語の定義文を記載しているページ
の番号は.ゴシック体や太字などにより.他のページ番
号と区別する態様とする. 次に,具体例に従って.本発明の実施例を説明する。
索引ファイルの作成・更新では.例えば第3図に示すよ
うな索引用語入力画面を用いる.ディスプレイ11およ
びキーボード12を使用し.本客データから抽出したい
索引用語とその読みとを入力する.なお,Wi面分割に
より.本文データを参照しながら索引用語を入力できる
ようにしてもよい。また.表示させた本文データ中の用
語を.カーソルで指示することにより,索引用語を入力
できるようにしてもよい。
うな索引用語入力画面を用いる.ディスプレイ11およ
びキーボード12を使用し.本客データから抽出したい
索引用語とその読みとを入力する.なお,Wi面分割に
より.本文データを参照しながら索引用語を入力できる
ようにしてもよい。また.表示させた本文データ中の用
語を.カーソルで指示することにより,索引用語を入力
できるようにしてもよい。
この索引用語と読みの入力により.第3図に示す索引フ
ァイルl8が作成される.ここでは.索引用語として「
キーボード」と「検索」の用語が登録された状態を示し
ている.バイナリで用語長,読み長も設定される.ペー
ジ番号のフィールドは,後で行う検索の結果を記入する
フィールドである.一第4図は,本文データファイルを
検,索し,索引用語の記載ページを,索引ファイル18
にセットする様子を示している。
ァイルl8が作成される.ここでは.索引用語として「
キーボード」と「検索」の用語が登録された状態を示し
ている.バイナリで用語長,読み長も設定される.ペー
ジ番号のフィールドは,後で行う検索の結果を記入する
フィールドである.一第4図は,本文データファイルを
検,索し,索引用語の記載ページを,索引ファイル18
にセットする様子を示している。
ここでは,5ページ目の本文データP5に,索引ファイ
ルl8中に登録されている「キーボードjと「検索」の
索引用語の記載があり,100ページ目の本文データP
IOOに.「検索」の記載がある。したがって,索引フ
ァイル18における「キーボード」の欄に,ページ番号
r0005」を記入し,「検索」の欄に,ページ番号r
0005 Jとr0100,を記入する. 本実施例では.特に索引用語についての定義文の自動抽
出も行うようになっている.例えば,「である」調の本
文データの場合.用語の定義文は,通常,「○○とは,
・・・・・・・・・である.」という形で記述される.
すなわち.索引用語がある文において.索引用語の直後
に『とは」があり.最後に「である.」があれば,その
文は定義文であると自動的に判断し,そのページ番号を
他のページ番号と区別する。
ルl8中に登録されている「キーボードjと「検索」の
索引用語の記載があり,100ページ目の本文データP
IOOに.「検索」の記載がある。したがって,索引フ
ァイル18における「キーボード」の欄に,ページ番号
r0005」を記入し,「検索」の欄に,ページ番号r
0005 Jとr0100,を記入する. 本実施例では.特に索引用語についての定義文の自動抽
出も行うようになっている.例えば,「である」調の本
文データの場合.用語の定義文は,通常,「○○とは,
・・・・・・・・・である.」という形で記述される.
すなわち.索引用語がある文において.索引用語の直後
に『とは」があり.最後に「である.」があれば,その
文は定義文であると自動的に判断し,そのページ番号を
他のページ番号と区別する。
第5図は,その定義文抽出処理の例を示している。
本文データP5では,「検索」の索引用語が,「検索と
は,・・・・である。」の定義文の形で現れている。そ
こで,索引ファイル18における「検索」についての出
現ページ番号r0005,に,定義文フラグを立てる。
は,・・・・である。」の定義文の形で現れている。そ
こで,索引ファイル18における「検索」についての出
現ページ番号r0005,に,定義文フラグを立てる。
第5図の例では,ページ番号の先頭を定義文フラグとし
て表し, ’1.0四,としている。なお,実際には
,ページ番号をパイナリデー夕で表し,その先頭の1ビ
ットを定義文フラグとしている。
て表し, ’1.0四,としている。なお,実際には
,ページ番号をパイナリデー夕で表し,その先頭の1ビ
ットを定義文フラグとしている。
索引用語についてのページの抽出と.定義文の抽出が終
了したならば.実際に文書に付加される形の索引ベージ
データの作成に移る。
了したならば.実際に文書に付加される形の索引ベージ
データの作成に移る。
そのため,索引ファイル18中の索引用語を,読み順に
従ってソートする.なお.このソートは,索引ファイル
エ8の作成・更新時に,あらかじめ行っておくようにし
てもよい.そして,索引ファイル18中の索引用語とペ
ージ番号とから,索引ページを,文書データに組み換え
る。
従ってソートする.なお.このソートは,索引ファイル
エ8の作成・更新時に,あらかじめ行っておくようにし
てもよい.そして,索引ファイル18中の索引用語とペ
ージ番号とから,索引ページを,文書データに組み換え
る。
第6図は,以上のようにして作成さ、れた索引ページを
,実際に印刷したイメージを示している。
,実際に印刷したイメージを示している。
ここでは,和文の例を挙げたが,英文等についても,同
様に索引ページの作成が可能である。この場合は,索引
用語の並びは,アルファベット順となる。
様に索引ページの作成が可能である。この場合は,索引
用語の並びは,アルファベット順となる。
以上説明したように,本発明によれば,ドキュメントの
索引作成の手作業を最小限にし,簡易・迅速に索引を作
成できるようになる。特に,検索性の良さが求められて
いるマニュアル等についての索引を含めたレビューや査
読を,簡単に行うことができるようになるので,分かり
やすいマニュアルの作成に寄与するところが大きい。
索引作成の手作業を最小限にし,簡易・迅速に索引を作
成できるようになる。特に,検索性の良さが求められて
いるマニュアル等についての索引を含めたレビューや査
読を,簡単に行うことができるようになるので,分かり
やすいマニュアルの作成に寄与するところが大きい。
第I図は本発明の構戒例,
第2図は本発明の一実施例処理フロー
第3図は本発明の一実施例に係る索引ファイル作成・更
新の例, 第4図は本発明の一実施例に係るページ抽出処理の例, 第5図は本発明の一実施例に係る定義文抽出処理の例, 第6図は本発明の一実施例により自動作成された索引ペ
ージの例を示す。 図中.10は処理装置.11はディスブ,レイ,12は
キーボード,13は索引ファイル作成・更新処理部,1
4は索引用語検索処理部,15はページ抽出処理部,1
6は定義文抽出処理部,17は索引ページデータ作成処
理部,18は索引ファイル,19は本文データファイル
,20は索引ページファイルを表す。
新の例, 第4図は本発明の一実施例に係るページ抽出処理の例, 第5図は本発明の一実施例に係る定義文抽出処理の例, 第6図は本発明の一実施例により自動作成された索引ペ
ージの例を示す。 図中.10は処理装置.11はディスブ,レイ,12は
キーボード,13は索引ファイル作成・更新処理部,1
4は索引用語検索処理部,15はページ抽出処理部,1
6は定義文抽出処理部,17は索引ページデータ作成処
理部,18は索引ファイル,19は本文データファイル
,20は索引ページファイルを表す。
Claims (1)
- 【特許請求の範囲】 本文データファイル(19)に格納された本文データに
ついて、索引を作成するデータ処理システムにおいて、 索引用語を入力し、索引用語が登録される索引ファイル
(18)を作成・更新する索引ファイル作成・更新処理
部(13)と、 索引ファイル(18)に登録された各索引用語について
、本文データファイル(19)を検索し、索引用語の記
載ページを抽出する索引用語検索処理部(14)と、 索引用語の検索結果に基づいて、索引ページデータを持
つ索引ページファイル(20)を作成する索引ページデ
ータ作成処理部(17)とを備えたことを特徴とする索
引ページデータ自動作成処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1244580A JPH03105667A (ja) | 1989-09-20 | 1989-09-20 | 索引ページデータ自動作成処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1244580A JPH03105667A (ja) | 1989-09-20 | 1989-09-20 | 索引ページデータ自動作成処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03105667A true JPH03105667A (ja) | 1991-05-02 |
Family
ID=17120839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1244580A Pending JPH03105667A (ja) | 1989-09-20 | 1989-09-20 | 索引ページデータ自動作成処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03105667A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07262187A (ja) * | 1994-03-22 | 1995-10-13 | Nec Corp | 自動索引作成装置 |
-
1989
- 1989-09-20 JP JP1244580A patent/JPH03105667A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07262187A (ja) * | 1994-03-22 | 1995-10-13 | Nec Corp | 自動索引作成装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5077668A (en) | Method and apparatus for producing an abstract of a document | |
EP1271355A2 (en) | Auto-index method | |
JPH08241332A (ja) | 全文登録語検索装置および方法 | |
JP2000250908A (ja) | 電子書籍の作成支援装置 | |
JP3398729B2 (ja) | キーワード自動抽出装置およびキーワード自動抽出方法 | |
JPH03105667A (ja) | 索引ページデータ自動作成処理方式 | |
JP2943791B2 (ja) | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 | |
JP6565012B2 (ja) | 翻訳支援システム | |
Chen et al. | Automating index preparation | |
JPS61248160A (ja) | 文書情報登録方式 | |
JP3470930B2 (ja) | 自然語解析方法及び装置 | |
RU2379748C2 (ru) | Способ управления данными в сформированном компьютерном документе и машиночитаемый носитель с записанной на нем программой | |
JPS6175952A (ja) | 文書入力処理方式 | |
JP3239845B2 (ja) | 全文検索装置および方法 | |
JPS63201867A (ja) | 文書画像自動要約方式 | |
JP3316884B2 (ja) | 言語翻訳装置 | |
JPH03122717A (ja) | プログラムコメント文生成装置 | |
JPH06266753A (ja) | 文書作成装置 | |
JPH0769919B2 (ja) | インデックス作成支援装置 | |
JPH04139579A (ja) | 単語検索装置 | |
JPH05233714A (ja) | 関連語情報作成支援方式 | |
Bird et al. | Web‐based Dictionaries for Languages of the South‐west USA | |
JPS61169961A (ja) | ユ−ザ辞書を備えた文字処理装置 | |
JPH08185401A (ja) | 文書検索装置 | |
JPH0310372A (ja) | 専門用語の原語訳語対応表示処理方式 |