JPH06348695A - ワードプロセッサ索引生成方式 - Google Patents

ワードプロセッサ索引生成方式

Info

Publication number
JPH06348695A
JPH06348695A JP5163095A JP16309593A JPH06348695A JP H06348695 A JPH06348695 A JP H06348695A JP 5163095 A JP5163095 A JP 5163095A JP 16309593 A JP16309593 A JP 16309593A JP H06348695 A JPH06348695 A JP H06348695A
Authority
JP
Japan
Prior art keywords
index
character string
document
word
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5163095A
Other languages
English (en)
Inventor
Tomoharu Takagi
智治 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5163095A priority Critical patent/JPH06348695A/ja
Publication of JPH06348695A publication Critical patent/JPH06348695A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 ワードプロセッサで作成された文書で文字列
の抽出から索引の生成までを自動化して索引とする語句
の見落としや不統一が生じないようにする。 【構成】 索引辞書9は文字列が索引とする語句である
かを判断する基準となる抽出対象語句を格納し、文字列
抽出手段3は文書から文字列およびその文字数を抽出
し、照合手段4は抽出された文字列およびその文字数を
索引辞書9と照合し、索引エントリ手段5は索引とする
語句と判断された語句を索引リスト8にエントリし、索
引エントリ手段6はエントリされた語句を五十音順にソ
ートし文字列も文字数も同じものをまとめた後にページ
数だけを索引リスト8のページ数の項目欄に付加し、索
引出力手段7は索引リスト8を索引文書ファイル11に
出力する。制御手段2は文字列抽出手段3,照合手段
4,索引エントリ手段5,索引エントリ手段6および索
引出力手段7を制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はワードプロセッサ索引生
成方式に関し、特にワードプロセッサで作成された文書
から索引を自動的に生成するためのワードプロセッサ索
引生成方式に関する。
【0002】
【従来の技術】従来のこの種のワードプロセッサ索引生
成方式は、作成者が作成された文書を見ながら索引とす
る語句を手入力で索引リストとして電子化していた。
【0003】また、ワードプロセッサで文書を作成する
過程または文書を作成した後、作成者が索引とする語句
に索引指示である何らかの印を施し、指示された部分の
語句だけを抽出することを自動化して索引を生成してい
た(特開平1−237756号公報,特開平3−102
565号公報参照)。
【0004】
【発明が解決しようとする課題】上述した従来のワード
プロセッサ索引生成方式は、索引とする語句を作成者が
判断するので、索引とする語句の見落としや不統一が生
じる可能性があるという問題点がある。
【0005】本発明の目的は、上述の点に鑑み、ワード
プロセッサで作成された文書において文字列の抽出から
索引の生成までを自動化して索引とする語句の見落とし
や不統一が生じることがないようにしたワードプロセッ
サ索引生成方式を提供することにある。
【0006】
【課題を解決するための手段】本発明のワードプロセッ
サ索引生成方式は、ワードプロセッサで作成された文書
から索引リストを生成する場合に、対象となる文字列が
索引とする語句であるかどうかを判断する基準となる索
引辞書と、文書から文字列およびその文字数を抽出する
文字列抽出手段と、この文字列抽出手段により抽出され
た文字列およびその文字数を前記索引辞書と照合する照
合手段と、この照合手段により照合した結果、その文字
列が索引とする語句だった場合にその語句を索引リスト
にエントリする索引エントリ手段と、この索引エントリ
手段により索引としてエントリされた語句を五十音順に
ソートし文字列も文字数も同じものはひとつにまとめて
ページ数だけを索引リストのページ数の項目欄に付加す
る索引ソート手段と、この索引ソート手段により完成し
た索引リストを索引文書ファイルへ出力する索引出力手
段と、前記文字列抽出手段,前記照合手段および前記索
引エントリ手段を文書の文頭の文字列から文末の文字列
まで繰り返し実行し、前記索引ソート手段および前記索
引出力手段を制御する制御手段とを有する。
【0007】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0008】図1は、本発明の一実施例に係るワードプ
ロセッサ索引生成方式の構成を示すブロック図である。
本実施例のワードプロセッサ索引生成方式は、索引生成
キー1aを有するキーボード1と、制御手段2と、文字
列抽出手段3と、照合手段4と、索引エントリ手段5
と、索引ソート手段6と、索引出力手段7と、索引リス
ト8と、索引辞書9と、作成文書ファイル10と、索引
文書ファイル11とから構成されている。
【0009】制御手段2は、文書を作成していく過程ま
たは作成終了後に作成者がキーボード1で索引作成キー
1aを操作することにより、あとは自動的に処理される
文字列抽出手段3,照合手段4および索引エントリ手段
5を文書の文頭の文字列から文末の文字列まで繰り返し
実行し、またその後の処理である索引ソート手段6およ
び索引出力手段7も制御して文書から索引を生成する。
【0010】文字列抽出手段3は、制御手段2からの指
示により、作成文書ファイル10に作成された文書から
文字列およびその文字数を抽出する。
【0011】照合手段4は、文字列抽出手段3により抽
出された文字列およびその文字数を索引辞書9と照合す
る。
【0012】索引エントリ手段5は、照合手段4により
文字列およびその文字数を索引辞書9と照合した結果、
その文字列が索引とする語句だった場合にその語句の文
字列およびページ数を索引リスト8にエントリする。
【0013】索引ソート手段6は、索引エントリ手段5
により索引リスト8にエントリされた語句を五十音順に
ソートし、文字列も文字数も同じ語句はひとつにまとめ
ページ数だけを索引リスト8上のページ数の項目欄に付
加する。
【0014】索引出力手段7は、索引ソート手段6によ
り完成した索引リスト8を索引文書ファイル11に索引
として出力する。
【0015】索引リスト8は、文字列抽出手段3により
抽出された文字列が照合手段4によって索引辞書9と照
合された結果、索引とする語句と判断された場合のその
語句の文字列,文字数および文書上のその語句のあるペ
ージ数を格納する。
【0016】索引辞書9は、一般的に索引とする頻度が
高いと思われる語句の文字列および文字数をあらかじめ
格納し、索引リスト8に抽出する対象の語句(抽出対象
語句)とする。語句の並びかたは、まず文字数でまとめ
られ、その中で五十音順に並べられている。
【0017】作成文書ファイル10は、作成された文書
を格納するファイルである。
【0018】索引文書ファイル11は、完成した索引リ
スト8を索引として出力するファイルである。
【0019】図2は、作成文書ファイル10に作成され
たある1つの文書の文章をランダムに抽出したところを
例示する図である。
【0020】図3(a)から(c)は、図2に示した文
書から生成される索引リスト8を索引の生成過程の順に
例示した図である。
【0021】図3(a)は、索引の生成過程で最初に索
引とする語句と判断された語句の文字列,文字数および
ページ数をエントリした索引リスト8を例示する図であ
る。
【0022】図3(b)は、文書の文頭の文字列から文
字列抽出手段3,照合手段4および索引エントリ手段5
が繰り返し実行され文末の文字列まで終了した時点の索
引リスト8を例示する図である。
【0023】図3(c)は、索引ソート手段6によって
索引とする語句が五十音順にソートされた索引リスト8
を例示する図である。
【0024】次に、このように構成された本実施例のワ
ードプロセッサ索引生成方式の動作について、日本語文
書からその索引を生成する場合を例にとって図2および
図3(a)〜(c)を参照して説明する。
【0025】制御手段2では、作成者がキーボード1で
索引生成キー1aを操作することにより索引の生成の指
示を与えると、文字列抽出手段3は、作成文書ファイル
の中の日本語文書の先頭から文字列およびその文字数を
順次抽出する。文字列の抽出は、名詞,代名詞および品
詞を主に抽出する。なお、作成者の希望に応じて索引辞
書9内の抽出対象語句の増加および削除は可能である。
【0026】例えば図2では、まず抽出される文字列は
「テレビ」である。照合手段4は、索引辞書9から文字
列抽出手段3で抽出された文字列「テレビ」と同じ文字
数である3文字の語句を取り出し、文字列「テレビ」と
照合する。
【0027】照合手段4は、照合した結果、その文字列
が索引辞書9の中の同じ文字数の語句と文字列で一致し
た場合、その文字列を索引とする語句と判断する。
【0028】照合した結果その文字列が索引辞書9の中
の同じ文字数の語句と文字列で不一致だった場合は、照
合手段4は、その文字列を索引対象外の語句と判断す
る。
【0029】照合手段4は、索引とする語句と判断した
文字列,その文字数および文書上のその語句のあるペー
ジ数を索引エントリ手段5に渡す。索引エントリ手段5
は、渡された文字列、その文字数およびページ数を図3
(a)に示すように索引リスト8にエントリする。
【0030】最初の文字列の処理が終了すると、制御手
段2は処理が終了した文字列の次の文字列から順に、文
字列抽出手段2,照合手段4および索引エントリ手段5
までの処理を文書の文末まで繰り返し実施する。
【0031】文字列抽出手段3,照合手段4および索引
エントリ手段5までの処理が文書の文末まで終了する
と、索引リスト8は、図3(b)に示すようになる。
【0032】制御手段2は、図3(b)の状態にある索
引リスト8の中の索引とする語句のソートを索引ソート
手段6に指示する。
【0033】索引ソート手段6は、まず索引リスト8に
エントリされた語句を五十音順にソートする。その後、
索引リスト8にエントリされた語句のうちの文字列およ
び文字数が同じ語句を一つにまとめる。次に、文書上の
その語句のあるページ数が複数存在するときには、索引
リスト8上のその語句のページの項目欄にページ数が付
加されていく。このとき、文字数が同じもので文字列が
違う場合では、ひらがなが最優先し、次にカタカナ、次
に漢字、最後にアルファベットの順となる。この結果、
索引リスト8は、図3(c)に示すようになる。
【0034】索引ソート手段6によりソートが終了した
索引リスト8は、索引出力手段7により、索引として索
引文書ファイル11に出力される。
【0035】なお、本実施例は作成された文書が日本語
文書だった場合を例にとって説明しているが、本発明の
ワードプロセッサ索引生成方式は日本語に限らず他の言
語においても同様に適用できることは言うまでもない。
【0036】
【発明の効果】以上説明したように本発明は、索引辞書
との照合という方法により作成していく過程または作成
終了後の文書から索引とする語句を自動的に抽出できる
ので、索引作成の省力化が図れ、索引とする語句の見落
としや不統一を防止できるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例に係るワードプロセッサ索引
生成方式の構成を示すブロック図である。
【図2】図1の実施例の具体的な説明をするための文章
の一例を示した図である。
【図3】本実施例のワードプロセッサ索引生成方式にお
ける索引リストを示す図である。(a)は、作成文書の
中で最初に索引とする語句と判断された語句をエントリ
した索引リストを示し、(b)は、索引とする語句のエ
ントリが文書の文末まで終了した時点の索引リストを示
し、(c)は、(b)の状態にある索引リストのなかの
語句を五十音順にソートし、文字列も文字数も同じもの
はひとつにまとめてページ数だけを索引リストのページ
数の項目欄に付加した後の索引リストを示している。
【符号の説明】
1 キーボード 1a 索引生成キー 2 制御手段 3 文字列抽出手段 4 照合手段 5 索引エントリ手段 6 索引ソート手段 7 索引出力手段 8 索引リスト 9 索引辞書 10 作成文書ファイル 11 索引文書ファイル

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 ワードプロセッサで作成された文書から
    索引を生成する場合に、対象となる文字列が索引とする
    語句であるかどうかを判断する基準となる抽出対象語句
    を格納する索引辞書と、 作成された文書から文字列およびその文字数を抽出する
    文字列抽出手段と、 この文字列抽出手段により抽出された文字列およびその
    文字数を前記索引辞書と照合する照合手段と、 この照合手段により照合した結果、その文字列が索引と
    する語句だった場合にその語句を索引リストにエントリ
    する索引エントリ手段と、 この索引エントリ手段により索引としてエントリされた
    語句を五十音順にソートし文字列も文字数も同じものは
    ひとつにまとめてページ数だけを索引リストのページ数
    の項目欄に付加する索引ソート手段と、 この索引ソート手段により完成した索引リストを索引文
    書ファイルへ出力する索引出力手段と、 前記文字列抽出手段,前記照合手段および前記索引エン
    トリ手段を文書の文頭の文字列から文末の文字列まで繰
    り返し実行し、前記索引ソート手段および前記索引出力
    手段を制御する制御手段とを有することを特徴とするワ
    ードプロセッサ索引生成方式。
  2. 【請求項2】 前記ワードプロセッサが、日本語ワード
    プロセッサである請求項1記載のワードプロセッサ索引
    生成方式。
JP5163095A 1993-06-07 1993-06-07 ワードプロセッサ索引生成方式 Pending JPH06348695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5163095A JPH06348695A (ja) 1993-06-07 1993-06-07 ワードプロセッサ索引生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5163095A JPH06348695A (ja) 1993-06-07 1993-06-07 ワードプロセッサ索引生成方式

Publications (1)

Publication Number Publication Date
JPH06348695A true JPH06348695A (ja) 1994-12-22

Family

ID=15767092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5163095A Pending JPH06348695A (ja) 1993-06-07 1993-06-07 ワードプロセッサ索引生成方式

Country Status (1)

Country Link
JP (1) JPH06348695A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983171A (en) * 1996-01-11 1999-11-09 Hitachi, Ltd. Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63229563A (ja) * 1987-03-18 1988-09-26 Nec Corp 索引作成方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63229563A (ja) * 1987-03-18 1988-09-26 Nec Corp 索引作成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983171A (en) * 1996-01-11 1999-11-09 Hitachi, Ltd. Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program

Similar Documents

Publication Publication Date Title
US5579224A (en) Dictionary creation supporting system
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JPH06348695A (ja) ワードプロセッサ索引生成方式
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JP3161660B2 (ja) キーワード検索方法
JPS61267824A (ja) 日本語デ−タ整列化処理方式
JPS63115264A (ja) 文書処理装置
JP2894298B2 (ja) 文書検索装置
JP2702443B2 (ja) 日本語入力装置
JPH07141370A (ja) 英語形態素解析装置
JPH04365166A (ja) 文章検査装置
JPH0668160A (ja) 情報検索方式
JPH07104862B2 (ja) 文字入力方法およびその装置
JPS6349930A (ja) キ−ワ−ド抽出装置
JPH0869467A (ja) 日本語文書処理装置
JPS61223977A (ja) 翻訳処理装置
JPS62287338A (ja) 検索装置
JPS63213062A (ja) 送り仮名検索装置
JPH03252859A (ja) 目次自動生成装置
JPH03129561A (ja) インデックス作成支援装置
JPH09114842A (ja) 情報検索処理装置および情報検索処理方法
JPS62287337A (ja) 検索装置
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPH03248272A (ja) 文書検索装置