JPH0769919B2 - インデックス作成支援装置 - Google Patents

インデックス作成支援装置

Info

Publication number
JPH0769919B2
JPH0769919B2 JP1269555A JP26955589A JPH0769919B2 JP H0769919 B2 JPH0769919 B2 JP H0769919B2 JP 1269555 A JP1269555 A JP 1269555A JP 26955589 A JP26955589 A JP 26955589A JP H0769919 B2 JPH0769919 B2 JP H0769919B2
Authority
JP
Japan
Prior art keywords
index
character information
editing
information
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1269555A
Other languages
English (en)
Other versions
JPH03129562A (ja
Inventor
茂起 空閑
浩幸 勘座
直利 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1269555A priority Critical patent/JPH0769919B2/ja
Priority to US07/596,283 priority patent/US5276616A/en
Priority to DE69028592T priority patent/DE69028592T2/de
Priority to EP90119749A priority patent/EP0423683B1/en
Publication of JPH03129562A publication Critical patent/JPH03129562A/ja
Publication of JPH0769919B2 publication Critical patent/JPH0769919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、書籍などのインデックス(索引)を作成する
ための装置に関するものである。
また、インデックスは該当書籍におけるキーワードであ
ることからキーワード作成支援装置としても利用が可能
である。更に、インデックスは辞書類・文書類の見出し
としても利用ができ、広く、辞書・文書などの文書処理
の検索、編集、作成装置として利用が可能である。
即ち、文字列の処理を行うワードプロセッサ、コンピュ
ータなどへの適用が可能である。
また、インデックス作成支援機能、あるいはキーワード
作成支援機能、その他の文書処理機能は、独立の機能と
して用いられるほかに、ワードプロセッサ、コンピュー
タなどの他の文書処理機能と組み合わせて適用すること
も可能である。
〈従来の技術〉 従来、書籍やマニュアルにはインデックスを付け、利用
者の検索の利便に供されてきた。
このインデックスの作成作業には、書籍やマニュアルの
著者や編集の専門家が書籍やマニュアルなどの文書の中
のインデックスのすべき文字列に特殊な記号を付加した
り、あるいは、インデックスにすべき文字列を別の紙に
書き出した後で、該抽出記号、書き出されたインデック
スを利用して索引とする文字列や出現ページを決定する
という方式が取られていた。また、これらの文字列をイ
ンデックスとしてどのように配列し、どのように出力す
るかも、専門家の判断に任せられていた。
最近では、ワードプロセッサ(以後ワープロ)やその他
の文書処理システムが開発され、電子化された文書情報
を用いてインデックスを作成することも可能になってい
る。
ただし、この場合も、紙が電気的表示装置に代わっただ
けであり、インデックスを作成する過程のみを取り出せ
ば、依然として、著者や専門家が、インデックスとすべ
き文字列に特殊な記号を付加したり、インデックスとす
べき文字列を指摘したりする方法が採られている。
これらのインデックス作成技術の基盤として、符号や文
字列などを入力する技術が確立している。また、入力し
た符号や文字列などを表示装置に出力する表示技術が確
立している。また、符号などを手掛かりに文字列を抽出
し、索引の見出しとして編集したりできる編集技術が確
立している。また、符号化したインデックスの出現ペー
ジを計算し、索引見出しと組み合わせて出力するコンピ
ュータの基本技術が確立している。
これらの技術を用いて、電子化された文書中から、イン
デックスを指定することによりインデックスを作成する
技術の基盤が確立されている。
〈発明が解決しようとする問題点〉 紙のうえに記述された文書の中からインデックスを作成
する方法は、運び易く、どの部分にも、自由な文字や記
号サイズで、入出力同一面に書けるなど紙の特徴に基づ
くメリットを有しているが次のような問題点を有してい
る。
まず、インデックスを抽出するための作業に時間がかか
った。
また、抽出記号を付加したり他の紙に書き移したりする
過程で間違いの混入する可能性が高かった。
また、文書が完成してからでないとインデックスの作成
がやりにくいという制約があった。
また、インデックス作成の過程が管理しにくいという問
題があった。
また、文書中にない表現がインデックスの見出しとして
取られたり、インデックス見出しが記述されていないペ
ージがインデックス頁として当てられたりする間違いが
発生するという問題があった。
また、インデックス作成後に文章の変更があった場合
に、インデックス見出しや頁数などに間違いを引き起こ
す可能性が高いとう問題があった。
また、このような間違いを校正するため多くの人的パワ
ーと時間を必要とした。
また、著者とインデックスの作成者が異なる場合、同一
内容に対し、微妙な表現の差異が生じ、インデックスの
利用者に困惑を与えるという問題があった。
一方、ワープロなどの文書処理装置を利用し、抽出用の
符号を付けてインデックスを作成する方法は、文書が修
正されても、直ちに、関連する部分が修正できるという
メリットをもたらすが、インデックス抽出の過程は本質
的に紙の上の文章を用いるのと同じであるので、紙のう
えでのインデックス抽出と同じ問題を有している。
即ち、インデックスを抽出するための符号付けに時間と
注意力を必要とする。そのため、大量の文書では作業の
過程で間違いが生じ易いという問題があった。
また、文中の記述とインデックス見出し記述との整合が
とりにくいし、整合を取る際に間違いが発生するという
問題があった。
また、インデックスを抽出する人が変われば、インデッ
クスが変わるというインデックス抽出の統一性がなかっ
た。
また、作業を行う人がインデックス抽出の専門知識を有
し、かつ、装置の扱える人でなければならないという制
約条件が有った。
また、インデックス作成のための知識が蓄積されないと
いう問題があった。
これらの問題を解決するため、特開昭63-286965号公報
には、作成文書中に含まれた用語とその用語が存在する
ページ番号を抽出して記憶し、記憶された用語とページ
番号を所定の順序に編集することにより、索引を自動的
に作成する文書作成装置が記載され、また、特開昭63-2
44259号公報には、作成文書中に含まれる単語(用語)
頻度と単語表記長さから妥当なキーワード優先順位付け
を実現するキーワード抽出装置が記載されている。
本発明は、専門家の有しているインデックス抽出のため
の領域知識をコンピュータに格納することにより、領域
知識に基づいた統一的インデックスの抽出を行い、イン
デックス作成のかかる問題を解決し、効率的で、間違い
の少ないインデックスの作成を行おうとするものであ
る。
〈問題点を解決するための手段〉 本発明は、文字情報を入力する文字情報入力手段と、文
字情報を出力する文字情報出力手段と、入力された文字
情報を記憶する文字情報記憶手段と、文字情報を編集す
る文字情報編集手段と、文字情報を表示する文字情報表
示手段と、文字情報を言語解析する言語解析手段と、イ
ンデックスを抽出するインデックス抽出手段と、抽出さ
れたインデックスを対話的に編集する編集手段と、言語
解析用の辞書類、解析結果、制御の途中経過、結果など
を蓄積する一時記憶手段と、上記の各手段を制御する制
御手段と、を有する装置において、 抽出されたインデックスからインデックスの文書中での
記述環境を検索する手段と インデックス抽出結果の一覧表に追加、訂正、削除する
手段と、 インデックス抽出結果の一覧表に見出し項目を取捨選択
する手段と、 インデックスの記述状態をKWIC及び原文のいずれか或は
双方で確認する手段と、 インデックスの出現頻度、出現順位を表示する手段と、 により出力するインデックスを制御するものである。
〈作用〉 はじめに、制御手段の制御により、本発明の装置に入力
された文字情報が、言語解析手段によって言語解析さ
れ、その結果が記憶手段に蓄積される。
次に、インデックス抽出手段により、この言語解析結果
とインデックス抽出のための知識を利用し、インデック
スを抽出する。
次に、抽出されたインデックスの結果を対話的に編集す
る手段(以後インデックスエディタ)に表示する。
次に、インデックスエディタの画面に、抽出されたイン
デックスの文中での使用状況を確認する画面を表示し、
ユーザが使用状況を含めてインデックスの取捨選択の判
断を行う。
次に、ユーザの判断結果に基づいて、インデックスの取
捨選択を実行し、その結果を編集手段で編集し、出力手
段に出力するように作用する。
〈実施例〉 以下図に基づいて本発明を詳細に説明する。第1図は本
発明にかかわるインデックス作成支援装置のブロック構
成図である。
図において1は文字情報を入力するためのキーボードな
どの入力手段である。2は入力した文字情報を出力する
ためのプリンタなどの出力手段である。3は、入力され
た文字情報を記憶す半導体素子、ディスク、フロッピー
ディスクなどの記憶手段である。4は、入力された文字
情報を編集するための、マウス、アイコン、機能キーな
どの編集手段である。編集自体は後で述べる制御装置で
行われるが、ここでいう編集手段は制御装置の実行の契
機を与えたり、ユーザが編集を行い易くするために設け
られた手段である。5は入力されたり、編集された文字
情報を表示するためのCRTなどの表示手段である。6は
入力された文字情報を言語解析するための、辞書、テー
ブル、言語解析プログラムなどからなる言語解析手段で
ある。7は、ルールや対象領域の専門用語などのインデ
ックス抽出のための知識により、インデックスを抽出す
る手段である。8は抽出されたインデックスを文中での
使用状況などの他の情報とともに編集し、見易い形にし
て表示し、インデックスの取捨選択、追加、変更などを
行えるようにしたインデックス用のエディタである。9
は入力された文字情報や、言語解析のためのバッファと
なる一時記憶手段である。一般に制御装置に密接したRA
Mが利用される。10はこれらの各手段を制御するCPUなど
の制御手段である。
第2図はワープロのマニュアルの文章を表示手段に表示
した例を示す図である。ワープロの文章は数百ページに
及ぶものもあるが、ここでは、本発明の原理を説明する
のが目的なので図のような1頁の文章で例を示す。
11はタイトルあるいは見出しと呼ばれる文章である。こ
れは、通常、文書の最初の部分に太字で記述されたり、
章、節などの番号と1行程度の文章から成り立つ場合が
多い。本例では、他の部分より大きいサイズの文字を用
いて、タイトル文であることを強調している。12は本文
であり、見出しに対する内容の説明、操作の方法など詳
細な記載がなされている部分である。13は表示装置の表
示画面のイメージを表す例を示した図である。
第3図は本発明の機能ブロックの概略フロー図である。
14は入力された文字情報を形態素解析、構文解析、意味
解析、文脈解析などして文章を装置が解釈できる形式に
変えて記憶する言語解析処理モジュールである。15は抽
出ルールや専門用語辞書などのインデックス抽出用の知
識を用いて文字情報の中からインデックスの候補となり
得る部分を抽出するモジュールである。16は抽出された
インデックスの候補を編集し、文中での使用の状態を確
認しながら、インデックス候補の取捨選択、追加、変更
などの処理を行うインデックスエディタ処理のモジュー
ルである。17は抽出されたインデックスの候補の情報に
基づいて、編集を行ったり、出力を行うモジュールであ
る。
以後これらの各モジュールに対し、第2図に上げた例文
を用いて具体的に説明を行う。
言語解析処理モジュールは、まず、記憶手段あるいは一
時記憶手段に蓄えられた文書から、言語解析手段で処理
できる単位の文を切り出し、一時記憶手段に読み込む。
例えば、今、言語解析手段は1文を単位として処理する
ものと仮定すると、制御手段は第2図の例文の第1番目
の文書である「漢字を1文字ずつ入力する」を一時記憶
手段に呼び込む。次に、形態素解析、構文解析、意味解
析などの言語解析が行われる。ここでは、形態素解析の
例を示し、どのような過程が必要であるかの原理を示
す。
呼び込まれた文章は、通常、文章の頭のほうの文字から
順に言語解析手段にある言語解析用辞書と参照される。
第4図がその辞書の例を表した図である。これは、入力
例文の形態素解析を行うのに必要な見出しに限った辞書
になっている。18は見出しの情報を表す項目である。19
はその読みの情報を表す項目である。20はその品詞情報
を表す項目である。21は見出し項目の弁別番号である。
今の場合、入力文の頭文字は「漢」であるので、「漢」
と辞書との照合がなされるが、照合に失敗する。そこ
で、照合する文字を1文字ずつ増やし照合を繰り返す。
例えば、次の段階では「漢字」までを切り出して、辞書
と照合する。今度は、照合に成功する。成功した場合
は、辞書の読みの情報、品詞情報、あるいは、見出しの
弁別番号を一時記憶手段、あるいは、記憶手段にスタッ
クし、再び入力文字列の次の文字から辞書との照合を繰
り返す。これにより、各形態素が決定される。また、形
態素と形態素間の接続関係表を用いることにより解析し
た文は「漢字を/1文字ずつ/入力する」のように文節単
位に分類することもできる。
第5図は言語解析された各形態素の情報を出現順に並べ
た例を表した図である。22は各形態素の画面バッファ上
の開始位置であり、23はその終了位置である。24は各形
態素の弁別番号であり、25は各形態素の出現頻度情報で
ある。26は文節の切れ目であることを示す項目であり、
「文節」はそこまでの形態素が連なって一つの文節を形
成することを意味している。
次にインデックス抽出処理モジュールの説明に移る。イ
ンデックスの抽出方法の一つとして、専門用語辞書を用
いる方法で例を示す。第6図は、専門用語辞書の構造及
び内容の例を示した図である。27は専門用語辞書の標準
見出し情報の項目であり、通常、検索に便利なようにソ
ートされている。28は、見出しの読み情報の項目であ
る。29は見出しの品詞情報の項目である。30は見出しの
句のゆらぎ表記の情報である。この項目の中の数字は見
出しの形態素の番号を表している。数字の後ろの「+」
記号は、数字で示される形態素の次の位置に、「+」の
次に示されている文字情報が追加される可能性があるこ
とを意味している。31は揺らぎ表記情報の項目である。
項目の数字は形態素の番号を示しており、数字に続く中
点以下の文字列が来る可能性のあることを意味してい
る。この図の場合でいうと、ウインドウはウィンドウと
書かれることもあることになる。次に、言語解析された
結果は、専門用語辞書の標準見出し、あるいは、句の揺
らぎあるいは、揺らぎ表記情報で生成された見出しと照
合され、照合結果が記憶装置に蓄えられる。第2図の入
力ぶんの例では、「変換」、「次候補」、「音訓の入
力」、「ウィンドウ」の部分が抽出される。
第7図はこのようにして得られた、インデックスの候補
を蓄積したバッファの構造の例を示したものである。32
は出現頁情報を表す項目である。33はインデックス候補
見出しの出現行数である。34、35はそれぞれインデック
ス候補文字列の始まりと、終わりの位置情報を表す項目
である。36はインデックス見出しの出現頻度情報の項目
である。この情報が2時少の場合は、32から34までの項
目に複数個のインデックスが存在することになり、本図
ではそれをコンマで区切って示している。37はインデッ
クス候補の見出し情報の項目である。38はインデックス
候補見出しの読み情報の1文字を代入したものである。
38はインデックスの1文字インデックスを50音の行単位
で取る場合は、50音の行の代表文字に置き換えられる。
次に、本発明の特徴であるインデックスエディタ処理の
説明を行う。第8図はインデックスエディタの表示例の
図である。本エディタは通常のエディタと同様、入力編
集が行えるようになっている。本インデックスエディタ
は、表形式になっており、縦線で項目の区切りを示して
いる。項目から別の項目へ移る場合は、編集手段に機能
定義された機能キーやマウスなどを利用するようになっ
ている。本発明では、「機能キー+→」、「機能キー+
←」、「機能キー+↑」、「機能キー+↓」の4種類の
キー操作で表の行又は欄を移動できるように定義してあ
る。
39は本発明装置のユーザが見出し項目が必要であるかい
なかを判断し、不必要な場合は、編集手段の機能キー
「F2」または入力手段で、不要の記号「#」を入力でき
るようにした要/不要記入項目である。「#」がない場
合は、必要であると見なされる。ただし、無印の場合の
定義、機能キーの種類、要/不要の記号はこれに限定す
るものではない。
また、40はインデックスの見出しである。インデックス
に修正が必要な場合は修正することができるようになっ
ている。41は索引の最終形態の1文字インデックスであ
る。同字異音語などで本発明のインデックス抽出手段が
間違って辞書検索を行った場合などに、修正を行う。42
はインデックス見出しの出現ページである。この項目
は、インデックス見出しの修正や追加があった場合のみ
入力が可能なようになっている。43はインデックスエデ
ィタの項目の識別のための欄であり、44がインデックス
見出しの内容になっている。45はインデックスを抽出す
る元の文書ファイルの名前である。46はインデックスエ
ディタのファイルの名前である。47は、インデックスエ
ディタの操作方法のガイダンスの例を表した図である。
ガイダンスはウインドウの機能をもった表示装置では、
必要な場合にのみ、ウインドウに表示させて確認するこ
ともできる。
インデックスエディタを表示した状態で、F1キーを押す
と現在エディタで指示している行のインデックス見出し
の文中での使用状況を表示することができる。今、変換
の行を指示しているとすると仮定する。
第9図は「F1」キーを押しKWIC(Key Word In Contex
t)画面に移ったときの表示例の図である。53はインデ
ックスの見出しと、出現頻度、出現順位を表示するガイ
ダンス画面領域である。54はKWIC表示画面領域である。
55は原文章表示画面領域である。56は操作ガイダンス画
面領域である。
48はエディタ画面で、指示されたインデックス見出しの
候補である。49はインデックスの内、KWIC表示している
見出しの出現順位、出現頻度を表わす情報である。図中
の1は出現順位を、2は出現頻度を示している。50はキ
ーワードである。見易くするため、キーワードの前後は
スペースを挿入してある。51、52はそれぞれキーワード
前、キーワード後の文字列である。通常キーワードを含
め1行に収まる分量をKWICとして表示する。
55はKWICだけではインデックスの取捨選択が決定できな
いときさらに、本文を参照し、判断支援を行うための画
面である。インデックスの部分は反転表示などの他の部
分と異なる表示の方法が取られている。また、インデッ
クスの部分にカーソルを合わせると、KWIC画面、ガイダ
ンス画面の表示がそれと連動して変化するようになって
いる。以上のように、インデックスの一覧表と本文を見
比べながらインデックスの重要性を判断し、取捨選択し
て行くのが本発明の特徴となっている。
第10図にインデックスエディタ処理モジュールの詳細処
理フローを示す。57は第7図に示すインデックス抽出結
果のファイルを参照するモジュールである。37の項目を
参照することにより、4個のインデックス候補があるこ
とが分かる。もしインデックスの候補があれば、第8図
の43のインデックス一覧表のタイトル部分及びインデッ
クス一覧表の表の枠を作成する。これは、タイトル及び
表の枠の部分をあらかじめ、項目を定義して記憶手段に
記憶しておき、これを呼び出すことで実現できる。この
処理モジュールが58である。
次に、第8図の見出しの並び順はインデックスの出現順
の並びになっているので、一覧性を良くするために、読
みのインデックス及び見出しで、たとえば50音順に、ソ
ートを行う。先程58の処理でいれたタイトルの項目に、
ソートした第8図の相当項目の内容を書き込む。例え
ば、「インデックス」というタイトルの項目には37の内
容を入れる。32の出現ページを入れるときは、もし出現
ページが同一であるなら、1個のみを42の項目に書き出
す。この処理モジュールが59である。この書き込みの処
理は、見出し及び項目が終了するまで繰り返される。こ
のとき、見出しが変化する毎に行の数を1つだけ増加さ
せる。この処理モジュールが60である。
書き込む見出し、及び項目が終了したら、エディタファ
イルの表示処理の操作により、一覧表を呼び出す。この
処理モジュールが62である。63は表示されたインデック
スエディタ画面のどの列の指示かあるかを調べるモジュ
ールである。もし列の指示があれば、あらかじめ制御装
置に記憶されている各列の処理に入る。例えば「要/不
要」の欄であれば、「#」かF2キーが押されるのを待ち
押されたら、「#」を表示するようになっている。この
処理モジュールが64であり、F2、#以外のキーが押され
た場合は、注意を促すようになっている。
列選択がない場合は、最初の見出しの、要/不要欄を指
すようになっている。もし、要/不要以外の列、例え
ば、インデックスの列が指示された場合は、枠エディタ
の機能が働くようになっている。この処理モジュールが
65であり、この処理は列処理が終了するまで繰り返され
る。この処理が66である。列処理を終了すれば、インデ
ックスエディタの処理を終了し、編集・出力処理に移
る。
取捨選択の判断ができかねる場合は、インデックス候補
の含まれる本文を確認しながら、要/不要の選択を行う
ことができる。67は「F1」キーが押されるのを待ち、KW
IC画面に移行し、KWICの表示領域に、インデックス候補
見出しをキーとして、キーの前後の文字列を定義された
領域に表示するルーチンである。「F1」が押されない場
合は、終了するか、他の処理に移るかの分岐を行うのも
このモジュールである。「F1」キーが押された場合、通
常、カーソルはKWIC画面の先頭の位置を指示するように
設計してある。
ここで、ユーザの画面変更要求のキー、例えば「機能+
↓」の入るのを待つ。この処理モジュールが68である。
画面の変更処理があれば、例えば、「機能+↓」が押さ
れれば、本文画面に移る。本文画面は、KWICに表示され
ているインデックスの本文中の位置が本文画面の上から
3行目に来るように本文文章の表示を行い、画面エディ
タの機能をもつようにする。本文中のインデックス見出
し候補の部分の反転表示は、第7図の32、33、34、35の
情報を利用することにより実現することができる。ま
た、「機能キー+↑」で、ガイダンス画面に移ったとき
の処理は次のようになっている。インデックス見出しの
部分は、通常、インデックスエディタの見出しを表示し
ているが、ここにはユーザ指定でインデックス文字列を
入力できるようになっている。それは、行エディタで実
現することができる。また、右上の、インデックスの頻
度、出現順位情報は、第7図の36及び32、33、34、35の
情報から表示することができる。
画面切り替えを行い、インデックスの取捨選択が判断で
きたら、再び、インデックスエディタの画面に戻る。こ
の処理モジュールが70である。ここで、終了するか否か
の判断を行い、終了しない場合は62へ戻り要/不要のマ
ークを付けるなどのインデックスエディタの処理を繰り
返す。この分岐の処理モジュールが71であり、インデッ
クスエディタの一連の処理を終了するモジュールが72で
ある。
次に編集・出力処理モジュールの説明に移る。この処理
モジュールは、第8図に表現された情報を元に、最終的
なインデックスを作成し、出力するモジュールである。
まず、第8図の要/不要の列を参照し、「#」マークの
ある行を削除する。削除処理を施した結果を元に、指定
されたフォーマットに従い出力する。指定されたフォー
マットは記憶装置に蓄え、ユーザの指定により、パラメ
ータを変え出力できるようになっている。その出力例を
第11図に示す。73は1文字インデックスである。74はイ
ンデックス見出しである。75は出現ページ数である。1
文字インデックスは実施例では、辞書のかな1文字で表
しているが意図に応じて50音の行に集約して出すことも
できる。
また、本発明では、編集手段をキーボードとカーソルを
用いた実施例で説明したが、他のマウスなどの手段でも
発明に影響はない。
また、実施例では、重ね合わせのないウインドウシステ
ムを用いたが、表示のフィールドや大きさを変えたり、
重ね合わせのウインドウシステムを使用しても本発明に
影響はない。
また、操作ガイダンスの表現は、表示のとおりでなくて
も良く、プルダウンメニューなどの方法を用いても本発
明に影響はない。
〈発明の効果〉 本発明の効果は、インデックスの取捨選択を、本文の確
認と結び付けて行うことにより、確実にかつ容易に実行
できるようにした点にある。
また、本文の確認の際に、KWIC表示を設け、早期の判断
を手助けるようにした点でも効果がある。
更に、本文を深く調査したいときには、KWIC画面から、
素早く本文の表示画面に移行できるようにしたため、ユ
ーザのインデックス取捨の判断のレベルに応じて情報を
提供できるようにした点でも効果がある。
また、インデックスエディタというインデックスの候補
を一覧できるエディタを作り、削除見出しを決めれるの
で、インデックス登録語数などの制約を考慮して作業を
進められる点でも効果がある。
更に、インデックス候補の出現頻度、出現順位情報を表
示しているので、インデックス取捨選択の重要度の判断
の手助けをする点でも効果がある。
また、専門家の知識を専門用語辞書として蓄えており、
これと、入力文書との照合により、自動的に文書のイン
デックスが抽出できるため、インデックスの抽出作業を
短縮できる点にある。
また、計算機による、文書と知識ベースや辞書との照合
を行っているため、表記やページ数の抽出ミス、転記ミ
スなどを防ぐことができる点でも効果がある。
更に、文書作成の途中であっても、装置を操作し、イン
デックスの抽出状態をみてみるなど、文書作成が終了
し、文章を入力してみてからでないとインデックスの作
成にかかれないという制約を解消する点でも効果があ
る。
更に、専門家の知識を知識ベース化しているため、専門
家のインデックス抽出のための知識が順次蓄積されると
共に、専門家間や編集者間による差異のない統一的なイ
ンデックスの抽出ができる点でも効果がある。
更に、インデックス抽出にかかわる知識を計算機で処理
できる形で保存しているので、インデックス作成の専門
家と同様の抽出知識を素人でも容易に得ることができ、
装置の使用に拘る人への制約を緩和できる点でも効果が
ある。
また、計算機を利用して解析を行うことができるので、
文書に変更のある場合も間違いなく、早く対応でき、文
書の修正を行い易くした点でも効果がある。
【図面の簡単な説明】
第1図は本発明装置の構成ブロック図であり、第2図は
表示手段に表示されたワープロのマニュアル文書例を示
した図である。第3図は機能モジュールの全体フロー図
であり、第4図は言語解析処理モジュールの辞書の構造
の例を表した図である。第5図は言語解析処理モジュー
ルの言語解析の結果の例を示した図であり、第6図はイ
ンデックス抽出手段の専門用語辞書の構造の例を示した
図である。第7図はインデックス抽出処理で得られた結
果の例を示した図であり、第8図はインデックスエディ
タの表示例の図である。第9図はKWIC画面の表示の例を
示した図であり、第10図はインデックスエディタ処理モ
ジュールの詳細フロー図である。第11図はインデックス
の最終出力結果の表示例の図である。 6……言語解析手段 7……インデックス抽出手段 8……インデックス編集手段 14……言語解析処理モジュール 15……インデックス抽出処理モジュール 16……インデックスエディタ処理モジュール 39……インデックスエディタの要/不要欄 40……インデックスエディタのインデックス欄 41……インデックスエディタの読み情報欄 42……インデックスエディタの出現頁欄 53……KWIC画面のガイダンス表示領域 54……KWIC画面のKWIC表示領域 55……KWIC画面の本文表示領域 73……インデックス中の1文字インデックス 74……インデックス中の見出し 75……インデックス中の出現頁情報

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字情報を入力する文字情報入力手段と、
    文字情報を出力する文字情報出力手段と、入力された文
    字情報を記憶する文字情報記憶手段と、文字情報を編集
    する文字情報編集手段と、文字情報を表示する文字情報
    表示手段と、文字情報を言語解析する言語解析手段と、
    インデックスを抽出するインデックス抽出手段と、抽出
    されたインデックスを対話的に編集する編集手段と、言
    語解析用の辞書類、解析結果、制御の途中経過、結果な
    どを蓄積する一時記憶手段と、上記の各手段を制御する
    制御手段と、 を有する装置において、 抽出されたインデックスからインデックスの文書中での
    記述環境を検索する手段と、 インデックス抽出結果の一覧表に追加、訂正、削除する
    手段と、 インデックス抽出結果の一覧表に見出し項目を取捨選択
    する手段と、 インデックスの記述状態をKWIC及び原文のいずれか或は
    双方で確認する手段と、 インデックスの出現頻度、出現順位を表示する手段と、 により出力するインデックスを制御することを特徴とす
    るインデックス作成支援装置。
JP1269555A 1989-10-16 1989-10-16 インデックス作成支援装置 Expired - Fee Related JPH0769919B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1269555A JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置
US07/596,283 US5276616A (en) 1989-10-16 1990-10-11 Apparatus for automatically generating index
DE69028592T DE69028592T2 (de) 1989-10-16 1990-10-15 Gerät zur automatischen Generierung eines Index
EP90119749A EP0423683B1 (en) 1989-10-16 1990-10-15 Apparatus for automatically generating index

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1269555A JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置

Publications (2)

Publication Number Publication Date
JPH03129562A JPH03129562A (ja) 1991-06-03
JPH0769919B2 true JPH0769919B2 (ja) 1995-07-31

Family

ID=17474011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1269555A Expired - Fee Related JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置

Country Status (1)

Country Link
JP (1) JPH0769919B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3573501B2 (ja) * 1994-10-11 2004-10-06 富士通株式会社 索引作成装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63244259A (ja) * 1987-03-31 1988-10-11 Matsushita Electric Ind Co Ltd キ−ワ−ド抽出装置
JPS63286965A (ja) * 1987-05-20 1988-11-24 Fujitsu Ltd 文書作成装置

Also Published As

Publication number Publication date
JPH03129562A (ja) 1991-06-03

Similar Documents

Publication Publication Date Title
EP0423683B1 (en) Apparatus for automatically generating index
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3408291B2 (ja) 辞書作成支援装置
EP0241646A2 (en) Document processing apparatus
US6976214B1 (en) Method, system, and program for enhancing text composition in a text editor program
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPH0769919B2 (ja) インデックス作成支援装置
JPH0877196A (ja) 文書情報抽出装置
Pantelia ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE
JP2621999B2 (ja) 文書処理装置
JP4248549B2 (ja) 機械翻訳編集装置、機械翻訳編集プログラム及び機械翻訳編集方法
JPS6134668A (ja) 仮名漢字変換処理方式
JPH08185401A (ja) 文書検索装置
Tools A Corpus/Annotation Toolbox
JPH0612453A (ja) 未知語抽出登録装置
JPH06149790A (ja) 文章作成装置
JPH06266765A (ja) 文章検索装置
JPH0769918B2 (ja) インデックス作成支援装置
JPH03129560A (ja) インデックス作成支援装置
JPH03105667A (ja) 索引ページデータ自動作成処理方式
JPH07191995A (ja) 機械翻訳装置
JPH0227473A (ja) 文書編集方法
JPH0785026A (ja) 辞書更生方法及び装置
JPH07219962A (ja) キーワード作成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070731

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080731

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees