JPH03129562A - インデックス作成支援装置 - Google Patents

インデックス作成支援装置

Info

Publication number
JPH03129562A
JPH03129562A JP1269555A JP26955589A JPH03129562A JP H03129562 A JPH03129562 A JP H03129562A JP 1269555 A JP1269555 A JP 1269555A JP 26955589 A JP26955589 A JP 26955589A JP H03129562 A JPH03129562 A JP H03129562A
Authority
JP
Japan
Prior art keywords
index
information
editor
character information
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1269555A
Other languages
English (en)
Other versions
JPH0769919B2 (ja
Inventor
Shigeki Kuga
空閑 茂起
Hiroyuki Kanza
浩幸 勘座
Naotoshi Maruyama
丸山 直利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1269555A priority Critical patent/JPH0769919B2/ja
Priority to US07/596,283 priority patent/US5276616A/en
Priority to DE69028592T priority patent/DE69028592T2/de
Priority to EP90119749A priority patent/EP0423683B1/en
Publication of JPH03129562A publication Critical patent/JPH03129562A/ja
Publication of JPH0769919B2 publication Critical patent/JPH0769919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、書籍などのインデックス(索引)を作成する
ための装置に関するものである。
また、インデックスは該当書籍におけるキーワードであ
ることからキーワード作成支援装置としても利用が可能
である。更に、インデックスは辞書類・文書類の見出し
としても利用ができ、広く、辞書・文書などの文書処理
の検索、編集、作成装置として利用が可能である。
即ち、文字列の処理を行うワードプロセッサ、コンピュ
ータなどへの適用が可能である。
また、インデックス作成支援機能、あるいはキーワード
作成支援機能、その他の文書処理機能は、独立の機能と
して用いられるほかに、ワードプロセッサ、コンピュー
タなどの他の文書処理機能と組み合わせて適用すること
も可能である。
〈従来の技術〉 従来、書籍やマニュアルにはインデックスを付け、利用
者の検索の利便に供されてきた。
このインデックスの作成作業には、書籍やマニュアルの
著者や編集の専門家が書籍やマニュアルなどの文書の中
のインデックスにすべき文字列に特殊な記号を付加した
り、あるいは、インデックスにすべき文字列を別の紙に
書き出した後で、該抽出記号、書き出されたインデック
スを利用して索引とする文字列や出現ページを決定する
という方式が取られていた。また、これらの文字列をイ
ンデックスとしてどのように配列し、どのように出力す
るかも、専門家の判断に任せられていた。
最近では、ワードプロセッサ(以後ワープロ)やその他
の文書処理システムが開発され、電子化された文書情報
を用いてインデックスを作成することも可能になってい
る。
ただし、この場合も、紙が電気的表示装置に代わっただ
けであり、インデックスを作成する過程のみを取り出せ
ば、依然として、著者や専門家が、インデックスとすべ
き文字列に特殊な記号を付加したり、インデックスとす
べき文字列を指摘したりする方法が採られている。
これらのインデックス作成技術の基盤として、符号や文
字列などを入力する技術が確立している。
また、入力した符号や文字列などを表示装置に出力する
表示技術が確立している。また、符号などを手掛かりに
文字列を抽出し、索引の見出しとして編集したりできる
編集技術が確立している。また、符号化したインデック
スの出現ページを計算し、索引見出しと組み合わせて出
力するコンピュータの基本技術が確立している。
これらの技術を用いて、電子化された文書中から、イン
デックスを指定することによりインデックスを作成する
技術の基盤が確立されている。
〈発明が解決しようとする問題点〉 紙のうえに記述された文書の中からインデックスを作成
する方法は、運び易く、どの部分にも、自由な文字や記
号サイズで、入出力同一面に書けるなど紙の特徴に基づ
くメリットを有・しているが次のような問題点を有して
いる。
まず、インデックスを抽出するための作業に時間がかか
った。
また、抽出記号を付加したり他の紙に書き写したりする
過程で間違いの混入する可能性が高かっtこ 。
また、文書が完成してからでないとインデックスの作成
がやりにくいという制約があった。
また、インデックス作成の過程が管理しにくいという問
題があった。
また、文書中にない表現がインデックスの見出しとして
取られたり、インデックス見出しが記述されていないペ
ージがインデックス頁として当てられたりする間違いが
発生するという問題があった。
また、インデックス作成後に文章の変更があった場合に
、インデックス見出しや頁数などに間遠いを引き起こす
可能性が高いとう問題があった。
また、このような間違いを校正するため多くの人的パワ
ーと時間を必要とした。
また、著者とインデックスの作成者が異なる場合、同一
内容に対し、微妙な表現の差異が生じ、インデックスの
利用者に困惑を与えるという問題があった。
一方、ワープロなどの文書処理装置を利用し、抽出用の
符号を付けてインデックスを作成する方法は、文書が修
正されても、直ちに、関連する部分が修正できるという
メリットをもたらすが、インデックス抽出の過程は本質
的に紙の上の文章を用いるのと同じであるので、紙のう
えでのインデックス抽出と同じ問題を有している。
即ち、インデックスを抽出するための符号付けに時間と
注意力を必要とする。そのため、大量の文書では作業の
過程で間違いが生じ易いという問題があった。
また、文中の記述とインデックス見出し記述との整合が
とりにくいし、整合を取る際に間違いが発生するという
問題があった。
また、インデックスを抽出する人が変われば、インデッ
クスが変わるというインデックス抽出の統一性がなかっ
た。
また、作業を行う人がインデックス抽出の専門知識を有
し、かつ、装置の扱える人でなければならないという制
約条件が有った。
また、インデックス作成のための知識が蓄積されないと
いう問題があった。
本発明は、専門家の有しているインデックス抽出のため
の領域知識をコンピュータに格納することにより、領域
知識に基づいた統一的インデックスの抽出を行い、イン
デックス作成のかかる問題を解決し、効率的で、間違い
の少ないインデックスの作成を行おうとするものである
〈問題点を解決するための手段〉 本発明は、文字情報を入力する手段と、文字情報を出力
する手段と、入力された文字情報を記憶する手段と、文
字情報を編集する手段と、文字情報を表示する手段と、
文字情報を言語解析する手段と、インデックスを抽出す
る手段と、抽出されたインデックスを対話的に編集する
手段と、言語解析用の辞書類、解析結果、制御の途中経
過、結果などを蓄積する一時記憶手段と、これらの各手
段を制御する制御手段から構成される。
く作用〉 はじめに、制御手段の制御により、本発明の装置に入力
された文字情報が、言語解析手段によって言語解析され
、その結果が記憶手段に蓄積される。
次に、インデックス抽出手段により、この言語解析結果
とインデックス抽出のための知識を利用し、インデック
スを抽出する。
次に、抽出されたインデックスの結果を対話的に編集す
る手段(以後インデックスエディタ)に表示する。
次に、インデックスエディタの画面に、抽出されたイン
デックスの文中での使用状況を確認する画面を表示し、
ユーザが使用状況を含めてインデックスの取捨選択の判
断を行う。
次に、ユーザの判断結果に基づいて、インデックスの取
捨選択を実行し、その結果を編集手段で編集し、出力手
段に出力するように作用する。
〈実施例〉 以下図に基づいて本発明の詳細な説明する。第1図は本
発明にかかわるインデックス作成支援装置のブロック構
成国である。
図においてlは文字情報を入力するためのキーボードな
どの入力手段である。2は入力した文字情報を出力する
ためのプリンタなどの出力手段である。3は、入力され
た文字情報を記憶す半導体素子、ディスク、フロッピー
ディスクなどの記憶手段である。4は、入力された文字
情報を編集するための、マウス、アイコン、機能キーな
どの編集手段である。編集自体は後で述べる制御装置で
行われるが、ここでいう編集手段は制御装置の実行の契
機を与えたり、ユーザが編集を行い易くするために設け
られた手段である。5は入力されたり、編集された文字
情報を表示するためのCRTなどの表示手段である。6
は入力された文字情報を言語解析するための、辞書、テ
ーブル、言語解析プログラムなどからなる言語解析手段
である。
7は、ルールや対象領域の専門用語などのインデックス
抽出のための知識により、インデックスを抽出する手段
である。8は抽出されたインデックスを文中での使用状
況などの他の情報とともに編集し、見易い形にして表示
し、インデックスの取捨選択、追加、変更などを行える
ようにしたインデックス用のエディタである。9は入力
された文字情報や、言語解析のためのバッファとなる一
時記憶手段である。一般に制御装置に密接したRAMが
利用される。lOはこれらの各手段を制御するCPUな
どの制御手段である。
第2図はワープロのマニュアルの文章を表示手段に表示
した例を示す図である。ワープロの文章は数百ページに
及ぶものもあるが、ここでは、本発明の詳細な説明する
のが目的なので図のような1頁の文章で例を示す。
11はタイトルあるいは見出しと呼ばれる文章である。
これは、通常、文書の最初の部分に太字で記述されたり
、章、節などの番号と1行程度の文章から成り立つ場合
が多い。本例では、他の部分より大きいサイズの文字を
用いて、タイトル文であることを強調している。12は
本文であり、見出しに対する内容の説明、操作の方法な
ど詳細な記載がなされている部分である。13は表示装
置の表示画面のイメージを表す例を示した図である。
第3図は本発明の機能ブロックの概略フロー図である。
14は入力された文字情報を形態素解析、構文解析、意
味解析、文脈解析などして文章を装置が解釈できる形式
に変えて記憶する言語解析処理モジュールである。15
は抽出ルールや専門用語辞書などのインデックス抽出用
の知識を用いて文字情報の中からインデックスの候補と
なり得る部分を抽出するモジュールである。16は抽出
されたインデックスの候補を編集し、文中での使用の状
態を確認しながら、インデックス候補の取捨選択、追加
、変更などの処理を行うインデックスエディタ処理のモ
ジュールである。17は抽出されたインデックスの候補
の情報に基づいて、編集を行ったり、出力を行うモジュ
ールである。
以後これらの各モジュールに対し、第2図に上げた例文
を用いて具体的に説明を行う。
言語解析処理モジュールは、まず、記憶手段あるいは一
時記憶手段に蓄えられた文書から、言語解析手段で処理
できる単位の文を切り出し、−時記憶手段に読み込む。
例えば、今、言語解析手段は1文を単位として処理する
ものと仮定すると、制御手段は第2図の例文の第1番目
の文章である「漢字を1文字ずつ入力する」を−時記憶
手段に呼び込む。次に、形態素解析、構文解析、意味解
析などの言語解析が行われる。ここでは、形態素解析の
例を示し、どのような過程が必要であるかの原理を示す
呼び込まれた文章は、通常、文章の頭のほうの文字から
順に言語解析手段にある言語解析用辞書と参照される。
第4wJがその辞書の例を表した図である。これは、入
力例文の形態素解析を行うのに必要な見出しに限った辞
書になっている。18は見出しの情報を表す項目である
。19はその読みの情報を表す項目である。20はその
品詞情報を表す項目である。21は見出し項目の弁別番
号である。
今の場合、入力文の頭文字は「漢」であるので、「漢」
と辞書との照合がなされるが、照合に失敗する。そこで
、照合する入力文の文字を1文字ずつ増やし照合を繰り
返す。例えば、次の段階では「漢字」までを切り出して
、辞書と照合する。今度は、照合に成功する。成功した
場合は、辞書の読みの情報、品詞情報、あるいは、見出
しの弁別番号を一時記憶手段、あるいは、記憶手段にス
タックし、再び入力文字列の次の文字から辞書との照合
を繰り返す。これにより、各形態素が決定される。また
、形態素と形態素間の接続関係表を用いることにより解
析した文は「漢字を/1文字ずつ/入力する」のように
文節単位に分類することもできる。
第5図は言語解析された各形態素の情報を出現順に並べ
た例を表した図である。22は各形態素の画面バッファ
上の開始位置であり、23はその終了位置である。24
は各形態素の弁別番号であり、25は各形態素の出現頻
度情報である。26は文節の切れ目であることを示す項
目であり、「文節」はそこまでの形態素が連なって一つ
の文節を形成することを意味している。
次にインデックス抽出処理モジュールの説明に移る。イ
ンデックスの抽出方法の一つとして、専門用語辞書を用
いる方法で例を示す。第6図は、専門用語辞書の構造及
び内容の例を示した図である。27は専門用語辞書の標
準見出し情報の項目であり、通常、検索に便利なように
ソートされている。28は見出しの読み情報の項目であ
る。29は見出しの品詞情報の項目である。30は見出
しの句のゆらぎ表記の情報である。この項目の中の数字
は見出しの形態素の番号を表している。数字の後ろの「
+」記号は、数字で示される形態素の次の位置に、「+
」の次に示されている文字情報が追加される可能性があ
ることを意味している。
31は揺らぎ表記情報の項目である。項目の数字は形態
素の番号を示しており、数字に続く中点以下の文字列が
来る可能性のあることを意味している。この図の場合で
いうと、ウィンドウはウィンドウと書かれることもある
ことになる。 次に、言語解析された結果は、専門用語
辞書の標準見出し、あるいは、句の揺らぎあるいは、揺
らぎ表記情報で生皮された見出しと照合され、照合結果
が記憶装置に蓄えられる。第2図の入力文の例では、「
変換」、「次候補」、「音訓の入力」、「ウィンドウ」
の部分が抽出される。
第7図はこのようにして得られた、インデックスの候補
を蓄積したバッファの構造の例を示したものである。3
2は出現頁情報を表す項目である。
33はインデックス候補見出しの出現行数である。
34.35はそれぞれインデックス候補文字列の始まり
と、終わりの位置情報を表す項目である。
36はインデックス見出しの出現頻度情報の項目である
。この情報が2時少の場合は、32から34までの項目
に複数個のインデックスが存在することになり、本図で
はそれをコンマで区切って示している。37はインデッ
クス候補の見出し情報の項目である。38はインデック
ス候補見出しの読み情報の1文字を代入したものである
。38はインデックスの1文字インデックスを50音の
行単位で取る場合は、50音の行の代表文字に置き換え
られる。
次に、本発明の特徴であるインデックスエディタ処理の
説明を行う。第8図はインデックスエディタの表示例の
図である。本エディタは通常のエディタと同様、入力編
集が行えるようになっている。本インデックスエディタ
は、表形式になっており、縦線で項目の区切りを示して
いる。項目から別の項目へ移る場合は、編集手段に機能
定義された機能キーやマウスなどを利用するようになっ
ている。本発明では、「機能キー+−g、r機能キー+
←」、「機能キー+i」、「機能キ+↓」の4種類のキ
ー操作で表の行又は欄を移動できるように定義しである
39は本発明装置のユーザが見出し項目が必要であるか
いなかを判断し、不必要な場合は、編集手段の機能キー
「F2」または入力手段で、不要の記号「#」を入力で
きるようにした要/不要記入項目である。「#」がない
場合は、必要であると見なされる。ただし、無印の場合
の定義、機能キーの種類、要/不要の記号はこれに限定
するものではない。
まf:、、40はインデックスの見出しである。インデ
ックスに修正が必要な場合は修正することができるよう
になっている。41は索引の最終形態の1文字インデッ
クスである。同字異音語などで本発明のインデックス抽
出手段が間違って辞書検索を行った場合などに、修正を
行う。42はインデックス見出しの出現ページ5である
。この項目は、インデックス見出しの修正や追加があっ
た場合のみ入力が可能なようになっている。43はイン
デックスエディタの項目の識別のための欄であり、44
がインデックス見出しの内容になっている。
45はインデックスを抽出する元の文書ファイルの名前
である。46はインデックスエディタのファイルの名前
である。47は、インデックスエディタの操作方法のガ
イダンスの例を表した図である。ガイダンスはウィンド
ウの機能をもった表示装置では、必要な場合にのみ、ウ
ィンドウに表示させて確認することもできる。
インデックスエディタを表示した状態で、Flキーを押
すと現在エディタで指示している行のインデックス見出
しの文中での使用状況を表示することができる。今、変
換の行を指示しているとすると仮定する。
第9図はrFIJキーを押しKWIC(KeyWord
  In  Context)画面に移ったときの表示
例の図である。53はインデックスの見出しと、出現頻
度、出現順位を表示するガイダンス画面領域である。5
4はKWIC表示画面領域である。55は原文章表示画
面領域である。
56は操作ガイダンス画面領域である。
48はエディタ画面で、指示されたインデックス見出し
の候補である。49はインデックスの内、KWIC表示
している見出しの出現順位、出現頻度を表わす情報であ
る。図中のlは出現順位を、2は出現頻度を示している
。50はキーワードである。見易くするため、キーワー
ドの前後はスペースを挿入しである。51,52はそれ
ぞれキーワード前、キーワード後の文字列である。通常
キーワードを含め1行に収まる分量をKWICとして表
示する。
55はKWICだけではインデックスの取捨選択が決定
できないときさらに、本文を参照し、判断支援を行うた
めの画面である。インデックスの部分は反転表示などの
他の部分と異なる表示の方法が取られている。また、イ
ンデックスの部分にカーソルを合わせると、KWIC画
面、ガイダンス画面の表示がそれと連動して変化するよ
うになっている。以上のように、インデックスの一寛表
と本文を見比べながらインデックスの重要性を判断し、
取捨選択して行くのが本発明の特徴となっている。
第10図にインデックスエディタ処理モジュールの詳細
処理フローを示す。57は第7図に示すインデックス抽
出結果のファイルを参照するモジュールである。37の
項目を参照することにより、4個のインデックス候補が
あることが分かる。もしインデックスの候補があれば、
第8図の43のインデックス−覧表のタイトル部分及び
インデックス−覧表の表の枠を作成する。これは、タイ
トル及び表の枠の部分をあらかじめ、項目を定義して記
憶手段に記憶しておき、これを呼び出すことで実現でき
る。この処理モジュールが58である。
次に、第8図の見出しの並び順はインデックスの出現順
の並びになっているので、−覧性を良くするために、読
みのインデックス及び見出しで、たとえば50音順に、
ソートを行う。先程58の処理でいれたタイトルの項目
に、ソートした第8図の相当項目の内容を書き込む。例
えば、「インデックス」というタイトルの項目には37
の内容を入れる。32の出現ページを入れるときは、も
し出現ページが同一であるなら、1個のみを42の項目
に書き出す。この処理モジュールが59である。この書
き込みの処理は、見出し及び項目が終了するまで繰り返
される。このとき、見出しが変化する毎に行の数を1つ
だけ増加させる。この処理モジュールが60である。
書き込む見出し、及び項目が終了したら、エディタファ
イルの表示処理の操作により、−覧表を呼び出す。この
処理モジュールが62である。63は表示されたインデ
ックスエディタ画面のどの列の指示かあるかを調べるモ
ジュールである。もし列の指示があれば、あらかじめ制
御装置に記憶されている各列の処理に入る。例えば「要
/不要」の欄であれば、「#」かF2キーが押されるの
を待ち押されたら、「#」を表示するようになっている
。この処理モジュールが64であり、F2、#以外のキ
ーが押された場合は、注意を促すようになっている。
列選択がない場合は、最初の見出しの、要/不要欄を指
すようになっている。もし、要/不要以外の列、例えば
、インデックスの列が指示された場合は、枠エディタの
機能が働くようになっている。この処理モジュールが6
5であり、この処理は列処理が終了するまで繰り返され
る。この処理が66である。列処理を終了すれば、イン
デックスエディタの処理を終了し、編集・出力処理に移
る。
取捨選択の判断ができかねる場合は、インデックス候補
の含まれる本文を確認しながら、要/不要の選択を行う
ことができる。67はrFIJキーが押されるのを待ち
、KWIC画面に移行し、KWICの表示領域に、イン
デックス候補見出しをキーとして、キーの前後の文字列
を定義された領域に表示するルーチンである。「Fl」
が押されない場合は、終了するか、他の処理に移るかの
分岐を行うのもこのモジュールである。「Fl」キーが
押された場合、通常、カーソルはKWIC画面の先頭の
位置を指示するように設計しである。
ここで、ユーザの画面変更要求のキー、例えば「機能十
↓」の入るのを待つ。この処理モジュールが68である
。画面の変更処理があれば、例えば、「機能+↓」が押
されれば、本文画面に移る。
本文画面は、KWICに表示されているインデックスの
本文中の位置が本文画面の上から3行目に来るように本
文文章の表示を行い、画面エディタの機能をもつように
する。本文中のインデックス見出し候補の部分の反転表
示は、第7図の32.33.34.35の情報を利用す
ることにより実現することができる。また、「機能キー
+↑」で、ガイダンス画面に移ったときの処理は次のよ
うになっている。インデックス見出しの部分は、通常、
インデックスエディタの見出しを表示しているが、ここ
にはユーザ指定でインデックス文字列を入力できるよう
になっている。それは、行エディタで実現することがで
きる。また、右上の、インデックスの頻度、出現順位情
報は、第7図の36及び32.33.34.35の情報
から表示することができる。
画面切り替えを行い、インデックスの取捨選択が判断で
きたら、再び、インデックスエディタの画面に戻る。こ
の処理モジュールが70である。
ここで、終了するか否かの判断を行い、終了しない場合
は62へ戻り要/不要のマークを付けるなどのインデッ
クスエディタの処理を繰り返す。この分岐の処理モジュ
ールが71であり、インデックスエディタの一連の処理
を終了するモジュールが72である。
次に編集・出力処理モジュールの説明に移る。
この処理モジュールは、第8図に表現された情報を元に
、最終的なインデックスを作威し、出力するモジュール
である。まず、第8図の要/不要の列を参照し、「#」
マークのある行を削除する。
削除処理を施した結果を元に、指定されたフォーマット
に従い出力する。指定されたフォーマットは記憶装置に
蓄え、ユーザの指定により、パラメータを変え出力でき
るようになっている。その出力例を第12図に示す。7
3は1文字インデックスである。74はインデックス見
出しである。75は出現ページ数である。1文字インデ
ックスは実施例では、辞書のかな1文字で表しているが
意図に応じて50音の行に集約して出すこともできる。
また、本発明では、編集手段をキーボードとカーソルを
用いた実施例で説明したが、他のマウスなどの手段でも
発明に影響はない。
また、実施例では、重ね合わせのないウィンドウシステ
ムを用いたが、表示のフィールドや大きさを変えたり、
重ね合わせのウィンドウシステムを使用しても本発明に
影響はない。
また、操作ガイダンスの表現は、表示のとおりでなくて
も良く、プルダウンメニューなどの方法を用いても本発
明に影響はない。
〈発明の効果〉 本発明の効果は、インデックスの取捨選択を、本文の確
認と結び付けて行うことにより、確実にかつ容易に実行
できるようにした点にある。
また、本文の確認の際に、KWIC表示を設け、早期の
判断を手助けるようにした点でも効果がある。
更に、本文を深く調査したいときには、KWIC画面か
ら、素早く本文の表示画面に移行できるようにしたt;
め、ユーザのインデックス取捨の判断のレベルに応じて
情報を提供できるようにした点でも効果がある。
また、インデックスエディタというインデックスの候補
を一覧できるエディタを作り、削除見出しを決めれるの
で、インデックス登録語数などの制約を考慮して作業を
進められる点でも効果がある。
更に、インデックス候補の出現頻度、出現順位情報を表
示しているので、インデックス取捨選択の重要度の判断
の手助けをする点でも効果がある。
また、専門家の知識を専門用語辞書として蓄えており、
これと、入力文書との照合により、自動的に文書のイン
デックスが抽出できるため、インデックスの抽出作業を
短縮できる点にある。
また、計算機による、文書と知識ベースや辞書との照合
を行っているため1.表記やページ数の抽出ミス、転記
ミスなどを防ぐことができる点でも効果がある。
更に、文書作成の途中であっても、装置を操作し、イン
デックスの抽出状態をみてみるなど、文書作成が終了し
、文章を入力してみてからでないとインデックスの作成
にかかれないという制約を解消する点でも効果がある。
更に、専門家の知識を知識ベース化しているため、専門
家のインデックス抽出のための知識が順次蓄積されると
ともに、専門家間゛や編集者間による差異のない統一的
なインデックスの抽出ができる点でも効果がある。
更に、インデックス抽出にかかわる知識を計算機で処理
できる形で保存しているので、インデックス作成の専門
家と同様の抽出知識を素人でも容易に得ることができ、
装置の使用に拘る人への制約を緩和できる点でも効果が
ある。
また、計算機を利用して解析を行うことができるので、
文書に変更のある場合も間違いなく、早く対応でき、文
書の修正を行い易くした点でも効果がある。
【図面の簡単な説明】
第1図は本発明装置の構成ブロック図であり、第2図は
表示手段に表示されたワープロのマニュアル文書例を示
した図である。第3図は機能モジュールの全体フロー図
であり、第4図は言語解析処理モジュールの辞書の構造
の例を表した図である。第5図は言語解析処理モジュー
ルの言語解析の結果の例を示した図であり、第6図はイ
ンデックス抽出手段の専門用語辞書の構造の例を示した
図である。第7図はインデックス抽出処理で得られた結
果の例を示した図であり、第8図はインデックスエディ
タの表示例の図である。第9図はKWIC画面の表示の
例を示した図であり、第10結果の表示例の図である。 6・・・言語解析手段 7・・・インデックス抽出手段 8・・・インデックス編集手段 14・・言語解析処理モジュール 15・・インデックス抽出処理モジュール16・・イン
デックスエディタ処理モジュール39・・インデックス
エディタの要/不要欄40・・インデックスエディタの
インデックス欄41・・インデックスエディタの読み情
報欄2 3 4 5 3 4 5 インデックスエディタの出現頁欄 KWIC画面のガイダンス表示領域 KWIC画面のKWIC表示領域 KWIC画面の本文表示領域 インデックス中の1文字インデックス インデックス中の見出し インデックス中の出現頁情報 以上

Claims (1)

  1. 【特許請求の範囲】 文字情報を入力する手段と、文字情報を出力する手段と
    、入力された文字情報を記憶する手段と、文字情報を編
    集する手段と、文字情報を表示する手段と、文字情報を
    言語解析する手段と、インデックスを抽出する手段と、
    抽出されたインデックスを対話的に編集する手段と、言
    語解析用の辞書類、解析結果、制御の途中経過、結果な
    どを蓄積する一時記憶手段と、これらの各手段を制御す
    る制御手段を持つ装置において、 1)抽出されたインデックスからインデックスの文書中
    での記述環境が検索できること、2)インデックス抽出
    結果の一覧表に追加、訂正、削除の機能を持たせたこと
    、 3)インデックス抽出結果の一覧表に見出し項目を取捨
    選択する機能を持たせたこと、 4)インデックスの記述状態をKWIC及び原文のいず
    れかあるいは双方で確認できるようにしたこと、 5)インデックスの出現頻度、出現順位を表示すること
    、 により出力するインデックスを制御することを特徴とす
    るインデックス作成支援装置。
JP1269555A 1989-10-16 1989-10-16 インデックス作成支援装置 Expired - Fee Related JPH0769919B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1269555A JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置
US07/596,283 US5276616A (en) 1989-10-16 1990-10-11 Apparatus for automatically generating index
DE69028592T DE69028592T2 (de) 1989-10-16 1990-10-15 Gerät zur automatischen Generierung eines Index
EP90119749A EP0423683B1 (en) 1989-10-16 1990-10-15 Apparatus for automatically generating index

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1269555A JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置

Publications (2)

Publication Number Publication Date
JPH03129562A true JPH03129562A (ja) 1991-06-03
JPH0769919B2 JPH0769919B2 (ja) 1995-07-31

Family

ID=17474011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1269555A Expired - Fee Related JPH0769919B2 (ja) 1989-10-16 1989-10-16 インデックス作成支援装置

Country Status (1)

Country Link
JP (1) JPH0769919B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110908A (ja) * 1994-10-11 1996-04-30 Fujitsu Ltd 索引作成装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63244259A (ja) * 1987-03-31 1988-10-11 Matsushita Electric Ind Co Ltd キ−ワ−ド抽出装置
JPS63286965A (ja) * 1987-05-20 1988-11-24 Fujitsu Ltd 文書作成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63244259A (ja) * 1987-03-31 1988-10-11 Matsushita Electric Ind Co Ltd キ−ワ−ド抽出装置
JPS63286965A (ja) * 1987-05-20 1988-11-24 Fujitsu Ltd 文書作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110908A (ja) * 1994-10-11 1996-04-30 Fujitsu Ltd 索引作成装置

Also Published As

Publication number Publication date
JPH0769919B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
EP0423683B1 (en) Apparatus for automatically generating index
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5579224A (en) Dictionary creation supporting system
JPH02253369A (ja) 電子辞書
JPH0484271A (ja) 文書内情報検索装置
JP2848729B2 (ja) 翻訳方法および翻訳装置
Hollingsworth et al. Retrieving hierarchical text structure from typeset scientific articles–a prerequisite for e-science text mining
JPH03129562A (ja) インデックス作成支援装置
JP2838984B2 (ja) 汎用参照装置
JP2621999B2 (ja) 文書処理装置
Sinclair 4.2 Corpus processing
JP4248549B2 (ja) 機械翻訳編集装置、機械翻訳編集プログラム及び機械翻訳編集方法
JPH0612453A (ja) 未知語抽出登録装置
Woolls From purity to pragmatism; user-driven development of a multilingual parallel concordancer
JPH06195380A (ja) 翻訳支援システムにおける検索結果表示方式
JPH06149790A (ja) 文章作成装置
JPH08297659A (ja) 文字列変換処理方式
JP2924955B2 (ja) 翻訳方法および翻訳装置
JPH0232455A (ja) 項目抽出方式
Tools A Corpus/Annotation Toolbox
JPH06266753A (ja) 文書作成装置
JPH06266765A (ja) 文章検索装置
JPH03129561A (ja) インデックス作成支援装置
JPH03129560A (ja) インデックス作成支援装置
JPH08185401A (ja) 文書検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070731

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080731

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees