JPH09204433A - キーワード設定装置 - Google Patents

キーワード設定装置

Info

Publication number
JPH09204433A
JPH09204433A JP8010125A JP1012596A JPH09204433A JP H09204433 A JPH09204433 A JP H09204433A JP 8010125 A JP8010125 A JP 8010125A JP 1012596 A JP1012596 A JP 1012596A JP H09204433 A JPH09204433 A JP H09204433A
Authority
JP
Japan
Prior art keywords
document
user setting
setting key
index
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8010125A
Other languages
English (en)
Other versions
JP3591109B2 (ja
Inventor
Akio Yamashita
明男 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP01012596A priority Critical patent/JP3591109B2/ja
Publication of JPH09204433A publication Critical patent/JPH09204433A/ja
Application granted granted Critical
Publication of JP3591109B2 publication Critical patent/JP3591109B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザ設定キーを登録時に設定していない登
録文書を検索可能としかつ以後の登録文書を設定済みの
ユーザ設定キーにより検索可能とする。 【解決手段】 登録情報記憶手段1から文書記憶手段2
への文書の登録に際し、登録制御手段6は、指定された
ユーザ設定キーと登録文書のIDを対応付け索引情報と
して索引記憶手段3に登録する。その際、索引記憶手段
3にないユーザ設定キーについては、索引語抽出手段4
が当該ユーザ設定キーを用いて登録済み文書を検索し、
その検索された文書のIDも該ユーザ設定キーの索引情
報として索引記憶手段に記憶する。以後の登録文書につ
いては、索引語抽出手段4で索引語を自動抽出し、その
中に設定済みユーザ設定キーがある場合、該ユーザ設定
キーの索引情報に関し、今回の登録文書のIDも対応付
けて更新登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、索引を用いて文書
を検索する文書検索装置で用いるキーワードを設定する
装置に関し、特に、ユーザが設定するキーワードを扱う
キーワード設定装置に関する。
【0002】
【従来の技術】文書検索装置に文書を登録する際に、文
書にキーワードを設定し、設定されたキーワードを対象
にして検索する方法が知られている。更に、検索キーの
設定の負担を軽くするために、ユーザとの対話や自動処
理によって定められたキーワード(ユーザ設定キー)を
登録文書に設定する装置も考案されている。
【0003】このようなユーザ設定キーを扱う従来公知
の技術としては、次のようなものが知られている。例え
ば、特開平3-252766号公報においては、 ・データ登録時に、既に登録されたキーワードの一覧か
らキーワードを選択して登録データに付与し、データ検
索時にはキーワードの一覧からキーワードを選択して検
索する情報検索システムにおいて、キーワードに利用情
報を付加し、この使用情報を使用して、検索時のキーワ
ード一覧に登録データに付与されたキーワードのみを表
示する方法が開示されている。
【0004】また、特開平4-127371号公報におけるデー
タ登録装置及び方法とデータ検索装置及び方法では、 ・登録キーワードを単語に分割して登録単純キーワード
を生成するとともに、この登録単純キーワードの各々に
対応する登録データのインデックスを記憶する単純キー
ワード転置テーブルと、登録キーワードと登録単純キー
ワードとの対応関係も記憶するキーワード構成テーブル
を設け、このうちのキーワード構成テーブルには、登録
キーワードと登録単純キーワードとの対応関係とともに
登録キーワード内での登録単純キーワードの単位を記録
する技術が開示されている。
【0005】
【発明が解決しようとする課題】特開平3-252766号公報
では、ユーザが設定するキーを一覧として表示されるよ
うに予め用意しておくことを基本としており、自由にキ
ーワードを登録データに設定することができない。ま
た、関連する文書であっても登録時にキーワードを設定
していないと検索することができない。また、特開平4-
127371号公報では、予めキーワードを用意しておく必要
があって、登録時に任意のキーワードの設定はできず、
また登録キーワード内の順位は記憶してあっても範囲や
距離を記録していないため、検索時に何等脈略のないも
の(例えば、登録単純キーワードが別々の段落に出現す
るもの)を検索してしまうといった危険性もあった。
【0006】このように、上記従来装置では、設定する
キーワードを予め用意する必要があり、登録時にユーザ
が任意に設定するキーワードに応じて設定機能を変更す
るような構成ではなかった。また、新規にキーワードを
追加しても既に登録した文書に対してキーワードを自動
的に設定するように構成されてはいなかった。なお、特
開平4-127371号公報には、ユーザ設定キーを構成する語
を自動抽出してキーワードの設定を自動化するという方
法も示唆されてはいるが、この方法は不要な設定を招来
する可能性が高く、実用的ではなかった。
【0007】上述の如く、検索用の索引を有する文書検
索装置に採用される上記従来のキーワード設定方法は、
キーワード設定の融通性に欠け、既に登録された文書や
以後に登録される文書間でのキーワードの関連付けがで
きず、登録時にキーワードを設定しなかった文書につい
ては当該キーワードを用いて検索できず、検索漏れの増
大を免れないという問題点があった。
【0008】本発明は上記問題点を解消し、予め用意さ
れたキーワード以外のキーワードを、登録済み文書と以
後の登録文書の間で関連付けて効率良く設定でき、ユー
ザ設定キーを登録時に設定していない登録済み文書を該
キーにより検索可能とし、かつその後の登録文書に既に
設定済みのユーザ設定キーを反映させて該キーにより該
当文書を検索可能にするキーワード設定装置を提供する
ことを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、登録情報記憶手段に記憶された文書を文
書記憶手段に登録する際、該文書に対して指定されたユ
ーザ設定キーと当該文書の文書IDを対応付け索引情報
として索引記憶手段に登録するキーワード設定装置にお
いて、登録文書から所定の索引語を自動抽出する索引語
抽出手段と、該索引語抽出手段による索引語抽出時に文
字列を解析するために用いる解析辞書を記憶する解析辞
書手段と、文書登録時にユーザ設定キーが指定され、該
ユーザ設定キーが前記索引記憶手段に存在しない場合、
前記索引語抽出手段により登録済み文書から当該ユーザ
設定キーを所定の条件で含む文書を検索し、該検索され
た文書の文書IDと当該ユーザ設定キーを対応付けて前
記索引記憶手段の索引情報に追加する第1の登録処理
と、文書登録時にユーザ設定キーが指定されない場合、
前記索引語抽出手段により当該文書から索引語を自動抽
出し、該索引語中に設定済みユーザ設定キーがある場
合、この時の登録文書の文書IDを用いて当該設定済み
ユーザ設定キーの索引情報を更新する第2の登録処理を
行う登録制御手段とを具備することを特徴とする。
【0010】望ましくは、本発明において、前記登録制
御手段は、前記第1の登録処理時、新たに索引情報に追
加されたユーザ設定キーを前記解析辞書手段に記憶し、
前記第2の登録処理時、前記解析辞書手段に記憶された
ユーザ設定キーを対象として索引語に含まれるか否かを
判定することを特徴とする。
【0011】また、本発明において、前記登録制御手段
は、前記第1の登録処理に係わる前記所定の条件を満た
す文書として、前記文書記憶手段内の前記ユーザ設定キ
ーを含む文書若しくは前記索引語抽出手段で分解した該
ユーザ設定キーの構成語を一文内に含む文書を検索対象
とすることを特徴とする。
【0012】また、本発明において、前記索引語抽出手
段は、登録文書から前記解析辞書手段に記憶されたユー
ザ設定キーについて抽出を行う場合、該ユーザ設定キー
を含むという条件及び該ユーザ設定キーを構成する語を
所定の条件で含むという条件を併用して当該ユーザ設定
キーを抽出することを特徴とする。
【0013】また、本発明において、前記登録制御手段
は、前記索引語抽出手段で分解したユーザ設定キーの構
成語を一文内に含む文書を検索する際、前記索引記憶手
段を参照して探索文書数を限定することを特徴とする。
【0014】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて添付図面を参照して詳細に説明する。図1は、本発
明の第1の実施の形態に係わるキーワード設定装置の概
略構成を示す機能ブロック図である。このキーワード設
定装置は、登録情報記憶手段1、文書記憶手段2、索引
記憶手段3、索引語抽出手段4、解析辞書手段5、登録
制御手段6を具備して構成される。
【0015】登録情報記憶手段1は、登録する文書名、
文書内容、利用者が設定したユーザ設定キー、更新フラ
グを記憶する手段である。文書記憶手段2は、登録され
た文書のID、文書名、索引を更新した日時、文書内容
を記憶する手段である。
【0016】索引記憶手段3は、ユーザ設定キーと索引
語抽出手段4で抽出した自動抽出キーの2種類のキーワ
ードに対応する文書IDを記憶する手段である。このう
ち、ユーザ設定キーに対応する文書IDについては、元
々このキーワードが設定されていたかどうかの状態を示
す情報「:u,:a」についても記憶する。ここ
で、「:u」はユーザ設定キーであることを示し、「:
a」は自動抽出キーであることを示している。
【0017】索引語抽出手段4は、登録文書を解析して
キーワード(自動抽出キー)を抽出する手段である。解
析辞書手段5は、文字列を解析するための情報(品詞、
接続情報)やユーザ設定キーを記憶した辞書手段であ
る。
【0018】登録制御手段6は、文書名とその内容を文
書記憶手段2に登録したり、ユーザ設定キーや自動抽出
キーと文書IDを対応づけて索引記憶手段3に登録する
手段である。この他、登録制御手段6は、登録情報記憶
手段1に記憶された更新フラグがONの時、登録文書に
設定されたユーザ設定キーが索引記憶手段3の索引語に
あるかどうかを判定し、索引語として存在していない場
合には索引記憶手段3の内容の更新と解析辞書手段5へ
のキーワードの追加の処理を行う。
【0019】次に、この装置における文書記憶手段2、
索引記憶手段3及び解析辞書手段5の記憶態様について
具体例を用いて説明する。
【0020】図2は、この装置における文書記憶手段2
の内容の一例を概念的に示す図である。この例は、それ
ぞれNo.1,No.2の文書IDを持つ2つの文書が登録され
た状態を示しており、これら2つの文書には、上記文書
IDの他、文書名、文書毎に索引を更新した日時、文書
の内容が各々同図に示す態様で記憶されている。
【0021】図3は、文書記憶手段2に記憶された上記
文書(図2に参照)に関する索引記憶手段3の内容の一
例を概念的に示す図である。この索引記憶手段3は、索
引語と該索引語に関連する文書ID列の関係とを対応付
けた索引情報を記憶しており、この索引情報は、ユーザ
設定キーと自動抽出キー毎に区別して記憶される。
【0022】図3(a)は、索引記憶手段3に記憶され
たユーザ設定キーに関する索引情報の一例を示したもの
である。この例では、文書ID=1の文書に対しては、
当該文書の登録時、利用者が、「□□新聞」,「xx
社」,「電子週刊誌」の3つのキーワードを設定し、同
様に、文書ID=2の文書に対しては、「○○誌」,
「WWW」の2のキーワードを設定した時の結果を示し
ている。図3(a)において、文書ID欄の「:」の後
の文字は抽出フラグである。すなわち、同欄の文書ID
の後の「:u」は、ユーザ設定キーであることを意味す
る。抽出フラグとしては、この他、「:a」があり、同
フラグがついた場合、自動抽出によるキーであることを
意味している。ここで、「:u」,「:a」はあくまで
も説明のため表記であって、実際には文書IDの内部ビ
ット列の特定ビットの状態で識別するように構成され
る。
【0023】図3(b)は、文書記憶手段2に記憶され
た上記文書(図2参照)の内容から索引語抽出手段4に
よって自動抽出されたキー(自動抽出キー)に関する索
引情報の一例を示したものである。この索引情報は、本
実施の形態に係わる索引語抽出手段4において、登録文
書の文書内容から名詞性の単語を自動的に抽出するよう
に構成した場合の例である。例えば、文書ID=1の文
書からは、「インターネット」,「電子」,「週刊
誌」,「発行」,「文章」,「画像」,「音声」,「情
報」,「無料」,「発信」等の名詞性の単語が抽出さ
れ、これらの単語と文書ID=1が関連付けられて記憶
されている。同様に、文書ID=2の文書からは、「ワ
ールド」,「ワイド」,「ウェッブ」,「WWW」,
「インターネット」,「利用」,「加速」等の名詞性の
単語が抽出され、これらの単語と文書ID=2が関連付
けられて記憶されている。
【0024】図4は、この装置における解析辞書手段5
の内容の一例を概念的に示す図である。この解析辞書手
段5の記憶情報は、文書登録時に、索引語抽出手段4が
当該登録文書から索引語を抽出する際の文書解析用の辞
書として用いられる。
【0025】図4(a)は、この種の解析辞書の代表的
な例として、日本語の文章に一般的に出現する単語につ
いての解析情報を記憶した例を示したものである。日本
語の文章の解析にあたっては、更に、接続語についての
解析情報を記憶した接続語テーブルが必要であるが、こ
のテーブルについては周知技術の適用範囲であるため、
ここでは詳しい説明を省略する。
【0026】この解析辞書では、見出し、品詞、読み、
コスト等の情報を一組にして、これを10万語以上記憶
している。品詞情報は、単語間の接続判定や索引語抽出
のために用いる。コスト情報は、接続可能な複数な解析
結果からコストが最小となるものを選択する際のコスト
計算に用いる。
【0027】この他、本装置の解析辞書手段5には、ユ
ーザ設定キーとその登録日時が記憶されており、これら
記憶情報は、その後における文書の登録に際して、利用
者からのユーザ設定キーの設定がない場合の当該登録文
書に対するユーザ設定キーの自動付与のために用いられ
る。
【0028】図4(b)は、文書記憶手段2に記憶され
た上記文書(図2参照)を扱った場合におけるユーザ設
定キーとその登録日時の記憶態様を示すものである。こ
の記憶態様は、「□□新聞」,「○○誌」,「xx
社」,「WWW」,「電子週刊誌」というキーワード
が、ユーザ設定キーとして登録されていることを意味し
ている。ここで、ユーザ設定キーの登録日時は、図4
(a)に示した辞書の保守に利用される。
【0029】次に、本実施の形態に係わる装置における
キーワード設定時の概略動作について、図5及び図6に
示すフローチャートを参照して説明する。この装置での
新たな文書の登録に際し、利用者は、図示しない入力手
段を用いて、文書情報記憶手段1に上記登録しようとす
る文書の文書名とユーザ設定キーと文書内容とを入力
し、更には、ユーザ設定キーに関連する索引や辞書の更
新を行うかどうかの更新フラグを指定する(ステップ
1)。
【0030】上記入力及び指定が終了すると、登録制御
手段6は、上記入力されたユーザ設定キーと、上記登録
文書に対応する文書IDと、上記ユーザ設定キーに対す
る「抽出フラグ=:u」とを関係付けて、これらを索引
情報として索引記憶手段3に登録する。また、その際、
登録制御手段6は、後述するステップ7の処理のため
に、上記ユーザ設定キーが既に登録されていたかどうか
の状態「新規/既存」のいずれかに対応する情報を自ら
記憶する(ステップ2)。
【0031】このステップ2の処理後、登録制御手段6
は、入力された文書ID、文書名、索引の更新日時、文
書内容を文書記憶手段2に登録し(ステップ3)、更に
は上記文書内容を索引語抽出手段4に渡す(ステップ
4)。その後、索引語抽出手段4は、図4(a)及び
(b)に示すような辞書から構成される解析辞書手段5
を参照して、以下の条件(A)〜(C)を満たす語を索
引語として抽出する。
【0032】(A)図4(b)のユーザ設定キーについ
ては、全て名詞性とみなし、上記登録文書の内容に含ま
れていればこれを抽出する。
【0033】(B)図4(a)の単語については、名詞
性の(品詞が名詞類やサ変化名詞等)を自動的に登録文
書より抽出する。
【0034】(C)辞書に登録されていない文字列につ
いては、英数字やカタカナ文字の連続する部分について
のみ、自動的に登録文書より抽出する。
【0035】これら抽出した索引語は、ユーザ設定キー
か、自動抽出キーかの種別をつけて、索引語抽出手段4
で一時的に記憶した後、登録制御手段6に転送する(ス
テップ5)。
【0036】引き続き、登録制御手段6は、上記抽出さ
れたキー群と文書IDを対応付け、これらを索引情報と
して索引記憶手段3に登録する(ステップ6)。この
時、登録制御手段6は、索引語に付けられた上記キー種
別情報を基にして索引記憶手段2のどちらの索引(ユー
ザ設定キーの索引か自動抽出キーの索引)に登録するか
を判断する。ここでもし、英数字やカタカナ語がユーザ
設定キーとして解析辞書手段5に登録されている場合
〔例えば、「WWW」が解析辞書手段5に登録されてい
た場合〕、ユーザ設定キーと同じものが自動抽出キーと
して抽出される。この場合には、ユーザ設定キーと自動
抽出キーのそれぞれに対応する索引に追加される。更
に、ユーザ設定キーについては、自動抽出の意味を示す
フラグ「:a」を文書IDに付加して登録する。
【0037】次いで、登録制御手段6は、ステップ2で
記憶したユーザ設定キーに関する「新規/既存」の状態
を調べ、ユーザ設定キーが索引記憶手段3に索引語とし
て存在していたかどうかを判定する(ステップ7)。
【0038】ここで、全てのユーザ設定キーが索引語と
して存在していた場合(ステップ7YES)、処理を終
了する。これに対して、ユーザ設定キーの一つでも索引
語として存在していなかった場合(ステップ7NO)、
次いで、登録制御手段6は、登録情報記憶手段1の更新
フラグを調べ、ユーザ設定キーに関連する索引や辞書の
更新の指定があるかどうかを調べる(ステップ8)。こ
こで、上記指定がなければ(ステップ8NO)、そのま
ま処理を終了する。
【0039】一方、ユーザ設定キーに関連する索引や辞
書の更新の指定があった場合(ステップ8YES)、更
に、登録制御手段6は、ユーザ設定キーを登録日時とと
もに解析辞書手段5に登録する(ステップ9)。
【0040】その後、登録制御手段6は、文書記憶手段
2に既に登録済みの文書に対して上記ユーザ設定キーに
関連する文書を検索し、この検索で見つかった文書につ
いて「ユーザ設定キー、文書ID、抽出フラグ=:a」
を関係付け、これを索引情報として索引記憶手段4に追
加登録する(ステップ10)。
【0041】図6は、上記ステップ10の処理の詳細な
フローチャートを示している。以下、同図を参照して、
キーワードの更新処理について更に詳しく説明する。上
記ステップ9において、ユーザ設定キーを登録日時とと
もに解析辞書手段5に登録した後、登録制御手段6は、
上記ユーザ設定キーを索引語抽出手段に渡す(ステップ
101)。
【0042】ここで、索引語抽出手段4は、解析辞書手
段5を参照してそのユーザ設定キーを構成する語(構成
語)を抽出し、この構成語を登録制御手段6に返す(ス
テップ102)。
【0043】次いで、登録制御手段6は、ユーザ設定キ
ー毎にユーザ設定キー自身やその構成語を含む文書を文
書記憶手段1より検索し、該検索結果をユーザ設定キー
毎にまとめて検索結果テーブル(例えば、登録制御手段
6の内部に設けられる)に格納する(ステップ10
3)。この格納結果テーブルの内容の一例を図15に示
している。なお、ステップ103での文書の検索におい
ては、上記ステップ2で登録した文書は検索対象から除
外する。
【0044】ステップ103の文書検索において、ユー
ザ設定キーあるいはその構成を含む文書が既に存在して
いれば、当該検索完了後、上記検索結果テーブルの各行
には、ユーザ設定キー、該ユーザ設定キーの構成語、関
連する文書IDのリストが記憶されていることになる。
【0045】そこで、登録制御手段6は、上記ステップ
103での検索終了後、検索結果テーブルに検索結果が
格納されたかどうかを判断する(ステップ104)。こ
こで、検索結果が格納されていない場合(ステップ10
4NO)、ステップ105以降の処理をスキップし、処
理を終了する。一方、検索結果が格納されていない場合
(ステップ104YES)、引き続き、登録制御手段6
は、上記検索結果テーブルより1行を取り出し(ステッ
プ105)、この1行の情報について、ユーザ設定キー
やその構成語が所定の条件で出現するかどうかを判定す
る(ステップ106)。ここで、所定の条件としては、
まず、ユーザ設定キーを含むという条件を用いる。所定
の条件で出現するかどうかは、ユーザ設定キーに関連す
る文書ID毎に記憶する。
【0046】ここで、ユーザ設定キーやその構成語が所
定の条件で出現していなければ(ステップ106N
O)、処理をステップ108へと進める。一方、ユーザ
設定キーやその構成語が所定の条件で一つでも出現して
いれば(ステップ106YES)、登録制御手段6は、
ユーザ設定キーに関連すると記録された文書について該
ユーザ設定キーと検索された文書IDと抽出フラグ「:
a」とを関係付けて索引情報として索引記憶手段3に登
録する(ステップ107)。その際のユーザ設定キーに
関する抽出フラグ「:a」は、索引語はユーザ設定であ
るが、設定自身はユーザ設定ではなく自動抽出であるこ
とを意味している。
【0047】その後、登録制御手段6は、検索結果テー
ブルの全てについての処理が完了したかどうかを判定し
(ステップ108)、処理が完了していれば(ステップ
108YES)、処理を終了し、処理が完了していなけ
れば(ステップ108NO)、完了するまでステップ1
05以降の処理を継続する。
【0048】次に、実際の例を用いて各構成部の動作を
説明する。ここで、例えば、文書記憶手段2に図2に示
すような内容の文書1及び文書2が登録済みの状態で、
更に、図7に示すような文書名と内容を持つ文書を新規
に登録する場合について、図5に示すフローチャートに
沿って各ステップ毎に説明する。
【0049】この場合において、上記ステップ1で、こ
れから登録しようとする文書(図7参照)に対して、ユ
ーザ設定キーとして「インターネット」と「情報発信」
を設定し、ユーザ設定キーに関連する索引や辞書の更新
を行うことを指定した(更新フラグをONに設定した)
ものとする。この場合の登録情報記憶手段1の内容は、
図8に示す如くとなる。
【0050】ステップ2において、登録制御手段6は、
ユーザ設定キーと文書IDと「抽出フラグ=:u」を索
引記憶手段3に登録する。この登録後における索引記憶
手段3のユーザ設定キーに対応する部分の内容の一例を
図9に示す。
【0051】この登録にあたっては、ユーザ設定キーが
索引記憶手段3に存在していれば文書IDの追加だけで
良い。ユーザ設定キーが索引記憶手段3に存在していな
い場合は、新たに登録される索引情報は索引語の辞書式
順序が昇順になるような位置に挿入される。この例の場
合、ユーザ設定キー「インタネット」,「情報発信」は
存在していないので、これら両ユーザ設定キーに関し
て、「インターネット→3:u」、「情報発信→3:
u」という索引情報が「WWW」と「電子週刊誌」とい
う索引語の間に挿入される。また、この索引語の挿入に
関連して、登録制御手段6は、その後のステップ7での
判定のために、上記「インターネット」と「情報発信」
がそれぞれ「新規」登録であったことを自ら記憶/保持
する。
【0052】ステップ3において、登録制御手段6は、
入力文書IDと索引の更新日時と文書内容とを文書記憶
手段2に登録する。この例の場合における登録後の文書
記憶手段2の内容は図10に示す如くのものとなる。ス
テップ4において、登録制御手段6は、図8に示す文書
内容を索引語抽出手段4に渡す。
【0053】ステップ5において、索引語抽出手段4
は、上記文書内容に対して解析辞書手段5を参照して索
引語の抽出を行い、この索引語を登録制御手段6に返
す。このステップ5の処理において、索引語抽出手段4
は、図4(a),(b)に示すような辞書内容を有する
解析辞書手段5を参照して、名詞性の語を索引語として
抽出する。
【0054】具体的に、図4(b)に示すユーザ設定キ
ーについては全て名詞性とみなし、該ユーザ設定キーが
文書内容に含まれていれば抽出する。また、図4(a)
に示す単語については、名詞性のもの(品詞が名詞やサ
変名詞等)を抽出する。更に、上記辞書に登録されてい
ない文字列については、英数字やカタカナ文字の連続す
る部分については、自動的に抽出する。
【0055】抽出した索引語は、ユーザ設定キーか自動
抽出キーかの種別を付加して、索引語抽出手段4で一時
的に記憶する。この例の場合において、図8に示す登録
文書の文書内容から抽出される索引語の一例を示したも
のが図11である。この例の場合、図10に示す文書内
容には、図4(b)に示すユーザ設定キーが含まれてい
なかったので、抽出した索引語の種別は全て「自動抽
出」になっている。
【0056】ステップ6において、登録制御手段6は、
上記抽出された図11に示す如くのキー群と文書ID
(=3)を対応付けて索引記憶手段3に登録する。この
登録は、ユーザ設定キーと自動抽出毎に行う。この例の
場合、ユーザ設定キーは抽出されていないので、自動抽
出キーに関連する索引だけを更新する。
【0057】この登録後の索引記憶手段3の内容の一例
を図12に示している。ユーザ設定キーが抽出されなか
ったというこの例の条件に対応して、図12では、索引
記憶手段3の自動抽出キーに対する内容例のみを示して
いる。なお、図11に示すような結果で抽出された索引
語が自動抽出キーとして索引記憶手段3に存在していれ
ば、この既に存在している索引語に対して文書IDのみ
を追加する。また、上記のような索引語が存在していな
ければ、抽出された索引語と文書ID(=3)の関係を
新たに登録する。
【0058】ステップ7において、登録制御手段6は、
この例の場合のユーザ設定キーである「インターネッ
ト」と「情報発信」の全てが索引記憶手段3に索引語と
して存在していたかどうかを判断する。この例では、上
記ステップ3において、これら両ユーザ設定キーが「新
規」登録であると記憶しておいたため、登録制御手段6
は、この記憶情報を参照してステップ8へと処理を進め
る。
【0059】ステップ8において、登録制御手段6は、
ステップ1で設定された登録情報記憶手段1の更新フラ
グを調べ、ユーザ設定キーに関連する索引や辞書の更新
の指定があるかどうかを調べる。この例の場合、更新フ
ラグがONに設定されているため、処理をステップ9に
進める。
【0060】ステップ9において、登録制御手段6は、
ユーザ設定キー「インターネット」と「情報発信」と
を、登録日時とともに解析辞書手段5に登録する。この
登録は、ユーザ設定キーの辞書内に対して行われる。登
録後の解析辞書手段5の内容の一例を図13に示してい
る。
【0061】ステップ10において、登録制御手段6
は、登録済みの文書に対してユーザ設定キー「インター
ネット」と「情報発信』に関連する文書を検索し、検索
された文書に関しては、「ユーザ設定キー、文書ID、
抽出フラグ=:a」の情報要素によって成る索引情報を
索引記憶手段4に追加する。
【0062】次に、この具体例に関する上記ステップ1
0でのより詳細な動作を、図6に示すフローチャートに
沿って各ステップ毎に説明する。ステップ101におい
て、登録制御手段6は、まず、ユーザ設定キー「インタ
ーネット」と「情報発信」を索引語抽出手段4に渡す。
【0063】ステップ102において、索引語抽出手段
4は、解析辞書手段5を参照して上記ユーザ設定キー
「インターネット」と「情報発信」の構成語を抽出し、
登録制御手段6に返す。この例の場合における上記ユー
ザ設定キーから抽出された構成語の内容を図14に示し
ている。同図に示すように、ユーザ設定キー「インター
ネット」からは構成語が抽出されないものの、ユーザ設
定キー「情報発信」からは「情報」と「発信」という構
成語が抽出される。
【0064】ステップ103において、登録制御手段6
は、索引語抽出手段4から返送された構成語の情報等を
基に、上記ユーザ設定キー毎にユーザ設定キー自身やそ
の構成語を含む文書を検索し、その検索結果をユーザ設
定キー毎にまとめて検索結果テーブルに格納する。ここ
での文書検索においては、ステップ2で登録した文書は
検索対象から除外される。従って、この例の場合は、図
2に示した文書1と文書2のみを対象として、上記ユー
ザ設定キーやその構成語を含む文書を見つけるための全
文探索が行われる。
【0065】上記検索結果テーブルは、例えば、登録制
御手段6の内部に設けることができる。図15は、この
例の場合における上記全文検索後の検索結果テーブルの
内容の一例を示している。同図の例においては、ユーザ
設定キー「インターネット」に対しては、文書IDが1
と2の文書が検索され、「情報発信」に関しては文書I
Dが1の文書が検索された様子を示している。
【0066】ステップ104において、登録制御手段6
は、上記検索結果テーブルに検索結果が格納されたかど
うかを判定し、検索結果が格納されていない場合は処理
を終了する。この例の場合、図15に示したように、検
索結果が格納されているので、ステップ105の処理に
進む。
【0067】ステップ105において、登録制御手段6
は、検索結果テーブルより1行の情報(ユーザ設定キー
と該キーに関連する文書IDのリスト)を取り出す。こ
の例の場合、図15に示す検索結果テーブルから、No.1
の行に相当する、『ユーザ設定キー「インターネッ
ト」:文書ID=(1,2)』というリスト情報がまず
取り出される。
【0068】ステップ106において、登録制御手段6
は、そのリスト情報を基に、ユーザ設定キーやこの構成
語が所定の条件で出現するかどうかを判定し、その判定
結果を検索結果テーブルの文書IDに対応付けて記憶す
る。この回の上記No.1の行のリスト情報の処理では、
「インターネット」というユーザ設定キーは文書IDが
1と2の文書に共に含まれるとの判定結果を得て、その
判定結果を、当該検索結果テーブル上に、例えば図16
のNo.1の行に示すような態様で記憶した後、処理をステ
ップ107に進める。
【0069】ステップ107において、登録制御手段6
は、ユーザ設定キーに関連すると記憶された文書につい
て、このユーザ設定キーとこれに関連する文書ID:a
とを索引記憶手段3に登録する。図17は、この例の場
合における索引記憶手段の内容の一例を示したものであ
り、上記ユーザ設定キー「インターネット」に関する情
報は、同図のNo.5の行に登録されている。
【0070】このNo.5の行の情報は、ユーザ設定キー
「インターネット」に関しては、文書IDが3の文書登
録時にユーザ設定されたものであり、しかも、その登録
時に既に登録されていた文書IDが1と2の文書から自
動抽出されたキーであることを示している。
【0071】ステップ108において、登録制御手段6
は、検索結果テーブルの全ての情報を処理したかどうか
を判定する。この回の処理に際して、検索結果テーブル
のNo.2の行が残っているとの判定結果に従って、処理を
ステップ105へ戻す。
【0072】ステップ105において、登録制御手段6
は、検索結果テーブルより次の1行を取り出す。この回
の処理では、図15に示すような内容の検索結果テーブ
ルから、No.2の行に相当する、『ユーザ設定キー「情報
発信」:文書ID=(1)』というリスト情報が取り出
される。
【0073】ステップ106において、登録制御手段6
は、そのリスト情報を基に、ユーザ設定キーやこの構成
語が所定の条件で出現するかどうかを判定し、その判定
結果を検索結果テーブルの文書IDに対応付けて記憶す
る。この回の上記No.2の行のリスト情報の処理では、
「情報発信」というユーザ設定キーは文書IDが1の文
書に含まれないとの判定結果を得て、その判定結果を、
検索結果テーブルに、例えば図16のNo.2の行に示すよ
うな態様で記憶した後、処理をステップ108に進め
る。
【0074】ステップ108において、登録制御手段6
は、上記検索結果テーブルの全ての情報を処理したかど
うかを判定する。この回の処理では、検索結果テーブル
のNo.2の行まで全て完了しているため、処理を終了す
る。
【0075】このように、第1の実施の形態では、上記
ステップ1からステップ3の処理において、文書の登録
に際し、ユーザ設定キーを指定すると、このユーザ設定
キーと登録文書の文書IDが対応付けられて索引情報と
して登録されるが、この登録処理に付随して、上記ステ
ップ7及びステップ8の処理で、索引記憶手段3に記憶
されていないユーザ設定キーがあり、かつこのユーザ設
定キーについて、関連する索引情報や解析辞書の更新を
行う旨の指示があると判定された場合、ステップ9でま
ず上記ユーザ設定キーを解析辞書に記憶した後、更にス
テップ10で、上記ユーザ設定キーを用いて既に登録済
みの文書の検索を行い、該ユーザ設定キーを含む文書が
検索された場合、この文書の文書IDも上記ユーザ設定
キーと対応付けて索引情報として登録する。
【0076】従って、利用者が登録時に設定したキーワ
ード(上記の例では、「インターネット」)に対して該
設定キーワードに関連する登録済みの文書IDも索引記
憶手段3に記憶され、この設定キーワードに対して、過
去に登録した文書の文書IDが索引付けられることにな
る。これにより、ユーザ設定キーを登録時に設定してい
ない文書も、そのユーザー設定キー及びその関連語を含
む文書であればこのユーザ設定キーを用いて検索可能で
あり、ユーザ設定キーによる検索漏れを大幅に低減でき
る。
【0077】また、その後に登録される文書について
は、上記ステップ4からステップ6の処理において、登
録文書の文書内容から索引語抽出手段4により索引語を
自動抽出し、この抽出された索引語を登録文書の文書I
Dと対応付けて索引情報として登録する中で、該抽出さ
れた索引語の中に、それ以前に上記解析辞書手段5のユ
ーザ設定キーエリア内に登録されたユーザ設定キーが存
在する場合、索引記憶手段3における当該ユーザ設定キ
ーの索引情報に関して、今回登録する文書の文書IDも
対応付けるように更新登録を行う。これにより、ユーザ
設定キーを利用者が設定しなくとも、キーワード設定装
置が自動的にそのユーザ設定キーワードを抽出して設定
でき、ユーザが設定したキーワードを含む新規登録文書
を自動的に索引付けできるようになる。
【0078】上記のように、ユーザ設定キーが設定され
た時点より前に登録された文書について、このユーザ設
定キーやユーザ設定キーの構成語を所定の条件で含む文
書を検出し、このユーザ設定キーから索引付けされるよ
うにし、更には、索引抽出手段が参照する辞書にユーザ
設定キーを索引語として登録し、その後に登録される文
書からはこのユーザ設定キーが自動抽出できるようにす
ることによって、利用者が登録時に設定キーワードに関
連する登録済みの文書も検索可能となり、その後に登録
される文書に対してもこのキーワードが自動的に設定さ
れ、ユーザ設定キーに関連する文書の検索漏れを減らす
ことができる。
【0079】なお、ユーザ設定キーが設定された時点よ
り前に登録された文書について、このユーザ設定キーや
ユーザ設定キーの構成語を所定の条件で含む文書を検索
する際の上記所定の条件として、上記実施の形態におい
ては、 (1)ユーザ設定キーを含む。
【0080】という条件を定めたが、この他、後述する
ように、 (2)ユーザ設定キーを構成する語(構成語)が一文内
に存在する。
【0081】(3)ユーザ設定キーの構成語が係り受け
関係にある。
【0082】等の条件を含めても良い。
【0083】また、これら所定の条件を満足する文書を
検索する際に、登録された文書の内容を全文探索するの
ではなく、ユーザ設定キーを構成語に分割し、登録時に
自動的に抽出したキーによって作成した全文検索用の索
引を参照するようにしても良い。この場合には、全文検
索に比べて高速な検索を実現できる。併せて、この全文
検索用の索引を用いる方法によれば、文書中に含まれる
単語をユーザが高速に探索することも実現できる。
【0084】更に、索引抽出手段が参照する辞書にユー
ザ設定キーを索引語として登録し、その後に登録される
文書からこのユーザ設定キーを自動抽出する場合におい
て、索引語と文書との対応には、ユーザが明示的に設定
したものか、更新処理によって設定されたものかを識別
する情報も付加する。この情報を参照することで、検索
時にどの対応を使って検索可能かを指定できるようにな
る。
【0085】次に、本発明の他の実施の形態について説
明する。上記第1の実施の形態では、図6のフローチャ
ートにおけるステップ106の処理でのユーザ設定キー
のチェック条件として、「ユーザ設定キーを含む」とい
う条件を用いていた。この第1の実施の形態によれば、
「情報発信」の構成語の「情報」,「発信」を含むもの
として文書IDが1の文書を確かに検索できたが、この
文書1の上記構成語に関連する文書内容は、正確には、
「情報を発信する」といった表現となっており「情報発
信」とは一致せず、検索の対象とはなり得なかった。
【0086】この点の対策として、第2の実施の形態で
は、上記ステップ106の処理においてユーザ設定キー
をチェックする条件として、「ユーザ設定の構成語を一
文内に含む」を加え、 (1)ユーザ設定キーを含む。
【0087】(2)ユーザ設定キーの構成語が一文内に
出現する。
【0088】のうちのいずれかの条件を満たした場合
に、ユーザ設定キーが含まれていたと判断するようにし
ている。ここで、1文とは句点や改行で区切られる文字
列のことを言うものとする。
【0089】上記(2)のチェック条件を加えた結果、
「情報を発信する」と「情報発信」が一致するように判
断される。これにより、第2の実施の形態では、上記第
1の実施の形態と同様に図8に示すような条件に沿って
文書を登録する場合、登録制御手段6内の検索結果テー
ブルの内容は、図16に示すような内容から図18に示
すような内容に変化し、「情報発信」の構成語を含む文
書IDの判定結果が<無し>から<有り>に変化する。
その結果、図6におけるステップ107での文書検索処
理は、「インターネット」に続き「情報発信」について
も実行され、登録制御手段6は「情報発信」に関連する
文書ID、すなわち1を索引記憶手段3に登録する。そ
の結果、索引記憶手段3の内容は、図17に示すような
内容から図19に示すような内容へと変化する。
【0090】また、この第2の実施の形態では、ユーザ
設定キーの構成語と元々のユーザ設定キーの関係につい
ても解析辞書手段5に追加し、図5におけるステップ5
でのユーザ設定キーの抽出処理に際しても、上記(2)
のチェック条件も加味して抽出するようにする。ここ
で、構成語と元々のユーザ設定キーの関係を解析辞書手
段5に登録する方法としては、図20に示すように、構
成語の「その他情報」にユーザ設定キーへのポインタ
(ユーザ設定キーの解析辞書での番号)を保持する方法
が考えられる。このポインタは、複数存在するようにし
ても良い。図20に示す例では、「情報」,「発信」の
各語については同一のポインタ「6」を付加することで
元々のユーザ設定キー「情報発信」の構成語であること
を、同様に、「電子」,「週刊誌」の各語については同
一のポインタ「7」を付加することで元々のユーザ設定
キー「電子週刊誌」の構成語であることを示している。
【0091】このように、第2の実施の形態では、上記
(2)の条件も加味して登録時にも索引語を抽出する様
にしたため、「情報が発信された」といった内容を含む
文書が登録された場合にも、「情報発信」というユーザ
設定キーが抽出されることになる。その場合、この抽出
されたキーに対する図11に示すような抽出結果の種別
は、「ユーザ設定キー」となり、該抽出結果は、ユーザ
設定キーに関する索引情報として索引記憶手段3に登録
される。
【0092】上記登録処理の結果、単純な文字列照合で
は検索できない文書もユーザが設定したキーワードで検
索できるようになる。例えば、「情報発信」というキー
ワードに対して、「情報発信」,「情報を発信」,「情
報の発信」,「情報を無料で発信する」,「発信された
情報」といった表現との照合が可能になる。
【0093】索引記憶手段3内の索引情報の内容に関す
る図17から図19への変化から分かるように、第2の
実施の形態では、利用者が登録時に設定したキーワード
(例えば、「インターネット」や「情報発信」)に関す
る登録済みの文書の文書IDも索引記憶手段3に記憶さ
れるため、ユーザ設定キーによる検索漏れが更に減少す
る。また、登録時の索引語抽出に対しても構成語を一文
内に含むという条件を追加することにより、ユーザ設定
キーに関連する文書の自動索引付けの精度を高められ、
ユーザ設定キーからの検索漏れをより低減できる。
【0094】この他、本発明の第3の実施の形態として
は、図1における機能ブロックのうち、索引記憶手段3
と解析辞書手段5のキー記憶部分を共通化した構成が考
えられる。具体的には、例えば、索引語、索引語の種
別、登録日時、解析情報、関連する文書ID列を索引語
毎に記憶する。
【0095】このように、索引記憶手段3と解析辞書手
段5のキー記憶エリアを共通化したの構成とした場合に
も、上記第2の実施の形態と同様の効果が期待できる。
併せて、この第3の実施の形態においては、ユーザ設定
キーに関する登録や更新を索引記憶手段3と解析辞書手
段5について2回行っていたのを1回に済ますことがで
きるようになる。
【0096】また、本発明の第4の実施の形態として、
索引抽出手段4の動作に、キーワードと文書中の類似表
記との差を標準化して照合させる処理を追加する方法が
考えられる。具体的には、英数字については、ASCI
Iの小文字に変換し、ピリオドは削除する。また、カタ
カナについては変換ルールを適用して短縮表記を生成す
る。この変換した結果同士を比較し、両者が一致してい
れば照合したものとして処理を進める。かかる構成の第
4の実施の形態においては、キーワードと文書中の表記
が一致していなくても一致したものとして扱われ、更に
抽出漏れを減らす効果を高めることができる。
【0097】また、本発明の第5の実施の形態として、
語と語の関係を記憶した関連語辞書を用いて、索引抽出
手段4においてキーワードを関連語辞書を用いて展開
し、展開された悟に対して抽出処理を行なうようにして
も良い。かかる構成とすることで、キーワード自身は文
書中に含まれていないがその関連語が文書中に含まれて
いる場合も、キーワードが含まれていたものとして扱わ
れ、抽出漏れを減らす効果を更に向上させることができ
る。
【0098】
【発明の効果】以上説明したように、本発明によれば、
文書登録に際してユーザ設定キーの設定時点より前に登
録された文書について、該ユーザ設定キーやその構成語
を所定の条件で含む文書を検出し、該文書のIDをその
検出に用いた上記ユーザ設定キーと対応付けて索引情報
として登録するようにしたため、ユーザ設定キーが登録
時に設定されていなくても、このユーザ設定キーに対し
て当該キーと関連のある文書を自動的に索引付けること
ができ、ユーザ設定キーを登録時に設定していない文書
も検索可能となる。
【0099】併せて、本発明では、文書登録時にその登
録文書から索引語を抽出する索引語抽出手段が参照する
辞書内に既に設定されたユーザ設定キーも索引語として
登録しておき、その後の文書登録に際して、上記索引語
抽出手段により、上記辞書を参照しつつ登録済みのユー
ザ設定キーを自動抽出するようにしたため、ユーザ設定
キーを登録時に設定しなくても既に登録済みのユーザ設
定キーを用いて当該ユーザ設定キーに関連する文書の検
索が可能となる。
【図面の簡単な説明】
【図1】第1の実施の形態に係わるキーワード設定装置
の機能ブロック図。
【図2】図1における装置の文書記憶手段の記憶内容の
一例を示す図。
【図3】図1における装置の索引記憶手段の索引情報の
内容の一例を示す図。
【図4】図1における装置の解析辞書手段の解析情報の
内容の一例を示す図。
【図5】図1における装置のキーワード設定処理動作を
示すフローチャート。
【図6】図5におけるステップ10の詳細動作を示すフ
ローチャート。
【図7】図1における装置で登録される文書の具体例を
示す図。
【図8】図7の文書登録時の登録情報記憶手段の内容を
示す図。
【図9】図7の文書登録時のステップ2実行後の索引記
憶手段のユーザ設定キーに関する索引情報の内容を示す
図。
【図10】図7の文書登録時のステップ3実行後の文書
記憶手段の内容を示す図。
【図11】図7の文書登録時のステップ5実行後の抽出
索引語の内容を示す図。
【図12】図7の文書登録時のステップ6実行後の索引
記憶手段の自動抽出キーに関する索引情報の内容を示す
図。
【図13】図7の文書登録時のステップ9実行後の解析
辞書手段のユーザ設定キーに関する解析情報の内容を示
す図。
【図14】図7の文書登録時のステップ102実行後の
ユーザ設定キーによる抽出構成語の内容を示す図。
【図15】図7の文書の登録時のステップ103実行後
の検索結果テーブルの内容の一例を示す図。
【図16】図7の文書登録時のステップ106実行後の
判定結果を検索結果テーブルに反映した結果を示す図。
【図17】図7の文書登録時のステップ107実行後の
索引記憶手段のユーザ設定キーに関する索引情報の内容
を示す図。
【図18】第2の実施の形態に係わる装置のステップ1
06実行後の判定結果を検索結果テーブルに反映した結
果を示す図。
【図19】第2の実施の形態に係わる装置のステップ1
07実行後の索引記憶手段のユーザ設定キーに関する索
引情報の内容を示す図。
【図20】第2の実施の形態に係わる装置のユーザ設定
キーの構成語とユーザ設定キーとの関係を示す図。
【符号の説明】
1…登録情報記憶手段、2…文書記憶手段、3…索引記
憶手段、4…索引語抽出手段、5…解析辞書手段、6…
登録制御手段

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 登録情報記憶手段に記憶した文書を文書
    記憶手段に登録する際、該文書に対して指定されたユー
    ザ設定キーと当該文書の文書IDを対応付け索引情報と
    して索引記憶手段に登録するキーワード設定装置におい
    て、 登録文書から所定の索引語を自動抽出する索引語抽出手
    段と、 該索引語抽出手段による索引語抽出時に文字列を解析す
    るために用いる解析辞書を記憶する解析辞書手段と、 文書登録時にユーザ設定キーが指定され、該ユーザ設定
    キーが前記索引記憶手段に存在しない場合、前記索引語
    抽出手段により登録済み文書から当該ユーザ設定キーを
    所定の条件で含む文書を検索し、該検索された文書の文
    書IDと当該ユーザ設定キーを対応付けて前記索引記憶
    手段の索引情報に追加する第1の登録処理と、文書登録
    時にユーザ設定キーが指定されない場合、前記索引語抽
    出手段により当該文書から索引語を自動抽出し、該索引
    語中に設定済みユーザ設定キーがある場合、この時の登
    録文書の文書IDを用いて当該設定済みユーザ設定キー
    の索引情報を更新する第2の登録処理を行う登録制御手
    段とを具備することを特徴とするキーワード設定装置。
  2. 【請求項2】 前記登録制御手段は、前記第1の登録処
    理時、新たに索引情報に追加されたユーザ設定キーを前
    記解析辞書手段に記憶し、前記第2の登録処理時、前記
    解析辞書手段に記憶されたユーザ設定キーを対象として
    索引語に含まれるか否かを判定することを特徴とする請
    求項1記載のキーワード設定装置。
  3. 【請求項3】 前記登録制御手段は、前記第1の登録処
    理に係わる前記所定の条件を満たす文書として、前記文
    書記憶手段内の前記ユーザ設定キーを含む文書若しくは
    前記索引語抽出手段で分解した該ユーザ設定キーの構成
    語を一文内に含む文書を検索対象とすることを特徴とす
    る請求項1または2記載のキーワード設定装置。
  4. 【請求項4】 前記索引語抽出手段は、登録文書から前
    記解析辞書手段に記憶されたユーザ設定キーについて抽
    出を行う場合、該ユーザ設定キーを含むという条件及び
    該ユーザ設定キーを構成する語を所定の条件で含むとい
    う条件を併用して当該ユーザ設定キーを抽出することを
    特徴とする請求項2記載のキーワード設定装置。
  5. 【請求項5】 前記登録制御手段は、前記索引語抽出手
    段で分解したユーザ設定キーの構成語を一文内に含む文
    書を検索する際、前記索引記憶手段を参照して探索文書
    数を限定することを特徴とする請求項3記載のキーワー
    ド設定装置。
JP01012596A 1996-01-24 1996-01-24 キーワード設定装置 Expired - Fee Related JP3591109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01012596A JP3591109B2 (ja) 1996-01-24 1996-01-24 キーワード設定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01012596A JP3591109B2 (ja) 1996-01-24 1996-01-24 キーワード設定装置

Publications (2)

Publication Number Publication Date
JPH09204433A true JPH09204433A (ja) 1997-08-05
JP3591109B2 JP3591109B2 (ja) 2004-11-17

Family

ID=11741578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01012596A Expired - Fee Related JP3591109B2 (ja) 1996-01-24 1996-01-24 キーワード設定装置

Country Status (1)

Country Link
JP (1) JP3591109B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161686A (ja) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> 連続インデックス機構
JP2001337969A (ja) * 2000-05-29 2001-12-07 Nippon Telegr & Teleph Corp <Ntt> 知識獲得方法、文書情報構造化方法および装置と前記方法を実施するプログラムを記録した記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149889A (ja) * 1992-11-12 1994-05-31 Seiko Epson Corp 電子ファイリングシステム
JPH07239861A (ja) * 1994-02-25 1995-09-12 Ricoh Co Ltd 文書検索装置
JPH0991311A (ja) * 1995-09-26 1997-04-04 Canon Inc 情報蓄積検索装置およびその制御方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149889A (ja) * 1992-11-12 1994-05-31 Seiko Epson Corp 電子ファイリングシステム
JPH07239861A (ja) * 1994-02-25 1995-09-12 Ricoh Co Ltd 文書検索装置
JPH0991311A (ja) * 1995-09-26 1997-04-04 Canon Inc 情報蓄積検索装置およびその制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161686A (ja) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> 連続インデックス機構
JP2001337969A (ja) * 2000-05-29 2001-12-07 Nippon Telegr & Teleph Corp <Ntt> 知識獲得方法、文書情報構造化方法および装置と前記方法を実施するプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP3591109B2 (ja) 2004-11-17

Similar Documents

Publication Publication Date Title
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US20020161570A1 (en) Multi-language document search and retrieval system
US8565526B2 (en) Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text
JPH10501912A (ja) Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法
FI120755B (fi) Tietueiden käsittely vastinparien löytämiseksi vertailutietojoukosta
JPS6359660A (ja) 情報処理装置
JP2693914B2 (ja) 検索システム
JP3591109B2 (ja) キーワード設定装置
JPH05250416A (ja) データベースの登録・検索装置
US7539611B1 (en) Method of identifying and highlighting text
JP4031844B2 (ja) 検索方法およびシステム
JPH0612451A (ja) 例文検索システム
JPS62249269A (ja) 文書処理装置
JPH05128159A (ja) キーワード抽出方法及び装置
JP2776069B2 (ja) 文章検査装置
JPH03123971A (ja) 索引付け支援装置
JPH08329081A (ja) 機械翻訳方法及び機械翻訳装置
JPH1115843A (ja) Sgml文書検索装置およびsgml文書検索方法
JPH04278664A (ja) 住所解析処理装置
JPH06124279A (ja) 文章作成支援装置および文章作成支援方法
JP2000259675A (ja) 検索装置
JPH0371370A (ja) 英単語検索装置
JPS6175467A (ja) 仮名漢字変換方式
JP2003228577A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040816

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070903

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120903

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120903

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees