JPH09259132A - 情報登録検索装置及びその方法 - Google Patents

情報登録検索装置及びその方法

Info

Publication number
JPH09259132A
JPH09259132A JP8062817A JP6281796A JPH09259132A JP H09259132 A JPH09259132 A JP H09259132A JP 8062817 A JP8062817 A JP 8062817A JP 6281796 A JP6281796 A JP 6281796A JP H09259132 A JPH09259132 A JP H09259132A
Authority
JP
Japan
Prior art keywords
word
character
character string
search
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8062817A
Other languages
English (en)
Other versions
JP3825829B2 (ja
Inventor
Hirotaka Shiiyama
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP06281796A priority Critical patent/JP3825829B2/ja
Publication of JPH09259132A publication Critical patent/JPH09259132A/ja
Application granted granted Critical
Publication of JP3825829B2 publication Critical patent/JP3825829B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索スピードを向上させつつ、新語や造語等
を検索することが可能な情報登録検索装置及びその方法
を提供する。 【解決手段】 単語辞書により単語抽出を行い単語イン
デックスを生成し、残りから文字インデックスを生成し
登録する。検索は、登録と同様にキー分解したものの論
理積で新語や造語も検索できる。更に、新語・造語を学
習登録することにより、高速で検索漏れを少なくするこ
とができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書ファイルや画
像ファイル等インデックスを付して登録し管理する情報
登録装置及びその方法に関するものである。
【0002】
【従来の技術】従来、全文検索システムは単純にテキス
トデータを検索する処理までは検索速度が遅いためこれ
を解決するための手段としてキーインデックスを作成す
るのが普通であった。該キーインデックスとはその切り
出したキーがどのテキストファイルに存在するか記憶し
たデータベースの一種である。また、ここでいう、キー
とは、例えばテキストデータから抽出した単語、簡単な
ものでは1文字・連続2文字を単純に切り出したもので
ある。
【0003】従来から、キーインデックス方式として、
単語単位でインデックスを作成する単語インデックス方
式、或いは1文字・2文字を単位としてインデックスを
作成する文字インデックス方式が考えられている。
【0004】
【発明が解決しようとしている課題】しかし、従来の単
語インデックス方式、或いは文字インデックス方式では
夫々一長一短があった。
【0005】例えば、文字インデックス方式も最も簡単
な例である1文字キーインデックス方式では、「新聞
紙」という言葉を検索する場合、1文字インデックス
で、「新」「聞」「紙」の3文字が存在するテキストデ
ータを検出しても実際は、「新たに…聞いたこと…紙に
書いておきましょう」という風に個々のキーがばらばら
に離れている事があり得るので、実際にはテキストデー
タを全部検索するまでは確定できず検索速度は遅い。
【0006】さらに、1文字キーの位置を示すアドレス
情報をインデックスに持たせる方法も存在するが、イン
デックスファイルの容量が膨大になるという欠点があっ
た。
【0007】他方、単語インデックス方式では、単語即
ち複数文字に対して1つのテキストファイル識別アドレ
スが使用されるのでキーインデックスは比較的小さくて
すみ、文字の連続性が保証されているので元のテキスト
ファイル中のシーク・確定処理が不要で極めて高速検索
が可能であるという長所がある。しかし、新語・造語な
ど単語辞書に存在しない言葉に対してはインデックスが
反映されず、検索不能になるという欠点があった。
【0008】
【課題を解決するための手段】本発明は上記課題を解決
するために文書情報から単語を抽出する抽出手段と、該
抽出手段により抽出された単語を、前記文書情報のイン
デックスとして記憶する第1の記憶手段と、文書情報の
中で、前記抽出手段により抽出されなかった文字を、前
記文書情報の文字インデックスとして記憶する第2の記
憶手段と、検索文字列を指示する指示手段と、前記指示
手段により、前記第1の記憶手段或いは第2の記憶手段
に記憶されていない文字列が指示された場合に、該文字
列を前記第1の記憶手段に単語として記憶するよう制御
する制御手段、とを有することを特徴とする情報登録検
索装置を提供する。
【0009】本発明は上記課題を解決するために検索文
字列を指示する指示手段と、該指示手段により指示され
た検索文字列から単語を抽出し、該抽出された単語の存
在するページを判断する第1の判断手段と、前記検索文
字列の単語として抽出されなかった文字の存在するペー
ジを判断する第2の判断手段と、前記第1の判断手段の
判断結果と前記第2の判断手段の判断結果の論理積をと
ることにより前記検索文字列を含むページを出力するよ
うに制御する制御手段と、を有することを特徴とする情
報登録検索装置を提供する。
【0010】
【発明の実施の形態】本発明の詳細について説明する前
に、まず前提条件として、文書データは複数のページか
らなるものとし、各々複数のページファイルに分割しユ
ニークなページIDを付け、もとの文書データとの対応
を別途文書ページDBにて管理する。また、ページとい
う概念が存在しないテキストデータでは文字数や行数に
より仮想的にページ分けをする。この文書ページDBは
ページIDによるもとの文書データと個々のページの対
応だけではなく、文書データの属性情報、例えば文書名
や日付け、所有者等を記憶し、文書属性による検索にも
用いる事が可能である。
【0011】以下、本発明の一実施形態について詳細に
説明する。
【0012】図1は、本発明の一実施形態のシステムブ
ロック概略図である。
【0013】本実施形態の構成は、文書をスキャナして
イメージ情報を得るイメージスキャナ1、イメージ情報
から本件テキスト情報を得るOCR処理するOCR処理
ソフトウエア2、本件テキスト情報からキーインデック
スを作成し、検索処理も行う全文検索ソフトウエア3、
イメージ情報と本件テキスト情報および検索用ファイル
を記憶する外部記憶装置4、検索語・検索条件の入力の
ためのキーボード5、検索語・検索条件の入力のための
表示およびイメージデータを表示するための表示装置6
からなる。
【0014】以下、図1を参照しながら、本実施の形態
の蓄積・登録処理と検索処理について簡単に説明する。
【0015】蓄積・登録処理は、以下の作業から成り立
っている。
【0016】イメージスキャナ1から得られたイメージ
データを外部記憶装置4のイメージデータ41に記憶す
る作業/文書ページDB43に新規文書のページ情報を
設定する作業/イメージスキャナ1から得られたイメー
ジデータをOCR処理ソフトウエア2でテキスト情報化
した後、テキスト情報42に記憶する作業/及びテキス
ト情報から本件アルゴリズムに従ってキーインデックス
作成処理を行う全文検索ソフトウエア3で作成したキー
インデックスを単語・文字キーインデックスに記憶する
作業等からなっている。
【0017】又、検索処理は、キーボード5から入力さ
れた検索語は全文検索ソフトウエア3が受け取り、登録
時と同じアルゴリズムでキー分解した後、各キーに対応
するページ情報を単語・文字キーインデックス44から
読み込み、本件アルゴリズムでページIDによる第一次
絞り込み後、最終的にテキストデータを検索して最終確
定作業を経た後、文書ページDB43から文書アドレス
情報を取り出す作業、および表示装置6に該当イメージ
データを表示する作業からなる。
【0018】次に、上述の蓄積・登録処理の全体の流れ
について、図2と図3を用いて詳細に説明する。
【0019】図2は、イメージスキャナ1から得られた
イメージデータ(ドキュメントを含む)を外部記憶装置
4に記憶する処理を示している。まず、ステップS1で
ページカウンタ(不図示)を初期化する。ステップS2
では、これからイメージスキャナで読み取る文書(複数
のページからなる)の文書IDを取得する。ステップS
3では、複数のページからなるすべての文書について、
読み取り、登録処理が終了したか判断する。
【0020】ステップS3で読み取り、登録処理が終了
していない場合は、ステップS4からS9の処理を終了
するまで行う。
【0021】ステップS4ではページカウンタを1up
する。続いてステップS5では読み取ったテキストデー
タに対してOCR(文書認識処理)を行う。OCR処理
は、公知の技術を用いているので説明を省略する。ステ
ップS6では、ステップS5のOCR処理の結果にもと
づいて、単語・文字インデックス登録処理を行う。ここ
で単語・文字インデックス登録処理について図3、図
4、図5を用いて詳細に説明する。
【0022】図3のステップS21ではイメージスキャ
ナ1から得られたイメージデータ((ドキュメントを含
む)のページIDを取得する。次に、ステップS22で
はイメージスキャナ1から得られたイメージデータをO
CR処理ソフトウエア2でテキスト情報化し、1ページ
中の文字列を取得する。ステップS23ではステップS
5で取得したすべての文字列を、単語辞書と比較し、単
語抽出を行い単語キーを作成する。但し、重複単語は削
除する。ステップS24ではステップS23で単語とし
て抽出されなかった文字列から文字キーを作成する。即
ち、単語辞書またはそれに類する辞書との比較により抽
出に引っかからなかった文字・文字列の文字キー、例え
ば1・2文字キーに分解し抽出する。
【0023】ステップS25では、ステップS23の処
理で、残った抽出単語を単語インデックス44中のその
単語が存在するアドレスデータを格納する場所にそのペ
ージIDを記憶し(図4)、ステップS24で抽出され
た文字・文字列を、1・2文字インデックスにそのキー
が存在するアドレスデータを格納する場所にそのページ
ID(図5)記憶する。
【0024】これらの処理により、単語辞書またはそれ
に類する辞書に存在する単語は単語インデックスへ、存
在しない残りの文字列は1・2文字インデックスへ記憶
されたことになる。
【0025】当然、単語インデックスと文字インデック
スを同一のものにまとめたインデックスを使用すること
も考えられる。
【0026】次に、本発明の単語・文字インデックスの
登録処理について、例を用いて説明する。
【0027】例えば、「キヤノワードはヒット商品であ
る。」という文字列を持つページ(ページID3とす
る)を登録する場合について説明する。単語辞書には
「ワード」「ヒット」「商品」という単語は登録されて
いるが、「キヤノワード」という造語は存在しない。
【0028】従って、単語インデックスには、「ワー
ド」「ヒット」「商品」キーに対してこのページID3
が登録される(図4)。
【0029】他方、単語抽出後には、「キヤノ」「は」
「である」が残っている。
【0030】カタカナとひらがなに対して文字キーは連
続2文字以上で作成すると定義すると「キヤ」「ヤノ」
「であ」「ある」が文字インデックスにページID3で
登録されることになる(図5)。
【0031】このようにして、ステップS6で1ページ
中の単語・文字インデックス登録処理が行われる。次
に、ステップS7では、OCRで得たテキストデータ及
びイメージデータをぞれぞれ、図1の42、41に格納
する。ステップS8では、単語・文字インデックス登録
処理(S6)で取得したページIDをもとに、ページD
B(図6)情報を記憶する。ステップS9では、次回の
ページIDを示すページID採番をカウントアップす
る。
【0032】以上のステップS4からステップS9の処
理をすべてのページに対して行い、1文書中のすべての
ページについて処理が行われた場合、ステップS10の
処理に移る。
【0033】ステップS10では、日付を取得する。ス
テップS11では、以上の処理より取得した文書ID、
ページカウンタ数、日付、S6で得たページIDをもと
に、文書DB(図7)を追記する。そして、ステップS
12で次の文書IDを示す、文書ID採番をカウントア
ップする。
【0034】以上の処理により蓄積・登録処理が終了す
る。
【0035】次に、図8を用いて、本実施の形態の検索
処理について説明する。
【0036】ステップ31では、キーボード5から入力
された検索語を取得する。
【0037】ステップS32では、検索語と単語辞書と
比較し単語キーを抽出し、含まれる単語を抽出し重複単
語は排除する。S33では、文書中に残り文字があるか
判断し、ある場合は、S34で残り文字フラグを立て
る。無い場合は、S36の処理に移る。ステップS35
では、その残りの文字列を文字キーに分解し、文字キー
を作成する。ステップS36では、単語キーは単語イン
デックスから記憶しているページID群を取得し、文字
キーは文字インデックスからID群を取得する。ステッ
プS37では、全てのキーに対応するID群の論理積を
とり全てのキーを含むページを求める。ステップS38
では、ページIDに対応するページの文字列情報をなめ
て、抽出された単語キーと文字キーが連続しているか判
断し、連続している場合は、ステップS40の処理に移
るステップS40では、残り文字フラグが立っているか
判断し、立っている場合は、ステップS41で新語・造
語フラグを立て、ステップS42の処理に移る。即ち、
ステップS33で単語キー以外の文字が存在すると判断
され、それが連続している場合は、新語・造語であると
判断される。ステップS42でページIDを検索結果と
して出力する。また、連続していない場合は、検索語を
含むページが存在しないことを示す情報を出力する。
【0038】ステップS37からステップS42では、
検索語が完全一致するための処理が行われている。即
ち、検索語が完全一致するためには、抽出された単語キ
ーと文字キーの全てが同時に存在する必要があり、それ
を知るには各キーを含むページID群をインデックスフ
ァイルから取り出し、論理積演算を行い全てのキーに共
通なページIDを取得すれば良い。そして、文字キーの
連続性を確認する為にそのページIDを持つテキストデ
ータを取り出しその中をシークなめ確定し、検索語の存
在を確認した後検索結果として出力する。
【0039】次に、本発明の検索処理について例を用い
て説明する。
【0040】検索で「キヤノワード」を検索語に指定す
ると、登録時と同じアルゴリズムでキー分解が行われ、
まず単語辞書との比較から「ワード」が単語キーとして
抽出され、その抽出残りから「キヤ」「ヤノ」が文字キ
ーとなる。
【0041】単語インデックスから「ワード」に対する
ID群を取得し、次いで文字インデックスから「キヤ」
「ヤノ」に対するID群を取得する。
【0042】両者のID群の論理積演算を行い「キヤ」
「ヤノ」と「ワード」の両方のキーを持つページを得た
後、「キヤノワード」と連続して存在するかどうかを元
のテキストデータをなめて確定し、存在することを確認
した後検索結果としてID3を出力する。
【0043】次に、もし検索語からの単語抽出で抽出残
りが存在し、且つ上記検索処理でヒットが確認できれ
ば、その検索語は単語辞書には存在しない新語・造語で
ある。
【0044】図9を用いて本発明の新語・造語登録処理
について説明する。
【0045】先ず、図9のフローチャートは、前回検索
処理で新語・造語フラグが立っている場合に実行され
る。実行に伴って使用者に確認をとった後、新語・造語
登録処理を行うようにしてもよい。
【0046】ステップS51の処理に入るときには、先
の検索処理で新語・造語抽出で残った成分から得た文字
キー、その新語・造語でヒットしたページID群の情報
は既知とする。
【0047】ステップS51では、単語辞書に新語・造
語を追加登録する。前述の例を用いると、「キヤノワー
ド」が単語辞書に登録される。ステップS52では、単
語インデックスに新語・造語をキーとし、検索で得たペ
ージIDが記憶される。即ち、例では、単語キー「キヤ
ノワード」に対してID3が記憶される。ステップS5
3では、検索で得たページIDをファイル名に変換し、
文字列データをなめ、確定する準備をする。例では、ペ
ージID3に対応するファイル名を、ページDBより取
得する。ステップS54では、未処理ページが存在する
か判断し、存在しないときは処理を終了し、存在する場
合は処理ステップS55にを移す。
【0048】ステップS55では、文字列中に検索語の
一部となっていない文字キーの有無をチェックする。そ
してステップS56では、一部ではない文字キーが存在
するかどうか判断し、存在しない場合は、ステップS5
7でその文字キーに対応するページID群から今回のペ
ージID3を削除する。即ち、例えば、「キヤノ」とい
う文字は文字列中に存在しないので、文字インデックス
の「キヤノ」に対応するページID群からページID3
を削除することになる。
【0049】即ち、単語辞書に「キヤノワード」を登録
し、単語インデックスには今回検索でヒットしたID3
を単語キー「キヤノワード」に対応するページIDとし
て登録する。これにより、過去の登録済データに関して
も検索漏れが無く整合性が保証される。
【0050】次に、文字インデッックスの「キヤ」「ヤ
ノ」というキーに対応するページIDで削除してもよい
ものを判断する。今回の例ではこのページに「キヤノワ
ード」の「キヤ」「ヤノ」しか存在しなかったので「キ
ヤ」「ヤノ」、キーに対するページID群からID3を
削除するが、もしこのページ中に他の検索語の一部では
ない形で「キヤ」「ヤノ」が存在する場合には削除して
はならない。
【0051】以上説明したように、検索語と新規単語と
しての単語辞書に登録する場合には、これまで登録され
たテキストデータ全てに対してこの検索後で検索漏れが
無く整合性が必要であり、その手段として上記処理で得
られたページIDを、単語インデックスに対しこの新規
単語に対応するアドレスデータとして登録を行う必要が
ある。
【0052】又その後、このアドレス登録で不要になっ
た文字インデックスデータのみ(ページ中で複数そのキ
ーが存在している場合には削除不可)文字インデックか
ら削除する事により文字インデックス方式の弱点である
インデックスデータの増大という欠点を緩和する事が可
能である。
【0053】この処理に関しては、検索処理語ユーザー
に通知せず自動的に行う「新語・造語自動学習機能」と
して提供するか、あるいは通知して「新語・造語登録す
るか」確認した後この処理を行う機能として提供するか
が考えられる。
【0054】以上の処理により「造語・新語」が登録さ
れ、次回から高速検索できる事となり、しかもインデッ
クス量も削除される。
【0055】本発明が解決しようとしているのは、単語
キーや文字キー単独ではなく、お互いの長所を生かした
ハイブリッド方式の確立である。
【0056】単語辞書またはそれに類する辞書に検索語
そのものが無いがハイブリッドインデックス方式による
検索によりヒットすることにより、ソフト側がその検索
語が新語・造語として有効であることを自動判別する事
が可能となれば使用者にとって使い勝手の良い検索装置
を提供することが可能である。
【0057】この判断に基づき、単語抽出用の辞書に学
習登録を行い且つ、過去に蓄積したデータに対してハイ
ブリッド方式検索結果を今回の新語・造語に対して新規
な単語インデックスを追加登録することにより検索漏れ
のない整合性を保証する事が可能であると同時に、単語
インデックス方式の特徴である高速検索の恩恵を次回以
降の検索で受ける事が可能である。
【0058】更に、文字インデックスからは今回の新語
・造語の一部文字列として存在しているデータを削除
し、文字インデックの成長を抑える事が可能である。
【0059】本実施の形態は先に示した文書・テキスト
データを管理するシステム以外にも、文書画像からOC
Rにより得たテキストデータに対する全文検索システム
による画像検索、更には文字データを含まない画像デー
タに対しても付加した説明テキストデータを対応づけて
おくことにより検索可能な画像ファイリングシステムに
も応用可能である。
【0060】もちろん複数検索語とその論理演算指定、
シソーラス(類義語)展開した検索語の処理も本発明の
アルゴリズムによる各々の検索結果を演算すれば可能で
ある。
【0061】又、今回は検索処理にからんだ新語・造語
登録したが、単純に使用者のカスタマイズ機能としての
単語登録処理に付随する機能としても有効である。
【0062】又、単語抽出に関しては単語辞書と比較す
るとしたが、カスタマイズ辞書の様なそれに類する辞書
であればどの様な辞書でも実現可能である。
【0063】更に、単語インデックスと文字インデック
スと別々のインデックスとして記述したが、同一のもの
でも実現可能である。
【0064】
【発明の効果】本発明によれば、単語インデックス方式
と文字インデック方式の互いに長所を組合わせたハイブ
リッド型インデックス方式の全文検索を実現可能であ
る。
【0065】単語インデックス方式の高速検索と少量イ
ンデックスと、文字インデックス方式の新語・造語に対
する柔軟な検索が可能となる。
【0066】そして単語インデックス方式と文字インデ
ック方式を上手く連動・機能させるための、ユーザー指
定または自動学習型の、新語・造語を新規単語として単
語辞書またはそれに類する辞書に登録し且つインデック
スの整合性を取る処理機能により、夫々のインデックス
を生かす連携作用が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施の形態のシステムブロック概略
図である。
【図2】本発明の登録処理のフローチャートである。
【図3】本発明の単語・文字インデックス登録処理のフ
ローチャートである。
【図4】本発明の単語インデックスの構成図である。
【図5】本発明の文字インデックスの構成図である。
【図6】本発明のページDBの構成図である。
【図7】本発明の文書DBの構成図である。
【図8】本発明の検索処理のフローチャートである。
【図9】本発明の新語・造語学習処理のフローチャート
である。
【符号の説明】
1 イメージスキャナ 2 OCR処理ソフトウエア 3 全文検索ソフトウエア 4 外部記憶装置 5 キーボード 6 表示装置

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 文書情報から単語を抽出する抽出手段
    と、 該抽出手段により抽出された単語を、前記文書情報のイ
    ンデックスとして記憶する第1の記憶手段と、 文書情報の中で、前記抽出手段により抽出されなかった
    文字を、前記文書情報の文字インデックスとして記憶す
    る第2の記憶手段と、 検索文字列を指示する指示手段と、 前記指示手段により、前記第1の記憶手段或いは第2の
    記憶手段に記憶されていない文字列が指示された場合
    に、該文字列を前記第1の記憶手段に単語として記憶す
    るよう制御する制御手段、とを有することを特徴とする
    情報登録検索装置。
  2. 【請求項2】 予め決められた複数の単語を記憶する単
    語辞書を有することを特徴とする請求項1記載の情報登
    録検索装置。
  3. 【請求項3】 前記第2の記憶手段は、1、2文字を単
    位として文字インデックスとした記憶することを特徴と
    する請求項1記載の情報登録検索装置。
  4. 【請求項4】 前記制御手段は、前記指示手段により、
    前記第1の記憶手段或いは第2の記憶手段に記憶されて
    いない文字列が指示された場合に、該文字列を前記第1
    の記憶手段に単語として記憶し、前記第2の記憶手段か
    ら、指示された検索文字列に相当する部分を削除するよ
    うに制御することを特徴とする請求項1記載の情報登録
    検索装置。
  5. 【請求項5】 検索文字列を指示する指示手段と、 該指示手段により指示された検索文字列を単語を抽出
    し、該抽出された単語の存在するページを判断する第1
    の判断手段と、 前記検索文字列の単語として抽出されなかった文字の存
    在するページを判断する第2の判断手段と、 前記第1の判断手段の判断結果と前記第2の判断手段の
    判断結果の論理積をとることにより前記検索文字列を含
    むページを出力するように制御する制御手段と、を有す
    ることを特徴とする情報登録検索装置。
  6. 【請求項6】 予め決められた複数の単語を、文字情報
    に対応する単語インデックスとして記憶する記憶手段を
    有することを特徴とする請求項5記載の情報登録検索装
    置。
  7. 【請求項7】 該指示手段により指示された検索文字列
    に含まれる単語と、文字が、文章中に連続して存在して
    いる場合には、前記検索文字列を単語として、前記記憶
    手段に記憶することを特徴とする請求項6記載の情報登
    録検索装置。
  8. 【請求項8】 文書情報から単語を抽出する抽出工程
    と、 該抽出された単語を、前記文書情報のインデックスとし
    て記憶する第1の記憶工程と、 文書情報の中で、前記抽出工程により抽出されなかった
    文字を、前記文書情報の文字インデックスとして記憶す
    る第2の記憶工程と、 検索文字列を指示する指示工程と、 前記指示工程により、前記第1の記憶工程或いは第2の
    記憶工程に記憶されていない文字列が指示された場合
    に、該文字列を前記第1の記憶工程に単語として記憶す
    るよう制御する制御工程、とを有することを特徴とする
    情報登録検索方法。
  9. 【請求項9】 前記第2の記憶工程は、1、2文字を単
    位として文字インデックスとして記憶することを特徴と
    する請求項8記載の情報登録検索方法。
  10. 【請求項10】 前記制御工程は、前記指示工程によ
    り、前記第1の記憶工程或いは第2の記憶工程に記憶さ
    れていない文字列が指示された場合に、該文字列を前記
    第1の記憶工程に単語として記憶し、前記第2の記憶工
    程から、指示された検索文字列に相当する部分を削除す
    るように制御することを特徴とする請求項8記載の情報
    登録検索方法。
  11. 【請求項11】 検索文字列を指示する指示工程と、 該指示工程により指示された検索文字列から単語を抽出
    し、該抽出された単語の存在するページを判断する第1
    の判断工程と、 前記検索文字列の単語として抽出されなかった文字の存
    在するページを判断する第2の判断工程と、 前記第1の判断工程の判断結果と前記第2の判断工程の
    判断結果の論理積をとることにより前記検索文字列を含
    むページを出力するように制御する制御工程と、を有す
    ることを特徴とする情報登録検索方法。
  12. 【請求項12】 予め決められた複数の単語を、文字情
    報に対応する単語インデックスとして記憶する記憶手段
    を有することを特徴とする請求項11記載の情報登録検
    索方法。
  13. 【請求項13】 該指示手段により指示された検索文字
    列に含まれる単語と、文字が、文章中に連続して存在す
    る場合には、前記検索文字列を単語として、前記記憶工
    程に記憶すること手を特徴する請求項12記載の情報登
    録検索方法。
JP06281796A 1996-03-19 1996-03-19 登録情報検索装置及びその方法 Expired - Fee Related JP3825829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06281796A JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06281796A JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Publications (2)

Publication Number Publication Date
JPH09259132A true JPH09259132A (ja) 1997-10-03
JP3825829B2 JP3825829B2 (ja) 2006-09-27

Family

ID=13211273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06281796A Expired - Fee Related JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Country Status (1)

Country Link
JP (1) JP3825829B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342373A (ja) * 2001-05-21 2002-11-29 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法、装置、プログラム、同プログラムを記録した記録媒体
JP2004534980A (ja) * 2000-11-21 2004-11-18 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 計算ユニットにおけるテキスト処理方法及び計算ユニット
JP2011197809A (ja) * 2010-03-17 2011-10-06 Fujitsu Ltd 検索装置、検索方法および検索プログラム
WO2013179441A1 (ja) * 2012-05-31 2013-12-05 株式会社日立製作所 検索サーバ、検索方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03229367A (ja) * 1990-02-05 1991-10-11 Nippon Telegr & Teleph Corp <Ntt> テキストベース検索方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03229367A (ja) * 1990-02-05 1991-10-11 Nippon Telegr & Teleph Corp <Ntt> テキストベース検索方式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
小川泰嗣、ほか: "全文検索のための文字成分表方式の改良", 情報処理学会研究報告, vol. 94巻、62号, CSNG200000121034, 22 July 1994 (1994-07-22), pages 261 - 264, ISSN: 0000748982 *
岩井勇、ほか: "フルテキストサーチによるマルチメディア文書検索システムの実現", 情報の科学と技術, vol. 42巻、10号, CSNG200201856001, 1 October 1992 (1992-10-01), pages 942 - 945, ISSN: 0000748981 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004534980A (ja) * 2000-11-21 2004-11-18 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 計算ユニットにおけるテキスト処理方法及び計算ユニット
JP2002342373A (ja) * 2001-05-21 2002-11-29 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法、装置、プログラム、同プログラムを記録した記録媒体
JP2011197809A (ja) * 2010-03-17 2011-10-06 Fujitsu Ltd 検索装置、検索方法および検索プログラム
WO2013179441A1 (ja) * 2012-05-31 2013-12-05 株式会社日立製作所 検索サーバ、検索方法及びプログラム

Also Published As

Publication number Publication date
JP3825829B2 (ja) 2006-09-27

Similar Documents

Publication Publication Date Title
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JPS59128661A (ja) 画像フアイル装置
JPH0484271A (ja) 文書内情報検索装置
JPH0628403A (ja) 文書検索装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JPH08314966A (ja) 文書検索装置のインデックス作成方法及び文書検索装置
JPH0991305A (ja) 情報処理方法及び装置
JPH06309365A (ja) 文書処理装置
JP2000231560A (ja) 文書自動分類方式
JPH05250416A (ja) データベースの登録・検索装置
JPS62106574A (ja) 文書画像フアイル登録検索方式
JP3085508B2 (ja) 電子帳票検索システム
JPH09212523A (ja) 全文検索方法
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPS613245A (ja) 情報整理装置
JPH06309368A (ja) 文書検索装置
JPH05128159A (ja) キーワード抽出方法及び装置
JP2001092831A (ja) 文書検索装置及び文書検索方法
JP2787945B2 (ja) 情報処理装置及び方法
JP3464518B2 (ja) 文書索引作成システム
JP2967995B2 (ja) 文書処理装置および文書処理方法
JP3998201B2 (ja) 文書検索方法
JP2601139B2 (ja) 文字列検索装置
JPH09269952A (ja) 文書検索装置及びその方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060703

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110707

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130707

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees