JP3825829B2 - 登録情報検索装置及びその方法 - Google Patents

登録情報検索装置及びその方法 Download PDF

Info

Publication number
JP3825829B2
JP3825829B2 JP06281796A JP6281796A JP3825829B2 JP 3825829 B2 JP3825829 B2 JP 3825829B2 JP 06281796 A JP06281796 A JP 06281796A JP 6281796 A JP6281796 A JP 6281796A JP 3825829 B2 JP3825829 B2 JP 3825829B2
Authority
JP
Japan
Prior art keywords
word
key
search
character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06281796A
Other languages
English (en)
Other versions
JPH09259132A (ja
Inventor
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP06281796A priority Critical patent/JP3825829B2/ja
Publication of JPH09259132A publication Critical patent/JPH09259132A/ja
Application granted granted Critical
Publication of JP3825829B2 publication Critical patent/JP3825829B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書ファイルや画像ファイル等インデックスを付して登録し管理する情報登録装置及びその方法に関するものである。
【0002】
【従来の技術】
従来、全文検索システムは単純にテキストデータを検索する処理までは検索速度が遅いためこれを解決するための手段としてキーインデックスを作成するのが普通であった。該キーインデックスとはその切り出したキーがどのテキストファイルに存在するか記憶したデータベースの一種である。また、ここでいう、キーとは、例えばテキストデータから抽出した単語、簡単なものでは1文字・連続2文字を単純に切り出したものである。
【0003】
従来から、キーインデックス方式として、単語単位でインデックスを作成する単語インデックス方式、或いは1文字・2文字を単位としてインデックスを作成する文字インデックス方式が考えられている。
【0004】
【発明が解決しようとしている課題】
しかし、従来の単語インデックス方式、或いは文字インデックス方式では夫々一長一短があった。
【0005】
例えば、文字インデックス方式も最も簡単な例である1文字キーインデックス方式では、「新聞紙」という言葉を検索する場合、1文字インデックスで、「新」「聞」「紙」の3文字が存在するテキストデータを検出しても実際は、「新たに…聞いたこと…紙に書いておきましょう」という風に個々のキーがばらばらに離れている事があり得るので、実際にはテキストデータを全部検索するまでは確定できず検索速度は遅い。
【0006】
さらに、1文字キーの位置を示すアドレス情報をインデックスに持たせる方法も存在するが、インデックスファイルの容量が膨大になるという欠点があった。
【0007】
他方、単語インデックス方式では、単語即ち複数文字に対して1つのテキストファイル識別アドレスが使用されるのでキーインデックスは比較的小さくてすみ、文字の連続性が保証されているので元のテキストファイル中のシーク・確定処理が不要で極めて高速検索が可能であるという長所がある。しかし、新語・造語など単語辞書に存在しない言葉に対してはインデックスが反映されず、検索不能になるという欠点があった。
【0008】
【課題を解決するための手段】
本発明は上記課題を解決するために、登録した文書データから検索文字列を含む文書データを検索する登録情報検索装置において、検索対象の文書データに含まれる文字列から、予め決定された複数の単語キーを記憶している単語キー記憶手段に記憶された単語キーを抽出する抽出手段と、前記抽出した単語キーを第1の保持テーブルに登録する一方、前記抽出手段で単語キーとして抽出されなかった文字列から作成した文字キーを第2の保持テーブルに登録する登録手段と、検索文字列を指示する指示手段と、検索文字列を前記単語キー記憶手段を用いて単語キーと文字キーとに分解する分解手段と、前記分解手段で分解された単語キーと文字キーとをそれぞれ前記第1の保持テーブルと第2の保持テーブルとから検索する検索手段と、第2の保持テーブルに保持された文字キーを用いて検索文字列を含む文書データがヒットした場合、該検索文字列を前記単語キー記憶手段と前記第1の保持テーブルとに登録することを特徴とする登録情報検索装置を提供する。
【0009】
本発明は上記課題を解決するために、登録した文書データから検索文字列を含む文書データを検索する登録情報検索装置の制御方法において、登録情報検索装置が備える抽出手段が、検索対象の文書データに含まれる文字列から、予め決定された複数の単語キーを記憶している単語キー記憶手段に記憶された単語キーを抽出する抽出工程と、登録情報検索装置が備える登録手段が、前記抽出した単語キーを第1の保持テーブルに登録する一方、前記抽出工程で単語キーとして抽出されなかった文字列から作成した文字キーを第2の保持テーブルに登録する登録工程と、登録情報検索装置が備える分解手段が、検索文字列を指示する指示工程と、検索文字列を前記単語キー記憶手段を用いて単語キーと文字キーとに分解する分解工程と、登録情報検索装置が備える検索手段が、前記分解工程で分解された単語キーと文字キーとをそれぞれ前記第1の保持テーブルと第2の保持テーブルとから検索する検索工程と、第2の保持テーブルに保持された文字キーを用いて検索文字列を含む文書データがヒットした場合、該検索文字列を前記単語キー記憶手段と前記第1の保持テーブルとに登録することを特徴とする登録情報検索方法を提供する。
【0010】
【発明の実施の形態】
本発明の詳細について説明する前に、まず前提条件として、文書データは複数のページからなるものとし、各々複数のページファイルに分割しユニークなページIDを付け、もとの文書データとの対応を別途文書ページDBにて管理する。また、ページという概念が存在しないテキストデータでは文字数や行数により仮想的にページ分けをする。この文書ページDBはページIDによるもとの文書データと個々のページの対応だけではなく、文書データの属性情報、例えば文書名や日付け、所有者等を記憶し、文書属性による検索にも用いる事が可能である。
【0011】
以下、本発明の一実施形態について詳細に説明する。
【0012】
図1は、本発明の一実施形態のシステムブロック概略図である。
【0013】
本実施形態の構成は、文書をスキャナしてイメージ情報を得るイメージスキャナ1、イメージ情報から本件テキスト情報を得るOCR処理するOCR処理ソフトウエア2、本件テキスト情報からキーインデックスを作成し、検索処理も行う全文検索ソフトウエア3、イメージ情報と本件テキスト情報および検索用ファイルを記憶する外部記憶装置4、検索語・検索条件の入力のためのキーボード5、検索語・検索条件の入力のための表示およびイメージデータを表示するための表示装置6からなる。
【0014】
以下、図1を参照しながら、本実施の形態の蓄積・登録処理と検索処理について簡単に説明する。
【0015】
蓄積・登録処理は、以下の作業から成り立っている。
【0016】
イメージスキャナ1から得られたイメージデータを外部記憶装置4のイメージデータ41に記憶する作業/文書ページDB43に新規文書のページ情報を設定する作業/イメージスキャナ1から得られたイメージデータをOCR処理ソフトウエア2でテキスト情報化した後、テキスト情報42に記憶する作業/及びテキスト情報から本件アルゴリズムに従ってキーインデックス作成処理を行う全文検索ソフトウエア3で作成したキーインデックスを単語・文字キーインデックスに記憶する作業等からなっている。
【0017】
又、検索処理は、キーボード5から入力された検索語は全文検索ソフトウエア3が受け取り、登録時と同じアルゴリズムでキー分解した後、各キーに対応するページ情報を単語・文字キーインデックス44から読み込み、本件アルゴリズムでページIDによる第一次絞り込み後、最終的にテキストデータを検索して最終確定作業を経た後、文書ページDB43から文書アドレス情報を取り出す作業、および表示装置6に該当イメージデータを表示する作業からなる。
【0018】
次に、上述の蓄積・登録処理の全体の流れについて、図2と図3を用いて詳細に説明する。
【0019】
図2は、イメージスキャナ1から得られたイメージデータ(ドキュメントを含む)を外部記憶装置4に記憶する処理を示している。まず、ステップS1でページカウンタ(不図示)を初期化する。ステップS2では、これからイメージスキャナで読み取る文書(複数のページからなる)の文書IDを取得する。ステップS3では、複数のページからなるすべての文書について、読み取り、登録処理が終了したか判断する。
【0020】
ステップS3で読み取り、登録処理が終了していない場合は、ステップS4からS9の処理を終了するまで行う。
【0021】
ステップS4ではページカウンタを1upする。続いてステップS5では読み取ったテキストデータに対してOCR(文書認識処理)を行う。OCR処理は、公知の技術を用いているので説明を省略する。ステップS6では、ステップS5のOCR処理の結果にもとづいて、単語・文字インデックス登録処理を行う。ここで単語・文字インデックス登録処理について図3、図4、図5を用いて詳細に説明する。
【0022】
図3のステップS21ではイメージスキャナ1から得られたイメージデータ((ドキュメントを含む)のページIDを取得する。次に、ステップS22ではイメージスキャナ1から得られたイメージデータをOCR処理ソフトウエア2でテキスト情報化し、1ページ中の文字列を取得する。ステップS23ではステップS5で取得したすべての文字列を、単語辞書と比較し、単語抽出を行い単語キーを作成する。但し、重複単語は削除する。ステップS24ではステップS23で単語として抽出されなかった文字列から文字キーを作成する。即ち、単語辞書またはそれに類する辞書との比較により抽出に引っかからなかった文字・文字列の文字キー、例えば1・2文字キーに分解し抽出する。
【0023】
ステップS25では、ステップS23の処理で、残った抽出単語を単語インデックス44中のその単語が存在するアドレスデータを格納する場所にそのページIDを記憶し(図4)、ステップS24で抽出された文字・文字列を、1・2文字インデックスにそのキーが存在するアドレスデータを格納する場所にそのページID(図5)記憶する。
【0024】
これらの処理により、単語辞書またはそれに類する辞書に存在する単語は単語インデックスへ、存在しない残りの文字列は1・2文字インデックスへ記憶されたことになる。
【0025】
当然、単語インデックスと文字インデックスを同一のものにまとめたインデックスを使用することも考えられる。
【0026】
次に、本発明の単語・文字インデックスの登録処理について、例を用いて説明する。
【0027】
例えば、「キヤノワードはヒット商品である。」という文字列を持つページ(ページID3とする)を登録する場合について説明する。単語辞書には「ワード」「ヒット」「商品」という単語は登録されているが、「キヤノワード」という造語は存在しない。
【0028】
従って、単語インデックスには、「ワード」「ヒット」「商品」キーに対してこのページID3が登録される(図4)。
【0029】
他方、単語抽出後には、「キヤノ」「は」「である」が残っている。
【0030】
カタカナとひらがなに対して文字キーは連続2文字以上で作成すると定義すると「キヤ」「ヤノ」「であ」「ある」が文字インデックスにページID3で登録されることになる(図5)。
【0031】
このようにして、ステップS6で1ページ中の単語・文字インデックス登録処理が行われる。次に、ステップS7では、OCRで得たテキストデータ及びイメージデータをぞれぞれ、図1の42、41に格納する。ステップS8では、単語・文字インデックス登録処理(S6)で取得したページIDをもとに、ページDB(図6)情報を記憶する。ステップS9では、次回のページIDを示すページID採番をカウントアップする。
【0032】
以上のステップS4からステップS9の処理をすべてのページに対して行い、1文書中のすべてのページについて処理が行われた場合、ステップS10の処理に移る。
【0033】
ステップS10では、日付を取得する。ステップS11では、以上の処理より取得した文書ID、ページカウンタ数、日付、S6で得たページIDをもとに、文書DB(図7)を追記する。そして、ステップS12で次の文書IDを示す、文書ID採番をカウントアップする。
【0034】
以上の処理により蓄積・登録処理が終了する。
【0035】
次に、図8を用いて、本実施の形態の検索処理について説明する。
【0036】
ステップ31では、キーボード5から入力された検索語を取得する。
【0037】
ステップS32では、検索語と単語辞書と比較し単語キーを抽出し、含まれる単語を抽出し重複単語は排除する。S33では、文書中に残り文字があるか判断し、ある場合は、S34で残り文字フラグを立てる。無い場合は、S36の処理に移る。ステップS35では、その残りの文字列を文字キーに分解し、文字キーを作成する。ステップS36では、単語キーは単語インデックスから記憶しているページID群を取得し、文字キーは文字インデックスからID群を取得する。ステップS37では、全てのキーに対応するID群の論理積をとり全てのキーを含むページを求める。ステップS38では、ページIDに対応するページの文字列情報をなめて、抽出された単語キーと文字キーが連続しているか判断し、連続している場合は、ステップS40の処理に移るステップS40では、残り文字フラグが立っているか判断し、立っている場合は、ステップS41で新語・造語フラグを立て、ステップS42の処理に移る。即ち、ステップS33で単語キー以外の文字が存在すると判断され、それが連続している場合は、新語・造語であると判断される。ステップS42でページIDを検索結果として出力する。また、連続していない場合は、検索語を含むページが存在しないことを示す情報を出力する。
【0038】
ステップS37からステップS42では、検索語が完全一致するための処理が行われている。即ち、検索語が完全一致するためには、抽出された単語キーと文字キーの全てが同時に存在する必要があり、それを知るには各キーを含むページID群をインデックスファイルから取り出し、論理積演算を行い全てのキーに共通なページIDを取得すれば良い。そして、文字キーの連続性を確認する為にそのページIDを持つテキストデータを取り出しその中をシークなめ確定し、検索語の存在を確認した後検索結果として出力する。
【0039】
次に、本発明の検索処理について例を用いて説明する。
【0040】
検索で「キヤノワード」を検索語に指定すると、登録時と同じアルゴリズムでキー分解が行われ、まず単語辞書との比較から「ワード」が単語キーとして抽出され、その抽出残りから「キヤ」「ヤノ」が文字キーとなる。
【0041】
単語インデックスから「ワード」に対するID群を取得し、次いで文字インデックスから「キヤ」「ヤノ」に対するID群を取得する。
【0042】
両者のID群の論理積演算を行い「キヤ」「ヤノ」と「ワード」の両方のキーを持つページを得た後、「キヤノワード」と連続して存在するかどうかを元のテキストデータをなめて確定し、存在することを確認した後検索結果としてID3を出力する。
【0043】
次に、もし検索語からの単語抽出で抽出残りが存在し、且つ上記検索処理でヒットが確認できれば、その検索語は単語辞書には存在しない新語・造語である。
【0044】
図9を用いて本発明の新語・造語登録処理について説明する。
【0045】
先ず、図9のフローチャートは、前回検索処理で新語・造語フラグが立っている場合に実行される。実行に伴って使用者に確認をとった後、新語・造語登録処理を行うようにしてもよい。
【0046】
ステップS51の処理に入るときには、先の検索処理で新語・造語抽出で残った成分から得た文字キー、その新語・造語でヒットしたページID群の情報は既知とする。
【0047】
ステップS51では、単語辞書に新語・造語を追加登録する。前述の例を用いると、「キヤノワード」が単語辞書に登録される。ステップS52では、単語インデックスに新語・造語をキーとし、検索で得たページIDが記憶される。即ち、例では、単語キー「キヤノワード」に対してID3が記憶される。ステップS53では、検索で得たページIDをファイル名に変換し、文字列データをなめ、確定する準備をする。例では、ページID3に対応するファイル名を、ページDBより取得する。ステップS54では、未処理ページが存在するか判断し、存在しないときは処理を終了し、存在する場合は処理ステップS55にを移す。
【0048】
ステップS55では、文字列中に検索語の一部となっていない文字キーの有無をチェックする。そしてステップS56では、一部ではない文字キーが存在するかどうか判断し、存在しない場合は、ステップS57でその文字キーに対応するページID群から今回のページID3を削除する。即ち、例えば、「キヤノ」という文字は文字列中に存在しないので、文字インデックスの「キヤノ」に対応するページID群からページID3を削除することになる。
【0049】
即ち、単語辞書に「キヤノワード」を登録し、単語インデックスには今回検索でヒットしたID3を単語キー「キヤノワード」に対応するページIDとして登録する。これにより、過去の登録済データに関しても検索漏れが無く整合性が保証される。
【0050】
次に、文字インデクスの「キヤ」「ヤノ」というキーに対応するページIDで削除してもよいものを判断する。今回の例ではこのページに「キヤノワード」の「キヤ」「ヤノ」しか存在しなかったので「キヤ」「ヤノ」、キーに対するページID群からID3を削除するが、もしこのページ中に他の検索語の一部ではない形で「キヤ」「ヤノ」が存在する場合には削除してはならない。
【0051】
以上説明したように、検索語と新規単語としての単語辞書に登録する場合には、これまで登録されたテキストデータ全てに対してこの検索後で検索漏れが無く整合性が必要であり、その手段として上記処理で得られたページIDを、単語インデックスに対しこの新規単語に対応するアドレスデータとして登録を行う必要がある。
【0052】
又その後、このアドレス登録で不要になった文字インデックスデータのみ(ページ中で複数そのキーが存在している場合には削除不可)文字インデックから削除する事により文字インデックス方式の弱点であるインデックスデータの増大という欠点を緩和する事が可能である。
【0053】
この処理に関しては、検索処理語ユーザーに通知せず自動的に行う「新語・造語自動学習機能」として提供するか、あるいは通知して「新語・造語登録するか」確認した後この処理を行う機能として提供するかが考えられる。
【0054】
以上の処理により「造語・新語」が登録され、次回から高速検索できる事となり、しかもインデックス量も削除される。
【0055】
本発明が解決しようとしているのは、単語キーや文字キー単独ではなく、お互いの長所を生かしたハイブリッド方式の確立である。
【0056】
単語辞書またはそれに類する辞書に検索語そのものが無いがハイブリッドインデックス方式による検索によりヒットすることにより、ソフト側がその検索語が新語・造語として有効であることを自動判別する事が可能となれば使用者にとって使い勝手の良い検索装置を提供することが可能である。
【0057】
この判断に基づき、単語抽出用の辞書に学習登録を行い且つ、過去に蓄積したデータに対してハイブリッド方式検索結果を今回の新語・造語に対して新規な単語インデックスを追加登録することにより検索漏れのない整合性を保証する事が可能であると同時に、単語インデックス方式の特徴である高速検索の恩恵を次回以降の検索で受ける事が可能である。
【0058】
更に、文字インデックスからは今回の新語・造語の一部文字列として存在しているデータを削除し、文字インデックの成長を抑える事が可能である。
【0059】
本実施の形態は先に示した文書・テキストデータを管理するシステム以外にも、文書画像からOCRにより得たテキストデータに対する全文検索システムによる画像検索、更には文字データを含まない画像データに対しても付加した説明テキストデータを対応づけておくことにより検索可能な画像ファイリングシステムにも応用可能である。
【0060】
もちろん複数検索語とその論理演算指定、シソーラス(類義語)展開した検索語の処理も本発明のアルゴリズムによる各々の検索結果を演算すれば可能である。
【0061】
又、今回は検索処理にからんだ新語・造語登録したが、単純に使用者のカスタマイズ機能としての単語登録処理に付随する機能としても有効である。
【0062】
又、単語抽出に関しては単語辞書と比較するとしたが、カスタマイズ辞書の様なそれに類する辞書であればどの様な辞書でも実現可能である。
【0063】
更に、単語インデックスと文字インデックスと別々のインデックスとして記述したが、同一のものでも実現可能である。
【0064】
【発明の効果】
本発明によれば、単語インデックス方式と文字インデック方式の互いに長所を組合わせたハイブリッド型インデックス方式の全文検索を実現可能である。
【0065】
単語インデックス方式の高速検索と少量インデックスと、文字インデックス方式の新語・造語に対する柔軟な検索が可能となる。
【0066】
そして単語インデックス方式と文字インデック方式を上手く連動・機能させるための、ユーザー指定または自動学習型の、新語・造語を新規単語として単語辞書またはそれに類する辞書に登録し且つインデックスの整合性を取る処理機能により、夫々のインデックスを生かす連携作用が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施の形態のシステムブロック概略図である。
【図2】本発明の登録処理のフローチャートである。
【図3】本発明の単語・文字インデックス登録処理のフローチャートである。
【図4】本発明の単語インデックスの構成図である。
【図5】本発明の文字インデックスの構成図である。
【図6】本発明のページDBの構成図である。
【図7】本発明の文書DBの構成図である。
【図8】本発明の検索処理のフローチャートである。
【図9】本発明の新語・造語学習処理のフローチャートである。
【符号の説明】
1 イメージスキャナ
2 OCR処理ソフトウエア
3 全文検索ソフトウエア
4 外部記憶装置
5 キーボード
6 表示装置

Claims (4)

  1. 登録した文書データから検索文字列を含む文書データを検索する登録情報検索装置において、
    検索対象の文書データに含まれる文字列から、予め決定された複数の単語キーを記憶している単語キー記憶手段に記憶された単語キーを抽出する抽出手段と、
    前記抽出した単語キーを第1の保持テーブルに登録する一方、前記抽出手段で単語キーとして抽出されなかった文字列から作成した文字キーを第2の保持テーブルに登録する登録手段と、
    検索文字列を指示する指示手段と、
    検索文字列を前記単語キー記憶手段を用いて単語キーと文字キーとに分解する分解手段と、
    前記分解手段で分解された単語キーと文字キーとをそれぞれ前記第1の保持テーブルと第2の保持テーブルとから検索する検索手段と、
    第2の保持テーブルに保持された文字キーを用いて検索文字列を含む文書データがヒットした場合、該検索文字列を前記単語キー記憶手段と前記第1の保持テーブルとに登録することを特徴とする登録情報検索装置。
  2. 前記第2の保持テーブルは、1文字または2文字のデータ長の文字キーインデックスを保持することを特徴とする請求項1記載の登録情報検索装置。
  3. 前記第2の保持テーブルに保持された文字キーを用いて検索文字列を含む文書データがヒットした場合、該文字キーと対応して保持されていた前記ヒットした文書データを特定するIDを削除することを特徴とする請求項1記載の登録情報検索装置。
  4. 登録した文書データから検索文字列を含む文書データを検索する登録情報検索装置の制御方法において、
    登録情報検索装置が備える抽出手段が、検索対象の文書データに含まれる文字列から、予め決定された複数の単語キーを記憶している単語キー記憶手段に記憶された単語キーを抽出する抽出工程と、
    登録情報検索装置が備える登録手段が、前記抽出した単語キーを第1の保持テーブルに登録する一方、前記抽出工程で単語キーとして抽出されなかった文字列から作成した文字キーを第2の保持テーブルに登録する登録工程と、
    登録情報検索装置が備える指示手段が、検索文字列を指示する指示工程と、
    登録情報検索装置が備える分解手段が、検索文字列を前記単語キー記憶手段を用いて単語キーと文字キーとに分解する分解工程と、
    登録情報検索装置が備える検索手段が、前記分解工程で分解された単語キーと文字キーとをそれぞれ前記第1の保持テーブルと第2の保持テーブルとから検索する検索工程と、
    第2の保持テーブルに保持された文字キーを用いて検索文字列を含む文書データがヒットした場合、該検索文字列を前記単語キー記憶手段と前記第1の保持テーブルとに登録することを特徴とする登録情報検索方法。
JP06281796A 1996-03-19 1996-03-19 登録情報検索装置及びその方法 Expired - Fee Related JP3825829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06281796A JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06281796A JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Publications (2)

Publication Number Publication Date
JPH09259132A JPH09259132A (ja) 1997-10-03
JP3825829B2 true JP3825829B2 (ja) 2006-09-27

Family

ID=13211273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06281796A Expired - Fee Related JP3825829B2 (ja) 1996-03-19 1996-03-19 登録情報検索装置及びその方法

Country Status (1)

Country Link
JP (1) JP3825829B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10057634C2 (de) * 2000-11-21 2003-01-30 Bosch Gmbh Robert Verfahren zur Verarbeitung von Text in einer Rechnereinheit und Rechnereinheit
JP2002342373A (ja) * 2001-05-21 2002-11-29 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法、装置、プログラム、同プログラムを記録した記録媒体
JP5494066B2 (ja) * 2010-03-17 2014-05-14 富士通株式会社 検索装置、検索方法および検索プログラム
WO2013179441A1 (ja) * 2012-05-31 2013-12-05 株式会社日立製作所 検索サーバ、検索方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03229367A (ja) * 1990-02-05 1991-10-11 Nippon Telegr & Teleph Corp <Ntt> テキストベース検索方式

Also Published As

Publication number Publication date
JPH09259132A (ja) 1997-10-03

Similar Documents

Publication Publication Date Title
KR970076328A (ko) 문서 정보 검색 시스템
JPH10501912A (ja) Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法
JP2006085733A (ja) ファイリング・検索装置およびファイリング・検索方法
JPH0314184A (ja) 文書画像再配置ファイリング装置
JPH0484271A (ja) 文書内情報検索装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP2005107931A (ja) 画像検索装置
JPH05324719A (ja) 文書検索システム
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3727995B2 (ja) 文書処理方法及び装置
JPS6378228A (ja) 情報検索装置
JPH0561910A (ja) 全文インデツクス検索方法
JPH0991305A (ja) 情報処理方法及び装置
JPH06309365A (ja) 文書処理装置
JPS62106574A (ja) 文書画像フアイル登録検索方式
JPH0877179A (ja) 文書索引生成装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH08314950A (ja) テキストの検索方法及び装置
JP3085508B2 (ja) 電子帳票検索システム
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP3187671B2 (ja) 電子辞書表示装置
JPH06309368A (ja) 文書検索装置
JPH09146968A (ja) 文書検索方法
JP2601139B2 (ja) 文字列検索装置
JP2001092831A (ja) 文書検索装置及び文書検索方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060703

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110707

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130707

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees