JP2004192221A - 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 - Google Patents
文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 Download PDFInfo
- Publication number
- JP2004192221A JP2004192221A JP2002358070A JP2002358070A JP2004192221A JP 2004192221 A JP2004192221 A JP 2004192221A JP 2002358070 A JP2002358070 A JP 2002358070A JP 2002358070 A JP2002358070 A JP 2002358070A JP 2004192221 A JP2004192221 A JP 2004192221A
- Authority
- JP
- Japan
- Prior art keywords
- document
- print result
- search
- document print
- result information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】文書の印刷に関する情報を利用して検索結果を判断する文書検索処理方法及び装置を提供する。
【解決手段】文書が印刷された際に印刷に関わる情報を記憶する。その文書印刷実績情報の一部を指定する。指定された情報を利用した文書検索を可能とする。また、文書印刷実績情報の一部を項目別に適合条件および重みを指定することを可能とする。
【選択図】 図1
【解決手段】文書が印刷された際に印刷に関わる情報を記憶する。その文書印刷実績情報の一部を指定する。指定された情報を利用した文書検索を可能とする。また、文書印刷実績情報の一部を項目別に適合条件および重みを指定することを可能とする。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、文書データを検索する文書検索処理方法及び装置並びに記憶媒体に関する。
【0002】
【従来の技術】
大量の文書データを扱う機会が増加してきたため、所望の文書データを検索する手段も多種多様になってきている。単純なキーワード検索(キーワードを指示し、それが出現するか否かで検索を行う)ではユーザの要求を十分に満たさなくなってきているためである。そのため文書の内容の特徴をデータ化し、その類似度を用いて検索する文書概念検索を行う方法が増えてきている。
【0003】
【発明が解決しようとする課題】
しかし、そのように高度化が進む検索で検索を行っても、似たような文書タイトルが並んでいる場合がある。これは電子データの場合、複製・更新が容易であるため過去のデータが残されているケースが多いため。また目的の微細な違いによって数種類の微細な違いしかない文書がならんでいることもある。
【0004】
いずれの場合もユーザの目的がはっきりしている場合は、再度絞り込んだ検索を行うなり、検索結果のデータをそれぞれ開いて細部を確認すれば目的のデータをみつけることが可能である。しかし、目的を正確に把握していないケースもある。会社業務での申請書等の類や、他者から指示された場合(たとえばタイトルのみ指示された場合等)など細部を確認しても判断しにくい場合がある。そのような場合に、それらの文書の最近の印刷状況や印刷者等の情報は、判断するうえの有効な情報になりうる。
【0005】
また文書が印刷されているという事実は、文書の内容の価値が高く、老朽化していないことをある程度示唆している。印刷の期日や印刷者を限定すれば、有効な判断材料となる。よって文書検索のスコアリングに組入れることで、よりユーザ所望の文書を検索結果の上位に出力させることが可能である。例えば、社内の最新技術資料等を検索する場合に、上記印刷実績情報によって注目度を図ることが可能となる。
【0006】
本発明は、上記従来技術の有する問題点を解消するためになされたもので、その第1の目的は、文書の印刷に関する情報を利用して検索結果を判断する文書検索処理方法及び装置を提供することである。
【0007】
また、本発明の第2の目的は、上述したような本発明の文書検索処理装置を制御するための制御プログラムを格納した記憶媒体を提供することである。
【0008】
【課題を解決するための手段】
上記の目的を達成するために、本発明の請求項1に記載の文書検索処理方法は、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶ステップと、文書印刷実績情報の一部を指定する文書印刷実績情報指定ステップと、前記文書印刷実績記憶ステップで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定ステップで指定された情報を利用することを特徴とする。
【0009】
また、上記第1の目的を達成するために、本発明の請求項2に記載の文書検索処理方法は、請求項1に記載の文書検索処理方法において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定ステップを有することを特徴とする。
【0010】
また、上記第1の目的を達成するために、本発明の請求項3に記載の文書検索処理方法は、請求項1に記載の文書検索処理方法において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定ステップを有することを特徴とする。
【0011】
また、上記第1の目的を達成するために、本発明の請求項4に記載の文書検索処理装置は、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶手段と、文書印刷実績情報の一部を指定する文書印刷実績情報指定手段と、前記文書印刷実績記憶手段で記憶されたうちの文書印刷実績情報を前記文書印刷実績指定手段で指定された情報を利用することを特徴とする。
【0012】
また、上記第1の目的を達成するために、本発明の請求項5に記載の文書検索処理方法は、請求項4に記載の文書検索処理装置において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定手段を有することを特徴とする。
【0013】
また、上記第1の目的を達成するために、本発明の請求項6に記載の文書検索処理方法は、請求項4に記載の文書検索処理装置において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定手段を有することを特徴とする。
【0014】
また、上記第2の目的を達成するために、本発明の請求項7に記載の記憶媒体は、文書データを検索する文書検索処理装置を制御するためのコンピュータで読み取り可能な制御プログラムを格納した記憶媒体であって、前記制御プログラムは、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶モジュールと、文書印刷実績情報の一部を指定する文書印刷実績情報指定モジュールと、前記文書印刷実績記憶モジュールで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定モジュールで指定された情報を利用することを特徴とする。
【0015】
また、上記第2の目的を達成するために、本発明の請求項8に記載の記憶媒体は、請求項7に記載の記憶媒体において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定モジュールを有することを特徴とする。
【0016】
また、上記第2の目的を達成するために、本発明の請求項9に記載の記憶媒体は、請求項7に記載の記憶媒体において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定モジュールを有することを特徴とする。
【0017】
【発明の実施の形態】
以下、本発明の各実施の形態について、図面を用いて説明する。
【0018】
(第1の実施の形態)
まず、本発明の第1の実施の形態について、図1〜図12を用いて説明する。
【0019】
図1〜図3は、本実施の形態に係る文書検索処理装置の構成を示す図である。
【0020】
図1はネットワーク構成を示した図である。ネットワークに数種のサーバーと多くのクライアント、そしてネットワークプリンタをはじめとする周辺機器がつながれている。サーバーは文書管理サーバー、文書検索サーバー、プリントサーバー等の機能で分担されており、ユーザはクライアントからそれらが一つのシステムであるかのようにオペレートすることが可能である。
【0021】
図2は、上記ネットワーク全体を一つの文書検索処理装置とみたてた場合のシステム構成を示したブロック図である。
【0022】
同図において、201は検索処理部である。検索指示を解析し、登録されているデータ内を検索し、その結果を出力する機能を担う。本機能は図1において検索サーバーがこれを担う。
【0023】
202は登録部である。登録の指示を受け、検索の対象となるデータを解析し、検索のための情報とデータそのものをデータベースに登録する機能を担う。本機能は図1においては文書管理サーバー、および文書検索サーバーがこれを担う。
【0024】
203はIF(インターフェース)部である。データの登録や検索、印刷等の指示を受け付け、その結果を表示する機能を担う。本機能は図1においてはクライアントがそれぞれ担う。
【0025】
204はデータベース部である。検索用のデータ、検索対象そのもののデータ等をデータベースで管理する機能を担う。本機能は図1においては各種サーバーが分担して担う。
【0026】
205は印刷部である。印刷の指示を受け、データを印刷する機能を担う。本機能は図1においては、プリンタサーバおよびプリンタが担う。
【0027】
206はネットワークバスである。各機能部間のデータのやりとりを担う。本機能は図1におけるネットワークそのものと、ネットワークに繋がるすべての機材が担う。
【0028】
図3は、図2で示した各機能部を担当する実際のシステムにおけるサーバーおよびクライアントシステムの基本構成を示した図である。
【0029】
同図において、301はCPU(マイクロプロセッサ:中央演算処理装置)で、文書検索のための演算、論理判断等を行い、後述するバス(BUS)309を介して該バス309に接続された後述する各構成要素を制御する。
【0030】
302はROM(リードオンリーメモリ)で、読み出し専用の固定メモリであり、CPU301による制御プログラム等を記憶している。
【0031】
303はRAM(ランダムアクセスメモリ)で、各構成要素からの各種データの一時記憶に用いる。
【0032】
304は入力装置で、キーボード及びマウス等からなる。
【0033】
305は表示装置で、CRT(陰極線管)或いは液晶表示器等からなる。
【0034】
306は記憶装置で、ハードディスクからなる。
【0035】
307は外部記憶装置で、フロッピー(R)ディスクや書き込み可能CD、DVD等の外部記憶装置にアクセスするためのドライブ等である。この外部記憶装置307は、記憶装置306と同等に使用でき、それらの記憶媒体を通して他の文書検索処理装置とのデータ交換を行う装置である。
【0036】
308は通信装置で、モデム或いはLAN(ローカルエリアネットワーク)コントローラ等からなり、通信回線を介して外部とのデータ交換を行う装置である。
【0037】
309はバス(BUS)で、CPU301の制御対象である後述する各構成要素を指示するアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。
【0038】
斯かる各構成要素からなる本実施の形態に斯かる文書検索処理装置においては、入力装置304からの各種の入力に応じて作動するものであって、入力装置304からの入力が供給されると、まず、インタラプタ信号がCPU301に送られ、該CPU301がROM302内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。
【0039】
以下、以上の構成よりなる本実施例装置では、印刷実績情報を使用することで高度な文書検索を行なうことが可能である。この処理例を以下に説明する。
【0040】
図4は本発明を適用した文書検索処理装置の文書検索結果の表示画面構成例を示したものである。
【0041】
検索条件パネルには、今回の検索指示内容が表示される。検索指示としての表示例としては、ユーザの手による自然文、あるいはユーザの入力した複数のキーワードの羅列、またユーザが指示した既存の文書の内容等である。検索結果パネルには、上記検索条件によって行われた文書検索結果が表示される。検索結果としてリストアップされた各文書のIDとタイトル、検索適合値および各種印刷情報実績適合値が表示される。本実施例では3種の印刷実績情報適合値が★の数による3段階で表示されている。<time>はユーザー指定期間中に印刷が行われたかを示す。<number>はユーザ指定部数の印刷が行われたか、<member>はユーザ指定メンバーが印刷を行ったか否かを示す。図4の画面例では、ID=2897の文書はユーザ指定期間内での印刷実績が高いことを表し、ID=23988の文書は総印刷部数が多い、つまり利用実績が高いことを表し、ID=1028および10029の文書はユーザ指定メンバー内での利用実績が高いことを表している。
【0042】
図5は本発明を適用した文書検索処理装置の印刷実績情報適合値算出のためのユーザプロファイルデータの例を示したものである。
【0043】
図4の検索結果で示した3種の印刷実績情報適合値に関するユーザ指定値が実際に格納されている。対象印刷時間は、”前1ヶ月”であり、これは検索時よりも1ヶ月前までの印刷を評価することを意味する。対象部数は、”10”であり、これは印刷部数が総計で10部以上の印刷を評価することを意味する。対象印刷者は、”チームA“であり、これはチームA所属のメンバーによる印刷を評価することを意味する。優先度は各印刷情報の重みを示し、それぞれの項目の適合値をもとめたあとに印刷実績情報としての総合適合値を算出する際の比率に換算される。
【0044】
上述の説明をフローに従って説明する。
【0045】
図6は本発明文書検索装置の動作、より具体的にはマイクロプロセッサCPUの処理手順を示すフローチャートである。ステップS601はシステムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップS602はキーボード等の入力装置から何らかのキーが押下され、割込みが発生するのをマイクロプロセッサCPUにおいて待つ処理である。キーが入力されると、ステップS603においてマイクロプロセッサCPUはこのキーを判別し、キーの種類において各種の処理に分岐する。各種キーに対応した分岐先の複数の処理をステップS604という形でまとめて表現している。図7、図8、図9で説明する文書の登録処理、検索実行処理、印刷処理がこの分岐先の一部となる。ステップS605は上記の各処理の結果、変更された部分を表示する表示処理である。表示内容を表示パターンに展開しバッファに出力するといった通常広く行われている処理である。
【0046】
図7はステップS604の一部である文書の登録処理を詳細化したフローチャートである。ステップS701は文書を検索するための情報を生成する処理であり、文書にたいし形態素解析等で使用単語を抽出、また抽出した単語から概念情報を算出する。ステップS702は文書データを文書管理DBに登録するとともに、DBのインデックスを更新する。処理である。ステップS703は、前記ステップS701で生成した検索情報を文書検索DBへ登録するとともに、DBのインデックスを更新する。
【0047】
図8はステップS604の一部である文書の検索実行処理を詳細化したフローチャートである。ステップS801はユーザの検索条件の入力処理であり、ここにおいてユーザは自然文、あるいは複数のキーワードを入力する、あるいは既存の文書を指定する形で類似の文書を検索するように指示する。ステップS802は検索条件情報の生成処理であり、入力文の解析やユーザプロファイルの読込を行う。ステップS803はステップS802で得られた検索条件情報をもとに、対象DB内の各文書において各種の検索適合値を求め、その文書の検索適合値を総合してRAMに格納する処理である。生成した値をDBに登録することも可能である。ステップS804はステップS803で格納した文書毎の検索適合値を順序付けする処理である。ステップS805はステップS804で順序付けされた文書を検索結果としてリストアップして表示する処理である。その際に、ステップS803で登録された検索適合値も同時に表示する。
【0048】
図9はステップS604の一部である文書の印刷処理を詳細化したフローチャートである。ステップS901はユーザの印刷指定処理であり、ここにおいてユーザは文書を印刷および印刷体裁等に関わる指示を行う。ステップS902はステップS901で指示された文書およびその文書の過去の印刷実績情報を含む関連データを文書管理DBおよび文書検索DBより呼び出す処理を行う。ステップS903は呼び出された指定文書を指示された印刷体裁条件に従って印刷を行う。ステップS904は、今回の印刷時間、印刷部数、印刷者等の印刷実績情報をステップS902で呼び出した印刷実績情報に加える。ステップS905はステップS904で更新された印刷実績情報を文書検索DBに登録する。
【0049】
図10はステップS802の処理を詳細化したフローチャートである。ステップS1001は検索クエリとなる入力文を解析する処理である。基本的にステップS701相当の処理が行われる。ステップS1002は検索に関わるユーザ情報をユーザプロファイルから呼び出す処理を行う。ステップS1003は、検索クエリを解析した情報および呼び出されたユーザ情報をもとに、必要な検索種類、その重み付け、優先度等の検索適合値算出のための条件情報をまとめる。ステップS1004は、ステップS1003で解析した検索条件情報を検索処理で参照可能なメモリ等に設定する。
【0050】
図11はステップS803の処理を詳細化したフローチャートである。ステップS1101は検索対象である文書DB内の文書を指定するカウンターNに初期値1をセットする処理である。ステップS1102は文書DBからN番目の文書の検索関連データを呼び出す処理である。ステップS1103は呼び出された検索関連データから、その文書の今回の検索における適合値を算出する処理である。ステップS1104は上記ステップS1103で算出された検索適合値をメモリあるいは所定のDBに格納する処理である。ステップS1105は文書DB内の検索対象文書に残りがあるが判定する処理であり、存在する場合はステップS1109へ分岐する。ステップS1106ではカウンターであるNをカウントアップして、ステップS1102に戻り、検索条件適合値の算出・格納を繰り返す。
【0051】
図12はステップS1103の処理を詳細化したフローチャートである。ステップS1201はステップS1003で設定された検索条件を読み込む処理である。ここで今回必要な検索機能を実行順に設定する。ステップS1202は最初に実行する検索機能に必要な関連データをステップS1201で読み込んだ検索条件から抽出する。ステップS1203は指定されている検索機能の実行を指示する。指定された検索機能によって、ステップS1204〜6に分岐する。ステップS1204はキーワード検索における適合値を算出する処理である。検索条件で読み込まれた検索クエリであるキーワードを文書内容に含むか否かが基本的な判断基準となり、クエリ中のキーワード中の適合度合や、そのキーワードの使用形態(複合語等)で適合値が算出される。ステップS1205は概念検索における適合値を算出する処理である。文書内から形態素解析で抽出された単語を次元とし、頻度等の重み付けで値をとったベクトル表現で特徴をあらわし、ベクトルの内積をもって適合値を算出される。ステップS1206は印刷実績情報検索の適合値を算出する処理である。設定された検索条件のなかの印刷実績情報制限をどれぐらい満たすかで適合値が算出される。また、ここでの結果は総合検索適合値とはべつに表示するために、各印刷実績情報制限別の適合値を所定のメモリに格納しておく。ステップS1207は設定された検索条件で指示された重みにしたがって、各検索機能の適合値の総合値を算出する処理である。ステップS1208は、必要な検索機能の適合値をすべて加算したかを判定する処理である。ステップS1209は、ステップS1208で未実施の検索機能があると判定された場合の処理であり、未実施の検索機能のうちの次に実行すべき検索機能を設定し、ステップS1202へ戻る。ステップS1210は、ステップS1208ですべての検索機能が実行済と判定された場合の処理であり、算出された総合適合値を所定のメモリに格納する。
【0052】
(他の実施例)
上述した第1の実施の形態における印刷実績情報の制限はユーザプロファイルの形でユーザがあらかじめ設定しているが、検索の際に指定させることも可能である。同時に総合検索適合値算出における他の検索機能との重みのバランスを検索時に指定することも可能である。
【0053】
また、印刷実績情報は総合検索適合値に他の機能と同列に扱われているが、総合検索適合値には加算せず、検索結果一覧で参考表示する程度にとどめることも可能である。総合検索値が同値の場合の優先度として使用する程度の利用も可能である。
【0054】
また、本発明は、単体の装置に限らず、複数の装置からなるシステムにも適用可能である。また、それらの装置やシステムに記録媒体や通信装置を使ってソフトウェアを提供することによっても、実現可能であることは言うまでもない。
【0055】
この場合、本発明を達成するためのソフトウェアによって表わされる制御プログラムを格納した記憶媒体を、システム或いは装置に読み出すこと、或いは前記制御プログラムを、ネットワーク経由でシステム或いは装置に読み出すことによって、そのシステム或いは装置が本発明の効果を享受することが可能となる。
【0056】
また、前記制御プログラムを記憶するための記憶媒体としては、ハードディスク、フロッピィディスク、光ディスク、光磁気ディスク、CD−R、DVD、磁気テープ、不揮発性のメモリカード、CD−ROM等を用いることができるのは言うまでもない。
【0057】
【発明の効果】
以上詳述したように、本発明の文書検索処理方法及び装置によれば、文書の印刷に関する情報を利用して文書検索結果を判断することを可能にするという効果を奏する。
【0058】
また、本発明の記憶媒体によれば、上述したような本発明の文書検索処理装置を円滑に制御することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書検索処理装置のネットワーク構成の概要を示す図である。
【図2】本発明の第1の実施の形態に係る文書検索処理装置の機能構成を示すブロック図である。
【図3】本発明の第1の実施の形態に係る文書検索処理装置のシステム構成を示すブロック図である。
【図4】本発明の第1の実施の形態に係る文書検索処理装置における文書検索結果の表示画面構成の一例を示す図である。
【図5】本発明の第1の実施の形態に係る文書検索処理装置におけるユーザプロファイルの印刷実績情報検索に関連する部分の一例を示す図である。
【図6】本発明の第1の実施の形態に係る文書検索処理装置における文書検索処理動作全体の流れを示すフローチャートである。
【図7】本発明の第1の実施の形態に係る文書検索処理装置における文書を文書DBに登録する処理動作の流れを示すフローチャートである。
【図8】本発明の第1の実施の形態に係る文書検索処理装置における文書検索実行処理動作の詳細な流れを示すフローチャートである。
【図9】本発明の第1の実施の形態に係る文書検索処理装置における文書印刷実行処理動作の詳細な流れを示すフローチャートである。
【図10】本発明の第1の実施の形態に係る文書検索処理装置における検索条件情報生成処理動作の詳細な流れを示すフローチャートである。
【図11】本発明の第1の実施の形態に係る文書検索処理装置における対象文書検索適合値格納処理動作の詳細な流れを示すフローチャートである。
【図12】本発明の第1の実施の形態に係る文書検索処理装置における検索適合値生成処理動作の詳細な流れを示すフローチャートである。
【発明の属する技術分野】
本発明は、文書データを検索する文書検索処理方法及び装置並びに記憶媒体に関する。
【0002】
【従来の技術】
大量の文書データを扱う機会が増加してきたため、所望の文書データを検索する手段も多種多様になってきている。単純なキーワード検索(キーワードを指示し、それが出現するか否かで検索を行う)ではユーザの要求を十分に満たさなくなってきているためである。そのため文書の内容の特徴をデータ化し、その類似度を用いて検索する文書概念検索を行う方法が増えてきている。
【0003】
【発明が解決しようとする課題】
しかし、そのように高度化が進む検索で検索を行っても、似たような文書タイトルが並んでいる場合がある。これは電子データの場合、複製・更新が容易であるため過去のデータが残されているケースが多いため。また目的の微細な違いによって数種類の微細な違いしかない文書がならんでいることもある。
【0004】
いずれの場合もユーザの目的がはっきりしている場合は、再度絞り込んだ検索を行うなり、検索結果のデータをそれぞれ開いて細部を確認すれば目的のデータをみつけることが可能である。しかし、目的を正確に把握していないケースもある。会社業務での申請書等の類や、他者から指示された場合(たとえばタイトルのみ指示された場合等)など細部を確認しても判断しにくい場合がある。そのような場合に、それらの文書の最近の印刷状況や印刷者等の情報は、判断するうえの有効な情報になりうる。
【0005】
また文書が印刷されているという事実は、文書の内容の価値が高く、老朽化していないことをある程度示唆している。印刷の期日や印刷者を限定すれば、有効な判断材料となる。よって文書検索のスコアリングに組入れることで、よりユーザ所望の文書を検索結果の上位に出力させることが可能である。例えば、社内の最新技術資料等を検索する場合に、上記印刷実績情報によって注目度を図ることが可能となる。
【0006】
本発明は、上記従来技術の有する問題点を解消するためになされたもので、その第1の目的は、文書の印刷に関する情報を利用して検索結果を判断する文書検索処理方法及び装置を提供することである。
【0007】
また、本発明の第2の目的は、上述したような本発明の文書検索処理装置を制御するための制御プログラムを格納した記憶媒体を提供することである。
【0008】
【課題を解決するための手段】
上記の目的を達成するために、本発明の請求項1に記載の文書検索処理方法は、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶ステップと、文書印刷実績情報の一部を指定する文書印刷実績情報指定ステップと、前記文書印刷実績記憶ステップで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定ステップで指定された情報を利用することを特徴とする。
【0009】
また、上記第1の目的を達成するために、本発明の請求項2に記載の文書検索処理方法は、請求項1に記載の文書検索処理方法において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定ステップを有することを特徴とする。
【0010】
また、上記第1の目的を達成するために、本発明の請求項3に記載の文書検索処理方法は、請求項1に記載の文書検索処理方法において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定ステップを有することを特徴とする。
【0011】
また、上記第1の目的を達成するために、本発明の請求項4に記載の文書検索処理装置は、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶手段と、文書印刷実績情報の一部を指定する文書印刷実績情報指定手段と、前記文書印刷実績記憶手段で記憶されたうちの文書印刷実績情報を前記文書印刷実績指定手段で指定された情報を利用することを特徴とする。
【0012】
また、上記第1の目的を達成するために、本発明の請求項5に記載の文書検索処理方法は、請求項4に記載の文書検索処理装置において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定手段を有することを特徴とする。
【0013】
また、上記第1の目的を達成するために、本発明の請求項6に記載の文書検索処理方法は、請求項4に記載の文書検索処理装置において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定手段を有することを特徴とする。
【0014】
また、上記第2の目的を達成するために、本発明の請求項7に記載の記憶媒体は、文書データを検索する文書検索処理装置を制御するためのコンピュータで読み取り可能な制御プログラムを格納した記憶媒体であって、前記制御プログラムは、文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶モジュールと、文書印刷実績情報の一部を指定する文書印刷実績情報指定モジュールと、前記文書印刷実績記憶モジュールで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定モジュールで指定された情報を利用することを特徴とする。
【0015】
また、上記第2の目的を達成するために、本発明の請求項8に記載の記憶媒体は、請求項7に記載の記憶媒体において、ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定モジュールを有することを特徴とする。
【0016】
また、上記第2の目的を達成するために、本発明の請求項9に記載の記憶媒体は、請求項7に記載の記憶媒体において、文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定モジュールを有することを特徴とする。
【0017】
【発明の実施の形態】
以下、本発明の各実施の形態について、図面を用いて説明する。
【0018】
(第1の実施の形態)
まず、本発明の第1の実施の形態について、図1〜図12を用いて説明する。
【0019】
図1〜図3は、本実施の形態に係る文書検索処理装置の構成を示す図である。
【0020】
図1はネットワーク構成を示した図である。ネットワークに数種のサーバーと多くのクライアント、そしてネットワークプリンタをはじめとする周辺機器がつながれている。サーバーは文書管理サーバー、文書検索サーバー、プリントサーバー等の機能で分担されており、ユーザはクライアントからそれらが一つのシステムであるかのようにオペレートすることが可能である。
【0021】
図2は、上記ネットワーク全体を一つの文書検索処理装置とみたてた場合のシステム構成を示したブロック図である。
【0022】
同図において、201は検索処理部である。検索指示を解析し、登録されているデータ内を検索し、その結果を出力する機能を担う。本機能は図1において検索サーバーがこれを担う。
【0023】
202は登録部である。登録の指示を受け、検索の対象となるデータを解析し、検索のための情報とデータそのものをデータベースに登録する機能を担う。本機能は図1においては文書管理サーバー、および文書検索サーバーがこれを担う。
【0024】
203はIF(インターフェース)部である。データの登録や検索、印刷等の指示を受け付け、その結果を表示する機能を担う。本機能は図1においてはクライアントがそれぞれ担う。
【0025】
204はデータベース部である。検索用のデータ、検索対象そのもののデータ等をデータベースで管理する機能を担う。本機能は図1においては各種サーバーが分担して担う。
【0026】
205は印刷部である。印刷の指示を受け、データを印刷する機能を担う。本機能は図1においては、プリンタサーバおよびプリンタが担う。
【0027】
206はネットワークバスである。各機能部間のデータのやりとりを担う。本機能は図1におけるネットワークそのものと、ネットワークに繋がるすべての機材が担う。
【0028】
図3は、図2で示した各機能部を担当する実際のシステムにおけるサーバーおよびクライアントシステムの基本構成を示した図である。
【0029】
同図において、301はCPU(マイクロプロセッサ:中央演算処理装置)で、文書検索のための演算、論理判断等を行い、後述するバス(BUS)309を介して該バス309に接続された後述する各構成要素を制御する。
【0030】
302はROM(リードオンリーメモリ)で、読み出し専用の固定メモリであり、CPU301による制御プログラム等を記憶している。
【0031】
303はRAM(ランダムアクセスメモリ)で、各構成要素からの各種データの一時記憶に用いる。
【0032】
304は入力装置で、キーボード及びマウス等からなる。
【0033】
305は表示装置で、CRT(陰極線管)或いは液晶表示器等からなる。
【0034】
306は記憶装置で、ハードディスクからなる。
【0035】
307は外部記憶装置で、フロッピー(R)ディスクや書き込み可能CD、DVD等の外部記憶装置にアクセスするためのドライブ等である。この外部記憶装置307は、記憶装置306と同等に使用でき、それらの記憶媒体を通して他の文書検索処理装置とのデータ交換を行う装置である。
【0036】
308は通信装置で、モデム或いはLAN(ローカルエリアネットワーク)コントローラ等からなり、通信回線を介して外部とのデータ交換を行う装置である。
【0037】
309はバス(BUS)で、CPU301の制御対象である後述する各構成要素を指示するアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。
【0038】
斯かる各構成要素からなる本実施の形態に斯かる文書検索処理装置においては、入力装置304からの各種の入力に応じて作動するものであって、入力装置304からの入力が供給されると、まず、インタラプタ信号がCPU301に送られ、該CPU301がROM302内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。
【0039】
以下、以上の構成よりなる本実施例装置では、印刷実績情報を使用することで高度な文書検索を行なうことが可能である。この処理例を以下に説明する。
【0040】
図4は本発明を適用した文書検索処理装置の文書検索結果の表示画面構成例を示したものである。
【0041】
検索条件パネルには、今回の検索指示内容が表示される。検索指示としての表示例としては、ユーザの手による自然文、あるいはユーザの入力した複数のキーワードの羅列、またユーザが指示した既存の文書の内容等である。検索結果パネルには、上記検索条件によって行われた文書検索結果が表示される。検索結果としてリストアップされた各文書のIDとタイトル、検索適合値および各種印刷情報実績適合値が表示される。本実施例では3種の印刷実績情報適合値が★の数による3段階で表示されている。<time>はユーザー指定期間中に印刷が行われたかを示す。<number>はユーザ指定部数の印刷が行われたか、<member>はユーザ指定メンバーが印刷を行ったか否かを示す。図4の画面例では、ID=2897の文書はユーザ指定期間内での印刷実績が高いことを表し、ID=23988の文書は総印刷部数が多い、つまり利用実績が高いことを表し、ID=1028および10029の文書はユーザ指定メンバー内での利用実績が高いことを表している。
【0042】
図5は本発明を適用した文書検索処理装置の印刷実績情報適合値算出のためのユーザプロファイルデータの例を示したものである。
【0043】
図4の検索結果で示した3種の印刷実績情報適合値に関するユーザ指定値が実際に格納されている。対象印刷時間は、”前1ヶ月”であり、これは検索時よりも1ヶ月前までの印刷を評価することを意味する。対象部数は、”10”であり、これは印刷部数が総計で10部以上の印刷を評価することを意味する。対象印刷者は、”チームA“であり、これはチームA所属のメンバーによる印刷を評価することを意味する。優先度は各印刷情報の重みを示し、それぞれの項目の適合値をもとめたあとに印刷実績情報としての総合適合値を算出する際の比率に換算される。
【0044】
上述の説明をフローに従って説明する。
【0045】
図6は本発明文書検索装置の動作、より具体的にはマイクロプロセッサCPUの処理手順を示すフローチャートである。ステップS601はシステムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップS602はキーボード等の入力装置から何らかのキーが押下され、割込みが発生するのをマイクロプロセッサCPUにおいて待つ処理である。キーが入力されると、ステップS603においてマイクロプロセッサCPUはこのキーを判別し、キーの種類において各種の処理に分岐する。各種キーに対応した分岐先の複数の処理をステップS604という形でまとめて表現している。図7、図8、図9で説明する文書の登録処理、検索実行処理、印刷処理がこの分岐先の一部となる。ステップS605は上記の各処理の結果、変更された部分を表示する表示処理である。表示内容を表示パターンに展開しバッファに出力するといった通常広く行われている処理である。
【0046】
図7はステップS604の一部である文書の登録処理を詳細化したフローチャートである。ステップS701は文書を検索するための情報を生成する処理であり、文書にたいし形態素解析等で使用単語を抽出、また抽出した単語から概念情報を算出する。ステップS702は文書データを文書管理DBに登録するとともに、DBのインデックスを更新する。処理である。ステップS703は、前記ステップS701で生成した検索情報を文書検索DBへ登録するとともに、DBのインデックスを更新する。
【0047】
図8はステップS604の一部である文書の検索実行処理を詳細化したフローチャートである。ステップS801はユーザの検索条件の入力処理であり、ここにおいてユーザは自然文、あるいは複数のキーワードを入力する、あるいは既存の文書を指定する形で類似の文書を検索するように指示する。ステップS802は検索条件情報の生成処理であり、入力文の解析やユーザプロファイルの読込を行う。ステップS803はステップS802で得られた検索条件情報をもとに、対象DB内の各文書において各種の検索適合値を求め、その文書の検索適合値を総合してRAMに格納する処理である。生成した値をDBに登録することも可能である。ステップS804はステップS803で格納した文書毎の検索適合値を順序付けする処理である。ステップS805はステップS804で順序付けされた文書を検索結果としてリストアップして表示する処理である。その際に、ステップS803で登録された検索適合値も同時に表示する。
【0048】
図9はステップS604の一部である文書の印刷処理を詳細化したフローチャートである。ステップS901はユーザの印刷指定処理であり、ここにおいてユーザは文書を印刷および印刷体裁等に関わる指示を行う。ステップS902はステップS901で指示された文書およびその文書の過去の印刷実績情報を含む関連データを文書管理DBおよび文書検索DBより呼び出す処理を行う。ステップS903は呼び出された指定文書を指示された印刷体裁条件に従って印刷を行う。ステップS904は、今回の印刷時間、印刷部数、印刷者等の印刷実績情報をステップS902で呼び出した印刷実績情報に加える。ステップS905はステップS904で更新された印刷実績情報を文書検索DBに登録する。
【0049】
図10はステップS802の処理を詳細化したフローチャートである。ステップS1001は検索クエリとなる入力文を解析する処理である。基本的にステップS701相当の処理が行われる。ステップS1002は検索に関わるユーザ情報をユーザプロファイルから呼び出す処理を行う。ステップS1003は、検索クエリを解析した情報および呼び出されたユーザ情報をもとに、必要な検索種類、その重み付け、優先度等の検索適合値算出のための条件情報をまとめる。ステップS1004は、ステップS1003で解析した検索条件情報を検索処理で参照可能なメモリ等に設定する。
【0050】
図11はステップS803の処理を詳細化したフローチャートである。ステップS1101は検索対象である文書DB内の文書を指定するカウンターNに初期値1をセットする処理である。ステップS1102は文書DBからN番目の文書の検索関連データを呼び出す処理である。ステップS1103は呼び出された検索関連データから、その文書の今回の検索における適合値を算出する処理である。ステップS1104は上記ステップS1103で算出された検索適合値をメモリあるいは所定のDBに格納する処理である。ステップS1105は文書DB内の検索対象文書に残りがあるが判定する処理であり、存在する場合はステップS1109へ分岐する。ステップS1106ではカウンターであるNをカウントアップして、ステップS1102に戻り、検索条件適合値の算出・格納を繰り返す。
【0051】
図12はステップS1103の処理を詳細化したフローチャートである。ステップS1201はステップS1003で設定された検索条件を読み込む処理である。ここで今回必要な検索機能を実行順に設定する。ステップS1202は最初に実行する検索機能に必要な関連データをステップS1201で読み込んだ検索条件から抽出する。ステップS1203は指定されている検索機能の実行を指示する。指定された検索機能によって、ステップS1204〜6に分岐する。ステップS1204はキーワード検索における適合値を算出する処理である。検索条件で読み込まれた検索クエリであるキーワードを文書内容に含むか否かが基本的な判断基準となり、クエリ中のキーワード中の適合度合や、そのキーワードの使用形態(複合語等)で適合値が算出される。ステップS1205は概念検索における適合値を算出する処理である。文書内から形態素解析で抽出された単語を次元とし、頻度等の重み付けで値をとったベクトル表現で特徴をあらわし、ベクトルの内積をもって適合値を算出される。ステップS1206は印刷実績情報検索の適合値を算出する処理である。設定された検索条件のなかの印刷実績情報制限をどれぐらい満たすかで適合値が算出される。また、ここでの結果は総合検索適合値とはべつに表示するために、各印刷実績情報制限別の適合値を所定のメモリに格納しておく。ステップS1207は設定された検索条件で指示された重みにしたがって、各検索機能の適合値の総合値を算出する処理である。ステップS1208は、必要な検索機能の適合値をすべて加算したかを判定する処理である。ステップS1209は、ステップS1208で未実施の検索機能があると判定された場合の処理であり、未実施の検索機能のうちの次に実行すべき検索機能を設定し、ステップS1202へ戻る。ステップS1210は、ステップS1208ですべての検索機能が実行済と判定された場合の処理であり、算出された総合適合値を所定のメモリに格納する。
【0052】
(他の実施例)
上述した第1の実施の形態における印刷実績情報の制限はユーザプロファイルの形でユーザがあらかじめ設定しているが、検索の際に指定させることも可能である。同時に総合検索適合値算出における他の検索機能との重みのバランスを検索時に指定することも可能である。
【0053】
また、印刷実績情報は総合検索適合値に他の機能と同列に扱われているが、総合検索適合値には加算せず、検索結果一覧で参考表示する程度にとどめることも可能である。総合検索値が同値の場合の優先度として使用する程度の利用も可能である。
【0054】
また、本発明は、単体の装置に限らず、複数の装置からなるシステムにも適用可能である。また、それらの装置やシステムに記録媒体や通信装置を使ってソフトウェアを提供することによっても、実現可能であることは言うまでもない。
【0055】
この場合、本発明を達成するためのソフトウェアによって表わされる制御プログラムを格納した記憶媒体を、システム或いは装置に読み出すこと、或いは前記制御プログラムを、ネットワーク経由でシステム或いは装置に読み出すことによって、そのシステム或いは装置が本発明の効果を享受することが可能となる。
【0056】
また、前記制御プログラムを記憶するための記憶媒体としては、ハードディスク、フロッピィディスク、光ディスク、光磁気ディスク、CD−R、DVD、磁気テープ、不揮発性のメモリカード、CD−ROM等を用いることができるのは言うまでもない。
【0057】
【発明の効果】
以上詳述したように、本発明の文書検索処理方法及び装置によれば、文書の印刷に関する情報を利用して文書検索結果を判断することを可能にするという効果を奏する。
【0058】
また、本発明の記憶媒体によれば、上述したような本発明の文書検索処理装置を円滑に制御することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書検索処理装置のネットワーク構成の概要を示す図である。
【図2】本発明の第1の実施の形態に係る文書検索処理装置の機能構成を示すブロック図である。
【図3】本発明の第1の実施の形態に係る文書検索処理装置のシステム構成を示すブロック図である。
【図4】本発明の第1の実施の形態に係る文書検索処理装置における文書検索結果の表示画面構成の一例を示す図である。
【図5】本発明の第1の実施の形態に係る文書検索処理装置におけるユーザプロファイルの印刷実績情報検索に関連する部分の一例を示す図である。
【図6】本発明の第1の実施の形態に係る文書検索処理装置における文書検索処理動作全体の流れを示すフローチャートである。
【図7】本発明の第1の実施の形態に係る文書検索処理装置における文書を文書DBに登録する処理動作の流れを示すフローチャートである。
【図8】本発明の第1の実施の形態に係る文書検索処理装置における文書検索実行処理動作の詳細な流れを示すフローチャートである。
【図9】本発明の第1の実施の形態に係る文書検索処理装置における文書印刷実行処理動作の詳細な流れを示すフローチャートである。
【図10】本発明の第1の実施の形態に係る文書検索処理装置における検索条件情報生成処理動作の詳細な流れを示すフローチャートである。
【図11】本発明の第1の実施の形態に係る文書検索処理装置における対象文書検索適合値格納処理動作の詳細な流れを示すフローチャートである。
【図12】本発明の第1の実施の形態に係る文書検索処理装置における検索適合値生成処理動作の詳細な流れを示すフローチャートである。
Claims (9)
- 文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶ステップと、
文書印刷実績情報の一部を指定する文書印刷実績情報指定ステップと、
前記文書印刷実績記憶ステップで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定ステップで指定された情報を利用することを特徴とする文書検索処理方法。 - ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定ステップを有することを特徴とする請求項1の文書検索処理方法。
- 文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定ステップを有することを特徴とする請求項1の文書検索処理方法。
- 文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶手段と、
文書印刷実績情報の一部を指定する文書印刷実績情報指定手段と、
前記文書印刷実績記憶手段で記憶されたうちの文書印刷実績情報を前記文書印刷実績指定手段で指定された情報を利用することを特徴とする文書検索処理装置。 - ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定手段を有することを特徴とする請求項4の文書検索装置。
- 文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定手段を有することを特徴とする請求項4の文書検索装置。
- 文書データを検索する文書検索処理装置を制御するためのコンピュータで読み取り可能な制御プログラムを格納した記憶媒体であって、前記制御プログラムは、
文書が印刷された際に印刷に関わる情報を記憶する文書印刷実績記憶モジュールと、
文書印刷実績情報の一部を指定する文書印刷実績情報指定モジュールと、
前記文書印刷実績記憶モジュールで記憶されたうちの文書印刷実績情報を前記文書印刷実績指定モジュールで指定された情報を利用することを特徴とする記憶媒体。 - ユーザが文書印刷実績情報の項目別に適合条件を指定する文書印刷実績情報適合条件指定モジュールを有することを特徴とする請求項7の記憶媒体。
- 文書印刷実績情報のうち項目別に重みを指定する文書印刷実績項目別優先度指定モジュールを有することを特徴とする請求項7の記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358070A JP2004192221A (ja) | 2002-12-10 | 2002-12-10 | 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358070A JP2004192221A (ja) | 2002-12-10 | 2002-12-10 | 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004192221A true JP2004192221A (ja) | 2004-07-08 |
Family
ID=32757894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002358070A Withdrawn JP2004192221A (ja) | 2002-12-10 | 2002-12-10 | 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004192221A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122685A (ja) * | 2005-09-30 | 2007-05-17 | Ricoh Co Ltd | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2012185696A (ja) * | 2011-03-07 | 2012-09-27 | Dainippon Printing Co Ltd | 文書検索装置 |
JP2013186514A (ja) * | 2012-03-06 | 2013-09-19 | Fujifilm Corp | 印刷条件決定装置、印刷条件決定方法及びプログラム |
-
2002
- 2002-12-10 JP JP2002358070A patent/JP2004192221A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122685A (ja) * | 2005-09-30 | 2007-05-17 | Ricoh Co Ltd | 情報処理装置、情報処理方法及び情報処理プログラム |
US7986431B2 (en) | 2005-09-30 | 2011-07-26 | Ricoh Company, Limited | Information processing apparatus, information processing method, and computer program product |
JP2012185696A (ja) * | 2011-03-07 | 2012-09-27 | Dainippon Printing Co Ltd | 文書検索装置 |
JP2013186514A (ja) * | 2012-03-06 | 2013-09-19 | Fujifilm Corp | 印刷条件決定装置、印刷条件決定方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4308587B2 (ja) | 文書群管理装置 | |
US8584009B2 (en) | Automatically propagating changes in document access rights for subordinate document components to superordinate document components | |
JP2007122685A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US6961724B1 (en) | Method and apparatus for image retrieval | |
JP2001256255A (ja) | データ検索装置及びデータ検索方法 | |
JP2009123114A (ja) | 情報処理装置及び情報処理方法 | |
JPH05324728A (ja) | 情報検索装置 | |
JP2004192221A (ja) | 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体 | |
JP3578651B2 (ja) | 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH1115841A (ja) | 情報検索装置及び情報検索プログラムを記録した媒体 | |
JPH1139338A (ja) | 文書検索装置、文書検索方法及び文書検索のためのプログラムを記録した媒体 | |
JP2812357B2 (ja) | データベース検索システム | |
JP2000099531A (ja) | 情報処理装置 | |
JPH10260981A (ja) | 情報処理装置および情報処理方法 | |
JPS61182131A (ja) | 情報検索システム | |
JP2006031209A (ja) | 全文検索システム、全文検索方法、プログラムおよび記録媒体 | |
JP2001147922A (ja) | 文書管理装置、文書管理方法および記憶媒体 | |
JP6939473B2 (ja) | 文書処理装置及びプログラム | |
JP3198941B2 (ja) | 情報処理装置及び記録媒体 | |
JP2005327023A (ja) | ヒット数予想を利用した全文検索の検索方式 | |
US20040122824A1 (en) | Apparatus and method for market-based document content selection | |
JP2005173795A (ja) | 文書検索装置、およびその検索方法、並びに記憶媒体 | |
JP2004088454A (ja) | 画像情報表示システム | |
JP2005190453A (ja) | 検索結果表示システムおよび検索結果表示プログラム | |
JP3659595B2 (ja) | 構造化文書の文書部品管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060307 |