JP2005173795A - 文書検索装置、およびその検索方法、並びに記憶媒体 - Google Patents

文書検索装置、およびその検索方法、並びに記憶媒体 Download PDF

Info

Publication number
JP2005173795A
JP2005173795A JP2003410329A JP2003410329A JP2005173795A JP 2005173795 A JP2005173795 A JP 2005173795A JP 2003410329 A JP2003410329 A JP 2003410329A JP 2003410329 A JP2003410329 A JP 2003410329A JP 2005173795 A JP2005173795 A JP 2005173795A
Authority
JP
Japan
Prior art keywords
document
similarity
search
document search
similarity determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003410329A
Other languages
English (en)
Inventor
Daiki Suzuki
大記 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003410329A priority Critical patent/JP2005173795A/ja
Publication of JP2005173795A publication Critical patent/JP2005173795A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 大量の文書データを扱う検索において、効率的にユーザが所望する文書データを検索することができる文書検索装置、およびその文書検索方法、並びに記憶媒体を提供する。
【解決手段】 文書毎に複数の類似性判定基準により判定し、その総合結果を表示する際に検索結果の類似性判定において有効であった類似性判定基準を表示する。
【選択図】 図8

Description

本発明は、文書検索装置、およびその文書検索方法、並びに記憶媒体に関する。
電子化された文書も実際は多種多様であり、純粋な文字列のみのテキストからレイアウト構造やフォント等の付加属性を持ったもの、画像データを包含しているもの、プリントされた文書をスキャンしたデータ等である。また扱う量も膨大となり、データを効率良く扱うための多種多様の検索技術も用意されている。文字列を検索する技術、レイアウト構造や画像データを検索する技術等である。
現在は情報処理技術・ネットワーク技術の発展により増え続ける情報をより効率よく扱うために、情報の一元管理を目指す検索の統合化と高度化が進んでいる。
統合化は先にあげた対象によって異なる検索を統合することであり、文書を構成する対象や属性情報によって検索判断基準が用意される。
高度化は対象が同じでもより深く分析した手法や異なる方法による検索を組合せることである。例えば文書のテキスト検索では単純なキーワード検索による文書検索(キーワードを指示し、求める文書データが出現するか否かで行う検索)だけでなく、キーワード間の関係や、使用単語の概念から本質的な意味概念の比較等から総合して判断する。
以上、統合化・高度化によりユーザが多種多様かつ膨大な文書の中から所望の文書を検索するための類似性判定基準は増やすことで、より高度な検索を実現させてきている。
しかしながら、検索精度を高めるために検索の判定基準が複雑になると、その判定基準すべてがユーザの所望している判定基準に合致しているとは限らなくなる。つまり表示された文書の検索結果の中にはユーザの所望する判定基準による類似性が高い文書と他の判定基準による類似性が高い文書が混在することになる。タイトルからそれらの判別が容易につかない場合、ユーザは各検索結果の内容をそれぞれ確認する必要が生じ、所望の文書を得るのに時間がかかることになる。検索の判定基準が多くなればなるほど、この傾向は強まることになる。
多文書を内容等で自動的に分類する技術が特許文献1などで開示されている。検索判定基準が自動分類での分類基準に使用可能であれば、検索結果を自動分類することで結果対象の確認効率を向上させることができる。しかし、この方法では分類された各カテゴリーを超えた総合判定順に文書を確認していくことが難しい。これはユーザ所望の判定基準が少数の場合は有効であるが、数が多いとかえって確認の無駄が増大する。全体の判定基準の数が多い場合もまた同様である。そもそも全体の判定基準が少数であれば、その内訳を有効・無効を問わずにすべて表示することが可能になる。
特開平8−305710号公報
本発明の目的は、上述した課題を解決するためになされたものであり、その目的は複数の類似性判定基準により判定された結果を総合して文書を検索する類似文書検索手段による文書検索において、検索結果の類似性判定において有効であった類似性判定基準を表示することにより、効率的にユーザが所望する文書データを結果のなかから選別することができる文書検索装置、およびその文書検索方法、並びに記憶媒体を提供することにある。
上記目的を達成するために、本発明は、文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する類似文書検索手段とを備える文書検索装置において、検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示手段を具備することを特徴とする文書検索装置を提供する。
また、本発明は文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する類似文書検索工程とを備える文書検索方法において、検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示工程を具備することを特徴とする文書検索方法を提供する。
また、本発明は文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する文書検索処理装置を制御するためのコンピュータで読み取り可能な制御プログラムを格納した記憶媒体であって、前記制御プログラムが、検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示モジュールを具備することを特徴とする記憶媒体を提供する。
本発明の文書検索処理方法及び装置によれば、検索結果の類似性判定において有効であった類似性判定基準を表示することにより、ユーザは表示された検索結果文書がなぜ結果としてあげられているかを確認することが可能であり、多くの判定基準を用いた検索結果においても効率的にその場でユーザ所望の判定基準による検索結果を選ぶことが可能となる。また、本発明の記憶媒体によれば、上述したような本発明の文書検索処理装置を円滑に制御することができるという効果を奏する。
以下、本発明の各実施の形態について、図面を用いて説明する。
(第1の実施の形態)
まず、本発明の第1の実施の形態について、図1〜図16を用いて説明する。
図1〜図3は、本実施の形態に係る文書検索処理装置の構成を示す図である。
図1はネットワーク構成を示した図である。ネットワークに数種のサーバーと多くのクライアント、そしてネットワークプリンタをはじめとする周辺機器がつながれている。サーバーは文書管理サーバー、文書検索サーバー、プリントサーバー等の機能で分担されており、ユーザはクライアントからそれらが一つのシステムであるかのようにオペレートすることが可能である。
図2は、上記ネットワーク全体を一つの文書検索処理装置とみたてた場合のシステム構成を示したブロック図である。
同図において、201は検索処理部である。検索指示を解析し、登録されているデータ内を検索し、その結果を出力する機能を担う。本機能は図1において検索サーバーがこれを担う。
202は登録部である。登録の指示を受け、検索の対象となるデータを解析し、検索のための情報とデータそのものをデータベースに登録する機能を担う。本機能は図1においては文書管理サーバー、および文書検索サーバーがこれを担う。
203はIF(インターフェース)部である。データの登録や検索、印刷等の指示を受け付け、その結果を表示する機能を担う。本機能は図1においてはクライアントがそれぞれ担う。
204はデータベース部である。検索用のデータ、検索対象そのもののデータ等をデータベースで管理する機能を担う。本機能は図1においては各種サーバーが分担して担う。
205は印刷部である。印刷の指示を受け、データを印刷する機能を担う。本機能は図1においては、プリンタサーバおよびプリンタが担う。
206はネットワークバスである。各機能部間のデータのやりとりを担う。本機能は図1におけるネットワークそのものと、ネットワークに繋がるすべての機材が担う。
図3は、図2で示した各機能部を担当する実際のシステムにおけるサーバーおよびクライアントシステムの基本構成を示した図である。
同図において、301はCPU(マイクロプロセッサ:中央演算処理装置)で、文書検索のための演算、論理判断等を行い、後述するバス(BUS)309を介して該バス309に接続された後述する各構成要素を制御する。
302はROM(リードオンリーメモリ)で、読み出し専用の固定メモリであり、CPU301による制御プログラム等を記憶している。
303はRAM(ランダムアクセスメモリ)で、各構成要素からの各種データの一時記憶に用いる。
304は入力装置で、キーボード及びマウス等からなる。
305は表示装置で、CRT(陰極線管)或いは液晶表示器等からなる。
306は内部記憶装置で、ハードディスクからなる。
307は外部記憶装置で、フロッピー(登録商標)ディスクや書き込み可能CD、DVD等の外部記憶装置にアクセスするためのドライブ等である。この外部記憶装置307は、記憶装置306と同等に使用でき、それらの記憶媒体を通して他の文書検索処理装置とのデータ交換を行う装置である。
308は通信装置で、モデム或いはLAN(ローカルエリアネットワーク)コントローラ等からなり、通信回線を介して外部とのデータ交換を行う装置である。
309はバス(BUS)で、CPU301の制御対象である後述する各構成要素を指示するアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。
斯かる各構成要素からなる本実施の形態に斯かる文書検索処理装置においては、入力装置304からの各種の入力に応じて作動するものであって、入力装置304からの入力が供給されると、まず、インタラプタ信号がCPU301に送られ、該CPU301がROM302内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。
以下、以上の構成よりなる本実施例装置では、検索結果の類似性判定において有効であった類似性判定基準を表示することで高度な文書検索を行なうことが可能である。この処理例を以下に説明する。
図4は本発明を適用した文書検索処理装置の文書検索結果の表示画面構成例を示したものである。
検索モード401は表示されている文書検索結果を実行した際の検索モードを表示している。検索モードはキーワード検索や類似文書検索、すべての検索を実行する統合検索等の検索種類や検索クエリ中の単語の同義語・類義語展開や検索結果数等の検索時に指定可能なオプションパラメータを含む。ユーザが個別に指定する場合もあり、また検索クエリから検索処理側が自動で判断する場合もある。画面の例では類似文書検索が実行された結果であると表示されている。
検索クエリ402は表示されている文書検索結果を実行した際の検索クエリを表示している。ユーザが直接入力した自然文や、貼り付けられた文書の一部、また文書ファイルそのものを指定することが可能である。画面の例では文書タイトル08088で登録されている文書そのものをクエリとして指定されている。
検索結果ランキング403は実行された文書検索の結果順位を示している。画面の例では上位10件の結果が表示されている。文書タイトル名404は検索結果ランキング403に該当する文書タイトル名を表示、総合類似度405は該当するスコアを表示している。結果はこのスコアによってソーティングされている。
有効類似性判定基準406は検索結果の類似性判定において有効であった類似性判定基準を表示している。
画面の例では、検索結果第1位の文書タイトル08308の文書は、判定基準Aと判定基準Dによって高い類似性が確認され、トップにランキングされたことがわかる。また文書タイトル08090は判定基準Bと判定基準Eによって高い類似性が確認され、第2位にランキングされている。
また検索結果第1位から第6位までの文書は有効判定基準が複数存在しているが、その判定基準間での有効度の違いがフォントの太さによって表現されている。検索結果第1位の文書は判定基準Aと判定基準Dが有効判定基準であるが、判定基準Aが太字表示されていることで、判定基準Aのほうが判定基準Dよりも有効度が高かったことを確認することができる。
図5は本発明を適用した文書検索処理装置の文書検索における類似性判定基準の構成例を示したものである。
本例では5つの「ファイル種」・「文書内容」・「レイアウト」・「画像」・「ファイル属性」の判定基準から総合判定がなされる構成になっている。
「ファイル種」はテキストファイル、画像ファイルのほか、様々なアプリケーションソフトで使用されているファイル種であり、メールやWeb上のファイルもここで分類される。
「文書内容」はさらに詳細な6つの判定基準から構成されている。「文書タイトル」はファイル名や内部でタイトルに使用されている文における類似性、「キーワード」はクエリでのキーワードの有無やキーワード間の関係の類似性を判定する。キーワードを用いた検索は通常広く行われている処理である。
「意味概念」は文書の内容を概念レベルでの類似性を判定するもの、「トピック」は文書の内容の話題を示す分野別特徴量での類似性、「地域」は地域性、「時代」は時代性での類似性を判定する。「意味概念」、「トピック」、「地域」、「時代」はあらかじめ用意された知識データベースを用いて、文書内に出現する単語から各範疇での特徴量に換算させ、その総和を文書全体の特徴量とし、その特徴量間の類似性を判定する。類似性の判定は、各範疇において分類された特徴量をベクトルの要素としたベクトル空間モデルを用意し、ベクトル間の余弦値を類似度として判定するものであり、通常広く行われている処理である。
また、これらの各範疇における分類単位をさらに詳細な判定基準とする。「意味概念」では、「人」「物」「行動」「心理」等が具体的な判定基準である。さらに下位分類である単位も同様で、例えば「人」の下位分類である「親族」「仲間」「老若」「男女」等を判定基準とすることも可能である。「トピック」の例では、「政治」「経済」「軍事」「産業」「文化」となり、「地域」では「関東」「関西」「九州」等の国内分類から、「アメリカ」「イギリス」「ブラジル」「中国」等の世界分類単位がこれに該当、「時代」では「現代」「近代」「古代」等になる。いずれも知識データベースにおける特徴量の分類単位に依るもので、各単位での特徴量がえられれば同様である。
「レイアウト」は文書のレイアウト構造の類似性、「画像」が画像データの類似性を判定する、「ファイル属性」はファイルの作成者や所属、作成日等から類似性を判定するもので、いずれも通常広く行われている処理である。
図5による類似判定基準構成に基づいて、高い類似性が判断された判定基準を可能な限り詳細な判定基準レベルで図4の判定基準A〜Eのように表示する。
上述の説明をフローに従って説明する。
図6は本発明文書検索装置の動作、より具体的にはマイクロプロセッサCPUの処理手順を示すフローチャートである。ステップS601はシステムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップS602はキーボード等の入力装置から何らかのキーが押下され、割込みが発生するのをマイクロプロセッサCPUにおいて待つ処理である。キーが入力されると、ステップS603においてマイクロプロセッサCPUはこのキーを判別し、キーの種類において各種の処理に分岐する。各種キーに対応した分岐先の複数の処理をステップS604という形でまとめて表現している。図7、図8、図9で説明する文書の登録処理、検索実行処理、印刷処理がこの分岐先の一部となる。ステップS605は上記の各処理の結果、変更された部分を表示する表示処理である。表示内容を表示パターンに展開しバッファに出力するといった通常広く行われている処理である。
図7はステップS604で行うキー対応処理の一つである文書の登録処理を詳細化したフローチャートである。本登録処理は、検索対象とする文書を登録する処理である。ステップS701では文書を検索するための情報を生成する処理である。検索対象とする文書から、文書テキストに存在する単語を形態素解析処理で抽出、また抽出された単語から知識データベースを用いて意味概念情報やトピック情報、地域・時代情報を生成、さらにレイアウト構造、画像データから画像特徴量、ファイル情報からファイル作成者や作成日等の属性情報等を抽出する。ステップS702は文書データを文書管理DBに登録するとともに、DBのインデックスを更新する処理である。ステップS703は、前記ステップS701で生成した検索情報を文書検索DBへ登録するとともに、DBのインデックスを更新する。
図8はステップS604で行うキー対応処理の一つである文書の検索実行処理を詳細化したフローチャートである。ステップS801はユーザの検索条件の入力処理であり、ここにおいてユーザは自然文、あるいは複数のキーワードを入力するか、あるいは既に登録済みの文書を指定する文書ID、あるいは文書ファイルを指定する文書ファイル名を入力することで検索クエリを指示する。また、検索方法や検索時の様々なオプションもここで指示する。例えば、検索クエリ内の単語を同義語展開や類義語展開等で拡張して検索する等の指示である。ステップS802は検索条件情報の生成処理であり、検索クエリの解析および総合判定に必要な判定基準の選定、各判定基準の重みを生成する。ステップS803はステップS802で得られた検索条件情報をもとに、対象DB内の各文書において各種の判定基準による類似度を求め、それらを総合した類似度と高い類似性を示した判定基準を指定する情報をRAMに格納する処理である。生成した値をDBに登録することも可能である。ステップS804はステップS803で格納した文書毎の類似度を順序付けする処理である。ステップS805はステップS804で順序付けされた文書を検索結果としてリストアップし、文書を特定する情報と総合類似度、そして類似性判定において有効であった類似性判定基準を表示する処理である。
図9はステップS803の処理を詳細化したフローチャートである。ステップS901は検索対象である文書DB内の文書を指定するカウンターNに初期値1をセットする処理である。ステップS902はステップS703で登録したN番目の文書の検索関連データをデータベースから呼び出す処理である。ステップS903は呼び出された検索関連データから、その文書の今回の検索における類似性を判定する処理である。ステップS904は上記ステップS903で判定された結果をメモリあるいは所定のデータベースに格納する処理である。ステップS905は文書DB内の検索対象文書に残りがあるが判定する処理であり、存在する場合はステップS909へ分岐する。ステップS906ではカウンターであるNをカウントアップして、ステップS902に戻り、類似性判定とその結果の格納を繰り返す。
図10はステップS903の処理を詳細化したフローチャートである。ステップS1001はステップS802で設定された検索条件を読み込む処理である。ステップS1002は最初に実行する判定基準に必要な関連データをステップS902で読み込んだ検索関連データから抽出する。ステップS1003は指定されている判定基準による類似性判定の実行を指示する。指定された判定基準によって、ステップS1004〜6に分岐する。ステップS1004は文書内容に関する類似性を判定する処理である。ステップS1005は文書レイアウト、および包含する画像データに関する類似性を判定する処理である。ステップS1006はファイル種およびファイル属性に関する類似性を判定する処理である。ステップS1004〜6は図5における類似性判定基準構成に依るものである。ステップS1007は設定された検索条件に従がって各類似性判定結果を総合する処理である。検索結果を順序付けするための総合類似度の算出や、高い類似性を示した有効類似性判定基準の識別情報を生成する。ステップS1008は、必要な判定基準の類似性判定がすべて終了したかを判定する処理である。ステップS1009は、ステップS1008で類似性未確認の判定基準があると判定された場合の処理であり、未実施の類似性判定のうちの次に実行すべき判定基準を設定し、ステップS1002へ戻る。ステップS1010は、ステップS1008で必要な判定基準の類似性判定がすべて終了したと判定された場合の処理であり、生成された類似性判定結果を所定のメモリに格納する。
(他の実施例)
本実施の形態の文書検索結果の表示ではユーザに有効判定基準を確認させるための表示として判定基準名を表示しているが、判定基準名の代わりに記号・マーク等の図形や色などで表示することも可能である。また判定基準間の有効度の差も、数値やグラフ等を利用して定量的に表示することも可能である。また判定基準を容易に類推することが可能な具体的なキーワードを表示することも可能である。
また、本発明は、単体の装置に限らず、複数の装置からなるシステムにも適用可能である。また、それらの装置やシステムに記録媒体や通信装置を使ってソフトウェアを提供することによっても、実現可能であることは言うまでもない。
この場合、本発明を達成するためのソフトウェアによって表わされる制御プログラムを格納した記憶媒体を、システム或いは装置に読み出すこと、或いは前記制御プログラムを、ネットワーク経由でシステム或いは装置に読み出すことによって、そのシステム或いは装置が本発明の効果を享受することが可能となる。
また、前記制御プログラムを記憶するための記憶媒体としては、ハードディスク、フロッピィディスク、光ディスク、光磁気ディスク、CD−R、DVD、磁気テープ、不揮発性のメモリカード、CD−ROM等を用いることができるのは言うまでもない。
本発明の第1の実施の形態に係る文書検索処理装置のネットワーク構成の概要を示す図である。 本発明の第1の実施の形態に係る文書検索処理装置の機能構成を示すブロック図である。 本発明の第1の実施の形態に係る文書検索処理装置のシステム構成を示すブロック図である。 本発明の第1の実施の形態に係る文書検索処理装置における文書検索結果の表示画面構成の一例を示す図である。 本発明の第1の実施の形態に係る文書検索処理装置における類似性判定基準の構成の一例を示す図である。 本発明の第1の実施の形態に係る文書検索処理装置における文書検索処理動作全体の流れを示すフローチャートである。 本発明の第1の実施の形態に係る文書検索処理装置における文書登録処理動作の流れを示すフローチャートである。 本発明の第1の実施の形態に係る文書検索処理装置における文書検索実行処理動作の流れを示すフローチャートである。 本発明の第1の実施の形態に係る文書検索処理装置における類似性判定結果格納処理動作の流れを示すフローチャートである。 本発明の第1の実施の形態に係る文書検索処理装置における類似性判定処理動作の流れを示すフローチャートである。

Claims (15)

  1. 文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する類似文書検索手段とを備える文書検索装置において、
    検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示手段を具備することを特徴とする文書検索装置。
  2. 前記類似文書検索手段は、表示される類似性判定基準間で有効度の差に応じて表示方法を変更する有効類似性判定基準表示手段を具備することを特徴とする請求項1記載の文書検索装置。
  3. 前記類似文書検索手段は、文書テキスト、文書内の画像、文書のレイアウト構造、文書ファイル属性、それぞれの対象毎に類似性判定基準が別れている類似文書検索手段を具備することを特徴とする請求項1記載の文書検索装置。
  4. 前記類似文書検索手段は、文書内容から抽出した意味概念により類似性を判定する類似文書検索手段を具備し、分類された意味概念を類似性判定基準とすることを特徴とする請求項1記載の文書検索装置。
  5. 前記類似文書検索手段は、文書内容から抽出した分野別特徴量により類似性を判定する類似文書検索手段を具備し、分類された分野を類似性判定基準とすることを特徴とする請求項1記載の文書検索装置。
  6. 文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する類似文書検索工程とを備える文書検索方法において、
    検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示工程を具備することを特徴とする文書検索方法。
  7. 前記類似文書検索工程は、表示される類似性判定基準間で有効度の差に応じて表示方法を変更する有効類似性判定基準表示工程を具備することを特徴とする請求項6記載の文書検索方法。
  8. 前記類似文書検索工程は、文書テキスト、文書内の画像、文書のレイアウト構造、文書ファイル属性、それぞれの対象毎に類似性判定基準が別れている類似文書検索工程を具備することを特徴とする請求項6記載の文書検索方法。
  9. 前記類似文書検索工程は、文書内容から抽出した意味概念により類似性を判定する類似文書検索工程を具備し、分類された意味概念を類似性判定基準とすることを特徴とする請求項6記載の文書検索方法。
  10. 前記類似文書検索工程は、文書内容から抽出した分野別特徴量により類似性を判定する類似文書検索工程を具備し、分類された分野を類似性判定基準とすることを特徴とする請求項6記載の文書検索方法。
  11. 文書検索の対象である文書毎に複数の類似性判定基準により判定された結果を総合して文書を検索する文書検索処理装置を制御するためのコンピュータで読み取り可能な制御プログラムを格納した記憶媒体であって、
    前記制御プログラムは、
    検索結果の類似性判定において有効であった類似性判定基準を表示する有効類似性判定基準表示モジュールを具備することを特徴とする記憶媒体。
  12. 表示される類似性判定基準間で有効度の差に応じて表示方法を変更する有効類似性判定基準表示モジュールを具備することを特徴とする請求項10記載の記憶媒体。
  13. 文書テキスト、文書内の画像、文書のレイアウト構造、文書ファイル属性、それぞれの対象毎に類似性判定基準が別れている類似文書検索モジュールを具備することを特徴とする請求項10記載の記憶媒体。
  14. 文書内容から抽出した意味概念により類似性を判定する類似文書検索モジュールを具備し、分類された意味概念を類似性判定基準とすることを特徴とする請求項10記載の記憶媒体。
  15. 文書内容から抽出した分野別特徴量により類似性を判定する類似文書検索モジュールを具備し、分類された分野を類似性判定基準とすることを特徴とする請求項10記載の記憶媒体。
JP2003410329A 2003-12-09 2003-12-09 文書検索装置、およびその検索方法、並びに記憶媒体 Withdrawn JP2005173795A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003410329A JP2005173795A (ja) 2003-12-09 2003-12-09 文書検索装置、およびその検索方法、並びに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003410329A JP2005173795A (ja) 2003-12-09 2003-12-09 文書検索装置、およびその検索方法、並びに記憶媒体

Publications (1)

Publication Number Publication Date
JP2005173795A true JP2005173795A (ja) 2005-06-30

Family

ID=34731445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003410329A Withdrawn JP2005173795A (ja) 2003-12-09 2003-12-09 文書検索装置、およびその検索方法、並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP2005173795A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011529600A (ja) * 2008-07-29 2011-12-08 テキストワイズ・リミテッド・ライアビリティ・カンパニー 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011529600A (ja) * 2008-07-29 2011-12-08 テキストワイズ・リミテッド・ライアビリティ・カンパニー 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置

Similar Documents

Publication Publication Date Title
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP5241828B2 (ja) 辞書の単語及び熟語の判定
US20180004850A1 (en) Method for inputting and processing feature word of file content
US6330576B1 (en) User-friendly information processing device and method and computer program product for retrieving and displaying objects
JP2004334334A (ja) 文書検索装置、文書検索方法及び記憶媒体
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US20020083045A1 (en) Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program
JP2007206771A (ja) 情報要素処理プログラム、情報要素処理方法及び情報要素処理装置
KR102437201B1 (ko) 저작물 관리 방법 및 이러한 방법을 수행하는 장치
RU2698405C2 (ru) Способ поиска в базе данных
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JP2005173795A (ja) 文書検索装置、およびその検索方法、並びに記憶媒体
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000163445A (ja) データベース管理システム
JP2002183195A (ja) 概念検索方式
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004145626A (ja) 文書分類支援装置およびコンピュータプログラム
JP3943005B2 (ja) 情報検索プログラム
JP2001147922A (ja) 文書管理装置、文書管理方法および記憶媒体
JP4217410B2 (ja) 情報検索装置及びその制御方法、並びにプログラム
JPH11195041A (ja) 文書検索装置、方法及び記録媒体
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JP2000259658A (ja) 文書分類装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070306