JP4084647B2 - Information search system, information search method, and information search program - Google Patents
Information search system, information search method, and information search program Download PDFInfo
- Publication number
- JP4084647B2 JP4084647B2 JP2002359927A JP2002359927A JP4084647B2 JP 4084647 B2 JP4084647 B2 JP 4084647B2 JP 2002359927 A JP2002359927 A JP 2002359927A JP 2002359927 A JP2002359927 A JP 2002359927A JP 4084647 B2 JP4084647 B2 JP 4084647B2
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- information
- document
- name
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
【0001】
【発明の属する技術分野】
本発明はメタデータが付与されたデータを扱うシステム(体系化システム、と呼ぶ)に関するもので、メタデータの付与に関する技術、あるいは文書およびデータベースの検索方法および検索システムあるいは検索のためのコンピュータプログラムに関する。
【0002】
【従来の技術】
メタデータの付与に関する技術、あるいは文書およびデータベースの検索方法および検索システムあるいは検索のためのコンピュータプログラムに関するものには以下のような技術がある(例えば、特許文献1、特許文献2参照)。
【0003】
特許文献1には、「予め全体のデータベースシステムのメタデータを管理する情報資源管理辞書に、ネットワークに接続されているデータベースシステムの情報収集のための基本的な管理情報を登録しておき、情報収集のための基本的な情報により指定されたタイミングで個別データベースシステムのメタデータや個別の情報資源ツールからメタデータを収集し、収集されたメタデータを情報資源管理辞書に反映させる技術」が記載されている。
【0004】
また特許文献2には、「キーワード整形器は、同意語・不要語を参照して、文書データから文書単語対と文書メタデータを生成する。キーワード関係抽出器は、階層関係を参照して、階層関係、同値関係、連想関係を抽出し、ディレクトリファイル生成器は、トップキーワード、階層関係、同値関係、連想関係、および文書メタデータからディレクトリファイルを生成する。利用者は、ディレクトリアクセス部を介してディレクトリファイルにアクセスする技術」が記載されている。
【0005】
【特許文献1】
特開平10−91503号公報(例えば段落番号0010、0014等、図1等)
【特許文献2】
特開2000−10996号公報(例えば0039、0136、図1、図2等)
【0006】
【発明が解決しようとする課題】
検索処理においては、より利用し易いシステム、方法及びプログラムが望まれている。本発明は例えば情報を概念情報(以下メタデータという)で整理し、メタデータを検索に使用し、検索処理のための情報のカテゴライズ作業としてのメタデータの文書への付与作業の操作性を向上させ、また、メタデータのラベル等を利用した検索方法において、検索処理の操作性を向上させる、あるいは検索精度を向上させる、情報検索システム、情報検索方法及び情報検索プログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明における課題を解決するための第1の手段は、データベースに記憶されている全てのメタデータ値と入力情報との類似度を示す第1の類似情報と、データベースに記憶されている既存の情報のうち、入力情報と類似されているとされたもののメタデータ値と入力情報との類似度を示す第2の類似情報とに基づいて、入力情報にふさわしいメタデータ値を決定することである。
さらに、本発明における課題を解決するための第2の手段は、一般文書やデータベースなどの検索対象を検索しようとする検索情報に基づき、以下の実施の形態で述べている如きメタデータを複数抽出しラベルとして画面に表示し、これらのラベルから特定のラベルを指定することにより、指定されたラベルに基づき選別して検索結果を出力するようにしたことである。その際、互いに関連するメタデータのラベルとの関連を把握しやすくしたことである。
【0008】
【発明の実施の形態】
本発明に係る実施の形態について説明する。図1に情報検索システムの構成を示す。本システムは、複数の操作装置102とこれらの操作装置102からの検索要求に基づき検索を実行する検索処理装置(例えばサーバで構成)101とを備えている。操作装置102は、利用者が検索の操作を行うための装置で、各操作装置102は入力装置としてのキーボードやマウスと出力装置としてのディスプレイや印刷手段を有している。利用者であるクライアントはこの検索処理装置101を利用して文書の登録を行う。その文書に付与すべきメタデータは、システムが自動で付与してくれる。メタデータ自体はシステム構築時にシステム管理者が登録するが、システム構築後もシステム管理者の許可のもと手動で登録を行うことが可能である。
【0009】
次に検索時のメタデータ入力(本実施例ではラベルによる指定)を行い、画面に検索結果を表示する手順について説明する。また検索処理装置101は、文書やメタデータの蓄積手段やメタデータの受付手段および検索結果の出力手段を備えており、さらにメタデータのためのデータベース(以下メタデータDBと記す)103や文書のためのデータベース(文書DB)104、文書とメタデータの組合せに関するデータベース(文書メタデータDB)105に接続されている。メタデータDB103や文書DB104、文書メタデータDB105は主に検索処理を実行する上で利用するデータベースである。
【0010】
図2は上記情報検索システムが検索処理を行う上で、例えばメタデータによる情報検索の処理を行う場合のシステムの動作とデータベースの利用の関係を示す動作説明図である。実際はシステムはプログラムを実行して以下に説明する動作を行うが、仮想的に処理目的を達成するシステムが構築され、そのシステムは処理のための構成を持つとして説明する。但し上述の通り、システムは機能を持ち、処理動作をなすのみで、実際には以下のような専用の構成を備えているものではない、以下の専用の各手段は動作あるいは機能である。図2に本発明の1つの処理手順例を示す。まず図2のステップS200にて、システム構築時に、メタデータ管理者がメタデータのカテゴリを表すメタデータ名とそのメタデータ名に属するメタデータの値を作成する。作成したメタデータ名とメタデータ値はメタデータDB103に登録する。またメタデータの作成にあたりメタデータの上位概念・下位概念などは管理者が設定しなくともよい。そのため、メタデータ作成者の負担を大きく減らすことができる。また、固定のディレクトリ構成をもたない(すなわち任意のメタデータに対する上位のメタデータは1つと限らない)ので、検索者が個別に持つ概念の上下関係と異なるディレクトリ構成になることはない。なお、メタデータ名をメタデータの値とする上位概念となるメタデータを作成しメタデータ間に階層構造を設けることも可能である。この際は上位のメタデータ名を1つに固定する必要もなく、自由に複数個設定することができる。この内容の詳細は図3にて説明する。
【0011】
次に図2のフローを用いて、システム全体のフローを説明する。まずステップS201においてクライアントは操作装置102の入力手段から文章を入力し、サーバではクライアントから入力され、登録された文書を文書DBに格納する。この際、ステップS204でメタデータ付与手段において文書に付与するメタデータを文書に関連付けて文書メタデータDBに登録する。なお、文書メタデータDBに登録するメタデータは、ステップS202で該当メタデータ抽出手段にてシステムがメタデータDBから得る。さらにステップS203で該当メタデータ特定手段で文書に付与すべきメタデータをシステムが自動で特定する。また、この際、システムの自動処理に任せず、システム管理者が個別に付与すべきメタデータを特定することも可能である。文書登録およびメタデータの付与の詳細に関しては後述する。
【0012】
文書検索時にはステップS220でメタデータ提示手段にて、クライアントからの接続要求の操作によってサーバはメタデータをクライアントの操作装置102に返す。次にステップS209でメタデータ入力手段にて、クライアントがメタデータを選択する操作を行うことによって、ステップS210でメタデータ該当文書検索手段によって、サーバは選択されたメタデータを持つ文書を特定し、ステップS214でメタデータ該当文書出力手段によって、その結果をクライアントの操作装置102に返す。
【0013】
情報検索システムの処理内容を大きく分けると、蓄積時の処理と検索時の処理と出力時の処理とに分けることができる。蓄積時や検索時の処理は、操作装置102および検索処理装置101、とメタデータDB103や文書DB104、文書メタデータDB105で行われる。文書蓄積時のメタデータの自動付与や、検索処理はサーバである検索処理装置101が行い、文書登録や検索キーの指定や検索命令は主にクライアントの操作装置102で行う。検索結果の出力処理は主に操作装置102で行う。
【0014】
図3にカテゴリのディレクトリへの構成例を示す。ここでいうカテゴリとはメタデータの同一種別のグループを意味し、ディレクトリとは上位のメタデータが一意に決まる多分岐構造のデータ構造である。図に示すようにカテゴリのディレクトリ構成は、1つのカテゴリに対して複数存在するのが通常である。従って文書のカテゴリを作成することに比べて、作成したカテゴリをディレクトリ(階層)にマッピングすることは難しい。例えば、製品Aの基本設計書のカテゴリは、製品カテゴリとして「製品A」、文書カテゴリとして「基本設計書」が考えられる。そのカテゴリをディレクトリに分類するときには、311と312のどちらのディレクトリに分類するべきか、即ち「製品」301と「文書」302のどちらのメタデータを上位にしたディレクトリに分類するべきかは、他に蓄積されている文書や、利用方法により変化する。例えば、ある製品Aについての文書を探す場合には図3の311のようなディレクトリ構成が望ましいが、基本設計書のサンプルを探す場合には図3の312のようなディレクトリ構成が望ましい。そこで、本発明の1実施例ではカテゴリをディレクトリとしてとらえるのではなく、カテゴリの情報を文書のメタデータとして保持し、そのメタデータを用いて文書の体系化を行う。ここで、本システムのメタデータは、カテゴリすなわちメタデータ名(例えば「製品」301、「文書」302など)と各カテゴリの情報すなわちメタデータ値(例えば「製品A」、「基本設計書」など)を意味する。また、後述するが、メタデータの付与された情報(文書など)を効果的に扱うことのできるインタフェースを提供する。
【0015】
図4にメタデータの一例を示す。本発明の実施例で、例えば図4のようなメタデータを扱うととする。ここで、メタデータは、カテゴリを表すメタデータ名(例えば図4の401では「製品名」)と、メタデータ名のカテゴリ内の種類を表すメタデータの値(例えば図4の401では「製品A」、「製品B」、「製品C」、・・・)からなる。図4の402と403も同様である。
【0016】
図5にメタデータに関する情報保持方法を示す。図5には、文書のメタデータの例とメタデータに文書を埋め込んだ例を示す。この例では、メタデータはXML等の形式で文書に付与する。図5の511〜513に示すように、文書へのリンク(URLやフルパスなど)を含んだ形で文書のメタデータを表すことが可能である。文書がXMLやHTMLの形式の場合には、図5の514に示すように文書を埋め込んだ形で表すことも可能である。また、図5の514のように、1つのカテゴリ(例えば「文書種別」)に複数のメタデータの値(例えば基本設計書502と詳細設計書503)を付与することも可能である。この方法により、複数のディレクトリにかかわる文書(例えば、製品Bに関するもので、メタデータの文書種別に基本設計書502と詳細設計書503が合わさった文書など)を表現することができる。従って、ディレクトリ保管の場合における、このような文書をどのディレクトリに格納すべきか判断できないといった問題を本実施例の方法で容易に解決できる。このように、同一階層に複数の概念をもつ文書を上位概念が一意に決まるディレクトリ構成のフォルダに容易に格納できないという問題は、本実施例の方法で解決することができる。従って本実施例の方法を用いることで、文書の格納に関するこのような作業を効率良く悩まずに実施できる。
【0017】
図6〜図15を用いて、蓄積時の処理であるメタデータ付与エージェントについて説明を行う、なお以下で英数字「S」はシステム動作手順であるステップを意味している。まず図6にシステムによるメタデータの自動付与のフローチャートを示す。まずS601にてメタデータを付与する新規文書が操作装置102から入力される。詳細は文書新規登録画面(図13)にて、後述する。次にメタデータの各カテゴリ(例えば種別、製品名等)に関する処理を行う。S602にて処理対象のカテゴリを選択する。S603においては、第1に一つのカテゴリの各メタデータに対する処理を行う。その処理では、例えば当該メタデータと当該新規文書の類似度を取得し、当該メタデータと当該類似度を記憶する。続いて記憶したメタデータを類似度の高い順でソートする。これをAとする。類似度の取得に用いる手法については何を用いてもかまわない。S604にて、ここで処理を予定している全てのカテゴリに対する上記のメタデータのソート処理が終了したかチェックする。終了していなければS602に戻り、ソート処理を継続する。この処理では、あるカテゴリのメタデータの中で、新規文書にふさわしいメタデータを選ぶ。例えば、当該新規文書に「生産計画ABC」という単語が多く現れる場合、製品名のメタデータ「生産計画ABC」は当該新規文書にふさわしいと判断する。S602とS603の一連の処理が、終了したら、S605の処理に移る。
【0018】
S605では蓄積済みの文書から、当該入力文書と類似する文書を検索する。次にS606にて、検索した各文書に対する次に示す処理を行う、なおこの処理は一例である。まず第1に、そこで検索した文書に付与されたメタデータを取得する。第2に取得した各メタデータに対する処理として、取得したメタデータと当該入力文書の類似度を記憶する。次に記憶したメタデータをスコア(類似度を数値で定量的に表したもの)の合計で、類似度の高い順にソートする。これをBとする。S607では、検索結果の上位N文書に対してS606のソート処理が完了したかをチェックする。完了していなければ、S606に戻り処理を続行する。完了していればS608に移る。上記の処理では、当該新規文書に類似した文書のメタデータを選ぶ。例えば、当該新規文書に類似した文書のN個において、「基本設計書」というメタデータが多く現れる場合(例えば設定値を超えて現れた場合)、種別のメタデータ「基本設計書」は当該新規文書にふさわしいメタデータであると判断する。
【0019】
S608ではメタデータの各カテゴリに対する次の処理を行う。前術のAとBの、順位の和が小さい順にメタデータをソートして、これを推定カテゴリとする。またこのAまたはBに係数をかけてAやBの重みを調整することも可能である。すなわち類似度のスコアが大きい順に推定カテゴリを設ける。システムでは、AとBを総合して、当該新規文書にふさわしいメタデータを決定する。全てのカテゴリの処理が終了していなければS608を繰り返す。全てのカテゴリの処理が終了したら、即ちS609でYESなら、文書一覧画面(図11)に戻る。文書一覧画面(図11)については後述する。
【0020】
図7にはメタデータを付与するためのエージェント機能に係る画面の遷移図を示す。はじめにユーザ認証画面701でログインの操作を行ったユーザを特定する。次に個人を対象としたライブラリの検索画面702に遷移し、そこで個人を対象としたライブラリの条件を入力する検索を行う。個人ライブラリの検索結果を表す画面703が表示される。この画面で、例えば検索された人のリストから、参照したい人のライブラリへのリンクを選択する。次に選択結果の画面である文書一覧の表示画面704に遷移する。文書一覧の画面704からは文書内容を表す画面705、あるいは文書の新規登録を行う画面706、メタデータを変更するための画面707に遷移する。文書内容を表す画面705では文書の概念(メタデータ)や目次などが表示される。文書の新規登録を行う画面706では、指定の文書を新規に登録することができる。メタデータを変更するための画面707では登録した文書のメタデータを変更することができる。メタデータの変更画面707では、例えばメタデータの1つである「文書」に関連する製品名を指定するためのメタデータを変更するための詳細画面708を表示し、その画面から製品名を選択できる。
【0021】
図8にユーザ認証画面の一例を示す。ユーザ認証画面はユーザの個別番号(以下IDと記す)の入力フィールド802やパスワードの入力フィールド803、「ログイン」を操作する表示(例えば表示ボタン)804、入力を消去する表示(例えば「クリア」ボタン)805から構成される。操作手順は次に示すとおりである。まずユーザは、自分のユーザIDとパスワードを操作装置102に入力し、「ログイン」ボタンを操作(例えばクリック)する。すると画面は個人ライブラリの検索画面(図9)に遷移する。本画面(図8)では、システムを利用するユーザを識別できる。またパスワードによるセキュリティ管理も行える。個人ライブラリの検索画面(図9)から戻り、再度ログイン処理を行った場合は、前回のログインユーザは自動的にログアウトされ、今回指定のユーザでログインすることができる。
【0022】
図9に個人ライブラリの検索画面の一例901を示す。ライブラリの検索画面は、部署名を選択または入力するためのフィールド902とキーワードを入力するためのフィールド903、更新日を入力するためのフィールド904、検索を実行するための「検索」ボタン905、入力された内容を削除するための「クリア」ボタン906から構成される。操作手順は次に示すとおりである。まずユーザは検索条件(部署、キーワードおよび更新日)を上記フィールドに一個所以上入力または選択し、検索を実行、即ち「検索」ボタンをクリックする。すると画面は個人ライブラリの検索結果画面(図10)に遷移する。個人ライブラリの検索条件の入力画面の例901では、蓄積された文書群の中から、ユーザが見たい文書を、部署、キーワードおよび更新日の各視点で絞り込むことができる。キーワードには、文書サブジェクト、文書種別、製品名および作成者名などを指定できる。この場合、メタデータのカテゴリが増えればそのカテゴリ値も指定できる。
【0023】
図10に個人ライブラリの検索結果の一例を示す画面である。個人ライブラリの検索結果の画面1001は、検索エリアとして図9で説明した個人ライブラリの検索画面と同様のものを表示することで、検索条件がどうであったかが分かるように検索条件を表示している。この検索エリアには部署の選択フィールド1002、キーワードの入力フィールド1003、更新日の入力フィールド1004および再検索を実行するための操作ボタン1005、あるいは入力内容を消去するための操作を行う「クリア」ボタン1006が設けられている。操作手順は図9で説明した個人ライブラリの検索の操作方法と同様である。部署の選択フィールド1002やキーワードの入力フィールド1003、更新日の入力フィールド1004の内容を変更して「再検索」ボタン1005を押せば、新たに変更した検索条件の検索結果を検索結果の表示エリアに反映できる。個人ライブラリの検索結果の画面(図10)は、検索結果の表示エリアとして、列方向に氏名列1007、所属列1008、個人ライブラリへのリンク列1009が設けられている。行方向にはそれらのデータが複数表示されている。検索結果表示エリアの操作手順は次に示すとおりである。まずユーザは氏名列における1個の個人ライブラリのリンク1010をクリックする。すると画面は文書一覧の画面(図11)に遷移する。戻りのための表示を図11は省略しているが、戻りの操作を行うことで図10に戻ることが出来、上述したように、選択フィールドや入力フィールドの値である1002〜1004の内容を変更して「再検索」ボタン1005をクリックすることにより、何度でも検索をしなおすことができる。本画面では、蓄積された文書群の中から、ユーザが見たい文書を、部署、キーワードおよび更新日の各視点で絞り込み、文書の登録者等の情報を一覧で参照できる。なお氏名列1007における氏名は、文書の登録者の氏名である。
【0024】
図11に文書一覧画面の一例1101を示す。文書一覧画面は、例えばエージェントの発話1111があり、誰が登録した文書であるかの説明や、文書の新規登録1102や文書情報の変更1103、使い方のヘルプ1104へのリンクが表示されている。文書一覧では列方向に文書サブジェクト列1106、文書種別列1107、製品名列1108、作成者名列1109から構成され、行方向にそれらのデータが複数表示されている。1110に示すように登録者(本実施例ではログイン者)とは異なる作成者の情報も参照できる。文書一覧画面の操作手順は次に示すとおりである。例えば、ユーザは文書サブジェクト列1106における1個の文書サブジェクト「基本設計書(全体編)」1112をクリックする。すると画面は文書内容を表示する画面(図12)に遷移する。文書内容の画面(図12)には選択された文書サブジェクト例えば「基本設計書(全体編)」に関する種別、製品名、作者、本文といった情報が表示されている。文書一覧の画面(図11)の機能においては、ログイン時のユーザが当該個人ライブラリの登録者と一致していない場合、エージェントの発話において文書の新規登録のための画面やメタデータの変更のための画面へのリンクを表示しない。そのため他人が登録した文書やメタデータを変更することが抑止できる。図11の例ではエージェントの発話1111の「AAさんの登録した文書一覧です。」とあるAAが登録者の氏名である。なお作成者名1109は文書の作成者(著者)であり、文書の登録者とは区別されている。また本画面では、1人のユーザが登録した文書群と各文書のメタデータを一覧で参照できる。さらにエージェントが、画面の種別に応じて、現在可能な操作をガイダンスするため、ユーザは操作に戸惑うことが少なくなる。
【0025】
図12に文書内容の画面の一例1201を示す。文書内容の画面は、エージェントの発話1206と文書内容1205から構成される。エージェントの発話1206はメタデータ1202、文書一覧へのリンク1203、使い方のヘルプへのリンク1204で構成され、他の形式で表示しても良い。操作手順は次に示すとおりである。ユーザはエージェントの発話における、文書一覧画面へのリンク1203をクリックする。すると画面は文書一覧の画面(図11)に遷移する。本画面では、1個の文書の内容(タイトルと目次など)とメタデータ(種別、製品名、作成者など)を参照できる。
【0026】
図13に文書の新規登録のための画面の一例1301を示す。文書の新規登録の画面はエージェントの発話1306、文書ファイルパスの入力フィールド1304、「登録」ボタン1305から構成される。エージェントの発話1306には「文書を新規登録します。」というガイダンスに加え、文書一覧へのリンク1302と使い方のヘルプへのリンク1303がある。なお他の形式で表示しても良い。操作手順は次に示すとおりである。まずユーザは文書ファイルのパスを入力フィールド1304に入力し、「登録」ボタン1305をクリックする。するとエージェントは、図3のフローチャートで述べた以下の処理を行う。第1ステップで、当該文書ファイルから本文を抽出する。第2ステップで、当該文書の本文に含まれるメタデータを検索し、メタデータ毎に出現数によって重みを加算する。第3ステップで、当該文書と本文が類似する蓄積文書を検索する。第4ステップで、検索結果の各文書に付与済みのメタデータ毎に、当該各文書の類似度によって重みを加算する。第5ステップで、メタデータの種別毎に重みの最も大きいメタデータを新規登録した文書に付与する。その文書とメタデータの付与情報はシステムに登録される。また、文書一覧へのリンク1302を選択すると画面は文書一覧の画面(図11)に遷移する。この時、新規登録した文書のメタデータは、文書一覧の画面(図11)に反映されている。文書の新規登録の画面(図13)の機能では、ユーザのクライアントPC即ち操作装置102にある文書を当該システムに登録することができる。さらに、当該文書に対し、最も適切であるとエージェントが判断したメタデータを自動的に文書に対して付与することができる。これにより、ユーザが手作業で、メタデータを文書に付与する必要が無くなり、登録作業における手間が大幅に削減できる。
【0027】
図14にメタデータの変更のための画面の一例1401を示す。メタデータの変更画面はエージェントの発話1412とメタデータを変更するための情報とからなる。エージェントの発話1412は「文章の情報を変更します。」というガイダンスに加え、文書一覧へのリンク1402、文書の新規登録画面へのリンク1403および使い方のヘルプへのリンク1404からなる。なお他の形式で表示しても良い。メタデータを変更するための情報は文書サブジェクトの入力フィールド1406、文書種別の選択または入力フィールド1407、製品名の選択または入力フィールド1408、作成者名の選択または入力フィールド1409から構成される。メタデータを変更する操作手順は次に示すとおりである。まずユーザは文書のメタデータ(文書サブジェクト、文書種別、製品名および作成者名)の中で、1つのメタデータを変更する。例えば、XX株式会社殿提案資料1413における製品名1414を変更するとする。メタデータの候補は、文書新規登録画面でエージェントが取得したメタデータの中で、重みの大きい(すなわち類似度が高くメタデータとしてふさわしい)メタデータである。メタデータの候補はリスト1410に表示されるので、その中から任意の製品名を選択して製品名1414にセットする。メタデータの候補はリスト1410に、重みの大きい順に表示されている。メタデータの候補を選択する操作として、例えばリスト1410の中からその他・・・1411をクリックする。すると、メタデータ変更の詳細画面(図15)が表示される。メタデータ変更の詳細画面(図15)では、既存のメタデータ群の中から、各文書に対してメタデータの候補を提示する。詳細は後述する。これにより、ユーザが文書にメタデータを付与する手間を削減することができる。エージェントの発話1412エリアにおいて例えばユーザは、文書一覧画面へのリンクをクリックする。すると文書一覧画面(図11)に遷移する。この時、メタデータ変更の画面(図14)で変更したメタデータは文書一覧画面(図11)に反映されている。また、エージェントの発話における文書を新規登録したいというリンク1403を選択すると文書の新規登録のための画面(図13)に遷移する。
【0028】
図15にメタデータの変更のための詳細画面の一例1501を示す。メタデータ変更の詳細画面はメタデータ値の一覧から構成される。操作手順は次に示すとおりである。まずメタデータを変更するための画面(図14)にて、例えば、サブジェクトがXX株式会社殿提案資料1413の行の製品名を設定するとする。その際、製品名の入力欄の1つ、例えばコンボボックスを選択し製品名の一覧1410を表示する。その中から、例えば「その他・・・」1411を選択する。するとメタデータの変更のための詳細画面1501が表示される。その画面から1個のメタデータ例えば「HHシステム」1502をクリックする。すると画面はメタデータの変更画面(図14)へ再び戻る。この時、ユーザが選択したメタデータすなわち「HHシステム」を1414の欄に反映する。このように例では「HHシステム」を選択したのでメタデータの変更画面(図14)の1414の欄には「HHシステム」が新たに入力されることになる。この実施例では、既存のメタデータ群を表示し、そこからユーザが適切なメタデータを選択して文書に付与する例を示した。これにより、ユーザは文書に付与するメタデータの変更作業においても、適切なメタデータを自分で考える手間を削減できる。さらに、メタデータとして、類義語や異表記などの混入を防ぎ、メタデータのノイズを減少させる効果がある。例えば、上記の例で一覧からのみメタデータを選択するのであれば「HHシステム」で統一できる。これに対して入力域への手作業による入力にすると「HHSYSTEM」、「HH−システム」、「H H システム」のように同じものを指すのに異なるメタデータを増やしてしまう危険性が高い。このように一覧を表示して、そこからメタデータを選択させることでメタデータのノイズを減少させることが可能である。以上、蓄積時の処理について説明を行った。本実施例ではメタデータの付与方法について、その実施例(実施形態例)に加えて、実施上の効果について述べた。
【0029】
図16以降では、検索時の処理と出力時について説明する。以下ではメタデータが付与された文書を効果的に検索するシステムの実施例について説明する。本実施例では、メタデータが付与された文書を効果的に扱うために、図16に示すように、画面上にメタデータ名を表すラベルを分散させた画面(メタデータマップと呼ぶ)を用いる。ここでは、メタデータとして、図5の511〜514の文書と文書のメタデータを扱うと仮定する。まず図16の1611はメタデータマップの初期状態である。このメタデータのマップはビジュアルに検索を行うことができるビジュアル検索画面としての意味合いをもつものである。メタデータのマップには、初期状態ではメタデータのカテゴリを表す上位、例えば最上位の概念であるメタデータ名が表示されている。この例では3個の表示であるが、1個でもよい。しかし2個以上の方が本発明の利用効果が大きい。ユーザはこれらのメタデータ名の中から、文書検索で絞り込みたいカテゴリを代表するメタデータ名を選択(ラベルをクリック)して、文書検索を開始する。最上位のメタデータ名は例えば、図3を例にとれば、「製品」と「文書」である。ディレクトリの構成要素が同じでも、分類基準が変われば構成(ディレクトリ構成)も変るため、最上位のメタデータは1つのカテゴリに対して複数存在し得る。例えば、1つのカテゴリに対して10個の構成(ディレクトリ構成)があったとすると、最大で10個のメタデータ名が初期画面(図16の1611)に表示される。仮にこの初期画面をデータマップではなく、ディレクトリを用いて表示する場合について説明する。本発明の方法では1つのカテゴリに関して複数の構成をとることができる。たとえば1つのカテゴリに関して10とおりのディレクトリ構成をとることができるとする。その場合、ディレクトリを10個表示することになる。そのため、1つのウィンドウに1つのディレクトリを表示すると仮定するのであれば、ウィンドウを10枚用意することになる。それにくらべれば、初期状態で例えば最上位のメタデータ名を表示する本実施例の方法はウィンドウが少なくて、例えば1枚で、済み大変見やすく、大変便利である。
【0030】
図16の1612は図16の1611の状態からメタデータ名である「製品」のラベルをクリック即ち選択した状態を表したメタデータのマップの例である。メタデータ名「製品」のラベルがクリックされると、そのメタデータ名に属するメタデータの値が表示される。ここで、図16の1612におけるメタデータ名「製品」のメタデータ値は「製品A」、「製品B」,「製品C」である。なお、このメタデータ値のラベルは、メタデータ名の表示位置の周囲に重なりを防ぐように表示し、メタデータ名とメタデータ値を線で結ぶなりして関連がわかるようにして表示される。また、メタデータ値が多数ある場合には、メタデータが付与されている文書数や、選択済みのメタデータやそれに関連するメタデータなどを指標として評価し、メタデータの重要度を決定し、重要度の高い順にメタデータ値をメタデータのマップに表示する。重要度の低いその他のメタデータ値は「その他」などのラベルとして1つのラベルにまとめて、メタデータのマップ上に表示するようにしてもよい。その場合、その「その他」のラベルを選択すると、その他のメタデータ値を例えばリスト形式で表示させ、そこからそのメタデータ値の選択を可能とする。またグループ化できるメタデータはそれらを代表するグループ名を1つのラベルとして定義できる。そこで、そのグループ名を選択するとそのグループ内のメタデータをリスト形式で表示しそこからメタデータ値を選択できる。また、選択されたラベルを再クリックすることで、選択された「メタデータ名」のラベルを非選択状態とすることができる。その場合はその「メタデータの値」のラベルの色を薄くしたり、ラベルのサイズを小さくしたり、ラベル自体を非表示にすることもできる。ラベル自体を非表示にした場合は、その上位概念のラベルを選択しなおせば、再度表示することができる。
【0031】
次にユーザは表示されたメタデータの値を表すラベルの中から、該当するラベルを選択する。この操作により、選択されたメタデータの値をもつ文書が絞り込まれる。また、複数のメタデータの値を選択すると、OR条件、またはAND条件で絞り込みが行われる。この際、OR条件やAND条件はポップアップメニューや環境設定で設定することもできる。あるいは、メタデータ値を選択する過程で、同時にその条件式を別ウィンドウなどに、条件式表示画面として表示し、その条件式を変更できるようにすることなどが可能である。具体的な例をあげると、環境設定などでANDを設定していた場合、例えばA、B、Cと選択すると、条件式表示画面には「A AND B AND C」と表示される。この際、AND式は、クリック操作などで変更できるようになっている。さらにこの条件式に括弧アイテムなどをドラックすることで、括弧を挿入することなども可能である。また選択されたラベルを再クリックすることで、選択されたメタデータの値を非選択状態にし、絞り込みをしなおすことも可能である。また、選択したくないラベルを(例えばコントロールキーを押しながら)非選択にしていくことも可能である。
【0032】
図16の1613は図16の1612において、メタデータの値「製品A」のラベルをクリックした場合のメタデータのマップ(すなわちビジュアル検索画面)の出力例である。このとき、「製品A」のメタデータの値が付与されているのは図5を参照すればわかるように、図5の511〜513の文書1・文書2・文書3である。従って文書1・文書2・文書3が検索結果となる。また、「製品A」のメタデータを持っていない文書4(図5の514)は検索結果として抽出されない。詳細は後述するが、検索結果の抽出例は、図17〜図19の1701に示すとおりである。また「製品A」のラベルがクリックされた時に、同じカテゴリ内の、他のラベルの色を薄く表示するなどして選択された「製品A」のラベルを強調している。また操作モードにより、選択されていない、同じカテゴリ内の他のラベルを小さくすることも、非表示にすることもできる。この操作により、情報を絞り込んで、同時に見る必要がある情報を極力スクロールなどせずに見ることができるようにするなどの配慮を行い、画面を見やすくすることができる。
【0033】
図16の1614は図16の1613において、メタデータ名「文書」のラベルがクリックされた時のメタデータマップの一例を示している。「製品」のラベルがクリックされたときと同様に「文書」のメタデータ名に属するメタデータの値が表示される。文書に属するメタデータ値は、ここでは「基本設計書」、「詳細設計書」、「テスト」である。このときに、図5の511〜513に示すとおり、文書1・文書2・文書3は図16の1613で選択された「製品A」のメタデータに加え「基本設計書」、「詳細設計書」のメタデータも持っている。そこで、図16の1614に示すように、これらのラベルを線1621〜1622で結ぶなどしてメタデータ値の間の関連を強調することもできる。メタデータ値間の関連度を強調する方法として、関連するラベル同士を線で結ぶ以外に、「ラベルの背景色、色調、濃淡による関連度の表現」、「ラベルへの識別マークの付与による関連度の表現」、「ラベルの枠線の種別や線幅による関連度の表現」、「ラベルの形状、大きさによる関連度の表現」、「文字フォントによる関連度の表現」、「ラベル間の距離の違いによる関連度の表現」などを用いても良い。このように、上記関連性あるいは関連度を視覚的な方法で表示することが望ましい。
【0034】
図16の1615は図16の1614において、メタデータ名「文書」のメタデータの値である「基本設計書」のラベルが選択された場合のメタデータマップの表示例を示している。メタデータマップ上では、「製品A」と「基本設計書」が指定されている。図5の例では「製品A」と「基本設計書」のメタデータを持っているの511の文書1と512の文書2の2つである。従って文書1と文書2が検索結果となる。検索結果の抽出例は、詳細は後述するが、図17〜図19の1701に示すとおりである。
【0035】
本実施例の方法によれば、このようにメタデータマップに表示されているメタデータを表すラベルを選択していくことにより目的の文書を絞り込むことが容易となる。また、選択していくメタデータ名は「製品」でも「文書」でも「納入先」でも好きなものから選択していくことが可能である。そのため、先に挙げた問題すなわち、図3の311、312に示すように分類基準が複数ある場合、検索する人が望むディレクトリ構成を複数の画面等をめくるなどして探さなければならないといった面倒な作業を回避することが可能である。例えば本実施例でいえば、「製品」「文書」「納入先」の3つのディレクトリ構成があり、この中から自分が必要とするディレクトリを探すとする。そのためには1つのウィンドウに1つのディレクトリが表示できるとすると、3枚のウィンドウを用意しそれをめくるなどの操作が必要になる。ディレクトリが100あれば100枚めくることになる。さらに、その中から文書を探す過程で、他のディレクトリとの関連がつかめないという問題も発生する。本実施例では、これらの問題を全て解決できる。まずディレクトリのトップの、メタデータのラベルのみが初期画面に表示されるため、ディレクトリ構成が100あっても、初期状態では、1画面の中の、100個のラベルから適切なものを1つ選ぶだけで検索を実施できる。さらにメタデータマップ上で互いに関連するメタデータのラベルをネットワーク状に線で連結していくため、気になる他のディレクトリのメタデータとの関連も上述したように簡単に把握できる。さらに、メタデータマップでどのラベルが選択されているのかを保存しておくことが可能であるため、コンピュータを再起動した後に、本実施例のシステムを立ち上げたときに前回の状態を再現することも可能である。
【0036】
図17に選択されたメタデータを含む文書を表示する例を示す。図の左側エリアにメタデータのマップ1615を、上側エリア1702に選択されたラベル(メタデータの値)を、右側エリア1701に選択されたメタデータの値を持つ文書のリストを示している。上記メタデータのマップ1615を表示するエリアは、検索操作の手順に基づいて、図16で説明した画面遷移が表示され、図16で説明した処理が為されていく。上側エリア1702のメタデータの値は、操作手順すなわちラベルの選択順に基づいて作成されている。また、その情報を簡略化するために、階層数(階層の深さ、実施例では「・」の数+1)はこの実施例では2つに固定している。階層数の固定は、解除して全て出力することも可能である。また上側エリア1702のメタデータ値は手入力することもできる。上側エリア1702のメタデータ値の全てを出力する場合はメタデータが同一のカテゴリ(ディレクトリ構成)中にあり、なおかつ階層の上位から下位への遷移の過程で、操作した中から個々のメタデータ値を順番に抽出して、メタデータの値(例えばメタデータ1・メタデータ2・・・)を出力する。
【0037】
また、図17のメタデータのマップ1615の代わりに、図18の1801のようにディレクトリの形で選択されたメタデータを表示することもできる。また上側エリア1702のメタデータ値(階層を持つメタデータ)を手入力した場合、そのメタデータ値とシステム保管の全メタデータのメタデータ値とで部分マッチングを行い、そのメタデータ値が合致するシステムに保管されているディレクトリを表示する。表示されたディレクトリが期待したものでない場合つまり同じ階層を持つメタデータが複数存在する場合は、他に合致したディレクトリを順に表示する。その際の表示順はシステムに先に登録された順、後に登録された順、最上位階層のメタデータ名の50音順などがある。本実施例の方法によれば、例えば、図3の311と312のディレクトリ、両方の構成に基づく概念からでも文書を選択していことが可能となる。またこのような問題を少なくするために最上位メタデータ名を別途指定することも可能である。指定の仕方は@マークなどの記号を先頭につけて@(最上位メタデータ名)・メタデータ名・メタデータ値などとしても良いし、別領域に最上位メタデータ名を表示しても良い。
【0038】
図19もメタデータ利用による検索機能のインタフェースの例である。メタデータを表形式1901で表している。メタデータの表における「製品」1911・「文書」1912などのメタデータ名をクリックすることで、そのメタデータの値でソートして表示することが可能である。また、メタデータの列(「製品」1911と「文書」1912など)をドラック操作などで入れ替えることにより並び替えの優先順位を変更することも可能である。
【0039】
また、ユーザ補助の観点から便利な機能として以下の機能がある。例えば図16においてメタデータを選択していく過程について、それまでのユーザの選択履歴を記録しておき、ユーザが選択しやすい(すなわち選択頻度の高い)メタデータ名やメタデータ情報を目立たせることなども可能である。目立たせる方法としては、「ラベルの背景色、色調、濃淡による関連度の表現」、「ラベルへの識別マークの付与による関連度の表現」、「ラベルの枠線の種別や線幅による関連度の表現」、「ラベルの形状、大きさによる関連度の表現」、「文字フォントによる関連度の表現」によるものなどが考えられる。
【0040】
メタデータ間の関連に関して、メタデータには共起(共に反応する)する関係と排他する関係も定義可能である。これにより、あるメタデータのラベルが選択された場合、共起関係にあるメタデータのラベルが自動的に選択されるようにできる(例えば、「JAVA(R)」のメタデータの値を選択すると、自動的に「オブジェクト指向」が選択されるなど)、また排他関係にあるメタデータが自動的に非選択になるようにすることも可能である。
【0041】
リレーショナルデータベース(RDBと呼ぶ)への適用の観点から、本発明は文書に付与されたメタデータのみに適用するのではなく、データベースのデータに適用することも可能である。例えばRDB等の各フィールド名がメタデータ名として、フィールドの値(データ)がメタデータの値として利用できる。また、参照したいフィールドを本文と定義することで、上述の検索方法を利用することができる。またRDB等をXMLの形式にして出力することで、本発明をそのまま適用することができる。このことにより、データベースに蓄積されている情報を、メタデータマップを用いたシステムで、階層構造を固定せず、視覚的にデータ間の関連を確認しながら目的どおりに絞り込むことが可能となる。
【0042】
メタデータの再配置に関しては、以下に示す方法で画面を見やすくし、操作をしやすくする手法を設けている。すなわち、メタデータマップの表示に関して、メタデータのラベルの数が増加した場合、ラベルが重ならないようにマップの再配置を自動で行う。また、マップを見やすくするために、線が密集しないようにラベルの再配置を自動的に行う。ラベルの再配置方法は次に述べるように、複数存在する。第1の方法としては、各ラベルの近傍のラベルのみを、ずらすことで重なりや密集を解決する。この方法は現状の配置を大きく変えずに、ラベルの再配置を行い、見やすくするものである。第2の方法としては、全ラベルの均等配置を行う方法である。この方法は現在の配置をある程度維持しながら、全体のバランスを取り直す方法である。この方法によって、ラベル全体が均等に配置しなおされて見やすくなる。第3には乱数を使うなどし、完全に再配置をやり直す方法がある。この場合は、現在のメタデータマップの配置は維持されないが、現在の配置が気にいらない場合には有効である。さらに第4の方法として、互いに類似するラベルを近傍に配置するなどの手法もある。メタデータマップのラベルの再配置は検索作業の途中に、任意に手動で行うこともできる。また、環境設定やオプション設定などで自動的に、ラベルの再配置を行うようにもできる。また表示情報の増減に伴って文字や図形の大きさを変更することが可能である。表示するメタデータの数がある値を超えると文字表示の大きさであるポイント数を下げる、あるいは重なり表示が出来るとまたは表示間隔が狭くなると文字表示の大きさであるポイント数を下げるようにすることで見易さを維持できる。また図16の例1614のように関連を線で表示する場合、線がクロスしないように表示することが好ましい。
【0043】
また図17〜19において、特に図17において、表示エリア1615に多数の情報を表示すると文字などの表示の大きさを小さくしなければならなくなる。この場合表示エリア1615と1701の境界を移動可能とすることで1615の表示面積を広げる操作を可能とすることが望ましい。また表示エリアの拡大に伴ってエリア1615内の表示文字を自動的に大きくすることが望ましい。逆にエリア1615を縮小する操作では、エリア1615の文字は自動的に縮小する。あるいは関連性の低い即ち関連度の線が細い線の表示を自動的に消すことも有効である。
【0044】
以上述べたように本発明の実施例として、文書のメタデータをディレクトリ構成で定義せず、上位概念や下位概念を意識しない自由な形式の構成で定義する方法について述べた。この方法は、文書をフォルダ(ディレクトリ)で格納せずに、メタデータを付与した状態で格納する、文書の格納方法と、とらえることができる。この方法によれば、ディレクトリ構成を意識する必要がなく、上位概念が複数存在しても容易に文書のメタデータを定義できる。そのため文書の登録者が思い描くメタデータを正確に登録することができる。また、本発明の実施例では、メタデータマップ上でディレクトリを意識することなく、ラベルを選択していくことで、ディレクトリ検索のように情報を絞り込むことが可能な機能について述べた。この際、メタデータマップは複数のディレクトリ構成に展開できる要素をもっているので、検索者が思い描くディレクトリ構成を想定して検索を行うことが可能である。さらに、この検索実行時に、メタデータをメタデータマップの形、ディレクトリの形、および表形式で表示でき、そこで、好きなラベル(位置)またはディレクトリまたは値やフィールドから検索を行うことが可能な情報検索方法を提示した。また文書を検索していく過程で、他のディレクトリ構成(カテゴリ)に含まれる文書との関連などが、ラベル同士が線で結合されることにより、容易に判別できる方法について述べた。この方法によれば、メタデータ同士の関連をたどって、関連情報を広く調べることも可能となり、必要な情報を充分に調査することができ検索精度を上げることができて、大変便利である。またDBのフィールド情報をメタデータとして、DBの内容を容易に検索できる検索方法について、その内容を説明した。DBの内容をそのまま、本実施例の検索方法で検索できれば、既に構築済みのDBの検索を視覚的に、キーワードの決定に労力を使わずに快適に行うことができる。
【0045】
【発明の効果】
本発明によれば、検索処理のための情報のカテゴライズ作業としてのメタデータの文書への付与作業の操作性が向上する。
また本発明によれば、メタデータのラベルなどを利用した検索方法において、検索処理の操作性が向上する、あるいは検索精度が向上する。
【図面の簡単な説明】
【図1】 情報検索装置のシステム構成図である。
【図2】 システム全体の処理フローチャートである。
【図3】 カテゴリのディレクトリへの構成例である。
【図4】 メタデータの例である。
【図5】 メタデータの持たせ方の例である。
【図6】 文書蓄積、メタデータ付与処理のフローチャートである。
【図7】 文書蓄積、メタデータ付与処理の画面遷移である。
【図8】 文書蓄積、メタデータ付与処理のユーザ認証画面の説明図である。
【図9】 文書蓄積、メタデータ付与処理の個人ライブラリ検索画面の説明図である。
【図10】 文書蓄積、メタデータ付与処理の個人ライブラリ検索結果画面の説明図である。
【図11】 文書蓄積、メタデータ付与処理の文書一覧画面の説明図である。
【図12】 文書蓄積、メタデータ付与処理の文書内容画面の説明図である。
【図13】 文書蓄積、メタデータ付与処理の文書新規登録画面の説明図である。
【図14】 文書蓄積、メタデータ付与処理のメタデータ変更画面の説明図である。
【図15】 文書蓄積、メタデータ付与処理のメタデータ変更詳細画面の説明図である。
【図16】 メタデータマップによる検索の流れである。
【図17】 メタデータマップによる検索結果である。
【図18】 メタデータのディレクトリと検索結果である。
【図19】 メタデータの表と検索結果である。
【符号の説明】
101 サーバ(検索処理装置)
102 クライアント(操作装置)
103 メタデータデータベース
104 文書データベース
105 文書メタデータデータベース
201 文書入力手段
202 該当メタデータ抽出手段
203 該当メタデータ特定手段
204 該当メタデータ付与手段
209 メタデータ入力手段
210 メタデータ該当文書検索手段
214 メタデータ該当文書出力手段
220 メタデータ提示手段
1111 メタデータ付与エージェントの発話の一例
1615 メタデータマップの表示例
1701 文書検索結果の一例(検索文書一覧の一例)
1801 メタデータのディレクトリ形表示例
1901 メタデータの表形式による表示例[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a system for handling data to which metadata is attached (called a systematization system), and relates to a technique for giving metadata, a document and database search method, a search system, or a computer program for search. .
[0002]
[Prior art]
There are the following technologies related to the technology related to the addition of metadata, or the search method and search system of documents and databases, or the computer program for search (see, for example,
[0003]
In
[0004]
[0005]
[Patent Document 1]
JP-A-10-91503 (for example, paragraph numbers 0010 and 0014, FIG. 1 and the like)
[Patent Document 2]
JP 2000-10996 A (for example, 0039, 0136, FIG. 1, FIG. 2, etc.)
[0006]
[Problems to be solved by the invention]
A system that is easier to use in search processing,MethodAnd programsIs desired. For example, the present invention organizes information with conceptual information (hereinafter referred to as metadata), uses the metadata for searching,Improve the operability of adding metadata to documents as information categorization work for search processing, and improve the operability of search processing in search methods using metadata labels, etc., or Information search system, information search method and information search for improving search accuracyThe purpose is to provide a program.
[0007]
[Means for Solving the Problems]
To solve the problems in the present inventionFirstMeans ofThe first similarity information indicating the similarity between all metadata values stored in the database and the input information, and the existing information stored in the database that is similar to the input information The metadata value suitable for the input information is determined based on the second similarity information indicating the similarity between the metadata value and the input information.
Furthermore, the second means for solving the problems in the present invention is as follows:Based on the search information for searching the search target such as general documents and databases, a plurality of metadata as described in the following embodiment is extracted and displayed as a label on the screen, and a specific label is selected from these labels. By specifying, the search result is output based on the specified label. In doing so, it is easier to understand the relationship with the metadata labels that are related to each other.OctopusIt is.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments according to the present invention will be described. FIG. 1 shows the configuration of the information search system. This system includes a plurality of
[0009]
Next, a procedure for inputting metadata at the time of search (designation by a label in this embodiment) and displaying the search result on the screen will be described. The search processing apparatus 101 includes a document and metadata storage unit, a metadata reception unit, and a search result output unit. Further, a database (hereinafter referred to as a metadata DB) 103 for metadata and a document And a database (document metadata DB) 105 relating to a combination of documents and metadata. The metadata DB 103, the document DB 104, and the document metadata DB 105 are databases used mainly for executing search processing.
[0010]
FIG. 2 is an operation explanatory diagram showing the relationship between the operation of the system and the use of the database when the information search system performs a search process, for example, when an information search process using metadata is performed. In practice, the system executes a program and performs the operations described below. However, a system that virtually achieves the processing purpose is constructed, and the system is described as having a configuration for processing. However, as described above, the system has a function and only performs a processing operation, and does not actually have a dedicated configuration as described below. The following dedicated units are operations or functions. FIG. 2 shows one processing procedure example of the present invention. First, in step S200 of FIG. 2, at the time of system construction, a metadata administrator creates a metadata name representing a metadata category and a metadata value belonging to the metadata name. The created metadata name and metadata value are registered in the
[0011]
Next, the flow of the entire system will be described using the flow of FIG. First, in step S201, the client inputs text from the input unit of the
[0012]
At the time of document retrieval, the server returns the metadata to the
[0013]
The processing contents of the information retrieval system can be broadly divided into accumulation processing, retrieval processing, and output processing. Processing at the time of storage and search is performed by the
[0014]
FIG. 3 shows a configuration example of the category directory. The category here means a group of the same type of metadata, and the directory is a data structure of a multi-branch structure in which upper metadata is uniquely determined. As shown in the figure, a plurality of category directory structures usually exist for one category. Therefore, it is difficult to map the created category to a directory (hierarchy) as compared to creating a document category. For example, the category of the basic design document for product A can be “product A” as the product category and “basic design document” as the document category. When the category is classified into a directory, which of 311 and 312 should be classified, that is, which of “product” 301 and “document” 302 should be classified as a higher-level directory. It varies depending on the documents stored in and the usage method. For example, when searching for a document for a certain product A, a directory structure such as 311 in FIG. 3 is desirable. However, when searching for a sample of a basic design document, a directory structure such as 312 in FIG. 3 is desirable. Therefore, in one embodiment of the present invention, the category is not regarded as a directory, but the category information is held as document metadata, and the document is organized using the metadata. Here, the metadata of this system includes categories, that is, metadata names (for example, “product” 301, “document” 302, etc.) and information of each category, that is, metadata values (for example, “product A”, “basic design document”, etc. ). Further, as will be described later, an interface capable of effectively handling information (document or the like) to which metadata is added is provided.
[0015]
FIG. 4 shows an example of metadata. In the embodiment of the present invention, it is assumed that metadata as shown in FIG. 4 is handled. Here, the metadata includes a metadata name representing a category (for example, “product name” in 401 in FIG. 4) and a metadata value representing a type in the category of the metadata name (for example, “product in 401 in FIG. 4”). A ”,“ Product B ”,“ Product C ”,. The same applies to 402 and 403 in FIG.
[0016]
FIG. 5 shows an information holding method regarding metadata. FIG. 5 shows an example of document metadata and an example in which the document is embedded in the metadata. In this example, metadata is attached to a document in a format such as XML. As shown at 511 to 513 in FIG. 5, it is possible to represent document metadata in a form including a link (URL, full path, etc.) to the document. When the document is in an XML or HTML format, it can be expressed in an embedded form as indicated by
[0017]
The metadata providing agent, which is a process at the time of accumulation, will be described with reference to FIGS. 6 to 15. In the following, the alphanumeric character “S” means a step that is a system operation procedure. First, FIG. 6 shows a flowchart of automatic assignment of metadata by the system. First, in step S <b> 601, a new document to which metadata is added is input from the
[0018]
In step S605, a document similar to the input document is searched from the accumulated documents. Next, in S606, the following processing is performed on each retrieved document. This processing is an example. First of all, the metadata given to the retrieved document is acquired. Secondly, as a process for each acquired metadata, the similarity between the acquired metadata and the input document is stored. Next, the stored metadata is sorted in the descending order of similarity by the sum of scores (similarities expressed quantitatively by numerical values). This is B. In step S607, it is checked whether the sorting process in step S606 has been completed for the top N documents in the search result. If not completed, the process returns to S606 and continues. If completed, the process proceeds to S608. In the above processing, metadata of a document similar to the new document is selected. For example, in N documents similar to the new document, when a lot of metadata “basic design document” appears (for example, when it exceeds the set value), the type of metadata “basic design document” Judge that the metadata is appropriate for the document.
[0019]
In S608, the following processing is performed for each category of metadata. The metadata is sorted in ascending order of the sum of the ranks of A and B in the previous operation, and this is set as the estimated category. It is also possible to adjust the weights of A and B by multiplying A or B by a coefficient. That is, the estimated categories are provided in descending order of similarity score. In the system, A and B are combined to determine metadata suitable for the new document. If processing for all categories has not been completed, step S608 is repeated. When all categories have been processed, that is, if YES in S609, the process returns to the document list screen (FIG. 11). The document list screen (FIG. 11) will be described later.
[0020]
FIG. 7 shows a screen transition diagram related to the agent function for adding metadata. First, the user who performed the login operation is specified on the user authentication screen 701. Next, a transition is made to a library search screen 702 for individuals, where a search for inputting library conditions for individuals is performed. A
[0021]
FIG. 8 shows an example of the user authentication screen. The user authentication screen includes an
[0022]
FIG. 9 shows an example 901 of a personal library search screen. The library search screen includes a field 902 for selecting or inputting a department name, a
[0023]
FIG. 10 is a screen showing an example of the search result of the personal library. The
[0024]
FIG. 11 shows an example 1101 of a document list screen. The document list screen includes, for example, an agent's utterance 1111, an explanation of who is registered, a
[0025]
FIG. 12 shows an example 1201 of a document content screen. The document content screen is composed of an agent utterance 1206 and
[0026]
FIG. 13 shows an example 1301 of a screen for newly registering a document. The new document registration screen includes an
[0027]
FIG. 14 shows an example screen 1401 for changing metadata. The metadata change screen includes an
[0028]
FIG. 15 shows an example 1501 of a detailed screen for changing metadata. The metadata change details screen is composed of a list of metadata values. The operation procedure is as follows. First, on the screen for changing metadata (FIG. 14), for example, it is assumed that the subject sets the product name in the row of the
[0029]
In FIG. 16 and subsequent figures, processing at the time of search and output will be described. In the following, an embodiment of a system that effectively searches for documents to which metadata is attached will be described. In this embodiment, in order to effectively handle a document with metadata, a screen (called a metadata map) in which labels representing metadata names are distributed on the screen is used as shown in FIG. . Here, it is assumed that the
[0030]
1612 in FIG. 16 is an example of a metadata map showing a state in which the label “product” as the metadata name is clicked, that is, selected from the
[0031]
Next, the user selects a corresponding label from among the labels representing the displayed metadata values. By this operation, documents having the selected metadata value are narrowed down. When a plurality of metadata values are selected, narrowing down is performed using an OR condition or an AND condition. At this time, the OR condition and the AND condition can be set by a pop-up menu or environment setting. Alternatively, in the process of selecting a metadata value, the conditional expression can be displayed on a separate window or the like as a conditional expression display screen at the same time so that the conditional expression can be changed. As a specific example, when AND is set in the environment setting or the like, for example, when A, B, or C is selected, “A AND B AND C” is displayed on the conditional expression display screen. At this time, the AND expression can be changed by a click operation or the like. It is also possible to insert parentheses by dragging parenthesis items or the like into this conditional expression. In addition, by clicking again on the selected label, it is possible to deselect the value of the selected metadata and narrow down the selection again. It is also possible to deselect labels that you do not want to select (for example, while holding down the control key).
[0032]
1613 in FIG. 16 is an output example of a metadata map (that is, a visual search screen) when the metadata value “product A” is clicked in 1612 of FIG. At this time, the metadata value of “product A” is assigned to
[0033]
1614 of FIG. 16 shows an example of a metadata map when the label of the metadata name “document” is clicked in 1613 of FIG. The value of the metadata belonging to the metadata name of “Document” is displayed in the same manner as when the “Product” label is clicked. Here, the metadata values belonging to the document are “basic design document”, “detailed design document”, and “test”. At this time, as shown in 511 to 513 in FIG. 5, in addition to the metadata of “Product A” selected in 1613 in FIG. ”Metadata. Therefore, as shown at 1614 in FIG. 16, these labels can be connected by
[0034]
1615 of FIG. 16 shows a display example of the metadata map when the label “basic design document” which is the metadata value of the metadata name “document” is selected in 1614 of FIG. On the metadata map, “Product A” and “Basic Design Document” are designated. In the example of FIG. 5, there are two documents, 511
[0035]
According to the method of the present embodiment, it becomes easy to narrow down a target document by selecting a label representing metadata displayed in the metadata map in this way. In addition, the metadata name to be selected can be selected from “Product”, “Document”, and “Delivery destination” as desired. Therefore, when there are a plurality of classification criteria as shown in 311 and 312 of FIG. 3, it is troublesome that the directory structure desired by the searcher must be searched by turning a plurality of screens or the like. It is possible to avoid work. For example, in the present embodiment, there are three directory configurations of “product”, “document”, and “delivery destination”. For that purpose, if one directory can be displayed in one window, it is necessary to prepare three windows and turn them. If there are 100 directories, 100 pages will be turned. Furthermore, in the process of searching for a document from among them, there arises a problem that the association with other directories cannot be grasped. In this embodiment, all these problems can be solved. First, since only the metadata label at the top of the directory is displayed on the initial screen, even if the directory structure is 100, in the initial state, one appropriate one of 100 labels in one screen is selected. Just search. Furthermore, since the metadata labels that are related to each other on the metadata map are connected by a line in the form of a network, the relationship with the metadata of other directories that are of interest can be easily grasped as described above. Furthermore, since it is possible to save which label is selected in the metadata map, the previous state is reproduced when the system of this embodiment is started after restarting the computer. It is also possible.
[0036]
FIG. 17 shows an example of displaying a document including the selected metadata. A
[0037]
Further, instead of the
[0038]
FIG. 19 is also an example of a search function interface using metadata. The metadata is represented in a
[0039]
In addition, the following functions are useful from the viewpoint of user assistance. For example, in the process of selecting metadata in FIG. 16, the user's selection history so far is recorded, and the metadata names and metadata information that are easy for the user to select (that is, frequently selected) are made conspicuous. Etc. are also possible. As a method to make it stand out, “Representation of the degree of association by the background color, tone, and shading of the label”, “Expression of the degree of association by adding an identification mark to the label”, “Relationship by the type and width of the label border "Representation of relevance by label shape and size", "Representation of relevance by character font", and the like.
[0040]
Regarding the relationship between metadata, a relationship that co-occurs (reacts together) and an exclusive relationship can be defined in the metadata. Thus, when a metadata label is selected, a metadata label having a co-occurrence relationship can be automatically selected (for example, when a metadata value “JAVA (R)” is selected). In addition, “object-oriented” is automatically selected), and it is also possible to automatically deselect metadata in an exclusive relationship.
[0041]
From the viewpoint of application to a relational database (referred to as RDB), the present invention can be applied not only to metadata attached to a document but also to database data. For example, each field name such as RDB can be used as a metadata name, and a field value (data) can be used as a metadata value. In addition, by defining the field to be referred to as the text, the above search method can be used. Further, by outputting RDB or the like in XML format, the present invention can be applied as it is. As a result, the information stored in the database can be narrowed down as desired while visually confirming the relationship between the data without fixing the hierarchical structure in a system using a metadata map.
[0042]
Regarding the rearrangement of metadata, a method for making the screen easier to see and operate is provided by the following method. That is, regarding the display of the metadata map, when the number of metadata labels increases, the maps are rearranged automatically so that the labels do not overlap. In order to make the map easier to see, the labels are automatically rearranged so that the lines are not crowded. There are a plurality of label rearrangement methods as described below. As a first method, overlapping and congestion are solved by shifting only the labels in the vicinity of each label. This method rearranges the labels without greatly changing the current arrangement and makes it easier to see. As a second method, all labels are evenly arranged. This method is a method for rebalancing the whole while maintaining the current arrangement to some extent. By this method, the entire label is rearranged evenly to make it easier to see. Third, there is a method of completely rearranging by using random numbers. In this case, the current arrangement of the metadata map is not maintained, but it is effective when the current arrangement is not desired. Further, as a fourth method, there is a method of arranging similar labels in the vicinity. Rearrangement of the metadata map labels can be done manually during the search process. It is also possible to automatically rearrange labels according to environment settings and option settings. In addition, the size of characters and figures can be changed as the display information increases or decreases. When the number of displayed metadata exceeds a certain value, the number of points that is the size of the character display is reduced, or when the overlapping display is possible or the display interval is narrowed, the number of points that is the size of the character display is reduced. This makes it easy to see. Further, when the relation is displayed as a line as in the example 1614 in FIG. 16, it is preferable to display the relation so that the line does not cross.
[0043]
17-19, especially in FIG. 17, when a large amount of information is displayed in the
[0044]
As described above, as an embodiment of the present invention, a method has been described in which document metadata is not defined in a directory structure, but is defined in a free format structure that is not conscious of upper concepts and lower concepts. This method can be regarded as a document storage method in which a document is stored in a state to which metadata is added without being stored in a folder (directory). According to this method, it is not necessary to be aware of the directory structure, and it is possible to easily define document metadata even when there are a plurality of superordinate concepts. Therefore, it is possible to accurately register metadata envisioned by a document registrant. In the embodiment of the present invention, the function has been described in which information can be narrowed down like directory search by selecting a label without being aware of the directory on the metadata map. At this time, since the metadata map has elements that can be expanded into a plurality of directory configurations, it is possible to perform a search assuming a directory configuration envisioned by the searcher. In addition, when performing this search, metadata can be displayed in the form of a metadata map, directory, and tabular, where you can search from your favorite label (location) or directory or value or field. A search method was presented. In addition, a method has been described in which, in the process of searching for a document, the relationship with a document included in another directory configuration (category) can be easily discriminated by connecting labels with lines. According to this method, it is possible to search the related information widely by tracing the relationship between the metadata, and it is possible to investigate the necessary information sufficiently and to improve the search accuracy, which is very convenient. Further, the contents of the search method that can easily search the contents of the DB using the DB field information as metadata have been described. If the contents of the DB can be searched as they are by the search method of the present embodiment, it is possible to search a DB that has already been constructed visually and comfortably without using effort in determining keywords.
[0045]
【The invention's effect】
According to the present invention, the operability of the operation of assigning metadata to a document as the operation of categorizing information for search processing is improved.
Further, according to the present invention, in the search method using the metadata label or the like, the operability of the search process is improved or the search accuracy is improved.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of an information search apparatus.
FIG. 2 is a process flowchart of the entire system.
FIG. 3 is a configuration example of a category directory.
FIG. 4 is an example of metadata.
FIG. 5 is an example of how to have metadata.
FIG. 6 is a flowchart of document accumulation and metadata assignment processing.
FIG. 7 is a screen transition of document accumulation and metadata assignment processing.
FIG. 8 is an explanatory diagram of a user authentication screen for document accumulation and metadata assignment processing;
FIG. 9 is an explanatory diagram of a personal library search screen for document accumulation and metadata assignment processing;
FIG. 10 is an explanatory diagram of a personal library search result screen for document accumulation and metadata assignment processing;
FIG. 11 is an explanatory diagram of a document list screen for document accumulation and metadata assignment processing;
FIG. 12 is an explanatory diagram of a document content screen for document accumulation and metadata assignment processing;
FIG. 13 is an explanatory diagram of a new document registration screen for document accumulation and metadata assignment processing;
FIG. 14 is an explanatory diagram of a metadata change screen for document accumulation and metadata assignment processing;
FIG. 15 is an explanatory diagram of a metadata change detail screen for document accumulation and metadata assignment processing;
FIG. 16 is a flow of retrieval by a metadata map.
FIG. 17 is a search result by a metadata map.
FIG. 18 shows metadata directories and search results.
FIG. 19 shows a metadata table and search results.
[Explanation of symbols]
101 server (search processing device)
102 Client (operating device)
103 metadata database
104 Document database
105 Document metadata database
201 Document input means
202 Corresponding metadata extraction means
203 Corresponding metadata identification means
204 Corresponding metadata giving means
209 Metadata input means
210 Metadata corresponding document search means
214 Metadata Applicable Document Output Means
220 Metadata presentation means
1111 An example of the utterance of the metadata grant agent
Display example of 1615 metadata map
1701 Example of document search result (example of search document list)
1801 Example of directory display of metadata
1901 Display example of metadata in tabular format
Claims (3)
前記メタデータ値と、他の前記メタデータ名に属する前記メタデータ値との関連とを表示しながら情報の検索をする表示部及び入力部を有する検索処理装置と、A search processing device having a display unit and an input unit for searching for information while displaying the metadata value and the association between the metadata value belonging to the other metadata name;
前記メタデータ値を前記メタデータ名に関連付けて記憶したメタデータデータベース、A metadata database storing the metadata value in association with the metadata name;
前記情報を特定する識別子に関連付けて、前記情報を記憶した文書データベース及びA document database storing the information in association with an identifier identifying the information; and
情報を特定する識別子に関連付けて、複数の前記メタデータ名と各メタデータ名に属する前記メタデータ値を記憶した文書メタデータデータベースを備える記憶装置と、A storage device comprising a document metadata database storing a plurality of the metadata names and the metadata values belonging to each metadata name in association with an identifier for identifying information;
を有する情報検索システムであって、 An information retrieval system having
前記検索処理装置は、The search processing device includes:
前記入力部を介して検索対象の情報の入力を受け付けると、前記メタデータデータベースから、メタデータ名ごとに、前記メタデータ名に関する前記メタデータデータベースに含まれるすべてのメタデータ値を取得し、When receiving input of information to be searched through the input unit, for each metadata name, from the metadata database, to obtain all metadata values included in the metadata database related to the metadata name,
当該取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を取得し、For all the obtained metadata values, obtain the similarity to the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第1の類似情報を作成し、For each metadata name, create first similarity information in which the similarity ranking is associated with a metadata value,
前記文書データベースに含まれる情報のうち、前記入力を受け付けた情報と類似すると判断された所定の個数の情報につき、前記文書メタデータデータベースを検索し、当該情報に係るメタデータ値をすべて取得し、Among the information included in the document database, the document metadata database is searched for a predetermined number of pieces of information determined to be similar to the information that has received the input, and all the metadata values related to the information are acquired,
当該文書メタデータデータベースを検索して取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を算出し、For all metadata values obtained by searching the document metadata database, calculate the similarity with the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第2の類似情報を作成し、For each metadata name, create second similarity information in which the similarity ranking is associated with a metadata value,
メタデータ名ごとに、前記第1の類似情報と前記第2の類似情報に基づいてメタデータ値を決定し、For each metadata name, determine a metadata value based on the first similarity information and the second similarity information;
前記決定されたメタデータ値を、情報を特定する識別子とメタデータ名に関連付けて、文書メタデータデータベースに記憶するThe determined metadata value is stored in the document metadata database in association with an identifier for identifying information and a metadata name.
こと及びAnd
前記文書メタデータデータベースに記憶されている、少なくとも1つの前記メタデータ名を示すラベルを前記表示部を介して表示し、A label indicating at least one metadata name stored in the document metadata database is displayed via the display unit;
前記表示されたラベルについての最初の選択を前記入力部を介して受け付け、Accepting an initial selection for the displayed label via the input unit;
前記文書メタデータデータベースを検索し前記最初に選択されたラベルが示す前記メタデータ名に属する前記メタデータ値を全て取得し、Search the document metadata database to obtain all the metadata values belonging to the metadata name indicated by the first selected label;
前記取得されたメタデータ値を示す最初のラベルを、前記メタデータ名を示すラベルとの関係を線で示しつつ前記表示部を介して表示し、An initial label indicating the acquired metadata value is displayed via the display unit while showing a relationship with a label indicating the metadata name by a line,
前記表示されたメタデータ名を示すラベルのうち、選択されていないラベルについて最初の選択に続く選択を前記入力部を介して受け付け、Among the labels indicating the displayed metadata names, the selection following the first selection is accepted for the unselected labels through the input unit,
前記文書メタデータデータベースを検索し前記最初の選択に続き選択されたラベルが示す前記メタデータ名に属するメタデータ値を全て取得し、Search the document metadata database to obtain all metadata values belonging to the metadata name indicated by the selected label following the first selection;
前記取得されたメタデータ値を示す最初の選択に続く選択に基づくラベルを、前記最初の選択に続き選択されたラベルとの関係を線で示しつつ前記表示部を介して表示し、A label based on a selection subsequent to the first selection indicating the acquired metadata value is displayed via the display unit with a line indicating a relationship with the label selected following the first selection;
前記最初のラベルが示す各メタデータ値と、前記最初の選択に続く選択に基づくラベルが示す各メタデータ値との組み合わせを含む情報が前記文書メタデータデータベースに存在する場合は、当該組み合わせを構成する前記メタデータ値を示すラベル間の関係を示す線を前記表示部を介して表示すること、If information including a combination of each metadata value indicated by the first label and each metadata value indicated by a label based on the selection following the first selection exists in the document metadata database, the combination is configured. Displaying a line indicating a relationship between labels indicating the metadata value to be displayed via the display unit;
を特徴とする情報検索システム。Information retrieval system characterized by
前記メタデータ値と、他の前記メタデータ名に属する前記メタデータ値との関連とをThe association between the metadata value and the metadata value belonging to another metadata name
表示しながら情報の検索をする表示部及び入力部を有する検索処理装置と、A search processing device having a display unit and an input unit for searching information while displaying;
前記メタデータ値を前記メタデータ名に関連付けて記憶したメタデータデータベース、A metadata database storing the metadata value in association with the metadata name;
前記情報を特定する識別子に関連付けて、前記情報を記憶した文書データベース及びA document database storing the information in association with an identifier identifying the information; and
情報を特定する識別子に関連付けて、複数の前記メタデータ名と各メタデータ名に属する前記メタデータ値を記憶した文書メタデータデータベースを備える記憶装置と、A storage device comprising a document metadata database storing a plurality of the metadata names and the metadata values belonging to each metadata name in association with an identifier for identifying information;
を有する情報検索システムを用いる情報検索方法であって、 An information search method using an information search system having
前記検索処理装置は、The search processing device includes:
前記入力部を介して検索対象の情報の入力を受け付けると、前記メタデータデータベースから、メタデータ名ごとに、前記メタデータ名に関する前記メタデータデータベースに含まれるすべてのメタデータ値を取得し、When receiving input of information to be searched through the input unit, for each metadata name, from the metadata database, to obtain all metadata values included in the metadata database related to the metadata name,
当該取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を取得し、For all the obtained metadata values, obtain the similarity to the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第1の類似情報を作成し、For each metadata name, create first similarity information in which the similarity ranking is associated with a metadata value,
前記文書データベースに含まれる情報のうち、前記入力を受け付けた情報と類似すると判断された所定の個数の情報につき、前記文書メタデータデータベースを検索し、当該情報に係るメタデータ値をすべて取得し、Among the information included in the document database, the document metadata database is searched for a predetermined number of pieces of information determined to be similar to the information that has received the input, and all the metadata values related to the information are acquired,
当該文書メタデータデータベースを検索して取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を算出し、For all metadata values obtained by searching the document metadata database, calculate the similarity to the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第2の類似情報を作成し、For each metadata name, create second similarity information in which the similarity ranking is associated with a metadata value,
メタデータ名ごとに、前記第1の類似情報と前記第2の類似情報に基づいてメタデータ値を決定し、For each metadata name, determine a metadata value based on the first similarity information and the second similarity information;
前記決定されたメタデータ値を、情報を特定する識別子とメタデータ名に関連付けて、文書メタデータデータベースに記憶するThe determined metadata value is stored in the document metadata database in association with an identifier for identifying information and a metadata name.
こと及びAnd
前記文書メタデータデータベースに記憶されている、少なくとも1つの前記メタデータ名を示すラベルを前記表示部を介して表示し、A label indicating at least one metadata name stored in the document metadata database is displayed via the display unit;
前記表示されたラベルについての最初の選択を前記入力部を介して受け付け、Accepting an initial selection for the displayed label via the input unit;
前記文書メタデータデータベースを検索し前記最初に選択されたラベルが示す前記メタデータ名に属する前記メタデータ値を全て取得し、Search the document metadata database to obtain all the metadata values belonging to the metadata name indicated by the first selected label;
前記取得されたメタデータ値を示す最初のラベルを、前記メタデータ名を示すラベルとの関係を線で示しつつ前記表示部を介して表示し、An initial label indicating the acquired metadata value is displayed via the display unit while showing a relationship with a label indicating the metadata name by a line,
前記表示されたメタデータ名を示すラベルのうち、選択されていないラベルについて最初の選択に続く選択を前記入力部を介して受け付け、Among the labels indicating the displayed metadata names, the selection following the first selection is accepted for the unselected labels through the input unit,
前記文書メタデータデータベースを検索し前記最初の選択に続き選択されたラベルが示す前記メタデータ名に属するメタデータ値を全て取得し、Search the document metadata database to obtain all metadata values belonging to the metadata name indicated by the selected label following the first selection;
前記取得されたメタデータ値を示す最初の選択に続く選択に基づくラベルを、前記最初の選択に続き選択されたラベルとの関係を線で示しつつ前記表示部を介して表示し、A label based on a selection subsequent to the first selection indicating the acquired metadata value is displayed via the display unit with a line indicating a relationship with the label selected following the first selection;
前記最初のラベルが示す各メタデータ値と、前記最初の選択に続く選択に基づくラベルが示す各メタデータ値との組み合わせを含む情報が前記文書メタデータデータベースに存在する場合は、当該組み合わせを構成する前記メタデータ値を示すラベル間の関係を示す線を前記表示部を介して表示すること、If information including a combination of each metadata value indicated by the first label and each metadata value indicated by a label based on the selection following the first selection exists in the document metadata database, the combination is configured. Displaying a line indicating a relationship between labels indicating the metadata value to be displayed via the display unit;
を特徴とする情報検索方法。Information retrieval method characterized by
前記メタデータ値と、他の前記メタデータ名に属する前記メタデータ値との関連とをThe association between the metadata value and the metadata value belonging to another metadata name
表示しながら情報の検索をする表示部及び入力部を有する検索処理装置と、A search processing device having a display unit and an input unit for searching information while displaying;
前記メタデータ値を前記メタデータ名に関連付けて記憶したメタデータデータベース、A metadata database storing the metadata value in association with the metadata name;
前記情報を特定する識別子に関連付けて、前記情報を記憶した文書データベース及びA document database storing the information in association with an identifier identifying the information; and
情報を特定する識別子に関連付けて、複数の前記メタデータ名と各メタデータ名に属する前記メタデータ値を記憶した文書メタデータデータベースを備える記憶装置と、A storage device comprising a document metadata database storing a plurality of the metadata names and the metadata values belonging to each metadata name in association with an identifier for identifying information;
を有する情報検索システムを機能させる情報検索プログラムであって、 An information search program for functioning an information search system having
前記検索処理装置に対し、For the search processing device,
前記入力部を介して検索対象の情報の入力を受け付けると、前記メタデータデータベースから、メタデータ名ごとに、前記メタデータ名に関する前記メタデータデータベースに含まれるすべてのメタデータ値を取得し、When receiving input of information to be searched through the input unit, for each metadata name, from the metadata database, to obtain all metadata values included in the metadata database related to the metadata name,
当該取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を取得し、For all the obtained metadata values, obtain the similarity to the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第1の類似情報を作成し、For each metadata name, create first similarity information in which the similarity ranking is associated with a metadata value,
前記文書データベースに含まれる情報のうち、前記入力を受け付けた情報と類似すると判断された所定の個数の情報につき、前記文書メタデータデータベースを検索し、当該情報に係るメタデータ値をすべて取得し、Among the information included in the document database, the document metadata database is searched for a predetermined number of pieces of information determined to be similar to the information that has received the input, and all metadata values related to the information are acquired.
当該文書メタデータデータベースを検索して取得したすべてのメタデータ値について、前記入力を受け付けた情報との類似度を算出し、For all metadata values obtained by searching the document metadata database, calculate the similarity with the information that received the input,
メタデータ名ごとに、前記類似度の順位をメタデータ値に関連付けた第2の類似情報を作成し、For each metadata name, create second similarity information in which the similarity ranking is associated with a metadata value,
メタデータ名ごとに、前記第1の類似情報と前記第2の類似情報に基づいてメタデータ値を決定し、For each metadata name, determine a metadata value based on the first similarity information and the second similarity information;
前記決定されたメタデータ値を、情報を特定する識別子とメタデータ名に関連付けて、文書メタデータデータベースに記憶するThe determined metadata value is stored in the document metadata database in association with an identifier for identifying information and a metadata name.
機能及びFunction and
前記文書メタデータデータベースに記憶されている、少なくとも1つの前記メタデータ名を示すラベルを前記表示部を介して表示し、A label indicating at least one metadata name stored in the document metadata database is displayed via the display unit;
前記表示されたラベルについての最初の選択を前記入力部を介して受け付け、Accepting an initial selection for the displayed label via the input unit;
前記文書メタデータデータベースを検索し前記最初に選択されたラベルが示す前記メタデータ名に属する前記メタデータ値を全て取得し、Search the document metadata database to obtain all the metadata values belonging to the metadata name indicated by the first selected label;
前記取得されたメタデータ値を示す最初のラベルを、前記メタデータ名を示すラベルとの関係を線で示しつつ前記表示部を介して表示し、An initial label indicating the acquired metadata value is displayed via the display unit while showing a relationship with a label indicating the metadata name by a line,
前記表示されたメタデータ名を示すラベルのうち、選択されていないラベルについて最初の選択に続く選択を前記入力部を介して受け付け、Among the labels indicating the displayed metadata names, the selection following the first selection is accepted for the unselected labels through the input unit,
前記文書メタデータデータベースを検索し前記最初の選択に続き選択されたラベルが示す前記メタデータ名に属するメタデータ値を全て取得し、Search the document metadata database to obtain all metadata values belonging to the metadata name indicated by the selected label following the first selection;
前記取得されたメタデータ値を示す最初の選択に続く選択に基づくラベルを、前記最初の選択に続き選択されたラベルとの関係を線で示しつつ前記表示部を介して表示し、A label based on a selection subsequent to the first selection indicating the acquired metadata value is displayed via the display unit with a line indicating a relationship with the label selected following the first selection;
前記最初のラベルが示す各メタデータ値と、前記最初の選択に続く選択に基づくラベルが示す各メタデータ値との組み合わせを含む情報が前記文書メタデータデータベースに存在する場合は、当該組み合わせを構成する前記メタデータ値を示すラベル間の関係を前記表示部を介して表示する機能を実現させること、If information including a combination of each metadata value indicated by the first label and each metadata value indicated by a label based on the selection following the first selection exists in the document metadata database, the combination is configured. Realizing a function of displaying a relationship between labels indicating the metadata value via the display unit;
を特徴とする情報検索プログラム。An information retrieval program characterized by
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359927A JP4084647B2 (en) | 2002-12-11 | 2002-12-11 | Information search system, information search method, and information search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359927A JP4084647B2 (en) | 2002-12-11 | 2002-12-11 | Information search system, information search method, and information search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004192355A JP2004192355A (en) | 2004-07-08 |
JP4084647B2 true JP4084647B2 (en) | 2008-04-30 |
Family
ID=32759180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002359927A Expired - Fee Related JP4084647B2 (en) | 2002-12-11 | 2002-12-11 | Information search system, information search method, and information search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4084647B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8011415B2 (en) | 2005-06-13 | 2011-09-06 | Sintokogio, Ltd. | Flaskless molding apparatus for an upper and a lower mold |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008515029A (en) * | 2004-09-29 | 2008-05-08 | 株式会社医薬分子設計研究所 | Display method of molecular function network |
JP2007115180A (en) * | 2005-10-24 | 2007-05-10 | Sony Corp | Information processor, information display method and information display program |
JP2009064097A (en) * | 2007-09-04 | 2009-03-26 | Hitachi East Japan Solutions Ltd | Retrieval result display method, retrieval result display program and retrieval result display device |
JP5096850B2 (en) * | 2007-09-14 | 2012-12-12 | 株式会社 日立東日本ソリューションズ | Search result display method, search result display program, and search result display device |
JP5155710B2 (en) * | 2008-03-25 | 2013-03-06 | 株式会社 日立東日本ソリューションズ | Document group analysis support device |
KR101054050B1 (en) * | 2008-11-28 | 2011-08-03 | 한국과학기술원 | Personalized visualization method to help users search for information |
JP5810792B2 (en) | 2011-09-21 | 2015-11-11 | 富士ゼロックス株式会社 | Information processing apparatus and information processing program |
EP2897059A4 (en) | 2012-09-13 | 2016-07-06 | Ntt Docomo Inc | User interface device, search method, and program |
JP2015225445A (en) * | 2014-05-27 | 2015-12-14 | ソニー株式会社 | Information processing apparatus and information processing method |
JP7325252B2 (en) * | 2019-07-10 | 2023-08-14 | 三菱電機ビルソリューションズ株式会社 | Document information presentation device and program |
JP6773861B1 (en) * | 2019-08-06 | 2020-10-21 | 株式会社東芝 | Nonconformity case search system and nonconformity case search method |
-
2002
- 2002-12-11 JP JP2002359927A patent/JP4084647B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8011415B2 (en) | 2005-06-13 | 2011-09-06 | Sintokogio, Ltd. | Flaskless molding apparatus for an upper and a lower mold |
Also Published As
Publication number | Publication date |
---|---|
JP2004192355A (en) | 2004-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0722145B1 (en) | Information retrieval system and method of operation | |
US5913215A (en) | Browse by prompted keyword phrases with an improved method for obtaining an initial document set | |
US7890499B1 (en) | Presentation of search results with common subject matters | |
US9384245B2 (en) | Method and system for assessing relevant properties of work contexts for use by information services | |
US20180004850A1 (en) | Method for inputting and processing feature word of file content | |
US20150178350A1 (en) | Automatic method and system for formulating and transforming representations of context used by information services | |
US20030004941A1 (en) | Method, terminal and computer program for keyword searching | |
JP2007527558A (en) | Navigation by websites and other information sources | |
KR101502671B1 (en) | Online analysis and display of correlated information | |
JPH0844759A (en) | System and method for information retrieval | |
US20040015485A1 (en) | Method and apparatus for improved internet searching | |
JP4084647B2 (en) | Information search system, information search method, and information search program | |
KR101441219B1 (en) | Automatic association of informational entities | |
US8612431B2 (en) | Multi-part record searches | |
US8181116B1 (en) | Method and apparatus for hyperlink list navigation | |
JP5943756B2 (en) | Search for ambiguous points in data | |
KR20000030486A (en) | Internet information search system for special searching a regional information and method for searching the internet information using the same | |
JP3864235B2 (en) | Information retrieval system and information retrieval program | |
KR101120040B1 (en) | Apparatus for recommending related query and method thereof | |
JP2005128872A (en) | Document retrieving system and document retrieving program | |
JPH10162011A (en) | Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device | |
US20080228725A1 (en) | Problem/function-oriented searching method for a patent database system | |
JP2746198B2 (en) | Database search method for full text | |
JP2005196254A (en) | Directory structure forming device, its method and directory service system | |
JPH06301728A (en) | Data base structure and its retrieving device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080215 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110222 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 6 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 6 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 6 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |