JP4189251B2 - キーワード解析方法及びそれに使用するプログラム - Google Patents

キーワード解析方法及びそれに使用するプログラム Download PDF

Info

Publication number
JP4189251B2
JP4189251B2 JP2003095893A JP2003095893A JP4189251B2 JP 4189251 B2 JP4189251 B2 JP 4189251B2 JP 2003095893 A JP2003095893 A JP 2003095893A JP 2003095893 A JP2003095893 A JP 2003095893A JP 4189251 B2 JP4189251 B2 JP 4189251B2
Authority
JP
Japan
Prior art keywords
keyword
frequency
keywords
analysis method
calculation result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003095893A
Other languages
English (en)
Other versions
JP2004302950A (ja
Inventor
滋 多胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2003095893A priority Critical patent/JP4189251B2/ja
Publication of JP2004302950A publication Critical patent/JP2004302950A/ja
Application granted granted Critical
Publication of JP4189251B2 publication Critical patent/JP4189251B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【産業上の利用分野】
本発明は遺伝子関連のデータの解析に利用して好適なキーワード解析技術に関し、特に、テキストマイニング方法によってキーワードを解析するためのキーワード解析技術に関する。
【0002】
【従来の技術】
大量の文書データ集合を保持するデータベースを検索し、所望のテーマについて記述されている文書データを抽出し、参照することを目的としたデータベース検索システムにおいて、所望のテーマについて記述されている文書データであるか否かを決定付ける条件として、ユーザが入力した1つまたは複数のキーワードを文書データ中に含むか否かを用いる方法が一般的である。
【0003】
あるいは、単に含むか否かという条件だけでは所望のテーマについて記述していない文書データも条件を満たしてしまう可能性が高いため、キーワードの1文書データあたりの出現回数を求め、それに基づいて抽出された文書データの順位付けを行うことで、より所望のテーマに近いテーマについて記述されている文書データを絞り込む方法も用いられている。
【0004】
後者の方法の例として、「特開2002−49638号公報文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体」が挙げられる。
【0005】
しかし、単純な順位付けでは、1つのパラメータによる文書データの絞り込みしかできないため、所望のテーマについて記述されている文書データであるにも関わらず、入力したキーワードの出現頻度が他の文書データに比して小さいという理由だけで、抽出されないということが起こりうる。
【0006】
これに対し、複数のキーワードを全文書データ中から抽出し、その各々の出現頻度を算出したうえで、全出現頻度の傾向が似ている文書データグループを自動的に抽出する、クラスタ解析と呼ばれる手法も用いられる。その例として、「特開平9−231238号公報テキスト検索結果表示方法及び装置」がある。
【0007】
【特許文献1】
特開2002−49638号公報
【特許文献2】
特開平9−231238号公報
【0008】
【発明が解決しようとする課題】
しかし、前記クラスタ解析の方法には次の課題がある。すなわち、文書データ間の類似度とキーワードの出現頻度とをより正確に対応付けるために、全文書データ中に共通に出現するキーワードを自動的に抽出し、そられの出現頻度を用いてクラスタ解析を実行する。従って、検索者が所望するテーマとは異なるテーマについて記述している文書データグループがクラスタ化されてしまう可能性が高く、所望のテーマについて記述している文書データのみ、あるいはほぼ同等の文書データから成るクラスタを得ることが困難になっている。
【0009】
また、遺伝子関連の文書データの例に見られるように、特定のテーマを象徴する情報がキーワードではない場合がある。遺伝子関連のデータの例では、特定の遺伝子のIDや塩基配列が特定のテーマを象徴する情報でもある。
【0010】
この例では、同一の塩基配列を持つ遺伝子に関して記述している文書データであっても、それらに出現するキーワード群が非常に異なる集合であることがありうる。かつ、検索者は特定の遺伝子に関して記述している文書データを抽出したいのであって、たとえそれら文書データに出現するキーワード群が非常に異なっていたとしても、それら文書データを全て抽出したいと考える。
【0011】
これに対し、キーワードの出現頻度に基づく従来の方法では、検索者にとって所望のテーマを象徴する適切なキーワードを選択する手段がないという問題がある。
本発明は、所望のテーマについて記述している文書データを文書データグループとして特定することが容易に行えるキーワード解析方法を提供することにある。
【0012】
【課題を解決するための手段】
本発明によると、文書データを格納したデータベースにおいて任意のキーワードを解析するためのキーワード解析方法において、
ユーザが入力した第1のキーワードに基づいて、上記データベースよりテキストデータを抽出するテキストデータ抽出ステップと、該抽出したテキストデータにおけるユーザが入力した第2のキーワードの出現頻度を算出する頻度算出ステップと、上記第2のキーワードの出現頻度を上記第1のキーワードに基づいて分類した頻度テーブルを生成する頻度テーブル生成ステップと、上記第2のキーワードの出現頻度に基づいて上記第1のキーワードをクラスタ解析するクラスタ解析ステップと、を含む。
【0013】
従って、検索者は全文書データをまず複数のグループに任意に分類し、さらにその文書データグループを単位として、やはり任意に入力したキーワード群の各々についてその出現頻度に応じてクラスタ解析を実行する。その結果として、個々の文書データでは出現するキーワードが異なる場合であっても、所望のテーマについて記述している文書データを文書データグループとして特定することが容易に行えるようになる。
【0014】
【発明の実施の形態】
以下図を参照して、本発明の実施例を説明する。図1は本発明によるキーワード解析システム構成を示す。本例のキーワード解析システムは、ディスプレイ装置101、演算装置102、マウス装置103、キーボード104、ファイルシステム105、及び、第1及び第2のキーワードテーブル111、112を有する。
【0015】
ディスプレイ装置101は、文字および図形を表示する機能とマウスカーソルを表示する機能とを有する。演算装置102は、ディスプレイ装置101上のマウスカーソルの位置を受信する機能と、キーボードから任意の文字列を受信する機能と、メモリ中にデータを保持する機能と、テキストデータから特定の一部の文字列を切り出す機能と、特定の文字列同士が一致するか否かを判定する機能を有する。マウス装置103は、ディスプレイ装置101上のマウスカーソルの移動を指示し、ボタンを押すことによりマウスカーソルの位置の認識を指示する機能を有する。キーボード104は、任意の文字列を入力し、演算装置102に送信する機能を有する。
【0016】
ファイルシステム105は、テキストデータ106を各々ファイルとして保持する機能を持つ補助記憶装置である。図7は、ファイルシステム105に含まれるテキストデータ106のファイル名の一覧を格納するテーブルの構造を示している。
【0017】
図2は第1のキーワードテーブル111の構造を示している。このテーブルには複数の第1のキーワードが1列に格納されている。第1のキーワードテーブル111は、ファイルシステム105よりテキストデータ106を検索及び分類するために使用する。図3は第2のキーワードテーブル112の構造を示している。このテーブルは第1のキーワードテーブルと同様に複数の第2のキーワードが1列に格納されている。第2のキーワードテーブル112は、第1のキーワードをクラスタ解析するために使用する。
【0018】
再び図1を参照して、本発明によるキーワード解析システムの概念を説明する。先ず、検索者は、キーボード104から、ファイルシステム105に含まれるテキストデータ106の検索及び分類に使用する第1のキーワードを入力し、第1のキーワードテーブル111に格納する。次に、検索者は、キーボード104から、クラスタ解析に使用する第2のキーワードを入力し、第2のキーワードテーブル112に格納する。
【0019】
キーワード解析システムは第1のキーワードを使用して、ファイルシステム105に格納された第1のキーワードを含むテキストデータ106を抽出する。それによって、例えば、ファイルシステム105に格納されたm件のテキストデータ106よりn件(n≦m)のテキストデータ106を抽出することができる。また、抽出したテキストデータを、第1のキーワード毎に分類することができる。
【0020】
次に、上記第1のキーワードを用いて抽出した複数のテキストデータ106内に第2のキーワードが含まれる頻度を算出した頻度算出結果テーブル500が生成される。本実施例におけるこの頻度とは個々のテキストデータ106内に第2のキーワードが1回以上現れるかを示す数値であり、複数回現れた場合でも、1つのテキストデータ106に対しては1とカウントされる。すなわち、算出される頻度fの数値は上記第1のキーワードにより抽出されたテキストデータn件に対し、f≦nとなる。
【0021】
本発明によると、この頻度算出結果テーブル500に格納された第1のキーワードを第2のキーワードの頻度分布に基づいてクラスタ解析する。頻度算出結果テーブル500には、第1のキーワードの各々に対して第2のキーワードの頻度分布が記載されている。従って、第1のキーワードのうち、第2のキーワードの頻度分布の態様が類似しているものをグループ化することができる。
【0022】
こうしてクラスタ解析することによって、第1のキーワードは幾つかのグループに分類される。各グループの第1のキーワードは、類似した第2のキーワードの頻度分布を有する。従って、同一グループの第1のキーワードは、類似した又は共通の性質を有する。ユーザは、このグループ化されたキーワード群を様々な用途に使用することができる。
クラスタ解析法として、デンドログラム、k−means、SOM(Self Organized Map)等が知られているが、本発明ではどのような方法を使用してもよい。
【0023】
図4は、2つのキーワードテーブル111、112を使用して算出したキーワード頻度算出結果テーブルの構造を示している。左端の縦列401は、第1のキーワードテーブルに格納されている全ての第1のキーワードを格納する列である。次の縦列402は、第1のキーワードの各々をその内部に含むテキストデータファイルの名前を格納する列である。
上端の横行403は、第2のキーワードテーブルに格納されている全ての第2のキーワードを格納する行である。セル404は、第2のキーワードの頻度を格納する領域である。
【0024】
例えば、第1のキーワード1−1は、名称がP001.txt、P002.txt、P003.txt、P004.txt、P005.txt、P006.txt、P007.txt、P008.txtである8つのテキストデータに含まれる。また、第1のキーワード1−1と第2のキーワード2−1の両者を含む頻度(テキストデータ数)は5であり、第1のキーワード1−1と第2のキーワード2−2の両者を含む頻度(テキストデータ数)は2である。
【0025】
図5はディスプレイ装置101の画面に表示されるキーワード頻度算出結果テーブルの構成を示している。このキーワード頻度算出結果テーブルは、図4に示したキーワード頻度算出結果テーブルより、第2の縦列402を省略したものである。左端の縦列501は、図4のキーワード頻度算出結果テーブルの縦列401に格納された全ての第1のキーワードを表示する列である。上端の横列502は、図4のキーワード頻度算出結果テーブルの横列403に格納された全ての第2のキーワードを表示する行である。セル503は、図4のキーワード頻度算出結果テーブルのセル404に格納された頻度を表示する領域である。
【0026】
ディスプレイ装置101の画面は、クラスタ解析の実行を演算装置102に指示するための解析指示ボタン504を含む。マウス装置103によって、解析指示ボタン504を押すことによって、図4のキーワード頻度算出結果テーブルの第1のキーワードがクラスタ解析される。
【0027】
図6は、図5の画面において、解析指示ボタン504を指示することによってクラスタ解析が行われた後の画面の構成を示している。本例では、第1のキーワードのうち、キーワード1−1、1−3、1−5が1つのグループとして分類され、キーワード1−2、1−4、1−6が1つのグループとして分類されている。キーワード1−1、1−3、1−5に含まれる第2のキーワードの頻度ベクトルは互いに類似しており、キーワード1−2、1−4、1−6に含まれる第2のキーワードの頻度ベクトルは互いに類似している。第1のグループのキーワード1−1、1−3、1−5に含まれる頻度のベクトルは、第2のグループのキーワード1−2、1−4、1−6に含まれる頻度のベクトルに類似していない。クラスタ解析は、第1のキーワードに含まれる頻度のベクトルの特徴に基づいて、第1のキーワードを分類し、グループ化する。
【0028】
図6の画面において、マウス装置103によって、所望のセルをクリックすることによって、更に詳細なデータが表示される。例えば、第1のキーワード1−5と第2のキーワード2−3の交点のセルをクリックすると、図8に示す画面が表示される。
【0029】
図8の画面の領域801及び802は、図6の画面において、マウス装置103によって指定されたセルに対応する第1及び第2のキーワードを表示する。領域803は、第1のキーワード801及び第2のキーワードが含まれるテキストデータファイル名の一覧を表示する領域であり、図4の第1のキーワードの各々の縦列402に格納されたファイル名のうち第2のキーワードが含まれるテキストファイルの名称が表示される。
【0030】
図9を参照して本発明によるキーワード解析システムによる処理の流れを説明する。まず、検索者は、キーボード104から、ファイルシステム105に含まれるテキストデータ106の検索及び分類に使用する第1のキーワードを入力し、図2に示した第1のキーワードテーブル111に格納する。第1のキーワードは、所望のテーマを表現するテキストデータ106を検索することができるように、選択される。
【0031】
また検索者は、キーボード104から、クラスタ解析に使用する第2のキーワードを入力し、図3に示した第2のキーワードテーブル112に格納する。第2のキーワードは、第1のキーワードを、所望のテーマに基づいて分類することができるように、選択される。
【0032】
まず、ステップ901において、第1のキーワードテーブル111から第1のキーワードを1つ取り出す。次に、ステップ902において、全ての第1のキーワードについて処理したか否か、すなわちステップ901において第1のキーワードが取り出せなかったか否かを調べる。全ての第1のキーワードについて処理し終わっていた場合には、ステップ911に進み、全ての第1のキーワードについて処理していない場合には、ステップ903に進む。
ステップ903において、ファイルシステム105より、テキストデータファイル106を1つ取り出す。
【0033】
ステップ904において、ファイルシステム105の全てのテキストデータファイルを処理したか否か、すなわちステップ903においてテキストデータファイルを取り出せなかったか否かを調べ、全てのテキストデータファイルを処理し終わっていた場合は、ステップ905に進み、全てのテキストデータファイルを処理していない場合は、ステップ901に戻る。
【0034】
ステップ905において、ステップ904にて取り出したテキストデータファイルにステップ901にて取り出した第1のキーワードが含まれているか否かを調べる。第1のキーワードが含まれていない場合は、ステップ903に戻り、次のテキストデータファイルを取り出して、処理を繰り返す。第1のキーワードが含まれている場合は、ステップ906に進む。
【0035】
ステップ906において、図4の頻度テーブルのセル402にステップ903にて取り出したテキストデータファイルのファイル名を格納する。ファイル名を格納する場所は、ステップ905において含まれていると判断されたキーワードが表示されたキーワード行401と同一の行である。
【0036】
次に、ステップ907において、第2のキーワードテーブル112から第2のキーワードを1つ取り出す。次に、ステップ908において、全ての第2のキーワードについて処理したか否か、すなわちステップ907において第2のキーワードを取り出せなかったか否かを調べる。全ての第2のキーワードについて処理し終わっていた場合には、ステップ903に戻り、次のファイルを処理する。全ての第2のキーワードについて処理していない場合には、ステップ909に進む。
【0037】
ステップ909において、ステップ903にて取り出したテキストデータファイルにこの第2のキーワードが含まれているか否かを調べる。第2のキーワードが含まれている場合は、ステップ910に進み、第2のキーワードが含まれていない場合は、ステップ907に戻り、次の第2のキーワードを取り出し、同様な処理を行う。
【0038】
ステップ910において、図4の頻度テーブルの出現頻度を1増加させる。第1のキーワードが格納されている行と同一の行であり、かつ第2のキーワードが格納されているの列と同一の列である、1つのセルに格納されている数値、すなわち出現頻度を1増加させる。
【0039】
こうして、ステップ908において、全ての第2のキーワードについて処理したことが確認されるまで、ステップ907からステップ910を繰り返す。全ての第2のキーワードについて処理された場合は、ステップ903に戻り、未処理のテキストデータファイルを1つ取り出すステップを繰り返す。また、全てのテキストデータファイルについて処理された場合は、ステップ904からステップ901に進み、未処理の第1のキーワードを1つ取り出すステップを繰り返す。この結果、図4における頻度テーブルのセル404に格納する頻度が全て算出される。
【0040】
次に、ステップ911において、図4の頻度テーブルをディスプレイ装置101の画面に表示する。ディスプレイ装置101の画面には、図5に示したテーブル画面が表示される。
次に、ステップ912において、ユーザはマウス装置103を使って画面上の解析ボタン504をクリックする。
【0041】
ステップ913において、クラスタ解析を実行する。セル503に表示された数値を列方向にベクトルとしてクラスタ解析を行い、類似したベクトルを含む1つ以上複数のクラスタを得る。ここで、クラスタとは、図5における列方向のデータをメモリ上においてグループ化したものを指す。クラスタ解析の手法はここでは限定しない。
【0042】
次に、ステップ914において、図6に示すように頻度テーブルを表示した画面を更新する。図6の例では、クラスタ解析により、キーワード1−1、キーワード1−3、キーワード1−5が1つのクラスタを形成し、残りが別のクラスタを形成している。さらに、頻度テーブル表示画面上にて、同一のクラスタを形成するセルを色分けしてよい。それによって、クラスタを視覚的に識別し易くなる。
【0043】
次に、ステップ915において、ユーザがマウス装置103を使って頻度テーブル表示画面上のいずれかのセルをクリックしたか否かを判定する。クリックした場合は、ステップ916において、クリックしたセルに対し、図4のテーブルにおいて同じ行に格納されているテキストデータファイル名を領域402から全て取り出し、さらにクリックしたセルに対し、図4のテーブルにおいて同じ列に格納されている第2のキーワードを領域403から取り出す。更に、前記テキストデータファイルのうち、取り出した第2のキーワードを含むものを抽出し、図7のテーブルに格納する。
【0044】
そしてステップ917において、それらのデータを図8のファイルリスト画面に表示する。801および802にはそれぞれステップ915でクリックしたセルに対応する第1および第2のキーワードを表示する。803には第1および第2のキーワードを含むテキストデータファイルの名称の一覧が表示される。図8は図6の太線で囲まれたセルをクリックした場合の例であり、801にはそのセルに対応した第1のキーワードであるキーワード1−5、802にはそのセルに対応した第2のキーワードであるキーワード2−3、803には該第1および第2のキーワードを含むファイルの名称の一覧が表示される。図6の該クリックしたセルに格納されている頻度(第1および第2のキーワードを含むファイルの数)は6なので図8の803には6つのテキストデータファイル名が表示されている。
【0045】
図9の処理はコンピュータによって実行されてよい。従って、本発明は図9の処理をコンピュータに実行させるためのプログラム及びそのようなプログラムを格納した記録媒体を含む。
【0046】
以上、本発明の例を説明したが、本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて様々な変更が可能であることは当業者に理解されよう。
【0047】
【発明の効果】
本発明によると、検索者は、入力した検索分類用キーワードに基づいて、文書データを抽出し、分類し、入力したクラスタ解析用キーワードに基づいて、検索分類用キーワードを複数のグループに分類することができる効果がある。
【0048】
従って、本発明によると、キーワードをまず複数のグループに任意に分類し、さらにその文書データグループを単位として、やはり任意に入力したキーワード群の各々についてその出現頻度に応じてクラスタ解析を実行する結果として、個々の文書データでは出現するキーワードが異なる場合であっても、所望のテーマについて記述している文書データを文書データグループとして特定することが容易に行えるようになる。
【図面の簡単な説明】
【図1】本発明によるキーワード解析システムの構成例を示す図である。
【図2】第1のキーワードテーブルの構造を示す図である。
【図3】第2のキーワードテーブルの構造を示す図である。
【図4】頻度テーブルの構造を示す図である。
【図5】クラスタ解析前の頻度テーブルの内容を表示する画面を示す図である。
【図6】クラスタ解析後の頻度テーブルの内容を表示する画面を示す図である。
【図7】テキストデータファイル名一覧テーブルを示す図である。
【図8】テキストデータファイル名一覧表示画面を示す図である。
【図9】本発明によるキーワード解析システムの処理の流れを示す流れ図である。
【符号の説明】
101…ディスプレイ装置、 102…演算装置、 103…マウス装置、 104…キーボード、 105…ファイルシステム、 106…テキストデータファイル、 111,112…キーワードテーブル

Claims (5)

  1. データ及び命令を入力する入力装置と検索及び解析処理を行なう演算装置とテキストデータの文書を格納する記憶装置とによって任意のキーワードを解析するためのキーワード解析方法において、
    上記入力装置を介して、複数の第1のキーワードを取り入れる第1のキーワード入力ステップと、
    上記入力装置を介して、複数の第2のキーワードを取り入れる第2のキーワード入力ステップと、
    上記演算装置によって、上記第1のキーワードを含む文書を上記記憶装置から検索する検索ステップと、
    上記演算装置によって、上記第1のキーワードを含む文書のうち上記第2のキーワードを含む文書を検索し、上記第1のキーワードと上記第2のキーワードの両者を含む文書の頻度を算出するキーワード頻度算出ステップと、
    上記演算装置によって、上記キーワード頻度算出ステップの算出結果に基づいて、上記第1のキーワードに対する上記第2のキーワードの頻度分布を示すキーワード頻度算出結果テーブルを生成するキーワード頻度算出結果テーブル生成ステップと、
    上記演算装置によって、クラスタ解析により、上記キーワード頻度算出結果テーブルにおける上記第1のキーワードのうち、上記第2のキーワードの頻度分布が類似しているものをグループ化するクラスタ解析ステップと、
    を含むキーワード解析方法。
  2. 請求項1記載のキーワード解析方法において、
    上記キーワード頻度算出結果テーブルは、上記第1のキーワードを示す複数の行と、上記第2のキーワードを示す複数の列と、を有し、上記行と上記列の交点のセルに、上記第1のキーワードと上記第2のキーワードの両者を含む文書の頻度が格納されていることを特徴とするキーワード解析方法。
  3. 請求項2記載のキーワード解析方法において、
    上記入力装置を介して、上記キーワード頻度算出結果テーブルのセルを指定する命令を取り入れたとき、上記演算装置は、該セルに対応した上記第1のキーワードと第2のキーワードの両者を含む文書の名称を表示装置に表示することを特徴とするキーワード解析方法。
  4. 請求項1記載のキーワード解析方法において、
    上記キーワード頻度算出結果テーブルには、上記第1のキーワードの各々に対して各第1のキーワードを含む文書の識別子が格納されていることを特徴とするキーワード解析方法。
  5. 請求項1からのいずれか1項記載のキーワード解析方法をコンピュータに実行させるためのプログラム。
JP2003095893A 2003-03-31 2003-03-31 キーワード解析方法及びそれに使用するプログラム Expired - Fee Related JP4189251B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003095893A JP4189251B2 (ja) 2003-03-31 2003-03-31 キーワード解析方法及びそれに使用するプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003095893A JP4189251B2 (ja) 2003-03-31 2003-03-31 キーワード解析方法及びそれに使用するプログラム

Publications (2)

Publication Number Publication Date
JP2004302950A JP2004302950A (ja) 2004-10-28
JP4189251B2 true JP4189251B2 (ja) 2008-12-03

Family

ID=33408111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003095893A Expired - Fee Related JP4189251B2 (ja) 2003-03-31 2003-03-31 キーワード解析方法及びそれに使用するプログラム

Country Status (1)

Country Link
JP (1) JP4189251B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009252185A (ja) * 2008-04-10 2009-10-29 Ricoh Co Ltd 情報検索装置、情報検索方法、制御プログラム及び記録媒体
JP6938569B2 (ja) * 2019-07-01 2021-09-22 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP2004302950A (ja) 2004-10-28

Similar Documents

Publication Publication Date Title
US6654742B1 (en) Method and system for document collection final search result by arithmetical operations between search results sorted by multiple ranking metrics
JP4116329B2 (ja) 文書情報表示システム、文書情報表示方法及び文書検索方法
US10754887B1 (en) Systems and methods for multimedia image clustering
US7778988B2 (en) Information processing device, method, and program for determining relativity between contents
JP2004287725A (ja) 検索処理方法及びプログラム
JP5594145B2 (ja) 検索装置、検索方法、及びプログラム
JP2010009577A (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
JPH08190564A (ja) 情報検索方法及びシステム
JP2009294939A (ja) 文書分類装置
CN111143400A (zh) 一种全栈式检索方法、系统、引擎及电子设备
JPH09231238A (ja) テキスト検索結果表示方法及び装置
JP2006127523A (ja) 文書情報表示システム
JP4189251B2 (ja) キーワード解析方法及びそれに使用するプログラム
JP3693514B2 (ja) 文書検索・分類方法および装置
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP4640861B2 (ja) 検索処理方法及びプログラム
JPH11213000A (ja) インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2005122509A (ja) 階層構造データ分析方法、分析装置および分析プログラム
JPH1185794A (ja) 検索語入力装置および検索語入力プログラムを記録した記録媒体
JP2002324077A (ja) 文書検索装置および文書検索方法
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
EP3109777B1 (en) Object classification device and program
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080912

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140919

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees