JP4305836B2 - Content search display device and content search display method - Google Patents

Content search display device and content search display method Download PDF

Info

Publication number
JP4305836B2
JP4305836B2 JP2003305970A JP2003305970A JP4305836B2 JP 4305836 B2 JP4305836 B2 JP 4305836B2 JP 2003305970 A JP2003305970 A JP 2003305970A JP 2003305970 A JP2003305970 A JP 2003305970A JP 4305836 B2 JP4305836 B2 JP 4305836B2
Authority
JP
Japan
Prior art keywords
content
search
similarity
dendrogram
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003305970A
Other languages
Japanese (ja)
Other versions
JP2005078245A (en
Inventor
憲次 片見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2003305970A priority Critical patent/JP4305836B2/en
Publication of JP2005078245A publication Critical patent/JP2005078245A/en
Application granted granted Critical
Publication of JP4305836B2 publication Critical patent/JP4305836B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は、データベースに格納されている情報コンテンツを検索する装置に関し、特に検索結果を類似の程度別に分類して色彩を関係付けて表示することができるコンテンツ検索装置に関する。   The present invention relates to an apparatus for searching for information contents stored in a database, and more particularly to a content search apparatus capable of classifying search results according to similar degrees and displaying them in relation to colors.

情報検索サーバに格納された情報コンテンツについて検索を行う場合、主に利用者は検索のキーワード又は自然言語文等を検索条件として入力することを行うが、この場合、前記検索条件の設定は利用者に委ねられているため、キーワードが不十分であったり適切でない場合が多い。このような場合、検索要求にヒットし抽出された複数のコンテンツは十分に絞込みがされていないか、利用者が必要とするコンテンツを十分に抽出していない可能性があった。   When searching for information content stored in an information search server, a user mainly inputs a search keyword or a natural language sentence as a search condition. In this case, the search condition is set by the user. In many cases, keywords are insufficient or inappropriate. In such a case, there is a possibility that a plurality of contents extracted by hitting the search request are not sufficiently narrowed down or contents required by the user are not sufficiently extracted.

本発明は、データベースに格納されている情報コンテンツを検索する装置に関し、特に検索結果を類似の程度別に分類して色彩を関係付けて表示することができるコンテンツ検索装置およびコンテンツ検索方法に関する。 The present invention relates to an apparatus for searching for information content stored in a database, and more particularly to a content search apparatus and a content search method capable of classifying search results according to similar degrees and displaying them in relation to colors.

また、利用者が検索要求に基づいて抽出した未知のコンテンツについて、どのコンテンツとどの程度類似しているかを容易に視覚的に知る手段がなく、これについては別途調査する他なく検索漏れの要因ともなっていた。   In addition, there is no easy means of visually knowing to what extent the unknown content extracted by the user based on the search request is similar to which content. It was.

これに対し文書検索装置においては、例えば特許文献1(特開平07−129602号公報)のようにキーワード又は自然言語文等を入力せず識別子を付加することで検索漏れを軽減させることも行われている。
特開平07−129602号公報
On the other hand, in a document search apparatus, for example, as in Patent Document 1 (Japanese Patent Laid-Open No. 07-129602), an omission of search is reduced by adding an identifier without inputting a keyword or a natural language sentence. ing.
Japanese Patent Laid-Open No. 07-129602

ところで、利用者の検索によりヒットした複数のコンテンツは類似の程度に応じてクラスタ分類されていないため、必要なコンテンツと不要なコンテンツが入り混じり、必要なコンテンツのみを抽出することが困難であった。また、検索時にヒットしなかったコンテンツの中からさらに利用者の要求に合ったコンテンツを発見することは、利用者の検索技術に大きく左右されることとなっていた。   By the way, since a plurality of contents hit by a user's search are not classified into clusters according to the degree of similarity, it is difficult to extract only necessary contents because necessary contents and unnecessary contents are mixed. . In addition, finding content that matches the user's request from the content that has not been hit at the time of the search is greatly influenced by the user's search technology.

また、前記特許文献1のようにキーワード又は自然言語文等を入力せず識別子を付加することで検索漏れを軽減させる手法においても、検索結果について文書間の類似の程度を容易に知らしめる十分な効果を得ることができなかった。   Moreover, even in the technique of reducing search omission by adding an identifier without inputting a keyword or a natural language sentence or the like as in Patent Document 1, it is sufficient to easily know the degree of similarity between documents with respect to a search result. The effect could not be obtained.

そこで本発明は、検索ヒットしたコンテンツについてこれらの類似程度に応じたクラスタ分類を行い、類似度に応じたコンテンツ間距離に従ってコンテンツを並べたデンドログラムを表示することが可能なコンテンツ検索装置およびコンテンツ検索方法を提供することを目的とする。 Therefore, the present invention provides a content search apparatus and content search capable of displaying a dendrogram in which contents are arranged according to the distance between the contents according to the similarity by performing cluster classification according to the degree of similarity of the contents hit by the search It aims to provide a method .

本発明は、前記目的を達成するために以下の(1)、(2)、(3)及び(4)の手段より構成したものである。   In order to achieve the above object, the present invention comprises the following means (1), (2), (3) and (4).

(1).コンテンツを記述し定義したメタデータが付加された少なくとも1つ以上のコンテンツが格納されているデータベースを有する情報検索サーバから前記コンテンツを抽出するための検索条件データを入力する検索条件データ入力手段と、前記検索条件データに基づき前記情報検索サーバから検索要求にヒットした検索コンテンツを抽出する処理を実行するコンテンツ検索処理手段と、前記検索コンテンツを表示させる検索コンテンツ表示手段と、前記データベースに格納されている全てのコンテンツ、又は前記コンテンツ検索処理手段によって抽出された前記検索コンテンツに付加されたメタデータを読み込み記録するメタデータ記録手段と、前記メタデータに基づいて、コンテンツ間の類似の程度を重み付けパラメータに変換する重み付け変換手段と、前記重み付けパラメータに基づいて全てのコンテンツ間の組み合わせについてコンテンツ間の距離を求め、その中で最も距離が近いコンテンツをクラスタリングしクラスタとし、そのクラスタの重み付けパラメータに基づいて全てのクラスタ間の組み合わせについてクラスタ間の距離を求め、その中で最も距離が近いクラスタをクラスタリングして類似度の高いコンテンツおよびクラスタをツリーにより結ぶクラスタリング処理手段と、前記クラスタ分類された前記重み付けパラメータに基づいて、前記検索コンテンツおよびクラスタを2次元平面上の一方の軸にとり、他方の軸をコンテンツ間およびクラスタ間距離にとり、前記一方の軸上において距離が近く類似度が高いコンテンツから類似度が低いコンテンツを前記ツリーにより結ぶデンドログラムを作成するデンドログラム作成手段と、前記デンドログラムをディスプレイに表示する表示制御手段と、を有するコンテンツ検索装置。 (1) Search condition data for inputting search condition data for extracting the content from an information search server having a database storing at least one content to which metadata defining and defining the content is added An input unit, a content search processing unit that executes a process of extracting search content that has hit a search request from the information search server based on the search condition data, a search content display unit that displays the search content, and the database and all content or metadata recording means for write-recorded read additional metadata to the search contents extracted by the content search processing means is stored, on the basis of the metadata, similar between content Weight to convert the degree of to a weighting parameter The distance between the contents is calculated for all combinations between the content conversion means and the weighting parameter, and the closest content among them is clustered into a cluster, and all clusters are determined based on the weighting parameter of the cluster. Based on the clustering processing means that obtains the distance between the clusters for the combination of them, clusters the clusters with the shortest distance among them, and connects the contents and clusters having high similarity by a tree, and the weighted parameters classified into the clusters The search content and the cluster are taken as one axis on the two-dimensional plane, the other axis is taken as the distance between the contents and the intercluster distance, and the content with a low similarity is selected from the content having a close distance and a high similarity on the one axis. The above Content search device including a dendrogram creating means for creating a dendrogram connecting by chromatography, and a display control means for displaying the dendrogram in the display.

(2).(1)に記載されたコンテンツ検索装置であって、前記メタデータ記録手段によって前記蓄積部に記録された前記メタデータを基に、少なくとも1種類以上のカテゴリについてコンテンツ間の類似の程度を重み付けパラメータで表現する重み付け変換手段と、前記カテゴリごとの前記重み付けパラメータについて、各コンテンツ間の類似の距離を測定してクラスタ分類を行うクラスタリング処理手段と、前記カテゴリごとにクラスタ分類された前記重み付けパラメータに基づいて前記検索コンテンツをデンドログラムとして表現させる手段と、前記カテゴリごとに前記検索コンテンツについて類似範囲又は非類似範囲について色分け処理を施す手段、又は類似の程度に応じて段階的な色調をもって色分け表現する色分け処理手段と、前記デンドログラムを階層的に表示してその中から選択された1つのデンドログラム層を前面に切り替えて表示させる切替表示手段とを、さらに具備することを特徴としたコンテンツ検索装置。 (2) The content search device according to (1), wherein, based on the metadata recorded in the storage unit by the metadata recording unit, at least one kind of category is similar between contents Weighting conversion means for expressing the degree by a weighting parameter, clustering processing means for performing cluster classification by measuring a similar distance between contents for the weighting parameter for each category, and the cluster classification for each category A means for expressing the search content as a dendrogram based on a weighting parameter; a means for performing color-coding processing on a similar range or a non-similar range for the search content for each category; or a stepwise color tone according to the degree of similarity Color-coding processing means for color-coding, and A content search apparatus further comprising switching display means for hierarchically displaying dendrograms and switching one dendrogram layer selected from the dendrograms to the front for display.

(3).コンテンツを記述し定義したメタデータが付加された少なくとも1つ以上のコンテンツが格納されているデータベースを有する情報検索サーバから前記コンテンツを抽出するための検索条件データを入力するステップと、前記検索条件データに基づき前記情報検索サーバから検索要求にヒットした検索コンテンツを抽出する処理を実行するステップと、前記検索コンテンツを表示させるステップと、
前記データベースに格納されている全てのコンテンツ、又は前記検索コンテンツに付加されたメタデータを読み込み記録するステップと、前記メタデータに基づいて、コンテンツ間の類似の程度を重み付けパラメータに変換するステップと前記重み付けパラメータに基づいて全てのコンテンツ間の組み合わせについてコンテンツ間の距離を求め、その中で最も距離が近いコンテンツをクラスタリングしクラスタとし、そのクラスタの重み付けパラメータに基づいて全てのクラスタ間の組み合わせについてクラスタ間の距離を求め、その中で最も距離が近いクラスタをクラスタリングして類似度の高いコンテンツおよびクラスタをツリーにより結ぶステップと、前記クラスタ分類された前記重み付けパラメータに基づいて、前記検索コンテンツおよびクラスタを2次元平面上の一方の軸にとり、他方の軸をコンテンツ間およびクラスタ間距離にとり、前記一方の軸上において距離が近く類似度が高いコンテンツから類似度が低いコンテンツを前記ツリーにより結ぶデンドログラムを作成するステップと、を有するコンテンツ検索方法。
(3) inputting search condition data for extracting the content from an information search server having a database storing at least one content to which metadata describing and defining the content is added; Executing a process of extracting search content that hits a search request from the information search server based on the search condition data; and displaying the search content;
Reading and recording all the content stored in the database or metadata added to the search content, converting the similarity between the contents into weighting parameters based on the metadata , Based on the weighting parameter, the distance between the contents is obtained for all the combinations between the contents, and the content with the closest distance among them is clustered into a cluster, and the cluster for all combinations between the clusters is determined based on the weighting parameter of the cluster. A distance between them, clustering the clusters with the shortest distance among them and connecting the content and clusters having a high similarity with a tree, and the search content based on the weighted parameters classified into the clusters And the cluster as one axis on the two-dimensional plane, the other axis as the distance between the contents and the distance between the clusters, and the content having a low similarity from the content having a short distance and a high similarity are connected by the tree. Creating a dendrogram; and a content search method.

(4).(3)のコンテンツ検索方法であって、前記メタデータ記録手段によって前記蓄積部に記録された前記メタデータを基に、少なくとも1種類以上のカテゴリについてコンテンツ間の類似の程度を重み付けパラメータで表現するステップと、前記カテゴリごとの前記重み付けパラメータについて、各コンテンツ間の類似の距離を測定してクラスタ分類を行うステップと、前記カテゴリごとにクラスタ分類された前記重み付けパラメータに基づいて前記検索コンテンツをデンドログラムとして表現させる手段と、前記カテゴリごとに前記検索コンテンツについて類似範囲又は非類似範囲について色分け処理を施すか、又は類似の程度に応じて段階的な色調をもって色分け表現するステップと、前記デンドログラムを階層的に表示してその中から選択された1つのデンドログラム層を前面に切り替えて表示させるステップとを、さらに具備することを特徴としたコンテンツ検索方法。

(4) The content search method according to (3), wherein the similarity between the contents is weighted for at least one category based on the metadata recorded in the storage unit by the metadata recording means. A step of expressing with parameters, a step of performing cluster classification by measuring a similar distance between contents for the weighting parameters for each category, and the search based on the weighting parameters clustered for each category Means for expressing content as a dendrogram, performing color-coding processing on a similar range or a non-similar range for the search content for each category, or color-coding with a stepwise color tone according to the degree of similarity, Display dendrograms hierarchically Content retrieval method characterized by the step of displaying is switched to the front one dendrogram layer selectively, further comprising the.

以上説明したように、請求項1記載の発明によれば、検索条件データに基づいた検索結果が、全コンテンツ間又は抽出した特定領域のコンテンツ間での類似の程度に応じたクラスタに分類されるため、検索条件データから直接結びつかないコンテンツについても抽出することができ、検索漏れを少なくする効果がある。   As described above, according to the first aspect of the present invention, the search results based on the search condition data are classified into clusters according to the degree of similarity between all contents or between contents in the extracted specific area. Therefore, content that is not directly connected to the search condition data can also be extracted, and there is an effect of reducing search omissions.

請求項2記載の発明によれば、検索条件データに基づいた検索結果について、この検索結果の範囲内での類似の程度に応じたクラスタ分類を行うことで、クラスタ分類をより高速且つ簡便に行うことができ、検索速度と効率を向上する効果がある。   According to the second aspect of the present invention, the cluster classification is performed on the search result based on the search condition data according to the degree of similarity within the range of the search result, so that the cluster classification is performed more quickly and easily. It has the effect of improving the search speed and efficiency.

また、請求項1及び2記載の発明によれば、検索結果についてコンテンツ間の類似の程度を色分け表現したデンドログラムとして表示するため、利用者は必要なコンテンツの検索漏れを少なくできると共に、類似程度を視覚的に把握することができるため検索効率が向上するという効果がある。   According to the first and second aspects of the present invention, the search result is displayed as a dendrogram in which the similarity between the contents is expressed in a color-coded manner. Can be visually grasped, so that the search efficiency is improved.

さらに、請求項3及び4記載の発明によれば、検索条件データに基づいた検索結果を多面的にクラスタ分類して階層的なデンドログラムで表示することにより、検索結果の類似関係を多様な条件付けで把握することができるという効果がある。   Furthermore, according to the third and fourth aspects of the present invention, the search results based on the search condition data are classified into clusters in a multifaceted manner and displayed in a hierarchical dendrogram, so that the similarity relationship of the search results can be variously conditioned. There is an effect that can be grasped by.

以下、図面を参照して本発明を実施するための最良の形態につき実施例を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の実施例1に係るコンテンツ検索装置の概略構成を示す図である。
101はキーボードの他マウス、タブレット等のポインティングデバイスを含む入力装置、102aは後述するデータベース検索ソフトウェアCを処理するCPU機能を有し、外部との通信を制御するための制御部、102bは制御部102aで処理される各種データ及びソフトウェアの一時記憶領域であるメモリ部、102cは前記データベース検索ソフトウェアCや抽出されたコンテンツ等を格納するハードディスクドライブ等の電子的・磁気的記録装置を指す蓄積部、102は102a、102b、102cを含めてPC(PCはパーソナル・コンピュータ等情報処理装置を指す)、103はコンテンツの検索結果を表示するディスプレイ等の表示装置、104は公衆回線網としてのインターネットのみならず構内LANとしてのイントラネットも含む回線網、105aは情報データを格納したデータベース、105はデータベース105aを有した情報検索サーバである。
FIG. 1 is a diagram illustrating a schematic configuration of a content search apparatus according to Embodiment 1 of the present invention.
101 is an input device including a pointing device such as a mouse and tablet in addition to a keyboard, 102a has a CPU function for processing database search software C, which will be described later, and a control unit for controlling communication with the outside, 102b is a control unit 102a is a temporary storage area for various data and software processed in 102a, 102c is an accumulator that indicates an electronic / magnetic recording device such as a hard disk drive for storing the database search software C and extracted contents, 102 is a PC including 102a, 102b, and 102c (PC indicates an information processing device such as a personal computer), 103 is a display device such as a display for displaying a search result of content, and 104 is only the Internet as a public line network In as a local LAN Network also includes Lanett, 105a is a database which stores information data, 105 is an information search server having a database 105a.

さらに、データベース105aに格納される情報データは次のA,Bから構成される。Aは文書データ、文字列データ、音楽データ、画像データ等デジタルデータとして扱うことが可能なコンテンツ、BはこのコンテンツAと他のコンテンツを識別するための識別子とコンテンツAに特有のパラメータで構成されるメタデータである。前記特有のパラメータとは、例えばコンテンツAが音楽データである場合、楽曲名、国名、作者名、音楽を信号として表現した場合の信号波形、リズム・テンポを現すデータ、楽曲の構成楽器の種類を表現するデータ等、当該音楽データの属性を現すデータ群のことである。   Further, the information data stored in the database 105a is composed of the following A and B. A is content that can be handled as digital data such as document data, character string data, music data, image data, etc. B is composed of an identifier for identifying the content A and other content and parameters specific to the content A. Metadata. For example, when the content A is music data, the specific parameters include a song name, a country name, an author name, a signal waveform when music is expressed as a signal, data representing rhythm and tempo, and the type of musical instrument constituting the song. A data group representing attributes of the music data, such as data to be expressed.

また、コンテンツAが映像データである場合の特有のパラメータとしては、映像の表題、特徴的又は代表的な映像の一画面等とすることができる。また、データベース検索ソフトウェアCは、制御部102aにおいてデータベース検索処理、重み付け変更処理、クラスタリング処理、デンドログラム作成処理、色分け処理、閾値変更処理を実行する機能を有するものである。以上により本発明の実施例1は構成される。   In addition, as the unique parameter when the content A is video data, the title of the video, a screen of a characteristic or representative video, or the like can be used. The database search software C has a function of executing database search processing, weight change processing, clustering processing, dendrogram creation processing, color classification processing, and threshold change processing in the control unit 102a. The first embodiment of the present invention is configured as described above.

次に、上述した構成による実施例1について、図2に示すフローチャートと共に説明する。まず、利用者は入力装置101から検索のキーワードと論理式等からなる検索条件データを入力し(ステップS201)、この検索条件データに基づいて制御部102aではデータベース検索ソフトウェアCのデータベース検索処理が実行され、情報検索サーバ105のデータベース105aから前記検索条件データに適合した少なくとも1つ以上のコンテンツが抽出される(ステップS202)。   Next, the first embodiment having the above-described configuration will be described with reference to the flowchart shown in FIG. First, the user inputs search condition data including a search keyword and a logical expression from the input device 101 (step S201), and the database search process of the database search software C is executed in the control unit 102a based on the search condition data. Then, at least one content that matches the search condition data is extracted from the database 105a of the information search server 105 (step S202).

ここで、音楽データのデータベースについて前記検索条件データを設定する場合を例にとって説明する。前記検索条件データは、例えば検索するコンテンツに関係するキーワードとして「楽曲名」、「作曲者名」、「国名」等を指定し、それらを関連付ける論理式として例えば論理積「×」、論理和「+」等で条件付けするものをいう。前記論理積「×」は「且つ」、前記論理和「+」は「又は」という関係付けを意味するものである。   Here, a case where the search condition data is set for a music data database will be described as an example. In the search condition data, for example, “song name”, “composer name”, “country name”, etc. are specified as keywords related to the content to be searched, and logical expressions “×”, logical sum “ It means what is conditioned by “+” or the like. The logical product “x” means “and”, and the logical sum “+” means “or”.

ステップS201では以上のような検索条件データを設定し、ステップS202ではこの条件に合致したコンテンツのみを抽出する。ステップS201とステップS202の動作は検索データがヒットするまで繰り返し実行され(ステップS203)、これによる検索結果を以下、一次検索結果と称す。この一次検索結果には、利用者の設定した前記検索条件データが直接的に関係あるコンテンツが少なくとも1つ以上抽出されており、これら一群のコンテンツは真に必要なコンテンツと不要なコンテンツが入り混じり、明確な区分けがされていない状態である。   In step S201, the search condition data as described above is set, and in step S202, only content that satisfies this condition is extracted. The operations in step S201 and step S202 are repeatedly executed until the search data is hit (step S203), and the search result based on this is hereinafter referred to as a primary search result. In the primary search result, at least one content that is directly related to the search condition data set by the user is extracted, and these groups of content are a mixture of truly necessary content and unnecessary content. The state is not clearly divided.

なお、PC102と情報検索サーバ105は回線網104を介して接続されても良いし、シリアル、パラレル等の通信ケーブルで直接接続されても良い。   Note that the PC 102 and the information search server 105 may be connected via the network 104, or may be directly connected via a serial or parallel communication cable.

一方、データベース検索ソフトウェアCは、情報検索サーバ105のデータベース105aから全てのコンテンツのメタデータを読み込み(ステップS204)、PC102の蓄積部102cに蓄積する(ステップS205)。これにおいて、読み込むメタデータの領域はデータベース105a中一部分のコンテンツ(例えば、前記検索条件データに関連付けられたコンテンツ)のメタデータであっても良い。   On the other hand, the database search software C reads all content metadata from the database 105a of the information search server 105 (step S204) and stores it in the storage unit 102c of the PC 102 (step S205). In this case, the metadata area to be read may be metadata of a part of content in the database 105a (for example, content associated with the search condition data).

次に、蓄積部102cに蓄積された前記メタデータは、データベース検索ソフトウェアCの重み付け変更処理によって重み付けパラメータに変換される(ステップS206)。この重み付けパラメータへの変換とは、前記メタデータについて互いのデータの関係を類似の度合いに応じて重み付けしたパラメータに変換し表現することである。   Next, the metadata stored in the storage unit 102c is converted into a weighting parameter by the weighting change process of the database search software C (step S206). The conversion to the weighting parameter is to express the metadata by converting the relationship between the data into parameters weighted according to the degree of similarity.

図3に、音楽データに関する前記メタデータの簡単な例と、この例から前記重み付けパラメータに変換する例を示し、前記重み付けパラメータへの変換について説明する。まず、301は蓄積部102cに蓄積された前記メタデータを表で現したメタデータ・テーブルである。このメタデータ・テーブル301において各行(レコード)は関連付けられた各コンテンツのメタデータに対応し、各レコードにはコンテンツとこれに付加されるメタデータを対応付ける識別子が含まれる。メタデータの要素は、音楽データとして特徴のある項目(アイテム)で構成される。例えば、曲名、ジャンル、作曲者、国名、音楽を波形で表現したデータを多様な類型に記号等で分類したもの、リズム・テンポ等をメタデータとすることができる。なお、音楽信号をサンプリングした波形データそのものをメタデータとしても良い。   FIG. 3 shows a simple example of the metadata related to music data and an example of conversion from this example to the weighting parameter, and the conversion to the weighting parameter will be described. First, reference numeral 301 denotes a metadata table that represents the metadata stored in the storage unit 102c as a table. In the metadata table 301, each row (record) corresponds to metadata of each associated content, and each record includes an identifier that associates the content with metadata added to the content. The metadata element is composed of items (items) characteristic of music data. For example, the music title, genre, composer, country name, data representing music in a waveform, classified into various types by symbols, rhythm / tempo, etc. can be used as metadata. Note that waveform data itself obtained by sampling a music signal may be used as metadata.

次に、メタデータ・テーブル301から前記重み付けパラメータを生成する方法について説明する。まず、一例として重み付け変換を行うための変換テーブルを使用する方法について説明する。図3の変換テーブル(ジャンル)302は、メタデータ・テーブル301のアイテム「ジャンル」についてメタデータを前記重み付けパラメータに変換するための変換表を現した例である。これによれば、メタデータ・テーブル301のアイテム「ジャンル」における「オペラ」は、変換テーブル(ジャンル)302により「112 27 01」というパラメータに変換される。以上のような変換テーブルは、ステップS204でデータベース105aからメタデータを読み込む際に一緒に読み込まれるものである。   Next, a method for generating the weighting parameters from the metadata table 301 will be described. First, a method of using a conversion table for performing weight conversion will be described as an example. A conversion table (genre) 302 in FIG. 3 is an example showing a conversion table for converting metadata into the weighting parameters for the item “genre” in the metadata table 301. According to this, “opera” in the item “genre” in the metadata table 301 is converted into a parameter “112 2701” by the conversion table (genre) 302. The conversion table as described above is read together when the metadata is read from the database 105a in step S204.

また、別の方法としては、前記波形データそのものをメタデータとした場合、波形データ同士を相対比較してその差分値を重み付けした数値で表現することで前記重み付けパラメータに変換することができる。   As another method, when the waveform data itself is metadata, the waveform data can be converted into the weighting parameter by relatively comparing the waveform data and expressing the difference value as a weighted numerical value.

以上のように、アイテムごとに各メタデータ間の類似の度合いに応じて数値を付与することにより、各アイテムに関する類似の程度を重み付けパラメータとして表現することができる。   As described above, by assigning numerical values according to the degree of similarity between the metadata for each item, the degree of similarity for each item can be expressed as a weighting parameter.

さらに、1つのコンテンツに関するメタデータ全体としての重み付けパラメータは、各アイテムの前記重み付けパラメータについて前記検索条件データの演算を行い数値化を行うことで求める。   Further, the weighting parameter as the whole metadata regarding one content is obtained by calculating the search condition data for the weighting parameter of each item and digitizing it.

次に、前記重み付けパラメータを基にデータベース検索ソフトウェアCはクラスタリング処理を行い(ステップS207)、その結果についてデンドログラム作成処理を行う(ステップS208)。これにおいて、前記クラスタリング処理は各コンテンツ間の距離を測定し、その距離を手掛かりにしてクラスタを作成していく階層的クラスタ分析の方法をとる。   Next, the database search software C performs clustering processing based on the weighting parameters (step S207), and performs dendrogram creation processing on the result (step S208). In this case, the clustering process employs a hierarchical cluster analysis method in which a distance between contents is measured and a cluster is created using the distance as a clue.

図4に前記クラスタリング処理のフローチャートを示して説明する。まず、クラスタリングすべきコンテンツの個数をN個とし、前記重み付けパラメータを基に全N個のコンテンツ間の距離を測定する(ステップS401)。この距離の測定は、例えば最短距離法、最長距離法、群平均法、重心法、メジアン法、ウォード法等の周知な方法を用いれば良く、特にユークリッド平方距離によるウォード法によるものが分類感度の高いクラスタ分析を行うものとして一般的に用いられている。これらにより、距離の近いものは類似度が高く、距離が遠くなるにつれ類似度が低くなるよう定義される。   FIG. 4 is a flowchart illustrating the clustering process. First, the number of contents to be clustered is N, and the distance between all N contents is measured based on the weighting parameter (step S401). For this distance measurement, for example, a known method such as the shortest distance method, the longest distance method, the group average method, the center of gravity method, the median method, or the Ward method may be used. It is generally used to perform high cluster analysis. By these, it is defined that a thing with a short distance has a high degree of similarity, and a degree of similarity becomes low as the distance increases.

前記いずれかの手法により全ての組み合わせについてコンテンツ間の距離を求めた後、その中で最も距離が近い2つのコンテンツをクラスタリングし1組のクラスタとする(ステップS402)。次に、ここでできたクラスタについてのパラメータを設定する(ステップS403)。これらステップS402とステップS403の作業をN−1回繰り返す(ステップS404)。このようにして類似分類を順次行ってクラスタリング処理を完成させる。   After obtaining the distance between the contents for all the combinations by any one of the above methods, the two contents having the closest distance among them are clustered to form a set of clusters (step S402). Next, parameters for the cluster created here are set (step S403). These steps S402 and S403 are repeated N-1 times (step S404). In this way, the similar classification is sequentially performed to complete the clustering process.

次に、このクラスタリング処理された結果に前記一次検索結果を当てはめる(ステップS209)と検索ヒットしたコンテンツを類似分類することができ、コンテンツ同士の類似範囲をその程度と共に把握することが可能となる。その方法は、例えばコンテンツを縦軸にとりコンテンツ間距離を横軸にとり図5に示すようなデンドログラムとして表現するものである。図5において501はコンテンツ、502はコンテンツ間距離を示す横軸であり右に行くほど距離が近く類似度が高いことを示す。503は類似度の高いコンテンツ同士を結ぶツリー構造、504は後述するクラスタの閾値を示す軸、505はクラスタ分類されたものの内、クラスタ4を示したものである。   Next, when the result of the clustering process is applied to the primary search result (step S209), the content hit by the search can be classified similarly, and the similarity range between the contents can be grasped together with the degree. For example, the content is expressed as a dendrogram as shown in FIG. 5 with the content on the vertical axis and the distance between the content on the horizontal axis. In FIG. 5, reference numeral 501 denotes a content, and reference numeral 502 denotes a horizontal axis indicating a distance between the contents, and the closer to the right, the closer the distance and the higher the similarity. Reference numeral 503 denotes a tree structure connecting contents having high similarity, 504 denotes an axis indicating a threshold value of a cluster to be described later, and 505 denotes a cluster 4 among those classified into clusters.

以上のように、前記一次検索結果を前記デンドログラムとして表現した後、データベース検索ソフトウェアCによる色分け処理を実行する(ステップS210)。この色分け処理は、前記一次検索結果について類似範囲又は非類似範囲等について色分けをして表示することで視覚的に分かりやすく利用者に提示するものである。またこの場合、類似の程度に応じて段階的な色調をもって表現することもできる。   As described above, after the primary search result is expressed as the dendrogram, color classification processing by the database search software C is executed (step S210). In this color classification process, the primary search result is displayed in a color-coded manner with respect to a similar range or a dissimilar range, and is presented to the user in an easily understandable manner. In this case, it is also possible to express with a stepwise color tone according to the degree of similarity.

そして最後に、前記色分け処理された検索結果が、類似の程度に応じて色彩をもったデンドログラムとして表示装置203に表示される(ステップS211)。図5におけるデンドログラムの表示例は、4つのクラスタ毎に色分けをして表示したものである。   Finally, the color-coded search results are displayed on the display device 203 as a dendrogram having colors according to the degree of similarity (step S211). The display example of the dendrogram in FIG. 5 is displayed by color-coding every four clusters.

また、前記検索結果の表示(ステップS211)に際し、表示するコンテンツの数が多すぎるとデンドログラムのツリー構造が複雑になるため見にくくなり、また検索結果の類似傾向が薄れてしまうことが懸念される。このため、検索結果のクラスタの数に応じて表示する数を調整することとし、その制限する基準を図5の閾値504で決定するよう利用者が入力装置101から設定できるようになっている(ステップS212)。なお、この閾値の設定は入力装置101によるだけでなく、前記一次検索結果のクラスタ数に応じてデータベース検索ソフトウェアCによって自動的に調整することもできる。   In addition, when displaying the search result (step S211), if the number of contents to be displayed is too large, the dendrogram tree structure becomes complicated and difficult to see, and the similarity tendency of the search result may be diminished. . For this reason, the number to be displayed is adjusted according to the number of clusters in the search result, and the user can set from the input device 101 so as to determine the restriction criterion by the threshold value 504 in FIG. Step S212). The threshold value can be automatically adjusted not only by the input device 101 but also automatically by the database search software C according to the number of clusters in the primary search result.

以上の実施例1のコンテンツ検索装置によれば、利用者が入力した前記検索条件データによる前記一次検索結果を類似の程度別に分類して表示することはもとより、前記一次検索結果に入らなかったコンテンツについても類似の程度に応じてデータベース105aから抽出する候補とすることができる。   According to the content search device of the first embodiment described above, the primary search results based on the search condition data input by the user are classified and displayed according to similar degrees, and the content does not enter the primary search results Can be extracted from the database 105a according to the degree of similarity.

実施例2について図6のフローチャートを用いて説明する。
本実施例では、利用者が前記検索条件データを入力装置101から入力して情報検索サーバ105のデータベース105aから前記一次検索結果を抽出する処理(ステップS601からステップS603)と、予めデータベース105aから蓄積部102cに全てのコンテンツ又は部分的なコンテンツ(例えば、前記検索条件データに関連付けられたコンテンツ)のメタデータを読み込み蓄積部102cに蓄積しておく処理(ステップS604、ステップS605)は前述の実施例1と同じである。
A second embodiment will be described with reference to the flowchart of FIG.
In this embodiment, the user inputs the search condition data from the input device 101 and extracts the primary search result from the database 105a of the information search server 105 (steps S601 to S603), and stores the data from the database 105a in advance. The processing (steps S604 and S605) of reading the metadata of all content or partial content (for example, content associated with the search condition data) in the storage unit 102c and storing it in the storage unit 102c is the above-described embodiment. Same as 1.

本実施例における実施例1との違いは、抽出された前記一次検索結果のコンテンツについてのみ前記重み付けパラメータへの変換処理以降の処理を行うというものである(ステップS606からステップS611)。これは、本実施例における重み付けパラメータへの変換処理からデンドログラム作成処理までが実施例1における処理よりも処理量が格段に軽いため、全体として高速な検索処理を実行することを可能とするものである。   The difference between the present embodiment and the first embodiment is that the processing after the conversion processing to the weighting parameter is performed only for the extracted content of the primary search result (from step S606 to step S611). This is because the processing amount from the weighting parameter conversion process to the dendrogram creation process in the present embodiment is much lighter than the process in the first embodiment, so that a high-speed search process can be executed as a whole. It is.

以上の実施例2のコンテンツ検索装置によれば、利用者が抽出した一次検索結果について前述の実施例1よりも高速に類似の程度別に分類して表示することが可能となる。   According to the content search apparatus of the second embodiment described above, it is possible to classify and display the primary search results extracted by the user according to the degree of similarity at a higher speed than in the first embodiment.

前述の実施例1及び実施例2は、デンドログラムを用いた検索結果の表示を2次元的に表現したものであった。これに対し実施例3のコンテンツ検索装置では、コンテンツ間の距離の測定を少なくとも1種類以上のカテゴリについて行って複数種類のデンドログラムを作成し、これについて奥行きを持たせて表示することを実現するものである。   In the first and second embodiments described above, the display of the search result using the dendrogram is two-dimensionally expressed. On the other hand, the content search apparatus according to the third embodiment realizes that a distance between contents is measured for at least one category to create a plurality of types of dendrograms and display them with depth. Is.

前記カテゴリとは、図3のメタデータ・テーブル301において縦の列の集まりを指すものである。例えば、アイテム「ジャンル」又はアイテム「波形類別」といったアイテム1列が最も単純なカテゴリであり、複数の列を組み合わせてカテゴリを作成しても良い。   The category refers to a collection of vertical columns in the metadata table 301 of FIG. For example, one item column such as item “genre” or item “waveform classification” is the simplest category, and a plurality of columns may be combined to create a category.

これについて図7に3次元的なデンドログラムの表示例を示す。701はカテゴリ1の類似程度を表す第1層のデンドログラム、702はカテゴリ2の類似程度を表す第2層のデンドログラムを示す。図7ではカテゴリ3、カテゴリ4まで階層化していることを示している。表示画面上、第1層のデンドログラムを表示する場合は、第2層以下を奥行きのある位置に配置するのみでツリー構造等の詳細の表示をさせないこととする。これは表示層である第1層を見易くするためである。第2層702を見たい場合は、入力装置101により第2層702を選択して第1層701の位置と入れ替えて表示させる。   FIG. 7 shows a display example of a three-dimensional dendrogram. Reference numeral 701 denotes a first layer dendrogram representing a category 1 similarity, and reference numeral 702 denotes a second layer dendrogram representing a category 2 similarity. FIG. 7 shows that the category 3 and the category 4 are hierarchized. When displaying the first layer dendrogram on the display screen, it is assumed that the second layer and lower layers are only arranged at a position having a depth, and details such as a tree structure are not displayed. This is to make it easy to see the first layer which is the display layer. When the user wants to see the second layer 702, the second layer 702 is selected by the input device 101, and the position of the first layer 701 is changed to be displayed.

以上の実施例3のコンテンツ検索システムによれば、利用者は検索したコンテンツを様々な条件で分類し、これらについて瞬時にデンドログラムを表示させて結果を確認することができる。   According to the content search system of the third embodiment described above, the user can classify the searched content under various conditions, and can instantly display the dendrogram for these to confirm the result.

本発明は、文書データベースのみならずデジタルデータとして扱うことのできる情報データベース全般について、インターネットやイントラネットを介した配信コンテンツの検索システム及び回線網を利用しないクローズドなシステムでの検索システムに利用できるものである。これにおいて、検索した結果のコンテンツ群についてその属性を基にそれらの類似度合いでクラスタリングを行い、その結果を視覚的に分かり易く表示できるため、高能率なデジタルデータ検索システムに利用することが可能である。   INDUSTRIAL APPLICABILITY The present invention is applicable not only to a document database but also to an information database in general that can be handled as digital data, to a search system for distribution contents via the Internet or an intranet and a search system in a closed system that does not use a circuit network. is there. In this, since the content group of the search result is clustered according to the degree of similarity based on the attribute, and the result can be displayed visually and easily, it can be used for a highly efficient digital data search system. is there.

本発明の実施例1に係る、コンテンツ検索装置の概略を示す構成図である。It is a block diagram which shows the outline of the content search apparatus based on Example 1 of this invention. 本発明の実施例1に係る、動作を示すフローチャートである。It is a flowchart which shows operation | movement based on Example 1 of this invention. 本発明の実施例1に係る、音楽データをコンテンツとした場合のメタデータ・テーブルと重み付けパラメータに変換する変換テーブルを例示した表である。It is the table | surface which illustrated the conversion table which converts into the metadata table and weighting parameter at the time of making music data into content based on Example 1 of this invention. 本発明の実施例1に係る、クラスタリング処理を示すフローチャートである。It is a flowchart which shows the clustering process based on Example 1 of this invention. 本発明の実施例1に係る、検索結果についてデンドログラムを作成した結果の例である。It is an example of the result which produced the dendrogram about the search result based on Example 1 of this invention. 本発明の実施例2に係る、動作を示すフローチャートである。It is a flowchart which shows operation | movement based on Example 2 of this invention. 本発明の実施例3に係る、階層的に表示したデンドログラムを示す図である。It is a figure which shows the dendrogram displayed hierarchically based on Example 3 of this invention.

符号の説明Explanation of symbols

101 入力装置
102 PC
102a 制御部
102b メモリ部
102c 蓄積部
103 表示装置
104 回線網
105 情報検索サーバ
105a データベース
A コンテンツ
B メタデータ
C データベース検索ソフトウェア

101 Input device 102 PC
102a Control unit 102b Memory unit 102c Storage unit 103 Display device 104 Line network 105 Information search server 105a Database A Content B Metadata C Database search software

Claims (4)

コンテンツを記述し定義したメタデータが付加された少なくとも1つ以上のコンテンツが格納されているデータベースを有する情報検索サーバから前記コンテンツを抽出するための検索条件データを入力する検索条件データ入力手段と、
前記検索条件データに基づき前記情報検索サーバから検索要求にヒットした検索コンテンツを抽出する処理を実行するコンテンツ検索処理手段と、
前記検索コンテンツを表示させる検索コンテンツ表示手段と、
前記データベースに格納されている全てのコンテンツ、又は前記コンテンツ検索処理手段によって抽出された前記検索コンテンツに付加されたメタデータを読み込み記録するメタデータ記録手段と、
前記メタデータに基づいて、コンテンツ間の類似の程度を重み付けパラメータに変換する重み付け変換手段と、
前記重み付けパラメータに基づいて全てのコンテンツ間の組み合わせについてコンテンツ間の距離を求め、その中で最も距離が近いコンテンツをクラスタリングしクラスタとし、そのクラスタの重み付けパラメータに基づいて全てのクラスタ間の組み合わせについてクラスタ間の距離を求め、その中で最も距離が近いクラスタをクラスタリングして類似度の高いコンテンツおよびクラスタをツリーにより結ぶクラスタリング処理手段と、
前記クラスタ分類された前記重み付けパラメータに基づいて、前記検索コンテンツおよびクラスタを2次元平面上の一方の軸にとり、他方の軸をコンテンツ間およびクラスタ間距離にとり、前記一方の軸上において距離が近く類似度が高いコンテンツから類似度が低いコンテンツを前記ツリーにより結ぶデンドログラムを作成するデンドログラム作成手段と、
前記デンドログラムをディスプレイに表示する表示制御手段と、
を有するコンテンツ検索装置。
Search condition data input means for inputting search condition data for extracting the content from an information search server having a database storing at least one content to which metadata describing and defining the content is added ;
Content search processing means for executing processing for extracting search content that has been hit by a search request from the information search server based on the search condition data;
Search content display means for displaying the search content ;
And all content or metadata recording means for Write-recorded read additional metadata to the search contents extracted by the content search processing means is stored in said database,
Weighting conversion means for converting the degree of similarity between contents into weighting parameters based on the metadata;
Based on the weighting parameter, the distance between the contents is obtained for all the combinations between the contents, and the content with the closest distance among them is clustered into a cluster, and the cluster for all the combinations between the clusters is based on the weighting parameter of the cluster. A clustering processing means for obtaining a distance between them, clustering the clusters with the closest distance among them, and connecting content and clusters with high similarity by a tree ;
Based on the weighted parameters classified into the clusters, the search content and the cluster are taken as one axis on a two-dimensional plane, the other axis is taken as the distance between the contents and the intercluster, and the distance is close and similar on the one axis. A dendrogram creating means for creating a dendrogram that connects content with low similarity to content with low similarity by the tree;
Display control means for displaying the dendrogram on a display;
A content search apparatus having:
請求項1に記載されたコンテンツ検索装置であって、
前記メタデータ記録手段によって前記蓄積部に記録された前記メタデータを基に、少なくとも1種類以上のカテゴリについてコンテンツ間の類似の程度を重み付けパラメータで表現する重み付け変換手段と、
前記カテゴリごとの前記重み付けパラメータについて、各コンテンツ間の類似の距離を測定してクラスタ分類を行うクラスタリング処理手段と、
前記カテゴリごとにクラスタ分類された前記重み付けパラメータに基づいて前記検索コンテンツをデンドログラムとして表現させる手段と、
前記カテゴリごとに前記検索コンテンツについて類似範囲又は非類似範囲について色分け処理を施す手段、又は類似の程度に応じて段階的な色調をもって色分け表現する色分け処理手段と、
前記デンドログラムを階層的に表示してその中から選択された1つのデンドログラム層を前面に切り替えて表示させる切替表示手段とを、さらに具備することを特徴としたコンテンツ検索装置。
The content search device according to claim 1,
Weighting conversion means for expressing the degree of similarity between contents for at least one category based on the metadata recorded in the storage unit by the metadata recording means by weighting parameters;
For the weighting parameter for each category, clustering processing means for performing cluster classification by measuring a similar distance between each content,
Means for expressing the search content as a dendrogram based on the weighting parameters clustered for each category;
Means for performing color-coding processing on a similar range or a non-similar range for the search content for each category, or color-coding processing means for performing color-coded expression in a stepwise color tone according to the degree of similarity;
A content search apparatus further comprising switching display means for hierarchically displaying the dendrogram and switching one dendrogram layer selected from the dendrogram to the front for display.
コンテンツを記述し定義したメタデータが付加された少なくとも1つ以上のコンテンツが格納されているデータベースを有する情報検索サーバから前記コンテンツを抽出するための検索条件データを入力するステップと、
前記検索条件データに基づき前記情報検索サーバから検索要求にヒットした検索コンテンツを抽出する処理を実行するステップと、
前記検索コンテンツを表示させるステップと、
前記データベースに格納されている全てのコンテンツ、又は前記検索コンテンツに付加されたメタデータを読み込み記録するステップと、
前記メタデータに基づいて、コンテンツ間の類似の程度を重み付けパラメータに変換するステップと
前記重み付けパラメータに基づいて全てのコンテンツ間の組み合わせについてコンテンツ間の距離を求め、その中で最も距離が近いコンテンツをクラスタリングしクラスタとし、そのクラスタの重み付けパラメータに基づいて全てのクラスタ間の組み合わせについてクラスタ間の距離を求め、その中で最も距離が近いクラスタをクラスタリングして類似度の高いコンテンツおよびクラスタをツリーにより結ぶステップと、
前記クラスタ分類された前記重み付けパラメータに基づいて、前記検索コンテンツおよびクラスタを2次元平面上の一方の軸にとり、他方の軸をコンテンツ間およびクラスタ間距離にとり、前記一方の軸上において距離が近く類似度が高いコンテンツから類似度が低いコンテンツを前記ツリーにより結ぶデンドログラムを作成するステップと、
を有するコンテンツ検索方法。
Inputting search condition data for extracting the content from an information search server having a database storing at least one content to which metadata defining and defining the content is added;
Executing a process of extracting search content that hits a search request from the information search server based on the search condition data;
Displaying the search content;
Reading and recording all content stored in the database or metadata attached to the search content;
Converting the degree of similarity between content into a weighting parameter based on the metadata ;
Based on the weighting parameter, the distance between the contents is obtained for all the combinations between the contents, and the content with the closest distance among them is clustered into a cluster, and the cluster for all combinations between the clusters is determined based on the weighting parameter of the cluster. Determining the distance between them, clustering the nearest cluster among them, and connecting content and clusters with high similarity by a tree,
Based on the weighted parameters classified into the clusters, the search content and the cluster are taken as one axis on a two-dimensional plane, the other axis is taken as the distance between the contents and the intercluster, and the distance is close and similar on the one axis. Creating a dendrogram that connects low-similarity content to low-similarity content by the tree;
A content search method comprising:
請求項1に記載されたコンテンツ検索方法であって、The content search method according to claim 1,
前記メタデータ記録手段によって前記蓄積部に記録された前記メタデータを基に、少なくとも1種類以上のカテゴリについてコンテンツ間の類似の程度を重み付けパラメータで表現するステップと、Expressing the degree of similarity between contents for at least one category based on the metadata recorded in the storage unit by the metadata recording means using a weighting parameter;
前記カテゴリごとの前記重み付けパラメータについて、各コンテンツ間の類似の距離を測定してクラスタ分類を行うステップと、For the weighting parameters for each category, performing a cluster classification by measuring a similar distance between each content;
前記カテゴリごとにクラスタ分類された前記重み付けパラメータに基づいて前記検索コンテンツをデンドログラムとして表現させる手段と、Means for expressing the search content as a dendrogram based on the weighting parameters clustered for each category;
前記カテゴリごとに前記検索コンテンツについて類似範囲又は非類似範囲について色分け処理を施すか、又は類似の程度に応じて段階的な色調をもって色分け表現するステップと、Performing a color-coding process on a similar range or a non-similar range for the search content for each category, or expressing the color-coded with a stepwise color tone according to the degree of similarity;
前記デンドログラムを階層的に表示してその中から選択された1つのデンドログラム層を前面に切り替えて表示させるステップとを、Displaying the dendrogram hierarchically and switching one dendrogram layer selected from the hierarchy to the front and displaying the dendrogram,
さらに具備することを特徴としたコンテンツ検索方法。A content search method further comprising:
JP2003305970A 2003-08-29 2003-08-29 Content search display device and content search display method Expired - Lifetime JP4305836B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003305970A JP4305836B2 (en) 2003-08-29 2003-08-29 Content search display device and content search display method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003305970A JP4305836B2 (en) 2003-08-29 2003-08-29 Content search display device and content search display method

Publications (2)

Publication Number Publication Date
JP2005078245A JP2005078245A (en) 2005-03-24
JP4305836B2 true JP4305836B2 (en) 2009-07-29

Family

ID=34409174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003305970A Expired - Lifetime JP4305836B2 (en) 2003-08-29 2003-08-29 Content search display device and content search display method

Country Status (1)

Country Link
JP (1) JP4305836B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006094151A2 (en) * 2005-03-01 2006-09-08 Adapt Technologies Inc., Query-less searching
JP4752623B2 (en) * 2005-06-16 2011-08-17 ソニー株式会社 Information processing apparatus, information processing method, and program
JP4815887B2 (en) * 2005-06-17 2011-11-16 日産自動車株式会社 Information processing apparatus and display apparatus for information processing
JP2007080061A (en) * 2005-09-15 2007-03-29 Univ Of Tsukuba Retrieval method of web page and clustering method of web page
JP2007148574A (en) * 2005-11-24 2007-06-14 Fuji Xerox Co Ltd Tree structure display program, tree structure display method, tree structure display device
US7716169B2 (en) 2005-12-08 2010-05-11 Electronics And Telecommunications Research Institute System for and method of extracting and clustering information
US8583673B2 (en) * 2009-08-17 2013-11-12 Microsoft Corporation Progressive filtering of search results
KR101055363B1 (en) * 2010-10-07 2011-08-08 한국과학기술정보연구원 Apparatus and method for providing search information based on multiple resource
JP5299471B2 (en) * 2011-05-20 2013-09-25 日産自動車株式会社 Information processing program and information processing method

Also Published As

Publication number Publication date
JP2005078245A (en) 2005-03-24

Similar Documents

Publication Publication Date Title
JP4622808B2 (en) Music classification device, music classification method, music classification program
JP5344715B2 (en) Content search apparatus and content search program
JP2005122295A (en) Relationship figure creation program, relationship figure creation method, and relationship figure generation device
WO2001031502A1 (en) Multimedia information classifying/arranging device and method
JP3625054B2 (en) Technical document retrieval device
JP2004178604A (en) Information retrieval system and its method
EP1832987B1 (en) Content data searcher
JP2000148793A (en) Method and device for similar retrieval of composite media document and storage medium stored with similar retrieval program for composite media document
JP4305836B2 (en) Content search display device and content search display method
JP3820878B2 (en) Information search device, score determination device, information search method, score determination method, and program recording medium
JP6680956B1 (en) Search needs evaluation device, search needs evaluation system, and search needs evaluation method
JPH09231238A (en) Display method for text retrieval result and device therefor
CN109471930B (en) Emotional board interface design method for user emotion
JP2002007433A (en) Information sorter, information sorting method, computer readable recording medium recorded with information sorting program and information sorting program
WO2008062822A1 (en) Text mining device, text mining method and text mining program
JP2004348771A (en) Technical document retrieval device
JP5716966B2 (en) Data analysis apparatus, data analysis method and program
Li et al. Music data mining: an introduction
JP6924450B2 (en) Search needs evaluation device, search needs evaluation system, and search needs evaluation method
JP4949012B2 (en) Explanation sentence selection apparatus, explanation sentence selection method, explanation sentence analysis apparatus, and explanation sentence analysis method
JP4423385B2 (en) Document classification support apparatus and computer program
JP7427510B2 (en) Information processing device, information processing method and program
JP4134975B2 (en) Topic document presentation method, apparatus, and program
JP2003316819A (en) Object classification researching device and program for executing it
JP4972271B2 (en) Search result presentation device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090423

R151 Written notification of patent or utility model registration

Ref document number: 4305836

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

EXPY Cancellation because of completion of term