JP2007164633A - Content retrieval method, system thereof, and program thereof - Google Patents

Content retrieval method, system thereof, and program thereof Download PDF

Info

Publication number
JP2007164633A
JP2007164633A JP2005362384A JP2005362384A JP2007164633A JP 2007164633 A JP2007164633 A JP 2007164633A JP 2005362384 A JP2005362384 A JP 2005362384A JP 2005362384 A JP2005362384 A JP 2005362384A JP 2007164633 A JP2007164633 A JP 2007164633A
Authority
JP
Japan
Prior art keywords
content
meta information
information
registration
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005362384A
Other languages
Japanese (ja)
Inventor
Takehito Abe
剛仁 阿部
Tomonori Takada
智規 高田
Harumi Kawamura
春美 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005362384A priority Critical patent/JP2007164633A/en
Publication of JP2007164633A publication Critical patent/JP2007164633A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To display result obtained by retrieving specified contents and arranging meta information related to the matter of the content. <P>SOLUTION: When character information is inputted as a search query, contents having related meta information with high degree of similarity to the query are selected, and sameness of the selected contents are judged based on the feature quantity of the extracted contents, and the contents whose sameness are high are grouped and displayed. When a content is inputted as a retrieval query, the feature quantity of the content of the query is extracted, the contents having the feature quantity whose sameness is high with the feature quantity of the content of the query are selected, and these degrees of similarity are determined based on the related meta information which the contents have, grouped and displayed. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、コンテンツ検索方法及び装置及びプログラムに係り、特に、動画像、静止画像、音声、テキスト情報などのディジタルコンテンツ集合に対して、検索クエリとしたコンテンツと同一性の高いコンテンツを選び出し提示するコンテンツ検索方法及び装置及びプログラムに関する。   The present invention relates to a content search method, apparatus, and program, and in particular, selects and presents content that is highly identical to the content used as a search query for a set of digital content such as moving images, still images, audio, and text information. The present invention relates to a content search method, apparatus, and program.

パーソナルコンピュータや携帯端末等の情報処理装置及び光ファイバ、3G携帯通信などが普及し、多くの家庭や企業において、動画像、静止画、音声、テキスト情報等様々なコンテンツが流通・利用されている。このような環境の下において、大量の情報の中から、利用者が所望のコンテンツを効率よく見つけ出す検索の方法が求められている。また、コンテンツの流通過程において、提供者が意図しない利用条件で配布される場合があり、提供者がそれらのコンテンツの所在を確認でき、利用者が正当な利用条件で配布されているコンテンツを検索するための、コンテンツ検索方法が求められている。   Information processing devices such as personal computers and mobile terminals, optical fibers, 3G mobile communications, etc. have become widespread, and various contents such as moving images, still images, audio, text information are distributed and used in many homes and businesses. . Under such an environment, there is a need for a search method in which a user can efficiently find desired content from a large amount of information. Also, in the distribution process of content, the provider may be distributed under unintended usage conditions. The provider can confirm the location of the content, and the user can search for content distributed under valid usage conditions. There is a need for a content search method for this purpose.

コンテンツ検索方法には、利用者が検索クエリとして、コンテンツに関連するメタ情報を入力する方法と、コンテンツ自体の特徴量を利用する方法がある。前者の方法においては、ロボット等がWebを巡回して自動的にコンテンツと関連するメタ情報を収集し、収集したメタデータを基にテキストマッチングを行うことで、所望のコンテンツを識別する。また、後者の場合は、コンテンツの色や形状、音程などの特徴を基にコンテンツに固有の特徴量を抽出し、それらの特徴量のマッチングにより識別する方法がある(例えば、非特許文献1参照)。   The content search method includes a method in which a user inputs meta information related to content as a search query, and a method in which the feature amount of the content itself is used. In the former method, a robot or the like visits the Web and automatically collects meta information related to the content, and performs text matching based on the collected metadata to identify the desired content. In the latter case, there is a method of extracting feature quantities specific to the content based on features such as the color, shape, and pitch of the content and identifying them by matching those feature quantities (see Non-Patent Document 1, for example) ).

また、前述のコンテンツの特徴量とメタ情報両方から、検索クエリとその他のコンテンツの近似順位を計算し、その順位に基づいて検索結果を出力するものもある(例えば、特許文献1参照)。
「オブジェクトに基づく高速画像検索システム:ExSight」、串間和彦他、情報処理学会論文誌、Vol.40, No.2, pp732-741,(1999). 特開平11−224256号公報、「情報検索方法及び情報検索プログラムを記録した記録媒体」
In addition, there is also a method in which an approximate ranking of a search query and other content is calculated from both the above-described content feature amount and meta information, and a search result is output based on the ranking (see, for example, Patent Document 1).
"High-speed image retrieval system based on objects: ExSight", Kazuhiko Kushima et al., IPSJ Transactions, Vol.40, No.2, pp732-741, (1999). JP-A-11-224256, “Information Retrieval Method and Recording Medium Recording Information Retrieval Program”

前述の従来のコンテンツ検索において、検索クエリにコンテンツの関連メタ情報を用いると、メタ情報がコンテンツの内容を的確に表現しているとは限らず、所望のコンテンツとは全く別のコンテンツが検索結果として表示され、結果が確かめながら絞り込む作業は大きな負担になる。   In the above-described conventional content search, when content-related meta information is used in a search query, the meta information does not always accurately represent the content, and the content that is completely different from the desired content is the search result. It is displayed as, and the work to narrow down while confirming the result is a heavy burden.

一方、検索クエリにコンテンツ特徴量を用いると、内容が類似するコンテンツを検索結果として得ることができるが、表示されたコンテンツの関連メタ情報を集め、検索結果の信頼性を計る作業も容易ではない。例えば、インターネットに接続されたWebより入手したあるサムネイル画像について、オリジナルの高品質画像を検索し、関連するメタ情報と共に利用を希望する場合を想定する。このとき、従来の検索手法では、コンテンツとそれに関連するメタ情報は体系立っていない情報として得られ、様々異なるメタ情報から必要とする情報を見つけ出し、得られたメタ情報全体を見通した情報の信頼性の推定を行うことは困難であった。コンテンツ特徴量とメタ情報の両方を検索クエリとする、例えば、特許文献1にある従来手法においても、メタ情報は付随情報として提示されるために、表示された検索結果が妥当なものであるかを判断することは容易に行うことはできない。   On the other hand, if the content feature amount is used in the search query, content with similar contents can be obtained as a search result, but it is not easy to collect related meta information of the displayed content and measure the reliability of the search result. . For example, it is assumed that an original high-quality image is searched for a certain thumbnail image obtained from the Web connected to the Internet, and is desired to be used together with related meta information. At this time, according to the conventional search method, the content and related meta information are obtained as unstructured information, the necessary information is found from various different meta information, and the reliability of the information in view of the obtained meta information as a whole. It was difficult to estimate sex. For example, even in the conventional method disclosed in Patent Document 1, since meta information is presented as accompanying information, the displayed search result is valid. It cannot be easily determined.

本発明は、上記の点に鑑みなされたもので、特定のコンテンツを検索し、コンテンツの内容と関連するメタ情報から整理して結果を表示して、利用者が簡易に所望のコンテンツと関連メタ情報を入手し、信頼性の確認を補助することを可能とする、コンテンツ検索方法及び装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and searches for specific contents, organizes them from meta information related to the contents of the contents, displays the results, and allows the user to easily obtain desired contents and related meta data. It is an object of the present invention to provide a content search method, apparatus, and program capable of obtaining information and assisting confirmation of reliability.

図1は、本発明の原理を説明するための図である。   FIG. 1 is a diagram for explaining the principle of the present invention.

本発明(請求項1)は、コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索方法であって、
メタ情報収集手段が、利用者からの検索クエリとして、コンテンツの関連メタ情報を取得すると、コンテンツ集合より検索クエリに該当するコンテンツの関連メタ情報を収集するメタ情報収集ステップ(ステップ1)と、
メタ情報識別手段が、検索クエリと収集した前記コンテンツの関連メタ情報を比較して、情報の関連性を判定し、コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBから一定の関連性を有するコンテンツを取得するメタ情報識別ステップ(ステップ2)と、
コンテンツ特徴量取得手段が、コンテンツDBからコンテンツ毎のコンテンツ特徴量を抽出するコンテンツ特徴量取得ステップ(ステップ3)と、
グループ分類手段が、コンテンツ特徴量取得ステップで得られたコンテンツ特徴量に基づいて、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツをグループ化するグループ分類ステップ(ステップ4)と、
出力手段が、グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力する出力ステップ(ステップ5)と、を行う。
The present invention (Claim 1) is a content search method for searching for specific content from a content set and presenting it.
When the meta information collecting means acquires the related meta information of the content as the search query from the user, the meta information collecting step (step 1) for collecting the related meta information of the content corresponding to the search query from the content set;
The meta information identification means compares the search query with the related meta information of the collected content to determine the relevance of the information, and from the content DB that stores the related meta information and feature quantity of the content in association with each other. A meta-information identification step (step 2) for acquiring relevant content;
A content feature amount acquisition means for extracting a content feature amount for each content from the content DB (step 3);
A group classification step (group classification unit) determines the identity of the content based on the content feature amount obtained in the content feature amount acquisition step, and groups the content determined to have an identity higher than a predetermined value ( Step 4) and
The output means performs an output step (step 5) for outputting at least one of the content and the related meta information of the content for each group classified in the group classification step.

また、本発明(請求項2)は、請求項1の出力ステップ(ステップ5)において、
グループ分類ステップ(ステップ4)により関連性が高いと判定されたコンテンツを含むグループから順に、一定のグループもしくは全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 2) is an output step (Step 5) of Claim 1,
In order from the group including the content determined to be highly relevant in the group classification step (step 4), at least one of the content and the related meta information of the content is output for each group for a certain group or all groups. To do.

また、本発明(請求項3)は、請求項1または、2において、
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
グループ分類ステップ(ステップ4)により同一性を有するコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
出力ステップ(ステップ5)において、
グループ分類ステップ(ステップ4)で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得ステップで取得した登録されている関連メタ情報を出力する。
Further, the present invention (Claim 3) is as described in Claim 1 or 2,
A content registration step of extracting a feature amount of the designated content in advance and associating the designated content and the extracted feature amount of the content with the related meta information of the input content and registering them in the content registration DB; ,
A registered meta information acquisition step of searching the content registration DB using the feature quantity of the content having the identity in the group classification step (step 4) as a search query and acquiring the registered related meta information;
In the output step (step 5),
At the same time as outputting at least one of the content and the related meta information of the content for each group classified in the group classification step (step 4), the registered related meta information acquired in the registered meta information acquisition step is output.

また、本発明(請求項4)は、コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索方法であって、
検索クエリ取得手段が、利用者からの検索クエリとしてコンテンツを取得する検索クエリ取得ステップと、
クエリコンテンツ特徴量取得手段が、検索クエリとして入力されたコンテンツの特徴量Aを抽出するクエリコンテンツ特徴量抽出ステップと、
特徴量比較手段が、コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBから取得したコンテンツの特徴量Bを抽出し、特徴量Aと該特徴量Bとを比較し、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツを取得する特徴量比較ステップと、
メタ情報取得手段が、特徴量比較ステップで取得したコンテンツに対応する該コンテンツの関連メタ情報を収集するメタ情報取得ステップと、
グループ分類手段が、メタ情報取得ステップで得られた関連メタ情報に基づいて、コンテンツの関連性を判定し、関連性が高いと判定されたコンテンツをグループ化するグループ分類ステップと、
出力手段が、グループ分類ステップで分類されたグループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する出力ステップと、を行う。
The present invention (Claim 4) is a content search method for searching for specific content from a content set and presenting it.
A search query acquisition step in which a search query acquisition means acquires content as a search query from a user;
A query content feature amount acquisition unit extracts a feature amount A of content input as a search query, and a query content feature amount extraction step;
The feature amount comparison unit extracts the feature amount B of the content acquired from the content DB in which the related meta information and the feature amount of the content are associated and accumulated, compares the feature amount A with the feature amount B, and A feature amount comparison step of determining identity and acquiring content determined to be higher than a predetermined value;
A meta information acquisition unit for collecting related meta information of the content corresponding to the content acquired in the feature amount comparison step;
A group classification step in which the group classification means determines the relevance of the content based on the related meta information obtained in the meta information acquisition step, and groups the content determined to have high relevance;
An output means performs an output step of outputting at least one of content and related meta information of the content for each group classified in the group classification step.

また、本発明(請求項5)は、請求項4の出力ステップにおいて、
グループ分類ステップにより同一性が高いと判定されたコンテンツを含むグループから順に一定数のグループもしくは、全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 5) provides an output step according to Claim 4,
At least one of the content and the related meta information of the content is output for each group with respect to a certain number of groups or all the groups in order from the group including the content determined to have high identity by the group classification step.

また、本発明(請求項6)は、請求項4または、5において、
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
グループ分類ステップにより同一になったコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
出力ステップにおいて、
グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得ステップで取得した登録されている関連メタ情報を出力する。
Further, the present invention (Claim 6) is as described in Claim 4 or 5,
A content registration step of extracting a feature amount of the designated content in advance and associating the designated content and the extracted feature amount of the content with the related meta information of the input content and registering them in the content registration DB; ,
The registration meta-information acquisition step of searching the content registration DB using the feature amount of the content that became the same in the group classification step as a search query and acquiring the registered related meta-information is further performed.
In the output step,
At least one of the content and the related meta information of the content is output for each group classified in the group classification step, and at the same time, the registered related meta information acquired in the registered meta information acquisition step is output.

また、本発明(請求項7)は、請求項4のグループ分類ステップにおいて、
一定の同一性を有するコンテンツをコンテンツ集合内より選択した後、同一性に応じてコンテンツ同士をグループ化し、
出力ステップにおいて、
グループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 7) is the group classification step of Claim 4,
After selecting content with a certain identity from the content set, the content is grouped according to identity,
In the output step,
For each group, at least one of content and related meta information of the content is output.

また、本発明(請求項8)は、請求項7の出力ステップにおいて、
グループ分類ステップにより同一性が高いと判定されたコンテンツのグループから順に、一定数のグループもしくは全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 8) is the output step of Claim 7,
In order from the group of contents determined to have high identity by the group classification step, at least one of the content and the related meta information of the content is output for each group for a certain number of groups or all groups.

また、本発明(請求項9)は、請求項7または、8において、予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
グループ分類ステップにおいて同一性を有するコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
出力ステップにおいて、
グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得ステップで取得した登録されている関連メタ情報を出力する。
Further, according to the present invention (Claim 9), the feature amount of the specified content is extracted in advance in Claim 7 or 8, and the specified content and the extracted feature amount of the content are input. A content registration step of associating the related meta information of the content and registering it in the content registration DB;
In the group classification step, the registration meta information acquisition step of searching the content registration DB using the feature amount of the content having the identity as a search query and acquiring the registered related meta information is further performed.
In the output step,
At least one of the content and the related meta information of the content is output for each group classified in the group classification step, and at the same time, the registered related meta information acquired in the registered meta information acquisition step is output.

また、本発明(請求項10)は、請求項3,6、または9において、
コンテンツ登録ステップによりコンテンツ登録DBに蓄積された各コンテンツの関連メタ情報中のライセンス情報(以下、登録ライセンス情報と記す)と、登録メタ情報取得ステップにより収集した関連情報メタ情報中のライセンス情報(以下、収集ライセンス情報と記す)との、許諾条件を判定するライセンス許諾判定ステップを更に行い、
グループ分類ステップにおいて、
ライセンス許諾判定ステップにより包含関係を判断してグループに分類し、
出力ステップにおいて、
グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 10) according to Claim 3, 6 or 9,
License information in the related meta information of each content accumulated in the content registration DB by the content registration step (hereinafter referred to as registered license information), and license information in the related information meta information collected in the registration meta information acquisition step (hereinafter referred to as “registered license information”). , The license license determination step for determining the license conditions, and the collected license information)
In the group classification step,
The inclusion relationship is judged by the license permission judgment step and classified into groups.
In the output step,
At least one of content and related meta information of the content is output for each group.

また、本発明(請求項11)は、請求項10において、
ライセンス許諾判定ステップにより包含関係を判断するステップを更に行い、
出力ステップにおいて、
登録ライセンス情報の許諾範囲内にある収集ライセンス情報が関連付けられたコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (claim 11) is the method according to claim 10,
A step of determining an inclusion relationship in the license permission determination step;
In the output step,
At least one of the content associated with the collected license information within the permitted range of the registered license information and the related meta information of the content is output.

図2は、本発明の原理構成図である。   FIG. 2 is a principle configuration diagram of the present invention.

本発明(請求項12)は、コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索装置であって、
コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDB160と、
利用者からの検索クエリとして、コンテンツの関連メタ情報を取得すると、コンテンツ集合より検索クエリに該当するコンテンツの関連メタ情報を収集するメタ情報収集手段110と、
検索クエリと収集したコンテンツの関連メタ情報を比較して、情報の関連性を判定し、コンテンツDB160から一定の関連性を有するコンテンツを取得するメタ情報識別手段120と、
コンテンツDB160からコンテンツ毎のコンテンツ特徴量を抽出するコンテンツ特徴量取得手段130と、
コンテンツ特徴量取得手段130で得られたコンテンツ特徴量に基づいて、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツをグループ化するグループ分類手段140と、
グループ分類手段140で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力する出力手段150と、を有する。
The present invention (Claim 12) is a content search device for searching for specific content from a content set and presenting it.
A content DB 160 that stores content-related meta information and feature quantities in association with each other;
Meta information collection means 110 that collects related meta information of content corresponding to a search query from a content set when content related meta information is acquired as a search query from a user;
Meta information identifying means 120 that compares the search query with the related meta information of the collected content, determines the relevance of the information, and acquires content having a certain relevance from the content DB 160;
Content feature amount acquisition means 130 for extracting content feature amounts for each content from the content DB 160;
A group classification unit 140 that determines the identity of the content based on the content feature amount obtained by the content feature amount acquisition unit 130, and groups the content determined to have an identity higher than a predetermined value;
Output means 150 for outputting at least one of the content and the related meta information of the content for each group classified by the group classification means 140.

また、本発明(請求項13)は、請求項12において、
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
グループ分類手段により同一性を有するコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
出力手段は、
グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得手段で取得した登録されている関連メタ情報を出力する。
Further, the present invention (Claim 13), in Claim 12,
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
A registration meta-information acquiring unit that searches the content registration DB using the feature amount of the content having the identity by the group classification unit as a search query, and acquires the related meta-information that is registered;
The output means is
At least one of the content and the related meta information of the content is output for each group classified by the group classification unit, and at the same time, the registered related meta information acquired by the registered meta information acquisition unit is output.

本発明(請求項14)は、コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索装置であって、
コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBと、
利用者からの検索クエリとしてコンテンツを取得する検索取得手段と、
検索クエリとして入力されたコンテンツの特徴量Aを抽出するクエリコンテンツ特徴量抽出手段と、
コンテンツDBから取得したコンテンツの特徴量Bを抽出し、特徴量Aと該特徴量Bとを比較し、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツを取得する特徴量比較手段と、
特徴量比較手段で取得したコンテンツに対応する該コンテンツの関連メタ情報を収集するメタ情報取得手段と、
メタ情報取得手段で得られた関連メタ情報に基づいて、コンテンツの関連性を判定し、関連性が高いと判定されたコンテンツをグループ化するグループ分類手段と、
グループ分類手段で分類されたグループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する出力手段と、を有する。
The present invention (Claim 14) is a content search device for searching for specific content from a content set and presenting it.
A content DB that stores content-related meta information and feature quantities in association with each other;
Search acquisition means for acquiring content as a search query from a user;
Query content feature amount extraction means for extracting feature amount A of the content input as a search query;
The feature amount B of the content acquired from the content DB is extracted, the feature amount A and the feature amount B are compared, the identity of the content is determined, and the content whose identity is determined to be higher than a predetermined value is acquired Characteristic amount comparison means
Meta information acquisition means for collecting related meta information of the content corresponding to the content acquired by the feature amount comparison means;
Group classification means for determining the relevance of the content based on the related meta information obtained by the meta information acquisition means, and grouping the content determined to be highly relevant;
Output unit for outputting at least one of content and related meta information of the content for each group classified by the group classification unit.

また、本発明(請求項15)は、請求項14において、
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
グループ分類手段により同一になったコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
出力手段は、
グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得手段で取得した登録されている関連メタ情報を出力する。
Further, the present invention (Claim 15) according to Claim 14,
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
A registered meta-information acquiring unit that searches the content registration DB using the feature amount of the content that is the same by the group classification unit as a search query and acquires the registered related meta-information;
The output means is
At least one of the content and the related meta information of the content is output for each group classified by the group classification unit, and at the same time, the registered related meta information acquired by the registered meta information acquisition unit is output.

また、本発明(請求項16)は、請求項14において、
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
グループ分類手段において同一性を有するコンテンツの特徴量を検索クエリとしてコンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
出力手段は、
グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、登録メタ情報取得手段で取得した登録されている関連メタ情報を出力する。
The present invention (Claim 16) is characterized in that in Claim 14,
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
A registration meta-information acquisition unit that searches the content registration DB using the feature quantity of the content having the identity in the group classification unit as a search query and acquires the registered related meta-information;
The output means is
At least one of the content and the related meta information of the content is output for each group classified by the group classification unit, and at the same time, the registered related meta information acquired by the registered meta information acquisition unit is output.

また、本発明(請求項17)は、請求項13,15、または16において、
コンテンツ登録手段によりコンテンツ登録DBに蓄積された各コンテンツの関連メタ情報中のライセンス情報(以下、登録ライセンス情報と記す)と、登録メタ情報取得ステップにより収集した関連情報メタ情報中のライセンス情報(以下、収集ライセンス情報と記す)との、許諾条件を判定するライセンス許諾判定手段を更に有し、
グループ分類手段は、
ライセンス許諾判定手段により包含関係を判断してグループに分類し、
出力手段は、
グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する。
Further, the present invention (Claim 17) according to Claim 13, 15, or 16,
License information in the related meta information of each content accumulated in the content registration DB by the content registration means (hereinafter referred to as registered license information) and license information in the related information meta information collected in the registered meta information acquisition step (hereinafter referred to as “registered license information”). And license license determination means for determining a license condition,
Group classification means
The inclusion relationship is judged by the license permission judgment means and classified into groups,
The output means is
At least one of content and related meta information of the content is output for each group.

本発明(請求項18)は、コンピュータを、請求項12乃至17記載のコンテンツ検索装置として機能させるコンテンツ検索プログラムである。   The present invention (Claim 18) is a content search program for causing a computer to function as the content search apparatus according to Claims 12 to 17.

上記のように本発明によれば、特定のコンテンツを検索し、コンテンツの内容と関連するメタ情報を整理して受け取ることが可能になる。   As described above, according to the present invention, it is possible to search for specific contents and receive meta information related to the contents of contents in an organized manner.

さらに、利用者は利用目的に応じて、必要なライセンス条件のコンテンツを簡易に入手することが可能となる。   Furthermore, the user can easily obtain the content having the necessary license conditions according to the purpose of use.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施の形態]
本実施の形態では、検索クエリとして利用者から文字情報(関連メタ情報)が入力された場合のコンテンツ検索について説明する。
[First Embodiment]
In the present embodiment, a content search when character information (related meta information) is input from a user as a search query will be described.

図3は、本発明の第1の実施の形態におけるコンテンツ検索装置の構成図である。   FIG. 3 is a configuration diagram of the content search apparatus according to the first embodiment of the present invention.

同図に示すコンテンツ検索装置100には、検索クエリを入力する入力装置100、値Webサーバ30に接続されたネットワーク20、検索結果を表示する表示装置40が接続されている。   An input device 100 for inputting a search query, a network 20 connected to the value Web server 30, and a display device 40 for displaying search results are connected to the content search device 100 shown in FIG.

検索装置100は、メタ情報収集部110、メタ情報識別部120、コンテンツ特徴量取得部130、グループ分類部140、出力部150、コンテンツDB160,分類情報DB170を有する。コンテンツDB160は、コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているデータベースである。   The search device 100 includes a meta information collection unit 110, a meta information identification unit 120, a content feature amount acquisition unit 130, a group classification unit 140, an output unit 150, a content DB 160, and a classification information DB 170. The content DB 160 is a database that stores related meta information and feature amounts of content in association with each other.

上記の構成における動作を説明する。   The operation in the above configuration will be described.

図4は、本発明の第1の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 4 is a flowchart of the operation of the content search apparatus according to the first embodiment of the present invention.

ステップ101) コンテンツ検索装置100は、入力装置10から検索クエリ(コンテンツに関連するメタ情報(以下、関連メタ情報と記す)が入力される。   Step 101) The content search device 100 receives a search query (meta information related to content (hereinafter referred to as related meta information) from the input device 10.

ステップ102) メタ情報収集部110は、入力された検索クエリに基づいて、コンテンツ集合内のコンテンツの関連メタ情報を収集する。例えば、コンテンツ集合がネットワーク20で接続されたWebサイト(Webサーバ30)で公開されている画像である場合は、Webサイトを巡回して、HTMLファイルを収集し、テキスト情報を解析するロボットを用いて、その画像情報を含むHTMLファイル、もしくは、そこからリンクされたサイトのHTMLファイルにて、タグ及びタグで指定された文字情報から取得することも可能である。   Step 102) The meta information collection unit 110 collects related meta information of content in the content set based on the input search query. For example, if the content set is an image published on a Web site (Web server 30) connected via the network 20, a robot that circulates the Web site, collects HTML files, and analyzes text information is used. It is also possible to obtain the tag and the character information designated by the tag in the HTML file including the image information or the HTML file of the site linked from the HTML file.

ステップ103) 次に、メタ情報識別部120において、メタ情報収集部110で収集した関連メタ情報と検索クエリと比較して関連性を判定する。コンテンツの関連メタ情報は、例えば、タイトルや作者名、作者の所属グループ、キーワード、ライセンス情報などであり、テキストの部分一致や辞書を使った意味的類似度により関連性を判断する。   Step 103) Next, the meta information identifying unit 120 compares the related meta information collected by the meta information collecting unit 110 with the search query to determine the relevance. The content-related meta information includes, for example, a title, an author name, an author's group, a keyword, license information, and the like.

ステップ104) そして、関連性が高いと判断した(例えば、設定した閾値以上の類似度を持つ)コンテンツを全て選択し、メタ情報識別部120内のメモリ(図示せず)に格納する。   Step 104) Then, all contents determined to be highly relevant (for example, having a similarity equal to or higher than a set threshold) are selected and stored in a memory (not shown) in the meta information identification unit 120.

ステップ105) コンテンツ特徴量取得部130は、メタ情報識別部120で選択されたコンテンツに基づいて、コンテンツDB160に格納されているコンテンツの特徴量を取得し、当該コンテンツ特徴量取得部130内のメモリ(図示せず)に格納する。   Step 105) The content feature amount acquisition unit 130 acquires the feature amount of the content stored in the content DB 160 based on the content selected by the meta information identification unit 120, and the memory in the content feature amount acquisition unit 130 (Not shown).

ステップ106) 次に、グループ分類部140において、コンテンツ特徴量取得部130内のメモリ(図示せず)からコンテンツの特徴量を取得して、分類情報DB170を参照して相互の同一性を判断し、同一と判断されたコンテンツ同士を同一のグループに分類し、当該グループ分類部140内のメモリ(図示せず)に格納する。特徴量による同一性の判定は、例えば、分類情報DB170に格納されている文字列部分一致割合、数値情報としての差分値、ビット列での部分一致割合等で判断する。   Step 106) Next, the group classification unit 140 acquires content feature amounts from a memory (not shown) in the content feature amount acquisition unit 130, and refers to the classification information DB 170 to determine mutual identity. The contents determined to be the same are classified into the same group and stored in a memory (not shown) in the group classification unit 140. The determination of the identity based on the feature amount is performed based on, for example, a character string partial matching ratio stored in the classification information DB 170, a difference value as numerical information, a partial matching ratio in a bit string, and the like.

ステップ107) 出力部150は、グループ分類部140のメモリ(図示せず)から検索結果として、グループに分類された状態の選択したコンテンツを表示装置40に提示する。提示の方法は、コンテンツ自体でもよいし、関連するメタデータの中から一つもしくは全てでもよい。グループ内のコンテンツ全てを表示する場合もあるし、グループ内の代表コンテンツ1つについて表示する方法もある。   Step 107) The output unit 150 presents the selected content in the group classified state on the display device 40 as a search result from the memory (not shown) of the group classification unit 140. The presentation method may be the content itself, or one or all of the related metadata. There are cases where all the contents in the group are displayed, and there is a method of displaying one representative content in the group.

また、表示するコンテンツのグループの順序は、メタ情報の関連性が高い順番にすることができる。図5(a)は、あるコンテンツ集団から「ファミリーカー」というキーワードを検索クエリとし、4つの画像コンテンツが選択された例である。関連性が高いと判定される順に、それぞれ「ファミリーカー」「ファミリーセダン」「スポーツカー」「大衆車」という関連メタ情報が附属していたとする。グループ分類部140は、図5(b)に示すように、特徴量が「0001」である2つのコンテンツをグループ化し、出力部150において、検索クエリと最も関連性の高いメタ情報のコンテンツを含むグループ(特徴量「0001」のグループ)から順に表示する。   Further, the order of the group of contents to be displayed can be set in the order in which the relevance of the meta information is high. FIG. 5A shows an example in which four image contents are selected from a certain content group using the keyword “family car” as a search query. Assume that related meta information “family car”, “family sedan”, “sports car”, and “popular car” are attached in the order in which the relevance is determined to be high. As shown in FIG. 5B, the group classification unit 140 groups two contents having a feature quantity “0001”, and the output unit 150 includes meta information contents most relevant to the search query. Displayed in order from the group (the group with the feature amount “0001”).

一方、特徴量でグループ化したグループの関連性のランクの平均値の高い順に表示することも可能であり、例えば、図5(c)に示すように、特徴量が「FFF1」であるコンテンツを第1グループとする方法もある。   On the other hand, it is also possible to display in descending order of the average value of the relevance rank of the groups grouped by the feature amount. For example, as shown in FIG. 5C, content having the feature amount “FFF1” is displayed. There is also a method of making the first group.

また、上記のステップ102のメタ情報を収集する処理では、前述のネットワーク20を利用した収集活動等により得られたメタ情報が、予めDB(メタ情報DB)に蓄積された状態にあり、当該DBにアクセスすることによりメタ情報を得ることも可能である。   Further, in the process of collecting the meta information in step 102 described above, the meta information obtained by the collection activity using the network 20 is accumulated in advance in a DB (meta information DB), and the DB It is also possible to obtain meta information by accessing.

[第2の実施の形態]
図6は、本発明の第2の実施の形態における検索装置の構成を示す。同図において、図3の構成と同一部分には同一符号を付し、その説明を省略する。
[Second Embodiment]
FIG. 6 shows the configuration of the search device according to the second embodiment of the present invention. In this figure, the same parts as those in FIG.

本実施の形態では、前述の第1の実施の形態に、コンテンツ特徴量抽出部210、登録部220、コンテンツ登録DB230、登録メタ情報取得部240を追加した構成である。   In this embodiment, a content feature amount extraction unit 210, a registration unit 220, a content registration DB 230, and a registration meta information acquisition unit 240 are added to the first embodiment described above.

図7は、本発明の第2の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 7 is a flowchart of the operation of the content search apparatus in the second embodiment of the present invention.

ステップ101〜ステップ106までの処理は、前述の第1の実施の形態と同様であるのでその説明は省略する。   Since the processing from step 101 to step 106 is the same as that in the first embodiment, the description thereof will be omitted.

以下のステップ201〜204の処理は、ステップ101〜ステップ106の処理を実施する前に行われる処理である。   The following steps 201 to 204 are performed before the steps 101 to 106 are performed.

ステップ201,202) 入力装置10から予め、コンテンツをコンテンツ特徴量抽出部210に、そのコンテンツ関連メタ情報(以下、登録メタ情報と記す)を登録部220に入力する。   Steps 201 and 202) The content is input to the content feature amount extraction unit 210 and the content related meta information (hereinafter referred to as registration meta information) from the input device 10 in advance to the registration unit 220.

ステップ203) コンテンツ特徴量抽出部210は、入力されたコンテンツから前述のコンテンツ特徴量取得部130と同様の方法で、特徴量を抽出する。   Step 203) The content feature amount extraction unit 210 extracts feature amounts from the input content in the same manner as the content feature amount acquisition unit 130 described above.

ステップ204) 登録部220は、コンテンツ特徴量抽出部210で抽出されたコンテンツ特徴量と、入力された登録メタ情報を、互いに関連付けて、図8に示すようにコンテンツ登録DB230に蓄積する。コンテンツデータそのものは、コンテンツ登録DB230に蓄積しても、しなくてもよい。   Step 204) The registration unit 220 stores the content feature amount extracted by the content feature amount extraction unit 210 and the input registration meta information in the content registration DB 230 as shown in FIG. The content data itself may or may not be stored in the content registration DB 230.

ステップ205) 登録メタ情報取得部240は、ステップ106において、グループ分類部140で分類された各グループのコンテンツの特徴量を検索クエリとして、コンテンツ登録DB230を検索し、同一と判定されるコンテンツの登録メタ情報を取得し、検索結果として出力部150に出力する。   Step 205) In step 106, the registration meta information acquisition unit 240 searches the content registration DB 230 using the content features of each group classified by the group classification unit 140 as a search query, and registers the content determined to be the same. Meta information is acquired and output to the output unit 150 as a search result.

ステップ206) 出力部150は、検索結果をグループに分類された状態で、選択したコンテンツを表示装置40に提示する。提示の際は得られた登録メタ情報をグループ毎に表示する。   Step 206) The output unit 150 presents the selected content on the display device 40 in a state where the search results are classified into groups. At the time of presentation, the obtained registration meta information is displayed for each group.

また、本実施の形態において、コンテンツ登録DB230に利用許諾条件を記したライセンスを登録しておくことにより、これを取得し、ステップ201〜204の処理で収集したコンテンツのメタ情報のライセンスを比較し、ライセンスの包含関係を判断する。包含関係は、一方の条件が他方の条件と一致するか、もしくは、他方を満たすか否かであり、例えば、コンテンツ登録DB230から、「2010年1月1日まで利用可」の許諾条件を持つライセンスを取得した場合に、利用期限が同じであるか、その前か後かに分類される。ライセンスの包含関係によりグループをさらに小グループに分割する。   Further, in the present embodiment, by registering a license describing the use permission condition in the content registration DB 230, the license is acquired and compared with the meta information licenses collected in the processes of steps 201 to 204. Determine the license inclusion relationship. The inclusion relationship is whether one condition matches the other condition or satisfies the other condition. For example, the content registration DB 230 has a permission condition “available until January 1, 2010”. When a license is acquired, the usage period is the same, or before or after. The group is further divided into small groups according to the license inclusion relationship.

検索結果の提示の際には、出力部150は、小グループ毎にまとめて提示し、得られたライセンスの包含関係を表示する。また、小グループのうち、ライセンス包含関係がコンテンツ登録DB230のライセンスを満たすもののみ表示することもできる。例えば、前述の例であれば、利用期限が2010年1月1日より前に設定されたライセンスと関連付けられたコンテンツのみが、検索結果として表示される。   When presenting the search results, the output unit 150 presents them together for each small group, and displays the obtained license inclusion relationship. In addition, among the small groups, only those whose license inclusion relationship satisfies the license of the content registration DB 230 can be displayed. For example, in the above example, only the content associated with the license whose usage period is set before January 1, 2010 is displayed as the search result.

[第3の実施の形態]
本実施の形態では、利用者から検索クエリとしてコンテンツが入力された場合について説明する。
[Third Embodiment]
In the present embodiment, a case where content is input as a search query from a user will be described.

図9は、本発明の第3の実施の形態におけるコンテンツ検索装置の構成を示す。同図において、図3及び図6と同一構成部分には同一符号を付し、その説明を省略する。   FIG. 9 shows the configuration of a content search apparatus according to the third embodiment of the present invention. In this figure, the same components as those in FIGS.

同図に示す構成は、検索クエリ取得部310、クエリコンテンツ特徴量取得部320、特徴量比較部330、メタ情報取得部340、グループ分類部140、出力部150、コンテンツDB160、メタ情報DB350、分類情報DB170から構成される。   The configuration shown in the figure includes a search query acquisition unit 310, a query content feature amount acquisition unit 320, a feature amount comparison unit 330, a meta information acquisition unit 340, a group classification unit 140, an output unit 150, a content DB 160, a meta information DB 350, a classification. It consists of information DB170.

なお、メタ情報DB350は、ネットワークを介してメタ情報を収集する場合には不要である。   Note that the meta information DB 350 is unnecessary when collecting meta information via a network.

図10は、本発明の第10の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 10 is a flowchart of the operation of the content search apparatus in the tenth embodiment of the present invention.

ステップ301) 入力装置10から利用者がコンテンツを特定して入力する。   Step 301) A user specifies and inputs content from the input device 10.

ステップ302) 検索クエリ取得部310は、入力されたコンテンツから特徴量Aを抽出し、検索クエリを生成する。   Step 302) The search query acquisition unit 310 extracts the feature amount A from the input content, and generates a search query.

ステップ303) クエリコンテンツ特徴量取得部320は、コンテンツDB160内のコンテンツ集合を取得して、当該コンテンツ集合からコンテンツの特徴量Bを取得し、当該クエリコンテンツ特徴量取得部320内のメモリ(図示せず)に格納する。   Step 303) The query content feature quantity acquisition unit 320 acquires a content set in the content DB 160, acquires a feature quantity B of the content from the content set, and a memory (not shown) in the query content feature quantity acquisition unit 320. Stored).

ステップ304) 特徴量比較部330は、コンテンツ特徴量取得部320内のメモリ(図示せず)に格納されている特徴量Bと、検索クエリの特徴量Aとを比較して、同一性を判定する。   Step 304) The feature quantity comparison unit 330 compares the feature quantity B stored in the memory (not shown) in the content feature quantity acquisition unit 320 with the feature quantity A of the search query to determine identity. To do.

ステップ305) その結果、同一性が高いと判断されるコンテンツを全て選択し、当該特徴量比較部330内のメモリ(図示せず)に格納する。   Step 305) As a result, all contents determined to have high identity are selected and stored in a memory (not shown) in the feature amount comparison unit 330.

ステップ306) メタ情報取得部340は、特徴量比較部330内のメモリ(図示せず)からコンテンツを取得し、当該コンテンツに関連する関連メタ情報をメタ情報DB350または、ネットワークから取得する。   Step 306) The meta information acquisition unit 340 acquires content from a memory (not shown) in the feature amount comparison unit 330, and acquires related meta information related to the content from the meta information DB 350 or the network.

ステップ307) グループ分類部140は、分類情報DB170を参照して、関連メタ情報の一部もしくはすべてを比較し、関連性が高いと判定されたコンテンツ同士を同一のグループに分類し、分類結果をメモリ(図示せず)に格納する。   Step 307) The group classification unit 140 refers to the classification information DB 170, compares some or all of the related meta information, classifies the contents determined to be highly related, and classifies the classification results into the same group. Store in a memory (not shown).

ステップ308) 出力部150は、グループ分類部140内のメモリ(図示せず)から取得して、グループに分類された状態で、選択されたコンテンツを表示装置40に提示する。   Step 308) The output unit 150 obtains from the memory (not shown) in the group classification unit 140, and presents the selected content on the display device 40 in a state of being classified into groups.

提示の方法は、コンテンツ自体でもよいし、関連するメタデータの中の一つまたは、全てでもよい。また、グループ内のコンテンツ全てを表示する場合もあるし、グループ内の代表コンテンツ1つについて表示する方法もある。   The presentation method may be the content itself or one or all of the related metadata. Further, there are cases where all the contents in the group are displayed, and there is a method of displaying one representative content in the group.

ステップ303のコンテンツ特徴量を抽出する処理において、コンテンツ集合内の一部もしくは全部のコンテンツについて、予め特徴量抽出作業を実行して、特徴量をコンテンツDB160に蓄積した状態とし、当該コンテンツDB160にアクセスすることにより、特徴量を参照可能にする方法も可能である。   In the process of extracting the content feature amount in step 303, the feature amount extraction operation is executed in advance for part or all of the content in the content set so that the feature amount is accumulated in the content DB 160, and the content DB 160 is accessed. By doing so, a method of making it possible to refer to the feature amount is also possible.

また、本実施の形態において、表示するコンテンツのグループの順序は、メタ情報の関連性の高いコンテンツを含む順番にすることができる。図11(a)は、あるコンテンツ集団から特徴量[0001]を持つコンテンツを検索クエリとし、4つの画像コンテンツが選択された例である。特徴量は、数字の値が近いほど同一性が高いものとし、同一性の高い順に「ファミリーカー」「大衆車」「スポーツカー」及び「ファミリーカー」という関連メタ情報が附属していたとする。図11(b)に示すように、メタ情報が「ファミリーカー」である2つのコンテンツをグループ化し、検索クエリと最も同一性の高い特徴量のコンテンツを含むグループ(メタ情報「ファミリーカー」のグループ)から順に表示する。一方、メタ情報でグループ化したグループの特徴量同一性ランクの平均値の高い順に表示することも可能であり、例えば、図11(c)に示すように、メタ情報が「大衆車」であるコンテンツを第1グループとする方法もある。   Further, in the present embodiment, the order of the group of contents to be displayed can be an order including contents with high relevance of meta information. FIG. 11A is an example in which four image contents are selected from a certain content group using a content having a feature quantity [0001] as a search query. It is assumed that the feature quantity has a higher identity as the numerical value is closer, and associated meta information “family car”, “popular car”, “sport car”, and “family car” is attached in descending order of the identity. As shown in FIG. 11B, two contents whose meta information is “family car” are grouped, and a group including a content with a feature amount having the highest identity with the search query (group of meta information “family car”). ) Are displayed in order. On the other hand, it is also possible to display in the descending order of the average value of the feature quantity identity ranks of groups grouped by meta information. For example, as shown in FIG. 11C, the meta information is “popular car”. There is also a method in which the content is set to the first group.

[第4の実施の形態]
図12は、本発明の第4の実施の形態におけるコンテンツ検索装置の構成を示す。同図において、図3、図6、図9と同一構成部分には同一符号を付し、その説明を省略する。
[Fourth Embodiment]
FIG. 12 shows the configuration of a content search apparatus according to the fourth embodiment of the present invention. In this figure, the same components as those in FIGS. 3, 6, and 9 are denoted by the same reference numerals, and description thereof is omitted.

図12に示すコンテンツ検索装置は、検索クエリ取得部310、クエリコンテンツ特徴量取得部320、特徴量比較部330、メタ情報取得部340、グループ分類部140、登録メタ情報取得部410、出力部150、コンテンツDB160,メタ情報DB350,分類情報DB170,コンテンツ特徴量抽出部210、登録部220、コンテンツ登録DB230から構成される。   The content search apparatus illustrated in FIG. 12 includes a search query acquisition unit 310, a query content feature amount acquisition unit 320, a feature amount comparison unit 330, a meta information acquisition unit 340, a group classification unit 140, a registered meta information acquisition unit 410, and an output unit 150. , Content DB 160, meta information DB 350, classification information DB 170, content feature amount extraction unit 210, registration unit 220, and content registration DB 230.

図13は、本発明の第4の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 13 is a flowchart of the operation of the content search apparatus in the fourth embodiment of the present invention.

登録フローにおいて、第2の実施の形態と同様に、予め特定のコンテンツとそのコンテンツ関連メタ情報が入力されると(ステップ201,202)、コンテンツに対しては特徴量を抽出し(ステップ203)、コンテンツ特徴量とコンテンツ関連メタ情報をコンテンツ登録DB230に蓄積する(ステップ204)。   In the registration flow, as in the second embodiment, when a specific content and its content-related meta information are input in advance (steps 201 and 202), feature amounts are extracted for the content (step 203). The content feature amount and the content related meta information are stored in the content registration DB 230 (step 204).

検索フローにおいては、ステップ301〜307の特徴量でグルーピングするまでは前述の第3の実施の形態と同様である。   The search flow is the same as that in the third embodiment until grouping is performed using the feature amounts in steps 301 to 307.

上記の処理の後、登録メタ情報取得部410が、グループ分類部140のメモリ(図示せず)に格納されているグループのコンテンツの特徴量を取得し、それを検索クエリとして、コンテンツ登録DB230を検索し、同一性が高いと判定される(例えば、特徴量の差が設定した閾値以内になっている)コンテンツの登録メタ情報を取得し、出力部150に出力する。   After the above processing, the registration meta information acquisition unit 410 acquires the feature quantity of the group content stored in the memory (not shown) of the group classification unit 140, and uses the content registration DB 230 as a search query. Search is performed, and the registered meta information of the content that is determined to have high identity (for example, the difference in the feature amount is within the set threshold) is acquired and output to the output unit 150.

出力部150は、検索結果として、グループに分類された状態で、選択したコンテンツを表示装置40に提示する。提示の際には、得られたコンテンツの登録メタ情報をグループ毎に表示する。   The output unit 150 presents the selected content on the display device 40 as a search result in a state of being classified into groups. When presenting, the registered meta information of the obtained content is displayed for each group.

本実施の形態において、コンテンツ登録DB230にコンテンツの利用許諾条件を記したライセンスを登録しておくことにより、これを取得して、登録フロー(ステップ201〜204)にて収集したコンテンツのメタ情報をライセンスと比較し、ライセンスの包含関係により、登録メタ情報取得部410では、グループ分類部140から取得したグループをさらに小グループに分割する。   In the present embodiment, by registering a license in which content usage permission conditions are registered in the content registration DB 230, the license information is acquired and collected in the registration flow (steps 201 to 204). Compared with the license, the registered meta information acquisition unit 410 further divides the group acquired from the group classification unit 140 into smaller groups based on the license inclusion relationship.

出力部150における検索結果の提示の際には、小グループ毎にまとめて表示装置40に提示し、得られたライセンスの包含関係を表示する。   When presenting the search result in the output unit 150, the small group is presented together on the display device 40, and the obtained license inclusion relationship is displayed.

また、小グループのうち、ライセンス包含関係がコンテンツ登録DB230に格納されているライセンスを満たすもののみを表示することもできる。   In addition, it is possible to display only small groups satisfying the license whose license inclusion relationship is stored in the content registration DB 230.

[第5の実施の形態]
図14は、本発明の第5の実施の形態におけるコンテンツ検索装置の構成を示す。同図において、図9と同一構成部分には、同一符号を付し、その説明を省略する。
[Fifth Embodiment]
FIG. 14 shows the configuration of a content search apparatus according to the fifth embodiment of the present invention. In the figure, the same components as those in FIG. 9 are denoted by the same reference numerals, and the description thereof is omitted.

同図に示す構成は、検索クエリ取得部310、クエリコンテンツ特徴量取得部320、特徴量比較部330、特徴量グループ分類部510、メタ情報取得部520、出力部150、メタ情報DB350,コンテンツDB160から構成される。   The configuration shown in the figure includes a search query acquisition unit 310, a query content feature amount acquisition unit 320, a feature amount comparison unit 330, a feature amount group classification unit 510, a meta information acquisition unit 520, an output unit 150, a meta information DB 350, and a content DB 160. Consists of

図15は、本発明の第5の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 15 is a flowchart of the operation of the content search apparatus in the fifth embodiment of the present invention.

本実施の形態では、ステップ301〜305までの処理は前述の第3の実施の形態の図10の処理と同様である。   In the present embodiment, the processing in steps 301 to 305 is the same as the processing in FIG. 10 of the third embodiment described above.

ステップ305において、特徴量比較部330によって選択されたコンテンツに対して、特徴量グループ分類部510は、特徴量による同一性に応じて、コンテンツをグループ
分類し、特徴量と共にメモリ(図示せず)に格納する(ステップ501)。
In step 305, with respect to the content selected by the feature amount comparison unit 330, the feature amount group classification unit 510 classifies the content according to the identity based on the feature amount, and stores a memory (not shown) together with the feature amount. (Step 501).

次に、メタ情報取得部520が、グループのコンテンツに基づいて、メタ情報DB350、または、ネットワークを介して各々の関連メタ情報を取得してグループに関連付け、特徴量と共に当該メタ情報取得部520内のメモリ(図示せず)に格納する(ステップ502)。出力部150において、メタ情報取得部520のメモリ(図示せず)に格納されているグループに分類されたメタ情報を検索結果として、グループ分類された状態で、選択したコンテンツを表示装置40に提示する(ステップ503)。   Next, the meta information acquisition unit 520 acquires each related meta information via the meta information DB 350 or the network based on the content of the group and associates the related meta information with the group, together with the feature amount, in the meta information acquisition unit 520 Is stored in a memory (not shown) (step 502). In the output unit 150, the selected information is presented to the display device 40 in the grouped state by using the meta information classified into the group stored in the memory (not shown) of the meta information acquiring unit 520 as a search result. (Step 503).

提示の方法は、コンテンツ自体でもよいし、当該コンテンツに関連するメタ情報の中の一つもしくは全てでもよい。グループ内のコンテンツ全てを表示する場合もあるし、グループ内の代表コンテンツ1つについて表示する方法もある。   The presentation method may be the content itself or one or all of the meta information related to the content. There are cases where all the contents in the group are displayed, and there is a method of displaying one representative content in the group.

本実施の形態において、表示するコンテンツのグループの順序は、特徴量の同一性の高いコンテンツを含む順番とすることができる。図16(a)は、あるコンテンツ集団から特徴量[0001]を持つコンテンツを検索クエリとし、4つの画像コンテンツが選択された例である。特徴量は数字の値が近いほど同一性が高いものとし、高い順に「ファミリーカー」及び「大衆車」「スポーツカー」「ファミリーカー」という関連メタ情報が附属していたとする。図16(b)に示すように、特徴量が「0001」である2つのコンテンツをグループ化し、検索クエリと最も同一性の高い特徴量のコンテンツのグループから順に表示する。   In the present embodiment, the order of groups of contents to be displayed can be an order including contents with high feature quantity identity. FIG. 16A shows an example in which four image contents are selected from a certain content group using a content having a feature quantity [0001] as a search query. It is assumed that the feature quantity has the higher identity as the numerical value is closer, and associated meta information “family car”, “popular car”, “sport car”, and “family car” is attached in descending order. As shown in FIG. 16B, two contents having a feature quantity “0001” are grouped and displayed in order from a group of contents having a feature quantity having the highest identity with the search query.

本実施の形態によれば、内容の同一性が高いコンテンツグループに対して、どのようなメタ情報が附属しているかを一括して確認でき、あるコンテンツに対する統計的なメタ情報の附属度合いから、信頼性を推測することが可能である。   According to the present embodiment, it is possible to collectively check what kind of meta information is attached to a content group having high content identity, and from the degree of attachment of statistical meta information for a certain content, It is possible to infer reliability.

[第6の実施の形態]
図17は、本発明の第6の実施の形態におけるコンテンツ検索装置の構成を示す。
[Sixth Embodiment]
FIG. 17 shows the configuration of a content search apparatus according to the sixth embodiment of the present invention.

同図において、図14及び図6、図12の構成と同一構成部分には同一符号を付しその説明を省略する。   In this figure, the same components as those in FIGS. 14, 6 and 12 are designated by the same reference numerals, and the description thereof is omitted.

図17に示す構成は、第5の実施の形態の図14に示す構成に、コンテンツ特徴量抽出部210、登録部220、コンテンツ登録DB230、及び登録メタ情報取得部610を付加した構成である。   The configuration illustrated in FIG. 17 is a configuration in which a content feature amount extraction unit 210, a registration unit 220, a content registration DB 230, and a registered meta information acquisition unit 610 are added to the configuration illustrated in FIG. 14 of the fifth embodiment.

図18は、本発明の第6の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。   FIG. 18 is a flowchart of the operation of the content search apparatus in the sixth embodiment of the present invention.

コンテンツ登録DB230への登録フローは、第4の実施の形態の図13のステップ201〜204と同様であり、特徴量の同一性の高いコンテンツを選択し、選択されたコンテンツのメタ情報をメタ情報DB350から取得するステップ301〜ステップ502の処理は第5の実施の形態と同様である。   The registration flow to the content registration DB 230 is the same as that in steps 201 to 204 in FIG. 13 of the fourth embodiment. The content with high feature quantity identity is selected, and the meta information of the selected content is changed to meta information. The processing from step 301 to step 502 acquired from the DB 350 is the same as in the fifth embodiment.

その後、登録メタ情報取得部610は、メタ情報取得部520のメモリ(図示せず)に格納されている各グループのコンテンツの特徴量を取得して、当該特徴量を検索クエリとしてコンテンツ登録DB230を検索し、同一と判定されるコンテンツの登録メタ情報を取得し、当該登録メタ情報取得部610内のメモリ(図示せず)に格納する(ステップ601)。出力部150は、登録メタ情報取得部610内のメモリ(図示せず)から検索結果として登録メタ情報を取得して、グループに分類された状態で、選択したコンテンツを表示装置40に提示する(ステップ602)。提示の際には、得られた登録メタ情報をグループ毎に表示する。   Thereafter, the registered meta information acquisition unit 610 acquires the feature amount of each group of content stored in the memory (not shown) of the meta information acquisition unit 520, and uses the feature registration DB 230 as a search query. The registration meta information of the content determined to be the same is acquired and stored in a memory (not shown) in the registration meta information acquisition unit 610 (step 601). The output unit 150 acquires registered meta information as a search result from a memory (not shown) in the registered meta information acquisition unit 610, and presents the selected content on the display device 40 in a state of being classified into groups ( Step 602). At the time of presentation, the obtained registration meta information is displayed for each group.

本実施の形態において、コンテンツ登録DB230にコンテンツの利用許諾条件を記したライセンスを登録しておくことにより、これを取得し、登録フローのステップ201〜204で収集したコンテンツのメタ情報のライセンスと比較し、ライセンスの包含関係によりグループをさらに小グループに分割する。検索結果の提示の際には、小グループ毎にまとめて提示し、得られたライセンスの包含関係を表示する。また、小グループのうち、ライセンス包含関係がコンテンツ登録DB230のライセンスを満たすもののみを表示することもできる。   In the present embodiment, by registering a license in which content usage permission conditions are registered in the content registration DB 230, the license is acquired and compared with the content meta information license collected in steps 201 to 204 of the registration flow. The group is further divided into small groups according to the license inclusion relationship. When presenting the search result, it is presented together for each small group, and the inclusion relation of the obtained license is displayed. In addition, it is possible to display only the small groups whose license inclusion relation satisfies the license of the content registration DB 230.

また、本発明は、上記の第1〜第6の実施の形態における動作をプログラムとして構築し、コンテンツ検索装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることも可能である。   In the present invention, the operations in the first to sixth embodiments described above are constructed as a program, installed in a computer used as a content search device, executed, or distributed via a network. Is possible.

また、第2、第4、第6の実施の形態における登録フロー(ステップ201〜204)の動作のみをコンテンツ登録プログラムとして独立したプログラムとしてもよい。   Further, only the operation of the registration flow (steps 201 to 204) in the second, fourth, and sixth embodiments may be an independent program as a content registration program.

また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールして実行させる、または、配布することも可能である。   Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and installed in a computer to be executed or distributed.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、大量の情報から同一性の高いコンテンツを検索する技術に適用可能である。   The present invention is applicable to a technique for searching for highly identical content from a large amount of information.

本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の第1の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search apparatus in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search device in the 1st Embodiment of this invention. 本発明の第1の実施の形態における表示例を示す図である。It is a figure which shows the example of a display in the 1st Embodiment of this invention. 本発明の第2の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search device in the 2nd Embodiment of this invention. 本発明の第2の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search device in the 2nd Embodiment of this invention. 本発明の第2の実施の形態におけるコンテンツ登録DBの例である。It is an example of content registration DB in the 2nd Embodiment of this invention. 本発明の第3の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search device in the 3rd Embodiment of this invention. 本発明の第3の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search device in the 3rd Embodiment of this invention. 本発明の第3の実施の形態における表示例である。It is a display example in the 3rd Embodiment of this invention. 本発明の第4の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search device in the 4th Embodiment of this invention. 本発明の第4の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search device in the 4th Embodiment of this invention. 本発明の第5の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search device in the 5th Embodiment of this invention. 本発明の第5の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search apparatus in the 5th Embodiment of this invention. 本発明の第5の実施の形態における表示例である。It is a display example in the 5th Embodiment of this invention. 本発明の第6の実施の形態におけるコンテンツ検索装置の構成図である。It is a block diagram of the content search device in the 6th Embodiment of this invention. 本発明の第6の実施の形態におけるコンテンツ検索装置の動作のフローチャートである。It is a flowchart of operation | movement of the content search device in the 6th Embodiment of this invention.

符号の説明Explanation of symbols

10 入力装置
20 ネットワーク
30 Webサーバ
40 表示装置
100 検索装置
110 メタ情報収集手段、メタ情報収集部
120 メタ情報識別手段、メタ情報識別部
130 コンテンツ特徴量取得手段、コンテンツ特徴量取得部
140 グループ分類手段、グループ分類部
150 出力手段、出力部
160 コンテンツDB(データベース)
170 分類情報DB
210 コンテンツ特徴量抽出部
220 登録部
230 コンテンツ登録DB(データベース)
310 検索クエリ取得部
320 クエリコンテンツ特徴量取得部
330 特徴量比較部
340 メタ情報取得部
350 メタ情報DB(データベース)
410 登録メタ情報取得部
510 特徴量グループ分類部
520 メタ情報取得部
610 登録メタ情報取得部
DESCRIPTION OF SYMBOLS 10 Input apparatus 20 Network 30 Web server 40 Display apparatus 100 Search apparatus 110 Meta information collection means, meta information collection part 120 Meta information identification means, meta information identification part 130 Content feature-value acquisition means, Content feature-value acquisition part 140 Group classification means , Group classification unit 150 output means, output unit 160 content DB (database)
170 Classification information DB
210 content feature amount extraction unit 220 registration unit 230 content registration DB (database)
310 search query acquisition unit 320 query content feature amount acquisition unit 330 feature amount comparison unit 340 meta information acquisition unit 350 meta information DB (database)
410 registered meta information acquisition unit 510 feature amount group classification unit 520 meta information acquisition unit 610 registered meta information acquisition unit

Claims (18)

コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索方法であって、
メタ情報収集手段が、利用者からの検索クエリとして、コンテンツの関連メタ情報を取得すると、コンテンツ集合より前記検索クエリに該当するコンテンツの関連メタ情報を収集するメタ情報収集ステップと、
メタ情報識別手段が、前記検索クエリと収集した前記コンテンツの関連メタ情報を比較して、情報の関連性を判定し、コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBから一定の関連性を有するコンテンツを取得するメタ情報識別ステップと、
コンテンツ特徴量取得手段が、前記コンテンツDBから前記コンテンツ毎のコンテンツ特徴量を抽出するコンテンツ特徴量取得ステップと、
グループ分類手段が、前記コンテンツ特徴量取得ステップで得られた前記コンテンツ特徴量に基づいて、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツをグループ化するグループ分類ステップと、
出力手段が、前記グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力する出力ステップと、
を行うことを特徴とするコンテンツ検索方法。
A content search method for searching and presenting specific content from a content set,
When the meta information collecting means acquires the related meta information of the content as the search query from the user, the meta information collecting step of collecting the related meta information of the content corresponding to the search query from the content set;
The meta information identification unit compares the search query with the collected related meta information of the content, determines the relevance of the information, and determines from the content DB in which the related meta information of the content and the feature amount are stored in association with each other. A meta-information identifying step for acquiring content having a relevance of
A content feature amount acquiring unit that extracts a content feature amount for each content from the content DB;
Group classification in which group classification means determines the identity of the content based on the content feature amount obtained in the content feature amount acquisition step, and groups the content determined to have an identity higher than a predetermined value Steps,
An output step for outputting at least one of content and content-related meta information for each group classified in the group classification step;
The content search method characterized by performing.
前記出力ステップにおいて、
前記グループ分類ステップにより関連性が高いと判定されたコンテンツを含むグループから順に、一定のグループもしくは全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項1記載のコンテンツ検索方法。
In the output step,
In order from the group including the content determined to be highly relevant by the group classification step, for at least one of the content and the related meta information of the content for each group for a certain group or all groups,
The content search method according to claim 1.
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
前記グループ分類ステップにより同一性を有するコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
前記出力ステップにおいて、
前記グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得ステップで取得した前記登録されている関連メタ情報を出力する、
請求項1または、2記載のコンテンツ検索方法。
A content registration step of extracting a feature amount of the designated content in advance and associating the designated content and the extracted feature amount of the content with the related meta information of the input content and registering them in the content registration DB; ,
The registration meta-information acquisition step of searching the content registration DB using the feature quantity of the content having the identity by the group classification step as a search query and acquiring the registered related meta-information is further performed.
In the output step,
Outputting at least one of content and content-related meta information for each group classified in the group classification step, and simultaneously outputting the registered related meta-information acquired in the registration meta-information acquisition step;
The content search method according to claim 1 or 2.
コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索方法であって、
検索クエリ取得手段が、利用者からの検索クエリとしてコンテンツを取得する検索クエリ取得ステップと、
クエリコンテンツ特徴量取得手段が、前記検索クエリとして入力されたコンテンツの特徴量Aを抽出するクエリコンテンツ特徴量抽出ステップと、
特徴量比較手段が、コンテンツの関連メタ情報及び特徴量を関連付けて蓄積するコンテンツDBから取得したコンテンツの特徴量Bを抽出し、前記特徴量Aと該特徴量Bとを比較し、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツを取得する特徴量比較ステップと、
メタ情報取得手段が、取得した前記コンテンツに対応する該コンテンツの関連メタ情報を収集するメタ情報取得ステップと、
グループ分類手段が、前記メタ情報取得ステップで得られた前記関連メタ情報に基づいて、コンテンツの関連性を判定し、関連性が高いと判定されたコンテンツをグループ化するグループ分類ステップと、
出力手段が、前記グループ分類ステップで分類された前記グループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する出力ステップと、
を行うことを特徴とするコンテンツ検索方法。
A content search method for searching and presenting specific content from a content set,
A search query acquisition step in which a search query acquisition means acquires content as a search query from a user;
A query content feature amount acquiring unit for extracting a feature amount A of the content input as the search query;
The feature amount comparison unit extracts the feature amount B of the content acquired from the content DB in which the related meta information and the feature amount of the content are associated and stored, compares the feature amount A with the feature amount B, and the same content A feature amount comparison step for determining a gender and acquiring content determined to have a higher identity than a predetermined value;
A meta information acquisition step in which meta information acquisition means collects related meta information of the content corresponding to the acquired content;
A group classification step for determining the relevance of the content based on the related meta information obtained in the meta information acquisition step, and grouping the content determined to have high relevance;
An output step of outputting at least one of content and related meta information of the content for each of the groups classified in the group classification step;
The content search method characterized by performing.
前記出力ステップにおいて、
前記グループ分類ステップにより同一性が高いと判定されたコンテンツを含むグループから順に一定数のグループもしくは、全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項4記載のコンテンツ検索方法。
In the output step,
Outputting at least one of the content and the related meta-information of the content for each group for a certain number of groups in order from the group including the content determined to have high identity by the group classification step, or all groups;
The content search method according to claim 4.
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
前記グループ分類ステップにより同一になったコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
前記出力ステップにおいて、
前記グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得ステップで取得した前記登録されている関連メタ情報を出力する、
請求項4または、5記載のコンテンツ検索方法。
A content registration step of extracting a feature amount of the designated content in advance and associating the designated content and the extracted feature amount of the content with the related meta information of the input content and registering them in the content registration DB; ,
Further, a registration meta-information acquisition step of searching the content registration DB using the feature amount of the content made identical in the group classification step as a search query and acquiring the registered related meta-information is performed.
In the output step,
Outputting at least one of content and content-related meta information for each group classified in the group classification step, and simultaneously outputting the registered related meta-information acquired in the registration meta-information acquisition step;
The content search method according to claim 4 or 5.
前記グループ分類ステップにおいて、
一定の同一性を有するコンテンツをコンテンツ集合内より選択した後、同一性に応じてコンテンツ同士をグループ化し、
前記出力ステップにおいて、
グループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項4記載のコンテンツ検索方法。
In the group classification step,
After selecting content with a certain identity from the content set, the content is grouped according to identity,
In the output step,
For each group, output at least one of content and related meta information of the content.
5. The content search method according to claim 4.
前記出力ステップにおいて、
前記グループ分類ステップにより同一性が高いと判定されたコンテンツのグループから順に、一定数のグループもしくは全てのグループについて、グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項7記載のコンテンツ検索方法。
In the output step,
In order from the group of contents determined to have high identity by the group classification step, for at least one of the content and the related meta-information of the content for each group for a certain number of groups or all groups,
The content search method according to claim 7.
予め、前記コンテンツ同一性の判定により同一のグループになったコンテンツに対し、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録ステップと、
前記グループ分類ステップにおいて同一性を有するコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得ステップと、を更に行い、
前記出力ステップにおいて、
前記グループ分類ステップで分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得ステップで取得した前記登録されている関連メタ情報を出力する、
請求項7または、8記載のコンテンツ検索方法。
In advance, the feature quantity of the designated content is extracted from the contents in the same group by the content identity determination, and the designated content and the extracted feature quantity of the content are input. A content registration step of registering the related meta information in association with the content registration DB;
In the group classification step, a registration meta information acquisition step of searching the content registration DB using a feature amount of content having the same as a search query and acquiring the registered related meta information is performed.
In the output step,
Outputting at least one of content and content-related meta information for each group classified in the group classification step, and simultaneously outputting the registered related meta-information acquired in the registration meta-information acquisition step;
The content search method according to claim 7 or 8.
前記コンテンツ登録ステップにより前記コンテンツ登録DBに蓄積された各コンテンツの関連メタ情報中のライセンス情報(以下、登録ライセンス情報と記す)と、前記登録メタ情報取得ステップにより収集した前記関連情報メタ情報中のライセンス情報(以下、収集ライセンス情報と記す)との、許諾条件を判定するライセンス許諾判定ステップを更に行い、
前記グループ分類ステップにおいて、
前記ライセンス許諾判定ステップにより包含関係を判断してグループに分類し、
前記出力ステップにおいて、
グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項3,6、または9記載のコンテンツ検索方法。
License information (hereinafter referred to as registration license information) in the related meta information of each content accumulated in the content registration DB by the content registration step, and the related information meta information collected by the registration meta information acquisition step Further performing a license permission determination step of determining permission conditions for the license information (hereinafter referred to as collected license information);
In the group classification step,
The inclusion relationship is determined by the license permission determination step and classified into groups,
In the output step,
Outputting at least one of content and related meta information of the content for each group;
The content search method according to claim 3, 6 or 9.
前記ライセンス許諾判定ステップにより包含関係を判断するステップを更に行い、
前記出力ステップにおいて、
前記登録ライセンス情報の許諾範囲内にある収集ライセンス情報が関連付けられたコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する
請求項10記載のコンテンツ検索方法。
A step of determining an inclusion relationship in the license permission determination step;
In the output step,
The content search method according to claim 10, wherein at least one of content associated with collected license information within a licensed range of the registered license information and related meta information of the content is output.
コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索装置であって、
コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBと、
利用者からの検索クエリとして、コンテンツの関連メタ情報を取得すると、コンテンツ集合より前記検索クエリに該当するコンテンツの関連メタ情報を収集するメタ情報収集手段と、
前記検索クエリと収集した前記コンテンツの関連メタ情報を比較して、情報の関連性を判定し、一定の関連性を有するコンテンツを前記コンテンツDBから取得するメタ情報識別手段と、
前記コンテンツDBから前記コンテンツ毎のコンテンツ特徴量を抽出するコンテンツ特徴量取得手段と、
前記コンテンツ特徴量取得手段で得られた前記コンテンツ特徴量に基づいて、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツをグループ化するグループ分類手段と、
前記グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力する出力手段と、
を有することを特徴とするコンテンツ検索装置。
A content search device that searches for specific content from a content set and presents the content.
A content DB that stores content-related meta information and feature quantities in association with each other;
Meta information collection means for collecting related meta information of content as a search query from a user, and collecting related meta information of content corresponding to the search query from a content set;
Meta information identifying means for comparing the search query and related meta information of the collected content to determine the relevance of the information and acquiring content having a certain relevance from the content DB;
Content feature amount acquisition means for extracting a content feature amount for each content from the content DB;
Group classification means for determining the identity of the content based on the content feature quantity obtained by the content feature quantity acquisition means, and grouping the contents determined to have an identity higher than a predetermined value;
Output means for outputting at least one of content and content-related meta-information for each group classified by the group classification means;
A content search apparatus comprising:
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
前記グループ分類手段により同一性を有するコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
前記出力手段は、
前記グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得手段で取得した前記登録されている関連メタ情報を出力する、
請求項12記載のコンテンツ検索装置。
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
A registration meta-information acquisition unit that searches the content registration DB using the feature quantity of the content having the identity by the group classification unit as a search query and acquires the registered related meta-information;
The output means includes
Outputting at least one of the content and the related meta information of the content for each group classified by the group classification unit, and simultaneously outputting the registered related meta information acquired by the registered meta information acquisition unit;
The content search apparatus according to claim 12.
コンテンツ集合より特定コンテンツを検索し、提示するコンテンツ検索装置であって、
コンテンツの関連メタ情報及び特徴量を関連付けて蓄積しているコンテンツDBと、
利用者からの検索クエリとしてコンテンツを取得する検索取得手段と、
前記検索クエリとして入力されたコンテンツの特徴量Aを抽出するクエリコンテンツ特徴量抽出手段と、
前記コンテンツDBから取得したコンテンツの特徴量Bを抽出し、前記特徴量Aと該特徴量Bとを比較し、コンテンツの同一性を判定し、同一性が所定の値より高いと判定されたコンテンツを取得する特徴量比較手段と、
前記特徴量比較手段で取得した前記コンテンツに対応する該コンテンツの関連メタ情報を収集するメタ情報取得手段と、
前記メタ情報取得手段で得られた前記関連メタ情報に基づいて、コンテンツの関連性を判定し、関連性が高いと判定されたコンテンツをグループ化するグループ分類手段と、
前記グループ分類手段で分類された前記グループ毎に、コンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する出力手段と、
を有することを特徴とするコンテンツ検索装置。
A content search device that searches for specific content from a content set and presents the content.
A content DB that stores content-related meta information and feature quantities in association with each other;
Search acquisition means for acquiring content as a search query from a user;
Query content feature amount extraction means for extracting the feature amount A of the content input as the search query;
Content feature B obtained from the content DB is extracted, the feature A is compared with the feature B, content identity is determined, and content whose identity is determined to be higher than a predetermined value A feature amount comparison means for obtaining
Meta information acquisition means for collecting related meta information of the content corresponding to the content acquired by the feature amount comparison means;
Group classification means for determining the relevance of content based on the related meta information obtained by the meta information acquisition means, and grouping the content determined to be highly relevant;
Output means for outputting at least one of content and related meta information of the content for each group classified by the group classification means;
A content search apparatus comprising:
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
前記グループ分類手段により同一になったコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
前記出力手段は、
前記グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得手段で取得した前記登録されている関連メタ情報を出力する、
請求項14記載のコンテンツ検索装置。
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
A registration meta-information acquisition unit that searches the content registration DB using the feature amount of the content that is the same by the group classification unit as a search query, and acquires the registered related meta-information;
The output means includes
Outputting at least one of the content and the related meta information of the content for each group classified by the group classification unit, and simultaneously outputting the registered related meta information acquired by the registered meta information acquisition unit;
The content search device according to claim 14.
予め、指定されたコンテンツの特徴量を抽出し、該指定されたコンテンツ及び抽出された該コンテンツの特徴量と入力された該コンテンツの関連メタ情報を関連付けてコンテンツ登録DBに登録するコンテンツ登録手段と、
前記グループ分類手段において同一性を有するコンテンツの特徴量を検索クエリとして前記コンテンツ登録DBを検索し、登録されている関連メタ情報を取得する登録メタ情報取得手段と、を更に有し、
前記出力手段は、
前記グループ分類手段で分類されたグループ毎にコンテンツ及びコンテンツの関連メタ情報の少なくとも一方を出力すると同時に、前記登録メタ情報取得手段で取得した前記登録されている関連メタ情報を出力する、
請求項14記載のコンテンツ検索装置。
Content registration means for extracting a feature amount of designated content in advance and registering the designated content and the extracted feature amount of the content in association with the related meta information of the content in the content registration DB; ,
The group classification means further includes registered meta information acquisition means for searching the content registration DB using a characteristic amount of content having identity as a search query and acquiring registered related meta information,
The output means includes
Outputting at least one of the content and the related meta information of the content for each group classified by the group classification unit, and simultaneously outputting the registered related meta information acquired by the registered meta information acquisition unit;
The content search device according to claim 14.
前記コンテンツ登録手段により前記コンテンツ登録DBに蓄積された各コンテンツの関連メタ情報中のライセンス情報(以下、登録ライセンス情報と記す)と、前記登録メタ情報取得ステップにより収集した前記関連情報メタ情報中のライセンス情報(以下、収集ライセンス情報と記す)との、許諾条件を判定するライセンス許諾判定手段を更に有し、
前記グループ分類手段は、
前記ライセンス許諾判定手段により包含関係を判断してグループに分類し、
前記出力手段は、
グループ毎にコンテンツ及び該コンテンツの関連メタ情報の少なくともいずれか一方を出力する、
請求項13,15、または16記載のコンテンツ検索装置。
License information (hereinafter referred to as registration license information) in the related meta information of each content accumulated in the content registration DB by the content registration means, and the related information meta information collected in the registration meta information acquisition step License license determination means for determining license conditions for license information (hereinafter referred to as collected license information),
The group classification means includes:
The inclusion relationship is judged by the license permission judging means and classified into groups,
The output means includes
Outputting at least one of content and related meta information of the content for each group;
The content search device according to claim 13, 15 or 16.
コンピュータを、
請求項12乃至17記載のコンテンツ検索装置として機能させることを特徴とするコンテンツ検索プログラム。
Computer
18. A content search program that functions as the content search device according to claim 12.
JP2005362384A 2005-12-15 2005-12-15 Content retrieval method, system thereof, and program thereof Pending JP2007164633A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005362384A JP2007164633A (en) 2005-12-15 2005-12-15 Content retrieval method, system thereof, and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005362384A JP2007164633A (en) 2005-12-15 2005-12-15 Content retrieval method, system thereof, and program thereof

Publications (1)

Publication Number Publication Date
JP2007164633A true JP2007164633A (en) 2007-06-28

Family

ID=38247430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005362384A Pending JP2007164633A (en) 2005-12-15 2005-12-15 Content retrieval method, system thereof, and program thereof

Country Status (1)

Country Link
JP (1) JP2007164633A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009577A (en) * 2008-05-28 2010-01-14 Ricoh Co Ltd Information processing apparatus, full text retrieval method, full text retrieval program, and recording medium
JP2010218385A (en) * 2009-03-18 2010-09-30 Nippon Hoso Kyokai <Nhk> Content retrieval device and computer program
JP2010286861A (en) * 2009-06-09 2010-12-24 Yahoo Japan Corp Image retrieval device
JP2012242892A (en) * 2011-05-16 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> Recommendation data forming-method, recommendation data forming-device, and recommendation data forming-program
US9172936B2 (en) 2011-02-10 2015-10-27 Nec Corporation Inter-video corresponding relationship display system and inter-video corresponding relationship display method
US9473734B2 (en) 2011-02-10 2016-10-18 Nec Corporation Inter-video corresponding relationship display system and inter-video corresponding relationship display method
JP2019144818A (en) * 2018-02-20 2019-08-29 村田機械株式会社 Data management system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009577A (en) * 2008-05-28 2010-01-14 Ricoh Co Ltd Information processing apparatus, full text retrieval method, full text retrieval program, and recording medium
JP2010218385A (en) * 2009-03-18 2010-09-30 Nippon Hoso Kyokai <Nhk> Content retrieval device and computer program
JP2010286861A (en) * 2009-06-09 2010-12-24 Yahoo Japan Corp Image retrieval device
US9172936B2 (en) 2011-02-10 2015-10-27 Nec Corporation Inter-video corresponding relationship display system and inter-video corresponding relationship display method
US9473734B2 (en) 2011-02-10 2016-10-18 Nec Corporation Inter-video corresponding relationship display system and inter-video corresponding relationship display method
JP2012242892A (en) * 2011-05-16 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> Recommendation data forming-method, recommendation data forming-device, and recommendation data forming-program
JP2019144818A (en) * 2018-02-20 2019-08-29 村田機械株式会社 Data management system
JP7067109B2 (en) 2018-02-20 2022-05-16 村田機械株式会社 Data management system

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US7917514B2 (en) Visual and multi-dimensional search
US7739221B2 (en) Visual and multi-dimensional search
US7769771B2 (en) Searching a document using relevance feedback
JP5596792B2 (en) Content-based image search
JP4893243B2 (en) Image summarization method, image display device, k-tree display system, k-tree display program, and k-tree display method
RU2501078C2 (en) Ranking search results using edit distance and document information
KR101475126B1 (en) System and method of inclusion of interactive elements on a search results page
CN101364239B (en) Method for auto constructing classified catalogue and relevant system
WO2018072071A1 (en) Knowledge map building system and method
US8630972B2 (en) Providing context for web articles
US20090265631A1 (en) System and method for a user interface to navigate a collection of tags labeling content
KR100859918B1 (en) Method and apparatus for evaluating searched contents by using user feedback and providing search result by utilizing evaluation result
JP2013541793A (en) Multi-mode search query input method
US20180144059A1 (en) Animated snippets for search results
JP2007164633A (en) Content retrieval method, system thereof, and program thereof
JP2008210024A (en) Apparatus for analyzing set of documents, method for analyzing set of documents, program implementing this method, and recording medium storing this program
JP2005107688A (en) Information display method and system and information display program
KR100876214B1 (en) Apparatus and method for context aware advertising and computer readable medium processing the method
CN109933691A (en) Method, apparatus, equipment and storage medium for content retrieval
US20160117352A1 (en) Apparatus and method for supporting visualization of connection relationship
CN106294784B (en) resource searching method and device
Zaharieva et al. Retrieving Diverse Social Images at MediaEval 2017: Challenges, Dataset and Evaluation.
JP4544047B2 (en) Web image search result classification presentation method and apparatus, program, and storage medium storing program
JP2010286888A (en) Information collection system, information collection method, and program therefor