JP2010225051A - Content meta information impartment device and method thereof, and content retrieval device and method thereof - Google Patents

Content meta information impartment device and method thereof, and content retrieval device and method thereof Download PDF

Info

Publication number
JP2010225051A
JP2010225051A JP2009073862A JP2009073862A JP2010225051A JP 2010225051 A JP2010225051 A JP 2010225051A JP 2009073862 A JP2009073862 A JP 2009073862A JP 2009073862 A JP2009073862 A JP 2009073862A JP 2010225051 A JP2010225051 A JP 2010225051A
Authority
JP
Japan
Prior art keywords
content
meta information
search
information
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009073862A
Other languages
Japanese (ja)
Inventor
Yoichi Nagai
洋一 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009073862A priority Critical patent/JP2010225051A/en
Publication of JP2010225051A publication Critical patent/JP2010225051A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a content meta information impartment device allowing utilization of a situation that present retrieval is about to be done for sharing of present and future meta information. <P>SOLUTION: The content meta information impartment device includes: a content meta information holding part holding content meta information; a browsed history information holding part holding browsed history information of a content; and a dynamic content meta information impartment part reading a past history corresponding to a browsed situation from the browsed history information holding part when the prescribed past browsed situation of the content is imparted, calculating similarity between the contents in the browsed situation based on the read browsed history information, imparting the content meta information held in the content meta information holding part as the content meta information of the opposite party between the contents decided that they are similar to each other based on the similarity, or performing processing of increasing weight of the content meta information corresponding to each content according to the similarity. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、コンテンツの検索において、検索利用者の情報や検索コンテキストに応じて、コンテンツ間のメタ情報を共有するコンテンツメタ情報付与装置、その方法及びそのプログラム並びにコンテンツ検索装置、その方法及びそのプログラムに関する。   The present invention relates to a content meta information providing apparatus, a method and a program thereof, and a content search apparatus, a method and a program thereof, which share meta information between contents according to a search user's information and a search context. About.

コンピュータ等に記憶された大量の情報から必要な情報を検索するための様々な方法が存在する。一般に検索を行う際には必要な情報と関連が深いと考えられるキーワードが入力としてシステムに与えられる。一方、受け取ったキーワードを基にしてコンテンツを抽出するために、検索システムはコンテンツのインデックスを保持している。コンテンツのインデックスは、コンテンツの中身を形態素解析などの解析を行うことにより得られ、タームとして保持される。また、コンテンツのインデックスは、入力されたキーワードとの一致をチェックされることができるようになっている。検索を実行する際には、インデックス内のタームが、入力されたキーワードと一致するコンテンツが抽出される。   There are various methods for retrieving necessary information from a large amount of information stored in a computer or the like. In general, when performing a search, a keyword that is considered to be closely related to necessary information is given to the system as an input. On the other hand, in order to extract content based on the received keyword, the search system holds a content index. The content index is obtained by performing analysis such as morphological analysis on the content, and is retained as a term. The content index can be checked for a match with the input keyword. When executing the search, contents whose terms in the index match the input keyword are extracted.

コンテンツのインデックス内に保持されるタームは、コンテンツの中身の解析により付与される場合もある。しかし、コンテンツの作成者が与えたコンテンツの内容を示すメタ情報がタームとして利用される場合もある。メタ情報の意味はコンテンツの作成者により付与されているため、メタ情報は、コンテンツの内容を示す意味の含有度が高く、このメタ情報を検索に用いることにより、より高精度な検索が行われている(特許文献1参照)。   The term held in the content index may be given by analyzing the content. However, there is a case where meta information indicating the content content provided by the content creator is used as a term. Since the meaning of the meta information is given by the creator of the content, the meta information has a high content of meaning indicating the contents of the content, and by using this meta information for the search, a more accurate search is performed. (See Patent Document 1).

メタ情報の利用は、コンテンツに対応したメタ情報が存在することが前提となっている。しかし、人手によりコンテンツにメタ情報を付与することは、一般にコストが高く、コンテンツに対応したメタ情報が無い場合も少なくない。   The use of meta information is premised on the existence of meta information corresponding to content. However, it is generally expensive to manually add meta information to content, and there are many cases where there is no meta information corresponding to the content.

対応するメタ情報が存在するコンテンツと、対応するメタ情報が無いコンテンツとの間でメタ情報の共有を図ることにより、上記の問題を解決する手法として、コンテンツの閲覧された履歴情報を用いて協調フィルタリングを行う手法が提案されている(特許文献2参照)。   As a technique to solve the above problem by sharing meta information between content that has corresponding meta information and content that does not have corresponding meta information, collaborate using history information that has been browsed. A technique for performing filtering has been proposed (see Patent Document 2).

特開2002−334257号公報JP 2002-334257 A 特開2003−316824号公報JP 2003-316824 A

しかし、特許文献2で用いられている協調フィルタリングの手法では、過去全てのコンテンツ被閲覧履歴を用いることになるため、現在の検索が行われようとしている状況が現在及び将来のメタ情報の共有に活かされず、メタ情報による検索の結果が検索条件や検索時の状態を反映したものにならない。   However, in the collaborative filtering method used in Patent Document 2, all the content browsing history is used, so that the current search is being performed in sharing the current and future meta information. The search result based on the meta information does not reflect the search condition and the state at the time of the search.

そこで、本発明は、現在の検索が行われようとしている状況を現在及び将来のメタ情報の共有に活かし、メタ情報による検索の結果が検索条件や検索時の状態を反映したものになるようなことを可能にするコンテンツメタ情報付与装置、その方法及びそのプログラム並びにコンテンツ検索装置、その方法及びそのプログラムを提供することを目的とする。   Therefore, the present invention utilizes the situation where the current search is about to be performed for sharing the current and future meta information, and the search result based on the meta information reflects the search condition and the state at the time of the search. It is an object of the present invention to provide a content meta information assigning device, a method and a program thereof, and a content search device, a method and a program thereof.

本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、を備えることを特徴とするコンテンツメタ情報付与装置が提供される。   According to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, When a predetermined past browsing situation is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and based on the read browsing history information read, The degree of similarity between contents is calculated, and the contents meta information held in the contents meta information holding unit among the contents determined to be similar to each other based on the degree of similarity A dynamic code that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity or given as content meta information. Content meta information providing device, characterized in that it comprises a Tentsumeta information adding unit, is provided.

また、本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、を備えるコンテンツメタ情報付与装置におけるコンテンツメタ情報付与方法であって、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与ステップを備えることを特徴とするコンテンツメタ情報付与方法が提供される。   Further, according to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, In the content meta-information providing method in the content meta-information providing apparatus comprising: when a predetermined past browsing situation of the content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit Based on the read history information that has been read and read, the similarity between the contents in the browsed state is calculated, and the content determined to be similar to each other based on the similarity Each content meta information held in the meta information holding unit is assigned as the content meta information of each partner, or similar Content meta information attaching method characterized by comprising a dynamic content meta information adding step of increasing processing weight for the content meta information corresponding to each content according to is provided.

更に、本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、を備えることを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラムが提供される。   Furthermore, according to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A process of giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity is performed. Program for causing a computer is provided as the content meta information providing device, characterized in that it comprises a specific content meta information adding unit.

本発明によれば、現在の検索が行われようとしている状況を現在及び将来のメタ情報の共有に活かし、メタ情報による検索の結果が検索条件や検索時の状態を反映したものになるようなことが可能となる。   According to the present invention, the current search is performed for sharing current and future meta information, and the search result based on the meta information reflects the search condition and the state at the time of the search. It becomes possible.

本発明の実施形態によるコンテンツ検索装置の構成を示すブロック図である。It is a block diagram which shows the structure of the content search device by embodiment of this invention. 図1に示すコンテンツメタ情報保持部に保存されているデータの1例を示す図である。It is a figure which shows an example of the data preserve | saved at the content meta information holding | maintenance part shown in FIG. 図1に示す被閲覧履歴情報保持部に保存されているデータの1例を示す図である。It is a figure which shows an example of the data preserve | saved in the browsing history information holding | maintenance part shown in FIG. 本発明の実施例1によるコンテンツ検索装置の構成を示すブロック図である。It is a block diagram which shows the structure of the content search apparatus by Example 1 of this invention. 本発明の実施例1によるコンテンツ検索装置の動作を示すシーケンス図である。It is a sequence diagram which shows operation | movement of the content search apparatus by Example 1 of this invention. 本発明の実施例2によるコンテンツ検索装置の構成を示すブロック図である。It is a block diagram which shows the structure of the content search apparatus by Example 2 of this invention. 図6に示す一時コンテンツメタ情報保持部に保持されているデータの1例を示す図である。It is a figure which shows an example of the data currently hold | maintained at the temporary content meta-information holding part shown in FIG. 本発明の実施例2によるコンテンツ検索装置の動作を示すシーケンス図である。It is a sequence diagram which shows operation | movement of the content search apparatus by Example 2 of this invention. 本発明の実施例1及び2における類似コンテンツ情報の1例を示す図である。It is a figure which shows an example of the similar content information in Example 1 and 2 of this invention.

以下、図面を参照して本発明を実施するための最良の形態について詳細に説明する。   The best mode for carrying out the present invention will be described below in detail with reference to the drawings.

本発明のシステムの構成図を、図1に示す。本発明のシステムは、コンテンツメタ情報保持部101、コンテンツ間類似度保持部103、被閲覧履歴情報保持部105、検索インタフェース部107、検索部109、動的コンテンツメタ情報付与部111、静的コンテンツ間類似度算出部113、静的コンテンツメタ情報付与部115及び制御部117を含む。   A block diagram of the system of the present invention is shown in FIG. The system of the present invention includes a content meta information holding unit 101, an inter-content similarity holding unit 103, a browsed history information holding unit 105, a search interface unit 107, a search unit 109, a dynamic content meta information adding unit 111, a static content It includes an inter-similarity calculation unit 113, a static content meta information adding unit 115, and a control unit 117.

検索インタフェース部107は、コンテンツを検索するための検索条件(検索キーワード、検索キーワードを結合する論理式、絞り込み条件(コンテンツの、拡張子、生成日時、作成者、カテゴリ、タグ)など)を入力し、入力した検索条件を制御部117に渡す入力部107−1と、制御部117から受け取った検索結果を表示する出力部107−2を含む。   The search interface unit 107 inputs search conditions (search keyword, logical expression for combining search keywords, narrowing conditions (content extension, creation date, creator, category, tag, etc.)) for searching for content. , An input unit 107-1 for passing the input search condition to the control unit 117, and an output unit 107-2 for displaying the search result received from the control unit 117.

なお、図1に示すシステムは、ハードウェアによって実現することも出来るが、コンピュータを図1に示すシステムとして機能させるためのプログラムをコンピュータが読み込んで実行することによって実現することもできる。   The system shown in FIG. 1 can be realized by hardware, but can also be realized by the computer reading and executing a program for causing the computer to function as the system shown in FIG.

コンテンツメタ情報保持部101は、コンテンツの検索時に検索時に検索の索引として利用され、そこでキーワードと一致する読み出されたメタ情報の重みがコンテンツの順序付け(ソート)に利用される。   The content meta information holding unit 101 is used as a search index when searching for content, and the weight of the read meta information that matches the keyword is used for ordering (sorting) the content.

被閲覧履歴情報保持部105は、本システムが提供するコンテンツが本システムの利用者により閲覧されたことにより得られる被履歴情報を保持する。つまり、被閲覧履歴情報保持部105は、コンテンツ毎に、そのコンテンツが検索にヒットしたときの検索条件、検索者メタ情報(役職、所属部署など)ごとの、閲覧の有意度(閲覧の有無)の割合を保持する。   The browsing history information holding unit 105 holds history information obtained by browsing the content provided by the system by a user of the system. In other words, the browsed history information holding unit 105 searches for each content, the search condition when the content hits the search, and the significance of browsing (whether browsing is performed) for each searcher meta information (title, department, etc.). Keep the percentage of.

静的コンテンツ間類似度算出部113は、被閲覧履歴保持部105が保持する情報に基づいてコンテンツ間の類似度を求める。   The static content similarity calculation unit 113 obtains the similarity between the contents based on the information held by the browse history holding unit 105.

コンテンツ間類似度保持部103は、静的コンテンツ間類似度算出部113で求めたコンテンツ間の類似度を保持する。   The inter-content similarity holding unit 103 holds the inter-content similarity calculated by the static content similarity calculating unit 113.

静的コンテンツメタ情報付与部115は、コンテンツ間類似度保持部103が保持する情報とコンテンツメタ情報保持部101が保持する情報に基づいて、似通ったコンテンツ間でメタ情報を共有するための処理を行う。   The static content meta information adding unit 115 performs processing for sharing meta information between similar contents based on the information held by the inter-content similarity holding unit 103 and the information held by the content meta information holding unit 101. Do.

静的コンテンツメタ情報付与部115は、コンテンツメタ情報保持部101のメタ情報をオフライン(検索実行時ではないバッチでの処理)で更新する際に用いることを想定している。被閲覧履歴情報保持部105で情報がすでに蓄積されているものの、コンテンツ間類似度保持部103とコンテンツメタ情報保持部101に、まだデータが保持されていない場合に、静的コンテンツメタ情報付与部115と静的コンテンツ間類似度算出部113を用いてコンテンツメタ情報保持部101で保持されるメタ情報を更新する。静的コンテンツメタ情報付与部115と静的コンテンツ間類似度算出部113は本実施形態のシステムを開始する時に、システム管理者が起動します。動的コンテンツメタ情報付与部111がその検索メタ情報(検索者メタ情報、コンテキスト情報(検索時の時間と場所など)など)と一致する状況での履歴を用いるのに対し、静的コンテンツメタ情報付与部115は、全ての履歴を用いてコンテンツメタ情報保持部101で保持されるデータを更新する。静的コンテンツ間類似度算出部113はその際に静的コンテンツメタ情報付与部115から呼ばれるが、動的コンテンツメタ情報付与部111からも呼ばれる。静的コンテンツメタ情報付与部115は一旦システムが稼動してしまえば使われることも無くなる。   The static content meta information adding unit 115 is assumed to be used when updating the meta information of the content meta information holding unit 101 offline (processing in a batch not at the time of search execution). When information is already stored in the browsing history information holding unit 105, but the data is not yet held in the content similarity holding unit 103 and the content meta information holding unit 101, the static content meta information adding unit 115 and the static content similarity calculation unit 113 are used to update the meta information held in the content meta information holding unit 101. The static content meta information adding unit 115 and the static content similarity calculating unit 113 are activated by the system administrator when starting the system of this embodiment. Whereas the dynamic content meta-information adding unit 111 uses a history in a situation that matches the search meta-information (searcher meta-information, context information (such as time and place at the time of search)), static content meta-information The granting unit 115 updates the data held in the content meta information holding unit 101 using all the histories. The static content similarity calculation unit 113 is called from the static content meta information adding unit 115 at that time, but is also called from the dynamic content meta information adding unit 111. The static content meta information adding unit 115 is not used once the system is in operation.

動的コンテンツメタ情報付与部111は、検索利用時の検索条件や検索メタ情報と一致する過去の履歴の部分で、お互いが近いコンテンツを被閲覧履歴情報保持部105から抽出する。また、動的コンテンツメタ情報付与部111は、コンテンツ間類似度保持部103に保持されているコンテンツ間の類似度に加えて、抽出したコンテンツ間の類似度をさらに強化したコンテンツ間類似度を求め、コンテンツ間類似度が強化されたコンテンツ間で、強化された程度に応じてコンテンツメタ情報保持部101にあるメタ情報の値を更新する。   The dynamic content meta-information adding unit 111 extracts, from the browsed history information holding unit 105, contents that are close to each other in the past history part that matches the search condition and search meta information when using the search. Further, the dynamic content meta information adding unit 111 obtains the inter-content similarity that further enhances the similarity between the extracted contents in addition to the similarity between the contents held in the inter-content similarity holding unit 103. The value of the meta information in the content meta information holding unit 101 is updated according to the degree of enhancement between the contents whose inter-content similarity is enhanced.

検索部109は、検索インタフェース部107が取得した検索条件に含まれるキーワードから該当するコンテンツを取得して適切な順序に並び替える。   The search unit 109 acquires corresponding content from the keywords included in the search conditions acquired by the search interface unit 107 and rearranges them in an appropriate order.

本実施形態のコンテンツメタ情報保持部101には、図2に示すように、各コンテンツ毎に、URLなどのそのコンテンツのIDと、そのコンテンツの属性等の性質を表すメタ情報群が保持されている。   As shown in FIG. 2, the content meta information holding unit 101 according to the present embodiment holds a meta information group indicating the ID of the content such as a URL and a property such as the attribute of the content for each content. Yes.

本実施形態の被閲覧履歴情報保持部105には、図3に示すように、検索メタ情報と、コンテンツとにより形成されるマトリックスが、検索に関する各メタ項目毎に用意される。マトリックスには検索時の各メタ項目における条件において、各ドキュメントが検索者にとって必要だったかを示す値が入る。この例ではドキュメントが閲覧されたか、されなかったか、の2値でマトリックスを表している。従って、この例では、このマトリックス内の値が各ドキュメントが検索者にとって必要だったかを示す値である。   In the browse history information holding unit 105 of this embodiment, as shown in FIG. 3, a matrix formed by search meta information and content is prepared for each meta item related to search. In the matrix, a value indicating whether each document is necessary for the searcher in the condition of each meta item at the time of search is entered. In this example, the matrix is represented by a binary value indicating whether the document is viewed or not. Thus, in this example, the values in this matrix are values that indicate whether each document was needed by the searcher.

図3のマトリックス内の値は閲覧の有意度であるが、閲覧数を有意度をとした場合は、図3の表内の値は1、2、3…と増えていくことになる。これらの値は、0〜1の間で正規化される。正規化することによって、類似度を求める際に検索メタ情報の項目での履歴のたまり具合の差の影響を軽微化できるメリットがある。正規化する際は、被閲覧履歴情報保持部105において、検索メタ情報の項目ごとに、その項目における全てのコンテンツの有意度(この場合閲覧数)の最大値と最小値がそれぞれ1と0になるように調整します。具体的には、
正規化後の有意度=(正規化前の有意度−その項目における全コンテンツの最小値)÷(その項目における全コンテンツの最大値−その項目における全コンテンツの最小値))
などの式を用いる方法が考えられます。正規化を行うとすると、あらかじめ正規化するのは被閲覧履歴情報保持部105が更新されるタイミングにバッチで正規化しておくか、検索実行時に走査する検索メタ情報の項目ごとにその都度正規化をする。
The values in the matrix of FIG. 3 are the significance of browsing, but when the number of browsing is regarded as the significance, the values in the table of FIG. These values are normalized between 0 and 1. By normalizing, there is a merit that the influence of the difference in the accumulation state of the history in the item of the search meta information can be minimized when the similarity is obtained. When normalization is performed, in the browsed history information holding unit 105, for each item of the search meta information, the maximum value and the minimum value of the significance (in this case, the number of browsing) of all contents in the item are set to 1 and 0, respectively. Adjust so that In particular,
Significance after normalization = (Significance before normalization-Minimum value of all content in the item) / (Maximum value of all content in the item-Minimum value of all content in the item))
A method using an expression such as If normalization is performed, normalization is performed in advance in batches at the timing when the browsing history information holding unit 105 is updated, or normalized for each item of search meta information scanned at the time of search execution. do.

有意度としては他に、これまで検索結果にヒットした回数のうち実際にアクセスされた割合を考えることもできるが、その場合、マトリックス内には閲覧数のほかに、検索にヒットした回数、の2つの値が必要になる。この場合、コンテンツの検索にヒットした回数、ヒットしたコンテンツが閲覧された回数の履歴情報は外部から与えられるものと想定される。   In addition to the number of hits in the search results so far, you can also consider the percentage of actual accesses, but in that case, in the matrix, in addition to the number of views, the number of hits in the search Two values are required. In this case, it is assumed that the history information of the number of times the content search has been hit and the number of times the hit content has been browsed is given from the outside.

本実施形態の静的コンテンツ間類似度算出部113は、被閲覧履歴情報保持部105から検索メタ情報毎にコンテンツとその有意値のセットを取得し、それらの情報を用いて、最多で全てのコンテンツ間の類似度を算出する。類似度の算出方法としては被閲覧履歴情報保持部105におけるコンテンツの検索メタ情報ごとの有意値をコンテンツの特徴量ベクトルとし、ベクトル間の類似度(例えば、ベクトルの内積)を求める既存技術を用いる。算出したコンテンツ間の類似度はコンテンツ間類似度保持部103に保持される。   The similarity calculation part 113 between static contents of this embodiment acquires the set of content and its significant value for every search meta information from the browsing history information holding | maintenance part 105, and uses that information, and most is all. The similarity between contents is calculated. As a method of calculating the similarity, an existing technique for obtaining a similarity between vectors (for example, an inner product of vectors) using a significant value for each content search meta information in the browse history information holding unit 105 as a feature vector of the content is used. . The calculated similarity between contents is held in the content similarity holding unit 103.

本実施形態のコンテンツ間類似度保持部103は、静的コンテンツ間類似度算出部113により算出されたコンテンツ間の類似度を保持し、必要に応じてそれらの情報を渡す機能を有する情報保持部である。   An inter-content similarity holding unit 103 according to the present embodiment holds an inter-content similarity calculated by the static inter-content similarity calculating unit 113 and has a function of passing the information as necessary. It is.

本実施形態の静的コンテンツメタ情報付与部115や動的コンテンツメタ情報付与部111は、コンテンツ間類似度保持部103からコンテンツ間の類似度を読み込み、コンテンツ間の類似度が或る閾値よりも大きい場合に、コンテンツメタ情報保持部101に、コンテンツがお互いに持つメタ情報を類似度に応じて共有させる。   The static content meta information adding unit 115 and the dynamic content meta information adding unit 111 according to the present embodiment read the similarity between the contents from the inter-content similarity holding unit 103, and the similarity between the contents is below a certain threshold. If it is larger, the content meta information holding unit 101 is made to share the meta information held by the contents according to the similarity.

本実施形態の動的コンテンツメタ情報付与部111は、検索時に利用者から取得した検索メタ情報をキーとして、被閲覧履歴情報保持部105から、コンテンツ毎にキーと一致する検索メタ情報についての図3に示すような値(検索メタ情報の名前とコンテンツとの関連度(検索メタ情報が現れた時にどれほどの割合でコンテンツが閲覧されたかを表すなど、被閲覧履歴により検索メタ情報とコンテンツとの関連を表す情報))を取得する。取得した値を元に、キーとなる検索メタ情報が利用される場合において類似するコンテンツセット(2つのコンテンツ)を取捨選択する。例えば、あるコンテンツ間で、全ての被閲覧履歴を見るとそれほど似ていなくても、「携帯」というキーワードで検索された時は似通った閲覧をされるコンテンツがある。ここではそうした特定の検索条件における被閲覧履歴情報の類似傾向を調べる。類似していることが判別されたコンテンツセットに対しては、コンテンツ間類似度保持部103から取得したコンテンツ間のコンテンツ類似度を強化した値を取得する。類似度が強化されたコンテンツセットに対して、コンテンツメタ情報保持部101を参照し、そのコンテンツ間で共有されるコンテンツメタ情報を、強化された類似度に応じて強化させる。   The dynamic content meta information adding unit 111 according to the present embodiment is a diagram regarding search meta information that matches the key for each content from the browsed history information holding unit 105 using the search meta information acquired from the user at the time of search as a key. The value shown in FIG. 3 (relationship between the name of the search meta information and the content (representing the rate at which the content is browsed when the search meta information appears, etc. Acquire information indicating association)). Based on the acquired value, similar content sets (two contents) are selected when search meta-information as a key is used. For example, there is a content that is viewed similarly when searched by the keyword “mobile phone” even if the browsing history is not very similar between certain contents. Here, the similarity tendency of the browsing history information under such a specific search condition is examined. For content sets determined to be similar, a value obtained by enhancing the content similarity between contents acquired from the inter-content similarity holding unit 103 is acquired. The content meta information holding unit 101 is referred to the content set with the enhanced similarity, and the content meta information shared between the contents is enhanced according to the enhanced similarity.

コンテンツ間の類似度は1つの数値で表される。類似度を算出する際に、キーとなるコンテンツメタ情報毎の数値(つまり複数の値)を利用する。例としては、キーとなるコンテンツメタ情報の項目が図3において(検索キーワード=SI、検索者役職=課長、検索者所属部署=営業部)で、差異の閾値を各検索メタ情報項目の平均値からの距離の平均とした場合、「SI」の項の閾値は(|(2/3)−1|+|(2/3)−0|+|(2/3)−1|)/3=4/9、同様にして「課長」の項の閾値は4/9、「営業部」の項の閾値は0になる。文書Aと文書Bとの類似度は(両者のメタ項目の値の差がそのメタ項目の閾値以下の数/比較するメタ項目の数)=1/3=0.33になる。文書Aと文書Cの類似度は(3/3)=1となる。   The similarity between contents is represented by one numerical value. When calculating the similarity, a numerical value (that is, a plurality of values) for each content meta information as a key is used. As an example, the item of content meta information as a key is the search keyword = SI, searcher title = section manager, searcher affiliation department = sales department in FIG. 3, and the difference threshold is the average value of each search meta information item. When the average of the distance from the threshold is used, the threshold value of the term “SI” is (| (2/3) −1 | + | (2/3) −0 | + | (2/3) −1 |) / 3 = 4/9, similarly, the threshold of the section “section manager” is 4/9, and the threshold of the section “sales department” is 0. The similarity between the document A and the document B is (number difference between the meta items is equal to or less than the threshold of the meta item / number of meta items to be compared) = 1/3 = 0.33. The similarity between document A and document C is (3/3) = 1.

実施例1における必要最低限のモジュールによる検索システムについての構成例についての説明を行う。   A configuration example of the search system using the minimum necessary modules in the first embodiment will be described.

図4は実施例1の構成ブロック図である。実施例1による検索システム201は、検索インタフェース部107、制御部117と、検索部109と、コンテンツメタ情報保持部101と、被閲覧履歴情報保持部105と、動的コンテンツメタ情報付与部111を含む。   FIG. 4 is a configuration block diagram of the first embodiment. The search system 201 according to the first embodiment includes a search interface unit 107, a control unit 117, a search unit 109, a content meta information holding unit 101, a browsed history information holding unit 105, and a dynamic content meta information adding unit 111. Including.

検索インタフェース部107は、実施形態のものと同様なものである。   The search interface unit 107 is the same as that of the embodiment.

制御部117は、検索システム201の利用者によって入力される検索条件及び利用者の所属部署や役職などの利用者メタ情報を取得する部分を有し、取得した検索条件及び利用者メタ情報を動的コンテンツメタ情報付与部111に渡す。そして、制御部117は、動的コンテンツメタ情報付与部111からコンテンツメタ情報が更新された通知を受けると、検索部109に、検索要求として、利用者によって入力された検索条件を送る。そして検索部109から返って来た検索結果を利用者に渡す。   The control unit 117 has a part for acquiring search conditions input by a user of the search system 201 and user meta information such as a user's department and job title, and moves the acquired search conditions and user meta information. To the content meta information adding unit 111. Then, when receiving the notification that the content meta information has been updated from the dynamic content meta information adding unit 111, the control unit 117 sends the search condition input by the user as a search request to the search unit 109. The search result returned from the search unit 109 is passed to the user.

利用者メタ情報は外部ネットワークから与えられると想定している。利用者メタ情報を取得するために必要な装置としては、利用者の個人情報を取得するための「認証システム」が必要になる。   It is assumed that user meta information is given from an external network. As an apparatus necessary for acquiring user meta information, an “authentication system” for acquiring user personal information is required.

検索部109は、サーチコア部109−1とスコアリング部109−3を含む。   The search unit 109 includes a search core unit 109-1 and a scoring unit 109-3.

サーチコア部109−1は、コンテンツメタ情報保持部101にアクセスし、制御部117が上記の動作で取得した取得した検索条件と一致するコンテンツメタ情報を持つコンテンツを取得し、同時にコンテンツ毎に、キーワードと一致したメタ情報群の重みの和を取得する。   The search core unit 109-1 accesses the content meta information holding unit 101, acquires content having content meta information that matches the acquired search condition acquired by the control unit 117 in the above operation, and at the same time, for each content, Get the sum of the weights of the meta information group that matches the keyword.

スコアリング部109−3は、サーチコア部109−1で取得したコンテンツに対して、メタ情報群の重みを基準にソートして、ソート後のコンテンツを制御部117に渡す。   The scoring unit 109-3 sorts the content acquired by the search core unit 109-1 with reference to the weight of the meta information group, and passes the sorted content to the control unit 117.

コンテンツメタ情報保持部101は、コンテンツの属性を表すメタ情報を保持する記憶部である。各コンテンツは複数のメタ情報を有する(メタ情報を持たない場合もある)。メタ情報はメタ項目に加え、メタ項目とその値の組み合わせや、さらにその組み合わせに対してそれぞれ重みを持つ構成などがありうる。コンテンツメタ情報保持部101で保持されるメタ情報の構成例を図2に示す。   The content meta information holding unit 101 is a storage unit that holds meta information representing content attributes. Each content has a plurality of pieces of meta information (may not have meta information). In addition to meta items, meta information may include a combination of meta items and their values, and a configuration having weights for the combinations. An example of the configuration of the meta information held by the content meta information holding unit 101 is shown in FIG.

被閲覧履歴情報保持部105は、本検索システムによって提示されたコンテンツが利用者に対して有意だったかどうかを示す値(有効値)が、コンテンツ毎に保持される。値としては単純に利用者がそのコンテンツを見たかどうかを示す0か1の2値などもありうる。また、値としては閲覧対象のページに「参考になった」「参考にならなかった」などのボタンが設置されている場合などは、どちらを押したかの割合を採用しても良い。上記の有効値はコンテンツ毎に保持される一方、検索条件毎や、所属部署や役職などの利用者のメタ情報毎にも分類される。   The browsing history information holding unit 105 holds, for each content, a value (valid value) indicating whether the content presented by the search system is significant to the user. The value may be a binary value of 0 or 1 that simply indicates whether the user has viewed the content. In addition, as a value, when a button such as “not helpful” or “not helpful” is installed on the page to be browsed, the ratio of which button is pressed may be adopted. While the above effective values are held for each content, they are also classified for each search condition and for each meta information of a user such as a department or job title.

被閲覧履歴情報保持部105に保持されるデータの構成例を図3に示す。   An example of the structure of data held in the browse history information holding unit 105 is shown in FIG.

動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1、動的コンテンツ間メタ情報付与コア部111−3を含む。   The dynamic content meta information addition unit 111 includes a dynamic content similarity calculation unit 111-1 and a dynamic content meta information addition core unit 111-3.

動的コンテンツ間類似度算出部111−1は、被閲覧履歴情報保持部105で保持されている履歴のうち、動的コンテンツメタ情報付与部111から与えられたキーワードと利用者メタ情報の項目において、コンテンツ間で持つ有意度の数における、その有意度の差が予め定められた有効値閾値以下であった項目数の割合を、類似度として算出して返す。   The dynamic content similarity calculation unit 111-1 includes the keyword and user meta information items provided from the dynamic content meta information adding unit 111 in the history held by the browsed history information holding unit 105. The ratio of the number of items in which the difference in significance is equal to or less than a predetermined effective value threshold in the number of significance levels between contents is calculated and returned.

動的コンテンツ間類似度算出部111−1は、検索メタ情報を受け取った後、まず被閲覧履歴情報保持部105にアクセスし、全ての一対のコンテンツを走査する。走査の際にはコンテンツが持つコンテンツメタ情報で、受け取ったコンテンツメタ情報と一致する部分において、どれだけ被閲覧履歴が類似しているかを調べて数値化する。   After receiving the search meta information, the dynamic content similarity calculation unit 111-1 first accesses the browsed history information holding unit 105 and scans all the pairs of contents. At the time of scanning, it is digitized by examining how much the browsing history is similar in the content meta information of the content that matches the received content meta information.

図1の静的コンテンツ間類似度算出部113が予め全ての2つのコンテンツを走査して、全てのコンテンツ間の類似度を計算するのに対し、動的コンテンツ間類似度算出部111−1は、制御部から117から与えられた検索キーワードと検索メタ情報を有するコンテンツ間のみの類似度を計算する。   While the static content similarity calculation unit 113 in FIG. 1 scans all the two contents in advance and calculates the similarity between all the contents, the dynamic content similarity calculation unit 111-1 The similarity between only the search keyword given from the control unit 117 and the content having the search meta information is calculated.

動的コンテンツ間メタ情報付与コア部111−3は、動的コンテンツメタ情報付与部111より与えられた類似コンテンツ情報(図9を参照)を参照する部分を持つ。参照した前記類似コンテンツ情報に含まれる項目(2つのコンテンツURLと重み(類似度))の全てに対して、前記項目内のコンテンツURLを持つコンテンツのメタ情報をコンテンツメタ情報保持部101から参照する。参照したペアのコンテンツのメタ情報に対して、ペアの片方が持つメタ情報のメタ項目の値を、そのメタ項目の重みと前記項目で参照した重み(類似度)を掛け合わせた数値を、相対するメタ情報に加える(相対するメタ情報に加えようとしたメタ項目の値が無い場合はそのメタ項目の値を新たに加え、重みとして先に掛け合わせて算出した数値をセットする)。これをペアのコンテンツのお互いに対して行うことで、これらコンテンツのメタ情報を更新する。更新されたメタ情報はコンテンツメタ情報保持部101に更新される。   The dynamic content meta-information adding core unit 111-3 has a portion that refers to the similar content information (see FIG. 9) provided by the dynamic content meta-information adding unit 111. For all items (two content URLs and weight (similarity)) included in the referenced similar content information, the content meta information holding unit 101 refers to the meta information of the content having the content URL in the item. . Relative to the meta information of the content of the referenced pair, the value of the meta information of the meta information that one of the pair has is multiplied by the weight of the meta item and the weight (similarity) referenced in the item. (If there is no value of the meta item to be added to the opposite meta information, the value of the meta item is newly added, and the numerical value calculated by multiplying the weight is set first). By performing this for each of the paired contents, the meta information of these contents is updated. The updated meta information is updated to the content meta information holding unit 101.

次に動作について説明する。   Next, the operation will be described.

図5は第1の実施形態の処理の例を示すシーケンス図である。   FIG. 5 is a sequence diagram illustrating an example of processing according to the first embodiment.

まず、検索要求を取得した制御部117が、取得した検索条件と検索メタ情報を送ると共にコンテンツメタ情報の更新要求を動的コンテンツメタ情報付与部111に対して送る(ステップS301)。   First, the control unit 117 that has acquired the search request transmits the acquired search condition and the search meta information, and also transmits a content meta information update request to the dynamic content meta information adding unit 111 (step S301).

それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1に対してコンテンツ間の類似度を算出することを要求する(ステップS302)。ここで、類似度算出の対象となるコンテンツは、制御部117が受け取った検索条件とメタ情報を含むコンテンツと全てのコンテンツの組み合わせとなります。   Receiving this, the dynamic content meta information adding unit 111 requests the dynamic content similarity calculation unit 111-1 to calculate the similarity between the contents (step S302). Here, the content for which the similarity is calculated is a combination of the content including the search condition and meta information received by the control unit 117 and all the content.

類似度算出要求を受け取った動的コンテンツ間類似度算出部111−1は被閲覧履歴保持部105からコンテンツの被閲覧履歴情報を取得し(ステップS303、S304)、コンテンツ間の類似度情報を算出して、動的コンテンツメタ情報付与部111に返す(ステップS305)。   Upon receiving the similarity calculation request, the dynamic content similarity calculation unit 111-1 acquires content browsing history information from the browsing history holding unit 105 (steps S 303 and S 304), and calculates similarity information between the content. Then, it returns to the dynamic content meta information adding unit 111 (step S305).

それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間メタ情報付与コア部111−3に、取得したコンテンツ間の類似度を渡す(ステップS306)。   Receiving it, the dynamic content meta information adding unit 111 passes the similarity between the acquired contents to the dynamic content meta information adding core unit 111-3 (step S306).

コンテンツ間の類似度情報を受け取った動的コンテンツ間メタ情報付与コア部111−3は、コンテンツメタ情報保持部101のメタ情報を一部書き換える(ステップS307、S308、S309)。   The dynamic content meta-information adding core unit 111-3 that receives the similarity information between the contents rewrites part of the meta information of the content meta-information holding unit 101 (steps S307, S308, and S309).

メタ情報を書き換えた後に、動的コンテンツメタ情報付与部111は、処理が終了したことを呼び出し元の制御部117に伝える(ステップS310)。   After rewriting the meta information, the dynamic content meta information adding unit 111 notifies the calling source control unit 117 that the processing has been completed (step S310).

処理が終了したことを伝えられた制御部117は、検索部109に対して、検索条件と共に検索を依頼する(ステップS311)。   The control unit 117 notified of the completion of the process requests the search unit 109 to perform a search together with the search condition (step S311).

検索依頼された検索部109はサーチコア部109−1に対して検索を依頼し(ステップS312)、サーチコア部109−1は、キーワードとインデックス内のタームが一致するコンテンツ及びメタ項目の値の重みの総和をコンテンツメタ情報保持部10から抽出して、検索部109に渡す(ステップS313、S314、S315)。抽出したコンテンツを受け取った検索部109はスコアリング部109−3に受け取ったコンテンツを渡す(ステップS316)。   The requested search unit 109 requests the search core unit 109-1 to perform a search (step S312), and the search core unit 109-1 determines the content of the keyword and the term in the index and the value of the meta item. The sum of the weights is extracted from the content meta information holding unit 10 and passed to the search unit 109 (steps S313, S314, and S315). Receiving the extracted content, the search unit 109 passes the received content to the scoring unit 109-3 (step S316).

スコアリング部109−3は、検索結果(抽出されたコンテンツの、タイトル、URLなど)の並び替えを行い、その結果得た検索結果を検索部109に返し(ステップS316)、検索部109は、検索結果を、検索システム利用者に返す(ステップS318)。   The scoring unit 109-3 sorts the search results (such as the title and URL of the extracted content), and returns the search results obtained as a result to the search unit 109 (step S316). The search result is returned to the search system user (step S318).

実施例1では検索の再現率の向上を目的としたのに対し、実施例2は適合率の向上を目的とする。   The first embodiment aims to improve the recall rate of the search, while the second embodiment aims to improve the precision.

実施例2では、検索時に求めたメタ情報を、全体のメタ情報として永続化するのではなく、その検索時の状況用の検索用のメタ情報として生成する。   In the second embodiment, meta information obtained at the time of searching is not made permanent as the entire meta information, but is generated as meta information for searching for the situation at the time of searching.

実施例1では、コンテンツメタ情報保持部101のコンテンツメタ情報が検索実行毎に更新されるが、実施例2では、コンテンツメタ情報の更新は全体のコンテンツメタ情報保持部101で保持されるコンテンツメタ情報に反映させず、その検索時のみ有効なメタ情報フィールド(一時コンテンツメタ情報保持部121)を一時的に用意することで、他の現在の状況とは関連の無い過去の検索行動の履歴の影響を排除する。   In the first embodiment, the content meta information in the content meta information holding unit 101 is updated every time search is executed. In the second embodiment, the content meta information is updated by the content meta information holding unit 101 in the entire content meta information holding unit 101. By temporarily preparing a meta information field (temporary content meta information holding unit 121) that is not reflected in the information and valid only during the search, a history of past search behaviors that are not related to other current situations Eliminate the impact.

実施例2では現在の状況にのみ関連するコンテンツメタ情報の共有を図ることで、検索している状況(検索条件、利用メタ情報)が一致するコンテンツメタ情報の共有を狙うものである。   In the second embodiment, content meta information related only to the current situation is shared, thereby aiming to share content meta information that matches the search situation (search condition, use meta information).

実施例1では全ての検索行動がコンテンツのメタ情報の共有に反映されるため、コンテンツメタ情報の共有は早く進むメリットはあるが、複数の検索条件、複数の検索メタ情報における検索時での検索行動により同じコンテンツに対してメタ情報が共有されていくと、異なる状況(検索条件、検索メタ情報)下でのコンテンツメタ情報が混ざってしまい、コンテンツメタ情報が広く共有されることで検索の再現率は向上するものの、現在の状況とは関連の無いコンテンツメタ情報が含まれることで適合率が落ちてしまう可能性もあり得る。   In the first embodiment, since all search behaviors are reflected in the sharing of content meta information, sharing of content meta information has the advantage of advancing quickly, but searching at the time of searching with a plurality of search conditions and a plurality of search meta information When meta information is shared for the same content by action, content meta information under different circumstances (search conditions, search meta information) is mixed, and content meta information is widely shared to reproduce search Although the rate is improved, there is a possibility that the relevance rate is lowered by including content meta information that is not related to the current situation.

そこで実施例2では、その検索している状況(検索条件、検索メタ情報)下でのみ関連するコンテンツメタ情報の共有を図ることで、適合率の向上を目指す。   In the second embodiment, therefore, the content meta information that is related only under the search status (search condition, search meta information) is shared, thereby aiming at an improvement in the relevance rate.

実施例1のように、オリジナルのコンテンツのメタ情報を上書きしてしまうと、コンテンツが検索時にヒットしたときに、元々あったコンテンツメタ情報と検索条件が一致したから検索にヒットしたのか、履歴から付与されたメタ情報と検索条件が一致したから検索にヒットしたのかがわからなくなってしまう。更に、履歴から付与されたメタ情報は、その検索時の検索条件や検索メタ情報においての類似度により付与されるもので、すべての検索でのコンテンツメタ情報が次々とコンテンツメタ情報に追加されてしまうとコンテンツメタ情報がノイズとなってしまう可能性もある。実施例2では検索時に、オリジナルのコンテンツメタ情報保持部101とは別に検索用のメタ情報保持部(一時コンテンツメタ情報保持部121)を一時的に生成、利用することで実施例1の問題を解決する。   If the meta information of the original content is overwritten as in the first embodiment, when the content hits at the time of search, the search meta data matches the original content meta information and the search condition is matched. Since the given meta information matches the search condition, it is not possible to know whether the search has been hit. Furthermore, the meta information given from the history is given according to the search condition at the time of the search and the similarity in the search meta information, and the content meta information in all searches is added to the content meta information one after another. If this happens, the content meta information may become noise. In the second embodiment, the problem of the first embodiment can be solved by temporarily generating and using a search meta information holding unit (temporary content meta information holding unit 121) separately from the original content meta information holding unit 101 during the search. Resolve.

図6は実施例2の構成ブロック図である。実施例2による検索システム202は、検索インタフェース部107、制御部117と、検索部109と、コンテンツメタ情報保持部101と、一時コンテンツメタ情報保持部121と、被閲覧履歴情報保持部105と、動的コンテンツメタ情報付与部111を含む。   FIG. 6 is a configuration block diagram of the second embodiment. The search system 202 according to the second embodiment includes a search interface unit 107, a control unit 117, a search unit 109, a content meta information holding unit 101, a temporary content meta information holding unit 121, a browse history information holding unit 105, A dynamic content meta information adding unit 111 is included.

またサーチ部は、一時コンテンツメタ情報保持のためのコンテンツ情報を要求された場合、コンテンツメタ情報保持部101で保持されているコンテンツに対し、要求時に渡されたコンテンツURLと一致するコンテンツ情報を全て取得して返す。   When the search unit is requested for content information for holding temporary content meta information, the search unit searches all content information that matches the content URL passed at the time of request for the content held in the content meta information holding unit 101. Get and return.

検索インタフェース部107は、実施形態のものと同様なものである。   The search interface unit 107 is the same as that of the embodiment.

検索部109は、サーチコア部109−1B、スコアリング部109−3を含む。   The search unit 109 includes a search core unit 109-1B and a scoring unit 109-3.

サーチコア部109−1Bは、コンテンツメタ情報保持部101と、一時コンテンツメタ情報保持部121に保持されている検索条件、検索メタ情報と一致する検索フィールドにアクセスし、検索者から取得した検索条件と、検索メタ情報(検索者メタ情報、検索時のコンテキスト情報などを含む)と一致するコンテンツメタ項目の値を含むコンテンツメタ情報を持つコンテンツの識別情報を取得し、同時にコンテンツ毎に、検索者から取得した検索条件と、検索メタ情報に一致したコンテンツメタ項目の重みの和も一緒に取得する。   The search core unit 109-1B accesses the search condition and the search field that matches the search meta information held in the content meta information holding unit 101 and the temporary content meta information holding unit 121, and the search condition acquired from the searcher And content identification information having content meta information including the value of the content meta item that matches the search meta information (including searcher meta information, context information at the time of search, etc.), and at the same time, for each content, the searcher And the sum of the weights of the content meta items that match the search meta information are also acquired.

一時コンテンツメタ情報保持部121は、コンテンツメタ情報保持部101と同等の検索条件に一致するメタ情報を持つコンテンツを込みこむ機能を、検索メタ情報毎に保持することが可能な部分である。一時コンテンツメタ情報保持部121で保持されるデータの構成例を図7に示す。   The temporary content meta information holding unit 121 is a part capable of holding for each search meta information a function of incorporating content having meta information that matches the search conditions equivalent to the content meta information holding unit 101. A configuration example of data held in the temporary content meta information holding unit 121 is shown in FIG.

動的コンテンツ間メタ情報付与コア部111−3Bは、動的コンテンツ間メタ情報付与コア部111−3の有する機能を備えているが、算出されたメタ情報の更新先が、コンテンツメタ情報保持部101ではなく一時コンテンツメタ情報保持部121となっている。   The dynamic content meta-information adding core unit 111-3B has the function of the dynamic content meta-information adding core unit 111-3, but the update destination of the calculated meta information is the content meta-information holding unit. The temporary content meta information holding unit 121 is not 101.

算出されたメタ情報の更新先でのメタ情報はコンテンツメタ情報になります。また、検索メタ情報とコンテンツメタ情報の対応付けについてであるが、書き込まれる際には、検索者から入力された検索メタ情報からコンテンツメタ情報を算出し、図7の左側に、検索者から入力された検索メタ情報をそのまま入れて対応する右側に算出したコンテンツメタ情報が書き込まれる。検索時の読み込みの際は、検索者から入力された検索メタ情報と完全一致する図7の左側の検索メタ情報に対応する右側のコンテンツメタ情報が読み込まれる。   The meta information at the update destination of the calculated meta information is the content meta information. Further, regarding the association between the search meta information and the content meta information, when it is written, the content meta information is calculated from the search meta information input from the searcher, and input from the searcher on the left side of FIG. The calculated content meta information is written on the right side of the search meta information as it is. When reading at the time of search, the content meta information on the right side corresponding to the search meta information on the left side in FIG. 7 that completely matches the search meta information input by the searcher is read.

次に動作について説明する。図8は実施例2の処理を示すシーケンス図である。   Next, the operation will be described. FIG. 8 is a sequence diagram illustrating processing of the second embodiment.

まず、検索要求を取得した制御部117が、取得した情報と共にメタ情報の更新要求を動的コンテンツメタ情報付与部111に対して送る(ステップS401)。   First, the control unit 117 that has acquired the search request sends a meta information update request together with the acquired information to the dynamic content meta information adding unit 111 (step S401).

それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1に対してコンテンツ間の類似度を算出することを要求する(ステップS402)。   In response, the dynamic content meta information adding unit 111 requests the dynamic content similarity calculation unit 111-1 to calculate the similarity between the contents (step S402).

類似度算出要求を受け取った動的コンテンツ間類似度算出部111−1は被閲覧履歴保持部105からコンテンツの被閲覧履歴情報を取得し(ステップS403、S404)、類似コンテンツ情報を算出して、これを動的コンテンツメタ情報付与部111に返す(ステップS405)。類似コンテンツ情報は、類似すると判定された2つのコンテンツのURLとその間の類似度のセットを1単位する項目を0個以上持つ情報である。具体例は図9の通りである。   The dynamic content similarity calculation unit 111-1 that has received the similarity calculation request acquires the browsing history information of the content from the browsing history holding unit 105 (steps S 403 and S 404), calculates the similar content information, This is returned to the dynamic content meta information adding unit 111 (step S405). The similar content information is information having zero or more items each of which sets a set of similarities between two URLs determined to be similar. A specific example is as shown in FIG.

それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間メタ情報付与コア部111−3Bに取得したコンテンツ間の類似度を渡す(ステップS406)。   Receiving it, the dynamic content meta information adding unit 111 passes the acquired similarity between the contents to the dynamic content meta information adding core unit 111-3B (step S406).

動的コンテンツ間メタ情報付与コア部113−1Bは、動的コンテンツメタ情報付与部111より受け取った類似コンテンツ情報を検索メタ情報と共にサーチ部に渡して一時コンテンツメタ情報保持部121のためのコンテンツ情報を要求し、類似コンテンツ情報に記載されたコンテンツURLのコンテンツ情報(コンテンツメタ情報保持部101で保持されている、渡されたコンテンツURLと一致するコンテンツの全ての情報)を取得する。そして取得したコンテンツ情報を一時コンテンツメタ情報保持部121に追加する(ステップS407、S408、S409)。   The dynamic content meta-information adding core unit 113-1B passes the similar content information received from the dynamic content meta-information adding unit 111 to the search unit together with the search meta information, and the content information for the temporary content meta information holding unit 121 To obtain the content information of the content URL described in the similar content information (all information of the content that is held in the content meta information holding unit 101 and matches the passed content URL). Then, the acquired content information is added to the temporary content meta information holding unit 121 (steps S407, S408, S409).

一時コンテンツメタ情報を書き換えた後に、動的コンテンツメタ情報付与部111は、処理が終了したことを呼び出し元の制御部117に伝える(ステップS410)。   After rewriting the temporary content meta information, the dynamic content meta information adding unit 111 notifies the calling source control unit 117 that the processing has been completed (step S410).

処理が終了したことを伝えられた制御部117は、サーチコア部109−1Bに対して検索条件、検索メタ情報と共に検索を依頼する(ステップS411)。   The control unit 117 notified of the completion of the process requests the search core unit 109-1B to perform a search together with the search condition and the search meta information (step S411).

検索依頼された検索部109は、サーチコア部109−1Bに対して検索条件と検索メタ情報を渡して検索を依頼し(ステップS412)、サーチコア部109−1Bは、検索条件と検索メタ情報を一時コンテンツメタ情報保持部121に渡し(ステップS413)、一時コンテンツメタ情報保持部121は、検索条件と検索メタ情報が一致するコンテンツのURLを抽出して、そのコンテンツのURLとメタ項目の値と一致する重みの和をサーチコア部109−1Bに渡す(S414)。   The search unit 109 that has requested the search passes the search condition and search meta information to the search core unit 109-1B to request a search (step S412), and the search core unit 109-1B searches for the search condition and the search meta information. Is sent to the temporary content meta information holding unit 121 (step S413), and the temporary content meta information holding unit 121 extracts the URL of the content that matches the search condition and the search meta information, and the URL of the content and the value of the meta item Is transferred to the search core unit 109-1B (S414).

また、サーチコア部109−1Bは、コンテンツメタ情報保持部101に対して検索条件を渡して検索を依頼し(ステップS415)、コンテンツメタ情報保持部101は、検索条件が一致するコンテンツのURLを抽出して、そのコンテンツのURLとメタ項目の値と一致する重みの和をサーチコア部109−1Bに渡す(S416)。   In addition, the search core unit 109-1B sends a search condition to the content meta information holding unit 101 to request a search (step S415), and the content meta information holding unit 101 sets the URL of the content that matches the search condition. The content is extracted and the sum of the weights matching the URL of the content and the value of the meta item is passed to the search core unit 109-1B (S416).

サーチコア部109−1Bは、一時コンテンツメタ情報保持部121とコンテンツメタ情報保持部101から渡されたコンテンツのURLとメタ項目の値と一致する重みの和を検索部109に渡す(ステップS417)。   The search core unit 109-1B passes to the search unit 109 the sum of the weights that match the URL of the content and the value of the meta item passed from the temporary content meta information holding unit 121 and the content meta information holding unit 101 (step S417). .

コンテンツのURLとメタ項目の値と一致する重みの和を受け取った検索部109は、それらをスコアリング部109−3に渡して(ステップS418)、スコアリング部109−3は、検索結果の並び替えを行う。スコアリング部109−3は、その結果得た検索結果を、検索部109と制御部117を介して、検索システム利用者に返す。   The search unit 109 that has received the sum of the weights matching the URL of the content and the value of the meta item passes them to the scoring unit 109-3 (step S418), and the scoring unit 109-3 arranges the search results. Change. The scoring unit 109-3 returns the search result obtained as a result to the search system user via the search unit 109 and the control unit 117.

なお、一時コンテンツメタ情報保持部121で保持されているデータは削除することが可能である。   The data held in the temporary content meta information holding unit 121 can be deleted.

本システムの効果は、検索対象となるコンテンツにメタ情報のあるものと無いものが混在している状態において、検索時の検索条件や検索者のメタ情報やコンテキスト情報に応じたメタ情報を共有することにより、コンテンツメタ情報が無いコンテンツに対しても状況に即した検索を実現することにある。   The effect of this system is to share the meta information according to the search condition at the time of search, the meta information of the searcher, and the context information in a state where the content to be searched is mixed with and without meta information Thus, it is possible to realize a search according to the situation even for content having no content meta information.

101 コンテンツメタ情報保持部
103 コンテンツ間類似度保持部
105 被閲覧履歴情報保持部
107 検索インタフェース部
109 検索部
109−1 サーチコア部
109−1B 実施例2でのサーチ部
109−3 スコアリング部
111 動的コンテンツメタ情報付与部
111−1 動的コンテンツ間類似度算出部
111−3、111−3B 動的コンテンツ間メタ情報付与コア部
113 静的コンテンツ間類似度保持部
115 静的コンテンツメタ情報付与部
117 制御部
121 一時コンテンツメタ情報保持部
DESCRIPTION OF SYMBOLS 101 Content meta-information holding part 103 Inter-content similarity holding part 105 Browsing history information holding part 107 Search interface part 109 Search part 109-1 Search core part 109-1B Search part 109-3 Scoring part 111 in Example 2 Dynamic content meta information giving unit 111-1 Dynamic content similarity calculating unit 111-3, 111-3B Dynamic content meta information giving core unit 113 Static content similarity holding unit 115 Static content meta information giving Unit 117 Control unit 121 Temporary content meta information holding unit

Claims (35)

コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、
を備えることを特徴とするコンテンツメタ情報付与装置。
A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A dynamic content meta information adding unit that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party;
A content meta information providing apparatus comprising:
前記コンテンツの被閲覧履歴情報は、コンテンツ毎のコンテンツが検索にヒットしたときの検索条件、検索者メタ情報毎の閲覧の有意度の割合を示すことを特徴とする請求項1に記載のコンテンツメタ情報付与装置。   2. The content meta according to claim 1, wherein the browse history information of the content indicates a search condition when content for each content hits a search, and a ratio of browsing significance for each searcher meta information. Information grant device. 前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、閲覧された場合のうち、そのコンテンツがその閲覧者にとって有意だった場合の割合を有意値として検索メタ情報毎に保持することを特徴とする請求項1又は2に記載のコンテンツメタ情報付与装置。   The browsed history information holding unit is configured to search for each content, each search condition, and each searcher meta information as a significant value by using a ratio when the content is significant for the viewer as a significant value. The content meta information adding device according to claim 1 or 2, wherein the content meta information adding device holds each information. 前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、利用者に提示された場合のうち、その利用者が実際に閲覧した場合の割合を保持することを特徴とする請求項1又は2に記載のコンテンツメタ情報付与装置。   The browsed history information holding unit holds, for each content, each search condition, and each searcher meta-information, a ratio when the user actually browses among cases presented to the user. The content meta information providing apparatus according to claim 1 or 2, characterized in that the apparatus is provided. 前記動的コンテンツメタ情報付与部において、被閲覧履歴情報保持部で、2つのコンテンツ間において、検索メタ情報のうちの与えられた項目についての保持されている値が両方存在する数と、その値の差がある閾値以下のものの数を取得し、両方存在する数における、値の差が閾値以下の数の割合を類似度として用いる請求項1乃至4のいずれか1項に記載のコンテンツメタ情報付与装置。   In the dynamic content meta information adding unit, the browse history information holding unit includes the number of both values held for the given item in the search meta information between the two contents, and the value The content meta information according to any one of claims 1 to 4, wherein the content meta information according to any one of claims 1 to 4 is obtained as a similarity by acquiring a number of those having a difference of less than or equal to a threshold in a number of both existing numbers. Granting device. 前記ある閾値とは、前記被閲覧履歴保持部の各メタ項目における有意度の平均と、そのメタ項目におけるコンテンツの有意度の差の平均であることを特徴とする請求項5に記載のコンテンツメタ情報付与装置。   The content meta according to claim 5, wherein the certain threshold value is an average of significance in each meta item of the browsing history holding unit and a difference in significance of content in the meta item. Information grant device. 前記動的コンテンツメタ情報付与部は、或るコンテンツについて、そのコンテンツと類似度が閾値以上の他の或るコンテンツがあった場合、前記他の或るコンテンツが持つメタ情報と重みを前記コンテンツメタ情報保持部から取得し、前記類似度と取得した重みとを掛け合わせた値を、前記或るコンテンツのメタ情報の重みに加え、前記或るコンテンツに前記他の或るコンテンツが持つメタ情報がない場合には、そのメタ情報と前記掛け合わせた値を前記或るコンテンツに付与することを特徴とする請求項1乃至6のいずれか1項に記載のコンテンツメタ情報付与装置。   The dynamic content meta-information adding unit, when there is some other content whose similarity with the content is equal to or greater than a threshold value for the certain content, assigns the meta-information and weight of the other certain content to the content meta The value obtained by multiplying the similarity and the acquired weight obtained from the information holding unit is added to the weight of the meta information of the certain content, and the meta information possessed by the other certain content is added to the certain content. 7. The content meta information adding apparatus according to claim 1, wherein if there is no content, the value multiplied by the meta information is added to the certain content. コンテンツ間類似度保持部で保持するコンテンツ間の類似度を算出するコンテンツ間類似度算出部と、求めた類似度に従いコンテンツ間でメタ情報を共有して前記コンテンツメタ情報保持部に保持させるコンテンツメタ情報付与部とを更に備えることを特徴とする請求項1乃至7のいずれか1項に記載のコンテンツメタ情報付与装置。   An inter-content similarity calculating unit that calculates the similarity between contents held by the inter-content similarity holding unit, and a content meta that is shared by the content according to the obtained similarity and is held in the content meta-information holding unit The content meta information providing apparatus according to claim 1, further comprising an information adding unit. 請求項1に記載のコンテンツメタ情報付与装置を備え、検索条件を与えられた際に、前記検索条件をキーとして前記コンテンツメタ情報保持部で保持されている前記コンテンツメタ情報を検索し、前記検索条件とメタ項目の値が一致するコンテンツメタ情報を抽出する検索部と、検索条件と検索メタ情報を与えられた際に、前記検索条件と検索メタ情報を動的コンテンツメタ情報付与装置に渡して前記コンテンツメタ情報保持部内のコンテンツメタ情報を更新させ、その後、前記検索部を用いて前記コンテンツメタ情報保持部から前記検索条件とメタ項目の値が一致するコンテンツメタ情報を取得する、一連の処理を行う制御部を備えることを特徴としたコンテンツ検索装置。   The content meta information adding device according to claim 1, wherein when the search condition is given, the content meta information held in the content meta information holding unit is searched using the search condition as a key, and the search A search unit for extracting content meta information whose value matches the condition and meta item value, and when the search condition and search meta information are given, the search condition and the search meta information are passed to the dynamic content meta information adding device. A series of processes for updating the content meta information in the content meta information holding unit, and then acquiring content meta information whose meta condition value matches the search condition from the content meta information holding unit using the search unit A content search apparatus comprising a control unit for performing the above. 前記動的コンテンツメタ情報付与部は、更に、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索部は、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項9に記載のコンテンツ検索装置。
The dynamic content meta information providing unit further includes:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
The search unit excludes the updated content from the search target from the content meta information holding unit, and sets the temporary content meta information holding unit as a search target using the search condition and the search meta information as a key. The content search device according to claim 9.
前記検索部は、前記コンテンツメタ情報保持部及び前記一時コンテンツメタ情報保持部でのコンテンツとメタ情報のセット群に対して、与えられた検索条件と同じ検索条件を持つコンテンツ及び関連のあるメタ情報を持つコンテンツを抽出した上で、その検索条件とメタ項目の値が一致したメタ情報の重みを用いてそれらのコンテンツをソートする請求項10に記載のコンテンツ検索装置。   The search unit includes contents having the same search condition as the given search condition and related meta information for the set of content and meta information in the content meta information holding unit and the temporary content meta information holding unit. The content search apparatus according to claim 10, wherein content having the same is extracted and the content is sorted using the weight of meta information whose meta condition value matches the search condition. コンテンツを検索するための検索条件を取得し、取得した前記検索条件を前記制御部に渡す入力部と、前記制御部から受け取った検索結果を表示するための出力部とを更に備えることを特徴とする請求項9乃至11のいずれか1項に記載のコンテンツ検索装置。   It further comprises an input unit for acquiring a search condition for searching for content and passing the acquired search condition to the control unit, and an output unit for displaying the search result received from the control unit. The content search device according to any one of claims 9 to 11. コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
を備えるコンテンツメタ情報付与装置におけるコンテンツメタ情報付与方法であって、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与ステップを備えることを特徴とするコンテンツメタ情報付与方法。
A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
A content meta information providing method in a content meta information providing apparatus comprising:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. Content meta information comprising a dynamic content meta information adding step for performing processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party Grant method.
前記コンテンツの被閲覧履歴情報は、コンテンツ毎のコンテンツが検索にヒットしたときの検索条件、検索者メタ情報毎の閲覧の有意度の割合を示すことを特徴とする請求項13に記載のコンテンツメタ情報付与方法。   14. The content meta according to claim 13, wherein the browse history information of the content indicates a search condition when the content for each content hits the search, and a ratio of the significance of browsing for each searcher meta information. Information grant method. 前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、閲覧された場合のうち、そのコンテンツがその閲覧者にとって有意だった場合の割合を有意値として検索メタ情報毎に保持することを特徴とする請求項13又は14に記載のコンテンツメタ情報付与方法。   The browsed history information holding unit is configured to search for each content, each search condition, and each searcher meta information as a significant value by using a ratio when the content is significant for the viewer as a significant value. 15. The content meta information adding method according to claim 13, wherein the information is held for each piece of information. 前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、利用者に提示された場合のうち、その利用者が実際に閲覧した場合の割合を保持することを特徴とする請求項13又は14に記載のコンテンツメタ情報付与方法。   The browsed history information holding unit holds, for each content, each search condition, and each searcher meta-information, a ratio when the user actually browses among cases presented to the user. 15. The content meta information providing method according to claim 13, wherein the content meta information is added. 前記動的コンテンツメタ情報付与ステップにおいて、被閲覧履歴情報保持部で、2つのコンテンツ間において、検索メタ情報のうちの与えられた項目についての保持されている値が両方存在する数と、その値の差がある閾値以下のものの数を取得し、両方存在する数における、値の差が閾値以下の数の割合を類似度として用いる請求項13乃至16のいずれか1項に記載のコンテンツメタ情報付与方法。   In the dynamic content meta information giving step, the number of values that are held for the given item in the search meta information between the two contents in the browse history information holding unit, and the value The content meta information according to any one of claims 13 to 16, wherein the content meta information according to any one of claims 13 to 16 is obtained as a similarity by acquiring the number of those having a difference of less than or equal to a threshold in a number of both existing numbers Grant method. 前記ある閾値とは、前記被閲覧履歴保持部の各メタ項目における有意度の平均と、そのメタ項目におけるコンテンツの有意度の差の平均であることを特徴とする請求項17に記載のコンテンツメタ情報付与方法。   18. The content meta according to claim 17, wherein the certain threshold is an average of significance in each meta item of the browse history holding unit and an average of differences in significance of content in the meta item. Information grant method. 前記動的コンテンツメタ情報付与ステップでは、或るコンテンツについて、そのコンテンツと類似度が閾値以上の他の或るコンテンツがあった場合、前記他の或るコンテンツが持つメタ情報と重みを前記コンテンツメタ情報保持部から取得し、前記類似度と取得した重みとを掛け合わせた値を、前記或るコンテンツのメタ情報の重みに加え、前記或るコンテンツに前記他の或るコンテンツが持つメタ情報がない場合には、そのメタ情報と前記掛け合わせた値を前記或るコンテンツに付与することを特徴とする請求項13乃至18のいずれか1項に記載のコンテンツメタ情報付与方法。   In the dynamic content meta information assigning step, when there is some other content whose similarity to the content is equal to or greater than a threshold, the meta information and weight of the other content are assigned to the content meta information. The value obtained by multiplying the similarity and the acquired weight obtained from the information holding unit is added to the weight of the meta information of the certain content, and the meta information possessed by the other certain content is added to the certain content. 19. The content meta information providing method according to claim 13, wherein if there is no content, the value multiplied by the meta information is added to the certain content. 19. コンテンツ間類似度保持部で保持するコンテンツ間の類似度を算出するコンテンツ間類似度算出ステップと、求めた類似度に従いコンテンツ間でメタ情報を共有して前記コンテンツメタ情報保持部に保持させるコンテンツメタ情報付与ステップとを更に備えることを特徴とする請求項13乃至19のいずれか1項に記載のコンテンツメタ情報付与方法。   A content similarity calculation step for calculating a similarity between contents held in the inter-content similarity holding unit, and a content meta for sharing the meta information between the contents according to the obtained similarity and holding the content meta information in the content meta-information holding unit 20. The content meta information providing method according to claim 13, further comprising an information adding step. 請求項13に記載のコンテンツメタ情報付与方法を含み、検索条件を与えられた際に、前記検索条件をキーとして前記コンテンツメタ情報保持部で保持されている前記コンテンツメタ情報を検索し、前記検索条件とメタ項目の値が一致するコンテンツメタ情報を抽出する検索ステップと、検索条件と検索メタ情報を与えられた際に、前記検索条件と検索メタ情報を動的コンテンツメタ情報付与装置に渡して前記コンテンツメタ情報保持部内のコンテンツメタ情報を更新させ、その後、前記検索部を用いて前記コンテンツメタ情報保持部から前記検索条件とメタ項目の値が一致するコンテンツメタ情報を取得する、一連の処理を行う制御ステップを備えることを特徴としたコンテンツ検索方法。   14. The content meta information adding method according to claim 13, wherein when the search condition is given, the content meta information held in the content meta information holding unit is searched using the search condition as a key, and the search A search step for extracting content meta information whose value matches the condition and meta item value, and when the search condition and the search meta information are given, the search condition and the search meta information are passed to the dynamic content meta information adding device. A series of processes for updating the content meta information in the content meta information holding unit, and then acquiring content meta information whose meta condition value matches the search condition from the content meta information holding unit using the search unit The content search method characterized by including the control step which performs. 前記動的コンテンツメタ情報付与ステップでは、更に、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索ステップでは、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項21に記載のコンテンツ検索方法。
In the dynamic content meta information giving step,
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
In the search step, the updated content is excluded from the search target from the content meta information holding unit, and the temporary content meta information holding unit is set as a search target using the search condition and the search meta information as a key. The content search method according to claim 21, wherein:
前記検索ステップでは、前記コンテンツメタ情報保持部及び前記一時コンテンツメタ情報保持部でのコンテンツとメタ情報のセット群に対して、与えられた検索条件と同じ検索条件を持つコンテンツ及び関連のあるメタ情報を持つコンテンツを抽出した上で、その検索条件とメタ項目の値が一致したメタ情報の重みを用いてそれらのコンテンツをソートする請求項22に記載のコンテンツ検索方法。   In the search step, for the set of content and meta information in the content meta information holding unit and the temporary content meta information holding unit, content having the same search condition as the given search condition and related meta information 23. The content search method according to claim 22, wherein the content having the above is extracted, and the content is sorted using the weight of the meta information whose meta condition value matches the search condition. コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、
を備えることを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。
A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A dynamic content meta information adding unit that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party;
A program for causing a computer to function as a content meta information providing device.
請求項24に記載のコンテンツメタ情報付与装置において、
前記コンテンツの被閲覧履歴情報は、コンテンツ毎のコンテンツが検索にヒットしたときの検索条件、検索者メタ情報毎の閲覧の有意度の割合を示すことを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。
In the content meta-information provision apparatus of Claim 24,
The content browsing history information indicates a search condition when content for each content hits a search, and a percentage of browsing significance for each searcher meta information. A program to make it work.
前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、閲覧された場合のうち、そのコンテンツがその閲覧者にとって有意だった場合の割合を有意値として検索メタ情報毎に保持することを特徴とする請求項24又は25に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   The browsed history information holding unit is configured to search for each content, each search condition, and each searcher meta information as a significant value by using a ratio when the content is significant for the viewer as a significant value. 26. The program for causing a computer to function as the content meta information adding apparatus according to claim 24 or 25, wherein the program is stored for each piece of information. 前記被閲覧履歴情報保持部は、各コンテンツ、各検索条件、各検索者メタ情報毎に、利用者に提示された場合のうち、その利用者が実際に閲覧した場合の割合を保持することを特徴とする請求項24又は25に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   The browsed history information holding unit holds, for each content, each search condition, and each searcher meta-information, a ratio when the user actually browses among cases presented to the user. The program for functioning a computer as a content meta-information provision apparatus of Claim 24 or 25 characterized by the above-mentioned. 前記動的コンテンツメタ情報付与部において、被閲覧履歴情報保持部で、2つのコンテンツ間において、検索メタ情報のうちの与えられた項目についての保持されている値が両方存在する数と、その値の差がある閾値以下のものの数を取得し、両方存在する数における、値の差が閾値以下の数の割合を類似度として用いる請求項24乃至27のいずれか1項に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   In the dynamic content meta information adding unit, the browse history information holding unit includes the number of both values held for the given item in the search meta information between the two contents, and the value The content meta information according to any one of claims 24 to 27, wherein the content meta information according to any one of claims 24 to 27 is obtained as a similarity by acquiring the number of those having a difference of less than or equal to a threshold, A program for causing a computer to function as a granting device. 前記ある閾値とは、前記被閲覧履歴保持部の各メタ項目における有意度の平均と、そのメタ項目におけるコンテンツの有意度の差の平均であることを特徴とする請求項28に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   29. The content meta according to claim 28, wherein the certain threshold is an average of significance in each meta item of the browse history holding unit and an average of differences in significance of content in the meta item. A program for causing a computer to function as an information providing device. 前記動的コンテンツメタ情報付与部は、或るコンテンツについて、そのコンテンツと類似度が閾値以上の他の或るコンテンツがあった場合、前記他の或るコンテンツが持つメタ情報と重みを前記コンテンツメタ情報保持部から取得し、前記類似度と取得した重みとを掛け合わせた値を、前記或るコンテンツのメタ情報の重みに加え、前記或るコンテンツに前記他の或るコンテンツが持つメタ情報がない場合には、そのメタ情報と前記掛け合わせた値を前記或るコンテンツに付与することを特徴とする請求項24乃至29のいずれか1項に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   The dynamic content meta-information adding unit, when there is some other content whose similarity with the content is equal to or greater than a threshold value for the certain content, assigns the meta-information and weight of the other certain content to the content meta The value obtained by multiplying the similarity and the acquired weight obtained from the information holding unit is added to the weight of the meta information of the certain content, and the meta information possessed by the other certain content is added to the certain content. 30. When there is no content, the value multiplied by the meta information is added to the certain content, so that the computer functions as the content meta information adding device according to any one of claims 24 to 29. Program for. コンテンツ間類似度保持部で保持するコンテンツ間の類似度を算出するコンテンツ間類似度算出部と、求めた類似度に従いコンテンツ間でメタ情報を共有して前記コンテンツメタ情報保持部に保持させるコンテンツメタ情報付与部とを更に備えることを特徴とする請求項24乃至30のいずれか1項に記載のコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。   An inter-content similarity calculating unit that calculates the similarity between contents held by the inter-content similarity holding unit, and a content meta that is shared by the content according to the obtained similarity and is held in the content meta-information holding unit The program for functioning a computer as a content meta-information provision apparatus of any one of Claims 24 thru | or 30 further provided with an information provision part. 請求項24に記載のコンテンツメタ情報付与装置を備え、検索条件を与えられた際に、前記検索条件をキーとして前記コンテンツメタ情報保持部で保持されている前記コンテンツメタ情報を検索し、前記検索条件とメタ項目の値が一致するコンテンツメタ情報を抽出する検索部と、検索条件と検索メタ情報を与えられた際に、前記検索条件と検索メタ情報を動的コンテンツメタ情報付与装置に渡して前記コンテンツメタ情報保持部内のコンテンツメタ情報を更新させ、その後、前記検索部を用いて前記コンテンツメタ情報保持部から前記検索条件とメタ項目の値が一致するコンテンツメタ情報を取得する、一連の処理を行う制御部を備えることを特徴としたコンテンツ検索装置としてコンピュータを機能させるためのプログラム。   25. The content meta information adding device according to claim 24, wherein when the search condition is given, the content meta information held in the content meta information holding unit is searched using the search condition as a key, and the search A search unit for extracting content meta information whose value matches the condition and meta item value, and when the search condition and search meta information are given, the search condition and the search meta information are passed to the dynamic content meta information adding device. A series of processes for updating the content meta information in the content meta information holding unit, and then acquiring content meta information whose meta condition value matches the search condition from the content meta information holding unit using the search unit A program for causing a computer to function as a content search apparatus comprising a control unit that performs the above. 前記動的コンテンツメタ情報付与部は、更に、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索部は、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項32に記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。
The dynamic content meta information providing unit further includes:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
The search unit excludes the updated content from the search target from the content meta information holding unit, and sets the temporary content meta information holding unit as a search target using the search condition and the search meta information as a key. A program for causing a computer to function as the content search device according to claim 32.
前記検索部は、前記コンテンツメタ情報保持部及び前記一時コンテンツメタ情報保持部でのコンテンツとメタ情報のセット群に対して、与えられた検索条件と同じ検索条件を持つコンテンツ及び関連のあるメタ情報を持つコンテンツを抽出した上で、その検索条件とメタ項目の値が一致したメタ情報の重みを用いてそれらのコンテンツをソートする請求項33に記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。   The search unit includes contents having the same search condition as the given search condition and related meta information for the set of content and meta information in the content meta information holding unit and the temporary content meta information holding unit. 34. A program for causing a computer to function as a content search apparatus according to claim 33, wherein content having the same is extracted, and the content is sorted using the weight of meta information whose meta item value matches the search condition. . コンテンツを検索するための検索条件を取得し、取得した前記検索条件を前記制御部に渡す入力部と、前記制御部から受け取った検索結果を表示するための出力部とを更に備えることを特徴とする請求項32乃至34のいずれか1項に記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。   It further comprises an input unit for acquiring a search condition for searching for content and passing the acquired search condition to the control unit, and an output unit for displaying the search result received from the control unit. A program for causing a computer to function as the content search device according to any one of claims 32 to 34.
JP2009073862A 2009-03-25 2009-03-25 Content meta information impartment device and method thereof, and content retrieval device and method thereof Withdrawn JP2010225051A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009073862A JP2010225051A (en) 2009-03-25 2009-03-25 Content meta information impartment device and method thereof, and content retrieval device and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009073862A JP2010225051A (en) 2009-03-25 2009-03-25 Content meta information impartment device and method thereof, and content retrieval device and method thereof

Publications (1)

Publication Number Publication Date
JP2010225051A true JP2010225051A (en) 2010-10-07

Family

ID=43042145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009073862A Withdrawn JP2010225051A (en) 2009-03-25 2009-03-25 Content meta information impartment device and method thereof, and content retrieval device and method thereof

Country Status (1)

Country Link
JP (1) JP2010225051A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140099341A (en) * 2013-01-30 2014-08-12 에스케이플래닛 주식회사 Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor
WO2017158798A1 (en) * 2016-03-17 2017-09-21 富士通株式会社 Information processing device, information distribution system, information processing method, and information processing program
WO2018011852A1 (en) * 2016-07-11 2018-01-18 株式会社日立製作所 Information service method, information service system, and information management method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140099341A (en) * 2013-01-30 2014-08-12 에스케이플래닛 주식회사 Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor
KR102088656B1 (en) * 2013-01-30 2020-04-14 에스케이플래닛 주식회사 Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor
WO2017158798A1 (en) * 2016-03-17 2017-09-21 富士通株式会社 Information processing device, information distribution system, information processing method, and information processing program
JPWO2017158798A1 (en) * 2016-03-17 2018-09-27 富士通株式会社 Information processing apparatus, information distribution system, information processing method, and information processing program
WO2018011852A1 (en) * 2016-07-11 2018-01-18 株式会社日立製作所 Information service method, information service system, and information management method

Similar Documents

Publication Publication Date Title
US8271546B2 (en) Method and system for URL autocompletion using ranked results
US8498984B1 (en) Categorization of search results
CN106605221B (en) Multi-user search system with method for instant indexing
JP5575902B2 (en) Information retrieval based on query semantic patterns
JP5632124B2 (en) Rating method, search result sorting method, rating system, and search result sorting system
US7487145B1 (en) Method and system for autocompletion using ranked results
US8291014B2 (en) User interface for web comments
WO2020019565A1 (en) Search sorting method and apparatus, and electronic device and storage medium
US20140280106A1 (en) Presenting comments from various sources
US8374975B1 (en) Clustering to spread comments to other documents
US7765209B1 (en) Indexing and retrieval of blogs
CA2790421C (en) Indexing and searching employing virtual documents
WO2020019562A1 (en) Search sorting method and device, electronic device, and storage medium
JP2011238276A (en) Ranking blog documents
US20100121790A1 (en) Method, apparatus and computer program product for categorizing web content
JP2010506255A (en) Bookmarking and ranking
CN113297457B (en) High-precision intelligent information resource pushing system and pushing method
US20150339387A1 (en) Method of and system for furnishing a user of a client device with a network resource
CN111767445A (en) Data searching method and device, computer equipment and storage medium
CN112883030A (en) Data collection method and device, computer equipment and storage medium
CN111475725A (en) Method, apparatus, device, and computer-readable storage medium for searching for content
CN101661490A (en) Search engine, client thereof and method for searching page
RU2693193C1 (en) Automated extraction of information
RU2452001C1 (en) Method of displaying advertisement on internet resources depending on combined content thereof
JP2010225051A (en) Content meta information impartment device and method thereof, and content retrieval device and method thereof

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100712

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100712

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120605