JP2010225051A - Content meta information impartment device and method thereof, and content retrieval device and method thereof - Google Patents
Content meta information impartment device and method thereof, and content retrieval device and method thereof Download PDFInfo
- Publication number
- JP2010225051A JP2010225051A JP2009073862A JP2009073862A JP2010225051A JP 2010225051 A JP2010225051 A JP 2010225051A JP 2009073862 A JP2009073862 A JP 2009073862A JP 2009073862 A JP2009073862 A JP 2009073862A JP 2010225051 A JP2010225051 A JP 2010225051A
- Authority
- JP
- Japan
- Prior art keywords
- content
- meta information
- search
- information
- meta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、コンテンツの検索において、検索利用者の情報や検索コンテキストに応じて、コンテンツ間のメタ情報を共有するコンテンツメタ情報付与装置、その方法及びそのプログラム並びにコンテンツ検索装置、その方法及びそのプログラムに関する。 The present invention relates to a content meta information providing apparatus, a method and a program thereof, and a content search apparatus, a method and a program thereof, which share meta information between contents according to a search user's information and a search context. About.
コンピュータ等に記憶された大量の情報から必要な情報を検索するための様々な方法が存在する。一般に検索を行う際には必要な情報と関連が深いと考えられるキーワードが入力としてシステムに与えられる。一方、受け取ったキーワードを基にしてコンテンツを抽出するために、検索システムはコンテンツのインデックスを保持している。コンテンツのインデックスは、コンテンツの中身を形態素解析などの解析を行うことにより得られ、タームとして保持される。また、コンテンツのインデックスは、入力されたキーワードとの一致をチェックされることができるようになっている。検索を実行する際には、インデックス内のタームが、入力されたキーワードと一致するコンテンツが抽出される。 There are various methods for retrieving necessary information from a large amount of information stored in a computer or the like. In general, when performing a search, a keyword that is considered to be closely related to necessary information is given to the system as an input. On the other hand, in order to extract content based on the received keyword, the search system holds a content index. The content index is obtained by performing analysis such as morphological analysis on the content, and is retained as a term. The content index can be checked for a match with the input keyword. When executing the search, contents whose terms in the index match the input keyword are extracted.
コンテンツのインデックス内に保持されるタームは、コンテンツの中身の解析により付与される場合もある。しかし、コンテンツの作成者が与えたコンテンツの内容を示すメタ情報がタームとして利用される場合もある。メタ情報の意味はコンテンツの作成者により付与されているため、メタ情報は、コンテンツの内容を示す意味の含有度が高く、このメタ情報を検索に用いることにより、より高精度な検索が行われている(特許文献1参照)。 The term held in the content index may be given by analyzing the content. However, there is a case where meta information indicating the content content provided by the content creator is used as a term. Since the meaning of the meta information is given by the creator of the content, the meta information has a high content of meaning indicating the contents of the content, and by using this meta information for the search, a more accurate search is performed. (See Patent Document 1).
メタ情報の利用は、コンテンツに対応したメタ情報が存在することが前提となっている。しかし、人手によりコンテンツにメタ情報を付与することは、一般にコストが高く、コンテンツに対応したメタ情報が無い場合も少なくない。 The use of meta information is premised on the existence of meta information corresponding to content. However, it is generally expensive to manually add meta information to content, and there are many cases where there is no meta information corresponding to the content.
対応するメタ情報が存在するコンテンツと、対応するメタ情報が無いコンテンツとの間でメタ情報の共有を図ることにより、上記の問題を解決する手法として、コンテンツの閲覧された履歴情報を用いて協調フィルタリングを行う手法が提案されている(特許文献2参照)。 As a technique to solve the above problem by sharing meta information between content that has corresponding meta information and content that does not have corresponding meta information, collaborate using history information that has been browsed. A technique for performing filtering has been proposed (see Patent Document 2).
しかし、特許文献2で用いられている協調フィルタリングの手法では、過去全てのコンテンツ被閲覧履歴を用いることになるため、現在の検索が行われようとしている状況が現在及び将来のメタ情報の共有に活かされず、メタ情報による検索の結果が検索条件や検索時の状態を反映したものにならない。 However, in the collaborative filtering method used in Patent Document 2, all the content browsing history is used, so that the current search is being performed in sharing the current and future meta information. The search result based on the meta information does not reflect the search condition and the state at the time of the search.
そこで、本発明は、現在の検索が行われようとしている状況を現在及び将来のメタ情報の共有に活かし、メタ情報による検索の結果が検索条件や検索時の状態を反映したものになるようなことを可能にするコンテンツメタ情報付与装置、その方法及びそのプログラム並びにコンテンツ検索装置、その方法及びそのプログラムを提供することを目的とする。 Therefore, the present invention utilizes the situation where the current search is about to be performed for sharing the current and future meta information, and the search result based on the meta information reflects the search condition and the state at the time of the search. It is an object of the present invention to provide a content meta information assigning device, a method and a program thereof, and a content search device, a method and a program thereof.
本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、を備えることを特徴とするコンテンツメタ情報付与装置が提供される。 According to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, When a predetermined past browsing situation is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and based on the read browsing history information read, The degree of similarity between contents is calculated, and the contents meta information held in the contents meta information holding unit among the contents determined to be similar to each other based on the degree of similarity A dynamic code that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity or given as content meta information. Content meta information providing device, characterized in that it comprises a Tentsumeta information adding unit, is provided.
また、本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、を備えるコンテンツメタ情報付与装置におけるコンテンツメタ情報付与方法であって、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与ステップを備えることを特徴とするコンテンツメタ情報付与方法が提供される。 Further, according to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, In the content meta-information providing method in the content meta-information providing apparatus comprising: when a predetermined past browsing situation of the content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit Based on the read history information that has been read and read, the similarity between the contents in the browsed state is calculated, and the content determined to be similar to each other based on the similarity Each content meta information held in the meta information holding unit is assigned as the content meta information of each partner, or similar Content meta information attaching method characterized by comprising a dynamic content meta information adding step of increasing processing weight for the content meta information corresponding to each content according to is provided.
更に、本発明によれば、コンテンツのメタ情報(以下、「コンテンツメタ情報」という。)を保持するコンテンツメタ情報保持部と、コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、を備えることを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラムが提供される。 Furthermore, according to the present invention, a content meta information holding unit that holds content meta information (hereinafter referred to as “content meta information”), a browse history information holding unit that holds content browse history information, When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A process of giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity is performed. Program for causing a computer is provided as the content meta information providing device, characterized in that it comprises a specific content meta information adding unit.
本発明によれば、現在の検索が行われようとしている状況を現在及び将来のメタ情報の共有に活かし、メタ情報による検索の結果が検索条件や検索時の状態を反映したものになるようなことが可能となる。 According to the present invention, the current search is performed for sharing current and future meta information, and the search result based on the meta information reflects the search condition and the state at the time of the search. It becomes possible.
以下、図面を参照して本発明を実施するための最良の形態について詳細に説明する。 The best mode for carrying out the present invention will be described below in detail with reference to the drawings.
本発明のシステムの構成図を、図1に示す。本発明のシステムは、コンテンツメタ情報保持部101、コンテンツ間類似度保持部103、被閲覧履歴情報保持部105、検索インタフェース部107、検索部109、動的コンテンツメタ情報付与部111、静的コンテンツ間類似度算出部113、静的コンテンツメタ情報付与部115及び制御部117を含む。
A block diagram of the system of the present invention is shown in FIG. The system of the present invention includes a content meta
検索インタフェース部107は、コンテンツを検索するための検索条件(検索キーワード、検索キーワードを結合する論理式、絞り込み条件(コンテンツの、拡張子、生成日時、作成者、カテゴリ、タグ)など)を入力し、入力した検索条件を制御部117に渡す入力部107−1と、制御部117から受け取った検索結果を表示する出力部107−2を含む。
The
なお、図1に示すシステムは、ハードウェアによって実現することも出来るが、コンピュータを図1に示すシステムとして機能させるためのプログラムをコンピュータが読み込んで実行することによって実現することもできる。 The system shown in FIG. 1 can be realized by hardware, but can also be realized by the computer reading and executing a program for causing the computer to function as the system shown in FIG.
コンテンツメタ情報保持部101は、コンテンツの検索時に検索時に検索の索引として利用され、そこでキーワードと一致する読み出されたメタ情報の重みがコンテンツの順序付け(ソート)に利用される。
The content meta
被閲覧履歴情報保持部105は、本システムが提供するコンテンツが本システムの利用者により閲覧されたことにより得られる被履歴情報を保持する。つまり、被閲覧履歴情報保持部105は、コンテンツ毎に、そのコンテンツが検索にヒットしたときの検索条件、検索者メタ情報(役職、所属部署など)ごとの、閲覧の有意度(閲覧の有無)の割合を保持する。
The browsing history
静的コンテンツ間類似度算出部113は、被閲覧履歴保持部105が保持する情報に基づいてコンテンツ間の類似度を求める。
The static content
コンテンツ間類似度保持部103は、静的コンテンツ間類似度算出部113で求めたコンテンツ間の類似度を保持する。
The inter-content
静的コンテンツメタ情報付与部115は、コンテンツ間類似度保持部103が保持する情報とコンテンツメタ情報保持部101が保持する情報に基づいて、似通ったコンテンツ間でメタ情報を共有するための処理を行う。
The static content meta information adding unit 115 performs processing for sharing meta information between similar contents based on the information held by the inter-content
静的コンテンツメタ情報付与部115は、コンテンツメタ情報保持部101のメタ情報をオフライン(検索実行時ではないバッチでの処理)で更新する際に用いることを想定している。被閲覧履歴情報保持部105で情報がすでに蓄積されているものの、コンテンツ間類似度保持部103とコンテンツメタ情報保持部101に、まだデータが保持されていない場合に、静的コンテンツメタ情報付与部115と静的コンテンツ間類似度算出部113を用いてコンテンツメタ情報保持部101で保持されるメタ情報を更新する。静的コンテンツメタ情報付与部115と静的コンテンツ間類似度算出部113は本実施形態のシステムを開始する時に、システム管理者が起動します。動的コンテンツメタ情報付与部111がその検索メタ情報(検索者メタ情報、コンテキスト情報(検索時の時間と場所など)など)と一致する状況での履歴を用いるのに対し、静的コンテンツメタ情報付与部115は、全ての履歴を用いてコンテンツメタ情報保持部101で保持されるデータを更新する。静的コンテンツ間類似度算出部113はその際に静的コンテンツメタ情報付与部115から呼ばれるが、動的コンテンツメタ情報付与部111からも呼ばれる。静的コンテンツメタ情報付与部115は一旦システムが稼動してしまえば使われることも無くなる。
The static content meta information adding unit 115 is assumed to be used when updating the meta information of the content meta
動的コンテンツメタ情報付与部111は、検索利用時の検索条件や検索メタ情報と一致する過去の履歴の部分で、お互いが近いコンテンツを被閲覧履歴情報保持部105から抽出する。また、動的コンテンツメタ情報付与部111は、コンテンツ間類似度保持部103に保持されているコンテンツ間の類似度に加えて、抽出したコンテンツ間の類似度をさらに強化したコンテンツ間類似度を求め、コンテンツ間類似度が強化されたコンテンツ間で、強化された程度に応じてコンテンツメタ情報保持部101にあるメタ情報の値を更新する。
The dynamic content meta-
検索部109は、検索インタフェース部107が取得した検索条件に含まれるキーワードから該当するコンテンツを取得して適切な順序に並び替える。
The
本実施形態のコンテンツメタ情報保持部101には、図2に示すように、各コンテンツ毎に、URLなどのそのコンテンツのIDと、そのコンテンツの属性等の性質を表すメタ情報群が保持されている。
As shown in FIG. 2, the content meta
本実施形態の被閲覧履歴情報保持部105には、図3に示すように、検索メタ情報と、コンテンツとにより形成されるマトリックスが、検索に関する各メタ項目毎に用意される。マトリックスには検索時の各メタ項目における条件において、各ドキュメントが検索者にとって必要だったかを示す値が入る。この例ではドキュメントが閲覧されたか、されなかったか、の2値でマトリックスを表している。従って、この例では、このマトリックス内の値が各ドキュメントが検索者にとって必要だったかを示す値である。
In the browse history
図3のマトリックス内の値は閲覧の有意度であるが、閲覧数を有意度をとした場合は、図3の表内の値は1、2、3…と増えていくことになる。これらの値は、0〜1の間で正規化される。正規化することによって、類似度を求める際に検索メタ情報の項目での履歴のたまり具合の差の影響を軽微化できるメリットがある。正規化する際は、被閲覧履歴情報保持部105において、検索メタ情報の項目ごとに、その項目における全てのコンテンツの有意度(この場合閲覧数)の最大値と最小値がそれぞれ1と0になるように調整します。具体的には、
正規化後の有意度=(正規化前の有意度−その項目における全コンテンツの最小値)÷(その項目における全コンテンツの最大値−その項目における全コンテンツの最小値))
などの式を用いる方法が考えられます。正規化を行うとすると、あらかじめ正規化するのは被閲覧履歴情報保持部105が更新されるタイミングにバッチで正規化しておくか、検索実行時に走査する検索メタ情報の項目ごとにその都度正規化をする。
The values in the matrix of FIG. 3 are the significance of browsing, but when the number of browsing is regarded as the significance, the values in the table of FIG. These values are normalized between 0 and 1. By normalizing, there is a merit that the influence of the difference in the accumulation state of the history in the item of the search meta information can be minimized when the similarity is obtained. When normalization is performed, in the browsed history
Significance after normalization = (Significance before normalization-Minimum value of all content in the item) / (Maximum value of all content in the item-Minimum value of all content in the item))
A method using an expression such as If normalization is performed, normalization is performed in advance in batches at the timing when the browsing history
有意度としては他に、これまで検索結果にヒットした回数のうち実際にアクセスされた割合を考えることもできるが、その場合、マトリックス内には閲覧数のほかに、検索にヒットした回数、の2つの値が必要になる。この場合、コンテンツの検索にヒットした回数、ヒットしたコンテンツが閲覧された回数の履歴情報は外部から与えられるものと想定される。 In addition to the number of hits in the search results so far, you can also consider the percentage of actual accesses, but in that case, in the matrix, in addition to the number of views, the number of hits in the search Two values are required. In this case, it is assumed that the history information of the number of times the content search has been hit and the number of times the hit content has been browsed is given from the outside.
本実施形態の静的コンテンツ間類似度算出部113は、被閲覧履歴情報保持部105から検索メタ情報毎にコンテンツとその有意値のセットを取得し、それらの情報を用いて、最多で全てのコンテンツ間の類似度を算出する。類似度の算出方法としては被閲覧履歴情報保持部105におけるコンテンツの検索メタ情報ごとの有意値をコンテンツの特徴量ベクトルとし、ベクトル間の類似度(例えば、ベクトルの内積)を求める既存技術を用いる。算出したコンテンツ間の類似度はコンテンツ間類似度保持部103に保持される。
The
本実施形態のコンテンツ間類似度保持部103は、静的コンテンツ間類似度算出部113により算出されたコンテンツ間の類似度を保持し、必要に応じてそれらの情報を渡す機能を有する情報保持部である。
An inter-content
本実施形態の静的コンテンツメタ情報付与部115や動的コンテンツメタ情報付与部111は、コンテンツ間類似度保持部103からコンテンツ間の類似度を読み込み、コンテンツ間の類似度が或る閾値よりも大きい場合に、コンテンツメタ情報保持部101に、コンテンツがお互いに持つメタ情報を類似度に応じて共有させる。
The static content meta information adding unit 115 and the dynamic content meta
本実施形態の動的コンテンツメタ情報付与部111は、検索時に利用者から取得した検索メタ情報をキーとして、被閲覧履歴情報保持部105から、コンテンツ毎にキーと一致する検索メタ情報についての図3に示すような値(検索メタ情報の名前とコンテンツとの関連度(検索メタ情報が現れた時にどれほどの割合でコンテンツが閲覧されたかを表すなど、被閲覧履歴により検索メタ情報とコンテンツとの関連を表す情報))を取得する。取得した値を元に、キーとなる検索メタ情報が利用される場合において類似するコンテンツセット(2つのコンテンツ)を取捨選択する。例えば、あるコンテンツ間で、全ての被閲覧履歴を見るとそれほど似ていなくても、「携帯」というキーワードで検索された時は似通った閲覧をされるコンテンツがある。ここではそうした特定の検索条件における被閲覧履歴情報の類似傾向を調べる。類似していることが判別されたコンテンツセットに対しては、コンテンツ間類似度保持部103から取得したコンテンツ間のコンテンツ類似度を強化した値を取得する。類似度が強化されたコンテンツセットに対して、コンテンツメタ情報保持部101を参照し、そのコンテンツ間で共有されるコンテンツメタ情報を、強化された類似度に応じて強化させる。
The dynamic content meta
コンテンツ間の類似度は1つの数値で表される。類似度を算出する際に、キーとなるコンテンツメタ情報毎の数値(つまり複数の値)を利用する。例としては、キーとなるコンテンツメタ情報の項目が図3において(検索キーワード=SI、検索者役職=課長、検索者所属部署=営業部)で、差異の閾値を各検索メタ情報項目の平均値からの距離の平均とした場合、「SI」の項の閾値は(|(2/3)−1|+|(2/3)−0|+|(2/3)−1|)/3=4/9、同様にして「課長」の項の閾値は4/9、「営業部」の項の閾値は0になる。文書Aと文書Bとの類似度は(両者のメタ項目の値の差がそのメタ項目の閾値以下の数/比較するメタ項目の数)=1/3=0.33になる。文書Aと文書Cの類似度は(3/3)=1となる。 The similarity between contents is represented by one numerical value. When calculating the similarity, a numerical value (that is, a plurality of values) for each content meta information as a key is used. As an example, the item of content meta information as a key is the search keyword = SI, searcher title = section manager, searcher affiliation department = sales department in FIG. 3, and the difference threshold is the average value of each search meta information item. When the average of the distance from the threshold is used, the threshold value of the term “SI” is (| (2/3) −1 | + | (2/3) −0 | + | (2/3) −1 |) / 3 = 4/9, similarly, the threshold of the section “section manager” is 4/9, and the threshold of the section “sales department” is 0. The similarity between the document A and the document B is (number difference between the meta items is equal to or less than the threshold of the meta item / number of meta items to be compared) = 1/3 = 0.33. The similarity between document A and document C is (3/3) = 1.
実施例1における必要最低限のモジュールによる検索システムについての構成例についての説明を行う。 A configuration example of the search system using the minimum necessary modules in the first embodiment will be described.
図4は実施例1の構成ブロック図である。実施例1による検索システム201は、検索インタフェース部107、制御部117と、検索部109と、コンテンツメタ情報保持部101と、被閲覧履歴情報保持部105と、動的コンテンツメタ情報付与部111を含む。
FIG. 4 is a configuration block diagram of the first embodiment. The
検索インタフェース部107は、実施形態のものと同様なものである。
The
制御部117は、検索システム201の利用者によって入力される検索条件及び利用者の所属部署や役職などの利用者メタ情報を取得する部分を有し、取得した検索条件及び利用者メタ情報を動的コンテンツメタ情報付与部111に渡す。そして、制御部117は、動的コンテンツメタ情報付与部111からコンテンツメタ情報が更新された通知を受けると、検索部109に、検索要求として、利用者によって入力された検索条件を送る。そして検索部109から返って来た検索結果を利用者に渡す。
The
利用者メタ情報は外部ネットワークから与えられると想定している。利用者メタ情報を取得するために必要な装置としては、利用者の個人情報を取得するための「認証システム」が必要になる。 It is assumed that user meta information is given from an external network. As an apparatus necessary for acquiring user meta information, an “authentication system” for acquiring user personal information is required.
検索部109は、サーチコア部109−1とスコアリング部109−3を含む。
The
サーチコア部109−1は、コンテンツメタ情報保持部101にアクセスし、制御部117が上記の動作で取得した取得した検索条件と一致するコンテンツメタ情報を持つコンテンツを取得し、同時にコンテンツ毎に、キーワードと一致したメタ情報群の重みの和を取得する。
The search core unit 109-1 accesses the content meta
スコアリング部109−3は、サーチコア部109−1で取得したコンテンツに対して、メタ情報群の重みを基準にソートして、ソート後のコンテンツを制御部117に渡す。
The scoring unit 109-3 sorts the content acquired by the search core unit 109-1 with reference to the weight of the meta information group, and passes the sorted content to the
コンテンツメタ情報保持部101は、コンテンツの属性を表すメタ情報を保持する記憶部である。各コンテンツは複数のメタ情報を有する(メタ情報を持たない場合もある)。メタ情報はメタ項目に加え、メタ項目とその値の組み合わせや、さらにその組み合わせに対してそれぞれ重みを持つ構成などがありうる。コンテンツメタ情報保持部101で保持されるメタ情報の構成例を図2に示す。
The content meta
被閲覧履歴情報保持部105は、本検索システムによって提示されたコンテンツが利用者に対して有意だったかどうかを示す値(有効値)が、コンテンツ毎に保持される。値としては単純に利用者がそのコンテンツを見たかどうかを示す0か1の2値などもありうる。また、値としては閲覧対象のページに「参考になった」「参考にならなかった」などのボタンが設置されている場合などは、どちらを押したかの割合を採用しても良い。上記の有効値はコンテンツ毎に保持される一方、検索条件毎や、所属部署や役職などの利用者のメタ情報毎にも分類される。
The browsing history
被閲覧履歴情報保持部105に保持されるデータの構成例を図3に示す。
An example of the structure of data held in the browse history
動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1、動的コンテンツ間メタ情報付与コア部111−3を含む。
The dynamic content meta
動的コンテンツ間類似度算出部111−1は、被閲覧履歴情報保持部105で保持されている履歴のうち、動的コンテンツメタ情報付与部111から与えられたキーワードと利用者メタ情報の項目において、コンテンツ間で持つ有意度の数における、その有意度の差が予め定められた有効値閾値以下であった項目数の割合を、類似度として算出して返す。
The dynamic content similarity calculation unit 111-1 includes the keyword and user meta information items provided from the dynamic content meta
動的コンテンツ間類似度算出部111−1は、検索メタ情報を受け取った後、まず被閲覧履歴情報保持部105にアクセスし、全ての一対のコンテンツを走査する。走査の際にはコンテンツが持つコンテンツメタ情報で、受け取ったコンテンツメタ情報と一致する部分において、どれだけ被閲覧履歴が類似しているかを調べて数値化する。
After receiving the search meta information, the dynamic content similarity calculation unit 111-1 first accesses the browsed history
図1の静的コンテンツ間類似度算出部113が予め全ての2つのコンテンツを走査して、全てのコンテンツ間の類似度を計算するのに対し、動的コンテンツ間類似度算出部111−1は、制御部から117から与えられた検索キーワードと検索メタ情報を有するコンテンツ間のみの類似度を計算する。
While the static content
動的コンテンツ間メタ情報付与コア部111−3は、動的コンテンツメタ情報付与部111より与えられた類似コンテンツ情報(図9を参照)を参照する部分を持つ。参照した前記類似コンテンツ情報に含まれる項目(2つのコンテンツURLと重み(類似度))の全てに対して、前記項目内のコンテンツURLを持つコンテンツのメタ情報をコンテンツメタ情報保持部101から参照する。参照したペアのコンテンツのメタ情報に対して、ペアの片方が持つメタ情報のメタ項目の値を、そのメタ項目の重みと前記項目で参照した重み(類似度)を掛け合わせた数値を、相対するメタ情報に加える(相対するメタ情報に加えようとしたメタ項目の値が無い場合はそのメタ項目の値を新たに加え、重みとして先に掛け合わせて算出した数値をセットする)。これをペアのコンテンツのお互いに対して行うことで、これらコンテンツのメタ情報を更新する。更新されたメタ情報はコンテンツメタ情報保持部101に更新される。
The dynamic content meta-information adding core unit 111-3 has a portion that refers to the similar content information (see FIG. 9) provided by the dynamic content meta-
次に動作について説明する。 Next, the operation will be described.
図5は第1の実施形態の処理の例を示すシーケンス図である。 FIG. 5 is a sequence diagram illustrating an example of processing according to the first embodiment.
まず、検索要求を取得した制御部117が、取得した検索条件と検索メタ情報を送ると共にコンテンツメタ情報の更新要求を動的コンテンツメタ情報付与部111に対して送る(ステップS301)。
First, the
それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1に対してコンテンツ間の類似度を算出することを要求する(ステップS302)。ここで、類似度算出の対象となるコンテンツは、制御部117が受け取った検索条件とメタ情報を含むコンテンツと全てのコンテンツの組み合わせとなります。
Receiving this, the dynamic content meta
類似度算出要求を受け取った動的コンテンツ間類似度算出部111−1は被閲覧履歴保持部105からコンテンツの被閲覧履歴情報を取得し(ステップS303、S304)、コンテンツ間の類似度情報を算出して、動的コンテンツメタ情報付与部111に返す(ステップS305)。 Upon receiving the similarity calculation request, the dynamic content similarity calculation unit 111-1 acquires content browsing history information from the browsing history holding unit 105 (steps S 303 and S 304), and calculates similarity information between the content. Then, it returns to the dynamic content meta information adding unit 111 (step S305).
それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間メタ情報付与コア部111−3に、取得したコンテンツ間の類似度を渡す(ステップS306)。
Receiving it, the dynamic content meta
コンテンツ間の類似度情報を受け取った動的コンテンツ間メタ情報付与コア部111−3は、コンテンツメタ情報保持部101のメタ情報を一部書き換える(ステップS307、S308、S309)。 The dynamic content meta-information adding core unit 111-3 that receives the similarity information between the contents rewrites part of the meta information of the content meta-information holding unit 101 (steps S307, S308, and S309).
メタ情報を書き換えた後に、動的コンテンツメタ情報付与部111は、処理が終了したことを呼び出し元の制御部117に伝える(ステップS310)。
After rewriting the meta information, the dynamic content meta
処理が終了したことを伝えられた制御部117は、検索部109に対して、検索条件と共に検索を依頼する(ステップS311)。
The
検索依頼された検索部109はサーチコア部109−1に対して検索を依頼し(ステップS312)、サーチコア部109−1は、キーワードとインデックス内のタームが一致するコンテンツ及びメタ項目の値の重みの総和をコンテンツメタ情報保持部10から抽出して、検索部109に渡す(ステップS313、S314、S315)。抽出したコンテンツを受け取った検索部109はスコアリング部109−3に受け取ったコンテンツを渡す(ステップS316)。
The requested
スコアリング部109−3は、検索結果(抽出されたコンテンツの、タイトル、URLなど)の並び替えを行い、その結果得た検索結果を検索部109に返し(ステップS316)、検索部109は、検索結果を、検索システム利用者に返す(ステップS318)。 The scoring unit 109-3 sorts the search results (such as the title and URL of the extracted content), and returns the search results obtained as a result to the search unit 109 (step S316). The search result is returned to the search system user (step S318).
実施例1では検索の再現率の向上を目的としたのに対し、実施例2は適合率の向上を目的とする。 The first embodiment aims to improve the recall rate of the search, while the second embodiment aims to improve the precision.
実施例2では、検索時に求めたメタ情報を、全体のメタ情報として永続化するのではなく、その検索時の状況用の検索用のメタ情報として生成する。 In the second embodiment, meta information obtained at the time of searching is not made permanent as the entire meta information, but is generated as meta information for searching for the situation at the time of searching.
実施例1では、コンテンツメタ情報保持部101のコンテンツメタ情報が検索実行毎に更新されるが、実施例2では、コンテンツメタ情報の更新は全体のコンテンツメタ情報保持部101で保持されるコンテンツメタ情報に反映させず、その検索時のみ有効なメタ情報フィールド(一時コンテンツメタ情報保持部121)を一時的に用意することで、他の現在の状況とは関連の無い過去の検索行動の履歴の影響を排除する。
In the first embodiment, the content meta information in the content meta
実施例2では現在の状況にのみ関連するコンテンツメタ情報の共有を図ることで、検索している状況(検索条件、利用メタ情報)が一致するコンテンツメタ情報の共有を狙うものである。 In the second embodiment, content meta information related only to the current situation is shared, thereby aiming to share content meta information that matches the search situation (search condition, use meta information).
実施例1では全ての検索行動がコンテンツのメタ情報の共有に反映されるため、コンテンツメタ情報の共有は早く進むメリットはあるが、複数の検索条件、複数の検索メタ情報における検索時での検索行動により同じコンテンツに対してメタ情報が共有されていくと、異なる状況(検索条件、検索メタ情報)下でのコンテンツメタ情報が混ざってしまい、コンテンツメタ情報が広く共有されることで検索の再現率は向上するものの、現在の状況とは関連の無いコンテンツメタ情報が含まれることで適合率が落ちてしまう可能性もあり得る。 In the first embodiment, since all search behaviors are reflected in the sharing of content meta information, sharing of content meta information has the advantage of advancing quickly, but searching at the time of searching with a plurality of search conditions and a plurality of search meta information When meta information is shared for the same content by action, content meta information under different circumstances (search conditions, search meta information) is mixed, and content meta information is widely shared to reproduce search Although the rate is improved, there is a possibility that the relevance rate is lowered by including content meta information that is not related to the current situation.
そこで実施例2では、その検索している状況(検索条件、検索メタ情報)下でのみ関連するコンテンツメタ情報の共有を図ることで、適合率の向上を目指す。 In the second embodiment, therefore, the content meta information that is related only under the search status (search condition, search meta information) is shared, thereby aiming at an improvement in the relevance rate.
実施例1のように、オリジナルのコンテンツのメタ情報を上書きしてしまうと、コンテンツが検索時にヒットしたときに、元々あったコンテンツメタ情報と検索条件が一致したから検索にヒットしたのか、履歴から付与されたメタ情報と検索条件が一致したから検索にヒットしたのかがわからなくなってしまう。更に、履歴から付与されたメタ情報は、その検索時の検索条件や検索メタ情報においての類似度により付与されるもので、すべての検索でのコンテンツメタ情報が次々とコンテンツメタ情報に追加されてしまうとコンテンツメタ情報がノイズとなってしまう可能性もある。実施例2では検索時に、オリジナルのコンテンツメタ情報保持部101とは別に検索用のメタ情報保持部(一時コンテンツメタ情報保持部121)を一時的に生成、利用することで実施例1の問題を解決する。
If the meta information of the original content is overwritten as in the first embodiment, when the content hits at the time of search, the search meta data matches the original content meta information and the search condition is matched. Since the given meta information matches the search condition, it is not possible to know whether the search has been hit. Furthermore, the meta information given from the history is given according to the search condition at the time of the search and the similarity in the search meta information, and the content meta information in all searches is added to the content meta information one after another. If this happens, the content meta information may become noise. In the second embodiment, the problem of the first embodiment can be solved by temporarily generating and using a search meta information holding unit (temporary content meta information holding unit 121) separately from the original content meta
図6は実施例2の構成ブロック図である。実施例2による検索システム202は、検索インタフェース部107、制御部117と、検索部109と、コンテンツメタ情報保持部101と、一時コンテンツメタ情報保持部121と、被閲覧履歴情報保持部105と、動的コンテンツメタ情報付与部111を含む。
FIG. 6 is a configuration block diagram of the second embodiment. The
またサーチ部は、一時コンテンツメタ情報保持のためのコンテンツ情報を要求された場合、コンテンツメタ情報保持部101で保持されているコンテンツに対し、要求時に渡されたコンテンツURLと一致するコンテンツ情報を全て取得して返す。
When the search unit is requested for content information for holding temporary content meta information, the search unit searches all content information that matches the content URL passed at the time of request for the content held in the content meta
検索インタフェース部107は、実施形態のものと同様なものである。
The
検索部109は、サーチコア部109−1B、スコアリング部109−3を含む。
The
サーチコア部109−1Bは、コンテンツメタ情報保持部101と、一時コンテンツメタ情報保持部121に保持されている検索条件、検索メタ情報と一致する検索フィールドにアクセスし、検索者から取得した検索条件と、検索メタ情報(検索者メタ情報、検索時のコンテキスト情報などを含む)と一致するコンテンツメタ項目の値を含むコンテンツメタ情報を持つコンテンツの識別情報を取得し、同時にコンテンツ毎に、検索者から取得した検索条件と、検索メタ情報に一致したコンテンツメタ項目の重みの和も一緒に取得する。
The search core unit 109-1B accesses the search condition and the search field that matches the search meta information held in the content meta
一時コンテンツメタ情報保持部121は、コンテンツメタ情報保持部101と同等の検索条件に一致するメタ情報を持つコンテンツを込みこむ機能を、検索メタ情報毎に保持することが可能な部分である。一時コンテンツメタ情報保持部121で保持されるデータの構成例を図7に示す。
The temporary content meta
動的コンテンツ間メタ情報付与コア部111−3Bは、動的コンテンツ間メタ情報付与コア部111−3の有する機能を備えているが、算出されたメタ情報の更新先が、コンテンツメタ情報保持部101ではなく一時コンテンツメタ情報保持部121となっている。
The dynamic content meta-information adding core unit 111-3B has the function of the dynamic content meta-information adding core unit 111-3, but the update destination of the calculated meta information is the content meta-information holding unit. The temporary content meta
算出されたメタ情報の更新先でのメタ情報はコンテンツメタ情報になります。また、検索メタ情報とコンテンツメタ情報の対応付けについてであるが、書き込まれる際には、検索者から入力された検索メタ情報からコンテンツメタ情報を算出し、図7の左側に、検索者から入力された検索メタ情報をそのまま入れて対応する右側に算出したコンテンツメタ情報が書き込まれる。検索時の読み込みの際は、検索者から入力された検索メタ情報と完全一致する図7の左側の検索メタ情報に対応する右側のコンテンツメタ情報が読み込まれる。 The meta information at the update destination of the calculated meta information is the content meta information. Further, regarding the association between the search meta information and the content meta information, when it is written, the content meta information is calculated from the search meta information input from the searcher, and input from the searcher on the left side of FIG. The calculated content meta information is written on the right side of the search meta information as it is. When reading at the time of search, the content meta information on the right side corresponding to the search meta information on the left side in FIG. 7 that completely matches the search meta information input by the searcher is read.
次に動作について説明する。図8は実施例2の処理を示すシーケンス図である。 Next, the operation will be described. FIG. 8 is a sequence diagram illustrating processing of the second embodiment.
まず、検索要求を取得した制御部117が、取得した情報と共にメタ情報の更新要求を動的コンテンツメタ情報付与部111に対して送る(ステップS401)。
First, the
それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間類似度算出部111−1に対してコンテンツ間の類似度を算出することを要求する(ステップS402)。
In response, the dynamic content meta
類似度算出要求を受け取った動的コンテンツ間類似度算出部111−1は被閲覧履歴保持部105からコンテンツの被閲覧履歴情報を取得し(ステップS403、S404)、類似コンテンツ情報を算出して、これを動的コンテンツメタ情報付与部111に返す(ステップS405)。類似コンテンツ情報は、類似すると判定された2つのコンテンツのURLとその間の類似度のセットを1単位する項目を0個以上持つ情報である。具体例は図9の通りである。 The dynamic content similarity calculation unit 111-1 that has received the similarity calculation request acquires the browsing history information of the content from the browsing history holding unit 105 (steps S 403 and S 404), calculates the similar content information, This is returned to the dynamic content meta information adding unit 111 (step S405). The similar content information is information having zero or more items each of which sets a set of similarities between two URLs determined to be similar. A specific example is as shown in FIG.
それを受けた動的コンテンツメタ情報付与部111は、動的コンテンツ間メタ情報付与コア部111−3Bに取得したコンテンツ間の類似度を渡す(ステップS406)。
Receiving it, the dynamic content meta
動的コンテンツ間メタ情報付与コア部113−1Bは、動的コンテンツメタ情報付与部111より受け取った類似コンテンツ情報を検索メタ情報と共にサーチ部に渡して一時コンテンツメタ情報保持部121のためのコンテンツ情報を要求し、類似コンテンツ情報に記載されたコンテンツURLのコンテンツ情報(コンテンツメタ情報保持部101で保持されている、渡されたコンテンツURLと一致するコンテンツの全ての情報)を取得する。そして取得したコンテンツ情報を一時コンテンツメタ情報保持部121に追加する(ステップS407、S408、S409)。
The dynamic content meta-information adding core unit 113-1B passes the similar content information received from the dynamic content meta-
一時コンテンツメタ情報を書き換えた後に、動的コンテンツメタ情報付与部111は、処理が終了したことを呼び出し元の制御部117に伝える(ステップS410)。
After rewriting the temporary content meta information, the dynamic content meta
処理が終了したことを伝えられた制御部117は、サーチコア部109−1Bに対して検索条件、検索メタ情報と共に検索を依頼する(ステップS411)。
The
検索依頼された検索部109は、サーチコア部109−1Bに対して検索条件と検索メタ情報を渡して検索を依頼し(ステップS412)、サーチコア部109−1Bは、検索条件と検索メタ情報を一時コンテンツメタ情報保持部121に渡し(ステップS413)、一時コンテンツメタ情報保持部121は、検索条件と検索メタ情報が一致するコンテンツのURLを抽出して、そのコンテンツのURLとメタ項目の値と一致する重みの和をサーチコア部109−1Bに渡す(S414)。
The
また、サーチコア部109−1Bは、コンテンツメタ情報保持部101に対して検索条件を渡して検索を依頼し(ステップS415)、コンテンツメタ情報保持部101は、検索条件が一致するコンテンツのURLを抽出して、そのコンテンツのURLとメタ項目の値と一致する重みの和をサーチコア部109−1Bに渡す(S416)。
In addition, the search core unit 109-1B sends a search condition to the content meta
サーチコア部109−1Bは、一時コンテンツメタ情報保持部121とコンテンツメタ情報保持部101から渡されたコンテンツのURLとメタ項目の値と一致する重みの和を検索部109に渡す(ステップS417)。
The search core unit 109-1B passes to the
コンテンツのURLとメタ項目の値と一致する重みの和を受け取った検索部109は、それらをスコアリング部109−3に渡して(ステップS418)、スコアリング部109−3は、検索結果の並び替えを行う。スコアリング部109−3は、その結果得た検索結果を、検索部109と制御部117を介して、検索システム利用者に返す。
The
なお、一時コンテンツメタ情報保持部121で保持されているデータは削除することが可能である。
The data held in the temporary content meta
本システムの効果は、検索対象となるコンテンツにメタ情報のあるものと無いものが混在している状態において、検索時の検索条件や検索者のメタ情報やコンテキスト情報に応じたメタ情報を共有することにより、コンテンツメタ情報が無いコンテンツに対しても状況に即した検索を実現することにある。 The effect of this system is to share the meta information according to the search condition at the time of search, the meta information of the searcher, and the context information in a state where the content to be searched is mixed with and without meta information Thus, it is possible to realize a search according to the situation even for content having no content meta information.
101 コンテンツメタ情報保持部
103 コンテンツ間類似度保持部
105 被閲覧履歴情報保持部
107 検索インタフェース部
109 検索部
109−1 サーチコア部
109−1B 実施例2でのサーチ部
109−3 スコアリング部
111 動的コンテンツメタ情報付与部
111−1 動的コンテンツ間類似度算出部
111−3、111−3B 動的コンテンツ間メタ情報付与コア部
113 静的コンテンツ間類似度保持部
115 静的コンテンツメタ情報付与部
117 制御部
121 一時コンテンツメタ情報保持部
DESCRIPTION OF
Claims (35)
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、
を備えることを特徴とするコンテンツメタ情報付与装置。 A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A dynamic content meta information adding unit that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party;
A content meta information providing apparatus comprising:
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索部は、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項9に記載のコンテンツ検索装置。 The dynamic content meta information providing unit further includes:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
The search unit excludes the updated content from the search target from the content meta information holding unit, and sets the temporary content meta information holding unit as a search target using the search condition and the search meta information as a key. The content search device according to claim 9.
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
を備えるコンテンツメタ情報付与装置におけるコンテンツメタ情報付与方法であって、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与ステップを備えることを特徴とするコンテンツメタ情報付与方法。 A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
A content meta information providing method in a content meta information providing apparatus comprising:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. Content meta information comprising a dynamic content meta information adding step for performing processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party Grant method.
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索ステップでは、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項21に記載のコンテンツ検索方法。 In the dynamic content meta information giving step,
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
In the search step, the updated content is excluded from the search target from the content meta information holding unit, and the temporary content meta information holding unit is set as a search target using the search condition and the search meta information as a key. The content search method according to claim 21, wherein:
コンテンツの被閲覧履歴情報を保持する被閲覧履歴情報保持部と、
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、前記コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行う動的コンテンツメタ情報付与部と、
を備えることを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。 A content meta information holding unit for holding content meta information (hereinafter referred to as “content meta information”);
Browsing history information holding unit for holding browsing history information of content;
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The similarity between the contents in the situation is calculated, and the content meta information held in the content meta information holding unit is determined between the contents determined to be similar to each other based on the similarity. A dynamic content meta information adding unit that performs processing to increase the weight of the content meta information corresponding to each content according to the similarity, or as content meta information of the other party;
A program for causing a computer to function as a content meta information providing device.
前記コンテンツの被閲覧履歴情報は、コンテンツ毎のコンテンツが検索にヒットしたときの検索条件、検索者メタ情報毎の閲覧の有意度の割合を示すことを特徴とするコンテンツメタ情報付与装置としてコンピュータを機能させるためのプログラム。 In the content meta-information provision apparatus of Claim 24,
The content browsing history information indicates a search condition when content for each content hits a search, and a percentage of browsing significance for each searcher meta information. A program to make it work.
コンテンツの所定の過去の被閲覧状況が与えられた場合、前記被閲覧状況に対応する過去の履歴を被閲覧履歴情報保持部から読み込み、読み込まれた前記被閲覧履歴情報を基に、前記被閲覧状況におけるコンテンツ間の類似度を算出し、前記類似度を基に相互に類似していると判断されたコンテンツ間で、一時コンテンツメタ情報保持部で保持しているそれぞれのコンテンツメタ情報をそれぞれの相手のコンテンツメタ情報として付与し、又は、前記類似度に応じて各コンテンツに対応する前記コンテンツメタ情報の重みを増やす処理を行い、
前記検索部は、更新のあったコンテンツに対しては、前記コンテンツメタ情報保持部からの検索対象から外し、前記一時コンテンツメタ情報保持部を検索条件と検索メタ情報をキーとして検索対象とすることを特徴とする請求項32に記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。 The dynamic content meta information providing unit further includes:
When a predetermined past browsing situation of content is given, a past history corresponding to the browsing situation is read from the browsing history information holding unit, and the browsing history information is read based on the read browsing history information read. The degree of similarity between the contents in the situation is calculated, and the contents meta information held in the temporary contents meta information holding unit between the contents determined to be similar to each other based on the degree of similarity A process for giving the content meta information of the other party or increasing the weight of the content meta information corresponding to each content according to the similarity,
The search unit excludes the updated content from the search target from the content meta information holding unit, and sets the temporary content meta information holding unit as a search target using the search condition and the search meta information as a key. A program for causing a computer to function as the content search device according to claim 32.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073862A JP2010225051A (en) | 2009-03-25 | 2009-03-25 | Content meta information impartment device and method thereof, and content retrieval device and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073862A JP2010225051A (en) | 2009-03-25 | 2009-03-25 | Content meta information impartment device and method thereof, and content retrieval device and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010225051A true JP2010225051A (en) | 2010-10-07 |
Family
ID=43042145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009073862A Withdrawn JP2010225051A (en) | 2009-03-25 | 2009-03-25 | Content meta information impartment device and method thereof, and content retrieval device and method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010225051A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140099341A (en) * | 2013-01-30 | 2014-08-12 | 에스케이플래닛 주식회사 | Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor |
WO2017158798A1 (en) * | 2016-03-17 | 2017-09-21 | 富士通株式会社 | Information processing device, information distribution system, information processing method, and information processing program |
WO2018011852A1 (en) * | 2016-07-11 | 2018-01-18 | 株式会社日立製作所 | Information service method, information service system, and information management method |
-
2009
- 2009-03-25 JP JP2009073862A patent/JP2010225051A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140099341A (en) * | 2013-01-30 | 2014-08-12 | 에스케이플래닛 주식회사 | Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor |
KR102088656B1 (en) * | 2013-01-30 | 2020-04-14 | 에스케이플래닛 주식회사 | Method to recommend associated digital contents via analysis of contents selection path and apparatus therefor |
WO2017158798A1 (en) * | 2016-03-17 | 2017-09-21 | 富士通株式会社 | Information processing device, information distribution system, information processing method, and information processing program |
JPWO2017158798A1 (en) * | 2016-03-17 | 2018-09-27 | 富士通株式会社 | Information processing apparatus, information distribution system, information processing method, and information processing program |
WO2018011852A1 (en) * | 2016-07-11 | 2018-01-18 | 株式会社日立製作所 | Information service method, information service system, and information management method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8271546B2 (en) | Method and system for URL autocompletion using ranked results | |
US8498984B1 (en) | Categorization of search results | |
CN106605221B (en) | Multi-user search system with method for instant indexing | |
JP5575902B2 (en) | Information retrieval based on query semantic patterns | |
JP5632124B2 (en) | Rating method, search result sorting method, rating system, and search result sorting system | |
US7487145B1 (en) | Method and system for autocompletion using ranked results | |
US8291014B2 (en) | User interface for web comments | |
WO2020019565A1 (en) | Search sorting method and apparatus, and electronic device and storage medium | |
US20140280106A1 (en) | Presenting comments from various sources | |
US8374975B1 (en) | Clustering to spread comments to other documents | |
US7765209B1 (en) | Indexing and retrieval of blogs | |
CA2790421C (en) | Indexing and searching employing virtual documents | |
WO2020019562A1 (en) | Search sorting method and device, electronic device, and storage medium | |
JP2011238276A (en) | Ranking blog documents | |
US20100121790A1 (en) | Method, apparatus and computer program product for categorizing web content | |
JP2010506255A (en) | Bookmarking and ranking | |
CN113297457B (en) | High-precision intelligent information resource pushing system and pushing method | |
US20150339387A1 (en) | Method of and system for furnishing a user of a client device with a network resource | |
CN111767445A (en) | Data searching method and device, computer equipment and storage medium | |
CN112883030A (en) | Data collection method and device, computer equipment and storage medium | |
CN111475725A (en) | Method, apparatus, device, and computer-readable storage medium for searching for content | |
CN101661490A (en) | Search engine, client thereof and method for searching page | |
RU2693193C1 (en) | Automated extraction of information | |
RU2452001C1 (en) | Method of displaying advertisement on internet resources depending on combined content thereof | |
JP2010225051A (en) | Content meta information impartment device and method thereof, and content retrieval device and method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100712 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100712 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20120605 |