JP4274907B2 - Content classification system and method, computer program, and recording medium - Google Patents

Content classification system and method, computer program, and recording medium Download PDF

Info

Publication number
JP4274907B2
JP4274907B2 JP2003381494A JP2003381494A JP4274907B2 JP 4274907 B2 JP4274907 B2 JP 4274907B2 JP 2003381494 A JP2003381494 A JP 2003381494A JP 2003381494 A JP2003381494 A JP 2003381494A JP 4274907 B2 JP4274907 B2 JP 4274907B2
Authority
JP
Japan
Prior art keywords
content
cluster
value
contents
branch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003381494A
Other languages
Japanese (ja)
Other versions
JP2005148843A (en
Inventor
恵太 大井
憲亨 林
岳弥 向垣内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003381494A priority Critical patent/JP4274907B2/en
Publication of JP2005148843A publication Critical patent/JP2005148843A/en
Application granted granted Critical
Publication of JP4274907B2 publication Critical patent/JP4274907B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワークを介した情報検索において、ユーザに対して提供するコンテンツのコンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体に関する。   The present invention relates to a content classification system and method, a computer program, and a recording medium for content provided to a user in information retrieval via a network.

従来、インターネットなどの情報通信ネットワークを介し、この情報通信ネットワークを利用するユーザ(利用者)が利用の目的であるコンテンツ(情報)を検索する際に、様々なコンテンツ分類方法による情報提供が行われている。特に、ユーザが目的とするコンテンツを、的確に素早く提供するための技術の一つとして、協調フィルタリング技術が知られている。   2. Description of the Related Art Conventionally, information is provided by various content classification methods when a user (user) using this information communication network searches for content (information) that is the purpose of use via an information communication network such as the Internet. ing. In particular, collaborative filtering technology is known as one of the technologies for accurately and quickly providing content intended by a user.

この協調フィルタリング技術は、ユーザの嗜好を過去の行動という形で履歴データベースに記録しておき、そのユーザと類似のコンテンツ検索を行っている他のユーザの検索履歴についての情報に基づいて、ユーザが求めるコンテンツや、あるいは嗜好性を的確に推測して提供する技術である。また、この協調フィルタリングの技術は、リコメンデーションサービスを提供する際に使用される代表的な手法でもある。この協調フィルタリング技術の効果を発揮させるには、可能な限りの多くのユーザについて、各々の嗜好に関する情報を多く収集し、また対象となるユーザの数も多人数である方が、より正確な嗜好性の推測を行うことができる。   This collaborative filtering technology records user preferences in the form of past actions in a history database, and based on information about the search history of other users who are searching for content similar to that user, It is a technology that provides the content that is sought and / or the preference by accurately guessing. This collaborative filtering technique is also a typical technique used when providing a recommendation service. In order to bring out the effects of this collaborative filtering technology, it is more accurate to collect as much information about each preference as possible for as many users as possible and to have a large number of target users. A sex guess can be made.

なお、リコメンデーションサービスとは、インターネット上に展開するバーチャルな通信販売の商店などで、利用するユーザの嗜好性や要求を分析し、アクセスしてきたそれぞれのユーザごとに、そのユーザが興味を持ちそうな情報を選択して表示するサービスである。例えば、Webサイトにおいて、所定の分類に基づくユーザ層ごとに異なるトップメニューを用意する、といったことが行われている。   Note that the recommendation service is a virtual mail order store on the Internet that analyzes the preferences and requirements of users to use, and for each user who has accessed, the user may be interested. It is a service that selects and displays various information. For example, a different top menu is prepared for each user group based on a predetermined classification on a Web site.

こうした協調フィルタリング技術の応用として、従前より、Webサイトの閲覧要求をした端末のIPアドレスと、当該閲覧されたWebサイトのURL(Universal Resource Locator)とを要求の度に記録し、アクセス履歴を生成している。このアクセス履歴に基づいて、当該端末を利用するユーザに対し、このユーザが検索しているコンテンツやWebに類似する他のWebサイトを推奨することが行われている。   As an application of such collaborative filtering technology, the IP address of the terminal that requested the browsing of the website and the URL (Universal Resource Locator) of the browsed website are recorded for each request to generate an access history. is doing. Based on this access history, it is recommended that the user using the terminal recommends the content that the user is searching for or another Web site similar to the Web.

図9は、従来における代表的なコンピュータネットワークの構成と、該ネットワークに使用されるポータルサーバ102の構成を示す図である。ポータルサーバ102は、不特定多数のユーザ103に共用される端末101A、101B、101C、101Dに対し、インターネット104を介して接続されている。端末は、例えば、インターネットカフェにあるようなコンピュータである。   FIG. 9 is a diagram illustrating a configuration of a typical computer network in the past and a configuration of the portal server 102 used in the network. The portal server 102 is connected via the Internet 104 to terminals 101A, 101B, 101C, and 101D shared by an unspecified number of users 103. The terminal is, for example, a computer in an internet cafe.

ポータルサーバ102は、アイテム記憶部105を備え、該アイテム記憶部105にはリンク集ページを構成するページデータ(以下、アイテム)として、たとえばJ、K、L、M、Nが記憶されている。また、説明の便宜上、アイテム数については、実際に運用する場合よりも少なくしている。   The portal server 102 includes an item storage unit 105. The item storage unit 105 stores, for example, J, K, L, M, and N as page data (hereinafter referred to as items) constituting the link collection page. Further, for convenience of explanation, the number of items is set to be smaller than that in actual operation.

ポータルサーバ102は、アイテム提供部106を備え、該アイテム提供部106は、端末にアイテムを送信して表示させる。例えば、あるユーザ103の操作により端末101AがアイテムKを要求すると、アイテム提供部106は、アイテム記憶部105からアイテムKを読み出して端末101Aに表示させる。ポータルサーバ102は、アクセス履歴記憶部107を備え、該アクセス履歴記憶部107には、アクセス履歴100が記憶される。   The portal server 102 includes an item providing unit 106, and the item providing unit 106 transmits and displays items on the terminal. For example, when the terminal 101A requests an item K by an operation of a certain user 103, the item providing unit 106 reads the item K from the item storage unit 105 and displays the item K on the terminal 101A. The portal server 102 includes an access history storage unit 107, and an access history 100 is stored in the access history storage unit 107.

図10は、アクセス履歴100を示す図である。アクセス履歴100にあっては、端末101A、101B、101C、101Dのいずれかが、アイテムJ、K、L、M、Nのいずれかを要求した(アクセスしたという)時刻(アクセス時刻)と、当該アクセスした端末のIPアドレスと、該アクセスされたアイテムのURLと、を含む行をアクセスの度に記録することによって、当該行はアクセス時刻が早い順に並んでいる。   FIG. 10 is a diagram showing the access history 100. In the access history 100, any one of the terminals 101A, 101B, 101C, and 101D requested (accessed) one of the items J, K, L, M, and N (access time), and By recording a line including the IP address of the accessed terminal and the URL of the accessed item for each access, the line is arranged in order of early access time.

ポータルサーバ102は、アイテム推奨部108を備えている。このアイテム推奨部108は、例えば、アイテムMを要求されると、アクセス履歴100に記録されている他のアイテムJ、K、L、Nを端末へのURL表示等により推奨する。ここで、端末からの要求がアイテムMに変われば、アイテム提供部106がアイテムMを提供することになる。なお、類似のコンテンツ分類方法に関する技術が特許文献1や非特許文献1に記載されている。
特開2002−342368号公報 本橋 健 外1名 「アクセス履歴のみから利用者の嗜好を分析推薦するアウェアネスネット」、情報処理学会、第62回大会、pp.253−256、2001年3月
The portal server 102 includes an item recommendation unit 108. For example, when the item M is requested, the item recommendation unit 108 recommends other items J, K, L, and N recorded in the access history 100 by displaying a URL on the terminal. Here, if the request from the terminal changes to the item M, the item providing unit 106 provides the item M. Techniques relating to similar content classification methods are described in Patent Document 1 and Non-Patent Document 1.
JP 2002-342368 A Takeshi Motohashi 1 “Awareness Net that analyzes and recommends user preferences based on access history only”, IPSJ, 62nd Annual Meeting, pp. 253-256, March 2001

上述した従来技術によるコンテンツ分類方法においては、ユーザが目的とするコンテンツを検索して、例えばあるWebサイトに接続してコンテンツを見つけても、このコンテンツに対して、単純に関連したほかのコンテンツを表示するのみであった。このため、ユーザにとっては、目的とするコンテンツが表示されるものの、そのコンテンツに単純に関連したコンテンツの表示は逆に不要な情報であったり、あるいは既知の情報でもあった。   In the content classification method according to the above-described prior art, even if the user searches for the target content and finds the content by connecting to a certain website, for example, other related content is simply related to this content. It was only displayed. For this reason, although the target content is displayed for the user, the display of the content simply related to the content is, on the contrary, unnecessary information or known information.

これらの関連するコンテンツは複数存在しているので、一度に表示すると混乱を招いてしまう。また、目的とするコンテンツとの関連の度合いや、ユーザの嗜好によるコンテンツ同士の関連性の度合いなどをパラメータとして加えた表示をすることもできなかった。ユーザにとってこうした関連情報は必要ではあるものの、単純に関連性のみで関連付けがされたコンテンツの情報の提供は、コンテンツ検索の妨げになる場合もあった。   Since there are a plurality of these related contents, displaying them all at once will cause confusion. In addition, it is not possible to display a parameter by adding the degree of association with the target content or the degree of association between contents according to user preferences. Although such related information is necessary for the user, provision of content information that is related only by relevance may hinder content search.

また、リコメンデーションサービスを行っているWebサイトを介した電子商取引の商店では、顧客であるユーザに対して顧客の求める商品(コンテンツ)に関連した商品を提示して、ユーザから更なる需要を生み出す要求がある。しかしながら、ユーザの履歴情報に基づいた推測による商品の提示や、あるいは単純にユーザから要求のあった商品に類似した商品を提示するだけでは、ユーザに新規な需要を起こさせることが難しかった。   In addition, in an e-commerce store through a website that provides a recommendation service, products related to products (contents) requested by customers are presented to users who are customers to generate further demand from users. There is a request. However, it has been difficult to cause a new demand to the user simply by presenting a product based on a guess based on the user's history information or simply presenting a product similar to the product requested by the user.

本発明は、上記に鑑みてなされたもので、その目的とするところは、www(World Wide Web)上における多くのコンテンツが構成するコンテンツ群の構造を、ユーザのアクセス履歴に基づいてクラスタリング(構成)し、ユーザの要求に合ったコンテンツおよびコンテンツ群の特徴を俯瞰的にユーザに提供可能なコンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体を提供することにある。   The present invention has been made in view of the above. The purpose of the present invention is to cluster the structure of a content group constituted by many contents on www (World Wide Web) based on the access history of the user (configuration). And providing a content classification system and method, a computer program, and a recording medium that can provide users with a comprehensive overview of content and content group characteristics that meet the user's requirements.

課題を解決するために、請求項1に記載の本発明は、ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類方法であって、前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aと、処理Aの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成する処理と、処理Aの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bと、処理Bの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶する処理と、処理Bの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cと、をコンピュータが実行することによりコンテンツの分類を行う。 In order to solve the problem, the present invention according to claim 1 is a content classification method for classifying content searched by a user via a network into a cluster including a content and an association between the content. Each time the content Q is accessed in the search process, the content Q is associated with each of the contents that have already been registered in the access list storing the access history and are different from the content Q, and the number of associations is determined by branching. a processing a to be stored in the access list associated with said branch value and the content Q as, after the processing a, the content Q is the cluster list for storing the association between the content and the content is information about the cluster If you do not belong to the storage cluster, only the content Q And generating the belonging cluster, after the process A, when the branch value exceeds a preset threshold s, when the both ends content of the branch values corresponding belong to different clusters, the cluster deletes the information related to the cluster from the cluster list for each, to generate a cluster Cx including associations between their content and content belonging to the cluster, it sets the number of contents belonging to the cluster Cx pre reference value and process B to be compared with L, after the process B, when the number of contents belonging to the cluster Cx is equal to or less than the reference value L, a process of storing information about the cluster Cx to said cluster list, after the processing B , when the number of contents belonging to the cluster Cx is greater than the reference value L, The number of threshold s or more branch value included in the serial cluster Cx extracts the content Y of the maximum, the cluster Cx all branch value of the content Y, as the threshold value s or 0 in a predetermined selection means F Content is classified by a computer executing a process C for storing information on the cluster list.

また、請求項2に記載の本発明は、請求項1において、前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除する。 In addition, the present invention according to claim 2 provides the access list according to claim 1, wherein the access list includes stored contents arranged in time series, and the number of stored contents is a predetermined value p set in advance. The oldest content is deleted in order of time series so that it becomes as follows.

また、請求項4に記載の本発明は、請求項1〜3のいずれかにおいて、前記処理Cは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cの終了後に再び前記処理Cを行うものであって、前記チェック情報が付与されたコンテンツは抽出しない。 Further, in the present invention described in claim 4, in any one of claims 1 to 3, the process C adds check information indicating that the extracted content Y has been extracted, and the process C The processing C is performed again after the completion, and the content with the check information is not extracted.

また、請求項3に記載の本発明は、請求項1または2のいずれかにおいて、前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換する。 Further, in the present invention described in claim 3, in any one of claims 1 and 2, the sorting means F converts the branch value of the maximum value among the branch values of the content Y into the threshold value s, all the cases the number of one of the branch value greater than or equal to the threshold value s of the content that is associated with the content Y, converts the branch value to the threshold s, not converted into the threshold s the branch value is 0 Convert to

また、請求項に記載の本発明は、請求項において、前記処理Cの終了後において、前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cを実行し、前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cを実行するFurther, the present invention according to claim 5 is the case where the number of contents belonging to the cluster Cx associated with contents belonging to another cluster is one after the completion of the processing C in claim 4 . If the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is stored in the cluster list, and there is a content to which the check information is not given to the contents belonging to the cluster Cx. Executes the process C again, and stores the cluster Cx in the cluster list when the number of contents belonging to the cluster Cx is less than or equal to the reference value L when the associated number is two or more. If the number of contents belonging to the cluster Cx is larger than the reference value L, the process C is executed again. To.

また、請求項に記載の本発明は、請求項1〜5のいずれかにおいて、前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDうちのいずれかを含む。 According to a sixth aspect of the present invention, in any one of the first to fifth aspects, the access history identifies the access time and the user in addition to the content ID for identifying the content. include any of the user ID to.

また、請求項7に記載の本発明は、ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類システムであって、前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶するとともに、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成する処理A手段と、前記処理A手段の処理の後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理B手段と、前記処理B手段の処理の後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理C手段と、を備える。 According to a seventh aspect of the present invention, there is provided a content classification system for classifying content searched by a user via a network into a cluster including a content and an association between the content, wherein the user performs the content in the search process. each time access to Q, the associates and respective content different contents Q and the content Q in already registered in the access list for storing a history of the access, and the content Q the number of association as branch value When the branch value is associated and stored in the access list, and the content Q does not belong to the cluster stored in the cluster list storing the content that is information about the cluster and the association between the content, the content Create a cluster to which only Q belongs And management A unit, after processing of the processing A means, in the case where the branch value exceeds a preset threshold s, when the respective contents of both ends of the branch values corresponding belong to different clusters, the For each of the clusters, information related to the cluster is deleted from the cluster list, and a cluster Cx including the contents belonging to the clusters and the association between the contents is generated, and the number of contents belonging to the cluster Cx is set in advance. If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the processing of the processing B means to be compared with the value L and the processing B means, information on the cluster Cx is stored in the cluster list; If the number of contents belonging to the cluster Cx is greater than the reference value L, the class The number of threshold s or more branch value included in the Cx extracts the content Y with the maximum information of all branch value of the content Y, about the cluster Cx as the threshold value s or 0 in a predetermined selection means F Is stored in the cluster list.

また、請求項8に記載の本発明は、請求項7において、前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除する。 According to an eighth aspect of the present invention, in the seventh aspect of the present invention, the access list includes stored contents arranged in time series, and the number of stored contents is a predetermined value p set in advance. The oldest content is deleted in order of time series so that it becomes as follows.

また、請求項10に記載の本発明は、請求項7〜9のいずれかにおいて、前記処理C手段は、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理C手段の処理の終了後に再び前記処理C手段の処理を行うものであって、前記チェック情報が付与されたコンテンツは抽出しない。 In addition, according to a tenth aspect of the present invention, in any one of the seventh to ninth aspects, the processing C means adds check information indicating that the content Y has been extracted to the processing C. The processing of the processing means C is performed again after the processing of the means is completed, and the content to which the check information is added is not extracted.

また、請求項9に記載の本発明は、請求項7または8のいずれかにおいて、前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換する。 Further, in the present invention described in claim 9 according to any one of claims 7 and 8, the sorting means F converts the maximum branch value of the branch values of the content Y into the threshold value s, all the cases the number of one of the branch value greater than or equal to the threshold value s of the content that is associated with the content Y, converts the branch value to the threshold s, not converted into the threshold s the branch value is 0 Convert to

また、請求項11に記載の本発明は、請求項10において、前記処理C手段による処理の終了後において、前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理C手段による処理を実行し、前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理C手段による処理を実行するFurther, the invention according to claim 11, in claim 10, after the completion of processing by the processing C unit, number one content is associated with the contents belonging to another cluster belonging to said cluster Cx In this case, if the check information is assigned to all of the contents belonging to the cluster Cx, the cluster Cx is stored in the cluster list, and the contents to which the check information is not assigned are assigned to the contents belonging to the cluster Cx. When the number of contents belonging to the cluster Cx is less than or equal to the reference value L when the associated number is two or more, the cluster Cx is set to the cluster Cx. The number of contents stored in the cluster list and belonging to the cluster Cx is equal to the reference value L. Again executes processing by the processing C means if even larger.

また、請求項12に記載の本発明は、請求項7〜11のいずれかにおいて、前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDうちのいずれかを含む。 According to a twelfth aspect of the present invention, in any one of the seventh to eleventh aspects, the access history identifies the access time and the user in addition to the content ID for identifying the content. include any of the user ID to.

また、請求項13に記載の本発明は、ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類プログラムであって、前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aのステップと、前記処理Aのステップの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成するステップと、前記処理Aのステップの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bのステップと、前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶するステップと、前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cのステップと、をコンピュータに実行させることによりコンテンツの分類を行う。 According to a thirteenth aspect of the present invention, there is provided a content classification program for classifying content searched by a user via a network into a cluster including a content and an association between the content, wherein the user performs the content in the search process. each time access to Q, the associates and respective content different contents Q and the content Q in already registered in the access list for storing a history of the access, and the content Q the number of association as branch value The process A step of associating the branch value with the access list and storing it in the access list; and after the step of the process A, the content Q is stored in a cluster list that stores content that is information about clusters and the association between the content. If you do not belong to the storage cluster, the A step of content Q only produces a cluster belonging, after step of the process A, when the branch value exceeds a preset threshold s, both ends content of the branch values corresponding different clusters When the data belongs to the cluster Cx, the information about the cluster is deleted from the cluster list for each of the clusters , and the cluster Cx including the contents belonging to the clusters and the association between the contents is generated, and the number of contents belonging to the cluster Cx If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the step of the process B and the step of the process B, the information about the cluster Cx is a step of storing the cluster list, step of the process B In, when the number of contents belonging to the cluster Cx is greater than the reference value L, the number of branch value than the threshold s included in the cluster Cx extracts the content Y of the maximum, all of the content Y The contents are classified by causing the computer to execute the step of processing C in which information regarding the cluster Cx is stored in the cluster list by setting the branch value as the threshold value s or 0 by the predetermined sorting and selecting means F.

また、請求項14に記載の本発明は、請求項13において、前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除する。 According to a fourteenth aspect of the present invention, in the thirteenth aspect, the access list includes stored contents arranged in time series, and the number of stored contents is a predetermined value p set in advance. The oldest content is deleted in order of time series so that it becomes as follows.

また、請求項16に記載の本発明は、請求項13〜15のいずれかにおいて、前記処理Cのステップは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cのステップの終了後に再び前記処理Cを行うものであって、前記チェック情報が付与されたコンテンツは抽出しない。 Further, in the present invention described in claim 16, in any one of claims 13 to 15, the step of the process C provides check information indicating that the extracted content Y has been extracted, and the process The process C is performed again after the end of the step C, and the content with the check information is not extracted.

また、請求項15に記載の本発明は、請求項13または14のいずれかにおいて、前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換する。 Further, in the present invention described in claim 15, in any one of claims 13 and 14, the sorting unit F converts the branch value of the maximum value among the branch values of the content Y into the threshold value s, all the cases the number of one of the branch value greater than or equal to the threshold value s of the content that is associated with the content Y, converts the branch value to the threshold s, not converted into the threshold s the branch value is 0 Convert to

また、請求項17に記載の本発明は、請求項16において、前記処理Cのステップの終了後において、 前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cのステップを実行し、前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cのステップを実行するIn addition, in the present invention described in claim 17 , in claim 16 , after the step of the process C is completed, the number of contents belonging to the cluster Cx associated with contents belonging to another cluster is one. In this case, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is stored in the cluster list, and there is a content to which the check information is not given to the contents belonging to the cluster Cx. If the number of contents belonging to the cluster Cx is equal to or less than the reference value L when the associated number is two or more, the cluster Cx is changed to the cluster. The number of contents stored in the list and belonging to the cluster Cx is larger than the reference value L If so, the process C step is executed again .

また、請求項18に記載の本発明は、請求項13〜17のいずれかにおいて、前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDうちのいずれかを含む。 In addition, in the present invention described in claim 18 according to any one of claims 13 to 17 , the access history identifies the time of access and the user in addition to the content ID for identifying the content. include any of the user ID to.

また、請求項19に記載の本発明は、請求項13〜18のいずれかにおいて、前記ネットワークに接続されたプロキシサーバ上で実行される。 The present invention according to claim 19 is executed on a proxy server connected to the network according to any one of claims 13 to 18 .

また、請求項20に記載の本発明は、請求項13〜18のいずれかにおいて、前記ユーザが目的とする前記コンテンツの検索に用いるローカル端末上で実行される。 The present invention described in claim 20 is executed on a local terminal used for searching for the content intended by the user in any one of claims 13-18 .

また、請求項21に記載の本発明は、請求項13〜18のいずれかにおいて、前記ネットワークに接続するアプリケーションサービスプロバイダにて実行される。 The invention according to claim 21 is executed by an application service provider connected to the network according to any one of claims 13 to 18 .

また、請求項22に記載の本発明は、ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類プログラムを記録した記録媒体であって、前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aのステップと、前記処理Aのステップの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成するステップと、前記処理Aのステップの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bのステップと、前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶するステップと、前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cのステップと、をコンピュータに実行させることによりコンテンツの分類を行うことを特徴とするコンテンツ分類プログラムを記録する。 The present invention according to claim 22 is a recording medium on which a content classification program for classifying content searched by a user via a network into a cluster including content and an association between the content is recorded. Each time the content Q is accessed in the search process, the content Q is associated with each of the contents that have already been registered in the access list storing the access history and are different from the content Q, and the number of associations is determined by branching. a step of processing a to be stored in the access list associated with said branch value and the content Q as, after the step of the process a, the content Q is an association between the content and the content is information about the cluster belonging to the storage cluster to cluster list to store If not, the steps of generating a cluster in which only the content Q belongs, after said step of processing A, when the branch value exceeds a preset threshold s, the contents of both ends of the branch value applicable Each of the clusters is deleted from the cluster list for each of the clusters , and the cluster Cx including the contents belonging to the clusters and the association between the contents is generated, and the number of contents belonging to the cluster Cx If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the step of the process B and the step of the process B, the information about the cluster Cx is a step of storing the cluster list, after the step of the process B, before If the number of contents belonging to a cluster Cx is greater than the reference value L, the number of threshold s or more branch value included in the cluster Cx extracts the content Y of the maximum, all the branch value of this content Y Content is classified by causing a computer to execute a step of processing C for storing information on the cluster Cx in the cluster list as the threshold value s or 0 by a predetermined sorting means F Record the classification program.

また、請求項23に記載の本発明は、請求項22において、前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除することを特徴とするコンテンツ分類プログラムを記録する。 Further, in the present invention described in claim 23 according to claim 22, wherein the access list is a list of stored contents in time series, and the number of stored contents is a predetermined value p set in advance. A content classification program is recorded, which is characterized in that the content is deleted in order from the oldest content in time series as described below.

また、請求項25に記載の本発明は、請求項22〜24のいずれかにおいて、前記処理Cのステップは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cのステップの終了後に再び前記処理Cのステップを行うものであって、前記チェック情報が付与されたコンテンツは抽出しないことを特徴とするコンテンツ分類プログラムを記録する。 According to a twenty-fifth aspect of the present invention, in any one of the twenty-second to twenty-fourth aspects, the step of the process C provides check information indicating that the extracted content Y has been extracted, and the process A content classification program is recorded in which the step of the process C is performed again after the completion of the step C, and the content to which the check information is added is not extracted.

また、請求項24に記載の本発明は、請求項22または23のいずれかにおいて、前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換することを特徴とするコンテンツ分類プログラムを記録する。 Further, in the present invention described in claim 24, in any one of claims 22 and 23, the sorting means F converts the branch value of the maximum value among the branch values of the content Y into the threshold value s, all the cases the number of one of the branch value greater than or equal to the threshold value s of the content that is associated with the content Y, converts the branch value to the threshold s, not converted into the threshold s the branch value is 0 A content classification program characterized by being converted to is recorded.

また、請求項26に記載の本発明は、請求項25において、前記処理Cのステップの終了後において、前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cのステップを実行し、前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cのステップを実行することを特徴とするコンテンツ分類プログラムを記録する。 Further, in the present invention described in claim 26 , in claim 25 , after the step of the process C is completed, the number of contents belonging to the cluster Cx associated with contents belonging to another cluster is one. In this case, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is stored in the cluster list, and there is a content to which the check information is not given to the contents belonging to the cluster Cx. If the number of contents belonging to the cluster Cx is equal to or less than the reference value L when the associated number is two or more, the cluster Cx is changed to the cluster. The number of contents stored in the list and belonging to the cluster Cx is larger than the reference value L Recording the content classification program and executes again the step of the processing C if Re.

また、請求項27に記載の本発明は、請求項22〜26のいずれかにおいて、前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDうちのいずれかを含むことを特徴とするコンテンツ分類プログラムを記録する。 According to a twenty-seventh aspect of the present invention, in any one of the twenty-second to twenty- sixth aspects, the access history identifies the access time and the user in addition to the content ID for identifying the content. recording the content classification program characterized by comprising any of the user ID to.

本発明によれば、www(World Wide Web)上における多くのコンテンツが構成するコンテンツ群の構造を、ユーザのアクセス履歴に基づいてクラスタリング(構成)し、ユーザの要求に合ったコンテンツおよびコンテンツ群の特徴を俯瞰的にユーザに提供可能なコンテンツ分類システムおよび方法、コンピュータプログラムおよび記憶媒体を提供することができる。   According to the present invention, the structure of a content group constituted by many contents on www (World Wide Web) is clustered (configured) based on the user's access history, and the content and the content group that meet the user's request are classified. It is possible to provide a content classification system and method, a computer program, and a storage medium that can provide a user with an overview of features.

図1に示すのは、本発明に係るコンテンツ分類システムについての実施の形態を説明するための概略構成図である。この図1には、クラスタリング装置1と、アクセス履歴データベース6と、サービス提供装置8とが示されている。さらに、クラスタリング装置1は、処理Aモジュール3と、処理Bモジュール4と、処理Cモジュール5と、統合データベース2と、API(Application Program Interface)7とを少なくとも有している。   FIG. 1 is a schematic configuration diagram for explaining an embodiment of a content classification system according to the present invention. In FIG. 1, a clustering device 1, an access history database 6, and a service providing device 8 are shown. Further, the clustering apparatus 1 includes at least a processing A module 3, a processing B module 4, a processing C module 5, an integrated database 2, and an API (Application Program Interface) 7.

このような構成においては、図示しないユーザがサービス提供装置8を操作して目的とするコンテンツを検索する場合に、アクセス履歴データベース6に記憶されたこのユーザのアクセス履歴、つまり、あるコンテンツにサービス提供装置8からアクセスした時刻、ユーザを個体識別するためのユーザID、コンテンツを個体識別するためのコンテンツID、といったものを時系列に沿って並べたものを利用して、コンテンツのクラスタリングを実行することを意図している。なお、ここでクラスタリングとは情報の選別/分類を行うためのフィルタリング技術を意味しており、数多くのコンテンツを、そのコンテンツ間の関係に基づいて複数のグループ(群)と同義のクラスタ群として分類することである。   In such a configuration, when a user (not shown) operates the service providing apparatus 8 to search for a target content, the user's access history stored in the access history database 6, that is, a service is provided to a certain content. Performing content clustering by using a time series of the access time from the apparatus 8, a user ID for individual identification of a user, and a content ID for individual identification of content. Is intended. Here, clustering means a filtering technique for selecting / classifying information, and many contents are classified as a cluster group synonymous with a plurality of groups (groups) based on the relationship between the contents. It is to be.

このアクセス履歴データベース6に記憶されたアクセス履歴は、クラスタリング装置1によってクラスタリングが実行され、サービス提供装置8からのクラスタリングの結果の呼び出しに対して、クラスタリング結果を出力する。また、サービス提供装置8とクラスタリング装置1との間は、API7により結合されている。このAPI7は、クラスタリング装置1とサービス提供装置8との間で共通に使用されるプログラム上の命令や関数の集合体である。クラスタリングやコンテンツの検索などの各種の命令は、このAPI7に記憶された命令や関数に従って伝達される。   The access history stored in the access history database 6 is clustered by the clustering device 1, and the clustering result is output in response to the clustering result call from the service providing device 8. Further, the service providing device 8 and the clustering device 1 are connected by an API 7. This API 7 is a set of instructions and functions on a program that are used in common between the clustering apparatus 1 and the service providing apparatus 8. Various commands such as clustering and content search are transmitted according to commands and functions stored in the API 7.

クラスタリング装置1では、アクセス履歴データベース6に記憶されたアクセス履歴に基づいて、サービス提供装置8を利用して目的とするコンテンツを検索しているユーザへ、そのコンテンツと関連の深いコンテンツを、たとえばモニタ画面上に表示することができる。こうした機能を実現するために、アクセス履歴を処理するための処理Aモジュール3と処理Bモジュール4と処理Cモジュール5とが設けられており、これらの処理モジュールは全て統合データベース2によって制御され、コンテンツ間の関係を保持するデータベースの役目を果たしている。   In the clustering device 1, for a user who is searching for a target content using the service providing device 8 based on the access history stored in the access history database 6, content closely related to the content is monitored, for example. Can be displayed on the screen. In order to realize such a function, a process A module 3, a process B module 4 and a process C module 5 for processing the access history are provided, all of which are controlled by the integrated database 2, It plays the role of a database that maintains the relationship between them.

次に、図2〜図4を参照しながら、この処理Aモジュール3、処理Bモジュール4、処理Cモジュール5にて実行される処理について説明する。   Next, processes executed by the process A module 3, the process B module 4, and the process C module 5 will be described with reference to FIGS.

まず、図2に示す処理Aモジュール3にて行われる処理Aを説明する。ステップS1にてユーザによるコンテンツ検索が開始される。このコンテンツ検索はサービス提供装置8からのコンテンツ検索命令によるものである。次に、ステップS2にてユーザがコンテンツQにアクセスしたという履歴をデータとして取得する。ここで、アクセスされたコンテンツQが初めてアクセスされた場合は、ステップS3にてそのコンテンツQのみの1点からなるクラスタCq(グループ)として処理する。また、コンテンツQへのアクセスが初めてのアクセスでない場合は、そのままステップS4へ進む。   First, the process A performed by the process A module 3 shown in FIG. 2 will be described. In step S1, content search by the user is started. This content search is based on a content search command from the service providing apparatus 8. Next, a history that the user has accessed the content Q is acquired as data in step S2. Here, when the accessed content Q is accessed for the first time, it is processed as a cluster Cq (group) consisting of only one point of the content Q in step S3. If the access to the content Q is not the first access, the process proceeds to step S4 as it is.

次に、ステップS4にて、ユーザのアクセスリストにあるコンテンツRと、アクセスしたコンテンツQとの間の枝値の重みに1を加える。ここで、アクセスリストとは、ユーザがアクセスしたコンテンツQと、そのコンテンツQをコンテンツRと関連付け(枝値)した回数とをデータとして対応付けて時系列的に並べたデータ群である。このアクセスリストは、統合データベース2に記憶されている。また、枝値とは、あるコンテンツにユーザがアクセスしたことに対して、このアクセスに伴いあるコンテンツとアクセスリストのコンテンツとの関連付けが行われることを、相互のコンテンツの間を結ぶ1本の枝に見立てて模式的に表現したものであり、関連付けの回数が増えるとこの枝の本数も増え枝値も大きくなる、という表現を説明のために用いている。重み付けとは、この枝値の値を指している表現であり、枝値が0ならば重み付けは0であるが、たとえば枝がこれに1本加われば、枝値での重み付けは1となる。   Next, in step S4, 1 is added to the weight of the branch value between the content R in the user's access list and the accessed content Q. Here, the access list is a data group in which the content Q accessed by the user and the number of times the content Q is associated (branch value) with the content R are associated as data and arranged in time series. This access list is stored in the integrated database 2. The branch value is a single branch that connects the contents to each other when the user accesses a certain content to associate the content with the content in the access list. The expression that the number of branches increases and the branch value increases as the number of associations increases is used for explanation. The weighting is an expression indicating the value of the branch value. If the branch value is 0, the weight is 0. For example, if one branch is added, the weight of the branch value is 1.

次に、ステップS5にて、ユーザのアクセスリストにアクセスしたコンテンツQを載せる。このとき、アクセスリストの大きさは、常に予め設定された所定値p以下になるように時系列的に旧いコンテンツから順に削除されている。次に、ステップS6にて、新たに重み付けの重みが予め設定された閾値s以上になった枝値を抽出して列挙する。列挙した全ての枝値の重みに対して次段の処理Bモジュール4にて処理Bを実行する。なお、閾値s以上になった枝値が無い場合は、再びステップS1に戻り、ステップS1〜ステップS6までの処理を繰り返し実行する。   Next, in step S5, the content Q accessed in the user access list is placed. At this time, the size of the access list is deleted in order from the oldest content in time series so as to always be equal to or smaller than a predetermined value p set in advance. Next, in step S6, branch values whose weighting weights are not less than a preset threshold value s are extracted and listed. The process B module 4 in the next stage executes the process B for all enumerated weights of branch values. If there is no branch value that is greater than or equal to the threshold value s, the process returns to step S1 again, and the processes from step S1 to step S6 are repeated.

以上説明したように、処理Aにおいては、ユーザがあるコンテンツ(たとえばコンテンツQ)にアクセスしたことによって、「アクセスされたコンテンツ」と「アクセスリストに既に載っているコンテンツ(たとえばコンテンツR)」との間を枝で結ぶ処理を行う。「アクセスリストに既に載っているコンテンツ」は1個以上であり、従って「アクセスされたコンテンツ」から「アクセスリストに既に載っているコンテンツ」へ繋がる枝の本数は1本以上となる。ユーザが目的とするコンテンツを検索する過程で、数多くのコンテンツにアクセスする都度に、こうした枝が繋がって増えてゆく。なお、このアクセスリストが初めて起動した直後などの原始の状態では、「アクセスリストに既に載っているコンテンツ」は存在しないので、従ってユーザが最初にアクセスしたコンテンツをそのままアクセスリストに載せる処理を行う。   As described above, in the process A, when the user accesses a certain content (for example, the content Q), the “accessed content” and “the content already on the access list (for example, the content R)” A process of connecting the branches with branches is performed. The number of “contents already on the access list” is one or more. Therefore, the number of branches from “accessed content” to “contents already on the access list” is one or more. In the process of searching for the target content, each time a large number of contents are accessed, these branches are connected and increase. In a primitive state such as immediately after the access list is activated for the first time, “content already on the access list” does not exist. Therefore, the content that the user first accessed is placed on the access list as it is.

図3を参照して、処理Bモジュール4にて行われる処理Bを説明する。まず、ステップS7にて、新たに重みが閾値s以上になった枝を(ia,ib)とする。この(ia,ib)とは、コンテンツQとコンテンツRとを互いに結ぶ枝を示している。次に、ステップS8にて、iaとibが同じクラスタに属している場合は、以降の処理は実行せずに他の閾値s以上になった枝についてステップS7を実行する。   With reference to FIG. 3, the process B performed in the process B module 4 is demonstrated. First, in step S7, a branch whose weight is newly greater than or equal to the threshold value s is defined as (ia, ib). This (ia, ib) indicates a branch connecting the content Q and the content R to each other. Next, in step S8, when ia and ib belong to the same cluster, step S7 is executed for the branch that is equal to or greater than another threshold s without performing the subsequent processing.

次に、ステップS9にて、iaとibが互いに異なるクラスタに属している場合は、これらのクラスタをクラスタリストから削除する。たとえばiaが属するクラスタがクラスタCqであり、ibが属するクラスタがクラスタCrである場合は、このクラスタCrとクラスタCqを共にクラスタリストから削除する。ここで、クラスタリストから削除されるのは、クラスタCrとクラスタCqであり、それぞれのクラスタに属していたiaとibがクラスタCrとクラスタCqと一緒に削除されることは無い。   Next, when ia and ib belong to different clusters in step S9, these clusters are deleted from the cluster list. For example, when the cluster to which ia belongs is the cluster Cq and the cluster to which ib belongs is the cluster Cr, both the cluster Cr and the cluster Cq are deleted from the cluster list. Here, what is deleted from the cluster list is the cluster Cr and the cluster Cq, and ia and ib belonging to the respective clusters are not deleted together with the cluster Cr and the cluster Cq.

次に、ステップS10にて、クラスタCqとクラスタCrの大きさ(サイズ)の和が、予め設定された基準値L以下の場合は、クラスタCqとクラスタCrを1つにして纏めた新たなクラスタであるクラスタCxをクラスタリストに載せる(登録)。   Next, if the sum of the sizes (sizes) of the cluster Cq and the cluster Cr is equal to or smaller than a preset reference value L in step S10, a new cluster obtained by combining the cluster Cq and the cluster Cr into one. Is added to the cluster list (registration).

次に、ステップS11にて、iaとibのそれぞれが互いに異なるクラスタに属し、クラスタCq、クラスタCrのサイズの和が基準値Lより大きい場合、クラスタCqとクラスタCrを1つにした新たなクラスタCxを生成し、このクラスタCxに対して処理Cモジュール5にて処理Cを実行する。この処理Cが終了すると、再びステップS7に戻り、処理Bを繰り返し行う。また、この繰り返しの実行により、全ての閾値s以上の重み付けの枝に処理が実行された場合に、処理Aへ戻る。   Next, in step S11, when each of ia and ib belongs to different clusters and the sum of the sizes of the clusters Cq and Cr is larger than the reference value L, a new cluster in which the clusters Cq and Cr are combined into one is obtained. Cx is generated, and the process C module 5 executes the process C for this cluster Cx. When this process C ends, the process returns to step S7 again, and the process B is repeated. In addition, when the processing is executed for all weighted branches equal to or greater than the threshold value s due to this repeated execution, the processing returns to processing A.

図4を参照して、処理Cモジュール5にて行われる処理Cを説明する。まず、ステップS12にて、新たなクラスタであるクラスタCxに対し、このクラスタCxに属するコンテンツ群の枝値の中から、次数(閾値s以上の重み付けの枝の本数)が最大となるコンテンツYを選択する。ただし、次のステップS13でチェック済みのものを除く。次に、ステップS13でコンテンツYにチェック情報が付与される。このチェック情報とは、コンテンツYに対して処理Cを実行済みであることの印であって、再び処理Cが行われることを防止するためのフラグ情報となる。   With reference to FIG. 4, the process C performed in the process C module 5 is demonstrated. First, in step S12, for the new cluster Cx, the content Y having the maximum degree (the number of weighted branches greater than or equal to the threshold s) is selected from the branch values of the content group belonging to the cluster Cx. select. However, those already checked in the next step S13 are excluded. Next, check information is given to the content Y in step S13. This check information is a mark indicating that the process C has been executed for the content Y, and is flag information for preventing the process C from being performed again.

次に、ステップS14にて、コンテンツYについて閾値s以上の重み付けの枝値に注目し、
1)重み付けが最大の枝値は、その重み付けを閾値sと同じ値(s)にする。
Next, in step S14, paying attention to the weighting branch value greater than or equal to the threshold s for the content Y,
1) The branch value having the maximum weight is set to the same value (s) as the threshold value s.

2)枝値について、コンテンツY側でない反対側の端点のコンテンツの次数が1の場合、すなわちコンテンツYとしか繋がっていない枝である場合は、その枝の重み付けを閾値sと同じにする。 2) Regarding the branch value, when the order of the content at the end point on the opposite side that is not the content Y side is 1, that is, the branch that is connected only to the content Y, the weight of the branch is made the same as the threshold value s.

3)上記1)、2)以外の場合は、枝の重みを0とする。重み付けが0となるので、従って該当する枝は切られることになる。 3) In cases other than 1) and 2) above, the branch weight is set to 0. Since the weight is 0, the corresponding branch is cut.

以上の1)〜3)の処理がステップS14にて実行される。   The above processes 1) to 3) are executed in step S14.

次に、ステップS15において、クラスタCxの連結成分を調べる。この連結成分とはクラスタCxが他のクラスタと連結する枝があるか否かを調べる処理である。次に、ステップS16において、クラスタCxの連結成分が1個の場合であって、かつ未チェックのものが残っていれば処理Cの初段のステップS12へ戻り、次数が最大となるコンテンツを新たに選択して、再び処理Cを実行する。また、全てチェック済みであった場合は、処理Bに戻って、クラスタCxをクラスタリストに載せる(登録)。   Next, in step S15, the connected components of the cluster Cx are examined. This connected component is a process for examining whether or not there is a branch connecting the cluster Cx to another cluster. Next, in step S16, if the number of connected components of the cluster Cx is one and an unchecked component remains, the process returns to step S12 in the first stage of the process C, and the content having the maximum degree is newly added. Select and execute process C again. If all the checks have been made, the process returns to process B and the cluster Cx is placed in the cluster list (registration).

次に、ステップS17にて、クラスタCxの連結成分が2個以上の場合であって、かつクラスタのサイズが基準値L以下である連結成分については、クラスタリストに載せる(登録)。また、サイズが基準値Lよりも大きい連結成分に対しては、連結成分に対して処理Cを再び実行する。   Next, in step S17, connected components whose cluster Cx has two or more connected components and whose cluster size is equal to or smaller than the reference value L are placed in the cluster list (registration). For a connected component having a size larger than the reference value L, the process C is performed again on the connected component.

以上説明した処理A〜処理Cによって、複数のコンテンツ同士の関係をユーザのアクセス履歴に従ってクラスタリングして構築し、こうしてクラスタリングされたコンテンツ群の特徴成分をユーザに提供することができる。ユーザがコンテンツにアクセスしたアクセス履歴のみでもってクラスタリングを行い、コンテンツ同士の関係を示す枝の重み付けが大きい関係にまとめて整理することができるので、ユーザに対してクラスタの特徴や、他クラスタとの関係などを俯瞰的に提供することができる。   By the processes A to C described above, the relationship between a plurality of contents can be constructed by clustering according to the user's access history, and thus the feature components of the clustered contents group can be provided to the user. Clustering is performed only with the access history of the user accessing the content, and it is possible to organize and organize the relationship into a relationship with a large weight of the branch indicating the relationship between the content. Relationships can be provided from a bird's-eye view.

図5は、図1〜図4を参照して説明した本発明のコンテンツ分類システムに係る、他の実施の形態を説明するための構成図である。ユーザが目的とするコンテンツの検索を実行する情報端末としてクライアントマシン10が配置される。このクライアントマシン10は、ユーザとのインタフェイスになるために表示されるブラウザ13と、このブラウザ13に表示する内容を生成するためのクライアントシステム14を有している。また、クライアントシステム14は、RDF(Resource Description Framework)受信のためのステップS20と、RDF解析のステップS21と、クラスタリング情報表示のためのステップS22の処理を実行する。   FIG. 5 is a block diagram for explaining another embodiment of the content classification system of the present invention described with reference to FIGS. A client machine 10 is arranged as an information terminal that executes a search for content intended by a user. The client machine 10 includes a browser 13 that is displayed to be an interface with a user, and a client system 14 that generates content to be displayed on the browser 13. Further, the client system 14 executes processing of Step S20 for receiving RDF (Resource Description Framework), Step S21 of RDF analysis, and Step S22 for displaying clustering information.

また、クライアントマシン10はサーバマシン11とネットワーク接続されている。サーバマシン11には、PROXY(プロキシ)サーバ15と、アクセス履歴情報データベース17と、サーバシステム16を有している。また、サーバシステム16では、アクセス履歴収集のステップS30と、クラスタリング情報生成のステップS31と、RDF形式変換のステップS32と、RDF送信のステップS33の一連の処理を行う。また、サーバマシン11はインターネット12に接続している。   The client machine 10 is connected to the server machine 11 via a network. The server machine 11 includes a PROXY (proxy) server 15, an access history information database 17, and a server system 16. Further, the server system 16 performs a series of processes of access history collection step S30, clustering information generation step S31, RDF format conversion step S32, and RDF transmission step S33. The server machine 11 is connected to the Internet 12.

クライアントマシン10の図示しない画像表示装置にブラウザ画面13が表示され、ユーザはこのブラウザ画面13を介して目的とするコンテンツを検索する。検索の対象となるのはインターネット12を介して接続された膨大な量のコンテンツ群であり、この中から目的とするコンテンツの検索を行う。ブラウザ13はサーバマシン11が有するプロキシサーバ15を介してインターネット12に接続している。このプロキシサーバ15はサーバシステム16に接続していて、ブラウザ13で目的とするコンテンツの検索が行われると、その検索の過程で発生するインターネット12上の数多くのコンテンツへのアクセスをアクセス履歴として収集する。このアクセス履歴の収集はステップ30で実行される。収集されたアクセス履歴はアクセス履歴情報としてアクセス履歴情報データベース17に記憶される。   A browser screen 13 is displayed on an image display device (not shown) of the client machine 10, and the user searches for desired content via the browser screen 13. The search target is a huge amount of content groups connected via the Internet 12, and the target content is searched from these. The browser 13 is connected to the Internet 12 via a proxy server 15 included in the server machine 11. The proxy server 15 is connected to the server system 16 and, when the target content is searched by the browser 13, the access to a large number of contents on the Internet 12 generated in the search process is collected as an access history. To do. This access history collection is executed in step 30. The collected access history is stored in the access history information database 17 as access history information.

クラスタリング情報生成の処理はステップ31で実行され、このステップ31での処理は先に説明した処理A〜処理Cによるクラスタリング処理である。このクラスタリング情報生成のステップで、ユーザが検索している目的とするコンテンツの特徴に関連したコンテンツを提供することができる。こうして生成されたクラスタリング情報はステップS32においてRDF形式に変換されて、次のステップS33にてRDF送信の処理が実行される。   The clustering information generation process is executed in step 31, and the process in step 31 is the clustering process by the processes A to C described above. In this clustering information generation step, it is possible to provide content related to the characteristics of the target content being searched for by the user. The clustering information generated in this way is converted into the RDF format in step S32, and the RDF transmission process is executed in the next step S33.

サーバシステム16から送信されたRDF形式のクラスタリング情報は、クライアントシステム14で受信される。クライアントシステム14では、ステップS20において、このRDF形式のデータを受信し、次のステップS21でRDF解析を行ってデコード処理をする。このデコード処理により元のクラスタリング情報に戻され、ステップS22においてクラスタリング情報の表示が行われる。このクラスタリング情報の表示はブラウザ13を表示している画面に表示される。   The clustering information in RDF format transmitted from the server system 16 is received by the client system 14. In step S20, the client system 14 receives the data in the RDF format, performs RDF analysis in the next step S21, and performs decoding processing. By this decoding processing, the original clustering information is restored, and the clustering information is displayed in step S22. The clustering information is displayed on the screen displaying the browser 13.

図6は、クライアントシステム14のステップS22にて実行されるクラスタリング情報表示の一例を示している。この図6には、クラスタリングモデル表示ウィンドウ20と、検索目的となるコンテンツが属するクラスタ21bと、このクラスタ21bの名称を示すタイトル21aとが示され、タイトル21aには、このタイトル21aと同じクラスタ21bに属するタイトル22a〜22dが示されている。このタイトル22a〜22dはタイトル21aと直接に近い特徴を有する(つまり、同じクラスタ21bに属する)ので、直接に枝で結ばれて表示されている。ユーザはこうした表示上の特徴から俯瞰的にコンテンツやクラスタ相互の関係を眺めることができ、クラスタやコンテンツの特徴を容易に理解することが可能となる。   FIG. 6 shows an example of clustering information display executed in step S22 of the client system 14. FIG. 6 shows a clustering model display window 20, a cluster 21b to which the content to be searched belongs, and a title 21a indicating the name of the cluster 21b. The title 21a includes the same cluster 21b as the title 21a. Titles 22a to 22d belonging to are shown. Since the titles 22a to 22d have characteristics close to that of the title 21a (that is, belong to the same cluster 21b), the titles 22a to 22d are directly connected by branches. The user can see the relationship between contents and clusters from a bird's-eye view from these display characteristics, and can easily understand the characteristics of clusters and contents.

また、タイトル21aはメインとなるコンテンツであるので、ブラウザ表示部分は色を変える(どこの部分がブラウザに表示されているか目立つように)ことで、ユーザの注目を得ることが可能となる。タイトル22a〜22dのタイトル表示部分はマウスなどでクリック可能とし、このクリック操作はブラウザ13の表示に反映され変化するようにする。   In addition, since the title 21a is the main content, the browser display portion can change the color (so that the portion that is displayed on the browser is conspicuous), so that the user's attention can be obtained. The title display portions of the titles 22a to 22d can be clicked with a mouse or the like, and this click operation is reflected in the display of the browser 13 and changes.

さらに、クラスタ21bの周囲には他の特徴をもつクラスタ23a〜23gが表示され、それぞれ枝でクラスタ21bに繋がっている。さらにこれらのクラスタ23a〜23gには、図に示すようにさらに他の特徴を有するクラスタ25a〜25lが表示され、やはりそれぞれが枝でクラスタ23a〜23gに繋がっている。クラスタ24はクラスタ21bとクラスタ23a〜23gまでのクラスタ群を含むクラスタを示している。クラスタ23a〜23gのクラスタ表示には、次数が高いものを代表としてタイトル表示がされている。ユーザはこのタイトルを見ることで、それぞれのクラスタの特徴を知ることができる。また、外側のクラスタ群25a〜25lはクラスタの存在のみが表示される。こうした表示によりクラスタリングモデル表示ウィンドウ20では、クラスタ同士の距離や表示される大きさ、タイトル、色の違い、クリックによる操作、枝の本数などで、ユーザに対して俯瞰的かつ直感的に、目的とするコンテンツの表示とそれに関係した特徴(ユーザの嗜好やコンテンツの性質)を提示することができる。   Further, clusters 23a to 23g having other characteristics are displayed around the cluster 21b, and each cluster is connected to the cluster 21b by a branch. Furthermore, in these clusters 23a to 23g, clusters 25a to 25l having further other characteristics are displayed as shown in the figure, and each of them is connected to the clusters 23a to 23g by branches. A cluster 24 indicates a cluster including a cluster 21b and clusters 23a to 23g. In the cluster display of the clusters 23a to 23g, titles are displayed with the higher order as a representative. By viewing this title, the user can know the characteristics of each cluster. In the outer cluster groups 25a to 25l, only the existence of clusters is displayed. With such a display, the clustering model display window 20 provides a bird's eye view intuitively and intuitively with the distance between clusters, displayed size, title, color difference, click operation, number of branches, etc. Content to be displayed and features related to the content (user preference and content properties) can be presented.

図7と図8は、図1〜図4を用いて説明した本発明のコンテンツ分類システムによって、数値で表示された調査データを円グラフ34に示した例である。図7には、インターネットにおいてDVD(Digital Versatile Disk)ソフトのコンテンツにアクセスした顧客の顧客ID31と、DVDソフトを管理するためのDVDコード32と、顧客がDVDソフトにアクセスしてきた時間情報33とが示されている。この例では、顧客数は合計で2606人であり、DVDソフトのタイトル数は2689作品、アクセスの履歴数は33207となっている。   FIGS. 7 and 8 are examples in which the pie chart 34 shows survey data displayed numerically by the content classification system of the present invention described with reference to FIGS. FIG. 7 shows a customer ID 31 of a customer who accesses the contents of DVD (Digital Versatile Disk) software on the Internet, a DVD code 32 for managing the DVD software, and time information 33 when the customer has accessed the DVD software. It is shown. In this example, the total number of customers is 2,606, the number of DVD software titles is 2,689 works, and the access history number is 33207.

この図7のデータに基づいて、図1〜図4にて説明したクラスタリング処理(処理A〜処理C)を実行した。この実行した結果を図8の円グラフ34に示した。「その他」のデータは、クラスタリング処理で、特に意味の無いデータとなった。また、意味のあるデータとしては全体の約2/3が意味のあるデータとして表示されている。また、図中の「関連有」、「アクション」、「SF」、「ホラー」、〜「アニメ」、「アダルト系」の並びは、クラスタリング処理の結果、互いの関連性を構築して並べたものである。   Based on the data shown in FIG. 7, the clustering process (Process A to Process C) described with reference to FIGS. The result of this execution is shown in the pie chart 34 of FIG. The “others” data has no meaning in the clustering process. Further, as the meaningful data, about 2/3 of the whole is displayed as the meaningful data. In the figure, “related”, “action”, “SF”, “horror”, “animation”, “adult” are arranged as a result of clustering processing. Is.

本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング装置の構成を説明するための構成図を示す。The block diagram for demonstrating the structure of the clustering apparatus based on embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング方法を説明するためのステップ図を示す。The step figure for demonstrating the clustering method based on embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング方法を説明するためのステップ図を示す。The step figure for demonstrating the clustering method based on embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング方法を説明するためのステップ図を示す。The step figure for demonstrating the clustering method based on embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムのほかの実施の形態に係る、クライアントマシンとサーバの構成を説明するための構成図を示す。The block diagram for demonstrating the structure of the client machine and server based on other embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムの実施の形態に係る、ブラウザ画面の表示例を説明するための模式図を示す。The schematic diagram for demonstrating the example of a display of a browser screen based on embodiment of the content classification system of this invention is shown. 本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング処理の対象データを示す。The object data of a clustering process based on embodiment of the content classification system of this invention are shown. 本発明のコンテンツ分類システムの実施の形態に係る、クラスタリング処理により作成される円グラフの一例を示す。An example of the pie chart created by the clustering process based on Embodiment of the content classification system of this invention is shown. 従来技術による協調フィルタリング技術を説明するための概念図を示す。The conceptual diagram for demonstrating the collaborative filtering technique by a prior art is shown. 従来技術による協調フィルタリング技術を説明するための概念図を示す。The conceptual diagram for demonstrating the collaborative filtering technique by a prior art is shown.

符号の説明Explanation of symbols

1 クラスタリング装置
2 統合データベース
3 処理Aモジュール
4 処理Bモジュール
5 処理Cモジュール
6 アクセス履歴データベース
7 API(Application Program Interface)
8 サービス提供装置
10 クライアントマシン
11 サーバマシン
12 インターネット
13 ブラウザ
14 クライアントシステム
15 プロクシサーバ(PROXY)
16 サーバシステム
17 アクセス履歴情報データベース
20 クラスタリングモデル表示ウィンドウ
DESCRIPTION OF SYMBOLS 1 Clustering apparatus 2 Integrated database 3 Process A module 4 Process B module 5 Process C module 6 Access history database 7 API (Application Program Interface)
8 Service Providing Device 10 Client Machine 11 Server Machine 12 Internet 13 Browser 14 Client System 15 Proxy Server (PROXY)
16 Server system 17 Access history information database 20 Clustering model display window

Claims (27)

ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類方法であって、
前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aと、
処理Aの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成する処理と、
処理Aの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bと、
処理Bの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶する処理と、
処理Bの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cと、
をコンピュータが実行することによりコンテンツの分類を行うことを特徴とするコンテンツ分類方法。
A content classification method for classifying content searched by a user via a network into a cluster including content and an association between the content,
Every time the user accesses the content Q in the course of the search, associating the respective content different from said content Q, already registered in the access list for storing a history of the access this content Q, association a processing a to be stored in the access list associated with said branch value and the content Q as branch value the number of times,
After the process A, when the content Q does not belong to the cluster stored in the cluster list that stores the content that is information about the cluster and the association between the contents , a process of generating a cluster to which only the content Q belongs;
After processing A, when the branch value exceeds a preset threshold s, when the respective contents of both ends of the branch values corresponding belong to different clusters, the from the cluster list for each of the cluster A process B that deletes information about clusters, generates a cluster Cx including contents belonging to the clusters and associations between the contents, and compares the number of contents belonging to the cluster Cx with a preset reference value L;
After the process B, when the number of contents belonging to the cluster Cx is equal to or less than the reference value L, a process of storing information on the cluster Cx in the cluster list;
After the process B, when the number of contents belonging to the cluster Cx is larger than the reference value L, the content Y having the maximum number of branch values equal to or greater than the threshold value s included in the cluster Cx is extracted. A process C for storing information on the cluster Cx in the cluster list by setting all the branch values of the cluster Cx as the threshold s or 0 by the predetermined sorting means F;
A content classification method characterized by classifying content by executing a computer.
前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除することを特徴とする請求項1に記載のコンテンツ分類方法。 The access list is a list of stored contents in a time series, and the old contents are deleted in order from the oldest so that the number of stored contents is equal to or less than a predetermined value p set in advance. The content classification method according to claim 1, wherein: 前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換することを特徴とする請求項1又は2に記載のコンテンツ分類方法。 Said selection means F is the branch value of the maximum value of the branch value of the content Y is converted to the threshold s, the number of branch value greater than or equal to the threshold value s of the content that is associated with the content Y is The content classification method according to claim 1 or 2, wherein in one case, the branch value is converted into the threshold value s, and all the branch values that are not converted into the threshold value s are converted into zero. 前記処理Cは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cの終了後に再び前記処理Cを行うものであって、前記チェック情報が付与されたコンテンツは抽出しないことを特徴とする請求項1乃至3のいずれかに記載のコンテンツ分類方法。 The process C adds check information indicating that it has been extracted to the extracted content Y, and performs the process C again after the completion of the process C. The content to which the check information is added is 4. The content classification method according to claim 1, wherein no content is extracted. 前記処理Cの終了後において、
前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cを実行し、
前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cを実行することを特徴とする請求項4記載のコンテンツ分類方法。
After completion of the process C,
In the case where the number of contents belonging to the cluster Cx is associated with the contents belonging to another cluster is one, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is changed to the cluster. When the content that is stored in the list and does not have the check information is included in the content that belongs to the cluster Cx, the process C is executed again,
When the number of associated items is two or more and the number of contents belonging to the cluster Cx is equal to or less than the reference value L, the cluster Cx is stored in the cluster list, and the number of contents belonging to the cluster Cx 5. The content classification method according to claim 4, wherein if the value is larger than the reference value L, the process C is executed again.
前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDのうちのいずれかを含むことを特徴とする請求項1乃至5のいずれかに記載のコンテンツ分類方法。   6. The access history includes, in addition to a content ID for identifying the content, one of the access time and a user ID for identifying the user. The content classification method according to any one of the above. ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類システムであって、
前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶するとともに、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成する処理A手段と、
前記処理A手段の処理の後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理B手段と、
前記処理B手段の処理の後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理C手段と、
を備えることを特徴とするコンテンツ分類システム。
A content classification system for classifying content searched by a user via a network into a cluster including content and an association between the content,
Every time the user accesses the content Q in the course of the search, associating the respective content different from said content Q, already registered in the access list for storing a history of the access this content Q, association number stores the contents Q and the branch value and the access list in association with each of the branch value, the content Q has been stored in the cluster list for storing the association between the content and the content is information about the cluster If it does not belong to a cluster, a process A means for generating a cluster to which only the content Q belongs;
After processing of the processing A means, in the case where the branch value exceeds a preset threshold s, when the respective contents of both ends of the branch values corresponding belong to different clusters, the for each of the cluster Deletes information related to the cluster from the cluster list, generates a cluster Cx including contents belonging to those clusters and associations between the contents, and compares the number of contents belonging to the cluster Cx with a preset reference value L Process B means;
If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the processing of the processing B means, information on the cluster Cx is stored in the cluster list, and the number of contents belonging to the cluster Cx is When the value is larger than the reference value L, the content Y having the maximum number of branch values greater than or equal to the threshold value s included in the cluster Cx is extracted, and all branch values of the content Y are extracted by the predetermined sorting means F. Processing C means for storing information about the cluster Cx in the cluster list as a threshold s or 0;
A content classification system comprising:
前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除することを特徴とする請求項7に記載のコンテンツ分類システム。 The access list is a list of stored contents in a time series, and the old contents are deleted in order from the oldest so that the number of stored contents is equal to or less than a predetermined value p set in advance. The content classification system according to claim 7. 前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換することを特徴とする請求項7または8に記載のコンテンツ分類システム。 Said selection means F is the branch value of the maximum value of the branch value of the content Y is converted to the threshold s, the number of branch value greater than or equal to the threshold value s of the content that is associated with the content Y is The content classification system according to claim 7 or 8, wherein in one case, the branch value is converted into the threshold value s, and all the branch values that are not converted into the threshold value s are converted into zero. 前記処理C手段は、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理C手段の処理の終了後に再び前記処理C手段の処理を行うものであって、前記チェック情報が付与されたコンテンツは抽出しないことを特徴とする請求項7乃至9のいずれかに記載のコンテンツ分類システム。 The process C means adds check information indicating that the extracted content Y has been extracted, and performs the process of the process C means again after the process of the process C means ends. 10. The content classification system according to claim 7, wherein content to which information is added is not extracted. 前記処理C手段による処理の終了後において、
前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理C手段による処理を実行し、
前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理C手段による処理を実行することを特徴とする請求項10記載のコンテンツ分類システム。
After completion of the process by the process C means,
In the case where the number of contents belonging to the cluster Cx is associated with the contents belonging to another cluster is one, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is changed to the cluster. When the content that is stored in the list and does not have the check information is included in the content that belongs to the cluster Cx, the processing by the processing C means is executed again,
When the number of associated items is two or more and the number of contents belonging to the cluster Cx is equal to or less than the reference value L, the cluster Cx is stored in the cluster list, and the number of contents belonging to the cluster Cx 11. The content classification system according to claim 10, wherein if the value is larger than the reference value L, the processing by the processing C means is executed again.
前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDのうちのいずれかを含むことを特徴とする請求項7乃至11のいずれかに記載のコンテンツ分類システム。   12. The access history includes any one of the time of access and a user ID for identifying the user in addition to a content ID for identifying the content. The content classification system according to any one of the above. ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類プログラムであって、
前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aのステップと、
前記処理Aのステップの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成するステップと、
前記処理Aのステップの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから当該クラスタに関する情報を削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bのステップと、
前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶するステップと、
前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cのステップと、
をコンピュータに実行させることによりコンテンツの分類を行うことを特徴とするコンテンツ分類プログラム。
A content classification program for classifying content searched by a user via a network into a cluster including content and an association between the content,
Every time the user accesses the content Q in the course of the search, associating the respective content different from said content Q, already registered in the access list for storing a history of the access this content Q, association a step of processing a to be stored in the access list associated with said branch value and the content Q as branch value the number of times,
After the step of process A, if the content Q does not belong to the cluster stored in the cluster list that stores the content that is information about the cluster and the association between the content, a cluster to which only the content Q belongs is generated. Steps,
When the branch value exceeds a preset threshold value s after the step of the process A, if the contents at both ends of the branch value belong to different clusters, the cluster is determined for each of the clusters. Processing for deleting information related to the cluster from the list, generating a cluster Cx including contents belonging to those clusters and an association between the contents, and comparing the number of contents belonging to the cluster Cx with a preset reference value L Step B,
If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the step of the process B , storing information on the cluster Cx in the cluster list;
After the step of the process B, when the number of contents belonging to the cluster Cx is larger than the reference value L, the content Y having the largest number of branch values equal to or greater than the threshold s included in the cluster Cx is extracted; all branch value of the content Y, the steps of processing C that stores information on the cluster Cx to said cluster list as the threshold value s or 0 in a predetermined selection means F,
A content classification program for classifying content by causing a computer to execute
前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除することを特徴とする請求項13に記載のコンテンツ分類プログラム。 The access list is a list of stored contents in a time series, and the old contents are deleted in order from the oldest so that the number of stored contents is equal to or less than a predetermined value p set in advance. The content classification program according to claim 13. 前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換することを特徴とする請求項13又は14に記載のコンテンツ分類プログラム。 Said selection means F is the branch value of the maximum value of the branch value of the content Y is converted to the threshold s, the number of branch value greater than or equal to the threshold value s of the content that is associated with the content Y is 15. The content classification program according to claim 13, wherein in one case, the branch value is converted to the threshold value s, and all the branch values that are not converted to the threshold value s are converted to zero. 前記処理Cのステップは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cのステップの終了後に再び前記処理Cを行うものであって、前記チェック情報が付与されたコンテンツは抽出しないことを特徴とする請求項13乃至15のいずれかに記載のコンテンツ分類プログラム。 In the step of the process C, check information indicating that the content Y has been extracted is added to the extracted content Y, and the process C is performed again after the step of the process C is completed. 16. The content classification program according to claim 13, wherein the extracted content is not extracted. 前記処理Cのステップの終了後において、
前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cのステップを実行し、
前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cのステップを実行することを特徴とする請求項16記載のコンテンツ分類プログラム。
After completion of the step of the process C,
In the case where the number of contents belonging to the cluster Cx is associated with the contents belonging to another cluster is one, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is changed to the cluster. When the content that is stored in the list and does not have the check information is included in the content that belongs to the cluster Cx, the step of the process C is executed again,
When the number of associated items is two or more and the number of contents belonging to the cluster Cx is equal to or less than the reference value L, the cluster Cx is stored in the cluster list, and the number of contents belonging to the cluster Cx 17. The content classification program according to claim 16, wherein if the value is larger than the reference value L, the step of the process C is executed again.
前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDのうちのいずれかを含むことを特徴とする請求項13乃至17のいずれかに記載のコンテンツ分類プログラム。   18. The access history includes any one of the access time and a user ID for identifying the user in addition to a content ID for identifying the content. The content classification program according to any one of the above. 前記ネットワークに接続されたプロキシサーバ上で実行されることを特徴とする請求項13乃至18のいずれかに記載のコンテンツ分類プログラム。   The content classification program according to claim 13, wherein the content classification program is executed on a proxy server connected to the network. 前記ユーザが目的とする前記コンテンツの検索に用いるローカル端末上で実行されることを特徴とする請求項13乃至18のいずれかに記載のコンテンツ分類プログラム。   19. The content classification program according to claim 13, wherein the content classification program is executed on a local terminal used for searching for the content intended by the user. 前記ネットワークに接続するアプリケーションサービスプロバイダにて実行されることを特徴とする請求項13乃至18のいずれかに記載のコンテンツ分類プログラム。   19. The content classification program according to claim 13, which is executed by an application service provider connected to the network. ユーザがネットワークを介して検索したコンテンツをコンテンツ及びコンテンツ間の関連付けを含むクラスタに分類するコンテンツ分類プログラムを記録した記録媒体であって、
前記ユーザが前記検索の過程でコンテンツQにアクセスする度に、このコンテンツQと前記アクセスの履歴を記憶するアクセスリストにすでに登録済みで前記コンテンツQとは異なるコンテンツのそれぞれとを関連付けし、関連付けの回数を枝値として前記コンテンツQと前記枝値とを対応付けて前記アクセスリストに記憶する処理Aのステップと、
前記処理Aのステップの後に、前記コンテンツQが、クラスタに関する情報であるコンテンツ及びコンテンツ間の関連付けを記憶するクラスタリストに記憶されたクラスタに属さない場合は、そのコンテンツQのみが属するクラスタを生成するステップと、
前記処理Aのステップの後に、前記枝値が予め設定された閾値sを超えた場合に、該当する前記枝値の両端のコンテンツのそれぞれが異なるクラスタに属するときは、そのクラスタのそれぞれについて前記クラスタリストから削除するとともに、それらのクラスタに属するコンテンツ及びコンテンツ間の関連付け含むクラスタCxを生成し、前記クラスタCxに属するコンテンツの数を予め設定された基準値Lと比較する処理Bのステップと、
前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値L以下の場合は、前記クラスタCxに関する情報を前記クラスタリストに記憶するステップと、
前記処理Bのステップの後に、前記クラスタCxに属するコンテンツの数が前記基準値Lより大きい場合に、前記クラスタCxに含まれる閾値s以上の枝値の本数が最大となるコンテンツYを抽出し、このコンテンツYの全ての枝値を、所定の取捨選択手段Fで前記閾値sあるいは0として前記クラスタCxに関する情報を前記クラスタリストに記憶する処理Cのステップと、
をコンピュータに実行させることによりコンテンツの分類を行うことを特徴とするコンテンツ分類プログラムを記録した記録媒体。
A recording medium recording a content classification program for classifying content searched by a user via a network into a cluster including content and association between the content ,
Every time the user accesses the content Q in the course of the search, associating the respective content different from said content Q, already registered in the access list for storing a history of the access this content Q, association a step of processing a to be stored in the access list associated with said branch value and the content Q as branch value the number of times,
After the step of process A, if the content Q does not belong to the cluster stored in the cluster list that stores the content that is information about the cluster and the association between the content, a cluster to which only the content Q belongs is generated. Steps,
When the branch value exceeds a preset threshold value s after the step of the process A, if the contents at both ends of the branch value belong to different clusters, the cluster is determined for each of the clusters. A step of processing B which deletes from the list, generates a cluster Cx including contents belonging to those clusters and an association between the contents, and compares the number of contents belonging to the cluster Cx with a preset reference value L;
If the number of contents belonging to the cluster Cx is equal to or less than the reference value L after the step of the process B , storing information on the cluster Cx in the cluster list;
After the step of the process B, when the number of contents belonging to the cluster Cx is larger than the reference value L, the content Y having the largest number of branch values equal to or greater than the threshold s included in the cluster Cx is extracted; all branch value of the content Y, the steps of processing C that stores information on the cluster Cx to said cluster list as the threshold value s or 0 in a predetermined selection means F,
A recording medium on which a content classification program is recorded, wherein the content classification is performed by causing a computer to execute.
前記アクセスリストは記憶したコンテンツを時系列的に並べたものであって、前記記憶したコンテンツの数が予め設定された所定値p以下になるように、時系列的に旧いコンテンツから順に削除することを特徴とする請求項22に記載のコンテンツ分類プログラムを記録した記録媒体。 The access list is a list of stored contents in a time series, and the old contents are deleted in order from the oldest so that the number of stored contents is equal to or less than a predetermined value p set in advance. A recording medium on which the content classification program according to claim 22 is recorded. 前記取捨選択手段Fは、前記コンテンツYの枝値のうち最大値の枝値は前記閾値sへ変換し、前記コンテンツYと関連付けされているコンテンツのうち前記閾値s以上の枝値の数が1つの場合は、その枝値を前記閾値sへ変換し、前記閾値sへ変換されない前記枝値は全て0に変換することを特徴とする請求項22又は23に記載のコンテンツ分類プログラムを記録した記録媒体。 Said selection means F is the branch value of the maximum value of the branch value of the content Y is converted to the threshold s, the number of branch value greater than or equal to the threshold value s of the content that is associated with the content Y is The content classification program according to claim 22 or 23, wherein in one case, the branch value is converted to the threshold value s, and all the branch values that are not converted to the threshold value s are converted to 0. recoding media. 前記処理Cのステップは、抽出した前記コンテンツYに抽出済みであることを示すチェック情報を付与し、前記処理Cのステップの終了後に再び前記処理Cのステップを行うものであって、前記チェック情報が付与されたコンテンツは抽出しないことを特徴とする請求項22乃至24のいずれかに記載のコンテンツ分類プログラムを記録した記録媒体。 In the step of the process C, check information indicating that the content Y has been extracted is added to the extracted content Y, and the step of the process C is performed again after completion of the step of the process C. 25. The recording medium on which the content classification program according to claim 22 is not extracted. 前記処理Cのステップの終了後において、
前記クラスタCxに属するコンテンツが別のクラスタに属するコンテンツと関連付けられている数が1個の場合に、前記クラスタCxに属するコンテンツのすべてに前記チェック情報が付与されていれば前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツに前記チェック情報が付与されていないコンテンツが存在するときは再び前記処理Cのステップを実行し、
前記関連付けられている数が2個以上の場合に、前記クラスタCxに属するコンテンツの数が前記基準値L以下のときは前記クラスタCxを前記クラスタリストに記憶し、前記クラスタCxに属するコンテンツの数が前記基準値Lよりも大きければ再び前記処理Cのステップを実行することを特徴とする請求項25記載のコンテンツ分類プログラムを記録した記録媒体。
After completion of the step of the process C,
In the case where the number of contents belonging to the cluster Cx is associated with the contents belonging to another cluster is one, if the check information is given to all the contents belonging to the cluster Cx, the cluster Cx is changed to the cluster. When the content that is stored in the list and does not have the check information is included in the content that belongs to the cluster Cx, the step of the process C is executed again,
When the number of associated items is two or more and the number of contents belonging to the cluster Cx is equal to or less than the reference value L, the cluster Cx is stored in the cluster list, and the number of contents belonging to the cluster Cx 26. The recording medium recorded with the content classification program according to claim 25, wherein if the value is larger than the reference value L, the step of the process C is executed again.
前記アクセスの履歴は、前記コンテンツを識別するためのコンテンツIDに加えて、前記アクセスの時刻、前記ユーザを識別するためのユーザIDのうちのいずれかを含むことを特徴とする請求項22乃至26のいずれかに記載のコンテンツ分類プログラムを記録した記録媒体。   27. The access history includes, in addition to a content ID for identifying the content, any one of the time of access and a user ID for identifying the user. A recording medium on which the content classification program according to any one of the above is recorded.
JP2003381494A 2003-11-11 2003-11-11 Content classification system and method, computer program, and recording medium Expired - Fee Related JP4274907B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003381494A JP4274907B2 (en) 2003-11-11 2003-11-11 Content classification system and method, computer program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003381494A JP4274907B2 (en) 2003-11-11 2003-11-11 Content classification system and method, computer program, and recording medium

Publications (2)

Publication Number Publication Date
JP2005148843A JP2005148843A (en) 2005-06-09
JP4274907B2 true JP4274907B2 (en) 2009-06-10

Family

ID=34690853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003381494A Expired - Fee Related JP4274907B2 (en) 2003-11-11 2003-11-11 Content classification system and method, computer program, and recording medium

Country Status (1)

Country Link
JP (1) JP4274907B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5105802B2 (en) 2005-09-07 2012-12-26 株式会社リコー Information processing device
CN101727454A (en) * 2008-10-30 2010-06-09 日电(中国)有限公司 Method for automatic classification of objects and system
US9529935B2 (en) * 2014-02-26 2016-12-27 Palo Alto Research Center Incorporated Efficient link management for graph clustering

Also Published As

Publication number Publication date
JP2005148843A (en) 2005-06-09

Similar Documents

Publication Publication Date Title
US20170228469A1 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US9300755B2 (en) System and method for determining information reliability
JP4637969B1 (en) Properly understand the intent of web pages and user preferences, and recommend the best information in real time
JP5431727B2 (en) Relevance determination method, information collection method, object organization method, and search system
US7644101B2 (en) System for generating and managing context information
CN102622417B (en) The method and apparatus that information record is ranked up
US7428705B2 (en) Web map tool
CN101986306B (en) Method and equipment for acquiring yellow page information based on query sequence
JP2004510257A (en) Internet search system and method for facilitating user search
US9411895B2 (en) Personalized deeplinks for search results
WO2008141295A1 (en) Keyword generation system and method for online activity
TW201118620A (en) Systems and methods for providing advanced search result page content
CN102037464A (en) Search results with most clicked next objects
CN103186666B (en) Method, device and equipment for searching based on favorites
JP2007109217A (en) Information processing apparatus, information processing method, information processing program, information displaying apparatus, information displaying method and information displaying program
KR100557874B1 (en) Method of scientific information analysis and media that can record computer program thereof
JP2005251157A (en) Information retrieval system, information retrieval method and program
JP2002351916A (en) Device and method for retrieving web information and program making computer execute this method
JP2005148846A (en) Content classifying system and method, computer program, and recording medium
US8140508B2 (en) System and method for contextual commands in a search results page
KR100671077B1 (en) Server, Method and System for Providing Information Search Service by Using Sheaf of Pages
JP4963619B2 (en) Information search system, information search device, search result screen information generation method, and search result screen information generation processing program
JP4274907B2 (en) Content classification system and method, computer program, and recording medium
JP5407336B2 (en) Information processing device
KR20010108877A (en) Method For Evaluating A Web Site

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees