JP2007249600A - Method for classifying objective data to category - Google Patents
Method for classifying objective data to category Download PDFInfo
- Publication number
- JP2007249600A JP2007249600A JP2006071958A JP2006071958A JP2007249600A JP 2007249600 A JP2007249600 A JP 2007249600A JP 2006071958 A JP2006071958 A JP 2006071958A JP 2006071958 A JP2006071958 A JP 2006071958A JP 2007249600 A JP2007249600 A JP 2007249600A
- Authority
- JP
- Japan
- Prior art keywords
- data
- category
- target data
- server
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000011156 evaluation Methods 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、端末装置のユーザに閲覧させる目的データをカテゴリに分類する方法、サーバ、およびプログラムに関する。 The present invention relates to a method, a server, and a program for classifying target data to be browsed by a user of a terminal device.
従来、インターネットにおいて情報(目的データ)を検索する方法としては、様々なものが提供されているが、その一つに、ツリー状に構成されたカテゴリをユーザが辿っていくことによって目的の情報(目的データ)に至る、ディレクトリ型と呼ばれる検索エンジンがある。この方法は、通常人手によりカテゴリ分けがなされた目的データを検索するもので、同種類の情報をまとめて閲覧することが可能であり、例えば商品情報の検索等に用いられている。 Conventionally, various methods for searching information (target data) on the Internet have been provided, and one of them is to search for target information (following a tree-structured category). There is a search engine called a directory type. This method searches for target data that has been classified into categories by hand, and can browse the same type of information collectively. For example, it is used for searching for product information.
この方法を実現するためには、予め商品等の情報提供項目に対してカテゴリ情報を記憶しておく必要がある。更に、ユーザによる検索が効果的に行われるためには、カテゴリに分類する際の精度の高さが求められる。こうした状況の中で、情報の分類に関しては、その精度を向上させる技術が知られている。 In order to realize this method, it is necessary to store category information for information providing items such as products in advance. Furthermore, in order for the search by the user to be performed effectively, high accuracy is required when classifying into categories. Under such circumstances, techniques for improving the accuracy of information classification are known.
例えば、特許文献1には、各クラス(カテゴリ)間の情報の重なりによる誤分類を少なくする為に、各クラスについて着目クラスには現れるが他のクラスでは現れにくい特徴、および他のクラスでは現れるが着目クラスでは現れにくい特徴を求め、そのデータを使って類似度の補正を行う方法が開示されている。
しかしながら、上記方法によっても、分類の精度は学習事例(目的データを特徴付けるキーワード等とカテゴリとの組)の正確さ、あるいは分類の際の類似度評価の正確さに左右されるため、誤った分類がされる可能性は依然として残る。そのため、通常人手により行っている各目的データに対するカテゴリ情報の付与を自動で行うと、自動で分類された学習事例に含まれる誤分類が蓄積されることによって、次第に分類精度が悪化していくことが懸念される。 However, even with the above method, the accuracy of classification depends on the accuracy of the learning examples (a combination of keywords and other characteristics that characterize the target data and the category) or the accuracy of the similarity evaluation at the time of classification. The possibility of being left still remains. For this reason, if category information is automatically assigned to each objective data that is normally performed manually, the classification accuracy will gradually deteriorate due to the accumulation of misclassifications included in automatically classified learning cases. Is concerned.
そこで本発明は、人手で行うのと近い精度で自動的に目的データをカテゴリに分類することができ、更には、そうした信頼度の高い分類サンプル(学習事例)を継続的に取得し、次回以降の新たな目的データの分類に利用できる方法を提供することを目的とする。 Therefore, the present invention can automatically classify target data into categories with an accuracy close to that performed manually, and continuously obtain such highly reliable classification samples (learning examples). It is an object of the present invention to provide a method that can be used to classify new target data.
具体的には、以下のようなものを提供する。 Specifically, the following are provided.
(1) 端末装置と通信ネットワークを介して接続されたサーバが、前記端末装置のユーザに閲覧させる目的データをカテゴリに分類する方法であって、
前記目的データを複数の候補カテゴリデータと関連付けて記憶するステップと、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信するステップと、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶するステップと、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をするステップと、
を含む方法。
(1) A method in which a server connected to a terminal device via a communication network classifies target data to be browsed by a user of the terminal device into a category,
Storing the target data in association with a plurality of candidate category data;
Transmitting the target data associated with the selected candidate category data in response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Storing in association with the selected candidate category data;
Determining the category for classifying the target data based on the selection frequency data in a predetermined period;
Including methods.
(1)の発明によれば、サーバは、端末装置のユーザに閲覧させる目的データを複数の候補カテゴリデータと関連付けて記憶し、前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信し、前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶し、所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をする。 According to the invention of (1), the server stores the target data to be browsed by the user of the terminal device in association with a plurality of candidate category data, and from the terminal device, one of the plurality of candidate category data by the user is stored. In response to receiving the data indicating the selection of the user, the target data associated with the selected candidate category data is transmitted, and the data indicating the selection of the target data by the user is received from the terminal device. Accordingly, the selection count data of the candidate category data selected by the user is counted up, stored in association with the selected target data and the selected candidate category data, and the selection count in a predetermined period. The category for classifying the target data is determined based on the data.
このことにより、前記サーバは、複数の候補カテゴリについて、実際のユーザのアクセス履歴(どのカテゴリから当該目的データに辿り着いたか)を記憶できるので、当該アクセス履歴に基づいてカテゴリを選択することにより、仮に候補カテゴリの中に相応しくないものが混在していた場合にも、そのようなカテゴリは自動的に排除され、実際のユーザの思いに近い(精度の良い)カテゴリに対して自動的に分類できる可能性がある。 As a result, the server can store the actual user access history (from which category the target data has been reached) for a plurality of candidate categories, so that by selecting a category based on the access history Even if there are unsuitable candidate categories, such categories are automatically excluded and automatically classified into categories that are close to the user's expectations (high accuracy). There is a possibility.
(2) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の回数以上のものであることを特徴とする(1)に記載の方法。 (2) The method according to (1), wherein the category to be determined has a number of selections of the candidate category data equal to or greater than a predetermined number.
(2)の発明によれば、前記サーバは、前記目的データを選択回数が所定の回数以上のカテゴリに分類する。 According to the invention of (2), the server classifies the target data into categories in which the number of selections is a predetermined number or more.
このことにより、前記サーバは、数多く(所定の回数以上)選択された実績のあるカテゴリに分類するので、実際のユーザが選択しやすいカテゴリに対して自動的に分類できる可能性がある。
(3) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の順位以上のものであることを特徴とする(1)に記載の方法。
As a result, the server classifies the category into a category with a track record of selection (more than a predetermined number of times), so that there is a possibility that it can be automatically classified into a category that can be easily selected by an actual user.
(3) The method according to (1), wherein the category to be determined has a number of selections of the candidate category data equal to or higher than a predetermined rank.
(3)の発明によれば、前記サーバは、前記目的データを前記選択回数が所定の順位以上のものに対応するカテゴリに分類する。 According to the invention of (3), the server classifies the target data into categories corresponding to those with the number of selections equal to or higher than a predetermined order.
このことにより、前記サーバは、選択される頻度が高いカテゴリを一または複数選択するので、多くのユーザが考える(思いつきやすい)カテゴリに対して自動的に分類できる可能性がある。 Accordingly, since the server selects one or a plurality of categories that are frequently selected, there is a possibility that the server can automatically classify the categories that many users think (easy to come up with).
(4) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数の相対評価により決定するものであることを特徴とする(1)に記載の方法。 (4) The method according to (1), wherein the category to be determined is determined by relative evaluation of the number of selections of the candidate category data.
(4)の発明によれば、前記サーバは、前記カテゴリデータの選択回数の相対評価により前記目的データを分類するカテゴリを決定する。 According to the invention of (4), the server determines a category for classifying the target data by relative evaluation of the number of selections of the category data.
このことにより、前記サーバは、関連付けた複数のカテゴリの中から、例えば他と比べて選択される割合が突出するカテゴリを選択できるため、ユーザの志向により近いカテゴリに対して自動的に分類できる可能性がある。また、所定の期間において、どの候補カテゴリも所定の選択回数に達しなかった場合や、所定の順位以内の候補カテゴリ間で選択回数に大きな差がある場合にも適切にカテゴリを選択できる。 As a result, the server can automatically select a category that is closer to the user's orientation because it can select a category that has a higher proportion of selection than other categories. There is sex. In addition, a category can be appropriately selected even when no candidate category has reached the predetermined number of selections in a predetermined period or when there is a large difference in the number of selections between candidate categories within a predetermined rank.
(5) 前記決定をしたカテゴリデータと関連付けて、前記目的データに含まれるキーワードデータを抽出して記憶するステップを更に含む(1)から(4)のいずれかに記載の方法。 (5) The method according to any one of (1) to (4), further including a step of extracting and storing keyword data included in the target data in association with the determined category data.
(5)の発明によれば、前記サーバは、前記決定をしたカテゴリデータと関連付けて、前記目的データに含まれるキーワードデータを抽出して記憶する。 According to the invention of (5), the server extracts and stores the keyword data included in the target data in association with the determined category data.
このことにより、前記サーバは、前記カテゴリデータと前記キーワードデータとの対応付けを記憶するため、後に、分類の事例として利用することができる。 Thus, the server stores the association between the category data and the keyword data, and can be used later as a classification example.
(6) 前記目的データとは別の新たな目的データの登録を受け付けたことに応じて、前記新たな目的データと前記キーワードデータとの類似度の算出をするステップと、
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定するステップと、
を更に含む(5)に記載の方法。
(6) calculating a similarity between the new target data and the keyword data in response to accepting registration of new target data different from the target data;
Determining a category for classifying the new target data in accordance with a category evaluation based on the calculated similarity;
The method according to (5), further comprising:
(6)の発明によれば、前記サーバは、前記目的データとは別の新たな目的データの登録を受け付けたことに応じて、前記新たな目的データと前記キーワードデータとの類似度の算出をし、前記算出をした類似度に基づき、前記新たな目的データを分類するカテゴリを決定する。 According to the invention of (6), the server calculates the similarity between the new target data and the keyword data in response to receiving registration of new target data different from the target data. Then, based on the calculated similarity, a category for classifying the new target data is determined.
このことにより、前記サーバは、記憶した前記キーワードデータと前記カテゴリデータとの関連付けに基づき、キーワードが類似する前記目的データについて、対応するカテゴリに自動的に分類することができる。 Accordingly, the server can automatically classify the target data having similar keywords into corresponding categories based on the association between the stored keyword data and the category data.
(7) 前記目的データを複数の前記カテゴリデータと関連付けて記憶するステップが、前記目的データと前記キーワードデータとの類似度の算出をし、当該算出をした類似度に基づくカテゴリの評価に従い前記候補カテゴリデータを選択することを特徴とする(5)または(6)に記載の方法。 (7) The step of storing the target data in association with a plurality of the category data calculates a similarity between the target data and the keyword data, and the candidate is evaluated according to a category evaluation based on the calculated similarity. The method according to (5) or (6), wherein category data is selected.
(7)の発明によれば、前記サーバは、前記目的データと前記キーワードデータとの類似度の算出をし、当該算出をした類似度に基づき前記候補カテゴリデータを選択する。 According to the invention of (7), the server calculates the similarity between the target data and the keyword data, and selects the candidate category data based on the calculated similarity.
このことにより、前記サーバは、記憶したキーワードデータとカテゴリデータとの関連付けに基づき、学習を行う(分類するカテゴリをアクセス履歴により決定する)データについてキーワードが類似する複数のカテゴリを、分類する候補として前記目的データに関連付けることができる。よって、ユーザのアクセス履歴を取得する対象のカテゴリを自動的に抽出することができる。 As a result, the server performs learning based on the association between the stored keyword data and category data (determining the category to be classified based on the access history) as candidates for classifying a plurality of categories having similar keywords. It can be associated with the target data. Therefore, it is possible to automatically extract a category for which a user access history is acquired.
(8) 前記決定をしたカテゴリデータと関連付けて前記目的データに含まれるキーワードデータを抽出して記憶するステップが、前記カテゴリの選択回数に基づく選択確率データを更に関連付けて記憶し、
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする(6)または(7)に記載の方法。
(8) The step of extracting and storing keyword data included in the target data in association with the determined category data further stores selection probability data based on the number of selections of the category,
The method according to (6) or (7), wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
(8)の発明によれば、前記サーバは、前記決定をしたカテゴリデータと関連付けて前記カテゴリの選択回数に基づく選択確率データを更に記憶し、前記キーワードデータに関連付くカテゴリの評価を、前記類似度および前記選択確率データに基づいて行う。 According to the invention of (8), the server further stores selection probability data based on the number of selections of the category in association with the determined category data, and evaluates the category associated with the keyword data with the similarity And based on the selection probability data.
このことにより、前記サーバは、例えば、類似度に基づいて抽出された分類候補となるカテゴリの中から、ユーザによる選択確率の高かったカテゴリに対して優先的に分類できる。よって、ユーザの志向に沿った、より自然な分類ができる可能性がある。 Thereby, for example, the server can preferentially classify a category having a high selection probability by the user from categories that are candidates for classification extracted based on the degree of similarity. Therefore, there is a possibility that more natural classification can be performed according to the user's intention.
(9) 端末装置と通信ネットワークを介して接続され、前記端末装置のユーザに閲覧させる目的データをカテゴリに分類するサーバであって、
前記目的データを複数の候補カテゴリデータと関連付けて記憶する手段と、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信する手段と、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶する手段と、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をする手段と、
を備えるサーバ。
(9) A server that is connected to a terminal device via a communication network and classifies target data to be browsed by a user of the terminal device,
Means for storing the target data in association with a plurality of candidate category data;
Means for transmitting target data associated with the selected candidate category data in response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Means for storing in association with the selected candidate category data;
Means for determining the category for classifying the target data based on the selection frequency data in a predetermined period;
A server comprising
(9)の発明によれば、当該サーバを運用することにより、(1)と同様の効果が期待できる。 According to the invention of (9), the same effect as that of (1) can be expected by operating the server.
(10) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の回数以上のものであることを特徴とする(9)に記載のサーバ。 (10) The server according to (9), wherein the category to be determined is one in which the candidate category data is selected a predetermined number of times or more.
(10)の発明によれば、当該サーバを運用することにより、(2)と同様の効果が期待できる。 According to the invention of (10), the same effect as in (2) can be expected by operating the server.
(11) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の順位以上のものであることを特徴とする(9)に記載のサーバ。 (11) The server according to (9), wherein the category to be determined has a number of selections of the candidate category data equal to or higher than a predetermined order.
(11)の発明によれば、当該サーバを運用することにより、(3)と同様の効果が期待できる。 According to the invention of (11), the same effect as that of (3) can be expected by operating the server.
(12) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数の相対評価により決定するものであることを特徴とする(9)に記載のサーバ。 (12) The server according to (9), wherein the category to be determined is determined by relative evaluation of the number of selections of the candidate category data.
(12)の発明によれば、当該サーバを運用することにより、(4)と同様の効果が期待できる。 According to the invention of (12), the same effect as in (4) can be expected by operating the server.
(13) 前記決定をしたカテゴリデータと関連付けて、前記目的データに含まれるキーワードデータを抽出して記憶する手段を更に備える(9)から(12)のいずれかに記載のサーバ。 (13) The server according to any one of (9) to (12), further including means for extracting and storing keyword data included in the target data in association with the determined category data.
(13)の発明によれば、当該サーバを運用することにより、(5)と同様の効果が期待できる。 According to the invention of (13), the same effect as in (5) can be expected by operating the server.
(14) 前記目的データとは別の新たな目的データの登録を受け付けたことに応じて、前記新たな目的データと前記キーワードデータとの類似度の算出をする手段と、
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定する手段と、
を更に備える(13)に記載のサーバ。
(14) means for calculating a similarity between the new target data and the keyword data in response to accepting registration of new target data different from the target data;
Means for determining a category for classifying the new target data according to the evaluation of the category based on the calculated similarity;
The server according to (13), further comprising:
(14)の発明によれば、当該サーバを運用することにより、(6)と同様の効果が期待できる。 According to the invention of (14), the same effect as in (6) can be expected by operating the server.
(15) 前記目的データを複数の前記カテゴリデータと関連付けて記憶する手段が、前記目的データと前記キーワードデータとの類似度の算出をし、当該算出をした類似度に基づくカテゴリの評価に従い前記候補カテゴリデータを選択することを特徴とする(13)または(14)に記載のサーバ。 (15) A means for storing the target data in association with a plurality of the category data calculates a similarity between the target data and the keyword data, and the candidate is evaluated according to a category evaluation based on the calculated similarity. The server according to (13) or (14), wherein category data is selected.
(15)の発明によれば、当該サーバを運用することにより、(7)と同様の効果が期待できる。 According to the invention of (15), the same effect as that of (7) can be expected by operating the server.
(16) 前記決定をしたカテゴリデータと関連付けて前記目的データに含まれるキーワードデータを抽出して記憶する手段が、前記カテゴリの選択回数に基づく選択確率データを更に関連付けて記憶し、
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする(14)または(15)に記載のサーバ。
(16) The means for extracting and storing the keyword data included in the target data in association with the determined category data further stores the selection probability data based on the number of selections of the category,
The server according to (14) or (15), wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
(16)の発明によれば、当該サーバを運用することにより、(8)と同様の効果が期待できる。 According to the invention of (16), the same effect as that of (8) can be expected by operating the server.
(17) 端末装置と通信ネットワークを介して接続されたサーバに、前記端末装置のユーザに閲覧させる目的データをカテゴリに分類させるプログラムであって、
前記目的データを複数の候補カテゴリデータと関連付けて記憶させるステップと、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信させるステップと、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶させるステップと、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をさせるステップと、
を実行させるプログラム。
(17) A program for causing a server connected to a terminal device via a communication network to classify target data to be viewed by a user of the terminal device into a category,
Storing the target data in association with a plurality of candidate category data;
In response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device, transmitting target data associated with the selected candidate category data;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Storing in association with the selected candidate category data;
Determining the category for classifying the target data based on the selection frequency data in a predetermined period;
A program that executes
(17)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(1)と同様の効果が期待できる。 According to the invention of (17), the same effect as in (1) can be expected by executing the program on the server.
(18) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の回数以上のものであることを特徴とする(17)に記載のプログラム。 (18) The program according to (17), wherein the category to be determined has a number of selections of the candidate category data equal to or greater than a predetermined number.
(18)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(2)と同様の効果が期待できる。 According to the invention of (18), the same effect as in (2) can be expected by executing the program on the server.
(19) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数が所定の順位以上のものであることを特徴とする(17)に記載のプログラム。 (19) The program according to (17), wherein the category to be determined has a number of selections of the candidate category data equal to or higher than a predetermined order.
(19)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(3)と同様の効果が期待できる。 According to the invention of (19), the same effect as in (3) can be expected by executing the program on the server.
(20) 前記決定をするカテゴリは、前記候補カテゴリデータの選択回数の相対評価により決定するものであることを特徴とする(17)に記載のプログラム。 (20) The program according to (17), wherein the category to be determined is determined by relative evaluation of the number of selections of the candidate category data.
(20)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(4)と同様の効果が期待できる。 According to the invention of (20), the same effect as in (4) can be expected by executing the program on the server.
(21) 前記決定をしたカテゴリデータと関連付けて、前記目的データに含まれるキーワードデータを抽出して記憶させるステップを更に含む(17)から(20)のいずれかに記載のプログラム。 (21) The program according to any one of (17) to (20), further including a step of extracting and storing keyword data included in the target data in association with the determined category data.
(21)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(5)と同様の効果が期待できる。 According to the invention of (21), the same effect as in (5) can be expected by executing the program on the server.
(22) 前記目的データとは別の新たな目的データの登録を受け付けたことに応じて、前記新たな目的データと前記キーワードデータとの類似度の算出をさせるステップと、
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定させるステップと、
を更に含む(21)に記載のプログラム。
(22) a step of calculating a similarity between the new target data and the keyword data in response to accepting registration of new target data different from the target data;
Determining a category for classifying the new target data in accordance with a category evaluation based on the calculated similarity;
The program according to (21), further including:
(22)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(6)と同様の効果が期待できる。 According to the invention of (22), the same effect as in (6) can be expected by executing the program on the server.
(23) 前記目的データを複数の前記カテゴリデータと関連付けて記憶させるステップが、前記目的データと前記キーワードデータとの類似度の算出をさせ、当該算出をした類似度に基づくカテゴリの評価に従い前記候補カテゴリデータを選択させることを特徴とする(21)または(22)に記載のプログラム。 (23) The step of storing the target data in association with a plurality of the category data causes the similarity between the target data and the keyword data to be calculated, and the candidate is evaluated according to the category evaluation based on the calculated similarity. The program according to (21) or (22), wherein category data is selected.
(23)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(7)と同様の効果が期待できる。 According to the invention of (23), the same effect as in (7) can be expected by executing the program on the server.
(24) 前記決定をしたカテゴリデータと関連付けて前記目的データに含まれるキーワードデータを抽出して記憶させるステップが、前記カテゴリの選択回数に基づく選択確率データを更に関連付けて記憶させ、
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする(22)または(23)に記載のプログラム。
(24) The step of extracting and storing the keyword data included in the target data in association with the determined category data further stores the selection probability data based on the number of selections of the category,
The program according to (22) or (23), wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
(24)の発明によれば、当該プログラムを当該サーバ上で実行することにより、(8)と同様の効果が期待できる。 According to the invention of (24), the same effect as in (8) can be expected by executing the program on the server.
本発明によれば、人手で行う場合と近い精度で自動的に目的データをカテゴリに分類できる可能性がある。更には、そうした信頼度の高い分類サンプル(学習事例)を継続的に取得し、次回以降の新たな目的データの分類に利用することで、分類の精度を高く維持できる可能性がある。 According to the present invention, there is a possibility that the target data can be automatically classified into categories with an accuracy close to that performed manually. Furthermore, by continuously acquiring such highly reliable classification samples (learning examples) and using them for classification of new target data after the next time, there is a possibility that classification accuracy can be maintained high.
本発明に係る好適な実施形態の一例について、図面に基づいて以下に説明する。 An example of a preferred embodiment according to the present invention will be described below based on the drawings.
[全体構成]
図1は、本発明の好適な実施形態の一例に係るデータ分類方法の概念図である。
[overall structure]
FIG. 1 is a conceptual diagram of a data classification method according to an example of a preferred embodiment of the present invention.
カテゴリ分類を実施するサーバ10は、ユーザが目的データを閲覧するために使用する端末装置20と、通信ネットワーク30を介して接続され、端末装置20のユーザに対する情報提供サービスを運用する。
The
端末装置20では、ユーザがサーバ10に記憶されている商品等の情報提供項目(目的データ)を検索する場合に、ツリー状にカテゴリ分けされたリンクを辿って、希望する種類の目的データ(商品データ等)群を閲覧する。目的データとカテゴリとの関連付けについてはサーバ10が記憶している。
In the
サーバ10は、分類するカテゴリを学習するデータ(商品A)を受け付けた際、分類の候補となるカテゴリ(分類1、分類2)を付与する。端末装置20のユーザは、付与されたカテゴリのうち、いずれかを選択して目的のデータ(商品A)に辿り着くが、このときに選択されたカテゴリをサーバ10は記憶する。
When the
このようなカテゴリ選択の履歴を所定の期間記憶することにより、サーバ10は、ユーザの考えに近いカテゴリ分類を学習することができる(処理の詳細は後述する)。その結果、サーバ10は、新たな目的データ(商品B)を受け付けた際に、学習したカテゴリ(例えば分類2)に分類する。
By storing such a category selection history for a predetermined period, the
[コンピュータの構成]
図2は、本発明の好適な実施形態の一例に係るコンピュータシステムを構成する各コンピュータ(サーバ10、または端末装置20)の構成を示すブロック図である。
[Computer configuration]
FIG. 2 is a block diagram showing a configuration of each computer (
制御部110、記憶部120、入力部130、表示部140、通信制御部150は、バス160を介して接続されている。
The
制御部110は、情報の演算、処理を行う情報演算処理装置(CPU)であり、当該コンピュータ全体の制御を行う。制御部110は、記憶部120に記憶された各種プログラムを適宜読み出して実行することにより、上述のハードウエアと協働し、本発明に係る各種機能を実現している。
The
記憶部120は、制御部110と組み合わせてプログラムの実行に使用するローカルメモリ、大容量のバルクメモリ、および当該バルクメモリの検索を効率的に行うために使用するキャッシュメモリを含んでよい。記憶部120を実現するコンピュータ可読媒体としては、電気的、磁気的、光学的、電磁的に実現するものを含んでよい。より具体的には、半導体記憶装置、磁気テープ、フロッピー(登録商標)ディスク、ランダム・アクセス・メモリ(RAM)、リードオンリー・メモリ(ROM)、CD−ROMとCD−R/WとDVDとを含む光ディスクが含まれる。
The
入力部130は、ユーザによる入力の受付を行うものであり、キーボード、ポインティング・デバイス等を含んでよい。入力部130は、直接または介在I/Oコントローラを介して当該コンピュータと接続することができる。
The
表示部140は、ユーザにデータの入力を受け付ける画面を表示したり、当該コンピュータによる演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。表示部140は、直接または介在I/Oコントローラを介して当該コンピュータと接続することができる。
The
通信制御部150は、当該コンピュータを専用ネットワークまたは公共ネットワークを介して別の演算処理システムまたは記憶装置と接続できるようにするためのネットワーク・アダプタである。通信制御部150は、モデム、ケーブル・モデムおよびイーサネット(登録商標)・アダプタを含んでよい。
The
[学習処理フロー]
図3は、本発明の好適な実施形態の一例に係るデータ分類の学習処理フローを示す図である。
[Learning process flow]
FIG. 3 is a diagram showing a data classification learning process flow according to an example of the preferred embodiment of the present invention.
ステップS105では、サーバ10は、学習用の目的データを受け付ける。当該目的データは入力部130から受け付けることとしてもよいし、通信制御部150を介して別の演算処理システムあるいは記憶装置から受信することとしてもよい。目的データは、例えば商品に関するデータの場合には、商品名や商品説明等の情報を含んでおり、本学習処理を通じて、分類すべきカテゴリを付与する。
In step S105, the
ステップS110では、サーバ10は、受け付けた目的データに対して、分類の候補となる複数のカテゴリを付与する。このカテゴリの付与については、人手によってもよいが、既に分類済みのサンプルが存在すればサーバが自動で行う(詳細は図4にて後述する)ことが望ましい。
In step S110, the
ステップS105およびS110の結果、例えば商品データの場合には、図5に示すような商品分類テーブル40に、候補となるカテゴリ、商品名、商品説明を記憶する。これらのデータを基に、端末装置20においてカテゴリに紐付けて商品データを表示し、ユーザに対する情報提供サービスを運用する。
As a result of Steps S105 and S110, for example, in the case of product data, candidate categories, product names, and product descriptions are stored in the product classification table 40 as shown in FIG. Based on these data, the
ステップS115では、サーバ10は、端末装置20からカテゴリ選択を表すデータを受信する。具体的には、サーバ10は、端末装置20のユーザが辿ってきたカテゴリ(リンク)を示すデータを受信し、当該ユーザが目的データを選択(閲覧)した際に、ステップS110にて付与された候補カテゴリの中から選択されたカテゴリデータを判別する。
In step S <b> 115, the
ステップS120では、サーバ10は、候補カテゴリのそれぞれが選択された回数をカウントアップして記憶する。具体的には、例えば図6に示すアクセス履歴テーブル50を利用する。目的データ(商品名フィールド)に対してステップS110にて付与した候補カテゴリ(カテゴリフィールド)のそれぞれについて、ステップS115にて受信したカテゴリ選択を表すデータを受信する毎に選択回数フィールドの値をカウントアップして記憶する。
In step S120, the
ステップS125では、サーバ10は、目的データを分類するカテゴリを決定するか否かを判別する。具体的には、例えば、目的データに候補カテゴリを付与してユーザへの閲覧を開始してから所定の期間が経った場合に分類するカテゴリを決定することとしてもよいし、選択回数が所定の数に達した場合に決定することとしてもよい。
In step S125, the
あるいは、サーバ10は、この時点で分類するカテゴリを決定せず、後に新たな目的データを受け付けたときの選択回数に基づいて分類するカテゴリを決定することとしてもよい。その場合には、サーバ10は、より長期間にわたってユーザの傾向を記憶し、カテゴリ分類に利用することができる。なお、このときには、ステップS125およびS130は不要となる。
Or the
ステップS130では、サーバ10は、目的データを分類するカテゴリを決定する。具体的には、例えば以下のような方法で決定することができる。
In step S130, the
(1)選択回数の最も多いカテゴリにする。この場合、サーバ10は、目的データに付与した候補カテゴリの中から、最も選択回数の多いものを選択して目的データに関連付ける。
(1) Select a category with the largest number of selections. In this case, the
(2)選択回数の上位複数のカテゴリにする。この場合、サーバ10は、目的データに付与した候補カテゴリのうち、選択回数の多いものから順に所定の数を選択して目的データに関連付ける。
(2) Select a plurality of categories with the highest number of selections. In this case, the
(3)選択回数が他と比べて多いカテゴリにする。この場合、サーバ10は、例えば各候補カテゴリについての選択回数の偏差値を算出し、当該偏差値が所定の値以上のものを選択して目的データに関連付ける。
(3) Select categories that have more selections than others. In this case, for example, the
分類するカテゴリの決定方法は、以上に限られないが、このような方法によれば、サーバ10は、多くのユーザが選択する傾向にあるカテゴリに対して目的データを効果的に分類することができる。このことにより、ユーザが辿りやすいカテゴリのみを残して、選択されにくい(精度の悪い)カテゴリを排除することもできる。
The method for determining the category to be classified is not limited to the above, but according to such a method, the
なお、所定の期間が経ってもなお、分類すべきカテゴリが決定できないと判断した場合には、サーバ10はその旨を管理者の端末に表示して候補カテゴリの再設定を促してもよい。
If it is determined that a category to be classified cannot be determined even after a predetermined period of time has elapsed, the
ステップS135では、サーバ10は、ステップS130にて決定したカテゴリ(ステップS125およびステップS130を行わない場合には全候補カテゴリ)と関連付けて、目的データに含まれるキーワードと、カテゴリの選択回数に基づいて計算する当該カテゴリの選択確率データを記憶する。具体的には、例えば、図7に示す分類学習テーブル60を利用する。
In step S135, the
分類学習テーブル60には、目的データの名称(例えば商品名等)、目的データに含まれるキーワード、ステップS130にて決定したカテゴリ、カテゴリの選択確率を関連付けて記憶する。ここで、キーワードは、目的データを特徴付ける単語であって、例えば商品データの場合には、商品分類テーブル40(図5)の商品説明を、形態素解析等によって語句に分解し、TF*IDFや確率言語モデルといった手法を用いることにより抽出することができる。 In the classification learning table 60, the name of the target data (for example, product name), the keyword included in the target data, the category determined in step S130, and the category selection probability are stored in association with each other. Here, the keyword is a word that characterizes target data. For example, in the case of product data, the product description in the product classification table 40 (FIG. 5) is decomposed into words by morphological analysis or the like, and TF * IDF or probability It can be extracted by using a method such as language model.
なお、記憶手段はテーブルには限られず、転置索引ファイルとして記憶することもできる。更に、記憶するキーワードには、出現場所や出現回数、あるいは他の分類サンプル(学習事例)とあわせた中での出現頻度等を関連付けて記憶することとしてもよい。これらは後述する類似度の算出において利用することができる。 The storage means is not limited to a table, and can be stored as an inverted index file. Furthermore, the keyword to be stored may be stored in association with the appearance location, the number of appearances, or the appearance frequency in combination with other classification samples (learning examples). These can be used in the calculation of similarity described later.
なお、ステップS135は、本処理フローにおいては、分類カテゴリの決定後に行うこととしたが、タイミングはこれに限られず、例えばキーワードについては、ステップS105にて目的データを受け付けた際に記憶してもよいし、選択確率は、ステップS120の選択回数とあわせて記憶することもできる。 Note that step S135 is performed after the classification category is determined in this processing flow, but the timing is not limited to this. For example, keywords may be stored when the target data is received in step S105. The selection probability may be stored together with the number of selections in step S120.
[分類処理フロー]
図4は、本発明の好適な実施形態の一例に係るカテゴリへの分類処理フローを示す図である。当該分類処理は、学習処理フロー(図3)において学習したカテゴリ分類に基づいて、新たな目的データを分類する処理であるが、当該学習処理フローのステップS110における候補カテゴリの付与においても用いることができる。
[Classification process flow]
FIG. 4 is a diagram showing a classification processing flow into categories according to an example of the preferred embodiment of the present invention. The classification process is a process of classifying new target data based on the category classification learned in the learning process flow (FIG. 3), but it can also be used for assigning candidate categories in step S110 of the learning process flow. it can.
ステップS205では、サーバ10は、カテゴリ分類を行う新たな目的データを受け付ける。当該新たな目的データは入力部130から受け付けることとしてもよいし、通信制御部150を介して別の演算処理システムあるいは記憶装置から受信することとしてもよい。
In step S205, the
ステップS210では、サーバ10は、学習処理フロー(図3)のステップS135において記憶した分類学習テーブル60または転置索引ファイル等に基づいて、当該新たな目的データとカテゴリ毎のキーワード群との類似度を算出する。具体的には、例えば、TF*IDF、あるいはkNN法やNaive Bayes法といった手法を用いることにより、類似度を算出することができる。このとき、キーワードと関連付けて出現頻度等のデータを前もって記憶していれば、これらを用いることができる。このことにより、サーバ10は、当該新たな目的データと類似度の高いキーワード群と、それに対応するカテゴリを抽出することができる。
In step S210, the
ステップS215では、サーバ10は、ステップS210にて算出した類似度に基づいて、分類するカテゴリを決定する。具体的には、サーバ10は当該類似度を用いて、対応するカテゴリそれぞれについて分類すべきか否かを評価する。このとき、サーバ10は、例えば以下のように分類するカテゴリを一つまたは複数決定する。
In step S215, the
(1)類似度が最も高いキーワード群に対応するカテゴリ、あるいは類似度の高い順に所定の個数のカテゴリに分類する(Naive Bayes法等)。この場合、例えば「バッグ」、「ヌメ革」を商品説明に含んだ目的データは、分類学習テーブル60(図7)の例によれば、1行目の学習事例のキーワードとの類似度が高くなり、サーバ10は、当該目的データを「ハンドバッグ」のカテゴリに分類する。
(1) A category corresponding to a keyword group having the highest similarity, or a predetermined number of categories in descending order of similarity (Naive Bayes method or the like). In this case, for example, the target data including “bag” and “numerous leather” in the product description has a high similarity to the keyword of the learning example in the first row according to the example of the classification learning table 60 (FIG. 7). Thus, the
このように、サーバ10は、当該新たな目的データを受け付けた時点で記憶している最新のキーワードとカテゴリの組み合わせを参照して、当該新たな目的データの分類に活用する。なお、この分類学習テーブル60は、前述のように学習処理フロー(図3)のステップS130において実際のユーザによる選択実績に基づいて、不要と考えられる候補カテゴリは排除されているため、特許文献1のように誤分類が蓄積されることによる精度の悪化も抑止できる。
In this way, the
(2)類似度の高い適切な個数のサンプル中で分類するカテゴリを多数決する(kNN法)。この場合、例えば、目的データとキーワードの類似する学習事例が3件あったとき、対応するカテゴリが「ハンドバッグ」2件、「トートバッグ」1件であれば、サーバ10は、当該目的データを多数決により「ハンドバッグ」に分類する。
(2) A large number of categories to be classified in an appropriate number of samples having a high degree of similarity are determined (kNN method). In this case, for example, when there are three learning cases similar to the target data and the keyword, if the corresponding category is two “handbags” and one “tote bag”, the
(3)類似度による重み付けをした上で、適切な個数のサンプル中で分類するカテゴリを多数決する(kNN法)。この場合、上記(2)の例では、「トートバッグ」よりも「ハンドバッグ」の方がキーワードの類似する学習事例の件数は多いが、「トートバッグ」の類似度が勝っていれば、サーバ10は、重み付けの結果「トートバッグ」をより高く評価して分類する可能性がある。
(3) After weighting by similarity, a large number of categories to be classified in an appropriate number of samples are determined (kNN method). In this case, in the example of (2) above, the “handbag” has a larger number of learning cases with similar keywords than the “totebag”, but if the “totebag” similarity score is higher, the
(4)同一カテゴリに対応付けられたキーワード群との類似度の平均が最も高いカテゴリ、あるいは高い順に所定の個数のカテゴリに分類する。この場合は、サーバ10は、同じカテゴリに分類される学習事例の中で、目的データとの類似度にばらつきがあるものよりも、最高の類似度でなくても偏りがないものに分類する可能性がある。
(4) A category having the highest average similarity with a keyword group associated with the same category, or a predetermined number of categories in descending order. In this case, the
(5)類似度に対して選択確率の重み付けをした上で、上述の(1)〜(4)の方法により分類する。この場合は、選択確率が高ければ分類の精度が高いと仮定し、サーバ10は、例えば分類学習テーブル60(図7)の選択確率を類似度に掛け合わせて評価することにより、精度の高い学習事例に基づいたカテゴリに分類することができる。
(5) After the selection probabilities are weighted on the similarity, classification is performed by the methods (1) to (4) described above. In this case, assuming that the selection probability is high, it is assumed that the classification accuracy is high. For example, the
以上のように、本発明の実施形態によれば、情報提供サービスを運用することで目的データを分類するカテゴリの学習ができ、学習したカテゴリに対して新たな目的データを自動で分類することができる。 As described above, according to the embodiment of the present invention, it is possible to learn a category for classifying target data by operating an information providing service, and to automatically classify new target data for the learned category. it can.
ここで、学習の結果(学習事例)については、数多く、そして新しい方がより精度が高く、ユーザの意見を反映していることが期待できる。そこで、学習処理については定期的に行うことが好ましく、例えば、新たな目的データを自動で分類する際にも複数のカテゴリを付与し、学習を行うこととしてもよい。 Here, with regard to the learning results (learning examples), many and newer ones can be expected to have higher accuracy and reflect the user's opinions. Therefore, it is preferable to periodically perform the learning process. For example, when new target data is automatically classified, a plurality of categories may be assigned and learning may be performed.
このようにして、サーバ10は、情報提供サービスを運用する中で学習事例を継続的に取得・利用することができ、カテゴリ分類の精度を高く維持することができる。
In this way, the
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
10 サーバ
20 端末装置
30 通信ネットワーク
40 商品分類テーブル
50 アクセス履歴テーブル
60 分類学習テーブル
110 制御部
120 記憶部
130 入力部
140 表示部
150 通信制御部
160 バス
10
Claims (24)
前記目的データを複数の候補カテゴリデータと関連付けて記憶するステップと、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信するステップと、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶するステップと、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をするステップと、
を含む方法。 A server connected to a terminal device via a communication network is a method for classifying target data to be viewed by a user of the terminal device into a category,
Storing the target data in association with a plurality of candidate category data;
Transmitting the target data associated with the selected candidate category data in response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Storing in association with the selected candidate category data;
Determining the category for classifying the target data based on the selection frequency data in a predetermined period;
Including methods.
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定するステップと、
を更に含む請求項5に記載の方法。 Calculating a similarity between the new target data and the keyword data in response to accepting registration of new target data different from the target data;
Determining a category for classifying the new target data in accordance with a category evaluation based on the calculated similarity;
The method of claim 5 further comprising:
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする請求項6または請求項7に記載の方法。 Extracting and storing keyword data included in the target data in association with the determined category data, further storing selection probability data based on the number of selections of the category,
The method according to claim 6 or 7, wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
前記目的データを複数の候補カテゴリデータと関連付けて記憶する手段と、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信する手段と、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶する手段と、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をする手段と、
を備えるサーバ。 A server that is connected to a terminal device via a communication network and classifies target data to be browsed by a user of the terminal device,
Means for storing the target data in association with a plurality of candidate category data;
Means for transmitting target data associated with the selected candidate category data in response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Means for storing in association with the selected candidate category data;
Means for determining the category for classifying the target data based on the selection frequency data in a predetermined period;
A server comprising
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定する手段と、
を更に備える請求項13に記載のサーバ。 Means for calculating the similarity between the new target data and the keyword data in response to accepting registration of new target data different from the target data;
Means for determining a category for classifying the new target data according to the evaluation of the category based on the calculated similarity;
The server according to claim 13, further comprising:
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする請求項14または請求項15に記載のサーバ。 Means for extracting and storing keyword data included in the target data in association with the determined category data, and further storing selection probability data based on the number of selections of the category;
The server according to claim 14 or 15, wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
前記目的データを複数の候補カテゴリデータと関連付けて記憶させるステップと、
前記端末装置から、前記ユーザによる前記複数の候補カテゴリデータのうち一の選択を表すデータを受信したことに応じて、前記選択をした候補カテゴリデータに関連付けられた目的データを送信させるステップと、
前記端末装置から前記ユーザによる前記目的データの選択を表すデータを受け付けたことに応じて、前記ユーザが前記選択をした候補カテゴリデータの選択回数データをカウントアップして、前記選択をした目的データおよび前記選択をした候補カテゴリデータに関連付けて記憶させるステップと、
所定の期間における前記選択回数データに基づき、前記目的データを分類する前記カテゴリの決定をさせるステップと、
を実行させるプログラム。 A program that causes a server connected to a terminal device via a communication network to classify target data to be viewed by a user of the terminal device into a category,
Storing the target data in association with a plurality of candidate category data;
In response to receiving data representing one selection of the plurality of candidate category data by the user from the terminal device, transmitting target data associated with the selected candidate category data;
In response to receiving data representing selection of the target data by the user from the terminal device, the user counts up the number of selections of candidate category data selected by the user, and the selected target data and Storing in association with the selected candidate category data;
Determining the category for classifying the target data based on the selection frequency data in a predetermined period;
A program that executes
前記算出をした類似度に基づくカテゴリの評価に従い、前記新たな目的データを分類するカテゴリを決定させるステップと、
を更に含む請求項21に記載のプログラム。 In response to accepting registration of new target data different from the target data, calculating the similarity between the new target data and the keyword data;
Determining a category for classifying the new target data in accordance with a category evaluation based on the calculated similarity;
The program according to claim 21, further comprising:
前記キーワードデータに関連付くカテゴリの評価が、前記類似度および前記選択確率データに基づくことを特徴とする請求項22または請求項23に記載のプログラム。 The step of extracting and storing the keyword data included in the target data in association with the determined category data further stores the selection probability data based on the number of selections of the category,
The program according to claim 22 or 23, wherein an evaluation of a category associated with the keyword data is based on the similarity and the selection probability data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006071958A JP4891638B2 (en) | 2006-03-16 | 2006-03-16 | How to classify target data into categories |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006071958A JP4891638B2 (en) | 2006-03-16 | 2006-03-16 | How to classify target data into categories |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007249600A true JP2007249600A (en) | 2007-09-27 |
JP2007249600A5 JP2007249600A5 (en) | 2009-03-05 |
JP4891638B2 JP4891638B2 (en) | 2012-03-07 |
Family
ID=38593822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006071958A Active JP4891638B2 (en) | 2006-03-16 | 2006-03-16 | How to classify target data into categories |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4891638B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010061213A (en) * | 2008-09-01 | 2010-03-18 | Nec Corp | Information processor, information classification method and program |
JP2013531289A (en) * | 2010-05-18 | 2013-08-01 | アリババ・グループ・ホールディング・リミテッド | Use of model information group in search |
JP2015522887A (en) * | 2012-07-19 | 2015-08-06 | フェイスブック,インク. | Context-based object retrieval in social networking systems |
JP5761029B2 (en) * | 2009-12-11 | 2015-08-12 | 日本電気株式会社 | Dictionary creation device, word collection method, and program |
US9740996B2 (en) | 2012-03-27 | 2017-08-22 | Alibaba Group Holding Limited | Sending recommendation information associated with a business object |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297642A (en) * | 2001-03-30 | 2002-10-11 | Fujitsu Ltd | Alteration support device and computer program |
-
2006
- 2006-03-16 JP JP2006071958A patent/JP4891638B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297642A (en) * | 2001-03-30 | 2002-10-11 | Fujitsu Ltd | Alteration support device and computer program |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010061213A (en) * | 2008-09-01 | 2010-03-18 | Nec Corp | Information processor, information classification method and program |
JP5761029B2 (en) * | 2009-12-11 | 2015-08-12 | 日本電気株式会社 | Dictionary creation device, word collection method, and program |
US9600468B2 (en) | 2009-12-11 | 2017-03-21 | Nec Corporation | Dictionary creation device, word gathering method and recording medium |
JP2013531289A (en) * | 2010-05-18 | 2013-08-01 | アリババ・グループ・ホールディング・リミテッド | Use of model information group in search |
EP2572325A4 (en) * | 2010-05-18 | 2016-03-23 | Alibaba Group Holding Ltd | Using model information groups in searching |
US9740996B2 (en) | 2012-03-27 | 2017-08-22 | Alibaba Group Holding Limited | Sending recommendation information associated with a business object |
JP2015522887A (en) * | 2012-07-19 | 2015-08-06 | フェイスブック,インク. | Context-based object retrieval in social networking systems |
US10311063B2 (en) | 2012-07-19 | 2019-06-04 | Facebook, Inc. | Context-based object retrieval in a social networking system |
Also Published As
Publication number | Publication date |
---|---|
JP4891638B2 (en) | 2012-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163647B (en) | Data processing method and device | |
CN104834729B (en) | Topic recommends method and topic recommendation apparatus | |
CN109271574A (en) | A kind of hot word recommended method and device | |
US8019754B2 (en) | Method of searching text to find relevant content | |
US9317613B2 (en) | Large scale entity-specific resource classification | |
US20190318407A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
JP3225912B2 (en) | Information retrieval apparatus, method and recording medium | |
US10229190B2 (en) | Latent semantic indexing in application classification | |
US8788503B1 (en) | Content identification | |
US20140229476A1 (en) | System for Information Discovery & Organization | |
US20110184946A1 (en) | Applying synonyms to unify text search with faceted browsing classification | |
US20180341686A1 (en) | System and method for data search based on top-to-bottom similarity analysis | |
WO2010081238A1 (en) | Method and system for document classification | |
CN113869034B (en) | Aspect emotion classification method based on reinforced dependency graph | |
CN106462644B (en) | Identifying preferred result pages from multiple result page identifications | |
US11941073B2 (en) | Generating and implementing keyword clusters | |
CN111460251A (en) | Data content personalized push cold start method, device, equipment and storage medium | |
KR101472451B1 (en) | System and Method for Managing Digital Contents | |
CN110008396B (en) | Object information pushing method, device, equipment and computer readable storage medium | |
JP2023516209A (en) | METHOD, APPARATUS, APPARATUS AND COMPUTER-READABLE STORAGE MEDIUM FOR SEARCHING CONTENT | |
CN118246540B (en) | Interaction method, device, equipment and storage medium | |
JP4891638B2 (en) | How to classify target data into categories | |
CN115827990B (en) | Searching method and device | |
CN116881432A (en) | Text pushing method, text pushing device, electronic equipment and storage medium | |
CN114491232B (en) | Information query method and device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111216 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4891638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141222 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |