JP2009265754A - Information providing system, information providing method, and information providing program - Google Patents
Information providing system, information providing method, and information providing program Download PDFInfo
- Publication number
- JP2009265754A JP2009265754A JP2008111555A JP2008111555A JP2009265754A JP 2009265754 A JP2009265754 A JP 2009265754A JP 2008111555 A JP2008111555 A JP 2008111555A JP 2008111555 A JP2008111555 A JP 2008111555A JP 2009265754 A JP2009265754 A JP 2009265754A
- Authority
- JP
- Japan
- Prior art keywords
- information
- content
- user
- access
- provision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、通信端末装置から送信されたクエリに適合するコンテンツのコンテンツ識別情報を通信端末装置に送信する情報提供装置、情報提供方法及び情報提供プログラムに関するものである。 The present invention relates to an information providing apparatus, an information providing method, and an information providing program for transmitting content identification information of content that matches a query transmitted from a communication terminal apparatus to the communication terminal apparatus.
現在、インターネット上には膨大な情報が蓄積されており、ユーザは、キーワード検索等の方法により所望の情報にアクセスしている。従来の検索エンジンにおいては、ユーザが入力する検索条件と、格納している文書群のキーワード分布等の文書情報との関係を用いて、条件に合致する文書を抽出し、抽出した文書に優先順位を付してユーザに提供するものが一般的であった。しかし、ユーザ毎に興味や嗜好の違いがあるので、同じ検索条件から抽出された情報であっても、個々の情報の有用性はユーザ毎に異なる。このため、ユーザ固有の情報を反映した情報の提示が求められている。 Currently, a large amount of information is stored on the Internet, and a user accesses desired information by a method such as keyword search. In a conventional search engine, a document that matches a condition is extracted using a relationship between a search condition input by a user and document information such as a keyword distribution of a stored document group. It is common to provide a user with However, since there is a difference in interest and preference for each user, the usefulness of each piece of information differs for each user even if the information is extracted from the same search condition. For this reason, presentation of information reflecting user-specific information is required.
特許文献1には、ユーザの年齢、性別、住所等の属性情報をユーザプロファイルとして予め登録し、このユーザプロファイルに基づいて広告等のコンテンツをユーザに提示するシステムが記載されている。各コンテンツには、訴求したいユーザの属性情報が情報発信主等により対応付けられており、この属性情報とユーザプロファイルとの対比により、ユーザに提示するコンテンツが決定される。
特許文献2には、多数のユーザの情報アクセス履歴に基づいて、検索キーワードとユーザ属性情報を組み合わせた集合と、提示候補であるコンテンツとの間の関連スコアを予め算出し、検索インデクスとして保持しておき、ユーザにより入力された検索キーワードと当該ユーザのユーザ属性情報に関連付けられたコンテンツを検索インデクスを参照して抽出し、関連スコア順に提示する装置が記載されている。
In
特許文献3には、文書検索においてユーザが入力した検索キーワードとその関連語を記録し、関連語の入力履歴からユーザ間の類似度を算出し、類似度の高い他ユーザの関連語リストをユーザに提示する文書検索装置が記載されている。この文書検索装置によれば、検索漏れを防止するための関連語の入力が支援され、効率的な文書検索が可能となる。
特許文献4には、ユーザ及び他ユーザのURLアクセス履歴に基づいて、当該ユーザと他ユーザとの類似度を算出し、類似度の高い他ユーザのアクセス履歴等の情報を当該ユーザに提供する情報処理装置が記載されている。この情報処理装置によれば、ユーザは、趣味・嗜好が共通する蓋然性の高い他のユーザが利用した文書へのアクセスが可能となる。
特許文献1及び特許文献2に記載されたシステムでは、ユーザの属性情報を用いているので、コンテンツに対する嗜好が異なっていても、同じ属性を有する複数のユーザに対しては、同様の情報が提示される。即ち、ユーザに提示される情報の有用性の点で問題があった。また、ユーザの属性情報は人手によって入力されるため、この入力の負担が大きいという問題があった。さらに、意図的に事実と異なる属性情報が入力されたり、ユーザの属性が時間の経過と共に変化する等の理由により、属性情報の精度が低いという問題もあった。また、検索キーワードの選択も人手によって行われるので、同じ情報を求めていても、入力される検索キーワードによって提示されるコンテンツのランキングに差が生じ、提示される情報の精度に問題があった。
In the systems described in
また、特許文献3及び特許文献4に記載された装置においては、ユーザと類似度の高い他ユーザに対応付けられている情報が、個々の情報の軽重が考慮されることなく、当該ユーザにそのまま提示されていた。従って、ユーザにとって有用な情報が優先的に提示されるとは限らなかった。即ち、提示される情報の有用性の面で、精度が低いという問題があった。
In addition, in the devices described in
そこで、本発明は、ユーザにとって有用な情報を精度良くかつ容易に提供することができる情報提供装置、情報提供方法及び情報提供プログラムを提供することを目的とする。 SUMMARY An advantage of some aspects of the invention is that it provides an information providing apparatus, an information providing method, and an information providing program that can provide information useful to a user accurately and easily.
上記課題を解決するために、本発明の情報提供装置は、ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段と、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、アクセス履歴格納手段に格納されたアクセス頻度情報に基づいて算出するユーザ間類似度計算手段と、ユーザと各ユーザとの間のユーザ間類似度により重み付けした当該各ユーザのアクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段と、コンテンツスコア計算手段によって算出された各コンテンツのコンテンツスコアをユーザ識別情報に対応付けて記憶するインデックス格納手段と、通信端末装置から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段と、クエリ入力手段により受け付けられたクエリに適合するコンテンツのコンテンツ識別情報を取得し、インデックス格納手段を参照して、取得したコンテンツ識別情報から提供情報を生成する提供情報生成手段と、提供情報生成手段により生成された提供情報を通信端末装置に出力する提供情報出力手段とを備えることを特徴とする。 In order to solve the above problems, an information providing apparatus according to the present invention includes an access history storage unit that stores access frequency information indicating a frequency of access to each content by a user in association with user identification information for identifying the user. An inter-user similarity calculating means for calculating the similarity between users representing the similarity of access tendency to content among the users based on the access frequency information stored in the access history storage means, and the user and each user The content score calculation means for calculating the content score, which is the information representing the usefulness of the content for the user, from the access frequency information of each user weighted by the similarity between the users between, and the content score calculation means Corresponding content score of each content to user identification information Index storage means for storing, query input means for receiving an input of a query including at least user identification information transmitted from the communication terminal device, and content identification information of content that conforms to the query accepted by the query input means , Provision information generation means for generating provision information from the acquired content identification information with reference to the index storage means, and provision information output means for outputting the provision information generated by the provision information generation means to the communication terminal device It is characterized by that.
また、上記課題を解決するために、本発明の情報提供方法は、情報提供装置における情報提供方法において、情報提供装置が、ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段に格納されたアクセス頻度情報に基づいて、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を算出するユーザ間類似度計算ステップと、ユーザと各ユーザとの間のユーザ間類似度により重み付けした当該各ユーザのアクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出し、算出した各コンテンツのコンテンツスコアをユーザ識別情報に対応付けてインデックス格納手段に記憶させるコンテンツスコア計算ステップと、通信端末装置から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力ステップと、クエリ入力ステップにより受け付けたクエリに適合するコンテンツのコンテンツ識別情報を取得し、インデックス格納手段を参照して、取得したコンテンツ識別情報から提供情報を生成する提供情報生成ステップと、提供情報生成ステップにおいて生成した提供情報を通信端末装置に出力する提供情報出力ステップとを実行することを特徴とする。 In order to solve the above-described problem, the information providing method of the present invention is the information providing method in the information providing apparatus, in which the information providing apparatus stores the access frequency information indicating the frequency of access to each content by the user. Similarity between users that calculates similarity between users representing similarity of access tendency to content among users based on access frequency information stored in access history storage means stored in association with identifying user identification information The content score, which is information representing the usefulness of content for the user, is calculated from the degree calculation step and the access frequency information of each user weighted by the similarity between users between the user and each user. Stores the content score of each content as an index in association with user identification information A content score calculation step to be stored in a stage, a query input step for receiving an input of a query including at least user identification information transmitted from the communication terminal device, and content identification information for content matching the query received by the query input step Obtaining and referring to the index storage means, a provision information generating step for generating provision information from the acquired content identification information, and a provision information output step for outputting the provision information generated in the provision information generation step to the communication terminal device It is characterized by performing.
さらに、上記課題を解決するために、本発明の情報提供プログラムは、コンピュータを、ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段と、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、アクセス履歴格納手段に格納されたアクセス頻度情報に基づいて算出するユーザ間類似度計算手段と、ユーザと各ユーザとの間のユーザ間類似度により重み付けした当該各ユーザのアクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段と、コンテンツスコア計算手段によって算出された各コンテンツのコンテンツスコアをユーザ識別情報に対応付けて記憶するインデックス格納手段と、通信端末装置から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段と、クエリ入力手段により受け付けられたクエリに適合するコンテンツのコンテンツ識別情報を取得し、インデックス格納手段を参照して、取得したコンテンツ識別情報から提供情報を生成する提供情報生成手段と、提供情報生成手段により生成された提供情報を通信端末装置に出力する提供情報出力手段として機能させることを特徴とする。 Furthermore, in order to solve the above problem, the information providing program of the present invention stores the computer in association with the user identification information for identifying the user, the access frequency information indicating the frequency of access to each content by the user. An access history storage means, and an inter-user similarity calculation means for calculating the similarity between users representing the similarity of the access tendency to the content among the users based on the access frequency information stored in the access history storage means; A content score calculating means for calculating a content score, which is information representing the usefulness of content for the user, from the access frequency information of each user weighted by the similarity between users between the user and each user; and a content score Content contents of each content calculated by the calculation means Conforms to the index storage means for storing the user ID in association with the user identification information, the query input means for receiving the input of the query including at least the user identification information transmitted from the communication terminal device, and the query received by the query input means The content identification information of the content to be acquired is acquired, the provision information generation means for generating the provision information from the acquired content identification information with reference to the index storage means, and the provision information generated by the provision information generation means to the communication terminal device It is characterized by functioning as provision information output means for outputting.
これら構成により、各コンテンツに対するアクセス傾向の類似性に基づいてユーザ間類似度が算出される。また、コンテンツスコア計算手段は、アクセス履歴から各ユーザの各コンテンツに対するアクセス頻度を抽出し、ユーザと各ユーザとの間のユーザ間類似度により重み付けしたアクセス頻度から、コンテンツスコアを算出する。このため、ユーザと他のユーザとのユーザ間類似度が大きいほど、当該他のユーザがアクセスしたコンテンツのコンテンツスコアは大きくなるので、コンテンツスコアは、ユーザに対する文書の有用性を精度良く表すことができる。クエリに適合するコンテンツのコンテンツ識別情報は、コンテンツスコアに基づいてユーザに提示されるので、そのユーザにとって有用性の高い文書が提示される。また、コンテンツスコアはユーザのコンテンツに対するアクセス履歴から算出され、特段の属性情報等の入力が不要であるので、ユーザの負担は小さい。従って、ユーザにとって有用な情報を精度良く且つ容易に提供することが可能となる。 With these configurations, the similarity between users is calculated based on the similarity of the access tendency to each content. The content score calculation means extracts the access frequency of each user for each content from the access history, and calculates the content score from the access frequency weighted by the similarity between users between the users. For this reason, since the content score of the content accessed by the other user increases as the similarity between the user and the other user increases, the content score accurately represents the usefulness of the document to the user. it can. Since the content identification information of the content that matches the query is presented to the user based on the content score, a document that is highly useful to the user is presented. Further, the content score is calculated from the user's access history with respect to the content, and it is not necessary to input special attribute information or the like, so the burden on the user is small. Therefore, it is possible to provide information useful for the user accurately and easily.
また、本発明に係る情報提供装置は、提供情報生成手段は、インデックス格納手段及びアクセス履歴格納手段を参照して、クエリに含まれるユーザ識別情報により特定されるユーザがアクセスしたことがないコンテンツのコンテンツ識別情報のみから提供情報を生成することを特徴とすることができる。 In the information providing apparatus according to the present invention, the provided information generating unit refers to the index storing unit and the access history storing unit, and the content specified by the user identification information included in the query has not been accessed by the user. The provision information can be generated only from the content identification information.
これら構成により、クエリに含まれるユーザ識別情報に基づいて、当該ユーザがアクセスしたことがないコンテンツが抽出され、さらに、抽出されたコンテンツはコンテンツスコアに基づいてユーザに提示される。従って、当該ユーザにとって未知のコンテンツが提示されるので、そのユーザにとってより有用性の高い情報を提供することが可能となる。 With these configurations, content that the user has never accessed is extracted based on the user identification information included in the query, and the extracted content is presented to the user based on the content score. Accordingly, since the content unknown to the user is presented, it is possible to provide information more useful to the user.
本発明に係る情報提供装置は、ユーザによる各コンテンツに対するアクセスの履歴を収集し、収集したアクセス履歴に基づいてアクセス頻度情報を生成し、生成したアクセス頻度情報をアクセス履歴格納手段に記憶させるアクセス履歴収集手段を更に備えることを特徴とする。 An information providing apparatus according to the present invention collects an access history for each content by a user, generates access frequency information based on the collected access history, and stores the generated access frequency information in an access history storage unit It further comprises a collecting means.
この構成により、アクセス頻度情報は、コンテンツに対するアクセスの履歴に基づいて生成されるので、アクセス頻度情報が容易に生成され、本発明を確実に実施することが可能となる。 With this configuration, since the access frequency information is generated based on the history of access to the content, the access frequency information is easily generated, and the present invention can be reliably implemented.
本発明に係る情報提供装置では、アクセス履歴収集手段は、提供情報に応答して通信端末装置から出力された、コンテンツに対するアクセスのアクセス履歴を収集し、提供情報に含まれ、且つアクセス履歴を収集しなかったコンテンツのアクセス頻度情報を減ずることを特徴とする。 In the information providing apparatus according to the present invention, the access history collecting means collects the access history of access to the content output from the communication terminal device in response to the provided information, and is included in the provided information and collects the access history. It is characterized in that the access frequency information of the content that has not been reduced is reduced.
この構成により、ユーザに提示した提供情報に応じて行われたアクセスの履歴を収集することができるので、提供情報としてユーザに提示されたにも関わらず、ユーザがアクセスしなかったコンテンツを特定することができる。このようにアクセスされなかったコンテンツのアクセス頻度情報を減ずることにより、アクセス頻度情報にはユーザにとっての当該コンテンツの有用性がより強く反映される。このようなアクセス頻度情報を用いてコンテンツスコアを算出することにより、提供されるコンテンツのユーザにとっての有用性の精度を一層向上させることが可能となる。 With this configuration, it is possible to collect a history of accesses performed according to the provided information presented to the user, so that content that the user did not access despite being presented to the user as provided information is specified. be able to. By reducing the access frequency information of the content that has not been accessed in this way, the usefulness of the content for the user is more strongly reflected in the access frequency information. By calculating the content score using such access frequency information, it is possible to further improve the accuracy of the usefulness of the provided content for the user.
本発明に係る情報提供装置では、提供情報生成手段は、インデックス格納手段を参照して、コンテンツ識別情報をコンテンツスコアの順に並べた提供情報を生成することを特徴とする In the information providing apparatus according to the present invention, the provided information generating unit generates the provided information in which the content identification information is arranged in the order of the content score with reference to the index storing unit.
この構成により、コンテンツスコアの大きいコンテンツ識別情報がユーザに提示されるので、ユーザにとって有用性の高い情報をユーザに提供することが可能となる。 With this configuration, content identification information having a large content score is presented to the user, so that it is possible to provide the user with highly useful information for the user.
本発明に係る情報提供装置では、通信端末装置から送信されたクエリは検索キーワードを含み、提供情報生成手段は、検索キーワードを含むコンテンツのコンテンツ識別情報を取得することを特徴とすることができる。 In the information providing apparatus according to the present invention, the query transmitted from the communication terminal apparatus includes a search keyword, and the provided information generation unit acquires content identification information of content including the search keyword.
この構成により、本発明の情報提供装置を、キーワードによる文書検索に適用することが可能となる。 With this configuration, the information providing apparatus of the present invention can be applied to document search using keywords.
本発明に係る情報提供装置では、コンテンツ識別情報は、当該コンテンツのネットワーク上の所在を示す情報を含むことができる。 In the information providing apparatus according to the present invention, the content identification information can include information indicating the location of the content on the network.
この構成により、提供されたコンテンツ識別情報に基づいて、ユーザは、ネットワーク上に所在するコンテンツにアクセスすることが可能となる。 With this configuration, based on the provided content identification information, the user can access content located on the network.
また、本発明に係る情報提供装置では、コンテンツスコア計算手段は、ユーザ間類似度が所定の閾値より高いユーザのアクセス履歴を用いてコンテンツスコアを算出することが好適である。 In the information providing apparatus according to the present invention, it is preferable that the content score calculating means calculates a content score using an access history of a user whose similarity between users is higher than a predetermined threshold.
本発明の情報提供装置においては、アクセスをするユーザの数は、一般的には非常に大きい。コンテンツスコアの計算に際して、ユーザ間類似度が所定の閾値以下の他のユーザのアクセス履歴を除外することができるので、処理負荷の軽減を図ることが可能となる。 In the information providing apparatus of the present invention, the number of accessing users is generally very large. When calculating the content score, it is possible to exclude access histories of other users whose similarity between users is equal to or less than a predetermined threshold value, so that the processing load can be reduced.
本発明の情報提供装置、情報提供方法及び情報提供プログラムによれば、クエリに適合する複数のコンテンツのコンテンツ識別情報は、ユーザにとってのコンテンツの有用性を表すコンテンツスコアに基づいてユーザに提示されるので、ユーザにとって有用性の高いコンテンツが提示される。このコンテンツスコアは、アクセス履歴から算出されるのでユーザによる属性入力等の負担はない。その結果、ユーザにとって有用な情報を精度良くかつ容易に提供することが可能となる。 According to the information providing apparatus, the information providing method, and the information providing program of the present invention, the content identification information of a plurality of contents that match the query is presented to the user based on the content score representing the usefulness of the content for the user. Therefore, content that is highly useful to the user is presented. Since the content score is calculated from the access history, there is no burden such as attribute input by the user. As a result, it is possible to provide information useful for the user accurately and easily.
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、各図面において同一又は相当の部分に対しては同一の符号を付すこととする。
[第1の実施形態]
DESCRIPTION OF EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In the drawings, the same or corresponding parts are denoted by the same reference numerals.
[First Embodiment]
図1は、第1の実施形態に係る情報提供装置10、ネットワークアクセスサーバ20及び通信端末装置30の機能的構成を示すブロック図である。情報提供装置10と通信端末装置30とは有線又は無線のネットワーク40を介して通信可能である。このネットワーク40は、例えば移動体通信網、インターネット等である。
FIG. 1 is a block diagram illustrating functional configurations of the
情報提供装置10は、通信端末装置30から送信されたクエリに適合するコンテンツのコンテンツ識別情報を取得し、取得したコンテンツ識別情報を通信端末装置30に送信する装置であり、例えばサーバコンピュータにより構成される。コンテンツは、例えばhtmlファイル、テキストファイル、リッチテキストファイル及び画像ファイル等である。コンテンツ識別情報は、例えばコンテンツのネットワーク上の所在を示す情報(例えば、URL)を含むことができる。
The
ネットワークアクセスサーバ20は、通信端末装置30からネットワーク40上の各種装置へのアクセスを制御する装置であり、例えばゲートウエイやプロクシ等である。
The
通信端末装置30は、情報提供装置10及びネットワークアクセスサーバ20と情報の送受信を行なう装置であり、例えば、携帯端末装置、パーソナルコンピュータにより構成される。通信端末装置30は、情報提供装置10にクエリを送信し、このクエリに応答して情報提供装置10から送信された提供情報を表示し、ユーザに提示する。なお、複数のユーザが一台の通信端末装置30を共有したり、一人のユーザが複数の通信端末装置30を利用したりすることは可能であるが、第1の実施形態においては、説明の便宜上、一人のユーザは一台の通信端末装置30を利用するものとする。また、通信端末装置30は、ネットワークアクセスサーバ20を介して、情報提供装置10と通信を行うこととしてもよい。ここで、図1には3台の通信端末装置30が示されているが、この台数には限られない。
The
図1を用いて、情報提供装置10及びネットワークアクセスサーバ20の各機能要素を併せて説明する。なお、各機能要素において行われる処理の詳細は後述する。第1の実施形態において、情報提供装置10とネットワークアクセスサーバ20とは、それぞれ別の装置として構成しているが、一つの装置として構成されることとしてもよい。情報提供装置10は、機能的には、ユーザ間類似度計算部11、コンテンツスコア計算部12、インデックス格納部13、クエリ入力部14、提供情報生成部15及び提供情報出力部16を備えている。ネットワークアクセスサーバ20は、機能的には、アクセス履歴収集部21及びアクセス履歴格納部22を備えている。
The functional elements of the
アクセス履歴収集部21は、ユーザによる各コンテンツに対するアクセスの履歴を収集し、収集したアクセス履歴に基づいてアクセス頻度情報を生成し、生成したアクセス頻度情報をアクセス履歴格納部22に記憶させるアクセス履歴収集手段である。このアクセス履歴は、誰がどのコンテンツにアクセスしたかを示す情報であり、少なくともユーザ識別情報及びコンテンツ識別情報を含み、さらに、時刻情報、通信端末装置30を識別する情報等を含むことができる。アクセス履歴収集部21は、通信端末装置30からネットワークアクセスサーバ20を介して行われるアクセスに基づいて、アクセス先情報(例えば、URL)を、当該通信端末装置30を識別する情報(例えば、IPアドレスやIMEI等の端末識別番号)、ユーザ識別情報(例えば、ネットワークアクセス時のログインネームやSIMやUIMの契約者識別番号)及び時刻情報と併せてアクセス履歴を示す情報として収集する。また、これらの情報は、通信端末装置30から直接送信されることとしても良い。
The access history collection unit 21 collects a history of access to each content by a user, generates access frequency information based on the collected access history, and stores the generated access frequency information in the access
アクセス履歴格納部22は、ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段である。
The access
ユーザ間類似度計算部11は、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、アクセス履歴格納部22に格納されたアクセス頻度情報に基づいて算出するユーザ間類似度計算手段である。ユーザ間類似度計算部11は、算出したユーザ間類似度をコンテンツスコア計算部12に送出する。
The inter-user
コンテンツスコア計算部12は、ユーザと各ユーザとの間のユーザ間類似度により重み付けした当該各ユーザのアクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段である。ここで各ユーザは、当該ユーザと他ユーザとを含む。また、コンテンツスコア計算部12は、ユーザ毎に算出した各コンテンツのコンテンツスコアをユーザ識別情報に対応付けた情報をインデックスとしてインデックス格納部13に記憶させる。
The content
インデックス格納部13は、各コンテンツのコンテンツスコアをユーザ識別情報に対応付けたインデックスを記憶するインデックス格納手段である。
The
クエリ入力部14は、通信端末装置30から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段である。また、クエリは、情報提供装置10に対する情報の提供要求であり、検索キーワード、その他の検索条件を含むことができる。クエリ入力部14は、受け付けたクエリを提供情報生成部15に送出する。
The
提供情報生成部15は、クエリ入力手段により受け付けられたクエリに適合するコンテンツのコンテンツ識別情報を取得し、インデックス格納部13を参照して、取得したコンテンツ識別情報から提供情報を生成する提供情報生成手段である。提供情報生成部15は、生成した提供情報を提供情報出力部16に送出する。
The provision
提供情報出力部16は、取得した提供情報を通信端末装置30に出力する提供情報出力手段である。
The provision
図2は情報提供装置10のハードウエア構成図である。情報提供装置10は、物理的には、CPU101、主記憶装置であるRAM102及びROM103、ハードディスク、ネットワークカード等のデータ送受信デバイスである通信モジュール104、フラッシュメモリ等の補助記憶装置105などを含むコンピュータシステムとして構成されている。図1において説明した情報提供装置10の各機能は、図2に示すCPU101、RAM102等のハードウエア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104等を動作させるとともに、RAM102や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。情報提供装置10は、例えばサーバコンピュータにより実現される。また、図示はしていないが、ネットワークアクセスサーバ20も、物理的には図2に示されるようなハードウエア構成を備える。
FIG. 2 is a hardware configuration diagram of the
続いて、通信端末装置30の各機能要素を説明する。通信端末装置30は、指示受付部31、ユーザ識別情報記憶部32、送受信部33及び表示部34を備えている。
Subsequently, each functional element of the
指示受付部31は、情報提供装置10からの情報提供を受けるための、ユーザからの指示を受け付ける指示受付手段である。
The
ユーザ識別情報記憶部32は、ユーザを一意に識別するユーザ識別情報を記憶するユーザ識別情報記憶手段である。このユーザ識別情報記憶部32には、通信端末装置30の所有者であるユーザのユーザ識別情報を予め記憶させておくことができる。また、通信端末装置30に対するログイン操作が行わる際に入力されるユーザ識別情報を記憶させることもできる。
The user identification
送受信部33は、指示受付部31がユーザからの指示を受け付けると、ユーザ識別情報をクエリとして情報提供装置10に送信する送信手段であり、また、情報提供装置10から送信された提供情報を受信する受信手段である。クエリは、ユーザ識別情報の他に、検索キーワード、その他の検索条件を含むことができる。これらの検索条件は、ユーザにより入力され、指示受付部31により受け付けられる。
The transmission /
表示部34は、受信した提供情報を表示する表示手段であり、例えばディスプレイ装置により構成される。
The
図3は通信端末装置30のハードウエア構成図である。通信端末装置30は、物理的には、CPU301、主記憶装置であるRAM302及びROM303、入力デバイスであるキーボード等の入力装置304、ネットワークカード等のデータ送受信デバイスである通信モジュール305、ハードディスク、フラッシュメモリ等の補助記憶装置306、ディスプレイ等の出力装置307などを含むコンピュータシステムとして構成されている。図1において説明した通信端末装置30の各機能は、図3に示すCPU301、RAM302等のハードウエア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU301の制御のもとで通信モジュール305、入力装置304、出力装置307等を動作させるとともに、RAM302や補助記憶装置306におけるデータの読み出し及び書き込みを行うことで実現される。
FIG. 3 is a hardware configuration diagram of the
続いて、第1の実施形態に係る情報提供装置10、ネットワークアクセスサーバ20及び通信端末装置30の動作について説明する。図4は、情報提供装置10及びネットワークアクセスサーバ20が、インデックスを生成する処理手順を示す図である。
Subsequently, operations of the
まず、アクセス履歴収集部21は、通信端末装置30からネットワークアクセスサーバ20を介したコンテンツへのアクセスが行われると、アクセス履歴を収集し、収集したアクセス履歴をアクセス履歴格納部22に記憶させる(S101)。ここでアクセス履歴格納部に記憶されるアクセス履歴のデータ構造の例を図5に示す。アクセス履歴は、ユーザ識別情報であるユーザIDとコンテンツ識別情報であるコンテンツIDとが対応付けられたデータである。例えば、図5に示すアクセス履歴の1行目のレコードは、ユーザU02による、コンテンツD04に対するアクセスがあったことを示している。アクセス履歴が収集される毎にユーザIDとコンテンツIDとの組で表されるデータが、アクセス履歴格納部22に逐次、追加して記憶される。
First, when the
続いて、ネットワークアクセスサーバ20のアクセス履歴収集部21は、図5に例示したアクセス履歴のデータを、図6に示すような各コンテンツがアクセスされた頻度をユーザ毎に集計したデータ構造に変換する(S102)。変換されたデータは、アクセス履歴格納部22に格納される。例えば、コンテンツD01は、ユーザU01により5回のアクセスをされたことが示されている。第1の実施形態においては、ステップS102において行われるデータ構造の変換は、アクセス履歴がアクセス履歴格納部22に追加される毎に逐次行われることとしたが、図5に示すアクセス履歴のデータが所定量の増加をした時又は一定時間毎に行われることとしても良い。また、ネットワークアクセスサーバ20は、ステップS102において行われるデータ構造の変換は行わずに、図5に示すデータ構造によりアクセス履歴を記憶しておくこととしても良い。この場合には、情報提供装置10のユーザ間類似度計算部11がステップS102に示すデータ構造の変換を行うこととなる。
Subsequently, the access history collection unit 21 of the
ユーザ間類似度計算部11は、アクセス履歴格納部22に格納されたアクセス履歴に基づいて、ユーザ間類似度を算出する(S103,ユーザ間類似度計算ステップ)。このユーザ間類似度は、コンテンツに対するアクセス傾向の類似性を数値化したものである。ユーザ間類似度の算出は、既存技術により実現することができる。第1の実施形態においては、ユーザ毎に各コンテンツに対するアクセス頻度を要素とするベクトルを生成し、ユーザ間のベクトルの内積値をユーザ間類似度とする。このベクトルにおいては、コンテンツ数がベクトルの次元数となる。以下にユーザ間類似度計算部11によるユーザ間類似度の算出の一例を具体的に説明する。
The inter-user
まず、ユーザ間類似度計算部11は、図6に示すデータを、ユーザ毎の各コンテンツに対するアクセス回数をベクトルの要素の値として、ベクトルの大きさが1となるように正規化する。例えばユーザU01のコンテンツD01に対するアクセスの頻度を表す要素の値は、5/(52+22+22)1/2=0.87と求められる。このようにユーザ毎の各コンテンツに対するアクセスの頻度を正規化したデータを図7に示す。さらに、ユーザ間類似度計算部11は、ユーザ毎の各コンテンツに対するアクセスの頻度を正規化したデータをベクトルの要素の値として、ユーザ毎にコンテンツIDの昇順に並べ、ユーザ毎のユーザベクトルを生成する。生成したユーザベクトルを図8に示す。このユーザベクトルは、ユーザの各コンテンツに対するアクセス傾向を表す。本実施例においては、説明の便宜上、ユーザベクトルの要素数Nは4としているが、この要素数Nの値は、アクセスの対象となるコンテンツの総数であるので、実際には非常に大きな値となる。なお、アクセス対象とするコンテンツの数は、いずれかのユーザがアクセスしたコンテンツの総数としても良いし、既存技術であるクローラを用いて収集したコンテンツを含めても良い。ただし、クローラを用いて収集したコンテンツを対象とした場合には、ユーザから1度もアクセスされなかったコンテンツが含まれることとなる。
First, the inter-user
続いて、ユーザ間類似度計算部11は、図8に示したユーザベクトルに基づいて、ユーザ間類似度を算出する。ユーザ間類似度は、ユーザベクトルの内積値を算出することにより得られる。このように求めたユーザ間類似度を図9に示す。例えば、ユーザU01とユーザU02とのユーザ間類似度は0.084である。ユーザ間類似度はベクトルの内積値であるので、0以上1以下の値となり、ユーザ間類似度が0の場合は、ユーザ間において同一のコンテンツに対するアクセスが全くなかったことを表し、ユーザ間類似度が1の場合は、正規化したアクセス頻度が同一であったことを表す。ユーザ間類似度計算部11は、生成したユーザ間類似度を一時記憶部(図示せず)に、記憶させる。なお、ユーザ間類似度計算部11は、予め定めた所定数以下の数のユーザのユーザ間類似度を算出することとしても良い。一般に情報提供装置10は、膨大な数のユーザに情報を提供するサービスを行うので、ユーザ間類似度の算出を、提供情報の精度を劣化させない程度の大きさの所定数に限定することで、情報提供装置10の処理負荷を軽減することができる。
Subsequently, the inter-user
次に、コンテンツスコア計算部12は、ステップS103において生成したユーザ間類似度及びユーザベクトルに基づいて、ユーザ毎のコンテンツスコアを算出する(S104,コンテンツスコア計算ステップ)。ユーザU02のコンテンツスコアの算出を例として、以下に具体的に説明する。まず、コンテンツスコア計算部12は、図8に示す各ユーザのユーザベクトルに、ユーザU02と各ユーザとのユーザ間類似度を乗じて、図10に示す類似度考慮ユーザベクトルを算出する。例えば、ユーザU01のユーザベクトル(0.87,0.35,0,0.35)に、ユーザU02とユーザU01とのユーザ間類似度0.084を乗ずると、ユーザU02にとってのユーザU01の類似度考慮ユーザベクトル(0.073,0.029,0,0.03)が得られる。この例と同様に、ユーザU02にとってのユーザU02、U03、U04及びU05の類似度考慮ユーザベクトルが得られる。ここで、ユーザU02とユーザ間類似度が大きい対象ユーザであるほど、類似度考慮ユーザベクトルの要素の値が大きくなる。例えば、ユーザ間類似度の値が0.98であるユーザU05の類似度考慮ユーザベクトルの各要素は、0.14〜0.98といった値であるのに対して、ユーザ間類似度の値が0.029であるユーザU04の類似度考慮ユーザベクトルの各要素は、0.1未満の値であり、ユーザU05とユーザU04とには類似度考慮ユーザベクトルの値に顕著な差があることがわかる。
Next, the content
続いて、コンテンツスコア計算部12は、ユーザ毎に、当該ユーザにとっての各ユーザの類似度考慮ユーザベクトルを合算し、各コンテンツのコンテンツスコアを要素とするベクトルを算出する。算出したコンテンツスコアを要素とするベクトルを図11に示す。例えば、ユーザU02のコンテンツD01のコンテンツスコアは、図10に示されるユーザU02にとっての各ユーザの類似度考慮ユーザベクトルのコンテンツD01の要素の値0.073,0,0.11,0.028,0.14を合算し、0.35と求められる。同様に、ユーザU02のコンテンツD02のコンテンツスコアは0.033、コンテンツD03のコンテンツスコアは1.93、コンテンツD04のコンテンツスコアは0.48と求められる。このように求められたコンテンツスコアは、各ユーザのコンテンツに対する興味や嗜好の度合いを数値化したものであり、各ユーザにとっての各コンテンツの有用度を表している。
Subsequently, the content
なお、本実施例においては、各コンテンツに対するアクセス頻度を表すベクトルにユーザ間類似度を乗じて得たベクトルをコンテンツスコアの算出に用いているが、このように算出したベクトル以外であっても、ユーザの各コンテンツに対するアクセス頻度を表す値又はベクトルに、ユーザ間のアクセス傾向の類似性を反映させるような演算を行って得た値又はベクトルであれば、コンテンツスコアの算出に用いることができる。なお、コンテンツスコア計算部12は、ユーザ間類似度が所定の閾値より高いユーザのアクセス頻度情報を用いてコンテンツスコアを算出することとしても良い。ユーザ間類似度が低いユーザのユーザベクトルをコンテンツスコアの算出に用いなくても、コンテンツスコアの精度の劣化は小さい。従って、所定の閾値を適切な値に設定することにより、コンテンツスコアの精度の劣化なく、情報提供装置10の処理負荷を軽減できる。なお、この場合には、この閾値は、予め情報提供装置10に入力され、コンテンツスコア計算部12に記憶されているものとする。
In the present embodiment, a vector obtained by multiplying a vector representing the access frequency for each content by the similarity between users is used for calculation of the content score. Any value or vector obtained by performing an operation that reflects the similarity of the access tendency between users to a value or vector representing the access frequency of each content of the user can be used for calculation of the content score. Note that the content
コンテンツスコア計算部12は、算出したコンテンツスコアとユーザ識別情報と対応付けた情報を提供情報の生成に用いるためのインデックスとしてインデックス格納部13に記憶させる(S105,コンテンツスコア計算ステップ)。具体的には、コンテンツスコア計算部12は、図11に示されるようなユーザ毎のコンテンツスコアのベクトルの各要素を値の大きな順に並べ替え、さらに対応するコンテンツIDに置き換えて、図12(a)に示されるようなインデックスをインデックス格納部13に記憶させる。例えば、ユーザU02のコンテンツに対する興味や嗜好の度合いは、D03、D04、D01、D02の順に低下することが判る。このようにコンテンツIDをコンテンツスコア順に並べたデータをインデックスとすることで、提供情報の生成処理の高速化が図られる。なお、図12(a)に示されるようなインデックスの態様では、ユーザ識別情報に対応付けたコンテンツIDの配列をインデックスとしているが、このコンテンツIDは、コンテンツスコアの値の大きさにより並べられているので、実質的にはコンテンツスコアの情報を有している。また、他の実施形態としては、図12(b)に示されるように、コンテンツIDとコンテンツスコアの値とを対応付けたデータの組をインデックスとすることができる。このようなインデックスとすることにより、提供情報の出力に際して、コンテンツスコアを提供情報に含めることができるので、提供情報を提示されたユーザは、各コンテンツの有用度を定量的に知ることができる。さらに、他の実施形態としては、図11に示されるようなコンテンツIDの昇順にコンテンツスコアを要素として並べたベクトルを、インデックスとすることができる。
The content
なお、ステップS103〜S105に示す処理は、所定時間が経過する毎に行われることとすることができる。この所定時間には、任意の時間を予め設定しておくことが可能である。また、新たなアクセス履歴がアクセス履歴格納部22に追加される毎にこれらの処理が行われることとしても良い。
Note that the processing shown in steps S103 to S105 can be performed every time a predetermined time elapses. An arbitrary time can be set in advance as the predetermined time. These processes may be performed every time a new access history is added to the access
次に、図13を用いて、情報提供装置10が、送信されたクエリに基づいて、提供情報を通信端末装置に送信する処理手順を説明する。
Next, a processing procedure in which the
まず、通信端末装置30の指示受付部31は、ユーザによって入力されるクエリを受け付ける(S201)。第1の実施形態においては、このクエリは、当該ユーザを識別するユーザ識別情報及び検索のための検索キーワードを含む。ユーザ識別情報は、当該ユーザが通信端末装置30にログインするときにユーザにより入力され、ユーザ識別情報記憶部32に記憶されている。検索キーワードは、例えば複数であっても良いし、論理式により与えられても良い。
First, the
続いて、クエリを受け付けた指示受付部31は、送受信部33を介してユーザ識別情報及び検索キーワードを含むクエリを情報提供装置10に送信する(S202)。
Subsequently, the
情報提供装置10のクエリ入力部14は、通信端末装置30から送信されたクエリを受信する(S211,クエリ入力ステップ)。クエリ入力部14は、受信したクエリを提供情報生成部15に送出する。なお、クエリ入力部14は、(例えば、保守目的のため)情報提供装置10が備えるキーボードやマウス等の入力装置からクエリを取得することとしても良い。
The
次に、提供情報生成部15は、インデックス格納部13を参照して、受信したクエリに含まれるユーザ識別情報に基づいて、インデックスを抽出する(S212,提供情報生成ステップ)。例えば、受信したクエリに含まれるユーザ識別情報が、ユーザU02である場合には、インデックスとして、(D03,D04,D01,D02)が抽出される。
Next, the provision
続いて、提供情報生成部15は、クエリに含まれる検索キーワードに適合するコンテンツを、ステップS212において抽出したインデックスの中から抽出する(S213,提供情報生成ステップ)。検索キーワードを含むコンテンツの検索は、インデックスに含まれる各コンテンツの全文検索により行われる。この全文検索は、既存技術により生成されたコンテンツ毎の出現語インデックス(図示せず)を参照することにより行われる。この出現語インデックスは、インデックス格納部13に記憶されていても良いし、他の記憶部に記憶されていることとしても良い。さらに、提供情報生成部15は、検索キーワードに適合するコンテンツのコンテンツIDをコンテンツスコア順に並べた提供情報を生成する。インデックス格納部13に記憶されているインデックスが図12(a)に示されるような態様であれば、検索キーワードに適合しないコンテンツIDをインデックスから除外することにより提供情報を生成できる。また、抽出されたコンテンツの中で最もコンテンツスコアが大きいコンテンツのコンテンツIDのみを提供情報とすることもできる。インデックス格納部13に記憶されているインデックスが図11に示されるような態様であれば、検索キーワードに適合するコンテンツのコンテンツIDとコンテンツスコアを抽出し、コンテンツスコアの降順にコンテンツIDを並べることにより、提供情報を生成することができる。提供情報生成部15は、生成した提供情報を提供情報出力部16に送出する。
Subsequently, the provision
提供情報出力部16は、取得した提供情報を通信端末装置30に送信する(S214,提供情報出力ステップ)。通信端末装置30の送受信部33は、提供情報を受信し、受信した提供情報を表示部34に送出する(S203)。表示部34は、取得した提供情報を表示し、ユーザに提示する(S204)。
The provided
第1の実施形態によれば、情報提供装置10のユーザ間類似度計算部11は、ユーザの各コンテンツに対するアクセス傾向の類似性に基づいてユーザ間類似度を算出する。また、コンテンツスコア計算部12は、アクセス履歴格納部22に格納されたアクセス履歴から各ユーザの各コンテンツに対するアクセス頻度を抽出し、ユーザと各ユーザとの間のユーザ間類似度により重み付けしたアクセス頻度から、コンテンツスコアを算出する。ユーザと他のユーザとのユーザ間類似度が大きいほど、当該他のユーザがアクセスしたコンテンツのコンテンツスコアは大きくなるので、このように算出されたコンテンツスコアは、ユーザに対する文書の有用性を精度良く表すことができる。提供情報生成部15は、クエリに含まれる検索キーワードを含むコンテンツを抽出し、このコンテンツのコンテンツIDを含む提供情報をコンテンツスコアに基づいて生成する。この提供情報は、そのユーザにとって有用性の高いコンテンツを提示する。また、コンテンツスコアはユーザのコンテンツに対するアクセス履歴から算出され、特段の属性情報等の入力が不要であるので、ユーザの負担は小さい。従って、ユーザにとって有用な情報を精度良く且つ容易に提供することが可能となる。
[第2の実施形態]
According to the first embodiment, the inter-user
[Second Embodiment]
図14は、本発明の第2の実施形態に係る情報提供装置10a、ネットワークアクセスサーバ20及び通信端末装置30の機能的構成を示すブロック図である。図14に示す情報提供装置10aは、図1に示す情報提供装置10における提供情報生成部15に代えて未アクセスコンテンツ情報生成部17を備えている。情報提供装置10aの他の構成は、情報提供装置10と同一である。
FIG. 14 is a block diagram showing functional configurations of the
未アクセスコンテンツ情報生成部17は、インデックス格納部13及びアクセス履歴格納部22を参照して、クエリに含まれるユーザ識別情報により特定されるユーザがアクセスしたことがないコンテンツのコンテンツ識別情報のみから提供情報を生成する手段である。
The unaccessed content
図15を用いて、第2の実施形態に係る情報提供装置10aが、送信されたクエリに基づいて、提供情報を通信端末装置に送信する処理手順を説明する。
A processing procedure in which the
まず、通信端末装置30の指示受付部31は、ユーザによって入力される情報提供指示を受け付ける(S301)。この情報提供指示は、例えば、図16に示す通信端末装置30の検索指示ボタン308をユーザが操作することにより行われる。この操作以外には、ユーザは、検索キーワードの入力等の特段の操作を行う必要はない。
First, the
情報提供指示を受け付けた指示受付部31は、送受信部33を介してユーザ識別情報のみを含むクエリを情報提供装置10に送信する(S302)。このユーザ識別情報は、ユーザ識別情報記憶部32に記憶されており、例えば、通信端末装置が備えるSIMやUIMが記憶する契約者識別情報でも良いし、ウエブブラウザが記憶するクッキーでも良い。
The
情報提供装置10aのクエリ入力部14は、通信端末装置30から送信されたクエリを受信する(S311,クエリ入力ステップ)。クエリ入力部14は、受信したクエリを未アクセスコンテンツ情報生成部17に送出する。
The
次に、未アクセスコンテンツ情報生成部17は、インデックス格納部13を参照して、受信したクエリに含まれるユーザ識別情報に基づいて、インデックスを抽出する(S312,提供情報生成ステップ)。例えば、受信したクエリに含まれるユーザ識別情報が、ユーザU02である場合には、インデックスとして、(D03,D04,D01,D02)が抽出される。
Next, the unaccessed content
続いて、未アクセスコンテンツ情報生成部17は、アクセス履歴格納部22を参照して、ステップS312において抽出したインデックスから、ユーザ識別情報が特定するユーザがアクセスしたことがないコンテンツのコンテンツIDを抽出する(S313,提供情報生成ステップ)。例えば、図6を参照するとユーザU02は、コンテンツD03,D04にはアクセスしたことがあり(アクセス頻度を示す値がゼロではない)、コンテンツD01,D02にはアクセスしたことがない(アクセス頻度を示す値がゼロである)ことが判るので、未アクセスコンテンツ情報生成部17は、コンテンツID(D01,D02)を抽出する。
Subsequently, the unaccessed content
未アクセスコンテンツ情報生成部17は、抽出したコンテンツIDをコンテンツスコア順に並べたものを提供情報として生成する(S314,提供情報生成ステップ)。また、抽出されたコンテンツの中で最もコンテンツスコアが大きいコンテンツのコンテンツIDのみを提供情報とすることもできる。未アクセスコンテンツ情報生成部17は、生成した提供情報を提供情報出力部16に送出する。
The unaccessed content
提供情報出力部16は、取得した提供情報を通信端末装置30に送信する(S315,提供情報出力ステップ)。通信端末装置30の送受信部33は、提供情報を受信し、受信した提供情報を表示部34に送出する(S203)。表示部34は、取得した提供情報を表示し、ユーザに提示する(S204)。例えば、図16に示す通信端末装置30においては、提供情報がディスプレイ307に表示される。
The provided
第2の実施形態によれば、未アクセスコンテンツ情報生成部17は、ユーザ識別情報のみに基づいて、当該ユーザがアクセスしたことがないコンテンツを抽出し、さらに、抽出したコンテンツのコンテンツ識別情報及びコンテンツスコアに基づいて、提供情報を生成する。従って、情報提供装置10は、ユーザ識別情報以外の情報をクエリとして要求することなく、提供情報を生成し、提供することが可能となる。当該ユーザは、有用であり、且つ未知のコンテンツに関する情報を得ることが可能となる。ユーザは、時に特段の目的を持たずにいわゆるウエブブラウジングをし、コンテンツに対するアクセスを試みる。このような場合には、クエリとしての検索キーワードに想到することが困難であるので、第2に実施形態に示される態様は有用である。また、ユーザは、通信端末装置30の検索指示ボタン308を押すだけの簡単な操作により、当該ユーザがアクセスしたことがなく、且つ当該ユーザの興味や嗜好に適合するコンテンツを適合度合いの強い順に並べた情報を得ることができる。
[第3の実施形態]
According to the second embodiment, the unaccessed content
[Third Embodiment]
図17は、本発明の第3の実施形態に係る情報提供装置10、ネットワークアクセスサーバ20a及び通信端末装置30の機能的構成を示すブロック図である。図17に示すネットワークアクセスサーバ20aは、図1に示すネットワークアクセスサーバ20における構成に加えて提供情報保持部23を備えている。ネットワークアクセスサーバ20aの他の構成は、ネットワークアクセスサーバ20と同一である。
FIG. 17 is a block diagram showing functional configurations of the
提供情報保持部23は、提供情報出力部16が通信端末装置30に出力する提供情報を取得し、保持する手段である。アクセス履歴収集部21は、提供情報に応答して通信端末装置30から出力された、コンテンツに対するアクセスのアクセス履歴を収集し、提供情報に含まれ、且つアクセス履歴を収集しなかったコンテンツのアクセス頻度情報を減ずる機能を備える。このアクセス頻度情報は、アクセス履歴格納部22に格納されていたものである。
The provision
通信端末装置30は、受信した提供情報を表示部34に表示し、ユーザは、表示部34に表示された提供情報から、所望のコンテンツ識別情報を選択し、コンテンツに対するアクセスを行う。このアクセスの履歴は、ネットワークアクセスサーバ20aのアクセス履歴収集部21により収集される。アクセス履歴収集部21は、提供情報保持部23を参照して、通信端末装置30に提供された提供情報に含まれており、且つアクセス履歴として収集されなかったコンテンツのコンテンツ識別情報を抽出する。さらに、アクセス履歴収集部21は、アクセス履歴格納部22において、ここで抽出したコンテンツ識別情報に対応付けられているアクセス頻度情報の数を任意の数だけ減ずる。この任意の数は、例えば「1」とするとすることができ、また、小数とすることもできる。例えば、アクセス履歴格納部22には図6に示すようなアクセス履歴が格納されており、ユーザU02に提供情報として(D03,D04)が提示され、当該ユーザが通信端末装置30からコンテンツD04にアクセスした場合には、ユーザU02のD03に対するアクセス頻度が、例えば「4」から「3」に減ぜられる。
The
第3の実施形態によれば、提供情報保持部23が通信端末装置30に送信された提供情報を保持し、アクセス履歴収集部21が、ユーザに提示した提供情報に応じて行われたアクセス履歴を収集することができるので、提供情報としてユーザに提示されたにも関わらず、ユーザがアクセスしなかったコンテンツを特定することができる。このようにアクセスされなかったコンテンツの、アクセス履歴格納部に格納されているアクセス頻度情報を減ずることにより、アクセス頻度情報にはユーザにとっての当該コンテンツの有用性がより強く反映される。このようなアクセス頻度情報を用いてコンテンツスコア計算部12がコンテンツスコアを算出することにより、提供される提供情報の、ユーザにとっての有用性の精度を一層向上させることが可能となる。
According to the third embodiment, the provided
続いて、第1〜第3の実施形態におけるインデックスの生成及び提供情報の送信を行う一連の処理をコンピュータに実行させるための情報提供プログラムを説明する。図18に示すように、情報提供プログラム81,82は、コンピュータが備える記録媒体80に形成されたプログラム格納領域80a内に格納されている。
Subsequently, an information providing program for causing a computer to execute a series of processes for generating an index and transmitting provided information in the first to third embodiments will be described. As shown in FIG. 18, the
情報提供プログラム(ネットワークアクセスサーバ用)81は、情報提供処理を統括的に制御するメインモジュール81a、アクセス履歴収集モジュール81b及び提供情報保持モジュール81cを備えて構成される。
情報提供プログラム(情報提供装置用)82は、情報提供処理を統括的に制御するメインモジュール82a、ユーザ間類似度計算モジュール82b、コンテンツスコア計算モジュール82c、クエリ入力モジュール82d、提供情報生成モジュール(未アクセスコンテンツ情報生成モジュール)82e及び提供情報出力モジュール82fを備えて構成される。アクセス履歴収集モジュール81b及び提供情報保持モジュール81cを実行させることにより実現される機能は、アクセス履歴収集部21及び提供情報保持部23の機能とそれぞれ同様である。ユーザ間類似度計算モジュール82b、コンテンツスコア計算モジュール82c、クエリ入力モジュール82d、提供情報生成モジュール(未アクセスコンテンツ情報生成モジュール)82e及び提供情報出力モジュール82fを実行させることにより実現される機能は、ユーザ間類似度計算部11、コンテンツスコア計算部12、クエリ入力部14、提供情報生成部15(又は未アクセスコンテンツ情報生成部17)及び提供情報出力部16の機能とそれぞれ同様である。なお、情報提供プログラム81,82は、その一部又は全部が、通信回線等の伝送媒体を介して伝送され、他の機器により受信されて記録(インストールを含む)される構成としてもよい。
The information providing program (for network access server) 81 includes a
The information providing program (for information providing apparatus) 82 includes a
10,10a…情報提供装置、11…ユーザ間類似度計算部、12…コンテンツスコア計算部、13…インデックス格納部、14…クエリ入力部、15…提供情報生成部、16…提供情報出力部、17…未アクセスコンテンツ情報生成部、20,20a…ネットワークアクセスサーバ、21…アクセス履歴収集部、22…アクセス履歴格納部、23…提供情報保持部、30…通信端末装置、31…指示受付部、32…ユーザ識別情報記憶部、33…送受信部、34…表示部、40…ネットワーク、81,82…情報提供プログラム、81b…アクセス履歴収集モジュール、81c…提供情報保持モジュール、82a…メインモジュール、82b…ユーザ間類似度計算モジュール、82c…コンテンツスコア計算モジュール、82d…クエリ入力モジュール、82e…提供情報生成モジュール(未アクセスコンテンツ情報生成モジュール)、82f…提供情報出力モジュール。
DESCRIPTION OF
Claims (10)
各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、前記アクセス履歴格納手段に格納された前記アクセス頻度情報に基づいて算出するユーザ間類似度計算手段と、
ユーザと各ユーザとの間の前記ユーザ間類似度により重み付けした当該各ユーザの前記アクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段と、
前記コンテンツスコア計算手段によって算出された各コンテンツの前記コンテンツスコアを前記ユーザ識別情報に対応付けて記憶するインデックス格納手段と、
通信端末装置から送信された、ユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段と、
前記クエリ入力手段により受け付けられた前記クエリに適合するコンテンツのコンテンツ識別情報を取得し、当該クエリに含まれるユーザ識別情報に対応付けられて前記インデックス格納手段に記憶された前記コンテンツスコアを参照して、取得した前記コンテンツ識別情報から提供情報を生成する提供情報生成手段と、
前記提供情報生成手段により生成された前記提供情報を前記通信端末装置に出力する提供情報出力手段と
を備えることを特徴とする情報提供装置。 Access history storage means for storing access frequency information representing the frequency of access to each content by a user in association with user identification information for identifying the user;
An inter-user similarity calculating unit that calculates an inter-user similarity representing the similarity of the access tendency to the content between the users based on the access frequency information stored in the access history storage unit;
Content score calculation means for calculating a content score, which is information representing the usefulness of content for the user, from the access frequency information of each user weighted by the similarity between users between the user and each user;
Index storage means for storing the content score of each content calculated by the content score calculation means in association with the user identification information;
Query input means for receiving an input of a query including user identification information transmitted from a communication terminal device;
The content identification information of the content that matches the query accepted by the query input means is acquired, and the content score stored in the index storage means in association with the user identification information included in the query is referred to Providing information generating means for generating providing information from the acquired content identification information;
An information provision apparatus comprising: provision information output means for outputting the provision information generated by the provision information generation means to the communication terminal apparatus.
前記提供情報生成手段は、前記検索キーワードを含むコンテンツのコンテンツ識別情報を取得することを特徴とする請求項1〜5のいずれか1項に記載の情報提供装置。 The query transmitted from the communication terminal device includes a search keyword,
The information providing apparatus according to claim 1, wherein the provided information generating unit acquires content identification information of content including the search keyword.
前記情報提供装置が、
ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段に格納された前記アクセス頻度情報に基づいて、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を算出するユーザ間類似度計算ステップと、
ユーザと各ユーザとの間の前記ユーザ間類似度により重み付けした当該各ユーザの前記アクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出し、算出した各コンテンツの前記コンテンツスコアを前記ユーザ識別情報に対応付けてインデックス格納手段に記憶させるコンテンツスコア計算ステップと、
通信端末装置から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力ステップと、
前記クエリ入力ステップにより受け付けた前記クエリに適合するコンテンツのコンテンツ識別情報を取得し、前記インデックス格納手段を参照して、取得した前記コンテンツ識別情報から提供情報を生成する提供情報生成ステップと、
前記提供情報生成ステップにおいて生成した前記提供情報を前記通信端末装置に出力する提供情報出力ステップと
を実行することを特徴とする情報提供方法。 In the information providing method in the information providing apparatus,
The information providing device is
Content between users based on the access frequency information stored in the access history storage means for storing access frequency information indicating the frequency of access to each content by the user in association with user identification information for identifying the user An inter-user similarity calculating step for calculating an inter-user similarity indicating the similarity of access tendencies to
A content score, which is information representing the usefulness of content for the user, is calculated from the access frequency information of each user weighted by the similarity between the users between the user and each user. A content score calculation step of storing the content score in the index storage means in association with the user identification information;
A query input step for receiving an input of a query including at least user identification information transmitted from the communication terminal device;
A provision information generation step of acquiring content identification information of the content conforming to the query received by the query input step, and generating provision information from the acquired content identification information with reference to the index storage means;
A provision information output step of outputting the provision information generated in the provision information generation step to the communication terminal device;
ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段と、
各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、前記アクセス履歴格納手段に格納された前記アクセス頻度情報に基づいて算出するユーザ間類似度計算手段と、
ユーザと各ユーザとの間の前記ユーザ間類似度により重み付けした当該各ユーザの前記アクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段と、
前記コンテンツスコア計算手段によって算出された各コンテンツの前記コンテンツスコアを前記ユーザ識別情報に対応付けて記憶するインデックス格納手段と、
通信端末装置から送信された、少なくともユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段と、
前記クエリ入力手段により受け付けられた前記クエリに適合するコンテンツのコンテンツ識別情報を取得し、前記インデックス格納手段を参照して、取得した前記コンテンツ識別情報から提供情報を生成する提供情報生成手段と、
前記提供情報生成手段により生成された前記提供情報を前記通信端末装置に出力する提供情報出力手段と
して機能させることを特徴とする情報提供プログラム。 Computer
Access history storage means for storing access frequency information representing the frequency of access to each content by a user in association with user identification information for identifying the user;
An inter-user similarity calculating unit that calculates an inter-user similarity representing the similarity of the access tendency to the content between the users based on the access frequency information stored in the access history storage unit;
Content score calculation means for calculating a content score, which is information representing the usefulness of content for the user, from the access frequency information of each user weighted by the similarity between users between the user and each user;
Index storage means for storing the content score of each content calculated by the content score calculation means in association with the user identification information;
Query input means for receiving an input of a query including at least user identification information transmitted from the communication terminal device;
Providing information generating means for acquiring content identification information of the content conforming to the query received by the query input means, referring to the index storage means, and generating providing information from the acquired content identification information;
An information provision program for causing the provision information generated by the provision information generation means to function as provision information output means for outputting to the communication terminal device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008111555A JP2009265754A (en) | 2008-04-22 | 2008-04-22 | Information providing system, information providing method, and information providing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008111555A JP2009265754A (en) | 2008-04-22 | 2008-04-22 | Information providing system, information providing method, and information providing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009265754A true JP2009265754A (en) | 2009-11-12 |
Family
ID=41391565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008111555A Pending JP2009265754A (en) | 2008-04-22 | 2008-04-22 | Information providing system, information providing method, and information providing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009265754A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009277124A (en) * | 2008-05-16 | 2009-11-26 | Canon Inc | Information processor, control method thereof, and control program |
WO2011126134A1 (en) | 2010-04-09 | 2011-10-13 | サイバーアイ・エンタテインメント株式会社 | Server system for real-time moving image collection, recognition, classification, processing, and delivery |
JP2012058893A (en) * | 2010-09-07 | 2012-03-22 | Jvc Kenwood Corp | Device, method and program for processing user information |
JP2012058894A (en) * | 2010-09-07 | 2012-03-22 | Jvc Kenwood Corp | Device, method and program for processing user information |
JP2012242844A (en) * | 2011-05-13 | 2012-12-10 | Ntt Docomo Inc | Recommendation information generation device and recommendation information generation method |
WO2013054839A1 (en) | 2011-10-14 | 2013-04-18 | サイバーアイ・エンタテインメント株式会社 | Knowledge information processing server system provided with image recognition system |
CN111290713A (en) * | 2020-01-22 | 2020-06-16 | 恩亿科(北京)数据科技有限公司 | Data storage method and device, electronic equipment and storage medium |
JP2022081889A (en) * | 2020-11-20 | 2022-06-01 | 株式会社センターモバイル | Advertisement method of smart phone, tablet or the like |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228487A (en) * | 1997-02-17 | 1998-08-25 | Nec Corp | Automatic learning system for user taste |
JP2002251410A (en) * | 2001-02-26 | 2002-09-06 | Sharp Corp | Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program |
JP2004259083A (en) * | 2003-02-27 | 2004-09-16 | Shigeru Koyanagi | Method, server and program for retrieving information |
WO2007019311A2 (en) * | 2005-08-03 | 2007-02-15 | Wink Technologies, Inc. | Systems for and methods of finding relevant documents by analyzing tags |
JP2007286832A (en) * | 2006-04-14 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | System, method, and program for advertisement distribution |
-
2008
- 2008-04-22 JP JP2008111555A patent/JP2009265754A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228487A (en) * | 1997-02-17 | 1998-08-25 | Nec Corp | Automatic learning system for user taste |
JP2002251410A (en) * | 2001-02-26 | 2002-09-06 | Sharp Corp | Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program |
JP2004259083A (en) * | 2003-02-27 | 2004-09-16 | Shigeru Koyanagi | Method, server and program for retrieving information |
WO2007019311A2 (en) * | 2005-08-03 | 2007-02-15 | Wink Technologies, Inc. | Systems for and methods of finding relevant documents by analyzing tags |
JP2007286832A (en) * | 2006-04-14 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | System, method, and program for advertisement distribution |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009277124A (en) * | 2008-05-16 | 2009-11-26 | Canon Inc | Information processor, control method thereof, and control program |
WO2011126134A1 (en) | 2010-04-09 | 2011-10-13 | サイバーアイ・エンタテインメント株式会社 | Server system for real-time moving image collection, recognition, classification, processing, and delivery |
US8863183B2 (en) | 2010-04-09 | 2014-10-14 | Cyber Ai Entertainment Inc. | Server system for real-time moving image collection, recognition, classification, processing, and delivery |
US9204198B2 (en) | 2010-04-09 | 2015-12-01 | Cyber Ai Entertainment Inc. | Server system for real-time moving image collection, recognition, classification, processing, and delivery |
JP2012058893A (en) * | 2010-09-07 | 2012-03-22 | Jvc Kenwood Corp | Device, method and program for processing user information |
JP2012058894A (en) * | 2010-09-07 | 2012-03-22 | Jvc Kenwood Corp | Device, method and program for processing user information |
JP2012242844A (en) * | 2011-05-13 | 2012-12-10 | Ntt Docomo Inc | Recommendation information generation device and recommendation information generation method |
WO2013054839A1 (en) | 2011-10-14 | 2013-04-18 | サイバーアイ・エンタテインメント株式会社 | Knowledge information processing server system provided with image recognition system |
CN111290713A (en) * | 2020-01-22 | 2020-06-16 | 恩亿科(北京)数据科技有限公司 | Data storage method and device, electronic equipment and storage medium |
CN111290713B (en) * | 2020-01-22 | 2023-11-03 | 恩亿科(北京)数据科技有限公司 | Data storage method and device, electronic equipment and storage medium |
JP2022081889A (en) * | 2020-11-20 | 2022-06-01 | 株式会社センターモバイル | Advertisement method of smart phone, tablet or the like |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100692209B1 (en) | Method and system for providing information of commodity customized to each user | |
JP4909334B2 (en) | Service proposal apparatus and method, service proposal system, service proposal apparatus and method based on user's favorite base | |
JP2009265754A (en) | Information providing system, information providing method, and information providing program | |
KR100923505B1 (en) | Ranking system based on user's attention and the method thereof | |
JP2010129061A (en) | Index creating system, information retrieval system, and index creating method | |
US20190018884A1 (en) | Multiple entity aware typeahead in searches | |
US20210109989A1 (en) | Systems and methods for automatically generating and optimizing web pages | |
US20150199774A1 (en) | One click on-boarding crowdsourcing information incentivized by a leaderboard | |
KR100856916B1 (en) | Information providing method and system of extracting a personalized issue | |
JP2010079683A (en) | Program and advertisement distribution system | |
US8856110B2 (en) | Method and apparatus for providing a response to a query | |
KR20070099709A (en) | Method and system for matching users based on the user preference index | |
JP5296745B2 (en) | Query suggestion providing apparatus and method | |
JP4527770B2 (en) | Information retrieval apparatus, computer program, and storage medium | |
JP5141144B2 (en) | Information retrieval system and information retrieval program | |
JP4834118B2 (en) | Service guided bidding apparatus and method using faceted query | |
KR100469825B1 (en) | Method and system for providing the popular information on an area | |
US20150156169A1 (en) | Method for determining validity of command and system thereof | |
JP5063728B2 (en) | Multiple server search apparatus and method | |
JP5777663B2 (en) | Search support device and search support program | |
US9177255B1 (en) | Cloud systems and methods for determining the probability that a second application is installed based on installation characteristics | |
JP2009140173A (en) | Server device recommending web site, recommendation method for web site and web site recommendation program | |
JP2007188403A (en) | Display information individual control system and display information individual control method | |
JP6168963B2 (en) | Information search apparatus, information search method, and program | |
KR100371805B1 (en) | Method and system for providing related web sites for the current visitting of client |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130129 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130730 |