JP7166116B2 - Information processing device, information processing method, and program - Google Patents

Information processing device, information processing method, and program Download PDF

Info

Publication number
JP7166116B2
JP7166116B2 JP2018174397A JP2018174397A JP7166116B2 JP 7166116 B2 JP7166116 B2 JP 7166116B2 JP 2018174397 A JP2018174397 A JP 2018174397A JP 2018174397 A JP2018174397 A JP 2018174397A JP 7166116 B2 JP7166116 B2 JP 7166116B2
Authority
JP
Japan
Prior art keywords
user
information
entity
category
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018174397A
Other languages
Japanese (ja)
Other versions
JP2020046895A (en
Inventor
正樹 野口
美樹 小川
尚方 四熊
秀平 宇野
真吾 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018174397A priority Critical patent/JP7166116B2/en
Publication of JP2020046895A publication Critical patent/JP2020046895A/en
Application granted granted Critical
Publication of JP7166116B2 publication Critical patent/JP7166116B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。 The present invention relates to an information processing device, an information processing method, and a program.

従来、クエリに関連する電子リソースを識別し、エンティティに関連する電子リソースから、エンティティに対する知識パネル中に表示するためのコンテンツを選択し、選択されるコンテンツの各コンテンツアイテムは、受信した複数のクエリのうち、エンティティとコンテンツアイテムによって表されるコンテンツとの両方を照会したクエリの数に基づいて選択される技術が開示されている。(例えば、特許文献1)。 Traditionally, an electronic resource associated with a query is identified, content is selected from the electronic resource associated with the entity for display in a knowledge panel for the entity, and each content item of selected content is associated with multiple queries received. of which are selected based on the number of queries that have queried both the entity and the content represented by the content item. (For example, Patent Document 1).

特開2016-139438号公報JP 2016-139438 A

しかしながら、従来の技術では、興味関心の定義が異なる複数のサービス間でユーザの興味関心を横断的に推定することについては考慮されていなかった。このため、推定される情報が限定的になる場合があった。 However, in the conventional technology, no consideration has been given to estimating a user's interests cross-sectionally among a plurality of services with different definitions of interests. Therefore, the estimated information may be limited.

本発明は、このような事情を考慮してなされたものであり、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides an information processing apparatus, an information processing method, and a program that can expand the estimated range of user's interests using more information. One of the purposes is to

本発明の一態様は、複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得する取得部と、前記取得部により取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択するエンティティ選択部と、前記エンティティ選択部により選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定する推定部と、を備え、前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、情報処理装置である。 According to one aspect of the present invention, an acquisition unit acquires a user's usage history and a user's search history regarding content information provided by a plurality of services via a network, and the content information acquired by the acquisition unit. an entity selection unit that selects entities highly related to one or more keywords included in the text data or search query of the user; an estimating unit for estimating a certain category, wherein the entity is obtained by referring to an entity representing a thing of things and a database describing relationships between the entities. .

本発明の一態様によれば、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる。 According to one aspect of the present invention, more information can be used to expand the estimated range of user interests.

情報処理装置100の利用環境を示す図である。2 is a diagram showing a usage environment of the information processing apparatus 100; FIG. 情報処理装置100の処理を模式的に示す図である。4 is a diagram schematically showing processing of the information processing apparatus 100; FIG. 情報処理装置100のブロック図である。2 is a block diagram of the information processing apparatus 100; FIG. ナレッジベースを説明するための図である。FIG. 4 is a diagram for explaining a knowledge base; FIG. カテゴリを説明するための図である。FIG. 4 is a diagram for explaining categories; FIG. 情報処理装置100がユーザの情報を収集する処理を説明するための図である。FIG. 4 is a diagram for explaining a process in which the information processing apparatus 100 collects user information; 情報処理装置100の入稿時処理の流れの一例を示すフローチャートである。4 is a flowchart showing an example of the flow of processing at the time of manuscript submission of the information processing apparatus 100. FIG. レコメンド情報を生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。4 is a flowchart showing an example of the flow of processing by the information processing device 100, the terminal device 10, and the service server 20 when recommendation information is generated and output. 統計レポートを生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。10 is a flowchart showing an example of the flow of processing by the information processing device 100, the terminal device 10, and the service server 20 when generating and outputting a statistical report;

以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。 Hereinafter, embodiments of an information processing apparatus, an information processing method, and a program according to the present invention will be described with reference to the drawings.

[概要]
情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、複数のサービスサーバの利用履歴を収集し、それぞれのサービスを横断して展開することを支援する装置である。
[Overview]
An information processing device is realized by one or more processors. An information processing device is a device that collects usage histories of a plurality of service servers and assists development across respective services.

複数のサービスサーバのそれぞれは、例えば、ユーザにより操作される端末装置からのリクエストに対応するウェブページを提供するウェブサーバ、アプリケーションが起動された端末装置と通信を行って各種情報の受け渡しを行ってコンテンツ情報を提供するアプリケーションサーバなどである。サービスサーバは、例えば、ニュースを提供するサービスやショッピングサービス、オークションサービス、マッチングサービス、金融決済サービス、ナビゲーションサービスなどを、ネットワークを介して提供する。 Each of the plurality of service servers communicates with, for example, a web server that provides a web page corresponding to a request from a terminal device operated by a user, and a terminal device on which an application is started, and exchanges various information. Examples include an application server that provides content information. The service server provides, for example, news services, shopping services, auction services, matching services, financial settlement services, navigation services, etc. via the network.

情報処理装置は、サービスサーバが提供するコンテンツ情報を構成する非構造化テキストから、1以上の固有名詞を抽出し、キーワードとして設定する。キーワードとは、例えば、ユーザによって入力される検索クエリに含まれる可能性がある、人、場所、物事などの固有名詞である。キーワードには、正式名称以外に、該キーワードのあだ名(ニックネーム)、略称、通称、自称などの別名を含む場合がある。非構造化テキストは、例えば、キーワードを含む(または、キーワードに関する)ニュース記事や、百科事典のウェブページ、ショッピングサイトにおける商品タイトルや詳細説明、企業公式情報(ニュースリリースやミニブログ)といったコンテンツに含まれるテキストデータである。 The information processing device extracts one or more proper nouns from the unstructured text forming the content information provided by the service server, and sets them as keywords. Keywords are, for example, proper nouns for people, places, things, etc. that may be included in a search query entered by a user. Keywords may include aliases such as nicknames, abbreviations, common names, and self-names of the keywords in addition to the official names. Unstructured text is included in content such as news articles that include (or are related to) keywords, web pages in encyclopedias, product titles and descriptions on shopping sites, and official company information (news releases and microblogs). It is text data that can be

情報処理装置は、ユーザ毎のキーワードに対応付いたエンティティを蓄積することで、ユーザの興味関心を推定する。また、情報処理装置は、エンティティの属するカテゴリを参照することでサービスサーバが提供するサービスのユーザ利用履歴を、他のサービスで自サービスのユーザ利用履歴と同様に利用させることを実現したり、統計データ収集などの別の用途に流用したりすることを可能にする。カテゴリは、他のカテゴリとの類似度や関連度合いを示すことができるように階層構造で示されてもよいし、クラスタ構造で示されてもよい。なお、カテゴリは、サービスサーバ20の提供する複数のサービスにおいて横断的に利用可能であるように設定されることが望ましい。 The information processing device estimates user's interests by accumulating entities associated with keywords for each user. In addition, the information processing device can refer to the category to which the entity belongs to enable the user's usage history of the service provided by the service server to be used in other services in the same way as the user's usage history of its own service. It makes it possible to divert it to other uses such as data collection. The categories may be shown in a hierarchical structure or a cluster structure so as to indicate the degree of similarity or association with other categories. It should be noted that the category is preferably set so that it can be used across multiple services provided by the service server 20 .

[全体構成]
図1は、情報処理装置100の利用環境を示す図である。情報処理装置100は、例えば、サービスサーバ20-1~20-N(Nは自然数)および端末装置10とネットワークNWを介して通信する。ネットワークNWは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、プロバイダ装置、無線基地局、専用回線などのうちの一部または全部を含む。
[overall structure]
FIG. 1 is a diagram showing a usage environment of an information processing apparatus 100. As shown in FIG. The information processing device 100 communicates with, for example, the service servers 20-1 to 20-N (N is a natural number) and the terminal device 10 via the network NW. The network NW includes, for example, a part or all of a WAN (Wide Area Network), a LAN (Local Area Network), the Internet, a provider device, a wireless base station, a dedicated line, and the like.

情報処理装置100は、端末装置10からサービスサーバ20に対するリクエスト(例えば、検索リクエストや、閲覧リクエスト)の履歴や、そのリクエストを受信した結果ユーザが行った何らかの反応(以下、後続操作)の履歴を、ユーザ利用履歴として蓄積する。なお、本明細書では、サービスサーバ20-1~20-Nに関する共通の事項を説明する場合など、個々のサービスサーバ20-1~20-Nを区別しない場合には、単にサービスサーバ20と呼ぶ。 The information processing apparatus 100 stores a history of requests (for example, search requests and browsing requests) from the terminal device 10 to the service server 20 and a history of some reaction (hereinafter referred to as subsequent operation) performed by the user as a result of receiving the request. , is stored as a user usage history. In this specification, when the individual service servers 20-1 to 20-N are not distinguished, such as when explaining common matters related to the service servers 20-1 to 20-N, they are simply referred to as service servers 20. .

端末装置10は、ユーザの入力操作を受け付ける装置である。端末装置10は、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータ、スマートスピーカ(AIスピーカ)などである。入力操作は、タッチ操作、マウス操作、キーボード操作、音声入力などにより実行される。 The terminal device 10 is a device that receives a user's input operation. The terminal device 10 is a mobile phone such as a smart phone, a tablet terminal, a personal computer, a smart speaker (AI speaker), or the like. The input operation is performed by touch operation, mouse operation, keyboard operation, voice input, or the like.

サービスサーバ20は、端末装置10からのリクエストに対応するウェブページを提供するウェブサーバ装置、アプリケーションが起動された端末装置10と通信を行って各種情報の受け渡しを行ってコンテンツ情報を提供するアプリケーションサーバ装置などである。 The service server 20 is a web server device that provides a web page corresponding to a request from the terminal device 10, and an application server that communicates with the terminal device 10 on which an application is started, exchanges various information, and provides content information. equipment and so on.

図2は、情報処理装置100が収集するユーザ利用履歴について説明するための図である。情報処理装置100は、例えば、ユーザが端末装置10を介してサービスサーバ20に送信した、検索リクエストや閲覧リクエストなどのリクエストや、ユーザの登録情報、サービスサーバ20の提供するサービス特有の設定内容をユーザ利用履歴として収集する。情報処理装置100は、収集したユーザ利用履歴から、複数観点のユーザ属性情報を抽出する。 FIG. 2 is a diagram for explaining user usage histories collected by the information processing apparatus 100 . The information processing apparatus 100 receives, for example, requests such as search requests and browsing requests sent by the user to the service server 20 via the terminal apparatus 10, user registration information, and settings unique to services provided by the service server 20. Collect as user usage history. The information processing apparatus 100 extracts user attribute information from multiple viewpoints from the collected user usage history.

ユーザ属性情報は、例えば、デモグラフィック属性、ジオグラフィック属性、サイコグラフィック属性を含む。デモグラフィック属性とは、例えば、年齢、性別、職業、年収、家族構成などを含むユーザ個人の社会的な立場をラベリングする際に用いることのできる属性情報である。ジオグラフィック属性とは、例えば、自宅住所、勤務地住所、頻繁に訪れる場所などを含むユーザ個人を地理的条件でラベリングする際に用いることのできる属性情報である。サイコグラフィック属性とは、興味関心、趣味、週間、嗜好、価値観を含む属性情報である。これらのユーザ属性情報は、ユーザによってあらかじめ設定されたアカウント登録情報から取得してもよいし、端末装置10から送信されるリクエスト情報に付随する位置情報を取得してもよいし、情報処理装置100によってユーザ利用履歴を解析することで推定されてもよい。情報処理装置100は、抽出したユーザ属性情報を、ユーザへのレコメンド情報生成に用いたり、ユーザに提供するコンテンツ情報22の選定などにおける統計分析に活用したりすることで各サービスサーバ20が提供するサービスの向上に活用することができる。 User attribute information includes, for example, demographic attributes, geographic attributes, and psychographic attributes. Demographic attributes are attribute information that can be used for labeling the social status of individual users, including, for example, age, gender, occupation, annual income, and family composition. A geographic attribute is attribute information that can be used to label an individual user according to geographical conditions, including, for example, home address, work address, and frequently visited places. Psychographic attributes are attribute information including interests, hobbies, weeks, tastes, and values. These pieces of user attribute information may be obtained from account registration information preset by the user, may be obtained from location information attached to request information transmitted from the terminal device 10, or may be obtained from the information processing device 100. may be estimated by analyzing the user usage history. The information processing apparatus 100 uses the extracted user attribute information to generate recommendation information for the user, or utilizes it for statistical analysis in selecting the content information 22 to be provided to the user, etc., so that each service server 20 provides the information. It can be used to improve services.

[構成]
図3は、情報処理装置100のブロック図である。情報処理装置100は、例えば、入稿データ取得部110と、解析部120と、エンティティ選択部130と、タグ設定部140と、履歴取得部150と、推定部160と、情報提供部170と、端末装置通信部180と、記憶部190とを備える。情報処理装置100の記憶部190を除くこれらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め情報処理装置100のHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで情報処理装置100のHDDやフラッシュメモリにインストールされてもよい。
[Constitution]
FIG. 3 is a block diagram of the information processing device 100. As shown in FIG. The information processing apparatus 100 includes, for example, a submitted data acquisition unit 110, an analysis unit 120, an entity selection unit 130, a tag setting unit 140, a history acquisition unit 150, an estimation unit 160, an information provision unit 170, A terminal device communication unit 180 and a storage unit 190 are provided. These components of the information processing apparatus 100 except for the storage unit 190 are realized by executing a program (software) by a hardware processor such as a CPU (Central Processing Unit). Some or all of these components are hardware (circuits) such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), and GPU (Graphics Processing Unit). (including circuitry), or by cooperation of software and hardware. The program may be stored in advance in a storage device (a storage device having a non-transitory storage medium) such as the HDD or flash memory of the information processing device 100, or may be stored in a removable storage such as a DVD or CD-ROM. It is stored in a medium (non-transitory storage medium), and may be installed in the HDD or flash memory of the information processing apparatus 100 by loading the storage medium into a drive device.

記憶部190は、例えば、RAM(Random Access Memory)、レジスタ、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)などにより実現される。記憶部190は、例えば、ナレッジベース192、タグ情報194、利用履歴196、ユーザ属性198などの情報を記憶する。 The storage unit 190 is implemented by, for example, a RAM (Random Access Memory), a register, a flash memory, an EEPROM (Electrically Erasable Programmable Read Only Memory), or the like. The storage unit 190 stores information such as a knowledge base 192, tag information 194, usage history 196, and user attributes 198, for example.

ナレッジベース192は、事物に関する情報および事物間の意味的関係に関する情報をグラフとして記述したデータベースである。ナレッジベース192は、例えば、「建物」、「美術」、「旅行」といった抽象的な概念と、それらの概念に属するまたは関連する特定の個体(「東京タワー」、「アール・ヌーヴォー」、「日帰りバスツアー」など)を指すエンティティを含む。さらにナレッジベース192には、特定のエンティティとの関連性が高いテキストデータが設定されてもよく、例えば、エンティティ「東京タワー」にはテキストデータ「日本電波塔」が設定され、エンティティ「アール・ヌーヴォー」にはテキストデータ「19世紀」が設定される。 The knowledge base 192 is a database in which information about things and information about semantic relationships between things are described as graphs. The knowledge base 192 includes, for example, abstract concepts such as “building”, “art”, and “travel”, and specific individuals belonging to or related to these concepts (“Tokyo Tower”, “Art Nouveau”, “day trip”, etc.). Includes entities that refer to "bus tours", etc.). Furthermore, the knowledge base 192 may be set with text data highly related to a specific entity. ” is set with the text data “19th century”.

タグ情報194は、コンテンツ情報22をナレッジベース192の記憶する語句でタグ設定した情報である。例えば、プロ野球選手Aの2000本安打に関するニュースには、タグ情報として「スポーツ」、「プロ野球」、「A選手」、「2000本安打」の語句がタグとして設定される。 The tag information 194 is information obtained by tagging the content information 22 with phrases stored in the knowledge base 192 . For example, in the news about professional baseball player A's 2000 hits, the words "sports", "professional baseball", "A player", and "2000 hits" are set as tag information.

利用履歴196は、前述したユーザ利用履歴である。利用履歴196には、例えば、サービスサーバ20の提供するコンテンツ情報の閲覧履歴、クリック履歴、表示履歴、サービスの購入履歴、コンテンツ情報のキーワードなどが含まれる。利用履歴196は、定期的なバッチ処理などによりサービスサーバ20から取得される。 The usage history 196 is the aforementioned user usage history. The usage history 196 includes, for example, browsing history, click history, display history, service purchase history, keywords of content information provided by the service server 20, and the like. The usage history 196 is acquired from the service server 20 by periodical batch processing or the like.

ユーザ属性198は、ユーザによってあらかじめ設定されたアカウント登録情報(例えば、ユーザID、性別、住所、職業)である。ユーザ属性198には、利用履歴196を解析することで得られる、ユーザ属性情報に含まれると推定される結果(以下、推定ユーザ属性)が含まれてもよく、例えば、プロ野球に関するニュースを頻繁に閲覧するユーザの推定ユーザ属性情報には「スポーツ」が設定される。 The user attributes 198 are account registration information preset by the user (eg, user ID, gender, address, occupation). The user attribute 198 may include a result estimated to be included in the user attribute information obtained by analyzing the usage history 196 (hereinafter referred to as estimated user attribute). "Sports" is set in the estimated user attribute information of the user who browses the website.

入稿データ取得部110は、サービスサーバ20のコンテンツ情報22を取得する。このコンテンツ情報22は、サービスサーバ20でユーザに向けて公開済のものであってもよいし、ユーザ公開前のものであってもよい。入稿データ取得部110は、コンテンツ情報22の非構造化テキストを解析部120に出力する。 The submitted data acquisition unit 110 acquires the content information 22 of the service server 20 . This content information 22 may have been published to the user by the service server 20, or may have not been published to the user. The submitted data acquisition unit 110 outputs the unstructured text of the content information 22 to the analysis unit 120 .

解析部120は、入稿データ取得部110により出力された非構造化テキストを解析し、1以上のキーワードを設定する。解析部120は、例えば、非構造化テキスト内の文脈に基づいて、固有名詞と思われる語句を抽出し、さらに抽出結果から1以上のキーワードを設定する。また、解析部120は、ナレッジベース192に記録されるテキストデータが含まれるかを検索し、固有名詞と思われる語句を抽出してもよい。 The analysis unit 120 analyzes the unstructured text output by the submitted manuscript data acquisition unit 110 and sets one or more keywords. The analysis unit 120, for example, extracts words and phrases considered to be proper nouns based on the context within the unstructured text, and sets one or more keywords from the extraction results. Also, the analysis unit 120 may search for text data recorded in the knowledge base 192 to extract words that are considered to be proper nouns.

解析部120は、例えば、非構造化テキストが和文であれば形態素解析を行って、単語に分割し、W2V(Word2Vec)などの手法を用いて、固有名詞を抽出する。解析部120による固有名詞の抽出には、他のウェブクローリング(Web Crawling)技術が用いられてもよい。解析部120は、解析結果をエンティティ選択部130に出力する。 For example, if the unstructured text is a Japanese sentence, the analysis unit 120 performs morphological analysis, divides it into words, and extracts proper nouns using a technique such as W2V (Word2Vec). Other web crawling techniques may be used for the extraction of proper nouns by the analysis unit 120 . The analysis unit 120 outputs analysis results to the entity selection unit 130 .

エンティティ選択部130は、解析部120により出力された解析結果に含まれるキーワードを精査して、キーワードと関連性の高い1以上のエンティティを選択する。例えば、解析部120による解析結果に「日本電波塔」が含まれる場合、エンティティ選択部130は、ナレッジベース192のテキストデータ「日本電波塔」と対応付けられたエンティティ「東京タワー」を選択する。なお、エンティティ選択部130は、ナレッジベース192のテキストデータと同名であるエンティティが存在する場合には、そのエンティティ(例えば、上述の例ではエンティティ「日本電波塔」)を選択してもよい。エンティティ選択部130は、選択したエンティティをタグ設定部140に出力する。 The entity selection unit 130 scrutinizes the keywords included in the analysis results output by the analysis unit 120, and selects one or more entities highly related to the keywords. For example, when the analysis result of the analysis unit 120 includes “Japan Radio Tower”, the entity selection unit 130 selects the entity “Tokyo Tower” associated with the text data “Japan Radio Tower” in the knowledge base 192 . Note that if there is an entity with the same name as the text data of the knowledge base 192, the entity selection unit 130 may select that entity (for example, the entity "Japan Radio Tower" in the above example). The entity selection section 130 outputs the selected entity to the tag setting section 140 .

タグ設定部140は、エンティティ選択部130により選択されたエンティティと、コンテンツ情報22とを対応付けた情報を、タグ情報194に記憶させる。 The tag setting unit 140 causes the tag information 194 to store information that associates the entity selected by the entity selection unit 130 with the content information 22 .

履歴取得部150は、利用履歴196から着目するユーザに対応付けられたユーザ利用履歴を取得する。履歴取得部150は、サービスサーバ20からユーザ利用ログ24を取得して、ユーザ利用履歴として利用してもよい。ユーザ利用ログ24は、サービスサーバ20のそれぞれが提供する複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、ユーザの検索履歴とを含むものであり、ユーザを特定する情報(例えば、ユーザID、リクエスト種別、表示したコンテンツ情報、後続操作の有無)を含む。履歴取得部150は、取得したユーザ利用履歴を推定部160に出力する。なお、履歴取得部150は「取得部」の一例である。 The history acquisition unit 150 acquires the user usage history associated with the user of interest from the usage history 196 . The history acquisition unit 150 may acquire the user usage log 24 from the service server 20 and use it as the user usage history. The user usage log 24 includes the user's usage history and the user's search history regarding content information provided via the network by a plurality of services provided by each of the service servers 20, and is information identifying the user. (For example, user ID, request type, displayed content information, presence/absence of subsequent operation). The history acquisition unit 150 outputs the acquired user usage history to the estimation unit 160 . Note that the history acquisition unit 150 is an example of an “acquisition unit”.

推定部160は、エンティティ選択部130により選択されたエンティティと、履歴取得部150により取得されたユーザ利用履歴とに基づいて、ユーザの興味関心のあるエンティティと対応付けられているカテゴリを、ユーザの興味関心のあるカテゴリであると推定する。カテゴリの推定方法については後述する。推定部160は、推定したユーザの興味関心のあるカテゴリをユーザ属性198として記憶させる。 Based on the entity selected by the entity selection unit 130 and the user usage history acquired by the history acquisition unit 150, the estimation unit 160 determines the category associated with the entity that the user is interested in as the user's Presumed to be a category of interest. A method of estimating the category will be described later. The estimation unit 160 stores the estimated user's interest category as a user attribute 198 .

例えば、推定部160は、ユーザ利用履歴が含むユーザの後続操作がある場合に、ユーザが選択されたエンティティと対応付けられているカテゴリに興味関心がある可能性が高いと推定し、興味関心がある可能性が高いことを示すフラグやランクなどを設定してユーザ属性198として記憶させる。 For example, if the user's subsequent operation is included in the user usage history, the estimation unit 160 estimates that the user is likely to be interested in the category associated with the selected entity. A flag, rank, or the like indicating that there is a high possibility is set and stored as a user attribute 198 .

情報提供部170は、サービスサーバ20からユーザの興味関心に関する検索条件を取得し、その検索条件に基づいてユーザ属性198に蓄積されたカテゴリを検索し、得られた検索結果をサービスサーバ20に返却する。 The information providing unit 170 acquires search conditions related to the user's interests from the service server 20, searches categories accumulated in the user attributes 198 based on the search conditions, and returns the obtained search results to the service server 20. do.

例えば、情報提供部170は、端末装置10により送信されたサービスサーバ20の所定コンテンツ情報(例えば、トップページや、ユーザ毎にカスタマイズされたページ)の閲覧リクエストに含まれるユーザの興味関心に関する検索条件を受信し、蓄積されたユーザ属性198に対してその検索条件で抽出した検索結果を生成する。情報提供部170は、推定部160により推定され、ユーザ属性198に蓄積されたユーザの興味関心があると推定するカテゴリに基づいて、ユーザに対するレコメンド対象であるコンテンツ情報を抽出する。 For example, the information providing unit 170 may use search conditions related to the user's interests included in a request to view predetermined content information (for example, a top page or a page customized for each user) of the service server 20 transmitted by the terminal device 10. is received, and a search result extracted with the search condition for the accumulated user attribute 198 is generated. The information providing unit 170 extracts content information to be recommended to the user based on the categories estimated by the estimation unit 160 and accumulated in the user attribute 198 and estimated to be of interest to the user.

情報提供部170は、例えば、ユーザ属性198の記憶するカテゴリを検索キーとして、タグ情報194に対応付けられたカテゴリと関連性の高いタグ情報が設定されているコンテンツ情報を検索する。情報提供部170により生成される検索結果は、単一のユーザに対して提供されるレコメンド情報であってもよいし、同一または類似する興味関心を持つと推定されるユーザグループに対して提供されるレコメンド情報であってもよい。また、情報提供部170は、特に興味関心が推定されていないユーザに対して提供するレコメンド情報として、一部または全部のユーザを集計対象として、ランキング形式のレコメンド情報を生成してもよい。情報提供部170は、生成した検索結果を端末装置通信部180に出力する。 The information providing unit 170 searches for content information in which tag information highly relevant to the category associated with the tag information 194 is set, using, for example, the category stored in the user attribute 198 as a search key. The search results generated by the information providing unit 170 may be recommended information provided to a single user, or may be provided to a group of users presumed to have the same or similar interests. It may be recommendation information that In addition, the information providing unit 170 may generate recommendation information in a ranking format with some or all of the users as aggregation targets, as recommendation information to be provided to users whose interests are not estimated. The information providing unit 170 outputs the generated search result to the terminal device communication unit 180 .

また、情報提供部170は、後述する端末装置通信部180が、他ユーザのレコメンド情報を閲覧する権限を持つ端末装置10の利用者(例えば、サービスサーバ20のサービス提供者)からのレコメンド情報の出力リクエストを受け付けた、端末装置10の利用者により指定された条件を満たすレコメンド情報をレポート形式などで出力してもよい。以下、情報提供部170が出力するレポート形式のレコメンド情報を統計レポートと称する。 In addition, the information providing unit 170 receives recommendation information from the user of the terminal device 10 (for example, the service provider of the service server 20) who has the authority to browse the recommendation information of other users. The recommended information that satisfies the conditions specified by the user of the terminal device 10 who received the output request may be output in a report format or the like. The report-format recommendation information output by the information providing unit 170 is hereinafter referred to as a statistical report.

なお、端末装置10の利用者により指定された条件は、ユーザの興味関心があると推定されるカテゴリの記憶されたデータベースと対比可能な態様で蓄積されているユーザ属性198の記憶するデモグラフィック属性や、ジオグラフィック属性に含まれるものであることが望ましい。例えば、サービスサーバ20のサービス提供者は、カテゴリ「横浜球団」に興味があるユーザ数や、ユーザの性別、年代別の統計的な情報、それらのユーザが興味関心を持つ傾向のある他のカテゴリの情報を含む統計レポートを情報処理装置100から取得することができる。 The conditions specified by the user of the terminal device 10 are the demographic attributes stored in the user attributes 198 stored in a manner that can be compared with the stored database of categories that are presumed to be of interest to the user. or should be included in the geographic attributes. For example, the service provider of the service server 20 may provide information such as the number of users who are interested in the category "Yokohama baseball team", statistical information by gender and age of the users, and other categories in which those users tend to be interested. can be obtained from the information processing device 100.

端末装置通信部180は、端末装置10に対して、そのユーザに対応する情報提供部170により出力された検索結果を返却する。端末装置通信部180は、例えば、端末装置10がサービスサーバ20の特定コンテンツを表示する際にレコメンド情報の出力リクエストを受け付け、その応答として端末装置10の利用ユーザに対応付けられたレコメンド情報を返却する。 The terminal device communication unit 180 returns the search results output by the information providing unit 170 corresponding to the user to the terminal device 10 . For example, when the terminal device 10 displays the specific content of the service server 20, the terminal device communication unit 180 receives a recommendation information output request, and returns the recommendation information associated with the user of the terminal device 10 as a response. do.

[カテゴリ推定]
以下、推定部160によるカテゴリ推定方法について説明する。図4はナレッジベース192の記憶するエンティティについて説明するための図である。
[Category Estimation]
A category estimation method by the estimation unit 160 will be described below. FIG. 4 is a diagram for explaining entities stored in the knowledge base 192. As shown in FIG.

ナレッジベース192において記述された事物は、オントロジーによって定義される。オントロジーとは、事物のクラスおよびプロパティを定義したものであり、クラスとプロパティとの間に成り立つ制約を集めたものである。 The things described in the knowledge base 192 are defined by an ontology. An ontology defines classes and properties of things, and is a collection of constraints between classes and properties.

例えば、くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている、という性質を持つ事物は、「鳥」というクラスに分類される。また、「鳥」というクラスの中で、飛べない、という性質を持つ事物は、例えば、「ペンギン」や「ダチョウ」という、より下位のクラスに分類される。このように、クラスの体系は、上位と下位の関係を有する階層構造となっていてよい。上位のクラスの性質は、下位のクラスに継承される。上述した例では、「鳥」というクラスの、「くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている」という性質は、「ペンギン」や「ダチョウ」という下位のクラスの性質にも含まれることになる。クラスを識別するためのクラス名は、例えば、「鳥」というクラスであれば、そのクラス名は「鳥」という文字列によって表されてよい。なお、クラス名は、必ずしも意味を表している必要はなく、例えば、「鳥」というクラスであっても、「情報1」や「C1」といった単なる識別情報を示す文字列が割り当てられてもよい。上述したエンティティ、すなわち事物は、オントロジーにより定義されたクラス体系の中に含まれる、いずれかのクラスに属するものとする。 For example, a beaked, egg-laying vertebrate with winged forelimbs would be classified as a "bird". In addition, in the class "bird", an entity having the property of being unable to fly is classified into lower classes such as "penguin" and "ostrich". In this way, the system of classes may have a hierarchical structure having a relationship between upper and lower levels. Properties of higher classes are inherited by lower classes. In the above example, the property of the class ``bird'', ``a vertebrate that has a beak, lays eggs, and has winged forelimbs'', is similar to the property of the lower classes ``penguin'' and ``ostrich''. will also be included. As for the class name for identifying the class, for example, if the class is "bird", the class name may be represented by the character string "bird". Note that the class name does not necessarily have to represent a meaning. For example, even for the class "bird", a character string indicating simple identification information such as "information 1" or "C1" may be assigned. . The above-mentioned entities, that is, things, belong to any class included in the class system defined by the ontology.

プロパティとは、事物の性質や特徴、クラス間の関係を記述する属性である。例えば、プロパティは、「~を体の構成要素としてもつ」という性質や、「~に生息する」という性質を示す属性であってもよいし、「あるクラスが上位クラスであり、あるクラスが下位クラスである」というクラス間の上位下位の関係を示す属性であってもよい。プロパティを識別するためのプロパティ名は、上述したクラス名と同様に、そのプロパティ名自体が意味を表していてもよいし、意味を表していなくてもよい。 A property is an attribute that describes the properties and characteristics of things and the relationships between classes. For example, a property may be an attribute that indicates the property of "having ~ as a component of the body", or the property of "inhabiting ~", or "a class is a superclass and a class is a subclass". It may be an attribute that indicates a higher-lower relationship between classes such as "is a class". A property name for identifying a property may or may not have a meaning, like the class name described above.

ナレッジベース192は、上述したクラスがノードとして表され、上述したプロパティがラベル付き、且つ方向性のあるエッジとして表された有向グラフである。このようなグラフ構造によって、事物についての情報がノードにより、事物間の関係がエッジによって判別可能となる。 The knowledge base 192 is a directed graph in which the above classes are represented as nodes and the above properties are represented as labeled and directed edges. With such a graph structure, it is possible to determine information about things by nodes and relationships between things by edges.

上述のプロパティは、エンティティ間の関係の記述にも転用可能である。例えば、図4に示したナレッジベース192は、エンティティE1が、エンティティE2およびエンティティE3と、同一のクラスに属するという、エンティティ間の関係を規定する。エンティティE1とエンティティE2はプロパティ「所属チーム」で表現され、エンティティE1とエンティティE3とはプロパティ「職業」で表現される。 The above properties can also be transferred to describe relationships between entities. For example, the knowledge base 192 shown in FIG. 4 defines a relationship between entities such that entity E1 belongs to the same class as entities E2 and E3. The entity E1 and the entity E2 are represented by the property "affiliation team", and the entity E1 and the entity E3 are represented by the property "occupation".

図5は、カテゴリについて説明するための図である。以下では、カテゴリが階層構造で示される例を用いて説明する。情報処理装置100の管理者は、複数のサービス間で共通するカテゴリ体系に基づいてエンティティにカテゴリを対応付けておくことで、ユーザの興味関心のあるカテゴリの推定に用いる。情報処理装置100の管理者は、例えば、図4のエンティティE2「横浜球団」は、図5のカテゴリC111の「横浜球団」とあらかじめ対応付けられたものとして設定する。 FIG. 5 is a diagram for explaining categories. An example in which categories are shown in a hierarchical structure will be described below. The administrator of the information processing apparatus 100 associates categories with entities based on a category system common among a plurality of services, and uses the categories to estimate the user's interests. The administrator of the information processing apparatus 100 sets, for example, the entity E2 “Yokohama team” in FIG. 4 as being associated in advance with the category C111 “Yokohama team” in FIG.

従って、エンティティ選択部130は、エンティティE1「A選手」が解析部120によいってキーワードとして設定された場合に、カテゴリC111の「横浜球団」を選択したり、その上位カテゴリであるカテゴリC1「スポーツ」や、カテゴリC11「プロ野球」を選択したりする。推定部160は、選択したカテゴリを推定ユーザ属性としてユーザ属性198に記憶させる。 Therefore, when the entity E1 "A player" is set as a keyword for the analysis unit 120, the entity selection unit 130 selects the category C111 "Yokohama team", or selects the category C1 " sports” or category C11 “professional baseball”. The estimation unit 160 stores the selected category in the user attribute 198 as an estimated user attribute.

なお、推定部160は、推定ユーザ属性に対してユーザのカテゴリに対する興味関心の強さを推定して付与してもよい。推定部160は、例えば、利用履歴の時系列を参照し、新しい利用履歴に関連するカテゴリに対してより高いポイントが設定されるような重み付けを行い、興味関心の強さを数値やランクで表現する。 In addition, the estimation unit 160 may estimate and assign the strength of the user's interest in the category to the estimated user attribute. The estimating unit 160, for example, refers to the time series of usage histories, weights categories related to new usage histories so that higher points are set, and expresses the strength of interest in numerical values or ranks. do.

[レコメンド対象の抽出]
以下、情報提供部170によるレコメンド対象のコンテンツ情報を抽出する方法について説明する。図6は、利用履歴196とユーザ属性198の関係を説明するための図である。
[Recommendation target extraction]
A method for extracting content information to be recommended by the information providing unit 170 will be described below. FIG. 6 is a diagram for explaining the relationship between usage history 196 and user attributes 198. As shown in FIG.

図6の上図は利用履歴196の一例を示す図である。利用履歴196には、例えば、ユーザ利用履歴に対応付いたコンテンツ情報22を提供するサービス、履歴の種別、コンテンツ情報22に対応付いたキーワード、後続操作の有無などが設定される。情報提供部170は、例えば、利用履歴196からレコメンド対象のコンテンツ情報に対応付けられたカテゴリを抽出する。情報提供部170は、推定部160によりユーザのカテゴリに対する興味関心の強さが推定されている場合、その興味関心の強さに応じて抽出するカテゴリを変更してもよい。 The upper diagram in FIG. 6 is a diagram showing an example of the usage history 196 . In the usage history 196, for example, a service that provides the content information 22 associated with the user usage history, the type of history, a keyword associated with the content information 22, presence/absence of subsequent operations, and the like are set. For example, the information providing unit 170 extracts a category associated with the content information to be recommended from the usage history 196 . When the estimation unit 160 estimates the level of interest of the user in the category, the information providing unit 170 may change the category to be extracted according to the level of interest.

図6の下図は、ユーザ属性198の一例を示す図である。情報提供部170は、カテゴリを選択する際に、利用履歴196からサービスの情報をそのまま転用してもよいし、他のサービスに転用可能なカテゴリであれば利用履歴196とは異なるサービスに転用してもよい。情報提供部170は、例えば、サービス「ニュース」に対応付いたカテゴリ「プロ野球」をそのままレコメンド情報としてもよいし、サービス「ニュース」に対応付いたカテゴリ「横浜」を、同一カテゴリのコンテンツ情報を持つサービス「グルメ」に転用してレコメンド情報としてもよい。 The lower diagram in FIG. 6 is a diagram showing an example of user attributes 198 . When selecting a category, the information providing unit 170 may divert the service information from the usage history 196 as it is, or divert it to a service different from the usage history 196 if the category can be diverted to other services. may For example, the information providing unit 170 may use the category "professional baseball" associated with the service "news" as the recommendation information as it is, or may use the category "Yokohama" associated with the service "news" as the content information of the same category. It may be used as recommendation information by diverting to the service "Gourmet".

情報提供部170は、ユーザ毎に上述のレコメンド対象の抽出を行ってもよいし、サイコグラフィック属性が類似するユーザグループ(すなわち、同一または類似の興味関心のあるカテゴリがユーザ属性198として記憶されるユーザグループ)毎に、上述のレコメンド対象の抽出を行ってもよい。また、情報提供部170は、複数のユーザグループのレコメンド対象の抽出結果を、属性情報のないユーザに対するレコメンド情報として利用してもよい。 The information providing unit 170 may extract the above-described recommendation target for each user, and may select groups of users with similar psychographic attributes (i.e., categories with the same or similar interests are stored as the user attributes 198). The above-described recommendation target extraction may be performed for each user group. Further, the information providing unit 170 may use the extraction results of recommendation targets of a plurality of user groups as recommendation information for users without attribute information.

[入稿時処理フロー]
図7は、サービスサーバ20にコンテンツ情報22が入稿される際の情報処理装置100の処理の流れの一例を示すフローチャートである。
[Upload processing flow]
FIG. 7 is a flow chart showing an example of the processing flow of the information processing apparatus 100 when the content information 22 is submitted to the service server 20. As shown in FIG.

まず、入稿データ取得部110は、コンテンツ情報22を取得する(S100)。次に、解析部120は、キーワードを設定する(S102)。次に、エンティティ選択部130は、エンティティを選択する(S104)。次に、タグ設定部140は、エンティティ選択部130により選択されたエンティティと、コンテンツ情報22とを対応付けた情報をタグ情報194として記憶させる(S106)。以上、本フローチャートの処理の説明を終了する。 First, the submitted data acquisition unit 110 acquires the content information 22 (S100). Next, the analysis unit 120 sets keywords (S102). Next, the entity selection unit 130 selects an entity (S104). Next, the tag setting unit 140 stores, as tag information 194, information that associates the entity selected by the entity selection unit 130 with the content information 22 (S106). This completes the description of the processing of this flowchart.

[レコメンド抽出処理フロー]
図8は、レコメンド情報を生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。なお、S200からS204までの処理は定期的に行われる処理であり、S206からS212までの処理はユーザがサービスサーバ20を利用する際に行われる処理である。
[Recommendation extraction processing flow]
FIG. 8 is a flow chart showing an example of the processing flow of the information processing device 100, the terminal device 10, and the service server 20 when generating and outputting recommendation information. The processing from S200 to S204 is performed periodically, and the processing from S206 to S212 is performed when the user uses the service server 20. FIG.

まず、履歴取得部150は、ユーザ利用履歴を取得する(S200)。次に、推定部160は、ユーザ利用履歴に基づいてユーザの興味関心のあるカテゴリを推定する(S202)。次に、情報提供部170は、ユーザの興味関心のあるカテゴリに基づいて、レコメンド情報を抽出する(S204)。 First, the history acquisition unit 150 acquires user usage history (S200). Next, the estimation unit 160 estimates the user's interest category based on the user's usage history (S202). Next, the information providing unit 170 extracts recommendation information based on the user's interest category (S204).

サービスサーバ20は、端末装置10による対象となるユーザのサービス表示リクエストを受信する(S206)。次に、端末装置通信部180は、サービスサーバ20からのレコメンド情報の出力リクエストを受信し(S208)、その応答としてレコメンド情報の検索結果を送信する(S210)。次に、サービスサーバ20は、受信した検索結果に基づいて対象となるユーザに対する表示サービス情報を生成し(S212)、端末装置10に生成した表示サービス情報を送信する(S214)以上、本フローチャートの処理の説明を終了する。係る処理によって、ユーザの興味関心の推定範囲を拡大することができる。 The service server 20 receives the target user's service display request from the terminal device 10 (S206). Next, the terminal device communication unit 180 receives a recommendation information output request from the service server 20 (S208), and transmits the search result of recommendation information as a response (S210). Next, the service server 20 generates display service information for the target user based on the received search results (S212), and transmits the generated display service information to the terminal device 10 (S214). End the explanation of the processing. Such processing can expand the estimated range of the user's interests.

[興味関心に基づく統計結果の提供フロー]
図9は、統計レポートを生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。
[Provision flow of statistical results based on interests]
FIG. 9 is a flow chart showing an example of the flow of processing by the information processing device 100, the terminal device 10, and the service server 20 when generating and outputting a statistical report.

まず、サービスサーバ20のサービス提供者は、端末装置10を介して検索条件を指定した統計レポートの出力リクエストを情報処理装置100に送信する(S300)。次に、端末装置通信部180は、出力リクエストを受信する(S302)。次に、情報提供部170は、検索条件に該当するユーザを抽出し(S304)、そのユーザに対応付いたレコメンド情報に基づいて統計レポートを生成する(S306)。端末装置通信部180は、統計レポートをサービス提供者の端末装置10に送信する(S308)。以上、本フローチャートの処理の説明を終了する。 First, the service provider of the service server 20 transmits a statistical report output request specifying search conditions to the information processing apparatus 100 via the terminal device 10 (S300). Next, the terminal device communication unit 180 receives the output request (S302). Next, the information providing unit 170 extracts users who meet the search conditions (S304), and generates a statistical report based on the recommendation information associated with the users (S306). The terminal device communication unit 180 transmits the statistical report to the terminal device 10 of the service provider (S308). This completes the description of the processing of this flowchart.

以上説明した実施形態によれば、複数のサービスによりネットワークを介して提供されるコンテンツ情報22に関するユーザの利用履歴と、ユーザの検索履歴とを取得する履歴取得部150と、履歴取得部150により取得されたコンテンツ情報22のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティをナレッジベース192に記憶されるエンティティから選択するエンティティ選択部130と、エンティティ選択部130により選択されたエンティティに対応付けられているカテゴリを、ユーザの興味関心のあるカテゴリを推定する推定部160と、を備えることにより、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる。 According to the embodiment described above, the history acquisition unit 150 acquires the user's usage history and the user's search history regarding the content information 22 provided via the network by a plurality of services, and the history acquisition unit 150 acquires an entity selection unit 130 that selects an entity highly related to one or more keywords included in the text data of the content information 22 or the search query from the entities stored in the knowledge base 192; By providing an estimating unit 160 for estimating categories associated with entities in which the user is interested, it is possible to expand the estimated range of the user's interests using more information. .

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the mode for carrying out the present invention has been described using the embodiments, but the present invention is not limited to such embodiments at all, and various modifications and replacements can be made without departing from the scope of the present invention. can be added.

10…端末装置、20…サービスサーバ、22…コンテンツ情報、24…ユーザ利用ログ、100…情報処理装置、110…入稿データ取得部、120…解析部、130…エンティティ選択部、140…タグ設定部、150…履歴取得部、160…推定部、170…情報提供部、180…端末装置通信部、192…ナレッジベース、194…タグ情報、196…利用履歴、198…ユーザ属性 REFERENCE SIGNS LIST 10 terminal device 20 service server 22 content information 24 user usage log 100 information processing device 110 manuscript data acquisition unit 120 analysis unit 130 entity selection unit 140 tag setting Unit 150 History acquisition unit 160 Estimation unit 170 Information provision unit 180 Terminal device communication unit 192 Knowledge base 194 Tag information 196 Usage history 198 User attribute

Claims (7)

複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得する取得部と、
前記取得部により取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択するエンティティ選択部と、
前記エンティティ選択部により選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリ推定する推定部と、を備え、
前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものであり、
前記ユーザの興味関心のあるカテゴリをデータベースに蓄積しておき、ユーザの属性を指定した興味関心に関する検索条件を取得し、ユーザの属性ごとの、特定のカテゴリに興味のある人数または割合を、データベースの検索結果として返却する情報提供部を備える、
情報処理装置。
an acquisition unit that acquires a user's usage history regarding content information provided via a network by a plurality of services and the user's search history;
an entity selection unit that selects an entity highly related to one or more keywords included in the text data or search query of the content information acquired by the acquisition unit;
an estimation unit for estimating the category associated with the entity selected by the entity selection unit as the category of interest of the user;
The entity is obtained by referring to a database describing entities representing things and relationships between the entities,
Categories of interests of the user are stored in a database, search conditions related to interests specifying user attributes are acquired, and the number or percentage of users who are interested in a specific category for each user attribute is stored in the database. Equipped with an information providing unit that returns as a search result of
Information processing equipment.
前記推定部は、前記複数のサービス間で共通するカテゴリ体系に基づいて、前記ユーザの興味関心のあるカテゴリを推定する、
請求項1に記載の、情報処理装置。
The estimation unit estimates a category of interest of the user based on a category system common among the plurality of services.
The information processing device according to claim 1 .
前記情報提供部は、あらかじめ前記データベースと対比可能な態様で蓄積されている前記ユーザのユーザ属性情報を、前記検索条件としてさらに取得する、
請求項1または2に記載の情報処理装置。
The information providing unit further acquires, as the search condition, user attribute information of the user stored in advance in a manner that can be compared with the database,
The information processing apparatus according to claim 1 or 2.
前記推定部は、前記利用履歴が含む前記ユーザの後続操作がある場合に、前記エンティティに対応付けられている前記カテゴリに興味関心がある可能性が高いと推定する、
請求項1から3のいずれか一項に記載の情報処理装置。
The estimation unit estimates that there is a high possibility that the category associated with the entity is of interest when the user's subsequent operation is included in the usage history.
The information processing apparatus according to any one of claims 1 to 3.
前記推定部により推定された前記カテゴリに基づいて、前記ユーザに対するレコメンド対象の前記コンテンツ情報を抽出する情報提供部をさらに備える、
請求項1から4のいずれか一項に記載の情報処理装置。
further comprising an information providing unit that extracts the content information to be recommended to the user based on the category estimated by the estimation unit;
The information processing apparatus according to any one of claims 1 to 4.
コンピュータが、
複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得し、
取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択し、
選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリ推定し、
前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものであり、
前記コンピュータが、更に、
前記ユーザの興味関心のあるカテゴリをデータベースに蓄積しておき、
ユーザの属性を指定した興味関心に関する検索条件を取得し、
ユーザの属性ごとの、特定のカテゴリに興味のある人数または割合を、データベースの検索結果として返却する、
情報処理方法。
the computer
Acquiring a user's usage history and the user's search history regarding content information provided by a plurality of services via a network,
selecting an entity highly relevant to one or more keywords included in the text data or search query of the acquired content information;
estimating the category associated with the selected entity as the category of interest of the user;
The entity is obtained by referring to a database describing entities representing things and relationships between the entities,
The computer further
accumulating categories of interest of the user in a database;
Acquire search conditions related to interests that specify user attributes,
Return the number or percentage of people who are interested in a specific category for each user attribute as a database search result,
Information processing methods.
コンピュータに、
複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得させ、
取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択させ、
選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリ推定させ、
前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものであり、
前記コンピュータが、更に、
前記ユーザの興味関心のあるカテゴリをデータベースに蓄積させ、
ユーザの属性を指定した興味関心に関する検索条件を取得させ、
ユーザの属性ごとの、特定のカテゴリに興味のある人数または割合を、データベースの検索結果として返却させる、
プログラム。
to the computer,
Acquiring a user's usage history and the user's search history regarding content information provided by a plurality of services via a network;
selecting an entity highly relevant to one or more keywords included in the text data or search query of the acquired content information;
presuming that the category associated with the selected entity is the category of interest of the user;
The entity is obtained by referring to a database describing entities representing things and relationships between the entities,
The computer further
accumulating categories of interest of the user in a database;
Acquire search conditions related to interests that specify user attributes,
Return the number or percentage of people who are interested in a specific category for each user attribute as a search result of the database,
program.
JP2018174397A 2018-09-19 2018-09-19 Information processing device, information processing method, and program Active JP7166116B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018174397A JP7166116B2 (en) 2018-09-19 2018-09-19 Information processing device, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018174397A JP7166116B2 (en) 2018-09-19 2018-09-19 Information processing device, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2020046895A JP2020046895A (en) 2020-03-26
JP7166116B2 true JP7166116B2 (en) 2022-11-07

Family

ID=69899762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018174397A Active JP7166116B2 (en) 2018-09-19 2018-09-19 Information processing device, information processing method, and program

Country Status (1)

Country Link
JP (1) JP7166116B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022009877A1 (en) * 2020-07-07 2022-01-13
CN112905878B (en) * 2021-01-25 2023-03-10 长沙市到家悠享网络科技有限公司 Corresponding relation configuration method, device, equipment and storage medium
JP7280305B2 (en) * 2021-03-18 2023-05-23 ヤフー株式会社 Information processing device, information processing method and information processing program
JP7074910B1 (en) 2021-04-20 2022-05-24 ヤフー株式会社 Information processing equipment, information processing methods, and information processing programs

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113542A (en) 2008-11-06 2010-05-20 Kaiin Chin Information provision system, information processing apparatus and program for the information processing apparatus
JP2012103817A (en) 2010-11-08 2012-05-31 Rakuten Inc Electronic book distribution system, electronic book distribution method, client device, electronic book distribution device, program, and information recording medium
JP2014516447A (en) 2011-04-28 2014-07-10 フェイスブック,インク. Cognitive relevance targeting in social networking systems
US9026516B1 (en) 2011-08-09 2015-05-05 Google Inc. Interest-based keywords for prominent entity and by location
US9948998B1 (en) 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device
JP2018100890A (en) 2016-12-20 2018-06-28 ヤフー株式会社 Provision device, provision method, and provision program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113542A (en) 2008-11-06 2010-05-20 Kaiin Chin Information provision system, information processing apparatus and program for the information processing apparatus
JP2012103817A (en) 2010-11-08 2012-05-31 Rakuten Inc Electronic book distribution system, electronic book distribution method, client device, electronic book distribution device, program, and information recording medium
JP2014516447A (en) 2011-04-28 2014-07-10 フェイスブック,インク. Cognitive relevance targeting in social networking systems
US9026516B1 (en) 2011-08-09 2015-05-05 Google Inc. Interest-based keywords for prominent entity and by location
US9948998B1 (en) 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device
JP2018100890A (en) 2016-12-20 2018-06-28 ヤフー株式会社 Provision device, provision method, and provision program

Also Published As

Publication number Publication date
JP2020046895A (en) 2020-03-26

Similar Documents

Publication Publication Date Title
JP7166116B2 (en) Information processing device, information processing method, and program
JP6906419B2 (en) Information providing equipment, information providing method, and program
CN103886090B (en) Content recommendation method and device based on user preferences
KR101997541B1 (en) Ranking external content on online social networks
US10282483B2 (en) Client-side caching of search keywords for online social networks
US11361029B2 (en) Customized keyword query suggestions on online social networks
JP6420481B2 (en) Search for content by key authors on online social networks
US9411890B2 (en) Graph-based search queries using web content metadata
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US9069867B2 (en) Resource management system, method and program for selecting candidate tag
US11455660B2 (en) Extraction device, extraction method, and non-transitory computer readable storage medium
JP5615857B2 (en) Analysis apparatus, analysis method, and analysis program
CN112148889A (en) Recommendation list generation method and device
CN108090111B (en) Animated excerpts for search results
US20180349503A1 (en) Multimedia Search Using Reshare Text on Online Social Networks
CN107862553A (en) Advertisement real-time recommendation method, device, terminal device and storage medium
US11055312B1 (en) Selecting content using entity properties
KR20140091530A (en) Relevance of name and other search queries with social network features
US20120066359A1 (en) Method and system for evaluating link-hosting webpages
JP2019125007A (en) Information analyzer, information analysis method and information analysis program
JP2009193465A (en) Information processor, information providing system, information processing method, and program
JP2013125468A (en) Advertisement distribution device
JP2009098964A (en) Network service system, server, method and program
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
JP2013206407A (en) Information recommendation method, device and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221025

R150 Certificate of patent or registration of utility model

Ref document number: 7166116

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350