JP2020046895A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2020046895A
JP2020046895A JP2018174397A JP2018174397A JP2020046895A JP 2020046895 A JP2020046895 A JP 2020046895A JP 2018174397 A JP2018174397 A JP 2018174397A JP 2018174397 A JP2018174397 A JP 2018174397A JP 2020046895 A JP2020046895 A JP 2020046895A
Authority
JP
Japan
Prior art keywords
user
entity
information
category
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018174397A
Other languages
English (en)
Other versions
JP7166116B2 (ja
Inventor
正樹 野口
Masaki Noguchi
正樹 野口
美樹 小川
Miki Ogawa
美樹 小川
尚方 四熊
Naokata Shikuma
尚方 四熊
秀平 宇野
Shuhei Uno
秀平 宇野
真吾 星野
Shingo Hoshino
真吾 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LY Corp
Original Assignee
Z Holdings Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Z Holdings Corp filed Critical Z Holdings Corp
Priority to JP2018174397A priority Critical patent/JP7166116B2/ja
Publication of JP2020046895A publication Critical patent/JP2020046895A/ja
Application granted granted Critical
Publication of JP7166116B2 publication Critical patent/JP7166116B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる情報処理装置、情報処理方法、およびプログラムを提供すること。【解決手段】複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得する取得部と、前記取得部により取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択するエンティティ選択部と、前記エンティティ選択部により選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定する推定部と、を備え、前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、情報処理装置。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
従来、クエリに関連する電子リソースを識別し、エンティティに関連する電子リソースから、エンティティに対する知識パネル中に表示するためのコンテンツを選択し、選択されるコンテンツの各コンテンツアイテムは、受信した複数のクエリのうち、エンティティとコンテンツアイテムによって表されるコンテンツとの両方を照会したクエリの数に基づいて選択される技術が開示されている。(例えば、特許文献1)。
特開2016−139438号公報
しかしながら、従来の技術では、興味関心の定義が異なる複数のサービス間でユーザの興味関心を横断的に推定することについては考慮されていなかった。このため、推定される情報が限定的になる場合があった。
本発明は、このような事情を考慮してなされたものであり、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。
本発明の一態様は、複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得する取得部と、前記取得部により取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択するエンティティ選択部と、前記エンティティ選択部により選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定する推定部と、を備え、前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、情報処理装置である。
本発明の一態様によれば、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる。
情報処理装置100の利用環境を示す図である。 情報処理装置100の処理を模式的に示す図である。 情報処理装置100のブロック図である。 ナレッジベースを説明するための図である。 カテゴリを説明するための図である。 情報処理装置100がユーザの情報を収集する処理を説明するための図である。 情報処理装置100の入稿時処理の流れの一例を示すフローチャートである。 レコメンド情報を生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。 統計レポートを生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。
[概要]
情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、複数のサービスサーバの利用履歴を収集し、それぞれのサービスを横断して展開することを支援する装置である。
複数のサービスサーバのそれぞれは、例えば、ユーザにより操作される端末装置からのリクエストに対応するウェブページを提供するウェブサーバ、アプリケーションが起動された端末装置と通信を行って各種情報の受け渡しを行ってコンテンツ情報を提供するアプリケーションサーバなどである。サービスサーバは、例えば、ニュースを提供するサービスやショッピングサービス、オークションサービス、マッチングサービス、金融決済サービス、ナビゲーションサービスなどを、ネットワークを介して提供する。
情報処理装置は、サービスサーバが提供するコンテンツ情報を構成する非構造化テキストから、1以上の固有名詞を抽出し、キーワードとして設定する。キーワードとは、例えば、ユーザによって入力される検索クエリに含まれる可能性がある、人、場所、物事などの固有名詞である。キーワードには、正式名称以外に、該キーワードのあだ名(ニックネーム)、略称、通称、自称などの別名を含む場合がある。非構造化テキストは、例えば、キーワードを含む(または、キーワードに関する)ニュース記事や、百科事典のウェブページ、ショッピングサイトにおける商品タイトルや詳細説明、企業公式情報(ニュースリリースやミニブログ)といったコンテンツに含まれるテキストデータである。
情報処理装置は、ユーザ毎のキーワードに対応付いたエンティティを蓄積することで、ユーザの興味関心を推定する。また、情報処理装置は、エンティティの属するカテゴリを参照することでサービスサーバが提供するサービスのユーザ利用履歴を、他のサービスで自サービスのユーザ利用履歴と同様に利用させることを実現したり、統計データ収集などの別の用途に流用したりすることを可能にする。カテゴリは、他のカテゴリとの類似度や関連度合いを示すことができるように階層構造で示されてもよいし、クラスタ構造で示されてもよい。なお、カテゴリは、サービスサーバ20の提供する複数のサービスにおいて横断的に利用可能であるように設定されることが望ましい。
[全体構成]
図1は、情報処理装置100の利用環境を示す図である。情報処理装置100は、例えば、サービスサーバ20−1〜20−N(Nは自然数)および端末装置10とネットワークNWを介して通信する。ネットワークNWは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、プロバイダ装置、無線基地局、専用回線などのうちの一部または全部を含む。
情報処理装置100は、端末装置10からサービスサーバ20に対するリクエスト(例えば、検索リクエストや、閲覧リクエスト)の履歴や、そのリクエストを受信した結果ユーザが行った何らかの反応(以下、後続操作)の履歴を、ユーザ利用履歴として蓄積する。なお、本明細書では、サービスサーバ20−1〜20−Nに関する共通の事項を説明する場合など、個々のサービスサーバ20−1〜20−Nを区別しない場合には、単にサービスサーバ20と呼ぶ。
端末装置10は、ユーザの入力操作を受け付ける装置である。端末装置10は、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータ、スマートスピーカ(AIスピーカ)などである。入力操作は、タッチ操作、マウス操作、キーボード操作、音声入力などにより実行される。
サービスサーバ20は、端末装置10からのリクエストに対応するウェブページを提供するウェブサーバ装置、アプリケーションが起動された端末装置10と通信を行って各種情報の受け渡しを行ってコンテンツ情報を提供するアプリケーションサーバ装置などである。
図2は、情報処理装置100が収集するユーザ利用履歴について説明するための図である。情報処理装置100は、例えば、ユーザが端末装置10を介してサービスサーバ20に送信した、検索リクエストや閲覧リクエストなどのリクエストや、ユーザの登録情報、サービスサーバ20の提供するサービス特有の設定内容をユーザ利用履歴として収集する。情報処理装置100は、収集したユーザ利用履歴から、複数観点のユーザ属性情報を抽出する。
ユーザ属性情報は、例えば、デモグラフィック属性、ジオグラフィック属性、サイコグラフィック属性を含む。デモグラフィック属性とは、例えば、年齢、性別、職業、年収、家族構成などを含むユーザ個人の社会的な立場をラベリングする際に用いることのできる属性情報である。ジオグラフィック属性とは、例えば、自宅住所、勤務地住所、頻繁に訪れる場所などを含むユーザ個人を地理的条件でラベリングする際に用いることのできる属性情報である。サイコグラフィック属性とは、興味関心、趣味、週間、嗜好、価値観を含む属性情報である。これらのユーザ属性情報は、ユーザによってあらかじめ設定されたアカウント登録情報から取得してもよいし、端末装置10から送信されるリクエスト情報に付随する位置情報を取得してもよいし、情報処理装置100によってユーザ利用履歴を解析することで推定されてもよい。情報処理装置100は、抽出したユーザ属性情報を、ユーザへのレコメンド情報生成に用いたり、ユーザに提供するコンテンツ情報22の選定などにおける統計分析に活用したりすることで各サービスサーバ20が提供するサービスの向上に活用することができる。
[構成]
図3は、情報処理装置100のブロック図である。情報処理装置100は、例えば、入稿データ取得部110と、解析部120と、エンティティ選択部130と、タグ設定部140と、履歴取得部150と、推定部160と、情報提供部170と、端末装置通信部180と、記憶部190とを備える。情報処理装置100の記憶部190を除くこれらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め情報処理装置100のHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで情報処理装置100のHDDやフラッシュメモリにインストールされてもよい。
記憶部190は、例えば、RAM(Random Access Memory)、レジスタ、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)などにより実現される。記憶部190は、例えば、ナレッジベース192、タグ情報194、利用履歴196、ユーザ属性198などの情報を記憶する。
ナレッジベース192は、事物に関する情報および事物間の意味的関係に関する情報をグラフとして記述したデータベースである。ナレッジベース192は、例えば、「建物」、「美術」、「旅行」といった抽象的な概念と、それらの概念に属するまたは関連する特定の個体(「東京タワー」、「アール・ヌーヴォー」、「日帰りバスツアー」など)を指すエンティティを含む。さらにナレッジベース192には、特定のエンティティとの関連性が高いテキストデータが設定されてもよく、例えば、エンティティ「東京タワー」にはテキストデータ「日本電波塔」が設定され、エンティティ「アール・ヌーヴォー」にはテキストデータ「19世紀」が設定される。
タグ情報194は、コンテンツ情報22をナレッジベース192の記憶する語句でタグ設定した情報である。例えば、プロ野球選手Aの2000本安打に関するニュースには、タグ情報として「スポーツ」、「プロ野球」、「A選手」、「2000本安打」の語句がタグとして設定される。
利用履歴196は、前述したユーザ利用履歴である。利用履歴196には、例えば、サービスサーバ20の提供するコンテンツ情報の閲覧履歴、クリック履歴、表示履歴、サービスの購入履歴、コンテンツ情報のキーワードなどが含まれる。利用履歴196は、定期的なバッチ処理などによりサービスサーバ20から取得される。
ユーザ属性198は、ユーザによってあらかじめ設定されたアカウント登録情報(例えば、ユーザID、性別、住所、職業)である。ユーザ属性198には、利用履歴196を解析することで得られる、ユーザ属性情報に含まれると推定される結果(以下、推定ユーザ属性)が含まれてもよく、例えば、プロ野球に関するニュースを頻繁に閲覧するユーザの推定ユーザ属性情報には「スポーツ」が設定される。
入稿データ取得部110は、サービスサーバ20のコンテンツ情報22を取得する。このコンテンツ情報22は、サービスサーバ20でユーザに向けて公開済のものであってもよいし、ユーザ公開前のものであってもよい。入稿データ取得部110は、コンテンツ情報22の非構造化テキストを解析部120に出力する。
解析部120は、入稿データ取得部110により出力された非構造化テキストを解析し、1以上のキーワードを設定する。解析部120は、例えば、非構造化テキスト内の文脈に基づいて、固有名詞と思われる語句を抽出し、さらに抽出結果から1以上のキーワードを設定する。また、解析部120は、ナレッジベース192に記録されるテキストデータが含まれるかを検索し、固有名詞と思われる語句を抽出してもよい。
解析部120は、例えば、非構造化テキストが和文であれば形態素解析を行って、単語に分割し、W2V(Word2Vec)などの手法を用いて、固有名詞を抽出する。解析部120による固有名詞の抽出には、他のウェブクローリング(Web Crawling)技術が用いられてもよい。解析部120は、解析結果をエンティティ選択部130に出力する。
エンティティ選択部130は、解析部120により出力された解析結果に含まれるキーワードを精査して、キーワードと関連性の高い1以上のエンティティを選択する。例えば、解析部120による解析結果に「日本電波塔」が含まれる場合、エンティティ選択部130は、ナレッジベース192のテキストデータ「日本電波塔」と対応付けられたエンティティ「東京タワー」を選択する。なお、エンティティ選択部130は、ナレッジベース192のテキストデータと同名であるエンティティが存在する場合には、そのエンティティ(例えば、上述の例ではエンティティ「日本電波塔」)を選択してもよい。エンティティ選択部130は、選択したエンティティをタグ設定部140に出力する。
タグ設定部140は、エンティティ選択部130により選択されたエンティティと、コンテンツ情報22とを対応付けた情報を、タグ情報194に記憶させる。
履歴取得部150は、利用履歴196から着目するユーザに対応付けられたユーザ利用履歴を取得する。履歴取得部150は、サービスサーバ20からユーザ利用ログ24を取得して、ユーザ利用履歴として利用してもよい。ユーザ利用ログ24は、サービスサーバ20のそれぞれが提供する複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、ユーザの検索履歴とを含むものであり、ユーザを特定する情報(例えば、ユーザID、リクエスト種別、表示したコンテンツ情報、後続操作の有無)を含む。履歴取得部150は、取得したユーザ利用履歴を推定部160に出力する。なお、履歴取得部150は「取得部」の一例である。
推定部160は、エンティティ選択部130により選択されたエンティティと、履歴取得部150により取得されたユーザ利用履歴とに基づいて、ユーザの興味関心のあるエンティティと対応付けられているカテゴリを、ユーザの興味関心のあるカテゴリであると推定する。カテゴリの推定方法については後述する。推定部160は、推定したユーザの興味関心のあるカテゴリをユーザ属性198として記憶させる。
例えば、推定部160は、ユーザ利用履歴が含むユーザの後続操作がある場合に、ユーザが選択されたエンティティと対応付けられているカテゴリに興味関心がある可能性が高いと推定し、興味関心がある可能性が高いことを示すフラグやランクなどを設定してユーザ属性198として記憶させる。
情報提供部170は、サービスサーバ20からユーザの興味関心に関する検索条件を取得し、その検索条件に基づいてユーザ属性198に蓄積されたカテゴリを検索し、得られた検索結果をサービスサーバ20に返却する。
例えば、情報提供部170は、端末装置10により送信されたサービスサーバ20の所定コンテンツ情報(例えば、トップページや、ユーザ毎にカスタマイズされたページ)の閲覧リクエストに含まれるユーザの興味関心に関する検索条件を受信し、蓄積されたユーザ属性198に対してその検索条件で抽出した検索結果を生成する。情報提供部170は、推定部160により推定され、ユーザ属性198に蓄積されたユーザの興味関心があると推定するカテゴリに基づいて、ユーザに対するレコメンド対象であるコンテンツ情報を抽出する。
情報提供部170は、例えば、ユーザ属性198の記憶するカテゴリを検索キーとして、タグ情報194に対応付けられたカテゴリと関連性の高いタグ情報が設定されているコンテンツ情報を検索する。情報提供部170により生成される検索結果は、単一のユーザに対して提供されるレコメンド情報であってもよいし、同一または類似する興味関心を持つと推定されるユーザグループに対して提供されるレコメンド情報であってもよい。また、情報提供部170は、特に興味関心が推定されていないユーザに対して提供するレコメンド情報として、一部または全部のユーザを集計対象として、ランキング形式のレコメンド情報を生成してもよい。情報提供部170は、生成した検索結果を端末装置通信部180に出力する。
また、情報提供部170は、後述する端末装置通信部180が、他ユーザのレコメンド情報を閲覧する権限を持つ端末装置10の利用者(例えば、サービスサーバ20のサービス提供者)からのレコメンド情報の出力リクエストを受け付けた、端末装置10の利用者により指定された条件を満たすレコメンド情報をレポート形式などで出力してもよい。以下、情報提供部170が出力するレポート形式のレコメンド情報を統計レポートと称する。
なお、端末装置10の利用者により指定された条件は、ユーザの興味関心があると推定されるカテゴリの記憶されたデータベースと対比可能な態様で蓄積されているユーザ属性198の記憶するデモグラフィック属性や、ジオグラフィック属性に含まれるものであることが望ましい。例えば、サービスサーバ20のサービス提供者は、カテゴリ「横浜球団」に興味があるユーザ数や、ユーザの性別、年代別の統計的な情報、それらのユーザが興味関心を持つ傾向のある他のカテゴリの情報を含む統計レポートを情報処理装置100から取得することができる。
端末装置通信部180は、端末装置10に対して、そのユーザに対応する情報提供部170により出力された検索結果を返却する。端末装置通信部180は、例えば、端末装置10がサービスサーバ20の特定コンテンツを表示する際にレコメンド情報の出力リクエストを受け付け、その応答として端末装置10の利用ユーザに対応付けられたレコメンド情報を返却する。
[カテゴリ推定]
以下、推定部160によるカテゴリ推定方法について説明する。図4はナレッジベース192の記憶するエンティティについて説明するための図である。
ナレッジベース192において記述された事物は、オントロジーによって定義される。オントロジーとは、事物のクラスおよびプロパティを定義したものであり、クラスとプロパティとの間に成り立つ制約を集めたものである。
例えば、くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている、という性質を持つ事物は、「鳥」というクラスに分類される。また、「鳥」というクラスの中で、飛べない、という性質を持つ事物は、例えば、「ペンギン」や「ダチョウ」という、より下位のクラスに分類される。このように、クラスの体系は、上位と下位の関係を有する階層構造となっていてよい。上位のクラスの性質は、下位のクラスに継承される。上述した例では、「鳥」というクラスの、「くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている」という性質は、「ペンギン」や「ダチョウ」という下位のクラスの性質にも含まれることになる。クラスを識別するためのクラス名は、例えば、「鳥」というクラスであれば、そのクラス名は「鳥」という文字列によって表されてよい。なお、クラス名は、必ずしも意味を表している必要はなく、例えば、「鳥」というクラスであっても、「情報1」や「C1」といった単なる識別情報を示す文字列が割り当てられてもよい。上述したエンティティ、すなわち事物は、オントロジーにより定義されたクラス体系の中に含まれる、いずれかのクラスに属するものとする。
プロパティとは、事物の性質や特徴、クラス間の関係を記述する属性である。例えば、プロパティは、「〜を体の構成要素としてもつ」という性質や、「〜に生息する」という性質を示す属性であってもよいし、「あるクラスが上位クラスであり、あるクラスが下位クラスである」というクラス間の上位下位の関係を示す属性であってもよい。プロパティを識別するためのプロパティ名は、上述したクラス名と同様に、そのプロパティ名自体が意味を表していてもよいし、意味を表していなくてもよい。
ナレッジベース192は、上述したクラスがノードとして表され、上述したプロパティがラベル付き、且つ方向性のあるエッジとして表された有向グラフである。このようなグラフ構造によって、事物についての情報がノードにより、事物間の関係がエッジによって判別可能となる。
上述のプロパティは、エンティティ間の関係の記述にも転用可能である。例えば、図4に示したナレッジベース192は、エンティティE1が、エンティティE2およびエンティティE3と、同一のクラスに属するという、エンティティ間の関係を規定する。エンティティE1とエンティティE2はプロパティ「所属チーム」で表現され、エンティティE1とエンティティE3とはプロパティ「職業」で表現される。
図5は、カテゴリについて説明するための図である。以下では、カテゴリが階層構造で示される例を用いて説明する。情報処理装置100の管理者は、複数のサービス間で共通するカテゴリ体系に基づいてエンティティにカテゴリを対応付けておくことで、ユーザの興味関心のあるカテゴリの推定に用いる。情報処理装置100の管理者は、例えば、図4のエンティティE2「横浜球団」は、図5のカテゴリC111の「横浜球団」とあらかじめ対応付けられたものとして設定する。
従って、エンティティ選択部130は、エンティティE1「A選手」が解析部120によいってキーワードとして設定された場合に、カテゴリC111の「横浜球団」を選択したり、その上位カテゴリであるカテゴリC1「スポーツ」や、カテゴリC11「プロ野球」を選択したりする。推定部160は、選択したカテゴリを推定ユーザ属性としてユーザ属性198に記憶させる。
なお、推定部160は、推定ユーザ属性に対してユーザのカテゴリに対する興味関心の強さを推定して付与してもよい。推定部160は、例えば、利用履歴の時系列を参照し、新しい利用履歴に関連するカテゴリに対してより高いポイントが設定されるような重み付けを行い、興味関心の強さを数値やランクで表現する。
[レコメンド対象の抽出]
以下、情報提供部170によるレコメンド対象のコンテンツ情報を抽出する方法について説明する。図6は、利用履歴196とユーザ属性198の関係を説明するための図である。
図6の上図は利用履歴196の一例を示す図である。利用履歴196には、例えば、ユーザ利用履歴に対応付いたコンテンツ情報22を提供するサービス、履歴の種別、コンテンツ情報22に対応付いたキーワード、後続操作の有無などが設定される。情報提供部170は、例えば、利用履歴196からレコメンド対象のコンテンツ情報に対応付けられたカテゴリを抽出する。情報提供部170は、推定部160によりユーザのカテゴリに対する興味関心の強さが推定されている場合、その興味関心の強さに応じて抽出するカテゴリを変更してもよい。
図6の下図は、ユーザ属性198の一例を示す図である。情報提供部170は、カテゴリを選択する際に、利用履歴196からサービスの情報をそのまま転用してもよいし、他のサービスに転用可能なカテゴリであれば利用履歴196とは異なるサービスに転用してもよい。情報提供部170は、例えば、サービス「ニュース」に対応付いたカテゴリ「プロ野球」をそのままレコメンド情報としてもよいし、サービス「ニュース」に対応付いたカテゴリ「横浜」を、同一カテゴリのコンテンツ情報を持つサービス「グルメ」に転用してレコメンド情報としてもよい。
情報提供部170は、ユーザ毎に上述のレコメンド対象の抽出を行ってもよいし、サイコグラフィック属性が類似するユーザグループ(すなわち、同一または類似の興味関心のあるカテゴリがユーザ属性198として記憶されるユーザグループ)毎に、上述のレコメンド対象の抽出を行ってもよい。また、情報提供部170は、複数のユーザグループのレコメンド対象の抽出結果を、属性情報のないユーザに対するレコメンド情報として利用してもよい。
[入稿時処理フロー]
図7は、サービスサーバ20にコンテンツ情報22が入稿される際の情報処理装置100の処理の流れの一例を示すフローチャートである。
まず、入稿データ取得部110は、コンテンツ情報22を取得する(S100)。次に、解析部120は、キーワードを設定する(S102)。次に、エンティティ選択部130は、エンティティを選択する(S104)。次に、タグ設定部140は、エンティティ選択部130により選択されたエンティティと、コンテンツ情報22とを対応付けた情報をタグ情報194として記憶させる(S106)。以上、本フローチャートの処理の説明を終了する。
[レコメンド抽出処理フロー]
図8は、レコメンド情報を生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。なお、S200からS204までの処理は定期的に行われる処理であり、S206からS212までの処理はユーザがサービスサーバ20を利用する際に行われる処理である。
まず、履歴取得部150は、ユーザ利用履歴を取得する(S200)。次に、推定部160は、ユーザ利用履歴に基づいてユーザの興味関心のあるカテゴリを推定する(S202)。次に、情報提供部170は、ユーザの興味関心のあるカテゴリに基づいて、レコメンド情報を抽出する(S204)。
サービスサーバ20は、端末装置10による対象となるユーザのサービス表示リクエストを受信する(S206)。次に、端末装置通信部180は、サービスサーバ20からのレコメンド情報の出力リクエストを受信し(S208)、その応答としてレコメンド情報の検索結果を送信する(S210)。次に、サービスサーバ20は、受信した検索結果に基づいて対象となるユーザに対する表示サービス情報を生成し(S212)、端末装置10に生成した表示サービス情報を送信する(S214)以上、本フローチャートの処理の説明を終了する。係る処理によって、ユーザの興味関心の推定範囲を拡大することができる。
[興味関心に基づく統計結果の提供フロー]
図9は、統計レポートを生成し、出力する際の情報処理装置100と端末装置10とサービスサーバ20の処理の流れの一例を示すフローチャートである。
まず、サービスサーバ20のサービス提供者は、端末装置10を介して検索条件を指定した統計レポートの出力リクエストを情報処理装置100に送信する(S300)。次に、端末装置通信部180は、出力リクエストを受信する(S302)。次に、情報提供部170は、検索条件に該当するユーザを抽出し(S304)、そのユーザに対応付いたレコメンド情報に基づいて統計レポートを生成する(S306)。端末装置通信部180は、統計レポートをサービス提供者の端末装置10に送信する(S308)。以上、本フローチャートの処理の説明を終了する。
以上説明した実施形態によれば、複数のサービスによりネットワークを介して提供されるコンテンツ情報22に関するユーザの利用履歴と、ユーザの検索履歴とを取得する履歴取得部150と、履歴取得部150により取得されたコンテンツ情報22のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティをナレッジベース192に記憶されるエンティティから選択するエンティティ選択部130と、エンティティ選択部130により選択されたエンティティに対応付けられているカテゴリを、ユーザの興味関心のあるカテゴリを推定する推定部160と、を備えることにより、より多くの情報を用いてユーザの興味関心の推定範囲を拡大することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
10…端末装置、20…サービスサーバ、22…コンテンツ情報、24…ユーザ利用ログ、100…情報処理装置、110…入稿データ取得部、120…解析部、130…エンティティ選択部、140…タグ設定部、150…履歴取得部、160…推定部、170…情報提供部、180…端末装置通信部、192…ナレッジベース、194…タグ情報、196…利用履歴、198…ユーザ属性

Claims (8)

  1. 複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得する取得部と、
    前記取得部により取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択するエンティティ選択部と、
    前記エンティティ選択部により選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定する推定部と、を備え、
    前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、
    情報処理装置。
  2. 前記推定部は、前記複数のサービス間で共通するカテゴリ体系に基づいて、前記ユーザの興味関心のあるカテゴリを推定する、
    請求項1に記載の、情報処理装置。
  3. 前記ユーザの興味関心のあるカテゴリをデータベースに蓄積しておき、
    興味関心に関する検索条件を取得し、データベースの検索結果を返却する情報提供部を備える、
    請求項1または2に記載の、情報処理装置。
  4. 前記情報提供部は、あらかじめ前記データベースと対比可能な態様で蓄積されている前記ユーザのユーザ属性情報を、前記検索条件としてさらに取得する、
    請求項3に記載の情報処理装置。
  5. 前記推定部は、前記利用履歴が含む前記ユーザの後続操作がある場合に、前記エンティティに対応付けられている前記カテゴリに興味関心がある可能性が高いと推定する、
    請求項1から4のいずれか一項に記載の情報処理装置。
  6. 前記推定部により推定された前記カテゴリに基づいて、前記ユーザに対するレコメンド対象の前記コンテンツ情報を抽出する情報提供部をさらに備える、
    請求項1から5のいずれか一項に記載の情報処理装置。
  7. コンピュータが、
    複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得し、
    取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択し、
    選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定し、
    前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、
    情報処理方法。
  8. コンピュータに、
    複数のサービスによりネットワークを介して提供されるコンテンツ情報に関するユーザの利用履歴と、前記ユーザの検索履歴とを取得させ、
    取得された前記コンテンツ情報のテキストデータまたは検索クエリに含まれる1以上のキーワードと関連性の高いエンティティを選択させ、
    選択されたエンティティに対応付けられているカテゴリを、前記ユーザの興味関心のあるカテゴリを推定させ、
    前記エンティティは、物事の事物を表すエンティティと、エンティティ間の関係が記述されているデータベースを参照して得られるものである、
    プログラム。
JP2018174397A 2018-09-19 2018-09-19 情報処理装置、情報処理方法、およびプログラム Active JP7166116B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018174397A JP7166116B2 (ja) 2018-09-19 2018-09-19 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018174397A JP7166116B2 (ja) 2018-09-19 2018-09-19 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020046895A true JP2020046895A (ja) 2020-03-26
JP7166116B2 JP7166116B2 (ja) 2022-11-07

Family

ID=69899762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018174397A Active JP7166116B2 (ja) 2018-09-19 2018-09-19 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7166116B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905878A (zh) * 2021-01-25 2021-06-04 长沙市到家悠享网络科技有限公司 对应关系配置方法、装置、设备和存储介质
WO2022009877A1 (ja) * 2020-07-07 2022-01-13 株式会社Nttドコモ レコメンドシステム
JP7074910B1 (ja) 2021-04-20 2022-05-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022144212A (ja) * 2021-03-18 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9948998B1 (en) * 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113542A (ja) 2008-11-06 2010-05-20 Kaiin Chin 情報提供システム、情報処理装置及びそのプログラム
JP5259679B2 (ja) 2010-11-08 2013-08-07 楽天株式会社 電子書籍配信システム、電子書籍配信方法、クライアント装置、電子書籍配信装置、プログラム及び情報記録媒体
US20120278166A1 (en) 2011-04-28 2012-11-01 Gregory Badros Cognitive Relevance Targeting in a Social Networking System
US9026516B1 (en) 2011-08-09 2015-05-05 Google Inc. Interest-based keywords for prominent entity and by location
JP6728029B2 (ja) 2016-12-20 2020-07-22 ヤフー株式会社 提供装置、提供方法および提供プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9948998B1 (en) * 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022009877A1 (ja) * 2020-07-07 2022-01-13 株式会社Nttドコモ レコメンドシステム
CN112905878A (zh) * 2021-01-25 2021-06-04 长沙市到家悠享网络科技有限公司 对应关系配置方法、装置、设备和存储介质
CN112905878B (zh) * 2021-01-25 2023-03-10 长沙市到家悠享网络科技有限公司 对应关系配置方法、装置、设备和存储介质
JP2022144212A (ja) * 2021-03-18 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7280305B2 (ja) 2021-03-18 2023-05-23 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7074910B1 (ja) 2021-04-20 2022-05-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022165577A (ja) * 2021-04-20 2022-11-01 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Also Published As

Publication number Publication date
JP7166116B2 (ja) 2022-11-07

Similar Documents

Publication Publication Date Title
JP6906419B2 (ja) 情報提供装置、情報提供方法、およびプログラム
Zhao et al. Unsupervised spatial event detection in targeted domains with applications to civil unrest modeling
US9172666B2 (en) Locating a user based on aggregated tweet content associated with a location
JP7166116B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9990422B2 (en) Contextual analysis engine
CN112148889A (zh) 一种推荐列表的生成方法及设备
CN107291792B (zh) 用于确定相关实体的方法和系统
JP5615857B2 (ja) 分析装置、分析方法及び分析プログラム
US20150106157A1 (en) Text extraction module for contextual analysis engine
US11455660B2 (en) Extraction device, extraction method, and non-transitory computer readable storage medium
US20110264651A1 (en) Large scale entity-specific resource classification
CN104102639B (zh) 基于文本分类的推广触发方法和装置
EP2557511B1 (en) Information processing device, information processing method, information processing programme, and recording medium
US20140006408A1 (en) Identifying points of interest via social media
JP2019125007A (ja) 情報分析装置、情報分析方法および情報分析プログラム
US20180225305A1 (en) Method for displaying landmark data
JP2009098964A (ja) ネットワークサービスシステム、サーバ、方法及びプログラム
JP6728178B2 (ja) 検索データを処理するための方法及び装置
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
CN111738785A (zh) 选品方法、系统及存储介质
US8799314B2 (en) System and method for managing information map
JP5165422B2 (ja) 情報提供システム及び情報提供方法
CN102880622A (zh) 一种在互联网上确定用户特征的方法和系统
CN112000495B (zh) 用于兴趣点信息管理的方法、电子设备和存储介质
JP7042720B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221025

R150 Certificate of patent or registration of utility model

Ref document number: 7166116

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350