JP6450203B2 - 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 - Google Patents
個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 Download PDFInfo
- Publication number
- JP6450203B2 JP6450203B2 JP2015013057A JP2015013057A JP6450203B2 JP 6450203 B2 JP6450203 B2 JP 6450203B2 JP 2015013057 A JP2015013057 A JP 2015013057A JP 2015013057 A JP2015013057 A JP 2015013057A JP 6450203 B2 JP6450203 B2 JP 6450203B2
- Authority
- JP
- Japan
- Prior art keywords
- graph
- tree structure
- node
- personal profile
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
なお、概念空間とは、物事や事象の概念が付与された疑似的な空間である。
個人プロファイル生成装置は、グループ化手段によって、予め設定された終了条件を満たすまで第1初期グラフを再帰的にグループ化することで、木構造におけるノードの位置を表した位置情報が付加された第1グループ化グラフを生成する。
個人プロファイル生成装置は、グループ木構造グラフ生成手段によって、位置情報に基づいて第1グループ化グラフの各ノードを配置することで、第1グループ化グラフから、上位概念及び下位概念となるノード同士が木構造で階層化された第1グループ木構造グラフを生成する。
本願発明に係る個人プロファイル生成装置は、擬似的な概念空間にキーワードをマッピングし、概念空間まで個人プロファイルを拡張できるので、広範な個人の嗜好が反映された個人プロファイルを生成することができる。
本願発明に係るコンテンツ推薦装置は、個人プロファイル生成装置が生成した個人プロファイルを用いて、視聴者の嗜好に適したコンテンツを推薦することができる。
まず、本願発明の実施形態に係るコンテンツ推薦装置2で利用されるリンク付きコーパスを説明した後、コンテンツ推薦装置2の構成を説明する。
リンク付きコーパスとは、キーワード同士がリンク付けられた辞書コーパスのことである。リンク付きコーパスの代表例としては、ウィキペディアがあげられる。ウィキペディアは、キーワード間のリンク、及び、カテゴリに属する上位概念や下位概念のキーワードが管理されているので、リンク付きコーパスとして簡単に利用できる。
図2を参照し、コンテンツ推薦装置2の概略について説明する。
コンテンツ推薦装置2は、個人プロファイル生成装置1がリンク付きコーパスから個人プロファイルを生成し、生成した個人プロファイルに基づいて、コンテンツの推薦を行うものである。
続いて、コンテンツ推薦装置2の構成について説明する。
図2のように、コンテンツ推薦装置2は、個人プロファイル生成装置1と、コンテンツ推薦手段70とを備える。
個人プロファイル生成装置1は、初期グラフ生成手段10と、グループ化手段20と、グループ木構造グラフ生成手段30と、グループ木構造グラフDB40と、プロファイル生成手段50と、プロファイルDB60とを備える。
図1,図3を参照し、初期グラフの生成について、詳細に説明する(適宜図2参照)。
この例では、ウィキペディアにおける俳優“○○○○”のページから、初期グラフAを生成することとする。例えば、初期グラフ生成手段10は、俳優“○○○○”のページのHTML(Hyper Text Markup Language)を解析し、このページの下部に表示されているカテゴリのキーワードを取得する。ここでは、初期グラフ生成手段10は、カテゴリのキーワードとして、“日本の俳優”、“△△市出身の人物”を取得したこととし、“日本の歌手”については説明を省略する。
従って、初期グラフ生成手段10は、前記したノードのそれぞれをエッジで接続し、図3のような初期グラフAを生成する。
また、初期グラフ生成手段10は、推薦対象情報が入力され、入力された推薦対象情報にキーワード抽出処理(例えば、形態素解析処理)を施し、推薦対象情報からキーワード(第3キーワード)を抽出する。そして、初期グラフ生成手段10は、推薦対象情報の第3キーワードのうち、リンク付きコーパスのキーワードに一致するものを抽出する(名寄せ処理)。
その後、初期グラフ生成手段10は、生成した初期グラフA及び第2初期グラフをグループ化手段20に出力する。
参考文献:Vincent D Blondel et.al,“Fast unfolding of communities in large networks”,“Journal of Statistical Mechanics:Theory and Experiment 2008(10),P10008(12pp)”
図4〜図6を参照し、再帰的グループ化処理について、詳細に説明する(適宜図2参照)。
図4のように、グループ化手段20は、図3の初期グラフAのグループを初期化する。初期化された初期グラフAでは、全てのノードが同一のグループG1に属する。
なお、グループG3は、分割されなかったこととする。
また、グループ化手段20は、初期グラフ生成手段10から入力された第2初期グラフを再帰的にグループ化することで、位置情報が付加された第2グループ化グラフを生成する。ここで、グループ化手段20は、グループ化グラフBと同様の手順で、第2グループ化グラフを生成できるため、説明を省略する。
その後、グループ化手段20は、生成したグループ化グラフB及び第2グループ化グラフをグループ木構造グラフ生成手段30に出力する。
なお、グループ木構造グラフは、上位概念及び下位概念となるノード同士が木構造で階層化されたグラフである。
以下、図7を参照し、グループ木構造グラフの生成について、説明する(適宜図2参照)。
なお、各ノードの位置情報は、グループ木構造グラフ内で異なる位置を表し、重複しない。
また、グループ木構造グラフ生成手段30は、グループ化手段20から入力された第2グループ化グラフの各ノードに付加された位置情報に基づいて、第2グループ木構造グラフを生成する。ここで、第2グループ木構造グラフは、グループ木構造グラフCと同様の手順で生成できるため、説明を省略する。
その後、グループ木構造グラフ生成手段30は、グループ木構造グラフC及び第2グループ木構造グラフをグループ木構造グラフDB40に書き込む。
なお、個人プロファイルは、グループ木構造グラフCを各視聴者に適応させたものであるから、個人適応型グループ木構造グラフと呼ぶこともできる。
図8を参照し、個人プロファイルの生成について、詳細に説明する(適宜図2参照)。
まず、プロファイル生成手段50は、アクセス履歴情報にキーワード抽出処理(例えば、形態素解析処理)を施し、アクセス履歴情報からキーワード(第2キーワード)を抽出する。次に、プロファイル生成手段50は、抽出した各キーワードに一致するグループ木構造グラフCのノードを探索する。そして、プロファイル生成手段50は、この探索されたノード(基準ノード)に予め設定された重みを加える。
なお、この重みは、任意の値に設定することができる。
なお、図8では、accumが重みを表す。
また、プロファイル生成手段50は、第2グループ木構造グラフのノードに重み付けを行うことで、推薦対象プロファイル(target_tree)を生成する。ここで、プロファイル生成手段50は、第2グループ木構造グラフのノードに、任意の手法で重み付けを行うことができる。例えば、プロファイル生成手段50は、tf−idf(Term Frequency-Inverse Document Frequency)法で重み付けを行ってもよい。また、プロファイル生成手段50は、第2グループ木構造グラフのノードが固有名詞のときは一般名詞よりも大きく重み付けを行い、そのノードが一般名詞のときは固有名詞よりも小さく重み付けを行ってもよい。
なお、推薦対象プロファイルは、個人プロファイルと同一の木構造を有するが、各ノードの重みが個人プロファイルで同一位置のノードと異なる。
以下、コンテンツの推薦について、詳細に説明する(適宜図2参照)。
本実施形態では、コンテンツ推薦手段70は、個人プロファイルと推薦対象プロファイルとの一致度として、推薦対象プロファイルが個人プロファイルにどの程度含まれているかを表す包含係数を算出する。
なお、accumの前に各ノードの位置情報を記載した。例えば、(0,1,2,3,4)_accumがi番目のリーフノードの重みを表し、(0)_accumがルートノードの重みを表す。
なお、コンテンツ推薦手段70は、ベクトルtarget_vec[i]の各要素を平準化してもよいし、平準化しなくともよい。
包含係数が閾値以上の場合、コンテンツ推薦手段70は、推薦対象となるコンテンツを視聴者に推薦するという判定結果を出力する。
包含係数が閾値未満の場合、コンテンツ推薦手段70は、推薦対象となるコンテンツを視聴者に推薦しないという判定結果を出力する。
図9を参照し、個人プロファイル生成装置1のグループ木構造グラフ生成処理について、詳細に説明する(適宜図2参照)。
個人プロファイル生成装置1は、グループ化手段20によって、ノード間の連結粗密情報に基づいて、親グループを2以上の子グループに分割する(ステップS3)。
個人プロファイル生成装置1は、グループ化手段20によって、終了条件を満たすか否かを判定する(ステップS5)。
以上の手順により、個人プロファイル生成装置1は、グループ木構造グラフCを生成できる。
以後、個人プロファイル生成装置1は、ステップS2〜S4と同様の処理で第2グループ木構造グラフを生成できるため、説明を省略する。
図10を参照し、個人プロファイル生成装置1のプロファイル生成処理について、詳細に説明する(適宜図2参照)。
個人プロファイル生成装置1は、プロファイル生成手段50によって、アクセス履歴情報からキーワードを抽出する(ステップS11)。
個人プロファイル生成装置1は、プロファイル生成手段50によって、上位係数αと下位係数βとが乗じられた重みが閾値以下になるまで、その重みをグループ木構造グラフCのノードに加える(ステップS12)。
以上の手順により、個人プロファイル生成装置1は、個人プロファイルを生成できる。
図11を参照し、コンテンツ推薦装置2のコンテンツ推薦処理について、詳細に説明する(適宜図2参照)。
コンテンツ推薦装置2は、コンテンツ推薦手段70によって、ステップS21でベクトル化された個人プロファイルと推薦対象プロファイルとの一致度を算出する(ステップS22)。
コンテンツ推薦装置2は、コンテンツ推薦手段70によって、ステップS22で算出した一致度が閾値以上であるか否かを判定する(ステップS23)。
一致度が閾値未満の場合(ステップS23でNo)、又は、ステップS24の処理後、コンテンツ推薦手段70は、処理を終了する。
以上の手順により、コンテンツ推薦装置2は、コンテンツを推薦できる。
また、前記した実施形態では、番組に関するコンテンツを推薦することとして説明したが、本願発明による個人プロファイルを用いて、番組以外のコンテンツ、例えばイベント情報、商品情報などを推薦することもできる。
2 コンテンツ推薦装置
10 初期グラフ生成手段
20 グループ化手段
30 グループ木構造グラフ生成手段
40 グループ木構造グラフDB
50 プロファイル生成手段
60 プロファイルDB
70 コンテンツ推薦手段
Claims (6)
- 第1キーワード同士がリンクされたリンク付きコーパスから、個人の嗜好に適応した個人プロファイルを生成する個人プロファイル生成装置であって、
前記リンク付きコーパスの第1キーワードをノードとして、リンクされた前記第1キーワード同士をエッジとして接続した第1初期グラフを生成する初期グラフ生成手段と、
予め設定された終了条件を満たすまで前記第1初期グラフを再帰的にグループ化することで、木構造における前記ノードの位置を表した位置情報が付加された第1グループ化グラフを生成するグループ化手段と、
前記位置情報に基づいて前記第1グループ化グラフの各ノードを配置することで、前記第1グループ化グラフから、上位概念及び下位概念となる前記ノード同士が木構造で階層化された第1グループ木構造グラフを生成するグループ木構造グラフ生成手段と、
前記個人が興味を持つコンテンツの内容を表す個人興味情報に基づいて、前記個人の嗜好を表した重みを前記第1グループ木構造グラフのノードに伝搬させることで、前記個人プロファイルを生成するプロファイル生成手段と、を備えることを特徴とする個人プロファイル生成装置。 - 前記グループ化手段は、前記ノード間の連結粗密情報による再帰的グループ化処理を前記第1初期グラフに施すことを特徴とする請求項1に記載の個人プロファイル生成装置。
- 前記プロファイル生成手段は、
前記個人興味情報に含まれる第2キーワードを抽出し、
抽出した前記第2キーワードに一致する前記第1グループ木構造グラフのノードである基準ノードに所定の重みを加え、
前記基準ノードから前記第1グループ木構造グラフの各ノードに到るまで階層が1つ上がる毎に予め設定された1以下の上位係数と前記階層が1つ下がる毎に予め設定された1以下の下位係数とが乗じられた重みを算出し、
算出した当該重みが予め設定された閾値以下になるまで、算出した当該重みを前記第1グループ木構造グラフの各ノードに加えることを特徴とする請求項1又は請求項2に記載の個人プロファイル生成装置。 - 前記初期グラフ生成手段は、推薦対象となるコンテンツの内容を表す推薦対象情報に含まれる第3キーワードのうち、前記第1キーワードに一致するものを抽出し、抽出された前記第3キーワードをノードとして、前記第1キーワード同士のリンクにより前記第3キーワード同士をエッジとして接続した第2初期グラフを生成し、
前記グループ化手段は、前記終了条件を満たすまで前記第2初期グラフを再帰的にグループ化することで、前記位置情報が付加された第2グループ化グラフを生成し、
前記グループ木構造グラフ生成手段は、前記位置情報に基づいて前記第2グループ化グラフの各ノードを配置することで、前記第2グループ化グラフから、上位概念及び下位概念となる前記ノード同士が木構造で階層化された第2グループ木構造グラフを生成し、
前記プロファイル生成手段は、前記第2グループ木構造グラフのノードに重み付けを行うことで、推薦対象プロファイルを生成することを特徴とする請求項1から請求項3の何れか一項に記載の個人プロファイル生成装置。 - 請求項4に記載の個人プロファイル生成装置と、
前記個人プロファイルと前記推薦対象プロファイルとの一致度を算出し、算出した前記一致度の閾値判定によって、前記推薦対象のコンテンツを前記個人に推薦するか否かを判定するコンテンツ推薦手段と、を備えることを特徴とするコンテンツ推薦装置。 - コンピュータを、請求項1から請求項4の何れか一項に記載の個人プロファイル生成装置として機能させるための個人プロファイル生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015013057A JP6450203B2 (ja) | 2015-01-27 | 2015-01-27 | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015013057A JP6450203B2 (ja) | 2015-01-27 | 2015-01-27 | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016139229A JP2016139229A (ja) | 2016-08-04 |
JP6450203B2 true JP6450203B2 (ja) | 2019-01-09 |
Family
ID=56560246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015013057A Expired - Fee Related JP6450203B2 (ja) | 2015-01-27 | 2015-01-27 | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6450203B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6739379B2 (ja) * | 2017-03-10 | 2020-08-12 | ヤフー株式会社 | 情報処理装置、情報処理方法、プログラム、および広告情報処理システム |
JP7099976B2 (ja) * | 2019-03-22 | 2022-07-12 | 株式会社日立製作所 | 情報管理装置および情報管理方法 |
CN110347926A (zh) * | 2019-07-15 | 2019-10-18 | 北京百度网讯科技有限公司 | 用于推送信息的方法和装置 |
KR20220043534A (ko) * | 2020-09-29 | 2022-04-05 | 삼성전자주식회사 | 컨텐츠 추천 서비스를 제공하는 전자 장치 및 그 방법 |
CN113268629B (zh) * | 2021-04-29 | 2023-01-03 | 西安交通大学 | 一种融合节点偏好的异构图歌单多标签推荐方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7657907B2 (en) * | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
US7873616B2 (en) * | 2006-07-07 | 2011-01-18 | Ecole Polytechnique Federale De Lausanne | Methods of inferring user preferences using ontologies |
-
2015
- 2015-01-27 JP JP2015013057A patent/JP6450203B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016139229A (ja) | 2016-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6450203B2 (ja) | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 | |
US7519588B2 (en) | Keyword characterization and application | |
JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
US20080301133A1 (en) | Location recognition using informative feature vocabulary trees | |
US8812504B2 (en) | Keyword presentation apparatus and method | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
WO2008016102A1 (fr) | dispositif de calcul de similarité et dispositif de recherche d'informations | |
CN108280114A (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
JP6472573B2 (ja) | データ分析手法候補決定装置 | |
JP5477635B2 (ja) | 情報処理装置および方法、並びにプログラム | |
KR102059743B1 (ko) | 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템 | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
CN105005616A (zh) | 基于文本图片特征交互扩充的文本图解方法及系统 | |
CN110110220A (zh) | 融合社交网络和用户评价的推荐模型 | |
JP2006318398A (ja) | ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP2019128925A (ja) | 事象提示システムおよび事象提示装置 | |
Peiris et al. | Synthesis and evaluation of a domain-specific large data set for dungeons & dragons | |
JP2012185654A (ja) | 翻訳装置、翻訳プログラムおよび翻訳方法 | |
JP4266584B2 (ja) | テキストデータ群生成装置、テキストデータ群生成方法、プログラムおよび記録媒体 | |
Nio et al. | Improving the robustness of example-based dialog retrieval using recursive neural network paraphrase identification | |
CN113392245A (zh) | 一种用于众测任务发布的文本摘要与图文检索生成方法 | |
JP4982542B2 (ja) | 共起行列生成装置、共起行列生成方法、共起行列生成プログラムおよびそのプログラムを記録した記録媒体 | |
JP6632564B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP2010015394A (ja) | リンク先提示装置およびコンピュータプログラム | |
JP4314271B2 (ja) | 単語間関連度算出装置、単語間関連度算出方法及び単語間関連度算出プログラム並びにそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6450203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |