JP2017059255A - 推定装置、推定方法及び推定プログラム - Google Patents

推定装置、推定方法及び推定プログラム Download PDF

Info

Publication number
JP2017059255A
JP2017059255A JP2016238717A JP2016238717A JP2017059255A JP 2017059255 A JP2017059255 A JP 2017059255A JP 2016238717 A JP2016238717 A JP 2016238717A JP 2016238717 A JP2016238717 A JP 2016238717A JP 2017059255 A JP2017059255 A JP 2017059255A
Authority
JP
Japan
Prior art keywords
information
content
feature
time
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016238717A
Other languages
English (en)
Other versions
JP6692739B2 (ja
Inventor
俊平 大倉
Shumpei Okura
俊平 大倉
一真 村尾
Kazuma Murao
一真 村尾
秀平 宇野
Shuhei Uno
秀平 宇野
真吾 星野
Shingo Hoshino
真吾 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016238717A priority Critical patent/JP6692739B2/ja
Publication of JP2017059255A publication Critical patent/JP2017059255A/ja
Application granted granted Critical
Publication of JP6692739B2 publication Critical patent/JP6692739B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】コンテンツの重要度の推定精度を向上させること。【解決手段】本願に係る推定装置は、コンテンツに関する所定の定常情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づき、所定の時刻における当該コンテンツの特徴を示す特徴情報を、入力された情報から当該情報が有する特徴を抽出する学習器を用いて抽出する抽出部を有することを特徴とする。【選択図】図1

Description

本発明は、推定装置、推定方法及び推定プログラムに関する。
近年、インターネットを介して、ニュースや広告等のコンテンツを配信する技術が知られている。このようなコンテンツを配信する技術の一例として、コンテンツの内容やコンテンツの新しさに基づいて、コンテンツの重要度を推定し、推定した重要度が高いコンテンツを優先的に表示する技術が知られている。例えば、このような技術では、コンテンツの内容に基づいた重要度を予め推定し、推定した重要度を時間の経過に伴い減衰させることで、新たなコンテンツを優先的に表示する。
特開2015−99265号公報
しかしながら、上記の従来技術では、コンテンツの重要度を適切に推定することができるとは限らないという問題がある。例えば、コラム等のコンテンツは、ニュース等のコンテンツと比較して、新しさがあまり重要ではないため、時間が経過しても重要度があまり変化しない。このため、各コンテンツの重要度を一律に減衰させた場合は、実際の重要度との間で乖離が生じる場合がある。また、時間の経過に伴う重要度の減衰をあらかじめ考慮して重要度をあらかじめ推定するモデルが考えられる。しかしながら、コンテンツの種別によっては、時間が経過してから真の重要度が判明するコンテンツ等も存在するため、このようなモデルの学習は、困難である。
本願は、上記に鑑みてなされたものであって、コンテンツの重要度の推定精度を向上させることを目的とする。
本願に係る推定装置は、コンテンツに関する所定の定常情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づき、所定の時刻における当該コンテンツの特徴を示す特徴情報を、入力された情報から当該情報が有する特徴を抽出する学習器を用いて抽出する抽出部を有することを特徴とする。
実施形態の一態様によれば、コンテンツの重要度の推定精度を向上させることができるという効果を奏する。
図1は、実施形態に係る情報配信処理が実行する処理の一例を示す図である。 図2は、実施形態に係る情報配信装置が有する機能構成の一例を示す図である。 図3は、実施形態にかかるコンテンツデータベースに登録される情報の一例を示す図である。 図4は、実施形態にかかる実績情報データベースに登録される情報の一例を示す図である。 図5は、実施形態に係る学習器データベースに登録される情報の一例を示す図である。 図6は、実施形態にかかる特徴情報データベースに登録される情報の一例を示す図である。 図7は、実施形態にかかるコンテンツデータベースに登録される情報の一例を示す図である。 図8は、実施形態にかかる情報配信装置が特徴情報を抽出する処理の一例を示す図である。 図9は、実施形態にかかる端末装置が優先度に応じてコンテンツを表示する処理の一例を説明する図である。 図10は、実施形態にかかる情報配信装置がコンテンツの投稿を受付ける処理の流れの一例を示すフローチャートである。 図11は、実施形態にかかる情報配信装置が事項する推定処理の流れの一例を示すフローチャートである。 図12は、実施形態に係る情報配信装置による情報配信処理の一例を示すフローチャートである。 図13は、情報配信装置の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
以下に、本願に係る推定装置、推定方法及び推定プログラムを実施するための形態(以下、「実施形態」と呼ぶ。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る推定装置、推定方法及び推定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.情報配信装置の一例〕
まず、図1を用いて、推定装置の一例である情報配信装置10の一例について説明する。図1は、実施形態に係る情報配信処理が実行する処理の一例を示す図である。図1では、情報配信装置10が実行する処理の一例として、コンテンツの配信元から投稿を受付けたコンテンツの重要度を、所定の時間帯ごとに推定する推定処理と、利用者U01が使用する端末装置100に、推定した重要度に応じた順序で表示させる情報配信処理との一例について説明する。
ここで、情報配信装置10が配信するコンテンツとは、所定のクライアントが情報配信装置10に登録するコンテンツであり、例えば、ニュースやコラム等のテキストを含むコンテンツである。なお、以下の説明では、情報配信装置10がテキストを含むコンテンツの配信を行う例について説明するが、実施形態はこれに限定されるものではない。すなわち、以下に説明する情報配信処理は、例えば、画像や動画像等のテキストを含まないコンテンツや営利若しくは非営利の広告に関するコンテンツ、ゲーム、メール、ツイート、ブログの記事等、端末装置100に対して配信可能な任意のコンテンツに対して適用可能である。
図1に示すように、情報配信装置10は、図示しないネットワーク(例えば、インターネット)を介して、利用者U01が使用する端末装置100と、クライアントが使用するクライアント端末200と通信可能に接続される。また、情報配信装置10は、端末装置101やログサーバ102とネットワークを介して通信可能に接続される。なお、情報配信装置10は、任意の数の端末装置100、101、ログサーバ102、およびクライアント端末200と通信可能である。
端末装置100は、利用者U01によって利用される情報処理装置であり、ユーザがニュースやコラム等のコンテンツを閲覧するために利用される。具体例を挙げると、端末装置100は、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。
端末装置101は、端末装置100と同様に、利用者U01によって利用される情報処理装置である。なお、端末装置101は、端末装置100と同一の装置であってもよい。ここで、端末装置100は、コンテンツに関する各種のログをログサーバ102に対して送信する。一方、ログサーバ102は、サーバ装置等により実現される情報処理装置であり、端末装置101や、図示を省略した他の端末装置等から、配信されたコンテンツに関する各種のログを収集し、収集した情報に基づくログの実績情報を情報配信装置10へと送信する。
ここで、コンテンツに関する各種のログとは、例えば、コンテンツが閲覧されたか否か、コンテンツがタップされる等選択されたか否か、所定のウェブページからコンテンツやコンテンツが配置されたウェブページに対するリンクが設定されたか否かといった情報である。また、コンテンツに関する各種のログとは、Web検索エンジン等を利用してコンテンツが検索されたか否か、ショートメッセージサービスやマイクロブログ等でコンテンツに関する情報が発信(ツイート等)されたか否か等を示すログである。
このようなログを取得した場合、ログサーバ102は、コンテンツ毎の実績情報を生成する。例えば、ログサーバ102は、コンテンツの閲覧回数(インプレッション数)、コンテンツの選択回数、CTR(Click Through Rate)、コンテンツを対象として設定されたリンクの数、コンテンツの検索回数、コンテンツを含む情報を含む発信回数等を、実績情報として情報配信装置10へと送信する。すなわち、ログサーバ102は、コンテンツに関する情報のうち、時間の経過に応じて変化する情報である変動情報として、各種の実績情報を情報配信装置10へと送信する。
なお、ログサーバ102が収集するログの種別や、情報配信装置10へと送信する実績情報の内容は、上述した例に限定されるものではない。すなわち、ログサーバ102は、時間の経過に応じて変化する情報であれば、任意の情報を、実績情報として情報配信装置10へと送信してよい。
クライアント端末200は、配信対象となるコンテンツを情報配信装置10に登録する端末装置である。例えば、クライアント端末200は、コンテンツの生成、編集、配信等を行うクライアントが使用する情報処理装置であり、PDA等の移動端末や、PC、サーバ等である。
情報配信装置10は、クライアント端末200から登録されたコンテンツを記憶し、端末装置100からコンテンツの配信要求を受付けると、記憶したコンテンツを端末装置100に対して配信する情報処理装置である。例えば、情報配信装置10は、PC、サーバ、クラウドシステム等の物理的若しくは仮想的な情報処理装置により実現される。
ここで、情報配信装置10が配信するコンテンツには、コンテンツの内容、コンテンツが登録されてから経過した時間(すなわち、情報鮮度)等に応じた重要度が推定される。そして、情報配信装置10は、推定された重要度が高いコンテンツを優先的に配信する。この結果、端末装置100は、優先度がより高いコンテンツを優先的に表示する。
〔1−1.情報配信処理〕
ここで、従来技術では、コンテンツの登録時にコンテンツの内容に基づいてコンテンツの重要度の初期値を推定し、推定した重要度を時間の経過に伴い減衰させた。しかしながら、配信対象となるコンテンツには、ニュース等、情報鮮度が重要視されるコンテンツだけではなく、コラム等、情報鮮度が重要視されないコンテンツ等も含まれる。また、コンテンツの中には、投稿されてからある程度時間が経過した後に、価値が見いだされた結果、リツイート等が頻繁に行われ、重要性が上昇するといったコンテンツも存在する。このため、各コンテンツの重要度を一律の基準で算出した場合や、時間の経過と共に重要度を減衰させた場合には、算出される重要度の値が、各コンテンツが有する実際の重要性と乖離してしまう。
また、コンテンツの投稿時に、時間の経過に伴う重要性の変化を考慮した重要度の初期値を算出するモデルを利用する手法が考えられる。しかしながら、配信対象となるコンテンツは、それぞれ異なる態様で重要性が変動するので、各コンテンツの重要度の初期値を適切に算出するモデルを学習するのは、困難である。
そこで、情報配信装置10は、以下の推定処理を実行する。例えば、情報配信装置10は、コンテンツに関する所定の情報をコンテンツの定常情報として取得する。例えば、情報配信装置10は、コンテンツに含まれるテキスト、画像、音声等の内容、コンテンツの配信元等の提供主、コンテンツが属する著者等、コンテンツに関する情報のうち、時間の経過に応じた変化が少ない情報等の少なくともいずれか1つを記事情報として取得する。なお、情報配信装置10は、コンテンツに関する情報のうち、コンテンツを配信する前に特定可能な情報等、以下に説明する変動情報と比較して、時間の経過に応じて変化が少ない情報であれば、任意の情報を記事情報として採用可能である。
また、情報配信装置10は、コンテンツに関する情報のうち時間の経過に応じて変化する情報、すなわち、所定の時間帯ごとに値が変動しうる情報をコンテンツの変動情報として取得する。例えば、情報配信装置10は、ログサーバ102が収集した実績情報を変動情報として取得する。より具体的には、情報配信装置10は、コンテンツが閲覧された回数(インプレッション数)、コンテンツが選択された回数、コンテンツに対するリンクの数、コンテンツの検索回数、コンテンツに関する情報が発信された回数等の少なくともいずれか1つを実績情報として取得する。
そして、情報配信装置10は、入力された情報から当該情報が有する特徴を抽出する学習器Leを用いて、定常情報と変動情報とに基づき、所定の時刻におけるコンテンツの特徴を示す特徴情報を新たに抽出する。すなわち、情報配信装置10は、コンテンツに関する所定の情報であって、変動情報よりも時間の経過に応じて変化が少ない定常情報と、変動情報とに基づいて、所定の時刻におけるコンテンツの特徴を抽出する。そして、情報配信装置10は、特徴情報に基づいて、所定の時刻におけるコンテンツの重要度を推定する。
例えば、情報配信装置10は、時刻tnにおけるコンテンツの重要度wnを推定する場合は、学習器Leを用いて、コンテンツの定常情報と、時刻tnまでの間に取得された変動情報との組に基づいて、時刻tnにおけるコンテンツの特徴を示す特徴情報ynを抽出し、抽出した特徴情報ynから時刻tnにおけるコンテンツの重要度wnを推定する。また、情報配信装置10は、時刻tn+1におけるコンテンツの重要度wn+1を推定する場合は、学習器Leを用いて、コンテンツの定常情報と、時刻tn+1までの間に取得された変動情報との組に基づいて、時刻tn+1におけるコンテンツの特徴を示す特徴情報yn+1を抽出し、抽出した特徴情報から時刻tn+1におけるコンテンツの重要度wn+1を推定する。より具体的には、情報配信装置10は、特徴情報ynと、時刻tn+1までの間に取得された変動情報との組から、時刻tn+1におけるコンテンツの特徴を示す特徴情報yn+1を抽出し、抽出した特徴情報から時刻tn+1におけるコンテンツの重要度wn+1を推定する。
このように、情報配信装置10は、コンテンツの配信前に特定可能な情報から重要度を推定し、時間の経過と共に重要度を減衰させるのではなく、各時刻(若しくは、時間帯)ごとに、コンテンツの定常情報とそれまでの変動情報とに基づいて、その時刻におけるコンテンツの特徴を抽出し直す。より具体的には、情報配信装置10は、定常情報と変動情報とに基づいて、所定の時刻におけるコンテンツの特徴を抽出する。
このため、情報配信装置10は、コンテンツの重要度の推定精度を向上させることができる。例えば、ニュース等の情報鮮度が重要視されるコンテンツでは、時間の経過と共に、インプレッション数や検索数が少なくなると考えられる。一方、コラム等の情報鮮度があまり重要視されないコンテンツでは、時間の経過に係らず、インプレッション数や検索数が一定の値を保ったり、上昇したりする場合があると考えられる。
そこで、情報配信装置10は、各時刻におけるコンテンツの特徴を、定常情報と変動情報との特徴に基づいて抽出し直す。そして、情報配信装置10は、各時刻ごとに抽出し直したコンテンツの特徴から重要度を推定する。このため、情報配信装置10は、コンテンツごとに重要性の指標が異なったり、時間経過に伴う重要性の変化の態様が異なる場合にも、重要性を適切に反映した重要度を推定することができる。
〔1−2.学習器について〕
ここで、情報配信装置10は、入力された情報から、その情報が有する特徴を抽出するように学習が行われた学習器Leを用いて、定常情報と変動情報との特徴を抽出し、抽出した特徴を示す情報をコンテンツの特徴情報とする。例えば、情報配信装置10は、ニューラルネットワーク、オートエンコーダ、及びディープラーニング等、入力データに対する演算結果を出力する複数のノードを多層に接続し、入力された情報の次元数を圧縮することで、入力された情報が有する特徴を抽出する学習器Leを用いて、特徴情報を抽出する。
より具体的な例を説明する。例えば、情報配信装置10は、入力された情報の次元数を圧縮してその情報が有する特徴を示す特徴情報を抽出し、抽出した特徴情報から入力された情報を復元するように学習が行われたオートエンコーダを学習器Leとして記憶する。このような学習器Leには、入力される情報を受付ける入力層と、入力層よりも少ない数のノードが配置される中間層と、特徴情報から復元された情報を出力する出力層とを有し、各層のノードが隣接する層のノードと所定の接続係数が設定された経路を介して接続される。
ここで、中間層には、入力層よりも少ない数のノードが配置されているため、中間層が出力するデータは、学習器Leに入力されるデータの次元数を圧縮したデータとなり、出力層が出力するデータは、次元数を圧縮したデータから再現されたデータであって、入力されたデータと同じ次元数を有するデータとなる。このため、入力された情報の特徴を失わないように、学習器Leが入力情報の次元数を圧縮できるのであれば、学習器Leに入力された情報と、学習器Leが復元した情報とは、同一若しくは類似する情報になると考えられる。
そこで、情報配信装置10は、定常情報と実績情報と時刻を示す時刻情報との組が入力されると、入力された情報の組の次元数を圧縮した情報を抽出し、抽出した情報から入力された情報の組を再現するよう接続係数を修正した学習器Leを取得する。このような学習器Leは、入力された情報の組を再現するために暗に必要な情報、すなわち、定常情報と実績情報と時刻情報との組が有する特徴を示す特徴情報を中間層で抽出することとなる。
このため、情報配信装置10は、定常情報と実績情報と時刻情報とを、複数次元の情報である分散表現に変換し、定常情報と実績情報と時刻情報との分散表現の組を学習器Leに入力する。そして、情報配信装置10は、学習器Leが有する中間層が出力した情報を、時刻情報が示す時刻又は時間帯において、定常情報と実績情報との組が有する特徴、すなわち、コンテンツの特徴を示す特徴情報として取得する。
〔1−3.RNN(Recurrent Neural Networks)について〕
ここで、学習器Leが定常情報と実績情報と時刻情報との組から抽出した特徴情報には、定常情報の特徴と実績情報の特徴と時刻情報の特徴とが反映されている。そこで、情報配信装置10は、所定の時刻よりも前の時刻におけるコンテンツの特徴を示す情報として抽出された特徴情報と、所定の時刻よりも前の時刻における変動情報との組から、所定の時刻におけるコンテンツの特徴情報を抽出する。
例えば、情報配信装置10は、時刻「tn−1」におけるコンテンツの特徴を示す特徴情報として抽出された特徴情報、すなわち、前回抽出した特徴情報「yn−1」と、時刻「tn−1」から時刻「tn」までの間の実績情報と、時刻「tnを示す時刻情報とを学習器Leに入力することで、時刻「tn」におけるコンテンツの特徴情報「yn」を抽出する。そして、情報配信装置10は、抽出した特徴情報「yn」に基づいて、時刻「tn」におけるコンテンツの重要度「wn」を推定する。
上述した処理を実行する場合、例えば、情報配信装置10は、時刻「tn」におけるコンテンツの特徴を示す特徴情報「yn」を抽出した際に、抽出した特徴情報「yn」を所定の記憶装置に保持し、保持した特徴情報「yn」と、時刻「tn」から時刻「tn+1」までの間の実績情報と、時刻「tn+1」を示す時刻情報とを学習器Leに入力することで、時刻「tn+1」におけるコンテンツの特徴情報「yn+1」を抽出してもよい。また、情報配信装置10は、中間層が出力した情報を一次的に蓄積し、蓄積した情報を入力層へと伝達する蓄積層を有する学習器Le、すなわちRNNを用いることで、新たなコンテンツの特徴情報を抽出してもよい。
例えば、RNNによって実現される学習器Leは、中間層において時刻「tn」におけるコンテンツの特徴情報「yn」を抽出すると、抽出した特徴情報「yn」を出力するとともに、蓄積層に保持する。また、情報配信装置10は、学習器Leに対し、時刻「tn」から時刻「tn+1」までの間の実績情報と、時刻「tn+1」を示す時刻情報とを学習器Leに入力する。このような場合、学習器Leは、蓄積層が蓄積した情報、すなわち、時刻「tn」におけるコンテンツの特徴情報「yn」と、時刻「tn」から時刻「tn+1」までの間の実績情報と、時刻「tn+1」を示す時刻情報とを入力された情報として、時刻「tn+1」におけるコンテンツの特徴情報「yn+1」を抽出する。このため、情報配信装置10は、新たな実績情報を随時入力するだけで、新たなコンテンツの特徴情報を抽出することができる。
〔1−4.推定手法について〕
また、情報配信装置10は、抽出したコンテンツの特徴情報から、コンテンツの重要度を推定する際、任意の手法により、コンテンツの重要度を推定することができる。例えば、学習器Leを用いて抽出されるコンテンツの特徴情報は、複数次元の情報として抽出される。そこで、情報配信装置10は、特徴情報が有する各次元の情報が示す素性を推定するモデルを用いて、抽出された特徴情報からコンテンツの素性を示す素性情報を推定し、推定した素性情報からコンテンツの重要度を推定するモデルを用いて、コンテンツの重要度を推定してもよい。
例えば、情報配信装置10は、特徴情報が有する各次元の情報がどのような素性を示しているかを推定するモデルを生成する。そして、情報配信装置10は、生成したモデルを用いて、特徴情報から素性情報を推定し、推定した素性情報に基づくコンテンツの重要度を推定すればよい。また、情報配信装置10は特徴情報から素性情報を推定し、推定した素性情報からコンテンツの重要度を推定するように学習が行われた、ニューラルネットワークやDNN等の学習器を用いてもよい。
以下、図1を用いて、上述した処理を実行する情報配信装置10が実行する推定処理の一例と、情報配信処理の一例とについて説明する。
〔1−5.推定処理の一例〕
まず、情報配信装置10が実行する推定処理について説明する。例えば、情報配信装置10は、クライアント端末200からコンテンツの投稿を受付ける(ステップS1)。より具体的には、情報配信装置10は、コンテンツの内容と共に、コンテンツの配信元、コンテンツが属するカテゴリ、コンテンツの著者等、コンテンツの属性を示す各種の情報を含む記事情報「x」を受付ける。
かかる場合、情報配信装置10は、記事情報を記憶するとともに、tf−idf(Term Frequency - Inverse Document Frequency)、Key-Value方式、W2V(Word 2 Vector)等の技術を用いて、記事情報「x」から複数次元の情報を生成する。すなわち、情報配信装置10は、定常情報である記事情報「x」の分散表現「y0」を生成する(ステップS2)。
続いて、情報配信装置10は、ログサーバ102から、各コンテンツのインプレッション数や選択回数等、コンテンツに関する各種の実績情報を収集する(ステップS3)。例えば、情報配信装置10は、時刻「t1」におけるコンテンツの実績情報「h1」を収集する。
そして、情報配信装置10は、分散表現「y0」と、時刻「t1」を示す時刻情報「t1」と、コンテンツの実績情報「h1」とを学習器Leに入力することで、時刻「t1」におけるコンテンツの特徴を示す特徴情報「y1」を生成する(ステップS4)。また、情報配信装置10は、所定のモデルや学習器等を用いて、特徴情報「y1」から時刻「t1」におけるコンテンツの素性を示す素性情報「z1」を推定し、推定した素性情報「z1」から、時刻「t1」におけるコンテンツの重要度である推定重要度「w1」を推定する(ステップS5)。
また、情報配信装置10は、所定の時間帯毎に、前回抽出した特徴情報と、新たに収集した実績情報とに基づいて、特徴情報を新たに生成し直し、推定重要度をその都度推定する(ステップS6)。より具体的には、情報配信装置10は、時刻「t1」から「t2」までの間におけるコンテンツの実績情報「h2」を収集し、時刻「t2」を示す時刻情報「t2」と、実績情報「h2」と、前回抽出した特定情報「y1」を学習器Leに入力することで、時刻「t2」におけるコンテンツの特徴を示す特徴情報「y2」を生成する。また、情報配信装置10は、所定のモデルや学習器等を用いて、特徴情報「y2」から時刻「t2」におけるコンテンツの素性を示す素性情報「z2」を推定し、推定した素性情報「z2」から、時刻「t2」におけるコンテンツの重要度である推定重要度「w2」を推定する。
同様に、情報配信装置10は、時刻「t2」から「t3」までの間におけるコンテンツの実績情報「h3」を収集し、時刻情報「t3」と、実績情報「h3」と、前回抽出した特定情報「y2」を学習器Leに入力することで、時刻「t3」におけるコンテンツの特徴を示す特徴情報「y3」を生成する。また、情報配信装置10は、特徴情報「y3」から時刻「t3」におけるコンテンツの素性を示す素性情報「z3」を推定し、推定した素性情報「z3」から、時刻「t3」におけるコンテンツの重要度である推定重要度「w3」を推定する。
すなわち、情報配信装置10は、所定の時刻「tn」までの実績情報「hn」と、前回算出した特徴情報、すなわち、時刻「tn−1」におけるコンテンツの特徴を示す特徴情報「ynー1」とに基づいて、時刻「tn」におけるコンテンツの特徴を示す特徴情報「yn」を抽出する。そして、情報配信装置10は、抽出した特徴情報「yn」から、時刻「tn」におけるコンテンツの素性を示す素性情報「zn」を推定し、推定した素性情報「zn」から、時刻「tn」におけるコンテンツの重要度である推定重要度「wn」を推定する。
〔1−6.情報配信処理の一例〕
次に、情報配信装置10が実行する情報配信処理について説明する。例えば、情報配信装置10は、端末装置100からコンテンツの配信要求を受付ける(ステップS7)。このような場合、情報配信装置10は、利用者U01の属性やコンテンツの属性等から、配信対象となるコンテンツを選択し、選択したコンテンツのうち、推定重要度が高いコンテンツを優先的に配信する(ステップS8)。例えば、情報配信装置10は、選択したコンテンツについて、最後に推定した推定重要度が高い順にコンテンツを配信する。この結果、端末装置100は、推定重要度が高いコンテンツを優先的に表示することで(ステップS9)、適切な順序でコンテンツを利用者U01に閲覧させることができる。
〔2.情報配信装置の構成〕
次に、図2を用いて、実施形態にかかる情報配信装置10の構成について説明する。図2は、実施形態に係る情報配信装置が有する機能構成の一例を示す図である。図2に示すように、情報配信装置10は、通信部11と、記憶部12と、制御部13とを有する。通信部11は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部11は、ネットワークNと有線または無線で接続され、端末装置100、ログサーバ102、およびクライアント端末200との間で情報の送受信を行う。
〔2−1.記憶部が記憶するデータベース〕
記憶部12は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部12は、コンテンツデータベース14、実績情報データベース15、学習器データベース16、特徴情報データベース17、推定モデルデータベース18、重要度データベース19を記憶する。
コンテンツデータベース14には、クライアント端末200から登録を受付けたコンテンツが登録される。例えば、図3は、実施形態にかかるコンテンツデータベースに登録される情報の一例を示す図である。図3に示すように、コンテンツデータベース14は、「コンテンツID」、「コンテンツ内容」、「配信元」、「カテゴリ」、「著者」、「分散表現」といった項目を有する。なお、コンテンツデータベース14には、図3に示した情報以外にも、コンテンツの登録時において特定可能な任意の情報、すなわち、任意の定常情報が登録されていてよい。
「コンテンツID」は、登録されたコンテンツを識別する情報である。また、「コンテンツ内容」とは、コンテンツに含まれるテキスト等の情報である。なお、「コンテンツ内容」には、動画像、画像、音声等、テキスト以外の情報が含まれていてもよい。また、「配信元」とは、コンテンツの提供元、コンテンツの制作元、コンテンツを情報配信装置10に登録した登録元を示す情報である。なお、コンテンツが広告等である場合、「配信元」には、広告の提供元、広告代理店等の広告提供者、広告において宣伝等が行われる会社や個人等を示す情報となる。
「カテゴリ」は、例えばニュースやコラム等、コンテンツが属するカテゴリを示す情報である。また、「著者」は、コンテンツの制作者等を示す情報である。また、「分散表現」とは、コンテンツから抽出された情報であって、コンテンツの内容を示す複数次元の情報である。より具体的には、「分散表現」とは、「コンテンツ内容」、「配信元」、「カテゴリ」、「著者」等、コンテンツの定常情報である記事情報の内容を示す複数次元の情報である。
例えば、図3に示す例では、コンテンツID「ID1」、コンテンツ内容「コンテンツA」、配信元「配信元A」、カテゴリ「カテゴリA」、著者「著者A」、分散表現「分散表現A」が対応付けて登録されている。この情報は、コンテンツID「ID1」で示されるコンテンツの内容が「コンテンツA」であり、配信元が「配信元A」であり、著者が「著者A」であり、カテゴリ「カテゴリA」に属する旨を示す。また、この情報は、コンテンツID「ID1」で示されるコンテンツの記事情報の分散表現が「分散表現A」である旨を示す。
図2に戻り、実績情報データベース15は、各コンテンツの実績情報を記憶する。例えば、図4は、実施形態にかかる実績情報データベースに登録される情報の一例を示す図である。図4に示すように、実績情報データベース15には、「コンテンツID」、「日時」、「インプレッション数」、「クリック回数」、「ツイート数」といった項目を有する。なお、実績情報データベース15には、図4に示した情報以外にも、コンテンツに関する情報のうち、時間の経過に応じて変化する情報、すなわち、任意の変動情報が登録されていてよい。
「日時」は、対応付けられた各変動情報が収集された時間帯を示す。また、「インプレッション数」は、対応付けられた「日時」が示す時間帯においてコンテンツが閲覧された回数を示す。また、「クリック回数」は、対応付けられた「日時」が示す時間帯においてコンテンツが選択された回数を示す。また、「ツイート数」は、対応付けられた「日時」が示す時間帯においてコンテンツに関する情報が発信された回数を示す。
例えば、図4に示す例では、コンテンツID「ID1」、日時「2015/1/1/00:00〜00:59」、インプレッション数「1000」、クリック回数「300」、ツイート数「500」が対応付けて登録されている。また、図4に示す例では、コンテンツID「ID1」、日時「2015/1/1/01:00〜01:59」、インプレッション数「300」、クリック回数「10」、ツイート数「5」が登録されている。
この情報は、コンテンツID「ID1」で示されるコンテンツが、日時「2015/1/1/00:00〜00:59」の間において、「1000」回閲覧され、「300」回選択され、「500」回ツイートされた旨を示す。また、この情報は、コンテンツID「ID1」で示されるコンテンツが、日時「2015/1/1/01:00〜01:59」の間において、「300」回閲覧され、「10」回選択され、「5」回ツイートされた旨を示す。このように、コンテンツID「ID1」で示されるコンテンツは、時間の経過と共に、インプレッション数、クリック回数、ツイート数が共に大きく減少しているため、ニュース等、情報鮮度が重要なコンテンツであると考えられる。
一方、図4に示す例では、コンテンツID「ID2」、日時「2015/1/1/00:00〜00:59」、インプレッション数「300」、クリック回数「50」、ツイート数「5」が対応付けて登録されている。また、図4に示す例では、コンテンツID「ID2」、日時「2015/1/1/01:00〜01:59」、インプレッション数「350」、クリック回数「60」、ツイート数「50」が登録されている。
この情報は、コンテンツID「ID2」で示されるコンテンツが、日時「2015/1/1/00:00〜00:59」の間において、「300」回閲覧され、「50」回選択され、「5」回ツイートされた旨を示す。また、この情報は、コンテンツID「ID2」で示されるコンテンツが、日時「2015/1/1/01:00〜01:59」の間において、「350」回閲覧され、「60」回選択され、「50」回ツイートされた旨を示す。このように、コンテンツID「ID2」で示されるコンテンツは、時間の経過と共に人気が上昇し、インプレッション数、クリック回数、ツイート数が上昇しているため、情報鮮度があまり重要ではないコンテンツであると考えられる。
図2に戻り、学習器データベース16には、情報配信装置10がコンテンツの定常情報と変動情報とに基づいてコンテンツの特徴情報を抽出する際に使用する学習器Leが登録されている。より具体的には、学習器データベース16には、入力データに対する演算結果を出力する複数のノードを多層に接続した学習器であって、入力された情報の次元数を圧縮することで情報が有する特徴を示す特徴情報を抽出する学習器Leの各ノードを接続する経路に設定された接続係数が登録されている。
例えば、図5は、実施形態に係る学習器データベースに登録される情報の一例を示す図である。図5に示すように、学習器データベース16には、「ニューロンID」、「結合先ニューロンID」、「接続係数」といった項目を有する。「ニューロンID」は、学習器Leに含まれるノードであるニューロンを識別するための識別情報を示す。「結合先ニューロンID」は、「ニューロンID」に対応するニューロンと結合する他のニューロンを識別するための識別情報を示す。「接続係数」は、「ニューロンID」が示すニューロンと、「結合先ニューロンID」が示すニューロンとを接続する経路に設定された接続係数を示す。
例えば、図5に示す例では、学習器データベース16には、ニューロンID「N11」、ニューロンID「N21」、および接続係数「WA」が対応付けて登録されている。この情報は、ニューロンID「N11」に対応するニューロンが、ニューロンID「N21」に対応するニューロンと接続係数「WA」が設定された経路で接続されている旨を示す。このため、ニューロンID「N21」に対応するニューロンには、ニューロンID「N11」の出力に接続係数「WA」を積算した値が入力として伝達される。
図2に戻り、特徴情報データベース17は、各時間帯における各コンテンツの特徴情報を記憶する。例えば、図6は、実施形態にかかる特徴情報データベースに登録される情報の一例を示す図である。図6に示すように、特徴情報データベース17には、「コンテンツID」、「使用日時」、「特徴情報」が対応付けて登録されている。
ここで、「使用日時」とは、対応付けられた特徴情報が示す特徴がどの時間帯におけるコンテンツの特徴であるかを示す情報であり、対応付けられた特徴情報を抽出する際に用いた実績情報が収集された時間帯である。また、「特徴情報」とは、対応付けられた使用日時が示す時間帯の次の時間帯におけるコンテンツの特徴情報である。
例えば、図6に示す例では、特徴情報データベース17には、コンテンツID「ID1」、使用日時「2015/1/1/00:00〜00:59」、特徴情報「特徴情報y1」が対応付けて登録されている。この情報は、コンテンツID「ID1」で示されるコンテンツの特徴情報であって、「2015/1/1/00:00〜00:59」の間に収集された実績情報に基づいて抽出された特徴情報が、「特徴情報y1」である旨を示す。
図2に戻り、推定モデルデータベース18は、コンテンツの特徴情報からコンテンツの素性情報を推定し、推定した素性情報から推定重要度を推定する。例えば、推定モデルデータベース18には、情報配信装置10がモデルとして学習器Leと同様のニューラルネットワークを利用する場合、図5に示した学習器データベース16と同様の情報が登録される。なお、推定モデルデータベース18には、コンテンツの特徴情報からコンテンツの素性情報を推定し、推定した素性情報から推定重要度を推定するためのモデルであれば、任意の形式のモデルに関する情報が登録されていてよい。
重要度データベース19は、各時間帯における各コンテンツの重要度を記憶する。例えば、図7は、実施形態にかかるコンテンツデータベースに登録される情報の一例を示す図である。図7に示すように、重要度データベース19には、「コンテンツID」、「使用日時」、「推定重要度」が対応付けて登録されている。ここで、「推定重要度」とは、コンテンツの特徴情報が有する重要度を示す値である。
例えば、図7に示す例では、重要度データベース19には、コンテンツID「ID1」、使用日時「2015/1/1/00:00〜00:59」、推定重要度「推定重要度w1」が対応付けて登録されている。この情報は、コンテンツID「ID1」で示されるコンテンツの特徴情報であって、「2015/1/1/00:00〜00:59」の間に収集された実績情報に基づいて抽出された特徴情報から推定された推定重要度が、「推定重要度w1」である旨を示す。
〔2−2.制御部が有する構成の一例〕
図2に戻って、説明を続ける。制御部13は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、情報配信装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。
図2に示すように、制御部13は、受付部20、収集部21、生成部22、抽出部23、推定部24、配信部25を有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部13の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部13が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
受付部20は、クライアントからコンテンツの登録を受付ける。例えば、受付部20は、コンテンツの内容、配信元を示す情報、カテゴリ、著者等、コンテンツに関する所定の情報である定常情報を受付ける。このような場合、受付部20は、受付けたコンテンツの定常情報を、コンテンツデータベース14に登録する。
収集部21は、コンテンツに関する情報のうち時間に応じて変化する変動情報を収集する。例えば、収集部21は、ログサーバ102にアクセスし、インプレッション数、クリック回数、ツイート数等、コンテンツに関する実績情報を収集する。そして、収集部21は、ログが収集された時間帯と対応付けて、生成した実績情報を変動情報として実績情報データベース15に登録する。
生成部22は、コンテンツの定常情報を示す分散表現を生成する。例えば、生成部22は、新たなコンテンツが登録された場合は、tf−idfやW2V等の技術を用いて、新たに登録されたコンテンツの定常情報から、複数次元の情報(例えば、ベクトル)である分散表現を生成する。その後、生成部22は、生成した分散表現を、対応するコンテンツのコンテンツIDと対応付けてコンテンツデータベース14に登録する。
抽出部23は、コンテンツの定常情報と、コンテンツの変動情報とに基づき、所定の時刻におけるコンテンツの特徴を示す特徴情報を、入力された情報から特徴を抽出する学習器Leを用いて抽出する。より具体的には、抽出部23は、所定の時刻よりも前の時刻におけるコンテンツの特徴を示す情報として抽出された特徴情報と、所定の時刻よりも前の時刻における変動情報との組から、所定の時刻におけるコンテンツの特徴を示す特徴情報を抽出する。
例えば、抽出部23は、特徴情報データベース17を参照し、特徴情報が登録されていないコンテンツを特定する。続いて、抽出部23は、特定したコンテンツの分散表現をコンテンツデータベース14から取得し、取得した分散表現を学習器Leに入力することで、分散表現が有する特徴、すなわち、コンテンツが有する特徴を示す特徴情報を抽出する。そして、抽出部23は、抽出した特徴情報を特徴情報データベース17に登録する。
また、抽出部23は、所定の時刻におけるコンテンツの特徴を示す特徴情報を抽出する場合には、所定の時刻よりも前の時刻における変動情報を実績情報データベース15から読み出す。より具体的には、抽出部23は、前回コンテンツの特徴を示す特徴情報を抽出してから後の時間帯における変動情報を実績情報データベース15から読み出す。また、抽出部23は、前回抽出した特徴情報を特徴情報データベース17から読み出す。そして、抽出部23は、読み出した変動情報と特徴情報とに基づいて、所定の時刻におけるコンテンツの特徴を示す特徴情報を抽出し、抽出した特徴情報を特徴情報データベース17に登録する。
以下、抽出部23が実行する処理の一例について説明する。なお、以下の説明では、
日時「2015/1/1/02:00〜02:59」に含まれる日時を「t2」とする例について説明する。例えば、抽出部23は、日時「t2」までに収集された実績情報、すなわち、使用日時「2015/1/1/01:00〜01:59」を用いて抽出された特徴情報「y2」が登録されていないコンテンツを特徴情報データベース17から特定する。
また、抽出部23は、特定したコンテンツの実績情報のうち、日時「t2」までに取集された実績情報、すなわち、日時「2015/1/1/01:00〜01:59」の間に収集された実績情報「h2」を実績情報データベース15から取得する。また、抽出部23は、特定したコンテンツの特徴情報のうち、前回抽出された特徴情報、すなわち、日時「2015/1/1/00:00〜00:59」の間に収集された実績情報「h1」に基づいて抽出された特徴像法「y1」を特徴情報データベースから抽出する。そして、抽出部23は、特徴情報「y1」と実績情報「h2」と時刻情報「t2」との組を学習器Leに入力することで、時刻「t2」におけるコンテンツの特徴を示す特徴情報「y2」を抽出する。
なお、前回抽出した特徴情報に基づいて新たな特徴情報を抽出する場合、抽出部23は、RNNを用いて特徴情報の抽出を行ってもよい。例えば、図8は、実施形態にかかる情報配信装置が特徴情報を抽出する処理の一例を示す図である。例えば、コンテンツが登録された際や、登録されてからしばらく時間が経過するまでの間、コンテンツの実績情報が存在しないと考えられる。そこで、抽出部23は、図8中(A)に示すように、コンテンツの分散表現「y0」を学習器Leに入力する。
かかる場合、学習器Leは、中間層に向けて入力された分散表現の次元数を圧縮するとともに、中間層が出力する情報、すなわち、次元数を圧縮した分散表現から元の分散表現を復元する。このような学習器Leにおいては、入力された分散表現と復元された分散表現とが同一となるように、接続係数の値を修正することで、分散表現が有する特徴、すなわち、コンテンツの特徴情報を精度良く抽出するようになる。
そこで、抽出部23は、図8中(B)に示すように、コンテンツの分散表現「y0」を学習器Leに入力した際に学習器Leの中間層が出力した情報を、日時「t1」が示す時間帯におけるコンテンツの特徴情報「y1」とする。そして、抽出部23は、特徴情報「y1」を特徴情報データベース17に登録する。
ここで、学習器LeがRNNにより実現される場合、特徴情報「y1」は、入力層のノードと接続された蓄積層に保持される。そして、図8中(C)に示すように、抽出部23が、コンテンツの時刻情報「t2」と実績情報「h2」とを学習器Leに入力した場合、蓄積層に保持された特徴情報「y1」は、時刻情報「t2」と実績情報「h2」とともに学習器Leの入力層へと入力される。この結果、学習器Leは、図8中(D)に示すように、特徴情報「y1」と時刻情報「t2」と実績情報「h2」との組が有する特徴を特徴情報「y2」として抽出する。
図2に戻り、説明を続ける。推定部24は、抽出された所定の時刻における特徴情報に基づいて、所定の時刻におけるコンテンツの重要度を推定する。例えば、推定部24は、推定モデルデータベース18からモデルを読み出す。また、推定部24は、コンテンツごとに、特徴情報データベース17から最新の特徴情報を特定し、読み出したモデルを用いて、特定した特徴情報からコンテンツが有する素性を示す素性情報を推定し、素性情報から、所定の時刻におけるコンテンツの重要度を推定するモデルを用いて、所定の時刻におけるコンテンツの推定重要度を推定する。そして、推定部24は、推定した推定重要度と、特定した特徴情報と対応付けられた使用日時とを対応付けて重要度データベース19に登録する。なお、例えば、推定部24は、入力された情報の次元数を圧縮することで、特徴を抽出する学習器に特徴情報や素性情報を入力することで、推定重要度を推定してもよい。
配信部25は、推定重要度が高いコンテンツから優先的に利用者U01へとコンテンツを配信する。例えば、配信部25は、配信要求を受信すると、コンテンツデータベース14の定常情報や、利用者U01の属性等に基づくターゲティングを行い、配信対象とするコンテンツを選択する。
また、配信部25は、選択したコンテンツの配信要求を受信した際における推定重要度を重要度データベース19から特定し、特定した推定重要度の順に、選択したコンテンツを端末装置100へと配信する。例えば、日時「2015/1/1/02:00〜02:59」の時間帯においては、使用日時「2015/1/1/01:00〜01:59」と対応付けられた重要度が最新の推定重要度となる。このため、配信部25は、日時「2015/1/1/02:00〜02:59」の時間帯において、配信要求を受信した場合は、使用日時「2015/1/1/01:00〜01:59」と対応付けられた最新の推定重要度を特定し、特定した推定重要度に基づいて、コンテンツの配信を行う。
なお、配信部25は、コンテンツと特定した推定重要度とを合わせて端末装置10に配信し、推定重要度が高いコンテンツから優先的に表示させるよう、端末装置100を制御することで、推定重要度が高いコンテンツを優先的に利用者U01へと提供してもよい。
〔2−3.端末装置100における表示の一例〕
次に、図9を用いて、端末装置100が推定重要度に応じた優先度でコンテンツを表示する処理の一例について説明する。図9は、実施形態にかかる端末装置が優先度に応じてコンテンツを表示する処理の一例を説明する図である。なお、図9に示す例では、コンテンツとして、ニュースA、ニュースB、コラムCが配信された後で、ニュースDおよびニュースEが配信された際に端末装置100が表示する画面の一例を記載した。また、以下の説明では、端末装置100は、最大で4つのコンテンツを表示するものとする。
例えば、端末装置100には、投稿日が「2015/1/1/10:00」のニュースA、投稿日が「2015/1/1/09:00」のニュースB、および、投稿日が「2015/1/1/11:00」のコラムCが配信される。ここで、コラムよりもニュースの重要度がより高く、投稿日がより新しいコンテンツの重要度がより高くなるように、推定重要度を算出した場合、例えば、情報配信装置10は、ニュースAの推定重要度を「100」とし、ニュースBの推定重要度を「90」とし、コラムCの推定重要度を「30」とする。この結果、端末装置100は、図9の第1状態に示すように、各コンテンツの推定重要度の順、すなわち、ニュースA、ニュースB、およびコラムCの順で各コンテンツを表示することとなる。
ここで、ニュース等のコンテンツにおいては、情報鮮度が重要な素性となる。このため、情報配信装置10は、ニュースAおよびニュースBの情報鮮度が低下すると、ニュースAおよびニュースBの推定重要度を低下させることとなる。一方、コラム等のコンテンツにおいては、情報鮮度があまり重要な素性ではないため、情報配信装置10は、時間が経過してもコラムCの重要度をあまり低下させない。また、情報配信装置10は、投稿されてから所定の時間が経過した後に、コラムCのインプレッション数が上昇した場合等には、実績情報に基づいて、コラムCの重要度を新たに算出し直す。
このため、例えば、情報配信装置10は、ニュースAの推定重要度を「80」とし、ニュースBの推定重要度を「60」とし、コラムCの推定重要度を「50」とする。また、情報配信装置10は、新たなニュースDの推定重要度を「100」とする。この結果、端末装置100は、図9の第2状態に示すように、ニュースD、ニュースA、ニュースB、コラムCの順に表示する。
ここで、コラムCのインプレッション数やツイート数が上昇した結果、コラムCが人気のコンテンツになった場合は、情報配信装置10は、コラムCの推定重要度をより高い値に算出し直す。例えば、情報配信装置10は、コラムCの推定重要度を「50」から「70」に算出し直す。一方、ニュースA、B、D等のコンテンツは、時間の経過と共にインプレッション数やツイート数が低下する。このため、情報配信装置10は、ニュースAの推定重要度を「50」とし、ニュースBの推定需要度を「40」とし、ニュースDの推定重要度を「80」とする。また、情報配信装置10は、新たなニュースEの推定重要度を「100」とする。
この結果、端末装置100は、図9の第3状態に示すように、ニュースE、ニュースD、コラムC、ニュースAの順にコンテンツを表示する。すなわち、端末装置100は、ニュースBの表示を取りやめるとともに、時間が経過してから人気となったコンテンツであるコラムCを、投稿時にはコラムCより推定重要度が高かったニュースAよりも優先的に表示する。
このように、情報配信装置10は、定常情報と時刻情報とに基づいて、コンテンツの推定重要度を、各時間帯ごとに算出し直す。このため、例えば、情報配信装置10は、配信対象となるコンテンツに、情報鮮度が重要な素性であるコンテンツ、情報鮮度が重要ではないコンテンツ、投稿後に時間が経過してから人気が出るコンテンツ、一定の人気を保つコンテンツ、人気が徐々に低下するコンテンツ等、コンテンツの重要性が様々な態様で変化する場合にも、推定重要度を真の重要性に追従させることができる。
すなわち、コンテンツの重要性は、時間が経過するについてそれぞれ異なる態様で変動する。このため、従来技術のように、定常情報のみを用いてコンテンツの推定重要度を算出した場合は、推定重要度を真の重要性に追従させることができない。また、従来技術のように、閲覧実績等の変動情報のみを用いて重要度を推定した場合は、十分な閲覧実績が得られていない入稿直後のコンテンツについての重要度を精度良く推定できない。
しかしながら、情報配信装置10は、定常情報と変動情報とに基づいて、コンテンツの推定重要度を算出するので、入稿直後のコンテンツについても重要度を推定することができる。また、情報配信装置10は、変動情報が取得された場合は、取得された変動情報と定常情報とに基づいて、コンテンツの推定重要度を算出し直す。この結果、情報配信装置10は、入稿直後のコンテンツと、変動情報が取得可能なコンテンツとの間で、重要度の比較を行うことができる結果、投稿日時が異なる複数のコンテンツについても、配信時における実際の重要性に応じたコンテンツの配信を実現することができる。
〔2−4.学習器およびモデルの一例〕
次に、数式を用いて、情報配信装置20が使用する学習器Leおよびモデルの一例について説明する。なお、以下の説明では、時刻情報「k」が示す時刻における実績情報を「hk」、分散表現や特徴情報を「yk」、素性情報を「zk」、推定重要度を「wk」と記載する。また、以下の説明では、記事情報を「x」と記載する。なお、「x」は、記事情報を示す疎ベクトルとなる。
例えば、「k=0」の場合、コンテンツの、分散表現「y0」は、記事情報「x」から以下の式(1)により算出される。ここで、式(1)に示す「A」および「a」は、所定の行列である。すなわち、情報配信装置10は、行列「A」と記事情報「x」との積に行列「a」を加算した値を式(2)で示される関数に入力することで、分散表現「y0」を算出する。
Figure 2017059255
Figure 2017059255
続いて、情報配信装置20は、「k=1」の場合、すなわち、最初の実績情報「h1」が収集された場合には、分散表現「y0」と、時刻情報「t1」と、実績情報「h1」の組から特徴情報「y1」を抽出することとなる。また、情報配信装置20は、「k≧2」の場合、前回抽出した特徴情報「yk−1」と、時刻情報「k」と、実績情報「hk」との組から特徴情報「yk」を抽出する。
具体的には、情報配信装置20は、以下の式(3)を用いて、特徴情報「yk」を抽出することとなる。ここで、式(3)に示す「B」および「b」は、所定の行列である。すなわち、情報配信装置10は、特徴情報「yk−1」の転置行列と、時刻情報「k」の転置行列と、実績情報「hk」の転置行列とを並べた行列の転置行列を、行列「B」に積算した値と、行列「b」との和を式(2)で示す関数に入力することで、特徴情報「yk」を算出する。
Figure 2017059255
続いて、情報配信装置20は、以下に示す式(4)を用いて、時刻「k」における素性情報「zk」を算出する。ここで、式(4)に示す「C」および「c」は、所定の行列である。すなわち、情報配信装置10は、行列「C」と特徴情報「yk」との積に行列「c」を加算した値を、式(5)に示す関数に入力することで、時刻「k」における素性情報「zk」を算出する。
Figure 2017059255
Figure 2017059255
続いて、情報配信装置20は、以下に示す式(6)を用いて、時刻「k」における素性情報「zk」から、時刻「k」における推定重要度「wk」を算出する。ここで、式(6)に示す「D」および「d」は、所定の行列である。すなわち、情報配信装置10は、行列「D」と素性情報「zk」との積に行列「d」を加算した値を、推定重要度「wk」として算出する。
Figure 2017059255
なお、定常情報と変動情報とに基づいて、特徴情報を抽出する学習器Leの接続係数を修正する処理、および、特徴情報から推定情報を推定し、推定情報から推定重要度を推定するモデルを学習する処理は、上述した式(1)〜(6)に含まれる行列「A」〜「D」、および行列「a」〜「d」を適切な値に調整する処理となる。そこで、情報配信装置20は、確率的勾配降下法(SGD:Stochastic Gradient Descent)等の手法を用いて、行列「A」〜「D」、および行列「a」〜「d」の値を学習することで、推定重要度の推定精度を向上させることができる。
〔3.情報配信装置が実行する処理の手順〕
次に、図10〜図12を用いて、実施形態に係る情報配信装置10が実行する処理の流れの一例について説明する。まず、図10を用いて、コンテンツの投稿を受付けた際に実行する処理の流れについて説明する。図10は、実施形態にかかる情報配信装置がコンテンツの投稿を受付ける処理の流れの一例を示すフローチャートである。例えば、情報配信装置10は、クライアント端末20から、コンテンツの投稿を受付ける(ステップS101)。かかる場合、情報配信装置10は、コンテンツの定常情報の内容を示す分散表現を生成し(ステップS102)、処理を終了する。
次に、図11を用いて、コンテンツの推定重要度を推定する処理の流れについて説明する。図11は、実施形態にかかる情報配信装置が事項する推定処理の流れの一例を示すフローチャートである。例えば、情報配信装置10は、登録された各コンテンツの実績情報を収集する(ステップS201)。
続いて、情報配信装置10は、コンテンツごとに、前回抽出した特徴情報が存在するか否かを判定する(ステップS202)。そして、情報配信装置10は、前回抽出した特徴情報が存在しない場合は(ステップS202:No)、コンテンツの定常情報の分散表現と、実績情報との組の特徴情報を抽出する(ステップS203)。一方、情報配信装置10は、前回抽出した特徴情報が存在する場合は(ステップS202:Yes)、前回抽出した特徴情報と実績情報との組の特徴情報を抽出する(ステップS204)。
また、情報配信装置10は、ステップS203またはステップS204にて抽出した特徴情報から、コンテンツの素性を示す素性情報を推定し(ステップS205)、素性情報から推定重要度を推定する(ステップS206)。そして、情報配信装置10は、推定重要度を登録し(ステップS207)、処理を終了する。
次に、図12を用いて、実施形態に係る情報配信装置10が実行する情報配信処理の流れの一例について説明する。図12は、実施形態に係る情報配信装置による情報配信処理の一例を示すフローチャートである。例えば、情報配信装置10は、端末装置100から配信要求を受信したか否かを判定する(ステップS301)。そして、情報配信装置10は、配信要求を受信していない場合は(ステップS301:No)、受信するまで待機する。
一方、情報配信装置10は、配信要求を受信した場合は(ステップS301:Yes)、配信対象の候補となるコンテンツを選択する(ステップS302)。また、情報配信装置10は、選択したコンテンツの推定重要度を特定する(ステップS303)。そして、情報配信装置10は、コンテンツと推定重要度とを端末装置100に配信し、推定重要度に応じた優先度順に、各コンテンツを表示させ(ステップS304)、処理を終了する。
〔5.変形例〕
上述した実施形態に係る情報配信装置10は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の情報配信装置10の他の実施形態について説明する。
〔5−1.学習器について〕
上述した説明では、情報配信装置10は、入力層、中間層および出力層の3層を有するオートエンコーダである学習器Leを用いて、特徴情報の抽出を行った。しかしながら、実施形態は、これに限定されるものではない。例えば、情報配信装置10は、複数の中間層を有する学習器Le、すなわち、任意の数の層を有する学習器Leを用いて、特徴情報の抽出を行ってよい。
ここで、学習器Leが複数の中間層を有する場合、ノードの数が最も少ない中間層、すなわち、出力する情報の次元数が最も少ない中間層が、入力された情報の特徴を端的に示していると考えられる。そこで、情報配信装置10は、複数の中間層を有する学習器Leを用いる場合、出力する情報の次元数が最も少ない中間層が出力する情報を特徴情報とすればよい。
また、情報配信装置10は、オートエンコーダ以外にも、任意の学習器Leを用いて上述した情報配信処理を実行してもよい。また、情報配信装置10は、定常情報と変動情報とに基づいて、所定の時間帯におけるコンテンツの特徴を適切に示す特徴情報を抽出することができるのであれば、ニューラルネットワークやディープラーニング以外にも、任意のモデルを学習してよく、かかるモデルを用いて、上述した推定処理を実行してよい。
また、情報配信装置10は、定常情報と変動情報とに基づいて、所定の時刻におけるコンテンツの特徴を示す特徴情報を抽出する学習器Leと、特徴情報から素性情報を推定し、素性情報から推定重要度を推定するモデルとを、一つの学習器Leやモデルにより実現してもよい。このような学習器Leやモデルは、上述した式(1)〜(6)によって示される処理を実現することとなる。
なお、上述した説明では、情報配信装置10は、前回抽出した特徴情報と、時刻情報と、実績情報との組を学習器Leに入力した。このような入力を行った場合、学習器Leは、前回抽出した特徴情報に含まれる前回の時刻情報と、新たに入力した時刻情報との差に基づく特徴を反映させた特徴情報を出力すると考えられる。しかしながら、実施形態は、これに限定されるものではなく、例えば、情報配信装置10は、前回抽出した特徴情報と、実績情報との組を学習器Leに入力してもよい。すなわち、情報配信装置10は、定常情報と変動情報との組に基づいて、コンテンツの特徴をその都度抽出するのであれば、任意の態様で、学習器Leを利用してよい。
〔5−2.変動情報について〕
上述した説明では、情報配信装置10は、定常情報と変動情報とに基づいて、特徴情報を抽出していた。ここで、情報配信装置10が推定重要度を推定する時間間隔が、実績情報を収集する時間間隔よりも短い場合、初期の推定処理においては、変動情報が存在しない場合がある。このような場合であっても、情報配信装置10は、上述した推定処理を実行することで、定常情報から特徴情報を推定し、推定した特徴情報から推定重要度を推定してもよい。
また、情報配信装置10は、コンテンツの配信要求を受信した際に、配信対象となるコンテンツの実績情報を収集し、収集した実績情報とコンテンツの定常情報との組、または、前記抽出した特徴情報と収集した実績情報との組から、新たな特徴情報を抽出し、抽出した特徴情報から推定重要度を推定してもよい。すなわち、情報配信装置10は、任意のタイミングで、上述した推定処理を実行してもよい。
また、情報配信装置10は、コンテンツの変動情報を任意の態様で用いてよい。例えば、上述した例では、特徴情報「yk」を抽出する場合、「tk−1」から「tk」の間の実績情報に基づいて、特徴情報を抽出した。しかしながら、情報配信装置10は、例えば、「t0」から「tk」の間の実績情報、すなわち、コンテンツが登録されてから所定の時刻までの間における実績情報に基づいて、特徴情報を抽出して良い。また、情報配信装置10は、「ti」から「tk」の間の実績情報(ただし、i<k)を用いてもよい。すなわち、情報配信装置10は、任意の時間間隔における実績情報に基づいて、特徴情報を抽出して良い。このような処理を実行した場合、例えば、学習器Leは、インプレッション数の遷移やクリック回数の遷移、CTRの遷移等、それまでの変動情報の遷移の態様に応じて、コンテンツの特徴を抽出することができる。この結果、情報配信装置10は、推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、コンテンツに関する情報のうち、時間の経過とともに変動する情報であれば、任意の情報を、変動情報として採用することができる。例えば、情報配信装置10は、インプレッション数、クリック回数、コンテンツに対するリンクの数、コンテンツの検索回数、ツイート数、コンテンツに対する利用者の評価等、コンテンツに関する情報のうち時間の経過と共に変動する情報のうち、少なくともいずれか1つを変動情報として採用し、変動情報に基づいて特徴情報を抽出すればよい。
〔5−3.定常情報について〕
また、情報配信装置10は、コンテンツに関する情報のうち、時間の経過とともに変動しない情報であれば、任意の情報を定常情報として採用することができる。例えば、情報配信装置10は、コンテンツの内容、配信元等の提供主、コンテンツが属するカテゴリ、著者、コンテンツに含まれるテキスト、画像、動画像、若しくは音声等の変動しない情報のうち、少なくともいずれか1つを変動情報として採用し、変動情報に基づいて特徴情報を抽出すればよい。
また、上述した例では、情報配信装置10は、定常情報をコンテンツに関する情報のうち、時間の経過と共に変動しづらい所定の情報を定常情報とした。ここで、定常情報には、コンテンツに含まれるテキスト等、時間の経過とともに変化しない情報を定常情報としてもよい。また、情報配信装置10は、コンテンツの配信時等、実績情報がまた収集されていない状態で特定可能な任意の情報を定常情報としてもよい。
〔5−4.特徴情報の抽出について〕
上述した情報配信装置10は、定常情報と変動情報との組からコンテンツの特徴を抽出可能な学習器Leを用いた。しかしながら、実施形態は、これに限定されるものではなく、情報配信装置10は、学習器Leの学習を行ってもよい。
例えば、情報配信装置10は、各コンテンツについて前回推定した推定重要度と、各コンテンツについて新たに収集した実績情報とを比較し、コンテンツの推定重要度の順番と、実績情報の順番(例えば、インプレッション数の順番)とが一致するように、学習器leや、特徴情報から推定重要度を推定するモデルを修正してもよい。また、情報配信装置10は、入力された特徴情報、時刻情報、および実績情報の組と、抽出した特徴情報から復元された情報とが一致するように、学習器Leが有する接続係数の修正を行ってもよい。このような修正は、例えば、バックプロパゲーション法といった手法により実現されてもよい。
〔5−5.ターゲティングについて〕
ここで、情報配信装置10は、配信対象となるコンテンツの選択に、学習器Leを利用してもよい。例えば、情報配信装置10は、収入、職業、学歴等のデモグラフィック属性や、ライフスタイルや利用者U01の好み等のサイコグラフィック属性等、利用者U01の属性情報を示す分散表現を求め、学習器Leを用いて、利用者U01の属性情報と、コンテンツの定常情報と、実績情報との組の特徴を示す特徴情報を抽出する。そして、情報配信装置10は、抽出した特徴情報から推定優先度を推定することで、コンテンツの配信先となる利用者U01の属性に応じた推定優先度を推定してもよい。
このような処理を実行することで、情報配信装置10は、ターゲティングの精度を向上させることができる。なお、このような処理を実行する場合、情報配信装置10は、入力された属性情報と定常情報と実績情報との組の特徴を示す特徴情報から、入力された属性情報と定常情報と実績情報との組を上手く復元するように、学習器Leの学習を行えばよい。
〔5−6.コンテンツについて〕
上述した説明では、情報配信装置10は、ニュースやコラム等のテキストを含むコンテンツの分散表現から特徴情報を抽出した。しかしながら、実施形態は、これに限定されるものではない。すなわち、情報配信装置10は、画像、動画像、音声等のコンテンツから分散表現を生成し、生成した分散表現に基づくコンテンツの特徴情報を抽出してもよい。すなわち、情報配信装置10は、画像、動画像、音声等の分散表現をコンテンツの定常情報とし、定常情報と実績情報との組に基づいて、コンテンツの特徴情報を抽出してもよい。
すなわち、情報配信装置10は、テキスト情報のみならず、画像や動画像等、情報の次元数を圧縮することで特徴情報を抽出することができるコンテンツであれば、任意のコンテンツについて、上述した推定処理や情報配信処理を採用することができる。
〔5−7.広告の入稿〕
なお、コンテンツが広告である場合、広告主は、広告コンテンツの入稿を代理店に依頼する場合もある。この場合、情報配信装置10に広告コンテンツを入稿するのは代理店となる。本明細書では、コンテンツが広告である場合、「クライアント」といった表記は、広告コンテンツによって広告が行われるクライアント等、広告主だけでなく代理店を含む概念であり、「クライアント端末」といった表記は、広告主が使用する装置だけでなく代理店によって利用される装置を含む概念であるものとする。
〔5−8.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図2に示した各データベース14〜19は、情報配信装置10が保持せずに、ストレージサーバ等に保持されていてもよい。この場合、情報配信装置10は、ストレージサーバにアクセスすることで、コンテンツ等を取得することとなる。
また、例えば、上述してきた情報配信装置10は、端末装置100から配信要求を受け付けたり、コンテンツと推定重要度とを配信したりといった、配信処理を中心に実行するフロントエンドサーバ側と、コンテンツの定常情報と変動情報とに基づく特徴情報を抽出し、抽出した特徴情報から推定重要度を推定する推定処理を中心に実行するバックエンドサーバ側に分散されてもよい。すなわち、情報配信装置10は、推定重要度を推定する推定装置と、推定重要度に応じてコンテンツを配信する情報配信装置とによって実現されてもよい。
〔5−9.ハードウェア構成〕
また、上述してきた実施形態に係る情報配信装置10は、例えば図13に示すような構成のコンピュータ1000によって実現される。図13は、情報配信装置の機能を実現するコンピュータのハードウェア構成の一例を示す図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が情報配信装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部13の機能を実現する。また、HDD1400には、記憶部12内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網を介してこれらのプログラムを取得してもよい。
〔6.効果〕
上述したように、情報配信装置10は、コンテンツに係る所定の情報である定常情報と、時間の経過に応じて変化する変動情報とに基づき、所定の時刻におけるコンテンツの特徴を示す特徴情報を、入力された情報からその情報が有する特徴を抽出する学習器Leを用いて抽出する。そして、情報配信装置10は、抽出した特徴情報に基づいて、所定の時刻におけるコンテンツの重要度を推定する。このため、情報配信装置10は、コンテンツの重要度の推定精度を向上させることができる。
すなわち、情報配信装置10は、入力された情報の特徴を抽出する学習器Leを用いて、各時刻におけるコンテンツの特徴を、定常情報と変動情報との特徴に基づいてその都度抽出し直す。そして、情報配信装置10は、各時刻ごとに抽出し直したコンテンツの特徴から重要度を推定する。このため、情報配信装置10は、コンテンツごとに重要性の指標が異なったり、時間経過に伴う重要性の変化の態様が異なる場合にも、定常情報と変動情報との特徴に基づいて、コンテンツの特徴を抽出し直す。また、情報配信装置10は、最初に推定した推定重要度が実際の重要性と異なる場合にも、後に収集された実績情報から、新たに推定重要度を推定するので、コンテンツの重要度を実際の重要性に追従させることができる。このため、情報配信装置10は、実際の重要性を適切に反映した推定重要度を推定することができる。
また、情報配信装置10は、変動情報よりも時間の経過に応じた変化が少ない情報を定常情報とする。このため、情報配信装置10は、コンテンツにかかる情報のうち、時間の経過に応じた変化が少ない情報に基づいて、コンテンツの特徴を示す特徴情報を抽出することができる。
また、情報配信装置10は、所定の時刻よりも前の時刻におけるコンテンツの特徴を示す情報として抽出された特徴情報と、所定の時刻よりも前の時刻における変動情報との組から、所定の時刻におけるコンテンツの特徴を示す特徴情報を抽出する。例えば、情報配信装置10は、前回抽出した特徴情報と、新たに収集した変動情報との組から、新たな特徴情報を抽出する。
ここで、前回抽出した特徴情報には、それまでに収集された変動情報の特徴が累積して含まれていると考えられる。このため、情報配信装置10は、前回抽出した特徴情報と、新たに収集した変動情報との組から、これまでに収集された全ての変動情報を考慮した特徴情報を抽出することができるので、ある時間帯におけるコンテンツの特徴を精度良く示す特徴情報を抽出できる。この結果、情報配信装置10は、推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、前回特徴情報を抽出してから後の時間帯における変動情報と、前回抽出した特徴情報との組から、新たな特徴情報を抽出する。このように、情報配信装置10は、各時間帯において、新たな変動情報に基づく特徴情報を抽出しなおすので、各時間帯における推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、それまでに収集した変動情報に基づいて、新たなコンテンツの特徴情報を抽出する。このため、情報配信装置10は、収集された変動情報に基づき、将来の推定重要度を推定することができるので、例えば、CTR予測等を精度良く行うことができる。
また、情報配信装置10は、コンテンツが登録されてからの変動情報に基づいて、コンテンツの特徴を示す特徴情報を抽出する。このため、情報配信装置10は、例えば、インプレッション数の変動等、変動情報の遷移の態様に基づいて、コンテンツの特徴情報を抽出するので、推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、入力データに対する演算結果を出力する複数のノードを多層に接続した学習器Leであって、入力された情報の次元数を圧縮することで情報が有する特徴を示す特徴情報を抽出する学習器Leを用いて、コンテンツの特徴情報を抽出する。このため、情報配信装置10は、各時間帯におけるコンテンツの特徴情報を適切に抽出することができる。
また、情報配信装置10は、入力された情報から抽出した特徴情報を出力する中間層と、中間層が出力した特徴情報と、変動情報との入力を受付ける入力層とを有する学習器Le、すなわちRNNを用いて、コンテンツの特徴情報を抽出する。ここで、上述したように、特徴情報には、それまでに収集された変動情報の特徴が累積して含まれていると考えられる。このため、情報配信装置10は、次の時間帯におけるコンテンツの特徴を精度良く示す特徴情報を抽出できるので、推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、コンテンツの内容、コンテンツの提供主、コンテンツが属するカテゴリ、およびコンテンツの著者、前記コンテンツに含まれるテキスト、および前記コンテンツに含まれるテキスト、画像、動画像、若しくは音声のうち、少なくともいずれか1つに基づいて、コンテンツの特徴情報を抽出する。このため、情報配信装置10は、コンテンツが有する定常情報に基づく特徴情報を抽出できる。
また、情報配信装置10は、インプレッション数、選択回数、コンテンツに対するリンクの数、コンテンツの検索数、ツイート数等のコンテンツに関する情報が発信された回数、コンテンツの評価のうち、少なくともいずれか1つに基づいて、コンテンツの特徴情報を抽出する。このため、情報配信装置10は、それまでの変動情報に基づいて、コンテンツが有する特徴情報を抽出することができる。
また、情報配信装置10は、特徴情報からコンテンツが有する素性を示す素性情報を推定し、素性情報から、コンテンツの推定重要度を推定するモデルを用いて、コンテンツの推定重要度を推定する。このため、情報配信装置10は、各時間帯におけるコンテンツの推定重要度の推定精度を向上させることができる。
また、情報配信装置10は、所定の時刻におけるコンテンツの特徴を示す情報として抽出された特徴情報と、所定の時刻よりも後の時刻における変動情報との組から、所定の時刻よりも後の時刻におけるコンテンツの特徴を示す特徴情報を抽出する。例えば、情報配信装置10は、前回抽出した特徴情報と、新たに収集した変動情報との組から、新たな特徴情報を抽出する。このように、情報配信装置10は、各時間帯において、新たな変動情報に基づく特徴情報を抽出しなおすので、各時間帯における推定重要度の推定精度を向上させることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」等に読み替えることができる。例えば、配信部は、配信手段や配信回路に読み替えることができる。
10 情報配信装置
11 通信部
12 記憶部
13 制御部
14 コンテンツデータベース
15 実績情報データベース
16 学習器データベース
17 特徴情報データベース
18 推定モデルデータベース
19 重要度データベース
20 受付部
21 収集部
22 生成部
23 抽出部
24 推定部
25 配信部
100、101 端末装置
102 ログサーバ
200 クライアント端末

Claims (14)

  1. コンテンツに関する所定の定常情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づき、所定の時刻における当該コンテンツの特徴を示す特徴情報を、入力された情報から当該情報が有する特徴を抽出する学習器を用いて抽出する抽出部
    を有することを特徴とする推定装置。
  2. 前記抽出部は、前記所定の定常情報として、前記コンテンツに関する情報のうち前記変動情報よりも時間の経過に応じた変化が少ない情報に基づき、前記特徴情報を抽出する
    ことを特徴とする請求項1に記載の推定装置。
  3. 前記抽出部は、前記所定の時刻よりも前の時刻における前記コンテンツの特徴を示す情報として抽出された特徴情報と、前記所定の時刻よりも前の時刻における変動情報との組から、前記所定の時刻における前記コンテンツの特徴を示す特徴情報を抽出する
    ことを特徴とする請求項1または2に記載の推定装置。
  4. 前記抽出部は、前記所定の時刻よりも前の時刻における前記コンテンツの特徴を示す特徴情報を抽出した後の時間帯における変動情報と、当該所定の時刻よりも前の時刻における前記コンテンツの特徴を示す特徴情報との組から、前記所定の時刻における前記コンテンツの特徴を示す特徴情報を抽出する
    ことを特徴とする請求項3に記載の推定装置。
  5. 前記抽出部は、前記変動情報として、前記所定の時刻よりも前の時刻における変動情報に基づいて、前記所定の時刻における前記コンテンツの特徴を示す特徴情報を抽出する
    ことを特徴とする請求項1〜4のうちいずれか1つに記載の推定装置。
  6. 前記抽出部は、前記変動情報として、前記コンテンツが登録されてから前記所定の時刻までの間における変動情報に基づいて、前記所定の時刻における前記コンテンツの特徴を示す特徴情報を抽出する
    ことを特徴とする請求項1〜5のうちいずれか1つに記載の推定装置。
  7. 前記抽出部は、入力データに対する演算結果を出力する複数のノードを多層に接続した学習器であって、入力された情報の次元数を圧縮することで当該情報が有する特徴を示す特徴情報を抽出する学習器を用いて、前記コンテンツの特徴情報を抽出する
    ことを特徴とする請求項1〜6のうちいずれか1つに記載の推定装置。
  8. 前記抽出部は、前記学習器として、入力された情報から抽出した特徴情報を出力する層と、当該層が出力した特徴情報と、前記変動情報との入力を受付ける層とを有する学習器を用いて、前記コンテンツの特徴情報を抽出する
    ことを特徴とする請求項7に記載の推定装置。
  9. 前記抽出部は、前記定常情報として、前記コンテンツの内容、前記コンテンツの提供主、前記コンテンツが属する分野、前記コンテンツの著者、前記コンテンツに含まれるテキスト、および前記コンテンツに含まれるテキスト、画像、動画像、若しくは音声のうち、少なくともいずれか1つに基づいて、前記コンテンツの特徴情報を抽出する
    ことを特徴とする請求項1〜8のうちいずれか1つに記載の推定装置。
  10. 前記抽出部は、前記変動情報として、前記コンテンツが閲覧された回数、前記コンテンツが選択された回数、当該コンテンツに対するリンクの数、前記コンテンツが検索された回数、前記コンテンツに関する情報が発信された回数、および前記コンテンツに対する評価のうち、少なくともいずれか1つに基づいて、前記コンテンツの特徴情報を抽出する
    ことを特徴とする請求項1〜9のうちいずれか1つに記載の推定装置。
  11. 前記所定の時刻における前記コンテンツの特徴を示す特徴情報から、前記所定の時刻における前記コンテンツが有する素性を示す素性情報を推定し、当該素性情報から、前記所定の時刻における前記コンテンツの重要度を推定するモデルを用いて、前記所定の時刻における前記コンテンツの重要度を推定する推定部
    を有することを特徴とする請求項1〜10のうちいずれか1つに記載の推定装置。
  12. 所定の時刻におけるコンテンツの特徴を示す特徴情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づいて、前記所定の時刻よりも後の時刻における前記コンテンツの特徴を示す特徴情報を抽出する抽出部
    を有することを特徴とする推定装置。
  13. コンテンツに関する所定の定常情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づき、所定の時刻における当該コンテンツの特徴を示す特徴情報を、入力された情報から当該情報が有する特徴を抽出する学習器を用いて抽出する抽出工程
    を含むことを特徴とする推定方法。
  14. コンピュータに、
    コンテンツに関する所定の定常情報と、当該コンテンツに関する情報のうち時間の経過に応じて変化する変動情報とに基づき、所定の時刻における当該コンテンツの特徴を示す特徴情報を、入力された情報から当該情報が有する特徴を抽出する学習器を用いて抽出する抽出手順
    を実行させることを特徴とする推定プログラム。
JP2016238717A 2016-12-08 2016-12-08 抽出装置、抽出方法及び抽出プログラム Active JP6692739B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016238717A JP6692739B2 (ja) 2016-12-08 2016-12-08 抽出装置、抽出方法及び抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016238717A JP6692739B2 (ja) 2016-12-08 2016-12-08 抽出装置、抽出方法及び抽出プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015184426A Division JP6059314B1 (ja) 2015-09-17 2015-09-17 推定装置、推定方法及び推定プログラム

Publications (2)

Publication Number Publication Date
JP2017059255A true JP2017059255A (ja) 2017-03-23
JP6692739B2 JP6692739B2 (ja) 2020-05-13

Family

ID=58391650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016238717A Active JP6692739B2 (ja) 2016-12-08 2016-12-08 抽出装置、抽出方法及び抽出プログラム

Country Status (1)

Country Link
JP (1) JP6692739B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019211866A (ja) * 2018-05-31 2019-12-12 キユーピー株式会社 情報提供装置、情報提供方法及び情報提供装置のニューラルネットワークの学習方法
JP2020071509A (ja) * 2018-10-29 2020-05-07 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
WO2020144730A1 (ja) * 2019-01-07 2020-07-16 富士通株式会社 抽出方法、抽出プログラムおよび情報処理装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168281A (ja) * 1992-12-01 1994-06-14 Matsushita Electric Ind Co Ltd 記事情報重要度判定装置及び方法、並びにキーワード学習装置及び方法
JP2000099525A (ja) * 1998-09-18 2000-04-07 Nippon Telegr & Teleph Corp <Ntt> 利用者の周期的興味変化に基づく情報提供方法および装置と情報提供プログラムを記録した記録媒体
JP2007317068A (ja) * 2006-05-29 2007-12-06 Osaka Prefecture Univ リコメンド装置およびリコメンドシステム
JP2012168986A (ja) * 2012-05-25 2012-09-06 Telecom Italia Spa 選択されたコンテンツアイテムをユーザーに提供する方法
US20150199347A1 (en) * 2014-01-15 2015-07-16 Microsoft Corporation Promoting documents based on relevance
JP6059314B1 (ja) * 2015-09-17 2017-01-11 ヤフー株式会社 推定装置、推定方法及び推定プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168281A (ja) * 1992-12-01 1994-06-14 Matsushita Electric Ind Co Ltd 記事情報重要度判定装置及び方法、並びにキーワード学習装置及び方法
JP2000099525A (ja) * 1998-09-18 2000-04-07 Nippon Telegr & Teleph Corp <Ntt> 利用者の周期的興味変化に基づく情報提供方法および装置と情報提供プログラムを記録した記録媒体
JP2007317068A (ja) * 2006-05-29 2007-12-06 Osaka Prefecture Univ リコメンド装置およびリコメンドシステム
JP2012168986A (ja) * 2012-05-25 2012-09-06 Telecom Italia Spa 選択されたコンテンツアイテムをユーザーに提供する方法
US20150199347A1 (en) * 2014-01-15 2015-07-16 Microsoft Corporation Promoting documents based on relevance
JP6059314B1 (ja) * 2015-09-17 2017-01-11 ヤフー株式会社 推定装置、推定方法及び推定プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高橋 翼 外2名: "「ソーシャルブックマークにおけるトピック分析と活性度推定に基づくWebページのランキング」", 第2回データ工学と情報マネジメントに関するフォーラム−DEIM 2010−論文集 [ONLINE], JPN6016032886, 25 May 2010 (2010-05-25), ISSN: 0004035345 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019211866A (ja) * 2018-05-31 2019-12-12 キユーピー株式会社 情報提供装置、情報提供方法及び情報提供装置のニューラルネットワークの学習方法
JP2020071509A (ja) * 2018-10-29 2020-05-07 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7061552B2 (ja) 2018-10-29 2022-04-28 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
WO2020144730A1 (ja) * 2019-01-07 2020-07-16 富士通株式会社 抽出方法、抽出プログラムおよび情報処理装置
JPWO2020144730A1 (ja) * 2019-01-07 2021-11-18 富士通株式会社 抽出方法、抽出プログラムおよび情報処理装置
JP7222402B2 (ja) 2019-01-07 2023-02-15 富士通株式会社 抽出方法、抽出プログラムおよび情報処理装置
US11893814B2 (en) 2019-01-07 2024-02-06 Fujitsu Limited Extraction method, computer-readable recording medium storing extraction program, and information processing device

Also Published As

Publication number Publication date
JP6692739B2 (ja) 2020-05-13

Similar Documents

Publication Publication Date Title
JP6059314B1 (ja) 推定装置、推定方法及び推定プログラム
US8655949B2 (en) Correlated information recommendation
TWI636416B (zh) 內容個人化之多相排序方法和系統
US8332512B1 (en) Method and system for selecting content based on a user&#39;s viral score
KR102233805B1 (ko) 미인지된 및 새로운 유저들에 대한 향상된 유저 경험
JP3389948B2 (ja) 表示広告選択システム
US9710555B2 (en) User profile stitching
JP6261547B2 (ja) 判定装置、判定方法及び判定プログラム
JP4785906B2 (ja) コンテンツ推薦装置及び方法
RU2725659C2 (ru) Способ и система для оценивания данных о взаимодействиях пользователь-элемент
US20160071162A1 (en) Systems and Methods for Continuous Analysis and Procurement of Advertisement Campaigns
EP2407897A1 (en) Device for determining internet activity
EP2800015A1 (en) Content distribution
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
US20170140397A1 (en) Measuring influence propagation within networks
WO2021129055A1 (zh) 信息预测模型训练方法及装置、信息预测方法及装置、存储介质、设备
EP3625748B1 (en) Distributed node cluster for establishing a digital touchpoint across multiple devices on a digital communications network
CN106447419B (zh) 基于特征选择的拜访者标识
US9043397B1 (en) Suggestions from a messaging platform
US20210233147A1 (en) Recommendation engine based on optimized combination of recommendation algorithms
US20170228349A1 (en) Combined predictions methodology
JP2018084928A (ja) 選択装置、選択方法および選択プログラム
JP6692739B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP6522050B2 (ja) 判定装置、学習装置、判定方法及び判定プログラム
JP5813052B2 (ja) 情報処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20190521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190719

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200415

R150 Certificate of patent or registration of utility model

Ref document number: 6692739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350