JP2017054269A - 抽出装置、抽出方法、及び抽出プログラム - Google Patents

抽出装置、抽出方法、及び抽出プログラム Download PDF

Info

Publication number
JP2017054269A
JP2017054269A JP2015177054A JP2015177054A JP2017054269A JP 2017054269 A JP2017054269 A JP 2017054269A JP 2015177054 A JP2015177054 A JP 2015177054A JP 2015177054 A JP2015177054 A JP 2015177054A JP 2017054269 A JP2017054269 A JP 2017054269A
Authority
JP
Japan
Prior art keywords
content
extraction
contents
user
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015177054A
Other languages
English (en)
Other versions
JP6367776B2 (ja
Inventor
一真 村尾
Kazuma Murao
一真 村尾
真吾 星野
Shingo Hoshino
真吾 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2015177054A priority Critical patent/JP6367776B2/ja
Publication of JP2017054269A publication Critical patent/JP2017054269A/ja
Application granted granted Critical
Publication of JP6367776B2 publication Critical patent/JP6367776B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】適切な記事を抽出すること。【解決手段】本願に係る抽出装置は、算出部と、抽出部とを有する。算出部は、コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する。抽出部は、算出部により算出された各コンテンツのスコアに基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する。例えば、算出部は、所定の編集者が選択するコンテンツまたは大衆が注目するコンテンツのスコアが高くなるような基準に基づいて、複数のコンテンツのスコアを算出する。【選択図】図2

Description

本発明は、抽出装置、抽出方法、及び抽出プログラムに関する。
従来、ユーザが指定した検索条件に類似した記事を検索し、検索により抽出された記事を提示する技術が提供されている。
特開平9−101991号公報 特開2015-5057号公報
しかしながら、上記の従来技術では、ユーザにとって適切な記事を抽出することができるとは限らない。例えば、ユーザの指定(関心等)のみに基づいて記事が抽出される場合、社会的に重要な記事等が抽出されるとは限らず、ユーザにとって適切な記事が抽出されるとは限らない。
本願は、上記に鑑みてなされたものであって、適切な記事を抽出することができる抽出装置、抽出方法、及び抽出プログラムを提供することを目的とする。
本願に係る抽出装置は、コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する算出部と、前記算出部により算出された各コンテンツのスコアに基づいて、前記複数のコンテンツからユーザに配信するコンテンツを抽出する抽出部と、を備えたことを特徴とする。
実施形態の一態様によれば、適切な記事を抽出することができるという効果を奏する。
図1は、実施形態に係る抽出処理の一例を示す図である。 図2は、実施形態に係る配信装置の構成例を示す図である。 図3は、実施形態に係るコンテンツ情報記憶部の一例を示す図である。 図4は、実施形態に係る学習情報記憶部の一例を示す図である。 図5は、実施形態に係るユーザ情報記憶部の一例を示す図である。 図6は、実施形態に係る端末装置の構成例を示す図である。 図7は、実施形態に係るマス向けコンテンツの抽出処理の一例を示す図である。 図8は、実施形態に係るコンテンツの配信の一例を示すフローチャートである。 図9は、実施形態に係る端末装置におけるコンテンツの表示の一例を示す図である。 図10は、配信装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る抽出装置、抽出方法、及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法、及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.抽出処理〕
まず、図1を用いて、実施形態に係る抽出処理の一例について説明する。図1は、実施形態に係る抽出処理の一例を示す図である。なお、本実施形態における抽出処理には、コンテンツを配信する処理を含む。図1に示す配信装置100は、端末装置10からの配信要求に基づいてコンテンツを配信する配信サービスを提供する。
図1に示すように、配信システム1は、端末装置10と、提供元装置20と、編集者端末50と、配信装置100とが含まれる。端末装置10と、提供元装置20と、編集者端末50と、配信装置100とは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。なお、図1に示した配信システム1には、複数台の端末装置10や、複数台の提供元装置20や、複数台の編集者端末50や、複数台の配信装置100が含まれてもよい。
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1に示す例においては、端末装置10がタッチパネル機能を有するスマートフォンである場合を示す。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。
また、端末装置10は、配信装置100へコンテンツの配信を要求する。また、端末装置10は、配信装置100から配信されたコンテンツを所定のアプリにより表示する。なお、所定のアプリはブラウザであってもよい。
提供元装置20は、コンテンツの提供元、いわゆるコンテンツプロバイダ等によって利用される情報処理装置である。例えば、提供元装置20は、提供元により作成されたコンテンツを配信装置100に入稿する。
編集者端末50は、所定の編集者によって利用される情報処理装置である。例えば、編集者端末50は、所定のサービス(以下、「情報提供サービス」とする)において掲載されるコンテンツを選択する編集者E1が利用する端末装置である。図1では、編集者端末50として、ノート型PCを示すが、例えば、スマートフォンや、タブレット型端末や、デスクトップPCや、携帯電話機や、PDA等であってもよい。また、図1に示す例においては、説明のため、編集者端末50から編集者E1が選択した記事に関する情報(以下、「選択記事情報」とする場合がある)を受け付ける場合を示すが、配信装置100は、編集者E1が選択した記事に関する情報を管理する管理装置等から、編集者E1の選択記事情報を受け付けてもよい。
配信装置100は、端末装置10にコンテンツを配信するサービスを提供する情報処理装置である。また、配信装置100は、コンテンツ群から選択したコンテンツを提供するサービスにおいて選択されるコンテンツのスコアが高くなるような基準に基づいて算出された各コンテンツのスコアに基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する抽出装置である。例えば、配信装置100は、所定の編集者が選択するコンテンツまたは大衆が注目するコンテンツのスコアが高くなるような基準に基づいて算出された各コンテンツのスコアに基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する。
図1に示す例では、配信装置100は、上記のスコアに基づき抽出されたコンテンツと、ユーザに関するユーザ情報に基づいて抽出された他のコンテンツとを、端末装置10に配信する。以下では、スコアに基づき抽出されたコンテンツを「マス向けコンテンツ」とし、ユーザに関するユーザ情報に基づいて抽出された他のコンテンツを「個人向けコンテンツ」とする場合がある。また、以下では、コンテンツを「記事」と称する場合がある。すなわち、マス向けコンテンツは「マス向け記事」と読み替え、個人向けコンテンツは「個人向け記事」と読み替えることもできる。
図1に示すように、配信装置100は、提供元装置20からコンテンツの入稿を受け付ける(ステップS10)。例えば、配信装置100は、提供元装置20から定期的にコンテンツの入稿を受け付ける。なお、図1では、1台の提供元装置20を示すが、配信装置100は、多数の提供元装置20からコンテンツの入稿を受け付けてもよい。例えば、配信装置100は、提供元装置20から入稿されたコンテンツをコンテンツ情報記憶部121に記憶する。
また、配信装置100は、編集者端末50から編集者E1の選択記事情報を受け付ける(ステップS11)。具体的には、配信装置100は、編集者E1が選択したコンテンツ(記事)であって、情報提供サービスにおいて掲載される記事に関する情報を受け付ける。例えば、編集者E1は、コンテンツ情報記憶部121に記憶されたコンテンツ(記事)と同様の記事群の中から、掲載する記事を選択する。
また、例えば、配信装置100は、編集者E1が選択した記事に関する情報を定期的に受け付けてもよいし、編集者E1が選択した記事の履歴を受け付けてもよい。なお、配信装置100は、予め選択記事情報を受け付けている場合、ステップS11の処理を行わなくてもよい。
また、配信装置100は、端末装置10から端末装置10を利用するユーザU1に関するユーザ情報を受け付ける(ステップS12)。例えば、配信装置100は、端末装置10からユーザ情報として、ユーザU1の興味や関心に関する情報を受け付ける。また、配信装置100は、端末装置10からユーザ情報として、ユーザU1のインターネット上における行動履歴を受け付けてもよい。この場合、配信装置100は、受け付けたユーザU1の行動履歴から、ユーザU1の興味や関心を推定してもよい。
また、配信装置100は、端末装置10以外の外部装置から端末装置10を利用するユーザU1のユーザ情報を受け付けてもよい。また、上記のユーザ情報は一例であって、配信装置100は、目的に応じて種々のユーザ情報を受け付けてもよい。なお、配信装置100は、予め端末装置10を利用するユーザU1のユーザ情報を受け付けている場合、ステップS12の処理を行わなくてもよい。
また、配信装置100は、以下のステップS13において端末装置10を利用するユーザU1のユーザ情報を受け付けてもよい。なお、以下では、配信装置100が端末装置10を利用するユーザU1がスポーツや芸能に興味や関心があることを示すユーザ情報を受け付けた場合を例に説明する。
そして、配信装置100は、端末装置10からコンテンツの配信要求を受け付ける(ステップS13)。この場合、配信装置100は、所定のマスロジックによりコンテンツ情報記憶部121に記憶されたコンテンツから、マス向けコンテンツを抽出する(ステップS14)。なお、以下では、マス向けコンテンツの抽出を「第1抽出」とする場合がある。例えば、配信装置100は、ステップS14における第1抽出により、編集者E1の選択記事情報に基づいて算出された各コンテンツのスコアに基づいて、記事A〜記事H等の複数のコンテンツからマス向けコンテンツを抽出する。
ここで、各コンテンツに対して算出されるスコアについて説明する。例えば、配信装置100は、提供元装置20から入稿されたコンテンツに含まれる単語に基づいて、各コンテンツのスコアを算出する。この場合、配信装置100は、所定の間隔(例えば、10分おき)に各単語のスコアを算出する。例えば、配信装置100は、所定のスコア算出ロジックに基づいて、各単語のスコアを算出する。例えば、配信装置100は、所定の期間における単語を見出しに含むコンテンツの増加量に基づく単語のスコアを算出する。例えば、配信装置100は、所定の期間において一の単語を含むコンテンツを入稿した提供元数に応じて、一の単語のスコアを算出してもよい。また、例えば、配信装置100は、一の単語を含むコンテンツを入稿した提供元に関する評価に応じて、一の単語のスコアを算出してもよい。
また、配信装置100は、所定のスコア算出ロジックにより算出された単語のスコアが所定の閾値を超える単語を含むコンテンツを抽出してもよい。そして、配信装置100は、閾値を超える単語を含むコンテンツの中から、以下に示す各記事のスコアに基づいてマス向けコンテンツを抽出してもよい。
配信装置100は、所定のスコア算出ロジックに基づいて算出した各単語のスコアに基づく各単語の重みを用いて、各記事のスコアを算出する。例えば、配信装置100は、各記事に含まれる単語の重みに基づいて各記事のスコアを算出する。
例えば、各記事のスコアは、そのコンテンツに含まれる単語の重みを合算することにより算出される。例えば、各単語の重みは、例えば1時間おきなど定期的に導出されてもよい。また、各単語の重みは、所定のスコア算出ロジックにより算出された単語のスコアや編集者E1の選択記事情報やその単語を含むコンテンツを入稿した提供元の評価値等に基づいて導出される。すなわち、配信装置100は、種々の情報の影響を加味して各単語の重みを導出する。
例えば、配信装置100は、コンテンツに含まれる単語が後述するメイン表示領域EA11(図9参照)へ掲載された回数などに基づく学習により、単語の重みを導出する。例えば、配信装置100は、編集者E1の選択記事情報に含まれるコンテンツ中における頻度の高い単語の重みを重くする。また、配信装置100は、提供元が入稿したコンテンツのメイン表示領域EA11(図9参照)へ掲載された回数などに基づく学習により、単語の重みを導出する。例えば、配信装置100は、評価値の高い提供元が入稿したコンテンツ中における頻度の高い単語の重みを重くする。このような各単語の重みを用いて、配信装置100は、所定のスコア算出ロジックにより各コンテンツのスコアを算出する。すなわち、配信装置100は、所定の編集者が選択するコンテンツのスコアが高くなるような基準に基づいて、複数のコンテンツのスコアを算出する。
ステップS14において、配信装置100は、所定のスコア算出ロジックにより算出されたスコアが高い方から順に所定数のコンテンツを、マス向けコンテンツとして抽出する。図1に示す例においては、配信装置100は、スコアが最も高い「1.5」である記事Eや、スコアが記事Eの次に高い「1.2」である記事Cや、スコアが記事Cの次に高い「1.1」である記事F等をマス向けコンテンツMC11として抽出する。
また、配信装置100は、コンテンツ情報記憶部121に記憶されたコンテンツから、ユーザ情報に基づいて、ユーザU1にパーソナライズされた個人向けコンテンツを抽出する(ステップS15)。なお、以下では、個人向けコンテンツの抽出を「第2抽出」とする場合がある。例えば、配信装置100は、ステップS15における第2抽出により、記事A〜記事H等の複数のコンテンツから、ユーザU1が興味や関心を示す可能性の高い所定数のコンテンツを個人向けコンテンツとして抽出する。
図1に示す例においては、配信装置100は、ステップS12においてユーザU1がスポーツや芸能に興味や関心があることを示すユーザ情報を受け付けているため、カテゴリ「スポーツ」に分類される記事Bやカテゴリ「芸能」に分類される記事Hや記事Aを、個人向けコンテンツPC11として抽出する。なお、記事B、記事H、記事Aの順は、配信装置100が各コンテンツへのユーザの関心度に基づいて決定した優先順位を示す。
配信装置100は、第1抽出によりマス向けコンテンツMC11を抽出し、第2抽出により個人向けコンテンツPC11を抽出した後、マス向けコンテンツMC11と個人向けコンテンツPC11とをブレンドする(ステップS16)。図1に示す例では、配信装置100は、マス向けコンテンツMC11と個人向けコンテンツPC11とを1対1の割合でブレンドしたブレンドコンテンツBC11を決定する。以下、ブレンドコンテンツBC11に含まれるコンテンツの数を「配信数」とする。
例えば、配信装置100は、マス向けコンテンツMC11のうちスコアの高い方から配信数の半分の数までのコンテンツを、ブレンドコンテンツBC11に含めるコンテンツとして決定する。また、例えば、配信装置100は、個人向けコンテンツPC11のうち優先順位の高い方から配信数の半分の数までのコンテンツを、ブレンドコンテンツBC11に含めるコンテンツとして決定する。なお、配信装置100は、個人向けコンテンツPC11から配信数の半分の数までランダムで抽出したコンテンツを、ブレンドコンテンツBC11に含めるコンテンツとして決定してもよい。配信装置100は、ブレンドコンテンツBC11において、マス向けコンテンツMC11から決定されたコンテンツと個人向けコンテンツPC11から決定されたコンテンツとに関わらず、重複するコンテンツを排除してもよい。
ここで、配信装置100は、マス向けコンテンツ、個人向けコンテンツの順に交互に配置されるブレンドコンテンツBC11を決定する。また、配信装置100は、マス向けコンテンツ間ではスコアの高いコンテンツほど上の配置順になるように、個人向けコンテンツ間では優先順位が高いコンテンツほど上の配置順になるようにブレンドコンテンツBC11を決定する。図1では、配信装置100は、記事E、記事B、記事C、記事H、記事F、記事A等を含むブレンドコンテンツBC11を決定する。
その後、配信装置100は、ブレンドコンテンツBC11を端末装置10へ配信する(ステップS17)。具体的には、記事E、記事B、記事C、記事H、記事F、記事A等の順で表示されるブレンドコンテンツBC11を端末装置10へ配信する。
そして、ブレンドコンテンツBC11を受信した端末装置10は、ブレンドコンテンツBC11を表示する(ステップS18)。図1では、端末装置10は、ブレンドコンテンツBC11のうち配置順が上位のコンテンツである記事E、記事B、記事C、記事Hを表示する。なお、端末装置10を利用するユーザは、端末装置10の画面にタッチしスクロール操作等を行うことにより、記事Hから下の記事F、記事A等を順次表示させる。
上述したように、配信装置100は、所定の編集者(例えば編集者E1)が選択するコンテンツのスコアが高くなるような基準に基づいて、複数のコンテンツのスコアを算出する。そして、配信装置100は、算出したコンテンツのスコアに基づいて、マス向けコンテンツを抽出する。これにより、配信装置100は、所定の編集者が選択するようなコンテンツをマス向けコンテンツとして抽出することができる。したがって、配信装置100は、適切なコンテンツを抽出することができる。また、配信装置100は、マス向けコンテンツMC11と個人向けコンテンツPC11とを1対1の割合でブレンドしたブレンドコンテンツBC11を配信する。これにより、配信装置100は、ユーザの興味や関心に基づいた記事と社会的な重要性に基づいた記事とをバランスよくユーザに配信することができる。
なお、配信装置100と編集者端末50とは、外部の記憶装置等に記憶されたコンテンツ情報に基づいて、コンテンツの抽出や選択を行ってもよい。具体的には、配信装置100や編集者端末50は、コンテンツ情報が記憶された記憶装置からコンテンツに関する各種情報を取得し、コンテンツの抽出や選択を行ってもよい。
また、上記例においては、配信装置100がマス向けコンテンツの抽出、個人向けコンテンツの抽出、コンテンツのブレンド、及びコンテンツの配信を行ったが、配信システム1は各処理を各情報処理装置に分散して実行してもよい。例えば、配信装置100は、マス向けコンテンツの抽出を行う情報処理装置からマス向けコンテンツを取得し、個人向けコンテンツの抽出を行う情報処理装置から個人向けコンテンツを取得し、マス向けコンテンツと個人向けコンテンツとをブレンドして配信してもよい。また、例えば、配信装置100は、マス向けコンテンツと個人向けコンテンツとをブレンドしたブレンドコンテンツを外部の情報処理装置から取得して配信してもよい。
〔2.配信装置の構成〕
次に、図2を用いて、実施形態に係る配信装置100の構成について説明する。図2は、実施形態に係る配信装置100の構成例を示す図である。図2に示すように、配信装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、配信装置100は、配信装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10や提供元装置20や編集者端末50との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図2に示すように、コンテンツ情報記憶部121と、学習情報記憶部122と、ユーザ情報記憶部123とを有する。
(コンテンツ情報記憶部121)
実施形態に係るコンテンツ情報記憶部121は、コンテンツ(記事)に関する各種情報を記憶する。図3に、実施形態に係るコンテンツ情報記憶部121の一例を示す。図3に示すコンテンツ情報記憶部121は、「コンテンツID」、「コンテンツ」、「カテゴリ」、「提供元ID」、「スコア」といった項目を有する。
「コンテンツID」は、コンテンツを識別するための識別情報を示す。「コンテンツ」は、いわゆるコンテンツプロバイダ等の提供元から取得したコンテンツである記事を示す。図3では「コンテンツ」に「記事A」といった概念的な情報が格納される例を示したが、実際には、文字情報や文字情報と画像との組合せ、または、これらの格納場所を示すファイルパス名などが格納される。また、「カテゴリ」は、コンテンツの内容に基づく分類情報を示す。また、「提供元ID」は、コンテンツの提供元を識別するための識別情報を示す。また、「スコア」は、各コンテンツのスコアを示す。例えば、各コンテンツのスコアは、後述する学習情報記憶部122に記憶された情報に基づいて算出される。
例えば、図3に示す例において、コンテンツID「CT11」により識別される記事Aは、提供元ID「CP11」により識別される提供元から取得したコンテンツであることを示す。また、コンテンツID「CT11」により識別される記事Aは、その内容はカテゴリ「芸能」に分類され、スコアが「0.4」であることを示す。
なお、コンテンツ情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、コンテンツ情報記憶部121は、コンテンツを取得した日時やコンテンツが作成された日時に関する情報を記憶してもよい。コンテンツ情報記憶部121は、各提供元の評価値に関する情報を記憶してもよい。
(学習情報記憶部122)
実施形態に係る学習情報記憶部122は、各単語の重みに関する各種情報を記憶する。例えば、学習情報記憶部122は、学習により導出された各単語の重みに関する各種情報を記憶する。例えば、学習情報記憶部122は、各単語に対応する重みを記憶する。図4に、実施形態に係る学習情報記憶部122の一例を示す。図4に示す学習情報記憶部122は、「素性」、「重み」といった項目を有する。
「素性」は、学習を行う重みを導出する対象(情報)を示す。図4では、「単語A」や「単語B」のように抽象的に記載するが、「単語A」や「単語B」としては、「日本」や「映画」など具体的な単語が記憶される。また、図4に示す例において、単語Aの重みは「0.05」であり、単語Bの重みは「−0.1」であり、単語Cの重みは「0.02」であり、単語Dの重みは「−0.05」であることを示す。
なお、学習情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。図4に示す例においては、学習情報記憶部122は、各単語を識別する単語IDを記憶してもよい。また、学習情報記憶部122は、コンテンツのスコアを算出するために用いられる種々の情報を記憶してもよい。例えば、学習情報記憶部122は所定のスコア算出ロジックに基づく各単語のスコアに関する情報を記憶してもよい。また、例えば、学習情報記憶部122は、各提供元の評価値に関する情報を記憶してもよい。
(ユーザ情報記憶部123)
実施形態に係るユーザ情報記憶部123は、ユーザに関する各種情報を記憶する。図5に、実施形態に係るユーザ情報記憶部123の一例を示す。図5に示すユーザ情報記憶部123は、「ユーザID」、「年齢」、「性別」、「居住地」、「関心1」、「関心2」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U1」により識別されるユーザは、図1の例に示したユーザに対応する。また、「年齢」は、ユーザIDにより識別されるユーザの年齢を示す。なお、「年齢」は、例えば35歳など、ユーザIDにより識別されるユーザの具体的な年齢であってもよい。また、「性別」は、ユーザIDにより識別されるユーザの性別を示す。また、「居住地」は、ユーザIDにより識別されるユーザの居住地を示す。「関心1」は、ユーザIDにより識別されるユーザが最も関心や興味のある対象を示す。また、「関心2」は、ユーザIDにより識別されるユーザが「関心1」の対象の次に関心や興味のある対象を示す。なお、「関心3」や「関心4」のように、3以上の関心が登録されてもよい。
例えば、図5に示す例において、ユーザID「U1」により識別されるユーザの年齢は、「30代」であり、性別は、「男性」であり、居住地は、「地域A」であることを示す。また、例えば、図5に示す例において、ユーザID「U1」により識別されるユーザは、「スポーツ(サッカー)」に最も関心があり、その次に「芸能(ドラマ)」に関心があることを示す。
なお、ユーザ情報記憶部123は、上記に限らず、目的に応じて種々の情報、例えば上記以外のデモグラフィック属性情報やサイコグラフィック属性情報等を記憶してもよい。また、配信装置100は、端末装置10から受け付けたユーザ情報に基づいて推定されるユーザに関する各種情報を、ユーザ情報記憶部123に記憶させてもよい。
(制御部130)
図2の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、配信装置100内部の記憶装置に記憶されている各種プログラム(決定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図2に示すように、制御部130は、受付部131と、学習部132と、算出部133と、第1抽出部134と、第2抽出部135と、決定部136と、配信部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
(受付部131)
受付部131は、端末装置10からコンテンツの配信要求を受け付ける。受付部131は、提供元装置20からコンテンツの入稿を受け付ける。例えば、受付部131は、提供元装置20から定期的にコンテンツの入稿を受け付ける。例えば、受付部131は、多数の提供元装置20からコンテンツの入稿を受け付けてもよい。例えば、受付部131は、提供元装置20から入稿されたコンテンツをコンテンツ情報記憶部121に記憶する。
また、受付部131は、編集者端末50から編集者E1の選択記事情報を受け付ける。具体的には、受付部131は、編集者E1が選択したコンテンツ(記事)であって、情報提供サービスにおいて掲載される記事に関する情報を受け付ける。また、受付部131は、端末装置10から端末装置10を利用するユーザU1に関するユーザ情報を受け付ける。例えば、受付部131は、端末装置10からユーザ情報として、ユーザU1の興味や関心に関する情報を受け付ける。また、受付部131は、端末装置10からユーザ情報として、ユーザU1のインターネット上における行動履歴を受け付けてもよい。また、受付部131は、端末装置10以外の外部装置から端末装置10を利用するユーザU1のユーザ情報を受け付けてもよい。
(学習部132)
学習部132は、各単語に対応する各単語の重みを学習する。例えば、学習部132は、各単語の重みを算出するために、提供元装置20から入稿されたコンテンツに含まれる各単語のスコアを算出する。例えば、学習部132は、所定の間隔(例えば、10分おき)に各単語のスコアを算出する。具体的には、学習部132は、所定のスコア算出ロジックに基づいて、各単語のスコアを算出する。
学習部132は、各単語の重みを、例えば1時間おきなど定期的に学習を行うことにより導出する。また、各単語の重みは、所定のスコア算出ロジックにより算出された単語のスコアや編集者E1の選択記事情報やその単語を含むコンテンツを入稿した提供元の評価値等に基づいて算出される。
例えば、学習部132は、コンテンツに含まれる単語が後述するメイン表示領域EA11(図9参照)へ掲載された回数などに基づく学習により、単語の重みを導出する。例えば、学習部132は、編集者E1の選択記事情報に含まれるコンテンツ中における頻度の高い単語の重みが重くなるように学習を行う。また、学習部132は、提供元が入稿したコンテンツのメイン表示領域EA11(図9参照)へ掲載された回数などに基づく学習により、単語の重みを導出する。例えば、学習部132は、評価値の高い提供元が入稿したコンテンツ中における頻度の高い単語の重みが重くなるように学習を行う。そして、学習部132は、学習により導出した各単語の重みを学習情報記憶部122に記憶する。
また、例えば、学習部132は、所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に含まれる単語の重みが重くなるように学習を行ってもよい。例えば、コンテンツ提供サービスにおいて掲載された記事は、新聞社のサイト情報、大手ポータルサイトの記事であってもよい。また、例えば、コンテンツ提供サービスにおいて掲載された記事は、新聞社等の所定の提供元が発行する紙媒体に掲載された記事であってもよい。また、例えば、学習部132は、所定のSNS(Social Networking Service)において投稿された文字情報に所定の閾値以上の頻度で含まれる単語の重みが重くなるように学習を行ってもよい。
(算出部133)
算出部133は、コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、所定の編集者が選択するコンテンツまたは大衆が注目するコンテンツのスコアが高くなるような基準に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、各コンテンツに関する社会生活での重要度または各コンテンツに関する大衆の関心に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、ユーザに関するユーザ情報以外の情報に基づいて、複数のコンテンツのスコアを算出する。
例えば、算出部133は、所定のサービスにおいて掲載されるコンテンツに含まれる単語に基づいて、複数のコンテンツのスコアを算出する。算出部133は、所定のスコア算出ロジックを用いて各コンテンツのスコアを算出する。例えば、算出部133は、所定のサービスにおいて掲載されたコンテンツの履歴に基づいて、複数のコンテンツのスコアを算出する。
また、例えば、算出部133は、所定のサービスにおいて掲載されたコンテンツの履歴に基づいて変動する単語の重みにより、複数のコンテンツのスコアを算出する。例えば、算出部133は、所定のサービスにおいて掲載されたコンテンツに含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出する。具体的には、算出部133は、メイン表示領域EA11(図9参照)へ掲載されたコンテンツに含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出してもよい。
また、算出部133は、所定のサービスにおけるコンテンツの抽出基準に関する情報に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、所定のサービスにおけるコンテンツの抽出基準に基づいて変動する単語の重みにより、複数のコンテンツのスコアを算出する。また、例えば、算出部133は、所定のサービスにおけるコンテンツの抽出基準において使用が制限される単語の重みが低く設定された単語の重みに基づいて、複数のコンテンツのスコアを算出してもよい。
また、例えば、算出部133は、所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に関する情報に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出する。具体的には、算出部133は、所定の新聞の一面に掲載された記事に含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出してもよい。
また、例えば、算出部133は、所定のネットワークサービスにおいて投稿される情報に基づいて、複数のコンテンツのスコアを算出する。具体的には、算出部133は、所定のネットワークサービスにおいて投稿される文字情報や画像情報等に基づいて、複数のコンテンツのスコアを算出する。例えば、算出部133は、所定のネットワークサービスにおいて投稿された文字情報に所定の閾値以上の頻度で含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出する。具体的には、算出部133は、所定のSNSにおいて投稿された文字情報に所定の閾値以上の頻度で含まれる単語の重みが重くなるように学習された各単語の重みに基づいて、複数のコンテンツのスコアを算出してもよい。
(第1抽出部134)
第1抽出部134は、算出部133により算出された各コンテンツのスコアに基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する。例えば、第1抽出部134は、マス向けコンテンツを抽出する。例えば、第1抽出部134は、所定のマスロジックによりコンテンツ情報記憶部121に記憶されたコンテンツから、マス向けコンテンツを抽出する。
例えば、第1抽出部134は、第1抽出により、編集者E1の選択記事情報に基づいて算出された各コンテンツのスコアに基づいて、記事A〜記事H等の複数のコンテンツからマス向けコンテンツを抽出する。具体的には、第1抽出部134は、所定のスコア算出ロジックにより算出されたスコアが高い方から順に所定数のコンテンツを、マス向けコンテンツとして抽出する。図1に示す例においては、第1抽出部134は、スコアが最も高い「1.5」である記事Eや、スコアが記事Eの次に高い「1.2」である記事Cや、スコアが記事Cの次に高い「1.1」である記事F等をマス向けコンテンツMC11として抽出する。
(第2抽出部135)
第2抽出部135は、ユーザに関するユーザ情報に基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する。例えば、第2抽出部135は、コンテンツ情報記憶部121に記憶されたコンテンツから、ユーザ情報に基づいて、ユーザU1にパーソナライズされた個人向けコンテンツを抽出する。
例えば、第2抽出部135は、第2抽出により、記事A〜記事H等の複数のコンテンツから、ユーザU1が興味や関心を示す可能性の高い所定数のコンテンツを個人向けコンテンツとして抽出する。図1に示す例においては、第2抽出部135は、ユーザU1がスポーツや芸能に興味や関心があるため、カテゴリ「スポーツ」に分類される記事Bやカテゴリ「芸能」に分類される記事Hや記事Aを、個人向けコンテンツPC11として抽出する。
(決定部136)
決定部136は、マス向けコンテンツと個人向けコンテンツとの割合を決定し、決定した割合に基づいて、ブレンドコンテンツに含ませるマス向けコンテンツと個人向けコンテンツとを決定する。図1に示す例では、決定部136は、マス向けコンテンツMC11と個人向けコンテンツPC11とを1対1の割合でブレンドしたブレンドコンテンツBC11を決定する。
例えば、決定部136は、マス向けコンテンツMC11のうちスコアの高い方から配信数の半分の数までのコンテンツを、ブレンドコンテンツBC11に含めるコンテンツとして決定する。また、例えば、決定部136は、個人向けコンテンツPC11のうち優先順位の高い方から配信数の半分の数までのコンテンツを、ブレンドコンテンツBC11に含めるコンテンツとして決定する。
例えば、決定部136は、マス向けコンテンツ、個人向けコンテンツの順に交互に配置されるブレンドコンテンツBC11を決定する。また、決定部136は、マス向けコンテンツ間ではスコアの高いコンテンツほど上の配置順になるように、個人向けコンテンツ間では優先順位が高いコンテンツほど上の配置順になるようにブレンドコンテンツBC11を決定する。図1では、決定部136は、記事E、記事B、記事C、記事H、記事F、記事A等を含むブレンドコンテンツBC11を決定する。
(配信部137)
配信部137は、第1抽出部134により抽出されたマス向けコンテンツと、第2抽出部135により抽出された個人向けコンテンツとを、端末装置10に配信する。配信部137は、決定部136により決定されたブレンドコンテンツを端末装置10に配信する。すなわち、配信部137は、第1抽出部134により抽出されたマス向けコンテンツと、第2抽出部135により抽出された個人向けコンテンツとを所定の割合で配信する。図1に示す例では、配信部137は、マス向けコンテンツMC11と個人向けコンテンツPC11とが1対1の割合でブレンドされたブレンドコンテンツBC11を配信する。具体的には、配信部137は、決定部136により決定された記事E、記事B、記事C、記事H、記事F、記事A等を含むブレンドコンテンツBC11を端末装置10に配信する。
〔3.端末装置の構成〕
次に、図6を用いて、実施形態に係る端末装置10の構成について説明する。図6は、実施形態に係る端末装置10の構成例を示す図である。図6に示すように、端末装置10は、通信部11と、記憶部12と、入力部13と、出力部14と、制御部15とを有する。
(通信部11)
通信部11は、例えば、通信回路等によって実現される。そして、通信部11は、図示しない所定の通信網と有線または無線で接続され、配信装置100との間で情報の送受信を行う。
(記憶部12)
記憶部12は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部12は、例えば、端末装置10にインストールされているアプリケーションに関する情報、例えばプログラム等を記憶する。
(入力部13)
入力部13は、ユーザからの各種操作を受け付ける。例えば、入力部13は、タッチパネル機能により表示面(例えば表示部153)を介してユーザからの各種操作を受け付けてもよい。また、入力部13は、端末装置10に設けられたボタンや、端末装置10に接続されたキーボードやマウスからの各種操作を受け付けてもよい。
(出力部14)
出力部14は、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等によって実現されるタブレット端末等の表示画面であり、各種情報を表示するための表示装置である。
(制御部15)
制御部15は、例えば、CPUやMPU等によって、端末装置10内部の記憶部12などの記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、インストールされているアプリケーションのプログラムが含まれる。また、制御部15は、例えば、ASICやFPGA等の集積回路により実現される。
図6に示すように、制御部15は、送信部151と、受信部152と、表示部153とを有し、以下に説明する配信処理の機能や作用を実現または実行する。なお、制御部15の内部構成は、図6に示した構成に限られず、後述する配信処理を行う構成であれば他の構成であってもよい。また、制御部15が有する各処理部の接続関係は、図6に示した接続関係に限られず、他の接続関係であってもよい。
送信部151は、入力部13により受け付けたユーザ操作に従って、配信装置100へコンテンツの配信要求を送信する。例えば、送信部151は、起動したブラウザ等のアプリからの配信要求を配信装置100へ送信する。受信部152は、配信装置100から配信されたコンテンツを受信する。図1に示す例においては、受信部152は、ブレンドコンテンツBC11を受信する。
表示部153は、受信部152により受信されたコンテンツを表示する。図1に示す例においては、表示部153は、受信部152により受信されたブレンドコンテンツBC11を表示する。例えば、表示部153は、ブレンドコンテンツBC11のうち配置順が上位のコンテンツである記事E、記事B、記事C、記事Hを表示する。なお、端末装置10を利用するユーザU1は、表示部153によりブレンドコンテンツBC11が表示された端末装置10の画面にタッチしスクロール操作等を行うことにより、記事Hから下の記事F、記事A等を順次表示させる。
なお、上述した制御部15による選択処理等の処理は、例えば、JavaScript(登録商標)などにより実現されてもよい。また、上述した選択処理が所定のアプリケーションにより行われる場合や表示処理が専用アプリにより行われる場合、制御部15は、例えば、所定のアプリや専用アプリを制御するアプリ制御部を有してもよい。
〔4.マス向けコンテンツの抽出〕
次に、図7を用いて、実施形態に係る配信装置100におけるマス向けコンテンツの抽出について説明する。図7は、実施形態に係るマス向けコンテンツの抽出処理の一例を示す図である。
まず、図7に示す例において、配信装置100は、所定の記事DBであるデータベースDB10に格納された記事からマス向けコンテンツの抽出を行う。例えば、データベースDB10は、コンテンツ情報記憶部121であってもよい。
そして、配信装置100は、各種のマスロジックを適宜用いて、各単語のスコアの算出や重みの導出を行う。例えば、配信装置100は、所定のロジックAであるマスロジックLG11や、所定のロジックBであるマスロジックLG12や、所定のロジックCであるマスロジックLG13等を用いて各単語のスコアの算出や重みの導出を行う。
例えば、マスロジックLG11は、図1に示す例における編集者E1の選択記事情報に基づいて、各単語のスコアの算出や重みの導出を行う。具体的には、マスロジックLG11は、所定のスコア算出ロジックにより算出した各単語のスコアと編集者E1の選択記事情報とに基づいて、各単語の重みの導出を行ってもよい。
また、例えば、マスロジックLG12は、特許文献2に示す技術に基づいて、伝聞情報に含まれる単語のスコアを小さくする等により、各単語のスコアの算出や重みの導出を行う。このようなマスロジックLG12を用いて各単語のスコアの算出や重みの導出を行うことにより、配信装置100は、伝聞情報に該当するようなコンテンツのスコアを低くすることができる。すなわち、配信装置100は、伝聞情報に該当するようなコンテンツがマス向けコンテンツとして抽出されることを抑制できる。
また、例えば、マスロジックLG13は、所定のSNS(Social Networking Service)において投稿された文字情報に所定の閾値以上の頻度で含まれる単語のスコアを大きくすること等により、各単語のスコアの算出や重みの導出を行う。このようなマスロジックLG13を用いて各単語のスコアの算出や重みの導出を行うことにより、配信装置100は、大衆が注目するコンテンツのスコアを高くすることができる。すなわち、配信装置100は、大衆が注目するコンテンツがマス向けコンテンツとして抽出されやすくすることができる。
そして、配信装置100は、機械学習アルゴリズムによる重要度判定AL11を行う。例えば、配信装置100は、各種マスロジックLG11〜LG13等に基づいて導出された各単語の重みに基づいて、各コンテンツのスコアを算出する。そして、配信装置100は、スコアの高いコンテンツほど重要度が高いと判定する。
また、配信装置100は、重要度判定AL11を行った後、提供元選定ロジックLG14を行う。ここで、重要度判定AL11においては、同様の内容についてのコンテンツが複数の提供元から入稿された場合、それらのコンテンツは高いスコアが付与される可能性が高い。そのため、配信装置100が単純にスコアの高い方から順にコンテンツを抽出した場合、同じような内容のコンテンツが複数抽出される可能性が高い。そこで、配信装置100は、提供元選定ロジックLG14により、同様の内容についてのコンテンツが複数の提供元から入稿されている場合、1つの提供元のコンテンツのみを選定する。
例えば、配信装置100は、同一話題(単語)に対して複数の提供元からの同時入稿があった場合、過去のメイン表示領域EA11(図9参照)への各提供元の掲載実績によって、1つのコンテンツのみを選定する。例えば、配信装置100は、メイン表示領域EA11(図9参照)における対応するカテゴリに対する各提供元の掲載実績によって、1つのコンテンツのみを選定してもよい。具体的には、配信装置100は、経済に関するコンテンツの掲載をする提供元を選定する場合、メイン表示領域EA11(図9参照)における経済に関する各提供元の掲載実績によって、1つのコンテンツのみを選定してもよい。また、配信装置100は、例えば、蓋然性を決定する所定のパラメータTを導入し、乱択性についてはハッシュ関数などを利用することで、同一時刻の同一の提供元の組み合わせに対しては、一意の提供元が選択されるようにしてもよい。
その後、図示することは省略するが、配信装置100は、コンテンツの見出し形態素同士のコサイン類似度を計測し、閾値に達した場合は配置順の上位のものを優先して掲出してもよい。すなわち、配信装置100は、所定の重複排除処理をおこなってもよい。また、配信装置100は、所定の編集者(例えば編集者E1)が決定したコンテンツのカテゴリごとの順序のルールに基づいて、掲出リストを作成してもよい。例えば、配信装置100は、掲出リストとしてマス向けコンテンツMC11を抽出する。
〔5.ブレンドコンテンツ配信〕
次に、図8を用いて、実施形態に係る配信システム1におけるブレンドコンテンツの配信選択処理の手順について説明する。図8は、実施形態に係るコンテンツの配信の一例を示すフローチャートである。
図8に示すように、配信装置100の受付部131は、コンテンツの配信要求を受け付ける(ステップS101)。その後、配信装置100の第1抽出部134は、所定のマスロジックによりマス向けコンテンツを抽出する(ステップS102)。また、配信装置100の第2抽出部135は、ユーザ情報に基づいて個人向けコンテンツを抽出する(ステップS103)。配信装置100の決定部136は、所定のロジックによりマス向けコンテンツと個人向けコンテンツとを合わせたブレンドコンテンツを決定する(ステップS104)。その後、配信装置100の配信部137は、ブレンドコンテンツを配信する(ステップS105)。
〔6.コンテンツの表示〕
次に、図9を用いて、実施形態に係る配信システム1において配信されたコンテンツの端末装置10における表示について説明する。図9は、実施形態に係る端末装置におけるコンテンツの表示の一例を示す図である。なお、図9に示す例においては、配信装置100が決定したブレンドコンテンツとともに、図1に示す編集者E1が選択したコンテンツも配信され表示される場合を示す。なお、編集者E1が選択したコンテンツの配信は、配信装置100が行ってもよいし、編集者端末50等の他の情報処理装置が行ってもよい。
図9に示す例では、端末装置10の画面DP10において、タブ「すべて」が選択された状態を示す。また、図9に示す例において、メイン表示領域EA11には、編集者E1が選択した複数のコンテンツを含むコンテンツ群CG10が表示される。また、その下部に位置するおすすめ表示領域BA11には、配信装置100が決定し配信したブレンドコンテンツが表示される。
図9では、ユーザが画面DP10にタッチした指F1を移動させることにより、メイン表示領域EA11の下部の表示領域BA11を表示させるスクロール操作を行う(ステップS21)。これにより、端末装置10において、表示領域BA11が表示されるように画面DP10の表示が変更される(ステップS22)。
ここで、図9に示す例では、図1に示すブレンドコンテンツBC11が端末装置10に配信された場合を示す。つまり、図9中のコンテンツCT15は、図1に示すマス向けコンテンツMC11のうちスコアが最も高い「1.5」である記事Eに対応しており、経済に関する記事が表示領域BA11の最上位に表示される。また、図9中のコンテンツCT12は、図1に示す個人向けコンテンツPC11のうち優先順位が最も高い記事Bに対応しており、スポーツに関する記事が経済に関する記事の下に続けて表示される。
また、図9中のコンテンツCT13は、図1に示すマス向けコンテンツMC11のうちスコアが記事Eの次に高い「1.2」である記事Cに対応しており、地域に関する記事がスポーツに関する記事の下に続けて表示される。また、図9中のコンテンツCT18は、図1に示す個人向けコンテンツPC11のうち優先順位が記事Bの次に高い記事Hに対応しており、芸能に関する記事が地域に関する記事の下に続けて表示される。
このように、端末装置10は、メイン表示領域EA11の下に続けて、おすすめ表示領域BA11を表示することにより、ユーザが下にあるコンテンツに関心や興味を持つ可能性を高めることができる。なお、端末装置10を利用するユーザは、端末装置10の画面DP10にタッチしさらにスクロール操作等を行うことにより、記事Hから下の記事FであるコンテンツCT16や記事AであるコンテンツCT11等を順次表示させることができる。
〔7.効果〕
上述してきたように、実施形態に係る配信装置100は、算出部133と、抽出部(実施形態においては「第1抽出部134」。以下同じ。)と、を有する。算出部133は、コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する。抽出部は、算出部133により算出された各コンテンツのスコアに基づいて、複数のコンテンツからユーザに配信するコンテンツを抽出する。
これにより、実施形態に係る配信装置100は、コンテンツ群から選択したコンテンツを提供するサービスにおける基準に基づいて、コンテンツを抽出することができる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定の編集者が選択するコンテンツまたは大衆が注目するコンテンツのスコアが高くなるような基準に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、所定の編集者が選択するようなコンテンツをマス向けコンテンツとして抽出することができる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100は配信部137をさらに有する。配信部137は、抽出部により抽出されたコンテンツ(実施形態においては「マス向けコンテンツMC11」。以下同じ。)と、ユーザに関するユーザ情報に基づいて抽出された他のコンテンツ(実施形態においては「個人向けコンテンツPC11」。以下同じ。)とを、ユーザが利用する端末装置10に配信する。
これにより、実施形態に係る配信装置100は、所定の編集者が選択するようなマス向けコンテンツとユーザが興味や関心のあるコンテンツとを配信することにより、社会的に関心の高いコンテンツとユーザが興味を持ちそうなコンテンツとの両方を含むコンテンツを配信できる。したがって、配信装置100は、適切なコンテンツを配信することができる。
また、実施形態に係る配信装置100において、配信部137は、抽出部により抽出されたコンテンツと、ユーザに関するユーザ情報に基づいて抽出された他のコンテンツとを所定の割合で配信する。
これにより、実施形態に係る配信装置100は、マス向けコンテンツと個人向けコンテンツとを所定の割合でブレンドしたブレンドコンテンツを配信する。これにより、配信装置100は、ユーザの興味や関心に基づいた記事と社会的な重要性に基づいた記事とをバランスよくユーザに配信することができる。
また、実施形態に係る配信装置100において、算出部133は、各コンテンツに関する社会生活での重要度または各コンテンツに関する大衆の関心に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、社会生活での重要度が高いコンテンツや大衆の関心が高いコンテンツのスコアが高くなるようにスコアを算出することにより、社会生活での重要度が高いコンテンツや大衆の関心が高いコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、ユーザに関するユーザ情報以外の情報に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、ユーザの関心や興味があるコンテンツのみがマス向けコンテンツとして抽出されることを抑制する。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定のサービスにおいて掲載されるコンテンツに含まれる単語に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、所定のサービスにおいて掲載されるコンテンツに含まれる単語の重みが重くなるような各単語の重みに基づいてスコアを算出することにより、所定のサービスにおいて掲載されるようなコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定のサービスにおいて掲載されたコンテンツの履歴に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、所定のサービスにおけるコンテンツの掲載履歴に含まれるコンテンツに類似するようなコンテンツのスコアが高くなるようにスコアを算出することにより、所定のサービスにおいて掲載されるようなコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定のサービスにおけるコンテンツの抽出基準に関する情報に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、所定のサービスにおけるコンテンツの抽出基準を満たすコンテンツのスコアが高くなるようにスコアを算出することにより、所定のサービスにおいて掲載されるようなコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に関する情報に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に含まれる単語の重みが重くなるような各単語の重みに基づいてスコアを算出することにより、所定の提供元が提供するコンテンツ提供サービスにおいて掲載されるようなコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
また、実施形態に係る配信装置100において、算出部133は、所定のネットワークサービスにおいて投稿される情報に基づいて、複数のコンテンツのスコアを算出する。
これにより、実施形態に係る配信装置100は、例えば、所定のネットワークサービスにおいて投稿される文字情報に多く含まれる単語の重みが重くなるような各単語の重みに基づいてスコアを算出することにより、所定のネットワークサービスにおいて多数のユーザが興味や関心を示すようなコンテンツがマス向けコンテンツとして抽出されやすくなる。したがって、配信装置100は、適切なコンテンツを抽出することができる。
〔8.ハードウェア構成〕
上述してきた実施形態に係る配信装置100は、例えば図10に示すような構成のコンピュータ1000によって実現される。図10は、配信装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が決定したデータをネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、決定したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る配信装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受付部は、受付手段や受付回路に読み替えることができる。
1 配信システム
100 配信装置(抽出装置)
121 コンテンツ情報記憶部
122 学習情報記憶部
123 ユーザ情報記憶部
130 制御部
131 受付部
132 学習部
133 算出部
134 第1抽出部(抽出部)
135 第2抽出部
136 決定部
137 配信部

Claims (13)

  1. コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する算出部と、
    前記算出部により算出された各コンテンツのスコアに基づいて、前記複数のコンテンツからユーザに配信するコンテンツを抽出する抽出部と、
    を備えたことを特徴とする抽出装置。
  2. 前記算出部は、
    所定の編集者が選択するコンテンツまたは大衆が注目するコンテンツの前記スコアが高くなるような基準に基づいて、複数のコンテンツの前記スコアを算出する
    ことを特徴とする請求項1に記載の抽出装置。
  3. 前記抽出部により抽出されたコンテンツと、前記ユーザに関するユーザ情報に基づいて抽出された他のコンテンツとを、前記ユーザが利用する端末装置に配信する配信部
    をさらに備えたことを特徴とする請求項1または請求項2に記載の抽出装置。
  4. 前記配信部は、
    前記抽出部により抽出されたコンテンツと、前記ユーザに関するユーザ情報に基づいて抽出された他のコンテンツとを所定の割合で配信する
    ことを特徴とする請求項3に記載の抽出装置。
  5. 前記算出部は、
    前記各コンテンツに関する社会生活での重要度または前記各コンテンツに関する大衆の関心に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項1〜4のいずれか1項に記載の抽出装置。
  6. 前記算出部は、
    前記ユーザに関するユーザ情報以外の情報に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項1〜5のいずれか1項に記載の抽出装置。
  7. 前記算出部は、
    所定のサービスにおいて掲載されるコンテンツに含まれる単語に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項1〜6のいずれか1項に記載の抽出装置。
  8. 前記算出部は、
    前記所定のサービスにおいて掲載されたコンテンツの履歴に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項7に記載の抽出装置。
  9. 前記算出部は、
    前記所定のサービスにおけるコンテンツの抽出基準に関する情報に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項7または請求項8に記載の抽出装置。
  10. 前記算出部は、
    所定の提供元が提供するコンテンツ提供サービスにおいて掲載された記事に関する情報に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項1〜9のいずれか1項に記載の抽出装置。
  11. 前記算出部は、
    所定のネットワークサービスにおいて投稿される情報に基づいて、前記複数のコンテンツのスコアを算出する
    ことを特徴とする請求項1〜10のいずれか1項に記載の抽出装置。
  12. コンピュータが実行する抽出方法であって、
    コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する算出工程と、
    前記算出工程により算出された各コンテンツのスコアに基づいて、前記複数のコンテンツからユーザに配信するコンテンツを抽出する抽出工程と、
    を含むことを特徴とする抽出方法。
  13. コンテンツ群から選択したコンテンツを提供するサービスにおいてコンテンツを選択する基準に基づいて、複数のコンテンツのスコアを算出する算出手順と、
    前記算出手順により算出された各コンテンツのスコアに基づいて、前記複数のコンテンツからユーザに配信するコンテンツを抽出する抽出手順と、
    をコンピュータに実行させることを特徴とする抽出プログラム。
JP2015177054A 2015-09-08 2015-09-08 抽出装置、抽出方法、及び抽出プログラム Active JP6367776B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015177054A JP6367776B2 (ja) 2015-09-08 2015-09-08 抽出装置、抽出方法、及び抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015177054A JP6367776B2 (ja) 2015-09-08 2015-09-08 抽出装置、抽出方法、及び抽出プログラム

Publications (2)

Publication Number Publication Date
JP2017054269A true JP2017054269A (ja) 2017-03-16
JP6367776B2 JP6367776B2 (ja) 2018-08-01

Family

ID=58320847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015177054A Active JP6367776B2 (ja) 2015-09-08 2015-09-08 抽出装置、抽出方法、及び抽出プログラム

Country Status (1)

Country Link
JP (1) JP6367776B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022103656A (ja) * 2020-12-28 2022-07-08 ヤフー株式会社 コンテンツ提供装置、コンテンツ提供方法、及びコンテンツ提供プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
JP2011166621A (ja) * 2010-02-12 2011-08-25 Nomura Research Institute Ltd 映像コンテンツの推奨装置、推奨する映像コンテンツの決定方法、及びコンピュータプログラム
JP2012118624A (ja) * 2010-11-29 2012-06-21 Sharp Corp コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
JP2011166621A (ja) * 2010-02-12 2011-08-25 Nomura Research Institute Ltd 映像コンテンツの推奨装置、推奨する映像コンテンツの決定方法、及びコンピュータプログラム
JP2012118624A (ja) * 2010-11-29 2012-06-21 Sharp Corp コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022103656A (ja) * 2020-12-28 2022-07-08 ヤフー株式会社 コンテンツ提供装置、コンテンツ提供方法、及びコンテンツ提供プログラム
JP7193523B2 (ja) 2020-12-28 2022-12-20 ヤフー株式会社 コンテンツ提供装置、コンテンツ提供方法、及びコンテンツ提供プログラム

Also Published As

Publication number Publication date
JP6367776B2 (ja) 2018-08-01

Similar Documents

Publication Publication Date Title
US11119627B2 (en) Information display method, device, apparatus and storage medium
US9256826B2 (en) Predicting reactions to short-text posts
US10031738B2 (en) Providing application recommendations
US9965522B2 (en) Mobile application search ranking
US10621281B2 (en) Populating values in a spreadsheet using semantic cues
US11805165B2 (en) Computerized system and method for an interactive online learning experience
US11036810B2 (en) System and method for determining quality of cited objects in search results based on the influence of citing subjects
US9280597B2 (en) System and method for customizing search results from user's perspective
US9268858B1 (en) Previewing content based on detected customer activities
US20160042071A1 (en) System and method for search of sources and targets based on relative expertise of the sources
US20130325779A1 (en) Relative expertise scores and recommendations
US11455352B2 (en) Recommending contents using a base profile
US9471570B2 (en) Method and system for user selection of query suggestions
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
US11205195B2 (en) Information processing device, information processing method, and information processing program
JP6113797B2 (ja) 決定装置、決定方法、及び決定プログラム
US20160034957A1 (en) Generating Advertisements for Search Results Associated With Entities Based on Aggregated Entity Bids
US10990620B2 (en) Aiding composition of themed articles about popular and novel topics and offering users a navigable experience of associated content
JP2016001407A (ja) 検索装置、検索方法及び検索プログラム
JP6414192B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム
JP6367776B2 (ja) 抽出装置、抽出方法、及び抽出プログラム
US20160034958A1 (en) Generating Advertisements For Search Results That Are Associated With Entities
US20160125061A1 (en) System and method for content selection
JP6584240B2 (ja) 生成装置、生成方法、及び生成プログラム
JP6019156B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170508

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170516

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20170804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180705

R150 Certificate of patent or registration of utility model

Ref document number: 6367776

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250