JP6552759B1 - データ処理装置及びデータ処理方法 - Google Patents

データ処理装置及びデータ処理方法 Download PDF

Info

Publication number
JP6552759B1
JP6552759B1 JP2019030594A JP2019030594A JP6552759B1 JP 6552759 B1 JP6552759 B1 JP 6552759B1 JP 2019030594 A JP2019030594 A JP 2019030594A JP 2019030594 A JP2019030594 A JP 2019030594A JP 6552759 B1 JP6552759 B1 JP 6552759B1
Authority
JP
Japan
Prior art keywords
program
content
advertisement
group
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019030594A
Other languages
English (en)
Other versions
JP2020137005A (ja
Inventor
了敬 木塚
了敬 木塚
勝 三國
勝 三國
逸美 松岡
逸美 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Video Research Co Ltd
Original Assignee
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Video Research Co Ltd filed Critical Video Research Co Ltd
Priority to JP2019030594A priority Critical patent/JP6552759B1/ja
Application granted granted Critical
Publication of JP6552759B1 publication Critical patent/JP6552759B1/ja
Publication of JP2020137005A publication Critical patent/JP2020137005A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】 配信済みの番組等を接触者の評価に基づいて適切に分類する。【解決手段】 本発明では、配信済み内容に接触した接触者の配信済み内容に対する評価を示す評価データを、配信済み内容毎及び接触者毎に記憶し、配信済み内容を説明するための説明情報を示すメタデータを、配信済み内容毎に記憶し、配信済み内容毎及び接触者毎の評価データと、配信済み内容毎のメタデータとに基づいて、評価から導出される指標と説明情報との対応関係を特定し、複数の配信済み内容の各々を対象とし、対象のメタデータが示す説明情報を対応関係に適用することで、対象の指標を割り出し、割り出した指標に基づき、複数の配信済み内容の各々を複数のグループのいずれかに分類する。【選択図】図7

Description

本発明は、過去に配信された配信済み内容に関するデータを処理するデータ処理装置及びデータ処理方法に係り、特に、配信済み内容の説明情報を示すメタデータと、配信済み内容に接触した接触者の配信済み内容に対する評価を示す評価データと、を処理するデータ処理装置及びデータ処理方法に関する。
テレビ又はラジオで放送される番組及びコマーシャル、並びにネット配信されるデジタルコンテンツ等(以下、番組等)は、ジャンル及び属性などに基づいて分類されることがある。このように番組等が分類されることは、番組等の接触者(詳しくは、テレビ聴取者、ラジオ聴取者及びネット利用者等)が自分の嗜好に合致する番組等を見つけ易くなる等の点において有用である。また、番組等の分類は、広告主が出稿を計画する際に役立ち、例えば、適当な分類を選択して、その分類に該当する番組の放送時間帯に出稿すれば、効率よく広告を打つことができる。
また、番組等の分類としては、将来配信予定の番組等を対象とする分類が挙げられると共に、既に配信済みの番組等を対象とする分類も考えられる。後者の分類は、例えば、配信済みの番組等の接触状況(詳しくは、視聴率、聴取率、及びネット利用者数等)を分析する際に必要とされ、具体的には、接触状況を分類別に分析する場合に利用される。
ところで、番組等の分類は、一般的な属性項目、具体的にはジャンル、出演者、内容、放送(配信)日時、及び放送局等の配信元等に応じて行われることが一般的である(例えば、特許文献1参照)。特許文献1では、テレビ番組のメタデータを解析して、テレビ番組の放送時間、ジャンル及び出演者等の属性項目を特定し、特定した属性項目に基づいてテレビ番組を分類することになっている。また、特許文献1には、番組メタデータに含まれる番組タイトルを形態素解析し、その解析結果に基づいてテレビ番組を分類することも開示されている。
特開2007−200339号公報
配信済みの番組等を分類する際に利用される情報としては、上述したように番組等の説明情報(メタ情報)が挙げられる。一方で、分類用の情報としては、番組等の接触者の当該番組等に対する評価(例えば、番組等に対する感想及び視聴感等)も考えられる。そして、接触者の評価に基づいて番組等を分類できれば、その分類結果の利用価値が高まり、例えば、接触時における接触者の心理的状態が互いに類似する複数の番組等を見つけ出すことが可能となる。
ただし、接触者が変われば同じ番組等であっても評価が変わり得るため、接触者の評価に基づいて番組等を分類する場合には、上記の事情を考慮する必要がある。すなわち、接触者の評価に基づく番組等の分類については、配信済みの番組等に対する接触者の評価が多様であることを踏まえて適切に分類することが求められている。
そこで、本発明は、上記の事情に鑑みてなされたものであり、以下に示す目的を解決することを課題とする。
具体的に説明すると、本発明は、上記従来技術の問題点を解決し、配信済みの番組等を接触者の評価に基づいて適切に分類することが可能なデータ処理装置及びデータ処理方法を提供することを目的とする。
また、配信済みの番組等を接触者の評価に基づいてグループ分け(分類)した場合、将来配信される予定の番組等がどのグループに属するかを判定できれば、当該配信予定の番組等に対する接触者(厳密には、接触予定者)の評価を推測することができる。このような機能を有するデータ処理装置は、放送業界及び広告業界等において特に有用であり、その開発が期待される。
そこで、本発明の他の目的は、配信済みの番組等の分類(グループ分け)を利用して、将来配信予定の番組等に対する評価(例えば、感想など)を推測することが可能なデータ処理装置を実現することをも目的とする。
上記の目的を達成するために、本発明のデータ処理装置は、配信済み内容に接触した接触者の前記配信済み内容に対する評価を示す評価データを、前記配信済み内容毎及び前記接触者毎に記憶する評価データ記憶部と、前記配信済み内容を説明するための説明情報を示すメタデータを、前記配信済み内容毎に記憶するメタデータ記憶部と、前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータとに基づいて、前記評価から導出される指標と前記説明情報との対応関係を特定する特定部と、複数の前記配信済み内容の各々を対象とし、該対象の前記メタデータが示す前記説明情報を前記対応関係に適用することで、前記対象の前記指標を割り出す割り出し部と、前記割り出し部が割り出した前記指標に基づき、複数の前記配信済み内容の各々を複数のグループのいずれかに分類する分類部と、を有することを特徴とする。
上記のように構成された本発明のデータ処理装置は、配信済み内容(番組等)に対する接触者の評価に基づいて、配信済み内容を分類する。より詳しく説明すると、本発明のデータ処理装置は、配信済み内容の説明情報を示すメタデータと接触者毎の評価データとに基づいて、評価から導出される指標と説明情報との対応関係を特定する。この対応関係は、各配信済み内容に対する接触者毎の評価を反映したものである。
そして、本発明のデータ処理内容は、上記の対応関係により、複数の配信済み内容の各々について指標を割り出し、割り出した指標に基づいて、複数の配信済み内容をグループ分けする。以上の構成によれば、上記の対応関係に適用して配信済み内容の分類を行うので、接触者の評価が多様に変わり得ることを考慮しつつ、各配信済み内容を接触者の評価に基づいて適切に分類することが可能となる。
また、上記のデータ処理装置において、前記特定部は、前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータと、を用いた機械学習を実施して、前記対応関係を示す数理モデルを構築することにより前記対応関係を特定すると、好ましい。
上記の構成であれば、機械学習による数理モデルの構築を通じて、上述の対応関係を的確に特定することが可能となる。
また、上記のデータ処理装置において、前記配信済み内容は、過去に放送された放送済み番組及び放送済み広告のうちの少なくとも一つであってもよい。
上記の構成であれば、過去に放送された放送済み番組及び放送済み広告のうちの少なくとも一方を、接触者(具体的には、視聴者又は聴取者等)の評価に基づいて分類することが可能となる。
また、上記のデータ処理装置において、前記配信済み内容に対しては分類カテゴリが予め設定されており、前記分類部は、前記分類カテゴリ別に、前記分類カテゴリに属する複数の前記配信済み内容の各々を、前記割り出し部が割り出した前記指標に基づいて前記複数のグループのいずれかに分類すると、より好ましい。
上記の構成であれば、分類カテゴリ毎に、当該分類カテゴリに属する複数の配信済み内容を分類するため、分類カテゴリを大分類とした体系的な分類が可能となり、分類結果の利便性が向上する。
また、上記のデータ処理装置において、前記評価データは、前記配信済み内容に対する前記接触者の感想に関するアンケート結果を示すデータであると、さらに好ましい。このような構成であれば、複数の配信済み内容のそれぞれを、接触者の感想に基づいて分類することが可能となる。
さらに、前記アンケート結果を示す前記評価データの一部が、前記対応関係の妥当性についての検証用データとして用いられると、一段と好ましい。このような構成であれば、対応関係の妥当性を検証することができるので、対応関係を用いたグループ分けの信憑性が高くなる。
また、上記のデータ処理装置において、将来配信される配信予定内容の前記説明情報として入力された入力情報を取得する入力情報取得部と、前記複数のグループのうち、前記配信予定内容が属するグループを判定する判定部と、を有し、前記割り出し部は、前記入力情報を前記対応関係に適用することで、前記配信予定内容の前記指標を割り出し、前記判定部は、割り出された前記配信予定内容の前記指標に基づいて、前記配信予定内容が属するグループを判定すると、より一層好ましい。
上記の構成であれば、将来配信される配信予定内容の説明情報から、配信予定内容の指標を割り出し、割り出した指標に基づいて、配信予定内容が属するグループを決める。このように上記の構成によれば、将来配信予定の番組等がどのグループに属するかを事前に把握しておくことができる。
また、上記のデータ処理装置において、前記入力情報取得部は、互いに異なる第一配信予定内容及び第二配信予定内容のそれぞれについて、前記入力情報を取得し、前記割り出し部は、前記第一配信予定内容及び前記第二配信予定内容のそれぞれについて、前記入力情報を前記対応関係に適用して前記指標を割り出し、前記判定部は、前記第一配信予定内容及び前記第二配信予定内容のそれぞれについて割り出された前記指標に基づいて、前記第一配信予定内容が属するグループ、及び、前記第二配信予定内容が属するグループを判定し、前記第一配信予定内容が属するグループと前記第二配信予定内容が属するグループとの間の類似度合いを算出する類似度合い算出部を更に有すると、尚一層好ましい。
上記の構成によれば、将来配信される第一配信予定内容及び第二配信予定内容のそれぞれについて、グループを判定することができる。また、上記の構成では、第一配信予定内容が属するグループと、第二配信予定内容が属するグループと、の間の類似度合いを算出することができる。これにより、グループ同士のマッチングが実施可能となるので、例えば、ある第一配信予定内容を配信する者に、当該第一配信予定内容が属するグループと類似度合いが高いグループに属する第二配信予定内容を提示することが可能となる。
また、上記のデータ処理装置において、前記第一配信予定内容は、将来放送される広告であり、前記第二配信予定内容は、将来放送される番組であると、益々好ましい。
上記の構成では、将来放送される広告及び番組のそれぞれについてグループを判定し、また、グループ間の類似度合いを算出する。これにより、将来放送される広告が属するグループと、将来放送される番組が属するグループと、のマッチングが実施可能となり、例えば、ある広告の出稿を計画する者に対して、その広告が属するグループと類似度合いが高いグループに属する番組を提示することが可能となる。そして、提示された番組の放送時間中に上記の広告を放送すれば、その広告効果を向上させることが可能となる。
また、上記のデータ処理装置において、前記メタデータが示す前記説明情報を数値化する処理を実施する数値化処理部を有してもよい。かかる構成において、前記類似度合い算出部は、前記数値化処理部によって数値化された前記第一配信予定内容の前記説明情報と、前記数値化処理部によって数値化された前記第二配信予定内容の前記説明情報と、に基づいて、前記第一配信予定内容が属するグループと前記第二配信予定内容が属するグループとの間の類似度合いを算出すると、より好適である。
上記の構成では、第一配信予定内容が属するグループと、第二配信予定内容が属するグループとの類似度合いを算出する際、数値化された各配信予定内容の説明情報を用いるので、類似度合いを適切に算出することが可能となる。
また、上記のデータ処理装置において、前記特定部は、前記指標と数値化された前記説明情報との前記対応関係を特定すると、更に好適である。
上記の構成では、数値化された説明情報を用いて、対応関係をより適切に特定することが可能となる。
また、前述した課題を解決するために、本発明のデータ処理方法は、記憶装置が、配信済み内容に接触した接触者の前記配信済み内容に対する評価を示す評価データを、前記配信済み内容毎及び前記接触者毎に記憶し、記憶装置が、前記配信済み内容を説明するための説明情報を示すメタデータを、前記配信済み内容毎に記憶し、コンピュータが、前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータとに基づいて、前記評価から導出される指標と前記説明情報との対応関係を特定し、コンピュータが、複数の前記配信済み内容の各々を対象とし、該対象の前記メタデータが示す前記説明情報を前記対応関係に適用することで、前記対象の前記指標を割り出し、コンピュータが、割り出された前記指標に基づき、複数の前記配信済み内容の各々を複数のグループのいずれかに分類することを特徴とする。
上記の方法によれば、接触者の評価が変わり得ることを考慮しつつ、複数の配信済み内容のそれぞれを、接触者の評価に基づいて適切に分類することが可能である。
本発明によれば、接触者の評価が変わり得ることを考慮しつつ、複数の配信済み内容のそれぞれを、接触者の評価に基づいて適切に分類することが可能となる。
また、本発明によれば、将来配信予定の内容を、配信済み内容と同様にグループ分けすることができるので、当該配信予定内容に対する接触者(厳密には、接触予定者)の評価を予測することが可能である。
本発明のデータ処理装置を利用したサービスの提供者、及び、その関係者を示す図である。 本発明のデータ処理装置を利用したサービスの説明図である。 本発明のデータ処理装置を含むシステムの構成の一例を示す図である。 データ処理装置の機能を示すブロック図である。 グループ分けのイメージを示す概念図である。 グループに属する番組/広告の説明情報に対する処理についての説明図である。 グループ分け処理の流れを示す図である。 グループ判定処理の流れを示す図である。 類似度合い算出処理の流れを示す図である。 お薦め広告枠の連絡画面を示す図である。
本発明の一実施形態(本実施形態)に係る調査結果処理装置及び調査結果処理方法について、添付の図面を参照しながら、以下に詳細に説明する。
なお、以下に説明する実施形態は、本発明の理解を容易にするために挙げた一例にすぎず、本発明を限定するものではない。すなわち、本発明は、その趣旨を逸脱しない限りにおいて、以下に説明する実施形態から変更又は改良され得る。また、当然ながら、本発明には、その等価物が含まれる。
また、本明細書において、「装置」とは、単独で特定の機能を発揮する一つの装置の他、分散して存在しているものの特定の機能を発揮するために協働する複数の装置をも含むものである。
また、以下の説明において、配信される/配信された「内容」とは、メディアを通じて公衆向けに配信される/配信された内容であり、具体的には、テレビ(インターネットテレビを含む)の番組及び広告、ラジオ(IPサイマルラジオを含む)の番組及び広告、並びに、Webコンテンツ及びWeb広告が該当する。
なお、以下では、配信される/配信された「内容」の一例として、テレビ番組(番組に相当)及びテレビCM(広告に相当)を挙げて説明することとする。ただし、本発明の構成及び効果は、当然ながら、テレビ番組及びテレビCM以外の内容にも適用され得る。
また、以下の説明において、「接触」とは、テレビ番組及びテレビCMを視聴する行為に該当し、「接触者」とは、テレビ番組及びテレビCMの視聴者を意味する。ここで、「視聴」は、放送される番組及び広告をリアルタイムで視聴することの他に、番組及び広告を録画等して一定期間内に再生して視聴したりWeb配信されるものを視聴したりする、いわゆるタイム視聴を含む。
なお、テレビ番組及びテレビCM以外の内容への「接触者」について説明しておくと、例えば、ラジオ番組及びラジオCMについては、これらを聴取する者が接触者に該当する。また、Webコンテンツ及びWeb広告については、これらを利用(閲覧)する者が接触者に該当する。
また、以下の説明において、「接触者」である視聴者は、個人であってもよく、あるいは、個人が属するグループ(例えば、世帯)であってもよい。
<<本実施形態のデータ処理装置を利用したサービスについて>>
本実施形態のデータ処理装置及びデータ処理方法の説明に先立ち、本実施形態のデータ処理装置を利用したサービスについて、図1及び図2を参照しながら説明する。図1は、本実施形態のデータ処理装置を利用したサービスの提供者、及び、その関係者を示す図である。図2は、本実施形態のデータ処理装置を利用したサービスの説明図である。
本実施形態のデータ処理装置は、図1に図示の調査会社Rによって利用される。調査会社Rは、本実施形態のデータ処理装置を利用したサービスを提供する者であり、具体的にはレコメンドサービスを提供する。レコメンドサービスは、広告枠の購入を検討している者(例えば、図1に図示の広告会社C)に対して、お薦め広告枠を提示するサービスである。
ここで、「お薦め広告枠」とは、将来放送される予定の広告(以下、放送予定広告)を効果的に打つための広告枠である。より具体的に説明すると、お薦め広告枠は、将来放送される番組のうち、視聴者の評価が放送予定広告と類似すると期待される番組の放送時間(例えば、図2中、ハッチング付きの時間帯)中に設定されたスポットCM枠である。なお、お薦め広告枠は、スポットCM枠に限定されず、タイムCM枠(いわゆる提供スポンサー枠)であってもよい。
また、調査会社Rは、レコメンドサービスを提供するにあたり、図2に示すように、過去に放送されたテレビ番組及びテレビCM(以下、放送済み番組及び放送済み広告)を分類する。具体的に説明すると、調査会社Rは、放送済み番組に関するメタデータ(以下、番組メタデータ)を取得する。番組メタデータは、放送済み番組を説明するための説明情報、具体的には番組のジャンル、出演者、内容、及びタイトル等を示すデータであり、例えば、その番組を放送したテレビ局Tから取得可能である。なお、番組メタデータが示す説明情報、及び番組メタデータの取得経路については、特に制限されるものではなく、例えば、番組制作会社等から取得することも可能である。
また、調査会社Rは、放送済み番組に対する評価を示す評価データ(以下、番組評価データ)を取得する。番組評価データは、放送済み番組を視聴した視聴者の、放送済み番組に対する評価を示すデータである。より具体的に説明すると、調査会社Rは、図1に図示した複数のモニタMを対象としてアンケート調査を実施する。このアンケート調査において、各モニタMは、調査期間中に放送されたテレビ番組のうち、実際に視聴したテレビ番組(放送済み番組)に対する感想を回答する。調査会社Rは、各モニタMのアンケート結果を示す番組評価データを取得する。
ここで、「感想」とは、視聴者が実際にテレビ番組(放送済み番組)を視聴した際の視聴者の心理状態、いわゆるコンテキストであり、より具体的には、テレビ番組に抱いた印象及びイメージ、テレビ番組を視聴した際の状況及び気分、テレビ番組に期待する感情的欲求、並びにテレビ番組の出演者への感情等が挙げられ、具体的には、好意度、親しみ易さ、ハラハラ・ドキドキ感、感動、高揚感(楽しい気分になる)、新鮮さ、有用性、情報性、見応え、話題性、及び、笑える内容か(娯楽に適するか)等が該当する。
なお、例えば、上記の『コンテキスト』として、視聴者が視聴行動を繰り返したときに抱く気持ち(情動)の変化、例えば、ある放送局で連続して放送されるテレビ番組とテレビCM、若しくは連続して放送される複数のテレビ番組を視聴した場合の気持ちの流れを取り扱ってもよい。
なお、本実施形態では、上記のアンケート調査がネットリサーチ形式で行われ、各モニタMは、各モニタMが保有する端末(例えば、図3に図示のモニタ端末22)を用いてアンケートに回答し、そのアンケート結果を示す番組評価データが上記の端末を通じて調査会社Rに送付される。ただし、これに限定されるものではなく、例えば、各モニタMがアンケートの回答を記入した記入用紙を回収し、あるいは調査員による聞き取りによってアンケート結果を入手し、入手したアンケート結果をキーボード又はタッチパネル等の入力機器を通じて入力することで、番組評価データを取得してもよい。
また、調査会社Rは、放送済み広告についても同様にメタデータ(以下、広告メタデータと言う)、及び評価データ(以下、広告評価データと言う)を取得する。広告メタデータは、放送済み広告を説明するための説明情報、具体的には放送済み広告が取り扱う商品のカテゴリ、放送済み広告の出演者及び内容等を示すデータであり、例えば、その広告を制作した広告会社Cから取得可能である。なお、広告メタデータが示す説明情報、及び広告メタデータの取得経路については、特に制限されるものではない。
広告評価データは、各モニタMが調査期間中に放送されたテレビCM(放送済み広告)のうち、実際に視聴したテレビCMに対する感想を示すデータである。広告評価データについても、番組評価データと同様、各モニタMが保有する端末からネットワーク経由で取得したり、各モニタMから回収した記入済みのアンケート用紙及び聞き取り調査の結果を入力したりすることで取得可能である。
ちなみに、放送済み番組及び放送済みCMは、本発明における「配信済み内容」に該当する。
そして、調査会社Rは、過去の所定期間(例えば、上述のアンケート調査期間)に放送された複数のテレビ番組のそれぞれを、取得済みの番組メタデータ及び番組評価データに基づいて複数のグループに分類する。同様に、調査会社Rは、過去の所定期間(例えば、上述のアンケート調査期間)に放送された複数のテレビCMのそれぞれを、取得済みの広告メタデータ及び広告評価データに基づいて複数のグループに分類する。
また、調査会社Rは、将来放送される予定のテレビCM(つまり、放送予定広告)に関する説明情報を入手する。具体的に説明すると、調査会社Rは、例えば、放送予定広告を手掛ける広告会社Cから放送予定広告の説明情報を入手し、その情報を調査会社R側で入力する(すなわち、放送予定広告の説明情報に関する入力情報を取得する)。なお、放送予定広告の説明情報の入手元については、広告会社Cに限定されず、例えば広告主であってもよい。
そして、調査会社Rは、図2に示すように、取得済みの入力情報に基づき、放送済み広告を分類した複数の広告グループのうちのどのグループに放送予定広告が属するかを判定(厳密には、予測)する。以下、放送予定広告が属するグループを「広告グループ」と呼ぶこととする。
さらに、調査会社Rは、将来放送される予定のテレビ番組(以下、放送予定番組)のそれぞれに関する説明情報を入手する。具体的に説明すると、調査会社Rは、例えば、Nカ月(Nは任意の自然数)後に放送される放送予定番組の説明情報、より詳しくは未来のテレビ番組表の情報を各テレビ局Tから入手し、その情報を調査会社R側で入力する(すなわち、放送予定番組の説明情報に関する入力情報を取得する)。なお、放送予定番組の説明情報の入手元は、テレビ局に限定されず、例えば番組制作会社であってもよい。
そして、調査会社Rは、図2に示すように、取得済みの入力情報に基づき、放送済み番組を分類した複数の番組グループのうちのどのグループに各放送予定番組が属するかを判定(厳密には、予測)する。以下、放送予定番組が属するグループを「番組グループ」と呼ぶこととする。
ちなみに、放送予定広告及び放送予定番組は、本発明における「配信予定内容」に該当し、また、互いに異なる第一配信予定内容及び第二配信予定内容に相当する。より詳しく説明すると、放送予定広告は、第一配信予定内容であり、放送予定番組は、第二配信予定内容である。
さらにまた、調査会社Rは、図2に示すように、広告グループと番組グループとのマッチングを実施する。より詳しく説明すると、調査会社Rは、広告グループと類似する番組グループ(厳密には、後述のベストマッチグループ)を特定する。ここで、特定された番組グループは、当該番組グループに属する放送予定番組に対する視聴者の評価(厳密には、後述する指標)が放送予定広告と最も類似すると期待されるグループである。
以上までの一連の処理を経た後、調査会社Rは、レコメンドサービスを広告会社Cに対して実施する。具体的に説明すると、調査会社Rは、広告グループと類似する番組グループに属する放送予定番組を特定し、その放送予定番組の放送時間中に設定された広告枠(スポットCM枠)を、放送予定広告に対する「お薦め広告枠」として広告会社Cに提案する。
なお、本実施形態では、上述したレコメンドサービスの実施主体が調査会社Rであることとしたが、これに限定されるものではなく、例えば、テレビ局Tがレコメンドサービスを実施してもよく、あるいは、広告会社C、調査会社R及びテレビ局T以外の第三者機関、若しくはその他のサービス提供会社が実施してもよい。あるいは、レコメンドサービスに相当するデータ処理(具体的には、「お薦め広告枠」を特定するためのデータ処理)を、広告会社Cが自前で実行してもよい。
また、レコメンドサービスは、同サービスによって提案される「お薦め広告枠」を利用して広告が放送される日時の数か月前、数週間前、数日前、数時間前、数分前、若しくは数秒前まで利用可能である。
<<本実施形態に係るデータ処理装置の構成について>>
次に、図3を参照しながら、本実施形態に係るデータ処理装置(以下、データ処理装置10)の構成について説明する。図3は、データ処理装置10を含むレコメンドサービス提供システムの構成の一例を示す図である。
データ処理装置10は、テレビ番組及びテレビCMに関する各種データ、具体的には、番組メタデータ、番組評価データ、広告メタデータ及び広告評価データを用い、レコメンドサービスに係る一連のデータ処理を実施する。本実施形態において、データ処理装置10は、調査会社Rが所有するコンピュータ(具体的には、図3に図示のサーバコンピュータ11)と、そのサーバコンピュータ11と接続された記憶装置12と、によって構成されている。
サーバコンピュータ11は、データ処理装置10の本体をなすコンピュータであり、レコメンドサービスに係る一連のデータ処理を実施する。サーバコンピュータ11は、図3に示すように、CPU11aと、ROM及びRAM等からなるメモリ11bと、通信用インタフェース11cと、ハードディスクドライブ11dと、マウス及びキーボード等からなる入力機器11eと、ディスプレイ及びプリンタ等の出力機器11fと、を有する。
また、サーバコンピュータ11には、データ処理用のプログラム(以下、データ処理プログラム)がインストールされている。このデータ処理プログラムがCPUによって読み取られて実行されることで、サーバコンピュータ11において、レコメンドサービスに係る一連のデータ処理が実施される。
なお、本実施形態では、調査会社Rが所有するサーバコンピュータ11がデータ処理装置10を構成することとしたが、これに限定されるものではない。すなわち、調査会社R以外の機関(例えば、テレビ局T又は広告会社C、あるいは第三者機関)が所有するコンピュータによってデータ処理装置10を構成してもよい。例えば、ASP(Application Service Provider)サーバがデータ処理装置10を構成し、当該ASPサーバがレコメンドサービスに係る一連のデータ処理をASPサービスとして実施してもよい。
記憶装置12は、レコメンドサービスに要する各種データを記憶している。具体的に説明すると、記憶装置12は、過去に放送された放送済み番組の番組メタデータを番組毎に記憶しているとともに、放送済み番組を視聴したモニタMの放送済み番組に対する評価(厳密には、視聴時の感想に関するアンケート結果)を示す番組評価データを番組毎、且つモニタM(視聴者)毎に記憶している。
なお、本実施形態において、番組メタデータは、各テレビ局Tが所有するデータ配信サーバ21からネットワーク経由で提供され、記憶装置12に蓄積される。また、図3に図示の構成では、番組評価データが、各モニタMが所有するモニタ端末22からネットワーク経由で取得され、記憶装置12に蓄積されることになっている。
また、記憶装置12は、過去に放送された放送済み広告の広告メタデータを広告毎に記憶しているとともに、放送済み広告を視聴したモニタMの放送済み広告に対する評価(厳密には、視聴時の感想に関するアンケート結果)を示す広告毎、且つモニタM(視聴者)毎に記憶している。
なお、本実施形態において、広告メタデータは、広告会社Cが所有するデータ配信サーバ23からネットワーク経由で提供され、記憶装置12に蓄積される。また、図3に図示の構成では、広告評価データが、各モニタMが所有するモニタ端末22からネットワーク経由で取得され、記憶装置12に蓄積されることになっている。ちなみに、広告メタデータの入手元は、広告会社Cに限定されず、他の者(例えば、広告主)であってもよい。
本実施形態において、記憶装置12は、サーバコンピュータ11と通信可能に接続されている。サーバコンピュータ11は、レコメンドサービスの提供に際して記憶装置12にアクセスし、記憶装置12中の各種データを読み出して所定のデータ処理に供する。
なお、図3に図示の構成において、記憶装置12は、サーバコンピュータ11と分離しており、例えばサーバコンピュータ11以外のデータベースサーバ等によって構成されている。ただし、これに限定されるものではなく、記憶装置12がサーバコンピュータ11に内蔵又は外付けされた補助記憶装置(例えば、サーバコンピュータ11のハードディスクドライブ11d)によって構成されてもよい。
次に、図4を参照しながら、データ処理装置10の構成を機能面から改めて説明することとする。図4は、データ処理装置10の機能を示すブロック図である。
データ処理装置10は、図4に示すように、評価データ記憶部31、メタデータ記憶部32、数値化処理部33、特定部34、割り出し部35、分類部36、入力情報取得部37、判定部38及び類似度合い算出部39を機能部として有する。これらの機能部のうち、評価データ記憶部31及びメタデータ記憶部32は、前述した記憶装置12によって構成されている。それ以外の機能部(7つの機能部)は、サーバコンピュータ11が有するハードウェア機器と、サーバコンピュータ11にインストールされたデータ処理プログラムとが協働することで実現される。なお、本実施形態では、上述した7つの機能部のすべてが一台のサーバコンピュータ11によって実現されているが、これに限定されるものではなく、7つの機能部のうちの一部の機能部が別のコンピュータによって実現されてもよい。
以下、データ処理装置10の各機能部について詳述する。
(評価データ記憶部)
評価データ記憶部31は、放送済み番組についての番組評価データを番組毎、及びモニタM(すなわち、放送済み番組の視聴者)毎に記憶する。また、評価データ記憶部31は、放送済み広告についての広告評価データを広告毎、及びモニタM(すなわち、放送済み広告の視聴者)毎に記憶する。
なお、番組評価データ及び広告評価データについて付言しておくと、これらの評価データは、前述したように、放送済み番組/放送済み広告に対する視聴者(モニタM)の感想に関するアンケート結果を示すデータである。より詳しく説明すると、アンケートでは、感想に関する複数の回答候補(例えば、「ドキドキする」、「期待通り」、「マンネリな内容」、「笑える」、及び「もう見たくない」等)が用意されている。放送済み番組を実際に視聴したモニタMは、上記複数の回答候補の中から該当する候補を選択することで、放送済み番組に対する感想を回答する。
ちなみに、本実施形態において、上記の評価データを取得するために実施されるアンケートは、データの信頼性を確保し得るように設計されており、具体的には、代表性が担保されるようにアンケート回答者を選定し、また、アンケート中の各質問等についても適切な表現にて尋ねられている。
(メタデータ記憶部)
メタデータ記憶部32は、放送済み番組の番組メタデータを番組毎に記憶するとともに、放送済み広告の広告メタデータを広告毎に記憶する。ここで、番組メタデータ及び広告メタデータについて付言しておくと、それぞれのデータは、前述したように、説明情報として出演者及び内容(イメージ)等を示すテキスト情報を含んでいる。
また、番組メタデータは、放送済み番組の説明情報として、番組ジャンルをさらに含んでいる。また、広告メタデータは、放送済み広告の説明情報として、その広告が取り扱う商品のカテゴリをさらに含んでいる。番組メタデータが示す番組ジャンル、及び、広告メタデータが示す商品カテゴリは、放送済み番組に対して予め設定された分類カテゴリに相当し、放送済み番組を分類する際の大分類に相当する。
なお、それぞれの放送済み番組は、いずれか一つのジャンルに分類されてもよく、あるいは複数のジャンルに亘って分類されてもよい。
(数値化処理部)
数値化処理部33は、番組メタデータ及び広告メタデータが示す説明情報を数値化する処理を実施する。具体的に説明すると、数値化処理部33は、各メタデータが示す説明情報(厳密には、出演者及び内容等を示すテキスト情報)をベクトル化する。より詳しく説明すると、数値化処理部33は、各メタデータが示す出演者に対してword2vecを適用することで、出演者の情報を数値化(ベクトル化)する。また、数値化処理部33は、各メタデータが示す内容に対してLDA(Latent Dirichlet Allcation)を適用することで、内容の情報を数値化(ベクトル化)する。
以上のように本実施形態では、各メタデータが示す説明情報を数値化(ベクトル化)し、これにより、以降の処理において説明情報を取り扱い易くなり、具体的には、説明情報を用いたデータ処理(例えば、後述する機械学習等)を行い易くなる。ただし、これに限定されるものではなく、機械学習の時点では、説明情報をそのまま(すなわち、数値化しない状態で)用いてもよい。
なお、メタデータが示す説明情報を数値化(ベクトル化)する手法については、上述の手法に限定されず、その他にも好適に利用可能な手法があれば、その中から自由に選択して利用することができる。
(特定部)
特定部34は、番組毎及びモニタM毎の番組評価データと、番組毎の番組メタデータとに基づき、放送済み番組に関する指標と説明情報との対応関係を特定する。同様に、特定部34は、広告毎及びモニタM毎の広告評価データと、広告毎の広告メタデータとに基づき、放送済み広告に関する指標と説明情報との対応関係を特定する。
ここで、指標について説明すると、指標は、ある番組/広告に関して得られた評価データが示す評価から導出される。具体的に説明すると、指標は、ある番組/広告について得られた評価データが示す感想の各々と、それぞれの感想に応じた数値と、によって構成され、例えば、「ドキドキ3.0」及び「笑える1.8」のような表記によって表現される。なお、感想に応じた数値については、感想を数値化する公知の技術が利用可能であり、例えば、LDA(Latent Dirichlet Allcation)を利用して感想を数値化することができる。
また、ある番組/広告について指標を導出する際には、その番組/広告に関して得らえた評価データが示す評価に加えて、その番組/広告に関するメタデータが示す説明情報を加味して指標を導出してもよい。
本実施形態の特定部34は、所定期間(例えば、前述のアンケート調査期間)において放送された放送済み番組のすべての指標を求め、すべての放送済み番組の指標と説明情報との対応関係を特定する。同様に、本実施形態の特定部34は、上記の所定期間に放送された放送済み広告のすべての指標を求め、すべての放送済み広告の指標と説明情報との対応関係を特定する。
より詳しく説明すると、特定部34は、所定期間において放送された各放送済み番組について、番組毎及びモニタM毎の番組評価データと、番組毎の番組メタデータとを用いた機械学習を実施し、放送済み番組についての指標と説明情報との対応関係を示す数理モデルを構築する。また、特定部34は、所定期間において放送された各放送済み広告について、広告毎及びモニタM毎の広告評価データと、広告毎の広告メタデータとを用いた機械学習を実施し、放送済み広告についての指標と説明情報との対応関係を示す数理モデルを構築する。
以上の手順により、放送済み番組及び放送済み広告の各々について、指標と説明情報との対応関係が特定される。なお、本実施形態において、上述の機械学習では、数値化処理部33によって数値化(ベクトル化)された説明情報を示すメタデータを用いる。つまり、本実施形態の特定部34は、指標と数値化(ベクトル化)された説明情報との対応関係を特定することになる。ただし、前述したように、機械学習の段階で説明情報が数値化されていなくてもよく、換言すると、指標と数値化されていない説明情報との対応関係を特定してもよい。
ちなみに、機械学習については、公知の手法、例えば、ID3(Iterative Dichotomiser 3)、相関ルール学習、ニューラルネットワーク、ディープラーニング、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシン、クラスタリング、主成分分析、クラスタ分析、ベイジアンネットワーク及びエクストリーム・ラーニング・マシン等が利用可能である。さらに、今後開発され得る機械学習方法も利用可能である。
また、本実施形態では、機械学習によって構築される数理モデルに関して、指標と説明情報との対応関係の妥当性について、上述した評価データの一部を教師データ(検証用データ)として用いて適宜検証する。これにより、上記の対応関係を用いて行われるデータ処理(具体的には、後述のグループ分け)について、処理結果の信憑性が確保される。
なお、対応関係の妥当性についての検証は、評価データの一部を教師データとして用いた検証方法に限られず、統計学的な検証方法(例えば、ホールドアウト法、交差確認法及びブーストトラップ法等)によって行われてもよい。
(割り出し部)
割り出し部35は、所定期間(例えば、前述したアンケート調査期間)に放送された放送済み番組及び放送済み広告について、特定部34が特定した対応関係(具体的には、数理モデル)を適用して指標を割り出す。具体的に説明すると、割り出し部35は、所定期間に放送されたすべての放送済み番組を対象とし、対象である各放送済み番組の番組メタデータが示す説明情報を上記の数理モデルに適用する。これにより、対象である各放送済み番組の指標(すなわち、感想及びその度合い)が割り出される。
同様にして、割り出し部35は、上記の所定期間に放送されたすべての放送済み広告を対象とし、対象である各放送済み広告の広告メタデータが示す説明情報を上記の数理モデルに適用する。これにより、対象である各放送済み広告の指標(すなわち、感想及びその度合い)が割り出される。
また、本実施形態の割り出し部35は、将来放送される放送予定広告及び放送予定番組を対象として、これらの指標を割り出すことが可能である。かかる機能については、後に説明することとする。
(分類部)
分類部36は、割り出し部35によって指標が割り出された際の対象、すなわち、所定期間に放送された放送済み番組及び放送済み広告をグループ分け(分類)する。具体的に説明すると、分類部36は、所定期間に放送されたすべての放送済み番組の各々を、各放送済み番組について割り出された指標に基づき、複数のグループのいずれかに分類する。各グループには、少なくとも一つの放送済み番組が属している。換言すると、各放送済み番組は、一つ又は複数のグループに分類される。
より詳しく説明すると、分類部36は、所定期間に放送された各放送済み番組の番組メタデータを参照し、当該番組メタデータが示す番組ジャンルに応じて、所定期間に放送された各放送済み番組をジャンル分けする。その後、分類部36は、各ジャンル別に、当該各ジャンルに属する複数の放送済み番組の各々を、割り出し部35が割り出した指標に基づいて複数のグループのいずれかに分類する。
なお、指標に基づく分類(グループ分け)は、すべての番組ジャンルについて実施してもよく、あるいは、各番組ジャンルに属する放送済み番組の数を求めたときの上位n位(nは2以上の自然数)までの番組ジャンルのみについて実施してもよい。また、各放送済み番組が属するジャンルの種類は、一種類であってもよく、あるいは複数種類であってもよい。
同様に、分類部36は、所定期間に放送された各放送済み広告の広告メタデータを参照し、当該広告メタデータが示す商品カテゴリに応じて、所定期間に放送された各放送済み広告をカテゴリ分けする。その後、分類部36は、各商品カテゴリ別に、当該各商品カテゴリに属する複数の放送済み広告の各々を、割り出し部35が割り出した指標に基づいて複数のグループのいずれかに分類する。各グループには、少なくとも一つの放送済み広告が属している。換言すると、各放送済み広告は、一つ又は複数のグループに分類される。
ここで、分類部36が分類(グループ分け)を行う際に採用する手法について説明すると、公知の分類手法が利用可能であり、特に、シンプルなクラスタリング手法として知られているK−means法が好ましい。このK−means法は、教師無し学習によるクラスタリング手法であり、同手法によれば、放送済み番組/放送済み広告について割り出し部35が割り出した指標を、図5に示すように多次元座標空間にプロットし、プロット同士の近さでk個(kは2以上の自然数)のクラスタに分けられる。このk個のクラスタが、本発明における「複数のグループ」に相当する。
ちなみに、図5は、グループ分けのイメージ図であり、具体的にはK−means法によるクラスタリングについての説明図である。なお、説明の都合上、図5では、プロットが打たれる多次元座標空間を2次元座標空間として図示しているが、これに限定されるものではなく、より高次元の座標空間であってもよい。
(入力情報取得部)
入力情報取得部37は、将来放送される放送予定広告及び放送予定番組について、その説明情報として入力された入力情報を取得する。具体的に説明すると、放送予定広告についての入力情報は、放送予定広告の商品カテゴリ、出演者及び広告内容(イメージ)等であり、例えば、当該放送予定広告を手掛ける広告会社Cから伝達され、調査会社R側で入力される。厳密には、調査会社Rの従業員等が、サーバコンピュータ11の入力機器11eを通じて上記の入力情報を入力する。これにより、入力情報取得部37は、放送予定広告の説明情報として入力された入力情報を取得する。
なお、放送予定広告の入力情報の取得経路については、上記の内容に限定されるものではなく、例えば、放送予定広告に関する説明情報が広告会社C側で入力され、その入力情報を示すデータがネットワーク経由で調査会社Rのサーバコンピュータ11に伝送されてもよい。
また、放送予定番組についての入力情報は、放送予定番組の放送日時、放送曜日、番組タイトル、番組ジャンル及び出演者等であり、例えば、放送予定番組を放送するテレビ局Tから番組表情報として配信される。入力情報取得部37は、各テレビ局Tから配信されてくる番組表情報を逐次受信することにより、各放送予定番組の説明情報として入力された入力情報を取得する。
なお、放送予定番組の入力情報の取得経路については、上記の内容に限定されるものではなく、例えば、放送予定番組に関する説明情報が各テレビ局Tからメール又はFax等で伝達され、調査会社Rの従業員等がサーバコンピュータ11の入力機器11eを通じて上記の情報を入力してもよい。
(判定部)
判定部38は、分類部36が放送済み番組及び放送済み広告をグループ分け(クラスタリング)した際の複数のグループのうち、放送予定広告及び放送予定番組が属するグループを判定(予測)する。判定部38によるグループ判定(グループ予測)について説明すると、グループ判定が行われる前段階で、先ず、割り出し部35が、入力情報取得部37が取得した入力情報を用いて、放送予定番組/放送予定広告の指標を割り出す。具体的には、特定部34が特定した対応関係(具体的には、対応関係を示す数理モデル)に上記の入力情報を適用することで、入力情報に係る放送予定番組/放送予定広告の指標が割り出される。
その後、判定部38は、割り出し部35によって割り出された指標に基づいて、放送予定番組/放送予定広告が属するグループを判定する。具体的に説明すると、判定部38は、例えば、図5に図示した座標空間にて放送予定番組/放送予定広告について割り出された指標をプロットし、そのプロットがどのクラスタ(グループ)内に存在するかを特定することで、放送予定番組/放送予定広告が属するグループを判定する。
以上のように本実施形態では、放送予定番組/放送予定広告が属するグループを、その候補となる複数のグループの中から一つ選んで決める形になっているが、これに限定されるものではない。例えば、上記複数のグループのそれぞれについて、放送予定番組/放送予定広告が属する確率を求めて、2つ以上のグループについて上記の確率が基準値よりも高くなる場合には、それらのグループすべてを、放送予定番組/放送予定広告が属するグループとして取り扱ってもよい。
なお、本実施形態において、割り出し部35は、放送予定番組及び放送予定広告のそれぞれについて指標を割り出し、判定部38は、放送予定番組及び放送予定広告のそれぞれについて割り出された指標に基づいて、放送予定番組が属するグループ、及び、放送予定広告が属するグループを判定(予測)する。
(類似度合い算出部)
類似度合い算出部39は、判定部38が判定した放送予定広告が属するグループ(広告グループ)と、放送予定番組が属するグループ(番組グループ)との間の類似度合いを算出する。類似度合いの算出手順について説明すると、先ず、類似度合い算出部39は、番組グループに対し、当該番組グループに属する放送済み番組の説明情報を紐付ける。
上記の手順について図6を参照しながら具体的に説明すると、類似度合い算出部39は、ある番組グループ(図6のケースでは、グループX)に属する放送済み番組のそれぞれについて、出演者及び内容等の説明情報を特定した後、特定した説明情報すべてを、ある番組グループの説明情報として集約(マージ)する。また、集約された各々の説明情報は、図6に示すように、数値化処理部33によって数値化(ベクトル化)される。ちなみに、図6は、グループに属する番組/広告の説明情報に対する処理についての説明図である。
次に、類似度合い算出部39は、上記と略同様の手順により、広告グループに対し、当該広告グループに属する放送済み広告の説明情報を紐付ける。具体的に説明すると、類似度合い算出部39は、図6に図示した手順により、ある広告グループに属する放送済み広告のそれぞれについて、出演者及び内容等の説明を特定し、特定した説明情報すべてを、ある広告グループの説明情報として集約(マージ)する。また、集約された各々の説明情報は、数値化処理部33によって数値化(ベクトル化)される。
その後、類似度合い算出部39は、番組グループについて集約された説明情報と、広告グループについて集約された説明情報と、を用いて、番組グループと広告グループとの間の類似度合いを算出する。より詳しく説明すると、類似度合い算出部39は、数値化処理部33によって数値化された番組グループの説明情報と、同じく数値化処理部33によって数値化された広告グループの説明変数とに基づいて、グループ間の類似度合いを算出する。ここで、類似度合いの算出方法については、特に限定されるものではなく、公知の算出方法の中から好適なものを選んで利用することができる。
また、類似度合いの算出は、一つの広告グループに対して、番組グループを変えて複数回繰り返し実施され、より詳しくは、番組グループの数と同じ回数だけ繰り返される。
以上のように、ある広告グループについて番組グループを変えて繰り返し算出することにより、ある広告グループとの間で最も類似度合いが高くなる番組グループを特定することができる。ここで、ある広告グループとの間で最も類似度合いが高くなる番組グループは、ある広告グループと最もマッチングする番組グループであり、以下、「ベストマッチグループ」と呼ぶこととする。
ベストマッチグループは、同グループに属する放送予定番組を視聴した際の視聴者の感想が、ある広告グループに属する放送予定広告を視聴した際の感想と類似すると期待される番組グループである。つまり、ベストマッチグループに属する放送予定番組の放送時間中に設定される広告枠(スポットCM枠)は、ある広告グループに属する放送予定広告にとっての「お薦め広告枠」となる。
<<データ処理フローについて>>
次に、データ処理装置10の動作例として、データ処理装置10が実施するデータ処理の流れ(以下、データ処理フロー)について説明する。
なお、以下に説明するデータ処理フローでは、本発明のデータ処理方法が採用されている。すなわち、以下の説明には、本発明のデータ処理方法についての説明が含まれており、また、以下に述べるデータ処理フロー(具体的には、後述するグループ分け処理、グループ判定処理、及び類似度合い算出処理)の各ステップは、本発明のデータ処理方法を構成する工程に相当する。
本実施形態に係るデータ処理フローは、3つの処理に大別され、具体的には、グループ分け処理、グループ判定処理、及び類似度合い算出処理によって構成されている。グループ分け処理は、所定期間に放送された複数の放送済み広告/放送済み番組の各々を複数のグループのいずれかに分類する処理であり、図7に図示の流れに従って進行する。図7は、グループ分け処理の流れを示す図である。
グループ判定処理は、放送予定広告が属するグループ(広告グループ)及び放送予定番組が属するグループ(番組グループ)のそれぞれを判定する処理であり、図8に図示の流れに従って進行する。図8は、グループ判定処理の流れを示す図である。
類似度合い算出処理は、広告グループと番組グループとの間の類似度合いを算出する処理であり、図9に図示の流れに従って進行する。図9は、類似度合い算出処理の流れを示す図である。
以下、それぞれ処理の手順について詳しく説明する。
(グループ分け処理)
グループ分け処理の実施に際して、先ず、調査期間中に放送されたテレビ番組(放送済み番組)及びテレビCM(放送済み広告)の感想に関するアンケート調査が実施され、モニタMが調査期間中に実際に視聴したテレビ番組/テレビCMの感想を回答する。その後、調査会社Rは、各モニタMが回答した感想に関するアンケート結果を示すデータ、すなわち、番組評価データ及び広告番組データをモニタM毎、且つ番組/広告毎に取得する。
そして、グループ分け処理の開始にあたり、データ処理装置10を構成する記憶装置12が、取得済みの番組評価データ及び広告番組データをモニタM毎、且つ番組/広告毎に記憶する(S001)。
また、調査会社Rは、調査期間中に放送されたテレビ番組の説明情報を示す番組メタデータをテレビ局Tから取得し、調査期間中に放送されたテレビCMの説明情報を示す広告メタデータを広告会社Cから取得する。そして、記憶装置12は、グループ分け処理の開始にあたり、取得済みの番組メタデータ及び広告メタデータを、番組/広告毎に記憶する(S002)。なお、ステップS002は、前述のステップS001よりも先に実施されてもよく、あるいは、ステップS001と同時並行で実施されてもよい。
次に、データ処理装置10を構成するサーバコンピュータ11が、記憶装置12にアクセスして番組毎及びモニタM毎の番組評価データと、番組毎の番組メタデータとを読み出し、これらのデータを用いて機械学習を実施する。これにより、サーバコンピュータ11は、番組評価データが示す評価から導出される指標と説明情報との対応関係を示す数理モデルを構築し、当該対応関係を特定する(S003)。
また、ステップS003では、サーバコンピュータ11が広告毎及びモニタM毎の広告評価データと、広告毎の広告メタデータとを記憶装置12から読み出し、これらのデータを用いて機械学習を実施する。これにより、サーバコンピュータ11は、広告評価データが示す評価から導出される指標と説明情報との対応関係を示す数理モデルを構築し、当該対応関係を特定する。
なお、本実施形態において、サーバコンピュータ11は、記憶装置12から読み出した番組メタデータ/広告メタデータが示す説明情報を数値化(ベクトル化)し、数値化した説明情報を上記の機械学習に供する。この結果、ステップS003では、指標と数値化(ベクトル化)された説明情報との対応関係が特定されることになる。
次に、サーバコンピュータ11は、アンケート調査期間中に放送された複数のテレビ番組/複数のテレビCMの各々を対象とし、当該対象のメタデータが示す説明情報を、ステップS003にて構築した数理モデルに適用する。これにより、サーバコンピュータ11は、対象である各テレビ番組(放送済み番組)/各テレビCM(放送済み広告)の指標を割り出す(S004)。
次に、サーバコンピュータ11は、前段のステップS004で割り出された指標に基づき、アンケート調査期間中に放送された複数のテレビ番組/複数のテレビCMの各々を、複数のグループのいずれかに分類する(S005)。具体的に説明すると、例えば、ステップS004で割り出された各テレビ番組/各テレビCMの指標をK−means法によってk個のクラスタに分けることにより、各テレビ番組/各テレビCMを分類(グループ分け)する。
なお、本実施形態において、サーバコンピュータ11は、各テレビ番組の番組メタデータが示す番組ジャンルに応じて各テレビ番組を分けた上で、各番組ジャンル別に、当該各番組ジャンルに属するテレビ番組を上述の要領にて分類(グループ分け)する。また、同様にして、サーバコンピュータ11は、各テレビCMの広告メタデータが示す商品カテゴリに応じて各テレビCMを分けた上で、各商品カテゴリ別に、当該各商品カテゴリに属するテレビCMを上述の要領にて分類(グループ分け)する。なお、各グループには、少なくとも一つのテレビ番組/テレビCMが属している。
以上までの一連のステップがすべて完了した時点で、グループ分け処理が終了する。なお、グループ分け処理は、適宜なタイミングで繰り返し実施され、例えば、前述のアンケート調査が新たに実施された場合には、そのアンケート調査の終了後の一定期間内に実施されるとよい。
(グループ判定処理)
グループ判定処理は、グループ分け処理が実施された後に実施される。本実施形態において、グループ判定処理は、広告会社C等からの実施要求を受け付けて開始され、例えば、広告会社Cが新たな広告(以下、新規広告A)の出稿を計画し、その計画に際してグループ判定処理の実施を要求すると、これを契機として開始される。以下では、新規広告Aを放送予定広告とするケースを具体例として挙げて、グループ判定処理の流れを説明する。
グループ判定処理に際して、先ず、データ処理装置10を構成するサーバコンピュータ11が、新規広告Aの説明情報に関する入力情報を取得する(S011)。なお、新規広告Aの説明情報は、前述したように、例えば広告会社C等から入手可能である。
また、サーバコンピュータ11は、将来放送される予定のテレビ番組(放送予定番組)の説明情報に関する入力情報を各テレビ局T等から取得する(S012)。なお、本ステップS012にて取得される入力情報は、例えば、数か月後に放送されることになっているテレビ番組の説明情報、具体的には、当該テレビ番組の放送日時、放送曜日、番組タイトル及び出演者等であり、番組表情報として各テレビ局Tから配信される。
ちなみに、ステップS012は、前述したステップS011より先に実施されてもよく、あるいは、ステップS011と同時並行で実施されてもよい。
その後、サーバコンピュータ11は、取得済みの入力情報を、グループ分け処理のステップS013にて特定した対応関係(厳密には、当該対応関係を示す数理モデル)に適用する。これにより、新規広告A、及び、将来放送予定のテレビ番組のそれぞれについて指標が割り出される(S013)。
次に、サーバコンピュータ11は、前段のステップS013にて割り出した指標に基づいて、新規広告Aが属するグループ(広告グループ)を判定するとともに(S014)、将来放送予定のテレビ番組が属するグループ(番組グループ)を判定する(S015)。ここで、将来放送予定のテレビ番組については、通常、複数存在するため、ステップS015では、将来放送予定の複数のテレビ番組のそれぞれについて、番組グループを判定することになる。
以上までの一連のステップが完了した時点で、グループ判定処理が終了する。そして、本実施形態では、グループ判定処理が終了すると、引き続き類似度合い算出処理が実施されることになっている。
(類似度合い算出処理)
類似度合い算出処理は、前述したように、例えばグループ判定処理と連続して実施される。以下では、グループ判定処理についての説明と同様、新規広告Aを放送予定広告とするケースを具体例として挙げて、類似度合い算出処理の流れを説明する。なお、説明を分かり易くするため、以下では、将来放送予定のテレビ番組を3つの番組(以下、番組P1、P2、P3)のみとする。また、以下では、それぞれのテレビ番組が属する番組グループをG1、G2、G3と表記し、新規広告Aが属する広告グループをGaと表記することとする。
類似度合い算出工程では、サーバコンピュータ11が、新規広告Aが属する広告グループGaと、将来放送予定のテレビ番組が属する番組グループG1、G2、G3の各々と、の間の類似度合いを算出する。
具体的に説明すると、類似度合い算出工程において、サーバコンピュータ11は、先ず、広告グループGaに属するすべての放送済み広告の説明情報を集約する(S021)。同様にして、サーバコンピュータ11は、各番組グループG1、G2、G3について、当該各番組グループに属するすべての放送済み番組の説明情報を集約する(S022)。そして、それぞれのグループで集約された説明情報は、前述したように、数値化(ベクトル化)される。
次に、サーバコンピュータ11は、広告グループGaについて集約されて数値化(ベクトル化)された放送済み広告の説明情報と、各番組グループG1、G2、G3について集約されて数値化(ベクトル化)された放送済み番組の説明情報と、に基づいて、番組グループG1、G2、G3のうちの一つと広告グループGaとの類似度合いを算出する(S023)。このステップS023は、番組グループを変えて繰り返し実施される。
そして、すべての番組グループG1、G2、G3について、広告グループGaとの類似度合いを算出した後(S024でYes)、サーバコンピュータ11は、最も類似度合いが高くなった番組グループ、すなわち、ベストマッチグループを特定する(S025)。
さらに、サーバコンピュータ11は、ベストマッチグループに属する将来放送予定のテレビ番組を特定し、そのテレビ番組の放送時間中に設定された広告枠を、新規広告Aの出稿を計画している広告会社Cに通知するための処理(例えば、メール送信処理、または紙等へのプリント処理)を実行する(S026)。そして、本ステップS026にて通知される広告枠が、新規広告Aにとっての「お薦め広告枠」となる。
お薦め広告枠の通知方法の一例を挙げると、例えば、図10に示す通知画面を表示するためのデータを広告会社C等に送信する方法が挙げられる。同図に示すように、通知画面には、本データ処理フローにて入力された新規広告Aの説明情報(具体的には、商品カテゴリ、出演者、及び内容等)と共に、お薦め広告枠の放送時間帯及びお薦め広告枠とのマッチング度合い(具体的には、出演者一致数、出演者類似度及び内容類似度)等が表示される。この通知画面を通じて、新規広告Aについて有用な広告効果が得られる放送枠を確認することが可能となる。
なお、本実施形態では、ステップS025、S026をサーバコンピュータ11が実施することになっているが、これらのステップS025、S026は、人手によって実施されてもよい。
以上までの一連のステップが完了した時点で、類似度合い算出処理が終了する。そして、広告会社C等から新たな実施要求を受け付けた際には、前述のグループ判定処理、それに続く類似度合い算出処理が実施されることになる。
<<本実施形態の有効性について>>
本実施形態では、上述したように、番組評価データ/広告評価データが示す評価からテレビ番組/テレビCMに関する指標が導出される。また、指標と説明情報との対応関係を特定し、あるテレビ番組/あるテレビCMの説明情報を上記の対応関係に適用することで、あるテレビ番組/あるテレビCMの指標を割り出す。さらに、割り出した指標に基づき、複数のテレビ番組/複数のテレビの各々を複数のグループのいずれかに分類する。
そして、上記の構成によれば、過去に放送済みの番組及び広告を視聴者の評価に基づいて適切に分類することが可能となる。具体的に説明すると、「発明が解決しようとする課題」の項で説明したように、視聴者の評価に基づいて番組及び広告を分類できれば、その分類結果の利用価値が高まる。その一方で、同じ番組又は同じ広告であっても、視聴者が変われば評価が変わり得るため、視聴者の評価に基づいて番組及び広告を分類する場合には、そのような評価の多様性を考慮する必要がある。
これに対して、本実施形態では、前述したように、指標と説明情報との対応関係を適用して番組及び広告の分類(グループ分け)を行う。ここで、対応関係は、各視聴者(厳密には、各モニタM)の評価を示す番組評価データ/広告評価データを機械学習に供することで特定されるものであり、換言すると、各視聴者の評価(感想)を反映したものである。本実施形態では、そのような対応関係を適用して番組及び広告を分類するため、視聴者の評価が多様に変わり得ることを考慮しつつ、番組及び広告を視聴者の評価に基づいて適切に分類することが可能となる。
また、本実施形態では、将来放送予定の番組及び広告が属するグループを判定(予測)することができるので、将来放送予定の番組及び広告がどのグループに属するかを事前に把握しておくことが可能である。
さらに、本実施形態では、グループ間の類似度合いを算出することができ、具体的には、将来放送予定の広告が属するグループ(広告グループ)と、将来放送予定の番組が属するグループ(番組グループ)と、の間の類似度合いを算出することが可能である。これにより、広告グループと最も類似する番組グループ、すなわち、ベストマッチグループを特定することが可能となる。そして、ある広告(例えば、上述した新規広告A)を、ベストマッチグループに属する将来のテレビ番組の放送時間中に設定された広告枠(スポットCM枠)を利用して放送すれば、上記の広告を効果的に打つことができ、分かり易くは、当該広告に対して反応を示す傾向にある視聴者に向けて打つことができる。
なお、本実施形態では、広告グループと番組グループとの間で類似度合いを算出してベストマッチグループを特定することとしたが、これに限定されるものではない。すなわち、広告グループ同士の間で類似度合いを算出してベストマッチグループを特定してもよく、あるいは、番組グループ同士の間で類似度合いを算出してベストマッチグループを特定してもよい。
<<その他の実施形態>>
以上までに本発明のデータ処理装置及びデータ処理方法について具体例を挙げて説明してきたが、上述の実施形態は、あくまでも一例に過ぎず、他の実施形態も考えられる。例えば、上記の実施形態では、過去に放送された複数のテレビ番組(放送済み番組)を分類し、且つ、過去に放送された複数のテレビCM(放送済み広告)を分類することとしたが、これに限定されるものではない。例えば、放送済み番組及び放送済み広告のうちのいずれか一方のみを分類する形態であってもよい。
また、上記の実施形態に係るデータ処理装置(すなわち、本実施形態のデータ処理装置10)は、放送済み番組及び放送済み広告を分類する機能の他に、将来放送される番組及び広告が属するグループを判定する機能、及び、グループ間の類似度合いを算出する機能を備えている。ただし、これに限定されるものではなく、放送済み番組及び放送済み広告を分類する機能のみを備えているが、残り2つの機能を備えていないデータ処理装置であってもよい。
また、上記の実施形態では、将来放送される番組が属するグループ(番組グループ)と、将来放送される広告が属するグループ(広告グループ)との間の類似度合いを算出することとした。このような形態とは異なるが、一つの参考例として、将来放送される番組と将来放送される広告との間の類似度合いを算出するケースも考えられる。かかる場合には、将来放送される番組についての説明情報と、将来放送される広告についての説明情報と、に基づいて両者の類似度合いが算出されることになる。
一方、グループ間の類似度合いを算出する場合には、それぞれのグループに属する番組又は広告すべての説明情報を集約(マージ)して用いるので、より説明因子である説明情報の数がより多くなる。したがって、グループ間の類似度合いを算出する方が、より妥当な算出結果を得ることができ、かかる点ではより有利である。
また、上記の実施形態では、番組評価データ及び広告評価データが、視聴者の感想に関するアンケート結果を示すデータであることとした。ただし、評価データは、視聴者の評価(感想)を特定し得るデータである限り、特に限定されるものではなく、例えば、番組/広告を視聴した際の脳波、脈拍及び体温等、視聴者の生体情報を示すデータであってもよい。
10 データ処理装置
11 サーバコンピュータ
11a CPU
11b メモリ
11c 通信用インタフェース
11d ハードディスクドライブ
11e 入力機器
11f 出力機器
12 記憶装置
21 データ配信サーバ
22 モニタ端末
23 データ配信サーバ
31 評価データ記憶部
32 メタデータ記憶部
33 数値化処理部
34 特定部
35 割り出し部
36 分類部
37 入力情報取得部
38 判定部
39 類似度合い算出部
C 広告会社
M モニタ(接触者)
R 調査会社
T テレビ局

Claims (13)

  1. 配信済み内容に接触した接触者の前記配信済み内容に対する評価を示す評価データを、前記配信済み内容毎及び前記接触者毎に記憶する評価データ記憶部と、
    前記配信済み内容を説明するための説明情報を示すメタデータを、前記配信済み内容毎に記憶するメタデータ記憶部と、
    前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータとに基づいて、前記評価から導出される指標と前記説明情報との対応関係を特定する特定部と、
    複数の前記配信済み内容の各々を対象とし、該対象の前記メタデータが示す前記説明情報を前記対応関係に適用することで、前記対象の前記指標を割り出す割り出し部と、
    前記割り出し部が割り出した前記指標に基づき、複数の前記配信済み内容の各々を複数のグループのいずれかに分類する分類部と、を有することを特徴とするデータ処理装置。
  2. 前記特定部は、前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータと、を用いた機械学習を実施して、前記対応関係を示す数理モデルを構築することにより前記対応関係を特定する請求項1に記載のデータ処理装置。
  3. 前記配信済み内容は、過去に放送された放送済み番組及び放送済み広告のうちの少なくとも一つである請求項1又は2に記載のデータ処理装置。
  4. 前記配信済み内容に対しては分類カテゴリが予め設定されており、
    前記分類部は、前記分類カテゴリ別に、前記分類カテゴリに属する複数の前記配信済み内容の各々を、前記割り出し部が割り出した前記指標に基づいて前記複数のグループのいずれかに分類する請求項1乃至3のいずれか一項に記載のデータ処理装置。
  5. 前記評価データは、前記配信済み内容に対する前記接触者の感想に関するアンケート結果を示すデータである請求項1乃至4のいずれか一項に記載のデータ処理装置。
  6. 前記アンケート結果を示す前記評価データの一部が、前記対応関係の妥当性についての検証用データとして用いられる請求項5に記載のデータ処理装置。
  7. 将来配信される配信予定内容の前記説明情報として入力された入力情報を取得する入力情報取得部と、
    前記複数のグループのうち、前記配信予定内容が属するグループを判定する判定部と、を有し、
    前記割り出し部は、前記入力情報を前記対応関係に適用することで、前記配信予定内容の前記指標を割り出し、
    前記判定部は、割り出された前記配信予定内容の前記指標に基づいて、前記配信予定内容が属するグループを判定する請求項1乃至6のいずれか一項に記載のデータ処理装置。
  8. 前記入力情報取得部は、互いに異なる第一配信予定内容及び第二配信予定内容のそれぞれについて、前記入力情報を取得し、
    前記割り出し部は、前記第一配信予定内容及び前記第二配信予定内容のそれぞれについて、前記入力情報を前記対応関係に適用して前記指標を割り出し、
    前記判定部は、前記第一配信予定内容及び前記第二配信予定内容のそれぞれについて割り出された前記指標に基づいて、前記第一配信予定内容が属するグループ、及び、前記第二配信予定内容が属するグループを判定し、
    前記第一配信予定内容が属するグループと前記第二配信予定内容が属するグループとの間の類似度合いを算出する類似度合い算出部を更に有する請求項7に記載のデータ処理装置。
  9. 前記第一配信予定内容は、将来放送される広告であり、
    前記第二配信予定内容は、将来放送される番組である請求項8に記載のデータ処理装置。
  10. 前記メタデータが示す前記説明情報を数値化する処理を実施する数値化処理部を有する請求項8又は9に記載のデータ処理装置。
  11. 前記類似度合い算出部は、前記数値化処理部によって数値化された前記第一配信予定内容の前記説明情報と、前記数値化処理部によって数値化された前記第二配信予定内容の前記説明情報と、に基づいて、前記第一配信予定内容が属するグループと前記第二配信予定内容が属するグループとの間の類似度合いを算出する請求項10に記載のデータ処理装置。
  12. 前記特定部は、前記指標と数値化された前記説明情報との前記対応関係を特定する請求項10又は11に記載のデータ処理装置。
  13. 記憶装置が、配信済み内容に接触した接触者の前記配信済み内容に対する評価を示す評価データを、前記配信済み内容毎及び前記接触者毎に記憶し、
    記憶装置が、前記配信済み内容を説明するための説明情報を示すメタデータを、前記配信済み内容毎に記憶し、
    コンピュータが、前記配信済み内容毎及び前記接触者毎の前記評価データと、前記配信済み内容毎の前記メタデータとに基づいて、前記評価から導出される指標と前記説明情報との対応関係を特定し、
    コンピュータが、複数の前記配信済み内容の各々を対象とし、該対象の前記メタデータが示す前記説明情報を前記対応関係に適用することで、前記対象の前記指標を割り出し、
    コンピュータが、割り出された前記指標に基づき、複数の前記配信済み内容の各々を複数のグループのいずれかに分類することを特徴とするデータ処理方法。
JP2019030594A 2019-02-22 2019-02-22 データ処理装置及びデータ処理方法 Active JP6552759B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019030594A JP6552759B1 (ja) 2019-02-22 2019-02-22 データ処理装置及びデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019030594A JP6552759B1 (ja) 2019-02-22 2019-02-22 データ処理装置及びデータ処理方法

Publications (2)

Publication Number Publication Date
JP6552759B1 true JP6552759B1 (ja) 2019-07-31
JP2020137005A JP2020137005A (ja) 2020-08-31

Family

ID=67473256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019030594A Active JP6552759B1 (ja) 2019-02-22 2019-02-22 データ処理装置及びデータ処理方法

Country Status (1)

Country Link
JP (1) JP6552759B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021260933A1 (ja) * 2020-06-26 2021-12-30 日本電気株式会社 推定装置、推定方法、および記録媒体

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023188144A1 (ja) * 2022-03-30 2023-10-05 日本電気株式会社 情報処理装置、情報処理方法およびプログラム
JP7499397B1 (ja) 2023-11-16 2024-06-13 株式会社ビデオリサーチ 行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215867A (ja) * 2005-02-04 2006-08-17 Sony Corp 情報処理システム、情報提供装置および方法、情報処理装置および方法、並びにプログラム
JP5560545B2 (ja) * 2008-08-26 2014-07-30 株式会社ニコン 配信システム、ならびに配信方法
JP5353443B2 (ja) * 2009-05-25 2013-11-27 株式会社Jvcケンウッド データ分類器作成装置、データ分類装置、データ分類器作成方法、データ分類方法、データ分類器作成プログラム、データ分類プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021260933A1 (ja) * 2020-06-26 2021-12-30 日本電気株式会社 推定装置、推定方法、および記録媒体
JP7487775B2 (ja) 2020-06-26 2024-05-21 日本電気株式会社 推定装置、推定方法、およびプログラム

Also Published As

Publication number Publication date
JP2020137005A (ja) 2020-08-31

Similar Documents

Publication Publication Date Title
CN113473187B (zh) 广告投放的跨屏优化
Jung et al. Persona generation from aggregated social media data
CN108352025B (zh) 基于消费者在线行为的电视广告时段定位
JP6552759B1 (ja) データ処理装置及びデータ処理方法
Napoli Audience economics: Media institutions and the audience marketplace
K. Balasubramanian et al. Modeling attitude constructs in movie product placements
E. Prescott Big data and competitive advantage at Nielsen
JP6201077B1 (ja) 調査データ処理装置及び調査データ処理方法
US20090006206A1 (en) Systems and Methods for Facilitating Advertising and Marketing Objectives
CN109417644B (zh) 跨屏广告投放的收益优化
US20120296701A1 (en) System and method for generating recommendations
WO2008145571A2 (en) Internet user identification
WO2009126815A2 (en) Diversified, self-organizing map system and method
CA2520117A1 (en) Generating audience analytics
CN1586075A (zh) 在项目推荐器中把多个项划分成相似项的组的方法及装置
CN108280679A (zh) 用于向网站访客递送目标内容以推广产品和品牌的方法和装置
Hill et al. Social TV: Real-time social media response to TV advertising
US11842292B1 (en) Predicting results for a video posted to a social media influencer channel
US11113707B1 (en) Artificial intelligence identification of high-value audiences for marketing campaigns
Molteni et al. Forecasting with twitter data: an application to Usa Tv series audience
US20170286995A1 (en) Computing A Score For Opportunities In A Placement System
JP6803998B1 (ja) 情報処理装置、及び情報処理方法
US20170330221A1 (en) Systems and methods for integration of universal marketing activities
JP7090777B1 (ja) コンテンツ推奨装置、及びコンテンツ推奨方法
JP2020095337A (ja) 調査結果処理装置、及び調査結果処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190225

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190225

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190702

R150 Certificate of patent or registration of utility model

Ref document number: 6552759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250