JP6637628B1 - データ処理装置及びデータ処理方法 - Google Patents
データ処理装置及びデータ処理方法 Download PDFInfo
- Publication number
- JP6637628B1 JP6637628B1 JP2019047268A JP2019047268A JP6637628B1 JP 6637628 B1 JP6637628 B1 JP 6637628B1 JP 2019047268 A JP2019047268 A JP 2019047268A JP 2019047268 A JP2019047268 A JP 2019047268A JP 6637628 B1 JP6637628 B1 JP 6637628B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- subject
- target person
- target
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 68
- 238000003672 processing method Methods 0.000 title claims description 17
- 238000013075 data extraction Methods 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims abstract description 11
- 230000002776 aggregation Effects 0.000 claims description 16
- 238000004220 aggregation Methods 0.000 claims description 16
- 230000009471 action Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 10
- 238000005259 measurement Methods 0.000 description 53
- 238000000034 method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 238000013480 data collection Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Abstract
Description
具体的には、本発明は、上記従来技術の問題点を解決し、代表性がないデータを代表性があるデータとして利用するためのデータ処理装置及びデータ処理方法を提供することを目的とする。
より具体的に説明すると、第一データの各々と第二データの各々との間で算出した共通項目の内容の類似度合いに基づいて特定された第二対象者の第二データを、集計用データとして抽出する。このような手順により、代表性がない第二データの中から、代表性がある第一データと類似するデータ(詳しくは、共通項目の内容が似ているデータ)を抽出することができる。そして、抽出された第二データは、代表性があるデータとみなして取り扱うことが可能となる。
以上の結果、本来は代表性がないデータであっても、あたかも代表性があるデータとして取り扱うことが可能となる。
上記の構成において、第二データは、第二対象者が特定行動を行うと、これをトリガーとして第二データが収集される。このようにして第二データが収集される場合、第二データについての代表性が欠落し易くなるため、本発明の「代表性がないデータを、代表性があるデータとみなして取り扱うことができるようにする」という効果がより際立って発揮されるようになる。
上記の構成であれば、放送メディアに接触するために用いる機器がインターネットに接続された対象者(第二対象者)から第二データが収集される。この場合、第二データは、代表性がないデータとなる場合があり、本発明の効果が有効に発揮されることになる。
上記の構成であれば、第二データが、放送メディアへの接触時に機器が発信するログデータであるため、比較的簡易に収集することができる反面、代表性がないデータとなり得る。また、一般的に、上記のログデータは、詳細な属性情報が付与されていないため、ログデータ単独での補正(バイアス解消策の実施)が困難である。したがって、上記のログデータを第二データとして収集する場合には、本発明の効果がより際立って発揮されることになる。
上記の構成であれば、放送メディアへの接触状況(例えば、テレビの視聴状況)の類似度合いに基づき、代表性がない第二データの中から、代表性があるデータとなるように集計用データを抽出することが可能となる。
上記の構成であれば、それぞれの第一対象者について共通項目の内容が最も類似する第二対象者から順に特定していく。そして、特定された第二対象者の人数が設定人数に達したときに、それまでに特定された第二対象者の第二データを集計用データとして抽出する。これにより、第二データから集計用データを抽出する際に、代表性を確保する上でより妥当なデータを抽出することが可能となる。
上記の構成において、設定人数分の第二対象者を特定した際に、ある第二対象者が複数回重複して特定される場合があり得る。この場合、ある第二対象者の第二データを、その者が特定された回数と同数の集計用データとして抽出すれば、その後に集計用データを用いた集計作業を行う際に、特定回数を集計ウェイトとして利用することができ、より適切な集計が可能となる。
上記のデータ処理方法によれば、本来、代表性がない第一データを、代表性がある集計用データとして抽出することができる。
なお、以下に説明する実施形態は、あくまでも、本発明の理解を容易にするために挙げた一例にすぎず、本発明を限定するものではない。すなわち、本発明は、その趣旨を逸脱しない限りにおいて、以下に説明する実施形態から変更又は改良され得る。また、当然ながら、本発明には、その等価物が含まれる。
なお、以下では、放送メディアの一例として、テレビを挙げて説明する。ただし、以下に説明する内容は、当然ながら、テレビ以外の放送メディアにも適用され得る。
なお、以下では、放送メディアに接触するために用いられる機器の一例として、テレビ受信機(受像機)を例に挙げて説明する。ただし、以下に説明する内容は、当然ながら、放送メディアに接触するために用いられるテレビ受信機以外の機器にも適用され得る。
また、以下の説明において、「属性」は、人の性別及び年齢等のデモグラフィック、人の興味関心及びライフスタイル等のサイコグラフィック、並びに、行動傾向及び行動履歴等に応じて設定される分類である。
本実施形態のデータ処理装置及びデータ処理方法の説明に先立ち、これらの処理対象となる第一データ及び第二データについて、図1を参照しながら説明することとする。図1は、各収集データの説明図であり、各収集データの配信経路を示している。
第一データは、第一対象者Tを対象として調査(厳密には、標本調査)を行うことで収集される調査用のデータである。ここで、第一対象者Tは、設定された母集団から統計学的手法によりランダム(無作為)に選出された者である。また、本実施形態では、母集団から第一対象者Tをランダムに選出するにあたり、調査地点・地域を設定し、当該調査地点・地域に居住する者の中から第一対象者Tを選出する。ただし、第一対象者Tの選出方法については、上記の選出方法に限られず、ランダムに選出する方法である限り、自由に採用することが可能である。
第二データは、第二対象者Uを対象として収集されるデータである。ここで、第二対象者Uは、予め設定された選出条件を満たす制限付きの対象者である。具体的に説明すると、本実施形態の第二対象者Uは、上記の収集条件として、その者が利用するテレビ視聴用の機器(すなわち、テレビ受信機)がインターネットに接続されているという条件を満たす者である。より厳密に説明すると、第二対象者Uは、テレビの視聴履歴を示すログデータ(以下、デバイスログデータとも言う)をテレビ受信機からインターネット経由で提供することを承諾した者である。
本実施形態に係るデータ処理装置(以下、データ処理装置10)の構成について、図2を参照しながら説明する。図2は、データ処理装置10の構成を示す図である。
図3は、デバイスログデータの抽出要領を示すイメージ図である。
次に、上述したデータ処理装置10の動作例として、データ処理装置10が収集データを処理する流れ(以下、データ処理フロー)について説明する。
なお、データ処理フローでは、本発明のデータ処理方法が採用されている。すなわち、以下の説明には、本発明のデータ処理方法に関する説明が含まれており、また、以下に述べるデータ処理フロー中の各ステップは、本発明のデータ処理方法を構成する工程に相当する。
以上までに説明してきたように、本実施形態では、各第一対象者Tの測定データ(第一データ)と各第二対象者Uのデバイスログデータ(第二データ)との間で、テレビ視聴状況(共通項目の内容)についての類似度合いを算出する。そして、算出した類似度合いに基づいて特定された第二対象者Uのデバイスログデータを、集計用データとして抽出する。
以上までに、本発明のデータ処理装置及びデータ処理方法について、一つの具体的な実施形態を挙げて説明したが、当該実施形態は、あくまでも一例に過ぎず、他の実施形態も考えられる。
その他の第二データとしては、以下の例が挙げられる。
[1]インターネット調査のパネルから収集したテレビ視聴状況測定データ
[2]ネットワークに接続された家電機器等(例えば、ハードディスクレコーダ)の操作ログデータ
[3]店で会員カードを提示して商品を購買した場合等に生成されるID付きPOS(Point of Sales)データ
ここで、[1]の例については、インターネット調査の要請に応じるという条件(収集条件)を満たす者、すなわち調査パネルが第二対象者Uに該当する。また、[2]の例については、上記の家電機器を所有し、且つデータ収集に応じるという条件(収集条件)を満たす者が第二対象者Uに該当する。[3]の例については、POSデータ取得の契機となる購買行動を行うという条件(収集条件)を満たす者が第二対象者Uに該当する。
11 処理側サーバ
11a CPU
11b メモリ
11c 通信用インターフェイス
11d ハードディスクドライブ
11e 入力機器
11f 出力機器
12 データ提供側サーバ
12a CPU
12b メモリ
12c 通信用インターフェイス
12d ハードディスクドライブ
12e 入力機器
12f 出力機器
C1 第一収集センター
C2 第二収集センター
M 製造メーカ
T 第一対象者
U 第二対象者
Claims (9)
- ランダムに選出された第一対象者を対象として収集した第一データを、前記第一対象者の人数に応じた分、記憶している第一記憶部と、
予め定められた収集条件を満たす第二対象者であって前記第一対象者よりも多い第二対象者を対象として収集した第二データを、前記第二対象者の人数に応じた分、記憶している第二記憶部と、
前記第二記憶部に記憶された前記第二データの中から、集計用データとして用いる前記第二データを抽出するデータ抽出部と、を有し、
前記第一データ及び前記第二データの双方には、当該双方に共通する共通項目の内容を示すデータが含まれており、
前記データ抽出部は、前記第一データの各々と前記第二データの各々との間で前記共通項目の内容の類似度合いを算出し、算出した前記類似度合いに基づいて特定された設定人数分の前記第二対象者の前記第二データを、前記集計用データとして抽出することを特徴とするデータ処理装置。 - 前記第二データは、前記収集条件を満たす前記第二対象者が特定行動を行った場合に収集されるデータである請求項1に記載のデータ処理装置。
- 前記第二対象者は、前記収集条件として、前記第二対象者が放送メディアに接触するために用いる機器がインターネットに接続されているという条件を満たす者である請求項1又は2に記載のデータ処理装置。
- 前記第二データは、前記第二対象者が前記機器を用いて前記放送メディアに接触した場合に前記機器が発信するログデータである請求項3に記載のデータ処理装置。
- 前記共通項目の内容は、前記放送メディアへの接触状況である請求項4に記載のデータ処理装置。
- 前記放送メディアへの接触状況は、テレビの視聴状況である請求項5に記載のデータ処理装置。
- 前記データ抽出部は、前記第一対象者と前記第二対象者との組み合わせを変えて前記組み合わせ別に前記類似度合いを算出し、それぞれの前記第一対象者について、前記類似度合いが最大となる前記組み合わせから順に該組み合わせに属する前記第二対象者を特定し、特定された前記第二対象者の人数が前記設定人数に達したときに、特定された前記設定人数分の前記第二対象者の前記第二データを前記集計用データとして抽出する請求項1乃至6のいずれか一項に記載のデータ処理装置。
- 前記データ抽出部が前記設定人数分の前記第二対象者を特定した際に、ある第二対象者が複数回重複して特定された場合、前記データ抽出部は、前記ある第二対象者の前記第二データを、前記ある第二対象者が特定された回数と同数の前記集計用データとして抽出する請求項7に記載のデータ処理装置。
- 第一記憶部が、ランダムに選出された第一対象者を対象として収集した第一データを、前記第一対象者の人数に応じた分、記憶しており、
第二記憶部が、予め定められた収集条件を満たしており前記第一対象者よりも多い第二対象者を対象として収集した第二データを、前記第二対象者の人数に応じた分、記憶しており、
コンピュータが、前記第二記憶部に記憶された前記第二データの中から、集計用データとして用いる前記第二データを抽出し、
前記第一データ及び前記第二データの双方には、当該双方に共通する共通項目の内容を示すデータが含まれており、
前記コンピュータは、前記第一データの各々と前記第二データの各々との間で前記共通項目の内容の類似度合いを算出し、算出した前記類似度合いに基づいて特定された設定人数分の前記第二対象者の前記第二データを、前記集計用データとして抽出することを特徴とするデータ処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047268A JP6637628B1 (ja) | 2019-03-14 | 2019-03-14 | データ処理装置及びデータ処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047268A JP6637628B1 (ja) | 2019-03-14 | 2019-03-14 | データ処理装置及びデータ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6637628B1 true JP6637628B1 (ja) | 2020-01-29 |
JP2020149451A JP2020149451A (ja) | 2020-09-17 |
Family
ID=69183739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019047268A Active JP6637628B1 (ja) | 2019-03-14 | 2019-03-14 | データ処理装置及びデータ処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6637628B1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6408744B2 (ja) * | 2016-04-20 | 2018-10-17 | 株式会社電通 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
JP2018067041A (ja) * | 2016-10-17 | 2018-04-26 | 大日本印刷株式会社 | 抽出装置及びコンピュータプログラム |
-
2019
- 2019-03-14 JP JP2019047268A patent/JP6637628B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020149451A (ja) | 2020-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11785301B2 (en) | Methods and apparatus to assign viewers to media meter data | |
JP6201077B1 (ja) | 調査データ処理装置及び調査データ処理方法 | |
CN103649981B (zh) | 用于输送目标内容的方法和装置 | |
US20140236708A1 (en) | Methods and apparatus for a predictive advertising engine | |
US20130006706A1 (en) | Using consumer purchase behavior for television targeting | |
US20110313849A1 (en) | Method and system for effective market research | |
JP2012524458A (ja) | 対話的活動に関するユーザ体験を測定するための方法及びシステム | |
CN102439620A (zh) | 媒体内容项目相对有效性的判定 | |
JP6448601B2 (ja) | 調査システムおよび調査方法 | |
JP6960069B1 (ja) | 情報処理装置、及び情報処理方法 | |
JP2020166785A (ja) | テレビ番組評価システム | |
JP6637628B1 (ja) | データ処理装置及びデータ処理方法 | |
JP6613385B1 (ja) | データ処理装置及びデータ処理方法 | |
Kim | Audience measurement and analysis | |
JP6495532B1 (ja) | 調査結果処理装置、及び調査結果処理方法 | |
JP6951382B2 (ja) | メディア接触状況調査装置及びメディア接触状況調査方法 | |
JP6556971B1 (ja) | データ処理装置、及びデータ処理方法 | |
JP2020166791A (ja) | 広告配信システム | |
JP7329708B1 (ja) | 情報処理装置、及び情報処理方法 | |
JP6813854B2 (ja) | テレビ番組評価システム | |
JP7320149B1 (ja) | 出稿支援装置、及び出稿支援方法 | |
Chakraborty et al. | Selecting important features related to efficacy of mobile advertisements | |
JP7295207B1 (ja) | 調査集計システム | |
JP7185792B1 (ja) | 評価装置、及び評価方法 | |
JP2020166784A (ja) | テレビ番組評価システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190315 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190315 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6637628 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |