JP2018156299A - 調査データ処理装置及び調査データ処理方法 - Google Patents

調査データ処理装置及び調査データ処理方法 Download PDF

Info

Publication number
JP2018156299A
JP2018156299A JP2017051688A JP2017051688A JP2018156299A JP 2018156299 A JP2018156299 A JP 2018156299A JP 2017051688 A JP2017051688 A JP 2017051688A JP 2017051688 A JP2017051688 A JP 2017051688A JP 2018156299 A JP2018156299 A JP 2018156299A
Authority
JP
Japan
Prior art keywords
survey
data
monitor
fusion
survey data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017051688A
Other languages
English (en)
Other versions
JP6201077B1 (ja
Inventor
玄 田村
Gen Tamura
玄 田村
伊佐 片柳
Isa Katayanagi
伊佐 片柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Video Research Co Ltd
Original Assignee
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Video Research Co Ltd filed Critical Video Research Co Ltd
Priority to JP2017051688A priority Critical patent/JP6201077B1/ja
Application granted granted Critical
Publication of JP6201077B1 publication Critical patent/JP6201077B1/ja
Publication of JP2018156299A publication Critical patent/JP2018156299A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データの片方又は双方が動的に変化する調査データであっても、その回答内容を正確且つ効率的に融合し、融合データとして有効に活用するためのデータ処理サービスを提供する。【解決手段】第1調査データのうち新規の第1調査データを特定する(S201)。新規の第1調査データと第2調査データの双方の共通項目に関数を適用して距離計算用スコア群を算出する(S202)。距離計算用スコア群を比較して、新規の第1調査データの各モニタA’と第2調査データの各モニタBとの類似度合いを示す距離について距離計算を実行する(S203)。新規の第1調査データの各モニタA’について、総距離が近いモニタを第2調査データのモニタBの中から特定し、同一のモニタとみなして融合する(S204)。融合データを保存する(S205)。【選択図】図12

Description

本発明は、調査データ処理装置及び調査データ処理方法に係り、特に、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データを処理する装置及び方法に関する。
メディアプランニング等を目的としてアンケート調査等の種々の調査を実施し、その調査結果を示す調査データを処理することは各業界でよく行われており、各社は、例えば自社の商品やサービスについて独自に調査を行い、その調査結果の中から有用な情報を抽出する。さらに、調査の中には、同一のモニタを対象にして購買・広告接触・ライフスタイル等の多面的情報を採取することを目的としてなされる調査があり、このような調査の結果は、所謂「シングルソースデータ」と呼ばれ、広告メディアと商品の購買の有無との相関等を個人ベースで分析する際に有用な情報源となる。
一方、従来から複数のデータベースを融合する技術が知られている。かかる技術は、データフュージョンと称され、シングルソースデータを取得するには非常にコストがかかるという不都合を解消するための手段として用いられる。
図15に示すデータフュージョンの概念図を参照しながら説明すると、互いに独立して取得した2つの調査データA及びBを、それぞれの調査に回答したモニタの類似度に基づいて融合(フュージョン)する。つまり、共通項目1〜nの回答内容について類似度が高いモニタ同士を同じモニタとみなし、これによって調査データA中、あるモニタの回答内容を示すレコード(具体的には、共通項目1〜n及び独自項目A1〜nの回答)に対して、調査データB中、そのあるモニタと同視されるモニタの回答内容を示すレコード(具体的には、独自項目B1〜nの回答)を付与することが可能となる。この結果、調査データAの内容に、調査データAには未収録であった独自項目B1〜nの回答内容を追加した融合データが生成されることになる。
以上のように、データフュージョンによって比較的少ない質問数に設定された調査の調査結果であってもシングルソースデータ化することが可能となり、このようにして得られた擬似シングルソースデータを活用することで、メディアプランニング等において有用な情報をより低コストで入手可能となる。
さらに、データフュージョンの手法としては、「制約なし統計的マッチング」及び「制約付き統計的マッチング」が挙げられる。「制約なし統計的マッチング」は、モニタの類似度に基づいて単にデータ同士をフュージョンするものである。この「制約なし統計的マッチング」は、処理が簡素化されるので、効率的に大量のデータを処理することができるというメリットがある。一方、「制約付き統計的マッチング」は、元データの平均と分散を保持しようとする制約の下でデータ同士をフュージョンするので、元データが持つ情報がより正確に融合データに引き継がれるというメリットがある。
また、「制約付き統計的マッチング」では、通常、データフュージョン用の計算に要する時間が長時間になるため、近年では、計算時間を短くし「制約付き」とほぼ変わらない精度を検証済みの「距離優先制約付き統計的マッチング」という技術が開発されている(特許文献1参照)。
特許第4338486号公報
以上までに説明してきたように、比較的少ない質問数に設定された調査の調査結果からシングルソースデータを得る手法としてデータフュージョンは有効である。
すなわち、複数の調査の調査結果を融合して得られる融合データを有効に活用することにより、融合前では不可能な集計が可能となる。また、これに係る一連の処理の実行がASP(Application Service Provider)等によるサービスとして提供されれば、それらの調査結果を利用したい各社にとって有益となる。
しかしながら、調査データの片方又は両方が動的に変化する調査データの場合、データフュージョン実施時点では融合できていたレコードがその後調査データから存在しなくなったり、データフュージョン実施時点では存在しなかった新たなレコードがその後出現したりすることがある。
例えば、このように動的に変化する調査データの例としては、ローテーションを行うパネル調査データが挙げられる。具体的には、パネル調査で同一対象を長い間調査していると、調査慣れや学習効果による影響が出てくることがあり、また、標本が母集団の変化に対応しなくなることがある。このような状況を避けるため、パネル調査では、一定期間経過後に、モニタの一部又は全部を遂次組み替えること(総入れ替えや部分的に入れ替える等のローテーション)を行っている場合がある。また、パネル調査データには、上記のような定期的なローテーション以外にも、脱落したモニタを補充するため、新たなモニタを追加することにより、不規則にモニタを入れ替えるような場合もある。さらに、上記のようなアンケート調査等の調査データに限らず、動的に変化する調査データとしては、各種機器から自動的に取得できる稼働ログデータや、Webログ、購買履歴、アプリ利用履歴等、又は、常に変化し続ける大量の顧客データ(いわゆるビッグデータ)等も、動的に変化する調査データとして捉えることもできる。
上述のとおり、データフュージョンには、「制約なし統計的マッチング」、「制約付き統計的マッチング」又は「距離優先制約付き統計的マッチング」等、様々な手法が存在するが、従来では、このように調査データの片方又は両方が動的に変化する調査データにおいては、データフュージョン実施時点では存在しなかった新たなレコードを正確且つ効率的に融合する処理ができなかった。
そこで、本発明は、上記の問題に鑑みてなされたものであり、その目的は、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データの片方又は双方が動的に変化する調査データであっても、その回答内容を正確且つ効率的に融合し、融合データとしてより有効に活用するためのデータ処理サービスを提供することが可能な調査データ処理装置及び調査データ処理方法を実現することである。
前記課題は、本発明の調査データ処理装置によれば、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データを処理する調査データ処理装置であって、前記第1調査及び前記第2調査の双方に含まれる共通項目に対する回答内容を、前記第1調査に回答した第1調査モニタの人数分集めた第1調査データを取得する第1調査データ取得部と、前記共通項目、及び、前記第2調査のみに含まれる第2調査独自項目に対する各々の回答内容を、前記第2調査に回答した第2調査モニタの人数分集めた第2調査データを取得する第2調査データ取得部と、前記第1調査データ取得部が取得した前記第1調査データと、前記第2調査データ取得部が取得した前記第2調査データと、を融合して、前記第1調査データ及び前記第2調査データの各々の回答内容を示す融合データを生成するデータ融合処理を実行する処理実行部と、を備え、前記データ融合処理は、所定の演算式を用いて前記共通項目に対する回答内容に関する値を算出し、前記第1調査モニタと前記第2調査モニタとの間で前記値同士を比較した結果を用いて、前記共通項目に対する回答内容の類似度合いを算出する算出処理と、算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1調査モニタに対して、前記第2調査モニタの前記第2調査独自項目に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含み、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化したときに、前記割り当て処理によって既に割り当て済みであって割り当て相手がその時点で未だ存在する前記第1調査モニタ及び前記第2調査モニタについてはそのまま割り当て相手を引継ぎ、新規の第1調査モニタ又は新規の第2調査モニタについてのみ前記算出処理及び前記割り当て処理を実行すること、により解決される。
また、本発明の調査データ処理方法によれば、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データをコンピュータによって処理する調査データ処理方法であって、前記コンピュータが、前記第1調査及び前記第2調査の双方に含まれる共通項目に対する回答内容を、前記第1調査に回答した第1調査モニタの人数分集めた第1調査データを取得する工程と、前記共通項目、及び、前記第2調査のみに含まれる第2調査独自項目に対する各々の回答内容を、前記第2調査に回答した第2調査モニタの人数分集めた第2調査データを取得する工程と、取得した前記第1調査データと前記第2調査データとを融合して、前記第1調査データ及び前記第2調査データの各々の回答内容を示す融合データを生成するデータ融合処理を実行する工程と、を実行し、前記データ融合処理は、所定の演算式を用いて前記共通項目に対する回答内容に関する値を算出し、前記第1調査モニタと前記第2調査モニタとの間で前記値同士を比較した結果を用いて、前記共通項目に対する回答内容の類似度合いを算出する算出処理と、算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1調査モニタに対して、前記第2調査モニタの前記第2調査独自項目に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含み、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化したときに、前記割り当て処理によって既に割り当て済みであって割り当て相手がその時点で未だ存在する前記第1調査モニタ及び前記第2調査モニタについてはそのまま割り当て相手を引継ぎ、新規の第1調査モニタ又は新規の第2調査モニタについてのみ前記算出処理及び前記割り当て処理を実行すること、により解決される。
以上のように構成された本発明の調査データ処理装置又は調査データ処理方法では、第1調査モニタ又は第2調査モニタの双方又は一方が変化したときに、割り当て処理によって既に割り当て済みであって割り当て相手がその時点で未だ存在する第1調査モニタ及び第2調査モニタについてはそのまま割り当て相手を引継ぎ、新規の第1調査モニタ又は新規の第2調査モニタについてのみ算出処理及び割り当て処理をあらためて実行する。
これにより、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データの片方又は双方が動的に変化する調査データであっても、既に融合済みの融合データをそのまま生かすことができると共に、継続的にその回答内容を正確且つ効率的に融合することができる。そして、その融合データが示す情報を分析することにより、融合前の情報からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前後において、前記算出処理で用いられる前記所定の演算式は変化しない、とよい。
上記の構成のように、新規の調査データを融合する際に、共通項目に対する回答内容に関する値(距離計算用スコア)を算出する際に使用する所定の演算式(融合パラメータ等の関数)を再計算せず、既に使用した所定の演算式を再利用することにより、処理が簡素化され、大量の新規調査データであっても、迅速に処理することが可能となる。
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前後において、前記共通項目に対する調査時期が異なる場合、前記算出処理及び前記割り当て処理において、前記処理実行部は、前記共通項目と近似する項目若しくは時期に対する回答内容又は該回答内容の統計値を前記共通項目に対する回答内容として代替する、とよい。
上記の構成のように、例えば、共通項目が時点に依存する等の理由により、共通項目に対する調査時期が異なることによって、新規の調査データが融合データと全く同一の共通項目を保持していない場合であっても、共通項目と近似する項目若しくは時期に対する回答内容又はその回答内容の平均値や代表値等の統計値を共通項目に対する回答内容として代替することにより、同一の共通項目を保持している場合と差異なく、新規の調査データを融合することが可能となる。
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前において、前記処理実行部は、前記割り当て処理において、前記第1調査に関する集計結果が前記第1調査データと前記融合データとの間で揃い、且つ、前記第2調査独自項目に関する集計結果が前記第2調査データと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定する、とよい。
上記構成のように、第1調査モニタ又は第2調査モニタの双方又は一方が変化する前は、いわゆる「制約付き統計的マッチング」を採用し、融合前の調査データにおける集計結果が融合後の調査データ(融合データ)における集計結果と揃うように融合処理を実施することにより、第1調査データ及び第2調査データの平均と分散を維持でき、各調査データが保持する情報をより正確に融合データに引き継ぐことができる。
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査データは、前記第1調査のみに含まれる第1調査独自項目に対する回答内容を含む、とよい。
上記構成のように、第1調査データにも共通項目以外に第1調査のみに含まれる第1調査独自項目に対する回答内容を含むことにより、より内容の充実した融合データを得ることができる。
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査は、メディア接触に関する調査であり、前記第2調査は、生活者属性、商品関与及びメディア接触について多面的に捉えるアンケート調査である、とよい。
上記構成のように、一方の調査データをテレビ番組やラジオ番組等(CM含む。)の視聴状況、携帯電話・スマートフォン・タブレット・PC等によってインターネット上で閲覧・視聴できる情報(ウェブサイト等)の閲覧状況や動画・音楽等の視聴状況、新聞・雑誌等の購読状況等、メディア接触に関する調査とし、他方の調査データを生活者属性、商品関与及びメディア接触等について多面的に捉えるアンケート調査とすることにより、これらの相関関係を把握することが可能となり、この相関関係に基づいて最大の広告効果が得られる広告枠(放送時間やテレビ番組等)を選定することが可能となる等、融合データをより有効に活用することができる。
本発明によれば、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データの片方又は双方が動的に変化する調査データであっても、その回答内容を正確且つ効率的に融合し、融合データとしてより有効に活用するためのデータ処理サービスを提供することが可能な調査データ処理装置及び調査データ処理方法を実現することができる。
これにより、その融合データが示す情報を分析することで、融合前の情報からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。具体的に説明すると、例えば、ある調査において調査した項目(例えば、テレビ視聴の有無)と、他の調査において調査した項目(例えば、生活状況や消費者意識等)との間の相関関係を把握することが可能となり、この相関関係に基づいて最大の広告効果が得られる広告枠(放送時間やテレビ番組等)を選定することが可能となる。
本発明に係るデータ処理サービスに関する説明図である。 本発明の調査データ処理装置を含む通信システムを示した図である。 図3中の(A)は、第1調査に対する回答結果を示し、(B)は、第2調査に対する回答結果を示した図である。 調査データ処理装置のハードウェア構成を示した図である。 調査データ処理装置の構成を機能面から示した図である。 データ融合処理の内容を概念的に示した図である。 データ処理サービスに係る一連の処理についての大まかな流れを示した図である。 時点tにおけるデータ融合処理の流れ示す図である。 「制約なし統計的マッチング」を採用してデータ融合処理を実施した場合の説明図である。 「制約付き統計的マッチング」を採用してデータ融合処理を実施した場合の説明図である。 第1調査データが変化した状態を概念的に示す図である。 融合実施後の時点t+1におけるデータ融合処理の流れ示す図である。 第1調査データが変化した状態を概念的に示す図である。 第2調査データが変化した後に第1調査データが変化した状態を概念的に示す図である。 データフュージョンの概念を示した図である。
以下、本発明の一実施形態(以下、本実施形態)について図面を参照しながら説明する。
本実施形態においては、メディア接触に関する調査の一例である視聴率調査を第1調査とし、生活者属性、商品関与及びメディア接触等について多面的に捉えるアンケート調査を第2調査とするケースを例に挙げて説明する。なお、ここでは、両調査の関係において、視聴率調査を主とし、アンケート調査を従として説明する。
また、以下の説明において、「シングルソースデータ」とは、同一のモニタ(回答者)から収集した比較的多数(例えば数百問)の質問への回答内容を示すデータであり、購買、広告接触、ライフスタイル等の多面的情報を採取したデータである。具体的には、同データが示す情報には、モニタの属性に関する質問への回答内容、具体的にはデモグラフィック(人口統計学的属性)に関する情報、及び、サイコグラフィック(心理学的属性)に関する情報等が含まれている。
なお、メディア接触に関する調査とは、本実施形態のようなテレビ番組(CM含む)の視聴状況に関する調査に限らず、ラジオ番組等(CM含む)の視聴状況、携帯電話・スマートフォン・タブレット・PC等によってインターネット上で閲覧・視聴できる情報(ウェブサイト等)の閲覧状況や動画・音楽等の視聴状況、新聞・雑誌等の購読状況等であってもよい。
<<調査データ処理サービスについて>>
先ず、本発明により実現される調査データ処理サービスについて図1を参照しながら説明する。図1は、調査データ処理サービスに関する説明図である。
調査データ処理サービスは、本発明の調査データ処理装置を管理する調査会社によって提供されるものであり、互いに異なるモニタに対して実施した複数の調査(本実施形態では、第1調査及び第2調査の二種類の調査)の調査結果を示す調査データを融合するための一連のデータ処理を実行するサービスである。
具体的に説明すると、調査会社は、第1調査として視聴率調査を実施する。この視聴率調査は、無作為に抽出したモニタに対してテレビ番組等の視聴状況に関する調査を実施するものであり、調査会社は、それらの視聴状況に関する情報を各モニタから収集すると、それらの情報を集約して第1調査データとして保管する。
なお、視聴率には、世帯視聴率と個人視聴率の二種類の視聴率があるが、本実施形態では、個人視聴率を利用するものとする。ただし、これに限定されるものではなく、調査対象者を世帯単位とした世帯視聴率であっても適用することができる。
個人視聴率とは、調査対象者を世帯に属する構成員単位とし、世帯内の所定年齢以上(例えば4歳以上)の家族全員の中で、誰がどれくらいどのようなテレビ番組を視聴したかを示す割合であり、本実施形態のように、視聴者を、性別等に分けて、どのような属性の個人がどれくらい見ていたかを知りたいとき等に利用されている。一方、世帯視聴率とは、調査対象者を世帯単位とし、テレビ所有世帯のうち、どのくらいの世帯がテレビ番組を視聴していたかを示す割合である。
また、調査会社は、第2調査としてアンケート調査を実施する。このアンケート調査は複数のモニタを対象にして複数の質問をするものであり、調査会社は、全ての質問に対する回答を各モニタから回収すると、モニタ人数に相当する分の回答を集約して第2調査データとして保管する。
アンケート調査では、生活者属性、商品関与、メディア接触という3つの視点を同一モニタに調査し、生活者を多角的に捉えることを目的とし、各モニタに対して比較的多数の質問を出す。具体的には、質問は数百問程度に及び、その内容には、モニタのデモグラフィック属性やサイコグラフィック属性を含む。つまり、調査会社が第2調査として実施するアンケート調査の回答結果を示す調査データは、シングルソースデータに相当する。
なお、アンケート調査のモニタは、視聴率調査のモニタとは異なるモニタとする。また、調査会社がアンケート調査を依頼するモニタの人数については自由に設定可能であるが、シングルソースデータとして十分な情報を収集することが可能な規模でモニタを確保するのが望ましい。
調査会社は、第1調査である視聴率調査で取得した第1調査データと、第2調査であるアンケート調査で取得したシングルソースデータとしての第2調査データとを融合する。この結果、上記2つの調査データを融合した融合データが生成される。
以上のように、調査会社は、データ融合処理を実行して第1調査と第2調査の回答結果を集約し、その結果を融合データという形で得ることができ、融合前のデータでは不可能な集計等も可能となる。また、この融合データは、メーカ等の顧客企業に提供することもでき、融合データの提供を受けた顧客企業は、その融合データが示す情報を分析し、その情報に基づいて効果的なメディアプランニングを立案することが可能となる。
<<調査データ処理サービスの提供システムについて>>
次に、上述したデータ処理サービスを提供するためのシステム構成について、図2を参照しながら説明する。図2は、本発明の調査データ処理装置を含む通信システムを示した図である。
調査会社は、上記のデータ処理サービスを提供するために、コンピュータ、より厳密にはサーバコンピュータ(以下、サーバ1)を保有している。このサーバ1は、本発明の調査データ処理装置に相当し、上述したデータ処理サービスをASPサービスとして提供する。
サーバ1の機能について概説すると、サーバ1は、図2に示すように、インターネット等の情報通信網N1を介して、視聴率調査の対象となる各世帯と通信可能に接続されている。
具体的に説明すると、調査会社は、抽出された世帯に対して測定機21を配布する。この測定機21は、抽出された世帯の自宅内(厳密にはテレビの設置箇所周辺)に配置され、世帯全体の中の各構成員を一の調査対象者として、テレビ番組の視聴状況を測定するために使用される。測定機21により生成されたテレビ番組の視聴状況を示すデータは、情報通信網N1を通じて外部の機器に向けて送信される。この測定機21が送信するデータ(以下、視聴率データ)は、どの調査対象者がどのテレビ番組をいつどれだけ視聴したのかを示すデータである。
ちなみに、本実施形態では、世帯の構成員(すなわち、個人)を調査対象者としたが、世帯自体を調査対象者として取り扱ってもよい。
また、サーバ1は、図2に示すように、インターネット等の情報通信網N2を介してモニタ保有の回答用端末31と通信可能に接続されている。そして、サーバ1は、各回答用端末31と通信することにより、アンケート調査の各質問に対する各モニタの回答データ(以下、個別回答データ)を受信する。
ここで、回答用端末31とは、アンケート調査の回答を依頼した各モニタに対して調査会社が配布したタブレット型の通信端末である。つまり、モニタは、回答用端末31に搭載されたタッチパネルを見てアンケート調査の各質問を確認し、タッチパネル上でのタッチ操作を通じて回答する。そして、回答用端末31がモニタによる回答操作を受け付けると、その回答内容を示す個別回答データを生成し、生成したデータをサーバ1に向けて送信する。
なお、回答用端末31については、タブレット型の端末に限定されるものではなく、スマートフォンやノートPC等、他の通信端末であってもよい。また、回答用端末31に代えて、調査会社が各モニタにアンケート用紙を配付し、回収した回答済みのアンケート用紙の内容に基づいて調査会社側でデータ化する方法であってもよい。
また、サーバ1は、規定の問題数に相当する数の個別回答データを各回答用端末31から受信すると、各データが示す情報を取りまとめて全モニタ分の回答結果として集約し、その集約したデータ、すなわち、第2調査データをサーバ1内に記憶させておく。
また、サーバ1は、同サーバ1内に記憶された第1調査データと第2調査データとを融合して融合データを生成する処理、すなわち、データ融合処理を実行する。ここで、融合データを生成するとは、元データである2つの調査データとは別のデータを生成するケースに限られず、元データである2つの調査データのうちの一方を他方に組み込んだ内容に更新する形で融合データを生成するケースを含むものとする。
なお、データ融合処理及び融合データについては、後の項で詳細に説明する。
さらに、サーバ1に、調査会社の担当者が操作する各端末や顧客企業端末が通信可能に接続されている場合は、その不図示の各端末や顧客企業端末が入力操作を受け付けることで生成するデータ配信要求を受信すると、生成した融合データを要求の発信元である各端末や顧客企業端末に向けて配信することもできる。
<<調査データについて>>
次に、視聴率調査に関する第1調査データ、及び、アンケート調査に関する第2調査データについて、図3を参照しながら説明する。
図3中の(A)は、第1調査である視聴率調査の調査結果の内容の一例を示している。図3中の(B)は、第2調査であるアンケート調査に対する調査結果の内容の一例を示している。
視聴率調査の結果を示す視聴率データを集計した第1調査データD1には、性別等のモニタの属性に関する内容、すなわち、デモグラフィック(人口統計学的属性)に関する情報と、テレビXの視聴の有無等に関する情報を含む。また、各項目は「0」又は「1」の数値で二値化されている。ただし、これに限定されず、各項目が「0」及び「1」のいずれかを入力する方法以外の方法で入力されることとしてもよい。
これに対して、アンケート調査の結果を示す個別回答データを集計した第2調査データD2は、前述したようにシングルソースデータとなっており、数百問分の個別回答データを例えば1万人超のモニタから回収して集約したものになっている。
例えば、性別等のモニタの属性に関する内容、すなわち、デモグラフィック(人口統計学的属性)に関する情報と、テレビXの視聴の有無等に関する情報の他、ビールAの購入の有無等、サイコグラフィック(心理学的属性)に関する情報を含む。また、第2調査データD2においても、各項目は「0」又は「1」の数値で二値化されているが、これに限定されず、各項目が「0」及び「1」のいずれかを入力する方法以外の方法で入力されることとしてもよい。
第1調査データD1及び第2調査データD2には、図3(A)及び(B)に示すように、両調査間で共通する項目(以下、共通項目)が含まれている。この共通項目は、後のデータ融合処理においてキーとなる項目であり、図3に示すケースではモニタ属性に関する項目(性別等)及びテレビ番組の視聴状況に関する項目(テレビXの視聴の有無等)が、共通項目に該当する。
一方、第2調査データD2には、第1調査には含まれず、且つ、第2調査のみにしか含まれない独自の項目(独自項目)が存在する。この項目は、世間の動向を把握するため、生活者属性、商品関与、メディア接触という3つの視点を同一モニタに調査し、生活者を多角的に捉えることを目的として、調査会社が実施するアンケート調査において特別に設定されたものであり、一例を挙げると、図3(B)に示したビールAの購入の有無等を問う項目が、この独自項目に該当する。
<<サーバの構成について>>
次に、サーバ1の構成について図4を参照しながら説明する。図4は、サーバ1のハードウェア構成を示した図である。
サーバ1は、図4に示すように、CPU1a、ROM1b、RAM1c、通信用インタフェース(図4中、通信用I/Fと表記)1d、ハードディスクドライブ(図4中、HDDと表記)1e、マウスやキーボード等の入力装置1f、及びディスプレイやプリンタ等の出力装置1gを構成要素として有する。また、サーバ1には、その機能を発揮させるためのプログラム(以下、データ処理プログラム)が予めインストールされている。このデータ処理プログラムがCPU1aに読み取られて実行されることで、サーバ1によるデータ処理サービスが提供されることになる。
サーバ1のハードウェア構成については上述の通りであるが、以下、図5を参照しながらサーバ1の構成を機能面から改めて説明する。図5は、サーバ1の構成を機能面から示した図である。
サーバ1は、図5に示すように、データ受信部11、データ集約部12、データ記憶部13、処理実行部14及びデータ配信部15を有する。これらは、サーバ1が実行する各種処理を担うものであり、サーバ1を構成する上述のハードウェア構成機器と上述のデータ処理プログラムとが協働することによって構成されている。以下、上述したサーバ1の機能部の各々について説明する。
データ受信部11は、情報通信網N1,N2を介してサーバ1と接続された機器と通信して当該機器からデータを受信するものであり、例えば、各世帯に配置された測定機21から視聴率データを受信し、また、回答用端末31から個別回答データを受信する。
データ集約部12は、データ受信部11が、視聴率データ又は個別回答データを受信すると、当該視聴率データ又は個別回答データを解析して同データが示す情報を特定し、さらにその情報を図3に図示したテーブル形式でまとめる。すなわち、データ集約部12は、各世帯に配置された測定機21から送信された視聴率データを、全モニタ分且つ全項目分の第1調査データD1として集約するものである。また、回答用端末31から送信された個別回答データを、全モニタ分且つ全項目分の第2調査データD2として集約するものである。
データ記憶部13は、各種のデータを記憶しておくものであり、サーバ1に搭載されたハードディスクドライブ1eを主たる構成要素としている。データ記憶部13に記憶されるデータの中には、データ集約部12によって生成された第1調査データD1や第2調査データD2が含まれている。さらに、データ記憶部13には、後述の処理実行部14がデータ融合処理を実行することで生成される融合データが記憶される。
なお、本実施形態では、第1調査データD1及び第2調査データD2がサーバ1内のハードディスクドライブ1eに記憶されることとしたが、これに限定されるものではない。つまり、第1調査データD1及び第2調査データD2を記憶する記憶装置については、サーバ1と別に設けられていることとしてもよく、例えば、サーバ1と通信可能なデータベースサーバを第1調査データD1及び第2調査データD2の記憶装置として用いることとしてもよい。
処理実行部14は、データ記憶部13に記憶された第1調査データD1及び第2調査データD2を読み出し、これらのデータを融合するデータ融合処理を実行して融合データを生成するものである。
以下、図6を参照しながらデータ融合処理について概説する。図6は、データ融合処理の内容を概念的に示した図である。
データ融合処理は、互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データ同士を、当該各々の共通項目に対する回答内容をキーとして融合する処理である。かかる処理により、図6下段に示すように、第1調査の調査結果に対して第2調査にのみ含まれた独自項目(第2調査独自項目に相当)に対する回答内容を付加した情報を示すデータ、すなわち、融合データが生成される。
データ融合処理では、先ず、視聴率調査の調査結果を示す第1調査データD1と、アンケート調査の調査結果を示す第2調査データD2とを対比する。具体的に説明すると、上記2つの調査に回答したモニタ同士の間で両調査に含まれる共通項目を特定して、その共通項目への回答の類似度合いを算出する。
ここで、共通項目は、前述したように、性別等のモニタ属性に関する項目とテレビ番組の視聴状況(テレビ視聴行動)に関する項目とを含んでいる。
より詳しく説明すると、データ融合処理では、第1調査である視聴率調査を依頼したモニタA(以下、モニタA)の各々について、第2調査であるアンケート調査を依頼したモニタB(以下、モニタB)の中から共通項目に対する回答内容が最も類似しているモニタを探索する。かかる目的のため、モニタAとモニタBとの間の類似度合いを算出する。なお、類似度合いの算出方法については後の項で説明する。
類似度合いの算出後には、類似度合いが高いモニタの組み合わせを探索する。具体的に説明すると、モニタAに対して、モニタBの中から上記の類似度合いが最も高いモニタを探索する。探索されたモニタ(モニタB)、及び、基準とされたモニタ(モニタA)は、以降、一組のモニタとして扱われる。
そして、一組のモニタのうち、モニタAに対して、モニタBが回答した独自項目の回答内容と同一の回答内容を割り当てる。
ここで、独自項目は、前述したように、ビールAの購入の有無等の商品・サービス関与に関する項目の他、日常生活意識・行動、メディア・広告関与、メディア接触等に関する項目等を含んでいる。
モニタAは、視聴率調査に含まれる項目、具体的には、共通項目のみに対して回答しており、アンケート調査のみに含まれる独自項目に対しては回答していない。したがって、モニタBが回答した独自項目の回答内容と同一の回答内容を割り当てることにより、アンケート調査に回答していないモニタ(モニタA)に対して、独自項目への仮想回答が付与されることになる。
以上の手順に従ってモニタA全てに対して仮想回答が割り当てられることにより、視聴率調査の結果を示す視聴率データを集計した第1調査データD1と、アンケート調査の結果を示す個別回答データを集計した第2調査データD2とが融合するようになる。
この結果、異なるモニタに対して実施された異なる調査の調査結果における共通項目と独自項目を含む擬似的調査データとして、融合データが生成され、生成された融合データは、データ記憶部13に記憶される。
なお、融合データについて付言しておくと、融合データの数は、モニタAの数又はモニタBの数と必ずしも同数になるとは限らず、例えば、モニタBの数が、モニタAの数の倍数となっていない場合には、両モニタ数の最小公倍数に相当する数のデータを含む融合データが生成される場合がある。
データ配信部15は、サーバ1に通信可能に接続されている不図示の各端末や顧客企業端末から発された融合データの配信要求をデータ受信部11が受信することにより、データ記憶部13から融合データを読み出して上記の各端末や顧客企業端末に向けて同データを配信するものである。
<<調査データ処理方法>>
次に、本実施形態に係る調査データ処理方法について説明する。
本実施形態に係る調査データ処理方法は、コンピュータであるサーバ1を用いて行われる。換言すると、サーバ1がASPサービスとして実行するデータ処理(以下、データ処理サービス)では、本実施形態に係る調査データ処理方法が適用されていることになる。以下では、本実施形態に係る調査データ処理方法の説明として、サーバ1によるデータ処理サービスの流れと同サービス中の各工程について説明することとする。
サーバ1によるデータ処理サービスは、図7に示す流れに従って進行する。図7は、データ処理サービスに係る一連の処理についての大まかな流れを示した図である。
データ処理サービスは、先ず、第1調査データを取得する工程(S001)から始まる。ここで、第1調査データは、視聴率調査の結果を示す視聴率データを集計したものである。
本工程S001について詳しく説明すると、データ受信部11が、各世帯に配置された測定機21から視聴率データを受信する。そして、一定期間経過後、データ集約部12が、これらの視聴率データを集約して、全モニタ分の第1調査データを生成する。そして、本工程S001で取得した第1調査データは、データ記憶部13に記憶される。
このように、本実施形態では、データ受信部11とデータ集約部12との協働によって第1調査データが取得される。かかる観点において、データ受信部11及びデータ集約部12は、第1調査データを取得する第1調査データ取得部を構成している。
第1調査データを取得した後、第2調査データを取得する工程(S002)が実行される。
本工程S002について詳しく説明すると、データ受信部11が、各モニタの回答用端末31から個別回答データを受信する。その後、全項目分の個別回答データを全モニタから回収した時点で、データ集約部12が、これらの個別回答データを集約して、全モニタ分且つ全項目分の第2調査データを生成する。そして、本工程S002で取得した第2調査データは、データ記憶部13に記憶される。
このように、本実施形態では、データ受信部11とデータ集約部12との協働によって第2調査データが取得される。かかる観点において、データ受信部11及びデータ集約部12は、第2調査データを取得する第2調査データ取得部を構成している。
なお、本実施形態では、第1調査データを取得した後に第2調査データを取得することとしたが、これに限定されるものではなく、第2調査データを取得した後に第1調査データを取得することとしてもよいし、第1調査データと第2調査データを同時に取得することとしてもよい。
また、第1調査データ又は第2調査データの片方又は双方が動的に変化するデータである場合は、その変化した分のデータのみ取得することとしてもよい。
以上までの工程S001、S002により2つの調査データ(第1調査データ及び第2調査データ)がデータ記憶部13に記憶されると、その後にサーバ1の処理実行部14が、これらの第1調査データ及び第2調査データを読み出してデータ融合処理を実行する(S003)。
本工程S003により、視聴率調査及びアンケート調査の双方の回答内容を示す融合データが生成され、本工程S003において生成された融合データは、データ記憶部13に記憶される。なお、本工程S003は、それ以前の工程S001、S002によって第1調査データ及び第2調査データがデータ記憶部13に記憶されると自動的に実行されることとしてもよく、又は、サーバ1のユーザ(例えば、調査会社の従業員)による所定の入力操作をサーバ1側で受け付けたことを契機として実行されることとしてもよい。
その後、必要に応じて、例えば、各端末や顧客企業端末を通じて融合データの配信が要求されると、当該要求をデータ受信部11が受信することによって、サーバ1のデータ配信部15がデータ記憶部13から融合データを読み出し、当該データを各端末や顧客企業端末に向けて配信する(S004)。
以上の一連の工程が終了した段階で、ある時点(例えば時点t)における1回のデータ処理サービスが完了することとなる。
次に、上述したデータ処理サービスのうち、データ融合処理を実行する工程S003について図8を参照しながらより詳細に説明する。図8は、ある時点(時点t)におけるデータ融合処理の流れを示す図である。
サーバ1の処理実行部14により実行されるデータ融合処理は、図8の流れにしたがって進行する。以下、各工程について説明する。
データ融合処理では、先ず、データ記憶部13に記憶された第1調査データと第2調査データを読み出し、第1調査データと第2調査データの双方に含まれる共通項目を指定する(S101)。
具体的には、処理実行部14が、第1調査データの内容を解析し、第1調査データに含まれる一のモニタAが共通質問に対して回答した回答内容を特定する。同様に、第2調査データを解析し、第2調査データに含まれる一のモニタBが共通質問に対して回答した回答内容を特定する。
なお、本実施形態では、性別等のモニタ属性とテレビ視聴行動についての回答内容が、共通項目として指定される。
次に、モニタAの一人が、モニタBのどの人と最も類似しているかを特定するために、モニタAとモニタBのそれぞれに共通項目を用いて合成変数(主成分分析により得られる主成分得点算出関数等)を作成し(S102)、工程S102により算出した合成変数(主成分分析により得られる主成分得点算出関数等)又は予め設定した任意の関数をデータ記憶部13に保存する(S103)。
具体的には、処理実行部14が、第1調査のモニタAと第2調査のモニタBとの距離を求めるために必要な値(距離計算用スコア群)を算出する際に使用する融合パラメータとなる関数を設定する。合成変数の作成には、例えば、統計学における主成分分析を行い生成される主成分得点を用いても良いし、共通項目それぞれに任意の係数を掛け合わせ、その後得られる総和を用いても良い。また、合成変数は単一でもよく、複数あってもよい。
次に、第1調査データと第2調査データの双方の共通項目に上記の関数を適用して、距離計算用スコア群を算出する(S104)。
具体的には、処理実行部14が、上記関数と共通項目を用いることにより、第1調査データと第2調査データの各モニタA、Bの値を求める。このとき、距離計算用スコア群が目的変数となり、共通項目が説明変数となる。
次に、上記工程S104により算出した距離計算用スコア群を比較して、第1調査データの各モニタAと第2調査データの各モニタBとの類似度合いを示す距離について距離計算を実行する(S105)。
本実施形態では、共通項目の各々について回答内容の違いを距離で表し、共通項目ごとの距離計算用スコア群を合計した総距離を以てモニタ間の類似度合いとしており、その総距離が小さい値になる程、属性が近いモニタであることを示している。具体的には、処理実行部14が、各項目の距離計算用スコア群を合算し、その結果を以てモニタ間の類似度合いとする。
次に、上記工程S105によって距離計算を実行した後、第1調査データの各モニタAについて、総距離が近いモニタを第2調査データのモニタBの中から特定し、同一のモニタとみなして紐付けて融合する(S106)。
このとき、本実施形態においては、第1調査データのモニタAと第2調査データのモニタBとの割り当てパターンを設定する際に、「制約なし統計的マッチング」又は「制約付き統計的マッチング」のいずれの手法を用いてもよい。
例えば、処理を簡素化して、効率的に大量のデータを処理することが可能な「制約なし統計的マッチング」の手法を採用して、割り当てパターンを設定することができる。ここでは、事案を簡素化するために、図9に示すケースを例に挙げて説明することとする。
図9は、上記のような「制約なし統計的マッチング」を採用してデータ融合処理を実施した場合の説明図である。
図9に示すように、処理実行部14は、第1調査データのモニタAについて、上記工程106にて算出した類似度合いが最も高い第2調査データのモニタB、すなわち、最も類似した第2調査データのモニタBを一つ選択して紐付ける。例えば、ここでは、第1調査データのモニタA(A00001)については、第2調査データのモニタB(B00002)を、第1調査データのモニタA(A00002)については、第2調査データのモニタB(B00003)を、最も類似するモニタと特定し、融合する。
これにより、第1調査データのモニタA(A00001)には第2調査データのモニタB(B00002)の回答と同一の回答内容が仮想回答として割り当てられ、第1調査データのモニタA(A00002)には第2調査データのモニタB(B00003)の回答と同一の回答が仮想回答として割り当てられる。すなわち、仮想回答が各モニタA00001、A00001に対して割り当てられた結果、データ同士が融合し、最終的に、図9の下段に示す融合データが生成される。
一方、融合データは、元データ(第1調査データ及び第2調査データ)の平均・分散を維持できるように、「制約付き統計的マッチング」の手法を採用して、割り当てパターンを設定することもできる。この「制約付き統計的マッチング」では、処理実行部14が、モニタ同士間の類似度合いに基づいて割り当てパターンを統計的解法に従って設定する。
具体的には、処理実行部14は、割り当てパターンを設定するため手法として輸送問題の解法を採用し、当該解法により下記の前提条件(A)、(B)の双方を満たすような割り当てパターンを設定することとしている。
(A)第1調査に関する集計結果については、融合前の第1調査データと融合データとの間で同一とする。
(B)第2調査に関する集計結果については、融合前の第2調査データと融合データとの間で同一とする。
ここで、第1調査又は第2調査に関する集計結果とは、同調査に対する回答内容別にモニタ人数を集計した際の人数比率のことである。
また、輸送問題の解法により割り当てパターンを設定するにあたり、第1調査の各モニタ及び第2調査の各モニタに対して重み(ウェイト)を設定する。ここで、第1調査データの各モニタAに対して設定される重みは、輸送問題における需要量に相当し、第2調査データの各モニタBに対して設定される重みは、供給量に相当する。
ここでは、事案を簡素化するために、図10に示すケースを例に挙げて説明することとする。
図10は、上記のような「制約付き統計的マッチング」を採用してデータ融合処理を実施した場合の説明図である。
例えば、図10に示すように、データ融合に係る2つの調査データのうちの一方(第1調査データ)がモニタ数2人(A00001〜A00002)のデータであり、他方(第2調査データ)がモニタ数3人(B00001〜B00003)である場合、第1調査データのモニタAを第2調査データのモニタBのいずれか一人以上と結びつけ、第2調査データのモニタBを第1調査データのモニタAのいずれか一人以上と結びつける。このとき、第2調査データのモニタBは、第1調査データのモニタ1人と重み3で結びついてもよいし、図10に示すように、第1調査データのモニタ1人と重み1(A00001とB00002、A00002とB00002)、他の第1調査データのモニタ1人と重み2(A00001とB00001、A00002とB00003)で結びついてもよい。また、第1調査データのモニタAは、第2調査データのモニタ1人と重み2(A00001とB00001、A00002とB00003)で結びついてもよいし、第1調査のモニタ1人と重み1(A00001とB00002)、他の第1調査のモニタ1人と重み1(A00002とB00002)で結びついてもよい。
ただし、結びついた重みと第1調査データのモニタAと第2調査データのモニタBとの間の類似度(上記値から算出した類似度)の総和が最も小さくなるよう結び付ける。その結果、融合データは、元データ(第1調査データ及び第2調査データ)の平均・分散を維持することができる。この「制約付き統計的マッチング」では、このように設定した重み配分こそが、割り当てパターンに相当する。
これにより、第1調査データのモニタA(A00001)には第2調査データのモニタB(B00001)の回答及び第2調査データのモニタB(B00002)の回答と同一の回答内容が仮想回答として割り当てられ、前者はモニタ2人分の回答、後者はモニタ1人分の回答として扱われる。また、第1調査データのモニタA(A00002)には第2調査データのモニタB(B00002)の回答及び第2調査データのモニタB(B00003)の回答と同一の回答内容が仮想回答として割り当てられ、前者はモニタ1人分の回答、後者はモニタ2人分の回答として扱われる。すなわち、仮想回答が各モニタA00001、A00001に対して割り当てられた結果、データ同士が融合し、最終的に、図10の下段に示す融合データが生成される。
その後、融合結果(融合データ)を保存する処理(S107)が実行され、融合データがデータ記憶部13に記憶されるようになる。そして、この時点でデータ融合処理が完了する。
なお、融合処理は、共通項目のうち、男女別等の特定項目の値別に融合することとしてもよい。その場合は、上記工程S104〜S106の処理はその値別に実行する。また、その場合は、融合結果を一つのファイルにして保存する。
ここで、本実施形態においては、第1調査及び第2調査は、モニタのローテーションを行う調査であり、第1調査データD1及び第2調査データD2は、時間の経過と共に動的に変化するデータとなる。
具体的には、同一モニタを長い間調査していると、調査慣れや学習効果による影響が出てくることがあり、また、標本となるモニタが母集団の変化に対応しなくなることがあるので、このような状況を避けるため、本実施形態では、一定期間経過後に、第1調査及び第2調査のモニタA,Bの一部又は全部を遂次組み替えること(ローテーション)を行っている。また、上記のような定期的なローテーション以外にも、脱落したモニタを補充するため、新たなモニタを追加することにより、不規則にモニタを入れ替えるような場合もある。
なお、本実施形態における動的に変化するデータとは、アンケート調査等の調査データに限らず、各種機器から自動的に取得できる稼働ログデータや、Webログ、購買履歴、アプリ利用履歴等、又は、常に変化し続ける大量の顧客データ(いわゆるビッグデータ)等も、全て含み、本実施形態において適用することができる。
本実施形態においては、第1調査と第2調査は、変化のタイミングが異なるものである。具体的には、第1調査は、時点tから1経過するごとに所定割合でモニタAの一部を逐次入れ替えるものである。また、第2調査は、時点tからn経過するごとにモニタBの全部を総入れ替えするものである。
なお、本実施形態においては、モニタBの全部を総入れ替えするものとして説明するが、これに限定されることはなく、第2調査のモニタBは、第1調査のモニタAと変化のタイミングが異なるものであればよく、例えば、時点tからn経過するごとにモニタBの半分や1/3を部分的に入れ替えるものであってもよい。
以下、第1調査データが動的に変化するデータである場合の具体的な事例について、図11乃至図13を例に挙げて説明する。
図11及び図13は、第1調査データが変化した状態を概念的に示す図である。図12は、融合実施後の時点t+1におけるデータ融合処理の流れ示す図である。
図11に示すように、融合実施時点(時点t)では、第1調査のモニタAと第2調査のモニタBとは全て融合できているが、融合実施後(時点t+1)には、融合していたモニタAの一部が第1調査データの中から存在しなくなり、融合実施時点(時点t)には存在しなかった新たなモニタA’が、第1調査データの中に加わることになる。そのため、新たなモニタA’について、第2調査データの中から紐付ける相手を特定する必要がある。
上記のような場合、融合実施後の時点t+1における、上述したデータ処理サービスのうち、データ融合処理を実行する工程S003について、図12を参照しながら説明する。
融合実施後の時点t+1において、サーバ1の処理実行部14により実行されるデータ融合処理は、図12の流れにしたがって進行する。
融合実施後のt+1時点におけるデータ融合処理では、先ず、第1調査データのうち新規の第1調査データを特定する(S201)。
具体的には、処理実行部14が、データ記憶部13に記憶された第1調査データの内容を解析し、その第1調査データの中から新規の第1調査データ(モニタA’の回答内容に相当するデータ)を特定する。
次に、その新規の第1調査データと第2調査データの双方の共通項目に、上述の時点tにおけるデータ融合処理のS103にて保存した関数を適用して、距離計算用スコア群を算出する(S202)。
具体的には、処理実行部14が、上記関数と共通項目を用いることにより、新規の第1調査データと第2調査データの各モニタA’、Bの合成変数を求める。このとき、新規の第1調査データについてのみ、上記処理を行うこと以外は、上述した時点tにおけるデータ融合処理のS104と同様の処理を実行する。
このように、第1調査データに新規のモニタA’が加わった場合も、距離計算用スコア群を算出する際に使用する関数を再計算せず、既に使用し有効であると実証済みの関数を再利用することにより、処理が簡素化され、大量の新規調査データであっても、迅速に処理することができる。
このとき、例えば、特定期間Aのテレビの視聴傾向のように、共通項目が時点tに依存する等の理由により、新規の第1調査データが融合データ(又は第2調査データ)と全く同一の共通項目を保持していない場合があり得る。すなわち、図11に示すように、融合実施時点(時点t)においては、共通項目r(t)は、第1調査データ(モニタA)及び第2調査データ(モニタB)の双方に含まれているが、融合実施後(時点t+1)においては、新たなモニタA’の第1調査データの共通項目は、時点の経過に伴って共通項目r(t+1)と変化し、融合データ(又は第2調査データ)と全く同一の共通項目を保持していないことになる。
そのため、本実施形態では、時点tより後ろ(t+1以降)の時点において、例えば、特定期間Bのテレビ視聴傾向の平均値等の統計量を算出し、時点tにおける共通項目r(t)に代替する。これにより、厳密には、時点tの特定期間Aのテレビの視聴傾向とは異なるが、近似する時期の視聴傾向ということで代替でき、同一の共通項目を保持している場合と差異なく、新規の調査データを融合することができる。
次に、上記工程S202により算出した距離計算用スコア群を比較して、新規の第1調査データの各モニタA’と第2調査データの各モニタBとの類似度合いを示す距離について距離計算を実行する(S203)。
具体的には、処理実行部14が、新規の第1調査データの各モニタA’について各項目の距離計算用スコア群を合算し、その結果を以てモニタ間の類似度合いとする。
次に、上記工程S203によって距離計算を実行した後、新規の第1調査データの各モニタA’について、総距離が近いモニタを第2調査データのモニタBの中から特定し、同一のモニタとみなして紐付けて融合する(S204)。
このとき、本実施形態においては、新規の第1調査データのモニタA’と第2調査データのモニタBとの割り当てパターンを設定する際に、処理の簡素化を目的として、「制約なし統計的マッチング」を採用してデータ融合処理を実施する。
具体的には、処理実行部14は、新規の第1調査データのモニタA’について、上記工程203にて算出した類似度合いが最も高い第2調査データのモニタB、すなわち、最も類似した第2調査データのモニタBを一つ選択して紐付け、そのモニタBを最も類似するモニタと特定し、融合する。これにより、新規の第1調査データのモニタA’にも第2調査データ内のいずれかのモニタBの回答と同一の回答内容が仮想回答として割り当てられ、最終的に、新たな融合データが生成される。
なお、本実施形態では、時点t+1において、第1調査データのモニタAがモニタA’に変化したときに、融合相手であるモニタA,Bがその時点で未だ存在するモニタA,Bについてはそのままの融合相手を引継ぎ、新規の第1調査データのモニタA’についてのみ時点t+1におけるデータ融合処理をあらためて実行する。これにより、既に融合処理済みの融合データを生かすと共に、新規の第1調査データのモニタA’についても、正確且つ効率的に融合することができる。
その後、融合結果(融合データ)を保存する処理(S205)が実行され、融合データがデータ記憶部13に記憶されるようになる。これにより、時点t+1におけるデータ融合処理が完了する。
また、他の事例として、以下、第2調査データが動的に変化するデータである場合の具体的な事例について、図14を例に挙げて説明する。
図14は、第2調査データが変化した状態を概念的に示す図である。
上述のように、第1調査と第2調査は、変化のタイミングが異なるものであり、第2調査は、時点tからn経過するごとにモニタBの全部を総入れ替えするものである。
上述の図11に示すように、融合実施時点(時点t)では、第1調査のモニタAと第2調査のモニタBとは全て融合できているが、図14に示すように、融合実施後(時点t+n)には、融合していたモニタBの全部が第2調査データの中から存在しなくなり、第2調査データは融合実施時点(時点t)には存在しなかった新たなモニタB’に総入れ替えとなる。そのため、新たなモニタB’について、第1調査データの中から紐付ける相手を特定する必要がある。
この場合は、原則として、図8に示す融合実施の時点tにおいてサーバ1の処理実行部14により実行されるデータ融合処理と同様の処理をあらためて実行する。なお、図12に示す融合実施後の時点t+1においてサーバ1の処理実行部14により実行されるデータ融合処理と同様の処理を、第2調査データのモニタB’について実行することとしてもよい。
また、さらに、融合実施後(時点t+n+1)には、第2調査データのモニタB’と融合していたモニタAの一部が第1調査データの中から存在しなくなり、融合実施時点(時点t+n)には存在しなかった新たなモニタA’が、第1調査データの中に加わることになる。そのため、新たなモニタA’について、第2調査データの中から紐付ける相手を特定する必要があるが、この場合も図12に示す融合実施後の時点t+1において、サーバ1の処理実行部14により実行されるデータ融合処理と同様の処理を実行する。
<<その他の実施形態>>
上記の実施形態には、主として本発明の調査データ処理装置及び調査データ処理方法について説明した。しかし、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることはもちろんである。
上記の実施形態では、第1調査及び第2調査共に一の調査会社が実施している例について説明したが、これに限定されるものではない。例えば、第1調査を調査会社が実施し、第2調査を他の会社が実施する等、本発明は、異なる主体によって実施された調査結果を示す調査データを融合する場合であっても適用可能である。こうすることにより、顧客企業にとっては、独自に実施したアンケート調査等(例えば、自社が販売する商品や提供するサービスについて世間の反応を把握する目的から実施するアンケート調査等)の結果と、調査会社が実施した調査(例えば、視聴率調査等)とを融合することができ、各顧客企業のニーズに則した効果的なメディアプランニングを立案することが可能となる。
また、上記の実施形態では、独自項目が存在するのは第2調査だけとし、第1調査は共通項目のみで独自項目を含んでいないが、これに限定されるものではない。すなわち、本発明は、第1調査においても、第2調査には含まれず、且つ、第1調査のみにしか含まれない独自の項目(第1調査独自項目)が存在する場合であっても適用可能である。
また、上記の実施形態では、2つの調査データを融合することにより、融合データを生成することとしたが、これに限定されるものではない。すなわち、3つ以上の複数の調査データであっても、共通項目が存在すれば、それらを融合して融合データを生成することができるので、そのようなケースについても本発明を適用することが可能である。
また、上記の実施形態では、シングルソースデータと非シングルソースデータとを融合して擬似シングルソースデータとしての融合データを生成するケースを例に挙げて説明したが、これに限定されるものではない。すなわち、本発明は、非シングルソースデータ同士を融合して融合データを生成するケース、及び、シングルソースデータ同士を融合して融合データを生成するケースのいずれにも適用可能である。
また、上記の実施形態では、第1調査のモニタAと第2調査のモニタBとの間の類似度合いを評価する上で、両調査に共通して含まれる共通項目全ての回答内容を評価対象とすることとしたが、これに限定されるものではない。すなわち、複数ある共通項目のうち、一部のみを評価対象とすることとしてもよい。
1 サーバ(調査データ処理装置)
1A CPU
1B ROM
1c RAM
1d 通信用インタフェース
1e ハードディスクドライブ
1f 入力装置
1g 出力装置
11 データ受信部
12 データ集約部
13 データ記憶部
14 処理実行部
15 データ配信部
21 測定機
31 回答用端末
D1,D2 調査データ
N1,N2 情報通信網
また、上記の調査データ処理装置について好適な構成を述べると、前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前において、前記処理実行部は、前記割り当て処理において、前記第1調査に関する集計結果が前記第1調査データと前記融合データとの間で揃い、且つ、前記第2調査に関する集計結果が前記第2調査データと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定する、とよい。

Claims (7)

  1. 互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データを処理する調査データ処理装置であって、
    前記第1調査及び前記第2調査の双方に含まれる共通項目に対する回答内容を、前記第1調査に回答した第1調査モニタの人数分集めた第1調査データを取得する第1調査データ取得部と、
    前記共通項目、及び、前記第2調査のみに含まれる第2調査独自項目に対する各々の回答内容を、前記第2調査に回答した第2調査モニタの人数分集めた第2調査データを取得する第2調査データ取得部と、
    前記第1調査データ取得部が取得した前記第1調査データと、前記第2調査データ取得部が取得した前記第2調査データと、を融合して、前記第1調査データ及び前記第2調査データの各々の回答内容を示す融合データを生成するデータ融合処理を実行する処理実行部と、を備え、
    前記データ融合処理は、
    所定の演算式を用いて前記共通項目に対する回答内容に関する値を算出し、前記第1調査モニタと前記第2調査モニタとの間で前記値同士を比較した結果を用いて、前記共通項目に対する回答内容の類似度合いを算出する算出処理と、
    算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1調査モニタに対して、前記第2調査モニタの前記第2調査独自項目に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含み、
    前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化したときに、前記割り当て処理によって既に割り当て済みであって割り当て相手がその時点で未だ存在する前記第1調査モニタ及び前記第2調査モニタについてはそのまま割り当て相手を引継ぎ、新規の第1調査モニタ又は新規の第2調査モニタについてのみ前記算出処理及び前記割り当て処理を実行することを特徴とする調査データ処理装置。
  2. 前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前後において、
    前記算出処理で用いられる前記所定の演算式は変化しないことを特徴とする請求項1に記載の調査データ処理装置。
  3. 前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前後において、前記共通項目に対する調査時期が異なる場合、
    前記算出処理及び前記割り当て処理において、前記処理実行部は、前記共通項目と近似する項目若しくは時期に対する回答内容又は該回答内容の統計値を前記共通項目に対する回答内容として代替することを特徴とする請求項1又は2に記載の調査データ処理装置。
  4. 前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化する前において、
    前記処理実行部は、前記割り当て処理において、前記第1調査に関する集計結果が前記第1調査データと前記融合データとの間で揃い、且つ、前記第2調査独自項目に関する集計結果が前記第2調査データと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定することを特徴とする請求項1乃至3のいずれか1項に記載の調査データ処理装置。
  5. 前記第1調査データは、前記第1調査のみに含まれる第1調査独自項目に対する回答内容を含むことを特徴とする請求項1乃至4のいずれか1項に記載の調査データ処理装置。
  6. 前記第1調査は、メディア接触に関する調査であり、
    前記第2調査は、生活者属性、商品関与及びメディア接触について多面的に捉えるアンケート調査であることを特徴とする請求項1乃至5のいずれか1項に記載の調査データ処理装置。
  7. 互いに異なるモニタに対して実施した第1調査及び第2調査の各々の調査結果を示す調査データをコンピュータによって処理する調査データ処理方法であって、
    前記コンピュータが、
    前記第1調査及び前記第2調査の双方に含まれる共通項目に対する回答内容を、前記第1調査に回答した第1調査モニタの人数分集めた第1調査データを取得する工程と、
    前記共通項目、及び、前記第2調査のみに含まれる第2調査独自項目に対する各々の回答内容を、前記第2調査に回答した第2調査モニタの人数分集めた第2調査データを取得する工程と、
    取得した前記第1調査データと前記第2調査データとを融合して、前記第1調査データ及び前記第2調査データの各々の回答内容を示す融合データを生成するデータ融合処理を実行する工程と、を実行し、
    前記データ融合処理は、
    所定の演算式を用いて前記共通項目に対する回答内容に関する値を算出し、前記第1調査モニタと前記第2調査モニタとの間で前記値同士を比較した結果を用いて、前記共通項目に対する回答内容の類似度合いを算出する算出処理と、
    算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1調査モニタに対して、前記第2調査モニタの前記第2調査独自項目に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含み、
    前記第1調査モニタ又は前記第2調査モニタの双方又は一方が変化したときに、前記割り当て処理によって既に割り当て済みであって割り当て相手がその時点で未だ存在する前記第1調査モニタ及び前記第2調査モニタについてはそのまま割り当て相手を引継ぎ、新規の第1調査モニタ又は新規の第2調査モニタについてのみ前記算出処理及び前記割り当て処理を実行することを特徴とする調査データ処理方法。
JP2017051688A 2017-03-16 2017-03-16 調査データ処理装置及び調査データ処理方法 Active JP6201077B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017051688A JP6201077B1 (ja) 2017-03-16 2017-03-16 調査データ処理装置及び調査データ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017051688A JP6201077B1 (ja) 2017-03-16 2017-03-16 調査データ処理装置及び調査データ処理方法

Publications (2)

Publication Number Publication Date
JP6201077B1 JP6201077B1 (ja) 2017-09-20
JP2018156299A true JP2018156299A (ja) 2018-10-04

Family

ID=59895648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017051688A Active JP6201077B1 (ja) 2017-03-16 2017-03-16 調査データ処理装置及び調査データ処理方法

Country Status (1)

Country Link
JP (1) JP6201077B1 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200050115A (ko) * 2018-11-01 2020-05-11 (주)굿러닝가치향상센터 다중 원천 데이터 분석 방법 및 이를 위한 장치
WO2020095898A1 (ja) * 2018-11-05 2020-05-14 株式会社ビデオリサーチ テレビ番組評価システム
JP2020095337A (ja) * 2018-12-10 2020-06-18 株式会社ビデオリサーチ 調査結果処理装置、及び調査結果処理方法
JP2020166786A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組評価システム
JP2020167639A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組評価システム
JP2020166789A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP2020166788A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP2020166790A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ マーケティング支援システム
JP2020167641A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP2020166787A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP2020167642A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP2021064945A (ja) * 2020-12-10 2021-04-22 株式会社ビデオリサーチ テレビ番組評価システム
JP2022160682A (ja) * 2019-03-29 2022-10-19 株式会社ビデオリサーチ マーケティング支援システム
JP7227412B1 (ja) 2021-11-09 2023-02-21 株式会社博報堂Dyホールディングス 情報処理システム、コンピュータプログラム、及び情報処理方法
WO2024096054A1 (ja) * 2022-11-04 2024-05-10 株式会社マクロミル 情報処理方法、プログラム、記憶媒体および情報処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005085207A (ja) * 2003-09-11 2005-03-31 Dentsu Inc データベース融合装置および広告メディアプランニング支援装置
JP2007287131A (ja) * 2006-03-20 2007-11-01 Rakuten Inc ソーシャルネットワーキングサービスシステム
US20110239243A1 (en) * 2010-03-26 2011-09-29 Google Inc. Exposure based customization of surveys
JP2015032199A (ja) * 2013-08-05 2015-02-16 株式会社ビデオリサーチ アンケートデータ処理装置及びアンケートデータ処理方法
JP2015219756A (ja) * 2014-05-19 2015-12-07 カシオ計算機株式会社 画像比較方法、装置並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005085207A (ja) * 2003-09-11 2005-03-31 Dentsu Inc データベース融合装置および広告メディアプランニング支援装置
JP2007287131A (ja) * 2006-03-20 2007-11-01 Rakuten Inc ソーシャルネットワーキングサービスシステム
US20110239243A1 (en) * 2010-03-26 2011-09-29 Google Inc. Exposure based customization of surveys
JP2015032199A (ja) * 2013-08-05 2015-02-16 株式会社ビデオリサーチ アンケートデータ処理装置及びアンケートデータ処理方法
JP2015219756A (ja) * 2014-05-19 2015-12-07 カシオ計算機株式会社 画像比較方法、装置並びにプログラム

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225740B1 (ko) * 2018-11-01 2021-03-10 (주)굿러닝가치향상센터 다중 원천 데이터 분석 방법 및 이를 위한 장치
KR20200050115A (ko) * 2018-11-01 2020-05-11 (주)굿러닝가치향상센터 다중 원천 데이터 분석 방법 및 이를 위한 장치
WO2020095898A1 (ja) * 2018-11-05 2020-05-14 株式会社ビデオリサーチ テレビ番組評価システム
JP2020077924A (ja) * 2018-11-05 2020-05-21 株式会社ビデオリサーチ テレビ番組評価システム
JP2020095337A (ja) * 2018-12-10 2020-06-18 株式会社ビデオリサーチ 調査結果処理装置、及び調査結果処理方法
JP7116401B2 (ja) 2019-03-29 2022-08-10 株式会社ビデオリサーチ テレビ番組評価システム
JP7134437B2 (ja) 2019-03-29 2022-09-12 株式会社ビデオリサーチ 広告配信システム
JP2020166788A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP2020166790A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ マーケティング支援システム
JP2020167641A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP2020166787A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP2020167642A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP2020167639A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組評価システム
JP7232466B2 (ja) 2019-03-29 2023-03-03 株式会社ビデオリサーチ テレビ番組評価システム
JP2020166786A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組評価システム
JP7129672B2 (ja) 2019-03-29 2022-09-02 株式会社ビデオリサーチ マーケティング支援システム
JP2020166789A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ 広告配信システム
JP7134436B2 (ja) 2019-03-29 2022-09-12 株式会社ビデオリサーチ 広告配信システム
JP2022160682A (ja) * 2019-03-29 2022-10-19 株式会社ビデオリサーチ マーケティング支援システム
JP7162261B2 (ja) 2019-03-29 2022-10-28 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP7162260B2 (ja) 2019-03-29 2022-10-28 株式会社ビデオリサーチ テレビ番組用広告の提供方法
JP7186990B2 (ja) 2019-03-29 2022-12-12 株式会社ビデオリサーチ マーケティング支援システム
JP7232467B2 (ja) 2019-03-29 2023-03-03 株式会社ビデオリサーチ 広告配信システム
JP2021064945A (ja) * 2020-12-10 2021-04-22 株式会社ビデオリサーチ テレビ番組評価システム
JP7227412B1 (ja) 2021-11-09 2023-02-21 株式会社博報堂Dyホールディングス 情報処理システム、コンピュータプログラム、及び情報処理方法
JP2023070618A (ja) * 2021-11-09 2023-05-19 株式会社博報堂Dyホールディングス 情報処理システム、コンピュータプログラム、及び情報処理方法
WO2023085279A1 (ja) * 2021-11-09 2023-05-19 株式会社博報堂Dyホールディングス 情報処理システム及び情報処理方法
WO2024096054A1 (ja) * 2022-11-04 2024-05-10 株式会社マクロミル 情報処理方法、プログラム、記憶媒体および情報処理装置

Also Published As

Publication number Publication date
JP6201077B1 (ja) 2017-09-20

Similar Documents

Publication Publication Date Title
JP6201077B1 (ja) 調査データ処理装置及び調査データ処理方法
US10555050B2 (en) Cross-screen measurement accuracy in advertising performance
JP2022003523A (ja) インプレッションデータの帰属先の誤判定及び/又はデータベース保有者による未カバーを補償する方法及び装置
KR102021062B1 (ko) 사용법에 기반하여 컴퓨터를 간접적으로 분류하는 시스템 및 방법
US9519910B2 (en) System and methods for calibrating user and consumer data
CN103649981B (zh) 用于输送目标内容的方法和装置
US20100161492A1 (en) Analyzing return on investment of advertising campaigns using cross-correlation of multiple data sources
US20130006706A1 (en) Using consumer purchase behavior for television targeting
US20100145791A1 (en) Analyzing return on investment of advertising campaigns using cross-correlation of multiple data sources
CN115860833A (zh) 基于消费者在线行为的电视广告时段定位
US20160026640A1 (en) Systems and methods of testing-based online ranking
JP2020166785A (ja) テレビ番組評価システム
US20160342699A1 (en) Systems, methods, and devices for profiling audience populations of websites
JP2019219774A (ja) コンバージョンレポート表示装置、その表示プログラムおよびその表示方法
JP6495532B1 (ja) 調査結果処理装置、及び調査結果処理方法
JP6552761B1 (ja) データ処理装置、及びデータ処理方法
JP6556971B1 (ja) データ処理装置、及びデータ処理方法
JP5638673B1 (ja) アンケートデータ処理装置及びアンケートデータ処理方法
US20190065607A1 (en) Automated application analytics
JP7320149B1 (ja) 出稿支援装置、及び出稿支援方法
JP7185792B1 (ja) 評価装置、及び評価方法
JP7247415B1 (ja) 情報処理装置、及び情報処理方法
JP6637628B1 (ja) データ処理装置及びデータ処理方法
Chakraborty et al. Selecting important features related to efficacy of mobile advertisements
JP6813854B2 (ja) テレビ番組評価システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170828

R150 Certificate of patent or registration of utility model

Ref document number: 6201077

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250