JP5638673B1 - アンケートデータ処理装置及びアンケートデータ処理方法 - Google Patents

アンケートデータ処理装置及びアンケートデータ処理方法 Download PDF

Info

Publication number
JP5638673B1
JP5638673B1 JP2013162409A JP2013162409A JP5638673B1 JP 5638673 B1 JP5638673 B1 JP 5638673B1 JP 2013162409 A JP2013162409 A JP 2013162409A JP 2013162409 A JP2013162409 A JP 2013162409A JP 5638673 B1 JP5638673 B1 JP 5638673B1
Authority
JP
Japan
Prior art keywords
data
questionnaire
fusion
question
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013162409A
Other languages
English (en)
Other versions
JP2015032199A (ja
Inventor
靖宏 岩城
靖宏 岩城
玄 田村
玄 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Video Research Co Ltd
Original Assignee
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Video Research Co Ltd filed Critical Video Research Co Ltd
Priority to JP2013162409A priority Critical patent/JP5638673B1/ja
Application granted granted Critical
Publication of JP5638673B1 publication Critical patent/JP5638673B1/ja
Publication of JP2015032199A publication Critical patent/JP2015032199A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】複数のアンケートの回答結果をより有効に活用するためのデータ処理サービスを提供する。【解決手段】コンピュータ1が、互いに異なる調査者が互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々のデータを、両アンケートに含まれる共通質問への回答内容の類似度合いをキーとして融合する。このとき、コンピュータ1は、類似度合いに基づいて設定された割り当てパターンにて、第1アンケートのモニタに対し、第2アンケートのみに含まれる質問に対するモニタの回答内容と同一の回答内容を割り当てる。割り当てパターンは、第1アンケートのみに含まれる質問に関する集計結果が融合前後で変化せず、かつ、第2アンケートのみに含まれる質問に関する集計結果が融合前後で変化しないように統計的解法に従って設定される。そして、コンピュータ1は、データ配信要求を発する端末に向けて融合データを配信する。【選択図】図5

Description

本発明は、アンケートデータ処理装置及びアンケートデータ処理方法に係り、特に、互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータを処理する装置及び方法に関する。
メディアプランニング等を目的としてアンケートを実施し、その回答データを処理することは各業界でよく行われており、各社は、例えば自社の商品やサービスについて独自にアンケート調査を行い、その調査結果の中から有用な情報を抽出する。さらに、アンケート調査の中には、同一のモニタを対象にして購買・広告接触・ライフスタイル等の多面的情報を採取することを目的としてなされる調査があり、このような調査の結果は、所謂「シングルソースデータ」と呼ばれ、広告メディアと商品の購買の有無との相関等を個人ベースで分析する際に有用な情報源となる。
一方、従来から複数のデータベースを融合する技術が知られている。かかる技術は、データフュージョンと称され、シングルソースデータを取得するには非常にコストがかかるという不都合を解消するための手段として用いられる。
図13に示すデータフュージョンの概念図を参照しながら説明すると、互いに独立して取得した2つの調査データA及びBを、それぞれのアンケートに回答したモニタの類似度に基づいて融合(フュージョン)する。つまり、類似度が高いモニタ同士を同じモニタとみなし、これによって調査データA中、あるモニタの回答データに対して、調査データB中、あるモニタと同視されるモニタの回答データ(具体的には、質問bの回答)を付与することが可能となる。この結果、調査データAの内容に、調査データAには未収録であった質問bの回答を追加した融合データが生成されることになる。
以上のように、データフュージョンによって比較的少ない質問数に設定されたアンケートの回答結果をシングルソースデータ化することが可能となり、このようにして得られた擬似シングルソースデータを活用することで、メディアプランニング等において有用な情報をより低コストで入手可能となる。
さらに、データフュージョンの手法としては、「制約なし統計的マッチング」及び「制約付き統計的マッチング」が挙げられる。「制約なし統計的マッチング」は、モニタの類似度に基づいて単にデータ同士をフュージョンするだけであるので、基データが持つ情報が融合データに引き継がれるとは限らないという問題があった。一方で、「制約付き統計的マッチング」は、基データが持つ情報が融合データに引き継がれ、より具体的には、基データの平均と分散を保持しようとする制約の下でデータ同士をフュージョンするので、メディアプランニング等において好適な融合データを入手することが可能となる。
なお、「制約付き統計的マッチング」では、通常、データフュージョン用の計算に要する時間が長時間になるため、近年では、計算時間を短くし「制約付き」とほぼ変わらぬ精度を検証済みの「距離優先制約付き統計的マッチング」という技術が開発されている(特許文献1参照)。
特許第4338486号公報
以上までに説明してきたように、比較的少ない質問数に設定されたアンケートの回答結果からシングルソースデータを得る手法としてデータフュージョンは有効であり、これに係る一連の処理の実行がASP(Application Service Provider)等によるサービスとして提供されれば、アンケート調査者にとって有益となる。つまり、上記のサービスの提供によって、複数のアンケートの回答結果を融合してより有効に活用することが期待される。
そこで、本発明は、上記の問題に鑑みてなされたものであり、その目的は、複数のアンケートの回答結果を融合してより有効に活用するためのデータ処理サービスを提供することが可能なアンケートデータ処理装置及びアンケートデータ処理方法を実現することである。
前記課題は、本発明のアンケートデータ処理装置によれば、互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータを処理するアンケートデータ処理装置であって、前記第1アンケート及び前記第2アンケートの双方に含まれる共通質問、及び、前記第1アンケートのみに含まれる第1質問の各々の回答内容を、前記第1アンケートに回答した前記モニタの人数分集めた第1アンケートデータを取得する第1アンケートデータ取得部と、前記共通質問、及び、前記第2アンケートのみに含まれる第2質問の各々の回答内容を、前記第2アンケートに回答した前記モニタの人数分集めた第2アンケートデータを取得する第2アンケートデータ取得部と、前記第1アンケートデータ取得部が取得した前記第1アンケートデータと、前記第2アンケートデータ取得部が取得した前記第2アンケートデータと、を融合して、前記第1質問及び前記第2質問の各々の回答内容を示す融合データを生成するデータ融合処理を実行する処理実行部と、該処理実行部により生成された前記融合データを、該融合データの配信要求を発する端末に向けて配信するデータ配信部と、を備え、前記データ融合処理は、前記第1アンケートに回答した前記モニタと前記第2アンケートに回答した前記モニタとの間で、前記共通質問の回答内容の類似度合いを算出する算出処理と、算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1アンケートに回答した前記モニタに対して、前記第2アンケートに回答した前記モニタの前記第2質問に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含んでおり、該割り当て処理において、前記処理実行部は、前記第1質問に関する集計結果が前記第1アンケートデータと前記融合データとの間で揃い、かつ、前記第2質問に関する集計結果が前記第2アンケートデータと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定することにより解決される。
上記の装置は、互いに異なるモニタに対して実施した2つのアンケートの回答結果を示す2つのアンケートデータを処理するサービスを提供するものである。具体的に説明すると、上記の装置は、共通質問に対する回答内容からモニタ間の類似度合いを算出し、類似度合いが高いモニタ同士を同じモニタとみなすことでアンケートデータ同士を融合(フュージョン)する。また、上記の装置は、データフュージョンの際に「制約付き統計的マッチング」を採用し、融合前のアンケートデータにおける集計結果が融合後のアンケートデータ(すなわち、融合データ)における集計結果と揃うようにデータフュージョンを実施する。そして、融合データについては、当該データの配信要求を発する端末に向けて送信される。
以上のように、上記のアンケートデータ処理装置は、複数のアンケートの回答結果をより有効に活用するためのデータ処理サービスとして、複数のアンケートの回答結果をデータ融合処理によって集約し、その結果を融合データという形で提供する。そして、融合データを受信した者は、当該融合データが示す情報を分析することで、融合前の情報からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。
なお、上記のアンケートデータ処理装置において、前記処理実行部は、前記割り当て処理において前記割り当てパターンを輸送問題の解法に従って設定するとよい。
また、上記のアンケートデータ処理装置において、前記第1アンケートデータ及び前記第2アンケートデータのうち、いずれか一方のアンケートデータは、シングルソースデータであり、もう一方のアンケートデータは、前記シングルソースデータよりも質問数が少ないアンケートの回答内容を示す非シングルソースデータであり、前記データ配信部は、前記非シングルソースデータの提供者が管理する前記端末に向けて前記融合データを配信することとしてもよい。
上記の構成であれば、本発明の効果がより有効に奏されることになる。すなわち、シングルソースデータよりも質問数が少ないアンケートの回答内容を示す非シングルソースデータの場合、本発明のアンケートデータ処理装置によるデータ処理サービスを活用すれば、データフュージョンによって非シングルソースデータをシングルソースデータ化することが可能となる。これにより、上記の非シングルソースデータ単独では得られなかった情報を、シングルソースデータと融合したことで得られるようになる。
また、上記のアンケートデータ処理装置において、複数の前記非シングルソースデータが互いに異なる複数の調査者から提供される場合において、前記処理実行部は、各々の前記非シングルソースデータに対して個別に前記データ融合処理を実行し、前記データ配信部は、複数の前記非シングルソースデータのうち、一の前記非シングルソースデータと前記シングルソースデータとを融合することで生成される前記融合データを、一の前記非シングルソースデータを提供した前記調査者が管理する前記端末にのみ配信することとしてもよい。
上記の構成であれば、各調査者(換言すると、各非シングルソースデータを入手するためにアンケートを行った者)は、自らが提供したアンケートデータを基データとする融合データのみを受信するようになり、データ通信上のセキュリティが確保されるようになる。この結果、各アンケート調査者は、本発明のアンケートデータ処理装置によるデータ処理サービスを安心して利用することが可能となる。
また、上記のアンケートデータ処理装置において、互いに質問内容が異なる複数の前記第2アンケートが実施された場合において、前記第2アンケートデータ取得部が前記第2アンケートと同数の前記第2アンケートデータを取得し、前記処理実行部が、前記第1アンケートデータと複数の前記第2アンケートデータとを融合して、前記第1質問の回答内容及び前記第2アンケート別の前記第2質問の回答内容を示す前記融合データを生成する前記データ融合処理を実行し、該データ融合処理では、前記処理実行部によって、前記算出処理及び前記割り当て処理がそれぞれ前記第2アンケートデータの数と同じ数だけ繰り返されることとしてもよい。
上記の構成であれば、3つ以上のアンケートデータの融合が可能となるので、その融合データが示す情報量がより一層増え、当該融合データの利用価値が益々高まることになる。この結果、上記融合データの配信をサービスとして提供する本発明のアンケートデータ処理装置が更に有用なものとなる。
さらに、前述の課題は、本発明のアンケートデータ処理方法によれば、互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータをコンピュータによって処理するアンケートデータ処理方法であって、前記コンピュータが、前記第1アンケート及び前記第2アンケートの双方に含まれる共通質問、及び、前記第1アンケートのみに含まれる第1質問の各々の回答内容を、前記第1アンケートに回答した前記モニタの人数分集めた第1アンケートデータを取得する工程と、前記共通質問、及び、前記第2アンケートのみに含まれる第2質問の各々の回答内容を、前記
第2アンケートに回答した前記モニタの人数分集めた第2アンケートデータを取得する工程と、取得した前記第1アンケートデータと前記第2アンケートデータとを融合して、前記第1質問及び前記第2質問の各々の回答内容を示す融合データを生成するデータ融合処理を実行する工程と、生成された前記融合データを、該融合データの配信要求を発する端末に向けて配信する工程と、を行い、前記データ融合処理は、前記第1アンケートに回答した前記モニタと前記第2アンケートに回答した前記モニタとの間で、前記共通質問の回答内容の類似度合いを算出する算出処理と、算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1アンケートに回答した前記モニタに対して、前記第2アンケートに回答した前記モニタの前記第2質問に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含んでおり、該割り当て処理において、前記コンピュータは、前記第1質問に関する集計結果が前記第1アンケートデータと前記融合データとの間で揃い、かつ、前記第2質問に関する集計結果が前記第2アンケートデータと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定することにより解決される。
上記の方法によれば、上述した本発明のアンケートデータ処理装置と同様の効果を得ることが可能である。すなわち、本発明のアンケートデータ処理方法により、複数のアンケートの回答結果をより有効に活用するためのデータ処理サービスとして、複数のアンケートの回答結果をデータ融合処理にて集約し、その結果を融合データという形で提供する。これにより、融合データを受信した者は、当該融合データが示す情報を分析することで、融合前の情報からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。
本発明によれば、複数のアンケートの回答結果をより有効に活用するためのデータ処理サービスとして、複数のアンケートの回答結果をデータ融合処理にて集約し、その結果を融合データという形で提供する。これにより、融合データを受信した者は、当該融合データが示す情報を分析することで、融合前の情報からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。具体的に説明すると、例えば、ある調査者が調査した項目(例えば、ある商品の購入の有無)と、他の調査者が調査した項目(例えば、あるテレビ番組の視聴の有無)との間の相関関係を把握することが可能となり、当該相関関係に基づいて最大の広告効果が得られる広告枠(放送時間やテレビ番組等)を選定することが可能となる。
本発明に係るデータ処理サービスに関する説明図である。 本発明のアンケートデータ処理装置を含む通信システムを示した図である。 図3中の(A)は、第1アンケートに対する回答結果を示し、(B)は、第2アンケートに対する回答結果を示している。 アンケートデータ処理装置のハードウェア構成を示した図である。 アンケートデータ処理装置の構成を機能面から示した図である。 データ融合処理の内容を概念的に示した図である。 データ処理サービスに係る一連の処理についての大まかな流れを示した図である。 データ融合処理の流れを示す図である。 モニタ間の類似度合いの算出手順についての説明図である。 割り当て処理の内容に関する説明図である。 変形例に係るデータ融合処理の内容を概念的に示した図である(その1)。 変形例に係るデータ融合処理の内容を概念的に示した図である(その2)。 データフュージョンの概念を示した図である。
以下、本発明の一実施形態(以下、本実施形態)について図面を参照しながら説明する。
なお、以下の説明において、「シングルソースデータ」とは、同一のモニタ(回答者)が回答した比較的多数(例えば数百問)の質問への回答内容を示すデータであり、同データが示す情報には、モニタの属性に関する質問への回答内容、具体的にはデモグラフィック(人口統計学的属性)に関する情報、及び、サイコグラフィック(心理学的属性)に関する情報が含まれている。
一方、「非シングルソースデータ」とは、シングルソースデータよりも質問数が少ないアンケートの回答内容を示すデータであり、後述するアンケート調査会社VR以外の企業各社が独自にアンケートを実施することで得られるデータ、所謂「マルチソースデータ」である。
<<アンケートデータ処理サービスについて>>
先ず、本発明により実現されるアンケートデータ処理サービスについて図1を参照しながら説明する。図1は、アンケートデータ処理サービスに関する説明図である。
アンケートデータ処理サービスは、本発明のアンケートデータ処理装置を管理するアンケート調査会社VRによって提供されるものであり、サービスの依頼主Pが提供するアンケートデータとアンケート調査会社VRが自ら保有するアンケートデータとを融合するための一連のデータ処理を実行するサービスである。
具体的に説明すると、アンケート調査会社VRは、一の調査者としてアンケートを実施し、当該アンケートにおいて複数のモニタMを対象にして複数の質問をする。そして、アンケート調査会社VRは、すべての質問に対する回答を各モニタMから回収すると、モニタ人数に相当する分の回答を集約し、それをデータとして保管する。ここで、アンケート調査会社VRは、各モニタに対して比較的多数の質問を出し、具体的には、モニタのデモグラフィック属性やサイコグラフィック属性を含む数百問程度の問題を出す。つまり、アンケート調査会社VRが実施するアンケートの回答結果を示すアンケートデータは、シングルソースデータに相当する。
なお、アンケート調査会社VRがアンケートを依頼するモニタの人数については自由に設定可能であるが、シングルソースデータとして十分な情報を収集することが可能な規模でモニタMを確保するのが望ましく、以下では、図1に示すように1万人のモニタを対象とするケースを例に挙げて説明する。
一方、依頼主Pは、図1に示すように複数存在し、各依頼主Pは、一の調査者としてアンケートを実施する。より具体的に説明すると、各依頼主Pは、メーカ等の企業であり、自社が販売する商品や提供するサービスについて世間の反応を把握する目的からアンケートを実施し、その回答結果をデータとして管理する。ここで、依頼主Pが実施するアンケートは、アンケート調査会社VRが実施するアンケートよりも小規模であり、質問数及びモニタ数のいずれもがアンケート調査会社VRが実施するアンケートに比べて格段に少なくなっている。つまり、各依頼主Pが実施するアンケートの回答結果を示すアンケートデータは、非シングルソースデータに相当する。
なお、アンケート回答を依頼されるモニタについては、依頼主Pが実施するアンケートとアンケート調査会社VRが実施するアンケートとの間で互いに異なっているが、この場合、モニタが全て異なっていることとしてもよく、若しくは、モニタの一部が重複していることとしてもよい。また、依頼主Pがアンケートを依頼するモニタの人数については、アンケート調査会社VRが実施するアンケートにおけるモニタ人数より少なくなっている限りにおいては自由に設定可能である。
そして、依頼主Pは、自社独自に実施したアンケートの回答結果を示すアンケートデータをアンケート調査会社VRに引き渡す。依頼主Pからアンケートデータを受け取ったアンケート調査会社VRは、同データと自己が取得したシングルソースデータとしてのアンケートデータとを融合するサービスを実行する。この結果、上記2つのアンケートデータを融合した融合データが生成され、当該融合データは、アンケートデータの提供元の依頼主Pに対して提供される。
以上のように、アンケート調査会社VRは、依頼主Pが独自に収集したアンケートの回答結果をより有効に活用するためのデータ処理サービスとして、データ融合処理を実行して上記依頼主Pとアンケート調査会社VRの各々によって実施されたアンケートの回答結果を集約し、その結果を融合データという形で提供することが可能である。そして、融合データを受信した上記依頼主Pは、当該融合データが示す情報を分析することで、融合前のアンケートデータ(すなわち、依頼主P自ら取得したアンケートの回答データ)からは得られなかった情報を入手し、さらにその情報に基づいて効果的なメディアプランニングを立案することが可能となる。
<<アンケートデータ処理サービスの提供システムについて>>
次に、上述したデータ処理サービスを提供するためのシステム構成について、図2を参照しながら説明する。図2は、本発明のアンケートデータ処理装置を含む通信システムを示した図である。
アンケート調査会社VRは、上記のデータ処理サービスを提供するために、コンピュータ、より厳密にはサーバコンピュータ(以下、サーバ1)を保有している。このサーバ1は、本発明のアンケートデータ処理装置に相当し、上述したデータ処理サービスをASPサービスとして提供する。
サーバ1の機能について概説すると、サーバ1は、図2に示すように、インターネット等の情報通信網を介してモニタ保有の回答用端末2と通信可能に接続されている。そして、サーバ1は、各回答用端末2と通信することで、アンケートの各質問に対する各モニタの回答データ(以下、個別回答データ)を受信する。ここで、回答用端末2とは、アンケートの回答を依頼した各モニタに対してアンケート調査会社VRが配布したタブレット型の通信端末である。つまり、モニタは、回答用端末2に搭載されたタッチパネルを見てアンケートの各質問を確認し、タッチパネル上でのタッチ操作を通じて回答する。
そして、回答用端末2がモニタによる回答操作を受け付けると、その回答内容を示す個別回答データを生成し、生成したデータをサーバ1に向けて送信する。なお、回答用端末2については、タブレット型の端末に限定されるものではなく、スマートフォンやノートPC等、他の通信端末であってもよい。
また、サーバ1は、規定の問題数に相当する数の個別回答データを各モニタ側端末2から受信すると、各データが示す情報を取りまとめて全モニタ分の回答結果として集約し、その集約したデータ、すなわち、アンケートデータをサーバ1内に記憶させておく。
一方、サーバ1は、図2に示すように、インターネット等の情報通信網を介して各依頼主Pが管理する端末(以下、依頼主端末3)と通信可能に接続されている。依頼主端末3は、端末に相当し、依頼主Pが独自に実施したアンケートの回答結果を示すアンケートデータを記憶している。そして、サーバ1は、依頼主端末3と通信することで、同端末3が記憶しているアンケートデータを受信する。
また、サーバ1は、同サーバ1内に記憶されたアンケートデータと、依頼主端末3から受信したアンケートデータと、を融合して融合データを生成する処理、すなわち、データ融合処理を実行する。ここで、融合データを生成するとは、基データである2つのアンケートデータとは別のデータを生成するケースに限られず、基データである2つのアンケートデータのうちの一方を他方に組み込んだ内容に更新する形で融合データを生成するケースを含むものとする。なお、データ融合処理及び融合データについては、後の項で詳細に説明する。
そして、サーバ1は、依頼主端末3が依頼主P(厳密には、依頼主Pで勤務する従業員)による入力操作を受け付けることで生成するデータ配信要求を受信すると、生成した融合データを要求の発信元である依頼主端末3に向けて配信する。なお、配信される融合データは、融合データの配信要求を発した依頼主端末3から提供されたアンケートデータを基データとする融合データである。
<<アンケートデータについて>>
次に、アンケート調査会社VR及び依頼主Pの各々が実施するアンケートの回答データ、すなわち、アンケートデータについて図3を参照しながら説明する。図3中の(A)は、アンケート調査会社VRが実施したアンケートに対する回答結果を示している。図3中の(B)は、依頼主Pが実施したアンケートに対する回答結果を示しており、厳密には、複数の依頼主Pのうち、一の依頼主Pがモニタ100人を対象にして実施したアンケートに対する回答結果を一例として示している。
アンケート調査会社VRが実施したアンケートのアンケートデータD1は、前述したようにシングルソースデータとなっており、数百問分の個別回答データを1万人のモニタから回収して集約したものになっている。これに対して、依頼主Pが実施したアンケートのアンケートデータD2は、前述したように非シングルソースデータとなっており、十数問分の回答を100人のモニタから回収して集約したものになっている。
なお、図3に示すケースでは、アンケート調査会社VRが実施したアンケート、及び、依頼主Pが実施したアンケートのいずれにおいても、各質問に対する回答が「0」又は「1」の数値で二値化されている。ただし、これに限定されず、各質問に対する回答が「0」及び「1」のいずれかを入力する方法以外の方法で入力されることとしてもよい。
また、アンケート調査会社VRが実施したアンケート、及び、依頼主Pが実施したアンケートには、図3の(A)及び(B)に示すように、両アンケート間で共通する質問(以下、共通質問)が含まれている。この共通質問は、後のデータ融合処理においてキーとなる質問であり、図3に示すケースではモニタ属性に関する質問、より具体的には、性別、年代、職業である。
また、図3に示すケースでは、後に説明する依頼主側固有質問の内容と関連する事項、より具体的には「ビールの飲酒の有無」が更に共通質問の中に含まれている。依頼主側固有質問の内容と関連する質問とは、その回答内容についてモニタ人数を集計したときの集計結果が、依頼主側固有質問の回答内容についてモニタ人数を集計したときの集計結果との間で一定の相関を示す間柄(換言すると、一定の相関係数を示す間柄)にある質問である。
一方、アンケート調査会社VRが実施したアンケートには、同アンケートのみに含まれ、かつ、依頼主Pが実施したアンケートには含まれていない質問が存在する。この質問は、世間の動向を把握する等の目的でアンケート調査会社VRが実施するアンケートにおいて特別に設定されたものであり、具体的には、図3の(A)に示した「テレビ番組Xの視聴の有無」が該当する。なお、上記の質問については、以下、調査会社側固有質問と呼ぶこととする。
また、依頼主Pが実施したアンケートには、同アンケートのみに含まれ、かつ、アンケート調査会社VRが実施したアンケートには含まれていない質問が存在する。この質問は、依頼主Pが自社の商品・サービスについて世間の反応を把握する等の目的で特別に設定されたものであり、具体的には、図3の(B)に示した「ビールAの購入の有無」が該当する。なお、上記の質問については、以下、依頼主側固有質問と呼ぶこととする。
<<サーバの構成について>>
次に、サーバ1の構成について図4を参照しながら説明する。図4は、サーバ1のハードウェア構成を示した図である。
サーバ1は、図4に示すように、CPU1a、ROM1b、RAM1c、通信用インタフェース(図4中、通信用I/Fと表記)1d、ハードディスクドライブ(図4中、HDDと表記)1e、マウスやキーボード等の入力装置1f、及びディスプレイやプリンタ等の出力装置1gを構成要素として有する。また、サーバ1には、その機能を発揮させるためのプログラム(以下、データ処理プログラム)が予めインストールされている。このデータ処理プログラムがCPU1aに読み取られて実行されることで、サーバ1によるデータ処理サービスが提供されることになる。
サーバ1のハードウェア構成については上述の通りであるが、以下、図5を参照しながらサーバ1の構成を機能面から改めて説明する。図5は、サーバ1の構成を機能面から示した図である。
サーバ1は、図5に示すように、データ受信部11、データ集約部12、データ記憶部13、処理実行部14及びデータ配信部15を有する。これらは、サーバ1が実行する各種処理を担うものであり、サーバ1を構成する上述のハードウェア構成機器と上述のデータ処理プログラムとが協働することによって構成されている。以下、上述したサーバ1の機能部の各々について説明する。
データ受信部11は、情報通信網を介してサーバ1と接続された機器と通信して当該機器からデータを受信するものであり、例えば、回答用端末2から個別回答データを受信し、また、依頼主端末3からアンケートデータD2を受信する。
データ集約部12は、データ受信部11が回答用端末2から個別回答データを受信すると、当該個別回答データを解析して同データが示す回答情報を特定し、更にその回答情報を図3の(A)に図示したテーブル形式でまとめる。すなわち、データ集約部12は、アンケート回答用端末2から送信された個別回答データを、全モニタ分且つ全質問分のアンケートデータD1として集約するものである。
データ記憶部13は、各種のデータを記憶しておくものであり、サーバ1に搭載されたハードディスクドライブ1eを主たる構成要素としている。データ記憶部13に記憶されるデータの中には、データ集約部12によって生成されたアンケートデータD1や、データ受信部11が依頼主端末3から受信したアンケートデータD2が含まれている。さらに、データ記憶部13には、後述の処理実行部14がデータ融合処理を実行することで生成される融合データが記憶される。
なお、本実施形態では、アンケートデータD1、D2がサーバ1内のハードディスクドライブ1eに記憶されることとしたが、これに限定されるものではない。つまり、アンケートデータD1、D2を記憶する記憶装置については、サーバ1と別に設けられていることとしてもよく、例えば、サーバ1と通信可能なデータベースサーバをアンケートデータD1、D2の記憶装置として用いることとしてもよい。
処理実行部14は、データ記憶部13に記憶された2つのアンケートデータD1、D2を読み出し、これらのデータを融合するデータ融合処理を実行して融合データを生成するものである。以下、図6を参照しながらデータ融合処理について概説する。図6は、データ融合処理の内容を概念的に示した図である。
データ融合処理は、互いに異なる調査者が互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータ同士を、当該各々の共通質問に対する回答内容をキーとして融合する処理である。かかる処理により、図6に示すように、第1アンケートの回答結果に対して第2アンケートにのみ含まれた質問の回答内容を付加した情報を示すデータ、すなわち、融合データが生成される。
より分かり易く説明するために、アンケート調査会社VRが実施したアンケートを第1アンケートとし、依頼主Pが実施したアンケートを第2アンケートとするケースを例に挙げて説明する。
データ融合処理では、先ず、アンケート調査会社VRが実施したアンケートの回答結果を示すアンケートデータD1(第1アンケートデータに相当)と、依頼主Pが実施したアンケートの回答結果を示すアンケートデータD2(第2アンケートデータに相当)とを対比する。具体的に説明すると、上記2つのアンケートに回答したモニタ同士の間で両アンケートに含まれる共通質問への回答の類似度合いを算出する。ここで、共通質問は、前述したように、性別、年代及び職業等のモニタ属性に関する質問を含み、さらに、本実施形態では依頼主側固有質問の内容と関連する事項を含んでいる。
より詳しく説明すると、データ融合処理では、アンケート調査会社VRがアンケートを依頼したモニタ1万人の各々について、依頼主Pがアンケートを依頼した100人のモニタの中で、共通質問に対する回答内容が最も類似しているモニタを探索する。かかる目的のため、アンケート調査会社VRがアンケートを依頼したモニタ1万人の各々について、依頼主Pがアンケートを依頼した100人のモニタの各々との間の類似度合いを算出する。なお、類似度合いの算出方法については後の項で説明する。
類似度合いの算出後には、類似度合いが高いモニタの組み合わせを探索する。具体的に説明すると、アンケート調査会社VRがアンケートを依頼した各モニタに対して、依頼主Pがアンケートを依頼したモニタの中から上記の類似度合いが最も高いモニタを探索する。探索されたモニタ(依頼主Pが実施したアンケートの回答者)、及び、基準とされたモニタ(アンケート調査会社VRが実施したアンケートの回答者)は、以降、一組のモニタとして扱われる。
そして、一組のモニタのうち、アンケート調査会社VRがアンケートを依頼した方のモニタに対して、依頼主Pがアンケートを依頼した方のモニタが回答した依頼主側固有質問(具体的には、ビールAの購買の有無)の回答内容と同一の回答内容を割り当てる。ここで、アンケート調査会社VRがアンケートを依頼した方のモニタは、アンケート調査会社VRが実施したアンケートに含まれる質問、具体的には、共通質問や調査会社側固有質問(第1質問に相当)のみを回答しており、依頼主Pが実施したアンケートのみに含まれる依頼主側固有質問(第2質問に相当)については回答していない。したがって、依頼主Pがアンケートを依頼した方のモニタが回答した依頼主側固有質問の回答内容と同一の回答内容を割り当てることで、依頼主側固有質問を回答していないモニタに対して、同質問への仮想回答が付与されることになる。
以上の手順に従ってアンケート調査会社VRがアンケートを依頼したモニタ全てに対して仮想回答が割り当てられることで、アンケート調査会社VRが実施した分のアンケートデータD1と、依頼主Pが実施した分のアンケートデータD2とが融合するようになる。
なお、本実施形態では、データ融合の際に「制約付き統計的マッチング」を採用しており、融合前のアンケートデータにおける集計結果が融合後のアンケートデータ、すなわち、融合データにおける集計結果と揃うようにデータ融合を行うこととしている。「制限付き統計的マッチング」については、後の項で改めて説明する。
以上の結果、調査会社側固有質問及び依頼主側固有質問の双方の回答内容を含む擬似的アンケートデータとして、融合データが生成される。したがって、融合データを入手すれば、調査会社側固有質問及び依頼主側固有質問の双方について、回答内容別にモニタ人数を集計することが可能となり、さらに、調査会社側固有質問及び依頼主側固有質問の間において回答内容の相関関係を把握することも可能となる。
また、融合データは、アンケート調査会社VRが実施したアンケートのモニタ数、すなわち、1万人分の回答データに相当する。つまり、融合データが生成されることにより、依頼主Pが独自で実施したアンケートの回答結果を示すアンケートデータD2から同アンケートの回答結果を含む1万人分のシングルソースデータが生成されることになる。
なお、融合データについて付言しておくと、アンケート調査会社VRが実施したアンケートのモニタ数と必ずしも同数になるとは限らず、例えば、アンケート調査会社VRが実施したアンケートのモニタ数が、依頼主Pが実施したアンケートのモニタ数の倍数となっていない場合には、両モニタ数の最小公倍数に相当する数のデータを含む融合データが生成される場合がある。
そして、生成された融合データは、データ記憶部13に記憶される。
データ配信部15は、依頼主端末3から発された融合データの配信要求をデータ受信部11が受信すると、データ記憶部13から融合データを読み出して上記の依頼主端末3に向けて同データを配信するものである。
特に、本実施形態に係るデータ配信部15は、データ配信要求を発した依頼主端末3に対して、同端末3が提供したアンケートデータを基データとする融合データのみを配信する。換言すると、依頼主端末3は、自らが提供したアンケートデータを基データとする融合データのみを受信するようになる。この結果、データ通信上のセキュリティが確保されるようになるので、アンケート調査会社VRが提供するデータ処理サービスを複数の依頼主Pが利用しているとしても、各依頼主Pは、自社独自で実施したアンケートのデータを公開されることがなく、上記サービスを安心して利用することが可能である。
<<アンケートデータ処理方法>>
次に、本実施形態に係るアンケートデータ処理方法について説明する。本実施形態に係るアンケートデータ方法は、コンピュータであるサーバ1を用いて行われる。換言すると、サーバ1がASPサービスとして実行するデータ処理(以下、データ処理サービス)では、本実施形態に係るアンケートデータ処理方法が適用されていることになる。以下では、本実施形態に係るアンケートデータ処理方法の説明として、サーバ1によるデータ処理サービスの流れと同サービス中の各工程について説明することとする。
サーバ1によるデータ処理サービスは、図7に示す流れに従って進行する。図7は、データ処理サービスに係る一連の処理についての大まかな流れを示した図である。
データ処理サービスは、先ず、第1アンケートデータを取得する工程(S001)から始まる。ここで、第1アンケートデータは、アンケート調査会社VRが実施したアンケートの回答結果を示すアンケートデータD1とする。
本工程S001について詳しく説明すると、サーバ1のデータ受信部11が各モニタの回答用端末2と通信し、各質問別に個別回答データを受信する。その後、全質問分の個別回答データを全モニタから回収した時点で、データ集約部12が、これらの個別回答データを集約して、全モニタ分且つ全質問分のアンケートデータD1を生成する。このように、本実施形態では、データ受信部11とデータ集約部12との協働によってアンケートデータD1が取得される。かかる観点において、データ受信部11及びデータ集約部12は、第1アンケートデータを取得する第1アンケートデータ取得部を構成していると言える。
そして、本工程S001で生成されたアンケートデータD1は、データ記憶部13に記憶される。
第1アンケートデータを取得した後には、第2アンケートデータを取得する工程(S002)が実行される。ここで、第2アンケートデータは、依頼主Pが実施したアンケートの回答結果を示すアンケートデータD2であり、本実施形態では依頼主端末3から送信されてくる。すなわち、本工程S002は、データ受信部11が依頼主端末3から上記のアンケートデータD2を受信する工程である。かかる観点において、データ受信部11は、第2アンケートデータを取得する第2アンケートデータ取得部に相当すると言える。
そして、本工程S002で取得したアンケートデータD2は、データ記憶部13に記憶される。なお、本実施形態では、第1アンケートデータを取得した後に第2アンケートデータを取得することとしたが、これに限定されるものではなく、第2アンケートデータを取得した後に第1アンケートデータを取得することとしてもよい。
以上までの工程S001、S002により2つのアンケートデータD1、D2がデータ記憶部13に記憶されると、その後にサーバ1の処理実行部13がこれらのデータD1、D2を読み出してデータ融合処理を実行する(S003)。本工程S003により、調査会社側固有質問及び依頼主側固有質問の各々の回答内容を示す融合データが生成される。なお、本工程S003は、それ以前の工程S001、S002によって2つのアンケートデータD1、D2がデータ記憶部13に記憶されると自動的に実行されることとしてもよく、あるいは、サーバ1のユーザ(例えば、アンケート調査会社VRの従業員)が入力装置1fを通じて行う所定の入力操作をサーバ1側で受け付けたことを契機として実行されることとしてもよい。
本工程S003において生成された融合データは、データ記憶部13に記憶される。
その後、依頼主Pが依頼主端末3を通じて融合データの配信を要求すると、当該要求をデータ受信部11が受信する。そして、データ配信要求の受信に伴い、本サーバ1のデータ配信部15がデータ記憶部13から融合データを読み出し、当該データを依頼主端末3に向けて配信する(S004)。このとき、データ配信部15は、データ配信要求を解析して当該要求の発信元である依頼主端末3を特定し、特定した依頼主端末3と対応する融合データをデータ記憶部13から読み出して上記依頼主端末3に向けて配信する。
なお、依頼主端末3と対応する融合データとは、前述したように、当該依頼主端末3から受信したアンケートデータD2を基データとする融合データのことである。また、依頼主端末3と融合データとの対応関係については、それを示すデータ(参照データ)が融合データ生成時に併せて生成されてデータ記憶部13に記憶されるようになっている。そして、データ配信部15は、融合データをデータ記憶部13から読み出す際に、上記の参照データに基づき、特定した依頼主端末3と対応する融合データをデータ記憶部13の中から検索する。
以上の一連の工程が終了した時点で、1回のデータ処理サービスが完了することとなる。次に、上述したデータ処理サービスのうち、データ融合処理を実行する工程S003について図8を参照しながらより詳細に説明する。図8は、データ融合処理の流れを示す図である。
データ融合処理は、図8に示すように、モニタ間の距離を算出する処理S011、割り当てパターンを導出する処理S012、データ融合を行う処理S013、融合データを保存する処理S014によって構成されている。これらの処理は、いずれもサーバ1の処理実行部14によって実行される。以下、各処理について説明する。
モニタ間の距離を算出する処理S011は、算出処理に相当し、第1アンケートに回答したモニタと第2アンケートに回答したモニタとの間で各アンケートに含まれる共通質問の回答内容の類似度合いを算出する処理である。ここで、第1アンケートは、アンケート調査会社VRが実施したアンケートであり、第2アンケートは、依頼主Pが実施したアンケートである。
本処理S011について詳しく説明すると、アンケート調査会社VRがアンケートを依頼したモニタ1万人の各々について、依頼主Pがアンケートを依頼した100人のモニタの各々との間の類似度合いを算出する。類似度合いの算出に関して言えば、本実施形態では、共通質問の各々について回答内容の違いを距離(厳密には、ユーグリッド距離)で表し、共通質問毎の距離を合計した総距離を以てモニタ間の類似度合いとしている。
モニタ間の類似度合いの算出方法について図9に示す例を参照しながら説明する。図9は、モニタ間の類似度合いの算出手順についての説明図である。なお、同図には、アンケート調査会社VRがアンケートを依頼したモニタの一人(具体的には、識別番号S00001が付与されたモニタ)と依頼主Pがアンケートを依頼したモニタの一人(具体的には、識別番号T001が付与されたモニタ)との間の類似度合いを算出した際の結果が示されている。
サーバ1の処理実行部14は、モニタ間の類似度合いを算出するにあたり、データ記憶部13に記憶された2つのアンケートデータD1、D2を読み出す。そして、処理実行部14は、2つのアンケートデータD1、D2のうち、アンケート調査会社VRが実施したアンケートの回答結果を示すデータD1を解析し、一のモニタ(例えば、識別番号S00001のモニタ)が共通質問に対して回答した回答内容を特定する。同様にして、処理実行部14は、依頼主Pが実施したアンケートの回答結果を示すデータD2を解析し、一のモニタ(例えば、識別番号T001のモニタ)が共通質問に対して回答した回答内容を特定する。
その後、処理実行部14は、両モニタの回答内容を対比し、質問別に回答内容の差異、すなわち距離を算出する。ここで、本実施形態では、前述したように、各回答内容が「0」又は「1」のいずれかで表現されているので、距離は、「0」又は「1」となる。例えば、図9に示すケースでは、「性別」に関する距離が0、「年代」に関する距離が1、「職業」に関する距離が1、「ビールの飲酒の有無」に関する距離が0となっている。そして、処理実行部14は、各質問の距離を合算し、その結果を以てモニタ間の類似度合いとする。このようにして算出された類似度合いは、小さい値になるほど属性が近いモニタであることを示し、図9に示すケースでは、類似度合いとしての総距離が2となっている。
なお、本実施形態では、共通質問中に依頼主側固有質問と関連する質問(具体的には、「ビールの飲酒の有無」)が含まれており、かかる質問についても距離を評価することとしている。このため、後のデータ融合時にアンケート調査会社VRがアンケートを依頼した各モニタに対して依頼主側固有質問(具体的には、ビールAの購買の有無)の仮想回答を割り当てる際には、上記関連質問の回答内容に関する類似度合いが反映されることになる。このように依頼主側固有質問と関連する質問について類似度合いを算出し、その算出結果に基づいて仮想回答を割り当てることで仮想回答としてより適切な回答を割り当てることが可能となり、詳しくは、依頼主側固有質問への回答に影響を与える因子についての回答結果を加味してより妥当と考えられる回答を割り当てることが可能となる。
依頼主Pがアンケートを依頼したモニタの一人について上記類似度合いを算出した後、処理実行部14は、依頼主Pがアンケートを依頼したモニタの中から次のモニタを順次抽出し、上記と同様の手順を繰り返す。これにより、アンケート調査会社VRがアンケートを依頼した一のモニタ(例えば、識別番号S00001のモニタ)について、依頼主Pがアンケートを依頼したモニタの数に相当する数(具体的には、100個)の類似度合いが算出されることとなる。
そして、処理実行部14は、上述した手順を、アンケート調査会社VRがアンケートを依頼したモニタの人数分(具体的には、1万人分)繰り返す。この結果、モニタ間の類似度合いが、アンケート調査会社VRが実施したアンケートのモニタ人数(1万人)×依頼主Pが実施したアンケートのモニタ人数(100人)の積に相当する分だけ算出されることとなる。
次に、割り当てパターンを導出する処理S012について説明する。本処理S012は、次処理S013とともに割り当て処理を成し、次処理S013においてアンケート調査会社VRがアンケートを依頼した各モニタに対して依頼主側固有質問の仮想回答を割り当てるにあたり、その割り当てパターンを導出する工程である。
そして、本実施形態では、調査会社側固有質問に関する集計結果が融合前のアンケートデータD1(アンケート調査会社VRが実施したアンケート分)と融合データとの間で揃い、かつ、依頼主側固有質問に関する集計結果が融合前のアンケートデータD2(依頼主Pが実施したアンケート分)と融合データとの間で揃うような割り当てパターンを導出することとしている。
つまり、本実施形態では、「制約付き統計的マッチング」を採用しており、処理実行部14が、前工程で算出したモニタ同士間の類似度合いに基づいて上記の割り当てパターンを統計的解法に従って設定することになっている。以下、割り当てパターンを導出する手順について説明する。
処理実行部14は、割り当てパターンを導出するため手法として輸送問題の解法を採用し、当該解法により下記の前提条件(a)、(b)の双方を満たすような割り当てパターンを導出することとしている。
(a)調査会社側固有質問に関する集計結果については、融合前のアンケートデータD1(アンケート調査会社VRが実施した分のアンケートデータ)と融合データとの間で同一とする。
(b)依頼主側固有質問に関する集計結果については、融合前のアンケートデータD2(依頼主Pが実施した分のアンケートデータ)と融合データとの間で同一とする。
ここで、調査会社側固有質問に関する集計結果とは、同質問に対する回答内容別にモニタ人数を集計した際の人数比率のことである。同様に、依頼主側固有質問に関する集計結果とは、同質問に対する回答内容別にモニタ人数を集計した際の人数比率のことである。
一方、輸送問題の解法により割り当てパターンを設定するにあたり、アンケート調査会社VRがアンケートを依頼した各モニタ、及び、依頼主Pがアンケートを依頼した各モニタに対してウェイトを設定する。ここで、アンケート調査会社VRがアンケートを依頼した各モニタに対して設定されるウェイトは、輸送問題における需要量に相当し、依頼主Pがアンケートを依頼した各モニタに対して設定されるウェイトは、供給量に相当する。
以降の説明については、事案を簡素化するために、図10に示すケースを例に挙げて説明することとする。図10は、割り当て処理の内容に関する説明図であり、同図には、データ融合に係る2つのアンケートデータのうちの一方(調査データA)がモニタ数3及び質問数2のデータであり、他方(調査データB)がモニタ数2及び質問数2であるケースを図示している。
なお、図10中、調査データAは、アンケート調査会社VRが実施したアンケート分のデータD1に相当し、調査データBは、依頼主Pが実施したアンケート分のデータD2に相当する。
調査データAについて説明すると、各モニタa1、a2、a3に対して設定されたウェイトが2であり、調査会社側固有質問に関する集計結果(具体的には、テレビ番組Xを視聴したことが有るモニタの比率)が33.3%となっている。
一方、調査データBについて説明すると、各モニタb1、b2に対して設定されたウェイトが3であり、依頼主側固有質問に関する集計結果(具体的には、ビールAを購入したことが有るモニタの比率)が50%となっている。
そして、調査データA側の各モニタa1、a2、a3に対して、依頼主側固有質問に対する調査データB側のモニタb1、b2の回答内容を仮想回答として割り当てる際、調査データA側の各モニタa1、a2、a3のウェイトを、調査データB側のモニタb1、b2の各々に対して配分する。そして、各モニタa1、a2、a3別に設定したウェイト配分こそが、割り当てパターンに相当する。
より具体的に説明すると、調査データA側の各モニタa1、a2、a3については、組み合わせの相手となるモニタがb1、b2の2種類であるため、ウェイトの配分の候補としては、「b1に2、b2に0」、「b1に1、b2に1」及び「b1に0、b2に2」となる。ここで、上記3つの候補のうち、いずれの候補を採用するのかについては、上述した前提条件(a)、(b)を満たしつつ、さらに、採用した候補に対応する累計距離を最小化させるという条件を満たすように決定される。
ここで、「採用した候補に対応する累計距離」とは、モニタ間の類似度合いとして算出した距離(厳密には、総距離)と、採用したウェイト配分とによって求められる値である。一例を挙げて説明すると、モニタa1に対して「b1に1、b2に1」というウェイト配分を、モニタa2に対して「b1に0、b2に2」というウェイト配分を、モニタa3に対して「b1に2、b2に0」というウェイト配分をそれぞれ採用した場合には、下記の通り、上記の累計距離は4(=1+1+2)となる。
<モニタa1分>
(b1に対するウェイト1)×(a1とb1との間の距離0)+(b2に対するウェイト1)×(a1とb2との間の距離1)=1
<モニタa2分>
(b1に対するウェイト0)×(a2とb1との間の距離0)+(b2に対するウェイト2)×(a2とb2との間の距離1)=2
<モニタa3分>
(b1に対するウェイト2)×(a3とb1との間の距離1)+(b2に対するウェイト0)×(a3とb2との間の距離0)=2
なお、上記の式において「距離」とは、性別の差異を示す距離のことである。
そして、採用した候補に対する累計距離をすべてのウェイト配分について求め、その中で、算出した累計距離が最も小さくなるウェイト配分を探索する。これにより、モニタa1、a2、a3別のウェイト配分が設定されることになる。
以上のようにして各モニタa1、a2、a3別のウェイト配分が設定され、図10に示すケースでは、モニタa1に対して「b1に2、b2に0」という配分が、モニタa2に対して「b1に1、b2に1」という配分が、モニタa3に対して「b1に0、b2に2」という配分が設定されることになる。そして、各モニタa1、a2、a3別のウェイト配分が設定されることで、割り当てパターンが設定され、その設定完了を以て、割り当てパターンを導出する処理S012が終了する。
次に、データ融合を行う処理S013について説明する。本処理S013は、前の処理S012で設定された割り当てパターンにて、アンケート調査会社VRがアンケートを依頼した各モニタ(換言すると、同アンケートを回答したモニタ)に対して仮想回答を割り当てる処理である。ここで、仮想回答とは、依頼主Pがアンケートを依頼したモニタ(換言すると、同アンケートに回答したモニタ)のうち、仮想回答が割り当てられるモニタと対を成すモニタの依頼主側固有質問に対する回答内容と同一の回答内容のことである。
本処理S013について既出の図10を参照しながらより具体的に説明すると、モニタa1の回答にはモニタb1の回答が仮想回答として割り当てられ、モニタa3の回答にはモニタb2の回答が割り当てられる。ここで、モニタb1の回答が割り当てられたモニタa1の回答、及び、モニタb2の回答が割り当てられたモニタa3の回答については、それぞれウェイト2の回答として扱われ、換言すると、モニタ2人分の回答として扱われることになる。
一方で、モニタa2の回答は、ウェイトが1の配分にてモニタb1の回答が割り当てられ、ウェイトが1の配分にてモニタb2の回答が割り当てられる。つまり、モニタa2の回答については、モニタb1の回答を割り当てた分と、モニタb2の回答を割り当てた分と、をそれぞれモニタ1人分の回答として扱うことになる。
以上のように仮想回答が各モニタa1、a2、a3に対して割り当てる結果、データ同士が融合し、最終的に、図10の下段に示す融合データが生成される。なお、同図に示すように、生成された融合データでは、調査会社側固有質問に関する集計結果、及び、依頼主側固有質問に関する集計結果が融合前の基データと同一となっている。
その後、融合データを保存する処理S014が実行され、融合データがデータ記憶部13に記憶されるようになる。そして、融合データの保存処理S014が完了した時点でデータ融合処理が完了する。
<<データ融合処理の変形例>>
以上までに説明してきたケースは、1つのシングルソースデータと1つの非シングルソースデータとを融合して擬似シングルソースデータとしての融合データを生成するケースである。換言すると、上述のケースでは、1つの第1アンケートデータに対して1つの第2アンケートデータを融合させることとした。ただし、1つの第1アンケートデータに対して複数の第2アンケートデータを融合するケースも考えられ、かかるケースについても本発明を適用することが可能である。以下では、データ融合処理において1つの第1アンケートデータに対して複数の第2アンケートデータを融合するケース(変形例)について説明する。
なお、データ融合処理の具体的な手順については、既に説明した内容と共通するので、説明を省略することとする。
変形例としては、アンケート調査会社VRがシングルソースデータの入手を目的としてアンケート(第1アンケートに相当)を実施する一方で、互いに異なる複数の調査者(例えば、複数の依頼主P)が、互いに質問内容が異なる独自のアンケート(第2アンケートに相当)を実施するケースが考えられる。かかるケースを取り上げて具体的に説明すると、先ずサーバ1、厳密には、第2アンケートデータ取得部に相当するデータ受信部11が、各調査者が独自に行ったアンケートの回答結果を示すアンケートデータ(第2アンケートデータ)を受信する。ここで、データ受信部11が受信するアンケートデータの個数は、当然ながら、複数の依頼主Pが独自に実施するアンケートと同数になっている。
そして、サーバ1の処理実行部14は、アンケート調査会社VRから取得したアンケートデータと各依頼主Pから取得したアンケートデータとを融合して融合データを生成するデータ融合処理を実行する。この処理によって生成される融合データは、アンケート調査会社VRが実施したアンケート固有の質問(すなわち、調査会社側固有質問)に対する回答内容と、各依頼主Pが実施したアンケート別の固有質問(すなわち、依頼主側固有質問)に対する回答内容とを示すものとなっている。つまり、変形例に係るデータ融合処理では、図11や図12に示すように、アンケート調査会社VRが設定した固有質問(図中、第1質問と表記)の回答結果、及び、各依頼主Pが設定した固有質問(図中、第2質問(1)、第2質問(2)と表記)の回答結果を示す融合データが生成されることとなる。図11及び12は、変形例に係るデータ融合処理の内容を概念的に示した図である。
ところで、データ融合処理では、アンケート調査会社VR側のアンケートに回答したモニタと各依頼主P独自のアンケートに回答したモニタとの間でアンケート中の共通質問の回答内容の類似度合いを算出する算出処理が実行される。その後、算出した類似度合いに基づいて設定された割り当てパターンにて、アンケート調査会社VR側のアンケートに回答したモニタに対して、各依頼主P独自のアンケートに回答したモニタの同アンケート固有の質問に対する回答内容と同一の回答内容を割り当てる割り当て処理が実行される。
そして、変形例に係るデータ融合処理では、上記の算出処理及び割り当て処理を、依頼主P側のアンケートデータの数と同じ数だけ繰り返し実行する。具体的に説明すると、依頼主P側のアンケートデータを複数取得した状況において、そのうちのいずれか一つのアンケートデータとアンケート調査会社VRが取得したアンケートデータとを融合させるべく上記の算出処理及び割り当て処理を実行する。以降、残りのアンケートデータについても、一つずつ順次融合させる度に算出処理及び割り当て処理を実行し、すべてのアンケートデータについて算出処理及び割り当て処理が完了した時点でデータ融合処理が完了する。
以上のように変形例では3つ以上のアンケートデータの融合が可能となるので、当該融合データが示す情報量がより一層増え、当該融合データの利用価値が益々高まることになる。この結果、上記融合データの配信をサービスとして提供する本発明のアンケートデータ処理装置が更に有用なものとなる。
なお、アンケート調査会社VRが取得したアンケートデータと各依頼主P側のアンケートデータとを融合させる上で、両アンケートで内容が共通する質問、すなわち共通質問が必要となる。変形例において、共通質問については、図11に示すように複数の依頼主Pが実施するアンケートすべてに同じ内容の共通質問が含まれていることとしてもよい。あるいは、図12に示すように、各依頼主Pが実施するアンケートの間では異なるものの、アンケート調査会社VRが実施するアンケートには含まれるように共通質問が設定されていることとしてもよい。
<<その他の実施形態>>
上記の実施形態には、主として本発明のアンケートデータ処理装置及びアンケートデータ処理方法について説明した。しかし、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることはもちろんである。
また、上記の実施形態では、アンケート調査会社VRが実施した方のアンケートを第1アンケートとし、依頼主Pが実施した方のアンケートを第2アンケートとするケースを例に挙げて説明した。そして、上記の実施形態では、アンケート調査会社VRが実施したアンケートの回答結果に依頼主側固有質問の回答内容が加わるようにデータ融合を行う例を採り上げて説明した。ただし、これに限定されるものではなく、依頼主Pが実施したアンケートの回答結果に調査会社側固有質問の回答内容が加わるようにデータ融合を行うケース、すなわち、依頼主Pによるアンケートを第1アンケートとし、アンケート調査会社VRによるアンケートを第2アンケートとするケースに対しても本発明は適用可能である。
また、上記の実施形態では、アンケート調査会社VR及び依頼主Pがそれぞれ実施したアンケートについて、その回答結果を示すアンケートデータ同士を融合するケースを例に挙げて説明した。すなわち、上記の実施形態では、互いに異なる調査者が実施した各アンケートの回答結果を示すデータに対して、データ融合処理を実行することとした。ただし、これに限定されるものではなく、同一の調査者により実施された複数のアンケートの各々について、その回答結果を示すアンケートデータ同士を融合する場合にも本発明は適用可能である。
また、上記の実施形態では、シングルソースデータと非シングルソースデータとを融合して擬似シングルソースデータとしての融合データを生成するケースを例に挙げて説明したが、これに限定されるものではない。すなわち、本発明は、非シングルソースデータ同士を融合して融合データを生成するケース、及び、シングルソースデータ同士を融合して融合データを生成するケースのいずれにも適用可能である。
また、上記の実施形態では、依頼主Pが実施したアンケートの回答結果を示すデータをデータ通信により取得することとした。ただし、依頼主Pが実施したアンケートのデータを取得する方法については、上記の内容に限定されず、例えば、依頼主Pが実施したアンケートの回答結果を示すデータをCD−RやDVD等の記録媒体から読み取ることで取得することとしてもよい。また、上記の回答結果が紙媒体に記録されている場合には、その情報を確認しながら入力装置1fを通じて入力することで取得することとしてもよい。
また、上記の実施形態では、アンケート調査会社VRが実施したアンケートのモニタと依頼主Pが実施したアンケートのモニタとの間の類似度合いを評価する上で、両アンケートに共通して含まれる共通質問への回答内容の類似度合いを評価することとした。このとき、共通質問すべての回答内容を評価対象とすることとしたが、これに限定されるものではない。すなわち、複数ある共通質問のうち、一部のみを評価対象とすることとしてもよい。
また、上記の実施形態において、各アンケートの時期については特に言及しなかったが、一般的に、アンケート調査会社VRによるアンケートは、同社のデータ処理サービスを依頼主Pが依頼する時点で既に完了していると考えられる。ただし、これに限定されるものではなく、データ処理サービスを依頼主Pが依頼した以降にアンケート調査会社VRによるアンケートが行われることとしてもよい。この場合のアンケートは、新しいアンケートデータを取得する目的でアンケートの全問を出題するもの(全問調査)、及び、アンケートの回答結果に追加したい項目についてのみ出題するもの(追加調査)のいずれであってもよい。例えば、モニタ間の類似度合いを評価するうえで、それまでに含まれていなかった質問を共通質問として追加し、当該質問について、依頼主Pがデータ処理サービスを依頼した後に調査することとしてもよい。
また、上記の実施形態では、割り当てパターンを設定する際に適用する統計学的手法として輸送問題による解法を採用することとした。ただし、これに限定されるものではない。すなわち、割り当てパターンについては、前述した前提条件(a)、(b)を満たすように設定されればよく、具体的には、調査会社側固有質問に関する集計結果が融合前後で変わらず、かつ、依頼主側固有質問に関する集計結果が融合前後で変わらないように設定されればよい。かかる条件を満たす限りにおいては、割り当てパターンを設定する際に適用する統計学的手法は、特に制限なく採用することが可能である。
1 サーバ(アンケートデータ処理装置)
1a CPU、1b ROM、1c RAM
1d 通信用インタフェース
1e ハードディスクドライブ
1f 入力装置、1g 出力装置
2 回答用端末
3 依頼主端末
11 データ受信部、12 データ集約部
13 データ記憶部、14 処理実行部
15 データ配信部
D1,D2 アンケートデータ
VR アンケート調査会社
P 依頼主

Claims (6)

  1. 互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータを処理するアンケートデータ処理装置であって、
    前記第1アンケート及び前記第2アンケートの双方に含まれる共通質問、及び、前記第1アンケートのみに含まれる第1質問の各々の回答内容を、前記第1アンケートに回答した前記モニタの人数分集めた第1アンケートデータを取得する第1アンケートデータ取得部と、
    前記共通質問、及び、前記第2アンケートのみに含まれる第2質問の各々の回答内容を、前記第2アンケートに回答した前記モニタの人数分集めた第2アンケートデータを取得する第2アンケートデータ取得部と、
    前記第1アンケートデータ取得部が取得した前記第1アンケートデータと、前記第2アンケートデータ取得部が取得した前記第2アンケートデータと、を融合して、前記第1質問及び前記第2質問の各々の回答内容を示す融合データを生成するデータ融合処理を実行する処理実行部と、
    該処理実行部により生成された前記融合データを、該融合データの配信要求を発する端末に向けて配信するデータ配信部と、を備え、
    前記データ融合処理は、
    前記第1アンケートに回答した前記モニタと前記第2アンケートに回答した前記モニタとの間で、前記共通質問の回答内容の類似度合いを算出する算出処理と、
    算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1アンケートに回答した前記モニタに対して、前記第2アンケートに回答した前記モニタの前記第2質問に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含んでおり、
    該割り当て処理において、前記処理実行部は、前記第1質問に関する集計結果が前記第1アンケートデータと前記融合データとの間で揃い、かつ、前記第2質問に関する集計結果が前記第2アンケートデータと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定することを特徴とするアンケートデータ処理装置。
  2. 前記処理実行部は、前記割り当て処理において前記割り当てパターンを輸送問題の解法に従って設定することを特徴とする請求項1に記載のアンケートデータ処理装置。
  3. 前記第1アンケートデータ及び前記第2アンケートデータのうち、いずれか一方のアンケートデータは、シングルソースデータであり、もう一方のアンケートデータは、前記シングルソースデータよりも質問数が少ないアンケートの回答内容を示す非シングルソースデータであり、
    前記データ配信部は、前記非シングルソースデータの提供者が管理する前記端末に向けて前記融合データを配信することを特徴とする請求項2に記載のアンケートデータ処理装置。
  4. 複数の前記非シングルソースデータが互いに異なる複数の調査者から提供される場合において、前記処理実行部は、各々の前記非シングルソースデータに対して個別に前記データ融合処理を実行し、
    前記データ配信部は、複数の前記非シングルソースデータのうち、一の前記非シングルソースデータと前記シングルソースデータとを融合することで生成される前記融合データを、一の前記非シングルソースデータを提供した前記調査者が管理する前記端末にのみ配信することを特徴とする請求項3に記載のアンケートデータ処理装置。
  5. 互いに質問内容が異なる複数の前記第2アンケートが実施された場合において、
    前記第2アンケートデータ取得部が前記第2アンケートと同数の前記第2アンケートデータを取得し、
    前記処理実行部が、前記第1アンケートデータと複数の前記第2アンケートデータとを融合して、前記第1質問の回答内容及び前記第2アンケート別の前記第2質問の回答内容を示す前記融合データを生成する前記データ融合処理を実行し、
    該データ融合処理では、前記処理実行部によって、前記算出処理及び前記割り当て処理がそれぞれ前記第2アンケートデータの数と同じ数だけ繰り返されることを特徴とする請求項2に記載のアンケートデータ処理装置。
  6. 互いに異なるモニタに対して実施した第1アンケート及び第2アンケートの各々の回答結果を示すアンケートデータをコンピュータによって処理するアンケートデータ処理方法であって、
    前記コンピュータが、
    前記第1アンケート及び前記第2アンケートの双方に含まれる共通質問、及び、前記第1アンケートのみに含まれる第1質問の各々の回答内容を、前記第1アンケートに回答した前記モニタの人数分集めた第1アンケートデータを取得する工程と、
    前記共通質問、及び、前記第2アンケートのみに含まれる第2質問の各々の回答内容を、前記第2アンケートに回答した前記モニタの人数分集めた第2アンケートデータを取得する工程と、
    取得した前記第1アンケートデータと前記第2アンケートデータとを融合して、前記第1質問及び前記第2質問の各々の回答内容を示す融合データを生成するデータ融合処理を実行する工程と、
    生成された前記融合データを、該融合データの配信要求を発する端末に向けて配信する工程と、を行い、
    前記データ融合処理は、
    前記第1アンケートに回答した前記モニタと前記第2アンケートに回答した前記モニタとの間で、前記共通質問の回答内容の類似度合いを算出する算出処理と、
    算出した前記類似度合いに基づいて設定された割り当てパターンにて、前記第1アンケートに回答した前記モニタに対して、前記第2アンケートに回答した前記モニタの前記第2質問に対する回答内容と同一の回答内容を割り当てる割り当て処理と、を含んでおり、
    該割り当て処理において、前記コンピュータは、前記第1質問に関する集計結果が前記第1アンケートデータと前記融合データとの間で揃い、かつ、前記第2質問に関する集計結果が前記第2アンケートデータと前記融合データとの間で揃うような前記割り当てパターンを統計的解法に従って設定することを特徴とするアンケートデータ処理方法。
JP2013162409A 2013-08-05 2013-08-05 アンケートデータ処理装置及びアンケートデータ処理方法 Active JP5638673B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013162409A JP5638673B1 (ja) 2013-08-05 2013-08-05 アンケートデータ処理装置及びアンケートデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013162409A JP5638673B1 (ja) 2013-08-05 2013-08-05 アンケートデータ処理装置及びアンケートデータ処理方法

Publications (2)

Publication Number Publication Date
JP5638673B1 true JP5638673B1 (ja) 2014-12-10
JP2015032199A JP2015032199A (ja) 2015-02-16

Family

ID=52145653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013162409A Active JP5638673B1 (ja) 2013-08-05 2013-08-05 アンケートデータ処理装置及びアンケートデータ処理方法

Country Status (1)

Country Link
JP (1) JP5638673B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115859931A (zh) * 2023-02-27 2023-03-28 长沙冉星信息科技有限公司 一种电子问卷的生成方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6201077B1 (ja) * 2017-03-16 2017-09-20 株式会社ビデオリサーチ 調査データ処理装置及び調査データ処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197232A (ja) * 2000-10-18 2002-07-12 Masakuni Hirano 大規模アンケート調査実施総合システム
JP2010267035A (ja) * 2009-05-13 2010-11-25 Video Research:Kk 調査システム及び調査方法
JP2011028350A (ja) * 2009-07-22 2011-02-10 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197232A (ja) * 2000-10-18 2002-07-12 Masakuni Hirano 大規模アンケート調査実施総合システム
JP2010267035A (ja) * 2009-05-13 2010-11-25 Video Research:Kk 調査システム及び調査方法
JP2011028350A (ja) * 2009-07-22 2011-02-10 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115859931A (zh) * 2023-02-27 2023-03-28 长沙冉星信息科技有限公司 一种电子问卷的生成方法

Also Published As

Publication number Publication date
JP2015032199A (ja) 2015-02-16

Similar Documents

Publication Publication Date Title
JP6201077B1 (ja) 調査データ処理装置及び調査データ処理方法
CN113473187B (zh) 广告投放的跨屏优化
US8935345B2 (en) Information providing apparatus, information providing method, information providing program, and computer-readable recording medium having information providing program recorded therein
JP2013218638A (ja) コンテンツ配信システムおよびリコメンド方法
Hsu et al. Music streaming characteristics and emotional consumption as determinants of consumer satisfactions and intention to purchase
JP5638673B1 (ja) アンケートデータ処理装置及びアンケートデータ処理方法
JP2012103955A (ja) プロファイル解析システム
JP2020112857A (ja) データ処理装置及びデータ処理方法
WO2020122027A1 (ja) 情報処理装置及びプログラム。
JP7186316B1 (ja) 推定装置、及び推定方法
Wei et al. Consumer adoption intentions toward the Internet in China: The effects of impersonal and interpersonal communication channels
JP6031710B1 (ja) 商標支援システム
JP2017182807A (ja) 商標支援システム
JP2015026163A (ja) 調査結果解析用の装置及び調査結果解析方法
WO2012099970A1 (en) Brand index evaluation apparatuses, methods and systems
JP2017134800A (ja) 役務請負いの受注決定方法又は商品の販売決定方法
JP6201253B1 (ja) 商標支援システム
JP5638675B1 (ja) 汎用的データフュージョンシステム及び汎用的データフュージョン方法
Kumar et al. A novel influence quantification model on Instagram using data science approach for targeted business advertising and better digital marketing outcomes
JP5793798B1 (ja) 商標支援システム
JP2016194885A (ja) 解析装置、解析方法及びプログラム
JP7247415B1 (ja) 情報処理装置、及び情報処理方法
KR20180106211A (ko) 불특정 다수로부터 패널 모집을 통한 리서치 진행 시스템 및 방법
KR102429532B1 (ko) 쿠폰을 이용한 공동 음식주문 장치 및 방법
JP7104219B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141022

R150 Certificate of patent or registration of utility model

Ref document number: 5638673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250