JP2017191517A - アンケートデータ精査装置及びそのプログラム - Google Patents

アンケートデータ精査装置及びそのプログラム Download PDF

Info

Publication number
JP2017191517A
JP2017191517A JP2016081507A JP2016081507A JP2017191517A JP 2017191517 A JP2017191517 A JP 2017191517A JP 2016081507 A JP2016081507 A JP 2016081507A JP 2016081507 A JP2016081507 A JP 2016081507A JP 2017191517 A JP2017191517 A JP 2017191517A
Authority
JP
Japan
Prior art keywords
data
answer data
answer
questionnaire
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016081507A
Other languages
English (en)
Other versions
JP6670159B2 (ja
Inventor
田中 英輝
Hideki Tanaka
英輝 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2016081507A priority Critical patent/JP6670159B2/ja
Publication of JP2017191517A publication Critical patent/JP2017191517A/ja
Application granted granted Critical
Publication of JP6670159B2 publication Critical patent/JP6670159B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去するアンケートデータ精査装置及びそのプログラムを提供する。【解決手段】本発明のアンケートデータ精査装置1は、精査対象のアンケートデータを構成する第1回答データ集合に対し、個々の回答者番号の回答データ系列毎に、指定次数の自己相関係数を算出し、予め設定された第1閾値を超える自己相関係数を1つ以上含む回答者番号の回答データ系列を、繰り返し回答データを持つ回答者番号の回答データ系列として検出する繰り返し回答データ検出部111と、検出した当該繰り返し回答データを持つ回答者番号の回答データ系列を第1回答データ集合から除去して第2回答データ集合を生成する第1除去部113と、を備える。本発明のプログラムは、コンピュータをアンケートデータ精査装置1として機能させる。【選択図】図1

Description

本発明は、インターネットなどで実施する多数の選択肢の質問からなる選択式のアンケートデータに対し、「不誠実回答者」の回答データを自動的に検出し除去するアンケートデータ精査装置及びそのプログラムに関する。
近年では、WEBが日常的に使われるようになり、WEB上で募集したユーザを対象にしたアンケート調査が頻繁に行われるようになっている。典型的には調査会社に登録した登録者が回答するなどのアンケート調査があるが、面接によるアンケートと異なり、WEB上でのアンケートでは、不正な回答が多数紛れ込むことがある。
一般に、アンケート調査における不正な回答として2種類がある。第1の不正な回答は、なりすましによる回答である。例えば一人の回答者が何人もの回答者になりすまして、同一商品のアンケートに何度も答える不正である。なりすましによる不正な回答の検出には多数の技法が知られている(例えば、特許文献1,2参照)。
第2の不正な回答は、アンケート調査における質問を十分読まずに不誠実に回答する者による回答である。本願明細書中、なりすましによる回答とは区別するために、「不誠実回答」と称し、このような不誠実回答の回答者を「不誠実回答者」と称している。
不誠実回答の存在によって集計データの品質が低下する問題は、調査会社も把握しており、幾つかの対策が講じられている(例えば、非特許文献1参照)。
非特許文献1によれば、極端に回答時間の短い回答者を或る程度自動で検出するようにしている。しかしながら、基本的にはアンケートデータの精査者の目視による確認で不誠実回答を除去する目視作業が中心となっている。
また、不誠実回答の自動検出に関する技法として、回答が一致するはずの質問を予め複数用意しておきその一致を確認することや、予め回答として数値範囲が定まっている質問を用意しておき、その適合性を確認するなどの技法が知られている(例えば、特許文献3参照)。
特開2015−92335号公報 特開2008−197931号公報 特開2011−248436号公報
NTTコム リサーチ、"回答結果の品質向上の取り組み"、[online], NTTコム オンライン・マーケッティング・ソリューション株式会社、[平成28年3月14日検索]、インターネット<URL: http://research.nttcoms.com/service/qpolicy4.html>
上述したように、不誠実回答の存在によってアンケートデータにおける集計品質が低下してしまう。
このため、インターネットなどで実施する多数の選択肢の質問からなる選択式のアンケートデータに対し、「不誠実回答者」の回答データを自動的に検出し除去して、精査者の目視作業を不要とするか、又は軽減させる技法が望まれる。
このような不誠実回答の自動検出に関する技法として、特許文献3の技法では、回答が一致するはずの質問を予め複数用意しておきその一致を確認することや、予め回答として数値範囲が定まっている質問を用意しておき、その適合性を確認することが提案されている。しかしながら、依然として、同一の選択肢(回答データ)のみのパターンや特定の選択肢(回答データ)の繰り返しパターンなどの不誠実回答を自動検出することができず、改善の余地がある。
本発明の目的は、上述の問題に鑑みて、多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去するアンケートデータ精査装置及びそのプログラムを提供することにある。
本発明のアンケートデータ精査装置は、多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去するアンケートデータ精査装置であって、回答者番号で識別可能とする複数の回答者の各々に対応してn個の回答データからなる回答データ系列を持ち精査対象のアンケートデータを構成する第1回答データ集合に対し、個々の回答者番号の回答データ系列毎に、次数1から予め設定された次数k(n−1≧k ≧1)までk個の自己相関係数を算出し、予め設定された第1閾値を超える自己相関係数を1つ以上含む回答者番号の回答データ系列を、繰り返し回答データを持つ回答者番号の回答データ系列として検出する繰り返し回答データ検出手段と、前記繰り返し回答データ検出手段により検出した当該繰り返し回答データを持つ回答者番号の回答データ系列を前記第1回答データ集合から除去して第2回答データ集合を生成する第1除去手段と、を備えることを特徴とする。
また、本発明のアンケートデータ精査装置において、前記繰り返し回答データ検出手段は、同一回答データのみからなるn個の回答データからなる回答者番号の回答データ系列の検出を含むことを特徴とする。
また、本発明のアンケートデータ精査装置において、予め設定された代表値算出法により、前記第2回答データ集合における質問毎の代表的な回答データを代表値として算出する代表値算出手段と、前記第2回答データ集合に対し、前記代表値による回答データ系列と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データを含む回答者番号の回答データ系列を、ずれ回答データを持つ回答者番号の回答データ系列として検出するずれ回答データ検出手段と、前記ずれ回答データ検出手段により検出した当該ずれ回答データを持つ回答者番号の回答データ系列を前記第2回答データ集合から除去して第3回答データ集合を生成する第2除去手段と、を更に備えることを特徴とする。
また、本発明のアンケートデータ精査装置において、前記代表値算出手段は、前記代表値算出法として、前記第2回答データ集合における質問毎の全ての回答データを対象とした最頻値、中間値、及び平均値のいずれかの算出法により前記代表値を算出することを特徴とする。
また、本発明のアンケートデータ精査装置において、前記ずれ回答データ検出手段は、前記代表値を用いた所定の平均二乗距離演算又は所定の積率相関係数演算により、当該ずれ回答データを持つ回答者番号の回答データ系列を検出することを特徴とする。
更に、本発明のプログラムは、コンピュータを、本発明のアンケートデータ精査装置として機能させるためのプログラムとして構成される。
本発明によれば、多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去することができる。特に、同一の回答データのみのパターンや特定の回答データの繰り返しパターンなどの不誠実回答、更には代表的な回答データ(代表値)からずれた不誠実回答者の回答データを自動的に検出し取り除くことができる。これにより、アンケートデータの信頼性を高めることができ、そのアンケートデータの集計品質を向上させることができる。
本発明による一実施形態のアンケートデータ精査装置の概略構成を示すブロック図である。 本発明による一実施形態のアンケートデータ精査装置に係る精査対象の回答データ集合の一例を示す図である。 本発明による一実施形態のアンケートデータ精査装置の動作を示すフローチャートである。 本発明による一実施形態のアンケートデータ精査装置に係る代表的な回答データ(代表値)に基づくずれ回答データの検出処理に用いる積率相関係数演算の一例を示す説明図である。
以下、図面を参照して、本発明による一実施形態のアンケートデータ精査装置1及びそのプログラムについて説明する。
(装置構成)
図1は、本発明による一実施形態のアンケートデータ精査装置1の概略構成を示すブロック図である。本実施形態のアンケートデータ精査装置1は、制御部11及び記憶部12からなり、制御部11は、繰り返し回答データ検出部111、第1パラメータ設定部112、第1除去部113、代表値算出部114、第2パラメータ設定部115、ずれ回答データ検出部116、第2パラメータ設定部117、及び第2除去部118を備える。
アンケートデータ精査装置1は、コンピュータとして機能させることができ、当該コンピュータに、制御部11の各構成要素を実現させるためのプログラムは、当該コンピュータのメモリに記憶される。当該コンピュータに備えられる中央演算処理装置(CPU)などの制御で、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、当該メモリから読み込んで各構成要素の機能を当該コンピュータに実現させることができる。ここで、記憶部12は、当該メモリの一部の領域で構成することができる。記憶部12は、一時記憶し読み書き可能なメモリを想定している。
本実施形態のアンケートデータ精査装置1は、多数の選択肢の質問からなる選択式のアンケートデータを入力し、そのアンケートデータから不誠実回答者の回答データを自動的に検出し除去する装置である。
選択式のアンケートデータは、図2に例示するように、回答者番号と各質問に対する数字の選択肢の列からなるよう配列することができる。実際の質問や回答が質問番号や数字回答でなくとも、数字に変換したものを予め用意しておくことで、図2に示すような形式にすることができる。一般に、インターネットなどで実施するアンケートでは、実際の質問や回答を数字に自動変換するアプリケーションが利用され、予め集計容易とするよう実際の質問や回答は当該アプリケーションに適合するものとなっている。
そこで、本実施形態のアンケートデータ精査装置1は、入力する精査対象のアンケートデータとして、図2に例示するように、回答者番号で識別可能とする複数の回答者の各々に対応してn個の回答データからなる回答データ系列で構成される「第1回答データ集合」を入力し、制御部11の機能により記憶部12へ一時記憶する。
「第1回答データ集合」は、図2に例示する形式に従う最初のアンケートデータである。n個の質問があり、各回答者はn個の回答を行ったものとする。即ち、一人の回答者(1つの回答者番号)に対してk(n-1≧k ≧1)個の自己相関係数が得られる。よく知られているように、“1,1,1,1,…”など同一選択肢のみからなる回答(図2に例示する“回答者1”)、“1,2,1,2,1,2,…”などの繰り返しパターンの回答(図2に例示する“回答者2”)は、不誠実回答の典型例である。この“1,2,1,2,1,2,…”という繰り返しパターンは右に2つシフトすると元の回答と一致するため周期2の繰り返しパターンである。“1,1,1,1,…”のような同一番号の選択肢(同一の回答データ)の繰り返しは右に1つシフトすると元の回答と一致するため周期1の繰り返しパターンである。よって本願明細書中、同一の回答データのみのパターンや特定の周期を持つ繰り返しの回答データを総括して、「繰り返し回答データ」と称する。
一般に、「繰り返し回答データ」の繰り返しパターンは単純ではなく、複数の組み合わせの場合や、冒頭の一部は誠実な回答であるが、その後、不誠実回答となる繰り返しパターンに転ずる場合などもある。このような場合でも、本実施形態のアンケートデータ精査装置1は、その「繰り返し回答データ」を持つ不誠実回答者の回答データ系列を検出し精査対象のアンケートデータから除去する。
また、本実施形態のアンケートデータ精査装置1は、それぞれの質問の代表的な回答データ(本願明細書中、「代表値」とも称する)と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データ(本願明細書中、「ずれ回答データ」と称する)の回答者は不誠実回答者として検出し、その不誠実回答者の回答データ系列(全ての回答データ)を精査対象のアンケートデータから除去する。
特に、WEBのアンケート調査の利点は多人数調査である。即ち、各質問の回答データは多数得られるため、質問毎の全ての回答データを対象としたモード(最頻値)、メディアン(中間値)、及び平均値などの代表値は信頼することができる。このため、本実施形態のアンケートデータ精査装置1は、この代表値に比して第2閾値で相関性が有るとして定義される範囲からずれた回答データを持つ回答者は不誠実回答を行っている可能性が高いため、これをアンケートデータから除去する。
より具体的に、制御部17の構成要素について説明する。尚、制御部11は、入力される精査対象の「第1回答データ集合」に対し不誠実回答の回答データを検出し除去する際に、適宜、記憶部12へ一時記憶し、読み出すことができる。
繰り返し回答データ検出部111は、精査対象の「第1回答データ集合」を入力し、第1パラメータ設定部112から設定された指定次数kと第1閾値を示す第1パラメータに基づいて、当該「第1回答データ集合」における各回答者番号のn個の回答データに対し次数1から予め決められた次数kまでの自己相関係数を算出する。即ち、一人の回答者(1つの回答者番号)に対してk個の自己相関係数が得られる。そこで、繰り返し回答データ検出部111は、自己相関係数の演算により、全ての回答者の回答データに対してk個の自己相関係数を算出し、1つでも第1閾値を超える自己相関係数を含む回答者番号の回答データ系列を、周期性の高いパターンを表わす「繰り返し回答データ」を持つ回答データ系列として検出し、不誠実回答者の回答者番号として第1除去部113へ通知する。
第1パラメータ設定部112は、指定次数k及び第1閾値を示す第1パラメータについて繰り返し回答データ検出部111に設定する。第1パラメータ設定部112は、指定次数k及び第1閾値に関して操作者により外部入力可能となっている。
第1除去部113は、精査対象の「第1回答データ集合」を入力し、繰り返し回答データ検出部111から通知された不誠実回答者の回答者番号を基に、当該不誠実回答者の回答者番号に対応する回答データ系列(全回答データ)を「第1回答データ集合」から除去して「第2回答データ集合」を生成する。「第2回答データ集合」は記憶部12へ一時記憶され、代表値算出部114及び第2除去部117へ入力可能となっている。
これにより、本実施形態のアンケートデータ精査装置1は、その「繰り返し回答データ」を持つ不誠実回答を検出し精査対象のアンケートデータから除去した「第2回答データ集合」を得ることができる。
代表値算出部114は、「第2回答データ集合」を入力し、第2パラメータ設定部112から設定された質問毎の代表的な回答データ(代表値)の代表値算出法として、質問毎の全ての回答データを対象としたモード(最頻値)、メディアン(中間値)、及び平均値のうちいずれの算出法を用いるかを示す第2パラメータに基づいて、当該「第2回答データ集合」における質問毎の代表的な回答データを代表値として算出し、「第2回答データ集合」及びその質問毎の代表値をずれ回答データ検出部116へ出力する。
第2パラメータ設定部115は、それぞれの質問の代表的な回答データ(代表値)の代表値算出法として、質問毎の全ての回答データを対象としたモード(最頻値)、メディアン(中間値)、及び平均値のうちいずれの算出法を用いるかを示す第2パラメータについて代表値算出部114に設定する。第2パラメータ設定部115は、代表値算出法の選択に関して操作者により外部入力可能となっている。
ずれ回答データ検出部116は、代表値算出部114から「第2回答データ集合」及びその質問毎の代表値を入力し、第3パラメータ設定部117から設定された平均二乗距離演算と積率相関係数演算のうちいずれの演算処理を用いるかを示す選択情報及び第2閾値を示す第3パラメータに基づいて、対応する演算方式に従うずれ回答データの検出処理を実行する。そして、ずれ回答データ検出部116は、代表値による回答データ系列と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データを含む回答者番号の回答データ系列を、ずれ回答データを持つ回答者番号の回答データ系列として検出し、その回答者番号は不誠実回答者の番号として第2除去部118へ通知する。
第3パラメータ設定部117は、平均二乗距離演算と積率相関係数演算のうちいずれの演算処理を用いるかを示す選択情報及び第2閾値を示す第3パラメータについて、ずれ回答データ検出部116に設定する。第3パラメータ設定部117は、平均二乗距離演算と積率相関係数演算のうちいずれの演算処理を用いるかを示す選択情報及び第2閾値に関して操作者により外部入力可能となっている。
第2除去部118は、「第2回答データ集合」を入力し、ずれ回答データ検出部116から通知された不誠実回答者の回答者番号を基に、当該不誠実回答者の回答者番号に対応する回答データ系列(全回答データ)を「第2回答データ集合」から除去して「第3回答データ集合」を生成する。「第3回答データ集合」は記憶部12へ一時記憶され、外部へ出力可能となっている。
(装置動作)
以下、より具体的に、図3及び図4を参照しながら、本実施形態のアンケートデータ精査装置1の動作について説明する。図3は、本実施形態のアンケートデータ精査装置1の動作を示すフローチャートである。また、図4は、それぞれ本実施形態のアンケートデータ精査装置1に係る代表値に基づくずれ回答データの検出処理に用いる積率相関係数演算の一例を示す説明図である。
図3を参照するに、まず、操作者の操作により、精査対象のアンケートデータ(第1回答データ集合)がアンケートデータ精査装置1へ入力される(ステップS1)。
続いて、アンケートデータ精査装置1は、繰り返し回答データ検出部111により、第1パラメータ設定部112から設定された指定次数kと第1閾値を示す第1パラメータに基づいて、当該「第1回答データ集合」における各回答者番号のn個の回答データに対し次数1から予め決められた次数kまでの自己相関係数を算出する。これにより、繰り返し回答データ検出部111は、「第1回答データ集合」における繰り返し回答データの検出を行ない、その繰り返し回答データを持つ不誠実回答者の回答者番号を検出する(ステップS2)。
より具体的には、繰り返し回答データ検出部111は、全ての回答者の回答データに対して次数1から予め決められた次数k(n-1≧k ≧1)までk個の自己相関係数を算出し、予め設定された第1閾値を超える自己相関係数を1つ以上含む回答者番号の回答データ系列を、繰り返し回答データを持つ回答データ系列として検出する。即ち、1つでも第1閾値を超える自己相関係数を含む回答データ系列の回答者番号は、「繰り返し回答データ」を持つ不誠実回答者の回答データ系列として判定する。
例えば、或る回答者番号のn個の回答データ系列(x,…,x)に対するk次の自己相関係数rは式(1)で与えられ、−1から1までの値を取る。周期がmであればm次の相関係数が1となり反対(負)の相関があれば−1となる。
繰り返し回答データ検出部111は、或る回答者番号における全ての回答データxが当該(x,…,x)の平均値と一致する場合、式(1)の計算を行わず、周期1の「繰り返し回答データ」として検出し、不誠実回答者の回答者番号として判定する。
回答データxが当該(x,…,x)のうち平均値と異なる値が1つでもあれば、繰り返し回答データ検出部111は、式(1)に基づいて得られるk個の自己相関係数を計算することができる。これらの自己相関係数の中で、1つでも第1閾値より大きな自己相関係数があれば「繰り返し回答データ」として判定し、その「繰り返し回答データ」を持つ回答者番号は不誠実回答者の番号として検出する。例えば第1閾値を1に近い値(例えば、0.8以上1以下)とすると、周期性の高いパターンを持つ「繰り返し回答データ」を検出することができる。
このようにして、繰り返し回答データ検出部111は、全ての回答者に対してk個の自己相関係数を算出し、式(1)にて1つでも第1閾値を超える自己相関係数を含む回答データ系列を持つ回答者番号を、「繰り返し回答データ」を持つ不誠実回答者の回答者番号として検出する。
続いて、アンケートデータ精査装置1は、第1除去部113により、繰り返し回答データ検出部111から通知された不誠実回答者の回答者番号を基に、当該不誠実回答者の回答者番号に対応する回答データ系列(全回答データ)を「第1回答データ集合」から除去することにより、「第2回答データ集合」を生成する(ステップS3)。
続いて、アンケートデータ精査装置1は、代表値算出部114により、第2パラメータ設定部112から設定された質問毎の全ての回答データを対象としたモード(最頻値)、メディアン(中間値)、及び平均値のうちいずれの代表値を用いるかを示す第2パラメータに基づいて、当該「第2回答データ集合」における質問毎の代表的な回答データを代表値として算出する(ステップS4)。
モード(最頻値)では、全回答数のうち最も頻度の高い回答データを代表値とする。
また、メディアン(中間値)では、全回答数を対象に集計したとき、下限の回答データから(或いは上限の回答データから)累積し全回答数の半値に相当する値を代表値とする。
また、平均値では、全回答数の平均値を代表値とする。
尚、上述の説明では、その理解を高めるために意図的に、モード(最頻値)、メディアン(中間値)、及び平均値による代表値算出法によって異なる代表値を持ちうることを意図して説明したが、同じ値を持つこともあることは勿論である。また、各代表値は、必ずしも整数で扱う必要はない。
いずれの代表値算出法を用いるかは、概ね質問内容によって予め想定されるために、本実施形態のアンケートデータ精査装置1では、第2パラメータ設定部115によって操作者が、全ての質問に対して共通に、代表値算出法を選択設定できるようにしている。
続いて、アンケートデータ精査装置1は、ずれ回答データ検出部116により、「第2回答データ集合」に対し、代表値による回答データ系列と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データを含む回答者番号の回答データ系列を、ずれ回答データを持つ回答者番号の回答データ系列として検出する(ステップS5)。
尚、本実施形態のアンケートデータ精査装置1では、ずれ回答データ検出部116におけるずれ回答データの検出処理として、第3パラメータ設定部117によって操作者が、平均二乗距離演算と積率相関係数演算のうち一方を選択設定できるようにしている。
まず、或る回答者番号の平均二乗距離とは、式(2)で表される数値eである。
ここで、xは、或る回答者番号のn個の回答データ系列(x,…,x)における各回答データであり、yは、代表値の回答データ系列(y,…,y)における当該回答データxと対応する代表値である。
平均二乗距離演算とする場合、ずれ回答データ検出部116は、式(2)の数値eを、第2閾値を超える回答者を不誠実回答者と判定する。
一方、積率相関係数演算とする場合、ずれ回答データ検出部116は、式(3)で示される積率相関係数rxyを算出する。具体的には、或る回答者番号のn個の回答データ系列(x,…,x)と、代表値の回答データ系列(y,…,y)との間の積率相関係数rxyは、式(2)で与えられ、−1から1までの値を取る。特に、積率相関係数の演算対象となる2つの回答データ系列が正の定数倍の関係であれば1を、負の定数倍の関係にあれば−1をとり、0は相関がないことを示す。ただし、代表値の回答データ系列(y,…,y)の全ての値がその(y,…,y)の平均値に等しい場合は、式(2)に示す平均二乗距離の計算のみ選択できる。
そして、ずれ回答データ検出部116は、「第2回答データ集合」における全ての回答者番号の回答データ系列について、代表値の回答データ系列との積率相関係数rxyを算出し、第2閾値より小さい積率相関係数rxyとなる回答データ系列を持つ回答者番号を不誠実回答者の番号として検出する。例えば図4に示すように、第2閾値を0に近い値(例えば、−0.2以上0.2以下)とすると、代表値に対してほとんど無相関の回答データ系列を持つ不誠実回答者の番号を検出することができる。尚、不誠実回答者の番号を検出することは、誠実な回答者の回答者番号を検出することと同義であるから、第2閾値は検出対象に適応したものとする。即ち、ずれ回答データ検出部116が、代表値による回答データ系列と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データを検出するものであればよい。
続いて、アンケートデータ精査装置1は、第2除去部118により、ずれ回答データ検出部116によって検出した不誠実回答者の回答者番号を基に、当該不誠実回答者の回答者番号に対応する回答データ系列(全回答データ)を「第2回答データ集合」から除去して「第3回答データ集合」を生成する(ステップS6)。「第3回答データ集合」は記憶部12へ一時記憶され、外部へ出力可能となっている。
以上のように、本実施形態のアンケートデータ精査装置1によれば、多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去することができる。
特に、同一選択肢のみのパターンや特定の選択肢の繰り返しパターンなどの不誠実回答、更には代表的な回答データ(代表値)からずれた不誠実回答を自動的に検出し取り除くことができる。これにより、アンケートデータの信頼性を高めることができ、そのアンケートデータの集計品質を向上させることができる。
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施形態では、第1乃至第3パラメータに関して操作者によって選択設定されるとして説明したが、予め設定されているものとしてもよい。また、第1乃至第3パラメータに関して操作者によって選択設定された特定パラメータで、「第1回答データ集合」から「第2回答データ集合」を経て「第3回答データ集合」を得る例を説明したが、このとき、第1乃至第3パラメータに関して異なるものを選択設定して得た「第3回答データ集合」と比較して、共通に残っている回答者番号の回答データを最も信頼できる回答データとして利用するなどの応用も可能である。
本発明によれば、多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去することができるので、アンケートデータの集計品質を向上させる用途に有用である。
1 アンケートデータ精査装置
11 制御部
12 記憶部
111 繰り返し回答データ検出部
112 第1パラメータ設定部
113 第1除去部
114 代表値算出部
115 第2パラメータ設定部
116 ずれ回答データ検出部
117 第2パラメータ設定部
118 第2除去部

Claims (6)

  1. 多数の選択肢の質問からなる選択式のアンケートデータに対し、不誠実回答者の回答データを自動的に検出し除去するアンケートデータ精査装置であって、
    回答者番号で識別可能とする複数の回答者の各々に対応してn個の回答データからなる回答データ系列を持ち精査対象のアンケートデータを構成する第1回答データ集合に対し、個々の回答者番号の回答データ系列毎に、次数1から予め設定された次数k(n-1≧k ≧1)までk個の自己相関係数を算出し、予め設定された第1閾値を超える自己相関係数を1つ以上含む回答者番号の回答データ系列を、繰り返し回答データを持つ回答者番号の回答データ系列として検出する繰り返し回答データ検出手段と、
    前記繰り返し回答データ検出手段により検出した当該繰り返し回答データを持つ回答者番号の回答データ系列を前記第1回答データ集合から除去して第2回答データ集合を生成する第1除去手段と、
    を備えることを特徴とするアンケートデータ精査装置。
  2. 前記繰り返し回答データ検出手段は、同一回答データのみからなるn個の回答データからなる回答者番号の回答データ系列の検出を含むことを特徴とする、請求項1に記載のアンケートデータ精査装置。
  3. 予め設定された代表値算出法により、前記第2回答データ集合における質問毎の代表的な回答データを代表値として算出する代表値算出手段と、
    前記第2回答データ集合に対し、前記代表値による回答データ系列と比較して第2閾値で相関性が有るとして定義される範囲からずれた回答データを含む回答者番号の回答データ系列を、ずれ回答データを持つ回答者番号の回答データ系列として検出するずれ回答データ検出手段と、
    前記ずれ回答データ検出手段により検出した当該ずれ回答データを持つ回答者番号の回答データ系列を前記第2回答データ集合から除去して第3回答データ集合を生成する第2除去手段と、
    を更に備えることを特徴とする、請求項1又は2に記載のアンケートデータ精査装置。
  4. 前記代表値算出手段は、前記代表値算出法として、前記第2回答データ集合における質問毎の全ての回答データを対象とした最頻値、中間値、及び平均値のいずれかの算出法により前記代表値を算出することを特徴とする、請求項3に記載のアンケートデータ精査装置。
  5. 前記ずれ回答データ検出手段は、前記代表値を用いた所定の平均二乗距離演算又は所定の積率相関係数演算により、当該ずれ回答データを持つ回答者番号の回答データ系列を検出することを特徴とする、請求項3又は4に記載のアンケートデータ精査装置。
  6. コンピュータを、請求項1から5のいずれか一項に記載のアンケートデータ精査装置として機能させるためのプログラム。
JP2016081507A 2016-04-14 2016-04-14 アンケートデータ精査装置及びそのプログラム Expired - Fee Related JP6670159B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016081507A JP6670159B2 (ja) 2016-04-14 2016-04-14 アンケートデータ精査装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016081507A JP6670159B2 (ja) 2016-04-14 2016-04-14 アンケートデータ精査装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2017191517A true JP2017191517A (ja) 2017-10-19
JP6670159B2 JP6670159B2 (ja) 2020-03-18

Family

ID=60085988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016081507A Expired - Fee Related JP6670159B2 (ja) 2016-04-14 2016-04-14 アンケートデータ精査装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP6670159B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021068175A (ja) * 2019-10-23 2021-04-30 Kddi株式会社 特性調査方法間での因子スコアの相違に基づく対象特性情報決定プログラム、装置及び方法
JPWO2020079874A1 (ja) * 2018-10-18 2021-09-09 住友電気工業株式会社 検知装置、ゲートウェイ装置、検知方法および検知プログラム
JP2022062249A (ja) * 2018-02-23 2022-04-19 株式会社リンクアンドモチベーション アンケート処理装置、アンケート処理方法、およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279057A (ja) * 2001-03-22 2002-09-27 Ntt Data Corp セキュリティマネジメント装置
JP2002342531A (ja) * 2001-05-15 2002-11-29 Uto Akihiko 通信端末を用いてのアンケート調査における信憑性疑問回答の自動除去方法及びシステム
JP2004280482A (ja) * 2003-03-17 2004-10-07 Toshiba Corp データ収集方法及びプログラム並びにシステム
JP2014063408A (ja) * 2012-09-24 2014-04-10 Yahoo Japan Corp 生活圏判定装置、生活圏判定方法及び生活圏判定プログラム
JP2015114971A (ja) * 2013-12-13 2015-06-22 株式会社ビデオリサーチ 回答良否判断装置及び回答良否判断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279057A (ja) * 2001-03-22 2002-09-27 Ntt Data Corp セキュリティマネジメント装置
JP2002342531A (ja) * 2001-05-15 2002-11-29 Uto Akihiko 通信端末を用いてのアンケート調査における信憑性疑問回答の自動除去方法及びシステム
JP2004280482A (ja) * 2003-03-17 2004-10-07 Toshiba Corp データ収集方法及びプログラム並びにシステム
JP2014063408A (ja) * 2012-09-24 2014-04-10 Yahoo Japan Corp 生活圏判定装置、生活圏判定方法及び生活圏判定プログラム
JP2015114971A (ja) * 2013-12-13 2015-06-22 株式会社ビデオリサーチ 回答良否判断装置及び回答良否判断方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022062249A (ja) * 2018-02-23 2022-04-19 株式会社リンクアンドモチベーション アンケート処理装置、アンケート処理方法、およびプログラム
JP7245372B2 (ja) 2018-02-23 2023-03-23 株式会社リンクアンドモチベーション アンケート処理装置、アンケート処理方法、およびプログラム
JPWO2020079874A1 (ja) * 2018-10-18 2021-09-09 住友電気工業株式会社 検知装置、ゲートウェイ装置、検知方法および検知プログラム
JP2021068175A (ja) * 2019-10-23 2021-04-30 Kddi株式会社 特性調査方法間での因子スコアの相違に基づく対象特性情報決定プログラム、装置及び方法
JP7141382B2 (ja) 2019-10-23 2022-09-22 Kddi株式会社 特性調査方法間での因子スコアの相違に基づく対象特性情報決定プログラム、装置及び方法

Also Published As

Publication number Publication date
JP6670159B2 (ja) 2020-03-18

Similar Documents

Publication Publication Date Title
Dupuis et al. Detecting computer-generated random responding in questionnaire-based data: A comparison of seven indices
Curran Methods for the detection of carelessly invalid responses in survey data
Lai et al. Impact of regime type on the influence of US foreign aid
Stensrud et al. Human performance estimating with analogy and regression models: an empirical validation
Meschi et al. Too big to learn: The effects of major acquisition failures on subsequent acquisition divestment
Murray et al. Empirical evaluation of the anchoring vignette approach in health surveys
Finch A comparison of factor rotation methods for dichotomous data
Bradley et al. Rating Scales in Survey Research: Using the Rasch model to illustrate the middle category measurement flaw
Hong et al. Robust maximum marginal likelihood (RMML) estimation for item response theory models
JP2017191517A (ja) アンケートデータ精査装置及びそのプログラム
Partap A review of service quality assessment of library and information centres
Wu Some IRT-based analyses for interpreting rater effects
JP2015064666A (ja) アンケート分析システムおよびそのプログラム
Gómez-Benito et al. Efficacy of effect size measures in logistic regression: An application for detecting DIF
Sengul Avsar et al. Examination of Polytomous Items' Psychometric Properties According to Nonparametric Item Response Theory Models in Different Test Conditions.
Walker et al. Beyond percent correct: Measuring change in individual picture naming ability
Li et al. Applying time-series analysis to detect scale drift
JP5733799B2 (ja) プロファイリングシステム、プロファイリング方法およびプログラム
JP2011233044A (ja) 主観評価のための装置、方法およびプログラム
Waltenburg et al. Exploratory data analysis: a primer for undergraduates
Matthews et al. Methods for inferring health-related social networks among coworkers from online communication patterns
JP2007102668A (ja) 統計比較処理装置
Guo et al. Evaluation of different scoring rules for a noncognitive test in development
Akbarzade Khorshidi et al. Optimising service quality translating via quantitative quality function deployment
Elsworth Confronting the biases in connoisseur review and performance indicators in higher education: A structural modelling approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200228

R150 Certificate of patent or registration of utility model

Ref document number: 6670159

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees