JPWO2018047251A1 - データ分析システム、データ分析端末、及び、データ分析方法 - Google Patents

データ分析システム、データ分析端末、及び、データ分析方法 Download PDF

Info

Publication number
JPWO2018047251A1
JPWO2018047251A1 JP2018537917A JP2018537917A JPWO2018047251A1 JP WO2018047251 A1 JPWO2018047251 A1 JP WO2018047251A1 JP 2018537917 A JP2018537917 A JP 2018537917A JP 2018537917 A JP2018537917 A JP 2018537917A JP WO2018047251 A1 JPWO2018047251 A1 JP WO2018047251A1
Authority
JP
Japan
Prior art keywords
data
information
sample
recipe
measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018537917A
Other languages
English (en)
Inventor
恵木 正史
正史 恵木
卓成 桂
卓成 桂
大輔 福井
大輔 福井
美奈 吉村
美奈 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi High Tech Corp
Original Assignee
Hitachi High Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi High Technologies Corp filed Critical Hitachi High Technologies Corp
Publication of JPWO2018047251A1 publication Critical patent/JPWO2018047251A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)

Abstract

標本に関する項目毎の測定データを含む測定情報の項目に基づいて、項目の組み合わせの異なる複数のレシピ情報を生成し、測定データに対して各レシピ情報を適用し、各レシピ情報に対応する標本データを生成し、標本データに適用する統計検定手法を当該標本データの構成に基づいて決定し、標本データに対してその決定した統計検定手法を適用し、その標本データの生成に用いられたレシピ情報に関する統計的有意性を示す検定スコアを算出し、その算出した検定スコアと当該検定スコアに関するレシピ情報とを対応付けて表示するデータ分析方法。

Description

本発明は、概して、データの分析に関する。
様々なセンシングデバイスを用いて様々な情報を測定及び収集し、その収集したビッグデータを業務に活用する動きが活発化している。近年、脳や身体の変化もその測定の対象に含まれつつある。自動車業界及び電機業界では、人々の脳を測定して感性に関する情報を抽出し、乗り心地や爽快感などといった感性に訴える商品を開発することが進められている。ライフサイエンス及び臨床医学分野では、様々なウェアラブルセンサやバイオセンサを用いて人々を測定及び分析することにより、疾病の発生リスクを軽減する取り組みが進められている。
特許文献1には、データの属性(カラム)の組み合せを全探索しながら、属性間の共起関係を検定し、統計的に有意な共起関係を自動抽出することが開示されている。非特許文献1のツールは、有意差検定に関する多数の統計的手法を提供する。ユーザは、ツールに仮説を明示的に設定し、その仮説の統計的有意性を検定する。
特開2001−265596号公報
IBM、SPSS Statistics Base、インターネット<http://www-03.ibm.com/software/products/ja/spss-stats-base>
従来、ユーザ(分析者)は、測定データに対して、知識と経験に基づいて仮説を1つ1つ作成及び検定する。しかし、仮説候補の数は膨大であるため、妥当な結論を得るまで多数の試行錯誤が必要である。また、仮説の統計的有意性を正しく評価するためには、多数の統計手法の中から、仮説や標本データに応じて適切な統計手法を選択する必要がある。しかし、それぞれの統計手法を理解して適切に使いこなすことは容易ではないため、ユーザの知識と経験によって、結論に大きなバラツキが生じ得る。
そこで、本発明の目的は、ユーザが、効率的に仮説を作成したり、適切な統計手法を選択したりすることを支援することにある。
一実施例に係るデータ分析システムは、プロセッサ及びメモリを有する。
メモリには、標本に関する項目毎の測定データを含む測定情報が格納されている。
プロセッサは、
メモリから取得した測定情報の項目に基づいて、項目の組み合わせの異なる複数のレシピ情報を生成するレシピ生成処理と、
測定データに対して各レシピ情報を適用し、各レシピ情報に対応する標本データを生成する標本データ生成処理と、
標本データに適用する統計検定手法を、当該標本データの構成に基づいて決定する検定手法決定処理と、
標本データに対して検定手法決定処理によって決定された統計検定手法を適用し、標本データの生成に用いられたレシピ情報に関する統計的有意性を示す検定スコアを算出する検定スコア算出処理と、
検定スコアと当該検定スコアに関するレシピ情報とを対応付けて表示する分析結果表示処理と、を実行する。
本発明によれば、ユーザが、効率的に仮説を作成したり、適切な統計手法を選択したりすることを支援することができる。
データ分析システムのハードウェア構成の例を示す。 データ分析システムの機能構成の例を示す。 測定部位とチャンネルIDとの関係を示す。 測定情報の例を示す。 標本情報の例を示す。 測定補足情報の例を示す。 レシピ生成条件を設定するためのGUI(Graphical User Interface)の例を示す。 レシピ生成部の処理の例を示すフローチャートである。 標本データ生成部の処理の例を示すフローチャートである。 レシピ情報の例を示す。 標本データの例を示す。 分析結果テーブルの例を示す。 加速度センサによる測定の例を示す。 マルチモーダルによる測定の例を示す。 マルチモーダルに係る標本情報の例を示す。
以下、実施例を説明する。以下の説明では、「aaaテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「aaaテーブル」を「aaa情報」と呼ぶことができる。
さらに、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いることがあるが、これらについてはお互いに置換が可能である。また、本実施例では、被験者が母集団からの標本である場合について説明する。従って、「標本」と「被験者」はお互いに置換が可能であり、同様に「標本識別子」と「被験者ID」もお互いに置換可能である。なお、本実施例では、標本が人である場合で説明するが、標本が、装置や店舗など、人でなくても良い。
また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び通信インターフェイスデバイスのうちの少なくとも1つを用いながら行うため、処理の主語が、プロセッサ、そのプロセッサを有する装置とされてもよい。プロセッサが行う処理の一部又は全部が、ハードウェア回路で行われてもよい。コンピュータプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア(例えば可搬型の記憶メディア)であってもよい。
図1は、データ分析システム10のハードウェア構成の例を示す。
データ分析システム10は、CPU12と、メモリ14と、ストレージ22と、入力I/F(Interface)16と、出力I/F18と、通信I/F20とを有する。これらの構成要素12〜22は、双方向通信可能なバス24に接続されている。
メモリ14には、データ及びプログラムが格納される。メモリ14の例は、DRAM(Dynamic Random Access Memory)、MRAM(Magnetoresistive Random Access Memory)、FeRAM(Ferroelectric Random Access Memory)、相変化メモリである。
ストレージ22には、データ及びプログラムが格納されてよい。ストレージ22の例は、HDD(Hard Disk Drive)、SSD(Solid State Drive)である。
CPU12は、メモリ14からプログラム及びデータを読み出して処理することにより、データ分析システム10の有する各種機能を実現する。
入力I/F16は、ユーザが、データ分析システム10に情報を入力するためのI/Fである。入力I/F16の例は、キーボード、マウス、及びマイク等である。
出力I/F18は、データ分析システム10が、ユーザに対して情報を出力するためのI/Fである。出力I/F18の例は、ディスプレイ、及びスピーカ等である。
データ分析システム10は、インターネット等の通信ネットワーク4を介して、データ分析端末30からデータ分析の要求を受領すると、その要求に基づいてデータ分析を実行し、その分析結果をデータ分析端末30に応答してもよい。データ分析端末は、データ分析システム10と同様、バス42に接続されているCPU31、メモリ34、入力I/F、出力I/F、及び通信I/F40を有してよい。
図2は、データ分析システム10の機能構成の例を示す。
データ分析システム10は、データとして、測定情報100、標本情報200、及び測定補足情報300を保持してよい。これらのデータの一部又は全部は、メモリ14及び/又はストレージ22に格納されてよい。測定情報100については後述する(図4参照)。標本情報200については後述する(図5参照)。測定補足情報300の詳細については後述する(図6参照)
データ分析システム10は、機能として、レシピ生成条件取得部44、レシピ生成部42、標本データ生成部46、検定手法決定部48、検定スコア算出部50、及び、分析結果表示部52を有してよい。これらの機能の一部又は全部は、メモリ14に格納されているプログラムがCPU12で実行されることによって実現されてよい。又は、これらの機能の一部又は全部は、所定の論理回路によって実現されてもよい。
レシピ生成条件受付部44は、ユーザからレシピ情報の生成に関する条件(「レシピ生成条件」という)400を受け付ける。レシピ生成条件受付部44は、ユーザからレシピ生成条件400を受け付けるためのGUI401(図7参照)を生成及び表示してよい。レシピ生成条件受付部44は、ストレージ22から、又は、通信ネットワーク4を介して、レシピ生成条件400を取得してもよい。
レシピ生成部42は、複数のレシピ情報500を生成する。レシピ生成部42は、測定情報100、標本情報200、および測定補足情報300に基づいて、レシピ情報を生成してよい。その際、レシピ生成部42は、レシピ生成条件400に適合する範囲内で、レシピ情報500を生成してよい。すなわち、レシピ生成部42は、レシピ生成条件400に適合しないレシピ情報500は作成しなくてよい。これにより、生成するレシピ情報500の数を削減することができる。レシピ生成部42の処理の詳細については後述する(図8参照)。
標本データ生成部46は、レシピ生成部42によって生成された複数のレシピ情報500を、それぞれ、測定情報100に適用して、複数の標本データ600を生成する。標本データ生成部46は、機能として、クレンジング部54と、特徴量算出部56とを有してよい。クレンジング部54は、測定情報100に含まれる測定データ110(図4参照)をクレンジングする。特徴量算出部56は、クレンジング部54によってクレンジングされた測定データ110を用いて特徴量を算出する。標本データ生成部46の処理の詳細については後述する(図8参照)。
検定手法決定部48は、標本データ生成部46によって生成された複数の標本データ600のそれぞれについて、その標本データ600の構成に基づき、その標本データ600に適用するに適切な統計検定手法を決定する。検定手法決定部48は、予め設定されている複数の統計検定手法の中から、適切な統計検定手法を選択してよい。
検定スコア算出部50は、複数の標本データ600のそれぞれに対して、検定手法決定部48によって決定された統計検定手法を適用し、その標本データ600を生成するために用いられたレシピ情報500に関する検定スコアを算出する。検定スコアは、レシピ情報500の統計的有意性を示す値である。
分析結果表示部52は、検定スコア算出部50によって算出された検定スコアと、その検定スコアに係るレシピ情報とを対応付けた分析結果を生成及び表示する。分析結果の表示例については後述する(図11参照)。
図3は、測定部位とチャンネルIDとの関係を示す。
本実施例では、被験者の脳の各部位の脳血流量を測定対象とする。例えば、図3に示すように、被験者の頭に脳活動計測装置50を装着し、その被験者の脳の各部位の脳血流量をチャンネルIDと対応付けて測定する。
図4は、測定情報100の例を示す。
測定情報100は、データ項目に対応する測定データを管理する。本実施例における測定情報100は、被験者がタスクを実行したときに、その被験者の脳の各部位から測定された値を有する。
図4の測定情報100は、データ項目として、被験者ID102、タスクID104、繰り返しID106、チャンネルID108、及び、測定データ110を有する。
被験者ID102は、被験者を識別するための情報である。
タスクID104は、タスクを識別するための情報である。
繰り返しID106は、繰り返しの何回目に実行されたタスクであるかを示す情報である。
チャンネルID108は、図3で説明したように、測定対象である脳の各部位を識別するための情報である。
測定データ110は、被験者ID102の被験者が、タスクID104のタスクを、繰り返しID106のときに実行した際に、チャンネルID108の示す部位において、所定の間隔で測定された値(時系列データ)である。
典型的には、各被験者が、同じように、2つ以上の対比対象のタスクを実行する。対比対象のタスクに対する有意差検定を行うためである。対比対象のタスクとは、例えば、ドリンクAを飲んだ場合とドリンクBを飲んだ場合や、自動車Aを運転した場合と自動車Bを運転した場合などである。
図5は、標本情報200の例を示す。
標本情報200は、標本の属性に関する情報を管理する。
図5の標本情報200は、データ項目として、被験者ID202、年齢204、性別206、嗜好208に関する「質問01〜質問10」の回答を有する。したがって、標本情報200の1つのレコードを参照することにより、被験者ID202の被験者の年齢204、性別206、及び嗜好208を認識することができる。
図6は、測定補足情報300の例を示す。
測定補足情報300は、測定情報に含まれる標本識別子を除く項目の属性に関する情報を管理する。図6は、図4のチャンネルID108が有する、複数の属性を表す。測定補足情報300は、複数のチャンネルIDをグルーピングする方式に関する情報を含む。
グループ方式α304は、複数のチャンネルIDから、3つのグループを形成する。グループ方式α304が選択されると、チャンネルID01〜06が前頭部左グループに、チャンネルID07〜16が前頭部中央グループに、チャンネルID17〜22が前頭部右グループにグルーピングされてよい。
グループ方式β306は、複数のチャンネルIDから、5つのグループを形成する。グループ方式β306が選択されると、チャンネルID01〜04が左BA46野付近グループに、チャンネルID05〜09が左BA10分野付近グループに、チャンネルID10〜13が前頭葉中央部グループに、チャンネルID14〜18が右BA10野付近グループに、チャンネルID19〜22が右BA46野付近グループにグルーピングされてよい。
グループ方式γ308は、複数のチャンネルIDから、7つのグループを形成する。グループ方式γ308が選択されると、チャンネルID01〜03が左下前頭回付近グループに、チャンネルID04〜06が左中前頭回付近グループに、チャンネルID07〜09が左上前頭回付近グループに、チャンネルID10〜13が上前頭回内側付近グループに、チャンネルID14〜16が右上前頭回付近グループに、チャンネルID17〜19が右中前頭回付近グループに、チャンネルID20〜22が右下前頭回付近グループにグルーピングされてよい。
図7は、レシピ生成条件を設定するためのGUIの例を示す。
GUI401は、レシピ生成条件受付部44によって生成及び表示される。
ユーザは、GUI401を介して、測定情報の項目402について、要因の候補とするか否か及び層別項目の候補とするか否かを設定できてよい。測定情報の項目402には、測定情報に関連するデータ項目が含まれてよい。本実施例において、測定情報の項目402には、測定情報100のタスクID104、繰り返しID106、チャンネルID108、測定補足情報300のグループ方式α304、β306、γ308が含まれてよい。
ユーザは、GUI401を介して、標本情報の項目404について、要因の候補とするか否か及び層別項目の候補とするか否かを設定できてよい。標本情報の項目404には、標本情報200に関連するデータ項目が含まれてよい。本実施例において、標本情報の項目404には、標本情報200の年齢204、性別206、嗜好208が含まれてよい。
ユーザは、GUI401を介して、クレンジング方法及びその強度406を設定できてよい。
ユーザは、GUI401を介して、各特徴量408について候補に含めるか否かを設定できてよい。
レシピ生成条件受付部44は、GUI401に設定された内容に基づいて生成されるレシピ情報の総数410を算出及び表示してよい。典型的には、総数410が多いほど、分析に要する処理時間は長くなる。これにより、ユーザは、適切な総数410となるように、設定内容を変更することができる。
図8aは、レシピ生成部42の処理の例を示すフローチャートである。
レシピ生成部42は、次の処理を実行する。
(S10)レシピ生成部42は、測定情報の項目402と標本情報の項目404から少なくとも1つの項目を要因として選択する。ここで要因として選択可能な項目は、図7のGUI401で要因の候補として設定されたものであってよい。
(S12)レシピ生成部42は、層別にするか否かを選択し、層別にする場合にはS14を実行し、層別にしない場合にはS30を実行する。
(S14)レシピ生成部42は、測定情報の項目402と標本情報の項目404から、(S10)で選択された要因を除いて、少なくとも1つの項目を層別項目として選択する。ここで層別項目として選択可能な項目は、図7のGUI401で層別項目の候補として設定されたものであってよい。
(S16)レシピ生成部42は、S14で決定した層別項目の値から、少なくとも1つの値を層として選択する。
(S20)レシピ生成部42は、クレンジング方法及び強度を選択する。ここで選択可能なクレンジング方法及び強度は、図7のGUI401のクレンジング方法及びその強度406として設定されたものであってよい。
(S22)レシピ生成部42は、特徴量を選択する。ここで選択可能な特徴量は、図7のGUI401の特徴量408で候補として選択されたものであってよい。
(S30)レシピ生成部42は、S10で選択された要因と、S12で層別にすると選択された場合にはS14で選択された層別項目とS16で選択された層と、S20で選択されたクレンジング方法と、S22で選択された特徴量算出方法とに基づいて、レシピ情報500を生成する。レシピ情報500については図9で説明する。
レシピ生成部42は、S10の要因の選択と、S12の層別にするか否かの選択と、S14の層別項目の選択と、S16の層の選択と、S20のクレンジング方法及び強度の選択と、S22の特徴量算出方法の選択とについて、選択の組み合わせを変えて、複数のレシピ情報を生成してよい。
このことからもわかるように、図7のGUI401において測定情報の項目402と標本情報の項目404に関する候補の数を増やすほど、生成すべきレシピ情報の数(仮説総数)も増える。
図9は、レシピ情報500の例を示す。
レシピ情報500は、測定データ110から、どのように標本データ600を作成するのかを示す情報を有する。すなわち、レシピ情報500の内容が異なると、異なる標本データ600が作成される。
レシピ情報500は、上記S10で選択された要因502と、S12で層別にすると選択された場合にはS14及びS16で選択された層504と、S20で選択されたクレンジング方法506と、S22で選択された特徴量算出方法508とを含んでよい。
図8bは、標本データ生成部46の処理の例を示すフローチャートである。標本データ生成部46は、レシピ生成部42によって生成された複数のレシピ情報500のそれぞれについて、次の処理を実行してよい。
(S40)標本データ生成部46は、レシピ情報500で層504が指定されていない場合(S12で層別にしないことを選択した場合)には全ての測定データ110を抽出し、あるいは、レシピ情報500で層504が指定されている場合には層504の条件に適合する測定データ110を抽出し、標本識別子(被験者ID)と、レシピ情報500の要因502で指定される項目の値の組み合わせに基づいて、それら抽出された測定データ110をグルーピングする。これにより、標本識別子と要因の値が異なる、複数のグループが形成される。
(S42)標本データ生成部46は、それらの形成された複数のグループのそれぞれについて、そのグループに属する測定データ110を、レシピ情報500のクレンジング方法506に設定されたクレンジング方法でクレンジングする。そして、標本データ生成部46は、複数のクレンジングされたグループのそれぞれについて、レシピ情報500の特徴量算出方法508で指定された方法で特徴量を算出する。
(S44)標本データ生成部46は、その算出されたグループの特徴量を用いて、標本データ600を生成する。標本データ600については図10で説明する。
図10は、標本データ600の例を示す。
標本データ600は、測定データ110から、レシピ情報500に基づいて生成されるデータである。図10の例の標本データ600は、レシピ情報500の要因502にタスクID104と性別206が設定されたレシピ情報500に基づいて生成されたものである。
図10の標本データ600は、要因数が「2」(つまり「タスクID」と「性別」)であり、各要因の標本数(タスクIDの男性の被験者数と女性の被験者数)がそろっていない。この場合、検定手法決定部48は、統計検定手法として、「標本数が異なる2要因ANOVA(analysis of variance)」が適合すると決定してよい。
統計検定手法としては、例えば、「対応のないt検定」、「対応のあるt検定」、「標本数が等しい1要因ANOVA」、「標本数が異なる1要因ANOVA」、「標本数が等しい2要因ANOVA」、「標本数が異なる2要因ANOVA」、「2要因とも対応のある2要因ANOVA」、「1要因に対応がなく、1要因に対応があり、標本数が等しい2要因ANOVA」、「1要因に対応がなく、1要因に対応があり、標本数が異なる2要因ANOVA」、「3要因とも対応がなく、標本数が等しい3要因ANOVA」、「3要因とも対応がなく、標本数が異なる3要因ANOVA」などがある。検定手法決定部48は、標本データ600の構造に基づいて、何れの統計検定手法が適合するかを決定してよい。
図11は、分析結果テーブル700の例を示す。
分析結果テーブル700には、1つのレシピ情報500によって生成された標本データ600に対する統計検定手法による統計検定の結果が、1つのレコードとして格納されてよい。各レコードは、異なる複数のレシピ情報500を表す。分析結果テーブル700は、データ項目として、要因702、層704、特徴量706、クレンジング方法708、及び、検定スコア710を有してよい。
要因702には、検定スコア710の算出に用いられた要因(レシピ情報500の要因502)が格納される。
層704には、検定スコア710の算出に用いられた層(レシピ情報500の層504)が格納される。
クレンジング方法706には、検定スコア710の算出に用いられたクレンジング方法(レシピ情報500のクレンジング方法506)が格納される。
特徴量算出方法708には、検定スコア710の算出に用いられた特徴量算出方法(レシピ情報500の特徴量算出方法508)が格納される。
検定スコア710には、要因702、層704、クレンジング方法706及び特徴量算出方法708に格納されている値を含むレシピ情報500から生成された標本データ600に対して、検定手法決定部48によって決定された統計検定手法に基づいて算出された有意差検定の結果(p値)が格納される。検定スコア710は、検定スコア算出部50によって算出されてよい。検定スコア710が小さいほど、層704に注目した場合、要因702の値の違いが、特徴量708の値に有意な差を生じさせる可能性が高い(つまり偶然に起こる可能性が低い)ことを示す。
例えば、図11の分析結果テーブル700の1行目のレコードは、前頭部中央(704)の脳活動に注目した場合、タスクID(702)の違いが、ノイズタイプA強度3でクレンジング(706)した脳血流量の平均値(708)に有意な差を生じさせる可能性が高い(つまり偶然に起こる可能性は「0.0002」である)(710)ことを示す。
すなわち、分析結果テーブル700の各レコードは、有意差検定における「仮説とその検定結果」と対応していると解釈してもよい。
分析結果表示部52は、分析結果テーブル700の内容を、ディスプレイに表示してよい。また、分析結果表示部52は、分析結果テーブル700のレコードを、検定スコア710の小さい順にソートして表示してもよい。このソートにより、ユーザは、統計的有意性の高い仮説を容易に知ることができる。
実施例1によれば、ユーザは、図7のようなGUI401を操作し、効率的に仮説を作成することができる。また、検定手法決定部48が標本データ600の構造に基づいて適切な統計検定手法を決定してくれるので、統計手法に精通していないユーザであっても分析を行うことができる。また、分析結果テーブル700を検定スコア710の小さい順にソートできるので、多数の仮説の中から統計的有意性の高い仮説を容易に知ることができる。
図12は、加速度センサによる測定の例を示す。
測定データは、実施例1のような脳の各部位の脳血流量に限られない。例えば、測定データは、図12のように、身体の各部位(手や足など)に装着された加速度センサによって測定された値であってもよい。
1つの加速度センサは、X軸、Y軸、Z軸の3つの値を測定可能であるとする。この場合、身体に1つの加速度センサ60aを装着したときのチャンネルIDの数は3個(X軸とY軸とZ軸の測定値)となり、身体に4つの加速度センサ60b、60c、60d、60eを装着したときのチャンネルIDの数は12個となる。
このように、各測定データを、各チャンネルIDと対応付けることにより、実施例1の場合と同じように、データ分析を行うことができる。
図13は、マルチモーダルの測定の例を示す。
マルチモーダルの測定とは、異なる種類のセンサでデータを同時に測定することをいう。例えば図13のように、1人の被験者の頭に脳活動計測装置50と加速度センサ60fを装着する。そして、脳血流量のデータと、加速度のデータとを同時に測定する。これにより、被験者の頭の加速度の変化と、その被験者の脳の各部位の脳血流量の変化との関連性も分析することができる。
図14は、マルチモーダルに係る標本情報220の例を示す。
マルチモーダルの場合、或る種類のデータを特徴量に変換して、標本情報200の項目として追加してもよい。例えば図14のように、図6の標本情報200に加速度センサの特徴量230のデータ項目を追加し、その特徴量の項目に、被験者IDの被験者から測定された加速度データを特徴量に変換した値を格納してもよい。図14の例では、加速度センサによる測定値を、小さい(S)、普通(M)、大きい(L)の3つの特徴量に変換している。このように、測定データがマルチモーダルの場合であっても、標本情報を拡張することにより、実施例1の場合と同じように、データ分析を行うことができる。
上述した実施例は、本発明の説明のための例示であり、本発明の範囲を実施例にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
例えば、データ分析端末30のメモリ34に測定情報100と標本情報200が格納されており、データ分析端末30(のCPU32)が、そのメモリ34に格納されている測定情報100と標本情報200をデータ分析システム10に送信して、データ分析を依頼してもよい。データ分析システム10は、そのデータ分析の依頼を受けて、図7のGUI401を生成するためのデータを、データ分析端末30に送信してよい。データ分析端末30は、データ分析システム10からGUI401を生成するためのデータを受けて、GUI401を生成及び表示してよい。ユーザは、データ分析端末30が表示したGUI401を通じて、データ分析システム10にレシピ生成条件400を入力してよい。データ分析システム10は、その入力されたレシピ生成条件400に基づいて、上述の実施例と同様、レシピ情報500、標本データ600及び分析結果テーブル700を生成してよい。そして、データ分析システム10は、その分析結果テーブル700を、データ分析端末30に送信してよい。データ分析端末30は、受領した分析結果テーブル700を表示してよい。
10:データ分析システム 30:データ分析端末 42:レシピ生成部 44:レシピ生成条件受付部 46:標本データ生成部 48:検定手法決定部 50:検定スコア算出部 52:分析結果表示部 100:測定情報 200:標本情報 300:測定補足情報 400:レシピ生成条件 500:レシピ情報 600:標本データ

Claims (11)

  1. プロセッサ及びメモリを有し、
    前記メモリには、標本に関する項目毎の測定データを含む測定情報が格納されており、
    前記プロセッサは、
    前記メモリから取得した測定情報の項目に基づいて、項目の組み合わせの異なる複数のレシピ情報を生成するレシピ生成処理と、
    前記測定データに対して前記各レシピ情報を適用し、前記各レシピ情報に対応する標本データを生成する標本データ生成処理と、
    前記標本データに適用する統計検定手法を、当該標本データの構成に基づいて決定する検定手法決定処理と、
    前記標本データに対して前記検定手法決定処理によって決定された統計検定手法を適用し、前記標本データの生成に用いられたレシピ情報に関する統計的有意性を示す検定スコアを算出する検定スコア算出処理と、
    前記検定スコアと当該検定スコアに関するレシピ情報とを対応付けて表示する分析結果表示処理と、を実行する
    データ分析システム。
  2. 前記プロセッサは、項目の組み合わせに関する条件を含むレシピ生成条件を受け付けるレシピ生成条件受付処理をさらに実行し、
    前記レシピ生成処理は、前記レシピ生成条件受付処理によって受け付けた前記レシピ生成条件に適合する範囲内でレシピ情報を生成する
    請求項1に記載のデータ分析システム。
  3. 前記測定情報は標本識別子の項目を含み、
    前記レシピ生成処理は、
    前記測定情報に含まれる複数の項目の中から、前記標本識別子を除く、少なくとも1つの項目を要因に決定し、
    それら決定した要因の組み合わせに基づいて前記レシピ情報を生成し、
    前記標本データ生成処理は、
    複数の測定データを、前記標本識別子と前記要因に属する値とに基づいてグルーピングして複数のグループを形成し、
    前記複数のグループのそれぞれについて、当該グループに含まれる測定データに基づいて特徴量を算出し、
    前記標本識別子と前記要因と前記特徴量との対応関係を含む標本データを生成する
    請求項2に記載のデータ分析システム。
  4. 前記レシピ生成処理は、
    前記測定情報に含まれる複数の項目の中から、前記標本識別子と前記要因を除く、少なくとも1つの項目を層別項目に決定し、その決定した前記層別項目のそれぞれについて、その層別項目に属する値のうちの少なくとも1つを層に決定し、
    それら決定した、前記要因と、前記層別項目と、前記層別項目に係る層との組み合わせに基づいて前記レシピ情報を生成し、
    前記標本データ生成処理は、
    前記層別項目に係る層に適合する前記複数の測定データを、前記標本識別子と、前記要因に属する値とに基づいてグルーピングして前記複数のグループを形成する、
    請求項3に記載のデータ分析システム。
  5. 前記レシピ生成条件受付処理は、測定データのクレンジング手法及び特徴量の算出手法の選択をさらに受け付け、
    前記レシピ生成処理は、前記レシピ生成条件受付処理で選択されたクレンジング方法及び特徴量算出方法を前記レシピ情報に含め、
    前記標本データ生成処理は、前記レシピ情報に含まれる前記クレンジング方法に基づいて測定データをクレンジングし、そのクレンジングされた測定データに対して前記レシピ情報に含まれる特徴量算出方法に基づいてグループの特徴量を算出する
    請求項3に記載のデータ分析システム。
  6. 前記メモリには、標本の属性に関する項目を含む標本情報が格納されており、
    前記レシピ生成処理は、
    前記測定情報及び前記標本情報に含まれる複数の項目の中から、前記要因を決定する
    請求項3に記載のデータ分析システム。
  7. 前記標本は被験者を表し、
    前記測定データは、被験者の脳の各部位における脳活動を測定したデータであり、
    前記測定情報に含まれる少なくとも1つの項目は、前記被験者が実施する対比対象のタスクである
    請求項6に記載のデータ分析システム。
  8. 前記標本は被験者を表し、
    前記測定データは、被験者の身体の各部位における身体活動を測定したデータであり、
    前記測定情報に含まれる少なくとも1つの項目は、前記被験者が実施する対比対象のタスクである
    請求項6に記載のデータ分析システム。
  9. 前記標本は被験者を表し、
    前記測定データは、被験者の脳の各部位における脳活動と、前記被験者の身体の各部位における身体活動を測定したデータであり、
    前記測定情報に含まれる少なくとも1つの項目は、前記被験者が実施する対比対象のタスクである
    請求項6に記載のデータ分析システム。
  10. 標本に関する項目毎の測定データを含む測定情報の項目に基づいて、項目の組み合わせの異なる複数のレシピ情報を生成し、
    前記測定データに対して前記各レシピ情報を適用し、前記各レシピ情報に対応する標本データを生成し、
    前記標本データに適用する統計検定手法を、当該標本データの構成に基づいて決定し、
    前記標本データに対してその決定された統計検定手法を適用し、前記標本データの生成に用いられたレシピ情報に関する統計的有意性を示す検定スコアを算出し、
    前記検定スコアと当該検定スコアに関するレシピ情報とを対応付けた分析結果情報を生成するデータ分析サーバ、と通信可能なデータ分析端末であって、プロセッサ及びメモリを有し、
    前記メモリには、測定情報が格納されており、
    前記プロセッサは、
    前記メモリに格納されている測定情報を前記データ分析サーバに送信し、
    前記分析結果情報を前記データ分析サーバから取得し、
    その取得した分析結果情報に基づいて、検定スコアとレシピ情報との対応関係を表示する
    データ分析端末。
  11. 標本に関する項目毎の測定データを含む測定情報の項目に基づいて、項目の組み合わせの異なる複数のレシピ情報を生成し、
    前記測定データに対して前記各レシピ情報を適用し、前記各レシピ情報に対応する標本データを生成し、
    前記標本データに適用する統計検定手法を、当該標本データの構成に基づいて決定し、
    前記標本データに対してその決定した統計検定手法を適用し、前記標本データの生成に用いられたレシピ情報に関する統計的有意性を示す検定スコアを算出し、
    前記検定スコアと当該検定スコアに関するレシピ情報とを対応付けて表示する
    データ分析方法。
JP2018537917A 2016-09-07 2016-09-07 データ分析システム、データ分析端末、及び、データ分析方法 Pending JPWO2018047251A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/076268 WO2018047251A1 (ja) 2016-09-07 2016-09-07 データ分析システム、データ分析端末、及び、データ分析方法

Publications (1)

Publication Number Publication Date
JPWO2018047251A1 true JPWO2018047251A1 (ja) 2019-06-24

Family

ID=61562739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018537917A Pending JPWO2018047251A1 (ja) 2016-09-07 2016-09-07 データ分析システム、データ分析端末、及び、データ分析方法

Country Status (2)

Country Link
JP (1) JPWO2018047251A1 (ja)
WO (1) WO2018047251A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004188026A (ja) * 2002-12-12 2004-07-08 Olympus Corp 情報処理装置
JP2005038256A (ja) * 2003-07-16 2005-02-10 Jgs:Kk 有効因子情報選択装置、有効因子情報選択方法、プログラム、および、記録媒体
US8095498B2 (en) * 2008-12-17 2012-01-10 International Business Machines Corporation Data mining model interpretation, optimization, and customization using statistical techniques
JP2011034457A (ja) * 2009-08-04 2011-02-17 Nec Corp データマイニングシステム、データマイニング方法及びデータマイニング用プログラム

Also Published As

Publication number Publication date
WO2018047251A1 (ja) 2018-03-15

Similar Documents

Publication Publication Date Title
Kunkel et al. Physical inactivity post-stroke: a 3-year longitudinal study
JP2018118144A5 (ja) 脳活動解析システム及び方法
McAlinden et al. Validation of the Quality of Life Inventory for patients with anxiety and depression
JP2015062817A5 (ja) 脳活動解析装置、脳活動解析方法、判別器生成装置、判別器生成方法、バイオマーカー装置およびプログラム、健康管理装置およびプログラム、ならびに判別器のプログラム
Mormann et al. Scene-selective coding by single neurons in the human parahippocampal cortex
CN108135548A (zh) 用于监测压力状态的方法和系统
Brammer The role of neuroimaging in diagnosis and personalized medicine-current position and likely future directions
AU2019204997B2 (en) Method and system for health condition analysis based on elasticity detection device
DeMasi et al. A step towards quantifying when an algorithm can and cannot predict an individual's wellbeing
Pirrotta et al. Italian validation of Montreal cognitive assessment
TW201426620A (zh) 健康檢查路徑評估指標建構系統、方法、運用此方法之裝置及電腦程式產品
JP6644767B2 (ja) 相互相関に基づかれる階層的なデータ分析に関する方法及び装置
Mancini et al. Marked point process models for the admissions of heart failure patients
Davison et al. Quantitative data analyses
JP6623774B2 (ja) パスウェイ解析プログラム、パスウェイ解析方法、及び、情報処理装置
JPWO2018047251A1 (ja) データ分析システム、データ分析端末、及び、データ分析方法
RU2586030C2 (ru) Способ и система тестирования
CN111091416A (zh) 一种预测酒店购买机器人的概率的方法和装置
Surana et al. Static and dynamic measures of active music listening as indicators of depression risk
US10600333B2 (en) System and method for normalizing activity results
JP2013218607A (ja) ソフトウェア品質評価装置、ソフトウェア品質評価方法、及び、プログラム
RU2704547C1 (ru) Способ удаленного сбора и групповой обработки психофизиологических реакций при предъявлении различной информации
Lamu et al. Validity and responsiveness of GHC-index in patients with amalgam-attributed health complaints
JP2021503353A (ja) バランスを定量化するための改善された方法
Skoczylas Congruence in research question, design, and analysis: A tutorial on the measurement of change in clinical speech and language research

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20190903