JP5903037B2 - 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム - Google Patents

信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム Download PDF

Info

Publication number
JP5903037B2
JP5903037B2 JP2012280266A JP2012280266A JP5903037B2 JP 5903037 B2 JP5903037 B2 JP 5903037B2 JP 2012280266 A JP2012280266 A JP 2012280266A JP 2012280266 A JP2012280266 A JP 2012280266A JP 5903037 B2 JP5903037 B2 JP 5903037B2
Authority
JP
Japan
Prior art keywords
confidence interval
data
width
region
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012280266A
Other languages
English (en)
Other versions
JP2014013556A (ja
Inventor
山本 淳
淳 山本
仁史 川崎
仁史 川崎
央 倉沢
央 倉沢
浩史 佐藤
浩史 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012280266A priority Critical patent/JP5903037B2/ja
Publication of JP2014013556A publication Critical patent/JP2014013556A/ja
Application granted granted Critical
Publication of JP5903037B2 publication Critical patent/JP5903037B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本発明は、センサによりサンプリングされたデータをもとに、そのデータが従う母集団分布の平均を推定する技術に関する。
各ユーザが携帯するセンサによりサンプリングされたデータを共有して活用する、ユーザ参加型のセンシング環境が注目されている(例えば、非特許文献1)。ユーザ参加型のセンシング環境では、いつどこでデータがサンプリングされるかは各センサを携帯するユーザの移動に依存するため、時間や場所によってサンプリングされるデータ数(サンプルサイズ)は異なりうる。また、サンプリングされたデータが従う母集団分布としては正規分布が仮定されるが、母集団分布の平均(母平均)は時間や場所によって変わりうるし、母集団分布の分散(母分散)も各センサの精度によって異なりうる。一般に、アプリケーションが知りたいのは、センサの精度(母分散)によってばらつくデータそのものではなく、データからばらつきを除いた母平均についてである。
サンプリングされたデータから母平均を推定する方法として区間推定がある(例えば、非特許文献2)。母平均の区間推定では、母平均の値が入る確率が信頼係数以上と保証される信頼区間を推定する。母集団分布が正規分布である場合、母平均の信頼区間幅は、信頼係数を固定すると、母分散(母分散が未知の場合は標本分散)とサンプルサイズに依存する。具体的には、母分散が小さいほど、信頼区間幅は狭くなる。また、サンプルサイズが大きいほど、信頼区間幅は狭くなる。一般に、信頼区間幅が一定の幅以下でないと、信頼区間に母平均の値が入る確率が信頼係数以上と保証されても、アプリケーションにとっては役に立たない。
木實新一,瀬崎 薫:都市生活における実世界センシング,電気学会誌,Vol.129,No.3,pp.156−159(2009). 東京大学教養学部統計学教室(編):統計学入門,pp.225−230,東京大学出版会(1991).
ユーザ参加型のセンシング環境でサンプリングされたデータに対して母平均の区間推定を適用する方法として、時空間を一様な大きさの領域に分割して、領域ごとに母平均を区間推定する方法が考えられる。しかしながら、ユーザ参加型のセンシング環境では、時間や場所によって存在するセンサの精度(母分散)やサンプルサイズは異なりうる。このため、母分散とサンプルサイズに依存する母平均の信頼区間幅が全ての領域において一定の幅以下になるとは限らない、という問題がある。信頼区間幅が一定の幅以下にならなかった領域の母平均の区間推定結果については、アプリケーションにとって役に立たない。
もちろん、時空間を分割する一様な領域の大きさをより大きくすることで、全ての領域において母平均の信頼区間幅が一定の幅以下になる可能性はある。しかしながら、この場合には、時空間を分割する一様な領域の大きさをより大きくする前に、信頼区間幅が一定の幅以下になっていた領域については、必要以上に領域が大きくなってしまう、という問題がある。母平均の区間推定結果は領域ごとに得られるため、必要以上に領域が大きくなることは、必要以上に時空間の粒度が粗くなることを意味し、好ましくない。
そこで、前記課題を解決するために、本発明は、ユーザ参加型のセンシング環境のように、時間や場所によって存在するセンサの精度(母分散)やサンプルサイズが異なる場合であっても、時空間を分割した全ての領域において母平均の信頼区間幅を一定の幅以下として、かつ各領域の大きさを母平均の信頼区間幅が一定の幅以下になる範囲内で小さく保つことを目的とする。
上記目的を達成するために、ある時空間の領域におけるデータについて、母平均の信頼区間を推定する。そして、母平均の信頼区間の幅が所定の信頼区間の幅より広いとき、隣接する時空間の領域におけるデータを当該ある時空間の領域におけるデータに統合し、母平均の信頼区間を推定し直すこととした。一方で、母平均の信頼区間の幅が所定の信頼区間の幅より狭いとき、母平均の信頼区間を推定し直さないこととした。
具体的には、本発明は、第1の時空間の領域に分布するセンサが測定した第1のデータについて、所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間推定部と、前記信頼区間推定部が推定した前記第1のデータについての母平均の信頼区間の幅が、所定の信頼区間の幅より狭いか広いかを判断する信頼区間幅判断部と、前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと前記信頼区間幅判断部が判断したとき、前記第1の時空間の領域に隣接する第2の時空間の領域に分布するセンサが測定した第2のデータを前記第1のデータに統合した統合データを、新たな第1の時空間の領域に分布するセンサが測定した新たな第1のデータとして、前記信頼区間推定部に対して出力するデータ統合部と、前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと前記信頼区間幅判断部が判断したとき、前記第1のデータについての母平均の信頼区間の情報を推定結果の情報として出力する信頼区間出力部と、を備えることを特徴とする信頼区間推定装置である。
また、本発明は、第1の時空間の領域に分布するセンサが測定した第1のデータについて、所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間推定ステップと、前記信頼区間推定ステップで推定した前記第1のデータについての母平均の信頼区間の幅が、所定の信頼区間の幅より狭いか広いかを判断する信頼区間幅判断ステップと、前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと前記信頼区間幅判断ステップで判断したとき、前記第1の時空間の領域に隣接する第2の時空間の領域に分布するセンサが測定した第2のデータを前記第1のデータに統合した統合データを、新たな第1の時空間の領域に分布するセンサが測定した新たな第1のデータとして、前記信頼区間推定ステップに対して出力し、前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと前記信頼区間幅判断ステップで判断したとき、前記第1のデータについての母平均の信頼区間の情報を推定結果の情報として出力するデータ統合・信頼区間出力ステップと、を順に繰り返し備えることを特徴とする信頼区間推定方法である。
この構成によれば、時空間の領域によって存在するセンサの精度(母分散)やサンプルサイズが異なる場合であっても、全ての時空間の領域において母平均の信頼区間幅を一定の幅以下として、かつ全ての時空間の領域の大きさを母平均の信頼区間幅が一定の幅以下になる範囲内で小さく保つことができる。
また、本発明は、前記データ統合部は、前記第1のデータ及び前記第2のデータについて、母平均の差の検定を実行し、前記第1のデータとの間のp値が有意水準より大きい前記第2のデータを、前記第1のデータに統合することを特徴とする信頼区間推定装置である。
また、本発明は、前記データ統合・信頼区間出力ステップで、前記第1のデータ及び前記第2のデータについて、母平均の差の検定を実行し、前記第1のデータとの間のp値が有意水準より大きい前記第2のデータを、前記第1のデータに統合することを特徴とする信頼区間推定方法である。
この構成によれば、時空間的に隣接する領域間では母平均の差があまりないという仮定が成り立たない場合でも、母平均の差が極端にある領域同士を統合してしまうことを抑制することができる。
また、本発明は、前記データ統合部は、前記第1のデータ及び前記第2のデータについて、さらに、検定力を算出し、前記第1のデータとの間のp値が有意水準よりも大きく、かつ検定力が閾値よりも大きい前記第2のデータを、前記第1のデータに統合することを特徴とする信頼区間推定装置である。
また、本発明は、前記データ統合・信頼区間出力ステップで、前記第1のデータ及び前記第2のデータについて、さらに、検定力を算出し、前記第1のデータとの間のp値が有意水準よりも大きく、かつ検定力が閾値よりも大きい前記第2のデータを、前記第1のデータに統合することを特徴とする信頼区間推定方法である。
この構成によれば、母平均の差の検定力が閾値よりも大きいか否かによって実際に統合するか否かを決定することで、母平均の差がある領域同士を統合してしまうことをより確実に抑制することができる。
また、本発明は、前記信頼区間幅判断部が母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと判断した端数領域データを、前記端数領域データが測定された時空間の領域に隣接する時空間の領域で測定され、かつ、前記信頼区間幅判断部が母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと判断した隣接領域データに統合するデータ再統合部と、前記データ再統合部が前記端数領域データ及び前記隣接領域データを統合した再統合データについて、前記所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間再推定部と、をさらに備えることを特徴とする信頼区間推定装置である。
また、本発明は、前記信頼区間幅判断ステップで母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと判断した端数領域データを、前記端数領域データが測定された時空間の領域に隣接する時空間の領域で測定され、かつ、前記信頼区間幅判断ステップで母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと判断した隣接領域データに統合するデータ再統合ステップと、前記データ再統合ステップで前記端数領域データ及び前記隣接領域データを統合した再統合データについて、前記所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間再推定ステップを、前記信頼区間推定ステップ、前記信頼区間幅判断ステップ及び前記データ統合・信頼区間出力ステップの後に順に繰り返し備えることを特徴とする信頼区間推定方法である。
この構成によれば、時空間の領域によって存在するセンサの精度(母分散)やサンプルサイズが異なる場合であっても、より確実に、全ての時空間の領域において母平均の信頼区間幅を一定の幅以下とすることができる。
また、本発明は、コンピュータに、前記信頼区間推定ステップ、前記信頼区間幅判断ステップ及び前記データ統合・信頼区間出力ステップを、順に繰り返し実行させるための信頼区間推定プログラムである。
この構成によれば、信頼区間推定プログラムを、記録媒体に記録することも、ネットワークを通して提供することも可能である。
本発明は、ユーザ参加型のセンシング環境のように、時間や場所によって存在するセンサの精度(母分散)やサンプルサイズが異なる場合であっても、時空間を分割した全ての領域において母平均の信頼区間幅を一定の幅以下として、かつ各領域の大きさを母平均の信頼区間幅が一定の幅以下になる範囲内で小さく保つことができる。
本発明の信頼区間推定装置の構成を示す図である。 本発明のセンサデータベース装置に格納されるレコードの例を示す図である。 本発明のセンサの種類と時空間の範囲の条件の例を示す図である。 本発明の時空間の最小単位の条件の例を示す図である。 本発明の信頼係数と信頼区間幅の条件の例を示す図である。 本発明の入力バッファ部の時空間配列の例を示す図である。 実施形態1の領域統合・区間推定部のフローチャートを示す図である。 実施形態1の領域統合前の未処理領域集合と処理対象領域集合の例を示す図である。 実施形態1の領域統合前の入力バッファ部と出力バッファ部の時空間配列の例を示す図である。 実施形態1の処理対象の領域と隣接領域の関係の例を示す図である。 実施形態1の領域統合後の未処理領域集合と処理対象領域集合の例を示す図である。 実施形態1の領域統合後の入力バッファ部と出力バッファ部の時空間配列の例を示す図である。 実施形態1の処理終了後の出力バッファ部の時空間配列の例を示す図である。 実施形態2の領域統合・区間推定部のフローチャートを示す図である。 実施形態3の領域統合・区間推定部のフローチャートを示す図である。 実施形態2の領域統合・区間推定部のフローチャートを示す図である。
添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施の例であり、本発明は以下の実施形態に制限されるものではない。
(実施形態1)
図1に本発明の信頼区間推定装置の構成を示す。信頼区間推定装置Cは、要求受付部C1、領域分割部C2、領域統合・区間推定部C4、結果応答部C6の各処理部と、入力バッファ部C3、出力バッファ部C5の各記憶部から構成されている。信頼区間推定装置Cは、アプリケーション装置A及びセンサデータベース装置Dと通信する。破線の矢印は制御の流れ、実線の矢印はデータの流れをそれぞれ示す。
図2に本発明のセンサデータベース装置に格納されるレコードの例を示す。各レコードは、センサの種類、サンプリングの日時と位置(緯度、経度)、及びデータから構成されている。例えば、1行目のレコードは、種類「温度」のセンサにより、日時「2012−01−31 09:15:00」に位置(緯度「35.738157」、経度「139.565407」)で、データ「1.0」がサンプリングされたことを意味する。
以降では、アプリケーション装置Aから区間推定の要求を受け付けて、区間推定の結果を応答するまでの流れを、各処理部や各記憶部を参照しながら説明する。特に、本発明のポイントである領域統合・区間推定部C4に関わる動作を詳しく説明する。
要求受付部C1は、アプリケーション装置Aから、センサの種類と時空間の範囲の条件、時空間の最小単位の条件、及び信頼係数と信頼区間幅の条件を、区間推定の要求として受信する。なお、時空間の最小単位の条件については、アプリケーション装置Aから受信するのではなく、信頼区間推定装置Cが保持しておいても構わない。
図3に本発明のセンサの種類と時空間の範囲の条件の例を示す。図3は、種類「温度」のセンサにより、日時「2012−01−31 08:00:00」〜「2012−01−31 12:00:00」、位置(緯度「35.722000」〜「35.738000」、経度「139.560000」〜「139.566000」)の時空間の範囲でサンプリングされたデータを、区間推定の対象とすることを意味する。
図4に本発明の時空間の最小単位の条件の例を示す。図4は、日時の間隔「01:00:00」、位置(緯度)の間隔「0.004」からなる領域を、時空間の最小単位とすることを意味する。なお、後述するが、領域分割部C2により、図3に示した時空間の範囲が、図4に示した時空間の最小単位の領域に分割されることになる。
図5に本発明の信頼係数と信頼区間幅の条件の例を示す。図5は、母平均の値が区間[L,U]に入る確率を信頼係数「0.95」以上、区間幅U−Lを信頼区間幅「0.5」以下にすることを、区間推定の条件とすることを意味する。
領域分割部C2は、要求受付部C1からセンサの種類と時空間の範囲の条件及び時空間の最小単位の条件を入力される。まず、領域分割部C2は、入力されたセンサの種類と時空間の範囲の条件に従って、センサデータベース装置Dからレコードを検索する。次に、領域分割部C2は、入力された時空間の最小単位の条件に従って、その時空間の範囲を領域に分割した時空間配列を入力バッファ部C3に作成し、検索結果のレコードを入力バッファ部C3の時空間配列の領域ごとに区分けして書き込む。
図6に本発明の入力バッファ部の時空間配列の例を示す。図6は、図3に示したセンサの種類と時空間の範囲の条件及び図4に示した時空間の最小単位の条件を、要求受付部C1から入力された場合の様子である。図3に示した日時の開始「2012−01−31 08:00:00」から日時の終了「2012−01−31 12:00:00」までが、図4に示した日時の間隔「01:00:00」で4分割されている。また、図3に示した位置(緯度)の開始「35.722000」から位置(緯度)の終了「35.738000」までが、図4に示した位置(緯度)の間隔「0.004」で4分割されている。
時空間配列の各インデックス(i,j)(i=1,2,3,4、j=1,2,3,4)は、分割された各領域の番地に相当する。各インデックス(i,j)に対応する時空間配列の要素は、種類「温度」のセンサにより各領域内でサンプリングされたデータを含む、図2に示したレコードのリストである。
なお、図6は、時間軸が1次元、空間軸が1次元の2次元配列となっているが、例えば、図4において位置(緯度)の間隔と位置(経度)の間隔を併せて指定した場合は、時間軸が1次元、空間軸が2次元の3次元配列になる。また、図6は、時空間の範囲が時空間の最小単位で余りなく割り切れる場合の例であるが、割り切れない場合は、その余りの領域を切り捨てても切り捨てなくてもどちらでも構わない。
図7に実施形態1の領域統合・区間推定部のフローチャートを示す。領域統合・区間推定部C4は、要求受付部C1から信頼係数と信頼区間幅の条件を入力される。
ステップS1について説明する。母平均の区間推定結果を書き込むための時空間配列を、出力バッファ部C5に作成する。なお、出力バッファ部C5の時空間配列の大きさは、入力バッファ部C3の時空間配列と同じ大きさとする。
未処理の領域(インデックス)を管理するための未処理領域集合を作成し、初期化段階では入力バッファ部C3または出力バッファ部C5の時空間配列の全ての領域(インデックス)を要素とする。また、処理対象の領域(インデックス)を管理するための処理対象領域集合を作成し、初期化段階では空集合とする。
ステップS2について説明する。未処理領域集合から領域をランダムに一つ選択し、空の処理対象領域集合に追加する。なお、処理対象領域集合に追加した領域は、未処理領域集合から削除する。
図8に実施形態1の領域統合前の未処理領域集合と処理対象領域集合の例を示す。図8は、入力バッファ部C3の時空間配列が、図6に示したようになっていた場合に、未処理の領域(i,j)(i=1,2,3,4、j=1,2,3,4)の中から、領域(2,2)が処理対象の領域として選択されたときの様子である。
ステップS3について説明する。入力バッファ部C3の時空間配列から、処理対象の領域に対応するレコードのリストを読み出す。読み出したレコードのリスト(読み出したレコードのリストが複数ある場合は、それらが層化抽出されたものとみなす)について、入力された信頼係数の条件下で、母平均の信頼区間を算出する(母平均の信頼区間を算出する方法自体は広く知られている)。算出された母平均の信頼区間を、処理対象の領域に対応する母平均の区間推定結果として、出力バッファ部C5の時空間配列に書き込む。
図9に実施形態1の領域統合前の入力バッファ部C3と出力バッファ部C5の時空間配列の例を示す。図9は、未処理領域集合と処理対象領域集合が、図8に示したようになっていた場合の様子である。処理対象の領域が領域(2,2)であるため、入力バッファ部C3の時空間配列から、領域(2,2)に対応するレコードリスト22が読み出される。また、レコードリスト22を対象として、母平均の信頼区間が算出され、算出された母平均の信頼区間が、領域(2,2)に対応する母平均の区間推定結果として、出力バッファ部C5の時空間配列に書き込まれる。図9は、算出された母平均の信頼区間が[0.7,1.3]であったときの様子である。
ステップS4について説明する。出力バッファ部C5の時空間配列に書き込んだ母平均の信頼区間が、入力された信頼区間幅の条件を満たしているかどうかをチェックする。信頼区間幅の条件を満たしている場合は、ステップS7に進む。信頼区間幅の条件を満たしていない場合は、ステップS5に進む。
入力バッファ部C3と出力バッファ部C5の時空間配列が、図9に示したようになっており、要求受付部C1から入力された信頼係数と信頼区間幅の条件が、図5に示したようになっていた場合は、母平均の信頼区間幅「1.3−0.7=0.6」が、信頼区間幅の条件「0.5」よりも大きいため、信頼区間幅の条件を満たしていないと判断されて、ステップS5に進むことになる。
ステップS5について説明する。処理対象の領域に統合できる隣接領域が、未処理領域集合にあるかどうかをチェックする。
図10に実施形態1の処理対象の領域と隣接領域の関係の例を示す。図10は、未処理領域集合と処理対象領域集合が、図8に示したようになっていた場合の様子である。処理対象の領域が領域(2,2)である場合の隣接領域は、領域(1,1)、領域(1,2)、領域(1,3)、領域(2,1)、領域(2,3)、領域(3,1)、領域(3,2)、領域(3,3)の計8領域である。
処理対象の領域に統合できる隣接領域が、未処理領域集合にある場合は、ステップS6に進む。処理対象の領域に統合できる隣接領域が、未処理領域集合にない場合は、母平均の信頼区間幅をこれ以上は狭くできないので、あきらめてステップS7に進む。
ステップS6について説明する。未処理領域集合から統合する隣接領域をランダムに一つ選択し、処理対象領域集合に追加する。なお、処理対象領域集合に追加した領域は、未処理領域集合から削除する。なお、ここでは、時空間的に隣接する領域間では、母平均の差があまりないことを仮定している。
図11に実施形態1の領域統合後の未処理領域集合と処理対象領域集合の例を示す。図11は、未処理領域集合と処理対象領域集合が、図8に示したようになっていた場合に、処理対象の領域(2,2)に統合する隣接領域として、領域(2,3)が選択されたときの様子である。
ステップS3〜ステップS6を繰り返すことにより、母平均の信頼区間幅が入力された信頼区間幅の条件を満たすようになるまで(あるいは、統合できる隣接領域がなくなるまで)、処理対象の領域に未処理の隣接領域を統合しながら、母平均の区間推定を実行する。以下に、ステップS5とステップS6を実行した後、ステップS3とステップS4を再度実行して、ステップS7に進む場合の様子を説明する。
図12に実施形態1の領域統合後の入力バッファ部と出力バッファ部の時空間配列の例を示す。図12は、未処理領域集合と処理対象領域集合が、図11に示したようになっていた場合の、ステップS3の実行の様子である。処理対象の領域が領域(2,2)と領域(2,3)であるため、入力バッファ部C3の時空間配列から、領域(2,2)と領域(2,3)に対応するレコードリスト22とレコードリスト23が読み出される。
また、レコードリスト22とレコードリスト23を対象として(レコードリスト22とレコードリスト23が層化抽出されたものとみなして)、母平均の信頼区間が算出され、算出された母平均の信頼区間が、領域(2,2)と領域(2,3)に対応する母平均の区間推定結果として、出力バッファ部C5の時空間配列に書き込まれる。図12は、算出された母平均の信頼区間が、[0.8,1.2]であったときの様子である。なお、領域(2,2)と領域(2,3)には、同じ母平均の信頼区間が書き込まれる(図12では、領域(2,2)と領域(2,3)の統合領域に対して、一つの母平均の信頼区間が書き込まれる)。また、母平均の信頼区間は、すでに書き込まれている場合は、上書きされる。
入力バッファ部C3と出力バッファ部C5の時空間配列が、図12に示したようになっており、要求受付部C1から入力された信頼係数と信頼区間幅の条件が、図5に示したようになっていた場合は、母平均の信頼区間幅「1.2−0.8=0.4」が、信頼区間幅の条件「0.5」よりも小さいため、ステップS4の実行で信頼区間幅の条件を満たしていると判断されて、ステップS7に進むことになる。
ステップS7では、処理対象領域集合を空にする。ステップS8では、未処理領域集合が空かどうかをチェックする。未処理領域集合が空でない場合は、ステップS2に進む。未処理領域集合が空である場合は、処理を終了する。
ステップS2〜ステップS8を繰り返すことにより、前述したステップS3〜ステップS6を全ての領域に渡って適用する。以下に、ステップS2〜ステップS8を繰り返した後、出力バッファ部C5の時空間配列が最終的にどうなるかを説明する。
図13に実施形態1の処理終了後の出力バッファ部の時空間配列の例を示す。図13は、入力バッファ部C3の時空間配列が、図6に示したようになっていた場合の様子である。図13に示したように、母平均の信頼区間が書き込まれる各領域の大きさは一様ではないが、全ての領域の母平均の信頼区間幅は入力された信頼区間幅の条件を満たすようになる。また、各領域の大きさは、母平均の信頼区間幅が入力された信頼区間幅の条件を満たす範囲内で小さくなる。
結果応答部C6は、領域統合・区間推定部C4から、区間推定が完了したことを通知される。結果応答部C6は、出力バッファ部C5の時空間配列を、区間推定の結果として、アプリケーション装置Aに送信する。
実施形態1の処理では、母平均の区間推定さえできれば、母集団分布は正規分布の他にどのような分布であってもよい。実施形態1の処理は、信頼区間推定プログラムを信頼区間推定装置Cにインストールすることにより、実行することができる。信頼区間推定プログラムは、記録媒体に記録することも、ネットワークを通して提供することもできる。
(実施形態2)
実施形態1では、時空間的に隣接する領域間では、母平均の差があまりないことを仮定して、未処理の隣接領域の中から統合する隣接領域をランダムに選択している。実施形態2では、処理対象の領域と未処理の隣接領域との間で、母平均の差の検定を行い、処理対象の領域との間のp値が有意水準より大きい未処理の隣接領域を、統合する隣接領域として選択している。なお、p値が有意水準より小さければ、母平均の差は有意であり、母平均の差がない確率は低い、と言える。一方、p値が有意水準より大きければ、母平均の差は有意でなく、母平均の差がない確率は高い、と言える。
図14に実施形態2の領域統合・区間推定部のフローチャートを示す。図7のステップS4においてNOであった後、処理対象の領域に統合できる未処理の隣接領域があるかどうかをチェックする(ステップS9)。処理対象の領域に統合できる未処理の隣接領域があるとき(ステップS9においてYES)、ステップS10に進む。処理対象の領域に統合できる未処理の隣接領域がないとき(ステップS9においてNO)、図7のステップS7に進む。
ステップS10では、処理対象の領域と未処理の隣接領域の全ての組について、入力バッファ部C3の時空間配列から、処理対象の領域と未処理の隣接領域に対応するレコードのリストを読み出して(処理対象の領域と未処理の隣接領域のそれぞれについて、読み出したレコードのリストが複数ある場合は、それらが層化抽出されたものとみなす)、母平均の差の検定を行い、p値を算出する。
ステップS11では、p値が有意水準よりも大きい未処理の隣接領域があるかどうかをチェックする。p値が有意水準よりも大きい未処理の隣接領域があるとき(ステップS11においてYES)、ステップS12に進む。p値が有意水準よりも大きい未処理の隣接領域がないとき(ステップS11においてNO)、図7のステップS7に進む。
ステップS12では、p値が有意水準よりも大きい未処理の隣接領域の中から、任意またはp値が最大のものを未処理領域集合から取り出し、処理対象領域集合に追加し、図7のステップS3に進む。なお、ステップS11において有意水準が0であり、かつ、ステップS12において任意の未処理の隣接領域を未処理領域集合から取り出す場合は、実施形態2は実施形態1と実質的に同じになる。
これにより、時空間的に隣接する領域間では、母平均の差があまりないという仮定が成り立たない場合でも、母平均の差が極端にある領域同士を統合してしまうことを抑制することができる(例えば、屋内と屋外とでは距離が近くても温度は全く異なると考えられるが、そのような屋内の温度と屋外の温度とを混ぜてしまうことを避けることができる)。
上記で説明した実施形態では、処理対象の領域と未処理の隣接領域との間で母平均の差の検定を行い、処理対象の領域との間のp値が有意水準よりも大きい、つまり統計的に有意な差がないと判断された未処理の隣接領域を、処理対象の領域に統合している。
しかし、母平均の差があるにも関わらず統計的に有意な差がないと誤って判断してしまう確率(第2種の誤り)を考慮してないため、実際には母平均の差がある領域同士を統合してしまう可能性がある。
そこで、処理対象の領域に、統計的に有意な差がないと判断された未処理の隣接領域を無条件に統合するのではなく、母平均の差があるときに統計的に有意な差があると正しく判断できる確率(検定力=1−第2種の誤り)を算出し、その検定力が閾値よりも大きいか否かによって実際に統合するか否かを決定してもよい。
図16にこのような決定をする領域統合・区間推定部のフローチャートを示す。図14のステップS11において「Yes」であったとき、ステップS121では、p値が有意水準よりも大きい未処理の隣接領域と処理対象の領域の全ての組について、母平均の差の検定力を算出する。
ステップS122では、処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域があるか否かをチェックする。処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域があるとき(ステップS122において「Yes」であったとき)、ステップS123に進む。
処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域がないとき(ステップS122において「No」であったとき)、図7のステップS7に進む。なお、母平均の差の検定力の閾値については、[0、1]の値を閾値として静的に設定してもよいし、[0、1]の一様乱数をその都度発生させて、その値を閾値として動的に設定してもよい。
ステップS123では、処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域を未処理領域集合から取り出し、処理対象領域集合に追加して、図7のステップS3に進む。
なお、処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域が複数ある場合については、その全てを未処理領域集合から取り出して処理対象領域集合に追加してもよいし、その中の一つを未処理領域集合から取り出して処理対象領域集合に追加してもよい。
また、処理対象の領域との間のp値が有意水準よりも大きく、かつ母平均の差の検定力が閾値よりも大きい未処理の隣接領域の中から一つを選ぶ方法については、任意(ランダム)に一つを選んでもよいし、p値または母平均の差の検定力が最大のものを選んでもよい。
このように、処理対象の領域に、統計的に有意な差がないと判断された未処理の隣接領域を無条件に統合するのではなく、母平均の差の検定力が閾値よりも大きいか否かによって実際に統合するか否かを決定することで、母平均の差がある領域同士を統合してしまうことをより確実に抑制することができる。
実施形態2の処理では、母平均の区間推定と母平均の差の検定さえできれば、母集団分布は正規分布の他にどのような分布であってもよい。実施形態2の処理は、信頼区間推定プログラムを信頼区間推定装置Cにインストールすることにより、実行することができる。信頼区間推定プログラムは、記録媒体に記録することも、ネットワークを通して提供することもできる。
(実施形態3)
実施形態1、2では、信頼区間幅の条件を満たさない場合、処理対象の領域に隣接領域を統合していくが、統合対象の隣接領域を未処理の領域のみに限定しているため(信頼区間幅の条件を一旦満たした領域を、統合対象の隣接領域から除外しているため)、場合によっては信頼区間幅の条件を満たさない端数の領域が残る可能性が高くなる。
図15に実施形態3の領域統合・区間推定部のフローチャートを示す。図7のステップS8の後、ステップS13では、区間幅の条件を満たしていない端数領域があるかどうかを確認する。区間幅の条件を満たしていない端数領域があるときには(ステップS13においてYES)、ステップS14に進む。区間幅の条件を満たしていない端数領域がないときには(ステップS13においてNO)、図7の終了に進む。
ステップS14では、区間幅の条件を満たしていない未処理の端数領域の中から、処理対象の端数領域を一つ選択する。ステップS15では、区間幅の条件を満たしていない処理対象の端数領域を統合できる、区間幅の条件を満たしている隣接領域があるかどうかをチェックする。区間幅の条件を満たしていない処理対象の端数領域を統合できる、区間幅の条件を満たしている隣接領域があるときには(ステップS15においてYES)、ステップS16に進む。区間幅の条件を満たしていない処理対象の端数領域を統合できる、区間幅の条件を満たしている隣接領域がないときには(ステップS15においてNO)、ステップS18に進む。
ステップS16では、区間幅の条件を満たしていない処理対象の端数領域を、区間幅の条件を満たしている隣接領域に統合する。なお、ステップS16では、実施形態1と同様に、区間幅の条件を満たしている隣接領域の中から、統合する隣接領域をランダムに選択してもよい。又は、ステップS16では、実施形態2と同様に、区間幅の条件を満たしている隣接領域の中から、母平均の差がない確率が高いものを、統合する隣接領域として優先的に選択してもよい。
ステップS17では、統合領域に対して区間推定を実行し、その結果を出力バッファ部C5に書き込む。
ステップS18では、区間幅の条件を満たしていない未処理の端数領域がまだあるかどうかをチェックする。区間幅の条件を満たしていない未処理の端数領域がまだあれば(ステップS18においてYES)、ステップS14に進む。区間幅の条件を満たしていない未処理の端数領域がもうなければ(ステップS18においてNO)、図7の終了に進む。
このように、統合対象の隣接領域として、未処理の領域に限定せず、既処理の領域も包含するため、信頼区間幅の条件を満たさない端数の領域が残る可能性が低くなる。
実施形態3の処理では、実施形態1と同様に統合する隣接領域を選択するときには、母平均の区間推定さえできれば、実施形態2と同様に統合する隣接領域を選択するときには、母平均の区間推定と母平均の差の検定さえできれば、母集団分布は正規分布の他にどのような分布であってもよい。実施形態3の処理は、信頼区間推定プログラムを信頼区間推定装置Cにインストールすることにより、実行することができる。信頼区間推定プログラムは、記録媒体に記録することも、ネットワークを通して提供することもできる。
本発明に係る信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラムは、各ユーザが携帯するセンサによりサンプリングされたデータを共有して活用する、ユーザ参加型のセンシング環境などに適用することができる。
A:アプリケーション装置
C:信頼区間推定装置
D:センサデータベース装置
C1:要求受付部
C2:領域分割部
C3:入力バッファ部
C4:領域統合・区間推定部
C5:出力バッファ部
C6:結果応答部

Claims (9)

  1. 第1の時空間の領域に分布するセンサが測定した第1のデータについて、所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間推定部と、
    前記信頼区間推定部が推定した前記第1のデータについての母平均の信頼区間の幅が、所定の信頼区間の幅より狭いか広いかを判断する信頼区間幅判断部と、
    前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと前記信頼区間幅判断部が判断したとき、前記第1の時空間の領域に隣接する第2の時空間の領域に分布するセンサが測定した第2のデータを前記第1のデータに統合した統合データを、新たな第1の時空間の領域に分布するセンサが測定した新たな第1のデータとして、前記信頼区間推定部に対して出力するデータ統合部と、
    前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと前記信頼区間幅判断部が判断したとき、前記第1のデータについての母平均の信頼区間の情報を推定結果の情報として出力する信頼区間出力部と、
    を備えることを特徴とする信頼区間推定装置。
  2. 前記データ統合部は、前記第1のデータ及び前記第2のデータについて、母平均の差の検定を実行し、前記第1のデータとの間のp値が有意水準より大きい前記第2のデータを、前記第1のデータに統合することを特徴とする請求項1に記載の信頼区間推定装置。
  3. 前記データ統合部は、前記第1のデータ及び前記第2のデータについて、さらに、検定力を算出し、前記第1のデータとの間のp値が有意水準よりも大きく、かつ検定力が閾値よりも大きい前記第2のデータを、前記第1のデータに統合することを特徴とする請求項2に記載の信頼区間推定装置。
  4. 前記信頼区間幅判断部が母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと判断した端数領域データを、前記端数領域データが測定された時空間の領域に隣接する時空間の領域で測定され、かつ、前記信頼区間幅判断部が母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと判断した隣接領域データに統合するデータ再統合部と、
    前記データ再統合部が前記端数領域データ及び前記隣接領域データを統合した再統合データについて、前記所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間再推定部と、
    をさらに備えることを特徴とする請求項1から請求項3のいずれかに記載の信頼区間推定装置。
  5. センサが測定したデータについて母平均の信頼区間を推定する信頼区間推定装置が、
    第1の時空間の領域に分布するセンサが測定した第1のデータについて、所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間推定ステップと、
    前記信頼区間推定ステップで推定した前記第1のデータについての母平均の信頼区間の幅が、所定の信頼区間の幅より狭いか広いかを判断する信頼区間幅判断ステップと、
    前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと前記信頼区間幅判断ステップで判断したとき、前記第1の時空間の領域に隣接する第2の時空間の領域に分布するセンサが測定した第2のデータを前記第1のデータに統合した統合データを、新たな第1の時空間の領域に分布するセンサが測定した新たな第1のデータとして、前記信頼区間推定ステップに対して出力し、
    前記第1のデータについての母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと前記信頼区間幅判断ステップで判断したとき、前記第1のデータについての母平均の信頼区間の情報を推定結果の情報として出力するデータ統合・信頼区間出力ステップと、
    を順に繰り返し実行することを特徴とする信頼区間推定方法。
  6. 前記データ統合・信頼区間出力ステップで、前記第1のデータ及び前記第2のデータについて、母平均の差の検定を実行し、前記第1のデータとの間のp値が有意水準より大きい前記第2のデータを、前記第1のデータに統合することを特徴とする請求項5に記載の信頼区間推定方法。
  7. 前記データ統合・信頼区間出力ステップで、前記第1のデータ及び前記第2のデータについて、さらに、検定力を算出し、前記第1のデータとの間のp値が有意水準よりも大きく、かつ検定力が閾値よりも大きい前記第2のデータを、前記第1のデータに統合することを特徴とする請求項6に記載の信頼区間推定方法。
  8. 前記信頼区間推定装置が、
    前記信頼区間幅判断ステップで母平均の信頼区間の幅が前記所定の信頼区間の幅より広いと判断した端数領域データを、前記端数領域データが測定された時空間の領域に隣接する時空間の領域で測定され、かつ、前記信頼区間幅判断ステップで母平均の信頼区間の幅が前記所定の信頼区間の幅より狭いと判断した隣接領域データに統合するデータ再統合ステップと、
    前記データ再統合ステップで前記端数領域データ及び前記隣接領域データを統合した再統合データについて、前記所定の信頼係数の条件下で母平均の信頼区間を推定する信頼区間再推定ステップを、
    前記信頼区間推定ステップ、前記信頼区間幅判断ステップ及び前記データ統合・信頼区間出力ステップの後に順に繰り返し実行することを特徴とする請求項5から請求項7のいずれかに記載の信頼区間推定方法。
  9. 前記信頼区間推定装置に、請求項5から請求項8のいずれかに記載の前記信頼区間推定ステップ、前記信頼区間幅判断ステップ及び前記データ統合・信頼区間出力ステップを、順に繰り返し実行させるための信頼区間推定プログラム。
JP2012280266A 2012-06-07 2012-12-21 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム Expired - Fee Related JP5903037B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012280266A JP5903037B2 (ja) 2012-06-07 2012-12-21 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012129918 2012-06-07
JP2012129918 2012-06-07
JP2012280266A JP5903037B2 (ja) 2012-06-07 2012-12-21 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム

Publications (2)

Publication Number Publication Date
JP2014013556A JP2014013556A (ja) 2014-01-23
JP5903037B2 true JP5903037B2 (ja) 2016-04-13

Family

ID=50109185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012280266A Expired - Fee Related JP5903037B2 (ja) 2012-06-07 2012-12-21 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム

Country Status (1)

Country Link
JP (1) JP5903037B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4174399B2 (ja) * 2003-09-24 2008-10-29 株式会社東芝 検査システム,検査方法,及び電子装置の製造方法

Also Published As

Publication number Publication date
JP2014013556A (ja) 2014-01-23

Similar Documents

Publication Publication Date Title
CN106407051B (zh) 一种检测慢盘的方法及装置
US8775337B2 (en) Virtual sensor development
US8849738B2 (en) Predicting a user behavior number of a word
US20150088766A1 (en) Automated-valuation-model training-data optimization systems and methods
US8140319B2 (en) Method and system for predicting system performance and capacity using software module performance statistics
JP5437328B2 (ja) 観測値信頼度評価装置、観測値信頼度評価方法及び観測値信頼度評価プログラム
WO2020199662A1 (zh) 用于推送信息的方法和装置
US9432882B2 (en) System and method for deploying an RTT-based indoor positioning system
KR20080012907A (ko) 무선 장치에서 발생하는 이벤트에 지리적 위치를관련시키는 장치 및 방법
EP3770714B1 (en) Adaptive filter bank for modeling a thermal system
EP3770715B1 (en) Detecting diagnostic events in a thermal system
JP2019105927A (ja) 故障確率算出装置、故障確率算出方法及びプログラム
US10162867B2 (en) Low memory sampling-based estimation of distinct elements and deduplication
CN114356577A (zh) 一种系统容量预估方法以及装置
US10600007B2 (en) Auto-analyzing spatial relationships in multi-scale spatial datasets for spatio-temporal prediction
JP2005326412A (ja) 適応データ収集方法およびシステム
JP5903037B2 (ja) 信頼区間推定装置、信頼区間推定方法及び信頼区間推定プログラム
US20210149868A1 (en) Dynamic index management for computing storage resources
JP2009193205A (ja) 自動チューニングシステム、自動チューニング装置、自動チューニング方法
CN108133234B (zh) 基于稀疏子集选择算法的社区检测方法、装置及设备
JP5746255B2 (ja) 訪問poi推定装置、方法、プログラム、及びプログラムを記録したコンピュータ読取り可能な記録媒体
KR101831959B1 (ko) 빅데이터 분석 클라우드 서비스 시스템
KR102511439B1 (ko) Enf 신호를 획득하는 전자 장치 및 이의 동작 방법
JP6711768B2 (ja) 分散dbシステムおよびタイマ設定方法
CN113300905B (zh) 一种流量预测自适应调整方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160311

R150 Certificate of patent or registration of utility model

Ref document number: 5903037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees