JP6943242B2 - 分析装置、分析方法、およびプログラム - Google Patents
分析装置、分析方法、およびプログラム Download PDFInfo
- Publication number
- JP6943242B2 JP6943242B2 JP2018524061A JP2018524061A JP6943242B2 JP 6943242 B2 JP6943242 B2 JP 6943242B2 JP 2018524061 A JP2018524061 A JP 2018524061A JP 2018524061 A JP2018524061 A JP 2018524061A JP 6943242 B2 JP6943242 B2 JP 6943242B2
- Authority
- JP
- Japan
- Prior art keywords
- grouping
- analysis
- groups
- value
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本発明の第1の実施形態について説明する。
図2は、第1の実施形態の分析装置11の構成を示すブロック図である。分析装置11は、解析部113と、予測部114と、算出部115と、を備える。
分析装置11の主要な動作の流れを、図3のフローチャートに沿って説明する。
第1の実施形態の構成によれば、サンプルデータを削減することも追加することもなく、目的変数の値ごとのサンプル数の偏りの影響を低減したデータ分析を行うことができる。その理由は、各サンプルデータがグループにまとめられることによって、教師データにおける目的変数の値ごとのサンプル数の偏りが軽減されるからである。かつ、この分析においては、サンプルデータは削減も追加もされていない。
次に、本発明の第2の実施形態について説明する。
図4は、第2の実施形態に係る分析装置12の構成を示すブロック図である。
分割部111は、分析の範囲(すなわち、地域の範囲)を特定する。範囲の特定において、分割部111は、たとえば、ユーザから地域の範囲を指定する情報を取得する。分割部111は、データベース320から、地域の範囲を指定する情報を読み出してもよい。分割部111は、地域の範囲を指定する情報に基づいて、分析の範囲を特定すればよい。
組分け部112は、同じ列のセルを1つのグループにまとめる。図8は、組分け部112が同じ列のセルを1つのグループのまとめる様子を示す概念図である。図8に示す例では、組分け部112は、縦方向に並ぶセルが同じグループになるよう、5つのグループA1,A2,A3、A4,およびA5にまとめる。すなわち、組分け部112は、セルを5つのグループに分類する。
解析部113は、組分けごとに、グループを教師データの単位として機械学習を行う。具体的には、解析部113は、機械学習を以下のように行う。
予測部114は、解析部113が導出した予測式に基づいて、各グループの目的変数の予測値を算出する。具体的には、予測部114は、各グループの説明変数の値を予測式に代入することにより、そのグループの目的変数の予測値を得る。このとき用いられる各グループの説明変数の値は、たとえば、予測値を算出したい日の、説明変数の実測値もしくは予測値である。たとえば、信号機数や交差点数の値は、前日と同一の値が設定されてよい。自転車保有台数の値は、前日と同一の値または増減率を考慮した値が設定されればよい。天候は、天気予報等の情報から、尤もらしい値が設定されればよい。
算出部115は、予測部114が導出したグループの予測値に基づき、各セルの目的変数の値の目安となるスコアを算出する。
出力部116は、スコアに基づいた情報を出力する。たとえば、出力部116は、スコアが算出されたセルのうち、スコアの値が大きいセルを、事故が多く発生すると予測される場所として示す情報を出力する。
第2の実施形態に係る分析装置12の動作の流れを、図13に沿って説明する。
第2の実施形態に係る分析装置12によれば、分析の範囲を複数に分割することにより生成したセルの、予測したい目的変数の値の目安となるスコアを算出することができる。
分析装置12が扱う説明変数および目的変数は、機械学習の対象となりうる変数であれば何でもよい。目的変数は特定の種類の事件や事故の件数でもよい。その他、目的変数は、落雷件数、落とし物の届け出件数、小動物の死骸の発見件数、または公共物の破損があった数等でもよい。
上記第2の実施形態の説明では、組分け部112は、同じ列または行に並ぶセルを同一のグループとする組分けを行うが、組分けの方法(以下、「組分け法」と呼ぶ。)はこれらに限られない。
組分け部112は3種類以上の組分けを実行してもよい。そして、解析部113は、組分け部112が行った組分けのそれぞれに対して、予測式を導出してもよい。予測部114は、3種類以上の予測値を算出してもよい。
n×n個(nは2以上の整数)の分析対象に対して、変形例1で示されるような、「どの2つの分析対象も、任意の2つ以上の組分けにおいて異なるグループに属するような組分け法」が、n+1個作れる場合、算出部115は、分析対象(以下の説明では、セル)のスコアを、以下に示す方法で算出してもよい。以下、変形例3として、算出部115がセルのスコアを前述の方法とは異なる方法で算出する構成を説明する。
・当該セルが属するグループのすべての予測値の総和を算出し、
・算出された総和から、任意の組分けに基づいたグループの予測値の総和(Sとする)を減算し、
・減算された値をnで除する。
{(a1+b1+c1+d1+e1+f1)−S}/5
で算出される。
{(a4+b3+c2+d5+e3+f1)−S}/5
で算出される。
以上、説明した本発明の各実施形態において、各装置の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部または全部は、例えば図19に示すようなコンピュータ1900とプログラムとの可能な組み合わせにより実現される。コンピュータ1900は、一例として、以下のような構成を含む。
・ROM(Read Only Memory)1902
・RAM(Random Access Memory)1903
・RAM1903にロードされるプログラム1904Aおよび記憶情報1904B
・プログラム1904Aおよび記憶情報1904Bを格納する記憶装置1905
・記録媒体1906の読み書きを行うドライブ装置1907
・通信ネットワーク1909と接続する通信インタフェース1908
・データの入出力を行う入出力インタフェース1910
・各構成要素を接続するバス1911
各実施形態における各装置の各構成要素は、これらの機能を実現するプログラム1904AをCPU1901がRAM1903にロードして実行することで実現される。各装置の各構成要素の機能を実現するプログラム1904Aは、例えば、予め記憶装置1905やROM1902に格納されており、必要に応じてCPU1901が読み出す。なお、プログラム1904Aは、通信ネットワーク1909を介してCPU1901に供給されてもよいし、予め記録媒体1906に格納されており、ドライブ装置1907が当該プログラムを読み出してCPU1901に供給してもよい。
[付記1]
説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行する解析手段と、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行する予測手段と、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する算出手段と、
を備える分析装置。
[付記2]
前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
付記1に記載の分析装置。
[付記3]
前記解析手段は、前記機械学習分析を、3つ以上の前記組分けごとに実行し、
前記予測手段は、前記予測値の算出を、前記3つ以上の組分けごとに実行し、
前記算出手段は、前記スコアを、前記3つ以上の組分けごとに算出された、当該分析対象が属する前記グループの前記予測値のそれぞれを乗算することによって算出する、
付記1または2に記載の分析装置。
[付記4]
前記組分けについて、当該組分けによって生成するグループの目的変数の値のばらつきが所定の基準を外れるかを判定し、前記ばらつきが前記所定の基準を外れた場合に、新たに前記組分けを実行する、組分け手段をさらに備え、
前記解析手段は、前記ばらつきが所定の基準を外れないと判定された前記組分けによって生成する複数のグループについて前記機械学習分析を実行する、
付記1から付記3のいずれか一項に記載の分析装置。
[付記5]
n×n個(nは2以上の整数)の前記分析対象に対し、任意の2つの前記分析対象がいずれかただ1つの組分けにおいて同一のグループに属するようなn+1回の前記組分けを行う組分け手段をさらに備え、
前記算出手段は、前記分析対象のそれぞれの前記スコアを、当該分析対象が属するすべての前記グループについて算出された前記予測値の総和から、前記組分けのいずれかに基づいて算出された各グループの前記予測値の総和を引いた値を用いて、算出する、
付記1に記載の分析装置。
[付記6]
前記分析対象のうち前記スコアが高い方から所定数の前記分析対象を、他の前記分析対象とは異なる態様で表示する出力手段をさらに備える、
付記1から付記5のいずれか一項に記載の分析装置。
[付記7]
説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行し、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行し、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する、
分析方法。
[付記8]
前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
付記7に記載の分析方法。
[付記9]
前記機械学習分析を、3つ以上の前記組分けごとに実行し、
前記予測値の算出を、前記3つ以上の組分けごとに実行し、
前記スコアを、前記3つ以上の組分けごとに算出された、当該分析対象が属する前記グループの前記予測値のそれぞれを乗算することによって算出する、
付記7または8に記載の分析方法。
[付記10]
前記組分けについて、当該組分けによって生成するグループの目的変数の値のばらつきが所定の基準を外れるかを判定し、前記ばらつきが前記所定の基準を外れた場合に、新たに前記組分けを実行し、
前記ばらつきが所定の基準を外れないと判定された前記組分けによって生成する複数のグループについて前記機械学習分析を実行する、
付記7から付記9のいずれか一項に記載の分析方法。
[付記11]
n×n個(nは2以上の整数)の前記分析対象に対し、任意の2つの前記分析対象がいずれかただ1つの組分けにおいて同一のグループに属するようなn+1回の前記組分けを行い、
前記分析対象の前記スコアを、当該分析対象が属するすべての前記グループについて算出された前記予測値の総和から、前記組分けのいずれかに基づいて算出された各グループの前記予測値の総和を引いた値を用いて、算出する、
付記7に記載の分析方法。
[付記12]
前記分析対象のうち前記スコアが高い方から所定数の前記分析対象を、他の前記分析対象とは異なる態様で表示する、
付記7から付記11のいずれか一項に記載の分析方法。
[付記13]
コンピュータに、
説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行する解析処理と、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行する予測処理と、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する算出処理と、
を実行させるプログラム。
[付記14]
前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
付記13に記載のプログラム。
[付記15]
前記解析処理は、前記機械学習分析を、3つ以上の前記組分けごとに実行し、
前記予測処理は、前記予測値の算出を、前記3つ以上の組分けごとに実行し、
前記算出処理は、前記スコアを、前記3つ以上の組分けごとに算出された、当該分析対象が属する前記グループの前記予測値のそれぞれを乗算することによって算出する、
付記13または14に記載のプログラム。
[付記16]
コンピュータに、
前記組分けについて、当該組分けによって生成するグループの目的変数の値のばらつきが所定の基準を外れるかを判定し、前記ばらつきが前記所定の基準を外れた場合に、新たに前記組分けを実行する、組分け処理を実行させ、
前記解析処理は、前記ばらつきが所定の基準を外れないと判定された前記組分けによって生成する複数のグループについて前記機械学習分析を実行する、
付記13から付記15のいずれか一項に記載のプログラム。
[付記17]
コンピュータに、n×n個(nは2以上の整数)の前記分析対象に対し、任意の2つの前記分析対象がいずれかただ1つの組分けにおいて同一のグループに属するようなn+1回の前記組分けを行う組分け処理を実行させ、
前記算出処理は、前記分析対象のそれぞれの前記スコアを、当該分析対象が属するすべての前記グループについて算出された前記予測値の総和から、前記組分けのいずれかに基づいて算出された各グループの前記予測値の総和を引いた値を用いて、算出する、
付記13に記載のプログラム。
[付記18]
コンピュータに、前記分析対象のうち前記スコアが高い方から所定数の前記分析対象を、他の前記分析対象とは異なる態様で表示する出力処理を実行させる、
付記13から付記17のいずれか一項に記載のプログラム。
32 記憶装置
111 分割部
112 組分け部
113 解析部
114 予測部
115 算出部
116 出力部
320 データベース
1900 コンピュータ
1901 CPU
1902 ROM
1903 RAM
1904A プログラム
1904B 記憶情報
1905 記憶装置
1906 記録媒体
1907 ドライブ装置
1908 通信インタフェース
1909 通信ネットワーク
1910 入出力インタフェース
1911 バス
Claims (10)
- 説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行する解析手段と、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行する予測手段と、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する算出手段と、
を備える分析装置。 - 前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
請求項1に記載の分析装置。 - 前記解析手段は、前記機械学習分析を、3つ以上の前記組分けごとに実行し、
前記予測手段は、前記予測値の算出を、前記3つ以上の組分けごとに実行し、
前記算出手段は、前記スコアを、前記3つ以上の組分けごとに算出された、当該分析対象が属する前記グループの前記予測値のそれぞれを乗算することによって算出する、
請求項1または2に記載の分析装置。 - 前記組分けについて、当該組分けによって生成するグループの目的変数の値のばらつきが所定の基準を外れるかを判定し、前記ばらつきが前記所定の基準を外れた場合に、新たに前記組分けを実行する、組分け手段をさらに備え、
前記解析手段は、前記ばらつきが所定の基準を外れないと判定された前記組分けによって生成する複数のグループについて前記機械学習分析を実行する、
請求項1から3のいずれか一項に記載の分析装置。 - n×n個(nは2以上の整数)の前記分析対象に対し、任意の2つの前記分析対象がいずれかただ1つの組分けにおいて同一のグループに属するようなn+1回の前記組分けを行う組分け手段をさらに備え、
前記算出手段は、前記分析対象のそれぞれの前記スコアを、当該分析対象が属するすべての前記グループについて算出された前記予測値の総和から、前記組分けのいずれかに基づいて算出された各グループの前記予測値の総和を引いた値を用いて、算出する、
請求項1に記載の分析装置。 - 前記分析対象のうち前記スコアが高い方から所定数の前記分析対象を、他の前記分析対象とは異なる態様で表示する出力手段をさらに備える、
請求項1から5のいずれか一項に記載の分析装置。 - 説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行し、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行し、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する、
分析方法。 - 前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
請求項7に記載の分析方法。 - コンピュータに、
説明変数と目的変数とが関連づけられる複数の分析対象を分類する組分けによって生成する複数のグループについて、前記複数のグループの説明変数と目的変数との関係を導出する機械学習分析を、前記組分けごとに実行する解析処理と、
前記複数のグループの説明変数の値と前記関係とに基づいて、前記複数のグループの目的変数の値である予測値の算出を、前記組分けごとに実行する予測処理と、
前記分析対象に関するスコアを、前記組分けごとに算出された、当該分析対象が属する前記グループの前記予測値に基づく演算によって、算出する算出処理と、
を実行させるプログラム。 - 前記組分けにおいて同一のグループに属する前記分析対象のうちの任意の2つが、他の前記組分けにおいて異なるグループに属する、
請求項9に記載のプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016122843 | 2016-06-21 | ||
JP2016122843 | 2016-06-21 | ||
PCT/JP2017/022439 WO2017221856A1 (ja) | 2016-06-21 | 2017-06-19 | 分析装置、分析方法、および記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017221856A1 JPWO2017221856A1 (ja) | 2019-04-11 |
JP6943242B2 true JP6943242B2 (ja) | 2021-09-29 |
Family
ID=60783279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018524061A Active JP6943242B2 (ja) | 2016-06-21 | 2017-06-19 | 分析装置、分析方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6943242B2 (ja) |
WO (1) | WO2017221856A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6857332B2 (ja) * | 2018-03-13 | 2021-04-14 | オムロン株式会社 | 演算装置、演算方法、及びそのプログラム |
JP7292838B2 (ja) * | 2018-09-04 | 2023-06-19 | 株式会社日立製作所 | 事案発生抑止効果予測システム |
JP6775055B2 (ja) * | 2019-03-29 | 2020-10-28 | 株式会社Nttドコモ | リスク推定装置 |
JP6961312B2 (ja) * | 2019-09-03 | 2021-11-05 | 東芝情報システム株式会社 | 状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、及び状態変動検出用プログラム |
-
2017
- 2017-06-19 WO PCT/JP2017/022439 patent/WO2017221856A1/ja active Application Filing
- 2017-06-19 JP JP2018524061A patent/JP6943242B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2017221856A1 (ja) | 2019-04-11 |
WO2017221856A1 (ja) | 2017-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6943242B2 (ja) | 分析装置、分析方法、およびプログラム | |
CN110796284B (zh) | 细颗粒物污染等级的预测方法、装置及计算机设备 | |
US20210192586A1 (en) | Systems and Methods for Detecting and Responding to Anomalous Traffic Conditions | |
CN107657267B (zh) | 产品潜在用户挖掘方法及装置 | |
CN106844781B (zh) | 数据处理的方法及装置 | |
CN106919957B (zh) | 处理数据的方法及装置 | |
Singh et al. | Weather forecasting using machine learning techniques | |
CN106447075B (zh) | 行业用电需求预测方法与系统 | |
CN106452934B (zh) | 一种网络性能指标变化趋势的分析方法和装置 | |
CN108806254B (zh) | 城市交通走廊的识别方法、装置及计算机可读存储介质 | |
KR20140015812A (ko) | 1차원 수질모델 입력자료 생성지원을 위한 gis기반의 모식도 자동작성 시스템 및 모식도 작성 방법 | |
CN116034379A (zh) | 使用深度学习和机器学习的活动性水平测量 | |
CN115456695A (zh) | 一种店铺选址的分析方法、装置、系统及介质 | |
JP6879749B2 (ja) | 支援装置および支援方法 | |
CA3046873A1 (en) | A method of predicting a traffic behaviour in a road system | |
Kalair et al. | Dynamic and interpretable hazard-based models of traffic incident durations | |
JP2003256757A (ja) | 空間データ分析装置、空間データ分析方法、及び空間データ分析プログラム | |
CN110852322B (zh) | 感兴趣区域的确定方法及装置 | |
CN111121803B (zh) | 获取道路常用停靠点的方法及装置 | |
CN112151185A (zh) | 一种儿童呼吸疾病与环境数据关联分析方法及系统 | |
CN110796381A (zh) | 建模数据评价指标的处理方法、装置、终端设备及介质 | |
CN113688506B (zh) | 基于微站等多维数据的潜在大气污染源识别方法 | |
CN113723860B (zh) | 一种土地资源资产离任审计评价方法、装置及存储介质 | |
CN109063944A (zh) | 基于大数据分析技术的城市金融指数分析方法及装置 | |
CN115861816A (zh) | 一种立体低涡识别方法、装置、存储介质及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181206 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210810 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6943242 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |