JP2015088155A - データ分析装置及び方法及びプログラム - Google Patents
データ分析装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP2015088155A JP2015088155A JP2014023953A JP2014023953A JP2015088155A JP 2015088155 A JP2015088155 A JP 2015088155A JP 2014023953 A JP2014023953 A JP 2014023953A JP 2014023953 A JP2014023953 A JP 2014023953A JP 2015088155 A JP2015088155 A JP 2015088155A
- Authority
- JP
- Japan
- Prior art keywords
- data
- point
- vectors
- outlier
- change point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 64
- 238000007405 data analysis Methods 0.000 title claims description 27
- 239000013598 vector Substances 0.000 claims abstract description 95
- 238000004364 calculation method Methods 0.000 claims abstract description 41
- 238000001514 detection method Methods 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims 2
- 230000001186 cumulative effect Effects 0.000 claims 1
- 238000013500 data storage Methods 0.000 description 31
- 238000007781 pre-processing Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 15
- 238000007726 management method Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003070 Statistical process control Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】 本発明は、与えられた2次元データからデータから2つの隣接するベクトルを作成し、2つのベクトルのなす角、または、該2つのベクトルのなす角の和を用いて、該2つのベクトルのなす角の算出元であるデータが、外れ値、変化点候補、直線領域、曲線領域のいずれであるかを判定する。
【選択図】 図1
Description
前記2次元データから2つの隣接するベクトルを作成し、該2つの隣接するベクトルから2つのベクトルのなす角を、ベクトル外積を用いて計算するベクトル・なす角作成手段と、
前記2つのベクトルのなす角およびその平均、または、該2つのベクトルのなす角の和を用いて、該2つのベクトルのなす角の算出元であるデータが、外れ値、変化点候補、直線領域、曲線領域のいずれであるかを判定する検出手段と、
を有するデータ分析装置が提供される。
変化点の前後でデータは急に大きく変化し、変化点ではないところでは変動はしていてもその変動は小さい。この小さい変動を無視すればデータは時間に対して線形的に遷移しているといえる。そうでない場合に対しても何らかの変換を行うことで線形的に遷移するように変換できる場合を扱う。つまり、データは区分的に線で近似できるため、変動部分を除けば時間経過に対して常に同じ方向に成長しているといえる。
本実施の形態では、コンピュータグラフィックスにおける2次元上のデータを対象として、変化点、直線領域、曲線領域、外れ値を検出する。
コンピュータグラフィックスへの応用の場合、描く図形が閉曲線のように同じtkに対して複数のdkを持つある場合がある。この場合、閉曲線分割部250にて以下の処理を行う。なお、データ分析においては同じtkに対して1つのdkを持つため、閉曲線分割部250及び以下に説明する内容は不要である。
[2-1]事前処理
図8は、本発明の第2の実施の形態における事前処理のフローチャートである。
次に、計算部240で曲線領域、変化点、外れ値、直線領域を検出する方法を説明する。
曲線領域の検出について説明する。
次に変化点の検出について説明する。
次に、外れ点の検出について説明する。
最後に直線領域の検出について説明する。
次に、元データ(tk,dk) (k=1,2,…,n),ベクトルvk (k=2,3,…,n)、なす角θk(k=3,4,…,n)、なす角の和
dk=btk+c (25)
として、例えば最小二乗法でパラメータb,cを求める。
110 データ入力部
120 事前処理部
130 ベクトル作成部
140 なす角作成部
150 データ蓄積部
160 統計値計算部
170 パラメータ入力部
180 信頼区間判定部
190 結果出力部
200 データ分析装置
210 データ入力部
220 管理図データ作成部
221 ベクトル作成部
222 なす角の和作成部
223 群作成部
230 データ蓄積部
240 計算部
241 R管理図計算部
242 X−管理図計算部
250 閉曲線分割部
260 結果出力部
Claims (11)
- 与えられた2次元データを分析するデータ分析装置であって、
前記2次元データから2つの隣接するベクトルを作成し、該2つの隣接するベクトルから2つのベクトルのなす角を、ベクトル外積を用いて計算するベクトル・なす角作成手段と、
前記2つのベクトルのなす角、または、該2つのベクトルのなす角の和を用いて、該2つのベクトルのなす角の算出元であるデータが、外れ値、変化点候補、直線領域、曲線領域のいずれであるかを判定する検出手段と、
を有することを特徴とするデータ分析装置。 - 前記検出手段は、
前記なす角の平均と前記なす角の標準偏差を求める統計値計算手段と、
前記なす角の平均と前記なす角の標準偏差から信頼区間を算出し、各なす角が該信頼区間内に含まれるか否かにより、該なす角の算出元であるデータが外れ値または変化点候補であるかを判定する信頼区間判定手段と、
を含む請求項1記載のデータ分析装置。 - データ毎に前記ベクトルのなす角の累積値を算出するなす角の累積値算出手段と、
なす角の累積値を予め決められた数をまとめる群kを作成し、該群kからシューハートのX―−R管理図を生成する管理図計算手段と、
を更に有し、
前記検出手段は、
前記X―−R管理図の管理限界を算出し、各群の内部での平均、レンジが該X―−R管理図の管理限界内に含まれるか否かにより、前記なす角の算出元であるデータが外れ値、あるいは、変化点であることを判定する外れ値・変化点判定手段を含む
請求項1記載のデータ分析装置。 - 前記信頼区間判定手段は、
前記外れ値を含みN(≧3)点での前記なす角の平均を計算し、該平均の信頼区間を計算し、該平均が該平均の信頼区間に含まれていなければ変化点と判定する手段を含む
請求項2記載のデータ分析装置。 - 前記信頼区間判定手段は、
前記統計値計算手段で求められた前記なす角の標準偏差が大きい場合に、与えられたデータに対して移動平均による平滑化を行った後、前記外れ値及び前記変化点候補であることを判定する手段を含む
請求項2記載のデータ分析装置。 - 前記検出手段は、
前記群kの各点から該群kの内部での平均を求め、前記X―−R管理図の個々の測定値を時系列に管理するX−管理図のX−の値が所定の点の個数以上連続して増加または減少する区間がある場合には、X−の点を曲線構成点とし、その領域を曲線領域とし、該曲線領域と隣接する未分類点領域で連続しない単独の点を除くことで該曲線領域と合わせて増加または減少となっている拡張曲線構成点がある場合は、該拡張曲線構成点を含めて曲線領域とする曲線領域検出手段を含む
請求項3記載のデータ分析装置。 - 前記検出手段は、
前記X―−R管理図のデータの範囲によって管理するR管理図を用いて、前記群の各点から該群の内部での最大値から最小値を引いたレンジRを求め、R管理限界外の点をR変化点とし、該R変化点に挟まれている単独のR管理限界内の点がある場合は、該R管理限界内の点を含めて変化点とする変化点検出手段を含む
請求項3記載のデータ分析装置。 - 前記検出手段は、前記曲線領域検出手段の後に、
前記X―−R管理図の個々の測定値を時系列に管理する X−管理図を用いて、該X−管理図で管理限界外の点があるかを判定し、ある場合は、X−管理限界外の点をX−変化点とし、管理限界外の点がない場合は未分類点を直線構成点として未分類点領域を直線領域とする直線領域検出手段を含む
請求項6記載のデータ分析装置。 - 与えられたコンピュータグラフィックスの2次元データ(tk,dk)を分析するデータ分析装置であって、
前記コンピュータグラフィックスの2次元データ(tk,dk)について、同じtkに対して複数のdkを持つ場合には、該同じtkに対して一つのdkをもつようにデータを複数の組に分ける閉曲線分割手段を有し、
前記閉曲線分割手段は、
前記tkに対して前記dkが連続していない場合の閉曲線の場合には、該tkごとに該dkの数を計数し、最もdkの多い領域ごとに組に分け、該tkに対して該dkが連続している場合には、該dkが連続している辺の端点以外を削除して組に分ける手段を含む
ことを特徴とするデータ分析装置。 - 与えられた2次元データを分析するデータ分析方法であって、
データ分析装置において、
前記2次元データから2つの隣接するベクトルを作成し、該2つの隣接するベクトルから2つのベクトルのなす角を、ベクトル外積を用いて計算するベクトル・なす角作成ステップと、
前記2つのベクトルのなす角、または、該2つのベクトルのなす角の和を用いて、該2つのベクトルのなす角の算出元であるデータが、外れ値、変化点候補、直線領域、曲線領域のいずれであるかを判定する検出ステップと、
を有することを特徴とするデータ分析方法。 - コンピュータを、
請求項1乃至9のいずれか1項に記載のデータ分析装置の各手段として機能させるためのデータ分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014023953A JP6182473B2 (ja) | 2013-09-25 | 2014-02-12 | データ分析装置及び方法及びプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013198464 | 2013-09-25 | ||
JP2013198464 | 2013-09-25 | ||
JP2014023953A JP6182473B2 (ja) | 2013-09-25 | 2014-02-12 | データ分析装置及び方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016240204A Division JP6259058B2 (ja) | 2013-09-25 | 2016-12-12 | データ分析装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015088155A true JP2015088155A (ja) | 2015-05-07 |
JP6182473B2 JP6182473B2 (ja) | 2017-08-16 |
Family
ID=53050808
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014023953A Expired - Fee Related JP6182473B2 (ja) | 2013-09-25 | 2014-02-12 | データ分析装置及び方法及びプログラム |
JP2016240204A Active JP6259058B2 (ja) | 2013-09-25 | 2016-12-12 | データ分析装置及び方法及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016240204A Active JP6259058B2 (ja) | 2013-09-25 | 2016-12-12 | データ分析装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP6182473B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457370A (zh) * | 2019-08-12 | 2019-11-15 | 渤海大学 | 基于人工智能的数据挖掘中孤立点检测系统及清理方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6975296B1 (ja) * | 2020-08-17 | 2021-12-01 | ウィンボンド エレクトロニクス コーポレーション | 半導体記憶装置および動作方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02278480A (ja) * | 1989-04-20 | 1990-11-14 | Toshiba Corp | 直線ショートベクトル列によって表された形状の直線部と曲線部の切り分け方法 |
JPH1153561A (ja) * | 1997-07-30 | 1999-02-26 | Sony Corp | 経路探査装置および方法、輪郭曲線生成装置および方法、輪郭曲線編集装置および方法、並びにプログラムを記録した記録媒体 |
JP2012150280A (ja) * | 2011-01-19 | 2012-08-09 | Mitsubishi Precision Co Ltd | 第1の図形と第2の図形との間の位置関係を決定する方法、そのような方法を用いる装置、そのような方法のプログラム及び自動車運転模擬装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273508A (ja) * | 2000-03-24 | 2001-10-05 | Matsushita Electric Ind Co Ltd | 画像処理装置 |
EP2400410B1 (en) * | 2010-05-25 | 2014-01-08 | Dassault Systèmes | Computing of a resulting closed triangulated polyhedral surface from a first and a second modeled object |
JP5687612B2 (ja) * | 2011-12-21 | 2015-03-18 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
-
2014
- 2014-02-12 JP JP2014023953A patent/JP6182473B2/ja not_active Expired - Fee Related
-
2016
- 2016-12-12 JP JP2016240204A patent/JP6259058B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02278480A (ja) * | 1989-04-20 | 1990-11-14 | Toshiba Corp | 直線ショートベクトル列によって表された形状の直線部と曲線部の切り分け方法 |
JPH1153561A (ja) * | 1997-07-30 | 1999-02-26 | Sony Corp | 経路探査装置および方法、輪郭曲線生成装置および方法、輪郭曲線編集装置および方法、並びにプログラムを記録した記録媒体 |
JP2012150280A (ja) * | 2011-01-19 | 2012-08-09 | Mitsubishi Precision Co Ltd | 第1の図形と第2の図形との間の位置関係を決定する方法、そのような方法を用いる装置、そのような方法のプログラム及び自動車運転模擬装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457370A (zh) * | 2019-08-12 | 2019-11-15 | 渤海大学 | 基于人工智能的数据挖掘中孤立点检测系统及清理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6182473B2 (ja) | 2017-08-16 |
JP6259058B2 (ja) | 2018-01-10 |
JP2017102931A (ja) | 2017-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017020723A1 (zh) | 一种字符分割方法、装置及电子设备 | |
JP7132050B2 (ja) | テキスト行の区分化方法 | |
Khan et al. | An improved K-means clustering algorithm based on an adaptive initial parameter estimation procedure for image segmentation | |
EP3876201B1 (en) | Object detection and candidate filtering system | |
JP6259058B2 (ja) | データ分析装置及び方法及びプログラム | |
US11941329B2 (en) | Method for analyzing fuselage profile based on measurement data of whole aircraft | |
JP2020119447A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
WO2022033015A1 (zh) | 图像中异常区域的处理方法、装置和图像分割方法、装置 | |
CN113705617A (zh) | 点云数据的处理方法、装置、计算机设备和存储介质 | |
Chang et al. | Multi-agent distributed large-scale optimization by inexact consensus alternating direction method of multipliers | |
Groeneboom | Vertices of the least concave majorant of Brownian motion with parabolic drift | |
KR101890536B1 (ko) | 건설 시공 단계에서의 3차원 설계 모델 데이터와 레이저 스캔 데이터 간 비교 분석을 위한 차별적 데이터 감소 방법 및 시스템 | |
WO2015162748A1 (ja) | データ変換装置およびデータ変換方法 | |
CN113221792B (zh) | 一种章节检测模型构建方法、编目方法及其相关设备 | |
JP6213665B2 (ja) | 情報処理装置、及び、クラスタリング方法 | |
Gauthier et al. | Digitized 3D mesh segmentation based on curvature analysis | |
Kaloga et al. | Discrete mumford–shah on graph for mixing matrix estimation | |
Yan et al. | TopoSZ: Preserving Topology in Error-Bounded Lossy Compression | |
CN117280356A (zh) | 学习装置、学习方法、图像处理装置和图像处理方法 | |
CN106055669A (zh) | 一种数据离散化方法及系统 | |
Ndubuaku et al. | Cloud-assisted adaptive stream processing from discriminative representations | |
CN111666439A (zh) | 针对云端环境快速提取和划分医学影像大数据的工作方法 | |
Gruzman et al. | Detection of quasiperiodic textures with the use of two-dimensional power spectrum characteristics | |
CN106340029A (zh) | 基于Beta‑Gamma散度的灰度图像阈值分割方法 | |
CN112988924A (zh) | 一种基于样条函数插值算法的空间gis插值方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170724 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6182473 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |