JP5698167B2 - データ検定装置、データ検定方法、およびプログラム - Google Patents
データ検定装置、データ検定方法、およびプログラム Download PDFInfo
- Publication number
- JP5698167B2 JP5698167B2 JP2012041607A JP2012041607A JP5698167B2 JP 5698167 B2 JP5698167 B2 JP 5698167B2 JP 2012041607 A JP2012041607 A JP 2012041607A JP 2012041607 A JP2012041607 A JP 2012041607A JP 5698167 B2 JP5698167 B2 JP 5698167B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- average
- disturbance
- original data
- laplace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
Description
[プログラム、記録媒体]
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
100,110 検定統計量算出部
200,210 棄却限界値算出部
300,310 検定部
400 撹乱データ記憶部
Claims (5)
- 平均μ1で分散σ1 2の正規分布に従う元データx’に平均0で分散2b2のラプラス分布に従うノイズであるラプラスノイズを加算して撹乱した撹乱データxと、平均μ2で分散σ2 2の正規分布に従う元データy’に前記ラプラスノイズを加算して撹乱した撹乱データyとを用いて、前記元データx’の平均と前記元データy’の平均との間で有意な差があるか否かを検定するデータ検定装置であって、
平均μで分散σ2の正規分布に従うデータに平均0で分散2b2のラプラス分布に従うノイズを加算して撹乱した撹乱データの確率密度関数fは、相補誤差関数erfcを用いて
次式を計算して検定統計量を算出する検定統計量算出部と、
前記検定統計量が前記棄却限界値よりも大きい場合に、前記元データx’の平均と前記元データy’の平均との間で有意な差があると判定する検定部と、
を備えることを特徴とするデータ検定装置。 - 平均μ1で分散σ1 2の正規分布に従う元データx’に平均0で分散2b2のラプラス分布に従うノイズであるラプラスノイズを加算して撹乱した撹乱データxと、平均μ2で分散σ2 2の正規分布に従う元データy’に前記ラプラスノイズを加算して撹乱した撹乱データyとを用いて、前記元データx’の平均と前記元データy’の平均との間で有意な差があるか否かを検定するデータ検定装置であって、
平均μで分散σ2の正規分布に従うデータに平均0で分散2b2のラプラス分布に従うノイズを加算して撹乱した撹乱データの確率密度関数fは、相補誤差関数erfcを用いて
次式により検定統計量を算出する検定統計量算出部と、
を備えることを特徴とするデータ検定装置。 - 平均μ1で分散σ1 2の正規分布に従う元データx’に平均0で分散2b2のラプラス分布に従うノイズであるラプラスノイズを加算して撹乱した撹乱データxと、平均μ2で分散σ2 2の正規分布に従う元データy’に前記ラプラスノイズを加算して撹乱した撹乱データyとを用いて、前記元データx’の平均と前記元データy’の平均との間で有意な差があるか否かを検定するコンピュータによるデータ検定方法であって、
平均μで分散σ2の正規分布に従うデータに平均0で分散2b2のラプラス分布に従うノイズを加算して撹乱した撹乱データの確率密度関数fは、相補誤差関数erfcを用いて
検定統計量算出部が、次式を計算して検定統計量を算出する検定統計量算出ステップと、
検定部が、前記検定統計量が前記棄却限界値よりも大きい場合に、前記元データx’の平均と前記元データy’の平均との間で有意な差があると判定する検定ステップと、
を含むことを特徴とするデータ検定方法。 - 平均μ1で分散σ1 2の正規分布に従う元データx’に平均0で分散2b2のラプラス分布に従うノイズであるラプラスノイズを加算して撹乱した撹乱データxと、平均μ2で分散σ2 2の正規分布に従う元データy’に前記ラプラスノイズを加算して撹乱した撹乱データyとを用いて、前記元データx’の平均と前記元データy’の平均との間で有意な差があるか否かを検定するコンピュータによるデータ検定方法であって、
平均μで分散σ2の正規分布に従うデータに平均0で分散2b2のラプラス分布に従うノイズを加算して撹乱した撹乱データの確率密度関数fは、相補誤差関数erfcを用いて
検定統計量算出部が、次式により検定統計量を算出する検定統計量算出ステップと、
を含むことを特徴とするデータ検定方法。 - 請求項1または2に記載のデータ検定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012041607A JP5698167B2 (ja) | 2012-02-28 | 2012-02-28 | データ検定装置、データ検定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012041607A JP5698167B2 (ja) | 2012-02-28 | 2012-02-28 | データ検定装置、データ検定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013178637A JP2013178637A (ja) | 2013-09-09 |
JP5698167B2 true JP5698167B2 (ja) | 2015-04-08 |
Family
ID=49270217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012041607A Active JP5698167B2 (ja) | 2012-02-28 | 2012-02-28 | データ検定装置、データ検定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5698167B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6263620B2 (ja) * | 2014-07-04 | 2018-01-17 | 株式会社日立製作所 | 匿名化データ提供装置及び方法 |
CN105335896A (zh) * | 2014-08-13 | 2016-02-17 | 国家电网公司 | 用于电网的多源异构数据处理方法及装置 |
US11176272B2 (en) | 2018-09-12 | 2021-11-16 | The Nielsen Company (Us), Llc | Methods, systems, articles of manufacture and apparatus to privatize consumer data |
US11232179B2 (en) * | 2019-03-22 | 2022-01-25 | Microsoft Technology Licensing, Llc | Automated user identification for cross-platform group and device collaboration |
CN111784193B (zh) * | 2020-07-17 | 2024-03-26 | 中国人民解放军国防科技大学 | 基于正态分布的产品性能一致性检验方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040172401A1 (en) * | 2000-06-15 | 2004-09-02 | Peace Terrence B. | Significance testing and confidence interval construction based on user-specified distributions |
JP2010039756A (ja) * | 2008-08-05 | 2010-02-18 | Fuji Xerox Co Ltd | 独立性検定装置、データ解析装置、及び独立性検定プログラム |
-
2012
- 2012-02-28 JP JP2012041607A patent/JP5698167B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013178637A (ja) | 2013-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Philips | Have your cake and eat it too? Cointegration and dynamic inference from autoregressive distributed lag models | |
EP2814218B1 (en) | Detecting anomalies in work practice data by combining multiple domains of information | |
Krishna et al. | Too much automation? The bellwether effect and its implications for transfer learning | |
US7653615B2 (en) | Preserving privacy when statistically analyzing a large database | |
JP5698167B2 (ja) | データ検定装置、データ検定方法、およびプログラム | |
CN114117311B (zh) | 数据访问风险检测方法、装置、计算机设备及存储介质 | |
CN107168995B (zh) | 一种数据处理方法及服务器 | |
Drikvandi et al. | Diagnosing misspecification of the random‐effects distribution in mixed models | |
Li et al. | Training data debugging for the fairness of machine learning software | |
Park et al. | Perturbed gibbs samplers for generating large-scale privacy-safe synthetic health data | |
Li et al. | Sanitizing and minimizing databases for software application test outsourcing | |
Oh et al. | Advanced insider threat detection model to apply periodic work atmosphere | |
JP7026653B2 (ja) | クラスタリング装置、クラスタリング方法及びクラスタリングプログラム | |
Zhao et al. | Variable selection for recurrent event data with broken adaptive ridge regression | |
CN116340934A (zh) | 终端异常行为检测方法、装置、设备及存储介质 | |
Ding et al. | TraceDiag: Adaptive, Interpretable, and Efficient Root Cause Analysis on Large-Scale Microservice Systems | |
Rosenberg et al. | Spectrum-based log diagnosis | |
CN113642672A (zh) | 医保数据的特征加工方法、装置、计算机设备及存储介质 | |
Vertuam Neto et al. | On the use of online clustering for anomaly detection in trace streams | |
Bugayenko et al. | Extracting corrective actions from code repositories | |
Carterette | Model-based inference about IR systems | |
Talha et al. | Quality and Security in Big Data: Challenges as opportunities to build a powerful wrap-up solution. | |
Callegari et al. | Classification rule learning using subgroup discovery of cross-domain attributes responsible for design-silicon mismatch | |
Rabbi et al. | AI writes, we analyze: The ChatGPT python code saga | |
JP6486865B2 (ja) | データ撹乱装置、データ撹乱方法、データ撹乱プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5698167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |