JP2012529716A5 - - Google Patents

Download PDF

Info

Publication number
JP2012529716A5
JP2012529716A5 JP2012515111A JP2012515111A JP2012529716A5 JP 2012529716 A5 JP2012529716 A5 JP 2012529716A5 JP 2012515111 A JP2012515111 A JP 2012515111A JP 2012515111 A JP2012515111 A JP 2012515111A JP 2012529716 A5 JP2012529716 A5 JP 2012529716A5
Authority
JP
Japan
Prior art keywords
values
test data
information indicating
data source
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012515111A
Other languages
English (en)
Other versions
JP2012529716A (ja
JP5620984B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2010/038018 external-priority patent/WO2010144608A1/en
Publication of JP2012529716A publication Critical patent/JP2012529716A/ja
Publication of JP2012529716A5 publication Critical patent/JP2012529716A5/ja
Application granted granted Critical
Publication of JP5620984B2 publication Critical patent/JP5620984B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (36)

  1. テストデータを生成するための方法であって、
    データソースから複数のレコードの少なくとも1つのフィールドにおいて発生する値を読み取ること、
    上記値を特徴づける統計を含むプロファイル情報を格納すること、
    上記統計に基づいて上記フィールドについての確率分布のモデルを生成すること、
    所定の値が上記テストデータ値において発生する頻度が、上記生成されたモデルによってその所定の値に割り当てられた確率に対応するように、上記モデルを使用して複数のテストデータ値を生成すること、および
    上記テストデータ値を含むテストデータのコレクションをデータストレージシステムに格納すること、
    を含む方法。
  2. 上記生成されたモデルが、値の連続的な範囲に亘る確率密度に対応する確率分布の推定値の少なくとも第1の部分と、離散的な値についての1つ以上の離散的な確率値に対応する確率分布の推定値の少なくとも第2の部分と、を含む、
    請求項1に記載の方法。
  3. 上記統計情報が、値の複数の連続的な範囲のそれぞれに該当する値の数を示す情報を含む、
    請求項2に記載の方法。
  4. 上記第1の部分が、値の上記連続的な範囲の1つに該当する値の数を示す情報に少なくとも部分的に由来して導かれる、
    請求項3に記載の方法。
  5. 上記統計情報が、複数の特定の値のそれぞれが上記レコードにおいて発生する頻度を示す情報を含む、
    請求項2に記載の方法。
  6. 上記第2の部分における離散的な確率値の1つは、上記特定の値の1つが上記記録において発生する頻度を示す情報に少なくとも部分的に由来して導かれる、
    請求項5に記載の方法。
  7. 上記生成されたモデルと上記フィールドにおいて発生するデータソースから読み取られた値の特性を示す追加情報とを使用して上記複数のテストデータ値を生成することを更に含む、
    請求項1に記載の方法。
  8. 上記追加情報が、上記フィールドにおいて発生する無効な値の数を示す、
    請求項7に記載の方法。
  9. 上記追加情報が、上記フィールドにおいて発生する個別の値の割合を示す、
    請求項7に記載の方法。
  10. 上記データストレージシステムに格納されたテストデータのコレクションを使用して上記データソースに由来するレコードを処理するための少なくとも1つのプログラムを開発するための開発環境を提供することを更に含む、
    請求項1に記載の方法。
  11. 上記データソースに由来するレコードが上記開発環境にアクセスできない、
    請求項10に記載の方法。
  12. 上記データソースが上記開発環境にアクセスできない、
    請求項11に記載の方法。
  13. テストデータを生成するためのシステムであって、
    1つ以上のフィールドにおいて値を有するレコードを提供するデータソース、
    データストレージシステム、および
    実行環境を提供する上記データストレージシステムに結合された1つ以上のプロセッサであって、
    上記データソースから複数のレコードの少なくとも1つのフィールドにおいて発生する値を読み取り、
    上記値を特徴づける統計を含むプロファイル情報を格納し、
    上記統計に基づいて上記フィールドについての確率分布のモデルを生成し、
    所定の値が上記テストデータ値において発生する頻度が、上記生成されたモデルによってその所定の値に割り当てられた確率に対応するように、上記モデルを使用して複数のテストデータ値を生成し、そして
    上記テストデータ値を含むテストデータのコレクションを上記データストレージシステムに格納する、
    プロセッサ、
    を含むシステム。
  14. テストデータを生成するためのシステムであって、
    1つ以上のフィールドにおいて値を有するレコードを提供するデータソース、
    データストレージシステム、および
    上記レコードを処理してテストデータを生成するための手段、
    を含み、
    上記処理は、
    上記データソースから複数のレコードの少なくとも1つのフィールドにおいて発生する値を読み取ること、
    上記値を特徴づける統計を含むプロファイル情報を格納すること、
    上記統計に基づいて上記フィールドについての確率分布のモデルを生成すること、
    所定の値が上記テストデータ値において発生する頻度が、上記生成されたモデルによってその所定の値に割り当てられた確率に対応するように、上記モデルを使用して複数のテストデータ値を生成すること、および
    上記テストデータ値を含むテストデータのコレクションを上記データストレージシステムに格納すること、
    を含むシステム。
  15. 上記生成されたモデルが、値の連続的な範囲に亘る確率密度に対応する確率分布の推定値の少なくとも第1の部分と、離散的な値についての1つ以上の離散的な確率値に対応する確率分布の推定値の少なくとも第2の部分と、を含む、
    請求項13に記載のシステム。
  16. 上記統計情報が、値の複数の連続的な範囲のそれぞれに該当する値の数を示す情報を含む、
    請求項15に記載のシステム。
  17. 上記第1の部分が、値の上記連続的な範囲の1つに該当する値の数を示す情報に少なくとも部分的に由来して導かれる、
    請求項16に記載のシステム。
  18. 上記統計情報が、複数の特定の値のそれぞれが上記レコードにおいて発生する頻度を示す情報を含む、
    請求項15に記載のシステム。
  19. 上記第2の部分における離散的な確率値の1つは、上記特定の値の1つが上記記録において発生する頻度を示す情報に少なくとも部分的に由来して導かれる、
    請求項18に記載のシステム。
  20. 上記実行環境は、上記生成されたモデルと上記フィールドにおいて発生するデータソースから読み取られた値の特性を示す追加情報とを使用して上記複数のテストデータ値を生成する、
    請求項13に記載のシステム。
  21. 上記追加情報が、上記フィールドにおいて発生する無効な値の数を示す、
    請求項20に記載のシステム。
  22. 上記追加情報が、上記フィールドにおいて発生する個別の値の割合を示す、
    請求項20に記載のシステム。
  23. 上記実行環境は、上記データストレージシステムに格納されたテストデータのコレクションを使用して上記データソースに由来するレコードを処理するための少なくとも1つのプログラムを開発するための開発環境を提供する、
    請求項13に記載のシステム。
  24. 上記データソースに由来するレコードが上記開発環境にアクセスできない、
    請求項23に記載のシステム。
  25. 上記データソースが上記開発環境にアクセスできない、
    請求項24に記載のシステム。
  26. 上記生成されたモデルが、値の連続的な範囲に亘る確率密度に対応する確率分布の推定値の少なくとも第1の部分と、離散的な値についての1つ以上の離散的な確率値に対応する確率分布の推定値の少なくとも第2の部分と、を含む、
    請求項14に記載のシステム。
  27. 上記統計情報が、値の複数の連続的な範囲のそれぞれに該当する値の数を示す情報を含む、
    請求項26に記載のシステム。
  28. 上記第1の部分が、値の上記連続的な範囲の1つに該当する値の数を示す情報に少なくとも部分的に由来して導かれる、
    請求項27に記載のシステム。
  29. 上記統計情報が、複数の特定の値のそれぞれが上記レコードにおいて発生する頻度を示す情報を含む、
    請求項26に記載のシステム。
  30. 上記第2の部分における離散的な確率値の1つは、上記特定の値の1つが上記記録において発生する頻度を示す情報に少なくとも部分的に由来して導かれる、
    請求項29に記載のシステム。
  31. 上記実行環境は、上記生成されたモデルと上記フィールドにおいて発生するデータソースから読み取られた値の特性を示す追加情報とを使用して上記複数のテストデータ値を生成する、
    請求項14に記載のシステム。
  32. 上記追加情報が、上記フィールドにおいて発生する無効な値の数を示す、
    請求項31に記載のシステム。
  33. 上記追加情報が、上記フィールドにおいて発生する個別の値の割合を示す、
    請求項31に記載のシステム。
  34. 上記実行環境は、上記データストレージシステムに格納されたテストデータのコレクションを使用して上記データソースに由来するレコードを処理するための少なくとも1つのプログラムを開発するための開発環境を提供する、
    請求項14に記載のシステム。
  35. 上記データソースに由来するレコードが上記開発環境にアクセスできない、
    請求項34に記載のシステム。
  36. 上記データソースが上記開発環境にアクセスできない、
    請求項35に記載のシステム。
JP2012515111A 2009-06-10 2010-06-09 テストデータの生成方法 Active JP5620984B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US18579709P 2009-06-10 2009-06-10
US61/185,797 2009-06-10
PCT/US2010/038018 WO2010144608A1 (en) 2009-06-10 2010-06-09 Generating test data

Publications (3)

Publication Number Publication Date
JP2012529716A JP2012529716A (ja) 2012-11-22
JP2012529716A5 true JP2012529716A5 (ja) 2013-07-25
JP5620984B2 JP5620984B2 (ja) 2014-11-05

Family

ID=43307221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012515111A Active JP5620984B2 (ja) 2009-06-10 2010-06-09 テストデータの生成方法

Country Status (8)

Country Link
US (1) US9411712B2 (ja)
EP (1) EP2440882B1 (ja)
JP (1) JP5620984B2 (ja)
KR (2) KR101660853B1 (ja)
CN (1) CN102460076B (ja)
AU (1) AU2010258731B2 (ja)
CA (1) CA2764390C (ja)
WO (1) WO2010144608A1 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10102398B2 (en) 2009-06-01 2018-10-16 Ab Initio Technology Llc Generating obfuscated data
US20120041989A1 (en) * 2010-08-16 2012-02-16 Tata Consultancy Services Limited Generating assessment data
JP5651050B2 (ja) * 2011-03-08 2015-01-07 株式会社富士通マーケティング データ生成装置及びデータ生成プログラム
US20120330880A1 (en) * 2011-06-23 2012-12-27 Microsoft Corporation Synthetic data generation
US9460069B2 (en) 2012-10-19 2016-10-04 International Business Machines Corporation Generation of test data using text analytics
JP5933410B2 (ja) * 2012-10-25 2016-06-08 株式会社日立製作所 データベース分析装置及びデータベース分析方法
KR102026662B1 (ko) 2013-04-22 2019-09-30 삼성전자 주식회사 프로세서 검증을 위한 테스트 케이스 생성 장치 및 방법과, 검증장치
US9246935B2 (en) 2013-10-14 2016-01-26 Intuit Inc. Method and system for dynamic and comprehensive vulnerability management
US9313281B1 (en) 2013-11-13 2016-04-12 Intuit Inc. Method and system for creating and dynamically deploying resource specific discovery agents for determining the state of a cloud computing environment
CN104636404B (zh) * 2013-11-14 2019-02-19 华为技术有限公司 用于测试的大规模数据生成方法和装置
US20150169433A1 (en) * 2013-12-12 2015-06-18 Rafi Bryl Automated Generation of Semantically Correct Test Data for Application Development
WO2015095275A1 (en) 2013-12-18 2015-06-25 Ab Initio Technology Llc Data generation
US9501345B1 (en) 2013-12-23 2016-11-22 Intuit Inc. Method and system for creating enriched log data
US9323926B2 (en) 2013-12-30 2016-04-26 Intuit Inc. Method and system for intrusion and extrusion detection
US20150304343A1 (en) 2014-04-18 2015-10-22 Intuit Inc. Method and system for providing self-monitoring, self-reporting, and self-repairing virtual assets in a cloud computing environment
US9325726B2 (en) 2014-02-03 2016-04-26 Intuit Inc. Method and system for virtual asset assisted extrusion and intrusion detection in a cloud computing environment
US9866581B2 (en) 2014-06-30 2018-01-09 Intuit Inc. Method and system for secure delivery of information to computing environments
US10757133B2 (en) 2014-02-21 2020-08-25 Intuit Inc. Method and system for creating and deploying virtual assets
US9276945B2 (en) 2014-04-07 2016-03-01 Intuit Inc. Method and system for providing security aware applications
US20150269064A1 (en) * 2014-03-21 2015-09-24 Intuit Inc. Method and system for testing cloud based applications in a production environment using fabricated user data
US9245117B2 (en) 2014-03-31 2016-01-26 Intuit Inc. Method and system for comparing different versions of a cloud based application in a production environment using segregated backend systems
US11294700B2 (en) 2014-04-18 2022-04-05 Intuit Inc. Method and system for enabling self-monitoring virtual assets to correlate external events with characteristic patterns associated with the virtual assets
US9374389B2 (en) 2014-04-25 2016-06-21 Intuit Inc. Method and system for ensuring an application conforms with security and regulatory controls prior to deployment
US9319415B2 (en) 2014-04-30 2016-04-19 Intuit Inc. Method and system for providing reference architecture pattern-based permissions management
US9900322B2 (en) 2014-04-30 2018-02-20 Intuit Inc. Method and system for providing permissions management
US9330263B2 (en) 2014-05-27 2016-05-03 Intuit Inc. Method and apparatus for automating the building of threat models for the public cloud
US9473481B2 (en) 2014-07-31 2016-10-18 Intuit Inc. Method and system for providing a virtual asset perimeter
US10102082B2 (en) 2014-07-31 2018-10-16 Intuit Inc. Method and system for providing automated self-healing virtual assets
EP3191963B1 (en) 2014-09-08 2023-11-22 AB Initio Technology LLC Data-driven testing framework
US9558089B2 (en) * 2014-11-12 2017-01-31 Intuit Inc. Testing insecure computing environments using random data sets generated from characterizations of real data sets
JP6482338B2 (ja) * 2015-03-19 2019-03-13 株式会社エヌ・ティ・ティ・データ 質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム
US10409802B2 (en) * 2015-06-12 2019-09-10 Ab Initio Technology Llc Data quality analysis
EP3188038B1 (en) * 2015-12-31 2020-11-04 Dassault Systèmes Evaluation of a training set
CN106021097B (zh) * 2016-05-09 2019-02-26 北京航空航天大学 基于测试特征的软件可靠性指标区间估计方法
US20180293272A1 (en) * 2017-04-05 2018-10-11 Futurewei Technologies, Inc. Statistics-Based Multidimensional Data Cloning
CN107577604B (zh) * 2017-09-04 2020-12-22 北京京东尚科信息技术有限公司 测试数据的生成方法、装置和计算机可读存储介质
CN111213146B (zh) * 2017-10-13 2024-05-03 日本电信电话株式会社 伪数据生成装置、其方法和记录介质
KR102392642B1 (ko) * 2017-11-08 2022-04-29 한국전력공사 Cfg를 이용한 패턴 기반의 소프트웨어 절차변경 동작 감시 장치 및 그 방법
US11443837B2 (en) 2017-11-17 2022-09-13 International Business Machines Corporation Generation of test data for a data platform
CN108874666A (zh) * 2018-05-30 2018-11-23 平安普惠企业管理有限公司 测试数据自动生成方法、装置、计算机设备及存储介质
US11227065B2 (en) 2018-11-06 2022-01-18 Microsoft Technology Licensing, Llc Static data masking
US11269757B2 (en) * 2019-07-03 2022-03-08 Ownbackup Ltd. Production data in continuous integration flows
US10956301B2 (en) * 2019-07-03 2021-03-23 Ownbackup Ltd. Production data in continuous integration flows
US11188451B2 (en) * 2020-03-08 2021-11-30 Ownbackup Ltd. Test data generation for automatic software testing
KR102276290B1 (ko) 2020-04-10 2021-07-12 숭실대학교산학협력단 대용량 테스트 데이터 생성장치
US11841836B2 (en) 2021-01-04 2023-12-12 Ownbackup Ltd. Target environment data seeding
US11914503B2 (en) * 2021-09-01 2024-02-27 Sap Se Automated performance measurement over software lifecycle
CN114860575B (zh) * 2022-03-31 2023-10-03 中国电信股份有限公司 测试数据生成方法及装置、存储介质及电子设备
CN116303102B (zh) * 2023-05-19 2023-08-11 建信金融科技有限责任公司 测试数据的生成方法、装置、电子设备和存储介质

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664187A (en) * 1994-10-26 1997-09-02 Hewlett-Packard Company Method and system for selecting data for migration in a hierarchic data storage system using frequency distribution tables
JPH1030943A (ja) * 1996-07-15 1998-02-03 Ckd Corp センサ装置、表示装置及びデータ書き込み装置
US6581058B1 (en) * 1998-05-22 2003-06-17 Microsoft Corporation Scalable system for clustering of large databases having mixed data attributes
DE19911176A1 (de) 1999-03-12 2000-09-21 Lok Lombardkasse Ag Anonymisierungsverfahren
AU5782900A (en) 1999-06-30 2001-01-31 Stephen Billester Secure, limited-access database system and method
US6546389B1 (en) * 2000-01-19 2003-04-08 International Business Machines Corporation Method and system for building a decision-tree classifier from privacy-preserving data
US6567936B1 (en) * 2000-02-08 2003-05-20 Microsoft Corporation Data clustering using error-tolerant frequent item sets
JP2001256076A (ja) * 2000-03-08 2001-09-21 Ricoh Co Ltd テストデータ生成装置、テストデータ生成方法及び記録媒体
US7237123B2 (en) 2000-09-22 2007-06-26 Ecd Systems, Inc. Systems and methods for preventing unauthorized use of digital content
US20020138492A1 (en) 2001-03-07 2002-09-26 David Kil Data mining application with improved data mining algorithm selection
US7269578B2 (en) 2001-04-10 2007-09-11 Latanya Sweeney Systems and methods for deidentifying entries in a data source
US7266699B2 (en) 2001-08-30 2007-09-04 Application Security, Inc. Cryptographic infrastructure for encrypting a database
US7136787B2 (en) * 2001-12-19 2006-11-14 Archimedes, Inc. Generation of continuous mathematical model for common features of a subject group
US7080063B2 (en) * 2002-05-10 2006-07-18 Oracle International Corporation Probabilistic model generation
US7194317B2 (en) * 2002-08-22 2007-03-20 Air Products And Chemicals, Inc. Fast plant test for model-based control
US20040107189A1 (en) * 2002-12-03 2004-06-03 Lockheed Martin Corporation System for identifying similarities in record fields
US7324109B2 (en) * 2003-04-24 2008-01-29 Palmer James R Method for superimposing statistical information on tubular data
US7085981B2 (en) * 2003-06-09 2006-08-01 International Business Machines Corporation Method and apparatus for generating test data sets in accordance with user feedback
WO2005029369A2 (en) 2003-09-15 2005-03-31 Ab Initio Software Corporation Data profiling
US6957161B2 (en) * 2003-09-25 2005-10-18 Dell Products L.P. Information handling system including power supply self diagnostics
US7334466B1 (en) * 2005-01-04 2008-02-26 The United States Of America As Represented By The Secretary Of The Army Method and apparatus for predicting and evaluating projectile performance
US7672967B2 (en) * 2005-02-07 2010-03-02 Microsoft Corporation Method and system for obfuscating data structures by deterministic natural data substitution
JP2006236220A (ja) * 2005-02-28 2006-09-07 Ntt Data Technology Corp テスト用データファイル作成装置、方法、プログラム及び記録媒体
US7684963B2 (en) * 2005-03-29 2010-03-23 International Business Machines Corporation Systems and methods of data traffic generation via density estimation using SVD
US7565349B2 (en) * 2005-11-10 2009-07-21 International Business Machines Corporation Method for computing frequency distribution for many fields in one pass in parallel
KR100735012B1 (ko) * 2006-01-23 2007-07-03 삼성전자주식회사 제품 파라미터들의 통계적 분포 특성을 평가하는 방법
US7937693B2 (en) 2006-04-26 2011-05-03 9Rays.Net, Inc. System and method for obfuscation of reverse compiled computer code
US8209549B1 (en) 2006-10-19 2012-06-26 United Services Automobile Association (Usaa) Systems and methods for cryptographic masking of private data
US7724918B2 (en) 2006-11-22 2010-05-25 International Business Machines Corporation Data obfuscation of text data using entity detection and replacement
US8069129B2 (en) 2007-04-10 2011-11-29 Ab Initio Technology Llc Editing and compiling business rules
US7739249B2 (en) * 2007-04-16 2010-06-15 Sap, Ag Data generator apparatus testing data dependent applications, verifying schemas and sizing systems
JP4575416B2 (ja) 2007-10-29 2010-11-04 みずほ情報総研株式会社 テストデータ生成システム、テストデータ生成方法及びテストデータ生成プログラム
JP4986817B2 (ja) * 2007-11-13 2012-07-25 株式会社ソニーDadc 評価装置、評価方法、プログラム
US7877398B2 (en) 2007-11-19 2011-01-25 International Business Machines Corporation Masking related sensitive data in groups
WO2009139650A1 (en) 2008-05-12 2009-11-19 Business Intelligence Solutions Safe B.V. A data obfuscation system, method, and computer implementation of data obfuscation for secret databases
EP2189925A3 (en) 2008-11-25 2015-10-14 SafeNet, Inc. Database obfuscation system and method
US9298878B2 (en) 2010-07-29 2016-03-29 Oracle International Corporation System and method for real-time transactional data obfuscation
EP2668725B1 (en) 2011-01-28 2021-12-22 Ab Initio Technology LLC Generating data pattern information
US9558089B2 (en) * 2014-11-12 2017-01-31 Intuit Inc. Testing insecure computing environments using random data sets generated from characterizations of real data sets

Similar Documents

Publication Publication Date Title
JP2012529716A5 (ja)
Fahad et al. A comparative study of methods for measurement of energy of computing
Sollmann et al. How does spatial study design influence density estimates from spatial capture-recapture models?
JP5620984B2 (ja) テストデータの生成方法
US8850122B2 (en) Cache optimization via predictive cache size modification
Aikio et al. Herbarium records identify the role of long‐distance spread in the spatial distribution of alien plants in New Zealand
AU2017219167A1 (en) Graph query logic
JPWO2012086444A1 (ja) 監視データ分析装置、監視データ分析方法および監視データ分析プログラム
CN106649316A (zh) 一种视频推送方法及装置
Dong et al. Adaptive neural network-based approximation to accelerate eulerian fluid simulation
JP5282857B1 (ja) 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム
Navarro-Torres et al. Memory hierarchy characterization of SPEC CPU2006 and SPEC CPU2017 on the Intel Xeon Skylake-SP
CN104424361B (zh) 自动定义热存储和大工作负载
WO2009153793A1 (en) Incremental clustering of indexed xml data
US20130185236A1 (en) Monitoring data analyzing apparatus, monitoring data analyzing method, and monitoring data analyzing program
Laurenzano et al. Characterization and bottleneck analysis of a 64-bit ARMv8 platform
Bombi et al. Which climate change path are we following? Bad news from Scots pine
Worden et al. Projections of epidemic transmission and estimation of vaccination impact during an ongoing Ebola virus disease outbreak in Northeastern Democratic Republic of Congo, as of Feb. 25, 2019
CN106201857B (zh) 测试用例的选取方法及装置
Dey et al. Does the punishment fit the crime? Consequences and diagnosis of misspecified detection functions in Bayesian spatial capture–recapture modeling
CN109710470A (zh) 处理器重放调试方法及系统
GB2622538A (en) Database optimization using record correlation and intermediate storage media
US20120278030A1 (en) Computing device and method for configuring assembly information of a data center
Wu et al. Use of temporal contact graphs to understand the evolution of COVID-19 through contact tracing data
JP5651568B2 (ja) データベース撹乱装置、システム、方法及びプログラム