JP6812789B2 - 情報処理装置、情報処理プログラム、および情報処理方法 - Google Patents
情報処理装置、情報処理プログラム、および情報処理方法 Download PDFInfo
- Publication number
- JP6812789B2 JP6812789B2 JP2016256723A JP2016256723A JP6812789B2 JP 6812789 B2 JP6812789 B2 JP 6812789B2 JP 2016256723 A JP2016256723 A JP 2016256723A JP 2016256723 A JP2016256723 A JP 2016256723A JP 6812789 B2 JP6812789 B2 JP 6812789B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- test
- lower limit
- probability
- calculation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Biophysics (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
nは発症かつ変異ありの人数
xは変異ありの合計人数
Ncは発症の合計人数
Ntは集計表の合計人数
を表わす。クロス集計表内のn、x-n、Nc-n、およびNt-x-Nc+nは、観測度数といい、各項目の合計値を示すx、Nt-x、Nc、Nt-Nc、およびNtは、周辺度数を表わす。上述では、特定疾患の発症の有無を例としたが、商品購入の有無等でもよい。
・与えられたデータ(集計前データ42(図9))の特定事象発生有無をランダムに並べ替えて(permutation)、全ての検定について集計表を作成してp値を計算する。
・全ての検定の中から最小のp値を選択する。
・シミュレーションごとに得られた最小p値のセットから、最小p値の確率分布を数値的に求める。
・最小p値の確率分布をもとに多重検定補正の補正値を決定する。
情報処理装置100によって行われるp値算出処理を実現するプログラムは、例えば、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体19によって情報処理装置100に提供される。
(付記1)
多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する絞り込み部
を有する情報処理装置。
(付記2)
前記絞り込み部は、更に、
前記検定毎に前記偽陽性の確率の前記上限値を算出し、得られた複数の上限値から最小値を取得して前記所定の値に設定する上限値算出部と、
前記検定毎に前記偽陽性の確率の前記下限値を算出し、得られた複数の下限値の中から、前記所定の値よりも小さい下限値を選択する下限値算出部と、
前記下限値算出部が選択した前記所定の値よりも小さい下限値の検定に対して前記偽陽性の確率を算出する確率算出部と、
を有することを特徴とする付記1記載の情報処理装置。
(付記3)
前記絞り込み部は、更に、
前記検定毎に前記偽陽性の確率の前記上限値を算出し、得られた複数の上限値から最小値を取得する上限値算出部と、
前記最小値の検定の前記偽陽性の確率を算出して前記所定の値に設定する確率算出部と、
前記検定毎に前記偽陽性の確率の前記下限値を算出し、得られた複数の下限値から前記確率算出部が算出した前記所定の値よりも小さい下限値の検定を選択する下限値算出部とを有し、
前記確率算出部は、前記下限値算出部が選択した前記検定毎に前記偽陽性の確率を算出する
ことを特徴とする付記1記載の情報処理装置。
(付記4)
前記特定事象の発生有無と、該特定事象の発生有無との関連性に係る複数の属性の値を示す集計前データの特定事象発生有無の置き換え処理を行う置換処理部と、
前記特定事象発生有無がランダムに置き換えられた前記集計前データに基づいて、前記多重検定により得られた集計結果を示す前記集計後データを作成する集計処理部と、
を更に有する付記1乃至3のいずれか一項記載の情報処理装置。
(付記5)
取得した前記偽陽性の確率のセットの中から、有意水準補正値の算出対象となる最小の偽陽性の確率を選択して記憶部に追加する最小値選択部と、
前記記憶部に記憶されている前記最小の偽陽性の確率を用いて、有意水準補正値を算出する有意水準補正部と
前記有意水準補正値が収束するまで、前記置換処理部に前記置き換え処理を行わせる収束判定部と
を有する付記1乃至3のいずれか一項記載の情報処理装置。
(付記6)
多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する
処理をコンピュータに行わせる情報処理プログラム。
(付記7)
多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する
処理をコンピュータが行う情報処理方法。
9 利用者
11 CPU
12 主記憶装置
13 補助記憶装置
14 入力装置
15 表示装置
17 通信I/F
18 ドライブ装置
31 置換処理部
32 集計処理部
33 p値上限値算出部
34 p値下限値算出部
35 p値算出部
36 最小p値選択部
37 有意水準補正部
38 収束判定部
42 集計前データ
43 集計後データ
44 最小p値テーブル
54 p値算出部
55 p値下限値算出部
100 情報処理装置
Claims (6)
- 多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する絞り込み部
を有する情報処理装置。 - 前記絞り込み部は、更に、
前記検定毎に前記偽陽性の確率の前記上限値を算出し、得られた複数の上限値から最小値を取得して前記所定の値に設定する上限値算出部と、
前記検定毎に前記偽陽性の確率の前記下限値を算出し、得られた複数の下限値の中から、前記所定の値よりも小さい下限値を選択する下限値算出部と、
前記下限値算出部が選択した前記所定の値よりも小さい下限値の検定に対して前記偽陽性の確率を算出する確率算出部と、
を有することを特徴とする請求項1記載の情報処理装置。 - 前記絞り込み部は、更に、
前記検定毎に前記偽陽性の確率の前記上限値を算出し、得られた複数の上限値から最小値を取得する上限値算出部と、
前記最小値の検定の前記偽陽性の確率を算出して前記所定の値に設定する確率算出部と、
前記検定毎に前記偽陽性の確率の前記下限値を算出し、得られた複数の下限値から前記確率算出部が算出した前記所定の値よりも小さい下限値の検定を選択する下限値算出部とを有し、
前記確率算出部は、前記下限値算出部が選択した前記検定毎に前記偽陽性の確率を算出する
ことを特徴とする請求項1記載の情報処理装置。 - 前記特定事象の発生有無と、該特定事象の発生有無との関連性に係る複数の属性の値を示す集計前データの該特定事象の発生有無の置き換え処理を行う置換処理部と、
前記該特定事象の発生有無がランダムに置き換えられた前記集計前データに基づいて、前記多重検定により得られた集計結果を示す前記集計後データを作成する集計処理部と、
を更に有する請求項1乃至3のいずれか一項記載の情報処理装置。 - 多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する
処理をコンピュータに行わせる情報処理プログラム。 - 多重検定によって得られた特定事象の発生有無に係る集計後データに基づいて、検定毎に偽陽性の確率の上限値と下限値とを求め、求めた複数の上限値から、所定の値を設定し、設定した前記所定の値よりも小さい下限値の検定に対して該偽陽性の確率を算出し、該偽陽性の確率のセットを取得する
処理をコンピュータが行う情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016256723A JP6812789B2 (ja) | 2016-12-28 | 2016-12-28 | 情報処理装置、情報処理プログラム、および情報処理方法 |
US15/808,924 US11210599B2 (en) | 2016-12-28 | 2017-11-10 | Information processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016256723A JP6812789B2 (ja) | 2016-12-28 | 2016-12-28 | 情報処理装置、情報処理プログラム、および情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018109828A JP2018109828A (ja) | 2018-07-12 |
JP6812789B2 true JP6812789B2 (ja) | 2021-01-13 |
Family
ID=62629884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016256723A Active JP6812789B2 (ja) | 2016-12-28 | 2016-12-28 | 情報処理装置、情報処理プログラム、および情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11210599B2 (ja) |
JP (1) | JP6812789B2 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1362485B1 (en) * | 2001-02-12 | 2008-08-13 | Gracenote, Inc. | Generating and matching hashes of multimedia content |
JP5180822B2 (ja) | 2006-04-28 | 2013-04-10 | 独立行政法人理化学研究所 | バイオアイテム検索装置、バイオアイテム検索端末装置、バイオアイテム検索方法、および、プログラム |
JPWO2008090930A1 (ja) * | 2007-01-23 | 2010-05-20 | オリンパス株式会社 | 癌の診断方法 |
US20100274893A1 (en) * | 2009-04-27 | 2010-10-28 | Sonus Networks, Inc. | Methods and apparatus for detecting and limiting focused server overload in a network |
EP2387033A1 (en) * | 2010-05-11 | 2011-11-16 | Thomson Licensing | Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal |
WO2012013199A1 (en) * | 2010-07-26 | 2012-02-02 | Prysmian S.P.A. | Apparatus and method for monitoring an electric power transmission system through partial discharges analysis |
US9644241B2 (en) * | 2011-09-13 | 2017-05-09 | Interpace Diagnostics, Llc | Methods and compositions involving miR-135B for distinguishing pancreatic cancer from benign pancreatic disease |
CA2867481A1 (en) * | 2012-04-13 | 2013-10-17 | Somalogic, Inc. | Tuberculosis biomarkers and uses thereof |
EP2971177B1 (en) * | 2013-03-14 | 2019-09-11 | Neogenomics Laboratories, Inc. | Compositions and methods for detecting and determining a prognosis for prostate cancer |
DK3370515T3 (da) * | 2015-10-21 | 2022-05-02 | Redcoat Solutions Inc | Anordning til påvisning af væggelus |
-
2016
- 2016-12-28 JP JP2016256723A patent/JP6812789B2/ja active Active
-
2017
- 2017-11-10 US US15/808,924 patent/US11210599B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180181874A1 (en) | 2018-06-28 |
JP2018109828A (ja) | 2018-07-12 |
US11210599B2 (en) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5011830B2 (ja) | データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置 | |
US9292550B2 (en) | Feature generation and model selection for generalized linear models | |
JP7125358B2 (ja) | 計算機システム及び入力データに対する予測結果の根拠に関する情報の提示方法 | |
JP2018045559A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5985040B2 (ja) | データ解析装置、及びその方法 | |
JP6751376B2 (ja) | 最適解探索方法、最適解探索プログラム及び最適解探索装置 | |
WO2011078965A1 (en) | Methods and systems for high sigma yield estimation using reduced dimensionality | |
CN113555062B (zh) | 一种用于基因组碱基变异检测的数据分析系统及分析方法 | |
WO2011078930A1 (en) | Methods and systems for high sigma yield estimation | |
Mielniczuk et al. | Stopping rules for mutual information-based feature selection | |
WO2020086433A1 (en) | Methods and apparatus for phenotype-driven clinical genomics using a likelihood ratio paradigm | |
EP3779806A1 (en) | Automated machine learning pipeline identification system and method | |
JP6696568B2 (ja) | アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置 | |
US11126695B2 (en) | Polymer design device, polymer design method, and non-transitory recording medium | |
US20150120254A1 (en) | Model estimation device and model estimation method | |
US11650999B2 (en) | Database search enhancement and interactive user interface therefor | |
JP2014074994A (ja) | 評価支援方法、情報処理装置、及びプログラム | |
JP6812789B2 (ja) | 情報処理装置、情報処理プログラム、および情報処理方法 | |
JP6070337B2 (ja) | 物理故障解析プログラム、物理故障解析方法および物理故障解析装置 | |
Aldahmani et al. | Unbiased estimation for linear regression when n< v | |
JP2020161044A (ja) | データ管理システム、データ管理方法、およびデータ管理プログラム | |
JP6209492B2 (ja) | イベント同一性判定方法、イベント同一性判定装置、イベント同一性判定プログラム | |
US12039267B2 (en) | Automated categorization of data by generating unity and reliability metrics | |
WO2013115261A1 (ja) | データクレンジングシステムとデータクレンジング方法およびプログラム | |
JP2017157109A (ja) | 推定装置、推定方法および推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6812789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |