JP6699066B2 - フィッシャー正確検定計算装置、方法及びプログラム - Google Patents

フィッシャー正確検定計算装置、方法及びプログラム Download PDF

Info

Publication number
JP6699066B2
JP6699066B2 JP2018526337A JP2018526337A JP6699066B2 JP 6699066 B2 JP6699066 B2 JP 6699066B2 JP 2018526337 A JP2018526337 A JP 2018526337A JP 2018526337 A JP2018526337 A JP 2018526337A JP 6699066 B2 JP6699066 B2 JP 6699066B2
Authority
JP
Japan
Prior art keywords
fisher
exact test
calculation
result
summary table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018526337A
Other languages
English (en)
Other versions
JPWO2018008544A1 (ja
Inventor
長谷川 聡
聡 長谷川
浩気 濱田
浩気 濱田
千田 浩司
浩司 千田
正朗 長▲崎▼
正朗 長▲崎▼
計治 三澤
計治 三澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Nippon Telegraph and Telephone Corp filed Critical Tohoku University NUC
Publication of JPWO2018008544A1 publication Critical patent/JPWO2018008544A1/ja
Application granted granted Critical
Publication of JP6699066B2 publication Critical patent/JP6699066B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biotechnology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Genetics & Genomics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Storage Device Security (AREA)

Description

この発明は、フィッシャー正確検定(Fisher’s exact test)を効率良く計算する技術に関する。
統計学的検定法の一つとして、フィッシャー正確検定が広く知られている。フィッシャー正確検定の利用例として、ゲノムワイド関連解析(GWAS: Genome-Wide Association Study)がある(例えば、非特許文献1参照。)。以下、フィッシャー正確検定について簡単に説明する。
Figure 0006699066
この表は、n人の被験者を形質(X又はY)と特定のアレル(A又はG)で分類して数え上げした2x2の集計表の例である。a,b,c,dは度数(非負整数)を表す。フィッシャー正確検定は、非負整数iについて、
Figure 0006699066
としたとき、
Figure 0006699066
と所定の値の閾値Tとの大小関係で、形質と特定のアレルの間に統計学的に有意な関連があるかどうか判定するものである。ゲノムワイド関連分析では、各々の一塩基多型(SNP:Single Nucleotide Polymorphism)毎に上記のような集計表を作成し、各集計表についてフィッシャー正確検定を行う場合がある。ゲノムワイド関連解析では、数百万数千万という膨大な数のSNPが対象となる。したがって、ゲノムワイド関連分析では大量にフィッシャー正確検定を行う場面があり得る。
一方、ゲノム情報の機微性や機密性から、ゲノム情報を暗号技術によって秘匿しつつゲノムワイド関連解析を行う先行研究がある(例えば、非特許文献2参照。)。非特許文献2ではゲノム情報を秘匿しつつカイ2乗検定を行う方法が提案されている。
Konrad Karczewski, "How to do a GWAS", GENE 210: Genomics and Personalized Medicine, 2015. Yihua Zhang, Marina Blanton, and Ghada Almashaqbeh, "Secure distributed genome analysis for GWAS and sequence comparison computation", BMC medical informatics and decision making, Vol. 15, No. Suppl 5, p. S4, 2015.
フィッシャー正確検定では、1回あたり最大でn/2種類のpiの計算が必要となり、特にゲノムワイド関連解析では大量の集計表に対してそれぞれフィッシャー正確検定を行う場合があるため、計算機環境や集計表の度数によっては膨大な処理時間を要する可能性がある。
この発明の目的は、従来よりも効率良く、複数回のフィッシャー正確検定の計算を行うフィッシャー正確検定計算装置、方法及びプログラムを提供することである。
この発明の一態様によるフィッシャー正確検定計算装置は、有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を、フィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいて複数の集計表の中から選択する選択部と、選択された集計表のそれぞれについてフィッシャー正確検定の計算を行う計算部と、を備えており、選択部は、複数の集計表の度数を秘密計算により秘匿化した状態で、集計表の選択を行う
従来よりも効率良く、複数回のフィッシャー正確検定の計算を行うことができる。具体的には、計算リソースの使用量の削減や処理時間の削減の効果が期待できる。
フィッシャー正確検定計算装置の例を説明するためのブロック図。 フィッシャー正確検定計算方法の例を説明するための流れ図。
以下、図面を参照して、この発明の一実施形態について説明する。
フィッシャー正確検定計算装置は、図1に示すように、選択部4と計算部2を例えば備えている。フィッシャー正確検定計算方法は、フィッシャー正確検定計算装置の各部が図2及び以下に説明するステップS4,ステップS2の処理を行うことにより実現される。
<選択部4>
このフィッシャー正確検定計算装置及び方法は、mを正の整数として、m個の集計表のそれぞれについてフィッシャー正確検定の計算をすることはしない。その代わりに、例えば、フィッシャー正確検定の結果(pが有意水準である閾値Tより小さければ統計学的に有意な関連があると見なして“TRUE”、そうでなければ“FALSE”とする)がFALSEとなる十分条件の条件式を与える。そして、この条件式を満たさない集計表、言い換えればフィッシャー正確検定の結果が必ずFALSEとなる集計表を切り捨てる。切り捨てた集計表についてはp値の計算を行わず、切り捨てられなかった集計表、言い換えれば有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表についてのみ、フィッシャー正確検定の計算を行う。
そのために、まず、選択部4は、有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を、フィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいて複数の集計表(m個の集計表)の中から選択する(ステップS4)。選択された集計表についての情報は、計算部2に出力される。
フィッシャー正確検定の結果がFALSEとなる十分条件の条件式の例は、pa≧T(またはpa>T)である。paは、i=aの場合のpiである。paは、以下の式により定義される。
Figure 0006699066
pa≧Tである場合にはpの定義から必ずp≧Tとなる。このため、pa≧Tは、フィッシャー正確検定の結果がFALSEとなる十分条件の条件式と言える。
フィッシャー正確検定の結果がFALSEとなる十分条件の条件式がpa≧Tである場合には、選択部4は、各集計表の度数に基づいてpaを計算しpa≧Tであるか判断し、pa≧Tでないと判断された集計表、言い換えればpa<Tとなる集計表を選択する。
<計算部2>
計算部2は、選択部4により選択された集計表のそれぞれについてフィッシャー正確検定の計算を行う(ステップS2)。フィッシャー正確検定の計算は、既存の任意の計算方法を用いることができる。
フィッシャー正確検定では、1回あたり最大でn/2種類のpiの計算が必要となるため、paの計算だけでよければ、計算回数は最大で2/n倍に削減される。n=1000であれば、1/500の計算回数に削減できることになる。ただし、pa<Tとなる集計表についてはフィッシャー正確検定を行う必要があるため、pa<Tとなる集計表の割合が小さいほど良い。実際に、NBDCヒトデータベース(参考文献1)に登録・公開されているゲノムデータの集計表(非制限公開データ)を利用して実験したところ、以下の表のようになった。
Figure 0006699066
利用したデータ(データ1〜4)は下表のとおりである。
Figure 0006699066
例えば、データ1について、pa<Tとなる集計表の割合は13/455781≒0.00285%と十分小さく、pを求める計算回数をpaの計算回数のn/2倍とすれば、通常の方法で全てのSNPのpを求める計算回数はpaの計算回数のM×n/2=455781×(1666+3198)/2=1,108,459,392倍となるが、本発明によりpa<Tとなる集計表を求め、当該集計表のpのみ求める場合、その計算回数はpaの計算回数のM+L×n/2=455781+13×(1666+3198)/2=519,013倍となり、通常の方法で全てのSNPのpを求める計算回数と比べ519,013/1,108,459,392≒1/2135.7程度の計算回
数で済む。ただしMはSNP数、Lはpa<Tとなる集計表の数とする。
〔参考文献1〕NBDC ヒトデータベース, インターネット
〈URL:http://humandbs.biosciencedbc.jp/〉
本実験に使用したデータは、オーダーメイド医療実現化プロジェクト(代表者理化学研究所ゲノム医科学研究センター中村祐輔センター長)、オーダーメイド医療の実現プログラム(代表者理化学研究所統合生命医科学研究センター久保充明副センター長)、ならびに感覚器未来医療学(代表者京都府立医科大学医学研究科上田真由美准教授)によって取得され、科学技術振興機構(JST)の「バイオサイエンスデータベースセンター(NBDC)」ウェブサイト(http://humandbs.biosciencedbc.jp/)を通じて提供されたものである。
なお、計算部2は、入力されたフィッシャー正確検定の対象となる集計表の度数(a,b,c,d)を秘密計算により秘匿化した状態で、その集計表の度数(a,b,c,d)に対応するフィッシャー正確検定の結果を得るための計算を行ってもよい。この秘密計算は、例えば参考文献2,3に記載されている既存の秘密計算技術により実現することができる。
〔参考文献2〕Ivan Damgard, Matthias Fitzi, Eike Kiltz, Jesper Buus Nielsen and Tomas Toft, "Unconditionally secure constant-rounds multi-party computation for equality, comparison, bits and exponentiation", In Proc. 3rd Theory of Cryptography Conference, TCC 2006, volume 3876 of Lecture Notes in Computer Science, pages 285-304, Berlin, 2006, Springer-Verlag
〔参考文献3〕Takashi Nishide, Kazuo Ohta, "Multiparty Computation for Interval, Equality, and Comparison Without Bit-Decomposition Protocol", Public Key Cryptography - PKC 2007, 10th International Conference on Practice and Theory in Public-Key Cryptography, 2007, P.343-360
このように、有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表についてのみフィッシャー正確検定の計算を行うことにより、言い換えれば、フィッシャー正確検定の結果が明らかにFALSEとなる集計表についてはpの演算を行わないことにより、複数の集計表についてのフィッシャー正確検定の計算量を減らすことができる。
なお、演算の削減効果について、p a の計算は、
Figure 0006699066
より、
Figure 0006699066
であるから、k=0,1,2,…,nについてΣj=1 k log jを事前計算しておき、log paを事前計算値を用いて求めれば、事前計算値の加減算のみで計算できる。このとき、log pa > log Tとなるかどうか判定すればよい。なお、Σj=1 0 log j =0とする。
[変形例等]
選択部4は、複数の集計表の度数を秘密計算により秘匿化した状態で、上記の集計表の選択を行ってもよい。
すなわち、選択部4は、例えば、フィッシャー正確検定の結果がFALSEとなる十分条件の条件式を満たすかどうか入出力を秘匿しつつ判定計算を行ってもよい。
このような計算は、例えばk=0,1,2,…,nについてΣj=1 k log jを事前計算しておき、入出力を秘匿しつつ大小比較、等号判定、加減乗算ができる暗号技術を組み合わせて実現することができる。以下、入出力を秘匿しつつ大小比較する(以下、入出力秘匿大小比較と略する。)について説明する。大小比較を行う二つの数値x,yを入力とし、x,yの少なくとも一方は暗号化され実際の数値が分からないものとする。いまxのみが暗号化されているものとし、これをE(x)と表記する。そして出力となる大小比較結果を
Figure 0006699066
とする。すなわち、入出力秘匿大小比較とは、E(x),yを入力とし、E(x)を復号することなく、大小結果の暗号文E(z)を求めることを意味する。もし、zが最終的に求めたい結果であれば、E(z)を適宜復号する。このような入出力秘匿大小比較として、例えば参考文献2,3の方法を挙げることができる。同様に等号判定の場合はx=yであればz=1となる。これも例えば参考文献2,3の方法を挙げることができる。
式Aのlog paの計算の具体例を挙げる。入力はE(a+b), E(c+d), E(a+c), E(b+d), E(n),E(a), E(b), E(c), E(d)であり、出力はE(z)、ただしzはlog pa>log Tであれば1、そうでなければ0とする。式Aの右辺の第1項を例に説明する。先ず事前計算した値Σj=1 k log j (k=0,1,…,n)を用いて、a+b=kであればE(1)を返し、そうでなければE(0)を返す等号判定の秘密計算を実行する。いまa+b=kであればc=1、そうでなければc=0とする。そして乗算の秘密計算により各kについてE(c)とΣj=1 k log jからE(cΣj=1 k log j)を計算する。
そしてそれらを最終的に暗号化したまま加算することで、E(Σj=1 a+b log j)を得ることができる。そして式Aの右辺の各項について同様の処理を行い、暗号化したまま加算することで式Aを秘密計算により計算できる。
フィッシャー正確検定の結果がFALSEとなる十分条件の条件式の入力を各集計表i(i=1,2,…,m)の度数ai,bi,ci,diとし、出力をTRUEi'又はFALSEi'とする。TRUEi'又はFALSEi'をXi'と表記する。これらの入出力が秘匿された状態をE()の記号で表すものとする。すなわち、例えばaiやTRUEi'が秘匿された状態をそれぞれE(ai),E(TRUEi')と表す。秘匿された状態から元の状態に戻す操作(例えばE(ai)からai)を復号と呼ぶこととする。このとき、各集計表が当該条件式を満たしたかどうかの結果、すなわちXi'は、入力ai,bi,ci,diに関する情報を与え得る。
そこで、選択部4は、以下に説明する(例1)から(例3)の処理を行ってもよい。
(例1)
まず、選択部4は、入出力秘匿大小比較を用いて、E(ai),E(bi),E(ci),E(di)からE(Xi')を求めた後、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))の順序を、入れ替え順序を秘匿しつつ適当に入れ替える。そして、選択部4は、E(Xi')を復号し、復号結果がTRUEi'となった組に対応する集計表を選択する。
この場合、計算部2は、選択された集計表について、E(ai),E(bi),E(ci),E(di)を入力として、言い換えれば入力を秘匿しつつフィッシャー正確検定の計算を行う。
例1の手法により、TRUEi'となった集計表の度数(a,b,c,d)を秘匿化しつつ、選択部4による選択及び計算部2によるフィッシャー正確検定の計算を行うことができる。
(例2)
例2では、予め選択する集計表の数Uを決めておく。
選択部4は、例1と同様にして、入出力秘匿大小比較を用いて、E(ai),E(bi),E(ci),E(di)からE(Xi')を計算することにより、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))を求める。そして、選択部4は、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))について、Xi'を秘匿しつつTRUEi'が前方又は後方となるようソートする。TRUEi'が前方又は後方となるようソートするために、例えばTRUEi'を表すフラグとして1を設定し、FALSEi'を表すフラグとして0を設定しておけばよい。
そして、選択部4は、ソート後のm個の組の前方又は後方からU個の組を選択する。Uは正の整数である。
この場合、計算部2は、選択された集計表について、E(ai),E(bi),E(ci),E(di)を入力として、言い換えれば入力を秘匿しつつフィッシャー正確検定の計算を行う。
例2の手法により、例1の手法のメリットに加えて、TRUEi'となった集計表の数を更に秘匿化することができるというメリットを得ることができる。
(例3)
例3では、まず、選択部4は、例1と同様にして、選択部4は、入出力秘匿大小比較を用いて、E(ai),E(bi),E(ci),E(di)からE(Xi')を計算することにより、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))を求める。
そして、選択部4は、FALSEi'を秘匿しつつ確率的にTRUEi'に置き換える。確率的にTRUEi'に置き換える方法として、例えば予め確率的にTRUE’又はFALSE’を秘匿したm個のデータE(Y1'),E(Y2'),…,E(Ym')を作成しておき、E(Xi'),E(Yi')(i=1,2,…,m)についてXi',Yi'を秘匿しつつ、
Figure 0006699066
を計算する。Zi'がTRUE’となる個数で実際にXi'がTRUE'となる個数の類推が困難となるよう、Y1',Y2',…,Ym'について TRUE’の割合は適宜調整される。
選択部4は、置き換えた後は、(例1)と同様の処理を行う。
例3の手法により、例1の手法のメリットに加えて、TRUEi'となった集計表の数を更に秘匿化することができるというメリットを得ることができる。
このような秘匿化により、例えばゲノム情報やそれに付随する各種データを秘匿しつつフィッシャー正確検定を実行することができる。これは、例えば、複数の研究機関が所持するゲノムデータを秘匿したまま相互に開示することなく、統合されたデータのフィッシャー正確検定の実行結果を得ることができ、極めてセキュリティレベルの高いゲノム解析の実行環境の提供、ひいては医療の更なる発展へとつながることが期待できる。
[プログラム及び記録媒体]
フィッシャー正確検定計算装置及び方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、フィッシャー正確検定計算装置における各処理をコンピュータによって実現する場合、フィッシャー正確検定計算装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各処理がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
上述のゲノムワイド関連解析への応用結果から明らかなように、この発明の秘密計算技術は、フィッシャー正確検定を利用した解析、例えば、ゲノムワイド関連解析、ゲノム分析、臨床研究、社会調査、学術研究、実験結果の分析、マーケティング調査、統計計算、医療情報分析、顧客情報分析、売り上げ分析において、集計表の情報を秘匿したまま秘密計算によりフィッシャー正確検定を行うことに適用することが可能である。

Claims (7)

  1. 有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を、フィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいて複数の集計表の中から選択する選択部と、
    上記選択された集計表のそれぞれについてフィッシャー正確検定の計算を行う計算部と、
    を含み、
    上記選択部は、上記複数の集計表の度数を秘密計算により秘匿化した状態で、上記集計表の選択を行う、
    フィッシャー正確検定計算装置。
  2. 請求項1のフィッシャー正確検定計算装置において、
    a,b,c,dを集計表の度数とし、Tを有意水準として、フィッシャー正確検定の結果を求める途中の計算で得られるパラメータは以下の式により定義されるpaであり、
    上記選択部は、pa≦Tとなる集計表を選択する、
    Figure 0006699066

    フィッシャー正確検定計算装置。
  3. 請求項のフィッシャー正確検定計算装置において、
    mを正の整数とし、上記複数の集計表を複数の集計表i(i=1,2,…,m)とし、集計表iの度数をai,bi,ci,diとし、ai,bi,ci,diをそれぞれ秘匿化した情報をE(ai),E(bi),E(ci),E(di)とし、集計表iが有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表であるか否かを表す情報をE(Xi')として、上記選択部は、E(ai),E(bi),E(ci),E(di)からフィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいてE(Xi')を秘匿計算することによりm個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))を求め、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))の順序を入れ替え順序を秘匿しつつ入れ替え、E(Xi')を復号し、その復号結果が有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を選択する、
    フィッシャー正確検定計算装置。
  4. 請求項のフィッシャー正確検定計算装置において、
    mを正の整数とし、上記複数の集計表を複数の集計表i(i=1,2,…,m)とし、集計表iの度数ai,bi,ci,diとし、ai,bi,ci,diをそれぞれ秘匿化した情報をE(ai),E(bi),E(ci),E(di)とし、集計表iが有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表であるか否かを表す情報をE(Xi')とし、Uを正の整数として、上記選択部は、E(ai),E(bi),E(ci),E(di)からフィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいてE(Xi')を秘匿計算することによりm個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))を求め、集計表iが有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表であるか否かを表す情報が前方又は後方となるようにm個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))をXi'を秘匿化しつつソートし、ソート後のm個の組の前方又は後方からU個の組を選択する、
    フィッシャー正確検定計算装置。
  5. 請求項のフィッシャー正確検定計算装置において、
    mを正の整数とし、上記複数の集計表を複数の集計表i(i=1,2,…,m)とし、集計表iの度数ai,bi,ci,diとし、ai,bi,ci,diをそれぞれ秘匿化した情報をE(ai),E(bi),E(ci),E(di)とし、集計表iが有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表であるか否かを表す情報をE(Xi')とし、上記選択部は、E(ai),E(bi),E(ci),E(di)からフィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいてE(Xi')を秘匿計算することによりm個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))を求め、m個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))の中の少なくとも1つの組についてXi'が有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表でないことを表す情報である場合にはそのXi'を有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表であることを表す情報にXi'を秘匿化しつつ置き換え、置き換え後のm個の組(E(a1),E(b1),E(c1),E(d1),E(X1')), (E(a2),E(b2),E(c2),E(d2),E(X2')),…, (E(am),E(bm),E(cm),E(dm),E(Xm'))の順序を入れ替え順序を秘匿しつつ入れ替え、E(Xi')を復号し、その復号結果が有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を選択する、
    フィッシャー正確検定計算装置。
  6. 選択部が、有意である旨のフィッシャー正確検定の結果が得られる可能性がある集計表を、フィッシャー正確検定の結果を求める途中の計算で得られるパラメータに基づいて複数の集計表の中から選択する選択ステップと、
    計算部が、上記選択された集計表のそれぞれについてフィッシャー正確検定の計算を行う計算ステップと、
    を含み、
    上記選択部は、上記複数の集計表の度数を秘密計算により秘匿化した状態で、上記集計表の選択を行う、
    フィッシャー正確検定計算方法。
  7. 請求項1からの何れかのフィッシャー正確検定計算装置の各部としてコンピュータを機能させるためのプログラム。
JP2018526337A 2016-07-06 2017-06-30 フィッシャー正確検定計算装置、方法及びプログラム Active JP6699066B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016134087 2016-07-06
JP2016134087 2016-07-06
PCT/JP2017/024128 WO2018008544A1 (ja) 2016-07-06 2017-06-30 フィッシャー正確検定計算装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2018008544A1 JPWO2018008544A1 (ja) 2019-04-11
JP6699066B2 true JP6699066B2 (ja) 2020-05-27

Family

ID=60912160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018526337A Active JP6699066B2 (ja) 2016-07-06 2017-06-30 フィッシャー正確検定計算装置、方法及びプログラム

Country Status (5)

Country Link
US (1) US20190163722A1 (ja)
EP (1) EP3483744B1 (ja)
JP (1) JP6699066B2 (ja)
CN (1) CN109328346B (ja)
WO (1) WO2018008544A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7057564B2 (ja) * 2018-06-06 2022-04-20 日本電信電話株式会社 分類器生成装置、仮説検定装置、分類器生成方法、仮説検定方法、プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007126088A1 (ja) * 2006-04-28 2007-11-08 Riken バイオアイテム検索装置、バイオアイテム検索端末装置、バイオアイテム検索方法、および、プログラム
JP5075553B2 (ja) * 2007-09-27 2012-11-21 株式会社日立ソリューションズ 2×n型分割表の総数数え上げ処理装置
US20110246409A1 (en) * 2010-04-05 2011-10-06 Indian Statistical Institute Data set dimensionality reduction processes and machines
CN102485905A (zh) * 2010-12-03 2012-06-06 浙江中医药大学附属第一医院 一种基于表达趋势的微小核糖核酸靶基因预测方法
US20140032122A1 (en) * 2012-07-27 2014-01-30 The Johns Hopkins University Gene-wide significance (gwis) test: novel gene-based methods for the identification of genetic associations having multiple independent effects

Also Published As

Publication number Publication date
EP3483744A1 (en) 2019-05-15
EP3483744A4 (en) 2020-02-05
CN109328346A (zh) 2019-02-12
EP3483744B1 (en) 2022-03-23
JPWO2018008544A1 (ja) 2019-04-11
WO2018008544A1 (ja) 2018-01-11
CN109328346B (zh) 2023-07-28
US20190163722A1 (en) 2019-05-30

Similar Documents

Publication Publication Date Title
Lee et al. Lower bounds in communication complexity
JP6534778B2 (ja) 秘密計算システム、秘密計算装置、秘密計算方法、およびプログラム
CN110199338A (zh) 秘密计算系统、秘密计算装置、秘密计算方法、程序
Sarkar et al. Fast and scalable private genotype imputation using machine learning and partially homomorphic encryption
CN110199339A (zh) 秘密计算系统、秘密计算装置、秘密计算方法、程序
Xue et al. Medical image protection algorithm based on deoxyribonucleic acid chain of dynamic length
JP6699066B2 (ja) フィッシャー正確検定計算装置、方法及びプログラム
JP6585846B2 (ja) 秘密計算システム、秘密計算装置、秘密計算方法、およびプログラム
US10333697B2 (en) Nondecreasing sequence determining device, method and program
JP2020519968A (ja) ビット分解秘密計算装置、ビット結合秘密計算装置、方法およびプログラム
JP6682105B2 (ja) フィッシャー正確検定計算装置、方法及びプログラム
JP2014164144A (ja) 秘密表除算装置及び方法
JP6541048B2 (ja) 秘密計算システム、秘密計算装置、秘密計算方法、およびプログラム
JP6758632B2 (ja) 正確検定計算装置、正確検定計算方法、およびプログラム
Karimi et al. A secure system for genomics clinical decision support
Todoki Privacy-Preserving Machine Learning Applications
Wang et al. Privacy-preserving Training Algorithm for Naive Bayes Classifiers
Akkaya Privacy-preserving rare disease analysis with fully homomorphic encryption
Woods et al. Secure Comparisons of Single Nucleotide Polymorphisms Using Secure Multiparty Computation: Method Development
GÜRSOY et al. Fast and Scalable Private Genotype Imputation Using Machine Learning and Partially Homomorphic Encryption

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20181221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200410

R150 Certificate of patent or registration of utility model

Ref document number: 6699066

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250