CN109328346B - 费希尔精确检验计算装置、方法以及记录介质 - Google Patents

费希尔精确检验计算装置、方法以及记录介质 Download PDF

Info

Publication number
CN109328346B
CN109328346B CN201780038368.9A CN201780038368A CN109328346B CN 109328346 B CN109328346 B CN 109328346B CN 201780038368 A CN201780038368 A CN 201780038368A CN 109328346 B CN109328346 B CN 109328346B
Authority
CN
China
Prior art keywords
exact test
fisher exact
calculation
result
tables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780038368.9A
Other languages
English (en)
Other versions
CN109328346A (zh
Inventor
长谷川聪
滨田浩气
千田浩司
长崎正朗
三泽计治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Nippon Telegraph and Telephone Corp filed Critical Tohoku University NUC
Publication of CN109328346A publication Critical patent/CN109328346A/zh
Application granted granted Critical
Publication of CN109328346B publication Critical patent/CN109328346B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Complex Calculations (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

费希尔精确检验计算装置包括:选择单元(4),根据求费希尔精确检验的结果的途中的计算中得到的参数,从多个合计表的中选择存在得到显著的含义的费希尔精确检验的结果的可能性的合计表;以及计算单元(2),对于选择出的合计表的每一个进行费希尔精确检验的计算。

Description

费希尔精确检验计算装置、方法以及记录介质
技术领域
本发明涉及高效地计算费希尔精确检验(Fisher’s exact test)的技术。
背景技术
作为统计学的检验法之一,费希尔精确检验广为人知。作为费希尔精确检验的利用例,有全基因组关联分析(GWAS:Genome-Wide Association Study)(例如,参照非专利文献1。)。以下,简单说明费希尔精确检验。
【表1】
X Y 总计
A a b a+b
G c d c+d
总计 a+c b+d a+b+c+d(=n)
该表是将n人的被验者按照特征(X或者Y)和确定的等位基因(allele)(A或者G)分类计数的2x2的合计表的例子。a,b,c,d表示频数(非负整数)。费希尔精确检验是,对于非负整数i,设为
时,按照
和规定的值的阈值T的大小关系,判定在特征和确定的等位基因之间是否存在统计学上显著的关联检验。在全基因组关联分析中,有对各个单核苷酸多态性(SNP:SingleNucleotide Polymorphism)的每一个作成上述那样的合计表,对各合计表进行费希尔精确检验的情况。在全基因组关联分析中,数百万数千万那样庞大的数量的SNP成为对象。因此,在全基因组关联分析中可能存在大量进行费希尔精确检验的场景。
另一方面,由于基因组信息的微妙性和机密性,存在通过加密技术将基因组信息隐匿的同时进行全基因组关联分析的现有研究(例如,参照非专利文献2。)。在非专利文献2中提出了将基因组信息隐匿的同时进行卡方检验的方法。
【现有技术文献】
【非专利文献】
【非专利文献1】Konrad Karczewski,“How to do a GWAS”,GENE 210:Genomicsand Personalized Medicine,2015.
【非专利文献2】Yihua Zhang,Marina Blanton,and Ghada Almashaqbeh,“Securedistributed genome analysis for GWAS and sequence comparison computation”,BMCmedical informatics and decision making,Vol.15,No.Suppl5,p.S4,2015.
发明内容
【发明要解决的课题】
在费希尔精确检验中,每1次最大需要n/2种类的pi的计算,特别是在全基因组关联分析中存在对大量的合计表分别进行费希尔精确检验的情况,所以存在由于计算机环境和合计表的频数,需要庞大的处理时间的可能性。
本发明的目的是提供比以往效率高地进行多次费希尔精确检验的计算的费希尔精确检验计算装置、方法以及程序。
【用于解决课题的手段】
本发明的一个方式的费希尔精确检验计算装置包括:选择单元,根据求费希尔精确检验的结果的途中的计算中得到的参数,从多个合计表中选择存在得到显著的含义的费希尔精确检验的结果的可能性的合计表;以及计算单元,分别对选择出的合计表进行费希尔精确检验的计算。
【发明的效果】
可以进行比以往效率高的多次的费希尔精确检验的计算。具体地说,可以期待计算资源的使用量的削减和处理时间的削减的效果。
附图说明
图1是用于说明费希尔精确检验计算装置的例子的方框图。
图2是用于说明费希尔精确检验计算方法的例子的流程图。
具体实施方式
以下,参照附图,说明本发明的一个实施方式。
如图1所示,费希尔精确检验计算装置例如具有选择单元4和计算单元2。费希尔精确检验计算方法通过费希尔精确检验计算装置的各单元进行图2以及以下说明的步骤S4、步骤S2的处理来实现。
<选择单元4>
该费希尔精确检验计算装置以及方法将m设为正整数,不对m个合计表每一个进行费希尔精确检验的计算。取而代之,例如,提供费希尔精确检验的结果(若p小于显著性水平即阈值T,则视为存在统计学的显著的关联“TRUE”(真),否则设为“FALSE”(假))为FALSE的充分条件的条件式。然后,舍弃不满足该条件式的合计表,换言之费希尔精确检验的结果必定为FALSE的合计表。不对舍弃的合计表进行p值的计算,仅对未舍弃的合计表,换言之仅对存在得到显著的含义的费希尔精确检验的结果的可能性的合计表进行费希尔精确检验的计算。
因此,首先,选择单元4根据求费希尔精确检验的结果的途中的计算中得到的参数,从多个合计表(m个合计表)中选择存在得到显著的含义的费希尔精确检验的结果的可能性的合计表(步骤S4)。关于选择出的合计表的信息被输出到计算单元2。
费希尔精确检验的结果为FALSE的充分条件的条件式的例子为pa≧T(或者pa>T)。pa是i=a的情况下的pi。pa通过以下的式子进行定义。
在pa≧T的情况下,由p的定义必然p≧T。因此,pa≧T称为费希尔精确检验的结果为FALSE的充分条件的条件式。
在费希尔精确检验的结果为FALSE的充分条件的条件式为pa≧T的情况下,选择单元4根据各合计表的频数计算pa,判断是否pa≧T,选择判断为不是pa≧T的合计表,换言之pa<T的合计表。
<计算单元2>
计算单元2对由选择单元4选择的合计表的每一个进行费希尔精确检验的计算(步骤S2)。费希尔精确检验的计算可以使用已知的任意的计算方法。
在费希尔精确检验中,每1次最大需要n/2种类的pi的计算,所以如果只进行pa的计算,则计算次数最大被削减至2/n倍。若n=1000,则可以削减至1/500的计算次数。但是,对于pa<T的合计表,因为需要进行费希尔精确检验,所以pa<T的合计表的比例小比较好。实际上,在利用NBDC人类数据库(参考文献1)中注册、公开的基因组数据的合计表(非限制公开数据)进行了实验后,成为以下的表那样。
【表2】
满足p<5.0×10-8的合计表的数 满足pa<5.0×10-8的合计表的数
数据1 7 13
数据2 101 133
数据3 33 43
数据4 91 104
利用的数据(数据1~4)如下表所示。
【表3】
例如,对于数据1,成为pa<T的合计表的比例为13/455781≒0.00285%,足够小,若将求p的计算次数设为pa的计算次数的n/2倍,则以通常的方法求全部SNP的p的计算次数为pa的计算次数的M×n/2=455781×(1666+3198)/2=1,108,459,392倍,但是在通过本发明求pa<T的合计表,仅求该合计表的p的情况下,该计算次数为pa的计算次数的M+L×n/2=455781+13×(1666+3198)/2=519,013倍,与用通常的方法求全部的SNP的p的计算次数相比,用519,013/1,108,459,392≒1/2135.7左右的计算次数即可。其中M为SNP数,L为pa<T的合计表的数。
〔参考文献1〕NBDC人类数据库,因特网
〈URL:http://humandbs.biosciencedbc.jp/〉
在本实验中使用的数据,由定制(order-made)医疗实现项目(代表者理化学研究所基因组医学科学研究中心中村祐辅中心主任),定制医疗的实现方案(代表者理化学研究所综合生命医学科学研究中心久保充明副中心主任),以及由感觉器未来医疗学(代表者京都府立医科大学医学研究科上田真由美副教授)取得,通过科学技术振兴机构(JST)的“生物科学数据库中心(NBDC)”网站(http://humandbs.biosciencedbc.jp/)提供。
而且,计算单元2也可以在通过秘密计算,将成为输入的费希尔精确检验的对象的合计表的频数(a,b,c,d)隐匿化的状态下,进行用于得到与该合计表的频数(a,b,c,d)对应的希尔精确检验的结果的计算。该秘密计算例如可以通过参考文献2,3中记载的已知的秘密计算技术实现。
〔参考文献2〕Ivan Damgard,Matthias Fitzi,Eike Kiltz,Jesper Buus Nielsenand Tomas Toft,"Unconditionally secure constant-rounds multi-partycomputation for equality,comparison,bits and exponentiation",In Proc.3rdTheory of Cryptography Conference,TCC 2006,volume 3876of Lecture Notes inComputer Science,pages 285-304,Berlin,2006,Springer-Verlag
〔参考文献3〕Takashi Nishide,Kazuo Ohta,"Multiparty Computation forInterval,Equality,and Comparison Without Bit-Decomposition Protocol",PublicKey Cryptography-PKC 2007,10th International Conference on Practice andTheory in Public-Key Cryptography,2007,P.343-360
这样,通过仅对存在得到显著的含义的费希尔精确检验的结果的可能性的合计表进行费希尔精确检验的计算,换言之,通过对于费希尔精确检验的结果明显为FALSE的合计表不进行p的运算,可以减少对多个合计表的费希尔精确检验的计算量。
而且,关于运算的削减效果,pa的计算由
得到的是
,所以若对于k=0,1,2,…,n事先计算Σj=1 k log j,使用事先计算值求log pa,则可以仅通过事先计算值的加减法进行计算。这时,只要判断是否log pa>log T即可。而且,设为Σj=1 0log j=0。
[变形例等]
选择单元4也可以在通过秘密计算将多个合计表的频数隐匿化的状态下,进行上述的合计表的选择。
即,选择单元4例如也可以在将输入输出隐匿的同时进行费希尔精确检验的结果是否满足为FALSE的充分条件的条件式的判定计算。
这样计算,例如对k=0,1,2,…,n事先计算Σj=1 k log j,在将输入输出隐匿的同时,组合可大小比较、等号判定、加减乘法的加密技术来实现。以下,说明将输入输出隐匿的同时进行大小比较(以下,简称为输入输出隐匿大小比较。)。将进行大小比较的两个数值x,y设为输入,x,y的至少一方被加密,成为不知道实际的数值的值。现在仅将x加密,将其记述为E(x)。然后将成为输出的大小比较结果设为
。即,输入输出隐匿大小比较意思是,将E(x),y设为输入,不解码E(x),求大小结果的密文E(z)。如果z是最终要求出的结果,则适当解码E(z)。作为这样的输入输出隐匿大小比较,例如可以举出参考文献2,3的方法。同样,在等号判定的情况下若x=y则z=1。这例如也可以举出参考文献2,3的方法。
举出式A的log pa的计算的具体例。输入是E(a+b),E(c+d),E(a+c),E(b+d),E(n),E(a),E(b),E(c),E(d),输出是E(z),其中z若log pa>log T则为1,否则为0。以式A的右边的第1项为例进行说明。首先,使用事先计算的值Σj=1 k log j(k=0,1,…,n),执行若a+b=k,则返回E(1),否则返回E(0)的等号判定的秘密计算。现在,若a+b=k,则c=1,否则c=0。然后通过乘法的秘密计算,对各k,由E(c)和Σj=1 k log j计算E(cΣj=1 k log j)。
然后,通过在最终将这些值加密的状态下相加,可以得到E(Σj=1 a+b log j)。然后对于式A的右边的各项进行同样的处理,通过在保持加密的状态下相加,可以通过秘密计算来计算式A。
将费希尔精确检验的结果为FALSE的充分条件的条件式的输入设为各合计表i(i=1,2,…,m)的频数ai,bi,ci,di,将输出设为TRUEi'或者FALSEi'。将TRUEi'或者FALSEi'记述为Xi'。用E()的记号表示这些输入输出被隐匿的状态。即,例如将ai或TRUEi'被隐匿的状态分别表示为E(ai),E(TRUEi')。将从被隐匿的状态返回到原来的状态的操作(例如从E(ai)至ai)称为解码。这时,各合计表是否满足了该条件式的结果,即Xi'能够提供有关输入ai,bi,ci,di的信息。
因此,选择单元4可以进行以下说明的(例1)至(例3)的处理。
(例1)
首先,选择单元4使用输入输出隐匿大小比较,由E(ai),E(bi),E(ci),E(di)求出E(Xi')后,在隐匿更换顺序的同时适当更换m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,
(E(am),E(bm),E(cm),E(dm),E(Xm'))的顺序。然后,选择单元4解码E(Xi'),选择与解码结果为TRUEi'的组对应的合计表。
在该情况下,计算单元2对于选择的合计表,将E(ai),E(bi),E(ci),E(di)作为输入,换言之在隐匿输入的同时进行费希尔精确检验的计算。
通过例1的方法,可以在将称为TRUEi'的合计表的频数(a,b,c,d)隐匿化的同时,进行选择单元4的选择以及计算单元2的费希尔精确检验的计算。
(例2)
在例2中,预先决定选择的合计表的数U。
选择单元4与例1同样,通过使用输入输出隐匿大小比较,由E(ai),E(bi),E(ci),E(di)计算E(Xi'),求m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,
(E(am),E(bm),E(cm),E(dm),E(Xm'))。然后,选择单元4对m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,
(E(am),E(bm),E(cm),E(dm),E(Xm')),在隐匿Xi'的同时进行分类,以便TRUEi'成为前方或者后方。为了进行分类以便TRUEi'成为前方或者后方,只要例如设定1作为表示TRUEi'的标志,设定0作为表示FALSEi'标志即可。
然后,选择单元4从分类后的m个组的前方或者后方选择U个组。U是正整数。
在该情况下,计算单元2对被选择出的合计表,将E(ai),E(bi),E(ci),E(di)作为输入,换言之在将输入隐匿的同时进行费希尔精确检验的计算。
通过例2的方法,除了例1的方法的优点,能够得到可将成为TRUEi'的合计表的数进一步隐匿化的优点。
(例3)
在例3中,首先,选择单元4与例1同样,选择单元4通过使用输入输出隐匿大小比较,从E(ai),E(bi),E(ci),E(di)计算E(Xi'),求m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,
(E(am),E(bm),E(cm),E(dm),E(Xm'))。
然后,选择单元4在隐匿FALSEi'的同时概率性地置换为TRUEi'。作为概率性地置换为TRUEi'的方法,例如预先作成概率性地隐匿了TRUE’或者FALSE’的m个数据E(Y1'),E(Y2'),…,E(Ym'),对于E(Xi'),E(Yi')(i=1,2,…,m)在隐匿Xi',Yi'的同时,计算
。对于Y1',Y2',…,Ym'适当调整TRUE’的比例,使得难以通过Zi'为TRUE’的个数类推实际上Xi'成为TRUE'的个数。
选择单元4在置换后进行与(例1)同样的处理。
通过例3的方法,除了例1的方法的优点之外,能够得到可将成为TRUEi'的合计表的数进一步隐匿化的优点。
通过这样的隐匿化,例如可以在将基因组信息或与其付随的各种数据隐匿的同时执行费希尔精确检验。这例如可以将多个研究机构所持有的基因组数据保持隐匿而不相互公开地得到综合的数据的费希尔精确检验的执行结果,可以期待提供安全级别极高的基因组解析的执行环境,进而促进医疗的进一步发展。
[程序以及记录介质]
在费希尔精确检验计算装置以及方法中说明的处理,不仅按照记载的顺序时间序列地执行,而且也可以根据执行处理的装置的处理能力或者需要并行地或者单独地执行。
而且,在通过计算机实现费希尔精确检验计算装置中的各处理的情况下,通过程序记述费希尔精确检验计算装置应具有的功能的处理内容。然后,通过计算机执行该程序,在计算机上实现该各处理。
记述了该处理内容的程序可以记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如是磁记录装置、光盘、光磁记录介质、半导体存储器等任何介质。
而且,各处理单元也可以通过在计算机上执行规定的程序来构成,也可以硬件性地实现这些处理内容的至少一部分。
另外,不用说在不脱离本发明的趣旨的范围内可适当变更。
产业上的可利用性
从对上述全基因组关联分析的应用结果可知,本发明的秘密计算技术能够适用于在利用了费希尔精确检验的解析,例如,全基因组关联分析、基因组分析、临床研究、社会调查、学术研究、实验结果的分析、市场调查、统计计算、医疗信息分析、顾客信息分析、收益分析中,将合计表的信息保持隐匿的情况下通过秘密计算进行费希尔精确检验。

Claims (7)

1.一种费希尔精确检验计算装置,包括:
选择单元,根据在求费希尔精确检验的结果的中途的计算中得到的参数,从多个合计表中选择存在得到显著的含义的费希尔精确检验的结果的可能性的合计表;以及
计算单元,对所述选择出的合计表的每一个进行费希尔精确检验的计算,
在将a,b,c,d设为合计表的频数,将T设为显著性水平,求费希尔精确检验的结果的途中的计算中得到的参数是通过以下式子定义的pa
上述选择单元选择pa≦T的合计表
2.如权利要求1所述的费希尔精确检验计算装置,
上述选择单元在通过秘密计算将上述多个合计表的频数隐匿化的状态下,进行上述合计表的选择。
3.如权利要求2所述的费希尔精确检验计算装置,
上述选择单元根据从E(ai),E(bi),E(ci),E(di)求费希尔精确检验的结果的中途的计算中得到的参数,通过隐匿计算E(Xi'),求m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm')),在隐匿更换顺序的同时更换m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm'))的顺序,解码E(Xi'),选择存在得到该解码结果显著的含义的费希尔精确检验的结果的可能性的合计表,其中将m设为正整数,将上述多个合计表设为多个合计表i(i=1,2,…,m),将合计表i的频数设为ai,bi,ci,di,将分别隐匿化了ai,bi,ci,di的信息设为E(ai),E(bi),E(ci),E(di),将表示合计表i是否为存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息设为E(Xi')。
4.如权利要求2的费希尔精确检验计算装置,
将m设为正整数,将上述多个合计表设为多个合计表i(i=1,2,…,m),设合计表i的频数ai,bi,ci,di,将分别隐匿化了ai,bi,ci,di的信息设为E(ai),E(bi),E(ci),E(di),将表示合计表i是否为存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息设为E(Xi'),将U设为正整数,上述选择单元根据从E(ai),E(bi),E(ci),E(di)求费希尔精确检验的结果的途中的计算中得到的参数,通过隐匿计算E(Xi'),求m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm')),在将Xi'隐匿化的同时分类m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm')),使得表示合计表i是否为存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息成为前方或者后方,从分类后的m个组的前方或者后方选择U个组。
5.如权利要求2所述的费希尔精确检验计算装置,
将m设为正整数,将上述多个合计表设为多个合计表i(i=1,2,…,m),设合计表i的频数ai,bi,ci,di,将分别隐匿化了ai,bi,ci,di的信息设为E(ai),E(bi),E(ci),E(di),将表示合计表i是否为存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息设为E(Xi'),上述选择单元根据从E(ai),E(bi),E(ci),E(di)求费希尔精确检验的结果的途中的计算中得到的参数,通过隐匿计算E(Xi')求m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm')),在对于m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm'))中的至少一个组,Xi'为表示不是存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息的情况下,在将Xi'隐匿化的同时,将该Xi'置换为表示是存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的信息,在隐匿更换顺序的同时更换置换后的m个组(E(a1),E(b1),E(c1),E(d1),E(X1')),(E(a2),E(b2),E(c2),E(d2),E(X2')),…,(E(am),E(bm),E(cm),E(dm),E(Xm'))的顺序,解码E(Xi'),选择存在得到该解码结果是显著的含义的费希尔精确检验的结果的可能性的合计表。
6.一种费希尔精确检验计算方法,包括:
选择单元根据求费希尔精确检验的结果的途中的计算中得到的参数,从多个合计表中选择存在得到显著的含义的费希尔精确检验的结果的可能性的合计表的选择步骤;以及
计算单元对于上述选择出的合计表的每一个进行费希尔精确检验的计算的计算步骤,
在将a,b,c,d设为合计表的频数,将T设为显著性水平,求费希尔精确检验的结果的途中的计算中得到的参数是通过以下式子定义的pa
在所述选择步骤中,所述选择单元选择pa≦T的合计表
7.一种计算机可读取的记录介质,记录了使计算机具有作为权利要求1至5的任意一项的费希尔精确检验计算装置的各单元的功能的程序。
CN201780038368.9A 2016-07-06 2017-06-30 费希尔精确检验计算装置、方法以及记录介质 Active CN109328346B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016-134087 2016-07-06
JP2016134087 2016-07-06
PCT/JP2017/024128 WO2018008544A1 (ja) 2016-07-06 2017-06-30 フィッシャー正確検定計算装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
CN109328346A CN109328346A (zh) 2019-02-12
CN109328346B true CN109328346B (zh) 2023-07-28

Family

ID=60912160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780038368.9A Active CN109328346B (zh) 2016-07-06 2017-06-30 费希尔精确检验计算装置、方法以及记录介质

Country Status (5)

Country Link
US (1) US20190163722A1 (zh)
EP (1) EP3483744B1 (zh)
JP (1) JP6699066B2 (zh)
CN (1) CN109328346B (zh)
WO (1) WO2018008544A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7057564B2 (ja) * 2018-06-06 2022-04-20 日本電信電話株式会社 分類器生成装置、仮説検定装置、分類器生成方法、仮説検定方法、プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102485905A (zh) * 2010-12-03 2012-06-06 浙江中医药大学附属第一医院 一种基于表达趋势的微小核糖核酸靶基因预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921105B2 (en) * 2006-04-28 2011-04-05 Riken Bioitem searcher, bioitem search terminal, bioitem search method, and program
JP5075553B2 (ja) * 2007-09-27 2012-11-21 株式会社日立ソリューションズ 2×n型分割表の総数数え上げ処理装置
US20110246409A1 (en) * 2010-04-05 2011-10-06 Indian Statistical Institute Data set dimensionality reduction processes and machines
US20140032122A1 (en) * 2012-07-27 2014-01-30 The Johns Hopkins University Gene-wide significance (gwis) test: novel gene-based methods for the identification of genetic associations having multiple independent effects

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102485905A (zh) * 2010-12-03 2012-06-06 浙江中医药大学附属第一医院 一种基于表达趋势的微小核糖核酸靶基因预测方法

Also Published As

Publication number Publication date
EP3483744A4 (en) 2020-02-05
CN109328346A (zh) 2019-02-12
JP6699066B2 (ja) 2020-05-27
WO2018008544A1 (ja) 2018-01-11
EP3483744A1 (en) 2019-05-15
EP3483744B1 (en) 2022-03-23
US20190163722A1 (en) 2019-05-30
JPWO2018008544A1 (ja) 2019-04-11

Similar Documents

Publication Publication Date Title
Chen et al. Princess: Privacy-protecting rare disease international network collaboration via encryption through software guard extensions
US9064123B2 (en) Secure product-sum combination system, computing apparatus, secure product-sum combination method and program therefor
Perin et al. Attacking randomized exponentiations using unsupervised learning
CN106716344B (zh) 用于密码运算的指数分裂
US11121868B2 (en) Secure computation system, secure computation device, secure computation method, and program
Salem et al. Privacy-preserving similar patient queries for combined biomedical data
Szajda et al. Toward a Practical Data Privacy Scheme for a Distributed Implementation of the Smith-Waterman Genome Sequence Comparison Algorithm.
CN109328346B (zh) 费希尔精确检验计算装置、方法以及记录介质
Akgün et al. Identifying disease-causing mutations with privacy protection
CN109313664B (zh) 费希尔精确检验计算装置、方法以及记录介质
Poon et al. Privacy preserving Fisher’s exact test on genomic data
Grosso et al. Punctured Syndrome Decoding Problem: Efficient Side-Channel Attacks Against Classic McEliece
CN109478381B (zh) 秘密计算系统、秘密计算装置、秘密计算方法以及程序
WO2020167504A1 (en) Distributed randomness generation via multi-party computation
Pessach et al. Fairness-driven private collaborative machine learning
EP4024755A1 (en) Secured performance of an elliptic curve cryptographic process
Karimi et al. A secure system for genomics clinical decision support
Wang et al. Privacy-preserving Training Algorithm for Naive Bayes Classifiers
EP4092655A1 (en) Secret maximum value calculation device, method, and program
Berrang Quantifying and mitigating privacy risks in biomedical data
Doukas et al. Accessible secure information society applications via the use of optimised cryptographic calculations
Souza et al. Monte Carlo execution time estimation for Privacy-preserving Distributed Function Evaluation protocols
Ruzai et al. New simultaneous Diophantine attacks on generalized RSA key equations
Akkaya Privacy-preserving rare disease analysis with fully homomorphic encryption
CN115037442A (zh) 一种模型效果检测方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant