CN116324935A - 参数估计装置、参数估计系统、参数估计方法及程序 - Google Patents

参数估计装置、参数估计系统、参数估计方法及程序 Download PDF

Info

Publication number
CN116324935A
CN116324935A CN202080106085.5A CN202080106085A CN116324935A CN 116324935 A CN116324935 A CN 116324935A CN 202080106085 A CN202080106085 A CN 202080106085A CN 116324935 A CN116324935 A CN 116324935A
Authority
CN
China
Prior art keywords
parameter estimation
calculation
time point
vector
time points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080106085.5A
Other languages
English (en)
Inventor
三品气吹
滨田浩气
五十岚大
菊池亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN116324935A publication Critical patent/CN116324935A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/085Secret sharing or secret splitting, e.g. threshold schemes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/46Secure multiparty computation, e.g. millionaire problem

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stored Programmes (AREA)
  • Communication Control (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种参数估计装置,通过安全计算进行cox比例风险模型的参数估计,所述参数估计装置具备:数据保存部,对数据库进行保存,该数据库按照每个观测对象具有记录,该记录包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及输出部,输出由所述运算部估计出的参数。

Description

参数估计装置、参数估计系统、参数估计方法及程序
技术领域
本发明涉及一种在安全计算技术(secure computation technique)中保持机密性(confidentiality)的同时实现cox比例风险模型的参数估计的技术。
背景技术
使用cox的比例风险模型的回归分析即cox比例风险回归(cox proportionalhazard regression)是生存时间分析中常用的分析方法(非专利文件1)。在市售的统计分析软件和软件语言包中,cox比例风险回归可在纯文本中进行。
此外,作为无需恢复加密数值即可获得特定运算(计算)结果的方法,已知一种被称为安全计算的方法。作为一例,通过进行将数值分片分散至多个安全计算装置这样的加密处理,并由多个安全计算装置进行协同计算,可无需恢复数值地获得作为分散至多个安全计算装置的状态的、加减法、常数加法、乘法、常数乘法、逻辑运算(取反、逻辑积、逻辑和、及异或)、数据格式转换(整数和二进制数)等的结果。
[引证文件]
[非专利文件]
[非专利文件1]D.R.Cox.Regression Models and Life-Tables.Journal of theRoyal Statistical Society.Series B(Methodological),Vol.34,No.2.(1972),pp.187-220.
发明内容
[要解决的技术问题]
当进行cox比例风险模型的参数估计时,纯文本中,在发生死亡和中止的每个时点(即,时间点)都会进行重复计算。但是,如果在安全计算中也使用类似的方法,则存在需要对应该保密的时点的值进行解码的问题。此外,cox比例风险模型的参数估计的计算中包含指数、除法、及group-by sum这样的安全计算中的处理成本较大的诸多处理,所以还存在安全计算中难以高效地进行计算的问题。
本发明是鉴于上述问题而提出的,其目的在于,提供一种无需对时点的值进行解码即可高效地执行cox比例风险模型的参数估计的技术。
[技术方案]
根据公开的技术,提供一种参数估计装置,通过安全计算进行cox比例风险模型的参数估计,所述参数估计装置具备:
数据保存部,对数据库进行保存,该数据库按照每个观测对象具有记录,该记录包括事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;
运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志(flag),通过使用所述置换表和所述标志,在对时点的值进行保密的同时进行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出部,输出由所述运算部估计出的参数。
[有益效果]
根据公开的技术,能够提供一种无需对时点的值进行解码即可高效地进行cox比例风险模型的参数估计的技术。
附图说明
[图1]本发明的实施方式的参数估计装置的构成图。
[图2]装置的硬件构成示例的示意图。
[图3]置换表的说明图。
[图4]标志的说明图。
[图5]数据库的例示图。
[图6]参数估计装置的处理步骤的示例的说明图。
[图7]参数估计装置的处理步骤的示例的说明图。
具体实施方式
下面,参见附图对本发明的实施方式(本实施方式)进行说明。需要说明的是,下文中描述的实施方式仅为一例,可应用本发明的实施方式并不限定于下述的实施方式。
(装置构成例)
图1示出了本实施方式的参数估计装置100的构成图。如图1所示,本实施方式的参数估计装置100具有输入部110、运算部120、输出部130、及数据保存部140。
参数估计装置100可由1个装置(计算机)构成,也可被构成为由多个计算机组成的系统。该系统可被称为参数估计系统。参数估计系统中,例如,运算部120和数据保存部140可为单独的服务器。
藉由观测而获得的数据的隐藏数据(concealed data)被输入参数估计装置100的输入部110。除非另有说明,参数估计装置100处理的数据为隐藏数据,并通过安全计算来进行计算。
输入的数据作为数据库被保存在数据保存部140中。运算部120通过对从数据保存部140的数据库中读取的标量、矢量(向量)、矩阵等的数据执行后述的处理来进行cox比例风险模型的参数估计。输出部130输出由运算部120估计出的参数。
需要说明的是,运算部120算出的参数保存在数据保存部140中,并可响应于来自外部的访问而从输出部130输出。稍后将描述运算部120中的处理内容的细节。
(硬件构成例)
本实施方式的参数估计装置100例如可藉由使计算机执行记述有本实施方式中说明的处理内容的程序而实现。需要说明的是,该「计算机」(注:「」等同于“”)可为物理机,也可为云端(cloud)上的虚拟机。在使用虚拟机的情况下,这里描述的「硬件」为虚拟硬件。
上述程序可存储在计算机可读存储介质(便携式存储器等)中、保存、或分发。此外,也可通过互联网、电子邮件等的网络来提供上述程序。
图2是上述计算机的硬件构成示例的示意图。图2的计算机具有分别藉由总线B而彼此连接的驱动装置1000、辅助存储装置1002、存储装置1003、CPU 1004、接口装置1005、显示装置1006、输入装置1007、输出装置1008等。
实现该计算机的处理的程序例如可由CD-ROM、存储卡等的存储介质1001提供。存储有程序的存储介质1001被放入(set)驱动装置1000后,程序可从存储介质1001经由驱动装置1000被安装至辅助存储装置1002。但是,程序并不是一定要通过存储介质1001来安装,也可经由网络从其它计算机下载。辅助存储装置1002保存被安装的程序,同时还保存必要的文件、数据等。
存储装置1003在接收到程序启动指示时从辅助存储装置1002读取程序并对其进行保存。CPU 1004根据存储装置1003中保存的程序实现参数估计装置100的功能。接口装置1005用作与网络连接的接口。显示装置1006对基于程序的GUI(Graphical UserInterface)等进行显示。输入装置1007由键盘、鼠标、按钮、触屏等构成,用于输入各种操作指示。输出装置1008输出运算结果。
(准备)
这里,对参数估计装置100的操作示例进行说明之前,作为准备,先对标记法(notation)、cox比例风险回归、安全计算等进行说明。
<标记法>
将a由b定义记为a:=b,将矢量记为→a:=(a0,…,an-1),如无特殊说明,A这样的大写字母表示矩阵,并将转置矩阵记为AT。需要说明的是,本说明书的文本中,为了便于记载,将应置于字母正上方的矢量符号(→)写在了字母的前面,例如「→a」。此外,附图记载的算法中,3阶张量以斜体字母表示。本说明书的文本中,为了便于记载,对3阶张量的字母以在该字母的左上方标注tensor的方式进行了表示,例如tensorZZ’。
如果加减乘法中输入为矢量→a或矩阵A和标量b,则对→a和A的所有要素进行与b的运算。此外,没有特别记载的矢量为列矢量(column vector)。如果为行矢量(rowvector),则在其左上方标注t以进行区分,例如t→a。
<cox比例风险回归>
cox比例风险模型是由下述式(1)表示的模型(非专利文件1)。
[式1]
Figure BDA0004171563210000051
式(1)中,t、β、及z分别表示时间、权重、及特征量,λ0(t)和exp(→βT→z)分别被称为基准风险函数(baseline hazard function)和相对风险函数(relative riskfunction)(风险(hazard))。cox比例风险回归中对权重的参数β进行估计。权重是通过使用下述式(2)所示的部分似然(likelihood)进行最优似然估计而计算的。
[式2]
Figure BDA0004171563210000052
式(2)中,D为观察到死亡的时点的个数(数量),→zi表示在时点i死亡的患者的特征量。需要说明的是,本实施方式中,虽然将死亡用作目标事件,但是这仅为示例。例如,也可将跌倒、无法行走、疾病发作、住院等作为目标事件。中止也可被解释为事件之一。
式(2)中的Ri是直到时点i之前也没有发生中止或死亡的患者的集合,被成为风险集合(risk set)。需要说明的是,「中止」是指,无法再进行观测,之后是否发生死亡不得而知。
因而,式(2)的部分似然函数是通过按照每个时点计算“(死亡了的患者的风险)/(风险集合的风险的总和)”并将所有时点的结果相乘而获得的。这种部分似然是基于多个中止或死亡不会发生在相同时点(不存在关系数据(tie data))这样的假设,所以在常带有关系数据的真实数据中一般使用下述式(3)所示的Breslow法。
[式3]
Figure BDA0004171563210000061
式(3)基本上与式(2)的cox的部分似然相同,但是,两者的不同点在于,分母为di次方(di为时点i的死亡患者数)和分子中使用时点i的死亡患者的特征量的总和si代替→zi。在di=1的情况下,与式(2)一致(相同),为此,可认为式(3)是式(2)的一般化形式。在下面的说明中,将式(3)作为前提。
作为计算→β的最优似然估计量的方法,常用的有Newton法等。本实施方式中也使用Newton法。Newton法中,将式(3)变形至对数似然函数后,使用该对数似然函数的1阶导数(derivative)(梯度)和2阶导数(Hessian(黑塞矩阵))进行计算。对数似然函数l(→β)、其1阶导数U(→β)、及2阶导数I(→β)分别由下述式(4)、式(5)、及式(6)表示。
[式4]
Figure BDA0004171563210000062
[式5]
Figure BDA0004171563210000063
[式6]
Figure BDA0004171563210000071
Newton法中,使用式(5)和式(6)对下面的式(7)进行迭代,由此计算→β的最优似然估计值。式(7)大致可在进行5次迭代后收敛。
[式7]
Figure BDA0004171563210000072
<安全计算>
将通过加密、秘密共享等对某个值a进行了隐藏后的值称为a的密文或隐藏值,记为[a]。在a藉由秘密共享而被隐藏了的情况下,通过[a]来参照(refer to)各安全计算装置拥有的秘密共享的片段的集合。需要说明的是,就表示密文的括弧“[”和“]”而言,与在附图和说明书中插入的数式中的括弧的格式有些不同,在说明书的文本中,为了便于记载,使用了“[”和“]”。
接着,对安全计算中的各种运算进行说明。
■四则运算
2个密文[a]和[b]的加法、减法、及乘法分别为计算密文[a+b]、[a-b]、及[a×b]的处理。将这些运算分别记为[a]+[b]、[a]-[b]、及[a]×[b]。
此外,将密文[a]除以纯文本b的处理用诸如[a]/b的标记法来表示。在输入为矢量和矩阵并按照每个要素来进行这些处理的情况下,同样用诸如[→a]+[→b]和[A]+[B]的标记法来表示。
在加减乘法中输入为矩阵A和列矢量→b的情况下,对矩阵的各列矢量进行与b的每个要素的运算,在输入为矩阵A和行矢量t→b的情况下,对矩阵的各行矢量进行与t→b的每个要素的运算。
■总和
将计算矢量[→a]的要素的总和的处理记为sum([→a])。此外,在如sum([A])那样m×n矩阵为sum的输入的情况下,计算列方向的总和,并输出长度n的行矢量[t→c]。
■prefix sub
将根据矢量[→a]:=([a1],[a2],…,[an])和标量[b]计算矢量([b],[b]-[a1],[b]-([a1]+[a2]),…,[b]-Σ[→a])的处理记为prefixSub([→a],[b])。
■倒数
将计算密文[a]的倒数1/[a]的处理记为例如[c]←reciprocal([a])。在输入为矢量的情况下也使用相同的标记法。
■指数
将使密文[a]作为输入并计算纳皮尔数(Napier number)e的[a]次方的处理记为例如[c]←exp([a])。在输入为矢量的情况下也采用相同的标记法。
■Group-by common
Group-by common是生成可在诸如Group-by sum和Group-by count的各种Group-by运算中通用的中间数据的处理。中间数据包括置换表[→π]和表示键(key)的值是否为边界的标志[→e],通过重复使用这些,可高效执行使用相同键的各种Group-by运算。
参见图3和图4,对藉由Group-by common的运算而获得的置换表→π和标志→e的示例进行说明。这里,为了便于描述,将其作为纯文本的处理进行说明。
置换表→π是表示将输入至Group-by common的矢量中的各要素移动至第几个要素即可对该矢量的要素进行排序的矢量。
图3中,将矢量→k输入Group-by common后,对该矢量进行排序,获得如图3所示的置换表→π。例如,置换表→π的第1个要素3表示,如果输入矢量→k的第1个要素成为第3个要素则可进行排序。
标志→e是通过如下方式而获得的矢量,即,针对输入至Group-by common的矢量的排序后的矢量的各要素,使其与该要素的下面的值进行比较,如果相同,则向该要素的位置赋予0,如果不同,则赋予1。图4示出了输入和标志的示例。如图4所示,对于标志的最后的要素,由于无法和下面的值进行比较,所以向该要素的位置赋予1。
将使键的矢量[→k]作为输入来进行Group-by common的处理记为例如下述式(8)。将使用置换表[→π]对矢量[→a]和矩阵[A](行数与[→π]的长度相等)进行排序的处理记为例如下述式(9)和式(10)。
将使用排序后的矢量[→a’]或[A’]、及[→e]进行Group-by sum的处理记为例如下述式(11)和式(12)。[→a’]、[A’]等的’(prime)表示已经排序完毕,下面也采用相同的标记法。
[式8]
Figure BDA0004171563210000091
[式9]
Figure BDA0004171563210000092
[式10]
Figure BDA0004171563210000093
[式11]
Figure BDA0004171563210000094
[式12]
Figure BDA0004171563210000101
在sort和groupBySum的输入为矩阵的情况下,处理按每列进行。此外,一般而言,进行Group-by sum后,输出的大小(size)会小于或等于输入的大小,但是,本实施方式中输入和输出的大小相同,不需要的部分在尾部用零填充。据此,可对时点键属性的个数进行隐藏。需要说明的是,在下述的处理的说明中,为了方便起见,将Group-by sum的结果记为「长度为时点数的矢量」或「时点数×n的矩阵」,但是,实际上处理的是不需要的部分被0进行了填充后的「长度为记录数的矢量」或「记录数×n的矩阵」。
例如,在将图4所示的标志→e记为(0,1,0,0,1,1)的情况下,假设→a’为(2,1,3,5,1,2),则将→a’和→e作为输入的Group-by sum为(2+1,3+5+1,2,0,0,0)=(3,9,2,0,0,0)。
(关于参数估计装置100的操作)
下面,对参数估计装置100的操作示例进行说明。参数估计装置100的运算部120读取数据保存部140(数据库)中保存的密文的数据,并通过安全计算来计算上述式(5)、式(6)、及式(7),由此进行cox比例风险回归的参数估计。下面首先对特征性操作进行说明。
<对所有记录进行集中处理>
在原样实装了式(5)和式(6)的情况下,处理为按每个时点进行迭代计算,并对计算结果依次相加。安全计算cox比例风险回归的情况下,为了隐藏时点数,使用上述groupByCommon和groupBySum。
groupByCommon和groupBySum中,对时点的值进行隐藏的同时执行每个时点的汇总,并用0对不需要的部分进行填充,这样就不会泄露与时点数有关的信息。
此外,不是进行每个时点数的迭代处理,而是对所有记录进行集中处理,据此,可减少安全计算中的处理成本较大的运算的次数,处理效率也较高。换言之,例如,不是进行在时点1计算Σj∈Riexp(→βT→zj)、在时点2计算Σj∈Riexp(→βT→zj)、…这样的计算,而是一次计算所有时点的Σj∈Riexp(→βT→zj)。具体而言,在各时点的值为标量的情况下,将其视为长度是时点数的矢量并对其进行集中计算,在各时点的值为长度n的矢量的情况下,将其视为时点数×n的矩阵并对其进行集中计算。此外,在各时点的值为n×n矩阵的情况下,将其视为时点数×n×n的3阶张量并对其进行集中计算。
<处理成本较大的运算的削减>
式(5)和式(6)中包括很多exp和除法,此外,Σj∈Ri的处理为Group-by sum,所以安全计算中的计算成本非常大。
本实施方式的参数估计装置100可将cox比例风险回归中的exp、除法、及Group-bysum这样的成本较大的处理抑制到最低限度,以进行高效计算。在单纯按照式(5)和式(6)进行计算的情况下,Newton法的每次迭代中,exp为7次×时点数,除法需要3次×时点数,但是,本实施方式中可抑制到如下所述的最低限度。
·每次迭代中exp的计算为1次
·每次迭代中倒数的计算为1次
此外,就Group-by sum而言,通过将处理分为groupByCommon和groupBySum,也可更高效地进行处理。下面对这些运算的削减进行详细说明。
■exp的削减
如式(5)和式(6)所示,exp的参数(argument)都为→βT→zj,所以一次计算后可重复使用。除此之外,通过对上述所有记录进行集中处理,处理可为并列处理,每次迭代只需1次即可。
■除法的削减
在通过倒数计算+乘法来进行除法运算的情况下,可使Σj∈Riexp(→βT→zj)的倒数在式(5)的第2项和式(6)的第1项中重复使用,所以进行1次倒数计算+2次乘法即可,不用进行2次除法运算。式(6)的第2项具有与上述2个不同的除数,但是,无需除法即可求得该项。对式(5)的第2项和式(6)的第2项进行比较可知,当使式(5)的第2项的除了di之外的部分为A时,式(6)的第2项可由AAT表示,所以仅通过乘积即可计算式(6)的第2项。除此之外,通过对上述所有记录进行集中处理,处理可为并列处理,每次迭代只需1次即可。
■Group-by sum的削减
如果按照式(5)和式(6)进行实装,则处理期间也需要多次执行Group-bysum,处理效率较低。为此,本实施方式中,从所有键都相同这点出发,重复使用藉由第一次对键仅进行一次Group-bycommon而获得的[→e]。
本实施方式的参数估计装置100中,通过使用Group-by common,可对安全计算cox比例风险回归进行高效计算。groupBySum的计算中,仅进行了使用表示边界的标志[→e]的汇总。
<关于具体的处理内容>
接下来,对参数估计装置100所执行的具体的处理内容进行说明。这里,被隐藏的观测数据在数据保存部140中作为数据库而被进行了保存,运算部120通过安全计算对该数据进行处理,由此来估计cox比例风险回归的参数。处理操作中,执行上述特征性操作。
运算部120的处理对象即数据库的示意图如图5所示。图5中,为了便于说明,由纯文本对数据进行了表示,此外,还示出了按时点的升序进行了排序后的状态。
如图5所示,数据库中,按照患者数m中的每个患者(观测对象)保存了n个特征量、观测的时点、及该时点的状态(死亡=1,中止=0)。m也为记录数,D为时点数。例如,如果时刻矢量→t=(1,1,1,2),则时点数为2。
图5的示例中,就1个患者而言,在死亡了的情况下,将该患者、该患者的特征量、该时点、及该状态记录(保存)在数据库内。此外,就在该时点被中止了的患者而言,也将该患者、该患者的特征量、该时点、及该状态记录在数据库内。
另外,在相同时点可能会观察到多个患者的死亡或中止。为此,时点数D≤患者数m。
通过从数据库中读取数据,运算部120将所有患者的特征量保持为m×n的矩阵Z,将时点保持为时刻矢量→t,并将所有患者的状态保持为状态矢量→c。
Z、→t、及→c在初始状态下都没有被排序。如上所述,使用Group-by common先对时刻矢量→t进行排序以创建置换表→π,然后通过对其进行重复使用,就以特征量Z或状态矢量→c的→t为键的排序而言,仅进行基于置换表→π的排序即可。换言之,成本低于正常排序。
<处理步骤>
参数估计装置100的运算部120按照图6和图7所示的算法的步骤对上述数据库的数据进行参数估计。图6和图7中为了进行说明赋予了行号。下文中,将处理部分的行号视为步骤号进行说明。
在图6的算法1的步骤3中,运算部120通过[0]对n阶权重矢量[→β]进行初始化。在步骤4中,使用Group-by common对→t进行排序以创建置换表→π,并生成标志→e。
在步骤5和步骤6中,运算部120分别对[Z]和[→c]进行排序,以生成[Z’]和[→c’]。
运算部120在步骤8中基于[Z’]生成除了死亡例的特征量之外都为0的[Z’dead],在步骤9中使用groupBySum生成由每个时点的死亡例的特征量的总和构成的[S]。在步骤11中,算出每个时点的死亡数[→d]。在步骤13中,生成m×n×n张量[tensorZZ’],在步骤15~17中进行[→β]的更新。
关于步骤16的calcGH的处理,参见图7进行说明。在步骤3~6中,运算部120计算与→zexp(→βT→z)对应的[W’]、与→z→zTexp(→βT→z)对应的[tensorX’]等。与步骤4中计算的exp(→βT→zj)对应的[t→v’]在后续的计算中被重复使用。
步骤8~10中,运算部120计算与各时点的Σj∈Riexp(→βT→zj)对应的[→vpsub]。时点数长度的矢量[→vpsub]的各要素成为标量值Σj∈Riexp(→βT→zj)。换言之,这里的计算不是每个时点数的迭代处理的计算,而是所有记录的集中处理的计算。下面描述的[Wpsub]和[tensorXpsub]的计算中同样也对所有记录进行集中处理。
在步骤12~14中,运算部120计算与各时点的Σj∈Ri→zjexp(→βT→zj)对应的[Wpsub]。在步骤16~18中,运算部120计算与各时点的Σj∈Ri→zj→zj Texp(→βT→zj)对应的[tensorXpsub]。
在步骤20中,运算部120计算与Σj∈Riexp(→βT→zj)的倒数对应的[→y]。倒数的计算仅为该部分。
在步骤22~25中,运算部120计算梯度即式(5)。[→y]和[→d]是长度为时点数的矢量,[G]、[W]、及[S]是时点数×特征量数的矩阵,计算结果[t→g]是长度为特征量数的行矢量。藉由步骤25的sum,对所有时点的总和进行计算。
在步骤27~30中,运算部120计算黑塞矩阵(Hessian)即式(6)。步骤29的[Gtmp][Gtmp]T与上述AAT对应。
(实施方式的效果)
藉由上述本实施方式的技术,不需要对时点的个数进行解码即可高效地进行cox比例风险模型的参数估计。
换言之,藉由本实施方式的技术,只对所有数据进行一次处理,无需执行以往的纯文本中的处理那样的迭代处理,据此,不需要对时点数进行解码即可进行计算。此外,藉由减少迭代处理,可使除法、指数、及group-by sum这样的安全计算中的处理成本较大的处理为并列处理,这样,可在对数据和时点数进行隐藏的同时高效地执行cox比例风险回归的参数估计。
(实施方式的总结)
本说明书中至少记载了下述各项所述的参数估计装置、参数估计系统、参数估计方法、及程序。
(第1项)
一种参数估计装置,通过安全计算进行cox比例风险模型的参数估计,所述参数估计装置具备:
数据保存部,对数据库进行保存,该数据库中按照每个观测对象具有记录,该记录包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;
运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出部,输出由所述运算部估计出的参数。
(第2项)
如第1项所述的参数估计装置,其中,
所述运算部藉由1次迭代进行1次exp的计算和进行利用该计算的结果的运算的方式来执行用于所述参数估计的迭代计算中使用的计算公式内的多个exp的计算。
(第3项)
如第1项或第2项所述的参数估计装置,其中,
所述运算部藉由1次迭代进行1次倒数的计算和进行利用该计算的结果的运算的方式来执行用于所述参数估计的迭代计算中使用的计算公式内的多个倒数的计算。
(第4项)
如第1项至第3项中的任一项所述的参数估计装置,其中,
所述运算部使用矢量或矩阵或张量对所有时点执行用于所述参数估计的迭代计算中使用的计算公式内的每个时点的计算。
(第5项)
一种参数估计系统,通过安全计算进行cox比例风险模型的参数估计,所述参数估计系统具备:
数据保存部,对数据库进行保存,该数据库中按照每个观测对象具有记录,该记录包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;
运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;
输出部,输出由所述运算部估计出的参数。
(第6项)
一种由参数估计装置执行的参数估计方法,该参数估计装置通过安全计算进行cox比例风险模型的参数估计,所述参数估计方法具有:
运算步骤,从按照每个观测对象具有包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态的记录的数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出步骤,输出由所述运算步骤估计出的参数。
(第7项)
一种程序,使计算机作为第1项至第4项中的任一项所述的参数估计装置中的各功能部而发挥功能。
以上对本实施方式进行了说明,但是,本发明并不限定于上述特定的实施方式,在权利要求书记载的本发明的主旨的范围内还可进行各种各样的变形和变更。
[附图标记说明]
100 参数估计装置
110 输入部
120 运算部
130 输出部
140 保存部
1000 驱动装置
1001 存储介质
1002 辅助存储装置
1003 存储装置
1004 CPU
1005 接口装置
1006 显示装置
1007 输入装置
1008 输出装置。

Claims (7)

1.一种参数估计装置,通过安全计算进行cox比例风险模型的参数估计,所述参数估计装置具备:
数据保存部,对数据库进行保存,该数据库按照每个观测对象具有记录,该记录包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;
运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出部,输出由所述运算部估计出的参数。
2.如权利要求1所述的参数估计装置,其中,
所述运算部藉由每次迭代进行1次exp的计算和进行利用该计算的结果的运算的方式来执行用于所述参数估计的迭代计算中使用的计算公式内的多个exp的计算。
3.如权利要求1或2所述的参数估计装置,其中,
所述运算部藉由每次迭代进行1次倒数的计算和进行利用该计算的结果的运算的方式来执行用于所述参数估计的迭代计算中使用的计算公式内的多个倒数的计算。
4.如权利要求1至3中的任一项所述的参数估计装置,其中,
所述运算部使用矢量或矩阵或张量对所有时点集中执行用于所述参数估计的迭代计算中使用的计算公式内的每个时点的计算。
5.一种参数估计系统,通过安全计算进行cox比例风险模型的参数估计,所述参数估计系统具备:
数据保存部,对数据库进行保存,该数据库按照每个观测对象具有记录,该记录包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态;
运算部,从所述数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出部,输出由所述运算部估计出的参数。
6.一种由参数估计装置执行的参数估计方法,所述参数估计装置通过安全计算进行cox比例风险模型的参数估计,所述参数估计方法具有:
运算步骤,从按照每个观测对象具有包含事件被观测到的时点、该时点的观测对象的特征量、及该时点的观测对象的状态的记录的数据库中读取由时点构成的矢量,通过对该矢量进行排序,生成置换表和表示时点的边界的标志,通过使用所述置换表和所述标志,在对时点的值进行隐藏的同时执行所述特征量的每个时点的汇总,并根据汇总结果进行所述参数估计;及
输出步骤,输出由所述运算步骤估计出的参数。
7.一种程序,使计算机作为如权利要求1至4中的任一项所述的参数估计装置中的各功能部而发挥功能。
CN202080106085.5A 2020-10-16 2020-10-16 参数估计装置、参数估计系统、参数估计方法及程序 Pending CN116324935A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/039119 WO2022079904A1 (ja) 2020-10-16 2020-10-16 パラメータ推定装置、パラメータ推定システム、パラメータ推定方法、及びプログラム

Publications (1)

Publication Number Publication Date
CN116324935A true CN116324935A (zh) 2023-06-23

Family

ID=81209023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080106085.5A Pending CN116324935A (zh) 2020-10-16 2020-10-16 参数估计装置、参数估计系统、参数估计方法及程序

Country Status (6)

Country Link
US (1) US20230367846A1 (zh)
EP (1) EP4231272A1 (zh)
JP (1) JP7456514B2 (zh)
CN (1) CN116324935A (zh)
AU (1) AU2020472128B2 (zh)
WO (1) WO2022079904A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087854A1 (ja) 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム
EP3401828B1 (en) 2016-01-07 2020-05-06 Sony Corporation Information processing device, information processing system, information processing method and program

Also Published As

Publication number Publication date
EP4231272A1 (en) 2023-08-23
US20230367846A1 (en) 2023-11-16
AU2020472128B2 (en) 2023-11-30
JPWO2022079904A1 (zh) 2022-04-21
WO2022079904A1 (ja) 2022-04-21
AU2020472128A1 (en) 2023-05-11
JP7456514B2 (ja) 2024-03-27

Similar Documents

Publication Publication Date Title
US8498411B1 (en) Using multiples above two with running totals and reference values other than 0 and 2 (window size) in elliptic curve cryptography scalar multiplication acceleration tables
Gu et al. A division-free Toom–Cook multiplication-based Montgomery modular multiplication
US8311215B2 (en) Encryption apparatus, decryption apparatus, key generation apparatus, and storage medium
Borinsky et al. Tropical Feynman integration in the Minkowski regime
Das Computational number theory
JP5449576B2 (ja) 演算装置、演算装置の楕円スカラー倍算方法、楕円スカラー倍算プログラム、演算装置の剰余演算方法および剰余演算プログラム
Wenger et al. Harder, better, faster, stronger: elliptic curve discrete logarithm computations on FPGAs
Farzam et al. Implementation of supersingular isogeny-based Diffie-Hellman and key encapsulation using an efficient scheduling
Diem et al. Index calculus in class groups of non-hyperelliptic curves of genus three
Abramov et al. Denominators of rational solutions of linear difference systems of an arbitrary order
CN116324935A (zh) 参数估计装置、参数估计系统、参数估计方法及程序
US10333697B2 (en) Nondecreasing sequence determining device, method and program
Wild Generating all cycles, chordless cycles, and hamiltonian cycles with the principle of exclusion
JP7091930B2 (ja) テンソルデータ計算装置、テンソルデータ計算方法及びプログラム
Roman’kov et al. Algebraic and quantum attacks on two digital signature schemes
Maity et al. A comparative numerical study of the spectral theory approach of Nishimura and the roots method based on the analysis of BDMMAP/G/1 queue
Saito et al. Computation of true chaotic orbits using cubic irrationals
Xu et al. Efficient algorithms for computing multidimensional integral fractional Laplacians via spherical means
Koç A New Algorithm for Inversion mod $ p^ k$
Barina Multiplication algorithm based on Collatz function
Wu et al. An efficient montgomery exponentiation algorithm for cryptographic applications
US9355363B2 (en) Systems and methods for virtual parallel computing using matrix product states
JP2018538620A5 (zh)
Wu et al. Fast modular multiplication based on complement representation and canonical recoding
Lou et al. An efficient Montgomery exponentiation algorithm by using signed-digit-recoding and folding techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination