CN117999031A - 以可解释人工智能为基础的医疗数据的解析方法、程序及装置 - Google Patents
以可解释人工智能为基础的医疗数据的解析方法、程序及装置 Download PDFInfo
- Publication number
- CN117999031A CN117999031A CN202280063390.XA CN202280063390A CN117999031A CN 117999031 A CN117999031 A CN 117999031A CN 202280063390 A CN202280063390 A CN 202280063390A CN 117999031 A CN117999031 A CN 117999031A
- Authority
- CN
- China
- Prior art keywords
- neural network
- medical data
- network model
- data
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 364
- 201000010099 disease Diseases 0.000 claims abstract description 96
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 96
- 230000006870 function Effects 0.000 claims description 93
- 208000002682 Hyperkalemia Diseases 0.000 claims description 60
- 230000001131 transforming effect Effects 0.000 claims description 24
- 230000000877 morphologic effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 description 57
- 230000008569 process Effects 0.000 description 34
- 238000013136 deep learning model Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 12
- 230000009466 transformation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明的一实施例涉及由计算装置执行的以可解释人工智能为基础的医疗数据的解析方法、程序及装置。所述方法包括下列步骤:以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性;以及利用所述已学习的第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
Description
技术领域
本发明的内容涉及一种医疗领域的深度学习技术,具体地,该方法针对用于检测疾病的深度学习模型的决策过程进行解析,以解析结果为基础说明医疗数据与疾病之间的相关关系。
背景技术
制约人工智能的最大问题是无法说明正确的决策过程,即,无法说明黑盒子的极限。即,人们无法得知和人工智能的判断错误有关的过程与理由。该极限妨碍了针对错误的监视与感知,因此在医疗领域中该问题是致命性的。为了克服该极限,人们目前正在进行很多研究。
例如,现有研究之一是疾病感知,为了标示重要的数据领域而使用灵敏度图(sensitivity map)。然而,灵敏度图只对判断为重要的领域进行标示,却无法说明该领域的哪个特征是与疾病有关的。现有研究中另一个则使用了下述技术,即,把说明疾病的各特征的模块加以统合后感知疾病的集成技术。该研究能够说明哪个特征参与了感知疾病时的决策。然而,该研究只使用了由模块预先决定的特征。因此实质上无法得知人工智能执行了什么决策。
发明内容
技术问题
本发明旨在解决前述背景技术的问题,本发明的目的是提供一种方法,该方法能说明用于检测疾病的深度学习模型的判断及决定的理由,以该说明为基础解析医疗数据的哪个特征和疾病有关。
然而,本发明需要解决的技术课题不限于前述课题,可以在下面的记载中明确地了解到前面没有提到的其它课题。
技术方案
实现如前所述的课题的本发明的一实施例揭示了一种由计算装置执行的以可解释人工智能为基础的医疗数据的解析方法。所述方法可包括下列步骤:以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性;以及利用所述已学习的第一神经网络模型变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
或者,所述第二神经网络模型可包括:第一副神经网络模型,为了使得对所述疾病的阳性或阴性的推断与所述第二医疗数据相反而变换所述第二医疗数据的特征从而生成第三医疗数据;以及第二副神经网络模型,为了使得对所述疾病的阳性或阴性的推断与所述第二医疗数据相同而变换所述第三医疗数据的特征从而生成第四医疗数据。
或者,利用所述已学习的第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反,该步骤包括下列步骤:利用所述第二神经网络模型变换所述第二医疗数据的特征并且利用所述已学习的第一神经网络模型对所述变换了特征的第二医疗数据推断阳性或阴性;以及以把所述变换了特征的第二医疗数据或对所述变换了特征的第二医疗数据的阳性或阴性推断结果中的至少一个作为输入变量的损失函数为基础,让所述第二神经网络模型学习。
或者,所述利用第二神经网络模型变换所述第二医疗数据的特征并且利用所述已学习的神经网络模型对所述变换了特征的第二医疗数据推断阳性或阴性的步骤可包括下列步骤:以所述第二神经网络模型所含第一副神经网络模型为基础把推断为阴性的第二医疗数据的特征予以变换而生成被推断为与所述第二医疗数据相反的阳性的第三医疗数据;以及以所述第二神经网络模型所含第二副神经网络模型为基础把所述第三医疗数据的特征予以变换而生成与推断为阴性的所述第二医疗数据对应的第四医疗数据。
或者,所述利用第二神经网络模型变换所述第二医疗数据的特征并且利用所述已学习的神经网络模型对所述变换了特征的第二医疗数据推断阳性或阴性的步骤可包括下列步骤:向所述第二副神经网络模型输入所述推断为阴性的第二医疗数据,生成对应于所述推断为阴性的第二医疗数据的第五医疗数据;以及向所述已学习的第一神经网络模型输入所述第三医疗数据而生成下述预测数据,该预测数据示出对所述第三医疗数据的所述疾病的阳性或阴性推断结果。
或者,所述损失函数可包括:第一损失函数,用于评估所述第一副神经网络模型是否把相当于所述疾病为阴性的输入的特征予以变换而生成相当于所述疾病为阳性的输出;第二损失函数,用于评估所述第二副神经网络模型是否把所述第一副神经网络模型的输出的特征予以变换而复原所述第一副神经网络模型的输入;以及第三损失函数,用于评估所述第二副神经网络模型是否以所述第一副神经网络模型的输入为基础生成和所述第一副神经网络模型的输入相同的输出。
或者,以把所述变换了特征的第二医疗数据或对所述变换了特征的第二医疗数据的阳性或阴性推断结果中的至少一个作为输入变量的损失函数为基础让所述第二神经网络模型学习的步骤包括下述步骤:以把所述第四医疗数据、所述第五医疗数据或所述预测数据中的至少一个作为输入变量的损失函数为基础,让所述第一副神经网络模型及所述第二副神经网络模型学习。
或者,以把所述第四医疗数据、所述第五医疗数据或所述预测数据中的至少一个作为输入变量的损失函数为基础让所述第一副神经网络模型及所述第二副神经网络模型学习的步骤可包括下列步骤:运算把所述预测数据作为输入变量的第一损失函数,让所述第一副神经网络模型学习以便使得作为所述第一损失函数的运算结果的第一损失减少;运算把所述第四医疗数据作为输入变量的第二损失函数,让所述第一副神经网络模型或所述第二副神经网络模型中的至少一个学习以便使得作为所述第二损失函数的运算结果的第二损失减少;以及运算把所述第五医疗数据作为输入变量的第三损失函数,让所述第二副神经网络模型学习以便使得作为所述第三损失函数的运算结果的第三损失减少。
或者,所述第一医疗数据及所述第二医疗数据可包含心电图数据。而且,所述疾病可包含高钾血症(hyperkalemia)。
或者,所述第二医疗数据的特征能以所述高钾血症为阴性的心电图数据与所述高钾血症为阳性的心电图数据之间的形态学(morphological)差异为基础。
另一方面,实现如前所述的课题的本发明的替代性实施例揭示了由计算装置执行的以可解释人工智能为基础的医疗数据的解析方法。所述方法可包括下列步骤:获取包含心电图数据的医疗数据;以及以第二神经网络模型为基础变换所述医疗数据的特征,从而生成通过第一神经网络模型推断的疾病的阳性或阴性与所述医疗数据相反的输出数据。此时,所述第二神经网络模型可以是利用下述第一神经网络模型预先学习的,该第一神经网络模型则学习对医疗数据推断疾病的阳性或阴性。
或者,所述方法还包括下述步骤:生成用于以视觉方式比较所述医疗数据与所述输出数据的用户界面。
实现如前所述的课题的本发明的一实施例揭示一种存储在计算机可读存储介质的计算机程序(program)。所述计算机程序在一个以上的处理器运行时执行用于以可解释人工智能为基础的医疗数据的解析的多个动作,此时,所述多个动作则可包括下列动作:以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性;以及利用所述已学习的第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
依据实现如前所述的课题的本发明的一实施例,揭示一种用于以可解释人工智能为基础的医疗数据的解析的计算装置。所述装置可包括:处理器,包含至少一个内核(core);存储器(memory),包含所述处理器可执行的多个程序代码(code);以及网络单元(network unit),用于获取医疗数据。此时,所述处理器能以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性,能利用所述已学习的第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
发明的效果
本发明提供的方法能说明用于检测疾病的深度学习模型的判断及决定的理由,能以该说明为基础解析医疗数据的哪个特征和疾病有关。
附图说明
图1是本发明一实施例的计算装置的块图。
图2是示出本发明一实施例的利用第一神经网络模型的疾病阳性或阴性分类过程的块图。
图3是示出本发明一实施例的利用第二神经网络模型的医疗数据解析过程的块图。
图4是示出依据本发明的一实施例学习了的第二神经网络模型的仿真(simulation)结果的图表。
图5是示出本发明一实施例的神经网络模型的学习方法的顺序图。
图6是示出使用本发明一实施例的神经网络模型的医疗数据的解析方法的顺序图。
具体实施方式
下面为了让本发明所属技术领域中的普通技术人员(以下简称“本领域普通技术人员”)能够轻易实行本发明的实施例而结合附图详细说明本发明。本发明所揭示的实施例用来让本领域普通技术人员能利用或实施本发明的内容。因此,对于本发明的实施例的各种变形对本领域普通技术人员是明显清晰的。即,本发明能以各种不同的形态实现,并不局限于下面的实施例。
本发明的整体说明书中相同或相似的附图标记表示相同或相似的要素。而且,可以为了清楚地说明本发明而在附图中省略掉与本发明的说明无关部分的附图标记。
本发明所使用的术语“或”不意味着排他性的“或”而是意味着蕴含性的“或”。即,如果本发明没有特别指定或者在文脉上其意义不明确的话,“x利用a或b”应该理解成意味着自然的蕴含性置换中的一个。例如,如果本发明没有特别指定或者在文脉上其意义不明确的时,“x利用a或b”可解释为x利用a的情形或x利用b的情形或x利用a及b的情形中的一个情形。
本发明所使用的术语“和/或”应理解为指称或包含所列举的相关概念中一个以上概念的所有可能的组合。
本发明所使用的术语“包括”和/或“具有”应该理解成意味着特定特征和/或要素的存在。然而,术语“包括”和/或“具有”应该理解成不排除一个以上的其它特征、其它要素和/或它们的组合的存在或添加。
如果本发明没有特别指定或者在文脉上无法明确看出在指示着单数形态的话,单数通常应解释成可包含“一个或一个以上”。
本发明所使用的术语“第N(N是自然数)”可理解成为了按照功能观点、结构观点或方便说明等预设的基准把本发明的要素予以互相区分而使用的表现方式。例如,本发明中执行不同功能的要素可以区分为第一要素或第二要素。然而,本发明的技术精神内实质相同但是为了说明方便而需要予以区分的要素也能以第一要素或第二要素予以区分。
本发明所使用的术语“获取”不仅可理解为意味着通过和外部装置或系统的有线无线通信网接收数据,还可理解为意味着以设备内置(on-device)形态生成数据。
另一方面,本发明所使用的术语“模块(module)”或“单元(unit)”可理解为指称诸如计算机相关实体(entity)、固件(firmware)、软件(software)或其一部分、硬件(hardware)或其一部分、软件与硬件的组合等处理运算资源的独立功能单位的术语。此时,“模块(module)”或“单元(unit)”可以是由单一要素构成的单位,也可以是由多个要素组合或集合表现的单位。例如,作为协议概念的“模块(module)”或“单元(unit)”可以指称计算装置的硬件要素或其集合、执行软件的特定功能的应用程序、通过执行软件实现的处理过程(procedure)、或用于执行程序的指令集合等。而且,作为广义概念的“模块(module)”或“单元(unit)”可以指称组成系统的计算装置本身或者在计算装置执行的应用程序等。然而,前述概念仅仅是一个例示而已,“模块(module)”或“单元(unit)”的概念能以本发明的内容为基础在本领域普通技术人员可理解的范畴内进行各种定义。
本发明所使用的术语“模型(model)”可理解成为了解决特定问题而使用数学概念与语言实现的系统、用于解决特定问题的软件单位的集合、或对于用于解决特定问题的处理过程的抽象化模型。例如,神经网络(neural network)“模型”可以指称由通过学习而拥有解决问题的能力的神经网络所实现的整个系统。此时,神经网络能通过学习把连接节点(node)或神经元(neuron)的参数(parameter)予以优化而拥有解决问题的能力。神经网络“模型”可包括单一神经网络,也可包括多个神经网络组合而成的神经网络集合。
本发明所使用的术语“块(block)”可理解为以种类、功能之类的各种基准为基础区分的要素的集合。因此,分类成一个“块”的要素可随着基准而被多样化地更改。例如,神经网络“块”可理解为包含至少一个神经网络的神经网络集合。此时,神经网络“块”所含神经网络可假设成为了实现作为分类基准的共同目的而进行一定运算。
前述术语的说明是为了帮助理解本发明的。因此,除非把前述术语明确记载成限制本发明的内容的事项,否则其不是以限制本发明内容的技术精神的意义使用。
图1是本发明一实施例的计算装置的块图。
本发明一实施例的计算装置100可以是执行数据的综合处理及运算的硬件装置或硬件装置的一部分,也可以是以通信网络连接的基于软件的运算环境。例如,计算装置100可以是作为执行集约式数据处理功能并共享资源的主体的服务器,也可以是通过和服务器的相互作用共享资源的客户机(client)。而且,计算装置100也可以是凭借多个服务器及多个客户机相互作用而把数据予以综合处理的云系统(cloud system)。前述内容仅仅是和计算装置100的种类相关的一个例示而已,计算装置100的种类能以本发明的内容为基础在本领域普通技术人员可理解的范畴内以各种方式构成。
请参阅图1,本发明一实施例的计算装置100可包括处理器(processor)110、存储器(memory)120及网络单元(network unit)130。然而,图1仅仅是一个例示而已,计算装置100可包括用于实现运算环境的其它要素。而且,计算装置100也可只包括所述揭示的多个要素中的一部分。
本发明一实施例的处理器110可理解为包括用于执行运算的硬件和/或软件的组成单位。例如,处理器110能读取计算机程序后进行用于机械学习的数据处理。处理器110能对用于机械学习的输入数据的处理、用于机械学习的特征的提取、基于反向传播(backpropagation)的误差计算之类的运算过程进行处理。如前所述的用于执行数据处理的处理器110可包括中央处理装置(CPU:central processing unit)、通用图形处理装置(GPGPU:general purpose graphics processing unit)、张量处理装置(TPU:tensorprocessing unit)、定购型半导体(ASIC:application specific integrated circuit)或现场可编程门阵列(FPGA:field programmable gate array)等。前述处理器110的种类仅仅是一个例示而已,处理器110的种类能以本发明的内容为基础在本领域普通技术人员可理解的范畴内进行各种配置。
处理器110能以医疗数据为基础针对用于检测疾病的人工智能的判断及决策过程的解析用深度学习模型进行训练。处理器110能以医疗数据为基础让深度学习模型学习以便让深度学习模型提供人工智能对医疗数据的哪个特征影响特定疾病发病进行判断的依据。例如,处理器110能把医疗数据输入深度学习模型并变换(transformation)医疗数据而让疾病的发病与否(i.e.阳性或阴性与否)被相反地预测。如果医疗数据是疾病发病的人(i.e.阳性的人)的医疗数据的话,处理器110能使用深度学习模型把所输入的医疗数据予以变换以便将其预测成疾病没有发病的人(i.e.阴性的人)的医疗数据。如果医疗数据是疾病没有发病的人的医疗数据的话,处理器110能使用深度学习模型把所输入的医疗数据予以变换以便将其预测成疾病发病的人的医疗数据。通过该变换生成的数据能以疾病的发病与否为基准呈现出和输入相反的特征。处理器110反复执行深度学习模型的前向传播(forward propagation)与后向传播(backpropagation)以便清晰地表达出深度学习模型所变换的医疗数据所表达的与输入相反的特征,从而能让深度学习模型学习。处理器110能使用通过该过程学习的深度学习模型生成能够说明用于诊断特定疾病的人工智能的判断及决策过程的依据。
处理器110能生成用户界面以便解析用于检测疾病的人工智能的判断及决策过程。处理器110能生成用户界面,该用户界面把使用以如前所述的方式学习的深度学习模型提供的人工智能的判断依据予以视觉化(visualization)。例如,处理器110能生成基于图形的用户界面以便互相比较已经学习的深度学习模型所予以变换的医疗数据和相当于深度学习模型的输入的变换前医疗数据。深度学习模型所予以变换的医疗数据能以疾病的发病与否为基准呈现出与输入相反的特征。因此,比较深度学习模型所予以变换的医疗数据和变换前医疗数据的话,人们就能轻易掌握医疗数据的哪个特征影响疾病的发病。而且,比较深度学习模型所予以变换的医疗数据和变换前医疗数据的话,人们就能轻易掌握用于检测疾病的人工智能是如何解析影响疾病发病的医疗数据的特征。为了让使用者轻易执行如前所述的比较与掌握,处理器110能生成下述用户界面,该用户界面分别以图形表达深度学习模型所予以变换的医疗数据和变换前医疗数据。
本发明一实施例的存储器120可理解为包括把计算装置100所处理的数据予以存储并管理的硬件和/或软件的组成单位。即,存储器120能存储处理器110所生成或所确定的任何形态的数据及网络单元130所收到的任何形态的数据。例如,存储器120可以包括闪存式(flash memory type)、硬盘式(hard disk type)、多媒体微记忆卡式(multimedia cardmicro type)、卡式存储器、随机存取存储器(RAM:random access memory)、静态随机存储器(SRAM:static random access memory)、只读存储器(ROM:read-only memory)、带电可擦可编程只读存储器(EEPROM:electrically erasable programmable read-onlymemory)、可编程只读存储器(PROM:programmable read-only memory)、磁存储器、磁盘、光盘中至少一个形式的存储介质。而且,存储器120也可包括以预设体系管制并管理数据的数据库(database)系统,前述存储器120的种类仅仅是一个例示而已,存储器120的种类能以本发明的内容为基础在本领域普通技术人员可理解的范畴内进行各种配置。
存储器120能把处理器110执行运算时所需要的数据、数据组合以及能在处理器110执行的多个程序代码(code)等予以结构化及组织化后管理。例如,存储器120能把通过后述的网络单元130收到的医疗数据予以存储。存储器120能存储让神经网络模型接收医疗数据的输入后进行学习的程序代码、让神经网络模型接收医疗数据的输入后按照计算装置100的使用目的进行推论的程序代码、执行程序代码而生成的加工数据等。
本发明一实施例的网络单元130可理解为通过任何形态的公知的有线无线通信系统收发数据的组成单位。例如,网络单元130能使用局域网(LAN:local area network)、宽带码分多址(WCDMA:wideband code division multiple access)、长期演进(LTE:longterm evolution)、无线宽频(WiBro:wireless broadband internet)、第五代移动通信(5G)、超宽带无线通信(ultra wide-band)、紫蜂(ZigBee)、射频(RF:radio frequency)通信、无线局域网(wireless LAN)、无线上网(wireless fidelity)、近场通信(NFC:nearfield communication)或蓝牙(Bluetooth)之类的有线无线通信系统进行数据收发。前述多个通信系统仅仅是一个例示而已,还能在前述例示以外适用各种用于网络单元130数据收发用途的有线无线通信系统。
网络单元130能通过和任何系统或任何客户机等的有线无线通信接收处理器110进行运算时所需要的数据。而且,网络单元130能通过和任何系统或任何客户机等的有线无线通信发送通过处理器110的运算生成的数据。例如,网络单元130能通过和医院环境内数据库、执行医疗数据标准化之类作业的云服务器或计算装置等的通信接收医疗数据。网络单元130能通过和前述数据库、服务器或计算装置等进行通信发送神经网络模型所输出的数据以及处理器110运算过程中导出的中间数据、加工数据等。
图2是示出本发明一实施例的利用第一神经网络模型的疾病阳性或阴性分类过程的块图。
请参阅图2,本发明一实施例的计算装置100的处理器110能以第一医疗数据10为基础针对用于检测疾病的第一神经网络模型200进行训练。处理器110能以医疗数据10为基础让第一神经网络模型200学习以便让第一神经网络模型200把疾病的阳性或阴性予以分类。此时,第一医疗数据10可包含诊断疾病时运用形态学(morphological)解析的生物信号相关数据。
例如,处理器110能把第一医疗数据10所含心电图数据输入第一神经网络模型200而针对第一医疗数据10的测量对象预测高钾血症(hyperkalemia)的阳性或阴性。处理器110能利用损失函数把对第一医疗数据10的高钾血症阳性或阴性预测结果和基准真实值(GT,ground truth)予以比较。处理器110能以比较结果为基础重新配置诸如第一神经网络模型200的加权值(weight)之类的参数。处理器110反复执行该运算一直到损失函数收敛为止而能以第一医疗数据10为基础让第一神经网络模型200学习。第一神经网络模型200的学习除了前述例示的监督学习(supervised learning)以外,还能以半监督学习(semi-supervised learning)、无监督学习(unsupervised learning)、强化学习(reinforcementlearning)等为基础执行。
另一方面,第一神经网络模型200可包括用于从第一医疗数据10提取特征的神经网络210、以所提取的特征为基础对疾病阳性或阴性分类的神经网络220。例如,第一神经网络模型200的用于提取特征的神经网络210可包括残差(residual)神经网络。用于提取特征的神经网络210能由n个(n是自然数)的残差块(block)组成。n个残差块可分别包含卷积层(convolutionlayer)、激活(activation)层、随机失活(dropout)层及批量归一化(batchnormalization)层。第一神经网络模型200的用于分类的神经网络220能把用于提取特征的神经网络210所生成的特征图按照通道(channel-wise)予以平均化。用于分类的神经网络220能通过全连接层(FCL:fullyconnectedlayer)与软最大值(softmax)激活层计算疾病为阳性或阴性的概率。
图3是示出本发明一实施例的利用第二神经网络模型的医疗数据解析过程的块图。
本发明一实施例的计算装置100的处理器110能以第二医疗数据20为基础进行第二神经网络模型的学习,该第二神经网络模型则解析用于检测疾病的第一神经网络模型200的判断及决定过程。处理器110能以第二医疗数据20为基础让第二神经网络模型学习以便让第二神经网络模型以第一神经网络模型200的任务(task)为基准生成针对第二医疗数据20的反因子(counter factor)。处理器110能让第二神经网络模型学习以便生成下述数据,该数据是第二神经网络模型说明第一神经网络模型200的数据解析及决策过程时可使用的比较数据。此时,处理器110能在第二神经网络模型的学习过程使用预先学习的第一神经网络模型200。而且,第二医疗数据20可以包含诊断疾病时运用形态学解析的生物信号相关数据。
具体地,请参阅图3,处理器110能以第二神经网络模型所含第一副神经网络模型310为基础把第二医疗数据20的特征予以变换。此时,第二医疗数据20的特征变换可理解为下述运算过程,即,以第二医疗数据20为基础生成新数据以便导出和第一神经网络模型200对第二医疗数据20的预测结果相反的结果。处理器110能通过第一副神经网络模型310把第二医疗数据20的特征予以变换而生成第三医疗数据30以便使得对疾病的阳性或阴性的推断和第二医疗数据20相反。此时,第一副神经网络模型310可包括:神经网络311,用于从第二医疗数据20提取特征;以及神经网络312,把提取的特征予以变换而生成让疾病的阳性或阴性推断与第二医疗数据20相反的第三医疗数据30。第一副神经网络模型310的用于提取特征的神经网络311可对应于第一神经网络模型200的用于提取特征的神经网络210。因此,在第一副神经网络模型310的学习过程中可以不执行针对用于提取特征的神经网络311的训练而只执行针对生成第三医疗数据30的神经网络312的训练。
例如,处理器110能把第二医疗数据20所含心电图数据输入第一副神经网络模型310。此时,第二医疗数据20所含心电图数据可以是高钾血症为阴性的人的心电图数据。处理器110能通过第一副神经网络模型310把第二医疗数据20所含心电图数据的PR间距、QRS持续时间、T振幅之类的形态学特征予以变换。而且,处理器110通过基于第一副神经网络模型310的第二医疗数据20的形态学特征的变换生成包含高钾血症被推断为阳性的心电图数据的第三医疗数据30。即,处理器110能使用第一副神经网络模型310把高钾血症为阴性的心电图数据的形态学特征予以变换而生成被第一神经网络模型200推断高钾血症为阳性的心电图数据。
处理器110能以第二神经网络模型所含第二副神经网络模型320为基础把第三医疗数据30的特征予以变换。此时,第三医疗数据30的特征变换可理解为如下所述的运算过程,即,为了导出和第一神经网络模型200对第二医疗数据20的预测结果相同的结果而把第三医疗数据30复原成第二医疗数据20的运算过程。处理器110能通过第二副神经网络模型320把第三医疗数据30的特征予以变换而生成对应于第二医疗数据20的第四医疗数据40以便和第二医疗数据20相同地推断疾病的阳性或阴性。此时,第二副神经网络模型320可包括用于从第三医疗数据30提取特征的神经网络321以及把提取的特征予以变换而生成对应于第二医疗数据20的第四医疗数据40的神经网络322。第二副神经网络模型320的用于提取特征的神经网络321可对应于第一神经网络模型200的用于提取特征的神经网络210。因此,在第二副神经网络模型320的学习过程中可以不执行针对用于提取特征的神经网络321的训练而只执行针对生成第四医疗数据40的神经网络322的训练。
例如,处理器110能把通过第一副神经网络模型310生成的包含心电图数据的第三医疗数据30输入第二副神经网络模型320。此时,第三医疗数据30所含心电图数据可以是被第一神经网络模型200推断为高钾血症阳性的数据。处理器110能通过第二副神经网络模型320以心电图的PR间距、QRS持续时间、T振幅之类的指标为基准把第三医疗数据30所含心电图数据的形态学特征予以变换。而且,处理器110能通过基于第二副神经网络模型320的第三医疗数据30的形态学特征的变换生成接近第二医疗数据20的第四医疗数据40。也就是说,处理器110能进行下列运算,即,通过第二副神经网络模型320把第一副神经网络模型310所生成的第三医疗数据30重新复原成第二医疗数据20。即,处理器110能使用第二副神经网络模型320把高钾血症被推断为阳性的心电图数据的形态学特征予以变换而生成高钾血症为阴性的心电图数据。
以前述内容为基础,处理器110能使用第一副神经网络模型310及第二副神经网络模型320变换第二医疗数据20的域(domain)。此时,第二医疗数据20的域可理解为以疾病的阳性或阴性为基准区分的域。例如,处理器110能通过第一副神经网络模型310把相当于特定疾病的阴性域的第二医疗数据20变换成阳性域。处理器110能通过第二副神经网络模型320把变换成阳性域的第二医疗数据20重新变换成阴性域。此时,利用第一副神经网络模型310的阳性域变换及利用第二副神经网络模型320的阴性域变换可理解为在最大程度保持第二医疗数据20的内容(content)的情形下变换第二医疗数据20的样式(style)的运算过程。
处理器110能以预先学习的第一神经网络模型200为基础针对第一副神经网络模型310所生成的第三医疗数据30预测疾病的阳性或阴性。处理器110能把第三医疗数据30输入预先学习的第一神经网络模型200生成包含对第三医疗数据30的疾病阳性或阴性推断结果的预测数据50。处理器110能通过预先学习的第一神经网络模型200确认第一副神经网络模型310所生成的第三医疗数据30是否与第二医疗数据20相反地预测疾病的阳性或阴性。即,处理器110能利用预先学习的第一神经网络模型200评估第一副神经网络模型310的运算结果。也就是说,预先学习的第一神经网络模型200可理解为用于判别第一副神经网络模型310的运算结果的模型。
例如,处理器110能把第三医疗数据30输入第一神经网络模型200,该第三医疗数据30则是把包含高钾血症为阴性的心电图数据的第二医疗数据20输入第一副神经网络模型310后生成的。处理器110能通过第一神经网络模型200的特征提取神经网络210提取第三医疗数据30所含心电图数据的特征。而且,处理器110能通过第一神经网络模型200的分类神经网络220以第三医疗数据30的特征为基础生成预测数据50,该预测数据50则包含第三医疗数据30的高钾血症为阳性或阴性的概率。第一副神经网络模型310按照自己的任务准确地生成了第三医疗数据30的话,第一神经网络模型200能输出包含第三医疗数据30被推断为高钾血症阳性的结果的预测数据50。即,处理器110可以通过第一神经网络模型200评估第一副神经网络模型310把第二医疗数据20的特征予以变换是否准确地生成了与第二医疗数据20相反的高钾血症为阳性的第三医疗数据30。
处理器110能把第二医疗数据20输入第二副神经网络模型320生成对应于第二医疗数据20的第五医疗数据60。此时,第五医疗数据60的生成可理解为下述运算过程,即,该运算过程评估第二副神经网络模型320是否生成其疾病的阳性或阴性与否和第二医疗数据20对应的数据。第二副神经网络模型320基本上能以第三医疗数据30为基础执行复原第二医疗数据20的任务。因此,把第二医疗数据20输入第二副神经网络模型320的话,第二副神经网络模型320理论上需要生成对应于第二医疗数据20的第五医疗数据60。即,处理器110能把第二医疗数据20输入第二副神经网络模型320而确认第二副神经网络模型320是否准确地执行了自己的任务。
例如,处理器110能把包含高钾血症为阴性的心电图数据的第二医疗数据20输入第二副神经网络模型320。处理器110能通过第二副神经网络模型320把第二医疗数据20所含心电图数据的形态学特征予以变换而生成第五医疗数据60。第二副神经网络模型320的目的是在保持所输入的内容的情形下变换样式而生成属于和第二医疗数据20相同的域的数据,因此第五医疗数据60可以是和高钾血症为阴性的第二医疗数据20相同的数据。即,第二副神经网络模型320按照自己的任务准确地生成了第五医疗数据60的话,可理解为第二副神经网络模型320照原样输出高钾血症为阴性的第二医疗数据20。
请参阅图3,处理器110能以第一损失函数为基础执行对第一副神经网络模型310的训练。此时,第一损失函数可以是这样的损失函数,即,该损失函数用来评估第一副神经网络模型310把输入的特征予以变换后是否生成其疾病的阳性或阴性和输入相反的输出。而且,第一损失函数能把包含对第三医疗数据30的疾病阳性或阴性推断结果的预测数据50和基准真实值(GT,ground truth)作为输入变量。例如,第一损失函数能如下述数学式1表达。
数学式1
L1=CrossEntropy(yA,y^A)
在此,yA可以是基准真实值(GT,ground truth),y^A可以是预测数据50所包含的对阳性或阴性的预测概率。数学式1中的损失函数以交叉熵(CrossEntropy)函数表达,但本发明并不局限于该函数。
处理器110能运算以预测数据50与基准真实值(GT,ground truth)作为输入变量的第一损失函数而导出第一损失。处理器110能让第一副神经网络模型310学习以便减少第一损失。即,为了让第一副神经网络模型310欺骗第一神经网络模型200,处理器110能重新配置第一副神经网络模型310的参数以便减少第一损失。例如,第一副神经网络模型310接收了高钾血症为阴性的心电图数据的输入的话,处理器110能反复运算第一损失函数而以第一损失减少的方向重新配置第一副神经网络模型310的生成神经网络312的参数。此时,第一副神经网络模型310的生成神经网络312的参数重新配置可理解为下述过程,即,为了让第一神经网络模型200把第一副神经网络模型310的输出预测成高钾血症为阳性的心电图数据而让第一副神经网络模型310的生成神经网络312学习的过程。此时,第一副神经网络模型310的特征提取神经网络311对应于第一神经网络模型200的特征提取神经网络210,因此在利用第一损失函数的学习过程中可能不会执行第一副神经网络模型310的特征提取神经网络311的学习。
处理器110能以第二损失函数为基础执行对第一副神经网络模型310或第二副神经网络模型320中的至少一个的训练。此时,第二损失函数可以是这样的损失函数,即,该损失函数用来评估第二副神经网络模型320是否变换第一副神经网络模型310的输出的特征而复原第一副神经网络模型310的输入。而且,第二损失函数能把作为第一副神经网络模型310的输入的第二医疗数据20和第二副神经网络模型320以第三医疗数据30为基础生成的第四医疗数据40作为输入变量。即,第二损失函数可以是用来进行下述比较的函数,即,比较第一副神经网络模型310的输入和以第一副神经网络模型310的输出为基础的第二副神经网络模型320的输出。例如,第二损失函数能如下述数学式2表达。
数学式2
L2=Mean squared error(xreal A,xrecover A)
在此,xreal A(x真实 A)可以是第二医疗数据20,xrecover A(x复原 A)可以是第四医疗数据40。数学式2中的损失函数以均方误差(Mean squared error)函数表达,但本发明并不局限于该函数。
处理器110能运算以第二医疗数据20与第四医疗数据40作为输入变量的第二损失函数而导出第二损失。处理器110能让第一副神经网络模型310或第二副神经网络模型320中的至少一个学习以便减少第二损失。即,为了让第四医疗数据40复原成第二医疗数据20,处理器110能重新配置第一副神经网络模型310或第二副神经网络模型320中的至少一个参数以便减少第二损失。例如,第一副神经网络模型310接收了高钾血症为阴性的心电图数据的输入的话,处理器110能反复运算第二损失函数而以第二损失减少的方向重新配置第一副神经网络模型310的生成神经网络312与第二副神经网络模型320的生成神经网络322的参数。此时,多个生成神经网络312、322的参数重新配置可理解为下述过程,即,为了让第二副神经网络模型320生成和第一副神经网络模型310的输入相同的高钾血症为阴性的心电图数据而让多个生成神经网络312、322学习的过程。此时,第一副神经网络模型310的特征提取神经网络311与第二副神经网络模型320的特征提取神经网络321对应于第一神经网络模型200的特征提取神经网络210,因此在利用第一损失函数的学习过程中可能不会执行多个特征提取神经网络311、321的学习。凭借着通过该第二损失函数的学习,处理器110能阻止和第一副神经网络模型310的输入无关的第二副神经网络模型320的输出生成。也就是说,凭借着通过该第二损失函数的学习,处理器110能让第二副神经网络模型320的输出成为下述形态,即,在尽量保持第一副神经网络模型310的输入的内容的情形下只变换了样式的形态。
处理器110能以第三损失函数为基础执行对第二副神经网络模型320的训练。此时,第三损失函数可以是这样的损失函数,即,该损失函数用来评估第二副神经网络模型320以第一副神经网络模型310的输入为基础是否生成了和第一副神经网络模型310的输入相同的输出。而且,第三损失函数能以作为第一副神经网络模型310的输入的第二医疗数据20和第二副神经网络模型320以第二医疗数据30为基础生成的第五医疗数据60作为输入变量。即,第三损失函数可以是用来进行下述比较的函数,即,比较第一副神经网络模型310的输入和以第一副神经网络模型310的输入为基础的第二副神经网络模型320的输出。例如,第三损失函数能如下述数学式3表达。
数学式3
L3=Mean squared error(xreal A,xiden A)
在此,xreal A可以是第二医疗数据20,xiden A(x同一 A)可以是第五医疗数据60。数学式3中的损失函数以均方误差函数表达,但本发明并不局限于该函数。
处理器110能运算以第二医疗数据20与第五医疗数据60作为输入变量的第三损失函数而导出第三损失。处理器110能让第二副神经网络模型320学习以便减少第三损失。即,为了让第五医疗数据60与第二医疗数据20之间的差异最小化,处理器110能重新配置第二副神经网络模型320的参数以便减少第三损失。例如,第二副神经网络模型320接收了高钾血症为阴性的心电图数据的输入的话,处理器110能反复运算第三损失函数而以第三损失减少的方向重新配置第二副神经网络模型320的生成神经网络322的参数。此时,第二副神经网络模型320的生成神经网络322的参数重新配置可理解为下述过程,即,为了让第二副神经网络模型320生成和所输入的心电图数据相同的高钾血症为阴性的心电图数据而让第二副神经网络模型320的生成神经网络322学习的过程。此时,第二副神经网络模型320的特征提取神经网络321对应于第一神经网络模型200的特征提取神经网络210,因此在利用第三损失函数的学习过程中可能不会执行第二副神经网络模型320的特征提取神经网络321的学习。凭借着通过该第三损失函数的学习,第二副神经网络模型320能正确地识别待变换的数据的域。即,凭借着通过第三损失函数的学习,处理器110能让第二副神经网络模型320学习而使得第二副神经网络模型320生成和第一副神经网络模型320的输入相同的域。
另一方面,用于让包括第一副神经网络模型310与第二副神经网络模型320的第二神经网络模型学习的损失函数可表达为第一损失函数、第二损失函数及第三损失函数之和。即,处理器110能如下让第二神经网络模型学习,以作为前述各损失函数的运算结果导出的多个损失的总和减少的方向学习。通过如前所述的学习,第二神经网络模型能生成对于所输入的医疗数据的反因子,该反因子则是下述说明的依据,该说明能够对第一神经网络模型200解析医疗数据的哪个特征后预测了疾病的阳性或阴性给予说明。
如前所述,第二神经网络模型被训练成对所输入的医疗数据生成反因子的话,能使得第一神经网络模型200对医疗数据的预测结果和第一神经网络模型200的下述预测结果完全相反地导出,该预测结果是对接收了医疗数据的输入的第二神经网络模型的输出的预测结果。例如,预先学习的第一神经网络模型200对医疗数据的预测结果是阴性的话,预先学习的第一神经网络模型200对接收了医疗数据的输入的第二神经网络模型的输出的预测结果可以是阳性。因此,比较第二神经网络模型的输入与第二神经网络模型的输出的话,能轻易说明第一神经网络模型200是以医疗数据的哪个特征为基础判断了疾病的阳性或阴性。即,第二神经网络模型能有效地用来说明第一神经网络模型200的数据解析及决策过程。
图4是示出依据本发明的一实施例学习了的第二神经网络模型的仿真结果的图表。
为了验证依据本发明的一实施例学习的第二神经网络模型,在被分类为高钾血症阴性的患者的心电图记录以一秒间隔让2秒单位的格子(window)移动而提取了9个阴性样本。而且,9个阴性样本则被输入已经学习的第二神经网络模型而变换成阳性样本。图4示出了多个样本的比较结果。图4中重叠表达的3个图表分别是相当于阴性样本的第一图表81、相当于由第二神经网络模型生成的阳性样本的第二图表82及相当于实际被诊断为高钾血症阳性的患者的样本的第三图表83。
比较第一图表81与第二图表82的话,可以确认第二神经网络模型所生成的阳性样本的QRS持续时间及PR间距相比于阴性样本各自大平均1.14倍、1.64倍。而且,第二神经网络模型所生成的阳性样本中具有高大T波(Tall T)的比率是45.34%,可以得知相比于阴性样本显著地增加2倍以上。在此,高大T波(Tall T)可理解为T振幅是R峰值振幅的一半以上的情形。而且,比较第二图表82与第三图表83的话,可以确认第二图表82呈现出和第三图表83相似的变化样态。
以前述结果为基础,可知依据本发明的一实施例学习的第二神经网络模型能把影响高钾血症阳性或阴性预测的心电图的形态学特征予以妥切变换后提出。即,使用依据本发明的一实施例学习的第二神经网络模型的话,能说明下述预测的基准,即,该基准是用于诊断疾病的神经网络模型(e.g.本发明的第一神经网络模型)参考心电图的哪个形态学特征后预测高钾血症阳性或阴性的基准。
图5是示出本发明一实施例的神经网络模型的学习方法的顺序图。
请参阅图5,本发明一实施例的计算装置100能以第一医疗数据为基础让第一神经网络模型学习以便对第一医疗数据推断疾病的阳性或阴性(步骤S110)。此时,第一医疗数据可以是包含诸如心电图之类的顺序(sequential)信息的生物信号相关数据。而且,第一神经网络模型所推断的疾病可以是高钾血症。大部分的高钾血症在进展到极度危险的程度时依然无症状,因此使得高钾血症的诊断较难,尤其在医院外部更是艰难。因此,利用能在日常生活中获取的非侵入式的心电图诊断高钾血症受到瞩目。有鉴于这种必要性,第一神经网络模型可以是接收心电图数据的输入后把心电图数据的测量对象的高钾血症发病与否予以分类的模型。然而,数据及疾病的种类仅仅是一个例示而已,本发明的第一神经网络模型的任务并不局限于前述例示。
计算装置100能利用通过步骤S110学习的第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对第二医疗数据的疾病的阳性或阴性的推断相反(步骤S120)。此时,第二神经网络模型可理解为是这样的模型,该模型提出用于说明第一神经网络模型的判断及决策过程的依据。第二医疗数据可以如同第一医疗数据一样地是包含诸如心电图之类的顺序信息的生物信号相关数据。而且,关于第二医疗数据的疾病可以是高钾血症。
具体地,计算装置100能利用第二神经网络模型变换第二医疗数据的特征。计算装置100能利用通过步骤S110学习的第一神经网络模型对变换了特征的第二医疗数据推断阳性或阴性。此时,第二神经网络模型可包括:第一副神经网络模型,为了使得对疾病的阳性或阴性的推断与第二医疗数据相反而变换第二医疗数据的特征从而生成第三医疗数据;以及第二副神经网络模型,为了使得对疾病的阳性或阴性的推断与第二医疗数据相同而变换第三医疗数据的特征从而生成第四医疗数据。
例如,计算装置100能以第二神经网络模型所含第一副神经网络模型为基础把推断为阴性的第二医疗数据的特征予以变换而生成被推断为与所述第二医疗数据相反的阳性的第三医疗数据。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,计算装置100能通过第二神经网络模型所含第一副神经网络模型变换第二医疗数据的形态学特征而生成作为被第一神经网络模型推断高钾血症为阳性的心电图数据的第三医疗数据。即,第一副神经网络模型能进行下述运算,该运算以高钾血症为阴性的心电图数据和高钾血症为阳性的心电图数据之间的形态学差异为基础变换数据特征。
计算装置100能以第二神经网络模型所含第二副神经网络模型为基础变换第三医疗数据的特征而生成与推断为阴性的第二医疗数据对应的第四医疗数据。如果第三医疗数据是被第一神经网络模型推断为高钾血症阳性的心电图数据的话,计算装置100能通过第二神经网络模型所含第二副神经网络模型变换第三医疗数据的形态学特征而生成对应于第二医疗数据的第四医疗数据。即,第二副神经网络模型能进行下述运算,该运算以高钾血症为阴性的心电图数据和高钾血症为阳性的心电图数据之间的形态学差异为基础变换数据的特征。
计算装置100能把第三医疗数据输入通过步骤S110学习的第一神经网络模型而生成对第三医疗数据的疾病阳性或阴性推断结果的预测数据。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,第一副神经网络模型所生成的第三医疗数据应该被第一神经网络模型推断为高钾血症阳性。因此,为了评估第一副神经网络模型是否准确地生成了第三医疗数据,计算装置100能通过第一神经网络模型分析第三医疗数据而确认是否相当于高钾血症为阳性的数据。
计算装置100能把推断为阴性的第二医疗数据输入第二副神经网络模型而生成与推断为阴性的第二医疗数据对应的第五医疗数据。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,第二副神经网络模型所生成的第五医疗数据也应该和第二医疗数据一样地被第一神经网络模型推断为高钾血症阴性。因此,为了评估第二副神经网络模型是否准确地识别数据的域,计算装置100可以确认第二副神经网络模型是否生成和第二医疗数据相同的数据。
而且,计算装置100能以下述损失函数为基础让第二神经网络模型学习,该损失函数把变换了特征的第二医疗数据或变换了特征的第二医疗数据的阳性或阴性推断结果中的至少一个作为输入变量。也就是说,计算装置100能以把第四医疗数据、第五医疗数据或预测数据中的至少一个作为输入变量的损失函数为基础让第二神经网络模型所含第一副神经网络模型及第二副神经网络模型学习。此时,损失函数可包括:第一损失函数,反映第一副神经网络模型是否把相当于疾病阴性的输入的特征予以变换而生成相当于疾病阳性的输出;第二损失函数,反映第二副神经网络模型是否把第一副神经网络模型的输出的特征予以变换而复原第一副神经网络模型的输入;以及第三损失函数,反映第二副神经网络模型是否以第一副神经网络模型的输入为基础生成和第一副神经网络模型的输入相同的输出。
例如,计算装置100运算以预测数据作为输入变量的第一损失函数,能让第一副神经网络模型学习以便使得作为第一损失函数的运算结果的第一损失减少。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,计算装置100能通过第一损失函数比较预测数据和相当于高钾血症为阳性的心电图数据的基准真实值(GT,ground truth)。计算装置100能以作为比较结果导出的第一损失最小化的方向更新第一副神经网络模型的神经网络参数。此时,第一损失最小化可理解为,让第一副神经网络模型学习以便让第一神经网络模型把第一副神经网络模型所生成的第三医疗数据识别成患有真正高钾血症并且被诊断为阳性的患者的心电图数据。
计算装置100运算以第四医疗数据作为输入变量的第二损失函数,让第一副神经网络模型或第二副神经网络模型中的至少一个学习以便使得作为第二损失函数的运算结果的第二损失减少。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,计算装置100能通过第一损失函数比较第二医疗数据与第四医疗数据。计算装置100能以作为比较结果导出的第二损失最小化的方向更新第一副神经网络模型或第二副神经网络模型中的至少一个神经网络参数。此时,第二损失最小化可理解为,让第一副神经网络模型或第二副神经网络模型中的至少一个学习以便使得第二副神经网络模型所生成的第四医疗数据相当于从第三医疗数据复原了第二医疗数据的数据。
计算装置100运算以第五医疗数据作为输入变量的第三损失函数,让第二副神经网络模型学习以便使得作为第三损失函数的运算结果的第三损失减少。如果第二医疗数据是诊断为高钾血症阴性的患者的心电图数据的话,计算装置100能通过第三损失函数比较第二医疗数据与第五医疗数据。计算装置100能以作为比较结果导出的第三损失最小化的方向更新第二副神经网络模型的神经网络参数。此时,第三损失最小化可理解为,让第二副神经网络模型学习以便使得第二副神经网络模型输出和第二医疗数据相同的第五医疗数据。
以如前所述的方式学习的第二神经网络模型的一个优点是,不依靠作为解析对象的第一神经网络模型的结构。即,本发明一实施例的第二神经网络模型具有下述灵活性优点,只要是能把疾病的阳性或阴性与否予以分类的模型,就能对任何结构的模型进行解析。而且,本发明一实施例还有一个很大的优点,即,第二神经网络模型不必为了学习而必须具备配成对的(paired)数据。不必为了在两种不同条件下分析心电图的形态学差异而从同一患者准备两个心电图,因此为了让第二神经网络模型学习而收集数据的作业也变得容易。这是因为,本发明一实施例的第二神经网络模型在没有配成对的(unpaired)数据集识别两个群之间的形态学差异并且能针对输入生成相反因素。
图6是示出使用本发明一实施例的神经网络模型的医疗数据的解析方法的顺序图。
请参阅图6,本发明一实施例的计算装置100能获取包含心电图数据的医疗数据(步骤S210)。例如,如果计算装置100是云系统的服务器或客户机的话,计算装置100能通过和医院环境内数据库的通信或通过和心电图测量仪的通信接收心电图数据。如果计算装置100是医院环境内数据库的话,计算装置100能通过和医院环境内心电图测量仪等的通信生成心电图数据。而且,如果计算装置100是心电图测量仪的话,计算装置100能自己进行心电图测量过程而生成心电图数据。
计算装置100以第二神经网络模型为基础把通过步骤S210获取的医疗数据的特征予以变换而能够生成对疾病的阳性或阴性的推断与医疗数据相反的输出数据(步骤S220)。此时,第二神经网络模型可以是利用下述第一神经网络模型预先学习的,该第一神经网络模型则以对医疗数据推断疾病的阳性或阴性的方式进行了学习。利用预先学习的第一神经网络模型的第二神经网络模型的学习过程和前述图5的内容相同,因此下面将省略其具体说明。例如,计算装置100获取了被判定为高钾血症阴性的心电图数据的话,计算装置100能把所获取的心电图数据输入第二神经网络模型而变换心电图数据的形态学特征。此时,为了让拟生成并输出的数据被判定为高钾血症阳性,第二神经网络模型能以心电图的PR间距、QRS持续时间、T振幅之类的指标为基准把输入的心电图数据的模样予以变形。通过利用第二神经网络模型的特征变换,计算装置100能生成可被判定为高钾血症阳性的心电图数据。此时,相当于第二神经网络模型的输出的心电图数据可以是能被区分高钾血症阳性或阴性的第一神经网络模型判定成阳性的心电图数据。
计算装置100能生成用于以视觉方式比较通过步骤S110获取的医疗数据和通过步骤S120生成的第二神经网络模型的输出数据的用户界面(步骤S230)。通过步骤S120生成的第二神经网络模型的输出数据和通过步骤S110获取的医疗数据能以疾病的阳性或阴性为基准呈现出相反的因素。即,通过步骤S120生成的第二神经网络模型的输出数据可成为能说明用于分类疾病阳性或阴性的人工智能的判断过程的依据。因此,为了让使用者能通过对通过步骤S110获取的医疗数据和通过步骤S120生成的第二神经网络模型的输出数据进行比较而轻易了解人工智能的判断过程,计算装置100能生成以视觉方式比较两数据的用户界面。
例如,计算装置100能如图4所示地以图表形态的图形分别生成通过步骤S110获取的医疗数据和通过步骤S120生成的第二神经网络模型的输出数据。此时,计算装置100能通过用户界面的一个区域呈现出以图表形态的图形生成的两个数据。为了能轻易地对两个数据之间进行比较,计算装置100能把图表形态的多个图形重叠地显示到用户界面的一个区域。此时,为了明确比较重叠的多个图表,计算装置100能进行比例(scale)一致化作业。
另一方面,计算装置100能和客户机共享用户界面而通过客户机向使用者提供图形。计算装置100也能通过自己的输入输出单元实现用户界面而向使用者提供图形。
前文说明的本发明的各种实施例能和其它不同的实施例结合,能根据前文的详细说明在本领域普通技术人员可理解的范畴内予以改变。本发明的实施例在所有方面均为例示性,应被阐释为不是限制性。例如,以单一的整体形态予以说明的各要素能分散地实行,同样地,以分散的形态予以说明的各要素也能以结合的形态实行。因此,本发明的发明要求保护范围的意义、范围以及从其等值概念导出的一切修改与变形形态均应阐释为属于本发明的范围。
Claims (15)
1.一种以可解释人工智能为基础的医疗数据的解析方法,由包括至少一个处理器的计算装置执行,其特征在于,包括下列步骤:
以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性;以及
利用已学习的所述第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
2.根据权利要求1所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述第二神经网络模型包括:
第一副神经网络模型,为了使得对所述疾病的阳性或阴性的推断与所述第二医疗数据相反而变换所述第二医疗数据的特征从而生成第三医疗数据;以及
第二副神经网络模型,为了使得对所述疾病的阳性或阴性的推断与所述第二医疗数据相同而变换所述第三医疗数据的特征从而生成第四医疗数据。
3.根据权利要求1所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,利用已学习的所述第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反,该步骤包括下列步骤:
利用所述第二神经网络模型变换所述第二医疗数据的特征并且利用已学习的所述第一神经网络模型对变换了特征的所述第二医疗数据推断阳性或阴性;以及
以把变换了特征的所述第二医疗数据或对变换了特征的所述第二医疗数据的阳性或阴性推断结果中的至少一个作为输入变量的损失函数为基础,让所述第二神经网络模型学习。
4.根据权利要求3所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述利用第二神经网络模型变换所述第二医疗数据的特征并且利用已学习的所述神经网络模型对变换了特征的所述第二医疗数据推断阳性或阴性的步骤包括下列步骤:
以所述第二神经网络模型所含第一副神经网络模型为基础把推断为阴性的第二医疗数据的特征予以变换而生成被推断为与所述第二医疗数据相反的阳性的第三医疗数据;以及
以所述第二神经网络模型所含第二副神经网络模型为基础把所述第三医疗数据的特征予以变换而生成与推断为阴性的所述第二医疗数据对应的第四医疗数据。
5.根据权利要求4所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述利用第二神经网络模型变换所述第二医疗数据的特征并且利用已学习的所述神经网络模型对变换了特征的所述第二医疗数据推断阳性或阴性的步骤包括下述步骤:
向已学习的所述第一神经网络模型输入所述第三医疗数据而生成下述预测数据,该预测数据示出对所述第三医疗数据的所述疾病的阳性或阴性推断结果。
6.根据权利要求5所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述利用第二神经网络模型变换所述第二医疗数据的特征并且利用已学习的所述神经网络模型对变换了特征的所述第二医疗数据推断阳性或阴性的步骤包括下述步骤:
向所述第二副神经网络模型输入推断为阴性的所述第二医疗数据,生成与推断为阴性的所述第二医疗数据对应的第五医疗数据。
7.根据权利要求6所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述损失函数包括:
第一损失函数,用于评估所述第一副神经网络模型是否把相当于所述疾病为阴性的输入的特征予以变换而生成相当于所述疾病为阳性的输出;
第二损失函数,用于评估所述第二副神经网络模型是否把所述第一副神经网络模型的输出的特征予以变换而复原所述第一副神经网络模型的输入;以及
第三损失函数,用于评估所述第二副神经网络模型是否以所述第一副神经网络模型的输入为基础生成和所述第一副神经网络模型的输入相同的输出。
8.根据权利要求6所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,以把变换了特征的所述第二医疗数据或对变换了特征的所述第二医疗数据的阳性或阴性推断结果中的至少一个作为输入变量的损失函数为基础让所述第二神经网络模型学习的步骤包括下述步骤:
以把所述第四医疗数据、所述第五医疗数据或所述预测数据中的至少一个作为输入变量的损失函数为基础,让所述第一副神经网络模型及所述第二副神经网络模型学习。
9.根据权利要求8所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,以把所述第四医疗数据、所述第五医疗数据或所述预测数据中的至少一个作为输入变量的损失函数为基础让所述第一副神经网络模型及所述第二副神经网络模型学习的步骤包括下列步骤:
运算把所述预测数据作为输入变量的第一损失函数,让所述第一副神经网络模型学习以便使得作为所述第一损失函数的运算结果的第一损失减少;
运算把所述第四医疗数据作为输入变量的第二损失函数,让所述第一副神经网络模型或所述第二副神经网络模型中的至少一个学习以便使得作为所述第二损失函数的运算结果的第二损失减少;以及
运算把所述第五医疗数据作为输入变量的第三损失函数,让所述第二副神经网络模型学习以便使得作为所述第三损失函数的运算结果的第三损失减少。
10.根据权利要求1所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,
所述第一医疗数据及所述第二医疗数据包含心电图数据,
所述疾病包含高钾血症。
11.根据权利要求10所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,所述第二医疗数据的特征以所述高钾血症为阴性的心电图数据与所述高钾血症为阳性的心电图数据之间的形态学差异为基础。
12.一种以可解释人工智能为基础的医疗数据的解析方法,由包括至少一个处理器的计算装置执行,其特征在于,包括下列步骤:
获取包含心电图数据的医疗数据;以及
以第二神经网络模型为基础变换所述医疗数据的特征,从而生成通过第一神经网络模型推断的疾病的阳性或阴性与所述医疗数据相反的输出数据,
所述第二神经网络模型是利用下述第一神经网络模型预先学习的,该第一神经网络模型则学习对医疗数据推断疾病的阳性或阴性。
13.根据权利要求12所述的以可解释人工智能为基础的医疗数据的解析方法,其特征在于,还包括下述步骤:生成用于以视觉方式比较所述医疗数据与所述输出数据的用户界面。
14.一种计算机程序,存储在计算机可读存储介质,其特征在于,
所述计算机程序在一个以上的处理器运行时执行用于以可解释人工智能为基础的医疗数据的解析的多个动作,
所述多个动作包括下列动作:
以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性;以及
利用已学习的所述第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
15.一种用于以可解释人工智能为基础的医疗数据的解析的计算装置,其特征在于,
包括:
处理器,包含至少一个内核;
存储器,包含所述处理器可执行的多个程序代码;以及
网络单元,用于获取医疗数据,
所述处理器以第一医疗数据为基础让第一神经网络模型学习,以对所述第一医疗数据推断疾病的阳性或阴性,利用已学习的所述第一神经网络模型让变换第二医疗数据的特征的第二神经网络模型学习,使得对所述第二医疗数据的所述疾病的阳性或阴性的推断相反。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0126786 | 2021-09-25 | ||
KR10-2022-0118351 | 2022-09-20 | ||
KR1020220118351A KR20230044124A (ko) | 2021-09-25 | 2022-09-20 | 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치 |
PCT/KR2022/014131 WO2023048470A2 (ko) | 2021-09-25 | 2022-09-21 | 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117999031A true CN117999031A (zh) | 2024-05-07 |
Family
ID=90891550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280063390.XA Pending CN117999031A (zh) | 2021-09-25 | 2022-09-21 | 以可解释人工智能为基础的医疗数据的解析方法、程序及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117999031A (zh) |
-
2022
- 2022-09-21 CN CN202280063390.XA patent/CN117999031A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kalyankar et al. | Predictive analysis of diabetic patient data using machine learning and Hadoop | |
El Mrabet et al. | Supervised machine learning: A survey | |
KR102362679B1 (ko) | 심전도 신호 기반의 만성질환 예측 방법 | |
KR20230044124A (ko) | 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치 | |
Alom et al. | Early stage detection of heart failure using machine learning techniques | |
GB2603831A (en) | Mobile AI | |
Abououf et al. | Explainable AI for Event and Anomaly Detection and Classification in Healthcare Monitoring Systems | |
Sudharson et al. | Performance analysis of enhanced adaboost framework in multifacet medical dataset | |
CN117999031A (zh) | 以可解释人工智能为基础的医疗数据的解析方法、程序及装置 | |
Manur et al. | A Big Data Analysis Using Fuzzy Deep Convolution Network Based Model for Heart Disease Classification. | |
Hasan et al. | DEVELOPMENT OF HEART ATTACK PREDICTION MODEL BASED ON ENSEMBLE LEARNING. | |
Ganesh et al. | Diabetes Prediction using Logistic Regression and Feature Normalization | |
Festag et al. | Semantic anomaly detection in medical time series | |
Chippalakatti et al. | Comparative Review on the Machine Learning Algorithms for Medical Data | |
Priyanka et al. | Big data based system for biomedical image classification | |
WO2023048470A2 (ko) | 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치 | |
Zordan et al. | Automatic rate-distortion classification for the IoT: Towards signal-adaptive network protocols | |
KR102592762B1 (ko) | 합성곱 신경망 기반의 덴스넷을 통한 부정맥 분류 방법 | |
Hayyolalam et al. | A Hybrid Edge-assisted Machine Learning Approach for Detecting Heart Disease | |
Gangula et al. | Prediction and Prognosis of Diabetes Using Logistic Regression | |
KR20240013674A (ko) | 심전도를 이용한 건강 상태의 예측 방법, 프로그램및 장치 | |
Ashok | Diabetes Diagnosis using Ensemble Models in Machine Learning | |
WO2024019523A1 (ko) | 심전도를 이용한 건강 상태의 예측 방법, 프로그램 및 장치 | |
WO2024019500A1 (ko) | 심전도 세그먼트를 이용한 건강 상태의 예측 방법, 프로그램 및 장치 | |
KR20240013673A (ko) | 심전도 세그먼트를 이용한 건강 상태의 예측 방법,프로그램 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |