CN110675954A - 信息处理方法及装置、电子设备、存储介质 - Google Patents
信息处理方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN110675954A CN110675954A CN201910966235.9A CN201910966235A CN110675954A CN 110675954 A CN110675954 A CN 110675954A CN 201910966235 A CN201910966235 A CN 201910966235A CN 110675954 A CN110675954 A CN 110675954A
- Authority
- CN
- China
- Prior art keywords
- node
- information
- feature vector
- disease
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 22
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 201000010099 disease Diseases 0.000 claims abstract description 204
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 204
- 239000013598 vector Substances 0.000 claims abstract description 143
- 208000024891 symptom Diseases 0.000 claims abstract description 100
- 238000000034 method Methods 0.000 claims description 73
- 238000012545 processing Methods 0.000 claims description 33
- 230000015654 memory Effects 0.000 claims description 20
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 21
- 238000005295 random walk Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 5
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 208000004300 Atrophic Gastritis Diseases 0.000 description 3
- 201000004624 Dermatitis Diseases 0.000 description 3
- 208000036495 Gastritis atrophic Diseases 0.000 description 3
- 206010046914 Vaginal infection Diseases 0.000 description 3
- 208000010668 atopic eczema Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010063409 Acarodermatitis Diseases 0.000 description 1
- 206010003693 Atrophic vulvovaginitis Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 206010012468 Dermatitis herpetiformis Diseases 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 241000447727 Scabies Species 0.000 description 1
- 206010067197 Tinea manuum Diseases 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 201000008100 Vaginitis Diseases 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 210000002683 foot Anatomy 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 201000010808 postmenopausal atrophic vaginitis Diseases 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000005687 scabies Diseases 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 201000004647 tinea pedis Diseases 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 208000002003 vulvitis Diseases 0.000 description 1
- 208000010484 vulvovaginitis Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种信息处理方法及装置、电子设备、存储介质,涉及人工智能领域。具体实现方案为:从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,所述目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点;基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;将原始医疗数据的特征向量与所述目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;将目标第二节点所表征的疾病信息作为所述原始医疗数据的预测疾病,输出预测疾病。这样,提高预测结果的准确性,进而提高预测结果的可参考性。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种人工智能领域。
背景技术
人工智能(Artificial Intelligence,AI)在医疗中的应用场景十分复杂也十分重要,主要包括疾病的诊断、预测、治疗和管理等。其中,疾病预测是一项重要的任务,核心是预测某个体患某种疾病的风险概率,比如,疾病预测会根据患者的病历信息,例如咳嗽、咳痰等症状,预测可能存在的疾病,或者存在某种特定疾病(如哮喘)的风险概率。而如何提高上述预测结果的准确度成为AI在医疗领域中的研究热点。
发明内容
本申请实施例提供一种信息处理方法及装置、电子设备、存储介质,如此,提高预测结果的准确性,进而提高预测结果的可参考性。
第一方面,本申请实施例提供了一种信息处理方法,包括:
从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系;
基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;
将原始医疗数据的特征向量与目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;
将目标第二节点所表征的疾病信息作为原始医疗数据的预测疾病,输出预测疾病。
本申请实施例利用表征症状信息的第一节点,以及表征疾病信息的第二节点构建得到目标网络,如此,在获取到原始医疗数据后,在该目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,基于目标第一节点的特征向量,得到原始医疗数据的特征向量;进而,将原始医疗数据的特征向量与目标网络中表征疾病信息的第二节点对应的特征向量进行相似度计算,基于相似度结果来确定原始医疗数据与第二节点表征的疾病信息之间的关联度,以完成针对原始医疗数据的疾病预测过程。这里,由于该预测过程所利用的目标网络表征出了疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,所以,使得在相似度计算过程中充分考虑了疾病信息与症状信息,疾病信息间的关联,进而为提高预测结果的准确性奠定了基础,而且,该预测过程便于理解,可解释性强,也为工程化应用奠定了基础。
在一种实施方式中,方法还包括:
将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
这里,该实施方式提供了一种构建目标网络的方案,即将疾病信息以及症状信息分别作为节点,并基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系来构建节点间的连接关系,如此构建出目标网络,为后续基于该目标网络来完成疾病预测奠定了基础。而且,该构建方式简单,可解释性强。
在一种实施方式中,构建目标网络时,方法还包括:
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,
确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
这里,该实施方式提供了一种构建目标网络的方案,即将疾病信息以及症状信息分别作为节点,并基于疾病信息与症状信息之间的关联特征,或者疾病信息之间的关联特征,来确定存在关联关系的节点之间的边长,如此,来丰富目标网络所能够表征的信息的维度,同时,使不同边长具有可比性,为后续提高预测结果的准确性进一步奠定了基础。而且,该构建方式简单,可解释性强。
在一种实施方式中,方法还包括:
基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
这里,该实施方式中在目标网络的基础上训练得到各节点的特征向量,如此,使得节点对应的特征向量能够表达出疾病信息与症状信息,以及疾病信息之间的关联关系,如此,为提高预测结果的准确性进一步奠定了基础。
在一种实施方式中,基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量,包括:
对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。
这里,该实施方式中,当原始医疗数据对应多个目标第一节点时,可以将多个目标第一节点的特征向量进行加权平均,如此,将加权平均后的特征向量来作为原始医疗数据的特征向量,这样,使原始医疗数据的向量表达能够最大化还原真实情况,为提高预测结果的准确性进一步奠定了基础。而且,方式简单,可解释性强。
第二方面,本申请实施例提供了一种信息处理装置,包括:
特征向量处理单元,用于从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系;基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;
匹配单元,用于将原始医疗数据的特征向量与表征疾病信息的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;
输出单元,用于将目标第二节点所表征的疾病信息作为原始医疗数据的预测疾病,输出预测疾病。
在一种实施方式中,特征向量处理单元,还用于:
将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
在一种实施方式中,特征向量处理单元,还用于:
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,
确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
在一种实施方式中,特征向量处理单元,还用于:基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
在一种实施方式中,特征向量处理单元,还用于:对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器:以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行以上方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行以上方法。
上述申请中的一个实施例具有如下优点或有益效果:
本申请实施例利用表征症状信息的第一节点,以及表征疾病信息的第二节点构建得到目标网络,如此,在获取到原始医疗数据后,在该目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,基于目标第一节点的特征向量,得到原始医疗数据的特征向量;进而,将原始医疗数据的特征向量与目标网络中表征疾病信息的第二节点对应的特征向量进行相似度计算,基于相似度结果来确定原始医疗数据与第二节点表征的疾病信息之间的关联度,以完成针对原始医疗数据的疾病预测过程。这里,由于该预测过程所利用的目标网络表征出了疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,所以,使得在相似度计算过程中充分考虑了疾病信息与症状信息,疾病信息间的关联,进而为提高预测结果的准确性奠定了基础,而且,该预测过程便于理解,可解释性强,也为工程化应用奠定了基础。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的方法流程示意图;
图2是根据本申请实施例一具体应用的流程示意图;
图3是用来实现本申请实施例的信息处理装置的框图;
图4是可以实现本申请实施例的信息处理场景图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
疾病预测方法可以简单归为三大类,分别为:经典回归方法、机器学习方法和深度学习方法。其中,各类方法的特点分别为:
(1)基于经典回归方法的疾病风险预测,主要根据Cox比例风险回归模型及逻辑回归模型进行疾病风险预测,比如,根据患者所表现出来的症状以及既往病史来做线性拟合,进而预测属于某一种疾病的概率。但是,该方法预测准确度不高,且可解释性不好。
(2)基于机器学习方法的疾病预测,但是,该方法无法捕捉到疾病与症状之间的结构关系,进而导致预测准确度不高。
(3)基于深度学习方法的疾病预测,但是,该方法复杂度较高,可解释性较差。
综上,无论哪种方法,都无法捕捉到疾病与疾病或者疾病与症状之间的结构关系,进而导致预测结果准确度不高,可解释性不强。
基于此,本申请实施例提供了一种信息处理方法,如图1所示,方法包括:
步骤S101:从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系。
实际应用中,原始医疗数据可以具体为患者病例,症状信息可以具体为以下信息中的至少一种:体征,症状、病史、检测结果等。而原始医疗数据所包含的症状信息可以为一个也可以为多个。
在一具体示例中,每一症状信息对应一个第一节点,每一疾病信息对应一个第二节点,如此,使构建出的目标网络简单明了,进而提高目标网络的可解释性。
本申请实施例,在步骤S101之前构建目标网络,这里,可以采用如下方式构建出目标网络,具体地,
方式一:将症状信息作为第一节点,将疾病信息作为第二节点;基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
这里,该方式中提供了一种构建目标网络的方案,即将疾病信息以及症状信息分别作为节点,并基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系来构建节点间的连接关系,如此构建出目标网络,为后续基于该目标网络来完成疾病预测奠定了基础。而且,该构建方式简单,可解释性强。
方式二:将症状信息作为第一节点,将疾病信息作为第二节点;确定疾病信息与症状信息之间的关联特征(比如关联度),基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,确定疾病信息之间的关联特征(比如关联度),基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
这里,可以采用如下方式确定关联度,比如,利用大量已经过准确度验证过的样本医疗数据来确定症状信息在疾病信息中出现的频率,进而基于该出现频率确定出症状信息与疾病信息之间的关联度;同理,确定两疾病信息同时出现的概率,进而基于确定出疾病信息之间的关联度。
该实施方式提供了一种构建目标网络的方案,即将疾病信息以及症状信息分别作为节点,并基于疾病信息与症状信息之间的关联特征,或者疾病信息之间的关联特征,来确定存在关联关系的节点之间的边长,如此,来丰富目标网络所能够表征的信息的维度,同时,使不同边长具有可比性,为后续提高预测结果的准确性进一步奠定了基础。而且,该构建方式简单,可解释性强。
方式三:将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络;基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
这里,该实施方式中在目标网络的基础上训练得到各节点的特征向量,如此,使得节点对应的特征向量能够表达出疾病信息与症状信息,以及疾病信息之间的关联关系,如此,为提高预测结果的准确性进一步奠定了基础。实际应用中,特征向量可以具体为embedding向量。
方式四:将症状信息作为第一节点,将疾病信息作为第二节点;
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络;基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
这里,该实施方式提供了一种构建目标网络的方案,即将疾病信息以及症状信息分别作为节点,并基于疾病信息与症状信息之间的关联特征,或者疾病信息之间的关联特征,来确定存在关联关系的节点之间的边长,如此,来丰富目标网络所能够表征的信息的维度,同时,使不同边长具有可比性,为后续提高预测结果的准确性进一步奠定了基础。而且,该构建方式简单,可解释性强。进一步地,该实施方式中在构建完成目标网络中各节点的连接关系后,在目标网络的基础上训练得到各节点的特征向量,如此,使得节点对应的特征向量能够表达出疾病信息与症状信息,以及疾病信息之间的关联关系,如此,为提高预测结果的准确性进一步奠定了基础。实际应用中,特征向量可以具体为embedding向量。
实际应用中,上述方式可以择一而执行。另外,需要说明的是,将目标网络中各节点通过特征向量表达的方式可以为构建目标网络的一个步骤,也可不归属于构建目标网络的步骤中,即在构建完成目标网络后,在通过训练得到目标网络中各节点的特征向量;实际应用中,当得到目标网络后,还可以利用其它网络表达方式,对目标网络中的各节点进行表达。
步骤S102:基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量。
在一具体示例中,当原始医疗数据对应多个目标第一节点时,可以采用加权平均的方式来确定原始医疗数据的特征向量,具体地,对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。这样,使原始医疗数据的向量表达能够最大化还原真实情况,为提高预测结果的准确性进一步奠定了基础。而且,方式简单,可解释性强。
步骤S103:将原始医疗数据的特征向量与目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点。
在一具体示例中,将原始医疗数据的特征向量与表征疾病信息的第二节点的特征向量进行相似度匹配后,得到相似度得分,进而可以将相似度得分大于特定阈值的第二节点作为目标第二节点,或者,对相似度得分进行降序排列,将排列处于前特定位数(比如前三位)的第二节点作为目标第二节点。当然,实际应用中,还可以根据实际场景来确定目标第二节点,本实施例对此不作限制。
步骤S104:将目标第二节点所表征的疾病信息作为原始医疗数据的预测疾病,输出预测疾病。
这里,实际应用中,输出的预测疾病可以为一个也可以为多个(两个或两个以上),可根据实际需求而确定。
在一具体实例中,可以将目标网络中所有第二节点的特征向量,分别与原始医疗数据的特征向量进行相似度匹配,基于所有相似度得分来对第二节点进行排序(比如降序排序),将排序处于前特定位数(比如第一位)的第二节点作为目标第二节点,进而将该目标第二节点对应的疾病信息作为原始医疗数据的预设疾病。或者,将相似度得分大于特定阈值的第二节点作为目标第二节点,此时,可能存在多个(两个或两个以上)目标第二节点,将一个或多个目标第二节点对应的疾病信息作为预测疾病。
当然,在另一具体示例中,可以将目标网络中部分第二节点的特征向量与原始医疗数据的特征向量进行相似度匹配,换言之,在进行相似度匹配前,对所有第二节点进行初筛,进而仅将初筛通过的第二节点的特征向量与原始医疗数据的特征向量去匹配,如此,来降低计算量。这里,初筛过程中,可以将原始医疗数据的语义特征,与第二节点表征的疾病信息的语义特征进行匹配,进而选取出语义特征匹配结果满足规则(比如语义相同或相似)的第二节点与原始医疗数据的特征向量进行相似度匹配。当然,实际应用中,还可以采用其他初筛方法,本申请实施例对此不作限制。
以下结合具体应用场景对本申请实施例做进一步详细说明,包括三个主要步骤,分别为:复杂网络的构建,基于node2vec的网络节点表示学习,基于节点embedding向量的评估及应用;具体地,
步骤一:复杂网络的构建,包括:从电子病历知识图谱中抽取出疾病、及症状(如病况,体征)等实体,并对这些实体进行去重操作后,分别作为作为复杂网络的节点,节点与节点之间的边可根据以下规则产生,即:将具有上下位关系的疾病之间建立边;以及,将疾病与该疾病所表现出来的症状之间建立边,进而得到复杂网络G=(V,E),其中,V代表节点集合,E代表边的集合,实际应用中,可利用邻接矩阵来存储构建的该复杂网络。
这里,在构建复杂网络的过程中,可统计疾病与对应症状出现的频次,以及疾病与疾病之间关联度来作为对应边的权重。
步骤二:基于node2vec的复杂网络节点表示学习,这里,node2vec方法的主要思路为,利用构造节点在网络上的带权随机游走路径,来模仿文本生成的过程,提供一个随机节点序列,然后用skip-gram和hierarchical softmax模型对随机游走序列中每个局部窗口(如为预设值)内的节点对进行概率建模,最大化随机游走随机节点序列的似然概率,并使用随机梯度下降来得到节点的embedding向量。
具体地,在随机游走的过程中加入权重,并设定两个超参数p和q,以分别控制广度优先搜索策略BFS和深度优先搜索策略DFS的程度。这里,假设遍历了边(t,v)后,到达节点v,此时,节点v需要根据转移概率πv,x选择下一个节点x。设πv,x=αpq(t,x)pvx,其中,
dtx表示节点t和x之间的最短距离,且属于{0,1,2}。Pvx为节点v到节点x的边的权重,进而,得到随机游走序列s。
在得到随机游走序列s之后,基于skip-gram模型来学习s中每个节点的embedding表示,目标函数为:
其中,
这里,t为窗口大小,vi和vj分别表示节点的embedding向量。
由于在计算softmax函数时,需要考虑到所有的节点,时间复杂度较高,因此,可以采用hierarchicalsoftmax模型来进行优化。首先,根据随机游走序列中节点出现的频次来构建一棵霍夫曼树,所有节点均出现在叶子结点的位置,这样便可通过优化树中的某一特定路径来简化计算复杂度。如从根节点到达叶子节点vj所产生的序列为这里所以这样在计算P(vj|vi)时的复杂度从O(V)降低到了O(log|V|)。
如此,利用上述过程,即可得到随机游走序列s中各节点对应的embedding向量,进而得到整个复杂网络中各节点的embedding向量。
实际过程中,以复杂网络中的每个节点为起始节点随机游走长度设置为l,这样重复进行r次,即可得到每个节点的embedding向量。
步骤三:节点embedding向量的评估和应用。
首先,评估节点embedding向量的有效性,即在得到复杂网络的节点的embedding向量之后,通过求疾病embedding向量之间的余弦相似度,来筛选出与目标疾病最相似的网络节点集合,进而判断筛选出的网络节点集合是否为与目标疾病最相似的疾病,以确定embedding向量的有效性。举例来说,利用本示例方法得到了如下三类疾病相似的前top5,分别为:
目标疾病一:急性阴道炎
急性阴道炎:1.0;念珠菌性阴道炎:0.9588962340951271;老年性阴道炎:0.9068920141554352;外阴阴道炎:0.8916969020379597;滴虫性外阴炎:0.8883860485520669。
目标疾病二:萎缩性胃炎
萎缩性胃炎:1.0;慢性萎缩性胃炎:0.9766093766037207;幽门螺杆菌检查阳性:0.9477087571985747;浅表萎缩性胃炎:0.9331792885938741;饱胀感:0.8202972675860577。
目标疾病三:急性湿疹
急性湿疹:1.0;疥疮:0.9199061135284379;疱疹样皮炎:0.8905545152246818;婴儿湿疹:0.8848237481082544;手足癣:0.8669997031631382。
通过以上实验结果可以看出相似节点的embedding向量在复杂网络对应的空间中也是相似的,从而验证了学习到的节点embedding向量的有效性。
其次,基于节点embedding向量进行疾病预测;具体地,如图2所示,在学习得到复杂网络中各节点的embedding向量之后,可以得到每个疾病、症状实体的embedding向量表示,对于某个患者的病历信息,首先抽取出病历中的症状实体,并基于复杂网络中各实体embedding向量中筛选出相对应的症状embedding向量,对这些向量加权平均得到患者的病历信息的embedding向量,然后依次使用此病历信息的embedding向量与所有疾病embedding向量计算余弦相似度,进而选出与该病历信息的embedding向量最相似的疾病,以预测得到病历信息的疾病。和真实疾病标签做对比,最终得到top1疾病预测准确率。
这里,当预测得到病历信息的疾病后,还可以根据真实病历标签进行对比,以此得到疾病预测准确率,进而便于基于预测准确率来优化复杂网络,以及该复杂网络中各节点的向量表达。
显然,本申请实施例在医学领域首次有效地捕捉到疾病与症状形成的复杂网络的结构信息,也即能够通过疾病与症状之间的关系构建复杂网络,并根据出现频次为复杂网络中的边附加权重,然后基于node2vec方法学习节点的embedding向量,而且,该向量融合了疾病与疾病以及疾病与症状之间的关系,为提高预测结果的准确性奠定了基础,且该过程可解释性强,便于后续工程化应用。
本申请实施例还提供了一种信息处理装置,如图3所示,信息处理装置300包括:
特征向量处理单元301,用于从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系;基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;
匹配单元302,用于将原始医疗数据的特征向量与目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;
输出单元303,用于将目标第二节点所表征的疾病信息作为原始医疗数据的预测疾病,输出预测疾病。
在一种实施方式中,特征向量处理单元301,还用于:
将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
在一种实施方式中,特征向量处理单元301,还用于:
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,
确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
在一种实施方式中,特征向量处理单元301,还用于:基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
在一种实施方式中,特征向量处理单元301,还用于:对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。
这里,需要指出的是:以上装置实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本申请装置实施例中未披露的技术细节,本领域的技术人员请参照本申请方法实施例的描述而理解,为节约篇幅,这里不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图4所示,是根据本申请实施例的信息处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,该电子设备包括:一个或多个处理器401、存储器402,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。
存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的信息处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的信息处理方法。
存储器402作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的信息处理方法对应的程序指令/模块(例如,附图3所示的特征向量处理单元301、匹配单元302和输出单元303)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的信息处理方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据信息处理方法的电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至信息处理方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
信息处理方法的电子设备还可以包括:输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图4中以通过总线连接为例。
输入装置403可接收输入的数字或字符信息,以及产生与信息处理方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、发光二极管(Light EmittingDiode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ray Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,利用表征症状信息的第一节点,以及表征疾病信息的第二节点构建得到目标网络,如此,在获取到原始医疗数据后,在该目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,基于目标第一节点的特征向量,得到原始医疗数据的特征向量;进而,将原始医疗数据的特征向量与目标网络中表征疾病信息的第二节点对应的特征向量进行相似度计算,基于相似度结果来确定原始医疗数据与第二节点表征的疾病信息之间的关联度,以完成针对原始医疗数据的疾病预测过程。这里,由于该预测过程所利用的目标网络表征出了疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,所以,使得在相似度计算过程中充分考虑了疾病信息与症状信息,疾病信息间的关联,进而为提高预测结果的准确性奠定了基础,而且,该预测过程便于理解,可解释性强,也为工程化应用奠定了基础。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种信息处理方法,其特征在于,包括:
从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,所述目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,所述目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系;
基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;
将原始医疗数据的特征向量与所述目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;
将目标第二节点所表征的疾病信息作为所述原始医疗数据的预测疾病,输出预测疾病。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
3.根据权利要求2所述的方法,其特征在于,构建所述目标网络时,所述方法包括:
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,
确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
5.根据权利要求1所述的方法,其特征在于,所述基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量,包括:
对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。
6.一种信息处理装置,其特征在于,包括:
特征向量处理单元,用于从目标网络中选取出与原始医疗数据所包含的症状信息相匹配的目标第一节点,其中,所述目标网络包含有表征症状信息的至少一个第一节点,以及表征疾病信息的至少一个第二节点,所述目标网络至少能够通过节点间的连接关系表征症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系;基于原始医疗数据对应的目标第一节点的特征向量,得到原始医疗数据的特征向量;
匹配单元,用于将原始医疗数据的特征向量与所述目标网络的第二节点的特征向量进行相似度匹配,得到匹配结果满足预设规则的目标第二节点;
输出单元,用于将目标第二节点所表征的疾病信息作为所述原始医疗数据的预测疾病,输出预测疾病。
7.根据权利要求6所述的方法,其特征在于,所述特征向量处理单元,还用于:
将症状信息作为第一节点,将疾病信息作为第二节点;
基于症状信息与疾病信息之间的关联关系,以及疾病信息之间的关联关系,构建包含有第一节点和第二节点的目标网络。
8.根据权利要求7所述的方法,其特征在于,所述特征向量处理单元,还用于:
确定疾病信息与症状信息之间的关联特征,基于关联特征确定存在关联关系的症状信息对应的第一节点与疾病信息对应的第二节点之间的第一边长,至少基于确定的第一边长构建目标网络;和/或,
确定疾病信息之间的关联特征,基于关联特征确定存在关联关系的疾病信息对应的第二节点之间的第二边长,至少基于确定的第二边长构建目标网络。
9.根据权利要求7或8所述的方法,其特征在于,所述特征向量处理单元,还用于:基于目标网络中疾病信息与症状信息之间的关联关系,以及疾病信息之间的关联关系,得到目标网络中第一节点的特征向量,以及第二节点的特征向量。
10.根据权利要求6所述的方法,其特征在于,所述特征向量处理单元,还用于:对原始医疗数据对应的至少两个目标第一节点中各目标第一节点的特征向量进行加权平均处理,将加权平均处理后的特征向量作为原始医疗数据的特征向量。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910966235.9A CN110675954A (zh) | 2019-10-11 | 2019-10-11 | 信息处理方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910966235.9A CN110675954A (zh) | 2019-10-11 | 2019-10-11 | 信息处理方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110675954A true CN110675954A (zh) | 2020-01-10 |
Family
ID=69081774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910966235.9A Pending CN110675954A (zh) | 2019-10-11 | 2019-10-11 | 信息处理方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110675954A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462894A (zh) * | 2020-03-27 | 2020-07-28 | 北京百度网讯科技有限公司 | 一种医疗冲突的检测方法、装置、电子设备及存储介质 |
CN111640511A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 医疗事实验证的方法、装置、电子设备及存储介质 |
CN112071425A (zh) * | 2020-09-04 | 2020-12-11 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
CN112364181A (zh) * | 2020-11-27 | 2021-02-12 | 深圳市慧择时代科技有限公司 | 一种保险产品匹配度确定方法及装置 |
CN112687395A (zh) * | 2020-12-30 | 2021-04-20 | 上海京知信息科技有限公司 | 人工智能的医疗信息处理方法、装置、设备及存储介质 |
CN112885480A (zh) * | 2021-02-23 | 2021-06-01 | 东软集团股份有限公司 | 用户信息的处理方法、装置、存储介质和电子设备 |
CN115662647A (zh) * | 2022-12-27 | 2023-01-31 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN107145744A (zh) * | 2017-05-08 | 2017-09-08 | 合肥工业大学 | 医学知识图谱的构建方法、装置及辅助诊断方法 |
CN107657063A (zh) * | 2017-10-30 | 2018-02-02 | 合肥工业大学 | 医学知识图谱的构建方法及装置 |
CN108614885A (zh) * | 2018-05-03 | 2018-10-02 | 杭州认识科技有限公司 | 基于医学信息的知识图谱分析方法及装置 |
CN109559822A (zh) * | 2018-11-12 | 2019-04-02 | 平安科技(深圳)有限公司 | 智能初诊方法、装置、计算机设备及存储介质 |
CN109949929A (zh) * | 2019-03-19 | 2019-06-28 | 挂号网(杭州)科技有限公司 | 一种基于深度学习大规模病历的辅助诊断系统 |
-
2019
- 2019-10-11 CN CN201910966235.9A patent/CN110675954A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN107145744A (zh) * | 2017-05-08 | 2017-09-08 | 合肥工业大学 | 医学知识图谱的构建方法、装置及辅助诊断方法 |
CN107657063A (zh) * | 2017-10-30 | 2018-02-02 | 合肥工业大学 | 医学知识图谱的构建方法及装置 |
CN108614885A (zh) * | 2018-05-03 | 2018-10-02 | 杭州认识科技有限公司 | 基于医学信息的知识图谱分析方法及装置 |
CN109559822A (zh) * | 2018-11-12 | 2019-04-02 | 平安科技(深圳)有限公司 | 智能初诊方法、装置、计算机设备及存储介质 |
CN109949929A (zh) * | 2019-03-19 | 2019-06-28 | 挂号网(杭州)科技有限公司 | 一种基于深度学习大规模病历的辅助诊断系统 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462894A (zh) * | 2020-03-27 | 2020-07-28 | 北京百度网讯科技有限公司 | 一种医疗冲突的检测方法、装置、电子设备及存储介质 |
CN111462894B (zh) * | 2020-03-27 | 2023-09-01 | 北京百度网讯科技有限公司 | 一种医疗冲突的检测方法、装置、电子设备及存储介质 |
CN111640511A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 医疗事实验证的方法、装置、电子设备及存储介质 |
CN111640511B (zh) * | 2020-05-29 | 2023-08-04 | 北京百度网讯科技有限公司 | 医疗事实验证的方法、装置、电子设备及存储介质 |
CN112071425A (zh) * | 2020-09-04 | 2020-12-11 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
WO2021151351A1 (zh) * | 2020-09-04 | 2021-08-05 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
CN112364181A (zh) * | 2020-11-27 | 2021-02-12 | 深圳市慧择时代科技有限公司 | 一种保险产品匹配度确定方法及装置 |
CN112364181B (zh) * | 2020-11-27 | 2024-05-28 | 深圳市慧择时代科技有限公司 | 一种保险产品匹配度确定方法及装置 |
CN112687395A (zh) * | 2020-12-30 | 2021-04-20 | 上海京知信息科技有限公司 | 人工智能的医疗信息处理方法、装置、设备及存储介质 |
CN112885480A (zh) * | 2021-02-23 | 2021-06-01 | 东软集团股份有限公司 | 用户信息的处理方法、装置、存储介质和电子设备 |
CN115662647A (zh) * | 2022-12-27 | 2023-01-31 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
CN115662647B (zh) * | 2022-12-27 | 2024-03-12 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113657465B (zh) | 预训练模型的生成方法、装置、电子设备和存储介质 | |
CN110675954A (zh) | 信息处理方法及装置、电子设备、存储介质 | |
CN112560479B (zh) | 摘要抽取模型训练方法、摘要抽取方法、装置和电子设备 | |
CN111639710A (zh) | 图像识别模型训练方法、装置、设备以及存储介质 | |
CN111667056B (zh) | 用于搜索模型结构的方法和装置 | |
JP2021184237A (ja) | データセット処理方法、装置、電子機器及び記憶媒体 | |
CN111737954B (zh) | 文本相似度确定方法、装置、设备和介质 | |
CN111681726A (zh) | 电子病历数据的处理方法、装置、设备和介质 | |
US20220067439A1 (en) | Entity linking method, electronic device and storage medium | |
CN111753914A (zh) | 模型优化方法和装置、电子设备及存储介质 | |
CN111582479B (zh) | 神经网络模型的蒸馏方法和装置 | |
CN112001190A (zh) | 自然语言处理模型的训练方法、装置、设备及存储介质 | |
CN111859953B (zh) | 训练数据的挖掘方法、装置、电子设备及存储介质 | |
CN111737996A (zh) | 基于语言模型获取词向量的方法、装置、设备及存储介质 | |
CN111950291A (zh) | 语义表示模型的生成方法、装置、电子设备及存储介质 | |
CN112560985A (zh) | 神经网络的搜索方法、装置及电子设备 | |
CN111079945A (zh) | 端到端模型的训练方法及装置 | |
CN111966782A (zh) | 多轮对话的检索方法、装置、存储介质及电子设备 | |
CN113409898B (zh) | 分子结构获取方法、装置、电子设备及存储介质 | |
JP2022160590A (ja) | 事前訓練済みモデルの決定方法及びその決定装置、電子機器並びに記憶媒体 | |
CN111611808B (zh) | 用于生成自然语言模型的方法和装置 | |
CN111914994A (zh) | 多层感知机的生成方法、装置、电子设备及存储介质 | |
CN114386503A (zh) | 用于训练模型的方法和装置 | |
CN114154550A (zh) | 域名对抗样本生成方法以及装置 | |
CN111325000B (zh) | 语言生成方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |