CN113257412B - 信息处理方法、装置、计算机设备及存储介质 - Google Patents
信息处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113257412B CN113257412B CN202110663916.5A CN202110663916A CN113257412B CN 113257412 B CN113257412 B CN 113257412B CN 202110663916 A CN202110663916 A CN 202110663916A CN 113257412 B CN113257412 B CN 113257412B
- Authority
- CN
- China
- Prior art keywords
- target
- symptom
- vector
- description
- physiological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 56
- 238000003672 processing method Methods 0.000 title claims abstract description 39
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 208000024891 symptom Diseases 0.000 claims abstract description 432
- 239000013598 vector Substances 0.000 claims abstract description 278
- 238000000605 extraction Methods 0.000 claims abstract description 100
- 201000010099 disease Diseases 0.000 claims abstract description 83
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 83
- 238000000034 method Methods 0.000 claims abstract description 52
- 230000001575 pathological effect Effects 0.000 claims description 83
- 238000013528 artificial neural network Methods 0.000 claims description 55
- 238000013527 convolutional neural network Methods 0.000 claims description 43
- 230000000306 recurrent effect Effects 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 26
- 210000004027 cell Anatomy 0.000 claims description 25
- 230000036541 health Effects 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 17
- 230000007170 pathology Effects 0.000 claims description 16
- 210000003855 cell nucleus Anatomy 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000003745 diagnosis Methods 0.000 abstract description 15
- 238000013473 artificial intelligence Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 206010019233 Headaches Diseases 0.000 description 1
- 208000036071 Rhinorrhea Diseases 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请提供了一种信息处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。所述方法包括:获取目标对象的生理描述数据;基于目标疾病类型关联的至少两个目标症状,对所述生理描述数据进行特征提取,得到所述至少两个目标症状中每个目标症状的至少两个特征向量;基于所述每个目标症状的至少两个特征向量,输出参考信息。上述技术方案,通过基于目标疾病类型关联的目标症状对生理描述数据进行特征提取,能够得到各目标症状在生理描述数据中的时序特征,进而基于各目标症状的时序特征,能够确定目标对象与目标疾病类型的关联性,能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。
Description
技术领域
本申请涉及人工智能技术领域,特别涉及一种信息处理方法、装置、计算机设备及存储介质。
背景技术
疾病诊断是健康检查中的重要步骤。目前,基于深度学习技术能够利用病人EMR(Electronic Medical Record,电子病历)中描述症状的文本信息进行特征提取,根据提取到特征进行疾病预测,从而起到辅助医生进行诊断、减轻医生工作负担的目的。然而,这种方式仅使用了描述症状的文本信息,导致疾病预测的结果准确性较低,不能有效的辅助医生进行疾病诊断。
发明内容
本申请实施例提供了一种信息处理方法、装置、计算机设备及存储介质,能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。所述技术方案如下。
一方面,提供了一种信息处理方法,所述方法包括:
获取目标对象的生理描述数据,所述生理描述数据用于指示所述目标对象在目标时间段内的生理健康状况;
基于目标疾病类型关联的至少两个目标症状,对所述生理描述数据进行特征提取,得到所述至少两个目标症状中每个目标症状的至少两个特征向量,所述特征向量用于表示对应的目标症状在所述生理描述数据中出现的时序特征;
基于所述每个目标症状的至少两个特征向量,输出参考信息,所述参考信息用于指示所述目标对象与所述目标疾病类型的关联性。
另一方面,提供了一种信息处理装置,所述装置包括:
数据获取模块,用于获取目标对象的生理描述数据,所述生理描述数据用于指示所述目标对象在目标时间段内的生理健康状况;
特征提取模块,用于基于目标疾病类型关联的至少两个目标症状,对所述生理描述数据进行特征提取,得到所述至少两个目标症状中每个目标症状的至少两个特征向量,所述特征向量用于表示对应的目标症状在所述生理描述数据中出现的时序特征;
信息输出模块,用于基于所述每个目标症状的至少两个特征向量,输出参考信息,所述参考信息用于指示所述目标对象与所述目标疾病类型的关联性。
在一些实施例中,所述特征提取模块,用于执行下述至少两项:
基于卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到所述至少两个目标症状中每个目标症状的症状描述特征向量,所述症状描述特征向量用于指示对应的目标症状在所述症状描述数据中出现的时序特征;
基于循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到所述至少两个目标症状中每个目标症状的对象属性特征向量,所述对象属性特征向量用于指示对应的目标症状在所述对象属性数据中出现的时序特征;
基于图卷积神经网络对所述生理描述数据中的病理图像数据进行特征提取,得到所述至少两个目标症状中每个目标症状的病理图像特征向量,所述病理图像特征向量用于指示对应的目标症状在所述病理图像数据中出现的时序特征。
在一些实施例中,所述症状描述数据包括所述目标时间段内的至少一条症状描述文本;
所述特征提取模块,包括:
第一特征提取单元,用于基于所述卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到至少一个症状描述向量,一个症状描述向量用于指示一条症状描述文本的特征;
拼接单元,用于对于所述至少两个目标症状中的任一目标症状,对至少一个目标描述向量进行拼接,得到症状描述拼接向量,所述目标描述向量为所述至少一个症状描述向量中与所述任一目标症状对应的症状描述向量;
所述第一特征提取单元,还用于基于所述卷积神经网络对所述症状描述拼接向量进行特征提取,得到所述任一目标症状的症状描述特征向量。
在一些实施例中,所述第一特征提取单元,用于对于任一条症状描述文本,基于预训练词向量将所述症状描述文本转化为症状描述矩阵,所述预训练词向量用于指示词汇和词向量之间的对应关系,所述症状描述矩阵的行数为所述症状描述文本中词汇的个数,所述症状描述矩阵的列数为词向量的维度数;基于所述卷积神经网络对所述症状描述矩阵进行特征提取,得到所述症状文本对应的症状描述向量。
在一些实施例中,所述对象属性数据包括所述目标时间段内的至少一组对象属性值;
所述特征提取模块,包括:
第二特征提取单元,用于基于所述循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到至少一个对象属性向量,一个对象属性向量用于指示一组对象属性值的特征;
第一向量处理单元,用于对于所述至少两个目标症状中的任一目标症状,基于所述循环神经网络对至少一个目标属性向量进行处理,得到所述任一目标症状的对象属性特征向量,所述目标属性向量为所述至少一个对象属性向量中与所述任一目标症状对应的对象属性向量。
在一些实施例中,所述病理图像数据包括所述目标时间段内的至少一张病理图像;
所述特征提取模块,包括:
第三特征提取单元,用于基于所述图卷积神经网络对所述生理描述数据中的病理图像数据进行特征提取,得到至少一个细胞图向量,一个细胞图向量用于指示一张病理图像的特征;
第二向量处理单元,用于对于所述至少两个目标症状中的任一目标症状,基于所述循环神经网络对至少一个目标图向量进行处理,得到所述任一目标症状的病理图像特征向量,所述目标图向量为所述至少一个症状描述向量中与所述任一目标症状对应的细胞图向量。
在一些实施例中,所述第三特征提取单元,用于对于任一张病理图像,以所述病理图像中的细胞核为节点,细胞核之间的类别关系为边,构建所述病理图像对应的细胞图;基于所述图卷积神经网络对所述病理图像对应的细胞图进行特征提取,得到所述病理图像对应的细胞图向量。
在一些实施例中,所述基于目标疾病类型关联的至少两个目标症状对所述生理描述数据进行特征提取,得到所述至少两个目标症状中每个目标症状的至少两个特征向量,基于目标预测模型中的所述卷积神经网络、所述循环神经网络和所述图卷积神经网络实现,所述目标预测模型用于预测所述目标对象与所述目标疾病类型的关联性。
在一些实施例中,所述目标预测模型的训练步骤包括:
获取样本对象的样本生理描述数据,所述样本生理描述数据用于指示所述样本对象在样本时间段内的生理健康状况;
获取标签疾病类型对应的至少两个标签症状;
基于本次迭代过程对应的预测模型和所述至少两个标签症状,对所述样本生理描述数据进行特征提取,得到所述至少两个标签症状中每个标签症状的至少两个样本特征向量,所述样本特征向量用于表示对应的样本症状在所述样本生理描述数据中的时序特征;
基于所述本次迭代过程对应的预测模型对所述每个目标症状的至少两个特征向量进行预测,得到预测结果,所述预测结果用于指示预测为所述样本对象与所述标签疾病类型相关联的概率;
基于所述预测结果对所述本次迭代过程对应的预测模型进行训练,得到所述目标预测模型。
在一些实施例中,所述信息输出模块,用于将所述每个目标症状的至少两个特征向量分别进行特征融合,得到所述每个目标症状的症状表示向量;基于所述至少两个目标症状的症状表示向量,确定并输出所述参考信息。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段计算机程序,所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的信息处理方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一段计算机程序,所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中信息处理方法中所执行的操作。
另一方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述各个方面的各种可选实现方式中提供的信息处理方法。
本申请实施例提供的技术方案带来的有益效果是:
在本申请实施例中,通过获取目标对象的生理描述数据,从而获取了目标对象在目标时间段内的生理健康状况,再基于目标疾病类型关联的目标症状对该生理描述数据进行特征提取,从而能够得到各目标症状在生理描述数据中的时序特征,进而基于各目标症状的时序特征,能够确定目标对象与目标疾病类型的关联性,由于相较于描述症状的文本信息,生理描述数据中包括的信息较为丰富,因此能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例提供的一种信息处理方法的实施环境示意图;
图2是根据本申请实施例提供的一种信息处理方法的流程图;
图3是根据本申请实施例提供的另一种信息处理方法的流程图;
图4是根据本申请实施例提供的另一种信息处理方法的流程图;
图5是根据本申请实施例提供的一种智能导诊场景的示意图;
图6是根据本申请实施例提供的一种信息处理装置的框图;
图7是根据本申请实施例提供的另一种信息处理装置的框图;
图8是根据本申请实施例提供的一种终端的结构框图;
图9是根据本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
本申请中术语“至少一个”是指一个或多个,“多个”的含义是指两个或两个以上。
下面简单介绍一下本申请实施例用到的技术。
AI(Artificial Intelligence,人工智能)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的技术方案还能够与云技术相结合,例如,将训练得到的目标预测模型部署在云端服务器。云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
其中,云技术中的医疗云(Medical Cloud)是指在云计算、移动技术、多媒体、4G通信、大数据、以及物联网等新技术基础上,结合医疗技术,使用“云计算”来创建医疗健康服务云平台,实现了医疗资源的共享和医疗范围的扩大。因为云计算技术的运用与结合,医疗云提高了医疗机构的效率,方便居民就医。例如现在医院的预约挂号、电子病历、医保等都是云计算与医疗领域结合的产物。医疗云还具有数据安全、信息共享、动态扩展、布局全局的优势。示例性的,本申请实施例提供的目标预测模型部署在医疗健康服务云平台上。
区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
ML(Machine Learning,机器学习)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
CNN(Convolutional Neural Networks,卷积神经网络),是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),它的人工神经元可以响应一部分覆盖范围内的周围单元,由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer),是深度学习(deeplearning)的代表算法之一。
RNN(Recurrent Neural Network,循环神经网络),是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。
GCN (Graph Convolutional Networks,图卷积神经网络),是卷积神经网络的拓展,可以在非规则排列的拓扑图结构上进行卷积,从而完成提取特征,分类等任务。
EMR(Electronic Medical Record,电子病历)是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的医疗记录,用以取代手写纸张病历。
KNN (k-Nearest Neighbor,K最近邻)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。
ReLU(Rectified Linear Unit,线性整流函数),又称修正线性单元,是一种人工神经网络中常用的激活函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。
以下对本申请的实施环境进行介绍。
本申请实施例提供的信息处理方法,能够由计算机设备执行。可选地,该计算机设备为终端或服务器。下面首先以计算机设备为服务器为例,介绍一下本申请实施例提供的信息处理方法的实施环境,图1是根据本申请实施例提供的一种信息处理方法的实施环境示意图。参见图1,该实施环境包括终端101和服务器102。
终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。在一些实施例中,上述终端101和服务器102能够作为区块链系统中的节点。
可选地,终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
可选地,服务器102是独立的物理服务器,也能够是多个物理服务器构成的服务器集群或者分布式系统,还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于为支持辅助疾病诊断的应用程序提供后台服务。可选地,服务器102可以承担主要计算工作,终端101可以承担次要计算工作;或者,服务器102承担次要计算工作,终端101承担主要计算工作;或者,服务器102和终端101二者之间采用分布式计算架构进行协同计算。
在该实施环境中,该支持信息处理的应用程序可以是辅助疾病诊断的应用程序。
例如,终端101向服务器102发送信息处理请求,该信息处理请求携带该目标对象的对象标识。该服务器102在接收到该信息处理请求之后,采用本申请实施例提供的信息处理方法,获取该目标对象的生理描述数据,然后基于目标疾病类型关联的至少两个目标症状,对该生理描述数据进行特征提取,得到该至少两个目标症状中每个症状的至少两个特征向量,然后基于该每个目标症状的至少两个特征向量,输出参考信息。将该参考信息发送至终端101,由终端101对该参考信息进行展示,使得该参考信息能够辅助医务人员进行疾病诊断。
本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。
在另一种可选地实现方式中,计算机设备为终端101。终端安装和运行有支持辅助疾病诊断的应用程序。示意性的,终端是医务人员使用的终端,终端中运行的应用程序内登录有医务人员的账号。
例如,终端101基于该支持辅助疾病诊断的应用程序获取目标对象的对象标识,如通过识别医疗卡中的信息或者获取医务人员输入的信息等,然后终端101向服务器102发送携带有目标对象的对象标识的数据获取请求,接收服务器102返回的目标对象的生理描述数据。然后终端101基于目标疾病类型关联的至少两个目标症状对该生理描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的至少两个特征向量。最后终端101基于该每个目标症状的至少两个特征向量,输出参考信息,该参考信息用于指示目标对象与目标疾病类型的关联性。
图2是根据本申请实施例提供的一种信息处理方法的流程图,如图2所示,在本申请实施例中以由终端执行为例进行说明。该信息处理方法包括以下步骤。
201、终端获取目标对象的生理描述数据,该生理描述数据用于指示该目标对象在目标时间段内的生理健康状况。
在本申请实施例中,该终端为医务人员使用的终端,该终端安装和运行有用于辅助疾病诊断的应用程序。该目标对象为待进行疾病诊断的人员。该生理描述数据为反映目标对象在一段时间内的生理健康状况的数据,如一年之内的病历数据、半年之内的病历数据或者三个月之内的病历数据等。
202、终端基于目标疾病类型关联的至少两个目标症状,对该生理描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的至少两个特征向量,该特征向量用于表示对应的目标症状在该生理描述数据中出现的时序特征。
在本申请实施例中,目标疾病类型为待诊断的疾病类型,该目标疾病类型关联有至少两个目标症状,如流感关联有头疼和流鼻涕等症状。终端从目标症状的角度对上述生理描述数据进行特征提取,从而得到每个目标症状的至少两个特征向量,也即终端通过特征提取得到每个目标症状在上述生理描述数据中出现的时序特征。
203、终端基于该每个目标症状的至少两个特征向量,输出参考信息,该参考信息用于指示该目标对象与该目标疾病类型的关联性。
在本申请实施例中,终端在得到每个目标症状的至少两个特征向量之后,由于该至少两个目标症状与目标疾病类型相关联,则终端基于该至少两个目标症状的特征向量,来确定该目标对象与该目标疾病类型之间的关联性,得到参考信息。
本申请实施例提供的方案,通过获取目标对象的生理描述数据,从而获取了目标对象在目标时间段内的生理健康状况,再基于目标疾病类型关联的目标症状对该生理描述数据进行特征提取,从而能够得到各目标症状在生理描述数据中的时序特征,进而基于各目标症状的时序特征,能够确定目标对象与目标疾病类型的关联性,由于相较于描述症状的文本信息,生理描述数据中包括的信息较为丰富,因此能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。
上述图2示例性示出了本申请实施例提供的信息处理方法的流程图,下面基于一种应用场景来对该信息处理方法进行进一步的介绍。参见图3所示,图3是根据本申请实施例提供的另一种信息处理方法的流程图,如图3所示,在本申请实施例中以由终端执行为例进行说明。该信息处理方法包括以下步骤。
301、终端获取目标对象的生理描述数据,该生理描述数据用于指示该目标对象在目标时间段内的生理健康状况。
在本申请实施例中,该终端为医务人员使用的终端,该终端安装和运行有用于辅助疾病诊断的应用程序。终端基于信息输入操作,获取目标对象的对象标识,然后基于该对象标识,获取该目标对象的生理描述数据,也即终端基于该对象标识,获取该目标对象在目标时间段内的生理健康状况相关的数据。可选地,该目标时间段为预设的时间段或者医务人员指定的时间段,如三个月、半年以及一年等,本申请实施例对此不进行限制。
在一些实施例中,该目标对象的生理描述数据存储在终端对应的病历数据库中,相应的,终端基于该对象标识和该目标时间段,从该病历数据库中获取该目标对象的生理描述数据。
在一些实施例中,该目标对象的生理描述数据存储在服务器对应的病历数据库中,相应的,终端向服务器发送数据获取请求,该数据获取请求携带有该目标对象的对象标识和该目标时间段。服务器对接收到的数据获取请求进行解析,基于该对象标识和该目标时间段,从该病历数据库中获取该目标对象的生理描述数据,然后向终端返回该目标对象的生理描述数据。终端接收服务器返回的生理描述数据。
在一些实施例中,该生理描述数据包括症状描述数据、对象属性数据以及病理图像数据中的至少两种。症状描述数据为EMR文本中描述患病症状的文本。对象属性数据为目标对象对应的结构化数据,如年龄、性别、体重以及检验报告中的属性值等,该属性值包括血糖值、血压值以及尿酸值等。病理图像数据为诊断过程中拍摄的病理图像。
在一些实施例中,上述症状描述数据、对象属性数据以及病理图像数据分别存储在不同的区块链节点上,区块链系统中的各个节点均能够对上述症状描述数据、对象属性数据以及病理图像数据进行查阅。或者,在一些情况下,如果用户想要对症状描述数据、对象属性数据或者病理图像数据中的任一种进行补充或者更新,也能够通过区块链系统来实现。比如用户在区块链系统中提出对症状描述数据进行补充,那么区块链系统中的多个节点能够对补充的内容进行投票,在区块链系统中的多个节点达成共识的情况下,区块链系统能够对补充的内容进行存储。当然,若用户想要对症状描述数据进行更新时,区块链系统中的多个节点也能够对更新的内容进行投票,在区块链系统中的多个节点达成共识的情况下,区块链系统能够对更新的内容进行存储。通过将症状描述数据、对象属性数据以及病理图像数据存储区块链系统中,能够保证区块链系统中的每个节点获取到目标对象相同的生理描述数据,从而在使用本申请实施例提供的信息处理方法时,能够得到较为准确的参考信息。
需要说明的是,在本申请实施例中,以生理描述数据包括症状描述数据、对象属性数据以及病理图像数据为例进行说明。可选地,终端根据生理描述数据包括的数据不同,执行下述步骤302至步骤304中的至少两项。
302、终端基于卷积神经网络对该生理描述数据中的症状描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的症状描述特征向量,该症状描述特征向量用于指示对应的目标症状在该症状描述数据中出现的时序特征。
在本申请实施例中,对于生理描述数据中的症状描述数据,终端基于卷积神经网络对该症状描述数据进行特征提取。对于上述至少两个目标症状中的任一目标症状,终端通过特征提取能够得到该任一目标症状对应的症状描述特征向量,也即得到该任一目标症状在该症状描述数据中出现的时序特征。
在一些实施例中,该症状描述数据中包括该目标时间段内的至少一条症状描述文本。可选地,一条症状描述文本对应该目标时间段内的一次就诊记录。例如,病人每次就诊时,医务人员会在就诊记录中记录一段描述患病症状的文字,也即症状描述文本,该就诊记录保存在该病人的EMR中。
相应的,终端基于卷积神经网络对该生理描述数据中的症状描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的症状描述特征向量的步骤包括:终端基于卷积神经网络对该生理描述数据中的症状描述数据进行特征提取,得到至少一个症状描述向量,一个症状描述向量用于指示一条症状描述文本的特征。然后对于该至少两个目标症状中的任一目标症状,终端对至少一个目标描述向量进行拼接,得到症状描述拼接向量,该目标描述向量为该至少一个症状描述向量中与该任一目标症状对应的症状描述向量。然后终端基于该卷积神经网络对该症状描述拼接向量进行特征提取,得到该任一目标症状的症状描述特征向量。通过对症状描述数据进行特征提取,能够得到表示每条症状描述文本的特征向量,再从目标症状的角度对特征向量进行拼接,并进行特征提取,从而能够得到该目标症状在症状描述数据中的时序特征。
在一些实施例中,终端先将症状描述文本转化为矩阵,再进行特征提取。相应的,对于任一条症状描述文本,终端基于预训练词向量将该症状描述文本转化为症状描述矩阵,该预训练词向量用于指示词汇和词向量之间的对应关系,该症状描述矩阵的行数为该症状描述文本中词汇的个数,该症状描述矩阵的列数为词向量的维度数。然后终端基于该卷积神经网络对该症状描述矩阵进行特征提取,得到该症状文本对应的症状描述向量。
可选地,以一条症状描述文本为一条EMR文本为例,终端基于预训练词向量将该EMR文本转化成一个症状描述矩阵,然后基于卷积神经网络进行特征提取,得到该EMR文本对应的症状描述向量。
例如,以症状描述数据中包括该目标时间段内的J条症状描述文本,J为正整数。参见公式(1)所示:
在一些实施例中,对于任一目标症状,如果该目标症状在至少两条症状描述文本中连续出现,则终端基于该目标症状对应的时间窗口,确定该目标症状的出现次数。然后终端将该目标症状在对应的时间窗口中的向量拼接起来形成一个新的矩阵,再基于卷积神经网络进行特征提取。该时间窗口用于表示目标症状出现的时序,也即目标症状在症状描述文本中出现的先后顺序。参见公式(2)和(3)所示:
其中,表示目标症状对应的时间窗口,表示第i个目标症状,表示目标症状在至少一条症状描述文本中的最晚出现时序,表示目标症状在至少一条症状描述文本中的最早出现时序,表示目标症状的症状描述特征向量,表示卷积神经网络,表示向量融合函数,、和表示目标描述向量,目标描述向量为至少一个症状描述向量中与该目标症状对应的症状描述向量,m表示目标症状在症状描述文本首次出现的时序。
例如,在五次就诊记录中,某个目标症状在第二次就诊记录至第四次就诊记录中均出现,则时间窗口为4-2=2。
需要说明的是,对于在至少一条症状描述文本中未连续出现的目标症状,终端按照目标症状在症状描述文本中的出现时序,对该目标症状对应的症状描述向量进行拼接,再基于该卷积神经网络对该症状描述矩阵进行特征提取,得到该症状文本对应的症状描述向量。
例如,在五次就诊记录中,某个目标症状在第一次就诊记录、第二次就诊记录以及第四次就诊记录中出现,则终端获取第一次就诊记录对应的症状描述向量、第二次就诊记录对应的症状描述向量以及第四次就诊记录对应的症状描述向量,然后对获取到的症状描述向量进行拼接,得到症状描述拼接向量。
303、终端基于循环神经网络对该生理描述数据中的对象属性数据进行特征提取,得到该至少两个目标症状中每个目标症状的对象属性特征向量,该对象属性特征向量用于指示对应的目标症状在该对象属性数据中出现的时序特征。
在本申请实施例中,对于生理描述数据中的对象属性数据,终端基于循环神经网络对该对象属性数据进行特征提取。对于上述至少两个目标症状中的任一目标症状,终端通过特征提取能够得到该任一目标症状对应的对象属性特征向量,也即得到该任一目标症状在该对象属性数据中出现的时序特征。
在一些实施例中,该对象属性数据包括该目标时间段内的至少一组对象属性值。可选地,一组对象属性值对应该目标表时间段内的一次就诊记录。例如,病人每次就诊时,医务人员会在就诊记录中记录该病人的姓名、性别、年龄、体重等基础属性值,还会在就诊记录中记录该病人的血糖值、血压值等检验报告中的属性值,该基础属性值和检验报告中的属性值即为对象属性值。
相应的,终端基于循环神经网络对该生理描述数据中的对象属性数据进行特征提取,得到该至少两个目标症状中每个目标症状的对象属性特征向量的步骤包括:终端基于循环神经网络对该生理描述数据中的对象属性数据进行特征提取,得到至少一个对象属性向量,一个对象属性向量用于指示一组对象属性值的特征。然后对于该至少两个目标症状中的任一目标症状,终端基于该循环神经网络对至少一个目标属性向量进行处理,得到该任一目标症状的对象属性特征向量,该目标属性向量为该至少一个对象属性向量中与该任一目标症状对应的对象属性向量。通过对对象属性向量进行特征提取,能够得到表示每组对象属性值的特征向量,再从目标症状的角度基于循环神经网络对特征向量进行处理,从而能够得到该目标症状在对象属性数据中的时序特征。
可选地,以一组对象属性值包括年龄、性别、体重、血糖值以及血压值为例,终端基于循环神经网络对至少两组对象属性值进行特征提取,得到每组对象属性值对应的对象属性向量。
在一些实施例中,对于任一目标症状,终端基于循环神经网络,对该目标症状在时间窗口内的对象属性向量进行特征提取。参见公式(4)所示:
304、终端基于图卷积神经网络对该生理描述数据中的病理图像数据进行特征提取,得到该至少两个目标症状中每个目标症状的病理图像特征向量,该病理图像特征向量用于指示对应的目标症状在该病理图像数据中出现的时序特征。
在本申请实施例中,对于生理描述数据中的病理图像数据,终端基于图卷积神经网络对该病理图像数据进行特征提取。对于上述至少两个目标症状中的任一目标症状,终端通过特征提取能够得到该任一目标症状对应的病理图像特征向量,也即得到该任一目标症状在该病理图像数据中出现的时序特征。
在一些实施例中,该病理图像数据包括该目标时间段内的至少一张病理图像。可选地,一张病理图像对应目标时间段内的一次就诊记录。当然,一次就诊记录还可以包括多张病理图像,本申请实施例以一张病理图像为例进行说明。例如,病人每次就诊时,医务人员会在就诊记录中记录该病人此次就诊时拍摄的X射线图像、CT图像(ComputedTomography,计算机体层摄影)等病理图像。
相应的,终端基于图卷积神经网络对该生理描述数据中的病理图像数据进行特征提取,得到该至少两个目标症状中每个目标症状的病理图像特征向量的步骤,包括:终端基于图卷积神经网络对该生理描述数据中的病理图像数据进行特征提取,得到至少一个细胞图向量,一个细胞图向量用于指示一张病理图像的特征。然后对于该至少两个目标症状中的任一目标症状,终端基于循环神经网络对至少一个目标图向量进行处理,得到该任一目标症状的病理图像特征向量,该目标图向量为该至少一个症状描述向量中与该任一目标症状对应的细胞图向量。通过对病理图像数据进行特征提取,能够得到表示每张病理图像的特征向量,再从目标症状的角度基于循环神经网络对特征向量进行处理,从而能够得到该目标症状在病理图像数据中的时序特征。
在一些实施例中,终端先提取出细胞核的轮廓和位置,然后以细胞核为节点生成细胞图,再进行特征提取。相应的,对于任一张病理图像,终端以该病理图像中的细胞核为节点,细胞核之间的类别关系为边,构建该病理图像对应的细胞图。然后终端基于该图卷积神经网络对该病理图像对应的细胞图进行特征提取,得到该病理图像对应的细胞图向量。可选地,终端将细胞核的形态信息,如周长、面积、离心力等,作为节点的属性,基于K最近邻算法来生成细胞图。图卷积神经网络的处理方式参见公式(5)和(6)所示:
其中,表示节点w在第k层的初始向量表示,表示求取最大值,表示激活函数,W表示激活函数的斜率,表示节点w的邻居节点u在第k-1层的最终向量表示,u表示节点w的邻居节点,表示节点w的邻居节点集合,表示节点w在第k层的最终向量表示,表示节点w在第k-1层的最终向量表示,k表示图卷积的层数。在得到最后一层的所有节点的向量表示后,经过一层avgpool(平均池化)便能够得到整个细胞图的向量表示。
在一些实施例中,对于任一目标症状,终端基于循环神经网络,对该目标症状在时间窗口内的细胞图向量进行特征提取。参见公式(7)所示:
305、终端基于该每个目标症状的至少两个特征向量,输出参考信息,该参考信息用于指示该目标对象与该目标疾病类型的关联性。
在本申请实施例中,经过步骤302至步骤304的特征提取之后,对于任一目标症状,终端均得到了与该任一目标症状对应的三个特征向量,该三个特征向量能够指示该任一目标症状的时序特征。终端对该任一目标症状对应的三个特征向量进行融合,得到该任一目标症状的症状表示向量,再通过平均池化层对至少两个目标症状的症状表示向量进行处理,得到目标对象的表示向量,最后通过全连接层来确定该参考信息。
在一些实施例中,终端将该每个目标症状的至少两个特征向量分别进行特征融合,得到该每个目标症状的症状表示向量,然后基于该至少两个目标症状的症状表示向量,确定并输出该参考信息。参见公式(8)和(9)所示:
其中,表示目标症状的症状表示向量,表示向量融合函数,表示目标症状的症状描述特征向量,表示目标症状的对象属性特征向量,表示目标症状的病理图像特征向量,P表示目标对象的表示向量,表示平均池化层的处理函数,、和表示目标症状,z表示目标症状的个数,z为正整数。
需要说明的是,为了使上述步骤301至步骤305所描述的信息处理方法更容易理解,参见图4所示,图4是根据本申请实施例提供的另一种信息处理方法的流程图。如图4所示,终端首先获取目标对象在目标时间段内的多条EMR文本401、多组对象属性值402以及多张病理图像403,也即获取到目标对象的生理描述数据。然后对于多条EMR文本401,终端基于卷积神经网络404进行处理,得到EMR向量表示405,也即得到至少两个目标症状中每个目标症状的症状描述特征向量。然后对于多组对象属性值402,终端基于循环神经网络406进行处理,得到对象属性向量表示407,也即得到至少两个目标症状中每个目标症状的对象属性特征向量。然后对于多张病理图像403,终端基于图卷积神经网络408进行处理,得到病理图像向量表示409,也即得到至少两个目标症状中每个目标症状的病理图像特征向量。然后终端对上述EMR向量表示405、对象属性向量表示407以及病理图像向量表示409进行向量融合410。然后终端基于平均池化层411对向量融合的结果进行处理。然后终端基于全连接层412对平均池化层的输出进行处理,得到参考信息413。
在一些实施例中,终端基于目标预测模型中的卷积神经网络、循环神经网络和图卷积神经网络实现上述步骤302-至步骤304,该目标预测模型用于预测目标对象与目标疾病类型的关联性。
下面对该目标预测模型的训练步骤进行介绍。该目标预测模型的训练步骤包括步骤(a)-步骤(e)。
(a)终端获取样本对象的样本生理描述数据,该样本生理描述数据用于指示该样本对象在样本时间段内的生理健康状况。
在本申请实施例中,该样本生理描述数据包括症状描述数据、对象属性数据以及病理图像数据中的至少两种。获取方式参见步骤301,在此不再赘述。需要说明的是,样本对象的样本生理描述数据是样本对象针对某种疾病类型连续多次就诊所生成的数据。该某种疾病类型为该目标预测模型所对应的疾病类型。
(b)终端获取标签疾病类型对应的至少两个标签症状。
在本申请实施例中,为了让目标预测模型的预测结果更具有可解释性,针对要预测的标签疾病类型d,引入与该标签疾病类型相关的z个标签症状,z为正整数。为了提取每个标签症状的时序信息,对每个标签症状,终端分别确定了每个标签症状对应的时间窗口,确定时间窗口的方式参见步骤302,在此不再赘述。
(c)终端基于本次迭代过程对应的预测模型和该至少两个标签症状,对该样本生理描述数据进行特征提取,得到该至少两个标签症状中每个标签症状的至少两个样本特征向量,该样本特征向量用于表示对应的样本症状在该样本生理描述数据中的时序特征。
在本申请实施例中,本步骤参见步骤302至步骤304,在此不再赘述。
(d)基于该本次迭代过程对应的预测模型对该每个目标症状的至少两个特征向量进行预测,得到预测结果,该预测结果用于指示预测为该样本对象与该标签疾病类型相关联的概率。
在本申请实施例中,本步骤参见步骤305,在此不再赘述。
(e)终端基于该预测结果对该本次迭代过程对应的预测模型进行训练,得到该目标预测模型。
在本申请实施例中,若该预测结果满足训练结束条件,则将本次迭代过程对应的预测模型,确定为该目标预测模型;若该预测结果不满足训练结束条件在,则终端基于该预测结果调整本次迭代过程对应的预测模型的模型参数,然后继续训练模型参数调整后的预测模型。
需要说明的是,上述步骤301至步骤305是本申请实施例提供的信息处理方法的可选实现方式,相应的,该信息处理方法还能够应用于其他场景,例如应用于智能导诊场景。参见图5所示,图5是根据本申请实施例提供的一种智能导诊场景的示意图,在该智能导诊场景中,终端提示用户输入疾病名称或者症状名称,然后终端根据用户输入的疾病名称或者症状名称,获取至少一个疾病预测模型,一个疾病预测模型用于预测用户与一种疾病类型的关联性。然后终端获取该用户授权的生理描述数据,然后基于该至少一个疾病预测模型分别对该生理描述数据进行特征提取。对于任一疾病预测模型,由于一个疾病预测模型对应一种疾病类型,一种疾病类型关联至少两个目标症状,则终端得到至少两个目标症状中每个目标症状的至少两个特征向量。然后终端基于该疾病预测模型对每个目标症状的至少两个特征向量进行处理,输出参考信息。终端基于至少一个疾病预测模型输出的至少一个参考信息,显示至少一个科室。可选地,终端还能够获取用户的年龄和性别,以进行更精准的推荐。
本申请实施例提供的方案,通过获取目标对象的生理描述数据,从而获取了目标对象在目标时间段内的生理健康状况,再基于目标疾病类型关联的目标症状对该生理描述数据进行特征提取,从而能够得到各目标症状在生理描述数据中的时序特征,进而基于各目标症状的时序特征,能够确定目标对象与目标疾病类型的关联性,由于相较于描述症状的文本信息,生理描述数据中包括的信息较为丰富,因此能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。另外,由于预测模型在训练过程中引入了与疾病相关联的症状,并设置了可变的时间窗口,使得终端能够基于训练得到的模型,更加灵活的提取与症状相关的时序信息,从而能够显著的提高疾病预测的准确性和可解释性。
图6是根据本申请实施例提供的一种信息处理装置的框图。该装置用于执行上述信息处理方法中的步骤,参见图6,装置包括:数据获取模块601,特征提取模块602以及信息输出模块603;
数据获取模块601,用于获取目标对象的生理描述数据,该生理描述数据用于指示该目标对象在目标时间段内的生理健康状况;
特征提取模块602,用于基于目标疾病类型关联的至少两个目标症状对该生理描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的至少两个特征向量,该特征向量用于表示对应的目标症状在该生理描述数据中出现的时序特征;
信息输出模块603,用于基于该每个目标症状的至少两个特征向量,输出参考信息,该参考信息用于指示该目标对象与该目标疾病类型的关联性。
在一些实施例中,该特征提取模块602,用于执行下述至少两项:
基于卷积神经网络对该生理描述数据中的症状描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的症状描述特征向量,该症状描述特征向量用于指示对应的目标症状在该症状描述数据中出现的时序特征;
基于循环神经网络对该生理描述数据中的对象属性数据进行特征提取,得到该至少两个目标症状中每个目标症状的对象属性特征向量,该对象属性特征向量用于指示对应的目标症状在该对象属性数据中出现的时序特征;
基于图卷积神经网络对该生理描述数据中的病理图像数据进行特征提取,得到该至少两个目标症状中每个目标症状的病理图像特征向量,该病理图像特征向量用于指示对应的目标症状在该病理图像数据中出现的时序特征。
在一些实施例中,该症状描述数据包括该目标时间段内的至少一条症状描述文本;
参见图7所示,图7是根据本申请实施例提供的另一种信息处理装置的框图。如图7所示,该特征提取模块602,包括:
第一特征提取单元6021,用于基于卷积神经网络对该生理描述数据中的症状描述数据进行特征提取,得到至少一个症状描述向量,一个症状描述向量用于指示一条症状描述文本的特征;
拼接单元6022,用于对于该至少两个目标症状中的任一目标症状,对至少一个目标描述向量进行拼接,得到症状描述拼接向量,该目标描述向量为该至少一个症状描述向量中与该任一目标症状对应的症状描述向量;
该第一特征提取单元6021,还用于基于该卷积神经网络对该症状描述拼接向量进行特征提取,得到该任一目标症状的症状描述特征向量。
在一些实施例中,该第一特征提取单元6021,用于对于任一条症状描述文本,基于预训练词向量将该症状描述文本转化为症状描述矩阵,该预训练词向量用于指示词汇和词向量之间的对应关系,该症状描述矩阵的行数为该症状描述文本中词汇的个数,该症状描述矩阵的列数为词向量的维度数;基于该卷积神经网络对该症状描述矩阵进行特征提取,得到该症状文本对应的症状描述向量。
在一些实施例中,该对象属性数据包括该目标时间段内的至少一组对象属性值;
如图7所示,该特征提取模块602,包括:
第二特征提取单元6023,用于基于循环神经网络对该生理描述数据中的对象属性数据进行特征提取,得到至少一个对象属性向量,一个对象属性向量用于指示一组对象属性值的特征;
第一向量处理单元6024,用于对于该至少两个目标症状中的任一目标症状,基于该循环神经网络对至少一个目标属性向量进行处理,得到该任一目标症状的对象属性特征向量,该目标属性向量为该至少一个对象属性向量中与该任一目标症状对应的对象属性向量。
在一些实施例中,该病理图像数据包括该目标时间段内的至少一张病理图像;
如图7所示,该特征提取模块602,包括:
第三特征提取单元6025,用于基于图卷积神经网络对该生理描述数据中的病理图像数据进行特征提取,得到至少一个细胞图向量,一个细胞图向量用于指示一张病理图像的特征;
第二向量处理单元6026,用于对于该至少两个目标症状中的任一目标症状,基于循环神经网络对至少一个目标图向量进行处理,得到该任一目标症状的病理图像特征向量,该目标图向量为该至少一个症状描述向量中与该任一目标症状对应的细胞图向量。
在一些实施例中,该第三特征提取单元6025,用于对于任一张病理图像,以该病理图像中的细胞核为节点,细胞核之间的类别关系为边,构建该病理图像对应的细胞图;基于该图卷积神经网络对该病理图像对应的细胞图进行特征提取,得到该病理图像对应的细胞图向量。
在一些实施例中,该基于目标疾病类型关联的至少两个目标症状对该生理描述数据进行特征提取,得到该至少两个目标症状中每个目标症状的至少两个特征向量,基于目标预测模型中的该卷积神经网络、该循环神经网络和该图卷积神经网络实现,该目标预测模型用于预测该目标对象与该目标疾病类型的关联性。
在一些实施例中,该目标预测模型的训练步骤包括:
获取样本对象的样本生理描述数据,该样本生理描述数据用于指示该样本对象在样本时间段内的生理健康状况;
获取标签疾病类型对应的至少两个标签症状;
基于本次迭代过程对应的预测模型和该至少两个标签症状,对该样本生理描述数据进行特征提取,得到该至少两个标签症状中每个标签症状的至少两个样本特征向量,该样本特征向量用于表示对应的样本症状在该样本生理描述数据中的时序特征;
基于该本次迭代过程对应的预测模型对该每个目标症状的至少两个特征向量进行预测,得到预测结果,该预测结果用于指示预测为该样本对象与该标签疾病类型相关联的概率;
基于该预测结果对该本次迭代过程对应的预测模型进行训练,得到该目标预测模型。
在一些实施例中,该信息输出模块603,用于将该每个目标症状的至少两个特征向量分别进行特征融合,得到该每个目标症状的症状表示向量;基于该至少两个目标症状的症状表示向量,确定并输出该参考信息。
本申请实施例提供的方案,通过获取目标对象的生理描述数据,从而获取了目标对象在目标时间段内的生理健康状况,再基于目标疾病类型关联的目标症状对该生理描述数据进行特征提取,从而能够得到各目标症状在生理描述数据中的时序特征,进而基于各目标症状的时序特征,能够确定目标对象与目标疾病类型的关联性,由于相较于描述症状的文本信息,生理描述数据中包括的信息较为丰富,因此能够显著的提高疾病预测的准确性,从而有效的辅助医生进行疾病诊断。
需要说明的是:上述实施例提供的信息处理装置在进行信息处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息处理装置与信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在本申请实施例中,计算机设备能够被配置为终端或者服务器,当计算机设备被配置为终端时,可以由终端作为执行主体来实施本申请实施例提供的技术方案,当计算机设备被配置为服务器时,可以由服务器作为执行主体来实施本申请实施例提供的技术方案,也可以通过终端和服务器之间的交互来实施本申请提供的技术方案,本申请实施例对此不作限定。
计算机设备被配置为终端时,参见图8所示,图8是根据本申请实施例提供的一种终端的结构框图。该终端800可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以集成有GPU(Graphics Processing Unit,图像处理器), GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器801所执行以实现本申请中方法实施例提供的信息处理方法。
在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
外围设备接口803可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置在终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在另一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端800的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测终端800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时,由处理器801根据用户对显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时,指纹传感器814可以与物理按键或厂商Logo集成在一起。
光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制显示屏805的显示亮度。具体地,当环境光强度较高时,调高显示屏805的显示亮度;当环境光强度较低时,调低显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
接近传感器816,也称距离传感器,通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时,由处理器801控制显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制显示屏805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
计算机设备被配置为服务器时,参见图9所示,图9是根据本申请实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上CPU(Central Processing Units,处理器)901和一个或一个以上的存储器902,其中,该存储器902中存储有至少一条计算机程序,该至少一条计算机程序由该处理器901加载并执行以实现上述各个方法实施例提供的信息处理方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一段计算机程序,该至少一段计算机程序由计算机设备的处理器加载并执行以实现上述实施例的信息处理方法中计算机设备所执行的操作。例如,所述计算机可读存储介质可以是ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器)、磁带、软盘和光数据存储设备等。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述各种可选实现方式中提供的信息处理方法。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种信息处理方法,其特征在于,所述方法包括:
获取目标对象的生理描述数据,所述生理描述数据用于指示所述目标对象在目标时间段内的生理健康状况;
基于卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到目标疾病类型关联的至少两个目标症状中每个目标症状的症状描述特征向量,所述症状描述特征向量用于指示对应的目标症状在所述症状描述数据中出现的时序特征;
基于循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到所述至少两个目标症状中每个目标症状的对象属性特征向量,所述对象属性特征向量用于指示对应的目标症状在所述对象属性数据中出现的时序特征;
基于图卷积神经网络对所述生理描述数据中的病理图像数据进行特征提取,得到所述至少两个目标症状中每个目标症状的病理图像特征向量,所述病理图像特征向量用于指示对应的目标症状在所述病理图像数据中出现的时序特征;
基于所述每个目标症状的至少两个特征向量,输出参考信息,所述参考信息用于指示所述目标对象与所述目标疾病类型的关联性;
其中,所述病理图像数据包括所述目标时间段内的至少一张病理图像;
所述基于图卷积神经网络对所述生理描述数据中的病理图像数据进行特征提取,得到所述至少两个目标症状中每个目标症状的病理图像特征向量,包括:
对于任一张病理图像,提取所述病理图像中的细胞核的轮廓和位置,以所述病理图像中的细胞核为节点,细胞核之间的类别关系为边,构建所述病理图像对应的细胞图;
基于所述图卷积神经网络对所述病理图像对应的细胞图进行特征提取,得到所述病理图像对应的细胞图向量,所述细胞图向量用于指示所述病理图像的特征;
对于所述至少两个目标症状中的任一目标症状,基于所述循环神经网络对至少一个目标图向量进行处理,得到所述任一目标症状的病理图像特征向量,所述目标图向量为与所述任一目标症状对应的细胞图向量。
2.根据权利要求1所述的方法,其特征在于,所述症状描述数据包括所述目标时间段内的至少一条症状描述文本;
所述基于卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到目标疾病类型关联的至少两个目标症状中每个目标症状的症状描述特征向量,包括:
基于所述卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到至少一个症状描述向量,一个症状描述向量用于指示一条症状描述文本的特征;
对于所述目标疾病类型关联的至少两个目标症状中的任一目标症状,对至少一个目标描述向量进行拼接,得到症状描述拼接向量,所述目标描述向量为所述至少一个症状描述向量中与所述任一目标症状对应的症状描述向量;
基于所述卷积神经网络对所述症状描述拼接向量进行特征提取,得到所述任一目标症状的症状描述特征向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到至少一个症状描述向量,包括:
对于任一条症状描述文本,基于预训练词向量将所述症状描述文本转化为症状描述矩阵,所述预训练词向量用于指示词汇和词向量之间的对应关系,所述症状描述矩阵的行数为所述症状描述文本中词汇的个数,所述症状描述矩阵的列数为词向量的维度数;
基于所述卷积神经网络对所述症状描述矩阵进行特征提取,得到所述症状描述文本对应的症状描述向量。
4.根据权利要求1所述的方法,其特征在于,所述对象属性数据包括所述目标时间段内的至少一组对象属性值;
所述基于循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到所述至少两个目标症状中每个目标症状的对象属性特征向量,包括:
基于所述循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到至少一个对象属性向量,一个对象属性向量用于指示一组对象属性值的特征;
对于所述至少两个目标症状中的任一目标症状,基于所述循环神经网络对至少一个目标属性向量进行处理,得到所述任一目标症状的对象属性特征向量,所述目标属性向量为所述至少一个对象属性向量中与所述任一目标症状对应的对象属性向量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述信息处理方法,基于目标预测模型中的所述卷积神经网络、所述循环神经网络和所述图卷积神经网络实现,所述目标预测模型用于预测所述目标对象与所述目标疾病类型的关联性。
6.根据权利要求5所述的方法,其特征在于,所述目标预测模型的训练步骤包括:
获取样本对象的样本生理描述数据,所述样本生理描述数据用于指示所述样本对象在样本时间段内的生理健康状况;
获取标签疾病类型对应的至少两个标签症状;
基于本次迭代过程对应的预测模型和所述至少两个标签症状,对所述样本生理描述数据进行特征提取,得到所述至少两个标签症状中每个标签症状的至少两个样本特征向量,所述样本特征向量用于表示对应的样本症状在所述样本生理描述数据中的时序特征;
基于所述本次迭代过程对应的预测模型对所述每个目标症状的至少两个特征向量进行预测,得到预测结果,所述预测结果用于指示预测为所述样本对象与所述标签疾病类型相关联的概率;
基于所述预测结果对所述本次迭代过程对应的预测模型进行训练,得到所述目标预测模型。
7.根据权利要求1所述的方法,其特征在于,所述基于所述每个目标症状的至少两个特征向量,输出参考信息,包括:
将所述每个目标症状的至少两个特征向量分别进行特征融合,得到所述每个目标症状的症状表示向量;
基于所述至少两个目标症状的症状表示向量,确定并输出所述参考信息。
8.一种信息处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标对象的生理描述数据,所述生理描述数据用于指示所述目标对象在目标时间段内的生理健康状况;
特征提取模块,用于基于卷积神经网络对所述生理描述数据中的症状描述数据进行特征提取,得到目标疾病类型关联的至少两个目标症状中每个目标症状的症状描述特征向量,所述症状描述特征向量用于指示对应的目标症状在所述症状描述数据中出现的时序特征;
所述特征提取模块,还用于基于循环神经网络对所述生理描述数据中的对象属性数据进行特征提取,得到所述至少两个目标症状中每个目标症状的对象属性特征向量,所述对象属性特征向量用于指示对应的目标症状在所述对象属性数据中出现的时序特征;
所述特征提取模块,还用于基于图卷积神经网络对所述生理描述数据中的病理图像数据进行特征提取,得到所述至少两个目标症状中每个目标症状的病理图像特征向量,所述病理图像特征向量用于指示对应的目标症状在所述病理图像数据中出现的时序特征;
信息输出模块,用于基于所述每个目标症状的至少两个特征向量,输出参考信息,所述参考信息用于指示所述目标对象与所述目标疾病类型的关联性;
其中,所述病理图像数据包括所述目标时间段内的至少一张病理图像;所述特征提取模块,包括:
第三特征提取单元,用于对于任一张病理图像,提取所述病理图像中的细胞核的轮廓和位置,以所述病理图像中的细胞核为节点,细胞核之间的类别关系为边,构建所述病理图像对应的细胞图;基于所述图卷积神经网络对所述病理图像对应的细胞图进行特征提取,得到所述病理图像对应的细胞图向量,所述细胞图向量用于指示所述病理图像的特征;
第二向量处理单元,用于对于所述至少两个目标症状中的任一目标症状,基于所述循环神经网络对至少一个目标图向量进行处理,得到所述任一目标症状的病理图像特征向量,所述目标图向量为与所述任一目标症状对应的细胞图向量。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段计算机程序,所述至少一段计算机程序由所述处理器加载并执行权利要求1至7任一项权利要求所述的信息处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储至少一段计算机程序,所述至少一段计算机程序用于执行权利要求1至7任一项权利要求所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110663916.5A CN113257412B (zh) | 2021-06-16 | 2021-06-16 | 信息处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110663916.5A CN113257412B (zh) | 2021-06-16 | 2021-06-16 | 信息处理方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113257412A CN113257412A (zh) | 2021-08-13 |
CN113257412B true CN113257412B (zh) | 2022-02-11 |
Family
ID=77188091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110663916.5A Active CN113257412B (zh) | 2021-06-16 | 2021-06-16 | 信息处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113257412B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115132303A (zh) * | 2022-04-28 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 生理标签预测方法、模型训练方法、装置、设备及介质 |
CN116522105B (zh) * | 2023-02-01 | 2023-09-22 | 深圳中汇能科技有限公司 | 基于云计算的数据一体化搭建的方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119775A (zh) * | 2019-05-08 | 2019-08-13 | 腾讯科技(深圳)有限公司 | 医疗数据处理方法、装置、系统、设备和存储介质 |
CN110969613A (zh) * | 2019-12-06 | 2020-04-07 | 广州柏视医疗科技有限公司 | 一种具有影像征象解释的肺结核智能识别方法及系统 |
CN111666477A (zh) * | 2020-06-19 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、智能设备及介质 |
CN112035671A (zh) * | 2020-11-05 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 状态检测方法、装置、计算机设备及存储介质 |
CN112489790A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 关键数据确定方法、装置、设备及存储介质 |
CN112802013A (zh) * | 2021-03-12 | 2021-05-14 | 清华大学 | 基于图神经网络与多任务学习的脑疾病检测方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119710A (zh) * | 2019-05-13 | 2019-08-13 | 广州锟元方青医疗科技有限公司 | 细胞分类方法、装置、计算机设备和存储介质 |
CN112581438B (zh) * | 2020-12-10 | 2022-11-08 | 腾讯医疗健康(深圳)有限公司 | 切片图像识别方法、装置和存储介质及电子设备 |
-
2021
- 2021-06-16 CN CN202110663916.5A patent/CN113257412B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119775A (zh) * | 2019-05-08 | 2019-08-13 | 腾讯科技(深圳)有限公司 | 医疗数据处理方法、装置、系统、设备和存储介质 |
CN110969613A (zh) * | 2019-12-06 | 2020-04-07 | 广州柏视医疗科技有限公司 | 一种具有影像征象解释的肺结核智能识别方法及系统 |
CN111666477A (zh) * | 2020-06-19 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、智能设备及介质 |
CN112035671A (zh) * | 2020-11-05 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 状态检测方法、装置、计算机设备及存储介质 |
CN112489790A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 关键数据确定方法、装置、设备及存储介质 |
CN112802013A (zh) * | 2021-03-12 | 2021-05-14 | 清华大学 | 基于图神经网络与多任务学习的脑疾病检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113257412A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348543B (zh) | 眼底图像识别方法、装置、计算机设备及存储介质 | |
CN112884770B (zh) | 图像分割处理方法、装置及计算机设备 | |
CN111243668B (zh) | 分子结合位点检测方法、装置、电子设备及存储介质 | |
CN113610750B (zh) | 对象识别方法、装置、计算机设备及存储介质 | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN111931877B (zh) | 目标检测方法、装置、设备及存储介质 | |
CN111091166A (zh) | 图像处理模型训练方法、图像处理方法、设备及存储介质 | |
CN113257383B (zh) | 匹配信息确定方法、显示方法、装置、设备及存储介质 | |
CN111930964B (zh) | 内容处理方法、装置、设备及存储介质 | |
CN112669928A (zh) | 结构化信息构建方法、装置、计算机设备及存储介质 | |
CN113674856B (zh) | 基于人工智能的医学数据处理方法、装置、设备及介质 | |
CN112749728A (zh) | 学生模型训练方法、装置、计算机设备及存储介质 | |
WO2022193973A1 (zh) | 图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN112036331A (zh) | 活体检测模型的训练方法、装置、设备及存储介质 | |
CN111192262A (zh) | 基于人工智能的产品缺陷分类方法、装置、设备及介质 | |
CN113257412B (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
CN113505256B (zh) | 特征提取网络训练方法、图像处理方法及装置 | |
CN111598160A (zh) | 图像分类模型的训练方法、装置、计算机设备及存储介质 | |
CN113569042A (zh) | 文本信息分类方法、装置、计算机设备及存储介质 | |
CN113570645A (zh) | 图像配准方法、装置、计算机设备及介质 | |
CN111598896A (zh) | 图像检测方法、装置、设备及存储介质 | |
CN112037305B (zh) | 对图像中的树状组织进行重建的方法、设备及存储介质 | |
CN113821658A (zh) | 对编码器进行训练的方法、装置、设备及存储介质 | |
CN113743186B (zh) | 医学图像的处理方法、装置、设备及存储介质 | |
CN113569894B (zh) | 图像分类模型的训练方法、图像分类方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40050618 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |