CN114141380A - 数据处理和分析方法、装置和系统 - Google Patents

数据处理和分析方法、装置和系统 Download PDF

Info

Publication number
CN114141380A
CN114141380A CN202111448149.2A CN202111448149A CN114141380A CN 114141380 A CN114141380 A CN 114141380A CN 202111448149 A CN202111448149 A CN 202111448149A CN 114141380 A CN114141380 A CN 114141380A
Authority
CN
China
Prior art keywords
knowledge
variables
bayesian network
learning
combining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111448149.2A
Other languages
English (en)
Inventor
陈冠伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Haoxinqing Mobile Medical Technology Co ltd
Original Assignee
Beijing Haoxinqing Mobile Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Haoxinqing Mobile Medical Technology Co ltd filed Critical Beijing Haoxinqing Mobile Medical Technology Co ltd
Priority to CN202111448149.2A priority Critical patent/CN114141380A/zh
Publication of CN114141380A publication Critical patent/CN114141380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开一种数据处理和分析方法、系统及设备,通过构造领域知识图谱,利用图谱抽取子图,构造结构先验知识,最后利用训练学习的贝叶斯网络进行归因分析,可以有效利用专家经验,降低模型对样本量的要求,提升模型的性能,加速模型训练速度,在缺乏心理疾病或睡眠障碍大数据的情况下能够将专家经验结合模型训练得到有效的分析结果。

Description

数据处理和分析方法、装置和系统
本申请是申请日为2021年8月12日,申请号为CN202110921652.9,发明名称为“基于知识图谱的睡眠障碍归因分析方法、装置和系统”的中国发明专利申请的分案申请。
技术领域
本发明涉及人工智能领域,尤其涉及一种数据处理和分析方法、装置和系统。
背景技术
随着现代社会节奏加快,生活压力增大,心理健康也日益成为职场人士重点关注的对象,抑郁症、神经衰落等精神或心理引发的疾病越来越困扰很多人,通过大数据方式对患者的检查结果进行人工智能算法建立模型可以辅助医生或者医务工作者提供更多科学的判断,如何有效利用这些数据,提供更好决策是急需解决的科学问题。随着影响疾病判断的因素不断增多,指标的变化成为常态,如何挖掘出促进指标增长的潜在因素正成为一个难题。
发明内容
针对上述缺陷,本发明要解决的技术问题是如何利用好影响的心理或睡眠障碍的各种因素的大数据和不断增多的维度以进行更科学的判断。
针对上述缺陷,本发明的目的在于提供一种数据处理和分析方法、系统及电子设备、计算机存储介质和程序产品。
根据本说明书的实施例的一方面,提供一种数据处理和分析方法,用于服务器端,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
优选的,算法模型包括自然语言处理、深度学习和知识图谱技术。
优选的,实体抽取包括关系抽取、事件抽取、实体消歧、知识融合和知识处理。
优选的,构造结构先验通过抽取子图结构,直接构造贝叶斯网络结构参数分布,再结合样本,共同学习贝叶斯网络结构。
优选的,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
优选的,构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中。
本发明提供一种数据处理和分析方法,应用于互联网医疗平台,收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
优选的,医疗诊断检查数据包括文本数据和图片数据。
优选的,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
优选的,抽取子图利用图神经网络模型对图中节点之间的关系进行预测,挖掘更多因果关系。
优选的,方法结合专家经验,构建相关业务领域的知识图谱,基于图片抽取相关子图,在子图上利用图神经网络模型进行节点之间关系的预测,挖掘更多因果关系,构造贝叶斯网络机构先验分布,结合样本学习贝叶斯网络。
本发明提供一种数据处理和分析系统,包括服务器端、客户端和互联网医疗平台,
用户通过所述客户端提交医疗诊断检查数据,
所述互联网医疗平台,收集用户输入的医疗诊断检查数据,所述服务器端通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
优选的,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
优选的,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
本发明提供一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现上述方法的步骤。
本发明提供一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现上述方法的步骤。
本发明提供一种电子设备,包括:
处理器;以及
被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
本发明提供一种电子设备,包括:
处理器;以及
被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
本发明可以有效利用专家经验,降低模型对样本量的要求,提升模型的性能,加速模型训练速度,在缺乏心理疾病或睡眠障碍大数据的情况下能够将专家经验结合模型训练得到有效的分析结果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明数据处理和分析方法一实施例框架示意图;
图2示出了本发明数据处理和分析方法另一实施例框架示意图;
图3示出了本发明数据处理和分析方法一实施例流程示意图;
图4示出了本发明数据处理和分析方法另一实施例流程示意图;
图5示出了本发明数据处理和分析方法另一实施例流程示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
如图1所示,本说明书的一个实施例提供的一种数据处理和分析方法,用于服务器端,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
因果判断基于效应发生的条件得出关于因果关系的结论的过程。
知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网医疗的信息表达成更接近人类认知世界的形式,更好地组织、管理和理解医疗互联网大数据中海量信息的能力。
图神经网络以GNN网络结构模型为典型,MI在概率和信息论中是两个随机变量的互信息(mutual information,MI)度量了两个变量之间相互依赖的程度。
CMI是条件互信息,给定三个变量X,Y,Z,其中X,Y在给定Z的条件下的直接或间接的非线性依赖关系程度。
PMI是部分互信息,原理基本与CMI相同,不同点在于X,Y在给定Z的条件下具有部分独立性,而非完全的条件独立性。
在一些实施例中,算法模型包括自然语言处理、深度学习和知识图谱技术。
在一些实施例中,实体抽取包括关系抽取、事件抽取、实体消歧、知识融合和知识处理。
在一些实施例中,构造结构先验通过抽取子图结构,直接构造贝叶斯网络结构参数分布,再结合样本,共同学习贝叶斯网络结构。
如图2所示,本说明书的一个实施例提供的一种数据处理和分析方法,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析;
在贝叶斯网络结构学习过程中,根据信息论相关理论,更好地度量变量间的线性和非线性因果关系。在本实施例中,加入部分互信息(PMI),以精确地度量变量间的线性与非线性因果关系。
设X,Y,Z为三个随机变量,根据信息论相关知识,互信息、条件互信息定义如下:
Figure BDA0003382742970000071
Figure BDA0003382742970000072
式中,部分互信息定义如下:
Figure BDA0003382742970000073
其中,
Figure BDA0003382742970000074
Figure BDA0003382742970000075
通过加入上述部分互信息(PMI),可以解决MI和CMI用于度量变量间线性因果关系以及非线性因果关系时的严重过估计和欠估计问题。
如图3所示,本说明书的一个实施例提供的一种数据处理和分析方法,包括:
S101、通过算法模型,对收集到的数据进行实体抽取;
S102、利用图数据库对知识进行存储;
S103、结合业务专家经验构建知识图谱;
S104、根据知识图谱和输入信息,抽取相关子图,构造结构先验;
S105、结合训练样本,学习建立贝叶斯网络模型;
S106、利用学习建立的贝叶斯网络模型进行归因分析。
在一个具体例子中,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
在一些实施例中,构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中。
如图4所示,本发明提供一种数据处理和分析方法的实施例,应用于互联网医疗平台,包括:
S201、收集用户输入的医疗诊断检查数据;
S202、通过算法模型,对数据进行实体抽取;
S203、利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
S204、根据知识图谱和输入信息,抽取相关子图,构造结构先验;
S205、结合训练样本,学习建立贝叶斯网络模型;
S206、利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
在本发明的实施例中,互联网医疗平台可以为心理治疗或者睡眠障碍等。
在一些实施例中,互联网医疗平台依据历史已收集的数据进行初步建模,通过建立模型对不同疾病类型、不同人群以及不同检测方案的大数据进行建模。
在一些具体的例子中,医疗诊断检查数据包括文本数据和图片数据。
在一些具体的例子中,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
在一些具体的例子中,抽取子图利用图神经网络模型对图中节点之间的关系进行预测,挖掘更多因果关系。
在一些具体的例子中,方法结合专家经验,构建相关业务领域的知识图谱,基于图片抽取相关子图,在子图上利用图神经网络模型进行节点之间关系的预测,挖掘更多因果关系,构造贝叶斯网络机构先验分布,结合样本学习贝叶斯网络。
本发明提供一种数据处理和分析方法的实施例,应用于互联网医疗平台,包括:
S301、收集用户输入的睡眠障碍体检数据;体检数据包括血液数据、血压数据、尿常规数据、心电图、B超、大脑CT等数据;
S302、通过NLP、深度学习、知识图谱等技术,对数据进行实体抽取;实体抽取包括睡眠障碍与体检数据关系抽取、与用户行为事件如熬夜、咖啡因摄入、工作压力、运动量过大等事件抽取、医生经验实体消歧、疾病和症状知识图谱知识融合和知识处理;
S303、利用图数据库,RDF资源描述框架等技术对知识进行存储,结合医生专家经验构建知识图谱;知识图谱包括不同的因素、不同的体检数据指标与对应的睡眠障碍和心理疾病的整体数据图谱;
S304、根据知识图谱和输入信息,抽取相关子图,构造结构先验;
S305、结合训练样本,学习建立贝叶斯网络模型;
S306、利用学习建立的贝叶斯网络模型进行归因分析形成睡眠障碍分析结果。
在一些实施例中,构造结构先验统计出不同患者用户大数据样本中变量(比如心电图、B超、大脑CT数据或熬夜、咖啡因摄入、工作压力、运动量过大等事件变量)的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
根据另一方面的实施例,还提供一种数据处理和分析系统,包括服务器端、客户端和互联网医疗平台,
用户通过所述客户端提交医疗诊断检查数据,
所述互联网医疗平台,收集用户输入的医疗诊断检查数据,所述服务器端通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
在一些实施例中,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:
通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
根据另一方面的实施例,还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:
通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
根据本说明书的实施例的另一方面,还提供一种电子设备,包括:
处理器;以及
被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析。
根据本说明书的实施例的另一方面,还提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:
收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:
收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
根据本说明书的实施例的另一方面,提供一种电子设备,包括:
处理器;以及
被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
本发明数据处理和分析方法、系统及设备,通过构造领域知识图谱,利用图谱抽取子图,构造结构先验知识,最后利用训练学习的贝叶斯网络进行归因分析,可以有效利用专家经验,降低模型对样本量的要求,提升模型的性能,加速模型训练速度,在缺乏心理疾病或睡眠障碍大数据的情况下能够将专家经验结合模型训练得到有效的分析结果。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据处理和分析方法,用于服务器端,收集用户输入的数据,通过算法模型,对数据进行数据关系抽取、与用户行为事件抽取、专家经验实体消歧、专业知识图谱知识融合和知识处理,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构;构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中;结合训练样本,学习建立贝叶斯网络模型,在贝叶斯网络结构学习过程中,加入部分互信息,以精确地度量变量间的线性与非线性因果关系;利用学习建立的贝叶斯网络模型进行归因分析。
2.根据权利要求1所述的数据处理和分析方法,所述算法模型包括自然语言处理、深度学习和知识图谱技术。
3.根据权利要求1所述的数据处理和分析方法,所述构造结构先验通过抽取子图结构,直接构造贝叶斯网络结构参数分布,再结合样本,共同学习贝叶斯网络结构。
4.根据权利要求1所述的数据处理和分析方法,所述方法结合专家经验,构建相关业务领域的知识图谱,基于图片抽取相关子图,在子图上利用图神经网络模型进行节点之间关系的预测,挖掘更多因果关系,构造贝叶斯网络机构先验分布,结合样本学习贝叶斯网络。
5.根据权利要求1-4之一所述的方法,所述用户输入的数据包括文本数据和图片数据。
6.一种数据处理和分析方法,应用于互联网医疗平台,收集用户输入的睡眠障碍体检数据,通过算法模型,对数据进行睡眠障碍与体检数据关系抽取、与用户行为事件抽取、医生经验实体消歧、疾病和症状知识图谱知识融合和知识处理,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构;构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中;结合训练样本,学习建立贝叶斯网络模型,在贝叶斯网络结构学习过程中,加入部分互信息,以精确地度量变量间的线性与非线性因果关系;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
7.一种数据处理和分析系统,包括服务器端、客户端和互联网医疗平台,
用户通过所述客户端提交体检数据,
所述互联网医疗平台,收集用户输入的体检数据,通过算法模型,对数据进行疾病与体检数据关系抽取、与用户行为事件抽取、医生经验实体消歧、疾病和症状知识图谱知识融合和知识处理,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构;构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中;结合训练样本,学习建立贝叶斯网络模型,在贝叶斯网络结构学习过程中,加入部分互信息,以精确地度量变量间的线性与非线性因果关系;
利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
8.一种计算机可读存储介质,其上存储有计算机程序/指令,被处理器执行时实现权利要求1-5之一所述方法的步骤。
9.一种计算机程序产品,包括计算机程序/指令,被处理器执行时实现权利要求1-5之一所述方法的步骤。
10.一种电子设备,包括:
处理器;以及
被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
收集用户输入的数据,通过算法模型,对数据进行数据关系抽取、与用户行为事件抽取、专家经验实体消歧、专业知识图谱知识融合和知识处理,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构;构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中;结合训练样本,学习建立贝叶斯网络模型,在贝叶斯网络结构学习过程中,加入部分互信息,以精确地度量变量间的线性与非线性因果关系;利用学习建立的贝叶斯网络模型进行归因分析。
CN202111448149.2A 2021-08-12 2021-08-12 数据处理和分析方法、装置和系统 Pending CN114141380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111448149.2A CN114141380A (zh) 2021-08-12 2021-08-12 数据处理和分析方法、装置和系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111448149.2A CN114141380A (zh) 2021-08-12 2021-08-12 数据处理和分析方法、装置和系统
CN202110921652.9A CN113362931B (zh) 2021-08-12 2021-08-12 基于知识图谱的归因分析方法、装置和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202110921652.9A Division CN113362931B (zh) 2021-08-12 2021-08-12 基于知识图谱的归因分析方法、装置和系统

Publications (1)

Publication Number Publication Date
CN114141380A true CN114141380A (zh) 2022-03-04

Family

ID=77523034

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202111448149.2A Pending CN114141380A (zh) 2021-08-12 2021-08-12 数据处理和分析方法、装置和系统
CN202110921652.9A Active CN113362931B (zh) 2021-08-12 2021-08-12 基于知识图谱的归因分析方法、装置和系统
CN202111437271.XA Pending CN114141379A (zh) 2021-08-12 2021-08-12 基于知识图谱的睡眠障碍归因分析方法、装置和系统

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202110921652.9A Active CN113362931B (zh) 2021-08-12 2021-08-12 基于知识图谱的归因分析方法、装置和系统
CN202111437271.XA Pending CN114141379A (zh) 2021-08-12 2021-08-12 基于知识图谱的睡眠障碍归因分析方法、装置和系统

Country Status (1)

Country Link
CN (3) CN114141380A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115718536A (zh) * 2023-01-09 2023-02-28 苏州浪潮智能科技有限公司 一种调频方法、装置、电子设备及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115985491B (zh) * 2023-03-21 2023-07-18 安徽通灵仿生科技有限公司 一种介入式心室导管泵的医学信息处理系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10482088B2 (en) * 2016-05-04 2019-11-19 Eugene S. Santos Augmented exploration for big data and beyond
CN108461151B (zh) * 2017-12-15 2021-06-15 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN109378053B (zh) * 2018-11-30 2021-07-06 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN111292848B (zh) * 2019-12-31 2023-05-16 同方知网数字出版技术股份有限公司 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
CN113128233B (zh) * 2021-05-11 2022-07-19 济南大学 一种心理疾病知识图谱的构建方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115718536A (zh) * 2023-01-09 2023-02-28 苏州浪潮智能科技有限公司 一种调频方法、装置、电子设备及可读存储介质
CN115718536B (zh) * 2023-01-09 2023-04-18 苏州浪潮智能科技有限公司 一种调频方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN114141379A (zh) 2022-03-04
CN113362931A (zh) 2021-09-07
CN113362931B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
Lacave et al. Learning Analytics to identify dropout factors of Computer Science studies through Bayesian networks
Ambekar et al. Disease risk prediction by using convolutional neural network
CN113362931B (zh) 基于知识图谱的归因分析方法、装置和系统
CN113420152B (zh) 基于模糊逻辑的业务处理方法、装置和系统
US20210406687A1 (en) Method for predicting attribute of target object based on machine learning and related device
Pasichnyk et al. The model of data analysis of the psychophysiological survey results
CN112185558A (zh) 基于深度学习的心理健康及康复评定方法、装置及介质
CN112069329B (zh) 文本语料的处理方法、装置、设备及存储介质
Ambica et al. An efficient expert system for diabetes by naive Bayesian classifier
CN111126552A (zh) 一种智能学习内容推送方法及系统
Shen et al. A scenario-driven decision support system for serious crime investigation
Brenas et al. Health intervention evaluation using semantic explainability and causal reasoning
Wang et al. A narrative-based reasoning with applications in decision support for social service organizations
Pryss et al. Machine learning findings on geospatial data of users from the trackyourstress mhealth crowdsensing platform
Mbunge et al. Diverging hybrid and deep learning models into predicting students’ performance in smart learning environments–a review
Pathak et al. Imputing Missing Data in Electronic Health Records
CN112820400A (zh) 基于医疗知识图谱知识推理的疾病诊断方法、装置、设备
Kovalchuk et al. Personalized clinical decision support with complex hospital-level modelling
Binaghi et al. An integrated fuzzy logic and web-based framework for active protocol support
Santos et al. Measurement Task Ontology.
Cardoso et al. Abstract computation in schizophrenia detection through artificial neural network based systems
Ikponmwosa et al. Examining Data Mining Classification Techniques for Predicting Early Childhood Development in Nigeria
Amri et al. A Predictive Visual Analytics Evaluation Approach Based on Adaptive Neuro-Fuzzy Inference System
Mayatopani Expert System for Diagnosing Behavioral Disorders Using the Dempster-Shafer Theory Algorithm
Qu et al. Five-dimensional evaluation system and perceptron intelligent computing performance measurement methods based on medical heterogeneous equipment health data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Rooms 1601 and 1602, 16th floor, No. 52, North Fourth Ring West Road, Haidian District, Beijing 100080

Applicant after: Good Feeling Health Industry Group Co.,Ltd.

Address before: Rooms 1601 and 1602, 16th floor, No. 52, North Fourth Ring West Road, Haidian District, Beijing 100080

Applicant before: BEIJING HAOXINQING MOBILE MEDICAL TECHNOLOGY CO.,LTD.

CB02 Change of applicant information