CN114064818A - 医疗实体关系的确定方法、训练方法、装置、设备及介质 - Google Patents
医疗实体关系的确定方法、训练方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114064818A CN114064818A CN202111402936.3A CN202111402936A CN114064818A CN 114064818 A CN114064818 A CN 114064818A CN 202111402936 A CN202111402936 A CN 202111402936A CN 114064818 A CN114064818 A CN 114064818A
- Authority
- CN
- China
- Prior art keywords
- item
- target
- diagnosis
- diagnostic
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000012549 training Methods 0.000 title claims abstract description 57
- 238000003745 diagnosis Methods 0.000 claims abstract description 322
- 238000012545 processing Methods 0.000 claims abstract description 39
- 230000001225 therapeutic effect Effects 0.000 claims description 55
- 238000002560 therapeutic procedure Methods 0.000 claims description 45
- 238000002626 targeted therapy Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 210000003141 lower extremity Anatomy 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 208000010392 Bone Fractures Diseases 0.000 description 11
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 210000000988 bone and bone Anatomy 0.000 description 8
- 230000009885 systemic effect Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 239000011505 plaster Substances 0.000 description 6
- 210000000629 knee joint Anatomy 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 210000002249 digestive system Anatomy 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 208000036487 Arthropathies Diseases 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 210000002345 respiratory system Anatomy 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 210000000750 endocrine system Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002478 hand joint Anatomy 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 210000004324 lymphatic system Anatomy 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 210000003857 wrist joint Anatomy 0.000 description 2
- 206010023232 Joint swelling Diseases 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- 206010041591 Spinal osteoarthritis Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 208000009729 Ventricular Premature Complexes Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 201000004427 acute laryngopharyngitis Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000036319 cervical spondylosis Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 229910052602 gypsum Inorganic materials 0.000 description 1
- 239000010440 gypsum Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 208000014987 limb edema Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 208000004124 rheumatic heart disease Diseases 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 208000005801 spondylosis Diseases 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 208000013076 thyroid tumor Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供了一种医疗实体关系的确定方法、训练方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及自然语言处理、知识图谱和深度学习技术领域。具体实现方案为:利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,其中,第一对象集合表征与目标诊断项对应的对象集合;利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合,其中,第二对象集合表征与目标治疗项对应的对象集合;根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及自然语言处理、知识图谱和深度学习技术。具体地,涉及一种医疗实体关系确定的方法、训练方法、装置、电子设备以及存储介质。
背景技术
在医疗领域,不同医疗实体之间的关系错综复杂。例如,诊断项与治疗项之间的关系。诊断项与治疗项之间关系的确定关系到医疗资源利用的标准化和收费的合理化。
发明内容
本公开提供了一种医疗实体关系的确定方法、训练方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种医疗实体关系的确定方法,包括:利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,其中,上述第一对象集合表征与上述目标诊断项对应的对象集合;利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合,其中,上述第二对象集合表征与上述目标治疗项对应的对象集合;以及,根据上述第一对象集合和上述第二对象集合,确定上述目标诊断项与上述目标治疗项之间的关系。
根据本公开的另一方面,提供了一种模型训练方法,包括:利利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型;以及,利用样本治疗项数据和第二对象标签数据训练上述诊断项标签模型,得到治疗项标签模型。
根据本公开的另一方面,提供了一种医疗实体关系的确定装置,包括:第一获得模块,用于利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,其中,上述第一对象集合表征与上述目标诊断项对应的对象集合;第二获得模块,用于利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合,其中,上述第二对象集合表征与上述目标治疗项对应的对象集合;以及,第一确定模块,用于根据上述第一对象集合和上述第二对象集合,确定上述目标诊断项与上述目标治疗项之间的关系。
根据本公开的另一方面,提供了一种模型训练装置,包括:第三获得模块,用于利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型;以及,第四获得模块,用于利用样本治疗项数据和第二对象标签数据训练上述诊断项标签模型,得到治疗项标签模型。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被所述至少一个处理器执行,以使上述至少一个处理器能够执行如上所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如上所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用医疗实体关系的确定方法、模型训练方法及装置的示例性系统架构;
图2示意性示出了根据本公开实施例的医疗实体关系的确定方法的流程图;
图3示意性示出了根据本公开实施例的基于关系图谱和实体属性图谱配合标签模型来确定目标诊断项与目标治疗项之间关系的示例示意图;
图4示意性示出了根据本公开实施例的模型训练方法的流程图;
图5示意性示出了根据本公开实施例的模型训练过程的示例示意图;
图6示意性示出了根据本公开实施例的医疗实体关系的确定装置的框图;
图7示意性示出了根据本公开实施例的模型训练装置的框图;以及
图8示意性示出了根据本公开实施例的适于实现医疗实体关系的确定方法和模型训练方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
病案首页是病案信息的高度浓缩,能够反映病案的综合信息。主要诊断项是病案首页的核心。主要诊断项的选择需要遵循相关原则。例如,应选择本次住院对用户的健康危害大、消耗医疗资源多且住院时间长的诊断项。可以利用疾病诊断相关分组(DiagnosisRelated Groups,DRG)来确定主要诊断项。由此,主要诊断项的正确选择关系到医疗资源利用的标准化和收费的合理化。诊断项与治疗项之间存在着关联关系,因此,例如可以根据与诊断项具有关联的治疗项的消耗的医疗资源来对至少一个诊断项进行排序,从而从至少一个诊断项中确定出主要诊断项。由此可以说明诊断项与治疗项之间关系的确定关系到医疗资源利用的标准化和收费的合理化。
此外,还可以根据主要诊断项对医院医疗进行绩效工作的评估,因此,主要诊断项的正确选择的重要性将更加突出。如何辅助医生实现病案首页的主要诊断项的正确选择,是亟待解决的问题。
随着人工智能技术的不断发展,可以利用人工智能技术辅助医生,实现病案首页的主要诊断项的正确选择。例如,诊断项与治疗消耗项具有关联关系,因此,可以根据与诊断项具有关联关系的治疗项的耗费信息,对至少一个诊断项进行排序,从而从至少一个诊断项中确定出主要诊断项。由此,提高医疗资源利用的标准化和收费的合理化。
为了实现能够利用上述基于诊断项与治疗项之间的关联关系的方式来确定主要诊断项,需要能够实现诊断项与治疗项之间关系的合理预测。可以利用关系图谱来实现诊断项与治疗项之间关系的合理预测。知识图谱可以是基于利用医学书籍与病历数据抽取诊断项与治疗项之间的关联关系构建的。
诊断项与治疗项之间存在着错综复杂的关系,而医学书籍和病历数据能够提供的数据较为有限,因此,利用有限的医学书籍与病历数据较难以实现数目庞大的关联关系的抽取,进而难以实现诊断项与治疗项之间关系的合理性检测的高准召率输出。
为此,本公开实施例提出了一种实体关系确定方案。即,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到表征与目标诊断项对应的第一对象集合。利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到表征与目标治疗项对应的第二对象集合。根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。实现了任意诊断项与任意治疗项之间的关联关系的预测,从而实现诊断项与治疗项之间关系的合理性检测。图1示意性示出了根据本公开实施例的可以应用医疗实体关系的确定方法、模型训练方法及装置的示例性系统架构。
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用医疗实体关系的确定方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的医疗实体关系的确定方法、模型训练方法及装置。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。
服务器105可以是提供各种服务的各种类型的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
服务器105可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(Virtual Private SerVer,VPS)中,存在的管理难度大,业务扩展性弱的缺陷。服务器105也可以为分布式系统的服务器,或者是结合了区块链的服务器。
需要说明的是,本公开实施例所提供的医疗实体关系的确定方法和训练方法一般可以由服务器105执行。相应地,本公开实施例所提供的医疗实体关系的确定装置和训练装置一般可以设置于服务器105中。本公开实施例所提供的医疗实体关系的确定方法和训练方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的医疗实体关系的确定装置和训练装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
或者,本公开实施例所提供的医疗实体关系的确定方法和训练方法一般也可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的医疗实体关系的确定装置和训练方法也可以设置于终端设备101、102、或103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的医疗实体关系的确定方法的流程图。
如图2所示,该方法200包括操作S210~S230。
操作S210,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。第一对象集合表征与目标诊断项对应的对象集合。
操作S220,利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合。第二对象集合表征与目标治疗项对应的对象集合。
操作S230,根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。
根据本公开的实施例,诊断项标签模型可以用于对诊断项所对应的标签进行预测。诊断项标签模型可以用于表征诊断项与标签之间的对应关系治疗项标签模型可以用于对治疗项所对应的标签进行预测。诊断项标签模型可以是利用第一样本数据对深度学习模型进行训练得到的。治疗项标签模型可以是利用第二样本数据对深度学习模型进行训练得到的。此外,治疗项标签模型还可以是利用第二样本数据对诊断项标签模型进行训练得到的。
根据本公开的实施例,深度学习模型可以包括预训练模型。例如,预训练模型可以包括以下至少一项:单向特征表示的自回归预训练语言模型、双向特征表示的自编码预训练语言模型和双向特征表示的自回归预训练语言模型。单向特征表示的自回归预训练语言模型可以包括以下至少一项:ELMo(Embedding from Language Models)模型和GPT(Generative Pre-Training,生成式预训练)模型。双向特征表示的自编码预训练语言模型可以包括ENRIE(Enhanced Language Representation with Informative Entities)模型、BERT(Bidirectional Encoder Representations from Transformers)模型、MASS(Masked Sequence to Sequence Pre-training for Language Generation)模型和UniLM(Unified Language Model,统一语言)模型。双向特征表示的自回归预训练语言模型可以包括XLNet模型。
根据本公开的实施例,诊断项和医疗项均是医疗实体。诊断项可以指对疾病的诊断结果。例如,诊断项可以包括骨折、关节炎、2型糖尿病、风湿性心脏病、冠心病和病毒性感冒等。治疗项(即治疗消耗项)可以指用于治疗疾病的操作。治疗项可以包括非通用治疗项和通用治疗项。例如,非通用治疗项可以包括骨牵引、石膏固定、放疗、化疗和外科手术等。通用治疗项可以包括以下至少一项:无创心电监测、动态血压监测、指脉氧监测和指脉血氧饱和度监测。
根据本公开的实施例,诊断项与治疗消耗项之间可能具有关联关系。例如,诊断项“骨折”与治疗项“骨牵引”和“石膏固定”均具有关联关系。诊断项与治疗项可以是一对一,也可以是一对多的关联关系,即,一个诊断项可以对应一个或多个治疗项。
根据本公开的实施例,标签可以指与诊断项和治疗项对应的对象。对象可以包括以下至少一项:系统、一级部位和二级部位。二级部位可以指与一级部位对应的二级部位。系统可以包括以下至少一项:运动系统、免疫系统、淋巴系统、消化系统、循环系统、神经系统、内分泌系统、感觉系统和呼吸系统。此外,系统还可以包括除上述以外的其他系统。一级部位可以包括以下至少一项:非全身部位和全身部位。全身部位可以指遍及全身的部位。一级部位和二级部位可以参见如下表1。需要说明的是,表1仅是示例性说明,除表1所示的一级部位和二级部位以外,还可以包括其他一级部位以及与一级部位对应的二级部位。此外,还可以具有与二级部位对应的三级部位。例如,二级部位“关节”可以包括以下至少一项:腕关节、指关节和膝关节。
表1
根据本公开的实施例,诊断项与对象(即标签)之间的关联关系可以参见如下表2。治疗项与对象(即标签)之间的关联关系可以参见如下表3。需要说明的是,表1和表2仅是示例性说明。
诊断项 | 对象 |
室性期前收缩 | 循环系统、心脏、胸部 |
甲状腺肿瘤 | 内分泌系统、甲状腺、颈部 |
胃癌 | 消化系统、胃部 |
手部关节脱位 | 运动系统、上肢、关节、手部 |
急性咽喉炎 | 呼吸系统、咽喉 |
…… | …… |
表2
治疗项 | 对象 |
陈旧骨折手法复位术 | 运动系统、骨头 |
胃管置管术 | 消化系统、胃部 |
牙体缺损充填术 | 牙部 |
骨髓穿刺术 | 运动系统、骨头 |
腕关节牵引术 | 运动系统、腕部、关节 |
皮肤牵引术 | 运动系统、骨头、关节 |
颈椎病推拿治疗 | 颈部、颈椎 |
…… | …… |
表3
根据本公开的实施例,第一对象集合可以表征与目标诊断项对应的对象集合。第一对象集合可以包括一个或多个对象。例如,如果目标诊断项为“股骨髁上骨折”,则与“股骨髁上骨折”对应的第一对象集合可以包括“下肢”和“膝关节”。
根据本公开的实施例,第二对象集合可以表征与目标治疗项对应的对象集合。第二对象集合可以包括一个或多个对象。例如,如果目标治疗项为“四肢关节错缝推拿治疗”,则与“四肢关节错缝推拿治疗”对应的第二对象集合可以包括“关节”。如果目标治疗项为“下肢石膏固定”,则与“下肢石膏固定”对应的第二对象集合可以包括“关节”。
根据本公开的实施例,可以将目标诊断项数据输入诊断项标签模型,得到第一对象集合。将目标治疗项数据输入治疗项标签模型,得到第二对象集合。在获得第一对象集合和第二对象集合之后,可以根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。目标诊断项与目标治疗项之间的关系可以包括具有关联关系和不具有关联关系。例如,可以确定第一对象集合与第二对象集合是否具有交集,根据确定结果,确定目标诊断项与目标治疗性之间的关系。
根据本公开的实施例,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到表征与目标诊断项对应的第一对象集合。利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到表征与目标治疗项对应的第二对象集合。根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。实现了任意诊断项与任意治疗项之间的关联关系的预测,从而实现诊断项与治疗项之间关系的合理性检测。
根据本公开的实施例,操作S230可以包括如下操作。
在确定第一对象集合和第二对象集合存在交集的情况下,确定目标诊断项和目标治疗项具有关联关系。在确定第一对象集合和第二对象集合不存在交集的情况下,确定目标诊断项和目标治疗项不具有关联关系。
根据本公开的实施例,确定第一对象集合和第二对象集合是否存在交集,即,第一对象集合和第二对象集合是否存在相同的对象。如果确定第一对象集合和第二对象集合存在相同的对象,则可以确定第一对象集合和第二对象集合存在交集,由此,可以确定目标诊断项与目标治疗项之间具有关联关系。如果确定第一对象集合和第二对象集合不存在相同的对象,则可以确定第一对象集合和第二对象集合不存在交集,由此,可以确定目标诊断项与目标治疗项之间不具有关联关系。
例如,目标诊断项为“股骨髁上骨折”。目标治疗项为“下肢石膏固定”。与“股骨髁上骨折”对应的第一对象集合包括“下肢”和“膝关节”。与“下肢石膏固定”对应的第二对象集合包括“下肢”。由于第一对象集合与第二对象集合均有“下肢”,因此,可以确定第一对象集合和第二对象集合存在交集,由此,可以确定“股骨髁上骨折”与“下肢石膏固定”之间具有关联关系。
根据本公开的实施例,为了进一步提高合理性检测精度,针对确定目标诊断项与目标治疗项是否具有关联关系,可以在第一对象集合和第二对象集合是否存在相同的对象,即,第一对象集合和第二对象集合是否存在交集的基础上,基于第一比值、第二比值和第一预定比值阈值来确定。第一预定比值阈值可以根据实际业务需求进行配置,在此不作限定。第一比值可以表征交集包括的对象的数目与第一对象集合包括的数目的比值。第二比值可以表征交集包括的对象的数目与第二对象集合包括的数目的比值。如果第一比值和第二比值均大于第一预定比值阈值,则可以确定目标诊断项与目标治疗项具有关联关系。如果第一比值和第二比值中的至少一项小于第一预定比值阈值,则可以确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,操作S210可以包括如下操作。
在基于关系图谱和实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,操作S210可以包括如下操作。
在基于实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,操作S210可以包括如下操作。
在基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,知识图谱可以包括关系图谱,也可以包括实体属性图谱,还可以包括关系图谱和实体属性图谱。知识图谱可以是基于利用医学书籍与病历数据抽取诊断项与治疗项之间的关联关系构建的。关系图谱可以用于表征诊断项与治疗项之间的关联关系。
在利用诊断项标签模型和治疗项标签模型处理之前,可以先基于知识图谱来确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于知识图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于诊断项标签模型和治疗项标签模型来分别处理目标诊断项数据和目标治疗项数据。
例如,如果知识图谱包括关系图谱,则可以基于关系图谱确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于诊断项标签模型来和治疗项标签模型来分别处理目标诊断项数据和目标治疗项数据。基于关系图谱确定目标诊断项与目标治疗项之间是否具有关联关系可以包括:基于关系图谱,根据目标诊断项数据,确定与目标诊断项对应的第二关联诊断项集合。基于关系图谱,根据第二关联诊断项集合的第二关联诊断项数据集合,确定与第二关联诊断项集合对应的第二关联治疗项集合。确定目标治疗项数据与第二关联治疗项集合的第二关联治疗项数据集合包括的多个关联治疗项数据各自之间的第三相似度,得到多个第三相似度。在确定多个第三相似度均小于预定相似度阈值的情况下,确定目标诊断项与目标治疗项之间不具有关联关系。在确定存在至少一个第三相似度小于预定相似度阈值的情况下,确定目标诊断项与目标治疗项之间具有关联关系。基于关系图谱,根据目标诊断项数据,确定与目标诊断项对应的第二关联诊断项集合,可以包括:确定目标诊断项数据与关系图谱包括的多个第二候选诊断项数据各自之间的第四相似度,得到多个第四相似度。根据多个第四相似度,从与多个第二候选诊断项数据对应的多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。
例如,如果知识图谱包括实体属性图谱,则可以基于实体属性图谱确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于诊断项标签模型和治疗项标签模型来分别处理目标诊断项数据和目标治疗项数据。
例如,如果知识图谱包括关系图谱和实体属性图谱,则可以基于关系图谱确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于实体属性图谱确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于诊断项标签模型和治疗项标签模型来分别处理目标诊断项数据和目标治疗项数据。
根据本公开的实施例,实体属性图谱可以包括第一实体属性图谱和第二实体属性图谱。
根据本公开的实施例,第一实体属性图谱可以是基于利用医学书籍与病历数据抽取得到的诊断项与病况之间的关联关系构建的。第二实体属性图谱可以是基于利用医学书籍与病历数据抽取得到的治疗项与病历之间的关联关系构建的。第一实体属性图谱可以表征诊断项与病况之间的关联关系。第二实体属性图谱可以表征治疗性与病况之间的关联关系。
根据本公开的实施例,上述医疗实体关系的确定方法还可以包括如下操作。
基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合。基于第一实体属性图谱,根据第一关联诊断项集合的第一关联诊断项数据集合,确定与第一关联诊断项集合对应的第一病况集合。基于第二实体属性图谱,根据目标治疗项数据,确定与目标治疗项对应的第一关联治疗项集合。基于第二实体属性图谱,根据第一关联治疗项集合的第一关联治疗项数据集合,确定与第一关联治疗项集合对应的第二病况集合。在确定第一病况集合与第二病况集合不存在交集的情况下,确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,第一关联诊断项集合可以包括一个或多个第一关联诊断项。第一关联诊断项可以指与目标诊断项具有关联关系的诊断项。第一病况集合可以一个或多个第一病况。第一病况可以指与目标诊断项具有关联关系的病况。第一关联治疗项集合可以包括一个或多个第一关联治疗项。第一关联治疗项可以指与目标治疗项具有关联关系的治疗项。第二病况集合可以包括一个或多个第二病况。第二病况可以指与目标治疗项具有关联关系的病况。关联关系可以用相似度表征。
根据本公开的实施例,可以先从第一实体属性图谱中确定与目标诊断项数据对应的第一关联诊断项数据集合,将与第一关联诊断项数据集合对应的诊断项确定为第一关联诊断项集合。再从第一实体属性图谱中确定与第一关联诊断项数据集合对应的第一病况数据集合,将与第一病况数据集合对应的病况确定为第一病况集合。
根据本公开的实施例,可以先从第二实体属性图谱中确定与目标治疗项数据对应的第一关联治疗项数据集合,将与第一关联治疗项数据集合对应的治疗项确定为第一关联治疗项集合。再从第二实体属性图谱中确定与第一关联治疗项数据集合对应的第二病况数据集合,将与第二病况数据集合对应的病况确定为第二病况集合。
根据本公开的实施例,在确定第一病况集合和第二病况集合之后,可以确定第一病况集合和第二病况集合是否存在交集,即,第一病况集合和第二病况集合是否存在相同的病况。如果确定第一病况集合和第二病况集合存在相同的病况,则可以确定第一病况集合和第二病况集合存在交集,由此,可以确定目标诊断项与目标治疗项之间具有关联关系。如果确定第一病况集合和第二病况集合不存在相同的病况,则可以确定第一病况集合和第二病况集合不存在交集,由此,可以确定目标诊断项与目标治疗项之间不具有关联关系。
例如,目标诊断项为“股骨髁上骨折”。目标治疗项为“骨牵引”。与“股骨髁上骨折”对应的第一病况集合包括“下肢紧张”、“下肢疼痛”、“膝关节肿胀”、“下肢水肿”、“膝关节活动受限”、“关节功能障碍”和“膝端屈曲畸形”。与“骨牵引”对应的第二病况集合包括“下肢疼痛”、“下肢紧张”和“关节功能障碍”。由于第一病况集合与第二病况集合均包括“下肢疼痛”、“下肢紧张”和“关节功能障碍”,因此,可以确定第一病况集合和第二病况集合存在交集,由此,可以确定“股骨髁上骨折”与“骨牵引”之间具有关联关系。
根据本公开的实施例,为了进一步提高合理性检测精度,针对确定目标诊断项与目标治疗项是否具有关联关系,可以在第一病况集合和第二病况集合是否存在相同的病况,即,第一病况集合和第二病况集合是否存在交集的基础上,基于第三比值、第四比值和第二预定比值阈值来确定。第二预定比值阈值可以根据实际业务需求进行配置,在此不作限定。第三比值可以表征交集包括的病况的数目与第一病况集合包括的数目的比值。第四比值可以表征交集包括的病况的数目与第二病况集合包括的数目的比值。如果第三比值和第四比值均大于第二预定比值阈值,则可以确定目标诊断项与目标治疗项具有关联关系。如果第三比值和第四比值中的至少一项小于第二预定比值阈值,则可以确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合可以包括如下操作。
确定目标诊断项数据与第一实体属性图谱包括的多个第一候选诊断项数据各自之间的第一相似度,得到多个第一相似度。根据多个第一相似度,从与多个第一候选诊断项数据对应的多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合。
根据本公开的实施例,相似度可以表征两个对象之间的相似程度。相似度可以根据实际业务需求进行配置,在此不作限定。例如,相似度可以包括集合相似度、余弦相似度、皮尔逊相关系数、欧式距离或Jaccard距离。集合相似度可以用Dice距离表征。
根据本公开的实施例,第一相似度可以表征与目标诊断项数据对应的目标诊断项和与第一候选诊断项数据对应的第一候选诊断项之间的相似程度。例如,第一相似度的数值越大,可以表征目标诊断项与第一候选诊断项之间的相似程度越大。反之,目标诊断项与第一候选诊断项之间的相似程度越小。
根据本公开的实施例,根据多个第一相似度,从与多个第一候选诊断项数据对应的多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合可以包括:对多个第一相似度进行排序,得到第一排序结果。根据第一排序结果,从多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合。排序可以按照第一相似度由小到大的顺序排序或按照由大到小的顺序排序。例如,如果排序按照第一相似度由小到大的顺序,则可以将与排序靠后的预定数目的第一相似度对应的第一候选诊断项均确定为第一关联诊断项。
备选地,可以根据多个第一相似度和第一预定相似度阈值,从多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合。第一预定相似度阈值可以根据实际业务需求进行配置,在此不作限定。例如,第一预定相似度阈值是0.9。例如,针对多个第一候选诊断项中的每个第一候选诊断项,在确定与第一候选诊断项对应的第一相似度大于或等于第一预定相似度阈值的情况下,可以将第一候选诊断项确定为第一关联诊断项。
根据本公开的实施例,基于第二实体属性图谱,根据目标治疗项数据,确定与目标治疗项对应的第一关联治疗项集合,可以包括如下操作。
确定目标治疗项数据与第二实体属性图谱包括的多个候选治疗项数据各自之间的第二相似度,得到多个第二相似度。根据多个第二相似度,从与多个候选治疗项数据对应的多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。
根据本公开的实施例,第二相似度可以表征与目标治疗项数据对应的目标治疗项和与候选治疗项数据对应的候选治疗项之间的相似程度。例如,第二相似度的数值越大,可以表征目标治疗项与候选治疗项之间的相似程度越大。反之,目标治疗项与候选治疗项之间的相似程度越小。
根据本公开的实施例,根据多个第二相似度,从与多个候选治疗项数据对应的多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合可以包括:对多个第二相似度进行排序,得到第二排序结果。根据第二排序结果,从多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。备选地,可以根据多个第二相似度和第二预定相似度阈值,从多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。第二预定相似度阈值可以根据实际业务需求进行配置,在此不作限定。例如,第二预定相似度阈值是0.9。例如,针对多个候选治疗项中的每个候选治疗项,在确定与候选治疗项对应的第二相似度大于或等于第二预定相似度阈值的情况下,可以将候选治疗项确定为第一关联治疗项。
根据本公开的实施例,基于第二实体属性图谱,根据目标治疗项数据,确定与目标治疗项对应的第一关联治疗项集合,可以包括如下操作。
确定目标治疗项数据与第二实体属性图谱包括的多个候选治疗项数据各自之间的第二相似度,得到多个第二相似度。根据多个第二相似度,从与多个候选治疗项数据对应的多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。
根据本公开的实施例,基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合,可以包括如下操作。
在基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合。
根据本公开的实施例,在利用第一实体属性图谱和第二实体属性图谱处理之前,可以先基于关系图谱来确定目标诊断项与目标治疗项之间是否具有关联关系。如果基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系,则可以基于第一实体属性图谱和第二实体属性图谱来处理目标诊断项数据和目标治疗项数据。
根据本公开的实施例,上述医疗实体关系的确定方法还可以包括如下操作。
基于关系图谱,根据目标诊断项数据,确定与目标诊断项对应的第二关联诊断项集合。基于关系图谱,根据第二关联诊断项集合的第二关联诊断项数据集合,确定与第二关联诊断项集合对应的第二关联治疗项集合。确定目标治疗项数据与第二关联治疗项集合的第二关联治疗项数据集合包括的多个关联治疗项数据各自之间的第三相似度,得到多个第三相似度。在确定多个第三相似度均小于预定相似度阈值的情况下,确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,第二关联诊断项集合可以包括一个或多个第二关联诊断项。第二关联诊断项可以指与目标诊断项具有关联关系的诊断项。第二关联治疗项集合可以包括一个或多个第二关联治疗项。第二关联治疗项可以指与目标治疗项具有关联关系的治疗项。关联关系可以用相似度表征。
根据本公开的实施例,可以先从关系图谱中确定与目标诊断项数据对应的第二关联诊断项数据集合,将与第二关联诊断项数据集合对应的诊断项确定为第二关联诊断项集合。再从关系图谱中确定与第二关联诊断项数据集合对应的第二关联治疗项数据集合,将与第二关联治疗项数据集合对应的治疗项确定为第二关联治疗项集合。
根据本公开的实施例,在确定第二关联治疗项集合之后,可以确定目标治疗项数据与第二关联治疗项数据集合包括的多个第二关联治疗项数据中的每个第二关联治疗项数据之间的第三相似度,得到多个第三相似度。如果确定多个第三相似度均小于第三预定相似度阈值,则可以确定目标诊断项与目标治疗项之间不具有关联关系。如果确定至少存在一个大于或等于第三预定相似度阈值的第三相似度,则可以确定目标诊断项项与目标治疗项之间具有关联关系。第三预定相似度阈值可以根据实际业务需求进行配置,在此不作限定。例如,第三预定相似度阈值是0.9。
根据本公开的实施例,基于关系图谱,根据目标诊断项数据,确定与目标诊断项对应的第二关联诊断项集合,可以包括如下操作。
确定目标诊断项数据与关系图谱包括的多个第二候选诊断项数据各自之间的第四相似度,得到多个第四相似度。根据多个第四相似度,从与多个第二候选诊断项数据对应的多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。
根据本公开的实施例,第四相似度可以表征与目标诊断项数据对应的目标诊断项和与第二候选诊断项数据对应的第二候选诊断项之间的相似程度。例如,第四相似度的数值越大,可以表征目标诊断项与第二候选诊断项之间的相似程度越大。反之,目标诊断项与第二候选诊断项之间的相似程度越小。
根据本公开的实施例,根据多个第四相似度,从与多个第二候选诊断项数据对应的多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合可以包括:对多个第四相似度进行排序,得到第三排序结果。根据第三排序结果,从多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。备选地,可以根据多个第四相似度和第四预定相似度阈值,从多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。第四预定相似度阈值可以根据实际业务需求进行配置,在此不作限定。例如,第四预定相似度阈值是0.9。例如,针对多个第二候选诊断项中的每个第二候选诊断项,在确定与第二候选诊断项对应的第四相似度大于或等于第四预定相似度阈值的情况下,可以将第二候选诊断项确定为第二关联诊断项。
根据本公开的实施例,上述医疗实体关系的确定方法还可以包括如下操作。
在确定目标治疗项是通用治疗项的情况下,确定目标诊断项与目标治疗项之间具有关联关系。
根据本公开的实施例,可以在基于关系图谱确定目标诊断项与目标治疗项之间是否具有关联关系之前,确定目标治疗项是否是通用治疗项。如果确定目标治疗项是通用治疗项,则可以确定目标诊断项和目标治疗项之间具有关联关系。如果确定目标治疗项不是通用治疗项,则可以基于关系图谱确定目标诊断项和目标治疗项之间的关系。
根据本公开的实施例,第一相似度和第二相似度可以均是集合相似度。
根据本公开的实施例,第三相似度和第四相似度可以均是集合相似度。
根据本公开的实施例,集合相似度可以实现字符级别的相似度确定,提高诊断项与治疗项之间关联关系预测的准确率。
根据本公开的实施例,在确定目标诊断项和目标治疗项具有关联关系的情况下,根据目标治疗项和其他治疗项各自消耗的医疗资源,从目标诊断项和与其他治疗项对应的其他诊断项中确定主要诊断项。目标诊断项和其他诊断项是针对同一用户的诊断项。
根据本公开的实施例,可以利用本公开实施例提供的医疗实体关系的确定方案来确定其他诊断项和其他治疗项之间的关系,在此不再赘述。医疗资源可以包括医疗物品和医护人员。
根据本公开的实施例,可以根据目标治疗项和其他治疗项各自消耗的医疗资源,确定目标治疗项和其他治疗项各自的资金消耗值。根据各自的资金消耗值对与目标治疗项对应的目标诊断项以及与其他治疗项对应的其他诊断项进行排序,得到第四排序结果。根据第四排序结果,从目标诊断项和其他诊断项中确定主要诊断项。
根据本公开的实施例,上述能够辅助医生实现病案首页的主要诊断项的正确选择。
基于上述内容,本公开实施例所述的实体关系确定方案可以包括基于标签模型来确定目标诊断项与目标治疗项之间关系的方案,或基于知识图谱和标签模型配合来确定目标诊断项与目标治疗项之间关系的方案。知识图谱可以包括以下至少一项:关系图谱和实体属性图谱,实体属性图谱包括第一实体属性图谱和第二实体属性图谱。
基于知识图谱和标签模型配合来确定目标诊断项与目标治疗项之间关系的方案可以包括以下一项:基于关系图谱配合标签模型来确定目标诊断项与目标治疗项之间关系的方案、基于实体属性图谱(即包括第一实体属性图谱和第二实体属性图谱)配合标签模型来确定目标诊断项与目标治疗项之间关系的方案、基于关系图谱和实体属性图谱配合标签模型来确定目标诊断项与目标治疗项之间关系的方案。
下面参考图3,结合具体实施例对根据本公开实施例所述的医疗实体关系的确定方法做进一步说明。
图3示意性示出了根据本公开实施例的基于关系图谱和实体属性图谱配合标签模型来确定目标诊断项与目标治疗项之间关系的示例示意图。
如图3所示,在300中,针对基于关系图谱300-1确定目标诊断项与目标治疗项之间的关系。即,确定目标诊断项数据301与关系图谱包括的多个第二候选诊断项数据302各自之间的第四相似度304,得到多个第四相似度304。根据多个第四相似度304从与第二候选诊断项数据集合305对应的多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。
确定目标治疗项数据306与第二关联治疗项数据集合305包括的多个关联治疗项数据各自之间的第三相似度,得到多个第三相似度。
多个第三相似度均小于预定相似度阈值307?若否,则确定目标诊断项与目标治疗项之间具有关联关系308。若是,则利用基于第一实体属性图谱和第二实体属性图谱确定目标诊断项与目标治疗项之间的关系。
针对基于实体属性图谱(即包括第一实体属性图谱和第二实体属性图谱)300-2确定目标诊断项与目标治疗项之间的关系。即,确定目标诊断项数据301与第一实体属性图谱包括的多个第一候选诊断项数据309各自之间的第一相似度310,得到多个第一相似度310。根据多个第一相似度310,从与多个第一候选诊断项数据309对应的多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合。基于第一实体属性图谱,根据第一关联诊断项集合的第一关联诊断项数据集合311,确定与第一关联诊断项集合对应的第一病况集合312。
确定目标治疗项数据306与第二实体属性图谱包括的多个候选治疗项数据313各自之间的第二相似度314,得到多个第二相似度314。根据多个第二相似度314,从与多个候选治疗项数据313对应的多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。基于第二实体属性图谱,根据第一关联治疗项集合的第一关联治疗项数据集合315,确定与第一关联治疗项集合对应的第二病况集合316。
第一病况集合312与第二病况集合316存在交集317?若是,则确定目标诊断项与目标治疗项之间具有关联关系308。若否,则基于标签模型确定目标诊断项与目标治疗项之间的关系。
针对基于标签模型300-3确定目标诊断项与目标治疗项之间的关系。即,将目标诊断项数据301输入诊断项标签模型318,得到第一对象集合319。将目标治疗项数据306输入治疗项标签模型320,得到第二对象集合321。
第一对象集合319和第二对象集合321存在交集322?若是,则确定目标诊断项与目标治疗项之间具有关联关系308。若否,则确定目标诊断项和目标治疗项之间不具有关联关系323。
利用本公开实施例所述的实体关系确定方案进行评估,准确率、召回率和F1分数均可以达到0.91以上。
图4示意性示出了根据本公开实施例的模型训练方法的流程图。
如图4所示,该方法400包括操作S410~S420。
在操作S410,利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型。
在操作S420,利用样本治疗项数据和第二对象标签数据训练诊断项标签模型,得到治疗项标签模型。
根据本公开的实施例,第一对象标签和第二对象标签均可以包括以下至少一项:系统标签、一级部位标签和二级部位标签。二级部位标签可以指与一级部位标签对应的二级部位标签。系统标签可以包括以下至少一项:运动系统标签、免疫系统标签、淋巴系统标签、消化系统标签、循环系统标签、神经系统标签、内分泌系统标签、感觉系统标签和呼吸系统标签。此外,系统标签还可以包括除上述以外的其他系统标签。一级部位标签可以包括以下至少一项:非全身部位标签和全身部位标签。全身部位标签可以指遍及全身的部位标签。一级部位标签和二级部位标签可以参见上文所示的表1,在此不再赘述。
根据本公开的实施例,预定模型可以为深度学习模型。例如,预定模型可以包括预训练语言模块、GRU(即门控循环单元)、全连接层和激活函数层等。
根据本公开的实施例,样本诊断项数据具有与其对应的第一对象标签数据。样本诊断项数据和第一对象标签数据之间的关联关系可以是基于系统解剖学与医学专家的意见构建的。同样的,样本治疗项数据具有与其对应的第二对象标签数据。样本治疗项数据和第二对象标签数据之间的关联关系也可以是基于系统解剖学与医学专家的意见构建的。
根据本公开的实施例,可以将样本诊断项数据输入预定模型,得到第一对象预测结果。将第一对象预测结果和第一样本标签数据输入第一损失函数,得到第一输出值。根据第一输出值调整预定模型的模型参数,直至满足预定条件。将在满足预定条件的情况下得到的预定模型确定为诊断项标签模型。
根据本公开的实施例,可以将样本治疗项数据输入诊断项标签模型,得到第二对象预测结果。将第二对象预测结果和第二样本标签数据输入损失函数,得到第二输出值。根据第二输出值调整诊断项标签模型的模型参数,得到治疗项标签模型。
基于上述内容,可以获得诊断项标签模型和治疗项标签模型。
根据本公开的实施例,基于上述方式得到的诊断项标签模型和治疗项标签模型,能够实现任意诊断项与任意治疗项之间关联关系的预测。诊断项标签模型和治疗项标签模型的准确率与召回率均可以达到0.95以上。诊断项标签模型对诊断项的覆盖率可以达到0.98以上。治疗项标签模型对治疗项的覆盖率可以达到0.9以上。基于上述实现未建立诊断项与治疗项的关系图谱或实体属性图谱的关联预测,从而进一步实现诊断项与治疗项之间关系的合理性检测。
根据本公开的实施例,第一对象标签数据包括系统标签数据和多级部位标签数据。
根据本公开的实施例,操作S410可以包括如下操作。
对样本诊断项数据进行编码处理,得到样本诊断项向量。对样本诊断项向量进行全连接处理,得到第一样本诊断项向量和第二样本诊断项向量。根据样本诊断项向量、第一样本诊断项向量和第二样本诊断项向量,得到系统预测结果和多级部位预测结果。利用系统标签数据、系统预测结果、多级部位标签数据和多级部位预测结果训练预定模型,得到诊断项标签模型。
根据本公开的实施例,可以将系统标签数据和系统预测结果输入第一损失函数,得到第一输出值。将多级部位标签数据和多级部位预测结果输入第一损失函数,得到第二输出值。根据第一输出值和第二输出值调整预定模型的模型参数,直至满足预定条件。将在满足预定条件的情况下得到的预定模型确定为诊断项标签模型。
根据本公开的实施例,多级部位标签数据包括一级部位标签数据和二级部位标签数据。第一部位标签数据可以包括非全身部位标签数据和全身部位标签数据。
根据本公开的实施例,多级预测结果包括一级部位预测结果和二级部位预测结果。一级部位预测结果可以包括非全身部位预测结果和全身部位预测结果。
根据本公开的实施例,根据样本诊断项向量、第一样本诊断项向量和第二样本诊断项向量,得到系统预测结果和多级部位预测结果,可以包括如下操作。
根据样本诊断项向量和第一样本诊断项向量,得到第三样本诊断项向量。根据样本诊断项向量、第一样本诊断项向量和第二样本诊断项向量,得到第四样本诊断项向量。根据第一样本诊断项向量,得到非全身部位预测结果。根据第二样本诊断项向量,得到全身部位预测结果。根据第三样本诊断项向量,得到二级部位预测结果。根据第四样本诊断项向量,得到系统预测结果。
根据本公开的实施例,根据第四样本诊断项向量,得到系统预测结果可以包括:对第四样本诊断项向量进行全连接处理,得到第五样本诊断项向量。对第五样本诊断项向量进行激活处理,得到系统部位预测结果。
根据本公开的实施例,根据第一样本诊断项向量,得到非全身部位预测结果可以包括:对第一样本诊断项向量进行全连接处理,得到第六样本诊断项向量。对第六样本诊断项向量进行激活处理,得到非全身部位预测结果。
根据本公开的实施例,根据第二样本诊断向量,得到全身部位预测结果可以包括:对第二样本诊断项向量进行全连接处理,得到第七样本诊断项向量。对第七样本诊断项向量进行激活处理,得到全身部位预测结果。
根据本公开的实施例,根据第三样本诊断项向量,得到二级部位预测结果可以包括:对第三样本诊断项向量进行全连接处理,得到第八样本诊断项向量。对第八样本诊断项向量进行激活处理,得到二级部位预测结果。
下面参考图5,结合具体实施例对根据本公开实施例所述的模型训练方法做进一步说明。
图5示意性示出了根据本公开实施例的模型训练过程的示例示意图。
如图5所示,在500中,预定模型包括预训练语言模块502、门控循环单元503、多个全连接层和多个激活层。多个全连接层包括全连接层505、全连接层510、全连接层514、全连接层518和全连接层522。多个激活层包括激活层512、激活层516、激活层520和激活层524。
利用预训练语言模块502和门控循环单元503处理样本诊断项数据501,得到样本诊断项向量504。将样本诊断项向量504输入全连接层505,得到第一样本诊断项向量506和第二样本诊断项向量507。
根据样本诊断项向量504和第一样本诊断项向量506,得到第三样本诊断项向量508。根据样本诊断项向量504、第一样本诊断项向量506和第二样本诊断项向量507,得到第四样本诊断项向量509。
将第四样本诊断项向量509输入全连接层510,得到第五样本诊断项向量511。将第五样本诊断项向量511输入激活层512,得到系统部位预测结果513。
将第一样本诊断项向量506输入全连接层514,得到第六样本诊断项向量515。将第六样本诊断项向量515输入激活层516,得到非全身部位预测结果517。
将第二样本诊断项向量507输入全连接层518,得到第七样本诊断项向量519。将第七样本诊断项向量519输入激活层520,得到全身部位预测结果521。
将第三样本诊断项向量508输入全连接层522,得到第八样本诊断项向量523。将第八样本诊断项向量523输入激活层524,得到二级部位预测结果525。
将系统标签数据和系统预测结果513输入第一损失函数,得到第一输出值。将非全身部位标签数据和非全身部位预测结果517输入第一损失函数,得到第三输出值。将全身部位标签数据和全身部位预测结果521输入第一损失函数,得到第四输出值。将二级部位标签数据和二级部位预测结果523输入第一损失函数,得到第五输出值。根据第一输出值和第二输出值调整预定模型的模型参数,直至满足预定条件。将在满足预定条件的情况下得到的预定模型确定为诊断项标签模型。第二输出值包括第三输出值、第四输出值和第五输出值。
以上仅是示例性实施例,但不限于此,还可以包括本领域已知的其他医疗实体关系的确定方法和模型训练方法,只要能够实现诊断项和治疗项之间关系的合理预测即可。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取、收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图6示意性示出了根据本公开实施例的医疗实体关系的确定装置的框图。
如图6所示,医疗实体关系的确定装置600可以包括第一获得模块610、第二获得模块620和第一确定模块630。
第一获得模块610,用于利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。第一对象集合表征与目标诊断项对应的对象集合。
第二获得模块620,用于利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合。第二对象集合表征与目标治疗项对应的对象集合。
第一确定模块630,用于根据第一对象集合和第二对象集合,确定目标诊断项与目标治疗项之间的关系。
根据本公开的实施例,第一确定模块630可以包括第一确定子模块和第二确定子模块。
第一确定子模块,用于在确定第一对象集合和第二对象集合存在交集的情况下,确定目标诊断项和目标治疗项具有关联关系。
第二确定子模块,用于在确定第一对象集合和第二对象集合不存在交集的情况下,确定目标诊断项和目标治疗项不具有关联关系。
根据本公开的实施例,第一获得模块610可以包括第一获得子模块。
第一获得子模块,用于在基于关系图谱和实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,第一获得模块610可以包括第二获得子模块。
第二获得子模块,用于在基于实体属性图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,第一获得模块610可以包括第三获得子模块。
第三获得子模块,用于在基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合。
根据本公开的实施例,实体属性图谱包括第一实体属性图谱和第二实体属性图谱。
根据本公开的实施例,上述医疗实体关系的确定装置600还可以包括第二确定模块、第三确定模块、第四确定模块、第五确定模块和第六确定模块。
第二确定模块,用于基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合。
第三确定模块,用于基于第一实体属性图谱,根据第一关联诊断项集合的第一关联诊断项数据集合,确定与第一关联诊断项集合对应的第一病况集合。
第四确定模块,用于基于第二实体属性图谱,根据目标治疗项数据,确定与目标治疗项对应的第一关联治疗项集合。
第五确定模块,用于基于第二实体属性图谱,根据第一关联治疗项集合的第一关联治疗项数据集合,确定与第一关联治疗项集合对应的第二病况集合。
第六确定模块,用于在确定第一病况集合与第二病况集合不存在交集的情况下,确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,第二确定模块可以包括第三确定子模块。
第三确定子模块,用于确定目标诊断项数据与第一实体属性图谱包括的多个第一候选诊断项数据各自之间的第一相似度,得到多个第一相似度。
第四确定子模块,用于根据多个第一相似度,从与多个第一候选诊断项数据对应的多个第一候选诊断项中确定与目标诊断项对应的第一关联诊断项集合。
根据本公开的实施例,第四确定模块可以包括第五确定子模块和第六确定子模块。
第五确定子模块,用于确定目标治疗项数据与第二实体属性图谱包括的多个候选治疗项数据各自之间的第二相似度,得到多个第二相似度。
第六确定子模块,用于根据多个第二相似度,从与多个候选治疗项数据对应的多个候选治疗项中确定与目标治疗项对应的第一关联治疗项集合。
根据本公开的实施例,第一相似度和第二相似度均是集合相似度。
根据本公开的实施例,第二确定模块可以包括第七确定子模块。
第七确定子模块,用于在基于关系图谱确定目标诊断项与目标治疗项之间不具有关联关系的情况下,基于第一实体属性图谱,根据目标诊断项数据,确定与目标诊断项对应的第一关联诊断项集合。
根据本公开的实施例,上述医疗实体关系的确定方法还可以包括第七确定模块、第八确定模块、第九确定模块和第十确定模块。
第七确定模块,用于基于关系图谱,根据目标诊断项数据,确定与目标诊断项对应的第二关联诊断项集合。
第八确定模块,用于基于关系图谱,根据第二关联诊断项集合的第二关联诊断项数据集合,确定与第二关联诊断项集合对应的第二关联治疗项集合。
第九确定模块,用于确定目标治疗项数据与第二关联治疗项集合的第二关联治疗项数据集合包括的多个关联治疗项数据各自之间的第三相似度,得到多个第三相似度。
第十确定模块,用于在确定多个第三相似度均小于预定相似度阈值的情况下,确定目标诊断项与目标治疗项之间不具有关联关系。
根据本公开的实施例,第七确定模块可以包括第八确定子模块和第九确定子模块。
第八确定子模块,用于确定目标诊断项数据与关系图谱包括的多个第二候选诊断项数据各自之间的第四相似度,得到多个第四相似度。
第九确定子模块,用于根据多个第四相似度,从与多个第二候选诊断项数据对应的多个第二候选诊断项中确定与目标诊断项对应的第二关联诊断项集合。
根据本公开的实施例,上述医疗实体关系的确定装置600还可以包括第十一确定模块。
第十一确定模块,用于在确定目标诊断项和目标治疗项具有关联关系的情况下,根据目标治疗项和其他治疗项各自消耗的医疗资源,从目标诊断项和与其他治疗项对应的其他诊断项中确定主要诊断项。目标诊断项和其他诊断项是针对同一用户的诊断项。
图7示意性示出了根据本公开实施例的模型训练装置的框图。
如图7所示,模型训练装置700可以包括第二获得模块710和第三获得模块720。
第三获得模块710,用于利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型。
第四获得模块720,用于利用样本治疗项数据和第二对象标签数据训练诊断项标签模型,得到治疗项标签模型。
根据本公开的实施例,第一对象标签数据包括系统标签数据和多级部位标签数据。
根据本公开的实施例,第三获得模块710可以包第二获得子模块、第三获得子模块、第四获得子模块和第五获得子模块。
第二获得子模块,用于对样本诊断项数据进行编码处理,得到样本诊断项向量。
第三获得子模块,用于对样本诊断项向量进行全连接处理,得到第一样本诊断项向量和第二样本诊断项向量。
第四获得子模块,用于根据样本诊断项向量、第一样本诊断项向量和第二样本诊断项向量,得到系统预测结果和多级部位预测结果。
第五获得子模块,用于利用系统标签数据、系统预测结果、多级部位标签数据和多级部位预测结果训练预定模型,得到诊断项标签模型。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
图8示意性示出了根据本公开实施例的适于实现医疗实体关系的确定方法和模型训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如医疗实体关系的确定方法或模型训练方法。例如,在一些实施例中,医疗实体关系的确定方法或模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的医疗实体关系的确定方法或模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行医疗实体关系的确定方法或模型训练方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (20)
1.一种医疗实体关系的确定方法,包括:
利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,其中,所述第一对象集合表征与所述目标诊断项对应的对象集合;
利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合,其中,所述第二对象集合表征与所述目标治疗项对应的对象集合;以及
根据所述第一对象集合和所述第二对象集合,确定所述目标诊断项与所述目标治疗项之间的关系。
2.根据权利要求1所述的方法,其中,所述根据所述第一对象集合和所述第二对象集合,确定所述目标诊断项与所述目标治疗项之间的关系,包括:
在确定所述第一对象集合和所述第二对象集合存在交集的情况下,确定所述目标诊断项和所述目标治疗项具有关联关系;以及
在确定所述第一对象集合和所述第二对象集合不存在交集的情况下,确定所述目标诊断项和所述目标治疗项不具有关联关系。
3.根据权利要求1或2所述的方法,其中,所述利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,包括:
在基于关系图谱和实体属性图谱确定所述目标诊断项与所述目标治疗项之间不具有关联关系的情况下,利用所述诊断项标签模型处理所述目标诊断项的目标诊断项数据,得到所述第一对象集合。
4.根据权利要求1或2所述的方法,其中,所述利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,包括:
在基于实体属性图谱确定所述目标诊断项与所述目标治疗项之间不具有关联关系的情况下,利用所述诊断项标签模型处理所述目标诊断项的目标诊断项数据,得到所述第一对象集合。
5.根据权利要求1或2所述的方法,其中,所述利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,包括:
在基于关系图谱确定所述目标诊断项与所述目标治疗项之间不具有关联关系的情况下,利用所述诊断项标签模型处理所述目标诊断项的目标诊断项数据,得到所述第一对象集合。
6.根据权利要求3所述的方法,其中,所述实体属性图谱包括第一实体属性图谱和第二实体属性图谱;
其中,所述方法还包括:
基于所述第一实体属性图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第一关联诊断项集合;
基于所述第一实体属性图谱,根据所述第一关联诊断项集合的第一关联诊断项数据集合,确定与所述第一关联诊断项集合对应的第一病况集合;
基于所述第二实体属性图谱,根据所述目标治疗项数据,确定与所述目标治疗项对应的第一关联治疗项集合;
基于所述第二实体属性图谱,根据所述第一关联治疗项集合的第一关联治疗项数据集合,确定与所述第一关联治疗项集合对应的第二病况集合;以及
在确定所述第一病况集合与所述第二病况集合不存在交集的情况下,确定所述目标诊断项与所述目标治疗项之间不具有关联关系。
7.根据权利要求6所述的方法,其中,所述基于所述第一实体属性图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第一关联诊断项集合,包括:
确定所述目标诊断项数据与所述第一实体属性图谱包括的多个第一候选诊断项数据各自之间的第一相似度,得到多个第一相似度;以及
根据所述多个第一相似度,从与所述多个第一候选诊断项数据对应的多个第一候选诊断项中确定与所述目标诊断项对应的第一关联诊断项集合。
8.根据权利要求6或7所述的方法,其中,所述基于所述第二实体属性图谱,根据所述目标治疗项数据,确定与所述目标治疗项对应的第一关联治疗项集合,包括:
确定所述目标治疗项数据与所述第二实体属性图谱包括的多个候选治疗项数据各自之间的第二相似度,得到多个第二相似度;以及
根据所述多个第二相似度,从与所述多个候选治疗项数据对应的多个候选治疗项中确定与所述目标治疗项对应的第一关联治疗项集合。
9.根据权利要求7或8所述的方法,其中,所述第一相似度和所述第二相似度均是集合相似度。
10.根据权利要求6~9中任一项所述的方法,其中,所述基于所述第一实体属性图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第一关联诊断项集合,包括:
在基于所述关系图谱确定所述目标诊断项与所述目标治疗项之间不具有关联关系的情况下,基于所述第一实体属性图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第一关联诊断项集合。
11.根据权利要求5或10所述的方法,还包括:
基于所述关系图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第二关联诊断项集合;
基于所述关系图谱,根据所述第二关联诊断项集合的第二关联诊断项数据集合,确定与所述第二关联诊断项集合对应的第二关联治疗项集合;
确定所述目标治疗项数据与所述第二关联治疗项集合的第二关联治疗项数据集合包括的多个关联治疗项数据各自之间的第三相似度,得到多个第三相似度;以及
在确定所述多个第三相似度均小于预定相似度阈值的情况下,确定所述目标诊断项与所述目标治疗项之间不具有关联关系。
12.根据权利要求11所述的方法,其中,所述基于所述关系图谱,根据所述目标诊断项数据,确定与所述目标诊断项对应的第二关联诊断项集合,包括:
确定所述目标诊断项数据与所述关系图谱包括的多个第二候选诊断项数据各自之间的第四相似度,得到多个第四相似度;以及
根据所述多个第四相似度,从与所述多个第二候选诊断项数据对应的多个第二候选诊断项中确定与所述目标诊断项对应的第二关联诊断项集合。
13.根据权利要求2~12中任一项所述的方法,还包括:
在确定所述目标诊断项和所述目标治疗项具有关联关系的情况下,根据所述目标治疗项和其他治疗项各自消耗的医疗资源,从所述目标诊断项和与其他治疗项对应的其他诊断项中确定主要诊断项,其中,所述目标诊断项和所述其他诊断项是针对同一用户的诊断项。
14.一种模型训练方法,包括:
利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型;以及
利用样本治疗项数据和第二对象标签数据训练所述诊断项标签模型,得到治疗项标签模型。
15.根据权利要求14所述的方法,其中,所述第一对象标签数据包括系统标签数据和多级部位标签数据;
其中,所述利用样本诊断项数据和第一标签数据训练预定模型,得到诊断项标签模型,包括:
对所述样本诊断项数据进行编码处理,得到样本诊断项向量;
对所述样本诊断项向量进行全连接处理,得到第一样本诊断项向量和第二样本诊断项向量;
根据所述样本诊断项向量、所述第一样本诊断项向量和所述第二样本诊断项向量,得到系统预测结果和多级部位预测结果;以及
利用所述系统标签数据、所述系统预测结果、所述多级部位标签数据和所述多级部位预测结果训练所述预定模型,得到所述诊断项标签模型。
16.一种医疗实体关系的确定装置,包括:
第一获得模块,用于利用诊断项标签模型处理目标诊断项的目标诊断项数据,得到第一对象集合,其中,所述第一对象集合表征与所述目标诊断项对应的对象集合;
第二获得模块,用于利用治疗项标签模型处理目标治疗项的目标治疗项数据,得到第二对象集合,其中,所述第二对象集合表征与所述目标治疗项对应的对象集合;以及
第一确定模块,用于根据所述第一对象集合和所述第二对象集合,确定所述目标诊断项与所述目标治疗项之间的关系。
17.一种模型训练装置,包括:
第三获得模块,用于利用样本诊断项数据和第一对象标签数据训练预定模型,得到诊断项标签模型;以及
第四获得模块,用于利用样本治疗项数据和第二对象标签数据训练所述诊断项标签模型,得到治疗项标签模型。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~13中任一项或权利要求14或15所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~13中任一项或权利要求14或15所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~13中任一项或权利要求14或15所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111402936.3A CN114064818A (zh) | 2021-11-23 | 2021-11-23 | 医疗实体关系的确定方法、训练方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111402936.3A CN114064818A (zh) | 2021-11-23 | 2021-11-23 | 医疗实体关系的确定方法、训练方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114064818A true CN114064818A (zh) | 2022-02-18 |
Family
ID=80275730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111402936.3A Pending CN114064818A (zh) | 2021-11-23 | 2021-11-23 | 医疗实体关系的确定方法、训练方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114064818A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579626A (zh) * | 2022-03-09 | 2022-06-03 | 北京百度网讯科技有限公司 | 数据处理方法、数据处理装置、电子设备和介质 |
CN116313118A (zh) * | 2022-06-07 | 2023-06-23 | 拉萨卓友峰科技有限公司 | 应用于医疗数据处理的知识图谱构建方法 |
-
2021
- 2021-11-23 CN CN202111402936.3A patent/CN114064818A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579626A (zh) * | 2022-03-09 | 2022-06-03 | 北京百度网讯科技有限公司 | 数据处理方法、数据处理装置、电子设备和介质 |
CN114579626B (zh) * | 2022-03-09 | 2023-08-11 | 北京百度网讯科技有限公司 | 数据处理方法、数据处理装置、电子设备和介质 |
CN116313118A (zh) * | 2022-06-07 | 2023-06-23 | 拉萨卓友峰科技有限公司 | 应用于医疗数据处理的知识图谱构建方法 |
CN116313118B (zh) * | 2022-06-07 | 2023-11-14 | 拉萨卓友峰科技有限公司 | 应用于医疗数据处理的知识图谱构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109741806B (zh) | 一种医学影像诊断报告辅助生成方法及其装置 | |
US11670420B2 (en) | Drawing conclusions from free form texts with deep reinforcement learning | |
CN111048167B (zh) | 一种层级式病例结构化方法及系统 | |
CN114064818A (zh) | 医疗实体关系的确定方法、训练方法、装置、设备及介质 | |
CN112614578B (zh) | 医生智能推荐方法、装置、电子设备及存储介质 | |
CN112528660A (zh) | 处理文本的方法、装置、设备、存储介质和程序产品 | |
CN115169364B (zh) | 智能问答方法、装置、设备以及存储介质 | |
CN114765075A (zh) | 药品推荐方法、装置及系统、电子设备及存储介质 | |
CN108292306A (zh) | 电子临床自由文本的阅读者驱动的释义 | |
CN113792115B (zh) | 实体相关性确定方法、装置、电子设备及存储介质 | |
CN106503471A (zh) | 基于电子病历的医疗数据查询系统及方法 | |
CN113657105A (zh) | 基于词汇增强的医学实体抽取方法、装置、设备及介质 | |
WO2023178978A1 (zh) | 基于人工智能的处方审核方法、装置、设备及介质 | |
RU2699607C2 (ru) | Повышение эффективности и уменьшение частоты последующих лучевых исследований путем прогнозирования основания для следующего исследования | |
CN113658662A (zh) | 基于用药大数据的配药方法、装置、设备及存储介质 | |
CN114141358A (zh) | 基于知识图谱的疾病诊断装置、计算机设备及存储介质 | |
CN116578704A (zh) | 文本情感分类方法、装置、设备及计算机可读介质 | |
CN114708976A (zh) | 辅助诊断技术的方法、装置、设备及存储介质 | |
CN116861875A (zh) | 基于人工智能的文本处理方法、装置、设备及存储介质 | |
CN116340778A (zh) | 基于多模态的医疗大模型构建方法及其相关设备 | |
CN111785340B (zh) | 一种医疗数据处理方法、装置、设备及存储介质 | |
CN117350291A (zh) | 一种电子病历命名实体识别方法、装置、设备及存储介质 | |
CN116796840A (zh) | 医疗实体信息抽取方法、装置、计算机设备及存储介质 | |
CN116702776A (zh) | 基于跨中西医的多任务语义划分方法、装置、设备及介质 | |
CN114461085A (zh) | 医疗输入推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |