CN117409921B - 疾病结论确定方法、装置以及存储介质 - Google Patents
疾病结论确定方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN117409921B CN117409921B CN202311723372.2A CN202311723372A CN117409921B CN 117409921 B CN117409921 B CN 117409921B CN 202311723372 A CN202311723372 A CN 202311723372A CN 117409921 B CN117409921 B CN 117409921B
- Authority
- CN
- China
- Prior art keywords
- positive
- conclusion
- candidate
- matching
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 107
- 201000010099 disease Diseases 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003745 diagnosis Methods 0.000 claims abstract description 74
- 238000013507 mapping Methods 0.000 claims abstract description 44
- 208000024891 symptom Diseases 0.000 claims abstract description 33
- 230000003902 lesion Effects 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 230000011218 segmentation Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 9
- 208000002151 Pleural effusion Diseases 0.000 description 45
- 238000000605 extraction Methods 0.000 description 25
- 210000004072 lung Anatomy 0.000 description 17
- 210000000056 organ Anatomy 0.000 description 17
- 210000004185 liver Anatomy 0.000 description 14
- 238000012795 verification Methods 0.000 description 11
- 206010035600 Pleural fibrosis Diseases 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 238000002059 diagnostic imaging Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 230000001502 supplementing effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000002308 calcification Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 210000000232 gallbladder Anatomy 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种疾病结论确定方法、装置以及存储介质。其中,一种疾病结论确定方法,包括:通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
Description
技术领域
本申请涉及医疗信息处理技术领域,特别是涉及一种疾病结论确定方法、装置以及存储介质。
背景技术
BERT、GPT和GLM等在大规模语料库上预训练的大型语言模型(LLM)已经能优秀地应对多种自然语言处理任务,在文本理解和文本生成方面表现突出,并且推理和逻辑能力也很好,尤其在数据处理能力、上下文理解能力、自然语言推理能力和语言生成能力等方面具有不错的优势。
随着模型规模的急剧增长,LLM还进一步获得了涌现能力,开拓了将LLM用作通用人工智能(AGI)的道路。ChatGPT和PaLM2等先进的LLM具有数百上千亿个参数,它们已有潜力解决许多复杂的实际任务,比如教育、代码生成和推荐。
但大型语言模型(LLM)也存在一定的不足,例如大型语言模型(LLM)的决策过程可能存在一些难以理解的因素,这使得模型的透明度相对较低。大型语言模型(LLM)是黑箱模型,缺乏可解释性,因此备受批评。大型语言模型(LLM)通过参数隐含地表示知识。因此,我们难以解释和验证大型语言模型(LLM)获得的知识。此外,大型语言模型(LLM)是通过概率模型执行推理,而这是一个非决断性的过程。对于大型语言模型(LLM)用以得出预测结果和决策的具体模式和功能,人类难以直接获得详情和解释。这可能会在某些场景中影响人们对模型的信任程度,尤其在医疗等高度敏感且风险接受度低的领域,将很大程度上限制其优势发挥。
与之相对应的是,知识图谱以三元组的形式存储巨量事实,(即头实体、关系、尾实体),因此知识图谱是一种结构化和决断性的知识表征形式,典型的知识图谱就是Wikidata。知识图谱对多种应用而言都至关重要,因为其能提供准确和明确的知识。此外,众所周知,它们还具有很棒的符号推理能力,这能生成可解释的结果。此外,通过让专家来构建特定领域的知识图谱,就能具备提供精确可靠的特定领域知识的能力,还能随着新知识的持续输入而积极演进。
但是知识图谱很难构建,由于真实世界知识图谱往往是不完备的,还会动态变化,因此当前的知识图谱构建方法难以应对。这些方法无法有效建模未见过的实体以及表征新知识。不仅如此,知识图谱的现有构建方法往往是针对特定知识图谱或任务定制的,泛化能力不足。
总而言之,大型语言模型(LLM)优点表现在一般知识、语言处理和泛化能力;缺点表现为隐含知识、不决断问题、黑箱和缺乏特定领域知识。知识图谱的优点表现在结构化知识、准确度、决断能力、可解释性、特定领域的知识和知识演进;缺点表现在不完备性、缺乏语言理解和未见知识。
在现有技术中,通常使用医学影像知识图谱或者自然语言处理(例如,大型语言模型(LLM)),来对医学影像诊断报告进行处理,从而根据医学影像诊断报告中所见的疾病征象得到疾病结论。
其中“医学影像诊断报告”是基于医学影像检查(例如DR、CT、MR和超声等)图像,由专业医生结合病史资料,根据医学图像观察的疑似病灶信息,通过医学影像诊断知识和经验以及医学逻辑推理,编写影像诊断的文本报告,内容一般包括“所见”(即,医学图像的征象描述)和“结论”(即,由征象描述推理的可能疾病结论),提供给临床医生和患者进一步检查和治疗。
医学影像诊断报告的编写和解读,都需要准确理解影像报告文本的逻辑关系,尤其是“所见”和“结论”中的阳性描述句(指疑似疾病或异常征象的描述内容)。医学影像诊断报告上下文中不同段落之间的阳性描述句,需要建立准确的映射关系。
但是,现有技术中的大型语言模型(LLM)由于具有上述的隐含知识、不决断问题、黑箱和缺乏特定领域知识等缺点,使得在处理医学影像诊断报告中的阳性描述句之间的逻辑关系时,准确度不够高,并且局限性较大,从而无法准确确定上下文中不同段落之间的阳性描述句的映射关系。
并且现有技术中的医学影像知识图谱由于具有上述的不完备性、缺乏语言理解和未见知识等缺点,使得医学影像知识图谱不够完整,并且医学影像知识图谱人工参与较多,使得映射关系为一对多或多对一或多对多时,其匹配准确度较差。
针对上述的现有技术中存在的通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题,目前尚未提出有效的解决方案。
发明内容
本申请的实施例提供了一种疾病结论确定方法、装置以及存储介质,以至少解决现有技术中存在的通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
根据本申请实施例的一个方面,提供了一种疾病结论确定方法,包括:通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
根据本申请实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上所述的方法。
根据本申请实施例的另一个方面,还提供了一种疾病结论确定装置,包括:第一确定模块,用于通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;第二确定模块,用于通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;第三确定模块,用于通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及第四确定模块,用于根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
根据本申请实施例的另一个方面,还提供了一种疾病结论确定装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
在本申请实施例中,服务器通过大型语言模型对医学影像诊断报告进行预处理,从而整理医学影像诊断报告中各个分句之间的逻辑关系,使得大型语言模型的问答模块可以根据已经确定的逻辑关系,更加准确和容易地对阳性描述句进行语义分析,从而准确确定上下文中不同段落之间的阳性描述句的映射关系,确定用于指示疾病结论的候选结论。并且本技术方案通过医学影像知识图谱,根据医学影像诊断报告中阳性描述句,确定用于指示疾病结论的匹配项,从而计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较,从而确定最终结论的方式,从而使得确定的最终结论更加准确。进而解决了现有技术中通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是用于实现根据本申请实施例1所述的方法的计算设备的硬件结构框图;
图2A是根据本申请实施例1所述的疾病结论确定系统的示意图;
图2B是根据本申请实施例1所述的服务器的模块示意图;
图3是根据本申请实施例1的第一个方面所述的疾病结论确定方法的流程示意图;
图4是根据本申请实施例1所述的疾病结论确定方法的另一个流程示意图;
图5是根据本申请实施例1所述的医学影像知识图谱的示意图;
图6A是根据本申请实施例1所述的疾病结论确定方法的整体流程示意图;
图6B是图6A中的所述的步骤S67用于确定最终结论的流程示意图;
图6C是图6B的所述的步骤S6713用于确定最终结论的流程示意图;
图7是根据本申请实施例2所述的疾病结论确定装置的示意图;以及
图8是根据本申请实施例3所述的疾病结论确定装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种疾病结论确定方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现疾病结论确定方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本申请实施例中的疾病结论确定方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的疾病结论确定方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2A是根据本实施例所述的疾病结论确定系统的示意图。参照图2A所示,该系统包括:影像科终端100、服务器200以及临床科终端300。
其中影像科医生通过影像科终端100编写关于患者的医学影像诊断报告,之后将医学影像诊断报告发送至服务器200。
参考图2B所示,服务器200设置有大型语言模型和医学影像知识图谱。其中大型语言模型包括:信息抽取模块、阴阳性判断模块和问答模块。
服务器200通过大型语言模型的信息抽取模块对医学影像诊断报告中的分句进行信息提取和确定分句之间的逻辑关系,从而生成规范文本。
进一步地,服务器200通过大型语言模型的阴阳性判断模块从规范文本中的规范分句确定阳性描述句。其中阳性描述句用于描述病变部位的疾病征象。
进一步地,服务器200通过大型语言模型的问答模块生成与阳性描述句对应的候选结论,并将阳性描述句与对应的候选结论建立映射关系。其中候选结论用于指示根据阳性描述句推测的疾病结论。
进一步地,服务器200通过医学影像知识图谱生成与阳性描述句对应的匹配项。其中匹配项用于指示根据阳性描述句匹配的可能的疾病结论。
进一步地,服务器200计算阳性描述句的匹配项和候选结论之间的匹配值,根据匹配值确定最终确定的疾病结论(即,最终结论)。
进一步地,服务器200将阳性描述句和相应的最终结论进行整理,从而形成便于临床医生查看的最终报告,并将该最终报告发送至临床医生的临床科终端300。
此外,图5示出了部分医学影像知识图谱,参考图5所示,医学影像知识图谱包括多个类型的关键词,分别为主部位、一级部位、二级部位、征象描述以及结论。其中主部位、一级部位和二级部位都用于描述人体的器官,并且其中一级部位为主部位的下级关键词,二级部位为一级部位的下级关键词。并且征象描述为二级部位的下级关键词,结论为征象描述的下级关键词。
从而服务器200可以根据关键词匹配的方式,在医学影像知识图谱中确定疾病的结论,并将该结论作为匹配项。
此外,工作人员可以根据实际情况,在医学影像知识图谱中添加其他类型的关键词,例如修饰描述、定性描述、关系描述和位置描述等。此处不作具体限定。
需要说明的是,系统中的影像科终端100、服务器200以及临床科终端300均可适用上面所述的硬件结构。
在上述运行环境下,根据本实施例的第一个方面,提供了一种疾病结论确定方法,该方法由图2A中所示的服务器实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:
S302:通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;
S304:通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;
S306:通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及
S308:根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
具体地,影像科医生通过影像科终端100编写关于患者的医学影像诊断报告,之后将医学影像诊断报告发送至服务器200。
参考图4所示,服务器200接收到医学影像诊断报告后,将医学影像诊断报告输入大型语言模型,根据大型语言模型的信息抽取模块和阴阳性判断模块对医学影像诊断报告进行预处理。
具体地,大型语言模型的信息抽取模块对医学影像诊断报告进行分句和分词处理。之后信息抽取模块根据分句处理后得到的分句,分析各个分句之间的逻辑关系。其中逻辑关系例如可以包括递进关系、顺承关系、并列关系以及转折关系等。之后信息抽取模块根据分句之间的逻辑关系,对各个分句之间的顺序进行排列整理,从而生成分句之间逻辑关系分明的规范文本。之后信息抽取模块将规范文本发送至大型语言模型的阴阳性判断模块。
进一步地,大型语言模型的阴阳性判断模块接收到规范文本后,根据规范文本中的各个分句中的分词类型,判断各个分句是否为阳性描述句。其中阳性描述句用于描述病变部位的征象。
例如,当某个分句包括“可见”、“多发”以及“钙化影”等用于描述病变部位的征象等阳性词汇,则将个分句作为阳性描述句(S302)。
从而阴阳性判断模块通过上述方法判断规范文本中各个分句是否为阳性描述句,并将确定的阳性描述句输入大型语言模型的问答模块。
进一步地,大型语言模型的问答模块对阳性描述句进行语义分析,从而输出与阳性描述句对应的候选结论。其中候选结论可以为不同的多个候选结论,用于指示可能的疾病结论。
例如,问答模块对阳性描述句“左膈面显示欠清”进行语义分析,输出的可能的疾病结论(即,候选结论)有三个,分别为:“左侧胸膜增厚”、“左侧胸腔积液”和“左侧胸腔积气”。
又例如,问答模块对阳性描述句“左肋膈角变钝”进行语义分析,输出的可能的疾病结论(即,候选结论)为“左侧胸腔积液”。
进一步地,服务器200将阳性描述句和对应的候选结论建立映射关系。例如服务器200将阳性描述句“左膈面显示欠清”与对应的候选结论“左侧胸膜增厚”、“左侧胸腔积液”和“左侧胸腔积气”建立映射关系,将阳性描述句“左肋膈角变钝”和对应的候选结论“左侧胸腔积液”建立映射关系(S304)。之后服务器200将各个阳性描述句输入预设的医学影像知识图谱。
进一步地,服务器200将阳性描述句中的分词与医学影像知识图谱中的关键词进行匹配,从而确定与阳性描述句对应的匹配项。其中匹配项为可能的疾病结论。
例如,阳性描述句“左肋膈角变钝”中的分词包括“左肋膈角”和“变钝”。则参考图5所示,服务器200根据分词“左肋膈角”在医学影像知识图谱中进行匹配,匹配到医学影像知识图谱中的关键词“左肋膈角”,根据分词“变钝”在医学影像知识图谱中进行匹配,匹配到医学影像知识图谱中的关键词“变钝”。之后服务器200在医学影像知识图谱中确定关键词“左肋膈角”和“变钝”共同的下级关键词为“左侧胸腔积液”,将关键词“左侧胸腔积液”和相应的候选结论“左侧胸腔积液”进行匹配,根据匹配结果将关键词“左侧胸腔积液”确定为阳性描述句“左肋膈角变钝”的匹配项。
进一步地,服务器200获取与阳性描述句“左肋膈角变钝”对应的候选结论“左侧胸腔积液”,并获取与阳性描述句“左肋膈角变钝”对应的匹配项“左侧胸腔积液”,之后计算候选结论“左侧胸腔积液”与匹配项“左侧胸腔积液”之间的匹配值。当匹配值超过第一预设阈值的情况下,将候选结论“左侧胸腔积液”作为最终结论。其中最终结论用于指示最终确定的疾病结论。即,服务器200确定与用于描述病症征象的阳性描述句“左肋膈角变钝”对应的最终疾病结论为“左侧胸腔积液”。
进一步地,服务器200将阳性描述句和相应的最终结论进行整理,从而形成便于临床医生查看的最终报告,并将该最终报告发送至临床医生的临床科终端300。
正如背景技术中所述的,但是,现有技术中的大型语言模型(LLM)由于上述的隐含知识、不决断问题、黑箱、缺乏特定领域知识等缺点,使得在处理医学影像诊断报告中的阳性描述句之间的逻辑关系时,准确度不够高,并且局限性较大,从而无法准确确定上下文中不同段落之间的阳性描述句的映射关系。并且现有技术中的医学影像知识图谱由于上述的不完备性、缺乏语言理解和未见知识等缺点,使得医学影像知识图谱不够完整,并且医学影像知识图谱人工参与较多,使得映射关系为一对多或多对一或多对多时,其匹配准确度较差。
针对以上所述的技术问题,通过本申请实施例的技术方案,服务器通过大型语言模型对医学影像诊断报告进行预处理,从而整理医学影像诊断报告中各个分句之间的逻辑关系,使得大型语言模型的问答模块可以根据已经确定的逻辑关系,更加准确和容易地对阳性描述句进行语义分析,从而准确确定上下文中不同段落之间的阳性描述句的映射关系,确定用于指示疾病结论的候选结论。并且本技术方案通过医学影像知识图谱,根据医学影像诊断报告中阳性描述句,确定用于指示疾病结论的匹配项,从而计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较,从而确定最终结论的方式,从而使得确定的最终结论更加准确。进而解决了现有技术中通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
可选地,通过大型语言模型对医学影像诊断报告进行预处理确定阳性描述句的操作,包括:通过大型语言模型对医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对多个分句进行整理,生成规范文本;以及根据规范文本中的多个分句的分词类型,确定阳性描述句。
具体地,服务器200将医学影像诊断报告输入大型语言模型后,大型语言模型的信息抽取模块对医学影像诊断报告进行分句和分词处理。
之后信息抽取模块根据各个分句中的分词,确定分词的类型,以及根据分词的类型确定分句之间的关系。例如预先设定的词库中包括病理征象和组织器官等类型的分词。信息抽取模块将各个分句中的分词与词库中的分词进行匹配,从而确定分词的类型。
进一步地,信息抽取模块在确定了各个分句中分词的类型之后,根据分句中分词的类型,确定分词之间的关系,例如病理征象类型的分词与器官类型的分词之间的关系,以及器官类型的分词与器官类型的分词之间的关系等,进而根据所确定的分词之间的关系确定分句之间的逻辑关系。其中逻辑关系例如可以包括递进关系、顺承关系、并列关系以及转折关系等。
例如,医学影像诊断报告1为:肝脏边缘光滑,各叶大小比例正常,肝实质内密度均匀,未见明显异常组织密度影及占位性病变。胆囊不大,壁厚薄均匀,未见阳性结石影。胰腺大小、形态及密度正常。脾不大,实质密度均匀。
信息抽取模块判定分句“肝脏边缘光滑”中器官类型的分词“肝脏”与分句“各叶大小比例正常”中器官类型的分词“各叶”存在从属关系。分句“肝脏边缘光滑”中器官类型的分词“肝脏”与分句“肝实质内密度均匀”中器官类型的分词“肝实质”存在从属关系。并且分句“各叶大小比例正常”中器官类型的分词“各叶”与分句“肝实质内密度均匀”中器官类型的分词“肝实质”存在从属关系。
并且分句“肝脏边缘光滑”中器官类型的分词“肝脏”和病理征象类型的分词“边缘光滑”之间存在阴性关系。分句“各叶大小比例正常”中器官类型的分词“各叶”和病理征象类型的分词“大小比例正常”之间存在阴性关系。分句“肝实质内密度均匀”同理。其中阴性关系用于指示描述器官未病变的征象。
从而信息抽取模块确定分句“肝脏边缘光滑”与分句“各叶大小比例正常”、分句“肝实质内密度均匀”为顺承关系。
同理,信息抽取模块根据上述的根据分词的类型确定分句之间的逻辑关系的方法,确定分句“肝脏边缘光滑”与分句“胆囊不大”、“胰腺大小、形态及密度正常”、分句“脾不大,实质密度均匀”为并列关系。
此外,信息抽取模块还会通过关联词确定分句之间的逻辑关系。其中关联词例如可以包括:“不但”、“而且”、“但是”和“或者”等等。
进一步地,信息抽取模块根据医学影像诊断报告中的各个分句之间的逻辑关系,对各个分句之间的顺序进行排列整理,从而生成逻辑关系分明的第一规范文本。之后信息抽取模块将第一规范文本的各个分句中的不必要的分词进行舍弃,将必要的分词进行抽取,从而生成规范分句。
此外,又例如,医学影像诊断报告2为逻辑关系整理后的第一规范文本。
其中,医学影像诊断报告2为:右膈肌光滑,膈下未见游离气体影。左膈面显示欠清,左肋膈角变钝,左下肺野见团块影。
信息抽取模块将各个分句中的不必要的分词进行舍弃,将必要的分词进行抽取,从而生成规范分句。
例如,分句“右膈肌光滑”中,信息抽取模块判定分词“肌”为不必要的分词,分词“右膈”和“光滑”为必要的分词,从而将分词“肌”进行舍弃,将分词“右膈”和“光滑”进行抽取,从而生成的规范分句为“右膈光滑”。
分句“左膈面显示欠清”中,信息抽取模块判定分词“面”和“显示”为不必要的分词,分词“左膈”和“欠清”为必要的分词,从而将分词“面”和“显示”进行舍弃,将分词“左膈”和“欠清”进行抽取,从而生成的规范分句为“左膈欠清”。
从而信息抽取模块根据上述的生成规范分句的方法,将医学影像诊断报告2中所有的分句都生成相应的规范分句,从而生成的规范分句分别为:
(1)右膈光滑;
(2)膈下未见游离气体影;
(3)左膈欠清;
(4)左肋膈角变钝;
(5)左下肺野见团块影。
进一步地,信息抽取模块根据规范分句生成第二规范文本。之后信息抽取模块将第二规范文本发送至大型语言模型的阴阳性判断模块。
进一步地,大型语言模型的阴阳性判断模块接收到第二规范文本后,根据规范文本中的各个分句中的分词类型,判断各个分句是阳性描述句还是阴性描述句。其中阳性描述句用于描述病变部位的征象,阴性描述句用于描述未病变部位的征象。
例如,描述病变部位的征象的分句,或者分句中包括“可见”、“多发”以及“钙化影”等用于描述病变部位的征象等阳性词汇,则将该分句作为阳性描述句。描述未病变部位的征象的分句,或者分句中包括“无”、“未见”、“清晰”等阴性词汇,则将该分句作为阴性描述句。
从而,本技术方案通过将医学影像诊断报告转化为规范的结构化的格式,使得大型语言模型能够更好地理解文本中的内容,从而可以更好地处理文本中描述的医学概念,同时能够根据得到的逻辑关系对文本的描述顺序进行重新排序,能够规范化对医学影像诊断报告的描述。
可选地,通过大型语言模型根据阳性描述句确定候选结论的操作,包括:通过大型语言模型的问答模块对阳性描述句进行语义分析,生成相应的候选结论。
具体地,服务器200预先训练的大型语言模型的问答模块用于根据阳性描述句生成相应的疾病结论。
阴阳性判断模块将阳性描述句输入问答模块,问答模块对阳性描述句进行分词,并对分词进行编码。
例如输入问答模块的阳性描述句为“左膈欠清”,问答模块对该阳性描述句进行分词处理后得到的分词包括“左膈”和“欠清”,之后生成与各个分词对应的独热编码,之后通过词嵌入方式将独热编码生成词向量。
进一步地,问答模块通过注意力机制对于分词对应的词向量进行语义分析,将语义分析后的词向量在预设的问答库中进行检索,从而生成与阳性描述句“左膈欠清”对应的候选结论,例如候选结论为“左侧胸腔积液”、“左侧胸膜增厚”以及“左侧胸腔积气”。其中候选结论可以为多个,并且候选结论用于指示可能的疾病结论。
进一步地,阴阳性判断模块将其他的阳性描述句分别输入问答模块中,从而问答模块根据上述的生成候选结论的方法,生成各个阳性描述句相应的候选结论。例如阳性描述句“左肋膈角变钝”的候选结论为“左侧胸腔积液”,阳性描述句“左下肺野团块影”的候选结论为“左下肺占位”。
从而,本技术方案根据医学知识训练完成的大型语言模型,通过强大的语言理解能力,准确地生成与各个阳性描述句对应的候选结论,从而提高了确定的疾病结论的准确度。
可选地,通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项的操作,包括:通过医学影像知识图谱对阳性描述句的分词进行匹配,得到相应的匹配项。
具体地,服务器200将阳性描述句中的分词输入至医学影像知识图谱,医学影像知识图谱输出相应的结论,之后服务器200将该结论和与阳性描述句对应的候选结论进行比较,从而确定与该候选结论对应的匹配项。其中在候选结论为多个的情况下,每个候选结论对应于一个匹配项。
例如服务器200将阳性描述句“左肋膈角变钝”输入至医学影像知识图谱中,将分句中的器官类型的分词“左肋膈角”与医学影像知识图谱中的关键词进行匹配。从而服务器200在医学影像知识图谱中的二级部位类型的关键词中匹配到关键词“左肋膈角”,之后将分句中的征象类型的分词“变钝”与医学影像知识图谱中的与关键词“左肋膈角”关联的征象描述类型的关键词进行匹配。其中征象描述类型的关键词为二级部位类型的关键词的下级关键词。
其中,参考图5所示,与关键词“左肋膈角”关联的征象描述类型的关键词至少包括:“变钝”、“模糊”以及“结节”。
从而,服务器200将征象类型的分词“变钝”分别与关键词“变钝”、“模糊”以及“结节”进行匹配,从而服务器200在医学影像知识图谱的征象描述类型的关键词中匹配到关键词“变钝”。在阳性描述句“左肋膈角变钝”中分词都匹配完成后,确定与征象描述类型的关键词“变钝”关联的结论类型的关键词为:“左侧胸腔积液”。
之后服务器200计算结论类型的关键词为“左侧胸腔积液”与候选结论“左侧胸腔积液”之间的相似度,当相似度值大于预定阈值(例如0.5),则将结论类型的关键词为“左侧胸腔积液”作为阳性描述句“左肋膈角变钝”的匹配项。
当相似度值小于预定阈值的情况下,则判定阳性描述句“左肋膈角变钝”的候选结论“左侧胸腔积液”无匹配项。
又例如,服务器200将阳性描述句“左下肺野团块影”输入至医学影像知识图谱中,将分句中的器官类型的分词“左下肺野”与医学影像知识图谱中的关键词进行匹配。从而服务器200在医学影像知识图谱中二级部位类型的关键词中匹配到关键词“左下肺野”,之后将分句中的征象类型的分词“团块影”与医学影像知识图谱中的与关键词“左下肺野”关联的征象描述类型的关键词进行匹配。其中征象描述类型的关键词为二级部位类型的关键词的下级关键词。
其中,参考图5所示,与关键词“左下肺野”关联的征象描述类型的关键词至少包括:“团块影”以及“斑片状高密度影”。
从而,服务器200将征象类型的分词“团块影”分别与关键词“团块影”、以及“斑片状高密度影”进行匹配,从而服务器200在医学影像知识图谱的征象描述类型的关键词中匹配到关键词“团块影”。在阳性描述句“左下肺野团块影”中分词都匹配完成后,确定与征象描述类型的关键词“团块影”关联的结论类型的关键词为“左下肺占位”。
之后服务器200计算结论类型的关键词为“左下肺占位”与候选结论“左下肺占位”之间的相似度,当相似度值大于预定阈值(例如0.5),则将结论类型的关键词为“左下肺占位”作为阳性描述句“左下肺野团块影”的匹配项。
当相似度值小于预定阈值的情况下,则判定阳性描述句“左下肺野团块影”的候选结论“左下肺占位”无匹配项。
此外,在医学影像知识图谱中,一个阳性描述句对应的结论可能为多个。例如,服务器200将阳性描述句“左膈欠清”输入至医学影像知识图谱中,将分句中的器官类型的分词“左膈”与医学影像知识图谱中的关键词进行匹配。从而服务器200在医学影像知识图谱中一级部位类型的关键词中匹配到关键词“左膈”,之后将分句中的征象类型的分词“欠清”与医学影像知识图谱中的与关键词“欠清”关联的征象描述类型的关键词进行匹配。其中征象描述类型的关键词为一级部位类型的关键词的下级关键词。
其中,参考图5所示,与关键词“左膈”关联的征象描述类型的关键词至少包括:“欠清”、“抬高”以及“幕状粘连”。
从而,服务器200将征象类型的分词“欠清”分别与关键词“欠清”、“抬高”以及“幕状粘连”进行匹配,从而服务器200在医学影像知识图谱的征象描述类型的关键词中匹配到关键词“欠清”。在阳性描述句“左膈欠清”中分词都匹配完成后,确定与征象描述类型的关键词“欠清”关联的结论类型的关键词为:“左侧胸腔积液”、“左侧胸膜增厚”以及“左侧胸腔积气”。
进一步地,服务器200分别计算结论类型的关键词:“左侧胸腔积液”、“左侧胸膜增厚”以及“左侧胸腔积气”与候选结论的相似度值,从而为每个候选结果确定相应的匹配项。
例如,阳性描述句“左膈欠清”的候选结论为分别为:“左侧胸腔积液”、“左侧胸膜增厚”以及“左侧胸腔积气”。
从而服务器200分别计算候选结论“左侧胸腔积液”与结论类型的关键词:“左侧胸腔积液”、“左侧胸膜增厚”以及“左侧胸腔积气”之间的相似度值,从而将相似度值最高并且该相似度值大于预设阈值(例如0.5)的结论类型的关键词确定为与候选结论“左侧胸腔积液”对应的匹配项。
当该相似度值小于预设阈值(例如0.5)的结论类型的关键词时,则候选结论“左侧胸腔积液”无匹配项。
从而通过上述确定匹配项的方法,从结论类型的关键词中,分别为候选结论“左侧胸膜增厚”以及“左侧胸腔积气”确定对应的匹配项。
从而,本技术方案通过医学影像知识图谱确定阳性描述句的匹配项,从而可以将确定匹配项的过程明确展示,具有可解释性,弥补了大型语言模型隐含知识、不决断问题和黑箱等缺点。
可选地,根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论的操作,包括:获取与阳性描述句存在映射关系的候选结论;获取与阳性描述句的候选结论对应的匹配项;以及根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论。
具体地,例如,阳性描述句标识为阳性描述语句A,其对应的候选结论为a1,i,与其对应的匹配项为a2,i,其中i为自然数,且i=n,n表示候选结论的数量。
服务器200根据预设的匹配值计算方法分别计算候选结论a1,i和匹配项a2,i的匹配值bi。其中通过匹配值计算方法计算匹配值的方式可以为通过计算余弦相似度和评分函数计算匹配值。其中评分函数会考虑不同的权重,如关键词在训练数据中出现的次数(关键词出现次数多则说明将相应的症状判定为某种病症的概率较高)。
之后服务器200判断匹配值为bi是否大于或者等于第一预设阈值,之后将大于或者等于第一预设阈值的匹配值进行排序。并且计算最高匹配值和次高匹配值之间的差值。
当差值大于或者等于第二预设阈值(例如,第二预设阈值为0.2)时,服务器200则将与最高匹配值对应的候选结论作为与阳性描述语句A对应的最终结论。
当差值小于第二预设阈值时,服务器200则将与最高匹配值对应的候选结论作为最优匹配候选项。其中,第一预设阈值>第二预设阈值。
进一步地,服务器200将最优匹配候选项Z作为阳性描述句,并将该阳性描述句输入大型语言模型的问答模块,由问答模块输出与该阳性描述句对应的候选结论,并且将该阳性描述句与候选结论建立映射关系。之后服务器200将该阳性描述句输入医学影像知识图谱,从而确定相应的匹配项。然后服务器200计算候选结论与匹配项之间的匹配值。在匹配值小于第一预设阈值,或者差值小于第二预设阈值的情况下,服务器200则判定没有与该阳性描述句对应的病症,则由工作人员校验最优匹配候选项Z。当工作人员的校验结果为最优匹配候选项Z错误,则放弃为阳性描述语句A确定最终结论。
当校验结果为最优匹配候选项Z正确,则将最优匹配候选项Z补充至医学影像知识图谱中。
例如,与阳性描述句“左肋膈角变钝”(即,阳性描述句)对应的候选结论为“左侧胸腔积液”,与阳性描述句“左肋膈角变钝”的候选结论“左侧胸腔积液”对应的匹配项为“左侧胸腔积液”。
服务器200获取与阳性描述句“左肋膈角变钝”(即,阳性描述句)对应的候选结论“左侧胸腔积液”以及对应的匹配项“左侧胸腔积液”。
进一步地,服务器200通过预设的匹配值计算方法计算候选结论“左侧胸腔积液”与匹配项“左侧胸腔积液”的匹配值。
进一步地,服务器200将候选结论“左侧胸腔积液”与匹配项“左侧胸腔积液”的匹配值与第一预设阈值进行比较。在匹配值大于或者等于第一预设阈值的情况下,服务器200将候选结论“左侧胸腔积液”作为与阳性描述句“左肋膈角变钝”(即,阳性描述句)对应的最终结论。
从而,本技术方案通过计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较确定最终结论的方式,从而使得最终结论的确定更加准确。
可选地,根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论的操作,包括:在阳性描述句的候选结论为一项的情况下,根据预设的匹配值计算方法计算候选结论与相应的匹配项之间的匹配值;以及在匹配值大于第一预设阈值的情况下,将候选结论作为最终结论。
具体地,参考图6A以及图6B所示,例如,阳性描述语句A对应的候选结论为a1,1,与候选结论为a1,1对应的匹配项为a2,1。其中与阳性描述句A对应的候选结论与匹配项都为一项(S6701、S6706和S6707)。
进一步地,服务器200根据预设的匹配值计算方法计算候选结论a1,1和匹配项a2,1的匹配值b1(S6708)。
进一步地,服务器200将匹配值b1是否与第一阈值进行比较,从而判断匹配值b1是否大于或者等于第一预设阈值(S6709)。
当匹配值b1大于或者等于第一预设阈值(例如,第一预设阈值为0.6),则将候选结论a1,1作为与阳性描述语句A对应的最终结论(S6710)。
当匹配值b1,1小于第一预设阈值(例如,第一预设阈值为0.6)时,则由工作人员校验该与阳性描述语句A对应的候选结论a1,1(S6711)。
当校验结果为候选结论a1,1错误,则放弃为阳性描述语句A确定最终结论。
当校验结果为候选结论a1,1正确,则将候选结论a1,1补充至医学影像知识图谱中。
此外,当阳性描述语句A对应的候选结论为a1,1,并且没有对应的匹配项的情况下(S6701~S6702),由工作人员校验该与阳性描述语句A对应的候选结论a1,1(S6703)。当校验结果为候选结论a1,1错误,则放弃为阳性描述语句A确定最终结论(S6704)。当校验结果为候选结论a1,1正确,则将候选结论a1,1补充至医学影像知识图谱中(S6705)。
此外,在与阳性描述句A对应的候选结论和匹配项都为一项的情况下,工作人员可以根据医学影像知识图谱和大型语言模型的各自的效果,选择候选结论或者匹配项作为与阳性描述语句对应的最终结论。即,将候选结论作为与阳性描述语句对应的最终结论,或者将匹配项作为与阳性描述语句对应的最终结论,此处不作具体限定。
从而本技术方案通过计算候选结论和匹配项之间的匹配值,既确定了最终结论,又论证了医学影像知识图谱中的结论类型的关键词是否正确,从而可以完善医学影像知识图谱,使得医学影像知识图谱在后续确定结论时更加准确。
可选地,根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论的操作,还包括:在阳性描述句的候选结论为多项的情况下,分别计算候选结论与相应的匹配项之间的匹配值;以及根据与最高匹配值对应的候选结论确定最终结论。
具体地,参考图6A~6C所示,例如,阳性描述语句A对应的候选结论为a1,i,与候选结论为a1,i对应的匹配项为a2,i,其中i为自然数,且i=n,n表示候选结论的数量。其中与阳性描述句A对应的候选结论为多项,每一项候选结论对应于一个匹配项(S6712)。
服务器200根据预设的匹配值计算方法分别计算候选结论a1,i和匹配项a2,i的匹配值bi(S671301)。
例如,n=4,从而候选结论分别为a1,1,a1,2,a1,3,a1,4,相应的匹配项分别为a2,1,a2,2,a2,3,a2,4。
并且候选结论a1,1和匹配项a2,1的匹配值为b1,候选结论a1,2和匹配项a2,2的匹配值为b2,候选结论a1,3和匹配项a2,3的匹配值为b3,候选结论a1,4和匹配项a2,4的匹配值为b4。
之后服务器200判断匹配值bi是否等于1。当服务器200判定匹配值bi等于1时,即候选结论与匹配项完全相同,则将与匹配值bi对应的候选结论a1,i作为与阳性描述语句A对应的最终结论。其中在与阳性描述句A对应的候选结论为多项的情况下,多个匹配值中最多只有一个匹配值等于1。
进一步地,当服务器200判定匹配值bi不等于1时,则判断匹配值bi是否大于或者等于第一预设阈值(例如,第一预设阈值为0.6),当大于或者等于第一预设阈值的匹配值bi的数量为1时,则将与该匹配值bi对应的候选结论a1,i作为与阳性描述语句A对应的最终结论(S671302、S671303、S671304和S671305)。例如,在配置b1~b4中,只有匹配值b1大于或者等于第一预设阈值,则将与该匹配值b1对应的候选结论a1,1作为与阳性描述语句A对应的最终结论。
当大于或者等于第一预设阈值的匹配值bi的数量为0时,则由工作人员校验该多个候选结论和相应的多个匹配项(S671306、S671307和S671310)。当匹配项的校验结果为匹配项错误,则将医学影像知识图谱中与错误的匹配项对应的关键词删除(S671308)。当匹配项的校验结果为匹配项正确,则将正确的匹配项作为与阳性描述语句A(即,阳性描述句)对应的最终结论之一(S671309)。当某个候选结论的校验结果为候选结论正确,则将正确的候选结论补充至医学影像知识图谱中,并将正确的候选结论作为与阳性描述语句A(即,阳性描述句)对应的最终结论之一(S671310和S671312)。从而服务器200则将正确的候选结论和正确的匹配项都作为与阳性描述语句A(即,阳性描述句)对应的最终结论。
当校验结果为候选结论和多个匹配项全部错误,则放弃为阳性描述语句A确定最终结论(S671311)。
当匹配值b1~b4中大于或者等于第一预设阈值的匹配值数量大于1时,服务器200则将大于或者等于第一预设阈值的匹配值进行排序。并且计算最高匹配值和次高匹配值之间的差值(S671313)。例如,当匹配值b1、b2和b3,都大于或者等于第一预设阈值,匹配值b4小于第一预设阈值时,服务器200将匹配值b1,b2,b3进行比较并排序。当排序结果为b1>b2>b3,则舍弃匹配值b3,计算最高匹配值b1和次高匹配值b2之间的差值。
进一步地,服务器200将差值与第二预设阈值进行比较,判断该差值是否大于或者等于第二预设阈值(S671314)。
当差值大于或者等于第二预设阈值(例如,第二预设阈值为0.2)时,服务器200则将与最高匹配值b1对应的候选结论a1,1作为与阳性描述语句A(即,阳性描述句)对应的最终结论(S671315)。
当差值小于第二预设阈值时,服务器200则将与最高匹配值b1对应的候选结论a1,1作为最优匹配候选项Z(S671316)。其中,第一预设阈值>第二预设阈值。
进一步地,服务器200判断与最优匹配候选项Z对应的阳性描述句A是否曾经作为最优匹配候选项(S671317)。当服务器200判定阳性描述句A并不是由最优匹配候选项生成的,则服务器200将最优匹配候选项Z作为阳性描述句B(S671322),并将该阳性描述句B输入大型语言模型的问答模块,由问答模块输出与该阳性描述句B对应的候选结论(S64),并且将该阳性描述句B与候选结论建立映射关系(S65)。之后服务器200将该阳性描述句B输入医学影像知识图谱,从而确定与所述候选结论对应的匹配项(S66)。然后服务器200计算候选结论与匹配项之间的匹配值。在匹配值小于第一预设阈值,或者差值小于第二预设阈值的情况下,服务器200则判定没有与该阳性描述句B对应的病症,不再将阳性描述句B的最优匹配候选项输入问答模块,对阳性描述句进行迭代。
则由工作人员校验最优匹配候选项Z(S671318)。当校验结果为最优匹配候选项Z错误,则放弃为阳性描述语句A确定最终结论(S671319和S671321)。
当校验结果为最优匹配候选项Z正确,则将最优匹配候选项Z补充至医学影像知识图谱中(S671320)。
此外,当阳性描述语句A对应的候选结论为a1,1~a1,4,并且都没有对应的匹配项的情况下,由工作人员校验该与阳性描述语句A对应的候选结论a1,1~a1,4。当校验结果为候选结论a1,1~a1,4都错误,则放弃为阳性描述语句A确定最终结论。当校验结果为候选结论a1,1~a1,4中至少一个正确,则将其中正确的候选结论补充至医学影像知识图谱中,并将正确的候选结论作为与阳性描述语句A对应的最终结论。
从而本技术方案通过计算候选结论和匹配项之间的匹配值,既确定了最终结论,又论证了医学影像知识图谱中的结论类型的关键词是否正确,从而可以完善医学影像知识图谱,使得医学影像知识图谱在后续确定结论时更加准确。
此外,参考图6A所示,本技术方案根据医学影像诊断报告确定疾病结论的顺序步骤如下:
S61:影像科医生通过影像科终端100将编写的医学影像诊断报告发送至服务器200;
S62:服务器200的大型语言模型的信息抽取模块根据医学影像诊断报告中分句的逻辑关系,生成规范文本;
S63:服务器200的大型语言模型的阴阳性判断模块根据规范文本中的分句确定阳性描述句;
S64:服务器200的大型语言模型的问答模块生成与阳性描述句对应的候选结论;
S65:服务器200将阳性描述句和其对应的候选结论建立映射关系;
S66:服务器200将阳性描述句输入医学影像知识图谱,确定与阳性描述句的候选结论对应的匹配项;
S67:服务器200计算与阳性描述句对应的候选结论和匹配项之间的匹配值,根据匹配值确定最终结论;
S68:服务器200将阳性描述句以及相应的最终结论进行整理,从而形成便于临床医生查看的最终报告,并且将该最终报告发送至临床医生的临床科终端300。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上所述的方法。
从而根据本实施例,服务器通过大型语言模型对医学影像诊断报告进行预处理,从而整理医学影像诊断报告中各个分句之间的逻辑关系,使得大型语言模型的问答模块可以根据已经确定的逻辑关系,更加准确和容易地对阳性描述句进行语义分析,从而准确确定上下文中不同段落之间的阳性描述句的映射关系,确定用于指示疾病结论的候选结论。并且本技术方案通过医学影像知识图谱,根据医学影像诊断报告中阳性描述句,确定用于指示疾病结论的匹配项,从而计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较,从而确定最终结论的方式,从而使得确定的最终结论更加准确。进而解决了现有技术中通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图7示出了根据本实施例所述的疾病结论确定装置700,该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示,该装置700包括:第一确定模块710,用于通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;第二确定模块720,用于通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;第三确定模块730,用于通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及第四确定模块740,用于根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
可选地,第一确定模块710,包括:第一生成子模块,用于通过大型语言模型对医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对多个分句进行整理,生成规范文本;以及第一确定子模块,用于根据规范文本中的多个分句的分词类型,确定阳性描述句。
可选地,第二确定模块720,包括:第二生成子模块,用于通过大型语言模型的问答模块对阳性描述句进行语义分析,生成相应的候选结论。
可选地,第三确定模块730,包括:第一匹配子模块,用于通过医学影像知识图谱对阳性描述句的分词进行匹配,得到相应的匹配项。
可选地,第四确定模块740,包括:第一获取子模块,用于获取与阳性描述句存在映射关系的候选结论;第二获取子模块,用于获取与阳性描述句的候选结论对应的匹配项;第二确定子模块,用于根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论。
可选地,第二确定子模块,包括:第一计算单元,用于在阳性描述句的候选结论为一项的情况下,根据预设的匹配值计算方法计算候选结论与相应的匹配项之间的匹配值;以及第一确定单元,用于在匹配值大于第一预设阈值的情况下,将候选结论作为最终结论。
可选地,第二确定子模块,还包括:第二计算单元,用于在阳性描述句的候选结论为多项的情况下,分别计算候选结论与相应的匹配项之间的匹配值;以及第二确定单元,用于根据与最高匹配值对应的候选结论确定最终结论。
从而根据本实施例,服务器通过大型语言模型对医学影像诊断报告进行预处理,从而整理医学影像诊断报告中各个分句之间的逻辑关系,使得大型语言模型的问答模块可以根据已经确定的逻辑关系,更加准确和容易地对阳性描述句进行语义分析,从而准确确定上下文中不同段落之间的阳性描述句的映射关系,确定用于指示疾病结论的候选结论。并且本技术方案通过医学影像知识图谱,根据医学影像诊断报告中阳性描述句,确定用于指示疾病结论的匹配项,从而计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较,从而确定最终结论的方式,从而使得确定的最终结论更加准确。进而解决了现有技术中通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
实施例3
图8示出了根据本实施例所述的疾病结论确定装置800,该装置800与根据实施例1的第一个方面所述的方法相对应。参考图8所示,该装置800包括:处理器810;以及存储器820,与处理器810连接,用于为处理器810提供处理以下处理步骤的指令:通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中阳性描述句用于描述病变部位的征象;通过大型语言模型根据阳性描述句确定候选结论,并且将各个阳性描述句与候选结论建立映射关系,其中候选结论用于指示根据阳性描述句推测的疾病结论;通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项,其中匹配项用于指示根据阳性描述句匹配到的疾病结论;以及根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中最终结论用于指示最终确定的疾病结论。
可选地,通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句的操作,包括:通过大型语言模型对医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对多个分句进行整理,生成规范文本;以及根据规范文本中的多个分句的分词类型,确定阳性描述句。
可选地,通过大型语言模型根据阳性描述句确定候选结论的操作,包括:通过大型语言模型的问答模块对阳性描述句进行语义分析,生成相应的候选结论。
可选地,通过预设的医学影像知识图谱,根据阳性描述句确定相应的匹配项的操作,包括:通过医学影像知识图谱对阳性描述句的分词进行匹配,得到相应的匹配项。
可选地,根据阳性描述句相应的匹配项和与阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论的操作,包括:获取与阳性描述句存在映射关系的候选结论;获取与阳性描述句的候选结论对应的匹配项;根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论。
可选地,根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论的操作,包括:在阳性描述句的候选结论为一项的情况下,根据预设的匹配值计算方法计算候选结论与相应的匹配项之间的匹配值;以及在匹配值大于第一预设阈值的情况下,将候选结论作为最终结论。
可选地,根据预设的匹配值计算方法计算匹配项和候选结论之间的匹配值,并且根据匹配值确定与阳性描述句对应的最终结论的操作,还包括:在阳性描述句的候选结论为多项的情况下,分别计算候选结论与相应的匹配项之间的匹配值;以及根据与最高匹配值对应的候选结论确定最终结论。
从而根据本实施例,服务器通过大型语言模型对医学影像诊断报告进行预处理,从而整理医学影像诊断报告中各个分句之间的逻辑关系,使得大型语言模型的问答模块可以根据已经确定的逻辑关系,更加准确和容易地对阳性描述句进行语义分析,从而准确确定上下文中不同段落之间的阳性描述句的映射关系,确定用于指示疾病结论的候选结论。并且本技术方案通过医学影像知识图谱,根据医学影像诊断报告中阳性描述句,确定用于指示疾病结论的匹配项,从而计算候选结论和匹配项之间的匹配值,为医学影像诊断报告确定最终结论。从而本技术方案通过大型语言模型和医学影像知识图谱双重确定疾病结论,并对输出的疾病结论进行比较,从而确定最终结论的方式,从而使得确定的最终结论更加准确。进而解决了现有技术中通过大型语言模型或者医学影像知识图谱分析医学影像诊断报告得到疾病结论时,准确度较差的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种疾病结论确定方法,其特征在于,包括:
通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中所述阳性描述句用于描述病变部位的征象;
所述大型语言模型根据所述阳性描述句确定候选结论,并且将各个阳性描述句与所述候选结论建立映射关系,其中所述候选结论用于指示根据所述阳性描述句推测的疾病结论;
通过预设的医学影像知识图谱,根据所述阳性描述句确定相应的匹配项,其中所述匹配项用于指示根据所述阳性描述句匹配到的疾病结论;以及
根据所述阳性描述句相应的匹配项和与所述阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中所述最终结论用于指示最终确定的疾病结论,其中
通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句的操作,包括:通过所述大型语言模型对所述医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对所述多个分句进行整理,生成规范文本;以及根据所述规范文本中的多个分句的分词类型,确定所述阳性描述句,并且
所述大型语言模型根据所述阳性描述句确定候选结论的操作,包括:
通过所述大型语言模型的问答模块对所述阳性描述句进行语义分析,生成相应的候选结论。
2.根据权利要求1所述的方法,其特征在于,通过预设的医学影像知识图谱,根据所述阳性描述句确定相应的匹配项的操作,包括:
通过所述医学影像知识图谱对所述阳性描述句的分词进行匹配,得到相应的匹配项。
3.根据权利要求1所述的方法,其特征在于,根据所述阳性描述句相应的匹配项和与所述阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论的操作,包括:
获取与所述阳性描述句存在映射关系的候选结论;
获取与所述阳性描述句的候选结论对应的匹配项;
根据预设的匹配值计算方法计算所述匹配项和所述候选结论之间的匹配值,并且根据所述匹配值确定与所述阳性描述句对应的最终结论。
4.根据权利要求3所述的方法,其特征在于,根据预设的匹配值计算方法计算所述匹配项和所述候选结论之间的匹配值,并且根据所述匹配值确定与所述阳性描述句对应的最终结论的操作,包括:
在所述阳性描述句的候选结论为一项的情况下,根据预设的匹配值计算方法计算所述候选结论与相应的匹配项之间的匹配值;以及
在所述匹配值大于第一预设阈值的情况下,将所述候选结论作为所述最终结论。
5.根据权利要求3所述的方法,其特征在于,根据预设的匹配值计算方法计算所述匹配项和所述候选结论之间的匹配值,并且根据所述匹配值确定与所述阳性描述句对应的最终结论的操作,还包括:
在所述阳性描述句的候选结论为多项的情况下,分别计算所述候选结论与相应的匹配项之间的匹配值;以及
根据与最高匹配值对应的候选结论确定所述最终结论。
6.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至5中任意一项所述的方法。
7.一种疾病结论确定装置,其特征在于,包括:
第一确定模块,用于通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中所述阳性描述句用于描述病变部位的征象;
第二确定模块,用于所述大型语言模型根据所述阳性描述句确定候选结论,并且将各个阳性描述句与所述候选结论建立映射关系,其中所述候选结论用于指示根据所述阳性描述句推测的疾病结论;
第三确定模块,用于通过预设的医学影像知识图谱,根据所述阳性描述句确定相应的匹配项,其中所述匹配项用于指示根据所述阳性描述句匹配到的疾病结论;以及
第四确定模块,用于根据所述阳性描述句相应的匹配项和与所述阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中所述最终结论用于指示最终确定的疾病结论,其中
所述第一确定模块包括:第一生成子模块,用于通过所述大型语言模型对所述医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对所述多个分句进行整理,生成规范文本;以及第一确定子模块,用于根据所述规范文本中的多个分句的分词类型,确定所述阳性描述句,并且
所述第二确定模块,包括:第二生成子模块,用于通过所述大型语言模型的问答模块对所述阳性描述句进行语义分析,生成相应的候选结论。
8.一种疾病结论确定装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句,其中所述阳性描述句用于描述病变部位的征象;
所述大型语言模型根据所述阳性描述句确定候选结论,并且将各个阳性描述句与所述候选结论建立映射关系,其中所述候选结论用于指示根据所述阳性描述句推测的疾病结论;
通过预设的医学影像知识图谱,根据所述阳性描述句确定相应的匹配项,其中所述匹配项用于指示根据所述阳性描述句匹配到的疾病结论;以及
根据所述阳性描述句相应的匹配项和与所述阳性描述句存在映射关系的候选结论之间的匹配值,确定最终结论,其中所述最终结论用于指示最终确定的疾病结论,其中
通过大型语言模型对医学影像诊断报告进行预处理,确定阳性描述句的操作,包括:通过所述大型语言模型对所述医学影像诊断报告进行分句处理,并根据得到的多个分句之间的逻辑关系,对所述多个分句进行整理,生成规范文本;以及根据所述规范文本中的多个分句的分词类型,确定所述阳性描述句,并且
所述大型语言模型根据所述阳性描述句确定候选结论的操作,包括:通过所述大型语言模型的问答模块对所述阳性描述句进行语义分析,生成相应的候选结论。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311723372.2A CN117409921B (zh) | 2023-12-15 | 2023-12-15 | 疾病结论确定方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311723372.2A CN117409921B (zh) | 2023-12-15 | 2023-12-15 | 疾病结论确定方法、装置以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117409921A CN117409921A (zh) | 2024-01-16 |
CN117409921B true CN117409921B (zh) | 2024-03-12 |
Family
ID=89500311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311723372.2A Active CN117409921B (zh) | 2023-12-15 | 2023-12-15 | 疾病结论确定方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117409921B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570331A (zh) * | 2016-11-07 | 2017-04-19 | 万里云医疗信息科技(北京)有限公司 | 一种动态诊断报告的生成方法及生成系统 |
CN111599488A (zh) * | 2020-05-19 | 2020-08-28 | 万达信息股份有限公司 | 一种智能问诊实现方法、系统和存储介质 |
CN112667799A (zh) * | 2021-03-15 | 2021-04-16 | 四川大学 | 一种基于语言模型和实体匹配的医疗问答系统构建方法 |
CN113658690A (zh) * | 2021-08-30 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 一种智能导医方法、装置、存储介质以及电子设备 |
CN115458110A (zh) * | 2022-08-15 | 2022-12-09 | 复旦大学附属中山医院厦门医院 | 影像学结构化报告标签提取方法、系统、终端及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230343425A1 (en) * | 2022-04-22 | 2023-10-26 | Taipei Medical University | Methods and non-transitory computer storage media of extracting linguistic patterns and summarizing pathology report |
-
2023
- 2023-12-15 CN CN202311723372.2A patent/CN117409921B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570331A (zh) * | 2016-11-07 | 2017-04-19 | 万里云医疗信息科技(北京)有限公司 | 一种动态诊断报告的生成方法及生成系统 |
CN111599488A (zh) * | 2020-05-19 | 2020-08-28 | 万达信息股份有限公司 | 一种智能问诊实现方法、系统和存储介质 |
CN112667799A (zh) * | 2021-03-15 | 2021-04-16 | 四川大学 | 一种基于语言模型和实体匹配的医疗问答系统构建方法 |
CN113658690A (zh) * | 2021-08-30 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 一种智能导医方法、装置、存储介质以及电子设备 |
CN115458110A (zh) * | 2022-08-15 | 2022-12-09 | 复旦大学附属中山医院厦门医院 | 影像学结构化报告标签提取方法、系统、终端及存储介质 |
Non-Patent Citations (1)
Title |
---|
面向诊断报告的疾病知识图谱构建技术研究;陈尧文;中国优秀硕士学位论文全文数据库;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117409921A (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rahman et al. | Ambiguous medical image segmentation using diffusion models | |
Faghani et al. | Mitigating bias in radiology machine learning: 3. Performance metrics | |
US10984024B2 (en) | Automatic processing of ambiguously labeled data | |
CN111225614A (zh) | 诊断辅助装置、信息处理方法、诊断辅助系统以及程序 | |
CN109670054A (zh) | 知识图谱构建方法、装置、存储介质及电子设备 | |
EP3968337A1 (en) | Target object attribute prediction method based on machine learning and related device | |
CN110503155A (zh) | 一种信息分类的方法及相关装置、服务器 | |
CN115497616A (zh) | 一种感染性疾病辅助决策的方法、系统、设备及存储介质 | |
CN114708952B (zh) | 一种图像标注方法、装置、存储介质和电子设备 | |
RU2720363C2 (ru) | Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта | |
US20220375576A1 (en) | Apparatus and method for diagnosing a medical condition from a medical image | |
CN115206478A (zh) | 医学报告生成方法以及装置、电子设备、可读存储介质 | |
CN115408551A (zh) | 一种医疗图文数据互检方法、装置、设备及可读存储介质 | |
Pan et al. | Muvam: A multi-view attention-based model for medical visual question answering | |
CN114662477A (zh) | 基于中医对话的停用词表生成方法、装置及存储介质 | |
CN110610766A (zh) | 基于症状特征权重推导疾病概率的装置和存储介质 | |
CN112182253B (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
Hu et al. | Interpretable medical image visual question answering via multi-modal relationship graph learning | |
US20240028831A1 (en) | Apparatus and a method for detecting associations among datasets of different types | |
CN117409921B (zh) | 疾病结论确定方法、装置以及存储介质 | |
CN116994689A (zh) | 医疗数据的特征化处理方法、装置、设备、介质及产品 | |
Yazid et al. | A new similarity measure based on Bayesian Network signature correspondence for brain tumors cases retrieval | |
CN117476163B (zh) | 用于确定疾病结论的方法、装置以及存储介质 | |
Khincha et al. | Constructing and evaluating an explainable model for COVID-19 diagnosis from chest X-rays | |
CN118071695B (zh) | 基于深度学习的临床医学影像分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |