CN113111625A - 一种医学文本标签生成系统、方法及计算机可读存储介质 - Google Patents
一种医学文本标签生成系统、方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113111625A CN113111625A CN202110482972.9A CN202110482972A CN113111625A CN 113111625 A CN113111625 A CN 113111625A CN 202110482972 A CN202110482972 A CN 202110482972A CN 113111625 A CN113111625 A CN 113111625A
- Authority
- CN
- China
- Prior art keywords
- label
- medical text
- integration
- target
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000010354 integration Effects 0.000 claims abstract description 185
- 238000012216 screening Methods 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 230000035945 sensitivity Effects 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 4
- 206010061818 Disease progression Diseases 0.000 claims description 2
- 230000005750 disease progression Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 210000001685 thyroid gland Anatomy 0.000 description 29
- 230000003211 malignant effect Effects 0.000 description 21
- 201000010099 disease Diseases 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 208000004930 Fatty Liver Diseases 0.000 description 10
- 206010019708 Hepatic steatosis Diseases 0.000 description 10
- 208000010706 fatty liver disease Diseases 0.000 description 10
- 231100000240 steatosis hepatitis Toxicity 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 210000004185 liver Anatomy 0.000 description 9
- 238000002559 palpation Methods 0.000 description 7
- 238000002604 ultrasonography Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 208000009453 Thyroid Nodule Diseases 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 206010054107 Nodule Diseases 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 208000026292 Cystic Kidney disease Diseases 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 1
- 208000024799 Thyroid disease Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 210000003240 portal vein Anatomy 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 208000021510 thyroid gland disease Diseases 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种医学文本标签生成系统,包括:请求解析模块,用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;标签筛选模块,用于从标签库中筛选目标医学文本数据对应的各初始医学文本标签;其中,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;标签整合模块,用于按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签。应用本发明所提供的医学文本标签生成系统,降低了标签使用的复杂度,降低了标签生成门槛,降低了医学文本标签决策难度。本发明还公开了一种医学文本标签生成方法及存储介质,具有相应技术效果。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种医学文本标签生成系统、方法及计算机可读存储介质。
背景技术
关乎人类健康的大数据医疗一直是备受关注的领域,对医学文本的利用是该领域需要攻克的难题。常见的医学文本包括病历、影像学报告,如X线检查报告、超声检查报告、计算机体层摄影(Computed Tomography,CT)报告、磁共振检查(Magnetic Resonance,MR)报告等是医疗领域重要的信息载体。然而上述医学文本基本都是使用自然语言编写,属于非结构化文本,不便于机器理解和自动化处理。
目前通过信息抽取、实体识别、中文分词以及深度学习等方法可将其转化为标签式文本,从而实现结构化,但由此生成的医学标签具有数量众多、碎片化等特点,目前大多是使用数据表将其存储起来,存储及使用均缺乏系统化管理,使用复杂度高。应用时需要配备专业医学人员进行选择标签,任何场景使用基本都需要依赖专家意见,医学具有较高的专业门槛,使用成本大。由于医学是一门经验主义科学,对于对数据要求高的场景,如核保、算法等,即使有医学专家的支持,有时候依然难以进行医学文本标签决策,决策难度高,标签生成受主观因素影响大。
综上所述,如何有效地解决现有的医学文本生成方式门槛高,成本高,决策难度高等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种医学文本标签生成系统,该系统降低了标签使用的复杂度,降低了标签生成门槛,降低了医学文本标签决策难度;本发明的另一目的是提供一种医学文本标签生成方法及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种医学文本标签生成系统,包括:
请求解析模块,用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;
标签筛选模块,用于从标签库中筛选所述目标医学文本数据对应的各初始医学文本标签;其中,所述标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;
标签整合模块,用于按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到目标医学文本标签。
在本发明的一种具体实施方式中,所述标签整合模块,具体用于按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到整合医学文本标签;当接收到标签构建指令时,根据所述标签构建指令对所述整合医学文本标签进行构建操作,得到所述目标医学文本标签。
在本发明的一种具体实施方式中,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和语义标签整合逻辑;
所述标签整合模块,具体用于按照所述语义标签整合逻辑对各所述初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和医学关联标签整合逻辑;
所述标签整合模块,具体用于按照所述医学关联标签整合逻辑对各所述初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和病程进展标签整合逻辑;
所述标签整合模块,具体用于按照所述病程进展标签整合逻辑对各所述初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和严重程度标签整合逻辑;
所述标签整合模块,具体用于按照所述严重程度标签整合逻辑对各所述初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,还包括:
第一指令接收模块,用于接收目标灵敏度及特异度整合指令;
所述标签整合模块,具体用于结合所述目标标签整合逻辑和所述目标灵敏度及特异度指令对各所述初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,还包括:
第二指令接收模块,用于接收目标支持度及置信度整合指令;
所述标签整合模块,具体用于结合所述目标标签整合逻辑和所述目标支持度及置信度整合指令对各所述初始医学文本标签进行整合操作。
一种医学文本标签生成方法,包括:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;
从标签库中筛选所述目标医学文本数据对应的各初始医学文本标签;其中,所述标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;
按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到目标医学文本标签。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述医学文本标签生成方法的步骤。
本发明所提供的医学文本标签生成系统,包括:请求解析模块,用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;标签筛选模块,用于从标签库中筛选目标医学文本数据对应的各初始医学文本标签;其中,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;标签整合模块,用于按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签。
由上述技术方案可知,通过预先设置标签库,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系。首先,从标签库中直接筛选目标医学文本数据对应的初始医学文本标签;接着,解析得到标签生成请求中包含的目标标签整合逻辑,按照目标标签整合逻辑对各初始医学文本标签进行自动整合,得到目标医学文本标签。通过设置用于初始医学文本标签查询的标签库,使得医学标签得到系统化管理,降低了标签使用的复杂度,降低了标签生成门槛,通过预先设置整合逻辑,能够根据解析得到的目标标签整合逻辑自动对筛选得到的各初始医学文本标签进行整合操作,从而生成目标医学文本标签。降低了医学文本标签决策难度。
相应的,本发明还提供了与上述系统相对应的医学文本标签生成方法和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中医学文本标签生成系统的一种结构框图;
图2为本发明实施例中一种医学文本标签生成系统的具体结构框图;
图3为本发明实施例中医学文本标签生成系统的另一种结构框图;
图4为本发明实施例中医学文本标签生成系统的另一种结构框图;
图5为本发明实施例中一种医学文本标签生成方法的实施流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例中医学文本标签生成系统的一种结构框图,该系统可以包括:
请求解析模块1,用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;
标签筛选模块2,用于从标签库中筛选目标医学文本数据对应的各初始医学文本标签;其中,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;
标签整合模块3,用于按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签。
参见图1和图2,图1为本发明实施例中医学文本标签生成系统的一种结构框图,图2为本发明实施例中一种医学文本标签生成系统的具体结构框图。本发明实施例提供的医学文本标签生成系统包括请求解析模块1、标签筛选模块2、以及标签整合模块3。当需要进行医学文本标签生成时,向请求解析模块1发送标签生成请求,标签生成请求中包含待标签生成的目标医学文本数据和目标标签整合逻辑。如图2所示,目标医学文本数据可以包含病史、体格检查、图像学检查报告等医学文本数据,还可以包含通过规则提取、实体识别、中文分词、深度学习等技术得到的标签式数据。请求解析模块1接收标签生成请求,并对标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑。
预先建立有标签库,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系,如可以存储有医学文本数据中包含的各关键词与各初始医学文本数据之间的对应关系。在解析得到待标签生成的目标医学文本数据之后,标签筛选模块2从标签库中筛选目标医学文本数据对应的各初始医学文本标签。如图2所示,标签库管理平台包括标签筛选模块2、标签整合模块3、标签构建模块、以及数据交互模块,预先进行标签入库操作,当需要进行标签筛选时没直接勾选得到各初始医学文本标签。其中,数据交互模块提供检查方式评估单元,用于提供灵敏度及特异度整合逻辑支持;数据交互模块还提供指标数据获取单元,用于提供官方统计、权威披露、高质量文献中总结得到的平均住院/治疗费用、疾病恶性程度以及疾病伤残/死亡率等指标数据,并提供相应的整合逻辑支持;数据交互模块还提供了数据挖掘及关联分析单元,用于提供混淆矩阵、支持度和置信度查询,以及支持度及置信度整合逻辑支持。数据交互模块对医学文本标签生成的全流程、各个环节进行数据支持,辅助用户进行标签构建的决策,为决策提供数据支持。
预先设置对医学文本标签进行自动整合的各种标签整合逻辑,如图2所示,可以包括语义标签整合逻辑、医学关联标签整合逻辑、病程进展标签整合逻辑、慢性疾病标签整合逻辑、严重程度标签整合逻辑等。并且本发明实施例所提供的医学文本标签生成系统可以应用于算法特征构造、保险核保、医学支持、医学研究、数据分析等多种应用场景。在解析得到目标标签整合逻辑之后,标签整合模块3按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签,从而完成标签生成操作。通过设置用于初始医学文本标签查询的标签库,使得医学标签得到系统化管理,降低了标签使用的复杂度,降低了标签生成门槛,通过预先设置整合逻辑,能够根据解析得到的目标标签整合逻辑自动对筛选得到的各初始医学文本标签进行整合操作,从而生成目标医学文本标签。降低了医学文本标签决策难度。
由上述技术方案可知,通过预先设置标签库,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系。首先,从标签库中直接筛选目标医学文本数据对应的初始医学文本标签;接着,解析得到标签生成请求中包含的目标标签整合逻辑,按照目标标签整合逻辑对各初始医学文本标签进行自动整合,得到目标医学文本标签。通过设置用于初始医学文本标签查询的标签库,使得医学标签得到系统化管理,降低了标签使用的复杂度,降低了标签生成门槛,通过预先设置整合逻辑,能够根据解析得到的目标标签整合逻辑自动对筛选得到的各初始医学文本标签进行整合操作,从而生成目标医学文本标签。降低了医学文本标签决策难度。
在本发明的一种具体实施方式中,标签整合模块3,具体用于按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到整合医学文本标签;当接收到标签构建指令时,根据标签构建指令对整合医学文本标签进行构建操作,得到目标医学文本标签。
在利用标签整合模块3对各初始医学文本标签进行整合操作,得到整合医学文本标签之后,可以默认系统设定的整合结果,用户也可进行调整,如根据使用目的进行调整,自主构建并定义新标签,从而得到目标医学文本标签。如图2所示,可以通过预设构建逻辑,设置默认构建标签体系,也可以自主选择构建逻辑,生成自定义构建标签。在对整合医学文本标签进一步进行标签构建时,可根据当前需要按照相应的标签构建方式,对整合得到的整合医学文本标签进行构建,使得用户根据需要对整合医学文本标签进行调整,提升了用户使用体验。
在本发明的一种具体实施方式中,请求解析模块1,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和语义标签整合逻辑;
标签整合模块3,具体用于按照语义标签整合逻辑对各初始医学文本标签进行整合操作。
预先设置标签整合逻辑为语义标签整合逻辑。请求解析模块1通过对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和语义标签整合逻辑。进而,标签整合模块3按照语义标签整合逻辑对各初始医学文本标签进行整合操作。如:“肾脏无回声(单个)”、“肾脏无回声(2个)”、“肾脏无回声”等同语义标签合并为“肾脏无回声病变”;“脂肪肝趋势”、“轻度脂肪肝”、“轻-中度脂肪肝”、“中度脂肪肝”、“中-重度脂肪肝”、“重度脂肪肝”合并为“脂肪肝病变”。通过标签语义整合逻辑将同语义标签进行合并、构造,充分利用了各初始医学文本标签之间的语义关系,实现对各初始医学文本标签的整合,降低了医学文本标签维度,使得医学文本标签决策得到简化。
在本发明的一种具体实施方式中,请求解析模块1,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和医学关联标签整合逻辑;
标签整合模块3,具体用于按照医学关联标签整合逻辑对各初始医学文本标签进行整合操作。
预先设置标签整合逻辑为医学关联标签整合逻辑。请求解析模块1对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和医学关联标签整合逻辑;进而标签整合模块3按照医学关联标签整合逻辑对各初始医学文本标签进行整合操作。如:“肾囊肿”与“肾脏无回声”整合为“肾脏囊肿”;“肝内片状低回声”、“肝脏回声细密”、与多种脂肪肝标签整合成“脂肪肝病变”。,通过标签医学关联将具有医学联系的标签进行整合,充分利用了各初始医学文本标签之间的医学联系,实现对各初始医学文本标签的整合,降低了医学文本标签维度,使得医学文本标签决策得到简化。
在本发明的一种具体实施方式中,请求解析模块1,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和病程进展标签整合逻辑;
标签整合模块3,具体用于按照病程进展标签整合逻辑对各初始医学文本标签进行整合操作。
预先设置标签整合逻辑为病程进展标签整合逻辑。请求解析模块1通过对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和病程进展标签整合逻辑。进而,标签整合模块3按照病程进展标签整合逻辑对各初始医学文本标签进行整合操作。如:脂肪肝相关标签(“脂肪肝”、“肝内片状低回声”、“肝脏回声细密”)、肝硬化相关标签(“肝硬化”、“肝脏缩小”、“肝脏回声增粗”、“肝脏回声增强”、“肝脏回声不均匀”、“门静脉扩张”),并且可设计层级递进关系。通过病程进展标签整合逻辑从更高维度对各初始医学文本标签进行整合,使得整合得到的目标医学文本标签得到较大的简化。
在本发明的一种具体实施方式中,请求解析模块1,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和严重程度标签整合逻辑;
标签整合模块3,具体用于按照严重程度标签整合逻辑对各初始医学文本标签进行整合操作。
预先设置标签整合逻辑为严重程度标签整合逻辑。请求解析模块1通过对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和严重程度标签整合逻辑。进而,标签整合模块3按照严重程度标签整合逻辑对各初始医学文本标签进行整合操作。如:参考疾病发生指标(发病率、患病率),死亡指标(死亡率、病死率),残疾失能指标(病残率、潜在减寿年数、伤残调整寿命年、健康寿命年、质量调整寿命年),费用指标(平均住院日、平均住院费用、平均治疗费用)等,可将指标相似的疾病及相应标签进行整合。通过严重程度标签整合逻辑从更高维度对各初始医学文本标签进行整合,在需要进行疾病严重程度评估、疾病负担、风险估算、治疗费用测算等使用场景,该整合逻辑可帮助用户更快捷地获取相应初始医学文本标签。
在本发明的一种具体实施方式中,该系统还可以包括:
第一指令接收模块4,用于接收目标灵敏度及特异度整合指令;
标签整合模块3,具体用于结合目标标签整合逻辑和目标灵敏度及特异度指令对各初始医学文本标签进行整合操作。
参见图3,图3为本发明实施例中医学文本标签生成系统的另一种结构框图。本发明实施例所提供的医学文本标签生成系统还可以包括第一指令接收模块4。预先根据高质量文献和数据总结得出不同检查项间的灵敏度(sensitivity)和特异度(specificity),如:触诊和前列腺超声对前列腺增生诊断的灵敏度和特异度;胸部正位片和胸部CT对诊断肺气肿、肺结节、肺炎等的灵敏度和特异度。在对各初始医学文本标签进行整合时,用户终端可以根据场景需求生成目标灵敏度及特异度整合指令,第一指令接收模块4接收目标灵敏度及特异度整合指令。进而,标签整合模块3通过结合目标标签整合逻辑和目标灵敏度及特异度指令对各初始医学文本标签进行整合操作。从而使得最终生成的目标医学文本标签满足用户所需的灵敏度和特异度需求。
在本发明的一种具体实施方式中,该系统还可以包括:
第二指令接收模块5,还用于接收目标支持度及置信度整合指令;
标签整合模块3,具体用于结合目标标签整合逻辑和目标支持度及置信度整合指令对各初始医学文本标签进行整合操作。
参见图4,图4为本发明实施例中医学文本标签生成系统的另一种结构框图。本发明实施例所提供的医学文本标签生成系统还可以包括第二指令接收模块5。预先通过数据挖掘算法,如关联分析算法(Apriori算法和FP-growth算法),给出标签分级整合的数据支持强度,并根据新进数据更新数据结果。如:“肝内片状低回声”、“肝脏回声细密”分别与脂肪肝标签间的支持度(support)和置信度(confidence);“甲状腺低回声”、“甲状腺等回声”、“甲状腺高回声”等分别与“甲状腺结节”间的支持度和置信度。
在对各初始医学文本标签进行整合时,用户终端可以根据场景需求生成目标支持度及置信度整合指令,第二指令接收模块5接收目标支持度及置信度整合指令。进而,标签整合模块3结合目标标签整合逻辑和目标支持度及置信度整合指令对各初始医学文本标签进行整合操作。从而实现根据不同支持度和置信度下进行标签整合的智能决策。
在本发明的一种具体实例应用中,以甲状腺恶性结节疾病患病风险分析为研究目标进行举例。既往的患病风险分析方式为从数据库包含的体格检查中存在“触诊甲状腺恶性结节”标签或者甲状腺超声检查中存在“超声甲状腺恶性结节”标签的人群进行风险分析。
本发明标签筛选模块2在用户选择“触诊甲状腺恶性结节”或者“超声甲状腺恶性结节”的标签时,数据支持模块给出知识框,提示:“根据《xxx指南》,甲状腺结节一般由触诊及超声检出,触诊发现一般人群甲状腺结节的患病率为n1,而超声检查发现甲状腺结节的患病率达n2。触诊对恶性结节的敏感性和特异性均较低,需其他辅助检查,超声对恶性结节的敏感性约n3、特异性为n4”。用户可根据研究可接受的灵敏度和特异度决定纳入何种检查人群。当用户选择中包含超声检查中的“超声甲状腺恶性结节”标签时,数据支持模块可继续给出新的知识框,提示:对数据库现有XXXXXX份甲状腺超声订单,使用Apriori算法进行关联分析,结果显示:“甲状腺恶性结节”对应“甲状腺低回声”,支持度为s1,置信度为c1;“甲状腺恶性结节”对应“甲状腺混合回声”,支持度为s2,置信度为c2;“甲状腺恶性结节”对应“甲状腺等回声”,支持度为s3,置信度为c3;“甲状腺恶性结节”对应“甲状腺强回声”,支持度为s4,置信度为c4;“甲状腺恶性结节”对应“甲状高回声”,支持度为s5,置信度为c5”。用户可根据研究可接受的支持度和置信度,选择相应的标签。
在上一过程中用户选择了纳入的标签为:“触诊甲状腺恶性结节”“超声甲状腺恶性结节”“甲状腺低回声”“甲状腺等回声”“甲状腺混合回声”,将上述标签加入“标签池”,点击进入“标签整合”。
标签整合模块3根据“标签池”中的标签触发的整合逻辑,在展示页为用户展示标签间的整合逻辑,如:“触诊甲状腺恶性结节”“超声甲状腺恶性结节”根据“标签语义”可进行整合为“甲状腺恶性结节”,“甲状腺低回声”“甲状腺等回声”“甲状腺混合回声”根据“诊断关联”可进行整合为“甲状腺恶性结节可能”,并且用户可点击“继续整合”上述结果进一步整合,形成“甲状腺恶性结节和恶性结节可能”的标签。此过程中,用户可自主调整整合逻辑。完成此过程后,用户点击进入“标签构建”。
标签构建模块进行系统展现标签“甲状腺恶性结节和恶性结节可能”,用户可调整改名称。
完成标签构建后,可链接数据库,用户进行数据获取,并进行风险分析。
相应于上面的系统实施例,本发明还提供了一种医学文本标签生成方法,下文描述的医学文本标签生成方法与上文描述的医学文本标签生成系统可相互对应参照。
参见图5,图5为本发明实施例中一种医学文本标签生成方法的实施流程图,该方法可以包括以下步骤:
S501:对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑。
S502:从标签库中筛选目标医学文本数据对应的各初始医学文本标签。
其中,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系。
S503:按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签。
由上述技术方案可知,通过预先设置标签库,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系。首先,从标签库中直接筛选目标医学文本数据对应的初始医学文本标签;接着,解析得到标签生成请求中包含的目标标签整合逻辑,按照目标标签整合逻辑对各初始医学文本标签进行自动整合,得到目标医学文本标签。通过设置用于初始医学文本标签查询的标签库,使得医学标签得到系统化管理,降低了标签使用的复杂度,降低了标签生成门槛,通过预先设置整合逻辑,能够根据解析得到的目标标签整合逻辑自动对筛选得到的各初始医学文本标签进行整合操作,从而生成目标医学文本标签。降低了医学文本标签决策难度。
在本发明的一种具体实施方式中,步骤S503可以包括以下步骤:
步骤一:按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到整合医学文本标签;
步骤二:当接收到标签构建指令时,根据标签构建指令对整合医学文本标签进行构建操作,得到目标医学文本标签。
在本发明的一种具体实施方式中,步骤S501可以包括以下步骤:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和语义标签整合逻辑;
相应的,步骤S503可以包括以下步骤:
按照语义标签整合逻辑对各初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,步骤S501可以包括以下步骤:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和医学关联标签整合逻辑;
相应的,步骤S503可以包括以下步骤:
按照医学关联标签整合逻辑对各初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,步骤S501可以包括以下步骤:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和病程进展标签整合逻辑;
相应的,步骤S503可以包括以下步骤:
按照病程进展标签整合逻辑对各初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,步骤S501可以包括以下步骤:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和严重程度标签整合逻辑;
相应的,步骤S503可以包括以下步骤:
按照严重程度标签整合逻辑对各初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,在步骤S503之前,该方法还可以包括以下步骤:
接收目标灵敏度及特异度整合指令;
相应的,步骤S503可以包括以下步骤:
结合目标标签整合逻辑和目标灵敏度及特异度指令对各初始医学文本标签进行整合操作。
在本发明的一种具体实施方式中,在步骤S503之前,该方法还可以包括以下步骤:
接收目标支持度及置信度整合指令;
相应的,步骤S503可以包括以下步骤:
结合目标标签整合逻辑和目标支持度及置信度整合指令对各初始医学文本标签进行整合操作。
相应于上面的系统实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;从标签库中筛选目标医学文本数据对应的各初始医学文本标签;其中,标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;按照目标标签整合逻辑对各初始医学文本标签进行整合操作,得到目标医学文本标签。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法及计算机可读存储介质而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见系统部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种医学文本标签生成系统,其特征在于,包括:
请求解析模块,用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;
标签筛选模块,用于从标签库中筛选所述目标医学文本数据对应的各初始医学文本标签;其中,所述标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;
标签整合模块,用于按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到目标医学文本标签。
2.根据权利要求1所述的医学文本标签生成系统,其特征在于,所述标签整合模块,具体用于按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到整合医学文本标签;当接收到标签构建指令时,根据所述标签构建指令对所述整合医学文本标签进行构建操作,得到所述目标医学文本标签。
3.根据权利要求1所述的医学文本标签生成系统,其特征在于,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和语义标签整合逻辑;
所述标签整合模块,具体用于按照所述语义标签整合逻辑对各所述初始医学文本标签进行整合操作。
4.根据权利要求1所述的医学文本标签生成系统,其特征在于,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和医学关联标签整合逻辑;
所述标签整合模块,具体用于按照所述医学关联标签整合逻辑对各所述初始医学文本标签进行整合操作。
5.根据权利要求1所述的医学文本标签生成系统,其特征在于,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和病程进展标签整合逻辑;
所述标签整合模块,具体用于按照所述病程进展标签整合逻辑对各所述初始医学文本标签进行整合操作。
6.根据权利要求1所述的医学文本标签生成系统,其特征在于,所述请求解析模块,具体用于对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和严重程度标签整合逻辑;
所述标签整合模块,具体用于按照所述严重程度标签整合逻辑对各所述初始医学文本标签进行整合操作。
7.根据权利要求1至6任一项所述的医学文本标签生成系统,其特征在于,还包括:
第一指令接收模块,用于接收目标灵敏度及特异度整合指令;
所述标签整合模块,具体用于结合所述目标标签整合逻辑和所述目标灵敏度及特异度指令对各所述初始医学文本标签进行整合操作。
8.根据权利要求1至6任一项所述的医学文本标签生成系统,其特征在于,还包括:
第二指令接收模块,用于接收目标支持度及置信度整合指令;
所述标签整合模块,具体用于结合所述目标标签整合逻辑和所述目标支持度及置信度整合指令对各所述初始医学文本标签进行整合操作。
9.一种医学文本标签生成方法,其特征在于,包括:
对接收到的标签生成请求进行解析,得到待标签生成的目标医学文本数据和目标标签整合逻辑;
从标签库中筛选所述目标医学文本数据对应的各初始医学文本标签;其中,所述标签库中存储有各医学文本数据与各初始医学文本标签之间的对应关系;
按照所述目标标签整合逻辑对各所述初始医学文本标签进行整合操作,得到目标医学文本标签。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求9所述医学文本标签生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482972.9A CN113111625B (zh) | 2021-04-30 | 2021-04-30 | 一种医学文本标签生成系统、方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482972.9A CN113111625B (zh) | 2021-04-30 | 2021-04-30 | 一种医学文本标签生成系统、方法及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113111625A true CN113111625A (zh) | 2021-07-13 |
CN113111625B CN113111625B (zh) | 2024-07-23 |
Family
ID=76720714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110482972.9A Active CN113111625B (zh) | 2021-04-30 | 2021-04-30 | 一种医学文本标签生成系统、方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111625B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563626A (zh) * | 2018-01-22 | 2018-09-21 | 北京颐圣智能科技有限公司 | 医疗文本命名实体识别方法和装置 |
CN111046275A (zh) * | 2019-11-19 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的用户标签确定方法及装置、存储介质 |
CN111949410A (zh) * | 2020-08-23 | 2020-11-17 | 陈顺发 | 基于大数据和边缘计算的数据整合方法及云端大数据中心 |
CN112035757A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗瀑布流推送方法、装置、设备及存储介质 |
CN112488845A (zh) * | 2020-11-16 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种投保客户的筛选方法、装置、电子设备及存储介质 |
CN112562807A (zh) * | 2020-12-11 | 2021-03-26 | 北京百度网讯科技有限公司 | 医疗数据分析方法、装置、设备、存储介质和程序产品 |
-
2021
- 2021-04-30 CN CN202110482972.9A patent/CN113111625B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563626A (zh) * | 2018-01-22 | 2018-09-21 | 北京颐圣智能科技有限公司 | 医疗文本命名实体识别方法和装置 |
CN111046275A (zh) * | 2019-11-19 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的用户标签确定方法及装置、存储介质 |
CN111949410A (zh) * | 2020-08-23 | 2020-11-17 | 陈顺发 | 基于大数据和边缘计算的数据整合方法及云端大数据中心 |
CN112035757A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗瀑布流推送方法、装置、设备及存储介质 |
CN112488845A (zh) * | 2020-11-16 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种投保客户的筛选方法、装置、电子设备及存储介质 |
CN112562807A (zh) * | 2020-12-11 | 2021-03-26 | 北京百度网讯科技有限公司 | 医疗数据分析方法、装置、设备、存储介质和程序产品 |
Non-Patent Citations (1)
Title |
---|
曹明宇等: "基于神经网络的药物实体与关系联合抽取", 《计算机研究与发展》, vol. 56, no. 07, pages 1432 - 1440 * |
Also Published As
Publication number | Publication date |
---|---|
CN113111625B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108475538B (zh) | 用于将第三方应用集成在图像解读工作流中的结构化发现对象 | |
CN113243033B (zh) | 综合诊断系统和方法 | |
CN112712879B (zh) | 医学影像报告的信息提取方法、装置、设备及存储介质 | |
JP5153281B2 (ja) | 診断支援装置及びその制御方法 | |
EP3567605A1 (en) | Structured report data from a medical text report | |
JP5952835B2 (ja) | 撮像プロトコルの更新及び/又はリコメンダ | |
US20130124527A1 (en) | Report authoring | |
Beddiar et al. | Automatic captioning for medical imaging (MIC): a rapid review of literature | |
US8799286B2 (en) | System and method for organizing and displaying of longitudinal multimodal medical records | |
CN105074708A (zh) | 放射学发现的背景驱动的概要视图 | |
EP2812828B1 (en) | Interactive optimization of scan databases for statistical testing | |
JP2015524107A (ja) | 患者情報を臨床基準にマッチングするシステム及び方法 | |
KR20240008838A (ko) | 인공 지능-보조 이미지 분석을 위한 시스템 및 방법 | |
US11630874B2 (en) | Method and system for context-sensitive assessment of clinical findings | |
KR102057277B1 (ko) | 의료 영상의 정량화 및 분석에 기반한 빅데이터 데이터베이스를 구축하기 위한 서버 및 서버 기반의 의료 영상 분석 방법 | |
Patrício et al. | Explainable deep learning methods in medical image classification: A survey | |
CN113658175A (zh) | 一种征象数据的确定方法及装置 | |
US20200294655A1 (en) | System and method to automatically prepare an attention list for improving radiology workflow | |
Ebadollahi et al. | Concept-based electronic health records: opportunities and challenges | |
US20240006039A1 (en) | Medical structured reporting workflow assisted by natural language processing techniques | |
van der Pol et al. | Canadian radiology in the age of artificial intelligence: a golden opportunity | |
Kovacs et al. | Correlate: a PACS-and EHR-integrated tool leveraging natural language processing to provide automated clinical follow-up | |
CN113111625A (zh) | 一种医学文本标签生成系统、方法及计算机可读存储介质 | |
EP4216229A1 (en) | Subscription and retrieval of medical imaging data | |
Pereira | Explainable Automatic Chest Radiography Pathology Detection and Reporting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |