CN115238033A - 一种实现医疗机构手术业务数据标准化的方法和系统 - Google Patents
一种实现医疗机构手术业务数据标准化的方法和系统 Download PDFInfo
- Publication number
- CN115238033A CN115238033A CN202210766572.5A CN202210766572A CN115238033A CN 115238033 A CN115238033 A CN 115238033A CN 202210766572 A CN202210766572 A CN 202210766572A CN 115238033 A CN115238033 A CN 115238033A
- Authority
- CN
- China
- Prior art keywords
- operation name
- matching
- name
- medical institution
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000012550 audit Methods 0.000 claims description 6
- 238000012552 review Methods 0.000 claims description 2
- 238000010561 standard procedure Methods 0.000 claims 1
- 238000013507 mapping Methods 0.000 description 8
- 238000002604 ultrasonography Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种实现医疗机构手术业务数据标准化的方法和系统,涉及数据标准化技术领域;利用Lucene创建标准数据索引,预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
Description
技术领域
本发明公开一种方法和系统,涉及数据标准化技术领域,具体地说是一种实现医疗机构手术业务数据标准化的方法和系统。
背景技术
数据治理是按照平台既有标准对采集数据合理化处理,对数据的获取、处理、使用进行监管。在医疗机构数据治理过程中,数据标准化是一份重要又繁琐的工作,而其中对医疗机构手术业务数据的标准化映射,因各个医疗机构的手术名称都会存在不同差异,需要人工进行标准化处理的工作量巨大,同时,又因每个人对医疗数据的认识不同,人工映射的过程也会存在差异或错误等各种局限。
发明内容
本发明针对现有技术的问题,提供一种实现医疗机构手术业务数据标准化的方法和系统,将不同医疗机构不同的手术码值与标准码值做映射形成手术业务数据的标准化。
本发明提出的具体方案是:
本发明提供一种实现医疗机构手术业务数据标准化的方法,利用Lucene创建标准数据索引,
预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
进一步,所述的方法中所述利用Lucene创建标准数据索引,包括:
选取标准数据版本,根据标准数据版本的手术名称创建标准数据索引。
进一步,所述的方法中所述根据标准手术名称将医疗机构手术名称进行拆分,包括:
通过Analyzer分词算法对医疗机构手术名称进行分词。
进一步,所述的方法中通过前端展示医疗机构手术业务数据标准化的过程。
进一步,所述的方法中通过前端展示:利用Analyzer分词算法对医疗机构手术名称进行分词,获得多个相应的手术名称,依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,
进一步,所述的方法中通过前端展示:经过智能匹配规则匹配出来的医疗机构手术名称和相应的标准数据,
并提供匹配查询数据按钮和匹配选择数据按钮进行相应操作。
进一步,所述的方法中通过人工审核方式对参考项进行审核,包括:
通过前端展示医疗机构手术名称的智能匹配分析结果,利用人工对智能匹配分析结果进行审核。
本发明还提供一种实现医疗机构手术业务数据标准化的系统,包括索引模块、分析模块和审核模块,
索引模块利用Lucene创建标准数据索引,
分析模块预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
审核模块通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
本发明的有益之处是:
本发明提供一种实现医疗机构手术业务数据标准化的方法,有完整的匹配流程和匹配规则,支持机器智能匹配,从而使匹配结果更加准确、快速,起到解放人力的作用。本发明方法支持待匹配数据可以跟人工已匹配的数据进行匹配,匹配方式多样化,并提供推荐标准数据,人工在匹配时可做参考,提高准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法智能匹配流程示意图。
图2是本发明方法人工审核流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明提供一种实现医疗机构手术业务数据标准化的方法,利用Lucene创建标准数据索引,
预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
本发明方法旨在能够辅助人工快速、正确的匹配码值,节省人力的同时提高匹配正确率。并且本发明方法在数据治理过程中医疗机构手术业务数据标准化映射起到巨大的作用。
具体应用中,在本发明方法的一些实施例中,具体过程可参考如下:
对标准数据创建索引,其中明确标准数据版本,利用Lucene对以下字段创建主索引:
一是手术名称,二是预处理后的手术名称,用于医疗机构手术名称与标准手术名称精准匹配;
预处理是指:手术名称会存在很多特殊字符,在Lucene创建索引的时候产生影响,所以在创建主索引时先去掉手术名称中的特殊字符。去掉的特殊字符如下:
对医疗机构手术名称拆分,根据标准手术名称将医疗机构手术名称进行拆分,得到多个手术名称,
进行智能匹配,将手术医疗机构数据与标准数据的匹配规则细化分为四级,规则如下:
第一级:首先将拆分出的手术名称与标准手术名称进行精准匹配。匹配过程中忽略表中特殊字符,例如表1:
表1
手术名称 | 标准手术名称 |
治疗性超声 | 治疗性超声 |
第二级:将拆分出的手术名称与专业人士提供的参照表进行精准匹配,匹配过程中忽略特殊字符,例如表2;
表2
手术名称 | 参照手术名称 |
心脏血管内非消融性超声 | 心脏血管治疗性超声 |
第三级:根据人工映射过的手术名称对拆分出的手术名称进行精准匹配;例如表3;
表3
第四级:手术名称模糊匹配;
若存在错误,四级匹配都不符合的数据进行相似度匹配后放入匹配错误项。
进一步,可利用前端展示匹配过程:
先通过Analyzer分词算法对医疗机构数据进行分词,然后依次执行智能匹配规则,再查找创建的标准数据索引,将得分最高的一项作为参考项。
将经过匹配规则匹配出来的医疗机构数据和相应的标准数据通过页面展示,提供“匹配查询数据”、“匹配选择数据”两个按钮方便人工操作。
通过匹配规则匹配出来的数据,一、二、三级分析出的数据符合医疗机构与标准匹配准确度为100%。
通过前端进行人工确认审核,一是为了审核机器匹配出来的数据,二是通过主观意识判断通过智能匹配意思模糊或者错误的数据。人工确认提供两种方式,如下。
在智能匹配分析进行匹配,主要是审核通过“智能分析”匹配出来的数据;
还可以在映射页面进行匹配,点击某条数据,映射工具会自动推荐匹配度最高的标准数据。
标准化实现过程中,医疗机构数据中手术名称通过Lucene分词和检索,医疗机构手术名称先通过检索对标准索引进行精准匹配,若匹配成功则返回数据,若匹配不成功则可再次通过Analyzer分词算法,对医疗机构手术名称进行分词再检索索引中是否有匹配标准名称,取得得分最高的一项返回给用户。
本发明方法利用智能分析+人工确认的方式进行数据标准化、智能分析辅助人工映射的方式实现医疗机构码值与标准码值映射;
智能匹配方式是基于分词和Lucene检索的基础上,对医疗机构数据进行四级规则判断、归类,提高准确率;
在人工确认过程中,会推荐Lucene检索得分最高一项标准数据,辅助人工做出决策,人工确认是基于业务人员的知识储备进行映射操作,随着匹配的数据增多,匹配的速度和准确率也将提高。
本发明还提供一种实现医疗机构手术业务数据标准化的系统,包括索引模块、分析模块和审核模块,
索引模块利用Lucene创建标准数据索引,
分析模块预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
审核模块通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
上述系统内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
同样地,本发明系统可以执行完整的匹配流程和匹配规则,支持机器智能匹配,从而使匹配结果更加准确、快速,起到解放人力的作用。本发明方法支持待匹配数据可以跟人工已匹配的数据进行匹配,匹配方式多样化,并提供推荐标准数据,人工在匹配时可做参考,提高准确率。
需要说明的是,上述各流程和各装置结构中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。
Claims (8)
1.一种实现医疗机构手术业务数据标准化的方法,其特征是利用Lucene创建标准数据索引,
预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
2.根据权利要求1所述的方法,其特征是所述利用Lucene创建标准数据索引,包括:
选取标准数据版本,根据标准数据版本的手术名称创建标准数据索引。
3.根据权利要求1或2所述的方法,其特征是所述根据标准手术名称将医疗机构手术名称进行拆分,包括:
通过Analyzer分词算法对医疗机构手术名称进行分词。
4.根据权利要求1所述的方法,其特征是通过前端展示医疗机构手术业务数据标准化的过程。
5.根据权利要求4所述的方法,其特征是通过前端展示:利用Analyzer分词算法对医疗机构手术名称进行分词,获得多个相应的手术名称,依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项。
6.根据权利要求4所述的方法,其特征是通过前端展示:经过智能匹配规则匹配出来的医疗机构手术名称和相应的标准数据,
并提供匹配查询数据按钮和匹配选择数据按钮进行相应操作。
7.根据权利要求4所述的方法,其特征是通过人工审核方式对参考项进行审核,包括:
通过前端展示医疗机构手术名称的智能匹配分析结果,利用人工对智能匹配分析结果进行审核。
8.一种实现医疗机构手术业务数据标准化的系统,其特征是包括索引模块、分析模块和审核模块,
索引模块利用Lucene创建标准数据索引,
分析模块预处理医疗机构手术名称并根据标准手术名称将医疗机构手术名称进行拆分,获得多个相应的手术名称,
依次根据四级智能匹配规则进行手术名称的智能匹配,查找创建的标准数据索引,获得匹配度最高的参考项,其中通过第一级匹配规则将所述手术名称与标准手术名称进行精准匹配,通过第二级匹配规则将所述手术名称与专业人士提供的参照表进行精准匹配,通过第三级匹配规则将所述手术名称与人工映射过的手术名称进行精准匹配,通过第四级匹配规则将所述手术名称进行模糊匹配,
审核模块通过人工审核方式对参考项进行审核,审核通过则完成医疗机构手术名称的标准化,否则通过人工再次匹配手术名称和标准数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210766572.5A CN115238033A (zh) | 2022-07-01 | 2022-07-01 | 一种实现医疗机构手术业务数据标准化的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210766572.5A CN115238033A (zh) | 2022-07-01 | 2022-07-01 | 一种实现医疗机构手术业务数据标准化的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115238033A true CN115238033A (zh) | 2022-10-25 |
Family
ID=83672236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210766572.5A Pending CN115238033A (zh) | 2022-07-01 | 2022-07-01 | 一种实现医疗机构手术业务数据标准化的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115238033A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116502A (zh) * | 2023-09-11 | 2023-11-24 | 北京和兴创联健康科技有限公司 | 基于人工智能和大数据构造手术画像知识图的方法和系统 |
-
2022
- 2022-07-01 CN CN202210766572.5A patent/CN115238033A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116502A (zh) * | 2023-09-11 | 2023-11-24 | 北京和兴创联健康科技有限公司 | 基于人工智能和大数据构造手术画像知识图的方法和系统 |
CN117116502B (zh) * | 2023-09-11 | 2024-04-05 | 北京和兴创联健康科技有限公司 | 基于人工智能和大数据构造手术画像知识图的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111797207B (zh) | 一种实现医院诊断数据标准化的方法 | |
CN109344250B (zh) | 基于医保数据的单病种诊断信息快速结构化方法 | |
CN109684468B (zh) | 针对循证医学的文献筛选标注系统 | |
WO2022027943A1 (zh) | 一种基于污染要素源解析的水污染溯源系统及方法 | |
US7853595B2 (en) | Method and apparatus for creating a tool for generating an index for a document | |
CN107908783A (zh) | 检索文本相关性的评估方法、装置、服务器和存储介质 | |
CN115238033A (zh) | 一种实现医疗机构手术业务数据标准化的方法和系统 | |
JP2019032704A (ja) | 表データ構造化システムおよび表データ構造化方法 | |
CN113284628A (zh) | 一种实现医疗机构检查字典数据标准化的方法 | |
Bonczar et al. | How to write an umbrella review? A step-by-step tutorial with tips and tricks | |
CN112214557B (zh) | 数据匹配分类方法及装置 | |
CN114238639A (zh) | 一种医学术语标准化框架的构建方法、装置、电子设备 | |
CN113674867A (zh) | 临床数据挖掘方法、装置、电子设备和存储介质 | |
CN112735545A (zh) | 自训练方法、模型、处理方法、装置及存储介质 | |
US20230185835A1 (en) | A system and method for examining relevancy of documents | |
CN115346607B (zh) | Dna样本查重方法及装置 | |
CN115954072A (zh) | 一种智能临床试验方案生成方法及相关装置 | |
CN113972009A (zh) | 一种基于临床检验医学大数据的医学检验咨询系统 | |
US20180039761A1 (en) | Method and system for automatically adding connectors during generation of a report | |
CN114496196A (zh) | 医疗实验室临床生化检验自动审核系统 | |
CN114186554A (zh) | 脚本数据处理方法、装置、计算机设备及存储介质 | |
CN114266260A (zh) | 一种应用于软件研发的内嵌式及时翻译系统 | |
CN115064237A (zh) | 一种实现医院体检总结数据标准化的方法 | |
CN111261244A (zh) | 一种样本信息采集存储系统及方法 | |
CN112541085B (zh) | 问卷的结构化方法、问卷的结构化装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |