CN115563127A - 基于大数据医疗通用检索索引构建的查询方法及系统 - Google Patents

基于大数据医疗通用检索索引构建的查询方法及系统 Download PDF

Info

Publication number
CN115563127A
CN115563127A CN202211407180.6A CN202211407180A CN115563127A CN 115563127 A CN115563127 A CN 115563127A CN 202211407180 A CN202211407180 A CN 202211407180A CN 115563127 A CN115563127 A CN 115563127A
Authority
CN
China
Prior art keywords
index
retrieval
metadata
query
dsl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211407180.6A
Other languages
English (en)
Other versions
CN115563127B (zh
Inventor
车涛锋
冷升锐
袁景
张伯慧
武思思
倪建伟
李云峰
陈一超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202211407180.6A priority Critical patent/CN115563127B/zh
Publication of CN115563127A publication Critical patent/CN115563127A/zh
Application granted granted Critical
Publication of CN115563127B publication Critical patent/CN115563127B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • G06F8/315Object-oriented languages
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了基于大数据医疗通用检索索引构建的查询方法及系统,该方法包括以下步骤:获取资源库数据表字段信息;根据已获取的资源库数据表字段信息,添加表关系信息,并将表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;调用ES接口,创建通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;根据查询关键词,匹配适配检索实体,并进行ES‑DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。本发明所提供的基于大数据医疗通用检索索引构建的查询方法及系统,仅通过配置既能实现适用于大数据医疗海量数据的病历、患者不同模式的复杂索引结构构建、查询、加工,而无需专业的编程开发人员定制开发。

Description

基于大数据医疗通用检索索引构建的查询方法及系统
技术领域
本发明涉及大数据医疗技术领域,具体涉及基于大数据医疗通用检索索引构建的查询方法及系统。
背景技术
现代属于大数据时代,各个行业大数据都在大规模增长,而与其他行业大数据相比较,医疗大数据更是具有数据增长速度快、保存周期长、粒度差异大、数据异构性强、带时空标记、特征维度高、隐私保护要求高等特点,对于医疗大数据的分析也与国民健康息息相关,且已经被广泛应用于临床诊疗、药物研发、卫生监测、公众健康、政策制定和执行等领域。医疗大数据涉及到电子病历、医学影像、医院视频等多种类型的数据,大数据医疗检索一般以患者维度、病历维度进行检索分析,各医疗数据涉及关联嵌套关系,也涉及敏感数据自动脱敏、多字段组合全文检索、检索多同义字段逻辑匹配等常用场景,需从索引结构、嵌套检索/聚合语法层面同步进行支持。
然而,大数据的高效检索仍是医疗大数据领域中的一个痛点,即便是目前已经出现如Elasticsearch的大数据检索引擎,但由于使用Elasticsearch需要一定的编程基础,且医疗领域的医务人员也不可能在工作之余花费大量时间去学习,因此,如何利用Elasticsearch在医疗大数据领域中实现适用于大数据医疗海量数据的病历、患者不同模式的复杂索引结构构建、查询、加工,而无需专业的编程开发人员定制开发,是目前需要解决的问题。
发明内容
本发明提供的基于大数据医疗通用检索索引构建的查询方法及系统,能够解决上述过程中的技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供了基于大数据医疗通用检索索引构建的查询方法,包括以下步骤:
S1:初始化资源库,获取资源库数据表字段信息;
S2:根据已获取的资源库数据表字段信息,添加表关系信息,并将所述资源库数据表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
S3:根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
S4:根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
在一些实施例中,所述S1还包括:
S11:对资源库数据表进行自动同步,更新资源库数据表字段信息。
在一些实施例中,所述S2中“添加表关系信息”包括:
S21:添加表级别属性,包括:表级别和表别名;
S22:添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段和导出属性设置;
S23:添加索引级别属性,包括:全局索引名称、别名、副本数和刷新时间。
在一些实施例中,所述S2还包括:
S24:根据已获得的索引元数据,构建元数据Restful服务;
S25:通过元数据Restful服务,提供访问API,对索引元数据进行管理。
在一些实施例中,所述S3包括:
S31:根据病历和患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL,完成索引构建;
S32:设置模板代码包配置信息,并根据病历和患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
在一些实施例中,所述S4包括:
S41:根据索引元数据,获取元数据信息,包括检索方式、字段类型和索引表级别配置;
S42:根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
S43:使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
第二方面,本发明提供了基于大数据医疗通用检索索引构建的查询系统,包括:
资源库管理模块,用于初始化资源库,获取资源库数据表字段信息;
索引元数据管理模块,用于根据已获取的资源库数据表字段信息,添加表关系信息,并将所述资源库数据表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
索引构建模块,用于根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
查询模块,用于根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
在一些实施例中,所述资源库管理模块还包括:
资源库更新子模块,用于对资源库数据表进行自动同步,更新资源库数据表字段信息。
在一些实施例中,所述索引元数据管理模块包括:
表级别添加子模块,用于添加表级别属性,包括:表级别和表别名;
字段级别添加子模块,用于添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段和导出属性设置;
索引级别添加子模块,用于添加索引级别属性,包括:全局索引名称、别名、副本数和刷新时间。
在一些实施例中,所述索引元数据管理模块还包括:
Restful服务构建子模块,用于根据已获得的索引元数据,构建元数据Restful服务;
元数据管理子模块,用于通过元数据Restful服务,提供访问API,对索引元数据进行管理。
在一些实施例中,所述索引构建模块包括:
索引构建子模块,用于根据病历和患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL,完成索引构建;
代码封装子模块,用于设置模板代码包配置信息,并根据病历和患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
在一些实施例中,所述查询模块包括:
元数据信息获取子模块,用于根据索引元数据,获取元数据信息,包括检索方式、字段类型和索引表级别配置;
检索语法生成子模块,用于根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
语句封装子模块,用于使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
第三方面,本发明提供了一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一项所述的方法。
本申请的有益效果是:
本申请提供的基于大数据医疗通用检索索引构建的查询方法及系统,基于索引元数据管理的检索方式、字段类型、索引表级别配置等元数据信息,使用Java语言实现按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法模板化封装,及ES-DSL语句逻辑组装,将最终组装ES-DSL语句通过ES集群解析执行后获取结果,通过Java序列化实现按配置脱敏、导出等二次加工,仅通过配置既能实现适用于大数据医疗海量数据的病历、患者不同模式的复杂索引结构构建、查询、加工,而无需专业的编程开发人员定制开发。
附图说明
图1为本申请的基于大数据医疗通用检索索引构建的查询方法流程图;
图2为本申请步骤S1的子流程图;
图3为本申请步骤S2的子流程图;
图4为本申请步骤S3的子流程图;
图5为本申请步骤S4的子流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本公开,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
图1为基于大数据医疗通用检索索引构建的查询方法流程图。
基于大数据医疗通用检索索引构建的查询方法,结合图1,包括以下步骤:
S1:初始化资源库,获取资源库数据表字段信息;
在一些实施例中,结合图2即本方案步骤S1的子流程图,所述S1还包括:
S11:对资源库数据表进行自动同步,更新资源库数据表字段信息。
具体的,本方案中的数据是从现有的医疗数据库中获取的,医疗数据库中包含了海量的医疗数据,也就包含了很多的数据表,同时医疗数据库的数据也是在不断更新的,因此,为了保证资源库数据表字段信息的准确性,资源库数据表也需要根据医疗数据库来进行自动同步更新的。
S2:根据已获取的资源库数据表字段信息,添加表关系信息,并将所述表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
在一些实施例中,结合图3即本方案步骤S2的子流程图,所述S2中“添加表关系信息”包括:
S21:添加表级别属性,包括:表级别、表别名;
S22:添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段、导出属性设置;
S23:添加索引级别属性,包括:全局索引名称、别名、副本数、刷新时间。
S24:根据已获得的索引元数据,构建元数据Restful服务。
具体的,元数据的作用包括描述数据、组织管理数据,因此,对于表结构来说,元数据就包括了表名、字段、字段类型等表字段信息;而对于表之间关系来讲,元数据则包括了表级别属性、字段级别属性、索引级别属性等。因此,获取了表字段信息以及表关系信息即可得到索引元数据。而为了便于索引元数据的管理,本方案构建了元数据Restful服务,具体的,通过元数据Restful服务提供对从医疗大数据模型映射过来的索引组成部分(表映射为索引元数据,表字段映射为元字段)的访问API,支撑上层业务对索引元数据、元字段的管理配置;同时,通过ES搜索主题、ES检索导航,映射底层索引结构,上层业务可以灵活组合展现病历、患者索引数据。
S3:根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
具体的,在获取了所需要的索引元数据之后,即可调用ES接口,自动构建病历、患者两种维度的医疗通用检索索引结构,同时生成适配检索实体(JavaBean、含脱敏基于注解+数据库配置)、序列化配置、示例代码、医疗嵌套检索代码等模板代码。
在一些实施例中,结合图4即本方案步骤S3的子流程图,所述S3包括:
S31:根据病历、患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL完成索引构建;
具体的,读取ES元索引层级关系、ES元字段配置信息;按病历索引设计通过Springboot自研模块组装病历索引mapping结构json对象;在病历索引mapping结构外层,嵌套nested_record形成患者mapping结构json对象;组装预置settings参数json,将病历、患者mapping结构json分别与预置settings参数json按ES索引结构定义结构拼接形成病历、患者索引创建DSL;连接ES集群,提交病历、患者索引创建DSL完成索引构建。
S32:设置模板代码包配置信息,并根据病历、患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
具体的,读取ES元索引层级关系、ES元字段配置信息;设置模板代码包配置信息,如:com.abc.search,按病历、患者索引设计结构通过Springboot自研模块结合Freemarker模板引擎技术,读取预置模板,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
S4:根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
在一些实施例中,根据图5即本申请步骤S4的子流程图,所述S4包括:
S41:根据索引元数据,获取元数据信息,包括检索方式、字段类型、索引表级别配置;
S42:根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
S43:使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
具体的,基于索引元数据管理的检索方式、字段类型、索引表级别配置等元数据信息,使用Java语言实现按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法模板化封装,及ES-DSL语句逻辑组装,将最终组装ES-DSL语句通过ES集群解析执行后获取结果,通过Java序列化实现按配置脱敏、导出等二次加工,仅通过配置既能实现适用于大数据医疗海量数据的病历、患者不同模式的复杂索引结构构建、查询、加工,而无需专业的编程开发人员定制开发。
本发明第二方面还提供了基于大数据医疗通用检索索引构建的查询系统,包括:
资源库管理模块,用于初始化资源库,获取资源库数据表字段信息;
索引元数据管理模块,用于根据已获取的资源库数据表字段信息,添加表关系信息,并将所述表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
索引构建模块,用于根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
查询模块,用于根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
在一些实施例中,所述资源库管理模块还包括:
资源库更新子模块,用于对资源库数据表进行自动同步,更新资源库数据表字段信息。
在一些实施例中,所述索引元数据管理模块包括:
表级别添加子模块,用于添加表级别属性,包括:表级别、表别名;
字段级别添加子模块,用于添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段、导出属性设置;
索引级别添加子模块,用于添加索引级别属性,包括:全局索引名称、别名、副本数、刷新时间。
在一些实施例中,所述索引元数据管理模块还包括:
Restful服务构建子模块,用于根据已获得的索引元数据,构建元数据Restful服务;
元数据管理子模块,用于通过元数据Restful服务,提供访问API,对索引元数据进行管理。
在一些实施例中,所述索引构建模块包括:
索引构建子模块,用于根据病历、患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL完成索引构建;
代码封装子模块,用于设置模板代码包配置信息,并根据病历、患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
在一些实施例中,所述查询模块包括:
元数据信息获取子模块,用于根据索引元数据,获取元数据信息,包括检索方式、字段类型、索引表级别配置;
检索语法生成子模块,用于根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
语句封装子模块,用于使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
本发明第三方面还提供了一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的方法。
本发明第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一项所述的方法。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (14)

1.基于大数据医疗通用检索索引构建的查询方法,其特征在于,包括以下步骤:
S1:初始化资源库,获取资源库数据表字段信息;
S2:根据已获取的资源库数据表字段信息,添加表关系信息,并将所述资源库数据表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
S3:根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
S4:根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
2.根据权利要求1所述的基于大数据医疗通用检索索引构建的查询方法,其特征在于,所述S1还包括:
S11:对资源库数据表进行自动同步,更新资源库数据表字段信息。
3.根据权利要求1所述的基于大数据医疗通用检索索引构建的查询方法,其特征在于,所述S2中“添加表关系信息”包括:
S21:添加表级别属性,包括:表级别和表别名;
S22:添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段和导出属性设置;
S23:添加索引级别属性,包括:全局索引名称、别名、副本数和刷新时间。
4.根据权利要求3所述的基于大数据医疗通用检索索引构建的查询方法,其特征在于,所述S2还包括:
S24:根据已获得的索引元数据,构建元数据Restful服务;
S25:通过元数据Restful服务,提供访问API,对索引元数据进行管理。
5.根据权利要求1所述的基于大数据医疗通用检索索引构建的查询方法,其特征在于,所述S3包括:
S31:根据病历和患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL,完成索引构建;
S32:设置模板代码包配置信息,并根据病历和患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
6.根据权利要求1所述的基于大数据医疗通用检索索引构建的查询方法,其特征在于,所述S4包括:
S41:根据索引元数据,获取元数据信息,包括检索方式、字段类型和索引表级别配置;
S42:根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
S43:使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
7.基于大数据医疗通用检索索引构建的查询系统,其特征在于,包括:
资源库管理模块,用于初始化资源库,获取资源库数据表字段信息;
索引元数据管理模块,用于根据已获取的资源库数据表字段信息,添加表关系信息,并将所述资源库数据表字段信息以及表关系信息作为索引元数据存储在索引元数据管理模块中;
索引构建模块,用于根据所述索引元数据,调用ES接口,创建病历以及患者的通用检索索引结构,同时生成适配检索实体以及序列化配置,并生成模板代码;
查询模块,用于根据查询关键词,匹配适配检索实体,并进行ES-DSL语句逻辑组装,通过ES集群解析执行后获取查询结果。
8.根据权利要求7所述的基于大数据医疗通用检索索引构建的查询系统,其特征在于,所述资源库管理模块还包括:
资源库更新子模块,用于对资源库数据表进行自动同步,更新资源库数据表字段信息。
9.根据权利要求7所述的基于大数据医疗通用检索索引构建的查询系统,其特征在于,所述索引元数据管理模块包括:
表级别添加子模块,用于添加表级别属性,包括:表级别和表别名;
字段级别添加子模块,用于添加字段级别属性,包括:同义词、字段检索方式、元字段分组、脱敏方式、加工字段、字词器、虚拟字段、浅加工是否型字段和导出属性设置;
索引级别添加子模块,用于添加索引级别属性,包括:全局索引名称、别名、副本数和刷新时间。
10.根据权利要求9所述的基于大数据医疗通用检索索引构建的查询系统,其特征在于,所述索引元数据管理模块还包括:
Restful服务构建子模块,用于根据已获得的索引元数据,构建元数据Restful服务;
元数据管理子模块,用于通过元数据Restful服务,提供访问API,对索引元数据进行管理。
11.根据权利要求7所述的基于大数据医疗通用检索索引构建的查询系统,其特征在于,所述索引构建模块包括:
索引构建子模块,用于根据病历和患者索引结构,构建病历json对象以及患者json对象,生成病历索引创建DSL以及患者索引创建DSL,并连接ES集群,提交病历索引创建DSL以及患者索引创建DSL,完成索引构建;
代码封装子模块,用于设置模板代码包配置信息,并根据病历和患者索引结构,生成适配检索实体以及序列化配置、ES-DSL嵌套查询封装工程代码。
12.根据权利要求7所述的基于大数据医疗通用检索索引构建的查询系统,其特征在于,所述查询模块包括:
元数据信息获取子模块,用于根据索引元数据,获取元数据信息,包括检索方式、字段类型和索引表级别配置;
检索语法生成子模块,用于根据查询关键词,生成按ES检索匹配模式、数据类型、数据类型属性及匹配策略的检索语法;
语句封装子模块,用于使用Java语言将已得到的检索语法进行ES-DSL语句逻辑组装,并通过ES集群解析执行后获取查询结果。
13.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一项所述的方法。
CN202211407180.6A 2022-11-10 2022-11-10 基于大数据医疗通用检索索引构建的查询方法及系统 Active CN115563127B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211407180.6A CN115563127B (zh) 2022-11-10 2022-11-10 基于大数据医疗通用检索索引构建的查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211407180.6A CN115563127B (zh) 2022-11-10 2022-11-10 基于大数据医疗通用检索索引构建的查询方法及系统

Publications (2)

Publication Number Publication Date
CN115563127A true CN115563127A (zh) 2023-01-03
CN115563127B CN115563127B (zh) 2023-02-24

Family

ID=84769941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211407180.6A Active CN115563127B (zh) 2022-11-10 2022-11-10 基于大数据医疗通用检索索引构建的查询方法及系统

Country Status (1)

Country Link
CN (1) CN115563127B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913497A (zh) * 2023-09-14 2023-10-20 深圳市微能信息科技有限公司 基于大数据的社区慢性病精准管理系统及方法
CN117453752A (zh) * 2023-12-25 2024-01-26 神州医疗科技股份有限公司 基于检索配置表数据模型的医院临床数据检索方法及装置
CN117951255A (zh) * 2024-03-13 2024-04-30 吉林大学第一医院 医疗数据检索方法、装置及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170199875A1 (en) * 2016-01-08 2017-07-13 Microsoft Technology Licensing, Llc Database operation using metadata of data sources
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN112131295A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 基于Elasticsearch的数据处理方法及设备
CN114356954A (zh) * 2021-10-12 2022-04-15 上海羚数智能科技有限公司 一种RESTful架构下的通用查询DSL方法
CN114496140A (zh) * 2021-12-31 2022-05-13 医渡云(北京)技术有限公司 查询条件的数据匹配方法、装置、设备及介质
CN114579598A (zh) * 2022-01-27 2022-06-03 浙江大华技术股份有限公司 分析型数据库和全文检索引擎的融合方法以及相关装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170199875A1 (en) * 2016-01-08 2017-07-13 Microsoft Technology Licensing, Llc Database operation using metadata of data sources
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN112131295A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 基于Elasticsearch的数据处理方法及设备
CN114356954A (zh) * 2021-10-12 2022-04-15 上海羚数智能科技有限公司 一种RESTful架构下的通用查询DSL方法
CN114496140A (zh) * 2021-12-31 2022-05-13 医渡云(北京)技术有限公司 查询条件的数据匹配方法、装置、设备及介质
CN114579598A (zh) * 2022-01-27 2022-06-03 浙江大华技术股份有限公司 分析型数据库和全文检索引擎的融合方法以及相关装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913497A (zh) * 2023-09-14 2023-10-20 深圳市微能信息科技有限公司 基于大数据的社区慢性病精准管理系统及方法
CN116913497B (zh) * 2023-09-14 2023-12-08 深圳市微能信息科技有限公司 基于大数据的社区慢性病精准管理系统及方法
CN117453752A (zh) * 2023-12-25 2024-01-26 神州医疗科技股份有限公司 基于检索配置表数据模型的医院临床数据检索方法及装置
CN117453752B (zh) * 2023-12-25 2024-03-19 神州医疗科技股份有限公司 基于检索配置表数据模型的医院临床数据检索方法及装置
CN117951255A (zh) * 2024-03-13 2024-04-30 吉林大学第一医院 医疗数据检索方法、装置及相关设备

Also Published As

Publication number Publication date
CN115563127B (zh) 2023-02-24

Similar Documents

Publication Publication Date Title
CN115563127B (zh) 基于大数据医疗通用检索索引构建的查询方法及系统
US9128996B2 (en) Uniform data model and API for representation and processing of semantic data
US7689555B2 (en) Context insensitive model entity searching
US8972459B2 (en) Data change tracking and event notification
US8195647B2 (en) Abstract records
US7792783B2 (en) System and method for semantic normalization of healthcare data to support derivation conformed dimensions to support static and aggregate valuation across heterogeneous data sources
US8140557B2 (en) Ontological translation of abstract rules
US8595231B2 (en) Ruleset generation for multiple entities with multiple data values per attribute
CN105518669B (zh) 数据模型改变管理
US20220253484A1 (en) Dynamically-qualified aggregate relationship system in genealogical databases
US9147040B2 (en) Point-in-time query system
CN110399359B (zh) 一种数据回溯方法、装置及设备
US20120124080A1 (en) Method, apparatus and computer program product for utilizing dynamically defined java implementations for creation of an efficient typed storage
US20090112794A1 (en) Aliased keys for federated database queries
US8380493B2 (en) Association of semantic meaning with data elements using data definition tags
WO2020117655A1 (en) System and method for ingesting data
Sen et al. An ontology-based approach to designing a NoSQL database for semi-structured and unstructured health data
Satti et al. Semantic bridge for resolving healthcare data interoperability
US9122985B2 (en) Programmatic access to terminologies expressed in hierarchical form
CN105518670B (zh) 用于模型查询的数据模型索引
JP2024504556A (ja) データ処理システムによって管理されるデータエンティティにアクセスするためのシステム及び方法
Macía Towards a semantic interoperability environment
Sachdeva et al. AQBE–QBE style queries for archetyped data
Abdalla A new approach for the integration of heterogeneous databases and information systems
CN117038002B (zh) 一种药物评价研究中生成观察变量的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant