CN107273405B - 基于MeSH表的电子病历档案的智能检索系统 - Google Patents

基于MeSH表的电子病历档案的智能检索系统 Download PDF

Info

Publication number
CN107273405B
CN107273405B CN201710288731.4A CN201710288731A CN107273405B CN 107273405 B CN107273405 B CN 107273405B CN 201710288731 A CN201710288731 A CN 201710288731A CN 107273405 B CN107273405 B CN 107273405B
Authority
CN
China
Prior art keywords
subject
medical record
retrieval
unit
index database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710288731.4A
Other languages
English (en)
Other versions
CN107273405A (zh
Inventor
巫涤峰
童永安
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wisefly Technology Co ltd
Original Assignee
Wisefly Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wisefly Technology Co ltd filed Critical Wisefly Technology Co ltd
Priority to CN201710288731.4A priority Critical patent/CN107273405B/zh
Publication of CN107273405A publication Critical patent/CN107273405A/zh
Application granted granted Critical
Publication of CN107273405B publication Critical patent/CN107273405B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种基于MeSH表的电子病历档案的智能检索系统,包括初始化单元、索引数据库构建单元、主题词组配单元以及智能检索排序单元,其中,首先通过初始化单元进行维护MeSH表,所述MeSH表包含主题词表格栏、主题词代码表格栏、款目词表格栏和可组配副主题词表格栏;通过索引数据库构建单元以病历档案编号作为索引数据库主键结合MeSH表构建索引数据库,主题词组配单元在索引数据库基础上用于主题词组配,最后通过智能检索排序单元进行智能检索排序,实现电子病历档案的智能检索,提高使用便利性。

Description

基于MeSH表的电子病历档案的智能检索系统
技术领域
本发明涉及医疗技术领域,特别是指一种基于MeSH表的电子病历档案的智能检索系统。
背景技术
电子病历系统采用电子设备来保存、管理、传输和重现数字化的病人的医疗记录,取代手写纸张病历。对于医院以及医护人员而言,患者的病程记录档案具有相当高的科研价值,是一种重要的医疗资源,可以为医护人员提供既往案例分析的材料,从而进一步提高诊疗水平。因此,开发一种以电子病历档案库为基础,针对某一检索词所进行的智能检索系统,具有极高的现实意义。
发明内容
针对背景技术中存在的问题,本发明的目的是提供一种基于MeSH表的电子病历档案的智能检索系统,实现电子病历档案的智能检索,提高使用便利性。
本发明的技术方案是这样实现的:一种基于MeSH表的电子病历档案的智能检索系统,包括初始化单元、索引数据库构建单元、主题词组配单元以及智能检索排序单元,其中,所述初始化单元:用于维护MeSH表,所述MeSH表包含主题词表格栏、主题词代码表格栏、款目词表格栏和可组配副主题词表格栏;
所述索引数据库构建单元:用于构建索引数据库,通过以病历档案编号作为索引数据库主键逐份进行统计,先根据病历档案首页将基本信息进行统计,再对病历档案的剩余部分,根据所述MeSH表逐个进行统计,直到所有病历都完成统计索引数据库;
所述主题词组配单元:用于主题词组配,首先用户在搜索框中输入所要检索的关键词,然后向系统发出检索请求,随后系统先在MeSH表的款目词中检索是否有这个词汇,如果没有,返回“没有相应主题词”的结果;如果在款目词中找到了这一检索词,则返回相应的主题词;随后用户根据这一主题词选择是否组配副主题词,如果选择结果为假,则进入下一步;如果选择结果为真,则系统返回这一主题词所对应的能组配的副主题词;用户在可供选择的副主题词表中选择目的副主题词,完成后判断是否需要组配特殊检索条件,组配完成后,则进入智能检索排序单元;
所述智能检索排序单元:在智能检索中,首先根据以下公式进行相关性运算:
χ=α出院诊断×2+β入院诊断×1.5+δ主题词×0.2;其中,α出院诊断、β入院诊断的可取值范围为0或1,而δ主题词则是所检索主题词出现的次数;将索引数据库中的每一份病历根据上述公式进行运算,得到索引值分布表;将该表进行分区,将同时满足年龄与性别检索要求的置放于I区,只满足年龄与性别检索要求的置放于II区,两者均不满足的置放于III区;将该表个分区内的结果进行降序排列,则表中从上至下为检索结果的排列顺序;将排序结果返回到用户终端,则呈现于用户的则为根据主题词组配所检索得的病历检索结果。
在上述技术方案中,所述病历档案的基本信息包括入院诊断、出院诊断、年龄和性别。
在上述技术方案中,所述病历档案的剩余部分包括病程记录和处方记录。
本发明基于MeSH表的电子病历档案的智能检索系统,初始化单元、索引数据库构建单元、主题词组配单元以及智能检索排序单元,其中,通过初始化单元进行维护MeSH表,而MeSH表分为主题词表格栏和副主题词表格栏以及款目词表格栏;通过索引数据库构建单元以病历档案编号作为索引数据库主键结合MeSH表构建索引数据库,主题词组配单元在索引数据库基础上用于主题词组配,最后通过智能检索排序单元进行智能检索排序,实现电子病历档案的智能检索,提高使用便利性。
附图说明
图1为本发明智能检索系统中索引数据库构建流程示意图;
图2为本发明智能检索系统中人机交互流程示意图;
图3为本发明智能检索系统中智能检索排序流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所述的一种基于MeSH表的电子病历档案的智能检索系统,包括初始化单元、索引数据库构建单元、主题词组配单元以及智能检索排序单元。
以下是对上述各单元执行的详细说明:
(1)始化单元:
在初始化单元中,主要维护MeSH表。
由于在检索病历时,某些词汇会有多种名称,例如肝癌/肝肿瘤,老年痴呆/早老性痴呆/阿尔兹海默症等,使得如果检索一个词汇容易发生漏检,只能检索到所输入检索词对应的内容。为了解决这一问题,需要引入MeSH表,这一MeSH表的最大特征是准确性和专指性,分为主题词表和副主题词表,对于一个主题词,只能组配其中的某一些副主题词,比如选择主题词为“链球菌感染”后,可选择的副主题词为“红霉素/治疗应用”,这样就能组配出指向应用了红霉素治疗的链球菌感染病人的检索词。
在主题词表中,还需要有相关参照,比如“肝肿瘤”这一主题词之下会有相当的款目词,比如“肝癌”等。
主题词表示例如下:
Figure BDA0001281377140000041
这一主题词表成树状结构,按照每个词的词义范畴和学科属性,逐步进行戏分,例如肺肿瘤下又可以细分为“肺小细胞癌”等。
(2)索引数据库构建单元:
索引的作用相当于图书中的目录,可以根据目录中的页码快速找到所需的内容。由于电子病历档案数量非常庞大,如果要针对某一检索词逐个逐个对这些电子病历进行查询,计算量非常庞大。针对这一问题,我们构建一个索引数据库,根据主题词对这电子病历档案进行关键词统计,以巨大表格的形式将统计结果记录在这个索引数据库中。
这一索引数据库是分范畴的,其中的主要组成部分是医学主题词表对应的计数值,其他组成部分则是“入院诊断”、“出院诊断”、“年龄”、“性别”等范畴。统计时,根据病历档案逐份逐份进行统计,先根据病案首页进行统计,将“入院诊断”、“出院诊断”、“年龄”、“性别”这些基本信息统计完成之后,再对电子病历档案的剩余部分(病程记录、处方记录等),针对各个主题词逐个进行统计,直到所有病历都完成统计索引数据库示例如下:
病历档案编号 入院诊断 出院诊断 ... J10.1.2.12
2000010100
2000010102
其流程如图1所示。
(3)主题词组配单元:
主题词组配这一过程是经过反复的人机交互过程完成的。
在主题词组配这一过程中,首先用户在搜索框中输入所要检索的关键词,然后向系统发出检索请求,随后系统先在MeSH表的款目词中检索是否有这个词汇,如果没有,返回“没有相应主题词”的结果;如果在款目词中找到了这一检索词,则返回相应的主题词。随后用户根据这一主题词选择是否组配副主题词,如果选择结果为假,则进入下一步;如果选择结果为真,则系统返回这一主题词所对应的能组配的副主题词。用户在可供选择的副主题词表中选择目的副主题词,完成后判断是否需要组配特殊检索条件,比如“年龄”、“性别”等。组配完成后,则进入智能检索环节,其中,人机交互流程如图2所示。
(4)智能检索排序单元:
在智能检索中,首先要进行的是相关性运算。相关性的计算公式如下:
χ=α出院诊断×2+β入院诊断×1.5+δ主题词×0.2;
其中,α出院诊断、β入院诊断的可取值范围为0或1,而δ主题词则是所检索主题词出现的次数。将索引数据库中的每一份病历根据上述公式进行运算,得到索引值分布表。将该表进行分区,将同时满足年龄与性别检索要求的置放于I区,只满足年龄与性别检索要求的置放于II区,两者均不满足的置放于III区。
将该表个分区内的结果进行降序排列,则表中从上至下为检索结果的排列顺序。将排序结果返回到用户终端,则呈现于用户的则为根据主题词组配所检索得的病历检索结果,其中,流程如图3所示。
以下是结合一具体实例进行的进一步说明:
医生A想要检索年龄在40岁以上患有胃出血并服用了善宁的男性患者病历,从而对现有的一名45岁胃出血男性病人进行案例分析。
对应的检索方法是,通过首先在检索框中输入“胃出血”,进行款目词检索后,系统返回对应的主题词是“消化道出血”,则用户选定“消化道出血”为主题词。选定该主题词后,用户判断需要进行副主题词组配,则系统返回副主题词列表,副主题词列表中包括“手术治疗”、“药物治疗”等多项,则选择“药物治疗”进入次级主题词列表,选定该级列表中的“善宁”,完成副主题词组配。最后进行年龄与性别的特殊检索条件的组配,选定“40岁+”、“男性”,完成主题词组配,进入检索环节。
在智能检索环节经过对索引数据库进行计算,各病历的相关度值以及年龄性别匹配情况如下表所示:
病历列表编号 相关度 年龄 性别
2000010100 1.0 1 1
2000010102 3.0 1 0
2000010103 5.0 0 1
2000010105 3.0 1 1
2000010108 4.0 1 1
2000010110 2.0 0 0
经过年龄与性别的检索结果进行分区之后:
Figure BDA0001281377140000061
Figure BDA0001281377140000071
则检索结果的排序如上表所示。
故,本发明基于MeSH表的电子病历档案的智能检索系统,具有以下有益效果:
1.该系统采用医学主题词表(MeSH表)作为索引数据库的主要构成结构主要是MeSH表中的多个款目词构成了主题词的入口,能够通过款目词映射到主题词,从而针对目标关键词对索引数据库进行全面的检索,避免了因为所检索的关键词还有多种表达而发生漏检的情况,大大降低了漏检率。
2.本系统在基于MeSH主题词表之上建立了索引数据库,根据一个相关度计算公式,计算索引数据库中各个病历的相关度,同时根据年龄与性别判定情况建立三个分区,将最符合检索目标关键词组配的病历置于最上面,检索结果排序按相关度依次递减,准确度比普通的检索方法要高。
3.在普通的检索中,进行检索关键词的组配常常无法区分层次,导致匹配的准确率降低。而在基于MeSH词表的病历检索方法中,由于组配方法分为主题词组配和副主题词组配,使得用户能在各个并列的主题词下进行进一步的副主题词组配,而且各个主题词有对应的可组配副主题词列表,更符合实际需求。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于MeSH表的电子病历档案的智能检索系统,其特征在于:包括初始化单元、索引数据库构建单元、主题词组配单元以及智能检索排序单元,其中,
所述初始化单元:用于维护MeSH表,所述MeSH表包含主题词表格栏、主题词代码表格栏、款目词表格栏和可组配副主题词表格栏;
所述索引数据库构建单元:用于构建索引数据库,通过以病历档案编号作为索引数据库主键逐份进行统计,先根据病历档案首页将基本信息进行统计,再对病历档案的剩余部分,根据所述MeSH表逐个进行统计,直到所有病历都完成统计索引数据库;
所述主题词组配单元:用于主题词组配,首先用户在搜索框中输入所要检索的关键词,然后向系统发出检索请求,随后系统先在MeSH表的款目词中检索是否有这个词汇,如果没有,返回“没有相应主题词”的结果;如果在款目词中找到了这一检索词,则返回相应的主题词;随后用户根据这一主题词选择是否组配副主题词,如果选择结果为假,则进入下一步;如果选择结果为真,则系统返回这一主题词所对应的能组配的副主题词;用户在可供选择的副主题词表中选择目的副主题词,完成后判断是否需要组配特殊检索条件,组配完成后,则进入智能检索排序单元;
所述智能检索排序单元:在智能检索中,首先根据以下公式进行相关性运算:
χ=α出院诊断×2+β入院诊断×1.5+δ主题词×0.2;
其中,α出院诊断、β入院诊断的可取值范围为0或1,而δ主题词则是所检索主题词出现的次数;将索引数据库中的每一份病历根据上述公式进行运算,得到索引值分布表;
将该表进行分区,将同时满足年龄与性别检索要求的置放于I区,只满足年龄与性别检索要求的置放于II区,两者均不满足的置放于III区;
将该表各分区内的结果进行降序排列,则表中从上至下为检索结果的排列顺序;将排序结果返回到用户终端,则呈现于用户的则为根据主题词组配所检索得的病历检索结果。
2.根据权利要求1所述的基于MeSH表的电子病历档案的智能检索系统,其特征在于:所述病历档案的基本信息包括入院诊断、出院诊断、年龄和性别。
3.根据权利要求1所述的基于MeSH表的电子病历档案的智能检索系统,其特征在于:所述病历档案的剩余部分包括病程记录和处方记录。
CN201710288731.4A 2017-04-27 2017-04-27 基于MeSH表的电子病历档案的智能检索系统 Expired - Fee Related CN107273405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710288731.4A CN107273405B (zh) 2017-04-27 2017-04-27 基于MeSH表的电子病历档案的智能检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710288731.4A CN107273405B (zh) 2017-04-27 2017-04-27 基于MeSH表的电子病历档案的智能检索系统

Publications (2)

Publication Number Publication Date
CN107273405A CN107273405A (zh) 2017-10-20
CN107273405B true CN107273405B (zh) 2020-12-18

Family

ID=60073617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710288731.4A Expired - Fee Related CN107273405B (zh) 2017-04-27 2017-04-27 基于MeSH表的电子病历档案的智能检索系统

Country Status (1)

Country Link
CN (1) CN107273405B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992630A (zh) * 2017-12-26 2018-05-04 医渡云(北京)技术有限公司 医疗数据检索方法及装置、存储介质、电子设备
CN109753516B (zh) * 2019-01-31 2021-08-10 北京嘉和海森健康科技有限公司 一种病历搜索结果的排序方法和相关装置
CN116305301B (zh) * 2023-05-26 2023-07-28 南昌工程学院 人员电子档案数据保护方法及系统
CN116719926B (zh) * 2023-08-10 2023-10-20 四川大学 基于智慧医疗的先天性心脏病报告数据筛选方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1178935A (zh) * 1997-08-30 1998-04-15 刘树根 世界文百语转换装置和方法
CN101034410A (zh) * 2007-04-16 2007-09-12 浙江大学 一种医疗事件索引模型及基于该模型的电子病历系统
US8135730B2 (en) * 2009-06-09 2012-03-13 International Business Machines Corporation Ontology-based searching in database systems
CN102426583A (zh) * 2011-10-10 2012-04-25 北京工业大学 基于图像内容分析的中医舌象检索方法
WO2013047471A1 (ja) * 2011-09-27 2013-04-04 株式会社ぐるなび 店舗情報検索システム
CN104572675A (zh) * 2013-10-16 2015-04-29 中国人民解放军南京军区南京总医院 一种相似病历检索的系统及方法
CN107256222A (zh) * 2017-04-27 2017-10-17 广州慧扬健康科技有限公司 基于自由词检索的电子病历快速检索系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1178935A (zh) * 1997-08-30 1998-04-15 刘树根 世界文百语转换装置和方法
CN101034410A (zh) * 2007-04-16 2007-09-12 浙江大学 一种医疗事件索引模型及基于该模型的电子病历系统
US8135730B2 (en) * 2009-06-09 2012-03-13 International Business Machines Corporation Ontology-based searching in database systems
WO2013047471A1 (ja) * 2011-09-27 2013-04-04 株式会社ぐるなび 店舗情報検索システム
CN102426583A (zh) * 2011-10-10 2012-04-25 北京工业大学 基于图像内容分析的中医舌象检索方法
CN104572675A (zh) * 2013-10-16 2015-04-29 中国人民解放军南京军区南京总医院 一种相似病历检索的系统及方法
CN107256222A (zh) * 2017-04-27 2017-10-17 广州慧扬健康科技有限公司 基于自由词检索的电子病历快速检索系统

Also Published As

Publication number Publication date
CN107273405A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN111986770B (zh) 药方用药审核方法、装置、设备及存储介质
CN109753516B (zh) 一种病历搜索结果的排序方法和相关装置
CN107273405B (zh) 基于MeSH表的电子病历档案的智能检索系统
CN110413734B (zh) 一种医疗服务的智能搜索系统及方法
JP5616335B2 (ja) サーチエンジンインデックス内の結合データに対するクエリ
US20120290328A1 (en) Searching an electronic medical record
CN104572675B (zh) 一种相似病历检索的系统及方法
US20050015381A1 (en) Database management system
CN104199855B (zh) 一种针对中医药学信息的检索系统和方法
CN110299209B (zh) 相似病历查找方法、装置、设备及可读存储介质
GB2293667A (en) Database management system
US11294938B2 (en) Generalized distributed framework for parallel search and retrieval of unstructured and structured patient data across zones with hierarchical ranking
EP2989561A1 (en) Database management system
CN115497631A (zh) 一种临床科研大数据分析系统
CN111341458B (zh) 基于多层级结构相似度的单基因病名称推荐方法和系统
CN111061835B (zh) 查询方法及装置、电子设备和计算机可读存储介质
CN107193996B (zh) 相似病历匹配检索系统
CN111091883B (zh) 一种医疗文本处理方法、装置、存储介质及设备
US20050080773A1 (en) Network drawing system and network drawing method
FEINSTEIN et al. Estimating prognosis with the aid of a conversational-mode computer program
CN107256222B (zh) 基于自由词检索的电子病历快速检索系统
Hirano et al. Mining typical order sequences from ehr for building clinical pathways
CN110010231A (zh) 一种数据处理系统及计算机可读存储介质
CN113380416A (zh) 一种区域医疗数据快速检索方法
Castaño et al. Evaluating the performance of a terminology search engine using historical data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201218