CN113064960A - 一种精确搜索与患者病情相似病例的方法 - Google Patents

一种精确搜索与患者病情相似病例的方法 Download PDF

Info

Publication number
CN113064960A
CN113064960A CN202010003262.9A CN202010003262A CN113064960A CN 113064960 A CN113064960 A CN 113064960A CN 202010003262 A CN202010003262 A CN 202010003262A CN 113064960 A CN113064960 A CN 113064960A
Authority
CN
China
Prior art keywords
patient
case
cases
similar
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010003262.9A
Other languages
English (en)
Inventor
邱志民
谢纵宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Chuangjingu Technology Co ltd
Original Assignee
Guangzhou Chuangjingu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Chuangjingu Technology Co ltd filed Critical Guangzhou Chuangjingu Technology Co ltd
Priority to CN202010003262.9A priority Critical patent/CN113064960A/zh
Publication of CN113064960A publication Critical patent/CN113064960A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种精确搜索与患者病情相似病例的方法,本发明利用病例信息来构建疾病的特征模型与患者的初步病情信息、体征、年龄、性别等可以轻易获取到的信息进行匹配,用于诊治医生的辅助诊断与治疗方案的推荐。本发明通过精确匹配相似病例来解决诊治医生需要多次通过关键字搜索符合病例,不能快速搜索到相关治疗方案的问题,以实现诊治医生能快速诊治患者,快速制定符合患者的治疗方案,提高诊治医生的诊治效率。

Description

一种精确搜索与患者病情相似病例的方法
技术领域
本发明涉及一种用于辅助诊断的精确匹配相似病例的方法,属于医学数据搜索领域。
背景技术
当医生遇到难以断定的病况时常常需要根据当前患者的症状参考已有病例的治疗方案。同一种疾病在不同的患者上都是不同的病况,治疗方法各有差异,就像中医一样,对症下药,药方都不是固定的。
现有的搜索方式都是基于关键词搜索后再人为设置年龄段与性别再进行病例过滤,这样搜索速度慢,效果体验差,不能把最匹配的病例置顶,医生还需要人为的点开每个过滤出来的病例再查看一遍,来选择最匹配目前患者的病例。正因此,急需一种能快速并精确搜索出与患者病情匹配的搜索方法,帮助医生快速诊断患者的病情,开出对症的药,及时解决患者的病情。
发明内容
为了克服上述现有技术的不足,本发明提供了一种精确搜索与患者病情相似病例的方法,本发明的目的是利用患者的初步病情信息、体征、年龄、性别等可以轻易获取到的信息,到病例数据库中寻找匹配相似的案例,再按相似值从大到小进行排序并推送给主治医生,用于辅助诊断与治疗方案的初步生成。
为了达到上述目的,本发明其特征在于以下步骤:
步骤1、构建Item Profile 1xN维矩阵
所有物体都有一个描述它的属性,这些描述属性来构造它的唯一性。每个病例都是唯一的,病例中的每个信息就是病例属性。所以可以将病例中的信息用自然语言处理的方式进行拆分,构成病例的属性,即Item Profile 1xN维矩阵。每条Item Profile使用性别、年龄、病情类别、门诊类别等进行标签分类。此类数据是离线处理,进行拆分存储,如果有新的电子病例进入数据库中则处理,否则可直接进入步骤2;
步骤2、构建User Item 1xN维矩阵
User Item就相当于患者的病情属性,患者U的User Item 是诊治医生根据患者的病况填写在电子病例里后,系统经过逻辑处理而生成一个独立的临时的1xN维矩阵;
步骤3、计算出User Profile 1xN维矩阵
通过诊治医生通过选择的病情类别范围或者诊治医生的门诊类别,并使用User Item转换计算来得出User Profile;
步骤4、相似度计算
利用余弦相似度的公式来计算患者U的User Profile和病例Item Profile即I之间的相似度,余弦相似度越大说明患者U的病况越可能与某病例I相似;
步骤5、找出相似病例列
首先需要从计算相似度中找出与目标患者U最相似的K个病例,用集合S(u ,K)表示,其医生可填患者u与某种病i的相似程度提高这种病类的相似度;
步骤6、排序推送相似病例
将获取的相似病例集合按照相似度从大到小排列,推送给诊治医生,并标注病例中患者的性别、年龄、患病名称等常见信息,附带辅助治疗方案;
作为优选方案,所述的患者病例信息是把以往的电子病例或者诊治医生填写的病例使用自然语言处理等的方式进行拆分,构成病例的属性,同时包括性别、年龄、病情类别、门诊类别;
作为优选方案,所述的User Profile是在步骤2中经过自然语言处理再与指定范围病例属性相乘得出的User Item 1xN维矩阵;
作为优选方案,所述的计算患者U的User Profile和病例Item Profile即I之间的相似度的计算算法为余弦算法,相似度即为两者的距离;
作为优选方案,所述的步骤5中诊治医生可填患者u与某种病i的相似程度即为rui,是可根据诊治医生的意向提高此病类i的相似度,让其排在推送结果之前;
作为优选方案,所述的步骤6中所推送给诊治医生的病例集合是按照相似度大小排序,并标注了患者的性别、年龄、患病名称等常见信息;
与现有技术相比,本发明的有益效果是通过精确匹配相似病例来解决诊治医生需要多次通过关键字搜索符合病例,不能快速搜索到相关治疗方案的问题,以实现诊治医生能快速诊治患者,快速制定符合患者的治疗方案,提高诊治医生的诊治效率。
附图说明
图1:为本发明方法实施例中的具体实施流程示意图;
图2:为本发明方法实施例中的方法逻辑计算推送过程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明优选实施例提供了一种精确搜索与患者病情相似病例的方法,其基本思想是:在医疗大数据,病例档案全面电子化的背景下,根据诊治医生对患者病情的初步记录,在电子病例库中搜索相似的病例并得到这些病例的相关治疗方案,同时能提供给诊治医生一些治疗建议,辅助医生进行对患者的诊治,起到提高医生的诊断效率与能更好的制定出针对患者的治疗方案。结合图2,本发明以普通门诊类别的患者为例,具体步骤为:
步骤1、构建Item Profile 1xN维矩阵
系统初始化时将未处理过的病例用自然语言处理中的信息的方式进行拆分,构成病例的属性,即Item Profile 1xN维矩阵。每条Item Profile使用性别、年龄、病情类别、门诊类别等进行标签分类。此类数据是离线处理,进行拆分存储。在门诊类别下的病例ItemProfile 1xN维矩阵示例表如下表1-1:
表1-1 Item Profile 1xN维矩阵示例表
流青鼻涕 发烧 四肢疼痛 喷嚏 咽干 咳嗽 咽痒 咽痛 灼热感 畏寒 .....
Item1 1 0 1 1 0 0 1 0 0 1 .....
Item2 0 1 1 1 1 1 1 0 0 1 .....
步骤2、构建User Item 1xN维矩阵
User Item就相当于患者的病情属性,患者U的User Item 是诊治医生根据患者的病况填写在电子病例里后,系统经过逻辑处理而生成一个独立的临时的1xN维矩阵,矩阵例如表1-2:
表1-2 患者U1xN维矩阵示例表
患者U 胸闷 呼吸不畅 四肢无力 头晕 干呕 无食欲 血压高 无精神 嗜睡 发热 .......
步骤3、计算出User Profile 1xN维矩阵
通过诊治医生通过选择的病情类别范围或者诊治医生的门诊类别,并使用User Item转换计算来得出通User Profile,例如下表示例所示:
表1-3 User Profile表
流青鼻涕 发烧 四肢疼痛 喷嚏 咳嗽 胸闷 呼吸不畅 四肢无力 咽痒 咽痛 灼热感 .......
患者U 0 0 1 1 1 1 1 1 0 0 0 ......
步骤4、相似度计算
利用余弦相似度的公式来计算患者U的User Profile和每个病例Item Profile即I之间的距离,余弦相似度越大说明患者U的病况越可能与某病例I相似,则计算公式如下:
Figure RE-DEST_PATH_IMAGE001
(1-1)
公式(1-1)中U表示患者U其病况属性的矩阵值,I表示病例I的矩阵值。
步骤5、找出相似病例列
首先需要从计算相似度中找出与目标患者U最相似的K个病例,用集合S(u ,K)表示,其中rui表示医生可填患者u与某种病i的相似程度,N(u)则表示患者U以往病例。对于每个候选病例i,患者病况u对的相似程度用如下公式计算:
Figure RE-492123DEST_PATH_IMAGE002
(1-2)
步骤6、排序推送相似病例
将获取的相似病例集合按照相似度从大到小排列,推送给诊治医生,并标注病例中患者的性别、年龄、患病名称等常见信息,附带辅助治疗方案。

Claims (10)

1.一种精确搜索与患者病情相似病例的方法,其特征在于,包括以下步骤:
步骤1、构建Item Profile 1xN维矩阵
所以物体都有一个描述它的属性,这些描述属性来构造它的唯一性,每个病例都是唯一的,病例中的每个信息就是病例属性,所以可以将病例中的信息用自然语言处理的方式进行拆分,构成病例的属性,即Item Profile 1xN维矩阵,每条Item Profile使用性别、年龄、病情类别、门诊类别等进行标签分类,此类数据是离线处理,进行拆分存储,如果有新的电子病例进入数据库中则处理,否则可直接进入步骤2;
步骤2、构建User Item 1xN维矩阵
User Item就相当于患者的病情属性,患者U的User Item 是诊治医生根据患者的病况填写在电子病例里后,系统经过逻辑处理与自然语言处理而生成一个独立的临时的1xN维矩阵;
步骤3、计算出User Profile 1xN维矩阵
通过诊治医生通过选择的病情类别范围或者诊治医生的门诊类别,并使用User Item转换计算来得出通User Profile;
步骤4、相似度计算
利用余弦相似度的公式来计算患者U的User Profile和每个病例Item Profile即I之间的距离,余弦相似度越大说明患者U的病况越可能与某病例I相似,则有计算公式:
Figure RE-RE-RE-DEST_PATH_IMAGE002
步骤5、找出相似病例列
首先需要从计算相似度中找出与目标患者U最相似的K个病例,用集合S(u ,K)表示,其中rui表示医生可填患者u与某种病i的相似程度,N(u)则表示患者U以往病例,对于每对候选病例i和患者病况u,相似程度用公式计算:
Figure RE-RE-RE-DEST_PATH_IMAGE004
步骤6、排序推送相似病例
将获取的相似病例集合按照相似度从大到小排列,推送给诊治医生,并标注病例中患者的性别、年龄、患病名称等常见信息,附带辅助治疗方案。
2.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤1与步骤2中的患者病例信息是通过以下方法得到:
把以往的电子病例或者诊治医生填写的病例使用自然语言处理等的方式进行拆分,构成病例的属性,同时包括性别、年龄、病情类别、门诊类别。
3.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤3中的User Profile是通过步骤2中由自然语言处理得出的User Item 1xN维矩阵进行转换而得。
4.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤4中的相似度计算算法是使用余弦算法。
5.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤5中的找出相似病例列的算法需要步骤4中的计算相似度的算法。
6.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤5中需要先计算出每个病例与患者病情的相似度,并找出与目标患者U最相似的K个病例,用集合S(u ,K)表示,其中rui表示医生可填患者u与某种病i的相似程度,N(u)则表示患者U以往病例,对于每对候选病例i和患者病况u,相似程度用公式计算:
Figure RE-RE-RE-DEST_PATH_IMAGE004A
7.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤5中诊治医生可填患者u与某种病i的相似程度rui,可填需要搜索出多少个相似病例。
8.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤6中所推送给诊治医生的病例集合是按照相似度大小排序。
9.如权利要求7所述的,其特征在于所推送的病例标注了患者的性别、年龄、患病名称等常见信息。
10.如权利要求1所述的一种精确搜索与患者病情相似病例的方法,其特征在于,在所述步骤1、步骤2与步骤3中的Item Profile、User Item与User Profile都是1xN维矩阵。
CN202010003262.9A 2020-01-02 2020-01-02 一种精确搜索与患者病情相似病例的方法 Pending CN113064960A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010003262.9A CN113064960A (zh) 2020-01-02 2020-01-02 一种精确搜索与患者病情相似病例的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010003262.9A CN113064960A (zh) 2020-01-02 2020-01-02 一种精确搜索与患者病情相似病例的方法

Publications (1)

Publication Number Publication Date
CN113064960A true CN113064960A (zh) 2021-07-02

Family

ID=76558354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010003262.9A Pending CN113064960A (zh) 2020-01-02 2020-01-02 一种精确搜索与患者病情相似病例的方法

Country Status (1)

Country Link
CN (1) CN113064960A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611380A (zh) * 2021-07-09 2021-11-05 喀什地区第一人民医院 针对诊断预测的数据选择方法
CN113724878A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置
CN116631614A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 治疗方案生成方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101911078A (zh) * 2007-12-28 2010-12-08 皇家飞利浦电子股份有限公司 基于疾病概率向量检索类似患者病例
US20150227714A1 (en) * 2012-11-14 2015-08-13 Fujitsu Limited Medical information analysis apparatus and medical information analysis method
CN104881463A (zh) * 2015-05-22 2015-09-02 清华大学深圳研究生院 基于结构化病历数据库的参考病历检索方法及装置
CN105184103A (zh) * 2015-10-15 2015-12-23 清华大学深圳研究生院 基于病历数据库的虚拟名医
CN106934018A (zh) * 2017-03-11 2017-07-07 广东省中医院 一种基于协同过滤的医生推荐系统
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
US20190251084A1 (en) * 2016-10-27 2019-08-15 Huawei Technologies Co., Ltd. Search method and apparatus

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101911078A (zh) * 2007-12-28 2010-12-08 皇家飞利浦电子股份有限公司 基于疾病概率向量检索类似患者病例
US20150227714A1 (en) * 2012-11-14 2015-08-13 Fujitsu Limited Medical information analysis apparatus and medical information analysis method
CN104881463A (zh) * 2015-05-22 2015-09-02 清华大学深圳研究生院 基于结构化病历数据库的参考病历检索方法及装置
CN105184103A (zh) * 2015-10-15 2015-12-23 清华大学深圳研究生院 基于病历数据库的虚拟名医
US20190251084A1 (en) * 2016-10-27 2019-08-15 Huawei Technologies Co., Ltd. Search method and apparatus
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN106934018A (zh) * 2017-03-11 2017-07-07 广东省中医院 一种基于协同过滤的医生推荐系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611380A (zh) * 2021-07-09 2021-11-05 喀什地区第一人民医院 针对诊断预测的数据选择方法
CN113724878A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置
CN113724878B (zh) * 2021-08-31 2024-05-10 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置
CN116631614A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 治疗方案生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Chen et al. Cross-modal memory networks for radiology report generation
CN112131393B (zh) 一种基于bert和相似度算法的医疗知识图谱问答系统构建方法
CN109299239B (zh) 一种基于es的电子病历检索方法
CN107341264B (zh) 一种支持自定义实体的电子病历检索系统及方法
WO2021032220A2 (zh) 一种基于证素的中医辅助诊断系统
CN111292848B (zh) 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
Shraga et al. Web table retrieval using multimodal deep learning
CN111767410A (zh) 临床医疗知识图谱的构建方法、装置、设备及存储介质
CN113064960A (zh) 一种精确搜索与患者病情相似病例的方法
CN111465990B (zh) 用于医疗保健临床试验的方法和系统
CN110189831B (zh) 一种基于动态图序列的病历知识图谱构建方法及系统
CN113707297A (zh) 医疗数据的处理方法、装置、设备及存储介质
CN113707303A (zh) 基于知识图谱的医疗问题解答方法、装置、设备及介质
CN113111162A (zh) 科室推荐方法、装置、电子设备及存储介质
CN111292814A (zh) 一种医疗数据标准化的方法及装置
CN111986759A (zh) 电子病历的解析方法、系统、计算机设备与可读存储介质
CN112885478A (zh) 医疗文献的检索方法、装置、电子设备及存储介质
CN111785387A (zh) 一种使用Bert做疾病标准化映射分类的方法及系统
US11526508B1 (en) Concept embeddings for improved search
CN111061835B (zh) 查询方法及装置、电子设备和计算机可读存储介质
CN111292818A (zh) 一种针对电子病历描述的查询重构方法
CN116092699A (zh) 一种基于预训练模型的癌症问答交互方法
CN111104481B (zh) 一种识别匹配字段的方法、装置及设备
CN113658712A (zh) 医患匹配方法、装置、设备及存储介质
Xu et al. RemixFormer: a transformer model for precision skin tumor differential diagnosis via multi-modal imaging and non-imaging data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210702