CN110675927A - 一种基于大数据的病情检索方法 - Google Patents

一种基于大数据的病情检索方法 Download PDF

Info

Publication number
CN110675927A
CN110675927A CN201910896016.8A CN201910896016A CN110675927A CN 110675927 A CN110675927 A CN 110675927A CN 201910896016 A CN201910896016 A CN 201910896016A CN 110675927 A CN110675927 A CN 110675927A
Authority
CN
China
Prior art keywords
big data
disease
symptoms
keywords
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910896016.8A
Other languages
English (en)
Inventor
陈玮
刘德彬
严开
黄远江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Baihang Intelligent Data Technology Research Institute Co Ltd
Original Assignee
Chongqing Baihang Intelligent Data Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Baihang Intelligent Data Technology Research Institute Co Ltd filed Critical Chongqing Baihang Intelligent Data Technology Research Institute Co Ltd
Priority to CN201910896016.8A priority Critical patent/CN110675927A/zh
Publication of CN110675927A publication Critical patent/CN110675927A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据的病情检索方法,方法包括以下步骤:S1:通过大数据技术进行病情症状收集,形成病情库;S2:提取症状中的关键字;S3:在步骤S2中,将关键字形成关键字组,在关键字组内进行排序;S4:在步骤S3中,输入字符,根据字符检索关键字组,按照相似度进行病症排序;S5:将相应的病症依次进行呈现。本发明具有准确性强、自由度高、快捷高效的优点。

Description

一种基于大数据的病情检索方法
技术领域
本发明涉及计算机技术领域,具体涉及一种基于大数据的病情检索方法。
背景技术
在现阶段的社会压力和节奏下,人们忙于工作,很难得到一个健康系统养生保健体系,所以也不会注重身体的状况,在身体发生轻微不适或不舒服的情况下不会得到注意,引起严重的病情。
现阶段,尤其是年轻人,不会进行定期体检,身体不舒服的请详细下,首选不是去医院,而是在网上进行检索,自己为自己进行诊断,这样既不能够准确的对病情进行判断,还容易被没有资质的医院进行误导,延误了就诊时机,现阶段网络上没有准确的病情检索方式,且由于病情所体现出的症状类似,需要借助专业设备才能确诊,因此自诊只能够确定大方向。
发明内容
针对上述现有技术的不足,本发明所要解决的技术问题是:如何提供一种准确性强、自由度高、快捷高效的基于大数据的病情检索方法。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种基于大数据的病情检索方法,该方法包括以下步骤:
S1:通过大数据技术进行病情症状收集,形成病情库;
S2:提取症状中的关键字;
S3:在步骤S2中,将关键字形成关键字组,在关键字组内进行排序;
S4:在步骤S3中,输入字符,根据字符检索关键字组,按照相似度进行病症排序;
S5:将相应的病症依次进行呈现。
进一步的,步骤S1中简历的收集,应用大数据技术在医学书籍、杂志论文、医学声明方面进行收集。
进一步的,其特征在于,步骤S2中关键字的提取包括以下步骤:
A1:对症状中的文字进行分词处理,简历分词组;
A2:建立数据清洗库,对症状中常用的描述性分词进行统计,对分词组中描述性分词进行清洗;
A3:运用PMI算法处理A2中剩余的分词组,确定先关语义,与进行对比确定分类。
进一步的,步骤S3中,关键字组的顺序为X1﹥X2﹥X3,其中1.2.3为病症中的重要度依次递减。
进一步的,步骤S4中,相似度为字符中与关键字组分词的相同数。
本发明的有益效果为:本发明将能够收集并建立病症库,搜集的病症库包含专业的医学资料,医学著作等,可靠度高,简化了医学性描述,在关键词中与搜索字符进行匹配,能够在众多关键字组中进行分词匹配,可以选择出最合适的,匹配度最高的病症,进行呈现。本发明在基于医学可靠性的前提下,根据大数据技术,做出统筹和整合,保障检索的病情与患者自身的相似度,做出专业得到就诊计划,配合医院先进的检查设备,保障医患之间的有效沟通,提升了就医效率。
附图说明
图1为本发明一种基于大数据的病情检索方法一实施方式的流程图。
具体实施方式
下面结合附图对本发明作进一步的详细说明。
如图1所示,一种基于大数据的病情检索方法,该方法包括以下步骤:
S1:通过大数据技术进行病情症状收集,形成病情库;
S2:提取症状中的关键字;
S3:在步骤S2中,将关键字形成关键字组,在关键字组内进行排序;
S4:在步骤S3中,输入字符,根据字符检索关键字组,按照相似度进行病症排序;
S5:将相应的病症依次进行呈现。
进一步的,步骤S1中简历的收集,应用大数据技术在医学书籍、杂志论文、医学声明方面进行收集。
进一步的,其特征在于,步骤S2中关键字的提取包括以下步骤:
A1:对症状中的文字进行分词处理,简历分词组;
A2:建立数据清洗库,对症状中常用的描述性分词进行统计,对分词组中描述性分词进行清洗;
A3:运用PMI算法处理A2中剩余的分词组,确定先关语义,与进行对比确定分类。
进一步的,步骤S3中,关键字组的顺序为X1﹥X2﹥X3,其中1.2.3为病症中的重要度依次递减。
进一步的,步骤S4中,相似度为字符中与关键字组分词的相同数。
本发明的有益效果为:本发明将能够收集并建立病症库,搜集的病症库包含专业的医学资料,医学著作等,可靠度高,简化了医学性描述,在关键词中与搜索字符进行匹配,能够在众多关键字组中进行分词匹配,可以选择出最合适的,匹配度最高的病症,进行呈现。本发明在基于医学可靠性的前提下,根据大数据技术,做出统筹和整合,保障检索的病情与患者自身的相似度,做出专业得到就诊计划,配合医院先进的检查设备,保障医患之间的有效沟通,提升了就医效率。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (5)

1.一种基于大数据的病情检索方法,其特征在于,该方法包括以下步骤:
S1:通过大数据技术进行病情症状收集,形成病情库;
S2:提取症状中的关键字;
S3:在步骤S2中,将关键字形成关键字组,在关键字组内进行排序;
S4:在步骤S3中,输入字符,根据字符检索关键字组,按照相似度进行病症排序;
S5:将相应的病症依次进行呈现。
2.根据权利要求1所述的一种基于大数据的病情检索方法,其特征在于,步骤S1中简历的收集,应用大数据技术在医学书籍、杂志论文、医学声明方面进行收集。
3.根据权利要求2所述的一种基于大数据的病情检索方法,其特征在于,步骤S2中关键字的提取包括以下步骤:
A1:对症状中的文字进行分词处理,简历分词组;
A2:建立数据清洗库,对症状中常用的描述性分词进行统计,对分词组中描述性分词进行清洗;
A3:运用PMI算法处理A2中剩余的分词组,确定先关语义,与进行对比确定分类。
4.根据权利要求3所述的一种基于大数据的病情检索方法,其特征在于,步骤S3中,关键字组的顺序为X1﹥X2﹥X3,其中1.2.3为病症中的重要度依次递减。
5.根据权利要求4所述的一种基于大数据的病情检索方法,其特征在于,步骤S4中,相似度为字符中与关键字组分词的相同数。
CN201910896016.8A 2019-09-22 2019-09-22 一种基于大数据的病情检索方法 Pending CN110675927A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910896016.8A CN110675927A (zh) 2019-09-22 2019-09-22 一种基于大数据的病情检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910896016.8A CN110675927A (zh) 2019-09-22 2019-09-22 一种基于大数据的病情检索方法

Publications (1)

Publication Number Publication Date
CN110675927A true CN110675927A (zh) 2020-01-10

Family

ID=69077139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910896016.8A Pending CN110675927A (zh) 2019-09-22 2019-09-22 一种基于大数据的病情检索方法

Country Status (1)

Country Link
CN (1) CN110675927A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640499A (zh) * 2020-06-15 2020-09-08 柳韶真 一种基于互联网的老年人慢性病管理评估系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及系统
CN108461135A (zh) * 2018-03-21 2018-08-28 吉林师范大学 一种共享式医学数据分析系统以及方法
CN108763196A (zh) * 2018-05-03 2018-11-06 上海海事大学 一种基于pmi的关键字提取方法
CN109299239A (zh) * 2018-09-29 2019-02-01 福建弘扬软件股份有限公司 一种基于es的电子病历检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及系统
CN108461135A (zh) * 2018-03-21 2018-08-28 吉林师范大学 一种共享式医学数据分析系统以及方法
CN108763196A (zh) * 2018-05-03 2018-11-06 上海海事大学 一种基于pmi的关键字提取方法
CN109299239A (zh) * 2018-09-29 2019-02-01 福建弘扬软件股份有限公司 一种基于es的电子病历检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨辉等: "基于医疗大数据平台的相似病历检索系统", 《东南国防医药》 *
杨辉等: "基于医疗大数据平台的相似病历检索系统", 《东南国防医药》, no. 02, 20 March 2017 (2017-03-20), pages 210 - 212 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640499A (zh) * 2020-06-15 2020-09-08 柳韶真 一种基于互联网的老年人慢性病管理评估系统

Similar Documents

Publication Publication Date Title
US20180322954A1 (en) Method and device for constructing medical knowledge graph and assistant diagnosis method
CN107705839B (zh) 疾病自动编码方法及系统
CN104572675B (zh) 一种相似病历检索的系统及方法
CN106934235B (zh) 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN105893597B (zh) 一种相似病历检索方法及系统
CN111026841B (zh) 一种基于检索和深度学习的自动编码方法及装置
CN106557653A (zh) 一种移动医疗智能导医系统及其方法
CN113345577B (zh) 诊疗辅助信息的生成方法、模型训练方法、装置、设备以及存储介质
CN113707297A (zh) 医疗数据的处理方法、装置、设备及存储介质
CN111696635A (zh) 疾病名称标准化方法及装置
CN109299227B (zh) 基于语音识别的信息查询方法和装置
CN110019641B (zh) 一种医疗否定术语的检出方法及系统
CN113658712A (zh) 医患匹配方法、装置、设备及存储介质
CN109907751B (zh) 一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法
CN110851506B (zh) 临床大数据的搜索方法及装置、存储介质、服务器
CN110675927A (zh) 一种基于大数据的病情检索方法
CN113488157A (zh) 智能导诊处理方法、装置、电子设备及存储介质
CN111640517B (zh) 病历编码方法、装置、存储介质及电子设备
CN113284627A (zh) 基于患者表征学习的用药推荐方法
CN110060749B (zh) 基于sev-sdg-cnn的电子病历智能诊断方法
CN108831560B (zh) 一种确定医疗数据属性数据的方法和装置
Gu et al. Chemical-induced disease relation extraction with lexical features
CN115336977B (zh) 一种精准icu警报分级评估方法
CN115631823A (zh) 相似病例推荐方法及系统
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110