CN117520920B - 一种多病种防控医疗数据分类方法及装置 - Google Patents

一种多病种防控医疗数据分类方法及装置 Download PDF

Info

Publication number
CN117520920B
CN117520920B CN202311600923.6A CN202311600923A CN117520920B CN 117520920 B CN117520920 B CN 117520920B CN 202311600923 A CN202311600923 A CN 202311600923A CN 117520920 B CN117520920 B CN 117520920B
Authority
CN
China
Prior art keywords
prevention
data chain
chain
identity
screened
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311600923.6A
Other languages
English (en)
Other versions
CN117520920A (zh
Inventor
谢战
陈文伟
康深圳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unitedhealthcare Big Data Wuxi Co ltd
Original Assignee
Unitedhealthcare Big Data Wuxi Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unitedhealthcare Big Data Wuxi Co ltd filed Critical Unitedhealthcare Big Data Wuxi Co ltd
Priority to CN202311600923.6A priority Critical patent/CN117520920B/zh
Publication of CN117520920A publication Critical patent/CN117520920A/zh
Application granted granted Critical
Publication of CN117520920B publication Critical patent/CN117520920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种多病种防控医疗数据分类方法及装置,该方法包括:采集被筛查防控人员的身份信息以及防控医疗数据,根据身份信息确定身份数据链,并按预设规则根据身份数据链确定标识身份数据链;获取被筛查防控人员的每个筛查项目对应的筛查项目结果的文本数据,根据文本数据确定筛查项目结果数据链,并将筛查项目结果数据链划分为能相互链接的子、母筛查项目结果数据链;将子筛查项目结果数据链附着于身份数据链上存储建立被筛查防控人员身份信息库;将标识身份数据链附着于母筛查项目结果数据链上分别进行存储建立不同的病种信息数据库,以对防控医疗数据进行分类。本发明解决了现有技术中的防控医疗数据不易管理且安全性低的问题。

Description

一种多病种防控医疗数据分类方法及装置
技术领域
本发明涉及医疗数据处理技术领域,特别涉及一种多病种防控医疗数据分类方法及装置。
背景技术
随着人们对于医疗防控的意识的加强,越来越多的医院开始注重医疗防控,即对选定的群体,例如规定区域内或者规定年龄段的群体进行多种病种的筛选检查,并将筛选检查得到的包含检测结果的数据进行存储,以便于后续的查看和利用。
现有技术中,将包含检测结果的数据与被筛选检查的人员信息的防控医疗数据全部统一打包集中存入至某个数据库当中,然而,此种方式不但不方便防控医疗数据的管理,而且也不够安全。
发明内容
有鉴于此,本发明的目的在于提供一种多病种防控医疗数据分类方法、装置、存储介质及设备,旨在解决现有技术中的防控医疗数据不易管理且安全性低的问题。
本发明实施例是这样实现的:
一种多病种防控医疗数据分类方法,所述方法包括:
采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果;
根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链;
获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链;
将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库;
将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类。
进一步的,上述多病种防控医疗数据分类方法,其中,所述身份信息至少包括姓名拼音、性别、身份证号码、年龄以及电话号码,所述根据所述身份信息确定所述被筛查防控人员的身份数据链的步骤包括:
将所述性别映射成对应的代表数字,并将所述被筛查防控人员的姓名拼音、性别对应的代表数字、身份证号码、年龄以及电话号码依序排列,以得到所述被筛查防控人员的身份数据链。
进一步的,上述多病种防控医疗数据分类方法,其中,所述并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链的步骤包括:
从所述身份数据链当中提取出所述身份证号码作为所述被筛查防控人员的标识身份数据链;
或从所述身份数据链当中提取出所述电话号码作为所述被筛查防控人员的标识身份数据链;
或分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链。
进一步的,上述多病种防控医疗数据分类方法,其中,所述分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链的步骤包括:
获取所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位;
将所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位依序排序组合成所述被筛查防控人员的标识身份数据链。
进一步的,上述多病种防控医疗数据分类方法,其中,所述并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链的步骤包括:
对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链;
确定所述筛查项目结果数据链当中的首、尾分锻链,并分别获取所述首、尾分锻链的链长;
根据所述首、尾分锻链的链长确定用于划分所述子筛查项目结果数据链和母筛查项目结果数据链的目标分锻链;
按预设比例从所述目标分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
进一步的,上述多病种防控医疗数据分类方法,其中,所述对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链的步骤之后还包括:
获取所述每个分段链与所述病种的筛查项目结果之间的特征表现值;
根据所述特征表现值从所述每个分段链当中提取出与所述病种的筛查项目结果最为相关的特征分锻链;
按预设比例从所述特征分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
进一步的,上述多病种防控医疗数据分类方法,其中,所述方法还包括:
当检测到需要进行防控医疗数据查询时,获取查询信息,并根据所述查询信息确定被查询人的身份信息;
根据所述身份信息确定对应的身份数据链,并根据所述身份数据链、身份数据链上携带的子筛查项目结果数据链以及标识身份数据链从所述不同的病种信息库当中查找出对应的母筛查项目结果数据链;
根据查找出的所述子筛查项目结果数据链和母筛查项目结果数据链确定所述被查询人的所述防控医疗数据。
本发明的另一个目的在于提供一种多病种防控医疗数据分类装置,所述装置包括:
采集模块,用于采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果;
确定模块,用于根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链;
划分模块,用于获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链;
建立模块,用于将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库;
分类模块,用于将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类。
本发明的另一个目的在于提供一种可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的方法的步骤。
本发明的另一个目的是提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法的步骤。
本发明通过获取被筛查防控人员的身份信息组成身份数据链,并且对身份数据链进行提取确定标识身份数据链,将被筛查防控人员的防控医疗数据进行整合分链成子筛查项目结果数据链和母筛查项目结果数据链,将子筛查项目结果数据链附着于身份数据链上,对身份数据链与对应的子筛查项目结果数据链存储建立身份信息数据库,将标识身份数据链附着于母筛查项目结果数据链上,对母筛查项目结果数据链和对应的标识身份数据链存储建立病种信息数据库,一方面实现了不同病种的防控医疗数据的分类存储,便于数据的管理,另一方面,多个数据库减少被攻击的风险,从数据库层面提升安全性,通过子筛查项目结果数据链和母筛查项目结果数据链组链的形式查找确定对应的防控医疗数据,从数据层面提升获取数据的准确性和安全性。解决了现有技术中的防控医疗数据不便于管理且不够安全的问题。
附图说明
图1为本发明第一实施例提供的多病种防控医疗数据分类方法的流程图;
图2为本发明一实施例中多病种防控医疗数据分类方法的中的被筛查防控人员身份信息数据库和病种信息数据库的示意图;
图3为本发明第三实施例中多病种防控医疗数据分类装置的结构框图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
以下将结合具体实施例和附图来详细说明如何对多病种的防控医疗数据进行管理以及提升防控医疗数据的安全性。
实施例一
请参阅图1,所示为本发明第一实施例中的多病种防控医疗数据分类方法,所述方法包括步骤S10~S13。
步骤S10,采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果。
其中,在实际当中,对选定的特定类型的人群进行不同病种的筛查记录,以形成对应的数据以实时掌握该特定人群的病种情况,以对不同的病种进行防控或者防控参考,具体的,被筛查防控人员为实际当中的特定类型的人群,包括但不限于特定区域或者特定年龄段的人,其中,特定类型的人群可以根据实际情况进行设定选择,在此不予限定。
具体的,采集的被筛查防控人员的筛查记录组成的数据为防控医疗数据,防控医疗数据包括不同病种的筛查项目及对应的筛查项目体现出的筛查结果,其中,需要对被筛查防控人员的不同的病种进行筛查,即筛查特定群体当中的多种病种的数据建立健全的防控医疗数据,具体的,筛查项目为筛查该病种需要进行检测的各项检测指标,例如,筛查脑卒中需要进行血糖、血脂等项目的指标检查,筛查项目结果包括筛查项目当中的指标体现出的对于该病种筛查的结果,其中,至少包含对于该病种的筛查结果的结论性的文字说明、当时筛查指标项目以及对应的筛查指标数据。
步骤S11,根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链。
其中,身份信息包括了被筛查防控人员的基本信息,可以确定被筛查防控人员的一些基本情况,根据身份信息可以确定被筛查防控人员唯一的身份标识,而标识身份数据链的确定可以准确的查找到当前的被筛查防控人员。
具体的,身份信息至少包括姓名拼音、性别、身份证号码、年龄以及电话号码,而作为本发明实施例当中的其中一种实施方式,根据所述身份信息确定所述被筛查防控人员的身份数据链的实施可以按如下方式进行实施:
将所述性别映射成对应的代表数字,并将所述被筛查防控人员的姓名拼音、性别对应的代表数字、身份证号码、年龄以及电话号码依序排列,以得到所述被筛查防控人员的身份数据链。
其中,优先的,身份数据链的组成尽量只带有数字和字母,便于数据的后续处理,例如加密、解密以及存储等。具体的,为了形成只带有数字或者字母的完整身份数据链,将性别映射成对应的代表数字,其中,可以为不同的性别设置对应的映射代表数字,例如,将性别男映射为1,性别女映射为0,进而可以将姓名拼音、性别对应的代表数字、身份证号码、年龄以及电话号码依序排列得到对应的身份数据链。
进一步的,在本发明一些可选的实施例当中,在确定身份数据链后,所述并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链的步骤包括:
从所述身份数据链当中提取出所述身份证号码作为所述被筛查防控人员的标识身份数据链;
或从所述身份数据链当中提取出所述电话号码作为所述被筛查防控人员的标识身份数据链;
或分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链。
其中,由于身份证号码和电话号码是已知可以确定的唯一的标识,因此,可以直接将被筛查防控人员的身份证号码或者电话号码作为标识身份数据链。
进一步的,在本发明一些可选的实施例当中,为了提高标识身份数据链形成的复杂程度以提高标识身份数据链的安全性,分别从身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成标识身份数据链,其中,作为本发明实施例当中的其中一种实施方式,所述分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链的步骤包括:
获取所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位;
将所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位依序排序组合成所述被筛查防控人员的标识身份数据链。
具体的,分别从组成身份信息的每个子身份信息当中,分别提取出对应的数字或者字母组成被筛查防控人员的标识身份数据链,其中,每个子身份信息均代表了被筛查防控人员的身份特征,从每个子身份信息当中分别提取出对应的数字或者字母,保证提取出的标识身份数据链唯一,并且此种组合方式避免了直接套用现有的可以确定的唯一的身份标识,降低标识身份数据链与被筛查防控人员的直接关联性,提升了标识身份数据链的安全性。
步骤S12,获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链。
其中,被筛查防控人员可能需要进行不止一种病种的筛查,即不止一种筛查项目的筛查,获取每个病种当中的每个筛查项目对应的筛查项目结果的文本数据,进而确定每个筛查的病种的结果,具体的,文本数据至少包含每个病种的筛查结论,例如“被筛查防控人员某几项指标显示……,根据被筛查防控人员的口述……,综合初步判定被筛查防控人员……”。从而形成能表征此次筛查结果的筛查项目结果数据链。
进一步的,将筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链,其中,子筛查项目结果数据链和母筛查项目结果数据链能相互链接,即可以通过子筛查项目结果数据链和母筛查项目结果数据链进行自行配对,且可以形成初始的筛查项目结果数据链。
步骤S13,将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库。
其中,将子筛查项目结果数据链附着于身份数据链上,具体的,每个身份数据链上至少包含一个子筛查项目结果数据链,而子筛查项目结果数据链的数量取决于该被筛查防控人员筛查的病种的数量,将附着有子筛查项目结果数据链的身份数据链建立被筛查防控人员身份信息库,对被筛查防控人员的身份信息进行分类,而被筛查防控人员身份信息库当中不止包含被筛查防控人员的身份信息,而且每个身份数据链上附着有包含有其对应的部分筛查项目结果的子筛查项目结果数据链,可以方便后续的数据查找。
步骤S14,将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类。
其中,根据不同的病种,建立不同的病种信息数据库,每个病种信息数据库只存储对应的病种的数据,即筛查项目结果的完整数据,其包括提取出的文本数据和其他数据,实现对防控医疗数据的分类,并且将标识身份数据链附着于母筛查项目结果数据链上,便于快速的查找到对应的被筛查防控人员,或者快速的通过被筛查防控人员的身份数据链查找到对应的母筛查项目结果数据链,并且采用分链的形式一方面在快速查找到对应的被筛查防控人员后,后通过组链的方式进行数据的配对提升数据查找获取的准确性。
具体的,如图2所示,被筛查防控人员身份信息库包括身份数据链的身份信息,每个身份数据链携带有子筛查项目结果数据链,例如,身份数据链1分别携带有子筛查项目结果数据链1-1、子筛查项目结果数据链1-2以及子筛查项目结果数据链1-3;而病种信息数据库当中存有防控医疗数据以及用于链接的母筛查项目结果数据链,母筛查项目结果数据链上携带有标识身份数据链用查找定位,例如,母筛查项目结果数据链1携带有标识身份数据链1-1以及1-2等、母筛查项目结果数据链2携带有标识身份数据链2-1等,母筛查项目结果数据链3携带有标识身份数据链3-1等。
另外,在本发明一些可选的实施例当中,所述方法还包括:
当检测到需要进行防控医疗数据查询时,获取查询信息,并根据所述查询信息确定被查询人的身份信息;
根据所述身份信息确定对应的身份数据链,并根据所述身份数据链、身份数据链上携带的子筛查项目结果数据链以及标识身份数据链从所述不同的病种信息库当中查找出对应的母筛查项目结果数据链;
根据查找出的所述子筛查项目结果数据链和母筛查项目结果数据链确定所述被查询人的所述防控医疗数据。
其中,在防控医疗数据存储后,可以进行主动的查询,用户可以通过既定的操作系统,触发查询,进行数据的查询,具体的,被筛查防控人员身份数据库与病种信息库之间进行通信连接,两个库之间可以进行信息的交互,在确定一个库中的数据后可以在另一个库当中查找对应的数据,进行匹配以获取到需要查询的完整数据,例如,当查询信息为某个姓名时,在身份数据库中确定查询的身份数据链,根据身份数据链可以定位到病种信息数据库当中的标识身份数据链,具体的,在定位到病种信息数据库当中的标识身份数据链后,进行子筛查项目结果数据链和母筛查项目结果数据链配对确认,并且在配对确认后形成完整的筛查项目结果数据链,从而在病种数据库当中查找到该被查询人的防控医疗数据,其中,防控医疗数据包括筛查项目结果数据链和筛查项目结果的其他数据。
综上,本发明上述实施例中的多病种防控医疗数据分类方法,通过获取被筛查防控人员的身份信息组成身份数据链,并且对身份数据链进行提取确定标识身份数据链,将被筛查防控人员的防控医疗数据进行整合分链成子筛查项目结果数据链和母筛查项目结果数据链,将子筛查项目结果数据链附着于身份数据链上,对身份数据链与对应的子筛查项目结果数据链存储建立身份信息数据库,将标识身份数据链附着于母筛查项目结果数据链上,对母筛查项目结果数据链和对应的标识身份数据链存储建立病种信息数据库,一方面实现了不同病种的防控医疗数据的分类存储,便于数据的管理,另一方面,多个数据库减少被攻击的风险,从数据库层面提升安全性,通过子筛查项目结果数据链和母筛查项目结果数据链组链的形式查找确定对应的防控医疗数据,从数据层面提升获取数据的准确性和安全性。解决了现有技术中的防控医疗数据不便于管理且不够安全的问题。
实施例二
本实施例也提出一种多病种防控医疗数据分类方法,本实施例当中的多病种防控医疗数据分类方法与实施例一当中的多病种防控医疗数据分类方法的不同之处在于:
步骤S12包括:
对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链;
确定所述筛查项目结果数据链当中的首、尾分锻链,并分别获取所述首、尾分锻链的链长;
根据所述首、尾分锻链的链长确定用于划分所述子筛查项目结果数据链和母筛查项目结果数据链的目标分锻链;
按预设比例从所述目标分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
其中,文本数据为记载筛查项目结论性的文字数据,具体的,文本数据可以通过语义识别各个筛查项目的结果得到,也可以通过医护人员根据各个筛查项目的结果进行主动输入的结论性的文字描述,其中,该文本数据得到的筛查项目结果数据链可能包含多段的文字描述,因此,将筛查项目结果数据链根据标点符号划分成多个分段链,而每个分段链包含了一段完整的文字信息,从而可以将该分段链进行拆分得到可以链接的子筛查项目结果数据链和母筛查项目结果数据链。
由于子筛查项目结果数据链的主要作用在于配对,并且,为了避免身份数据链上携带的子筛查项目结果数据链过多,因此,通过获取首、尾分锻链的长度,先确定较短的目标分锻链,后安装预设的比例从目标分锻链中进行划分,即从该目标分锻链中进行断开,得到子筛查项目结果数据链和母筛查项目结果数据链。在本实施例具体实施时,预设比例可以按照实际情况进行设定,例如,从目标分锻链的20%处开始划分,或者从目标分锻链的30%处开始划分,这里不予限定,而预设比例的判断可以根据该目标分锻链的字符数的占比进行确定。
进一步的,在本发明一些可选的实施例当中,目标分锻链还可以用于子筛查项目结果数据链和母筛查项目结果数据链配对链接的准确性校验,例如,通过链接后的子筛查项目结果数据链和母筛查项目结果数据链当中的该目标分段链与此前划分前的目标分段链进行匹配以对子筛查项目结果数据链和母筛查项目结果数据链链接的准确性校验。
另外,在本发明一些可选的实施例当中,所述对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链的步骤之后还包括:
获取所述每个分段链与所述病种的筛查项目结果之间的特征表现值;
根据所述特征表现值从所述每个分段链当中提取出与所述病种的筛查项目结果最为相关的特征分锻链;
按预设比例从所述特征分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
其中,每个分段链当中包含一个完整的语义信息,其中,便包括能较多表征病种相关信息的特征分锻链,例如,“被筛查防控人员某几项指标显示……,根据被筛查防控人员的口述……,综合初步判定被筛查防控人员……”,其中,“综合初步判定被筛查防控人员……”可以认定为与病种筛查结果最为相关的特征分锻链,为了保证链接的准确性,从该特征分锻链当中进行划分,将筛查项目结果数据链划成能相互链接的子筛查项目结果数据链和母筛查项目结果数据链。从而在进行配对是可以提升配对的准确性,避免不同的病种的结论前序可能存在部分相同的情况,影响配对的准确性。
综上,本发明上述实施例中的多病种防控医疗数据分类方法,通过获取被筛查防控人员的身份信息组成身份数据链,并且对身份数据链进行提取确定标识身份数据链,将被筛查防控人员的防控医疗数据进行整合分链成子筛查项目结果数据链和母筛查项目结果数据链,将子筛查项目结果数据链附着于身份数据链上,对身份数据链与对应的子筛查项目结果数据链存储建立身份信息数据库,将标识身份数据链附着于母筛查项目结果数据链上,对母筛查项目结果数据链和对应的标识身份数据链存储建立病种信息数据库,一方面实现了不同病种的防控医疗数据的分类存储,便于数据的管理,另一方面,多个数据库减少被攻击的风险,从数据库层面提升安全性,通过子筛查项目结果数据链和母筛查项目结果数据链组链的形式查找确定对应的防控医疗数据,从数据层面提升获取数据的准确性和安全性。解决了现有技术中的防控医疗数据不便于管理且不够安全的问题。
实施例三
请参阅图3,所示为本发明第三实施例中提出的多病种防控医疗数据分类装置,所述装置包括:
采集模块100,用于采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果;
确定模块200,用于根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链;
划分模块300,用于获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链;
建立模块400,用于将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库;
分类模块500,用于将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类。
进一步的,上述多病种防控医疗数据分类装置,所所述身份信息至少包括姓名拼音、性别、身份证号码、年龄以及电话号码,所述确定模块包括:
身份数据链确定单元,用于将所述性别映射成对应的代表数字,并将所述被筛查防控人员的姓名拼音、性别对应的代表数字、身份证号码、年龄以及电话号码依序排列,以得到所述被筛查防控人员的身份数据链。
进一步的,上述多病种防控医疗数据分类装置,其中,所述确定模块还包括:
标识身份数据链确定单元,用于从所述身份数据链当中提取出所述身份证号码作为所述被筛查防控人员的标识身份数据链;
或从所述身份数据链当中提取出所述电话号码作为所述被筛查防控人员的标识身份数据链;
或分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链。
进一步的,上述多病种防控医疗数据分类装置,其中,所述标识身份数据链确定单元具体用于:
获取所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位;
将所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位依序排序组合成所述被筛查防控人员的标识身份数据链。
进一步的,上述多病种防控医疗数据分类装置,其中,所述划分模块包括:
识别单元,用于对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链;
分段单元,用于确定所述筛查项目结果数据链当中的首、尾分锻链,并分别获取所述首、尾分锻链的链长;
第一划分单元,用于根据所述首、尾分锻链的链长确定用于划分所述子筛查项目结果数据链和母筛查项目结果数据链的目标分锻链;
第二划分单元,用于按预设比例从所述目标分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
进一步的,在本发明一些可选的实施例当中,所述划分模块还包括:
第三划分单元,用于获取所述每个分段链与所述病种的筛查项目结果之间的特征表现值;
根据所述特征表现值从所述每个分段链当中提取出与所述病种的筛查项目结果最为相关的特征分锻链;
按预设比例从所述特征分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
进一步的,在本发明一些可选的实施例当中,所述装置还包括:
检测模块,用于当检测到需要进行防控医疗数据查询时,获取查询信息,并根据所述查询信息确定被查询人的身份信息;
查找模块,用于根据所述身份信息确定对应的身份数据链,并根据所述身份数据链、身份数据链上携带的子筛查项目结果数据链以及标识身份数据链从所述不同的病种信息库当中查找出对应的母筛查项目结果数据链;
查询模块,用于根据查找出的所述子筛查项目结果数据链和母筛查项目结果数据链确定所述被查询人的所述防控医疗数据
上述各模块被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
实施例四
本发明另一方面还提供一种可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述实施例一至二中任意一个所述的方法的步骤。
实施例五
本发明另一方面还提供一种电子设备,所述电子设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例一至二中任意一个所述的方法的步骤。
以上各个实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种多病种防控医疗数据分类方法,其特征在于,所述方法包括:
采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果;
根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链;
获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链;
将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库;
将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类;
所述身份信息至少包括姓名拼音、性别、身份证号码、年龄以及电话号码,所述根据所述身份信息确定所述被筛查防控人员的身份数据链的步骤包括:
将所述性别映射成对应的代表数字,并将所述被筛查防控人员的姓名拼音、性别对应的代表数字、身份证号码、年龄以及电话号码依序排列,以得到所述被筛查防控人员的身份数据链;
所述并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链的步骤包括:
从所述身份数据链当中提取出所述身份证号码作为所述被筛查防控人员的标识身份数据链;
或从所述身份数据链当中提取出所述电话号码作为所述被筛查防控人员的标识身份数据链;
或分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链;
所述分别从所述身份数据链当中的姓名拼音、性别、身份证号码、年龄以及电话号码提取出子元素依序组合成所述被筛查防控人员的标识身份数据链的步骤包括:
获取所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位;
将所述姓名拼音的首字母、性别对应的代表数字、身份证号码的前预设位、年龄以及电话号码的后预设位依序排序组合成所述被筛查防控人员的标识身份数据链。
2.根据权利要求1所述的多病种防控医疗数据分类方法,其特征在于,所述并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链的步骤包括:
对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链;
确定所述筛查项目结果数据链当中的首、尾分锻链,并分别获取所述首、尾分锻链的链长;
根据所述首、尾分锻链的链长确定用于划分所述子筛查项目结果数据链和母筛查项目结果数据链的目标分锻链;
按预设比例从所述目标分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
3.根据权利要求2所述的多病种防控医疗数据分类方法,其特征在于,所述对所述筛查项目结果数据链进行语义字符识别以确定所述筛查项目结果数据链当中的每个分段链的步骤之后还包括:
获取所述每个分段链与所述病种的筛查项目结果之间的特征表现值;
根据所述特征表现值从所述每个分段链当中提取出与所述病种的筛查项目结果最为相关的特征分锻链;
按预设比例从所述特征分锻链中进行划分,将所述筛查项目结果数据链划成能相互链接的所述子筛查项目结果数据链和母筛查项目结果数据链。
4.根据权利要求1至3中任一项所述的多病种防控医疗数据分类方法,其特征在于,所述方法还包括:
当检测到需要进行防控医疗数据查询时,获取查询信息,并根据所述查询信息确定被查询人的身份信息;
根据所述身份信息确定对应的身份数据链,并根据所述身份数据链、身份数据链上携带的子筛查项目结果数据链以及标识身份数据链从所述不同的病种信息库当中查找出对应的母筛查项目结果数据链;
根据查找出的所述子筛查项目结果数据链和母筛查项目结果数据链确定所述被查询人的所述防控医疗数据。
5.一种多病种防控医疗数据分类装置,其特征在于,用于实现权利要求1至4中任一项所述的多病种防控医疗数据分类方法,所述装置包括:
采集模块,用于采集被筛查防控人员的身份信息以及所述被筛查防控人员的防控医疗数据,所述防控医疗数据至少包括所述筛查防控人员的不同病种的筛查项目以及对应的筛查项目结果;
确定模块,用于根据所述身份信息确定所述被筛查防控人员的身份数据链,并按预设规则根据所述身份数据链确定能代表所述被筛查防控人员唯一身份的标识身份数据链;
划分模块,用于获取所述被筛查防控人员的每个所述筛查项目对应的所述筛查项目结果的文本数据,根据所述文本数据确定所述被筛查防控人员的每个病种的筛查项目结果数据链,并按预设规则将所述筛查项目结果数据链划分为能相互链接的子筛查项目结果数据链和母筛查项目结果数据链;
建立模块,用于将所述子筛查项目结果数据链附着于所述身份数据链上并进行存储建立被筛查防控人员身份信息库;
分类模块,用于将所述标识身份数据链附着于所述母筛查项目结果数据链上并根据不同的所述病种分别进行存储建立不同的病种信息数据库,以对所述防控医疗数据进行分类。
6.一种可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任意一项所述的方法的步骤。
7.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至4任意一项所述的方法的步骤。
CN202311600923.6A 2023-11-28 2023-11-28 一种多病种防控医疗数据分类方法及装置 Active CN117520920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311600923.6A CN117520920B (zh) 2023-11-28 2023-11-28 一种多病种防控医疗数据分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311600923.6A CN117520920B (zh) 2023-11-28 2023-11-28 一种多病种防控医疗数据分类方法及装置

Publications (2)

Publication Number Publication Date
CN117520920A CN117520920A (zh) 2024-02-06
CN117520920B true CN117520920B (zh) 2024-07-19

Family

ID=89760615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311600923.6A Active CN117520920B (zh) 2023-11-28 2023-11-28 一种多病种防控医疗数据分类方法及装置

Country Status (1)

Country Link
CN (1) CN117520920B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593667A (zh) * 2021-08-10 2021-11-02 无锡市妇幼保健院 一种社区两癌筛查健康管理方法及系统
CN114038529A (zh) * 2021-11-23 2022-02-11 阜外华中心血管病医院 一种基于大数据的医疗信息管理方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183113A (zh) * 2020-10-14 2021-01-05 山东健康医疗大数据有限公司 基于健康医疗大数据的保险客户名单筛选方法及装置
KR102517271B1 (ko) * 2020-12-07 2023-04-04 (주)미라벨소프트 딥러닝을 이용한 fhir 의료 정보 표준 매핑 및 이를 통한 의료 정보 통합 서비스 제공 방법
CN113191156A (zh) * 2021-04-29 2021-07-30 浙江禾连网络科技有限公司 一种基于医学知识图谱与预训练模型的医学检查项目标准化的系统与方法
CN116312953A (zh) * 2022-11-23 2023-06-23 首都医科大学附属北京友谊医院 医疗信息处理系统、方法、医疗服务器及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593667A (zh) * 2021-08-10 2021-11-02 无锡市妇幼保健院 一种社区两癌筛查健康管理方法及系统
CN114038529A (zh) * 2021-11-23 2022-02-11 阜外华中心血管病医院 一种基于大数据的医疗信息管理方法及系统

Also Published As

Publication number Publication date
CN117520920A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
US10860548B2 (en) Generating and reusing transformations for evolving schema mapping
CN111341456B (zh) 糖尿病足知识图谱生成方法、装置及可读存储介质
US20050015381A1 (en) Database management system
CN107085587A (zh) 混合数据操作中的间接过滤
FR2825814A1 (fr) Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique
CN112036153B (zh) 工单纠错方法、装置、计算机可读存储介质和计算机设备
CN109473169A (zh) 一种疾病诊断方法、装置及终端设备
CN112966758B (zh) 一种农作物病虫草害识别方法、装置、系统及存储介质
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN109243549B (zh) 一种智能随访方法、装置及服务器
US10275656B2 (en) Large scale video search using queries that define relationships between objects
CN114372160A (zh) 一种搜索请求处理方法、装置、计算机设备及存储介质
CN110245242B (zh) 医学知识图谱构建方法、装置以及终端
CN115617840A (zh) 医疗数据检索平台构建方法、系统、计算机及存储介质
CN117520920B (zh) 一种多病种防控医疗数据分类方法及装置
US8903754B2 (en) Programmatically identifying branding within assets
CN111986815B (zh) 基于共现关系的项目组合挖掘方法及相关设备
CN109947715A (zh) 日志告警方法及装置
US20130080450A1 (en) Method and system for providing research relation service
CN113920384A (zh) 特征有效性评估方法、装置、设备及存储介质
CN112163082A (zh) 一种意图识别方法、装置、电子设备及存储介质
CN111539806A (zh) 一种公告内容结构化的方法及相关装置
CN110765327A (zh) 数据分析方法、装置、计算机装置及存储介质
US11972639B2 (en) Unsupervised signature-based person of interest database population
US12072920B2 (en) System and method for summarization of search results

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant