CN112035476B - 医疗记录数据的标准化方法、装置和计算机设备 - Google Patents
医疗记录数据的标准化方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112035476B CN112035476B CN202010897791.8A CN202010897791A CN112035476B CN 112035476 B CN112035476 B CN 112035476B CN 202010897791 A CN202010897791 A CN 202010897791A CN 112035476 B CN112035476 B CN 112035476B
- Authority
- CN
- China
- Prior art keywords
- data
- sequence
- difference
- preset
- square
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011425 standardization method Methods 0.000 title description 3
- 238000004364 calculation method Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000010606 normalization Methods 0.000 claims abstract description 58
- 238000013507 mapping Methods 0.000 claims abstract description 42
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 238000010586 diagram Methods 0.000 claims description 77
- 230000000903 blocking effect Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 12
- 238000005192 partition Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 230000011218 segmentation Effects 0.000 abstract 1
- 239000003814 drug Substances 0.000 description 13
- 238000007726 management method Methods 0.000 description 11
- 206010003011 Appendicitis Diseases 0.000 description 8
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 244000145841 kine Species 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 2
- 229930003268 Vitamin C Natural products 0.000 description 2
- CCGSUNCLSOWKJO-UHFFFAOYSA-N cimetidine Chemical compound N#CNC(=N/C)\NCCSCC1=NC=N[C]1C CCGSUNCLSOWKJO-UHFFFAOYSA-N 0.000 description 2
- 229960001380 cimetidine Drugs 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 235000019158 vitamin B6 Nutrition 0.000 description 2
- 239000011726 vitamin B6 Substances 0.000 description 2
- 235000019154 vitamin C Nutrition 0.000 description 2
- 239000011718 vitamin C Substances 0.000 description 2
- 229940011671 vitamin b6 Drugs 0.000 description 2
- 229940126673 western medicines Drugs 0.000 description 2
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及数字医疗领域,揭示了医疗记录数据的标准化方法,包括:获取指定医疗事件的医疗记录数据;将指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;将序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图;判断差异化计算是否达到预设条件;若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于差异阈值要求的指定方格;在指定方格的分布区域上,将序列数据通过动态归整算法映射到序列模板数据上。通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理。
Description
技术领域
本申请涉及数字医疗领域,特别是涉及到医疗记录数据的标准化方法、装置和计算机设备。
背景技术
医疗记录数据不仅是对患者医治过程的留痕,更是医学分析、医学研究以及医患管理的有力数据依据。但由于疾病的轻重缓急不同、医生医疗水平以及医治习惯的不同等等,导致医疗数据呈现千变万化的复杂性。表现为医疗数据的时间跨度不均一,比如住院时长不同;用药种类和频次不相同等等,导致医疗记录数据形式不统一,无法用于医学分析、医学研究以及医患管理等。
发明内容
本申请的主要目的为提供医疗记录数据的标准化方法,旨在解决现有医疗记录数据形式不统一,无法用于医学分析、医学研究以及医患管理的技术问题。
本申请提出一种医疗记录数据的标准化方法,包括:
获取指定医疗事件的医疗记录数据;
将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
判断所述差异化计算是否达到预设条件;
若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
优选地,所述将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图的步骤,包括:
获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;
在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;
在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;
保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;
在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;
按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;
按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
优选地,所述第一层级包括医疗项目类别,所述在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图的步骤,包括:
获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;
将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
优选地,所述在所述第一分布图上按照预设搜寻规则,搜寻第一阈值的步骤,包括:
比较所述第一分布图中各方格中的赋值;
选择最小赋值作为搜寻起始值;
通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;
将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;
判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;
若是,则判定所述指定赋值为所述第一阈值。
优选地,判断所述差异化计算是否达到预设条件的步骤,包括:
判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;
若否,则判定所述差异化计算达到预设条件。
优选地,所述指定方格为所述保留类的方格,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤,包括:
确定归整路径的起点和终点分别对应的方格;
在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;
动态调整所述归整路径,判断所述归整路径的距离是否达到最短;
若是,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
优选地,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤之后,包括:
获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;
判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;
若是,则判定所述第一病例与所述第二病例为雷同病例;
发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
本申请还提供了一种医疗记录数据的标准化装置,包括:
第一获取模块,用于获取指定医疗事件的医疗记录数据;
分块模块,用于将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
计算模块,用于将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
第一判断模块,用于判断所述差异化计算是否达到预设条件;
确定模块,用于若达到预设条件,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
映射模块,用于在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理。
附图说明
图1本申请一实施例的医疗记录数据的标准化方法流程示意图;
图2本申请一实施例的普通住院病历归整样例示意图;
图3本申请一实施例的长期住院病历归整样例示意图;
图4本申请一实施例的医疗记录数据的标准化装置结构示意图;
图5本申请一实施例的计算机设备内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例的医疗记录数据的标准化方法,包括:
S1:获取指定医疗事件的医疗记录数据;
S2:将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
S3:将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
S4:判断所述差异化计算是否达到预设条件;
S5:若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
S6:在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
本申请实施例中,医疗事件为某一患者用户接受治疗的整个过程事件,包括但不限于住院事件、门诊事件等。医疗记录数据为患者用户在某一医疗事件中的医疗消费数据,比如住院单、取药单、门诊费用单等。本申请实施例通过将医疗记录数据,按照个体、日期等分块参考因素,将同一个体不同日期的消费项目分为不同的数据分块,并按照日期的自然排序排成序列数据。然后将序列数据与序列模板数据进行差异化比较和计算,以减少相似比较过程中的搜索空间,以便将序列数据快速、精准地与序列模板数据建立映射关系,实现序列数据的标准化管理。上述序列模板数据为相同医疗项目对应的标准流程对应的消费预计。
本申请的数据分块,可根据具体的医疗事件具体选择合适的分块方式。比如住院治疗事件,按住院天数进行数据分块并排序;门诊治疗事件,按照每次门诊定义并按门诊顺序排序。实际应用中数据分块的方式可以多样化,例如按每两天住院天数作为一个数据分块,或按一个月的门诊事件汇总来作为一个数据分块。
本申请的序列模板数据,可通过两种途径获得,优先调用按经验或国家发布的标准临床路径文档作为序列模板数据,若不存在对应的序列模板数据,则通过数据统计方法,通过制定时间跨度的阈值,选取实际数据中较为标准的同类项目治疗数据作为序列模板数据。
本申请通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理,为后续的医学分析、医学研究以及医患管理提供有力的数据依据,对于病例等医疗记录数据,实现有效的风险管控,避免造假的雷同病例通过虚假住院进行骗保等。
进一步地,将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图的步骤S3,包括:
S31:获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;
S32:在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;
S33:在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;
S34:保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;
S35:在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;
S36:按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;
S37:按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
本申请的医疗记录数据中包括数据结构层次,上述数据结构层次由医学知识库中获得,比如:维生素B6注射液、维生素C注射液属于西药类层级下的维生素类,西咪替丁注射液属于西药类层级下的抑酸药类;注射器、输液器则属于耗材类层级下的一次性耗材类,等等具有明确包含关系的数据结构层次。本申请在计算差异度时,选择其中的一个或几个层次进行运算。本申请实施例通过从最高层级运算后,再递进到下一层级,如先按照西药类、耗材类进行计算,再按照抑酸药类、维生素类、一次性耗材类等细分类进行运算,使差异度计算更精准,每个层级计算通过当前层级下对应的差异阈值进行优化搜索空间,序列数据与序列模板数据的相似映射关系更准确。当前层级下对应的差异阈值,满足使组成搜索空间的方格在本层级下是连续贯通分布的,即相连行之间不能存在大于差异阈值的方格阻断搜索空间在行与行之间的连续性。
进一步地,所述第一层级包括医疗项目类别,所述在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图的步骤S32,包括:
S321:获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;
S322:将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
本申请实施例中,差异度计算公式为:其中,Dk为数据块与模板对比后差异项目(Diff)的数量,Df为差异项目产生的金额(fee)(或数量kind),Sk为相同项目(Same)的数量,Sf为相同项目产生的金额(fee)(或数量kind)。根据当前计算层中的具体项目中包括的差异项目以及相同项目的具体情况进行计算,当前层级中计算得到的差异度大,则可直接省略下一层级的差异度计算。比如当前层级一个为西药类,一个为中药类,则对于中药类和西药类下一层级的差异度计算可直接省略。但当前层级计算中差异度小于阈值,下一层级的差异度计算与当前层级的差异度计算并不存在必然联系,需要对下一层级的差异度进行重新计算,但差异度计算公式相同。本申请的医疗记录数据多为按一个时间段分段排列的医院账单或医嘱单,进行数据分块后,依然以数据组的形式存在,甚至包括文本数据,无法通过代入动态调整算法,本申请通过差异度的计算,将数据组的形式的数据块转化为数值代入动态调整算法,实现医疗记录数据的标准化调整。
进一步地,所述在所述第一分布图上按照预设搜寻规则,搜寻第一阈值的步骤S33,包括:
S331:比较所述第一分布图中各方格中的赋值;
S332:选择最小赋值作为搜寻起始值;
S333:通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;
S334:将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;
S335:判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;
S336:若是,则判定所述指定赋值为所述第一阈值。
本申请实施例中,以住院治疗的医疗事件为例,详细说明计算差异度的过程。举例地,序列模板数据的住院天数为6天,实际住院天数为9天,然后将序列模板数据的住院天数和实际住院天数组成二维数组对应的方格矩阵。按照上述的差异度计算公式,按照住院医疗项目所属的项目类别精算差异度,然后将差异度值填入上述方格矩阵的各对应方格中。本申请实施例以两个相邻层级的计算为例,进行详细说明。比如,当前层级对应的差异度计算完毕,形成的当前层级下的第一分布图,如下表1所示。然后通过二分类法或递进逼近法,搜索第一分布图中的差异阈值为0.25,因大于0.25后,第一分布图的第4行将被阻断而导致数据不连续,数据不连续则无法通过动态归整算法实现映射。判断每一行及其相邻行的保留类方格是否至少通过另外一行中的方格实现行与行之间的互相连通,且每一行的保留类方格也需要互相连通,即保留类方格在第一分布图中的分布状态为完整连续、不隔断。确定停止差异化计算时对应的差异阈值后,将大于0.25的格子标记为删除类,将小于等于阈值的格子标为保留类,得到保留类方格形成的第二分布图,如下表2所示。然后根据第一分布图中差异阈值的搜寻过程,确定第二分布图中的差异阈值,进行依次优化,至达到差异化计算达到预设条件。
表1
表2
进一步地,所述判断所述差异化计算是否达到预设条件的步骤S4,包括:
S41:判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;
S42:若否,则判定所述差异化计算达到预设条件。
本申请实施例的预设条件为认定达到最终的优化效果,停止继续差异化计算,包括在数据结构层次中两个连续的层级上计算差异度后,保留类方格的分布状态不再发生改变;或以达到数据结构层次中的最低层级。
进一步地,所述指定方格为所述保留类的方格,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤S6,包括:
S61:确定归整路径的起点和终点分别对应的方格;
S62:在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;
S63:动态调整所述归整路径,判断所述归整路径的距离是否达到最短;
S64:若是,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
本申请实施例通过动态归整算法寻找路径中相似点,并建立映射关系。动态归整算法形成的归整路径表示为W=W1,W2,W3,...,Wk,Wk的表达形式为点坐标(i,j),i表示序列数据所在序列x,j表示序列模板数据所在序列y,W1的表达形式为点坐标(1,1),Wk=(i,j),Wk+1=(i`,j`),i≤i`≤i+1,j≤j`≤j+1,通过动态归整算法,得到距离最短的归整路径Dist(Wki,Wkj)表示数据点Wkj和数据点Wkj的欧氏距离,数据点Wki表示序列x的第i个数据点,数据点Wkj表示序列y的第j个数据点。根据最后确定的最短距离的归整路径上的点坐标,对应于序列x和序列y的对应关系,得到序列x和序列y的映射关系,实现将序列数据映射至序列模板数据上,达到医疗记录数据的标准化。
本申请一实施例,以对比阑尾炎普通患者和标准模板数据的归整变化为例。如附图2看到,阑尾炎依据国家临床路径文档为7天标准住院天数,普通住院病例使用了6天,经过归整后发现其主要在第5-6天提高医疗效率。进行了医疗数据压缩,该实际医疗病例和国家临床路径文档的标准模板数据的差异很小。
本申请另一实施例,以长期住院的阑尾炎病例与标准模板数据的归整变化为例。如附图3,实际病例住院了20天,远远大于标准的7天,而通过归整对比,实际病例的第4-12天均映射到了标准的第3天,14-18天均映射到了标准的第5天,提示实际在这两天因不明原因拖延了,导致其时间消耗主要浪费在第3天和第5天,通过归整对比提示医院应该检视该病例在第3天和第5天的治疗情况。
通过上述两个实施例,通过将长期住院病例和普通病例统一映射到了标准模板数据上,解决了医疗数据因时间跨度不同而无法分析的问题。
进一步地,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤S6之后,包括:
S601:获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;
S602:判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;
S603:若是,则判定所述第一病例与所述第二病例为雷同病例;
S604:发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
本申请实施例,通过将病例数据库中的病例通过标准化映射后,再比较映射后的匹配路径的相似性,提高比较两个病例相似性的精准度,提高筛选类同病例的精准性,提高病例管控以及虚假治疗骗保的监控效果。
参照图4,本申请一实施例的医疗记录数据的标准化装置,包括:
第一获取模块1,用于获取指定医疗事件的医疗记录数据;
分块模块2,用于将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
计算模块3,用于将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
第一判断模块4,用于判断所述差异化计算是否达到预设条件;
确定模块5,用于若达到预设条件,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
映射模块6,用于在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
本申请实施例中,医疗事件为某一患者用户接受治疗的整个过程事件,包括但不限于住院事件、门诊事件等。医疗记录数据为患者用户在某一医疗事件中的医疗消费数据,比如住院单、取药单、门诊费用单等。本申请实施例通过将医疗记录数据,按照个体、日期等分块参考因素,将同一个体不同日期的消费项目分为不同的数据分块,并按照日期的自然排序排成序列数据。然后将序列数据与序列模板数据进行差异化比较和计算,以减少相似比较过程中的搜索空间,以便将序列数据快速、精准地与序列模板数据建立映射关系,实现序列数据的标准化管理。上述序列模板数据为相同医疗项目对应的标准流程对应的消费预计。
本申请的数据分块,可根据具体的医疗事件具体选择合适的分块方式。比如住院治疗事件,按住院天数进行数据分块并排序;门诊治疗事件,按照每次门诊定义并按门诊顺序排序。实际应用中数据分块的方式可以多样化,例如按每两天住院天数作为一个数据分块,或按一个月的门诊事件汇总来作为一个数据分块。
本申请的序列模板数据,可通过两种途径获得,优先调用按经验或国家发布的标准临床路径文档作为序列模板数据,若不存在对应的序列模板数据,则通过数据统计方法,通过制定时间跨度的阈值,选取实际数据中较为标准的同类项目治疗数据作为序列模板数据。
本申请通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理,为后续的医学分析、医学研究以及医患管理提供有力的数据依据,对于病例等医疗记录数据,实现有效的风险管控,避免造假的雷同病例通过虚假住院进行骗保等。
进一步地,计算模块3,包括:
获取单元,用于获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;
第一计算单元,用于在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;
第一搜寻单元,用于在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;
形成单元,用于保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;
第二计算单元,用于在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;
第二搜寻单元,用于按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;
第三计算单元,用于按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
本申请的医疗记录数据中包括数据结构层次,上述数据结构层次由医学知识库中获得,比如:维生素B6注射液、维生素C注射液属于西药类层级下的维生素类,西咪替丁注射液属于西药类层级下的抑酸药类;注射器、输液器则属于耗材类层级下的一次性耗材类,等等具有明确包含关系的数据结构层次。本申请在计算差异度时,选择其中的一个或几个层次进行运算。本申请实施例通过从最高层级运算后,再递进到下一层级,如先按照西药类、耗材类进行计算,再按照抑酸药类、维生素类、一次性耗材类等细分类进行运算,使差异度计算更精准,每个层级计算通过当前层级下对应的差异阈值进行优化搜索空间,序列数据与序列模板数据的相似映射关系更准确。当前层级下对应的差异阈值,满足使组成搜索空间的方格在本层级下是连续贯通分布的,即相连行之间不能存在大于差异阈值的方格阻断搜索空间在行与行之间的连续性。
进一步地,所述第一层级包括医疗项目类别,第一计算单元,包括:
获取子单元,用于获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;
计算子单元,用于将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
本申请实施例中,差异度计算公式为:其中,Dk为数据块与模板对比后差异项目(Diff)的数量,Df为差异项目产生的金额(fee)(或数量kind),Sk为相同项目(Same)的数量,Sf为相同项目产生的金额(fee)(或数量kind)。根据当前计算层中的具体项目中包括的差异项目以及相同项目的具体情况进行计算,当前层级中计算得到的差异度大,则可直接省略下一层级的差异度计算。比如当前层级一个为西药类,一个为中药类,则对于中药类和西药类下一层级的差异度计算可直接省略。但当前层级计算中差异度小于阈值,下一层级的差异度计算与当前层级的差异度计算并不存在必然联系,需要对下一层级的差异度进行重新计算,但差异度计算公式相同。本申请的医疗记录数据多为按一个时间段分段排列的医院账单或医嘱单,进行数据分块后,依然以数据组的形式存在,甚至包括文本数据,无法通过代入动态调整算法,本申请通过差异度的计算,将数据组的形式的数据块转化为数值代入动态调整算法,实现医疗记录数据的标准化调整。
进一步地,第一搜寻单元,包括:
比较子单元,用于比较所述第一分布图中各方格中的赋值;
选择子单元,用于选择最小赋值作为搜寻起始值;
确定子单元,用于通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;
标记子单元,用于将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;
判断子单元,用于判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;
判定子单元,用于若阻断所述保留类的方格在行与行之间以及列与列之间的连续贯通分布,则判定所述指定赋值为所述第一阈值。
本申请实施例中,以住院治疗的医疗事件为例,详细说明计算差异度的过程。举例地,序列模板数据的住院天数为6天,实际住院天数为9天,然后将序列模板数据的住院天数和实际住院天数组成二维数组对应的方格矩阵。按照上述的差异度计算公式,按照住院医疗项目所属的项目类别精算差异度,然后将差异度值填入上述方格矩阵的各对应方格中。本申请实施例以两个相邻层级的计算为例,进行详细说明。比如,当前层级对应的差异度计算完毕,形成的当前层级下的第一分布图,如下表1所示。然后通过二分类法或递进逼近法,搜索第一分布图中的差异阈值为0.25,因大于0.25后,第一分布图的第4行将被阻断而导致数据不连续,数据不连续则无法通过动态归整算法实现映射。判断每一行及其相邻行的保留类方格是否至少通过另外一行中的方格实现行与行之间的互相连通,且每一行的保留类方格也需要互相连通,即保留类方格在第一分布图中的分布状态为完整连续、不隔断。确定停止差异化计算时对应的差异阈值后,将大于0.25的格子标记为删除类,将小于等于阈值的格子标为保留类,得到保留类方格形成的第二分布图,如下表2所示。然后根据第一分布图中差异阈值的搜寻过程,确定第二分布图中的差异阈值,进行依次优化,至达到差异化计算达到预设条件。
表1
表2
进一步地,第一判断模块4,包括:
判断单元,用于判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;
判定单元,用于若保留类的方格的分布状态未发生改变,则判定所述差异化计算达到预设条件。
本申请实施例的预设条件为认定达到最终的优化效果,停止继续差异化计算,包括在数据结构层次中两个连续的层级上计算差异度后,保留类方格的分布状态不再发生改变;或以达到数据结构层次中的最低层级。
进一步地,所述指定方格为所述保留类的方格,映射模块6,包括:
确定单元,用于确定归整路径的起点和终点分别对应的方格;
选择单元,用于在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;
调整单元,用于动态调整所述归整路径,判断所述归整路径的距离是否达到最短;
建立单元,用于若达到最短,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
本申请实施例通过动态归整算法寻找路径中相似点,并建立映射关系。动态归整算法形成的归整路径表示为W=W1,W2,W3,...,Wk,Wk的表达形式为点坐标(i,j),i表示序列数据所在序列x,j表示序列模板数据所在序列y,W1的表达形式为点坐标(1,1),Wk=(i,j),Wk+1=(i`,j`),i≤i`≤i+1,j≤j`≤j+1,通过动态归整算法,得到距离最短的归整路径Dist(Wki,Wkj)表示数据点Wkj和数据点Wkj的欧氏距离,数据点Wki表示序列x的第i个数据点,数据点Wkj表示序列y的第j个数据点。根据最后确定的最短距离的归整路径上的点坐标,对应于序列x和序列y的对应关系,得到序列x和序列y的映射关系,实现将序列数据映射至序列模板数据上,达到医疗记录数据的标准化。
本申请一实施例,以对比阑尾炎普通患者和标准模板数据的归整变化为例。如附图2看到,阑尾炎依据国家临床路径文档为7天标准住院天数,普通住院病例使用了6天,经过归整后发现其主要在第5-6天提高医疗效率。进行了医疗数据压缩,该实际医疗病例和国家临床路径文档的标准模板数据的差异很小。
本申请另一实施例,以长期住院的阑尾炎病例与标准模板数据的归整变化为例。如附图3,实际病例住院了20天,远远大于标准的7天,而通过归整对比,实际病例的第4-12天均映射到了标准的第3天,14-18天均映射到了标准的第5天,提示实际在这两天因不明原因拖延了,导致其时间消耗主要浪费在第3天和第5天,通过归整对比提示医院应该检视该病例在第3天和第5天的治疗情况。
通过上述两个实施例,通过将长期住院病例和普通病例统一映射到了标准模板数据上,解决了医疗数据因时间跨度不同而无法分析的问题。
进一步地,医疗记录数据的标准化装置,包括:
第二获取模块,用于获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;
第二判断模块,用于判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;
判定模块,用于若达到预设相似阈值,则判定所述第一病例与所述第二病例为雷同病例;
发出模块,用于发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
本申请实施例,通过将病例数据库中的病例通过标准化映射后,再比较映射后的匹配路径的相似性,提高比较两个病例相似性的精准度,提高筛选类同病例的精准性,提高病例管控以及虚假治疗骗保的监控效果。
参照图5,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗记录数据的标准化过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现医疗记录数据的标准化方法。
上述处理器执行上述医疗记录数据的标准化方法,包括:获取指定医疗事件的医疗记录数据;将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;判断所述差异化计算是否达到预设条件;若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
上述计算机设备,通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理。
在一个实施例中,上述处理器将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图的步骤,包括:获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
在一个实施例中,第一层级包括医疗项目类别,上述处理器在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图的步骤,包括:获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
在一个实施例中,上述处理器在所述第一分布图上按照预设搜寻规则,搜寻第一阈值的步骤,包括:比较所述第一分布图中各方格中的赋值;选择最小赋值作为搜寻起始值;通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;若是,则判定所述指定赋值为所述第一阈值。
在一个实施例中,上述处理器判断所述差异化计算是否达到预设条件的步骤,包括:判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;若否,则判定所述差异化计算达到预设条件。
在一个实施例中,指定方格为所述保留类的方格,上述处理器在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤,包括:确定归整路径的起点和终点分别对应的方格;在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;动态调整所述归整路径,判断所述归整路径的距离是否达到最短;若是,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
在一个实施例中,上述处理器在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤之后,包括:获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;若是,则判定所述第一病例与所述第二病例为雷同病例;发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现医疗记录数据的标准化方法,包括:获取指定医疗事件的医疗记录数据;将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;判断所述差异化计算是否达到预设条件;若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
上述计算机可读存储介质,通过将医疗记录数据进行合理分块,并将每个数据分块通过动态时间归整的计算方式,将医疗记录数据映射到标准医疗路径对应的序列模板数据上,实现医疗记录数据的标准化处理。
在一个实施例中,上述处理器将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图的步骤,包括:获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
在一个实施例中,第一层级包括医疗项目类别,上述处理器在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图的步骤,包括:获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
在一个实施例中,上述处理器在所述第一分布图上按照预设搜寻规则,搜寻第一阈值的步骤,包括:比较所述第一分布图中各方格中的赋值;选择最小赋值作为搜寻起始值;通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;若是,则判定所述指定赋值为所述第一阈值。
在一个实施例中,上述处理器判断所述差异化计算是否达到预设条件的步骤,包括:判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;若否,则判定所述差异化计算达到预设条件。
在一个实施例中,指定方格为所述保留类的方格,上述处理器在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤,包括:确定归整路径的起点和终点分别对应的方格;在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;动态调整所述归整路径,判断所述归整路径的距离是否达到最短;若是,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
在一个实施例中,上述处理器在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤之后,包括:获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;若是,则判定所述第一病例与所述第二病例为雷同病例;发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种医疗记录数据的标准化方法,其特征在于,包括:
获取指定医疗事件的医疗记录数据;
将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
判断所述差异化计算是否达到预设条件;
若是,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上;
所述将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图的步骤,包括:
获取所述指定医疗事件的医疗记录数据中包括的数据结构层次,其中,所述数据结构层次包括由高向低依次排序第一层级、第二层级至第N层级;
在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图,其中,所述二维数组由所述预设分块方式对应的标准分区以及所述序列数据对应的分区组成;
在所述第一分布图上按照预设搜寻规则,搜寻第一阈值;
保留小于或等于所述第一阈值的差异值对应的方格,形成第二分布图;
在所述第二分布图上,计算所述序列数据与预设的序列模板数据,在所述第二层级上的差异度,对应更新所述第二分布图上各方格对应的差异度赋值;
按照所述第一阈值的搜寻过程,在所述第二分布图上搜寻第二阈值;
按照所述第一层级上的差异度和第二层级上的差异度的计算过程,计算所述第N层级上的差异度,以及搜寻所述第N层级上对应的第N阈值。
2.根据权利要求1所述的医疗记录数据的标准化方法,其特征在于,所述第一层级包括医疗项目类别,所述在二维数组上计算所述序列数据与预设的序列模板数据,在所述第一层级上的差异度,形成第一分布图的步骤,包括:
获取所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异信息,其中,所述差异信息包括存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额;
将所述存在差异的项目的数量、存在差异的项目对应的金额、相同项目的数量以及相同项目对应的金额,代入差异度计算公式,计算所述序列数据与预设的序列模板数据,在所述医疗项目类别上的差异度。
3.根据权利要求1所述的医疗记录数据的标准化方法,其特征在于,所述在所述第一分布图上按照预设搜寻规则,搜寻第一阈值的步骤,包括:
比较所述第一分布图中各方格中的赋值;
选择最小赋值作为搜寻起始值;
通过预设搜寻方式确定大于所述搜寻起始值的指定赋值;
将大于所述指定赋值的方格标记为删除类,将小于所述指定赋值的方格标记为保留类;
判断将所述指定赋值的方格标记为删除类时,是否阻断所述保留类的方格,在行与行之间以及列与列之间的连续贯通分布;
若是,则判定所述指定赋值为所述第一阈值。
4.根据权利要求3所述的医疗记录数据的标准化方法,其特征在于,判断所述差异化计算是否达到预设条件的步骤,包括:
判断所述数据结构层次中两个连续的层级上,分别计算差异度后,所述保留类的方格的分布状态是否发生改变;
若否,则判定所述差异化计算达到预设条件。
5.根据权利要求3所述的医疗记录数据的标准化方法,其特征在于,所述指定方格为所述保留类的方格,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤,包括:
确定归整路径的起点和终点分别对应的方格;
在所述保留类的方格的分布区域上,选择所述起点和终点分别对应的方格之外的特定方格,连接所述起点和终点分别对应的方格,形成归整路径,其中,所述特定方格包括与每个标准数据对应的一个或多个方格;
动态调整所述归整路径,判断所述归整路径的距离是否达到最短;
若是,则根据所述归整路径中所述序列数据与所述序列模板数据的对应点,将所述序列数据与所述序列模板数据建立映射关系。
6.根据权利要求1所述的医疗记录数据的标准化方法,其特征在于,所述在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上的步骤之后,包括:
获取第一病例与标准病例的第一匹配路径,获取第二病例与所述标准病例的第二匹配路径;
判断所述第一匹配路径和所述第二匹配路径的相似度,是否达到预设相似阈值;
若是,则判定所述第一病例与所述第二病例为雷同病例;
发出核验所述第一病例与所述第二病例为雷同病例的预警提示。
7.一种医疗记录数据的标准化装置,用于实现权利要求1-6中任意一项所述的方法,其特征在于,包括:
第一获取模块,用于获取指定医疗事件的医疗记录数据;
分块模块,用于将所述指定医疗事件的医疗记录数据,按照预设分块方式进行数据分块,并排布成序列数据;
计算模块,用于将所述序列数据与预设的序列模板数据,进行差异化计算,形成差异值分布图,其中,所述差异值分布图由填充差异值的方格组成;
第一判断模块,用于判断所述差异化计算是否达到预设条件;
确定模块,用于若达到预设条件,则确定停止差异化计算时对应的差异阈值,并保留差异值小于等于所述差异阈值要求的指定方格;
映射模块,用于在所述指定方格的分布区域上,将所述序列数据通过动态归整算法映射到所述序列模板数据上。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897791.8A CN112035476B (zh) | 2020-08-31 | 2020-08-31 | 医疗记录数据的标准化方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897791.8A CN112035476B (zh) | 2020-08-31 | 2020-08-31 | 医疗记录数据的标准化方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112035476A CN112035476A (zh) | 2020-12-04 |
CN112035476B true CN112035476B (zh) | 2024-05-14 |
Family
ID=73587233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010897791.8A Active CN112035476B (zh) | 2020-08-31 | 2020-08-31 | 医疗记录数据的标准化方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112035476B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115048884B (zh) * | 2022-08-16 | 2023-02-28 | 武九铁路客运专线湖北有限责任公司 | 一种渗流应力耦合作用下岩石损伤破裂数据化记录方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006313523A (ja) * | 2005-04-05 | 2006-11-16 | Yoshiro Mizuno | 処方箋、院内オーダー、調剤、レセプトにおける業務処理支援システム |
CN104361221A (zh) * | 2014-10-31 | 2015-02-18 | 沈阳锐易特软件技术有限公司 | 基于异构系统数据映射模板的医疗数据采集系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10133847B2 (en) * | 2014-06-10 | 2018-11-20 | International Business Machines Corporation | Automated medical problem list generation from electronic medical record |
-
2020
- 2020-08-31 CN CN202010897791.8A patent/CN112035476B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006313523A (ja) * | 2005-04-05 | 2006-11-16 | Yoshiro Mizuno | 処方箋、院内オーダー、調剤、レセプトにおける業務処理支援システム |
CN104361221A (zh) * | 2014-10-31 | 2015-02-18 | 沈阳锐易特软件技术有限公司 | 基于异构系统数据映射模板的医疗数据采集系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112035476A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2936344B1 (en) | Searchable data archive | |
WO2020000688A1 (zh) | 财务风险验证处理方法、装置、计算机设备及存储介质 | |
US5404509A (en) | Conducting and managing sampled information audits for the determination of database accuracy | |
CN109147198B (zh) | 自助售药方法和系统 | |
CN110363387A (zh) | 基于大数据的画像分析方法、装置、计算机设备及存储介质 | |
CN109659013A (zh) | 病症分诊及路径优化方法、装置、设备及存储介质 | |
CN107067164A (zh) | 一种指标快速估算方法及系统 | |
CN112035476B (zh) | 医疗记录数据的标准化方法、装置和计算机设备 | |
CN110782965B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN110782998A (zh) | 数据审核方法、装置、计算机设备和存储介质 | |
CN111180024A (zh) | 基于词频逆文档频率的数据处理方法、装置和计算机设备 | |
CN112017745A (zh) | 决策信息推荐、药物信息推荐方法、装置、设备及介质 | |
CN110729054B (zh) | 异常就诊行为检测方法、装置、计算机设备及存储介质 | |
CN112560444A (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN111210356B (zh) | 医保数据分析方法、装置、计算机设备和存储介质 | |
CN115203167A (zh) | 数据检测方法、装置、计算机设备和存储介质 | |
CN113065940A (zh) | 基于人工智能的发票报销的方法、装置、设备及存储介质 | |
CN113657970B (zh) | 基于人工智能的药品推荐方法、装置、设备及存储介质 | |
CN112035618A (zh) | 医疗费用分析方法、装置、计算机设备及存储介质 | |
CN112836041B (zh) | 人员关系分析方法、装置、设备及存储介质 | |
Yuan et al. | Exploring the growth patterns of medical demand for eye care: a longitudinal hospital-level study over 10 years in China | |
CN113257436A (zh) | 一种帕金森病治疗的药物治疗管理方法和系统 | |
CN110727711B (zh) | 基金数据库中异常数据检测方法、装置和计算机设备 | |
CN111063452A (zh) | 药物匹配方法、计算机设备 | |
CN114358036A (zh) | 基于互联网的智慧医疗物资调配方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220525 Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |