CN116452347A - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116452347A CN116452347A CN202310263883.4A CN202310263883A CN116452347A CN 116452347 A CN116452347 A CN 116452347A CN 202310263883 A CN202310263883 A CN 202310263883A CN 116452347 A CN116452347 A CN 116452347A
- Authority
- CN
- China
- Prior art keywords
- disease
- data
- diagnosis
- data processing
- feature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 47
- 238000003860 storage Methods 0.000 title claims abstract description 24
- 201000010099 disease Diseases 0.000 claims abstract description 398
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 398
- 238000003745 diagnosis Methods 0.000 claims abstract description 105
- 238000012545 processing Methods 0.000 claims abstract description 73
- 238000007781 pre-processing Methods 0.000 claims abstract description 60
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000013507 mapping Methods 0.000 claims description 41
- 208000019622 heart disease Diseases 0.000 claims description 24
- 238000003908 quality control method Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 12
- 238000001356 surgical procedure Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000000034 method Methods 0.000 description 44
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 8
- 238000007621 cluster analysis Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000000306 recurrent effect Effects 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 208000028659 discharge Diseases 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000035558 fertility Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 206010053942 Cerebral haematoma Diseases 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002586 coronary angiography Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000031225 myocardial ischemia Diseases 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010014096 Echinococciasis Diseases 0.000 description 1
- 208000009366 Echinococcosis Diseases 0.000 description 1
- 238000001604 Rao's score test Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012753 partial hepatectomy Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Primary Health Care (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Educational Administration (AREA)
- Epidemiology (AREA)
- Human Resources & Organizations (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供了一种数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及医保结算领域。具体实现方案为:获取原始病历数据;对原始病历数据进行预处理,得到预处理结果;对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
Description
技术领域
本公开涉及计算机技术领域,进一步涉及医保结算领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着我国经济的高速增长,医疗保障事业也飞速发展,医疗保险的覆盖程度、参保人员的规模、相关医保机构的数量以及医保报销的金额也与日俱增。医保支付方式是基本医疗保险制度的核心内容之一,其对费用控制、资源配置、规范和引导医疗行为等具有强导向作用,更是医保制度稳健运行的关键。相关技术中通常采用按项目付费、总额预付、按人头付费以及按病种定额付费等方式进行医保基金的支付,然而以上支付方式的操作过程大多较为繁琐并且仅能实现医保基金支付的基本功能,无法因地制宜地实现对于医保基金的智能监管,从而影响对于医疗资源的合理使用。
发明内容
本公开提供了一种数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中进行医保基金支付时的操作过程繁琐、无法合理分配医疗资源的技术问题。
根据本公开的一方面,提供了一种数据处理方法,包括:获取原始病历数据;对原始病历数据进行预处理,得到预处理结果;对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
根据本公开的又一方面,提供了一种数据处理装置,包括:获取模块,用于获取原始病历数据;第一处理模块,用于对原始病历数据进行预处理,得到预处理结果;第二处理模块,用于对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;生成模块,用于基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提出的数据处理方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提出的数据处理方法。
根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行本公开提出的数据处理方法。
在本公开中,通过获取原始病历数据,进而对原始病历数据进行预处理,得到预处理结果,随后对预处理结果进行特征抽取处理,得到用于确定治疗对象的疾病分类的诊断特征信息,以及用于确定手术操作编码和/或手术操作类型属性与等级的手术操作特征信息,最后基于诊断特征信息和手术操作特征信息生成按病种分值付费目录,达到了基于原始病历数据生成高效、准确地对应的病种分值付费目录的目的,实现了提高支付医保基金的操作效率、公正合理地分配医疗资源的效果,从而解决了相关技术中进行医保基金支付时的操作过程繁琐、无法合理分配医疗资源的技术问题。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本公开实施例的一种数据处理方法流程图;
图3是根据本公开实施例的一种门控循环神经网络模型的结构示意图;
图4是根据本公开实施例的一种手术操作标签预测的过程示意图;
图5是根据本公开实施例的一种综合病种目录聚类的流程示意图;
图6是根据本公开实施例的一种数据处理方法的示意图;
图7是根据本公开实施例的又一种数据处理方法的示意图;
图8是根据本公开实施例的一种数据处理装置的结构框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
我国的医疗保险基金是通过社会参保人员及其工作单位缴纳的参保费用和各级政府的财政补助的积累而形成的基金,是维持全社会医疗保障所不可缺少的重要组成部分,实际情况下,它是由医疗保险经办管理部门进行统一管理,并根据制定的相关规章制度进行参保人员医疗费用的支付。医疗保险基金关乎每一位社会参保人员的根本利益,也关系着社会的稳定发展。
随着我国经济的高速增长,医疗保障事业也飞速发展,医疗保险的覆盖程度,参保人员的规模,相关医保机构的数量,医保报销的金额也与日俱增。据可靠数据显示,截止2022年6月底,全国范围内的职工基本医疗保险3.57亿人,城乡居民基本医疗保险9.81亿人;生育保险参保人数为2.41亿人。基本医疗保险(含生育保险)基金收入15200.51亿元,基本医疗保险(含生育保险)基金支出11030.88亿元。医保基金始终坚持“以收定支、收支平衡、略有结余”的原则,保障基金安全可持续。
医保支付方式是基本医疗保险制度的核心内容之一,对费用控制、资源配置、规范和引导医疗行为等具有强导向作用,更是医保制度稳健运行的关键。因此如何因地制宜实现医保机制和管理创新,对不同级别医院或者收治不同病种支付较为合理的医保费用,从而达到对医保基金的智能监管,是具有十分重大的意义。
现阶段相关技术中的医保基金支付方式主要有如下几种形式:
(1)按项目付费:按项目付费是对医疗服务过程中所设计的每一项服务项目制定价格。参保人员在享受医疗服务时逐一对服务项目进行计费或者付费,然后由医疗保险经办机构向参保人或者定点医疗机构按照规定比例偿付发生的医疗费用。这是一种运用最早而又最常用的一种付费方式,也是目前我国医疗支付的基本方法。
按项目付费的特点是完全依据服务项目及服务量收费,会以增加服务项目及服务量为导向,优点在于能够提供质量更好,效率更高的医疗服务,但是缺点是医疗机构为了增加自己的收入会提供过多的服务量,例如可做可不做的检查都会开单据让患者做,其结果就会导致过度医疗的出现,在浪费医疗资源的同时,还增加了相关工作人员的负担,最后,还给患者和医保机构带来经济负担。
(2)总额预付:总额预付制是政府或医保经办与医疗服务提供方协商,以前期医院总支出作为依据,在剔除不合理的支出之后,确定下一年度的总额预算。在支付费用时,不论医院实际发生医疗费用支出多少,都以这个协商定额作为支付最高的限额,遵循“超支不补,结余自用”的原则。
总额预付制的缺点是由于各种外在因素的影响,医院每年的住院人数、住院费用等具有较大的不确定性,因此通过协商确定合适的年度预算总额是一件非常困难的事。若预算过高,容易引起医疗供给费用过高;若预算过低,那么医院可能出现医疗服务提供不足和医疗服务质量下降的现象。
(3)按人头付费:按人头付费是医疗保险机构每月或者每年按医院或医生服务的人数和规定收费的定额,预付给医疗服务提供方的一笔固定费用。在此期间,医院提供合同范围内的一起医疗服务。
按人头付费操作简单,医院管理成本较低,但是该方法会诱导医院对病人进行选择性接收,例如接收症状较轻,病情比较简单,住院时间相对较短的人,推诿病重的患者,将患者的住院次数进行分解,从而在付费环节可以获取到更多的“人头”,最终导致医疗服务质量逐渐下降,损害患者利益。
(4)按病种定额付费:又称为按疾病诊断付费。是根据国际疾病分类标准将住院病人的疾病诊断进行相关分组,充分利用医保信息系统和公立医院病案信息数据,在合理分组和据实测算基础上与医疗机构进行协商,确定医保病种定额付费标准向医院付费。
按病种定额付费是将住院病人的疾病按诊断、年龄、行为等分成若干组,每组又根据疾病的轻重程度及有无合并症、并发症分成不同的级别,对不同的病组预先制定一个付费标准,根据该付费标准对病人的治疗过程进行报销。但是该方法的管理成本非常高,需要预先划分病组,并且如何将一个病人进行恰当的分组比较困难。另外,医院也可能为了获取到医保局更加高额的报销,而使诊断升级从而划分到具有更高付费标准的病组中,最终影响医疗资源的合理、公正使用。
随着国家医保局不断发文推进基于大数据的按病种分值付费(Big DataDiagnosis Intervention Packet,DIP),多个按分值付费试点城市名单也进行了公布,以及《国家医疗保障按病种分值付费(DIP)技术规范》和《DIP目录库(1.0版)》的发布,DIP的推广与落地已经迫在眉睫。
但是想要实际使用DIP进行医疗行为的支付,最重要的环节是对每一个病例根据手术编码、诊断编码、特征进行入组,然后才能根据入组的结果得到每组的分值、点值、支付标准等指标的测算。而国家医保局发布的病种目录只含有核心病种,且不同地方由于自身的地域和发展的差异性也会存在大量的本地核心病种。此外,国家目录缺乏综合病种,这就对各个医保局、医疗机构的使用造成了障碍。目前,大多数的DIP分组器是通过医学人工建立的病种目录及入组规则实现了疾病及手术操作的分组,但是该方法不具备推广性,且人力成本耗费巨大。
综上可知,相关技术中进行医保基金支付时的操作过程繁琐、无法合理分配医疗资源,针对上述问题,目前尚未提出有效的解决方案。
根据本公开实施例,提供了一种数据处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本公开实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的电子设备中执行。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。图1示出了一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图。
如图1所示,计算机终端100包括计算单元101,其可以根据存储在只读存储器(ROM)102中的计算机程序或者从存储单元108加载到随机访问存储器(RAM)103中的计算机程序,来执行各种适当的动作和处理。在RAM 103中,还可存储计算机终端100操作所需的各种程序和数据。计算单元101、ROM 102以及RAM 103通过总线104彼此相连。输入/输出(I/O)接口105也连接至总线104。
计算机终端100中的多个部件连接至I/O接口105,包括:输入单元106,例如键盘、鼠标等;输出单元107,例如各种类型的显示器、扬声器等;存储单元108,例如磁盘、光盘等;以及通信单元109,例如网卡、调制解调器、无线通信收发机等。通信单元109允许计算机终端100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元101执行本文所描述的数据处理方法。例如,在一些实施例中,数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 102和/或通信单元109而被载入和/或安装到计算机终端100上。当计算机程序加载到RAM 103并由计算单元101执行时,可以执行本文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
此处需要说明的是,在一些可选实施例中,上述图1所示的电子设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述电子设备中的部件的类型。
在上述运行环境下,本公开提供了如图2所示的数据处理方法,该方法可以由图1所示的计算机终端或者类似的电子设备执行。图2是根据本公开实施例提供的一种数据处理方法流程图。如图2所示,该方法可以包括如下步骤:
步骤S21,获取原始病历数据;
上述原始病历数据可以为真实电子病历数据,该数据可以从地方医疗系统的服务器中进行实时获取,也可以通过设置时间条件集中调取历史时间段内在该地方医疗系统中产生的病历数据而获得。
步骤S22,对原始病历数据进行预处理,得到预处理结果;
具体的,对于原始病历数据进行的预处理操作包括但不限于数据清洗操作、版本映射操作以及数据质控操作。通过对真实电子病历数据进行预处理而得到预处理结果,该预处理结果中包括原始病历数据所对应的多种特征数据,进一步采用特征提取方式对该多项特征数据进行采样提取,可以得到聚类分析所需的特征数据。
步骤S23,对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
上述诊断特征信息和手术操作特征信息可以为进行聚类分析时所需的特征数据。其中,诊断特征信息可以包括主诊断亚目、主诊断类目以及主诊断编码的第一位,基于主诊断亚目、主诊断类目以及主诊断编码的第一位中的一项或者多项可以确定治疗对象的疾病分类。具体的,国际疾病分类(International Classification of Diseases,ICD)是依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统,ICD中一个完整的细目扩展编码为6位编码,亚目为前4位编码,类目为前3位编码。上述手术操作特征信息可以包括手术操作编码、手术操作类型属性以及手术等级。
上述诊断特征信息和手术操作特征信息中的内容可以进行随机组合,从而作为聚类分析所使用的特征。例如,将主诊断亚目与手术操作编码作为聚类分析的第一种特征组合,将主诊断类目、手术操作类型属性和手术等级作为聚类分析的第二种特征组合,将主诊断编码的第一位、手术操作类型属性以及手术等级作为聚类分析的第二种特征组合。进一步的,在聚类分析时,可以对第一特征组合按使用的手术操作分类与编码技术进行分类,如同一病案中有多个手术操作分类与编码时,可将各编码叠加作为新的分类,最终通过对临床疾病中疾病诊断与治疗方式的随机组合,穷举形成DIP目录。
步骤S24,基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
上述目标目录可以为原始病历数据的数据来源地区对应的地方DIP目录,目标目录中包括该地方的核心病种和综合病种,由于符合地方疾病数据特点和治疗方式,因而利用该目标目录可以有效提高按病种分值付费的准确性和实施效率。
根据本公开上述步骤S21至步骤S24,通过获取原始病历数据,进而对原始病历数据进行预处理,得到预处理结果,随后对预处理结果进行特征抽取处理,得到用于确定治疗对象的疾病分类的诊断特征信息,以及用于确定手术操作编码和/或手术操作类型属性与等级的手术操作特征信息,最后基于诊断特征信息和手术操作特征信息生成按病种分值付费目录,达到了基于原始病历数据生成高效、准确地对应的病种分值付费目录的目的,实现了提高支付医保基金的操作效率、公正合理地分配医疗资源的效果,从而解决了相关技术中进行医保基金支付时的操作过程繁琐、无法合理分配医疗资源的技术问题。
可选地,可选地,本公开实施例中的数据处理方法可以但不限于适用在医保支付监管场景之中,具体可以为地方病种目录的构建场景、按病种分值付费场景等,本公开实施例不予限制。
下面对上述实施例的数据处理方法进行进一步介绍。
作为一种可选的实施方式,在步骤S22,对原始病历数据进行预处理,得到预处理结果包括:
步骤S221,对原始病历数据进行抽取与映射处理,得到病历首页数据;
步骤S222,对病历首页数据进行预处理,得到预处理结果。
具体的,对原始病历数据进行全自动抽取与映射处理,可以得到病历首页数据。上述病历首页数据可以为医疗保障基金结算清单,该结算清单是医保定点医疗机构在开展住院、门诊慢特病等医疗服务后,向医保部门申请费用结算时提交的数据清单。在医疗保障基金结算清单中包含有治疗对象基本信息、门诊慢特病诊疗信息、住院诊疗信息、医疗收费信息等。
基于上述可选实施例方式,通过对原始病历数据进行抽取与映射处理,得到病历首页数据,进而对病历首页数据进行预处理,得到预处理结果,从而可以实现大数据治理输出病历首页数据,进而能够保障目标目录的数据真实性和可靠性。
作为一种可选的实施方式,本公开实施例的数据处理方法还包括:
采用预设数据结构存储病历首页数据,其中,预设数据结构包括:多个信息段,多个信息段至少包括:治疗对象信息段、住院诊疗信息段,治疗对象信息段包括:治疗对象的人身属性内容、住院诊疗信息段包括:疾病诊断内容、手术操作内容、住院时长取值、医疗支付方式取值、离院方式取值。
例如,在预设数据结构中,治疗对象信息段包括有治疗对象的人身属性内容,如:年龄(岁):50,性别:男;住院诊疗信息段包括:疾病诊断内容、手术操作内容、住院时长取值、医疗支付方式取值、离院方式取值,如:出院诊断(西医):B67.800,肝棘球蚴病;手术操作:50.2200,部分肝切除术;59.9900x002,输尿管支架取出术;实际住院(天):3;医疗付费方式:1;医保支付方式:3;离院方式:1。
基于上述可选实施方式,能够基于实际应用场景设计一套全新的数据结构用于存储病历首页数据,并实现数据全自动抽取、映射与保存。
作为一种可选的实施方式,在步骤S222,对病历首页数据进行预处理,得到预处理结果包括:
步骤S2221,对病历首页数据的编码格式进行调整,得到调整结果;
步骤S2222,采用数据质控方式对调整结果进行清洗,得到预处理结果,其中,数据质控方式用于确定调整结果中的核心要素字段是否为空、调整结果是否处于指定的编码库范围以及调整结果是否满足手术与诊断需求。
具体的,由于通用的DIP分组标准中诊断和手术操作编码均为医保2.0,因此,为统一诊断和手术的编码版本,需要将病历首页数据中的诊断编码临床2.0版映射为医保2.0,将手术操作编码临床3.0映射为医保2.0,由此实现对于病历首页数据编码格式的调整。
进一步的,对调整结果进行质控,在质控环节包含三种类型,其中,第一类为核心要素未填写,例如出院主要诊断名称未填写,住院天数未填写等,该类型是通过监测对应字段的值是否为空值实现;第二类为不在编码库范围,其中,编码库范围包含两类,即ICD-10编码库范围和ICD-9-CM3编码库范围,该类型则是通过直接检索编码库实现;第三类为不能作为主要手术和不能作为主要诊断,该类型是根据医学专家人工整理的知识库进行筛选,最后将无法通过质控环节的数据进行剔除,保留可使用数据。而对于无法映射,或者无法通过质控的数据,则需要医学专家人工进行批量数据复核与纠正,或者是对知识库中遗漏的知识进行补充。
基于上述可选实施方式,通过对病历首页数据的编码格式进行调整,得到调整结果,进而采用数据质控方式对调整结果进行清洗,得到预处理结果,进而能够保障目标目录的数据真实性和可靠性。
作为一种可选的实施方式,在步骤S23,对预处理结果进行特征抽取处理,得到手术操作特征信息包括:
步骤S231,对预处理结果中的手术操作实体词进行语义理解,得到语义特征;
步骤S232,基于语义特征进行手术操作标签预测,得到手术操作特征信息,其中,手术操作特征信息包括:手术类型与手术等级。
具体的,语义理解是让计算机直接理解人类语言文本的意思,并把他们和用来描述实体、关系和事件的术语相关联起来,旨在提供实际的能力和非语言概念的表示,以便进行自然语言处理,并能够帮助机器更准确或者更高效地反映人类意图。通过对预处理结果中的手术操作实体词进行语义理解,能够获得手术操作实体词中的语义特征。
进一步的,基于语义特征进行手术操作标签预测,可以获得手术类型和手术等级。其中,手术类型中具体可以包括手术、介入治疗、治疗性操作、诊断性操作以及保守治疗操作等,手术等级则是由手术操作所对应的复杂程度、资源消耗程度拆分得到的四个等级,例如,1-一级手术、2-二级手术、3-三级手术、4-四级手术。
基于上述可选实施方式,通过对预处理结果中的手术操作实体词进行语义理解,得到语义特征,进而基于语义特征进行手术操作标签预测,能够快速确定手术类型和手术等级。
作为一种可选的实施方式,在步骤S231,基于语义特征进行手术操作标签预测,得到手术操作特征信息包括以下方式之一:采用预设标注方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用关键词映射方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用文本相似度映射方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用隐式向量匹配标签传递方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用门控循环神经网络模型对语义特征进行手术操作标签预测,得到手术操作特征信息。
采用预设标注方式对语义特征进行手术操作标签预测时,可以采用人工标注的方式进行手术操作标签预测。具体的,根据已经整理的人工标注结果直接建立实体词到标签的映射知识库,然后通过从映射知识库中进行检索的方式,即可得到该实体词对应的手术类型标签以及手术等级标签。
采用关键词映射方式对语义特征进行手术操作标签预测时,预先建立关键词到手术类型标签之间的映射关系,例如在“切除术”和“手术”之间,“显像”和“诊断性操作”之间,“疗法”和“治疗性操作”之间建立映射关系,该映射关系可以基于统计学原理实现。在进行手术操作标签预测时,首先从语义特征中抽取关键词,然后统计关键词与各个手术操作类型属性对应关系的频次,将频次占比超过95%的手术操作类型属性作为该关键词对应的手术类型标签。
采用文本相似度映射方式对语义特征进行手术操作标签预测,得到手术操作特征信息时,可以将待预测实体词与知识库中的实体词计算杰卡德(Jaccard)相似度,Jaccard相似度计算方法如公式(1)所示:
进一步的,通过将Jaccard相似度于预设阈值进行比较,从而确定候选实体词,将由多个候选实体词所组成的候选集合依次映射到手术类型标签,进而可以将标签数量最多的手术类型标签作为待预测实体词的标签预测结果。
采用隐式向量匹配标签传递方式对语义特征进行手术操作标签预测时,依次将待预测实体词与知识库中的实体词进行结巴(jieba)分词,将分词结果进行合并,得到一个合并后的词语集合,随后以这个合并后的词语集合为基准,遍历集合中的每个词语,实体词中存在该词语就用1表示,实体词中不存在该词语就用0表示,这由此可将待预测实体词和知识库中的文本转化为0/1向量的形式。进一步的,依次计算待预测实体词对应的向量与知识库中的实体词对应的向量之间的余弦相似度,其中,余弦相似度的计算方法如公式(2)所示:
最后将满足阈值条件的实体词标签传递给待预测实体词,以作为待预测实体词的标签预测结果。
采用门控循环神经网络(Gate Recurrent Unit,GRU)模型对语义特征进行手术操作标签预测,其中,GRU是长短期记忆网络(Long Short-Term Memory,LSTM)的变种,它也是一种循环神经网络(Recurrent Neural Network,RNN),因此具有循环结构。图3是根据本公开实施例的一种门控循环神经网络模型的结构示意图,如图3所示,GRU模型中依次包括输入层、嵌入层、第一全连接层(Fully Connected Layer)、GRU层、池化层(pool)、第二全连接层、S型函数(sigmoid)层以及输出层。
相比LSTM而言,GRU模型的计算复杂度相对简单,计算量也会降低。GRU模型中包括有重置门和更新门,其中,重置门决定了如何将新的输入信息与前面的记忆相结合,更新门定义了前面记忆保存到当前时间步的量。
在实际应用中,首先将所有知识库以及待预测实体词进行字符层级的分割,生成词典,保证每个字符只有唯一的数字与之对应;接下来将知识库中的映射关系划分训练集、验证集和测试集,然后将实体词进行一维向量的嵌入(embedding)得到特征向量,将得到的特征向量与标签一同送入GRU网络进行训练拟合;最后通过sigmoid层输出属于每一种手术操作类型属性或者手术等级标签的预测概率,最后预测概率确定待预测实体词的手术操作类型和手术等级标签。
图4是根据本公开实施例的一种手术操作标签预测的过程示意图,针对手术操作实体词“脑血肿切开引流术”,可以采用以下任意一种方法进行手术操作标签预测:人工标注法、关键词映射法、文本相似度映射法、隐式向量匹配标签传递法、GRU深度模型预测法,经过手术操作标签预测后得到手术操作实体词“脑血肿切开引流术”对应的手术操作特征信息,该手术操作特征信息中,手术类型为“手术”,手术等级为“三级手术”。
基于上述可选实施方式,能够灵活采用多种方式实现手术操作标签预测,从而快速获得手术操作实体词对应的手术操作特征信息。
作为一种可选的实施方式,在步骤S24,基于诊断特征信息和手术操作特征信息生成目标目录包括:
步骤S241,对诊断特征信息和手术操作特征信息进行分组处理,得到多个数据集;
步骤S242,对多个数据集进行并行映射处理,得到多个数据集对应的多个病种类别;
步骤S243,对多个病种类别进行聚类处理,得到目标目录。
具体的,对诊断特征信息和手术操作特征信息进行随机均匀划分,可以得到多个数据集,对多个数据集中的每个数据仅进行并行映射处理,即进行特征数据到病种类别的映射,进而可以得到多个数据集对应的多个病种类别,最后对多个病种类别进行聚类处理,得到目标目录。
基于上述可选实施方式,通过对诊断特征信息和手术操作特征信息进行分组处理,得到多个数据集,进而对多个数据集进行并行映射处理,得到多个数据集对应的多个病种类别,最后对多个病种类别进行聚类处理,得到目标目录,能够将规模巨大的特征数据划分为不同的组,并在组与组之间并行执行映射计算,采用以空间换时间的方式,从而可以有效降低需要消耗的计算时间,提升DIP目录的生成效率。
作为一种可选的实施方式,在步骤S243,对多个病种类别进行聚类处理,得到目标目录包括:
步骤S2431,采用诊断特征信息和/或手术操作特征信息对多个病种类别进行聚类处理,得到聚类结果;
步骤S2432,按照病种例数由高到低的顺序对聚类结果进行排序处理,得到排序结果,其中,排序结果包括:第一比例的第一病种和第二比例的第二病种,第一病种为核心病种,第二病种为综合病种;
步骤S2433,基于第一病种和第二病种确定目标目录。
具体的,采用诊断特征信息和/或手术操作特征信息对多个病种类别进行聚类处理时,可以根据主诊断亚目对多个病种类别进行聚类处理,也可以根据手术操作编码对多个病种类别进行聚类处理,还可以采用主诊断亚目与手术操作编码组合后的结果对多个病种类别进行聚类处理,从而得到聚类结果。
进一步的,按照病种例数由高到低的顺序对聚类结果进行排序处理,得到排序结果,其中,排序结果中包括由前85%的核心病种和后15%的综合病种,根据排序结果中的核心病种和综合病种可以确定DIP目录。
基于上述可选实施方式,采用诊断特征信息和/或手术操作特征信息对多个病种类别进行聚类处理,得到聚类结果,进而按照病种例数由高到低的顺序对聚类结果进行排序处理,得到排序结果,最后基于排序结果中的第一病种和第二病种确定目标目录,由此能够因地制宜地生成符合地方疾病数据特点和治疗方式的DIP目录,利用该DIP目录进行医保结算,从而能够实现对于医疗资源的合理分配。
作为一种可选的实施方式,在步骤S2433,基于第一病种和第二病种确定目标目录包括:
步骤S31,采用预设核心病种目录确定第一病种对应的第一病种类型,以及采用诊断特征信息和/或手术操作特征信息对第二病种进行聚类处理,得到第二病种对应的第二病种类型;
步骤S32,基于第三病种的病种分值计算得到第一病种对应的病种分值与第二病种对应的病种分值,其中,第三病种为预设基准病种;
步骤S33,通过第一病种类型、第二病种类型、第一病种对应的病种分值以及第二病种对应的病种分值确定目标目录。
上述预设核心病种目录为国家下发的核心病种目录,采用国家下发的核心病种目录确定核心病种对应的第一病种类型,采用主诊断类目和/或手术操作类型属性对综合病种进行聚类处理,得到综合病种对应的第二病种类型。
上述第三病种为预设基准病种,预设基准病种为普遍开展的、临床路径明确的、并发症与合并症少的、诊疗技术成熟的、医疗费用相对稳定的并由由当地医保局明确的某一个病种。通过计算预设基准病种在当地区域内全部医疗机构的例均费用,将该预设基准病种的病种分值设置为100,再根据其他DIP病种与预设基准病种的例均费用比例关系,即可对照着基准病种分值计算出核心病种的病种分值以及综合病种的病种分值。进一步的,通过第一病种类型、第二病种类型、核心病种对应的病种分值以及综合病种对应的病种分值确定目标目录。
基于上述可选实施方式,采用预设核心病种目录确定第一病种对应的第一病种类型,以及采用诊断特征信息和/或手术操作特征信息对第二病种进行聚类处理,得到第二病种对应的第二病种类型,进而基于第三病种的病种分值计算得到第一病种对应的病种分值与第二病种对应的病种分值,其中,第三病种为预设基准病种,最后通过第一病种类型、第二病种类型、第一病种对应的病种分值以及第二病种对应的病种分值确定目标目录,能够因地制宜地生成符合地方疾病数据特点和治疗方式的DIP目录,利用该DIP目录进行医保结算,从而能够实现对于医疗资源的合理分配。
作为一种可选的实施方式,在步骤S31,采用预设核心病种目录确定第一病种对应的第一病种类型包括:
步骤S311,将第一病种与预设核心病种目录进行匹配,得到匹配结果;
步骤S312,基于匹配结果确定第一病种类型。
具体的,将排序结果中前85%的核心病种与国家下发的核心病种目录进行匹配,得到匹配结果。若匹配结果显示匹配成功,则上述核心病种为国家-本地核心病种;若匹配结果显示匹配失败,则上述核心病种为该地区核心病种。
基于上述可选实施方式,通过将第一病种与预设核心病种目录进行匹配,得到匹配结果,进而基于匹配结果确定第一病种类型,从而能够快速准确地确定DIP目录中的核心病种,并且能够对专属于地区的核心病种进行区分,从而能够更加符合地方疾病数据特点和治疗方式。
作为一种可选的实施方式,在步骤S31,采用诊断特征信息和/或手术操作特征信息对第二病种进行聚类处理,得到第二病种对应的第二病种类型包括:
步骤S313,采用诊断特征信息对第二病种进行聚类处理,得到第一聚类组;
步骤S314,采用诊断特征信息和手术操作特征信息对第二病种进行聚类处理,得到多个第二聚类组;
步骤S315,基于第一聚类组和多个第二聚类组确定第二病种类型。
上述第一聚类组为保守治疗组,上述多个第二聚类组包括诊断性操作组、治疗性操作组和相关手术组。具体的,采用主诊断编码的第一位对综合病种进行聚类处理,从而得到保守治疗组;采用主诊断类目+手术操作类型属性为“诊断性操作”+对应手术操作的手术等级的组合特征数据对综合病种进行聚类处理,从而构建诊断性操作组;采用主诊断类目+手术操作类型属性为“治疗性操作”+对应手术操作的手术等级的组合特征数据对综合病种进行聚类处理,从而构建治疗性操作组;采用主诊断类目+手术操作类型属性为“手术”+对应手术操作的手术等级的组合特征数据对综合病种进行聚类处理,从而构建相关手术组。
进一步的,利用保守治疗组、诊断性操作组、治疗性操作组和相关手术组可以确定第二病种类型。具体的,通过对综合病种的聚类结果计算标准例均费用,根据预设基准病种计算标准分值,并可以确定属于地区综合病种的病种类型。图5是根据本公开实施例的一种综合病种目录聚类的流程示意图,如图5所示,利用主诊断类目、手术操作类型、手术操作等级进行聚类分析,从而可以确定DIP目录中的多个病种类型。
基于上述可选实施方式,采用诊断特征信息对第二病种进行聚类处理,得到第一聚类组,进而采用诊断特征信息和手术操作特征信息对第二病种进行聚类处理,得到多个第二聚类组,最后基于第一聚类组和多个第二聚类组确定第二病种类型,从而能够快速准确地确定DIP目录中的综合病种,从而能够更加符合地方疾病数据特点和治疗方式。
作为一种可选的实施方式,在步骤S32,基于第三病种的病种分值计算得到第一病种对应的病种分值与第二病种对应的病种分值包括:
步骤S321,获取第一费用、第二费用和第三费用,其中,第一费用为第一病种在预设区域范围内全部医疗机构的每个病例平均费用,第二费用为第二病种在预设区域范围内全部医疗机构的每个病例平均费用,第三费用为第三病种在预设区域范围内全部医疗机构的每个病例平均费用;
步骤S322,利用第一费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第一病种对应的病种分值,以及利用第二费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第二病种对应的病种分值。
上述第一费用为核心病种在预设区域范围内全部医疗机构的每个病例平均费用,第二费用为综合病种在预设区域范围内全部医疗机构的每个病例平均费用,第三费用为预设基准病种在预设区域范围内全部医疗机构的每个病例平均费用。
利用第一费用与第三费用之间的费用比例关系和预设基准病种的病种分值计算得到核心病种对应的病种分值,利用第二费用与第三费用之间的费用比例关系和预设基准病种的病种分值计算得到综合病种对应的病种分值。
基于上述可选实施方式,通过获取第一费用、第二费用和第三费用,进而利用第一费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第一病种对应的病种分值,以及利用第二费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第二病种对应的病种分值,由此能够快速确定目标目录中核心病种和综合病种对应的病种分值,从而能够进一步完善地区的DIP目录。
作为一种可选的实施方式,本公开实施例的数据处理方法还包括:基于目标目录对病历首页数据执行分组操作,确定病历首页数据对应的目标治疗费用。
具体的,基于建设完成的DIP目录可对病历首页数据中的出院诊断以及手术操作列表进行入组,从而确定病历首页数据对应的DIP医疗总费用。
例如,在病历首页数据中,出院诊断为[[“I24.900X001”,“未特指的急性缺血性心脏病”],[“I21.900x001”,“非冠心病性心肌梗死”]],手术操作为[[“88.5500”,“单根导管的冠状动脉造影术”]],主诊断亚目为I24.9,手术操作编码为88.5500,经过组合之后即可入到I24.9_88.5500,组名为未特指的急性缺血性心脏病,行:单根导管的冠状动脉造影术,其对应的DIP分值为485.86。该医院的固定点值为50元/分,该固定点值是基于当年医保支付总额与医保支付比例核定年度住院总费用,并结合DIP分值及其对应病例数量而得到,固定点值的具体计算方式为:固定点值=(当年医保基金可用于DIP付费总额/医保报销比例)/∑(DIP分值*对应病种病例数量)。
为了体现不同类别和等级医疗机构之间医疗水平、医疗资源消耗程度差异,还需要确定医疗机构等级系数,主要是为了合理补偿在现行定价体系下各等级医疗机构之间的成本差异,促进DIP改革的顺利过渡。等级系数的具体计算方式为:等级系数=某等级医疗机构所有DIP病种的例均费用/统筹区域内所有DIP病种的例均费用。当等级系数为1.05时,此次的DIP医疗总费用为485.86(DIP分值)*50(固定点值)*1.05(等级系数)=25507.65。
基于上述可选实施方式,能够基于目标目录对病历首页数据执行分组操作,确定病历首页数据对应的目标治疗费用,从而实现对于地区DIP目录的快速应用,从而提高支付医保基金的操作效率,并且能够公正合理地分配医疗资源。
图6是根据本公开实施例的一种数据处理方法的示意图,如图6所示,该方法包括以下步骤:
步骤S601,获取原始病历数据;
步骤S602,对原始病历数据进行抽取与映射处理,得到病历首页数据;
步骤S603,对病历首页数据的编码格式进行调整,得到调整结果;
步骤S604,采用数据质控方式对调整结果进行清洗,得到预处理结果;
步骤S605,对预处理结果中的手术操作实体词进行语义理解,得到语义特征;
步骤S606,基于语义特征进行手术操作标签预测,得到手术操作特征信息,其中,手术操作特征信息包括:手术类型与手术等级;
步骤S607,对诊断特征信息和手术操作特征信息进行分组处理,得到多个数据集;
步骤S608,对多个数据集进行并行映射处理,得到多个数据集对应的多个病种类别;
步骤S609,对多个病种类别进行聚类处理,得到目标目录。
基于上述步骤S601至步骤S609,通过获取原始病历数据,进而对原始病历数据进行预处理,得到预处理结果,随后对预处理结果进行特征抽取处理,得到用于确定治疗对象的疾病分类的诊断特征信息,以及用于确定手术操作编码和/或手术操作类型属性与等级的手术操作特征信息,最后基于诊断特征信息和手术操作特征信息生成按病种分值付费目录,达到了基于原始病历数据生成高效、准确地对应的病种分值付费目录的目的,实现了提高支付医保基金的操作效率、公正合理地分配医疗资源的效果,从而解决了相关技术中进行医保基金支付时的操作过程繁琐、无法合理分配医疗资源的技术问题。
图7是根据本公开实施例的又一种数据处理方法的示意图,如图7所示,本公开实施例提出的数据处理方法能够通过大数据聚类技术,利用真实电子病历中的诊断和手术操作信息进行特征抽取,并基于抽取特征进行自动化聚类,自适应的生成DIP目录及标准分值,从而在减少人力资源消耗的同时高效生成本地DIP目录。具体的,通过大数据治理输出病案首页数据,进而通过数据预处理,主要包括数据清洗、版本映射和数据质控三个步骤,得到预处理结果;随后基于预处理结果抽取聚类所需数据特征,并在多个数据集中进行特征到病种类别的并行映射,如图7所示在数据集1-数据集n中进行特征到病种类别的并行映射,得到每个数据集的映射结果;在合并多个映射结果后,利用预设阈值对病种例数进行筛选,将病种例数小于或者等于预设阈值的病种类型丢弃,将病种例数大于预设阈值的病种类型保留,从而获得聚类生成的病种目录。
本公开实施例还可以基于所生成的本地DIP目录进行入组,即可得到治疗对象此次住院的病种,根据相应的标准分值得到相应的DIP费用,由此合理有效的提高了医保基金的使用效率。在具体实践中,本公开的数据处理方法能够应用在医保支付监管场景中,可以实现90%以上的入组一致率,由此能够有效确保在医保支付监管场景下的有效性。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本公开各个实施例所述的方法。
在本公开中还提供了一种数据处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图8是根据本公开实施例的一种数据处理装置的结构框图,如图8所示,一种数据处理装置800包括:
获取模块801,用于获取原始病历数据;
第一处理模块802,用于对原始病历数据进行预处理,得到预处理结果;
第二处理模块803,用于对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
生成模块804,用于基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
可选地,第一处理模块802还用于:对原始病历数据进行抽取与映射处理,得到病历首页数据;对病历首页数据进行预处理,得到预处理结果。
可选地,数据处理装置800还包括:存储模块805,用于采用预设数据结构存储病历首页数据,其中,预设数据结构包括:多个信息段,多个信息段至少包括:治疗对象信息段、住院诊疗信息段,治疗对象信息段包括:治疗对象的人身属性内容、住院诊疗信息段包括:疾病诊断内容、手术操作内容、住院时长取值、医疗支付方式取值、离院方式取值。
可选地,第一处理模块802还用于:对病历首页数据的编码格式进行调整,得到调整结果;采用数据质控方式对调整结果进行清洗,得到预处理结果,其中,数据质控方式用于确定调整结果中的核心要素字段是否为空、调整结果是否处于指定的编码库范围以及调整结果是否满足手术与诊断需求。
可选地,第二处理模块803还用于:对预处理结果中的手术操作实体词进行语义理解,得到语义特征;基于语义特征进行手术操作标签预测,得到手术操作特征信息,其中,手术操作特征信息包括:手术类型与手术等级。
可选地,第二处理模块803基于语义特征进行手术操作标签预测,得到手术操作特征信息包括以下方式之一:采用预设标注方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用关键词映射方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用文本相似度映射方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用隐式向量匹配标签传递方式对语义特征进行手术操作标签预测,得到手术操作特征信息;采用门控循环神经网络模型对语义特征进行手术操作标签预测,得到手术操作特征信息。
可选地,生成模块804还用于:对诊断特征信息和手术操作特征信息进行分组处理,得到多个数据集;对多个数据集进行并行映射处理,得到多个数据集对应的多个病种类别;对多个病种类别进行聚类处理,得到目标目录。
可选地,生成模块804还用于:采用诊断特征信息和/或手术操作特征信息对多个病种类别进行聚类处理,得到聚类结果;按照病种例数由高到低的顺序对聚类结果进行排序处理,得到排序结果,其中,排序结果包括:第一比例的第一病种和第二比例的第二病种,第一病种为核心病种,第二病种为综合病种;基于第一病种和第二病种确定目标目录。
可选地,生成模块804还用于:采用预设核心病种目录确定第一病种对应的第一病种类型,以及采用诊断特征信息和/或手术操作特征信息对第二病种进行聚类处理,得到第二病种对应的第二病种类型;基于第三病种的病种分值计算得到第一病种对应的病种分值与第二病种对应的病种分值,其中,第三病种为预设基准病种;通过第一病种类型、第二病种类型、第一病种对应的病种分值以及第二病种对应的病种分值确定目标目录。
可选地,生成模块804还用于:将第一病种与预设核心病种目录进行匹配,得到匹配结果;基于匹配结果确定第一病种类型。
可选地,生成模块804还用于:采用诊断特征信息对第二病种进行聚类处理,得到第一聚类组;采用诊断特征信息和手术操作特征信息对第二病种进行聚类处理,得到多个第二聚类组;基于第一聚类组和多个第二聚类组确定第二病种类型。
可选地,生成模块804还用于:获取第一费用、第二费用和第三费用,其中,第一费用为第一病种在预设区域范围内全部医疗机构的每个病例平均费用,第二费用为第二病种在预设区域范围内全部医疗机构的每个病例平均费用,第三费用为第三病种在预设区域范围内全部医疗机构的每个病例平均费用;利用第一费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第一病种对应的病种分值,以及利用第二费用与第三费用之间的费用比例关系和第三病种的病种分值计算得到第二病种对应的病种分值。
可选地,数据处理装置800还包括:确定模块806,用于基于目标目录对病历首页数据执行分组操作,确定病历首页数据对应的目标治疗费用。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
根据本公开的实施例,本公开还提供了一种电子设备,包括存储器和至少一个处理器,该存储器中存储有计算机指令,该处理器被设置为运行计算机指令以执行上述方法实施例中的步骤。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本公开中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取原始病历数据;
S2,对原始病历数据进行预处理,得到预处理结果;
S3,对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
S4,基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
根据本公开的实施例,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该非瞬时计算机可读存储介质中存储有计算机指令,其中,该计算机指令被设置为运行时执行上述方法实施例中的步骤。
可选地,在本实施例中,上述非瞬时计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取原始病历数据;
S2,对原始病历数据进行预处理,得到预处理结果;
S3,对预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,诊断特征信息用于确定治疗对象的疾病分类,手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
S4,基于诊断特征信息和手术操作特征信息生成目标目录,其中,目标目录为按病种分值付费目录。
可选地,在本实施例中,上述非瞬时计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的实施例,本公开还提供了一种计算机程序产品。用于实施本公开方法实施例的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本公开所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM)、随机存取存储器(RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本公开的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。
Claims (29)
1.一种数据处理方法,包括:
获取原始病历数据;
对所述原始病历数据进行预处理,得到预处理结果;
对所述预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,所述诊断特征信息用于确定治疗对象的疾病分类,所述手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
基于所述诊断特征信息和所述手术操作特征信息生成目标目录,其中,所述目标目录为按病种分值付费目录。
2.根据权利要求1所述的数据处理方法,其中,所述对所述原始病历数据进行预处理,得到预处理结果包括:
对所述原始病历数据进行抽取与映射处理,得到病历首页数据;
对所述病历首页数据进行预处理,得到所述预处理结果。
3.根据权利要求2所述的数据处理方法,其中,所述数据处理方法还包括:
采用预设数据结构存储所述病历首页数据,其中,所述预设数据结构包括:多个信息段,所述多个信息段至少包括:治疗对象信息段、住院诊疗信息段,所述治疗对象信息段包括:所述治疗对象的人身属性内容、所述住院诊疗信息段包括:疾病诊断内容、手术操作内容、住院时长取值、医疗支付方式取值、离院方式取值。
4.根据权利要求2所述的数据处理方法,其中,所述对所述病历首页数据进行预处理,得到所述预处理结果包括:
对所述病历首页数据的编码格式进行调整,得到调整结果;
采用数据质控方式对所述调整结果进行清洗,得到所述预处理结果,其中,所述数据质控方式用于确定所述调整结果中的核心要素字段是否为空、所述调整结果是否处于指定的编码库范围以及所述调整结果是否满足手术与诊断需求。
5.根据权利要求1所述的数据处理方法,其中,所述对所述预处理结果进行特征抽取处理,得到手术操作特征信息包括:
对所述预处理结果中的手术操作实体词进行语义理解,得到语义特征;
基于所述语义特征进行手术操作标签预测,得到所述手术操作特征信息,其中,所述手术操作特征信息包括:手术类型与手术等级。
6.根据权利要求5所述的数据处理方法,其中,所述基于所述语义特征进行手术操作标签预测,得到所述手术操作特征信息包括以下方式之一:
采用预设标注方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用关键词映射方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用文本相似度映射方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用隐式向量匹配标签传递方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用门控循环神经网络模型对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息。
7.根据权利要求1所述的数据处理方法,其中,所述基于所述诊断特征信息和所述手术操作特征信息生成目标目录包括:
对所述诊断特征信息和所述手术操作特征信息进行分组处理,得到多个数据集;
对所述多个数据集进行并行映射处理,得到所述多个数据集对应的多个病种类别;
对所述多个病种类别进行聚类处理,得到所述目标目录。
8.根据权利要求7所述的数据处理方法,其中,所述对所述多个病种类别进行聚类处理,得到所述目标目录包括:
采用所述诊断特征信息和/或所述手术操作特征信息对所述多个病种类别进行聚类处理,得到聚类结果;
按照病种例数由高到低的顺序对所述聚类结果进行排序处理,得到排序结果,其中,所述排序结果包括:第一比例的第一病种和第二比例的第二病种,所述第一病种为核心病种,所述第二病种为综合病种;
基于所述第一病种和所述第二病种确定所述目标目录。
9.根据权利要求8所述的数据处理方法,其中,所述基于所述第一病种和所述第二病种确定所述目标目录包括:
采用预设核心病种目录确定所述第一病种对应的第一病种类型,以及采用所述诊断特征信息和/或所述手术操作特征信息对所述第二病种进行聚类处理,得到所述第二病种对应的第二病种类型;
基于第三病种的病种分值计算得到所述第一病种对应的病种分值与所述第二病种对应的病种分值,其中,所述第三病种为预设基准病种;
通过所述第一病种类型、所述第二病种类型、所述第一病种对应的病种分值以及所述第二病种对应的病种分值确定所述目标目录。
10.根据权利要求9所述的数据处理方法,其中,所述采用预设核心病种目录确定所述第一病种对应的第一病种类型包括:
将所述第一病种与所述预设核心病种目录进行匹配,得到匹配结果;
基于所述匹配结果确定所述第一病种类型。
11.根据权利要求9所述的数据处理方法,其中,所述采用所述诊断特征信息和/或所述手术操作特征信息对所述第二病种进行聚类处理,得到所述第二病种对应的第二病种类型包括:
采用所述诊断特征信息对所述第二病种进行聚类处理,得到第一聚类组;
采用所述诊断特征信息和所述手术操作特征信息对所述第二病种进行聚类处理,得到多个第二聚类组;
基于所述第一聚类组和所述多个第二聚类组确定所述第二病种类型。
12.根据权利要求9所述的数据处理方法,其中,所述基于第三病种的病种分值计算得到所述第一病种对应的病种分值与所述第二病种对应的病种分值包括:
获取第一费用、第二费用和第三费用,其中,所述第一费用为所述第一病种在预设区域范围内全部医疗机构的每个病例平均费用,所述第二费用为所述第二病种在所述预设区域范围内全部医疗机构的每个病例平均费用,所述第三费用为所述第三病种在所述预设区域范围内全部医疗机构的每个病例平均费用;
利用所述第一费用与所述第三费用之间的费用比例关系和所述第三病种的病种分值计算得到所述第一病种对应的病种分值,以及利用所述第二费用与所述第三费用之间的费用比例关系和所述第三病种的病种分值计算得到所述第二病种对应的病种分值。
13.根据权利要求2所述的数据处理方法,其中,所述数据处理方法还包括:
基于所述目标目录对所述病历首页数据执行分组操作,确定所述病历首页数据对应的目标治疗费用。
14.一种数据处理装置,包括:
获取模块,用于获取原始病历数据;
第一处理模块,用于对所述原始病历数据进行预处理,得到预处理结果;
第二处理模块,用于对所述预处理结果进行特征抽取处理,得到诊断特征信息和手术操作特征信息,其中,所述诊断特征信息用于确定治疗对象的疾病分类,所述手术操作特征信息用于确定手术操作编码和/或手术操作类型属性与等级;
生成模块,用于基于所述诊断特征信息和所述手术操作特征信息生成目标目录,其中,所述目标目录为按病种分值付费目录。
15.根据权利要求14所述的数据处理装置,其中,所述第一处理模块还用于:
对所述原始病历数据进行抽取与映射处理,得到病历首页数据;
对所述病历首页数据进行预处理,得到所述预处理结果。
16.根据权利要求15所述的数据处理装置,其中,所述数据处理装置还包括:
存储模块,用于采用预设数据结构存储所述病历首页数据,其中,所述预设数据结构包括:多个信息段,所述多个信息段至少包括:治疗对象信息段、住院诊疗信息段,所述治疗对象信息段包括:所述治疗对象的人身属性内容、所述住院诊疗信息段包括:疾病诊断内容、手术操作内容、住院时长取值、医疗支付方式取值、离院方式取值。
17.根据权利要求15所述的数据处理装置,其中,所述第一处理模块还用于:
对所述病历首页数据的编码格式进行调整,得到调整结果;
采用数据质控方式对所述调整结果进行清洗,得到所述预处理结果,其中,所述数据质控方式用于确定所述调整结果中的核心要素字段是否为空、所述调整结果是否处于指定的编码库范围以及所述调整结果是否满足手术与诊断需求。
18.根据权利要求14所述的数据处理装置,其中,所述第二处理模块还用于:
对所述预处理结果中的手术操作实体词进行语义理解,得到语义特征;
基于所述语义特征进行手术操作标签预测,得到所述手术操作特征信息,其中,所述手术操作特征信息包括:手术类型与手术等级。
19.根据权利要求18所述的数据处理装置,其中,所述第二处理模块基于所述语义特征进行手术操作标签预测,得到所述手术操作特征信息包括以下方式之一:
采用预设标注方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用关键词映射方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用文本相似度映射方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用隐式向量匹配标签传递方式对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息;
采用门控循环神经网络模型对所述语义特征进行手术操作标签预测,得到所述手术操作特征信息。
20.根据权利要求14所述的数据处理装置,其中,所述生成模块还用于:
对所述诊断特征信息和所述手术操作特征信息进行分组处理,得到多个数据集;
对所述多个数据集进行并行映射处理,得到所述多个数据集对应的多个病种类别;
对所述多个病种类别进行聚类处理,得到所述目标目录。
21.根据权利要求20所述的数据处理装置,其中,所述生成模块还用于:
采用所述诊断特征信息和/或所述手术操作特征信息对所述多个病种类别进行聚类处理,得到聚类结果;
按照病种例数由高到低的顺序对所述聚类结果进行排序处理,得到排序结果,其中,所述排序结果包括:第一比例的第一病种和第二比例的第二病种,所述第一病种为核心病种,所述第二病种为综合病种;
基于所述第一病种和所述第二病种确定所述目标目录。
22.根据权利要求21所述的数据处理装置,其中,所述生成模块还用于:
采用预设核心病种目录确定所述第一病种对应的第一病种类型,以及采用所述诊断特征信息和/或所述手术操作特征信息对所述第二病种进行聚类处理,得到所述第二病种对应的第二病种类型;
基于第三病种的病种分值计算得到所述第一病种对应的病种分值与所述第二病种对应的病种分值,其中,所述第三病种为预设基准病种;
通过所述第一病种类型、所述第二病种类型、所述第一病种对应的病种分值以及所述第二病种对应的病种分值确定所述目标目录。
23.根据权利要求22所述的数据处理装置,其中,所述生成模块还用于:
将所述第一病种与所述预设核心病种目录进行匹配,得到匹配结果;
基于所述匹配结果确定所述第一病种类型。
24.根据权利要求22所述的数据处理装置,其中,所述生成模块还用于:
采用所述诊断特征信息对所述第二病种进行聚类处理,得到第一聚类组;
采用所述诊断特征信息和所述手术操作特征信息对所述第二病种进行聚类处理,得到多个第二聚类组;
基于所述第一聚类组和所述多个第二聚类组确定所述第二病种类型。
25.根据权利要求22所述的数据处理装置,其中,所述生成模块还用于:
获取第一费用、第二费用和第三费用,其中,所述第一费用为所述第一病种在预设区域范围内全部医疗机构的每个病例平均费用,所述第二费用为所述第二病种在所述预设区域范围内全部医疗机构的每个病例平均费用,所述第三费用为所述第三病种在所述预设区域范围内全部医疗机构的每个病例平均费用;
利用所述第一费用与所述第三费用之间的费用比例关系和所述第三病种的病种分值计算得到所述第一病种对应的病种分值,以及利用所述第二费用与所述第三费用之间的费用比例关系和所述第三病种的病种分值计算得到所述第二病种对应的病种分值。
26.根据权利要求15所述的数据处理装置,其中,所述数据处理装置还包括:
确定模块,用于基于所述目标目录对所述病历首页数据执行分组操作,确定所述病历首页数据对应的目标治疗费用。
27.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-13中任一项所述的数据处理方法。
28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-13中任一项所述的数据处理方法。
29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-13中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310263883.4A CN116452347A (zh) | 2023-03-17 | 2023-03-17 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310263883.4A CN116452347A (zh) | 2023-03-17 | 2023-03-17 | 数据处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116452347A true CN116452347A (zh) | 2023-07-18 |
Family
ID=87128002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310263883.4A Pending CN116452347A (zh) | 2023-03-17 | 2023-03-17 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116452347A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894685A (zh) * | 2023-09-11 | 2023-10-17 | 之江实验室 | 一种面向医疗行为片段的费用自动测算方法与系统 |
CN117149780A (zh) * | 2023-10-31 | 2023-12-01 | 北京创智和宇科技有限公司 | 一种构建dip本地病种目录库的方法及装置 |
CN117219288A (zh) * | 2023-10-27 | 2023-12-12 | 上海金仕达卫宁软件科技有限公司 | 基于医保病例的治疗方式的病例分类方法及系统 |
CN117271903A (zh) * | 2023-11-17 | 2023-12-22 | 神州医疗科技股份有限公司 | 基于医院临床大数据的事件搜索方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112786215A (zh) * | 2021-01-25 | 2021-05-11 | 山东众阳健康科技集团有限公司 | 基于大数据聚类生成dip综合病种目录的方法及系统 |
-
2023
- 2023-03-17 CN CN202310263883.4A patent/CN116452347A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112786215A (zh) * | 2021-01-25 | 2021-05-11 | 山东众阳健康科技集团有限公司 | 基于大数据聚类生成dip综合病种目录的方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894685A (zh) * | 2023-09-11 | 2023-10-17 | 之江实验室 | 一种面向医疗行为片段的费用自动测算方法与系统 |
CN116894685B (zh) * | 2023-09-11 | 2024-02-23 | 之江实验室 | 一种面向医疗行为片段的费用自动测算方法与系统 |
CN117219288A (zh) * | 2023-10-27 | 2023-12-12 | 上海金仕达卫宁软件科技有限公司 | 基于医保病例的治疗方式的病例分类方法及系统 |
CN117149780A (zh) * | 2023-10-31 | 2023-12-01 | 北京创智和宇科技有限公司 | 一种构建dip本地病种目录库的方法及装置 |
CN117149780B (zh) * | 2023-10-31 | 2024-01-05 | 北京创智和宇科技有限公司 | 一种构建dip本地病种目录库的方法及装置 |
CN117271903A (zh) * | 2023-11-17 | 2023-12-22 | 神州医疗科技股份有限公司 | 基于医院临床大数据的事件搜索方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116452347A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN104951894B (zh) | 医院疾病管理智能分析和评估系统 | |
Sandmann et al. | Estimating the opportunity costs of bed‐days | |
CN109065105B (zh) | 一种医院用患者疾病治疗分值统计方法 | |
CN111584021A (zh) | 病案信息校验方法、装置、电子设备及存储介质 | |
Hunter-Zinck et al. | Predicting emergency department orders with multilabel machine learning techniques and simulating effects on length of stay | |
Yoon et al. | Decision-making support systems using case-based reasoning for construction project delivery method selection: Focused on the road construction projects in Korea | |
CN114048379A (zh) | 服务推荐方法及装置、存储介质和电子设备 | |
Xu et al. | A medical procedure-based patient grouping method for an emergency department | |
CN114141377A (zh) | 一种建立诊断规则库的方法、诊断信息审核的方法及设备 | |
Gambarte et al. | A practical approach to advanced terminology services in health information systems | |
CN112926879B (zh) | 疾病诊断相关分组的支付方案决策方法、装置及设备 | |
CN114240494A (zh) | 医疗项目成本核算方法、系统、电子设备及存储介质 | |
CN112397171A (zh) | 基于drg实现针对诊疗项目和材料的关键路径监测方法、装置、处理器及其存储介质 | |
CN101853432A (zh) | 医疗绩效控制系统和方法 | |
CN116150690A (zh) | DRGs决策树构建方法及装置、电子设备、存储介质 | |
Prakash et al. | Random forest regression with hyper parameter tuning for medical insurance premium prediction | |
Magee | The hospital data project: comparing hospital activity within Europe | |
CN113821641A (zh) | 基于权重分配的药品分类的方法、装置、设备及存储介质 | |
McGuire | An evaluation of diagnosis-related group severity and complexity refinement | |
Jones | Methods for the analysis of CCRC data | |
CN114141340A (zh) | 一种在医疗过程中进行合理控费的方法、装置及设备 | |
US8548841B1 (en) | Supply expense analysis | |
LU503510B1 (en) | Medical expenses management system based on drg | |
CN114927232B (zh) | 药品研发类型挖掘和检索方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |