CN116150690A - DRGs决策树构建方法及装置、电子设备、存储介质 - Google Patents

DRGs决策树构建方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN116150690A
CN116150690A CN202310258618.7A CN202310258618A CN116150690A CN 116150690 A CN116150690 A CN 116150690A CN 202310258618 A CN202310258618 A CN 202310258618A CN 116150690 A CN116150690 A CN 116150690A
Authority
CN
China
Prior art keywords
diagnosis
case data
decision tree
node
current node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310258618.7A
Other languages
English (en)
Inventor
李同
巴堃
庄伯金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202310258618.7A priority Critical patent/CN116150690A/zh
Publication of CN116150690A publication Critical patent/CN116150690A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的实施例公开了一种DRGs决策树构建方法及装置、电子设备、存储介质,该方法包括:获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。本申请实施例的技术方案能够提高分类的准确性。

Description

DRGs决策树构建方法及装置、电子设备、存储介质
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种DRGs决策树构建方法及装置、电子设备、计算机可读存储介质。
背景技术
疾病诊断相关分组(Diagnosis Related Groups,DRGs)是一种专门用于医疗保险预付款制度的患者分类编码标准。其通过对不同的病例临床过程中疾病的严重程度、种类和治疗手段等进行测算,并按照相近的原则,将不同的病例分门别类,最终计算出定额的医保预付款。利用DRGs可以进行不同服务提供者之间同质病例服务绩效的比较,大大提高了评估结果的可靠性,可以进一步减缓医疗费用逐步增加的趋势,促进成本管理,增加患者满意度,有效提升医疗服务水平,基本上能够同时兼顾医保、医院、患者等各方面的利益。
我国在引进疾病诊断相关分组时对其进行了适当改良,但疾病诊断相关分组仍然以西医的诊疗方式为基础,目前在我国本土化过程中,尤其是在中医药临床方面,DGRs与中医医疗保险支付紧密结合的实质性工作的开展还基本属于空白状态。目前我国的DRGs仍处于探索阶段,所使用的DRGs模型主要是通过引进国外的DRGs模型或在此基础上进行改进,但最终的分类结果准确性较低。
发明内容
为解决上述技术问题,本申请的实施例提供了一种DRGs决策树构建方法及装置、电子设备、计算机可读存储介质,旨在解决现有的DRGs模型的准确性较低的技术问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种DRGs决策树构建方法,包括:
获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;
根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;
通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
进一步地,所述根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点,包括:
获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据;
根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点;
若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
进一步地,在所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点之后,包括:
若所述当前节点不是叶子节点,则根据所述当前节点所对应的病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法对所述当前节点所对应的病例数据进行二分类,得到所述当前节点的子节点;
将所述当前节点的子节点作为下一轮二分类的当前节点,跳转至获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据。
进一步地,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点,包括:
检测各个所述病例数据的体征特征和诊疗特征是否匹配;
若各个所述病例数据的特征数据和诊疗数据均匹配,则确定所述当前节点为叶子节点。
进一步地,所述根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点,包括:
获取当前节点对应的病例数据,根据各个病例数据的所述体征特征和所述诊疗特征随机初始化当前节点对应的病例数据的速度和位置;
通过最邻近法则对当前节点对应的病例数据进行划分,计算每个病例数据的适应值,更新个体极值;
通过粒子群算法的位置公式和速度公式更新当前节点对应的病例数据的位置及速度;
若聚类中心不变时,确定最优病例数据的位置,根据最优病例数据的位置进行二分类,构建决策树结构的当前节点的子节点。
进一步地,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,所述对所述体征特征和所述诊疗特征进行预处理,包括:
获取预设变量赋值表,根据所述预设变量赋值表对各个病例数据的所述体征特征和所述诊疗特征进行赋值。
根据本申请实施例的一个方面,提供了一种DRGs决策树构建装置,包括:
获取模块,配置为获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;
分类模块,配置为根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;
训练模块,配置为通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
进一步地,所述分类模块,包括:
第一获取子模块,配置为获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据;
第一确定子模块,配置为根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点;
第二确定子模块,配置为若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如前所述的DRGs决策树构建方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的DRGs决策树构建方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的DRGs决策树构建方法。
在本申请的实施例所提供的技术方案中,通过多个病例数据的体征特征和诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;再通过支持向量机对决策树结构的各个节点进行训练,得到各个节点的分类策略,根据分类策略和所述决策树结构,得到DRGs决策树,本申请基于自变异粒子群聚类算法进行二分类,可以获得更高的分类精度和更短的分类时间,同时,对分类算法的优化使得分类规则更清晰,更准确,从而更便于判断规则的形成,使得DRGs决策树的准确性较高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请涉及的一种实施环境的示意图;
图2是本申请涉及的一种DRGs决策树构建方法的流程图;
图3是本申请涉及的一个实施例中步骤S220的流程图;
图4是本申请涉及的一个实施例中步骤S220的流程图;
图5是本申请涉及的一个实施例中步骤S320的流程图;
图6是本申请涉及的一个实施例中步骤S220的流程图;
图7是本申请涉及的一种DRGs决策树构建装置的框图;
图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
疾病诊断相关分组(Diagnosis Related Groups,DRGs)是一种专门用于医疗保险预付款制度的患者分类编码标准。其通过对不同的病例临床过程中疾病的严重程度、种类和治疗手段等进行测算,并按照相近的原则,将不同的病例分门别类,最终计算出定额的医保预付款。利用DRGs可以进行不同服务提供者之间同质病例服务绩效的比较,大大提高了评估结果的可靠性,可以进一步减缓医疗费用逐步增加的趋势,促进成本管理,增加患者满意度,有效提升医疗服务水平,基本上能够同时兼顾医保、医院、患者等各方面的利益。
疾病诊断相关分组在国外研发逐渐成熟并取得显著效果后,近年来,世界各国纷纷对疾病诊断相关分组进行深入研究。我国也逐渐引进疾病诊断相关分组,虽然我国也对引进的疾病诊断相关分组进行了适当改良,但疾病诊断相关分组仍然以西医的诊疗方式为基础,目前在我国本土化过程中,尤其是在中医药临床方面,疾病诊断相关分组与中医医疗保险支付紧密结合的实质性工作的开展还基本属于空白状态。
一般来说,接受中医治疗所花费的住院时间更长,药品费用更高,但是平均每天出院者住院费用更低。因此,与西医相比,中医治疗医疗成本更低廉,在疾病诊断相关分组定额付费同等条件下,中医治疗显著产生更多剩余收益,因此从收入的角度而言,疾病诊断相关分组更有利于中医的发展。
目前我国的疾病诊断相关分组仍处于探索阶段,所使用的疾病诊断相关分组模型主要是通过引进国外的疾病诊断相关分组模型或在此基础上进行改进。本申请实施例所提供的DRGs决策树构建方法利用决策树算法建立DRGs决策树,通过组合多个二分类器来实现支持向量机(Support Vector Machine,SVM)多分类器的构造。首先将所有类别分为2个节点,每个节点在下一层次继续划分为2个子节点,如此循环,直至生成叶子节点,即只包含一个单独类别的节点,最终形成DRGs决策树,每个节点使用支持向量机进行分类。
同时,DRGs决策树的分类节点的结构对分类性能,即医保预付款定额的影响很大,现有的DRGs决策树在确定每一个分类节点时使用的主要有两种分类方法,一种是是基于病例疾病种类和医疗诊断结果进行分类,另一种是通过K均值算法(K-means)或邻近算法(k-Nearest Neighbor,KNN)等统计或机器学习的方法聚类,寻找相近的类别。第一种方法主要依赖医学指标,对数据的利用不够充分,而第二种聚类方法中K均值对异常数据很敏感,聚类过程易受异常数据的影响,邻近算法精度高,但计算量大。因此,本申请实施例提供了一种DRGs决策树构建方法用于解决上述问题。
请参阅图1,图1是本申请涉及的一种实施环境的示意图。该实施环境包括终端110和服务器120,终端110和服务器120之间通过有线或者无线网络进行通信。
终端100中运行有生成病例数据的客户端,生成的病例数据传输搭到服务器120进行存储。其中,终端110可以是笔记本电脑、计算机等任意能够运行生成病例数据的客户端的电子设备,服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处不对此进行限制。
图2是根据一示例性实施例示出的一种DRGs决策树构建方法的流程图。该方法可以应用于图1所示的实施环境,并由图1所示实施例环境中的信息抽取服务器20具体执行。
如图2所示,在一示例性实施例中,该DRGs决策树构建方法可以包括步骤S210至步骤S230,详细介绍如下:
步骤S210,获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理。
本申请实施例中,获取多个病例数据,多个病例数据可从多个不同的医院获取的关于中医治疗的相关的病例数据。提取病例数据中的特征数据和诊疗特征,体征特征表征对应的个体特征,如对应的年龄、疾病以及并发症、伴随症等。诊疗特征则表征治疗所采用的中医特征诊疗项目,如推拿疗法、拔罐、针灸等。对提取出的体征特征和诊疗特征进行预处理,便于后续进行处理。
步骤S220,根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点。
本申请实施例中,根据预处理后的各个病例数据的体征特征和诊疗特征构建决策树结构,具体的,将所述病例数据作为决策树结构的根节点,在根节点通过自变异粒子群聚类算法进行二分类,得到根节点的两个子节点,每个子节点都对应分到若干个病例数据,再对每个子节点通过同样的方式进行二分类,直到构建决策树结构的各个节点。
步骤S230,通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
本申请实施例中,通过支持向量机对每一个节点所对应的病例数据进行训练,得到每个节点的分类策略,即每个节点的属性选择度量,进而得到构建完成的DRGs决策树。
本申请实施例中,在中医临床方面,目前中医领域都是医生结合病例和经验进行诊断,其中涉及的诊断和医保支付规则较为模糊,而本专申请实施例所建立的中医DRGs决策树可以为其提供一个明晰的诊断和支付规则,便于此后可以快速对新病例做出初步判断。
本申请实例提供的DRGs决策树基于自变异粒子群聚类算法改进的中医DRGs决策树SVM,可以获得更高的分类精度和更短的分类时间,同时,对分类算法的优化使得分类规则更清晰,更准确,从而更便于判断规则的形成。
DRGs作为一种较为先进的支付方式,能够更为有效的凸显中医服务的优势,从而提升医院多方提供中医服务的源动力,以此改变中医供给不足的现状,引导医生及患者合理使用中医服务。
在本申请的一示例性实施例中,请参阅图3,在步骤S220中所述根据预处理后的各个病例数据的所述体征特征和诊疗特征,通过自变异PSO聚类算法进行二分类,构建决策树结构的各个节点,包括步骤S310至步骤S330,详细介绍如下:
步骤S310,获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据。
本申请实施例中,通过自变异粒子群聚类算法进行二分类后,每个节点课对应得到两个子节点,如对根节点进而二分类后,得到两个子节点,将两个子节点作为当前节点,每个当前节点对应有若干病例数据。
步骤S320,根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点。
本申请实施例中,根据每个当前节点所对应的体征特征和诊疗特征确定当前节点是否为叶子节点,叶子节点即为决策树结构最末端的节点,该节点所对应的病例数据无法再进行二分类。
步骤S330,若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
本申请实施例中,当当前节点是叶子节点时,则构建完成整改决策树结构。
在本申请的一示例性实施例中,请参阅图4,在步骤S320所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点之后,包括步骤S410和步骤S420,详细介绍如下:
步骤S410,若所述当前节点不是叶子节点,则根据所述当前节点所对应的病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法对所述当前节点所对应的病例数据进行二分类,得到所述当前节点的子节点。
本申请实施例中,若当前节点不是叶子节点,则再次通过变异粒子群聚类算法对当前节点所对应的病例数据进行二分类,得到当前节点的对应的两个子节点。
步骤S420,将所述当前节点的子节点作为下一轮二分类的当前节点,跳转至获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据。
本申请实施例中,将当前节点对应的子节点作为下一轮二分类的当前节点,跳转至获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据的步骤,重新进行二分类。
在本申请的一示例性实施例中,请参阅图5,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,在步骤S320所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点,包括步骤S510和步骤S520,详细介绍如下:
步骤S510,检测各个所述病例数据的体征特征和诊疗特征是否匹配。
本申请实施例中,每个节点都对应有若干病例数据,检测当前节点所对应的病例数据的体征特征和诊疗特征是否匹配。
步骤S520,若各个所述病例数据的特征数据和诊疗数据均匹配,则确定所述当前节点为叶子节点。
本申请实施例中,若当前节点的所有病例数据的体征特征和诊疗特征对应的均匹配,则可确定当前节点所对应的病例数据在不同的特征上均相同,无法再进一步进行二分类,则可确定当前节点为叶子节点。若当前节点的所有病例数据的体征特征和诊疗特征对应的不匹配,则还可对当前节点进而二分类。
在另一实施例中,计算病例数据的体征特征和诊疗特征的个数,同时计算位于当前节点之前进行二分类的轮数,检测病例数据的体征特征和诊疗特征的个数与位于当前节点之前进行二分类的轮数是否匹配,若匹配,确定当前节点为叶子节点。
在本申请的一示例性实施例中,请参阅图6,在步骤S220中所述根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点,包括步骤S610至步骤S640,详细介绍如下:
步骤S610,获取当前节点对应的病例数据,根据各个病例数据的所述体征特征和所述诊疗特征随机初始化当前节点对应的病例数据的速度和位置;
步骤S620,通过最邻近法则对当前节点对应的病例数据进行划分,计算每个病例数据的适应值,更新个体极值;
步骤S630,通过粒子群算法的位置公式和速度公式更新当前节点对应的病例数据的位置及速度;
步骤S640,若聚类中心不变时,确定最优病例数据的位置,根据最优病例数据的位置进行二分类,构建决策树结构的当前节点的子节点。
本申请实施例中,对于不是叶子节点的所有节点均通过自变异粒子群聚类算法进行二分类,在进行二分类时,通过依次选择一个病例数据作为簇中心,直至选择到最优的病例数据作为簇中心。
粒子群聚类算法是一种有效的基于群体智能理论的全局寻优算法,把优化问题的解抽象成粒子,如果把粒子想象成一只鸟,从一组解出发寻求最优解的过程就类似于鸟群寻找食物的过程。利用粒子群聚类算法对病例数据进行聚类的思想是将聚类视为一种优化问题,在全局范围内利用粒子群聚类算法得到一个针对病例数据的近似最优划分。
粒子群聚类算法需要预先设定簇的个数,本申请实施例中,簇的个数为2,粒子表示病例数据,在一个N维空间,每一个粒子i都有一个位置向量Xi和速度向量Vi。Vi用来修正粒子的位置,粒子通过记忆两个量来改变位置,一个是粒子在寻找最优解过程中所经过的最好位置p,另一个是粒子群中最好的那个粒子的位置g。而位置向量的构造如下:
Xi=(Ci1,Ci2,…,Cij)
式中,Cij表示第i个粒子所代表的第j个类的聚类中心,则每个粒子代表一种对数据集的划分,整个粒子群代表了对数据集的多种划分方案。
在搜索到两个最优位置后,粒子通过跟踪个体最优位置和全局最优位置来不断更新自己的速度和位置,算法的数学公式为:
Figure BDA0004131742020000111
上述公式中,w=(-e)/,l为最大迭代次数,e为当前迭代次数;t表示第t次迭代;Pi(t)为第t次迭代后第i个粒子所记忆的p;G(t)为第t次迭代后整个群体记忆的g;C1和C2为学习因子,本申请实施例中均取固定值1.5;rand()为独立的[0,1]之间的随机数。
粒子群聚类算法的粒子适应值函数为f,适应值的大小反应粒子与最优解的近似程度,对于本申请实施例中的聚类算法,适应值越小,对应的解越好。
Figure BDA0004131742020000112
Figure BDA0004131742020000113
式中,je为类内离散度之和,Nc为簇的个数,数据Pm属于聚类中心Cij代表的类。可以看出,适应值越高的粒子的类内离散度之和越小,即类内的相似度越高。
在本申请的一示例性实施例中,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,所述对所述体征特征和所述诊疗特征进行预处理,详细介绍如下:
获取预设变量赋值表,根据所述预设变量赋值表对各个病例数据的所述体征特征和所述诊疗特征进行赋值。
本申请实施例中,预先设置有预设变量赋值表,用于为遍历数据的各个特征进行赋值,预设变量赋值表中的变量对应病例数据中的体征特征和诊疗特征,如预设变量赋值表的变量包括年龄、性别、并发症、伴随症、住院天数、付费方式、推拿疗法、针刺、灸法、拔罐、中医外治、中医骨伤、中医肛肠、中医特殊疗法、中医综合,在赋值时,对于年龄和住院天数两个变量以对应的连续型变量进行赋值,性别变量则对男性赋值为1,女性赋值为2,其余各个变量则是存在时赋值为1,反之则赋值为2,如采用了针刺和拔罐进行治疗,则对应为针刺和拔罐赋值为1。对于遍历数据中无法匹配到的特征,则通过人工进行赋值或者人工对其进行筛除。
在本申请的一个示例性实施例中,请参阅7,图7是根据一示例性实施例示出的一种DRGs决策树构建装置,包括:
获取模块710,配置为获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;
分类模块720,配置为根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;
训练模块730,配置为通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
在本申请的一示例性实施例中,所述分类模块720,包括:
第一获取子模块,配置为获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据;
第一确定子模块,配置为根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点;
第二确定子模块,配置为若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
在本申请的一示例性实施例中,所述分类模块720,还包括:
分类子模块,配置为若所述当前节点不是叶子节点,则根据所述当前节点所对应的病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法对所述当前节点所对应的病例数据进行二分类,得到所述当前节点的子节点;
跳转子模块,配置为将所述当前节点的子节点作为下一轮二分类的当前节点,跳转至获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据。
在本申请的一示例性实施例中,所述体征特征包括并发症特征、伴随症特征,所述第一确定子模块,包括:
检测单元,配置为检测各个所述病例数据的体征特征和诊疗特征是否匹配;
确定单元,配置为若各个所述病例数据的特征数据和诊疗数据均匹配,则确定所述当前节点为叶子节点。
在本申请的一示例性实施例中,分类模块720,包括:
第二获取子模块,配置为获取当前节点对应的病例数据,根据各个病例数据的所述体征特征和所述诊疗特征随机初始化当前节点对应的病例数据的速度和位置;
计算子模块,配置为通过最邻近法则对当前节点对应的病例数据进行划分,计算每个病例数据的适应值,更新个体极值。
更新子模块,配置为通过粒子群算法的位置公式和速度公式更新当前节点对应的病例数据的位置及速度。
第三确定子模块,配置为若聚类中心不变时,确定最优病例数据的位置,根据最优病例数据的位置进行二分类,构建决策树结构的当前节点的子节点。
在本申请的一示例性实施例中,获取模块710,包括:
赋值子模块,配置为获取预设变量赋值表,根据所述预设变量赋值表对各个病例数据的所述体征特征和所述诊疗特征进行赋值。
需要说明的是,上述实施例所提供的DRGs决策树构建装置与上述实施例所提供的DRGs决策树构建方法属于同一构思,其中各个模块、子模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
本申请的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现上述各个实施例中提供的DRGs决策树构建方法。
图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图8示出的电子设备的计算机系统800仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(Central Processing Unit,CPU)801,其可以根据存储在只读存储器(Read-Only Memory,ROM)802中的程序或者从储存部分808加载到随机访问存储器(Random Access Memory,RAM)803中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 803中,还存储有系统操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output,I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分807;包括硬盘等的储存部分808;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入储存部分808。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的方法。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。

Claims (10)

1.一种DRGs决策树构建方法,其特征在于,包括:
获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;
根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;
通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
2.根据权利要求1所述的DRGs决策树构建方法,其特征在于,所述根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点,包括:
获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据;
根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点;
若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
3.根据权利要求2所述的DRGs决策树构建方法,其特征在于,在所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点之后,包括:
若所述当前节点不是叶子节点,则根据所述当前节点所对应的病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法对所述当前节点所对应的病例数据进行二分类,得到所述当前节点的子节点;
将所述当前节点的子节点作为下一轮二分类的当前节点,跳转至获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据。
4.根据权利要求2所述的DRGs决策树构建方法,其特征在于,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,所述根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点,包括:
检测各个所述病例数据的体征特征和诊疗特征是否匹配;
若各个所述病例数据的特征数据和诊疗数据均匹配,则确定所述当前节点为叶子节点。
5.根据权利要求1所述的DRGs决策树构建方法,其特征在于,所述根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点,包括:
获取当前节点对应的病例数据,根据各个病例数据的所述体征特征和所述诊疗特征随机初始化当前节点对应的病例数据的速度和位置;
通过最邻近法则对当前节点对应的病例数据进行划分,计算每个病例数据的适应值,更新个体极值;
通过粒子群算法的位置公式和速度公式更新当前节点对应的病例数据的位置及速度;
若聚类中心不变时,确定最优病例数据的位置,根据最优病例数据的位置进行二分类,构建决策树结构的当前节点的子节点。
6.根据权利要求1所述的DRGs决策树构建方法,其特征在于,所述体征特征包括并发症特征、伴随症特征,所述诊疗特征包括多个中医诊疗特征,所述对所述体征特征和所述诊疗特征进行预处理,包括:
获取预设变量赋值表,根据所述预设变量赋值表对各个病例数据的所述体征特征和所述诊疗特征进行赋值。
7.一种DRGs决策树构建装置,其特征在于,包括:
获取模块,配置为获取多个病例数据,提取所述病例数据中的体征特征和诊疗特征,并对所述体征特征和所述诊疗特征进行预处理;
分类模块,配置为根据预处理后的各个病例数据的所述体征特征和所述诊疗特征,通过自变异粒子群聚类算法进行二分类,构建决策树结构的各个节点;
训练模块,配置为通过支持向量机对所述决策树结构的各个节点进行训练,得到各个节点的分类策略,根据所述分类策略和所述决策树结构,得到DRGs决策树。
8.根据权利要求7所述的DRGs决策树构建装置,其特征在于,所述分类模块,包括:
第一获取子模块,配置为获取通过自变异粒子群聚类算法进行二分类后的当前节点所对应的病例数据的特征数据和诊疗数据;
第一确定子模块,配置为根据当前节点所对应的病例数据的体征特征和诊疗特征确定所述当前节点是否为叶子节点;
第二确定子模块,配置为若所述当前节点为叶子节点,则确定所述决策树结构构建完成。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1至6中任一项所述的DRGs决策树构建方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1至6中任一项所述的DRGs决策树构建方法。
CN202310258618.7A 2023-03-06 2023-03-06 DRGs决策树构建方法及装置、电子设备、存储介质 Pending CN116150690A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310258618.7A CN116150690A (zh) 2023-03-06 2023-03-06 DRGs决策树构建方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310258618.7A CN116150690A (zh) 2023-03-06 2023-03-06 DRGs决策树构建方法及装置、电子设备、存储介质

Publications (1)

Publication Number Publication Date
CN116150690A true CN116150690A (zh) 2023-05-23

Family

ID=86350694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310258618.7A Pending CN116150690A (zh) 2023-03-06 2023-03-06 DRGs决策树构建方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN116150690A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116779150A (zh) * 2023-07-03 2023-09-19 浙江一山智慧医疗研究有限公司 基于多智能体互动的个性化医疗决策方法、装置及应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116779150A (zh) * 2023-07-03 2023-09-19 浙江一山智慧医疗研究有限公司 基于多智能体互动的个性化医疗决策方法、装置及应用
CN116779150B (zh) * 2023-07-03 2023-12-22 浙江一山智慧医疗研究有限公司 基于多智能体互动的个性化医疗决策方法、装置及应用

Similar Documents

Publication Publication Date Title
WO2023029506A1 (zh) 病情分析方法、装置、电子设备及存储介质
CN113378970B (zh) 语句相似性检测方法、装置、电子设备及存储介质
CN113611405A (zh) 一种体检项目推荐方法、装置、设备及介质
CN115858886B (zh) 数据处理方法、装置、设备及可读存储介质
CN113724815A (zh) 基于决策分群模型的信息推送方法及装置
WO2023155441A1 (zh) 医疗资源推荐方法、装置、设备及存储介质
CN113674858A (zh) 在线医疗处方用药智能检查方法、装置、设备及存储介质
CN108304381B (zh) 基于人工智能的实体建边方法、装置、设备及存储介质
WO2023178978A1 (zh) 基于人工智能的处方审核方法、装置、设备及介质
CN116150690A (zh) DRGs决策树构建方法及装置、电子设备、存储介质
CN113706322A (zh) 基于数据分析的服务分发方法、装置、设备及存储介质
CN116578704A (zh) 文本情感分类方法、装置、设备及计算机可读介质
US10832822B1 (en) Methods and systems for locating therapeutic remedies
WO2022227171A1 (zh) 关键信息提取方法、装置、电子设备及介质
CN114706985A (zh) 文本分类方法、装置、电子设备及存储介质
CN111640517B (zh) 病历编码方法、装置、存储介质及电子设备
WO2022247007A1 (zh) 医学图像分级方法、装置、电子设备及可读存储介质
CN116522944A (zh) 基于多头注意力的图片生成方法、装置、设备及介质
CN111930908A (zh) 基于人工智能的答案识别方法及装置、介质、电子设备
CN116860935A (zh) 基于提示词问答交互的内容管理方法、装置、设备及介质
CN116844711A (zh) 基于深度学习的疾病辅助识别方法及装置
CN110909824A (zh) 试验数据的核查方法及装置、存储介质及电子设备
CN115631823A (zh) 相似病例推荐方法及系统
CN114596958A (zh) 基于级联分类的病理数据分类方法、装置、设备及介质
CN114373541A (zh) 基于分布式的智能中医诊断方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination