CN111739604A - 一种慢病人群实际就诊处方挖掘及实现方法 - Google Patents

一种慢病人群实际就诊处方挖掘及实现方法 Download PDF

Info

Publication number
CN111739604A
CN111739604A CN202010470690.2A CN202010470690A CN111739604A CN 111739604 A CN111739604 A CN 111739604A CN 202010470690 A CN202010470690 A CN 202010470690A CN 111739604 A CN111739604 A CN 111739604A
Authority
CN
China
Prior art keywords
patient
prescription
project
visit
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010470690.2A
Other languages
English (en)
Inventor
陈明东
黄越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipai Health Industry Investment Co ltd
Original Assignee
Sipai Health Industry Investment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sipai Health Industry Investment Co ltd filed Critical Sipai Health Industry Investment Co ltd
Priority to CN202010470690.2A priority Critical patent/CN111739604A/zh
Publication of CN111739604A publication Critical patent/CN111739604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种慢病人群实际就诊处方挖掘及实现方法,包括,选定某种慢性疾病,通过分析该慢性疾病的就诊规律,筛选出规律性高的患者群;对筛选出的规律性高的患者群中每位患者的实际使用项目进行项目关联性分析,得到每位患者的项目集;将所有的项目集应用到筛选出的规律性高的患者群的实际使用中,并在设定时间内统计每个项目集的使用人数,获取使用人数最多的项目集对应的人群,即为项目集代表性高的人群;统计项目性代表性高的人群中每位患者每个项目的日均花费,并形成矩阵,并将该矩阵输入聚类算法,初步得到候选处方集。优点是:能够挖掘出慢病人群的目标就诊处方集,对慢性病的实际就诊情况进行细颗粒度宏观描述。

Description

一种慢病人群实际就诊处方挖掘及实现方法
技术领域
本发明涉及就诊处方挖掘领域,尤其涉及一种慢病人群实际就诊处方挖掘及实现方法。
背景技术
慢性病人群的医疗支出在我国每年的医疗支出占比中逐年增加,已经成为医疗支出中的最主要的组成部分之一。为了降低慢性病患者的生活负担,我国多年前已经开始推广实行慢性病门诊就诊报销政策。在为广大慢性病患者提高生活水平的同时,慢性病基金支出中也掺杂了许多“水分”,基金使用中的浪费、套刷、造假行为屡见不鲜。针对基金的管理,国家也重拳出击,通过FWA(Fraud,Waste and Abuse)系统配合医保机构严审基金费用问题。
然而,目前的所有监管方案基本都比较零散,针对单次就诊的占比较高,这部分监管规则由药品说明书提取得到;剩余部分的监管方案则主要是基于个人就诊行为组成,比如就诊花费过高。因此,当前的监管方案中宏观的方案颗粒度都较粗,而颗粒度细的方案都指针对零散的单次就诊,缺乏宏观的细颗粒度方案。现有的方案针对普通门诊和住院的效果相对较好,因为普通门诊和住院具有人均就诊次数低,持续性低的特点;然而门诊慢性病的特点截然不同,门诊慢性病需要长期就诊,且一年中人均有十几次就诊,所以目前的监管方案难以很好的识别慢性病的就诊特点。
发明内容
本发明的目的在于提供一种慢病人群实际就诊处方挖掘及实现方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种慢病人群实际就诊处方挖掘及实现方法,所述方法包括如下步骤,
S1、选定某种慢性疾病,通过分析该慢性疾病的就诊规律,筛选出规律性高的患者群;
S2、对筛选出的规律性高的患者群中每位患者的实际使用项目进行项目关联性分析,得到每位患者的项目集;
S3、将所有的项目集应用到步骤S1中筛选出的规律性高的患者群的实际使用中,并在设定时间内统计每个项目集的使用人数,获取使用人数最多的项目集对应的人群,即为项目集代表性高的人群;
S4、统计项目性代表性高的人群中每位患者每个项目的日均花费,并形成矩阵,并将该矩阵输入聚类算法,初步得到候选处方集;
S5、将候选处方集进行筛选剔除,获取目标处方集。
优选的,因慢性疾病的治疗在较长一段时间内为按固定用量使用治疗项目,故慢性疾病的就诊规律性能够用CV值进行表征;步骤S1具体包括如下内容
S11、取一段时间中某患者的每次就诊时间和花费,并将获取的患者就诊时间和花费按时间排序即可得到有序的花费序列(c1,c2,c3,…,cn)和时间序列(t1,t2,t3,…,tn);
S12、将时间序列求差以获取就诊间隔序列(s1,s2,s3,…,sn-1),其中si=ti+1-ti,0<i≤n-1;
S13、使用花费序列除以就诊间隔序列以获取日均花费序列(r1,r2,r3,…,rn-1),其中ri=c1/s1,0<i≤n-1;
S14、计算日均花费序列的样本均值E和样本方差Var,并根据样本均值E和样本方差Var,获取日均花费样本的CV值,CV=sqrt(Var)/E;当获取的日均花费样本的CV值小于0,则表示该患者就诊花费序列规律性高;
S15、重复步骤S11至S14,筛选出所有规律性高的患者,组成规律性高的患者群。
优选的,步骤S2具体为,将每位患者每次就诊时使用的所有项目看作一个就诊集,在每位患者不同的就诊集中查找出现的每个项目子集及其对应的出现次数,并将出现次数最多的项目子集综合在一起形成每位患者对应的项目集。
优选的,步骤S4中,矩阵的行代表人的编号,矩阵的列代表各个项目,矩阵的各单元格的值代表人在对应项目的日均花费。
优选的,步骤S5具体为,计算每个候选处方集中各项目的日均花费CV值和平均值,判断各项目的日均花费和平均值之和是否高于设定阈值,若是,则剔除高CV值的项目后,组成目标处方集;若否,则直接生成目标处方集。
优选的,设定阈值为0.3-0.4。
本发明的有益效果是:本发明能够挖掘出慢病人群的目标就诊处方集,目标就诊处方集能够对慢性病的实际就诊情况进行细颗粒度宏观描述,本发明挖掘的目标就诊处方集覆盖率所有慢性病患者一段长时间就诊中的具体治疗项目组合,不仅能够用于实际就诊的宏观监控,也可以为医疗政策制定或修改提供具体参考。
附图说明
图1是本发明实施例中方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本实施例中提供了一种慢病人群实际就诊处方挖掘及实现方法,所述方法包括如下步骤,
S1、选定某种慢性疾病,通过分析该慢性疾病的就诊规律,筛选出规律性高的患者群;
S2、对筛选出的规律性高的患者群中每位患者的实际使用项目进行项目关联性分析,得到每位患者的项目集;
S3、将所有的项目集应用到步骤S1中筛选出的规律性高的患者群的实际使用中,并在设定时间内统计每个项目集的使用人数,获取使用人数最多的项目集对应的人群,即为项目集代表性高的人群;
S4、统计项目性代表性高的人群中每位患者每个项目的日均花费,并形成矩阵,并将该矩阵输入聚类算法,初步得到候选处方集;
S5、将候选处方集进行筛选剔除,获取目标处方集。
本实施例中,因慢性疾病的治疗在较长一段时间内基本为按固定用量使用治疗项目(如每日按一定次数和计量服药,每隔固定的时间进行检查等等),故慢性疾病就诊规律性可以用CV值进行表征;步骤S1具体包括如下内容
S11、取一段时间中某患者的每次就诊时间和花费,并将获取的患者就诊时间和花费按时间排序即可得到有序的花费序列(c1,c2,c3,…,cn)和时间序列(t1,t2,t3,…,tn);
S12、将时间序列求差以获取就诊间隔序列(s1,s2,s3,…,sn-1),其中si=ti+1-ti,0<i≤n-1;
S13、使用花费序列除以就诊间隔序列以获取日均花费序列(r1,r2,r3,…,rn-1),其中ri=c1/s1,0<i≤n-1;
S14、计算日均花费序列的样本均值E和样本方差Var,并根据样本均值E和样本方差Var,获取日均花费样本的CV值,CV=sqrt(Var)/E;当获取的日均花费样本的CV值小于0,则表示该患者就诊花费序列规律性高;
S15、重复步骤S11至S14,筛选出所有规律性高的患者,组成规律性高的患者群。
本实施例中,步骤S13中,计算过程中需要删除花费序列的最后一个元素,使其变成n-1列,保证其能够与n-1列的就诊间隔序列相除,以获取日均花费序列。
本实施例中,步骤S2具体为,将每位患者每次就诊时使用的所有项目看作一个就诊集,在每位患者不同的就诊集中查找出现的每个项目子集及其对应的出现次数,并将出现次数最多的项目子集综合在一起形成每位患者对应的项目集。
本实施例中,步骤S4中,矩阵的行代表人的编号,矩阵的列代表各个项目,矩阵的各单元格的值代表人在对应项目的日均花费。比如矩阵第i行第j列的元素值代表第i个人在第j个项目上的日均花费。其中聚类算法可以使用目前主流的算法中任意一个,考虑到数据量比较大,本发明在实现时选用了Kmeans聚类算法。
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
本实施例中,步骤S5具体为,计算每个候选处方集中各项目的日均花费CV值和平均值,判断各项目的日均花费和平均值之和是否高于设定阈值,若是,则剔除高CV值的项目后,组成目标处方集;若否,则直接生成目标处方集。其中设定阈值为0.3-0.4。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明通过提供一种慢病人群实际就诊处方挖掘及实现方法,挖掘出慢病人群的目标就诊处方集,目标就诊处方集能够对慢性病的实际就诊情况进行细颗粒度宏观描述,本发明挖掘的目标就诊处方集覆盖率所有慢性病患者一段长时间就诊中的具体治疗项目组合,不仅能够用于实际就诊的宏观监控,也可以为医疗政策制定或修改提供具体参考。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (6)

1.一种慢病人群实际就诊处方挖掘及实现方法,其特征在于:所述方法包括如下步骤,
S1、选定某种慢性疾病,通过分析该慢性疾病的就诊规律,筛选出规律性高的患者群;
S2、对筛选出的规律性高的患者群中每位患者的实际使用项目进行项目关联性分析,得到每位患者的项目集;
S3、将所有的项目集应用到步骤S1中筛选出的规律性高的患者群的实际使用中,并在设定时间内统计每个项目集的使用人数,获取使用人数最多的项目集对应的人群,即为项目集代表性高的人群;
S4、统计项目性代表性高的人群中每位患者每个项目的日均花费,并形成矩阵,并将该矩阵输入聚类算法,初步得到候选处方集;
S5、将候选处方集进行筛选剔除,获取目标处方集。
2.根据权利要求1所述的慢病人群实际就诊处方挖掘及实现方法,其特征在于:因慢性疾病的治疗在较长一段时间内为按固定用量使用治疗项目,故慢性疾病的就诊规律性能够用CV值进行表征;步骤S1具体包括如下内容
S11、取一段时间中某患者的每次就诊时间和花费,并将获取的患者就诊时间和花费按时间排序即可得到有序的花费序列(c1,c2,c3,…,cn)和时间序列(t1,t2,t3,…,tn);
S12、将时间序列求差以获取就诊间隔序列(s1,s2,s3,…,sn-1),其中si=ti+1-ti,0<i≤n-1;
S13、使用花费序列除以就诊间隔序列以获取日均花费序列(r1,r2,r3,…,rn-1),其中ri=c1/s1,0<i≤n-1;
S14、计算日均花费序列的样本均值E和样本方差Var,并根据样本均值E和样本方差Var,获取日均花费样本的CV值,CV=sqrt(Var)/E;当获取的日均花费样本的CV值小于0,则表示该患者就诊花费序列规律性高;
S15、重复步骤S11至S14,筛选出所有规律性高的患者,组成规律性高的患者群。
3.根据权利要求2所述的慢病人群实际就诊处方挖掘及实现方法,其特征在于:步骤S2具体为,将每位患者每次就诊时使用的所有项目看作一个就诊集,在每位患者不同的就诊集中查找出现的每个项目子集及其对应的出现次数,并将出现次数最多的项目子集综合在一起形成每位患者对应的项目集。
4.根据权利要求3所述的慢病人群实际就诊处方挖掘及实现方法,其特征在于:步骤S4中,矩阵的行代表人的编号,矩阵的列代表各个项目,矩阵的各单元格的值代表人在对应项目的日均花费。
5.根据权利要求4所述的慢病人群实际就诊处方挖掘及实现方法,其特征在于:步骤S5具体为,计算每个候选处方集中各项目的日均花费CV值和平均值,判断各项目的日均花费和平均值之和是否高于设定阈值,若是,则剔除高CV值的项目后,组成目标处方集;若否,则直接生成目标处方集。
6.根据权利要求5所述的慢病人群实际就诊处方挖掘及实现方法,其特征在于:设定阈值为0.3-0.4。
CN202010470690.2A 2020-05-28 2020-05-28 一种慢病人群实际就诊处方挖掘及实现方法 Pending CN111739604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010470690.2A CN111739604A (zh) 2020-05-28 2020-05-28 一种慢病人群实际就诊处方挖掘及实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010470690.2A CN111739604A (zh) 2020-05-28 2020-05-28 一种慢病人群实际就诊处方挖掘及实现方法

Publications (1)

Publication Number Publication Date
CN111739604A true CN111739604A (zh) 2020-10-02

Family

ID=72648127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010470690.2A Pending CN111739604A (zh) 2020-05-28 2020-05-28 一种慢病人群实际就诊处方挖掘及实现方法

Country Status (1)

Country Link
CN (1) CN111739604A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110130302A1 (en) * 2009-12-01 2011-06-02 Precision Therapeutics, Inc. Biological pathways associated with chemotherapy outcome for breast cancer
CN109616216A (zh) * 2018-11-30 2019-04-12 平安医疗健康管理股份有限公司 医疗费用预测方法、装置、设备及计算机可读存储介质
CN109615012A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
WO2020008214A1 (en) * 2018-07-05 2020-01-09 Oxford University Innovation Limited Method and apparatus for designing a course of treatment
US20200051679A1 (en) * 2018-08-08 2020-02-13 Hc1.Com Inc. Methods and systems for a pharmacological tracking and reporting platform

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110130302A1 (en) * 2009-12-01 2011-06-02 Precision Therapeutics, Inc. Biological pathways associated with chemotherapy outcome for breast cancer
WO2020008214A1 (en) * 2018-07-05 2020-01-09 Oxford University Innovation Limited Method and apparatus for designing a course of treatment
US20200051679A1 (en) * 2018-08-08 2020-02-13 Hc1.Com Inc. Methods and systems for a pharmacological tracking and reporting platform
CN109616216A (zh) * 2018-11-30 2019-04-12 平安医疗健康管理股份有限公司 医疗费用预测方法、装置、设备及计算机可读存储介质
CN109615012A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质

Similar Documents

Publication Publication Date Title
Way et al. The misleading narrative of the canonical faculty productivity trajectory
US7917374B2 (en) System and method for early identification of safety concerns of new drugs
US7856362B2 (en) System and method for early identification of safety concerns of new drugs
US20080016117A1 (en) Bioinformatic Transaction Scheme
US20130197936A1 (en) Predictive Healthcare Diagnosis Animation
US20050021236A1 (en) Statistically identifying an increased risk for disease
US20220084662A1 (en) Systems and methods for automatically notifying a caregiver that a patient requires medical intervention
Chushig-Muzo et al. Data-driven visual characterization of patient health-status using electronic health records and self-organizing maps
Schirm et al. How to estimate the population that is covered by community pharmacies? An evaluation of two methods using drug utilisation information
CN111951924A (zh) 一种异常用药行为检测方法及系统
Shannon et al. Mantel statistics to correlate gene expression levels from microarrays with clinical covariates
Myrov et al. Neural activity clusterization for estimation of firing pattern
CN111739604A (zh) 一种慢病人群实际就诊处方挖掘及实现方法
Tóth et al. Frequent Treatment Sequence Mining from Medical Databases.
Benfares et al. A clinical support system for classification and prediction of depression using machine learning methods
Goodman et al. Emergency department frequent user subgroups: Development of an empirical, theory-grounded definition using population health data and machine learning.
CN106503489A (zh) 心血管系统对应的基因的突变位点的获取方法及装置
YİĞİT Evaluation of Bed Utilization Performance of Hospital Departments in Turkey With Grey Related Analysis
Cohen et al. Identifying Homogeneous Patient Clusters in Swiss University Hospital Through Latent Class Analysis
Lee et al. Factors influencing metabolic syndrome perception and exercising behaviors in Korean adults: Data mining approach
Wang et al. Higher-order interaction of brain microstructural and functional connectome
CN106529210A (zh) 心理与精神对应的基因的突变位点的获取方法及装置
Mielczarek A simulation approach to evaluate the effect of demographic changes on projected number of patients across disease categories
CN116756626A (zh) 一种基于改进rfm模型的医保参保人员分类方法
Meghani et al. Trajectories and predictors of high-occurrence pain flares in ambulatory cancer patients on opioids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240326