CN112714937A - 基于回顾水平线的胰岛素剂量预测 - Google Patents

基于回顾水平线的胰岛素剂量预测 Download PDF

Info

Publication number
CN112714937A
CN112714937A CN201980056347.9A CN201980056347A CN112714937A CN 112714937 A CN112714937 A CN 112714937A CN 201980056347 A CN201980056347 A CN 201980056347A CN 112714937 A CN112714937 A CN 112714937A
Authority
CN
China
Prior art keywords
data
insulin
subject
blood glucose
dose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201980056347.9A
Other languages
English (en)
Inventor
A·伊曼巴耶夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN112714937A publication Critical patent/CN112714937A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • G16H20/17ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients delivered via infusion or injection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Infusion, Injection, And Reservoir Apparatuses (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种提供对受试者数据集的数据质量控制的新型系统,所述系统可用于治疗糖尿病患者。所述数据质量控制系统通过经训练的回归模型来分析血糖测量值并向所述受试者提供预测的胰岛素注射量。所预测的胰岛素注射量可用于提高胰岛素剂量滴定程序的准确性,从而使所述受试者确信滴定的胰岛素剂量是适当的并且提供针对糖尿病病状的最佳治疗。因此,所述数据质量控制系统提供改善的患者预后。

Description

基于回顾水平线的胰岛素剂量预测
本公开总体上涉及用于协助患者和卫生保健从业者管理对糖尿病的胰岛素治疗的系统和方法,其中基于血糖测量值的数据集来评价胰岛素剂量的量数据的质量。
背景技术
糖尿病(DM)是胰岛素分泌受损和外周胰岛素抗性程度不一而导致的高血糖症。2型糖尿病的特征在于正常生理胰岛素分泌的进行性破坏。在健康个体中,胰腺β细胞的基础胰岛素分泌持续发生,以在两餐之间长期维持稳定的葡萄糖水平。在健康个体中还存在餐时分泌,其中胰岛素响应进餐在最初的第一相峰值中快速释放,随后是在2-3小时后恢复至基础水平的长期胰岛素分泌。多年控制不良的高血糖症可能引起多种健康并发症。糖尿病是全世界过早发病和死亡的主要原因之一。
有效控制血糖/血浆葡萄糖可以预防或延缓这些并发症中的许多并发症,但一旦建立,可能无法逆转。因此,在预防糖尿病并发症的努力中实现良好的血糖控制是治疗1型和2型糖尿病的主要目标。具体而言,胰岛素剂量滴定的频繁变化是帮助稳定患者血糖水平的关键(Bergenstal等人, “Can a Tool thatAutomates Insulin Titration be a Keyto Diabetes Management
Figure DEST_PATH_IMAGE001
” Diabetes Tech. and Thera. 2012; 14(8) 675-682)。已经开发了具有可调步长和生理参数估计值以及预定义的空腹血糖目标值的智能滴定仪,以施用胰岛素药剂治疗方案。长效基础胰岛素的最优初始化和滴定方法仍在确定中。然而,有证据表明,许多患者通常未接受充分滴定以达到血糖控制的目标水平的胰岛素剂量(仍处于次优剂量且未能达到治疗目标)(Holman等人, “10-year follow-up of intensiveglucose control in type 2 diabetes,” N. Engl. J. Med. 2008; 359: 1577–1589)。
胰岛素方案的主要问题之一是患者缺乏自主权和授权。患者通常必须去诊所计算新的滴定度。当诊所必须为患者滴定胰岛素剂量时,改变滴定剂量的可能频率受到自然限制。自我滴定方案有助于患者的授权,使他们更多地参与到他们的治疗中,这可以改善血糖控制(Khunti等人, “Self-titration of insulin in the management of people withtype 2 diabetes: a practical solution to improve management in primary care,”Diabetes, Obes., and Metabol. 2012; 15(8) 690-700)。在其糖尿病管理和其胰岛素滴定中发挥积极作用的患者可能会感到更有能力负责其自我护理,并且更坚信其行为可以影响其疾病,从而带来更好的治疗效果(Norris等人, “Self-management education foradults with type 2 diabetes: a meta-analysis on the effect of glycemiccontrol. Diabetes Care,” 2002, 25:1159–71, Kulzer等人, “Effects of self-management training in type 2 diabetes: a randomized, prospective trial,”Diabet. Med. 2007, 24:415–23, Anderson等人, “Patient empowerment: results ofa randomized controlled trial,” Diabetes Care. 1995, 18:943–9)。此外,当患者控制其自身的滴定时,滴定的频率会增加,这会增加患者达到所需血糖水平的可能性。
然而,患者自主滴定依赖于可信赖的数据。如果患者要自行滴定剂量,则患者必须确信坚持先前推荐的滴定水平。可能错误地捕获或测量胰岛素剂量(例如,Friedrichs等人,”Dosing Accuracy and Injection Force of Different Insulin Glargine Pens.”J Diabetes Sci Technol. 2013; 7(5): 1346-1353;Abdel-Twab等人,”Dosing Accuracyof Two Disposable Insulin Pens According to New Iso 11680-1: 2012Requirements.” J Diabetes Sci Technol. 2015; 10(1): 157-161)。对于自主滴定,胰岛素剂量数据经由蓝牙或其他连接解决方案传输,存储在数据库中,然后进行分析。因此,误差可能会在整个算法链传播而产生错误和/或甚至有害的预测或结果。这个问题不仅困扰着工程师、研究人员、数据科学家、营销人员和职工,而且困扰着为其设计并制作这些新型联网数字健康应用程序、产品和服务的HCP和II型糖尿病(T2DM)患者。
主要的数据质量挑战是从医疗装置中将身体注射的胰岛素剂量成功捕获到医疗软件中。有许多有前景的场所可以解决这种数据质量挑战,包括硬件改进(例如添加诸如声音、速度、温度、压力或光学等传感器)和软件方法。软件解决方案尝试直接过滤出实际身体注射的胰岛素剂量或者尝试间接过滤出所有其他可能的胰岛素给药事件或分配,诸如空气注射、湿射、灌注事件、分剂量等等(Daskalaki等人, ”Real-Time Adaptive Models forthe personalized prediction of Glycemic Profile in Type 1 Diabetes Patients.”Diabetes Technol. Thera. 2012; 14(2): 168-174;Pappada等人Neural Network-Based Real-Time Prediction of Glucose in Patients with Insulin-DependenceDiabetes.” Diabetes Technol. Thera. 2011; 13(2): 135-141)。软件解决方案在复杂性方面范围从简单到高级启发式过滤规则,一直到复杂的并且优选自动化的机器学习和人工智能系统。然而,当前这些软件解决方案无法始终如一地获得高准确性分数。
US 2017/053101公开了一种用于确定所治疗的患者的治疗剂量的方法,该方法包括使用血糖史数据和由患者群体的患者所施用的胰岛素的治疗剂量数据以及与每种治疗剂量相关的预后属性来训练模型。基于此,可以基于一个或多个所识别的最佳治疗剂量来产生针对所治疗的患者的下一个推荐胰岛素治疗剂量。
鉴于上述背景,本领域需要用于提供胰岛素剂量的量数据的准确质量控制信息的装置、系统和方法,从而实现更准确的滴定方案,并且从而治疗2型糖尿病。
在该背景技术部分中公开的信息仅用于增强对本发明的一般背景的理解,并且不应被视为对该信息构成本领域技术人员已知的现有技术的承认或任何形式的暗示。
发明内容
在本发明的公开内容中,将描述多个实施方案和方面,它们将解决上述目标中的一个或多个,或者将解决从下面的公开内容以及从示例性实施方案的描述将显而易见的目标。
本公开解决了本领域中对用于提供对所捕获的胰岛素剂量的量的数据质量控制和重建的装置、系统和方法的需要。
根据本发明的第一方面,提供了一种用于为要治疗糖尿病的查询受试者提供药物剂量指导推荐的计算系统,其中该系统包括一个或多个处理器和一个存储器。存储器包括指令,所述指令在由所述一个或多个处理器执行时执行响应于接收到剂量指导请求的方法。所述指令包括以下步骤:(a)获得包含查询受试者参数的第一数据结构,(b)获得第一数据集,所述第一数据集包括在一定时间过程内得到的所述查询受试者的多个葡萄糖测量值,并从而建立血糖史,所述多个葡萄糖测量值中的每个相应葡萄糖测量值包括:(i)血糖(BG)水平,以及(ii)表示在所述时间过程中所述相应葡萄糖测量值产生的时间的对应血糖时间戳,(c)获得第二数据集,所述第二数据集包括所述查询受试者的胰岛素注射史,其中所述注射史包括在所述时间过程的整个或一部分期间的多次注射,并且对于所述多次注射中的每次相应注射包括:(i)对应的注射量,以及(ii)表示在所述时间过程中所述相应注射发生的时间的注射时间戳,(d)基于具有给定回顾水平线(RH)的血糖反应数据集获得用于回顾性胰岛素剂量预测的训练模型,(e)针对所述查询受试者的数据集进行数据优化,所述数据优化包括将查询受试者数据输入到所述训练模型中并获得所述查询受试者的至少一个重建胰岛素剂量的量,并且(f)提供药物剂量指导推荐,所述推荐是基于来自以下方面的数据计算的:第一数据结构、第一数据集、第二数据集以及针对所述查询受试者的至少一个重建胰岛素剂量的量。
这样,可以基于患者的血糖值重建历史剂量数据,这样允许计算出更准确的剂量推荐。
进行数据优化的步骤可以包括:(i)从所述查询受试者的数据集中获得相应时间过程中的多个查询受试者血糖测量值以及相应时间点子集中的至少一个查询受试者胰岛素剂量的量,并且(ii)将所述多个查询受试者血糖测量值输入到所述训练模型中,从而获得针对所述查询受试者的一个或多个查询模型输出值,其中针对所述查询受试者的所述一个或多个查询输出值包括针对所述查询受试者的至少一个或多个重建胰岛素剂量的量。
所述方法还可包括针对所述查询受试者的数据集进行数据预处理和数据处理,其中(i)所述数据预处理包括访问所述查询受试者的数据集,选择预定类型的胰岛素剂量,选择预定类型的血糖测量值并且将所述多个查询受试者血糖测量值和所述至少一个受试者胰岛素剂量的量重新组织成多个经预处理的查询受试者血糖测量值和/或至少一个经预处理的查询受试者胰岛素剂量的量,(ii)所述数据处理包括将经预处理的查询受试者血糖史和经预处理的查询受试者胰岛素剂量史合并到查询受试者数据表中,并且指定所述查询受试者数据表中的自变量和因变量,并且(iii)所述数据优化包括将所述查询受试者数据表应用于所述训练模型并获得针对所述查询受试者的至少一个重建胰岛素剂量的量。
在示例性实施方案中,提供了如上所述的计算系统,其中获得训练模型的步骤包括(a)获得包括多个参考实体的训练集,其中所述多个参考实体包括多个参考胰岛素剂量史和多个参考血糖史,其中每个参考胰岛素剂量史与参考血糖史配对形成所述多个参考实体中的参考实体,(b)对于所述多个参考实体中的每个相应参考实体,(i)从所述对应血糖史中获得相应时间过程中每个时间点的血糖测量值,以及(ii)从所述对应的参考胰岛素剂量史中获得所述相应时间过程中相应时间点子集中每个时间点的胰岛素剂量的量,其中所述多个参考实体中的每个相应参考实体提供针对所述相应时间过程的多个参考血糖测量值,其中所述多个参考血糖测量值是预定类型的血糖测量值,并且所述多个参考实体中的每个相应参考实体提供在相应时间点子集中的一个或多个参考胰岛素剂量的量,其中所述一个或多个参考胰岛素剂量的量是预定类型的胰岛素剂量,(c)获得包括多个测试实体的测试集,其中所述多个测试实体包括多个测试胰岛素剂量史和多个测试血糖史,其中每个测试胰岛素剂量史与测试血糖史配对形成所述多个测试实体中的测试实体,其中每个相应测试血糖史提供多个血糖测量值,并且其中每个相应测试胰岛素剂量史提供一个或多个测试胰岛素剂量的量,其中所述一个或多个测试胰岛素剂量的量是预定类型的胰岛素剂量,(d)在整个训练集中使用所述相应时间过程的所述多个参考血糖测量值和所述至少一个参考胰岛素剂量的量来训练模型,从而获得训练模型,(e)将所述多个测试血糖史输入到所述训练模型中,从而获得所述测试集的一个或多个训练模型输出值,其中所述一个或多个训练输出值包括所述测试集的一个或多个重建胰岛素剂量的量,并且(f)基于所述测试集的训练模型输出值来评价所述训练模型。可以对所述训练和测试集数据重采样以注入到机器学习引擎中。
在示例性实施方案中,所述多个参考胰岛素剂量史和所述多个参考血糖史来自于多个训练受试者,或者所述多个参考胰岛素剂量史和所述多个参考血糖史来自于单个训练受试者。
在另外的示例性实施方案中,所述时间点子集中的每个时间点紧随所述时间过程中的预定义时间段之前,其中所述时间过程中的所述预定义时间段选自20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟、100-120分钟和120-180分钟的集合。
所述相应参考胰岛素剂量史可以包括在所述时间过程的整个或一部分期间向所述对应参考实体施用的多个胰岛素剂量,以及对于所述多个胰岛素剂量中的每个相应胰岛素剂量而言,对应的胰岛素剂量的量和表示在所述时间过程中所述相应胰岛素剂量发生的时间的胰岛素剂量时间戳,并且其中所述胰岛素剂量时间戳是在所述时间点子集中。
所述方法还可包括提供一个或多个模型性能指标的步骤,其中所述一个或多个模型性能指标包括均方根误差或准确性分数。
在一个示例性的实施方案中,所述数据优化还包括处理丢失数据,其中通过以预定义时间间隔对所述受试者数据表进行重采样来对所述受试者数据表中的一个或多个时间间隙进行插值。
预定类型的血糖测量值可以是(i)连续的血糖监测数据,或(ii)血糖自我监测数据。所述预定类型的胰岛素剂量可以包括(i)一个或多个推注胰岛素剂量事件或(ii)一个或多个基础胰岛素剂量事件。
所述计算系统可适于提供针对所述查询受试者的长效或超长效胰岛素调整日剂量推荐,其中所述数据结构包括(i)所述受试者的葡萄糖上限目标范围水平,(ii)受试者的葡萄糖下限目标范围水平,和(iii)当前的剂量指导基线。
所述计算系统可以适于提供针对所述查询受试者的推注剂量推荐,其中所述数据结构包括进餐信息。
在本发明的另一方面中,提供了一种计算系统,其用于确定剂量推荐或剂量滴定的技术目的,并且具有改善的和最大程度优化的胰岛素剂量数据质量,所述胰岛素剂量数据质量是在不可接受或不可用的胰岛素剂量值的情况下定义的,所述不可接受或不可用的胰岛素剂量值可能是被不准确地记录和传送的、丢失的(例如,通过滴定方案,假定用户三天全部服用相同的剂量,但是由于用户错误或有时由于无法正确识别用户输入的记录错误而仅记录了一天的剂量),或破坏的(例如,胰岛素剂量诸如4000、-200,或时间戳交换,第15分钟出现在第10分钟而不是第5分钟之前),对所述不可接受或不可用的胰岛素剂量值进行重建、固定、扩展并且与基于所提出的机器学习方法的回顾水平线(RH)预测(即在时间上回到给药事件)的身体有反应的并因此身体注射的胰岛素剂量值进行配准,所提出的机器学习方法经过特别调节、调整并启动进行与特定输入受试者数据集配准的代表性且普遍化的样本群体水平的总体生理反应。在该相同实施方案中紧密捕获的是该计算系统的灵活性和可量测性,以选择和挑选适当的机器学习方法模型,以在新的群体水平数据上进行训练,以与其他或未来真实世界的受试者配准并作为其代表以实现普遍化预测。反过来,计算机系统包括一个或多个处理器和一个存储器,所述存储器包括指令,所述指令在由所述一个或多个处理器执行时进行一种方法,该方法包括:(a)获得是构成训练参考实体(尤其是彼此配对和配准的训练胰岛素剂量史和训练血糖史)的所有可用数据集的随机改组和分配的分数(例如70%)的训练集,(b)获得是构成训练参考实体(尤其是彼此配对和配准的训练胰岛素剂量史和训练血糖史)的所有可用数据集的随机改组和分配的分数(例如30%)的测试集,(c)对于每个训练或测试参考实体,包括:(i)来自对应的训练血糖史中的一定时间过程中每个时间点的血糖测量值,和(ii)来自对应的胰岛剂量史参考中的相同时间过程中时间点子集中每个时间点的胰岛素剂量的量,其中通常是时间线性和向前的血糖测量值经过处理并转化成不同长度(例如60分钟)倒退的、回到给药事件的时间戳的回顾水平线(RH)时间段。另外,这些RH时间段(例如60)受血糖测量值的类型影响,因此受捕获此类血糖测量值的装置类型影响。更具体地,血糖测量值是预定类型的血糖测量值,通常是由捕获此类血糖测量值的装置类型所决定的。对于连续血糖监测器(CGM)类型,例如以5分钟间隔的数据分辨率,则向后60分钟的回顾水平线(RH)将允许12次CGM血糖测量,对于快速血糖监测器(FGM)类型,例如15分钟间隔的数据分辨率,则向后60分钟的RH将改为允许仅4次FGM血糖测量,其他实施方案可以根据血糖装置的数据分辨率,在向后5分钟至15分钟、至30分钟、至75分钟、至90分钟或更长时间的任何情况下获得这种RH情况。胰岛素剂量测量值是预定类型的胰岛素剂量值,通常是由捕获此类胰岛素剂量的装置类型决定的;胰岛素笔、胰岛素泵和其他此类装置。
胰岛素剂量测量发生在带有时间戳的事件时,RH在时间上倒退60分钟,不是在时间上向前的。因此,虽然这是一个预测因素,但它是回顾性预测因素,其是为了数据质量清理的目的,而不是提前预报的目的。
该方法包括另一步骤:(d)应用各种适用于机器学习和其他不适用于传统的基于假设的统计学习的数据驱动学习的重采样技术(例如K折交叉验证(K-Fold CrossValidation)、刀切法(jack-knife))来分割所有可用数据(例如分割成70-30%的训练和测试数据集)。这些重采样技术估计并评价数据驱动的机器学习方法模型在新的、不可见数据上的技能,从而更好地捕获所研究样本群体中的一般生理反应。
当仅对单个患者的数据进行建模并试图了解一般生理反应时,建模者限于研究中受试者的功效样本量N,例如1925。因此,它是该特定样本群体在那个时间和空间上的极具代表性的快照视图。简言之,在传统的、统计的、假设驱动的建模范围内,仅可能有一个训练子集、测试子集(和验证)子集的单个实例。
然而,当对患者群体的数据进行建模并试图了解一般生理反应时,建模者可以提高严格度超出研究中受试者的功效样本量N。通过将可用受试者分割为训练集、测试集和有时甚至验证集(例如60%的训练集、30%的测试集、10%的验证集)并且能够重采样为甚至5个、10个、100个或甚至尽可能多为一组,有效地解释所有组中相同1925个原始受试者的1925 * 5 = 9625的实例,1925 * 10 = 19250的实例,以及1925 * 100 = 192500的实例中的变异。简言之,通过数据驱动的机器学习建模,至少有5个和10个(推荐,但可以而且确实被推高到50个、100个和200个)可能的不同训练、测试和验证子集的实例。
与假设驱动的学习方法不同,本发明试图全面优化数据驱动的学习方法的这种重采样特性。
该方法包括其他的数据质量检查步骤(e)其中除了训练-测试分割之外,还可以进行一系列调节、调整和启动的重采样技术,以完全实现点(d)的最后一点,即全面优化与假设驱动的学习方法不同的数据驱动的学习方法的这种重采样特性,以及(f)其中除了训练-测试分割和重采样之外,还可以进行一系列预处理和时间戳增长技术,以进一步筛分和过滤数据集,以便生成经过训练-测试分割的、重采样和预处理的数据集用于下一步训练。这些步骤中的大多数涉及RH时间段,因此可以使用滚动合并的概念。
这些重采样和预处理技术的其他优点是保留了要在下一步中进行训练的机器学习模型的任何和所有相关系数和标记,从而从参考训练数据中解压了其他黑盒训练模型。
在所解决的问题的情况下对定义的回顾水平线使用重采样和预处理技术时,可以从模型的初始基础中解压模型的系数。
因此,不仅仅是使用葡萄糖测量数据和胰岛素数据的任何“训练模型”属于公开的概念范围。相反,使用限定于在时间上倒退的回顾水平线区段内的葡萄糖测量数据和在时间上向后的相同RH区段内基于事件向后的胰岛素数据的,使用重采样和预处理技术的训练模型也可以满足公开的概念的主要要求和约束。
该方法包括以下的其他步骤:(g)使用训练数据集的相应时间过程的血糖测量值和整个训练集中的至少一个参考胰岛素剂量的量来训练模型,从而获得训练模型,以及(h)为了在群体水平上的模型评价目的,将对来自于(g)的训练模型应用测试血糖史(例如,数据集的30%),响应于测试集的血糖史输出而获得一个或多个重建胰岛素剂量的量的一个或多个训练模型输出预测值,比较训练模型(g)的预测、重建胰岛素剂量的量(这些量可以或可以不与已知、标记的、真实、实际值直接配准),并且通过将训练模型生成的值与来自测试集的实际值进行比较来评价所述模型。
例如,对于CGM用户的样本群体,作为X输入的以下12个CGM值[300、265、250、225、200、175、150、135、125、100、90、80]的以下60分钟回顾水平线(RH)与标记的、已知实际值Y(Y = 34 IU(胰岛素单位))配对,也就是Y_测试,因为该模型未曾见过这种12个CGM值的特定X输入。然后,该模型从步骤(g)募集训练模型,以便回顾性地预报预测值,Y_测试_预测,例如,Y_预测=32 IU。因此,为了进行评价,32 IU的预测值比实际、已知或标记的34 IU值低2 IU。简单的评价指标是百分比误差:例如,百分比误差=((V观测-V真实)的绝对值/V真实)*100,在该示例中为:((|32 – 34|)/ 34)*100 = (2/34)*100 = 5.8824%。这是一个有竞争力的结果,在大多数领域中,通常可接受最多15%的误差。
该方法还包括其他步骤:(i)将来自于(g)的训练模型应用于个体受试者的血糖史,以便为了医疗剂量指导请求和推荐的技术目的回顾性地清理胰岛素剂量数据,应用训练模型(例如:对于CGM用户,具有以以下12个CGM值作为X输入的RH60:[150、145、140、135、130、125、120、100、90、80、70、65]),响应于该特定个体受试者的血糖史输入,获得一个或多个重建胰岛素剂量的量(例如42 IU)的一个或多个训练模型输出预测值,以及(j)与药物剂量指导请求和受试者参数进行握手,验证回顾性重建的胰岛素剂量被药物剂量指导要求接受。在确认药物剂量指导请求后,然后回顾性重建的胰岛素剂量覆盖先前的胰岛素剂量(例如49 IU,从而正确地识别出例如具有7单位空气注射的新笔),并完成该药物剂量指导请求以发送到提供剂量推荐的推荐引擎中。
在另一方面中,本文公开了一种用于进行对来自受试者的数据集的数据质量控制的计算系统。如本文所公开的,该计算系统包括一个或多个处理器和一个存储器。该存储器包括指令,所述指令在由所述一个或多个处理器执行时进行一种方法。该方法包括(a)获得包括多个参考实体的训练集,其中所述多个参考实体包括多个参考胰岛素剂量史和多个参考血糖史,其中每个参考胰岛素剂量史与参考血糖史配对形成所述多个参考实体中的参考实体。该方法还包括(b)对于所述多个参考实体中的每个相应参考实体,(i)从所述对应血糖史中获得相应时间过程中每个时间点的血糖测量值,以及(ii)从所述对应的参考胰岛素剂量史中获得所述相应时间过程中相应时间点子集中每个时间点的胰岛素剂量的量。所述多个参考实体中的每个相应参考实体提供相应时间过程的多个参考血糖测量值。所述多个参考血糖测量值是预定类型的血糖测量值,并且所述多个参考实体中的每个相应参考实体提供在相应时间点子集中的一个或多个参考胰岛素剂量的量。
所述一个或多个参考胰岛素剂量的量是预定类型的胰岛素剂量。该方法还包括(c)获得包含多个测试实体的测试集。所述多个测试实体包含多个测试胰岛素剂量史和多个测试血糖史。每个测试胰岛素剂量史与测试血糖史配对形成所述多个测试实体中的测试实体。每个相应测试血糖史提供多个血糖测量值。每个相应测试胰岛素剂量史提供一个或多个测试胰岛素剂量的量。而且,所述一个或多个测试胰岛素剂量的量是预定类型的胰岛素剂量。该方法还包括(d)在整个训练集中使用所述相应时间过程的所述多个参考血糖测量值和所述至少一个参考胰岛素剂量的量来训练模型,从而获得训练模型。该方法还包括(e)将所述多个测试血糖史输入到训练模型中,从而获得测试集的一个或多个训练模型输出值。所述一个或多个训练输出值包括测试集的一个或多个重建胰岛素剂量的量。
在一些实施方案中,该方法该包括:(f)从查询受试者的数据集中获得相应时间过程中的多个查询受试者血糖测量值以及相应时间点子集中的至少一个查询受试者胰岛素剂量的量,以及(g)将所述多个查询受试者血糖测量值输入到所述训练模型中,从而获得针对所述查询受试者的一个或多个查询模型输出值。在此类实施方案中,针对所述查询受试者的所述一个或多个查询输出值包括针对所述查询受试者的至少一个或多个重建胰岛素剂量的量。
在其他实施方案中,针对所述查询受试者的所述一个或多个查询输出值包括针对所述查询受试者的至少一个或多个预计胰岛素剂量的量。
在一些实施方案中,所述多个参考胰岛素剂量史和所述多个参考血糖史来自于多个训练受试者。
在一些实施方案中,所述多个参考胰岛素剂量史和所述多个参考血糖史来自于单个训练受试者。
在一些实施方案中,该方法还包括:(h)针对多个查询受试者中的每个查询受试者重复所述获得(f)和所述输入(g)。
在一些实施方案中,所述时间点子集中的每个时间点紧随所述时间过程中的预定义时间段之前。然而,如下定义的进行预处理数据的步骤可能能够产生相同的时间点子集。
在一些实施方案中,时间过程中的预定义时间段选自20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟、100-120分钟或120-180分钟的集合。
在一些实施方案中,所述相应参考胰岛素剂量史包括在所述时间过程的整个或一部分期间向所述对应参考实体施用的多个胰岛素剂量,以及对于所述多个胰岛素剂量中的每个相应胰岛素剂量而言,对应的胰岛素剂量的量和表示在所述时间过程中所述相应胰岛素剂量发生的时间的胰岛素剂量时间戳。在此类实施方案中,所述胰岛素剂量时间戳是在所述时间点子集中。
在一些实施方案中,所述多个参考实体包括来自至少10,000名参考受试者的多个葡萄糖史和多个胰岛素剂量史。
在一些实施方案中,该方法还包括提供一个或多个模型性能指标,包括均方根误差或准确性分数。
在一些实施方案中,所述一个或多个模型性能指标包括如下计算的均方根误差:
Figure DEST_PATH_IMAGE002
=
Figure DEST_PATH_IMAGE003
其中n为2或更大的正整数,j是介于1至n之间的整数指数,每个y j 是所述多个测试实体中第j个测试实体在点集合中的相应时间点的重建胰岛素剂量的量,并且每个是第j个测试实体在相应时间点的对应测试胰岛素剂量的量。
在一些实施方案中,所述一个或多个模型性能指标包括如下计算的准确性分数(r2):
Figure DEST_PATH_IMAGE004
其中n为2或更大的正整数,j是介于1至n之间的整数指数,每个y j 是所述多个测试实体中第j个测试实体在点集合中的相应时间点的测试胰岛素剂量的量,每个y j 是第j个实体在相应时间点的重建剂量的量,并且是n个中的平均测试胰岛素剂量的量。
在一些实施方案中,所述获得查询受试者的一个或多个训练模型输出值还包括获得重建血糖史。
在一些实施方案中,该方法还包括对查询受试者的数据集进行数据预处理、数据处理和数据优化。在一些此类实施方案中,所述数据预处理包括访问所述查询受试者的数据集,选择预定类型的胰岛素剂量,选择预定类型的血糖测量值并且将所述多个查询受试者血糖测量值和所述至少一个受试者胰岛素剂量的量重新组织成多个经预处理的查询受试者血糖测量值和/或至少一个经预处理的查询受试者胰岛素剂量的量。在一些此类实施方案中,所述数据处理包括将经预处理的查询受试者血糖史和经预处理的查询受试者胰岛素剂量史合并到查询受试者数据表中,并且指定所述查询受试者数据表中的自变量和因变量。在一些此类实施方案中,所述数据优化包括将所述查询受试者数据表应用于所述训练模型并获得针对所述查询受试者的至少一个重建或预计胰岛素剂量的量。
在一些实施方案中,预定类型的胰岛素剂量包括一个或多个推注胰岛素剂量事件。
在一些实施方案中,预定类型的胰岛素剂量包括一个或多个基础胰岛素剂量事件。
在一些实施方案中,所述数据优化还包括处理丢失数据,其中通过以预定义时间间隔对所述受试者数据表进行重采样来对所述受试者数据表中的一个或多个时间间隙进行插值。
在一些实施方案中,预定义时间间隔为1分钟、2分钟、5分钟、10分钟、15分钟、20分钟或30分钟。
在一些实施方案中,预定义时间间隔在1至30分钟之间。
在一些实施方案中,所述模型是选自由以下组成的组的回归模型:线性回归模型、非线性回归模型、支持向量机、随机森林、Keras人工神经网络和梯度树提升模型。
在一些实施方案中,预定类型的血糖测量值是连续葡萄糖监测数据。在一些此类实施方案中,连续血糖监测数据包括以30秒、1分钟、2分钟、5分钟或10分钟的间隔得到的测量值。
在一些实施方案中,预定类型的血糖测量值是血糖自我监测数据。在一些此类实施方案中,血糖自我监测数据包括以至少每小时>1次、每天>1次、每天>2次、每天>3次、每天>4次、每7天>1次、每14天>1次、每7天>4次、每14天>4次、每30天>1次、每30天>4次的间隔得到的测量值。
在一些实施方案中,预定类型的胰岛素剂量包括一个或多个推注胰岛素剂量事件,并且所述一个或多个推注胰岛素剂量事件发生在选自80-100分钟、100-120分钟、110-130分钟、120-140分钟、130-150分钟、140-160分钟、150-170分钟或160-180分钟的时间过程中的预定义时间段内。
在一些实施方案中,预定类型的胰岛素剂量包括一个或多个基础胰岛素剂量事件,并且所述一个或多个基础胰岛素剂量事件发生在选自20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟、100-120分钟、36小时或24-48小时的时间过程中的预定义时间段内。
附图说明
将参考附图描述本发明的以下实施方案,其中
图1说明了一种示例性集成计算系统,该示例性集成计算系统用于使用胰岛素剂量的重建来为要治疗糖尿病的查询受试者提供药物剂量指导推荐,
图2A和图2B示出了提供剂量指导推荐的系统的第一实施方案的过程和特征的流程图,
图2C和图2D说明了如何基于CGM数据确定TGL值,
图3A根据本公开的一个实施方案说明了一种示例性的系统拓扑结构,该系统拓扑结构包括验证和校正来自受试者的报告数据的数据质量检查系统,用于自主地调整用于受试者的处方胰岛素方案中的长效胰岛素药剂剂量的方案监测装置,用于收集患者数据的数据收集装置,从受试者中测量葡萄糖数据的一个或多个葡萄糖传感器,以及由受试者用于根据处方胰岛素药剂方案注射胰岛素药剂的一支或多支胰岛素笔,其中以上鉴定的部件任选地通过通信网络互连,
图3B和图3C根据本公开的一个实施方案共同地说明了用于在处方胰岛素方案中进行数据质量检查的系统,
图4A和图4B根据本公开的各种实施方案共同地提供了用于在处方胰岛素方案中自主地进行数据质量检查的装置的过程和特征的流程图,
图5根据本公开的一个实施方案说明了输入到数据质量检查系统中的数据的示例,
图6A、图6B、图6C、图6D、图6E、图6F、图6G、图6H、图6I、图6J、图6K和图6L根据本公开的一个实施方案共同地说明了一种示例性的数据预处理模块,
图7A、图7B、图7C、图7D、图7E、图7F、图7G、图7H、图7I和图7J根据本公开的一个实施方案共同地说明了一种示例性的数据处理模块,
图8A和图8B根据本公开的一个实施方案共同地说明了一种示例性的数据优化模块,
图9A、图9B、图9C、图9D、图9E、图9F和图9G根据本公开的一个实施方案共同地说明了训练随机森林回归模型的示例,
图10A、图10B、图10C、图10D、图10E、图10F和图10G根据本公开的一个实施方案共同地说明了训练Keras人工神经网络回归模型的示例,
图11A、图11B、图11C、图11D、图11E和图11F根据本公开的一个实施方案共同地说明了训练支持向量机回归模型的示例,以及
图12A、图12B、图12C、图12D、图12E和图12F根据本公开的一个实施方案共同地说明了训练梯度树提升回归模型的示例。
在附图中,类似的结构主要由类似的附图标记标识。
具体实施方式
糖尿病是日益增长的世界卫生流行病。尽管可以用既定的滴定治疗方案和药品对糖尿病进行有效地管理,但是提供自动滴定推荐必须要进行质量检查才能准确性。本公开提供了一种数据质量系统,以处理患者收集的数据,从而实现自动滴定算法和自我滴定。这样通过减少剂量调整所需医师咨询的频率而增强了患者授权以及大大降低了治疗成本,而所有这些都不会降低治疗结果。
本公开依赖于包括与至少一个受试者有关的信息的训练和测试数据集的获取。一个或多个数据集至少包括在一定时间过程中得到的用于建立血糖史的受试者的多个葡萄糖测量值,并且对于所述多个葡萄糖测量值中的每个相应葡萄糖测量值而言,包括表示在所述时间过程中相应葡萄糖测量值产生的时间的对应葡萄糖时间戳,以及一个或多个基础胰岛素注射史,其中所注射史包括在所述时间过程的整个或一部分期间的多次注射,并且对于所述多次注射中的每次注射,包括对应的剂量事件的量和在所述时间过程中相应注射事件发生的时间的剂量事件时间戳。
参考图1,将描述用于为要治疗糖尿病的给定患者提供药物剂量指导推荐的计算系统。该系统包括一个或多个处理器和一个存储器,该存储器具有指令,所述指令在由所述一个或多个处理器执行时响应于接收到剂量指导请求(DGR)进行一种方法。
所述指令包括以下步骤:(a)获得包含患者(查询受试者)参数的第一数据结构,(b)获得第一数据集,所述第一数据集包括在一定时间过程内得到的所述患者的多个葡萄糖测量值并从而建立血糖史,所述多个葡萄糖测量值中的每个相应葡萄糖测量值包括:(i)血糖(BG)水平,以及(ii)表示在所述时间过程中所述相应葡萄糖测量值产生的时间的对应血糖时间戳,以及(c)获得第二数据集,所述第二数据集包括所述患者的胰岛素注射史,其中所述注射史包括在所述时间过程的整个或一部分期间的多次注射,对于所述多次注射中的每次相应注射包括:(i)对应的注射量,以及(ii)表示在所述时间过程中所述相应注射发生的时间的注射时间戳。
所述指令还包括以下步骤:(d)基于具有给定回顾水平线(RH)的血糖反应数据集获得用于回顾性胰岛素剂量预测的训练模型,(e)针对所述查询受试者的数据集进行数据优化,所述数据优化包括将查询受试者数据输入到所述训练模型中并获得所述查询受试者的至少一个重建胰岛素剂量的量,并且(f)提供药物剂量指导推荐,所述推荐是基于来自以下方面的数据计算的:第一数据结构、第一数据集、第二数据集以及针对所述查询受试者的至少一个重建胰岛素剂量的量。
已经描述了本发明的示例性实施方案的基本组成,将参考图2A和图2B来描述具体实施方案,其中流程图说明了当执行所存储的指令时如何接收和处理剂量指导请求(DGR)。每个给定功能中嵌入的功能的数量,功能的顺序和特定功能性(例如规则)都是示例性的。在示例性实施方案中,所描述的规则对应于来自Novo Nordisk A/S的Tresiba®的滴定标签推荐。
1.1 有效请求检查
该功能在上文有所描述,并检查剂量指导请求中必需的所有数据类型(即,客户端输入数据)是否存在并且在指定范围内。在请求缺少适当的数据的情况下,该功能将返回错误消息。否则,检查将传递数据。
对于给定的设置,可能需要附加输入数据来请求通过检查,例如“低血糖历史”,包括任何报告的降血糖事件,该降血糖事件具有时间戳、给定时间段内的最大基础限制(例如,每天或每周,请求时间(TOR))、单独剂量指导请求的唯一标识符以及客户端的唯一标识符。
1.2 最后注射数据刷新检查
该功能检查注射历史数据是否已在预定的时限内刷新,例如在最后30秒内,这是为了确保它具有注射历史数据的最新记录。
1.3 注射历史检查
该功能检查在过去8个小时内是否已经有剂量事件。如果有,则推荐再次注射会违反Tresiba标签(即,每天注射一次,并且间隔至少8小时),并且使用户处于降血糖事件的风险。如果在前8小时内没有剂量事件,则检查将会将数据传递到下一个功能。
1.4 补偿注射检查
Tresiba
Figure DEST_PATH_IMAGE005
标签规定用户应每天注射一次,并且间隔至少8小时。但是在患者忘记摄取每日剂量的情况下,除了定期安排的剂量(间隔至少8小时)之外,第二天还可以摄取被遗忘的剂量。相应地,该功能首先检查日历日内是否已经有剂量事件。如果有,则它会检查以查看前一个日历日是否没有剂量事件,并且如果是,则它将通过检查。如果从前一个日历日记录了剂量事件,则检查将返回错误消息,并且不给出剂量推荐。
1.5 记录的降血糖事件检查
该功能检查与请求一起接收的数据结构是否包括一个或多个记录的降血糖事件的指示符。如果在预设的时限内记录了一个或多个降血糖事件,则不会计算新的ADDR,但将用2UI的胰岛素将当前的DGB调低。降血糖事件可由患者手动记录和/或可在将CGM用于BG数据捕获时可以自动登记。在后一种情况下,可能会要求患者确认事件。
1.6 BG数据质量检查
在基于单独的BG测量提供BG数据(例如,空腹BG)的情况下,该功能将检查在指定数量的最近几天中的指定天数内是否记录有效BG值(例如,最后4天内至少有3个有效BG值)。在基于CGM测量提供了BG数据的情况下,可以执行CGM数据质量检查以确保数据中没有不可接受的间隙,这些间隙可能导致错误的滴定葡萄糖水平确定。下面描述CGM数据质量的不可接受水平的示例性标准。在数据质量不能够满足最小阈值的情况下,该此功能将返回错误消息,并且剂量指导请求将不会继续进行。另选地,有可能填充CGM数据内的间隙。这是为了增加尽管数据中存在间隙(例如,新传感器正在准备中),但剂量指导请求仍将通过下一次CGM数据质量检查的概率。合适的数学方法的示例将在下面更详细地描述。
1.7 剂量事件识别
在具有集成的剂量记录功能的笔装置(诸如NovoPen® 6)中,根据其使用说明,患者应该对该装置进行灌注直到他们看到胰岛素喷出。这些灌注“注射”(或“空气注射”)与笔的实际身体注射没有区别,并且将从引擎的角度看作摄入体内的单独注射。由于患者进行的实际注射次数是可以由剂量指导系统检查以确定患者是否依从滴定方案的参数之一,因此能够过滤出此类“灌注”注射是重要的。这种过滤可以在患者的智能手机应用程序中的剂量记载电路中进行(无论是集成在NovoPen® 6中集成还是作为安装在笔装置上的附加的记载装置来提供),该应用程序通常是适合于接收的装置并收集注射数据和BG数据,然后再将其作为对ADDR的请求的一部分或在云引擎中进行传输。过滤通常将基于剂量大小(灌注剂量通常比注射剂量小(更多))以及注射之间的时间。执行该分析的多个算法是已知的,例如,如US 2019/0035500中所公开的。过滤可以在不止一个的级别上实现,因为随后的过滤将只是什么也不过滤。相同的注意事项适用于“分次剂量”,即患者(通常)将其分为两次单独注射的大剂量,其应当组合为“剂量事件”,参见下文,以便不计数为两个单独剂量,这将危害基于剂量事件数量的滴定方案。
作为过滤的替代方式,并且根据本发明的一个方面,可以使用BG数据作为训练模型的输入来重建实际注射剂量的量,以获得BG测量值与胰岛素注射剂量的量之间的关系,这如上面和下面更详细地所述。
例如:非常接近(间隔5秒)的两个时间戳伴随有两个剂量,第一个剂量具有2 IU,第二个剂量具有20 IU。这是一种非常简单的情况,其中RHIDP(回顾水平线胰岛素剂量预测因素)模型在60分钟后校正胰岛素剂量迹线没有问题并正确显示患者仅对20 IU(例如Tresiba基础胰岛素)有反应-因此不是对22 IU有反应,从而正确地将2 IU的首次剂量识别为空气注射。作为安全检查,可以根据指定例如与记录的剂量的量或重建值的绝对大小的偏差量的规则来接受重建值。
一个更困难的示例:这次有三个时间戳,但仍然非常接近(间隔5秒),伴随有三个剂量:第一个剂量为15 IU,第二个剂量为7 IU,第三个剂量为15 IU。身体注射了多少
Figure 753887DEST_PATH_IMAGE001
RHIDP基于机器学习获得的BG迹线中的身体反应,或BG值下降或波动的程度,正确地预测身体注射30 IU。在这种情况下发生的情况是通常在一台笔式装置结束而另一台笔式装置启动时发生分次剂量。例如,NovoPen® 6从笔式装置进行第一次分配时具有7 IU的空气。因此,RHIDP模型正确地识别出身体未注射7 IU。
因此,从UI/UX或可见性角度来看。首先,向后60分钟,患者/用户在他们的胰岛素剂量日志中看到:15、7、15并且对于HCP/提供者或决策支持系统来说很难断定该时间戳事件使用的胰岛素剂量。在这里,RHIDP通过识别身体注射的且因此身体有反应的值为30 IU来帮助摆脱困难。因此,胰岛素剂量日志更新为30 IU,例如身体注射Tresiba基础胰岛素剂量和7 IU空气注射。该示例展示了分次剂量。
1.8 剂量事件检查
该功能是检查以查看患者是否已充分依从他/她的注射方案。自最近的ADDR以来,它至少查找3个剂量事件,并且它们已经在今天和直到前4个日历日窗口内发生。正在检查的这个额外日历日允许没有剂量的一天(例如,他/她忘记了),随后除了正常计划的剂量外,第二天也要摄取。如果在此时间范围内少于3个剂量事件(因为患者忘记了多天),则此检查将失败,这将导致重新推荐最近进行的ADDR。此外,在重复请求ADDR而没有进行任何注射的情况下,这将确保仅分配单个ADDR并且仅遵循重新推荐。
1.9 DGB检查
该功能检查以查看何时进行了最近的ADDR,或何时设置了起始基础剂量(SBD)值。如果最近的ADDR是在当前和之前的7个日历日内进行的,则检查通过。如果最近的ADDR早于此,则必须输入新的SBD量,并且必须从该新的点重新开始剂量指导请求过程。然后,新的SBD将被视为当前DGB。
1.10 依从性检查
该功能检查数据集中三个最近剂量事件的注射量,以确保它们各自至少等于或大于最近ADDR的量。如果任何剂量事件小于该量,则检查将失败,并将从最近的ADDR中重新推荐量。这确保了引擎不会因剂量不足导致的葡萄糖水平升高而增加滴定。
1.11 过多剂量检查
该功能检查在最后48小时内是否有超过两个剂量事件,这与违反Tresiba
Figure 936607DEST_PATH_IMAGE005
标签的推荐。
1.12 每日TGL确定
在基于单独的BG测量提供了BG数据(例如,空腹BG)的情况下,该功能将检查在指定的时间范围内是否记录了有效BG值。在基于CGM测量提供了BG数据的情况下,该功能会查看CGM数据集,并在可能的情况下确定自最近ADDR以来或直到最大天数(例如,从TOR起的4天)的每天的TGL,这是剂量指导周期。“天”可以是日历日(在这种情况下,某些天可能是不负的),也可以是从例如TOR计算的24小时周期,参见下文。这通过以下方式来完成:在CGM读数上应用例如3小时“滑动窗口”,此时为一个数据点,参见图2C和图2D,计算从当前时间直到最后剂量调整时间的每个3小时间隔的平均值。在示例性实施方案中,仅针对已经通过如下所述的BGH数据质量测试的几天确定每日TGL。每天的最低3小时平均值将记录为TGL值,并用于滴定。
1.13 每日TGL检查
该检查查找低于目标葡萄糖范围参数下限的任何每日TGL。如果是,则下一个ADDR比给定的最近ADDR减少2IU。如果不是,则检查传递到下一个功能。
1.14 平均TGL确定
如果在剂量指导周期(例如最后4天)内已经确定了至少最小数量的有效每日TGL值,例如2,则计算至少2个TGL值的平均值。
1.15 滴定确定
该功能利用总TGL平均值,如果其在目标范围内,则滴定确定将为从最近ADDR +0IU。如果TGL平均值高于目标范围的上限,则下一个ADDR从最近的ADDR增加2IU。如果TGL平均值低于目标范围的上限,则下一个ADDR从最近的ADDR下降2IU。
1.16 最大极限检查
为了防止剂量过量,该功能检查在给定时间段内的给定剂量最大值没有超过,例如在最后一周内Tresiba
Figure 981923DEST_PATH_IMAGE005
的最大值为300IU。患者特定值也可以包括在请求数据中。另选地,该功能可以检查下一个ADDR是否会超过患者的“过度基础化”极限(BW(kg)* OBL(IU/kg))。这将要求提供受试者的体重(BW)和受试者的过度基础化极限(OBL)作为随请求接收的数据的一部分。
1.17 输出
引擎对剂量指导请求的作为答复的主要输出确实是客户端接收到的ADDR,然而,附加信息可能对患者有用,直接与患者的治疗相关,例如引擎基于CGM值以及特定的错误或警告消息而计算出的TGL值,或者验证数据以提高可靠性和安全性。相应地,输出可以包括以下类型的数据中的一种或多种:用户ID、事务ID、ADDR、每日TGL、总TGL、剂量事件历史、低血糖记录、警告和错误代码。
**
转到图3A,结合图3A-3C描述了根据本公开的一个方面,用于针对受试者在处方胰岛素方案中进行数据质量控制的集成系统48的示例。
说明了此类数据的获取。集成系统48包括一支或多支连接的胰岛素笔104/一个或多个葡萄糖监测器102、存储器和用于进行对受试者的自主胰岛素注射数据的数据质量控制的处理器(未示出)。在一些实施方案中,葡萄糖监测器102是连续葡萄糖监测装置。在一些实施方案中,葡萄糖监测器102是自我监测葡萄糖装置。
现在将详细参考实施方案,其示例在附图中示出。在实施方式的以下详细描述中,阐述了许多具体细节以便提供对本发明的透彻的理解。然而,对于本领域的普通技术人员将显而易见的是,可以在没有这些具体细节的情况下实践本发明。
定义
在本公开中使用的术语仅出于描述特定实施方案的目的,而并非旨在限制本发明。如在本发明的描述和所附权利要求书中所用,单数形式的“一”,“一个”和“该”也旨在包括复数形式,除非上下文另外明确指出。还应理解,如本文所用,术语“和/或”是指并涵盖相关联的列出项目中的一个或多个项目的任何和全部可能的组合。将进一步理解的是,术语“包括”和/或“包含”当在本说明书中使用时指定所陈述的特征、整数、步骤、操作、元件和/或部件的存在,但是不排除存在或者添加一个或多个其他特征、整数、步骤、操作、元件、部件和/或它们的组。
如本文所用,术语“如果”可以被解释为意指“当……时”或“在……后”或“响应于确定”或“响应于检测”,这取决于上下文。类似地,短语“如果确定”或“如果检测到[陈述的条件或事件]”可以被解释为意指“在确定后”或“响应于确定”或“在检测到[陈述的条件或事件]后”或“响应于检测到[陈述的条件或事件]”,这取决于上下文。
术语“或”旨在表示包含性的“或”而不是排他性“或”。也就是说,除非另有说明或从上下文中清楚得知,否则短语“X采用A或B”旨在表示任何自然的包含性排列。也就是说,以下任何一种实例都满足短语“X采用A或B”:X采用A、X采用B、或者X采用A和B两者。另外,除非另有说明或从针对单数形式的上下文中清楚得知,否则本申请和所附权利要求书中所使用的冠词“一”和“一个”通常应解释为表示“一个或多个”。
还应理解,尽管术语第一、第二可以在本文中用于描述各种元件,但是这些元件不应受到这些术语的限制。这些术语仅用于区分一个元素和另一个元素。例如,在不脱离本公开的范围的情况下,第一滤波器可以被称为第二滤波器,并且类似地,第二滤波器可以被称为第一滤波器。第一个过滤器和第二个过滤器都是过滤器,但是它们不是同一过滤器。
术语“受试者”、“个体”和“用户”在本文中可互换使用,并且是指人类。优选地,个体是成年个体。
术语“多尿症”或“糖尿病”包括1型糖尿病、2型糖尿病、妊娠糖尿病(妊娠期间)和引起高血糖症的其他状态。该术语用于其中胰腺产生不足量的胰岛素,或其中人体的细胞对胰岛素没有适当反应从而阻止细胞吸收葡萄糖的代谢紊乱。结果,葡萄糖在血液中积聚,需要治疗以控制血糖水平。
根据本发明,基础胰岛素包括长效胰岛素和超长效胰岛素或由其组成。根据本发明,推注胰岛素包括短效和速效胰岛素或由其组成。原则上,胰岛素的半衰期越长,葡萄糖降低效果在给药间隔(即,注射之间的时间间隔)内越稳定和均匀地分布。基础胰岛素和推注胰岛素都可以用胰岛素笔施用于受试者。
术语胰岛素笔是指适合于施加离散剂量的胰岛素的注射装置,并且其中注射装置适于记录和传送与剂量有关的数据。
根据本发明,基础胰岛素和推注胰岛素都以在所述受试者中实现有益的血糖控制的量施用。根据本发明,所述受试者中有益的血糖控制至少由施用所述基础胰岛素或所述推注胰岛素后所述受试者中的HbA1c(糖基化血红蛋白)的水平确定。
如本文所用,术语“U”是指胰岛素(或其类似物或衍生物)的单位。后面带有数字的标号“U”指示浓度,如通过每ml流体体积的单位数所测量的(Joslin’s DiabetesDeskbook,第2版,Chapter 9 Using insulin to treat diabetes – generalprinciples,第268页)。关于“U”的含义的更多信息可见于标题为“Guideline on potencylabelling for insulin analogue containing products with particular referenceto the use of “International Units” or “Units””的EMA的文档(参考文献EMEA/CHMP/BWP/124446/2005)(参见http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500003654.pdf)。“IU”是指根据WHO生物学标准化专家委员会定义的人胰岛素国际单位。IU是标准化参数。对于市售胰岛素,标签指示1U(单位)特定胰岛素类似物的含量。
如本文所使用的,术语“药剂”是指用于受试者的医学治疗的化学物质。术语“药剂”、“药物”和“药品”在本文中可互换使用。所述药剂可以由医师或其他医疗保健提供者开处方。另选地,所述药剂可以是非处方药品或产品。在本公开的具体示例中,所述药剂是胰岛素,其用于治疗糖尿病。
描述
结合图1和图2描述了根据本公开的多个方面,用于针对受试者在处方胰岛素方案中进行数据质量控制的系统48的详细描述。因此,图1和图2共同说明了根据本公开的示例性系统的拓扑结构。在该拓扑结构中,存在用于自主提供作为受试者的处方胰岛素方案的一部分而收集的血糖数据和胰岛素剂量数据的数据质量检查的数据质量控制系统(“数据质量系统250”)(图1和图2),用于数据收集装置(“数据收集装置200”),与受试者相关联的一个或多个葡萄糖传感器102(图1和4),以及用于将胰岛素药剂注射到受试者体内的一支或多支胰岛素笔104(图1和4)。
在本公开全篇中,仅为了清楚的目的,将数据收集装置200和数据质量系统250称为单独的装置。即,如图3A所示,数据收集装置200的公开功能和数据质量系统250的公开功能包含在单独的装置中。然而,应当理解,实际上,在一些实施方案中,数据收集装置200的公开功能和数据质量系统250的公开功能包含在单个装置中。在一些实施方案中,数据收集装置200的公开功能和/或数据质量系统250的公开功能包含在单个装置中,并且该单个装置是葡萄糖监测器102或胰岛素笔104。
参考图3A,数据质量系统250自主地进行受试者的处方胰岛素方案中的胰岛素药剂剂量的数据质量控制验证。为此,与数据质量系统250电通信的数据收集装置200持续接收源自附接到受试者的一个或多个葡萄糖传感器102的自主葡萄糖测量值。在一些实施方案中,数据收集装置200还从受试者用于注射胰岛素药物的一个或多个胰岛素笔104接收胰岛素药物注射数据。在一些实施方案中,数据收集装置200直接从受试者使用的葡萄糖传感器102和胰岛素笔104接收这样的数据。例如,在一些实施方案中,数据收集装置200通过射频信号无线地接收该数据。在一些实施方案中,此类信号符合802.11(WiFi)、蓝牙或ZigBee标准。在一些实施方案中,数据收集装置200直接接收此类数据,分析数据,并且将经过分析的数据传递给数据质量系统250。在一些实施方案中,葡萄糖传感器102和/或胰岛素笔104包括RFID标签并且使用RFID通信与数据收集装置200和/或数据质量系统250通信。在一些实施方案中,数据收集装置200还获得或接收受试者的生理测量210(例如,从可穿戴的生理测量装置,从数据收集装置200内的测量装置,诸如磁力计或恒温器等)。对于本发明的一些实施方案,所述胰岛素笔装置是FlexPen®、FlexTouch®、NovoPen®或NovoPen Echo®。FlexPen®、FlexTouch®、NovoPen®和NovoPen Echo®是Novo Nordisk A/S的商标。
在一些实施方案中,数据收集装置200和/或数据质量系统250不靠近受试者并且/或者不具有无线能力,或者此类无线能力不用于采集葡萄糖数据、胰岛素药物注射数据和/或生理测量数据的目的。在此类实施方案中,通信网络106可以用于将葡萄糖测量值从葡萄糖传感器102传送到数据收集装置200和/或数据质量系统250,将胰岛素药剂注射数据从所述一支或多支胰岛素笔104传送到数据收集装置200和/或数据质量系统250,和/或将生理测量数据从一个或多个生理测量装置(未示出)传送到数据收集装置200和/或数据质量系统250。
网络106的示例包括但不限于万维网(WWW),内联网和/或无线网络,诸如蜂窝电话网络、无线局域网(LAN)和/或城域网(MAN)以及通过无线通信的其他装置。无线通信任选地使用多种通信标准、协议和技术中的任一种,包括但不限于全球移动通信系统(GSM)、增强型数据GSM环境(EDGE)、高速下行分组接入(HSDPA)、高速上行分组接入(HSUPA)、演进、仅数据(EV-DO)、HSPA、HSPA+、双小区HSPA(Dual-Cell HSPA) (DC-HSPDA)、长期演进(LTE)、近场通信(NFC)、宽带码分多址(W-CDMA)、码分多址(CDMA)、时分多址(TDMA)、蓝牙、无线保真(Wi-Fi)(例如,IEEE 802.11a、IEEE 802.11ac、IEEE 802.11ax、IEEE 802.11b、IEEE802.11g和/或IEEE 802.11n)、基于IP的语音传输(VoIP)、Wi-MAX、电子邮件协议(例如,互联网信息访问协议(IMAP)和/或邮局协议(POP))、即时消息(例如,可扩展消息与存在协议(XMPP)、针对即时消息和呈现业务的利用扩展的会话初始化协议(Session InitiationProtocol for Instant Messaging and Presence Leveraging Extensions) (SIMPLE)、即时消息和出席服务(IMPS)和/或短消息服务(SMS)或任何其他合适的通信协议,包括截至本公开内容的申请日尚未开发的通信协议。
在一些实施方案中,存在附接到受试者的单个葡萄糖传感器102,并且数据收集装置200和/或数据质量系统250是葡萄糖传感器102的一部分。即,在一些实施方案中,数据收集装置200和/或数据质量系统250和葡萄糖传感器102是单个装置。
在一些实施方案中,数据收集装置200和/或数据质量系统250是胰岛素笔的一部分。即,在一些实施方案中,数据收集装置200和/或数据质量系统250和胰岛素笔104是单个装置。
当然,系统48的其他拓扑结构是可能的。例如,一个或多个葡萄糖传感器102和一个或多个胰岛素笔104可以不依赖于通信网络106,而是直接将信息无线地传输到数据收集装置200和/或方案监测器装置250。此外,数据收集装置200和/或数据质量系统250可以构成便携式电子装置、服务器计算机,或者实际上构成在网络中链接在一起的若干计算机,或者是云计算上下文中的虚拟机。因此,图3A所示的示例性拓扑结构仅用于以本领域技术人员将容易理解的方式描述本公开的实施方案的特征。
虽然在图3A中公开的系统48可以独立工作,但在一些实施方案中,它也可以与电子病历链接,以便于以上述任何方式交换信息。
参照图3B和图3C,在典型实施方案中,数据质量系统250包括一台或多台计算机。在图3B和图3C中为了说明的目的,将数据质量系统250表示为单台计算机,其包括用于对来自受试者的数据集进行数据质量控制的所有功能。然而,本公开不限于此。在一些实施方案中,用于对来自受试者的数据集进行数据质量控制的功能分布在许多联网计算机上和/或驻留在若干联网计算机中的每一台上和/或托管在远程位置的通过通信网络106可访问的一台或多台虚拟机上。本领域的技术人员将理解,各种不同计算机拓扑结构中的任一种都可用于该应用,并且所有此类拓扑结构都在本公开的范围内。
在一些实施方案中,用于对来自受试者的数据集进行数据质量控制的示例性数据质量系统250包括一个或多个处理单元(CPU)202、网络或其他通信接口210、存储器214(例如,随机存取存储器)、一个或多个磁盘存储装置和/或持久性装置220(任选地由一个或多个控制器218访问)、一个或多个用于将上述部件互连的通信总线212和用于为上述部件供电的电源224。在一些实施方案中,使用诸如高速缓存之类的已知计算技术与非易失性存储器220无缝共享存储器214中的数据。在一些实施方案中,存储器214和/或存储器220包括相对于中央处理单元202远程定位的大容量存储装置。换句话说,存储在存储器214和/或存储器220中的一些数据实际上可以被托管在这样的计算机上:所述计算机在数据质量控制计算机系统250的外部,但是可以由数据质量控制计算机系统250利用网络接口210通过互联网、内联网或其他形式的网络或电子线缆(在图3A中示为元件106)进行电子访问。
在一些实施方案中,用于对来自受试者的数据集进行数据质量控制的数据质量系统250的存储器214存储:
●-操作系统204,该操作系统包括用于处理各种基本系统服务的程序;
●一个或多个训练集230,每个训练集(例如230-1)包括多个参考实体240,每个参考实体(例如240-1和240-C)包括:
o多个血糖史242,每个血糖史(例如242-1)包括该时间过程中受试者的多个葡萄糖测量值244,并且对于所述多个葡萄糖测量值(例如244-1-1和244-1-A)中的每个相应葡萄糖测量值而言,包括表示产生相应葡萄糖测量值的时间的时间戳246(例如246-1-1和246-1-A);以及
o多个胰岛素注射史260,每个胰岛素注射史(例如260-1)包括一个或多个胰岛素剂量的量262,并且对于所述一个或多个胰岛素剂量的量中的每个相应胰岛素剂量的量(例如262-1-1和262-1-B)而言,包括表示进行相应胰岛素注射的时间的时间戳264(例如264-1-1和264-1-B);
●一个或多个测试集270,每个测试集(例如270-1)包括多个测试实体272,每个测试实体(例如272-1和272-X)包括:
o多个血糖史242,每个血糖史(例如242-D)包括该时间过程中受试者的多个葡萄糖测量值244,并且对于所述多个葡萄糖测量值(例如244-D-1和244-D-Z)中的每个相应葡萄糖测量值而言,包括表示产生相应葡萄糖测量值的时间的时间戳246(例如246-D-1和246-D-Z);以及
o多个胰岛素注射史260,每个胰岛素注射史(例如260-E)包括一个或多个胰岛素剂量的量262,并且对于所述一个或多个胰岛素剂量的量中的每个相应胰岛素剂量的量(例如262-E-1和262-E-Y)而言,包括表示进行相应胰岛素注射的时间的时间戳264(例如264-E-1和264-E-Y);
●一个或多个模型282,其中每个训练模型(例如284-1和284-F)可以是一种或多种模型类型(例如回归模型类型,诸如线性回归模型、非线性回归模型、支持向量机、随机森林、Keras人工神经网络和/或梯度树增强模型)中的一种,并且其中每个训练模型284可以使用所述多个参考实体(例如240-1和240-C)进行训练并且可以使用所述多个测试实体(例如272-1和272-272-X)来验证每种训练模型284的有效性;和
●一个或多个受试者查询实体290,每个受试者查询实体(例如290-1和290-J)包括:
o多个血糖史242,每个血糖史(例如242-G)包括该时间过程中受试者的多个葡萄糖测量值244,并且对于所述多个葡萄糖测量值(例如244-G-1和244-G-W)中的每个相应葡萄糖测量值而言,包括表示产生相应葡萄糖测量值的时间的时间戳246(例如246-G-1和246-G-W);以及
o多个胰岛素注射史260,每个胰岛素注射史(例如260-H)包括一个或多个胰岛素剂量的量262,并且对于所述一个或多个胰岛素剂量的量中的每个相应胰岛素剂量的量(例如262-H-1和262-H-V)而言,包括表示进行相应胰岛素注射的时间的时间戳264(例如264-H-1和264-H-V)。
在一些实施方案中,数据质量控制模块250可在任何浏览器(电话机、平板电脑、膝上型电脑/台式电脑)内访问。在一些实施方案中,数据质量控制模块250在本地装置框架上运行,并且可用于下载到诸如Android或iOS的操作系统204上。
在一些实施方式中,用于对来自受试者的数据集进行数据质量控制的数据质量系统250的一个或多个以上标识的数据元件或模块存储在一个或多个先前描述的存储装置中,并且与一组用于进行上述功能的指令集相对应。以上标识的数据、模块或程序(例如,指令集)不需要被实现为单独的软件程序、过程或模块,并且因此,这些模块的各种子集可以在各种实施方式中被组合或以其他方式重新布置。在一些实施方式中,存储器214和/或220任选地存储以上标识的模块和数据结构的子集。此外,在一些实施方案中,存储器214和/或220存储以上未描述的附加模块和数据结构。
在一些实施方案中,用于对来自受试者的数据集进行数据质量控制的方案监测器装置250是智能电话(例如,iPhone)、膝上型计算机、平板计算机、台式计算机或其他形式的电子装置(例如,游戏机)。在一些实施方案中,数据质量系统250不是移动的。在一些实施方案中,数据质量系统250是移动的。在其他实施方案中,数据质量系统250不是智能电话,而是平板计算机、台式计算机、紧急车辆计算机或其他形式的有线或无线联网装置。在一些实施方案中,数据质量系统250具有在图2A和图2B中描绘的方案监测器装置250中找到的任何或全部电路、硬件部件和软件部件。为了简洁和清楚起见,仅示出了数据质量系统250的一些可能的部件,以便更好地强调安装在数据质量系统250上的附加软件模块。
数据质量系统250访问和/或存储所述一个或多个训练集230、所述一个或多个测试集270、所述一个或多个训练模型284和/或所述一个或多个受试者查询实体290。
在一些实施方案中,自动地测量葡萄糖测量244。ABBOTT的FREESTYLE LIBRE CGM(“LIBRE”)是可以用作葡萄糖传感器102以便进行受试者的自主葡萄糖测量的葡萄糖传感器的示例。LIBRE允许利用皮肤上硬币大小的传感器进行免标定葡萄糖测量,当靠近在一起时,该传感器可经由近场通信向读取器装置(例如,数据收集装置200和/或数据质量系统250)发送多达八小时的数据。LIBRE可在所有日常生活活动中佩戴十四天。
在一些实施方案中,由胰岛素药剂剂量方案指定的胰岛素药剂由作用持续时间在12至24小时之间的单一胰岛素药剂,或者共同作用持续时间在12至24小时之间的胰岛素药剂混合物组成。此类长效胰岛素药物的示例包括但不限于Insulin Degludec(由NOVONORDISK以商品名Tresiba开发),NPH(Schmid,2007, “New options in insulin therapy.J Pediatria (Rio J). 83(增刊5):S146–S155),Glargine(LANTUS,2007年3月2日,甘精胰岛素[rDNA起源]注射,[处方信息],Bridgewater, New Jersey: Sanofi-Aventis),以及Determir(Plank等人,2005, “A double-blind, randomized, dose-response studyinvestigating the pharmacodynamic and pharmacokinetic properties of the long-acting insulin analog detemir,” Diabetes Care 28:1107–1112)。
在一些实施方案中,所述多个葡萄糖测量值244(例如,一个或多个训练集230、一个或多个测试集270和/或一个或多个受试者查询实体290的一部分)限于在过去四小时、过去十二小时、过去24小时、过去两天、过去一周或过去两周内从受试者中得到的葡萄糖测量值。
现在已经公开了用于对来自受试者的数据集进行数据质量控制的系统48和系统250的细节,参考图4A和图4B公开了关于根据本公开的实施方案的系统的过程和特征的流程图的细节。
参考图4A中的方框302,本公开的目的是对来自受试者的数据集进行数据质量控制。在一些实施方案中,使用诸如数据收集装置200和数据质量系统250之类的装置来进行数据控制。如图3B和图3C所示,该装置包括一个或多个处理器202和存储器214/220。在一些实施方案中,根据受试者的请求进行数据质量控制。在一些实施方案中,根据医疗保健提供者的请求进行数据质量控制。在一些实施方案中,自动进行数据质量控制。在一些实施方案中,反复地自动进行数据质量控制。
参考图4A中的方框304,数据质量控制系统继续获得包括多个参考实体的训练集,其中所述多个参考实体包括多个参考胰岛素剂量史和多个参考血糖史,其中每个参考胰岛素剂量史与参考血糖史配对形成所述多个参考实体中的参考实体。
在一些实施方案中,所述多个参考胰岛素剂量史和所述多个参考血糖史来自于多个训练受试者。在一些实施方案中,所述多个受试者包括至少100个受试者、至少1,000个受试者、至少5,000个受试者、至少10,000个受试者、至少50,000个受试者或至少100,000个受试者。在一些实施方案中,每个训练受试者提供一个参考胰岛素剂量史和一个参考血糖史。在一些实施方案中,每个训练受试者提供一个以上的参考剂量史和一个以上的参考血糖史。
在一些实施方案中,所述多个参考胰岛素剂量史和所述多个参考血糖史来自于单个训练受试者。在一些实施方案中,单个训练受试者提供一个参考胰岛素剂量史和一个参考血糖史。在一些实施方案中,单个训练受试者提供一个以上的参考剂量史和一个以上的参考血糖史。
参考图4A中的方框310,数据质量控制系统继续对于所述多个参考实体中的每个相应参考实体,(i)从对应血糖史中获得相应时间过程中每个时间点的血糖测量值,以及(ii)从对应的参考胰岛素剂量史中获得相应时间过程中相应时间点子集中每个时间点的胰岛素剂量的量,其中所述多个参考实体中的每个相应参考实体提供针对所述相应时间过程的多个参考血糖测量值,其中所述多个参考血糖测量值是预定类型的血糖测量值,并且所述多个参考实体中的每个相应参考实体提供在相应时间点子集中的一个或多个参考胰岛素剂量的量,其中所述一个或多个参考胰岛素剂量的量是预定类型的胰岛素剂量。
在一些实施方案中,预定类型的血糖测量值是连续葡萄糖监测数据。在一些实施方案中,预定类型的血糖测量值是血糖自我监测数据。在一些实施方案中,预定类型的胰岛素剂量包括一个或多个推注胰岛素剂量事件。在一些实施方案中,预定类型的胰岛素剂量包括一个或多个基础胰岛素剂量事件。在一些实施方案中,相应时间过程选自20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟或100-120分钟的集合。
参考图4B中的方框320,数据质量控制系统继续获得包括多个测试实体的测试集,其中所述多个测试实体包括多个测试胰岛素剂量史和多个测试血糖史,其中每个测试胰岛素剂量史与测试血糖史配对形成所述多个测试实体中的测试实体,其中每个相应测试血糖史提供多个血糖测量值,并且其中每个相应测试胰岛素剂量史提供一个或多个测试胰岛素剂量的量,其中所述一个或多个测试胰岛素剂量的量是预定类型的胰岛素剂量。
参考图4B中的方框322,数据质量控制系统继续在整个训练集中使用所述相应时间过程的所述多个参考血糖测量值和所述至少一个参考胰岛素剂量的量来训练模型,从而获得训练模型。
在一些实施方案中,所述模型是选自由以下组成的组的回归模型:线性回归模型、非线性回归模型、支持向量机、随机森林、Keras人工神经网络和梯度树提升模型。在一些实施方案中,所述模型是分类器模型或集成模型。在一些实施方案中,所述模型是监督学习模型、非监督学习模型、半监督学习模型或强化学习模型。在一些实施方案中,所述模型类型选自最近邻、朴素贝叶斯(naïve Bayes)、决策树、线性回归、支持向量机、神经网络、k均值聚类、q学习、时间差分和深度对抗网络的集合。
参考图4B中的方框326,数据质量控制系统继续将所述多个测试血糖史输入到所述训练模型中,从而获得所述测试集的一个或多个训练模型输出值,其中所述一个或多个训练输出值包括所述测试集的一个或多个重建胰岛素剂量的量。
在一些实施方案中,重建胰岛素剂量的量(例如,基于血糖测量值预测的已实际身体注射的胰岛素剂量的量)为正整数。在一些实施方案中,重建胰岛素剂量的量用浮点数表示。在一些实施方案中,预测结果指标在0 IU至5 IU、0 IU至10 IU、0 IU至25 IU、0 IU至50IU、0 IU至100 IU、0 IU至150 IU、0 IU至200 IU和0 IU至250 IU的集合中。
在一些实施方案中,数据质量系统还提供一个或多个模型性能指标。在一些实施方案中,这一个或多个模型性能指标包括均方根误差、平均绝对误差、可释方差值或准确性分数。
在一些实施方案中,第一主要性能指标是“准确性”分数,其实际上是预测的决定系数或r平方(r^2)。该准确性指标越接近最大值“1”,则该模型越能更好地根据基于反应的BG曲线预报身体注射的胰岛素剂量的量。
公式:“准确性”分数或决定系数(r平方):
Figure DEST_PATH_IMAGE006
准确性分数是提供有关模型拟合优度的信息的统计值。在回归中,r平方决定系数是回归预测对真实数据点的近似程度的统计量度。r平方值为“1”表示回归预测完全符合该数据。r平方系数定义为(1- u/v),其中u是残差平方和(例如∑(y – y´)2),而v是总平方和(例如∑(y - )2)。可能的最高分数是1.0,并且分数可为负(因为模型可能任意地更差)。
在一些实施方案中,第二主要性能指标是均方根误差(RMSE)。该误差指标越小,该模型越能更好地从给定的血糖测量值预报身体注射的胰岛素剂量的量。
公式:均方根误差(RMSE):
Figure 173870DEST_PATH_IMAGE002
=
Figure 253822DEST_PATH_IMAGE003
.
均方根误差(RMSE)或均方根偏差(RMSD)是由模型或估计者预测的值(样本和群体值)与实际观察到的值之间的差异的常用量度。RMSE表示预测值与观察值之间差异的样本标准偏差。当对用于估计的数据样本进行计算时,这些个体差异称为残差,而当计算样本外时,这些个体差异称为预测误差。RMSE用于将不同时间的预测误差大小聚集形成单个预测能力量度。RMSE是准确性的一种量度,用于比较针对特定数据而不是数据集之间不同模型的预报误差,因为它与比例有关。每个误差对RMSE的影响与平方误差的大小成正比。因此,较大的预测误差(例如,与期望值有很大不同的预测胰岛素注射量)对RMSE具有不成比例的较大影响。因此,RMSE对离群值非常敏感。对RMSE和r平方预测指标两者的计算提供了有关训练模型准确性的明确信息。
参考图4B中的方框330,数据质量控制系统继续从所述查询受试者的数据集中获得相应时间过程中的多个查询受试者血糖测量值以及相应时间点子集中的至少一个查询受试者胰岛素剂量的量。在一些实施方案中,该系统还包括获得数据集并将每个数据集从所述多个查询受试者输入到训练模型中。
在一些实施方案中,数据质量控制系统同时执行针对所述多个受试者的数据质量控制请求。在一些实施方案中,所述多个受试者包括至少100个受试者、至少1,000个受试者、至少5,000个受试者、至少10,000个受试者、至少50,000个受试者或至少100,000个受试者。
参考图4B中的方框332,数据质量控制系统继续将所述多个查询受试者血糖测量值输入到训练模型中,从而获得针对查询受试者的一个或多个查询模型输出值,其中针对查询受试者的所述一个或多个查询输出值包括针对查询受试者的一个或多个重建胰岛素剂量的量。在一些实施方案中,每个受试者都患有糖尿病病状。
在一些实施方案中,该糖尿病病状是2型糖尿病。在一些实施方案中,药物剂量指导请求是针对胰岛素药剂的剂量,其中胰岛素药剂的剂量应达到要治疗糖尿病的受试者的预定血糖目标范围。
根据本公开,在一些实施方案中,以在受试者中实现有益的血糖控制的量施用基础胰岛素药剂。在一些实施方案中,实现有益的血糖控制的预定血糖目标范围为50-180mg/dL、60-180mg/dL、70-180mg/dL、80-180mg/dL、50-200mg/dL、60-200mg/dL、70-200mg/dL、80-200mg/dL、50-250mg/dL、60-250mg/dL、70-250mg/dL或80-250mg/dL。
在一些实施方案中,本公开的胰岛素药剂用于治疗至少5岁、至少10岁、至少11岁、至少12岁、至少13岁、至少14岁、至少15岁、至少16岁、至少17岁、至少18岁、至少19岁或至少20岁的受试者。
在一些实施方案中,本公开的胰岛素药剂用于治疗体重指数不大于32 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数不大于34 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数不大于35 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数不大于36 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数不大于37 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数不大于38 kg/m2的受试者。
在一些实施方案中,本公开用于治疗体重指数为约25 kg/m2的受试者。在一些实施方案中,本公开用于治疗体重指数在20 kg/m2至30 kg/m2之间的受试者。
在一些实施方案中,本发明用于治疗患有糖尿病至少1年、至少5年、至少7年、至少9年或至少11年的受试者。
在一些实施方案中,本公开在治疗数周后达到不超过7%的受试者的基线HbA1c水平。在一些实施方案中,本公开在治疗10至40周后、治疗15至30周后、或治疗20至28周后、或治疗26周后达到不超过7%的受试者的基线HbA1c水平。在一些实施方案中,本公开在治疗数周后达到不超过6%、不超过7%或不超过8%的受试者的基线HbA1c水平。在一些实施方案中,本公开在治疗10至40周后、治疗15至30周后、或治疗20至28周后、或治疗26周后达到不超过6%、不超过7%或不超过8%的受试者的基线HbA1c水平。
在一些实施方案中,所述药剂包括通过注射(诸如通过使用胰岛素笔装置104)递送的胰岛素。在一些实施方案中,所述药剂是LysB29(Nc-十六烷二酰基-y-Glu)des(B30)人胰岛素(德谷胰岛素,Tresiba®)。
在一些实施方案中,基础胰岛素包括长效胰岛素或超长效胰岛素或由其组成。
在一些实施方案中,所述药剂包括“长效胰岛素”,其还:
(a) 导致受试者在24小时周期内平均胰岛素浓度(AUCF%)的最大偏差≤±20,例如≤±18、≤±17、≤±16、≤±15、≤±14、≤±13、≤±12、≤±11、≤±10、≤±9、≤±8、≤±7、≤±6、≤±5、≤±4、≤±3、≤±2、≤±1、≤±0.5、≤±0.1。
在一些实施方案中,所述药剂包括“长效胰岛素”,其包括天然存在的胰岛素的衍生物或类似物,所述衍生物或类似物:
(a) 在生理条件下至少部分地表现出天然存在的胰岛素的胰岛素受体结合,优选地为天然存在的胰岛素的胰岛素受体结合的至少0.01%,例如天然存在的胰岛素的胰岛素受体结合的至少0.1%、至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少50%、至少65%、至少75%、至少85%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%或至少150%,和/或至少部分地表现出天然存在的胰岛素的效力,优选地为天然存在的胰岛素的效力的至少25%,例如天然存在的胰岛素的效力的至少50%、至少65%、至少75%、至少85%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%或至少150%;并且
(b) 皮下注射时,在生理条件下表现出至少18小时的平均终末半衰期,例如,大于18小时、至少20小时、大于20小时、大于22小时、至少22.5小时、或大于24小时、至少25小时、至少27.5小时、至少30小时、至少32.5、至少35小时、至少37.5小时、或至少40小时、或介于18至40小时之间、介于20至40小时之间、介于24至40小时之间。
在一些实施方案中,所述药剂包括“长效胰岛素”,其还:
(c) 导致受试者在24小时周期内平均胰岛素浓度(AUCF%)的最大偏差≤±20,例如≤±18、≤±17、≤±16、≤±15、≤±14、≤±13、≤±12、≤±11、≤±10、≤±9、≤±8、≤±7、≤±6、≤±5、≤±4、≤±3、≤±2、≤±1、≤±0.5、≤±0.1。
原则上,胰岛素的半衰期越长,葡萄糖降低效果在给药间隔(即,注射之间的时间间隔)内越稳定和均匀地分布。
在一些实施方案中,所述药剂包括天然存在的胰岛素的衍生物或类似物,所述衍生物或类似物:
(a)在生理条件下至少部分地表现出天然存在的胰岛素的胰岛素受体结合,优选地为天然存在的胰岛素的胰岛素受体结合的至少0.01%,例如天然存在的胰岛素的胰岛素受体结合的至少0.1%、至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少50%、至少65%、至少75%、至少85%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%或至少150%,和/或至少部分地表现出天然存在的胰岛素的效力,优选地为天然存在的胰岛素的效力的至少25%,例如天然存在的胰岛素的效力的至少50%、至少65%、至少75%、至少85%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%或至少150%;并且
(b)在例如皮下注射时,在生理条件下,表现出至少5小时且小于18小时的平均终末半衰期,例如至少7小时、至少8小时、至少10小时、至少12.5小时、大于12.5小时、至少15小时或至少17.5小时和小于18小时、介于5小时和17.5小时之间、介于10小时和17.5小时之间或介于15小时和17.5小时之间。
在一些实施方案中,所述药剂由作用持续时间在12至24小时之间的单一胰岛素药剂,或共同作用持续时间在12至24小时之间的胰岛素药剂混合物组成。此类胰岛素药剂的实例包括但不限于:德谷胰岛素(由NOVO NORDISK开发,商品名为Tresiba®)、NPH(Schmid,2007, “New options in insulin therapy,” J Pediatria (Rio J). 83(增刊5): S146–S155)、甘精胰岛素(LANTUS, 2007年3月2日)、甘精胰岛素注射液(Dunn等人2003, “AnUpdated Review of its Use in the Management of Diabetes Mellitus” Drugs 63:第1743页)和地特胰岛素(Plank等人, 2005, “A double-blind, randomized, dose-response study investigating the pharmacodynamic and pharmacokineticproperties of the long-acting insulin analog detemir,” Diabetes Care 28:1107–1112),其每一个特此通过引用并入。
回到图1,说明了用于向受试者提供经调整的日剂量推荐的示例方法400(例如在电子装置处进行)。在一些实施方案中,当先前未向受试者提供调整的日剂量推荐时,进行图1的方法。在一些实施方案中,进行图1的方法以提供对先前提供的调整日剂量推荐的重新推荐。在一些实施方案中,在提供一个或多个先前的调整日剂量推荐之后,进行图1的方法以提供更新的调整日剂量推荐。
参考图1,利用数据收集和分析集成系统48,获得了受试者的带时间戳的自主胰岛素注射404和血糖测量值402。另外,在一些实施方案中,来自所述一支或多支胰岛素笔104的数据作为多个记录被获得404,该胰岛素笔用于将处方胰岛素方案施加于受试者。每个记录包括有时间戳的事件,该事件指定受试者接受作为处方胰岛素药剂剂量方案的一部分的注射胰岛素药剂的量。在一些实施方案中,对葡萄糖测量值402(,例如,构成血糖史410的所述多个血糖测量值)进行质量评估,并且在必要时计算重建血糖史。血糖史410或重建血糖史和胰岛素注射史404存储在非暂时性存储器202中。存储器202还包括指令,所述指令在由所述一个或多个处理器执行时响应于接收到数据质量检查请求进行一种方法。这样,分析葡萄糖数据和注射史数据406。数据质量检查406基于血糖史410和注射史404重建胰岛素注射剂量。在一些实施方案中,这些重建的胰岛素注射剂量用于产生重建的胰岛素注射剂量408,连同关于受试者的其他数据(例如,受试者参数412和/或剂量指导基线418)一起,可用于提供药物剂量指导推荐。I
图5说明了导入血糖测量数据的示例。每个血糖数据点包括血糖测量值和时间戳,该时间戳表示在所述时间过程中相应血糖测量值产生的时间。在一些实施方案中,将血糖测量值402(这里是连续的血糖监测数据)输入到存储器(例如,“输入数组CGM”)中,并且计算血糖测量值之间的差,例如“输入数组RHIDP = np.diff(输入数组CGM)”。
在一些实施方案中,血糖数据点的集合包括至少2个血糖测量值、至少4个血糖测量值、至少5个血糖测量值、至少7个血糖测量值、至少10个血糖测量值、至少13个血糖测量值、至少15个血糖测量值、至少20个血糖测量值、至少30个血糖测量值、至少50个血糖测量值、至少100个血糖测量值、至少250个血糖测量值、至少300个血糖测量值或至少500血糖测量值。在一些实施方案中,针对所述血糖数据点集合的相应时间过程中的每个时间点发生在紧接前一时间点之后最多30秒,紧接前一时间点之后最多1分钟,紧接前一时间点之后最多5分钟,紧接前一时间点之后最多10分钟,紧接前一时间点之后最多30分钟,紧接前一时间点之后最多1小时,紧接前一时间点之后最多6小时,紧接前一时间点之后最多12小时,或紧接前一时间点之后最多24小时。在一些实施方案中,血糖史还包括关于进餐、运动或可能影响血糖水平的其他变量的信息。
在一些实施方案中,受试者的胰岛素注射史中的胰岛素剂量时间戳(例如预定义时间点)用于确定适当的时间过程(例如,紧接在预定义时间段之前的时间点的子集)以评价血糖测量数据。
访问数据后,可由数据质量控制系统进行多个过程。如以下实施例中所示,可以训练多种模型类型,并且可以计算多种性能指标以提供最准确的预测胰岛素注射剂量。
实施例
实施例1:训练不同的模型类型
参考图6A、图6B、图6C、图6D、图6E、图6F、图6G、图6H、图6I、图6J、图6K和图6L,示出了数据预处理的示例。数据至少包括多个葡萄糖测量值(例如葡萄糖史)。在一些实施方案中,数据还包括一次或多次胰岛素注射(例如胰岛素注射史)。在一些实施方案中,数据来自一个受试者。在一些实施方案中,数据来自多个受试者,其中每个受试者的每个数据包括至少一个葡萄糖史和至少一个胰岛素注射史。
在一些实施方案中,需要数据预处理以转换从葡萄糖传感器102和胰岛素笔104和/或从数据收集装置200接收的数据。即使在数据质量系统250进行数据质量控制检查之前,所收集的患者数据也可以变换(例如,将数据转换成更有用的数据和/或去除不需要的数据)。
在一些实施方案中,数据质量系统250本身变换原始数据。在其他实施方案中,数据收集装置200任选地变换受试者原始数据。
参考图6A和图6G,在一些实施方案中,第一步是访问原始数据。在图6A中,示出了访问原始数据文件“Doses.csv”以获取临床试验的胰岛素剂量数据的示例。参考图6B和图6H,在一些实施方案中,第二步是导入所需的软件库以进行必要的计算和变换。在这里的示例中,所需的软件库是Python库。参考图6C和图6I,在一些实施方案中,任选的第三步是查看未处理的原始数据(例如了解数据表的外观以及变换原始数据进行进一步分析所需的内容)。参考图6D和图6J,在一些实施方案中,第四步是仅选择所需数据。例如,在图6D中,仅选择基础胰岛素事件(而不是推注胰岛素事件)的数据,并且在图6J中,仅选择来自连续葡萄糖监测的数据(例如,而不是自我监测血糖数据)。在一些实施方案中,步骤4还包括删除重复记录,按受试者(例如,如果数据来源于一个以上的受试者)和/或时间戳对值进行排序,添加新列(例如“日”和/或“时间”)以便更容易地进行数据清理和/或探索性数据分析,去除不需要的列,并重新组织列(例如,重新组织成视觉上可以理解的格式以向受试者展示)。参考图6E和图6K中,这些示出了已变换为经过清理、预处理是数据的受试者数据的示例。一旦清理了数据,就将其存储以保存记录,并为进一步的数据处理和分析作准备(参见图6F和图6L)。
图6A、图6B、图6C、图6D、图6E和图6F共同示出了预处理受试者胰岛素注射史数据的示例。图6G、图6H、图6I、图6J、图6K和图6L共同示出了预处理受试者血糖史数据的示例。在一些实施方案中,仅预处理来自一个受试者的数据。在一些实施方案中,同时预处理来自多个受试者的数据。
参考图7A、图7B、图7C、图7D、图7E、图7F、图7G、图7H、图7I和图7J,这些图示出了数据预处理的示例。在一些实施方案中,数据预处理包括将经过预处理的胰岛素注射史数据(例如胰岛素数据集)和经过预处理的血糖史数据(例如CGM数据集)合并。在一些实施方案中,当已经同时预处理了来自一个以上受试者的数据时,数据处理将按受试者组织数据。在一些实施方案中,数据处理产生四个数据集。在一些实施方案中,这些数据集至少包括葡萄糖测量值的训练数据集(例如X_训练,训练自变量)、胰岛素剂量的量的训练数据集(例如Y_训练,训练因变量)、葡萄糖测量值的测试数据集(例如X_测试,测试自变量)、胰岛素剂量的量的测试数据集(例如Y_测试,测试因变量)。
参考图7A,在一些实施方案中,第一步涉及访问经过预处理的数据。第二步涉及导入必要的库,如图7B所示。在一些实施方案中,这些库与用于数据预处理的库相同,如图6B所示。数据处理的第三步涉及导入经过预处理的数据(例如读取经过预处理的数据)。在一些实施方案中,所述预处理使用双嵌套循环:1)处理胰岛素数据集的所有受试者,以及2)在每个受试者内,遍历所有胰岛素剂量事件的时间戳进行处理。在这个二级步骤中,在每个受试者的胰岛素剂量事件的每个时间戳,都将采取以下数据变换步骤:
1.将CGM数据集分为子集以选择一个受试者的数据。
2.将胰岛素数据集分为子集以选择一个受试者的对应胰岛素数据。
3.从CGM数据集的第一个胰岛素给药事件时间戳的分为子集的胰岛素数据集的初始时间点中选择60分钟(例如回顾水平线)的数据。
4.对于每个受试者,跳过后面60分钟没有对应CGM或葡萄糖数据的胰岛素剂量时间戳。
5.将数据表转换为时间数列表以进行重采样。
6.重采样通过重建索引为每3分钟并尽可能与原始数据集的5分钟CGM分辨率配准来进行。
7.将线性插值应用于数据集,并进行回填以填补因重采样产生的任何间隙。在一些实施方案中,这些间隙是所提供的数据中的时间间隙,其是没有记录数据的1分钟、2分钟、5分钟、10分钟、15分钟、20分钟或30分钟的间隔。
8.计算十二个值,其中每个值是子集CGM数据集中两个时间上相邻的时间点之间的差(CGM数据集应含有十三个血糖测量值,对应于紧接在注射胰岛素后60分钟内每五分钟所做的记录)。在一些实施方案中,当紧接在胰岛素注射之后的时间过程包括不同的时间段(例如15分钟、30分钟、45分钟、50分钟或90分钟)时和/或当以不同的时间间隔(例如,每30秒、每1分钟、每2分钟、每10分钟、每30分钟或每小时)记录血糖测量值时,计算出的CGM差值的对应数量将有所不同。
9.将CGM差的这十二个浮点值(正值和负值)本身针对每个受试者的每个胰岛素剂量事件的时间戳转换为一个数组。
10.对于每个受试者,针对每个适当的时间过程,将计算出的CGM差的所有此类数组汇编为一个数组。
因此,数据处理将输入的数据表变换为由列表的列表组成的数组。这种由列表的列表组成的数组中的值对应于自变(例如X)值。
在一些实施方案中,数据处理进行到第四步以生成因(例如Y)变量。这种自动化功能应用双嵌套循环:1)处理胰岛素数据集的所有受试者,然后2)在每个受试者内,处理胰岛素剂量事件的所有时间戳。在这个二级步骤中,在每个受试者的胰岛素剂量事件的每个时间戳,都将采取以下数据变换步骤:
1.将CGM数据集分为子集以选择一个受试者的数据。
2.将胰岛素数据集分为子集以选择一个受试者的对应胰岛素数据。
3.从CGM数据集的第一个胰岛素给药事件时间戳的分为子集的胰岛素数据集的初始时间点中选择60分钟(例如回顾水平线)的数据。在一些实施方案中,这种回顾水平线时间过程为20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟、100-120分钟、110-130分钟、120-140分钟、36小时或24-48小时。
4.对于每个受试者,跳过后面60分钟没有对应CGM或葡萄糖数据的胰岛素剂量时间戳。
5.从这个最终的子集胰岛素数据集中,仅将胰岛素剂量(例如胰岛素注射剂量的量)列的值提取到列表中。这里期望一个整数。
6.对于每个受试者,针对每个适当的时间过程中,将所有胰岛素注射剂量的量汇编成列表的列表。由于来自步骤5的列表对于胰岛素剂量单位的量应该始终只是一个整数,因此这基本上就变成了对应胰岛素剂量的量的单位数的列表。
因此,数据处理已将输入的胰岛素数据集变换为因变(例如Y)值的列表的列表组成的数组。
此时,所有自变值和因变值都汇编成相应的数据表(每个数据点保留有关其相应受试者和相应时间过程的信息)。为继续进行训练模型,必须将数据分割为训练和测试数据表(图7J)。
在该示例中,将随机选择的70%的数据表指定为训练集,并将其余30%的数据表指定为测试集。在其他实施方案中,训练集可以是原数据表的60%、原数据表的50%或原数据表的40%。
参考图8A和图8B,模型训练继续进行数据优化。现在可以将上述训练和测试数据集用于训练和验证不同的机器学习模型。在一些实施方案中,这些模型是回归模型、分类模型或集成模型。数据优化模块应用手动和自动两种方法比较、对比、验证,以选择具有优化参数的最佳性能模型。
参考图9A、图9B、图9C、图9D、图9E、图9F和图9G,数据可用于训练随机森林回归模型。请注意,将随机_状态变量设置为42是为了研究目的而启用可再现模型(例如重新运行这种机器学习训练步骤每次将会产生具有相同权重和拓扑结构的模型)。在该实施方案中,选择500个决策树(n_估计参数)。在其他实施方案中,用于随机森林回归模型的树的数目可以选自50、100、150、175、200、250、300、400和1000个树的集合)。
在一些实施方案中,本文描述的随机森林回归模型和其他模型需要大量计算资源(例如>1MB、>5MB、>50MB、>500MB、>1GB或>5GB或随机存取存储器)。在一些实施方案中,为了便于处理大量数据和训练模型,该示例中描述的过程可以在分布式、并行化计算系统上(例如,使用Amazon Web Services上的Hadoop、MapReduce和Spark)或在本地服务器上进行。
在训练了随机森林回归模型之后,可以计算多个性能指标。这些指标可包括训练集的“准确性分数”或r平方指标、“准确性分数”或r平方指标、均方根误差(RMSE)指标和解释方差分数(EVS)指标等。
参考图10A、图10B、图10C、图10D、图10E、图10F和图10G,相同的数据也可用于训练Keras人工神经网络回归模型。在该实施方案中,人工神经网络具有九个隐藏层。在一些实施方案中,人工神经网络可以具有多达1个隐藏层、多达2个隐藏层、多达3个隐藏层、多达4个隐藏层、多达5个隐藏层、多达10个隐藏层、多达15个隐藏层、多达20个隐藏层、多达25个隐藏层或多达50个隐藏层。
在训练了Keras神经网络回归模型之后,可以计算多个性能指标。这些指标可包括训练集的“准确性分数”或r平方指标、“准确性分数”或r平方指标、均方根误差(RMSE)指标、平均绝对误差(MAE)指标和解释方差分数(EVS)指标等。
参考图11A、图11B、图11C、图11D、图11E和图11F,相同的数据也可用于训练支持向量机回归模型。在训练了支持向量机回归器之后,可以计算多个性能指标。这些指标可包括训练集的“准确性分数”或r平方指标、“准确性分数”或r平方指标、均方根误差(RMSE)指标和平均绝对误差(MAE)指标等。
参考图12A、图12B、图12C、图12D、图12E和图12F,相同的数据也可用于梯度树提回归模型。在训练了梯度树推升回归模型之后,可以计算多个性能指标。这些指标可包括训练集的“准确性分数”或r平方指标、“准确性分数”或r平方指标、平均绝对误差(MAE)指标和解释方差分数(EVS)指标等。
下表1中示出了这里训练的每个模型的准确性分数和指标。
表1:经过训练的回归模型的性能。
Figure DEST_PATH_IMAGE007
总的来说,这里训练的模型实现了高准确性和相对较小的误差,特别是随机森林(RF:在约1 IU误差下的测试准确性性能为99.90%)和神经网络(DCNN:在约9 IU误差下的测试准确性性能为94.25%)回归模型。
这里概述的方法的优势在于,训练多种类型的模型可提供在任何时间点选择性能最佳的模型的选项。在其他实施方案中,可以并入其他过滤功能以确保适当地分析数据并且确保胰岛素注射预测落入合理范围(例如,生理上合理的范围)内。
参考文献和其他实施方案
本文中引用的全部参考文献均以引用方式全文并入本文,并且出于所有目的,其程度如同每个单独的公布或专利或专利申请被具体和单独地指示成出于所有目的而以引用方式全文并入。
所有标题和子标题在本文中仅为了方便而被使用,并且不应当被解释为以任何方式限制本发明。
除非另外声明,否则本文提供的任何和所有示例或示例性语言(例如,“诸如”)的使用仅旨在更好地说明本发明,而不是对本发明的范围进行限制。本说明书中的任何语言都不应被视为表明任何未声明的要素对于本发明的实践是必不可少的。
本文中引用和并入专利文献仅是为了方便,并不反映这样的专利文献的有效性、可专利性和/或可执行性的任何观点。
本发明可被实现为计算机程序产品,其包括嵌入非瞬态计算机可读存储介质中的计算机程序机构。例如,计算机程序产品可包含以图3A-3C的任何组合示出和/或在图1中描述的程序模块。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品、USB密钥或任何其他非瞬态计算机可读数据或程序存储产品中。
如对于本领域技术人员而言显而易见的那样,在不脱离本发明的实质和范围的情况下,可对本发明进行许多修改和变化。本文所述的具体实施方案仅作为实例提供。选择和描述上述实施方案是为了最好地解释本发明的原理及其实际应用,从而使本领域的其他技术人员能够通过适于所设想的特定用途的各种修改最好地利用本发明和各种实施方案。本发明仅受所附权利要求的条款以及这些权利要求所赋予的等同物的全部范围的限制。

Claims (14)

1.一种用于为要治疗糖尿病的查询受试者提供药物剂量指导推荐的计算系统(48),其中所述系统包括一个或多个处理器和一个存储器,所述存储器包括:
-指令,所述指令当由所述一个或多个处理器执行时,执行响应于接收到剂量指导请求的方法,所述指令包括以下步骤:
a) 获得包含查询受试者参数的数据结构(412),
b) 获得第一数据集,所述第一数据集包括在一定时间过程内得到的所述查询受试者的多个葡萄糖测量值(402),并从而建立血糖史(BGH),所述多个葡萄糖测量值中的每个相应葡萄糖测量值包括:
(i)血糖(BG)水平,以及
(ii)表示在所述时间过程中所述相应葡萄糖测量值产生的时间的对应血糖时间戳,
c) 获得第二数据集,所述第二数据集包括所述查询受试者的胰岛素注射史(404),其中所述注射史包括在所述时间过程的整个或一部分期间的多次注射,并且所述多次注射中的每次相应注射包括:
(i)对应的注射量,以及
(ii)表示在所述时间过程中所述相应注射发生的时间的注射时间戳,
d) 基于具有给定回顾水平线(RH)的血糖反应数据集获得用于回顾性胰岛素剂量预测的训练模型,
e) 针对所述查询受试者的所述数据集进行数据优化(406),所述数据优化包括将查询受试者数据输入到所述训练模型中并获得所述查询受试者的至少一个重建胰岛素剂量的量(408),并且
f) 提供药物剂量指导推荐(416),所述推荐是基于来自以下方面的数据计算的:第一数据结构、第一数据集、第二数据集以及针对所述查询受试者的至少一个重建胰岛素剂量的量。
2. 如权利要求1所述的计算系统,其中进行数据优化的所述步骤包括:
-从所述查询受试者的所述数据集中获得相应时间过程中的多个查询受试者血糖测量值以及相应时间点子集中的至少一个查询受试者胰岛素剂量的量,并且
-将所述多个查询受试者血糖测量值输入到所述训练模型中,从而获得针对所述查询受试者的一个或多个查询模型输出值,其中针对所述查询受试者的所述一个或多个查询输出值包括针对所述查询受试者的至少一个或多个重建胰岛素剂量的量。
3. 如权利要求1或2所述的计算系统,其中所述方法还包括针对所述查询受试者的所述数据集进行数据预处理和数据处理,其中:
(i)所述数据预处理包括访问所述查询受试者的数据集,选择预定类型的胰岛素剂量,选择预定类型的血糖测量值并且将所述多个查询受试者血糖测量值和所述至少一个受试者胰岛素剂量的量重新组织成多个经预处理的查询受试者血糖测量值和/或至少一个经预处理的查询受试者胰岛素剂量的量,并且
(ii) 所述数据处理包括将经预处理的查询受试者血糖史和经预处理的查询受试者胰岛素剂量史合并到查询受试者数据表中,并且指定所述查询受试者数据表中的自变量和因变量,并且
(iii)所述数据优化包括将所述查询受试者数据表应用于所述训练模型并获得针对所述查询受试者的至少一个重建胰岛素剂量的量。
4.如权利要求1-3中任一项所述的计算系统,其中获得训练模型的所述步骤包括:
-获得包括多个参考实体的训练集,其中所述多个参考实体包括多个参考胰岛素剂量史和多个参考血糖史,其中每个参考胰岛素剂量史与参考血糖史配对形成所述多个参考实体中的参考实体,
-对于所述多个参考实体中的每个相应参考实体,(i)从对应血糖史中获得相应时间过程中每个时间点的血糖测量值,以及(ii)从对应参考胰岛素剂量史中获得所述相应时间过程中相应时间点子集中每个时间点的胰岛素剂量的量,其中:
-所述多个参考实体中的每个相应参考实体提供针对所述相应时间过程的多个参考血糖测量值,其中所述多个参考血糖测量值是预定类型的血糖测量值,
-所述多个参考实体中的每个相应参考实体提供在相应时间点子集中的一个或多个参考胰岛素剂量的量,其中所述一个或多个参考胰岛素剂量的量是预定类型的胰岛素剂量,
-获得包括多个测试实体的测试集,其中所述多个测试实体包括多个测试胰岛素剂量史和多个测试血糖史,其中每个测试胰岛素剂量史与测试血糖史配对形成所述多个测试实体中的测试实体,其中每个相应测试血糖史提供多个血糖测量值,并且其中每个相应测试胰岛素剂量史提供一个或多个测试胰岛素剂量的量,其中所述一个或多个测试胰岛素剂量的量是预定类型的胰岛素剂量,
-在整个训练集中使用所述相应时间过程的所述多个参考血糖测量值和所述至少一个参考胰岛素剂量的量来训练模型,从而获得训练模型,
-将所述多个测试血糖史输入到所述训练模型中,从而获得所述测试集的一个或多个训练模型输出值,其中所述一个或多个训练输出值包括所述测试集的一个或多个重建胰岛素剂量的量,并且
-基于所述测试集的所述训练模型输出值来评价所述训练模型。
5.如权利要求4所述的计算系统,其中对所述训练和测试集数据重采样以注入到机器学习引擎中。
6. 如权利要求4或5所述的计算系统,其中:
-所述多个参考胰岛素剂量史和所述多个参考血糖史来自于多个训练受试者,或者
-所述多个参考胰岛素剂量史和所述多个参考血糖史来自于单个训练受试者。
7. 如权利要求4-6中任一项所述的计算系统,其中:
-所述时间点子集中的每个时间点紧随所述时间过程中的预定义时间段之前,并且
-所述时间过程中的所述预定义时间段选自20-40分钟、30-60分钟、40-60分钟、50-70分钟、60-80分钟、80-100分钟、100-120分钟和120-180分钟的集合。
8.如权利要求1所述的计算系统,其中所述相应参考胰岛素剂量史包括在所述时间过程的整个或一部分期间向所述对应参考实体施用的多个胰岛素剂量,以及对于所述多个胰岛素剂量中的每个相应胰岛素剂量而言,对应的胰岛素剂量的量和表示在所述时间过程中所述相应胰岛素剂量发生的时间的胰岛素剂量时间戳,并且其中所述胰岛素剂量时间戳是在所述时间点子集中。
9.如权利要求4-7中任一项所述的计算系统,其中所述方法还包括提供一个或多个模型性能指标,其中所述一个或多个模型性能指标包括均方根误差或准确性分数。
10.如权利要求1-9中任一项所述的计算系统,其中所述数据优化还包括处理丢失数据,其中通过以预定义时间间隔对所述受试者数据表进行重采样来对所述受试者数据表中的一个或多个时间间隙进行插值。
11.如权利要求1-10中任一项所述的计算系统,其中所述预定类型的血糖测量值是:(i)连续的葡萄糖监测数据,或(ii)血糖自我监测数据。
12.如权利要求1-11中任一项所述的计算系统,其中所述预定类型的胰岛素剂量包括(i)一个或多个推注胰岛素剂量事件或(ii)一个或多个基础胰岛素剂量事件。
13.如权利要求1-11中任一项所述的计算系统,所述计算系统适于提供针对所述查询受试者的长效或超长效胰岛素调整日剂量推荐(ADDR),其中所述数据结构(412)包括:(i)所述受试者的葡萄糖上限目标范围水平,(ii)所述受试者的葡萄糖下限目标范围水平,和(iii)当前的剂量指导基线。
14.如权利要求1-11中任一项所述的计算系统,所述计算系统适于提供针对所述查询受试者的短效胰岛素调整剂量推荐,其中所述数据结构(412)包括进餐数据和/或运动数据。
CN201980056347.9A 2018-08-31 2019-09-02 基于回顾水平线的胰岛素剂量预测 Withdrawn CN112714937A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862725413P 2018-08-31 2018-08-31
US62/725413 2018-08-31
EP18195592 2018-09-20
EP18195592.3 2018-09-20
PCT/EP2019/073338 WO2020043922A1 (en) 2018-08-31 2019-09-02 Retrospective horizon based insulin dose prediction

Publications (1)

Publication Number Publication Date
CN112714937A true CN112714937A (zh) 2021-04-27

Family

ID=67875433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980056347.9A Withdrawn CN112714937A (zh) 2018-08-31 2019-09-02 基于回顾水平线的胰岛素剂量预测

Country Status (5)

Country Link
US (1) US20210327555A1 (zh)
EP (1) EP3844782B1 (zh)
JP (1) JP2021536618A (zh)
CN (1) CN112714937A (zh)
WO (1) WO2020043922A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270204A (zh) * 2021-06-04 2021-08-17 荣曦 一种胰岛素泵初始剂量的预测方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11967407B2 (en) * 2018-07-26 2024-04-23 Sanofi Method of adjusting medication doses
EP3973461A4 (en) * 2019-05-23 2023-01-25 Cognizant Technology Solutions U.S. Corporation QUANTIFICATION OF THE PREDICTIVE UNCERTAINTY OF NEURAL NETWORKS BY RESIDUAL ESTIMATION WITH I/O-KERNEL
WO2022098575A1 (en) * 2020-11-05 2022-05-12 Dexcom, Inc. Medicament injection pen for distinguishing between priming pen events and therapeutic pen events
IL278675B2 (en) * 2020-11-12 2024-04-01 Dreamed Diabetes Ltd Method and system for automatic monitoring of diabetes treatments based on insulin injections
CN112908445A (zh) * 2021-02-20 2021-06-04 上海市第四人民医院 基于强化学习的糖尿病患者血糖管理方法、系统、介质及终端
EP4075444A1 (en) * 2021-04-14 2022-10-19 Roche Diabetes Care GmbH Method and means for postprandial blood glucose level prediction
WO2023233898A1 (ja) * 2022-06-03 2023-12-07 株式会社レナサイエンス 糖尿病治療薬の投与量の予測を支援する方法、予測支援装置、予測支援システム、及び予測支援プログラム
WO2023247608A1 (en) 2022-06-24 2023-12-28 Novo Nordisk A/S Systems and methods for regimen adherence evaluation
CN115050451B (zh) * 2022-08-17 2022-11-04 合肥工业大学 败血症临床用药方案自动生成系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004019495A (ja) 2002-06-13 2004-01-22 Toyota Industries Corp 動力伝達機構の位置決め構造
US20100262434A1 (en) * 2007-12-13 2010-10-14 Shaya Steven A Method and apparatus to calculate diabetic sensitivity factors affecting blood glucose
US9858386B2 (en) * 2009-11-02 2018-01-02 Universita Degli Studi Di Padova Method to recalibrate continuous glucose monitoring data on-line
EP3659651A3 (en) 2014-07-10 2020-10-14 Companion Medical, Inc. Medicine administering system including injection pen and companion device
WO2017031440A1 (en) 2015-08-20 2017-02-23 Aseko, Inc. Diabetes management therapy advisor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270204A (zh) * 2021-06-04 2021-08-17 荣曦 一种胰岛素泵初始剂量的预测方法

Also Published As

Publication number Publication date
US20210327555A1 (en) 2021-10-21
WO2020043922A1 (en) 2020-03-05
JP2021536618A (ja) 2021-12-27
EP3844782A1 (en) 2021-07-07
EP3844782B1 (en) 2022-07-13

Similar Documents

Publication Publication Date Title
CN112714937A (zh) 基于回顾水平线的胰岛素剂量预测
Wan et al. Cost-effectiveness of continuous glucose monitoring for adults with type 1 diabetes compared with self-monitoring of blood glucose: the DIAMOND randomized trial
US11574742B2 (en) Diabetes management therapy advisor
Lind et al. Continuous glucose monitoring vs conventional therapy for glycemic control in adults with type 1 diabetes treated with multiple daily insulin injections: the GOLD randomized clinical trial
Reddy et al. Prediction of hypoglycemia during aerobic exercise in adults with type 1 diabetes
Parkin et al. Continuous glucose monitoring use in type 1 diabetes: longitudinal analysis demonstrates meaningful improvements in HbA1c and reductions in health care utilization
EP3125761B1 (en) Method and apparatus for determining meal start and peak events in analyte monitoring systems
Donsa et al. Towards personalization of diabetes therapy using computerized decision support and machine learning: some open problems and challenges
JP2020507166A (ja) 遡及的な仮想基礎レートを用いて、インスリン送達を制御するための方法、システム、およびコンピュータ読み取り可能な媒体
Dassau et al. Modular artificial β-cell system: a prototype for clinical research
Faccioli et al. Accuracy of a CGM sensor in pediatric subjects with type 1 diabetes. Comparison of three insertion sites: arm, abdomen, and gluteus
EP2446385A2 (en) Adherence indication tool for chronic disease management and method thereof
Warshaw et al. The reference guide to integrate smart insulin pens into data-driven diabetes care and education services
Pease et al. Cost-effectiveness analysis of a hybrid closed-loop system versus multiple daily injections and capillary glucose testing for adults with type 1 diabetes
JP2020523136A (ja) 患者プロファイルに基づくインスリン滴定アルゴリズム
Sakulrang et al. A fractional differential equation model for continuous glucose monitoring data
Herrero et al. Automatic adaptation of basal insulin using sensor-augmented pump therapy
US20230005586A1 (en) Determining total daily basal dose mismatch
Parcerisas et al. A machine learning approach to minimize nocturnal hypoglycemic events in type 1 diabetic patients under multiple doses of insulin
Rodríguez-Rodríguez et al. A comparison of different models of glycemia dynamics for improved Type 1 diabetes mellitus management with advanced intelligent analysis in an internet of things context
Al-Taee et al. Blood-glucose pattern mining algorithm for decision support in diabetes management
US20220189632A1 (en) Individualized medicine using causal models
CA3160818A1 (en) Joint state estimation prediction that evaluates differences in predicted vs. corresponding received data
Indragandhi et al. Bimodal Insulin Delivery System Using Internet of Things and Machine Learning Approach
Luckett et al. Estimating dynamic treatment regimes in mobile health using V-learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210427

WW01 Invention patent application withdrawn after publication