CN117546254A - 用于定量确定临床参数的计算机实现方法和系统 - Google Patents

用于定量确定临床参数的计算机实现方法和系统 Download PDF

Info

Publication number
CN117546254A
CN117546254A CN202280022749.9A CN202280022749A CN117546254A CN 117546254 A CN117546254 A CN 117546254A CN 202280022749 A CN202280022749 A CN 202280022749A CN 117546254 A CN117546254 A CN 117546254A
Authority
CN
China
Prior art keywords
test
finger
data
computer
touch screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280022749.9A
Other languages
English (en)
Inventor
M·埃兰特科夫斯基
C·西米利恩
张燕萍
M·甘泽蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN117546254A publication Critical patent/CN117546254A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/742Details of notification to user or communication with user or patient ; user input means using visual displays
    • A61B5/7445Display arrangements, e.g. multiple display units
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/7475User input or interface means, e.g. keyboard, pointing device, joystick
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Software Systems (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,所述计算机实现方法包括:向移动装置的用户提供远端运动测试,所述移动装置具有触摸屏显示器,其中向所述移动装置的所述用户提供所述远端运动测试包括:使所述移动装置的所述触摸屏显示器显示测试图像;从所述移动装置的所述触摸屏显示器接收输入,所述输入指示用户将第一手指放在所述测试图像中的第一点上和将第二手指放在所述测试图像中的第二点上并且将所述第一手指和所述第二手指掐捏在一起从而使所述第一点和所述第二点靠在一起的尝试;以及从经接收的输入提取数字生物标志物特征数据,其中,以下任一项:(i)经提取的数字生物标志物特征数据为所述临床参数,或者(ii)所述方法进一步包括从经提取的数字生物标志物特征数据计算所述临床参数。

Description

用于定量确定临床参数的计算机实现方法和系统
技术领域
本发明涉及疾病的数字评估领域。特别地,本发明涉及一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法和系统。该计算机实现方法和系统可以用于确定指示多发性硬化症的扩展残疾状态量表(EDSS)、指示脊髓性肌萎缩的用力肺活量或指示亨廷顿病的总运动评分(TMS)。
背景技术
疾病,特别是神经系统疾病,需要针对疾病管理的强化诊断措施。在疾病发作后,这些疾病通常是进行性疾病,需要通过分期系统进行评估,以确定确切的状态。在这些进行性神经系统疾病中,突出的例子有多发性硬化症(MS)、亨廷顿病(HD)和脊髓性肌萎缩(SMA)。
目前,此类疾病的分期需要付出很大的努力,对于需要去医院或医生办公室的医学专家那里就诊的患者来说很麻烦。此外,分期需要医学专家的经验,通常是主观的,并基于个人经验和判断。然而,有一些疾病分期参数对疾病管理特别有用。此外,在SMA等其他情况下,临床相关参数(诸如用力肺活量)需要通过特殊装备(即肺量测定装置)来确定。
对于所有这些情况,确定替代物可能会有所帮助。合适的替代物包括生物标志物,特别是数字获取的生物标志物,诸如来自测试的表现参数,这些表现参数用于确定可与分期系统相关或可作为临床参数的替代标志物的生物功能的表现参数。
实际目标临床参数之间的相关性(诸如分数或其他临床参数)可以通过各种方法从数据中得出。
发明内容
本发明的第一方面提供了一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,该计算机实现方法包括:向移动装置的用户提供远端运动测试,该移动装置具有触摸屏显示器,其中向移动装置的用户提供远端运动测试包括:使移动装置的触摸屏显示器显示测试图像;从移动装置的触摸屏显示器接收输入,该输入指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试;并且从经接收的输入提取数字生物标志物特征数据,其中,以下任一项:(i)经提取的数字生物标志物特征数据是临床参数,或者(ii)该方法进一步包括从经提取的数字生物标志物特征数据计算临床参数。
本发明的第二方面提供了一种用于定量确定指示疾病的状态或进展的临床参数的系统,该系统包括:具有触摸屏显示器、用户输入界面和第一处理单元的移动装置;以及第二处理单元;其中:移动装置被配置为向其用户提供远端运动测试,其中提供远端运动测试包括:第一处理单元使移动装置的触摸屏显示器显示测试图像;用户输入界面被配置为从触摸屏显示器接收指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试的输入;第一处理单元或第二处理单元被配置为从经接收的输入提取数字生物标志物特征数据。
本发明的第三方面提供了一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,该计算机实现方法包括:从移动装置接收输入,该输入包括:来自加速度计的加速度数据,该加速度数据包括多个点,每个点对应于相应时间处的加速度;从经接收的输入提取数字生物标志物特征数据,其中经提取的数字生物标志物特征数据包括:对于多个点中的每一个,确定相应时间处的加速度的总大小与加速度的z分量的大小的比率;并且从多个所确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
本发明的第四方面提供了一种用于定量确定指示疾病的状态或进展的临床参数的系统,该系统包括:具有加速度计和第一处理单元的移动装置;以及第二处理单元;其中:加速度计被配置为测量加速度,并且加速度计、第一处理单元或第二处理单元中的任一项被配置为生成包括多个点的加速度数据,每个点对应于相应时间处的加速度;第一处理单元或第二处理单元被配置为通过以下方式从经接收的输入提取数字生物标志物特征数据:对于多个点中的每一个,确定相应时间处的加速度的总大小与加速度的z分量的大小的比率;并且从多个经确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
如下文所使用的,术语“具有”、“包括”或“包含”或它们的任何语法变化形式以非排他性方式使用。因此,这些术语既可以指除了由这些术语引入的特征之外,在此上下文中描述的实体中不存在其他特征的情况,也可以指存在一个或多个其他特征的情况。作为示例,表述“A具有B”、“A包括B”和“A包含B”既可以指其中除B之外,A中不存在其他要素的情况(即,其中A由B单独且唯一地组成的情况),也可以指其中除B之外,实体A中还存在一个或多个其他要素(诸如要素C、要素C和要素D或甚至其他要素)的情况。
另外,应当注意,指示特征或要素可存在一次或多于一次的术语“至少一个/种”、“一个/种或多个/种”或类似表述在引入相应的特征或要素时仅会使用一次。在下文中,在大多数情况下,当提及相应的特征或元素时,尽管相应的特征或元素可能只存在一次或多次,但不会重复使用表述“至少一个”或“一个或多个”。
此外,如下文所使用的,术语“优选地”、“更优选地”、“特别地”、“更特别地”、“具体地”、“更具体地”或类似的术语与任选特征结合使用,而不限制替代性的可能性。因此,由这些术语引入的特征是任选特征,并且不旨在以任何方式限制权利要求的范围。如本领域技术人员将认识到的,本发明可以通过使用替代性特征来进行。类似地,由“在本发明的一个实施例中”引入的特征或类似表述旨在成为任选特征,而对本发明的替代性实施例没有任何限制、对本发明的范围没有任何限制,并且对将以这种方式引入的特征与本发明的其他任选或非任选特征相组合的可能性也没有任何限制。
在此总结并且不排除进一步的可能的实施例,可以设想以下实施例。
实施例1:一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,该计算机实现方法包括:
向移动装置的用户提供远端运动测试,该移动装置具有触摸屏显示器,其中向移动装置的用户提供远端运动测试包括:
使移动装置的触摸屏显示器显示测试图像;
从移动装置的触摸屏显示器接收输入,该输入指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试;
从经接收的输入提取数字生物标志物特征数据。
实施例2:根据实施例1所述的计算机实现方法,其中:
在测试图像中指定和/或识别第一点和第二点。
实施例3:根据实施例1所述的计算机实现方法,其中:
第一点未在测试图像中指定,并且被限定为第一手指触摸触摸屏显示器的点;并且
第二点未在测试图像中指定,并且被限定为第二手指触摸触摸屏显示器的点。
实施例4:根据实施例1至3中任一项所述的计算机实现方法,其中:
经提取的数字生物标志物特征数据是临床参数。
实施例5:根据实施例1至3中任一项所述的计算机实现方法,其进一步包括:
从经提取的数字生物标志物特征数据来计算临床参数。
实施例6:根据实施例1至5中任一项所述的计算机实现方法,其中:
经接收的输入包括:
指示第一手指离开触摸屏显示器时的时间的数据;
指示第二手指离开触摸屏显示器时的时间的数据。
实施例7:根据实施例6所述的计算机实现方法,其中:
数字生物标志物特征数据包括第一手指离开触摸屏显示器时的时间与第二手指离开触摸屏显示器时的时间之间的差。
实施例8:根据实施例1至7中任一项所述的计算机实现方法,其中:
经接收的输入包括:
指示第一手指最初触摸第一点时的时间的数据;
指示第二手指最初触摸第二点时的时间的数据。
实施例9:根据实施例8所述的计算机实现方法,其中:
数字生物标志物特征数据包括第一手指最初触摸第一点时的时间和第二手指最初触摸第二点时的时间之间的差。
实施例10:根据实施例8或实施例9所述的计算机实现方法,其中:
数字生物标志物特征数据包括以下之间的差:
第一手指最初接触第一点时的时间和第二手指最初接触第二点时的时间中的较早者;以及
第一手指离开触摸屏显示器时的时间和第二手指离开触摸屏显示器时的时间中的较晚者。
实施例11:根据实施例1至10中任一项所述的计算机实现方法,其中:
经接收的输入包括:
指示第一手指离开触摸屏显示器时的位置的数据;以及
指示第二手指离开触摸屏显示器时的位置的数据。
实施例12:根据实施例11所述的计算机实现方法,其中:
数字生物标志物特征数据包括第一手指离开触摸屏显示器时的位置与第二手指离开触摸屏显示器时的位置之间的距离。
实施例13:根据实施例1至12中任一项所述的计算机实现方法,其中:
经接收的输入包括:
指示第一手指从其最初触摸第一点时的时间到其离开触摸屏时的时间所描绘的第一路径的数据,该数据包括第一起点、第一终点和第一路径长度;以及
指示第二手指从其最初触摸第二点时的时间到其离开触摸屏时的时间所描绘的第二路径的数据,该数据包括第二起点、第二终点和第二路径长度。
实施例14:根据实施例13所述的计算机实现方法,其中:
数字生物标志物特征数据包括第一平滑参数,该第一平滑参数为第一路径长度与第一起点与第一终点之间的距离的比率;
数字生物标志物特征数据包括第二平滑参数,该第二平滑参数为第二路径长度与第二起点和第二终点之间的距离的比率。
实施例15:根据实施例1至14中任一项所述的计算机实现方法,其中:
该方法包括:
从移动装置的触摸屏显示器接收多个输入,多个输入中的每一个指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的相应尝试;以及
从多个经接收的输入中的每一个提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
实施例16:根据实施例15所述的计算机实现方法,其中:
所述方法进一步包括:
确定对应于成功尝试的相应的数字生物标志物特征数据片段的子集。
本发明的目的是使用简单的基于移动装置的测试来确定影响用户运动控制的疾病的进展。鉴于此,测试的成功优选地取决于用户在不将手指从触摸屏显示表面抬起的情况下能够成功地将第一点和第二点放在一起的程度。确定尝试是否已经成功的步骤优选地包括确定第一手指离开触摸屏显示器时的位置与第二手指离开触摸屏显示器时的位置之间的距离。成功的尝试可以被限定为该距离低于预定阈值的尝试。替代的,确定尝试是否已经成功的步骤可以包括确定第一手指离开触摸屏显示器时的位置距第一点的初始位置与第二点的初始位置之间的中点的距离,并且第二手指离开触摸屏显示器时的位置距第一点的初始位置与第二点的初始位置之间的中点的距离。成功的尝试可以被限定为两个距离的平均值低于预定阈值的尝试,或者两个距离都低于预定阈值的尝试。
实施例17:根据实施例1至14中任一项所述的计算机实现方法,其中:
该方法包括:
从移动装置的触摸屏显示器接收多个输入,该多个输入中的每一个指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的相应尝试;
确定对应于成功尝试的多个经接收的输入的子集;以及
从多个经接收的输入的经确定的子集中的每一个输入提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
实施例18:根据实施例15至17中任一项所述的计算机实现方法,其中:
该方法进一步包括从以下中任一项得出统计参数:
多个数字生物标志物特征数据片段,或者
对应于成功尝试的经确定的相应的数字生物标志物特征数据片段的子集。
实施例19:根据实施例18所述的计算机实现方法,其中:
统计参数包括:
多个数字生物标志物特征数据片段的平均值;和/或
多个数字生物标志物特征数据片段的标准偏差;和/或
多个数字生物标志物特征数据片段的峰度;
多个数字生物标志物特征数据片段的中位数;
多个数字生物标志物特征数据片段的百分位数。
百分位数可以是5%、10%、15%、20%、25%、30%、33%、35%、40%、45%、50%、55%、60%、65%、66%、67%、70%、75%、80%、85%、90%、95%。
实施例20:根据实施例14至19中任一项所述的计算机实现方法,其中:
在由第一时间段接着第二时间段组成的总时间内接收多个经接收的输入;
多个经接收的输入包括:
在第一时间段期间接收的经接收的输入的第一子集,经接收的输入的第一子集具有经提取的数字生物标志物特征数据片段的相应的第一子集;并且
在第二时间段期间接收的输入的第二子集,经接收的输入的第二子集具有经提取的数字生物标志物特征数据片段的相应的第二子集;
所述方法进一步包括:
得出对应于经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;以及
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数,来计算疲劳参数。
实施例21:根据实施例20所述的计算机实现方法,其中:
第一时间段和第二时间段时是相同的持续时间。
实施例22:根据实施例15至21中任一项所述的计算机实现方法,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示用户将他们的惯用手的第一手指放在测试图像中的第一点上和将他们的惯用手的第二手指放在测试图像中的第二点上并且将他们的惯用手的第一手指和他们的惯用手的第二手指掐捏在一起从而将第一点和第二点放在一起的尝试,经接收的输入的第一子集具有经提取的数字生物标志物特征数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示用户将他们的非惯用手的第一手指放在测试图像中的第一点上和将他们的非惯用手的第二手指放在测试图像中的第二点上并且将他们的非惯用手的第一手指和他们的非惯用手的第二手指掐捏在一起从而将第一点和第二点放在一起的尝试,经接收的输入的第二子集具有经提取的数字生物标志物特征数据片段的相应的第二子集;
所述方法进一步包括:
得出对应于所述经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于所述经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;以及
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算惯用手参数。
实施例23:根据实施例15至22中任一项所述的计算机实现方法,其中:
所述方法进一步包括:
确定对应于仅第一手指和第二手指接触触摸屏显示器的用户尝试的多个经接收的输入的第一子集;
确定对应于仅一个手指或者三个或更多个手指中任一项接触触摸屏显示器的用户尝试的多个经接收的输入的第二子集;并且
数字生物标志物特征数据包括:
经接收的输入的第一子集中的经接收的输入的数量;和/或
在经接收的输入的第一子集中的经接收的输入的总数的比例。
实施例24:根据实施例15至23中任一项所述的计算机实现方法,其中:
多个经接收的输入的每个经接收的输入包括:
指示第一手指最初触摸第一点时的时间的数据;
指示第二手指最初触摸第二点时的时间的数据
指示第一手指离开触摸屏显示器时的时间的数据;以及
指示第二手指离开触摸屏显示器时的时间的数据;
该方法进一步包括,对于每个连续的输入对,确定以下各项之间的时间间隔:
对于连续的经接收的输入对中的第一个,第一手指离开触摸屏显示器的时间和第二手指离开触摸屏显示器的时间中的较晚者;以及
对于连续的经接收的输入对中的第二个,第一手指最初触摸第一点的时间和第二手指触摸第二点的时间中的较早者。
经提取的数字生物标志物特征数据包括:
经确定的时间间隔的集;
经确定的时间间隔的平均值;
经确定的时间间隔的标准偏差;和/或
经确定的时间间隔的峰度。
实施例25:根据实施例1至24中任一项所述的计算机实现方法,其中:
该方法进一步包括获得加速度数据。
实施例26:根据实施例25所述的计算机实现方法,其中:
加速度数据包括以下中的一者或多者:
(a)从贯穿整个测试的持续时间的加速度的大小得出的统计参数;
(b)从仅在第一手指、第二手指或两个手指与触摸屏显示器接触的时段期间的加速度的大小得出的统计参数;以及
(c)仅在没有手指接触触摸屏显示器的时段期间的加速度的大小的统计参数。
实施例27:根据实施例20所述的计算机实现方法,其中:
统计参数包括以下中的一者或多者:
平均值;
标准偏差;
中位数;
峰度;和
百分位数。
实施例28:根据实施例25至27中任一项所述的计算机实现方法,其中:
加速度数据包括z轴线偏差参数,其中确定z轴线偏差参数包括:
对于多个时间点中的每一个,确定加速度的z分量的大小,并且计算所有时间点上的加速度的z分量的标准偏差,其中限定z方向作为垂直于触摸屏显示器的平面的方向。
实施例29:根据实施例25至28中任一项所述的计算机实现方法,其中:
加速度数据包括标准偏差范数参数,其中确定标准偏差范数参数包括:
对于多个时间点中的每一个,确定加速度的x分量的大小,并且计算所有时间点上的加速度的x分量的标准偏差;
对于多个时间点中的每一个,确定加速度的y分量的大小,并且计算所有时间点上的加速度的y分量的标准偏差;
对于多个时间点中的每一个,确定加速度的z分量的大小,并且计算所有时间点上的加速度的z分量的标准偏差,其中限定z方向作为垂直于触摸屏显示器的平面的方向;并且
通过将x分量、y分量和z分量相应的标准偏差正交相加来计算它们的范数。
实施例30:根据实施例25至29中任一项所述的计算机实现方法,其中:
加速度数据包括水平状态参数,其中确定水平状态参数包括:
对于多个时间点中的每一个,确定:
加速度的大小;以及
加速度的z分量的大小,其中z方向被限定为垂直于触摸屏显示器的平面的方向;
加速度的z分量与加速度的大小的比率;
确定历经多个时间点的经确定的比率的平均值。
实施例31:根据实施例25至30中任一项所述的计算机实现方法,其中:
加速度数据包括取向稳定性参数,其中确定取向稳定性参数包括:
对于多个时间点中的每一个,确定:
加速度的大小;以及
加速度的z分量的大小,其中z方向被限定为垂直于触摸屏显示器的平面的方向;
加速度的z分量与加速度值的大小的比率;
确定历经多个时间点的经确定的比率的标准偏差。
实施例32:根据实施例1至31中任一项所述的计算机实现方法,其进一步包括:
将至少一个分析模型应用于数字生物标志物特征数据或从数字生物标志物特征数据得出的统计参数;和
基于至少一个分析模型的输出来预测至少一个临床参数的值。
实施例33:根据实施例32所述的计算机实现方法,其中:
分析模型包括经训练的机器学习模型。
实施例34:根据实施例33所述的计算机实现方法,其中:
分析模型为回归模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
线性回归;
偏最小二乘(PLS);
随机森林(RF);以及
极端随机树(XT)。
实施例35:根据实施例33所述的计算机实现方法,其中:
分析模型为分类模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
支持向量机(SVM);
线性判别分析;
二次判别分析(QDA);
朴素贝叶斯(NB);
随机森林(RF);以及
极端随机树(XT)。
实施例36:根据实施例1至35中任一项所述的计算机实现方法,其中:
待预测状态的疾病为多发性硬化症并且临床参数包括扩展残疾状态量表(EDSS)值,
待预测状态的疾病为脊髓性肌萎缩并且临床参数包括用力肺活量(FVC)值,或者
其中待预测状态的疾病为亨廷顿病并且临床参数包括总运动评分(TMS)值。
实施例37:根据实施例1至36中任一项所述的计算机实现方法,其中:
该方法进一步包括确定至少一个分析模型,其中确定至少一个分析模型包括:
(a)经由至少一个通信接口接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个所测量的值;
(b)从输入数据集确定至少一个训练数据集和至少一个测试数据集;
(c)通过用所训练的数据集训练包括至少一个算法的机器学习模型来确定分析模型;
(d)使用经确定的分析模型针对测试数据集预测临床参数;
(e)基于所预测的目标变量和测试数据集的临床参数的真值来确定经确定的分析模型的性能。
实施例38:根据实施例37所述的计算机实现方法,其中:
在步骤(c)中,通过用训练数据集训练多个机器学习模型来确定多个分析模型,其中机器学习模型通过它们的算法来区分,其中在步骤d)中,使用经确定的分析模型针对测试数据集预测多个临床参数,并且
其中在步骤(e)中,基于所预测的目标变量和测试数据集的临床参数的真值来确定经确定的分析模型中的每一个的性能,其中该方法进一步包括确定具有最佳性能的分析模型。
实施例39:一种用于定量确定指示疾病的状态或进展的临床参数的系统,该系统包括:
具有触摸屏显示器、用户输入界面和第一处理单元的移动装置;以及
第二处理单元;
其中:
移动装置被配置为向其用户提供远端运动测试,其中提供远端运动测试包括:
第一处理单元使移动装置的触摸屏显示器显示测试图像;
用户输入界面被配置为从触摸屏显示器接收指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试的输入;
第一处理单元或第二处理单元被配置为从经接收的输入提取数字生物标志物特征数据。
实施例40:根据实施例39所述的系统,其中:
在测试图像中指定和/或识别第一点和第二点。
实施例41:根据实施例39所述的系统,其中:
第一点未在测试图像中指定,并且被限定为第一手指触摸触摸屏显示器的点;并且
第二点未在测试图像中指定,并且被限定为第二手指触摸触摸屏显示器的点。
实施例42:根据实施例39至41中任一项所述的系统,其中:
经提取的数字生物标志物特征数据是临床参数。
实施例43:根据实施例39至41中任一项所述的系统,其中:
第一处理单元或第二处理单元被配置为从经提取的数字生物标志物特征数据计算临床参数。
实施例44:根据实施例39至43中任一项所述的系统,其中:
经接收的输入包括:
指示第一手指离开触摸屏显示器时的时间的数据;
指示第二手指离开触摸屏显示器时的时间的数据。
实施例45:根据实施例44所述的系统,其中:
数字生物标志物特征数据包括第一手指离开触摸屏显示器时的时间与第二手指离开触摸屏显示器时的时间之间的差。
实施例46:根据实施例39至45中任一项所述的系统,其中:
经接收的输入包括:
指示第一手指最初触摸第一点时的时间的数据;
指示第二手指最初触摸第二点时的时间的数据。
实施例47:根据实施例46所述的系统,其中:
数字生物标志物特征数据包括第一手指最初触摸第一点时的时间和第二手指最初触摸第二点时的时间之间的差。
实施例48:根据实施例46或实施例47所述的系统,其中:
数字生物标志物特征数据包括以下之间的差:
第一手指最初接触第一点时的时间和第二手指最初接触第二点时的时间中的较早者;以及
第一手指离开触摸屏显示器时的时间和第二手指离开触摸屏显示器时的时间中的较晚者。
实施例49:根据实施例39至48中任一项所述的系统,其中:
经接收的输入包括:
指示所述第一手指离开所述触摸屏显示器时的位置的数据;以及指示第二手指离开触摸屏显示器时的位置的数据。
实施例50:根据实施例49所述的系统,其中:
数字生物标志物特征数据包括第一手指离开触摸屏显示器时的位置与第二手指离开触摸屏显示器时的位置之间的距离。
实施例51:根据实施例39至50中任一项所述的系统,其中:
经接收的输入包括:
指示由所述第一手指从其最初触摸所述第一点时的时间到其离开触摸屏时的时间所描绘的第一路径的数据,所述数据包括第一起点、第一终点和第一路径长度;以及
指示第二手指从其最初触摸第二点时的时间到其离开触摸屏时的时间所描绘的第二路径的数据,该数据包括第二起点、第二终点和第二路径长度。
实施例52:根据实施例51所述的系统,其中:
数字生物标志物特征数据包括第一平滑参数,该第一平滑参数为第一路径长度与第一起点与第一终点之间的距离的比率;
数字生物标志物特征数据包括第二平滑参数,该第二平滑参数为第二路径长度与第二起点和第二终点之间的距离的比率。
实施例53:根据实施例39至52中任一项所述的系统,其中:
用户输入界面被配置为从移动装置的触摸屏显示器接收多个输入,该多个输入中的每一个指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的相应尝试;并且
第一处理单元或第二处理单元被配置为从多个经接收的输入中的每一个提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
实施例54:根据实施例53所述的系统,其中:
第一处理单元或第二处理单元被配置为确定对应于成功尝试的相应的数字生物标志物特征数据片段的子集。
实施例55:根据实施例39至52中任一项所述的系统,其中:
用户输入界面被配置为从移动装置的触摸屏显示器接收多个输入,该多个输入中的每一个指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的相应尝试;并且
第一处理单元或第二处理单元被配置为:
确定对应于成功尝试的多个经接收的输入的子集;并且
从经确定的多个经接收的输入的子集中的每一个输入提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
实施例56:根据实施例53至55中任一项所述的系统,其中:
第一处理单元或第二处理单元被配置为从以下中任一项得出统计参数:
多个数字生物标志物特征数据片段,或者
对应于成功尝试的经确定的相应的数字生物标志物特征数据片段的子集。
实施例57:根据实施例56所述的系统,其中:
统计参数包括:
多个数字生物标志物特征数据片段的平均值;和/或
多个数字生物标志物特征数据片段的标准偏差;和/或
多个数字生物标志物特征数据片段的峰度。
实施例58:根据实施例53至57中任一项所述的系统,其中:
在由第一时间段接着第二时间段组成的总时间内接收多个经接收的输入;
多个经接收的输入包括:
在第一时间段期间接收的经接收的输入的第一子集,经接收的输入的第一子集具有经提取的数字生物标志物特征数据片段的相应的第一子集;并且
在第二时间段期间接收的输入的第二子集,经接收的输入的第二子集具有经提取的数字生物标志物特征数据片段的相应的第二子集;并且
第一处理单元或第二处理单元被配置为:
得出对应于经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;并且
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数,来计算疲劳参数。
实施例59:根据实施例58所述的系统,其中:
第一时间段和第二时间段时是相同的持续时间。
实施例60:根据实施例53至59中任一项所述的系统,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示用户将他们的惯用手的第一手指放在测试图像中的第一点上和将他们的惯用手的第二手指放在测试图像中的第二点上并且将他们的惯用手的第一手指和他们的惯用手的第二手指掐捏在一起从而将第一点和第二点放在一起的尝试,经接收的输入的第一子集具有经提取的数字生物标志物特征数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示用户将他们的非惯用手的第一手指放在测试图像中的第一点上和将他们的非惯用手的第二手指放在测试图像中的第二点上并且将他们的非惯用手的第一手指和他们的非惯用手的第二手指掐捏在一起从而将第一点和第二点放在一起的尝试,经接收的输入的第二子集具有经提取的数字生物标志物特征数据片段的相应的第二子集;并且
第一处理单元或第二处理单元被配置为:
得出对应于经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;并且
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算惯用手参数。
实施例61:根据实施例53至60中任一项所述的系统,其中:
第一处理单元或第二处理单元被配置为:
确定对应于仅第一手指和第二手指接触触摸屏显示器的用户尝试的多个经接收的输入的第一子集;
确定对应于仅一个手指或者三个或更多个手指中任一项接触触摸屏显示器的用户尝试的多个经接收的输入的第二子集;并且
数字生物标志物特征数据包括:
经接收的输入的第一子集中的经接收的输入的数量;和/或
在经接收的输入的第一子集中的经接收的输入的总数的比例。
实施例62:根据实施例53至61中任一项所述的系统,其中:
多个经接收的输入的每个经接收的输入包括:
指示第一手指最初触摸第一点时的时间的数据;
指示第二手指最初触摸第二点时的时间的数据
指示第一手指离开触摸屏显示器时的时间的数据;以及
指示第二手指离开触摸屏显示器时的时间的数据;
第一处理单元或第二处理单元被配置为,针对每个连续的输入对确定以下各项之间的时间间隔:
对于连续的经接收的输入对中的第一个,第一手指离开触摸屏显示器的时间和第二手指离开触摸屏显示器的时间中的较晚者;以及
对于连续的经接收的输入对中的第二个,第一手指最初触摸第一点的时间和第二手指触摸第二点的时间中的较早者。
经提取的数字生物标志物特征数据包括:
经确定的时间间隔的集;
经确定的时间间隔的平均值;
经确定的时间间隔的标准偏差;和/或
经确定的时间间隔的峰度。
实施例63:根据实施例39至62中任一项所述的系统,其中:
该系统进一步包括被配置为测量移动装置的加速度的加速度计;并且
第一处理单元、第二处理单元或加速度计被配置为基于所测量的加速度生成加速度数据。
实施例64:根据实施例63所述的系统,其中:
加速度数据包括以下中的一者或多者:
(a)从贯穿整个测试的持续时间的加速度的大小得出的统计参数;
(b)从仅在第一手指、第二手指或两个手指与触摸屏显示器接触的时段期间的加速度的大小得出的统计参数;以及
(c)仅在没有手指接触触摸屏显示器的时段期间的加速度的大小的统计参数。
实施例65:根据实施例64所述的系统,其中:
统计参数包括以下中的一者或多者:
平均值;
标准偏差;
中位数;
峰度;和
百分位数。
实施例66:根据实施例63至65中任一项所述的系统,其中:
加速度数据包括z轴线偏差参数,其中确定z轴线偏差参数;并且
第一处理单元或第二处理单元被配置为通过针对多个时间点中的每个时间点确定加速度的z分量的大小并且计算所有时间点上的加速度的z分量的标准偏差来生成z轴线偏差参数,其中限定z方向为垂直于触摸屏显示器的平面的方向。
实施例67:根据实施例63至66中任一项所述的系统,其中:
加速度数据包括标准偏差范数参数,其中第一处理单元或第二处理单元被配置为通过以下方式确定标准偏差范数参数:
对于多个时间点中的每一个,确定加速度的x分量的大小,并且计算所有时间点上的加速度的x分量的标准偏差;
对于多个时间点中的每一个,确定加速度的y分量的大小,并且计算所有时间点上的加速度的y分量的标准偏差;
对于多个时间点中的每一个,确定加速度的z分量的大小,并且计算所有时间点上的加速度的z分量的标准偏差,其中限定z方向作为垂直于触摸屏显示器的平面的方向;并且
通过将x分量、y分量和z分量相应的标准偏差正交相加来计算它们的范数。
实施例68:根据实施例63至67中任一项所述的系统,其中:
加速度数据包括水平状态参数,其中第一处理单元或第二处理单元被配置为通过以下方式确定水平状态参数:
对于多个时间点中的每一个,确定:
加速度的大小;以及
加速度的z分量的大小,其中z方向被限定为垂直于触摸屏显示器的平面的方向;
加速度的z分量与加速度大小的比率;以及
确定历经多个时间点的经确定的比率的平均值。
实施例69:根据实施例63至68中任一项所述的系统,其中:
加速度数据包括取向稳定性参数,其中第一处理单元或第二处理单元被配置为通过以下方式确定取向稳定性参数:
对于多个时间点中的每一个,确定:
加速度的大小;以及
加速度的z分量的大小,其中z方向被限定为垂直于触摸屏显示器的平面的方向;
加速度的z分量与加速度值的大小的比率;并且
确定历经多个时间点的经确定的比率的标准偏差。
实施例70:根据实施例39至69中任一项所述的系统,其中:
第二处理单元被配置为将至少一个分析模型应用于数字生物标志物特征数据或从数字生物标志物特征数据得出的统计参数,并且基于至少一个分析模型的输出来预测至少一个临床参数的值。
实施例71:根据实施例70所述的系统,其中:
分析模型包括经训练的机器学习模型。
实施例72:根据71所述的系统,其中:
分析模型为回归模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
线性回归;
偏最小二乘(PLS);
随机森林(RF);以及
极端随机树(XT)。
实施例73:根据实施例71所述的系统,其中:
分析模型为分类模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
支持向量机(SVM);
线性判别分析;
二次判别分析(QDA);
朴素贝叶斯(NB);
随机森林(RF);以及
极端随机树(XT)。
实施例74:根据实施例39至73中任一项所述的系统,其中:
待预测状态的疾病为多发性硬化症并且临床参数包括扩展残疾状态量表(EDSS)值,
待预测状态的疾病为脊髓性肌萎缩并且临床参数包括用力肺活量(FVC)值,或者
其中待预测状态的疾病为亨廷顿病并且临床参数包括总运动评分(TMS)值。
实施例75:根据实施例39至74中任一项所述的系统,其中:
第一处理单元和第二处理单元是相同的处理单元。
实施例76:根据实施例39至74中任一项所述的系统,其中:
第一处理单元与第二处理单元分离。
实施例77:根据实施例39至76中任一项所述的系统,其进一步包括用于确定用于预测指示疾病状态的临床参数的至少一个分析模型的机器学习系统,该机器学习系统包括:
至少一个通信接口,该至少一个通信接口被配置用于接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
至少一个模型单元,所述至少一个模型单元包括至少一个机器学习模型,所述至少一个机器学习模型包括至少一种算法;
至少一个处理单元,其中处理单元被配置用于从输入数据集中确定至少一个训练数据集和至少一个测试数据集,其中处理单元被配置用于通过利用训练数据集训练机器学习模型来确定分析模型,其中处理单元被配置用于使用经确定的分析模型来预测测试数据集的临床参数,其中处理单元被配置用于基于所预测的临床参数和测试数据集的临床参数的真值来确定经确定的分析模型的性能,其中处理数据是第一处理单元或第二处理单元。
实施例78:一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,该计算机实现方法包括:
从移动装置接收输入,该输入包括:
来自加速度计的加速度数据,该加速度数据包括多个点,每一个点对应于相应时间处的加速度;
从经接收的输入提取数字生物标志物特征数据,其中提取数字生物标志物特征数据包括:
对于多个点中的每一个,确定相应时间处的加速度的总大小与加速度的z分量的大小的比率;以及
从多个经确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
实施例79:一种用于定量确定指示疾病的状态或进展的临床参数的系统,该系统包括:
具有加速度计和第一处理单元的移动装置;以及
第二处理单元;
其中:
加速度计被配置为测量加速度,并且加速度计、第一处理单元或第二处理单元中的任一项被配置为生成包括多个点的加速度数据,每一个点对应于相应时间处的加速度;
第一处理单元或第二处理单元被配置为通过以下来从经接收的输入提取数字生物标志物特征数据:
对于所述多个点中的每一个,确定所述相应时间处的所述加速度的总大小与所述加速度的z分量的大小的比率;以及
从多个经确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
实施例80:一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,该计算机实现方法包括:
向移动装置的用户提供远端运动测试,该移动装置具有触摸屏显示器,其中向移动装置的用户提供远端运动测试包括:
使得移动装置的触摸屏显示器显示图像,该图像包括:参考起点、参考终点和在起点与终点之间的待描绘的参考路径的指示;
从移动装置的触摸屏显示器接收输入,该输入指示由用户尝试在移动装置的显示器上描绘参考路径所描绘的测试路径,该测试路径包括:测试起点、测试终点和在测试起点与测试终点之间所描绘的测试路径;
从经接收的输入提取数字生物标志物特征数据,该数字生物标志物特征数据包括:
测试终点与参考终点之间的偏差;
测试起点与参考起点之间的偏差;和/或
测试起点和参考终点之间的偏差。
实施例81:根据实施例80所述的计算机实现方法,其中:
经提取的数字生物标志物特征数据是临床参数。
实施例82:根据实施例80所述的计算机实现方法,其进一步包括:
从经提取的数字生物标志物特征数据来计算临床参数。
实施例83:根据实施例80至82中任一项所述的计算机实现方法,其中:
参考起点与参考终点相同,并且参考路径为闭合路径。
实施例84:根据实施例83所述的计算机实现方法,其中:
闭合路径是正方形、圆形或八字形。
实施例85:根据实施例80至82中任一项所述的计算机实现方法,其中:
参考起点与参考终点不同,并且参考路径为开放路径;并且
数字生物标志物特征数据是测试终点与参考终点之间的偏差。
实施例86:根据实施例85所述的计算机实现方法,其中:
开放路径是直线或螺旋形。
实施例87:根据实施例80至86中任一项所述的计算机实现方法,其中:
该方法包括:
从触摸屏显示器接收多个输入,该多个输入中的每一个指示由用户尝试在移动装置的显示器上描绘参考路径所描绘的相应的测试路径,该测试路径包括:测试起点、测试终点和测试起点与测试终点之间所描绘的测试路径;
从多个经接收的输入中的每一个提取数字生物标志物特征数据,从而生成相应的多个数字生物标志物特征数据片段,每个数字生物标志物特征数据片段包括:
相应的经接收的输入的测试终点与参考终点之间的偏差;
测试起点与参考起点之间的偏差;和/或
相应的输入的测试起点与测试终点之间的偏差。
实施例88:根据实施例87所述的计算机实现方法,其中:
该方法包括:
从多个数字生物标志物特征数据片段得出统计参数。
实施例89:根据实施例88所述的计算机实现方法,其中:
统计参数包括以下中的一者或多者:
平均值;
标准偏差;
百分位数;
峰度;以及
中位数。
实施例90:根据实施例87至89中任一项所述的计算机实现方法,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示由用户尝试使用其惯用手在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第一子集具有经提取的数字生物标志物数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示由用户尝试使用其非惯用手在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第二子集具有经提取的数字生物标志物数据片段的相应的第二子集;
所述方法进一步包括:
得出对应于所述经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于所述经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;以及
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算惯用手参数。
实施例91:根据实施例87至90中任一项所述的计算机实现方法,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示由用户尝试沿第一方向在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第一子集具有经提取的数字生物标志物数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示由用户尝试沿与第一方向相反的第二方向在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第二子集具有经提取的数字生物标志物数据片段的相应的第二子集;
所述方法进一步包括:
得出对应于所述经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于所述经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;以及
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算方向性参数。
实施例92:根据实施例80至91中任一项所述的计算机实现方法,其进一步包括以下步骤:
将至少一个分析模型应用于数字生物标志物特征数据;
基于至少一个分析模型的输出来确定临床参数。
实施例93:根据实施例92所述的计算机实现方法,其中:
分析模型包括经训练的机器学习模型。
实施例94:根据实施例93所述的计算机实现方法,其中:
分析模型为回归模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
线性回归;
偏最小二乘(PLS);
随机森林(RF);以及
极端随机树(XT)。
实施例95:根据实施例93所述的计算机实现方法,其中:
分析模型为分类模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
支持向量机(SVM);
线性判别分析;
二次判别分析(QDA);
朴素贝叶斯(NB);
随机森林(RF);以及
极端随机树(XT)。
实施例96:根据实施例80至95中任一项所述的计算机实现方法,其中:
待预测状态的疾病为多发性硬化症并且临床参数包括扩展残疾状态量表(EDSS)值,
待预测状态的疾病为脊髓性肌萎缩并且临床参数包括用力肺活量(FVC)值,或者
其中待预测状态的疾病为亨廷顿病并且临床参数包括总运动评分(TMS)值。
实施例97:根据实施例80至96中任一项所述的计算机实现方法,其中:
该方法进一步包括确定至少一个分析模型,其中确定至少一个分析模型包括:
(a)经由至少一个通信接口接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个所测量的值;
(b)从输入数据集确定至少一个训练数据集和至少一个测试数据集;
(c)通过用所训练的数据集训练包括至少一个算法的机器学习模型来确定分析模型;
(d)使用经确定的分析模型预测测试数据集的临床参数;
(e)基于所预测的临床参数和测试数据集的临床参数的真值来确定经确定的分析模型的性能。
实施例98:根据实施例97所述的计算机实现方法,其中:
在步骤(c)中,通过用训练数据集训练多个机器学习模型来确定多个分析模型,其中机器学习模型通过它们的算法来区分,其中在步骤d)中,使用经确定的分析模型针对测试数据集预测多个临床参数,并且
其中在步骤(e)中,基于所预测的临床参数和测试数据集的临床参数的真值来确定经确定的分析模型中的每一个的性能,其中该方法进一步包括确定具有最佳性能的分析模型。
实施例99:一种用于定量确定指示疾病的状态或进展的临床参数的系统,该系统包括:
具有触摸屏显示器、用户输入界面和第一处理单元的移动装置;以及
第二处理单元;
其中:
所述移动装置被配置为向其用户提供远端运动测试,其中提供所述远端运动测试包括:
第一处理单元使移动装置的触摸屏显示器显示图像,该图像包括:参考起点、参考终点和在起点与终点之间的待描绘的参考路径的指示;
用户输入界面被配置为从触摸屏显示器接收指示由用户尝试在移动装置的显示器上描绘参考路径所描绘的测试路径的输入,该测试路径包括:测试起点、测试终点和测试起点与测试终点之间所描绘的测试路径;
第一处理单元或第二处理单元被配置为从经接收的输入提取数字生物标志物特征数据,该数字生物标志物特征数据包括:
测试终点与参考终点之间的偏差;和/或
测试起点和测试终点之间的偏差。
实施例100:根据实施例99所述的系统,其中:
经提取的数字生物标志物特征数据是临床参数。
实施例101:根据实施例99所述的系统,其中:
第一处理单元或第二处理单元被配置为从经提取的数字生物标志物特征数据计算临床参数。
实施例102:根据实施例99至101中任一项所述的系统,其中:
参考起点与参考终点相同,并且参考路径为闭合路径。
实施例103:根据实施例102所述的系统,其中:
闭合路径是正方形、圆形或八字形。
实施例104:根据实施例99至101中任一项所述的实施例的系统,其中:
参考起点与参考终点不同,并且参考路径为开放路径;并且
数字生物标志物特征数据是测试终点与参考终点之间的偏差。
实施例105:根据实施例104所述的系统,其中:
开放路径是直线或螺旋形。
实施例106:根据实施例99至105中任一项所述的系统,其中:
用户输入界面被配置为从触摸屏显示器接收多个输入,多个输入中的每一个指示由用户尝试在移动装置的显示器上描绘参考路径所描绘的相应的测试路径,该测试路径包括:测试起点、测试终点和测试起点与测试终点之间所描绘的测试路径;并且
第一处理单元或第二处理单元被配置为从多个经接收的输入中的每一个提取数字生物标志物特征数据,从而生成相应的多个数字生物标志物特征数据片段,每个数字生物标志物特征数据片段包括:
相应的经接收的输入的测试终点与参考终点之间的偏差;
测试起点与参考起点之间的偏差;和/或
相应的输入的测试起点与测试终点之间的偏差。
实施例107:根据实施例106所述的系统,其中:
第一处理单元或第二处理单元进一步被配置为从多个数字生物标志物特征数据片段得出统计参数。
实施例108:根据实施例107所述的系统,其中:
统计参数包括以下中的一者或多者:
平均值;
标准偏差;
百分位数;
峰度;以及
中位数。
实施例109:根据实施例106至108中任一项所述的系统,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示由用户尝试使用其惯用手在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第一子集具有经提取的数字生物标志物数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示由用户尝试使用其非惯用手在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第二子集具有经提取的数字生物标志物数据片段的相应的第二子集;并且
第一处理单元或第二处理单元被配置为:
得出对应于经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;并且
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算惯用手参数。
实施例110:根据实施例106至109中任一项所述的系统,其中:
多个经接收的输入包括:
经接收的输入的第一子集,每个指示由用户尝试沿第一方向在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第一子集具有经提取的数字生物标志物数据片段的相应的第一子集;以及
经接收的输入的第二子集,每个指示由用户尝试沿与第一方向相反的第二方向在移动装置的触摸屏显示器上描绘参考路径所描绘的相应的测试路径,经接收的输入的第二子集具有经提取的数字生物标志物数据片段的相应的第二子集;
第一处理单元或第二处理单元被配置为:
得出对应于经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;并且
通过计算第一统计参数与第二统计参数之间的差,并且任选地将该差除以第一统计参数或第二统计参数,来计算方向性参数。
实施例111:根据实施例99至110中任一项所述的系统,其中:
第二处理单元被配置为将至少一个分析模型应用于数字生物标志物特征数据或从数字生物标志物特征数据得出的统计参数,并且基于至少一个分析模型的输出来预测至少一个临床参数的值。
实施例112:根据实施例111所述的系统,其中:
分析模型包括经训练的机器学习模型。
实施例113:根据实施例112所述的系统,其中:
分析模型为回归模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
线性回归;
偏最小二乘(PLS);
随机森林(RF);以及
极端随机树(XT)。
实施例114:根据实施例112所述的系统,其中:
分析模型为分类模型,并且经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
支持向量机(SVM);
线性判别分析;
二次判别分析(QDA);
朴素贝叶斯(NB);
随机森林(RF);以及
极端随机树(XT)。
实施例115:根据实施例99至114中任一项所述的系统,其中:
待预测状态的疾病为多发性硬化症并且临床参数包括扩展残疾状态量表(EDSS)值,
待预测状态的疾病为脊髓性肌萎缩并且临床参数包括用力肺活量(FVC)值,或者
其中待预测状态的疾病为亨廷顿病并且临床参数包括总运动评分(TMS)值。
实施例116:根据实施例99至115中任一项所述的系统,其中:
第一处理单元和第二处理单元是相同的处理单元。
实施例117:根据实施例99至115中任一项所述的系统,其中:
第一处理单元与第二处理单元分离。
实施例118:根据实施例99至117中任一项所述的系统,其进一步包括用于确定用于预测指示疾病的状态的至少一个临床参数的至少一个分析模型的机器学习系统,该机器学习系统包括:
至少一个通信接口,该至少一个通信接口被配置用于接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
至少一个模型单元,所述至少一个模型单元包括至少一个机器学习模型,所述至少一个机器学习模型包括至少一种算法;
至少一个处理单元,其中处理单元被配置用于从输入数据集中确定至少一个训练数据集和至少一个测试数据集,其中处理单元被配置用于通过利用训练数据集训练机器学习模型来确定分析模型,其中处理单元被配置用于使用经确定的分析模型来预测测试数据集的临床参数,其中处理单元被配置用于基于所预测的临床参数和测试数据集的临床参数的真值来确定经确定的分析模型的性能,其中处理数据是第一处理单元或第二处理单元。
实施例119:一种计算机实现方法,包括以下中的一者、两者或全部:
根据实施例1至38中任一项所述的步骤;
根据实施例78所述的步骤;以及
根据实施例80至98中任一项所述的步骤。
实施例120:一种系统,包括以下中的一者、两者或全部:
根据实施例39至77中任一项所述的系统;
根据实施例79所述的系统;以及
根据实施例99至118中任一项所述的系统。
疾病的状态或进展的预测
上述公开内容主要涉及指示疾病的状态或进展的临床参数的确定。然而,在一些情况下,本发明可以提供一种确定疾病的状态或进展的计算机实现方法,该计算机实现方法包括:向移动装置的用户提供远端运动测试,该移动装置具有触摸屏显示器,其中向移动装置的用户提供远端运动测试包括:使移动装置的触摸屏显示器显示测试图像;从移动装置的触摸屏显示器接收输入,该输入指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试;以及从经接收的输入提取数字生物标志物特征数据,其中,以下任一项:(I)经提取的数字生物标志物特征数据是临床参数,或者(ii)该方法进一步包括从经提取的数字生物标志物特征数据来计算临床参数;并且基于经确定的临床参数确定疾病的状态或进展。
等同地,本发明的进一步的方面提供了一种用于确定疾病的状态或进展的系统,该系统包括:具有触摸屏显示器、用户输入界面和第一处理单元的移动装置;以及第二处理单元;其中:移动装置被配置为向其用户提供远端运动测试,其中提供远端运动测试包括:第一处理单元使移动装置的触摸屏显示器显示测试图像;用户输入界面被配置为从触摸屏显示器接收指示用户将第一手指放在测试图像中的第一点上和将第二手指放在测试图像中的第二点上并且将第一手指和第二手指掐捏在一起从而使第一点和第二点靠在一起的尝试的输入;第一处理单元或第二处理单元被配置为从经接收的输入提取数字生物标志物特征数据,并且基于经提取的数字生物标志物特征数据确定临床参数;并且第一处理单元或第二处理单元被配置为基于经确定的临床参数来确定疾病的状态或进展。
本发明的进一步的方面可以提供一种用于确定疾病的状态或进展的计算机实现方法,该计算机实现方法包括:从移动装置接收输入,该输入包括:来自加速度计的加速度数据,该加速度数据包括多个点,每个点对应于相应时间处的加速度;从经接收的输入提取数字生物标志物特征数据,其中提取数字生物标志物特征数据包括:对于多个点中的每一个,确定相应时间处的加速度的总大小与加速度的z分量的大小的比率;并且从多个经确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度;并且基于经确定的统计参数确定疾病的状态或进展。
本发明的进一步的方面提供了一种用于确定疾病的状态或进展的系统,该系统包括:具有加速度计和第一处理单元的移动装置;以及第二处理单元;其中:加速度计被配置为测量加速度,并且加速度计、第一处理单元或第二处理单元中的任一项被配置为生成包括多个点的加速度数据,每个点对应于相应时间处的加速度;第一处理单元或第二处理单元被配置为通过以下方式从经接收的输入提取数字生物标志物特征数据:对于多个点中的每一个,确定相应时间处的加速度的总大小与加速度的z分量的大小的比率;并且从多个经确定的比率得出统计参数,该统计参数包括平均值、标准偏差、百分位数、中位数和峰度;并且第一处理单元或第二处理单元被配置为基于统计参数确定疾病的状态或进展。
应当明确地理解,这里阐述的本发明的四个方面的特征可以与上面阐述的任何“实施例”的特征结合,除非明显不兼容或者上下文另有规定。本发明的这两个方面的特征还可以与任何随后公开的内容相结合。
本公开的附加的相关方面
在本公开的相关方面,提出了一种用于确定至少一个分析模型以用于预测指示疾病的状态的至少一个目标变量的机器学习系统。该机器学习系统包括:
-至少一个通信接口,该至少一个通信接口被配置用于接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
-至少一个模型单元,所述至少一个模型单元包括至少一个机器学习模型,所述至少一个机器学习模型包括至少一种算法;
-至少一个处理单元,其中该处理单元被配置用于从输入数据集中确定至少一个训练数据集和至少一个测试数据集,其中该处理单元被配置用于通过利用训练数据集训练机器学习模型来确定分析模型,其中该处理单元被配置用于使用所确定的分析模型来针对测试数据集预测目标变量,其中该处理单元被配置用于基于所预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型的性能。
如本文所用,术语“机器学习”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于使用人工智能(AI)来对分析模型进行自动模型构建的方法。如本文所用,术语“机器学习系统”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于包括至少一个处理单元诸如处理器、微处理器或被配置用于机器学习,特别是用于执行给定算法中的逻辑的计算机系统的系统。该机器学习系统可被配置用于执行和/或实施至少一种机器学习算法,其中该机器学习算法被配置用于基于训练数据来构建至少一个分析模型。
如本文所用,术语“分析模型”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于被配置用于针对至少一个状态变量预测至少一个目标变量的数学模型。所述分析模型可为回归模型或分类模型。如本文所用,术语“回归模型”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于包括至少一种监督学习算法的分析模型,该至少一种监督学习算法具有一定范围内的数值作为输出。如本文所用,术语“分类模型”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于包括至少一种监督学习算法的分析模型,该至少一种监督学习算法具有诸如“生病”或“健康”的分类词作为输出。
如本文所用,术语“目标变量”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于待预测的临床值。待预测的目标变量值可取决于其存在或状态为待预测的疾病。所述目标变量可为数值变量或分类变量。例如,所述目标变量可为分类变量,在存在疾病的情况下可为“阳性”,或在不存在疾病的情况下可为“阴性”。
所述目标变量可为数值变量,诸如至少一个值和/或标度值。
例如,状态为待预测的疾病为多发性硬化症。如本文所用,术语“多发性硬化症(MS)”涉及中枢神经系统(CNS)疾病,该疾病通常导致患有该疾病的受试者长期和严重的残疾。MS有四种标准化亚型定义,它们也包括在根据本发明使用的术语中:复发缓解型、继发进展型、原发进展型和进展复发型。MS的复发形式这一术语也被使用,并包括具有叠加复发的复发缓解型和继发进展型MS。复发缓解亚型的特征是不可预测的复发,然后是数月至数年的没有新的临床疾病活动迹象的缓解期。在发作(活动状态)期间遭受的缺陷可能会解决或留下后遗症。这描述了患有MS的受试者中85%至90%的初始过程。继发进展型MS描述了那些最初患有复发缓解型MS的患者,然后他们在急性发作之间开始出现进行性神经性衰退,没有任何明确的缓解期。偶尔会出现复发和轻微缓解。从疾病发作到从复发缓解型转变为继发进展型MS的中位时间约为19年。原发进展亚型描述了大约10%至15%的受试者在其最初的MS症状后从未缓解。它的特点是从发作就进展性残疾,没有或只有偶尔和轻微的缓解和改善。原发进展亚型的发作年龄晚于其他亚型。进展复发MS描述了那些从一发作就具有稳定的神经性衰退但也遭受明显叠加发作的受试者。现在公认的是,该后一种进展复发表型是原发进展型MS(PPMS)的一种变体,根据McDonald 2010标准对PPMS的诊断包括进展复发变体。
与MS相关的症状包括感觉变化(感觉迟钝和感觉异常)、肌肉无力、肌肉痉挛、移动困难、协调和平衡困难(共济失调)、言语问题(构音障碍)或吞咽问题(吞咽困难)、视觉问题(眼球震颤、视神经炎和视力下降或复视)、疲劳、急性或慢性疼痛、膀胱、性和肠道功能困难。不同程度的认知损害以及抑郁或情绪不稳定的情绪症状也是常见的症状。残疾进展和症状严重程度的主要临床测量法是扩展残疾状态量表(EDSS)。MS的其他症状在本领域是众所周知的并且在医学和神经病学的标准教科书中有所描述。
如本文所用,术语“进展中的MS”是指一种状况,其中疾病和/或其症状中的一种或多种随时间会恶化。通常,进展伴随着活化状态的出现。所述进展可以发生在疾病的所有亚型中。然而,根据本发明,通常应在患有复发缓解型MS的受试者中确定“进展中的MS”。
确定多发性硬化症的状态,通常包括评估与多发性硬化症相关的至少一种症状,这些症状选自由以下项组成的组:精细运动能力受损、固定需求、手指麻木、疲劳和昼夜节律改变、步态问题和行走困难、认知障碍(包括处理速度问题)。多发性硬化症中的残疾可根据以下中所述的扩展残疾状态量表(EDSS)进行量化:Kurtzke JF,"Rating neurologicimpairment in multiple sclerosis:an expanded disability status scale(EDSS)",November1983,Neurology.33(11):1444–52.doi:10.1212/WNL.33.11.1444.PMID6685237。目标变量可为EDSS值。
因此,本文使用的术语“扩展残疾状态量表(EDSS)”是指基于对患有MS的受试者的残疾的定量评估的评分(Krutzke 1983)。EDSS基于临床医生的神经学检查。EDSS通过在每个功能系统中分配功能系统评分(FSS)来量化八个功能系统中的残疾。功能系统是锥体系统、小脑系统、脑干系统、感觉系统、肠和膀胱系统、视觉系统、大脑系统和其他(其余)系统。EDSS步骤1.0至4.5是指完全可走动的患有MS的受试者,EDSS步骤5.0至9.5表征那些有行走障碍的受试者。
每个可能结果的临床意义如下:
·0.0:正常的神经学检查
·1.0:1FS无残疾,轻微迹象
·1.5:1FS以上无残疾,轻微迹象
·2.0:1FS轻微残疾
·2.5:1FS轻度残疾或2FS轻微残疾
·3.0:1FS中度残疾或3-4FS轻度残疾,但完全可走动
·3.5:完全可走动,但1FS中度残疾,并且1或2FS轻度残疾;或2FS中度残疾;或5FS轻度残疾
·4.0:尽管有相对严重的残疾,但在没有辅助的情况下完全可走动,多至一天大约12小时。可以在没有辅助的情况下行走500米
·4.5:在没有辅助的情况下完全可走动,多至一天中的大部分时间可起床走动、能够工作一整天,或者可能会有一些完全活动的限制或需要轻微的辅助。相对严重的残疾。可以在没有辅助的情况下行走300米
·5.0:无辅助可走动约200米。残疾影响完全的日常活动
·5.5:可走动100米,残疾妨碍完全的日常活动
·6.0:在休息或不休息的情况下行走100米需要间歇性或单边的持续辅助(手杖、拐杖或支架)
·6.5:不休息行走20米需要持续的双边支持(手杖、拐杖或支架)
·7.0:即使有辅助也无法行走超过5米,基本上限于轮椅、车轮本身、单独转移;每天在轮椅上活动约12小时
·7.5:不能多走几步,限于轮椅,可能需要辅助才能转移;车轮本身,但可能需要电动椅进行全天活动
·8.0:基本上限于床、椅子或轮椅,但可能一天的大部分时间都不在床上;保留自理功能,通常有效使用手臂
·8.5:基本上一天的大部分时间都限于床,部分有效地使用手臂,保留部分自理功能
·9.0:无助的卧床患者,能沟通和进食
·9.5:无法有效沟通或进食/吞咽
·10.0:因MS死亡
例如,状态为待预测的疾病为脊髓性肌萎缩。
如本文所用,术语“脊髓性肌萎缩(SMA)”涉及以运动神经元功能丧失(通常在脊髓中)为特征的神经肌肉疾病。作为运动神经元功能丧失的结果,通常会发生肌肉萎缩,导致受影响的受试者过早死亡。该疾病是由SMN1基因中的遗传性遗传缺陷引起的。由所述基因编码的SMN蛋白是运动神经元存活所必需的。该疾病以常染色体隐性方式遗传。
与SMA相关联的症状包括反射消失,特别是四肢的反射消失,肌肉无力和肌张力低下,由于出现呼吸肌无力、呼吸问题以及肺部分泌物积聚而导致儿童期发育阶段的完成困难,以及吸吮、吞咽和喂食/进食困难。四种不同类型的SMA是已知的。
婴儿型SMA或SMA1(遗传性早发性脊髓性肌萎缩病)是在生命的最初几个月表现的严重的形式,通常发病迅速且出乎意料(婴松软综合征)。快速的运动神经元死亡导致主要身体器官、特别是呼吸系统的效率低下,肺炎引起的呼吸衰竭是最常见的死亡原因。除非进行机械通气,否则诊断出患有SMA1的婴儿通常不会活过两岁,在最严重的情况下,最早会在几周内死亡,有时称为SMA0。利用适当的呼吸支持,已知约占SMA1病例的10%的SMA1表型较轻的患者可以活到青春期和成年期。
中间型SMA或SMA2(杜博维兹病)影响那些永远无法站立和行走但能够在一生中至少一段时间保持坐姿的儿童。通常在6到18个月之间的某个时间会注意到无力的发作。已知进展会不同。有些人随着时间的推移逐渐变得虚弱,而另一些人则通过精心维护避免任何进展。在这些儿童中可能存在脊柱侧弯,并且使用支具进行矫正可能有助于改善呼吸。肌肉无力,且呼吸系统是主要问题。预期寿命有所降低,但大多数患有SMA2的人都能很好地活到成年。
青少年型SMA或SMA3(库格尔贝格-韦兰德病)通常在12个月大后表现,并描述患有SMA3的人在某些时候能够在没有支撑的情况下行走,尽管许多人后来失去了这种能力。呼吸道受累不太明显,预期寿命正常或接近正常。
成人型SMA或SMA4一般在生命的三十岁后表现,伴有肌肉逐渐无力,其影响四肢的近端肌,经常需要人们使用轮椅来移动。其他并发症很少见,预期寿命不受影响。
通常,根据本发明的SMA为SMA1(遗传性早发性脊髓性肌萎缩病)、SMA2(杜博维兹病)、SMA3(库格尔贝格-韦兰德病)或SMA4
SMA通常通过张力减退和反射缺失的存在来进行诊断。两者都可以由医院的临床医生通过标准技术(包括肌电图)进行测量。有时,血清肌酸激酶作为生化参数可能增加。此外,也可以进行基因检测,特别是作为产前诊断或携带者筛查。此外,SMA管理中的关键参数是呼吸系统的功能。通常,呼吸系统的功能可以通过测量受试者的用力肺活量来进行确定,受试者的用力肺活量将指示由于SMA导致的呼吸系统的损伤程度。
如本文所用,术语“用力肺活量(FVC)”是由受试者完全吸气后能够用力吹出的肺部中的气量(以升为单位)。用力肺活量通常通过医院的肺活量测定法或在医生住院部使用肺活量测定装置来进行确定。
确定脊髓性肌萎缩的状态通常包括评估与选自由以下项组成的组的脊髓性肌萎缩相关联至少一种的症状:肌张力减退和肌肉无力、疲劳和昼夜节律的变化。脊髓性肌萎缩的状态的衡量标准可能是用力肺活量(FVC)。FVC可能是在完全吸气后可用力吹出的空气量的定量测量,单位为升,请参阅https://en.wikipedia.org/wiki/Spirometry。目标变量可为FVC值。
例如,状态为待预测的疾病为亨廷顿病。
如本文所用,术语“亨廷顿病(HD)”涉及中枢神经系统中伴随神经元细胞死亡的遗传性神经障碍。最突出的是,基底神经节受到细胞死亡的影响。还涉及大脑的其他区域,诸如黑质、大脑皮层、海马和浦肯野细胞。通常,所有区域都在运动和行为控制中发挥作用。这种疾病是由编码亨廷顿蛋白的基因中的基因突变引起的。亨廷顿蛋白是一种参与各种细胞功能的蛋白质,并与100多种其他蛋白质相互作用。突变的亨廷顿蛋白似乎对某些神经元细胞类型具有细胞毒性。突变的亨廷顿蛋白的特征在于由亨廷顿蛋白基因中的三核苷酸重复引起的聚谷氨酰胺区域。蛋白质的多聚谷氨酰胺区域中超过36个谷氨酰胺残基的重复导致引起疾病的亨廷顿蛋白。
这种疾病的症状最常见于中年,但可从婴儿到老年的任何年龄开始。在早期阶段,症状涉及人格、认知和身体技能的细微变化。身体症状通常是最先被注意到的,因为认知和行为症状通常不太严重,无法在所述早期阶段自行识别。几乎所有患有HD的人最终都会表现出相似的身体症状,但认知和行为症状的发作、进展和程度在个体之间存在显著差异。最典型的初始身体症状是痉挛、随机和无法控制的运动,称为舞蹈病。舞蹈病最初可能表现为全身不安、小幅度的无意启动或未完成的动作、缺乏协调性或眼球扫视运动缓慢。这些轻微的运动异常通常先于更明显的运动功能障碍迹象至少三年。随着疾病的进展,会出现明显的症状,例如僵硬、扭动动作或异常姿态。这些迹象表明大脑中负责运动的系统受到了影响。精神运动功能变得越来越受损,以至于任何需要肌肉控制的动作都会受到影响。常见的后果是身体不稳定,面部表情异常,咀嚼、吞咽和说话困难。因此,这种疾病也伴随着饮食困难和睡眠障碍。认知能力也以渐进的方式受损。执行功能、认知灵活性、抽象思维、规则获取和适当的行动/反应能力受损。在更明显的阶段,往往会出现记忆缺陷,包括短期记忆缺陷到长期记忆困难。认知问题会随着时间的推移而恶化,最终会变成痴呆症。HD伴随的精神并发症是焦虑、抑郁、情绪表现减少(情感迟钝)、自我中心主义、攻击性和强迫性行为,后者可导致或加重成瘾,包括酗酒、赌博和性欲亢进。
没有治愈HD的方法。根据要解决的症状,在疾病管理中有支持性措施。此外,许多药物用于改善疾病、其进展或伴随它的症状。川芎嗪已被批准用于治疗HD,包括抗精神病药和苯二氮卓类药物,它们被用作帮助减少舞蹈病的药物,金刚烷胺或瑞马西胺仍在研究中,但已显示出初步的积极结果。运动功能减退和强直,尤其是青少年病例,可用抗帕金森药物治疗,而肌阵挛运动亢进可用丙戊酸治疗。研究发现,乙基二十碳五烯酸可增强患者的运动症状,但其长期影响尚需揭示。
这种疾病可通过基因检测来诊断。此外,疾病的严重程度可根据统一亨廷顿病评定量表(UHDRS)进行分级。该量表系统涉及四个组成部分,即运动功能、认知、行为和功能能力。运动功能评估包括眼追踪、扫视启动、扫视速度、构音障碍、舌头突出、最大肌张力障碍、最大舞蹈症、后徙拉力测试、手指敲击、旋前/旋后手、尿失禁、手臂僵硬、身体运动迟缓、步态和串联行走的评估,可概括为总运动评分(TMS)。运动功能必须由医生进行调查和判断。
确定亨廷顿病的状态通常包括评估与亨廷顿病相关联的至少一种症状,该症状选自由以下项组成的组:精神运动迟缓、舞蹈病(抽搐、扭动)、进行性构音障碍、僵硬和肌张力障碍、社交退缩、处理速度的进行性认知障碍、注意力、计划、视觉空间处理、学习(尽管完整回忆)、疲劳和昼夜节律的变化。状态的衡量标准是总运动评分(TMS)。目标变量可为总运动评分(TMS)。因此,如本文所用,术语“总运动评分(TMS)”是指基于对眼追踪、扫视启动、扫视速度、构音障碍、舌头突出、最大肌张力障碍、最大舞蹈症、后徙拉力测试、手指敲击、旋前/旋后手、尿失禁、手臂僵硬、身体运动迟缓、步态和串联行走的评估而获得的评分。
如本文所用,术语“状态变量”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于可填充在预测模型中的输入变量,诸如通过受试者的体检和/或自我检查得出的数据。该状态变量可在至少一项主动测试和/或至少一项被动监测中确定。例如,该状态变量可在主动测试(诸如至少一项认知测试和/或至少一项手部运动功能测试和/或至少一项移动性测试)中确定。
如本文所用,术语“受试者”涉及哺乳动物。据本发明的受试者通常可能患有或将被怀疑患有疾病,即其可能已经表现出与所述疾病相关联的一些或全部阴性症状。在本发明的实施例中,所述受试者是人。
可通过使用受试者的至少一个移动装置来确定状态变量。如本文所用,术语“移动装置”是广义术语,并且将被赋予对于本领域普通技术人员普通和惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于移动电子装置,更具体地是指包括至少一个处理器的移动通信装置。移动装置具体地可为移动电话或智能电话。移动装置还可指平板计算机或任何其他类型的便携式计算机。移动装置可包括可被配置用于数据采集的数据采集单元。移动装置可被配置用于定量或定性地检测和/或测量物理参数并将它们转换成电子信号,诸如用于进一步处理和/或分析。为此目的,移动装置可包括至少一个传感器。应当理解,在移动装置中可使用多于一个传感器,即至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或甚至更多个不同的传感器。传感器可为选自由以下项组成的组的至少一个传感器:至少一个陀螺仪、至少一个磁力仪、至少一个加速度计、至少一个接近传感器、至少一个温度计、至少一个计步器、至少一个指纹检测器、至少一个触摸传感器、至少一个录音机、至少一个光传感器、至少一个压力传感器、至少一个位置数据检测器、至少一个相机、至少一个GPS等。移动装置可包括处理器和至少一个数据库以及有形地嵌入到所述装置并且当在所述装置上运行时执行数据采集方法的软件。移动装置可包括用户界面,诸如显示器和/或至少一个键,例如用于执行数据采集方法中请求的至少一项任务。
如本文所用,术语“预测”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于确定指示至少一个状态变量的疾病状态的至少一个数值或分类值。特别地,该状态变量可作为输入填充在分析中,并且分析模型可被配置用于对状态变量执行至少一次分析,以确定指示疾病状态的至少一个数值或分类值。该分析可包括使用至少一种经训练算法。
如本文所用,术语“确定至少一个分析模型”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于构建和/或创建分析模型。
如本文所用,术语“疾病状态”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于健康状况和/或医学状况和/或疾病阶段。例如,所述疾病状态可为健康或生病和/或存在或不存在疾病。例如,所述疾病状态可为与指示疾病阶段的标度有关的值。如本文所用,术语“指示疾病状态”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于与疾病状态直接相关的信息和/或与疾病状态间接相关的信息,例如需要进一步分析和/或处理以获得疾病状态的信息。例如,所述目标变量可能是需要与表和/或查找表进行比较以确定疾病状态的值。
如本文所用,术语“通信接口”是一个广义术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可以指但不限于形成边界的物项或元件,该边界配置成用于传输信息。特别地,通信接口可配置成用于传输来自计算装置(例如计算机)的信息,诸如将信息发送或输出到例如另一装置上。附加地或另选地,通信接口可配置成用于将信息传输到计算装置上(例如传输到计算机上),诸如,以便接收信息。通信接口可具体地提供用于传输或交换信息的途径。特别地,通信接口可提供数据传输连接,例如蓝牙、NFC、电感耦合等。作为示例,通信接口可以是或可包括至少一个端口,该端口包括网络或Internet端口、USB端口和磁盘驱动器中的一者或多者。通信接口可为至少一个Web接口。
如本文所用,术语“输入数据”是一个广义术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于用于模型构建的实验数据。该输入数据包括一组历史数字生物标志物特征数据。如本文所用,术语“生物标志物”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于生物状态和/或生物状况的可测量特征。如本文所用,术语“特征”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于预测所基于的疾病症状的可测量性质和/或特性。特别地,可考虑来自所有测试的所有特征,并确定每个预测的最优特征集。因此,可考虑每种疾病的所有特征。如本文所用,术语“数字生物标志物特征数据”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于由至少一个数字装置(诸如移动装置)确定的实验数据,该实验数据包括每个受试者的与疾病症状相关的多个不同测量值。可通过使用至少一个移动装置来确定数字生物标志物特征数据。关于移动装置和利用移动装置确定数字生物标志物特征数据,参考上面关于利用移动装置确定状态变量的描述。该组历史数字生物标志物特征数据包括每个受试者的多个测得值,这些测得值指示待预测的疾病状态。如本文所用,术语“历史”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于数字生物标志物特征数据在模型构建之前诸如在至少一个测试研究期间确定和/或收集的事实。例如,对于用于预测指示多发性硬化症的至少一个目标的模型构建,数字生物标志物特征数据可以是来自泛光灯POC研究的数据。例如,对于用于预测指示脊髓性肌萎缩的至少一个目标的模型构建,数字生物标志物特征数据可以是来自OLEOS研究的数据。例如,对于用于预测指示亨廷顿病的至少一个目标的模型构建,数字生物标志物特征数据可以是来自HD OLE研究,ISIS 44319-CS2的数据。可在至少一个主动测试和/或至少一个被动监测中确定输入数据。例如,可使用至少一个移动装置在主动测试(诸如至少一项认知测试和/或至少一项手部运动功能测试和/或至少一项移动性测试)中确定输入数据。
输入数据可进一步包括目标数据。如本文所用,术语“目标数据”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于包含要预测的临床值的数据,特别是每个受试者的一个临床值。目标数据可为数字数据或分类数据。临床值可直接或间接地反映疾病的状态。
处理单元可被配置用于从输入数据中提取特征。如本文所用,术语“提取特征”是一个广义术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于从输入数据确定和/或导出特征的至少一个过程。具体地,这些特征可以是预定义的,并且特征的子集可从可能的特征的整个集中选择。所述特征的提取可包括以下一项或多项:数据聚合、数据缩减、数据变换等。处理单元可被配置用于对特征进行排序。如本文所用,术语“排序特征”是一个广义术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于根据预定义标准为每个特征分配排序,特别是权重。例如,可根据特征的相关性(即与目标变量的相关性)对特征进行排序,和/或可根据冗余(即根据特征之间的相关性)对特征进行排序。处理单元可被配置用于通过使用最大相关最小冗余技术对特征进行排序。该方法使用相关和冗余之间的权衡对所有特征进行排序。具体地,特征选择和排序可如Ding C.、Peng H的“Minimum redundancy feature selection from microarray geneexpression data”,J Bioinform Comput Biol.2005Apr;3(2):185-205,PubMed PMID:15852500中所述进行。特征选择和排序可通过使用与Ding等人所述方法相比的改进的方法来执行。可使用最大相关系数而不是平均相关系数并且可对其应用加法变换。在回归模型作为分析模型的情况下,可将平均相关系数的值提高到5次方。在分类模型作为分析模型的情况下,可将平均相关系数的值乘以10。
如本文所用,术语“模型单元”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于被配置用于存储至少一个机器学习模型的至少一个数据存储装置和/或存储单元。如本文所用,术语“机器学习模型”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于至少一种可训练算法。模型单元可包括多个机器学习模型,例如用于构建回归模型的不同机器学习模型和用于构建分类模型的机器学习模型。例如,所述分析模型可为回归模型并且机器学习模型的算法可为选自由以下项组成的组的至少一种算法:k最近邻(kNN);线性回归;偏最小二乘(PLS);随机森林(RF);以及极端随机树(XT)。例如,所述分析模型可为分类模型并且机器学习模型的算法可为选自由以下项组成的组的至少一种算法:k最近邻(kNN);支持向量机(SVM);线性判别分析(LDA);二次判别分析(QDA);朴素贝叶斯(NB);随机森林(RF);以及极端随机树(XT)。
如本文所用,术语“处理单元”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于以下项:任意逻辑电路,其配置成用于执行计算机或系统的操作;和/或,一般而言,配置成用于执行计算或逻辑操作的装置。处理单元可包括至少一个处理器。特别是,处理单元可被配置成用于处理驱动计算机或系统的基本指令。作为示例,处理单元可包括至少一个算术逻辑单元(ALU)、至少一个浮点单元(FPU)(诸如数学协处理器或数值协处理器)、多个寄存器以及存储器(诸如高速缓冲存储器)。特别是,处理单元可为多核处理器。处理单元可被配置用于机器学习。处理单元可包括中央处理单元(CPU)和/或一个或多个图形处理单元(GPU)和/或一个或多个专用集成电路(ASIC)和/或一个或多个张量处理单元(TPU)和/或一个或多个现场可编程门阵列(FPGA)等。
处理单元可被配置用于预处理输入数据。预处理可包括用于满足至少一个质量标准的输入数据的至少一个过滤过程。例如,可对输入数据进行过滤,以删除缺失的变量。例如,该预处理可包括排除来自具有少于预定义的最小观察次数的受试者的数据。
如本文所用,术语“训练数据集”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于用于训练机器学习模型的输入数据的子集。如本文所用,术语“测试数据集”是一个广义术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于用于测试经训练的机器学习模型的输入数据的另一子集。该训练数据集可包括多个训练数据集。特别地,该训练数据集包括针对每个受试者的输入数据的训练数据集。该测试数据集可包括多个测试数据集。特别地,该测试数据集包括针对每个受试者的输入数据的测试数据集。处理单元可被配置用于针对每个受试者的输入数据生成和/或创建训练数据集和测试数据集,其中每个受试者的测试数据集可仅包括该受试者的数据,而该受试者的训练数据集包括所有其他输入数据。
处理单元可被配置用于对每个受试者的训练数据集和测试数据集两者执行至少一个数据聚合和/或数据变换。所述变换和特征排序步骤可在不拆分为训练数据集和测试数据集的情况下执行。这可能允许干扰例如数据中的重要特征。
处理单元可被配置用于针对训练数据集和测试数据集进行以下一项或多项:至少一次稳定变换;至少一次聚合;和至少一次归一化。
例如,处理单元可被配置用于训练数据集和测试数据集两者的受试者间数据聚合,其中为每个受试者确定特征的平均值。
例如,处理单元可被配置用于方差稳定,其中对于每个特征,应用至少一个方差稳定函数。该方差稳定函数可为选自由以下项组成的组的至少一个函数:logistic,如果所有值都大于300且没有值介于0和1之间,则可使用逻辑;logit,如果所有值都介于0和1之间(包括0和1),则可使用logit;sigmoid;log10,如果在所有值>=0时考虑,则可使用log10。处理单元可被配置用于使用每个方差变换函数来变换每个特征的值。处理单元可被配置用于使用特定标准来评估每个结果分布,包括原始分布。在分类模型作为分析模型的情况下,即当目标变量为离散变量时,所述标准可以是所获得的值能够在多大程度上区分不同的类别。具体地,所有类别间平均轮廓值的最大值可用于此目的。在回归模型作为分析模型的情况下,标准可以是在对目标变量应用方差稳定函数获得的值进行回归后获得的平均绝对误差。使用该选择标准,处理单元可被配置用于确定训练数据集上的最佳可能变换(如果有的话,优于原始值)。随后可将可能的最佳变换应用于测试数据集。
例如,处理单元可被配置用于z-分数变换,其中对于每个变换的特征,针对训练数据集确定平均值和标准偏差,其中这些值用于训练数据集和测试数据集两者上的z-分数变换。
例如,处理单元可被配置用于对训练数据集和测试数据集两者执行三个数据变换步骤,其中该变换步骤包括:1.受试者间数据聚合;2.方差稳定;3.z-分数变换。
处理单元可被配置用于确定和/或提供排序步骤和变换步骤的至少一个输出。例如,所述排序步骤和变换步骤的输出可包括至少一个诊断图。所述诊断图可包括至少一个主成分分析(PCA)图和/或至少一对比较与排序过程相关的关键统计数据的图。
处理单元被配置用于通过用训练数据集训练机器学习模型来确定分析模型。如本文所用,术语“训练机器学习模型”是广义的术语且被赋予对本领域普通技术人员而言普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于针对训练数据集确定机器学习模型的算法的参数的过程。所述训练可包括至少一个优化或调谐过程,其中确定最佳参数组合。可针对不同受试者的训练数据集迭代地执行训练。处理单元可被配置用于通过利用训练数据集训练机器学习模型来考虑不同数量的特征以用于确定分析模型。机器学习模型的算法可使用不同数量的特征(例如,取决于它们的排序)应用于训练数据集。所述训练可包括n次交叉验证法以获得模型参数的稳健估计。所述机器学习模型的训练可包括至少一个受控学习过程,其中选择至少一个超参数来控制训练过程。如有必要,重复训练步骤以测试超参数的不同组合。
特别是在机器学习模型的训练之后,处理单元被配置用于使用所确定的分析模型来针对测试数据集预测目标变量。如本文所用,术语“所确定的分析模型”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于经训练的机器学习模型。处理单元可被配置用于使用所确定的分析模型基于每个受试者的测试数据集来预测该受试者的目标变量。处理单元可被配置用于使用分析模型针对相应的训练数据集和测试数据集预测每个受试者的目标变量。处理单元可被配置用于例如在至少一个输出文件中记录和/或存储每个受试者的预测目标变量和每个受试者的目标变量的真值。如本文所用,术语“目标变量的真值”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于该受试者的目标变量的真值或实际值,其可从该受试者的目标数据中确定。
处理单元被配置用于基于预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型的性能。如本文所用,术语“性能”是广义的术语且被赋予对本领域普通技术人员而言其普通且惯常的含义,并且不限于特殊或自定义的含义。该术语具体地可指但不限于所确定的分析模型对预测目标变量的适用性。该性能可通过预测的目标变量和目标变量的真值之间的偏差来表征。机器学习系统可包括至少一个输出接口。输出接口可设计成与通信接口相同和/或可与通信接口一体形成。输出接口可被配置用于提供至少一个输出。该输出可包括关于所确定的分析模型的性能的至少一个信息。该关于所确定的分析模型的性能的信息可包括以下中的一项或多项:至少一个评分表、至少一个预测图、至少一个相关性图和至少一个残差图。
模型单元可包括多个机器学习模型,其中机器学习模型通过其算法来区分。例如,为了构建回归模型,模型单元可包括以下算法:k最近邻(kNN);线性回归;偏最小二乘(PLS);随机森林(RF);以及极端随机树(XT)。例如,为了构建分类模型,模型单元可包括以下算法:k最近邻(kNN);支持向量机(SVM);线性判别分析(LDA);二次判别分析(QDA);朴素贝叶斯(NB);随机森林(RF);以及极端随机树(XT)。处理单元可被配置用于通过利用训练数据集训练相应的机器学习模型来确定每个机器学习模型的分析模型,以及用于使用所确定的分析模型针对测试数据集预测目标变量。
处理单元可被配置用于基于预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型的性能。在构建回归模型的情况下,由处理单元提供的输出可包括以下一项或多项:至少一个评分表、至少一个预测图、至少一个相关性图和至少一个残差图。评分表可为箱形图,为每个受试者描绘了来自测试数据集和训练数据集两者以及每种类型的回归量(即,使用的算法)和所选特征的数量的平均绝对误差。预测图可针对回归量类型和特征数量的每种组合显示对于测试数据和训练数据两者,目标变量的预测值与真值的相关程度。相关图可显示对于每种回归量类型,预测目标变量与真实目标变量之间的斯皮尔曼相关系数,随模型中包含的特征数量的变化。残差图可显示对于回归量类型和特征数量的每种组合,以及对于测试和训练数据,预测目标变量与残差之间的相关性。处理单元可被配置用于确定具有最佳性能的分析模型,特别是基于输出。
在构建分类模型的情况下,处理单元提供的输出可包括评分表,该评分表以箱形图的形式示出来自测试数据和训练数据两者以及每种类型的回归量和所选特征的数量的每个受试者的平均F1表现分数,也表示为F分数或F度量。处理单元可被配置用于确定具有最佳性能的分析模型,特别是基于输出。
在本公开的进一步的相关方面,提出了一种用于确定至少一个分析模型以用于预测指示疾病的状态的至少一个目标变量的计算机实现方法。在该方法中,使用根据本发明的机器学习系统。因此,关于方法的实施例和定义,参考上面的机器学习系统的描述,或者如下文进一步详细描述。
该方法包括以下方法步骤,这些方法步骤可具体地以给定顺序执行。但是,不同的顺序也是可行的。完全或部分地同时执行两个或更多个方法步骤也是可能的。此外,一个或多个或甚至所有的方法步骤可执行一次或可重复执行,诸如重复一次或多次。此外,该方法可包括未列出的附加方法步骤。
所述方法包括以下步骤:
a)经由至少一个通信接口接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
在至少一个处理单元处:
b)从输入数据集中确定至少一个训练数据集和至少一个测试数据集;
c)通过利用所述训练数据集训练包括至少一种算法的机器学习模型来确定所述分析模型;
d)使用所确定的分析模型针对所述测试数据集预测所述目标变量;
e)基于所预测的目标变量和所述测试数据集的所述目标变量的真值来确定所确定的分析模型的性能。
在步骤c)中,可通过利用训练数据集训练多个机器学习模型来确定多个分析模型。该机器学习模型可通过其算法来区分。在步骤d)中,可使用所确定的分析模型针对测试数据集预测多个目标变量。在步骤e)中,可基于所预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型中的每一个的性能。该方法可进一步包括确定具有最佳性能的分析模型。
本文进一步公开并提出了一种用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的计算机程序,该计算机程序包括计算机可执行指令,当在计算机或计算机网络上执行该程序时,该计算机可执行指令用于在本文公开的一个或多个实施例中执行根据本发明的方法。具体地,计算机程序可存储在计算机可读数据承载件上和/或计算机可读存储介质上。计算机程序被配置为在本文所附的一个或多个实施例中执行根据本发明的方法的至少步骤b)至e)。
如本文所用,术语“计算机可读数据承载件”和“计算机可读存储介质”具体地可以指非暂时性数据存储装置,诸如具有存储在其上的计算机可执行指令的硬件存储介质。计算机可读数据承载件或存储介质具体地可以是或可包括诸如随机存取存储器(RAM)和/或只读存储器(ROM)之类的存储介质。
因此,具体地,可通过使用计算机或计算机网络,优选地通过使用计算机程序来执行如上文所指示的一个、多于一个或甚至所有方法步骤b)至e)。
本文进一步公开并提出了一种具有程序代码工具的计算机程序产品,以便在计算机或计算机网络上执行该程序时,在本文所附的一个或多个实施例中执行根据本发明的方法。具体地,程序代码工具可存储在计算机可读数据承载件上和/或计算机可读存储介质上。
本文进一步公开并提出了一种具有存储在其上的数据结构的数据承载件,在加载到计算机或计算机网络中之后,诸如在加载到计算机或计算机网络的工作存储器或主存储器中之后,该数据承载件可执行根据本文所公开的一个或多个实施例的方法。
本文进一步公开并提出了一种具有存储在机器可读承载件上的程序代码工具的计算机程序产品,以便在计算机或计算机网络上执行该程序时,执行根据本文所公开的一个或多个实施例的方法。如本文所用,计算机程序产品是指作为可交易产品的程序。该产品一般可以任意格式(诸如纸质格式)存在,或存在于计算机可读数据承载件和/或计算机可读存储介质上。具体地讲,计算机程序产品可以分布在数据网络上。
本文进一步公开并提出了一种包含可由计算机系统或计算机网络读取的指令的调制数据信号,用于执行根据本文所公开的一个或多个实施例的方法。
参考本发明的计算机实现方面,可通过使用计算机或计算机网络来执行根据本文所公开的一个或多个实施例的方法的一个或多个方法步骤或甚至所有方法步骤。因此,一般来讲,可通过使用计算机或计算机网络来执行包括提供和/或处理数据的任何方法步骤。一般来讲,这些方法步骤可包括通常除需要手动操作(诸如提供样品和/或执行实际测量的某些方面)的方法步骤之外的任何方法步骤。
具体地,本文进一步公开以下内容:
-计算机或计算机网络,该计算机或计算机网络包括至少一个处理器,其中该处理器适于执行根据本说明书中所描述的实施例之一的方法,
-一种计算机可加载数据结构,该计算机可加载数据结构适于当在计算机上执行该数据结构时,进行根据本说明书中所描述的实施例之一的方法,
-一种计算机程序,其中该计算机程序适于当在计算机上执行该程序时,执行根据本说明书中所描述的实施例之一的方法,
-一种计算机程序,其包括程序工具,该程序工具用于当在计算机上或在计算机网络上执行该计算机程序时,执行根据本说明书中所描述的实施例之一的方法,
-计算机程序,该计算机程序包括根据前述实施例的程序装置,其中这些程序装置存储在计算机可读的存储介质上,
-一种存储介质,其中数据结构存储在该存储介质上并且其中该数据结构适于在被加载到计算机或计算机网络的主存储器和/或工作存储器中之后,执行根据本说明书中所描述的实施例之一的方法,以及
-一种计算机程序产品,其具有程序代码工具,其中该程序代码工具能够被存储或被存储在存储介质上,以用于在计算机或计算机网络上执行该程序代码工具时,执行根据本说明书中所描述的实施例之一的方法。
在本发明的进一步方面中,提出了根据本文公开的实施例中的一个或多个实施例的机器学习系统预测以下中的一项或多项的用途:指示多发性硬化症的扩展残疾状态量表(EDSS)值、指示脊髓性肌萎缩的用力肺活量(FVC)值、或指示亨廷顿病的总运动评分(TMS)值。
根据本发明的装置和方法与用于预测疾病状态的已知方法相比具有若干优点。使用机器学习系统可允许分析大量复杂的输入数据,诸如在几项大型测试研究中确定的数据,并允许确定能够提供快速、可靠和准确结果的分析模型。
总结并且不排除进一步可能的实施例,可以设想以下附加实施例,其可以与前述实施例中的任何实施例结合:
附加实施例1:一种用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的机器学习系统,所述机器学习系统包括:
-至少一个通信接口,该至少一个通信接口被配置用于接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
-至少一个模型单元,所述至少一个模型单元包括至少一个机器学习模型,所述至少一个机器学习模型包括至少一种算法;
-至少一个处理单元,其中所述处理单元被配置用于从所述输入数据集中确定至少一个训练数据集和至少一个测试数据集,其中所述处理单元被配置用于通过利用所述训练数据集训练所述机器学习模型来确定所述分析模型,其中所述处理单元被配置用于使用所确定的分析模型来针对所述测试数据集预测所述目标变量,其中所述处理单元被配置用于基于所预测的目标变量和所述测试数据集的所述目标变量的真值来确定所确定的分析模型的性能。
附加实施例2:根据前一项实施例所述的机器学习系统,其中所述分析模型为回归模型或分类模型。
附加实施例3:根据前一项实施例所述的机器学习系统,其中所述分析模型为回归模型,其中所述机器学习模型的所述算法为选自由以下项组成的组的至少一种算法:k最近邻(kNN);线性回归;偏最小二乘(PLS);随机森林(RF);以及极端随机树(XT),或者其中所述分析模型为分类模型,其中所述机器学习模型的所述算法为选自由以下项组成的组的至少一种算法:k最近邻(kNN);支持向量机(SVM);线性判别分析(LDA);二次判别分析(QDA);朴素贝叶斯(NB);随机森林(RF);以及极端随机树(XT)。
附加实施例4:根据前述实施例中任一项所述的机器学习系统,其中所述模型单元包括多个机器学习模型,其中所述机器学习模型通过其算法来区分。
附加实施例5:根据前一项实施例所述的机器学习系统,其中所述处理单元被配置用于通过利用所述训练数据集训练相应的机器学习模型来确定所述机器学习模型中的每一个的分析模型以及被配置用于使用所确定的分析模型针对所述测试数据集预测所述目标变量,其中所述处理单元被配置用于基于所预测的目标变量和所述测试数据集的所述目标变量的所述真值来确定所确定的分析模型中的每一个的性能,其中所述处理单元被配置用于确定具有最佳性能的所述分析模型。
附加实施例6:根据前述实施例中任一项所述的机器学习系统,其中所述目标变量为待预测的临床值,其中所述目标变量为数字的或分类的。
附加实施例7:根据前述实施例中任一项所述的机器学习系统,其中状态为待预测的疾病为多发性硬化症并且所述目标变量为扩展残疾状态量表(EDSS)值,或者其中状态为待预测的疾病为脊髓性肌萎缩并且所述目标变量为用力肺活量(FVC)值,或者其中状态为待预测的疾病为亨廷顿病并且所述目标变量为总运动评分(TMS)值。
附加实施例8:根据前述实施例中任一项所述的机器学习系统,其中所述处理单元被配置用于针对每个受试者的输入数据生成和/或创建训练数据集和测试数据集,其中所述测试数据集包括一个受试者的数据,其中所述训练数据集包括其他输入数据。
附加实施例9:根据前述实施例中任一项所述的机器学习系统,其中所述处理单元被配置用于从所述输入数据中提取特征,其中所述处理单元被配置用于通过使用最大相关最小冗余技术对所述特征进行排序。
附加实施例10:根据前一项实施例所述的机器学习系统,其中所述处理单元被配置用于通过利用所述训练数据集训练所述机器学习模型来考虑不同数量的特征以用于确定所述分析模型。
附加实施例11:根据前述实施例中任一项所述的机器学习系统,其中所述处理单元被配置用于对所述输入数据进行预处理,其中所述预处理包括针对满足至少一个质量标准的输入数据的至少一个过滤过程。
附加实施例12:根据前述实施例中任一项所述的机器学习系统,其中所述处理单元被配置用于针对所述训练数据集和针对所述测试数据集执行以下中的一项或多项:至少一次稳定变换;至少一次聚合;和至少一次归一化。
附加实施例13:根据前述实施例中任一项所述的机器学习系统,其中所述机器学习系统包括至少一个输出接口,其中所述输出接口被配置用于提供至少一个输出,其中所述输出包括关于所确定的分析模型的性能的至少一个信息。
附加实施例14:根据前一项实施例所述的机器学习系统,其中关于所确定的分析模型的所述性能的所述信息包括以下中的一项或多项:至少一个评分表、至少一个预测图、至少一个相关性图和至少一个残差图。
附加实施例15:一种用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的计算机实现方法,其中在所述方法中使用根据前述实施例中任一项所述的机器学习系统,其中所述方法包括以下步骤:
a)经由至少一个通信接口接收输入数据,其中该输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值;
在至少一个处理单元处:
b)从输入数据集中确定至少一个训练数据集和至少一个测试数据集;
c)通过利用所述训练数据集训练包括至少一种算法的机器学习模型来确定所述分析模型;
d)使用所确定的分析模型针对所述测试数据集预测所述目标变量;
e)基于所预测的目标变量和所述测试数据集的所述目标变量的真值来确定所确定的分析模型的性能。
附加实施例16:根据前一项实施例所述的方法,其中在步骤c)中,通过利用所述训练数据集训练多个机器学习模型来确定多个分析模型,其中所述机器学习模型通过其算法来区分,其中在步骤d)中,使用所确定的分析模型针对所述测试数据集预测所述多个目标变量,其中在步骤e)中,基于所预测的目标变量和所述测试数据集的所述目标变量的所述真值来确定所确定的分析模型中的每一个的性能,其中所述方法进一步包括确定具有最佳性能的所述分析模型。
附加实施例17:用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的计算机程序,该计算机程序被配置用于当在计算机或计算机网络上执行时,使所述计算机或计算机网络完全或部分地执行根据涉及方法的前述实施例中任一项所述的用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的方法,其中所述计算机程序被配置为执行根据涉及方法的前述实施例中任一项所述的用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的方法的至少步骤b)至e)。
附加实施例18:一种包括指令的计算机可读存储介质,所述指令在由计算机或计算机网络执行时,使所述计算机或计算机网络执行根据前述方法实施例中任一项所述的方法的至少步骤b)至e)。
附加实施例19:根据涉及机器学习系统的前述实施例中任一项所述的机器学习系统用于确定分析模型以用于预测以下中的一项或多项的用途:指示多发性硬化症的扩展残疾状态量表(EDSS)值、指示脊髓性肌萎缩的用力肺活量(FVC)值、或指示亨廷顿病的总运动评分(TMS)值。
附图说明
优选地结合从属权利要求,在随后的实施例描述中将更详细地公开其他任选特征和实施例。其中,如本领域技术人员将认识到的,各个任选特征可以按单独的方式以及按任何任意可行的组合来实现。本发明的范围不受优选实施例的限制。在附图中示意性地描绘了实施例。其中,这些附图中相同的附图标记是指相同或功能上相当的元件。
在附图中:
-图1示出了根据本发明的机器学习系统的示例性实施例;
-图2示出了根据本发明的计算机实现方法的示例性实施例;并且
-图3A至图3C示出了用于评估分析模型的性能的相关图的实施例。
-图4示出了可以用于实施本发明的方法的系统的实例。
-图5A示出了掐捏测试期间的触摸屏显示器的实例。
-图5B示出了在进行掐捏测试之后的触摸屏的实例,以说明可以提取的一些数字生物标志物特征。
-图6A至图6D示出了掐捏测试的附加实例,示出了各种参数。
-图7展示了绘制形状测试的实例。
-图8展示了绘制形状测试的实例。
-图9展示了绘制形状测试的实例。
-图10展示了绘制形状测试的实例。
-图11展示了结束迹线距离特征。
-图12A至图12C展示了开始-结束迹线距离特征。
-图13A至图13C展示了开始迹线距离特征。
-图14A至图14G是展示可以从本发明的掐捏测试的结果提取的各种数字生物标志物特征的定义的表格。
-图15示出了在惯用手和非惯用手的PwMS中的掐捏测试基础特征的测试-重测信度和与9HPT和EDSS的相关性。ICC(2,1)指示(A)惯用手和(B)非惯用手的可比的测试-重测信度。
-图16示出了PwMS中的测试-重测信度。(A)基础特征、(B)基于IMU特征和(C,D)疲劳特征的ICC(2,1)值。分析中包括具有至少三次(每个研究参与者)有效测试运行的所有连续两周窗口。通过采用(A–C)中位数或(D)标准偏差来跨两周窗口聚合特征值。误差线指示通过自展估计的95% CI。
-图17示出了健康对照中的测试-重测信度。(A)基础特征、(B)基于IMU特征和(C,D)疲劳特征的ICC(2,1)值。分析中包括具有至少三次(每个研究参与者)有效测试运行的所有连续两周窗口。通过采用(A–C)中位数或(D)标准偏差来跨两周窗口聚合特征值。误差线指示通过自展估计的95% CI。
-图18示出了PwMS中掐捏测试特征与上肢功能和总体疾病严重程度的标准临床测量之间的横截面斯皮尔曼等级相关性。在调整年龄和性别后,(A)基础特征、(B)基于IMU特征和(C,D)疲劳特征与惯用手9HPT时间(蓝色)、EDSS评分(红色)和MSIS-29手臂项目(绿色)相关。误差线指示通过自展估计的95% CI。
-图19示出了PwMS中掐捏测试特征与信息处理速度和疲劳的标准临床测量之间的横截面斯皮尔曼等级相关性。在调整年龄和性别后,(A)基础特征、(B)基于IMU特征和(C,D)疲劳特征与口腔SDMT(蓝色)和FSMC总分(红色)的正确反应的数量相关。误差线指示通过自展估计的95% CI。
-图20示出了PwMS中掐捏测试特征与身体和认知疲劳之间的横截面斯皮尔曼等级相关性。在调整年龄和性别后,(A)基础特征、(B)基于IMU特征和(C,D)疲劳特征与FSMC认知分量表(蓝色)、FSMC身体分量表(红色)和FSMC总分(绿色)相关。误差线指示通过自展估计的95% CI。
-图21示出了掐捏测试特征之间的关系。(A)成对斯皮尔曼等级相关性分析导致稀疏相关性矩阵,表明掐捏测试特征携带上肢损伤的独特信息。(B)重复测量相关性分析示出了单次测试运行中的掐捏测试特征彼此之间的相关性并不强,导致相比于(A)中的更加稀疏的相关性矩阵。(C)主成分分析表明需要六个主成分来解释大约90%的基础特征的方差。(D)因子分析的载荷矩阵进一步证实了这样的观点:各个基础特征都捕获了上肢损伤的不同方面。
-图22示出了掐捏测试的一系列屏幕截图。
-图23列出了可以检查的掐捏测试特征的各种细节。
具体实施方式
图1高度示意性地示出了用于确定至少一个分析模型以用于预测指示疾病状态的至少一个目标变量的机器学习系统110。
所述分析模型可为被配置用于针对至少一个状态变量预测至少一个目标变量的数学模型。所述分析模型可为回归模型或分类模型。所述回归模型可为包括至少一种监督学习算法的分析模型,所述至少一种监督学习算法具有一定范围内的数值作为输出。所述分类模型可为包括至少一种监督学习算法的分析模型,所述至少一种监督学习算法具有诸如“生病”或“健康”的分类词作为输出。
待预测的目标变量值可取决于其存在或状态为待预测的疾病。所述目标变量可为数值变量或分类变量。例如,所述目标变量可为分类变量,在存在疾病的情况下可为“阳性”,或在不存在疾病的情况下可为“阴性”。所述疾病状态可为健康状况和/或医学状况和/或疾病阶段。例如,所述疾病状态可为健康或生病和/或存在或不存在疾病。例如,所述疾病状态可为与指示疾病阶段的标度有关的值。所述目标变量可为数值变量,诸如至少一个值和/或标度值。所述目标变量可能与疾病状态直接相关和/或可能与疾病状态间接相关。例如,所述目标变量可能需要进一步分析和/或处理,以得出疾病状态。例如,所述目标变量可能是需要与表和/或查找表进行比较以确定疾病状态的值。
机器学习系统110包括至少一个处理单元112诸如处理器、微处理器或被配置用于机器学习,特别是用于执行给定算法中的逻辑的计算机系统。机器学习系统110可被配置用于执行和/或实施至少一种机器学习算法,其中所述机器学习算法被配置用于基于训练数据来构建至少一个分析模型。处理单元112可包括至少一个处理器。特别地,处理单元112可经配置用于处理驱动计算机或系统的基本指令。作为示例,处理单元112可包括至少一个算术逻辑单元(ALU)、至少一个浮点单元(FPU)(诸如数学协处理器或数值协处理器)、多个寄存器以及存储器(诸如高速缓冲存储器)。特别地,处理单元112可为多核处理器。处理单元112可被配置用于机器学习。处理单元112可包括中央处理单元(CPU)和/或一个或多个图形处理单元(GPU)和/或一个或多个专用集成电路(ASIC)和/或一个或多个张量处理单元(TPU)和/或一个或多个现场可编程门阵列(FPGA)等。
机器学习系统包括被配置用于接收输入数据的至少一个通信接口114。通信接口114可配置成用于传输来自计算装置(例如计算机)的信息,诸如将信息发送或输出到例如另一装置上。附加地或另选地,通信接口114可配置成用于将信息传输到计算装置上(例如传输到计算机上),诸如,以便接收信息。通信接口114可具体地提供用于传输或交换信息的途径。特别地,通信接口114可提供数据传输连接,例如蓝牙、NFC、电感耦合等。作为示例,通信接口114可以是或可包括至少一个端口,该端口包括网络或Internet端口、USB端口和磁盘驱动器中的一者或多者。通信接口114可为至少一个Web接口。
输入数据包括一组历史数字生物标志物特征数据,其中该组历史数字生物标志物特征数据包括指示待预测的疾病状态的多个测得值。该组历史数字生物标志物特征数据包括每个受试者的多个测得值,这些测得值指示待预测的疾病状态。例如,对于用于预测指示多发性硬化症的至少一个目标的模型构建,数字生物标志物特征数据可以是来自泛光灯POC研究的数据。例如,对于用于预测指示脊髓性肌萎缩的至少一个目标的模型构建,数字生物标志物特征数据可以是来自OLEOS研究的数据。例如,对于用于预测指示亨廷顿病的至少一个目标的模型构建,数字生物标志物特征数据可以是来自HD OLE研究,ISIS 44319-CS2的数据。可在至少一个主动测试和/或至少一个被动监测中确定输入数据。例如,可使用至少一个移动装置在主动测试(诸如至少一项认知测试和/或至少一项手部运动功能测试和/或至少一项移动性测试)中确定输入数据。
输入数据可进一步包括目标数据。目标数据包括要预测的临床值,特别是每个受试者的一个临床值。目标数据可为数字数据或分类数据。临床值可直接或间接地反映疾病的状态。
处理单元112可被配置用于从输入数据中提取特征。所述特征的提取可包括以下一项或多项:数据聚合、数据缩减、数据变换等。处理单元112可被配置用于对特征进行排序。例如,可根据特征的相关性(即与目标变量的相关性)对特征进行排序,和/或可根据冗余(即根据特征之间的相关性)对特征进行排序。处理单元110可被配置用于通过使用最大相关最小冗余技术对特征进行排序。该方法使用相关和冗余之间的权衡对所有特征进行排序。具体地,特征选择和排序可如Ding C.、Peng H的“Minimum redundancy featureselection from microarray gene expression data”,J Bioinform ComputBiol.2005Apr;3(2):185-205,PubMed PMID:15852500中所述进行。特征选择和排序可通过使用与Ding等人所述方法相比的改进的方法来执行。可使用最大相关系数而不是平均相关系数并且可对其应用加法变换。在回归模型作为分析模型的情况下,可将平均相关系数的值提高到5次方。在分类模型作为分析模型的情况下,可将平均相关系数的值乘以10。
机器学习系统110包括至少一个模型单元116,所述至少一个模型单元包括至少一个机器学习模型,所述至少一个机器学习模型包括至少一种算法。模型单元116可包括多个机器学习模型,例如用于构建回归模型的不同机器学习模型和用于构建分类模型的机器学习模型。例如,所述分析模型可为回归模型并且机器学习模型的算法可为选自由以下项组成的组的至少一种算法:k最近邻(kNN);线性回归;偏最小二乘(PLS);随机森林(RF);以及极端随机树(XT)。例如,所述分析模型可为分类模型并且机器学习模型的算法可为选自由以下项组成的组的至少一种算法:k最近邻(kNN);支持向量机(SVM);线性判别分析(LDA);二次判别分析(QDA);朴素贝叶斯(NB);随机森林(RF);以及极端随机树(XT)。
处理单元112可被配置用于预处理输入数据。预处理112可包括针对满足至少一个质量标准的输入数据的至少一个过滤过程。例如,可对输入数据进行过滤,以删除缺失的变量。例如,该预处理可包括排除来自具有少于预定义的最小观察次数的受试者的数据。
处理单元112被配置用于从输入数据集中确定至少一个训练数据集和至少一个测试数据集。该训练数据集可包括多个训练数据集。特别地,该训练数据集包括针对每个受试者的输入数据的训练数据集。该测试数据集可包括多个测试数据集。特别地,该测试数据集包括针对每个受试者的输入数据的测试数据集。处理单元112可被配置用于针对每个受试者的输入数据生成和/或创建训练数据集和测试数据集,其中每个受试者的测试数据集可仅包括该受试者的数据,而该受试者的训练数据集包括所有其他输入数据。
处理单元112可被配置用于对每个受试者的训练数据集和测试数据集两者执行至少一个数据聚合和/或数据变换。所述变换和特征排序步骤可在不拆分为训练数据集和测试数据集的情况下执行。这可能允许干扰例如数据中的重要特征。处理单元112可被配置用于针对训练数据集和测试数据集进行以下一项或多项:至少一次稳定变换;至少一次聚合;和至少一次归一化。例如,处理单元112可被配置用于训练数据集和测试数据集两者的受试者间数据聚合,其中为每个受试者确定特征的平均值。例如,处理单元112可被配置用于方差稳定,其中对于每个特征,应用至少一个方差稳定函数。该方差稳定函数可为选自由以下项组成的组的至少一个函数:logistic,如果所有值都大于300且没有值介于0和1之间,则可使用逻辑;logit,如果所有值都介于0和1之间(包括0和1),则可使用logit;sigmoid;log10,如果在所有值>=0时考虑,则可使用log10。处理单元112可被配置用于使用每个方差变换函数来变换每个特征的值。处理单元112可被配置用于使用特定标准来评估每个结果分布,包括原始分布。在分类模型作为分析模型的情况下,即当目标变量为离散变量时,所述标准可以是所获得的值能够在多大程度上区分不同的类别。具体地,所有类别间平均轮廓值的最大值可用于此目的。在回归模型作为分析模型的情况下,标准可以是在对目标变量应用方差稳定函数获得的值进行回归后获得的平均绝对误差。使用该选择标准,处理单元112可被配置用于确定训练数据集上的最佳可能变换(如果有的话,优于原始值)。随后可将可能的最佳变换应用于测试数据集。例如,处理单元112可被配置用于z-分数变换,其中对于每个变换的特征,针对训练数据集确定平均值和标准偏差,其中这些值用于训练数据集和测试数据集两者上的z-分数变换。例如,处理单元112可被配置用于对训练数据集和测试数据集两者执行三个数据变换步骤,其中所述变换步骤包括:1.受试者间数据聚合;2.方差稳定;3.z-分数变换。处理单元112可被配置用于确定和/或提供排序步骤和变换步骤的至少一个输出。例如,所述排序步骤和变换步骤的输出可包括至少一个诊断图。所述诊断图可包括至少一个主成分分析(PCA)图和/或至少一对比较与排序过程相关的关键统计数据的图。
处理单元112被配置用于通过利用训练数据集训练机器学习模型来确定分析模型。所述训练可包括至少一个优化或调谐过程,其中确定最佳参数组合。可针对不同受试者的训练数据集迭代地执行训练。处理单元112可被配置用于通过利用训练数据集训练机器学习模型来考虑不同数量的特征以用于确定分析模型。机器学习模型的算法可使用不同数量的特征(例如,取决于它们的排序)应用于训练数据集。所述训练可包括n次交叉验证法以获得模型参数的稳健估计。所述机器学习模型的训练可包括至少一个受控学习过程,其中选择至少一个超参数来控制训练过程。如有必要,重复训练步骤以测试超参数的不同组合。
特别是在机器学习模型的训练之后,处理单元112被配置用于使用所确定的分析模型来针对测试数据集预测目标变量。处理单元112可被配置用于使用所确定的分析模型基于每个受试者的测试数据集来预测该受试者的目标变量。处理单元112可被配置用于使用分析模型来针对相应的训练数据集和测试数据集预测每个受试者的目标变量。处理单元112可被配置用于例如在至少一个输出文件中记录和/或存储每个受试者的预测目标变量和每个受试者的目标变量的真值。
处理单元112被配置用于基于预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型的性能。该性能可通过预测的目标变量和目标变量的真值之间的偏差来表征。机器学习系统110可包括至少一个输出接口118。输出接口118可设计成与通信接口114相同和/或可与通信接口114一体形成。输出接口118可被配置用于提供至少一个输出。该输出可包括关于所确定的分析模型的性能的至少一个信息。该关于所确定的分析模型的性能的信息可包括以下中的一项或多项:至少一个评分表、至少一个预测图、至少一个相关性图和至少一个残差图。
模型单元116可包括多个机器学习模型,其中机器学习模型通过其算法来区分。例如,为了构建回归模型,模型单元116可包括以下算法:k最近邻(kNN);线性回归;偏最小二乘(PLS);随机森林(RF);以及极端随机树(XT)。例如,为了构建分类模型,模型单元116可包括以下算法:k最近邻(kNN);支持向量机(SVM);线性判别分析(LDA);二次判别分析(QDA);朴素贝叶斯(NB);随机森林(RF);以及极端随机树(XT)。处理单元112可被配置用于通过利用训练数据集训练相应的机器学习模型来确定每个机器学习模型的分析模型以及使用所确定的分析模型针对测试数据集预测目标变量。
图2示出了根据本发明的方法步骤的示例性序列。在步骤a)(用参考数字120表示)中,经由通信接口114接收输入数据。该方法包括预处理输入数据,用参考数字122表示。如前所述,该预处理可包括针对满足至少一个质量标准的输入数据的至少一个过滤过程。例如,可对输入数据进行过滤,以删除缺失的变量。例如,该预处理可包括排除来自具有少于预定义的最小观察次数的受试者的数据。在步骤b)(用参考数字124表示)中,由处理单元112确定训练数据集和测试数据集。该方法可进一步包括对每个受试者的训练数据集和测试数据集两者的至少一个数据聚合和/或数据变换。该方法可进一步包括至少一个特征提取。数据聚合和/或数据变换和特征提取的步骤在图2中用参考数字126表示。该特征提取可包括特征的排序。在步骤c)(用参考数字128表示)中,通过利用训练数据集训练包括至少一种算法的机器学习模型来确定分析模型。在步骤d)(用参考数字130表示)中,使用所确定的分析模型针对测试数据集预测目标变量。在步骤e)(用参考数字132表示)中,基于预测的目标变量和测试数据集的目标变量的真值来确定所确定的分析模型的性能
图3A至图3C示出了用于评估分析模型的性能的相关图的实施例。
图3A示出了用于预测指示多发性硬化症的扩展残疾状态量表值的分析模型,特别是回归模型的相关图。该输入数据是来自52名受试者的泛光灯POC研究数据。
在前瞻性先导研究(FLOODLIGHT)中,评估了使用数字技术对多发性硬化症患者进行远程患者监测的可行性。通过使用以下纳入和排除标准选择研究人群:
主要纳入标准:
签署知情同意书
根据调查者的判断,能够遵守研究方案
年龄18-55岁(含)
根据修订后的McDonald 2010标准明确诊断患有MS
EDSS评分为0.0至5.5(含)
重量:45-110kg
对于有生育能力的女性:同意在研究期间使用可接受的避孕方法
主要排除标准:
根据调查者的判断,重症和不稳定的患者
登记前最后12周内给药方案的变化或疾病改善疗法(DMT)的转换
怀孕或哺乳,或打算在研究期间怀孕
本研究的主要目标是显示对基于智能手机和智能手表的评估的依从性,量化为依从性水平(%),并使用满意度问卷从患者和健康对照者那里获得关于智能手机和智能手表评估时间表的反馈,以及对他们日常活动的影响。此外,还解决了其他目标,特别是确定了使用Floodlight测试进行的评估与常规MS临床结果之间的关联,确立了Floodlight测量是否可以用作疾病活动/进展的标志,以及是否随着时间的推移,与MRI和临床结果相关联,确立Floodlight Test Battery是否可以区分患有和不患有MS的患者,以及区分MS患者的表型。
除了主动测试和被动监测外,在每次预定的诊所就诊时还进行了以下评估:
·SDMT口头版
·运动和认知功能疲劳量表(FSMC)
·定时25英尺行走测试(T25-FW)
·伯格平衡量表(BBS)
·9-Hole Peg测试(9HPT)
·患者健康问卷(PHQ-9)
·仅患有MS的患者:
·脑MRI(MSmetrix)
·扩展残疾状态量表(EDSS)
·患者确定的疾病步骤(PDDS)
·MSIS-29的笔和纸质版本
在进行临床测试时,要求患者和健康对照者携带/穿戴智能手机和智能手表以通过临床测量收集传感器数据。总之,研究结果表明,患者高度参与基于智能手机和智能手表的评估。此外,在基线记录的测试和诊所临床结果测量之间存在相关性,这表明基于智能手机的Floodlight Test Battery将成为在现实世界场景中持续监测MS的强大工具。此外,行走和进行U-形转弯时基于智能手机的转弯速度测量似乎与EDSS相关。
对于图3A,在使用根据本发明的方法构建模型期间,总共评估了7次测试中的889个特征。用于该预测的测试为:符号-数字模态测试(SDMT),其中受试者必须在给定的时间跨度内将尽可能多的符号与数字匹配;掐捏测试,其中受试者必须在给定的时间跨度内用拇指和食指挤压屏幕上显示的尽可能多的西红柿;绘制形状测试,其中受试者必须在屏幕上勾画形状;站立平衡测试,其中受试者必须直立30秒;5级掉头测试,其中受试者必须行走一小段距离,然后是180度转动;2分钟行走测试,其中受试者必须行走两分钟;最后是对步态的被动监测。下表概述了用于预测的选定特征、衍生特征的测试、特征的简短描述和排序:
/>
/>
图3A示出了对于每种回归量类型,尤其是从左到右的kNN、线性回归、PLS、RF和XT,预测目标变量与真实目标变量之间的斯皮尔曼相关系数rs,随相应分析模型中包含的特征数量f的变化。上排示出了在测试数据集上测试的各个分析模型的性能。下排示出了在训练数据集中测试的各个分析模型的性能。下行的曲线示出了从训练数据上预测目标变量获得的“全部”和“平均值”的结果。“平均值”是指对每个受试者所有观察值的平均值的预测。“全部”是指对所有个体观察值的预测。为了评估任何机器学习模型的性能,测试数据(顶行)的结果被认为更可靠。发现表现最好的回归模型是模型中包括32个特征的RF,其rs值为0.77,用圆圈和箭头指明。
下面对测试进行更详细的描述。这些测试通常是在数据采集装置(诸如本文别处规定的移动装置)上由计算机实现。
(1)被动监测步态和姿态的测试:被动监测
移动装置通常适用于执行或采集来自对所有活动或活动子集的被动监测的数据。特别地,被动监测应包括监测在预定义窗口(诸如一天或多天或一或多周)期间执行的一项或多项活动,选自由以下项组成的组:步态的测量、一般日常生活中的运动量、日常生活中的运动类型、日常生活中的一般活动能力和运动行为的变化。
目标典型被动监测表现参数:
a.行走的频率和/或速度;
b.站立/坐下、静止和平衡的量、能力和/或速度
c.访问地点的数量作为一般活动性的指标;
d.访问地点的类型作为运动行为的指标。
(2)认知能力测试:SDMT(也称为eSDMT)
移动装置通常还适用于执行或获取来自计算机实现的符号数字模态测试(eSDMT)的数据。测试的传统纸质SDMT版本由一系列120个符号组成,最多在90秒内显示,以及一个参考键图例(有3个版本可用),其中9个符号按给定顺序排列,它们各自的匹配数字从1到9。基于智能手机的eSDMT旨在由患者自行管理,并将使用一系列符号(通常为110个符号的相同序列),以及SDMT纸质/口头版本的参考键图例(通常为3个参考键图例)之间的随机交替(从一个测试到下一个测试)。与纸质/口头版本类似,eSDMT测量在预定时间窗口(例如90秒时间)内将抽象符号与特定数字配对的速度(正确配对响应数)。该测试通常每周进行,但可以可替代地以更高(例如每天)或更低(例如每两周)的频率进行。该测试还可以可替代地包含超过110个符号和更多和/或参考键图例的进化版本。符号序列也可以随机或根据任何其他修改的预先指定的序列来管理。
目标典型eSDMT表现参数:
1.正确响应数
a.90秒内的总体正确响应(CR)总数(类似于口头/纸质SDMT)
b.从时间0到30秒的正确响应数(CR0-30)
c.从时间30到60秒的正确响应数(CR30-60)
d.从时间60到90秒的正确响应数(CR60-90)
e.从时间0到45秒的正确响应数(CR0-45)
f.从时间45到90秒的正确响应数(CR45-90)
g.从时间i到j秒的正确响应数(CRi-j),其中i,j介于1到90秒之间,并且i<j。
2.错误数
a.90秒内的错误总数(E)
b.从时间0到30秒的错误数(E0-30)
c.从时间30到60秒的错误数(E30-60)
d.从时间60到90秒的错误数(E60-90)
e.从时间0到45秒的错误数(E0-45)
f.从时间45到90秒的错误数(E45-90)
g.从时间i到j秒的错误数(Ei-j),其中i、j介于1到90秒之间,并且i<j。
3.响应数
a.90秒内的总体响应总数(R)
b.从时间0到30秒的响应数(R0-30)
c.从时间30到60秒的响应数(R30-60)
d.从时间60到90秒的响应数(R60-90)
e.从时间0到45秒的响应数(R0-45)
f.从时间45到90秒的响应数(R45-90)
4.准确率
a.90秒内的平均准确率(AR):AR=CR/R
b.时间0到30秒的平均准确率(AR):AR0-30=CR0-30/R0-30
c.时间30到60秒的平均准确率(AR):AR30-60=CR30-60/R30-60
d.时间60到90秒的平均准确率(AR):AR60-90=CR60-90/R60-90
e.时间0到45秒的平均准确率(AR):AR0-45=CR0-45/R0-45
f.时间45到90秒的平均准确率(AR):AR45-90=CR45-90/R45-90
5.任务疲劳指数结束
a.最后30秒内的速度疲劳指数(SFI):SFI60-90=CR60-90/max(CR0-30,CR30-60)
b.最后45秒内的SFI:SFI45-90=CR45-90/CR0-45
c.最后30秒内的准确率疲劳指数(AFI):AFI60-90=AR60-90/max(AR0-30,AR30-60)
d.最后45秒内的AFI:AFI45-90=AR45-90/AR0-45
6.连续正确响应的最长序列
a.90秒内整体连续正确响应(CCR)的最长序列中的正确响应数
b.从时间0到30秒的连续正确响应的最长序列中的正确响应数(CCR0-30)
c.从时间30到60秒的连续正确响应的最长序列中的正确响应数(CCR30-60)
d.从时间60到90秒的连续正确响应的最长序列中的正确响应数(CCR60-90)
e.从时间0到45秒的连续正确响应的最长序列中的正确响应数(CCR0-45)
f.从时间45到90秒的连续正确响应的最长序列中的正确响应数(CCR45-90)
7.响应之间的时间间隔
a.两次连续响应之间的间隔(G)时间的连续变量分析
b.在90秒内两次连续响应之间经过的最大间隔(GM)时间
c.从时间0到30秒的两次连续响应之间经过的最大间隔时间(GM0-30)
d.从时间30到60秒的两次连续响应之间经过的最大间隔时间(GM30-60)
e.从时间60到90秒的两次连续响应之间经过的最大间隔时间(GM60-90)
f.从时间0到45秒的两次连续响应之间经过的最大间隔时间(GM0-45)
g.从时间45到90秒的两次连续响应之间经过的最大间隔时间(GM45-90)
8.正确响应之间的时间间隔
a.两次连续正确响应之间的间隔时间的连续变量分析(Gc)
b.在90秒内两次连续正确响应之间经过的最大间隔时间(GcM)
c.从时间0到30秒的两次连续正确响应之间经过的最大间隔时间(GcM0-30)
d.从时间30到60秒的两次连续正确响应之间经过的最大间隔时间(GcM30-60)
e.从时间60到90秒的两次连续正确响应之间经过的最大间隔时间(GcM60-90)
f.从时间0到45秒的两次连续正确响应之间经过的最大间隔时间(GcM0-45)
g.从时间45到90秒的两次连续正确响应之间经过的最大间隔时间(GcM45-90)
9.在eSDMT期间捕获的精细手指运动技能功能参数
a.当历经90秒输入响应时,触摸屏接触的持续时间(Tt)、触摸屏接触(Dt)与最近目标数字键中心之间的偏差、以及错误输入的触摸屏接触(Mt)(即接触未触发按键或触发按键但与屏幕上的继发滑动相关)的连续变量分析
b.从时间0到30秒的各个时间段的变量:Tts0-30、Dts0-30,Mts0-30
c.从时间30到60秒的各个时间段的变量:Tts30-60、Dts30-60,Mts30-60
d.从时间60到90秒的各个时间段的变量:Tts60-90、Dts60-90,Mts60-90
e.从时间0到45秒的各个时间段的变量:Tts0-45、Dts0-45,Mts0-45
f.从时间45到90秒的各个时间段的变量:Tts45-90、Dts45-90,Mts45-90
10.通过单个符号或符号簇对性能进行特定符号分析
a.针对9个符号中的每一个单独的及其所有可能的聚类组合的CR
b.针对9个符号中的每一个单独的及其所有可能的聚类组合的AR
c.针对9个符号中的每一个单独的及所有其可能的聚类组合的从先前响应到记录响应的间隔时间(G)
d.模式分析以通过分别探索9个符号的错误取代类型和9位数字响应来识别优先的错误响应。
11.学习和认知储备分析
a.eSDMT的连续管理之间的CR(整体和符号特定,如#9中所述)中从基线(基线定义为测试的前2次管理的平均表现)的变化
b.eSDMT的连续管理之间的AR(整体和符号特定,如#9中所述)中从基线(基线定义为测试的前2次管理的平均表现)的变化
c.eSDMT的连续管理之间的平均G和GM(整体和符号特定,如#9中所述)中从基线(基线定义为测试的前2次管理的平均表现)的变化
d.eSDMT的连续管理之间的平均Gc和GcM(整体和符号特定,如#9中所述)中从基线(基线定义为测试的前2次管理的平均表现)的变化
e.eSDMT的连续管理之间的SFI60-90和SFI45-90中从基线(基线定义为测试的前2次管理的平均表现)的变化
f.eSDMT的连续管理之间的AFI60-90和AFI45-90中从基线(基线定义为测试的前2次管理的平均表现)的变化
g.eSDMT的连续管理之间的Tt中从基线(基线定义为测试的前2次管理的平均表现)的变化
h.eSDMT的连续管理之间的Dt中从基线(基线定义为测试的前2次管理的平均表现)的变化
i.eSDMT的连续管理之间的Mt中从基线(基线定义为测试的前2次管理的平均表现)的变化。
(3)主动步态和姿态能力测试:掉头测试(也称为五级掉头测试,5UTT)和2MWT
基于传感器(例如加速度计、陀螺仪、磁力计、全球定位系统[GPS])和计算机实现测试,用于测量行走表现以及步态和步幅动力学,特别是2分钟行走测试(2MWT)和五U-形转弯测试(5UTT)。
在一个实施例中,移动装置适用于执行或获取来自两分钟行走测试(2MWT)的数据。该测试的目的是通过在两分钟行走测试(2MWT)中采集步态特征来评估长途行走中的困难、易疲劳性或异常模式。将从移动装置捕获数据。在残疾进展或新发复发的情况下,可能会观察到步幅和步长的减少、步幅持续时间的增加、步伐持续时间和不对称性的增加以及周期性步幅和步伐的减少。行走时的手臂摆动动态也将经由移动装置进行评定。受试者将被指示“尽可能快地行走2分钟,但要安全行走”。2MWT是一项简单的测试,需要在室内或室外、患者已确定他们可以在不进行U-形转弯的情况下直线行走≥200米的场所的平坦地面上进行。允许受试者根据需要穿着常规鞋类和辅助装置和/或矫形器。该测试通常每天进行。
特定的目标典型2MWT表现参数:
1.行走速度和痉挛的替代:
a.在例如2分钟内检测到的总步数(ΣS)
b.在2分钟内检测到任何休息停顿数,如果有(ΣRs)
c.整个2MWT中行走步伐时间(WsT)持续时间的连续变量分析
d.整个2MWT中行走步伐速度(WsV)的连续变量分析(步/秒)
e.整个2MWT中的步伐不对称率(一个步伐到下一个步伐之间的步伐持续时间的平均差异除以平均步伐持续时间):SAR=平均值Δ(WsTx-WsTx+1)/(120/ΣS)
f.每个20秒的时间段检测到的总步数(ΣSt,t+20)
g.每个20秒的时间段中的平均行走步伐时间持续时间:WsTt,t+20=20/ΣSt,t+20
h.每个20秒的时间段中的平均行走步伐速度:WsVt,t+20=ΣSt,t+20/20
i.每个20秒的时间段中的步伐不对称率:SARt,t+20=meanΔt,t+20(WsTx-WsTx+1)/(20/ΣSt,t+20)
j.通过生物力学建模行走的步长和总距离
2.行走疲劳性指数:
a.减速指数:DI=WsV100-120/max(WsV0-20,WsV20-40,WsV40-60)
b.不对称指数:AI=SAR100-120/min(SAR0-20,SAR20-40,SAR40-60)
在另一实施例中,移动装置适用于执行或获取来自五U-形转弯测试(5UTT)的数据。该测试的目的是评估在以舒适的步伐短距离行走时进行掉头的困难或异常模式。5UTT需要在室内或室外、在平坦地面上执行,其间指示患者“安全行走并在相距几米的两点之间来回进行五次连续U-形转弯调头”。此任务期间的步态特征数据(步伐数变化、U-形转弯期间步伐持续时间和不对称性、U-形转弯持续时间、U-形转弯期间转弯速度和手臂摆动的变化)将由移动装置捕获。允许受试者根据需要穿着常规鞋类和辅助装置和/或矫形器。该测试通常每天进行。
目标典型5UTT表现参数:
1.完全U-形转弯从开始到结束所需的平均步数(ΣSu)
2.完全U-形转弯从开始到结束所需的平均时间(Tu)
3.平均行走步伐持续时间:Tsu=Tu/ΣSu
4.转弯方向(左/右)
5.转弯速度(度/秒)
图3B示出了用于预测指示脊髓性肌萎缩的用力肺活量(FVC)值的分析模型,特别是回归模型的相关图。该输入数据是来自14名受试者的OLEOS研究数据。在使用根据本发明的方法构建模型期间,总共评估了9次测试中的1326个特征。下表概述了用于预测的选定特征、衍生特征的测试、特征的简短描述和排序:
图3B示出了对于每种回归量类型,尤其是从左到右的kNN、线性回归、PLS、RF和XT,预测目标变量与真实目标变量之间的斯皮尔曼相关系数rs,随相应分析模型中包含的特征数量f的变化。上排示出了在测试数据集上测试的各个分析模型的性能。下排示出了在训练数据集中测试的各个分析模型的性能。下行的曲线示出了从训练数据上预测目标变量获得的“全部”和“平均值”的结果。“平均值”是指对每个受试者所有观察值的平均值的预测。“全部”是指对所有个体观察值的预测。为了评估任何机器学习模型的性能,测试数据(顶行)的结果被认为更可靠。发现表现最好的回归模型是模型中包括10个特征的PLS,其rs值为0.8,用圆圈和箭头指明。
下面对测试进行更详细的描述。这些测试通常是在数据采集装置(诸如本文别处规定的移动装置)上由计算机实现。
(1)对中枢运动功能的测试:绘图形状测试和挤压(squeeze)形状测试
移动装置可以进一步适于执行远端运动功能的进一步测试(所谓的“绘图形状测试”)或从该测试获取数据,该测试配置为测量手指的灵活性和远端无力。从这种测试获取的数据集允许识别手指移动的精确度、压力分布和速度分布。
“绘制形状”测试的目的是评估手指的精细控制和笔划顺序。该测试被认为涵盖了手部运动功能受损的以下方面:震颤和痉挛以及手眼协调受损。指导患者将移动装置握在未被测试的手中,并且用被测试的手的第二手指在移动装置6的触摸屏上在最长时间(例如30秒)内“尽可能快且尽可能准确地”绘制复杂性增加的预先编写的交替形状(线性、矩形、圆形、正弦曲线和螺旋形;参见下文)。为了成功地绘制形状,患者的手指必须在触摸屏上连续地滑动,并且穿过所有指示的检查点并尽可能保持在书写路径的边界内来连接所指示的起点和终点。患者最多可尝试两次来成功完成6个形状中的每个形状。左右手将交替进行测试。将指导用户每日交替。这两个线性形状具有各自要连接的“a”个特定数量的检查点,即“a-1”个分段。方形形状具有要连接的“b”个特定数量的检查点,即“b-1”个分段。圆形形状具有要连接的“c”个特定数量的检查点,即“c-1”个分段。8的形状具有要连接的“d”个特定数量的检查点,即“d-1”个分段。螺旋形状具有要连接的“e”个特定数量的检查点,“e-1”个分段。完成这6个形状则意味着成功地绘制了总共“(2a+b+c+d+e-6)”个分段。
目的典型绘图形状测试表现参数:
基于形状复杂性,线性和方形形状可关联于加权因子(Wf)1,圆形和正弦曲线形状可关联于加权因子2,并且螺旋形状可关联于加权因子3。在第二次尝试中成功完成的形状可关联于加权因子0.5。这些加权因子是在本发明的上下文中可改变的数值实例。
1.形状完成性能评分:
a.每次测试成功完成的形状的数目(0到6)(ΣSh)
b.第一次尝试成功完成的形状的数目(0到6)(ΣSh1)
c.第二次尝试成功完成的形状的数目(0到6)(ΣSh2)
d.所有尝试均失败/未完成的形状的数目(0到12)(ΣF)
e.形状完成评分反映了成功完成的形状的数目,对于相应形状的不同复杂程度调整了加权因子(0到10)(Σ[Sh*Wf])
f.形状完成评分反映了成功完成的形状的数目,对于相应形状的不同复杂程度调整了加权因子,并且考虑了第一次尝试与第二次尝试的成功(0到10)(Σ[Sh1*Wf]+Σ[Sh2*Wf*0.5])
g.如#1e和#1f中定义的形状完成评分如果乘以30/t则可以说明测试完成时的速度,其中t将表示完成测试的时间(以秒为单位)。
h.按一定时间段内的多次测试计,6个单独形状各自的总体和第一次尝试完成率:(ΣSh1)/(ΣSh1+ΣSh2+ΣF)和(ΣSh1+ΣSh2)/(ΣSh1+ΣSh2+ΣF)。
2.分段完成和快速性性能评分/测量值:
(基于每个形状的两次尝试中的最佳[完成的分段的最高数目]进行分析,如果适用)
a.每次测试成功完成的分段的数目(0到[2a+b+c+d+e-6])(ΣSe)
b.成功完成分段的平均快速性([C],分段/秒):C=ΣSe/t,其中t将代表完成测试的时间(以秒为单位,最多30秒)
c.分段完成评分反映了成功完成的分段的数目,对于相应形状的不同复杂程度调整了加权因子(Σ[Se*Wf])
d.经速度调整和加权的分段完成评分(Σ[Se*Wf]*30/t),其中t将代表完成测试的时间(以秒为单位)。
e.线性和方形形状的成功完成的分段的形状特异性数目(ΣSeLS)
f.圆形和正弦曲线形状的成功完成的分段的形状特异性数目(ΣSeCS)
g.螺旋形状的成功完成的分段的形状特异性数目(ΣSeS)
h.在线性和方形形状测试中执行的成功完成的分段的形状特异性平均线性快速性:CL=ΣSeLS/t,其中t将表示从这些特定形状内对应的成功完成的分段的起点到终点所经过的累计时期时间(以秒为单位)。
i.在圆形和正弦曲线形状测试中执行的成功完成的分段的形状特异性平均圆形快速性:CC=ΣSeCS/t,其中t将表示从这些特定形状内对应的成功完成的分段的起点到终点所经过的累计时期时间(以秒为单位)。
j.在螺旋形状测试中执行的成功完成的分段的形状特异性平均螺旋快速性:CS=ΣSeS/t,其中t将表示从该特定形状内对应的成功完成的分段的起点到终点所经过的累积时期时间(以秒为单位)。
3.绘图精确度性能评分/测量值:
(基于每个形状的两次尝试中的最佳[完成的分段的最高数目]进行分析,如果适用)
a.偏差(Dev)计算为:从对于每个特定形状到达的开始检查点到对于每个特定形状到达的结束检查点绘制轨迹与目标绘图路径之间综合表面偏差的曲线下总面积(AUC)测量值的总和除以这些形状内对应的目标路径的总累计长度(从到达的开始检查点至到达的结束检查点)。
b.线性偏差(DevL)在#3a中计算为Dev,但具体来自线性和方形形状测试结果。
c.圆形偏差(DevC)在#3a中计算为Dev,但具体来自圆形和正弦曲线形状测试结果。
d.螺旋偏差(DevS)在#3a中计算为Dev,但具体来自螺旋形状测试结果。
e.形状特异性偏差(Dev1-6)在#3a中计算为Dev,但分别来自6个不同形状测试结果中的每个测试结果,仅适用于在最佳尝试中成功完成至少3个分段的那些形状。
f.任何其他计算与目标轨迹的形状特异性或与形状无关的总体偏差的方法的连续变量分析。
4)压力分布测量
i)施加的平均压力
ii)偏差(Dev)计算为压力的标准偏差
远端运动功能(所谓的“挤压形状测试”)可测量手指的灵活性和远端无力。从这种测试获取的数据集允许识别手指移动的精确度和速度以及相关的压力分布。该测试可能需要首先关于受试者的移动精确度能力进行校准。
挤压形状测试的目的是通过评定捏紧手指移动的准确性来评估精细的远端运动操纵(握持和抓握)和控制。该测试被认为涵盖了手部运动功能受损的以下方面:握持/抓握功能受损、肌肉无力和手眼协调能力受损。指导患者将移动装置握在未被测试的手中,并且通过用同一只手的两根手指(优选拇指+中指或拇指+无名指)触摸屏幕而在30秒内挤压/掐捏尽可能多的圆形形状(即,番茄)。精细运动操纵受损将影响表现。左右手将交替进行测试。将指导用户每日交替。
目的典型挤压形状测试表现参数:
1.挤压的形状的数目
a.30秒内挤压的番茄形状的总数(ΣSh)
b.30秒内第一次尝试挤压的番茄的总数(ΣSh1)(如果不是测试的首次尝试,则第一次尝试被检测为成功挤压后屏幕上的第一次双接触)
2.掐捏精确度测量值:
a.掐捏成功率(PSR)定义为ΣSh除以在测试的总持续时间内掐捏(ΣP)尝试的总数(衡量为屏幕上单独检测到的双指接触总数)。
b.双触异步性(DTA),对于所有被检测到的双接触来说,双触异步性被衡量为第一手指和第二手指触摸屏幕之间的时滞。
c.对于所有检测到的双接触,掐捏目标精确度(PTP)衡量为从双接触时两根手指的起始接触点之间的等距点到番茄形状中心的距离。
d.对于所有成功掐捏的双接触,掐捏手指移动不对称性(PFMA)衡量为由两根手指(最短/最长)从双接触起点滑动直至达到掐捏间隔的相应距离之间的比率。
e.对于所有成功掐捏的双接触,掐捏手指速度(PFV)衡量为每根手指和/或两根手指从双接触时间直至达到掐捏间隔在屏幕上滑动的速度(mm/sec)。
f.对于所有成功掐捏的双接触,掐捏手指异步性(PFA)衡量为相应各手指从双接触时间直至达到掐捏间隔在屏幕上滑动的速度(最慢/最快)之间的比率。
g.2a到2f随时间推移的连续变量分析以及它们按可变持续时间(5秒至15秒)的时期分析
h.所有测试形状(特别是螺旋形和方形)偏离目标绘制轨迹的综合测量值的连续变量分析
3)压力分布测量
i)施加的平均压力
ii)偏差(Dev)计算为压力的标准偏差
更通常地,根据本发明的方法执行挤压形状测试和绘图形状测试。甚至更具体地,确定下表1中列出的表现参数。
除了上面概述的特征之外,在执行“挤压形状”或“捏合”测试时还可以评估各种其他特征。这些将在下面描述。附加功能的描述中使用了以下术语:
·掐捏测试:数字化上肢/手部活动度测试需要用拇指和食指进行捏合动作,以在屏幕上挤压圆形形状。
·特征:根据智能手机在单次执行远端运动测试期间收集的原始数据计算出的标量值。它是对受试者表现的数字测量。
·笔划:手指在屏幕上绘制的不间断路径。当手指第一次触摸屏幕时笔划开始,并且当手指离开屏幕时结束。
·手势:第一手指触摸屏幕与最后手指离开屏幕之间记录的所有笔画的集合。
·尝试:任何包含至少两个笔划的手势。此类手势被认为是尝试在屏幕上挤压可见的圆形形状。
·两指尝试:任何恰好有两次笔划的尝试。
·成功的尝试:任何导致圆形形状被记录为“挤压”的尝试。
特征如下:
·最后点之间的距离:对于每次尝试,保留前两个记录的笔划,并且对于每对,计算两个笔划中最后点之间的距离。这可以对所有尝试进行,或者仅对成功的尝试进行。
·结束不对称性:对于每次尝试,保留前两个记录的笔划,并且对于每对,计算第一手指与第二手指之间离开屏幕的时间差。
·间隔时间:对于每对连续尝试,计算它们之间的间隔的持续时间。换句话说,对于每对尝试i和i+1,计算尝试i的结束与尝试i+1的开始之间的时间差。
·执行的尝试的次数:返回执行的尝试的次数。
·成功的尝试的次数:返回成功的尝试的次数。
·两指尝试的次数:返回两指尝试的次数。这可以除以尝试的总数,以返回两指尝试的分数。
·掐捏次数:对于每次尝试,计算尝试的持续时间。持续时间被限定为第一手指触摸屏幕与最后特征离开屏幕之间的时间。该特征还可以被限定为两个手指出现在屏幕上的持续时间。
·开始不对称性:对于每次尝试,保留前两次记录的笔划。对于每对,计算第一手指与第二手指之间触摸屏幕的时间差。
·笔划路径比:对于每次尝试,保留第一次和第二次记录的笔划。对于每个笔划,计算两个值:手指在屏幕上移动的路径的长度,和笔划中第一点与最后一点之间的距离。对于每个笔划,计算比率(路径长度/距离)。可以对所有尝试进行,或者仅对成功的尝试进行。
在所有上述情况下,可以执行多次测试,并且可以得出统计参数,诸如平均值、标准偏差、峰度、中位数和百分位数。当以这种方式进行多个测量时,可以确定通用疲劳因子。
·通用疲劳特征:来自测试的数据被分为两半,每半都有预定的持续时间,例如15秒。上面限定的任何特征都是使用前半部分数据和后半部分数据分别计算的,从而产生两个特征值。返回第一值与第二值之间的差。这可以通过除以第一特征值来归一化。
在一些情况下,诸如移动装置的数据采集装置可以包括加速度计,其可以被配置为在执行测试的时期期间测量加速度数据。存在也可以从加速度数据中提取的各种有用的特征,如下所述:
·水平性:对于每个时间点,加速度的z分量除以总大小。然后可以获取所得时间序列的平均值。可以获取绝对值。在本申请中,z分量被限定为垂直于触摸屏显示器的平面的分量。
·取向稳定性:对于每个时间点,加速度的z分量除以总大小。然后可以获取所得时间序列的标准偏差。可以获取绝对值。这里,z分量被限定为垂直于触摸屏显示器的平面的分量。
·z轴线的标准偏差:对于每个时间点,测量加速度的z分量。然后可以获取时间序列上的标准偏差。
·加速度大小的标准偏差:对于每个时间点,获取加速度的x、y和z分量。获取x分量上的标准偏差。获取y分量上的标准偏差。获取z分量上的标准偏差。然后通过将三个单独的标准偏差正交相加来计算标准偏差的范数。
·加速度大小:可以针对测试的持续时间确定加速度的总大小。然后可以得出统计参数:在测试的整个持续时间内、或者仅对于手指出现在屏幕上的那些时间点或者仅对于屏幕上没有手指出现的那些时间点。统计参数可以是平均值、标准偏差或峰度。
应该强调的是,在可能的情况下,这些基于加速度的特征不仅需要在掐捏或挤压形状期间获取,因为它们能够产生具有临床意义的输出,而与提取它们期间的测试的类型无关。这对于水平性和取向稳定性参数而言尤其如此。
数据获取装置可以进一步适于执行对中枢运动功能的进一步测试(所谓的“语音测试”)或从该进一步测试获取数据,该进一步测试配置为通过测量发声能力来测量近端中枢运动功能。
(2)鼓舞怪物测试,语音测试:
如本文所用,术语“鼓舞怪物测试”涉及持续发声测试,在一个实施例中,该持续发声测试是用于呼吸功能评估以处理在一个实施例中包括作为肌肉疲劳、中枢性张力减退和/或通气问题的指标的音调变化的腹部和胸部损伤的替代测试。在一个实施例中,鼓舞怪物测量了参与者维持“啊啊”声音的受控发声的能力。该测试使用适当的传感器来捕捉参与者的发声,在一个实施例中是录音机,例如麦克风。
在一个实施例中,受试者要执行的测试如下:鼓舞怪物需要参与者将速度控制在怪物朝其目标奔跑的速度。怪物尝试在30秒内奔跑得尽可能远。受试者被要求尽可能长时间地尽可能大声发出“啊啊”的声音。声音的音量被确定并用于调节角色的奔跑速度。游戏持续时间为30秒,因此如有必要,则可以通过多次发出“啊啊”的声音来完成游戏。
(3)敲击怪物(Tap-The-Monster)测试:
如本文所用,术语“敲击怪物测试”是指根据MFM D3(Bérard C et al.(2005),Neuromuscular Disorders 15:463)设计的用于评估远端运动功能的测试。在一个实施例中,测试具体针对评估灵活性、远端无力/强度和力量的MFM测试17(捡起十个硬币)、18(用手指围绕CD边缘行进)、19(捡起铅笔并画圈)和22(将手指放在图画上)。该游戏测量了参与者的灵活性和移动速度。在一个实施例中,受试者要执行的测试如下:受试者轻按随机出现在7个不同屏幕位置的怪物。
图3C示出了用于预测指示亨廷顿病的总运动评分(TMS)值的分析模型,特别是回归模型的相关图。该输入数据是来自46名受试者的HD OLE研究,ISIS 44319-CS2的数据。ISIS 443139-CS2研究是针对参与研究ISIS 443139-CS1的患者的开放标签扩展(OLE)。ISIS 443139-CS1研究是一项针对46名25-65岁(含)早期表现HD患者的多次递增剂量(MAD)研究。在使用根据本发明的方法构建模型的过程中,总共从一项测试,即绘制形状测试(见上文)评估了43个特征。下表概述了用于预测的选定特征、衍生特征的测试、特征的简短描述和排序:
图3C示出了对于每种回归量类型,尤其是从左到右的kNN、线性回归、PLS、RF和XT,预测目标变量与真实目标变量之间的斯皮尔曼相关系数rs,随相应分析模型中包含的特征数量f的变化。上排示出了在测试数据集上测试的各个分析模型的性能。下排示出了在训练数据集中测试的各个分析模型的性能。下行的曲线示出了下行中的“全部”和“平均值”的结果是从在训练数据上预测目标变量获得的结果。“平均值”是指对每个受试者所有观察值的平均值的预测。“全部”是指对所有个体观察值的预测。为了评估任何机器学习模型的性能,测试数据(顶行)的结果被认为更可靠。发现表现最好的回归模型是模型中包括4个特征的PLS,其rs值为0.65,用圆圈和箭头指明。
图4之后展示了本发明关于掐捏测试特征以及可以从绘制形状测试提取的过冲/下冲特征的许多原理。
图4示出了可以执行本申请的发明的硬件的示例布置的高级系统图。系统100包括两个主要部件:移动装置102,和处理单元104。移动装置102可以通过网络106连接到处理单元104,网络可以是有线网络或者诸如Wi-Fi或蜂窝网络的无线网络。在本发明的一些实施方式中,不需要处理单元104,并且其功能可以由存在于移动装置102上的处理单元112来执行。移动装置102包括触摸屏显示器108、用户输入界面模块110、处理单元112和加速度计114。
系统100可以用于实施掐捏测试和/或绘制形状测试中的至少一者,如本申请中先前已描述的。掐捏测试的目的是通过评定捏紧手指移动的准确性来评估精细的远端运动操纵(握持和抓握)和控制。该测试可以涵盖手部运动功能受损的以下方面:握持/抓握功能受损、肌肉无力和手眼协调性受损。为了执行测试,要求患者将移动装置握在未测试的手中(或将其放在桌子或其他表面上),并且用同一只手的两个手指(最好是拇指+食指/中指)触摸屏幕,以在固定时间内挤压/掐捏尽可能多的圆形形状,例如30秒。圆形形状显示在游戏区内的随机位置。精细运动性能受损将影响表现。测试可以用左手和右手交替执行。描述掐捏测试时将使用以下术语:
·触摸事件:OS记录的触摸交互记录了手指何时触摸屏幕以及在何处触摸屏幕
·开始距离:两根手指第一次点击所识别的两点之间的距离
·边界框:包含待挤压的形状的框
·初始手指距离:两根手指接触屏幕时的初始距离
·游戏区:游戏区完全包含待挤压的形状,并且由矩形界定。
·游戏区填充:屏幕边缘与实际游戏区之间的填充。形状不会显示在此填充区中。
可以限定以下任何或所有参数:
·边界框高度
·边界框宽度
·掐捏之前的两个指针之间的最小初始距离
·挤压形状的两个指针之间的最小距离。
·手指之间的间距的最小变化。
图5A和图5B示出了用户在执行掐捏测试时可以看到的显示的实例。具体地,图5A示出了具有触摸屏显示器108的移动装置102。触摸屏显示器108示出了典型的掐捏测试,其中形状S包括两个点P1和P2。在某些情况下,只会向用户呈现形状S(即,不会具体识别点P1和P2)。图5A中还示出了中点M,尽管这也可能不显示给用户。为了进行测试,装置的用户必须同时使用两根手指来尽可能地“掐捏”形状S,有效地通过使点P1和P2彼此尽可能靠近。优选地,用户能够仅使用两个手指来这样做。前面已经讨论了可以从触摸屏经接收的输入提取的数字生物标志物特征。下面参考图5B解释其中的一些。
图5B示出了两个附加点P1’和P2’,它们分别是路径1和路径2的端点。路径1和路径2代表执行掐捏测试时用户手指所走的路径。可以从图5B的布置得出的一些特征包括:
·P1’和P2’之间的距离。
·P1’和M之间的平均距离,以及P2’和M之间的距离。
·路径1的长度和P1与P1’之间的距离(直线)的比率。
·路径2的长度和P2与P2’之间的距离(直线)的比率。
·统计参数是根据多个测试从上述得出的。
应当强调的是,本申请中先前讨论的所有特征都可以与图5A中所示的系统100结合使用—其不限于图5B中所示的实例。
图6A至图6E展示了上面提到的各种参数,以及如何使用这些参数来确定测试是否已经开始、测试是否已经完成和测试是否已经成功完成的实例。应当强调的是,这些条件比附图中所示的掐捏测试的具体实例更普遍地应用。现在参考图6A,当以下情况时可以认为测试开始:两个手指触摸屏幕(如由图6A中最外面的圆圈所示);“初始手指距离”大于“最小开始距离”;两个手指之间的中心点(“初始手指距离”的中点处的点)位于边界框内;和/或手指没有沿不同方向移动。
我们现在讨论可以用于确定测试是否“完成”的各种特征。例如,当手指之间的距离减小、手指之间的距离变得小于掐捏间隔并且手指之间的距离已经减小了至少手指之间的间距的最小变化时,可以认为测试完成。除了确定测试是否“完成”之外,本申请还可以被配置为确定测试何时“成功”。例如,当两个手指之间的中心点比预定的阈值更接近形状的中心或边界框的中心时,可以认为尝试成功。该预定的阈值可以是掐捏间隔的一半。
图6B至图6D展示了测试完成、未完成、成功和不成功的情况:
·在图6B中,尝试尚未完成。手指之间的距离正在减小,并且手指之间的距离减小了超过所需的阈值。然而,手指之间的间隔大于掐捏间隔,这意味着测试尚未完成。
·在图6C中,尝试完成。手指之间的距离正在减小,手指之间的距离小于掐捏间隔,并且手指之间的间距减小了超过阈值。在这种情况下,尝试也是成功的,因为手指之间的中心点距形状的中心不到掐捏间隔的一半。
·在图6D中,测试完成,因为手指之间的距离正在减小,手指之间的距离小于掐捏间隔,并且手指之间的间距已经减小了大于阈值间距。然而,尝试并不成功,因为手指之间的中心点距形状的中心(即边界框的中心)的距离超过掐捏间隔的一半。
图7至图10示出了用户在执行绘制形状测试时可以看到的显示的实例。图11之后示出了可以从用户的绘制形状尝试得出的结果,并且该结果形成可以输入到分析模型中的数字生物标志物特征数据。
图7示出了绘制形状测试的简单实例,其中用户必须在触摸屏显示器108上从上到下描绘线。在图7的具体情况中,向用户示出了起点P1、终点P2、一系列中间点P和待描绘的路径的一般指示(图7中的灰色)。此外,还为用户提供了指示在哪个方向上沿循路径的箭头。图8是类似的,除了用户要从下到上描绘线。图9和图10也是类似的,除了在这些情况下,形状分别是封闭的正方形和圆形。在这些情况下,第一点P1与终点P1相同,并且箭头指示应该顺时针还是逆时针描绘形状。本发明不限于直线、正方形和圆形。可以使用的其他形状(如稍后所示)是八字形和螺旋形。
如本申请前面已经讨论的,可以从绘制形状测试中提取三个有用的特征。这些在图11之后展示。图11展示了本文中称为“结束迹线距离”的特征,其是期望端点P2与用户路径的端点P2’之间的偏差。这有效地参数化了用户的过冲。这是有用的特征,因为它提供了一种测量用户控制移动的终点的能力的方法,这是用户的运动控制的程度的有效指示。图12A至图12C每个示出了类似的特征,即“开始-结束迹线距离”,即用户路径P1’的起点与用户路径P2’的终点之间的距离。这是从封闭形状中提取的有用特征,诸如分别在图12A、12B和12C所示的正方形、圆形和八字形,因为如果测试完美执行,则然后路径应该在其结束的同一点开始。因此,开始-结束迹线距离特征提供了与前面讨论的结束迹线距离相同的有用信息。此外,然而,该特征还提供了有关用户如何能够准确地将手指放在所需的开始位置P1上的信息,这也测试了运动控制的单独的方面。图13A至图13C展示了“开始迹线距离”,其是用户的开始点P1’与期望的开始点P1之间的距离。如所讨论的,这提供了有关用户如何一开始能够准确地定位其手指的信息。
附加的实验结果
多发性硬化症(MS)是一种中枢神经系统的慢性炎症性、自身免疫性、脱髓鞘疾病。1它可能导致多个功能域受损,包括上肢功能。研究表明,高达60–76%的MS(PwMS)患者在患病期间经历或表现出上肢功能受损的迹象。2-4此类损伤会限制执行日常生活活动的能力并且从而降低生活的质量。5因此,评估上肢功能在监测疾病方面发挥着重要作用。6不幸的是,尽管上肢功能强烈影响生活的质量,并且对于残疾更明显的患者来说是一项关键测量,但在大多数治疗试验中很少进行测量。几种不同的评估可用于测量上肢功能或手动灵活性。其中这些包括力量灵活性测试、7凹槽钉板、8明尼苏达灵活性测试(和其转动子测试)、9功能灵活性测试10、11和九孔柱测试(9HPT)。6由于凭借其易用性和良好的心理测量特性,9HPT已成为上肢功能的常用的评估,并且被纳入多发性硬化症功能综合评分(MSFC)中。6,12,13然而,诸如9HPT的功能评估在诊所就诊期间是很少执行的,因此限制它们的效用。14因此需要能够以最小的患者负担远程进行的新的评估,因此可以更频繁地执行。掐捏测试被设计为客观的、生态有效的、基于传感器的上肢功能的评估,其可以在家中远程通过智能手机执行,而无需监督。15通过利用智能手机装置中嵌入的传感器,它可以测量掐捏移动的多个特性,而不是像9HPT那样提供单一的总结分数。掐捏测试首次应用于临床试验‘使用数字技术(智能手机和智能手表)监测多发性硬化症参与者-可行性研究’(NCT02952911)。16在这项研究中,先前示出两个特征—成功掐捏和双触异步性的次数—与9HPT、扩展残疾状态量表(EDSS)、1729项多发性硬化症影响量表(MSIS-29)的与手臂相关的项18和全脑容量相关,并且显示出中等至良好的测试-重测信度。15通过分析此处提供的有关上肢功能的更丰富的数据,这项先前的工作通过以下而扩展:探索被设计成探测上肢功能损伤的不同方面并且进一步表征掐捏测试作为上肢功能的客观和远程评估的用途的扩展的特征的范围。检查扩展的特征空间的测试-重测信度,连同其与MS疾病状态的标准临床测量的一致性,以及区分PwMS和健康对照(HC)的能力。此外,还评估了掐捏测试特征之间捕获的共享和补充信息。
方法
这项为期24周的前瞻性研究评估了在提供的智能手机上使用Floodlight PoC应用程序远程监控MS的可行性。完整的研究设计以及纳入和排除标准在之前已报道过16。两个中心招募了七十六名PwMS和二十五名18-55岁的HC。PwMS根据2010年修订的McDonald标准19进行诊断,并且具有在0.0与5.5之间的基线EDSS评分。该研究包括三次诊所就诊(基线、第12周和第24周[研究结束]),在此期间所有研究参与者均接受了标准临床测量。PwMS使用9HPT、EDSS、MSIS-29、口腔符号数字模式测试(SDMT)以及运动和认知功能疲劳量表(FSMC)进行评估,而HC仅使用9HPT、口腔SDMT和FSMC进行评估。附加地,在基线就诊期间,所有研究参与者都接收到了提供的预安装有Floodlight PoC应用程序的三星Galaxy S7智能手机,并且被指示执行基于智能手机的日常测试,包括掐捏测试。
掐捏测试
掐捏测试构成了本专利申请的主题,被设计成测试上肢功能的运动、视觉和认知方面。15通过评估两个手指(拇指以及第二或第三手指)的协调性,它可以评估抓住诸如钥匙、钢笔或门把手等小物体所需的能力。为了执行测试,参与者一只手拿着智能手机,另一只手在30秒内掐捏或挤压尽可能多的番茄形状,见图22。使用测试手的两根手指成功掐捏番茄形状后,新的番茄形状出现在智能手机显示器上的新的随机位置。在交替测试运行中评估惯用手和非惯用手。
特征提取
总共,从原始触摸屏和加速度计信号提取了说明测试的13个基础特征、11个基于惯性测量单元(IMU)特征和13个疲劳特征,见图23。
在本专利申请中,我们考虑以下特征的结果:
·两指尝试分数
·掐捏时间
·间隔时间
·最后点距离
·手指路径比率
·水平性
·取向稳定性
·疲劳成功尝试分数
·疲劳两指尝试分数
·疲劳掐捏时间
·疲劳双触异步性
·疲劳手指路径长度
这些特征以及其他比较特征的限定在分布于图14A至图14G的表中提供。
基础特征捕获上肢的整体损伤(执行掐捏的次数、成功掐捏的次数、成功尝试的分数和两指尝试的分数);手指协调性(双触异步性和双升异步性)、掐捏响应性(间隔时间);运动范围或掐捏精确度(手指路径长度);以及肌肉无力、痉挛或震颤(手指路径比率、手指路径速度、第一点或最后一点之间的距离、掐捏时间)。基于IMU特征是基于持有智能手机装置的未经测试的手的加速度计大小的平均值、标准偏差和峰度或智能手机的取向,并且开发用于捕获因两只手之间的协调性、肌肉无力或颤抖而产生的信号。通过测量测试前半部分与后半部分之间的性能差异来计算每个基础特征的疲劳特征。
数据处理
由于掐捏测试是无人监督的,因此识别未按照测试说明执行的个别测试运行非常重要。15研究参与者被要求在进行掐捏测试时将手机握在未经测试的手中;任何以手机放在坚硬表面(诸如桌子)上为特征的测试运行都将被忽略并且被视为无效。此外,为了对上肢功能实现有意义的评估,只有贡献至少20次有效测试运行的研究参与者才会被保留进行分析。最后,将数据汇总如下:
·对于测试-重测信度分析,通过使用跨两周窗口收集的至少三个有效个体评估来计算中位数特征值来聚合掐捏测试特征,以减少由于在患者的健康中的工作日与周末之间的差异或变化而导致的一般疾病独立变异性。
·由于PwMS中的疲劳水平每天都会波动,20因此通过获取跨两周窗口的标准偏差附加地聚合了疲劳特征。
·对于所有其他分析,掐捏测试特征是通过获取整个研究期间的中位数(基础特征、基于IMU特征和疲劳特征)或标准偏差(仅疲劳特征)来聚合的。
·此外,通过获取诊所就诊的平均值来聚合标准临床测量(9HPT;EDSS;口腔SDMT;MSIS-29手臂项目2、6、15;FSMC身体子量表)。
统计分析
进行了四次单独的分析。虽然惯用手和非惯用手的数据具有高度可比性(见图15),但惯用手数据的变异性略低。因此,仅报告对惯用手进行的分析。
在PwMS中通过计算组内相关性系数(2,1)(ICC[2,1])来评估测试-重测信度,该系数考虑了所有连续两周窗口。15每两周窗口至少需要三次有效测试运行。测试-重测信度被认为是差(ICC<0.05)、中等(ICC=0.5至0.74)、良好(ICC=0.75至0.9)或优秀(ICC>0.9)。21
年龄和性别调整后的斯皮尔曼等级相关性分析评估了与标准临床测量的一致性。掐捏测试特征与9HPT、EDSS、MSIS-29手臂项目、口腔SDMT和FSMC相关。该分析仅限于PwMS,因为HC中未收集EDDS和MSIS-29。相关性的强度被认为是不相关(│r│<0.25)、一般(│r│=0.25至0.49)、中等至良好(│r│=0.5至0.75)或良好至优秀(│r│>0.75)。22
此外,还对以下进行了两项独立的年龄和性别调整部分斯皮尔曼等级相关性分析1)基础特征、9HPT和口腔SDMT,以评估基础特征是否主要由运动或认知成分(或两者)驱动,以及2)疲劳特征、9HPT和FSMC来研究疲劳特征是否主要测量上肢功能或疲劳。
年龄和性别调整后的已知群体有效性分析评估了区分HC和PwMS子群的能力,并且使用Mann-Whitney U测试、Cohen’s d效应量和接受者工作曲线下面积(AUC)进行评估。包括两个PwMS子群:基线处的正常9HPT时间的PwMS(PwMS-正常)和基线处的异常9HPT时间的PwMS(PwMS-异常)。异常9HPT的阈值限定为由Erasmus等人得出的HC的惯用手规范数据的平均值加上两个标准偏差。23因此,所有惯用手9HPT基线时间低于22.15秒的PwMS被视为PwMS-正常,而所有剩余的PwMS被视为PwMS-异常。在一项单独的分析中,研究了疲劳特征区分无身体疲劳与有身体疲劳的PwMS之间的能力,限定为至少轻度疲劳(FSMC身体子量表≥22分)24。为了评估掐捏测试特征之间的共享和互补信息,执行了横截面成对斯皮尔曼等级相关性和重复测量相关性。与成对相关性相比,重复测量相关性分析估计每个受试者的独立截距,从而最大限度地减少受试者之间疾病严重程度差异引起的可能偏差。通过执行主成分分析和因子分析来补充这一点。
错误发现率(FDR)校正后,统计显着性设置为p<0.05,其分别应用于每个类别的特征(基础、基于IMU、疲劳)。
结果
总共登记了76名PwMS和25名HC,其中67名PwMS和18名HC被纳入此处介绍的分析中。这里包括的参与者的基线人口统计和疾病特性(见本专利申请的描述的末尾所附的表1)与完整研究人群的基线人口统计和疾病特征相似。16EDSS平均(SD)分数为2.4(1.4)并且双手平均(SD)9HPT时间为22.3(4.2)秒以及惯用手为22.1(4.7)秒,分析中包含的PwMS大多为轻度疾病,伴有有限的上肢功能损伤。与HC相比,PwMS队列的女性参与者比例更大(68%vs 33%),并且平均年龄稍大(39.2[7.8]岁vs35.0[8.9]岁)。
测试-重测信度
PwMS的测试-重测信度分析如图16所示。基础掐捏测试特征示出了中等或良好的测试-重测信度,ICC(2,1)在0.55—0.81之间。三次诊所就诊中惯用手上针对9HPT时间的ICC(2,1)为0.83。基于IMU特征示出了类似的ICC(2,1),其范围为0.51—0.81。在所有特征中,ICCs(2.1)在HC中往往较小,可能是由于该队列中受试者间变异性较低,见图17。
相关性分析
大多数基础特征与上肢功能和总体疾病严重程度的标准临床测量显示出一般或中等至良好的相关性,如图18所示。与9HPT的最强一致性是在双触异步性(r=0.54)、执行掐捏的次数(r=-0.48)和成功掐捏的次数(r=-0.48)方面观察到的。七个附加基础特征—两指尝试分数、掐捏时间、间隔时间、最后点距离、手指路径长度、手指速度和手指路径比率—显示出与9HPT的一般的相关性(│r│≤0.46)。大多数基础特征与EDSS显示出一般的相关性(│r│≤0.39),并且与MSIS-29手臂项目显示出一般或中等至良好的相关性(│r│≤0.53)。基础特征还与信息处理速度和疲劳相关,如图19所示。虽然所有十三个基础特征均与口腔SDMT显示出一般或中等至良好的相关性(│r│≤0.55),但对于大多数基础特征,与FSMC总分的相关性达到一般或中等至良好的强度(│r│≤0.52)。取向稳定性—显示出与至少三个临床测量的一般的相关性(9HPT:r=-0.27;MSIS-29手臂项目:r=-0.27;口腔SDMT:r=-0.28),如图18和图19中所示。疲劳特征通常与上肢功能和总体疾病严重程度的临床测量相关,特别是在应用标准偏差聚合时,如图18所示。使用这种聚合方法,对于大多数疲劳特征,与9HPT的相关性达到了一般或中等至良好的强度(│r│≤0.61)。与EDSS(│r│≤0.41)和MSIS-29手臂项目(│r│≤0.46)的相关性大多是一般的。通过获取标准偏差聚合的疲劳特征也与信息处理和疲劳相关,如图19所示。对于大多数疲劳特征,与口腔SDMT的相关性为一般或中等至良好(│r│≤0.63),而与FSMC总分的相关性达到一般强度(│r│≤0.47)。在基础特征、基于IMU特征和疲劳特征中,与FSMC身体和认知分量表的相关性和与FSMC总分的相关性高度相似,如图20所示。
接下来,对基础特征进行偏相关性分析,以评估它们是否主要由上肢功能和认知成分驱动,见图21的A和B部分。执行掐捏的次数、双触异步性、间隔时间和手指路径比率在考虑了口腔SDMT的正确反应的数量后,均与9HPT相关(分别为r=-0.27、r=0.31、r=0.29和r=0.32)。单独的偏相关性分析评估了疲劳是否主要捕获疲劳或上肢功能,见图21的C和D部分。当使用中位数聚合方法时,疲劳掐捏时间(r=-0.29)、疲劳路径长度(r=-0.30)和疲劳双升异步性(r=-0.26)即使在考虑了9HPT时间后也与FSMC总分相关。当应用标准偏差聚合方法时,在考虑9HPT时间后,两个疲劳特征与FMSC总分相关(疲劳成功尝试分数:r=-0.26;第一点距离:r=0.27)。
区分和区别HC与PwMS子群之间的能力
表2中总结了掐捏测试特征区分和区别HC、PwMS-正常与PwMS-异常之间的能力,并且附于本申请的描述。总体而言,基础特征表现出区分PwMS-正常与PwMS-异常之间的最强能力。对于两个子群之间显示出统计显着差异的八个基础特征(绿色表格单元格;p<0.05)—包括成功掐捏的次数—AUC范围为0.68–0.79,Cohen’s d范围为0.43–1.04。附加地,三个基础特征区分了HC与PwMS-异常(AUC=0.75–0.75;Cohen’s d=0.35–0.79;所有三个特征的所有p<0.05)。当使用标准偏差聚合方法时,一些疲劳特征区分了PwMS-正常与PwMS-异常。对于这两个子群之间显示出统计显着差异的五个疲劳特征(绿色表格单元格;p<0.05),AUC范围为0.70–0.82,Cohen’s d范围为0.38–1.10。此外,其中三个特征还区分了PwMS-异常与HC(AUC:0.74–0.76;Cohen’s d=0.52–0.64;所有三个特征的所有p<0.05)。
掐捏测试特征之间的关系
还研究了基础特征之间的关系。成对斯皮尔曼等级相关性分析揭示了,几个特征彼此独立,如图21的A部分所示。注意到特征之间存在一些相关性,但手指路径比率或疲劳掐捏时间没有相关性。观察到的相关性可能受到疾病严重程度的影响。为了确定所评估的特征的常见个体内关联,进行了重复测量相关性分析。与成对相关性分析不同,重复测量相关性分析测量每个受试者内两个特征的相关程度,并且因此不会与疾病严重程度混淆。由此产生的相关性矩阵如图21的B部分所示。正如预期的那样,进行掐捏的次数与以下相关:掐捏时间(相关性系数[CC]=-0.58)、间隔时间(CC=-0.43)和手指速度(CC=0.58),因为较慢的掐捏或较大的间隔时间将导致30秒窗口期内的掐捏较少。更令人惊讶的是,间隔时间与双触异步性相关(CC=0.65)。这种相关性尚待解释,但指出了影响掐捏响应性(即间隔时间)和手指协调性(即双触异步性)的共同因子。主成分分析也支持了大多数特征捕获独特信息的观点。虽然需要四个主成分才能解释大约80%的方差,但需要六个主成分才能解释90%的方差,见图21的C部分。这也反映在因子分析中,该分析揭示了所需的因子以解释由具有不同负载的基础特征捕获的数据,见图21的D部分。
讨论
基于智能手机传感器的简单和生态有效的掐捏测试的可靠特征与上肢功能、总体疾病严重程度、认知功能和疲劳的标准临床测量相关;并且确认PwMS有上肢功能损伤。掐捏测试被设计成测量执行日常生活活动的能力,诸如抓握物体、扣衬衫扣子或控制餐具,并且可以由患者在家中频繁地独立执行。通过利用市售智能手机中嵌入的传感器,它可以对掐捏的多个方面进行评估,包括掐捏的准确性、效率和平滑度以及两个手指的运动的范围和协调性。理想的掐捏测试特征满足以下三个标准:测试-重测信度、与标准临床测量的一致性以及区分和区别有上肢功能损伤的PwMS与没有上肢功能损伤的PwMS的能力。在本研究中,我们确认了满足所有三个标准的特征,如表3所示(附于本申请末尾)。这些包括大部分基础特征,包括执行掐捏的次数、成功掐捏的次数、两指尝试分数、掐捏时间、间隔时间、双触异步性、最后点距离和手指路径比率。这些特征表现出中等或良好的测试-重测信度,这与关于基于智能手机传感器的MS25和帕金森病26,27中的上肢功能的评估的先前研究一致。与之前报告的9HPT的ICC为0.84相比,最可靠的掐捏测试功能实现了0.81的ICC(2,1),28。对于基础特征而言,与临床医生报告的评估(9HPT和EDSS)和患者对疾病影响的看法(MSIS-29的手臂相关项目)的一致性通常最强。由于在智能手机装置上30秒内掐捏尽可能多的西红柿需要运动技能,而且还需要快速的信息处理和注意力,因此许多基础特征与9HPT和口腔SDMT相关也就不足为奇了。附加地,这两种临床测量都因疾病严重程度而混淆。因此,可以预期与口腔SDMT存在一定程度的相关性。因此,即使在考虑了口腔SDMT后,主要捕获运动成分的特征仍将与9HPT保持显着相关性,而在考虑9HPT后与口腔SDMT的相关性将趋于零。执行掐捏的次数、双触异步性、手指路径比率和间隔时间都显示出这个特性。毫不奇怪,双触异步性被确认为主要由运动成分驱动的特征,因为它测量在掐捏手势开始时拇指与第二或第三手指触摸智能手机屏幕之间的持续时间。因此,它被设计成独立于识别屏幕上出现的新番茄形状所涉及的认知任务。基础特征还显示出区分PwMS-正常与PwMS-异常的最强能力,指示越严重的功能损伤程度导致越差的掐捏测试的表现。其中三个特征—两指尝试分数、间隔时间和双触异步性—也区分了HC与PwMS-异常。使用全局9HPT阈值将PwMS分类为PwMS-正常或PwMS-异常。该阈值由Erasmus等人的标准人群得出23,因为该人群显示出与我们的PwMS队列相似的年龄和性别分布。HC和PwMS-异常的较少的数量以及各组之间年龄和性别的不平衡限制了区分HC与PwMS子群的能力。
评估持有智能手机的手的功能的基于IMU特征,通常满足测试-重测信度标准,见附于描述的表3。ICC(2,1)与通过基础特征获得的结果进行了比较,但它们在与临床测量的一致性以及区分HC与PwMS子群的能力方面的表现较差。考虑到参与本研究的大多数PwMS患有复发缓解型疾病,本研究中遇到的移动异常或运动缺陷的幅度可能不足以让这些特征捕获疾病相关信号。最后,我们研究了疲劳特征。这些如在比较了测试前半部分和后半部分期间的测试表现,并且我们假设它们会捕获疲劳。当通过标准偏差聚合单个的测试时,一些疲劳特征最多满足三个标准中的两个(疲劳掐捏时间满足所有三个标准),如表4所示。标准偏差聚合的改进的性能可能反映了疲劳的波动,正如在PwMS中常见的那样。20
掐捏测试提供了上肢功能的客观、自我评估,其可以补充MS的标准临床评估。研究了一系列特征,并且可以识别那些提供掐捏运动的各个方面的可靠测量的特征,其包括:掐捏的准确性、效率、响应性和平滑度;与上肢功能和总体疾病严重程度的临床测量的一致性;以及区分有无上肢功能损伤的PwMS的能力。
参考文献
1.Reich DS,Lucchinetti CF和Calabresi PA。Multiple Sclerosis.NewEngland Journal of Medicine 2018;378:169-180.DOI:10.1056/NEJMra1401483.
2.Johansson S,Ytterberg C,Claesson IM等人High concurrent presence ofdisability in multiple sclerosis.Associations with perceived health.JNeurol2007;254:767-773.2007/04/02.DOI:10.1007/s00415-006-0431-5.
3.Kister I,Bacon TE,Chamot E等人Natural history of multiple sclerosissymptoms.Int J MS Care 2013;15:146-158.DOI:10.7224/1537-2073.2012-053.
4.Bertoni R,Lamers I,Chen CC等人Unilateral and bilateral upper limbdysfunction at body functions,activity and participation levels in peoplewith multiple sclerosis.Mult Scler 2015;21:1566-1574.2015/02/11.DOI:10.1177/1352458514567553.
5.Yozbatiran N,Baskurt F,Baskurt Z等人Motor assessment of upperextremity function and its relation with fatigue,cognitive function andquality of life in multiple sclerosis patients.J Neurol Sci 2006;246:117-122.2006/05/05.DOI:10.1016/j.jns.2006.02.018.
6.Feys P,Lamers I,Francis G等人The Nine-Hole Peg Test as a manualdexterity performance measure for multiple sclerosis.Multiple SclerosisJournal 2017;23:711-720.DOI:10.1177/1352458517690824.
7.Valero-Cuevas FJ,Smaby N,Venkadesan M等人The strength-dexteritytest as a measure of dynamic pinch performance.J Biomech 2003;36:265-270.
8.Almuklass AM,Feeney DF,Mani D等人Peg-manipulation capabilitiesduring a test of manual dexterity differ for persons with multiple sclerosisand healthy individuals.Exp Brain Res 2017;235:3487-3493.2017/08/30.DOI:10.1007/s00221-017-5075-4.
9.Tesio L,Simone A,Zebellin G等人Bimanual dexterity assessment:validation of a revised form of the turning subtest from the MinnesotaDexterity Test.Int J Rehabil Res 2016;39:57-62.DOI:10.1097/MRR.0000000000000145.
10.Aaron DH和Jansen CW.Development of the Functional Dexterity Test(FDT):construction,validity,reliability,and normative data.J Hand Ther2003;16:12-21.
11.Tissue CM,Velleman PF,Stegink-Jansen CW等人Validity andreliability of the Functional Dexterity Test in children.J Hand Ther 2017;30:500-506.2016/11/15.DOI:10.1016/j.jht.2016.08.002.
12.Wang YC,Magasi SR,Bohannon RW等人Assessing dexterity function:acomparison of two alternatives for the NIH Toolbox.J Hand Ther 2011;24:313-320;quiz 321.2011/07/30.DOI:10.1016/j.jht.2011.05.001.
13.Cutter GR,Baier ML,Rudick RA等人Development of a multiplesclerosis functional composite as a clinical trial outcome measure.Brain1999;122:871-882.DOI:10.1093/brain/122.5.871.
14.Rae-Grant A,Bennett A,Sanders AE等人Quality improvement inneurology:Multiple sclerosis quality measures:Executive summary.Neurology2015;85:1904-1908.2015/09/02.DOI:10.1212/WNL.0000000000001965.
15.Montalban X,Graves J,Midaglia L等人A smartphone sensor-baseddigital outcome assessment of multiple sclerosis.Mult Scler J 2021;doi:10.1177/13524585211028561.
16.Midaglia L,Mulero P,Montalban X等人Adherence and Satisfaction ofSmartphone-and Smartwatch-Based Remote Active Testing and Passive Monitoringin People With Multiple Sclerosis:Nonrandomized Interventional FeasibilityStudy.J Med Internet Res 2019;21:e14863.DOI:10.2196/14863.
17.Kurtzke JF.Rating neurologic impairment in multiple sclerosis:anexpanded disability status scale(EDSS).Neurology 1983;33:1444-1452.
18.Hobart J,Lamping D,Fitzpatrick R等人The Multiple Sclerosis ImpactScale(MSIS-29):a new patient-based outcome measure.Brain 2001;124:962-973.
19.Polman CH,Reingold SC,Banwell B等人Diagnostic criteria formultiple sclerosis:2010revisions to the McDonald criteria.Ann Neurol 2011;69:292-302.DOI:10.1002/ana.22366.
20.Powell DJH,Liossi C,Schlotz W等人Tracking daily fatiguefluctuations in multiple sclerosis:ecological momentary assessment providesunique insights.J Behav Med 2017;40:772-783.20170309.DOI:10.1007/s10865-017-9840-4.
21.Koo TK和Li MY.A Guideline of Selecting and Reporting IntraclassCorrelation Coefficients for Reliability Research.J Chiropr Med 2016;15:155-163.2016/03/31.DOI:10.1016/j.jcm.2016.02.012.
22.Portney LG和Watkins MP.Foundations of Clinical Research:Applications to Practice.第三版编辑:Pearson/Prentice Hall,2009.
23.Erasmus L-P,Sarno S,Albrecht H等人Measurement of ataxic symptomswith a graphic tablet:standard values in controls and validity in MultipleSclerosis patients.Journal of Neuroscience Methods 2001;108:25-37.DOI:https://doi.org/10.1016/S0165-0270(01)00373-9.
24.Svenningsson A,Falk E,Celius EG等人Natalizumab treatment reducesfatigue in multiple sclerosis.Results from the TYNERGY trial;a study in thereal life setting.PLoS One 2013;8:e58643.20130321.DOI:10.1371/journal.pone.0058643.
25.Messan KS,Pham L,Harris T等人Assessment of Smartphone-Based SpiralTracing in Multiple Sclerosis Reveals Intra-Individual Reproducibility as aMajor Determinant of the Clinical Utility of the Digital Test.Front MedTechnol 2021;3:714682.20220201.DOI:10.3389/fmedt.2021.714682.
26.Lipsmeier F,Taylor KI,Kilchenmann T等人Evaluation of smartphone-based testing to generate exploratory outcome measures in a phase 1Parkinson's disease clinical trial.Mov Disord 2018;33:1287-1297.2018/04/27.DOI:10.1002/mds.27376.
27.Sahandi Far M,Eickhoff SB,Goni M等人Exploring Test-RetestReliability and Longitudinal Stability of Digital Biomarkers for ParkinsonDisease in the m-Power Data Set:Cohort Study.J Med Internet Res 2021;23:e26608.20210913.DOI:10.2196/26608.
28.Goldman MD,LaRocca NG,Rudick RA等人Evaluation of multiplesclerosis disability outcome measures using pooled clinical trialdata.Neurology 2019;93:e1921-e1931.2019/10/22.DOI:10.1212/WNL.0000000000008519.
29.Aghanavesi S,Nyholm D,Senek M等人A smartphone-based system toquantify dexterity in Parkinson's disease patients.Informatics in MedicineUnlocked 2017;9:11-17.DOI:10.1016/j.imu.2017.05.005.
30.Krysko KM,Akhbardeh A,Arjona J等人Biosensor vital sign detectsmultiple sclerosis progression.Ann Clin Transl Neurol 2021;8:4-14.20201119.DOI:10.1002/acn3.51187.
表1
表2
/>
/>
/>
表3
/>
/>
/>

Claims (21)

1.一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,所述计算机实现方法包括:
向移动装置的用户提供远端运动测试,所述移动装置具有触摸屏显示器,其中向所述移动装置的所述用户提供所述远端运动测试包括:
使所述移动装置的所述触摸屏显示器显示测试图像;
从所述移动装置的所述触摸屏显示器接收输入,所述输入指示用户将第一手指放在所述测试图像中的第一点上和将第二手指放在所述测试图像中的第二点上并且将所述第一手指和所述第二手指掐捏在一起从而使所述第一点和所述第二点靠在一起的尝试;以及
从经接收的输入提取数字生物标志物特征数据,
其中,以下任一项:
(i)经提取的数字生物标志物特征数据为所述临床参数,或者
(ii)所述方法进一步包括从经提取的数字生物标志物特征数据来计算所述临床参数。
2.根据权利要求1所述的计算机实现方法,其中:
所述经接收的输入包括:
指示所述第一手指离开所述触摸屏显示器时的时间的数据;
指示所述第二手指离开所述触摸屏显示器时的时间的数据;并且
所述数字生物标志物特征数据包括所述第一手指离开所述触摸屏显示器时的时间与所述第二手指离开所述触摸屏显示器时的时间之间的差。
3.根据权利要求1或权利要求2所述的计算机实现方法,其中:
所述经接收的输入包括:
指示所述第一手指离开所述触摸屏显示器时的位置的数据;以及
指示所述第二手指离开所述触摸屏显示器时的位置的数据;并且
所述数字生物标志物特征数据包括所述第一手指离开所述触摸屏显示器时的位置与所述第二手指离开所述触摸屏显示器时的位置之间的距离。
4.根据权利要求1至3中任一项所述的计算机实现方法,其中:
所述经接收的输入包括:
指示由所述第一手指从其最初触摸所述第一点时的时间到其离开触摸屏时的时间所描绘的第一路径的数据,所述数据包括第一起点、第一终点和第一路径长度;以及
指示由所述第二手指从其最初触摸所述第二点时的时间到其离开触摸屏时的时间所描绘的第二路径的数据,所述数据包括第二起点、第二终点和第二路径长度;
所述数字生物标志物特征数据包括第一平滑参数,所述第一平滑参数为所述第一路径长度与所述第一起点和所述第一终点之间的距离的比率;并且
所述数字生物标志物特征数据包括第二平滑参数,所述第二平滑参数为所述第二路径长度与所述第二起点和所述第二终点之间的距离的比率。
5.根据权利要求1至4中任一项所述的计算机实现方法,其中:
所述方法包括:
从所述移动装置的所述触摸屏显示器接收多个输入,所述多个输入中的每一个指示用户将第一手指放在所述测试图像中的第一点上和将第二手指放在所述测试图像中的第二点上并且将所述第一手指和所述第二手指掐捏在一起从而使所述第一点和所述第二点靠在一起的相应尝试;以及
从多个经接收的输入中的每一个提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
6.根据权利要求1至4中任一项所述的计算机实现方法,其中:
所述方法包括:
从所述移动装置的所述触摸屏显示器接收多个输入,所述多个输入中的每一个指示用户将第一手指放在所述测试图像中的第一点上和将第二手指放在所述测试图像中的第二点上并且将所述第一手指和所述第二手指掐捏在一起从而使所述第一点和所述第二点靠在一起的相应尝试;
确定对应于成功尝试的多个经接收的输入的子集;以及
从多个经接收的输入的经确定的子集中的每一个输入提取相应的数字生物标志物特征数据片段,从而生成相应的多个数字生物标志物特征数据片段。
7.根据权利要求5或权利要求6所述的计算机实现方法,其中:
所述方法进一步包括从以下中任一项得出统计参数:
所述多个数字生物标志物特征数据片段,或者
对应于成功尝试的相应的数字生物标志物特征数据片段的经确定的子集;并且
所述统计参数包括:
所述多个数字生物标志物特征数据片段的平均值;和/或
所述多个数字生物标志物特征数据片段的标准偏差;和/或
所述多个数字生物标志物特征数据片段的峰度;
所述多个数字生物标志物特征数据片段的中位数;
所述多个数字生物标志物特征数据片段的百分位数。
8.根据权利要求5至7中任一项所述的计算机实现方法,其中:
在由第一时间段接着第二时间段组成的总时间内接收所述多个经接收的输入;
所述多个经接收的输入包括:
在所述第一时间段期间接收的经接收的输入的第一子集,所述经接收的输入的第一子集具有经提取的数字生物标志物特征数据片段的相应的第一子集;并且
在所述第二时间段期间接收的输入的第二子集,经接收的输入的第二子集具有经提取的数字生物标志物特征数据片段的相应的第二子集;
所述方法进一步包括:
得出对应于所述经提取的数字生物标志物特征数据片段的第一子集的第一统计参数;
得出对应于所述经提取的数字生物标志物特征数据片段的第二子集的第二统计参数;以及
通过计算所述第一统计参数与所述第二统计参数之间的差,并且任选地将所述差除以所述第一统计参数,来计算疲劳参数。
9.根据权利要求5至8中任一项所述的计算机实现方法,其中:
所述方法进一步包括:
确定对应于仅所述第一手指和所述第二手指接触所述触摸屏显示器的用户尝试的所述多个经接收的输入的第一子集;
确定对应于仅一个手指或者三个或更多个手指中任一项接触所述触摸屏显示器的用户尝试的所述多个经接收的输入的第二子集;并且
所述数字生物标志物特征数据包括:
所述经接收的输入的第一子集中的经接收的输入的数量;和/或
在所述经接收的输入的第一子集中的经接收的输入的总数的比例。
10.根据权利要求1至9中任一项所述的计算机实现方法,其中:
所述方法进一步包括获得包括以下中的一者或多者的加速度数据:
(a)从贯穿整个测试的持续时间的加速度的大小得出的统计参数;
(b)从仅在所述第一手指、所述第二手指或两个手指与所述触摸屏显示器接触的时段期间的加速度的大小得出的统计参数;以及
(c)仅在没有手指接触所述触摸屏显示器的时段期间的加速度的大小的统计参数;并且
所述统计参数包括以下中的一者或多者:
所述平均值;
所述标准偏差;
所述中位数;
所述峰度;和
百分位数。
11.根据权利要求1至10中任一项所述的计算机实现方法,其中:
所述方法进一步包括获得加速度数据;
所述加速度数据包括以下中任一项:
水平状态参数,其中确定所述水平状态参数包括:
对于多个时间点中的每一个,确定:
加速度的大小;以及
所述加速度的z分量的大小,其中z方向被限定为垂直于所述触摸屏显示器的平面的方向;
所述加速度的所述z分量与所述加速度的所述大小的比率;
确定历经所述多个时间点的经确定的比率的平均值,或者取向稳定性参数,其中确定所述取向稳定性参数包括:
对于多个时间点中的每一个,确定:
加速度的大小;以及
所述加速度的z分量的大小,其中z方向被限定为垂直于所述触摸屏显示器的平面的方向;
所述加速度的所述z分量与加速度值的大小的比率;确定历经所述多个时间点的经确定的比率的标准偏差。
12.根据权利要求1至11中任一项所述的计算机实现方法,其中:
待预测状态的疾病为多发性硬化症并且所述临床参数包括扩展残疾状态量表(EDSS)值,
待预测状态的疾病为脊髓性肌萎缩并且所述临床参数包括用力肺活量(FVC)值,或者
其中待预测状态的疾病为亨廷顿病并且所述临床参数包括总运动评分(TMS)值。
13.根据权利要求1至12中任一项所述的计算机实现方法,其进一步包括以下步骤:
将至少一个分析模型应用于所述数字生物标志物特征数据;
基于所述至少一个分析模型的输出来确定所述临床参数。
14.根据权利要求13所述的计算机实现方法,其中:
所述分析模型包括经训练的机器学习模型。
15.根据权利要求14所述的计算机实现方法,其中:
所述分析模型为回归模型,并且所述经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
线性回归;
偏最小二乘(PLS);
随机森林(RF);以及
极端随机树(XT)。
16.根据权利要求15所述的计算机实现方法,其中:
所述分析模型为分类模型,并且所述经训练的机器学习模型包括以下算法中的一者或多者:
深度学习算法;
k最近邻(kNN);
支持向量机(SVM);
线性判别分析;
二次判别分析(QDA);
朴素贝叶斯(NB);
随机森林(RF);以及
极端随机树(XT)。
17.一种确定疾病的状态或进展的计算机实现方法,所述计算机实现方法包括:
执行根据权利要求1至16中任一项所述的计算机实现方法;以及
基于经确定的临床参数来确定所述疾病的所述状态或进展。
18.一种用于定量确定指示疾病的状态或进展的临床参数的系统,所述系统包括:
移动装置,其具有触摸屏显示器、用户输入界面和第一处理单元;以及
第二处理单元;
其中:
所述移动装置被配置为向其用户提供远端运动测试,其中提供所述远端运动测试包括:
第一处理单元使所述移动装置的所述触摸屏显示器显示测试图像;
所述用户输入界面被配置为从所述触摸屏显示器接收输入,所述输入指示用户将第一手指放在所述测试图像中的第一点上和将第二手指放在所述测试图像中的第二点上并且将所述第一手指和所述第二手指掐捏在一起从而使所述第一点和所述第二点靠在一起的尝试;
所述第一处理单元或所述第二处理单元被配置为从经接收的输入提取数字生物标志物特征数据。
19.一种用于确定疾病的状态或进展的系统,其包括根据权利要求18所述的系统,其中所述第一处理单元或所述第二处理单元进一步配置为基于经提取的数字生物标志物特征数据来确定所述疾病的所述状态或进展。
20.一种用于定量确定指示疾病的状态或进展的临床参数的计算机实现方法,所述计算机实现方法包括:
从所述移动装置接收输入,所述输入包括:
来自加速度计的加速度数据,所述加速度数据包括多个点,每一个点对应于相应时间处的加速度;
从经接收的输入提取数字生物标志物特征数据,其中提取所述数字生物标志物特征数据包括:
对于所述多个点中的每一个,确定所述相应时间处的所述加速度的总大小与所述加速度的z分量的大小的比率;以及
从多个经确定的比率得出统计参数,所述统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
21.一种用于定量确定指示疾病的状态或进展的临床参数的系统,所述系统包括:
移动装置,其具有加速度计和第一处理单元;以及
第二处理单元;
其中:
所述加速度计被配置为测量加速度,并且所述加速度计、所述第一处理单元或所述第二处理单元中的任一项被配置为生成包括多个点的加速度数据,每一个点对应于相应时间处的加速度;
所述第一处理单元或所述第二处理单元被配置为通过以下来从经接收的输入提取数字生物标志物特征数据:
对于所述多个点中的每一个,确定所述相应时间处的所述加速度的总大小与所述加速度的z分量的大小的比率;以及
从多个经确定的比率得出统计参数,所述统计参数包括平均值、标准偏差、百分位数、中位数和峰度。
CN202280022749.9A 2021-03-30 2022-03-30 用于定量确定临床参数的计算机实现方法和系统 Pending CN117546254A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21166119 2021-03-30
EP21166119.4 2021-03-30
PCT/EP2022/058486 WO2022207749A1 (en) 2021-03-30 2022-03-30 Computer-implemented methods and systems for quantitatively determining a clinical parameter

Publications (1)

Publication Number Publication Date
CN117546254A true CN117546254A (zh) 2024-02-09

Family

ID=75477868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280022749.9A Pending CN117546254A (zh) 2021-03-30 2022-03-30 用于定量确定临床参数的计算机实现方法和系统

Country Status (5)

Country Link
EP (1) EP4315363A1 (zh)
JP (1) JP2024512708A (zh)
KR (1) KR20230165272A (zh)
CN (1) CN117546254A (zh)
WO (1) WO2022207749A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109690689A (zh) * 2016-09-14 2019-04-26 豪夫迈·罗氏有限公司 用于进行性ms的数字生物标记
WO2018050763A1 (en) * 2016-09-14 2018-03-22 F. Hoffmann-La Roche Ag Digital biomarkers for cognition and movement diseases or disorders
CN111557033A (zh) * 2017-10-25 2020-08-18 豪夫迈·罗氏有限公司 用于认知和移动疾病或障碍的数字质量计量生物标记
CN114173640A (zh) * 2019-06-19 2022-03-11 豪夫迈·罗氏有限公司 数字生物标志物

Also Published As

Publication number Publication date
KR20230165272A (ko) 2023-12-05
WO2022207749A1 (en) 2022-10-06
EP4315363A1 (en) 2024-02-07
JP2024512708A (ja) 2024-03-19

Similar Documents

Publication Publication Date Title
US20200315514A1 (en) Digital biomarkers for muscular disabilities
US20220285027A1 (en) Prediction of disease status
US20200075167A1 (en) Dynamic activity recommendation system
US20220104755A1 (en) Digital biomarker
Derungs et al. Physical activity comparison between body sides in hemiparetic patients using wearable motion sensors in free-living and therapy: A case series
US20220351864A1 (en) Means and methods for assessing huntington&#39;s disease (hd)
CN117546254A (zh) 用于定量确定临床参数的计算机实现方法和系统
US20240153632A1 (en) Computer-implemented methods and systems for quantitatively determining a clinical parameter
US20220223290A1 (en) Means and methods for assessing spinal muscular atrophy (sma)
US20220401010A1 (en) Means and methods for assessing huntington&#39;s disease of the pre-manifest stage
SankarPandi et al. Predicting disability levels of community dwelling older individuals using single wrist mounted accelerometer
KR102357041B1 (ko) 인공 지능을 이용한 질병 분석 및 예측 방법
Valerio Development of Machine Learning-Based Algorithms for Assessing Tai Chi Exercise Proficiency in Older Adults
Derungs Performance monitoring and evaluation of patients after stroke in free-living using wearable motion sensors and digital biomarkers
Suri et al. Fear of falling in community-dwelling older adults: What their gait acceleration pattern reveals
Hirten et al. Remote Short Sessions of Heart Rate Variability Biofeedback Monitored With Wearable Technology: Open-Label Prospective Feasibility Study
Georgescu A Remote Pulmonary Rehabilitation System Using the Wearable RESpeck Monitor
Derungs Bewegungsüberwachung und Evaluierung von Patienten nach Schlaganfall im Alltag mit körpergetragenen Sensoren und digitalen Biomarkern
Taylor Sensor-Based Assessment of the Quality of Human Motion During Therapeutic Exercise

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication