WO2020014884A1 - 一种筛选去同步化指标的方法 - Google Patents

一种筛选去同步化指标的方法 Download PDF

Info

Publication number
WO2020014884A1
WO2020014884A1 PCT/CN2018/096091 CN2018096091W WO2020014884A1 WO 2020014884 A1 WO2020014884 A1 WO 2020014884A1 CN 2018096091 W CN2018096091 W CN 2018096091W WO 2020014884 A1 WO2020014884 A1 WO 2020014884A1
Authority
WO
WIPO (PCT)
Prior art keywords
point
data
peak
phase
take
Prior art date
Application number
PCT/CN2018/096091
Other languages
English (en)
French (fr)
Inventor
徐璎
杨凌
张陶
Original Assignee
苏州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 苏州大学 filed Critical 苏州大学
Priority to PCT/CN2018/096091 priority Critical patent/WO2020014884A1/zh
Priority to CN201880095725.XA priority patent/CN112423648B/zh
Publication of WO2020014884A1 publication Critical patent/WO2020014884A1/zh

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种大规模节律性数据获取后筛选去同步化指标的自动化判断方法。本发明为大规模节律性数据的筛选提供了可能,相较于现有非自动化判断技术有本质的进步。通过定义两个指标成功筛选小鼠去同步化表型,本发明可有效筛选人体生物节律数据去同步化。

Description

一种筛选去同步化指标的方法 技术领域
本发明涉及一种用于筛选昼夜去同步化的生物标记物和筛选方法。
背景技术
生物钟在同步生理行为与环境之间起着关键性作用。它允许有机体预测每日周期性的事件来适应外界环境光、暗周期的变化,从而使得身体状态更好。昼夜节律的遗传学基础的发现扩大了人们对生物钟如何产生昼夜节律的认识(Takahashi,J.S.Transcriptional architecture of the mammalian circadian clock.Nat Rev Genet 18,164-179(2017);Partch,C.L.,Green,C.B.& Takahashi,J.S.Molecular architecture of the mammalian circadian clock.Trends Cell Biol 24,90-9(2014).)。哺乳动物中的生物钟被认为是一种分级系统,其包括对环境输入的感知、将时间相关信息整合到生物钟中、将调整后的时间信息传输至生理行为,并随后将组织信息反馈到生物钟(Welsh,D.K.,Takahashi,J.S.& Kay,S.A.Suprachiasmatic nucleus:cell autonomy and network properties.Annu Rev Physiol 72,551-77(2010);Takahashi,J.S.Transcriptional architecture of the mammalian circadian clock.Nat Rev Genet 18,164-179(2017).)。该系统的架构引发了以下问题:这个动态的网络是如何参与环境光/暗周期同步?重要的是,现代生活方式因素和不同的时间类型与昼夜牵引(circadian entrainment)是紧密相关的((Kondratova,A.A.& Kondratov,R.V.The circadian clock and pathology of the ageing brain.Nat Rev Neurosci 13,325-35(2012);Morris,C.J.et al.Endogenous circadian system and circadian misalignment impact glucose tolerance via separate mechanisms in humans.Proe Natl Acad Sci U S A 112,E2225-34(2015);Garaulet, M.,Ordovas,J.M.& Madrid,J.A.The chronobiology,etiology and pathophysiology of obesity.Int J Obes(Lond)34,1667-83(2010);Stothard,E.R.et al.Circadian Entrainment to the Natural Light-Dark Cycle across Seasons and the Weekend.Curr Biol 27,508-513(2017);Qian,J.& Scheer,F.A.Circadian System and Glucose Metabolism:Implications for Physiology and Disease.Trends Endocrinol Metab 27,282-93(2016).)。昼夜节律系统是由遗传编码,不同信号传导途径之间存在明显的交叉作用。因此,在生物体中的大规模筛选可以提供新的分子组分和了解昼夜牵引的机制。然而,不同于通过周期长度和节律性来评估昼夜节律,用于昼夜牵引的生物标志物其实并不清楚,而本发明旨在解决这个问题。
在人体内,昼夜节律生物钟与环境信号的功能障碍或错位会改变睡眠-清醒周期的时间。携带hPER2 S662G/CSNK1D T44A/hCRy2 A260T突变体的小鼠可模拟人类的行为节律,能显示在光照/黑暗周期中不会牵引活动的起跳点(Hirano,A.et al.A Cryptochrome 2 mutation yields advanced sleep phase in humans.Elife 5(2016);Xu,Y.et al.Functional consequences of a CKIdelta mutation causing familial advanced sleep phase syndrome.Nature 434,640-4(2005);Xu,Y.et al.Modeling of a human circadian mutation yields insights into clock regulation by PER2.Cell 128,59-70(2007).)。PER2中的S662位点在人PER1中是保守的(S714)。在PER1中携带S714G突变的小鼠能够表现出进食行为和代谢平衡的异常(Liu,Z.et al.PER1 phosphorylation specifies feeding rhythm in mice.Cell Rep 7,1509-20(2014).)。
国际小鼠表型分析联盟(IMPC)对基因敲除小鼠进行系统性地表型分析产生了一个基因功能目录(de Angelis,M.H.et al.Analysis of mammalian gene function through broad-based phenotypic screens across a consortium of mouse clinics(vol 47,pg 969,2015).Nature Genetics 47(2015);Dickinson, M.E.et al.High-throughput discovery of novel developmental phenotypes.Na ture 537,508-514(2016);Beckers,J.,Wurst,W.& de Angelis,M.H.Towar ds better mouse models:enhanced genotypes,systemic phenotyping and envir otype modelling.Nat Rev Genet 10,371-80(2009).)。间接测热法的参数包含在IMPC分析结果中,由IMPC表型工作组开发标准化方案(https://www.mou sephenotype.org/impress/protocol/86)。使用配备有红外光束中断的代谢室而不是具有轮子的笼子来监测活动参数,以避免人为地增强或减弱活性。食物摄入监测系统也被整合用于调查昼夜节律模式和行为。因此,使用IMPC数据集进行昼夜牵引的系统性基因筛选是可行的,并且绕过产生突变株,这样节省了时间、费用和劳动力。
另一方面,实验动物是人工饲养,对其携带的微生物实行控制,遗传背景明确或者来源清楚的,用于科学研究、教学、生产、检定及其科学实验的动物。目前,实验动物主要包括小鼠、兔子等等。
目前,特别是对于小鼠的实验,需要通过代谢笼来记录活动、饮食、体温,研究不同的因素对节律性的指标的影响。在数据记录过程中许多偶然的因素都会对得到的数据产生干扰,如:食物突然掉落,突然的人为事件,环境条件突然变化等。因此,数据中除了正常范围内的数据外也会存在一些偶然因素的产生的干扰数据,因此需要能够更准确判断生物钟中去同步化的可靠的生物标记物。
发明内容
尽管一些偏离正常节律的个体中,参数起跳点Onset、峰值相位peak phase、morning peak、amplitude等都会一定程度上出现偏离,但是发明人发现在大规模的数据中,只有Onset、peak phase可以成为用于指示昼夜节律去同步化状态 和进一步筛选节律相关基因的指标。而其他的参数并不能用于指示去同步化。这Onset、peak phase两个参数是发明人第一次提出可以作为判定去同步化的指标。
鉴于此,本发明提供了一种判断受试者昼夜节律去同步化状态的方法,其中通过检测以下指标中的至少一种判断受试者昼夜节律去同步化:
1)活动和/或食物摄取节律的起跳点;
2)活动和/或食物摄取节律的峰值相位。
在一个实施例中,通过上述方法判断受试者昼夜节律去同步化状态,筛选与异常昼夜牵引有关遗传基因,所述遗传基因优选包括Slc7A11、Rhbdl1、Spop和Oxtr基因的至少一种。
一种筛选受试者昼夜节律去同步化相关基因的方法,包括以下步骤:
1.其中通过检测以下指标中的至少一种判断受试者昼夜节律去同步化:
1)活动和/或食物摄取节律的起跳点;
2)活动和/或食物摄取节律的峰值相位。
2.通过判断受试者昼夜节律去同步化状态,筛选与异常昼夜牵引有关遗传基因。
其中,所述遗传基因优选包括Slc7A11、Rhbdl1、Spop和Oxtr基因的至少一种。
在一个实施例中,所述受试者包括哺乳动物,优选为人类、小鼠、大鼠、猴的至少一种。
另一方面,还提供了一种从大规模数据中筛选活动和/或食物摄取节律的起跳点和峰值相位的方法,编写成程序优选使用Matlab并实现,包括以下实施步骤:
1)对生物体的生理、行为的节律性数据进行数据预处理,其中所述节律性数据是通过设定时间间隔内采样采集得到;
2)定义峰值相位,其中所述峰值相位为节律性数据最高峰对应的时间点;
3)定义起跳点,其中所述起跳点为各类节律性数据在一个周期内由低转变为高的开始的时间点。
在本发明的一个实施例中,上述步骤1)包括:
1-1)去掉在静息阶段超出正常生理范围的数据;
1-2)对外界环境发生交替变化的时刻所导致数据的突然变化下产生的干扰点去除;如果所述交替点是局部最大值或者最小值,且是由于外界环境交替变化引起的突跳点,则在拟合阶段时将该点去除;
1-3)将与前后相邻两点差距特别大的点(11)去除。
在一个具体实施例中,作为数据预处理,可以诸如去掉在静息阶段超出正常生理范围的数据;对外界环境发生交替变化的时刻所导致数据的突然变化下产生的干扰点去除;如果所述交替点是局部最大值或者最小值,且是由于外界环境交替变化引起的突跳点,则在拟合阶段时将该点去除;将与前后相邻两点差距特别大的点(11)去除。
在一个具体实施例中,在上述步骤1-1)中,所述超出正常生理范围的数据是根据不同的生理指标类型而定,其中,不同的生理指标类型包括以下数据的一种或多种:
a)小鼠活动数据中白天活动量超过4000次/小时的数据;
b)饮食数据中白天超过0.65克/小时的数据;
c)人心率数据在夜间大于200次/分的数据。
在一个具体实施例中,在上述步骤1-3)中,所述点(11)的数值与其左右两点的数值差的绝对值均大于阈值,阈值可以设定为一个周期内最大值的五分之四或其他比例,不同数据该比例可以设置不同。
在onset定义的过程中,判断起跳的阈值较为重要,对于本发明方法的准确性影响较大;高斯函数拟合原始数据,得到相位的过程中,拟合的初始值会对准确性影响较大。
之前对于代谢笼数据的处理是以余弦函数拟合为主的,只能有一个峰,本发明使用多个高斯的函数进行拟合,对于多峰的情况更加准确。
在一个实施例中,上述步骤2)包括:
2-1)对节律性的数据搜索三次局部高峰,其中昼夜节律性数据在一个周期内至少存在一个峰;
2-2)运用高斯拟合的方法对已进行数据预处理的数据进行拟合,将所述步骤1-2)中找到的所述局部最大值及其对应的时间点,作为高斯拟合中相位的初始值,对节律性数据进行拟合,得到拟合曲线;
2-3)选择拟合结果的第一个高峰对应的时间点作为所测定的指标的相位。
在一个实施例中,上述步骤3)包括:
3-1)确定第一个候选点:将节律性的数据分成高态区和低态区两类,在从低态区向高态区变化的过程中,设定从最近的外界环境转变点之前至少3小时开始,第一个达到高态对应的时间点为起跳点的第一个候选点;
3-2)确定第二个候选点:在从低态区向高态区变化的过程中,最近的外界环境转变点之前至少3小时开始,当该位置上的点与前三个点的均值之差大于阈值,将该位置上的点认为是起跳点,而该位置上的点对应的时间为起跳点的第二个候选点;
3-3)所述第一个候选点和所述第二个候选点中较前的一个点,为起跳的时间点。
在一个具体实施例中,上述步骤3-1)中,将节律性的数据分成高态区和低态区两类的方法是k-means聚类法。
在本发明中,将峰值相位和起跳点作为大规模筛选去同步化的指标。
进一步地,将峰值相位(Peak phase)和起跳点(Onset)这两个生物学指标(Biomarker)作为大规模筛选去同步化的指标;峰值相位,其生物学定义是各类节律性数据的最高峰所对应的时间,表示在该时刻,节律性的生理指标达到了最高值;起跳点,其生物学定义为各类节律性指标在一个周期内变化趋势由低转变为高开始的时间点。
在一个实施例中,前述方法还包括:
4)使用效应量比较筛选对象的峰值相位以及起跳点与对应基线的偏离程度。
在一个具体实施例中,上述步骤4)包括:
4-1)效应量是用来度量某个因素引起的影响的大小的统计量,与统计样本的大小无关;
4-2)偏离程度的具体计算方法为,筛选对象的峰值相位或起跳点的均值与峰值相位或起跳点的基线的均值之差,除以联合标准差。
其中,偏离正常情况的判断标准是:某个突变体的峰值相位(起跳点)与基线的差值位于所有筛选对象的峰值相位(起跳点)与基线差值的分布的2倍标准差之外。
发明人因此设计了一个方法,并确定了4个涉及昼夜牵引的新基因(Slc7A11、Rhbdl1、Spop或Oxtr)。
本发明提供了用于制备或检测Slc7A11、Rhbdl1、Spop或Oxtr基因的物质在制备用于检测异常昼夜牵引疾病的产品中的应用。
有益效果
本发明提供一种大规模节律性数据获取后筛选去同步化指标的自动化判断方法。此方法包含的基本特征是:1)程序化地实现非真实及受干扰数据的去除;2)定义了节律性生理数据的峰值相位与起跳点,作为此种筛选的生物学指标;3)使用效应量来比较筛选对象的峰值相位和起跳点与对应基线的偏离程度,从而确定去同步化程度。本发明为大规模节律性数据的筛选提供了可能,相较于现有非自动化判断技术有本质的进步。通过定义两个指标成功筛选小鼠去同步化表型,本发明有可能成为筛选人体生物节律数据去同步化的有效方法,例如通过于随身智能监测设备的数据,筛选如睡眠失调,代谢紊乱等同步化情况。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的 部件。在附图中:
图1示出使用IMPC资源确定生物标志物的筛选策略以及异常昼夜偏差表型的鉴定。
图2示出四个中心超过1200个C57BL6N小鼠间接测热法记录的起跳点、峰值相位和振幅的趋势。1(红色)代表最强;0(蓝色)代表最弱。
图3示出通过目视评估四个中心的起跳点、峰值相位分布。(a-h)在12小时光照和12小时黑暗循环下,在四个中心(ICS,WTSI,RBRC和TCP)获得的起跳点和峰值相位数据分布的直方图。对于活动(a-d),N=1200个C57BL/6N小鼠,通过间接测热法随时间测量的N=1206个C57BL/6N小鼠的食物摄入量(e-h)。粉红色柱:起跳点,红柱:峰值相位。
图4示出通过自动发现分析评估四个中心的起跳点、峰值相位分布。(a-h)在12小时光照和12小时黑暗循环下,在四个中心(ICS,WTSI,RBRC和TCP)获得的起跳点和峰值相位数据分布的直方图。对于活动(a-d),N=1200个C57BL/6N小鼠,通过间接测热法随时间测量的N=1206个C57BL/6N小鼠的食物摄入量(e-h)。粉红色柱:起跳点,红柱:峰值相位。
图5示出Bland-Altman方法计算两种方法之间的平均差异,即活动的视觉和自动检测分析测量。计算95%的一致性限度(1.96s.d.)以确定自动发现测定是否可以取代视觉评估。(a-d)显示活动起跳点数据,(e-h)显示四个中心(ICS,WTSI,RBRC和TCP)获得的峰值相位活动数据。
图6示出Bland-Altman方法计算两种方法之间的平均差异,即食物摄入的视觉和自动测定分析测量。(a-d)显示起跳点数据,(e-h)显示四个中心(ICS,WTSI,RBRC和TCP)获得的峰值相位数据。
图7示出突变株的每只个体小鼠的起跳点和峰值相位表型分析。(a-h)振荡活动和食物摄入随时间变化的概况(左),数据以平均值(n=7-8)表示。相矢量重现每个突变小鼠的起始点(紫色点)和峰值相位(红色点)。蓝点和线代表均值±s.d.的野生型起跳点(内圈)和峰值相(第二圈)。红色栏表示异常。 一天中的时间以小时表示,黑暗阶段以阴影表示。
图8示出大规模节律性数据获取后筛选去同步化指标的方法的数据预处理中干扰数据点的示意图;
图9示出大规模节律性数据获取后筛选去同步化指标的方法的原始数据和双峰拟合曲线的示意图;
图10示出大规模节律性数据获取后筛选去同步化指标的方法的三个小鼠活动的Onset位置示意图;
图11示出大规模节律性数据获取后筛选去同步化指标的方法的四个小鼠活动的活动位置示意图。
具体实施方式
下面通过具体实施方式及实验数据对本发明作进一步的说明。尽管为了清楚的目的,在下文中使用了专用术语,但这些术语并不意味着定义或限制本发明的范围。
除非另有限定,本文中所使用的所有技术和科学术语具有与本发明所述技术领域的普通技术人员通常理解相同的含义。
本发明中使用的术语“峰值相位”、“Peak phase”可互换,其生物学含义是指各类节律性数据的最高峰所对应的时间,表示在该时刻,节律性的生理指标达到了最高值。
本发明中使用的术语“起跳点”、“Onset”,其生物学含义是指各类节律性指标在一个周期内变化趋势由低转变为高开始的时间点。
本发明中,术语“突跳点”,其是指由于外界环境变化引起的数据变化点。
本发明中使用的术语“同步化”是指机体与环境昼夜节律之间的是否同步,如果不同步,即“去同步化”,就会在临床上出现Chronotypes,和环境昼夜之间不同步,即早起早睡,晚起晚睡,或者体内各种代谢,生理指标不能够达到最好状态。
在本发明中,术语“数据预处理”是指对数据中一些数据的剔除,例如去掉在静息阶段超出正常生理范围的数据;对外界环境发生交替变化的时刻所导致数据的突然变化下产生的干扰点去除;如果所述交替点是局部最大值或者最小值,且是由于外界环境交替变化引起的突跳点,则在拟合阶段时将该点去除;将与前后相邻两点数值差的绝对值均大于阈值的点(11)去除。
在本发明中,术语“阈值”是指一个周期内数值为最大值的三分之二或以上的数值,优选为一个周期内数值为最大值的五分之四或以上的数值。
在本发明中,术语“设定时间间隔”是指收集的数据是通过一定的时间间隔采集的,所述时间间隔可以是相同的,也可以彼此是不同的,间隔例如可以是每小时采集数据,每分钟采集数据,具体的间隔时间可以根据本领域技术人员的常规进行调整。
在本发明中,术语“突然变化”是指因外界环境发生交替变化的时刻所导致数据的变化,这种由于环境的改变引起的变化为突然变化。由于环境的改变和改变前的数据之间存在显著性差异,优选存在10%以上、20%以上、30%以上、50%以上、80%以上的差异。
在本发明中,术语“大规模筛选”是指从生物体的节律例如活动和/或食物 摄取节律的大规模数据中计算生物学指标的过程。
在本发明中,术语“大规模数据”是指关于若干生物体的节律例如活动和/或食物摄取节律的数据,其中生物体个数为两个以上,优选为10个以上,100个以上,1000个以上,10000个以上。
在本发明中,术语“高态区”是指节律数据根据K-means聚类分类方法将数据点进行高低值聚类获得的高值的节律数据,相对应的,术语“低态区”是指节律数据根据K-means聚类分类方法将数据点进行高低值聚类获得的低值的节律数据。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
实施例1 使用IMPC资源进行筛选
发明人通过设计一种方法框架对间接测热法测量的活动和食物摄入量进行系统和无偏分析(图1),从而量化活动和食物摄入行为、基因修饰物诱导光照/黑暗周期的同步性。我们下载并使用来自IMPC、理化学研究所生物资源中心(RBRC)、Phenogenomics多伦多中心(TCP)、Institute Clinique de la Souris(ICS)和Wellcome Trust Sanger Institute(WTSI)的热图,以可视化趋势并确定可靠的生物标志物。然后,发明人采用经验性视觉评估,并用算法获得生物标志物的数值。使用对照生物标志物值来评估不同中心内和不同中心之间的表型偏差。
根据突变系中生物标记分布,确定了第一次初筛的临界百分位数值。然后,使用适当的分析,包括相似表型的百分比、标准化效应大小和统计分析,基于主要筛选结果进行二次筛选。最后,使用昼夜系统和表型关联分析之间的相互关系分析(图1)验证筛选结果。
实施例2 筛选并确定可靠和可量化的生物标志物
在确定能够用于筛选的有效生物标志物时,来自C57BL/6N的基线数据对于中心和/或中心内的可靠性是至关重要的。发明人首先获得了超过1200种野生型C57BL/6N小鼠参数,这些参数与间接测热法的活动和/或食物摄入周期有关,然后使用热图作为原始数据。如预期的那样,结果显示,观察到每只小鼠的活动和食物摄取的Onset起跳点和振幅(图2)。图2中,图中左图和右图分别是使用4个中心野生型小鼠活动和饮食的原始数据作的热图,每一行代表一只小鼠的活动或饮食。图上方的水平柱中灰色部分表示夜晚,白色部分表示白天,水平柱下方的数字表示对应的时间。每一只小鼠活动或饮食的数据都使用其最大值去标准化,即每一行的最大值都为1。
活动节律和食物摄取都显示出两个峰值:傍晚(E)峰值为“强”振荡器,清晨(M)峰值为“弱”振荡器。此外,热图在两个峰之间呈现相应的图案和尖锐的转变,反映了固定的相位关系(图2)。观察结果表明,这些参数可能是筛选的潜在生物标志物。
通过优化绘制散点图的条件来评估这些生物标记,并且在21小时内以1小时的间隔以产生用于活动/休息的总共1200个散点图和用于食物摄取的1206个散点图(ZT0:开灯,ZT12:关灯);这些图片保存在Cam-Su GRC数据库中。活动和/或食物摄取的起跳点时间和峰值相位由两位交叉验证领域的专家进行评估。可靠地检测到活动和/或食物摄入的起跳点时间能产生最低的方差(图3a-d)。
活动和/或食物摄入的E峰值相位表现出比活动开始更宽的分布,且在所有小鼠中被发现此现象(图3e-h)。RBRC的onset方差高于其他中心(图3b),这 可能是由于屋内不同的光照时间导致的(WTSI:7:30-19:30;TCP:7:00-19:00;ICS:7:00-19:00;RBRC 11:00-23:00)。基于这些结果,此次的数据分析因此被限制在中心内部的比较而不是中心之间的比较。
表1
Figure PCTCN2018096091-appb-000001
表1是活动和饮食数据的统计结果。EP phases ave=evening peak的均值。EP=evening peak表示黑夜中的第一个高峰。EP phases SD=evening peak的标准差。MP phases SD=morning peak的标准差,MP=morning peak表示开灯时间附近的高峰。EP amp min=该中心evening peak振幅的最小值。EP amp max=该中心evening peak振幅的最大值。EP amp ave=该中心evening peak振幅的平均值。EP amp SD=该中心evening peak振幅的标准差。
从上述的数据看,MP phases的标准差比EP phases的标准差大,从图2也可以看出,EP phases基本集中在3小时内,而MP phases比较分散。
就EP amp本身而言,我们使用变异系数CV来考察期本身的离散程度,CV=EP amp SD/EP amp ave。通常来看如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除。所以,MP phases本身的variation就较大不可作为生物标记物。即包括来自振幅和早晨峰值(M)未能产生有意义的估计价值。
为了实现大规模筛选的客观评估,我们开发了一种自动寻找生物标志物的 算法来研究IMPC资源的效用。首先使用多重高斯函数来拟合M和E峰值相位和振幅。这种技术是基于这样一种假设,即早晨和晚上的活动至少包括两个振荡器,每个振荡器具有相互重叠的正常高度分布以调节活动的开始和结束。使用k-means将夜间数据分为两部分:活动和休息。搜索Zeitgeber时间(ZT)10后的第一个活动点,并将相应的ZT值用作候选起跳点。然后,搜索了ZT10之后的第一个数据点,它与前三个点的平均值之间的差值达到了一定的阈值。相应的ZT值被用作另一个候选起跳点。在这两个候选点中,前面的点被认为是Onset起跳点。之后将该模型应用于1200多只C57BL/6N小鼠的数据集。在每个中心分别汇总了Onset起跳点和活动期和食物摄入量的结果(图4a-h)。
然后,使用Bland-Altman方法比较这两种方法,以确定自动发现测定是否可以取代视觉评估。Bland-Altman图表显示两种方法之间的差异在95%的一致性范围内是可接受的,在起跳点获得的更精确的结果比在峰值期间获得的结果更精确(图5a-h和图6a-h)。推断起跳点很容易被视觉评估认为是从非活动状态明显陡峭的提升,而峰值相位有时会显示一个平台,这可能导致峰值相位识别的偏差。
最后,我们建立了阳性突变系,并通过使用hPER2 S662G小鼠用于评估活动起跳点的提前、使用Fbxl 3-/-小鼠用于活动起跳点的延迟,使用hPER1 S714G小鼠用于评价进食的食物摄取提前和Nestin-Cre:Zbtb20 -/-评价峰值相位的延迟,来评价标志物和自动发现分析(图7a-f)。起跳点和峰值相位使用间接测热法记录进行自动寻找测定来估计。使用标准化效应大小(d)来估计表型偏差,其中突变型和野生型对照之间的绝对差异以表型标准偏差为单位进行缩放,即d=(突变起跳点/峰值相位-对照起跳点/峰值相位)/σ。这些阳性对照在起跳点时间和峰值相位显示出高的可检测的d值,表明自动发现测定和生物标记物将是用于搜索昼夜携带的遗传组分的可靠工具。
总体而言,我们通过分析1200多种C57BL/6N标准化小鼠的显著趋势,定义了两种强大的生物标志物。我们的自动发现方法可以避免主观方面对体验的影响,使用大规模资源提供快速查找。
实施例3 发现昼夜节律表型的遗传决定因素
对312个敲除小鼠和203个杂合子小鼠进行了有效表型筛选,代表了498个基因,通过三个标准进一步筛选:(1)50%的小鼠显示非常相似的表型;(2)效应大小(d)>1.2代表差异(代表差异非常大);和(3)突变株与表型基线之间的统计学显著性(p值)小于0.001。我们发现4个新的突变基因(Slc7A11 - /-、Rhbd11 +/-、Spop +/-、Oxtr -/-)与昼夜节律相关(图7)。
实施例4.数据预处理:
实验记录得到的数据,通常都会伴随着一定的噪声。特别地,小鼠代谢笼数据的记录时间间隔比较大且连续性不强,通常是以二十分钟至一小时为时间间隔。时间间隔较长时,一些波动会对小鼠各项节律性指标的数据的分析有较大的影响。此外,一些系统性的影响也会对小鼠活动和饮食节律的数据导致较大的波动,如:有些中心的数据在ZT12(关灯时刻)时的活动数据存在突然提高,形成一个小峰,会对真实的第一个高峰的相位判断产生较大的影响。数据的波动对进一步数据分析带来很大的困难甚至会导致错误的分析结论。还有一些数据是明显远离正常范围的数据。因此,在对数据进项分析前我们要对数据进行数据预处理。去除偶然和系统性的波动。
实施目的:准确地判断并去除坏数据点。实施方案:使用Matlab将原始数据读出,分为三步进行判断。第一步,找到明显远离正常范围的数据,如:白天小鼠活动大于4000次/小时或者饮食量大于0.65克的数据,都将剔除。第二步, 判断系统性误差,统一对某一中心的数据在ZT12时单独判断,判断其是否为突然跳起,然后将在ZT12突然跳起的数据点去除。第三步,去除与前后相邻点差距特别大的点,首先判断该点是否是局部最大值的点,如果是,接下来判断该数据点与相邻数据之间的差值是否超过某一阈值,若超过则,定义该点为与整体的趋势不符合,将该点去除。
实施结果:如图8所示,将三种类型的坏点去除,使得数据比较光滑。中,图8中三类数据坏点的代表,左:数据明显超出常规范围;中:突跳的特别高的点,与整体趋势不符;右:ZT12突然增高,导致小峰。
实施例5.拟合小鼠节律性的数据,获得小鼠各类生理指标节律的相位:
小鼠的各类节律性生理指标可以通过代谢笼来记录。代谢笼记录的数据都是离散的,一般以三十分钟或者一小时为时间间隔记录。虽然原始数据能看到清晰且明显的昼夜节律。小鼠各类节律性生理指标的原始数据可以观察到明显的几个高峰,然而由于数据的离散度较高观测到的高峰只能说面是这些检测到的数据点的高峰,并不能代表活动和饮食真正的相位,甚至有些小鼠的数据很难判断第一个活动高峰。因此,在判断小鼠各类节律性数据的相位需要使用一些拟合的手段来对原始数据的趋势进行拟合,得到一条光滑曲线然后就可以得到准确的相位的数值。在此之前的研究主要是针对RNA水平的昼夜节律,RNA水平的昼夜节律通常是一个峰,因此拟合的手段主要以正弦(余弦)函数为主。然而,小鼠许多生理指标,如:活动,饮食,耗氧量,呼出的二氧化碳的量的节律呈现出的双峰,甚至可能出现三峰。因此,简单的正弦(余弦)函数已无法满足拟合的需求,因为同周期的正弦(余弦)函数得的线性叠加得到的函数仍然是单峰的。所以,我们选择高斯函数为拟合的最小单元,多个峰就用多个高斯函数进行叠加,叠加后得到的函数就是一个多峰的函数。拟合后得到的各个参数都有其对应的生物学意义,其中各个高斯函数均值对应的参数就是代表 了各个峰所在的相位。
实施目的:准确地得到小鼠各类生理指标节律的相位。实施方案:我们使用高斯函数对小鼠的节律性数据进行拟合,具体步骤如下。首先我们寻找原始数据中的峰值的位置,我们将峰值的位置定义为,比相邻前后两点的数据点都高的局部最大点。搜寻峰值时,默认高峰的个数最多为三个。三峰拟合时,拟合函数是三个高斯函数的叠加,形如式(1)。然后,将搜索到的峰值所对应的时间和峰值作为拟合时相位和振幅的初始值。将以上得到初始值用叠加后的高斯函数进行拟合。最后在拟合后得到的参数中得到小鼠活动和饮食的相位。
实施结果:如图9所示,拟合曲线与原始数据匹配较好,峰值的相位明显。图9中,左:原始代谢笼数据,阴影部分表示黑夜;右:原始数据和拟合的曲线,红色曲线代为根据原始数据拟合得到。
具体来说,为了得到小鼠活动和饮食的相位,我们使用最小二乘法进行拟合。我们使用三个高斯函数的线性拟合作为我们的拟合函数,使用Matlab中的lsqcurvefit函数进行拟合。拟合函数的形式如下:
Figure PCTCN2018096091-appb-000002
a 3,a 6和a 9分别代表三个峰的相位,
Figure PCTCN2018096091-appb-000003
Figure PCTCN2018096091-appb-000004
分别代表三个峰的峰值,a 2,a 5和a 8分别代表三个峰的宽度,a 10是拟合曲线的最小值。合适的三个峰的相位的拟合初始值和拟合参数范围对于最小二乘法拟合很重要。因此,我们首先为高斯拟从原始数据中合寻找合适的初始值和参数范围。三个峰对应的时间(ZT peak1,ZT peak2和ZT peak3)作为a 3,a 6和a 9的初始值;a 2,a 5和a 8的初始值人为设置为2;a 1,a 4和a 7的初始值为
Figure PCTCN2018096091-appb-000005
Figure PCTCN2018096091-appb-000006
其中m 1,m 2和m 3 是三个峰测量得到的峰值。如果只有两个峰,那么m 3设为0,如果只有一个峰m 2和m 3都设为0。拟合饮食数据时a 10的初始值是0.05,拟合活动数据时a 10的初始值是750,拟合其他数据时根据具体情况设定。然后,我们设置各个参数的上界和下界。a 3,a 6和a 9的参数范围是[ZT peak1-3,ZT peak1+3],[ZT peak2-3,ZT peak2+3]和[ZT peak3-3,ZT peak3+3]。a 1,a 4和a 7的参数范围是
Figure PCTCN2018096091-appb-000007
Figure PCTCN2018096091-appb-000008
a 2,a 5和a 8的参数范围都设为[0,4]。拟合饮食数据时a 10的参数范围是[0,0.15],拟合活动数据时a 10的参数范围是[0,1500],拟合其他数据时根据具体情况设定。
实施例6.定义小鼠活动和饮食的Onset:
小鼠的各类节律性生理指标在外界光照牵引的情况下会有明显的活动和休息两部分,通常情况下在关灯时间前后小鼠的各类节律性生理指标会从较低的状态向活跃的状态转变,然后各类节律性生理指标会逐渐上升达到第一个峰值,开始转变的这个时间点是小鼠各类指标高态和低态的明显分界点,是白天的休息状态向夜间第一个活越状态的转换点。这个点和各类节律性生理指标的相位一样能表征小鼠各类节律性生理指标的节律被外界光照环境同步的情况。特别地,Onset的变化还可以用来表征小鼠各类节律性生理指标对光照的响应。Onset和相位一样可以作为筛选的生物学标志,来寻找影响这一过程的遗传学因素。
实施目的:准确地定义出小鼠各类节律性生理指标开始上升的起始位置(Onset)。实施方案:我们从ZT9开始逐一判断各个数据点是否满足我们对Onset的定义。Onset有两类的特点,首先,数值上Onset点达到了活动的状态,其次,动态上,Onset通常是突然跳起的一个点。因此,我们依据这两个特点 来定义Onset点。第一类定义:第一类分类是从数据的大小来判断。我们用K-means分类方法将夜间的数据点分为高态区和低态区两类。从ZT9开始第一个达到夜间活动水平的点对应的时间点,我们将这个点作为第一个Onset候选点。第二类定义:第二类定义是通过判断数据点的突跳情况来判断的。从ZT9开始将每个数据点的前三个点的平均值与第一个峰值的差的绝对值乘上系数α作为阈值,其中α为人为设定的。若某一点与其前三个点的平均值的差值大于这一阈值,我们将这个点作为第二个Onset候选点。两个Onset的ZT值较小的一个我们判定为,该时间序列的Onset时间点。
实施结果:如图10所示,准确地定义出小鼠活动和饮食的起始位置(Onset)。图10中,蓝点为原始数据,阴影部分表示黑夜;图中红点为定义的Onset点。白天部分的横线表示Onset之前三个点的均值,黑夜的横线表示活动和休息两部分的分界线。
再如图11所示,已知的4个失同步的突变小鼠,Zbtb20 -/-小鼠活动的第一个峰变小,第二个峰升高;PER2 S662G小鼠活动提前;Fbxl3 -/-小鼠活动滞后;PER1 S714G小鼠饮食滞后。表2示出了各个已知与外界环境失同步的突变小鼠活动和饮食的相位和起跳点对应的效应值。
表2
Figure PCTCN2018096091-appb-000009
综上,本实施例所提供的一种大规模实验动物各类节律性生理指标数据自动快速筛选方法,通过采用上述技术方案,可以在大规模筛选时,自动,快速,准确地找到突变小鼠活动和饮食节律相位和Onset的值,从而有效地提高实验 动物活动数据的筛选效率。
通过引用并入
本文引用的每个专利文献和科学文献的全部公开内容通过引用并入本文用于所有目的。
等效
本发明可以在不脱离其基本特征的情况下以其他具体形式实施。因此,前述实施例被认为是说明性的,而不是对本文所述的本发明的限制。本发明的范围由所附权利要求书而不是由前述说明书表示,并且意在将落入权利要求书的等同物的含义和范围内的所有改变包括在其中。

Claims (12)

  1. 一种判断受试者昼夜节律去同步化状态的方法,其中通过检测以下指标中的至少一种来判断受试者昼夜节律去同步化:
    1)活动和/或食物摄取节律的起跳点;
    2)活动和/或食物摄取节律的峰值相位。
  2. 如权利要求1所述的方法,还包括以下步骤:
    通过判断受试者昼夜节律去同步化状态,筛选与异常昼夜牵引有关遗传基因,其中所述遗传基因优选包括Slc7A11、Rhbdl1、Spop和Oxtr基因的至少一种。
  3. 如权利要求1或2所述的方法,所述受试者包括哺乳动物,优选为人类、小鼠、大鼠、猴的至少一种。
  4. 一种从大规模数据中筛选活动和/或食物摄取节律的起跳点和峰值相位的方法,包括以下实施步骤:
    1)对生物体的生理、行为的节律性数据进行数据预处理,其中所述节律性数据是通过设定时间间隔内采样采集得到;
    2)定义峰值相位,其中所述峰值相位为节律性数据最高峰对应的时间点,其中:
    2-1)对节律性的数据搜索三次局部高峰,其中昼夜节律性数据在一个周期内至少存在一个峰;
    2-2)运用高斯拟合的方法对已进行数据预处理的数据进行拟合,将所述步骤1-2)中找到的所述局部最大值及其对应的时间点,作为高斯拟合中相位的初始值,对节律性数据进行拟合,得到拟合曲线;
    2-3)选择拟合结果的第一个高峰对应的时间点作为所测定的指标的相位。
    3)定义起跳点,其中所述起跳点为各类节律性数据在一个周期内由低转变为高的开始的时间点,其中:
    3-1)确定第一个候选点:将节律性的数据分成高态区和低态区两类,在从低态区向高态区变化的过程中,设定从最近的外界环境转变点之前至少3小时开始,第一个达到高态对应的时间点为起跳点的第一个候选点;
    3-2)确定第二个候选点:在从低态区向高态区变化的过程中,最近的外界环境转变点之前至少3小时开始,当该位置上的点与前三个点的均值之差大于阈值,将该位置上的点认为是起跳点,而该位置上的点对应的时间为起跳点的第二个候选点;
    3-3)所述第一个候选点和所述第二个候选点中较前的一个点,为起跳的时间点。
  5. 如权利要求4所述的方法,其特征在于,步骤1)包括:
    1-1)去掉在静息阶段超出正常生理范围的数据;
    1-2)对外界环境发生交替变化的时刻所导致数据的突然变化下产生的干扰点去除;如果所述交替点是局部最大值或者最小值,且是由于外界环境交替变化引起的突跳点,则在拟合阶段时将该点去除;
    1-3)将与前后相邻两点数值差的绝对值均大于阈值的点(11)去除,所述阈值设定为一个周期内最大值的三分之二以上。
  6. 如权利要求5所述的方法,其特征在于,在步骤1-1)中,所述超出正常生理范围的数据是根据不同的生理指标类型而定,其中,不同的生理指标类型包括以下数据的一种以上:
    a)小鼠活动数据中白天活动量超过4000次/小时的数据;
    b)饮食数据中白天超过0.65克/小时的数据;
    c)人心率数据在夜间大于200次/分的数据。
  7. 如权利要求5所述的方法,其特征在于,在步骤1—3)中,所述阈值设定为一个周期内最大值的至少五分之四以上。
  8. 如权利要求4所述的方法,其特征在于,在步骤3-1)中,将节律性的数据分成高态区和低态区两类的方法是k-means聚类法。
  9. 如权利要求4至8任一项所述的方法,其特征在于,所述峰值相位和起跳点为大规模筛选去同步化的指标。
  10. 如权利要求4至8任一项所述的方法,其特征在于,该方法还包括:
    4)使用效应量比较筛选对象的峰值相位以及起跳点与对应基线的偏离程度。
  11. 如权利要求10所述的方法,其特征在于,步骤4)包括:
    4-1)效应量是用来度量某个因素引起的影响的大小的统计量,与统计样本的大小无关;
    4-2)具体计算方法为,筛选对象的峰值相位或起跳点的均值与峰值相位或起跳点的基线的均值之差,除以联合标准差。
  12. 用于制备或检测Slc7A11、Rhbdl1、Spop或Oxtr基因的物质在制备用于检测异常昼夜牵引疾病的产品中的应用。
PCT/CN2018/096091 2018-07-18 2018-07-18 一种筛选去同步化指标的方法 WO2020014884A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2018/096091 WO2020014884A1 (zh) 2018-07-18 2018-07-18 一种筛选去同步化指标的方法
CN201880095725.XA CN112423648B (zh) 2018-07-18 2018-07-18 一种筛选去同步化指标的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/096091 WO2020014884A1 (zh) 2018-07-18 2018-07-18 一种筛选去同步化指标的方法

Publications (1)

Publication Number Publication Date
WO2020014884A1 true WO2020014884A1 (zh) 2020-01-23

Family

ID=69164187

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/096091 WO2020014884A1 (zh) 2018-07-18 2018-07-18 一种筛选去同步化指标的方法

Country Status (2)

Country Link
CN (1) CN112423648B (zh)
WO (1) WO2020014884A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5733312A (en) * 1997-01-17 1998-03-31 Pacesetter, Inc. System and method for modulating the output of an implantable medical device in response to circadian variations
CN101843610A (zh) * 2003-03-27 2010-09-29 三得利控股株式会社 花生四烯酸在制备具有使超昼夜节律正常化作用的组合物中的用途
CN103168306A (zh) * 2010-10-27 2013-06-19 皇家飞利浦电子股份有限公司 判定对象昼夜节律特征的方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5109549B2 (ja) * 2007-09-20 2012-12-26 ソニー株式会社 生体リズムの評価機能を有する携帯型電子機器
JP4609475B2 (ja) * 2007-10-11 2011-01-12 ソニー株式会社 情報処理装置及び情報処理方法、並びに記録媒体
JP5560550B2 (ja) * 2008-10-16 2014-07-30 ソニー株式会社 生体リズム予測方法
JP5365199B2 (ja) * 2009-01-06 2013-12-11 ソニー株式会社 ライフスタイルを評価するための方法、情報処理装置及びプログラム
US20110143326A1 (en) * 2009-12-11 2011-06-16 Gurley Virginia F System for circadian rhythm monitor with synchrony and activity planning
JP5644231B2 (ja) * 2010-07-23 2014-12-24 ソニー株式会社 生体リズム推定装置、生体リズム推定方法およびプログラム
EP2433557A1 (de) * 2010-09-27 2012-03-28 BIOTRONIK SE & Co. KG Verfahren und Anordnung zur Ermittlung von phasenspezifischen Parametern einer physiologischen Größe sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
JP2011070679A (ja) * 2010-10-13 2011-04-07 Sony Corp 情報処理装置及び情報処理方法、並びに記録媒体
JP5799581B2 (ja) * 2011-05-24 2015-10-28 ソニー株式会社 生体リズムの乱れ度算出装置、生体リズムの乱れ度算出システム、生体リズムの乱れ度算出方法、プログラム、及び記録媒体
JP5846604B2 (ja) * 2012-03-23 2016-01-20 国立研究開発法人産業技術総合研究所 行動リズムモニタリング用バイオマーカー
JP5963192B2 (ja) * 2012-05-15 2016-08-03 国立研究開発法人産業技術総合研究所 概日リズムの乱れを予測するためのバイオマーカー
KR101361577B1 (ko) * 2012-09-03 2014-02-11 서울대학교산학협력단 생체시계 교란을 판단하는 방법
WO2015054819A1 (en) * 2013-10-14 2015-04-23 Nanjing University Method for identifying advanced feeding rhythm syndrome and application thereof
KR101628062B1 (ko) * 2014-02-26 2016-06-08 고려대학교 산학협력단 It 기반 일주기 생체리듬 관리 시스템 및 그 방법
CN103954368B (zh) * 2014-05-21 2016-08-24 北京遥测技术研究所 一种基于光电探测阵列的窄带光解调系统及其解调方法
CN104796116B (zh) * 2014-08-06 2017-08-01 中国航空工业集团公司北京长城计量测试技术研究所 一种基于参数拟合的冲击波形峰值测量方法
CN104268873B (zh) * 2014-09-25 2017-04-12 南京信息工程大学 基于核磁共振图像的乳腺肿瘤分割方法
WO2016198985A1 (en) * 2015-06-11 2016-12-15 Koninklijke Philips N.V. System and method for estimating circadian phase

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5733312A (en) * 1997-01-17 1998-03-31 Pacesetter, Inc. System and method for modulating the output of an implantable medical device in response to circadian variations
CN101843610A (zh) * 2003-03-27 2010-09-29 三得利控股株式会社 花生四烯酸在制备具有使超昼夜节律正常化作用的组合物中的用途
CN103168306A (zh) * 2010-10-27 2013-06-19 皇家飞利浦电子股份有限公司 判定对象昼夜节律特征的方法

Also Published As

Publication number Publication date
CN112423648A (zh) 2021-02-26
CN112423648B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
Chan et al. Noninvasive technique for measurement of heartbeat regularity in zebrafish (Danio rerio) embryos
Stuber et al. Sources of intraspecific variation in sleep behaviour of wild great tits
WO2020103683A1 (zh) 基于脑功能图谱的猴-人跨物种迁移进行精神疾病的个体化预测方法和系统
Younes et al. Reliability of the American Academy of Sleep Medicine rules for assessing sleep depth in clinical practice
KR20110094064A (ko) 수면 및 각성 패턴의 확인 방법 및 용도
CN115862873B (zh) 一种睡眠节律量化及干预的方法、系统和装置
JP6709154B2 (ja) 人間の現在の概日リズムを計算するための装置、方法、システム、および当該方法を実行するためにコンピュータプログラム
Hughes et al. Constant light enhances synchrony among circadian clock cells and promotes behavioral rhythms in VPAC2-signaling deficient mice
Hida et al. Pathophysiology and pathogenesis of circadian rhythm sleep disorders
Gates et al. High-throughput mouse phenotyping
CN106456015B (zh) 用于评估急性发作和/或住院治疗的风险的装置、系统、方法和计算机程序
CN112257608A (zh) 一种牦牛养殖健康状态监测方法
WO2020014884A1 (zh) 一种筛选去同步化指标的方法
Banks et al. Assessment of circadian and light‐entrainable parameters in mice using wheel‐running activity
Lewis et al. Male prairie voles display cardiovascular dipping associated with an ultradian activity cycle
CN114943629A (zh) 一种健康管理保健服务系统及其健康管理方法
Joshi et al. Noninvasive sleep monitoring in large-scale screening of knock-out mice reveals novel sleep-related genes
CN113764105A (zh) 一种中老年心血管数据预测方法
US20090232739A1 (en) Method of in Vivo Screening for cardiac Toxic Agents Using Teleost
Li et al. Transcriptomic similarity informs neuromorphic deviations in depression biotypes
Fasolt et al. Contribution of shape and surface reflectance information to kinship detection in 3D face images
Cameron et al. Cellular patterns in the inner retina of adult zebrafish: quantitative analyses and a computational model of their formation
US20100056391A1 (en) Integrated screening assays and methods of use
Wilson-Nagrani Matching genotype to phenotype in a detailed assessment of lip morphology
Joshi Identification of Novel Sleep Related Genes from Large Scale Phenotyping Experiments in Mice

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18926875

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18926875

Country of ref document: EP

Kind code of ref document: A1