CN101068498A - 链接来自多模态数据集的图案的方法 - Google Patents
链接来自多模态数据集的图案的方法 Download PDFInfo
- Publication number
- CN101068498A CN101068498A CN 200580041489 CN200580041489A CN101068498A CN 101068498 A CN101068498 A CN 101068498A CN 200580041489 CN200580041489 CN 200580041489 CN 200580041489 A CN200580041489 A CN 200580041489A CN 101068498 A CN101068498 A CN 101068498A
- Authority
- CN
- China
- Prior art keywords
- pls
- pet
- mri
- data
- under inspection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
一种从相似对象获取影像和非影像数据集的方法。使用偏最小二乘(PLS)技术寻找影像和非影像数据集之间的链接。然后将链接简化成单个数值评定的表达式。然后单个数值评定用作对象之间的差异和相似性的目标、量化评定。每个数据集的数据可以是性能方面、身体特性或外观测量。
Description
相关申请的交叉引用
本申请要求由Chen等人于2004年10月4日提交的、名称为“神经影像方法和系统”的美国临时申请序列号60/615,767,以及2005年10月3日提交的、名称为“链接来自多模态数据集的图案的方法”的美国专利申请序列号(还未收到)的优先权权益,二者在此引用作为参考。
技术领域
本发明涉及影像,更特别地涉及链接多模态影像和非影像数据集、用于评价对从其获得数据集中数据的对象的效果的一般计算数学方法,最特别地涉及链接多模态神经影像和非影像数据集、用于表征患者组差异和用于评价对从其获得数据集中数据的人类受检者的神经系统、精神及相关疾病的治疗效果的生物数学方法。
背景技术
神经影像研究者常常获取多模态图像数据和各种非影像测量。例如,在我们的NIH资助纵向APOE-ε4研究中每两年从每个健康受检者获取FDG-PET和结构(例如容量)MRI脑图像以及一组完整的神经心理测验。在使用2-(1-[6-[(2-[18F]氟代乙基)(甲基)氨基]-2-萘基]乙缩醛)丙二腈(FDDNP)的影像神经原纤维缠结和乙型淀粉状蛋白斑的他们的研究(Shoghi-Jadid,K.等人2002)中,来自UCLA的研究者获取三重影像数据集,FDG-PET,FDDNP-PET以及T1加权容量MRI。类似地,匹兹堡大学的研究者在他们的AD中影像脑淀粉状蛋白的研究(Klunk,W.E.等人2004)中使用双重PET示踪剂,FDG和PIB。多模态影像数据集的可用性为研究者提供同时检查多个处理的机会,然而也提出将多个数据集最佳地集成并用于理解底线生物系统的方法难题。
已经存在利用来自一个图像模态的数据分析另一个的方法。人们已经长期地利用使用由结构图像提供的解剖标测来定位功能发现的图像融合技术(例如,参看(Reiman,E.M.等人2004))。类似地,在解剖图像上定义的研究区(ROI)可以用来从功能数据集中提取数据以研究试验条件控制的脑反应。利用高分辨率,容量MRI也常规地用来校正部分体积平均和与功能图像相关的萎缩的联合效果(Pietrini,P.等人1998)。在FDG-PET研究中,该校正允许研究者确定观察到的脑功能交替的底线原因完全是葡萄糖代谢途径还是主要是结构联系(Reiman,Chen,Alexander,Caselli,Bandy,Osborne,Saunders和Hardy 2004)。除了这里列出和在大部分结构功能研究中使用的这些程序之外,经常使用常规相关分析将来自一个影像模态的发现与来自另一个影像模态或来自非影像测量的发现相关(Shoghi-Jadid,Small,Agdeppa,Kepe,Ercoli,Siddarth,Read,Satyamurthy,Petric,Huang和Barrio 2002)。总的来说,这里列出的方法相对直接,并且主要在使用另一个支持且次要的分析来自一个单模态的数据的环境中。相反地,在当前研究中我们提出的方法,实际上多模态、网络间和多变量,是建立链接多个数据集并组合来自每个数据集的信息的最佳方法,用于增强研究者检测与试验条件相关的交替或与疾病研究相关的发作、进展或治疗的能力。
如上所述,我们的方法实际上是多变量的。多变量分析已经在单模态研究中长期使用,补充单变量分析。这些基于模型或数据驱动的单模态、网络内和多变量分析表征脑区域间的协方差/相关。这些基于体素或ROI的方法包括主分量分析(PCA)(Friston,K.J1994),基于PCA的成比例子概要文件模型(SSM)(Alexander,GE和Moeller,JR 1994),独立分量分析(Mckeown,M.J.等人1998;Duann,J.R.等人2002)(Mckeown,Makeig,Brown,Jung,Kindermann,Bell和Sejnowski 1998;Arfanakis,K.等人2000;Moritz,C.H.等人2000;Calhoun,V.D.等人2001;Chen,H.等人2002;Esposito,F.等人2003;Calhoun,V.D.等人2003;Schmithorst,V.J.和Holland,S.K.2004;Beckmann,C.F.和Smith,S.M.2004)以及偏最小二乘(PLS)法(McIntosh等人1996;Worsley,K.J.等人1997)。也包括多重相关分析(Horwitz,B 1991;Horwitz,B.等人1999),结构方程模型(McIntosh,A.R.和Gonzalez-Lima,F 1994;Horwitz,Tagamets和McIntosh1999),路径分析(Horwitz,B.等人1995;Worsley,K.J.等人1997)以及动态因果模型(Friston,K.J.等人2003)。这些方法典型地用来表征脑功能的区域网络(和新近的脑灰质密度(Alexander,G等人2001))以及测试它们与行为测量的关系。但是,这些多变量方法中没有一种用来识别多个影像数据集之间的区域协方差的图案。
在多个神经影像数据集的可用性的推动下以及在单模态网络分析特别是PLS工作的成功的激励下,我们开始探索允许我们寻找多个数据集之间的最大链接或为了增加的统计力最佳地组合它们的工具。我们相信双分块PLS(DBPLS)和多分块PLS(MBPLS)是我们愿意为此而探索的第一组工具。我们将列出使用PLS执行模态间分析时的挑战和困难以及随后我们非常特有的进一步方法研究的计划。但是,首先,需要回顾一般PLS方法,DBPLS在神经影像领域中的成功(主要由McIntosh和他的同事)以及MBPLS主要在化学统计学和生物信息学领域中的成功。
PLS方法的回顾
从在会科学研究方法百科全书引述,PLS回归是一种概括并组合来自PCA和多元回归的特征的相对新近的技术。当需要从一大组自变量中预测一组因变量时,它特别有用(Abdi,H.2003)。
PLS回归的常规使用是从c(c≥1)个独立数据集X1,…,Xc中预测(不是链接)相关数据集Y,因PLS回归的术语。注意在该文章中,每个数据集中的变量在数据矩阵中列向排列。除了PLS回归之外,我们也关注它对于描述多个数据集之间的链接而不标记相关或独立的使用。因为随后将描述PLS链接方法研究的细节,我们这里提供PLS回归方法的回顾。在某种意义上,当Y是矢量(单变量数据集)而X是满秩(假设c=1)时不需要PLS,因为可以使用普通多元回归完成Y-X关系。对于我们的神经影像研究,特别是我们的网络间分析,体素/变量的数目大于一,并且事实上比受检者/扫描数目大得多,多重共线性对于每个数据集而存在。已经研究出几种方法来处理当Y是矢量时的这种问题(这不是我们的神经影像研究中的情况)。已经提出称作主分量回归的方法来执行X矩阵的主分量分析(PCA)然后使用X的主分量作为Y上的回归量。虽然主分量的正交性消除了多重共线性问题,没有什么保证说明X的主分量对于Y相关(Abdi 2003)。相反地,PLS回归寻找来自X并且对于Y也相关的分量。特别地,PLS回归寻找执行X和Y的同时分解的一组分量,具有这些分量尽可能多地说明的X和Y之间协方差的约束(Abdi 2003)。寻找第一PLS回归量的程序相当于使得Y中变量的线性组合与X中变量的线性组合之间的协方差达到最大(成对的线性组合称作第一潜在变量对)。对于该第一潜在变量对,该最大协方差对于Y和X是对称的。这里对称称作数据集指定为相关的事实的不相关。但是,对于随后的潜在对,对称性丢失,如下面说明的。
DBPLS算法:如上所述,DBPLS通过构造一系列潜在变量对来揭示两个数据集之间的顺序最大协方差。从原始数据矩阵X和Y(具有必要的标准化)开始,第一潜在变量对如下构造。X的潜在变量是t=∑wixi,其中wi是标量且xi是X的第i列(i=1,2,…)。以矩阵形式,t=Xw,其中w=(w1,w2,…)T且‖w‖=1。类似地,Y潜在变量可以表示为u=Yc(‖c‖=1)。在双重影像数据集的环境中并且为了方便,我们将w和c分别称作X和Y的奇异图像。两个潜在变量t和u的协方差因此是cov(t,u)=w′X′Yc(假设两个数据集中变量的零平均值)。可以证明相对于w和c的最大协方差值是矩阵Ω=[X′YY′X]的最大特征值的平方根,且w是Ω的相应特征向量,c是Y′XX′Y的相应特征向量。在第二潜在变量对之前,需要从X和Y中回归出第一潜在变量对的作用,在化学统计学PLS文献中称作紧缩:
表示且
并且计算新的X1和Y1为X1=X-tp1′,Y1=Y-tr1′
然后,对于新的X1和Y1矩阵对重复相同的计算程序以构造第二潜在变量对。第三和剩余潜在变量对(直到X的秩)将类似地计算。
MBPLS算法:MBPLS的计算基于上述DBPLS程序,其中某种紧缩方案注意多于一个独立分块的存在。Westerhuis等人描述下面的数值方法(Westerhuis,J.A.和Smilde,A.K.2001):
1,计算X=[X1,…,Xc]与Y之间的DBPLS模型的第一潜在变量对。获得分数t和u,权重w以及荷重p和q。从这些中,获得多分块PLS分块权重wb,超级权重ws和分块分数tb。
2,wb=w(b)/‖w(b)‖2
3,tb=Xbwb
4,ws(b)=tb Tu/uTu
5,ws=ws/‖ws‖2
分块分数紧缩
6a,pb=Xb Ttb/tb Ttb
7a,Eb=Xb-tbpb
8a,F=Y-tq
超级分数紧缩
6b,Eb=Xb-tp(b)T
7b,F=Y-tq
对于另外的分量,设置X=[E1,…,Ec]和Y=F并返回到步骤1。
可以使用在MBPLS计算中起决定性作用的不同紧缩步骤。由Gerlach和Kowalski(Gerlach,R.W.和Kowalski,B.R.1979)建议的分块分数紧缩导致较差预测。Westerhuis等人显示当所有变量保持在大的X分块中并且建立DBPLS模型时,超级分数紧缩给出相同的结果。超级分数概括包含在所有分块中的信息,而分块分数概括特定分块的信息。但是,超级分数紧缩方法混合分离分块之间的变化,因此导致解释问题。为了克服分块的混合,提出使用超级分数仅紧缩Y(Westerhuis和Smilde 2001)。这产生与使用X的超级分数紧缩相同的预测,但是因为没有紧缩X,分块中的信息不混合。
模态内神经影像研究中DBPLS的回顾
McIntosh和他的同事在1996年将DBPLS首次引入到神经影像领域中(McIntosh,Bookstein,Haxby和Grady 1996),用于与行为或试验条件相关的模态内空间图案分析。作为该研究的结果,Worsley考虑他称作正交标准化PLS(Worsley,Poline,Friston和Evans 1997)的备选PLS程序,以说明对任意线性变换固定不变的问题。从那时起,DBPLS工作已经主要由McIntosh和他的团队扩展、改进和广泛地引入到各种脑研究。他们的努力还包括方法研究例如从PET到功能MRI研究的扩展,从原始PLS到种子PLS(McIntosh,A.R.等人1999)或时空PLS(Lobaugh,N.J.等人2001;Lin,F.H.等人2003)的扩展以及脑功能/疾病研究中的许多应用(McIntosh,A.R.1998;McIntosh,A.R.1999;Rajah,M.N.等人1999;O′Donnell,B.F.等人1999;Anderson,N.D.等人2000;Iidaka,T.等人2000;Lobaugh,West和McIntosh 2001;Nestor,P.G.等人2002;Keightley,M.L.等人2003;Habib,R.等人2003)。McIntosh团队的另一个重要贡献是模态间PLS神经影像研究的非参数推理程序、排列或自举的引入(例如,参看最初的介绍论文(McIntosh,Bookstein,Haxby和Grady 1996))。
模态间神经影像研究中DBPLS的回顾
在2003年澳大利亚悉尼的医学物理学和生物医学工程的世界代表大会上提出(Chen,K等人2003),我们的团队报告克服与两个影像数据集之间的协方差矩阵的尺寸(一个图像数据集中的体素数目×另一个中的体素数目)相关的巨大计算障碍、将FDG-PET链接到MRI分段灰质的网络间初步结果。我们的目标是寻找双模态影像数据集之间的直接链接或回归(MBPLS回归或MBPLS链接分析)。
一年后,来自McIntosh团队的研究者在2004年3月17-18日的第13届罗特曼研究所年会上报告用于分析多模态影像数据的备选方法(Chau,W等人2004)。他们在尝试回答相同的问题时使用与他们的模态内PLS研究中相同的操作程序:试验条件或行为相关的神经影像共变图案。换句话说,神经影像数据集的角色在上面的PLS回归表示法中仅是且总是X的分块,并且试验条件或行为数据作为相关的Y分块(Chau,Habib和McIntosh 2004)。因为多模态数据集之间的直接链接不是他们研究的目的,不存在在计算上处理协方差矩阵尺寸的问题的需求。而且,因为X分块的数目多于一,需要关于紧缩方案的研究,但是在他们的研究中没有考虑到。
化学统计学和生物信息学中DBPLS和MBPLS的回顾
虽然神经影像领域中DBPLS的成功实在是令人佩服,但是仍然使该领域中MBPLS的应用更成熟,证明它的成功,并且研究新的算法。但是,DBPLS和MBPLS的许多成功应用已经在食品或药理学行业的发酵和粒化领域中报告。化学统计学领域中PLS的重要性由化学统计学杂志中的在线社论证明(Hskuldsson,A 2004)。这里提供这些领域中不完全的MBPLS回顾,以及与我们针对的神经影像应用相关的一些讨论。
Esbensen等人使用PLS回归分析电子舌(30个非专用电势测定化学传感器的阵列)的数据,用于定性和定量监控开始轻乳酪生产培养的批量发酵过程(Esbensen,K.等人2004)。他们证明PLS产生的控制图允许在早至完全进展的发酵的30-50%,鉴别来自“异常”操作条件下运行的发酵批量和“正常”操作条件下运行的发酵批量的样本(Esbensen,Kirsanov,Legin,Rudnitskaya,Mortensen,Pedersen,Vognsen,Makarychev-Mikhailov和Vlasov 2004)。与我们的提议相关,该研究是基于多个历史数据集的MBPLS预测力,医生梦想复制疾病的早期诊断的能力的清晰证明。
在另一个研究(Lopes,J.A.等人2002)中,工业制药过程的性能(通过发酵产生活性制药成分)由MBPLS模拟。使用多分块方法,作者能够计算每个独立分块(定义为不同处理阶段的受控或质量变量)的权重和分数。他们发现接种体质量变量对于额定发酵的最终活性产物成分(API)生产具有大的影响。对于非额定发酵,在发酵阶段操作的受控变量说明获得的API量。如该研究中说明的,可以确定各个数据块对最终输出的贡献。他们研究的神经影像类似物是使用PLS评价在精确预测AD的发作时或在评价治疗效果时各种数据集(MRI,FDG-PET,神经心理测验)的相对贡献。
Hwang和同事在他们最近发表物的一篇中讨论了MBPLS到组织工程学领域的应用(Hwang,D.等人2004)。他们使用MBPLS模型将环境因素和变迁与胞内脂类和尿素合成级别相关联。MBPLS模型使得他们能够识别(1)最有影响的环境因素以及(2)代谢途径如何由这些因素改变。而且,作者翻转MBPLS模型以确定对于实际情况获得用于实现最佳级别细胞功能的最经济解决方案所需的环境因素的密度和类型。多个数据集(或者他们称作多组)包括环境因素组和C组,他们每个包括具有类似代谢行为的许多代谢和变迁。像Lopes等人的研究一样,该研究说明MBPLS评定每个独立数据集在预测所关注的行为时的相对重要性的能力。而且,该研究展示MBPLS用来确定产生最佳级别相关变量的变量组合的使用。
注意,上面回顾的MBPLS应用都在多个独立(预测值)分块和单个相关分块的框架内,全部由最多N个变量组成,其中N比神经影像数据集中体素/变量的数目小一万倍。
相对于神经影像,具有多重影像模态的区域协方差的多变量分析的主要难题是通过包括相对高分辨率神经影像数据集而产生的数据矩阵的非常高的维数。需要的是使用可行的多变量方法计算高维数据集的策略。
发明内容
公开寻找影像与非影像数据集之间的链接的数学方法。使用该链接以寻找数据集之间的关系,组合、概括来自多个数据集的信息,以及为了在评价人造和生物对象的状态时增加的统计力而构造新的数值替代标记,例如在与疾病(例如Alzheimer病)的战斗中评价人类和可能的早期治疗和预防策略。
实现公开从多个对象的每个获取多个数据集的请求。在这些数据集之间存在链接,其中每个数据集可能是不同的模态(例如影像和非影像数据集)。可以使用偏最小二乘(PLS)技术,包括具有常规标准或如这里公开建立的标准的双分块(DB)PLS或多分块(MB)PLS,寻找数据集之间的链接。而且,我们也公开寻找链接的其他分析技术。然后将链接简化成单个数值评定的表达式。作为选择,可以将链接简化成对于评定模态的每个可以由几个数字表征的唯一解。
然后,单个数值评定用作对象之间差异和相似性的目标量化评定。如所述,多个数据集中的数据可以由影像模态或非影像模态获取。每个数据集中的数据可以是指数,例如性能方面、身体特性、外观测量、或者对象内部状态的数值表示,例如来自各种人脑区域的葡萄糖摄入率/灰质密度。
附图说明
可以通过参考下面结合附随附图进行的详细描述更完整地理解实现,其中:
图1显示在使用我们新定义的标准的5分块PLS分析中10个可能对的每个之间的紧密关系性,该标准不需要相关或独立数据块的标记;
图2A说明在初步PLS验证研究中使用偏最小二乘(PLS)鉴别15个年轻受检者中的14个,其中x轴是PET-PLS受检者分数,y轴是MRI-PLS受检者分数;
图2B显示对于相同的初步PLS验证研究,PET在左屏且MRI在右屏的第一奇异图像;
图3说明PLS方法的可能使用,其中关注研究母亲的健康与女儿的认知技能之间的争论关系,其中X矩阵X列出母亲的身体特性测量,而Y矩阵列出女儿的认知技能测量;
图4说明对于J个人类受检者的双重FDG-PET和MRI数据形成矩阵X和Y的程序,其中X/Y的每行是重新排列成行向量的一个受检者的MRI/PET数据;
图5显示通过首先应用数据维数减少技术(PCA)继之以PLS程序而产生的奇异图像(MRI在右屏且PET在左屏),其中可以注意在使用乘幂算法的PLS与当前PLS之间存在显著相似性;
图6描绘在一次排除一个受检者,然后使用来自剩余受检者的信息预测该受检者的隶属关系的折叠程序中,PLS衍生的受检者分数作为鉴别器的使用;
图7显示由具有高计算成本的精确SVD计算程序以及由首先使用维数减少技术(不精确)的提出方法计算的紧密结果SVD关系,其中不精确的SVD结果显示在Y轴上,而精确的SVD显示在X轴上;
图8A显示在初步人脑研究中的分别MRI和PET单变量SPM发现(T图),其中经由SPM体素单变量分析(分别PET和MRI)获得结果,虽然具有增加的能力,PLS结果与这些SPM发现是一致的;
图8B显示在初步人脑研究中的SPM双变量发现(F图),其中经由SPM体素多变量(在该用例中,每个体素具有两个变量)获得结果,虽然具有增加的能力,PLS结果与这些SPM发现是一致的;
图9A显示对于初步人脑研究与整体MRI PLS潜在变量的体素乘体素PET相关,其中潜在变量代表整体MRI数据,因此,在该图9A中显示的PET图案反映PET体素乘体素方差与由MRI的脑结构测量全局相关;
图9B显示对于初步人脑研究与整体PET PLS潜在变量的体素乘体素MRI相关,其中潜在变量代表整体PET数据,因此,在该图9B中显示的MRI图案反映MRI体素乘体素方差与由PET的脑功能测量全局相关;
图10显示由非不可知的偏最小二乘处理获得的PLS奇异图像,其中这是对于初步PET和MRI人脑研究,其中奇异图像的相似性在与如图2B中所示的不可知方法的结果比较时是显然的;
图11-14显示提出方法的潜在应用的各个实例处理。
具体实施方式
研究和实现首先寻找双模态之间的链接的数学方法,然后将其扩展到多模态神经影像和非影像数据集之间。该方法允许研究者寻找数据集之间的关系,组合、概括来自多个数据集的信息,以及为了在与疾病(例如Alzheimer病)的战斗中评价可能的早期治疗和预防策略时增加的统计力而构造神经影像的新的数值替代标记。
使用偏最小二乘(PLS)技术的多模态网络间分析的概念。我们的团队首先建议研究多个影像数据集之间的直接链接,并且使用PLS为了增加统计力而组合来自多个数据集的信息。
使用在个人桌上型/膝上型计算机上可行的巨大尺寸的协方差矩阵计算PLS的数值策略。我们提出将没有计算机可以将它简单地存放在内存中的巨大矩阵划分成小块的方法。因此,计算网络间PLS变得在现代桌上型/膝上型计算机上可行。参看C.1对于基于体素的神经影像数据的DBPLS的实现。
为了研究Alzheimer病(AD),AD的风险,评价AD的早期治疗或预防,寻找多模态神经影像数据集之间共变图案的算法的特殊应用。我们提议观察跨越多模态的共变图案变化,并且使用潜在变量对作为多变量指数(索引)用于经由Monte-Carlo仿真计算统计力,并且相信指数具有提高的灵敏度而不需要校正多次比较。参看C.2.统计重要性的评定,D.1和D.3
作为诊断工具寻找影像与非影像数据集之间共变图案的算法的概念和应用。我们提议将我们最初的PLS AD应用推广到其他疾病诊断例如使用乳房X光摄影术和胸部MRI的乳癌诊断,以及推广到其他研究领域例如神经影像数据与一般信息之间的链接的探索。参看A的III.3,具体目标,D.1.5
多分块PLS作为寻找所有分块之间的共变图案而不指定一个分块为相关分块而其他分块为独立分块的程序的重新定义。常规PLS在基于一个或多个独立分块的观察预测单个相关分块的框架中。我们提出寻找相关多分块之间的关系的问题。使用该重新定义,我们引入各种备选目标函数和算法来寻找新定义的多分块PLS的解。参看D.4.1
对于它的解的存在性和唯一性关于多分块PLS重新定义的数学和理论讨论的理论发现。我们将讨论对于新引入的目标函数存在一种且仅一种解的条件。参看附录。
特别是在AD的研究中研究多模态神经影像数据集之间的网络间关系的新定义多分块PLS方法的应用。
系统间独立分量分析(ICA间)和系统间结构方程模型(SEM间)的概念介绍。ICA已经在对于单个数据集(一个系统)构造一组统计独立分量中广泛使用。我们提出系统间ICA的概念并且提出算法以让其实现。类似的评注可以对于系统间SEM而进行。参看D.4.3
A.具体目标
总体目标是在系统网络间方法中分析多模态神经影像和非影像数据集的多变量分析算法。使用该分析工具,我们目的在于a)研究影像/非影像数据集之间的链接,b)研究每个数据集总体上对脑功能、脑疾病发作、一般临床结果或治疗评价的可预测性的贡献的相关重要性,以及c)将研究的算法应用到各种神经影像研究,特别地包括我们的与阿朴脂蛋白ε4(APOE-ε4)等位基因相关联的Alzheimer病的遗传风险的纵向研究。
对于我们的模态间方法努力,将研究两种形式的偏最小二乘(PLS)技术,双分块PLS(DBPLS)和多分块PLS(MBPLS)。值得注意的是,DBPLS在模态内/单模态神经影像研究中具有成功的应用(McIntosh,A.R.等人1996)。
具体目标可以分类为方法研究,一般生物医学应用以及到AD神经影像研究的具体应用:
I:回答方法研究难题
I.1,研究/实现模态间和基于体素或基于研究区的DBPLS/MBPLS算法。将计划克服与非常大尺寸的双重影像数据集协方差矩阵相关联的困难的策略。
I.2,评定PLS揭示的模态间网络的统计力和I型错误。有效的非参数程序和Monte-Carlo仿真将为此目的而提出。
I.3,基于新提出的MBPLS目标函数最大化数据集之间的链接强度。除了MBPLS仅寻找相关数据集与该组独立数据集之间的最大链接的事实之外,我们提议研究所有可能数据集对的每个的协方差(或链接强度的其他指数)的同时最大化。
II:回答一般生物医学神经影像/非影像研究中的数据分析难题
II.1,提供研究多个数据集之间的网络间关系的工具。使用该工具,例如,可以检查由F-18氟代-2-脱氧葡萄糖(FDG)和正电子发射断层显像(PET)测量的各种脑区域上的葡萄糖摄入图案如何与由磁共振成像(MRI)测量的分段灰质容量的空间分布相关。另一个实例,可以使用该工具研究脑葡萄糖摄入的全局图案链接(由FDG-PET)、淀粉状蛋白斑的分布(由N-甲基-[C-11]2-(4′-甲基氨基苯基)-6-羟基苯并噻唑(PIB)-PET)以及灰质空间图案(由MRI)。
II.2,为了治疗评价、风险评定或临床诊断的增加统计力,使得组合并集成来自多个系统/数据集的信息的方法可用。
II.3,提供评定每个数据集在预测临床成果和评价治疗时的相对重要性的程序。
II.4,发起我们的努力以研究除了PLS之外网络间关系的其他数学算法。在备选多个数据集分析工具中存在网络间独立分量分析(ICA)和网络间结构方程模型(SEM)。
III:回答特别地在AD和AD风险的神经影像研究中以及在其他医学研究领域中的数据分析难题
III.1,研究使用剖面和纵向FDG-PET和MRI数据(可能地与神经心理学数据一起)评定对于载有APOE-ε4等位基因的0,1或2个复本的健康个体,临床AD的症状发作风险的预测方案(PLS应用于在NIMH MH057899-06的支持下获取的数据)。
III.2,使用剖面和纵向FDG-PET和MRI数据(可能地与神经心理学数据一起)构造临床诊断方案,以计算MCI患者转化到AD的可能性和平均持续时间。
III.3,探索将PLS应用到需要组合或评价多模态[非]影像数据集的其他医学研究和临床领域的可能性。一个实例是乳房X光摄影术和胸部MRI。
方法难题
考虑到我们的具体目标,我们的焦点将是提出、实现和评价克服这里列出的难题的策略。
I.说明网络间分析在神经影像研究中的需求和能力。细节请参看重要性部分和初步结果部分。
II.使得网络间神经影像PLS分析的计算可行。
为了说明例如使用双重影像数据集DBPLS的计算难题,让我们考虑在典型统计参数绘图(SPM)PET分析中使用的2mm立方体素的图像尺寸。注意,统计参数绘图指例如通过利用也称作SPM的软件(http://www.fil.ion.ucl.ac.uk/spm/)构造和评定用来测试关于功能影像数据的假设的空间扩展统计过程。SMP软件可以用于脑影像数据序列的分析。该序列可以是来自不同群组的一系列图像,或者来自相同受检者的时间序列。SPM软件可以用于fMRI,PET,SPECT,EEG和MEG的分析。
脑体素的数目可以是246,082(几乎二十五万)。如果该数目对于双网络PLS分析中的两个数据集,那么协方差矩阵将是246,082乘以246,082。相同的计算困难对于该研究中新引入的目标函数存在(关于其的更多内容在下面)。实现可行性不仅对于网络间PLS自身是重要的,而且对于它的I型错误和统计力计算(下面)更重要。
III.在回答神经影像研究领域中的难题时进一步研究PLS程序
I型错误和统计力评定:为了评定与两个数据集之间或多个数据集之间揭示的共变图案和相关有关的各个方面的统计重要性(I型错误),将采用非参数方法例如折叠,自举和排列(使用试验设计允许的)再取样技术以及Monte-Carlo仿真,除了我们自己提出的Monte-Carlo仿真之外,其已经在DBPLS模态内神经影像研究中说明了它们的有用性(McIntosh,Bookstein,Haxby和Grady1996)。而且,为了提出单个PLS指数或一组PLS指数作为设计新研究例如治疗评价时的替代标记,我们需要计算统计力。
新的MBPLS链接强度指数建立:对于没有意义的相关/独立标记可以指定给每个数据集的MBPLS情况,我们打算在寻找这些多个数据集之间的最大链接强度时制定新的目标函数。这在除了寻找相关数据集与该组独立数据集之间的最大链接的MBPLS算法之外。我们将研究使所有协方差(或链接强度的其他指数)同时最大化的可行性,一个协方差对于所有数据集之间的每个可能数据集对。在数学方面,将讨论该新的目标函数的全局最大值的存在性和唯一性。
另外的备用网络间分析工具研究:除了PLS之外,将探索用于分析多模态神经影像/非影像数据集的其他方法。更多内容参看试验设计&方法部分。
重要性:
生物数学方法研究:据我们所知,我们提出的多模态网络间分析方法是第一种这种方法。我们尝试回应同时地且系统地分析非常规尺寸的多个数据集的请求。除了它与生物医学特别是神经影像研究的相关性之外,在该努力中出现的数学问题在数学上是具有挑战性的。它们将必然发起和激励必要的理论讨论,这又将提供对于提出的方法的应用和进一步研究的领会。虽然我们当前提议的主要焦点不是面向数学定理的,我们在为MBPLS引入各种备用目标函数,提出相关优化策略,以及定义计算I型错误和统计力时的小概率事件方面是严格的。此外,我们逻辑构造的Monte-Carlo仿真对于面向数学定理的讨论的进一步推行是鼓励的。在该研究中,我们将不仅尝试定义这些生物医学相关的难题,而且积极地发起与理论上面向的数学家/统计学家的沟通以增进研究。
神经影像多重生物过程分析程序:我们相信我们的网络间多模态PLS不是模态内PLS方法的简单扩展。相反地,它在几个方面是新的。首先,网络间PLS寻找不同模态的图像之间的直接链接。链接强度和奇异图像提供对于由单变量或多变量分析单独每个图像数据集给出的信息补充的信息。使用该直接链接方法,可以研究并交叉引用不同的多个生理/代谢过程和解剖学结构信息。而且,可以根据或不根据试验条件或行为测量执行该多个过程研究(也就是,全部在静止条件下)。其次,与在奇异图像上设置为替代标记的一些预先指定节点结合的提出的全局指数(或一组全局指数)是创新的,连同统计力和I型错误计算的Monte-Carlo仿真一起(参看研究计划)。最后,研究计算策略以使得提出的多模态网络间分析程序可行。
Alzheimer病研究的网络间多模态分析工具:使用该网络间分析工具,可以研究例如脑结构与脑功能之间的关系,帮助我们在我们的NIH资助的正在进行的纵向神经影像研究中评价与APOE-ε4等位基因的0,1或2个复本相关联的有差别的AD遗传风险。类似地,该工具也可以非常有助于在其他NIH资助的Alzheimer病神经影像启动计划(ADNI)研究中理解AD疾病的进展,从轻度认知功能障碍(MC)到AD的转变(更多内容参看D.1数据部分)。
到其他生物医学研究/临床领域的潜在应用:我们相信PLS不仅是影像数据集的工具,而且是其他例如来自基因组或生物信息学的数据集的工具。例如,可以使用MBPLS表征和探索脑结构、脑功能与基因组构造之间的链接。将努力使得算法的实现一般化并适用于不仅来自神经影像研究而且来自多领域的数据。
最后,值得注意的是我们需要考虑备用MBPLS目标函数,为了研究它们之间的链接而不指定一个数据集为相关数据集而其他为预测值。为了关于FDG-PET和容量MRI研究PIB-FDG图案,例如,可以确定地将PIB-FDG数据集看作相关数据块。但是,具有相同标记的这三个数据集之间的关系可以提供公平的数据视图。
C.初步研究
C.1基于体素的神经影像数据的DBPLS的实现
C.1.1计算PLS的迭代方法:乘幂算法
使用较早引入的表示法,正方形矩阵Ω的尺寸是脑量内体素的数目(假设对于两个影像数据集,体素的数目相同)是显然的。
为了使计算可能,我们将巨大矩阵的每个(X,Y,Ω和其他中间矩阵)划分成当需要时一次仅读入一个到计算机内存的一系列小矩阵。为了使该策略起作用,仅允许的矩阵操作是可以在子矩阵上独立执行并且产生子矩阵形式的那些。这种操作的一个实例是X′与Y的乘法。为了将上面概述的策略用于与DBPLS相关的奇异值分解(SVD)计算,我们采用实际上迭代的所谓乘幂算法(Golub,GH和Van Loan,CF 1989)。在每次迭代中涉及的操作仅是矩阵×矢量,矢量×矩阵,以及矩阵×标量,它们在子矩阵上都是独立的。
与MATLAB例程svds.m相比较,使用乘幂算法的SVD计算的MATLAB代码在附录中给出。注意,实例乘幂算法代码和svds.m都需要整个矩阵在内存中。在我们的PLS分析中实现乘幂算法时,所有矩阵乘矢量,矢量乘标量的乘法都通过一次读入一个子矩阵而完成。
C.1.2经由矩阵尺寸减小的有效DBPLS实现
假设数据矩阵X是n乘以PX(Xn×PX),其中n<<PX且rank(X)≤n。不损失一般性,我们假设rank(X)=n。X的行空间具有标准正交基,
每个作为行向量,满足:
这个基例如可以是经由矩阵X上的主分量分析的一个。注意,存在无穷多个这种基。X可以表示为X=XIe,其中XI是满秩n×n矩阵。
类似地,Y=YIf,其中
是由Y的行跨越的空间的标准正交基。因此,
另一方面,SVD给出XTY=USVT,
其中U,V,UI和VI通常是单位矩阵。因此,我们具有
由该推导启发的,我们实现XI,YI以及XI TYI的svd的计算(也就是,UI,SI和VI的计算)。然后,我们使用矩阵e或f将解转换回到原始矩阵X和Y的空间。但是,理论上,我们不要求S的前n个对角元素等于SI的n个对角元素,并且我们不要求在U的前n列与eTUI的前n列之间,或者在V的前n行与VI Tf的前n行之间存在相等关系。
在任何情况下,我们将进一步探索这里描述的这些关系(参看下面的研究计划)以及寻找利用减小矩阵的有效计算的优点的可能性(例如,作为迭代乘幂算法的初始值)。
C.2.统计重要性和可靠性的评定
C.2.1.折叠程序
试验设计允许,留一程序是使用可用数据以经验为主地验证我们的网络间分析的经济方法。折叠交叉验证程序可以是证明潜在变量对作为有力鉴别器(C.3的鉴别分析中)或者纵向衰退的指数(能力分析中)的有效方法。
C.2.2.自举
自举再取样技术可以用来估计奇异图像(对于影像数据)的体素标准误差或者一般地矢量w和c的元素标准误差。为了统计重要性评定,奇异图像可以由体素标准误差度量。
C.3.初步经验验证和应用
C.3.1.受检者和影像数据
为了以经验为主地验证用于在该初步研究中检查FDG-PET和MRI数据集之间的功能/结构链接的提出的DBPLS方法,使用来自15个年轻成年人(31.3±4.8岁)和14个年长成年人(70.7±3.5岁)的FDG-PET/MRI数据。他们都是我们正在进行的阿朴脂蛋白ε4(APOE-ε4),Alzheimer病的遗传风险因素的纵向研究的参与者,并且都是APOE-ε4的非携带者(他们具有APOE-ε4等位基因的0个复本)。受检者同意他们将不给予关于他们的阿朴脂蛋白E基因型的信息,假设他们被通知的同意,并且在由Good Samaritan地区医疗中心(Phoenix,Ariz)和Mayo诊所(Rochester,Minn)的人类受检者委员会批准的准则下研究。
否认记忆或其他认知技能障碍的受检者不满意当前精神疾病的标准,并且在他们的PET/MRI会话之前至少两个星期不使用集中执行的药物治疗。全部具有正常的神经检查。不知道受检者的APOE-ε4型的研究者获得来自病史和家族史、神经检查以及结构化的精神病面谈的数据。所有受检者都完成Folstein修改的小型精神状态检查(MMSE)和Hamilton抑郁症等级提问表,并且除了一个受检者之外的全部受检者都完成一组神经心理测验。
使用951/31 ECAT扫描仪(Siemens,Knoxville,Tenn)执行PET,20分钟透射扫描,10mCi的18F-氟代脱氧葡萄糖的静脉注射,以及60分钟发射扫描的动态序列,当已经禁食至少4小时的受检者安静地躺在黑暗的房间里,闭上眼睛且朝向正面时。使用每个像素0.40周期的Hanning滤波器的反向投影和测量的衰减校正重构PET图像,产生大约8.5mm的平面内分辨率,半高宽(FWHM)和5.0-7.1mm FWHM的轴向分辨率,3.375切片厚度以及10.4cm轴向视野的31个切片。使用图像衍生的输入功能、血糖值和图解法计算葡萄糖代谢速度(每100g组织每分钟的毫克数)(Chen,K.等人1998)。计算每个受检者中整个脑中的葡萄糖代谢,作为来自次于通过丘脑中部的水平切面的所有脑内体素的平均测量(包括脑室的那些)。
使用1.5T Signa系统(通用电气,Milwaukee,WI)和T1加权的三维脉冲序列(稳定状态下的射频毁损梯度回召获取(SPGR),重复时间=33msec,回波时间=5msec,α=300,激发数=1,视野=24cm,影像矩阵=256乘192,切片厚度=1.5mm,扫描时间=13:36分钟)获取MRI数据。MRI数据集由平面内体素尺寸为0.94乘1.25mm的124个邻接水平切片组成。
通过两组受检者集中在一起的PLS分析实例数据集(在分析中不使用组隶属关系信息)。我们也称这种不关心组隶属关系的PLS分析为不可知PLS。
C.3.2数据预处理
使用计算机程序包SPM99(
http://www.fil.ion.ucl.ac.uk/spm,认知神经学的Wellcome部门,London)执行图像预处理。使用最佳MRI分段和标准化的改进程序在MNI模板空间(由Montreal神经学研究所创建的)上为每个受检者产生灰质概率图时忽视非脑组织的作用。简要地,该最佳程序首先分段每个受检者的脑空间上的MRI数据,通过仔细审查屏蔽来屏蔽分段的灰色组织图以首先消除任何非脑部分。然后,该程序估计将屏蔽的灰质图与MNI模板坐标空间上的灰质图比较的变形参数,随后将原始MRI数据变形,该数据然后分段以创建MNI模板空间上的灰质图。创建已调制和未调制的灰质图。灰色组织图也重新取样成26个切片(4mm的厚度),每个切片是65乘87的2mm体素的矩阵。最后,创建仅包含灰质强度值在所有受检者上为0.2或更高的那些体素的公共屏蔽。同样使用相同的体素尺寸和切片厚度将PET数据变形到MNI模板空间。相同的20%公共屏蔽同样应用到PET数据。最后,分别平滑PET和MRI数据以使得他们最终的解相互兼容。
C.3.3初步结果
使用MATLAB(MathWorks,MA)在运行linux操作系统的IBM A31膝上型电脑上实现PLS算法。
首先,使用不同尺寸(100乘100到6500乘6500)的随机产生的矩阵相对于MATLAB SVD实现(svd.m和svds.m)测试基于子矩阵的乘幂算法的准确度和可靠性。发现乘幂算法的实现相当于它在MATLAB中的对应算法。但是,对于具有1GB RAM和1GB交换空间的计算机,对于中等大尺寸的矩阵(6500乘6500),MATLABsvds.m崩溃,说需要将巨大矩阵划分成较小的矩阵。
对于实例MRI/PET数据集,通过将一个受检者的脑的体素排列成行向量来形成矩阵X的每行。因此,矩阵X中的行数是受检者的数目,并且列数是脑屏蔽中的体素数目。
当不尝试首先减小矩阵尺寸时,第一奇异图像对和相关奇异值的计算在一些代码优化之后花费70小时。
并不意外地,发现PET-PLS受检者分数和MRI-PLS受检者分数紧密相关(R=0.84,p<7.17e-09)。更有趣地,如图2A中所示,在年轻和年长受检者组之间存在完全的分离(空心圆:年长受检者;实心圆:年轻受检者)。
在根据自举估计的标准错误标准化之后,使用p=0.05到奇异图像的正和负值的任意阈值创建PET和MRI的第一奇异图像,如图2B中所示(左屏PET,右屏MRI)(p=0.05是合理的,因为不需要多次比较)。认识到奇异图像的符号是相对的并且PLS结果的解释是不熟悉的领域,我们当前对于双重图案的生物生理学理解如下:组合图案表示在内侧额叶、前扣带、双上前和楔前叶区域中同时发生的一致较低的灰质密度和较低的葡萄糖脑代谢速度(CMRgl);后扣带和双下前区域仅在PET上看到(具有负的图案权重)而在MRI上看不到;一些白色物质区域、尾状子结构和枕叶区域显示同时保留或在灰质分布上向前。这些剖面年轻和年长组MRI/PET发现指示,在非常健康的成年人中,年龄组差异与脑灰质密度和CMRgl变化的区域分布且相互链接的双网络图案相关联,如使用MRI基于体素的形态测定法和FDG-PET测量的。
相对于SPM发现比较PLS结果也是值得的。分别对于PET数据集和MRI灰质数据集(基于体素的形态测定分析)执行对比年轻和年长受检者组的SPM。我们发现PLS奇异图像与SPM T分数图之间的整体图案相似性以及多个明显聚焦的差异。但是,相对于SPM,网络间PLS组合来自两个模态的信息,并且提供可以用作有力鉴别器的全局指数(对)。例如,PET或MRI的多次比较校正的全局最大值在p=0.005处是显著的(校正后),PET/MRI PLS潜在变量是p<2.32e-18,对比年轻和年长受检者而不需要校正多次比较。
矩阵尺寸减小技术显著地提高计算速度。事实上,PLS花费不到一分钟完成,使用一个时间开销努力(几个小时)来分别为X和Y构造标准正交基e和f。我们发现使用或不使用首先减少矩阵尺寸的显著相似性PLS结果。但是,在奇异图像的空间图案方面以及在潜在变量数值和经验分布方面,这两种方法之间存在差异。
当我们执行折叠分析时差异也是明显的。折叠分析的目的在于检查将在29轮的每轮留在外面的受检者分类的准确度。首先基于剩余28个受检者的信息在每一轮中确定线性分类器。分类是相对于分类器基于他/她的PET和MRI潜在变量数值将留在外面的受检者指定到年轻或年长组。对于不执行矩阵尺寸减小的PLS程序获得100%的准确度。当执行矩阵尺寸减小时,29个受检者中3个被错误分类(89.7%准确度)。
C4.初步研究的发现总结
我们的初步研究的发现及其含义可以总结为:
(1)迭代乘幂算法在数值上与MATLAB svd例程相同
(2)虽然计算昂贵,矩阵尺寸不为研究环境而减小时PLS仍然可行
(3)结构和功能影像数据的组合增加灵敏度
(4)网络间PLS结果通常与单变量SPM发现一致但是具有更多增加的统计力
(5)PLS潜在变量可以是用于检测变化、区分组差异或分类的全局指数的构成部分
(6)存在提高计算速度的潜在可能性
(7)非参数统计测试和验证程序是PLS实现的集成部分
D.试验设计&方法
D.1:数据
在该提议下不需要获取任何新数据。我们的计划是使用在各种现有授权的支持下获取的数据或开始的数据。我们对人类受检者数据的使用将严格遵守HIPPA规章以及当地/机构IRB的任何需求。
D.1.1来自我们的NIH资助的纵向APOE-ε4研究的MRI,FDG-PET数据
纵向跟踪超过160个健康受检者(他们中一些已经具有5次或更多次就诊),Dr.Chen和Dr.Alexander作为研究者,Dr.Reiman作为PI且Dr.Caselli作为co-PI列出的该NIH资助项目(NIMHMH057899-06)在许多方面是空前的。这将是我们PLS应用的第一选择,特别是对于基于剖面和纵向FDG-PET和MRI数据(在有限程度上,因为数据都来自正常受检者,参看D.1.3)研究预测方案和构造临床诊断方案的我们的具体目标。因此,剖面和纵向数据集都将被考虑。而且,由于我们MBPLS的实现和神经心理学(NP)数据的可用,PLS到三重数据集(MRI,PET和NP数据)的应用将位于我们优先级列表的顶端。常规MBPLS应用将针对AD诊断,疾病发作的预测或到MCI的转变及治疗评价。另外,具有新提出的目标函数的MBPLS将用来寻找影像和非影像数据集之间的相互链接。
患者招募程序,MRI/PET影像数据获取程序,神经心理测量以及IRB规章(同意形式的需求等)与初步研究部分中描述的那些相同或几乎相同。
D.1.2来自我们的Alzheimer协会资助的APOE-ε4研究的MRI,FDG-PET数据
在该授权应用中描述的初步研究实际上基于来自该Alzheimer协会资助的研究的数据。同样地,数据的描述可以在‘初步研究’部分中找到。再次,Dr.Chen和Dr.Alexander作为研究者,Dr.Reiman作为PI以及Dr.Caselli作为co-PI列出。
D.1.3 ADNI下的AD患者,MCI患者以及健康受检者的MRI,FDG-PET数据
Alzheimer病神经影像启动计划(ADNI)是NIH在它的历史上资助的最大的项目之一。Dr.Chen,Dr.Alexander和Dr.Caselli是在2005年年初开始的该项目的研究者并且Dr.Reiman是co-PI。PI是UCSF的Dr.Michael Weiner。在两年间隔中将招募多达800个受检者参与。纵向MRI数据将对于全部800个受检者而获得,并且他们中一半将具有FDG-PET。因为该项目涉及AD患者,MCI患者和正常受检者,我们将能够评价PLS对表征自然衰老,疾病进展,以及到MCI和到AD的转变的使用。更重要地,我们具有更多机会来基于剖面和纵向FDG-PET和MRI数据研究预测方案和构造临床诊断方案。
D.1.5使用或不使用神经影像数据的对非影像数据的PLS分析
我们将积极地探索在神经影像领域内和外应用我们的多模态网络间PLS方法的可能性。来自基因组研究的微阵列数据将通过我们在Phoenix的翻译基因组研究所的连接而变得可用。PLS到基因组数据的应用将使用和不使用可用的神经影像数据。基因组、神经影像数据(FDG-PET和MRI)以及神经心理学测量的多个数据集PLS分析将在Dr.Papassotiropoulos分析来自我们的纵向APOE-ε4研究的参与者子集的血样以获得他们的基因组信息之后执行,这由其他资源计划和支持。
D.1.6优化的数据预处理
在初步发现部分中,我们为FDG-PET和MRI数据引入一些预处理步骤。将进一步研究预处理程序,特别是考虑到其他类型的数据集可以是PLS分析的一部分。许多分析共同感兴趣的预处理步骤,例如空间标准化、平滑、与基于体素的形态测定学(VBM)相关的一些问题等将不是当前研究的焦点。我们敏锐地知道关于VBM的争论,并且相信在新版本的SPM5中实现的新研究将解决它直到满意。这些区域的发展将在我们的预处理步骤中紧密跟踪并采用。将研究对于PLS(或通常多变量分析)更专用的预处理步骤,并且仔细地评价它们的效果。数据标准化例如常规地通过去除平均值并且统一化标准偏差而执行。我们将考虑将整个脑测量合并到该标准化中的各种方法,例如成比例定量或方差分析(ANOVA)。该常规标准化也将对于纵向研究而回顾,为了使用基线平均值对比后续时间的平均值。我们将研究的其他预处理问题包括对于一些或所有数据集在区域测量(例如SSM的一种(Alexander,G.E和moeller,J.1994)上全局的乘法调制的假设,以及基线数据作为后续灰色组织分段的先验的使用。
D.2 DBPLS和MBPLS实现和验证
D.2.1 MBPLS实现
我们先前的PLS实现仅聚焦于DBPLS。对于基于体素的MBPLS将进行大量努力。在体素乘体素的基础上,我们将首先尝试使制定完善的MBPLS算法为神经影像数据集而编程同时考虑非影像数据集的存在。随后的验证、非参数统计程序及其对于实际数据分析的使用将跟随,如在该提议中其他位置描述的。
在方法研究部分(参看下面)中,我们提议研究多个数据集之间的链接,而不指定一个为相关数据块且剩余的为独立(预测值)数据块。方法和理论研究将首先以它在个人桌上型计算机上的实现完成。事实上,测试代码实现和评价将是方法研究的重要部分。一旦完全理解它的数学适当性和可行性(且仅在此之后),将致力于使它在超级计算机系统上可用。而且,程序包的完成将标记为一般地处理基于体素的、基于ROI的影像数据或非影像数据的可行性(参看下面)。
D.2.2基于体素的和基于ROI的实现
我们当前的DBPLS实现是基于体素的。虽然在基于ROI的数据的计算部分中不需要额外的努力,只要数据以适当格式提供给程序,但是选择通常适合于脑功能,或者仅指定到具体脑疾病例如AD的一组ROI并不是无价值的任务。对于我们主要的AD研究兴趣,受AD影响的一系列脑区域将基于我们自己的研究(Alexander,G.E.等人2002)和其他研究(Minoshima,S.等人1995;Ibanez,V.等人1998;Silverman,D.等人2001)而产生。这些脑区域将在MNI坐标空间中高分辨率MRI模板上仔细定界。如果一些ROI需要手工定义,将检查ROI定义程序的可靠性(定等级器内和间的测试-再测试)(为此目的,我们计划使用Chris Rorden的计算机程序包MRIcro[www.mricro.com])。我们也计划使用自动的基于模板的ROI产生程序(Hammers,A.等人2002)将这些ROI转换成我们定制的模板(对于AD患者或对于健康受检者)。将积极地搜索已发布的、广泛使用且完整归档的ROI程序和结果(例如,已经由UCLA研究者在他们的自动化AD临床诊断的努力中仔细定义的多达200个ROI),并且用来最小化我们自己的努力。
D.2.3 PLS验证
在初步发现部分中,我们报告了我们的PET/MRI PLS发现与分别PET和MRI的SPM分析结果的一致性。我们计划在将它的结果对比各个数据集的单变量分析(例如由SPM)的结果中进一步验证我们的多模态网络间PLS方法。模态间PLS与模态内单变量分析之间的一致性间接地验证了该PLS方法。更重要地,如在我们的初步研究中发现的多个数据集PLS的增加灵敏度证明了期望的能力。PLS与单变量分析之间的对比,具有对生物医学和生物生理学过程的领会,在理解和解释PLS结果方面也是有帮助的。
PLS验证的另一个重要方面是揭示的网络间图案(奇异图像)和潜在变量对的再现性。虽然折叠留一程序在这一点上是合理的交叉验证,但是在从不同组的受检者获取的影像数据上重复相同生物特性的分析将更令人确信。当来自更多受检者的数据在我们的纵向APOE-ε4项目和其他的支持下获取时,这种再现性研究将对于包括在初步发现部分中报告的年轻/年长受检者研究的各种研究而执行。(注意,在我们的初步研究中每组中受检者的数目阻止我们这样做)。无论何时允许,受检者将为了验证再现性的两个相同分析而划分。确切地像建立监控疾病进展或诊断疾病发作的指数一样,组分割将重复最大可能数目以增加可用数据使用方面的验证效率,并且将进行编程努力使得当新的数据加入到我们的数据库时可以更新验证。
D.3 MBPLS/DMPLS作为AD的治疗评价和疾病进展的综合替代标记的建立
我们将主要致力于研究多模态网络间PLS作为可以在评定具有或不具有干预的纵向变化时以及在描述特别是对于AD的疾病进展时使用的方案。对于治疗评价,现在充分认识到神经影像替代标记的使用与大量增加的统计力、减小的成本以及缩短的研究持续时间相关联。更重要地,神经影像技术允许治疗/预防效果在关注疾病的早期阶段或者甚至在它发作之前观察到,如在我们的APOE-ε4研究中说明的。对于AD疾病进展或临床症状之前的脑交替(Reiman,E.M.等人1996;Reiman,E.M.等人2001;Reiman,Chen,Alexander,Caselli,Bandy,Osborne,Saunders和Hardy 2004),获取多模态影像和非影像数据现在越来越常见。另一方面,还没有最佳地使用神经影像数据的丰富性。神经影像数据完全使用的缺乏受如下事实所影响,即对于评价治疗效果或疾病进展的几乎所有神经影像研究,单变量统计是主导分析工具。换句话说,许多所选的脑区域或全局指数经常用于统计力计算,用于疾病进展监控以及用于临床诊断(经常不校正多次比较)。
作为对单变量方法的补充,我们提出并尝试建立模态内和模态间多变量指数作为研究治疗效果、监控疾病进展,以及可能地诊断AD疾病(使用剖面和纵向数据)时的分析工具。提出的方法将使得研究者能够最充分地利用神经影像数据的丰富性。结果,增加的统计力、减少的I型错误以及提高的灵敏度和专一性是期望的。另一方面,该方法不应当太复杂和违反直觉。
我们提议研究网络间PLS可行性作为跟踪下面描述的程序的替代标记。注意,这里讨论的基本概念适用于单模态和多模态数据集。
D.3.1纵向PLS分析
因为我们的初步发现是剖面的,这里我们将简要地描述几种处理纵向数据的方法。A)如果纵向数据仅对于两个时间点(基线和后续),那么在注意时间间隔和整个脑测量的方差之后,可以创建减法图像并加入网络间PLS分析中;B)不同时间点的数据可以看作独立的数据块,并且将它们全部直接加入到分析中。这样做时,我们将需要研究包括纵向信息的方法;C)可以独立地对来自每个时间点的数据执行PLS,继之以使用常规统计工具检查潜在变量中和奇异图像中的变化;D)来自单变量分析(例如SPM)的结果可以作为进一步PLS分析的起始点。例如,纵向体素回归系数(例如斜率)可以经历进一步的PLS分析(例如跨越患者组)。我们将在我们提出的研究中首先关注A)和D)。注意,下一个子部分将考虑该部分的讨论。
D.3.2指数建立
一个指数或一组指数是具有或不具有治疗的纵向变化的测量。在简单的单变量指数情况下,给定脑位置的CMRgl衰退(基线与后续扫描之间的差)是这种理想指数。评价的治疗效果反映为可测量的衰退减小。不具有治疗的衰退和具有治疗的衰退减小以及它们的方差通常是确定在具有期望统计力的新的试验中需要的受检者数目的起始点。
首先,例如一个指数或一组指数的可能候选可以是遵循制定完善的统计力程序中的相同逻辑思考,但是也考虑体素间协方差和网络间协方差的潜在变量对。因为潜在变量的方向性与纵向衰退一致(潜在变量的符号和权重是相对的,将不影响链接评定),例如,第一潜在变量对可以组合以形成单个指数或者可以用作双变量指数进入能力计算(注意最大协方差并不暗示最大相关)。因为潜在变量自身概括模态内和模态间链接,计算的能力并不基于选择一些体素/ROI位置而忽略它们之间的关系并且具有脑的剩余部分。相同的想法可以适用于多达第二、第三或更多潜在变量对的使用,或者例如与临床结果相关地最佳预先确定的它们的最佳组合。
其次,每个数据集内的奇异图像(第一数据集中的权重w,例如)可以用来构造随后统计力或疾病进展分析的指数。这是可能的,因为每个权重(在每个体素)自举估计方差的可用性。再次,因为权重方向性(正的或负的)的建立与单变量体素CMRgl衰退一致,可以选择权重显著(p<0.005例如)的奇异图像体素的集合。注意,也可以使用基于体素的分析的结果来指导体素的选择。
第三且最后,AD患者与MCI患者(AD研究作为我们当前方法提议的主要应用领域)之间的方向奇异图像差异可以与自举方法估计的体素方差一起使用。像单模态PET研究的单变量能力分析中的各个体素CMRgl衰退和衰退减小一样,图案/网络差异及其假设的减小(普遍的或脑区域相关的)可以是对于多模态研究(例如双FDG-PET和MRI)对于期望能力确定受检者数目或者对于给定受检者数目确定能力的基础,或者报告疾病进展/严重性的基础。
D.3.3能力计算
能力分析可以对于潜在变量对的每个独立地执行,继之以组合能力(定义为观察这些效果中至少一个的可能性)。该组合程序部分合理,因为潜在变量对不相关并且假设是高斯的,因此独立。对于奇异图像上的所选体素(空间图案上的所选显著节点)或自身,我们提议对于I型错误和统计力计算使用Monte-Carlo仿真程序,因为据我们所知没有可用软件为此目的而存在(参看B,附录,关于在2004年核医学年会上提出的我们自己的初步工作)。使用两个数据集研究中的第一潜在变量对作为实例,我们当前对仿真程序的原始思考在下面提供。
Monte-Carlo仿真程序包基于计算机程序包SPM99。仿真从标准或定制脑空间(例如MNI模板空间)上的3D脑屏蔽(由研究者提供)开始。因此,空间标准化、图像对准等处理不是仿真过程的一部分。对于N次迭代(N=10000,例如)的每次,该Monte-Carlo仿真程序包括下面的步骤:(1)对于I型错误计算,M个受检者中每个的两个模态的任意一个的3D脑图像在体素乘体素的基础上作为高斯随机数而产生。然后根据分析的最终图像分辨率平滑该图像。对于统计力计算,绘图产生程序与上面完全相同,但是近似的平均图像根据全部M个受检者的多达第n个特征图像(线性回归近似,与根据前几个PCA分量的原始图像的近似类似)。将如下包括由自举估计的体素方差和体素间协方差。假设∑是显著的特征图像体素内的协方差矩阵。该巨大矩阵是秩亏的,因为体素(变量)数目很可能远多于观察数目(自举再取样数目)的事实。因此,正方形矩阵Q存在使得∑=Q′∧Q,其中Q′Q=QQ′=I,并且Λ是仅第一个rank(∑)为非零元素的对角线。因此,可以使用零平均值和协方差矩阵Λ快速地产生长度为rank(∑)的随机矢量x,且随机y=Q′x+a将具有协方差矩阵∑,其中a是体素乘体素平均值。为了能力计算,协方差矩阵可以由相关矩阵代替,使得最终y具有单位方差和平均值
(作用大小)。除了处理体素间相关之外,注意增加的作用假设高斯变量具有单位标准偏差也是重要的。但是,平滑过程将标准偏差减小到单位级别以下。因此,相对于平滑后的随机域,原始已知作用大小大得多。结果,可能显著地过高估计了统计力。为了校正能力的过高估计,在引入非零作用大小之前,每个平滑后的高斯随机域由它的新的跨越体素的标准偏差度量。
(2)给定I型错误的阈值(5%例如)可以由在N个仿真/实现上构造的(2D)直方图评定(2D对应于两个影像数据集)。I型错误(显著水平)作为N上n的比例而估计,其中n是假设事件的出现(而没有引入关注的效果)。在几种可能备选中,I型错误的阈值T可以在2D直方图上计算为
其中α是I型错误,并且x和y是第一潜在变量对。然后T用于能力计算。显然,基于仿真的M个受检者数据的奇异图像与真实图像(或者来自分析实际数据的图像)的紧密性应当作为该研究的一部分而检查(参看该研究计划中的再现性部分)。其他备选存在并且将进一步探索。
D.3.4基于网络间PLS的疾病进展和临床诊断
与能力分析无关,用于检查疾病进展和临床诊断的网络间PLS的使用应当基于历史上和正在进行的制定完善的标准并且使用其确认。为了说明,我们将使用我们的NIH资助的纵向APOE-ε4研究作为实例。由于我们的纵向APOE-ε4研究中越来越多的健康受检者转变成AD或MCI,我们的首要尝试将是使用以转化率作为相关分块并且FDG-PET,MRI作为独立分块的MBPLS建立这种标准。该标准建立将基于受检者的子集。剩余的将用于验证目的。为了增加可用数据的使用方面的验证效率,组分割将重复最大可能数目。将进行编程努力使得当新的数据加入到我们的数据库时可以更新验证。该程序也将MBPLS作为预测值的使用的基础置于疾病的发作上。
D.3.5统计力方面和临床诊断方面数据块的相对重要性
我们将使用标准化的分块分数作为数据块重要性的测量。虽然这在方法上不具有挑战性,但是对诊断的贡献的相对重要性在生物和财政上具有重大意义。数据块重要性的新指数也将由提出的研究问题适当地观察。
D.4方法研究
D.4.1 MBPLS的新的目标函数
常规MBPLS的计算基于将数据集区分成单个相关数据集以及一个或多个独立(预测值)数据集。如果焦点在于从独立分块中预测相关分块的性能(例如疾病进展和临床诊断),这种设置是理想的。但是,当数据集(来自一组AD患者的FDG-PET,PIB-PET和结构MRI等)之间不存在清晰的相关-独立区别时,或者当主要兴趣在于寻找所有数据集之间的相互关系时,需要新的方法。存在建立定义数据集间协方差方面的标准的许多直观方法。难题在于寻找在数学上和逻辑上合理的,具有科学意义并且计算上可行的一些方法。这里我们将列出几种这种标准以启发我们自己和别人。下面,假设存在c个数据集,X1,X2,…,Xc。tk是表示Xk(k=1,2,…,c)的潜在变量,tk=∑wi (k)xi (k),其中xi (k)是矩阵Xk的第i列并且wi (k)是(单位标准的)相应权重。可以为计算潜在变量定义下面的目标函数:A)max(mink<l(cov(tk,tl))),B)
注意在这些表达式中使用的协方差是无条件的(当计算cov(tk,tl)时忽略其他数据集的作用)。对于代替地使用条件协方差的目标函数,将需要更复杂的方案。我们将需要使用上面定义的目标函数或其他来研究优化程序的解的存在性、唯一性、收敛和收敛速度。而且,需要考虑先前潜在变量集和正交性问题的作用建立适当的迭代程序,用于揭示第二、第三等潜在变量集。附录的部分C提供在我们的备选MBPLS研究努力上的一些初步结果。我们使用一些另外的约束证明备选MBPLS解的唯一性和存在性。
D.4.2使用和不使用矩阵尺寸减小的DBPLS计算
我们早期给出的先前结果显示使用迭代乘幂方案直接计算潜在变量与首先将矩阵尺寸减小到它们的秩之间的DBPLS结果差异和相似性。需要进一步的理论检查和理论指导的计算机仿真来揭示差异/相似性的原因以及研究当可行时说明该差异的程序。与矩阵尺寸的减小相关联的提高的计算速度对于提出的非参数统计再取样程序是重要的,因为它们实际上通常是迭代的。可以结合矩阵尺寸减小技术执行自举程序以估计每个图像模态的每个体素位置处权重的标准偏差。将研究关于该数据集尺寸减小技术的估计的标准偏差的鲁棒性。
D.4.3除了PLS方法之外或基于PLS结果探索备选方案
虽然该提议的主要焦点是建立DBPLS和MBPLS作为研究网络间链接的工具以及组合来自多个数据集的信息的方法,但是我们认识到存在描述多个数据集之间的关系的各个方面以及最大化组合来自每个数据集的信息的能力的其他方法。我们将MBPLS和DBPLS的建立看作1)将用来系统地研究多个数据集的许多工具之一(也就是,作为网络间方法)以及2)进一步应用数据驱动、基于模型或假设驱动的其他方法的探索工具。这些方法对于具有成功应用的跟踪记录的模态内单个数据集研究制定完善。但是,它们可能需要对于模态间、多个数据集研究而进一步推广。对于这种推广我们感兴趣的两种方法是(数据集间)独立分量分析(ICA),以及(两个数据集)结构方程模型(SEM)。在该非常早期的阶段,在我们未来研究方向的环境中这里我们的描述仅是粗略的且概念的。
多个数据集ICA:我们将仅说明两个数据集情况的概念。对于常规单个数据集,获得ICA解的一种方法是相互信息的最小化(Hyvarinen,A.等人2001)。使用与上面相同的表示法,第一数据集间独立对t和u通过最小化t和u之间的相互关系而获得:
min{H(t)+H(u)-H([t u])}
其中H(x)=∫p(x)logp(x)dx是连续随机变量/矢量x的熵,并且p(x)是x的概率密度函数(pdf)。积分将由对于离散随机变量/矢量求和代替。注意,这不是获得所有独立分量对的完整程序。我们的团队正在研究产生两个数据集ICA解时在混合矩阵上施加约束的概念直觉数值方法。其他备选方案也正在研究但是将不在这里讨论。
多个数据集SEM:
来自基于体素的PLS或基于ROI的PLS的结果将向研究者提供每个影像模态数据集内的共变图案以及这些数据集之间的链接。可以使用适当定量(数学)模型例如SEM的构造进一步理解这些图案和链接信息。众所周知的SEM向数据集间的情况的推广最初似乎自然且直接。但是,需要寻找区别和概括一个数据集内的节点以及跨越多个数据集的节点之间的链接强度的方法。
我们再次强调我们当前的研究焦点是数据集间的PLS。这些另外技术(网络间ICA和网络间SEM)的讨论将服务于我们,作为网络间PLS的研究仅是多个数据集分析策略的方法研究的开始的提醒。
D.5提出方法的可行性测试
可理解地,提出的程序与单变量分析比较以及与模态内多变量网络分析比较相对昂贵。但是,我们先前的发现提出在双重影像数据集上执行DBPLS甚至不首先减小矩阵尺寸,作为基础研究环境的分析程序在计算上是可行的。知道受检者的数目将仅少量地影响计算时间,协方差矩阵的计算在一开始而主体分数在最后也是重要的。因此,在我们先前的发现中报告的计算时间代表大范围的受检者/扫描数目。在计算可行性的上下文中,值得注意的是常规MBPLS作为临床诊断工具或治疗评价的标记是计算有效的,因为它的相关数据块具有单个或有限数目的变量。因此,协方差矩阵的尺寸不是关注点。
我们对于当前的计算速度完全不满意。如遍及该研究计划可以看到的,主要的努力在于有效地实现算法。计算可行性测试将是实现的每一个步骤中的集成部分。像在我们的初步研究中一样,该可行性测试包括下面三个部分:(1)算法是正确的且在数学上合理。将相对于数学偏差仔细检查实现的算法,并且与仅可以处理尺寸比神经影像数据集的尺寸小得多的非影像数据的制定完善的计算机程序包相比较。比较将使用中等尺寸的计算机仿真的数据集;(2)算法是计算有效的。将优化算法的每个部分(例如矢量化MATLAB中所有可能的操作)。该优化将在实际研究中相对于具有期望尺寸的数据集而进行(例如体素的数目)。该数据集可以来自实际研究或经由计算机仿真;(3)算法的输出是可科学解释的。这与D.2.4 PLS验证完全相同。细节参看该部分。
上面概述的三步骤可行性测试将位于为研究而计划的每个算法的每个步骤。这对于新提出的方法研究(例如在D.4.1中描述的备用MBPLS目标函数)尤其成立。
其他实例
图7是描绘精确不可知PLS操作和不精确不可知PLS操作之间的比较的图。该图陈述29乘200随机矩阵的特征向量。对于该特征向量,x轴是精确不可知PLS操作而y轴是不精确不可知PLS操作。
显示由图2B中看到的模态间精确不可知PLS操作,由图6A中看到的不精确不可知PLS操作,由图8A中看到的标准单变量SPM程序,以及由图8B中看到的体素乘体素多变量MRI-PET SPM揭示的空间图案。除了图8B中看到的体素多变量SPM之外,MRI和PET发现分别显示在左侧和右侧。
在多个神经影像数据集的可用性的推动下以及特别地在单模态PLS方法的成功的激励下,我们提出扩展PLS用于分析双重影像数据集。我们假设为了增加的统计力,该模态间PLS可以寻找多个数据集之间的最大和直接链接或者最佳地组合来自它们的信息。
更具体地,1)我们探索不可知和非不可知的PLS使用策略以分析双模态神经影像数据。不可知PLS是寻找两个图像数据集之间的直接链接而不关心任何受检者组隶属关系或扫描条件,并且执行与条件/组差异相关的随后分析。另一方面,非不可知PLS是在组合来自双重影像数据集的信息时直接考虑组/条件差异。2)我们为不可知PLS提出计算可行的方法,以克服与两个神经影像数据集之间的协方差矩阵的巨大尺寸相关联的困难。3)我们提出备选实现,以首先减小协方差矩阵尺寸从而提高不可知PLS的计算速度。4)我们将分别对于不可知和非不可知PLS展开执行非参数推理或交叉验证程序的框架。最后,5)我们通过将它应用于来自完全分离的年轻和年长健康受检者组的两个MRI/PET数据集,并且在单变量SPM分析和模态内PLS方法(也就是,仅使用两个影像数据集中的一个来寻找组/条件差异)的环境中对比发现,以经验为主地验证该网络间PLS方法。
方法
受检者和数据
为了以经验为主地验证用于检查FDG-PET和MRI数据集之间的功能/结构链接的PLS,使用来自15个年轻成年人(31.3±4.8岁)和14个年长成年人(70.7±3.5岁)的FDG-PET/MRI数据。他们都是由Alzheimer协会支持的‘AD的临床前过程中的PET,APOE和衰老’研究的参与者。他们都是APOE-ε4非携带者。受检者同意他们将不给予关于他们的阿朴脂蛋白E基因型的信息,假设他们被通知的同意,并且在由Banner Good Samaritan地区医疗中心(Phoenix,AZ)和Mayo诊所(Scottsdale,AZ)的人类受检者委员会批准的准则下研究。
否认记忆或其他认知技能障碍的受检者不满意当前精神疾病的标准,并且在他们的PET/MRI会话之前至少六个星期不使用集中执行的药物治疗。全部具有正常的神经检查。不知道受检者的APOE-ε4型的研究者获得来自病史和家族史、神经检查以及结构化的精神病面谈的数据。所有受检者都完成Folstein修改的小型精神状态检查(MMSE)和Hamilton抑郁症等级提问表,并且除了一个受检者之外的全部受检者都完成一组神经心理测验。
使用951/31 ECAT扫描仪(Siemens,Knoxville,Tenn)执行PET,20分钟透射扫描,10mCi的18F-氟代脱氧葡萄糖的静脉注射,以及60分钟发射扫描的动态序列,当已经禁食至少4小时的受检者安静地躺在黑暗的房间里,闭上眼睛且朝向正面时。使用每个像素0.40周期的Hanning滤波器的反向投影和测量的衰减校正重构PET图像,产生大约8.5mm的平面内分辨率,半高宽(FWHM)和5.0-7.1mm FWHM的轴向分辨率,3.375切片厚度以及10.4cm轴向视野的31个切片。使用图像衍生的输入功能、血糖值和图解法计算葡萄糖代谢速度(Chen等人1998)。计算每个受检者中整个脑中的葡萄糖代谢,作为来自次于通过丘脑中部的水平切面的所有脑内体素的平均测量(包括脑室的那些)。
使用1.5T Signa系统(通用电气,Milwaukee,WI)和T1加权的三维脉冲序列(稳定状态下的射频毁损梯度回召获取(SPGR),重复时间=33msec,回波时间=5msec,α=30°,激发数=1,视野=24cm,影像矩阵=256乘192,切片厚度=1.5mm,扫描时间=13:36分钟)获取MRI数据。MRI数据集由平面内体素尺寸为0.94乘1.25mm的124个邻接水平切片组成。
数据预处理
使用为脑影像数据序列的分析而设计的计算机程序包SPM99执行图像预处理。使用最佳MRI分段和标准化程序(Good等人2001)在MNI模板空间(由Montreal神经学研究所创建的)上为每个受检者产生灰色组织概率图时忽视非脑组织的作用。创建已调制和未调制的灰质图。灰色组织图也重新取样成26个切片(4mm的厚度),每个切片是65乘87的2mm体素的矩阵。最后,创建仅包含灰质强度值在所有受检者上为0.2或更高的那些体素的公共屏蔽。同样使用相同的体素尺寸和切片厚度将PET数据变形到MNI模板空间。相同的脑屏蔽同样应用到PET数据。最后,分别平滑PET和MRI数据以使得他们最终的解相互兼容(对于平滑后的MRI和PET,最终的半高宽是15mm)。
使用紧缩的PLS
我们采用通过将信息投影到先前的潜在变量对上来紧缩数据矩阵的方法。这保证所有数据空间中提取分量的正交性(Hoegaerts等人2003)。下面描述使用紧缩方案的PLS程序。
PLS揭示分别从两个数据集的每个线性构造的一对潜在变量之间的最大协方差。从原始数据矩阵X和Y(具有必要的标准化)开始,第一潜在变量对构造如下:X的潜在变量是t=∑wixi,其中wi是作为X的第i列(i=1,2,…)的随机变量xi的标量。以矩阵形式,t=Xw其中w=(w1,w2,…)T且‖w‖=1。对于影像数据集,下标i指脑量中的第i个体素。类似地,Y潜在变量可以表示为u=Yc(‖c‖=1)。再次,我们称t和u为第一潜在变量对。在不可知PLS的环境中,我们称w和c分别为X和Y的(第一)奇异图像,因为w和c可以映射回图像空间并显示。因此两个潜在变量t和u的协方差是cov(t,u)=w′X′Yc(假设零平均值)。可以证明相对于w和c的最大协方差值为矩阵Ω=[X′YY′X]的最大特征值的平方根,w是Ω的相应特征向量并且c是Y′XX′Y的相应特征向量。第二潜在变量对可以类似的方法构造,在从X和Y中如下回归出(紧缩)第一潜在变量对的贡献之后:表示
并且计算新的X1和Y1为X1=X-tp1′,Y1=Y-tr1′。然后对于新的X1和Y1矩阵对重复相同的程序以构造第二潜在变量对。将类似地计算第三和剩余潜在变量对(直到第L对,其中L=rank(X))。注意,这里描述的紧缩方案是Y指定为相关数据块而X指定为独立数据块的事实的反映。
多分块PLS
至此引入的PLS称作双PLS(对于两个数据集的DPLS)并且用于特别地当X和Y都是影像数据时我们的不可知PLS。当对于相关分块Y与多于一个独立分块X1,X2,…,Xm之间的关系感兴趣时,需要多分块PLS(MPLS)。如将看到的,我们的非不可知PLS实际上是MPLS。当试图揭示潜在变量2及之上时DPLS与MPLS之间的主要差异出现。为了开始,MPLS以与DPLS相同的方法精确地揭示Y与X=[X1 X2…Xm]之间的第一潜在变量。但是,上述DPLS紧缩步骤将混合来自各个X分块的贡献并且使得结果难以解释。提出各种紧缩方案。根据(Westerhuis和Smilde 2001的)提议,我们仅紧缩Y分块而保持X分块不动。
不可知PLS对比非不可知PLS
在执行非不可知PLS时,年轻和年长组隶属关系是矩阵Y,因为我们的主要兴趣是这两组之间的差异。在该情况下,Y实际上是分别对于年轻和年长受检者具有值1和2的列向量。作为选择,也可以使用各个受检者的年龄形成Y。通过将PET和MRI数据集中在一起形成X分块,X=[PET MRI],其中PET是从PET-FDG数据形成的n×Px数据矩阵。n等于受检者的数目并且Px是脑屏蔽上脑体素的数目。类似地定义数据矩阵MRI。我们称这为非不可知PLS,因为该MPLS程序直接使用组隶属关系作为相关分块。显然,不能信任直接从该非不可知PLS得出的I型错误评定,并且需要另外的程序寻找真正的I型错误(参看下面)。
相反地,不可知PLS寻找两个图像数据集PET和MRI之间的直接链接,而不参考年长/年轻受检者差异。如果年长和年轻受检者之间的差异是方差的主要来源,不可知PLS揭示最大协方差将具有自然地区分两组的能力,并且不需要过多关注与组差异的检查相关联的I型错误(但是下面参看自举和折叠程序)。
经由迭代乘幂算法的不可知PLS实现:精确方法
正方形矩阵Ω的尺寸是脑量内体素的数目(假设对于两个影像数据集,体素的数目相同)是显然的。为了使计算可能,我们将矩阵Ω和其他划分成当需要时一次仅读入一个到计算机内存的一系列小矩阵。为了使该策略起作用,仅允许的矩阵操作是可以在子矩阵上执行并且产生子矩阵形式的那些。一个这种操作是例如矩阵乘法。为了将该策略用于与PLS计算相关的奇异值分解(SVD),我们采用实际上迭代的所谓乘幂算法(Golub和Van Loan 1989)(对于MATLAB代码的说明片段,参看附录A)。在每次迭代中涉及的操作仅是矩阵×矢量,矢量×矩阵,以及矩阵×标量,它们在子矩阵上都是独立的。
经由矩阵尺寸减小的不可知PLS实现:不精确方法
假设数据矩阵X是n乘以PXz(Xn×PX),其中n<<PX且rank(X)≤n。不损失一般性,我们假设rank(X)=n。X的行空间具有标准正交基,
满足:
这个基例如可以是经由矩阵X上的PCA的一个。(注意存在无穷多个这种基。)X可以表示为X=XIe,其中XI是满秩n×n矩阵。类似地,我们具有Y=YIf。
因此,
XTY=USVT和
的奇异值分解(SVD)。在这些表达式中,U和UI是列正交的,并且V和VI是正交矩阵。上面公式(2)可以重写成
在(2)的启发下,我们执行XI TYI上的SVD(也就是,UI,SI和VI的计算),代替XTY。然后,我们使用矩阵e或f将解转换回到原始矩阵X和Y的空间。
虽然该方法显然不精确,我们的兴趣是检查它的结果如何与精确方法相比较(无论如何我们仅感兴趣前n个非零奇异值以及U和V的相关列)。
与不可知PLS相关的PET-MRI链接指数
因为不可知PLS直接寻找两个图像数据集之间的共变图案,可以定义各种标量和图像指数以检查结构MRI和功能PET之间的关系。在该当前文章中,将引入和使用它们中的两个。第一是MRI数据集与PET数据集之间的潜在变量对的平方相关系数。第二是称作解释力的图像方面的指数。这是在PET图像空间上的相关系数图。对于每个PET体素,相应相关系数在X分块(MRI)的单个潜在变量与来自该体素的PET测量之间。
非不可知PLS的非参数统计程序:排列
为了在测试年长和年轻受检者之间的差异时评定I型错误,在矩阵Y上执行10000行随机排列,并且对于该改序后的Y分块和未改变的X分块的每个运行MPLS程序。10000次运行上的不成对t测试p值的直方图用来评定I型误差。仅转变年长/年轻组隶属关系的排列朝向执行的排列总数而计数。
不可知PLS分析的非参数统计程序:折叠和自举
折叠交叉验证:不可知PLS分析(精确和不精确的)每次取出一个受检者而重复29次。使用来自28个受检者的作为结果的潜在变量对构造线性鉴别器,其然后适用于判定留在外面的受检者的年长/年轻组隶属关系。该程序允许我们评定分类准确度。
具有统计意义的自举评定:使用为不可知PLS而包括的全部29个受检者,自举再取样程序运行100次以估计奇异图像的体素标准偏差。然后使用自举估计的标准偏差为统计意义评定度量奇异图像对。
PLS与SPM的比较
PET和MRI数据集每个由单变量SPM对比年长和年轻受检者而独立分析(对于MRI数据,分析基本上是优化的基于体素的形态测定)。为了与PLS分析一致,由成比例定量说明全局CMRgl和总体颅内量(TIV),并且在SPM程序中使用PLS分析的屏蔽(参看预处理)。除了单变量SPM之外,MRI灰质图和FDG-PET数据在SPM多变量模式下使用F统计运行,也就是PET和MRI测量看作每个体素的双变量。在SPM分析中,提取并联合使用来自全局最大位置的MRI和PET数据测试年轻和年长组差异。
两个PET/MRI数据集由使用或不使用首先减小X和Y的矩阵尺寸的非不可知PLS和不可知PLS分析。再次,将两组受检者集中在一起来执行不可知PLS分析(也就是组隶属关系信息在PLS程序中不使用。对于我们这种合理实践的更多内容参看讨论部分)。联合地使用不可知PLS的潜在变量对以测试年轻和年长组差异。
比较来自5个分析,单变量SPM,多变量SPM,非不可知PLS,不使用矩阵尺寸减小的不可知PLS,以及使用矩阵尺寸减小的不可知PLS的空间共变图案。直观检查揭示的空间图案的差异和相似性。空间图案分别是多变量SPM的单个F分数图以及单变量SPM的两个t分数图(一个对于FDG-PET,另一个对于MRI灰质VBM)。空间图案是不可知PLS的奇异图像对以及非不可知PLS的从X分块分离的未混合PET和MRI图案。评定年长和年轻受检者之间差异的p值对于不可知PLS,SPM一起报告。报告非不可知PLS的排列结果并且在三个非不可知PLS分析之间比较:X分块仅是PET,X分块仅是MRI,以及X分块是PET和MRI。
结果
使用MATLAB SVD的乘幂算法的等价物:使用MATLAB在运行Linux操作系统的IBM A31膝上型电脑上实现乘幂算法。使用不同尺寸(100乘100到6500乘6500)的随机产生的矩阵相对于MATLAB SVD实现(svd.m和svds.m)测试算法的准确度。发现乘幂算法的实现相当于它在MATLAB中的对应算法。但是,对于具有1GB RAM和1GB交换空间的计算机,MATLAB svds.m对于中等大尺寸的矩阵(6500乘6500)而崩溃。
不可知精确PLS和不精确不可知PLS之间的数值相似性:再次使用不同尺寸的随机产生的矩阵测试不精确PLS实现(也就是首先使用矩阵尺寸减小)并且与精确解比较。虽然两种方法的结果并不令人惊奇地不完全相同,它们之间存在一致相关。使用从29作为受检者数目且200作为体素数目的随机产生的矩阵对计算的分量4说明该一致性。图7显示精确方法(x轴,矩阵U的第4列)与不精确方法(y轴,eTU1的第4列)之间非常强的相关。但是,超过100个仿真矩阵对,相关系数在0.73到0.99之间波动。同样发现,当矩阵X和Y非负时(例如,取区间[0 1]上的值的均匀分布随机单变量),第一分量较差地相关。幸运地,在处理我们的实际数据时,两个矩阵被平均地去除。
不可知PLS的各个SPM-PET,SPM-MRI图案和共变PET/MRI图案:首先通过直观检查由它们的每个揭示的并且在图2A,6A和8A-8B中显示的脑量变化来比较不同的分析技术。图2A,6A和8A-8B分别对于精确和不精确的不可知PLS。图8A上的左侧图像对于SPM-MRI(VBM)而图8A上的右侧图像对于SPM-PET。体素双变量SPM在图8B上。虽然它们具有区别的特性(模态内和体素单变量或体素双变量对比模态间和多变量)并且应当不同地解释,但是总体上它们看起来彼此非常相似。
例如,图2A显示不可知PLS揭示叠加在标准脑解剖图上的PET和MRI共变图案(左屏是MRI灰质奇异图像,右屏是PET奇异图像)。在根据自举估计的标准误差标准化(100轮)之后,它们使用p=0.05到奇异图像的正和负值的阈值创建。组合图案指示在内侧额叶、前扣带、双上前和楔前叶区域中同时发生的一致较低的灰质密度和较低的葡萄糖脑代谢速度(CMRgl);后扣带和双下前区域仅在PET上看到(具有负的图案权重)而在MRI上看不到;一些白色物质区域、尾状子结构和枕叶区域显示同时保留或在灰质分布上向前。这些剖面年轻和年长组MRI/PET发现指示,在非常健康的成年人中,年龄组差异与脑灰质密度和CMRgl变化的区域分布且相互链接的双网络图案相关联。不像各个SPM PET或SPM MRI/VBM分析,模态间PLS量化两个数据集之间的链接强度(优化的潜在变量对协方差)。
由不可知PLS揭示的FDG-PET与MRI灰质密度之间的链接:第一总体链接强度指数是潜在变量对t和u的平方相关系数,对于不可知PLS发现其强至R2=0.73(R=0.854且p<3.77e-9)。该紧密相关是解释MRI和PET共变空间图案及其相互作用的基础。对于不可知PLS,通过将X分块潜在变量t分别与Y分块中的y1,y2,y3,…相关来评定X分块到Y分块中各个变量的总体解释力。在MRI看作X分块的当前研究中我们的不可知PLS中,总体解释力是对FDG-PET空间图案的总体解剖影响(使用MRI灰色组织潜在变量与FDG-PET测量的体素乘体素相关系数形成的图)。这在图9A中显示为具有未校正p=0.001阈值的相应t分数图(如果相关系数显著不同于0则测试)。在该图中,最大正相关在位置(4 23 32)的右中扣带,相关系数是0.8且p=1.97e-7(T=6.917)。最大负相关在位置(-20 20 -8)的左核壳,R=-0.751且p=2.63e-6(T=-5.918)。类似地,图9B显示与体素MRI灰色组织密度的PET潜在变量相关。最大正和负相关系数是0.851(p=4.92e-9,T=8.423)和-0.81(p=9.96e-7,T=7.186),分别在位置(50 -14 48)的右前中央和(34 -48 -4)的右纺锤形。注意,这两个图可以容易地解释为相关图,并且与图7中的奇异图像对非常相似。
总之,图9A-9B显示空间功能和结构相关图。图9A中显示的是来自每个脑体素的PET测量与全局MRI灰质潜在变量之间的相关图。图9B中显示的是来自每个脑体素的MRI测量与全局PET潜在变量之间的相关图。显著性是p=0.001,没有对于多次比较而校正。
在PET和MRI数据都在X分块中的非不可知PLS中揭示的图案:图10显示在非不可知PLS中区分年轻和年长受检者时显著贡献的PET和MRI空间分布图案(也就是,年长年轻受检者组隶属关系是MBPLS Y分块,并且PET和MRI都在X分块中用作预测值)。不可知PLS奇异图像与非不可知结果之间的整体相似性是显然的。该显著相似性说明我们研究中的年长年轻受检者差异是占优势的并且是主要方差的事实。
通过各种方法I区分年长和年轻受检者:不可知PLS与SPM比较。相比SPM,网络间不可知PLS组合来自两个模态的信息并且提供更有力的(具有最小的I型错误)全局指数。例如,多次比较校正的全局最大值的I型错误分别对于PET是p=0.005(在右脑岛中[48 14 -2]处局部最大值,未校正的p=2.37e-7)且对于MRI是p=0.00001(右后中央的[50 -18 52],未校正的p=9.84e-12)。多变量(该研究中双变量)SPM多次比较校正的I型错误是1.34e-7(位置[10 14 -14]右直肌,未校正的p=1.06e-12)。注意,单变量SPM-PET或SPM-VBM/MRI是一尾而双变量SPM是两尾。相反地,对于不精确和精确不可知PLS,显著性分别是p=9.14-11和p=4.443e-12,对比年轻和年长受检者而不需要校正多次比较(对于精确不可知PLS结果,参看图2A)。
总之,图10显示共变MRI图在左侧而PET图在右侧的空间功能和结构相关图,其中图案由非不可知PLS操作产生,并且图2A是显示通过使用由不可知PLS操作获得的潜在变量对将全体年长和年轻受检者分离成各个组的图。
作为精确和非精确不可知PLS之间能力差异的进一步测试,使用折叠分析检查分类在29轮的每轮留在外面的受检者的精确度。首先基于剩余28个受检者的信息在每一轮中确定线性分类器。分类是相对于分类器基于他/她的PET和MRI潜在变量数值将留在外面的受检者指定到年轻或年长组。对于精确不可知PLS程序获得100%的准确度。但是,对于不精确不可知PLS,29个受检者中3个被错误分类(89.7%的准确度)。该比较非常初步,因为仅考虑线性鉴别。数据图的直观检查揭示还在进一步研究的非线性鉴别器的存在。
通过各种方法II区分年长和年轻受检者:仅使用PET,仅使用MRI,或者一起使用PET和MRI的非不可知PLS之间的比较。因为年长/年轻组隶属关系在非不可知PLS中实际上是Y分块,并且形成X的潜在变量以最好地预测隶属关系,区分两个组的产生的I型错误必须使用非参数排列估计。隶属关系每次转变的总共10000个随机排列中,在仅使用PET的非不可知PLS中两个排列产生与未改序的情况一样强的组隶属关系区别(I型错误的出现=2)。对于仅使用MRI的非不可知PLS,I型错误的数目出现30次。相反地,在MRI和PET一起用作X分块的非不可知PLS中,不存在I型错误的另外出现(除了未改序运行之外)。换句话说,对于仅使用PET,仅使用MRI,或者一起使用MRI和PET运行非不可知PLS,p=0.0003,0.0031或0.0001。
计算速度:当前,使用迭代乘幂算法的精确不可知PLS计算花费大约15-46小时,取决于迭代中使用的初始值以及使用在IBM A31膝上型电脑(具有1GB内存)上的一些代码优化。关于它的实践性,我们的提议,以及将显著减少计算时间的我们正在进行的努力的更多内容,参看讨论部分。
对于不精确不可知PLS和非不可知PLS,计算速度与常规SPM分析相当。
讨论
提议使用PLS研究多重影像数据集之间的共变图案。使用该技术,例如,研究者可以寻找功能和解剖学链接信息。另外,它可以用来为随后的统计干预不可知地或非不可知地组合来自多个数据集的信息。PLS是可以潜在地用于研究模态间多重影像数据集的几种工具中的一种。它不仅可以用来为随后基于模型和面向假设的分析作为预备步骤探索多个数据集(参看例如(Rajah和McIntosh 2005),像模态内PLS一样),更重要地,它可以构造可以用来评价组差异、纵向变化以及可能地治疗效果的基于潜在变量的指数。
给定潜在变量对的不可知PLS共变图案的解释需要PLS理论的良好掌握和研究问题的生物生理学方面。如在该研究中说明的,不可知PLS结果的理解可以从各个单变量SPM发现中得到帮助。但是,在任何情况下,应当注意模态内单变量SPM与多变量模态间PLS之间的基础差异。而且,同样值得注意的是,使用自举估计的体素标准偏差作为标准化因子产生共变图案。解释两个共变图案的困难也与PLS相对于w和c寻找最大协方差cov(t,u)=w′X′Yc(以‖w‖=‖c‖=1为条件)的事实相关联。因此,图案c和w扮演与PCA-SSM的特征图像类似的角色,其具有分别对于FDG-PET和MRI灰质图的最大累积总方差。更重要地,c和w建立两个数据集之间的关联(经由潜在变量对t=∑wixi和u=∑ciyi之间的相关系数),并且允许为进一步理解两个数据集之间的关系进行随后的解释力分析。
在神经影像领域中通常使用的PLS方法实际上是在我们的不可知模态间PLS中采用的双分块PLS。如在方法部分中看到的,双分块PLS是特殊的情况,更重要地,是可以处理来自多于两个数据块的数据的一般多分块PLS(MPLS)的基础。当前研究中我们的非不可知PLS分析基于MPLS,年长/年轻组隶属关系作为第三(且相关)数据集。考虑到多分块PLS分析在化学统计学领域中的成功(Lopes等人2002;Westerhuis等人1996;Westerhuis等人1997;Westerhuis和Smilde 2001),MPLS在神经影像研究中的更一般使用将是未来研究的主题(以便使用或不使用新定义的目标函数处理三重影像数据集)。
不可知PLS的乘幂算法的一个限制是因同样取决于第一和第二最大特征值之间的比值的收敛速度而导致的相对高的计算费用(Press等人1992)。虽然如下所述在我们的实验室中正在采取努力来极大地减少计算时间,常规不可知PLS可以使用它当前的实现整夜完成(注意速度主要受体素数目影响,而仅轻微地受受检者/扫描数目影响)。这在对即时结果交付的需求不如该研究说明的我们相信不可知PLS有利的能力或灵敏度问题一样重要的基础研究环境中是可接受的。此外,调节设置并重新运行分析的需求是不可能的,因为预处理步骤是标准的并且由SPM执行。在任何情况下,我们在模态间不可知PLS的有效实现上继续努力。事实上,我们关于不精确不可知PLS解用作乘幂算法迭代程序的初始值的初始研究证明速度可以对于常规使用而显著提高。而且,将评价特别考虑实现效率的其他算法例如QR和Rayleigh商(Borga等人1997)。最后,我们正在评价在本地对我们可用的高性能计算系统中实现不可知PLS的需求的过程中。
MRI衰老发现:虽然关于年轻和年长受检者之间海马形成(HF)差异不存在直接证据,已经报告头尺寸调节的HF量与延迟的记忆性能强烈相关(Golomb等人1994)。Murphy等人报告(Murphy等人1992)尾状和豆状核在老年人中显著小于年轻人中。当它们的量表示为脑物质量的比值时该显著差异保持(Murphy等人1992)。尾状核中的衰退(但是没有在豆状核中),在前间脑灰质结构以及联合皮质和中央颞叶结构中,但是没有在豆状核中,丘脑和前扣带也在独立的研究中报告(Jernigan等人1991)。发现颞叶皮层与衰老过程无关,但是后额叶量有关(DeCarli等人1994)。必然的变化:脑室增大,HF,尾状和豆状核。
PET衰老发现:使用正电子发射断层显像测量的前额代谢显示相对于其他皮质或皮质下区域而降低,在与年轻志愿者相比较稍老的健康群体中(Salmon等人1991)。使用直观定性评定(Loessner等人1995),发现特别是在额叶中的减少的皮质代谢,但是没有在基底神经节,海马趾区,丘脑,小脑,后扣带回和视觉皮层中。使用校正的部分容量效应,Melter等人发现仅在眼-前额皮层中区域大脑血流中的真实衰退(Meltzer等人2000)。
为了验证新引入的模态间PLS,在该研究中使用来自具有最大可能差异的年长和年轻受检者的数据。并不令人惊讶的是所有方法使用许多神经影像研究者期望在他们的研究中具有的统计显著水平检测组差异。对于假设测试,区分p=1.34e-7和p=4.44e-12可能是无意义的。另一方面,在计划新的研究中执行能力分析时,这些差异可以转化成减小的成本或增加的灵敏度。而且,使用实现的该第一验证,我们期望PLS将足够灵敏以识别其他方法可能不能检测的微妙的组/条件差异。
总之,提出的模态间PLS方法可以用来寻找两个图像数据集之间的直接链接,并且可以用来以增加的能力检查组差异。
图11是过程1100的实例实现的流程图,其中在数据集之间进行链接以实现有用的结果。在步骤1102中,获取多个数据集(Di,i=1-I)。每个数据集由在多个对象(On,n=1-N)的每个上执行的影像模态或非影像模态获取。在步骤1104中,寻找Di和Dj之间的链接,其中Di和Dj不是相同的模态。在步骤1106中,将Di和Dj之间的链接简化成单个数值评定的表达式。在步骤1108中,单个数值评定用作对象(On,n=1-N)之间的差异和相似性的目标、量化评定。
在步骤1104中寻找的链接将优选地使用偏最小二乘(PLS)操作,例如双分块(DB)PLS操作或多分块(MB)PLS操作寻找。对象(On)可以是解剖学人体部分例如指纹、器官或组织(例如;脑,胸)、体液、面部特征等。作为选择,对象(On)可以人造,例如制造的电子设备。这些对象的测量可以当作指数,例如与性能的各个方面相关的指数或者用于测量外观的指数。
在步骤1102中获取的数据集(Di)可以是影像模态或非影像模态。影像模态的实例包括,但不局限于,超声波,不同PET和单光子发射断层显像放射性示踪剂方法,结构、功能、灌注权重或扩散权重MRI,x射线计算的断层显像,N乙酰天冬氨酸、肌醇和其他化合物的磁共振光谱测量,脑电图,定量脑电图,事件相关潜能和其他电生理学程序,脑磁波图,以及前述影像模态的组合。非影像模态的实例包括,但不局限于,电生理学测量、生物化学测量、分子测量、转录子测量、蛋白质组测量、认知测量、行为测量,以及前述的组合。
过程1100的更特别实例在图12中看作过程1200。过程1200在获取FDG-PET(PETn)数据集和MRI(MRIn)数据集的步骤1202中开始,其中每个数据集在多个人类受检者(On,n=1-N)的每个上获取。在步骤1204中,对于他们各自的数据集PETn和MRIn寻找FDG-PET和MRI之间的链接,其中FDG-PET数据集(PETn)和MRI数据集(MRIn)被集中到(pooled into)来自全部各个人类受检者的复合数据集中。在步骤1206中,将在步骤1204中找到的FDG-PET与MRI之间的链接简化成单个数值评定的表达式。在步骤1208中,单个数值评定用作人类受检者(On,n=1-N)之间或者受检者组之间的差异和相似性的目标、量化评定(例如,N个受检者划分成两组)。
图13是过程1300的实例实现的流程图,其中在数据集之间进行链接以实现有用的结果。在步骤1302中,在多个tj的每个(时间=tj,j=1-2),获取多个数据集(Di j,i=1-I,j=1,2)。每个数据集由在多个对象(On,n=1-N)的每个上执行的影像模态或非影像模态获取。在步骤1304中,在时间t1和时间t2之间对于对象On的每个实施某种治疗。在步骤1306中,寻找时间tj的Di1 j和Di2 j之间的链接,其中Di1 j和Di2 j不是相同的模态。在步骤1308中,将tj处Di1 j和Di2 j之间的链接简化成单个数值评定的表达式。在步骤1310中,单个数值评定用作对象(On,n=1-N)上从时间t1到时间t2的治疗效果的目标、量化评定。
过程1300的更特别实例在图14中看作过程1400。过程1400在对于多个tj的每个(时间=tj,j=1-2)获取两个数据集(i)FDG-PET数据集(PETn j,j=1,2)和(ii)MRI数据集(MRIn j,j=1,2)的步骤1402中开始,其中两个数据集从多个人类受检者(On,n=1-N)获取。在步骤1404中,在t1和t2之间在人类受检者On的每个上实施治疗(例如,假设减慢人类衰老过程的饮食)(情况a),或者在t1和t2之间在人类受检者On的子集上(情况b)。在步骤1406中,对于分别两个数据集(i)FDG-PET数据集(PETn j,j=1,2)和(ii)MRI数据集(MRIn j,j=1,2)寻找FDG-PET和MRI之间的链接,其中FDG-PET数据集(PETn j)和MRI数据集(MRIn j)被集中到来自全部各个人类受检者的复合数据集中。在步骤1408中,将tj处FDG-PET与MRI之间链接的指数简化成单个数值评定。在步骤1410中,使用单个数值评定来评定在人类受检者(On,n=1-N)上从时间t1到时间t2的治疗效果(情况a),其中评定表示在N个人类受检者的子集与剩余人类受检者之间不同治疗效果的测量(情况a),或者评定表示与不接收治疗的控制组相比较的治疗效果的测量(情况b)。
虽然已经显示和描述了本发明的优选实施方案,本领域技术人员可以对其做修改而不背离本发明的本质和讲授。这里描述的实施方案仅是实例而不是限制。方法和任何装置的许多变化和修改是可能的并且在本发明的范围内。本领域技术人员将认识到,刚刚描述的过程可以容易地添加、去除或修改步骤而不背离本发明的原理。因此,保护范围并不局限于这里描述的实施方案,而是由下面的权利要求所限制,其范围将包括权利要求的主旨的所有等价物。
附录
A:迭代乘幂算法代码,与MATLAB svds.m相比较
下面给出与MATLAB例程svds.m相比较的使用乘幂算法的SVD计算的MATLAB代码。注意,实例乘幂算法代码和svds.m需要整个矩阵在内存中。在我们的PLS分析中实现乘幂算法时,所有矩阵乘向量,向量乘标量乘法通过一次读入一个子矩阵来完成。
使用乘幂的SVD计算的MATLAB代码:
m=1000;n=1000;%矩阵的x和y维(你可以改变)
l=1;%为了说明,仅一个奇异值
A=randn(m,n);%随机产生的测试矩阵
epsilon=1.0e-9;%收敛
numlte=5000;%迭代次数
%下面乘幂算法:
u=randn(m,1);v=randn(n,1);%用于迭代的初始值
d=zeros(l);sigma=u′*A*v;
for k=1:numlte;
z=u;u=A*v;u=u/norm(u,2);v=A′*z;
v=v/norm(v,2);sigma=u′*A*v;
error=norm(A*v-sigma*u,2);
if sigma<0;u=-u;sigma=-sigma;end;%我自己的加法
if rem(k,100)==0;
disp(sprintf(′%5d%9.7f%7.4f′,k,error,sigma));
end;
if error<epsilon;break;end;
end
sigma=u′*A*v;norm(A*v-sigma*u,2);
norm(A′*u-sigma*v,2);%开玩笑地复制:-)
[q,sig,r]=svds(A,2);%matlab的常规SVD
%将乘幂结果与常规SVD相比较
if exist(′h1′)~=1;h1=figure;h2=figure;
set(h1,′unit′,′centimeters′);set(h1,′pos′,[2 12 15 10]);
set(h2,′unit′,′centimeters′);set(h2,′pos′,[18 12 15 10]);
set(h1,′unit′,′pixels′);set(h2,′unit′,′pixels′);end;
figure(h1);
%linrfit(u,q(:,1));title(′u against q′);%我自己使用
if(q(1,1)-q(100,1))/(u(1)-u(100))<0;
plot(u,-q(:,1));title(′u against q′);
else;plot(u,q(:,1),′o′);title(′u against q′);end;
figure(h2);
%linrfit(v,r(:,1));title(′v against r′);%我自己使用
if(r(1,1)-r(100,1))/(v(1)-v(100))<0;
plot(v,-r(:,1),′o′);title(′v against r′);%45度线?
else;plot(v,r(:,1),′o′);title(′v against r′);end;
disp(sprintf(′%7.4f%7.4f′,sigma,sig(1,1)));
B:Monte-Carlo仿真摘要
下面的摘要在2004年6月的核医学年会上提出。它报告了我们在对于考虑多次比较的神经影像研究的一些新提出的指数,研制I型错误和统计力计算的Monte-Carlo仿真程序方面的努力。这里描述的该摘要并不专门为PLS设计,但是可以容易地适用于PLS。
用于统计力计算的Monte-Carlo仿真程序包,与神经影像研究相关联的各种全局指数的家族I型错误,Kewei Chen,Ph.D Eric M.Reiman,MD,Gene E.Alexander,Ph.D,Richard D.Gerkin,MD,MS,Daniel Bandy,MS,正电子发射断层显像中心,BannerGood Samaritan医疗中心,Phoenix,Arizona;数学和统计学系,Arizona州立大学;放射学和精神病学系,Arizona大学;心理学系,Arizona州立大学;以及Arizona Alzheimer研究中心和Alzheimer疾病核心中心,Phoenix,Arizona,USA。
引言:为了说明神经影像研究中的家族I型错误,已经成功地应用各种方法。再次回顾Monte-Carlo概念,我们开发了引入指示脑功能变化的各种新的全局指数的这种仿真程序包。
方法:程序包描述:考虑各种试验设计在MNI空间上执行仿真。总体上表征统计参数图,引入与‘缺乏去激励’和绘图直方图形状或对称等的结合有关的各种新的全局指数。这些指数可以用作关于研究假设的激励指数,并且还没有实现其I型错误理论计算(精确或近似的)。全局指数的一个实例是脑量上t分数的正最大值与(绝对)负最大值的比值。另一个是峰度。另外,程序包可以计算研究专用(不通用)观察的I型错误,例如左/右对称激励(不对称测试),或者仅在脑下区域内出现的激励(该子区域内至少一个体素在高度阈值u之上,并且该区域外没有体素高于u1(<<u))。当需要时(小样本尺寸,低平滑度等),该程序包也有助于检查基于随机域定理(RFT)的p值。最后,该程序包可以执行考虑多次比较的统计力分析。实例数据:使用在右手运动的研究中来自7个受检者的氧15水PET数据,以说明该计算机程序包的使用和那些全局指数的灵敏度。
结果:使用与实例PET数据集的SPM分析完全相同的设置,检查作为自由度(DF)函数的p=0.05处的显著阈值。发现,例如,绘图直方图的峰度的阈值是DF的递减函数,并且表现非常像(3*DF-6)/(DF-4)加上常数。为了测试程序包的能力计算的能力,对于一组中32个受检者而另一组中30个受检者的两个样本的t测试,将分别5,10和15%的最大作用大小引入到具有空间方差的丘脑区。校正多次比较,统计力分别计算为12,68和98%。对于实例PET数据集,发现程序包与基于RFT的方法同样好地或比基于RFT的方法更好地执行。没有幸存RFT校正的p=0.05的假设丘脑激励由提出的指数的几种检测,事后。
结论:全局特征和仿真程序包提供评价神经影像研究的精确I型错误/统计力的备选方法。
C:备选MBPLS的初步结果
如在研究计划部分陈述的,我们假设存在m个数据集,X1,X2,…,Xm。tk是表示Xk(k=1,2,…,m)的潜在变量,tk=∑wi (k)xi (k),其中xi (k)是矩阵Xk的第i列并且wi (k)是(单位标准的)相应权重。在该初步研究中,我们为计算潜在变量测试下面的目标函数:max(mink<l(cov(tk ,tl)))。MATLAB fmincon用来优化用于使用约束‖tk‖=1获得MBPLS解的该目标函数。在该测试中,我们使用m=5,变量数目分别对于数据块1-2是[10 15 8 20 15]。测量数目是200。多变量高斯随机数为零向量作为平均值并且任意正定矩阵(对角元素全等于一)作为协方差矩阵的总体上五个数据集而产生。一旦产生数据集,具有新定义的目标函数的MBPLS程序运行50次,每次使用不同的初始值(随机产生)。
从该初步数值仿真程序中,我们具有下面的结论(参看图1):
I.存在性:如图1中看到的,存在对于所有可能对具有非常强链接(定义为协方差)的tk′s。例如,数据块1和2之间的相关系数是0.944(第一子图)。事实上,成对相关系数中最小绝对值是0.929(数据块1和3之间)。此外,通过使用不同数目的数据块和每个数据块中不同数目的变量重复整个程序许多次来证明存在性。
II.条件唯一性:实际上,上面给出的目标函数不保证唯一解。这被证明,即给定不同初始值时优化过程收敛到不同的解。事实上,部分唯一性存在,因为对于1<m1<m,m1tk′s是唯一的(不管初始值),并且剩余的m-m1tk′s不唯一。为了使得解唯一,对于m-m1个数据块提出另外的约束。假设A是为具有唯一的tk′s的数据块和Θ不具有唯一的tk′s的数据块而设置的指数。优化程序是现在以最大化:
mink<l,k,l∈ΛΘ(abs(cov(tk,tl)))+mink∈Θvar(tk)。
假设在许多次运行的每次使用不同的初始值(随机选择),我们观察到优化程序一致地收敛到唯一解。
注意,当m=2时,该程序的解相当于普通DBPLS的第一潜在对。
III.经由其他算法的PLS实现
常规PLS实现中的核心复杂度在于对于Ω的潜在变量u和v的特征向量的计算。到此为止,已经研究出许多特征减小方法,包括Gauss-Jacobi迭代,QR减小,Arnoldi迭代,Lanczos迭代和乘幂算法,仅列出一些。我们灌输的乘幂迭代算法是子矩阵方法,因为矩阵尺寸提出另外的约束。每种方法具有它自己的优点和问题。在我们的分析中,我们计划探索乘幂和QR算法。在乘幂方法中,需要计算特征值的矩阵乘以起始矢量,直到获得接近于特征值的收敛。收敛速度取决于第二大特征值。因为乘幂迭代涉及重复的矩阵-矢量乘积,这容易对稠密或稀疏矩阵并行实现。虽然QR算法已经显示可称于并行计算机,我们的目标是将矩阵划分成较小的单元并且使用QR算法在节点处理器上计算,关于该实现的回顾完整归档[1,2,3]。以最简单的形式,QR方法的每次迭代需要O(n3)。如果矩阵是Hessenberg形式,它减小到O(n2),或者如果对称矩阵是三对角形式,减小到O(n)。初步减小由辅助或给定变化完成。
除了QR之外,我们也将评价Rayleigh商的使用。假设X-Y协方差矩阵是Cxy,定义Rayleigh商的矩阵A和B分别是
B=I,其中I是与矩阵A具有相同尺寸的单位矩阵。Rayleigh商定义为
已知[6]函数r(u)的全局最大点u对应于
其中w和c是DBPLS解,或者第一奇异图像对(并且μx和μy是标量使得‖u‖=ρ,t和u之间的协方差如背景和重要性部分中的DBPLS算法中一样定义)。在运行上,不需要提前形成矩阵A,Cxy或Cyx(其大量需要内存)。代替地或等价地,我们提出矢量u′X和Yu可以在每个迭代步骤中快速地形成。
编号的参考文献:
1.Abdi H(2003)Partial Least Squares(PLS)Regression.In:Encyclopedia for research methods for the social sciences(Lewis-BeakM et al.,eds),Thousand Oaks(CA):Sage,
2.Alexander G et al.(2001)Regional reductions in gray matterdensity in cognitively normal apolipoprotein E e-4 homozygotes andheterozygotes using voxel-based MRI morphometry.1st Annualmeeting of Society for neuroscience,Nov.10-15,2001,San Diego.
3.Alexander GE,moeller J(1994)Application of the scaledsubprofile model to functional imaging in neuropsychiatric disorders:A principal component approach to modeling brain function indisease.Human Brain Mapping 2:79-94
4.Alexander GE et al.(2002)Longitudinal PET Evaluation ofCerebral Metabolic Decline in Dementia:A Potential OutcomeMeasure in Alzheimer’s Disease Treatment Studies.Am.J.Psychiatry159:738-745
5.Alexander G,Moeller J(1994)Application of the ScaledSubprofile model:a statistical approach to the analysis of functionalpatterns in neuropsychiatric disorders:A principal componentapproach to modeling regional patterns of brain function in disease.Human Brain Mapping 79-94
6.Anderson ND et al.(2000)The effects of divided attention onencoding- and retrieval-related brain activity:A PET study ofyounger and older adults.J.Cogn Neurosci.12:775-792
7.Arfanakis K et al.(2000)Combining independent componentanalysis and correlation analysis to probe interregional connectivityin fMRI task activation datasets.Magn Reson.Imaging 18:921-930
8.Beckmann CF,Smith SM(2004)Probabilistic independentcomponent analysis for functional magnetic resonance imaging.IEEETrans.Med.Imaging 23:137-152
9.Calhoun VD et al.(2001)Spatial and temporal independentcomponent analysis of functional MRI data containing a pair of task-related waveforms.Hum.Brain Mapp.13:43-53
10.Calhoun VD et al.(2003)Latency(in)sensitive ICA.Groupindependent component analysis of fMRI data in the temporalfrequency domain.Neuroimage.20:1661-1669
11.Chau W et al.(2004)Multi-modality imaging data analysiswith partial least squares.Brain and Cognition 54:140-142
12.Chen H et al.(2002)[A method based on independentcomponent analysis for processing fMRI data].Sheng Wu Yi.Xue.Gong.Cheng Xue.Za Zhi.19:64-66
13.Chen K et al.(2003)Linking Functional and StructuralBrain Images with Multivariate Network Analysis:Description andPreliminary Application Using the Partial Least Square Method.World Congress on Medical Physics and Biomedical Engineering,Sydney,2003
14.Chen K et al.(1998)Noninvasive quantification of thecerebral metabolic rate for glucose using positron emissiontomography,18F-fluoro-2-deoxyglucose,the Patlak method,and animage-derived input function.J.Cereb.Blood flow Metab 18:716-723
15.Duann JR et al.(2002)Single-trial Variability in event-related BOLD signals.Neuroimage 15:823-835
16.Esbensen K et al.(2004)Fermentation monitoring usingmultisensor systems:feasibility study of the electronic tongue.Anal.Bioanal.Chem.378:391-395
17.Esposito F et al.(2003)Real-time independent componentanalysis of fMRI time-series.Neuroimage.20:2209-2224
18.Friston KJ(1994)Functional and effective connectivity:Asynthesis.Human Brain Mapping 2:56-78
19.Friston KJ et al.(2003)Dynamic causal modeling.Neuroimage.19:1273-1302
20.Gerlach RW,Kowalski BR(1979)Partial least squares pathmodeling with latent variables.Anal.Chim.Acta 112:417-421
21.Golub G,Van Loan C(1989)Matrix Computations,Baltimore,The Johns Hopkins University Press;
22.Habib R et al.(2003)Memory encoding and hippocampally-based novelty/familiarity discrimination networks.Neuropsychologia41:271-279
23.Hammers A et al.(2002)Implementation and application ofa brain template for multiple volumes of interest.Hum.Brain.Mapp.15:165-174
24.Horwitz B(1991)Functional Interactions in the Brain:Useof Correlations Between Regional Metabolic Rates.Journal ofCerebral Blood Flow and Metabolism 11:A114-A120
25.Horwitz B et al.(1995)Network analysis of PET-mappedvisual pathways in Alzheimer type dementia.Neuroreport 6:2287-2292
26.Horwitz B et al.(1999)Neural modeling,functional brainimaging,and cognition.Trends Cogn Sci.3:91-98
27.Hskuldsson A(2004)PLS Regression and the Covariance.Chemometricshttp://www.acc.umu.se/~tokitg/Chemometrics/Editorial:
28.Hwang D et al.(2004)Inverse modeling using multi-blockPLS to determine the environmental conditions that provide optimalcellular function.Bioinformatics.20:487-499
29.Hyvarien A et al.(2001)Independent Component Analysis,New York,John Wiley & Sons,Inc,
30.Ibanez V et al.(1998)Regional glucose metabolicabnormalities are not the results of atrophy in Alzheimer’s disease.Neurology 50:1585-1593
31.Iidaka T et al.(2000)The effect of divided attention onencoding and retrieval in episodic memory revealed by positronemission tomography.J.Cogn Neurosci.12:267-280
32.Keightley ML et al.(2003)An fMRI study investigatingcognitive modulation of brain regions associated with emotionalprocessing of visual stimuli.Neuropsychologia 41:585-596
33.Klunk WE et al.(2004)Imaging brain amyloid inAlzheimer’s disease with Pittsburgh Compound-B.Ann.Neurol.55:306-319
34.Lin FH et al.(2003)Multivariate analysis of neuronalinteractions in the generalized partial least squares framework:simulations and empirical studies.Neuroimage.20:625-642
35.Lobaugh NJ et al.(2001)Spatiotemporal analysis ofexperimental differences in event-related potential data with partialleast squares.Psychophysiology 38:517-530
36.Lopes JA et al.(2002)Multiblock PLS analysis of anindustrial pharmaceutical process.Biotechnol.Bioeng.80:419-427
37.McIntosh AR(1998)Understanding neural interactions inlearning and memory using functional neuroimaging.Ann.N.Y.Acad.Sci.855:556-571
38.McIntosh AR(1999)Mapping cognition to the brainthrough neural interactions.Memory.7:523-548
39.McIntosh AR et al.(1996)Spatial pattern analysis offunctional brain images using partial least squares.Neuroimage.3:143-157
40.McIntosh AR,Gonzalez-Lima F(1994)Structural equationmodeling and its application to network analysis in functional brainimaging.Human Brain Mapping.2-22
41.McIntosh AR et al.(1999)Recruitment of unique neuralsystems to support visual memory in normal aging.Curr.Biol.9:1275-1278
42.McKeown MJ et al.(1998)analysis of fMRI data by blindseparation into independent spatial components.Hum.Brain Mapp.6:160-188
43.Minoshima S et al.(1995)A diagnostic approach inAlzheimer’s disease using three-dimensional stereotactic surfaceprojections of fluorine-18-FDG PET.J.Nucl.Med.36:1238-1248
44.Moritz CH et al.(2000)Whole-brain functional MRimaging activation from a finger-tapping task examined withindependent component analysis.AJNR Am.J.Neuroradial.21:1629-1635
45.Nestor PG et al.(2002)A new statistical method for testinghypotheses of neuropsychological/MRI relationships in schizophrenia:partial least squares analysis.Schizophr.Res.53:57-66
46.O′Donnell BF et al.(1999)Identification of neural circuitsunderlying P300 abnormalities in schizophrenia.Psychophysiology36:388-398
47.Pietrini P et al.(1998)Abnormal metabolic patterns inAlzheimer’s disease after correction for partial volume effects.Neurology 1585-1593
48.Rajah MN et al.(1999)Frontotemporal interactions in faceencoding and recognition.Brain Res.Cogn Brain Res.8:259-269
49.Reiman EM et al.(2001)Declining brain activity incognitively normal apolipoprotein E epsilon 4 heterozygotes:Afoundation for using positron emission tomography to efficiently testtreatments to prevent Alzheimer’s disease.Proc.Natl.Acad.Sci.U.S.A 98:3334-3339
50.Reiman EM et al.(1996)Preclinical evidence of Alzheimer’sdisease in persons homozygous for the epsilon 4 allele forapolipoprotein E N.Engl.J.Med.334:752-758
51.Reiman EM et al.(2004)Functional brain abnormalities inyoung adults at genetic risk for late-onset Alzheimer’s dementia.Proc.Natl.Acad.Sci.U.S.A 101:284-289
52.Schmithorst VJ,Holland SK(2004)Comparison of threemethods for generating group statistical inferences from independentcomponent analysis of functional magnetic resonance imaging data.J.Magn Reson.Imaging 19:365-368
53.Shoghi-Jadid K et al.(2002)Localization of neurofibrillarytangles and beta-amyloid plaques in the brains of living patients withAlzheimer disease.Am J Geriatr Psychiatry 10:24-35
54.Silverman D et al.(2001)Positron Emission Tomography inEvaluation of Dementia Regional Brain Metabolism and Long-termOutcome.JAMA 286:2120-2127
55.Westerhuis JA,Smilde AK(2001)Deflation in multiblockPLS.Journal of Chemometrics 15:485-493
56.Worsley KJ et al.(1997)Characterizing the response ofPET and fMRI data using multivariate linear models.Neuroimage.6:305-319.
字母参考文献
A.Alexander,G,Moeller J 1994.Application of the ScaledSubprofile model:a statistical approach to the analysis of functionalpatterns in neuropsychiatric disorders:A principal componentapproach to modeling regional patterns of brain function in disease.Human Brain Mapping 79-94.
B.Anderson,N.D.,Iidaka,T.Cabeza,R.,Kapur,S.,McIntoch,A.R.,and Craik,F.I.2000.The effects of divided attention onencoding- and retrieval-related brain activity:A PET study ofyounger and older adults.J.Cogn Neurosci.12:775-792.
C.Ashbumer,J.and Friston,K.1997.Multimodal imagecoregistration and partitioning--a unified framework.Neuroimage.6:209-217.
D.*Borga,M.,Landelius,T.,and Knutsson,H.1997.A unifiedapproach to PCA,PLS,MLR and CCA.Report LiTH-ISY-R-1002,ISY,SE-58183.
E.Calhoun,V.D.,Adali,T.,Pearlson,G.D.,and Pekar,J.J.2001.Spatial and temporal independent component analysis offunctional MRI data containing a pair of task-related waveforms.Hum.Brain Mapp.13:43-53.
F.Calhoun,V.D.,Adali,T.,Pekar,J.J.,and Pearlson,G.D.2003.Latency (in)sensitive ICA.Group independent componentanalysis of fMRI data in the temporal frequency domain.Neuroimage.20:1661-1669.
G.Chen,H.,Yao,D.,Zhou,K.,Zhou,T.,Zhuo,Y.,and Chen,L.2002.[A method based on independent component analysis forprocessing fMRI data].Sheng Wu Yi.Xue.Gong.Cheng Xue.Za Zhi.19:64-66.
H.Chen,K.,Bandy,D.,Reiman,E.,Huang,S.C.,Lawson,M.,Feng,D.,Yun,L.S.,and Palant,A.1998.Noninvasive quantificationof the cerebral metabolic rate for glucose using positron emissiontomography,18F-fluoro-2-deoxyglucose,the Patlak method,and animage-derived input function.J.Cereb.Blood flow Metab 18:716-723.
I.DeCarli,C.,Murphy,D.G.,Gillette,J.A.,Haxby,J.V.,Teichberg,D.,Schapiro,M.B.,and Horwitz,B.1994.Lack of age-related differences in temporal lobe volume of very healthy adults.AJNR Am.J.Neuroradioal.15:689-696.
J.Esposito,F.,Seifritz,E.,Formisano,E.,Morrone,R.,Scarabino,T.,Tedeschi,G.,Cirillo,S.,Goebel,R.,and Di Salle,F.2003.Real-time independent component analysis of fMRI time-series.Neuroimage.20:2209-2224.
K.Friston,K.J.1994.Functional and effective connectivity:Asynthesis.Human Brain Mapping 2:56-78.
L.Friston,K.J.,Harrison,L.,and Penny,W.2003.Dynamiccausal modeling.Neuroimage.19:1273-1302.
M.Colomb,J.,Kluger,A.,de Leon,M.J.,Ferris,S.H.,Convit,A.,Mittelman,M.S.,Cohen,J.,Rusinek,H.,De,S.S.,and George,A.E.1994.Hippocampal formation size in normal human aging:acorrelate of delayed secondary memory performance.Learn.Mem.1:45-54.
N.Golub,GH and Van Loan,CF.1989.Matrix Computations.The Johns Hopkins University Press;Baltimore
O.Good,C.D.,Johnsrude,I.S.,Ashburner,J.,Henson,R.N.,Friston,K.J.,and Frackowiak,R.S.2001.A voxel-basedmorphometric study of ageing in 465 normal adult human brains.Neuroimage.14:21-36.
P.Habib,R.,McIntosh,A.R.,Wheeler,M.A.,and Tulving,E.2003.Memory encoding and hippocampally-based novelty/familiaritydiscrimination networks.Neuropsychologia 41:271-279.
Q.Hoegaerts,L.,Suykens,J.A.K.,Vandewalle,J.,and DeMoor,B.2003.Kernel PLS variants for regression.Proc of the 11thEuropean Symposium on Artificial Neural Networks 203-208.
R.Horwitz,B.1991.Functional Interactions in the Brain:Useof Correlations Between Regional Metabolic Rates.Journal ofCerebral Blood Flow and Metabolism 11:A114-A120.
S.Horwitz,B.,McIntosh,A.R.,Haxby,J.V.,Furey,M.,Salerno,J.A.,Schapiro,M.B.,Rapoport,S.I.,and Grady,C.L.1995.Networkanalysis of PET-mapped visual pathways in Alzheimer type dementia.Neuroreport 6:2287-2292.
T.Horwitz,B.,Tagamets,M.A.,and McIntosh,A.R.1999.Neural modeling,functional brain imaging,and cognition.TrendsCogn Sci.3:91-98.
U.Iidaka,T.,Anderson,N.D.,Kapur,S.,Cabeza,R.,and Craik,F.I.2000.The effect of divided attention on encoding and retrieval inepisodic memory revealed by positron emission tomography.J.CognNeurosci.12:267-280.
V.Jernigan,T.L.,Archibald,S.L.,Berhow,M.T.,Sowell,E.R.,Foster,D.S.,and Hesselink,J.R.1991.Cerebral structure on MRI,Part I:Localization of age-related changes.Biol.Psychiatry 29:55-67.
W.Keightley,M.L.,Winocur,G.,Graham,S.J.,Mayberg,H.S.,Hevenor,S.J.,and Grady,C.K.2003.An fMRI study investigatingcognitive modulation of brain regions associated with emotionalprocessing of visual stimuli.Neuropsychologia 41:585-596.
X.Kiebel,S.J.,Ashburner,J.,Poline,J.B.,and Friston,K.J.1997.MRI and PET coregistration-a cross validation of statisticalparametric mapping and automated image registration.Neuroimage.5:271-279.
Y.Klunk,W.E.,Engler,H.,Nordberg,A.,Wang,Y.,Blomqvist,G.,Holt,D.P.,Bergstrom,M.,Savitcheva,I.,Huang,G.F.,Estrada,S.,Ausen,B.,Debnath,M.L.,Barletta,J.,Price,J.C.,Sandell,J.,Lopresti,B.J.,Wall,A.,Koivisto,P.,Antoni,G.,Mathis,C.A.,andLangstrom,B.2004.Imaging brain amyloid in Alzheimer’s diseasewith Pittsburgh Compound-B.Annals of Neurology 55:306-319.
Z.Lin,F.H.,McIntosh,A.R.,Agnew,J.A.,Eden,G.F.,Zeffiro, T.A.,and Belliveau,J.W.2003.Multivariate analysis of neuronalinteractions in the generalized partial least squares framework:simulations and empirical studies.Neuroimage.20:625-642.
AA.Lobaugh,N.J.West,R.,and McIntosh,A.R.2001.Spatiotemporal analysis of experimental differences in event-relatedpotential data with partial least squares.Psychophysiology 38:517-530.
BB.Loessner,A.,Alavi,A.,Lewandrowski,K.U.,Mozley,D.,Souder,E.,and Cur,R.E.1995.Regional cerebral functiondetermined by FDG-PET in healthy volunteers:normal patterns andchanges with age.J.Nucl.Med.36:1141-1149.
CC.Lopes,J.A.,Menezes,J.C.,Westerhuis,J.A.,and Smilde,A.K.2002.Multiblock PLS analysis of an industrial pharmaceuticalprocess.Biotechnol.Bioeng.80:419-427.
DD.McIntosh,A.R.1999.Mapping cognition to the brainthrough neural interactions.Memory.7:523-548.
EE.McIntosh,A.R.1998.Understanding neural interactions inlearning and memory using functional neuroimaging.Annals of theNew York Academy of Sciences 855:556-571.
FF.McIntosh,A.R.,Bookstein,F.L.,Haxby,J.V.,and Gardy,C.L.1996.Spatial pattern analysis of functional brain images usingpartial least squares.Neuroimage.3:143-157.
GG.McIntosh,A.R.and Gonzalez-Lima,F.1994.Structuralequation modeling and its application to network analysis infunctional brain imaging.Human Brain Mapping.2-22.
HH.McIntosh,A.R.,Sekuler,A.B.,Penpeci,C.,Rajah,M.N.,Grady,C.L.,Sekuler,R.,and Bennett,P.J.1999.Recruitment ofunique neural systems to suppoft visual memory in normal aging.Curr.Biol.9:1275-1278.
II.McKeown,M.J.,Makeig,S.,Brown,G.G.,Jung,T.P.,Kindermann,S.S.,Bell,A.J.,and Sejnowski,T.J.1998.analysis offMRI data by blind separation into independent spatial components.Hum.Brain Mapp.6:160-188.
JJ.Meltzer,C.C.,Cantwell,M.N.,Greer,P.J.,Ben-Eliezer,D.,Smith,G.,Frank,G.,Kaye,W.H.,Houck,P.R.,and Price,J.C.2000.Does cerebral blood flow decline in healthy aging?A PET study withpartial-volume correction.J.Nucl.Med.41:1842-1848.
KK.Moeller,J.R.,Strother,S.C.,Sidtis,J.J.,and Rottenberg,D.A.1987.Scaled subprofile model:a statistical approach to theanalysis of functional patterns in positron emission tomographic data.J.Cereb.Blood Flow Metab 7:649-658.
LL.Moritz,C.H.,Haughton,V.M.,Cordes,D.,Quigley,M.,and Meyerand,M.E.2000.Whole-brain functional MR imagingactivation from a finger-tapping task examined with independentcomponent analysis.AJNR Am.J.Neuroradial.21:1629-1635.
MM.Murphy,D.G.,DeCarli,C.,Schapiro,M.B.,Rapoport,S.I.,and Horwitz,B.1992.Age-related differences in volumes ofsubcortical nuclei,brain matter,and cerebrospinal fluid in healthymen as measured with magnetic resonance imaging.Arch.Neurol.49:839-845.
NN.Nestor,P.G.,O′Donnell,B.F.,McCarley,R.W.,Niznikiewicz,M.,Barnard,J.,Jen,S.Z.,Bookstein,F.L.,and Shenton,M.E.2002.A new statistical method for testing hypotheses ofneuropsychological/MRI relationships in schizophrenia:partial leastsquares analysis.Schizophr.Res.53:57-66.
OO.O′Donnell,B.F.,McCarley,R.W.,Potts,G.F.,Salisbury,D.F.,Nestor,P.G.,Hirayasu,Y.,Niznikiewicz,M.A.,Barnard,J.,Shen,Z.J.,Weinstein,D.M.,Bookstein,F.L.,and Shenton,M.E.1999.Identification of neural circuits underlying P300 abnormalities inschizophrenia.Psychophysiology 36:388-398.
PP.Pietrini,P.,Alexander GE,and et al.1998.Abnormalmetabolic patterns in Alzheimer’s disease after correction for partialvolume effects.Neurology 1585-1593.
QQ.Press,WH,Vetterling,WT,Teukolsky,SA,and Flannery,BP,1992.Numerical Recipes in C The Art of Scientific computing.Press Syndicate of the University of Cambridge,New York
RR.Rajah,M.N.and McIntosh,A.R.2005.Overlap in thefunctional neural systems involved in semantic and episodic memoryretrieval.J.Cogn Neurosci.17:470-482.
SS.Rajah,M.N.,McIntosh,A.R.,and Grady,C.L.1999.Frontotemporal interactions in face encoding and recognition.BrainRes.Cogn Brain Res.8:259-269.
TT.Reiman,E.M.,Caselli,R.J.,Chen,K.,Alexander,G.E.,Bandy,D.,and Frost,J.2001.Declining brain activity in cognitivelynormal apolipoprotein E epsilon 4 heterozygotes:A foundation forusing positron emission tomography to efficiently test treatments toprevent Alzheimer’s disease.Proc.Natl.Acad.Sci.U.S.A 98:3334-3339.
UU.Reiman,E.M.,Caselli,R.J.,Yun,L.S.,Chen,K.,Bandy,D.,Minoshima,S.,Thibodeau,S.N.,and Osborne,D.1996.Preclinicalevidence of Alzheimer’s disease in persons homozygous for the epsilon4 allele for apolipoprotein E.New England Journal of Medicine.334:752-758.
VV.Reiman,E.M.,Chen,K.,Alexander,G.E.,Caselli,R.J.,Bandy,D.,Osborne,D.,Saunders,A.M.,and Hardy,J.2004.Functional brain abnormalities in young adults at genetic risk forlate-onset Alzheimer’s dementia.Proc.Natl.Acad.Sci.U.S.A 101:284-289.
WW.Salmon,E.,Maquet,P.,Sadzot,B.,Degueldre,C.,Lemaire,C.,and Franck,G.1991.Decrease of frontal metabolismdemonstrated by positron emission tomography in a population ofhealthy elderly volunteers.Acta Neurol.Belg.91:288-295.
XX.Schmithorst,V.J.and Holland,S.K.2004.Comparison ofthree methods for generating group statistical inferences fromindependent component analysis of functional magnetic resonanceimaging data.J.Magn Reson.Imaging 19:365-368.
YY.Shoghi-Jadid,K.,Small,G.W.,Agdeppa,E.D.,Kepe,V.,Ercoli,L.M.,Siddarth,P.,Read,S.,Satyamurthy,N.,Petric,A.,Huang,S.C.,and Barrio,J.R.2002.Localization of neurofibrillarytangles and beta-amyloid plaques in the brains of living patients withAlzheimer disease.Am J Geriatr Psychiatry 10:24-35.
ZZ.Westerhuis,J.A.,Coenegracht,P.M.J.,and Lerk,C.F.1997.Multivariate modeling of the tablet manufacturing process with wetgranulation for tablet optimization and in-process control.Int.J.Pharmaceut.156:109-117.
AAA.Westerhuis,J.A.,de Haan,P.,Zwinkels,J.,Jansen,W.T.,Coenegracht,P.M.J.,and Lerk,C.F.1996.Optimisation of thecomposition and production of mannitol/microcrystalline cellulosetablets.Int.J.Pharmaceut.143:151-162.
BBB.Westerhuis,J.A.and Smilde,A.K.2001.Deflation inmultiblock PLS.Journal of Chemometrics 15:485-493.
CCC.Worsley,K.J.,Poline,J.B.,Friston,K.J.,and Evans,A.C.1997.Characterizing the response of PET and fMRI data usingmultivariate linear models.Neuroimage.6:305-319.
Claims (32)
1.一种方法,包括:
从多个对象(On,n=1-N)的每个获取多个数据集(Di,i=1-I);
寻找Di和Dj之间的链接,其中Di和Dj不是相同的模态;
将链接简化成单个数值评定的表达式;以及
使用单个数值评定作为对象(On,n=1-N)之间的差异和相似性的目标、量化评定。
2.根据权利要求1的方法,其中多个数据集(Di,i=1-I)中的数据由影像模态或非影像模态获取。
3.根据权利要求0的方法,其中影像模态选自:
超声波;
PET,单光子发射断层显像放射性示踪剂,或者其他核医学程序;
结构、功能、灌注权重或扩散权重MRI;
x射线计算的断层显像;
N乙酰天冬氨酸、肌醇和其他化合物的磁共振光谱测量;
脑电图,定量脑电图,事件相关潜能和其他电生理学程序;
脑磁波图;
医学影像测量程序;以及
非医学影像测量程序。
4.根据权利要求0的方法,其中非影像模态选自:
一组生物化学测量;
一组分子测量;
一组遗传测量;
一组转录子测量;
一组蛋白质组测量;
一组认知测量或临床评级;
一组行为测量;以及
一组来自非医学非影像模态的测量。
5.根据权利要求1的方法,其中On选自制品、人体组织、人类体液;哺乳动物或其一部分,以及植物或其一部分。
6.根据权利要求1的方法,其中每个数据集On中的数据是选自性能方面、身体特性和外观测量的指数集。
7.根据权利要求1的方法,其中Di和Dj之间的链接使用偏最小二乘(PLS)寻找。
8.根据权利要求7的方法,其中PLS选自双分块(DB)PLS和多分块(MB)PLS。
9.根据权利要求1的方法,其中Di和Dj之间的链接使用SEM间或ICA间寻找。
10.一种计算机可读介质,包含当由计算机执行时实行根据权利要求1的方法的指令。
11.一种方法,包括:
在多个人类受检者(On,n=1-N)的每个上获取两个FDG-PET(PETn)和MRI(MRIn)数据集;
寻找FDG-PET和MRI之间的链接,其中FDG-PET和MRI是来自全部人类受检者的集中数据集;
将FDG-PET与MRI之间的链接简化成单个数值评定的表达式;以及
使用单个数值评定作为人类受检者之间的差异和相似性的目标、量化评定。
12.根据权利要求11的方法,其中
人类受检者(On,n=1-N)划分成组;以及
单个数值评定用作人类受检者的每个所述组之间的差异和相似性的目标、量化评定。
13.根据权利要求11的方法,其中FDG-PET和MRI之间的链接使用偏最小二乘(PLS)寻找。
14.根据权利要求13的方法,其中PLS选自双分块(DB)PLS和多分块(MB)PLS。
15.一种计算机可读介质,包含当由计算机执行时实行根据权利要求11的方法的指令。
16.一种方法,包括:
在多个tj的每个(时间=tj,j=1-2),对于多个对象(On,n=1-N)的每个获取多个数据集(Di j,i=1-I,j=1,2);
在t1和t2之间对于对象On的每个实施治疗;
寻找tj处Di1 j和Di2 j之间的链接,其中Di1 j和Di2 j不是相同的模态;
将tj处的链接简化成单个数值评定的表达式;以及
使用单个数值评定来评定对对象(On,n=1-N)从时间t1到时间t2的治疗效果。
17.根据权利要求16的方法,其中链接使用偏最小二乘(PLS)寻找。
18.根据权利要求17的方法,其中PLS选自双分块(DB)PLS和多分块(MB)PLS。
19.根据权利要求16的方法,其中多个数据集(Di j,i=1-I,j=1,2)中的数据由影像模态或非影像模态获取。
20.根据权利要求19的方法,其中影像模态选自:
超声波;
不同的PET和单光子发射断层显像放射性示踪剂方法;
结构、功能、灌注权重或扩散权重MRI;
x射线计算的断层显像;
N乙酰天冬氨酸、肌醇和其他化合物的磁共振光谱测量;
脑电图,定量脑电图,事件相关潜能和其他电生理学程序;以及
脑磁波图。
21.根据权利要求19的方法,其中非影像模态选自:
生物化学测量;
分子测量;
转录子测量;
蛋白质组测量;
认知测量;以及
行为测量。
22.根据权利要求16的方法,其中On选自制品、哺乳动物、人体组织以及人类体液。
23.根据权利要求16的方法,其中每个数据集On中的数据是选自性能方面、身体特性和外观测量的指数集。
24.一种计算机可读介质,包含当由计算机执行时实行根据权利要求16的方法的指令。
25.一种方法,包括:
在多个tj的每个(时间=tj,j=1-2),在多个人类受检者(On,n=1-N)的每个上获取两个FDG-PET和MRI数据集(PETn j和MRIn j,j=1,2);
在t1和t2之间在人类受检者On的每个上实施减慢脑衰老方面的假定治疗;
寻找tj处FDG-PET和MRI之间的链接,其中FDG-PET和MRI是来自全部人类受检者的集中数据集;
将tj处FDG-PET和MRI之间链接的指数简化成单个数值评定的表达式;以及
使用单个数值评定以评定对人类受检者(On,n=1-N)从时间t1到时间t2的治疗效果。
26.根据权利要求25的方法,其中
人类受检者(On,n=1-N)划分成子集;以及
单个数值评定用作人类受检者的每个所述子集之间的差异和相似性的目标、量化评定。
27.根据权利要求25的方法,其中
人类受检者(On,n=1-N)划分成子集;以及
单个数值评定用作下列人类受检者之间的差异和相似性的目标、量化评定:
对其实施减慢衰老过程的治疗的人类受检者;以及
没有对其实施减慢衰老过程的治疗的人类受检者。
28.根据权利要求25的方法,其中FDG-PET和MRI之间的链接使用偏最小二乘(PLS)寻找。
29.根据权利要求28的方法,其中PLS选自双分块(DB)PLS和多分块(MB)PLS。
30.根据权利要求25的方法,其中减慢脑衰老方面的假定治疗选自药理学处方、非处方药、免疫疗法、生物学疗法、膳食补充、膳食变化、体育锻炼、智力体操、为了促进健康生活的生活方式变化、为了促进健康心理机能的生活方式变化、为了减小心血管疾病风险的生活方式变化,以及前述的组合。
31.根据权利要求25的方法,其中
人类受检者(On,n=1-N)划分成组;以及
单个数值评定用作人类受检者的每个所述组之间的差异和相似性的目标、量化评定。
32.一种计算机可读介质,包含当由计算机执行时实行根据权利要求25的方法的指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US61576704P | 2004-10-04 | 2004-10-04 | |
US60/615,767 | 2004-10-04 | ||
US11/242,820 | 2005-10-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101068498A true CN101068498A (zh) | 2007-11-07 |
Family
ID=38880855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200580041489 Pending CN101068498A (zh) | 2004-10-04 | 2005-10-04 | 链接来自多模态数据集的图案的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101068498A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102177519A (zh) * | 2008-10-10 | 2011-09-07 | 皇家飞利浦电子股份有限公司 | 健康风险度量的确定和/或呈现 |
CN104093354A (zh) * | 2011-12-15 | 2014-10-08 | 联邦科学与工业研究组织 | 用于评估医学图像的方法和设备 |
CN105263416A (zh) * | 2013-06-07 | 2016-01-20 | 皇家飞利浦有限公司 | 基于皮质分布图的淀粉样蛋白pet脑扫描量化 |
CN106923854A (zh) * | 2017-03-21 | 2017-07-07 | 泰山医学院 | 一种适用于pet/ct的综合质控体模 |
CN106951064A (zh) * | 2016-11-22 | 2017-07-14 | 西安交通大学 | 引入对象连续动作的稳态视觉诱发范式设计及辨识方法 |
CN107209945A (zh) * | 2014-12-10 | 2017-09-26 | 皇家飞利浦有限公司 | 使用机器学习的用于医学成像的转化的系统和方法 |
CN107851098A (zh) * | 2015-05-28 | 2018-03-27 | 慧与发展有限责任合伙企业 | 链接数据集 |
CN109214325A (zh) * | 2018-08-28 | 2019-01-15 | 天津大学 | 一种基于空间滤波与模版匹配的运动相关电位检测方法 |
CN109700458A (zh) * | 2019-01-14 | 2019-05-03 | 广西医科大学第一附属医院 | 一种eeg脑功能网络构建方法、装置及存储介质 |
CN110710973A (zh) * | 2015-09-15 | 2020-01-21 | 西门子医疗有限公司 | 用于多对比度脑磁共振数据中异常检测的框架 |
US10963757B2 (en) | 2018-12-14 | 2021-03-30 | Industrial Technology Research Institute | Neural network model fusion method and electronic device using the same |
CN113435209A (zh) * | 2021-06-24 | 2021-09-24 | 台州师同人信息技术有限公司 | 基于共享实验室平台的数据管理方法及系统 |
-
2005
- 2005-10-04 CN CN 200580041489 patent/CN101068498A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102177519A (zh) * | 2008-10-10 | 2011-09-07 | 皇家飞利浦电子股份有限公司 | 健康风险度量的确定和/或呈现 |
CN104093354A (zh) * | 2011-12-15 | 2014-10-08 | 联邦科学与工业研究组织 | 用于评估医学图像的方法和设备 |
CN104093354B (zh) * | 2011-12-15 | 2017-06-09 | 联邦科学与工业研究组织 | 用于评估医学图像的方法和设备 |
CN105263416A (zh) * | 2013-06-07 | 2016-01-20 | 皇家飞利浦有限公司 | 基于皮质分布图的淀粉样蛋白pet脑扫描量化 |
CN107209945A (zh) * | 2014-12-10 | 2017-09-26 | 皇家飞利浦有限公司 | 使用机器学习的用于医学成像的转化的系统和方法 |
CN107851098A (zh) * | 2015-05-28 | 2018-03-27 | 慧与发展有限责任合伙企业 | 链接数据集 |
CN110710973A (zh) * | 2015-09-15 | 2020-01-21 | 西门子医疗有限公司 | 用于多对比度脑磁共振数据中异常检测的框架 |
CN110710973B (zh) * | 2015-09-15 | 2024-04-16 | 西门子医疗有限公司 | 用于多对比度脑磁共振数据中异常检测的框架 |
CN106951064A (zh) * | 2016-11-22 | 2017-07-14 | 西安交通大学 | 引入对象连续动作的稳态视觉诱发范式设计及辨识方法 |
CN106951064B (zh) * | 2016-11-22 | 2019-05-03 | 西安交通大学 | 引入对象连续动作的稳态视觉诱发范式设计及辨识方法 |
CN106923854A (zh) * | 2017-03-21 | 2017-07-07 | 泰山医学院 | 一种适用于pet/ct的综合质控体模 |
CN109214325A (zh) * | 2018-08-28 | 2019-01-15 | 天津大学 | 一种基于空间滤波与模版匹配的运动相关电位检测方法 |
CN109214325B (zh) * | 2018-08-28 | 2022-04-29 | 天津大学 | 一种基于空间滤波与模版匹配的运动相关电位检测方法 |
US10963757B2 (en) | 2018-12-14 | 2021-03-30 | Industrial Technology Research Institute | Neural network model fusion method and electronic device using the same |
CN109700458A (zh) * | 2019-01-14 | 2019-05-03 | 广西医科大学第一附属医院 | 一种eeg脑功能网络构建方法、装置及存储介质 |
CN113435209A (zh) * | 2021-06-24 | 2021-09-24 | 台州师同人信息技术有限公司 | 基于共享实验室平台的数据管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101068498A (zh) | 链接来自多模态数据集的图案的方法 | |
Ritter et al. | Multimodal prediction of conversion to Alzheimer's disease based on incomplete biomarkers | |
Sun et al. | Elucidating a magnetic resonance imaging-based neuroanatomic biomarker for psychosis: classification analysis using probabilistic brain atlas and machine learning algorithms | |
Nathoo et al. | A review of statistical methods in imaging genetics | |
Zhou et al. | Hierarchical anatomical brain networks for MCI prediction: revisiting volumetric measures | |
Hu et al. | Adaptive sparse multiple canonical correlation analysis with application to imaging (epi) genomics study of schizophrenia | |
Punjabi et al. | Neuroimaging modality fusion in Alzheimer’s classification using convolutional neural networks | |
Sepehrband et al. | Neuroanatomical morphometric characterization of sex differences in youth using statistical learning | |
CN1748217A (zh) | 增强计算机辅助医疗数据处理系统及方法 | |
Du et al. | Associating multi-modal brain imaging phenotypes and genetic risk factors via a dirty multi-task learning method | |
Zhang et al. | Integrative analysis of multi-dimensional imaging genomics data for Alzheimer's disease prediction | |
Li et al. | Sparse multi-response tensor regression for Alzheimer's disease study with multivariate clinical assessments | |
Janousova et al. | Combining various types of classifiers and features extracted from magnetic resonance imaging data in schizophrenia recognition | |
Li et al. | Gaussian mixture models and model selection for [18F] fluorodeoxyglucose positron emission tomography classification in Alzheimer’s disease | |
Guo et al. | Conversion discriminative analysis on mild cognitive impairment using multiple cortical features from MR images | |
Zheng et al. | Brain connectivity based prediction of Alzheimer’s disease in patients with mild cognitive impairment based on multi-modal images | |
Klyuzhin et al. | Data-driven, voxel-based analysis of brain PET images: Application of PCA and LASSO methods to visualize and quantify patterns of neurodegeneration | |
Chen et al. | Structure-constrained combination-based nonlinear association analysis between incomplete multimodal imaging and genetic data for biomarker detection of neurodegenerative diseases | |
Wang et al. | Identify complex imaging genetic patterns via fusion self-expressive network analysis | |
Parsaei et al. | Classification of suicidality by training supervised machine learning models with brain MRI findings: A systematic review | |
Ke et al. | Identifying imaging genetics biomarkers of alzheimer’s disease by multi-task sparse canonical correlation analysis and regression | |
Zhang et al. | Identification of multimodal brain imaging association via a parameter decomposition based sparse multi-view canonical correlation analysis method | |
Sheng et al. | Strategies for multivariate analyses of imaging genetics study in Alzheimer’s disease | |
Poline et al. | Intersubject variability in fMRI data: Causes, consequences, and related analysis strategies | |
Soheili-Nezhad et al. | Independent genomic sources of brain structure and function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20071107 |