CN110546157A

CN110546157A - 筛查感染的方法

Info

Publication number: CN110546157A
Application number: CN201880026705.7A
Authority: CN
Inventors: 凯瑟琳·弗朗西丝·赛克斯; 罗伯特·威廉·葛文; 乔纳森·斯科特·梅尔尼克; 迈克尔·威廉·罗; 西奥多·迈克尔·塔拉索
Original assignee: Language Of Health Co
Current assignee: Cooper Science
Priority date: 2017-02-22
Filing date: 2018-02-22
Publication date: 2019-12-06
Also published as: AU2018225170A1; CA3054368A1; EP3585801A2; JP2020511633A; SG11201907764PA; WO2018156808A3; US20200064345A1; KR20190117700A; WO2018156808A2; EP3585801A4; IL268849A

Abstract

公开的实施方案涉及用于鉴定感染的非侵入性方法、装置和系统。所述方法基于鉴定存在于肽阵列上的判别肽，相对于参考受试者中存在的抗体混合物的结合，所述判别肽被来自受感染的受试者的样品中存在的不同抗体混合物差异结合。

Description

筛查感染的方法

交叉引用

本申请要求2017年2月22日提交的第62/462,320号美国临时专利申请的权益，该临时申请通过引用整体并入本文。

背景技术

感染性疾病是通常由诸如细菌、病毒、真菌或寄生虫等微生物引起的病症。感染的诊断通常需要对诸如血液、尿液、咽拭子、粪便样品以及某些情况下的脊髓液等体液进行实验室检验。也可以利用成像扫描和活检来鉴定感染源。多种单独的检验可用于诊断感染，并且包括病原体的免疫测定、聚合酶链反应、荧光原位杂交和遗传检测。当前的方法是耗时、复杂且劳动密集的，并且可能需要不同程度的专业知识。另外，可用的诊断工具通常不能可靠地检测感染的早期阶段，并且常常需要一种以上的方法来阳性地诊断出感染。在许多情况下，感染者可能不会表现出任何感染症状，直到出现严重的并发症。

一个例子是克氏锥虫(T.cruzi)的感染，它引起查加斯病(Chagas disease)。查加斯病是拉丁美洲和加勒比海地区死亡和发病的主要原因之一[Perez CJ等人，Lymbery AJ，Thompson RC(2014)Trends Parasitol 30：176-182]，是造成全球心血管疾病负担的重要原因[Chatelain E(2017)Comput Struct Biotechnol J 15：98-103]。查加斯病被认为是这些地理区域中最被忽视的寄生虫病，流行病学家正在追踪其向包括美国和欧洲在内的非流行国家的进一步蔓延[Bern C(2015)Chagas′Disease.N Engl J Med 373：1882；Bern C和Montgomery SP(2009)Clin Infect Dis 49：e52-54；Rassi Jr A等人(2010)The Lancet375：1388-1402]。病原体克氏锥虫是一种带鞭毛的原生动物，主要通过以血液为食的锥蝽昆虫传播给哺乳动物宿主，它可以在宿主中的任何有核细胞中繁殖。其它传播方式包括输血或先天性和经口途径[Steverding D(2014)Parasit Vectors 7：317]。

需要方法、诊断工具和其它生物标志物来鉴定感染，优选在早期且没有症状的情况下检测感染。

发明内容

公开的实施方案涉及用于鉴定感染的方法、装置和系统。所述方法基于鉴定存在于肽阵列上的判别(discriminating)肽，与来自参考受试者的样品的结合相比，所述判别肽被来自受感染的受试者的生物样品差异结合。

一方面，提供了一种用于鉴定具有或疑似具有克氏锥虫感染的受试者的血清学状态的方法，该方法包括：(a)使来自所述受试者的所述样品与包含至少10,000个不同肽的肽阵列接触；(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合，以获得结合信号的组合；以及(c)将结合信号的所述组合与两组或更多组参考结合信号的组合进行比较，其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阳性的多个参考受试者中获得，并且其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阴性的多个受试者中获得，从而确定所述受试者的血清学状态。在一些实施方案中，所述阵列上的不同肽是原位合成的。在一些实施方案中，该方法进一步包括：(i)鉴定区别性参考结合信号的组合，其中所述区别性结合信号将来自已知对所述感染呈血清阳性的参考受试者的样品与来自已知对所述感染呈血清阴性的参考受试者的样品区分开；以及(ii)鉴定判别肽的组合，其中所述判别肽展示出对应于所述区别性参考结合信号的信号。在一些实施方案中，区别性参考结合信号的所述组合中的每一个是通过检测来自所述多个所述参考受试者中的每个受试者的样品中存在的抗体与包含至少10,000个不同肽的相同肽阵列上的至少25个肽的结合而获得的。在一些实施方案中，所述阵列上的不同肽是原位合成的。

在一些实施方案中，提供的方法鉴定对所述感染而言无症状的受试者的血清学状态。在其它实施方案中，所提供的方法鉴定对所述感染而言有症状的受试者的血清学状态。在其它实施方案中，所提供的方法鉴定对任何感染而言有症状的受试者的血清学状态。在其它实施方案中，所述判别肽包含图9B和图23A-23C中列出的一个或多个序列基序，与所有阵列肽中的判别肽相比，所述基序在所有含有该基序的肽中的判别肽中富集大于100％。在其它情况下，所述区别性肽选自图21A-N、表6和表7中列出的肽。

在一些实施方案中，所鉴定的并且将血清阳性受试者与对克氏锥虫感染呈血清阴性的受试者区分开的判别肽包含富集大于100％的一个或多个序列基序，包括图9B中列出的序列基序。在一些实施方案中，所述判别肽选自例如在图21A-N中列出的肽。在其它实施方案中，与本文所述方法的步骤(b)中的抗体结合相对应的结合信号比参考结合信号高例如约25％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约100％、约125％、约150％、约175％或约200％或更多，该参考结合信号是从当使用用于阳性鉴定查加斯病患者的S/CO(信号：截止值)血清学评分系统时得分＜1的受试者样品的抗体结合中获得的。

在其它实施方式中，本文提供的方法和系统相对于对克氏锥虫呈血清阴性而对乙型肝炎病毒(HBV)呈血清阳性的一组或多组参考受试者，鉴定具有或疑似具有克氏锥虫感染的受试者的血清学状态。将对克氏锥虫呈血清阳性的受试者与对HBV呈血清阳性的受试者区分开的判别肽包含富集大于100％的一个或多个序列基序，包括图14A中列出的序列基序。

在其它实施方案中，本文提供的方法和系统相对于对克氏锥虫呈血清阴性而对丙型肝炎病毒(HCV)呈血清阳性的一组或多组参考受试者，鉴定具有或疑似具有克氏锥虫感染的受试者的血清学状态。将对克氏锥虫呈血清阳性的受试者与对HCV呈血清阳性的受试者区分开的判别肽包含富集大于100％的序列基序，包括图15A中列出的序列基序。

在其它实施方案中，本文提供的方法和系统相对于对克氏锥虫呈血清阴性而对西尼罗病毒(WNV)呈血清阳性的一组或多组参考受试者，鉴定具有或疑似具有克氏锥虫感染的受试者的血清学状态。将对克氏锥虫呈血清阳性的受试者与对WNV呈血清阳性的受试者区分开的判别肽包含富集大于100％的序列基序，包括图16A中列出的序列基序。

在另一方面，本文提供了用于鉴定具有或疑似具有病毒感染的受试者的血清学状态的方法和系统，所述方法包括：(a)使来自所述受试者的所述样品与包含至少10,000个不同肽的肽阵列接触；(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合，以获得结合信号的组合；以及(c)将结合信号的所述组合与两组或更多组参考结合信号的组合进行比较，其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阳性的多个参考受试者中获得，从而确定所述受试者的血清学状态。在一些实施方案中，所述阵列上的不同肽是原位合成的。在一些实施方案中，该方法进一步包括：(i)鉴定区别性参考结合信号的组合，其中所述区别性结合信号将来自已知对所述感染呈血清阳性的参考受试者的样品与来自已知对所述感染呈血清阴性的参考受试者的样品区分开；以及(ii)鉴定判别肽的组合，其中所述判别肽展示出与所述区别性参考结合信号相对应的信号。

在一些实施方案中，当与已知对HBV呈血清阳性的参考受试者和对HCV呈血清阳性的参考受试者相比时，本文所述的方法和系统鉴定具有或疑似具有HBV感染的受试者的血清学状态。将对HBV呈血清阳性的受试者与对HCV呈血清阳性的受试者区分开的判别肽包含富集大于100％的一个或多个序列基序，包括图17A中列出的序列基序。

在一些实施方案中，当与已知对HBV呈血清阳性的参考受试者和对WNV呈血清阳性的参考受试者相比时，本文的方法和系统鉴定具有或疑似具有HBV感染的受试者的血清学状态。将对HBV呈血清阳性的受试者与对WNV呈血清阳性的受试者区分开的判别肽包含富集大于100％的序列基序，包括图18A的序列基序。

在一些实施方案中，当与已知对HCV呈血清阳性的参考受试者和对WNV呈血清阳性的参考受试者相比时，本文的方法和系统鉴定具有或疑似具有HCV感染的受试者的血清学状态。将对HCV呈血清阳性的受试者与对WNV呈血清阳性的受试者区分开的判别肽包含富集大于100％的序列基序，包括图19A的序列基序。

在另一方面，提供了用于确定具有或疑似具有选自克氏锥虫、HBV、HCV和WNV的多种不同感染之一的受试者的血清学状态的方法和系统，所述方法包括：(a)使来自疑似具有所述感染之一的受试者的样品与包含至少10,000个不同肽的肽阵列接触；(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合，以获得结合信号的组合；(c)针对所述多种感染中的每一种提供第一、第二、第三和至少第四组区别性结合信号，其中所述组区别性结合信号中的每组将来自对所述感染之一呈血清阳性的一组受试者的样品与从各自对所述多种感染中的其余一种呈血清阳性的受试者中获得的样品混合物区分开；(d)组合所述组区别性结合信号，以获得区别性结合信号的多类别组，其中所述多类别组将所述多种不同感染中的每一种彼此区分开；以及(e)将在步骤(b)中获得的结合信号的所述组合与区别性结合信号的所述多类别组进行比较，从而鉴定所述受试者的血清学状态。在一些实施方案中，该方法进一步包括针对所述第一、第二、第三和至少第四组区别性结合信号中的每组鉴定一组判别肽。在一些实施方案中，将选自克氏锥虫、HBV、HCV和WNV的多种不同感染彼此区分开的第一、第二、第三和至少第四组判别肽进一步包含区别性肽，该区别性肽包含当与所述阵列中的所述至少10,000个肽相比时富集大于100％的选自图20A中的列表的序列基序。

在一些实施方案中，第一组判别肽展示出信号，该信号将对克氏锥虫呈血清阳性的样品与各自对HBV、HCV和WNV之一呈血清阳性的样品的混合物区分开。当与所述阵列中的所述至少10,000个肽相比时，将对克氏锥虫呈血清阳性的样品与各自对HBV、HCV和WNV之一呈血清阳性的样品混合物区分开的判别肽大于100％地富集图10A中列出的一个或多个序列基序。在一些实施方案中，第二组判别肽展示出信号，该信号将对HBV呈血清阳性的样品与各自对克氏锥虫、HCV和WNV之一呈血清阳性的样品的混合物区分开。当与所述阵列中的所述至少10,000个肽相比时，将对HBV呈血清阳性的样品与对克氏锥虫、HCV和WNV之一呈血清阳性的样品混合物区分开的判别肽包含富集大于100％的一个或多个序列基序，包括图11A中列出的序列基序。在一些实施方案中，第三组判别肽展示出信号，该信号将HCV血清阳性样品与各自对HBV、克氏锥虫和WNV之一呈血清阳性的样品的混合物区分开。当与所述阵列中的所述至少10,000个肽相比时，将HCV血清阳性样品与各自对HBV、克氏锥虫和WNV之一呈血清阳性的样品混合物区分开的判别肽包含富集大于100％的序列基序，包括图12A中列出的序列基序。在一些实施方案中，至少第四组判别肽将对WNV呈血清阳性的样品与各自对HBV、HCV和克氏锥虫之一呈血清阳性的样品的混合物区分开。当与所述阵列中的所述至少10,000个肽相比时，将对WNV呈血清阳性的样品与各自对HBV、HCV和克氏锥虫之一呈血清阳性的样品混合物区分开的判别肽包含富集大于100％的序列基序，包括图13A中列出的序列基序。

所提供的任何方法的方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)等于或大于0.6。在其它实施方案中，该方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.69、0.70至0.79、0.80至0.89或0.90至1.00的范围内。

在另一方面，提供了一种用于鉴定受试者中感染性疾病的至少一种候选生物标志物的方法，该方法包括：提供肽阵列，并将来自所述受试者的生物样品与所述肽阵列一起孵育；鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽展示出能够将对所述感染性疾病呈血清阳性的样品与对所述感染性疾病呈血清阴性的样品区分开的结合信号；用该组判别肽中的每个肽查询蛋白质组数据库；将该组判别肽中的每个肽与引起所述感染性疾病的病原体的蛋白质组数据库中的一个或多个蛋白质进行比对；以及从所述蛋白质组数据库中获得每个鉴定出的蛋白质的相关性评分和排名；其中每个鉴定出的蛋白质是所述受试者中的所述疾病的候选生物标志物。在一些实施方案中，该方法进一步包括获得重叠评分，其中所述分数针对所述肽文库的肽组成进行校正。鉴定判别肽的方法包括：(i)检测来自对所述疾病呈血清阳性的多个受试者的样品中存在的抗体与不同肽的阵列的结合，以获得结合信号的第一组合；(ii)检测抗体与相同肽阵列的结合，所述抗体存在于来自两个或更多个受试者参考组的样品中，每组对所述疾病呈血清阴性，以获得结合信号的第二组合；(iii)比较结合信号的所述第一组合与所述第二组合；以及(iv)鉴定所述阵列上的所述肽，所述肽被来自患有所述疾病的受试者的样品中的抗体和来自两个或更多个受试者参考组的所述样品中的抗体差异结合，从而鉴定所述判别肽。在一些实施方案中，判别肽的数目对应于所述阵列上的肽总数的至少一部分。在一些实施方案中，判别肽的数目对应于所述阵列上的肽总数的至少0.00005％、至少0.0001％、至少0.0005％、至少0.0001％、至少0.001％、至少0.003％、至少0.005％、至少0.01％、至少0.05％、至少0.1％、至少0.5％、至少1％、至少0.5％、至少1.5％、至少2％、至少3％、至少4％、至少5％、至少10％、至少25％、至少50％、至少75％、至少80％或至少90％。

在一些实施方案中，所提供的方法鉴定查加斯病的至少一种候选生物标志物。在一些实施方案中，所述至少一种候选蛋白质生物标志物选自表2和表8中提供的列表。在一些实施方案中，所述至少一种蛋白质生物标志物是从图21A-N、表6和表7中提供的判别肽的至少一部分中鉴定的。在一些实施方案中，所述至少一种蛋白质生物标志物是从图21A-N、表6和表7中提供的判别肽的至少0.00005％、至少0.0001％、至少0.0005％、至少0.0001％、至少0.001％、至少0.003％、至少0.005％、至少0.01％、至少0.05％、至少0.1％、至少0.5％、至少1％、至少0.5％、至少1.5％、至少2％、至少3％、至少4％、至少5％、至少10％、至少25％、至少50％、至少75％、至少80％或至少90％中鉴定的。

本文公开了用于鉴定受试者中查加斯病的至少一种候选生物标志物的方法和系统，该方法包括：(a)提供肽阵列，并将来自所述受试者的生物样品与所述肽阵列一起孵育；(b)鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽展示出能够将对所述感染性疾病呈血清阳性的样品与对查加斯病呈血清阴性的样品区分开的结合信号；(c)用该组判别肽中的每个肽查询蛋白质组数据库；(d)将该组判别肽中的每个肽与引起查加斯病的病原体的蛋白质组数据库中的一个或多个蛋白质进行比对；以及(e)从所述蛋白质组数据库中获得每个鉴定出的蛋白质的相关性评分和排名；其中每个鉴定出的蛋白质是所述受试者中的查加斯病的候选生物标志物。在一些情况下，本文公开的方法和系统进一步包括获得重叠评分，其中所述评分针对所述肽文库的肽组成进行校正。在其它方面，本文公开的判别肽被鉴定为具有小于10^-7的p值。

在其它方面，鉴定所述组判别肽的步骤包括：(i)检测来自对所述疾病呈血清阳性的多个受试者的样品中存在的抗体与不同肽的阵列的结合，以获得结合信号的第一组合；(ii)检测抗体与相同肽阵列的结合，所述抗体存在于来自两个或更多个受试者参考组的样品中，每组对所述疾病呈血清阴性，以获得结合信号的第二组合；(iii)比较结合信号的所述第一组合与所述第二组合；以及(iv)鉴定所述阵列上的所述肽，所述肽被来自患有查加斯病的受试者的样品中的抗体和来自两个或更多个受试者参考组的所述样品中的抗体差异结合，从而鉴定所述判别肽。在其它方面，判别肽的数目对应于所述阵列上的肽总数的至少一部分。在某些情况下，所述至少一种候选蛋白质生物标志物选自表6中提供的列表。在其它情况下，所述至少一种蛋白质生物标志物是从图21A-N、表6和表7中提供的判别肽的至少一部分中鉴定出来的。在其它实施方案中，所述判别肽包含图9B和图23A-23C中列出的一个或多个序列基序，与所有阵列肽中的判别肽相比，该基序在在所有含有该基序的肽中的判别肽中富集大于100％。在其它方面，本文还公开了包含含有图23中提供的一个或多个基序的肽的肽阵列。

本文提供的方法和系统适用于包括人类和非人类哺乳动物在内的受试者。在一些实施方案中，该方法中使用的样品是血液样品，包括其全血、血浆和血清部分。在一些实施方案中，该样品是血清样品。在其它实施方案中，该样品是血浆样品。在其它实施方案中，该样品是经干燥的血液样品。

在一些实施方案中，用于执行本文所述的方法和系统的阵列包含至少5,000个不同的肽。在一些实施方案中，用于执行本文所述的方法和系统的阵列包含至少10,000个不同的肽。在一些实施方案中，用于执行本文所述的方法和系统的阵列包含至少50,000个不同的肽。在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少100,000个不同的肽。在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少300,000个不同的肽。在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少500,000个不同的肽。在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少1,000,000个不同的肽。在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少2,000,000个不同的肽。

在其它实施方案中，用于执行本文所述的方法和系统的阵列包含至少3,000,000个不同的肽。所述不同的肽可以由少于20种氨基酸合成。在一些实施方案中，所述肽阵列上的不同肽的长度为至少5个氨基酸。在其它实施方案中，所述肽阵列上的不同肽的长度为5至13个氨基酸。所述肽可以沉积在阵列表面上。在其它实施方案中，所述肽可以原位合成。

所提供的任何方法具有以AUC＞0.6为特征的分类再现性。在一些实施方案中，以AUC为特征的分类再现性在0.60至0.69、0.70至0.79、0.80至0.89或0.90至1.0的范围内。

援引并入

本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文，其程度如同特别且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。

附图说明

图1A-1C示出了示意图，其描绘了血液中的抗体与肽阵列特征的结合(图1A)，以及反映来自对查加斯病呈血清阴性的参考受试者的样品中抗体结合之间的差异的差异荧光信号(图1B)，以及来自对查加斯病呈血清阳性的受试者的样品中的抗体与相同肽阵列的结合(图1C)。

图2A-2D示出了条形图，其表示单克隆抗体(mAb)标准品(4C1(图2A)、p53Ab1(图2B)、p53Ab8(图2C)和LnkB2(图2D))与阵列上的同源表位对照特征的结合。将一组标准的单克隆抗体以2.0nM的浓度一式三份施加于阵列上。对于每种单克隆抗体，使用同源对照特征的平均log10 RFI来计算Z评分。Z评分分别针对每个对照特征作图，各种单克隆抗体被绘制为单个条形。误差条表示各个对照特征Z评分的标准偏差。在每个条形图的上方提供了每种mAb的已知表位。

图3示出了使一组文库肽可视化的火山图，其展示出在查加斯血清阳性与查加斯血清阴性受试者之间显著不同的抗体结合信号。火山图用来将这种区别评估为t检验p值的联合分布相比于信号强度平均值的差异对数(比率的对数)。在每个作图位置的肽的密度由热标度指示。在对多重性应用Bonferroni调整后，绿色虚线白色上方的356个肽通过免疫特征技术(IST)以95％的置信度区分阳性和阴性疾病。彩色圆圈表示其强度与克氏锥虫ELISA得出的信号/截止(S/CO)值显著相关的单个肽，Bonusroni阈值为p＜4e-7(绿色)或错误发现率＜10％(蓝色)。大多数与S/CO相关的肽都位于IST Bonferroni白色虚线上方。

图4A和4B示出了免疫特征测定(IST)在区分查加斯血清阳性与血清阴性供体中的性能。(图4A)2015年训练组群的受试者工作特征(ROC)曲线。蓝色曲线是通过计算100项四折交叉验证试验中的袋外预测值的中值而生成的。(图4B)2016年验证组群的ROC曲线。蓝色曲线是通过应用训练集衍生的算法来预测2016年样品而生成的。以灰色显示的置信区间(CI)通过对训练组群中的供体进行自引重取样来估计，并通过验证组群中的DeLong方法(DeLong ER等人.Biometrics44：837-845[1988])来估计。

图5示出了由查加斯分类相对于供体S/CO值显示的信号强度模式。热图对370个区分查加斯血清阳性与查加斯阴性供体的文库肽的信号强度范围进行排序，侧条图将这些与每个供体的ELISA S/CO值进行关联。

图6示出了来自前370个肽对所有查加斯蛋白质的比对评分的直方图(以蓝色条形表示)。用370个随机选择的文库肽的10个等价比对重复定位算法。每个产生的直方图都显示为彩虹色线图。

图7示出了文库分类肽与克氏锥虫蛋白质-抗原家族的相似性水平的表示。前370个肽与粘蛋白II GPI附着位点的比对以条形图表示，其中条形已被每个比对位置处使用标准单字母代码的氨基酸组成所代替。x轴表示粘蛋白II蛋白质中比对位置处的保守氨基酸。y轴代表分类肽对该氨基酸位置的覆盖度。一个位置处所有字母的高度是每个位置处的绝对数字比对，其中单个氨基酸占据的每个字母条的百分比等于该位置处比对的组成百分比。

图8示出了查加斯病、乙型肝炎、丙型肝炎和西尼罗病毒分类的概率。使用多类SVM机器分类器，通过四折交叉验证分析的袋外预测，迭代100次，计算出针对每个样品的平均预测的概率。每个样品对每种疾病类别都有一个预测的类别成员，范围从0(黑色)到100％(白色)。

图9A-9F示出了在排名前列的判别肽中富集的氨基酸(A)和基序(B-F)，所述判别肽将感染查加斯的血清阳性受试者的样品与来自对查加斯呈血清阴性(健康)的受试者的样品区分开。

图10A和10B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将被查加斯感染的受试者的样品与来自感染HBV、HCV和WNV的一组受试者的样品区分开。

图11A和11B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染HBV的受试者的样品与来自感染查加斯、HCV和WNV的一组受试者的样品区分开。

图12A和12B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染HCV的受试者的样品与来自感染HBV、查加斯和WNV的一组受试者的样品区分开。

图13A和13B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染WNV的受试者的样品与来自感染HBV、HCV和查加斯的一组受试者的样品区分开。

图14A和14B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染查加斯的受试者的样品与来自感染HBV的受试者的样品区分开。

图15A和15B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染查加斯的受试者的样品与来自感染HCV的受试者的样品区分开。

图16A和16B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染查加斯的受试者的样品与来自感染WNV的受试者的样品区分开。

图17A和17B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽感染HBV的受试者的样品与来自感染HCV的受试者的样品区分开。

图18A和18B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染HBV的受试者的样品与来自感染WNV的受试者的样品区分开。

图19A和19B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽将感染HCV的受试者的样品与来自感染WNV的受试者的样品区分开。

图20A和20B示出了在排名前列的判别肽中富集的基序(A)和氨基酸(B)，所述判别肽通过多类分类器确定，将来自感染查加斯、HCV、HBV和WNV的受试者的样品彼此区分开。

图21A-21N示出了区分血清阳性查加斯样品与血清阴性查加斯样品的判别肽的序列。

图22示出了使来自V16、V13和IEDB文库(V16阵列)的一组文库肽可视化的火山图，其显示了在查加斯血清阳性与查加斯血清阴性受试者之间显著不同的抗体结合信号。

图23A-23C示出了示例性基序，发现它们在V16阵列中的肽中富集，区分血清阳性查加斯样品与血清阴性查加斯样品。

具体实施方式

所公开的实施方案涉及用于鉴定受试者中的感染的方法、装置和系统。另外，提供了用于鉴定候选生物标志物的方法、装置和系统，所述生物标志物包括对感染的诊断、预后、监测和筛查和/或作为治疗感染的治疗性靶标有用的蛋白质生物标志物。

对任何一种感染和感染的候选生物标志物的鉴定基于免疫特征测定(IST)的存在，IST可以将来自受试者的抗体与阵列上肽文库的结合表现为结合信号的模式，即结合信号的组合，该模式反映受试者的免疫状态。IST是相对于被参考样品中存在的抗体结合的肽的组合，差异性地结合在受试者样品中存在的抗体的判别肽的组合。结合信号的模式包括结合信息，该结合信息可以指示感染导致的有症状状态和/或无症状状态，例如血清阳性或血清阴性。

与现有方法相比，本文描述的方法具有多个优点。一方面，所描述的方法可以检测有症状和无症状受试者中的感染。该方法是高效的，因为单个测试事件，即单个微阵列特征，可以评估多种感染中任何一种的存在，并且可以同时确定多种感染的诊断。对任何一种感染的鉴定仅受已经鉴定出判别肽的不同感染数目的限制。本文所述的方法、装置和系统适用于鉴定由多种病原体引起的感染，所述病原体包括细菌、病毒、真菌、原生动物、蠕虫和侵染(infestation)，并且在研究、医学和兽医学诊断以及健康监视，如追踪由病原体引起的暴发传播领域具有应用。

本文提供了能够使用单一非侵入性筛查方法来检测并诊断感染的方法、装置和系统，其鉴定与肽阵列结合的外周血抗体的差异模式。患者样品与肽阵列的差异结合导致特异性结合模式，即指示患者健康状况(例如感染)的免疫特征测定(IST)结果。另外，本文提供的装置和系统允许鉴定生物样品的抗原或与抗体的结合配偶体，可以将其评估为靶向治疗干预的候选生物标志物。

通常，相对于一种或多种参考免疫特征确定状况特有的免疫特征，该参考免疫特征从一组或多组不同的参考样品获得，每组获自一组或多组参考受试者，每组具有不同的状况，例如不同的感染。例如，与没有感染和/或具有由不同病原体诱导的不同感染的参考受试者的免疫特征相比，从测试受试者获得的免疫特征鉴定测试受试者的感染。因此，来自测试受试者的免疫特征与参考受试者的免疫特征的比较可以确定测试受试者的状况，例如感染。参考组可以是一组健康受试者，并且该状况在本文中被称为健康状况。健康受试者通常是那些没有正在被测试的感染或已知对正在被测试的感染呈血清阴性的受试者。

提供的方法可以检测样品例如血液中的多种不同感染，该样品来自对不同感染呈血清阳性的有症状或无症状受试者群体中的不同个体，该方法具有高性能、灵敏度和特异性。可以根据所提供的方法检测的感染包括但不限于由包括细菌、病毒、真菌、原生动物、寄生生物体和蠕虫在内的微生物引起的感染。

在一些实施方案中，IST基于抗体与肽阵列结合的多样但可再现的模式，所述肽阵列经选择以提供少于20个氨基酸的氨基酸组合的至少一部分的无偏采样，而不代表已知的蛋白质组序列。在来自受试者的样品中被抗体结合的肽可以不是天然靶序列，而可以模拟同源天然表位的序列或结构。例如，实施例1中描述的IST文库中的肽都不是与已知蛋白质组数据库中的任何9聚体序列的相同匹配。这并不令人惊讶，因为可能的9-聚体肽序列的数目比蛋白质组数据库中的连续9-聚体序列的数目大几个数量级。因此，任何模拟肽精确对应于天然序列的概率较低。被抗体选择性结合的每个IST肽序列可以是抗体在体内识别的表位的功能替代物。因此，包含部分或全部抗体结合的阵列肽序列的蛋白质的序列可用于鉴定候选蛋白质生物标志物，其可被评估为治疗靶标。

一方面，提供了一种用于鉴定具有或疑似具有至少一种感染的受试者的血清学状态的方法，该方法包括：(a)使来自该受试者的样品与包含至少10,000个不同肽的肽阵列接触；(b)检测该样品中存在的抗体与该阵列上的至少25个肽的结合，以获得结合信号的组合；以及(c)将来自该受试者的样品的结合信号的组合与一组或多组参考结合信号的组合进行比较，其中所述组参考结合信号组合中的每组中的至少一个从已知对感染呈血清阳性的多个参考受试者中获得，并且其中所述组参考结合信号组合中的每组中的至少一个从已知对感染呈血清阴性的多个受试者中获得，从而确定该受试者的血清学状态。在一些实施方案中，对感染呈血清阴性的参考受试者可对不同的感染呈血清阳性。阵列肽可以沉积或可以在固体表面上原位合成。在一些实施方案中，方法性能的特征可在于受试者工作特征(ROC)曲线下面积(AUC)大于0.6。在一些实施方案中，来自AUC的分类再现性在0.60至0.69、0.70至0.79、0.80至0.89或0.90至1.0的范围内。

在一些实施方案中，所述方法进一步包括鉴定区别性参考结合信号的组合，所述区别性参考结合信号将来自已知对感染呈血清阳性的参考受试者的样品与来自已知对相同感染呈血清阴性的参考受试者的样品区分开；以及鉴定展现出区别性结合信号组合的阵列肽的组合。区别性结合信号的组合可以包括相对于从参考样品获得的相应结合信号，增加或减少的信号、新增加的信号和/或在感染的存在下丢失的信号。展现出区别性结合信号的组合的阵列肽被称为判别肽。当与阵列肽结合使用时，术语“判别”在本文中与“分类”可互换使用。在一些实施方案中，区别性参考结合信号的组合包括与阵列上的至少1个、至少2个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少2000个、至少3000个、至少4000个、至少5000个、至少6000个、至少7000个、至少8000个、至少9000个、至少10000个、至少20000个或更多个判别肽的结合信号的组合。例如，对于给定状况，10,000个肽的阵列中的至少25个肽被鉴定为判别肽。在一些实施方案中，通过检测来自多个参考受试者中的每一个的参考样品中存在的抗体与包含至少10,000个不同肽的相同肽阵列上的至少25个肽的结合来获得区别性结合信号的每种组合。在一些实施方案中，所述肽是原位合成的。在一些实施方案中，从与肽阵列差异结合的抗体鉴定判别肽，所述肽阵列在阵列基底上包含至少5,000个、至少10,000个、至少15,000个、至少20,000个、至少25,000个、至少50,000个、至少100,000个、至少200,000个、至少300,000个、至少400,000个、至少500,00个、至少1,000,000个、至少2,000,000个、至少3,000,000个、至少4,000,000个、至少5,000,000或至少100,000,000或更多个不同肽的文库。在一些实施方案中，所述差异结合信号是

在一些实施方案中，阵列上肽总数的至少0.00005％、至少0.0001％、至少0.0005％、至少0.0001％、至少0.001％、至少0.003％、至少0.005％、至少0.01％、至少0.05％、至少0.1％、至少0.5％、至少1％、至少0.5％、至少1.5％、至少2％、至少3％、至少4％、至少5％、至少10％、至少25％、至少50％、至少75％、至少80％或至少90％是判别肽。在其它实施方案中，阵列上的所有肽都是判别肽。

结合测定

将受试者的免疫特征鉴定为与阵列肽结合的抗体的结合模式。肽阵列可在任何合适的条件下与样品例如血液、血浆或血清接触，以促进样品中的抗体与阵列上固定的肽的结合。因此，本发明的方法不受所采用的任何特定类型的结合条件的限制。此类条件将根据结合方案中所使用的阵列、基底的类型、基底上排列的肽的密度、结合相互作用的期望严格性和竞争材料的性质而变化。在一个优选的实施方案中，所述条件包括从可寻址阵列中去除未结合的抗体的步骤。确定对该步骤的需要以及用于该步骤的合适的条件完全在本领域的技术水平内。

本文所述的方法和系统中可以使用任何合适的检测技术，以供检测样品中的抗体与阵列上的肽的结合，以生成感染引起的免疫谱。在一个实施方案中，任何类型的可检测标记物可用于标记阵列上的肽，包括但不限于放射性同位素标记物、荧光标记物、发光标记物和电化学标记物(即：具有不同电极中点电位的配体标记物，其中检测包括检测标记物的电位)。或者，例如可使用可检测地标记的第二抗体来检测结合的抗体。

对来自可检测标记物的信号的检测完全在本领域的技术水平内。例如，荧光阵列读取仪是本领域熟知的，用于记录基底上的电位的仪器也是本领域熟知的(关于电化学检测，参见，例如，J.Wang(2000)Analytical Electrochemistry，Vol.，第2版，Wiley-VCH，NewYork)。结合相互作用还可使用其它无标记方法如SPR和质谱分析法来检测。SPR可提供对解离常数和解离率的测量。例如，A-100Biocore/GE仪器适合于这种类型的分析。FLEX芯片可用于在同一支持体上进行多达400个结合反应。

或者，样品中的抗体与阵列上的肽之间的结合相互作用可以以竞争形式来检测。在存在与不存在结合的竞争性抑制剂的情况下阵列与样品的结合谱的差异在表征样品时可能是有用的。

分类算法

对抗体结合信号数据即免疫特征数据(IST)的分析以及由其得到的诊断，通常使用各种算法和程序进行。使用例如激光扫描仪扫描由与第一抗体结合的标记的第二抗体产生的抗体结合模式。可以使用软件如GenePix Pro 8软件(Molecular Devices，SantaClara，CA)导入和处理由扫描仪获取的结合信号图像，以提供每个肽的表格信息，例如，在0-65,535范围内的连续值。可以导入表格数据并使用例如R语言和环境进行统计分析以供统计计算(R Foundation for Statistical Computing，Vienna，Austria.URL https：//www.R-project.org/)。

在从具有不同状况的参考受试者(例如感染后的血清阳性受试者)中获得的样品之间展现出差异信号模式的肽，即判别肽，可以使用已知的统计检验如Student T检验或ANOVA来鉴定。进行统计分析以选择在预定严格性水平上区分不同状况的判别肽。在一些实施方案中，可以通过以统计学手段，例如按照它们的p值对肽进行排名，来获得最具判别力的肽的列表。例如，可以对判别肽进行排名，并将其鉴定为具有介于0和1之间的p值。可以进一步调整p值的截止值，以说明在单个数据集上同时进行若干依赖性或独立性统计检验的情况。例如，当对一组数据进行多个成对检验时，可以使用Bonferroni校正来减少获得假阳性的机会。该校正取决于阵列文库的大小。在一些实施方案中，可以将用于确定判别的截止p值调整为小于10^-20、小于10^-19、小于10^-18、小于10^-17、小于10^-16、小于10^-15、小于10^-14、小于10^-13、小于10^-12、小于10^-11、小于10^-10、小于10^-9、小于10^-8、小于10^-7、小于10^-6、或小于10^-5、或小于10^-4、或小于10^-3、或小于10^-2。该调整取决于阵列文库的大小。或者，不对判别肽进行排名，而是使用展现出最多所有已鉴定的判别肽的结合信号信息对状况，例如样品的血清学状态进行分类。

随后，可以将在统计分析后选择的判别肽的结合信号信息导入机器学习算法中，以获得以一定的准确度、灵敏度和特异性对抗体谱数据进行分类的统计或数学模型，即分类器，并确定样品的血清学状态，以及本文其它地方描述的其它应用。许多计算算法中的任何一种可以用于分类目的。

分类器可以是基于规则的，也可以是计算上智能的。此外，计算智能分类算法可以被监督或不受监督。一种基本的分类算法——线性判别分析(LDA)——可用于分析生物医学数据，以便对两种或更多种疾病类别进行分类。例如，LDA可以是分类算法。一种更复杂的分类方法——支持向量机(SVM)，使用数学内核将原始预测子投影到更高维度的空间，然后鉴定根据样品的类别将样品最佳分离的超平面。一些常见的内核包括线性、多项式、S型或径向基函数。(Kukreja等人，BMC Bioinformatics.2012；13：139)中描述了对本领域中描述的常用分类器的比较研究。基于抗体结合谱数据的数据分析和预测建模的其它算法包括但不限于朴素贝叶斯分类器、Logistic回归、二次判别分析、K最近邻(KNN)、K Star、属性选择分类器(ACS)、通过聚类的分类、通过回归的分类、Hyper Pipes、投票特征间隔分类器、决策树、随机森林和神经网络，包括深度学习(Deep Learning)方法。

在一些实施方案中，抗体结合谱从训练样品集获得，其用于通过应用基于SVM分析的消除算法鉴定最具判别力的肽组合。可以通过交叉验证来确定使用按照统计学显著性水平排名的各种数目输入肽的算法的准确性。为了生成并评价可行数目的判别肽的抗体结合谱，可以使用多个判别肽构建多个模型，以鉴定表现最佳的模型。尽管该方法不排除限制肽的数目，但是该方法可以利用所有或基本上所有可用的肽结合信息，例如，结合信号。因此，该方法与试图先验确定其序列可用于结合目的的肽的方法相反。在一些实施方案中，阵列上多达所有的肽是判别肽。在一些实施方案中，使用至少25个、至少50个、至少75个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个、至少6000个、至少7000个、至少8000个、至少9000个、至少10000个、至少11000个、至少12000个、至少13000个、至少14000个、至少15000个、至少16000个、至少17000个、至少18000个、至少19000个、至少20000个或更多个判别肽来训练特定的疾病分类模型。在一些实施方案中，阵列上的肽的总数的至少0.00001％、至少0.0001％、至少0.0005％、至少0.001％、至少0.005％、至少0.01％、至少0.05％、至少0.1％、至少0.5％、至少1.0％、至少2％、至少3％、至少4％、至少5％、至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少99％是判别肽，并且使用相应的结合信号信息来训练特定的状况分类模型。在一些实施方案中，使用针对阵列上的所有肽获得的信号信息来训练状况特异性模型。

可以生成包含不同数目的判别肽的多个模型，并且可以通过交叉验证过程评估每个模型的性能。通过将训练样品集的每个样品分配给多个交叉验证组中的一个，可以训练并交叉验证SVM分类器。例如，对于四折交叉验证，将每个样品分配给四个交叉验证组之一，使得每组包含测试和对照样品，即参考样品；一个交叉验证组如组1被保留，并使用组2-4中的样品训练SVM分类器模型。对训练组中区分测试例和参考样品的肽进行分析，并例如按统计p值排名；然后将前k个肽用作SVM模型的预测子。为了阐明输入预测子的数目与模型性能之间的关系，并防止过拟合，针对一系列k，例如，25、50、100、250、1000、200、3000个前列肽或更多个，重复sub＝loop。通过使用组2-4产生的模型进行组1中样品的预测，即分类。生成四组中每组的模型，并使用真实疾病样品的信号结合数据，使用来自4个模型的所有预测来计算性能(AUC、灵敏度和/或特异性)。交叉验证步骤重复至少100次，并且相对于置信区间，例如95％，计算平均性能。诊断可视化可以使用例如相对于输入肽数目的模型性能来生成。

选择基于针对一组判别输入肽(最具判别力的肽的列表，k)的抗体结合信息的最佳模型/分类器，并使用该模型预测测试集的疾病状态。使用验证集确定不同分类器的性能，并且使用测试样品集，从具有最佳性能的模型获得诸如准确度、灵敏度、特异性和受试者工作特征(AUC)曲线的曲线下面积(AUC)的性能特征。在一些实施方案中，鉴定不同组的判别肽，以区分不同的状况。因此，针对将在不同受试者中鉴定的每种健康状况，例如感染，建立基于一组最具判别力的输入肽的最佳模型/分类器。

状况的分类

在一些实施方案中，可以获得单独的二元分类器，以相对于参考状况例如一种不同的感染的血清学状态来鉴定感染的血清学状态，并且提供了分类器利用的判别肽的组合。例如，如实施例3所示，选择基于判别肽的组合的最佳分类器，以预测具有或疑似具有克氏锥虫感染的受试者的血清学状态。在实施例3中，确定判别肽以将来自对克氏锥虫感染呈血清阳性的受试者的样品与来自对克氏锥虫呈血清阴性的一组受试者的参考样品区分开(图21A-N)。

判别肽的组合的特征包括一种或多种氨基酸的普遍性，和/或所鉴定的判别肽中存在的特定序列基序的普遍性。氨基酸和基序含量的富集是相对于阵列文库中所有肽的相应总氨基酸和基序含量。在一些实施方案中，将感染导致血清阳性的受试者与对相同感染呈血清阴性的参考受试者区分开的免疫特征结合模式的判别肽可以富集至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸。在一些实施方案中，相对于所有文库肽中存在的每种氨基酸的总含量，判别肽中氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％。

类似地，在一些实施方案中，将感染导致血清阳性的受试者与对相同感染呈血清阴性的参考受试者区分开的免疫特征结合模式的判别肽可以富集至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序。相对于所有文库肽中存在的每个基序的总含量，至少一个基序中序列基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％。

在一些实施方案中，所述感染性疾病是查加斯病，并且将血清阳性受试者中的查加斯病与健康参考受试者(其可以是对查加斯病呈血清阴性的受试者)区分开的判别肽富集精氨酸、天冬氨酸和赖氨酸中的一种或多种(图9A)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将查加斯病与健康参考受试者区分开的判别肽富集图9B-F中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是查加斯病，并且将血清阳性受试者中的查加斯病与对HBV呈血清阳性的参考受试者区分开的判别肽富集精氨酸、色氨酸、丝氨酸、丙氨酸、缬氨酸、谷氨酰胺和甘氨酸中的一种或多种(图14B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将查加斯病与HBV参考受试者区分开的判别肽富集图14A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是查加斯病，并且将血清阳性受试者中的查加斯病与对HCV呈血清阳性的参考受试者区分开的判别肽富集精氨酸，色氨酸、丝氨酸、缬氨酸和甘氨酸中的一种或多种(图15B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将查加斯病与对HCV呈血清阳性的参考受试者区分开的判别肽富集图15A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是查加斯病，并且将血清阳性受试者中的查加斯病与对WNV呈血清阳性的参考受试者区分开的判别肽富集赖氨酸、色氨酸、天冬氨酸、组氨酸、精氨酸、谷氨酸和甘氨酸中的一种或多种(图16B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。阵列文库中的所有肽。在一些实施方案中，将查加斯病与WNV参考受试者区分开的判别肽富集图16A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是HBV疾病，并且将血清阳性受试者中的HCV疾病与对WNV呈血清阳性的参考受试者区分开的判别肽富集苯丙氨酸、色氨酸、缬氨酸、亮氨酸、丙氨酸和组氨酸中的一种或多种(图17B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将HBV疾病与HCV参考受试者区分开的判别肽富集图17A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是HBV疾病，并且将血清阳性受试者中的WNV疾病与对WNV呈血清阳性的参考受试者区分开的判别肽富集色氨酸、赖氨酸、苯丙氨酸、组氨酸和缬氨酸中的一种或多种(图18B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将HBV疾病与WNV参考受试者区分开的判别肽富集图18A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在优选的实施方案中，所述感染性疾病是HCV疾病，并且将血清阳性受试者中的HCV疾病与对WNV呈血清阳性的参考受试者区分开的判别肽富集赖氨酸、色氨酸、精氨酸、酪氨酸和脯氨酸中的一种或多种(图19B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将HCV疾病与WNV参考受试者区分开的判别肽富集图19A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在其它实施方案中，可以获得单独的分类器，以相对于一组组合的两种或更多种不同感染来鉴定感染，并且提供了该分类器所利用的判别肽的组合。判别肽的组合的特征包括一种或多种氨基酸的普遍性，和/或所鉴定的判别肽中存在的特定序列基序的普遍性。例如，如实施例5所示，基于判别肽来创建第一二元分类器，以将对克氏锥虫呈血清阳性的受试者与一组受试者区分开，这组受试者是各自对HPV、HCV或WNV呈血清阳性的受试者的组合。根据判别肽创建第二二元分类器，以将对HBV呈血清阳性的受试者与一组受试者区分开，这组受试者是各自对查加斯、HCV或WNV呈血清阳性的受试者的组合。基于判别肽创建第三分类器，以将对HCV呈血清阳性的受试者与一组受试者区分开，这组受试者是各自对HPV、查加斯或WNV呈血清阳性的受试者的组合。基于判别肽创建第四分类器，以将对WVN呈血清阳性的受试者与一组受试者区分开，这组受试者是各自对HPV、HCV或查加斯呈血清阳性的受试者的组合。

氨基酸和基序含量的富集是相对于阵列文库中所有肽的相应总氨基酸和基序含量。在一些实施方案中，在用本文公开的方法和阵列诊断或检测受试者中的感染性疾病中，将患有感染性疾病的受试者与一组受试者(每个受试者具有两种或更多种不同感染之一)区分开的免疫特征结合模式的判别肽富集至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸。对于包含针对感染性疾病的免疫特征的肽，在超过一种氨基酸中，氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％。

类似地，在一些实施方案中，用本文公开的方法和阵列相对于一组受试者(每个受试者具有两种或更多种不同感染之一)诊断或检测受试者中的感染性疾病的免疫印记结合模式的判别肽富集至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序。对于包含针对感染性疾病的免疫特征的肽，在超过一个基序中，序列基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％。

在一些实施方案中，所述感染性疾病是查加斯病，并且将血清阳性受试者中的查加斯病与对HBV、HCV和WNV之一呈血清阳性的一组参考受试者区分开的判别肽富集精氨酸、酪氨酸、丝氨酸和缬氨酸中的一种或多种(图10B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将查加斯病与HBV、HCV和WNV参考受试者区分开的判别肽富集图10A中提供的一个或多个基序。对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在一些实施方案中，所述感染性疾病是HBV，并且将血清阳性受试者中的HBV疾病与对查加斯、HCV和WNV之一呈血清阳性的一组参考受试者区分开的判别肽富集色氨酸、苯丙氨酸、赖氨酸、缬氨酸、亮氨酸、精氨酸和组氨酸中的一种或多种(图11B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％、或大于500％或更多。在一些实施方案中，将HBV疾病与WNV参考受试者区分开的判别肽富集图11A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在一些实施方案中，所述感染性疾病是HCV，并且将血清阳性受试者中的HCV疾病与对查加斯、HBV和WNV之一呈血清阳性的一组参考受试者区分开的判别肽富集精氨酸、酪氨酸、天冬氨酸和甘氨酸中的一种或多种(图12B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将HCV疾病与参考受试者区分开的判别肽富集图12A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在一些实施方案中，所述感染性疾病是WNV，并且将血清阳性受试者中的WNV疾病与对查加斯、HBV和HCV之一呈血清阳性的一组参考受试者区分开的判别肽富集赖氨酸、色氨酸、组氨酸和脯氨酸中的一种或多种(图13B)。相对于阵列文库中所有肽的相应总氨基酸含量，所述一种或多种氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。在一些实施方案中，将WNV疾病与其它参考受试者区分开的判别肽富集图13A中提供的一个或多个基序。相对于阵列文库中所有肽的相应总基序含量，所述一个或多个氨基基序的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％或更多。

在另外其它的实施方案中，基于与不同组判别肽结合的抗体获得彼此独立的单独的分类器，并将其组合成多重分类器以潜在地实现最佳可能的分类，同时增加分类的效率和准确度。例如，第一单独分类器可以与第二单独分类器、与第三单独分类器以及与第四单独分类器组合，以获得多重分类器，第一单独分类器基于区分克氏锥虫感染与HBV、HCV和WNV感染参考组的判别肽，第二单独分类器基于区分HBV与查加斯、HCV和WNV感染参考组的判别肽，第三单独分类器基于区分HCV与查加斯、HBV和WNV感染参考组的判别肽，第四单独分类器基于区分WNV与查加斯、HBV和HCV感染参考组的判别肽。基于每个单独分类器的判别肽，可以出现肽的最佳组合，以提供可以同时将两种或更多种不同感染彼此区分开的多重分类器。实施例6证明了单独分类器的判别肽的组合产生了基于判别肽的组合的多重分类器，所述判别肽的组合可以同时将克氏锥虫感染、HPV感染、HCV感染和WNV感染彼此区分开。

在一些实施方案中，用于用本文公开的方法和阵列同时鉴定受试者中的两种或更多种感染的免疫特征结合模式的判别肽富集至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸。对于包含针对感染性疾病的免疫特征的肽，在至少一种氨基酸中，氨基酸的富集可以大于100％、大于125％、大于150％、大于175％、大于200％、大于225％、大于250％、大于275％、大于300％、大于350％、大于400％、大于450％或大于500％。在一些实施方案中，在查加斯、HBV、HCV和WNV之间进行同时区分，其中判别肽同时将这些感染中的每一种彼此区分开。在一些实施方案中，将查加斯与HBV、HCV和WNV感染中的每一种同时区分开的判别肽富集精氨酸、酪氨酸、赖氨酸、色氨酸、缬氨酸和丙氨酸中的一种或多种(图20B)。在一些实施方案中，将HBV与查加斯、HCV和WNV感染中的每一种同时区分开的判别肽富集图20A中列出的一个或多个基序。

测定性能

在一些实施方案中，所得到的用于对任何感染进行分类的方法性能的特征在于受试者工作特征(ROC)曲线下面积。分类的特异性、灵敏度和准确度指标可以通过ROC下面积(AUC)来确定。在一些实施方案中，所述方法确定/分类健康状况，例如，相对于受试者的血清学状态，感染的存在与否。当将该方法应用于健康状况通过替代方法已知的多个患者时，该方法的性能或准确度的特征可在于受试者工作特征(ROC)曲线下面积(AUC)大于0.90。在其它实施方案中，该方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)大于0.70、大于0.80、大于0.90、大于0.95，方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)大于0.97，方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)大于0.99。在其它实施方案中，方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.69、0.70至0.79、0.80至0.89或0.90至1.0的范围内。在另外其它的实施方案中，方法性能在灵敏度、特异性和/或准确度方面表示。

在一些实施方案中，所述方法的灵敏度为至少60％，例如65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的灵敏度。

在其它实施方案中，所述方法的特异性为至少60％，例如65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的特异性。

在一些实施方案中，所述方法的准确度为至少60％，例如65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。

建立区分一种或多种不同状况，例如个体的血清学状态的最佳分类器或多重分类器模型后，该方法被应用于确定状况，例如受试者的血清学状态。从需要诊断的受试者中获得样品。将样品与肽阵列接触，并且例如使用扫描仪，检测例如由受试者样品中的抗体与阵列上的多个肽结合产生的结合信号。将图像导入软件，以定量比较由受试者样品中的结合抗体产生的结合信号与先前为最佳分类模型鉴定的判别肽的相应结合信号。计算出总分，该总分说明该模型的判别肽与受检者样品的抗体结合的相应肽的结合信号之间的信号差异，并且提供指示例如感染的存在与否的输出。其它输出可以指示感染的状态。例如，输出可以指示感染是处于急性状态、慢性状态还是不确定状态。可以针对本文提供的示例性感染中的任何一种，即克氏锥虫、HBV、HCV、WNV和本文其它地方提供的其它任何已知感染，来确定感染的状态。

在一些实施方案中，所述方法具有以AUC大于0.6、大于0.65、大于0.7、大于0.75、大于0.80、大于0.85、大于0.90、大于0.95、大于0.96、大于0.97、大于0.98或大于0.99为特征的分类再现性。在一些实施方案中，分类再现性的特征在于AUC＝1。

鉴定候选生物标志物

所提供的获得的免疫特征随后可用于多种应用，包括根据本文公开的方法和装置，鉴定候选治疗靶标，对感染进行分类，监测感染的活动性，以及针对鉴定的感染性病症开发对于个体的治疗。在另一方面，可以对鉴定阵列上的判别肽的来自具有两种或更多种不同健康状况的受试者的样品中的抗体的差异结合进行分析，例如，通过比较区分蛋白质数据库中阵列序列的两种或更多种健康状况的一种或多种判别肽的序列，以鉴定候选靶蛋白。在一些实施方案中，通过将抗体组库展开在肽阵列上(免疫特征测定，IST)，并比较来自患病受试者例如被感染受试者的样品与来自健康参考受试者例如已知没有感染的受试者的样品，可以鉴定信息性的(informative)判别肽，以揭示所识别的蛋白质，即被抗体结合的蛋白质。例如，可利用信息学方法来鉴定肽。

在信息学无法鉴定推定的匹配的情况下，例如在非连续表位的情况下，可使用信息性的肽作为亲和试剂来纯化反应性抗体。而后可在标准免疫学技术中使用纯化的抗体来鉴定靶标。

在诊断出状况即感染后，可以查询适当的参考蛋白质组以关联样品中被抗体结合的判别肽的序列。在所有蛋白质组中选择参考蛋白质组(手动和算法，根据许多标准)，以提供生命树的广泛覆盖。参考蛋白质组构成了将在http：//www.uniprot.org/proteomes/？query＝reference：yes中的UniProtKB内发现的分类多样性的代表性横截面。参考蛋白质组包括经过充分研究的模式生物和生物医学和生物技术研究感兴趣的其它蛋白质组。具有特殊重要性的物种可以由特定生态型或感兴趣的菌株的许多参考蛋白质组表示。可以查询的蛋白质组的示例包括但不限于人类蛋白质组，以及来自其它哺乳动物、非哺乳动物、病毒、细菌、真菌、蠕虫、侵染和原生动物寄生虫的蛋白质组。此外，可以查询的其它编译的蛋白质包括但不限于疾病相关蛋白质的列表、含有已知或未知突变(包括单核苷酸多态性、插入、置换和缺失)的蛋白质的列表、由已知和未知剪接变体组成的蛋白质的列表、或来自组合文库(包括天然和非天然氨基酸)的肽或蛋白质的列表。在一些实施方案中，可以使用鉴定的判别肽查询的蛋白质组包括但不限于克氏锥虫的蛋白质组(SodréCL等人，ArchMicrobiol.[2009]Feb；191(2)：177-84.Epub 2008 Nov 11.Proteomic map ofTrypanosoma cruzi CL Brener：the reference strain of the genome project)；HBV、HCV和WNV的蛋白质组，其可见于例如http：//www.uniprot.org/proteomes/。

用于将单个和多个蛋白质与蛋白质组或蛋白质列表中的蛋白质进行比对的软件包括但不限于BLAST、CS-BLAST、CUDAWS++、DIAMOND、FASTA、GGSEARCH(GG或GL)、Genoogle、HMMER、H-suite、IDF、KLAST、MMseqs2、USEARCH、OSWALD、Parasail、PSI-BLAST、PSI_Protein、Sequilab、SAM、SSEARCH、SWAPHI、SWIMM和SWIPE。

或者，相对于在阵列上的整个肽文库中发现的基序，在判别肽中富集的序列基序可以与蛋白质组进行比对，以鉴定可以作为治疗状况的可能治疗靶标进行验证的靶蛋白。用于鉴定蛋白质结构域、家族和功能位点的在线数据库和搜索工具是可以获得的，例如，ExPASy的Prosite、Motif Scan(MyHits，SIB，瑞士)、Interpro 5、MOTIF(GenomeNet，日本)和Pfam(EMBL-EBI)。

在一些实施方案中，比对方法可以是将查询序列的氨基酸映射到较长蛋白质序列上的任何方法，包括BLAST(Altschul，S.F.&Gish，W.[1996]″Local alignmentstatistics.″Meth.Enzymol.266：460-480)，使用组成替换和评分矩阵，有空位和无空位的精确匹配，表位预测，抗原性预测，疏水性预测，表面可及性预测。对于每种方法，可以使用规范或修改的评分系统，其中修改后的评分系统被优化，以校正肽文库组合物中的偏差。在一些实施方案中，使用修改的BLAST比对，需要3个氨基酸的种子，其中空位罚分为4，且评分矩阵为BLOSUM62(Henikoff，J.G.Proc.Natl.Acad.Sci.USA 89，10915-10919[1992])，该评分矩阵被修改为反映阵列的氨基酸组成(States等人，Methods 3：66-70[1991])。这些修改提高了类似置换的评分，去除阵列中缺失的氨基酸的罚分，并且对所有精确匹配同等地进行评分。

可用于根据所提供的方法鉴定候选生物标志物蛋白的判别肽是根据其区分两种或更多种不同健康状况的能力来选择的。如本文其它地方所述，可以在预定的统计严格性下选择判别肽，例如，通过区分两种或更多种状况的概率的p值；通过两种或更多种状况之间的相对结合信号强度变化的差异；通过其在单一状况下的强度等级；通过其在针对两种或更多种状况训练的机器学习模型中的系数，例如AUC，或通过其与一个或多个研究参数的相关性，例如，R平方、斯皮尔曼相关性。在一些实施方案中，为了鉴定一种或多种候选生物标志物而选择的判别肽被选择为具有p＜1E-03、p＜1E-04或p＜1E-05的p值。

如本文其它地方所述鉴定出针对感染的一组判别肽后，将判别肽与一个或多个病原体蛋白质组进行比对，并且鉴定出具有阳性BLAST评分的肽。对于与判别肽比对的每种蛋白质，比对中的BLAST-正评分肽的评分被组装成矩阵，例如修改的BLOSUM62，该矩阵的每一行对应于所比对的肽，并且每一列对应于构成蛋白质的连续氨基酸之一。

矩阵的每一行对应于所比对的肽，并且每一列对应于该蛋白质上的氨基酸，在肽行内允许空位和缺失，以允许与蛋白质比对。

通过使用上述修改的BLAST评分矩阵，矩阵中的每个位置接收该列中肽和蛋白质的配对氨基酸的评分。然后，对于蛋白质中的每种氨基酸，将相应的列相加，以产生氨基酸“重叠评分”，该重叠评分代表该氨基酸在蛋白质中的某个位置处被判别肽覆盖的程度。

随后针对阵列文库的组成，即氨基酸含量，校正氨基酸重叠评分。例如，进行校正以说明排除20种天然氨基酸中的一种或多种的文库阵列肽。为了针对文库组成校正该评分，对于列出的所有阵列肽使用相同的方法计算氨基酸重叠评分。这允许根据以下方程式，计算每个氨基酸位置处基于判别肽的肽重叠差异评分s_d：

s_d＝a-(b/d)*c

其中“a”是来自判别肽的重叠评分，“b”是免疫特征判别肽的数目，“c”是整个肽阵列的重叠评分，而“d”是整个阵列上文库肽的数目。

接下来，将从判别肽的比对获得的氨基酸重叠评分转换为蛋白质评分S_d。为了将在氨基酸水平上的评分s_d转换为全蛋白质统计值S_d，计算蛋白质中每个可能的平铺n-聚体表位的评分的总和，并且最终得分是每个蛋白质沿n-聚体的该滚动窗口获得的最高得分，其中n可以是20(等)。在一些实施方案中，可以获得平铺10-聚体表位、15-聚体表位、20-聚体表位、25-聚体表位、30-聚体表位、35-聚体表位、40-聚体表位、45-聚体表位或50-聚体表位的评分。蛋白质评分S_d是沿滚动窗口获得的最高得分。在一些实施方案中，n-聚体与蛋白质的全长相关，即，判别肽与蛋白质的整个序列进行比对。或者，可以通过将肽序列与整个蛋白质序列进行比对来获得评分。

随后相对于随机选择的非判别肽的排名，对所鉴定的候选生物标志物进行排名。因此，如针对判别肽所述，获得与相同的蛋白质组或蛋白质列表的一种或多种蛋白质的每一种比对的非判别肽(即随机选择的肽)的重叠评分(非判别随机“s_r”评分)。计算随机肽的氨基酸重叠评分，然后针对肽文库的氨基酸含量进行校正，以提供非判别或随机s_r评分。然后将非判别s_r评分转换为多个随机选择的非判别肽中的每一个的非判别蛋白质′S_r′评分。例如，可获得至少25个、至少50个、至少100个、至少150个、至少200个或更多个随机选择的非判别肽的非判别随机蛋白质′S_r′评分。在一些实施方案中，可以使用用来获得蛋白质评分S_d的判别肽的等效数目来计算随机选择的非判别肽的最终蛋白质评分S_r。在其它实施方案中，用来确定S_d的判别肽数目的至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少95％、至少98％、至少99％用于确定非判别蛋白质′S_r′评分。

在一些实施方案中，候选蛋白质生物标志物根据其S_d评分相对于通过非判别肽的比对鉴定的蛋白质的S_r评分进行排名。在一些实施方案中，可以根据p值确定排名。排名靠前的候选生物标志物可以被选择为具有小于10^-3、小于10^-4、小于10^-5、小于10^-6、小于10^-7、小于10^-8、小于10^-9、小于10^-10、小于10^-12、小于10^-15、小于10^-18、小于10^-20或更小的p值。在一些实施方案中，根据所述方法鉴定了方法至少5个、至少10个、至少15个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少120个、至少150个、至少180个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个或更多个候选生物标志物。

在其它实施方案中，根据S_d评分选择候选生物标志物，该S_d评分是通过如前面的段落中所述将多个判别肽平铺到n-聚体表位上，并选择候选生物标志物的数目作为具有最大S_d评分的蛋白质对于该病原体蛋白质组的百分比来获得的。在一些实施方案中，候选生物标志物是具有最高排名的S_d评分并且包含病原体蛋白质组的蛋白质总数的至少0.01％的蛋白质。在其它实施方案中，候选生物标志物是具有最高排名的S_d评分并且包含病原体蛋白质组的蛋白质总数的至少0.02％、至少0.03％、至少0.04％、至少0.05％、至少0.1％、至少0.15％、至少0.2％、至少0.25％、至少0.3％、至少0.35％、至少0.4％、至少0.45％、至少0.5％、至少0.55％、至少0.6％、至少0.65％、至少0.7％、至少0.75％、至少0.8％、至少0.85％、至少0.9％、至少1％、至少2％、至少3％、至少4％、至少5％、至少10％、至少20％或更多的蛋白质。

在一些实施方案中，提供了一种用于鉴定受试者中感染的至少一种候选蛋白质生物标志物的方法，该方法包括：(a)提供肽阵列，并将来自所述受试者的生物样品与所述肽阵列一起孵育；(b)鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽能够将所述感染与至少一种不同的状况区分开；(c)用所述组判别肽中的多个所述判别肽查询蛋白质组数据库；(d)将所述组判别肽中的所述多个肽与引起感染的病原体的蛋白质组的一个或多个蛋白质进行比对；以及(e)从所述蛋白质组数据库中获得每个蛋白质的相关性评分以及每个鉴定出的蛋白质的排名；其中每个鉴定出的蛋白质是所述受试者中的所述疾病的候选生物标志物。在一些实施方案中，所述至少一种不同的状况可以包括一种或多种不同的感染和/或健康状况。在一些实施方案中，所述方法进一步包括获得重叠评分，其中所述评分针对所述肽文库的肽组成进行校正。可以通过统计学手段，例如t检验，将判别肽鉴定为具有小于10^-3、小于10^-4、小于10^-5、小于10^-6、小于10^-7、小于10^-8、小于10^-9、小于10^-10、小于10^-11、小于10^-12、小于10^-13、小于10^-14或小于10^-15的p值。在一些实施方案中，与根据该方法但使用非判别肽鉴定的蛋白质相比，可以根据小于10^-3、小于10^-4、小于10^-5或小于10^-6的p值对所得的候选生物标志物进行排名。

感染性疾病例如查加斯病的候选生物标志物

实施例4说明了一种使用判别肽鉴定候选蛋白质生物标志物的方法，该判别肽区分健康受试者样品的血清学状态与来自感染克氏锥虫(查加斯病)的受试者的样品。健康受试者可以是先前感染过克氏锥虫并血清转化为血清阴性的受试者，和/或从未感染过克氏锥虫的受试者。表2提供了候选蛋白质生物标志物的列表。类似地，可以使用判别肽来鉴定候选蛋白质生物标志物，该判别肽区分来自具有其它感染性疾病的受试者的样品与来自健康受试者的样品，来自具有其它感染性疾病的受试者的样品，以及来自患有模拟疾病(其可能是或可能不是感染性的)的受试者的样品的血清学状态。

在一些实施方案中，用于鉴定感染性疾病的候选蛋白质生物标志物的方法包括：(a)提供肽阵列，并将来自所述受试者的生物样品与所述肽阵列一起孵育；(b)鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽展示出能够将对所述感染性疾病呈血清阳性的样品与对相同感染性疾病呈血清阴性的样品区分开的信号；(c)用该组判别肽中的每个肽查询蛋白质组数据库；(d)将该组肽中的每个肽与该蛋白质组数据库中的一个或多个蛋白质进行比对，以鉴定引起所述感染的病原体的一个或多个蛋白质；以及(e)从该蛋白质组数据库中获得每个鉴定出的蛋白质的相关性评分和排名；其中每个鉴定出的蛋白质是所述受试者中的所述感染性疾病的候选生物标志物。在一些实施方案中，该方法中使用的判别肽被鉴定为具有小于10^-5、小于10^-6、小于10^-7、小于10^-8、小于10^-9、小于10^-10、小于10^-11、小于10^-12、小于10^-13、小于10^-14或小于10^-15的p值。在其它实施方案中，该方法中使用的判别肽是所有判别肽，即，尚未根据统计方法排名的肽。

在一些实施方案中，所述方法进一步包括鉴定区分感染性疾病与健康状况例如血清阴性状况的一组判别肽。在一些实施方案中，判别肽区分患有查加斯病的受试者与具有不同感染的受试者。或者，判别肽区分患有查加斯病的受试者与各自具有不同感染的受试者的混合物。在一些实施方案中，具有任何一种感染，例如查加斯、HBV、HCV、WNV的受试者可以与没有感染的受试者区分开。在一些情况下，没有感染的受试者是已从感染中逆转的血清阴性受试者。因此，候选生物标志物可用于诊断疾病，并且鉴定疾病进展的阶段。生物标志物也可用于感染性疾病的监测。表2中列出了相对于健康受试者在具有查加斯病的受试者中鉴定的候选生物标志物的实例。在一些实施方案中，根据该方法鉴定的候选生物标志物蛋白质按照小于10^-3、小于10^-4、小于10^-5或小于10^-6的p值进行排名。可以相对于已经从对状况无判别力的阵列肽中鉴定出的蛋白质来确定所得候选物的排名。

或者，根据所提供的方法鉴定的判别肽可以使用在区分两种不同状况的最具判别力的肽中富集的序列基序来鉴定候选靶蛋白。在一个实施方案中，鉴定用于治疗人类受试者的感染性疾病的候选靶标的方法包括(a)获得区分感染性疾病与一种或多种不同的感染性疾病的一组判别肽；(b)鉴定所述判别肽的一组基序；(c)将该组基序与人类蛋白质组进行比对；(d)鉴定该组中每个基序与免疫原性蛋白质区域之间的同源区域；以及(e)将所述蛋白质鉴定为治疗所述感染性疾病的候选靶标。该方法可以进一步包括鉴定区分感染性疾病与健康状况的一组判别肽。基序在最具判别力的肽中富集，该判别肽可用来鉴定候选靶蛋白以供开发并用于治疗各种感染性疾病，图9-20中提供了处于不同进展阶段的一些基序。

在一些实施方案中，鉴定判别肽的步骤可包括(i)检测来自患有所述感染性疾病的多个受试者的样品中存在的抗体与不同肽的阵列的结合，以获得结合信号的第一组合；(ii)检测抗体与相同肽阵列的结合，所述抗体存在于来自两个或更多个受试者参考组的样品中，每组具有不同的健康状况；(iii)比较结合信号的所述第一组合与所述第二组合；以及(iv)鉴定所述阵列上的肽，所述肽被来自患有所述疾病的受试者的样品中的抗体和来自两个或更多个受试者参考组的所述样品中的抗体差异结合，从而鉴定所述判别肽。在一些实施方案中，所述感染性疾病是查加斯病。在一些实施方案中，查加斯病与健康状况区分开。在一些实施方案中，查加斯病与一种或多种不同的感染区分开。如上所述，诸如HBV、HCV、WNV和查加斯等感染可以彼此区分开。

候选生物标志物的应用

在其它实施方案中，所提供的方法、装置和系统鉴定与疾病活动性相关和/或与疾病活动性随时间的变化相关的判别肽。例如，判别肽可以确定疾病活动性，并将其与由现有评分系统的已知标志物定义的活动性相关联。实施例3描述了若干判别肽与查加斯病的S/CO活动性评分相关。这些判别肽已根据所提供的方法用来鉴定蛋白质。因此，这些蛋白质中的一些可能是可用于检测和监测查加斯病活动性的新型候选生物标志物。

判别肽还可以用作抑制或激活目标蛋白质-蛋白质相互作用的药物设计的基础。在另一个方面，提供了通过本发明方法鉴定的新型判别肽的治疗和诊断用途。因此，这些方面和实施方案包括包含根据本发明的肽及其衍生物的制剂、药物和药物组合物。在一些实施方案中，提供了用于医学的新型判别肽或其衍生物。更具体地说，用于拮抗或激动目标配体如细胞表面受体的功能。本发明的判别肽可用于治疗人体或动物体的各种疾病和状况，如癌症和退行性疾病。治疗还可包括预防性以及治疗性治疗以及疾病或状况的缓解。

因此，本文公开的方法、系统和阵列装置能够鉴定判别肽，该判别肽用来鉴定候选生物标志物、鉴定疫苗靶标，后者继而可用于在疾病和/或状况的早期治疗疾病和/或状况的医疗干预。例如，本文公开的方法、系统和阵列装置能够在传统的基于生物标志物的测定之前数天或数周检测、诊断和监测疾病和/或状况。此外，仅需要一个阵列，即一个免疫特征测定，即可检测、诊断和监测一系列由感染原引起的疾病和状况，包括炎性状况、自身免疫性疾病、癌症和病原体感染。可以鉴定候选生物标志物以供治疗剂的验证和后续开发。

感染性疾病

所提供的测定、方法和装置可以用于鉴定多种不同的感染。在一些实施方案中，所提供的测定、方法和装置可用于鉴定区分任何一种感染与其它任何一种或多种感染的判别肽。在其它实施方案中，鉴定不同感染的判别肽可用来鉴定不同感染的候选生物标志物。本文所述的方法、装置和设备适用于鉴定由多种病原体引起的感染，所述病原体包括细菌、病毒、真菌、原生动物、蠕虫和侵染。在一些实施方案中，所提供的测定、方法和装置可用来鉴定用于不同感染的医疗干预的候选生物标志物，所述医疗干预包括诊断感染，相对于其它感染和模拟由感染引起的疾病的疾病提供感染的鉴别诊断，确定感染和由此引起的疾病的进展，对感染和疾病的活动性进行评分，作为用于治疗感染和疾病的治疗剂的评价候选目标，以及根据对治疗的预期反应在临床试验中对患者进行分层。

候选生物标志物可用于任何感染性疾病的医疗干预。

在一些实施方案中，所述感染是由病原性病毒感染引起的，根据所提供的方法可以对其鉴定候选生物标志物。可以根据所提供的方法鉴定其候选生物标志物的病原性病毒感染的非限制性实例包括由病毒引起的感染，所述病毒可见于以下病毒科，并用示例性种来说明：a)腺病毒科(Adenoviridae)，如腺病毒种；b)疱疹病毒科(Herpesviridae)，如1型单纯疱疹、2型单纯疱疹、水痘-带状疱疹病毒、EB病毒(Epstein-barr virus)、人巨细胞病毒、8型人疱疹病毒种；c)乳头瘤病毒科(Papillomaviridae)，如人乳头瘤病毒种；d)多瘤病毒科(Polyomaviridae)，如BK病毒、JC病毒种；e)痘病毒科(Poxviridae)，如天花种；f)肝脱氧核糖核酸病毒科(Hepadnaviridae)，如乙型肝炎病毒种；g)细小病毒科(Parvoviridae)，如人博卡病毒、细小病毒B19种；h)星形病毒科(Astroviridae)，如人星形病毒种；i)嵌杯样病毒科(Caliciviridae)，如诺沃克病毒(Norwalk virus)种；j)黄病毒科(Flaviviridae)，如丙型肝炎病毒、黄热病病毒、登革热病毒、西尼罗病毒种；k)披膜病毒科(Togaviridae)，如风疹病毒种；l)戊型肝炎病毒科(Hepeviridae)，如戊型肝炎病毒种；m)逆转录病毒科(Retroviridae)，如人免疫缺陷病毒(HIV)种；n)正粘病毒科(Orthomyxoviridaw)，如流感病毒种；o)砂粒样病毒科(Arenaviridae)，如瓜纳里托病毒(Guanarito virus)、呼宁病毒(Junin virus)、拉沙病毒(Lassa virus)、马秋博病毒(Machupo virus)和/或萨比亚病毒(Sabiá virus)种；p)本扬病毒科(Bunyaviridae)，如克里米亚-刚果出血热病毒(Crimean-Congo hemorrhagic fever virus)种；q)纤丝病毒科(Filoviridae)，如埃博拉病毒和/或马尔堡病毒(Marburg virus)种；副粘病毒科(Paramyxoviridae)，如麻疹病毒、腮腺炎病毒、副流感病毒、呼吸道合胞体病毒、人偏肺病毒、亨德拉病毒(Hendra virus)和/或尼帕病毒(Nipah virus)种；r)弹状病毒科(Rhabdoviridae)属，如狂犬病病毒种；s)呼肠孤病毒科(Reoviridae)，如轮状病毒、环状病毒、科罗拉多壁虱热病毒(Coltivirus)和/或版纳病毒(Banna virus)种；t)黄病毒科，如寨卡病毒。在一些实施方案中，病毒未指定的病毒科，如丁型肝炎。

在一些实施方式中，所述感染是由病原体引起的细菌感染，包括链球菌属(Streptococcus)(酿脓链球菌(Streptococcus pyogenes)、绿色链球菌(Streptococcusviridans))、葡萄球菌属(Staphylococcus)(金黄色葡萄球菌(Staphylococcus aureus)、表皮葡萄球菌(Staphylococcus epidermidis)、腐生性葡萄球菌(Staphylococcussaprophyticus))、铜绿假单胞菌(Pseudomonas aeruginosa)、洋葱伯克霍尔德菌(Burkholderia cenocepacia)、分枝杆菌属(Mycobacterium)(麻风分枝杆菌(M.leprae)、结核分枝杆菌(M.tuberculosis)、鸟分枝杆菌(M.avium))、衣氏放线菌(Actinomycesisraelii)、炭疽芽孢杆菌(Bacillus anthracis)、脆弱拟杆菌(Bacteroides fragilis)、百日咳博德特氏菌(Bordetella pertussis)、疏螺旋体属(Borrelia)(伯氏疏螺旋体(B.burgdorferi)、嘎氏疏螺旋体(B.garinii)、包柔氏疏螺旋体(B.afzelii))、空肠弯曲菌(Campylobacter jcjuni)、衣原体属(Chlamydia)(肺炎衣原体(C.pneumoniae)、沙眼衣原体(C.trachomatis))、鹦鹉衣原体(Chlamydophila psittaci)、梭菌属(Clostridium)(肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、产气荚膜梭菌(C.perfringens)、破伤风梭菌(C.tetani))、肠球菌属(Enteroccus)(粪肠球菌(E.faecalis)、屎肠球菌(E.faecium))、埃希氏菌属(Escheridia)(大肠杆菌(E.coli)、产肠毒素的大肠杆菌、肠致病性大肠杆菌、肠侵害性大肠杆菌、肠出血性(EHEC)，包括大肠杆菌O157：H7)、土拉热弗朗西丝菌(Francisella tularensis)、流感嗜血杆菌(Haemophilus influenzae)、幽门螺杆菌(Helicobacter pylori)、肺炎克雷伯氏菌(Klebsiella pneumoniae)、肺炎军团菌(Legionella pneumophila)、钩端螺旋体属(Leptospira)的种、肺炎支原体(Mycoplasmapneumoniae)、星状诺卡尔菌(Nocardia asteroides)、志贺菌属(Shigella)(宋内志贺菌(S.sonnel)、痢疾志贺菌(S.dysenteriae))、梅毒螺旋体(Treponema pallidum)和霍乱弧菌(Vibrio cholerae)。专性细胞内寄生虫(例如，嗜衣原体属(Chlamydophila)、埃利希体属(Ehrlichia)(犬埃里希体(E.canis)、沙费埃里希体(E.chaffeensis))、立克次体属(Rickettsia)、沙门氏菌属(Salmonella)(伤寒沙门氏菌(S.typhi))、其它沙门氏菌，例如鼠伤寒沙门氏菌(S.typhimurium))、奈瑟氏球菌属(Neisseria)(淋病奈瑟氏球菌(N.gonorrhoeae)、脑膜炎奈瑟氏球菌(N.meningitides))、布鲁氏菌属(Brucella)(流产布鲁氏菌(B.abortus)、犬布鲁氏菌(B.canis)、羊布鲁氏菌(B.melitensis)、猪布鲁氏菌(B.suis))、分枝杆菌属(Mycobacterium)、诺卡氏菌属(Nocardia)、李斯特氏菌属(Listeria)如单核细胞增生李斯特氏菌(Listeria monocytogenes)、弗朗西斯氏菌属(Francisella)、军团菌属(Legionella)和鼠疫耶尔森氏菌(Yersinia pestis)。由细菌病原体引起的感染还包括性传播疾病，包括由杜氏嗜血菌(Haemophilus ducreyi)引起的软下疳、由沙眼衣原体引起的衣原体病)、淋病(淋病奈瑟氏菌)、腹股沟肉芽肿或(肉芽肿克雷伯氏菌(Klebsiella granulomatis))、生殖支原体(Mycoplasma genitalium)、人支原体(Mycoplasma hominis)、梅毒(梅毒螺旋体)和脲原体感染。

在一些实施方案中，受试者罹患原生动物感染，其为由先前归类为原生动物界的生物体引起的寄生虫病。它们包括被分类为变形虫界(Amoebozoa)、Excavata和囊泡藻界(Chromalveolata)的生物体。实例包括溶组织内阿米巴(Entamoeba histolytica)、棘阿米巴属(Acanthamoeba)；狒狒巴拉姆希阿米巴(Balamuthia mandrillaris)和内阿米巴(Endolimax)；疟原虫属(Plasmodium)(其中一些会引起疟疾)和兰伯贾第虫(Giardialamblia)^[2]。由采采蝇传播的、作为非洲昏睡病病因的布氏锥虫是另一个实例。原生动物的其它非限制性实例可见于以下科，并用示例性种来说明：a)克氏锥虫种；布氏锥虫(Trypanosoma brucei)种；刚地弓形虫(Toxoplasma gondii)种；恶性疟原虫(Plasmodiumfalciparum)种；溶组织内阿米巴种和兰伯贾第虫种。在实施例中证明了所提供的方法鉴定感染性疾病的候选生物标志物的能力，其表明，判别肽可以鉴定来自感染有原生动物克氏锥虫(其引起查加斯病，也被称为美洲锥虫病)的受试者的样品中的候选生物标志物。

在其它实施方案中，所述感染是真菌感染，即真菌病，包括浅表真菌病、皮肤真菌病、皮下真菌病、主要病原体引起的全身性真菌病和致病真菌引起的全身性真菌病，包括假丝酵母属(candida)的种、曲霉属(Aspergillus)的种、隐球酵母属(Cryptoccocus)的种、组织胞浆菌属(Histoplasma)的种、肺孢子虫属(Pneumocystis)的种、葡萄穗霉属(Stachybitrys)的种和吸热菌属(Endothermy)的种。

在其它实施方案中，所述感染是可传播性海绵状脑病(TSE)，其属于影响包括人在内的许多动物的脑(脑病)和神经系统的一组进行性病况，并且是由朊病毒感染引起的，朊病毒是可传播的病原体。根据最普遍的假说，它们由朊病毒传播，尽管其它一些数据提示涉及螺原体属(Spiroplasma)感染。人类的朊病毒疾病包括经典的克雅氏病、新的克雅氏病变种(nvCJD，一种与牛海绵状脑病有关的人类疾病)、Gerstmann--Scheinker综合征、家族致命性失眠症、库鲁病以及最近发现的可变蛋白酶敏感的朊病毒病(prionopathy)。

在一些实施方案中，所述感染是寄生虫蠕虫病，也被称为蠕虫感染，其为人和其它动物的任何宏观寄生虫病，其中身体的一部分被称为蠕虫的寄生蠕虫感染。这些寄生虫种类繁多，大致分类为绦虫、吸虫和蛔虫。它们通常生活在宿主的胃肠道中，但也可能潜入其它器官，从而诱发生理损伤。在所有已知的蠕虫种中，在来自干粪便、粪便污泥、废水和污水污泥的人类排泄物样品中就了解其传播途径、其控制、失活和计数而言最重要的蠕虫是：土壤传播的蠕虫，包括似蚓蛔线虫(Ascaris lumbricoides)(全球最常见)、毛首鞭形线虫(Trichuris trichiura)、美洲板口线虫(Necator americanus)、粪类圆线虫(Strongyloides stercoralis)和十二指肠钩虫(Ancylostoma duodenale)；短膜壳绦虫(Hymenolepis nana)；牛肉绦虫(Taenia saginata)；蛲虫(Enterobius)；肝片形吸虫(Fasciola hepatica)；曼森血吸虫(Schistosoma mansoni)；犬弓蛔虫(Toxocara canis)；和猫弓蛔虫(Toxocara cati)。蠕虫病分类如下(疾病名称以“-病”结尾，而致病蠕虫置于括号中)：蛔虫感染(线虫病)：丝虫病(班氏吴策线虫(Wuchereria bancrofti)、马来布鲁线虫(Brugia malayi)感染)；盘尾丝虫病(旋盘尾丝虫(Onchocerca volvulus)感染)；土壤传播的蠕虫病——包括蛔虫病(似蚓蛔线虫感染，鞭虫病(鞭虫(Trichuris)感染)和钩虫感染(包括美洲钩虫病和十二指肠钩虫感染)；毛圆线虫病(毛圆线虫(Trichostrongylus spp.)感染)；龙线虫病(麦地那龙线虫感染)；绦虫感染(绦虫病)；棘球蚴病(棘球绦虫(Echinococcus)感染)；膜壳绦虫病(膜壳绦虫(Hymenolepis)感染)；绦虫病/囊虫病(绦虫(Taenia)感染)；多头蚴病(T.multiceps、T.serialis、T.glomerata和T.brauni感染)；吸虫感染(吸虫病)；双口吸虫病(双口吸虫(amphistomes)感染)；华支睾吸虫病(华支睾吸虫(Clonorchis sinensis)感染)；肝片吸虫病(片形属(Fasciola)感染)；姜片吸虫病(布氏姜片吸虫(Fasciolopsis buski)感染)；后睾吸虫病(后睾吸虫感染)；并殖吸虫病(并殖吸虫(Paragonimus)感染)；血吸虫病/裂体吸虫病(血吸虫感染)；和棘头虫感染：念珠棘虫(Moniliformis)感染。

在其它实施方案中，所述感染是蜱传感染，包括微粒孢子虫病、巴贝虫病、埃里希体病、莱姆病(包柔氏螺旋体感染)、波瓦桑病毒感染、斑疹热立克次体病，包括落基山斑疹热(RMSF)和斑疹伤寒。

对于每种疾病，感染性生物体的时间线以及个体相应的症状变化可能会有所不同。例如，在查加斯病中，受感染的个体最初会经历4-8周的急性期，表现为进入部位的眶周肿胀或溃疡性病变，并与通过血流循环的高水平寄生虫有关。这转变为无症状的、不确定的阶段，该阶段通常是终生感染，其特征是寄生虫血症的丧失以及原生动物被隔离在宿主器官的肌肉和脂肪细胞中[Perez CJ等人，Lymbery AJ，Thompson RC(2014)TrendsParasitol 30：176-182]。十到三十年后，三分之一或更多的不确定期个体将发展为慢性的、有症状的阶段，并将遭受严重的心脏、胃或其它器官相关疾病的表现，这导致不可逆的肌肉损伤，并通常在进入慢性阶段后两年内死亡[Viotti R等人，(2006)Ann Intern Med144：724-734；Granjon E等人，(2016)PLoS Negl Trop Dis 10：e0004596；Oliveira GBF等人，(2015)Global Heart 10：189-192]。另外，在免疫功能低下的患者中，包括共感染HIV的患者或接受癌症或自身免疫性疾病治疗的患者中，查加斯病的再激活已有文献记载[RassiJr A等人，(2010)；Pinazo MJ等人，(2013)PLoS Negl Trop Dis 7：e1965]。

WHO最近估计，未来五年，约有200,000人将死于查加斯心肌病。这相当于在相同的时间范围内预计在美国死于乳腺癌的女性人数[Pecoul B等人，(2016)PLoS Negl TropDis 10：e0004343]。

没有针对查加斯病的疫苗，唯一的预防方法是控制昆虫载体的传播。在过去的40年中，只有两种药物——苄硝唑和硝呋替莫——可用于治疗[Rassi Jr A等人，(2010)，Clayton J(2010)Nature 465：S4-S5]。它们已显示出对急性期感染的可变但显著的有效性，但对具有慢性表现者或对于预防从亚临床疾病转变为有症状疾病，已证明几乎没有治疗价值[Issa VS和Bocchi EA(2010)The Lancet 376：768.；Morillo CA等人，(2015)NewEngland Journal of Medicine 373：1295-1306]。药物疗效的不可预测性、较差的利用度以及已知的副作用已使其用药占诊断的查加斯病患者的不到1％[Clayton J(2010)；Viotti R等人，(2009)Expert Rev Anti Infect Ther 7：157-163]。一些接受治疗的患者经历了需要停止治疗的不良并发症[Viotti R等人，(2006)]。当前尚无工具来确定哪些患者将从治疗中受益而不是受到伤害。

最近，人们对发现更安全、更有效的对抗克氏锥虫感染的新药物的兴趣日益增加[De Rycker M等人，(2016)PLoS Negl Trop Dis 10：e0004584]。但是，由于缺乏可靠、实用的在亚临床和慢性期评估药物疗效的方法，因此阻碍了新药的开发。在测定感染状态和确定治疗影响方面存在许多困难[Gomes YM等人，(2009)Mem Inst Oswaldo Cruz 104Suppl1：115-121]。例如，寄生虫血症是不明显的(subpatent)，低水平的组织寄生虫在解剖上分散，与其它地方性流行病如利什曼病和疟疾存在抗原相似性，缺乏可靠的始发性或活动性疾病标志物，并且症状发展滞后于初始感染后数十年[Keating SM等人(2015)Int JCardiol 199：451-459]。总之，需要一种将查加斯血清阳性个体分层为临床上不同的组的方法。例如，将那些在急性期后仍然感染的个体与感染已消除的个体区分开是至关重要的。因此，希望预测在不确定期个体中的哪些感染个体将从临床沉默进展为具有威及生命的并发症。

可通过血液显微镜检查、血培养、病媒接种诊断法或从外周血细胞中提取的核酸的PCR来进行克氏锥虫寄生虫的直接检测。然而，这些测定不灵敏，被认为在慢性疾病阶段无法提供有效信息。在诊所和血库中，诊断依赖于血清学间接检测。ELISA试验可用于检测针对粗寄生虫裂解物的克氏锥虫抗体(Ortho克氏锥虫ELISA)，半纯化的体外培养的上鞭毛体部分，或四种重组蛋白的混合物(Abbott PRISM和ESA Dot Blot)。FDA已经批准了Ortho和Abbott检验，这些检验报告查加斯病的信号/截止值(S/CO)，该值可量化血浆中的抗原结合水平并反映抗体效价。遗憾的是，这些检验平台之间和内部的不确定性和不一致的结果是持续存在的问题，交叉反应性和假阳性的时常发生也是存在的问题。因此，尽管FDA没有批准或被认为是查加斯诊断的参考标准，但仍使用确认性血清学检验来提高准确度。放射免疫沉淀测定(克氏锥虫RIPA)是对上鞭毛体裂解物的反应性抗体的更特异性的定性检验，被某些血库常规用作确认性检验[Tobler LH等人，(2007)Transfusion 47：90-96]。其它测定，例如，ESA(ELISA条测定)[Cheng KY等人，(2007)Clinical and Vaccine Immunology14：355-361]、Architect Chagas试剂盒[Praast G等人，(2011)Diagnostic Microbiologyand Infectious Disease 69：74-81]以及Granjon等人(2016)的测定，利用来自克氏锥虫的重组抗原。普遍认为，克氏锥虫的复杂蛋白质组和生命周期需要发现另外的抗原[DePablos LM和Osuna A(2012)Infection and Immunity 80：2258-2264]。人类对克氏锥虫感染的免疫应答的多样性[Chatelain E(2017)]也证明了需要使用许多目标来准确确定任何预期使用的大群体中的阳性，特别是那些具有无症状疾病的群体。已经证明了需要新的经过验证的标志物和新方法来测量克氏锥虫感染状态和监测疾病活动性[Pinazo MJ等人，(2013)；Pinazo MJ等人，(2014)Expert Rev Anti Infect Ther 12：479-496]

建立所需检验的前提条件是开发单一的强大平台，该平台可以准确且可再现地检测多样性的无症状群体如献血者中的查加斯病。另外，期望一个检测能够同时诊断查加斯病和其它疾病感染，包括由与克氏锥虫在同一地理区域流行的其它病原体(例如西尼罗病毒(WNV))引起的感染。对于血库，这也将包括诸如乙型肝炎(HBV)和丙型肝炎(HCV)等病毒。

当前的血液检验实验室使用单独的一系列测定，每种测定都与查加斯系列一起在所有血液样品上进行，以确保美国无传染病产品的输血接受者[McCullough J(1993)JAMA269：2239-2245]。除了血清学筛查之外，针对不同病毒系列的检验还包括基于合并和分配方案的核酸筛查[Busch MP等人，(2008)J Infect Dis 198：984-993]。

与查加斯病的情况类似，许多感染了乙型肝炎和丙型肝炎病毒的受试者在初始感染期间没有症状，而且许多发生慢性疾病的受试者仍然无症状。另外，无论哪种肝炎，病毒性肝炎的症状(如果存在)都是相似的。多年后，感染通常导致肝病和肝硬化，进而可发展为诸如肝功能衰竭和肝癌等并发症。用于检测HBV和HCV感染的测定包括检测病毒抗原或宿主产生的抗体的检验。但是，这些测定的解释很复杂。此外，HBV和HCV的检测并非常规进行的，宿主中严重并发症的发生和病毒的传播仍未得到检查。

同样，由西尼罗病毒引起的蚊媒感染在大约80％的人中可能不会产生任何症状。如果不加以治疗，会发展成神经疾病，包括西尼罗脑炎、西尼罗脑膜炎、WN脑膜脑炎和WN脊髓灰质炎。许多疾病可能会出现与临床WNV感染引起的症状类似的症状，例如肠病毒感染和细菌性脑膜炎。在WNV的确诊中，鉴别诊断的考虑至关重要，而包括PCR和病毒培养在内的诊断和血清学检验对于鉴定引起症状的具体病原体是必要的。

样品

根据所提供的方法使用的样品可以是任何生物样品。例如，该生物样品可以是包含抗体的生物液体样品。合适的生物液体样品包括但不限于血液、血浆、血清、汗液、泪液、痰液、尿液、粪便水、耳流体、淋巴液、唾液、脑脊髓液、破坏液、骨髓悬浮液、阴道流、经宫颈灌洗液、滑液、房水、羊水、耳垢、母乳、支气管肺泡灌洗液、脑液、囊液、胸膜和腹膜液、心包液、腹水、乳汁、胰液、呼吸道分泌物、肠道和泌尿生殖道、羊水、乳汁和白细胞去除样品。生物样品还可以包括囊胚腔、脐带血或母体循环，其可以是胎儿或母体来源的。在一些实施方案中，该样品是容易通过非侵入性方法获得的样品，例如，血液、血浆、血清、汗液、泪液、痰液、尿液、痰液、耳流体或唾液。在某些实施方案中，该样品是外周血样品，或外周血样品的血浆或血清部分。如本文所用的，术语“血液”、“血浆”和“血清”明确包括其部分或加工部分。

由于血液的微创可及性及容易获得性，因此血液是在常规临床实践中测量的最优选且常用的人体体液。此外，血液灌注全身组织及其组成因此作为个体的整体生理学指标是相关的。在一些实施方案中，用于获得免疫特征/抗体结合谱的生物样品是血液样品。在其它实施方案中，生物样品是血浆样品。在其它实施方案中，生物样品是血清样品。在其它实施方案中，生物样品是经干燥的血液样品。生物样品可以通过第三方，例如不进行抗体结合谱分析的一方，和/或对肽阵列进行结合测定的一方获得。例如，样品可以通过临床医生、医师或从中获得样品的受试者的其它卫生保健管理人员获得。或者，生物样品可以由进行样品与肽阵列的结合测定的一方，和/或分析抗体结合谱/IS的同一方获得。待测定的生物样品可以存档(例如，冷冻)或以其它方式在贮藏条件下储存。

术语“患者样品”和“受试者样品”在本文中可互换使用，是指从患者(即医疗照顾、医护或治疗的接受者)获得的样品，例如，生物样品。受试者样品可以是本文所述的任何样品。在某些实施方案中，受试者样品通过非侵入性程序获得，例如外周血样品。

根据使用有限量样品提供的方法，可以获得样品中循环抗体的抗体结合谱。例如，阵列上的肽可以与一毫升血液的一部分接触，以获得包含足够数量的信息性肽-蛋白质复合物的抗体结合谱，以鉴定受试者的健康状况。

在一些实施方案中，获得抗体结合谱所需的生物样品的体积小于10ml、小于5ml、小于3ml、小于2ml、小于1ml、小于900ul、小于800ul、小于700ul、小于600ul、小于500ul、小于400ul、小于300ul、小于200ul、小于100ul、小于50ul、小于40ul、小于30ul、小于20ul、小于10ul、小于1ul、小于900nl、小于800nl、小于700nl、小于600nl、小于500nl、小于400nl、小于300nl、小于200nl、小于100nl、小于50nl、小于40nl、小于30nl、小于20nl、小于10nl或小于1nl。在一些实施方案中，可将生物流体样品稀释数倍以获得抗体结合谱。例如，可将从受试者获得的生物样品稀释至少2倍、至少4倍、至少8倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少5000倍或至少10,000倍。抗体存在于稀释的血清样品中，并且被认为对受试者的健康具有重要意义，因为如果抗体即使在稀释的血清样品中仍然存在，则它们必须合理地以相对高的量存在于患者的血液中。

在实施例中给出了根据本文所述方法检测受试者疾病的示例。实施例表明，仅使用90微升血清或血浆就可以正确诊断感染。

治疗和状况

本发明的方法和阵列提供用于鉴定判别肽的方法、测定和装置，该判别肽可用于筛查感染，以及鉴定感染的候选生物标志物。本文公开的实施方案的方法和阵列可用于，例如，筛查感染和/或鉴定受试者中感染的一种或多种候选生物标志物。受试者可以是人、豚鼠、狗、猫、马、小鼠、兔和各种其它动物。受试者可以是任何年龄，例如，受试者可以是婴儿、幼儿、儿童、青春期前儿童、青少年、成年或老年个体。

本发明的阵列和方法可以由使用者使用。许多使用者可使用本发明的方法来鉴定状况和/或提供状况的治疗。使用者可以是，例如，希望监测其自身健康的人。使用者可以是，例如，卫生保健提供者。卫生保健提供者可以是，例如，医师。在一些实施方案中，使用者是照顾受试者的卫生保健提供者。可以是本发明的使用者的医师和卫生保健提供者的非限制性实例可包括麻醉师、减肥手术专业人员、血库输血医学专业人员、心脏电生理学医生、心脏外科医生、心脏病科医生、注册护理助理、临床心脏电生理学专业人员、临床神经生理学专业人员、临床护理专业人员、结直肠外科医生、重症护理医学专业人员、重症护理外科手术专业人员、牙科保健员、牙科医生、皮肤科医师、急诊医疗技师、急诊医学医师、胃肠外科医生、血液病医生、临终关怀和姑息医学专业人员、顺势疗法专业人员、传染病专业人员、内科医生、颌面外科医生、医务助理、体检医生(medical examiner)、医学遗传学家、医疗肿瘤学家、助产师、新生儿-围产期专业人员、肾病医生、神经科医生、神经外科医生、核医学专业人员、护士、开业护士、产科医师、肿瘤科医生、口腔外科医生、口腔正畸医师、整形外科专业人员、疼痛控制专业人员、病理学医师、儿科医师、灌注师、牙周病医师、整形外科医生、足病医生、直肠科医生、假肢专业人员、精神科医生、肺脏科医生、放射科医生(radiologist)、外科医生、胸科专业人员、移植专业人员、血管专业人员、血管外科医生和兽医。利用本发明的阵列和方法确定的诊断可并入受试者的病历中。

阵列平台

在一些实施方案中，本文公开了提供允许增加化学文库合成的多样性和保真度的阵列平台的方法和过程。阵列平台包含阵列表面上的多个单独特征。每个特征通常包含任选地在阵列表面上原位合成的多个单独分子，其中分子在特征内是相同的，但是分子的序列或同一性在特征之间不同。阵列分子包括但不限于核酸(包括DNA、RNA、核苷、核苷酸、结构类似物或其组合)、肽、肽-模拟物及其组合等，其中阵列分子可包含分子中的天然或非天然单体。这样的阵列分子包括大合成肽阵列的合成。在一些实施方案中，阵列中的分子为模拟表位，一种模拟表位结构并能够结合表位引发的抗体的分子。在一些实施方案中，阵列中的分子为互补位或互补位模拟物，其包含与抗原表位结合的抗体(或T细胞受体)的可变区中的位点。在一些实施方案中，本发明的阵列为包含随机、伪随机或最大多样化肽序列的肽阵列。

所述肽阵列可包括与充分表征的单克隆抗体(mAb)的表位相匹配的对照序列。可以测量与对照序列以及与文库肽的结合模式，以使阵列和免疫特征测定过程符合要求。具有已知表位的mAb，例如4C1、p53Ab1、p53Ab8和LnKB2，可以以不同的剂量测定。此外，晶片间的信号精度可以通过测试来自不同晶片的阵列上的样品重复物，例如血浆样品，并计算所有文库肽的变异系数(CV)来确定。结合信号的测量精度可以被确定为在相同批次(在晶片批次内)晶片上合成的阵列上发生的阵列间、玻片间、晶片间和日间变化的集合。此外，可以针对不同批次(在晶片批次之间)晶片上的阵列确定测量精度。在一些实施方案中，可以在晶片批次之内和/或之间进行结合信号的测量，其精度变化小于5％、小于10％、小于15％、小于20％、小于25％或小于30％。

本文公开的技术包括光刻阵列合成平台，该光刻阵列合成平台合并半导体制造过程和组合化学合成以在硅晶片上产生基于阵列的文库。通过利用光刻特征图案化的巨大进步，该阵列合成平台具有高度可扩展性，并且能够在8英寸晶片上产生具有4000万个特征的组合化学文库。使用半导体晶片生产设备在10,000级洁净室中进行光刻阵列合成，以实现高再现性。当将晶片切割成标准显微镜载玻片尺寸时，每个载玻片含有超过300万个不同的化学实体。

在一些实施方案中，具有通过本文公开的光刻技术产生的化学文库的阵列用于基于免疫的诊断测定，例如被称为免疫特征测定。使用来自与阵列结合的一滴血液的患者抗体组库(repertoire)，结合阵列的荧光结合谱图像提供了足以对疾病与健康进行分类的信息。

在一些实施方案中，正在开发用于临床应用的免疫特征测定以诊断/监测感染性疾病并评估对感染治疗的反应。免疫特征测定的示例性实施方案详细描述于名称为“Compound Arrays for Sample Profiling”的美国授权前公开号2012/0190574和名称为“Immunosignaturing：A Path to Early Diagnosis and Health Monitoring”的美国授权前公开号2014/0087963”中，对于这样的公开内容，这两篇申请都通过引用并入本文。本文开发的阵列使用包括椭圆偏光法、质谱分析法和荧光的正交分析方法在每个合成阵列内并入分析测量能力。这些测量能够对阵列合成性能进行纵向定性和定量评估。

在一些实施方案中，所述阵列是基于晶片的光刻原位肽阵列，其使用可重复使用的掩模和自动化以获得可扩展数目的组合序列肽的阵列来产生。在一些实施方案中，该肽阵列包含至少5,000个、至少10,000个、至少15,000个、至少20,000个、至少30,000个、至少40,000个、至少50,000个、至少100,000个、至少200,000个、至少300,000个、至少400,000个、至少500,000个、至少1,000,000个、至少2,000,000个、至少3,000,000个、至少4,000,000个、至少5,000,000个、至少10,000,000个、至少100,000,000个或更多个具有不同序列的肽。每个不同序列肽的多个拷贝可以位于晶片上被称为特征的可寻址位置。

在一些实施方案中，在肽阵列上检测抗体结合提出了一些可通过本文公开的技术解决的挑战。因此，在一些实施方案中，本文公开的阵列和方法利用阵列表面上的特定涂层和官能团密度，其可调节进行免疫特征测定所必需的所需性质。例如，通过用适度亲水的单层聚乙二醇(PEG)、聚乙烯醇、羧甲基葡聚糖及其组合涂覆硅表面，可以使肽阵列上的非特异性抗体结合最小化。在一些实施方案中，所述亲水单层是均匀的。其次，使用使肽远离表面移动的间隔体将合成的肽与硅表面连接，使得肽以无阻碍的方向呈递给抗体。

原位合成的肽文库是与疾病无关的，并且可以在事先不知道要诊断的疾病的情况下进行合成。可以使用相同的阵列来确定任何健康状况。

如本文所用的术语“肽”是指在线性或环状链中连接在一起的多个氨基酸。对于本发明而言，术语肽不限于任何特定数目的氨基酸。然而，优选地，它们包含至多约400个氨基酸、至多约300个氨基酸、至多约250个氨基酸、至多约150个氨基酸、至多约70个氨基酸、至多约50个氨基酸、至多大约40个氨基酸、至多30个氨基酸、至多20个氨基酸、至多15个氨基酸、至多10个氨基酸或至多5个氨基酸。在一些实施方案中，阵列的肽为5至30个氨基酸、5至20个氨基酸或5至15个氨基酸。构成肽分子的全部或部分的氨基酸可以是二十种常规的、天然存在的氨基酸中的任何氨基酸，即，丙氨酸(A)、半胱氨酸(C)、天冬氨酸(D)、谷氨酸(E)、苯丙氨酸(F)、甘氨酸(G)、组氨酸(H)、异亮氨酸(L)、赖氨酸(L)、亮氨酸(L)、甲硫氨酸(M)、天冬酰胺(N)、脯氨酸(P)、谷氨酰胺(Q)、精氨酸(R)、丝氨酸(S)、苏氨酸(T)、缬氨酸(V)、色氨酸(W)和酪氨酸(Y)。构成本发明阵列的肽中的任何氨基酸均可被非常规氨基酸替代。通常，保守替代是优选的。在一些实施方案中，阵列上的肽是由不到20种氨基酸合成的。在一些实施方案中，在肽的合成过程中排除甲硫氨酸、半胱氨酸、异亮氨酸和苏氨酸中的一种或多种氨基酸。

数字处理设备

在一些实施方案中，本文所述的系统、平台、软件、网络和方法包括数字处理设备或其应用。在进一步的实施方案中，数字处理设备包括一个或多个硬件中央处理单元(CPU)，即执行设备功能的处理器。在更进一步的实施方案中，数字处理设备进一步包含被配置为执行可执行指令的操作系统。在一些实施方案中，数字处理设备任选地连接计算机网络。在进一步的实施方案中，数字处理设备任选地连接到因特网，使其可访问万维网。在更进一步的实施方案中，数字处理设备任选地连接到云计算基础设施。在其它实施方案中，数字处理设备任选地连接到内联网。在其它实施方案中，数字处理设备任选地连接到数据存储设备。

根据本文的描述，作为非限制性实例，合适的数字处理设备包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、小型笔记本型计算机、上网本计算机、记事本计算机、机顶计算机、手持式计算机、互联网设备、移动智能电话、平板计算机、个人数字助理、视频游戏控制台和媒介物。本领域技术人员将会认识到，许多智能电话适用于本文所述的系统。本领域技术人员还将认识到，具有可选计算机网络连接的选择电视、视频播放器和数字音乐播放器适用于本文所述的系统。合适的平板计算机包括具有本领域技术人员已知的小册子、平板和可转换配置的平板计算机。

在一些实施方案中，数字处理设备包括被配置为执行可执行指令的操作系统。该操作系统是例如包含程序和数据的软件，该软件管理设备的硬件并为应用程序的执行提供服务。本领域技术人员将认识到，作为非限制性实例，合适的服务器操作系统包括FreeBSD、OpenBSD、Linux、 Mac OS X Windows和本领域技术人员将认识到，作为非限制性实例，合适的个人计算机操作系统包括 Mac 和类似UNIX的操作系统如GNU/在一些实施方案中，操作系统由云计算提供。本领域技术人员还将认识到，作为非限制性实例，合适的移动智能电话操作系统包括 OS、Research In BlackBerry Windows OS、Windows OS、和

在一些实施方案中，数字处理设备包括存储和/或存储器设备。该存储设备和/或存储器设备是用于临时或永久地存储数据或程序的一个或多个物理设备。在一些实施方案中，该设备是易失性存储器且需要电力来维护存储的信息。在一些实施方案中，该设备是非易失性存储器，并且在数字处理设备未通电时保留存储的信息。在进一步的实施方案中，非易失性存储器包含闪速存储器。在一些实施方案中，非易失性存储器包含动态随机存取存储器(DRAM)。在一些实施方案中，非易失性存储器包含铁电随机存取存储器(FRAM)。在一些实施方案中，非易失性存储器包含相变随机存取存储器(PRAM)。在其它实施方案中，该设备是存储设备，作为非限制性实例，该存储设备包括CD-ROM、DVD、闪速存储器设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储器。在进一步的实施方案中，存储和/或存储器设备是诸如本文公开的那些设备的组合。

在一些实施方案中，数字处理设备包括用于向用户发送视觉信息的显示器。在一些实施方案中，该显示器是阴极射线管(CRT)。在一些实施方案中，该显示器是液晶显示器(LCD)。在进一步的实施方案中，该显示器是薄膜晶体管液晶显示器(TFT-LCD)。在一些实施方案中，该显示器是有机发光二极管(OLED)显示器。在各种其它实施方案中，在OLED显示器上是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施方案中，该显示器是等离子显示器。在其它实施方案中，该显示器是视频投影仪。在更进一步的实施方案中，该显示器是诸如本文公开的那些设备的组合。

在一些实施方案中，数字处理设备包括用于从用户接收信息的输入设备。在一些实施方案中，该输入设备是键盘。在一些实施方案中，该输入设备是指向设备，作为非限制性实例，该指示设备包括鼠标、跟踪球、跟踪板、操纵杆、游戏控制器或触笔。在一些实施方案中，该输入设备是触摸屏或多点触摸屏。在其它实施方案中，该输入设备是用于捕获语音或其它声音输入的麦克风。在其它实施方案中，该输入设备是用于捕获运动或视觉输入的摄像机。在更进一步的实施方案中，该输入设备是诸如本文公开的那些设备的组合。

在一些实施方案中，数字处理设备包括数码相机。在一些实施方案中，数码相机捕捉数字图像。在一些实施方案中，该数码相机是自动对焦相机。在一些实施方案中，数码相机是电荷耦合器件(CCD)相机。在进一步的实施方案中，数码相机是CCD摄像机。在其它实施方案中，数码相机是互补金属氧化物半导体(CMOS)相机。在一些实施方案中，数码相机捕捉静止图像。在其它实施方案中，数码相机捕捉视频图像。在各种实施方案中，合适的数码相机包括100万、200万、300万、400万、500万、600万、700万、800万、900万、1000万、1100万、1200万、1300万、1400万、1500万、1600万、1700万、1800万、1900万、2000万、2100万、2200万、2300万、2400万、2500万、2600万、2700万、2800万、2900万、3000万像素和更高像素的相机，包括其中的增量。在一些实施方案中，数码相机是标准清晰度相机。在其它实施方案中，数码相机是HD摄像机。在进一步的实施方案中，HD摄像机捕获具有至少约1280x约720像素或至少约1920x约1080像素的图像。在一些实施方案中，数码相机捕获彩色数字图像。在其它实施方案中，数码相机捕获灰度数字图像。在各种实施方案中，数字图像以任何合适的数字图像格式存储。作为非限制性实例，合适的数字图像格式包括联合图像专家组(JPEG)、JPEG2000、可交换图像文件格式(Exif)、标记图像文件格式(TIFF)、RAW、便携式网络图形(PNG)、图形交换格式(GIF)、位图(BMP)、便携式像素图(PPM)、便携式灰度图(PGM)、便携式位图文件格式(PBM)和WebP。在各种实施方案中，数字图像以任何合适的数字视频格式存储。作为非限制性实例，合适的数字视频格式包括AVI、MPEG、MP4、Windows DivX^TM、Flash Video、Ogg Theora、WebM和RealMedia。

非暂时性计算机可读存储介质

在一些实施方案中，本文公开的系统、平台、软件、网络和方法包括用程序编码的一个或多个非暂时性计算机可读存储介质，该程序包括可由任选的联网的数字处理设备的操作系统执行的指令。在进一步的实施方案中，计算机可读存储介质是数字处理设备的有形组件。在更进一步的实施方案中，计算机可读存储介质任选地可从数字处理设备移除。在一些实施方案中，作为非限制性实例，计算机可读存储介质包括CD-ROM、DVD、闪速存储器设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务器等。在一些情况下，所述程序和指令在介质上永久地、基本上永久地、半永久地或非暂时地编码。

计算机程序

在一些实施方案中，本文公开的系统、平台、软件、网络和方法包括至少一个计算机程序。计算机程序包括可在数字处理设备的CPU中执行的指令序列，该指令序列被编写以进行指定的任务。鉴于本文提供的公开内容，本领域技术人员将认识到，计算机程序可用各种语言的各种版本来编写。在一些实施方案中，计算机程序包含一个指令序列。在一些实施方案中，计算机程序包含多个指令序列。在一些实施方案中，从一个位置提供计算机程序。在其它实施方案中，从多个位置提供计算机程序。在各个实施方案中，计算机程序包括一个或多个软件模块。在各种实施方案中，计算机程序部分或全部包括一个或多个web应用程序、一个或多个移动应用程序、一个或多个独立应用程序、一个或多个web浏览器插件、扩展、加载项或附加项或其组合。

Web应用程序

在一些实施方案中，计算机程序包括web应用程序。鉴于本文提供的公开内容，本领域技术人员将认识到，在各种实施方案中，web应用程序利用一个或多个软件框架和一个或多个数据库系统。在一些实施方案中，基于诸如.NET或Ruby on Rails(RoR)的软件框架创建web应用程序。在一些实施方案中，web应用程序利用一个或多个数据库系统，作为非限制性实例，该数据库系统包括关系数据库系统、非关系数据库系统、面向对象的数据库系统、关联数据库系统和XML数据库系统。在进一步的实施方案中，作为非限制性实例，合适的关系数据库系统包括 SQL服务器、mySQL^TM和本领域技术人员还将认识到，在各种实施方案中，web应用程序以一种或多种语言的一个或多个版本编写。Web应用程序可以用一种或多种标记语言、表示定义语言、客户端脚本语言、服务器端编码语言、数据库查询语言或其组合来编写。在一些实施方案中，web应用程序在某种程度上以诸如超文本标记语言(HTML)、可扩展超文本标记语言(XHTML)或可扩展标记语言(XML)的标记语言编写。在一些实施方案中，web应用程序在某种程度上以诸如级联样式表(CSS)的表示定义语言编写。在一些实施方案中，web应用程序在某种程度上以诸如异步Javascript和XML(AJAX)、动作脚本、Javascript或的客户端脚本语言编写。在一些实施方案中，web应用程序在某种程度上以诸如Active Server Pages(ASP)、Perl、Java^TM、JavaServer Pages(JSP)、超文本预处理器(PHP)、Python^TM、Ruby、Tcl、Smalltalk、或Groovy的服务器端编码语言编写。在一些实施方案中，web应用程序在某种程度上以诸如结构化查询语言(SQL)的数据库查询语言编写。在一些实施方案中，web应用程序集成了诸如 Lotus 的企业服务器产品。在一些实施方案中，用于为艺术家提供允许艺术家上传信息和媒体文件的职业发展网络的网络应用程序包括媒体播放器元件。在各种进一步的实施方案中，媒体播放器元件利用许多合适的多媒体技术中的一种或多种，作为非限制性实例，该多媒体技术包括HTML 5、Java^TM和

移动应用程序

在一些实施方案中，计算机程序包括提供给移动数字处理设备的移动应用程序。在一些实施方案中，移动应用程序在其制造时被提供给移动数字处理设备。在其它实施方案中，经由本文所述的计算机网络将移动应用程序提供给移动数字处理设备。

鉴于本文提供的公开内容，使用本领域已知的硬件、语言和开发环境，通过本领域技术人员已知的技术创建移动应用程序。本领域技术人员将认识到，移动应用程序是用几种语言来编写的。作为非限制性实例，合适的编程语言包括C、C++、C#、Objective-C、Java^TM、Javascript、Pascal、Object Pascal、Python^TM、Ruby、VB.NET、WML和具有或不具有CSS的XHTML/HTML或其组合。

合适的移动应用程序开发环境可从多个来源获得。作为非限制性实例，商业上可用的开发环境包括AirplaySDK、alcheMo、Celsius、Bedrock、FlashLite、.NET Compact Framework、Rhomobile和WorkLight移动平台。其它开发环境可免费获得，作为非限制性实例，该其它开发环境包括Lazarus、MobiFlex、MoSync和Phonegap。此外，移动设备制造商分发软件开发者工具包，作为非限制性实例，该软件开发者工具包包括iPhone和iPad(iOS)SDK、AndroidT^M SDK、 SDK、BREW SDK、 OS SDK、Symbian SDK、webOS SDK和 Mobile SDK。

本领域技术人员将认识到，多个商业论坛可用于分发移动应用程序，作为非限制性实例，该商业论坛包括 App Store、Android^TMMarket、 AppWorld、用于Palm设备的App Store、App Catalog for webOS、 Marketplacefor Mobile、用于设备的Ovi Store、 Apps和 DSi Shop。

独立应用程序

在一些实施方案中，计算机程序包括独立应用程序，该独立应用程序是作为独立计算机进程运行的程序，而不是现有进程的附加项(例如，不是插件)。本领域技术人员将认识到经常编译独立应用程序。编译器是将用编程语言编写的源代码转换为二进制目标代码如汇编语言或机器代码的计算机程序。作为非限制性实例，合适的编译编程语言包括C、C++、Objective-C、COBOL、Delphi、Eiffel、Java^TM、Lisp、Python^TM、Visual Basic和VB.NET或其组合。通常至少部分地执行编译以创建可执行程序。在一些实施方案中，计算机程序包括一个或多个可执行编译的应用程序。

软件模块

在各个实施方案中，本文公开的系统、平台、软件、网络和方法包括软件、服务器和数据库模块。鉴于本文提供的公开内容，使用本领域已知的机器、软件和语言，通过本领域技术人员已知的技术创建软件模块。本文公开的软件模块以多种方式实现。在各种实施方案中，软件模块包含文件、代码段、编程对象、编程结构或其组合。在进一步的各种实施方案中，软件模块包含多个文件、多个代码段、多个编程对象、多个编程结构或其组合。在各种实施方案中，作为非限制性实例，一个或多个软件模块包含web应用程序、移动应用程序和独立应用程序。在一些实施方案中，软件模块在一个计算机程序或应用程序中。在其它实施方案中，软件模块在多于一个计算机程序或应用程序中。在一些实施方案中，软件模块托管在一台机器上。在其它实施方案中，软件模块托管在多于一台机器上。在进一步的实施方案中，软件模块托管在云计算平台上。在一些实施方案中，软件模块托管在一个位置中的一个或多个机器上。在其它实施方案中，软件模块托管在多于一个位置中的一个或多个机器上。

在以下实施例中更详细地描述了本发明，这些实施例不以任何方式限制所要求保护的本发明的范围。附图被认为是本发明说明书和描述的组成部分。提供以下实施例是为了说明，而非限制要求保护的发明。

实施例

实施例1-用于诊断感染的免疫特征方法

根据以下内容，开发了免疫特征测定来检测和区分克氏锥虫、HBV、HCV和WNV感染。

供体样品。对查加斯抗体呈血清阳性的供体血浆样品，以及年龄和性别匹配的健康供体血浆，以及对乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)或西尼罗病毒(WNV)检验呈血清阳性的血浆样品，从Creative Testing Solutions(Tempe，AZ)获得。获得了两个样品组群，一组于2015年，另一组于2016年。接收后，将血浆解冻，与作为冷冻保护剂的乙二醇1∶1混合，并分装成一次性使用的体积。一次性使用的等分试样在-20℃下储存直至需要。剩余的样品体积在-80℃下纯净储存。使用带有二维条形码的管(Micronic，Leystad，theNetherlands)跟踪所有样品的身份。在准备进行测定时，使等分试样在冰上升温至4℃，并在一级孵育缓冲液(含0.05％吐温20(PBST)和1％甘露醇的磷酸盐缓冲盐水)中1∶100稀释。然后将含有1∶100稀释液的微量滴定板稀释至1∶625，以用于测定。对于为了在整个晶片批次中评价平台性能而选择的样品子集，将1∶100的稀释液等分到一次性使用的微量滴定板中，并储存在-80℃下。所有等分和稀释步骤均使用BRAVO自动移液站(Agilent，SantaClara，CA)进行。Western Institutional Review Board审查了使用去识别的库存样品的所有程序(协议编号20152816)。

阵列。设计了126,009个肽的组合文库，其中值长度为9个残基，范围为5至13个氨基酸，以包括16种氨基酸(排除甲硫氨酸，M；半胱氨酸，C；异亮氨酸，I；和苏氨酸，T)的99.9％的所有可能的4-聚体和48.3％的所有可能的5-聚体。使用适用于叔丁氧羰基(BOC)保护基团肽化学的标准半导体光刻工具在200mm氧化硅晶片上合成这些肽(Legutki JB等人，Nature Communications.2014；5：4785)。简言之，用BOC-甘氨酸涂覆氨基硅烷官能化晶片。接下来，通过旋转涂覆将含有通过紫外线激活的光酸产生剂的光致抗蚀剂施加至晶片。通过光掩模将晶片暴露于紫外线(365nm)允许使用给定掩模将固定选择晶片上的特征暴露出来。在暴露于紫外线之后，加热晶片，从而允许暴露的特征的BOC-去保护。随后洗涤，然后通过施加激活的氨基酸完成循环。对于每个循环，将特定氨基酸添加到位于阵列上特定位置的肽的N-末端。重复这些循环，改变掩模和耦合的氨基酸，以实现组合肽文库。从每个晶片切割出具有标准显微镜载玻片尺寸的十三个矩形区域。将每个完成的晶片切割成13个具有标准显微镜载玻片尺寸(25mm x 75mm)的矩形区域。这些载玻片中的每一个含有8行3列的24个阵列。最后，使用标准混合物去除一些氨基酸侧链上的保护基团。将完成的载玻片储存在干燥的氮气环境中直至需要。进行了许多质量测试，确保在工艺规范内制造阵列，该工艺规范包括对每个步骤使用3σ统计限值。通过MALDI-MS间歇地对晶片批次进行采样，以鉴定每个氨基酸在正确的步骤中耦合，从而确保构成组合合成的单个步骤是正确的。经由电子自定义关系数据库从头到尾跟踪晶片制造，该数据库用Visual Basic编写并具有带有SQL后端的访问前端。前端用户界面允许操作员轻松地将生产信息输入数据库。SQL后端允许简单的数据库备份方法，并根据需要与其它计算机系统集成以进行数据共享。通常跟踪的数据包括化学品、配方、时间和执行任务的技术人员。在生产晶片之后，检查数据并锁定和储存记录。最后，如下所述，在结合测定中评价每个批次以确认性能

血浆测定。使用前，通过在蒸馏水中温和搅动1h，在PBS中搅动30min，并在一级孵育缓冲液(PBST，1％甘露醇)中搅动1h，获得生产质量制造的微阵列，并再水合。将载玻片装载到Arraylt微阵列盒(ArrayIt，Sunnyvale，CA)中，以使各个微阵列适应于微量滴定板的足迹。使用液体处理机，在一级孵育缓冲液(PBST，1％甘露醇)中以1∶625的稀释度制备90μl的每个样品，然后转移至盒中。将该混合物在阵列上于37℃孵育1小时，并在TeleShake95(INHECO，Martinsried，Germany)上混合以驱动抗体-肽结合。孵育后，使用BioTek 405TS(BioTek，Winooski，VT)在PBST中将该盒洗涤3次。在次级孵育缓冲液(PBST中的0.5％酪蛋白)中，使用4.0nM与AlexaFluor 555(Thermo-Invitrogen，Carlsbad，CA)缀合的山羊抗人IgG(H+L)或4.0nM与DyLight 550(Novus Biologicals，Littleton，CO)缀合的山羊抗人IgA在37℃下1小时，并在TeleShake95平台混合器上混合，来检测结合的抗体。用次级缓冲液孵育后，再次用PBST洗涤载玻片，随后用蒸馏水洗涤，从盒中取出，用异丙醇喷雾并离心干燥。通过确定每个可寻址肽特征的相对荧光值来获得定量信号测量结果。分别进行ELISA以评估抗IgG与抗IgA第二抗体产物之间的交叉反应性。对于针对IgA单克隆抗体的抗IgG产物，注意到低水平的交叉反应性；对于针对IgG单克隆抗体的抗IgA产物，没有发现反应性。

单克隆测定。在使用供体血浆进行IST测定之前，评价了对应于每个mAb已建立的表位序列的商业鼠类单克隆抗体(mAb)与对照肽的结合活性。在一级孵育缓冲液(1％甘露醇，PBST)中，用各2.0nM的抗体克隆4C1(Genway)、p53Ab1(Mllipore)、p53Ab8(Millipore)和LnkB2(Absolute Antibody)一式三份探查IST阵列。次级孵育和信号定量与上述相同。

数据采集。使用配备有532nm激光器和572nm BP 34滤光器的Innopsys 910AL微阵列扫描仪(Innopsys，Carbonne，France)对测定的微阵列进行成像。Mapix软件应用程序(版本7.2.1)使用自动网格化算法鉴定与每个肽特征相关的图像区域。将每个肽特征的中值像素强度保存为制表符分隔的文本文件，并存储在数据库中以供分析。

数据分析。在添加恒定值100以改善同方差性后，对中值特征强度进行log₁₀转化。通过减去该阵列的组合文库特征的中值强度来对每个阵列上的强度进行归一化。

在单克隆试验中，使用Z评分来评估每种单克隆抗体与其同源表位的选择性结合，Z评分如下计算：

其中I_mAb和I_2o分别是仅在单克隆或第二抗体的存在下转化的肽强度。对所有四个mAb测量与包含一个mAb的表位的每种肽的结合。

在IST测定中，通过定量荧光信号来测量血浆抗体与每个特征的结合。通过平均肽强度的t检验和不等方差的Welch调整来确定显示组间差异信号的肽特征。对于2105查加斯组群，将查加斯血清阳性供体(n＝146)与血清阴性供体(n＝189)进行比较，并鉴定具有显著差异信号的肽。通过使用标准血液组检测算法比较查加斯血清阳性供体(n＝88)与HCV阳性(n＝71)、HBV阳性(n＝88)或WNV阳性(n＝88)的查加斯血清阴性供体之间的平均强度，鉴定出可以将查加斯与其它感染性疾病区分开的第二组肽。在对多重性应用Bonferroni校正后，基于5％的假阳性阈值鉴定出显示显著判别的肽(即，p＜4e-7)。另外，通过三个克氏锥虫ELISA测定，对查加斯阳性供体的转化肽强度与其中值信号/截止值(S/CO)计算了Pearson相关性。此外，在2015年组群中，通过Benjamini-Hochberg方法(Benjamini Y和Hochberg Y[1995]Journal of the Royal Statistical Society，Series B 57：289-300)，使用10％的错误发现率标准来鉴定与S/CO相关的肽。

为了构建分类器，基于与Welch t检验(其比较查加斯阳性与查加斯阴性供体，或在多疾病模型中比较不同疾病类型)相关的p值，根据其区分查加斯阳性与其它样品的能力对特征进行排名。所选肽的数目在5至4000个特征之间逐步变化，并将每个选定特征输入到具有线性内核且成本参数为0.01的支持向量机(Cortes C和Vapnik V.MachineLearning.1995；20(3)：273-97)，以训练分类器。使用重复100次的四折或五折交叉验证来量化模型性能，被估计为受试者工作特征曲线(AUC)下的误差，并结合了特征选择和分类器开发以避免偏差。

最后，根据通过其t检验p值选择的交叉验证下的性能，使用最佳数目的特征，将固定的SVM分类器拟合在2015年组群中。该模型用于评估平台的准确性和再现性，并且也在2016年组群中作为交叉验证分析的独立验证检验进行了评价。

所有分析均使用R版本3.2.5进行(Team RC.R：A language and environment forstatistical computing.R Foundation for Statistical Computing Vienna2016.Available from：https：//www.R-project.org/)。

肽比对评分。将文库肽与克氏锥虫CL Bener蛋白质组进行比对[Sodre CL等人，(2009)Arch Microbiol 191：177-184]。比对算法使用修改的BLAST策略[Altschul SF和Gish W(1996)Methods Enzymol 266：460-480]，需要3个氨基酸的种子，空位罚分为4个氨基酸，且评分矩阵为BLOSUM62[Henikoff和Henikoff JG (1992)Proc Natl Acad Sci U SA 89：10915-10919]，该评分矩阵被修改为反映阵列的氨基酸组成[States DJ等人，(1991)Methods 3：66-70]。这些修改提高了类似置换的评分，去除阵列中缺失的氨基酸的罚分，并且对所有精确匹配同等地进行评分。

为了对一组分类文库肽，即判别肽生成蛋白质的比对得分，将产生阳性BLAST评分的肽组装成矩阵，该矩阵的每一行对应于所比对的肽，并且每一列对应于该蛋白质序列中的一个氨基酸。在肽行内允许空位和缺失，以供与蛋白质进行比对。以这种方式，矩阵中的每个位置接收与肽和蛋白质的比对氨基酸相关的评分。然后，将对应于蛋白质中的氨基酸的每一列相加，以产生重叠评分；这代表该氨基酸位置被分类肽覆盖的程度。为了针对文库组成校正该评分，对于列出的所有阵列肽使用相同的方法计算另一个重叠评分。这允许通过以下方程式计算每个氨基酸位置处的肽重叠差异评分s：

S_d＝a-(b/d)*c

在该方程式中，a是来自判别肽的重叠评分，b是判别肽的数目，c是整个肽文库的重叠评分，而d是该文库中肽的数目。

为了将这些s评分(在氨基酸水平上)转换为全蛋白质统计值，计算蛋白质中每个可能的平铺20-聚体表位的评分的总和。最终蛋白质评分(也称为蛋白质表位评分，S_d)是每个蛋白质沿该滚动窗口(20)的最大值。对于从文库中随机选择肽的100次迭代计算了一组相似的评分，其数目等于判别肽的数目。基于随机选择的肽中达到或超过该评分的次数(控制迭代次数)，计算每个评分S的p值。

精度、再现性和性能分析。通过测量在查加斯固定分类器模型中使用的200个肽的信号，对一组八个血浆样品表征了抗体与阵列特征结合的精度。从整个供体组群中选择四个表现出一系列S/CO值的查加斯血清阳性供体和三个查加斯血清阴性样品。一式三份地测定这些样品。载玻片设计中还包含了来自健康供体的良好表征的内部血浆样品，一式两份进行测定。作为阴性对照，在一级孵育步骤中将一个阵列在没有血浆的情况下孵育，但与第二检测抗体一起孵育。这24个样品在一个载玻片上均匀地分布在整个阵列位置上。然后将此载玻片布局在多个载玻片中复制。

为了评价一批内的精度，从一个制造批次中选择了三个晶片。使用上述单载玻片精度设计评价来自每个晶片的十三个载玻片中的十二个。在三个不同的日期，每天在三个ArrayIt盒中评价载玻片。在三天内将来自每个晶片的载玻片均匀分配，以使每个盒包含来自三个晶片之一的两个载玻片和来自其余两个晶片的各一个载玻片。

为了测量批次之间的精度，从四个不同生产批次的每个批次中选择一个晶片。使用上述精度研究样品集评价来自每个晶片的十三个载玻片中的十二个。每天将这些载玻片分发给四个盒中进行测试，历时三天。来自每个晶片的载玻片在3天中均匀分布，以使每个盒包含来自四个晶片中的两个晶片的两个载玻片。使用混合效应模型来估计实验差异的来源。供体样品被视为固定效应。嵌套因子“晶片”、“载玻片”和“阵列”与“天”交叉，并且被视为随机效应。使用lme4软件包在R中拟合模型，以得出方差系数(CV)。

为了评估免疫特征分类器在许多晶片制造批次和测定中的稳健性，选择了可以在单个载玻片上测定的质量控制(QC)样品集。它由11个病例和11个对照组成的代表性小组组成，在10个合成批中在来自制造的22个不同晶片的单个载玻片上进行测定。对于测试的22个晶片-载玻片中的每一个，将在查加斯试验中开发的固定模型分类器应用于该样品集，以估计受试者工作特征(ROC)曲线下面积。这些晶片之一用于查加斯试验，而另一晶片用于混合组群(查加斯、HBV、HCV和WNV)试验。

实施例2-平台验证

使用单克隆抗体进行实验，以评价最终原位合成的阵列肽产物关于配体呈现和抗体识别的质量。

所有诊断测定均在经过验证的微阵列平台上进行。

开发了肽合成方案，其中使用掩模和光刻技术在硅晶片上直接进行平行耦合反应。利用在各14μm×14μm的特征处展现总共131,712个肽(中值长度为9个氨基酸)的阵列来查询抗体结合事件。阵列布局包括通过共同连接体附接到表面的126,009个文库肽特征和6203个对照肽特征(参见实施例1)。将文库肽设计为对所有可能的氨基酸组合均匀地进行采样。对照肽包括500个特征，这些特征对应于五个不同的良好表征的单克隆抗体(mAb)的确立表位，每个复制100次。另一个935个特征对应于五个表位中的三个表位的四个不同序列变体，每个复制100至280次。用与文库肽类似的氨基酸组成设计了另外的500个对照特征，但这些特征均匀地是8-聚体且一式三份呈现。当开发IST模型时，对这500个对照特征的中值信号进行量化，并作为文库的一部分进行处理。其余3,268个对照包括有助于网格对齐的基准标记、分析对照序列和仅连接体特征。除基准点外，所有特征都均匀地分布在整个阵列中。

使用mAb进行实验，这些mAb评价最终阵列合成产物在配体呈现和抗体识别方面的质量。用识别序列选择一组四个鼠抗体克隆：4C1、p53Ab1、p53 Ab8和LnkB2，所述识别序列对应于在阵列布局内设计的五个对照表位中的四个。这四个阵列代表的表位的序列内容共同包括用来构建文库的全部16种氨基酸。

图2显示了如所述进行的结合试验的结果(参见实施例1)，其中每种抗体各自一式三份地与竞争剂一起应用于阵列。对于每种mAb，使用对照特征强度来计算对应于其表位的肽序列和三个非同源序列的Z评分。每个同源序列都以高信号强度结合，而非同源序列不显示或几乎不显示高于背景值的信号(仅次级)。

这些数据验证了合成文库产物的完整性。数据表明，微阵列携带适合于特异性抗体识别和结合的肽。在原位工艺中使用光刻和掩膜为扩大生产规模和有效成本核算提供了机会。值得注意的是，可以使用完全相同的文库阵列设计来鉴定区分多种不同状况(例如感染)的肽，如查加斯病、HPV、HCV和WNV的分类准确性所例示的(表4和表5)。

实施例3-免疫特征测定将对克氏锥虫呈血清阳性的受试者与对克氏锥虫呈血清阴性的受试者区分开

从血库储备(Creative Testing Solutions，Tempe，AZ)中获得了无症状供体的血浆样品的两个组群，如表1所示。2015年组群是335名供体，他们均使用血库的算法对查加斯病进行血清学检验。该检验旨在防止来自任何有查加斯病迹象的供体的样品进入血液供应。首先，连续进行三个ELISA，它们针对全克氏锥虫裂解物(Ortho)测定血浆。如果其中任何一个根据信号/截止值(S/CO＞1.0)被评分为阳性，则进行确认性检验。这是一种免疫沉淀测定(克氏锥虫RIPA)，其使用血浆来沉淀放射性标记的克氏锥虫裂解物。按照这些标准，有189名供体是血清阳性的，有146名是血清阴性的。S/CO评分＞4.0被认为是强阳性[Remesar M等人，(2015)Transfusion 55：2499-2504]，这将49名(26％)血清阳性供体纳入了这一高S/CO亚组。性别、年龄和种族的分布是在美国献血者群体中通常观察到的分布。2016年组群包括116名供体，他们以上述相同的系列ELISA和RIPA检测方案针对查加斯进行了检验。结果确定了58名查加斯血清阳性和58名血清阴性参与者。查加斯阳性个体中有较高比例(58名中的31名(53％))被评分到高S/CO＞4亚组中。性别和年龄的分布相似，但在第二个供体群体中种族分布略有偏斜。

表1.查加斯研究中的供体的描述

此处提出的研究试验是通过使用2015年组群作为算法训练集进行的，目的是开发一种区分查加斯血清阳性与血清阴性个体的分类器。固定该分类器，然后将其应用于预测2016年组群供体的阳性率。因此，2016年样品代表了与训练无关的验证集。

评价免疫特征确定查加斯阳性的性能

如实施例1中所述进行免疫特征(IST)测定，并扫描以获得每个特征处的信号强度测量值。Welch t检验的应用鉴定了356个单独的肽，这些肽在血库中被评分为查加斯血清阳性和血清阴性的供体之间在平均信号方面有显著差异。如图3中用白色虚线标出的，与查加斯阴性供体相比，大多数但不是全部显著区别性肽在查加斯阳性者中显示出更高的结合强度。这些肽中的许多肽具有也与所有查加斯阳性供体的克氏锥虫S/CO中值正相关的信号(显示为蓝色和绿色圆圈)。这与某些文库肽可以结合与ELISA筛查中被抗原结合的那些相同或相关的血浆抗体的可能性相一致。有14个肽与S/CO显著相关，但不符合查加斯阳性的IST判别的Bonferroni阈值(白色虚线下方的圆圈)。值得注意的是，在IST中表现出最强判别力的356个肽中有许多与S/CO值无显著相关。这表明根据IST(t检验)收集的结合数据与根据ELISA(S/CO)收集的结合数据有一些重叠，但表明还测量了独特的相互作用。

在2015年组群中开发了针对查加斯血清阳性的支持向量机(SVM)分类器。在交叉验证下，当将根据Welch t检验排名的前500个肽输入模型时，可获得最佳性能。此数字大于满足Bonferroni显著性截止值的356，表明在满足显著性的较低严格性、错误发现率(FDR)截止值的某些肽中存在额外的信息内容。图4A示出了五折交叉验证模型的100次迭代的平均灵敏度与特异性之间的关系，其中使用每个训练样品中的前500个肽作为诊断阈值的函数。曲线下面积(AUC)估计，对于从两组中的每组内随机选择的供体，与血清阴性供体相比，血清阳性供体有98％的概率被更高可能性地分类为查加斯阳性，95％置信区间(CI)为97％-99％。在灵敏度等于特异性的阈值下，准确度为93％(CI＝91％-95％)。交叉验证估计值通过对2016年组群中的前500个肽应用单个固定SVM分类器进行确认，其中观察到的性能(AUC 97％；准确度91％)在交叉验证估计值的95％CI内(图4B)。

使用相同的固定分类器，按方案评估测定的结合精度和再现性，在该方案中，如方法部分所述，重复测定四个查加斯血清阳性供体和三个查加斯血清阴性样品。重复计算分类精度。这些精度测量表明了针对包含固定分类器的IST测定特征的以下结合信号CV：阵列间＝11％，载玻片间＝4％，晶片间＝2.7％，日间＝7.7％，批次间＝14.6％。如方法部分所述，还确定了分类的再现性，表明AUC＞0.98(中值AUC＝1.0)。

图5中的结果探讨了2015年查加斯组群中抗体结合的异质性。显示了图3中描述的370(356+14)个肽的相对信号强度，通过t检验、通过与ELISA S/CO水平的相关性或这两个标准，它们可显著区分查加斯阳性(图21A-N)。

发现相对于相同基序在整个肽文库中的发生率，将查加斯血清阳性与查加斯血清阴性样品区分开的肽大于100％地富集图9B-F中列出的一个或多个基序。另外，发现99％的将血清阳性与血清阴性样品区分开的肽大于100％地富集精氨酸、天冬氨酸和赖氨酸中的一种或多种氨基酸(图9A)。

显示针对每个供体(y轴)的每个肽(x轴)，并且相对于其强度与相同肽在所有血清阴性供体(作为对照)中的平均强度相比的差异以阴影显示。热图色彩方案通过特征信号相对于对照信号的标准偏差(sd)进行缩放。图例已在7个sd处被截断，以允许显示较小但显著的变化。供体按其报告的中值ELISA S/CO测量值排序，并将这些数据绘制在热图旁边。这些肽已经如顶部的树状图所示聚类。ELISA阳性与阴性供体之间的区别在热图可视化中很明显，某些肽的IST信号与ELISA信号水平之间的相关性也很明显。查加斯阳性样品显示出一部分肽的至少三个不同的结合谱：i)信号一致低于对照，ii)信号略高于对照，以及iii)信号随着S/CO值的增加而增加。查加斯阴性样品中的肽信号异质性相对较小。

这些数据表明，不同的簇可能与感染状态相关，和/或表明疾病进展。

除了测量与IST肽阵列结合的IgG抗体外，还可以通过用荧光标记的抗IgA特异性二级试剂简单地检测血浆抗体结合事件来确定IgA结合活性。对于血清阳性与阴性供体之间显著不同的信号水平，更少的文库肽(224个)通过了Bonferroni截止值，并且与通过抗IgG二级试剂所检测到的那些有50％重叠。另外，在与S/CO相关的26个IgG分类肽的列表中发现了与S/CO值相关的所有23个IgA分类肽(23/26＝88％重叠)。IgA分类的性能(AUC＝0.94)与IgG分类器的性能类似。

这些发现表明，在IST试验结果与疾病特异性免疫活性之间存在相关性。这些发现提示使用免疫特征方法作为监测克氏锥虫诱导的查加斯病的状态的试验。一项纵向研究可以为监测血清阳性受试者的血清再转化或威及生命的感染并发症的长期发展提供必要的信息。

实施例4-查加斯分类肽的蛋白质组定位

使用改良的BLAST算法和评分系统(其使用20-聚体的滑动窗口)，将显著区分查加斯阳性与阴性供体的356个IST文库肽以及与S/CO值相关的14个肽与克氏锥虫蛋白质组进行比对(实施例1)。这产生了表2中所示的候选蛋白质-目标区域的排名列表。这些分类肽显示出高频率的比对得分，这些比对得分大大超过通过对从文库中随机选择的十组同等大小(370)的肽进行相同分析所获得的最大得分(图6)。例如，使用随机选择的肽所获得的最大得分范围是小于2000到2500；而分类肽产生的比对得分为3500。因此，在这种情况下，分类肽提供的蛋白质得分比得分最高的随机肽至少高出28％。用较小的分离度也可以获得可靠的结果。

通过查加斯分类肽定位的得分靠前的候选物是粘蛋白II家族的表面糖蛋白的C末端。IST肽比对区域包括糖基磷脂酰肌醇(GPI)附着位点，并且对应于查加斯病患者中的高度免疫原性表位[Buscaglia CA等人，(2004)J Biol Chem 279：15860-15869]。在粘蛋白II比对的IST肽中最常鉴定的氨基酸在图7中被总结为修饰的WebLogo[Crooks GE等人，(2004)Genome Res 14：1188-1190]。相应的克氏锥虫粘蛋白序列(UniProt ID＝Q4DXM4)沿x轴显示。任一位置的氨基酸置换垂直显示，并通过单字母代码的高度来描述定位的文库肽内的覆盖比例。粘蛋白II蛋白质家族的另一个成员被确定为排名第六的目标候选物，并且也被定位到C末端(UniProt ID＝Q4DN88)。另一个克氏锥虫表面糖蛋白家族的成员，分散基因家族蛋白(DGF-1)[Lander N等人，(2010)Infection and Immunity 78：231-240]，在比对算法(Q4DQ05)中排名第八，定位到其C端区域并对应于该家族的共有序列。剩下的评分排前10位的比对区域被定位到参与钙信号传导(钙调蛋白)、囊泡运输(空泡蛋白分选相关蛋白，Vps26)的蛋白质[Haft CR等人，(2000)Molecular Biology of the Cell 11：4105-4116]和未表征的蛋白质。这10个候选蛋白质组靶标共同构成了所比对的370个IST分类肽中的220个。领先的候选生物标志物也可以通过最多全部总数的判别肽来鉴定。

表2.分类文库肽与克氏锥虫蛋白质组的排名前列的比对

排名	克氏锥虫蛋白质	UniProt ID	氨基酸位置
				1	粘蛋白TcMUCII	Q4DXM4	170-190
2	未表征的蛋白质	Q4DLV5	170-190
				3	未表征的蛋白质	K4EBQ9	950-970
4	钙调蛋白	Q4DQ24	110-130
				5	未表征的蛋白质	Q4D6B0	910-930
6	粘蛋白TcMUCII	Q4DN88	340-360
				7	未表征的蛋白质	Q4DUA0	500-520
8	分散基因家族蛋白1(DGF-1)	Q4DQ05	3380-3400
				9	未表征的蛋白质	Q4DCE7	220-240
10	空泡蛋白分选相关蛋白(Vps26)	K4DSC6	10-30

这些数据表明，模拟寄生表位的阵列肽被查加斯血清阳性患者中的外周血抗体差异结合。这些判别肽被定位到几种已知的免疫原性克氏锥虫蛋白质，以及几种以前未知的抗原。

实施例5-查加斯阳性供体与其它血液感染性疾病检验呈阳性的患者的IST共分类：查加斯病、乙型肝炎、丙型肝炎和西尼罗病毒病。

除了区分查加斯阳性样品与查加斯阴性样品之外，还测试了免疫特征方法，以确定是否可以将查加斯病与其它感染性疾病区分开，以及是否可以将其它感染性疾病彼此区分开。

为了确定IST是否可以将查加斯阳性样品与其它感染性疾病样品区分开，重新测定了整个查加斯2015年组群的88个样品的子集，以及88个HBV、88个WNV和71个HCV疾病阳性血浆样品。通过Creative Testing Solutions的间接血清学检测和直接核酸检测将病毒样品指定为阳性。据报道，所有研究样品仅对四种疾病之一呈阳性。表3列出了人口统计数据，显示出不同的性别、种族和年龄范围。在西班牙裔供体中观察到较高的查加斯阳性率，这与中美洲和南美洲的疾病发生率一致。在整个查加斯组群中也观察到较高的患病率(表1)。HBV、HCV和WNV检验呈阳性的供体的种族分布与在美国总人口中的分布类似。

这项研究的所有IST测定均在同一天进行，并立即进行扫描以获取每个特征处的信号强度测量值。将原始数据导入到R中以供分析。

表3-血液组阳性疾病研究中的供体的描述

对所有样品进行免疫特征测定，以鉴定被来自感染了克氏锥虫(查加斯病)、乙型肝炎、丙型肝炎和西尼罗病毒的受试者的样品中的抗体差异结合的阵列肽。如实施例1中所述，对来自表3中所述受试者的样品进行基于阵列的测定，并如所述获取并分析每个样品中阵列结合的抗体的信号强度。

区分感染与其它感染

抗体与阵列肽的差异结合鉴定出区分查加斯(克氏锥虫感染)与HBV、查加斯与HCV、查加斯与WNV、HBV与HCV、HCV与WNV和WNV与HBV的肽。

从查加斯受试者的样品获得的信号结合数据与一组HBV受试者的结合数据所进行的比较鉴定了区分查加斯样品与HBV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图14A中列出的一个或多个基序。另外，发现将查加斯样品与HBV样品区分开的肽大于100％地富集精氨酸、酪氨酸、丝氨酸、丙氨酸、缬氨酸、谷氨酰胺和甘氨酸中的一种或多种氨基酸(图14B)。该对比的方法性能的特征在于0.98(0.98-0.99)。在90％灵敏度时，该测定的特异性为96％(94-97％)，在90％特异性时该测定的灵敏度为96％(94-97％)，在灵敏度＝特异性时该测定的准确度为94％(93-96％)。

从查加斯受试者的样品获得的信号结合数据与一组HCV受试者的结合数据所进行的比较鉴定了区分查加斯样品与HCV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图15A中列出的一个或多个基序。另外，发现将查加斯样品与HCV样品区分开的肽大于100％地富集精氨酸、酪氨酸、丝氨酸、缬氨酸和甘氨酸中的一种或多种氨基酸(图15B)。该对比的方法性能的特征在于0.99(0.98-0.99)。在90％灵敏度时，该测定的特异性为94％(92-98％)，在90％特异性时该测定的灵敏度为98％(95-99％)，在灵敏度＝特异性时该测定的准确度为93％(92-95％)。

从查加斯受试者的样品获得的信号结合数据与一组WNV受试者的结合数据所进行的比较鉴定了区分查加斯样品与WNV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图16A中列出的一个或多个基序。另外，发现将查加斯样品与WNV样品区分开的肽大于100％地富集赖氨酸、色氨酸、天冬氨酸、组氨酸、精氨酸、谷氨酸和甘氨酸中的一种或多种氨基酸(图16B)。该对比的方法性能的特征在于0.95(0.94-0.97)。在90％灵敏度时，该测定的特异性为87％(76-94％)，在90％特异性时该测定的灵敏度为89％(85-92％)，在灵敏度＝特异性时该测定的准确度为90％(86-91％)。

从HBV受试者的样品获得的信号结合数据与一组HCV受试者的结合数据所进行的比较鉴定了区分HBV样品与HCV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图17A中列出的一个或多个基序。另外，发现将HBV样品与HCV样品区分开的肽大于100％地富集苯丙氨酸、色氨酸、缬氨酸、亮氨酸、丙氨酸和组氨酸中的一种或多种氨基酸(图17B)。该对比的方法性能的特征在于0.91(0.88-0.94)。在90％灵敏度时，该测定的特异性为79％(69-86％)，在90％特异性时该测定的灵敏度为71％(53-83％)，在灵敏度＝特异性时该测定的准确度为84％(78-87％)。

从HBV受试者的样品获得的信号结合数据与一组WNV受试者的结合数据所进行的比较鉴定了区分HBV样品与WNV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图18A中列出的一个或多个基序。另外，发现将HBV样品与WNV样品区分开的肽大于100％地富集色氨酸、赖氨酸、苯丙氨酸、组氨酸和缬氨酸中的一种或多种氨基酸(图18B)。该对比的方法性能的特征在于0.97(0.96-0.98)。在90％灵敏度时，该测定的特异性为96％(90-99％)，在90％特异性时该测定的灵敏度为94％(90-97％)，在灵敏度＝特异性时该测定的准确度为93％(90-96％)。

从HCV受试者的样品获得的信号结合数据与一组WNV受试者的结合数据所进行的比较鉴定了区分HCV样品与WNV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图19A中列出的一个或多个基序。另外，发现将HCV样品与WNV样品区分开的肽大于100％地富集赖氨酸、色氨酸、精氨酸、酪氨酸和脯氨酸中的一种或多种氨基酸(图19B)。该对比的方法性能的特征在于0.97(0.95-0.98)。在90％灵敏度时，该测定的特异性为92％(84-97％)，在90％特异性时该测定的灵敏度为93％(86-97％)，在灵敏度＝特异性时该测定的准确度为92％(87-94％)。

这些数据表明，可以使用本文所述的免疫特征测定进行各种感染的比较，以鉴别诊断许多不同的感染性状况。

区分一种感染与包含两种或多种不同类型感染的组

开发了二元分类器，用于区分每种可用的感染性疾病与其它疾病的组合(表4)。通过四折交叉验证分析确定每种疾病对比的性能指标及其相应的95％CI。这些模型生成类似的强AUC，范围从0.94至0.97，对应的准确度为87％-92％。名义上，查加斯病与其余三种疾病(其它)的合并类别的对比表现最好；然而，括号中所示的CI重叠。名义上，肝炎对比是最弱的模型。最佳SVM输入肽的数目从50个到16,000个肽的宽范围内不等。

抗体与阵列肽的差异结合鉴定出区分查加斯样品和来自HBV、HCV和WNV(其它)受试者的一组混合样品的肽。发现相对于相同基序在整个肽文库中的发生率，最具判别力的肽大于100％地富集图10A中列出的一个或多个基序。另外，发现将查加斯样品与HBV、HCV和WNV样品组区分开的肽大于100％地富集精氨酸、天冬氨酸和赖氨酸中的一种或多种氨基酸(图10B)。

基于判别肽的结合信号信息开发了二元分类器，该分类器显示出可将来自查加斯病受试者的样品与来自其它传染性疾病HBV、HCV和WNV的样品明确区分开，测定性能的特征在于AUC＝0.97。在置信水平为90％时，该测定的特异性为94％，该测定的灵敏度为92％，该测定的准确度为92％(表4)。

从HBV受试者的样品获得的信号结合数据与查加斯病、HCV和WNV的一组受试者的结合数据所进行的比较鉴定了区分HBV样品与查加斯病、HCV和WNV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图11A中列出的一个或多个基序。另外，发现将HBV样品与查加斯病、HCV和WNV样品组区分开的肽大于100％地富集色氨酸、苯丙氨酸、赖氨酸、缬氨酸、亮氨酸、丙氨酸和组氨酸中的一种或多种氨基酸(图11B)。该对比的方法性能的特征在于AUC 94％。在置信水平为90％时，该测定的特异性为85％，该测定的灵敏度为85％，该测定的准确度为87％(表4)。

在第三组对比中，从HCV受试者的样品获得的信号结合数据与查加斯病、HBV和WNV的一组受试者的结合数据所进行的比较鉴定了区分HCV样品与查加斯病、HBV和WNV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图12A中列出的一个或多个基序。另外，发现将HCV样品与查加斯病、HBV和WNV样品组区分开的肽大于100％地富集精氨酸、酪氨酸、天冬氨酸和甘氨酸中的一种或多种氨基酸(图12B)。该对比的方法性能的特征在于AUC＝96％。在置信水平为90％时，该测定的特异性为91％，该测定的灵敏度为90％，该测定的准确度为90％(表4)。

在第四组对比中，从WNV受试者的样品获得的信号结合数据与查加斯病、HBV和HCV的一组受试者的结合数据所进行的比较鉴定了区分WNV样品与查加斯病、HBV和HCV组的肽，相对于相同基序在整个肽文库中的发生率，这些肽大于100％地富集图13A中列出的一个或多个基序。另外，发现将WNV样品与HBV和HCV、查加斯病样品组区分开的肽大于100％地富集赖氨酸、色氨酸、组氨酸和脯氨酸中的一种或多种氨基酸(图13B)。该对比的方法性能的特征在于AUC＝0.96。在置信水平为90％时，该测定的特异性为88％，该测定的灵敏度为87％，该测定的准确度为89％(表4)。

表4-四种疾病类别中的每一种相对于其余三种疾病的组合类别的二元分类

^aspec，特异性；^bsens灵敏度

这些数据表明，基于鉴定出的判别肽对多种不同感染的二元分类可以将对查加斯呈血清阳性的受试者与对查加斯呈阴性的受试者以及对WNV、HPV和HCV无症状的受试者区分开。如所示，在每种情况下，该方法性能均大于0.94。

实施例6-四种不同感染的同时分类

开发了多重分类器模型，以使用一组选定的肽和一种算法同时对所有四个感染性疾病状态进行分类。该多类别模型的性能与表4中所示的二元分类器相似。即，四折交叉验证分析得出，查加斯病的多类别AUC为0.98，HBV为0.96，HCV为0.95，WNV为0.97。表5列出了每个样品根据其最高预测概率分配给一个类别的性能指标。在这个混淆矩阵中，给出了每个二元对比。估计的总体多类别分类准确度达到87％。

将前面段落和表5中描述的组对比分类器组合在一起，以得到一个多重分类器，以确定是否可以同时区分查加斯、HBV、HCV和WNV这四种感染。

相对于相同基序在整个肽文库中的发生率，在多重分类器分析中将查加斯、HBV、HCV和WNV样品彼此区分开的肽大于100％地富集图20A中列出的一个或多个基序。另外，在多重分类器分析中将查加斯、HBV、HCV和WNV样品彼此区分开的肽大于100％地富集精氨酸、酪氨酸、赖氨酸、色氨酸、缬氨酸和丙氨酸中的一种或多种氨基酸(图20B)。

图8中显示的热图显示了335个测试组群样品中每个样品的袋交叉验证模型预测(表5中所示)的类别成员平均预测概率，涵盖了所有四种疾病。该图表明，最高的预测概率正确地将样品分配给感染性疾病类别。查加斯样品中分类肽的信号强度相对于所有三种病毒样品明显更加不同。相对于HBV和WNV，查加斯中的大多数(但不是全部)较高，除了几个较低肽信号的明显例外。相比之下，针对HBV和HCV样品测定的相同肽的信号强度差异则不太明显。

每个样品的每种结局都有一个预测的类别成员，范围从0(黑色)到100％(白色)。根据图8所示的最高预测概率将每个样品分配到疾病类别，并在表5所示的混淆矩阵中显示。根据图8中所示的预测概率分配分类，每个样品均以最高概率分配给类别。四种对比的测定性能的范围为0.95至0.98。总体准确度为87％。

表5-多类别预测的混淆矩阵和性能估计

总体准确度＝87％

这些数据表明，免疫特征测定可以高度准确地同时区分一种感染与两种或更多种其它感染。在所有情况下，由AUC定义的方法性能均大于0.95。

实施例7-免疫特征测定使用扩展的肽阵列将对克氏锥虫呈血清阳性的受试者与对克氏锥虫呈血清阴性的受试者区分开

为了鉴定可以区分对克氏锥虫呈血清阳性的样品与血清阴性样品的其它阵列肽，将3.2M独特肽的3.3M特征阵列(V16阵列)用于结合研究。V16阵列包含从20种天然存在的氨基酸中的18种合成的肽文库，其中不包括半胱氨酸(C)和甲硫氨酸(M)。肽的中值长度为8，长度范围为5至16个氨基酸。V16阵列上的文库包括：(A)低偏差文库，它是独特肽的高序列多样性文库，旨在根据18种氨基酸均匀覆盖序列空间，其包括五聚体、六聚体、七聚体和八聚体，以及它们的单体、二聚体、三聚体和四聚体子序列；(B)V13文库，其包含来自实施例2中所述的阵列文库的88,927个全长肽，以及在来自实施例2中所述的阵列文库的另外37,098个肽的两个至四个片段；以及(C)靶向国际表位数据库(http：//www.iedb.org/)中的表位的274,417个独特表位序列肽的IEDB文库。IEDB文库包含2,951个独特肽，这些肽被定位到克氏锥虫生物体的蛋白质表位。

血浆样品从Creative Testing Solutions(CTS；USA)(www.mycts.org)获得。使用来自无症状供体的49个样品(已知对查加斯呈血清阳性，S/CO评分至少为1.245)以及来自血清阴性供体的41个样品进行结合测定。结合测定中还包括血清阴性供体之一的另外六个重复。如实施例1中所述，进行结合测定，并且检测样品抗体与肽的结合作为定量信号测量，其通过确定每个可寻址肽特征的相对荧光值而获得。

为了构建分类器，基于比较查加斯阳性供体与查加斯阴性供体的Welch t检验相关的p值，根据其区分查加斯血清阳性与血清阴性样品的能力对特征进行排名。选择的输入肽的数目在25至16,000个特征之间逐步变化，并将每组选定特征输入到具有线性内核且成本参数为0.01的支持向量机(Cortes C和Vapnik V.Machine Learning.1995；20(3)：273-97)，以训练分类器。使用重复100次的五折交叉验证来量化模型性能，被估计为受试者工作特征曲线(AUC)下的误差，并结合了特征选择和分类器开发以避免偏差。

所有分析均使用R版本3.3.3进行(Team RC.R：A language and environment forstatistical computing.R Foundation for Statistical Computing Vienna2017.Available from：https：//www.R-project.org/)。

图22示出了使一组文库肽可视化的火山图，其展示出在查加斯血清阳性与查加斯血清阴性受试者之间显著不同的抗体结合信号。火山图用来将这种区别评估为t检验p值的联合分布相比于信号强度平均值的差异对数(比率的对数)。在每个作图位置的肽的密度由热标度指示。在对多重性应用Bonferroni调整后，红色虚线上方的2,707个肽通过免疫特征技术(IST)以95％的置信度区分阳性和阴性疾病。蓝色圆圈表示血清阳性和血清阴性样品与靶向查加斯病表位的IEDB文库中的肽的差异结合。在对多重性应用Bonferroni调整后，蓝线上方的蓝色圆圈显示的67个判别肽以95％的置信度区分阳性和阴性疾病。绿色圆圈表示被针对V13文库肽的样品抗体结合的493个肽。在对多重性应用Bonferroni调整后，绿线上方的绿色圆圈显示的52个肽以95％的置信度区分阳性和阴性疾病。使用三个Bonferroni截止值，并针对V16、V13和IEDB文库上3个肽子集的大小进行调整。

以下表6中列出了来自V16阵列分析的判别肽。按照逐渐增加的p值对肽进行排序，以对查加斯血清阳性患者的平均对数转化强度和查加斯血清阴性患者的平均对数转化强度进行t检验。井号(#)标识出来自IEDB文库的用于定位到报告的查加斯表位序列的判别肽，星号(*)标识出来自V16的V13文库的肽，其在图21A-N中列出。每个独特肽序列后面是该肽的平均血清阳性与平均血清阴性强度之比。

表6-区分查加斯血清阳性样品与查加斯血清阴性样品的肽序列

另外，在以下表7中列出了来自V16阵列分析的52个V13文库判别肽，其t检验p值＜0.0001，其与实施例3(上文)的V13文库重叠。这些肽在图22中以绿色突出显示。按照逐渐增加的p值对肽进行排序，以对查加斯血清阳性患者的平均对数转化强度和查加斯血清阴性患者的平均对数转化强度进行t检验。每个独特肽序列后面是该肽的平均血清阳性与平均血清阴性强度之比。

表7-在V16阵列分析中区分查加斯血清阳性样品与查加斯血清阴性样品的V13文库肽序列(在V16中)

具有1000个输入肽的SVM模型在交叉验证下获得了最佳平均性能。在100个交叉验证试验中训练并测试的具有1000个输入肽的模型所生成的受试者工作特征(ROC)曲线下面积(AUC)平均值为0.98(95％CI 0.97-0.99)。对于这些模型，在为90％特异性选择的诊断阈值下的平均灵敏度为96％(92％-98％)。为90％灵敏度选择的诊断阈值下的平均特异性为98％(92％-100％)。

发现相对于相同基序在整个V16肽文库中的发生率，V16阵列中区分查加斯血清阳性与查加斯血清阴性样品的肽富集图23A、图23B和图23C中列出的一个或多个基序。

实施例8-在延伸阵列上鉴定的查加斯分类肽的蛋白质组定位

使用改良的BLAST算法和评分系统(其使用20-聚体的滑动窗口)，将显著区分查加斯阳性与阴性供体(满足Bonferroni标准95％置信水平)的2707个文库肽与克氏锥虫蛋白质组进行比对。这产生了表8中所示的候选蛋白质-目标区域的排名列表。这些分类肽显示出高频率的比对得分，这些比对得分大大超过通过对从文库中随机选择的十组同等大小的肽进行相同分析所获得的最大得分。例如，使用随机选择的肽所获得的最大得分范围是小于8543到15920，而分类肽产生了与最高命中Wee90的比对得分46985。因此，在这种情况下，分类肽提供的蛋白质得分比得分最高的随机肽至少高出300％。用较小的分离度也可以获得可靠的结果。

表8.分类文库肽与克氏锥虫蛋白质组的排名前列的比对

排名	克氏锥虫蛋白质	UniProt ID	氨基酸位置
				1	蛋白激酶Wee90(丝氨酸/苏氨酸蛋白激酶，推定的)	K4E3I6	520-530
2	未表征的蛋白质	K4E3D2	440-450
				3	未表征的蛋白质	Q4E3T5	610-620
4	未表征的蛋白质	K4DM29	540-550
				5	粘蛋白TcMUCII，推定的	Q4D4I0	160-170
6	激素水解酶，推定的	Q4E0K4	50-60
				7	动力蛋白中间链，推定的	Q4D4E6	640-650
8	未表征的蛋白质	Q4DSF4	400-410
				9	微管相关蛋白Gb4，推定的	Q4DN34	100-110
10	未表征的蛋白质	K4E498	90-100
				11	驱动蛋白样蛋白质	K4E5W8	700-710

这些数据表明，模拟寄生表位的阵列肽被查加斯血清阳性患者中的外周血抗体差异结合。这些判别肽被定位到几种已知的免疫原性克氏锥虫蛋白质，以及几种以前未知的抗原。这些数据还表明，这些肽共有强基序，包括以前在V13上见到的“LR”基序(实施例4)，并且包括靶向来自IEDB的已知查加斯表位的肽。

这项研究支持在实施例1-4中提供的发现，并扩展了先前使用V13阵列从研究中获得的列表。

Claims

1.一种鉴定具有或疑似具有克氏锥虫感染的受试者的血清学状态的方法，所述方法包括：

(a)使来自所述受试者的样品与包含至少10,000个不同肽的肽阵列接触；

(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合，以获得结合信号的组合；以及

(c)将结合信号的所述组合与两组或更多组参考结合信号的组合进行比较，其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阳性的多个参考受试者中获得，并且其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阴性的多个受试者中获得，从而确定所述受试者关于克氏锥虫的血清学状态。

2.根据权利要求1所述的方法，其进一步包括：

(i)鉴定区别性参考结合信号的组合，其中所述区别性参考结合信号将来自已知对所述感染呈血清阳性的参考受试者的样品与来自已知对所述感染呈血清阴性的参考受试者的样品区分开；以及

(ii)鉴定判别肽的组合，其中区别性参考结合信号的所述组合对应于判别肽的所述组合。

3.根据权利要求2所述的方法，其中区别性参考结合信号的所述组合中的每一个是通过检测来自所述多个所述参考受试者中的每个受试者的样品中存在的抗体与权利要求1的步骤(a)中包含至少10,000个不同肽的肽阵列上的至少25个肽的结合而获得的。

4.根据权利要求1所述的方法，其中所述具有或疑似具有所述感染的受试者对所述感染而言是无症状的。

5.根据权利要求1所述的方法，其中所述具有或疑似具有所述感染的受试者对所述感染而言是有症状的。

6.根据权利要求1所述的方法，其中所述具有或疑似具有所述感染的受试者和所述参考受试者对任何感染性疾病而言是无症状的。

7.根据权利要求2所述的方法，其中所述判别肽由图9B和图23A-23C中列出的一个或多个序列基序组成，与所有阵列肽中的判别肽相比，所述基序在所有含有该基序的肽中的判别肽中的富集大于100％。

8.根据权利要求2所述的方法，其中所述区别性肽选自图21A-N、表6和表7中列出的肽。

9.根据权利要求1所述的方法，其中与在步骤(b)中获得的抗体结合相对应的结合信号高于从当使用S/CO评分系统时得分＜1的受试者样品的抗体结合中获得的参考结合信号。

10.根据权利要求1所述的方法，其中所述一组或多组对克氏锥虫呈血清阴性的参考受试者对乙型肝炎病毒(HBV)呈血清阳性。

11.根据权利要求10所述的方法，其中所述判别肽大于100％地富集图14A中列出的一个或多个序列基序。

12.根据权利要求1所述的方法，其中所述一组或多组对克氏锥虫呈血清阴性的参考受试者对丙型肝炎病毒(HCV)呈血清阳性。

13.根据权利要求12所述的方法，其中所述判别肽大于100％地富集图15A中的一个或多个序列基序。

14.根据权利要求1所述的方法，其中所述一组或多组对克氏锥虫呈血清阴性的参考受试者对西尼罗病毒(WNV)感染呈血清阳性。

15.根据权利要求14所述的方法，其中所述判别肽大于100％地富集图16A中列出的一个或多个序列基序。

16.一种鉴定具有或疑似具有病毒感染的受试者的血清学状态的方法，所述方法包括：

(c)将结合信号的所述组合与两组或更多组参考结合信号的组合进行比较，其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阳性的多个参考受试者中获得，并且其中所述组参考结合信号组合中的每组中的至少一个从已知对所述感染呈血清阴性的多个受试者中获得，从而确定所述受试者的血清学状态。

17.根据权利要求16所述的方法，其进一步包括：

(i)鉴定区别性参考结合信号的组合，其中所述区别性结合信号将来自已知对所述感染呈血清阳性的参考受试者的样品与来自已知对所述感染呈血清阴性的参考受试者的样品区分开；以及

18.根据权利要求17所述的方法，其中所述病毒感染是HBV感染，并且其中所述一组或多组参考受试者对HBV呈血清阴性而对HCV呈血清阳性。

19.根据权利要求18所述的方法，其中所述判别肽包含一个或多个来自图17A的、富集大于100％的序列基序。

20.根据权利要求17所述的方法，其中所述病毒感染是HBV感染，并且其中所述一组或多组参考受试者对HBV呈血清阴性而对WNV呈血清阳性。

21.根据权利要求20所述的方法，其中所述判别肽包含一个或多个来自图18A的、富集大于100％的序列基序。

22.根据权利要求17所述的方法，其中所述病毒感染是HCV感染，并且其中所述一组或多组参考受试者对HCV呈血清阴性而对WNV呈血清阳性。

23.根据权利要求22所述的方法，其中所述判别肽包含一个或多个来自图19A的、富集大于100％的序列基序。

24.一种确定具有或疑似具有选自克氏锥虫、HBV、HCV和WNV的多种感染中至少一种的受试者的血清学状态的方法，所述方法包括：

(a)使来自疑似具有所述感染之一的受试者的样品与包含至少10,000个不同肽的肽阵列接触；

(c)提供至少第一、第二、第三和第四组区别性结合信号，其对应于来自克氏锥虫、HBV、HCV和WNV的感染，其中所述组区别性结合信号中的每组将来自对所述感染之一呈血清阳性的一组受试者的样品与从各自对所述多种感染中的其余一种呈血清阳性的受试者中获得的样品混合物区分开；

(d)组合所述组区别性结合信号，以获得区别性结合信号的多类别组，其中所述多类别组能够将所述克氏锥虫、HBV、HCV和WNV感染中的每一种彼此区分开；以及

(e)将在步骤(b)中从所述受试者获得的结合信号的所述组合与区别性结合信号的所述多类别组进行比较，从而鉴定所述受试者的血清学状态。

25.根据权利要求24所述的方法，其进一步包括针对所述第一、第二、第三和至少第四组区别性结合信号中的每组鉴定一组判别肽。

26.根据权利要求25所述的方法，其中所述第一组判别肽展示出信号，所述信号将对克氏锥虫呈血清阳性的样品与各自对HBV、HCV和WNV之一呈血清阳性的样品的混合物区分开。

27.根据权利要求26所述的方法，其中所述判别肽包含图10A中列出的一个或多个序列基序，当与所述阵列中的所述至少10,000个肽相比时，所述基序富集大于100％。

28.根据权利要求25所述的方法，其中所述第二组判别肽展示出信号，所述信号将对HBV呈血清阳性的样品与各自对克氏锥虫、HCV和WNV之一呈血清阳性的样品的混合物区分开。

29.根据权利要求28所述的方法，其中所述判别肽包含图11A中列出的一个或多个序列基序，当与所述阵列中的所述至少10,000个肽相比时，所述基序富集大于100％。

30.根据权利要求25所述的方法，其中所述第三组判别肽展示出信号，所述信号将HCV血清阳性样品与各自对HBV、克氏锥虫和WNV之一呈血清阳性的样品的混合物区分开。

31.根据权利要求30所述的方法，其中所述判别肽包含图12A中列出的一个或多个序列基序，当与所述阵列中的所述至少10,000个肽相比时，所述基序富集大于100％。

32.根据权利要求25所述的方法，其中所述至少第四组判别肽将对WNV呈血清阳性的样品与各自对HBV、HCV和克氏锥虫之一呈血清阳性的样品的混合物区分开。

33.根据权利要求32所述的方法，其中所述判别肽包含图13A中列出的一个或多个序列基序，当与所述阵列中的所述至少10,000个肽相比时，所述基序富集大于100％。

34.根据权利要求25所述的方法，其中所述判别肽包含选自图20A中的列表的一个或多个基序，当与所述阵列中的所述至少10,000个肽相比时，所述基序富集大于100％。

35.根据权利要求1、16和24中任一项所述的方法，其中所述方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)等于或大于0.93。

36.一种用于鉴定受试者中感染性疾病的至少一种候选生物标志物的方法，该方法包括：

(a)提供肽阵列，并将来自所述受试者的生物样品与所述肽阵列一起孵育；

(b)鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽展示出能够将对所述感染性疾病呈血清阳性的样品与对所述感染性疾病呈血清阴性的样品区分开的结合信号；

(c)用该组判别肽中的每个肽查询蛋白质组数据库；

(d)将该组判别肽中的每个肽与引起所述感染性疾病的病原体的蛋白质组数据库中的一个或多个蛋白质进行比对；以及

(e)从所述蛋白质组数据库中获得每个鉴定出的蛋白质的相关性评分和排名；

其中每个鉴定出的蛋白质是所述受试者中的所述疾病的候选生物标志物。

37.根据权利要求36所述的方法，其进一步包括获得重叠评分，其中所述评分针对所述肽文库的肽组成进行校正。

38.根据权利要求36所述的方法，其中所述判别肽被鉴定为具有小于10^-7的p值。

39.根据权利要求36所述的方法，其中鉴定所述组判别肽的步骤包括：

(i)检测来自对所述疾病呈血清阳性的多个受试者的样品中存在的抗体与不同肽的阵列的结合，以获得结合信号的第一组合；

(ii)检测抗体与相同肽阵列的结合，所述抗体存在于来自两个或更多个受试者参考组的样品中，每组对所述疾病呈血清阴性，以获得结合信号的第二组合；

(iii)比较结合信号的所述第一组合与所述第二组合；以及

(iv)鉴定所述阵列上的所述肽，所述肽被来自患有所述疾病的受试者的样品中的抗体和来自两个或更多个受试者参考组的所述样品中的抗体差异结合，从而鉴定所述判别肽。

40.根据权利要求36所述的方法，其中判别肽的数目对应于所述阵列上的肽总数的至少一部分。

41.根据权利要求36所述的方法，其中所述感染性疾病是查加斯病。

42.根据权利要求36所述的方法，其中所述至少一种候选蛋白质生物标志物选自表2中提供的列表。

43.根据权利要求36所述的方法，其中所述至少一种蛋白质生物标志物是从图21A-N、表6和表7中提供的判别肽的至少一部分中鉴定出来的。

44.一种肽阵列，其包含图21A-N、表6和表7中提供的肽的至少一部分。

45.一种用于鉴定受试者中查加斯病的至少一种候选生物标志物的方法，该方法包括：

(b)鉴定与来自所述受试者的生物样品中的抗体结合的一组判别肽，该组判别肽展示出能够将对所述感染性疾病呈血清阳性的样品与对查加斯病呈血清阴性的样品区分开的结合信号；

(c)用该组判别肽中的每个肽查询蛋白质组数据库；

(d)将该组判别肽中的每个肽与引起查加斯病的病原体的蛋白质组数据库中的一个或多个蛋白质进行比对；以及

其中每个鉴定出的蛋白质是所述受试者中的查加斯病的候选生物标志物。

46.根据权利要求45所述的方法，其进一步包括获得重叠评分，其中所述评分针对所述肽文库的肽组成进行校正。

47.根据权利要求45所述的方法，其中所述判别肽被鉴定为具有小于10^-7的p值。

48.根据权利要求45所述的方法，其中鉴定所述组判别肽的步骤包括：

(iii)比较结合信号的所述第一组合与所述第二组合；以及

(iv)鉴定所述阵列上的所述肽，所述肽被来自患有查加斯病的受试者的样品中的抗体和来自两个或更多个受试者参考组的所述样品中的抗体差异结合，从而鉴定所述判别肽。

49.根据权利要求45所述的方法，其中判别肽的数目对应于所述阵列上的肽总数的至少一部分。

50.根据权利要求45所述的方法，其中所述至少一种候选蛋白质生物标志物选自表6中提供的列表。

51.根据权利要求45所述的方法，其中所述至少一种蛋白质生物标志物是从图21A-N、表6和表7中提供的判别肽的至少一部分中鉴定出来的。

52.根据权利要求45所述的方法，其中所述判别肽大于100％地富集图23中列出的一个或多个序列基序。

53.一种肽阵列，其包含包括图23中提供的一个或多个基序的肽。

54.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述受试者是人。

55.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述样品是血液样品。

56.根据权利要求37所述的方法，其中所述血液样品选自全血、血浆或血清。

57.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述样品是血清样品。

58.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述样品是血浆样品。

59.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述样品是经干燥的血液样品。

60.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少50,000个不同的肽。

61.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少100,000个不同的肽。

62.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少300,000个不同的肽。

63.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少500,000个不同的肽。

64.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少1,000,000个不同的肽。

65.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少2,000,000个不同的肽。

66.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列包含至少3,000,000个不同的肽。

67.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列上的不同肽的长度为至少5个氨基酸。

68.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述肽阵列上的不同肽的长度为5至13个氨基酸。

69.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述不同的肽由少于20种氨基酸合成。

70.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述阵列上的不同肽被沉积。

71.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述阵列上的不同肽是原位合成的。

72.根据权利要求1、16、24、36和45中任一项所述的方法，其中所述方法性能的特征在于受试者工作特征(ROC)曲线下面积(AUC)等于或大于0.6。