CN107076746B - 使用流形和超平面进行生物学数据的计算机分析 - Google Patents

使用流形和超平面进行生物学数据的计算机分析 Download PDF

Info

Publication number
CN107076746B
CN107076746B CN201580055946.0A CN201580055946A CN107076746B CN 107076746 B CN107076746 B CN 107076746B CN 201580055946 A CN201580055946 A CN 201580055946A CN 107076746 B CN107076746 B CN 107076746B
Authority
CN
China
Prior art keywords
subject
trail
bacterial
patients
program instructions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580055946.0A
Other languages
English (en)
Other versions
CN107076746A (zh
Inventor
埃兰·埃登
克福·奥韦
罗伊·纳冯
阿萨夫·柯汉多坦
欧加·波依科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Memed Diagnostics Ltd
Original Assignee
Memed Diagnostics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Memed Diagnostics Ltd filed Critical Memed Diagnostics Ltd
Priority to CN202010370187.XA priority Critical patent/CN111624346A/zh
Publication of CN107076746A publication Critical patent/CN107076746A/zh
Application granted granted Critical
Publication of CN107076746B publication Critical patent/CN107076746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Virology (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)

Abstract

本发明公开一种分析生物学数据的方法,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值。所述方法包含:计算一曲线的一区段和一方向所定义的一轴之间的一距离,所述距离是在沿着所述方向的一坐标定义的所述曲线上面的一点处被计算。所述方法还包含将所述距离关联至一细菌感染的存在、不存在或所述受验者具有所述细菌感染的可能性。所述坐标由所述表达数值的一组合所定义,其中至少90%的所述区段介于一下界限线和一上界限线之间。

Description

使用流形和超平面进行生物学数据的计算机分析
关联申请案
此申请要求于2014年8月14日申请的美国临时申请案编号62/037,180以及于2015年1月21日申请的美国临时申请案编号62/105,938的优先权的权利,它们的内容通过参照其整体并入本文。
技术领域及背景技术
本发明,在其一些实施例中,关于计算机分析,且更特别但并不排除地,关于生物学数据的计算机分析,例如为了区分细菌感染和非细菌感染之间,和/或细菌感染和病毒感染之间,和/或感染性与非感染性疾病之间的不同的目的。
抗生素(Abx)是世界上最常用的处方药类药物,全球市场达250-300亿美元。Abx也是世界上滥用最多的药物,有所有药物中的一大部份(40-70%)的被错误的处方(Linder,J.A.和R.S.Stafford于2001年;Scott,J.G.和D.Cohen等人于2001年;Davey,P.和E.Brown等人于2006年;Cadieux,G.和R.Tamblyn等人于2007年;Pulcini,C.和E.Cua等人于2007年),(“CDC-Get Smart:Fast Facts About Antibiotic Resistance”2011)。
Abx滥用的一种类型是在非细菌性疾病,如病毒感染的情况下施用对此疾病无效的药物。例如,根据美国疾病防控中心CDC,在美国每年开出超过6千万个错误Abx处方来治疗流感。Abx过度处方的医疗保健和经济后果包括:(i)全球非必要处方的抗生素的成本,每年估算大于100亿美元;(ii)非必要Abx治疗导致的副作用降低医疗保健的品质,导致并发症和长时间住院治疗(如过敏反应,Abx相关腹泻,肠酵母病等),以及(iii)由过度使用所致的细菌的抗性菌株的出现(CDC已宣称细菌的抗生素耐性增长为“21世纪世界最紧迫的健康问题之一”(Arias,C.A.和B.E.Murray于2009年;“CDC-About AntimicrobialResistance”,2011))。
抗生素处方不足也并不罕见。例如,在美国,多达15%的成人细菌肺炎住院患者延缓接受或未接受Abx治疗,即使在这些情况下早期治疗可挽救生命并且减少并发症(Houck,P.M.和D.W.Bratzler等人,2002)。
感染性疾病诊断的技术具有降低Abx滥用相关的相关健康和财政负担的潜力。理想地,这种技术应该:(i)准确区分细菌和病毒感染;(ii)迅速(几分钟内);(iii)能够区分病原性细菌和身体天然菌群一部分的非病原性细菌;(iv)区分混合共同感染和纯病毒感染,以及(v)适用于病原体难于接近的病例(如窦炎、肺炎、中耳炎、支气管炎等)。
目前解决方案(例如培养、PCR和免疫测定法)未满足所有这些要求:(i)一些化验产生很差的诊断准确度(如低灵敏度或特异性)(Uyeki等人,2009),并且受限于有限集合的细菌或病毒菌株;(ii)它们常常需要数小时至数天时间;(iii)它们未辨别病原性和非病原性细菌(Del Mar,C,1992),因此导致假阳性;(iv)它们常常不能辨别混合与纯病毒感染和(v)它们需要对感染位点直接取样,在其中寻找致病剂的踪迹,从而阻碍对病原体位于难于接近的组织中的病情诊断,这样的情况经常发生。
因而,仍存在诊断缺口,这又常常使医师过度处方Abx(“以防万一法”),或处方不足Abx(“观望法”)(Little,P.S.和I.Williamson,1994;Little,P.,2005;Spiro,D.M.和K.Y.Tay等人,2006),两者均具有深远的健康和财政后果。
因此,需要解决这些挑战的一种迅速的方法,其准确区分细菌(包括混合细菌加上病毒感染)、病毒和非细菌、非病毒疾病患者。
国际专利申请案WO 2013/117746教导了用于区分一细菌与病毒感染之间的签章(signature)和决定要素(determinants)。
发明内容
根据本发明一些实施例的一观点,提供一种分析一生物学数据的方法,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值。所述方法包含:计算一曲线的一区段和一方向所定义的一轴之间的一距离,所述距离是在沿着所述方向的一坐标δ1定义的所述曲线上面的一点处被计算。所述方法还包含将所述距离关联至一细菌感染的存在、不存在或所述受验者具有所述细菌感染的可能性。所述坐标δ1是由所述表达数值的一组合所定义,其中至少90%的所述区段介于一下界限线f(δ1)-ε0和一上界限线f(δ1)+ε1之间,其中所述f(δ1)等于1/(1+exp(δ1)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
根据本发明的一些实施例,所述方法包含基于所述距离,获得所述可能性;比较所述可能性和一预定阈值;以及当所述可能性在所述预定阈值以上,治疗所述受验者的所述细菌感染。
根据本发明一些实施例的一观点,提供一种分析一生物学数据的方法,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值。所述方法包含:计算一曲线的一区段和一方向所定义的一轴之间的一距离,所述距离是在沿着所述方向的一坐标δ0定义的所述曲线上面的一点处被计算。所述方法还包含将所述距离关联至一病毒感染的存在、不存在或所述受验者具有所述病毒感染的可能性。所述坐标δ0是由所述表达数值的一组合所定义,其中至少90%的所述区段介于一下界限线g(δ0)-ε0和一上界限线g(δ0)+ε1之间,其中所述f(δ0)等于1/(1+exp(δ0)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
根据本发明的一些实施例,所述方法包含基于所述距离,获得所述可能性;比较所述可能性和一预定阈值;以及当所述可能性在所述预定阈值以上,治疗所述受验者的所述病毒感染。
根据本发明的一些实施例,所述表达数值的所述组合包含所述表达数值的一线性组合。
根据本发明的一些实施例,所述表达数值的所述组合包括对应于至少一个所述表达数值的至少一非线性项。
根据本发明一些实施例的一观点,提供一种分析一生物学数据的方法,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值。所述方法包含:计算一弯曲表面的一区段和由一第一方向与一第二方向所定义的一平面之间的一第一距离。所述第一距离是在沿着所述第一方向的一第一坐标δ0以及沿着所述第二方向的一第二坐标δ1定义的所述表面上面的一点处被计算。所述方法还包含将所述第一距离关联至一细菌感染的存在、不存在或所述受验者具有所述细菌感染的可能性。每个所述坐标是由所述表达数值的一不同组合所定义,其中至少90%的所述区段介于一下界限表面f(δ01)-ε0和一上界限表面f(δ01)+ε1之间,其中所述f(δ01)等于exp(δ1)/(1+exp(δ0)+exp(δ1)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
根据本发明的一些实施例,对于所述坐标中的至少一个,所述表达数值的所述组合包含所述表达数值的一线性组合。
根据本发明的一些实施例,对于所述坐标中的至少一个,所述表达数值的所述组合包括至少一非线性项对应于所述表达数值中的至少一个。
根据本发明的一些实施例,所述方法基于所述第一距离,获得所述可能性;比较所述可能性和一预定阈值;以及当所述可能性在所述预定阈值以上,治疗所述受验者的所述细菌感染。
根据本发明的一些实施例,所述方法包含计算一第二弯曲表面的一区段和所述平面之间的一第二距离;以及使所述第二距离关联至一病毒感染的存在、不存在或所述受验者具有所述病毒感染的可能性。根据本发明的一些实施例,至少90%的所述第二表面的所述区段介于一第二下界限表面g(δ01)-ε2和一第二上界限表面g(δ01)+ε3之间,其中所述g(δ01)等于exp(δ0)/(1+exp(δ0)+exp(δ1)),以及其中所述ε2和所述ε3中的每一个皆小于0.5。
根据本发明的一些实施例,所述方法包含基于所述第二距离,获得所述可能性;比较所述可能性和一第二预定阈值;以及当所述可能性在所述第二预定阈值以上,治疗所述受验者的所述病毒感染。
根据本发明的一些实施例,所述方法包含基于所述距离,获得所述受验者具有一细菌感染的所述可能性;基于所述第二距离,获得所述受验者具有一病毒感染的所述可能性;比较每一个所述可能性和一对应的预定阈值;以及当每一个所述可能性都在所述对应的预定阈值以下,则确定患者可能具有一非感染性疾病。
根据本发明一些实施例的一观点,提供一种分析一生物学数据的方法,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值。所述方法包含:计算一弯曲表面的一区段和由一第一方向与一第二方向所定义的一平面之间的一距离。所述距离是在沿着所述第一方向的一第一坐标δ0以及沿着所述第二方向的一第二坐标δ1定义的所述表面上面的一点处被计算。所述方法包含将所述距离关联至一病毒感染的存在、不存在或所述受验者具有所述病毒感染的可能性;其中每个所述坐标是由所述表达数值的一不同组合所定义,其中至少90%的所述区段介于一下界限表面g(δ01)-ε0和一上界限表面g(δ01)+ε1之间,其中所述g(δ01)等于exp(δ0)/(1+exp(δ0)+exp(δ1)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
根据本发明的一些实施例,所述数个多肽中的每一个选自于CRP、IP-10、TRAIL、IL1ra、PCT以及SAA所组成的一族群。.
根据本发明的一些实施例,所述数个多肽包含至少三种多肽。
根据本发明的一些实施例,所述数个多肽包含至少三种多肽,选自于CRP、IP-10、TRAIL、IL1ra、PCT以及SAA所组成的一族群。
根据本发明的一些实施例,所述数个多肽包含至少CRP和TRAIL。
根据本发明的一些实施例,所述数个多肽包含至少CRP、TRAIL以及IP-10。
根据本发明的一些实施例,所述方法包含产生所述可能性的一输出,所述输出以文本呈现。
根据本发明的一些实施例,所述方法包含产生所述可能性的一输出,所述输出以图形化呈现。
根据本发明的一些实施例,所述方法包含产生所述可能性的一输出,所述输出使用一颜色索引呈现。
根据本发明的一些实施例,所述血液样本是全血。
根据本发明的一些实施例,所述血液样本是全血中的一部份。
根据本发明的一些实施例,所述血液的所述部份包含血清或血浆。
根据本发明的一些实施例,所述包法包含确定所述表达数值,以及其中所述表达数值中的至少一个是利用电泳或免疫化学来确定。
根据本发明的一些实施例,所述免疫化学确定是通过流式细胞仪(flowcytometry)、放射免疫测定(radioimmunoassay)、免疫荧光(immunofluorescence)或通过一酶联免疫吸附测定(enzyme-linked immunosorbent assay)来实现。
根据本发明的一些实施例,所述计算和所述关联的步骤是通过远离所述受验者的一计算机来执行。
根据本发明的一些实施例,所述计算和所述关联的步骤是通过所述受验者附近的一计算机来执行。
根据本发明的一些实施例,所述计算和所述关联的步骤是通过一云计算设施的一云计算资源来执行。
根据本发明的一些实施例,所述表达数值通过一测量系统来测量,所述测量系统进行至少一自动测定,所述自动测定选自于一自动ELISA、一自动免疫测定以及一自动功能测定所组成的一族群;且所述方法包含一步骤:自所述测量系统接收所述生物学数据。
根据本发明的一些实施例,所述接收是在一互联网网路上通过一网络接口。
根据本发明一些实施例的一观点,提供一种用于分析生物学数据的由计算机实施的方法。所述方法包含:显示一图形用户界面(GUI)在一显示装置上,所述图形用户界面具有一计算激活控制;接收一受验者血液中的数个多肽的数个表达数值;响应于一用户对所述控制的一激活,基于所述表达数值自动计算一分数;在所述GUI上产生一图形比例,所述图形比例具有:被识别为对应于所述受验者的一病毒感染的一第一端,以及被识别为对应于所述受验者的一细菌感染的一第二端;以及在所述比例上对应于所述分数的一位置处产生一标记。
根据本发明的一些实施例,所述表达数值是通过与测量所述表达数值的一外部机器进行通讯来接收。根据本发明的一些实施例,所述GUI包含一通讯控制,其中与所述外部机器的所述通讯是响应于所述用户的所述通讯控制的一激活。
根据本发明的一些实施例,所述GUI包含数个表达数值输入栏位,其中所述表达数值是通过所述输入栏位进行接收。
根据本发明的一些实施例,所述分数是所述受验者具有细菌感染的一可能性。根据本发明的一些实施例,所述分数是所述受验者具有病毒感染的一可能性。
根据本发明一些实施例的一观点,提供一种计算机软件产品,所述计算机软件产品包含一计算机可读介质,其中储存数个程序指令,当所述指令通过一硬件处理器被读取时,所述指令使得所述硬件处理器接收具有一未知疾病的一受验者的血液中的数个多肽的数个表达数值,并且执行如上面描述,并且可选地进一步在下面详细描述的方法。
根据本发明一些实施例的一观点,提供一种用于分析生物学数据的系统。所述系统包含:一用户界面,设置用以接收具有一未知疾病的一受验者的一血液样本中的数个多肽的数个表达数值;以及一硬件处理器,具有一计算机可读介质储存有所述计算机软件产品。
根据本发明一些实施例的一观点,提供一种用于分析生物学数据的系统。所述系统包含:一第一隔间,设置用以测量具有一未知疾病的一受验者的血液中的数个多肽的数个表达数值;一第二隔间,包含具有一计算机可读介质的一硬件处理器,所述计算机可读介质储存所述计算机软件产品。
根据本发明的一些实施例,所述第一隔间、所述第二隔间,以及所述显示装置被安装或整合于一手持装置的一本体上。
根据本发明一些实施例的一观点,提供一种分析一数据集的方法。所述方法包含:(a)存取一数据集,所述数据集包含基于在具有一未知疾病的一受验者的血液中的数个多肽的数个表达数值的数个分类族群,所述未知疾病存在于数个受验者的数个血液样本中,其中所述分类族群包含一细菌感染、一病毒感染以及一非病毒、非细菌疾病;以及(b)分析所述分类族群,以提供至少一第一概率分类函数f(δ01)代表一特定受验者具有一细菌感染的可能性,所述第一分类函数是一第一坐标δ0以及一第二坐标δ1的一函数,以及其中所述坐标中的每一个是由所述表达数值的一不同组合所定义。
根据本发明的一些实施例,所述方法还包含步骤:计算一第二分类函数g(δ01),所述第二分类函数代表一特定受验者具有一病毒感染的可能性,所述第二分类函数也是所述第一坐标以及所述第二坐标的一函数。
根据本发明的一些实施例,所述方法包含步骤:计算一第三分类函数h(δ01),所述第三分类函数代表一特定受验者具有一非病毒、非细菌疾病的可能性,所述第三分类函数也是所述第一坐标以及所述第二坐标的一函数。
根据本发明的一些实施例,对于所述坐标中的至少一个,所述表达数值的所述组合包含所述表达数值的一线性组合。
根据本发明的一些实施例,对于所述坐标中的至少一个,所述表达数值的所述组合包括至少一非线性项对应于所述表达数值中的至少一个。
根据本发明的一些实施例,所述方法包含产生所述分析的一输出。
根据本发明的一些实施例,所述数据集包含一个或以上的多维条目。
根据本发明的一些实施例,所述方法在所述数据集中的每个条目包含对应的所述受验者的至少一个临床参数。
根据本发明的一些实施例,所述方法其中所述临床参数选自于一性别、一年龄、一温度、一症状出现的时间以及一体重所组成的一族群。
根据本发明的一些实施例,所述分析包含机器学习。
根据本发明的一些实施例,所述机器学习包含一监督机器学习。
根据本发明的一些实施例,所述机器学习包含至少一程序选自于由聚类(clustering)、支持向量机(support vector machine)、线性建模(linear modeling)、k-最近邻分析(k-nearest neighbors analysis)、决策树学习(decision tree learning)、综合学习程序(ensemble learning procedure)、神经网络(neural networks)、概率模型(probabilistic model)、图形模型(graphical model)、贝叶斯网络(Bayesian network)、逻辑回归(logistic regression)以及关联规则学习(association rule learning)所组成的一族群。
根据本发明的一些实施例,所述方法其中所述机器学习选自于由支持向量机、神经网络以及逻辑回归所组成的一族群。
根据本发明的一些实施例,所述血液样本是全血。
根据本发明的一些实施例,所述血液样本是全血中的一部份。
根据本发明的一些实施例,所述血液的所述部份包含血清或血浆。
根据本发明的一些实施例,所述表达数值是利用电泳或免疫化学来确定。
根据本发明的一些实施例,所述免疫化学确定是通过流式细胞仪、放射免疫测定、免疫荧光或通过一酶联免疫吸附测定来实现。
根据本发明一些实施例的一观点,提供一种预测一疾病的一预后的方法。所述方法包含步骤:测量具有所述疾病的受验者中的TRAIL蛋白血清水平,当所述TRAIL水平低于一预定水平,则视所述预后比具有一TRAIL蛋白血清水平高于所述预定水平的一疾病的一受验者的预后更差。
根据本发明的一些实施例,所述方法其中所述疾病是一感染性疾病。
根据本发明的一些实施例,所述方法其中所述疾病不是一感染性疾病。
根据本发明一些实施例的一观点,提供一种确定一受验者的一疾病的治疗过程的方法。所述方法包含测量在所述受验者中的TRAIL蛋白血清水平,其中当所述TRAIL水平低于一预定水平,则所述受验者使用一最后治疗手段来进行治疗。
根据本发明的一些实施例,所述预定水平低于20皮克/毫升(pg/ml)。
根据本发明一些实施例的一观点,提供一种确定在生育年龄的一女性受验者中的一感染型的方法。
所述方法包含:比较所述受验者中的TRAIL蛋白血清水平与一预定阈值,所述预定阈值对应于在生育年龄的一健康女性受验者或一组数个健康女性受验者的TRAIL蛋白血清水平,其中所述TRAIL蛋白血清水平与所述预定阈值之间的一差异用于指示一感染型。
根据本发明一些实施例的一观点,提供一种确定在生育年龄的一男性受验者中的一感染型的方法。
所述方法包含:比较所述受验者中的TRAIL蛋白血清水平与一预定阈值,所述预定阈值对应于在生育年龄的一健康男性受验者或一组数个健康男性受验者的TRAIL蛋白血清水平,其中所述TRAIL蛋白血清水平与所述预定阈值之间的一差异用于指示一感染型。
根据本发明的一些实施例,当所述TRAIL蛋白血清水平高于所述预定阈值,所述感染型是病毒的。
根据本发明的一些实施例,当所述TRAIL蛋白血清水平高于所述预定阈值,所述感染型不是细菌的。
根据本发明的一些实施例,当所述TRAIL蛋白血清水平低于所述预定阈值,所述感染型是细菌的。
根据本发明的一些实施例,当所述TRAIL蛋白血清水平低于所述预定阈值,所述感染型不是病毒的。
除非另有定义,否则本文使用的所有技术及/或科学术语具有与普通技术人员对本发明有关的技术领域中所通常理解的相同含义。虽然类似或等同于本文描述的那些方法与材料可以用在本发明实施例的实践或测试中,示例性方法及/或材料仍进行说明如下。在冲突的情况下,专利说明书,包括定义,将控制。此外,材料、方法和举例仅是说明性的,非意指其必要限制。
附图说明
在此描述本发明的一些实施例,仅通过举例的方式,参照随附的图式以及图像。现以具体参照附图详细说明,强调所示细节是通过举例的方式以及为了发明实施例的说明性讨论的目的。在这点上,结合附图所做的描述会使得本领域的技术人员明显可知本发明的实施例可以如何实施。
在附图中:
图1A至1B是研究工作流程。(A)所述研究工作流程的概述。nBacterial、nViral以及nControl分别代表细菌数(包括被混合的细菌加上病毒共同感染)、病毒以及控制(没有明显的感染性疾病)案例。(B)蛋白质发现和验证过程。
图2A-2C显示蛋白质TRAIL,IP-10和CRP在细菌,病毒和非感染性患者中差异表达。呈现了在多数队列(n=765)上测量的TRAIL(A),IP-10(B)和CRP(C)的箱形图。红线和圆圈分别对应于组中位数和平均值;描绘了细菌和病毒组之间,以及感染性(细菌和病毒)与非感染性(包括健康受验者)之间的t-test p值。
图3A-3B是签章与实验室参数和用于诊断细菌与病毒的患者的蛋白质生物标记之间的比较。(A)临床和实验室参数以及表现最好的一对(ANC和Lym%),三重(ANC,Lym%和脉搏)和四重(ANC,Lym%,脉搏,Mono%)参数的表现,其值使用一逻辑回归组合。除了脉搏(记录在292个细菌和326个病毒患者中)和呼吸率(记录在292个细菌和326个病毒患者),多数队列(细菌和病毒患者,n=653)进行了比较。签章表现明显好于(P<10-15)最佳的四重参数。(B)签章表现明显好于(P<10-8)在宿主对感染的反应中具有一确定的作用的生物标记物。对于每个选择的生物标记物,在所述多数队列的亚组中进行分析(对于每个分析,43≤n≤154,一便利样本,n取决于信号的强度)。误差条表示95%CI。
图4显示签章表现在不同的患者亚组中是稳健的。描述了多数队列(细菌和病毒)亚组中的AUC。方形尺寸与患者数量成比例,误差棒代表95%CI。在病原体分析中,将每种病毒与影响相同生理系统的细菌进行比较,如括号所指示的。R-呼吸,S-全身性,C-中枢神经系统,G-胃肠道,U-尿液,K-皮肤。在比5例更多的患者中只发现病原体。对于亚组定义,见实例1中的表1。
图5是MLR模型的校准图。根据其细菌感染(x轴)的预测概率,在顶部面板中,患者分为10个箱,并与每个箱(y轴)中细菌感染的观察分数进行比较。虚线是一个移动平均线(大小为5个箱)。底部面板显示了细菌(红条)和病毒(蓝条)预测概率的分布。
图6A-6B是诊断患者的年龄分布。图6A:整个研究人口(n=794);图6B:仅儿科患者(n=445)。
图7A-7B显示在诊断患者中(n=794)检测到的病原体的分布。图7A:检出病原体中病原体亚组的分布;图7B:检测到的病原体中菌株的分布(从大于1%的患者检测到的菌株被呈现)。分布代表被诊断为感染性疾病患者中的阳性检出的百分比。
图8显示被诊断患有一感染性疾病的患者所涉生理系统的分布(n=673)。
图9A-9B显示临床综合征的分布(所有诊断患者,n=794)。图9A:主要临床综合征;图9B:具体临床综合征。
图10是最大体温分布(n=794)。
图11是症状开始时间分布(n=794)。N/A是健康对照或未获得数据的患者。
图12A-12B是合并症相关的患者人群特征。图12A:合并症分布(所有长期病患者,n=305);图12B:慢性药物的分布(所有长期病患者,n=305)。值得注意的是,一些患者出现了几种慢性疾病,并用几种慢性药物治疗。
图13显示招募地点分布(诊断患者,n=794)。
图14A-14B显示签章的外推PPV和NPV值作为细菌感染的流行性的函数,图14A:一致性(细菌,病毒)队列(n=527),图14B:多数(细菌,病毒)队列(n=653)。
图15A-15E是多数(细菌,病毒,非感染)队列(n=765)中细菌,病毒和非感染性患者(如所示)中临床参数和实验室测量的散点图。红线和圆圈分别对应于中位数和平均值。描绘细菌和病毒组之间以及传染性(细菌和病毒)与非传染性(包括健康受验者)之间的Ttest p值。
图16A-16B使用不同的截止值比较签章和PCT的表现。图16A:从一致性(细菌,病毒)队列中检测76例患者的表现;图16B:从多数(细菌,病毒)队列中检测101名患者的表现。误差条表示95%CI。计算过滤14%的边缘免疫应答患者之后的签章灵敏度和特异性。
图17A-17B使用不同截止值比较签章和CRP的表现。图17A:在一致性(细菌,病毒)队列中(n=527)测定的表现;图17B:在多数(细菌,病毒)队列中(n=653)测定的表现。误差条表示95%CI。计算过滤14%的边缘免疫应答患者之后的签章灵敏度和特异性。
图18A-18H是所选蛋白质生物标记物(任意单位)在细菌和病毒患者中的散点分布图。红线和圆圈分别对应于中位数和平均值。描述细菌和病毒组之间的T test p值。
图19A-19B显示签章的临床准确度对于降低蛋白质测量的技术准确度是稳健的。(A)使用色彩图作为TRAIL(y轴)和CRP(x轴)测量的CV(标准/平均值)的函数来评估区分细菌与病毒感染的签章的AUC。(B)呈现出图19A的对角线上的AUC值,使得TRAIL和CRP的CV相等。
图20是细菌('+'),病毒('o')和非感染性('^')患者的三维可视化。不同的患者类型被映射到CRP(μg/ml),TRAIL和IP-10(pg/ml)浓度图中的不同区域。
图21A-21C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围从0到100。
图22A-22C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围为100到200。
图23A-23C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围为200到300。
图24A-24C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围从300到400。
图25A-25C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围为400到500。
图26A-26C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围为500到1000。
图27A-27C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围从1000到2000。
图28A-28C是作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数的病毒(A)细菌或混合(B)和非感染性或健康(C)的概率,根据用于IP-10的本发明的一些实施例的范围为2000以上。
图29A-29F示出了根据本发明的一实施例,用于区分细菌和非细菌感染的方法的示例性输出。
图30A-30B是示出用于测量TRAIL(图30A)和IP-10(图30B)的快速和缓慢协定之间的相关性的曲线图。
图31是根据本发明的各种示例性实施例,适用于分析从一受验者所获得的生物学数据的方法的流程图。
图32A-32B是描述根据本发明的一些实施例,用于从一平面计算一表面距离的过程的示意图。
图33A-33D是描述根据本发明的一些实施例,用于获得一表面的区段的所述平滑版本的过程的示意图。
图34是根据本发明的一些实施例,用于分析生物学数据的一系统的方块图的示意图。
图35A-35D是描述作为坐标δ0和δ1的函数的细菌(图35A),病毒(图35B),非细菌(图35C)和非感染性(图35D)病因的概率的轮廓图。概率值介于0%(黑色)至100%(白色)之间。
图36A-36B显示低TRAIL水平是指示性或差的患者预后和结果,以及高疾病严重性。(A)与所有其他患者(具有感染性或非感染性病因)相比,进入ICU的患者血清中的TRAIL浓度。(B)与所有其他感染性或非感染性病因的患者相比,进入ICU或死亡的儿科患者血清中的TRAIL浓度。
图37A-37B绘示了生育年龄男性和女性TRAIL浓度差异的图表。
图38A-38E是根据本发明的一些实施例,在一计算机实现的用于分析生物学数据的方法中,适用于接收用户输入的图形用户界面(GUI)的屏幕截图。
图39A和39B是本发明的实施例中,用于分析生物学数据的系统的一方块图的示意图,所述系统包括网络接口(图39A)和用户界面(图39B)。
具体实施方式
本发明,在其一些实施例中,关于计算机分析,且更特别但并不排除地,关于生物学数据的计算机分析,例如为了区分细菌感染和非细菌感染之间,和/或细菌感染和病毒感染之间,和/或感染性与非感染性疾病之间的不同的目的。
在详细解释本发明至少一个实施例前,应当理解的是,本发明不必将其应用限于在以下描述中阐述及/或在附图中绘示的组件及/或方法的构造和布置细节。本发明可以有其他实施例或以各种方式实践或实行。
不同的感染媒介具有独特的分子态样可以被免疫系统识别和靶向。病原体相关分子态样(PAMP)是与不同病原体族群相关联的这种分子的实例,并且可以使用Toll样受体(TLRs)和其他态样辨识受体(例如NOD蛋白)通过先天免疫系统的细胞来辨识。
这些态样可能在不同分类的病原体之间有很大的变化,从而引起不同的免疫应答。例如,TLR-4可以辩识脂多糖(lipopolysaccharide),一种革兰氏阴性细菌的成分,以及脂磷壁酸(lipoteichoic acids),一种革兰氏阳性细菌的成分,因此促进所述免疫系统的一抗微生物反应。TLR-3可以辩识单链RNA(通常用来指示一病毒感染),且因此促使适当的抗病毒反应。所述免疫系统可以通过区分病原体的不同分类(例如细菌与病毒)来建立适当的防御。
在过去几十年中,已经确定了几种宿主标记(host markers)可用于各种适应症中感染源的鉴别诊断。通过测量自所述宿主而不是所述病原体的标记物衍生的标记物,最小化由于人体自然植物区系的非致病菌而造成的“假阳性”诊断是可能的。一个例子是降钙素原(PCT),由甲状腺C细胞所制造的激素降钙素的一种前体。健康个人血液中的PCT水平难以检测到(在pg/ml范围),但其可能由于一严重感染,造成水平升高至100纳克/毫升(ng/ml)。PCT被广泛用于诊断患有全身感染,败血症的患者,具有灵敏度为76%,且特异性为70%。然而,测试PCT在其他非全身性感染如肺炎或上呼吸道感染中的诊断价值的研究中发现其受到限制,特别是在分离使用时。
本发明人之前已经确定了创新的生物标记物套组,其表达模式与感染型显着相关,如国际专利申请WO2011132086和WO2013/117746中所记载的,两者均通过引用并入本文。
本发明在其一些实施例中,是基于将多肽的签章使用于细菌感染、病毒感染和非细菌、非病毒疾病的诊断。本实施例的方法使用模式辩识算法来识别一受验者所遭受的感染类型,这也允许选择适当的治疗方案。本发明的各种实施例通过以下方式解决当前诊断的解决方案的局限性:(i)允许对一广大范围的多种病原体的准确诊断;(ii)能够快速诊断(在几分钟内);(iii)对非病原菌和病毒的存在具有灵敏度(从而降低假阳性的问题);和(iv)消除对所述病原体的直接取样的需要,从而能够诊断难以接近的感染。因此,本发明的一些方法允许选择需要抗生素治疗的受验者,并且预防仅具有一病毒感染或一非感染性疾病的受验者的不必要的抗生素治疗。本发明的一些方法还允许选择抗病毒治疗有利的受验者。
为了证实国际专利申请WO2013/117746中的发现,本发明人现在已经增加了参加一多中心临床试验的患者数量,招募了具有不同类型的既定感染的1002名医院患者以及对照组(既定非病毒/非细菌疾病的患者和健康个体)。
为了提高前述方法的准确度和灵敏度,本发明人现在已经使用一三元分类器,将患者(具有一既定疾病类型的患者)分为下述三类中的其中一类:细菌感染、病毒感染和非细菌、非病毒疾病。比较具有本研究中获得的表达模式的一测试受验者的多肽的组合水平,与实例3和表9-12中总结的一二元分类器相比,在灵敏度和特异性方面获得了优异的结果。
在本发明的上下文中,可以使用以下缩写:ANC=绝对中性粒细胞计数;ANN=人造神经网络;AUC=接收器工作曲线下面积;BP=百日咳博德特氏菌(Bordetellapertussis);CHF=充血性心力衰竭;CI=置信区间;CID=先天性免疫缺陷;CLL=慢性淋巴细胞性白血病;CMV=巨细胞病毒;CNS=中枢神经系统;COPD=慢性阻塞性肺病;CP=肺炎噬衣原体(Chlamydophila pneumonia);CRP=C反应蛋白;CSF=脑脊液;CV=变异系数;DOR=诊断优势比;EBV=爱泼斯坦巴尔病毒(Epstein bar virus);eCRF=电子病例报告表;ED=急诊部;ELISA=酶联免疫吸附测定;FDR=假发现率;FMF=家族性地中海热;G-CSF=粒细胞集落刺激因子;GM-CSF=粒细胞-巨噬细胞集落刺激因子;HBV=乙型肝炎病毒;HCV=丙型肝炎病毒;HI=流感嗜血杆菌;HIV=人类免疫缺陷病毒;IDE=感染性疾病专家;IL=白介素;IRB=机构审查委员会;IVIG=静脉注射免疫球蛋白;KNN=K-最近邻;LP=嗜肺军团菌(Legionella pneumophila);LR+=正可能性比;LR-=负可能性比;LRTI=下呼吸道感染;mAb=单克隆抗体;MDD=最小可检测剂量;MDS=骨髓增生异常综合征;MP=肺炎支原体(Mycoplasma pneumonia);MPD=骨髓增生性疾病;NPV=阴性预测值;PCT=降钙素原;PED=儿科急诊部;PPV=阳性预测值;QA=质量保证;RSV=呼吸道合胞病毒(Respiratorysyncytial virus);RV=鼻病毒;SIRS=全身炎症综合征;SP=肺炎链球菌;STARD=诊断准确度报告标准;SVM=支持向量机;TNF=肿瘤坏死因子;URTI=上呼吸道感染;UTI=尿路感染;WBC=白血球细胞;WS=Wilcoxon rank-sum。
在本发明的上下文中,可以使用以下统计术语:
“TP”是真正的阳性,意味着准确反映测试活性的正向测试结果。例如,在本发明的上下文中,TP是例如但不限于真正对细菌感染进行分类。
“TN”是真正的阴性,表示准确反映所述测试活性的负向测试结果。例如,在本发明上下文中,TN是例如但不限于真正对病毒感染进行分类。
“FN”是假阴性,意味着显示为阴性但无法揭示情况的结果。例如,在本发明的上下文中,FN是例如但不限于将一细菌感染错误地分类为一病毒感染。
“FP”是假阳性,是指错误地分类为一阳性类别的测试结果。例如,在本发明的上下文中,FP是例如但不限于将一病毒感染错误地分类为一细菌感染。
“灵敏度”是通过TP/(TP+FN)或疾病受验者的真正阳性比例计算得到的。
“特异性”由TN/(TN+FP)或非疾病或正常受验者的真实阴性比例计算得到的。
“总准确度”由(TN+TP)/(TN+FP+TP+FN)计算。
“阳性预测值”或“PPV”是通过TP/(TP+FP)或所有阳性测试结果的真阳性比例计算。它本质上受到疾病流行和将要测试的人口的预先测试概率的影响。
“阴性预测值”或“NPV”是通过TN/(TN+FN)或所有阴性测试结果的真实阴性比例计算。它也固有地受到疾病流行和将要测试的人口的预先测试概率的影响。参见例如O’Marcaigh AS,Jacobson RM,“Estimating The Predictive Value Of A DiagnosticTest,How To Prevent Misleading Or Confusing Results,”Clin.Ped.1993,32(8):485-491,其讨论了特异性,灵敏度以及测试的阳性和阴性预测值,例如一临床诊断测试。
“MCC”(Mathews相关系数)计算如下:MCC=(TP*TN–FP*FN)/{(TP+FN)*(TP+FP)*(TN+FP)*(TN+FN)}^0.5
其中TP,FP,TN,FN分别为真阳性,假阳性,真阴性和假阴性。注意到,MCC值的范围介于-1到+1之间,分别表示完全错误和完美的分类。一个0的MCC表示随机分类。MCC已经被展示是有用的,可将灵敏度和特异性组合成一个单一的指标(Baldi,Brunak等人,2000)。在不均衡的分类大小的情况下也可用于测量和优化分类准确度(Baldi,Brunak等,2000)。
“准确度(Accuracy)”是指一测量或计算的数量(一测试报告值)与其实际(或真实)值的符合程度。临床准确度有关真实结果(真阳性(TP)或真阴性(TN)与错误分类结果(假阳性(FP)或假阴性(FN))的比例,可以表述为一灵敏度、特异性、阳性预测值(PPV)或阴性预测值(NPV)、Mathews相关系数(MCC),或一可能性、优势比、接收器工作特征(ROC)曲线、其他测量的曲线下面积(AUC)。
“分析准确度”是指测量过程本身的重现性和可预测性,并且可以总结为诸如变异系数(CV),Pearson相关性,以及具有不同时间,用户,设备和/或试剂的相同样品或对照组的一致性和校准测试。评估新生物标记物的这些和其他考虑因素也在2006年的Vasan中进行了总结。
“表现(performance)”是指与一诊断或预后测试的整体有用性和品质相关的术语,包括其它、临床和分析准确度,其他分析和过程特征,诸如使用特征(如稳定性,易使用性),健康经济价值,以及测试成分的相对成本。这些因素中的任何一个可能是优异表现的来源,以及因此获得测试的有用性,并且可以通过适当的“表现指标”来衡量,诸如AUC和MCC,结果时间,保质期等作为相关因素。
“统计上显著的”,这意味着改变是大于可被预测单靠机会而发生的变化(这可能是“假阳性”)。统计的显着性可以通过本领域已知的任何方法来确定。通常使用的显著性度量包括p值,其呈现获得结果的概率至少与一给定数据点一样极端,假设所述数据点是机会的结果。在p值为0.05或以下时,结果通常被认为是高度显着的。
现在将详细描述本发明的各观点。
图31是根据本发明的各种示例性实施例,适用于分析从一受验者获得的生物学数据的方法的流程图。应当理解的是,除非另有定义,否则以下描述的操作可以以许多组合或执行顺序同时或顺序地执行。具体来说,流程图的排序不被认为是限制的。例如,可以以一不同的顺序(例如,一相反的顺序)或基本上同时地执行以下描述或流程图中以特定顺序出现的两个或多个操作。另外,下面描述的几个操作是可选的,且可能不会被执行。
在本发明的一些实施例中,所述受验者已经用一抗生素进行预先治疗,并且在本发明的一些实施例中,所述受验者没有用一抗生素进行预先治疗。
本文描述的任何方法可以以许多形式实施。例如,它可以实现在一有形介质上诸如用于实行方法操作的一计算机。它可以体现在一计算机可读介质上,包含用于实施方法操作的数个计算机可读指令。它还可以体现在具有数码计算机的电子设备中,所述数码计算机能被设置为在所述有形介质上运行所述计算机程序或者在一计算机可读介质上执行所述指令。
实现本实施例的方法的计算机程序通常可以在例如但不限于CD-ROM或闪存介质的一分配媒介上分发给用户。从所述分配媒介,所述计算机程序可以复制到硬盘或一类似的中间存储介质。在本发明的一些实施例中,通过允许用户经由诸如互联网的通信网络从一远程位置下载程序,可以将实现本实施例的方法的计算机程序分发给用户。所述计算机程序可以通过将所述计算机指令从其分配媒介或其中间存储介质加载到所述计算机的执行存储器中来运行,将所述计算机配置为根据本发明的方法进行动作。所有这些操作都是计算机系统领域的技术人员所熟知的。
本实施例的方法的计算机操作可以由一计算机来执行,所述计算机远离所述受验者或在所述受验者附近。当所述计算机远离所述受验者,它可以通过诸如一电话网络或互联网的网络接收数据。为此,可以使用一本地计算机将数据传输到所述远程计算机。此配置允许在所述受验者处于一不同地区(例如,在家中)时进行分析,并且还允许对多个不同地区的多个受验者进行同时分析。
所述方法的计算机操作也可以由一云计算设施的一云计算资源来执行。所述云计算资源可以包括一计算服务器和可选的一存储服务器,并且可以由本领域已知的一云计算客户端来操作。
根据一些实施例的所述方法可以用于“裁定”一细菌感染。或者,所述方法可以用于排除一非细菌感染。根据一些实施例的所述方法可以用于“排除”一细菌感染并且“裁定”一非细菌疾病。
根据一些实施例的所述方法可以用于“裁定”一病毒感染。或者,所述方法可用于排除一非病毒感染。
根据一些实施例的所述方法可以用于“排除”一病毒感染并且“裁定”一非病毒疾病。
根据一些实施例的所述方法可以用于“裁定”一感染性疾病。或者,所述方法可以用于排除一非感染性疾病。根据一些实施例的所述方法可以用于“排除”一感染性疾病并且“裁定”一非感染性疾病。
通过所述方法分析的所述生物学数据包含在受验者血液中的数个多肽的表达数值。在一些实施例中,所述生物学数据包含仅两个多肽的表达数值,在一些实施例中,所述生物学数据包含至少三个多肽的表达数值,在一些实施例中,生物学数据包含仅三个多肽的表达数值,在一些实施例中,生物学数据包含至少四个多肽的表达数值,在一些实施例中,生物学数据包含仅四个多肽的表达数值,在一些实施例中,生物学数据包含至少五个多肽的表达数值,以及在一些实施例中,生物学数据包含仅五个多肽的表达数值。
本发明人考虑了多种类型的多肽。代表性例子包括但不限于CRP,IP-10,TRAIL,IL1ra,PCT和SAA。在一些实施例中,所述数个多肽包含至少CRP和TRAIL,并且在一些实施例中,所述数个多肽包含至少CRP,TRAIL和IP-10。
在本发明的一些实施例中,所述生物学数据以一受验者特特定数据集的形式提供,如本文进一步详细描述的。
根据一个特定实施例,通过所述方法分析分泌物(即可溶)多肽(例如TRAIL,CRP和IP-10)的水平。
本文所用的术语“受验者”优选为人类。一受验者可以是男性或女性。所述受验者可能是一新生儿,婴儿,小孩或成人。一受验者可以是以前被诊断或鉴定为具有一感染,并且可选地已经经历或正在进行感染的治疗性干预的人。或者,一受验者也可以是以前未被诊断为具有感染的受验者。例如,一受验者可以是表现出具有感染的一个或多个危险因素的受验者。一受验者也可能具有感染,但并没有显出感染症状。
根据本发明的一些实施例被诊断其疾病的所述受验者,在下文中被称为“测试受验者”。本发明人已经收集关于数个受验者的多肽的表达模式的知识,所述数个受验者的疾病已经被诊断,并已经基于所述收集的知识来设计本实施例的分析技术。此数个受验者下文中被称为“预先诊断的受验者”或者“其他受验者”。
本文所用的用语“细菌感染”是指一受验者被一细菌感染的一种情况。所述感染可能有症状或无症状。在本发明的上下文中,所述细菌感染还可以包含一病毒组分(即由一细菌和一病毒所引起的混合感染)。
所述细菌感染可以是急性或慢性的。
急性感染的特征为疾病的迅速发作,一相对短暂的症状期间,和数天内解决。一慢性感染是发展缓慢并且持续很一长时间的感染。急性和慢性感染之间的差异在于,在急性感染期间,免疫系统常常制造抵抗感染媒介的抗体IgM+,因而感染的慢性阶段通常是IgM-/IgG+抗体的特性。此外,急性感染导致免疫介导坏死过程,而慢性感染常常导致炎性介导纤维化过程并且留疤。因此,急性和慢性感染可以引发不同的潜在免疫学机制。
所述细菌感染可能是革兰氏阳性,革兰氏阴性菌或非典型细菌的结果。
本文所用的术语“革兰氏阳性细菌(Gram-positive bacteria)”是指特征在于具有肽聚糖以及多糖和/或磷壁酸作为其细胞壁结构的一部分的细菌,并且其特征在于革兰氏染色程序中它们的蓝紫色反应。代表性的革兰氏阳性菌包括:放线菌(Actinomycesspp.)、炭疽芽孢杆菌(Bacillus anthracis)、双歧杆菌(Bifidobacterium spp.)、肉毒杆菌(Clostridium botulinum)、产气荚膜梭菌(Clostridium perfringens)、梭菌(Clostridium spp.)、破伤风杆菌(Clostridium tetani)、白喉棒状杆菌(Corynebacterium diphtheria)、杰氏棒状杆菌(Corynebacterium jeikeium)、粪肠球菌(Enterococcus faecalis)、屎肠球菌(Enterococcus faecium)、欧氏白僵菌(Erysipelothrix rhusiopathiae)、真杆菌属(Eubacterium spp.)、阴道加德纳菌(Gardnerella vaginalis)、麻疹孪生球菌(Gemella morbillorum)、明串珠菌属(Leuconostoc spp.)、脓肿分枝杆菌(Mycobacterium abcessus)、鸟分枝杆菌复合菌(Mycobacterium avium complex)、龟分枝杆菌(Mycobacterium chelonae)、偶发分枝杆菌(Mycobacterium fortuitum)、嗜血分枝杆菌(Mycobacterium haemophilium)、堪萨斯分枝杆菌(Mycobacterium kansasii)、麻风分枝杆菌(Mycobacterium leprae)、海分枝杆菌(Mycobacterium marinum)、瘰疬分枝杆菌(Mycobacterium scrofulaceum)、耻垢分枝杆菌(Mycobacterium smegmatis)、土分枝杆菌(Mycobacterium terrae)、结核分枝杆菌(Mycobacterium tuberculosis)、溃疡分枝杆菌(Mycobacterium ulcerans)、诺卡式菌(Nocardia spp.)、黑色消化球菌(Peptococcus niger)、消化链球菌(Peptostreptococcusspp.)、丙酸杆菌(Proprionibacterium spp.)、金黄色葡萄球菌(Staphylococcusaureus)、耳葡萄球菌(Staphylococcus auricularis)、头状葡萄球菌(Staphylococcuscapitis)、孔氏葡萄球菌(Staphylococcus cohnii)、表皮葡萄球菌(Staphylococcusepidermidis)、溶血性葡萄球菌(Staphylococcus haemolyticus)、人葡萄球菌(Staphylococcus hominis)、路登葡萄球菌(Staphylococcus lugdanensis)、糖解葡萄球菌(Staphylococcus saccharolyticus)、腐生葡萄球菌(Staphylococcussaprophyticus)、施氏葡萄球菌(Staphylococcus schleiferi)、模仿葡萄球菌(Staphylococcus similans)、华纳葡萄球菌(Staphylococcus warneri)、木糖葡萄球菌(Staphylococcus xylosus)、无乳链球菌(B群链球菌)[Streptococcus agalactiae(groupB streptococcus)]、咽峡炎链球菌(Streptococcus anginosus)、牛链球菌(Streptococcus bovis)、犬链球菌(Streptococcus canis)、马链球菌(Streptococcusequi)、米勒链球菌(Streptococcus milleri)、轻型链球菌(Streptococcus mitior)、变形链球菌(Streptococcus mutans)、肺炎链球菌(Streptococcus pneumonia)、化脓性链球菌(A群链球菌)[Streptococcus pyogenes(group A streptococcus)]、唾液链球菌(Streptococcus salivarius)、血链球菌(Streptococcus sanguis)。
本文所用的术语“革兰氏阴性细菌(Gram-negative bacteria)”是指每个细菌细胞周围存在双重膜为特征的细菌。
代表性的革兰氏阴性细菌包括醋酸钙不动杆菌(Acinetobactercalcoaceticus)、伴放线放线杆菌(Actinobacillus actinomycetemcomitans)、嗜水气单胞菌Aeromonas hydrophila,木糖氧化产碱菌(Alcaligenes xylosoxidans)、拟杆菌(Bacteroides)、脆弱拟杆菌(Bacteroides fragilis)、杆状巴尔通体(Bartonellabacilliformis)、博德特菌(Bordetella spp.)、伯氏疏螺旋体(Borrelia burgdorferi)、粘膜炎布兰汉球菌(Branhamella catarrhalis)、布鲁菌(Brucella spp.)、弯曲杆菌(Campylobacter spp.)、肺炎嗜衣原体(Chalmydia pneumonia)、鹦鹉热嗜衣原体(Chlamydia psittaci)、沙眼衣原体(Chlamydia trachomatis)、紫色色杆菌(Chromobacterium violaceum)、柠檬酸杆菌(Citrobacter spp.)、啮蚀艾肯菌(Eikenellacorrodens)、产气肠杆菌(Enterobacter aerogenes)、大肠埃希菌(Escherichia coli)、脑膜脓毒性黄杆菌(Flavobacterium meningosepticum)、梭杆菌(Fusobacterium spp.)、流感嗜血杆菌(Haemophilus influenza)、嗜血杆菌(Haemophilus spp.)、幽门螺旋杆菌(Helicobacter pylori)、克雷伯氏菌(Klebsiella spp.)、军团菌(Legionella spp.)、钩端螺旋体(Leptospira spp.)、卡他莫拉菌(Moraxella catarrhalis)、摩氏摩根菌(Morganella morganii)、肺炎支原体(Mycoplasma pneumonia)、淋病奈瑟菌(Neisseriagonorrhoeae)、脑膜炎奈瑟菌(Neisseria meningitides)、多杀性巴氏杆菌(Pasteurellamultocida)、类志贺邻单胞菌(Plesiomonas shigelloides)、普雷沃氏菌(Prevotellaspp.)、变形菌(Proteus spp.)、雷氏普罗威登斯菌(Providencia rettgeri)、铜绿假单胞菌(Pseudomonas aeruginosa)、假单胞菌(Pseudomonas spp.)、普氏立克次氏体(Rickettsia prowazekii)、立氏立克次体(Rickettsia rickettsia)、罗卡利马体(Rochalimaea spp.)、沙门氏菌(Salmonella spp.)、伤寒沙门氏菌(Salmonella typhi)、粘质沙雷氏菌(Serratia marcescens)、志贺氏菌(Shigella spp.)、斑点病密螺旋体(Treponema carateum)、苍白密螺旋体(Treponema pallidum)、他方苍白密螺旋体(Treponema pallidum endemicum)、细弱密螺旋体(Treponema pertenue)、韦荣球菌(Veillonella spp.)、霍乱弧菌(Vibrio cholera)、创伤弧菌(Vibrio vulnificus)、结肠炎耶尔森杆菌(Yersinia enterocolitica)以及鼠疫耶尔森杆菌(Yersinia pestis)。
术语“非典型细菌(Atypical bacteria)”是指不属于古典“革兰氏”组之一的细菌。通常它们是细胞内细菌病原体。它们包括但不限于支原体(Mycoplasmas spp)、军团菌(Legionella spp)、立克次氏体(Lickettsiae spp)和衣原体(Chlamydiae spp)。
本文所用的术语“非细菌疾病”是指不是由感染性细菌引起的任何疾病或病症。
参考图31所示,所述方法从310开始,继续到311,计算一第一弯曲物S的一区段SROI与一非弯曲物π之间的一第一距离d。通常,所述第一弯曲物S是n维中的一流形,其中n是一正整数,以及所述非弯曲物π在n+1维空间中是一超平面。
在n+1维度中的n维流形和超平面的概念是几何学领域的技术人员所熟知的。例如,当n=1时,所述第一弯曲物是一曲线,并且所述非弯曲物π是二维中的一超平面,即定义一轴线的一条直线。当n=2时,所述第一弯曲物为一弯曲表面,且所述非弯曲物π为三维的一超平面,即一平坦平面,以下称为“平面”。
所述超平面π由n个方向定义。例如,当所述非弯曲物是一轴线时,它由一单一方向所定义,并且当所述非弯曲物是一平面时,它由两个方向所定义,称为一第一方向和一第二方向。
在所述超平面π上的一点P处计算所述流形S和所述超平面π之间的所述距离。P由n个坐标所定义。例如,当所述超平面为一轴时,P沿着所述单一方向由一单一坐标δ1定义,以及当所述超平面为一平面时,P由一对坐标表示(δ01),其中δ0被称为“一第一坐标”并且沿着所述第一方向被定义,以及δ1被称为“一第二坐标”,并且沿着所述第二方向被定义。除非另有明确说明,否则对坐标δ0的引用描述了当S是一表面并且π是一平面时预期的一可选实施例。
所述方向使用和它相应的坐标相同的希腊字母来表示,除了用加下底线的希腊字母表示的方向,以表示他们是向量。因此,所述第一方向被表示为δ 0,所述第二方向被表示为δ 1
图32A示出了对于n=2的情况的超平面π。在这些实施例中,π是由方向δ 0δ 1定义的一平面。还显示了在(δ0,δ1)处的点P。方向δ 0δ 1显示为彼此正交,但不一定是这种情况,因为δ0和δ1之间的角度可以不同于90°。在所述平面π内,有一个感兴趣的平面区域πROI沿方向δ 0从一最小的第一坐标δ0,MIN跨越到一最大的第一坐标δ0,MAX;以及沿方向δ 1从一最小的第二坐标δ1,MIN到一最大的第二坐标δ1,MAX。所述点P在所述感兴趣区域πROI内。当n=1(未显示)时,π是一个轴,且所述感兴趣区域πROI是从δ1,MIN跨越到δ1,MAX沿方向δ 1的π的一线性区段。
绘示了所述超平面π和所述流形S的图32B示出了所述第一距离d的计算。垂直于π,从S到P点测量所述距离d。应当理解的是,虽然物件π和S中的每个都被示出为一条一维线,但是不一定是这种情况,因为S和π通常是n维数学物件。例如,当S是一表面以及π是一平面时,π和S都是二维数学物件。S的所述区段SROI在一感兴趣区域πROI上。例如,当π是一平面时,πROI是一个平面的感兴趣区域,当π是一个轴时,πROI是沿一轴线的一个线性区段。因此,πROI是SROI在π上投影。对于n=2,SROI优选为(所述表面)S的一非平面区段,并且对于n=1,SROI优选为(所述曲线)S的一弯曲区段。
n坐标中的每一个由所述多肽的数个表达数值的一组合来定义。例如,对于n=1,所述坐标δ1由所述多肽的表达数值的一组合来定义,并且对于n=2,每个坐标δ0和δ1由所述多肽的所述表达数值的一不同组合来定义。
例如,根据以下等式,δ1和可选地还有δ0是所述多肽的组合:
δ0=a0+a1D1+a2D2+...+φ0
δ1=b0+b1D1+b2D2+...+φ1,
其中a0,a1,...和b0,b1,...都是常数和预定系数,且所述变量D1,D2,...中的每一个是所述多肽的一表达水平,以及δ0和δ1是相对于所述表达水平中至少一个的非线性函数。
所述函数φ0和φ1中的每一个是可选的,且可独立被设为0(或者等效地,不包含于所述相应坐标的计算中)。当φ0=0时,所述坐标δ0是所述多肽的一组合,φ1=0时,所述坐标δ1是所述多肽的一组合。
所述非线性函数φ0和φ1可选地并且优选地可以被表示为表达水平的幂的次方数,例如,根据以下等式:
φ0=∑iqiXi γi
φ1=∑iriXi λi,
其中i是一求和指数,qi和ri是系数集,Xi∈{D1,D2,...},且γi和λi中的每一个都是一个数字指数。注意到,每个非线性函数φ0和φ1中的项的数量不一定等于所述多肽的数量,并且每个总和中的两个或更多个项可以对应于相同的多肽,尽管具有不同的数字指数。
下面的实例段落提供了适用于本实施例的多个系数的代表性实例(参见表3、13-17、29和31-36)。
当φ0=0,φ1=0时,所述多肽包括TRAIL,δ0是可选地且优选地是TRAIL的表达数值的一增加函数,以及δ1是TRAIL的一递减函数。当φ0=0,φ0=0,以及所述多肽包括CRP,δ1和可选地δ0可选地且优选地是CRP的一表达数值的一增加函数。当所述多肽包括IP-10,δ1和可选地δ0可选地且优选地是IP-10的一表达数值的一增加函数。
在实施例中,其中φ0=0,φ1=0且所述多肽包括TRAIL、CRP以及IP-10,δ0和δ1中的每一个可以是TRAIL、CRP以及IP-10的一线性组合,根据以下等式:
δ0=a0+a1C+a2I+a3T
δ1=b0+b1C+b2I+b3T,
其中C、I和T分别是CRP、IP-10和TRAIL的表达水平。
优选地,a1和b1都是正的。优选a2和b2均为正。
优选地,a3为正且b3为负。在以下的实例段落中提供了适用于组合为一线性组合和所述多肽为CRP、IP-10以及TRAIL的系数的代表性实例(参见表3、13-17和33)。
在φ0≠0,φ1≠0且所述多肽包括TRAIL、CRP和IP-10的实施例中,每个δ0和δ1可以是TRAIL、CRP和IP-10的一组合,根据以下等式:
δ0=a0+a1C+a2I+a3T+φ0
δ1=b0+b1C+b2I+b3T+φ1
其中φ0和φ1中的每一个是C、I和T中至少两个的一非线性函数。作为代表性示例,φ0和φ1可以被表示为:
φ0=q1Cγ1+q2Cγ2+q3Tγ3
φ1=r1Cγ1+r2Cγ2+r3Tγ3.
在以下的实施例段落中提供了适用于所述多肽是CRP,IP-10和TRAIL以及所述非线性函数不为0的实施例的系数的代表性示例(参见表36)。
所述πROI的边界δ0,MIN、δ0,MAX、δ1,MIN、δ1,MAX优选对应于所述多肽的表达数值的生理可能范围。
当使用实例8中所述的协定进行测量时,更优选下文实例9,所述生理上可能的范围通常从0至约400微克/毫升(μg/ml)(CRP),从0至约3000pg/ml(IP-10)以及从0至约700pg/ml(TRAIL)。一些受验者可能会出现超出这些范围的浓度。在本发明的各种示例性实施例中,当根据实例8中所述的协定测量TRAIL,CRP和IP-10的表达数值时,更优选下面的实例9,所述系数a0,..,a3以及b0,...,b3取自下表3,以及πROI的边界为:δ0,MIN=--1.3、δ0,MAX=45、δ1,MIN=-14.3以及δ1,MAX=49.6。
当TRAIL,CRP和IP-10的表达数值通过不同于实例8中描述的协定来进行测量时,更优选的是下面的实例9,所述系数a0,..,a3和b0,...,b3的值与下表3的值不同,因此πROI的边界也与上述值不同。在这种情况下,所述系数和边界的值与上述值相关联,其中每个系数和边界的相关性从根据实例8中所述的协定测量的相应蛋白质的表达数值,更优选实例9,以及实际测量的相应蛋白质的表达数值之间的相关性导出。
弯曲物S的所述区段SROI的至少一主要部分介于下面称为一下界限弯曲物SLB和一上界限弯曲物SUB的两个弯曲物之间。
如本文所用“区段SROI的主要部分”是指一平滑版本SROI的一部份,其长度(当n=1)、表面积(当n=2)或体积(当n≥3)为60%、70%、80%、90%、95%或99%的所述SROI的一长度、表面积或体积的一平滑版本。
如本文所用,“区段SROI的一平滑版本”是指所述区段SROI,除了高斯曲率高于一曲率阈值的点附近的SROI的区域,其是SROI的中位数曲率的X倍,其中X为1.5、2、4或8。
可以采用下面步骤来确定是否所述区段SROI的主要部份是介于SLB和SUB之间。首先,获得所述区段SROI的一平滑版本。其次,计算所述区段SROI的所述平滑版本的所述长度(当n=1),表面积(当n=2)或体积(当n≥3)A1。第三,计算所述区段SROI介于SLB和SUB之间的所述平滑版本的所述部份的所述长度(当n=1),表面积(当n=2)或体积(当n≥3)A2。第四,计算A2相对于A1的百分比。
图33A至33D示出了获得SROI的所述平滑版本的过程。
为了说明清楚,SROI被示为一维区段,但本领域技术人员将理解,SROI通常是一个n维数学物件。对于SROI上的足够数量的采样点计算高斯曲率。例如,当所述流形表示为点云时,可以针对点云中的点来计算所述高斯曲率。然后获得所述高斯曲率的中位数,并且通过获得的中位数乘以因子X来计算所述曲率阈值。图33A示出了在平滑操作之前的SROI。标示处是具有一个或多个点322的一区域320,该处的所述高斯曲率高于所述曲率阈值。去除区域320内具有高斯曲率最大值的一点或多点,且所述区域320平滑地插入,例如通过多项式插值(图33B)。反复地重复去除和插值(图33C),直到所述区段SROI不包含高斯曲率高于所述曲率阈值的区域(图33D)。
当n=1时(即当S为一曲线时),SLB是一下界限曲线,SUB是一上界限曲线。在这些实施例中,SLB和SUB可以以如下形式书写::
SLB=f(δ1)-ε0
SUB=f(δ1)+ε1
其中f(δ1)是坐标δ1的一概率分类函数(沿方向δ 1),表示所述测试受验者具有一细菌感染的可能性。在本发明的一些实施例中,f(δ1)=1/(1+exp(δ1)))。πROI内的任何δ1值的SLB和SUB均为正值。还考虑到的是,其中f(δ1)是一概率分类函数,其表示测试受验者具有一病毒感染的可能性的实施例。进一步考虑的是其中f(δ1)是一概率分类函数,其表示测试受验者感染的可能性的实施例。
当n=2时(即当S为一弯曲表面时),SLB是一下界限弯曲表面,SUB为一上界限弯曲表面。在这些实施例中,SLB和SUB可以以如下形式书写:
SLB=f(δ0,δ1)-ε0
SUB=f(δ0,δ1)+ε1
其中f(δ01)是所述第一和第二坐标(沿所述第一和第二方向)的一概率分类函数,代表所述测试受验者具有一细菌感染的可能性。在本发明的一些实施例中,f(δ01)=exp(δ1)/(1+exp(δ0)+exp(δ1)))。πROI内的任何δ0和δ1的SLB和SUB均为正值。
在任何上述实施例中,参数ε0和ε1中的每一个都小于0.5或小于0.4或小于0.3或小于0.2或小于0.1或小于0.05。
再次参考图31所示,所述方法进行到312,计算出的所述距离d与所述受验者具有与所述概率函数f的类型相对应的一疾病或病症的存在、不存在或可能性相关联。例如,当所述概率函数f表示所述测试受验者具有一细菌感染的可能性时,计算出的所述距离d与一细菌感染的存在,不存在或所述受验者具有所述细菌感染的可能性相关联。
在本发明的各种示例性实施例中,所述关联包括确定距离d是所述受验者具有细菌感染的可能性。所述可能性可选地且优选地与一预定阈值ωB进行比较,其中,当可能性高于ωB时,所述方法可以确定所述受验者可能具有一细菌感染,反之受验者不可能有一细菌感染。ωB的典型值包括但不限于约0.2,约0.3,约0.4,约0.5,约0.6和约0.7。也可以考虑其他的可能性阈值。
在本发明的一些实施例中,当所述方法确定所述受验者可能具有一细菌感染时,所述受验者被治疗(316)所述细菌感染,如本文进一步详细描述的。
本发明人发现了一概率分类函数g(δ01),其表示所述测试受验者具有一病毒感染的可能性。在本发明的各种示例性实施例中,g(δ01)等于exp(δ0)/(1+exp(δ0)+exp(δ1))。
根据本发明的一些实施例,所述函数g还可用于评估所述受验者具有的一病毒感染的存在、不存在或可能性。因此,在一些实施例中,所述方法进行到313,在该处计算一第二弯曲表面的一区段和所述平面π之间的一第二距离,以及314,其中所述第二距离被关联至一病毒感染的存在、不存在或所述受验者具有所述病毒感染的可能性。对应于313和314的过程和定义与上述对311和312的过程和定义进行了比较修改,两者是相似的。因此,例如,所述第二表面的所述区段的一主要部分在一第二下界限表面g(δ01)-ε2和第二上界限表面g(δ01)+ε3之间,其中ε2和ε3中的每一个皆小于0.5或小于0.4或小于0.3或小于0.2或小于0.1或小于0.05。
在本发明的一些实施例中,当所述方法确定所述受验者可能具有一病毒感染时,所述受验者被治疗(316)所述病毒感染,如本文进一步详细描述。
在本发明的各种示例性实施例中,所述关联包括确定所述第二距离是所述受验者具有一病毒感染的可能性。所述可能性可选地且优选地与一预定阈值ωV进行比较,其中,当可能性高于ωV时,所述方法可以确定所述受验者可能具有一病毒感染,反之受验者不可能有一病毒感染。ωV的典型值包括但不限于约约0.5,约0.6约0.7和约0.8。也可以考虑其他的可能性阈值。
在执行操作313和314的实施例中,可以执行或不执行操作311和312。例如,本实施例考虑了不执行操作311和312的过程,并且所述方法确定所述受验者具有一病毒感染的可能性,而不计算所述第一距离,且不将所述第一距离关联至一细菌感染的存在、不存在或所述受验者有一细菌感染的可能性。
或者,可以执行所有操作311-314,其中不管314的结果执行311和312,并且313和314也被执行,不管312的结果。在这些实施例中,所述方法可选地且优选地确定所述受验者具有一细菌感染以及一病毒感染的可能性。这些可能性中的每一个可以与各自相应的预定阈值(ωB或ωV)进行比较。当每个可能性皆低于其相应的预订阈值时,所述方法可以确定患者可能具有一非细菌和一非病毒的感染性疾病。例如,所述方法可以确定所述受验者可能具有一非感染性疾病,一真菌病或一寄生虫病。
仍然可选地,不论是否执行一些操作,取决于一个或多个其他操作的结果。例如,所述方法可以执行311和312,以便确定所述受验者具有一细菌感染的可能性。此后,将确定的可能性与所述阈值ωB进行比较。如果确定的可能性高于ωB,则所述方法跳过执行313和314,否则就执行313和314。这些实施例的另一实例是所述方法执行313和314的过程,以便确定所述受验者具有一病毒感染的可能性。此后,将确定的所述可能性与阈值ωV进行比较。如果确定的可能性高于ωV,所述方法将跳过311和312的执行,否则就执行311和312。
所述方法可选地并且优选地继续到315,在该处产生所述(多个)可能性的一输出。所述输出可以呈现为文本,和/或图形和/或使用一颜色索引。所述输出可以可选地包括与所述阈值ωB的比较结果。图29A至29F和38A至38E示出了根据本发明的实施例,适用于区分细菌和非细菌感染的示例性输出。
所述方法在317结束。
图38A至38E是根据本发明的一些实施例,在一计算机实现的用于分析生物学数据的方法中,适用于接收用户输入的一图形用户界面(GUI)的屏幕截图。
所述GUI包括一计算激活控制390,其可以是一按钮控制的形式。所述GUI还可以包括数个表达数值的输入栏位380,其中每个表达数值的输入栏位被配置用以从一用户接收一受验者血液中的一多肽的一表达数值。所述用户输入所述多肽的表达数值到所述输入栏位。或者,所述表达数值可以通过在所述计算机和测量所述表达数值的一外部机器(未示出)之间建立的一通信来接收。在这些实施例中,所述用户不需要将所述表达数值手动输入到输入栏位中。在一些实施例中,所述GUI包括一通讯控制392,例如以一按钮控制的形式,其中与所述外部机器的通信是响应于所述用户的通讯控制的一激活。
响应于所述用户的一激活控制390,所述计算机基于自动接收的所述表达数值或通过栏位380计算一分数。所述核心可以是所述受验者具有一细菌感染和/或一病毒感染的可能性。例如,可以通过计算一弯曲表面和所述两个方向定义的一平面之间的一距离来计算分数,如上文进一步详细描述的。
可以在所述GUI上生成图形比例382。所述图形比例可以包括被识别为对应于一病毒感染的第一端,以及被识别为对应于一细菌感染的一第二端。
一旦分数被计算,一标记394可选地且优选地可以在对应于所计算的可能性的位置处在所述图形382上被产生。图38A示出了值输入到输入栏位之前的GUI,图38B示出了对应于感染为细菌的可能性为96%的位置处在比例382上的标记394,且图38C显示了感染是细菌的可能性为1%的位置处在比例382上的标记394(或等同地,感染是病毒的可能性为99%)。可选地,所述GUI还以数字显示所计算出来的分数。
GUI可选地并且优选地包括按钮控件形式的一个或多个附加控件386,388。例如,当所述用户激活所述控件388时,所述控件388可以指示计算机清除所述输入栏位380。这允许所述用户填入对应于一不同样本的值。在一些实施例中,所述GUI也产生总结先前的样本的结果的一输出384。当所述用户激活所述控件386时,所述控件386可以指示计算机清除所述输入栏位380以及所述输出384。这允许所述用户开始一个新的运行(可选地具有多重样本)而不登出所述GUI。
适用于本实施例的一协定的代表性示例如下。
所述GUI呈现一个具有对话框的一认证用户,允许所述用户填入实验的质量控制(QC)值。所述QC被验证,且图38A中的所述GUI被产出。所述用户在栏位380中填入所述表达数值,并激活控件390以接收结果(例如,图38B和38C)。为了填入另一血液样本的表达数值,所述用户激活控件388。每个样本的结果被添加到输出384,所述输出384可以是例如一个表格的形式。要在不关闭软件或登出所述用户的情况下输入一个新的实验,则激活所述控件386以清除输出384并输入新的QC值。优选地,所有操作都记录在一个或多个日志文件中。
在本发明的一些实施例中,GUI还包括显示先前实验的结果的一报告屏幕(图38D和38E),例如响应于日期的请求。
必须理解的是,本文示出的多肽名称以举例的方式提供。许多替代性名称、别名、修改、同种型和变型形式将对本领域的技术人员明显易于理解的。因此,旨在涵盖所有替代性蛋白名称、别名、修改、同种型和变型形式。
基因产品是根据由国际人类基因组织命名委员会(HGNC)分配的官方信件缩写或基因符号确定的,并在美国国家生物技术信息中心(NCBI)网站上提交的日期被列出也已知为Entrez基因。
TRAIL:所述基因编码的蛋白为属于肿瘤坏死因子(TNF)配体家族的细胞因子。所述基因的其他名称包括但不限于AP02L、TNF-相关细胞凋亡诱导配体、TNFSF10和CD253。TRAIL存在于膜结合形式和可溶形式中,这两者均可在不同细胞中诱导细胞凋亡,例如转化肿瘤细胞。所述蛋白结合至TNF受体超家族的若干成员如TNFRSF10A/TRAILR1、NFRSF1B/TRAILR2、NFRSF10C/TRAILR3、TNFRSF10D/TRAILR4,并且可能还结合至NFRSFl1B/0PG。可以通过结合至不可能诱导细胞凋亡的诱骗受体例如NFRSF10C/TRAILR3、TNFRSF10D/TRAILR4和NFRSFl 1B/0PG,以调制该蛋白的活性。所述蛋白质与其受体的结合已表明触发MAPK8/JNK、半胱天冬酶8和半胱天冬酶3的活化。已发现用于此基因的编码不同同种型的选择性剪接转录物变体。TRAIL可从由细胞表面溶解蛋白性裂解以产生具有同源三聚体结构的可溶形式。
根据一特定实施例,TRAIL形成的所述可溶性(即分泌物)的水平被测量。
根据另一实施例,所述TRAIL形成的细胞膜被测量。
还根据另一实施例,TRAIL形成的所述细胞膜和所述分泌都被测量。
根据本发明的另一观点,提供一种确定一受验者中的一感染型的方法,所述方法包含测量可溶性TRAIL和不溶性TRAIL的浓度,其中所述浓度用来指示所述感染型。
在一实施例中,当所述可溶性TRAIL的所述浓度高于一预定阈值,所述受验者被裁定有一细菌感染。
在另一实施例中,当所述可溶性TRAIL的所述浓度高于一预定阈值,所述受验者被裁定有一病毒感染。
可溶性TRAIL的示例蛋白质序列说明于SEQ ID编号:37和SEQ ID编号:38。
细胞膜人类TRAIL的一示例的mRNA序列说明于SEQ ID编号:1。
细胞膜人类TRAIL的一示例的氨基酸序列说明于SEQ ID编号:4。
TRAIL的其他示例cDNA和氨基酸序列说明于SEQ ID NOs:2、3和5-8。
IP10:此基因编码CXC亚族的趋化因子和受体CXCR3的配体。所述蛋白与CXCR3的结合导致多效性,包括单核细胞的刺激,自然杀手和T细胞迁移,以及粘附分子表达的调节。所述基因的其他名称包括但不限于:IP-10,CXCL10,Gamma-IP10,INP10和趋化因子(C-X-C基序)配体10。
人类IP10的示例cDNA序列说明于SEQ ID编号:9-12。人类IP10的示例氨基酸序列说明于SEQ ID编号:13。
CRP:C-反应性蛋白;CRP的其他别名包括但不限于RP11-419N10.4和PTXl。此基因编码的蛋白质属于正五聚蛋白家族。基于其辨识外来病原体和宿主的受损细胞以及通过在血液中与体液和细胞效应器系统相互作用来引发它们的消除的能力,其涉及若干宿主防御有关功能。因此,在急性期期间,血浆中此蛋白的水平极大增加对组织损伤、感染、或其他炎性刺激的响应。CRP显示与宿主防御相关的若干功能:其通过其与磷酸胆碱的钙依赖性结合促进凝集,细菌荚膜肿胀,吞噬和补体固定。
人类CRP的示例cDNA序列说明于SEQ ID编号:14-16。
人类CRP的示例氨基酸序列说明于SEQ ID编号:17。
IL1RA:此基因编码的蛋白质为属于白介素I受体家族的细胞因子受体。此蛋白为用于白介素a(ILIA)、白介素β(ILlB)和白介素I受体I型(IL1R1/IL1RA)的受体。其为涉及许多细胞因子诱导的免疫和炎性响应的重要介导。所述基因的其他名称包括但不限于:CD121A、IL-lRTl、p80、CD121a抗原、CD121A、IL1R和ILlra。
人类IL1RA的示例cDNA序列说明于SEQ ID编号:18、19和20。
人类IL1RA的示例氨基酸序列说明于SEQ ID编号:21-24。
PCT:降钙素原(PCT)是激素降钙素的肽前体,后者涉及钙稳态。降钙素原(“pCT”)是由116个氨基酸组成并具有约13,000道尔顿分子量的蛋白质。降钙素的激素原是正常代谢条件下由甲状腺C细胞产生和分泌的。pCT和降钙素合成由包含141个氨基酸的一前体肽的前降钙素原(“pre-pCT”)的转译起始。人类pre-pCT的氨基酸序列由Moullec等人描述于FEBS Letters,167:93-97,1984中。pCT是在信号肽切割之后(pre-pCT的前25个氨基酸)所形成的。
人类PCT的示例cDNA序列说明于SEQ ID编号:31-32。
人类PCT的示例氨基酸序列说明于SEQ ID编号:33-36。
SAA:编码载脂蛋白的血清淀粉样A家族的成员。所述编码的蛋白质为响应于炎症和组织损伤而高度表达的一主要急性期蛋白质。此蛋白质还在HDL代谢和胆固醇体内平衡中发挥重要作用。此蛋白的高水平与慢性炎症疾病相关,包括动脉硬化症、类风湿性关节炎、阿尔茨海默病和克隆氏病。此蛋白质还可能是某些肿瘤的一潜在生物标记。选择性剪接造成编码相同的蛋白质的多个转录物变体。
人类SAA的示例cDNA序列说明于SEQ ID编号:25-27。
人类SAA的示例氨基酸序列说明于SEQ ID编号:28-30。
应当理解的是,由于患者至患者DNA变异可能引起可导致蛋白质氨基酸序列差异的SNP,本发明人还考虑了具有至少90%、95%或99%的与上文提供的序列同源的氨基酸序列的蛋白质。
测量所述多肽(例如,TRAIL,IP-10和CRP)水平通常受蛋白质水平影响,如下文进一步描述的。
检测蛋白质的表达和/或活性的方法
在本发明的一些实施例中,在培养物的细胞中表达的蛋白质的表达和/或活性水平,可以使用本领域已知的方法测定,并且通常涉及使用抗体。这种方法可以称为免疫测定。免疫测定可以在多个步骤中运行,利用试剂被添加并在测量的不同点被冲洗掉或分离。多步测定通常称为分离免疫测定或异种免疫测定。一些免疫测定可以简单地通过混合所述试剂和样本进行一物理测量。这种测定称为同源免疫测定或更少频率的非分离免疫测定。在免疫测定中经常使用校准品。校准品是已知含有所讨论的分析物的溶液,并且所述分析物的浓度通常是已知的。比较对真实样本的一测定响应与所述校准品产生的所述测定响应,使得可以根据样本中分析物的存在或浓度来解释信号强度。
所述抗体可以是前述的单克隆抗体,多克隆抗体、嵌合抗体或片段,以及检测所述反应产物的步骤可以用任何合适的免疫测定进行。
用来检测多肽的抗体的合适来源包含市售可得来源,例如Abazyme,Abnova,AssayPro,Affinity Biologicals,AntibodyShop,Aviva bioscience,Biogenesis,Biosense Laboratories,Calbiochem,Cell Sciences,Chemicon International,Chemokine,Clontech,Cytolab,DAKO,Diagnostic BioSystems,eBioscience,EndocrineTechnologies,Enzo Biochem,Eurogentec,Fusion Antibodies,GenesisBiotech,GloboZymes,Haematologic Technologies,Immunodetect,Immunodiagnostik,Immunometrics,Immunostar,Immunovision,Biogenex,Invitrogen,JacksonImmunoResearch Laboratory,KMI Diagnostics,Koma Biotech,LabFrontier LifeScience Institute,Lee Laboratories,Lifescreen,Maine Biotechnology Services,Mediclone,MicroPharm Ltd.,ModiQuest,Molecular Innovations,Molecular Probes,Neoclone,Neuromics,New England Biolabs,Novocastra,Novus Biologicals,OncogeneResearch Products,Orbigen,Oxford Biotechnology,Panvera,PerkinElmer LifeSciences,Pharmingen,Phoenix Pharmaceuticals,Pierce Chemical Company,PolymunScientific,Polysiences,Inc.,Promega Corporation,Proteogenix,ProtosImmunoresearch,QED Biosciences,Inc.,R&D Systems,Repligen,ResearchDiagnostics,Roboscreen,Santa Cruz Biotechnology,Seikagaku America,SerologicalCorporation,Serotec,SigmaAldrich,StemCell Technologies,Synaptic Systems GmbH,Technopharm,Terra Nova Biotechnology,TiterMax,Trillium Diagnostics,UpstateBiotechnology,US Biological,Vector Laboratories,Wako Pure ChemicalIndustries,以及Zeptometrix。然而,技术人员能常规制备针对本文所述任意多肽的抗体。
用于测量多肽的多克隆抗体包括但不限于通过以下一种或多种主动免疫从血清产生的抗体:兔,山羊,绵羊,鸡,鸭,豚鼠,小鼠,驴,骆驼,大鼠和马。
另外的检测剂的实例包括但不限于:scFv,dsFv,Fab,sVH,F(ab')2,环肽,Haptamers,单结构域抗体,Fab片段,单链可变片段,Affibody分子,Affilins,纳米肽,Anticalins,Avimers,DARPins,Kunitz结构域,Fynomer和Monobody。
酶联免疫吸附测定(ELISA):进行ELISA涉及至少一种对于一特定抗原具有特异性的抗体。具有未知量抗原的样本非特异性地(通过吸附到表面)或特异性地(通过针对相同抗原特异性的另一种抗体,在“三明治”ELISA中捕获)被固定在一固体支持物上(通常为聚苯乙烯微量滴定板)。所述抗原被固定后,加入检测抗体,与所述抗原形成一复合物。所述检测抗体可以与一酶共价连接,或者本身可以通过生物缀合与酶连接的一第二抗体来检测。在每个步骤之间,通常用温和的洗涤剂溶液洗涤所述面板,以除去任何被非特异性结合的蛋白质或抗体。在最后的洗涤步骤之后,通过加入一酶底物以产生可见信号,显示出样本中的抗原量。
通常在此方法中使用的酶包括辣根过氧化物酶(horseradish peroxidase)和碱性磷酸酶(alkaline phosphatase)。如果校准良好并且在线性响应范围内,样本中存在的底物量与产生的颜色量成正比。通常采用衬底标准来提高定量准确度。
免疫印迹(Western blot):此方法涉及通过丙烯酰胺凝胶将一底物与其它蛋白质分离,然后将所述底物转移到一膜(例如尼龙或PVDF)上。然后通过对底物特异性的抗体检测所述底物的存在,这轮流由抗体结合试剂来检测。抗体结合试剂可以是例如蛋白A或其他抗体。抗体结合试剂可以如上所述被放射性标记或酶连接。检测可以通过放射自显影,比色反应或化学发光。所述方法同时允许通过膜上的相对位置定量所述底物和确定其身份,其用于指示电泳期间所述丙烯酰胺凝胶中的一迁移距离。
荧光激活细胞分选(FACS):此方法涉及通过底物特异性抗体在细胞中原位检测一底物。所述底物特异性抗体与荧光团连接。通过一细胞分选机进行检测,所述机器在光束通过时读取从每个细胞所发射的光的波长。此方法可以同时使用两种或更多种抗体。
自动免疫测定:应用于免疫测定(通常称为“自动免疫测定”)的自动化分析仪是一种医学实验室仪器,旨在以最少的人力援助快速测量许多生物样品中的不同化学物质和其他特征。这些血液和其他液体的测量性质可用于诊断疾病。许多将样本引入分析仪的方法被发明。这可以包括将样本的试管放置在机架中,其可以沿着轨道移动,或者将管插入旋转的圆形转盘中以使样本可被应用。一些分析仪需要将样本转移到样本杯中。然而,保护实验室工作人员的健康和安全的努力促使许多制造商开发具有闭管取样的分析仪,防止工作人员直接接触样本。样本可以单独,批量或连续处理。自动免疫测定机的实例包括但不限于:ARCHITECT ci4100,ci8200(2003),ci16200(2007),ARCHITECT i1000SR,ARCHITECTi2000,,i2000SR,i4000SR,AxSYM/AxSYM Plus,1994U.S.,DS2,AIMS,AtheNA,DSX,ChemWell,UniCel DxI 860i Synchron Access Clinical System,UniCel DxC 680iSynchron Access Clinical System,Access/Access 2Immunoassay System,UniCel DxI600 Access Immunoassay System,UniCel DxC 600i Synchron Access ClinicalSystem,UniCel DxI 800Access Immunoassay System,UniCel DxC 880i SynchronAccess Clinical System,UniCel DxI 660i Synchron Access Clinical System,SPAPLUS(Specialist Protein Analyzer),VIDAS Immunoassay Analyzer,BioPlex 2200,PhDSystem EVOLIS PR 3100TSC Photometer,MAGO 4S/2011 Mago Plus Automated EIAProcessor,LIAISON XL/2010LIAISON,ETI-MAX 3000 Agility,Triturus,HYTEC288PLUSDSX,VITROS ECi Immunodiagnostic System,VITROS 3600ImmunodiagnosticSystem,Phadia Laboratory System 100E,Phadia Laboratory System 250,PhadiaLaboratory System 1000,Phadia Laboratory System 2500,Phadia Laboratory System5000,cobas e 602/2010,cobas e411,cobas e601,MODULAR ANALYTICS E170,Elecsys2010,Dimension EXL 200/2011,Dimension Xpand Plus Integrated Chemistry System,Dimension RxL Max/Max Suite Integrated Chemistry System,;Dimension RxLIntegrated Chemistry System,Dimension EXL with LM Integrated ChemistrySystem,Stratus CSAcute Care Diagnostic System,IMMULITE 2000 XPi ImmunoassaySystem,ADVIA Centaur CP Immunoassay System,IMMULITE 2000,IMMULITE 1000,Dimension Vista 500 Intelligent Lab System,Dimension Vista 1500 IntelligentLab System,ADVIA Centaur XP,AIA-900,AIA-360,AIA-2000,AIA-600II,AIA-1800。CRP、IP-10和TRAIL的测量也可以在一Luminex机器上进行。
横向流量免疫测定(LFIA):这是一种允许在护理点(POC)快速测量分析物的技术,其基本原理如下所述。根据一实施例,在上下文中使用LFIA的手持设备。
所述技术基于一系列毛细管床,例如多孔纸或烧结聚合物片。这些元件中的每一个都具有自发地输送流体(例如尿液)的能力。所述第一元件(样品垫)作为一海绵使用并保持一过量的样品流体。一旦浸泡,所述流体迁移到制造商已经存储所谓的结合物的第二个元件(缀合垫),一干燥形式的生物活性颗粒(见下文)在一盐-糖基质中,其包含所有内容以保证目标分子(例如,抗原)与其已经固定在颗粒表面上的化学配偶体(例如抗体)之间的一最佳化化学反应。当所述样品流体溶解盐-糖基质时,它也溶解颗粒,并且在一个组合转运作用下,样品和共轭混合物同时流过多孔结构。以这种方式,分析物在进一步迁移通过第三毛细管床的同时与颗粒结合。此材料具有一个或多个区域(通常称为条纹),其中第三分子已被制造商固定。当样品-共轭物混合物达到这些条纹时,分析物已经结合在颗粒上,且第三个“捕获”分子结合所述复合物。
过了一会儿,当越来越多的流体流过条纹时,颗粒积聚且条纹区域变色。通常有至少两条条纹:一种(对照),其捕获任何颗粒,从而显示反应条件和技术工作正常,第二条包含特定的捕获分子,仅捕获固定有分析物分子的那些颗粒。在通过这些反应区之后,所述流体进入最终的多孔材料,芯只能起废物容器的作用。横向流量测试可以如竞争或三明治测定被操作。
免疫组化分析:根据本发明一些实施例的免疫测定可以是同质测定或异质测定。在一同质测定中,所述免疫反应通常涉及特异性抗体(例如,抗TRAIL,CRP和/或IP-10抗体)、一标记的分析物和感兴趣的样品。当抗体与标记的分析物结合时,从标记产生的信号被直接或间接地修饰。所述免疫反应和其程度的检测都可以在一匀相溶液中进行。可以使用的免疫化学标记物包括自由基、放射性同位素、荧光染料、酶、噬菌体或辅酶。
在一异质测定方法中,试剂通常是样品、抗体和产生可检测信号的工具。可以使用如上所述的样品。抗体可以固定在一支撑物上,例如一珠(如蛋白A和蛋白G琼脂糖珠)、平板或载玻片上,并与疑似含有所述抗原的样品在一液相中接触。
根据一特定实施例,将所述抗体固定在一多孔条上以形成一检测位点。所述多孔条的测量或检测区域可以包括数个位点,一个用于TRAIL,一个用于CRP,一个用于IP-10。一测试条也可能包含阴性和/或阳性对照的位点。
或者,对照位点可以位于与测试条分开的条带上。任选地,不同的检测位点可以含有不同量的抗体,例如在第一检测位点中有一较高的量和在随后的位点中有一较少的量。加入测试样品后,显示可检测信号的位点数量提供样品中多肽存在量的定量指示。检测位点可以被配置成任何适当可检测的形状,并且通常是横跨一测试条的宽度的一棒状或点状。
然后将支撑物与液相分离,并且使用用于产生这种信号的装置来检查支撑相或液相的可检测信号。所述信号与样品中分析物的存在有关。用于产生可检测信号的方法包括使用放射性标记,荧光标记或酶标记。例如,如果待检测的抗原含有一第二结合位点,则可以将结合所述位点的抗体缀合到一可检测的基团,并在分离步骤之前加入到所述液相反应溶液中。在固体支撑物上可检测基团的存在表明抗原在试验样品中的存在。合适的免疫测定的实例是寡核苷酸法,免疫印迹,免疫荧光法,免疫沉淀法,化学发光法,电化学发光法(ECL)或酶联免疫测定。
本领域技术人员将熟悉许多具体的免疫测定格式及其变体,其可用于实施本文公开的方法。一般可见于E.Maggio,Enzyme-Immunoassay,(1980)(CRC Press,Inc.,BocaRaton,Fla.);另参见美国专利第4,727,022号,Skold等人揭示的标题为“Methods forModulating Ligand-Receptor Interactions and their Application,”;美国专利第4,659,678号Forrest等人揭示的标题为“Immunoassay of Antigens,”;美国专利第4,376,110号,David等人,标题为“Immunometric Assays Using Monoclonal Antibodies,”;美国专利第4,275,149号,Litman等人,标题为“Macromolecular Environment Control inSpecific Receptor Assays,”;美国专利第4,233,402号,Maggio等人,标题为“Reagentsand Method Employing Channeling,”以及美国专利第4,230,767号由Boguslaski等人揭示的标题为“Heterogenous Specific Binding Assay Employing a Coenzyme asLabel.”。
抗体可以根据已知技术结合到适合于诊断测定的一固体支持物(例如,诸如蛋白A或蛋白G琼脂糖,微球,平板,载玻片或由诸如胶乳或聚苯乙烯的材料形成的孔的小珠),例如被动结合。同样可以将本文所述的抗体与可检测的标记或基团例如放射性标记(例如35S,125I,131I),酶标记(例如辣根过氧化物酶,碱性磷酸酶)和荧光标记(例如荧光素,Alexa,绿色荧光蛋白质,罗丹明)依照已知技术进行结合。
用于测量TRAIL的单克隆抗体包括但不限于:老鼠,单克隆(55B709-3)IgG;老鼠,单克隆(2E5)IgG1;老鼠,单克隆(2E05)IgG1;老鼠,单克隆(M912292)IgG1 kappa;老鼠,单克隆(IIIF6)IgG2b;老鼠,单克隆(2E1-1B9)IgG1;老鼠,单克隆(RIK-2)IgG1,kappa;老鼠,单克隆M181 IgG1;老鼠,单克隆VI10E IgG2b;老鼠,单克隆MAB375 IgG1;老鼠,单克隆MAB687IgG1;老鼠,单克隆HS501 IgG1;老鼠,单克隆clone 75411.11老鼠IgG1;老鼠,单克隆T8175-50 IgG;老鼠,单克隆2B2.108 IgG1;老鼠,单克隆B-T24IgG1;老鼠,单克隆55B709.3 IgG1;老鼠,单克隆D3 IgG1;山羊,单克隆C19 IgG;兔子,单克隆H257 IgG;老鼠,单克隆500-M49 IgG;老鼠,单克隆05-607IgG;老鼠,单克隆B-T24 IgG1;大鼠,单克隆(N2B2),IgG2a,kappa;老鼠,单克隆(1A7-2B7),IgG1;老鼠,单克隆(55B709.3),IgG以及老鼠,单克隆B-S23*IgG1;人类TRAIL/TNFSF10 MAb(Clone 75411),老鼠IgG1;人类TRAIL/TNFSF10 MAb(Clone 124723),老鼠IgG1;人类TRAIL/TNFSF10MAb(Clone 75402),老鼠IgG1。
用于测量TRAIL的抗体包括用于测量TRAIL的单克隆抗体和多克隆抗体。用于测量TRAIL的抗体包括被开发以靶向表位的抗体,所述表位从以下面列表包含的:小鼠骨髓瘤细胞系NS0来源的重组人类TRAIL(Thr95Gly281Accession#P50591),小鼠骨髓瘤细胞系,NS0来源的重组人类TRAIL(Thr95Gly281,与N端Met和6-His tag登陆号:P50591)、大肠杆菌来源(Val114-Gly281,具有和不具有N端Met登录号:Q6IBA9),人类血浆衍生的TRAIL,人类血清衍生的TRAIL,重组人类TRAIL,其中第一个氨基酸位于第85-151之间的位置,以及最后一个氨基酸位于第249-281位。
用于测量CRP的单克隆抗体的实例包括但不限于:老鼠,单克隆(108-2A2);老鼠,单克隆(108-7G41D2);老鼠,单克隆(12D-2C-36),IgG1;老鼠,单克隆(1G1),IgG1;老鼠,单克隆(5A9),IgG2a kappa;老鼠,单克隆(63F4),IgG1;老鼠,单克隆(67A1),IgG1;老鼠,单克隆(8B-5E),IgG1;老鼠,单克隆(B893M),IgG2b,lambda;老鼠,单克隆(C1),IgG2b;老鼠,单克隆(C11F2),IgG;老鼠,单克隆(C2),IgG1;老鼠,单克隆(C3),IgG1;老鼠,单克隆(C4),IgG1;老鼠,单克隆(C5),IgG2a;老鼠,单克隆(C6),IgG2a;老鼠,单克隆(C7),IgG1;老鼠,单克隆(CRP103),IgG2b;老鼠,单克隆(CRP11),IgG1;老鼠,单克隆(CRP135),IgG1;老鼠,单克隆(CRP169),IgG2a;老鼠,单克隆(CRP30),IgG1;老鼠,单克隆(CRP36),IgG2a;兔子,单克隆(EPR283Y),IgG;老鼠,单克隆(KT39),IgG2b;老鼠,单克隆(N-a),IgG1;老鼠,单克隆(N1G1),IgG1;单克隆(P5A9AT);老鼠,单克隆(S5G1),IgG1;老鼠,单克隆(SB78c),IgG1;老鼠,单克隆(SB78d),IgG1以及兔子,单克隆(Y284),IgG,人类C-反应性蛋白/CRP Biot MAb(Cl 232024),老鼠IgG2B,人类C-反应性蛋白/CRP MAb(Clone 232007),老鼠IgG2B,人/老鼠/猪C-反应性蛋白/CRP MAb(Cl 232026),老鼠IgG2A。
用于测量CRP的抗体包括用于测量CRP的单克隆抗体和用于测量CRP的多克隆抗体。
用于测量CRP的抗体还包括被开发以靶向从包含以下列表中的抗体的表位:人血浆衍生的CRP,人血清衍生的CRP,小鼠骨髓瘤细胞系NS0来源的重组人类C-反应性蛋白/CRP(Phe17Pro224登录号P02741)。
用于测量IP-10的单克隆抗体的实例包括但不限于:IP-10/CXCL10老鼠抗人类单克隆(4D5)抗体(LifeSpan BioSciences)、IP-10/CXCL10老鼠抗人类单克隆(A00163.01)抗体(LifeSpan BioSciences)、老鼠抗人类IP-10(AbD Serotec)、兔子抗人类IP-10(AbDSerotec)、IP-10人类mAb 6D4(Hycult Biotech)、老鼠抗人类IP-10单克隆抗体Clone B-C50(Diaclone)、老鼠抗人类IP-10单克隆抗体Clone B-C55(Diaclone)、人类CXCL10/IP-10MAb Clone 33036(R&D Systems)、CXCL10/INP10抗体1E9(Novus Biologicals)、CXCL10/INP10抗体2C1(Novus Biologicals)、CXCL10/INP10抗体6D4(Novus Biologicals)、CXCL10单克隆抗体M01A clone 2C1(Abnova Corporation)、CXCL10单克隆抗体(M05)、clone 1E9(Abnova Corporation)、CXCL10单克隆抗体、clone 1(Abnova Corporation)、IP10抗体6D4(Abcam)、IP10抗体EPR7849(Abcam)、IP10抗体EPR7850(Abcam)。
用于测量IP-10的抗体包括用于测量IP-10的单克隆抗体和用于测量IP-10的多克隆抗体。
测量IP-10的抗体也包括被开发以靶向表位的抗体,所述表位被包含在下面列出的:重组人类CXCL10/IP-10、含有77个氨基酸的非糖基化多肽链(aa 22-98)以及一N-端Histag干扰素γ诱导蛋白10(125aa长)、IP-10His Tag人类重组IP-10于大肠杆菌制造的含有77个氨基酸的片段(22-98)且具有一总分子重为8.5kDa带有一氨端的六组氨酸tag、大肠杆菌来源人类IP-10(Val22-Pro98)具有一N-端Met、人类血浆来源的IP-10、人类血清来源的IP-10、重组人类IP-10该处具有第一氨基酸介于1-24位与最后一个氨基酸位于71-98位。
应当理解,本文所述的多肽的表达水平可以是一绝对表达水平,一归一化表达和/或一相对表达水平。
在一般的科学背景下,归一化是将一测量原始数据转换成可以与其他归一化数据直接比较的数据的过程。在本发明的上下文中,表达水平的测量容易发生错误,例如,测量样品的不相等的降解,每个测定的不同负载量和其他各种误差。更具体地说,由于人为错误和设备失效,任何测定样品都可能含有比所想要的更多或更少的生物材料。因此,相同的误差或偏差适用于本发明的多肽和对照参考,其表达基本上是恒定的。因此,通过控制参考原始表达数值除以TRAIL,IP-10或CRP原始表达数值,得到一个商数,其基本上没有任何技术失效或不准确(除了为了测试目的而破坏样品的重大错误),并构成一个归一化表达数值的多肽。由于控制参考表达数值在不同样本中是相等的,因此它们构成了对这种归一化有效的一个公共参考点。
根据一特定实施例,所述多肽表达数值的每一个都使用相同的控制参考被归一化。
将进一步理解的是,绝对表达数值是取决于所使用的精确协定,因为每个协定通常导致不同的信噪比,并且因此导致测量的不同浓度。更具体地说,虽然生物标记物的整体趋势将被保留,无论所述协定如何(例如病毒感染中的TRAIL增加和细菌减少),所述测量尺度依赖于协定。
如下文实例5所示,可以通过将两种协定的测量值相关并计算一转化函数来补偿不同协定中测量的蛋白质浓度的这种变化。
通常,分析的样本是包含全血,血清,血浆,白细胞或血细胞的血液样本。优选地,所述样本是全血,血清或血浆。
值得注意的是,TRAIL和IP-10和CRP在其他组织和样本中是高度表达,所述样本包括但不限于CSF,唾液和上皮细胞,骨髓抽吸,尿液,粪便,肺泡灌洗液,痰液。因此,本发明的一些实施例可用于测量这些组织和样本中的TRAIL,CRP和IP-10。
优选地,在获得样本后约24小时内测量多肽的水平。或者,当在获得样本后24小时内储存开始时,在12℃或更低温度储存的样本中测量所述多肽的浓度。
一旦进行测试以确定多肽的水平,包含测量结果的一受验者特定数据集可选地被产生。
所述受验者特定数据集可以利用一计算机可读格式存储在一非易失性计算机可读介质上,以及可选地且优选地由衣硬件处理器,诸如一通用计算机或专用电路进行存取。
如上所述,所述测试受验者血液中的多肽水平与数个受验者血液中相同的多肽的水平进行比较,当所述受验者已经基于多肽血液水平以外的参数被验证为具有一细菌感染、病毒感染或非细菌/非病毒性疾病。数个受验者的多肽的水平与其验证的诊断可以被存储在一第二数据集中,本文中也称为“组数据集”或“预诊数据集”,如下文进一步描述。
术语“非细菌/非病毒疾病”是指不是由细菌或病毒引起的疾病。这包括急性心肌梗死,身体伤害,癫痫发作,炎症的疾病等,真菌性疾病,寄生虫病等。
本文所用的术语“病毒感染”是指由病毒引起并且不包含一细菌组分的疾病。
分析一数据集的方法,例如,为了计算代表一特定受验者具有一细菌感染的可能性,或者一特定受验者具有一病毒感染的可能性,或者一特定受验者具有一非细菌非病毒疾病的可能性的一个或多个概率分类函数,可以如下文实例1所述来进行。例如,可以使用PCR诊断测定来支持诊断,例如(i)
Figure GDA0002255600990000511
RV15用于检测副流感病毒1,2,3,4(parainfluenza virus 1,2,3,4),冠状病毒(coronavirus)229E/NL63,腺病毒A/B/C/D/E(adenovirus A/B/C/D/E),博卡病毒1/2/3/4(bocavirus 1/2/3/4),流感病毒A和B,偏肺病毒(metapneumovirus),冠状病毒OC43,鼻病毒A/B/C,呼吸道合胞病毒A和B以及肠病毒(Enterovirus),或(ii)
Figure GDA0002255600990000512
PB6用于检测肺炎链球菌,流感嗜血杆菌,肺炎衣原体,嗜肺军团菌,百日咳博德特氏菌和肺炎支原体。
血液培养物,尿液培养物和粪便培养物可以分析志贺氏菌,弯曲杆菌和沙门氏菌;血清学检测(IgM和/或IgG)用于巨细胞病毒(CMV),爱泼斯坦巴尔病毒(EBV),肺炎支原体和贝纳氏立克次体(Coxiella burnetii)(Q-热)。
放射学检查(例如疑似下呼吸道感染的胸部X光检查[LRTI])可用于确认胸部感染。
可替代的,或者另外还可以使用至少一名受过训练的医生来建立诊断。
在上文中已经描述了在预诊的受验者中确定多肽的表达水平的方法。
优选地,用于确定预诊的受验者中所述多肽的表达水平的相同方法被用于确定所述测试受验者中多肽的水平。因此,例如,如果使用一免疫测定型方法来确定预先诊断的受验者中多肽的表达水平,则应该使用一免疫测定型方法来确定所述测试受验者中的多肽水平。
应当理解,血液样本的类型在所述测试受验者和预先诊断的受验者之间不需要相同。本发明人能够显示TRAIL的血清和血浆水平非常相似。因此,例如,如果使用一血清样本来确定预先诊断的受验者中的多肽的表达水平,则可以使用一血浆样本来确定所述测试受验者中多肽的水平。
所述组数据集优选地以一计算机可读格式存储在一非易失性计算机可读介质上,并且可选且优选地由诸如一通用计算机或一专用电路的一硬件处理器存取。所述数据集可以存储在相同的介质上,以及可选且优选地由相同的硬件处理器来存取。
在所述受验者特定数据集中,每个条目可选地并且优选地可以被描述为一个元组(D,L),其中D表示数据集中的多肽,L表示多肽D的血液水平。因此,所述数据集可以是一二维数据集,其中所有元素可以由所述多肽和相应的响应跨越的一二维空间中的向量来描述。在所述组数据集中,每个条目可以描述为一个元组(S,G,D,L),其中S表示特定受验者,G表示组数据集中的受验者S的诊断,D表示多肽和L代表多肽D的血液水平。因此,所述示例性说明是一四维数据集,其中所有元素可以由所述受验者,诊断,多肽和各自的反应跨越的一四维空间中的向量来描述。本发明的一些实施例考虑使用较高尺度的数据集。这样的数据集在下文中被描述。
所述组数据集可选且优选地还可以包括所述受验者特定数据集的条目中的一个或多个,更优选全部。在所述组数据集的实施例中,所述组数据集包括所述受验者特定数据集的所有条目,其不需要使用两个单独的数据集,因为整个数据集都包含在一个广泛的数据集中。然而,这种广泛性的数据集可选并且优选地以允许区分与被分析的受验者相关联的广泛数据集的一部分以及仅与另一个受验者相关联的广泛数据集的一部分之间的方式被注解。在本公开的上下文中,即使没有将其作为一个单独的数据集来提供,与被分析的受验者相关联的广泛数据集的一部分被称为所述受验者特定数据集。类似地,即使没有提供作为一个单独的数据集,仅与其他受验者相关联的广泛数据集的一部分被称为所述组数据集。
所述组数据集优选包括许多受验者的多肽水平(例如,至少10个受验者被预先诊断为具有病毒感染,至少10个受验者被预先诊断为具有细菌感染,并且至少10个受验者被预先诊断为具有非细菌/非病毒疾病;或者至少20个受验者被预先诊断为具有病毒感染,至少20个受验者被预先诊断为具有细菌感染并且至少有20位受验者被预先诊断为具有非细菌/非病毒疾病;或至少有50名受验者被预先诊断为具有病毒感染,至少有50名受验者被预先诊断为具有细菌感染,并且至少50个受验者被预先诊断为具有非细菌/非病毒性疾病。
所述组特定数据集可以包括描述所述受验者的附加数据。包含附加数据的数据集可能是有利的,因为它们提供关于被分析的受验者和另一受验者之间的相似性的附加信息,从而增加可预测性的准确度。
除多肽水平以外的数据类型的代表性实例包括但不限于传统的实验室风险因子和/或临床参数,如上文进一步描述的。
本实施例考虑了受验者特定的和包含附加数据的组数据集,除了多肽和相应的水平。在一些实施例中,所述数据集中的至少一个包括一个或更多(例如,数个)多维条目,每个条目具有至少三维,在一些实施例中,数据集中的至少一个包括一个或更多(例如,数个)多维条目,每个条目至少有四个维度,在一些实施例中,数据集中的至少一个包括一个或更多(例如,数个)多维条目,每个条目具有至少五个维度,以及在一些实施例中,所述数据集中的至少一个包括一个或更多(例如,数个)多维条目,每个条目具有超过五个维度。
所述数据集的附加维度提供了与被分析的受验者,另一个受验者和/或TRAIL,CRP和IP-10以外的多肽水平有关的附加信息。
在本发明的一些实施例中,附加信息涉及传统实验室风险因子,临床参数,血液化学和/或遗传图谱中的至少一个。
“传统实验室风险因子”涵盖分离或来源于对象样品的生物标记,其当前在临床实验室中评估并且用于传统全球风险评价算法,例如嗜中性粒细胞绝对计数(缩写ANC),淋巴细胞绝对计数(缩写ALC),白细胞计数(缩写WBC),嗜中性粒细胞%(定义为为嗜中性粒细胞的白血细胞的部分并且缩写Neu(%)),淋巴细胞%(定义为为淋巴细胞的白血细胞的部分并且缩写Lym(%)),单核细胞%(定义为为单核细胞的白血细胞的部分并且缩写Mon(%))、钠(缩写Na)、钾(缩写K)、胆红素(缩写Bili)。
优选地,被分析的所述受验者的至少一个传统实验室风险因子被包括在所述受验者特定数据集中,并且其他受验者中的一或更多个(更优选全部)的所述传统实验室风险因子中的至少一个被包含在组数据集中。当所述受验者特定数据集包含所述传统实验室风险因子中的至少一个,所述风险因子可以被包含作为一单独的条目。当所述组数据集包含风险因素时,每个受验者可选地优选地包括所述风险因素。因此,例如,所述组数据集条目可以由元组(S,G,D,L{R})描述,其中先前已经引入了S,G,D和L,并且{R}是所述受验者S的至少一个风险因子。
“临床参数”涵盖对象健康状况的所有非样品或非分析物生物标记或其他特性,例如但不限于年龄(Age)、种族(RACE)、性别(Sex)、核心体温(缩写“温度”)、症状初始出现后的最大核心体温(缩写“最大温度”)、症状初始出现时间(缩写“症状时间”)或家族历史(缩写FamHX)。
优选地,被分析的所述受验者的至少一个所述临床参数被包括在所述受验者特定数据集中,并且其他受验者中的一或更多个(更优选全部)的所述临床参数中的至少一个被包含在组数据集中。当所述受验者特定数据集包含所述临床参数中的至少一个,所述临床参数可以被包含作为一单独的条目。当所述组数据集包含临床参数时,每个受验者可选地优选地包括所述临床参数。因此,例如,一组数据集条目可以由元组(S,G,D,L{C})描述,其中先前已经引入了S,G,D和L,并且{C}是所述受验者S的至少一个临床参数。
如本文所用,“血液化学”是指溶解在或包含血液中的任何和所有物质的浓度。这些物质的代表性实例包括但不限于白蛋白,淀粉酶,碱性磷酸酶,碳酸氢盐,总胆红素,BUN,C-反应蛋白,钙,氯化物,LDL,HDL,总胆固醇,肌酐,CPK,γ-GT,葡萄糖,LDH,无机磷,脂肪酶,钾,总蛋白,AST,ALT,钠,甘油三酸酯,尿酸和VLDL。
根据一实施例,被分析的所述受验者的血液化学被包括在所述受验者特定数据集中,并且其他受验者中的一或更多个(更优选全部)的所述血液化学被包含在组数据集中。当所述受验者特定数据集包含所述血液化学,所述血液化学可以被包含作为一单独的条目。当所述组数据集包含血液化学时,每个受验者可选地优选地包括所述血液化学。因此,例如,一组数据集条目可以由元组(S,G,D,L{C})描述,其中先前已经引入了S,G,D和L,并且{C}是所述受验者S的所述血液化学。
在本发明的一些实施例中,附加信息涉及个体的遗传图谱。
本文使用的“遗传图谱”是指对许多不同基因的分析,遗传图谱可以涵盖个体的整个基因组中的基因,或者可以包含一特定的基因子集,所述遗传图谱可以包括一基因组谱,一蛋白质组图谱,一表观基因组谱和/或一转录谱。
优选第,被分析的所述受验者的遗传图谱被包括在所述受验者特定数据集中,并且其他受验者中的一或更多个(更优选全部)的所述遗传图谱被包含在组数据集中。当所述受验者特定数据集包含所述遗传图谱,所述遗传图谱可以被包含作为一单独的条目。当所述组数据集包含遗传图谱时,每个受验者可选地优选地包括所述遗传图谱。因此,例如,一组数据集条目可以由元组(S,G,D,L{P})描述,其中先前已经引入了S,G,D和L,并且{P}是所述受验者S的所述遗传图谱。
所述方法可选地并且优选地继续到一步骤,至少临时地将多肽的水平存储在一非易失性计算机可读介质上,可以根据需要从其中提取或显示。
一旦存取了两个数据集,所述方法将继续进行到分析阶段,以便诊断所述受验者。
执行分析以便计算一个或多个概率分类函数f(δ01)、g(δ01)、h(δ01),分别代表一特定受验者具有一细菌感染、病毒感染,或非病毒、非细菌疾病的可能性。通常,f、g以及h满足关系式f(δ01)+g(δ01)+h(δ01)=1。每个分类函数是所述第一坐标δ0和所述第二坐标δ1的函数,其中所述坐标δ0和δ1中的每一个是由如上面详细所述的表达数值的一不同组合所定义。
分析可以以多种方式执行。
根据一个实施例,分析使用二元或更优选的三元分类器来计算所述概率分类函数中的一个或更多个。
优选地,所述分析加总所述病毒和非病毒、非细菌疾病的概率,以指派一非细菌感染的可能性。在另一个优选实施例中,所述分析加总所述病毒和细菌的概率,以指派一感染性疾病的可能性。然而在另一个优选实施例中,所述分析忽略所述非病毒、非细菌疾病的可能性,并且进行细菌和病毒概率的直接比较。根据本发明的一些实施例,适用于分析数据集的示例性解释功能在下文中提供。
根据本发明的一些实施例的数据集的分析包括执行机器学习过程。
如本文所使用的,术语“机器学习”是指体现为一计算机程序的一过程,其被配置以从先前收集的数据诱发模式,规律性或规则,以对未来数据开发一适当的响应,或以某种有意义的方式描述数据。
当数据集包括多维条目时,机器学习的使用特别但并不排除地是有利的。
所述组和受验者数据集可以用作一训练集,所述机器学习程序可以从中提取最能描述所述数据集的参数。一旦提取参数,就可以用它来预测感染的类型。
在机器学习中,信息可以通过监督学习或无监督学习获得。在本发明的一些实施例中,所述机器学习程序包括或者是监督学习过程。在所述监督学习中,使用全局或局部目标函数来优化学习系统的结构。换句话说,在监督学习中,有一个期望的反应,由系统用来指导学习。
在本发明的一些实施例中,所述机器学习程序包括或者是无监督的学习过程。在无监督的学习中,通常没有目标函数。特别地,所述学习系统没有提供一套规则。根据本发明的一些实施例的一种形式的无监督学习是未监督聚类,其中数据物件先天不是分类标记的。
适用于本实施例的“机器学习”程序的代表性示例,包括但不限于聚类,关联规则算法,特征评估算法,子集选择算法,支持向量机,分类规则,成本敏感分类器,投票算法,堆叠算法,贝叶斯网络,决策树,神经网络,基于实例的算法,线性建模算法,k-最近邻分析,集成学习算法,概率模型,图形模型,逻辑回归方法(包括多项逻辑回归方法),梯度上升法,奇异值分解法和主成分分析法。在神经网络模型中,自组织图和自适应共振理论是常用的无监督学习算法。自适应共振理论模型允许簇的数量随着问题大小而变化,并允许用户利用被称为警戒参数的一用户定义的常数来控制相同簇的成员之间的相似度。
以下是适用于本实施例的一些机器学习程序的概述。
关联规则算法是一种在特征中提取有意义的关联模式的技术。
术语“关联”在机器学习的上下文中是指特征之间的任何相关性,而不仅仅是预测特定类或数值的那些。关联包括但不限于查找关联规则,查找模式,执行特征评估,执行特征子集选择,开发预测模型以及理解特征之间的交互作用。
术语“关联规则”是指数据集中经常共存的元素。它包括但不限于关联模式,歧视模式,频繁模式,封闭模式和巨大模式。
关联规则算法通常的一个主要步骤是找到在所有观察结果中最常见的一组项目或特征。一旦获得了列表,就可以从中提取规则。
上述自组织图是通常用于高维度数据可视化和分析的无监督学习技术。典型的应用集中在地图上的数据中的中心依赖性的可视化。所述算法生成的地图可以通过其他算法加快关联规则的识别。所述算法通常包括称为“神经元”的处理单元网格。每个神经元与称为观察的特征向量相关联。所述地图试图使用一组有限的模型来表示所有可用的观测值与最优准确度。同时,所述模型在网格上被命令,使得类似的模型彼此接近并且彼此不相似的模型彼此远离。此过程使得能够识别以及可视化数据中的特征之间的依赖性或关联性。
特征评估算法是直接针对特征的排名,或针对基于他们的影响选择特征之后的排名。
机器学习的上下文中的术语“特征”是指一个或多个原始输入变量,一个或多个处理变量,或其他变量的一个或多个数学组合,包括原始变量和处理变量。特征可以是连续的或离散的。
信息获取是适用于特征评估的机器学习方法之一。获得信息的定义需要熵的定义,熵是训练样本集合中杂质的量度。通过了解特定特征的值而发生的目标特征的熵的减少被称为信息获取。信息获取可用作一参数来确定特征在解释感染类型方面的有效性。根据本发明的一些实施例,对称不确定性是可被特征选择算法使用的算法。对称不确定性通过将特征归一化为[0,1]范围来补偿信息获取对具有更多值的特征的偏差。
子集选择算法依赖于评估算法和搜索算法的组合。与特征评估算法类似,子集选择算法对特征的子集进行排序。然而,与特征评估算法不同,适用于本实施例的子集选择算法旨在选择对感染类型具有最高影响的特征子集,同时考虑子集中包括的特征之间的冗余度。特征子集选择的好处包括促进数据可视化和理解,减少测量和存储要求,减少训练和使用时间,并消除分散的特征以改进分类。
子集选择算法的两种基本方法是将特征添加到工作子集(正向选择)和从当前特征子集(向后消除)中删除的过程。在机器学习中,正向选择与具有相同名称的统计程序不同。在机器学习中添加到当前子集中的特征是通过使用交叉验证来评估当前子集的一个新特征增强的表现来发现的。在正向选择中,通过将每个剩余特征依次添加到当前子集,同时使用交叉验证评估每个新子集的预期表现来构建子集。当添加到当前子集时,导致最佳表现的特征被保留,并且所述过程继续。当没有剩余的可用特征来提高当前子集的预测能力时,搜索结束。所述过程找到一局部最优特征集。
反向消除以类似的方式实现。通过反向消除,当特征集中进一步减少不会改善子集的预测能力时,所述搜索结束。本实施例考虑搜索前向,后向或两个方向的搜索算法。适用于本实施例的搜索算法的代表性示例包括但不限于详尽搜索,贪婪攀登,子集的随机扰动,包装算法,概率竞赛搜索,模式搜索,秩序竞赛搜索和贝叶斯分类器。
决策树是决策支持算法,其形成考虑输入以作出决定所涉及的步骤的逻辑路径。
术语“决策树”是指任何类型的基于树的学习算法,包括但不限于模型树,分类树和回归树。
决策树可以用于分类数据集或其分层关系。决策树具有包含分支节点和叶节点的树结构。每个分支节点指定要对分割属性的值执行的属性(分割属性)和测试(拆分测试),并分支到其他节点以进行分割测试的所有可能结果。作为决策树根的分支节点称为根节点。每个叶节点可以表示分类(例如,组数据集的特定部分是否与受验者特定数据集的特定部分匹配)或值。叶节点还可以包含关于所表示的分类的附加信息,例如测量所表示的分类中的置信度的置信度分数(即分类的可能性是准确的)。例如,置信分数可以是从0到1的连续值,其分数为0表示非常低的置信度(例如,所表示的分类的指示值非常低),分数1表示非常高的置信度(例如,表示的分类几乎肯定是准确的)。
支持向量机是基于统计学习理论的算法。根据本发明的一些实施例的支持向量机(SVM)可以用于分类目的和/或用于数字预测。一支持向量机用于分类在本文中称为“支持向量分类器”,用于数字预测的支持向量机在本文中称为“支持向量回归”。
一SVM通常以一内核函数为特征,其选择决定了所得SVM是否提供分类,回归或其他功能。通过应用内核函数,SVM将输入向量映射到高维度特征空间中,其中可以构造决策超表面(也称为分隔符)以提供分类,回归或其他决策函数。在最简单的情况下,所述表面是一超平面(也称为线性分离器),但也可以考虑更复杂的分离器,并且可以使用所述内核函数来应用。定义所述超表面的数据点被称为支持向量。
支持向量分类器选择分隔符距离最近的数据点的距离尽可能大的分隔符,从而将与给定类中的物件相关联的特征向量点从与类之外的对象相关联的特征向量点分离。对于支持向量回归,构建了具有可接受误差半径的一高维度管,其使数据集的误差最小化,同时最大化相关曲线或函数的平坦度。换句话说,所述管是围绕一拟合曲线的包络,由最接近曲线或曲面的数据点的集合所定义。
支持向量机的优点是,一旦支持向量已被识别,剩余的观察值就可以从计算中去除,从而大大降低了问题的计算复杂度。一SVM通常分为两个阶段操作:一训练阶段和一测试阶段。在训练阶段期间,生成一组支持向量,用于执行决策规则。在测试阶段期间,使用决策规则进行决策。一支持向量算法是用于训练SVM的方法。通过执行算法,生成一训练参数集,包括表征SVM的支持向量。适用于本实施例的支持向量算法的代表性示例包括但不限于顺序最小优化。
根据本发明可以使用的回归技术包括但不限于线性回归,多重回归,逻辑回归,概率回归,序数逻辑回归,序数回归,泊松回归,负二项回归,多项逻辑回归(MLR)和截断回归。
一逻辑回归或逻辑回归是一种回归分析,用于预测分类因变量的结果(一个可能承担有限数量的值的因变量,其大小无意义,但其大小的排序可能或不可能有意义)基于一个或多个预测变量。逻辑回归还包括一个多项变体。多项逻辑回归模型,是一种回归模型,通过允许两个以上的离散结果来概括逻辑回归。也就是说,它是一个模型,用于预测一个分立的分解因变量的不同可能结果的概率,给定一组独立变量(可能是真实值,二元值,分类值等)。
逻辑回归的优点是它分配了可预测的预测信度的度量-一个概率。例如,当使用SVM解释函数时,预测具有75%和99%概率的细菌感染的患者将被指派为细菌,但是后者的概率较高的事实将被掩蔽。分配可信度的可能性水平可以增加可能影响临床判断的有价值的临床信息。
重要的是,为每个患者计算感染型的可能性,允许合理地过滤出患者,系统知道它不能高度确定地分类。这在图5中示出。因此,当产品分配40%的细菌感染的可能性(100%患者中有40%的“40%”分数将是细菌)。
另外,通过对可能性分数使用阈值,可以分配测试受验者的非二进制分类。例如,具有一细菌可能性低于30%的一受试验者可能被指定为细菌感染的可能性较低;在30%至70%之间的被指定为细菌感染的中间概率的可能性,以及高于70%的被指定为是细菌感染的一高概率。可以使用其他阈值。
最小绝对收缩和选择算子(LASSO)算法是用于线性回归的收缩和/或选择算法。LASSO算法可以利用一正规化将正常的平方误差的平方和最小化,其可以是L1范数正规化(对系数的绝对值的和的界限),L2范数正规化(在系数的平方和上的界限)等。LASSO算法可能与小波系数,前向逐步回归和增强方法的软阈值相关联。LASSO算法在文章中描述:Tibshirani,R,Regression Shrinkage and Selection via the Lasso,J.Royal.Statist.Soc B.,Vol.58,No.1,1996,pages 267-288,其公开内容通过引用并入本文。
贝叶斯网络是表示变量和变量之间条件相互依赖关系的模型。在贝叶斯网络变量表示为节点,并且节点可以通过一个或多个链路彼此连接。链接表示两个节点之间的关系。节点通常具有对应的条件概率表,其用于确定给定节点所连接的其他节点的状态的节点的状态的概率。在一些实施例中,采用贝叶斯最优分类器算法将最大后验假设应用于新记录,以便预测其分类的概率,并计算从一训练集中得到的每个其他假设的概率,并将这些概率用作未来预测感染类型的加权因子。适用于搜索最佳贝叶斯网络的算法包括但不限于全球分数度量算法。在建立网络的替代方法中,可以使用Markov blanket。Markov blanket隔离节点不受其边界外的任何节点的影响,由节点的父母,其子女和其子女的父母组成。
基于实例的算法为每个实例生成一个新模型,而不是基于从训练集生成(一次)的树或网络上的预测。
在机器学习的上下文中,术语“实例”是指数据集中的一个例子。
基于实例的算法通常将整个数据集存储在存储器中,并从类似于被测试的一组记录构建模型。可以通过最近邻或局部加权的方法,例如使用欧几里得距离(Euclidiandistance)来评估这种相似度。一旦选择了一组记录,最终的模型可以使用几种不同的算法来构建,例如朴素的贝叶斯。
本发明还可用于在任何数量的设置中筛选患者或受验者群体。例如,健康维护组织,公共卫生实体或学校健康计划可以筛选一组受验者来识别需要干预的那些,如上所述,或者用于收集流行病学数据。保险公司(例如健康,生命或残疾)可能会在确定覆盖范围或定价过程中筛选申请人,或者为现有客户进行干预。在这样的人口筛选中收集的数据,特别是当与任何临床进展情况如感染相关的情况下,在健康维护组织,公共卫生计划和保险公司的运营中将是有价值的。这样的数据阵列或集合可以存储在机器可读介质中,并且用于任何数量的与健康相关的数据管理系统,以提供改进的医疗服务,具有成本效益的医疗保健,改进的保险操作等。参见例如,美国专利申请号2002/0038227;美国专利申请号2004/0122296;美国专利申请号2004/0122297;和美国专利第5,018,067号。这样的系统可以直接从内部数据存储或远程地从一个或多个数据存储站点存取数据,如本文进一步详细描述的。
机器可读存储介质可以包括用机器可读数据或数据阵列编码的数据存储材料,当使用用指令编程的机器用于使用所述数据时,能够用于各种目的。本发明的生物标记物的有效量的测量和/或所得到的来自这些生物标记的风险的评估可以在可编程计算机上执行的计算机程序中实现,包括处理器,数据存储系统(包括易失性和非易失性存储器和/或存储元件),至少一个输入设备和至少一个输出设备。
程序代码可以应用于输入数据以执行上述功能并生成输出信息。可以根据本领域已知的方法将输出信息应用于一个或多个输出设备。计算机可以是例如个人计算机,微型计算机或常规设计的工作站。
每个程序可以以高级程序或面向对象的编程语言来实现,以与计算机系统进行通信。但是,如果需要,程序可以以汇编或机器语言实现。所述语言可以是编译或解释语言。每个这样的计算机程序可以存储在由通用或专用可编程计算机可读的存储介质或设备(例如,ROM或磁盘或本公开其他地方所定义的其他设备)中,用于在存储介质或设备由计算机读取以执行本文所述的过程。
本发明的与健康相关的数据管理系统也可被认为被实现为配置有计算机程序的计算机可读存储介质,其中如此配置的存储介质使得计算机以特定和预定义的方式操作以执行本文所述的各种功能。
记录的输出可能包括测定结果,发现,诊断,预测和/或治疗建议。这些可以传达给技术人员,医生和/或患者,例如。在某些实施例中,计算机将用于将这些信息传达给有兴趣的群体,例如患者和/或主治医师。基于输出,可以修改对受验者施用的治疗。
在一个实施例中,以图形化呈现所述输出。在另一个实施例中,所述输出以数字方式呈现(例如作为概率)。在另一个实施例中,使用一颜色索引(例如在显示条中)产生输出,其中一种颜色表示细菌感染以及另一种颜色表示非细菌感染。颜色的强度与细菌感染/非感染的概率相关。这种图形显示在图29A至29F中示出。
在一些实施例中,在测量完成后尽快将输出传送给受验者,并产生诊断和/或预测。结果和/或相关信息可以由受验者的治疗医师传达给受验者。或者,结果可以通过任何通信方式直接传达给测试受验者,包括书面通知,例如提供书面报告,电子邮件,电子邮件或电话形式。可以通过使用计算机来促进通信,例如在电子邮件通信的情况下。在某些实施例中,可以使用计算机硬件和软件的组合自动生成并传送包含诊断测试结果和/或从和/或治疗建议得出的结论,所述计算机硬件和软件的组合将被熟悉电讯技术熟练的技术人员。美国专利第6,283,761号中描述了面向医疗保健的通信系统的一个例子;然而,本公开不限于利用所述特定通信系统的方法。在本公开的方法的某些实施例中,可以在多个(例如,外国)管辖区域中进行所有或一些方法步骤,包括样本的测量,诊断疾病和测量结果或诊断的通信。
在一些实施例中,本文描述的方法使用系统330进行,系统330可选地且优选地但不一定必须包括一手持式设备,所述手持设备包括至少两个间隔,第一隔间测量在血液中的多肽含量(例如使用免疫组织化学方法),以及第二隔间计算分析在第一隔间中测量的结果,并提供与诊断有关的输出。
图34中示出了根据本发明的一些实施例的系统330的代表性示例的方块图。所述系统330可以包括一设备331,其可以但不一定是手持设备。或者,所述设备331可以是桌面可安装的或桌面可放置设备。所述系统330可以包括具有一测量系统333的一第一隔间332,其被配置为测量受验者的血液中的多肽的表达数值。所述测量系统333可以进行至少一种选自自动化ELISA,自动化免疫测定和自动化功能测定的自动化测定。系统330还可以包括一第二隔间334,其包含具有一计算机可读介质338的一硬件处理器336,储存用于执行本文描述的操作的计算机程序指令(例如,用于定义第一和/或第二坐标的计算机程序指令,用于定义曲线和/或平面的计算机程序指令,用于计算第一和/或距离的计算机程序指令,计算机程序指令,用于将计算出的距离关联至存在、不存在细菌和/或病毒感染或受验者有细菌和/或病毒感染的可能性)。所述硬件处理器336被配置以从第一隔间332接收表达数值测量值,并且响应于测量执行程序指令。可选地,优选地,所述硬件处理器336还被配置为将处理的数据输出到一显示设备340。
在本发明的一些可选实施例中,系统330与一通信网络进行通信。在这些实施例中,系统330或硬件处理器336包括与一通信网络352通信的一网络接口350。如图34所示,网络352用于将硬件处理器336执行的分析结果(例如,受验者所具有细菌/病毒感染存在、不存在或可能性)发送到一个或更远的位置。例如,系统330可以将分析结果发送到从诸如系统330的数个系统收集数据的实验室信息系统360和/或中央服务器362中的至少一个。
图39A是示出通信网络352用于接收表达数值测量的实施例中的系统330的方块图的示意图。在这些实施例中,系统330可以包括计算机可读介质338,如上文进一步详细描述的,以及硬件处理器,诸如但不限于处理器336。硬件处理器336可以包括网络接口350。通过接口350,硬件处理器336从一测量系统,例如但不限于测量系统333,接收所述表达数值测量,并且响应于所接收的测量结果执行计算机可读介质338中的计算机程序指令。硬件处理器336然后可以将处理的数据输出到显示设备340。
图34和图39A所示的实施例的组合也被考虑。例如,接口350可用于从网络352接收表达数值测量,并将分析结果发送到网络352。
在本发明的一些实施例中,系统330与用户进行通信,如图39B的方框图所示意图。在这些实施例中,系统330可以包括计算机可读介质338,如上文进一步详细描述的,以及一硬件处理器,例如但不限于处理器336。硬件处理器336包括与用户356通信的一用户界面354。通过接口350,硬件处理器336从用户356接收表达数值测量值。用户356可以从一外部来源获得表达数值,或者通过执行至少一种选自免疫测定和功能测定,或操作系统333(未示出,参见图39A和34)。硬件处理器336响应于所接收的测量结果,在计算机可读介质338中执行计算机程序指令。硬件处理器336然后可以将处理的数据输出到显示设备340。
一旦作出了诊断,可以理解,可以采取许多动作。
因此,例如,如果一细菌感染被裁定,则所述受验者可以用抗生素剂治疗。
抗生素剂的实例包括但不限于:达托霉素(Daptomycin);吉米沙星(Gemifloxacin);特拉万星(Telavancin);头孢洛罗(Ceftaroline);非达霉素(Fidaxomicin);阿莫西林(Amoxicillin);氨苄青霉素(Ampicillin);巴氨西林(Bacampicillin);羧苄青霉素(Carbenicillin);氯唑西林(Cloxacillin);达可西林(Dicloxacillin);氟氯西林(Flucloxacillin);美洛西林(Mezlocillin);奈夫西林(Nafcillin);苯唑西林(Oxacillin);青霉素G(Penicillin G);青霉素V(Penicillin V);哌拉西林(Piperacillin);匹氨西林(Pivampicillin);匹美西林(Pivmecillinam);替卡西林(Ticarcillin);氨曲南(Aztreonam);亚胺培南(Imipenem);多尼培南(Doripenem);美罗培南(Meropenem);厄他培南(Ertapenem);克林霉素(Clindamycin);林可霉素(Lincomycin);普那霉素(Pristinamycin);喹奴普斯汀(Quinupristin);头孢乙腈(Cefacetrile(cephacetrile));头孢羟氨苄(Cefadroxil(cefadroxyl));头孢氨苄(Cefalexin(cephalexin));头孢来星(Cefaloglycin(cephaloglycin));头孢洛宁(Cefalonium(cephalonium));头孢噻啶(Cefaloridine(cephaloradine));头孢噻吩(Cefalotin(cephalothin));头孢匹林(Cefapirin(cephapirin));头孢曲嗪(Cefatrizine);头孢氮氟(Cefazaflur);头孢西酮(Cefazedone);头孢唑啉(Cefazolin(cephazolin));头孢拉定(Cefradine(cephradine));头孢沙定(Cefroxadine);头孢替唑(Ceftezole);头孢克洛(Cefaclor);头孢孟多(Cefamandole);头孢美唑(Cefmetazole);头孢尼西(Cefonicid);头孢替坦(Cefotetan);头孢西丁(Cefoxitin);头孢丙烯(Cefprozil(cefproxil));头孢呋辛(Cefuroxime);头孢唑喃(Cefuzonam);头孢卡品(Cefcapene);头孢达肟(Cefdaloxime);头孢地尼(Cefdinir);头孢托仑(Cefditoren);头孢他美(Cefetamet);头孢克肟(Cefixime);头孢甲肟(Cefmenoxime);头孢地嗪(Cefodizime);头孢噻肟(Cefotaxime);头孢咪唑(Cefpimizole);头孢泊肟(Cefpodoxime);头孢特仑(Cefteram);头孢布烯(Ceftibuten);头孢噻呋(Ceftiofur);头孢噻林(Ceftiolene);头孢唑肟(Ceftizoxime);头孢曲松(Ceftriaxone);头孢哌酮(Cefoperazone);头孢他啶(Ceftazidime);头孢力定(Cefclidine);头孢吡肟(Cefepime);头孢瑞南(Cefluprenam);头孢噻利(Cefoselis);头孢唑兰(Cefozopran);头孢匹罗(Cefpirome);头孢喹肟(Cefquinome);第五代(Fifth Generation);头孢托罗(Ceftobiprole);头孢洛林(Ceftaroline);不分类(Not Classified);头孢氯嗪(Cefaclomezine);头孢洛仑(Cefaloram);头孢帕罗(Cefaparole);头孢卡奈(Cefcanel);头孢屈洛(Cefedrolor);头孢吡酮(Cefempidone);头孢三唑(Cefetrizole);头孢维曲(Cefivitril);头孢马替林(Cefmatilen);头孢吡锭(Cefmepidium);头孢维星(Cefovecin);头孢噁唑(Cefoxazole);头孢罗替(Cefrotil);头孢舒米(Cefsumide);头孢呋汀(Cefuracetime);头孢噻氧(Ceftioxide);阿奇霉素(Azithromycin);红霉素(Erythromycin);克拉霉素(Clarithromycin);地红霉素(Dirithromycin);罗红霉素(Roxithromycin);泰利霉素(Telithromycin);阿米卡星(Amikacin);庆大霉素(Gentamicin);卡那霉素(Kanamycin);新霉素(Neomycin);奈替米星(Netilmicin);巴龙霉素(Paromomycin);链霉素(Streptomycin);妥布霉素(Tobramycin);氟甲喹(Flumequine);萘啶酸(Nalidixicacid);奥索利酸(Oxolinic acid);吡咯米酸(Piromidic acid);吡哌酸(Pipemidicacid);罗索沙新(Rosoxacin);环丙沙星(Ciprofloxacin);依诺沙星(Enoxacin);洛美沙星(Lomefloxacin);那氟沙星(Nadifloxacin);诺氟沙星(Norfloxacin);氧氟沙星(Ofloxacin);培氟沙星(Pefloxacin);芦氟沙星(Rufloxacin);巴洛沙星(Balofloxacin);加替沙星(Gatifloxacin);格帕沙星(Grepafloxacin);左氧氟沙星(Levofloxacin);莫西沙星(Moxifloxacin);帕珠沙星(Pazufloxacin);司帕沙星(Sparfloxacin);替马沙星(Temafloxacin);妥舒沙星(Tosufloxacin);贝西沙星(Besifloxacin);克林沙星(Clinafloxacin);吉米沙星(Gemifloxacin);西他沙星(Sitafloxacin);曲伐沙星(Trovafloxacin);普卢利沙星(Prulifloxacin);磺胺甲二唑(Sulfamethizole);磺胺甲恶唑(Sulfamethoxazole);磺胺异恶唑(Sulfisoxazole);复方新诺明(Trimethoprim-Sulfamethoxazole);地美环素(Demeclocycline);多西环素(Doxycycline);二甲胺四环素(Minocycline);土霉素(Oxytetracycline);四环素(Tetracycline);替加环素(Tigecycline);氯霉素(Chloramphenicol);甲硝唑(Metronidazole);替硝唑(Tinidazole);呋喃妥因(Nitrofurantoin);万古霉素(Vancomycin);替考拉宁(Teicoplanin);特拉万星(Telavancin);利奈唑胺(Linezolid);环丝氨酸2(Cycloserine2);利福平(Rifampin);利福布丁(Rifabutin);利福喷丁(Rifapentine);杆菌肽(Bacitracin);多粘菌素B(Polymyxin B);紫霉素(Viomycin);卷曲霉素(Capreomycin)。
如果已经裁定一病毒感染,所述受验者可以用一抗病毒药物治疗。抗病毒剂的实例包括但不限于:阿巴卡韦(Abacavir);阿西洛韦(Aciclovir);阿昔洛韦(Acyclovir);阿德福韦(Adefovir);金刚烷胺(Amantadine);安普那韦(Amprenavir);安普利近(Ampligen);阿比朵尔(Arbidol);阿扎那韦(Atazanavir);利普妥(Atripla);巴拉韦(Balavir);波普瑞韦尔特(Boceprevirertet);西多福韦(Cidofovir);可比韦(Combivir);德罗格韦(Dolutegravir);达芦那韦(Darunavir);地拉韦啶(Delavirdine);地丹诺辛(Didanosine);二十二烷醇(Docosanol);Edoxudine;依法韦仑(Efavirenz);恩曲他滨(Emtricitabine);恩夫韦地(Enfuvirtide);恩替卡韦(Entecavir);Ecoliever;泛昔洛韦(Famciclovir);福米韦生(Fomivirsen);膦沙那韦(Fosamprenavir);膦甲酸钠(Foscarnet);膦乙酸钠(Fosfonet);融合抑制剂(Fusion inhibitor);更昔洛韦(Ganciclovir);伊巴他滨(Ibacitabine);Imunovir;碘苷(Idoxuridine);咪喹莫特(Imiquimod);茚地那韦(Indinavir);肌苷(Inosine);整合抑制剂(Integraseinhibitor);干扰素III型(Interferon type III);干扰素II型(Interferon type II);干扰素I型(Interferon typeI);干扰素(Interferon);拉米夫定(Lamivudine);洛匹那韦(Lopinavir);洛韦胺(Loviride);马拉韦罗(Maraviroc);吗啉胍(Moroxydine);Methisazone;奈非那韦(Nelfinavir);奈韦拉平(Nevirapine);Nexavir;奥司他韦(Oseltamivir);PEG干扰素(Peginterferon alfa-2a);喷昔洛韦(Penciclovir);帕拉米韦(Peramivir);普拉康纳利(Pleconaril);鬼臼毒素(Podophyllotoxin);拉替拉韦(Raltegravir);逆转录酶抑制剂(Reverse transcriptase inhibitor);利巴韦林(Ribavirin);金刚乙胺(Rimantadine);利托那韦(Ritonavir);嘧啶(Pyramidine);沙奎那韦(Saquinavir);索非布韦(Sofosbuvir);司坦夫定(Stavudine);特拉匹韦(Telaprevir);替诺福韦(Tenofovir);泰诺福韦酯(Tenofovir disoproxil);替喷那韦(Tipranavir);三氟尿苷(Trifluridine);三协唯(Trizivir);曲金刚胺(Tromantadine);特鲁瓦达(Truvada);traporved;伐昔洛韦(Valaciclovir);缬更昔洛韦(Valganciclovir);Vicriviroc;阿糖腺苷(Vidarabine);伟拉咪定(Viramidine);札西他滨(Zalcitabine);扎那米韦(Zanamivir);齐多夫定(Zidovudine);RNAi抗病毒药物(RNAi antivirals);吸入利巴韦林(inhaled rhibovirons);单克隆抗体respigams(monoclonal antibodyrespigams);神经氨酸酶阻断剂(neuriminidase blocking agents)。
使用本文描述的方法收集的信息可以帮助额外的患者管理选项。例如,所述信息可用于确定患者是否应该进入医院。也可能影响是否延长住院时间。它还可能影响是否需要执行附加测试的决定,或者可能会对特定的细菌和/或PCR进行不必要的测试,例如CT和/或X射线和/或MRI和/或培养和/或血清学和/或PCR测定用于特定细菌和/或PCR测定用于病毒和/或执行诸如腰椎穿刺等手术。
评估患者预后,疾病严重程度和结局往往在临床上有用。本发明人现在发现,低水平的TRAIL(低于约20pg/ml或约15pg/ml或约10pg/ml或约5pg/ml或约2pg/ml)与患者预后和结果差异显着相关,疾病严重程度高。例如,本发明人显示,与所有其他患者相比,重症监护病房(ICU)中普遍严重生病的成人患者的TRAIL水平明显较低,无论其是否具有感染性或非感染性病因。
因此,根据本发明的另一方面,提供了一种在具有所述疾病的受验者中预测包含测量TRAIL蛋白血清水平的疾病的预后的方法,其中当所述TRAIL水平低于一预定水平,则视所述预后比具有一TRAIL蛋白血清水平高于所述预定水平的一疾病的一受验者的预后更差。
测定TRAIL蛋白血清水平的方法如上所述。
所述疾病可能是感染性疾病或非感染性疾病。所述受验者可能患有诊断或未诊断的疾病。
疾病的具体实例包括但不限于细菌感染(例如菌血症,脑膜炎,呼吸道感染,小便池感染等),败血症,身体损伤和创伤,心血管疾病,多器官功能衰竭相关疾病,诱发的肾毒性,急性肾脏疾病,肾损伤,晚期肝硬化和肝衰竭,急性或慢性左心衰竭,肺/高血压伴有/无右心衰竭,以及各种恶性肿瘤。
根据另一个实施例,测量附加的多肽,这有助于增加预测的准确度。因此,例如可以测量的其他多肽包括IP-10,CRP,IL1RA,PCT和SAA。
根据一特定实施例,测量IP-10,CRP和TRAIL。
根据另一实施例,仅测量TRAIL。
本发明人已经发现,具有非常低水平的TRAIL(如上所述)的患者具有较低的恢复机会,并且并发症的几率更高。因此,本发明人提出,当发现一受验者具有非常低水平的TRAIL时,它们应该仅被使用最后的手段的药剂进行治疗。
这样的药剂例如可以是例如没有被FDA批准的实验药剂。其他最后手段是那些已知与严重副作用相关的药物。另一个典型的最后手段是抗生素如万古霉素(通常不提供以防止抗生素耐药性的扩散)。
应当理解,也可以提供通常不被认为是最后手段的药剂,但剂量超过临床可接受的剂量。
根据本发明的这个观点,如果TRAIL水平高于预定水平,那么通常不应该用最后的手段治疗患者。
本发明人现已发现,在生育年龄(t-test P<0.001)(见图37A)中,健康个体或非感染性疾病患者的TRAIL基础水平较男性低(见图37A),但生育前或生育年龄后(t-test P=0.9,图37A)不变。在一感染性疾病的患者中没有观察到这种趋势。
这种年龄依赖性动力学可以用于改进区分细菌,病毒和非传染性或健康个体的模型,如本领域技术人员明显知道的。
例如,所述模型可以包括年龄和性别参数。如果受验者的年龄用于指示生育的范围内(例如约13至45岁),且受验者是男性,则可以使用生育年龄的男性的TRAIL模型系数。如果受验者的年龄在用于指示生育的范围内,且受验者是女性,则可以使用生育年龄的女性的TRAIL模型系数。如果受验者的年龄超出用于指示生育能力的范围,则可以使用性别不变的TRAIL模型系数。
因此,根据本发明的另一方面,提供了一种在生育年龄的女性受验者中确定感染型的方法,所述方法包括将受验者中的TRAIL蛋白血清水平与预定阈值进行比较,所述预定阈值对应于生育年龄的健康女性受验者的TRAIL蛋白血清水平的阈值,或生育年龄的一组健康女性受验者,其中所述TRAIL蛋白血清水平与所述预定阈值之间的差异是用于指示感染型。
因此,根据本发明的另一方面,提供了一种在生育年龄的男性受验者中确定感染型的方法,所述方法包括将受验者中的TRAIL蛋白血清水平与预定阈值进行比较,所述预定对应于生育年龄的健康男性受验者的TRAIL蛋白的血清水平,或生育年龄的一组健康男性受验者,其中所述TRAIL蛋白血清水平与所述预定阈值之间的差异是用于指示感染型。
可以理解,所述预定阈值可以用于裁定或排除感染型。
因此,例如如果TRAIL蛋白血清水平高于一第一预定阈值,所述感染型是病毒的。
如果,例如TRAIL蛋白血清水平高于一第二个预定阈值,所述感染型不是细菌的。
如果,例如TRAIL蛋白血清水平低于一第三个预定阈值,所述感染型是细菌的。
如果例如TRAIL蛋白血清水平低于一第四个预定阈值,所述感染型不是病毒的。
通常,本文所述的健康男性或女性受验者没有已知的疾病。根据具体实施例,对照受验者没有感染性疾病。
通常,所述受验者的TRAIL蛋白血清水平与预定阈值之间的差异是统计学上显着的差异,如上文进一步描述的。
如在本文中所使用的术语“约”指代±10%。
术语“包括”、“包含”、“具有”及其同根词意指“包括但不限于”。
术语“由...组成”意指“包括且局限于”。
术语“本质上由...组成”意味着组合物、方法或结构可包括附加成分、步骤和/或零件,但是只有当该附加成分、步骤和/或零件并不实质性地改变要求保护的组合物、方法或结构的基本和新型特性时才如此。
在整个申请中,本发明在一范围形式中的可呈现各种实施例。但应当理解是,范围形式的描述仅仅是为了方便和简化,不应被解释为对本发明的范围的强行限制。因此,范围的描述应当被认为已经具体公开了所有可能的子范围以及范围内的单个数值。例如,范围的描述,从1至6应考虑到具有具体公开的子范围,如从1至3,从1至4,从1至5,从2至4,从2至6,从3至6等,以及个数在所述范围内,例如1,2,3,4,5及6,不论范围的宽度皆适用。
如本文所使用的术语“方法”是指用于完成一给定任务的方式、手段、技术和程序,包括但不限于化学、药理学、生物学、生物化学和医学领域的从业者已知或很容易从已知方式、手段、技术和程序开发的那些方式、手段、技术和程序。
如本文所用,如本文所使用,术语“治疗(treating)”包括消除、基本上抑制、减慢或逆转一病症的进展,基本上改善一病症的临床或美学上的症状或基本上预防一病症的临床或美学症状的出现。
可以理解的是,本发明的某些特征,为了清楚起见在分开的实施例的上下文中描述,也可以在单个实施例中被组合提供。相反地,本发明的各种特征,为了简洁起见,在单个实施例的上下文中描述,也可以单独地或以任何合适的子组合,或如适用于本发明的任何其他描述的实施例提供。在各种实施例的上下文中描述的某些特征不应被认为是所述实施例的必要特征,除非所述实施例在没有所述元件的情况下是无作用的。
如上所述和如下权利要求部分所要求保护的本发明的各种实施方案和方面能在以下实施例中找到实验支持。
实例:
现在参考以下实施例,其与上述描述一起以非限制性方式说明本发明的一些实施例。
通常,本文使用的命名法和本发明中使用的实验室程序包括分子,生化,微生物和重组DNA技术。这些技术在文献中有详细解释。见如"Molecular Cloning:A laboratoryManual"Sambrook et al.,(1989);"Current Protocols in Molecular Biology"VolumesI-III Ausubel,R.M.,ed.(1994);Ausubel et al.,"Current Protocols in MolecularBiology",John Wiley and Sons,Baltimore,Maryland(1989);Perbal,"A PracticalGuide to Molecular Cloning",John Wiley&Sons,New York(1988);Watson et al.,"Recombinant DNA",Scientific American Books,New York;Birren et al.(eds)"GenomeAnalysis:A Laboratory Manual Series",Vols.1-4,Cold Spring Harbor LaboratoryPress,New York(1998);methodologies as set forth in U.S.Pat.Nos.4,666,828;4,683,202;4,801,531;5,192,659and 5,272,057;"Cell Biology:A LaboratoryHandbook",Volumes I-III Cellis,J.E.,ed.(1994);"Culture of Animal Cells-AManual of Basic Technique"by Freshney,Wiley-Liss,N.Y.(1994),Third Edition;"Current Protocols in Immunology"Volumes I-III Coligan J.E.,ed.(1994);Stiteset al.(eds),"Basic and Clinical Immunology"(8th Edition),Appleton&Lange,Norwalk,CT(1994);Mishell and Shiigi(eds),"Selected Methods in CellularImmunology",W.H.Freeman and Co.,New York(1980);可用的免疫测定在专利和科学文献中广泛描述,参见例如美国专利第3,791,932;3,839,153;3,850,752;3,850,578;3,853,987;3,867,517;3,879,262;3,901,654;3,935,074;3,984,533;3,996,345;4,034,074;4,098,876;4,879,219;5,011,771以及5,281,521号;"Oligonucleotide Synthesis"Gait,M.J.,ed.(1984);“Nucleic Acid Hybridization"Hames,B.D.,and Higgins S.J.,eds.(1985);"Transcription and Translation"Hames,B.D.,and Higgins S.J.,eds.(1984);"Animal Cell Culture"Freshney,R.I.,ed.(1986);"Immobilized Cells andEnzymes"IRL Press,(1986);"A Practical Guide to Molecular Cloning"Perbal,B.,(1984)and"Methods in Enzymology"Vol.1-317,Academic Press;"PCR Protocols:AGuide To Methods And Applications",Academic Press,San Diego,CA(1990);Marshaket al.,"Strategies for Protein Purification and Characterization-A LaboratoryCourse Manual"CSHL Press(1996);其所有都通过引用并入,如同在此完全阐述的。本文档中提供了其他一般参考。相信其中的程序在本领域中是众所周知的,并且为了读者的便利而提供。其中包含的所有信息通过引用并入本文。
实例1:
宿主蛋白质组签章用于区分细菌和病毒感染:前瞻性多中心观察研究
方法
研究人口:共有1002位患者参加了研究。小儿科(≤18岁)从儿科急诊科,儿科病房和手术部门,以及急诊部门(ED),内科部门和外科部门的成人(>18岁)招募。根据适用情况,每位参与者或法定监护人都获得知情同意书。感染性疾病队列入选标准包括:急性感染性疾病的临床怀疑,症状发作后的高峰发热>37.5℃,症状持续时间≤12天。对照组的入选标准包括:非感染性疾病(例如创伤,中风和心肌梗塞)的临床印象,或健康的受验者。排除标准包括:注册前两周内任何急性感染性疾病发作的证据;诊断为先天性免疫缺陷;目前用免疫抑制或免疫调节治疗;活性恶性肿瘤,已证实或可疑的人类免疫缺陷病毒(HIV)-1,乙型肝炎病毒(HBV)或丙型肝炎病毒(HCV)感染(图1A)。重要的是,为了能够进行广泛的泛用性,入选时的抗生素治疗并没有被排除在研究之外。
注册流程和数据收集:对于每个患者,记录以下基线变量:人口统计学,身体检查,病史(例如主要投诉,潜在疾病,长期施用的药物,合并症,症状发作时间和峰值温度),完全血细胞计数(CBC)注册时获得,化学面板(如肌酸酐,尿素,电解质和肝酶)。从每个患者获得鼻拭子用于进一步的微生物学研究,并获得血液样本进行蛋白质筛选和验证。额外的样品是由医生认为适当的(例如尿液和粪便样品在疑似尿路感染[UTI]和胃肠炎[GI]的情况下获得)。放射学检查由医师自行决定(例如胸部X线检查疑似下呼吸道感染[LRTI])。入院30天后,记录疾病进展和治疗反应。所有信息都记录在电子病例报告单(eCRF)中。
微生物调查:患者接受鼻拭子样本的两次多重PCR诊断测定:(i)
Figure GDA0002255600990000761
(n=713),用于检测副流感病毒1,2,3和4,冠状病毒229E/NL63,腺病毒A/B/C/D/E,博卡病毒1/2/3/4,流感病毒A和B,偏肺病毒,冠状病毒OC43,鼻病毒A/B/C,呼吸道合胞病毒A和B,以及肠病毒,和(ii)用于检测肺炎链球菌,流感嗜血杆菌,肺炎衣原体,嗜肺军团菌,百日咳博德特氏菌和肺炎支原体的
Figure GDA0002255600990000762
(n=633)。多重PCR测定由认证服务实验室进行。根据患者的疑似临床综合征,还对患者进行额外的病原体检测,包括:血液培养(n=420),尿培养(n=188)和用于志贺氏菌,弯曲杆菌和沙门氏菌(n=66)的粪便培养);巨细胞病毒(CMV),爱泼斯坦巴尔病毒(EBV),肺炎支原体和贝纳氏立克次体(Q-热)的血清学检测(IgM和/或IgG)(n=167,n=130,n=206和n=41,分别)。
建立参考标准:明确诊断,一致性和多数队列:根据“诊断准确度(STARD)报告标准”的建议,制定了严格的综合参考标准。首先,对每位患者进行了详细的临床和微生物学调查。然后,整个疾病过程中收集的所有数据由三位医师组成的小组审查。对于成年患者(>18岁),小组包括主治医师和两名感染性疾病专家,而对于儿童和青少年(≤18岁),其中包括主治儿科医师,感染性疾病专家和高级儿科医师。每个组成员为每个患者分配以下诊断标签之一:(i)细菌;(ii)病毒;(iii)无明显的感染性疾病或健康(对照);和(iv)不确定。具有混合感染(细菌加病毒)的患者被标记为细菌,因为它们被类似地管理(例如用抗生素治疗)。重要的是,小组成员对同龄人的标签和签章的结果不知情。
此过程用于创建三个队列,诊断确定性越来越高(图1A):
(i)多数队列:三名小组成员中至少有两名患者被分配相同的标签;
(ii)一致性队列(所述多数队列的一亚组):所有三名小组成员都分配了相同的标签(术语“一致性队列”和“共识队列”可互换使用);以及
(iii)明确诊断队列(所述一致性队列的一亚组):细菌标记的患者由所有三名小组成员诊断为一致性,WBC>15,000/μl(用来指示增加细菌感染风险的一截止值)和以下微生物确认之一:菌血症(阳性血培养),细菌性脑膜炎(阳性CSF培养),肾盂肾炎(阳性尿培养和肾脏受累超声表现),UTI(阳性尿培养),败血性休克(阳性血培养)或扁桃体周围脓肿(手术探查或计算机断层扫描)。病毒标签患者由小组成员诊断为一致性,并具有病毒的阳性检测结果。
此外,所有三名小组成员均诊断为对照标记的患者为一致性。
样品,程序和蛋白质测量:静脉血液样本在4℃下存放5个小时,随后分为血浆,血清和总白细胞,并储存在-80℃。鼻拭子和粪便样品在4℃下储存长达72小时,随后运送到经过认证的服务实验室进行基于多重PCR的测定。在筛选阶段,使用酶联免疫吸附测定(ELISA),Luminex技术,蛋白质阵列和流式细胞仪(在新鲜分离的白细胞上)在血清和白细胞中测量宿主蛋白。筛选和签章构建后(参见Host-proteome筛选部分),选择并测量三种蛋白质,如下所示:通过Cobas 6000,Cobas Integra 400,Cobas Integra 800或ModularAnalytics P800(Roche)测量CRP。使用商业ELISA套组(MeMed Diagnostics)测量TRAIL和IP-10。
统计分析:主要分析基于接收器工作特性曲线(AUC),灵敏度(TP/P),特异性(TN/N),正可能性比(LR+=灵敏度/[1-特异性]),负可能性比(LR-=[1-灵敏度]/特异性)和诊断优势比(DOR=LR+/LR-),其中P,N,TP和TN对应于阳性(细菌患者),阴性(病毒患者),真阳性(正确诊断的细菌患者)和真阴性(正确诊断的病毒病人)。使用MATLAB进行统计分析。样本大小计算在下面的实例2中给出。
宿主蛋白质组筛选:图1B中描述了开发,培训和测试多变量逻辑模型的过程的总体概述。简而言之,进行了系统的文献筛选和生物信息学分析,其鉴定了可能在细菌与病毒患者的外周血液样本中差异表达的600个候选蛋白质,其中一些在宿主免疫应答中具有一已知的角色对于感染和其他与免疫系统没有直接联系。接下来,对来自训练组(50%病毒和50%细菌)的20-30名患者测量每种蛋白质候选物,并且使用Wilcoxon rank-sum(WS)P值<0.01来筛选具有统计学显著差异测量的蛋白质。这产生了一组86个蛋白质(假发现率[FDR]为0.07)。然后在100名额外的患者(50%病毒和50%细菌)中评估这些蛋白质中的每一种,并且使用P<10-4的t-test截止值进一步筛选,获得在病毒与细菌患者中显着差异表达的14种蛋白质(FDR<0.001)。
签章开发和验证:应用特征选择过程来鉴定蛋白质的最佳组合。使用两种特征选择方案:相互信息min-max和前向贪婪包装,它们使用一系列迭代来添加或删除特征。训练集上的表现增加不再具有统计学意义(P>0.05),终止流程。两种过程都融合到相同的最终三种蛋白质组中。为了将蛋白质水平整合为单个分数,研究了多个计算模型。它们的表现没有显着差异(P>0.1,如下文实施例2中进一步详述)。选择多项式逻辑回归(MLR)模型,因为通过将可能性分数分配给患者的诊断来提供概率解释。签章使用此属性过滤器出现细菌感染概率介于0.35至0.55之间的患者。术语“边缘免疫应答”用于描述这些患者,因为他们的细菌和病毒宿主反应之间的边界。多数队列中的患者分为训练和测试组,每组包含50%的患者(图1B)。训练组包括参加筛查过程的120例患者和随机分配的其他患者。测试组包括剩余的患者,并用于独立评定签章表现。重要的是,没有一个测试组患者用于训练算法或选择蛋白质。使用leave-10%-out交叉验证来估计模型表现。关于模型结构的更多细节在下文的实例2中提供。
结果:
患者特征:三名医师独立地为每名患者分配标签(细菌,病毒,对照或不确定)。标签用于创建三个队列,具有越来越多的诊断确定性:多数(n=765),一致性(n=639)和明确诊断(n=312)队列(图1A)。另外,98名患者被标记为不确定性,因为医生无法确定疾病病因或没有多数标记。简单来说,队列在性别平衡(47%的女性,53%的男性),包括56%的儿科患者(≤18岁)和44%的成年人(>18岁)。患者出现广泛的临床综合征(例如RTI,UTI和全身感染),最高温度(36-41.5℃),症状出现时间(0-12天),合并症和药物(表1和图6A-12B)。共检测到56种病原体,这些物种对西方世界的大量急性感染性疾病负责(图7A-B)。
表1
Figure GDA0002255600990000801
Figure GDA0002255600990000811
表1-多数队列患者的基线特征。值是数字(百分比)。仅提供超过5例患者检测到的微生物。CNS-中枢神经系统,GI-胃肠炎,LRTI-下呼吸道感染,UTRI-上呼吸道感染,UTI-尿路感染,N/A-健康对照或未获得数据的患者。流感A亚组包括H1N1毒株。非典型细菌亚组包括肺炎衣原体,肺炎支原体和嗜肺军团菌。肠病毒亚组包括轮状病毒(Rota virus),星状病毒,肠道病毒和诺如病毒G I/II(Norovirus G I/II)。在临床综合征分析中,LRTI组包括肺炎,细支气管炎,急性支气管炎和喉炎;URTI组包括咽炎,急性中耳炎,急性鼻窦炎和急性扁桃体炎。
明确诊断,一致性和多数队列的签章表现:在600个筛选的宿主蛋白及其组合中,多数队列的训练组中鉴别细菌、病毒和对照患者的最佳签章包括三种可溶性蛋白:TNF相关凋亡诱导配体(TRAIL),干扰素γ诱导蛋白10(IP-10)和C-反应蛋白(CRP)(图2A-C)。用于区分多数队列的细菌和病毒感染的AUC签章为0.94±0.04。使用在整个多数队列上的leave-10%-out交叉验证获得相似的结果(AUC=0.94±0.02)。签章显着优于筛选阶段评估的所有单个蛋白质(P<10-6)。在一致性和明确诊断队列中重复训练和测试程序,分别产生0.96±0.02和0.99±0.01的AUC。此表现的逐步增加与三队列中参考标准分配的确定性增加一致(表2,如下)。
表2-诊断细菌与病毒感染的签章测量准确度
Figure GDA0002255600990000821
A.在明确诊断队列(nBacterial=27,nViral=173),一致性(nBacterial=256,nViral=271)以及多数(nBacterial=319,nViral=334)队列中,对所有患者进行了leave-10%-out的交叉验证,获得了表现估计及其95%CI)B.过滤掉具有一边缘免疫应答的病患后,重复分析(明确诊断[nBacterial=27,nViral=159,nmarginal=14],一致性[nBacterial=233,nViral=232,nmarginal=62],和多数[nBacterial=290,nViral=277,nmarginal=88]),其类似于临床医生可能使用签章的方式。
接下来,本发明人使用签章来区分多数队列测试组上的感染性(细菌或病毒)和非感染性对照,产生0.96±0.02的AUC。进一步评估使用leave-10%-out交叉验证得到相似的结果(AUC=0.96±0.01)。签章表现胜过任何单个蛋白质(P<10-8)。再次,一致性和明确诊断队列的评估显示,AUC值分别改善为0.97±0.02和0.97±0.03。为了获得保守的签章表现估计,下面的分析将重点放在多数队列上。
与实验室测量,临床参数和成熟的生物标记比较:将签章与已建立的临床参数和实验室测量进行比较,包括白细胞计数(WBC),绝对嗜中性粒细胞计数(ANC),嗜中性粒细胞百分比,最大温度,脉搏和呼吸频率(图3A和实例2)。签章超越所有个别参数(P<10-18)。接下来,将签章与几个临床参数的组合进行比较。为此,针对多达四个临床参数的所有组合生成多项逻辑模型。图3A中描绘了表现最好的配对,三元组和四元组(添加第五个参数并没有提高表现)。所述签章明显优于ANC,脉搏,淋巴细胞和单核细胞百分比(AUC=0.94±0.02vs.0.77±0.04)最好的临床参数组合(P<10-15)的表现。接下来,将签章表现与PCT和CRP进行比较,两种常规用于诊断脓毒症和细菌感染的蛋白质(实例2)。签章表现明显优于两种蛋白质(分别为P<10-8和P<10-6)。签章还表现出比广泛的宿主蛋白更好,在免疫应答感染中具有确定的作用,包括败血症和细菌相关(例如TREM,IL-6和IL-8),病毒相关(例如IFN-γ和IL-2)和炎症相关(例如IL-1a和TNF-α)蛋白(P<10-8)(图3B和实例2,在下文中)。
签章表现在不同患者亚组中表现强劲:患者和病原体的异质性是现实生活临床环境中固有的,可能会对任何个体宿主生物标记物的诊断效用产生负面影响。为了检查签章,多个生物标记物的组合,尽管病人对病人的变异性仍能保持稳定的表现,但是进行了亚组分析。在各种患者特征方面,包括年龄,临床综合征,症状发作时间,最高温度,病原体种,合并症,用于慢性疾病药物治疗和临床治疗的患者特征,所述签章是稳健的(AUC在0.87和1.0之间)(图4和实施例2,下文)。技术上被排除的亚组患者也进行了签章测试,但是由专家组进行了一致性标记,其AUC值为0.96±0.06(nBacterial=27,nViral=14)。这可能意味着签章可以更广泛地适用于最初被排除的病例(例如亚热病患者)。
签章的表现不受潜在殖民者的影响:许多致病细菌也是天然菌群的一部分,经常在无症状的受验者中被发现。这些细菌构成了相当大的诊断挑战,因为只是检测它们并不一定意味着疾病的起因作用;因此,适当的治疗可能仍然不清楚。本发明人询问签章的表现是否受其存在的影响。
通过PCR在鼻拭子上检测的肺炎链球菌(SP)和流感嗜血杆菌(HI)是多数组中最常见的两种细菌(表1,上文)。在细菌和病毒患者中发现SP和HI的高比率(SP:36%和47%;HI:20%和32%),证实他们仅仅存在不一定会引起疾病。患者是基于它们是否具有SP(SP+:nBacterial=116,nViral=157;SP-:nBacterial=203,nViral=177)分层,并且比较两组的AUC表现。没有观察到显着性差异(0.93±0.03对0.94±0.02,P=0.31)。HI的存在或不存在不影响签章表现(0.94±0.04对0.93±0.02;HI+:nBacterial=63,nViral=106;HI-:nBacterial=256,nViral=228,P=0.34)。这表明签章保持不受SP和HI的影响。
讨论:
构建了严格的复合参考标准策略,其中包括收集临床资料,化学专题小组和各种微生物检测,随后由三名独立医师进行标记。这个过程产生了三个子队列的层次结构,缩小了尺寸大小,增加了参考标准的确定性:多数,一致性和明确诊断。各标签AUC分别为0.94±0.02、0.96±0.02和0.99±0.01。表现的逐步增加可能是由于参考标准确定性的增加。然而,增加的准确度,特别是在明确诊断队列中,也可能部分是由于患有严重疾病或直接诊断的患者的选择偏倚。因此,本文提出的主要分析集中在多数队列,其捕获更广泛的疾病严重性和难以诊断的病例。这个队列可能包括一些错误的签章,从而导致对签章准确度的保守估计。
所述签章涉及当前微生物测试的几个挑战。(i)难以诊断无法访问或未知的感染部位。签章准确诊断此类病例,包括下呼吸道感染(AUC 0.95±0.03,n=153)和无源性发热(AUC=0.97±0.03,n=123)。(ii)延长使用时间(小时至天)。签章测量可溶性蛋白质,可以很容易地在医院部署的自动免疫测定机器和点护理装置上快速测量(几分钟内)。(iii)混合感染可能导致诊断不确定性,因为病毒的检测并不排除细菌共同感染。签章通过将混合感染与纯细菌感染进行分类来解决这个问题,从而促使医生在抗生素治疗方面同样管理两组。混合共同感染引起类似于纯细菌的蛋白质组宿主反应而不是反应的混合物的事实可能表明细菌对病毒的通路优势。(iv)微生物测试的一个显着缺点,特别是PCR是在非细菌疾病的受验者中检测潜在的定居者。签章的表现不受潜在殖民者的存在或不存在的影响。
宿主蛋白质如PCT,CRP和IL-6是常规用于协助细菌感染的诊断,因为它们传达了关于临床症状,血液计数和微生物学等附加信息。然而,患者和病原体变异性限制它们的有用性。宿主蛋白的组合有可能克服这一点,但是迄今为止对单个蛋白质产生了微不足道的中度诊断改善。这种适度的改善可能是由于依赖于组合的细菌诱导的蛋白质,对相同的因子的敏感性,因此较不能相互补偿。因此,在包括宿主蛋白,临床参数和其他测试的组合中观察到一个更大的改善。然而,实时获得这些多个参数通常是不可行的。
为了解决这个问题,确定了具有互补行为的蛋白质的组合。具体地说,发现TRAIL是响应于病毒而被细菌诱导的,IP-10在病毒中比细菌感染高,CRP在细菌中高于病毒感染。虽然升高的CRP提示细菌感染的效用已经很好地建立了,但是包含新的病毒诱导的蛋白质补充常规使用的细菌诱导的蛋白质大大有助于在广泛的亚组中签章的稳健性,包括从症状发病时间,病原体种类和合并症等。例如,腺病毒是导致儿童急性感染5%-15%的重要病毒亚组,在诊断上特别具有挑战性,因为它们诱导了模拟细菌感染的临床症状。常规实验室参数对此亚组的表现差于签章(AUCs=0.60±0.10[WBC],0.58±0.10[ANC],0.88±0.05[签章];n=223)。
尽管感染性疾病诊断取得进展,但及时鉴定细菌感染仍然具有挑战性,导致抗生素滥用,造成深刻的健康和经济后果。为了满足更好的治疗指导的需要,本发明人已经开发并验证了一种结合新颖和传统的宿主蛋白以区分细菌和病毒感染的签章。目前在大样本患者中的发现是有希望的,表明这种宿主签章有可能帮助临床医生管理急性感染性疾病患者,并减少抗生素滥用。
实例2:
用于区分细菌和病毒感染的宿主蛋白质组签章:前瞻性多中心观察研究-补充材料
准确度度量:所述签章整合了一受验者中所测定的三种蛋白质生物标记物的水平,并计算出反映一细菌与病毒感染可能性的一数值分数。为了量化签章的诊断准确度,使用分数的截止值,并采用以下测量:灵敏度,特异性,阳性预测值(PPV),阴性预测值(NPV),总准确度,正可能性比(LR+),负可能性比(LR-)和诊断优势比(DOR)。这些测量定义如下:
Figure GDA0002255600990000861
Figure GDA0002255600990000862
Figure GDA0002255600990000863
Figure GDA0002255600990000864
Figure GDA0002255600990000865
Figure GDA0002255600990000871
Figure GDA0002255600990000872
Figure GDA0002255600990000873
P,N,TP,FP,TN,FN分别为阳性,阴性,真阳性,假阳性,真阴性和假阴性。流行率是阳性类别的相对频率(即,流行率=P/(P+N))。除非另有说明,阳性和阴性分别是指细菌和病毒感染的患者。
接收器工作曲线(AUC)下的区域也用于执行不同诊断方法的截断独立比较。关于AUC的配方和置信区间(CI)计算的细节,参见Hanley和McNeil。报告了本文件中准确度测量的95%CI。
样本量:主要的研究目的是获得签章对病毒和细菌病因分类进行分类的表现。据估计,拒绝所有人口灵敏度和特异性P的零假设的样本量低于P0=75%,显着性水平为1%,功率为90%,差异为15%(P1-P0≥15%),其中394例(197例病毒和197例)。此外,预计大约15%的患者将有不确定的感染源,10%将由于技术原因被排除,10%将是健康或非感染控制。总而言之,研究需要招募至少607名患者。由于招募了1002名患者,,实现了这一要求。
构建计算模型逻辑模型:将蛋白质水平整合为单个预测分数,检查了多个计算模型,包括人造神经网络(ANN),支持向量机(SVM),贝叶斯网络(BN),K-最近邻(KNN)和多项式逻辑回归(MLR)在多数队列中使用leave-10%-out交叉验证来区分细菌和病毒感染的AUC分别为0.93±0.02(ANN),0.93±0.02(SVM[线性]),0.94±0.02[SVM(径向基函数)],0.92±0.02(BN),0.91±0.02(KNN)和0.94±0.02(MLR)。ANN,SVM和MLR模型的表现差异无统计学意义(P>0.1)。本发明人选择使用MLR,因为它通过将可能性分数分配给患者的诊断来提供概率解释。
本发明人训练并测试了MLR签章,用于区分细菌和非细菌病因。由于潜在病因的流行在不同的临床环境中变化,所以模型先验被调整以反映相等的基线流行率(50%细菌和50%非细菌)。在非细菌群体中,先验者被调整为45%的病毒感染和5%的非传染性,以反映在具有可疑急性感染的受验者中病毒与非传染性病人的预期流行率。下面的表3-4总结了MLR权重及其各自的95%置信区间以及与每个系数相关联的p值。在细菌与病毒感染分析中,将概率调整为1)Pb_adjusted=[Pb+Pv]和Pb_adjusted=[Pb+Pv],其中Pb和Pv分别对应于细菌和病毒感染的可能性)。
表3.MLR系数及其各自的标准误差
Figure GDA0002255600990000881
表4.与每个MLR系数相关的p值。
Figure GDA0002255600990000882
Figure GDA0002255600990000891
逻辑校准曲线:为了评估MLR模型的有效性,将计算出的预测可能性与实际观察到的结果进行比较(图5)。预测可能性与观察到的可能性是高度兼容的,进一步证明了模型的有效性。
本研究中使用的患者队列总结:共招募了1002例患者,并招募了892例患者(根据预先确定的排除标准排除了110例)。根据实例1“方法”部分所述的参考标准方法,将患者分配到四个不同的诊断组:(i)细菌;(ii)病毒;(iii)无明显的感染性疾病或健康(对照);和(iv)不确定。混合感染(细菌加病毒)的患者被标记为细菌,因为它们被类似地管理(例如用抗生素治疗)(图1A)。总共89%的所有入选患者被分配诊断,一个接近文献记录的极限的比率。以下部分提供患者特征的详细描述,其中包括所有患者的最终诊断(n=794):多数队列的765名患者和29名在筛选期间血清样品耗尽的患者(图1A-B)。
年龄和性别分布:所有年龄的患者被招募到研究。有同意诊断的患者(诊断患者n=794)包括比成人(>18岁)患者更多的儿科(≤18岁)(儿科445例(56%)对成人349例[44%])。20-80岁患者的年龄分布相对均匀,儿科患者年龄小于4岁(图6A-B)为高峰。观察儿科患者年龄分布与预期相符,代表住院患者背景分布(例如急诊科,儿科科室,内部部门)。两个性别的患者被招募到研究。患者人口在性别分布方面是平衡的(47%的女性,53%的男性)。
检测病原体:为了最大化病原体检测率,使用了一大批微生物工具。在65%的急性感染性疾病患者中检测到至少一种病原体(占所有794名诊断患者的56%)。使用多重PCR,抗原检测和血清学检查,共有36种不同的病原体被主动检测。使用标准培养技术或内部PCR检测出来另外20个病原体。来自所有主要病原体亚组的56种不同的病原体都被检测到(图7A)。病原体鉴定率与以前发表的研究报道相似,包括来自所有主要病原体亚组(革兰氏阴性菌,革兰氏阳性菌,非典型细菌,RNA病毒和DNA病毒)的病原体。在13%的患者中,检测到来自多于一种的上述病原体亚组的病原体(图7A)。
本研究中发现的病原体毒株是西方世界广泛的急性感染性疾病的关键病原体,包括例如流感A/B,呼吸道合胞病毒(RSV),副流感病毒,大肠杆菌,A组链球菌等。值得注意的是,被检测到的病原体的分析显示,没有一个病原体是主要的(图7B)。
涉及生理系统和临床综合征:感染性疾病患者(所有诊断患者[n=794],不包括非感染性疾病或健康受验者s,n=673)呈现各种感染生理系统(图8)。最常见的生理系统是呼吸系统(46%),其次是全身性感染(22%)。所有不涉及上述系统且不是胃肠道,尿液,心血管或中枢神经系统(CNS)感染的感染被归类为“其他”(例如,蜂窝织炎,脓肿)。观察到的生理系统参与分布代表了自然分布,与全年抽样的大型队列报道一致。
本研究中确诊的患者(n=794)呈现了各种临床综合征(图9A-B),其反映了全年收集的儿科和成人患者队列中预期的临床异质性。最常见的临床综合征是LRTI(21%),主要包括肺炎,支气管炎,细支气管炎,慢性阻塞性肺疾病(COPD)恶化,非特异性LRTI。综合征第二最常见的是全身性感染(19%),其中主要包括发烧,无源和隐血菌症。全身性感染主要发现于3岁以下儿童,但在少数成年患者中也发现。全身性感染是一个真正的临床挑战,因为患者风险与测试/治疗成本之间的平衡不清楚。急性淋巴细胞炎,急性鼻炎,急性鼻窦炎,急性中耳炎等,均为URTI(19%)。下一个最常见的综合征是胃肠炎(12%),UTI(7%)和蜂窝织炎(4%)。CNS感染(2%)包括败血性和无菌性脑膜炎。额外的临床综合征(1%)被归类为“其他”,包括较不常见的感染(例如外耳炎,附睾炎等)。观察到的临床综合征分布模式代表了大多数频繁和临床相关的综合征,与以前发表的大型研究一致。
核心体温:核心体温是评估感染性疾病严重程度的重要参数。使用最高测量体温(per-os或per-rectum),在所有诊断的患者(n=794)中检查了最大体温的分布。在38℃和40℃之间,最高体温的分布相对均匀,峰值为39℃(图10)。15%的患者(非感染性疾病患者亚组或健康受验者)的体温<37.5℃。体温≥40.5℃是罕见的(<3%的患者)。总的来说,观察到的分布表示在临床环境中正常的温度范围。
症状发作时间:“症状时间”定义为第一次出现症状出现的持续时间(天)(第一次出现症状可能是发烧,但也可能是另一种症状,例如发烧前的恶心或头痛)。我们队列中的“症状时间”(所有诊断患者,n=794)的分布在症状开始后2-4天达到高峰(35%的患者),大部分患者迟早会转诊到医疗援助(图11)。
合并症和慢性药物方案:合并症和慢性药物方案可能在理论上影响诊断试验。在确诊患者中,62%没有合并症,而38%患有慢性疾病。此外,75%的患者未接受慢性药物治疗,25%的患者接受了≥1次慢性药物治疗。我们患者群中最常见的慢性病是高血压,高脂血症,肺部疾病(如COPD,哮喘等),糖尿病(主要是2型)和缺血性心脏病,与最常见的慢性疾病西方世界(图12A)。我们患者群体使用的慢性药物的分布与所报告的慢性疾病的范围密切相关(例如,合并症患者的29%是高脂血症和降脂剂是最常用的药物)。其他常用药物包括阿司匹林,血糖控制药物和β受体阻滞剂(图12B)。
患者招聘网站:儿科急诊科(PED),儿科病房和手术部门以及急诊部门(ED),内科部门和外科部门的成人(>18岁)招募儿科患者(≤18岁)。儿科ED是最常见的招聘网站(39%),其他网站可比较(17-20%),反映了相对平衡的招聘流程。ED患者和住院患者之间的比例为成人约1:1,儿童约2:1(图13)。
被排除的患者的特征:在研究的1002例患者中,排除了110例(11%)患者(部分患者符合多项排除标准)。最常见的排除原因是发烧低于研究阈值37.5℃(n=54),其次是症状开始>12天(n=26),最近(前14天)感染性疾病(n=22)。排除的其他原因包括具有活动性恶性肿瘤(n=14),并且是免疫受损的(例如,由于用免疫抑制药物治疗;n=2)。
不确定患者的特征:尽管严格收集了实验室和临床信息,但总共98名患者被定义为不确定性,基于专家组无法可靠地建立复合参考标准。虽然在没有参考标准的情况下不可能直接检查这些患者的签章表现,但是可以分析其宿主蛋白反应,以评估它们是否与具有一参考标准的患者不同。我们将具有参考标准(n=653)的急性感染患者的TRAIL,IP-10和CRP的分布与没有参考标准(n=98)的患者进行比较。没有观察到统计学显着差异性(Kolmogorov Smirnov检验TRAIL,IP-10和CRP分别为0.20,0.25,0.46)。具有和不具有参考标准的患者之间的宿主蛋白反应的相似性意味着本方法可用于诊断临床环境中不确定的患者。
签章表现在不同患者亚组中保持稳健:在实例1中,本发明人证实,在各种患者特征方面,所述签章在横跨大范围的患者特征中保持稳健,包括年龄,临床综合征,症状发作时间,最大温度,病原体物种,合并症和AUC值在0.87至1.0之间的临床部位(图4)。在本例中,提供了对另一患者亚组的签章表现的综述。
慢性药物分层方案:在现实临床实践中,患者常常处于各种慢性药物方案之下,这可能会影响包含签章的蛋白质的水平。因此,本发明人检查了我们队列中最常用的药物(按类别)是否影响了签章的表现。受评估的药物组中没有一个与签章准确度有显着变化相关(表5)。
表5.各类慢性药物方案的签章灵敏度评估。
Figure GDA0002255600990000931
脓毒症分层:脓毒症是一种以全身炎症状态(称为全身性炎症反应综合征[SIRS])为特征的潜在致命的医学病症,以及已知或疑似感染的存在。细菌性败血症患者受益于早期抗生素治疗;延误或误诊可能会造成严重甚至致命的后果。本发明人着重于对SIRS的定义是明确的成年患者,并且检查了签章对于成年患有细菌性败血症的患者和具有病毒感染的成年患者之间的区分能力,以及对于成年患有细菌性败血症的患者与具有病毒感染的患者之间的区分能力。
根据美国胸科医师学会和重症监护医学学会定义了成年细菌性败血症患者。SIRS由以下发现中的至少两项定义:(i)体温<36℃或>38℃,(ii)心率>90次/分钟,(iii)呼吸频率>20次呼吸或血气PaCO2<32mmHg(4.3kPa),和(iv)WBC<4000细胞/立方毫米或>12,000细胞/立方毫米或>10%带状。发现签章在区分成人细菌性败血症患者和病毒性败血症患者的准确度方面达到非常高的水平(AUC 0.97和0.93分别为一致性[成人细菌性败血症,成年病毒性败血症]和多数[成人细菌性败血症,成年病毒性败血症]队列。这些结果证明了签章在从病毒感染的成人患者中区分出细菌性脓毒病患的效用。
表6.准确度诊断细菌性败血症与成年患者病毒性败血症的关系
Figure GDA0002255600990000941
细菌与非细菌患者分层:抗生素滥用通常来源于使用这些药物治疗非细菌(病毒或非感染性)患者或由于细菌感染的延迟或漏诊。
因此,本发明人进一步研究了用于区分细菌和非细菌患者的签章表现。使用leave-10%-out交叉验证来评估整个多数队列,得到0.94±0.02的AUC。评估一致性队列(AUC为0.96±0.02),以及过滤出现边缘免疫应答的患者后,呈现出改善的表现(表7)。
表7.诊断细菌与非细菌(病毒和非感染)患者的准确度的签章测量。A.一致性(nBacterial=256,nNon-bacterial=383)以及多数(nBacterial=319,nNon-细菌=446)队列中所有患者使用一leave-10%-out交叉验证获得了表现估计及其95%CI。B.过滤具有一边缘免疫应答后重复的分析(一致性[nBacterial=237,nNon-bacterial=343,nMarginal=59])和多数[nBacterial=292,nNon-bacterial=387,nMarginal=86]),类似于临床医生可能使用签章的方式。
Figure GDA0002255600990000951
不同温度下的蛋白质稳定性可影响测定表现:生物标记的效用取决于其在现实生活临床环境中的稳定性(例如,当样品在分析物测量之前在室温下储存时的衰减速率)。为了解决这个问题,我们在4℃和25℃的24小时内检查了来自四个独立个体的血清样品中TRAIL,CRP和IP-10的稳定性。将每个血浆样品100μL的等分试样吸移到0.2mL管中,并在0至24小时内保持在4℃或25℃。随后,测量分析物的水平(使用相同的板和试剂测量相同分析物的不同时间点)。分析物在4°和25℃的半衰期大于72小时,对于TRAIL,CRP和IP-10(图15A-C)。值得注意的是,在真实的临床环境中,如果样品在室温下储存,TRAIL,IP-10和CRP的浓度应在样品获得后约24之内测量。优选应在5小时,4小时,3小时,2小时,1小时或甚至在样品获得后立即测量。或者,样品应在低于10℃的温度下储存,然后在获得样品后可以测量超过24个TRAIL。
三种蛋白质组合优于任何单个和成对的蛋白质:三种蛋白质的组合优于个体和成对的蛋白质组合,用于区分细菌与病毒以及感染与非感染性患者。
表8:细菌与病毒
Figure GDA0002255600990000961
表9:感染与非感染
Figure GDA0002255600990000962
表现分析作为细菌感染患病率的函数:细菌和病毒感染的流行是彼此依赖的。例如,在冬季,门诊患儿的儿科医生预计会比在夏季期间的医院内部部门的医生遇到更多的病毒感染。值得注意的是,一些诊断准确度的度量如AUC,灵敏度和特异性对于潜在流行率是不变的,而准确度的其他测量,如PPV和NPV是流行率依赖的。在本节中,综述了临床环境中PPV和NPV在细菌和病毒感染流行率方面的预期签章表现。
作为分析的基础,使用了使用一致性(细菌,病毒)和多数(细菌,病毒)队列获得的签章准确度测量。一致性队列中细菌感染的流行率为51.7%,PPV为93%±3%,NPV为93%±3%。细菌感染在多数队列中的流行率为48.7%,PPV为89%±3%,NPV为92%±3%。
使用测量的灵敏度和特异性来计算签章PPV和NPV的预期变化,作为细菌感染的流行率的函数(图14A-B)。
不同临床设定和外推签章各自的PPV和NPV的实例列于表10A。
表10A外推签章PPV和NPV在不同的临床环境下,基于一致性队列。
Figure GDA0002255600990000971
*年均流行率。细菌感染流行率的估计是基于哈里逊内科第17版的第7部份,细菌病因学章节(Bacterial etiology chapter,Part 7 of Harrison’s Internal Medicine17th Edition)所报道的数据。
所述签章用于诊断细菌与病毒感染优于标准实验室和临床参数:标准实验室和临床参数,其中一些常规用于临床实践,以帮助感染源的鉴别诊断,在多数队列(细菌,病毒,非传染性,n=765)中评估。评估参数包括ANC,%嗜中性粒细胞,%淋巴细胞,WBC和最大温度。根据这些参数的良好建立的临床角色,我们观察到细菌和病毒患者之间的水平有统计学显著差异性(图15A-E)。例如,细菌患者ANC水平升高(P<10-24),WBC(P<10-10),而病毒患者具有淋巴细胞百分比较高(P<10-31)。这个签章比任何个别特征(P<10-18)及其组合(P<10-15)明显更准确,参见图3A)。
所述签章的表现优于具有良好免疫学作用的蛋白质生物标记物:所述签章胜过所有临床参数和在筛选阶段评估的600种蛋白质(见图3A-B)。以下部分进一步比较签章与常规用于临床环境或具有免疫学作用的所选蛋白质。
在危重病人中鉴别败血症与其他非传染性SIRS原因之间最广泛使用和有用的蛋白质生物标志物之一是降钙素原(PCT)。对于PCT是否可以用于区分局部细菌和病毒感染是不太清楚的。为了测试这一点,我们从一致性(细菌,病毒)队列(nBacterial=39,nViral=37)中随机选择的76个患者和从所述多数(细菌,病毒)队列(nBacterial=51,nViral=50)中随机选择的101个患者中,测量了PCT浓度,并将基于PCT水平的诊断准确度与签章的诊断准确度进行了比较。PCT准确度使用常规应用于临床环境(0.1ng/mL,0.25ng/mL,0.5ng/mL和1ng/mL)的标准截止值计算。最大PCT灵敏度达到69%,截止值为0.1mg/mL,特异性为62%(对于一致性[细菌,病毒]队列)。对于同一列,所述签章显示灵敏度显着高于94%(P<0.001),特异性93%(P<0.001)(图16A)。使用来自所述多数(细菌,病毒)队列的患者的比较显示出了相似的结果(图16B)。
总体而言,尽管危重病人的败血症检测具有很高的诊断价值和预后价值,但我们的研究结果表明,PCT在区分局部感染(细菌与病毒)患者之间较不准确。
在临床环境中使用的另一种蛋白质生物标记是C-反应蛋白(CRP),一种在感染和其他炎症条件下上调的急性期反应蛋白。使用整个一致性(细菌,病毒)和多数(细菌,病毒)队列将CRP的表现与签章的表现进行比较。CRP的准确度使用在临床设置中应用的几个标准截止值确定。最大CRP灵敏度为92%,在20mg/mL截止值下得到特异性为60%(对于一致性[细菌,病毒]队列)(图17A)。该签章在同一阵列中具有类似的灵敏度(94%)和特异性(93%,P<10-9)。使用多数(细菌,病毒)队列观察到类似的结果(图17B)。总体而言,签章对于具有20mg/L截止值的CRP具有相似的灵敏度,但是用于区分细菌和病毒患者的特异性更高。
接下来,检查了蛋白质生物标记物在宿主对感染反应中的确定作用的差异反应(表10B和图18A-H)。每个生物标记物在至少43名患者(大约一半的细菌和一半病毒)中进行测试,如果显示出有希望的结果,则进一步测试另外的患者(最多150个)。
表10B。在宿主反应感染中具有广泛作用的蛋白质生物标记物的列表,以及用于测试每个生物标记的患者数(对于每个分析,分析的患者包括大约一半的细菌和半病毒患者)。
Figure GDA0002255600990000991
Figure GDA0002255600990001001
由于这些生物标记物在临床环境中没有明确的截止值,因此我们以AUC作为比较依据(图3B)。最有说服力的生物标记物为TREM(AUC为0.68±0.09)。TREM的准确度显着低于签章的准确度(当两组AUC比较时,P<10-9;图3B)。这些结果表明,仅仅参与宿主对感染的反应并不一定意味着诊断效用。例如,虽然IFN-γ在免疫应答病毒和细胞内细菌中具有广泛的作用,但其半衰期(<20h)限制了其诊断效用(因为其在血液中的浓度高度依赖于感染发病的时间)。
实例3
三元分类器优于二元分类器
在二元模型中,分类器通过将所有样品分类为“细菌”或“非细菌”(“病毒”和“非感染性”)分组进行培训。在三元模型中,分类器学习区分三类“细菌”,“病毒”和“非传染性”。然后将病毒和非感染性的概率分组在一起,以给出“非细菌”的概率。这在现有数据中得到证实。
上述分类器都使用多数和一致性队列上的10%的交叉验证进行评估。
结果
在多数队列上运行二元分类器得到如表10C所示的结果,如下所示:
表10C
Figure GDA0002255600990001011
多数队列分类器的灵敏度为80.3%,特异性为92.2%。
在同一数据集上运行基于多项式的分类器,得到表10D中总结的以下结果。
表10D
Figure GDA0002255600990001012
Figure GDA0002255600990001021
可以看出,这种分类器在灵敏度和特异性方面优于前一种。灵敏度提高到83.1%,特异性提高到93.5%。
在一致性队列上运行二元分类器得到表11中总结的结果。
表11
Figure GDA0002255600990001022
一致性队列分类器灵敏度为84.8%,特异性为93.5%。
在同一数据集上运行基于多项式的分类器得到表12中总结的结果。
表12
Figure GDA0002255600990001023
这种分类器在灵敏度和特异性方面优于前一种。灵敏度提高到85.2%,特异性提高到95.0%。
总之,三元分类器在数据集测试上的灵敏度及特异性都优于二元基础的分类器。
实例4
即使分析准确度降低,签章的临床准确度也保持稳定
由于经常不同的测量装置,特别是在护理点有用的测量装置显示出增加的CV值(即缩小分析准确度),所以评估临床准确度如何受到蛋白质测量值CV(std/mean)增加的影响是很重要的。
本发明人检查了用于区分细菌与病毒感染的签章的AUC变化,作为TRAIL和CRP两者的CV增加的函数。这是通过采用一致性队列的原始患者数据,并使用蒙特卡罗模拟来模拟CV的增加(图19A-B)来完成的。具体来说,对于TRAIL和CRP CV的每个组合,对每个患者分配100个模拟测量值,并重新计算每种情况下的AUC。描绘每CV组合的平均AUC。可以看出,签章临床准确度(以AUC计)对技术CV的增加是稳健的。例如,将ELISA CV增加0,0.24和0.4导致AUC分别为0.96,0.95和0.94的降低。当增加IP-10的CV值,并且在所述多数队列上重复模拟时,也得到类似的结果。
这个结果可以通过使用多个相互补偿的生物标记物来解释。这个令人惊奇的发现是有用的,因为它打开了在廉价和快速技术(如POC技术)上进行蛋白质测量的方法,这些技术通常显示出降低的分析灵敏度(比较例如自动化免疫测定或ELISA),而不会失去临床准确度。
实例5
不同的ELISA协定可用于测量TRAIL和IP-10,这将导致不同的信噪比,从而导致测量的不同浓度。更具体地说,虽然生物标记物的整体趋势将被保留,不管协定如何(例如病毒感染中的TRAIL增加而细菌中的TRAIL减少),测量量表仍依赖于协定。在以下小节中,描述了导致IP-10和TRAIL的不同测量浓度的协定的实例。
使用ELISA测量可溶性IP-10及TRAIL-协定1:为了确定人血浆和血清样品中可溶性IP-10和TRAIL的浓度,使用了标准的三明治ELISA(酶联免疫吸附测定)。简言之,96孔板的孔洞使用TRAIL和IP-10特异性的捕获抗体包被,并在包被缓冲液(例如1xPBS)中稀释,然后在4℃培养过夜。用洗涤缓冲液(例如含有0.2%Tween-20的1xPBS)洗涤孔洞两次,随后用含有蛋白质的阻挡缓冲液(例如含有0.2%Tween-20和5%不含脂肪的牛奶的1xPBS)在室温封闭至少2小时温度或4℃封闭过夜。然后用洗涤缓冲液将孔洞再洗涤两次。将蛋白质标准品和血浆或血清样品在室温下培养2小时。然后,用洗涤缓冲液洗涤孔洞三次,随后用特异于TRAIL和IP-10的HRP缀合的检测抗体培养,在阻挡缓冲液中在室温下稀释2小时。
将孔洞用洗涤缓冲液洗涤四次,并与含有HRP底物(例如TMB;3,3',5,5'-四甲基联苯胺)的反应溶液一起培养。在适当的显色后,向每个孔洞中加入一终止溶液。使用标准分光光度计测定HRP反应产物在450nm的吸光度。这个协定分别采用5(TRAIL)和4.75(IP10)小时,这里被称为缓慢协定。
使用ELISA测量可溶性IP-10和TRAIL–协定2:
减少测定时间可增加临床效用。为了进一步减少协定运行时间,所述协定被优化用于测量TRAIL和IP10并减少至不到100分钟。快速协定如下进行:
将50μl测定稀释液和50μl标准品加入到每孔的样品或对照品中。反应物在室温下在设定为550rpm的水平轨道微孔板振荡器(3mm轨道)上培养30分钟。然后将每个孔抽吸并使用洗涤缓冲液洗涤四次。接下来,向每个孔中加入200μl缀合物,并将反应物在室温下在振荡器上培养45分钟。将孔用洗涤缓冲液洗涤四次,并与含有HRP底物(例如TMB;3,3',5,5'-四甲基联苯胺)的反应溶液一起培养。10-25分钟后,向每个孔中加入终止溶液。使用标准分光光度计测定HRP反应产物在450nm的吸光度。这个协定分别采用99(TRAIL)和85(IP-10)分钟,这里被称为快速协定。
比较用于TRAIL的357个样品和用于IP-10的189个样品的缓慢和快速协定测量,并显示高度相关的结果(图30A-B)。
值得注意的是,使用快速协定获得的平均TRAIL浓度比使用缓慢协定获得的TRAIL浓度低约70%。横跨不同协定的蛋白质测量浓度的这种变化经常发生,并且可以通过将两种协定的测量值相关联并计算变换函数进行补偿。例如,转换函数y_slow=0.709x y_rapid-3e-12可用于转译所述快速协定和缓慢协定的浓度。这个转译保留了TRAIL的准确性。本领域技术人员可以开发其他保持了准确性的翻译功能和协定也。总之,TRAIL的行为在两个方案中保持不变(即病毒感染率最高,非传染性较低,细菌最低),尽管计算的浓度有一偏差。
不同的协定和队列导致不同的模型系数:
在利用缓慢协定测量IP-10和TRAIL时,在多数患者队列上产生的多项式逻辑模型系数的一个例子如表13所示:
表13
Figure GDA0002255600990001051
表14显示了使用缓慢协定测量IP-10和TRAIL时在共识患者队列上生成的多项逻辑模型系数的一个例子。
表14
Figure GDA0002255600990001061
由于患者队列中的亚组的频率偏离一般群体中的预期频率,所以可以使用用于系数调整的标准技术来进一步调整模型系数以反映预定的先验概率(例如参见G.King和LZeng,2002年医学统计)。例如,以下例子显示了使用缓慢协定测量IP-10和TRAIL时在多数患者队列上产生的多项逻辑模型系数,反映了45%细菌,45%病毒和10%非传染性的先验概率。
先前调整后的模型系数(多数队列上的训练)总结在表15中:
表15
Figure GDA0002255600990001062
事先调整后的模型系数(在共识队列中训练)总结在表16中。
表16
Figure GDA0002255600990001063
Figure GDA0002255600990001071
值得注意的是,如本领域技术人员显而易见的,可以选择系数的其它组合来产生相似的结果。用于测量影响测定蛋白质浓度的蛋白质的其他协定将产生不同的模型系数。例如,用于测量TRAIL的快速协定将计算的浓度降低到在缓慢协定中计算的浓度的大约70%。因此,一种调整方法是改变TRAIL的模型系数来解释这一变化。另一种方法是将TRAIL的快速协定测量值分为70%,并插入到用于所述缓慢协定而开发的上述模型中。
通常优选对蛋白质测量使用一对数变换,以改进模型准确度和校准(即,在某种感染的预测风险与观察到的风险之间更好地拟合)。
在表17中描绘了具有TRAIL和IP-10的对数转换的模型的示例(模型在共识队列上训练):
表17
Figure GDA0002255600990001072
实例6
超表面参数化
鉴于CRP[C],TRAIL[T]和IP-10[P]的浓度,我们定义:
δ0=-1.299+0.0605x[C]+0.0053x[P]+0.0088x[T]
δ1=-0.378+0.0875x[C]+0.0050x[P]-0.0201x[T]
概率可以通过以下公式计算:
Figure GDA0002255600990001081
Figure GDA0002255600990001082
Figure GDA0002255600990001083
我们在[C],[T],[P]空间中定义超表面:
Figure GDA0002255600990001084
用于区分细菌和非细菌患者。在一个优选实施例中。在其它优选实施例中。给定患者的[C],[T],[P]值,如果
Figure GDA0002255600990001085
否则他/她被分类为非细菌。
我们定义了所有可以用来区分细菌和非细菌感染的所有超平面,这些是驻留在以下两个超表面的那些:
Figure GDA0002255600990001086
Figure GDA0002255600990001087
1可以是0到1之间的任何数字。在一些优选实施例中∈1小于0.5,0.4,0.3,0.2or0.1。
0可以是0和ω之间的任何数字。在一些优选的实施方案中,∈0小于0.5,0.4,0.3,0.2或0.1。
实例7提供了表面的说明性实例。
实例7
分类图形表示法
图20是细菌('+'),病毒('o')和非感染性('^')患者的三维可视化。不同的患者类型被映射到CRP(μg/ml),TRAIL和IP-10(pg/ml)浓度图中的区别区间。
通过示例,使用多项逻辑回归生成概率表面。曲面的轮廓图如图21A至28C所示,作为TRAIL(y轴),CRP(x轴)和IP-10浓度的函数。图21A,22A,23A,24A,25A,26A,27A,28A显示了病毒感染的概率。21B,22B,23B,24B,25B,26B,27B,28B显示细菌或混合感染的概率,21C,22C,23C,24C,25C,26C,27C,28C显示非感染性或健康的概率。图21A-21C对应于从0到100的IP10pg,图22A-22C对应于100至200的IP10pg,图23A-23C对应于从200到300的IP10pg,图24A-24C对应于从300到400的IP10pg,25A-25C对应于从400到500的IP10pg,图26A-26C对应于从500到1000的IP10pg,图27A-27C对应于从1000到2000的IP10pg,图28A-28C对应于2000或以上的IP10pg。
细菌或混合的患者用'+'标记;病毒用'o',非感染或健康用'^'。可以看出,IP-10的低水平与非感染性疾病有关,较高水平与细菌疾病有关,以及最高水平与病毒疾病有关。低水平的TRAIL与细菌感染相关,较高水平与非感染性和健康性有关,而最高水平与病毒感染有关。低水平的CRP与非感染性疾病和健康受验者有关,较高水平与病毒感染有关,而最高水平与细菌疾病有关。这三种蛋白质的组合产生一概率函数,其诊断表现优于任何个体或蛋白质对。
图35A-35D是描述作为坐标δ0和δ1的函数的细菌(图35A),病毒(图35B),非细菌(图35C)和非感染性(图35D)病因的概率的轮廓图。概率值范围介于0%(黑色)至100%(白色)之间。
实例8
测量表达水平的示例性协定
一般来说,不限制TRAIL的表达数值可以使用ELISA或自动免疫测定来测量;IP-10表达数值可以用ELISA测定;和CRA的表达数值可以使用ELISA或自动免疫测定来测量。CRP的表达数值也可以使用基于其与磷酸胆碱的钙依赖性结合的一功能测定来测量。
协定A:
适用于测量TRAIL表达数值的协定
(a)使用抗体将在样品中存在的TRAIL固定在固体支撑物;
(b)将固定的TRAIL与特异性结合TRAIL的一第二抗体相接触;以及
(c)定量结合在所述被固定的TRAIL的抗体的量。.
适用于测量IP-10表达数值的协定
(a)使用一捕获抗体将存在于样品中的IP-10固定在一固体支撑物上;
(b)将固定的IP-10与特异性结合IP-10的一第二抗体相接触;以及
(c)定量结合在所述被固定的IP-10的抗体的量。
适用于测量CRP表达数值的协定
(a)使用一捕获抗体将存在于样品中的CRP固定在一固体支撑物上;
(b)将固定的CRP与特异性结合I CRP的一第二抗体接触;以及
(c)定量结合在所述被固定的CRP的抗体的量。
协定B:
适用于测量TRAIL表达数值的协定
(a)用特异性结合于TRAIL的一第一抗体培养样品,其中所述第一抗体固定在一固体相;
(b)清洗;
(c)添加特异性结合TRAIL的一第二抗体,其中所述第二抗体与一酶共轭;清洗
(d)添加酶底物并定量结合在所述被固定的样品的抗体的量。
适用于测量IP-10表达数值的协定
(a)用特异性结合IP-10的一第一抗体培养样品,其中所述第一抗体固定在一固相;
(b)清洗;
(c)添加特异性结合IP-10的一第二抗体,其中所述第二抗体与酶共轭;清洗
(d)添加酶底物并定量结合在所述被固定的样品的抗体的量。
适用于测量CRP表达数值的协定
(a)用特异性结合CRP的一第一抗体培养样品,其中所述第一抗体固定在一固相;
(b)清洗;
(c)添加特异性结合CRP的一第二抗体,其中所述第二抗体与酶共轭;清洗
(d)添加酶底物并定量结合在所述被固定的样品的抗体的量。
协定C:
适用于测量CRP表达数值的协定
(a)测量脂质混合物的浊度;
(b)在钙的存在下使用已知量的脂质(优选磷酰胆碱)接触样品;和
(c)测量溶液的浊度,其中浊度的增加与CRP的量相关。
实例9
详细描述了用于分析TRAIL和IP-10的量的ELISA
样品收集和储存:样品暴露于室温应最小化(少于6小时)。使用血清分离管(SST),并允许样品凝结至少30分钟,然后离心(在1200xg下5分钟)。血清可以立即测定,或等分并在4-8℃下储存长达24小时或≤20℃下长达3个月。应避免重复冻融循环。
试剂准备:使用前应将试剂置于室温。
底物溶液:颜色试剂A和B应在使用10分钟内以相同的体积混合在一起。必须防光。
QC-1V,QC-2B和标准品:解冻所有QC和标准品,并从每个小瓶中取出150uL至一个单独的标记聚丙烯试管。使用后立即移回到-20℃。
足迹测量:
在下表18中提供用于分析TRAIL的材料。
表18
Figure GDA0002255600990001121
TRAIL ELISA方法
a)如上所述准备样品,试剂和标准品。
b)从板框架上取出多余的微板条,将其返回到含有干燥剂包装的箔袋中,并重新密封。
c)向每个孔中加入50μL测定稀释剂MM1S。
d)每孔加入50μL标准品,样品或QC。盖上提供的胶条。
e)在550rpm的微孔板振荡器(3mm轨道)上室温培养30分钟。
f)抽吸各孔,洗涤,重复过程4次。用洗涤缓冲液(300μL)填充每个孔进行清洗。最后一次洗涤后,通过吸取或滗析清除任何剩余的洗涤缓冲液。倒置板,并用干净的纸巾擦拭。
g)向每个孔中加入200μL的TRAIL缀合物。用新的胶条盖住。在设定为550rpm的微板振荡器(3mm轨道)上在室温下培养45分钟。
h)如步骤(g)重复抽吸/清洗。
i)向每个孔中加入200μL底物溶液。在室温下培养24至30分钟。防光。
j)向每个孔中加入50μL的终止溶液。孔中的颜色应从蓝色变为黄色。如果孔中的颜色为绿色或颜色变化不均匀,轻轻敲击板,以确保充分混合。
k)使用设置为450nm的酶标仪,立即确定每个孔的光密度。将波长校正设置为570nm,这将校正板中的光学缺陷。
浓度的TRAIL计算:平均每个样品的重复读数,并减去平均零标准光密度(O.D.)。通过绘制每个标准(y轴)的平均吸光度相对于浓度(x轴)绘制一个标准曲线,并绘出最佳拟合线性曲线。最小r2不应低于0.96。如果存在较低的r2值,重复实验以获得可靠的结果。
精确度:基于CLSI(以前的NCCLS)EP05-A2指南评估精度。使用浓度低(11.4pg/ml),中(58.8pg/ml)和高(539.0pg/ml)生理浓度的三个样品来评定精度。结果总结在表19中,其中Sr是运行内精度,ST在器件内精度:
表19
Figure GDA0002255600990001141
回收:通过将三个水平的人类重组TRAIL(250,125和62.5pg/mL)掺入到5个人血清样品中而没有检测到的TRAIL水平来评估回收。然后测量和计算加标值和平均回收率,如下表20所示。
表20
范围 平均%回收 样本
75-78% 77% 血清(n=5)
线性:为了评估测定的线性,使用血清替代品连续稀释含有高浓度TRAIL的5个临床样品,以产生在测定生理范围内的值。如下表21所示,1:2,1:4和1:8稀释度的线性度分别平均为97%,100%和105%。
表21
Figure GDA0002255600990001142
Figure GDA0002255600990001151
灵敏度:为了估计空白极限(LOB),我们测试了72个空白样本的血清替代品。空白样品的平均值为0.78pg/ml,标准偏差为1.39pg/ml。因此,计算出的LOB为3.07pg/ml。
为了估计检测极限(LOD),遵循了CLSI EP17-A指南。简要地,围绕七个预定浓度的测量分布进行了表征,每个具有30次独立测量(210次测量),产生10pg/ml的LOD。
校准:此免疫测定针对纯化的NS0表达的重组人类TRAIL进行校准。.
预期值:测量来自明显健康的成年人(>18岁)的样品中TRAIL的存在。范围和平均值总结在表22中。
表22
范围pg/ml 平均pg/ml 样本类型
17-157 90 血清(n=34)
交叉反应性和干扰:这个测定识别天然和重组人类TRAIL。因子4-1BB配体,APRIL,BAFF/BLyS,CD27配体,CD30配体,CD40配体,Fas配体,GITR配体,LIGHT,LTα1/β2,LTα2/β1,OPG,OX40配体,TNF-α,-β,TRAIL R3,TRAIL R4,TRANCE和TWEAK在血清替代品中以50ng/mL进行制备,并测定交叉反应性。另外,在中等范围的重组人类TRAIL对照中,以50pg/mL的这些因子的制备被测试为干扰。没有观察到显着的交叉反应性或干扰。
IP-10测量:在下表23中提供用于分析IP-10的材料。
表23
Figure GDA0002255600990001152
Figure GDA0002255600990001161
IP-10ELISA方法
a)如上所述准备样品,试剂和标准品。
b)从板框架上取出多余的微板条,将其返回到含有干燥剂包装的箔袋中,并重新密封。
c)向每个孔中加入50μL测定稀释剂MM56。
d)每孔加入50μL标准品,样品或QC。盖上提供的胶条。
e)在550rpm的微孔板振荡器(3mm轨道)上室温培养30分钟。f)抽吸出各孔,洗涤,重复过程4次。用洗涤缓冲剂(300μL)填充每个孔进行清洗。最后一次洗涤后,通过吸取或滗析清除任何剩余的洗涤缓冲液。倒置板,并用干净的纸巾擦拭。
g)向每个孔中加入200μL的IP-10缀合物。用新的胶条盖住。在设定为550rpm的微板振荡器(3mm轨道)上在室温下培养45分钟。
h)如步骤(g)重复抽吸/洗涤。
i)向每个孔中加入200μL底物溶液。在室温下培养10分钟。防光。
j)向每个孔中加入50μL的终止溶液。孔中的颜色应从蓝色变为黄色。如果孔中的颜色为绿色或颜色变化不均匀,轻轻敲击板,以确保充分混合。
k)使用设置为450nm的酶标仪,立即确定每个孔的光密度。将波长校正设置为570nm,这将校正板中的光学缺陷。
IP-10浓度计算:平均每个样品的重复读数,并减去平均零标准光密度(O.D.)。通过绘制每个标准(y轴)的平均吸光度相对于浓度(x轴)绘制一个标准曲线,并绘出最佳拟合线性曲线。最小r2不应低于0.96。如果存在较低的r2值,请重复实验以获得可靠的结果。
精度:基于CLSI(以前的NCCLS)EP05-A2指南评估精度。浓度低(69.4pg/ml),中(228.2pg/ml)和高(641.5pg/ml)生理浓度的三个样品用于评定精度。结果总结在表24中,其中Sr为运行内精度,ST为器件内精度:
表24
Figure GDA0002255600990001171
回收(Recovery):通过将三个水平的人类IP-10,500、250和125pg/mL加入5个没有可检测水平的IP-10人类血清样本中来评估回收。加入的值和平均回收率如下表25所示接着被测量及计算。
表25
范围 平均回收% 样本
72-80% 77 血清/血浆(n=5)
线性度(Linearity):为了评定IP-10测定的线性度,将含有873.7至1110.4pg/mL的高浓度IP-10的5个临床样本用一血清替代物连续稀释,以制造具有所述测定的生理范围内的值的样本。如下表26所示,1:2、1:4和1:8稀释度中,线性度分别平均为98%、102%和104%。
表26
Figure GDA0002255600990001181
灵敏度:为了估计空白极限(LOB),我们测试了72个血清替代品的空白样本。空白样本的平均值为0.23pg/ml,标准偏差为1.26pg/ml,得到2.29pg/ml的LOB。
为了估计检测极限(LOD),应用CLSI EP17-A指南。简要地,在七个预定浓度中的测量分布进行了表征,每个具有30次独立测量(共210次测量),得到10pg/ml的LOD。
校准:此免疫测定是针对一高度纯化的大肠杆菌表达重组人类IP-10(E-coli-expressed recombinant human IP-10)进行校准的。
预期值(Expected values):测量来自明显健康的成年志愿者的数个样品中IP-10的存在。所述范围和平均值如下表27所示。
表27
范围pg/ml 平均pg/ml 样本类型
29-525 119 血清(n=34)
交叉反应性和干扰性:这个测定法识别天然和重组人类IP-10。因子BLC/BCA-1,ENA-78,GCP-2,GROα,GROγ,IFN-γ,IL-8,I-TAC,MIG,NAP-2,SDF-1α和SDF-1βng/mL在血清替代品中以50ng/mL进行制备,并测定交叉反应性。另外,测试在中等范围的重组人类IP-10对照中50pg/mL的这些因子的制剂的干扰。没有观察到显着的交叉反应性或干扰实例10
TRAIL和疾病预后
评估患者预后,疾病严重程度和结局往往是临床上有用的。本发明人发现,低水平的TRAIL与差的患者预后和结果,以及高的疾病严重程度显着相关。例如,与所有较少生病的其他患者相比,重症监护病房(ICU)中的成人患者的TRAIL水平显着较低,无论患者是否具有感染性或非传染性病因。中位血清浓度分别为9pg/ml,相对于80pg,对于严重病人和所有其他患者,分别为(ranksum P<0.001,图36A)。T
40名荷兰儿科患者,年龄在3个月至5岁。在40名荷兰儿科患者,年龄在3个月至5岁,测量所述TRAIL血清水平。结果发现,与其余患者相比,最终进入ICU(指示为疾病并发症以及预后差)甚至死亡的患者,他们的TRAIL血清浓度明显较低(中位数分别为11比85;ranksum P<0.001),如图36B所示。令人瞩目的是,在整个队列中死亡的仅有两名儿童中,所测量的TRAIL水平(<5pgml)最低。这些结果指出TRAIL可以用作预测疾病严重程度和结果的一预后标记。
实例11
TRAIL年龄和性别参数
健康个人或一非感染性疾病的患者的TRAIL基础水平在女性中与生育年龄期间的男性相比较低(t-test P<0.001)(图37A),但在生育年龄前或后则是不变的(t-test P=0.9,图37B)。在感染性疾病的患者中没有观察到这种趋势。
实例12
示例性流形、超平面以及坐标
一维流形(One-dimensional Manifold)
当n=1时,所述流形S是一曲线,以及所述超平面π是一单一方向δ1所定义的一个轴。本实例中的所述坐标δ1可选地且优选是所述多肽D1,D2等的一线性组合b0+b1D1+b2D2+...。
下面表28列出了n=1时获得的诊断表现(AUC)。使用一leave-10%-out交叉验证在每行中指定的队列上以计算机计算其表现。在第1-4行中,被分析的数个受验者具有细菌或病毒感染,并且所述坐标δ1被计算,使得所述概率分类函数f(δ1)表示所述测试受验者具有一细菌感染的可能性。在5-8行中,被分析的数个受验者是感染性或非感染性的,并且坐标δ1被计算,使得所述概率分类函数f(δ1)表示所述测试受验者具有一感染的可能性。在10-12行中,被分析的数个受验者具有细菌或非细菌感染,并且所述坐标δ1被计算,使得所述概率分类函数f(δ1)表示所述测试受验者具有一细菌感染的可能性。在1-4行中,P和N列分别对应于细菌和病毒患者的数量,在5-8行中,P和N列分别对应于感染性和非感染性患者的数量,并且在9-12行中,P和N列分别对应于细菌和非细菌患者的数量。多数和共识指示了模型被验证的所述队列类型。
表28
Figure GDA0002255600990001201
Figure GDA0002255600990001211
下面表29分别列出了用于定义坐标δ1的系数b0、b1、b2等,分别是表28中列出的12种情况。左边的第一个系数是b0,然后从左到右,所述系数对应于表28的每一行中的所述多肽的顺序。所述系数对于每种多肽对应于下列的浓度规模:TRAIL(pg/ml),IP-10(pg/ml),以及CRP(微克/毫升,μg/ml)。
对于一组给定的多肽,所获得的系数在不同队列中具有小量的变化。尽管如此,本实施例的所述概率分类函数和所述坐标的系数优选地对应于多数队列所获得的那些系数。
表29
Figure GDA0002255600990001212
下面表30列出了一维流形获得的诊断表现(AUC)。所述表现使用一leave-10%-out交叉验证在所述多数队列上以计算机计算。在第1-55行中,被分析的数个受验者具有细菌或病毒感染,并且所述概率分类函数f(δ1)表示所述测试受验者具有一细菌感染的可能性。在56-110行中,被分析的数个受验者是感染性或非感染性的,并且所述概率分类函数f(δ1)表示所述测试受验者具有一感染的可能性。在1-55行中,P和N列分别对应于细菌和病毒患者的数量,在56-110行中,P和N列分别对应于感染性和非感染性患者的数量。
表30
Figure GDA0002255600990001221
Figure GDA0002255600990001231
Figure GDA0002255600990001241
下面表31分别列出了用于定义所述坐标δ1的系数b0、b1、b2等,分别为表30所列的110种情况。左边的第一个系数是b0,然后从左到右,所述系数对应于表30的每一行中的所述多肽的顺序。所述系数对于每种多肽对应于下列浓度规模:TRAIL(pg/ml),IP-10(pg/ml),CRP(μg/ml),PCT(ng/ml),SAA(克/毫升,g/ml)以及IL 1ra(g/ml)。
表31
Figure GDA0002255600990001242
Figure GDA0002255600990001251
Figure GDA0002255600990001261
二维流形(Two-dimensional Manifold)
当n=2时,所述流形S是一弯曲表面,以及所述超平面π是由所述第一方向δ0和所述第二方向δ1所定义的一平坦平面。本实施例中的所述坐标δ0可选地且优选为所述多肽D1,D2等的一线性组合a0+a1D1+a2D2+...;以及本实施例中的所述坐标δ1可选地且优选为所述多肽D1,D2等的一线性组合b0+b1D1+b2D2+...。
下面表32-35列出了在n=2时达到的诊断表现(AUCs)。在所述多数队列的一子集上使用一leave-10%-out交叉验证以计算机计算所述表现,所述多数队列具有足够血清来测量所有蛋白质。所述坐标δ0和δ1被计算,使得所述概率分类函数f(δ01)表示所述测试受验者具有一细菌感染的可能性。AUC值对应于根据细菌与病毒(右侧第二列-B vs.V)和感染与非感染(最右栏-I vs.NI)的分类。所示出的是数个多肽包括两个多肽(表32),三个多肽(表33),四个多肽(表34)和五个多肽(表35)的数个实施例的结果。对于每个多肽呈现了坐标和δ1的系数,其中所述“常数(const)”应用于所述坐标δ0时对应为a0,当应用于所述坐标δ1时对应为b0。所述系数对于每种蛋白质对应于下列浓度规模:TRAIL(pg/ml),IP-10(pg/ml),CRP(μg/ml),PCT(ng/ml),SAA(g/ml)以及IL 1ra(g/ml)。
表32
Figure GDA0002255600990001271
Figure GDA0002255600990001281
Figure GDA0002255600990001291
表33
Figure GDA0002255600990001292
Figure GDA0002255600990001301
表34
Figure GDA0002255600990001302
Figure GDA0002255600990001311
Figure GDA0002255600990001321
表35
Figure GDA0002255600990001322
实例13
包括非线性函数的示例性坐标
本发明人意外地发现,在计算坐标δ1和δ2中加入所述非线性函数φ0和φ1捕捉了数据中更微妙的趋势,同时保留了一概率框架,允许有意义的解释所述结果。在此实施例中,所述坐标δ1和δ2根据下面的等式计算:
δ0=a0+a1C+a2I+a3T+φ0
δ1=b0+b1C+b2I+b3T+φ1,
所述非线性函数定义为:
φ0=q1Cγ1+q2Cγ2+q3Tγ3
φ1=r1Cγ1+r2Cγ2+r3Tγ3.
其中,γ1=0.5,γ2=2andγ3=0.5
表36详细说明了本实施例所使用的系数和常数。
表36
Figure GDA0002255600990001331
在微生物确认队列(AUC为0.95±0.03),一致性队列(AUC为0.95±0.02)和研究队列(AUC为0.93±0.02)中检查了表36所示的模型的表现。随着所述不明确区域的尺寸增加,签章表现得到改善。
下面的表37A-C详细说明了使用本实施例的非线性模型时诊断细菌与病毒感染的准确度的签章测量。在微生物学上确认的子队列(表37A;n=241),一致性子队列(表37B;n=527)和研究子队列(表37C;n=653)中获得了表现估计值及其95%CI,使用如指示的不明确的区域的不同尺寸。下面的表37D-F详细描述了在应用不同阈值时,在所述研究队列中具有隐性免疫反应的患者的百分比,以及当应用所述研究队列获得的不同隐性免疫反应阈值时,下面表37G-H详细描述了签章灵敏度和特异性。在表37D-H中,最左侧的列表示一最小隐性免疫反应阈值,以及最上面的行表示一最大隐性免疫反应阈值。
表37A
Figure GDA0002255600990001341
表37B
Figure GDA0002255600990001342
表37C
Figure GDA0002255600990001343
表37D
0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1
52.8 47.2 44.0 40.9 38.6 36.3 34.8 33.2 31.2 29.1 26.3 24.0 22.7 20.5 17.6 13.9 10.4 6.6 0.05
46.2 40.6 37.4 34.3 32.0 29.7 28.2 26.6 24.7 22.5 19.8 17.5 16.1 13.9 11.0 7.4 3.8 0.1
42.4 36.8 33.5 30.5 28.2 25.9 24.3 22.8 20.8 18.7 15.9 13.6 12.3 10.1 7.2 3.5 0.15
38.9 33.2 30.0 27.0 24.7 22.4 20.8 19.3 17.3 15.2 12.4 10.1 8.7 6.6 3.7 0.2
35.2 29.6 26.3 23.3 21.0 18.7 17.2 15.6 13.6 11.5 8.7 6.4 5.1 2.9 0.25
32.3 26.6 23.4 20.4 18.1 15.8 14.2 12.7 10.7 8.6 5.8 3.5 2.1 0.3
30.2 24.5 21.3 18.2 15.9 13.6 12.1 10.6 8.6 6.4 3.7 1.4 0.35
28.8 23.1 19.9 16.8 14.5 12.3 10.7 9.2 7.2 5.1 2.3 0.4
26.5 20.8 17.6 14.5 12.3 10.0 8.4 6.9 4.9 2.8 0.45
23.7 18.1 14.9 11.8 9.5 7.2 5.7 4.1 2.1 0.5
21.6 15.9 12.7 9.6 7.4 5.1 3.5 2.0 0.55
19.6 13.9 10.7 7.7 5.4 3.1 1.5 0.6
18.1 12.4 9.2 6.1 3.8 1.5 0.65
16.5 10.9 7.7 4.6 2.3 0.7
14.2 8.6 5.4 2.3 0.75
11.9 6.3 3.1 0.8
8.9 3.2 0.85
5.7 0.9
表37E
0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1
53.6 43.6 38.2 33.5 29.5 26.0 23.5 21.6 18.8 16.6 13.8 11.3 10.3 9.1 7.5 5.3 3.4 2.5 0.05
51.1 41.1 35.7 31.0 27.0 23.5 21.0 19.1 16.3 14.1 11.3 8.8 7.8 6.6 5.0 2.8 0.9 0.1
50.2 40.1 34.8 30.1 26.0 22.6 20.1 18.2 15.4 13.2 10.3 7.8 6.9 5.6 4.1 1.9 0.15
48.3 38.2 32.9 28.2 24.1 20.7 18.2 16.3 13.5 11.3 8.5 6.0 5.0 3.8 2.2 0.2
46.1 36.1 30.7 26.0 21.9 18.5 16.0 14.1 11.3 9.1 6.3 3.8 2.8 1.6 0.25
44.5 34.5 29.2 24.5 20.4 16.9 14.4 12.5 9.7 7.5 4.7 2.2 1.3 0.3
43.3 33.2 27.9 23.2 19.1 15.7 13.2 11.3 8.5 6.3 3.4 0.9 0.35
42.3 32.3 27.0 22.3 18.2 14.7 12.2 10.3 7.5 5.3 2.5 0.4
39.8 29.8 24.5 19.7 15.7 12.2 9.7 7.8 5.0 2.8 0.45
37.0 27.0 21.6 16.9 12.9 9.4 6.9 5.0 2.2 0.5
34.8 24.8 19.4 14.7 10.7 7.2 4.7 2.8 0.55
32.0 21.9 16.6 11.9 7.8 4.4 1.9 0.6
30.1 20.1 14.7 10.0 6.0 2.5 0.65
27.6 17.6 12.2 7.5 3.4 0.7
24.1 14.1 8.8 4.1 0.75
20.1 10.0 4.7 0.8
15.4 5.3 0.85
10.0 0.9
表37F
0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1
52.1 50.6 49.4 47.9 47.3 46.1 45.5 44.3 43.1 41.0 38.3 36.2 34.4 31.4 27.2 22.2 17.1 10.5 0.05
41.6 40.1 38.9 37.4 36.8 35.6 35.0 33.8 32.6 30.5 27.8 25.7 24.0 21.0 16.8 11.7 6.6 0.1
35.0 33.5 32.3 30.8 30.2 29.0 28.4 27.2 26.0 24.0 21.3 19.2 17.4 14.4 10.2 5.1 0.15
29.9 28.4 27.2 25.7 25.1 24.0 23.4 22.2 21.0 18.9 16.2 14.1 12.3 9.3 5.1 0.2
24.9 23.4 22.2 20.7 20.1 18.9 18.3 17.1 15.9 13.8 11.1 9.0 7.2 4.2 0.25
20.7 19.2 18.0 16.5 15.9 14.7 14.1 12.9 11.7 9.6 6.9 4.8 3.0 0.3
17.7 16.2 15.0 13.5 12.9 11.7 11.1 9.9 8.7 6.6 3.9 1.8 0.35
15.9 14.4 13.2 11.7 11.1 9.9 9.3 8.1 6.9 4.8 2.1 0.4
13.8 12.3 11.1 9.6 9.0 7.8 7.2 6.0 4.8 2.7 0.45
11.1 9.6 8.4 6.9 6.3 5.1 4.5 3.3 2.1 0.5
9.0 7.5 6.3 4.8 4.2 3.0 2.4 1.2 0.55
7.8 6.3 5.1 3.6 3.0 1.8 1.2 0.6
6.6 5.1 3.9 2.4 1.8 0.6 0.65
6.0 4.5 3.3 1.8 1.2 0.7
4.8 3.3 2.1 0.6 0.75
4.2 2.7 1.5 0.8
2.7 1.2 0.85
1.5 0.9
表37G
0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1
98.0 98.3 98.5 98.6 98.7 98.7 98.8 98.8 98.8 98.9 95.6 92.9 92.0 90.7 89.2 87.1 85.4 84.6 0.05
92.9 94.1 94.6 95.0 95.3 95.5 95.6 95.7 95.9 96.0 92.9 90.4 89.5 88.3 86.8 84.8 83.2 0.1
91.2 92.7 93.3 93.7 94.1 94.3 94.5 94.6 94.8 94.9 92.0 89.5 88.6 87.4 85.9 84.0 0.15
87.9 89.8 90.7 91.3 91.7 92.1 92.3 92.5 92.8 92.9 90.1 87.7 86.8 85.7 84.3 0.2
84.3 86.8 87.8 88.6 89.2 89.6 89.9 90.1 90.5 90.7 88.0 85.7 84.8 83.8 0.25
81.9 84.7 85.8 86.7 87.4 87.9 88.3 88.5 88.9 89.2 86.5 84.3 83.5 0.3
80.1 83.1 84.3 85.3 86.0 86.6 87.0 87.3 87.7 88.0 85.4 83.2 0.35
78.8 81.9 83.3 84.3 85.1 85.7 86.1 86.4 86.8 87.1 84.6 0.4
75.5 79.0 80.5 81.6 82.5 83.2 83.7 84.0 84.5 84.8 0.45
72.1 76.0 77.6 78.9 79.9 80.6 81.1 81.5 82.1 0.5
73.1 76.7 78.2 79.4 80.4 81.1 81.6 81.9 0.55
74.2 77.5 78.9 80.1 81.0 81.6 82.1 0.6
74.9 78.0 79.4 80.5 81.3 82.0 0.65
75.8 78.7 80.0 81.0 81.8 0.7
76.9 79.6 80.8 81.7 0.75
78.0 80.5 81.6 0.8
79.3 81.5 0.85
80.5 0.9
表37H
0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1
97.5 94.5 92.3 89.7 88.6 86.7 85.7 83.9 82.1 79.2 80.1 80.8 81.3 82.1 83.1 84.2 85.2 86.3 0.05
97.9 95.5 93.6 91.4 90.5 88.8 88.0 86.4 84.9 82.3 83.0 83.5 83.9 84.5 85.3 86.1 86.9 0.1
98.2 95.9 94.2 92.2 91.4 89.9 89.1 87.7 86.2 83.9 84.4 84.8 85.1 85.7 86.3 87.1 0.15
98.3 96.2 94.7 92.7 92.0 90.6 89.8 88.5 87.1 84.9 85.4 85.7 86.0 86.5 87.1 0.2
98.4 96.5 95.0 93.2 92.5 91.1 90.5 89.2 87.9 85.8 86.2 86.5 86.8 87.2 0.25
98.5 96.7 95.3 93.5 92.9 91.6 90.9 89.7 88.5 86.4 86.8 87.1 87.3 0.3
98.5 96.8 95.4 93.8 93.1 91.9 91.2 90.0 88.9 86.9 87.2 87.5 0.35
98.6 96.9 95.5 93.9 93.3 92.0 91.4 90.2 89.1 87.1 87.5 0.4
98.6 96.9 95.6 94.0 93.4 92.2 91.6 90.4 89.3 87.4 0.45
98.7 97.0 95.8 94.2 93.6 92.4 91.8 90.7 89.6 0.5
96.4 94.8 93.6 92.1 91.6 90.4 89.9 88.8 0.55
95.1 93.6 92.4 91.0 90.4 89.3 88.8 0.6
93.9 92.4 91.3 89.9 89.3 88.3 0.65
93.3 91.8 90.7 89.3 88.8 0.7
92.1 90.7 89.6 88.3 0.75
91.6 90.2 89.1 0.8
90.2 88.8 0.85
89.1 0.9
在排除以下两个子群组之后,研究队列进一步检查了所述签章表现:(i)在医院经过3天以上的抗生素治疗后被采集血液样本的患者和(ii)疑似胃肠炎的患者。在表38A-C中进一步描述了微生物学上确认的队列(AUC为0.96±0.04),一致性队列(AUC为0.96±0.02)和研究队列(AUC为0.95±0.02)的模型表现的细节。
表38A-C使用非线性MLR模型详细描述了用于诊断细菌与病毒感染的准确度的签章测量。在微生物学上确认的子队列(表38A;n=200),一致性子队列(表38B;n=402)和研究队列(表38C;n=491)中获得了表现估计值及其95%CI,当排除超过3天的医院抗生素治疗和/或怀疑胃肠炎的患者时。
表38A
Figure GDA0002255600990001371
Figure GDA0002255600990001381
表38B
Figure GDA0002255600990001382
表38C
Figure GDA0002255600990001383
实例14
基于抗生素的分层
在653名怀疑患有急性感染的患者中,有427名接受了抗生素治疗(299名有细菌诊断以及128名有病毒诊断)。用来区分在抗生素治疗的患者子队列中受到所述细菌与病毒感染患者的签章的AUC为0.93±0.02。在抗生素治疗的患者和一般队列的表现之间没有观察到统计学上的显着性差异(0.94±0.02与0.93±0.02;P=0.5)。
尽管本发明已经结合具体实施方案进行了描述,但显然的,许多替换、修改和变化对于本领域的技术人员将是清楚明白的。因此,本发明意在涵盖落入所附权利要求的精神和范围内的所有替换、修改和变化。
所有在此说明书中所述的公开刊物、专利以及专利申请案在此并入它们的全文于本说明书中,以供参照至每一个单一公开文件、专利或专利申请案所特定且单一指示于此并入参照的相同范围。此外,任何参照资料的援引文献或定义在此申请中不应被解释为承认这个参照资料可作为本发明的已知技术。关于其章节标题被使用的情况下,不应被解释为必要的限制。
SEQUENCE LISTING
<110> 米密德诊断学有限公司
埃兰·埃登
克福·奥韦
罗伊·纳冯
阿萨夫·柯汉多坦
欧加·波依科
<120> 使用流形和超平面进行生物学数据的计算机分析
<130> TP170063-CN
<150> US 62/037,180
<151> 2014-08-14
<150> US 62/105,938
<151> 2015-01-21
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 1953
<212> DNA
<213> 智人
<400> 1
acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60
gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120
atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180
gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240
aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300
gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360
gtcaagtggc aactccgtca gctcgttaga aagatgattt tgagaacctc tgaggaaacc 420
atttctacag ttcaagaaaa gcaacaaaat atttctcccc tagtgagaga aagaggtcct 480
cagagagtag cagctcacat aactgggacc agaggaagaa gcaacacatt gtcttctcca 540
aactccaaga atgaaaaggc tctgggccgc aaaataaact cctgggaatc atcaaggagt 600
gggcattcat tcctgagcaa cttgcacttg aggaatggtg aactggtcat ccatgaaaaa 660
gggttttact acatctattc ccaaacatac tttcgatttc aggaggaaat aaaagaaaac 720
acaaagaacg acaaacaaat ggtccaatat atttacaaat acacaagtta tcctgaccct 780
atattgttga tgaaaagtgc tagaaatagt tgttggtcta aagatgcaga atatggactc 840
tattccatct atcaaggggg aatatttgag cttaaggaaa atgacagaat ttttgtttct 900
gtaacaaatg agcacttgat agacatggac catgaagcca gtttttttgg ggccttttta 960
gttggctaac tgacctggaa agaaaaagca ataacctcaa agtgactatt cagttttcag 1020
gatgatacac tatgaagatg tttcaaaaaa tctgaccaaa acaaacaaac agaaaacaga 1080
aaacaaaaaa acctctatgc aatctgagta gagcagccac aaccaaaaaa ttctacaaca 1140
cacactgttc tgaaagtgac tcacttatcc caagagaatg aaattgctga aagatctttc 1200
aggactctac ctcatatcag tttgctagca gaaatctaga agactgtcag cttccaaaca 1260
ttaatgcaat ggttaacatc ttctgtcttt ataatctact ccttgtaaag actgtagaag 1320
aaagagcaac aatccatctc tcaagtagtg tatcacagta gtagcctcca ggtttcctta 1380
agggacaaca tccttaagtc aaaagagaga agaggcacca ctaaaagatc gcagtttgcc 1440
tggtgcagtg gctcacacct gtaatcccaa cattttggga acccaaggtg ggtagatcac 1500
gagatcaaga gatcaagacc atagtgacca acatagtgaa accccatctc tactgaaagt 1560
acaaaaatta gctgggtgtg ttggcacatg cctgtagtcc cagctacttg agaggctgag 1620
gcaagagaat tgtttgaacc cgggaggcag aggttgcagt gtggtgagat catgccacta 1680
cactccagcc tggcgacaga gcgagacttg gtttcaaaaa aaaaaaaaaa aaaaacttca 1740
gtaagtacgt gttatttttt tcaataaaat tctattacag tatgtcatgt ttgctgtagt 1800
gctcatattt attgttgttt ttgttttagt actcacttgt ttcataatat caagattact 1860
aaaaatgggg gaaaagactt ctaatctttt tttcataata tctttgacac atattacaga 1920
agaaataaat ttcttacttt taatttaata tga 1953
<210> 2
<211> 1805
<212> DNA
<213> 智人
<400> 2
acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60
gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120
atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180
gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240
aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300
gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360
gtcaagtggc aactccgtca gctcgttaga aagactccaa gaatgaaaag gctctgggcc 420
gcaaaataaa ctcctgggaa tcatcaagga gtgggcattc attcctgagc aacttgcact 480
tgaggaatgg tgaactggtc atccatgaaa aagggtttta ctacatctat tcccaaacat 540
actttcgatt tcaggaggaa ataaaagaaa acacaaagaa cgacaaacaa atggtccaat 600
atatttacaa atacacaagt tatcctgacc ctatattgtt gatgaaaagt gctagaaata 660
gttgttggtc taaagatgca gaatatggac tctattccat ctatcaaggg ggaatatttg 720
agcttaagga aaatgacaga atttttgttt ctgtaacaaa tgagcacttg atagacatgg 780
accatgaagc cagttttttt ggggcctttt tagttggcta actgacctgg aaagaaaaag 840
caataacctc aaagtgacta ttcagttttc aggatgatac actatgaaga tgtttcaaaa 900
aatctgacca aaacaaacaa acagaaaaca gaaaacaaaa aaacctctat gcaatctgag 960
tagagcagcc acaaccaaaa aattctacaa cacacactgt tctgaaagtg actcacttat 1020
cccaagagaa tgaaattgct gaaagatctt tcaggactct acctcatatc agtttgctag 1080
cagaaatcta gaagactgtc agcttccaaa cattaatgca atggttaaca tcttctgtct 1140
ttataatcta ctccttgtaa agactgtaga agaaagagca acaatccatc tctcaagtag 1200
tgtatcacag tagtagcctc caggtttcct taagggacaa catccttaag tcaaaagaga 1260
gaagaggcac cactaaaaga tcgcagtttg cctggtgcag tggctcacac ctgtaatccc 1320
aacattttgg gaacccaagg tgggtagatc acgagatcaa gagatcaaga ccatagtgac 1380
caacatagtg aaaccccatc tctactgaaa gtacaaaaat tagctgggtg tgttggcaca 1440
tgcctgtagt cccagctact tgagaggctg aggcaagaga attgtttgaa cccgggaggc 1500
agaggttgca gtgtggtgag atcatgccac tacactccag cctggcgaca gagcgagact 1560
tggtttcaaa aaaaaaaaaa aaaaaaactt cagtaagtac gtgttatttt tttcaataaa 1620
attctattac agtatgtcat gtttgctgta gtgctcatat ttattgttgt ttttgtttta 1680
gtactcactt gtttcataat atcaagatta ctaaaaatgg gggaaaagac ttctaatctt 1740
tttttcataa tatctttgac acatattaca gaagaaataa atttcttact tttaatttaa 1800
tatga 1805
<210> 3
<211> 1334
<212> DNA
<213> 智人
<400> 3
atttcctcac tgactataaa agaatagaga aggaagggct tcagtgaccg gctgcctggc 60
tgacttacag cagtcagact ctgacaggat catggctatg atggaggtcc aggggggacc 120
cagcctggga cagacctgcg tgctgatcgt gatcttcaca gtgctcctgc agtctctctg 180
tgtggctgta acttacgtgt actttaccaa cgagctgaag cagtttgcag aaaatgattg 240
ccagagacta atgtctgggc agcagacagg gtcattgctg ccatcttgaa gtctaccttg 300
ctgagtctac cctgctgacc tcaagcccca tcaaggactg gttgaccctg gcctagacaa 360
ccaccgtgtt tgtaacagca ccaagagcag tcaccatgga aatccacttt tcagaaccaa 420
gggcttctgg agctgaagaa caggcaccca gtgcaagagc tttcttttca gaggcacgca 480
aatgaaaata atccccacac gctaccttct gcccccaatg cccaagtgtg gttagttaga 540
gaatatagcc tcagcctatg atatgctgca ggaaactcat attttgaagt ggaaaggatg 600
ggaggaggcg ggggagacgt atcgtattaa ttatcattct tggaataacc acagcacctc 660
acgtcaaccc gccatgtgtc tagtcaccag cattggccaa gttctatagg agaaactacc 720
aaaattcatg atgcaagaaa catgtgaggg tggagagagt gactggggct tcctctctgg 780
atttctattg ttcagaaatc aatatttatg cataaaaagg tctagaaaga gaaacaccaa 840
aatgacaatg tgatctctag atggtatgat tatgggtact ttttttcctt tttatttttc 900
tatattttac aaattttcta cagggaatgt tataaaaata tccatgctat ccatgtataa 960
ttttcataca gatttaaaga acacagcatt tttatatagt cttatgagaa aacaaccata 1020
ctcaaaatta tgcacacaca cagtctgatc tcacccctgt aaacaagaga tatcatccaa 1080
aggttaagta ggaggtgaga atatagctgc tattagtggt tgttttgttt tgtttttgtg 1140
atttacttat ttagtttttg gagggttttt tttttctttt agaaaagtgt tctttacttt 1200
tccatgcttc cctgcttgcc tgtgtatcct gaatgtatcc aggctttata aactcctggg 1260
taataatgta gctacattaa cttgttaacc tcccatccac ttatacccag gaccttactc 1320
aattttccag gttc 1334
<210> 4
<211> 281
<212> PRT
<213> 智人
<400> 4
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys
35 40 45
Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr
50 55 60
Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val
65 70 75 80
Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Met Ile Leu Arg Thr Ser
85 90 95
Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro
100 105 110
Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly
115 120 125
Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu
130 135 140
Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly
145 150 155 160
His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile
165 170 175
His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe
180 185 190
Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln
195 200 205
Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys
210 215 220
Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr
225 230 235 240
Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile
245 250 255
Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala
260 265 270
Ser Phe Phe Gly Ala Phe Leu Val Gly
275 280
<210> 5
<211> 101
<212> PRT
<213> 智人
<400> 5
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys
35 40 45
Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr
50 55 60
Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val
65 70 75 80
Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Thr Pro Arg Met Lys Arg
85 90 95
Leu Trp Ala Ala Lys
100
<210> 6
<211> 65
<212> PRT
<213> 智人
<400> 6
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Phe Ala Glu Asn
35 40 45
Asp Cys Gln Arg Leu Met Ser Gly Gln Gln Thr Gly Ser Leu Leu Pro
50 55 60
Ser
65
<210> 7
<211> 223
<212> PRT
<213> 智人
<400> 7
Gln Asp His Gly Tyr Asp Gly Gly Pro Gly Gly Thr Gln Pro Gly Thr
1 5 10 15
Asp Leu Arg Ala Asp Arg Asp Leu His Ser Ala Pro Ala Val Ser Leu
20 25 30
Cys Gly Cys Asn Leu Arg Val Leu Tyr Gln Arg Ala Glu Ala Glu Lys
35 40 45
Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val
50 55 60
Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser
65 70 75 80
Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp
85 90 95
Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg
100 105 110
Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser
115 120 125
Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn
130 135 140
Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp
145 150 155 160
Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp
165 170 175
Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu
180 185 190
Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile
195 200 205
Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
210 215 220
<210> 8
<211> 178
<212> PRT
<213> 智人
<400> 8
Lys Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro
1 5 10 15
Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
20 25 30
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
35 40 45
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
50 55 60
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
65 70 75 80
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
85 90 95
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
100 105 110
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
115 120 125
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
130 135 140
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
145 150 155 160
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
165 170 175
Val Gly
<210> 9
<211> 2421
<212> DNA
<213> 智人
<400> 9
caccctcatg agccccgggt acgtttaact attgagggcc aggaaattgc cttcctcctg 60
gacactggcg cagccttctc agggttaatc tcctgtcctg gatgactgtc ttcaaggtcc 120
gttaccaccc gaggaatcct gggacagcct ataaccaggt atttctccca catcctcagt 180
tgtaattgag agactttaat cttttcacat gccttttttg ttattcctga aagtcccaca 240
cccttattaa ggagggatat attagccaag gctggagcta ttatctacat gaatatgggg 300
aaaaagttac ccatttgctg tcccctactt gaggagggaa tcaaccctga agtctgggca 360
ttggaaggac aatttggaag ggcaaaaaat gcctgcccag tccaaatcag gttaaaagat 420
cccaccactt ttccgtatca aaggcaatat cccttaaggc ctgaagctca taaaggatta 480
tagaatattg ttaaacattt aaaagctcaa ggcttagtga ggaaatgcag cagtccctgc 540
aacaccccag ttctaggagt acaaaaacca aacagtcagt ggagactagt gcaagatctt 600
agactcatta atgaggcagt aattcctcta tatccagttg tacccaaccc ctataccctg 660
ctctctcaaa taccagggga agcagaatgg ttcacggttc tggacctcaa ggatgccttc 720
ttctttattc ccctgcactc tgactcccag tttctctttg cttttgagga tcccacagac 780
cacacgtccc aacttacaca gatggtcttg ccccaagggt ttagggatag ccctcatctg 840
tttggtcagg cactggccca agatctatag gccacttctc aagtccaggc actctggtcc 900
ttcaatatgt ggatgattta cttttggcta ccagtttgga agcctcgtgc cagcaggcta 960
ctctggatct cttgaacttt ctggctaatc aagggtacaa ggtgtctagg tcgaaggccc 1020
agctttgcct acagcaggtt aaatatctaa gcctaatctt agccaaaggg accagggccc 1080
tcagcaagga atgaatacag cctatactgg cttatcctca ccctaagaca ttaaaacagt 1140
tgcggggatt ccttggaatt actggctttt gctgactatg gatctccaga tacagcgaga 1200
cagccaggcc cctctatact ctaatcaagg aaacccagag ggcaaatact catctagtcg 1260
aaagggaacc agaggcagaa acagccttca aaagcttaaa gcaggctcta gtacaagctc 1320
cagctttaag ccttcccaca ggacagaact tctctttata catcacagag agagccaaga 1380
tagctcttgg agtccttaga ctcgtgggac aaccccacaa ccagtggcat acctaagtaa 1440
ggaaattgat gtagtagcaa aaggctggcc tcactgttta agggtagttg cagcagcggc 1500
cgtcttagcg tcagaggcta tcagaataat acaaggaaag gatctcactg tctggactac 1560
tcatgatgta aatggcatac taggtgccaa aggaagttta tggctatcag acaaccgcct 1620
cttagatgcc aggcactact ccttgaggga ctggtgctta aaatatgcac gtgcgtggcc 1680
ctcaaccctg ccacttttct cccagaggat ggggaaccaa ttgagcatga ctgccaacaa 1740
attatagtcc agacttatgc cgcccgagat gatctcttag aagtcccctt aactaatcct 1800
gaccttaacc tatataccga cggaagttca tttgtggaga atgggatacg aagggcaggt 1860
tacgccatag tgatgtaacc acacttgaaa gcaagcctct tcccccaggg accagtgccc 1920
agttagcaga actagtggca cttacccgag ccttagaact gggaaaggga aaaagaataa 1980
atgtgtatac agataacaag tatgcttatc taatcctaca tgcccatgct gcaatatgga 2040
aagaatggga gttcctaacc tctgggaacc cccgctggat gccacaggga agttatggag 2100
ttattgcaca tggtgcagga acccaaagag gtgggagtct tacactacca aggccatcaa 2160
aatgggaagg agaggggaga acagcagcat aagcggctgg cagaggtagg gaaagaccag 2220
caagaaggaa agagagaaag agaaagtcag agaaagagac agagagagga agagacagag 2280
agacagaacg ttaaagaggg tgtcagaaac agagacaaac aaaaggagtc agaaagaagg 2340
acagacacag aaagtcaaag agagagttaa aaagagagga agagacaaag aagtcgaaga 2400
gagaaagaga gagatggaag t 2421
<210> 10
<211> 2421
<212> DNA
<213> 智人
<400> 10
ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60
gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120
attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggtaa ggaacatcaa 180
aggatactta atttgtaaaa tgagaaatag gaataggtat aaattctaaa aatacagaaa 240
taatgtattt gtaaaagttt cactgcatgc ttataaataa gagggaaata aatagagatt 300
ccctcagatc ataaaactta tatgaattga agtgagagaa acaaatagaa taagagaaag 360
agaaggaaaa agggaaggag gacagaagag atggggaaga gggaggatag agagagaaaa 420
tgtgagggaa tgcggacaga gatgagatac agatacttcc ttacctaact aagctcaatg 480
aaccacatga actgtgctta agggtttgac tttataatca acaagctgca attcttttct 540
tccagataat caactcttta atcatttaca gttgtgttat gatgtgatcc attcctcctc 600
agattaagtg actatttgct gatatgggga tataggttct gctaaatacc accagtctac 660
attaaatgcc taaaatgaac actgtgctaa ccttctctgc tgttcctctt ttcctacagg 720
agtacctctc tctagaactg tacgctgtac ctgcatcagc attagtaatc aacctgttaa 780
tccaaggtct ttagaaaaac ttgaaattat tcctgcaagc caattttgtc cacgtgttga 840
gatcatgtga gtgaaatccc atctgattat cacttccctg gttgtaatta tatactgtat 900
taaatatgta atgataataa aaaaagatca gtaaagggtt tgtgatgatt ctaaaactaa 960
tgtacagcaa acaaaaacat gcagagtgaa acttaaatgt ctgacttcag aactgcgtat 1020
gccatctgtt ttattgaccc aacacagttt taaatatttt catccctatt tatttctaca 1080
gtgctacaat gaaaaagaag ggtgagaaga gatgtctgaa tccagaatcg aaggccatca 1140
agaatttact gaaagcagtt agcaaggaaa ggtaggtttg ctgttgcctg cagaagaatt 1200
gctctttagg aaacggcaat cttgggagtc agaaatactt gcattgtggt ttgctgtgca 1260
atcgctggtt taaaagtatg ttaccaccac gccctcccct acctccattt atttaaatgc 1320
tgaggcacca tcttgtgtga taagtatcag aagttaccct gattaccagt caaccttgaa 1380
gtacagctat aactatctaa gcaaaactga caacattttc cccaagtctt tcatggttga 1440
aaaaagcaac ccctataatc cataatgaat gcatagcagc aggaaagctc agttatctat 1500
tctatgaact cggtactttc caaacacaac ccaatctgaa gccagagtca gactatcaca 1560
cttttatatc ccctttctct tcttacaggt ctaaaagatc tccttaaaac cagaggggag 1620
caaaatcgat gcagtgcttc caaggatgga ccacacagag gctgcctctc ccatcacttc 1680
cctacatgga gtatatgtca agccataatt gttcttagtt tgcagttaca ctaaaaggtg 1740
accaatgatg gtcaccaaat cagctgctac tactcctgta ggaaggttaa tgttcatcat 1800
cctaagctat tcagtaataa ctctaccctg gcactataat gtaagctcta ctgaggtgct 1860
atgttcttag tggatgttct gaccctgctt caaatatttc cctcaccttt cccatcttcc 1920
aagggtacta aggaatcttt ctgctttggg gtttatcaga attctcagaa tctcaaataa 1980
ctaaaaggta tgcaatcaaa tctgcttttt aaagaatgct ctttacttca tggacttcca 2040
ctgccatcct cccaaggggc ccaaattctt tcagtggcta cctacataca attccaaaca 2100
catacaggaa ggtagaaata tctgaaaatg tatgtgtaag tattcttatt taatgaaaga 2160
ctgtacaaag tagaagtctt agatgtatat atttcctata ttgttttcag tgtacatgga 2220
ataacatgta attaagtact atgtatcaat gagtaacagg aaaattttaa aaatacagat 2280
agatatatgc tctgcatgtt acataagata aatgtgctga atggttttca aaataaaaat 2340
gaggtactct cctggaaata ttaagaaaga ctatctaaat gttgaaagat caaaaggtta 2400
ataaagtaat tataactaag a 2421
<210> 11
<211> 2421
<212> DNA
<213> 智人
<400> 11
agatgacttt tttctattta tatttaataa gatgatgaac ccttcttgca ttcccgaaat 60
aaacctcaac tgttacagtg ttttattctt ttaatatgta cgaagtacat gttaagcaag 120
ttatttccta agcagcccca caaactgggc actactacca tcctgctctg cccctccctc 180
actctacttc agccacttca gccacaatgg cctctcctca ctgcccctct gatgcaccaa 240
gcttgttctc acctcaggaa tgtgcaacac ctgccagact tgctgttccc cggagcctcc 300
atccccagat atcctcatat atcatcctcc tcttcatttg tgtctctgct tacatatgac 360
ctatttacag aagcctttcc tgtctacccc ccatgaaata gaaatcgcat tccaatcttg 420
tctctacccc aatgctgttt cattttgtct gtagcaattg tcatcatctc atatatattc 480
acatgtggaa aatacacaaa atgtttaact tcttttaatt tacattccat ttccccatga 540
attgaagctc catgacagcg gagatttttc tctgctttcc ctgttgctca cttcccagca 600
ccaagagcag gcctggcaca tgggaagtac ttactattta ttgaatggat gaatgaacaa 660
atgaatgaat ggatacttat tttacacata agaaaactga agcttataga aattaagtaa 720
ctaaaatcac acagaagcac agctgaaact aaaacctacg tctaactttc aattcctgac 780
ccttaaccat taaaacaaat gacaggtgac tttaggccac tgaaaatgct catataatct 840
tatgaattct aaagcacaag ttaatcacac cattgattga aagtctgagg aatactgtat 900
agacaagccc ctgtacaagg taagcaaaag aatcagagga tggcctccaa agaattccct 960
ggacattatg ggaattacat tgttagcctt cctactgata cccataagcc tcacagcaag 1020
catcatgaag ctgtgacctt catctgcaca tgcccttgta tacccaaaag ataaaactgg 1080
atgcttcagg gccgaatggc caataaacac gtgtttatta ctggcatggg cagacacaca 1140
tactgaaagt accatttccc agcggactag ccatattatg atcagtacag acactaaaga 1200
tttagctttg aaaaaactat ttgctcttcc aaagctgaag aatcttctgt gatttcaaca 1260
ggcaagttac agtcaggtat tcttaatgtt cttttcctcc tctctcactg ggatactttc 1320
tttccttcag acaacgtcaa gcgaaaaaca aaatttcaca aatctccatt tctgacacta 1380
aacagtacag tatctttatt ttttttataa tttaatcaaa ccctgtattt tagaactgtg 1440
gggctgatcc aacattgcaa tgtgtcacat ttaattccat caatgtaaag cataatgagc 1500
aaagattaag gtagtgaggc ataactaaat gttttgaacc tgtgaatttc aaaagcaagg 1560
cccatttgtg ttattttcta aatagtaaat aaaatcattt tccaacattt cactatcaaa 1620
ttacagtaat ttttccacca gtacacactt gaggaaagcc acaaaaagac ttttccaaca 1680
gttcattctg ttattgctca taaccttcta aatacttctc ctcattggct tctattcaaa 1740
ggtaaatgga aagcagtaaa atttatggaa aatatattca actgcttaaa atacatcaac 1800
caaaaaaaag attttagagc tgtattatga gttgtgaaat tgcattgcct tcacttacct 1860
ttcagtttca ctggtaggta acaaaactga cagactggtc aagttccaaa acatccccta 1920
tatagagcct gactcttcca tctcaaattc tcaccttggt caaggccaga gtaaacacct 1980
gtccttcaca tttttacaca acatcacttt gtatgctaca aatataagct ttcataccag 2040
ggaggaagca aattccagga cactggaaac atttctgctc tcttaaacca gtctgttgat 2100
tgttcccttg actttctcag ctgtcaggat agtgaaagga ggaaaactgc aaaactgtaa 2160
agtataacct gataagtttg ccctttaagc ttttcacaca gagagaggta aaataaaact 2220
caagtctaag gtttaaaatt gagctatgaa tattatattc tagcactaga caaaaatgtt 2280
gcaagatttt aataaaataa gattattaaa atcaattttt acatttcatg ggccaaggag 2340
agacatcaaa gaatgtttaa ctaacatttt aaagatacta tactttataa agttaagaag 2400
aaaaatgaca actgcaccag t 2421
<210> 12
<211> 1227
<212> DNA
<213> 智人
<400> 12
ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60
gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120
attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggagt acctctctct 180
agaactgtac gctgtacctg catcagcatt agtaatcaac ctgttaatcc aaggtcttta 240
gaaaaacttg aaattattcc tgcaagccaa ttttgtccac gtgttgagat cattgctaca 300
atgaaaaaga agggtgagaa gagatgtctg aatccagaat cgaaggccat caagaattta 360
ctgaaagcag ttagcaagga aaggtctaaa agatctcctt aaaaccagag gggagcaaaa 420
tcgatgcagt gcttccaagg atggaccaca cagaggctgc ctctcccatc acttccctac 480
atggagtata tgtcaagcca taattgttct tagtttgcag ttacactaaa aggtgaccaa 540
tgatggtcac caaatcagct gctactactc ctgtaggaag gttaatgttc atcatcctaa 600
gctattcagt aataactcta ccctggcact ataatgtaag ctctactgag gtgctatgtt 660
cttagtggat gttctgaccc tgcttcaaat atttccctca cctttcccat cttccaaggg 720
tactaaggaa tctttctgct ttggggttta tcagaattct cagaatctca aataactaaa 780
aggtatgcaa tcaaatctgc tttttaaaga atgctcttta cttcatggac ttccactgcc 840
atcctcccaa ggggcccaaa ttctttcagt ggctacctac atacaattcc aaacacatac 900
aggaaggtag aaatatctga aaatgtatgt gtaagtattc ttatttaatg aaagactgta 960
caaagtagaa gtcttagatg tatatatttc ctatattgtt ttcagtgtac atggaataac 1020
atgtaattaa gtactatgta tcaatgagta acaggaaaat tttaaaaata cagatagata 1080
tatgctctgc atgttacata agataaatgt gctgaatggt tttcaaaata aaaatgaggt 1140
actctcctgg aaatattaag aaagactatc taaatgttga aagatcaaaa ggttaataaa 1200
gtaattataa ctaagaaaaa aaaaaaa 1227
<210> 13
<211> 98
<212> PRT
<213> 智人
<400> 13
Met Asn Gln Thr Ala Ile Leu Ile Cys Cys Leu Ile Phe Leu Thr Leu
1 5 10 15
Ser Gly Ile Gln Gly Val Pro Leu Ser Arg Thr Val Arg Cys Thr Cys
20 25 30
Ile Ser Ile Ser Asn Gln Pro Val Asn Pro Arg Ser Leu Glu Lys Leu
35 40 45
Glu Ile Ile Pro Ala Ser Gln Phe Cys Pro Arg Val Glu Ile Ile Ala
50 55 60
Thr Met Lys Lys Lys Gly Glu Lys Arg Cys Leu Asn Pro Glu Ser Lys
65 70 75 80
Ala Ile Lys Asn Leu Leu Lys Ala Val Ser Lys Glu Arg Ser Lys Arg
85 90 95
Ser Pro
<210> 14
<211> 2301
<212> DNA
<213> 智人
<400> 14
aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60
ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120
gtttcttggt cttgaccagc ctctctcatg cttttggcca gacaggtaag ggccacccca 180
ggctatggga gagatttgat ctgaggtatg ggggtggggt ctaagactgc atgaacagtc 240
tcaaaaaaaa aaaaaaaaga ctgtatgaac agaacagtgg agcatccttc atggtgtgtg 300
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tggtgtgtaa ctggagaagg ggtcagtctg 360
tttctcaatc ttaaattcta tacgtaagtg aggggataga tctgtgtgat ctgagaaacc 420
tctcacattt gcttgttttt ctggctcaca gacatgtcga ggaaggcttt tgtgtttccc 480
aaagagtcgg atacttccta tgtatccctc aaagcaccgt taacgaagcc tctcaaagcc 540
ttcactgtgt gcctccactt ctacacggaa ctgtcctcga cccgtgggta cagtattttc 600
tcgtatgcca ccaagagaca agacaatgag attctcatat tttggtctaa ggatatagga 660
tacagtttta cagtgggtgg gtctgaaata ttattcgagg ttcctgaagt cacagtagct 720
ccagtacaca tttgtacaag ctgggagtcc gcctcaggga tcgtggagtt ctgggtagat 780
gggaagccca gggtgaggaa gagtctgaag aagggataca ctgtgggggc agaagcaagc 840
atcatcttgg ggcaggagca ggattccttc ggtgggaact ttgaaggaag ccagtccctg 900
gtgggagaca ttggaaatgt gaacatgtgg gactttgtgc tgtcaccaga tgagattaac 960
accatctatc ttggcgggcc cttcagtcct aatgtcctga actggcgggc actgaagtat 1020
gaagtgcaag gcgaagtgtt caccaaaccc cagctgtggc cctgaggccc agctgtgggt 1080
cctgaaggta cctcccggtt ttttacaccg catgggcccc acgtctctgt ctctggtacc 1140
tcccgctttt ttacactgca tggttcccac gtctctgtct ctgggccttt gttcccctat 1200
atgcattgca ggcctgctcc accctcctca gcgcctgaga atggaggtaa agtgtctggt 1260
ctgggagctc gttaactatg ctgggaaacg gtccaaaaga atcagaattt gaggtgtttt 1320
gttttcattt ttatttcaag ttggacagat cttggagata atttcttacc tcacatagat 1380
gagaaaacta acacccagaa aggagaaatg atgttataaa aaactcataa ggcaagagct 1440
gagaaggaag cgctgatctt ctatttaatt ccccacccat gacccccaga aagcaggagg 1500
gcattgccca cattcacagg gctcttcagt ctcagaatca ggacactggc caggtgtctg 1560
gtttgggtcc agagtgctca tcatcatgtc atagaactgc tgggcccagg tctcctgaaa 1620
tgggaagccc agcaatacca cgcagtccct ccactttctc aaagcacact ggaaaggcca 1680
ttagaattgc cccagcagag cagatctgct ttttttccag agcaaaatga agcactaggt 1740
ataaatatgt tgttactgcc aagaacttaa atgactggtt tttgtttgct tgcagtgctt 1800
tcttaatttt atggctcttc tgggaaactc ctcccctttt ccacacgaac cttgtggggc 1860
tgtgaattct ttcttcatcc ccgcattccc aatataccca ggccacaaga gtggacgtga 1920
accacagggt gtcctgtcag aggagcccat ctcccatctc cccagctccc tatctggagg 1980
atagttggat agttacgtgt tcctagcagg accaactaca gtcttcccaa ggattgagtt 2040
atggactttg ggagtgagac atcttcttgc tgctggattt ccaagctgag aggacgtgaa 2100
cctgggacca ccagtagcca tcttgtttgc cacatggaga gagactgtga ggacagaagc 2160
caaactggaa gtggaggagc caagggattg acaaacaaca gagccttgac cacgtggagt 2220
ctctgaatca gccttgtctg gaaccagatc tacacctgga ctgcccaggt ctataagcca 2280
ataaagcccc tgtttacttg a 2301
<210> 15
<211> 2301
<212> DNA
<213> 智人
<400> 15
aggaattgaa ctcagctctg ccccaagcgg acctaataga catctacaga actctccacc 60
ccaaatcaac agaatataca tttttttcag caccacacca cacctattcc aaaattgatc 120
acatagttgg cagtaaagct ctcctcagca aatgtaaagg aacagaaatt ataacaaact 180
atctctcaga ccacagtgca atcaaattag aactcagaat taagaatctc actcaaaacc 240
gcacaactac atggaaactg aacaacctgc ttctgaatga ctactgggta cataatgaaa 300
tgaaggcaga aataaagatg ttctttgaaa tgaacaagaa caaacacaca acataccaga 360
atctctggga cgcattcaaa gcagtgtgta gagggaaatt tatagcacta aatgcccaca 420
agagaaagca ggaaacatcc aaaattgaca tcctaacatc acagttaaaa gaactagaaa 480
agcaagagca aacacattca aaagctagca gaaggcaaga gataactaaa atcagagcag 540
aactgaagga aatagagaca caaaaaccct tcaaaaaatt aatgaatcca ggagctggtt 600
ttttgaaagg atcaacaaaa tagatagacc actagcaaga ctaataaaga aaaaaagaga 660
gaagaatcaa atagacacaa taaaaaaatg ataaagggga tatcaccacc gatcccacgg 720
aaatacaaac taccatcaga gaatactaca aacacctcta cgcaaataaa ctagaaaatc 780
aagaagaaat ggataaattc ctcgacacat acactctccc aagactaaac caggaagaag 840
ttgaatctct gaatagacca ataacaggat atgaaattgt ggcaataatc aataccttac 900
caacaaaaaa gagtccagga ccagatggat tcacagccga attctaccag aggtacaagg 960
aggaactggt accattcctt ctgaaactat tccaatcaat agaaaaagag ggaatcctcc 1020
ctaactcatt ttatgaggcc agcatcattc tgataccaaa gccgggcaga gacacaacca 1080
aaaaagagaa ttttagacca atcaatatcc ttgatgaaca ttgatgcaaa aatcctcaat 1140
aaaatactgc caaaccaaat ccagcagcac atcaaaaagc ttatccacca tgatcaagtg 1200
ggcttcatcc ctgggatgca aggctggttc aatatacgca aatcaataaa tgtaatccag 1260
catataaaca gagccaaaga caaaaaccac atgattatct caatagatgc agaaaagacc 1320
tttgacaaaa ttcaacaacc cttcatgctc aaaactctca ataaattagg tattgatggg 1380
acgtatttca aaataataag agctatctat gacaaaccca cagccaatat catactgaat 1440
gggcaaaaac tggaagtatt cactttgaaa actggcacaa gacagggatg ccctctctca 1500
ccactcctat tcaacatagt gttggaagtt ctggccaggg caattaggca ggagaaggaa 1560
ataaagggta ttcaattagg aaaagaggaa gtcaaattgt ccctgtttgc agacgacatg 1620
attgtatatc tagaaaaccc cattgtctca gcccaaaatc tccttaagca gataagcaac 1680
ttcagcaaaa tctcaggata caaaatcaat gtacaaaaat cacaagcatt cttatacacc 1740
aacaacagac aaacagagag ccaaatcatg agtgaaatcc cattcacaat tgctttaaag 1800
agaataaaat acctaggaat ccaacttaca agggatgtga aggacctctt caaggagaac 1860
tacaaaccac tgctcaatga aataaaagag gataaaaaca aatggaagaa cattccatgc 1920
tcatgggtag gaagaatcaa tatcatgaaa atggccatac tgcccaaggt aatttacaga 1980
ttcaatgcca tccccatcaa gctaccaatg cctttcttca cagaattgga aaaaactatt 2040
tttagttcat atggaaccaa aaaagagccc gcattgccaa gtcaatccta agccaaaaga 2100
acaaagctgg aggcatcaca ctacctgact tcaaactata ctacaaggct acagtaacca 2160
aaacagcatg gtactggaac caaaacagag atatagatca atggaacaga acagagccct 2220
caaaattaat gccacatatc tacaactatc tgatctttga caaacctgag aaaaaccagc 2280
aatggggaaa ggattcccca t 2301
<210> 16
<211> 2024
<212> DNA
<213> 智人
<400> 16
aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60
ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120
gtttcttggt cttgaccagc ctctctcatg cttttggcca gacagacatg tcgaggaagg 180
cttttgtgtt tcccaaagag tcggatactt cctatgtatc cctcaaagca ccgttaacga 240
agcctctcaa agccttcact gtgtgcctcc acttctacac ggaactgtcc tcgacccgtg 300
ggtacagtat tttctcgtat gccaccaaga gacaagacaa tgagattctc atattttggt 360
ctaaggatat aggatacagt tttacagtgg gtgggtctga aatattattc gaggttcctg 420
aagtcacagt agctccagta cacatttgta caagctggga gtccgcctca gggatcgtgg 480
agttctgggt agatgggaag cccagggtga ggaagagtct gaagaaggga tacactgtgg 540
gggcagaagc aagcatcatc ttggggcagg agcaggattc cttcggtggg aactttgaag 600
gaagccagtc cctggtggga gacattggaa atgtgaacat gtgggacttt gtgctgtcac 660
cagatgagat taacaccatc tatcttggcg ggcccttcag tcctaatgtc ctgaactggc 720
gggcactgaa gtatgaagtg caaggcgaag tgttcaccaa accccagctg tggccctgag 780
gcccagctgt gggtcctgaa ggtacctccc ggttttttac accgcatggg ccccacgtct 840
ctgtctctgg tacctcccgc ttttttacac tgcatggttc ccacgtctct gtctctgggc 900
ctttgttccc ctatatgcat tgcaggcctg ctccaccctc ctcagcgcct gagaatggag 960
gtaaagtgtc tggtctggga gctcgttaac tatgctggga aacggtccaa aagaatcaga 1020
atttgaggtg ttttgttttc atttttattt caagttggac agatcttgga gataatttct 1080
tacctcacat agatgagaaa actaacaccc agaaaggaga aatgatgtta taaaaaactc 1140
ataaggcaag agctgagaag gaagcgctga tcttctattt aattccccac ccatgacccc 1200
cagaaagcag gagggcattg cccacattca cagggctctt cagtctcaga atcaggacac 1260
tggccaggtg tctggtttgg gtccagagtg ctcatcatca tgtcatagaa ctgctgggcc 1320
caggtctcct gaaatgggaa gcccagcaat accacgcagt ccctccactt tctcaaagca 1380
cactggaaag gccattagaa ttgccccagc agagcagatc tgcttttttt ccagagcaaa 1440
atgaagcact aggtataaat atgttgttac tgccaagaac ttaaatgact ggtttttgtt 1500
tgcttgcagt gctttcttaa ttttatggct cttctgggaa actcctcccc ttttccacac 1560
gaaccttgtg gggctgtgaa ttctttcttc atccccgcat tcccaatata cccaggccac 1620
aagagtggac gtgaaccaca gggtgtcctg tcagaggagc ccatctccca tctccccagc 1680
tccctatctg gaggatagtt ggatagttac gtgttcctag caggaccaac tacagtcttc 1740
ccaaggattg agttatggac tttgggagtg agacatcttc ttgctgctgg atttccaagc 1800
tgagaggacg tgaacctggg accaccagta gccatcttgt ttgccacatg gagagagact 1860
gtgaggacag aagccaaact ggaagtggag gagccaaggg attgacaaac aacagagcct 1920
tgaccacgtg gagtctctga atcagccttg tctggaacca gatctacacc tggactgccc 1980
aggtctataa gccaataaag cccctgttta cttgaaaaaa aaaa 2024
<210> 17
<211> 224
<212> PRT
<213> 智人
<400> 17
Met Glu Lys Leu Leu Cys Phe Leu Val Leu Thr Ser Leu Ser His Ala
1 5 10 15
Phe Gly Gln Thr Asp Met Ser Arg Lys Ala Phe Val Phe Pro Lys Glu
20 25 30
Ser Asp Thr Ser Tyr Val Ser Leu Lys Ala Pro Leu Thr Lys Pro Leu
35 40 45
Lys Ala Phe Thr Val Cys Leu His Phe Tyr Thr Glu Leu Ser Ser Thr
50 55 60
Arg Gly Tyr Ser Ile Phe Ser Tyr Ala Thr Lys Arg Gln Asp Asn Glu
65 70 75 80
Ile Leu Ile Phe Trp Ser Lys Asp Ile Gly Tyr Ser Phe Thr Val Gly
85 90 95
Gly Ser Glu Ile Leu Phe Glu Val Pro Glu Val Thr Val Ala Pro Val
100 105 110
His Ile Cys Thr Ser Trp Glu Ser Ala Ser Gly Ile Val Glu Phe Trp
115 120 125
Val Asp Gly Lys Pro Arg Val Arg Lys Ser Leu Lys Lys Gly Tyr Thr
130 135 140
Val Gly Ala Glu Ala Ser Ile Ile Leu Gly Gln Glu Gln Asp Ser Phe
145 150 155 160
Gly Gly Asn Phe Glu Gly Ser Gln Ser Leu Val Gly Asp Ile Gly Asn
165 170 175
Val Asn Met Trp Asp Phe Val Leu Ser Pro Asp Glu Ile Asn Thr Ile
180 185 190
Tyr Leu Gly Gly Pro Phe Ser Pro Asn Val Leu Asn Trp Arg Ala Leu
195 200 205
Lys Tyr Glu Val Gln Gly Glu Val Phe Thr Lys Pro Gln Leu Trp Pro
210 215 220
<210> 18
<211> 26803
<212> DNA
<213> 智人
<400> 18
cttgctctgt cacccaggct ggagtgcagt gctgtgatca tggttcactg cagccttgaa 60
ctcctgggct ctggcaatcc tcctgcctga gccttctgag tagctgagac tatagatatg 120
ggccaccaca cctggctaat ttttaatttt ttttagtaga gatgaagtct tgctatgttg 180
accaggcttg tgggagttca gtcaggctgg tggaaaaaat tttaaagata gttataagaa 240
atagacacaa accttcttgt aaggctggag agggtttaca ttgcttcagt aacagatttg 300
gctgaaagca gcctaatcct ctctaccttt agctgatagc aaaaatgaaa ataacaaggg 360
aatgtgagga agtttatcta aatagcttgc ttactcatgt ggtcctaaaa ccaaactttg 420
atcaacctca ggtgcataat tgctctctac tcagggggtg agcaatgtta attaccctct 480
agtggtgttt actcgagacc tttgtcattt aatctgtatt aaataaatgt gaactttgct 540
agcttattga ggtgatgctc cagatgcaga gcagagcccc ttagccagac tgacaggcaa 600
aatatctgtg tcagtgtatg tctctcatcc atcactggtt cagggtctgc gggctggatt 660
cctgcacagg ctggtcttga actcctgggc tcaagcaatc ctcccgcctg agccttctga 720
gtagctgaga ctacagatat gggccaccac acctggctat ttttaacatt ttttagtaga 780
gatgaagtct tgctgtgttg cccaggctgg tcttaaactc ctgggctcaa gagctcctcc 840
tgccttggcc tcccaaagtg ctgggagtac aggcatgagt catggtgccc agacggacat 900
ttttttaaaa ataaaggaat actcctgaaa cgctgaagtc ttctttgtac ccctctgtga 960
taacatgaat agcctcttaa tgacaccaag gagcaagaca agttagtccc aaagtagctc 1020
acatagatga tgataaagga atgaggggtg ggtgtgatct atgcaaaaaa cccttactct 1080
ttaatgggtt gctgtttcta acataattgc aacagtaccc tacattgcta taatgcatta 1140
tagttttcaa agtgcttttg tggcctccat aatagagagg ttgtgaggta agcttcaacc 1200
acggctgccc tactacccaa gagtggacac acaatgatga ataggtcaat ttctgcctct 1260
tagtttctta gctagggagg ggcacttact ggaacagcac agaaaacaga gtctttggcc 1320
cagttggaga atctttatca ggttatgcta cttcaagctt tcctcctgtt aaatgtgaga 1380
ggaataaatc cctgttcctt ggatcagtgt gactctgaaa cagctggagg agagacagct 1440
ttaggcaggt tgaaacagag agctccagca tatgtacttt tttttttttt ttgagatgga 1500
gtctcgctct gtctcccagg ctggagtgca gtggctcgat cttggctcac tgcaagctct 1560
gcctcccagg ttcatgccat tctcccgcct cagcctccct agtagctggg actacaggct 1620
cccgccacca cgcccggcta atttttttgt atttttagta gagacagggt ttcaccatgt 1680
tggccaggcc agtcttgaac tcctgacctg aggtgatcca cctgcctcag tctcccaaag 1740
tgctgggatt acaggcgtga gccactgaac ttggccaagt gcactacttt taaaagttaa 1800
agtattatgc agccatgagg gaatattgtg caagaagaaa gcttttacaa gaaaaacttg 1860
aaacattggt atttttgcct cctttttaac aactagagtc gttttgggag ttgtttcttg 1920
tcgaagaaac aacccatgtt tattttccca gtatggcagg accatgtagg aaagcaaaat 1980
tacccctcag gagaggaaat tctctgacac tctataaggc tccataaccc tcctctgaac 2040
tgtggccaac aagattgggt agcacttttt aaggtagttt aagaaaaata ggctgtgcat 2100
ggtggtttat gcctgtaatc ccagcacttt gggaggccga ggtgagtgga tcacctgagg 2160
tcaggagttt gagaccagcc tgaccaatat ggtgaaaccc catctctact gaaaatacaa 2220
aaattagccg ggtgtggtgg cgggcacctg tagtcccagc tactcgggag gctgaggcag 2280
gagaattgct tgaacctggg aggcggaggt tgcagtgagc cgagactgtg ccactgcact 2340
ccagcctggg tgacagagca ggactccatc tcaaaaaaaa aaaaaaaaaa aagaaagaaa 2400
gaaaaatata tagtgagccc aataaagctg tataatctaa atcaaacatg acttgcatgc 2460
ctggagactt tgcactagaa aaatatttct acctaaaaaa tcaaatttta ttttctttct 2520
cacaaatatt caatctgctt tcatctcagt tcttcctacc ttgtcaaacc tctccccaca 2580
tttcctattc tttttctctc cagcctgata tctctcatta tactgcttaa gagaaatgtt 2640
atgttactat tcttttctcc cagaactgtt tctctggttc tttaaggtgt ctgagtacac 2700
actgtgcctt cttcctttta gccctctctt ctccttgttc cctgagcctt acctttatga 2760
ccttagaact tcaagttccc actacaattt taaatataga ctattttgct tttcctccta 2820
ctagggagct taaattgcct ctaattacac tgttttcccg agtccttcct ctcctttgca 2880
atttagatat agcacagaag cacattttgc ttgactgtcc tctgaactgt catgctgttt 2940
tgatgtggtt ctattgtcca agagtcttgg ttaaataata gcccagcatc ccacctgtgt 3000
ttaaaagaac tgcttcacag gcaaatcaaa aagcccatgg atccgaagtc acaatgggcg 3060
ttgctattca aacagcacca gattgctatt caacgcttgg ttgaaaaata aatttcagtt 3120
tcattcacct aatatatttc cttctatttt gtaggatggt atgctcttac ttcaatttgg 3180
acttgttcac aattgaacgt taacatagcc ttatagatta gcctgttttc attggtccag 3240
agtattctcc aaataaagca gggtctgtgc attttaagca actcccctga acaatttcat 3300
gggcattctc aaatttgaga actacctgaa aagctgtgtt ggagaaaaga acaaccaatg 3360
aatgtggcag gacagaatat tgaacattaa cttccctttt cctcttctcc catctgttct 3420
cttccattat ccctacccgt ccgctcagtc tcgttattca ggcaacagtt attttgccat 3480
tatttcctca agaaaggaac aaaagtaaac acaattgctt tctgattttt tttttttttt 3540
tgcattttaa aatggacttt gaaaccataa gcaaagaggt gtttaagagt ctttccaaag 3600
ccaaaaatga aggttttgaa atttcaaagt cactgccttg aagagactcg aggtttggag 3660
tgtgtacagt atgtcggagc tggacttttc tccttcctga gactagataa cggtctgaat 3720
ccaagacagt tttcatgatt tcagaggaag tggtcaagtg gtctgtgagg tagaccttct 3780
gcttaagagc agtcaggagg ccgggtgccg tggctcacgc ctgtaatccc agcactttgg 3840
gagaccgagg tgggcggatc acctgaggtc aggagttcaa gacaagcctg accaacatgc 3900
agaaaccctg tctctactaa aaatacaaaa aattggccgg gcacggtggc acatgcactc 3960
cagcctgggc aacaatagtg aaactccatc tcaaaaaaaa aacaaaaaaa agagaagaaa 4020
agaaaagaaa aggagcagtc aggatgtgtg cctccaaagc tgaggtagac aaaaagatac 4080
cagagttcta gaggcctgcc aggcacagca gcagcagcag aaggaaggtg tgggcgagaa 4140
cagggcagcc aggcgtgtgc cacctcccag acacaattat tgggaatgga gggcaagtgg 4200
tgatgggaga aaatcttgac ttaattgatg tcaagattaa agaaatgcca cctggtggca 4260
tttaagttca cacataggta aagaaagtta tgcatttact gtgaaagtca tcccactatt 4320
tagtagaaac aggagatctg gattctggtc aagagtctct tttgccaact gtggcaccac 4380
tgagcagcgg cacagctttt gtgaatcctg ggttcttcat tattaaaatg gggacattag 4440
cgttgggttg agtataagaa atggacattt ttgcaggtca aaaatggttg aatatttgca 4500
ttttcatatg attcaaccga atacttactt cacaggcata aggaaaaaaa tagaataaca 4560
tactaacaac tgtccctgga gtaagtactt aacaaataca tgatttataa agaagatatg 4620
tgaaagatat ttgtaagtac atgatttata gaaagatatg aaagtatgta aacccttgtg 4680
gtctaatggt cacagaataa tctgagctta atatccctgc tccctaccat acagaaggca 4740
aaatgcctat taggggtttt ctttcttcac cctctccttc tttttcctcc tcctcttgac 4800
tcctcctcat cctcctcttt cttcttcccc ttattaatgt ctaaaaaggg gctgagcatg 4860
gtggctcatg cctgtaatcc tagcactctg ggaagctgcg gcaggtggat cacctgaggc 4920
caggagtttg aaaccagcct ggtcaacatg gcaaaacccc atccctacta aaaatacaaa 4980
aattacccag gtgtggtggc aggcacctgt aattccaact acccgggagg ctgaggcagg 5040
agaatcgctt aaacccggga ggcagaggtt gcagtgagcc aagattgtgc cactgttgtc 5100
catcctgggt gacagaggga gactctgtct caagataaat aataataata ataataattt 5160
ctaaaaaggt aatacatttt catagttcaa aaaccaaaag gtataaaagg aaatacagta 5220
aaaaatttcc tatcatatca ctgtctagag tactattcct tatatatttt cctgattttt 5280
gagtatttta aaatgtgagt gttggatatg agtgttggat ttaaaaagtt ttatgataat 5340
ttgtgtatat ttgtgtgtgt gtgtgtgtgt gtgtgtgtgt atagtagtcc aagactatca 5400
gtttatgaat aataagagga gacccatgga aaaccagtcc ctttgaccaa gttcactcag 5460
ataatcagca gcagggcttg gacattaatt acagttatcc aacatccttt gaggtctcac 5520
atgacaaatt acaaatatgg agtgtaaatg taacccactt tgctaggcaa aaaaagccct 5580
gtttttttaa aaaatatata tttttggctt atgggcaaca gaagccaggg agacgtacag 5640
tcaaacctca tttctcatgg ctttcatatc tgcaaattct cctactcatt aaaagttatt 5700
tataactccc gaatcaatac ccacagcact tttgtgatca ttggcagaca tgtgcagaaa 5760
agaaaaaaaa attgagttgt tgattgcaca cattcccagc tgaatttcaa caaagcaaca 5820
ctctgccttc ccacttcagc tttcttacta tatgtgtgtc ctttttctgt ttatttagta 5880
ccatgttttt cacactttcg ttctttttgg tggtgatttt gctgtttaaa atggccaaca 5940
agtgtagtgc taagtgctgc gtagggttct taagcacaag aaggctatga tgtgccttat 6000
ggagaaaata cgtgtgttgg atcagtttca ctcaagcatg agttatggcg ctattagctg 6060
tgagttcaat gttaacaaat caacaatata tgctaaagtg tctttaaaca gaaacacaca 6120
taaaacaagg ttatatgttt ggttggcaaa aatgttataa ccagaagctt gcagaaacct 6180
aaccctgtat ttcccttaag agcaatggtt cattattcac taattcaatg tttacagcaa 6240
ctttataaac tataactacc atgaataatg agaattgact atgttttaga tcataatacc 6300
tgaagtgaag ttttccatca tggtttttag ttcttagagt ccatttaagt tttttaaaaa 6360
tatgatagct atcctatcac atcccacatt cttgagatta aaaaattaat cttttatttg 6420
gtacagaaaa ggctcctgcg tgcatttttg gaggggctgg accgctgagg aagtcatggt 6480
tggctcaagt ggtttaaatg cattgctaat ttcatagcct ctgaaccact tatgaaacaa 6540
tactgatgat atgtcagtag ctatgtttgc agctccttca ggaatgctta tatcttttac 6600
tgctggtaaa gaagaaattt atagtaatag attttttttt tttttagata gagtctcact 6660
ctgtcgccta ggctggatta cagcggcttg atcacggttt actgcagcct ggatctccca 6720
ggctctccta ctgtagcctc cccagtaact agggccccca cacaggcatc accacaccca 6780
gctcattttt ttatgtttta tagagacagg gtcttactat gttttccagg ctggtctcaa 6840
acttctgggc tcaagcaatc ctcctacttt ggcctcccaa agtgctgaaa ttacaggcat 6900
gaaccactgc acctggttta tggtcatctt aagtagagac ttatgagtgc gtatcattgt 6960
atcaccaatc tgagactcaa ttttatcttt ctgttaatag acaatgcagt ttttctgtta 7020
attacaatga aaatcaaggg ttgcttagca agtttttact cataactcca agttttgtga 7080
cttatagtga gaaatgggta taattctttg tgatttgtta aaatgcagta tttcgaggag 7140
ggataacata taaaatttaa cagtttccta tcattatttt tatccttttg aaccactgta 7200
tactacagat agacaaaggc agctttggcc acttactcct cagtgtgact aagttgacca 7260
gatgttttcc agaccacagg ttctgtcaag agacagtgtg gagagaaatg ggtaggcagg 7320
tatggaaaga agagtcagaa acagatagtg agctaatctc tacaaatggc tcgttatggc 7380
ctgagctgtg ttctcctccc cgcaaaaaga tatgttggag tcgtaatccc cagtacctca 7440
gaatgtggcc ttatttggag attcgatatt tacagaggta agcaagttaa aatgagatca 7500
ctatagtggg tcctaattca atacgactgg tatccttaca aaaaagggga aatttaacca 7560
cagatacaga cacacacata gggagagtgc tagtgaaggt gaagtcagag attggaatga 7620
tgtagcagaa gcctaggaat gccaaagatt gccagcaaac caccagaagc tgggagagcc 7680
acatggaaca gattctcctt cacagtcccc tgaaagaacc aactctcctg acacctcgat 7740
ttcagacttc tagcctccag agctggggtc aatgagcttc tctcattaag ccatcatcca 7800
gtgtatggta ctttgttaca gcagtcttag caaatgcatg gttcctcact ggaaccatga 7860
atttccatgc atttatttca tttaaataat aaaacggatc ccctttgtgg cttgtagttc 7920
tgttccattt caaaaatcca gaaaaaagat ttgttcagaa gctagaaatg atgaactgga 7980
tcttgcccaa ggtcataaaa ccacaaaacc ctttacagag cacaaaagtc tgatttttca 8040
aagcttctct caaaagatgg gtcactcctt agtcatttag gccactgaca actgccctgg 8100
actctttatt tatttattta tttatttatt tatttaattt ttttgagaca gagtcttgct 8160
ttgtcgccca ggctggagtg cagtggcgtg atctgagctc actgcaagcc ctgcctcccg 8220
ggttgacgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cacccgccac 8280
cacgcccggc taattttttg tattttgttt agtagagaca gggtttcacc atgttagcca 8340
ggatggtctc gaggtcctga ccttgtgatc cacccgcctt ggcctcccaa agtgctggga 8400
ttacaggcgt gagccactgc gcctggcctg gactcttaca tataataagc ttgacttatc 8460
gtacaactta taattgatgc tttcacgtca tgggaagatc aaattaatgc agagagcgac 8520
tacgtttctg gtgggagagc agcaggggtc ttgagaggaa cagcagtgtt gactgtttcg 8580
ctacctactc tgggtgctga ttacatcttt ctttcgtgca ggcaaatcca cttggagcta 8640
ttttgggctc actgtgggca tcattctttg tatactctgc tcctttcccc catagtttct 8700
ctattgatgg gggattacta aagaatgaag aaaagaacaa aatgaaagtg gcttttgaaa 8760
aattttaaat gactgtcact atgtaacata ttcattattt catgtctcca ctggacattt 8820
tggagatgtg agccttgcaa tacctacatg aatgcttcta tgattatgat tattgttttg 8880
ctcttcgcct aacaacttgc caagtattgt caacctcagt gtgtgagatg gggtccactc 8940
aaacatcagg gccgaagtca ggtagttcag ttaagtgaat ttgataccag gaactagtta 9000
caaaggagtt ggaagggctg gaaagccaaa ctggagaaga aggggaaccc cagagtaaca 9060
atagcaggaa gcctctaccg tctacctcta gaactgggga ggagctgagt taacagagtc 9120
ctggagccat tgctggggaa gaagaacccc aactgcagag gaaaagtggc cattgtgaag 9180
aaggtgatgg tggagaagtc gtctgaatca aaggggagag gatatgttgg ctcctttatc 9240
tttttatctt tcattgtcct aattccttct gggcatggtt aaatgagccc aggaaatgca 9300
gttggcagga atcagcttcc tgtgacatag acagagtaag agaaggacaa aaataatgaa 9360
tctgagagca agcaggcaaa tgaccagcac attaagccta gcacacagta tgttatacgg 9420
gatttggggt agcaaaagat gaaggcaggt cagagaagcc acaactaggg gatgggcaag 9480
gtcaatgagg tatgacgggt attgtataca ggaagagggt cataaacagg agtggagtca 9540
atacaggaga ctaacatata cacatcataa atattagtag agaagcataa aatagtctcc 9600
tggagatcag ggaaacagga aattataggt tttcaggata attcagccat atccaggaaa 9660
cacacacagt gaagtaacaa agagtcaata ggcttagagt ggtacaattc attatgcaca 9720
tgtaggaatt cattccaaat aataggctga aatgtagaca tgagaatcca aaaaagatgt 9780
tttcttagtt tttgccaata tcttagctac gttttttttg gttcaacaaa gtaagttaac 9840
agtcatatct gcttggaaat tgtatttagg ccaggtgcag tgtctcacgc ctgtaatccc 9900
agcacttggg gtggctgagg caggaggatc ccttgagccc aggagttaga ggctgcagtg 9960
agcgacaact acaccactgc attccagtct gggtgacaga acaaaaactt attaaaaaaa 10020
gaaaaaaaaa aggtcgggcg cggtggctca cgcctgtaat cccagcactt tgggaggtcg 10080
aggtgggcgg atcacgagtc aagagatgga gaccatcttg gtcaacatgg tgaaacccca 10140
tctctactaa aaatacaaaa attagctggg catggtggca tgcacctgta gtcccaccta 10200
ttcaggaggc tgaggcagga gaatcgcttg aacccgggaa gcggaggttg cagtgagctg 10260
agattgcacc actgcactcc atcctgtcga gactctgtct caaaaagaaa aaaaaggaaa 10320
agaaactatt gaaatagctg atattagttt gcttacttgt cgttactctt tttcatgatg 10380
gattataaag aaaagttata actatttgaa ttttctgctg atttgaagtc tctataaaca 10440
gtacattcct ttttggtaca cagagggcac ttatctgcaa gaaaggcaaa gaaaatggaa 10500
aagttaatga aagaggaatc atccaatcca cgaacagaat gaaaccacat acacagtgaa 10560
gaaacttgtc ttacattttc ttccttatat tacttatcat tcatggtagt gactactttg 10620
gggcttgagt aaagcttctc taatttattc catgtagcat catatgtgaa aaagacaaat 10680
agatacttta gacatgataa taacacttta ttttttattt atttgtttat tttgagacag 10740
agttttgctc ttgttgccca ggctggagtg caatggtgca atctcagctc actgcaacct 10800
ctgcctcctg ggttcaagcg actctcctga ctcagcctcc caagtagctg ggattacagg 10860
cacgcatcac cacgcccagc taattttttg taattttagt agagacaggg tttctccgtg 10920
ttggccgggc tggcctcaaa ctcctgacct caggtgatcc acccaccttg gtctcccgaa 10980
gtgctgggat tataggtgtg agccaccatg cctggcccat aacaccttat ttaaaaataa 11040
tctgtctgga tccatacaac ttgtctggat aactaaattg gaaattattc cttgttttaa 11100
agtaattcaa ttgaaaattt ttaaattttt ttgttaatca agcacttttt ggtggaatct 11160
aaattaacac atgtaggaga tgcctgtttc actaattaca caggcatctt gcagtaatta 11220
atgtctggga ggaaggaatg tcttttgctt actctcttct tcttcacaaa aatgtgaatt 11280
ttggaaagca ataatggaag catgtagaat tatagaaata caaatgtata taactatcac 11340
aaaaaaatga ggccaaagga ctattcagat ataattaggc tatggtagct gtaattatct 11400
aggaaattaa taaaattcat tcacctagaa attattagtg agcatcaaat atgtgtcagc 11460
actaggctag ggtctcagaa cgtacagata aatcatagtt ctggcttcag ggagttatat 11520
agattagaga taaaacctaa ctacaggggc tgggcacggt agctcatacc tgtaatccca 11580
ccactttggg aggccgaggc gggtggatcg cctgaggtca aggagtttga gaccagcctg 11640
gccaacatga taaaatcctg tcactactaa aaatacaaaa gttagccggg aggtagtatg 11700
tgcacctgta atcccagcta ctcgggaggc tgaggcagga gaatctcttg agcctgcggt 11760
ggaggttgtg gtgagctgag atcacgacac tgcactccaa tctgggcgag agagtgagac 11820
cctatctcaa aaccccaaac aaaacaaaca aaaaaaccaa acctaactac agggctatga 11880
gagatgacta ctggcaagga gccacaggta gaacaaaggg gatgtgtccc caggcaaagg 11940
gtagtcagca agcctgcaac ctcagggttc ccggatctga gcctctggct cttggctagg 12000
caggccccaa gcgttggcct cctgccatgg caagctccag cctggtctcc caccttgagc 12060
taacattcat atgttgtaga cacagccacg cttcctgctt acctgtcact tccagttctc 12120
gaaggcaccc ttttcaaatg aaaatccgcc ccttttcaca tcaaacagct catctggtcc 12180
tgtggattac atttctcaga aatgcctctg aacattcgcc tcctctccac ccccactgcc 12240
tctgctacag tgcaggtgct cgccatttct gatttgttct gtcacacact cgtttatcag 12300
gtctctccat ctcctgtttt gacatgctgt aaagcaattt gccactggaa aaaagggctc 12360
tctttttttt tttgagacgg agtctcgctc tgctgcccag gctggagtgc aatggcatga 12420
tctcggctca ctgcaacctc tgcctcccaa gttcaagtga ttctcctgcc tcagcctccc 12480
taaagtctgg gattacaggt gcacgccacc aagcccggct aatttttgta tttttagtag 12540
acgtggggtt tcaccatatt ggccaagctg gtctcgaact cctgacctca ggtgatccac 12600
ccgcctcggc ctcccaaagt gctgggattt caggtgtgag gcatcgtgcc cggcctctct 12660
ttccaaagta tgttattatt tttcccaaga ccctttgacg gatcctcatt tcctacacac 12720
agtggttctc aaacttggat gtactccaga attacatagg aaattcttca tttttttaga 12780
cgaggtcttg ctatgtttct caggttggtc tcaaactctt gacctcgtgt gatcctccgg 12840
ccgcagtctc ccaagtagct gagattatag gcgtgccact gagcccagct ggaaattttt 12900
ttaaaacaca gattcctctg aatcaaaatt tctagaagtg aggtctgagc aatctgtatt 12960
tttaacaagt tatccagatg gctctttact gtcagtctgg ttccagctga gggagtttta 13020
gaattacaag gcaaagtcca aacttagcac acaaagtcat tcacatcaac tcttcccctg 13080
tacacaccct atgtcatagc cagagttgta acccatttct taaacaccca gggttctttt 13140
aagtctctgt gtcattgtat gttattttct ctagaattgc ctttaacctc ctttccaccc 13200
tggaaagcat tccctaagcc atctttgaag ctttctttga tctctaactt agagtcctcc 13260
tctccttcta aagccctgtg ttaatcactt gtcatggtgt actttaattt ttacttgcct 13320
gtttctcttt acggtacttt gacttcaaag ggtggggctg caaattagtc atctccttag 13380
agtccagcct tgttcctagt tcctaactgg cacttaatat aaacgaatga atgaatggac 13440
aaatgaagag aatgctagtt atgataaaga attggccgtg tatgagacta cttctcttta 13500
tgaactaaat aattatatgc ctttcaataa aatactagta cacgtagcta gcacaagctc 13560
atcagcattt gagatgatat ggaaaccaaa ataaacaaat gctaccacaa aaacataatg 13620
actgctttcc ccagtgcagg actgatggaa tcatcaaaca ttgagattaa tgtaatgttt 13680
ggcagatgtc cagtgttttt atttttcatt tgcctttgtg ttcatttatg gactaacaat 13740
ataataaaca cacacatact cacagtacat cttttttttt tttttttttg caaagcccag 13800
ttttcttcat cgcatatctt tgttttcttc aagtatcccc ttacttaatg ttggtagtat 13860
tttttttaat gaaatataaa tccctaacca ccaagcaaga aatgagactc ttaattgcat 13920
cagtttacag tgcaatgtga gtgtaaatag tgtaaattga atttttaatg gacttttttt 13980
tttcccgttt ttgcttgcct tacattcatt atccctccct gggtaataaa catttatttt 14040
tccctttgta accactcctc cccttctgtc catgtggttc tttttagtgg agctggtggt 14100
agggatgtgg catgagattc aagcttggcc acctggagtc actgtgttgt gctccagaag 14160
gacacctgat ccaagtcagc cagtaagagt gagccccagg atttttgctt ggaccactga 14220
ggaaaagtgt actctgccct gtggctgatc aaccattagg atataagcca ttgttgtagc 14280
tgtgtgagtc aagctacctg agaatgagga caacacagtg gcaagcaaca ccaagagaga 14340
aaaagaggca gattctgatg acatttttga gcctttgcat ccagctatgc ctgaatccaa 14400
tttatcccct ggaatttaca cttacttgag ctccacccac ttgaaagaaa acatttcttt 14460
ttattcttag cctgatttga atttggcctc tctcatttac tacccaaagt gtcttgacca 14520
ctagaatatt atgccagact ttacagcatc attgaatttg ccactttcca gaagagttgt 14580
gtgaattttc aatgtagctt ttaccttcta tgagtatcta gagatatatt taagtagaag 14640
tactccacta gtttgttgtg agatcttaag tcacttaatt tctctgtacc ctagttccct 14700
catttgctag acctagggag ctataatgtt ccttctgcaa aattcttatt ttgtgaaata 14760
ttctagaatg tctaactgat acactgctag aacaactgac tgctatttaa gaagagttga 14820
ctgctattta aggatcataa ttctctaggc ataagtgctg tgacggcaca gcgtgtgcat 14880
cggggctgag gggtggggtg gagcagaaag taggaggaga aagtttgata aacttccttt 14940
tggataaatt gaaaacagtc aaataattta taatttctta tattatcatt attagcttct 15000
tctataatta ggagacttgt tccaaaatgt gagaattgtc acaagttgtc aaattcatca 15060
aaggaagaaa atggatgtct cacaaaaaag tatgctcagt ccaatttctt ctcgtcacac 15120
tggaacaaac tgaacagttt tacacagaga tgagaagcct ggacattttt caaatatgtt 15180
ttgaagagaa tggcaatgcc tgagacagaa gtaggaaaaa gcaatgaata tttaaaaatc 15240
tgagctggtg taaaactaga aatagtttta gtaagaacaa tgtgatgtgc tacactaagt 15300
gaaatgtata cattgggcca cattataatc aaaaataaga atgtactttt attcatcttt 15360
tatttaaaca ataatcaagg tggcgggcgc ggtggctcat gcctgtaatc ccagcacttt 15420
gggaggccaa ggtgggtgga tcatgaggtc aggagttcaa gaccagcctg gacaacgtgg 15480
tgaaaccccg tctctactaa aaatacaaaa attagctggg tggggtggca tatgcctgta 15540
ataccagctg ctcggggggc tgaggcagga gaatcgcttg aacttgggaa gtggaggttg 15600
cagtcagcca agattgtgcc attgcgctcc agcctgggtg acagagcaag agactctgtc 15660
tcaaaaggaa aaaagaaaaa aaaaaaatca aggtaccatt tgtaccattt cctggaattt 15720
ctccaaagtg gcaaggtcac atgtttatac attagactcc cagtttaaca cacagcagac 15780
aataactttt tttttttttt tttgagatgg agtctcgctc tgtcacccag gctggagtgc 15840
agtggcacaa tcttggctga ctgcaacctc cgcttcccga gttcaagcga ttctcctgcc 15900
tcagcctccc gagtagctgg gattacaggc atatgccacc atgcccagct aatttttgta 15960
tttttagtgg agatggggtt tcaccacatt gtccaggctg gtctcaaact cctgacctca 16020
taatccagcc acctcagcct cccgaagtgc tggtccaccc ttccttcttt tctcccttcc 16080
atccttctcc cttttattcc atttttctaa atattagacc atagtacaaa tcaaaagtca 16140
caaactgata ggctgcaatg tagatacagc tgggaaaatg ttttgtttgc agaacactgg 16200
ggaaatttaa catgaaaaac tggaagatct caatccacat ggccacatgg taatattatt 16260
aatgttgcag gggctttcca attcaacatg tcctctgcat ccctactatt tatactgcca 16320
ctcatccacc tttctgtatt actggcctat cacctataca cgtttgagtt tatattcttc 16380
tggctttact tagcaactta ccttttatat ttaacattac aacatggtat tatcaattag 16440
tattcgattc agttgcatat aaccaaaaat gccaaattat actggcttaa acactaagga 16500
tttatttttc tgtcatataa aacaagtctg gaggtgggta gtccagggct aatatgacac 16560
tccagtgtca caaggtacct gggctccttc tatttatctt tttttttttt ttttttgaga 16620
cggagtcttg ctctgtagcc caggctggag tgcagtggtg cgatctgggc tcactgcaag 16680
cttcgcctcc cgggttcaca ccattctcct gcctcagcct ccggagtagc tgggactaca 16740
ggcgcccgcc accacgcccg gctaattttt ttgttatttt taatagagac gaggtttaca 16800
ccgtgttagc caggatggtc tcgatctcct gacctcgtga tccactcatc tcggcctccc 16860
aaagtgctgg gattagaggc gtgagccacc gcgcctggcc ctatttatct tttataggac 16920
atggcttcca gtctcaagtt cagtttgtca cccataatgg ccaaagagca gtagtcacct 16980
tacctgtttc aggcaggaag ggcagagggc aagaaacaaa atggtgctcc tcctgattga 17040
gtcagcgttc tttaaagatg ttttccagat gttccaccca gccgcgtttt tttttttttg 17100
agagacaggg tcttgctctt gtcacccagg ctggagtaca gtggcatgat catggctcac 17160
tgaggcctca atctcccagg ctcaagcgat ccttccattt tagcctccca agtagctgga 17220
agtagctggg accacaggca catgccacca taccctgcta actttttcat tttgtgtaga 17280
gacaaggtgt cactgtgttc tccaggctgg tctgcagttt ccaactcctg agtgcaagtg 17340
atcctcctgc tttggcctcc caaagggctg ggattacagg tgtgagccac tgtgtctggc 17400
caagctactt ctacttatat ctcattggtc ataacttgat cacacagcca catccagcta 17460
caatggagat tgagaaatgt agtcttttgg ctgggtacac agcatctgaa taaaatccag 17520
gcattgttac taaggaagaa ggagtaagtg tcaatctctg ctccataact ctctaggtta 17580
atacacacag atggaggaga ttgctagttg cccctcaaga tccagccttg ccttctgggc 17640
taagaaagcc cctgagattt acctggccat agtggcactg ggaacaaaca atgtatttct 17700
aaatcttctg attttaaaat ctttcagaat cacgatttct ccgacatcag tatttttatg 17760
tctttagaat tcaacaaaat gaaattccta agtctaatat atgtgaatat taagttttag 17820
cagatactgc tacataactt tccagaaggg tgtggcaatt cacatctcca ccagtgatca 17880
gcatgttcat tttccataca gctctggata ttttgtctat tttaaaatat cttcttctaa 17940
tctataattt aaaaatgtaa cttagtagga atttaattgt tcatgtaacc aaatcttccc 18000
attaatggct atgggtttct tcttttactt cagaaagtcc tccccacctt cagagtatat 18060
aaacattttt ttctaaattc ccttctaatt tcttataatt tatagtttta tttttgttat 18120
ttgattcatt tattctctca acagatattt attgagcact tattatacgt caggctctct 18180
tcaaactctg gtgagagtat tttctaactg ggagagacaa ccctagttga taagaaacaa 18240
acaaaccaat aagtaaataa gacatttccc ccagataatt aatacttggt gacgggggaa 18300
gacagtgaga caggctactt tacactggca ggtcaggaaa ggcttctctg aggaggcaag 18360
tgattcagga ttaattgatg actggtggag aagtccgggg agtggacaca ggtgggaaca 18420
gcctggtggg tgtgaacagc aacaagaagg ttaatgtggc ttcatggaac agggtgaaga 18480
tgagacaagc tgaacactga ggtgggcacc agaacatgga gggctttgta ggtcccaata 18540
aggagtatgg attttattgt atactggaga tttgtcatcc atctagaatc tgtttttata 18600
tataagaaaa ggtgtatatg tttgcgcaag tgtgtgtgtg tgtgtttggg ggggcggggt 18660
gggggcagac agggcgtaac ttttctttaa attagagtca aaatttaatt aaactattca 18720
ttctttacag gcagtgaggg gattaggatc ttatcccaca gaatctcacc tcatttcaaa 18780
tgttgtacag atattatctg agatatattt tcaggccggg tgcggtggct cacgcctgta 18840
atctcagcac tttgggaagc cgaggcgggt ggatcatttg aggtcaggag ttcaagacca 18900
tcctggccaa catggtgaaa ccccatctct actaaaaata caaaaattag ccgggtgtgg 18960
tggtacacgt ctataatccc agctacttga gaggctgagg caggagaatc gcttgaatcc 19020
aggaggtgga gcttgcagtg agccgagaaa acgccactgc actccagcct gggcgacagg 19080
gcaagactct gtctcaaaaa aaaaaacgaa aaaagaaata tattttcaat gaaatcaagc 19140
atataatgac tatttttatc ccagcatctt ggcttcttca ggctgctata acaaagcatc 19200
cctagtggag catccctaat ctgaaaatcc aaaatccaaa acgttccaaa atctgaaacc 19260
ttctgaacac tgacatgaca ccacaaatgg aaaattctac atgtaaatac acgtaaatac 19320
aaactttgtt tcatgcacaa attaaaaata ttgtataaaa ttaccttcag gctatgcata 19380
taaggcatat atgaaatata aatgaatttt gtgtttaccc atgggtctca tccccaagat 19440
gtttcatttt gtatatgtgc atactcccaa atctgaaaaa atccaaaatc ttaaatatct 19500
gtagtcctaa gcattttaga taagggatat tcaatccctt atccataaac aatttattta 19560
taaacaacac aaatttaggc tttgtaaaaa atagaaattt ggccgggtgt ggtggctcac 19620
gcttgtaatc ccagcacttt gggaggccga ggcaggcaca tcacttgagc tcaggagttt 19680
gagaccagcc tggtcaacat ggtgaaacct tgtctctacc aaaaatacaa aaattagcag 19740
ggcttcgtgg catgcgcctg ttgtcccagc tactcgggag gctgaggcag gagaattgct 19800
tgaacccgga aggcagaggt tgcagtgagc caagattgag ccactgcact ccagcctggg 19860
ggacaagtga gactccacct caaaaaacaa acaatcaaac acaatataaa tttatttctc 19920
atagttctgc aagctgagaa gtccaagatc aagatgtgag cagatccacc tttggtgaag 19980
ggctgctttc catttgatag atggctgtct tcttgtgtcc tcacatggtg gaaagggtga 20040
ggcagttttt tgaggtctct tttaaaagag aactaatccc attcatgtgg gggtctgccc 20100
tcatgaccta atcactttcc aaaggcccca cttcctaata ccatcaccct gggggttaaa 20160
ttttcaacac acaaattggt tggagagtga gcgaacatag acattcagtc tatagccccc 20220
agggatgtag ccactgaata aaataatcta gaacttcatc tagaggcagt ttataagtca 20280
cataagaaaa ccagttttac ttatagtcac ataaaacttt tgataaaaaa caaccctagt 20340
tgataagcca tttgtttact ggacttggct ctgaagaaat gacttttggc taatcctcaa 20400
aatgaaatct actcacagag ggcaagatct gccaccagtg aagatgttta aaacaatgtg 20460
ctgtaggctt tgaaggcaag tctaaagaag agcttctaaa aatattttgc acaatggtag 20520
cattaaaaga gtaggcacat gggccccaag ataacatctg tgaagaggag gaccagtgtg 20580
tgtttccttt tgtatgttta agtactaagt cagtgattac tttataatta aaccatattc 20640
ctcttgatct gtccataata aggtcactct gtaatttata ataggcttct taccaaattc 20700
aagctttaca acaaccctat aggttaaata ttcctgtgaa ttttatagat gaagaaacag 20760
agtaagtgaa agagttcata ctcaattcaa gtctcttgag tctaaaatca gtgctctctc 20820
tacataagaa gttagttgct aagatcacac aacttgagaa gagagaagac agttttcaca 20880
gtccctcccc tctgaccact aggctgcttg gggtactttt acaacttacc tgctctgaat 20940
taaggctctc tgtgaatctg attcatctgc caatttgcaa acagtcagcc ctgtagtacg 21000
tacctaagtt gatttttaaa atactatttc tcatcttaaa ataatggaaa ttgagtgaca 21060
taaatttcct ggacactttt taagatccaa agacaatttg ctaatttgtc gttacaatta 21120
aagagccccc caaaaggcgt aagaactgga ttttgacttg gacttctgtt ccttagtttc 21180
tttaacatat tgggggccgg gagtggtggc tcacacctgt aatcccagca ctttgggagg 21240
ccgaggcggg cagatcacga ggtcaggaga ttgagaccat cctggctaac acagtgaaac 21300
cccgtctcta caaaaaatac aaaaaaaaaa aaaaaaaatt agccgggtat ggtggcgggc 21360
gcctgtagtc ccagctactc aggaggctga ggtaggagaa tggcatgaac ccaggaggca 21420
gagcttgcag tgagccgaga tcgcactaca ctgcactcca gcctgggcga cagagcaaga 21480
ttccatctca aaaaaaaaaa gaaaaagata ttgggaaaac tcacttaaac tctatgggct 21540
tctgtaccac taaggcttct caaatttgat gcaagtaatg ggaacttgct gtggctaact 21600
tgagccacag gagaaggata ctgcaagact cacaaatgct tgaaagtttc ggaacaggtt 21660
tggaaatggg taagaaccaa ggaccgggtt gacctgaact gaaaggaaat tgaggtgcta 21720
ttagggacaa atatgaaatg aaggatgaac tgtctctgac atcctttgct tctgtgtttg 21780
gagatgagta agcagggagt gggtgcatat gcaaacaggg tggtcagaaa tgctttggcc 21840
ggatgtgtga ctgaaggcta tgtgcagctg aggaaggctg ggccaccaca gtagcagaga 21900
ggctgaccaa tttggcatgc agcaagcagg aagtagaagg gatcttaagc aagcaaagtg 21960
tttgggtaga caagattatg aggaatgagc accaatgaca tttccaacaa gcactgaaag 22020
cttccaaatg cttctaacag ttactgcctg tacaaacaca ggacagtctt gactatgtga 22080
gactgtgaca gtttcctcat gcctatgaaa tgagagacag tacttagcac tgacatgagc 22140
ttcatatttg aaggcagcaa actactgaac cacatgtagc ttccgaaatc aaaagatgca 22200
aactggcaga ccacaggtca gatatgacat gcagaaaaaa attagttact atcttagcct 22260
agtttgtgct gcttacagaa tatcagagac tgggtacttt atagagaaca caaattattt 22320
ttcatagttt tagaggctgg gaagtccaag atcaaagggc catcatctcg tgaaggcgtc 22380
cctgctgtgt caaaacatgg tggaaggcat cacatgggca aaagagagag agggaagcgg 22440
gggcaaactc ctttttatca ggcacccagt cctgtgattc attcatgaag acagtgtcct 22500
cctggcctaa tcacctctta aagctcccac ctctcagcac tgttgcactg gaaattatat 22560
ttctcacaca tgaactttgg ggaacacatt caaaccatta cagttaccaa agataaaaat 22620
gcagatttca gatttctctt ggggaagaaa aaaggctctg gcaataccag ggctgtattt 22680
ccacatggca acagttgtct gttgccttct gttgggttgt gggctctcac attgccatac 22740
cctcctcatg gcccccttca ctcataacag tacctgccta gacctcgaag cactagtttc 22800
caaccctgct tgagttaact acttccatga caactgtgca aggccagagt gtgggcagct 22860
accttgaggg ccaccggcat gggctgccca agtgaccgag ggcactaacc tctgctctcg 22920
aaacttcttt ggtaggatct cttcactcct gacttactac ttgtaactgc tggaaacaac 22980
catttattct acccctacta aaccacatct gtcttttctg tcagagccaa tcttcaagca 23040
tatgcttcct caaaagactt taattaccag gtagtagaag cggcagcaaa gagtccccat 23100
ctagcatctt ctaaaatgta gtggagaaac caacgacaac gaatctgaga caaccagttg 23160
tttgacttct ctgaaaacaa cctctaaaaa aagccttctc tcgtgaatag ctgcagacat 23220
gctgggcact aattgatgat gatgcccttt agtgagtctc ctctgcacat acctgattcc 23280
atttggatgc tggccctcac atacttctat ctgcgaactc cggaacacag aatatcatac 23340
aatgtatgat tcaatctgga ctctgctgga gccattctct acaaagcaga cacaactttt 23400
tcttgcctaa atcctttcaa gttgctttat ttttattttt aaactaatta ccataaatct 23460
aatttatcaa gctgctttta agataaactt taaaatgctt agagcagtct acaaattctt 23520
gcactgtttc actcttcctt atctctcagt cttcatctcc cattgcatct tctctgactc 23580
tttcatatgg atcttctttc aatttgtgga agaagccaag cttgttcctg cctcaggtcc 23640
ttgacacttg ctgttcactc tcctgggaga ctcttccccc catcttagct tttaaatacc 23700
agctggtcag actccttacc tgccttccac cttcctctca ttctcccact cctcgccttc 23760
atttctcaga gtcctccgct ctcttctttc tattgctctt aacacaattt gtctgttttc 23820
cgctaatctg taaactctac aagagcactt aactattttg catcccaccg aatattcgga 23880
gtcagcacag accccgtcat aatagagtag gtaagcaatg cttacctgtc aaatgaatga 23940
atgaaacacc cgattcatcc cccaagccag cttaatacat tagatgatct tatggactga 24000
ataagacatc cctcctttta aagaatattt ttgttttagc ttcacatcag caaaccccga 24060
acggttcatc ctaagataag cctggtagag aggaaagata ctaaccttct agggtcctaa 24120
agtggaacta ggaacttatt agatatgcac attctcaggc attatttccg atagcccagt 24180
cagagaattc tgggggtatg gcccagcaat ctgttttaac aaacctttca ggtaattctg 24240
atacacacta aagtttgaaa ggtttcttta aggctttcca gttttctttt cttttttgga 24300
gggatggggg ggggtctccc catgttgccc aggctggtct cgaactccta gcctcaagct 24360
atcctatcct cccacctcgg ccttccaaag cattgaaatt acaggcatga cccactgcgg 24420
ctcgcctccg tttctaactt aaaaaaattt tctttggagg ggagccttaa tcctttctat 24480
tatcctgcta gtagaatctt actactcctg agggtaatct ttgtcataat ccaaaagcct 24540
tgaataaagg cctatttgta tagttatgca gaatatattc ctgggaggtt tgccttccta 24600
ggagcacagg tcggccctgg gaggtggggg ttggggggca gggctgcatt ctaaagtcct 24660
gtaacaacgc acaagtacaa ctgaatagaa ctcggaacaa aggcatcagg gccacggtgc 24720
aagtctttgt tcatccgttc cccgactgct caccctgtct gataccgctc ttttccaccc 24780
agaaaagcag ccactcaagt tttaagaatg gatgtatgcc gcggacgttt tcgattaggc 24840
cgttttctct caggcactgg aggatattcg tggctgcagg aggcgcttcc accctttcct 24900
caacctagca aagaagtaac tgaaactaac ccaagggtta caaccgaaaa gccccttcca 24960
gcttcagaag cagaactgga agctcggata gacttctccg cctctacact cctggaaaac 25020
ccgcagtgga tttcaccaac ttcaggatcg gagcccaggc aggcgaacgt accttattgc 25080
gcatgctcgc tagcccctcc cgctcggagc ggaaggggga gcgctggggg cctgggcctg 25140
gcctggccgg ggcgtcggca ccggcggcca tcttggcttc ccggggaaag gcggcgtgag 25200
gggaagaagt tgtagggtgg gggcaggagt gaggaggagg gaagagagag ggggaggagg 25260
ccgcggcggg gcagggcggg gactgcctgc ctgcctgggt tgcggaagtg atagccgccg 25320
accgagcctg ctgctttctt gctactgctt cggcttcccg gctacccccc ggacggtgaa 25380
ggcggcccag ctgtggatgg tcagatagcc cttgtctccc gccgccaatc tctggcccct 25440
agcagcacgg agcagacggc ggcagcagca gcagcaggcg aggaggaaga tggcgggacg 25500
gctgccggcc tgtgtggtgg actgtggcac ggggtaaggg ggcttacggg cgggggtggg 25560
gaaactgagg cggaggaagg aagatggcgg gggagggagg aggccgggaa atgaatggtg 25620
cggcgaggtg ccgccgccgg ctgtcagtcc tagacccgcc ggccagcgag gggtggggcc 25680
cgcagccagg gcctcgcggg tcccctcgtt tctccctcct gggactgggg cgggggcgcg 25740
ggcccgagat tcaaccccca accctcccag cggctttctc cgcgcgaccc ctcccggccc 25800
ttcccccact acggtgggca gcgccgccca aagggcgctg gggacggtcg tcttgggggt 25860
ggtccccggg cccgacccat ccggctttcc tttccctccg cgcccgtttt tgccagtcgg 25920
tttggggacc caggggccga gctcggggac tggcctggca ggggagctag aaaagagaag 25980
cgctcctggt aggtttgaca agatcgctgt gacaacattc tgcccagggt gtgggtgggg 26040
aaagggaaga atcggactct gaaaatggga acctacagtg gggctttcat ttgaccaccc 26100
accttctcct ttcgactcct ggtcatttcc atctccctct gcgttttaac cggtgaacca 26160
agtcacattt taattcgagg gagaaagatg tcatgtgtta cttctgtagc ctcaaaaaag 26220
tcccccagtg agcaagcgcg ctgcaacttc cttagttttg tcaaagccgc ttcctgcttt 26280
cagtctttta tacccttata aggtagtttt tagtttccaa cctgagcaca tcttactaga 26340
acttttaagc aggttttaaa gagactgaat taccggtgct tggtgtccat ttatatgact 26400
taaaaaaatg tacttatgtt tcatggagtg ggggaaagga agcaccctgg aaaataaact 26460
aatttaagtt gtattcgttc attctgtgat ggtatcttga aggaagcagg aaggtataga 26520
ggtatatagg agggtgttta agttgcaaat agttactcgt agatatgtag ggtagtttgc 26580
gaaaatgtag agtggcttta aagtgtggtc gttcattttg tattaataga cgttttagag 26640
agttgtacca cactcataac tgcatagaga atagactacc cttattttta tgtagaatca 26700
ctgcttcagg atgacatata ggaaagtggt ttttttttct gtgctgatga catctctcca 26760
attcccagaa cactcccagt tttttttttt tgagggggaa gtc 26803
<210> 19
<211> 26803
<212> DNA
<213> 智人
<400> 19
gccgcaccta ccgctggcct cagacatcag caccccaaag ggtatgttgg agtcccatgg 60
tggaggtgcc ggccgctcct ccacgcactt gatgtatacc gaggatccca tgcttgacgt 120
cgcagggggc attagccagg agcacgttgc tgggatgcca gtccaggctg aggatggtgg 180
agccaatggg cttcttgatg tacttgcaca cccaccagtt attctcccgc tggaaataac 240
agatggcgat gacacacagc tgccgcccac agcaaacttg tcctgtgggc ccagcacaca 300
cagcaggcag tgggtgcggg cttaccctcc tggcccgtca gcgtccacac agaggccttg 360
tggcctgtgc cataggtcac gatgaggtta ctcttggagg cccagttgat gccttttacc 420
tgcccgttgt gctccttgag ctcgggcacc ttggcccact tggccccact cttacagctt 480
cgtggttgtt gaggcagatg gtggccatct gggtgcggcc cttgctccag gtttggcagc 540
aatgggttcc tgcagtcagc tgtgggaggc tgtagttgct ctccttttca gagtacccca 600
gctgcagact ctgggcagga cgcacccaac cagtgctctg gttttttgaa gtaaaaaatg 660
cataatgcaa ttttaccatc ttaaccattt tttaattatg aaatccggta gtgttaagta 720
taattgtgtt gttgtgaaac agatctccac aactttttca ttttgcaaaa ctaaataact 780
cctctttccc cctactccca agctccaggc agctaccatt tctgtttcta tgaatttgac 840
tacttatatt acctcatata aaggggttca taagtatttg tcttttcttg cttggttaca 900
tcacttagca tgatttctta agtttcattc atgttgtagc acatgtcaag atttcctttt 960
ttttttttaa aaaaaaggat gaagactatt cgtttgtatg tatatgccac attttgttta 1020
tccatccatt tttcttcaaa tgtttgagtt gtgtgatgtt taattatgtg tcaccttgac 1080
ggggcaaagg gttgcccaga cagctggtaa aacattattt ctgggtatgt tagtgaggct 1140
gtttccagaa gagattagca tttgaattgg caggctgaat aatgaagatc tgccctcatc 1200
aatgtggatg ggccagaaca aaccaaaaag gtggagaaag gaccagttat ctccccacca 1260
cccctgtgcc ctttagctgg gacatccatc ttctgccatc agacatcaga gcttctggtt 1320
ctcaggcctt cagactccag aagttatacc agtggcttcc ctggcttttg gactcagact 1380
ggggtttcac tgtatgtttc cctgattctc aggcctttgg acttgaattg aattacagca 1440
tgaactttcc tagttctcta gcttgcatat ggcatattgt gggacttctt gacctccata 1500
atcatgtgag ctaattccca taataaatct cctcttatgt atctataatt catatagata 1560
tgatatctat atatcaatcc catagataaa tagatgtctc atatatatat caatgtctct 1620
atatgtagat gtctcatata tggtatctat gtatctgtat catctctata tatctaatca 1680
tctaatatag atgtctcatg atatctatat agatatatct atatcataga tgcagagata 1740
tcatatatat gtctgtttct ttggagaatt ctgactgata caggttgctt ccgccttttg 1800
gctatcatga gtaatgccgc tgtaaccatg ggtatgcaaa tacttctttg agaccctgct 1860
ctgagttctt ttgggtaaat acccagaagt ggattgctgg atgatttggt ggttctactt 1920
ttaatttttt gaggaaatgc catactgttt tccataatgg ttgcaccatt ttataatctc 1980
accaagagtg cacagggttt caatttctct acatccatac caacacttat tagtgtgtgt 2040
gtgtgtgtgt gtgtgtgttt aatggctgtc ctaatgggtg tgaggtgaca tttcactgtg 2100
gttctgattt gcacatctct gataattgct ggtgttgagc atccttccat atgcttgttg 2160
gtcatttata tatcatcttt ggaaaaaatg tctattcaag tcttttgtct attttttttc 2220
cttccaactt ttattttagg tctgggggta catgtgcagg tttgttacat ggataaattg 2280
tgtgtcatgg gggtttggtg tacagattat ttggtcgcct aggtaaatga gcatagtacc 2340
tgataggtag ttttttgacc ctcccccttc tcccaccctc caccctgaag taggccccag 2400
tgtttattgt tcccttctta gcatctgtgt gtagtcaatg tttagctccc acttataagt 2460
gagaaaatgt ggtatttggt tttctgttct tacattaact tgcttagaat gatggcctcc 2520
agcagcatcc atgttgctgc aaaggacatg atttcgttct tcttatagct gtggtgtata 2580
tgtaccacat tttctttacc cagtccactg ctgatgggca tctaggttga ttccatgtct 2640
ttgatattgt gaatagtgct atgatgaaca tatgtgtgca tgtgtctttg tggcagaaca 2700
atttacattt ctttgggtat atatccagta atggggttgc taggtggaat gattaattca 2760
cttttaagtt ctttaagaaa tctctaaacc tctttcccca gtggctgaac taacttacat 2820
tcccaccagc agtgtccaag tgtttccttt tctgcacaac cttactaaca tctgttattt 2880
tttgactttt taatgatagc cattctgact catatgagat cgtatctctc tgtggttttg 2940
acttgcattt ctctgatgat tagtgatgta gagcattttt tcaaatgctt gttggccgca 3000
tgtgtcttct tttgagaagt gtctgctcct gtcatttgcc cactttttaa tgggcttgtt 3060
tgttttttgc ttgttaattt aagtttcatg tagattctgg atattagacc tttgtcaaat 3120
gcatagtttg tgaatatttt ctcccattcc ataggttgtt tactctgttg atagtttctt 3180
ttgctatgca gaagctcttt agtttagtta ggtactactt gtcaattttt gtttttgttg 3240
ctttgtccat tttaaaaaat agagtaattt gattattttg ttgttgaatt gtaggaattc 3300
tttatatatt atggatgcta acatcttatc aaatatgatt tgcaaaacat tttccctcat 3360
tctgtaggtt gccttttcac tattgtgtcc ttcaatgaac aaaagttttt atgtttgatg 3420
cagtcccatt tgtccatttt ttttggttgc ctgtgatttt ggtgtcatat ccaagaatgt 3480
ggaatgtgtc atatccacat tcaatgtcct gacgattttt ttctatgttt tcttccagaa 3540
gttttattgc tttgggtctt tggtttaagt ctttagtcca ttttgagtta atttttgtat 3600
gtggtgtaag aaacaggtcc aactgcattg ttttgcatgt aaatatccag ttttcccagc 3660
atcatttgtt gaccagactg tccttttccc atttagtgct gttggagctc ttcttggagg 3720
tcagttggcc atgtgtacac aagtttattt ctgggctctt tattctgttc tattgatttg 3780
tatatctgtc tttattccag taccacactg ttttattctt ctttttcaaa attgtttgac 3840
tcttagggcc ctttgagatt ccatatcaat tttaggatga attcttctat ttctgcaaca 3900
aatgctattg gaattttgat aaggattgaa ttgaatctgt agactgtttt gagtgatatt 3960
aacatcttaa taatattaag tctaatccat gaatgtgaga tgtttctatt tatttatctc 4020
ttctttgatt tctttcagta atgttttata gttttcatta tataagtttt tacttcctta 4080
gtcaatttct aagaattgtt ttctttttga tgccattgca acgggaatca ttttcttaat 4140
tttttcagat gctttcacta tttgtgtata gaaatgtaac tgattttttg tatgtgtgtt 4200
gattttgtat ctggtaactt tactgaattt ttaaatttgt tctaacctgt tttttttttt 4260
tggtggaatc tttaggattt tctgcatata agatcatgcc atctacaaac agaaattttt 4320
acttctttct tcccaatttg gatgcctttt attgcttttt cttgtctaat tgctttggac 4380
tggagttcca atactctgtt gaatagaagt gtccagaaca gacatttttg ccttgttctt 4440
aatcttagag gaaaagcttc cagtttttca ctgagtatgc cgttagctgt ggacttttcc 4500
taaacaacct ttattatgtg caggtaattt ccttctcttt ccacttttga gtgttttttt 4560
tcttttcttt tctttttttg tgtgtgaaag gatattgaat tttgccaaat gcttttcctg 4620
catcagtgga gatggtcatg tgggttttgt cctttattct gtaaatgtgg tgtactacat 4680
tgattttcat atgttgaacc atccttgcat cccagggata aatcccactt gatcatggtg 4740
aatgatcttt tgagtgtgct gttgaattta ttttgctagt atttttttga ctacgttcat 4800
cagacatatt gggtaattat ttattttttc ttgtagtatt tttgcctagc tttgatatca 4860
cactaatgct gcccctcaaa gaatgacctt ggaagtattc ctttctcttc agtttttggg 4920
ggattgatgt aaattctttt tttttttttt ttggagacag ggtctcactg tcacccaggc 4980
tggagtgcag cggcacaatc atagctcact gcagcctcta actcctgggc tcaagcaatt 5040
ctgcttcagc ctcctgagta gctgggacta taagcatgtg ccaccatgca cagctaattt 5100
atatatatat aatataatag ataaatatat atatatatat atatatatat atatattttt 5160
tttttttttt tttttttttt tttttttttt tgcagagaca aggtaggtct tgctatgttg 5220
cccaggctgg tctcagactc ctaggctcaa gtgaacctct cacctcagtc tcccaaagtt 5280
ctgggattac aggcatgagc caccacgtct ggccagtgtt aattcttcaa tatttggtag 5340
aattcttcag tgaagtcttc tagtcctggg cttttctttg ttgggaggtt tttaattacc 5400
aactcaattt ccttactagt tattggtcta tttatatctt ctatttcttc atgattcagt 5460
cttggcaggt ttggtgtttc tagaaattta tccatttctt ataggtcatc cagtttgttg 5520
gtatagttca tagtcttctc ttataatcct ttcttatctg tagctcagta cctcctatct 5580
ggagatgcag aattaggaat tgaaactata ataggccccc cttttataat ggggtgtcct 5640
tatttttacc ttctcacctt gcaataccct tgtcttgcta gtaaagaaag aagggaaatt 5700
tgattcagga ggtaatcata cttttcaatt tgtacaagat ctaatagcca tgaactccta 5760
tgtcattcct caccatccca taattcttag cccagccatc atccttacct caatccctgc 5820
tggtgcagcc tggtttattc tgttaatgtg ctgtactgca ttgaggtaag gacttctgct 5880
cagctttctt cttgatacca ttgtaccttg attcacactt cctcttgtga aataaagttt 5940
agcatgaagc tgctttctta catattttaa gttcggctta aaggtttttc tgtacatcgt 6000
gaactgtaac aagtggaata taaccagacc gtagcttaca cttgtgccat ttaccaagtt 6060
ttggccaatc aaatgtagcc aactgtttga actgtattca aataagggaa atgctcagct 6120
gtaaccaagc caactgtttc tgtacctcac ttctgttttc tgtatgtcac tttccttttt 6180
ctgtccataa atcatcttcc atggcgtagg tgtgctggag tctcagagtc tattctggct 6240
caggaggctg cctgattttg aatcattcat ggctcaatta aacttcttta attttttttt 6300
tttttgagat tgagtttcac ccttgttgcc caagttggag tgcaatggtg cagtctctgc 6360
tcactgcagc ctctgcctcc tgggttcaag cgattctcct gcctcagcct cctgagtagc 6420
tgagattaca ggcacatgcc accatgccca gctaattttt ctatttttag tagagacagg 6480
gtttcgccat gttggccagg ctggtctcga actcctgacc tcagcctccc aaagtgctga 6540
gattacagat gtgagccact gcacctggct tcactccttc aaatttaatt cagctaaagt 6600
ttttattttt ttctctttct tttttttttt tttttttgag acagagtcac tgtcacccag 6660
gctgaagtgc agtggcacaa tctcggctca ctgcaacctc cgcctcccag actcaagcga 6720
tttctggcta atttttgtgt ttttagtaga gatgggtttt caccatattg gccaggctga 6780
tcttgaactc ctgacctcag gtgatctgcc tgccttggcc tcccaaagtg ctaggattac 6840
aggcatgagc cactgtgccc agcctcaaat ttaagaagaa acagttaaca tggacttgca 6900
tacctccagg atattgtgaa tacctctcaa tatttttcta agttctcaaa gtcaaattag 6960
actctatgac aatcactcaa ggttcccttt gtttccaata tgttgatgac ctgctacttt 7020
gcaaccaaag caaacagggt gctcttctgg actcccttac tcaccttaag gcactgactg 7080
actaaggtta taaatcttcc aggtccaaat gccaacaggt acaaaaaatt cttacctact 7140
taggccataa aatattttag ggtactcaaa aactcgtccc aaaatgcctt gaatcaattt 7200
tattcattat ctctcaaaga caaacaatta cgtgaatttt taggagcaac tggatattgc 7260
caatggattc ccaattttgc tgcccatgtc taacctttat atgctgtcct cttagataca 7320
accacagagc actttacctg gtactctgag gcaccagcct ccttggaagc attgtccaca 7380
ccccagccct tcgactaccc aactttgaca atctttttta cctatattac tgtgaaaatg 7440
atgggattgt tgtgggtatc ttaggacaat ctttttgtcc cataacatat ttctcatgtc 7500
aacctagata tgtcccacag tacctttctc atgttaagta gcatcaggca ttcctccatg 7560
cttatatgca atagacttag ctgccatcct aattgacaaa gcaagtattc ttatactgcc 7620
ccaccattca cctctctgtt ctccatgctg ttcctctaca ttggtatccc tttcaaagtg 7680
gatcttgcct caactaaccc ttaactgttt tttttttgtt tttgtttttt gttttttgac 7740
aattctggca ctaccccaac acctgcttgt tccaatcttt caaagcctgg ccaccttaaa 7800
tagttaatct ggttactggt taggttaaca tctacataat gcagaagagt ttttgttcct 7860
accaatgtaa atatacctgg tgaacccatt ctggacaatg gatatataaa agcatatggt 7920
atccataagc aggaagacaa agtcactctg tctcctcctc tggtagatta atttggcact 7980
gggaagcctc catggaagct caaggtcagt gctttaccca agtaagacta ttggaaggaa 8040
atctctctac attgaaaata aatacagtac tggacctttt ctgggtaaca tttcaaaaat 8100
gtattgcaat caaattctgt gatttggctt cacagatggc actaaacaac cctccactgt 8160
cattgttact tggattataa ctaagtattt caatgtgagt gaatgtcaga ttacaggata 8220
atattcctgg tttgtaggaa aaagtagtgg gatatggaat agctcaagtg ttcccctagt 8280
tggcttgacc agcacccatg actatagttg gatggatgga ccttaacttg gtcaataaat 8340
aaaatacatt tctatagtaa ccaaggctaa attaaagggt ttctctgcca ggtgtttcac 8400
aacctgtttt accctcatag cctaacagaa gcacattgga agtgaagatg tgcagatgcc 8460
aacatgattg atgataaggg ttgtgaaaga cacagaattc caacttggtt gttcacaggt 8520
tccaccacta tgaccttgtc tgtaaacaac actggtctct ctctcttttt tttttttttt 8580
agaaggaatc tcactctgtt acccaggctg gagggcagtg gcacaatctc agctcactgc 8640
accctccacc ttccggttca agcgattctc ctgcctcagt ctcccgagta gctgggagta 8700
caggtgccca ccaccatgcc cggcttattt ttgtagtttt agtagagaca ggatttctcc 8760
atgttggcca ggctggtctt cacctcaagt gatccgccag cctcggcctc ccaaagtgct 8820
gggattacaa gcgtgagcca ctgtgcctgg cctggtctca tttttatgta gcaataagat 8880
atataaaagg ttcccaccta agtggtcaga gaaatgtgaa gttggatatc tggtgccttc 8940
ccttaccaga tatcccactt tgaatgctag ccacattaca actggggttc ttttatatat 9000
aaattaatgc catgtagatg cacctgatga gacatcatag acaacgcact tatgtattgc 9060
aaccctaagt tctcagtaat gagaatgctt ttccaaagcc tggcaatgta cgatgtagaa 9120
agaacaatcc taagcattcc aaagtaatga acaagcatct ggtgccacta tacagactgg 9180
gaagcctgcc atttacaagt tagcagtgta gcctctgttg cactccaaaa ttgtgtccta 9240
gatatgctga ctgcccaaca gagaggagct tgtacaatca ctggcaacaa tgctacttct 9300
atataaatta gaaaggaaaa attgtgtcta atctatatca tttaaaaaga aaggttggcc 9360
gggcacggtg gctcacgcct gtaatcacag cacttcggga ggccgaagcg ggcggatcat 9420
gaggtcaggg gatcgagacc atcctagcta acatggtgaa accctgtctc tactaaaaat 9480
acaaaaaatt agccaggcat ggtggcgggc acctgtagtc ccagctactt gggaggctga 9540
ggcaggagaa tggcgtgaac atgggaggcg gagcttgcag tgagcagaga tcacaccact 9600
gcaccccagc ctgggcgaca gaacgagact ccgtctcaaa aaaaaaaaaa aaaaaaaaaa 9660
aaaaaaaaaa gaaaggtcaa cattctacgt taggtaaata aggcatagtc caattaactg 9720
aactgaactg acctattccc acgactggga gactggttca acagaatatg gaccagtgtg 9780
ttcagatttt tctctgttgt aatctatgtt cttctttcat tttgcagatc tcttacctcc 9840
cagcacctaa tatgagtctt ttctacatag gaaataatcc aaatatttgt gaaacttcat 9900
gtgaagtttc aaatggggga agtgaaggaa cgaacaaccc acctcctaac cccaatttat 9960
acccacctgt gttagttcat ttgtattgct atgaagagat acctggaggc tgggaaattt 10020
ataaagaaaa gaggcttaat tggctcacag ttctgcaggg tgtataggca tggcatcagt 10080
atgtgctcag ctcctggtga gggcttcagg gagcttacaa tcatagctga aggtgaaggg 10140
ggagcatgca tcttacatgg tgatagaggg agcaagagag agggtcgggg ggtgccaggc 10200
tctttaaaca accagctctc atgtgaaata ccagagccag aactcactca tcaccatggg 10260
gatggcacta agccattcat gagggatctg cctcatcacc caaacacttc ccagtaggcc 10320
ccacctccaa cttggggatt gtatttcaac atgacatttt gaggggacag atatccaata 10380
ttcaaaccat atcaccacca gaaaggcata aagattactt taaactgaaa atattggaac 10440
aaacaatcgc tgcggaaagc agccttatct gaccgaaagc agacctgtcc aagagttctg 10500
ctatcatcaa ctccttctga gggactttcc agacagcgag gtgacagatg tttacaaacg 10560
tgacgttaaa aaataaagtt gtgtaaatga gtcttatcag aaccttttat actttctcac 10620
tgaagcctca gttggtatat aaacccttac cactggctgt ttgggaagtg actccttaca 10680
gagtgctccc tcaggcatgg agaataaact tttctcctgt taatgtattt tcaactaatt 10740
cgcaggccct agaccactca gatctaagtt gacagatgaa atgttttcct cccaacatga 10800
ccaagcttat agtgctttta tggtatatct gtagagattg cggtcaggca taacattgtt 10860
tgttagggtt gcagtacctt tcaggaaatg ctcaaagttt aattgattta ggggactttc 10920
actggatgag atgcctctct gagtcatcat aggttgcaaa gtattagttt tttgccactc 10980
actgtgtgtt gtgatatgac atactcataa tggggtagga caagatgtca gttttgcttc 11040
caaactttcc ttacttgttt cctttttggt tcaccactaa tgttgaagaa atgcaagatg 11100
gaaaatctca atagttgaca ctgattgatt gattgagatg gagtctcact ctgtcacctg 11160
ggctggagtg cagtggcgtg atatcggctc actgcaacct ccacctccca ggttcaagca 11220
gttctcctgc ctcagcctcc cgaacagctg ggattacagg tgcccgccac tactctcagc 11280
taattttttg tatttttagt agagatgggg tttcaccatg ttggccagac tagtctcgaa 11340
ttcctaacct tgtgattcgc ccgcctcggc ctcccaaggt gctgggatta caggcatgag 11400
tagttgacat ttattaagtg tttatatgtg ataagcactg ttagattatc ccatgtaata 11460
catcacttga ttgatttaag agattgtcat ttgaaagatt aaagaatatt tcccagaaag 11520
gatgcttggt caagcctcat catcctggga tggatgggac cttggttttg ggcaagttta 11580
ttacaattta agactattct aggtcatgga agtgtgtgtt aggacatata agtagttttc 11640
ttgtccagaa tactttgtaa taatataccc taagtttgat cagctttttg gcattcactt 11700
aattaaaatg ttcacaagta ggtacatttt tagaattgtt aagtaatata ctatttgtag 11760
tagcaaaaca ctacaaacaa atacctaata taataagagg gagtggttga ataaactagg 11820
gcatgtcaac taaaaaacat atttgaaatg cagggaaaat gcttactcta ggcaatagtt 11880
acaacttttg tccattatag gtacataaag gaaaagagta cacaaagaat tctattaatg 11940
atgaaattag gaacaatgtt cccatcccca atttataccc aaaagaaaat atgttctggc 12000
tgggcgcggt ggctcatgcc tgtaatccta gcagtttggg aggctgagac aggtggatcg 12060
cctgagctca ggagttcaaa accagtctgg gcaacatggc aaaaccccgt ctccaccaaa 12120
aatacaaaaa attagccagg cgtgatggca catgcctgta ggtccagcta cttgggaggc 12180
cgaggtggga ggatcgcttg agctcgggat gtggaggctg cagtgagcaa agctcacacc 12240
actgcactct agcatgggtg acagagtgag accccgtctc aaataaataa ataaataaat 12300
gaaaacttat attctataac atgtattctt atgtctttgg ctaaaacaaa agagaagaaa 12360
aataagtaga gagctaagtg aagtgaagtg tcttgaaaca gataagccat aaagtgagat 12420
atatgagtaa atgagtagtt gctggcctag gaattgtttc tgatgttttc acctattgaa 12480
agaatttttt tctttttgta aatctttttt ttggtttgtt aaactgaaaa ataaaagcaa 12540
tgaagagata atattgctgt agtaatgtcc cttagtgcat ccttggagtt agttgtcttg 12600
aatttggcct gctctgattg tcatttgctg tttgctgcat tgaaaaaatt tcagatttac 12660
aaaaatatgt gtgccagggt ggaggaaatt tttaacttga tgaattctca cctttaggac 12720
actgtctgct cttatatggc acttagcaag atgctgcaac aattgtccct gctcatactg 12780
ttggaggaag agggtatttg cagggagatt gctggagtca agatgatcca aatttaaatt 12840
gcagtggtga gcagtggcca ctagagggct gtgaagtact taattctaaa atttccacat 12900
tttaatctgg agcagaggaa actctggaag gaccactggg actaagggag ctcaatccca 12960
aacatcttta tctgagccct aaatgtcttc tacgttattc tttgacaata ctttgttaca 13020
tctcagaatt tgtagttttg aggtggaggt ttaagttaga aatagtttaa tatattctat 13080
tccagaatat aattcgcttt tttccaaatg aaactggcac taaaagcttt ttacttgaaa 13140
gcaaatacac ttcatatgct ttatgtattt ttgtccctat atcattgaaa tagtagattc 13200
aaggctgttt gtaaaaataa gtgactatac tgcatatagg aatagcccca ccttaaagac 13260
tttgatttta aggacattaa gtgggagggt cttttttgcc tttttttttt tgactatcaa 13320
aatactttca catttcttca attcaaagaa caactgttct aaatttagaa gacagacaag 13380
tgaaagagaa tatgctgcca tttccgatgg ttctttttta ctcttgatcc atcactctcc 13440
tgtctttggc tgactctttc tccaaaaagt accccttatt tttcctatgc ctttaacttc 13500
tgttttactt actctattgt agaactttga gaagttgtac accacattca ctgctacctc 13560
acattaactc tgcttactca ttgcagtctg ccttctgctc ctcaatgatt gctcctgtga 13620
aggtcatctt tggtttagca cttgtttgaa atctaatagc ctaaatgcac atcgattact 13680
gtttagaatt caaacgacat ttatttattt actttgagat ggagtttcat tcttgtcgcc 13740
cagctggagt acaatggcat gatcttggct cactgcaacc tccacctccc aggttcaagc 13800
gattctcctg cctcagcctc ctgagtagct gggattacag gcaccctcaa ccacgcctgg 13860
ctaagttttg tatttttttt agtagagatg gggtttcgcc atcttggcca ggctggtctc 13920
gaactcctga cctcaggtga tctgcctgcc tcagccccac aaagtgctgg gattacaagc 13980
gtgagccacc acgcccggcc caaatgacat ttatttttaa aagcaactaa accaggaaag 14040
accttcactc attcaatcaa aaaacatgca ttgaacacgt attcttggct agatccggtg 14100
ctgcaaagat gaaagacgcc actcctagcc tcaaggagct tgcagtttag tggtggcact 14160
ggatgtaaaa taatcataag atgtgaggtg aagactgatg aggtctattt tgttgacaca 14220
ggtaaacatt ctcagagaat atttaattag caacatgaca aaaattagtt gatttatttg 14280
aaggatattt aagtgaattt agagatgaga tttgttttta cttttttaat ttcagagagt 14340
tatgttggtt gcaaaaatct ttgttttcta gtatctattt tataagccat ctgagaccag 14400
gatgttttct ttttaacatg taaacttgat gcagtctctt tgtaaagtaa tgaatccccc 14460
cgtgaacctc aaggagaaga aagtttagct tgaacactta atttcaagta ccttgagaag 14520
ggaacaggct gtattgctca gagaagaagg ctctattagc taaggtagaa ggacaatgta 14580
aaactcttgt gaagacacct aaatgtcatt ccactcaaag cccattatta ataatttgaa 14640
actgtctgct ctgtgaaggc aacgacctat ctttactcat ttttgactct gctaacattt 14700
ctttttatag ttgaactaga ggcaaggcaa ggaacttgac atgcttgttt tccctttaga 14760
ataaagtggc cagaagcagt ttcttctgtg tgatccaaca ctttcttatc cccagagcaa 14820
ctctgcatag tctagatgta ccagagccca gcagcctgtg aggtgatgtg atgtgatgtg 14880
atgtgaacag aaaggctcca tgttggatga tgcctatgaa tctaatcaga ttctctttct 14940
tggtcatttt gatttccaga gaaggcagta gaagcaggtt ctgtgtgtat aaccagagac 15000
tagagggagg aactgacagg gaagctgggt catgagagtg gtgtgctcag cagagtaggg 15060
agtaagagag agctggctcc agagaggatg acaaaatgcc catgtctcca gcacttcttt 15120
agcattctga gttcccatcc tatcatgaat aggaagagtt ttctagctct ccatgaagcc 15180
gaaataggtt tcagactttc ctttctttcc cacacacata ataaataccc atcaggtaac 15240
ctgggcatgg ccttttattt aggcactaac aattctaaaa ggaattaata aatgcttcac 15300
tgccatttca cagtgtaaca gcatgccagt ttaccatacc attaacattt agcctcgtgg 15360
tatttctgtg ttttttcagt cagtaatgat ggcatttttg ccaagataat atagtgttaa 15420
actgtattgg ttgaaatcct aggcttttta aatgtaaact agcactttac aaagtattac 15480
aaaggaaacg aaccagggaa acttgagaag gaactttctt atccacattg ttataggtta 15540
taaaatagtt cctatttaaa ttaaaatacc tactgttgca cttttatgtg tgtttttata 15600
tataaataac atctgggttg gcaaatatgt gattttcgtc aaataggctt tgattgaaga 15660
tgaaatattt ttgtaaaact agtccttttt taaagttaaa attttatgtt accacatgaa 15720
ttgatcagca gaaatttatt tacattatgt aaattgattt ttaagagtat ccacaaggtt 15780
ttagctatta tttttgaact tgcttcctag cccacacaat taagtaataa gagtaagaaa 15840
aaagaaagca cacatccaaa tcatctatca aaacccagct tctacccaat gacacatcat 15900
tttatttctt gatcttgtaa tgttgagcac atgccttgga catattccta tatgtgggct 15960
ctattctctg cagcacgtca ctccctcttt tatccgcccc tcttatgtgc tcccactcct 16020
atcctcttca attaaaaatg cctctttctt ttttttttaa gttaattaat taattaattt 16080
ttttttattg atcattcttg ggtgtttctc gcagaggggg atttggcagg gtcataggat 16140
aatagtggag ggaaggtcag cagataaaca agtgaacaaa ggtctctggt tttcctaggc 16200
agaggaccct gcgggcttcc acagtatttg tgtccctggg tacttgagat tagggagtgg 16260
tgatgactct taacgagtct gctgccttca agcatctgtt taacaaagca catcttgcat 16320
ggcccttaat ccatttaacc ctgagtggac acagcacatg tttcagagag cacagggttg 16380
ggggtaaggt catagatcaa cagcatccca aggcacagga atttttctta gtacagaaca 16440
aaatgaagtc tcccatgtct acttctttct acacagacac agcaacaatc tgatttctct 16500
atcctttccc cacctttccc cctttcctat tccacaaaaa ccgccatcgt catcatggcc 16560
cgttctcaat gagctgttgg gtacacctcc cagacggggt ggtggccggg cagaggggct 16620
cctcacttcc cagaaggggc ggccgggcag aggtgccccc cacctcccgg atggggcggc 16680
ggctgggtgg aggcgggccc ccacctccct cccagacggg gcggctggcc gggcgggggc 16740
tgacccccca cctgcctctg ggacggggcg gctggccggg cgggggctga ccccccacct 16800
gcctccggga cagggtggct gctgggcaga ggggctcctc acttctcaga cggggcagct 16860
gccgggcgga ggggctcctc acttctcaga cggggtggcc gggcagagac gctcctcacc 16920
tcccagacgg ggtcgcggct gggcagaggc gctcctcaca tcccagacgg ggcggcgggg 16980
cagaggcgct tcccgcatct cagacgatgg gcggccgggc agagacgctc ctcacttcct 17040
agacgtgatg gtggccggga agaggcgctc ctcacttccc agactgggca gccaggcaga 17100
ggggctcctc acatcccaga cgatgggcgg ccaggcagag acgctcctca cttcccagac 17160
ggggtggcgg ccaggcagag gctgcaatct cggcactttg ggaggccaag gcaggctgct 17220
gggaggtgga ggttgtagct agccgagatc acgccactgc actccagcct gggcaacatt 17280
gagcactgag tgaaccagac tccgtctgca atcccggcac ctcgggaggc cgaggctggc 17340
ggatcactcg cggttaggag ctggagacca gcccggccaa cacagcgaaa ccctgtctcc 17400
accaaaaaaa tacgaaaacc agtcaggcgt ggcggcgcgc acctgcaatc ccaggcactc 17460
ggcaggctga ggcaggagaa tcaggcaggg aggttgcagt gagccgcgat ggcagcagta 17520
cagtccagct ttggctcggc atcagaggga taccgtggaa agagagggag agggagactg 17580
tggggagagg gagagggaga gaaaaatgcc tctttcaata tgtaaggtaa gattgataga 17640
tgattgcctt ccgtagttcc tcccaaaatt cataggttga aatcttagcc ctcagagtgg 17700
tggtattagg aagtatggag cctttgggag ataattagct caggagggtg gagccctccc 17760
gaataaattt aatgccttta taagcaagac cccagagagc cctttcaccc ttttctaccc 17820
tatgaggaca cagcgagaag acagctgtct gtgaaccagg aagcaggccc tcactacata 17880
ccgaatctac aagcaacttg atctcagact tcccagtctc ctgaactgcg agatataaat 17940
gtttgctgtt taagtcaccc agtctaaggt atttttgtta tagcagcctg aatggactca 18000
ggcggtaggc aagaggagga cagtgcacct gagttataca ttgggcaagt catttacctt 18060
cattggagcc tcggtttact tgtgttagat atgggaataa tgatagttac actgcagggt 18120
ggttgtgaag attagagaaa gtgcatatac tctgatcagc acagtgcatg gtacttcagt 18180
acacagtgtt aactgaagac acagtgttaa ctgaagacac agttgaaaac taaagatagc 18240
tagtgaaaca catgttctct gcacatcata cagtttcttg ggcagttttc aaagtgtgac 18300
tctgcagttc ataccaccat tatcacttag tctctaacaa ataatcatat ttgacacatt 18360
tggctgggac ttaataattt tatttgggca gcagctggtt tctggaagtg ttcatgggaa 18420
gaaaatgtat attaataaag ttagcaggta atgttctttg ttgaaatgtt ggatattgtg 18480
ggacacaaaa gagtcagggt aaatgtacat ttacagaatt gagcgtcaga gtgtcatagt 18540
tctctaatga tttacaaaga aagaattcct ggaacaagtg aaatacttaa taattaattc 18600
agcctgtatt tctgcaggta atcaactgca gtgataaaaa aataaaaatg gaactgtctt 18660
ttgctcattg gaaagatatt tgctgcattc aaagtcatca aaaaggcgaa gcaatgaaac 18720
ttaagacttt tgggttttaa taattaaaaa tccatcttaa agagaacctt gggctctggc 18780
acggtggctc attcttgtaa tcctagcact ttcggaggcc caggtgggcg gatcacttga 18840
ggtcaggagt ttgagaccag cctggttaac atggtgaaac cccatctcta ctaaaaatac 18900
aaaaattagc tgggtgtggt ggtgtgcgcc tgtaatccca gctacttggg aggctgaggc 18960
acgagaatca cttgaacctg ggagatggag gttgcagtga gccaagattg tgccactgca 19020
ttccagcctg ggtgacacag tgagactctg tcttgaaaaa aaaaaaaaga gagagagacc 19080
gtttgtgaag gtgtgttaca cagagaattc ctgattccta atctccagaa tagaaaaatt 19140
caaaggctca gaatcatccc aaatcaatta tccagtggca tctgcatttt ccgatttcat 19200
tctcactagc cgtgtgaaca tgggcatgac cccaggagcc aaggaattct ctaatgccta 19260
aggacagcca tgaggtcaat gaataacatg tgtcaggttt ccctggcaca gaggagcttc 19320
ccagtaaatg ttattttcct tagctatttc ccatttaaca tgtcaattat tcttagtgag 19380
tttccattca atatgagagt ttatataatt tgtcatattg aataggaact tgctaaggaa 19440
agctgtgtag cagaggaagc agccccaagt gacaggacat aaactttaaa ttcacaagat 19500
gcttgtatgt gaattatgat ggtatctgaa ttaacagtga tatttacagt ttagtaatac 19560
atttttcttc ccttgtcttg ggctttataa aaaccctgta agtcatgtat gtcaggaatt 19620
ttatcctcat aattgagaga aaaatactcc atattttatt ggaaataaga tcagtagatt 19680
ctctgtatat catacaatgt cttgcctact taaattatca ccccccttcc tatttcaaca 19740
aagactttct ctaagtaccc ctggcctctt gccctgatcc atactgttct ccttggtaat 19800
ggagtgagtt tcctgcctgg tgggtgcagc cattggccac atttctctag tgtatggaac 19860
tcaccggata aaaggcctca gatgtaggtc tctttctgct gtcttcaccc aggtgttgtg 19920
gagtgtgtct gtccttgagc actagctttc ccctgtgtgg gctgcctcaa ggcctgcatt 19980
catcaggtag ggactgttag ctggtagacc taagccacca ctccagtact gactgtcagt 20040
aaggaaggtg acatgctgac ctccatctgc tacatcattg tgtatatgtc ttcattagtt 20100
ctgcatattg gtgagaaaat ggatgctctg attcctcttg aaccccaaga gaatgaaggt 20160
aaaaaaattg aggtcctaat gcaaattttc ttagtacacc caaatctttg gatagagtcc 20220
tgcactcttt gagatatatc acacaatctg tctcactttc ttttcgcata tgttatatat 20280
tttaaaactt ttgtttttgg ggccaccact tactggctct gtgattttag gaaagctttt 20340
cagaccctca gaaccccagt ctcttcatct ctaaagtaat aaaatatatg taaagaacct 20400
atttcagcat gtgaattctg ttttcctttt tcctctagat gtatcatatc cagttaaaaa 20460
aaaatctact tgaactttgc aggtatcttc agtgtttatt acttctcatt tttaacattt 20520
attggaaatt agcatattgt cagaattgat ataatacaat atgtaacctc tttcattaag 20580
cttatcattt ttaaaataca aataactatt ctttacttaa atttttattt ctagacacag 20640
ggtcctgctc tctcgaaccc aggctggagt gcagtggcac aatcatagct cactgcagcc 20700
tcaaactctt gggcttaagt gatcctcctg cctcacactc tggagtagct gggattatag 20760
acctgagcca tggtgtccag catgacttaa attttgaata agttgcactt actaattaca 20820
cttacactgc tgcatctgaa agagtaatac aacaatagaa gccttttata gtaattattt 20880
gtggcaggta gactcctaaa atgactccca aatgacccac acccttgtac aatcaatacc 20940
ctgtcccttg agtgacagtg acttgctcta atcagttggc tttcagttaa tcaaaagaga 21000
gattatcttg ggctgaacta aactaatccc agcaagataa cagggacttc agtcttgcaa 21060
acagatatca tataaaggga atcatatctg cacatttgat tcttggaccc tgggtaggaa 21120
tttgttagag agcaaggatg tgaataaagg tgggaaataa aggtgtatct ggtgtctctg 21180
ctcaaaagct cacatgtagc tacaaggcag agatttaggg gagtggtatc cacagtcaag 21240
aagaattaat acatagtgtt tgagtctggc ttcttccaat tagcataatg cttttgaggt 21300
tcatccatat tgttgcatta ccagtagttt ttatttattt attttatcag tagtttctaa 21360
attgttgagt agtatattac attgtgtaga tatatcctgt gtgtttatcc atacacattt 21420
atggatattt gggagttgct agtttttagc tattctatga gcattcacat acatgtcttt 21480
gtgtggaaat aggttttcat atctcttggg taaatatacg ggagtggaat tgctagatca 21540
tatggtaaat actctgtata cttaaaatga agagaaactg tcaaactatt ttccataatg 21600
gctctaccat acttgatgtt ttagaaaaga ggaaaaacac tagcaatttt gatgctgtat 21660
gtctacaacc taagagaatc taataatagc gtcctggtct gtcagtgtag gaattgccta 21720
ggtaatacat ggaaggtgtg gagggagcag gtacacagaa aatgtgcgtc agaaagtttt 21780
gcttttccta tcccacgtca tttctgagtc tgatcctccc tactcctcac aaataaattg 21840
gtagattcat ctgtttttgg acccttttct gctctagtta ctgaactatc agagacttca 21900
ggaagagctt aagctaagct attccaggga agttttggtg ttactctgta cttacggact 21960
cctgcgtgtc tgtctctgtc accccagctg ccaactcaac ttagagttta ttagcctggc 22020
attgaccagc acactgtgat attctctgag gcacactgca tgctgctagt gtgccctggt 22080
tcataaagct gggccttcag cattgatccc actccaagtt ccttgctctg tcttcccaca 22140
gctgtcccct tgggggatgt ggggggtctg acatcatttg cattattagt ctattccaag 22200
aaatgcacct gtgcactaat cagttcactt tttctgtctt agtcggcaga tctagccata 22260
gcccaatccc tcaatttcta tactaagcct tttatattag taaaactgtt atgttatcta 22320
gaaattcatc agtgggaaaa ctacttcaag ggaggtagtt agaggctgca aggtgctaaa 22380
tatttttctt tctttctttt taaatgtaac ttggatctaa agtaaggacg aatttccttt 22440
tattatttgt tcagaatata ccagctggtc ctgtgggcag aagtttgtta aggggcctgg 22500
atgtgaaata acagtgtatc tcgtgtctct gctcaagagc tcacatgtag ctacaaggca 22560
gagatttagg ggagtggcat atacggccaa ctgagaaata acaatattgt cagggactcc 22620
aaggcacttt ggaagatata aagaatttct taaattttct tgtagaattg ttgcaaaagg 22680
cagacatgct taaatgttta aataagcttc ttgaaaactc atggaacatt caatcacaac 22740
tccaacagtt ctccaaaatt tgatttattc tggccatatt atgcagcaaa gaaacacttg 22800
gctatttatc taaatctctt ctgtcttgta aatgatccta gaaaataatc tagaaataca 22860
ttttattaaa gtaatgcatg aggtacatat cgattaccag ccaatagttg aacttaaaca 22920
taatgcatgg gtgtgagggc tggcattgat gattcacaat gaacacagtt gaatatcact 22980
tccctgctga gactcgggta tcatcgcaaa accacagtga gcatcagtgg ggatctgcat 23040
gctctggtca agacagatct ccatgctgag tgtctgtttg ccatgatgaa gagaacagtc 23100
aacaggagtg tttgccatga tgtagagaac agtccgggag gagtgaatgg aggatggggg 23160
catgaggaaa gatgaggctt tctctagtta tgaccctttg tgtagaagtt aggagtaggg 23220
gataaatgtt tctgcctaat atttaacttg gaagagaaga tgtccatgtg aaaaactgct 23280
aaatactgaa acaagagagc atgtgactaa gcaataccat gtgtggcaca gaaaacaagt 23340
gcaatagcag tttagcaaag tgagttcagt gtaggctgaa ctggttagag caggtttccg 23400
ggtgaaggtg aggattggtg agggtttgga ttggtagaaa gagacgggga ggacatctca 23460
catcaagaag ttatgccagt ggatttcagg agaattgagt gtttgtgtct gaaaagcctg 23520
taagaatagg gcatgacagt gtggagaaat gcatgaaagt atgaaggatc gtgatatcca 23580
gtttgaggag tgctaactag aggctctgaa gatttgagaa gaaacataat gaaaggtgtt 23640
ctcagcctga tcttggtatg caggactggt aaaccccaaa caccttacca ttctattacc 23700
tctccctcaa ggaatgggtc ccttgataag aatttagtgt aaaaaagatt gtcaattcag 23760
tgctgctgct gagtgctagt ttctttaaac acacacagtt ttcttttgag aatttttttt 23820
ctattagata gacgaactgt tatttaaatg aaaaaggcac atagtcccat aaaacaatta 23880
cacattcggg tgataacttc aaaaggagaa attaaaatgt tcttatgttt tgagcaagca 23940
tttccacttc cagactttgc tgcataaaca tctgtggtca tctagggaat gcctgacctg 24000
gttcagaggt gtcagagcaa tgtaaagtca cggaagtgct gcagttctat tctgggctct 24060
catctttttg cagcggtcca ttctctaatt ttcaaccaca tattaccaga caatctctta 24120
agtcatacac aacaaactga ttctgtttca atgcttagaa ttagaataaa aaagcctaag 24180
caaaaatagc acaaacattt gaaaaacact ccttttttct accactccct tcttagaaca 24240
gaaataaaag ccctgtactt taagaaaatg gatggaagaa ttttctttgt acttcttatt 24300
ctccaagtta catttactac ctgatagtgt taataccttt ttgtagtacc tttctttaaa 24360
atatacaggg aaatgatctg ttccaagaaa ctgtgttttt aaatttaatt atagtgtgct 24420
atgatgattt aaaaaatggc cttttgagta aaggacacga acaagttatt taaaaagtga 24480
gcagtaagtg tggtcagtaa acacatcaaa aagttccctt cactaatatt caaagaaatg 24540
caaattagaa taataatacc cttgttgctt gtcaaattaa tactttaaca attattatgt 24600
aaattttatg gataggattg caaatcaaca cacctttcct ggccactggt gtacataata 24660
gaaattctaa aaatgttctt aggcttgacc aagcatttcc acttctagac tttgctgcac 24720
aaagatctgt ggtcatctag gagaaggctt gacctggttc agaggtatca gagcaatgca 24780
aagtcatgaa aatgctgcaa ttctatcctg gactgtcatc ttttttgtag tggtccattc 24840
tctaattttt caatgacgta gtaccagaca gtctcttaag tcaaatgtat ttgtagggct 24900
ctggatttga aattcaatct ggctttcagc cttgatgtgg ccactcccaa cttgtaaagg 24960
acctgtgaag acttagacac agaataaaac acagaagata agaaaaccaa ctttgaaaga 25020
aaatttattg tcaaaattgt actgggtcaa ttgagcaaaa acttcaaaga gcgttttcat 25080
attaaccaaa gcatccctcc tcaattgaaa catataaaga tattgttcac ccctatcctg 25140
actcagagat ccacaaatct gggcattcat catcaccata ttctgctggc aatagtttta 25200
agcagctaaa ttactgttct ctactcttga gtttcctcca tctcttcaga tacagaaagt 25260
tctagaatat attcaaataa tcaaatcttt aattcattcc atatatctgg ctcaagacag 25320
tgtcccaata accttattct agagaaagtc agatttagac ttgtgctcat catcatactc 25380
atgttcttga catcatttta agctctgagg agacatctca cataactctc attgatacgt 25440
gtatacatct gtcactctgt gtttgtgctg tgatggatgg acttggatgt agatatgcat 25500
agatgatgaa gcagatagct atatatatgg tattgatgta gattcagtac agctgtataa 25560
ttgcatctgt gtttcacata tcttgtgtac tgtatcttga ctgtatctgt gtcaatacct 25620
aattgagtta taaggcataa atatgtggag ctcttagcac aatacctggc acactgcaat 25680
cagtcgatgt atgtgtttgt gtgtgtgcgt gtgtgtgtgt gtgatacaga cagaacctgc 25740
taatatgcat aatagtcagg ttgggttgtt ataacaaaat actatagact gtgtggctta 25800
aacggcagac atttgtttct cacagttctg gagtctggga aatccaaggt caagattagt 25860
ttctggtgag agcagtcttc ctcttttgca gctccccatg gtttgcaaat cacagatttc 25920
tcgctgtatt ctcacatagt gtaggaggaa cagagggagg gaagggagga agtgcctaag 25980
gacactaatc ccatgatgag agttctatcc accatgacct aattacctcc taatgccacc 26040
atctccaaat actatcacac tgggaattag gtctttaaca tgtgaatcat ttggggtgga 26100
gaagacaaac attcagctca taacaggtaa ggtagaaaat ctcaagaatt tatattttgt 26160
atatgaaaga tcattaatga gcagaatttt aagtttaatg ccaattttaa tctattttta 26220
tcttttctac gattcttttt tactttttaa tttttaaact ttcatataca aagggataat 26280
atttggctaa atgttctctt ctttttgagc tctggatcat tgttacgatc accccataat 26340
tgtatgtgtg cagagatagt gctttataca tttttaaaac aattttatat acagtattaa 26400
attttatttt tcaataaaca atccatgaga tagaaagaac atatattttg ttttacagat 26460
aagctccagg gagagtctag ggtaccttag attgtatggg taaaacatgg tttatttaaa 26520
tcataaataa acagtcttat ttccctaaat gcacatacag gcatccacat caaatgaaat 26580
cacatcacat gaattgaaca ggcagttact gacttagaac tttgcactca caaaagacac 26640
actctcctaa atgtctccat catactatac tttttgtccc caaatgccta atcactgaag 26700
cttcagactt tgttgctttg attcccttag gaaaaattcc tggtgtttca gaaaaaaaga 26760
gccatttaac tacattagaa gttaaccctc ctttaaaaat gtg 26803
<210> 20
<211> 26803
<212> DNA
<213> 智人
<400> 20
cagttaaggt ggggcaggaa taaatcacaa tggtggaatg tcatcagtta aggcaggaac 60
tggccatttt cacttctttt gtgattcttc acttgcttca ggccatctgg atgtatatgt 120
gcaggtcaca gggcatacat tggcttagct tgggctcaga ggcctgacaa ggcacagaag 180
gagctgggat agaggtgcaa agtactcatg ctgacctgac atcccatgcc cacggcagac 240
atgactactt gatcggacaa tactttcttg gaatcaaaga cacaacttca cagtcctcag 300
catcatagtt caggcagcct gtatcagtag atcagagtgg gcacatggcc tggtgctatc 360
actccatcct gtgaggggag atgggattgg aatggaggtg gaggagtcac aggtggtcct 420
gatatcacag gcctgggagt ctgaaagaag tgcagtaggt agtattatgg ccctcaaaga 480
catctgtgtc ctactgtcta gagtcaatta aagtgttacc taacatagaa aaaaggattt 540
tgcaggtggg attaaactaa ggatctcaag atagaaagac tctcctggag tatccagttg 600
tgtccaatgt aagaacaagc gttctcaaaa tagggacaca ggagattgaa ttgcaaagga 660
gatgtgctga taaacggaga ggttggagtg atgccgccat gaggcaagga atgtgggtgg 720
cctctagcag ctagcaatga ttcggaaatg gattctcccc cagagtccag aaagatcaca 780
gcagtgctga caccttgatt tgagcccagt gtcacctctg tcagacttct gccctataga 840
actgtaagag gataaatttg tgttttaagg cacaaagttt atggtaattt gttatagcag 900
caatgggaaa ctaatacaag aagggttgtg ttatcaacag aaatacagca atcagaagaa 960
agatggttgg ggagagcaga gggtggggtg ggaaggtgat ggattctgtt tgggacattc 1020
tgggtgtcat atgaatatta ttggggaact gtccatcaaa agctcagact tcaaagaaag 1080
aaaggaagga gcaacaatat tttgaaaggg agaaagtagg taatattcaa tatgtgttga 1140
gtacctacaa ggtttttagt tctttcacca agttatttta tttaattttt atggcatcaa 1200
ggggtgtttt ttttttttct taaaccaaat tttctcagtt aagcatccca tgtaagtggc 1260
caggggttaa gagatgtgac taagactaga cagagtgatt ttcatcatta catggtacta 1320
tggttctact gaagcactga ggaaggaagt caagagagtt cctgagaaat gtctggagtc 1380
ttagtaacat gcaaagtgag gcagaggtat tgtcagtgtt agctggtcac tttgaaaggt 1440
tagaggtaaa taaagttcag ggcaatggta cttggagagg agtgaatctt tggtaacctg 1500
gaggagatgc ttctcagagg aaaatttctt cacagcatga agtcaccagc tctaagacta 1560
gtgggtgttc tgggggatgt tagcagtgac tcactgactg ttggcccagt gaggggaggg 1620
atgaaaggct gggtagtggg tagagaatct gactcctcct gcccccacat gtctattcct 1680
gggccttctc ttggtggggg caaaaggtat gcaaagggat ttccgcagtg tctgagtgct 1740
cccaggagac ggaaaagtaa ctgatgactt ggagttggag tcttgttggc tcaggcagct 1800
ggggcgtttt gggatttcaa cacctccctt tagtttctat gtatggtgct gagcaagtag 1860
tcaaagactt tggtcttgct ttaccccagt agcccacaag cctgagtaca tggctaacat 1920
ttattgggca cttagtgtgt gccaaagagc tttatgagac aggttctttt tgagtcccat 1980
tatactgata atgggactga taagaaacag aaggtcagaa aggcccagta acttgggcaa 2040
ggtcatgtag ctagtaagtg gtccagctga aatttaaaac caggtttatc caactccaaa 2100
tcccacatct gatttatttt gccatgaatt aaaacatagt tctgattttg agaaactccc 2160
agtcccagtg ggaaaacaga tggaatcaca aattaccata acacagtgta gtgatgtaga 2220
tataaaaaca aagacatggg aaccctgaaa ggaagttgta acaccaatag aggaatgcat 2280
ggaggagatc tttcagagga ggtagcctcg tagctgggct caggggtgga tgagtttctg 2340
gctagaagcg cattgtgggt agagggagaa catatataga aaggcatgaa gatggtggac 2400
atgtttggaa agagtgagta ctagactgat gaacacgatg agtcaggagc ttatgacgtc 2460
aggggctact gctagcctag ctaatgactg aagattctgt gaaaagaaaa ccctaacatt 2520
tccagctgag tactagggcc atggtgatta tatatcatct ctcatgacaa cacaaatgtt 2580
tgggcttact tatcatcctg ctcagtaatc attatgtcac tcattaaaga tgtatcaggg 2640
taaattttag gtgagaattg attagaaatg taaactctat atatgtagtt acaggcttca 2700
cagtttgcca ctcaaacaat atggtcatcc aatcatgagg cacaaccttc tgctcagaac 2760
ttttttataa ttgggagaaa gtgacatccg agttccatct cttctgagaa ctgtgcagct 2820
cagaaatctt cttccctttt ttgatccccc agttgggtga gatgacatta acagtgtgtt 2880
ataagcactt ttcatgttta ctaccccata ttcaaaatta agcatttcaa acaactgtat 2940
aattgtctat aaatgtagca ttattagtta attttccttt taacacattg aggttacctc 3000
taatgttttg ctatttttaa ctatgttgaa ataatcatgt ggtttttatt ctttgaatta 3060
ttttatattg taatgttccc tgaaatgaaa ttagttgatc aaaagatgag taatcttttc 3120
atgacttttg atacatgtca ctcaatcacc ttctggaaga gttggaacaa gagcctattg 3180
ctggcatccc atttcatagc catctcacca atgttggaaa atgggctttt cctattttct 3240
gctaattcat tagttgttaa tggcttattt taactattaa tcccttgtta ttgatgaaag 3300
ttaagcattt tctgtatttt tattttctgt ctaaattcta ctttttgcac aatttccttt 3360
gctcacttct tcactggaat ttagtatttt tctttccaat ttgtatgact ccaaaatcag 3420
tgataaaata agcaaagggt ctttcttaga ggctaaacaa gggaatgaat aaggaacaag 3480
aacagcaaag ggatagtgaa taaagataca aaataataac ttatttttat ttttgaagct 3540
ttccccaggc agtaattctt gaccttttta agattataaa ttattttgag atatgcattc 3600
ttatcctcaa aatgaattag tacataaaat ttaaatgggt tgatagatcc cctgaagtgt 3660
atccacaaaa tgctctcagg ttaagcaaca ttgttctata ataactgctt taaccaaaat 3720
gtttaattat tgcttgtgtt tacctgtcct agcaaagagc taattgttaa attttgtgtt 3780
agagggtcaa tattataaat aacttaatgt ggcctctctt tcctttcctt tttttgagag 3840
ttttgaggct atcactaagt gggctttaga gtaccaggtg ggaatctgac ctcactgctc 3900
aaactttcaa cttcaggcat gaagtggtcc cagtgatgtg ggaacctcag agtctaaaac 3960
aaaaatagta gactgaggcc ctcagaaacc agacttatca gattcagaat ttaatataac 4020
tatgtttgaa agatttaaag aaaataaatc aaattaaaaa gtgagcaaga agcaagaata 4080
acaaatgaac tggcatattt gagaaagaat tttgagcttt tagaaataat acatacactt 4140
attgaaataa aaactcaagt caataggttt aaacagcaaa atgaatatag ttaaagaaaa 4200
ctattgtgct gaaagattta aaaaactatt acacagaatg caaaatgatg aaatagggta 4260
atttaatata tggcagatat gttaagacac tatgaggata gtatgagaag acctgataga 4320
catctaatca cagcacctta aggtgaaaat agagagagtg caccaatatt gaggagttaa 4380
tgtctgagac tattccagaa ctgataaata gatgaatcta cagatctcag aaacacagct 4440
tttacaaagg ataaatgaag agaaattcac cagagataca ttgtaatgaa tctgtaaatc 4500
accaaagcta aagatattat ttcacaagtg gaatgacagc tgacttctca acaacaacga 4560
aagcaaggag acagttgaaa gacatcttga aaatggtgag agaaaaacta actgttaata 4620
taaaattgtg tacctatcaa aaatatcttt tggccaggcg tggtggctca cgcctataat 4680
cctagcactt tgggaagcca aggaacgtgg atcacttgag gtcaggagtt tgagaccgag 4740
accgtcctgg ccaacatggt gaaaccccat ctctactaaa aatacaaaaa aaaaaaaaaa 4800
atagccatgt gtggtggtgt gcacctgtaa tcccagctac ttgggaggct gaggcaggag 4860
aatcgcttga acccaggagg tagaggttgc agtgagctga gatcatgctg ctgcactcca 4920
gtctgggtga cagagtgaga ctgcctcaaa accaaaccaa accaaaccaa accaatcttt 4980
caagaagtac accataaaga catttccgga taaacagtga atgagattac ttcctaaacg 5040
aatatgtaag gatgtttctt tttaaaattt tttttgggtg tattcatcac ctcaagcatt 5100
tattcttttg tgttgttaca actgataaga atatctaagg atgtttcaaa aggaagaaaa 5160
atgatcccta aagtctggta tattagtttc ttattagttg ctctaagaaa ttactgcaaa 5220
cttagtggct ttaaaaaaca cgaaattatc tttcagttct gtaggtcaga aatttaacct 5280
cctgatttct ggtcagaagt cttactgggc taaaatcagg gtatcagcag ggctgctgga 5340
ggctctggag atgatgtttc tctaatttct agaggcattt gcattcctta gctagtggct 5400
tcttcccaca tcttcaaagc taacagtggc agtcgagtcc ttctcttatc tttttttttt 5460
ggggggggtt ataaattttt tttattatta ttatacttta agttttaggg tacatgtgca 5520
caacgtgcag gtttgttaca tatgtataca tgtgccacat tggtgtgctg cacccattaa 5580
ctcatcattt agcattaggt atatctccta atgctatccg tcccccctcc cccaccccac 5640
aacagtcccc agtgtgtgat gttccccttc ccttctctta tcttatcact ctgacctctt 5700
ctgcctcctt tctctacttt taaggaccct tgtgattaga ttgggtccac ctaaataatc 5760
caggataatc tctttatttt aaggttagct gattagcaac ctcaattcca tctgtaacct 5820
taatttcttt tttgccatgt aacctaacat agtcacaggc ccaagggaat aataggatgt 5880
gggaattgcg ggtggtggag taggggcatt attctgctta ccacagggga ccttggatgt 5940
cagtaaaaaa tggtgaggaa gaaaacagga aacgtagaat aatctaaaca aatctttgaa 6000
aaataagttg aaatgtgggg ttagaaaaag ggcagaacta aaatgttaag acaaattaaa 6060
atgttaagcc tataagttga gagggagatg atcaaggtta aaaatactca taaatcatat 6120
ttttttgggt agggggttag atatttatta attttagacc ctgagaagta aaatagtcat 6180
gacaaaaatt taatagtaac cactaaaaca agagaaacag agtatataac ttctaaatca 6240
atatgggaag gggaatggaa taagaaaaca atagcaacca ccaacacccc acccaaaata 6300
aataataagg tgagagagaa aaagaagcat tgaaaagggg ctaaaataaa ataaaaaatt 6360
aagtcatgcc cgtaatccca gcactttgag aggccaagat gggtggatca cctgaggtca 6420
ggagttcgag accagcctga ccaacatggg gaaaccccat ctctactaaa aattcaaaat 6480
tagctgggtg tgggggtgca tgcctgtaat cccagctact ctggaggctg aggcaggaga 6540
atcgcttgaa cccaggaggc agaggttgtg gtgagcagag attgtgccat tgcattccag 6600
cctgggcagc aagagcgaaa cgccatctaa aaaaaaaaaa aaaaaaatta agatagtaaa 6660
acaaatccaa atacattaaa gattacaaaa aatgaaaatg aactaaactt cctagttgaa 6720
agacatattg tcagattgga ttttaaaatc tggcaatgat atttccagga cacagtccta 6780
aaatattaaa cacagaaaag ttgaaagtaa agggatggaa gaacacagtc aaactaacta 6840
gaagagagct gggttcaccc ttttatatca gagcagaatt tcactgagaa aacactaaca 6900
ggaaggggga aaggcacaac atagtgatga agcacttaat tctcaacaaa tgtatgacac 6960
ttctaaacta ttatgactgc aaaaaaaaaa aaaacctcag catatataaa attttggaag 7020
agccatggct atcagctgac atgcacttac catatttgca ttgtcctact acaaacttta 7080
cccatatgac caaggtgctg tcttcatccc cattttacag atggggaaat ttccccatag 7140
agaaaaagat ttgggccatg ccttggtttc ttcttgactc tgcttcctgc tgattgatcc 7200
tcacacctca cctggagacc tacttcacat tatccatcag gatgagaact ggtgtgcctt 7260
taccaaagga ccacagtcac cttcaaaacg tgtttagata gatctggatg gagacttatg 7320
tggttgcaga tgaaaaaaaa gtccccatgg tatatctgac tccatgtcat tcactgcatg 7380
aacactcaca cacatgcaca cgtacacagg caaacacaat cctgttctgg tccggcagta 7440
gtgccaacac tcaaatccca ggtcctactc tgaagccttt gaggaaacca ttgtcattct 7500
ggggtttatg ggaatatttc ttcttggtgc cccttgttcc tcacagaagc tttttttctg 7560
tgctgtgggc ttgctatcct agctttccaa gctatcctag ttttgcaaat ttctctgatc 7620
aatcacatca ggttcttgga tcatcccaaa attaaagagg tacgttttgc tgcaagagac 7680
aaagacattc acctctcaca cagtttgaat tcctgggtag aaacagattt caatgctggc 7740
cagcctctgt agctcccagt gccccctcaa ttatgactcc cgaggcattg gagcaggatc 7800
ctcaccttgc gcaaagataa ttaggtgtgc tgaagaaagc cagacactgc tctttcttag 7860
ctctgcatcc ttaaaaagtt accactactc cttctctttg aatctttgac ttgtcaatgg 7920
taaagtgcct atgattctta aagggataaa aacgcaacct atataaagca cctggcatag 7980
tgcctggcac aggtgggtgt ttaacaaatg ttaactcctt tctatcccac tgtgggtgtc 8040
catatcctct tgggtaggct gcctctggtt tccattgtgt catcagagcc atactaaatc 8100
gatgtgttgg acatggatcc caagaactaa tttctggaat gagttatgcc taccaacttc 8160
cctgatactt acttctgtct ctccatttat caaatggaaa tgtttgcatt tggcctctgc 8220
cagttggagt aaccaaaagg cttagaggtt ttggagaggt cctacactgc catctgtttg 8280
accacatact gcctttcacg tgtaataagc attgtttctt acatttgtct aggaattagc 8340
agttcacaaa gcacattcgc atataagggc ttgttttgaa ttgatcttgg cagcaattct 8400
atgagacaag taaaaggtag gtcaagcatt ataatcctca ttttaaatct gggaaaactg 8460
aatctcaaaa aggttgaaag acttgtctag gggacagtgt gtgggtaaat gagaagttaa 8520
gatttgctga actggcattt cctgactaca tatctagtgt ttatttatgg agaaggcact 8580
acggtggcca agtggctcag agtcacacag ctctgtgcct cagtttattt gtctgtaaaa 8640
tgaagataat aatatattct gaatactgtt gtggaatttc attgagatag ttcacataat 8700
ggcatggata ctgtagtaca ccgcctagat tcacaacccc acgactatcc atgagaatgg 8760
cccatagctc aagaggtcac attctttccc caggtgaagc ccgcatccaa tgactgctca 8820
gtgtgggtat ataaaggcct ggctcccttg ccagtgccac cctacctcct ggcgaatgga 8880
ctgaggcttg cattatgact gcattgcagc tcaactgttc tttccattca gtctttcctt 8940
tacactcaca caggtgagga cccagccatt aaatgcctca catgatgacc tctattgcat 9000
gctaggcttc gtgtgcacac acaaaaacca tcctctatca gtcaggcccc ttacttgcag 9060
aggcaaagag gccagtctgg gttagatgtg caccctgttt ttacaacaga acgagacaaa 9120
caggtcctcc ttaggtgtaa gttcatggcc ttggccccac ccctgaaact cagccatctg 9180
agacagtttt aggactgagg caaccccaga ctttgggttg ttgtttgctg ggcacagcct 9240
ccttttgcca atgttgcaat cctttgtaag agaccacagg ttgatcaccc gttcctgtta 9300
ctgagcacag agaggtttgt aggccagtct ctccaggaat tctgacgcac tgcaaaatcc 9360
catggtctga atgcttctac cttccctgtg aaagcccctg gcctcagaaa aggaagctgg 9420
tttaagtgac caacatttgg ggtggagctt ccgagggccc agccaccgtg ttacatgcaa 9480
caatcaacag agatattctt tggctagagt tgtttttctg ggtataggac cctataatta 9540
aaatcagctc tccaacttcc cttcctccaa aaagtataca atgtaaggag gaaaatgcaa 9600
attgaaaagt tgctagccct tcccgccaga atgccacccc aagcctcccc tgcaggaagt 9660
tctggagtcc ccaactctgc cccaagcctg aggcccttga taaggtaaag ggatgtgagt 9720
gtggaggccg gagcccccct cgccctgtag gctgctcccc ttgcttttcc ctttgaatgt 9780
tacagtttag ttctgtgact tacttataat tgcctgaatt ccccgcccac gctttctctt 9840
actttggggc ttctcaccgt tcctcttcct ccatcttcct cctctgaccc cactcccaag 9900
cctgaatggg gtgttcctct tccgtgctcc cacaaaaccc tgtgcctctt tcatcgttgc 9960
atatattatg ctgtaatgta gttttctgga ggtgtgaaga ctatgaatcc tatgaagaca 10020
aatacacacc taccttgctg accgttgtat cctcagaatc taatactgca cttggcacac 10080
agtggttggg agtaaatatt catgaggcaa acacacagga aggactcttt tgttatggtt 10140
gtttgttgtt gttgcaagta acataacccc accttgatct agctgactga cggctctacc 10200
accttgtctt ttgcagcaca agaggaatag gaactgcacc tcttccttca gtttcagctt 10260
gaataatatc aggaagattc gtatcggtct gagttgggtc acgtacccga cgtgctatag 10320
ctgaggatgg ggtaagctga ttggagtttg caacactgtt cacatagcca agatatggaa 10380
agaacctaaa tgtcaactgg tggatgaatg gataaagaaa ttgtggtata tacatacact 10440
ggaatattat tcaaccttaa aaagaaggaa atcctaacat ttgtgacaac atggatggac 10500
ctggagggaa ttatgctgag tgaaataaga cagacacaaa aagacatttc ttgcaggagc 10560
tcacttatat gtggaatcta aaatagtcaa gcttaaagaa gagagtagac tactggttgt 10620
caggagcagg agaaaagtgg aaatgaagag gtgatagtta aagggtacaa agtttcagtt 10680
atacaagata aataagttct ggaggtttac tattaatata tcacatagta cctataagta 10740
acaatactgt attgtatact taaaattgct aagagggtat atcttatatg ttcttaccaa 10800
taataataat aatggtaata attaaggggc aggaggacac ttcaaaaggt gatggatatg 10860
tttatggcct tgatggtggt gatggtttca tgagagtata cttatcccca aactaattga 10920
gatgtaaata ttaaatatgt acagcttttt gtatgtcaat cgtacctcag taaagtagtt 10980
taaaaatggt tggactgaga aaaggaggag ctgctcagca acatgaggct gggtgctggg 11040
cagacaaaac ctcacacatg cattactgaa cccacggact catgtctgtg agctttgtgg 11100
ctgtggatgc accatgccaa tgtagtcaag gattcttcaa tgtgtacctt actggattag 11160
ttccctctgt ttatttgtat tgactcctca gttcccttat gggttgcttg ttggctcttg 11220
tggaattatt taagtaaggc tttggttgca ggagtcagac atgcttaagc tggttttggc 11280
tgtaatgggg aatttgtgag atgtgacaca gtgacaggaa gtgcagccag acgttgtgag 11340
aggcagtaac tgggaatagg aaagttatga gaagttaagg cagtagtaat tgtttctcta 11400
tcgaaggcca taatgttatc attcctgcct ctatctgttt gcttgttctt ctctctcagc 11460
agaatggtct tctctgcttc tctgtgcacc tgcagaaggt gaccacccta aggcttatgg 11520
attcaggagt cctcagtttg agagcagtta ccaaatgcct cgcccctgtg aactctagtc 11580
ccagtttctt attcctggta ctggcttagt ttgaggcagc tgcccaccgt aagtccagtg 11640
agccatggcc tggggacaag gtcaggtaca tgtgtaatca gctgggtcta tgagttgtgg 11700
tggtggcgat ggaggtagct cccagaaaaa tggattacag gttaagaaga gtctatatat 11760
cttgaccaca tttgatgtga cttggaagtt tcaatgtgtg accacttaca aagttatgat 11820
caggtgtctc atttatttat ggtgatgtat gagtccgtgt gtgagtgtgt gtgtgtctgt 11880
gtttgtgtgt gtgtgtgaga gagagagaga gaatgagaat atgagtggtg gtttcccatt 11940
tatttttcta tgggccaaat cctgggctat gagctggaga tataagagta aacaaaatag 12000
acacggtgct tgctgtgacc tgccctggga gacagatatt acacggagga tcacataaat 12060
gcagagtctg agctgaggtc ttaagggtga ggataagtaa ctagtcagtg gagcagggga 12120
gggaagggtg ttccatgcct gtgtcaaggt cctgaggtga gagaaagagg tgaatttgag 12180
gaaccaaaag gagttcaggg aacaagaggg gctgtttcac aagctgagtc tggaagctga 12240
gcaggctgag cagattctta ggaactctgc aaaaacttaa gggcttgtct atgaccgtaa 12300
acaactacgg tcgtagataa acaagttggc aaacaactca aggatttaca gtcatcagaa 12360
ttgtaaaact gatcccatgt attttcaaac ctcaaatccc ttgctctgac cttgtgtgtc 12420
taagctagaa ggaagcagga tgcacctctc ccctggctgg aatgaaggga ttcacccaag 12480
ctctcagtct tctcacggca tccagggccc ccctgcttgt gtgtggtcta gatttccatt 12540
cccatagtag gaattccttt gggagccttg gggtctctcc tgctagaggg cttcacctgt 12600
gactgtctca attcaaggga ggggttctaa taacattaaa cctcaatatc ttgctcttcc 12660
attcctgatg cctccctttc cttctaccct tcccctacct ccttctttcc tatgccacag 12720
gctggcaggt tagtgccaga gcaagtggcc agtcaccatc attggggttg tggatcctca 12780
gggttcttca gaagcccctt caccatgatc aagagtctcc agtcactcag aattccacgg 12840
ttcccaaatg ccagctctcc cactactccc agcgttctcc atctctggga tgttgggctc 12900
caggcttctc agatgcactg agtaccctag gctaagccac tgatccatca gaacttcata 12960
gcctgagagg agagggagac aggcttgcaa aggagagttc tgactagaca ctggggtgct 13020
acagatgccc gtaagttgtc cctttaccct cgatgtcccc agtgttggga ccacctggga 13080
atgcccagcc ttgtgtgctg attgacttgt agtcccctgg ccctgactgg aagcctagtt 13140
ttctctctca tgaccagcta ggcccctagc tccccaggga agaaatccaa tctatttcct 13200
ctgatagtaa tggctaatac ttaaataatg ccaaccacat gccaagcact ttacagttgt 13260
tagcccagtc ttcacaagca ccttgtgagg tgggcaagag tcttatctta ctctcatttt 13320
atagatgtgg cccaggatcc cacagctata gttcatggtg ctgggatttg aacctctggc 13380
caccagagcc caccttaatg tgtcctcctc ctgttgtcat aacagaaaag tacaacacca 13440
tgatgacaca tcaggctatc ctggcaggtt cccaggctgc cccaatgccc aactttctag 13500
gtttacaaag ttgacattta cgaagtttcc aggtttacaa atctagtttc tgattcttta 13560
gtcagcagga atttctctac aaaagctgct tcgaaaattt ccagccaaac cttacacacc 13620
ttggcattac atcttggtga gccaaggcgg aagagaacag gaagtgaagg ccccatggga 13680
agtccctgcg gtcgggagca cccaggcggg gcggggggtg gggggctttc ctgtggccgg 13740
ctccctgccc ctcccacccc cattcaggcc ctgtgagttg aatgaagaga ccctgggaat 13800
gagtccaggt ctgcagggtt agaggaaatt gaaggccctt accagatccc tgttgagaag 13860
tttatgaatt atgagccctt ctgcaaatga gagggttctt ccctgtcagg agggacagat 13920
tgtaggtggc aagattggtg gcagccagta ggctggtctg ctccttcctc tctatttcat 13980
atgtgtatga aggcattacc tgcagcaagg gcctgtgtaa atgcatgtga tttacagagc 14040
attttatgta ctgcgtgtca ttcatgcttc cggtgagccc taagtctaag atagggcaga 14100
tagcatcagg tccattttgc agctgtcaaa atgaggtctg aagggcagaa gtggtgtgcc 14160
cacacacaca caactggttg gctgcagacc tggggactag acccgggact tcgtcctgcc 14220
caggggtctc ttgccactgc tccccatcaa cttggatggc tttaagcatt tgtgagttgt 14280
ctgctccctg atggcagaat gcagagacat gaagctacaa gcaggttcgc tcccaacggc 14340
aaaaaggagg aggggtgttc agaacatcag gtgcttctag agaaagcagg gagagagtat 14400
ctggccttgt ggacaatgtc acggcagagg ccaggtatag ggcatggggg taactggaag 14460
cgggatggac cctgttattc cctaagacat ggcttccacg tagtgctcaa acaaggcctt 14520
tgcccttgct gttccctcca cctggaatat tcttcccctt ccttgacatt gctcaggtct 14580
ccactcttat gtcaccctct cagagagggc ttccctggcc actttcccta aaatagccac 14640
ccactcctag gtccctcaaa agcatatcct gctttggatt ttccctatag caatatgccc 14700
tatgaagtta ttttatttgc taacttgttt cttgtctgtt ttcctttgtt agagcgttgg 14760
ggaccttgtc tggcttgttc ccaatgcctg gaagagtgcc tggcacacag gattaagcca 14820
acacatatgt tttgaatgaa tgtgtgcaca catgcatgag ctggcggcag tcggggttgg 14880
ggtaagcacg aaggcccagc tcagttctct gcatgtgacc tcccatctta cgcagataag 14940
aaccagtttg gtttctgcta gcctgagtca ccctcctgga aactgggcct gcttggcatc 15000
aagtcagcca tcagccggcc catctcctca tgctggccaa ccctctgtga gtgtgtggga 15060
ggggaggctg ggctcctcct tgtactctct gaggtgctct ggaaggaggg gcagctccac 15120
cctgggaggg actgtggccc aggtactgcc cgggtgctac tttatgggca gcagctcagt 15180
tgagttagag tctggaagac ctcagaagac ctcctgtcct atgaggccct ccccatggct 15240
ttaggtaagc tccttccact ctcatttttt cacctgagaa atgagagagg aaaatgtcta 15300
caattggtgt ttatcaaatg ctttcaggct ctggtgagca agcgtccagg aaaatgtcaa 15360
gcgcatggag ctccaggcct gtctggggga tctgggcacg gggaggcatc catgggagac 15420
catgcaggca ctctgaggca ggggctgcaa gcctagtgcc tgctggggca gcaggtgaac 15480
agagaggtgt aactgctgtg acagaagtca tggagtcctt ggagtgtgag ggtcattttc 15540
cactgttgat agaataggga aattggtgaa atagccctgt taaatgagag aaagaacagt 15600
gtgagctcaa tgagaaatac taatagaatg tggcactgag ccacaaggtc tgaggcttga 15660
ttgataagga agggtgggga ctgtggagaa ttaagggctt ggcacaggtc agttccacca 15720
gttgtcacaa gagaatgcag gctcaggtgg ccagaacttc tcgcttttcc agaagagtcc 15780
gatattctga tttcattata tatagtattc tgattaaacc agacaataaa gcaagcagat 15840
aaaatattta aagtataagc tgccagtttg caacctccgg ttaggatttg tgtggggcaa 15900
agaaaaaaac tctcaggatc attggtatgt agactctaat tttaagtttc taatttaaaa 15960
ttggcccctg aggctgggcg tggtggctca cacctgtaat cccagcattt tgggaggcca 16020
aggtgggtgg atctcttgag gtcaagagtt caaggcctgc ctggccaaca tggtgaaacc 16080
ctgtctctat taaaaataca aaaattagct gggcatggtg gtgcatgtct gcaatcttag 16140
ctacttgggt agctaaggca ggagaattgc tggaacccgg gaggtagagg ttgcagtgaa 16200
tggagatcac accactgcac tccagtctgg gcaatagaga gagacgctct ctctaaaaaa 16260
aaatatgtaa agataaataa aatgaaataa aataggcctc taatgagcag gccattctcc 16320
tttctgggtc ttactttcct tgcactcctt tctgggtgtt aagaggaggt ctagaggaag 16380
ctggacaact cttagcttgt agtaagcaca gtggaagtat cagctcttaa tgggtcatgg 16440
acacgttaca agctaggcgc cgtgctgagc actttacatg gtttatccca ctgaaccctc 16500
tcaataaccc tatgaggaag ggctattatt gctcacattt tcagaagagg aaatggatat 16560
agagagatta gataatttgc ccatggccag acagctagta taagaggagg aggtggattg 16620
actgcagaca ttctgtcttc aaaccactac actatgctat ggaggcacag agacttaatg 16680
aaatcatgga gaggggaatt gctttgtcaa ccacaagcag ttattccggg ggcagcagat 16740
cctcccctgt cccccagtgg gtacaatggt ccctggtggg ttgtgctaca atgttagccc 16800
atggtcttat gtgtttttca aatgtgtaaa gtaggatgct ggaaccactc ttagaaccag 16860
ataccaatac attgtgaaga aataaatctc tgtgcttaaa actggttcat cccaaaatat 16920
tttgaactga cacacaatag gtgctaaata aatgtgtgtt aacttgaatt ggattgaatt 16980
cgggaaaaaa gtgcaataag cttagtgaag acaccatgtt ccctgggtag aggaaccaca 17040
ttctccatct aaggccagga gtatgggagg tatcaatgtt tgcccagcac agaacagggt 17100
gccaagaaga gaaaagttga cggggtgcat actctgactg gaaactggaa gggtgagaac 17160
agagggtaaa ggatagagat ggaaccatgt gcatacactt tgtgttacct tggacaagtc 17220
attcatttct ctggacctct gctttctctc tacacaatgg ggtcccacca cttcccttac 17280
agctgacttg tatgaagaag gaggtggagg aggaggagaa ggtgaagaca atgctgactc 17340
aaagggtaaa ttatttttag gatccaagtt tgaaaacaat tttaggctac tagatatgaa 17400
caacatcttg attatgtagt tgaaggaaat taaagatgaa tggtttaatt aaaaattaat 17460
cagaatgaaa acgattgatt actaatatat ctgcaatggt ttattttcct gagtggcaga 17520
ctcactaagg tttttgaata ctcctgtgtg attgctctat gtatgtatgt atgtatgtat 17580
gtatgcatgt atctatctat ctgttgtcta ataaaatgga tcacatctct gctaataaaa 17640
acactacact ggcagggtac aattataatc attaactgtg cctggaattt gcagcagcag 17700
ccaccagagg taccagtgcc ctttaagggt tcataattta gaataatcca attatctgag 17760
tttttcaggg actgaggggt ttggcaaggt gtagaacttt cagtaataaa gtcaagaaag 17820
tcctggacaa accaaggtag ttggtcactc tagtccataa ccaggtaaag agctttccct 17880
gtaacctgtg taaggtttta gaatcatttc tttccttatt accaaaaatc ctccccaaat 17940
tttcaagaaa ttatgaacta aatagttact ctatgagata ggagttcagc ccaaaagaaa 18000
caccataaga acaaatataa ttcttgctta tgttaaccat gcaatgaagc agagagaaaa 18060
agtcagtggc ctctttagga ggactgtagt gtgggaagaa ataactaaac tgggtttcaa 18120
tcctggcctg gccaggatct ggagcaagtg agttaatctt tctaagcctt gagtagtttc 18180
ttcttcttct tcttcttctt cctccccctt ctcctcttct tcttcctcct ccttctcctc 18240
ttcttcttct tcttcttctt cctcttcttc ttcttcctcc tcctcctcct cctcttcttc 18300
ttcttcctct tcctcttcct cttcctcttc ttcctcttcc tcttattctt cttcgtcgtc 18360
ttcgtcttct ttttattttc aaagtgaaag caagtttatt aagaaagtaa aggaataaaa 18420
gaatggccac tccatagaca gagtagcctg aaccttgagt tcttctataa agtcactatg 18480
aatttatact cattttgaaa gtgggtgtca atatgtctgt ccactttgca cagctgttat 18540
gtggacaaaa ggagatctgt gtgaaagtgt aacacagagc ctaaactata acaggtaagc 18600
aacacagttg tccccttccc catggtgtct gttcttctcc atttcctcct gtctgcaggg 18660
ggattataaa actaatcatc aaagccaaga aggcaagagc aagcatgtac cgctgaaaac 18720
acaagataac tgcataagta atgactttca gtgcagattc atagctaacc cataaactgc 18780
tggggcaaaa atcatcttgg aaggctctga acctcagaaa ggattcacag taagttaacc 18840
atgtagatct gagaggagag tagcttcttg tagataacag ttggattata taccatgtcc 18900
tgatcccctt catcatccag gagagcagag gtggtcaccc tgatagcagc aagcctgggg 18960
gctgcagctt ggtgggtaga ggtactcagg ggtacagatg tctccaaacc tgtcctgctg 19020
ccttagggag cttctaataa gttgatggat ttggttaaaa ttaacttggc tacttggcag 19080
gactgggtca gtgaggacca acaaaaagaa gacatcagat tataccctgg gggtttgtat 19140
ttcttgtgtt tctttctctt ctttgtacta aaatatttac ccatgactgg gaaagagcaa 19200
ctggagtctt tgtagcatta tcttagcaaa aatttacaaa gtttggaaaa caatattgcc 19260
catattgtgt ggtgtgtcct gtgacactca ggattcaagt gttggccgaa gccactaaat 19320
gtgagatgaa gccattacaa ggcagtgtgc acatctgtcc acccaagctg gatgccaaca 19380
tttcacaaat agtgcttgcg tgacacaaat gcagttccag gaggcccaaa tgaaaatgtt 19440
tgtactgaaa tttgttaaag cttcccgaca aactagattt atcagtaagg attgttttct 19500
gcaaggggga tgaaacttgt ggggtgagcc atttgggctg aggaggaggg aggttggagc 19560
tgagaaatgt ggagacaatt tccctttaga aggactgaat ctccctgcct ctctggggtg 19620
cggcagccag caggatccaa tggtgtatat gtctccccag ctccccattc agtgatatca 19680
tgtcagtagc ttgaaattat ccgtggtggg agtattatgt catggaaatt ggcaaatgga 19740
aacttttatt ggagattcaa ttgttaaact tttaccagca caacactgcc ctgccttcag 19800
agtcaatgac cctatccaag tttaatccat ctgtccactg tctccaacac gatctttata 19860
aaacacacct gacaacatta cccttttatt cagtttttta aaagataagt ttccagctca 19920
tcggggtggc tttaaaggcc atttctcctc tggacctcac ccaacttttc aaatcacttt 19980
tcctacccct acctctaaat gctactcaaa ctccagccat cctgaataat aagacttttg 20040
aaaagtagat tatgggctgg gcacagtggc tcacacctgt aatcccagca ctttgggagg 20100
ccaagatggg tggatcacct gaggtcggga gttcgagacc agcctgacta acatagtgaa 20160
accctgtctc tactaaaaat acaaaattag ttgggggtgg tggcacaagc ctgtaatccc 20220
agctactcag gaggttgagg caggggaatt gcttgaacct gggaggcgga ggttgcggtg 20280
agcctagatt gctccactgc actccagcct gggcaacaag agcgaaactc catctcaaaa 20340
aaataaataa ataaataaag tagattacat cagatacctc tggcctaggt tgtttatgac 20400
caactctcct gctgagaata actagaaaag ctagacaaaa catatttcca aaagatctct 20460
ttggaggcat cagagaatgg ccaaggctgt aaggaactgc ctgagcccag agaggtggag 20520
cccagcactg gtgcccttta ctcctgggga catgtgctgg tttcaaaaac ttcagctgag 20580
cttttgagca ttcatggaac ttggtggggg agatgaaatt tgtaccttaa atcctgccta 20640
cagggagggt ccctgataat ccccacccaa tttggaaatc tgggtcagcc ttcacaggta 20700
ctgaagccct cctctgaatg atctcaagtc ctgctagggt agaggttacc tgcttttgaa 20760
aggctcctgg cctacctgtg cagcaggagc aaaagtgaac catctcaggg tacagataac 20820
aatcatccag agccttgaat gacctctact gtgcttaata tatagtattc agcagtcagt 20880
aaaaaggatt taggcacatg caagatgacc tgtgtatcag ggagaaatag gcaataaatt 20940
gagatccagc agggatttga atcatggatt tgaatcaggg gcagccttcg aaagaactat 21000
ggagaatata ctcagattta aaacataaga ttggaatttt tggcagagaa ctaacaactg 21060
tacaaaaaag gaaccaaatg gaaatcctag aactgaaaga tgcaattaac cgatgttgag 21120
aaatagccaa catctattga acacttccca tgtggacagc tgtgctaaac actttacagg 21180
catcaacata agatgtgtcc ccttacagca gtgcagtgtc cctcctaaga catggacagc 21240
ctggtttccc tatctctctg cttcatcaaa acccctttac gtggggctta gacactcctg 21300
ttgtctctag tgtctagtag cacagggctc agcacatgga agccactaga tacaatttga 21360
tgaccaggac ctccgatgaa agccatgggt gctgattggg aaggcattgt cttttatgtg 21420
ctatggtctt aaagcttcat ccaggaagca gaactcgggg ggtgctgagg acccagaacc 21480
gagaataaga ttagtcagag atttcctgtg ggcagaaatc ataaggacgc caactgtttg 21540
ggtgagataa gacgaaacca agagtggact tgtggccaga agcgtgagga agagggagag 21600
agcttccctt gtcccctttc ttcctctccc taagccacag tgattgacag ccccccccct 21660
ttggagtcag agcaggcttg agactggact gggaaaggag ggtgggtcag gatacagagc 21720
aggaaggctg ggagtgcagg gcaggagcaa ggggctgggg cattcattgt gcctgatctc 21780
tcccacttta cctggggtaa agaagcatat gcaaaagcca cggtgtgagt atttcccaag 21840
tgccagggtc agggcatgat tcatcacgtg cagcatttca ttcaatcctt atagtaaccg 21900
atgatgtggc ttctattatt agctctatca gataatgaaa ctgagaccaa gacaggctct 21960
gcacattgtg tggggtaatg acacaggggg attcagacct agactccata actcctgccc 22020
cagggaccac ccccaccctc accctgtgca tgtcgacaaa ggacagactg ggccacttct 22080
caggacacag cggggaaatg acacagagca gggaggttcc aggagccccg agcgtctttt 22140
ctccaggaga atactctctg aattcagact ggggtcagag aaacatttac ccaggagccg 22200
cagtgtgggt ggggcttttt acttgaaacg ctgtctgaag gcagtggcca ggatggaact 22260
ctccacccta ccttggcaag ccacttctct tctgcaatct gtaaggacat tgttgagaga 22320
attatggtct tccaattccg gagggttgaa gaaagacaaa taggagagaa cctatcatag 22380
tcaggtgcta gctgccttct ctttcagaga gtgtgagaat aaagtgatac acttgattat 22440
tagcaaatac tttggaaatt ttaaacgcta atattcaaca cactctggaa gaggcaaata 22500
agtagacagg ttcatataca tcatctcctt cagctagtcc tcacaaaaac aaacaaatga 22560
ataaacaaaa ttcttctttg gccctcatag gaagacactg tttcttgaac gtgtttcaaa 22620
aaggatgggt gactcactca aggtcacact gtttatgagg acagtacagg aatacagaca 22680
tgccattttg cctgaaaaaa tccatcaccc agggaggtga cacaattttg cagaaatgtt 22740
ctatttcctc tgaaggatac attctttaaa cctttgggaa attcattcat agtcttcctc 22800
ctttgaagga ttaactctct ggacacaaag tgtttgattc tgatttgttg gttggaagat 22860
gtgttggttg agagaaagat tctgatttgt tggttgaaaa tagactcatc aagatcaact 22920
gctgtagtag taaatatttt gacattttgt ctgtattcct gtgctgccct cacaagctgc 22980
atcaccttga gtgagtcatt catacttttt tgtttgtttt tgttttggag atggagtctt 23040
actctgttgc ctaggctgga gtgcggtggc gtgatcttgg ctcactgcga cctccatctc 23100
ctgggttcaa gtgatcctcc tgcctcagcc tcccgagtag ctgggattac aggcacatgc 23160
caccatccct gctaattttt gcattttcag tagagacgga gtttcaccat gttggtcagg 23220
ttggtcttga actcctgacc tcaggtgatc cgcccacctc agcctcccca agtgctggga 23280
ttacaggtgt gagccaccgt gcccagccca gccatcattt ttgaaacacg tttgagaaac 23340
agtgtcttcc tttgagggcc aaggagacat tttttttgtt tatttgtttg tttttgtgag 23400
gactagctga agggggtgat gtatattaac ctgcctactt atttgcctct tcccagagtg 23460
tgatgaatat tagggtttaa agtttctgaa gcatttgtta ataaagcccg gggctggagg 23520
tcagaagacc tggatttctc tgcatacttt tgccatcagc aagctgtgtg accttggaca 23580
gatccctttt ttgtctaaat ctttctgagt cttcttgaaa acaatgccag gttgggacag 23640
gatgattgcc aagctcccgt ccagctctaa aacactgcaa cgtatgcttc tgcaccagca 23700
ctgtccatcc tgtagatcat gcagaaattc tcttcaactt tttcctaccc ataaaatagg 23760
agcatgctta cctttttcct aatgttccag gccccgggtc tagaatattg taagtaagga 23820
agttaatgtg tatcagagcc cattatgggc cagaagttct cctcttcctt cctacacctg 23880
cttcctccct ccctccctcc ctctttccct tccttccttc catccatttg tgaagaagac 23940
atgatcaccc tcattctgag agtgaagaga cagaggctca actaatgaaa tgatttgttc 24000
aaggtcacac gggtggcaca aggcaagtgg cagaggttga atttagaccc attcctgtcc 24060
aaatgctgag tttatgtcat cgtcccgaga ccataacttt aaagatgtaa gatagtggga 24120
aaagagttga tttcaaagca cctctcagaa ggactcactt tacatcaggg gtcagcagac 24180
tcaggccaaa tccggtccat tccccgcttt tgcaaagaaa gttgtagtgg aacacagcta 24240
ggcttattga tttatggatt gccaacgtcc ttttgtgaaa cagacagctg agctgagtaa 24300
tcgtggcgca caaaacctaa aatatttact atctcgtcct ttacagaatg tttgccaatc 24360
tatggtccgg agtccaaggc tgtccatttt tcaaagaaca caaagtgaca tgagactgtc 24420
ccatgtgcag ggagccctat cattttatta tgaaaaaacg gcctttctgc tcaaatctgt 24480
tttttaaaaa gtcaacaaac agactctggg tacctgtcag gaacagtagg gagtttggtt 24540
tccattgtgc tcttcttccc aggaactcaa tgaaggggaa atagaaatct taattttggg 24600
gaaattgcac aggggaaaaa ggggagggaa tcagttacaa cactccattg cgacacttag 24660
tggggttgaa agtgacaaca gcaagggttt ctctttttgg aaatgcgagg agggtatttc 24720
cgcttctcgc agtggggcag ggtggcagac gcctagcttg ggtgagtgac tatttcttta 24780
taaaccacaa ctctgggccc gcaatggcag tccactgcct tgctgcagtc acagaatgga 24840
aatctgcaga ggcctccgca gtcacctaat cactctcctc ctcttcctgt tccattcaga 24900
gacgatctgc cgaccctctg ggagaaaatc cagcaagatg caagccttca ggtaaggcta 24960
ccccaaggag gagaaggtga gggtggatca gctggagact ggaaacatat cacagctgcc 25020
aggggctgcc aggccccaga gggcctgaga actgggtttg ggctggagag gatgtccatt 25080
attcaagaaa gaggctgtta catgcatggg cttcaggact tgtgtttcaa aatatcccag 25140
atgtggatag tgcgaccgga gggctgtctt actttcccag agactcagga acccagtgag 25200
taatagatgc atgccaagga gtgggactgc gattcaggcc tagttgaatg tgctgacaga 25260
gaagcagaga ggggcaccag gggcacagcc cgaaggccca gactgatatg ggcaaggcct 25320
gtctgtgctg acatgtcgga gggtcccact ctccagggac cttggtttcc ccgtctgtga 25380
catctgtgac atgagagtca cgataactcc ttgtgtgcct tacagggttg ttgtgaaaat 25440
taaatgcaca gataatagcg taacagtatt ccgtgcattg taaagagcct gaaaaccatt 25500
atgatttgaa aatggaatcg gctttgtgag accatcacta ttgtaaagat gtgatgctga 25560
tagaaatgac aggactgctt gtgcatgccc tctgcagtgt gacattccag cagtgaaatc 25620
atgttggggt gacttctccc ccactctgac ctttatgttt gtctgggccg aggctgcaag 25680
tcgggctctg tgggtgtatg agtgacaagt ctctcccttc cagatatggg gactgtctgc 25740
ttccctaggt tgcctctccc tgctctgatc agctagaagc tccaggagat cctcctggag 25800
gccccagcag gtgatgttta tccctccaga ctgaggctaa atctagaaac taggataatc 25860
acaaacaggc caatgctgcc atatgcaaag cactttggtt tgcctggcca cccctcgtcg 25920
agcatgtggg ctcttcagag ccacctgatg aggtgggtac agttagccac acttcacagg 25980
tgaagaggtg aggcacaggt cccaggtcag gctggccgga gctctgttta ttacgtctca 26040
cagctttgag tcctgctctc aaccagagag gccctttacc aagaagaaag gattgggacc 26100
cagaatcagg tcactggctg aggtagagag gaagccgggt tgttcccaag ggtagctgct 26160
cctgcaggac tctgagcagg tcaccagcta atggaggaaa ggctctaggg aaagaccctt 26220
ctggtctcag actcagagcg agttagctgc aaggtgttcc gtctcttgaa acttctacct 26280
aggtgctatg gtagccacta gtctcaggtg gctatttaaa tttatactta aatgaatgaa 26340
aatagaagaa aatttaaaat ccagaccctt ggtcacacta tccacattta aagaggtcaa 26400
tagccacatg tggttagtgg ccaccctatt gggcagtgca gctacagaac atttttgcat 26460
cccagaaagt tcttttggat gttgctgctc tacagcatgc tttgctgaaa cagaagtgcc 26520
ttccctggga atctcagatg ggaagcaagt aaggagggga gtcaaatgtg ggctcactgc 26580
tcaccagctg tgagggttgg gcctgcctct taaccattgt cagcctcagt cttctcatcc 26640
atgcatgccg tgggtatact aaaatactat acccctggaa gagctggatg caaatttgac 26700
aagttctggg ggacacagga aggtgccaag cacaaggctg ggcacatggt ggctgtgcac 26760
tacagctgag tccttttcct tttcagaatc tgggatgtta acc 26803
<210> 21
<211> 177
<212> PRT
<213> 智人
<400> 21
Met Glu Ile Cys Arg Gly Leu Arg Ser His Leu Ile Thr Leu Leu Leu
1 5 10 15
Phe Leu Phe His Ser Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser
20 25 30
Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe
35 40 45
Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn
50 55 60
Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala
65 70 75 80
Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys
85 90 95
Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp
100 105 110
Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser
115 120 125
Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp
130 135 140
Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn
145 150 155 160
Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp
165 170 175
Glu
<210> 22
<211> 159
<212> PRT
<213> 智人
<400> 22
Met Ala Leu Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser Lys
1 5 10 15
Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu
20 25 30
Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn
35 40 45
Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe
50 55 60
Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly
65 70 75 80
Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser
85 90 95
Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser
100 105 110
Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu
115 120 125
Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro
130 135 140
Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
145 150 155
<210> 23
<211> 180
<212> PRT
<213> 智人
<400> 23
Met Ala Leu Ala Asp Leu Tyr Glu Glu Gly Gly Gly Gly Gly Gly Glu
1 5 10 15
Gly Glu Asp Asn Ala Asp Ser Lys Glu Thr Ile Cys Arg Pro Ser Gly
20 25 30
Arg Lys Ser Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln
35 40 45
Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln
50 55 60
Gly Pro Asn Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu
65 70 75 80
Pro His Ala Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser
85 90 95
Cys Val Lys Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn
100 105 110
Ile Thr Asp Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe
115 120 125
Ile Arg Ser Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys
130 135 140
Pro Gly Trp Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser
145 150 155 160
Leu Thr Asn Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe
165 170 175
Gln Glu Asp Glu
180
<210> 24
<211> 143
<212> PRT
<213> 智人
<400> 24
Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu
1 5 10 15
Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn
20 25 30
Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe
35 40 45
Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly
50 55 60
Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser
65 70 75 80
Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser
85 90 95
Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu
100 105 110
Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro
115 120 125
Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
130 135 140
<210> 25
<211> 3804
<212> DNA
<213> 智人
<400> 25
taatttcagt gaaattatat aacttggtta catttaggtt acttattaca aatgaaaata 60
aatatactaa cagaagctgc ctcatatgca aatgagtaac atgttagaga ctaaaataca 120
caaaaaaatg catgtgcttt agctcatata aacaatatac aggacaactt accgggtagc 180
ataaacaacc aacaacggac tatcaaaagg aacctcgtca tctagtaact ttaaccttgt 240
tggtagatct cctttttcca tctccatata cacaggattg gaacttgcca tttctgaaat 300
ataaagcata tccttttcca aactttatct cttaggcgga aatattcaat ttatgaacat 360
gttcattcag caatcattag tcacgtacct actgtgtgga cctattatgt gcaaggccca 420
atattaagca ttacaagaga aacaaataaa agtacaagag atgtaatttc tacttttaag 480
aaccttaaaa tctaattggg aggcaaagca tattaaaagt tttaaataag acgaaggaac 540
atataattaa tacatcagtg actattactc ttaaaataat gagtatctag gcctatatat 600
agcaactgtc catataagca cacatcaaaa accaatatac atagctatca tcaatgccaa 660
gttgctcagt tttttctaga actagtattc ctactccatc ttttagaatt aaattcaatg 720
aaattaattt taaaatattt gacctttttt taaagttacc agtatagcaa atactcattc 780
tctgaagaac agaagatttg actttttgga atagccaaaa gtcacttaaa atcaagtctg 840
gtgaaaggag tgatgatcta aaactatttg tggtttaaaa aaaaaaagta tgaatctaaa 900
gtaaagtggg tttttttcca agtagttttc ttttttagtt ttttagaaac agggtctcat 960
tctgttgccc aggctggagt gcagtggtga tcactgcaac cttgaactcc tggctgtgtg 1020
tgtgtgtgtg tgtgtgtgca gcgacggggt cttcctacgt tgcctagctg cagtgcctgt 1080
gtgcacacat gcgcacatgc gtgtgtggag agacagggtc ttgctacgtt gcctagctgc 1140
aatacctggg tgtgtgcatg tgtgtgtgtg tagagacaag gtcttgaaac gttgtctagg 1200
ctggcatgtg tgtgtgtgtt tatatgtatg tgtgtgtaga cagggtcttg ctacattgca 1260
taggctggtg tgtgtgtttt tgtgtgtgta gagacggggt cttgctacgt tgcctaagct 1320
gggcaagtat ttttcaactg cctctgaaga caaatcccaa ataacagttc caaaagctgt 1380
ttcccataat tatcacatca ttagaagggt gaggcctact caccaggttc taagagccaa 1440
cattcatttt ctgatacatg cttttttaaa aaagtcattt tttccccagt ctcattgttt 1500
cccatttgac tgtgtcaggc aataagtact ttaaaggaat tcagaggagg aggccattca 1560
gaggtttggg gaagcctgat gactgcgcgg gagctaaacc agacatatcc acctaaattc 1620
aagtaagcag ccatatcact caaattgccc accatgcttc ctctagccag cactggtagt 1680
aacaactatc actctggctg atggagactc ttttctgctc ttctgtgact gggtatgatc 1740
acataataga gacagataca gtaaatttcc aatgagtaat aatgtcacac atttgaactt 1800
acctgaggag aaatagcttg tttcttattt cacacaaaag acaatctacc tcaactcaga 1860
aaaaaaaaaa ttattatgct tttaactgct atatttgaat taaagcagat ctgtaactat 1920
agatccatgt ttctagaaag ctaaaatatc tttaagtaag atgacataaa aatgtatctc 1980
tattcacttt tggtaatgaa tgaaaagttg cttaaagtct aaagtattag aaatatggca 2040
tctgttattc aagtaggatt tggaattaag aaaattcact tcttcaaaaa catgggacta 2100
tggctgcaga aagggcaatg catatagttt ttagggtatg atagctggtt tctattatat 2160
gtcaggatga catatgcgac cttccgccaa ggtagatact gcgggctatg caccaaagtc 2220
tctgaggcag acatgtaagc gagctcttca cctatattca ttcttttcct cctggacagg 2280
ttacatttcc cagtttcctt tgcagttagt tgtggctata tgacagaatt ctcatcaatg 2340
gaaatgtaca cagaagagag gtaagccact accaggccag gcctataaga cagcactttc 2400
tacatgcttt ccccagacat agcaacccaa acatgaccac atcccttaag ggaagatgga 2460
gctgaaaata atggaaggaa cttggaatgc tagaatgctg aattaccacc tgggagacag 2520
ctacccactg acctggaata cctgtcctgg actgttacat gagcaagaaa tacacttcta 2580
tttatgtatg agttacttca ttatcagata tttattacag cagtttagct acctaagatc 2640
tctctctgcc tcagactgct tatctataaa atggaataac accatctact ccaaacatta 2700
ttgtaaggat gaaatgagac aatgctgaaa agtgtttacc ataatatctg ccacacaata 2760
agtaccccat atagtatttc tgtattagta agttacatga gagattttct tcttttaata 2820
catctgcatt tataaacatt ttactttaac ctcaacttcc ccagcactgc tctaccattt 2880
tctgaatgtc attatgagag aaataaaact aatttctagg gccaggcatg gtggctcaca 2940
cctataatcc cagcattttg ggaggccaag gtgggaagac tgctttgagg tcaggatttc 3000
aagaccaacc tgggcaacac agtaagaccc catctctata aaaaaatgaa gaaatcagag 3060
ggtacagtgg cacatgcctg taatcccacg actcagaaaa ctgaggcagg aggatcgctt 3120
gaacccaagg gatcaaggct acagtgagcc atgatcacac cactgcattc cagcctgggc 3180
acagagtgag accctgtctc taaaaataaa aaatagggcc aggcacagtg gttgatgcct 3240
gtgatcccaa cactttggga ggccaaggca ggtagatcac ttgaggtcag gcgtttgaga 3300
ccagcttggc cgacatggca aaaccctgtc tctactaaaa tacaaaaatt agctgggcgt 3360
ggtggtgcac gcctgcagtc ccagctactt gggaggctga ggcaagacaa tcacttgaac 3420
ccaggaggcg gaggttgcag tgagccaaga tggcgccact gcactcaaac agaatgaaac 3480
tctgtctcaa aaaaaataaa ataaataaaa atttaaaaac taatttctta taatccagtt 3540
gtgaatttaa ccaatgtctg aaagaactat taaaagttaa aatgaatgga aaacagaata 3600
aagggttgac cagaacagat gtgattttct acttaaatct tttttttaaa ccccaaaatt 3660
caaaactgct aatgtttttt aatacgaatt tctatctttg ataaggcaat ctgagtatta 3720
cctttcaatc cttcaataaa agtatcccaa acagaagggc tattactgta actaagcttg 3780
atactctcct tcgctctttt caag 3804
<210> 26
<211> 3804
<212> DNA
<213> 智人
<220>
<221> misc_feature
<222> (2122)..(2131)
<223> n is a, c, g, or t
<400> 26
ggcttctggc tctgagtgag gtcctgctgc aaggtttcct agatgagcca ctgagactct 60
aataagatcc agtggaaata accaggctct cgtcggaata taagtcccaa gggaagctgt 120
gccagtcttg tgggcgactg cctgacttct cctttcattt cagcaccatg aagcttctca 180
cgggcctggt tttctgctcc ttggtcctgg gtgtcagcag ccgaagcttc ttttcgttcc 240
ttggcgaggc ttttgatggt aaggcttcag aaggtttgca ggatttctga agagaaacat 300
caccctggac ctgataaact ggggaaaatg atgctttcgg aaggctgctt ttgaaccaca 360
gagttgctag tgtctgcgtt gctgaggcct gccaggaact agggtttgct gggttgcctg 420
tctcgagtct ttcagagctg ctgggaatat cccctttccc cgtagtgcag cttctcagga 480
tgtgttaagt ggatggatca catttcagaa gccgctgcaa ggtgtatcaa aaacacatct 540
cctgagccgt aagggacggg gcatccagta acaacgcaca cggggtattt ttgggcttcc 600
ttaagatttg agccgctgcc ttaggttgtg ctgcccaatg tgcctgggga gctgctaaac 660
agattagaga gtcgaggatt gttgtcagtt actcagagaa agaacaatca tcctttccag 720
gagcacctga gctgtttgtt ttgcgtagaa gatgcaaaat aaggcctgca atgggtataa 780
aatgtccctc agcataaatc gcataggagt atgactaagg ctgttgactc ttctgtcttc 840
tttctccttc ctccttcgat ttcctagttg gataatgtac agggctcttt agcctcgctc 900
tgtcaggggc tcccttcctg gtttgttctg tttccattct tccttctcca gccttcttga 960
caagagctgg gaactaacgt gcctcaagcc cccacaagga ccacagcatt ttctcattta 1020
gtttcagaat gactctgtga cgcaatcttc ctctcttgga aggtgagaaa gctgatcttg 1080
gaaggtgaga aagctgagac ttagagcagc tgaagccaat gcccagggac ttactgccag 1140
tcagcaggtg gcagggcaga ggtttgagcc cggctgtgct tgaggtcagg gctcttgcca 1200
ggtagacgca tcactgacca cctcctagag gttgatggtt atgaatctca ggcacacctt 1260
ggcatcacct gaaataccca tgccttcaac tccccagcag agtctgcaga aactggcctg 1320
gggtgtggcc tgggcactgg gactttcagt ttctctctgg gtgattagaa agtgcagcca 1380
aggctcacgc ctgtaattcc agcactttgg gaggccaagg tggatgaatc acttgaggtc 1440
atgagttccg gagcagcctg gccaacatgg tgaaaccccg tctctactaa aaatactaaa 1500
atgtagccag gcgtggtggc aggcacctgt aatcccagct actcaggagg ctgaagcacg 1560
agaatcactt gaacccgaga agcagaggtt gcagtgacta gagatcgcac cagtgtcctc 1620
caacctgggt gacagagcga gactccatct aaaaaaaatg aaaaagaaag tgcagccaag 1680
gcagagcacc actgccctat tgcttcctca agcaacccac agcatcagta cagcctacta 1740
agaaagtatt tagggacttt tatgctccta acagtcactg gaactcacgt cacaatgacg 1800
tgtattccat ttgcaagaat atatacttta ggtcggggtg cggtggctca cgcctgtaat 1860
cccagcactt tgggaggcca aggcaggggg atcacgaggt caggagttcg agaccagcct 1920
gaccaacatg gtgaaatccc cgtctctact aaaaatacaa aaattagcca ggcgtgatgg 1980
cgcatgcctg taatctcagc tactcaggag gctgaggcag aagaatctct tgaacctggg 2040
aggtggaggt tgcgatgagc tgagatagca ccactgcact ccagcctggg cgacagagca 2100
agactctgtc taaaaaaaaa annnnnnnnn naaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaagaatata aactttagta gtcagggcag aagtactctg tgtctgccac ctttctcagc 2220
atcagtattc catgtcacta cctcattcat acacactcct ggatcttatc ataggcagct 2280
tcattctata gcagtggctc ttcaccaggg cacttgaaga agccaactag gataaaggaa 2340
tgtgcttctc aacccatggt atccaaggct gctatgatca caggctgaaa gcttgaagtc 2400
agtggaagat ttgtccttcc tcattcccct ctaaggtgtt gttggagtct ttatgttctc 2460
ctgatgtccc ttctgccttt cctttccttt ccaggggctc gggacatgtg gagagcctac 2520
tctgacatga gagaagccaa ttacatcggc tcagacaaat acttccatgc tcgggggaac 2580
tatgatgctg ccaaaagggg acctgggggt gcctgggctg cagaagtgat caggtaactg 2640
gagctcctgg gacgttaggg ctgggtgagc agagcttgcc tgccttggac agtcaggagg 2700
gagacgagct ccttgtggag aagttagagg ctgcggcccc tcctcctctt gccctctctc 2760
tgcctctgtg ctcagtgtga ggtctgagtg gatggtagga gtgagtgatt cctcatcctc 2820
cctctctggg tgctgttcat ccagcctagg ggtgcccagc ctggctgaat ggggtggtgc 2880
ccagtgtttt catccctcct tccttggcct ttctgggctc ctctctgagc cctcccttgg 2940
aacagggaga atgggagggt gggctattgc tcactggcct gattattaat ctccttcttg 3000
cctgccttga ttacagcgat gccagagaga atatccagag attctttggc catggtgcgg 3060
aggactcgct ggctgatcag gctgccaatg aatggggcag gagtggcaaa gaccccaatc 3120
acttccgacc tgctggcctg cctgagaaat actgagcttc ctcttcactc tgctctcagg 3180
agatctggct gtgaggccct cagggcaggg atacaaagcg gggagagggt acacaatggg 3240
tatctaataa atacttaaga ggtggaattt gtggaaactg ggtgttatac tttgtggtat 3300
agactgcctg tttagtatga aggggcgatc catgcacatc taagtgaacg tggaggctgg 3360
gtgggtggga gacgactcct gggcacacag ggcatcctgg gcatccctga ggcaaggaca 3420
tgatgagttc agtggccacc cccacaggat cccaggggct tcagcagatc ccacccctta 3480
ccccatgtga gcagctgccc agtgagtctg taggaacccg agccacattc ccagtgagtt 3540
caactgcacc ccggcacgtt ttgctagcac ctcaatggag agctccttgc ttgcagcttt 3600
ggcttgtggc acccagcaaa agcttcctgc cacccagtgg ctacagccac acactctcca 3660
gcaagattta atctcagcct tgtgaggagc cctttcccaa atttatttct ttctgtgttt 3720
tttatccctt agtagctaat ctcatgttag ccattaataa ctctctatgt taaacccttc 3780
cttttgtatc tgcggctaca ttga 3804
<210> 27
<211> 3804
<212> DNA
<213> 智人
<400> 27
gtataaatgc agaggtgcag taactgggct tttcaggata tccagatgga gttgtggtgt 60
tgttttgctt gtggttttta acgttaactt ttttttcccc tttattttaa gagaagcaca 120
aaatgaacaa actagtgagc ccagcaacat ggatggaaat tccggagatg cagactgctt 180
tcagccagca gtcaaaaggg tatgggcaaa aaaatatgaa ccatttgggg ctcaagtttc 240
tccaaatact ttatgtgact gcaagtactg tatacgctta tttcctgtga ctcagttctt 300
ctaactaaga tgttaagcat ttggcttaaa gtgtatagca ttacaaagag tatttcccca 360
gctttggctt gccagccaac tttccattga ctctagcctg ttagccattt ttattgtttt 420
ttgtttgttt gtttgtttgt tttcctcaca tgtacacata catacagatt gttcttatat 480
gtgattttgt tctctgggaa taaaatcttc attcaacaga ggcaatatga cagaaaaacc 540
gaagtttcat gtatatgatt tttcaaagaa agtgaattgg ccctcatgtt aaacctagca 600
tttcagagct gaaagtgtct tctcattaaa tattgaagaa atcatttgag ggtgtggaga 660
aggatggaca gaattagctg cttgtgtatt tattcttctc ctgcaacttt gccacgctat 720
tttgtacctc ccttcctaat tatgataaag ctttcttaga gagcagtcag gcaatgtgta 780
ttaaatgttt aaagctttac acccttagtt ctacttgtgg acatttattt cttaagaaag 840
atgtatacta agatttagat agaaatattc attacagtat cataataaag acagtagcaa 900
ggattctgtt atctgtgttg cattaataca atagagattg atgcaactgt tcattatttt 960
gaaagcatta atgataatat tgcatcaaag agttcactga acagattgta cagtacagtt 1020
ttacacacaa aaaaaatagt ttgtgagctt taaaagggcc ttcaaatgaa tatgctaaac 1080
ggttatcttt caataaagag agtatgggta agtcttaatt tctttcattt atttcagtaa 1140
tttaatgttt ttgttgttgt tattgtttgt ttttttgaga cagagtcttg ctctgtcacc 1200
caggctggag tgcagtggtg caatctcagc tcactgcaat ctcggctcac tgcaacgtct 1260
gcctcctgga ttcaagcaat tcttctgcct cagcctccgg agtagctggg attacaggcg 1320
tgcaccacca tacctagcta atttttgtat ttttagtaga gacggagttt tgccatattg 1380
gccaggctgg tgttgaactc ctggcctcat gtgatccgcc catctcagcc tcccaaagtg 1440
ctggggttac aggcatgagc cactgtgcca gcctatttca gtaacttaat gtttttacag 1500
gcatgtatta cctataaaat taataaagcc agtgaggtat ttcttttttg aactaaagca 1560
aagctaataa taagttatag agaagttaga gaagaaatct attaagtgat actttctttg 1620
tatactgttg ggctgagtac ccttgattct tggtggtgaa caagttatca gaaatttctt 1680
ggccaggagc cgtggctcac acctgtagtc ccagcacttt gggagtccaa ggtgggtgga 1740
tcacttgagg tcagaatttc tagatcagcc tggccagcat ggtgaaaccc tgtctctatt 1800
aaaaatacag aaattagcca ggcatggtga cgtgcgcctg taattccagc tacctgggag 1860
gctgaggcag caaaatcact tgaacctggc aggcggagtt cgcagtgagc tgggatcgcg 1920
tcgctgcact ccagcctgga tgacagagca agactccatc tcaaagaaaa aataaaaaag 1980
aaatttattt acttgtgtga atttttacaa tacagatgct tctcgactta aatggggcta 2040
catcccaata aactcataag ttgcaaatac tgtaaatcaa aaatgcattg aatacaccta 2100
atgtatggaa caccatagtt tagcctatcc tactttaaat gtgttccgaa cacttagatt 2160
agcctgtagt tgggcagcat tacctactat aaagtgtatt ttctaataaa atgttgaata 2220
tctcatgtaa ctcattgaat actgaaagtg aaaaacaatg tatgggtact caaaatatgg 2280
tttctctact gaatgtgaat cactttgaca ccatcataaa gttgaaaaat tccaagtcaa 2340
accattgtaa gtcaggggct atcagtattc agtggtaaat gctggctcta actattcttc 2400
caagtcagtg gttgactgct gtttattcta taaagggtta caatttatag attctctcac 2460
ttgtagaatg agagattcag aattaatagc agacagagtc cctaccttga tggagctttc 2520
atttaagtgt gaaagtcagg tgacctaaca aggccttggc ataagtttag gatttggatt 2580
gttatgggag cttgggtagg gacatgtcat aggtaaggca acagcagggg tagagataag 2640
cttgacatat gtcaaaaatc atgaagacat cagtaatcct tgaagttggc tgaaaggtat 2700
agagttgaga aagtagttaa aaaaaaaaaa gtcaggctga gtctaggtaa ggatgtgttt 2760
ctctgaggtc agatttgttc ctgtaccata aagggactat ttagaatctt aaagctggag 2820
caatttaaaa cgttaagttt tcagattgag gtcagatttg tgacttcatg tgaggtcaga 2880
tttgttcctg taccataaag ggactattta gaatcttaaa gctggagcaa tttaaaacgt 2940
taagttttca gattgacgtt ttttgaggta tagttaataa cctgaatgtt ctgattctag 3000
tcttggtagt caataagagt tgaccagatg aatttcatag ctttgtagag gatgaaatat 3060
ttcaaggctg atttgcacaa atgtttacat agatcatgta tctttcataa gtaatatgtt 3120
tgtattatta caaggctgta aaaatttaag caggttgtta atagcacagg gggtaacaga 3180
ttaataaaat taatgaataa aattactaaa agagtccaga agtaaaccca aatacgtgga 3240
ggaattaagc atatgtatga tacacatgac attttaaaaa tcagtgggaa aaggtaaatt 3300
attttacaaa tggtgttaga agcactgatt gataattttg ttaaaagaaa cttagattcc 3360
ctattttact cctaatccaa aataaattct gagtggatct aagattaagc aaaaattaag 3420
ccggaagctg agcatggtag catgtgtctg taatctccgc aatttaggag actgagtttg 3480
gctggggagg tggtgatatg cgcctagaaa aaaaaaattt tttaagccac agatgtataa 3540
gcaaaaagcg ggcaaagagg cggaattttt tttttttttt ttgatgaagt ctcacttgtc 3600
gcccaggctg gaacgcagtg gcgtgatctc agctcactgc aacctctgcc tcccgggttc 3660
aagcgattct cctgcctcag cctcccaagt agctgggatt acaggcacct gccgaggaga 3720
ggattttttt ataattaaaa caaaacaaaa caaaaaaaca ccaaactgga agataaagta 3780
tttacaacat gtaaaagact gttt 3804
<210> 28
<211> 122
<212> PRT
<213> 智人
<400> 28
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 29
<211> 122
<212> PRT
<213> 智人
<400> 29
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 30
<211> 122
<212> PRT
<213> 智人
<400> 30
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 31
<211> 5687
<212> DNA
<213> 智人
<400> 31
ctctctggtt gcccttaaca ttttttcctt catttcaact ttggtgggtc tgatgattat 60
gtgtcttggg gttgctcttc tcgaggagta tcttagtagt attctctgta tttcctgaat 120
ttgaatgttg gcctgtcttt ctaggttggg gaagttctcc tggataatat cctgaagagt 180
atttttcaac ttggttctat tctccttgtt actttcaggt acaccaatca aacgtagatt 240
tggtcttgtc acatagtccc atatttcttg gaggttttat tcgttccttt ttattctttt 300
ttctctagtt ttgtcttctc gctttatttc actaagttga tcttcaatct ctgatatcct 360
tgcttctgct tgattgattc agctatcccc cgctcgatat tacaaaccat gtcacgaggc 420
gtggacaccc cccatgatat ggggagtatt atcacccccc tcttccccca ctggatatta 480
caaaccatgt catagggagg tggacatccc ccacaatatg aggagtaata tcacacccct 540
ttccccgcag tggatattat gaaccatgtc acaggcggtt aaacaccccc aacgatatgg 600
ggagtaatat cacactcctc tcccccctgg atattacgaa ccatgtcatg gggggtggac 660
accctttgca atatggggag taaaatcacc cccctctccc ccaactggat attatgaacc 720
atgtcacagt gggggaaaaa tcctctgtga tatgcagagt aatatcaccc cactctcacc 780
acctggatat tacgaaccat gtcacagggg ggtggacacc ccccaagatg ggggagtaat 840
atcacctcac tctctgccac cagatattac aaactgtgtc acaggggggt gaacaacccc 900
cacaatatgg ggagcactat cacccccctc ccccagggta ttatgatcca tgtcacaggg 960
gggtggatac cacccactat atggggagta atatcacctt tctctcccgc cctggttttt 1020
atgaaccgtg tcacaggggg gtggacaccc cttgcgatat ggggagtaat atcacccccc 1080
tctccaccat ctggatatta cgaaccatgt cacagggggg tggacacccc tgcgatatgg 1140
ggaggaatat gcccctctcc ccacctggat attacaaatc atgtcacggg ggacggacat 1200
cccccacaat atggggagta atatcaccac actctcccct gctggatatt acgaaccata 1260
tcacaggcgg ctggagacac aaggcattaa caatatttcg agtaatatta tctttccctt 1320
tgaacattat gaacaatatg acagaggggt gtacacctcc tgcgatattg ggagtaatgt 1380
catcccctcc cccactggat attaggaacc atattactgg gggatgtatt cccccttcta 1440
gattgggagg aagatcatac ttgccctccc tgaatatttg aaacaatatc ataggggttt 1500
gtacactttt acgatattgg gagtaatatc atcctttctc cccctggaaa ttaggaacaa 1560
tatcacaggg gtggtgtaca cccctgcaat atttagggta atattattgt cttctcccct 1620
cgatattagg aacaatatta caaggacggt gtaaagtacc tgccaaattg ggaaaaatac 1680
tatcctctcc ctcttgtata ttagaaacaa taacacaggg ggaatgtaca cccactgcca 1740
tattgggagt aatatcatac tcgccccatc ccccagatat taggaacaat atcacagcag 1800
gggtgtacac ttttacgata ttgggagtaa tatcatactc tctccccctg gaaattagga 1860
ataatatcac agagatggtg tagaccctct gcaatactta ggataatatt atcatctccc 1920
ccctcgatat taggaacaat attacgggga gtgtaaatta cctgccaaat tggaggtaat 1980
cctctcctct ctctccctgt attttagaaa atataacaca caggaaatgt acaacactgc 2040
gatattcgga gtaatatctt cttctcccca cctggatatt aggaacaata acacggacgg 2100
ggcgtacacc cctcgcgata ttgaatgtaa tgtcatcctc tccctccctt tatattacga 2160
acaatatcac aggggggtgt acaacccctg caatattgga agtagtatca tccattctcc 2220
catgaatatt aggaacaata tcacaggggt agagtacacc ctctgcaatt tcgggagtaa 2280
catcatcctc tcgttccctg gatattataa acaacaccac gggggggtgg gggtgtacac 2340
acccttcgat attgggagta atataatcct ttccctccct atatattaga agcaatatca 2400
caggggttgg tgtaaacttc ttgcgatatg gggattaata tcacccccct ctcctgccct 2460
ggatattatg aaccatatca cagggaggtg gacacacttt gcgatatggg gagtaatatc 2520
acgcccctct cccccccgat attacgaacc atatcacaag ggagtggacc ccccccacga 2580
tatggggagt aatatcaccc ccctctcccg ccctggatat tacgaaccat atcacagggg 2640
gatggacacc ccccgcgatg cggggagtaa tgtcaccccc ttctgccccc taggatatta 2700
cgaaccatat catggacacc ctccacgata ttggaaataa tatcatcctc tcccccttgg 2760
atattaggaa caatatcaca gggggttgta cacctcctat gatattggaa gtaatatcat 2820
cctctccctc ctggatatta gcaacaatat cacagggagt gtgtacaacc ccagcgatat 2880
ttggagtaat atcaccctct caccccatgg atatgagaaa caatatcaca ggggaggtgt 2940
acatcccacg tgatattgtg tgtaatatca ttcttcccca acccctgcaa tattgtggtg 3000
taatataatt ctctcccttc ctggacatta tgaacaatat cactactagg tgatacatta 3060
ggagtaatgt atccatagga tattatgagg aatatcacag ggtgtacacc cactgtgata 3120
ttagaggtaa tatctcccta aaatattaag aagaatatct tacacccact gtgactttag 3180
aagtaatatc tccctaaaac gttacaaata acatcgcagg gtgtacactc acagtgatat 3240
taggagtaat atctccctag aatattacaa atacacatgg tgtaaaccca ctgtgacttt 3300
agaagaacta tctccctaaa ataatacaaa aatatcgcag tgtataccat aatatcccct 3360
agaatatcat aaataatatc acagggtgta cacccactgt gataatagga ataataccac 3420
cccaggatat tatgaataat gtcacaggct gtacacccac tatgacatta ggagtaatat 3480
ctccctagga cactatgaat aacatcacag attttacacc catggtgtgc acccactatg 3540
atattaggag taatatctgc acaggatata acaaataata gtacagggtg tacacatatg 3600
atatacaccc actgtgatat taggagaaat atatccctag gatattatga ataacctctc 3660
agagtacaca cacatggtat acaccctctg tggcattagg aacaataact ttctaaaaca 3720
ttacgaataa catcacagaa tgtacacaca tggtttacac ccactgtgac aggtgcaata 3780
tctcccttgg atattatgaa taacaacaaa ctatcactgt catattagga gtaatttctc 3840
cctagaatat tacaaataac atcacagggt gttcatttat ggtgcacacc cactgtgata 3900
ttaggagtaa tatctcccta ggatattact tttcatataa aagtgtgtac atccactgtg 3960
atattgggaa aaatatttct ctaggatatt atgaataata tcacagagcg tacacccact 4020
gtgatattag gagtaataat tccctgggtt attatgaata atatcacagg atgtacaacc 4080
actgtgatat taggagcaat atcttcctag gatattacaa ataatatcac agggtgtaca 4140
cccactgtga tattaaagta atttttaggt tattgtgaat aatatcacca agtgtacaaa 4200
catggtgtac actcactgtg atatcaggag taatatctca gtaaaatatt atgaataata 4260
tcacagggta tacacccact gtgatattag cagtagtatc tttgtaggat attacaaata 4320
atatcacagg gtgtatgccc actatgacat tagaagcaat atctccctag gatatcaaaa 4380
ataatatcac agggtgtaca acttctacat cccaggttct aagggattct cctgcttcag 4440
cctcctgagt ggctgggatt acagatgccc accaccacac ctggctaatt tcgtattttc 4500
agtagagatg gggtatcacc atgctggtca ggctggtctg gaacttctga cctcaggtga 4560
tccaccagcc tcggccttcc aaagtgctgg gaatacaggt gtgagccaac gtgcttggca 4620
gagagttata tattaaataa atctggaaac atagctccca tgtttgagtg tgcatttact 4680
tttatgaaga aattatgtca gaaaacctaa ggatgataat aaatatgaaa agtaactggc 4740
atgtaaaaag gtcttttgat taagaactat aaggttcgat ttcattttta gataacgtga 4800
tcctagctct tgtatagtgc ttataaatat tctacatcaa aggaatttgt tgcacagtgt 4860
cagaataaaa taaagtgtat ttcactgctt cttaattttt aaattagact gagtttgttt 4920
tcctagagag agaagaacat tttttatttt ttctgaaaag agtaggccat attttactga 4980
gatcttagat ttgttatata ttaggttttg gtcttctaac attctccagt ggattttctc 5040
taaagtaggt atgcacagaa agagttgaat agcaaaaaag taaatcatgt aataattctg 5100
agatttttgg gtttgtcaca actgagaaat attgctgagg gtgtatggtc ctcaagtgtg 5160
aaaatgttcc ttgtgaattg cttgtatccg aaatatacac acaacattaa gtcctggttt 5220
ttatctttta ttttttccaa tccttttttc ttctcaaggt gtccaagtca cacagagcca 5280
cagaatctca caggtgtctc agaattcctc ctcctgggac tctcagagga tccagaactg 5340
cagccactcc ttgctgggct gttcctatcc atgtgcctgg tcacgatgct ggggaacctg 5400
ctcatcatcc tggccgtcag ccctgactcc cacctccaca tccccatgta cttcttcctc 5460
tccaacctgt ccttgcctga cattggtttc accttggcca cggtccccaa gatgattgta 5520
gacatgcaat cacatagcag agtcatctcc catgcaggct gtctgacaca gatacctttc 5580
tttgtccttt ttgtatgtat agatgacatg ctcctgactg tgatggccta tgactgattt 5640
gtggccatct gtcaccccct gcactaccca gtcatcatga atcctca 5687
<210> 32
<211> 5687
<212> DNA
<213> 智人
<400> 32
attgaatttt atctcagagc ccacatgaag caggatcaaa gtcagtacac atgaaaacta 60
gagcccaaag actataaagc atgaaataag gatttaagct aaccctatct tgtaaggggt 120
ttgtaaagcc cagcttgcat ctgagctaca ctagcaccag gacagccact cagtaatggg 180
gtttctcaag gttattgctt ttcattcagt tgaaatgaga gtcatttctt acccttatgc 240
cctgtgagat ttcactggag gttgttcact gaaacatttt catatcattg catcaaccct 300
cttgaactca ctgtgcctgc ccccagttca gtctgtgact cacaagtacc ctgcagcaaa 360
agaaatccaa tagagggcaa atccctcacc ttaccttcct ttctaagacc tttgatgttc 420
tcatgtgtca tttcataatt gggattgtca attagtcgcc tcatctctgg tcctcacttt 480
cctctctccc agccaaactc aaccttcagc ccacacaatg gaattcaaca aaatgaggta 540
acagttttct gtgtgagtca ctctgggcaa ctctgttcac agagcactgt gaggtgagca 600
gccagaaccc aggcaagtgt ttcagccatc caagaactgg caggcagccc aagagacact 660
ctcacctgat gacagactag caggatgagt cctggaggaa atggttccca acagctgcag 720
aaggagtctc ttggctcatg cacagcaatg ctcttctcaa ttaaaaacgt tgtcattatt 780
gacactgcag tgtaaaatcc ttttacactg tgctcacatt tctacaggcc ttcacctgct 840
ctgcccatta aagacaagac ccttccatga gatgatgaca tctctaagtt actgttccac 900
ccaaacagtc ctatataatg aagagaaaaa ttttgctggc cctcaaaagg caaacacaag 960
gagaaagatt tccacaagct gtttctcttt gctgagcact tagaggaaaa ctgtaagtgg 1020
ttggaagaag gctttgtttt ctacaagact tttagttatt cctcagaaat tttcctgctt 1080
attcccagag gaggtcatct cttagatgct gtcagtcaga tagggattgg cagccaagca 1140
gaggtgctca gagaggtttc caactaatgt ggccagcgga aaactgccaa agaagcaggg 1200
atccttagga caaataaact ggaagatatt ttggggataa aaataaatcc ttttgaaaat 1260
gaaagatgga gagatgctgt atatacaaat tgccctgttc tgaacaatgt tgtcactagg 1320
actggccctg gagaccaatg atacaaacca aaatgttctc agacatgctt tgatggtctt 1380
tttctccaaa gttatctatt ctgtttccat ttcattctca caggacttgc catggggttc 1440
tcataagatt tcacattggt cataatccag gtggccctgg actgcaacct ctgagttggc 1500
aacatcagaa taggaattac gaaaaaccaa tttaaagtta aatacagaca caggcaaaag 1560
agagatgggt tgtcgaagct agtgcctagg tggacactgc ctcacatttt taattccaga 1620
agccatcagt actgagtgtc agatctcatt agtcaaacac agtgatcagg aatcctgttt 1680
tcctggagga tttccttgag ggagggacca ctcaagagtc tgaaatattt cacgtcatag 1740
agtatggatc tcaccccaac acccaatcag aaaataggga gaactggaaa ccaaaattcc 1800
ccctcccgct gtggaaggat gaaaaccaga gtgttggagt tctgtcctga taatggagca 1860
gacagctagg cagcaatcaa tgagggccag tacaggaatt cagtgctaag tattgggtca 1920
taacagaagt agggaaggta ttaatccagt gctatatgag gatcctggga cactggctcc 1980
tagtaatcta gttataacta ttagcaaaaa agaaaaaaaa aatcagtgat gtgaagagat 2040
ggcctaaagg agctccagca atatagctaa gcagctggca agtggtctga ggagcattgc 2100
aattccaggc ctcctaaggt ggcagtacgg gcactggtaa gacattctgc tgtggtgaaa 2160
ctagtttacc atagaggatt cacaattaaa ataggcaaac aggaaatgca agacagaggc 2220
taacaaaggg tttttttttt ggtggggggg agttgtttgt ttgtttgttt gttttctgag 2280
acggagtctt cctctgttgc ccaggctgga atgcagtggc acgatctcag ctcactacaa 2340
cctctgcctc ccaggttcaa gcagttcttc tgcctcagcc tcccaggttc aagcagttct 2400
tctgcctcag cctcccaagt acctgggact atagctgtgt gccaccacat tgactaattt 2460
ttgtactttt agtacagact gggtttcacc atgttggcca ggctggtgtc gaactcctga 2520
cctcaagtaa tccccccgcc ttggcctccc aaagtgctgg aattacaggc atgagccacc 2580
acacctggcc agtttttggt aattcttaaa gaactcaatg agcaacactc aaacaaccat 2640
aaagactata gagctcatgg ttgaatttta gatagctaaa cagacaggag tttttgtaag 2700
ttttgtaagt cttgctcatc cttccctctt ccatcctcta tctcaactat tctgtctacc 2760
attaaagcac cttagacctt gagtttggca atgcaacaag tgtgtgctca acacgaaata 2820
ggtaattcaa tagcaaagcc ctaaaacagc ctggcttgat tatttctcag ggcatgcagt 2880
tcctttgaag caggatcatt ttaataataa taataataga aataataata gaaattgaag 2940
acaattattt cacaatttcc atacacctaa gagctataca tatgaatgat aatgcataat 3000
tgtaaagcat gcatattaca ggtaataaat atgttagcta attataaaca atgcccattt 3060
tcatatagtt tatccttgcc aaataaaact gtaaaaaaaa gacacctttc aaatgctgct 3120
aaggagtaat acctgaatga ggttgattta atggagtctt agttcctgca tgtgttctaa 3180
ttgaatagac tatgtagtaa ttcccttaca tacccatcca tgtccaagaa cagtgaagat 3240
ctttatttaa tatgaattat tgcagatgat tagcacagtc tagccaaacc attccagtaa 3300
ttgtttttac ttgttatatt aatatataaa ttctcaaagg atataacagt gatgttgggt 3360
gaatttcact gaatgatagc tcaaacacct gaaatattga ctaagaaaac taatttatca 3420
atactgataa tcaattttaa tatgttaatt gattgtaata caggattctg tggttcaaaa 3480
aaaaagaaca agcaaaaaaa ctttcttcca tttccaaata ccaattaata gatctctact 3540
tccccttgga tttcttctta ccacctacca cctccaatct tcattctttc ctcacaaact 3600
aaacataaaa gttacctaca aagcatagaa tctgtgttaa aggatattct tgcttgtttt 3660
aagtccaaaa ttaaacagct ctgaattatt aaaaagcaca tgaattcaaa tgtcctattc 3720
taataagaaa atggtttaca tttctctatg ttcaaggaaa aaaatagtca agggtgtaca 3780
agtggggtaa aaattatttc cagtaggtta tgtgatttaa gttatagaaa cgaaccaggc 3840
aattcaatta aatgtcatgg aaagtaggtt ttttcttttc ctcttttttt ctaatatgta 3900
cactttgtga gaagataaat ccatagtgtg ataatttgtc cactgggtcc atcagacact 3960
ggagacagct tcctaagaat tataaggctt ctaaaggctt ctaaagccta aattgcctag 4020
agcattttgt gtgccaggca ctttgctagg tgccctaggg atgcaagaag tataaatgtt 4080
ttatgagaat acaggctgga aatgtattct tgattattcc tgtggaattt ctaggcagaa 4140
aagagtctaa tggggtatag gtatattttc tcaacacaat tttctgagcc tttaccagat 4200
gcagttctat ggtttgaatg tgtccctcag agtttgtgtg ttggaaactt aatccccaat 4260
gcaataatgt tggtgaggcc taatgaaagc ctaataatgt aggtgaggcc taatgagagc 4320
tgtttagacc atgaaggctc ttccctcatg gatggattaa tgctgttatg gtgggaatgg 4380
gttcattatt actggggtgg gttcataata aaaagatgag tttggcctgc tattctctct 4440
ctttctcatc ctctcttcca ccatgggatg acacagcaag aaggcccctg caagatgccc 4500
tcccctcagt attggacttc acagcctcca ggaccataag ccaataaatt tttgttcatt 4560
ataaatttcc cagtctgtgg tattctgtta tagcaacact caatttatgc attacttcca 4620
gattcttatg gctataccta cttctcacag tttgtattca cccctccttc aaccaagtac 4680
ccttaacaca gttcccatag tcacaaagcc aggtcactga agctgccctc tctccaacca 4740
cacacatata gatcaaatga ccccagacat agagctgatt gagaaggagg gaccagtacg 4800
agctctgctt ccccagcagc ttcctggaaa gaagaggcaa tacaacccaa cccaaaagtg 4860
caagagaagt aacacctcat gggatgagct taattaatca atgggagagg acactagaag 4920
acactagagg atctcccttc ctccctttct ttcccacttc accccctcca gtctctgaac 4980
catgagctat ttcaaaggtg cagtaatgct atatttggct tctctgaaga tatcctatga 5040
ggccaagtca tcagctttgt tcattatcta agagtggtgg ccagctcacc agcacttccc 5100
atcatgtttg ccctccctct ttcccttgtg ttacttccca ttttccctta cttctgcttt 5160
cttggcatta aattctactc tgcaatgtta ggatataagt ttttgcctca gattctgttt 5220
tctaggaaac ccatgctaag acaacactgg cagtggccct ggaaaagtaa acctcatgat 5280
ggatttggag ttggattgtt cactgatctg aaggacagag gactccactt aagtggtaag 5340
cagtgtagct atgaactctg ccacgcaggc ctcacaatta ctgaggcttc ttttacctgt 5400
ggttaactgg gacacagaac agcaggaaat tgagtgtaga ggttatcaag tagctgcttc 5460
acttaattgg tataatttta tggagttaac ctggtttaga gtccagagaa cattccacat 5520
agcctagaaa gggtagttat ttgtccttac cataatcaag tcatactttg aatatgagtt 5580
ttccttccct gttcagcacc acttctctta gacttaagaa tgcctgatct gttgatatta 5640
tgtcccatgt aacattgcct gagacaaaga tatccatgta ccttaaa 5687
<210> 33
<211> 140
<212> PRT
<213> 智人
<400> 33
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro
65 70 75 80
Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr
85 90 95
Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
100 105 110
Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg
115 120 125
Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala
130 135 140
<210> 34
<211> 128
<212> PRT
<213> 智人
<400> 34
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Arg Ile Ile Ala Gln
65 70 75 80
Lys Arg Ala Cys Asp Thr Ala Thr Cys Val Thr His Arg Leu Ala Gly
85 90 95
Leu Leu Ser Arg Ser Gly Gly Val Val Lys Asn Asn Phe Val Pro Thr
100 105 110
Asn Val Gly Ser Lys Ala Phe Gly Arg Arg Arg Arg Asp Leu Gln Ala
115 120 125
<210> 35
<211> 141
<212> PRT
<213> 智人
<400> 35
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro
65 70 75 80
Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr
85 90 95
Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
100 105 110
Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg
115 120 125
Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala Asn
130 135 140
<210> 36
<211> 116
<212> PRT
<213> 智人
<400> 36
Ala Pro Phe Arg Ser Ala Leu Glu Ser Ser Pro Ala Asp Pro Ala Thr
1 5 10 15
Leu Ser Glu Asp Glu Ala Arg Leu Leu Leu Ala Ala Leu Val Gln Asp
20 25 30
Tyr Val Gln Met Lys Ala Ser Glu Leu Glu Gln Glu Gln Glu Arg Glu
35 40 45
Gly Ser Ser Leu Asp Ser Pro Arg Ser Lys Arg Cys Gly Asn Leu Ser
50 55 60
Thr Cys Met Leu Gly Thr Tyr Thr Gln Asp Phe Asn Lys Phe His Thr
65 70 75 80
Phe Pro Gln Thr Ala Ile Gly Val Gly Ala Pro Gly Lys Lys Arg Asp
85 90 95
Met Ser Ser Asp Leu Glu Arg Asp His Arg Pro His Val Ser Met Pro
100 105 110
Gln Asn Ala Asn
115
<210> 37
<211> 187
<212> PRT
<213> 智人
<400> 37
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185
<210> 38
<211> 168
<212> PRT
<213> 智人
<400> 38
Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr
1 5 10 15
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
20 25 30
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
35 40 45
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
50 55 60
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
65 70 75 80
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
85 90 95
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
100 105 110
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
115 120 125
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
130 135 140
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
145 150 155 160
Phe Phe Gly Ala Phe Leu Val Gly
165

Claims (24)

1.一种用于分析生物学数据的系统,所述系统包含
一硬件处理器,所述硬件处理器用于执行储存在一计算机可读介质上的数个计算机程序指令,所述计算机程序指令包含:
数个计算机程序指令,用于接收生物学数据,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值,其中所述数个多肽中的每一个选自于CRP、IP-10、TRAIL、IL1ra、PCT以及SAA所组成的一族群;
数个计算机程序指令,用于计算一弯曲表面S的一区段SROI和由一第一方向与一第二方向所定义的一平面π之间的一第一距离d,所述第一距离d是在垂直于所述平面π,并且在所述平面π上的一点P与所述弯曲表面S上的一点之间被计算,所述点由沿着所述第一方向的一第一坐标δ0以及沿着所述第二方向的一第二坐标δ1被定义;以及
数个计算机程序指令,用于将所述第一距离关联至一细菌感染的存在、不存在或所述受验者具有所述细菌感染的可能性;
其中每个所述坐标是由所述表达数值的一不同组合所定义,
其中所述第一坐标δ0被定义为δ0=a0+a1D1+a2D2+...+φ0,其中所述第二坐标δ1被定义为δ1=b0+b1D1+b2D2+...+φ1,其中a0,a1,...和b0,b1,...都是常数和预定系数,且所述变量D1,D2,...中的每一个分别是所述数个多肽中的一个的一表达水平,以及δ0和δ1是0或相对于所述表达水平中至少一个是非线性的,以及
其中至少90%的所述区段介于一下界限表面f(δ01)-ε0和一上界限表面f(δ01)+ε1之间,其中所述f(δ01)等于exp(δ0)/(1+exp(δ0)+exp(δ1)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
2.如权利要求1所述的系统,其特征在于:所述表达数值通过一测量系统来测量,所述测量系统进行至少一自动测定,所述自动测定选自于一自动ELISA、一自动免疫测定以及一自动功能测定所组成的一族群;且所述硬件处理器自所述测量系统接收所述生物学数据。
3.如权利要求2所述的系统,其特征在于:所述接收是在一互联网网路上通过一网络接口。
4.如权利要求1至3任一项所述的系统,其特征在于:对于所述坐标中的至少一个,所述表达数值的所述组合包含所述表达数值的一线性组合。
5.如权利要求1至3任一项所述的系统,其特征在于:对于所述坐标中的至少一个,所述表达数值的所述组合包括至少一非线性项对应于所述表达数值中的至少一个。
6.如权利要求1至3任一项所述的系统,其特征在于:所述数个计算机程序指令还包含:
数个计算机程序指令,用于计算垂直于所述平面π,介于所述平面π上的一点与一第二弯曲表面的一区段上的一对应点之间的一第二距离,所述点由所述第一坐标δ0以及所述第二座标所定义;以及
数个计算机程序指令,用于使所述第二距离关联至一病毒感染的存在、不存在或所述受验者具有所述病毒感染的可能性;
其中至少90%的所述第二弯曲表面的所述区段介于一第二下界限表面g(δ01)-ε2和一第二上界限表面g(δ01)+ε3之间,其中所述g(δ01)等于exp(δ0)/(1+exp(δ0)+exp(δ1)),以及其中所述ε2和所述ε3中的每一个皆小于0.5。
7.如权利要求6所述的系统,其特征在于:所述数个计算机程序指令还包含:数个计算机程序指令,基于所述第一距离,获得所述受验者具有一细菌感染的所述可能性;
基于所述第二距离,获得所述受验者具有一病毒感染的所述可能性;
比较每一个所述可能性和一对应的预定阈值;以及
当每一个所述可能性都在所述对应的预定阈值以下,则确定患者可能具有一非感染性疾病。
8.如权利要求1至3任一项所述的系统,其特征在于:所述数个多肽包含至少三种多肽。
9.如权利要求1至3任一项所述的系统,其特征在于:所述数个多肽包含至少三种多肽,选自于CRP、IP-10、TRAIL、IL1ra、PCT以及SAA所组成的一族群。
10.如权利要求1至3任一项所述的系统,其特征在于:所述数个多肽包含至少CRP和TRAIL。
11.如权利要求1至3任一项所述的系统,其特征在于:所述数个多肽包含至少CRP、TRAIL以及IP-10。
12.如权利要求1至3任一项所述的系统,其特征在于:所述数个计算机程序指令还包含:数个计算机程序指令,用于产生所述可能性的一输出,所述输出以文本呈现。
13.如权利要求1至3任一项所述的系统,其特征在于:所述数个计算机程序指令还包含:数个计算机程序指令,用于产生所述可能性的一输出,所述输出以图形化呈现。
14.如权利要求1至3任一项所述的系统,其特征在于:所述数个计算机程序指令还包含:数个计算机程序指令,用于产生所述可能性的一输出,所述输出使用一颜色索引呈现。
15.如权利要求1至3任一项所述的系统,其特征在于:所述血液样本是全血。
16.如权利要求1至3任一项所述的系统,其特征在于:所述血液样本是全血中的一部份。
17.如权利要求16所述的系统,其特征在于:所述血液的所述部份包含血清或血浆。
18.如权利要求1至3任一项所述的系统,其特征在于:所述系统还包含:
一测量系统,用于确定所述表达数值,所述测量系统被设置用以进行至少一种测定,所述测定选自于一自动ELISA、一自动免疫测定以及一自动功能测定所组成的一族群;以及
一网络接口,自所述测量系统接收所述表达数值。
19.如权利要求1至3任一项所述的系统,其特征在于:通过远离所述受验者的所述硬件处理器来执行所述计算和所述关联。
20.如权利要求1至3任一项所述的系统,其特征在于:通过所述受验者附近的所述硬件处理器来执行所述计算和所述关联。
21.如权利要求1至3任一项所述的系统,其特征在于:通过在一云计算设施的一云计算资源处的所述硬件处理器来执行所述计算和所述关联。
22.一种计算机软件产品,其特征在于:所述计算机软件产品包含一计算机可读介质,其中储存数个程序指令,所述数个程序指令包含:
数个计算机程序指令,用于接收生物学数据,所述生物学数据包含在一受验者的血液中的数个多肽的数个表达数值,其中所述数个多肽中的每一个选自于CRP、IP-10、TRAIL、IL1ra、PCT以及SAA所组成的一族群;
数个计算机程序指令,用于计算一弯曲表面S的一区段SROI和由一第一方向与一第二方向所定义的一平面π之间的一第一距离d,所述第一距离d是在垂直于所述平面π,并且在所述平面π上的一点P与所述弯曲表面S上的一点之间被计算,所述点由沿着所述第一方向的一第一坐标δ0以及沿着所述第二方向的一第二坐标δ1被定义;以及
数个计算机程序指令,用于将所述第一距离关联至一细菌感染的存在、不存在或所述受验者具有所述细菌感染的可能性;其中每个所述坐标是由所述表达数值的一不同组合所定义,
其中所述第一坐标δ0被定义为δ0=a0+a1D1+a2D2+...+φ0,其中所述第二坐标δ1被定义为δ1=b0+b1D1+b2D2+...+φ1,其中a0,a1,...和b0,b1,...都是常数和预定系数,且所述变量D1,D2,...中的每一个分别是所述数个多肽中的一个的一表达水平,以及δ0和δ1是0或相对于所述表达水平中至少一个是非线性的,以及
其中至少90%的所述区段介于一下界限表面f(δ01)-ε0和一上界限表面f(δ01)+ε1之间,其中所述f(δ01)等于exp(δ1)/(1+exp(δ0)+exp(δ1)),以及其中所述ε0和所述ε1中的每一个皆小于0.5。
23.一种用于分析生物学数据的系统,其特征在于:所述系统包含:
一第一隔间,设置用以测量具有一未知疾病的一受验者的血液中的数个多肽的数个表达数值;
一第二隔间,包含具有一计算机可读介质的一硬件处理器,所述计算机可读介质储存如权利要求22所述的计算机软件产品;以及
一显示装置;
其中所述硬件处理器设置用以自所述第一隔间接收数个表达数值测量结果,以及用以输出数个分析结果到所述显示装置。
24.如权利要求23所述的系统,其特征在于:所述第一隔间、所述第二隔间,以及所述显示装置被安装或整合于一手持装置的一本体上。
CN201580055946.0A 2014-08-14 2015-08-12 使用流形和超平面进行生物学数据的计算机分析 Active CN107076746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010370187.XA CN111624346A (zh) 2014-08-14 2015-08-12 用于预测及/或决定预后的套组

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462037180P 2014-08-14 2014-08-14
US62/037,180 2014-08-14
US201562105938P 2015-01-21 2015-01-21
US62/105,938 2015-01-21
PCT/IL2015/050823 WO2016024278A1 (en) 2014-08-14 2015-08-12 Computational analysis of biological data using manifold and a hyperplane

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010370187.XA Division CN111624346A (zh) 2014-08-14 2015-08-12 用于预测及/或决定预后的套组

Publications (2)

Publication Number Publication Date
CN107076746A CN107076746A (zh) 2017-08-18
CN107076746B true CN107076746B (zh) 2020-05-29

Family

ID=55303939

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580055946.0A Active CN107076746B (zh) 2014-08-14 2015-08-12 使用流形和超平面进行生物学数据的计算机分析
CN202010370187.XA Pending CN111624346A (zh) 2014-08-14 2015-08-12 用于预测及/或决定预后的套组

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010370187.XA Pending CN111624346A (zh) 2014-08-14 2015-08-12 用于预测及/或决定预后的套组

Country Status (12)

Country Link
US (5) US10303846B2 (zh)
EP (2) EP3180621B1 (zh)
JP (2) JP6661607B2 (zh)
KR (1) KR20170041907A (zh)
CN (2) CN107076746B (zh)
AU (2) AU2015302870B2 (zh)
BR (1) BR112017002884A2 (zh)
CA (2) CA2954601C (zh)
IL (1) IL250585B (zh)
RU (1) RU2730836C2 (zh)
WO (1) WO2016024278A1 (zh)
ZA (1) ZA201700939B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106442984B (zh) 2010-04-21 2020-03-13 米密德诊断学有限公司 区分细菌与病毒感染的标记物和决定因素以及其使用方法
EP3882633A1 (en) 2012-02-09 2021-09-22 MeMed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
US10303846B2 (en) 2014-08-14 2019-05-28 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
WO2016059636A1 (en) 2014-10-14 2016-04-21 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections in non-human subjects and methods of use thereof
US11868851B2 (en) * 2015-03-11 2024-01-09 Symphonyai Sensa Llc Systems and methods for predicting outcomes using a prediction learning model
SG11201806741XA (en) * 2016-02-12 2018-09-27 Carrier Corp Shelf life estimation system
US11466331B2 (en) 2016-03-03 2022-10-11 Memed Diagnostics Ltd. RNA determinants for distinguishing between bacterial and viral infections
WO2017221255A1 (en) 2016-06-23 2017-12-28 Memed Diagnostics Ltd. Measuring trail by lateral flow immunoassay
EP3482200B1 (en) 2016-07-10 2022-05-04 Memed Diagnostics Ltd. Protein signatures for distinguishing between bacterial and viral infections
CN109804245B (zh) 2016-07-10 2022-10-25 米密德诊断学有限公司 感染的早期诊断
US20190180846A1 (en) * 2016-08-10 2019-06-13 Memed Diagnostics Ltd. System and method for analysis of biological data
KR101739703B1 (ko) * 2016-09-13 2017-05-24 (주) 어드밴스드 엔티 Trail 기반 뇌염 감별진단 방법 및 장치
EP3519833A4 (en) 2016-09-29 2020-06-03 MeMed Diagnostics Ltd. PROGNOSTIC AND TREATMENT METHODS
US11353456B2 (en) 2016-09-29 2022-06-07 Memed Diagnostics Ltd. Methods of risk assessment and disease classification for appendicitis
EP3568864A1 (en) 2017-01-11 2019-11-20 Koninklijke Philips N.V. Method and system for automated inclusion or exclusion criteria detection
KR20190119082A (ko) * 2017-02-17 2019-10-21 애큐웨더 아이엔씨. 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법
WO2018167921A1 (ja) * 2017-03-16 2018-09-20 三菱電機株式会社 信号処理装置
US10209260B2 (en) 2017-07-05 2019-02-19 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
US10474681B1 (en) * 2017-09-26 2019-11-12 Microsoft Technology Licensing, Llc Filtering mapped datasets
US11908581B2 (en) 2018-04-10 2024-02-20 Hill-Rom Services, Inc. Patient risk assessment based on data from multiple sources in a healthcare facility
US11504071B2 (en) * 2018-04-10 2022-11-22 Hill-Rom Services, Inc. Patient risk assessment based on data from multiple sources in a healthcare facility
WO2020036571A1 (en) 2018-08-16 2020-02-20 RICHARDSON, Paul, Stephen Systems and methods for automatic bias monitoring of cohort models and un-deployment of biased models
TW202018727A (zh) 2018-11-09 2020-05-16 財團法人工業技術研究院 整體式學習預測方法與系統
FR3088652A1 (fr) * 2018-11-21 2020-05-22 Nanotracks Diagnostics Détection in vitro de la présence d’au moins un agent pathogène microbien dans un échantillon biologique
JP2022524521A (ja) * 2019-03-12 2022-05-06 ノバルティス アーゲー Copdから喘息を区別するためのデジタル解決策
US11104946B2 (en) 2019-04-23 2021-08-31 Inflammatix, Inc. DNA sequences related to diagnosis and treatment of systemic inflammatory response syndrome
JPWO2022004730A1 (zh) * 2020-06-30 2022-01-06
CN111657961B (zh) * 2020-07-03 2021-04-27 北京印刷学院 一种在皮肤上制备超表面用于血糖检测的方法
JP2023145811A (ja) * 2020-08-17 2023-10-12 孝章 赤池 学習モデルの生成方法、プログラム、演算装置
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
US11430575B2 (en) * 2020-11-13 2022-08-30 Specialty Diagnostic (SDI) Laboratories, Inc. Systems and methods for a data driven disease test result prediction
CN112632151B (zh) * 2020-12-25 2023-02-10 南京邮电大学 一种基于二分过滤的移动对象传染行为挖掘方法
US11361847B1 (en) 2021-02-06 2022-06-14 Timothy A. Hodge System and method for rapidly reporting testing results

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103119444A (zh) * 2010-04-21 2013-05-22 米密德诊断学有限公司 区分细菌与病毒感染的标记物和决定因素以及其使用方法
WO2013117746A1 (en) * 2012-02-09 2013-08-15 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof

Family Cites Families (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154600B (nl) 1971-02-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen.
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
NL154599B (nl) 1970-12-28 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen, alsmede testverpakking.
US3901654A (en) 1971-06-21 1975-08-26 Biological Developments Receptor assays of biologically active compounds employing biologically specific receptors
US3853987A (en) 1971-09-01 1974-12-10 W Dreyer Immunological reagent and radioimmuno assay
US3867517A (en) 1971-12-21 1975-02-18 Abbott Lab Direct radioimmunoassay for antigens and their antibodies
NL171930C (nl) 1972-05-11 1983-06-01 Akzo Nv Werkwijze voor het aantonen en bepalen van haptenen, alsmede testverpakkingen.
US3850578A (en) 1973-03-12 1974-11-26 H Mcconnell Process for assaying for biologically active molecules
US3935074A (en) 1973-12-17 1976-01-27 Syva Company Antibody steric hindrance immunoassay with two antibodies
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4034074A (en) 1974-09-19 1977-07-05 The Board Of Trustees Of Leland Stanford Junior University Universal reagent 2-site immunoradiometric assay using labelled anti (IgG)
US3984533A (en) 1975-11-13 1976-10-05 General Electric Company Electrophoretic method of detecting antigen-antibody reaction
US4098876A (en) 1976-10-26 1978-07-04 Corning Glass Works Reverse sandwich immunoassay
CA1178414A (en) 1978-02-08 1984-11-27 Toyo Boseki Kabushiki Kaisha (Trading Under The Name Of Toyobo Co., Ltd.) Packaging material having excellent seal packaging property
US4233402A (en) 1978-04-05 1980-11-11 Syva Company Reagents and method employing channeling
US4275149A (en) 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4376110A (en) 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US4879219A (en) 1980-09-19 1989-11-07 General Hospital Corporation Immunoassay utilizing monoclonal high affinity IgM antibodies
US4659678A (en) 1982-09-29 1987-04-21 Serono Diagnostics Limited Immunoassay of antigens
US4727022A (en) 1984-03-14 1988-02-23 Syntex (U.S.A.) Inc. Methods for modulating ligand-receptor interactions and their application
US5011771A (en) 1984-04-12 1991-04-30 The General Hospital Corporation Multiepitopic immunometric assay
US4666828A (en) 1984-08-15 1987-05-19 The General Hospital Corporation Test for Huntington's disease
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4801531A (en) 1985-04-17 1989-01-31 Biotechnology Research Partners, Ltd. Apo AI/CIII genomic polymorphisms predictive of atherosclerosis
US5018067A (en) 1987-01-12 1991-05-21 Iameter Incorporated Apparatus and method for improved estimation of health resource consumption through use of diagnostic and/or procedure grouping and severity of illness indicators
US5272057A (en) 1988-10-14 1993-12-21 Georgetown University Method of detecting a predisposition to cancer by the use of restriction fragment length polymorphism of the gene for human poly (ADP-ribose) polymerase
US5192659A (en) 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
DE4322330A1 (de) 1992-08-31 1994-03-03 Behringwerke Ag Verwendung des IL-4-Rezeptors zur Therapie, Prophylaxe und Diagnose von allergischen, viralen, parasitären und bakteriellen Erkrankungen sowie von Pilzinfektionen
US5281521A (en) 1992-07-20 1994-01-25 The Trustees Of The University Of Pennsylvania Modified avidin-biotin technique
DE4227454C1 (de) 1992-08-19 1994-02-03 Henning Berlin Gmbh Verfahren zur Früherkennung, zur Erkennung des Schweregrads sowie zur therapiebegleitenden Verlaufsbeurteilung einer Sepsis sowie Mittel zur Durchführung des Verfahrens
US6283761B1 (en) 1992-09-08 2001-09-04 Raymond Anthony Joao Apparatus and method for processing and/or for providing healthcare information and/or healthcare-related information
SE9401351D0 (sv) 1994-04-21 1994-04-21 Venge A method for diagnosis
US5910421A (en) 1995-12-21 1999-06-08 University Of Florida Rapid diagnostic method for distinguishing allergies and infections
US6077665A (en) 1996-05-07 2000-06-20 The Board Of Trustees Of The Leland Stanford Junior University Rapid assay for infection in neonates
WO1999033965A1 (en) 1997-12-24 1999-07-08 Diatech Pty. Ltd. Bifunctional molecules
AU762756B2 (en) 1998-05-18 2003-07-03 Apoptosis Technology, Inc. Compounds, screening methods, and uses involving anti-apoptotic genes and gene products
DE19847690A1 (de) 1998-10-15 2000-04-20 Brahms Diagnostica Gmbh Verfahren und Substanzen für die Diagnose und Therapie von Sepsis und sepsisähnlichen systemischen Infektionen
US6709855B1 (en) 1998-12-18 2004-03-23 Scios, Inc. Methods for detection and use of differentially expressed genes in disease states
CA2359816C (en) 1999-01-06 2010-08-03 Genenews Inc. Method for the detection of gene transcripts in blood and uses thereof
MXPA02001977A (es) 1999-08-24 2002-09-18 Glycozym Aps Udp-n-acetilglucosamina: galactosa-beta1, 3-n-acetil-galactosamina-alfa-r/(gicnac a galnac) beta1, 6-n-acetilglucosaminiltransferasa, c2gnt3.
IL132687A0 (en) * 1999-11-01 2001-03-19 Keren Mechkarim Ichilov Pnimit System and method for evaluating body fluid samples
US20020038227A1 (en) 2000-02-25 2002-03-28 Fey Christopher T. Method for centralized health data management
US7668661B2 (en) 2000-04-28 2010-02-23 Siemens Healthcare Diagnostics Inc. Liver disease-related methods and systems
RU2229719C2 (ru) 2001-03-27 2004-05-27 Кабусики Кайся Тосиба Обнаружение имеющей отношение к заболеванию нуклеиновой кислоты
US7713705B2 (en) * 2002-12-24 2010-05-11 Biosite, Inc. Markers for differential diagnosis and methods of use thereof
DE10119804A1 (de) 2001-04-23 2002-10-24 Brahms Ag Entzündungsspezifische Peptide und deren Verwendungen
WO2002094880A1 (en) * 2001-05-18 2002-11-28 Kirin Beer Kabushiki Kaisha Anti-trail-r antibodies
FI115165B (fi) 2001-06-04 2005-03-15 Aboatech Ab Oy Menetelmä infektion laadun määrittämiseksi
DE10130985B4 (de) 2001-06-27 2004-03-18 B.R.A.H.M.S Ag Verfahren zur Diagnose von Sepsis und schweren Infektionen unter Bestimmung löslicher Cytokeratin-1-Fragmente
US20040209307A1 (en) 2001-08-20 2004-10-21 Biosite Incorporated Diagnostic markers of stroke and cerebral injury and methods of use thereof
DE50103907D1 (de) 2001-12-07 2004-11-04 Brahms Ag Verwendungen der Aldose-1-Epimerase (Mutarotase) für die Diagnose von Entzündungserkrankungen und Sepsis
DE60207183T2 (de) 2001-12-10 2006-08-10 Kabushiki Gaisha K-And-S Vorrichtung zur Beobachtung biologischer Daten
US20040038201A1 (en) 2002-01-22 2004-02-26 Whitehead Institute For Biomedical Research Diagnostic and therapeutic applications for biomarkers of infection
US20040122296A1 (en) 2002-12-18 2004-06-24 John Hatlestad Advanced patient management for triaging health-related data
US7468032B2 (en) 2002-12-18 2008-12-23 Cardiac Pacemakers, Inc. Advanced patient management for identifying, displaying and assisting with correlating health-related data
EP1489416A4 (en) 2002-03-22 2005-09-28 Kyowa Medex Co Ltd METHOD FOR THE EVALUATION OF VIRUS INFECTION
US7485298B2 (en) 2002-05-23 2009-02-03 Michael Powell Diagnosis and treatment of human dormancy-related sequellae
JP2005529599A (ja) 2002-06-11 2005-10-06 アイダホ リサーチ ファウンデーション ウィルス感染を検出するためのタイプiインターフェロン誘導タンパク質
US8563476B2 (en) 2002-11-15 2013-10-22 Morehouse School Of Medicine Anti-CXCL9, anti-CXCL10, anti-CXCL11, anti-CXCL13, anti-CXCR3 and anti-CXCR5 agents for inflammatory disorders
WO2004108899A2 (en) 2003-06-04 2004-12-16 The Government Of The United States As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Pni microarray and uses
JP2007518062A (ja) 2003-09-29 2007-07-05 バイオサイト インコーポレイテッド 敗血症を診断する方法および診断するための組成物
JP2005106694A (ja) * 2003-09-30 2005-04-21 Mochida Pharmaceut Co Ltd 敗血症早期検出及び重篤度評価
GB0401730D0 (en) 2004-01-27 2004-03-03 Bioxell Spa Diagnosis method
US8906630B2 (en) 2004-02-27 2014-12-09 The Trustees Of The University Of Pennsylvania Assays for detecting pathogenic respiratory bacteria
US7892539B2 (en) 2004-03-24 2011-02-22 The Regents Of The University Of California Modulation of an innate immune response by altering TRIAL-R signaling
US8155993B2 (en) * 2004-06-15 2012-04-10 Janssen Pharmaceutica, N.V. Apparatus and methods for assessing a pharmaceutical product
CA2614507A1 (en) * 2004-07-09 2006-08-17 Amaox, Ltd. Immune cell biosensors and methods of using same
AU2005290314A1 (en) * 2004-09-28 2006-04-06 Singulex, Inc. System and method for spectroscopic analysis of single particles
US7572640B2 (en) 2004-09-28 2009-08-11 Singulex, Inc. Method for highly sensitive detection of single protein molecules labeled with fluorescent moieties
WO2007011412A2 (en) 2004-11-05 2007-01-25 The Government Of The United States Of America, As Represented By The Secretary Of The Navy Diagnosis and prognosis of infectious diesease clinical phenotypes and other physiologic states using host gene expresion biomarkers in blood
WO2007018574A2 (en) 2004-11-10 2007-02-15 The United States Of America As Represented By The Secretary Of The Navy Diagnostic assay for rickettsia prowazekii disease by detection of responsive gene expression
JP2008538007A (ja) 2005-04-15 2008-10-02 ベクトン,ディッキンソン アンド カンパニー 敗血症の診断
CN101208602A (zh) 2005-04-15 2008-06-25 贝克顿迪金森公司 脓毒症的诊断
US20070015172A1 (en) 2005-06-01 2007-01-18 Z-Biomed, Inc. Expression profiles for microbial infection
UA78641C2 (en) 2005-08-29 2007-04-10 Open Joint Stock Company Conce A process for the preparation of carbamide-formaldehyde resin
DE102005050933A1 (de) 2005-10-21 2007-04-26 Justus-Liebig-Universität Giessen Erfindung betreffend Expressionsprofile zur Vorhersage von septischen Zuständen
CN101378764A (zh) 2005-12-09 2009-03-04 贝勒研究院 通过血液白细胞微阵列分析对系统性红斑狼疮的诊断、预后和疾病发展的监测
GB0601959D0 (en) 2006-01-31 2006-03-15 King S College London Sepsis test
US20070184460A1 (en) 2006-02-09 2007-08-09 Wei-Mei Ching Diagnostic assay for Orientia tsutsugamushi by detection of responsive gene expression
AU2007244824A1 (en) 2006-04-26 2007-11-08 Vertex Pharmaceuticals Incorporated Hepatitis C virus infection biomarkers
RU2348695C2 (ru) * 2006-05-23 2009-03-10 Закрытое акционерное общество "Молекулярно-медицинские технологии" Дифференцирующий и специфический олигонуклеотиды для идентификации последовательностей днк инфекционных агентов в биологических материалах, способ видовой идентификации инфекционных агентов, биочип и набор для осуществления этого способа
CN101541976A (zh) 2006-08-11 2009-09-23 贝勒研究院 利用血液白细胞中的基因表达标记物的急性感染的鉴别诊断
WO2008028489A2 (en) 2006-09-05 2008-03-13 Hvidovre Hospital Ip-i0 based immunological monitoring
AU2012244350B2 (en) 2006-09-05 2013-08-15 Statens Serum Institut Ip-10 based immunological monitoring
US20100068147A1 (en) 2006-10-05 2010-03-18 Agency for Science , Technology and Research Dengue diagnosis and treatment
CA2670897A1 (en) 2006-12-06 2008-06-12 Barbara White Methods of treating systemic lupus erythematosus
DE102006060112A1 (de) 2006-12-20 2008-06-26 Brahms Aktiengesellschaft Diagnose und Risikostratifizierung mittels dem neuen Marker CT-proADM
CN101617056A (zh) 2006-12-21 2009-12-30 伊诺基因卡尔生物技术私人有限公司 Eb病毒相关癌症的早期诊断方法及各自的试剂和试剂盒
EP2102370A4 (en) 2007-01-11 2010-01-13 Univ Duke METHOD OF MONITORING HIV INFECTION
WO2008095136A2 (en) 2007-01-31 2008-08-07 Henkin Robert I Methods for detection of biological substances
DE102007009751A1 (de) 2007-02-28 2008-09-04 B.R.A.H.M.S Aktiengesellschaft Verfahren zur selektiven Bestimmung von Procalcitonin 1-116 für diagnostische Zwecke sowie Antikörper und Kits zur Durchführung eines solchen Verfahrens
EP2126575A2 (en) 2007-02-28 2009-12-02 The Procter &amp; Gamble Methods and targets for identifying compounds for regulating rhinovirus infection
CA2689306C (en) 2007-06-01 2019-01-15 Council Of Scientific & Industrial Research A novel method for simultaneous detection and discrimination of bacterial, fungal, parasitic and viral infections of eye and central nervous system
RU2352948C1 (ru) 2007-06-15 2009-04-20 Государственное образовательное учреждение высшего профессионального образования "КРАСНОЯРСКАЯ ГОСУДАРСТВЕННАЯ МЕДИЦИНСКАЯ АКАДЕМИЯ ФЕДЕРАЛЬНОГО АГЕНТСТВА ПО ЗДРАВООХРАНЕНИЮ И СОЦИАЛЬНОМУ РАЗВИТИЮ" Способ прогноза исхода заболевания пациентов с ургентной хирургической патологией органов брюшной полости
IL184478A (en) 2007-07-08 2017-07-31 Hadasit Medical Res Services & Development Ltd Preparations, methods and kits for identifying carriers of mutations in genes 1brca and 2brca and for the early detection of cancers associated with mutations in these genes
DE102007035640A1 (de) 2007-07-27 2009-01-29 Lkh-Kunststoffwerk Gmbh & Co. Kg Tauchkolben
ES2403310T3 (es) 2007-08-03 2013-05-17 B.R.A.H.M.S Gmbh Antibiótico para su utilización en una infección local
EP2020603A1 (en) 2007-08-03 2009-02-04 BRAHMS Aktiengesellschaft Method for risk stratification in stable coronary artery disease
TW200920358A (en) 2007-08-13 2009-05-16 Lundbeck & Co As H Method of treating stress-mediated depression
WO2009025743A2 (en) 2007-08-17 2009-02-26 University Of Massachusetts Medical School Use of trail compositions as antiviral agents
EP2039980B1 (de) 2007-09-24 2010-04-07 BMDSys Production GmbH Kryostat mit stabilisiertem Aussengefäss
EP2071334A1 (en) 2007-12-14 2009-06-17 Transmedi SA Compositions and methods of detecting TIABS
WO2009100907A1 (en) 2008-02-14 2009-08-20 Dianeering Diagnostics Engineering And Research Gmbh Means and methods for assessing the risk of patients presenting to emergency departments based on very low concentrations of troponin i or t or using a combination of markers
WO2009120800A2 (en) * 2008-03-25 2009-10-01 University Of Southern California Prognostic panel for urinary bladder cancer
CA2719078A1 (en) 2008-04-21 2009-10-29 Witold Filipowicz Antiviral therapy
US9910036B2 (en) 2008-05-20 2018-03-06 Rapid Pathogen Screening, Inc. Method and device for combined detection of viral and bacterial infections
WO2009141359A1 (en) 2008-05-23 2009-11-26 Pronota N.V. New biomarker for diagnosis, prediction and/or prognosis of sepsis and uses thereof
AP2011005546A0 (en) 2008-06-25 2011-02-28 Baylor Res Intitute Blood transcriptional signature of mycobacterium tuberculosis infection.
JP5902479B2 (ja) 2008-10-24 2016-04-13 ベー.エル.アー.ハー.エム.エス ゲゼルシャフト ミット ベシュレンクテル ハフツング マーカーペプチドのレベルを決定することによる脳卒中患者における予後判定及びリスク評価のための方法
GB2463401B (en) 2008-11-12 2014-01-29 Caris Life Sciences Luxembourg Holdings S A R L Characterizing prostate disorders by analysis of microvesicles
TW201021778A (en) 2008-11-12 2010-06-16 Alcon Res Ltd Intraocular lens delivery device with a multi-part plunger tip
UA92843C2 (ru) 2009-05-21 2010-12-10 Институт Технической Теплофизики Национальной Академии Наук Украины Способ получения порошкообразного пищевого красителя из столовой свеклы
US8821876B2 (en) 2009-05-26 2014-09-02 Duke University Methods of identifying infectious disease and assays for identifying infectious disease
US8507210B2 (en) 2009-06-05 2013-08-13 B.R.A.H.M.S Gmbh Detection of bacterial infections in subjects suffering from dyspnea
US20110065136A1 (en) 2009-08-07 2011-03-17 Rules-Based Medicine, Inc. Methods and Devices for Detecting Glomerulonephritis and Associated Disorders
JP5667353B2 (ja) * 2009-09-25 2015-02-12 シスメックス株式会社 血球計数装置、診断支援装置、診断支援方法及びコンピュータプログラム
JP5722587B2 (ja) 2009-10-13 2015-05-20 ベー.エル.アー.ハー.エム.エス ゲゼルシャフト ミット ベシュレンクテル ハフツング 急性脳卒中または一過性脳虚血発作を有する患者における細菌感染の診断のためのプロカルシトニン及び抗生物質治療のガイダンス
CN102858991A (zh) 2009-10-15 2013-01-02 克雷桑多生物科技公司 生物标志物及炎性疾病活动性的测量和监测方法
US20110312534A1 (en) * 2010-03-05 2011-12-22 Erasmus University Medical Center Rotterdam Method for prediction of human iris color
CN103097891B (zh) 2010-05-31 2015-09-09 国立大学法人德岛大学 疾病重症度的检查方法
GB2482187A (en) * 2010-07-23 2012-01-25 Univ Exeter Predicting response to surgery
US8877212B2 (en) 2011-02-07 2014-11-04 Trudeau Institute Use of an IL12 receptor-beta 1 splice variant to diagnose active tuberculosis
RU2476887C2 (ru) 2011-03-29 2013-02-27 Учреждение Российской академии медицинских наук Дальневосточный научный центр физиологии и патологии дыхания Сибирского отделения РАМН Способ прогнозирования развития осложнений у больных внебольничной пневмонией
CN103781800A (zh) * 2011-06-20 2014-05-07 协和发酵麒麟株式会社 抗erbB3抗体
WO2013040062A2 (en) 2011-09-12 2013-03-21 Vanderbilt University Characterizing multiple sclerosis
JP5842107B2 (ja) * 2011-10-19 2016-01-13 パナソニックIpマネジメント株式会社 循環動態測定装置
ES2656150T3 (es) 2011-11-14 2018-02-23 Universitätsklinikum Jena Diagnóstico de la sepsis y del síndrome de respuesta inflamatoria sistémica
EP2637023A1 (en) 2012-03-08 2013-09-11 B.R.A.H.M.S GmbH Prediction of outcome in patients with chronic obstructive pulmonary disease
WO2013131993A2 (en) 2012-03-08 2013-09-12 Thommen Medical Ag Device for the diagnosis of inflammatory tissues in dental applications
CN104245954A (zh) * 2012-03-30 2014-12-24 文森医学公司 细菌成像剂及其使用方法
GB201211982D0 (en) 2012-07-05 2012-08-22 Isis Innovation Biomarker
DK2872891T3 (da) 2012-07-10 2019-05-13 Nepean Blue Mountains Local Health Distr Risikostratificering ved influenza
FR2996003B1 (fr) 2012-09-25 2014-10-17 Commissariat Energie Atomique Methode pour detecter specifiquement dans un echantillon une metalloprotease matricielle (mmp) d'interet uniquement dans sa forme active
US20140127827A1 (en) 2012-11-05 2014-05-08 Gwangju Institute Of Science And Technology Method for detection of antigen using fluorescence resonance energy transfer immunoassay
KR20150090240A (ko) 2012-11-30 2015-08-05 어플라이드 프로테오믹스, 인크. 결장 종양의 존재 또는 위험의 평가 방법
EP3608416A1 (en) 2013-01-22 2020-02-12 Imicroq, S.L. Rapid method for detection of pathogen
KR20150113113A (ko) 2013-01-29 2015-10-07 몰레큘러 헬스 게엠베하 임상적 판단 지원을 위한 시스템 및 방법
US10689701B2 (en) 2013-03-15 2020-06-23 Duke University Biomarkers for the molecular classification of bacterial infection
AU2014227964B2 (en) * 2013-03-15 2016-12-15 Boston Scientific Neuromodulation Corporation Clinical response data mapping
CN108627651A (zh) 2013-09-20 2018-10-09 阿斯图特医药公司 用于阑尾炎的诊断和预后及腹痛病因的区分的方法和组合物
WO2015048098A1 (en) 2013-09-24 2015-04-02 Washington University Diagnostic methods for infectious disease using endogenous gene expression
US10303846B2 (en) * 2014-08-14 2019-05-28 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
WO2016059636A1 (en) 2014-10-14 2016-04-21 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections in non-human subjects and methods of use thereof
JP6788586B2 (ja) 2014-11-19 2020-11-25 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Hnlを用いる診断方法
CN107209184B (zh) 2014-12-11 2020-04-24 米密德诊断学有限公司 用于诊断多种感染的标记组合及其使用方法
KR20160072626A (ko) 2014-12-15 2016-06-23 전북대학교산학협력단 패혈증 인자 il-6 간이 진단 키트
EP3367895A4 (en) * 2015-11-01 2019-07-03 Elminda Ltd. METHOD AND SYSTEM FOR ESTIMATING POTENTIAL DISTRIBUTION ON A CORTICAL SURFACE
US11466331B2 (en) 2016-03-03 2022-10-11 Memed Diagnostics Ltd. RNA determinants for distinguishing between bacterial and viral infections
IL287757B (en) 2016-03-03 2022-07-01 Memed Diagnostics Ltd An RNA test to diagnose the type of infection
WO2017221255A1 (en) 2016-06-23 2017-12-28 Memed Diagnostics Ltd. Measuring trail by lateral flow immunoassay
CN109804245B (zh) 2016-07-10 2022-10-25 米密德诊断学有限公司 感染的早期诊断
EP3482200B1 (en) 2016-07-10 2022-05-04 Memed Diagnostics Ltd. Protein signatures for distinguishing between bacterial and viral infections
JP7020689B2 (ja) 2016-09-16 2022-02-16 株式会社オンチップ・バイオテクノロジーズ 微粒子分注装置、微粒子解析装置、及び反応検出装置、並びにそれらを用いる方法
US11353456B2 (en) * 2016-09-29 2022-06-07 Memed Diagnostics Ltd. Methods of risk assessment and disease classification for appendicitis
EP3519833A4 (en) 2016-09-29 2020-06-03 MeMed Diagnostics Ltd. PROGNOSTIC AND TREATMENT METHODS
US10209260B2 (en) 2017-07-05 2019-02-19 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
US20220329345A1 (en) 2021-04-08 2022-10-13 Infinidome Ltd. Adjustable null steering in a stationary network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103119444A (zh) * 2010-04-21 2013-05-22 米密德诊断学有限公司 区分细菌与病毒感染的标记物和决定因素以及其使用方法
WO2013117746A1 (en) * 2012-02-09 2013-08-15 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Combining diagnostic test results to increase accuracy;Pepe MS;《Biostatistics》;20001231;第1卷(第2期);第123-140页 *

Also Published As

Publication number Publication date
CA3190715A1 (en) 2016-02-18
JP2017532633A (ja) 2017-11-02
US11081206B2 (en) 2021-08-03
IL250585B (en) 2020-10-29
BR112017002884A2 (pt) 2018-01-30
JP6661607B2 (ja) 2020-03-11
EP3180621A1 (en) 2017-06-21
AU2015302870B2 (en) 2021-12-23
EP3180621A4 (en) 2018-04-18
AU2015302870A1 (en) 2017-03-16
CA2954601C (en) 2023-04-18
EP3699930B1 (en) 2024-02-07
US10303846B2 (en) 2019-05-28
ZA201700939B (en) 2021-05-26
RU2730836C2 (ru) 2020-08-26
CA2954601A1 (en) 2016-02-18
AU2022200802A1 (en) 2022-03-03
US20200388347A1 (en) 2020-12-10
EP3699930A3 (en) 2020-10-28
CN107076746A (zh) 2017-08-18
US20190237156A1 (en) 2019-08-01
CN111624346A (zh) 2020-09-04
US20170235871A1 (en) 2017-08-17
EP3699930A2 (en) 2020-08-26
WO2016024278A1 (en) 2016-02-18
RU2017107750A (ru) 2018-09-17
IL250585A0 (en) 2017-04-30
US20220399074A1 (en) 2022-12-15
JP7095001B2 (ja) 2022-07-04
US11450406B2 (en) 2022-09-20
JP2020113285A (ja) 2020-07-27
EP3180621B1 (en) 2020-04-01
US20240029818A1 (en) 2024-01-25
US11776658B2 (en) 2023-10-03
KR20170041907A (ko) 2017-04-17
RU2017107750A3 (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
CN107076746B (zh) 使用流形和超平面进行生物学数据的计算机分析
CN109661578B (zh) 用于区分细菌和病毒感染的蛋白质特征
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
CN101668865B (zh) 与心血管疾病相关联的遗传易感性变体
AU2015257483B2 (en) Biomarkers and combinations thereof for diagnosising tuberculosis
KR20150090246A (ko) 암을 위한 분자 진단 테스트
US6117654A (en) Nucleic acid molecules encoding Tango-77-polypeptides
CN111183234A (zh) 在表达pnpla3 i148m变异的患者的肝病治疗中对hsd17b13的抑制
TW201632629A (zh) 用於癌症診斷與預後的方法
JP7319553B2 (ja) 在胎週数および早産を予測する胎児発達のための非侵襲的分子時計
CN107478843A (zh) 用于炎性疾病的抗‑cxcl9、抗‑cxcl10、抗‑cxcl11、抗‑cxcl13、抗‑cxcr3和抗‑cxcr5试剂
KR20150023904A (ko) 전립선암의 진단 및 치료에서의 마커의 용도
CA2561669A1 (en) Methods for identifying risk of osteoarthritis and treatments thereof
CN102459645B (zh) 作为前列腺癌标记的磷酸二酯酶9a
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
KR101114033B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
KR102326582B1 (ko) 청각장애의 진단용 마커 및 그의 용도
CN107058520A (zh) 分子标志物foxm1基因的应用
CN111989572A (zh) 评估疑似感染、sofa评分低于2的患者中的并发症风险
KR102110600B1 (ko) Frrs1l 유전자 녹아웃 자폐 스펙트럼 장애 동물모델 및 이의 용도
KR20050008644A (ko) 위암에서의 유전자 발현 프로파일
KR20220138230A (ko) 암 예후 예측용 바이오마커
KR20070055855A (ko) DNp63a 유전자 및 이를 이용한 항암제 스크리닝 방법
KR20130048240A (ko) Pcbp―1 항원에 대한 모노클로날 항체, 및 그의 용도
CN107058259A (zh) 分子标志物mk2基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1236616

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant