RU2730836C2 - Вычислительный анализ биологических данных с применением многообразия и гиперплоскости - Google Patents

Вычислительный анализ биологических данных с применением многообразия и гиперплоскости Download PDF

Info

Publication number
RU2730836C2
RU2730836C2 RU2017107750A RU2017107750A RU2730836C2 RU 2730836 C2 RU2730836 C2 RU 2730836C2 RU 2017107750 A RU2017107750 A RU 2017107750A RU 2017107750 A RU2017107750 A RU 2017107750A RU 2730836 C2 RU2730836 C2 RU 2730836C2
Authority
RU
Russia
Prior art keywords
subject
bacterial
disease
patients
trail
Prior art date
Application number
RU2017107750A
Other languages
English (en)
Other versions
RU2017107750A3 (ru
RU2017107750A (ru
Inventor
Эран ЭДЕН
Кфир Овед
Рой НАВОН
Ассаф КОЭН-ДОТАН
Ольга БОЙКО
Original Assignee
Мемед Диагностикс Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Мемед Диагностикс Лтд. filed Critical Мемед Диагностикс Лтд.
Publication of RU2017107750A publication Critical patent/RU2017107750A/ru
Publication of RU2017107750A3 publication Critical patent/RU2017107750A3/ru
Application granted granted Critical
Publication of RU2730836C2 publication Critical patent/RU2730836C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physiology (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)

Abstract

Группа изобретений относится к области медицины, более конкретно к вычислительному анализу биологических данных. Предложены варианты способа определения бактериальной инфекции на основании биологических данных, содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, а также машиночитаемый носитель данных для осуществления этих способов. В одном из вариантов способ характеризуется тем, что используют аппаратное обрабатывающее устройство для выполнения хранимых на машиночитаемом носителе компьютерных программных инструкций, которые включают: компьютерные программные инструкции для вычисления расстояния d между сегментом Sкривой S и осью π, образованной направлением, при этом d вычисляют перпендикулярно оси π между точкой Р на оси π и соответствующей точкой на кривой S, при этом указанные точки образованы координатой δвдоль указанного направления; и компьютерные программные инструкции для коррелирования указанного расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, при этом если d выше предварительно определенного уровня ω, то данные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию, при этом координата δобразована комбинацией указанных значений экспрессии, которая включает линейную комбинацию этих значений экспрессии, причем по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей прямой f(δ)-εи верхней ограничивающей прямой f(δ)+ε, где f(δ) равняется 1/(1+exp(δ)) и каждый из εи εсоставляет менее 0,5. Группа изобретений обеспечивает более точное определение наличия у субъекта бактериальной инфекции. 3 н. и 14 з.п. ф-лы, 14 пр., 38 табл., 39 ил.

Description

РОДСТВЕННЫЕ ЗАЯВКИ
Данная заявка притязает на приоритет предварительных заявок на патент США 62/037180, поданной 14 августа 2014 г., и 62/105938, поданной 21 января 2015 г, содержание которых полностью приведено здесь для ссылки.
ОБЛАСТЬ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ, И УРОВЕНЬ ТЕХНИКИ
Настоящее изобретение в рамках некоторых вариантов его осуществления относится к вычислительному анализу и, более конкретно, но не исключительно, к вычислительному анализу биологических данных, например с целью обеспечения различения бактериальной инфекции и небактериального заболевания, и/или бактериальной инфекции и вирусной инфекции, и/или инфекционного и неинфекционного заболевания.
Антибиотики (Abx) представляют собой наиболее часто назначаемый класс лекарств с глобальным рынком в размере 25-30 миллиардов долларов США. Abx также представляют собой тип лекарства, который наиболее часто подвергается неправильному применению среди значительной (40-70%) доли всех лекарств, подвергаемых неправильному назначению (binder, J.A. and R.S. Stafford 2001; Scott, J.G. and D. Cohen, et al. 2001; Davey, P. and E. Brown, et al. 2006; Cadieux, G. and R. Tamblyn, et al. 2007; Pulcini, C. and E. Cua, et al. 2007), ("CDC - Get Smart: Fast Facts About Antibiotic Resistance" 2011).
Один из типов неправильного применения Abx заключается во введении лекарства в случае небактериального заболевания, такого как вирусная инфекция, при котором Abx является неэффективным. Например, в соответствии с данными CDC (центра по контролю распространения и предотвращению заболеваний США), в США ежегодно происходит свыше 60 миллионов случаев неправильного назначения Abx для лечения гриппа. Здравоохранительные и экономические последствия чрезмерного назначения Abx включают: (i) стоимость излишне назначаемых антибиотиков в глобальном масштабе оценивается в >10 миллиардов долларов США ежегодно; (ii) побочные эффекты, возникающие вследствие излишнего лечения с применением Abx, снижают качество здравоохранения, вызывая осложнения и пролонгированную госпитализацию (например, аллергические реакции, Abx-ассоциированную диарею, возникновение кишечной дрожжевой инфекции и так далее), и (iii) возникновение резистентных штаммов бактерий в результате бесконтрольного применения (CDC провозгласил повышение резистентности бактерий к антибиотикам "одной из наиболее серьезных проблем здравоохранения в мире в 21-м веке" (Arias, С.A. and В.Е. Murray 2009; "CDC - About Antimicrobial Resistance" 2011).
Недостаточное назначение антибиотиков также не является редким явлением. Например, до 15% госпитализированных взрослых пациентов с пневмонией в США получают лечение с применением Abx с задержкой или не получают его вовсе, даже несмотря на то, что в данных случаях раннее лечение может обеспечивать спасение жизней и уменьшать осложнения (Houck, P.M. and D. W. Bratzler, et al. 2002).
Технологии для диагностирования инфекционных заболеваний обладают потенциалом в плане снижения связанной с состоянием здоровья и стоимостью нагрузки, возникающей вследствие неправильного применения Abx. В идеальном случае подобная технология должна: (i) обеспечивать точное различение бактериальных и вирусных инфекций; (ii) быть быстрой (в течение нескольких минут); (iii) быть способной обеспечивать различение патогенных и непатогенных бактерий, которые являются частью естественной флоры организма; (iv) обеспечивать различение смешанных сопутствующих инфекций и чистых вирусных инфекций; и (v) быть применимой в случаях, когда патоген является недоступным (например, при синусите, пневмонии, среднем отите, бронхите и так далее).
Современные решения (такие как культуральные анализы, ПЦР и иммуноанализы) не соответствуют всем этим требованиям: (i) некоторые из данных анализов обеспечивают низкую диагностическую точность (например, низкую чувствительность или специфичность) (Uyeki et al. 2009) и ограничены лимитированным набором бактериальных или вирусных штаммов; (ii) они зачастую требуют от нескольких часов до нескольких дней; (iii) они не обеспечивают различения патогенных и непатогенных бактерий (Del Mar, С 1992), таким образом приводя к ложноположительным результатам; (iv) они зачастую неспособны обеспечивать различение смешанных и чистых вирусных инфекций; и (v) они требуют прямого забора образца в области нахождения инфекции, в которой ищут следы вызвавшего заболевание агента, что, таким образом, делает невозможным диагностирование в случаях, когда патоген находится в недоступной ткани, что зачастую и является причиной возникновения заболевания.
Соответственно, все еще сохраняется связанный с диагностикой пробел, который в свою очередь часто приводит к чрезмерному назначению Abx (подход "на всякий случай") или недостаточному назначению Abx (подход "подождем и посмотрим") лечащими врачами (Little, P.S. and I. Williamson 1994; Little, P. 2005; Spiro, D.M. and K.Y. Tay, et al. 2006), оба из которых имеют далеко идущие последствия, связанные с состоянием здоровья и финансовыми расходами.
Соответственно, существует потребность в быстром способе, обеспечивающем точное различение пациентов с бактериальными (включая смешанную бактериальную плюс вирусную инфекцию), вирусными и небактериальными невирусными заболеваниями, который отвечает на данные вызовы.
В заявке WO 2013/117746 описаны сигнатуры и детерминанты для различения бактериальной и вирусной инфекции.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление расстояния между сегментом кривой и осью, образованной направлением, при этом расстояние вычисляется в точке кривой, образованной координатой δ1 вдоль направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию. Координата δ1 определяется на основе комбинации значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей прямой f(δ1)-ε0 и верхней ограничивающей прямой f(δ1)+ε1, при этом f(δ1) равняется 1/(1+ехр(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.
В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение бактериальной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Указанный способ включает: вычисление расстояния между сегментом кривой и осью, образованной направлением, при этом расстояние вычисляется в точке кривой, образованной координатой δ0 вдоль направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. Координата δ0 определяется на основе комбинации значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей прямой g(δ0)-ε0 и верхней ограничивающей прямой g(δ0)+ε1, при этом f(δ0) равняется 1/(1+ехр(δ0)), и при этом каждый из ε0 и ε1 составляет менее 0,5.
В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение вирусной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.
В соответствии с некоторыми вариантами осуществления изобретения комбинация значений экспрессии включает линейную комбинацию значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление первого расстояния между сегментом кривой поверхности и плоскостью, образованной первый направлением и вторым направлением. Первое расстояние вычисляют в точке на поверхности, образованной первой координатой δ0 вдоль первого направления и второй координатой δ1 вдоль второго направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию. Каждая из координат образована различной комбинацией значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей поверхностью f(δ01)-ε0 и верхней ограничивающей поверхностью f(δ01)+ε1, при этом f(δ01) равняется exp(δ1)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.
В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает линейную комбинацию значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе первого расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение бактериальной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.
В соответствии с некоторыми вариантами осуществления изобретения способ также включает вычисление второго расстояния между сегментом второй кривой поверхности и плоскостью; а также определение корреляции второго расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, 90% сегмента второй поверхности заключено между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε2 и ε3 составляет менее 0,5.
В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе второго расстояния, сравнение вероятности со вторым предварительно определенным пороговым значением и лечение вирусной инфекции у субъекта, если вероятность превышает второе предварительно определенное пороговое значение.
В соответствии с некоторыми вариантами осуществления изобретения способ включает вычисление вероятности того, что субъект имеет бактериальную инфекцию на основе расстояния, вычисление вероятности того, что субъект имеет вирусную инфекцию на основе второго расстояния, сравнение каждой вероятности с соответствующим предварительно определенным пороговым значением, и, если каждая из вероятностей составляет менее соответствующего предварительно определенного порогового значения, последующее заключение о том, что пациент вероятно имеет неинфекционное заболевание.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление расстояния между сегментом кривой поверхности и плоскостью, образованной первым расстоянием и вторым расстоянием. Расстояние вычисляют в точке на поверхности, образованной первой координатой δ0 вдоль первого направления и второй координатой δ1 вдоль второго направления. Способ включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию; при этом каждая из координат образована различной комбинацией значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей поверхностью g(δ01)-ε0 и верхней ограничивающей поверхностью g(δ01)+ε1, при этом g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.
В соответствии с некоторыми вариантами осуществления изобретения каждый из множества полипептидов выбран из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.
В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, три полипептида.
В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, три полипептида, выбранных из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.
В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, CRP и TRAIL.
В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, CRP, TRAIL и IP-10.
В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены в виде текста.
В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены графически.
В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены в значения цвета.
В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой цельную кровь.
В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой составную часть цельной крови.
В соответствии с некоторыми вариантами осуществления изобретения составная часть крови включает сыворотку или плазму.
В соответствии с некоторыми вариантами осуществления изобретения способ включает определение значений экспрессии, при этом, по меньшей мере, одно из значений экспрессии определяется с помощью электрофореза или иммунохимического анализа.
В соответствии с некоторыми вариантами осуществления изобретения иммунохимическое определение осуществляется с помощью проточной цитометрии, радиоиммуноанализа, иммунофлуоресценции или с помощью иммуносорбентного анализа с ферментной меткой.
В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью компьютера, который удален от субъекта.
В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью компьютера, который находится рядом с субъектом.
В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью облачного вычислительного ресурса в облачном вычислительном центре.
В соответствии с некоторыми вариантами осуществления изобретения значения экспрессии измеряют с помощью измерительной системы, выполняющей, по меньшей мере, один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.
В соответствии с некоторыми вариантами осуществления изобретения указанное получение осуществляется через интернет посредством сетевого интерфейса.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных с применением компьютера. Способ включает: отображение на отображающем устройстве графического пользовательского интерфейса (GUI) с элементом управления для активации вычислений; получение значений экспрессии полипептидов в крови субъекта; автоматическое вычисление балла на основе значений экспрессии в ответ на активацию элемента управления пользователем; генерирование на GUI графической шкалы с первым концом, идентифицированным в качестве соответствующего вирусной инфекции у субъекта, и вторым концом, идентифицированным в качестве соответствующего бактериальной инфекции у субъекта; и генерирование отметки на шкале в области, соответствующей баллу.
В соответствии с некоторыми вариантами осуществления изобретения значения экспрессии получают путем соединения с внешним устройством, которое обеспечивает измерение значений экспрессии. В соответствии с некоторыми вариантами осуществления изобретения GUI включает элемент управления соединением, при этом соединение с внешним устройством осуществляется в ответ на активацию элемента управления соединением пользователем.
В соответствии с некоторыми вариантами осуществления изобретения GUI включает множество полей для ввода значений экспрессии, при этом значения экспрессии получают через поля для ввода.
В соответствии с некоторыми вариантами осуществления изобретения балл представляет собой вероятность того, что субъект имеет бактериальную инфекцию. В соответствии с некоторыми вариантами осуществления изобретения балл представляет собой вероятность того, что субъект имеет вирусную инфекцию.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен компьютерный программный продукт, включающий машиночитаемый носитель данных, на котором хранятся программные инструкции, которые при чтении аппаратным обрабатывающим устройством заставляют аппаратное обрабатывающее устройство получать значения экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, и выполнять способ как описано выше и необязательно как более подробно описано ниже.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрена система для анализа биологических данных. Система включает: пользовательский интерфейс, сконфигурированный для получения значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание; и аппаратное обрабатывающее устройство с машиночитаемым носителем данных, на котором хранится компьютерный программный продукт.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрена система для анализа биологических данных. Система включает: первую часть, сконфигурированную для измерения значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание; вторую часть, включающую аппаратное обрабатывающее устройство с машиночитаемым носителем данных, на котором хранится компьютерный программный продукт.
В соответствии некоторыми вариантами осуществления изобретения первая часть, вторая часть и дисплей смонтированы или интегрированы с корпусом карманного устройства.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа набора данных. Способ включает: (а) анализ набора данных, включающего группы для классификации на основе значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, в образцах крови нескольких субъектов, при этом группы для классификации включают бактериальную инфекцию, вирусную инфекцию и невирусное небактериальное заболевание; и (b) анализ групп для классификации для получения, по меньшей мере, первой функции вероятностной классификации f(δ01), отражающей вероятность того, что конкретный субъект имеет бактериальную инфекцию, при этом первая функция для классификации представляет собой функцию первой координаты δ0 и второй координаты δ1, и при этом каждая из координат образована различной комбинацией значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения способ также включает вычисление второй функции для классификации g(δ01), отражающей вероятность того, что конкретный субъект имеет вирусную инфекцию, при этом вторая функция для классификации также представляет собой функцию первой и второй координаты.
В соответствии с некоторыми вариантами осуществления изобретения способ включает вычисление третьей функции для классификации h(δ01), отражающей вероятность того, что конкретный субъект имеет невирусное небактериальное заболевание, при этом третья функция для классификации также представляет собой функцию первой и второй координаты.
В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает линейную комбинацию значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.
В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных аналитических данных.
В соответствии с некоторыми вариантами осуществления изобретения набор данных включает одну или несколько многомерных записей.
В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором каждая запись в наборе данных включает, по меньшей мере, один клинический параметр соответствующего субъекта.
В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором клинический параметр выбран из группы, состоящей из пола, возраста, температуры, времени с момента появления симптомов и веса.
В соответствии с некоторыми вариантами осуществления изобретения анализ включает машинное обучение.
В соответствии с некоторыми вариантами осуществления изобретения машинное обучение включает машинное обучение с учителем.
В соответствии с некоторыми вариантами осуществления изобретения машинное обучение включает, по меньшей мере, одну процедуру, выбранную из группы, состоящей из кластеризации, метода опорных векторов, линейного моделирования, анализа на основе k-ближайших соседей, обучения с применением дерева решений, процедуры на основе агрегирования моделей, нейронных сетей, вероятностной модели, графической модели, байесовской сети, логистической регрессии и обучения на основе ассоциативных правил.
В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором машинное обучение выбрано из группы, состоящей из метода опорных векторов, нейронных сетей и логистической регрессии.
В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой цельную кровь.
В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой составную часть цельной крови.
В соответствии с некоторыми вариантами осуществления изобретения составная часть крови включает сыворотку или плазму.
В соответствии с некоторыми вариантами осуществления изобретения значение экспрессии определяется с помощью электрофореза или иммунохимического анализа.
В соответствии с некоторыми вариантами осуществления изобретения иммунохимическое определение осуществляется с помощью проточной цитометрии, радиоиммуноанализа, иммунофлуоресценции или с помощью иммуносорбентного анализа с ферментной меткой.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ предсказания прогноза заболевания. Способ включает измерение уровня белка TRAIL в сыворотке у субъекта с заболеванием, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то прогноз является более негативным, чем у субъекта с заболеванием с уровнем белка TRAIL в сыворотке выше предварительно определенного уровня.
В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором заболевание представляет собой инфекционное заболевание.
В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором заболевание не является инфекционным заболеванием.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения курса лечения для заболевания у субъекта. Способ включает измерение уровня белка TRAIL в сыворотке у субъекта, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то субъекта подвергают последнему оставшемуся эффективным виду лечения.
В соответствии с некоторыми вариантами осуществления изобретения предварительно определенный уровень составляет менее 20 пг/мл.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения типа инфекции у субъекта женского пола детородного возраста.
Способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым уровнем, при этом предварительно определенный пороговый уровень соответствует уровню белка TRAIL в сыворотке здорового субъекта женского пола детородного возраста, или группы здоровых субъектов женского пола детородного возраста, при этом разница между уровнем белка TRAIL в сыворотке и предварительно определенным уровнем указывает на тип инфекции.
В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения типа инфекции у субъекта мужского пола детородного возраста.
Способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым уровнем, при этом предварительно определенный пороговый уровень соответствует уровню белка TRAIL в сыворотке здорового субъекта мужского пола детородного возраста, или группы здоровых субъектов мужского пола детородного возраста, при этом разница между уровнем белка TRAIL в сыворотке и предварительно определенным уровнем указывает на тип инфекции.
В соответствии с некоторыми вариантами осуществления изобретения если уровень белка TRAIL в сыворотке превышает предварительно определенный пороговый уровень, то тип инфекции является вирусным.
В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке превышает предварительно определенный пороговый уровень, то тип инфекции является небактериальным.
В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке находится ниже предварительно определенного порогового уровня, то тип инфекции является бактериальным.
В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке находится ниже предварительно определенного порогового уровня, то тип инфекции является невирусным.
Если не указано иное, все используемые здесь технические и научные термины имеют те же значения, какие обычно понимаются средним специалистом в области, к которой относится данное изобретение. Несмотря на то, что при реализации на практике или тестировании настоящего изобретения могут применяться любые способы и материалы, являющиеся аналогичными или эквивалентными тем, которые описаны здесь, примеры способов и/или материалов описаны далее. В случае конфликта приоритет принадлежит данному описанию, включая определения. Кроме того, материалы, способы и примеры являются лишь иллюстративными и не должны рассматриваться в качестве ограничивающих.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Некоторые варианты осуществления изобретения описаны здесь лишь в качестве примера со ссылкой на прилагаемые фигуры. В плане же фигур следует отметить, что конкретные иллюстрации приведены лишь в качестве примера и в целях иллюстративного описания вариантов осуществления изобретения. В этом отношении описание наряду с фигурами сделает очевидным специалистам в данной области то, как варианты осуществления изобретения могут быть реализованы на практике.
На фигурах:
Фиг. 1А-В. Схема исследования. (А) Общий вид схемы исследования, nБакт, nВирусн. и nКонтрол. означают количество бактериальных (включая смешанные бактериальные плюс вирусные совместные инфекции), вирусных и контрольных (без явного инфекционного заболевания) случаев, соответственно. (В) Обнаружение белков и процесс проверки.
Фиг. 2А-С. Белки TRAIL, IP-10 и CRP экспрессируются различным образом у пациентов с бактериальным, вирусным и неинфекционным заболеванием. Представлены диаграммы типа "ящик с усами" для TRAIL (A), IP- 10 (В) и CRP (С), полученные при измерении у Мажоритарной группы (n=765). Красная линия и окружность соответствуют групповой медиане и среднему значению, соответственно; показаны p-значения t-теста бактериальной против вирусной группы и инфекционной (бактериальной и вирусной) против неинфекционной группы (включая здоровых субъектов).
Фиг. 3А-В. Сравнение сигнатуры с лабораторными параметрами и белковыми биомаркерами для различения пациентов с бактериальным и вирусным заболеванием. (А) Эффективность клинических и лабораторных параметров, а также наиболее эффективная пара (ANC и % лимфоцитов), триплет (ANC, % лимфоцитов и Пульс), и квадруплеты (ANC, % лимфоцитов, Пульс, % моноцитов) параметров, значения которых были скомбинированы с применением логистической регрессии. Сравнения осуществляли в рамках Мажоритарной группы (пациенты с бактериальным и вирусным заболеванием, n=653), помимо пульса (определен у 292 пациентов с бактериальным заболеванием и 326 пациентов с вирусным заболеванием) и интенсивностью дыхания (определена у 292 пациентов с бактериальным заболеванием и 326 пациентов с вирусным заболеванием). Сигнатура демонстрировала значительно более высокую эффективность (Р<10-15), чем оптимальный квадруплет.(В) Сигнатура демонстрировала значительно более высокую эффективность (Р<10-8), чем биомаркеры с хорошо определенной ролью в плане реакции на инфекции. Для каждого из выбранных биомаркеров проводили анализ на подгруппе Мажоритарной группы (43≤n≤154 для каждого анализа, нерепрезентативная выборка, n зависели от силы сигнала). Планки погрешностей соответствуют 95% доверительному интервалу.
Фиг. 4. Эффективность сигнатуры является стабильной в различных подгруппах пациентов. Показана AUC сигнатуры в подгруппах Мажоритарной группы (пациенты с бактериальным заболеванием и пациенты с вирусным заболеванием). Квадратная площадь пропорциональна количеству пациентов, а планки погрешностей соответствуют 95% доверительному интервалу. При анализе патогенов каждый вирус сравнивали с бактериями, поражающими ту же физиологическую систему, показано в скобках. R-респираторные, S-системные, C-центральная нервная система, G-желудочно-кишечный тракт, U-мочевыводящая система, K-кожа. Представлены только патогены, детектированные более чем у 5 пациентов. См. критерии для деления на подгруппы в Таблице 1 в Примере 1.
Фиг. 5. Калибровочный график MLR модели. В верхней части пациенты были сгруппированы в виде групп по 10 человек на основе их прогнозируемых вероятностей наличия бактериальной инфекции (ось x) и подвергнуты сравнению с наблюдаемой долей случаев бактериальных инфекции во второй группе (ось y). Пунктирная линия представляет собой скользящее среднее (размеров 5 групп). В нижней части показано распределение по прогнозируемым вероятностям наличия бактериальной инфекции (красные столбцы) и вирусной инфекции (синие столбцы).
Фиг. 6А-В. Возрастное распределение пациентов с поставленным диагнозом. А. Все участники исследования (n=794); В. Только пациенты-дети (n=445).
Фиг. 7А-В. Распределение детектированных патогенов у пациентов с поставленным диагнозом (n=794). А. Распределение по детектированным патогенам на основе подгрупп патогенов; В. Распределение детектированных патогенов по штамму (присутствуют штаммы, детектированные более чем y>1% пациентов). Распределение соответствует % положительных случаев детектирования у пациентов с диагностированным инфекционным заболеванием.
Фиг. 8. Распределение по пораженным физиологическим системам у пациентов с диагностированным инфекционным заболеванием (n=673).
Фиг. 9А-В. Распределение по клиническим синдромам (все пациенты с поставленным диагнозом, n=794). А. Основные клинические синдромы; В. Отдельные клинические синдромы.
Фиг. 10. Распределение по максимальным значениям температуры тела (n=794).
Фиг. 11. Распределение по времени с момента появления симптомов (n=794). N/A - здоровые контроли или пациенты, для которых не были получены данные.
Фиг. 12А-В. Характеристика сопутствующих патологий у пациентов. А. Распределение по сопутствующим патологиям (все хронически больные пациенты, n=305); В. Распределение по постоянно принимаемым лекарственным средствам (все хронически больные пациенты, n=305). Следует отметить, что у некоторых пациентов присутствовали несколько хронических заболеваний, которые подвергались лечению несколькими постоянно принимаемыми лекарственными средствами.
Фиг. 13. Распределение по месту направления на исследование (пациенты с поставленным диагнозом, n=794).
Фиг. 14А-В. Экстраполированные значения PPV и NPV для сигнатуры в виде функции распространенности бактериальных инфекций, А. Единогласная группа (бактериальная инфекция, вирусная инфекция) (n=527), В. Мажоритарная группа (бактериальная инфекция, вирусная инфекция) (n=653).
Фиг. 15А-Е. Точечные диаграммы клинических параметров и лабораторных измерений у пациентов с бактериальном, вирусным и неинфекционным заболеванием (как указано) в Мажоритарной группе (бактериальное заболевание, вирусное заболевание, неинфекционное заболевание) (n=765). Красная линия и окружность соответствуют групповой медиане и среднему, соответственно. Показаны p-значения t-теста бактериальной против вирусной группы и инфекционной (бактериальной и вирусной) против неинфекционной группы (включая здоровых субъектов).
Фиг. 16А-В. Сравнение эффективности сигнатуры и РСТ с применением различных пороговых значений. А. Эффективность, определенная у 76 пациентов из Единогласной группы (бактериальное заболевание, вирусное заболевание); В. Эффективность, определенная у 101 пациентов из Мажоритарной группы (бактериальное заболевание, вирусное заболевание). Планки погрешности соответствуют 95% доверительному интервалу. Чувствительность сигнатуры и специфичность вычисляли после исключения 14% пациентов с промежуточной иммунной реакцией.
Фиг. 17А-В. Сравнение эффективности сигнатуры и CRP с применением различных пороговых значений. А. Эффективность, определенная у Единогласной группы (бактериальное заболевание, вирусное заболевание) (n=527); В. Эффективность, определенная у Мажоритарной группы (бактериальное заболевание, вирусное заболевание) (n=653). Планки погрешностей соответствуют 95% доверительному интервалу. Чувствительность сигнатуры и специфичность вычисляли после исключения 14% пациентов с промежуточной иммунной реакцией.
Фиг. 18А-Н. Точечные диаграммы уровней некоторых белковых биомаркеров (произвольные единицы) у пациентов с бактериальным и вирусным заболеванием. Красная линяя и окружность соответствуют групповой медиане и среднему, соответственно. Показаны p-значения t-теста бактериальной группы против вирусной группы.
Фиг. 19А-В. Клиническая точность сигнатуры является устойчивой при сравнении со снижением технической эффективности измерений на основе белков. (A) AUC сигнатуры, обеспечивающей различение бактериальной и вирусной инфекции, оценивали с применением карты цветов в качестве функции измерения CV (станд./средн.) TRAIL (ось у) и CRP (ось х). (В) Значения AUC присутствуют на диагонали Фиг. 19А, таким образом что CV TRAIL и CRP являются равными.
ФИГ. 20 представляет собой 3-мерную визуализацию пациентов с бактериальным ('+'), вирусным ('о') и неинфекционным ('^') заболеванием. Указаны различные типы пациентов для различения отдельных участков на карте концентрации CRP (мкг/мл), TRAIL и IP-10 (пг/мл).
Фиг. 21А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 0 до 100.
Фиг. 22А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 100 до 200.
Фиг. 23А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 200 до 300.
Фиг. 24А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 300 до 400.
Фиг. 25А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 400 до 500.
Фиг. 26А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 500 до 1000.
Фиг. 27А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 1000 до 2000.
Фиг. 28А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 2000 и более.
Ha Фиг. 29A-F приведены иллюстративные примеры выходных данных в соответствии со способом различения бактериальной и небактериальной инфекции в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 30А-В представляют собой графики, иллюстрирующие корреляцию между быстрым и медленным протоколом измерения TRAIL (Фиг. 30А) и IP-10 (Фиг. 30В).
Фиг. 31 представляет собой блок-схему способа, являющегося подходящим для анализа биологических данных, полученных от субъекта, в соответствии с различными примерами вариантов осуществления настоящего изобретения.
Фиг. 32А-В представляют собой схематические иллюстрации, описывающие процедуру вычисления расстояния между поверхностью и плоскостью в соответствии с некоторыми вариантами осуществления настоящего изобретения.
Фиг. 33А-D представляют собой схематически иллюстрации, описывающие процедуру получения сглаженного варианта сегмента поверхности в соответствии с некоторыми вариантами осуществления настоящего изобретения.
Фиг. 34 представляет собой схематическую иллюстрацию блочной диаграммы системы для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.
Фиг. 35А-D представляют собой контурные диаграммы, описывающие вероятность наличия заболевания бактериальной (Фиг. 35А), вирусной (Фиг. 35В), небактериальной (Фиг. 35С) и неинфекционной (Фиг. 35В) этиологии в виде функции координат δ0 и δ1. Значения вероятности лежат в диапазоне от 0% (черные) до 100% (белые).
Фиг. 36А-В. Низкие уровни TRAIL свидетельствуют о негативном прогнозе для пациента и исходе, а также о высокой степени тяжести заболевания. (А) Концентрации TRAIL в сыворотке пациентов, которые соответствовали критериям поступления в отделение интенсивной терапии по сравнению со всеми другими пациентами (с заболеванием инфекционной или неинфекционной этиологии). (В) Концентрации TRAIL в сыворотке пациентов-детей, которые соответствовали критериям поступления в отделение интенсивной терапии или умерли по сравнению со всеми другими пациентами с заболеванием инфекционной или неинфекционной этиологии.
Фиг. 37А-В представляют собой графики, иллюстрирующие разницу между концентрацией TRAIL у мужчин и женщин детородного возраста.
Фиг. 38А-Е представляют собой скриншоты графического пользовательского интерфейса (GUI), являющегося подходящим для введения пользователем данным в рамках способа с применением компьютера для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.
Фиг. 39А и 39В представляют собой схематические иллюстрации блочной диаграммы системы для анализа биологических данных в рамках вариантов осуществления изобретения, при которых система включает сетевой интерфейс (Фиг. 39А) и пользовательский интерфейс (Фиг. 39В).
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение в рамках некоторых вариантов его осуществления относится к вычислительному анализу и, более конкретно, но не исключительно, к вычислительному анализу биологических данных, например с целью обеспечения различения бактериальной инфекции и небактериального заболевания, и/или бактериальной инфекции и вирусной инфекции, и/или инфекционного и неинфекционного заболевания.
Перед подробным описанием, по меньшей мере, одного варианта осуществления изобретения следует отметить, что изобретение не является ограниченным в плане его применимости сведениями, которые приведены ниже в данном описании или которые приведены в качестве примеров в разделе Примеры. Изобретение может быть реализовано в рамках других вариантов осуществления или может быть практически осуществлено или выполнено иными способами.
Различные инфекционные агенты обладают уникальными молекулярными паттернами, которые могут быть идентифицированы иммунной системой и являться ее мишенями. Патоген-ассоциированные молекулярные паттерны (РАМР) представляют собой пример подобных молекул, которые связаны с различными группами патогенов и могут быть распознаны клетками врожденной иммунной системы с применением Toll-подобных рецепторов (TLR) и других рецепторов распознавания паттернов (например, NOD белками).
Данные рецепторы могут значительно отличаться в рамках различных классов патогенов и, таким образом, вызывать различные иммунные реакции. Например, TLR-4 может распознавать липополисахарид, являющийся компонентом грамотрицательных бактерий, а также липотейхоевые кислоты, являющиеся компонентом грамположительных бактерий, таким образом стимулируя противомикробную реакцию иммунной системы. TLR-3 может распознавать одноцепочечную РНК (часто являющуюся признаком наличия вирусной инфекции) и, таким образом, стимулировать подходящую противовирусную реакцию. Благодаря различению различных классов патогенов (например бактериальных и вирусных) иммунная система может задействовать подходящую защиту.
В течение нескольких последних десятилетий были идентифицированы несколько маркеров организма, которые могут применяться для обеспечения дифференциальной диагностики источника инфекции при различных проявлениях. Путем измерения маркеров, полученных от организма, а не от патогена, является возможным минимизировать "ложноположительные" диагнозы вследствие непатологических штаммов бактерий, которые являются частью естественной флоры организма. Один из примеров представляет собой Прокальцитонин (РСТ), являющийся прекурсором гормона кальцитонина, продуцируемого С-клетками щитовидной железы. Уровни РСТ в кровотоке здоровых субъектов являются сложно детектируемыми (в пг/мл диапазоне), однако они могут значительно повышаться в результате тяжелой инфекции, при этом уровни могут подниматься вплоть до 100 нг/мл. РСТ широко применяется для постановки диагноза у пациентов с системной инфекцией, то есть сепсисом, при этом чувствительность составляет 76%, а специфичность составляет 70%. Тем не менее, исследования, в рамках которых анализировали диагностическую ценность РСТ при другой несистемной инфекции, такой как пневмония или инфекции верхних дыхательных путей, показали, что она является ограниченной, особенно при самостоятельном применении.
Авторы ранее определили новые наборы биомаркеров, паттерн экспрессии которых значительно коррелирует с типом инфекции - как описано в Международной патентной заявке WO 2011132086 и WO 2013/117746, обе из которых приведены здесь для ссылки.
Настоящее изобретение в рамках некоторых вариантов его осуществления основано на применении сигнатуры полипептидов для диагностики бактериальных инфекций, вирусных инфекций и небактериальных невирусных заболеваний. Способы по вариантам осуществления настоящего изобретения включают применение алгоритмов распознавания паттернов для идентификации типа инфекции, которой страдает субъект, что в свою очередь обеспечивает возможность выбора подходящей схемы лечения. Различные варианты осуществления изобретения направлены на преодоление ограничений современных диагностических решений за счет: (i) обеспечения возможности проведения точной диагностики в рамках широкого диапазона патогенов; (ii) обеспечения быстрой диагностики (в течение нескольких минут); (iii) нечувствительности к наличию непатогенных бактерий и вирусов (таким образом обеспечивая снижение проблемы ложноположительных результатов); и (iv) устранения потребности в прямом заборе образцов патогена, таким образом обеспечивая диагностику недоступных инфекций. Таким образом, некоторые способы по изобретению обеспечивают возможность отбора субъектов, для которых лечение антибиотиками является желательным, и предотвращение нежелательного лечения антибиотиками у субъектов, имеющих только вирусную инфекцию или неинфекционное заболевание. Некоторые способы по изобретению также предусматривают отбор субъектов, для которых противовирусное лечение будет обладать являться благоприятным.
Для подкрепления результатов, приведенных в Международной патентной заявке WO 2013/117746, авторы настоящего изобретения в данном случае увеличили количество пациентов, принимавших участие в многоцентровом клиническом исследовании, включив в него 1002 пациентов больниц с различными типами подтвержденных инфекций, а также контрольных субъектов (пациентов с подтвержденным невирусным/небактериальным заболеванием и здоровых субъектов).
Пытаясь повысить уровень точности и чувствительности описанных ранее способов, авторы настоящего изобретения в данном случае применили троичный классификатор, который обеспечивает классификацию пациентов (с подтвержденным типом заболевания) на три различных класса: бактериальная инфекция, вирусная инфекция и небактериальное невирусное заболевание. Сравнение уровней комбинации полипеитидов у тестируемого субъекта с паттернами экспрессии, полученными в рамках исследования, приводило к получению лучших результатов в плане чувствительности и специфичности по сравнению с двоичным классификатором, как показано в Примере 3 и в Таблицах 9-12.
В контексте настоящего изобретения могут применяться следующие аббревиатуры. ANC = Абсолютное количество нейтрофилов; ANN = Искусственные нейронные сети; AUC = Площадь под характеристической кривой; BP = Bordetella pertussis; CHF = Хроническая сердечная недостаточность; CI = Доверительный интервал; CID = Врожденный иммунодефицит; CLL = Хронический лимфолейкоз; CMV = Цитомегаловирус; CNS = Центральная нервная система; COPD = Хроническая обструктивная болезнь легких; CP = Chlamydophila pneumoniae; CRP = С-реактивный белок; CSF = Спинномозговая жидкость; CV = Коэффициент вариации; DOR = Соотношение диагностических коэффициентов; EBV = Вирус Эпштейна-Барра; eCRF = Электронная форма отчета; ED = Отделение неотложной помощи; ELISA = Иммуносорбентный анализ с ферментной меткой; FDR = Частота ложноположительных обнаружений; FMF = Семейная средиземноморская лихорадка; G-CSF = Гранулоцитарный колониестимулирующий фактор; GM-CSF = Гранулоцитарно-макрофагальный колониестимулирующий фактор; HBV = Вирус гепатита В; HCV = Вирус гепатита С; HI = Haemophilus influenza; HIV = Вирус иммунодефицита человека; IDE = Эксперты по инфекционным болезням; IL = Интерлейкин; IRB = Институциональный наблюдательный совет; IVIG = Внутривенный иммуноглобулин; KNN = Анализ на основе k-ближайших соседей; LP = Legionella pneumophila; LR+ = Положительный критерий отношения правдоподобия; LR- = Отрицательный критерий отношения правдоподобия; LRTI = Инфекции нижних дыхательных путей; mAb = Моноклональные антитела; MDD = Минимальная детектируемая доза; MDS = Миелодиспластический синдром; MP = Микоплазменная пневмония; MPD = Миелопролиферативное заболевание; NPV = Отрицательная прогностическая ценность; РСТ = Прокальцитонин; PED = Детское отделение неотложной помощи; PPV = Положительная прогностическая ценность; QA = Гарантия качества; RSV = Респираторно-синцитиальный вирус; RV = Риновирус; SIRS = Системный воспалительный синдром; SP = Стрептококковая пневмония; STARD = Стандарты отчетности по диагностической точности; SVM = Метод опорных векторов; TNF = Фактор некроза опухоли; URTI = Инфекция верхних дыхательных путей; UTI = Инфекции мочевыводящих путей; WBC = Белая кровяная клетка; WS = Критерий Уилкоксона.
В контексте настоящего изобретения могут применяться следующие статистические термины.
"TP" представляет собой истинно положительный результат и означает положительный результат теста, который точно отражает тестируемую активность. Например, в контексте настоящего изобретения TP, например, но без ограничения, истинным образом классифицирует бактериальную инфекцию как таковую.
"TN" представляет собой истинно отрицательный результат и означает отрицательный результат теста, который точно отражает тестируемую активность. Например, в контексте настоящего изобретения TN, например, но без ограничения, истинным образом классифицирует вирусную инфекцию как таковую.
"FN" представляет собой ложноотрицательный результат и означает результат, который выглядит отрицательным, но не описывает ситуацию. Например, в контексте настоящего изобретения FN, например, но без ограничения, ложным образом классифицирует бактериальную инфекцию как таковую.
"FP" представляет собой ложноположительный результат и означает результат теста, который ошибочно классифицируется в качестве соответствующего положительной категории. Например, в контексте настоящего изобретения FP, например, но без ограничения, ложным образом классифицирует бактериальную инфекцию в качестве бактериальной инфекции.
"Чувствительность" вычисляют как TP/(TP+FN) или на основе истинно положительной доли субъектов с заболеванием.
"Специфичность" вычисляют как TN/(TN+FP) или на основе истинно отрицательной доли случаев отсутствия заболевания или нормальных субъектов.
"Общую точность" вычисляют как (TN+TP)/(TN+FP+ТР+FN).
"Положительную прогностическую ценность" или "PPV" вычисляют как TP/(TP+FP) или в виде истинно положительной доли всех положительных результатов тестирования. На него по существу влияют частотность заболевания и вероятность его возникновения в тестируемой популяции перед проведением теста.
"Отрицательную прогностическую ценность" или "NPV" вычисляют как TN/(TN+FN) или на основе истинно отрицательной доли всех отрицательных результатов тестирования. На нее также по существу влияют частотность заболевания и вероятность его возникновения в тестируемой популяции перед проведением теста. См., например, O'Marcaigh AS, Jacobson RM, "Estimating The Predictive Value Of A Diagnostic Test, How To Prevent Misleading Or Confusing Results," Clin. Ped. 1993, 32(8): 485-491, где обсуждается специфичность, чувствительность и положительная и отрицательная прогностическая ценность теста, например клинического диагностического текста.
"МСС" (Коэффициент корреляции Мэтьюса) вычисляют следующим образом: МСС=(TP* TN-FP*FN)/((TP+FN)*(TP+FP)*(TN+FP)*(TN+FN}^O,5,
где TP, FP, TN, FN представляют собой истинно положительные, ложноположительные, истинно отрицательные и ложноотрицательные результаты, соответственно. Следует обратить внимание, что значения МСС лежат в диапазоне между -1 и +1, что соответствует полностью неправильной и превосходной классификации, соответственно. Нулевое значение МСС указывает на произвольную классификацию. Было показано, что МСС может применяться для комбинирования чувствительности и специфичности в одну метрику (Baldi, Brunak et al. 2000). Он также может применяться для измерения и оптимизации точности классификации в случаях несбалансированных размеров классов (Baldi, Brunak et al. 2000).
Термин "точность" означает степень соответствия измеренного или вычисленного количества (полученного в рамках теста значения) с его реальным (или истинным) значением. Клиническая точность относится к доле истинных результатов (истинно положительных (TP) или истинно отрицательных (TN) относительно неправильно классифицированных результатов (ложноположительных (FP) или ложноотрицательных (FN)) и может быть выражена как чувствительность, специфичность, значения положительной прогностической ценности (PPV) или отрицательной прогностической ценности (NPV), Коэффициент корреляции Мэтьюса (МСС) или в виде вероятности, соотношения вероятностей, характеристической кривой обнаружения (ROC), площади под кривой (AUC), а также других показателей.
Термин "аналитическая точность" означает воспроизводимость и предсказуемость самого процесса измерения и может быть обобщен в рамках подобных измерений в виде коэффициентов вариации (CV), коэффициента корреляции Пирсона и тестов на соответствие и калибровку нескольких образцов или контролей с различными показателями времени, пользователями, оборудованием и/или реагентами. Данные и иные обстоятельства в рамках оценки новых биомаркеров также приведены у Vasan, 2006.
"Эффективность" представляет собой термин, который связан с общей полезностью и качеством диагностического или прогностического теста, включая, помимо прочего, клиническую и аналитическую эффективность, другие аналитические и процессные характеристики, такие как применение характеристик (например, стабильности, простоты применения), экономического показателя здоровья, и относительных затрат на компоненты теста. Любой из данных факторов может являться источником повышенной эффективности и, таким образом, полезности теста и может быть определен с помощью подходящих "метрик эффективности", таких как AUC и МСС, время до получения результата, срок хранения и так далее в качестве соответствующего данному критерию..
Под "статистически значимым" подразумевается, что соответствующее изменение является более существенным, чем то, которое произойти лишь случайным образом (которое могло являться "ложноположительным").
Статистическая значимость может быть определена с помощью любого способа, известного из уровня техники. Обычно применяемые способы измерения значимости включают p-значение, которое описывает вероятность получения результата, который, по меньшей мере, является столь же экстремальным, что и соответствующие данные при условии, что эти данные являлись результатом только случайности. Результат зачастую считают высокозначимым при p-значении =0,05 или менее.
Далее будут подробны описаны аспекты изобретения.
Фиг. 31 представляет собой блок-схему способа, являющегося подходящим для анализа биологических данных, полученных от субъекта, в соответствии с различными примерами вариантов осуществления настоящего изобретения. Следует понимать, что если не указано иное, описанные ниже операции могут быть осуществлены либо одновременно, либо последовательно в рамках множества комбинаций или последовательностей осуществления. В частности, приведенный на блок-схемах порядок осуществления не следует рассматривать в качестве ограничивающего. Например, две или более операции, которые приведены в рамках последующего описания или на блок-схемах в определенном порядке, могут быть осуществлены в ином порядке (например, в обратном порядке) или по существу одновременно. Дополнительно, некоторые описанные ниже операции являются необязательными и могут не осуществляться.
В некоторых вариантах осуществления настоящего изобретения субъект ранее подвергался лечению антибиотиком, при этом в некоторых вариантах осуществления настоящего изобретения субъекты ранее не подвергался лечению антибиотиком.
Любой из описанных здесь способов может быть практически реализован в различных формах. Например, он может быть реализован в рамках физического носителя, например в виде компьютера для выполнения операций, являющихся частью способа. Он может быть реализован в рамках машиночитаемого носителя данных, включающего машиночитаемые инструкции для реализации операций, являющихся частью способа. Он также может быть реализован в рамках электронного устройства, имеющего характеристики цифрового компьютера, являющегося подходящим для выполнения компьютерной программы в рамках физического носителя, или выполнять инструкции на машиночитаемом носителе данных.
Компьютерные программы, в рамках которых осуществляется практическая реализация способа в соответствии с настоящими вариантами осуществления изобретения, могут поставляться пользователям на дистрибуционном носителе, таком как, но без ограничения, CD-ROM или флэш-накопитель. Компьютерные программы могут быть скопированы с дистрибуционного носителя на жесткий диск или малый промежуточный носитель данных. В некоторых вариантах осуществления настоящего изобретения компьютерные программы, в рамках которых осуществляется практическая реализация способа в соответствии с настоящими вариантами осуществления изобретения, могут быть поставлены пользователям путем обеспечения возможности скачивания пользователями программ из удаленного месторасположения через коммуникационную сеть, например интернет. Компьютерные программы могут быть запущены путем загрузки компьютерных инструкций либо с их дистрибуционного носителя или их промежуточного носителя данных в выполняемую память компьютера, конфигурирования компьютера для работы в соответствии со способом по данному изобретению. Все данные операции хорошо известны специалистам в области компьютерных систем.
Вычислительные операции в рамках способа в соответствии с настоящими вариантами осуществления изобретения могут быть выполнены компьютером, являющимся либо удаленным, либо находящимся рядом с субъектом. В случае, если компьютер является удаленным относительно пользователя, он может получать данные через сеть, такую как телефонная сеть или интернет. С этой целью локальный компьютер может применяться для передачи данных удаленному компьютеру. Данная конфигурация обеспечивает выполнение анализа, когда субъект находится в ином месте (например, дома), и также обеспечивает выполнение одновременных анализов для нескольких субъектов, находящихся во множестве различных мест.
Вычислительные операции в рамках способа также могут осуществляться с помощью облачного вычислительного ресурса в облачном вычислительном центре. Облачный вычислительный ресурс может включать вычислительный сервер и необязательно также сервер для хранения данных, и может управляться облачным вычислительным клиентом, как известно из уровня техники.
Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии бактериальной инфекции. Альтернативно, способ также может применяться для "вынесения заключения" об отсутствии небактериальной инфекции. Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии бактериальной инфекции и "вынесении заключения" о наличии небактериального заболевания.
Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии вирусной инфекции. Альтернативно, способ также может применяться для "вынесения заключения" об отсутствии невирусной инфекции.
Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии вирусной инфекции и для "вынесения заключения" о наличии невирусного заболевания.
Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии неинфекционного заболевания. Альтернативно, способ может применяться для "вынесения заключения" об отсутствии неинфекционного заболевания. Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии инфекционного заболевания и "вынесении заключения" о наличии неинфекционного заболевания.
Биологические данные, анализируемые с помощью способа, содержат значения экспрессии множества полипептидов в крови субъекта. В некоторых вариантах осуществления биологические данные включают значения экспрессии лишь двух полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, трех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь трех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, четырех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь четырех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, пяти полипептидов, и в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь пяти полипептидов.
Авторы настоящего изобретения рассматривают многие типы полипептидов. Соответствующие примеры включают, без ограничения, CRP, IP- 10, TRAIL, IL1ra, РСТ и SAA. В некоторых вариантах осуществления данное множество полипептидов включает, по меньшей мере, CRP и TRAIL, и в некоторых вариантах осуществления данное множество полипептидов включает, по меньшей мере, CRP, TRAIL и IP-10.
В некоторых вариантах осуществления настоящего изобретения биологические данные представлены в форме субъект-специфического набора данных, как далее подробно описано ниже.
В соответствии с определенным вариантом осуществления уровни секретируемых (то есть растворимых) полипептидов (например, TRAIL, CRP и IP-10) подвергают анализу с помощью данного способа.
Термин "субъект" в соответствии с используемым здесь значением предпочтительно означает человека. Субъект может иметь мужской или женский пол. Субъект может представлять собой новорожденного, ребенка, подростка или взрослого. Субъект может являться тем, кому ранее был поставлен диагноз или кто был идентифицирован в качестве имеющего инфекцию, и необязательно уже подвергся или подвергается терапевтическому вмешательству для лечения инфекции. Альтернативно, субъект также может являться тем, кому не был ранее поставлен диагноз, связанный с наличием инфекции. Например, субъект может представлять собой того, кто демонстрирует один или несколько факторов риска, связанных с наличием инфекции. Субъект также может иметь инфекции, но не демонстрировать симптомов инфекции.
Субъект, заболевание которого было диагностировано в соответствии с некоторыми вариантами осуществления настоящего изобретения обозначается ниже как "тестируемый субъект". Авторы настоящего изобретения собрали информацию относительно паттернов экспрессии полипептидов у множества субъектов, чье заболевание было уже диагностировано, и разработали аналитический способ в соответствии с настоящими вариантами осуществления изобретения на основе собранной информации. Данное множество субъектов обозначено ниже как "субъекты перед диагностикой" или "другие субъекты".
В соответствии с используемым здесь значением, термин "бактериальная инфекция" означает состояние, при котором субъект является инфицированным бактерией. Инфекция может являться симптоматической или асимптоматической. В контексте данного изобретения бактериальная инфекция также может включать вирусный компонент (то есть являться смешанной инфекцией вследствие как бактерий, так и вируса).
Бактериальная инфекция может являться острой или хронической.
Острая инфекция характеризуется быстрым развитием заболевания, относительно быстрым периодом проявления симптомов и разрешением в течение нескольких дней. Хроническая инфекция представляет собой инфекцию, которая развивается медленно и длится в течение долгого времени. Одно различие между острой и хронической инфекцией заключается в том, что при острой инфекции иммунная система зачастую продуцирует IgM+ антитела против инфекционного агента, в то время как хроническая фаза инфекции обычно характеризуется IgM-/IgG+ антителами. Кроме того, острые инфекции вызывают опосредуемые иммунитетом некротические процессы, в то время как хронические инфекции зачастую вызывают опосредуемые воспалением фиброзные процессы и появление шрамов. Таким образом, острые и хронические инфекции могут затрагивать различные иммунологические механизмы более низкого порядка.
Бактериальная инфекция может являться результатом грамположительных, грамотрицательных бактерий или атипичных бактерий.
Термин "грамположительные бактерии" в соответствии с используемым здесь значением означает бактерии, характеризуемые тем, что частью структуры их клеточной оболочки является пептидогликан, а также полисахариды и/или тейхоевые кислоты, а также характеризуются сине-фиолетовым цветом их реакции при процедуре окрашивания по Граму. Соответствующе грамположительные бактерии включают: Actinomyces spp., Bacillus anthracis, Bifidobacterium spp., Clostridium botulinum, Clostridium perfringens, Clostridium spp., Clostridium tetani, Corynebacterium diphtheriae, Corynebacterium jeikeium, Enterococcus faecalis, Enterococcus faecium, Erysipelothrix rhusiopathiae, Eubacterium spp., Gardnerella vaginalis, Gemella morbillorum, Leuconostoc spp., Mycobacterium abcessus, комплекс Mycobacterium avium, Mycobacterium chelonae, Mycobacterium fortuitum, Mycobacterium haemophilium, Mycobacterium kansasii, Mycobacterium leprae, Mycobacterium marinum, Mycobacterium scrofulaceum, Mycobacterium smegmatis, Mycobacterium terrae, Mycobacterium tuberculosis, Mycobacterium ulcerans, Nocardia spp., Peptococcus niger, Peptostreptococcus spp., Proprionibacterium spp., Staphylococcus aureus, Staphylococcus auricularis, Staphylococcus capitis, Staphylococcus cohnii, Staphylococcus epidermidis, Staphylococcus haemolyticus, Staphylococcus hominis, Staphylococcus lugdanensis, Staphylococcus saccharolyticus, Staphylococcus saprophyticus, Staphylococcus schleiferi, Staphylococcus similans, Staphylococcus warneri, Staphylococcus xylosus, Streptococcus agalactiae (стрептококк группы В), Streptococcus anginosus, Streptococcus bovis, Streptococcus canis, Streptococcus equi, Streptococcus milleri, Streptococcus mitior, мутанты Sreptococcus, Streptococcus pneumoniae, Streptococcus pyogenes (стрептококк группы A), Streptococcus salivarius, Streptococcus sanguis.
Термин "грамотрицательные бактерии" в соответствии с используемым здесь значением означает бактерии, характеризуемые наличием двойной мембраны, окружающей каждую бактериальную клетку.
Соответствующие грамотрицательные бактерии включают Acinetobacter calcoaceticus, Actinobacillus actinomycetemcomitans, Aeromonas hydrophila, Alcaligenes xylosoxidans, бактероиды, Bacteroides fragilis, Bartonella bacilliformis, Bordetella spp., Borrelia burgdorferi, Branhamella catarrhalis, Brucella spp., Campylobacter spp., Chalmydia pneumoniae, Chlamydia psittaci, Chlamydia trachomatis, Chromobacterium violaceum, Citrobacter spp., Eikenella corrodens, Enterobacter aerogenes, Escherichia coli, Flavobacterium meningosepticum, Fusobacterium spp., Haemophilus influenzae, Haemophilus spp., Helicobacter pylori, Klebsiella spp., Legionella spp., Leptospira spp., Moraxella catarrhalis, Morganella morganii, Mycoplasma pneumoniae, Neisseria gonorrhoeae, Neisseria meningitidis, Pasteurella multocida, Plesiomonas shigelloides, Prevotella spp., Proteus spp., Providencia rettgeri, Pseudomonas aeruginosa, Pseudomonas spp., Rickettsia prowazekii, Rickettsia rickettsii, Rochalimaea spp.. Salmonella spp., Salmonella typhi, Serratia marcescens, Shigella spp., Treponema carateum, Treponema pallidum, Treponema pallidum endemicum, Treponema pertenue, Veillonella spp., Vibrio cholerae, Vibrio vulnificus, Yersinia enterocolitica и Yersinia pestis.
Термин "атипичные бактерии" означает бактерии, которые не относятся ни к одной из классических групп по Граму. Как правило, они представляют собой внутриклеточные бактериальные патогены. Они включают, без ограничения, Mycoplasmas spp., Legionella spp. Rickettsiae spp. и Chlamydiae spp.
Термин "небактериальное заболевание" в соответствии с используемым здесь значением означает любое заболевание или состояние, которое не вызывается инфекционными бактериями.
На Фиг. 31 способ начинается в пункте 310 и продолжается в пункте 311, в котором вычисляется первое расстояние d между сегментом SROI первого кривого объекта S и некривого объекта π. В целом, первый кривой объект S представляет собой многообразие в n измерениях, при этом n представляет собой положительное целое число, а некривой объект π представляет собой гиперплоскость в n+1-мерном пространстве.
Концепция n-мерных многообразий и гиперплоскостей в n+1 измерениях хорошо известна специалистам в области геометрии. Например, если n=1, то первый кривой объект представляет собой кривую линию, а второй некривой объект π представляет собой гиперплоскость в 2 измерениях, а именно прямую линию, образующую ось. Если n=2, то первый кривой объект представляет собой кривую поверхность, в некривой объект π представляет собой гиперплоскость в 3 измерениях, а именно плоскую плоскость, называемую ниже "плоскостью".
Гиперплоскость π образована n направлениями. Например, если некривой объект представляет собой ось, то он образован одним направлением, а если некривой объект представляет собой плоскость, то он образован двумя направлениями, называемыми первым направлением и вторым направлением.
Расстояние между многообразием S и гиперплоскостью π вычисляют в точке Р на гиперплоскости. Р определяется n координатами. Например, если гиперплоскость представляет собой ось, то Р определяется одной координатой δ1 вдоль одного направления, а если гиперплоскость представляет собой плоскость, то Р определяется парой указанных координат (δ0, δ1), где δ0 имеет название "первая координата" и определена вдоль первого направления, a δ1 имеет название "вторая координата" и определена вдоль второго направления. Если явно не указано иное, указание на координату δ0 описывает необязательный вариант, который является предполагаемым в том случае, если S представляет собой поверхность, а π представляет собой плоскость.
Направления отмечены с использованием тех же греческих букв, что и соответствующие координаты, за исключением того, что направления отмечены с использованием подчеркнутых греческих букв для указания того, что они являются векторами. Таким образом, первое направление отмечено как δ 0, а второе направление отмечено как δ 1.
На Фиг. 32А изображена гиперплоскость π для случая n=2. В рамках данных вариантов π представляет собой плоскость, образованную направлениями δ 0 и δ 1. Также показана точка Р с координатами (δ0, δ1). Направления δ 0 и δ 1 показаны как ортогональные по отношению к друг другу, однако это не является обязательным, поскольку угол между δ 0 и δ 1 может быть отличным от 90°. На плоскости π присутствует представляющий интерес планарный участок πROI, расположенный от минимальной первой координаты δ0,MIN до максимальной первой координаты δ0,MAX вдоль направления δ 0 и от минимальной второй координаты δ1,MIN до максимальной второй координаты δ1,MAX вдоль направления δ 1. Точка Р расположена в рамках представляющего интерес участка πROI. Если n=1 (не показано), то π представляет собой ось, а представляющий интерес участок πROI представляет собой линейный сегмент π, расположенный от δ1,MIN до δ1,MAX вдоль направления δ1.
Вычисление первого расстояния d приведено на Фиг. 32В, на которой показана гиперплоскость π и многообразие S. Расстояние d измеряют от S до точки Р перпендикулярно π. Следует понимать, что в то время как каждый из объектов π и S показан в виде одномерной линии, это необязательно должно быть так, поскольку S и π в целом представляют собой n-мерные математические объекты. Например, если S представляет собой поверхность, а π представляет собой плоскость, то как π, так и S в целом представляют собой двумерные математические объекты. Сегмент SROI S расположен выше представляющего интерес участка πROI. Например, если π представляет собой плоскость, то πROI представляет собой планарный представляющий интерес участок, а если π представляет собой ось, то πROI представляет собой линейный сегмент вдоль оси. Таким образом, πROI представляет собой проекцию SROI на π. Для n=2 SROI предпочтительно представляет собой непланарный сегмент (поверхности) S, а для n=1 SROI предпочтительно представляет собой кривой сегмент (кривой) S.
Каждая из n координат задана комбинацией значений экспрессии полипептидов. Например, для n=1 координата δ1 задана комбинацией значений экспрессии полипептидов, а для n=2 каждая из координат δ0 и δ1 задана отличной комбинацией значений экспрессии полипептидов.
Например, δ1 и необязательно также δ0 представляют собой комбинацией полипептидов, в соответствии со следующим уравнением:
δ00+a1D1+a2D2+…+φ0
δ1=b0+b1D1+b2D2+…+φ1,
где а0, а1, … и b0, b1, … представляют собой неизменные и предварительно определенные коэффициенты, а каждая из переменных D1, D2, … представляет собой уровни экспрессии одного из полипептидов, а φ0 и φ1 представляют собой функции, которые являются нелинейными в отношении, по меньшей мере, одного из уровней экспрессии.
Каждая из функций φ0 и φ1 является необязательной и может независимо возвращать ноль (или, эквивалентным образом, не включаться при вычислении соответствующей координаты). Если φ0=0, то координата δ0 представляет собой комбинацию полипептидов, а если φ1=0, то координата δ1 представляет собой комбинацию полипептидов.
Нелинейные функции φ0 и φ1 могут быть необязательно и предпочтительно выражены в виде степеней уровней экспрессии, например в соответствии со следующими выражениями:
φ0iqiXi γi
φ1iriXi λi,где i представляет собой индекс суммирования, qi и ri представляют собой наборы коэффициентов, Xi ∈ {D1, D2, …}, а каждый из γi и λi представляет собой численную экспоненту. Следует обратить внимание, что ряд членов в каждой из нелинейных функций φ0 и φ1 не обязательно равняется количеству полипептидов и что два или более члена в каждой сумме могут соответствовать одному полипептиду, хотя и с отличной численной экспонентой.
Соответствующие примеры коэффициентов, подходящих для настоящих вариантов осуществления изобретения, приведены в разделе Примеры далее (см. Таблицы 3, 13-17, 29 и 31-36).
Если φ0=0, φ1=0 и полипептиды включают TRAIL, то δ0 необязательно и предпочтительно представляет собой возрастающую функцию значения экспрессии TRAIL, а δ1 представляет собой убывающую функцию TRAIL. Если φ0=0, φ1=0 и полипептиды включают CRP, то δ1 и необязательно также δ0 необязательно и предпочтительно представляют собой возрастающие функции значения экспрессии CRP. Если полипептиды включают IP-10, то δ1 и необязательно также δ0 необязательно и предпочтительно представляют собой возрастающие функции значения экспрессии IP-10.
В вариантах осуществления изобретения, в рамках которых φ0=0, φ1=0 и полипептиды включают TRAIL, CRP и IP-10, каждый из δ0 и δ1 может представлять собой линейную комбинацию TRAIL, CRP и IP-10 в соответствии со следующим уравнением:
δ001С+a2I+а3Т
δ1=b0+b1C+b2I+b3T,
где С, I и Т представляют собой, соответственно, уровни экспрессии CRP, IP-10 и TRAIL.
Предпочтительно, как a1, так и b1 являются положительными. Предпочтительно, как а2, так и b2 являются положительными.
Предпочтительно, а3 является положительным, а b3 является отрицательным. Соответствующие примеры коэффициентов, подходящих для вариантов осуществления изобретения, в рамках которых комбинация представляет собой линейную комбинацию, а полипептиды представляют собой CRP, IP-10 и TRAIL, приведены в разделе Примеры далее (см. Таблицы 3, 13-17 и 33).
В вариантах осуществления, в рамках которых φ0≠0, φ1≠0 и полипептиды включают TRAIL, CRP и IP-10, каждый δ0 и δ1 может представлять собой комбинацию TRAIL, CRP и IP-10 в соответствии со следующими уравнениями:
δ001С+a2I+a3T+φ0
δ1=b0+b1C+b2I+b3T+φ1,
где каждый из φ0 и φ1 представляет собой нелинейную функцию, по меньшей мере, одного или, по меньшей мере, двух из С, I и Т. В качестве соответствующего примера φ0 и φ1 могут быть выражены как:
φ0=q1Cγ1+q2Cγ2+q3Tγ3
φ1=r1Cγ1+r2Cγ2+r3Tγ3.
Соответствующие примеры коэффициентов, подходящих для вариантов осуществления изобретения, в рамках которых полипептиды представляют собой CRP, IP-10 и TRAIL, а нелинейные функции не возвращают ноль, приведены в разделе Примеры далее (см. Таблицу 36).
Границы δ0,MIN, δ0,MAX, δ1,MIN и δ1,MAX πROI предпочтительно соответствуют физиологически возможным диапазонам значений экспрессии полипептидов.
При измерении с применением протоколов, описанных ниже в Примере 8, более предпочтительно в Примере 9, физиологически возможные диапазоны составляют, как правило, от 0 до около 400 мкг/мл (CRP), от 0 до около 3000 пг/мл (IP-10) и от 0 до около 700 пг/мл (TRAIL). Некоторые субъекты могут демонстрировать концентрации, которые лежат вне данных диапазонов. - В рамках различных примеров вариантов осуществления изобретения если значения экспрессии TRAIL, CRP и IP-10 измеряют в соответствии с протоколом, описанным ниже в Примере 8, более предпочтительно в Примере 9, значения коэффициентов а0,…,а3 и b0,…,b3 берут из Таблицы 3 ниже, а границы πROI составляют: δ0,MIN=- -1.3 δ0,MAX=45 δ1,MIN=-14.3 и δ1,MAX=49.6.
При измерении значений экспрессии TRAIL, CRP и IP-10 с применением протокола, которые отличает от протокола, описанного ниже в Примере 8, более предпочтительно в Примере 9, значения коэффициентов а0,…,a3 и b0,…,b3 отличаются от значений в Таблице 3 ниже, и, таким образом, границы πROI также отличаются от указанных выше значений. В подобных случаях значения коэффициентов и границ коррелирует с вышеуказанными значениями, при этом корреляцию каждого коэффициента и границы получают на основе корреляции между значением экспрессии соответствующего белка при измерении в соответствии с протоколом, описанным в Примере 8, более предпочтительно в Примере 9, и значением экспрессии соответствующего белка при реальном измерении.
По крайней мере, основная часть сегмента SROI кривого объекта S расположена между двумя кривыми объектами, которые далее называют нижним ограничивающим кривым объектом SLB и верхним ограничивающим кривым объектом SUB.
В соответствии с используемым здесь значением, термин "основная часть сегмента SROI" означает часть сглаженного варианта SROI, чья длина (при n=1), площадь поверхности (при n=2) или объем (при n≥3) составляет 60% или 70% или 80% или 90% или 95% или 99% сглаженного варианта длины, площади поверхности или объема SROI, соответственно.
В соответствии с используемым здесь значением, термин "сглаженный вариант сегмента SROI" означает сегмент SROI за исключением участков SROI вблизи точек, где гауссова кривизна превышает предельное значение кривизны, составляющее Х-кратную величину медианной кривизны SROI, при этом X равен 1,5 или 2 или 4 или 8.
Нижеследующая процедура может применяться с целью определения того, расположена ли основная часть сегмента SROI между SLB и SUB. Во-первых, получают сглаженный вариант сегмента SROI. Во-вторых, вычисляют длину (при n=1), площадь поверхности (при n=2) или объем (при n≥3) А1 сглаженного варианта сегмента SROI. В-третьих, вычисляют длину (при n=1), площадь поверхности (при n=2) или объем (при n≥3) А2 части сглаженного варианта сегмента SROI, расположенного между SLB и SUB. В-четвертых, вычисляют процентное отношение А2 к А1.
На Фиг. 33А-D показана процедура получения сглаженного варианта SROI.
Для лучшего понимания SROI изображен в виде одномерного сегмента, однако специалисту в данной области будет очевидно, что SROI в целом представляет собой n-мерный математический объект. Гауссова кривизна вычисляется для достаточного количества точек на SROI. Например, при отображении многообразия в виде точечного множества гауссова кривизна может быть вычислена для точек, являющихся частью точечного множества. Затем получают медиану гауссовой кривизны и вычисляют предельную кривизну путем умножения полученной медиана на X На Фиг. 33А показан SROI перед проведением операции сглаживания. Отмечен участок 320 с одной или несколькими точками 322, в которых гауссова кривизна превышает предельную кривизну. Точка или точка, в которых гауссова кривизна является максимальной в участке 320, удалена, а участок 320 плавно интерполирован, например с помощью полиномиальной интерполяции (Фиг. 33В). Удаление и интерполяция повторяются несколько раз (Фиг. 33С) до момента, когда сегмент SROI не содержит участков, в которых гауссова кривизна превышает предельную кривизну (Фиг. 33D).
Если n=1 (то есть когда S представляет собой кривую линию), то SLB представляет собой нижнюю ограничивающую кривую, a SUB представляет собой верхнюю ограничивающую кривую. В рамках данных вариантов осуществления изобретения SLB и SUB могут быть записаны в форме:
SLB=f(δ1)-ε0,
SUB=f(δ1)+ε1
где f(δ1) представляет собой функцию вероятностной классификации координаты δ1 (вдоль направления δ 1 ), которая отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию. В некоторых вариантах осуществления изобретения f(δ1)=1/(1+exp(δ1)). Каждый из SLB и SUB является положительным для любого значения δ1 в рамках πROI. Также рассматриваются варианты осуществления изобретения, в рамках которых f(δ1) представляет собой функцию вероятностной классификации, которая отражает вероятность того, что тестируемый субъект имеет вирусную инфекцию. Также рассматриваются варианты осуществления изобретения, в рамках которых f(δ1) представляет собой функцию вероятностной классификации, которая отражает вероятность того, что тестируемый субъект имеет инфекцию.
Если n=2 (то есть если S представляет собой кривую поверхность), то SLB представляет собой нижнюю ограничивающую кривую поверхность, a SUB представляет собой верхнюю ограничивающую кривую поверхность. В рамках данных вариантов осуществления изобретения SLB и SUB могут быть записаны в форме:
SLB=f(δ01)-ε0,
SUB=f(δ01)+ε1
где f(δ01) представляет собой функцию вероятностной классификации первой и второй координаты (вдоль первого и второго направления), которая отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию. В некоторых вариантах осуществления изобретения f(δ01)=exp(δ1)/(1+exp(δ0)+exp(δ1)). Как SLB, так и SUB являются положительными для любого значения δ0 и δ1 в рамках πROI.
В рамках любого из указанных выше вариантов осуществления каждый из параметров ε0 и ε1 составляет менее чем 0,5 или менее чем 0,4 или менее чем 0,3 или менее чем 0,2 или менее чем 0,1 или менее чем 0,05.
На Фиг. 31 способ далее включает пункт 312, в рамках которого вычисленное расстояние d коррелируется с присутствием, отсутствием, или вероятностью того, что субъект имеет заболевание или состояние, соответствующее типу вероятностной функции f. Например, если вероятностная функция f отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию, то вычисленная вероятность d коррелируется с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию.
В рамках различных примеров вариантов осуществления изобретения данное определение корреляции включает определение того, что расстояние d представляет собой вероятность того, что субъект имеет бактериальную инфекцию. Данная вероятность необязательно и предпочтительно сравнивается с предварительно определенным пороговым значением ωB, при этом способ может обеспечивать возможность определения того, что субъект вероятно имеет бактериальную инфекцию, если вероятность превышает ωB, и что он вероятно не имеет бактериальную инфекцию в ином случае. Обычные значения сов включают, без ограничения, 0,2, около 0,3, около 0,4, около 0,5, около 0,6 и около 0,7. Также включены другие предельные значения вероятности.
В рамках некоторых вариантов осуществления настоящего изобретения, если способ обеспечивает определение того, что субъект вероятно имеет бактериальную инфекцию, то субъект подвергается лечению бактериальной инфекции (316), как подробно описано здесь.
Авторы настоящего изобретения обнаружили функцию вероятностной классификации g(δ01), которая отражает вероятность того, что тестируемый субъект имеет вирусную инфекцию. В различных примерах вариантов осуществления изобретения g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)).
Функция g может также применяться, в соответствии с некоторыми вариантами осуществления настоящего изобретения, для оценки присутствия, отсутствия или вероятности того, что субъект имеет вирусную инфекцию. Таким образом, в некоторых вариантах осуществления изобретения способ включает пункт 313, в рамках которого вычисляют второе расстояние между сегментом второй кривой поверхности и плоскостью π, а также пункт 314, в рамках которого второе расстояние коррелируется с наличием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. Процедура и определения, соответствующие пунктам 313 и 314, аналогичны процедуре и определениям, соответствующим пунктам 311 и 312, которые описаны выше, mutatis mutandis. Таким образом, например, основная часть сегмента второй поверхности расположена между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом каждый из ε2 и ε3 составляет менее 0,5 или менее 0,4 или менее 0,3 или менее 0,2 или менее 0,1 или менее 0,05.
В рамках некоторых вариантов осуществления настоящего изобретения если способ обеспечивает определение того, что субъект вероятно имеет вирусную инфекцию, то субъект подвергается лечению вирусной инфекции (316), как подробно описано здесь.
В рамках различных примеров вариантов осуществления изобретения данная корреляция включает определение того, что второе расстояние представляет собой вероятность того, что субъект имеет вирусную инфекцию. Данная вероятность необязательно и предпочтительно сравнивается с предварительно определенным пороговым значением ωV, при этом способ может обеспечивать возможность определения того, что субъект вероятно имеет вирусную инфекцию, если вероятность превышает ωV, и что он вероятно не имеет вирусную инфекцию в ином случае. Обычные значения ωV включают, без ограничения, около 0,5, около 0,6, около 0,7 и около 0.8. Также включены другие предельные значения вероятности.
В вариантах осуществления изобретения, в рамках которых осуществляются операции 313 и 314, операции 311 и 312 могут либо осуществляться, либо не осуществляться. Например, настоящие варианты осуществления предусматривают процедуру, в рамках которой операции 311 и 312 не осуществляются, при этом способ обеспечивает определение вероятности того, что субъект имеет вирусную инфекцию, без вычисления первого расстояния и без коррелирования первого расстояния с наличием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию.
Альтернативно, могут быть осуществлены все операции 311-314, при этом 311 и 312 осуществляются безотносительно результата операции 314, а 313 и 314 осуществляются безотносительно результата 312. В рамках данных вариантов осуществления способ необязательно и предпочтительно включает определение как вероятности того, что субъект имеет бактериальную инфекцию, так и вероятности того, что субъект имеет вирусную инфекцию. Каждая из данных вероятностей может быть подвергнута сравнению с соответствующим предварительно определенным пороговым значением (ωB или ωV). Если каждая из данных вероятностей находится ниже соответствующего порового значения, способ обеспечивает определение того, что пациент вероятно имеет небактериальное и невирусное инфекционное заболевание. Например, способ может обеспечивать определение того, что субъект вероятно имеет неинфекционное заболевание, грибковое заболевание или паразитическое заболевание.
Альтернативно, осуществление некоторых операций зависит от результата одной или нескольких других операций. Например, способ может включать осуществление операций 311 и 312 для определения вероятности того, что субъект имеет бактериальную инфекцию. После этого определенная вероятность сравнивается с пороговым значением ωB. В рамках способа пропускается осуществление операций 313 и 314, если определенная вероятность превышает сов, и осуществляются операции 313 и 314 в ином случае. Другой пример данных вариантов осуществления представляют собой процедуру, в рамках которой способ включает осуществление операций 313 и 314 для определения вероятности того, что субъект имеет вирусную инфекцию. После этого определенная вероятность сравнивается с пороговым значением ωV. В рамках способа пропускается осуществление операций 311 и 312, если определенная вероятность превышает ωV, и осуществляются операции 311 и 312 в ином случае.
Способ необязательно и предпочтительно достигает пункта 315, в рамках которого генерируются выходные данные по вероятности (вероятностям). Выходные данные могут быть представлены в виде текста, и/или графически и/или с применением значений цвета. Выходные данные могут необязательно включать результаты сравнения с пороговым значением ωB. На Фиг. 29A-F и 38А-Е показаны примеры выходных данных для различения бактериальной и небактериальной инфекции в соответствии с одним вариантом осуществления настоящего изобретения.
Способ оканчивается на пункте 317.
Фиг. 38А-Е представляют собой скриншоты графического пользовательского интерфейса (GUI), являющегося подходящим для введения пользователем данным в рамках способа с применением компьютера для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.
GUI включает элемент управления для активации вычислений 390, который может быть представлен в виде элемента управления в форме кнопки. GUI также может включать множество полей для ввода значений экспрессии 380, при этом каждое поле для ввода значения экспрессии сконфигурировано для получения от пользователя значения экспрессии полипептида в крови субъекта. Пользователь заполняет поля для ввода значениями экспрессии полипептидов. Альтернативно, значения экспрессии могут быть получены путем установления соединения между компьютером и внешним устройством (не показано), которое измеряет значения экспрессии. В рамках данных вариантов осуществления для пользователя необязательно вводить значения экспрессии в поля для ввода вручную. В некоторых вариантах осуществления GUI включает коммуникационный элемент управления 392, например в виде элемента управления в форме кнопки, при этом связь с внешним устройством осуществляется в ответ на активацию коммуникационного элемента управления пользователем.
В ответ на активацию элемента управления 390 пользователем компьютер вычисляет балл на основе значений экспрессии, полученных автоматически или через поля для ввода 380. Балл может представлять собой вероятность того, что субъект имеет бактериальную инфекцию и/или вирусную инфекцию. Балл может быть вычислен, например, путем вычисления расстояния между кривой поверхностью и плоскостью, образованной двумя направлениями, как подробно описано выше.
На GUI может быть сгенерирована графическая шкала 382. Графическая шкала может включать первый конец, идентифицированный в качестве соответствующего вирусной инфекции, и второй конец, идентифицированный в качестве соответствующего бактериальной инфекции.
При вычислении балла на графическую шкалу 382 может быть необязательно и предпочтительно нанесена метка 394 в месте, соответствующем вычисленной вероятности. На Фиг. 38А показан GUI перед введением значений в поля для ввода, на Фиг. 38 В показана отметка 394 на шкале 382 в месте, которое соответствует 96% вероятности того, что инфекция является бактериальной, а на Фиг. 38С показана отметка 394 на шкале 382 в месте, которое соответствует 1% вероятности того, что инфекция является бактериальной (или, эквивалентно, 99% вероятности, что инфекция является вирусной). Необязательно GUI также отображает вычисленный балл в числовом виде.
GUI необязательно и предпочтительно включает один или несколько дополнительных элементов управления 386, 388, которые могут быть в форме элементов управления в виде кнопок. Например, элемент управления 388 может заставлять компьютер очищать поля для ввода 380, когда пользователь активирует элемент управления 388. Это позволяет пользователю вводить значения, которые соответствуют другому образцу. В некоторых вариантах осуществления GUI также генерирует выходные данные 384, которые обобщают результаты предыдущих образцов. Элемент управления 386 может заставлять компьютер очищать поля для ввода 380, а также выходные данные 384, когда пользователь активирует элемент управления 386. Это позволяет пользователю начинать новый сеанс вычислений (необязательно с применением нескольких образцов) без выхода из GUI.
Соответствующий пример протокола, который является подходящим для настоящих вариантов осуществления изобретения, является следующим.
GUI представляет аутентифицированному пользователю диалог, который позволяет пользователю вводить значения контроля качества (QC) эксперимента. QC проверяется и генерируется GUI, показанный на Фиг. 38А. Пользователь вводит значения экспрессии в поля для ввода 380 и активирует элемент управления 390 для получения результата (например, как показано на Фиг. 38В и 38С). Для введения значений экспрессии другого образца крови пользователь активирует элемент управления 388. Результат каждого образца добавляется в выходные данные 384, которые могут быть представлены, например, в форме таблицы. Для проведения нового эксперимента без закрытия программы или выхода пользователь активирует элемент управления 386 для очистки полей для ввода 384 и вводит новые значения QC. Предпочтительно, все операции записываются в один или несколько log-файлов.
В некоторых вариантах осуществления настоящего изобретения GUI также включает экран для отчетов (Фиг. 38D и 38Е), на котором отображаются результаты предыдущих экспериментов, например в ответ на запрос, связанный с определенной датой.
Очевидно, что представленные здесь названия полипептидов приведены лишь в качестве примеров. Специалистам в данной области будут очевидны многие альтернативные названия, наименования, модификации, изоформы и вариации. Соответственно, изобретение включает все альтернативные названия белков, наименования, модификации, изоформы и вариации.
Генетические продукты указаны на основе официальной буквенной аббревиатуры или символа гена, присвоенного Комитетом по наименованиям Международной организации по изучению генома человека (HGNC), и подвергнуты листингу на дату подачи данной заявки на веб-сайте Национального центра биотехнологической информации США (NCBI), также известном как Entrez Gene.
TRAIL: Кодируемый данным геном белок, TNF-связанный апоптоз-индуцирующий лиганд (TRAIL), представляет собой цитокин, который принадлежит к семейству лигандов-факторов некроза опухоли (TNF). Дополнительные названия данного гена включают, без ограничения, AP02L, TNF-связанный апоптоз-индуцирующий лиганд, TNFSF10 и CD253. TRAIL существует в мембраносвязанной форме и растворимой форме, обе из которых могут индуцировать апоптоз в различных клетках, таких как трансформированные опухолевые клетки. Данный белок связывается с несколькими членами суперсемейства TNF-рецепторов, такими как TNFRSF10A/TRAILR1, NFRSF10B/TRAILR2, NFRSF10C/TRAILR3, TNFRSF10D/TRAILR4, и вероятно также с NFRSF 11B/OPG. Активность данного белка может модулироваться за счет связывания с рецепторами-приманками, такими как NFRSF 10C/TRAILR3, TNFRSF 10D/TRAILR4 и NFRSF11B/OPG, которые не могут индуцировать апоптоз. Было показано, что связывание данного белка с его рецепторами вызывает активацию MAPK8/JNK, каспазы 8 и каспазы 3. Для данного гена были обнаружены подвергнутые альтернативному сплайсингу транскриптные варианты, кодирующие иные изоформы. TRAIL может быть подвергнут протеолитическому отщеплению от поверхности клетки для получения растворимой формы, которая обладает гомотримерной структурой.
В соответствии с определенным вариантом осуществления изобретения измеряют уровень растворимой (то есть секретируемой) формы TRAIL.
В соответствии с другим вариантом осуществления изобретения измеряют уровень мембранной формы TRAIL.
В соответствии с другим вариантом осуществления изобретения измеряют как уровень мембранной формы TRAIL, так и уровень секретируемой формы TRAIL.
В соответствии с другим аспектом настоящего изобретения предусмотрен способ определения типа инфекции у субъекта, включающий измерение концентрации растворимого TRAIL и нерастворимого TRAIL, при этом концентрация свидетельствует о типе инфекции.
В одном варианте осуществления изобретения, когда концентрация растворимого TRAIL превышает предварительно определенное пороговое значение, делается заключение об отсутствии бактериальной инфекции у субъекта.
В другом варианте осуществления, когда концентрация растворимого TRAIL превышает предварительно определенное пороговое значение, делается заключение о наличии вирусной инфекции у субъекта.
Примеры белковых последовательностей для растворимого TRAIL указаны в SEQ ID NO: 37 и SEQ ID NO: 38.
Пример мРНК последовательности мембранного TRAIL человека указан в SEQ IDNO: 1.
Пример аминокислотных последовательностей мембранного TRAIL человека указан в SEQ ID NO: 4.
Другие примеры последовательностей кДНК и аминокислот для TRAIL указаны в SEQ ID NO: 2, 3 и 5-8.
IP-10: Данный ген кодирует хемокин подсемейства СХС и лиганд для рецептора CXCR3. Связывание данного белка с CXCR3 приводит к плейотропным эффектам, включая стимулирование миграции моноцитов, естественных киллеров (NK-клеток) и Т-клеток, а также к модулированию экспрессии молекул адгезии. Дополнительные названия данного гена включают, без ограничений: IP-10, CXCL10, гамма-IP 10, INP10 и хемокиновый (С-Х-С мотив) лиганд 10.
Пример последовательности кДНК IP-10 человека указан в SEQ ID NO: 9-12. Пример аминокислотной последовательности IP-10 человека указан в SEQ ID NO: 13.
CRP: С-реактивный белок; дополнительные наименования CRP включают, без ограничения, RP11-419N 10.4 и РТХ1. Белок, кодируемый данным геном, принадлежит к семейству пентаксинов. Он принимает участие в некоторых связанных с защитой организма функциях на основе его способности распознавать чужеродные патогены и поврежденные клетки организма, а также инициировать их уничтожение путем взаимодействия с гуморальными и клеточными эффекторными системами в крови. Как следствие, уровень данного белка в плазме сильно повышается при острой фазе реакции на повреждение ткани, инфекцию или другие воспалительные стимулы. CRP присущи несколько функций, связанных с защитой организма: он промотирует агглютинацию, разбухание бактериальной капсулы, фагоцитоз и связывание комплемента благодаря его кальций-зависимому связыванию с фосфорилхолином.
Пример последовательности кДНК CRP человека указан в SEQ ID NO: 14-16.
Пример аминокислотной последовательности CRP человека указан в SEQ IDNO: 17.
IL1RA: Белок, кодируемый данным геном, представляет собой цитокиновый рецептор, которые принадлежит к семейству рецепторов интерлейкина-1. Данный белок представляет собой рецептор интерлейкина-альфа (ILIA), интерлейкина-бета (IL1B) и рецептор интерлейкина-1 тип I (IL1R1/IL1RA). Он является важным медиатором, принимающим участие во многих цитокин- индуцированных иммунных и воспалительных реакциях. Дополнительные названия данного гена включают, без ограничений: CD121A, IL-1RT1, р80, антиген CD121a, CD121A, IL1R и IL1ra.
Примеры последовательностей кДНК IL1RA человека указаны в SEQ ID NO: 18, 19 и 20.
Примеры аминокислотных последовательностей IL1RA человека указаны в SEQ ID NO: 21-24.
РСТ. Прокальцитонин (РСТ) представляет собой пептидный прекурсор гормона кальцитонина, при этом последний принимает участие в кальциевом гомеостазе. Прокальцитонин (РСТ) представляет собой белок, состоящий из 116 аминокислот и имеющий молекулярную массу около 13000 Да. Он представляет собой прогормон кальцитонина, который при нормальных метаболических условиях продуцируется и секретируется С-клетками щитовидной железы. Синтез РСТ и кальцитонина инициируется путем трансляции препрокальцитонина ("pre-РСТ"), являющегося прекурсорным пептидом, включающим 141 аминокислоту. Аминокислотная последовательность pre-РСТ была описана Moullec et al. в FEBS Letters, 167:93-97 в 1984. РСТ образуется после расщепления сигнального пептида (первые 24 аминокислот pre-РСТ).
Примеры последовательностей кДНК РСТ человека указаны в SEQ ID NO: 31-32.
Примеры аминокислотных последовательностей РСТ человека указаны в SEQ ID NO: 33-36.
SAA: кодирует член семейства А сывороточных амилоидных аполипопротеинов. Кодируемый белок представляет собой крупный белок острой фазы, который экспрессируется в большом количестве при реакции на воспаление и повреждение ткани. Данный белок также играет важную роль при метаболизме липопротеинов высокой плотности (HDL) и гомеостазе холестерина. Высокие уровни данного белка связаны с хроническими воспалительными заболеваниями, включая атеросклероз, ревматоидный артрит, болезнь Альцгеймера и болезнь Крона. Данный белок также может представлять собой потенциальный биомаркер определенных видов опухолей. Изменение сплайсинга приводит к получению множества транскриптных вариантов, которые кодируют тот же белок.
Примеры последовательностей кДНК SAA человека указаны в SEQ ID NO: 25-27.
Примеры аминокислотных последовательностей SAA человека указаны в SEQ ID NO: 28-30.
Следует отметить, что поскольку вариации ДНК от пациента к пациенту могут приводить к случаям однонуклеотидного полиморфизма (SNP), которые могут вызывать появление различий в аминокислотной последовательности белков, авторы настоящего изобретения также включили белки с аминокислотными последовательностями, которые являются, по меньшей мере, на 90%, 95% или 99% гомологичными относительно указанных здесь выше последовательностей.
Результаты измерения уровней полипептидов (например, TRAIL, IP-10 и CRP) обычно зависят от уровня белка, как описано ниже.
Способы детектирования экспрессии и/или активности белков
Уровень экспрессии и/или активности белков, экспрессируемых в клетках культур в рамках некоторых вариантов осуществления изобретения, может быть определен с применением способов, которые известны из уровня техники и обычно включают применение антител. Подобные способы могут быть отнесены к иммуноанализам. Иммуноанализы могут быть проведены в рамках нескольких этапов с добавлением реагентов и промыванием или отделением в различные моменты времени при проведении анализа. Многоэтапные анализы часто называют сепарационными иммуноанализами или гетерогенными иммуноанализами. Некоторые иммуноанализы могут быть проведены просто путем смешивания реагентов и образца и осуществления физического измерения. Подобные анализы называют гомогенными иммуноанализами или (менее часто) несепарационными иммуноанализами. При проведении иммуноанализов зачастую применяют калибратор. Калибраторы представляют собой растворы, которые содержат исследуемый аналит, при этом концентрация данного аналита в целом является известной. Сравнение реакции анализа на реальный образец против реакции анализа, полученной с применением калибраторов, делает возможной интерпретацию силы сигнала в плане присутствия или концентрации аналита в образце.
Антитело может являться моноклональным, поликлональным, химерным или их фрагментом, при этом этап детектирования продукта реакции может быть осуществлен с применением любого подходящего иммуноанализа.
Подходящие источники антител для детектирования полипеитидов включают коммерчески доступные источники, такие как, например, Abazyme, Abnova, AssayPro, Affinity Biologicals, AntibodyShop, Aviva bioscience, Biogenesis, Biosense Laboratories, Calbiochem, Cell Sciences, Chemicon International, Chemokine, Clontech, Cytolab, DAKO, Diagnostic BioSystems, eBioscience, Endocrine Technologies, Enzo Biochem, Eurogentec, Fusion Antibodies, Genesis Biotech, GloboZymes, Haematologic Technologies, Immunodetect, Immunodiagnostik, Immunometrics, Immunostar, Immunovision, Biogenex, Invitrogen, Jackson ImmunoResearch Laboratory, KMI Diagnostics, Koma Biotech, LabFrontier Life Science Institute, Lee Laboratories, Lifescreen, Maine Biotechnology Services, Mediclone, MicroPharm Ltd., ModiQuest, Molecular Innovations, Molecular Probes, Neoclone, Neuromics, New England Biolabs, Novocastra, Novus Biologicals, Oncogene Research Products, Orbigen, Oxford Biotechnology, Panvera, PerkinElmer Life Sciences, Pharmingen, Phoenix Pharmaceuticals, Pierce Chemical Company, Polymun Scientific, Polysiences, Inc., Promega Corporation, Proteogenix, Protos Immunoresearch, QED Biosciences, Inc., R&D Systems, Repligen, Research Diagnostics, Roboscreen, Santa Cruz Biotechnology, Seikagaku America, Serological Corporation, Serotec, SigmaAldrich, StemCell Technologies, Synaptic Systems GmbH, Technopharm, Terra Nova Biotechnology, TiterMax, Trillium Diagnostics, Upstate Biotechnology, US Biological, Vector Laboratories, Wako Pure Chemical Industries и Zeptometrix. Тем не менее, специалист в данной области может без излишних трудозатрат получить антитела против любого из описанных здесь полипептидов.
Поликлональные антитела для измерения полипептидов включают, без ограничения, антитела, которые были получены из сывороток путем активной иммунизации одного или нескольких их следующих животных: кролика, козы, овцы, курицы, утки, морской свинки, мыши, осла, верблюда, крысы и лошади.
Примеры дополнительных агентов для детектирования включают, без ограничения: scFv, dsFv, Fab, sVH, F(ab')2, циклические пептиды, гаптамеры, однодоменное антитело, Fab-фрагменты, одноцепочечные вариабельные фрагменты, молекулы аффител, аффилины, нанофитины, антикалины, авимеры, DARP-ины (DARPins), домены Кунитца, финомеры и монотело.
Иммуносорбентный анализ с ферментной меткой (ELISA): Проведение ELISA включает применение, по меньшей мере, одного антитела со специфичностью в отношении определенного антигена. Образец с неизвестным количеством антигена иммобилизуют на твердой подложке (обычно используют полистирольный микротитровальный планшет) либо неспецифичным образом (путем адсорбции на поверхности), либо специфичным образом (посредством захвата другим антителом, являющимся специфичным по отношению к тому же антигену, в рамках "сэндвич"-анализа ELISA). После иммобилизации антигена добавляют антитело для детектирования, образующее комплекс с антигеном. Антитело для детектирования может ковалентно связываться с ферментом или само может подвергаться детектированию вторичным антителом, которое связано с ферментом путем биоконъюгации. Между каждым этапом планшет, как правило, промывают мягким чистящим раствором для удаления любых белков или антител, подвергнутых аспецифическому связыванию. После последнего этапа промывания планшет подвергают дальнейшей обработке добавлением ферментативного субстрата для продуцирования визуально наблюдаемого сигнала, что свидетельствует о количестве антигена в образце.
Ферменты, которые обычно применяют в рамках данного способа, включают пероксидазу хрена и щелочную фосфатазу. При условии правильной калибровки и соблюдения линейного характера ответного сигнала количество субстрата, присутствующего в образце, является пропорциональным количеству продуцируемого цвета. Субстратный стандарт в целом применяют для повышения количественной точности.
Вестерн-блот: Данный способ включает отделение субстрата от другого белка с помощью акриламидного геля с последующим переносом субстрата на мембрану (например, из нейлона или поливинилиденфторида). Присутствие субстрата затем детектируют с помощью антител, являющихся специфичными по отношению к субстрату, которые, в свою очередь, детектируются с помощью антителосвязывающих реагентов. Антителосвязывающие реагенты могу представлять собой, например, белок А или другие антитела. Антителосвязывающие реагенты могут быть помечены радиоактивным изотопом или быть связанными с ферментной меткой, как описано выше. Детектирование может осуществляться с помощью радиоавтографии, колориметрической реакции или хемилюминесценции. Данный способ обеспечивает как возможность проведения количественного анализа количества субстрата, так и определение его идентичности на основе относительного положения на мембране, что свидетельствует о расстоянии миграции в акриламидном геле при проведении электрофореза.
Сортировка клеток с активированной флуоресценцией (FACS): Данный способ включает детектирование субстрата in situ в клетках с помощью антител, являющихся специфичными по отношению к субстрату. Являющиеся специфичными по отношению к субстрату антитела связаны с флюорофорами. Детектирование осуществляется с помощью машины для сортировки клеток, которая считывает длину волны света, излучаемого из каждой клетки, при ее прохождении через луч света. Данный способ может включать одновременное применение двух или большего количества антител.
Автоматизированный иммуноанализ: Автоматизированный анализатор, применяемый в рамках проведения иммуноанализа (зачастую называемого "Автоматизированным иммуноанализом"), представляет собой медицинский лабораторный инструмент, приспособленный для быстрого измерения уровней различных химических веществ и других характеристик в рамках ряда биологических образцов с минимальным участием человека. Данные измеряемые свойства крови и других жидкостей могут применяться при диагностировании заболевания. Были изобретены различные способы помещения образцов в анализатор. Это может включать помещение тестовых пробирок с образцом в стойки, которые могут двигаться вдоль трека, или вставку пробирок в круглые поворотные механизмы, которые вращаются для доставки образца. Некоторые анализаторы требуют переноса образцов в чашки для образцов. Однако стремление защитить здоровье и безопасность персонала лабораторий побудило многих производителей разработать анализаторы, которые обеспечивают возможность работы с закрытыми пробирками, что предотвращает непосредственное контактирование работников с образцами. Образцы могут обрабатываться по одиночке, сериями или непрерывно. Примеры автоматических машин для проведения иммуноанализа включают, без ограничения, ARCHITECT ci4100, ci8200 (2003), ci16200 (2007), ARCHITECT i1000SR, ARCHITECT i2000 i2000SR, i4000SR, AxSYM/AxSYM Plus, 1994 U.S., DS2, AIMS, AtheNA, DSX, ChemWell, клиническую систему UniCel DxI 860i Synchron Access, клиническую систему UniCel DxC 680i Synchron Access, системы для проведения иммуноанализа Access/Access 2, систему для проведения иммуноанализа UniCel DxI 600 Access, клиническую систему UniCel DxC 600i Synchron Access, систему для проведения иммуноанализа UniCel DxI 800 Access, клиническую систему UniCel DxC 880i Synchron Access, клиническую систему UniCel DxI 660i Synchron Access, SPA PLUS (Specialist Protein Analyzer), иммуноаналитический анализатор VIDAS, BioPlex 2200, PhD System EVOLIS PR 3100TSC Photometer, автоматизированное обрабатывающее устройство на основе ФИА (ферментативного иммуноанализа) MAGO 4S/2011 Mago Plus, LIAISON XL/2010 LIAISON, ETI-MAX 3000 Agility, Triturus, HYTEC 288 PLUSDSX, иммунодиагностическую систему VITROS ECi, иммунодиагностическую систему VITROS 3600, Phadia Laboratory System 100E, Phadia Laboratory System 250, Phadia Laboratory System 1000, Phadia Laboratory System 2500, Phadia Laboratory System 5000, cobas e 602/2010, cobas e411, cobas e601, MODULAR ANALYTICS El70, Elecsys 2010, Dimension EXL 200/2011, интегрированную химическую систему Dimension Xpand Plus, интегрированную химическую систему Dimension RxL Max/Max Suite; интегрированную химическую систему Dimension RxL, интегрированную химическую систему Dimension EXL с LM, диагностическую систему Stratus CS Acute Care, иммуноаналитическую систему IMMULITE 2000 XPi, иммуноаналитическую систему ADVIA Centaur CP, IMMULITE 2000, IMMULITE 1000, умную лабораторную систему Dimension Vista 500, умную лабораторную систему Dimension Vista 1500, ADVIA Centaur XP, AIA-900, AIA- 360, AIA-2000, AIA-600 II, AIA-1800. Измерения CRP, IP-10 и TRAIL также могут быть осуществлены на аппарате Luminex.
Латеральные проточные иммуноанализы (LFIA): Данные анализы представляют собой технологию, которая обеспечивает быстрое измерения аналитов в месте оказания медицинской помощи (РОС); лежащие в его основе принципы описаны ниже. В соответствии с одним вариантом осуществления LFIA применяют в контексте карманного устройства.
Технология основана на серии капиллярных русел, таких как фрагменты пористой бумаге или спеченный полимер. Каждый из данных элементов обладает способностью обеспечивать спонтанный транспорт жидкости (например, мочи). Первый элемент (подушечка для образца) действует в качестве губки и удерживает избыток жидкости образца. При впитывании жидкость поступает во второй элемент (конъюгационную подушечку), в которую производитель поместил так называемый конъюгат, представляющий собой биоактивные частицы в высушенном виде (см. ниже) в сахарно-солевом матриксе, который содержит все необходимое для обеспечения оптимизированной химической реакции между молекулой-мишенью (например, антигеном) и его химическим партнером (например, антителом), который был иммобилизован на поверхности частицы. При растворении сахарно-солевого матрикса жидкостью образца она также растворяет частицы, при этом в рамках одного объединенного транспортного действия образец и конъюгат смешиваются при протекании через пористую структуру. Таким образом обеспечивается связывание аналита с частицами при миграции далее через третье капиллярное русло. Данный материал имеет один или несколько участков (часто называемых полосками), где производителем была иммобилизована третья молекула. К тому времени, когда смесь образца и конъюгата достигает данных полосок, аналит связывается частицей, при этом третья "захватывающая" молекула связывает комплекс.
Спустя некоторое время, когда все большее количество жидкости проходит через полоски, частицы скапливаются, и участок полоски меняет цвет. Как правило, присутствуют, по крайней мере, две полоски: одна (контроль), которая захватывает любую частицу и, таким образом, показывает, что реакционные условия и технология сработали правильным образом, и вторая, которая содержит определенную захватывающую молекулу и захватывает только те частицы, на которых была иммобилизована молекула аналита. После прохождения данных реакционных зон жидкость достигает конечного пористого материала, представляющего собой тампон, который попросту действует в качестве контейнера для отходов. Латеральные проточные тесты могут осуществляться в виде конкурентных анализов или сэндвич-анализов.
Иммуногистохимические анализы: Иммуноанализы, выполненные в соответствии с некоторыми вариантами осуществления настоящего изобретения, могут представлять собой гомогенные анализы или гетерогенные анализы. В рамках гомогенного анализа иммунологическая реакция обычно включает определенное антитело (например, анти-TRAIL, анти-CRP и/или анти-IP-10 антитело), помеченный аналит и представляющий интерес образец. Сигнал, полученный благодаря метке, подвергается модификации, напрямую или косвенным образом, при связывании антитела с помеченным аналитом. Как иммунологическая реакция, так и детектирование ее степени может быть осуществлено в гомогенном растворе. Иммунохимические метки, которые могут применяться, включают свободные радикалы, радиоизотопы, флуоресцентные красители, ферменты, бактериофаги или коферменты.
В рамках подхода с применением гетерогенного анализа реагенты обычно представляют собой образец, антитело и средства для продуцирования детектируемого сигнала. Могут применяться описанные выше образцы. Антитело может быть иммобилизовано на подложке, такой как шарик (например, на агарозных шариках на основе белка А и белка G), пластинка или предметное стекло, и подвергнуто контакту с образцом, в отношении которого предполагается содержание антигена в жидкой фазе.
В соответствии с определенным вариантом осуществления изобретения антитело иммобилизуют на пористой полоске для образования участка детектирования. Участок для измерения или детектирования пористой полоски может включать множество участков: один для TRAIL, один для CRP и один для IP-10. Тестовая полоска также может содержать участки для отрицательных и/или положительных контролей.
Альтернативно, контрольные участки могут быть расположены на полоске, являющейся отличной от тестовой полоски. Необязательно, различные участки для детектирования могут содержать различные количества антител, например более высокое количество в первом участке для детектирования и более низкие количества в последующих участках. При добавлении тестового образца количество участков, отображающих детектируемый сигнал, обеспечивает количественную индикацию количества полипептидов, присутствующих в образце. Участки для детектирования могут быть сконфигурированы в любой подходящей детектируемой форме и обычно представлены в форме полоски или точек, расположенных по ширине тестовой полоски.
Затем подложку отделяют от жидкой фазы и анализируют либо основную фазу, либо жидкую фазу на наличие детектируемого сигнала с применением средств для продуцирования подобного сигнала. Сигнал связан с наличием аналита в образце. Средства для продуцируемого детектируемого сигнала включают применение радиоактивных меток, флуоресцентных меток или ферментных меток. Например, если подвергаемый детектированию антиген содержит второй участок связывания, то антитело, которое связывается с данным участком, может быть конъюгировано с детектируемой группой или добавлено в реакционный раствор жидкой фазы перед этапом отделения. Наличие детектируемой группы на твердой подложке указывает на наличие антигена в тестируемом образце. Примеры подходящих иммуноанализов представляют собой способы на основе применения олигонуклеотидов, иммуноблоттинга, иммунофлуоресцентные способы, иммунопреципитацию, хемилюминесцентные способы, электрохемилюминесценцию (ECL) или иммуноанализы с применением ферментной метки.
Специалистам в данной области знакомы многочисленные конкретные форматы иммуноанализов и их вариации, которые могут применяться для осуществления описанного здесь способа. См., в основном, Е. Maggio, Enzyme- Immunoassay, (1980) (CRC Press, Inc., Boca Raton, Fla.); также см. патент США 4727022 Skold et al. titled "Methods for Modulating Ligand-Receptor Interactions and their Application," патент США 4659678 Forrest et al. titled "Immunoassay of Antigens," патент США 4376110 David et al., озаглавленный "Immunometric Assays Using Monoclonal Antibodies," патент США 4275149 Litman et al., озаглавленный "Macromolecular Environment Control in Specific Receptor Assays," патент США 4233402 Maggio et al., озаглавленный "Reagents and Method Employing Channeling," и патент США 4,230,767 Boguslaski et al., озаглавленный "Heterogenous Specific Binding Assay Employing a Coenzyme as Label."
Антитела могут быть конъюгированы с твердой подложкой, подходящей для проведения диагностического анализа (например, с шариками, такими как агарозные шарики на основе бека А или белка G, микросферы, пластинки, предметные стекла или лунки, сделанные из таких материалов, как латекс или полистирол) в соответствии с хорошо известными способами, такими как нереакционное связывание. Описанные здесь антитела могут быть аналогичным образом сконъюгированы с детектируемыми метками или группами, такими как радиометки (например, 35S, 125I, 131I), ферментными метками (например, пероксидазой хрена, щелочной фосфатазой) и флуоресцентными метками (например, флуоресцеином, Alexa, зеленым флуоресцентным белком, родамином) в соответствии с хорошо известными способами.
Моноклональные антитела для измерения TRAIL включают, без ограничения: мышь, моноклональное (55 В709-3) IgG; мышь, моноклональное (2Е5) IgG1; мышь, моноклональное (2Е05) IgG1; мышь, моноклональное (М912292) IgG1 каппа; мышь, моноклональное (IIIF6) IgG2b; мышь, моноклональное (2Е1-1 В9) IgG1; мышь, моноклональное (RIK-2) IgG1, каппа; мышь, моноклональное М181 IgG1; мышь, моноклональное VI10E IgG2b; мышь, моноклональное МАВ375 IgG1; мышь, моноклональное МАВ687 IgG1; мышь, моноклональное HS501 IgG1; мышь, моноклональный клон 75411.11 IgG1 мыши; мышь, моноклональное Т8175-50 IgG; мышь, моноклональное 2В2.108 IgG1; мышь, моноклональное В-Т24 IgG1; мышь, моноклональное 55В709.3 IgG1; мышь, моноклональное D3 IgG1; коза, моноклональное С19 IgG; кролик, моноклональное Н257 IgG; мышь, моноклональное 500-М49 IgG; мышь, моноклональное 05-607 IgG; мышь, моноклональное В-Т24 IgG1; крыса, моноклональное (N2B2), IgG2a, каппа; мышь, моноклональное (1А7-2В7), IgG1; мышь, моноклональное (55В709.3), IgG и мышь, моноклональное B-S23* IgG1, TRAIL/TNFSF10 MAb человека (клон75411), IgG1 мыши, TRAIL/TNFSF10 MAb человека (клон 124723), IgG1 мыши, TRAIL/TNFSF10 MAb человека (Clone 75402), IgG1 мыши.
Антитела для измерения TRAIL включают моноклональные антитела и поликлональные антитела для измерения TRAIL. Антитела для измерения TRAIL включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: рекомбинантного TRAIL человека, полученного на основе клеточной линии миеломы мыши NSO (Thr95-Gly281, кат. номер Р50591); рекомбинантного TRAIL человека, полученного на основе клеточной линии миеломы мыши NSO (Thr95-Gly281, с N-терминальной метиониновой и 6-гистидиновой меткой, кат. номер Р50591), полученного на основе Е. coli (Vail 14-Gly281, с/без N-терминального метионина, кат. номер Q6IBA9); TRAIL, полученного на основе сыворотки человека; рекомбинантного TRAIL человека, где первая аминокислота расположена между положениями 85-151, а последняя аминокислота расположена в положении 249-281.
Примеры моноклональных антител для измерения CRP включают, без ограничения: мышь, моноклональное (108-2А2); мышь, моноклональное (108-7G41D2); мышь, моноклональное (12D-2C-36), IgG1; мышь, моноклональное (1G1), IgG1; мышь, моноклональное (5А9), IgG2a каппа; мышь, моноклональное (63F4), IgG1; мышь, моноклональное (67А1), IgG1; мышь, моноклональное (8В-5Е), IgG1; мышь, моноклональное (В893М), IgG2b, лямбда; мышь, моноклональное (CI), IgG2b; мышь, моноклональное (C11F2), IgG; мышь, моноклональное (С2), IgG1; мышь, моноклональное (С3), IgG1; мышь, моноклональное (С4), IgG1; мышь, моноклональное (С5), IgG2a; мышь, моноклональное (С6), IgG2a; мышь, моноклональное (С7), IgG1; мышь, моноклональное (CRP103), IgG2b; мышь, моноклональное (CRP11), IgG1; мышь, моноклональное (CRP135), IgG1; мышь, моноклональное (CRP169), IgG2a; мышь, моноклональное (CRP30), IgG1; мышь, моноклональное (CRP36), IgG2a; кролик, моноклональное (EPR283Y), IgG; мышь, моноклональное (КТ39), IgG2b; мышь, моноклональное (N-a), IgG1; мышь, моноклональное (N1G1), IgG1; моноклональное (Р5А9АТ); мышь, моноклональное (S5G1), IgG1; мышь, моноклональное (SB78c), IgG1; мышь, моноклональное (SB78d), IgG1 и кролик, моноклональное(Y284), IgG, С-реактивные белок человека/CRP Biot MAb (CI 232024), IgG2B мыши, С-реактивный белок человека/CRP MAb (клон 232007), IgG2B человека, относящийся к человеку/мыши/свинье С-реактивный белок/CRP MAb (С1 232026), IgG2A мыши.
Антитела для измерения CRP включают моноклональные антитела для измерения CRP и поликлональные антитела для измерения CRP.
Антитела для измерения CRP также включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: CRP, полученного на основе плазмы человека; CRP, полученного из сыворотки человека; полученного на основе линии клеток миеломы мыши NS0 С-реактивного белка человека/CRP (Phe17-Pro224, кат .номер Р02741).
Примеры моноклональных антител для измерения IP-10 включают, без ограничения: IP-10/CXCL10 моноклональное антитело мыши против человека (4D5) (LifeSpan Biosciences), IP-10/CXCL10 моноклональное антитело мыши против человека (А00163.01) (LifeSpan Biosciences), IP-10 мыши против человека (AbD Serotec), IP-10 кролика против человека (AbD Serotec), IP-10 mAb человека 6D4 (Hycult Biotech), клон моноклонального антитела мыши против человека IP-10 В-С50 (Diaclone), клон моноклонального антитела мыши против человека IP-10 В-С55 (Diaclone), CXCL10/IP-10 клон MAb человека 33036 (R&D Systems), CXCLIO/INPIO антитело 1E9 (Novus Biologicals), CXCL10/INP10 антитело 2C1 (Novus Biologicals), CXCL10/INP10 антитело 6D4 (Novus Biologicals), клон моноклонального антитела CXCL10 M01A 2C1 (Abnova Corporation), CXCL10 моноклональное антитело (M05), клон 1E9 (Abnova Corporation), моноклональное антитело CXCL10, клон 1 (Abnova Corporation), IP-10 антитело 6D4 (Abeam), IP-10 антитело EPR7849 (Abcam), IP-10 антитело EPR7850 (Abcam).
Антитела для измерения IP-10 включают моноклональные антитела для измерения IP-10 и поликлональные антитела для измерения IP-10.
Антитела для измерения IP-10 также включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: рекомбинантного CXCL10 человека/IP-10; негликозилированной полипептидной цепи, содержащей 77 аминокислот (аминокислоты 22-98) и индуцируемый N- терминальной гистидиновой меткой интерферон гамма белок 10 (длиной 125 аминокислот); рекомбинантного IP-10 человека с IP-10 гистидиновой меткой в Е. Coli, содержащем фрагмент длиной 77 аминокислот (22-98) и имеющего общую молекулярную массу 8,5 кДа с амино-терминальной гексагистидиновой меткой; полученным на основе Е. coli IP-10 человека (Val22-Pro98) с N-терминальным метионином; IP-10, полученного на основе плазмы человека; IP-10, полученного на основе сыворотки человека; рекомбинантного IP-10 человека, где первая аминокислота расположена между положениями 1-24, а последняя аминокислота расположена в положении 71-98.
Очевидно, что уровень экспрессии описанных здесь полипептидом может представлять собой абсолютный уровень экспрессии, нормализованный уровень экспрессии и/или относительный уровень экспрессии.
В рамках общего научного контекста нормализация представляет собой процесс, посредством которого необработанные данные измерений конвертируются в данные, которые могут быть подвергнуты непосредственному сравнению с другими данными, нормализованными подобным образом. В контексте настоящего изобретения измерение уровней экспрессии подвержено ошибкам, возникающим вследствие, например, неодинаковой деградации измеряемых образцов, различным загрузочным количествам в рамках одного анализа, а также другим различным ошибкам. Более конкретно, любой проанализированный образец может содержать большее или меньшее количество материала, чем это требуется, вследствие человеческой ошибки и проблем с оборудованием. Таким образом, одна и та же ошибка или отклонение присуще как полипептиду по изобретению, так и контролю, экспрессия которого в целом является постоянной. Таким образом, разделение необработанных значений экспрессии TRAIL, IP-10 или CRP на необработанное значение экспрессии контроля обеспечивает получение отношения, которое по существу является свободным от каких-либо технических ошибок или неточностей (за исключением крупных ошибок, которые приводят к невозможности тестирования образца) и образует нормализованное значение экспрессии полипептида. Поскольку значения экспрессии контролей являются равными для различных образцов, они составляют общее контрольное значение, которое является корректным для подобной нормализации.
В соответствии с определенным вариантом осуществления изобретения каждое из значений экспрессии полипептидов подвергается нормализации с применением одного и того же контроля.
Очевидно, что абсолютные значения экспрессии зависят от применения одного и того же протокола, поскольку каждый протокол как правило приводит к получению различных соотношений сигнал/шум и, соответственно, различных значений концентраций. Более конкретно, в то время как общий тренд величин показателей биомаркеров будет сохраняться вне зависимости от протокола (например, TRAIL повышается при вирусных инфекциях и снижается при бактериальных инфекциях), измерительная шкала является зависимой от протокола.
Подобные изменения в плане измеряемых концентраций белков среди различных протоколов могут быть компенсированы путем коррелирования результатов измерений с применением двух протоколов и вычисления трансформационной функции, как показано в Примере 5 ниже.
Как правило, анализируемые образцы представляют собой образцы крови, включающие цельную кровь, сыворотку, плазму, лейкоциты или клетки крови. Предпочтительно, образец представляет собой цельную кровь, сыворотку или плазму.
Следует отметить, что TRAIL и IP-10 и CRP подвергаются высокой экспрессии в других тканях и образцах, включая, без ограничения, CSF, слюну и эпителиальные клетки, аспират костного мозга, мочу, стул, бронхоальвеолярный лаваж, мокроту. Таким образом, некоторые варианты осуществления настоящего изобретения могут применяться для измерения TRAIL, CRP и IP-10 в таких тканях и образцах.
Предпочтительно, уровень полипептидов измеряют в течение примерно 24 часов после получения образца. Альтернативно, концентрацию полипептидов измеряют в образце, который хранился при температуре 12°С или ниже, когда хранение начинается менее чем через 24 часа после получения образца.
После проведения тестов для определения уровня полипептидов необязательно генерируют специфичный для конкретного субъекта набор данных, который содержит результаты измерений.
Специфичный для конкретного субъекта набор данных может храниться в машиночитаемом формате на энергонезависимом машиночитаемом носителе и необязательно и предпочтительно анализироваться аппаратным обрабатывающим устройством, таким как компьютер общего назначения или выделенное устройство.
Как было указано ранее, уровни полипептидов в крови тестируемых субъектов сравнивают с уровнями идентичных полипептидов во множестве образцов крови субъектов, если субъекты уже были верифицированы в качестве имеющих бактериальную инфекцию, вирусную инфекцию или небактериальное/невирусное заболевание на основе параметров, отличных от уровней данных полипептидов в крови. Данные по уровням полипептидов множества субъектов совместно с их верифицированным диагнозом могут храниться во втором наборе данных, также называемом здесь "групповым набором данных" или "преддиагностическим набором данных", как описано ниже.
Термин "небактериальное/невирусное заболевание" означает заболевание, которое не вызывается бактерией или вирусом. Он включает заболевания, такие как острый инфаркт миокарда, физическая травма, эпилептический приступ, воспалительные расстройства и так далее, грибковые заболевания, паразитарные заболевания и так далее.
Термин "вирусная инфекция" в соответствии с используемым здесь значением означает заболевание, которое вызывается вирусом и не включает бактериальный компонент.
Способы анализа набора данных, например в целях вычисления одной или нескольких функций вероятностной классификации, отражающих вероятность того, что конкретный субъект имеет бактериальную инфекцию, или вероятность того, что конкретный субъект имеет вирусную инфекцию, или вероятность того, что конкретный субъект имеет небактериальное невирусное заболевания, могут быть осуществлены как описано в Примере 1 ниже. Например, диагноз может быть поддержан с применением диагностических анализов на основе ПЦР, таких как (i) Seeplex® RV15 для детектирования вируса парагриппа 1, 2, 3 и 4, коронавируса 229E/NL63, аденовируса A/B/C/D/E, бокавируса 1/2/3/4, вируса гриппа А и В, метапневмовируса, коронавируса ОС43, риновируса А/В/С, респираторно-синцитиального вируса А и В, и энтеровируса, или (ii) Seeplex® РВ6 для детектирования Streptococcus pneumoniae, Haemophilus influenzae, Chlamydophila pneumoniae, Legionella pneumophila, Bordetella pertussis и Mycoplasma pneumoniae.
Культуры, выделенные из крови, мочи и стула, могут быть проанализированы на Shigella spp., Campylobacter spp.и Salmonella spp.; серологическое тестирование (IgM и/или IgG) может быть проведено для анализа на цитомегаловирус (CMV), вирус Эпштейна-Барра (EBV), Mycoplasma Pneumonia и Coxiella burnetii (коксиеллез).
Радиологические тесты (например, рентгенография грудной клетки для субъектов с подозрением на наличие инфекции нижних дыхательных путей [LRTI]) могут применяться для подтверждения инфекций грудной клетки.
Альтернативно или дополнительно, по меньшей мере, один опытный лечащий врач может быть использован для постановки диагноза.
Способы определения уровня экспрессии полипептидов у субъектов перед диагностикой были описаны выше.
Предпочтительно, тот же способ, который применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, применяется для определения уровня данных полипептидов у тестируемого субъекта. Таким образом, например, если способ иммуноаналитического типа применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, то для определения уровня данных полипептидов у тестируемого субъекта должен применяться способ иммуноаналитического типа.
Очевидно, что тип образца крови не обязательно должен являться идентичным у тестируемого субъекта и субъектов перед диагностикой. Авторам настоящего изобретения удалось показать, что уровни TRAIL в сыворотке и плазме являются очень схожими. Таким образом, например, если образец сыворотки применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, то для определения уровня данных полипептидов у тестируемого субъекта может применяться образец плазмы.
Групповой набор данных предпочтительно хранится в машиночитаемом формате на энергонезависимом машиночитаемом носителе и необязательно и предпочтительно анализируется аппаратным обрабатывающим устройством, таким как компьютер общего назначения или выделенное устройство. Оба набора данных могут храниться на одном носителе и необязательно и предпочтительно анализироваться одним аппаратным обрабатывающим устройством.
В специфичном по отношению к субъекту наборе данных каждая запись может быть необязательно и предпочтительно описана в виде кортежа (D, L), где D соответствует полипептиду в наборе данных, a L соответствует уровню полипептида D в крови. Таким образом, набор данных может представлять собой двумерный набор данных, в котором все элементы могут быть описаны вектором в двумерном пространстве, заполненном значениями названия полипептида и соответствующей величины реакции. В групповом наборе данных каждая запись может быть описана в виде кортежа (S, G, D, L), где S соответствует конкретному субъекту, G соответствует диагнозу субъекта S в групповом наборе данных, D соответствует полипептиду, a L соответствует уровню полипептида D в крови. Таким образом, приведенная в качестве примера иллюстрация представляет собой четырехмерный набор данных, в котором все элементы могут быть описаны вектором в четырехмерном пространстве, заполненном значениями имени субъекта, диагноза, полипептида и соответствующими величинами реакции. Некоторые варианты осуществления настоящего изобретения включают применение набора данных более высоких размерностей. Такие наборы данных описаны далее.
Групповой набор данных может также необязательно и предпочтительно включать один или несколько, более предпочтительно все, записи специфичного по отношению к субъекту набора данных. В вариантах осуществления, в которых групповой набор данных включает все записи специфичного по отношению к субъекту набора данных, не является обязательным применение двух отдельных наборов данных, поскольку весь набор данных содержится в одном общем наборе данных. Однако подобный общий набор данных необязательно и предпочтительно снабжен аннотациями, обеспечивающими возможность различения части общего набора данных, который связан с подвергаемым анализу субъектом, и части общего набора данных, которая связана только с другими субъектами. В контексте настоящего описания часть общего набора данных, которая связана с подвергаемым анализу субъектом, называется специфичным по отношению к субъекту набором данных, даже если она не представлена в виде отдельного набора данных. Аналогичным образом, часть общего набора данных, которая связана только с другими субъектами, называется групповым набором данных, даже если она не представлена в виде отдельного набора данных.
Групповой набор данных предпочтительно включает значения уровней полипептидов у многих субъектов (например, по меньшей мере, 10 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 10 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 10 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание; или, по меньшей мере, 20 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 20 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 20 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание; или, по меньшей мере, 50 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 50 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 50 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание).
Специфичный по отношению к группе набор данных может включать дополнительные данные, которые описывают субъектов. Наборы данных, которые включают дополнительные данные, могут обеспечивать преимущество, поскольку они обеспечивают дополнительную информацию в плане аналогий между подвергаемым анализу субъектом и другим субъектом, тем самым повышая точность прогнозирования.
Соответствующие примеры типов данных, отличных от уровня полипептидов, включают, без ограничения, традиционные лабораторные факторы риска и/или клинические параметры, как описано выше.
Настоящие варианты осуществления изобретения включают специфические по отношению к субъекту и группе наборы данных, которые включают дополнительные данные помимо уровней полипептидов и величин реакций. В некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, три измерения, при этом в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, четыре измерения, в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, пять измерений, и в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет более пяти измерений.
Дополнительные измерения наборов данных обеспечивают дополнительную информацию, относящуюся к подвергаемому анализу субъекту, другим субъектам и/или уровням полипептидов, отличных от TRAIL, CRP и IP-10.
В некоторых вариантах осуществления настоящего изобретения дополнительная информация относится, по меньшей мере, к одному из традиционных лабораторных факторов риска, клиническим параметрам, биохимическим показателям крови и/или генетическому профилю.
Термин "традиционные лабораторные факторы риска" охватывает биомаркеры, выделенные или полученные из образцов субъекта, которые в настоящее время анализируются в клинической лаборатории и применяются в рамках традиционных глобальных алгоритмах оценки риска, таких как абсолютное количество нейтрофилов (обозначается как ANC), абсолютное количество лимфоцитов (обозначается как ALC), количество белых кровяных клеток (обозначается как WBC), % нейтрофилов (определен как доля белых кровяных клеток, представляющих собой нейтрофилы; обозначается как Neu (%)), % лимфоцитов (определен как доля белых кровяных клеток, представляющих собой лимфоциты; обозначается как Lym (%)), % моноцитов (определен как доля белых кровяных клеток, представляющих собой моноциты; обозначается как Mon (%)), натрий (обозначается как Na), калий (обозначается как K), билирубин (обозначается как Bili).
Предпочтительно, по меньшей мере, один из традиционных лабораторных факторов риска подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных, при этом, по меньшей мере, один из традиционных лабораторных факторов риска одного или нескольких (более предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает, по меньшей мере, один из традиционных факторов риска, то факторы риска могут быть включены в виде отдельной записи. Если групповой набор данных включает факторы риска, то факторы риска необязательно и предпочтительно включены для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {R}), где S, G, D и L были введены ранее, a {R} представляет собой, по меньшей мере, один фактор риска субъекта S.
Термин "клинические параметры" охватывает все не относящиеся к образцам или аналитам биомаркеры состояния здоровья субъекта или иные характеристики, такие как, без ограничения, возраст (Age), раса (RACE), пол (Sex), температура тела (обозначается как "temperature"), максимальная температура тела с момента первоначального проявления симптомов (обозначается как "maximal temperature"), время с первоначального проявления симптомов (обозначается как "time from symptoms"), беременность или семейная история (обозначается как "FamHX").
Предпочтительно, по меньшей мере, один из клинических параметром подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных и, по меньшей мере, один из клинических параметров одного или нескольких (предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает, по меньшей мере, один из клинических параметров, то клинические параметры могут быть включены в виде отдельной записи. Если групповой набор данных включает клинические параметры, то клинические параметры необязательно и предпочтительно включены в расчете на отдельного субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {С}), где S, G, D и L были введены ранее, а {С} представляет собой клинический параметр субъекта S.
В соответствии с используемым здесь значением, термин "биохимические показатели крови" означает концентрацию или концентрации любого и всех веществ, растворенных или содержащихся в крови. Соответствующие примеры таких веществ включают, без ограничения, альбумин, амилазу, щелочную фосфатазу, бикарбонат, общий билирубин, BUN (азот в составе мочевины в крови), С-реактивный белок, кальций, хлорид, LDL (липопротеины низкой плотности), HDL (липопротеины высокой плотности), общий холестерин, креатинин, СРК (креатинкиназу), γ-GT (гамма-глютаминтаурин), глюкозу, LDH (лактатдегидрогеназу), неорганический фосфор, липазу, калий, общий белок, AST (аспартатаминотрансферазу), ALT (аланинаминотрансферазу), натрий, триглицериды, мочевую кислоту и VLDL (липопротеины очень низкой плотности).
В соответствии с одним вариантом осуществления, биохимические показатели крови подвергаемого анализу субъекта включены в специфичный по отношению к субъекту набор данных, при этом биохимические показатели крови одного или нескольких (более предпочтительно - всех) других субъектов включены в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает биохимические показатели крови, то биохимические показатели крови могут быть включены в виде отдельной записи. Если групповой набор данных включает биохимические показатели крови, то биохимические показатели крови необязательно и предпочтительно включены для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {С}), где S, G, D и L были введены ранее, а {С} представляет собой биохимические показатели крови субъекта S.
В некоторых вариантах осуществления настоящего изобретения дополнительная информация относится к генетическому профилю субъекта.
В соответствии с используемым здесь значением, термин "генетический профиль" означает анализ ряда различных генов. Генетический профиль может включать гены из всего генома субъекта или может включать отдельное подмножество генов. Генетический профиль может включать геномный профиль, протеомный профиль, эпигеномный профиль и/или транскриптомный профиль.
Предпочтительно, генетический профиль подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных, при этом генетический профиль одного или нескольких (более предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает генетический профиль, то генетический профиль может быть включен в виде отдельной записи. Если групповой набор данных включает генетический профиль, то генетический профиль необязательно и предпочтительно включен для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {Р}), где S, G, D и L были введены ранее, а {Р} представляет собой генетический профиль субъекта S.
Способ необязательно и предпочтительно продолжается до этапа хранения значений уровней полипептида, по меньшей мере, временно, на энергонезависимом машиночитаемом носителе, из которого он может быть извлечен или отображен необходимым образом.
После анализа двух наборов данных способ продолжается до фазы анализа в целях определения диагноза тестируемого субъекта.
Анализ осуществляется с целью вычисления одной или нескольких функций вероятностной классификации f(δ01), g(δ01), h(δ01), отражающих вероятности того, что конкретный субъект имеет бактериальную инфекцию, вирусную инфекцию или невирусное небактериальное заболевание, соответственно. Как правило, f, g и h удовлетворяют условию f(δ01)+g(δ01)+h(δ01)=1. Каждая функция классификационная функция представляет собой функцию первой координаты δ0 и второй координаты δ1, при этом каждая из координат δ0 и δ1 определена различной комбинацией значений экспрессии, как описано выше.
Анализ может осуществляться более чем одним способом.
В соответствии с одним вариантом осуществления в рамках анализа применяется двоичный или, более предпочтительно, троичный классификатор для вычисления одного или нескольких функций вероятностной классификации.
Предпочтительно, в рамках анализа осуществляется сложение вероятности вирусного и невирусного небактериального заболевания с целью присвоения значения вероятности небактериальной инфекции. В другом предпочтительном варианте осуществления в рамках анализа осуществляется сложение вирусной и бактериальной инфекции с целью присвоения значения вероятности инфекционному заболеванию. В другом предпочтительном варианте осуществления в рамках анализа игнорируется вероятность невирусного небактериального заболевания и осуществляется непосредственное сравнение вероятностей бактериального и вирусного заболевания. Примеры интерпретационных функций, являющихся подходящими для анализа наборов данных в соответствии с некоторыми вариантами осуществления настоящего изобретения, приведены ниже.
Анализ наборов данных в соответствии с некоторыми вариантами осуществления настоящего изобретения включает выполнение процедуры машинного обучения.
В соответствии с используемым здесь значением, термин "машинное обучение" означает процедуру, реализованную в виде компьютерной программы, сконфигурированной для индуцирования паттернов, регулирующих условий или правил на основе ранее собранных данных для разработки подходящей реакции на будущие данные или описания данных в определенном осмысленном виде.
Применение машинного обучения является особенно, но не исключительно, полезным, если набор данных включает многомерные записи.
Групповые и специфичные по отношению к отдельным субъектам наборы данных могут применяться в качестве тренировочного набора, на основе которого процедура машинного обучения может извлекать параметры, которые описывают набор данных наилучшим образом. После извлечения параметров они могут применяться для прогнозирования типа инфекции.
При машинном обучении информация может быть получена путем обучения с учителем или обучения без учителя. В некоторых вариантах осуществления изобретения процедура машинного обучения включает или состоит из процедуры обучения с учителем. При обучении с учителем применяются функции достижения глобальных или локальных целей для оптимизации структуры обучающейся системы. Другими словами, при обучении с учителем существует желаемая реакция, которая применяется системой для направления процесса обучения.
В некоторых вариантах осуществления изобретения процедура машинного обучения включает или состоит из процедуры обучения без учителя. При обучении без учителя целевые функции обычно отсутствуют. В частности, система обучения не включает набора правил. Одна форма обучения без учителя в соответствии с некоторыми вариантами осуществления настоящего изобретения представляет собой кластеризацию без учителя, при которой объекты данных не помечаются как относящиеся к определенным классам a priori.
Соответствующие примеры процедур "машинного обучения" являющихся подходящими для настоящих вариантов осуществления изобретения включают, без ограничения, кластеризацию, алгоритмы на основе правил ассоциирования, алгоритмы анализа признаков, алгоритмы выбора подмножеств, методы опорных векторов, классификационные правила, обучение с неодинаковыми издержками неправильной классификации, избирательные алгоритмы, объединительные алгоритмы, байесовские сети, деревья решений, нейронные сети, алгоритмы обучения на основе множественных способов, вероятностные модели, графические модели, способы на основе логистической регрессии (включая способы на основе полиномиальной логистической регрессии), способы на основе градиентного подъема, способы на основе разложения по сингулярным числам матрицы и метод главных компонент. Среди моделей нейронных сетей самоорганизующаяся карта и теория адаптивного резонанса являются наиболее часто используемыми алгоритмами обучения без учителя. Модель на основе теории адаптивного резонанса обеспечивает вариативность ряда кластеров в зависимости от величины задачи и позволяет пользователю контролировать степень сходства между членами одних и тех же кластеров с помощью определяемой пользователем константы, называемой параметром бдительности.
Далее следует обзор некоторых процедур машинного обучения, подходящих для настоящих вариантов осуществления изобретения.
Алгоритм ассоциативного правила представляет собой способ выделения значимых ассоциативных паттернов среди признаков.
Термин "ассоциация" в контексте машинного обучения означает любую взаимосвязь между признаками, а не только те из них, которые позволяют прогнозировать конкретный класс или числовое значение. Ассоциация включает, без ограничения, определение ассоциативных правил, определение паттернов, осуществление анализа признаков, осуществление отбора подмножества признаков, разработку прогностических моделей и понимание взаимодействий между признаками.
Термин "ассоциативные правила" означает элементы, которые часто совместно встречаются в наборах данных. Он включает, без ограничения, ассоциативные паттерны, дифференциальные паттерны, частотные паттерны, закрытые паттерны и колоссальные паттерны.
Обычным первичным этапом алгоритма ассоциативных правил является определение набора элементов или признаков, которые являются наиболее часто встречающимися среди всех наблюдений. После получения перечня на их основе могут быть получены правила.
Вышеуказанная самоорганизующаяся карта представляет собой способ обучения без учителя, который часто применяется для визуализации и анализа данных высокой размерности. Традиционные виды применения связаны с визуализацией центральных зависимостей в рамках данных на карте. Карта генерируется алгоритмом, который может применяться для ускорения идентификации ассоциативных правил с применением других алгоритмов. Данный алгоритм обычно включает сеть из обрабатывающих элементов, называемых "нейронами". Каждый нейрон ассоциирован с характеристическим вектором, называемым наблюдением. Карта пытается отразить все доступные наблюдения с оптимальной точностью с применением ограничивающего набора моделей. В то же время модели становятся упорядоченными в рамках сети, таким образом что похожие модели расположены ближе друг к другу, а непохожие модели расположены далеко друг от друга. Данная процедура обеспечивает идентификацию, а также визуализацию зависимостей или ассоциаций между признаками в рамках данных.
Алгоритмы анализа признаков направлены на ранжирование признаков или ранжирование с последующим отбором признаков на основе их влияния.
Термин "признак" в контексте машинного обучения означает одну или несколько необработанных входных переменных, одну или несколько обработанных переменных, или одну или несколько математических комбинаций других переменных, включая необработанные переменные и обработанные переменные. Признаки могут являться непрерывными или дискретными.
Прирост информации представляет собой один из способов машинного обучения, подходящий для анализа признаков. Определение прироста информации требует определения энтропии, которая представляет собой степень неоднородности в наборе элементов для тренировки. Снижение энтропии целевого признака, которое осуществляется благодаря знанию значений определенного признака, называют приростом информации. Прирост информации может применяться в качестве параметра для определения эффективности признака при определении типа инфекции. Симметрическая неопределенность представляет собой алгоритм, который может применяться в рамках алгоритма отбора признаков в соответствии с некоторыми вариантами осуществления настоящего изобретения. Симметрическая неопределенность компенсирует предвзятость вследствие прироста информации в пользу признаков с
Figure 00000001
количеством значений путем нормализации признаков в рамках диапазона [0, 1].
Алгоритмы отбора подмножеств основаны на комбинации алгоритма анализа и алгоритма поиска. Аналогично алгоритмам анализа признаком алгоритмы отбора подмножеств включают ранжирование подмножеств признаков. Однако в отличие от алгоритмов анализа признаков алгоритм отбора подмножеств, подходящий для настоящих вариантов осуществления изобретения, нацелен на отбор подмножества признаков с наиболее сильным влиянием на тип инфекции одновременно с учетом степени статистической неопределенности между признаками, включенными в подмножество. Преимущества, связанные с отбором подмножества признаков, включают обеспечение визуализации данных и понимание, снижение требований к условиям измерения и хранения, снижение продолжительности тренировки и применения, и устранение отвлекающих признаков для улучшения классификации.
Двумя основными подходами к алгоритмам отбора подмножеств являются процесс добавления признаков к рабочему подмножеству (прямой отбор) и удаление признаков из текущего подмножества (обратное удаление). В машинном обучении прямой отбор осуществляется иным образом, чем статистическая процедура с тем же названием. В рамках машинного обучения добавляемый в текущее подмножество признак определяется путем анализа эффективности текущего подмножества, дополненного одним новым признаком, с применением перекрестной проверки. При прямом отборе подмножества формируются путем добавления каждого оставшегося признака в текущее подмножество при анализе ожидаемой эффективности каждого нового подмножества с применением перекрестной проверки. Приводящий к достижению наилучшей эффективности при добавлении к текущему подмножеству признак сохраняется и процесс продолжается. Поиск останавливается, когда ни один из оставшихся доступных признаков не улучшает прогностическую способность текущего подмножества. Данный процесс обеспечивает нахождение набора признаков локального оптимума.
Обратное удаление реализуется аналогичным образом. При обратном удалении поиск останавливается, когда дальнейшее удаление признаков из набора не повышает прогностическую способность подмножества. Настоящие варианты осуществления изобретения охватывают алгоритмы поиска, при которых осуществляется прямой поиск, обратный поиск или поиск в обоих направлениях. Соответствующие примеры алгоритмов поиска, которые могут применяться в рамках настоящих вариантов осуществления изобретения, включают, без ограничения, полный перебор, жадный алгоритм поиска с восхождением к вершине, случайные возмущения подмножеств, оберточные алгоритмы выбора признаков, поиск на основе гонки вероятностей, поиск на основе схем, поиск на основе гонки рангов и байесовский классификатор.
Дерево решений представляет собой алгоритм поддержки решений, который образует логическую последовательность этапов, связанных с анализом входных данных для принятия решения.
Термин "дерево решений" означает любой тип алгоритмов обучения на основе деревьев, включая, без ограничения, деревья в качестве моделей, классификационные деревья и деревья регрессии.
Дерево решений может применяться для классификации наборов данных или их связей иерархическим образом. Дерево решений имеет структуру дерева, которое включает узлы-"ветви" и узлы-"листья". Каждый узел-"ветвь" определяет атрибут (сплит-атрибут) и тест (сплит-тест) для осуществления в отношении значения сплит-атрибута и связан с другими узлами для всех возможных конечных результатов сплит-теста. Узел-ветвь, который представляет собой корень дерева решений, называют корневым узлом. Каждый узел-"лист" может соответствовать классификации (например, тому, является ли конкретная часть группового набора данных совпадающей с конкретной частью специфичного по отношению к субъекту набора данных) или значению. Узлы-"листья" также могут содержать дополнительную информацию о соответствующей классификации, такую как доверительный балл, который соответствует доверительности соответствующей классификации (например, вероятности того, что классификация является точной). Например, доверительный балл может представлять собой непрерывное значение от 0 до 1, при этом равный 0 балл указывает на очень малую доверительность (например, индикативное значение соответствующей классификации является очень низким), а равный 1 балл указывает на очень высокую доверительность (например, соответствующая классификация является практически наверняка точной).
Методы опорных векторов представляют собой алгоритмы, которые основаны на теории статистического обучения. Метод опорных векторов (SVM) в соответствии с некоторыми вариантами осуществления настоящего изобретения могут применяться для классификационных целей и/или для численного прогнозирования. Метод опорных векторов для классификации называют здесь "классификатором на основе метода опорных векторов", а метод опорных векторов для численного прогнозирования называют здесь "регрессией на основе метода опорных векторов".
SVM обычно характеризуется ядерной функцией, выбор которой определяет, будет ли полученный SVM обеспечивать классификацию, регрессию и другие функции. В рамках применения ядерной функции SVM обеспечивает маппинг входных векторов в высокоразмерное пространство признаков, в котором может быть сконструирована гиперповерхность для принятия решений (также известная как разделитель) для обеспечения классификации, регрессии или других связанных с принятием решений функций. В самом простом случае поверхность представляет собой гиперплоскость (также известную как линейный разделитель), однако более комплексные разделители также включены в объем изобретения и могут применяться с использованием ядерных функций. Точки данных, которые определяют гиперповерхность, называют опорными векторами.
Классификатор на основе метода опорных векторов обеспечивает выбор разделителя в участке, где расстояние до разделителя от наиболее близких точек данных является максимально большим, таким образом отделяя точки векторов признаков, связанные с объектами внутри рамках класса, от точек векторов признаков, связанных с объектами вне класса. Для реализации регрессии на основе метода опорных векторов конструируют трубку высокой размерности с радиусом, соответствующим величине приемлемой ошибки, которая минимизирует ошибку в наборе данных с одновременной максимизацией плоскостности связанной кривой или функции. Другими словами, трубка представляет собой "обертку" вокруг аппроксимированной кривой, образованной набором точек данных, являющихся ближайшими к данной кривой или поверхности.
Преимущество метода опорных векторов заключается в том, что после идентификации опорных векторов остальные наблюдения могут быть устранены из вычислений, что значительно снижает степень вычислительной сложности проблемы. SVM обычно включает две фазы: фазы тренировки и фазы тестирования. В рамках фазы тренировки генерируют набор опорных векторов для применения при реализации правила принятия решений. В рамках фазы тестирования осуществляется принятие решений с применением правила принятия решений. Алгоритм на основе опорных вектором представляет собой способ тренировки SVM. Путем реализации алгоритма генерируется тренировочный набор параметров, включая опорные векторы, которые характеризуют SVM. Соответствующий пример алгоритма опорных векторов, подходящих для настоящих вариантов осуществления изобретения включает, без ограничения, последовательную минимальную оптимизацию.
Способы на основе регрессии, которые могут применяться в соответствии с настоящим изобретением, включают, без ограничения, линейную регрессию, множественную регрессию, логистическую регрессию, регрессию на основе пробитое, порядковую логистическую регрессию, порядковую регрессию на основе пробитое, пуассоновскую регрессию, отрицательную биномиальную регрессию, полиномиальную логистическую регрессию (MLR) и усеченную регрессию.
Логистическая регрессия или логит-регрессия представляет собой тип регрессионного анализа, применяемый для прогнозирования конечной величины зависимой распределенной по категориям переменной (зависимой переменной, которая может иметь ограниченное количество значений, чьи величины не являются значимыми, но чей порядок величин может являться или не являться значимым) на основе одной или нескольких прогностических переменных. Логистические регрессии также включают полиномиальный вариант.Модель на основе полиномиальной логистической регрессии представляет собой модель на основе регрессии, которая обобщает логистическую регрессию путем обеспечения возможности наличия более чем двух дискретных конечных значений. Таким образом, она представляет собой модель, которая применяется для прогнозирования вероятностей различных возможных конечных значений распределенной по категориям зависимой переменной с учетом набора независимых переменных (которые могут иметь реальные значения, бинарные значения, соответствующие категориям значения и так далее).
Преимущество логистической регрессии заключается в том, что она обеспечивает определение интерпретируемой величины степени прогностической доверительности - вероятности. Например, пациенты, у которых прогнозируется наличие бактериальной инфекции с вероятностью 75% и 99%, будут отнесены к имеющим бактериальную инфекции при применении интерпретационной функции на основе SVM, однако факт того, что последние из них имеют более высокую вероятность ее наличия, будет скрыт.Определение уровня вероятности степени доверительности добавляет ценную клиническую информацию, которая может повлиять на вынесение клинических решений.
Важно, что вычисление вероятности типа инфекции для каждого пациента позволяет рационально исключать пациентов, для которых система знает о своей неспособности осуществлять классификацию с высокой уверенностью. Это продемонстрировано здесь на Фиг. 5. Таким образом, продукт позволяет определять, например, 40% вероятность бактериальной инфекции (40 из 100 пациентов со значением балла "40%" будут иметь бактериальную инфекцию).
Дополнительно, благодаря применению пороговых значений в отношении баллов вероятности, является возможным осуществлять недвоичную классификацию тестируемого субъекта. Например, у тестируемого субъекта с вероятностью бактериальной инфекции ниже 30% может быть определена низкая вероятность бактериальной инфекции; от 30% до 70% - средняя вероятность бактериальной инфекции, а свыше 70% - высокая вероятность бактериальных инфекций. Могут применяться и другие пороговые значения.
Алгоритм LASSO (способ оценки параметров линейной модели с возможностью уменьшения размерности) представляет собой алгоритм для уменьшения размерности и/или отбора для линейной регрессии. Алгоритм LASSO может обеспечивать минимизирование обычной суммы квадратичных ошибок с регуляризацией, которая может представлять собой L1-регуляризацию (ограничение суммы абсолютных значений коэффициентов), L2-регуляризацию (ограничение суммы квадратов коэффициентов) и им подобные. Алгоритм LASSO может быть связан с мягкой пороговой классификацией вейвлет коэффициентов, прямой пошаговой регрессией и способами бустинга. Алгоритм LASSO описан в публикации Tibshirani, R, Regression Shrinkage and Selection via the Lasso, J. Royal. Statist. Soc В., т.58, №. 1, 1996, стр. 267-288, содержание которой приведено здесь для ссылки.
Байесовская сеть представляет собой модель, которая соответствует переменным и условным взаимозависимостям между переменными. В байесовской сети переменные представлены в виде узлов, при этом узлы могут быть соединены друг с другом с помощью одного или нескольких соединений. Соединение указывает на связь между двумя узлами. Узлы обычно имеют соответствующие таблицы условных вероятностей, которые применяются для определения вероятности состояния узла с учетом состояния других узлов, с которыми соединен данный узел. В некоторых вариантах осуществления изобретения применяется алгоритм на основе оптимального байесовского классификатора для использования максимальной апостериорной гипотезы в отношении новой записи для прогнозирования вероятности ее классификации, а также для вычисления вероятностей на основе всех остальных гипотез, полученных на основе тренировочного набора, и для применения данных вероятностей в качестве весовых факторов для будущих предсказаний типа инфекции. Алгоритм, являющийся подходящим для поиска наилучшей байесовской сети, включает, без ограничения, алгоритм на основе метрики общего балла. В рамках альтернативного подхода к формированию сети может применяться марковское покрытие. Марковское покрытие заключается в изолировании узла от влияния любого узла вне его границы, которая состоит из элементов-родителей узла, его элементов-детей и элементов-родителей его элементов-детей.
Алгоритмы на основе экземпляров позволяют генерировать новую модель для каждого экземпляра вместо осуществления прогнозирования на основе деревьев или сетей, полученных (ранее) на основе тренировочного набора.
Термин "экземпляр" в контексте машинного обучения означает пример из набора данных.
Алгоритмы на основе экземпляров обычно включают хранение всего набора данных в памяти и построение модели на основе набора записей, сходных тем, которые подвергаются тестированию. Данное сходство может быть проанализировано, например, с помощью методов ближайшего соседа или локально взвешенных регрессий, например с применением евклидовых расстояний. После выбора набора записей конечная модель может быть построена с применением нескольких различных алгоритмов, таких как наивные байесовские классификаторы.
Настоящее изобретение также может применяться для скрининга подгрупп пациентов или субъектов в плане любых условий. Например, в рамках здравоохранительной организации, медицинского учреждения или школьной здравоохранительной программы может осуществляться скрининг группы субъектов для идентификации тех из них, которым требуются вмешательства, как описано здесь, или для сбора эпидемиологических данных. Страховые компании (например, предлагающие страхование здоровья, жизни или инвалидности) могут подвергать клиентов скрининга в рамках процесса определения покрываемых страховых случаев или стоимости или существующих клиентов для возможного вмешательства. Данные, собранные в рамках подобных анализов групп субъектов, особенно совместно с любым клиническим прогрессированием таких состояний, как инфекция, будут являться ценными в плане работы, например, здравоохранительных организаций, общественных здравоохранительных программ или страховых компаний. Подобные наборы данных или коллекции могут храниться на машиночитаемых носителях и применяться в рамках любых систем для управления связанными с состоянием здоровья данными для предоставления улучшенных медицинских услуг, оптимизации стоимости медицинских услуг, улучшения условий страхования и так далее. См., например, См., например, заявку на патент США 2002/0038227; заявку на патент США 2004/0122296; заявку на патент США 2004/ 0122297; и патент США 5018067. Подобные системы могут иметь доступ к данным непосредственно из внутреннего хранилища данных или удаленно из одного или нескольких мест для хранения данных, как описано ниже.
Машиночитаемый носитель для хранения данных может включать связанный с хранением данных материал, кодируемый машиночитаемыми данными или массивами данных, который при применении устройства, запрограммированного с применением инструкций для использования указанных данных, может применяться для ряда целей. Измерения эффективных количеств биомаркеров по изобретению и/или анализ риска, обусловленного данными биомаркерами, может быть реализован в рамках компьютерных программ, выполняемых на программируемых компьютерах, включающих, помимо прочего, процессор, систему хранения данных (включая энергозависимую и энергонезависимую память и/или элементы для хранения данных), по меньшей мере, одно устройство для ввода и, по меньшей мере, одно устройство для вывода.
Программный код может применяться для ввода данных для реализации описанных выше функций и генерации выходной информации. Выходная информация может подаваться на одно или несколько устройств вывода в соответствии со способами, которые известны из уровня техники. Компьютер может представлять собой, например, персональный компьютер, микрокомпьютер или рабочую станцию стандартного вида.
Каждая программа может быть реализована на высокоуровневом процедурном или объектно-ориентированном языке программирования для взаимодействия с компьютерной системой. Тем не менее, программы могут быть реализованы на ассемблере или машинном языке, если это требуется. Язык может представлять собой компилируемый или интерпретируемый язык. Каждая подобная компьютерная программа может храниться на носителях данных или устройстве (например, в ROM или на магнитной дискете или других носителях, как описано в других частях данного описания), читаемом программируемым компьютером общего или специального назначения для конфигурирования и работы компьютера при чтении носителей данных или устройства компьютером для реализации описанных здесь процедур.
Система управления связанными с состоянием здоровья данными по изобретению также может рассматриваться в качестве реализованной в виде машиночитаемого носителя данных, сконфигурированного с применением компьютерной программы, при этом носитель данных, сконфигурированный подобным образом, заставляет компьютер работать специальным и предварительно определенным образом для реализации различных описанных здесь функций.
Записываемые выходные данные могут включать результаты анализов, выводы, диагнозы, прогнозы и/или рекомендации по лечению. Они могут передаваться, например, техническим специалистам, лечащим врачам и/или пациентам. В определенных вариантах осуществления компьютеры будут применяться для передачи подобной информации заинтересованным сторонам, таким как пациенты и/или лечащие врачи. Терапия, вводимая субъекту, может быть модифицирована на основе выходных данных.
В одном варианте осуществления выходные данные представлены в графическом виде. В другом варианте осуществления выходные данные представлены в числовом виде (например, в виде вероятности). В другом варианте осуществления выходные данные генерируются с применением значения цвета (например, в рамках дисплея со шкалой), при этом один цвет указывает на наличие бактериальной инфекции, а другой цвет - на наличие небактериальной инфекции. Интенсивность цвета коррелирует с вероятностью наличия бактериальной инфекции/отсутствия инфекции. Подобный графический дисплей представлен на Фиг. 29А-F.
В некоторых вариантах осуществления выходные данные передаются субъекту как можно скорее после завершения анализа и генерирования диагноза и/или прогноза. Результаты и/или связанная информация могут быть переданы субъекту лечащим врачом субъекта. Альтернативно, результаты могут быть переданы непосредственно тестируемому субъекту с помощью коммуникационных средств, включая письменные, например путем предоставления письменного отчета, электронных форм коммуникаций, таких как электронная почта, и с помощью телефона. Передача может осуществляться путем применения компьютера, например в случае передачи по электронной почте. В определенных вариантах осуществления коммуникация, содержащая результаты диагностического теста и/или заключения на их основе и/или рекомендации по лечению, основанные на тесте, могут быть сгенерированы и доставлены автоматически субъекту с применением комбинации компьютерного аппаратного обеспечения и программного обеспечения, которое знакома специалистам в области телекоммуникаций. Один пример коммуникационной системы для применения в области здравоохранения описан в патенте США 6283761; тем не менее, настоящее изобретение не ограничивается способами, в рамках которых применяется данная конкретная коммуникационная система. В определенных вариантах осуществления способов изобретения все или некоторые из этапов способа, включая анализ образцов, диагностику заболеваний и передачу результатов анализов или диагностики, могут быть осуществлены в различных (например, зарубежных) юрисдикциях.
В некоторых вариантах осуществления описанные здесь способы реализуются с применением системы 330, которая необязательно и предпочтительно, но не обязательно, включает карманное устройство, которое включает, по меньшей мере, две части: первую, которая обеспечивает измерение количества полипептидов в крови (например, с применением иммуногистохимического способа), и вторую, которая проводит вычислительный анализ результатов, измеренных первой частью, и генерирует выходные данные, относящиеся к диагнозу.
Блок-схема соответствующего примера системы 330 в соответствии с некоторыми вариантами осуществления настоящего изобретения приведена на Фиг. 34. Система 330 может включать устройство 331, которое может представлять собой, но необязательно, карманное устройство. Альтернативно, устройство 331, которое может представлять собой устройство, которое монтируется или размещается на столе. Система 330 может включать первую часть 332 с измерительной системой 333, сконфигурированной для измерения значения экспрессии полипептидов в крови субъекта. Измерительная система 333 может выполнять, по меньшей мере, один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа. Система 330 также может включать вторую часть 334, включающую аппаратное обрабатывающее устройство 336 с машиночитаемым носителем данных 338 для хранения инструкций компьютерной программы для выполнения описанных здесь операций (например, инструкций компьютерной программы для определения первой и/или второй координаты, инструкций компьютерной программы для определения кривой и/или плоскости, инструкций компьютерной программы для вычисления первого и/или второго расстояния, инструкции компьютерной программы для коррелирования вычисленной дистанции (дистанций) с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную и/или вирусную инфекцию). Аппаратное обрабатывающее устройство 336 сконфигурировано для получения результатов измерений значений экспрессии из первой части 332 и выполнения программных инструкций в ответ на данные результаты. Необязательно и предпочтительно аппаратное обрабатывающее устройство 336 также сконфигурировано для вывода обработанных данных на устройство для отображения 340.
В некоторых необязательных вариантах осуществления настоящего изобретения система 330 соединена с коммуникационной сетью. В данных вариантах осуществления система 330 или аппаратное обрабатывающее устройство 336 включает сетевой интерфейс 350, который соединен с коммуникационной сетью 352. На соответствующей иллюстрации, приведенной на Фиг. 34, сеть 352 применяется для передачи результатов анализа, осуществленного аппаратным обрабатывающим устройством 336 (например, наличия, отсутствия или вероятности того, что субъект имеет бактериальную и/или вирусную инфекцию) в одно или несколько удаленных мест. Например, система 330 может передавать результаты анализа, по меньшей мере, одной лабораторной информационной системе 360, и/или центральному серверу 362, который собирает данные от множества систем, подобных системе 330.
Фиг. 39А представляет собой схематичную иллюстрацию, показывающую блок-схему системы 330 в вариантах осуществления, в рамках которых коммуникационная сеть 352 применяется для получения результатов измерения значений экспрессии. В рамках данных вариантов осуществления система 330 может включать машиночитаемый носитель 338, как описано выше, и аппаратное обрабатывающее устройство, такое как, но без ограничения, обрабатывающее устройство 336. Аппаратное обрабатывающее устройство 336 может включать сетевой интерфейс 350. Через интерфейс 350 аппаратное обрабатывающее устройство 336 получает результаты измерения значений экспрессии от измерительной системы, такой как, без ограничения, измерительная система 333, и выполняет компьютерные программные инструкции с машиночитаемого носителя 338 в ответ на полученные результаты измерений. Аппаратное обрабатывающее устройство 336 затем может выводить обработанные данные на устройство для отображения 340.
Изобретение также включает комбинации вариантов осуществления, показанных на Фиг. 34 и 39А. Например, интерфейс 350 может применяться как для получения результатов измерения значений экспрессии из сети 352, так и для передачи результатов анализа через сеть 352.
В некоторых вариантах осуществления настоящего изобретения система 330 взаимодействует с пользователем, как схематически показано на блок-схеме на Фиг. 39 В. В рамках данных вариантов осуществления система 330 может включать машиночитаемый носитель 338, как описано выше, и аппаратное обрабатывающее устройство, такое как, но без ограничения, обрабатывающее устройство 336. Аппаратное обрабатывающее устройство 336 включает пользовательский интерфейс 354, который взаимодействует с пользователем 356. Через интерфейс 350 аппаратное обрабатывающее устройство 336 получает результаты измерения значений экспрессии от пользователя 356. Пользователь 356 может получать значение экспрессии из внешнего источника или путем выполнения, по меньшей мере, одного анализа, выбранного из группы, состоящей из иммуноанализа и функционального анализа, или с помощью операционной системы 333 (не показана, см. Фиг. 39А и 34). Аппаратное обрабатывающее устройство 336 выполняет компьютерные программные инструкции с машиночитаемого носителя 338 в ответ на полученные результаты измерений. Аппаратное обрабатывающее устройство 336 затем может выводить обработанные данные на устройство для отображения 340.
Очевидно, что при диагностировании может быть произведен ряд действий.
Таким образом, например, если сделано заключение о наличии бактериальной инфекции, то субъект затем может быть подвергнут лечению антибиотиком.
Примеры антибиотиков включают, без ограничения, даптомицин; гемифлоксацин; телаванцин; цефтаролин; фидаксомицин; амоксициллин; ампициллин; бакампициллин; карбенициллин; клоксациллин; диклоксациллин; флуклоксациллину; мезлоциллин; нафциллин; оксациллин; пенициллин G; пенициллин V; пиперациллин; пивампициллин; пивмециллинам; тикарциллин; азтреонам; имипенем; дорипенем; меропенем; эртапенем; клиндамицин; линкомицин; пристинамицина; хинопристин; цефацетрил (цефацетрил); цефадроксил (цефадроксил); цефалексин (цефалексин); цефалоглицин (цефалоглицин); цефалониум (цефалониум); цефалоридин (цефалорадин); цефалотин (цефалотин); цефапирин (цефапирин); цефатризин; цефазафлур; цефазедон; цефазолин (цефазолин); цефрадин (цефрадин); цефроксадин; цефтезол; цефаклор; цефамандол; цевметазол; цефоницид; цефотетан; цефокситин; цефпрозил (цефпроксил); цефуроксим; цефузонам; цефкапен; фецдалоксим; цефдинир; цефдиторен; цефетамет; цефиксим; цефменоксим; цефодизим; цефотаксим; цефпимизол; цефподоксим; цефтерам; цефтибутен; цефтиофур; цефтиолен; цефтизоксим; цефтриаксон; цефоперазон; цефтазидим; цефклидин; цефепим; цефлупренам; цефоселис; цефозопран; цефпиром; цефхином, пятое поколение; цефтобипрол; цефтаролин, не классифицирован; цефакломезин; цефалорам; цефапарол; цефканел; цефедролор; цефемпидон; цефетризол; цефивитрил; цефматилен; цефмепидиниум; цефовицин; цефоксазол; цефротил; цефсумид; цефурацетим; цефтиоксид; азитромицин; эритромицин; кларитромицин; диритромицин; рокситромицин; телитромицин; амикацин; гентамицин; канамицина; неомицин; нетилмицин; паромомицин; стрептомицин; тобрамицина; флумекин; налидиксовую кислоту; оксолиновую кислоту; пиромидиновую кислоту; пипемидовую кислоту; розоксацин; ципрофлоксацин; эноксацин; ломефлоксацин; надифлоксацин; норфлоксацин; офлоксацин; пефлоксацин; руфлоксацин; балофлоксацин; гатифлоксацин; грепафлоксацин; левофлоксацин; моксифлоксацин; пазуфлоксацин; спарфлоксацин; темафлоксацин; тосуфлоксацин; бесифлоксацин; клинафлоксацин; гемифлоксацин; ситафлоксацин; тровафлоксацин; прулифлоксацин; сульфаметизол; сульфаметоксазолу; сульфисоксазол; триметоприм- сульфаметоксазол; демеклоциклин; доксициклин; миноциклин; окситетрациклин; тетрациклин; тигециклин; хлорамфеникол; метронидазол; тинидазол; нитрофурантоин; ванкомицин; тейкопланин; телаванцин; линезолид; циклосерин 2; рифампицин; рифабутин; рифапентин; бацитрацин; полимиксин В; биомицин; капреомицин.
Если сделано заключение о наличии вирусной инфекции, то субъект может быть подвергнут лечению противовирусным средством. Примеры противовирусных средств включают, без ограничения, абакавир; ацикловир; ацикловир; адефовир; амантадин; ампренавир; амплиген; арбидол; атазанавир; антрипла; балавир; боцепревирертет; цидофовир; комбивир; долутегравир; дарунавир; делавирдин; диданозин; докозанол; эдоксудин; эфавиренц; эмтрицитабин; энфувиртид; энтекавир; эколиевер; фамцикловир; фомивирсен; фосампренавир; фоскарнет; фосфонет; ингибитор слияния; ганцикловир; ибацитабин; имуновир; идоксуридин; имиквимод; индинавир; инозин; ингибитор интегразы; интерферон типа III; интерферон типа II; интерферон типа I; интерферон; ламивудин; лопинавир; ловирид; маравирок; мороксидин; метисазон; нельфинавир; невирапин; нексавир; оселтамивир; пегинтерферон альфа-2а; пенцикловир; перамивир; плеконарил; подофиллотоксин; ралтегравир; ингибитор обратной транскриптазы; рибавирин; ремантадин; ритонавир; пирамидин; саквинавир; софосбувир; ставудин; телапревир; тенофовир; тенофовир дизопроксил; типранавир; трифлуридин; тризивир; тромантадин; трувада; трапорвед; валацикловир; валганцикловир; викривирок; видарабин; вирамидин; зальцитабин; занамивир; зидовудин; противовирусные средства на основе РНК- интерференции; ингаляционные рибовирины; моноклональные антитела (торговое наименование Respigam); блокираторы нейраминидазы.
Информация, полученная с применением описанных здесь способов, может являться полезной в рамках дополнительных вариантов действий в отношении пациентов. Например, данная информация может применяться для определения, должен ли пациент быть госпитализирован. Она также может влиять на решение о пролонгации периода госпитализации. Она также может влиять на решение о том, следует ли проводить дополнительные тесты, или может предотвратить проведение необязательных тестов, таких как КТ и/или рентгенография и/или МРТ и/или культуральный и/или серологический и/или ПЦР-анализ на определенные бактерии и/или ПЦР анализ на вирусы и/или проведение процедур, таких как люмбальная пункция.
Часто является полезным с клинической точки зрения проанализировать у пациентов прогноз, тяжесть заболевания и конечный исход. Авторы настоящего изобретения определили, что низкие уровни TRAIL (ниже чем около 20 пг/мл или около 15 пг/мл или около 10 пг/мл или около 5 пг/мл или около 2 пг/мл) значительно коррелируют с плохим прогнозом и конечным исходом у пациента, а также с высокой тяжестью заболевания. Например, авторы настоящего изобретения показали, что взрослые пациенты в отделении интенсивной терапии (ICU), которые в целом являются тяжелобольными, имели значительно более низкие уровни TRAIL по сравнению со всеми другими пациентами, которые были менее больными, вне зависимости от инфекционной или неинфекционной этиологии заболевания.
Таким образом, в соответствии с другим аспектом настоящего изобретения предусмотрен способ прогнозирования течения заболевания, включающий измерение уровня белка TRAIL в сыворотке у субъекта с заболеванием, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то прогноз является более негативным, чем у субъекта с заболеванием с уровнем белка TRAIL в сыворотке выше предварительно определенного уровня.
Способы измерения уровней белка TRAIL в сыворотке описаны выше.
Заболевание может представлять собой инфекционное или неинфекционное заболевание. Субъект может иметь заболевание, которое было диагностировано или не было диагностировано.
Конкретные примеры заболеваний включают, без ограничения, бактериальные инфекции (например, бактериемию, менингит, инфекции дыхательных путей, инфекции мочевыводящих путей и так далее), сепсис, физическую травму или травму, сердечно-сосудистые заболевания, заболевания, ассоциированные с множественным отказом органов, лекарственную нефротоксичность, острую почечную недостаточность, травму почек, расширенный цирроз и почечную недостаточность, острую или хроническую недостаточность левого предсердия, легочную гипертензию с/без недостаточности правого предсердия и различные типы злокачественных образований.
В соответствии с другим вариантом осуществления измеряют уровни дополнительных полипептидов, что помогает повышать точность прогнозирования. Таким образом, например, другие полипептиды, которые могут подвергаться измерению, включают IP-10, CRP, IL1RA, РСТ и SAA.
В соответствии с определенным вариантом осуществления измеряют уровни IP-10, CRP и TRAIL.
В соответствии с другим вариантом осуществления измеряют уровни только TRAIL.
Авторы настоящего изобретения обнаружили, что пациенты с очень низкими уровнями TRAIL (в соответствии с указанной выше классификацией) имеют более низкий шанс выздоровления и более высокий шанс возникновения осложнений. Соответственно, авторы настоящего изобретения предлагают, что при обнаружении у субъектов очень низких уровней TRAIL они должны подвергаться лечению средствами, которые применяются лишь в качестве последних оставшихся эффективными средств.
Такие средства, например, могут представлять собой, например, экспериментальные средства, которые не были полностью одобрены FDA. Другие последние оставшиеся эффективными средства представляют собой средства, в отношении которых известно наличие связи с тяжелыми побочными эффектами. Другой пример последнего оставшегося эффективным средства представляет собой антибиотик, такой как ванкомицин (который обычно не назначается с целью предотвращения резистентности к антибиотикам).
Очевидно, что также могут быть назначены средства, которые обычно не считаются последними оставшимися эффективными средствами, но в дозировках, которые превосходят клинически допустимые дозировки.
В соответствии с данным аспектом настоящего изобретения, если уровень TRAIL превышает предварительно определенный уровень, то пациент обычно не должен подвергаться лечению последним оставшимся эффективным средством.
Авторы настоящего изобретения обнаружили, что базальные уровни TRAIL у здоровых субъектов или пациентов с неинфекционным заболеванием являются более низкими у женщин по сравнению с мужчинами в рамках детородного возраста (Р-значение t-теста<0,001) (см. Фиг. 37А), однако не различаются в рамках пре- или пост-детородного возраста (P-значение t-теста=0,9, Фиг. 37А). Данный тренд не наблюдался у пациентов с инфекционным заболеванием.
Данная зависящая от возраста динамика может применяться для улучшения моделей, обеспечивающих различение субъектов с бактериальным, вирусным и неинфекционным заболеванием, или здоровых субъектов, как будет очевидно специалисту в данной области.
Например, модель может включать параметры, связанные с возрастом и полом. Если возраст субъекта находится в рамках определенного диапазона, свидетельствующего о фертильности (например, от 13 до 45 лет) и субъект является мужчиной, то могут применяться коэффициенты модели TRAIL для мужчин в детородном возрасте. Если возраст субъекта находится в рамках диапазона, свидетельствующего о фертильности, и субъект является женщиной, то могут применяться коэффициенты модели TRAIL для женщин в детородном возрасте. Если возраст субъекта находится вне диапазона, свидетельствующего о фертильности. то могут применяться коэффициенты модели TRAIL, которые не зависят от возраста.
Таким образом, в соответствии с другим аспектом изобретения предусмотрен способ определения типа инфекции у субъекта-женщины детородного возраста, при этом способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым значением, при этом указанное предварительно определенного пороговое значение соответствует уровню белка TRAIL в сыворотке здорового субъекта-женщины детородного возраста или группы здоровых субъектов-женщин детородного возраста, при этом разница между указанным уровнем белка TRAIL в сыворотке и указанным предварительно определенным пороговым значением свидетельствует о типе инфекции.
Таким образом, в соответствии с другим аспектом изобретения предусмотрен способ определения типа инфекции у субъекта-мужчины детородного возраста, при этом способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым значением, при этом указанное предварительно определенного пороговое значение соответствует уровню белка TRAIL в сыворотке здорового субъекта-мужчины детородного возраста или группы здоровых субъектов-мужчин детородного возраста, при этом разница между указанным уровнем белка TRAIL в сыворотке и указанным предварительно определенным пороговым значением свидетельствует о типе инфекции.
Очевидно, что предварительно определенные пороговые значения могут применяться для заключения о наличии или отсутствии определенного типа инфекции.
Таким образом, например, если уровень белка TRAIL в сыворотке превышает первое предварительно определенное пороговое значение, то тип инфекции является вирусным.
Если, например, уровень белка TRAIL в сыворотке превышает второе предварительно определенное пороговое значение, то тип инфекции не является бактериальным.
Если, например, уровень белка TRAIL в сыворотке является более низким, чем третье предварительно определенное пороговое значение, то тип инфекции является бактериальным.
Если, например, уровень белка TRAIL в сыворотке является более низким, чем четвертое предварительно определенное пороговое значение, то тип инфекции не является вирусным.
Как правило, указанные здесь здоровые субъекты-мужчины и субъекты- женщины не имеют известного заболевания. В соответствии с определенным вариантом осуществления контрольный субъект не имеет инфекционного заболевания.
Как правило, разница между уровнем белка TRAIL в сыворотке субъекта и предварительно определенным пороговым значением является статистически значимым различием, как описано выше.
В соответствии с используемым здесь значением, термин "около" означает ±10%.
Термины "включает", "включающий", "имеющий" и их варианты означают "включая, без ограничения".
Термин "состоящий из" означает "включающий и ограниченный".
Термин "состоящий по существу из" означает, что композиция, способ или структура может включать дополнительные элементы, этапы и/или части, но только если дополнительные элементы, этапы и/или части существенно не изменяют основные и связанные с новизной характеристики указанной композиции, способа или структуры.
В рамках данной заявки различные варианты осуществления данного изобретения могут быть представлены в формате диапазонов. Следует понимать, что описание в формате диапазона приведено для удобства и краткости и не должно рассматриваться в качестве негибкого ограничения области, охватываемой изобретением. Соответственно, описание диапазона должно рассматриваться в качестве явно описывающего все возможные поддиапазоны, а также отдельные числовые значения в рамках данного диапазона. Например, описание диапазона, такого как от 1 до 6, должно рассматриваться в качестве явно описывающего поддиапазоны, такие как от 1 до 3, от 1 до 4, от 1 до 5, от 2 до 4, от 2 до 6, от 3 до 6 и так далее, а также все отдельные числа в рамках такого диапазона, например 1, 2, 3, 4, 5 и 6. Это применимо вне зависимости от ширины диапазона.
В соответствии с используемым здесь значением, термин "способ" означает способы, средства, методы и процедуры для достижения указанной цели, включая, без ограничения, такие способы, средства, методы и процедуры, которые либо известны, либо могут быть легко разработаны на основе известных способов, средств, методов и процедур практикующими специалистами в области химии, фармакологии, биологии, биохимии и медицины.
В соответствии с используемым здесь значением, термин "лечение" включает устранение, существенное ингибирование, замедление или обращение прогрессирования состояния, существенное облегчение клинических или эстетических симптомов состояния или предотвращение появления клинических или эстетических симптомов состояния в значительной степени.
Следует понимать, что определенные признаки изобретения, которые для ясности описаны в контексте отдельных вариантов осуществления, также могут быть предусмотрены в виде комбинации в рамках единого варианта осуществления. Наоборот, различные признаки изобретения, которые для кратности описаны в контексте единого варианта осуществления, также могут быть предусмотрены по отдельности или в виде любой подходящей субкомбинации или в любом подходящем виде в рамках любого иного описанного варианта осуществления изобретения. Определенные признаки, описанные в контексте различных вариантов осуществления, не должны рассматриваться в качестве существенных признаков таких вариантов осуществления, если только подобный вариант осуществления не становится неработоспособным без таких элементов.
Различные варианты осуществления и аспекты настоящего изобретения, которые описаны выше и приведены ниже в Формуле изобретения, находят экспериментальное подтверждение в рамках нижеследующих примеров.
ПРИМЕРЫ
Далее будет приведена ссылка на нижеследующие примеры, которые наряду с приведенным выше описанием неограничивающим образом иллюстрируют некоторые варианты осуществления изобретения.
В целом, используемые здесь обозначения и лабораторные процедуры, применяемые в рамках настоящего изобретения, включают молекулярные, биохимические, микробиологические способы и способы на основе рекомбинантных ДНК. Подобные способы подробно описаны в литературе. См., например, "Molecular Cloning: A laboratory Manual" Sambrook et al., (1989); "Current Protocols in Molecular Biology" т. I-III Ausubel, R.M., ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al. (eds) "Genome Analysis: A Laboratory Manual Series", т.1-4, Cold Spring Harbor Laboratory Press, New York (1998); методологии, описанные в патентах США 4666828; 4683202; 4801531; 5192659 и 5272057; "Cell Biology: A Laboratory Handbook", т. I-III Cellis, J.E., ed. (1994); "Culture of Animal Cells - A Manual of Basic Technique" Freshney, Wiley-Liss, N.Y. (1994), 3-е изд.; "Current Protocols in Immunology" т. I-III Coligan J.E., ed. (1994); Stites et al. (eds), "Basic and Clinical Immunology" (8-е изд.), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (eds), "Selected Methods in Cellular Immunology", W.H. Freeman and Co., New York (1980); доступные иммуноанализы подробно описаны в патентной и научной литературе, см., например, патенты США 3791932; 3839153; 3850752; 3850578; 3853987; 3867517; 3879262; 3901654; 3935074; 3984533; 3996345; 4034074; 4098876; 4879219; 5011771 и 5281521; "Oligonucleotide Synthesis" Gait, М.J., ed. (1984); "Nucleic Acid Hybridization" Hames, B.D., and Higgins S.J., eds. (1985); "Transcription and Translation" Hames, B.D., and Higgins S.J., eds. (1984); "Animal Cell Culture" Freshney, R.I., ed. (1986); "Immobilized Cells and Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning" Perbal, В., (1984) и "Methods in Enzymology" т. 1-317, Academic Press; "PCR Protocols: A Guide To Methods And Applications", Academic Press, San Diego, CA (1990); Marshak et al., "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996); все из которых полностью приведены здесь для ссылки. Другие общие ссылки приведены во всему объему данного описания. Считается, что указанные процедуры являются хорошо известными в данной области и приведены для удобства читателя. Вся содержащаяся информация приведена здесь для ссылки.
ПРИМЕР 1
Протеомная сигнатура организма для различения между бактериальной и вирусной инфекцией: Проспективное многоцентровое наблюдательное исследование
Способы
Исследуемая группа: В исследовании приняли участие всего 1002 пациента. Пациентов детского возраста (≤18 лет) набирали из педиатрических отделений неотложной помощи (PED), педиатрических палат и хирургических отделений, а взрослых пациентов (в возрасте >18 лет) - из отделений неотложной помощи (ED), отделений внутренней медицины и хирургических отделений. У каждого участника или законного представителя получали информированное согласие. Критерии включения в группу с инфекционным заболеванием включали: клиническое подозрение на наличие острого инфекционного заболевания, пиковую температуру >37,5°C с момент появления симптомов и продолжительность симптомов ≤12 дней. Критерии включения в контрольную группу включали: клинические признаки неинфекционного заболевания (например, травмы, инсульта или инфаркта миокарда) или здоровых субъектов. Критерии исключения включали: признаки какого-либо эпизода острого инфекционного заболевания в течение 2 недель перед включением в исследование, диагностированный врожденный иммунодефицит; текущее лечение на основе иммуносупрессорной или иммуномодулирующей терапии; активное злокачественное заболевание, подтвержденное или предполагаемое наличие заражения вирусом иммунодефицита человека (ВИЧ)-1, вирусом гепатита В (HBV) или вирусом гепатита С (НВС) (Фиг. 1А). Важно, что для обеспечения возможности широкого обобщения лечение антибиотиком при включении в исследование не являлось причиной исключения.
Процесс включения в исследования и сбор данных: Для каждого пациента записывали значения следующих базисных переменных: демографические показатели, показатели физического состояния, медицинскую историю (например, основные жалобы, сопутствующие диагнозы, постоянно применяемые лекарства, сопутствующие заболевания, время появления симптомов и пиковую температуру), результаты клинического анализа крови (СВС), полученные при включении в исследование и химические показатели (например, креатинин, мочевину, электролиты и печеночные ферменты). Назальный мазок получали от каждого пациента для дальнейшего микробиологического анализа, а для проведения скрининга на белок и проверки получали образец крови. Лечащие врачи в случае необходимости получали дополнительные образцы (например, образцы мочевины и стула в случаях подозрения на инфекцию мочевыводящих путей [UTI] и гастроэнтерита [GI], соответственно). Радиологические тесты проводили при назначении лечащим врачом (например, рентгенографию грудной клетки для субъектов с подозрением на наличие инфекции нижних дыхательных путей [LRTI]). Спустя тридцать дней после включения в исследование отмечали историю течения заболевания и реакцию на лечение. Всю информацию заносили в кастомизированную форму для электронной отчетности (eCRF).
Микробиологический анализ: Пациенты прошли два диагностических анализа на основе множественной ПЦР с применением назальных мазков: (i) Seeplex® RV15 (n=713) для детектирования вируса парагриппа 1, 2, 3 и 4, коронавируса 229E/NL63, аденовируса A/B/C/D/E, бокавируса 1/2/3/4, вируса гриппа А и В, метапневмовируса, коронавируса ОС43, риновируса А/В/С, респираторно-синцитиального вируса А и В и энтеровируса, и (ii) Seeplex® РВ6 (n=633) для детектирования Streptococcus pneumoniae, Haemophilus influenzae, Chlamydophila pneumoniae, Legionella pneumophila, Bordetella pertussis и Mycoplasma pneumoniae. Анализы на основе множественной ПЦР проводили в сертифицированной сервисной лаборатории. Пациенты также проходили тестирование на дополнительные патогены в соответствии с их предполагаемым клиническим симптомом, включая: культуры, выделенные из крови (n=420), мочи (n=188) и стула (n=66), на предмет Shigella spp., Campylobacter spp. и Salmonella spp.; серологическое тестирование (IgM и/или IgG) на цитомегаловирус (CMV), вирус Эпштейна-Барра (EBV), Mycoplasma Pneumonia и Coxiella burnetii (коксиеллез) (n=167, n=130, n=206 и n=41, соответственно).
Определение контрольного стандарта: Группа с точным диагнозом, Единогласная группа и Мажоритарная группа: Строгий композитный контрольный стандарт был разработан на основании рекомендаций, приведенных в Стандартах отчетности по диагностической точности (Standards for Reporting of Diagnostic Accuracy, STARD).38 Сначала для каждого пациента проводили микробиологический анализ, как описано выше. Затем все данные, собранные в рамках истории заболевания, анализировались комиссией из трех лечащих врачей. Для взрослых пациентов (возрастом >18 лет) комиссия включала лечащего врача и двух специалистов по инфекционным заболеваниям, в то время как для детей и подростков (возрастом ≤18 лет) она включает лечащего детского врача, эксперта по инфекционным заболеваниям и старшего лечащего педиатра. Каждый член комиссии присваивал одну из следующих диагностических категорий каждому пациенту: (i) бактериальное заболевание; (ii) вирусное заболевание; (iii) отсутствие явного инфекционного заболевания или здоровое состояние (контроли); и (iv) неопределенную категорию. Пациентов со смешанными инфекциями (бактериальными плюс вирусными) относили к категории пациентов с бактериальным заболеванием, поскольку они контролируются аналогичным образом (например, подвергаются лечению антибиотиками). Важно, что члены комиссии не были информированы о решениях своих коллег и общих результатах.
Данный процесс применяли для создания трех групп с повышенным уровнем диагностической точности (Фиг. 1А).
(i) Мажоритарная группа: Пациентов относили к данной группе на основании решения, по меньшей мере, двух из трех членов комиссии;
(ii) Единогласная группа (подгруппа Мажоритарной группы): Пациентов относили к данной группе на основании решения всех трех членов комиссии (термины "единогласная группа" и "консенсусная группа" используются здесь взаимозаменяемым образом); а
(iii) Группа с точным диагнозом (подгруппа Единогласной группы): Пациенты, отнесенные к группе с бактериальным заболеванием, получали единогласный диагноз всех трех членов комиссии, имели WBC >15000/мкл (пороговое значение, свидетельствующее о повышенном риске наличия бактериального заболевания11) и одно из следующих подтвержденных микробиологических заболеваний: бактериемию (с полученной из крови культурой с наличием роста), бактериальный менингит (с полученной из спинномозговой жидкости культурой с наличием роста), пиелонефрит (с полученной из мочи культурой с наличием роста и подтверждением поражения почек на основе УЗИ), инфекции мочевыводящих путей (с полученной из мочи культурой с наличием роста), септический шок (с полученной из крови культурой с наличием роста) или перитонзиллярный абсцесс (подтвержденных на основе хирургического исследования или компьютерной томографии). Пациенты, отнесенные к группе с наличием вирусного заболевания, получали единогласный диагноз от членов комиссии и имели положительные результаты тестирования на присутствие вируса.
Кроме того, отнесенные к контролям пациенты получали единогласный диагноз от всех трех членов комиссии.
Образцы, процедуры и измерения уровней белков. Образцы венозной крови хранили при 4°C в течение периода времени до 5 часов на месте проведения анализа и далее разделяли на плазму, сыворотку и общие лейкоциты и хранили при -80°C. Назальные мазки и образцы стула хранили при 4°C в течение периода времени до 72 часов и далее транспортировали в сертифицированную сервисную лабораторию для анализа на основе множественной ПЦР. В рамках фазы скрининга уровни белков организма измеряли в сыворотке и лейкоцитах с применением иммуносорбентного анализа с ферментной меткой (ELISA), технологии Luminex, белковых чипов и проточной цитометрии (на свежевыделенных лейкоцитах). После скрининга и разработки сигнатуры (см. раздел Протеомная сигнатура организма) были отобраны измерены три белка следующим образом: CRP измеряли с применением Cobas 6000, Cobas Integra 400, Cobas Integra 800 или Modular Analytics P800 (Roche). TRAIL и IP-10 измеряли с применением коммерческих наборов для ELISA (MeMed Diagnostics).
Статистический анализ: Первичный анализ был основан на площади под характеристической кривой (AUC), Чувствительности (ТР/Р), Специфичности (TN/N), Положительном критерии отношения правдоподобия (LR+ = Чувствительность/11-Специфичность]), Отрицательном критерии отношения правдоподобия (LR-=[1- Чувствительность] / Специфичность) и Соотношении диагностических коэффициентов (DOR=LR+/ LR-), где Р, N, TP и TN соответствуют положительным результатам (пациентам с бактериальным заболеванием), отрицательным результатам (пациентам с вирусным заболеванием), истинно положительным результатам (пациентам с правильно диагностированным бактериальным заболеванием) и истинно отрицательным результатам (пациентам с правильно диагностированным вирусным заболеванием), соответственно. Статистический анализ проводили с применением MATLAB. Вычисления размеров образцов представлены в Примере 2 ниже.
Скрининг протеома организма: Общий обзор процесса разработки, тренировки и тестирования мультивариативной логистической модели изображен на Фиг. 1В. Кратко, проводили системный описанный в литературе скрининг и биоинформатический анализ, позволивший идентифицировать 600 белков- кандидатов, которые с большой вероятностью дифференциально экспрессировались в образцах периферической крови пациентов с бактериальным заболеванием в отличие от пациентов с вирусным заболеванием, некоторые из которых играли известную роль в иммунной реакции организма на инфекцию, а другие не имели прямой связи с иммунной системой. Далее уровень каждого белка-кандидата измеряли у 20-30 пациентов из тренировочного набора (50% пациентов с вирусным заболеванием и 50% пациентов с бактериальным заболеванием) и применяли P-значение <0,01 в рамках критерия Уилкоксона (WS) для скрининга белков со статистически значимыми дифференциальными измерениями. Это привело к получению набор из 86 белков (значение ожидаемой доли ложных отклонений [FDR] 0,07). Уровень каждого из данных белков затем анализировали у 100 дополнительных пациентов (50% пациентов с вирусным заболеванием и 50% пациентов с бактериальным заболеванием) и также подвергали скринингу с пороговым значением отсечения в рамках t-критерия P<10-4, что позволило определить 14 белков, которые значительно различались в плане экспрессии у пациентов с вирусным заболеванием по сравнению с пациентами с бактериальным заболеванием (FDR<0,001).
Разработка и проверка сигнатуры: Применяли процесс отбора признаков для идентификации оптимальной комбинации белков. Применяли две схемы отбора признаков: схему на основе минимума-максимума взаимной информации39 и жадной обертки40, в рамках которых применяется серия итераций для добавления или удаления признаков. Процесс останавливали, когда повышение эффективности при использовании тренировочного набора более не являлось статистически значимым (P>0,05). Оба процесса конвергировались до одного конечного набора из трех белков. Для интеграции уровней белков в один балл было проанализировано множество вычислительных моделей. Их эффективность существенно не различалась (Р>0,1, как далее описано в Примере 2 ниже). Была выбрана модель на основе полиномиальной логистической регрессии (MLR), поскольку она обеспечивает возможность вероятностной интерпретации путем присвоения диагнозу пациента балла вероятности. Сигнатура использует данное свойство для исключения пациентов, чья вероятность наличия бактериальной инфекции является промежуточной: между 0,35 и 0,55. Для описания данных пациентов здесь используется термин "промежуточная иммунная реакция", поскольку их профиль располагается между реакциями организма на бактериальную инфекцию и вирусную инфекцию. Пациенты из Мажоритарной когорты были разделены на тренировочные и тестируемые набор, каждый из которых включал 50% пациентов (Фиг. 1В). Тренировочный набор включал 120 пациентов, которые принимали участие в процессе скрининга, и дополнительных пациентов, которые были включены произвольным образом. Тестируемый набор включает остальных пациентов и применялся для независимого анализа эффективности сигнатуры. Важно, что ни один из пациентов из тестируемого набора не применялся для тренировки алгоритмов или для отбора белков. Перекрестную проверку с исключением 10% применяли для оценки эффективности модели. Более подробная информация о структуре модели приведена в Примере 2 ниже.
РЕЗУЛЬТАТЫ
Характеристики пациентов: Три лечащих врача независимо относили каждого пациента к определенной категории (имеющих бактериальное заболевание, вирусное заболевание, контролям, или к неопределенной категории). Категории применяли для создания трех групп с повышенным уровнем диагностической точности: Мажоритарной группы (n=765), Единогласной группы (n=639) и Группы с точным диагнозом (n=312) (Фиг. 1А). Кроме того, 98 пациентов относили к неопределенной категории, поскольку лечащие врачи не могли определить этиологию заболевания или отнести их к Мажоритарной группе. Подробная характеристика Мажоритарной группы приведена в Таблице 1. Кратко, группу балансировали на основе возраста (47% женщин, 53% мужчин) и включали 56% пациентов детского возраста (≤18 лет) и 44% взрослых (возрастом >18 лет). У пациентов наблюдался широкий ряд клинических симптомов (например, RTI, UTI и системные инфекции), значений максимальной температуры (36-41,5°С), значений продолжительности периодов времени с начала появления симптомов (0-12 дней), сопутствующих заболеваний и принимаемых лекарственных средств (Таблица 1 и Фиг. 6А-12В). Всего были определены 56 видов патогенов, которые отвечают за большинство случаев острых инфекционных заболеваний в Западном мире (Фиг. 7А-В).
Figure 00000002
Figure 00000003
Таблица 1 - Базисные характеристики пациентов из Мажоритарной группы. Значения представляют собой числа (доли). Представлены только микроорганизмы, детектированные более чем у 5 пациентов. CNS - центральная нервная система, GI - гастроэнтерит, LRTI - инфекция нижних дыхательных путей, UTRI - инфекция верхних дыхательных путей, UTI - инфекция мочевыводящих путей, N/A - здоровые контроли или пациенты, для которых не были получены данные. Подгруппа вируса гриппа А включала штаммы H1N1. Подгруппа атипичных бактерий включала Chlamydophila pneumoniae, Mycoplasma pneumonia и Legionella pneumophila. Подгруппа кишечных вирусов включала ротавирус, астровирус, кишечный аденовирус и норовирус G I/II. При анализе клинического синдрома LRTI группа включала пневмонию, бронхиолит, острый бронхиолит и ларингит; группа URTI включала фарингит, острый средний отит, острый синусит и острый тонзиллит.
Эффективность сигнатуры у Группы с точным диагнозом, Единогласной группы и Мажоритарной группы: Из 600 подвергнутых скринингу белков организма и их комбинаций наилучшая сигнатура для различения пациентов с бактериальным заболеванием, вирусным заболеванием и контрольных пациентов в тренировочном наборе Мажоритарной группы включала три растворимых белка: TNF-родственный индуцирующий апоптоз лиганд (TRAIL), интерферон-гамма-индуцируемый белок 10 (IP-10) и С-реактивный белок (CRP) (Фиг. 2А-С). AUC сигнатуры для различения бактериальных и вирусных инфекций в рамках тестируемого набора Мажоритарной группы составлял 0,94±0,04. Аналогичные результаты были получены с применением перекрестной проверки с исключением 10% всей Мажоритарной группы (AUC=0,94±0,02). Сигнатура значительно превосходила все отдельные белки, проанализированные на этапе скрининга (Р<10-6). Процедуры тренировки и тестирования повторяли в отношении Единогласной группы и Группы с точным диагнозом с получением AUC в размере 0,96±0,02 и 0,99±0,01, соответственно. Поэтапное повышение эффективности соответствует повышенной достоверности контрольного стандарта в рамках трех групп (Таблица 2, ниже).
Figure 00000004
А. Значения эффективности и их 95% доверительные интервалы получали с применением перекрестной проверки с исключением 10% у всех пациентов из Группы с точным диагнозом (nБакт.=27, nВирусн.=173), единогласной группы (nБакт.=256, nВирусн.=271) и Мажоритарной группы (nБакт.=319, nВирусн.=334). В. Анализ повторяли после исключения пациентов с промежуточной иммунной реакцией (Группа с точным диагнозом [nБакт.=27, nВирусн.=159, nПромеж.=14], Единогласная группа [nБакт.=233, nВирусн.=232, nПромеж.=62] и Мажоритарная группа [nБакт.=290, nВирусн.=277, nПромеж.=88]), что соответствует вероятному способу применения сигнатуры лечащими врачами.
Далее, авторы настоящего изобретения применяли сигнатуру для различения пациентов с инфекционным (бактериальным или вирусным) заболеванием и неинфекционных контролей в рамках тестируемого набора Мажоритарной группы, что приводило к получению AUC в размере 0,96±0,02. Дальнейшая оценка с применением перекрестной проверки с исключением 10% давала аналогичные результаты (AUC=0,96±0,01). Сигнатура превосходила любой из отдельных белков (Р<10-8). Оценка на Единогласной группе и Группе с точным диагнозом опять же показывала повышенные значения AUC в размере 0.97±0,02 и 0,97±0,03, соответственно. Для получения консервативных оценок эффективности сигнатуры описанный ниже анализ был выполнен в отношении Мажоритарной группы.
Сравнение с лабораторными показателями, клиническими параметрами и хорошо известными биомаркерами: Сигнатуру сравнивали с хорошо известными клиническими параметрами и лабораторными показателями, включая количество белых кровяных клеток (WBC), абсолютное количество нейтрофилов (ANC), долю нейтрофилов, максимальную температуру, пульс и интенсивность дыхания (Фиг. 3А и Пример 2). Сигнатура превосходила все отдельные параметры (Р<10-18). Далее сигнатуру сравнивали с комбинацией нескольких клинических параметров. С этой целью получали полиномиальные логистические модели для всех комбинаций вплоть до четырех клинических параметров. Наиболее эффективная пара, триплет и квадруплет, изображены на Фиг. 3А (добавление пятого параметра не повышало эффективность). Сигнатура являлась значительно более эффективной, чем наиболее эффективная комбинация клинических параметров (Р<10-15), которая состояла из ABC, пульса, % лимфоцитов и % моноцитов (AUC=0,94±0,02 против 0,77±0,04). Далее эффективность сигнатуры сравнивали с РСТ и CRP, двумя белками, которые обычно применяются в клинической практике для диагностики сепсиса и бактериальных инфекций (Пример 2). Сигнатура была значительно более эффективной, чем оба белка (Р<10-8 и Р<10-6, соответственно). Сигнатура также была более эффективной, чем широкий диапазон белков организма с известной ролью в плане иммунной реакции на инфекцию, включая сепсис, и связанных с бактериями (например, TREM, IL-6 и IL-8), связанных с вирусами (например, IFN-γ и IL-2), и связанных с воспалением (например, IL-1a и TNF-α) белков (Р<10-8) (Фиг. 3В и Пример 2 ниже).
Эффективность сигнатуры является устойчивой в рамках различных подгрупп пациентов: Гетерогенность пациентов и патогенов, которая является неотъемлемой частью реальных клинических условий, может отрицательно влиять на диагностическую применимость любого отдельного биомаркера организма. Для анализа способности сигнатуры, представляющей собой комбинацию множества биомаркеров, поддерживать стабильную эффективность несмотря на различные условия у различных пациентов были проведены анализы с использованием подгрупп. Сигнатура являлась устойчивой (AUC от 0,87 до 1,0) в рамках широкого диапазона характеристик пациентов, включая возраст, клинический синдром, время с момента проявления симптомов, максимальную температуру, вид патогенов, сопутствующие заболевания, лечение лекарственными средствами для хронических заболеваний, и место применения (Фиг. 4 и Пример 2, ниже). Сигнатуру также тестировали на подгруппе пациентов, которых технически были исключены, но имели были отнесены к Единогласной группе комиссией экспертов, что соответствовало значению AUC 0,96±0,06 (nБакт.=27, nВирусн.=14). Это может свидетельствовать о том, что сигнатура может применяться более широко в рамках условий, который были первоначально исключены (например, у пациентов с субфебрильной температурой).
Эффективность сигнатуры остается неизменной при наличии потенциальных бактерий-колонизаторов: Многие вызывающие заболевания бактерии также представляют собой часть естественной флоры и часто обнаруживаются у субъектов без симптомов12,42-44. Подобные бактерии вызывают значительные трудности при диагностике, поскольку их обнаружение необязательно связано с их ролью в плане возникновения заболевания; таким образом, подходящее лечение может оставаться неясным. Авторы настоящего изобретения попытались определить влияние их наличия на эффективность сигнатуры.
Streptococcus pneumoniae (SP) и Haemophilus influenzae (HI), детектируемые с помощью ПЦР в назальных мазках, представляли собой две наиболее часто встречающиеся бактерии в рамках Мажоритарной группы (Таблица 1, выше). Высокие количества SP и HI были обнаружены как у пациентов с бактериальным заболеванием, так и у пациентов с вирусным заболеванием (SP: 36% и 47%; HI: 20% и 32%), являясь основанием для понимания того, что само их наличие необязательно вызывает заболевание.12 Пациенты были подвергнуты стратификации на основании того, имели ли они SP (SP+: nБакт.=116, nВирусн.=157; SP-: nБакт.=203, nВирусн.=177), при этом сравнивали эффективность AUC обеих групп. Значительное различие не наблюдалось (0,93±0,03 против 0,94±0,02, Р=0,31). Наличие или отсутствие HI также не влияло на эффективность сигнатуры (0,94±0,04 против 0,93±0,02; HI+: nБакт.=63, nВирусн.=106; HI-: nВакт.=256, nВирусн.=228, Р=0,34). Это свидетельствует о том, что наличие SP и HI не влияет на эффективность сигнатуры.
Обсуждение
Была разработана стратегия на основе строгого композитного контрольного стандарта, которая включала сбор клинических данных, группу химических анализов и широкий ряд микробиологических тестов с последующим отнесением к определенной группе тремя независимыми лечащими врачами. Данный процесс позволял получать иерархию из трех подгрупп с уменьшающимся размером и повышающейся достоверностью контрольного стандарта: Мажоритарной подгруппы, Единогласной подгруппы и Подгруппы с точным диагнозом. Соответствующие AUC сигнатуры составляли 0,94±0,02, 0,96±0,02 и 0,99±0,01. Данное поэтапное повышение эффективность может быть отнесено к повышению достоверности контрольного стандарта. Однако повышенная точность, в частности в рамках Группы с точным диагнозом, также может быть частично вызвана смещением отбора пациентов с тяжелым заболеванием или очевидным диагнозом. Таким образом, представленный здесь первичный анализ был сосредоточен на Мажоритарной группе, которая включает более широкий спектр степени тяжести заболевания и сложные в плане диагностики случаи. Данная группа потенциально включает некоторые ошибочные решения о включении в данную группу, что приводит к консервативным оценкам точности сигнатуры.
Сигнатура отвечает на несколько вызовов, присущих современным микробиологическим тестам, (i) Сложность диагностики инфекции в недоступных или неизвестных участках. Сигнатура обеспечивает точную диагностику подобных случаев, включая инфекции нижних дыхательных путей (AUC 0,95±0,03, n=153) и высокую температуру без явного источника (AUC=0,97±0,03, n=123). (ii) Продолжительное время, необходимое для получения результатов (от часов до дней). В рамках сигнатуры осуществляется измерение уровней растворимых белков, которые легко поддаются проведению быстрого измерения (в течение нескольких минут) при использовании больничных автоматизированных устройств для проведения иммуноанализа и стационарных устройств, (iii) Смешанные инфекции могут приводить к неточной диагностике, поскольку детектирование вируса не исключает наличия сопутствующей бактериальной инфекции.14,15 Сигнатура решает эту проблему благодаря отнесению смешанных инфекций к одной категории наряду с исключительно бактериальными инфекциями, что позволяет лечащим врачам работать с обеими группами аналогичным образом в плане лечения антибиотиками. Тот факт, что смешанные сопутствующие инфекции вызывали протеомную реакцию организма, которая является аналогичной реакции на исключительно бактериальную инфекцию, но не смесь различных реакций, может свидетельствовать о доминировании бактериальных инфекций над вирусными в плане биологического маршрута, (iv) Значительный недостаток микробиологических тестов, в частности ПЦР, заключается в детектировании потенциальных бактерий-колонизаторов у субъектов с небактериальными заболеваниями.12,13 Эффективность сигнатуры не изменялась в зависимости от наличия или отсутствия потенциальных бактерий-колонизаторов.
Белки организма, такие как РСТ, CRP и IL-6, традиционно применяют для содействия при диагностировании бактериальных инфекций, поскольку они предоставляют дополнительную информацию по клиническим симптомам, количеству в крови и микробиологическим показателям.11 Тем не менее, вариабельность в рамках одного пациента и в плане различных патогенов ограничивает их применимость.21-27 Комбинации белков организма обладают потенциалом в плане преодоления данного ограничения, однако на сегодняшний день по сравнению с отдельными белками они обеспечили улучшение диагностики в степени от незначительного до умеренного.11,35-37 Данное умеренное улучшение может обеспечиваться комбинацией индуцируемых бактериями белков, которые являются чувствительными по отношению к тем же факторам и, таким образом, являются менее способными компенсировать эффект друг друга. Соответственно, крупное улучшение наблюдалось при применении комбинаций, которые включали уровни белков в организме, клинические параметры и другие тесты.11,35-37 Однако получение данных множественных параметров в реальном времени зачастую неосуществимо.
Для решения данной проблемы была идентифицирована комбинация белков с комплементарным действием. В частности, было обнаружено, что TRAIL индуцировался в ответ на вирусы и подавлялся бактериями, IP-10 имел более высокий уровень при вирусных инфекциях по сравнению с бактериальными инфекциями, а уровень CRP был выше при бактериальных инфекциях по сравнению с вирусными инфекциями. В то время как применение повышенного уровня CRP в качестве индикатора наличия бактериальных инфекций является хорошо известным31,45, включение новых индуцируемых вирусами белков для дополнения традиционно применяемых индуцируемых бактериями белков по существу обеспечивало стабильность сигнатуры в рамках широкого диапазона подгрупп, включая, помимо прочего, время с момента появления симптомов, вид патогенов и сопутствующие заболевания. Например, аденовирусы, представляющие собой важную подгруппу вирусов, которые вызывают 5%-15% острых инфекций у детей, являются особенно сложными в плане диагностики, поскольку они вызывают клинические симптомы, которые имитируют бактериальную инфекцию.46 Стандартные лабораторные параметры обеспечивают плохую эффективность в рамках данной подгруппы по сравнению с сигнатурой (AUCs=0,60±0,10 [WBC], 0,58±0,10 [ANC], 0,88±0,05 [сигнатура]; n=223).
Несмотря на прогресс в области диагностики инфекционных заболеваний, своевременная идентификация бактериальных инфекций остается затрудненной, что приводит к излишнему применению антибиотиков и сопутствующим широкомасштабным последствиям в плане здравоохранения и экономики. Для удовлетворения потребности в улучшенном виде лечения авторы настоящего изобретения разработали и проверили сигнатуру, в рамках которой скомбинированы новые и традиционные белки организма для различения бактериальных и вирусных инфекций. Настоящее открытие, сделанное в рамках крупного объема выборки пациентов, являются многообещающим, что свидетельствует о том, что данная сигнатура обладает потенциалом в плане помощи лечащим врачам при лечении пациентов с острым инфекционным заболеванием и снижения частоты излишнего применения антибиотиков.
ПРИМЕР 2
Протеомная сигнатура организма для различения бактериальной и вирусной инфекции: Проспективное многоцентровое наблюдательное исследование - дополнительный материал
Меры точности: Сигнатура включает уровни трех белковых биомаркеров, измеренные у субъекта, и включает вычисление числового балла, который отражает вероятность наличия бактериальной инфекции по сравнению с вирусной инфекцией. Для количественного анализа диагностической точности сигнатуры применяли пороговое значение балла и проводили следующие измерения: чувствительность, специфичность, положительная прогностическая ценность (PPV), отрицательная прогностическая ценность (NPV), общая точность, положительный критерий отношения правдоподобия (LR+), отрицательный критерий отношения правдоподобия (LR-) и соотношение диагностических коэффициентов (DOR). Данные измерения осуществляются следующим образом:
Figure 00000005
Figure 00000006
Figure 00000007
Figure 00000008
Figure 00000009
Figure 00000010
Figure 00000011
Figure 00000012
Р, N, TP, FP, TN, FN представляют собой положительные результаты, отрицательные результаты, истинно положительные результаты, ложноположительные результаты, истинно отрицательные результаты и ложноотрицательные результаты, соответственно. Распространенность представляет собой относительную частотность положительного класса (то есть распространенность = Р/(Р+N)). Если не указано иное, положительные результаты и отрицательные результаты соответствуют пациентам с бактериальными и вирусными инфекциями, соответственно.
Площадь под характеристической кривой (AUC) также применяли для осуществления не зависящих от порогового значения сравнений различных диагностических способов. Подробное описание формулирования и вычисления доверительного интервала (CI) AUC см. в Hanley and McNeil.1 В рамках данного описания указаны 95% CI измерений точности.
Объем выборки: Первичная задача исследования заключалась в определении эффективности сигнатуры в плане классификации пациентов с заболеванием вирусной и бактериальной этиологии. Было определено, что объем выборки, требуемый для того, чтобы отвергнуть нулевую гипотезу о том, что чувствительность и специфичность в рамках всей группы, то есть Р, являются ниже Р0=75% при уровне значимости 1%, составлял 90% для 15% разности (Р1-Р0≥15%), то есть 394 пациентов (197 пациентов с вирусным заболеванием и 197 пациентов с бактериальным заболеванием). Кроме того, было предварительно определено, что примерно 15% пациентов будут иметь неопределяемый источник инфекции, при этом 10% будут исключены по техническим причинам и 10% будут являться здоровыми или неинфекционными контролями. Исследование требовало включения всего, по меньшей мере, 607 пациентов. Данное требование было выполнено, поскольку в исследовании приняли участие 1002 пациента.
Построение вычислительной модели логистической модели: Для включения уровней белков в одиночный прогностический балл было проанализировано множество вычислительных моделей, включая Искусственные нейронные сети (ANN), Методы опорных векторов (SVM), Байесовские сети (BN), Анализ на основе k-ближайших соседей (KNN) и Полиномиальную логистическую регрессию (MLR).2-3 Значения AUC для различения между бактериальной и вирусной инфекцией, полученные в рамках Мажоритарной группы с применением перекрестной проверки с исключением 10%, составляли 0,93±0,02 (ANN), 0,93±0,02 (SVM [линейный]), 0,94±0,02 [SVM (радиальная базисная функция)], 0,92±0,02 (BN), 0,91±0,02 (KNN) и 0,94±0,02 (MLR). Значительная разница в эффективности ANN, SVM и MLR моделей (Р>0,1 при сравнении их AUC) не наблюдалась. Авторы настоящего изобретения выбрали MLR, поскольку она обеспечивает возможность вероятностной интерпретации путем присвоения диагнозу пациента балла вероятности.
Авторы настоящего изобретения выполнили тренировку и тестирование MLR сигнатуры для различения заболеваний бактериальной и небактериальной этиологии. Поскольку распространенность лежащих в основе этиологии варьируется в рамках различных клинических условий, более ранние полученные с помощью моделей результаты корректировали для соответствия равной базисной распространенности (50% - бактериальные заболевания и 50% - небактериальные заболевания). В рамках группы без бактериального заболевания более ранние результаты были скорректированы до 45% вирусных заболеваний и 5% неинфекционных заболеваний для соответствия предполагаемому более высокой распространенности пациентов с вирусными заболеваниями против пациентов с неинфекционными заболеваниями среди субъектов с подозрением на наличие острой инфекции. Весовые коэффициенты MLR и их соответствующие 95% доверительные интервалы, а также p-значения, связанные с каждым коэффициентом, приведены в Таблицах 3-4 ниже. При сравнительном анализе бактериальных инфекций и вирусных инфекций вероятности корректировали для соответствия общей суммы 1 (Pb_скоррект.=[Pb+Pv] и Pb_скоррект.=[Pb+Pv], где Pb и Pv соответствуют вероятности бактериальных и вирусных инфекций, соответственно).
Figure 00000013
Figure 00000014
Figure 00000015
Логистические калибровочные кривые: В целях анализа проверки MLR модели вычисленные прогностические значения вероятности сравнивали с реально наблюдаемыми конечными результатами (Фиг. 5). Прогностические вероятности близко соответствовали наблюдаемым, что обеспечивало 5 дополнительную демонстрацию правильности модели.
Общие данные по группам пациентов, применяемым в данном исследовании: Всего было набрано 1002 пациентов и 892 пациентов приняли участие в исследовании (110 были исключены на основании предварительно определенных критериев исключения). На основе описанного в разделе "Способы" Примера 1 процесса определения контрольного стандарта пациентов относили к четырем различным диагностическим группам: (i) бактериальное заболевание; (ii) вирусное заболевание; (iii) отсутствие явного инфекционного заболевания или здоровое состояние (контроли); и (iv) неопределенная категория. Пациентов со смешанными инфекциями (бактериальными плюс вирусными) относили к категории пациентов с бактериальным заболеванием, поскольку они контролируются аналогичным образом (например, подвергаются лечению антибиотиками) (Фиг. 1А). Всего у 89% всех принимавших участие в исследовании пациентов был поставлен диагноз, при этом эта доля соответствует приводимому в литературе пределу.4-6 В дальнейших разделах приведено подробное описание характеристик пациентов, которое включает всех пациентов с конечным диагнозом (n=794): 765 пациентов из Мажоритарной группы и 29 пациентов, для которых образцы сыворотки были подвергнуты обеднению на этапе скрининга (Фиг. 1А-В).
Распределение по возрасту и полу: В исследовании принимали участие пациенты всех возрастов. Пациенты с не вызывающим сомнение диагнозом (пациенты с диагнозом; n=794) включали больше пациентов детского возраста (≤18 лет), чем взрослых (>18 лет) (445 пациентов [56%] против 349 [44%]). Распределение по возрасту было относительно равномерным для пациентов в возрасте 20-80 лет и достигала пика при значении возраста <4 лет для пациентов детского возраста (Фиг. 6А-В). Наблюдаемое распределение по возрасту для пациентов детского возраста соответствует ожидаемому и отражает фоновое распределение в рамках условий стационара7 (например, отделения неотложной помощи [ED], педиатрических отделений и отделений внутренней медицины). В исследовании принимали участие пациенты обоих полов. Группа пациентов являлась сбалансированной в плане распределения по полу (47% женщин, 53% мужчин).
Детектированные патогены: Применяли широкий набор микробиологических инструментов для максимизации степени детектирования патогенов. По меньшей мере, один патоген детектировали у 65% пациентов с острым инфекционным заболеванием (56% всех 794 пациентов с поставленным диагнозом). Всего 36 различных патогенов были детектированы активным образом с применением множественной ПЦР, детектирования антигенов и серологического исследования. Дополнительные 20 патогенов детектировали с применением стандартных культуральных способов или самостоятельно проводимой ПЦР. Были детектированы всего 56 различных патогенов, принадлежащих ко всем основным подгруппам патогенов (Фиг. 7А). Данная степень идентификации патогенов аналогична степени, которая отмечена в раннее опубликованных исследованиях, и включает патогены из всех основных подгрупп патогенов (грамотрицательные бактерии, грамположительные бактерии, атипичные бактерии, РНК вирусы и ДНК вирусы). У 13% пациентов были детектированы патогены из более чем одной указанной выше подгруппы патогенов (Фиг. 7А).
Патогенные штаммы, обнаруженные в рамках данного исследования являются ответственными за широк ряд острых инфекционных заболеваний в Западном мире и включают ключевые патогены, такие как вирус гриппа А/В, респираторно-синцитиальный вирус (RSV), парагрипп, Е. Coli, Streptococcus группы А и так далее. Следует отметить, что анализ детектированных патогенов выявил, что ни один из данных патогенов не является доминирующим (Фиг. 7В).
Вовлеченные физиологические системы и клинические синдромы: У пациентов с инфекционным заболеванием (все пациенты с диагнозом [n=794], за исключением пациентов с неинфекционными заболеваниями или здоровых субъектов, n=673) присутствовали инфекции в различных физиологических системах (Фиг. 8). Наиболее частой вовлеченной системой являлась респираторная система (46%) и затем системные инфекции (22%). Все инфекции, которые не поражали вышеуказанные системы и не являлись поражающими желудочно- кишечный тракт, мочевыводящую систему, сердечно-сосудистую систему или центральную нервную систему (CNS), относили к категории "Другие" (например, панникулит, абсцесс). Наблюдаемое распределение пораженных физиологических систем отражает естественное распределение и соответствует распределению в крупных группах пациентов, включенных в выборку в течение года.
У пациентов с диагнозом в рамках настоящего исследования (n=794) присутствовал ряд клинических синдромов (Фиг. 9А-В), который отражал ожидаемую клиническую гетерогенность в рамках группы пациентов детского и взрослого возраста, собранной в течение года. Наиболее частым клиническим синдромом являлся LRTI (21%), включая в основном пневмонию, бронхит, бронхиолит, обострение хронической обструктивной болезни легких (COPD) и неспецифическую LRTI. Вторым наиболее частым синдромом являлась системная инфекция (19%), включая в основном случаи высокой температуры без явного источника и скрытой бактериемии. Системные инфекции в основном детектировались у детей в возрасте <3 лет, но также детектировались и у нескольких взрослых пациентов. Системные инфекции представляют собой серьезную клиническую проблему, поскольку соблюдение баланса между риском для пациента и стоимостью тестирования/лечения является сложным. Третьим наиболее частым клиническим синдромом являлась URTI (19%), включая в основном острый тонзиллит, острый фарингит, неспецифическую URTI, острый синусит и острый средний отит. Следующими наиболее частыми синдромами являлись гастроэнтерит (12%), UTI (7%) и панникулит (4%). CNS инфекции (2%) включали септический и асептический менингит. Дополнительные клинические синдромы (1%) относили к категории "Другие", при этом они включали менее распространенные инфекции (например, наружный отит, эпидидимит и так далее).
Наблюдаемый паттерн распределения клинических синдромом соответствует наиболее частым и клинически релевантным симптомам и согласуется с ранее опубликованным крупным исследованиям.
Температура тела: Температура тела представляет собой важный параметр при оценке степени тяжести инфекционного заболевания. Распределение максимальных значений температуры тела анализировали у всех пациентов с диагнозом (n=794) на основе наиболее высокого значения температуры тела (при пероральном или ректальном измерении). Распределение максимальных значений температуры тела было относительно равномерным между 38°C и 40°C с пиковым значением 39°C (Фиг. 10). Температура тела <37,5°С была определена у 15% пациентов (подгруппа пациентов с неинфекционными заболеваниями или здоровыми субъектами). Температура тела ≥40,5°C являлась редкой (<3% пациентов). Общие результаты наблюдаемого распределения соответствуют нормальному диапазону температур в клинических условиях.
Время с момента появления симптомов: "Время с момента появления симптомов" было определено как продолжительности (в днях) с момента появления первого видимого симптома (первый видимый симптом мог представлять собой высокую температуру, но также мог представлять собой другой симптом, такой как тошнота или головная боль перед появлением высокой температуры). Распределение "времени с момента появления симптомов" в нашей группе (все пациенты с диагнозом, n=794) достигало пика спустя 2-4 дня после появления симптомов (35% пациентов) со значительными долями пациентов, обратившихся за медицинской помощью либо быстрее, либо позднее (Фиг. 11).
Сопутствующие заболевания и постоянный прием лекарственных средств: Сопутствующие заболевания и постоянный прием лекарственных средств теоретически могут влиять на результаты диагностического теста. Из всех пациентов с диагнозом 62% не имели сопутствующих заболеваний, в то время как 38% имели ≥1 хроническое заболевание. Кроме того, 75% пациентов не подвергались лечению постоянно принимаемыми лекарственными средствами, а 25% подвергались лечению ≥1 постоянно принимаемым лекарственным средством. Наиболее частыми хроническими заболеваниями в рамках нашей группы пациентов являлись гипертензия, гиперлипидемия, заболевания легких (например, COPD, астма и так далее), сахарный диабет (в основном 2 типа) и ишемические заболевания сердца, что соответствует наиболее частым хроническим заболеваниям в Западном мире (Фиг. 12А). Распределение постоянно принимаемых лекарственных средств, применяемых нашей группой пациентов, сильно коррелировало с диапазоном присутствующих хронических заболеваний (например, 29% пациентов с сопутствующими заболеваниями имели гиперлипидемию, при этом понижающие уровень липидов средства являлись наиболее часто применяемыми лекарственными средствами). Другие часто применяемые лекарственные средства включали аспирин, лекарственные средства для контроля уровня глюкозы в крови и бета-блокаторы (Фиг. 12В).
Места набора пациентов: Пациентов детского возраста (≤18 лет) набирали из педиатрических отделений неотложной помощи (PED), педиатрических больничных палат и хирургических отделений, а взрослых (>18 лет) - из отделений неотложной помощи (ED), отделений внутренней медицины и хирургических отделений. Педиатрические ED являлись наиболее частым местом набора (39%), а другие места набора имели сравнимые значения (17-20%), что соответствует относительно сбалансированному процессу набора. Соотношение между пациентами из ED и госпитализированными пациентами составляло ~1:1 для взрослых и ~2:1 для детей (Фиг. 13).
Характеристики исключенных пациентов: Из 1002 пациентов, которые были набраны для данного исследования, были исключены 110 пациентов (11%) (некоторые пациенты соответствовали более чем одному критерию исключения). Наиболее частой причиной исключения являлась повышенная температура, которая была ниже порогового значения 37.5°C в рамках исследования (n=54), и далее время с момента появления симптомов >12 дней (n=26) и недавно перенесенное (за последние 14 дней) инфекционное заболевание (n=22). Другие причины исключения включали активное злокачественное заболевание (n=14) и ослабленный иммунитет (например, вследствие лечения иммуносупрессорным лекарственным средством; n=2).
Характеристики пациентов с неопределенным заболеванием: Всего 98 пациентов были определены как имеющие неопределенное заболевание на основе неспособности экспертной комиссии надежно определить композитный контрольный стандарт, несмотря на строгий набор лабораторной и клинической информации. Несмотря на невозможность прямого анализа эффективности сигнатуры у данных пациентов при отсутствии контрольного стандарта, является возможным проанализировать их реакцию на основе белков организма в целях оценки их отличия от пациентов с контрольным стандартом. Авторы сравнили распределение TRAIL, IP-10 и CRP у пациентов с острой инфекцией с контрольным стандартом (n=653) с пациентами без контрольного стандарта (n=98). Отмечали количество статистических значимых различий (P-значение критерия Колмогорова-Смирнова = 0,20, 0,25, 0,46 для TRAIL, IP-10 и CRP, соответственно). Сходство в плане реакции на основе белков организма между пациентами с контрольным стандартом и без контрольного стандарта свидетельствует о том, что настоящий подход может применяться для определения диагноза у пациентов с неопределенным заболеванием в рамках клинических условий.
Эффективность сигнатуры является устойчивой в рамках различных подгрупп пациентов: В Примере 1 авторы настоящего изобретения продемонстрировали, что эффективность сигнатуры оставалась устойчивой в рамках широкого диапазона характеристик пациентов, включая возраст, клинический синдром, время с момента появления симптомов, максимальную температуру, вид патогенов, сопутствующие заболевание и место применения, при этом значения AUC составляли от 0,87 до 1,0 (Фиг. 4). В рамках данного примера приведен обзор эффективности сигнатуры в рамках дополнительных подгрупп пациентов.
Стратификация на основе постоянного приема лекарственных средств: В условиях реальной клинической практики пациенты часто проходят различные курсы лечения с постоянным приемом лекарственных средств, которые потенциально могут влиять на уровень белков, входящих в состав сигнатуры. Таким образом, авторы настоящего изобретения проанализировали влияние наиболее часто применяемых лекарственных средств в рамках группы (по категориям) на эффективность сигнатуры. Ни одна из проанализированных групп лекарственных средств не была связана со значительными измерениями в плане эффективности сигнатуры (Таблица 5).
Figure 00000016
Стратификация на основе сепсиса: Сепсис представляет собой потенциально летальное медицинское состояние, характеризуемое состоянием воспаления всего организма (называемы синдромом системной воспалительной реакции [SIRS]) и наличием известной или предполагаемой инфекции. Пациенты с бактериальным сепсисом получают пользу от ранней терапии с применением антибиотиков, при этом отсроченное или неправильное определение диагноза может иметь серьезные или даже фатальные последствия. Авторы настоящего изобретения сосредоточились на взрослых пациентах, для которых определение SIRS является очевидным, и проанализировали способность сигнатуры обеспечивать различение взрослых пациентов с бактериальным сепсисом и пациентов с вирусными инфекциями, а также взрослых пациентов с бактериальным сепсисом и пациентов с вирусным сепсисом.
Взрослых пациентов с бактериальным сепсисом определяли в соответствии с критериями Американской коллегии специалистов по заболеваниям грудной полости (American College of Chest Physicians) и Общества работников реаниматологии (Society of Critical Care Medicine). SIRS определяли на основе присутствия, по меньшей мере, двух из следующих результатов: (i) температуры тела <36°C или >38°C, (и) частоты сердечных сокращений >90 ударов в минуту, (iii) интенсивности дыхания >20 вздохов в минуту или на основе давления газа в крови, РаСО2 <32 мм рт.ст. (4,3 кПа) и (iv) WBC<4000 клеток/мм3 или >12000 клеток/мм3 или >10% палочкоядерных нейтрофилов. Было обнаружено, что сигнатура обеспечивала очень высокие уровни точности при различении взрослых пациентов с бактериальным сепсисом и вирусным сепсисом (значение AUC 0,97 и 0,93 для Единогласной [взрослые пациенты с бактериальным сепсисом, взрослые пациенты с вирусным сепсисом] и Мажоритарной [взрослые пациенты с бактериальным сепсисом, взрослые пациенты с вирусным сепсисом] группы, соответственно). Данные результаты демонстрируют применимость сигнатуры при различении взрослых пациентов с бактериальным сепсисом и взрослых пациентов с вирусными инфекциями.
Figure 00000017
Стратификация пациентов с бактериальным заболеванием и пациентов без бактериального заболевания: Излишнее применение антибиотиков обычно возникает вследствие применения данных лекарственных средств для лечения пациентов с небактериальным (вирусным или неинфекционным) заболеванием или вследствие поздней или отсутствующей диагностики бактериальных инфекций.
Таким образом, авторы настоящего изобретения дополнительно проанализировали эффективность сигнатуры в плане различения пациентов с бактериальным и небактериальным заболеванием. Всю Мажоритарную группу подвергли анализу с применением перекрестной проверки с исключением 10%, что привело к получению значения AUC 0,94±0,.02. Повышенные значения эффективности были продемонстрированы при оценке Единогласной группы (AUC 0,96±0,02) и после исключения пациентов с промежуточной иммунной реакцией (Таблица 7).
Таблица 7. Измерения точности сигнатуры при различении пациентов с бактериальным заболеванием и пациентов с небактериальным (вирусным и неинфекционным) заболеванием. А. Величины эффективности и их 95% доверительные интервалы получали с применением перекрестной провереи с исключением 10% у всех пациентов из Единогласной (n Бакт. =256, n Небакт. =383) и Мажоритарной (n Бакт. =319, n Небакт. =446) группы. В. Анализ повторяли после исключения пациентов с промежуточной имунной реакцией (Единогласная группа (n Бакт. =237, n Небакт. =343, n Промеж.. =59) и Мажоритарная группа [n Бакт. =292, n Небакт. =387, n Промеж.. =86]), что соответствует вероятному способу применения сигнатуры лечащими врачами.
Figure 00000018
Стабильность белков при различных температурах может влиять на эффективность анализа: Применимость биомаркера зависит от его стабильности в рамках реальных клинических условий (например, скорости его разложения при 20 хранении образца при комнатной температуре перед измерением уровня аналита). Для решения данной проблемы авторы анализировали стабильность TRAIL, CRP и IP-10 в образцах сыворотки от четырех независимых субъектов в течение 24 часов при 4°C и 25°C. Аликвоты по 100 мкл из каждого образца сыворотки переносили с помощью пипетки в 0,2 мл пробирки и хранили при 4°C или 25°C в течение от 0 до 24 часов. Далее измеряли уровни аналитов (в различные моменты времени для одних и тех же аналитов с применением того же планшета и реагентов). Для TRAIL, CRP и IP-10 время полужизни аналитов при 4°C и 25°C составляло более 72 часов (Фиг. 15А-С). Следует отметить, что в рамках реальных клинических условий в случае хранения образцов при комнатной температуре концентрации TRAIL, IP-10 и CRP должны быть измерены в течение примерно 24 часов после получения образца. Предпочтительно они должны быть измерены в течение 5 часов, 4 часов, 3 часов, 2 часов, 1 часа или даже немедленно после получения образца. Альтернативно, образец должен храниться при температуре ниже 10°C, после чего TRAIL может быть измерен в течение более чем 24 часов после получения образца.
Комбинация из трех белков является более эффективной, чем любой отдельный белок и пары белков: Комбинация трех белков является более эффективной, чем отдельные белки и пары белков при различении бактериальных и вирусных заболеваний, и инфекционных и неинфекционных заболеваний.
Figure 00000019
Анализ эффективности в виде функции распространенности бактериальных инфекций: Распространенность бактериальных и вирусных инфекций зависит от окружающих условий. Например, ожидается, что в зимний период педиатр у амбулаторных больных будет сталкиваться с существенно большим количеством случаев вирусных инфекций, чем лечащий врач в рамках больничного отделения внутренней медицины в летний период. Следует отметить, что некоторые меры диагностической точности, такие как AUC, чувствительность и специфичность, являются инвариантными в плане лежащей в основе распространенности, в то время как меры точности, такие как PPV и NPV, являются зависящими от распространенности. В данном разделе приведен обзор ожидаемой эффективности сигнатуры в плане PPV и NPV в клинических условиях с различной распространенностью бактериальных и вирусных инфекций.
В качестве базиса для данного анализа применяли меры точности сигнатуры, которые получали с применением Единогласной (бактериальное заболевание, вирусное заболевание) и Мажоритарной (бактериальное заболевание, вирусное заболевание) группы. Распространенность бактериальных инфекций в Единогласной группе составляла 51,7% с получением PPV в размере 93%±3% и NPV в размере 93%±3%. Распространенность бактериальных инфекций в Мажоритарной группе составляла 48,7% с получением PPV в размере 89%±3% и NPV в размере 92%±3%.
Измеренную чувствительность и специфичность применяли для вычисления ожидаемых изменений в плане PPV и NPV сигнатуры в виде функции распространенности бактериальных инфекций (Фиг. 14А-В).
Примеры различных клинических условий и экстраполированные значения PPV и NPV сигнатуры для каждого из них приведены в Таблице 10А.
Figure 00000020
*Средняя ежегодная распространенность. Оценки распространенности бактериальной инфекции основаны на данных, полученных их главы о бактериальной этиологии. 7-я часть учебника Internal Medicine, Harrison, 17-е изд.
Сигнатура превосходит стандартные лабораторные и клинические параметры при диагностике бактериальных и вирусных инфекций: Стандартные лабораторные и клинические параметры, некоторые из которых традиционно применяются в клинической практике для облегчения определения дифференциального диагноза источника инфекции, анализировали у Мажоритарной группы (бактериальное заболевание, вирусное заболевание, неинфекционное заболевание, n=765). Проанализированные параметры включают ANC, % нейтрофилов, % лимфоцитов, WBC и максимальную температуру. В соответствии с хорошо известной клинической ролью данных параметров авторы наблюдали статистически значимое различие в их уровнях между пациентами с бактериальным заболеванием и вирусным заболеванием (Фиг. 15А-Е). Например, пациенты с бактериальным заболеванием имели повышенные уровни ANC (Р<10-24) и WBC (Р<10-10), в то время как пациенты с вирусным заболеванием имели более высокий уровень % лимфоцитов (Р<10-31). Сигнатура являлась значительно более точной, чем любой из отдельных признаков (Р<10-18) и их комбинации (Р<10-15) (см. Фиг. 3А).
Сигнатура превосходит белковые биомаркеры с хорошо известной иммунологической ролью: Сигнатура превзошла все клинические параметры и 600 белков, которые анализировали на этапе скрининга (см. Фиг. 3А-В). В приведенном ниже разделе сигнатура дополнительно сравнивается с выбранными белками, которые традиционно применяются в рамках клинических условий или которые имеют иммунологическую роль.
Одним из наиболее широко применяемых и полезных белковых биомаркеров для различения сепсиса и других неинфекционных случаев SIRS у критически больных пациентов является прокальцитонин (РСТ). Возможность применения РСТ для различения местных бактериальных и вирусных инфекций является менее очевидной. Для анализа этого авторы измеряли концентрации РСТ у 76 произвольно выбранных пациентов из Единогласной (бактериальное заболевание, вирусное заболевание) группы (nБакт.=39, nВирусн.=37) и 101 произвольно выбранных пациентов из Мажоритарной (бактериальное заболевание, вирусное заболевание) группы (nБакт.=51, nВирусн.=50) и сравнивали диагностическую точность на основе уровней РСТ с точностью сигнатуры. Точность РСТ вычисляли с применением стандартных пороговых значений, которые обычно применяют в рамках клинических условий (0,1 нг/мл, 0,25 нг/мл, 0,5 нг/мл и 1 нг/мл).19-23 Максимальная чувствительность РСТ в размере 69% достигалась при пороговом значении 0,1 мг/мл и проводила к получению величины специфичности 62% (для Единогласной [бактериальное заболевание, вирусное заболевание] группы). Для той же группы сигнатура показывала значительно более высокую чувствительность в размере 94% (Р<0,001) и специфичность в размере 93% {Р<0,001) (Фиг. 16А). Сравнение с применением пациентов из Мажоритарной (бактериальной, вирусной) группы показало аналогичные результаты (Фиг. 16 В).
В целом, несмотря на высокую диагностическую и прогностическую ценность в плане детектирования сепсиса у критически больных пациентов, результаты авторов показывают, что РСТ является мене точным при различении пациентов с местными инфекциями (бактериальными инфекциями по сравнению с вирусными инфекциями).
Другой белковый биомаркер, применяемый в рамках клинических условий, представляет собой С-реактивный белок (CRP), являющийся белком реакции острой фазы, уровень которого повышается при инфекциях и других воспалительных условиях. Эффективность CRP сравнивали с эффективностью сигнатуры с применением всей Единогласной (бактериальное заболевание, вирусное заболевание) и Мажоритарной (бактериальное заболевание, вирусное заболевание) групп. Точность CRP определяли с применением нескольких стандартных пороговых значении, применяемых в рамках клинических условии. 26 Максимальную чувствительность CRO в размере 92% получали при пороговом значении 20 мг/мл, что приводило к получению специфичности в размере 60% (для Единогласной [бактериальное заболевание, вирусное заболевание] группы) (Фиг. 17А). Сигнатура имела аналогичную чувствительность (94%) и значительно более высокую специфичность (93%, Р<10-9) в той же группе. Аналогичные результаты наблюдали при применении Мажоритарной (бактериальное заболевание, вирусное заболевание) группы (Фиг. 17 В). В целом, сигнатура имела аналогичную чувствительность относительно CRP при пороговом значении 20 мг/л, однако заметно более высокую специфичность в плане различения пациентов с бактериальным заболеванием и пациентов с вирусным заболеванием.
Далее анализировали дифференциальную реакцию белковых биомаркеров с хорошо известной ролью в плане реакции организма на инфекции (Таблица 10В и Фиг. 18А-Н). Каждый биомаркер тестировали, по меньшей мере, на 43 пациентах (примерно половина - с бактериальным заболеванием и примерно половина - с вирусным заболеванием), при этом если он показывал многообещающие результаты, то его подвергали дальнейшему тестированию на дополнительных пациентах (вплоть до 150).
Figure 00000021
Figure 00000022
Figure 00000023
Поскольку данные биомаркеры не имеют хорошо известного порогового значения в рамках клинических условий, авторы применяли их AUC в качестве базиса для сравнения (Фиг. 3В). Наиболее информативным биомаркером являлся TREM (AUC в размере 0,68±0,09). Точность TREM была значительно ниже, чем точность сигнатуры (Р<10-9 при сравнении двух AUC; Фиг. 3В). Данные результаты показывают, что само по себе участие белка в реакции организма н инфекцию не обязательно обеспечивает диагностическую применимость. Например, несмотря на то, что IFN-γ обладает хорошо известной ролью в плане иммунной реакции на вирусы и внутриклеточные бактерии, его короткий период полужизни (<20 часов)27 ограничивает его диагностическую применимость (поскольку его концентрация в крови сильно зависит от времени с момента возникновения инфекции).
ПРИМЕР 3
Троичный классификатор превосходит двоичный классификатор
В рамках двоичной модели классификатор тренируют путем классификации всех образцов в качестве либо "Бактериальных", либо "Небактериальных" ("Вирусные" и "Неинфекционные" входят в одну группу). В рамках троичной модели классификатор обучается различать три класса: "Бактериальные", "Вирусные" и "Неинфекционные". Вероятность вирусного заболевания и неинфекционного заболевания затем группируют вместе для получения вероятности "небактериального заболевания". Это было продемонстрировано на настоящих данных.
Оба указанных выше классификатора были проанализированы с применением перекрестной проверки с исключением 10% на рамках как Мажоритарной группы, так и Единогласной группы.
РЕЗУЛЬТАТЫ
Применение двоичного классификатора в отношении данных из Мажоритарной группы привело к получению результатов, показанных в Таблице 10C ниже:
Figure 00000024
Чувствительность классификатора в рамках Мажоритарной группы составляла 80,3%, а специфичность составляла 92,2%.
Применение полиномиального классификатора в отношении того же набора данных привело к получению следующих результатов, указанных в Таблице 10D.
Figure 00000025
Можно увидеть, что данный классификатор превосходит предыдущий как плане чувствительности, так и в плане специфичности. Чувствительность была повышена до 83,1%, а специфичность - до 93,5%.
Применение двоичного классификатора в отношении данных из Единогласной группы привело к получению результатов, показанных в Таблице 11.
Figure 00000026
Чувствительность классификатора в Единогласной группе составила 84,8%, а специфичность - 93,5%.
Применение полиномиального классификатора в отношении того же набора данных привело к получению результатов, показанных в Таблице 12.
Figure 00000027
Данный классификатор превосходит предыдущий как плане чувствительности, так и в плане специфичности. Чувствительность была повышена до 85,2%, а специфичность - до 95,0%.
В целом, троичный классификатор превосходит двоичный классификатор как в плане чувствительности, так и в плане специфичности на обоих протестированных наборах данных.
ПРИМЕР 4
Клиническая точность сигнатуры остается устойчивой даже при снижении аналитической точности
Важно проанализировать влияние повышения CV (стандартное отклонение/среднее значение) уровней белков на клиническую точность, поскольку зачастую различные измерительные устройства, в частности те, которые применяются в местах оказания помощи, показывают повышенные значения CV (что соответствует сниженной аналитической точности).
Авторы настоящего изобретения проанализировали изменение в AUC сигнатуры для различения бактериальной и вирусной инфекции в виде функции повышения CV как TRAIL, так и CRP. Это было осуществлено путем использования исходных данных пациентов из Единогласной группы и симулирования повышения CV с применением симуляций на основе метода Монте-Карло (Фиг. 19А-В). В частности, для каждой комбинации CV TRAIL и CRP каждому пациенту были присвоены 100 симулируемых измерений, при этом осуществляли повторное вычисление AUC в каждом случае. Изображено среднее значение AUC на комбинацию CV. Можно увидеть, что клиническая точность сигнатуры (в плане AUC) является устойчивой в случаях повышения технического CV. Например, повышение CV в рамках ELISA на 0, 0,24 и 0,4 приводит к снижению AUC на 0,96, 0,95 и 0,94, соответственно. Аналогичные результаты были получены при повышении CV IP-10 и повторении симуляций на Мажоритарной группе.
Данный результат может быть объяснен применением множества биомаркеров, которые компенсируют влияние друг друга. Данное удивительное открытие является полезным, так как оно открывает способ осуществления измерений белков с применением дешевых и быстрых технологий (таких как технологии, используемые в местах оказания медицинской помощи), которые зачастую демонстрируют сниженную аналитическую чувствительность (по сравнению с автоматизированными иммуноанализами или ELISA), без утраты клинической точности.
ПРИМЕР 5
Для измерения уровней TRAIL и IP-10 могут применяться различные протоколы ELISA, которые будут приводить к получению различных соотношений сигнал/шум и, соответственно, различных значений измеряемых концентраций. Более конкретно, в то время как общий тренд величин показателей биомаркеров будет сохраняться вне зависимости от протокола (например, TRAIL повышается при вирусных инфекциях и снижается при бактериальных инфекциях), измерительная шкала является зависимой от протокола. В нижеследующих подразделах описаны примеры протоколов, которые приводят к получению различных значений измеряемых концентраций IP-10 и TRAIL.
Измерения уровней растворимого IP-10 и TRAIL с применением ELISA - Протокол №1: Для определения концентраций растворимого IP-10 и TRAIL в образцах плазмы и сыворотки человека применяли стандартный "сэндвич"-анализ ELISA. Кратко, лунки 96-луночного планшета покрывали иммобилизованным антителом, являющимся специфичным по отношению к TRAIL и IP-10, и разводили в буфере для иммобилизации (например, 1×PBS) с последующим инкубированием в течение ночи при 4°C.Лунки дважды промывали промывочным буфером (например, 1×PBS с 0,2% Твин-20) и далее блокировали блокирующим буфером, содержащим белки (например, 1×PBS с 0,2% Твин-20 и 5% обезжиренным молоком) в течение, по меньшей мере, 2 часов при комнатной температуре или в течение ночи при 4°C. Затем лунки дважды промывали промывочным буфером. Белковые стандарты и образцы плазмы или сыворотки инкубировали в течение двух часов при комнатной температуре. Затем лунки промывали три раза промывочным буфером и далее инкубировали с конъюгированным с пероксидазой хрена детектирующим антителом, являющимся специфичным по отношению к TRAIL и IP-10, и разводили в блокирующем буфере в течение двух часов при комнатной температуре.
Лунки промывали четыре раза промывочным буфером и инкубировали с реакционным раствором, который содержал субстрат на основе пероксидазы хрена (например, ТМВ; 3, 3', 5,5'-тетраметилбензидин). После достаточного проявления цвета в каждую лунку добавляли останавливающий раствор. Адсорбцию продукта реакции с пероксидазой хрена при 450 нм определяли с применением стандартного спектрофотометра. Данный протокол занимал 5 (TRAIL) и 4,75 (IP-10) часов, соответственно, и называется здесь "медленным протоколом".
Измерения уровней растворимого IP-10 и TRAIL с применением ELISA - Протокол №2:
Сниженное время проведения анализа обеспечивает повышенную клиническую применимость. Для дальнейшего снижения времени проведения протокола протокол оптимизировали для измерения TRAIL и IP-10 и снижения продолжительности до менее чем 100 минут. Быстрый протокол осуществляли следующим образом:
50 мкл аналитического разбавителя и 50 мкл стандартов добавляли в образцы или контроли в расчете на одну лунку. Реакцию инкубировали в течение 30 минут при комнатной температуре на горизонтальном орбитальном шейкере для микропланшетов (орбита 3 мм) при 550 об/мин. Затем каждую лунку подвергали аспирации и промывали четыре раза с применением промывочного буфера. Затем в каждую лунку добавляли 200 мкл конъюгата и инкубировали реакции в течение 45 минут при комнатной температуре на шейкере. Лунки промывали четыре раза промывочным буфером и инкубировали с реакционным раствором, который содержал субстрат на основе пероксидазы хрена (например, ТМВ; 3, 3', 5,5'-тетраметилбензидин). Спустя 10-25 минут в каждую лунку добавляли останавливающий раствор. Адсорбцию продукта реакции с пероксидазой хрена при 450 нм определяли с применением стандартного спектрофотометра. Данный протокол занимал 99 (TRAIL) и 85 (IP-10) минут, соответственно, и называется здесь "быстрым протоколом".
Измерения, сделанные в рамках медленного и быстрого протокола, сравнивали с применением 357 образцов для TRAIL и 189 образцов для IP-10, при этом они показывали значительно коррелирующие результаты (Фиг. 30А-В).
Следует отметить, что средняя концентрация TRAIL, полученная с применением быстрого протокола, была приблизительно на 70 процентов меньше, чем концентрация, полученная с применением медленного протокола. Подобные изменения в плане измеряемых концентраций белков среди различных протоколов часто возникают и могут быть компенсированы путем коррелирования результатов измерений с применением двух протоколов и вычисления трансформационной функции. Например, трансформационная функция у_медл.=0,709 × у_быстр. - 3е-12 может применяться для перевода концентраций, полученных в рамках быстрого протокола и медленного протокола. Данный перевод обеспечивает сохранение точности TRAIL. Специалистом в данной области могут быть разработаны и другие функции и протоколы для перевода, которые также обеспечивают сохранение точности. В целом, поведение TRAIL остается одинаковым в рамках обоих протоколов (то есть наиболее высокие уровни при вирусном заболевании, более низкие уровни при неинфекционном заболевании и самые низки при бактериальном заболевании) несмотря на различие в плане вычисленных концентраций.
Различные протоколы и группы ведут к различным коэффициентам модели:
В Таблице 13 приведен пример коэффициентов полиномиальной логистической модели, полученных у пациентов из Мажоритарной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом:
Figure 00000028
В Таблице 14 приведен пример коэффициентов полиномиальной логистической модели, полученных у пациентов из Единогласной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом:
Figure 00000029
Поскольку частота подгрупп в рамках группы пациентов отклоняется от предполагаемой частоты в общей популяции, является возможным провести дальнейгую корректировку коэффициентов модели для отражения предварительно определенного предыдущего значения вероятности с применением стандартных способов корректирования коэффициентов (например, см. G. King and L Zeng, Statistics in Medicine 2002). Например, следующие примеры показывают коэффициенты полиномиальной логистической модели, полученных у пациентов из Мажоритарной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом, что соответствует предыдущему значению 45% вероятности бактериального заболевания, 45% вероятности вирусного заболевания и 10% вероятности неинфекционного заболевания.
Коэффициенты модели (при тренировке на данных из Мажоритарной группы) после предыдущей корректировки приведены в Таблице 15:
Figure 00000030
Коэффициенты модели (при тренировке на данных из Единогласной группы) после предыдущей корректировки приведены в Таблице 16.
Figure 00000031
Следует отметить, что для получения аналогичных результатов могут быть выбраны другие комбинации коэффициентов, как будет очевидно для специалиста в данной области. Другие протоколы измерения уровней белков, которые влияют на концентрации подвергаемых измерению белков будут приводить к получению иных коэффициентов модели. Например, в рамках быстрого протокола для измерения TRAIL вычисляемые концентрации снижаются приблизительно до 70% концентраций, вычисленных в рамках медленного протокола. Таким образом, одним способом корректировки с учетом этого факта является изменение коэффициентов модели TRAIL для учета данного изменения. Другой способ заключается в разделении полученных в рамках быстрого протокола уровней TRAIL на 70% и их применение в рамках указанных выше моделей, которые были разработаны для медленного протокола.
Часто является предпочтительным применение логарифмического преобразования значений уровней белков для повышения точности модели и калибровки (то есть лучшего соответствия с учетом прогнозируемого риска определенной инфекции и наблюдаемого риска).
Пример модели с логарифмическим преобразованием уровней TRAIL и IP-10 указан в Таблице 17 (модель тренировали на Единогласной группе):
Figure 00000032
ПРИМЕР 6
Параметризация гиперповерхности
С учетом концентраций CRP [С], TRAIL [Т] и IP-10 [Р] определено следующее:
δ0=-1,299+0,0605 × [С]+0,0053 × [Р]+0,0088 × [Т]
δ1=-0,378+0,0875 × [С]+0,0050 × [Р] - 0,0201 × [Т]
Затем значения вероятностей могут быть вычислены следующим образом:
Figure 00000033
Figure 00000034
Figure 00000035
Определим гиперповерхность в [С], [Т], [Р] пространстве
Figure 00000036
которая применяется для различения пациентов с бактериальным заболеванием и небактериальным заболеванием в одном предпочтительном варианте осуществления изобретения. В других предпочтительных вариантах осуществления изобретения на основе значений пациента [С], [Т], [Р] его классифицируют как имеющего бактериальное заболевание, если
Figure 00000037
, иначе его/ее классифицируют в качестве не имеющего (не имеющей) бактериального заболевания.
Авторы определили набор всех гиперплоскостей, которые могут применяться для различения бактериальных и небактериальных инфекций в виде результатов, расположенных на следующих двух гиперповерхностях:
Figure 00000038
Figure 00000039
1 может представлять собой любое число от 0 до 1-. В некоторых предпочтительных вариантах осуществления ∈1 составляет менее 0,5, 0,4, 0,3, 0,2 или 0,1.
0 может представлять собой любое число от 0 до ω. В некоторых предпочтительных вариантах осуществления ∈0 составляет менее 0,5, 0,4, 0,3, 0,2 или 0,1.
Иллюстрированные примеры поверхностей приведены в Примере 7.
ПРИМЕР 7 Графическое представление классификации
Фиг. 20 представляет собой трехмерную визуализацию пациентов с бактериальным заболеванием ('+'), вирусным заболеванием ('о') и неинфекционным заболеванием ('^'). Разные типы пациентов нанесены на различные участки на карте концентрации CRP (мкг/мл), TRAIL и IP-10 (пг/мл).
В качестве примера были получены поверхности со значениями вероятностей с применением полиномиальной логистической регрессии. Контурные диаграммы поверхностей показаны на Фиг. 21А-28С в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10. На Фиг. 21А, 22А, 23А, 24А, 25А, 26А, 27А, 28А показаны вероятности наличия вирусных инфекций, на Фиг. 21В, 22В, 23В, 24В, 25В, 26В, 27В, 28В показаны вероятности наличия бактериальных или смешанных инфекций, а на Фиг. 21С, 22С, 23С, 24С, 25С, 26С, 27С, 28С показаны вероятности наличия неинфекционных заболеваний или здоровые субъекты. Фиг. 21А-С соответствуют IP-10 в диапазоне от 0 до 100 пг, Фиг. 22А-С соответствуют IP-10 в диапазоне от 100 до 200 пг, Фиг. 23А-С соответствуют IP-10 в диапазоне от 200 до 300 пг, Фиг. 24А-С соответствуют IP-10 в диапазоне от 300 до 400 пг, Фиг. 25А-С соответствуют IP-10 в диапазоне от 400 до 500 пг, Фиг. 26А-С соответствуют IP-10 в диапазоне от 500 до 1000 пг, Фиг. 27А-С соответствуют IP-10 в диапазоне от 1000 до 2000 пг и Фиг. 28А-С соответствуют IP-10 в диапазоне от 2000 пг и выше.
Пациенты с бактериальной или смешанной инфекцией отмечены в виде '+'; с вирусной инфекцией - в виде 'о', а с неинфекционным заболеванием или здоровые - в виде '^'. Можно увидеть, что низкие уровни IP-10 ассоциированы с неинфекционным заболеванием, более высокие уровни - с бактериальным заболеванием, а самые высокие - с вирусным заболеванием. Низкие уровни TRAIL ассоциированы с бактериальными инфекциями, более высокие уровни - с неинфекционным заболеванием или здоровыми субъектами, а самые высокие - с вирусным заболеванием. Низкие уровни CRP ассоциированы с неинфекционным заболеванием и здоровыми субъектами, более высокие - с вирусной инфекцией, а самые высокие - с бактериальной инфекцией. Комбинация из трех белков позволяет получать функцию вероятности, чья диагностическая эффективность превосходит любой из отдельных белков или пар белков.
Фиг. 35А-D представляют собой контурные диаграммы, описывающие вероятность наличия заболевания бактериальной (Фиг. 35А), вирусной (Фиг. 35В), небактериальной (Фиг. 35С) и неинфекционной (Фиг. 35D) этиологии в виде функции координат δ0 и δ1. Значения вероятности лежат в диапазоне от 0% (черные) до 100% (белые).
ПРИМЕР 8
Примеры протоколов для измерения уровней экспрессии
В целом, без ограничения, значение экспрессии TRAIL может быть измерено с применением ELISA или автоматизированного иммуноанализа; значение экспрессии IP-10 может быть измерено с применением анализа ELISA; а значение экспрессии CRP может быть измерено с применением ELISA или автоматизированного иммуноанализа. Значение экспрессии CRP также может быть измерено с применением функционального анализа, основанного на его кальцийзависимом связывании с фосфорилхолином.
Протокол А;
Подходящий протокол для измерения значения экспрессии TRAIL
(a) иммобилизация TRAIL, присутствующего в образце, с применением антитела на твердой подложке;
(b) контактирование иммобилизованного TRAIL со вторым антителом, которое специфично связывается с TRAIL; и
(c) количественный анализ антитела, которое связалось с иммобилизованным TRAIL.
Подходящий протокол для измерения значения экспрессии IP-10
(a) иммобилизация IP-10, присутствующего в образце, с применением иммобилизованного антитела на твердой подложке;
(b) контактирование иммобилизованного IP-10 со вторым антителом, которое специфически связывается с IP-10; и
(c) количественный анализ антитела, которое связалось с иммобилизованным IP-10.
Подходящий протокол для измерения значения экспрессии CRP
(а) иммобилизация CRP, присутствующего в образце, с применением иммобилизованного антитела на твердой подложке;
(b) контактирование иммобилизованного CRP со вторым антителом, которое специфически связывается с CRP; и
(c) количественный анализ антитела, которое связалось с иммобилизованным CRP.
Протокол В;
Подходящий протокол для измерения значения экспрессии TRAIL
(a) Инкубирование образца с первым антителом, которое специфически связывается с TRAIL, при этом указанное первое антитело иммобилизовано на твердой подложке;
(b) Промывание;
(c) Добавление второго антитела, которое специфически связывается с TRAIL, при этом второе антитело конъюгировано с ферментом; промывание
(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.
Подходящий протокол для измерения значения экспрессии IP-10
(a) Инкубирование образца с первым антителом, которое специфически связывается с IP-10, при этом указанное первое антитело иммобилизовано на твердой подложке;
(b) Промывание;
(c) Добавление второго антитела, которое специфически связывается с IP-10, при этом второе антитело конъюгировано с ферментом; промывание
(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.
Подходящий протокол для измерения значения экспрессии CRP
(a) Инкубирование образца с первым антителом, которое специфически связывается с CRP, при этом указанное первое антитело иммобилизовано на твердой подложке;
(b) Промывание;
(c) Добавление второго антитела, которое специфически связывается с CRP, при этом второе антитело конъюгировано с ферментом; промывание
(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.
Протокол С:
Подходящий протокол для измерения значения экспрессии CRP
(a) измерение помутнения смеси липидов;
(b) контактирование образца с известным количеством липидов (предпочтительно фосфорилхолина) в присутствии кальция; и
(c) измерение помутнения раствора, при этом повышение помутнения коррелирует с количеством CRP.
ПРИМЕР 9
Подробное описание ELISA для анализа количества TRAIL и IP-10
Сбор и хранение образцов: Подвергание образцов действию комнатной температуры должно быть минимизировано (менее 6 часов). Применяли пробирку для отделения сыворотки (SST) и оставляли образцы для образования сгустков в течение, по меньше мере, 30 минут после центрифугирования (5 минут при 1200 × g). Сыворотка может быть проанализирована немедленно или подвергнута аликвотированию и хранению при 4-8°C в течение времени до 24 часов или при ≤-20°C в течение времени до 3 месяцев. Повторных циклов замораживания и оттаивания следует избегать.
Подготовка реагентов: Все реагенты должны быть доведены до комнатной температуры перед применением.
Субстратный раствор: Цветные реагенты А и В должны быть смешаны вместе в равных объемах в рамках 10 минут перед применением. Следует обеспечивать защиту от света.
QC-1V, QC-2B и стандарты: Следует разморозить все QC и стандарты и удалить 150 мкл из каждого флакона в отдельную промаркированную полипропиленовую тестовую пробирку. После применения следует немедленно поместить их обратно под действие температуры -20°C.
Измерения TRAIL:
Материалы, применяемые для анализа TRAIL, указаны в Таблице 18 ниже.
Figure 00000040
Процедура ELISA TRAIL
a) Подготовить образцы, реагенты и стандарты, как указано выше.
b) Удалить избыточные стрипы с рамки планшета, положить их обратно в пакет из фольги, содержащий водопоглотитель, и закрыть.
c) Добавить 50 мкл аналитического разбавителя MM1S в каждую лунку.
d) Добавить 50 мкл стандарта, образцов или QC в каждую лунку. Накрыть сверху адгезивным стрипом.
e) Инкубировать в течение 30 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.
f) Подвергнуть каждую лунку аспирации и промыть; повторить процесс 4 раза. Промыть путем заполнения каждой лунки промывочным буфером (300 мкл).
После последнего промывания удалить любой оставшийся промывочный буфер с помощью аспирации или декантации. Перевернуть планшет и осуществить блоттинг с использованием чистых бумажных полотенец.
g) Добавить 200 мкл конъюгата TRAIL в каждую лунку. Накрыть новым адгезивным стрипом. Инкубировать в течение 45 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.
h) Повторить аспирацию/промывание как на стадии (g).
i) Добавить 200 мкл субстратного раствора в каждую лунку. Инкубировать в течение от 24 до 30 минут при комнатной температуре. Обеспечить защиту от света.
j) Добавить 20 мкл раствора для остановки в каждую лунку. Цвет в лунках должен измениться с синего на желтый. Если цвет в лунках является зеленым или изменение цвета не является равномерным, следует осторожно постучать по планшету для обеспечения тщательного смешивания.
k) Немедленно определить оптическую плотность каждой лунки с применением сканера для микропланшетов, настроенного на 450 нм. Установить величину корректировки длины волны на 570 нм, что будет обеспечивать корректировку оптических изъянов в планшете.
Вычисление концентраций TRAIL: Усреднить дублированные показания для каждого образца и вычесть оптическую плотность нулевого стандарта (O.D.). Создать стандартную кривую путем нанесения средней величины адсорбции для каждого стандарта (ось y) относительно концентрации (ось x) и построить аппроксимированную линейную кривую. Минимальное значение r2 не должно падать ниже 0,96. В случае наличия более низких значений r2 следует повторить эксперимент для получения надежных результатов.
Прецизионность: Прецизионность оценивали на основе руководств ЕР05-А2 Института клинических и лабораторных стандартов США (CLSI) (бывш. Национальный комитет по клиническим лабораторным стандартам США, NCCLS). Для анализа прецизионности применяли три образца с низкими (11,4 пг/мл), промежуточными (58,8 пг/мл) и высокими (539,9 пг/мл) физиологическими концентрациями. Результаты приведены в Таблице 19, где Sr представляет собой межсерийную прецизионность, a ST представляет собой межлабораторную прецизионность:
Figure 00000041
Степень извлечения: Степень извлечения оценивали путем добавления трех уровней рекомбинантного TRAIL человека (250, 125 и 62,5 пг/мл) к 5 образцам сыворотки человека без детектируемых уровней TRAIL. Затем измеряли и вычисляли подвергнутые добавлению значения и среднюю степень извлечения, как показано в Таблице 20 ниже.
Figure 00000042
Линейность: Для анализа линейности исследования пять клинических образцов, содержащих высокие концентрации TRAIL, подвергали последовательному разбавлению с применением заменителя сыворотки для получения образцов со значениями в рамках физиологического диапазона исследования. Линейность в среднем составляла 97%, 100%) и 105% для 1:2, 1:4 и 1:8 разбавлений, соответственно, как указано в Таблице 21 ниже.
Figure 00000043
Чувствительность: Для анализа Предела измерения холостого образца (Limitation of Blank, LOB) авторы протестировали 72 холостых образца заменителя сыворотки. Среднее значение холостых образцов составляло 0,78 пг/мл, а стандартное отклонение составляло 1,39 пг/мл. Таким образом, вычисленный LOB составлял 3,07 пг/мл.
Для анализа Предела обнаружения (Limitation of Detection, LOD) следовали руководствам CLSI ЕР17-А. Кратко, было охарактеризовано распределение результатов вокруг семи предварительно определенных концентраций, каждой из которых соответствовали 30 независимых результатов (всего 210 результатов), с получением значения LOD 10 пг/мл.
Калибровка: В рамках данного иммуноанализа проводили калибровку относительно очищенного экспрессированного NS0 рекомбинантного TRAIL человека.
Ожидаемые значения: Образцы, полученные от очевидно здорового взрослого субъекта (в возрасте >18 лет), подвергали анализу на наличие TRAIL. Значения диапазона и средний величины приведены в Таблице 22.
Figure 00000044
Figure 00000045
Перекрестная реактивность и интерференция: Данный анализ обеспечивает различение естественного и рекомбинантного TRAIL человека. Факторы 4-1 ВВ лиганд, APRIL, BAFF/BLyS, CD27 лиганд, CD30 лиганд, CD40 лиганд, Fas лиганд, GITR лиганд, LIGHT, LT α1/β2,LT α2/β1,OPG,OX40 лиганд, TNF-α, TNF-β, TRAIL R3, TRAIL R4, TRANCE и TWEAK получали в количестве 5 50 нг/мл в заменителе сыворотки и анализировали на перекрестную реактивность. Дополнительно, препараты на основе данных факторов в количестве 50 пг/мл в контроле на основе рекомбинантного TRAIL человека среднего диапазона тестировали на интерференцию. Значительная перекрестная реактивность или интерференция не наблюдалась.
Измерения уровня IP-10: Материалы, применяемые для анализа IP-10, указаны в Таблице 23 ниже.
Figure 00000046
Процедура ELISA IP-10
a) Подготовить образцы, реагенты и стандарты, как указано выше.
b) Удалить избыточные стрипы с рамки планшета, положить их обратно в пакет из фольги, содержащий водопоглотитель, и закрыть.
c) Добавить 50 мкл аналитического разбавителя ММ56 в каждую лунку.
d) Добавить 50 мкл стандарта, образцов или QC в каждую лунку. Накрыть сверху адгезивным стрипом.
e) Инкубировать в течение 30 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.
f) Подвергнуть каждую лунку аспирации и промыть; повторить процесс 4 раза. Промыть путем заполнения каждой лунки промывочным буфером (300 мкл). После последнего промывания удалить любой оставшийся промывочный буфер с помощью аспирации или декантации. Перевернуть планшет и осуществить блоттинг с использованием чистых бумажных полотенец.
g) Добавить 200 мкл конъюгата IP-10 в каждую лунку. Накрыть новым адгезивным стрипом. Инкубировать в течение 45 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.
h) Повторить аспирацию/промывание как на стадии (g).
i) Добавить 200 мкл субстратного раствора в каждую лунку. Инкубировать в течение 10 минут при комнатной температуре. Обеспечить защиту от света.
j) Добавить 50 мкл раствора для остановки в каждую лунку. Цвет в лунках должен измениться с синего на желтый. Если цвет в лунках является зеленым или изменение цвета не является равномерным, следует осторожно постучать по планшету для обеспечения тщательного смешивания.
k) Немедленно определить оптическую плотность каждой лунки с применением сканера для микропланшетов, настроенного на 450 нм.
Установить величину корректировки длины волны на 570 нм, что будет обеспечивать корректировку оптических изъянов в планшете.
Вычисление концентраций IP-10: Усреднить дублированные показания для каждого образца и вычесть оптическую плотность нулевого стандарта (O.D.). Создать стандартную кривую путем нанесения средней величины адсорбции для каждого стандарта (ось y) относительно концентрации (ось x) и построить аппроксимированную линейную кривую. Минимальное значение r2 не должно падать ниже 0,96. В случае наличия более низких значений r2 следует повторить эксперимент для получения надежных результатов.
Прецизионность: Прецизионность оценивали на основе руководств ЕР05-А2 Института клинических и лабораторных стандартов США (CLSI) (бывш. Национальный комитет по клиническим лабораторным стандартам США, NCCLS). Для анализа прецизионности применяли три образца с низкими (69,4 пг/мл), промежуточными (228,2 пг/мл) и высокими (641,5 пг/мл) физиологическими концентрациями. Результаты приведены в Таблице 24, где Sr представляет собой межсерийную прецизионность, a ST представляет собой межлабораторную прецизионность:
Figure 00000047
Степень извлечения: Степень извлечения оценивали путем добавления трех уровней IP-10 человека, 500, 250 и 125 пг/мл, к 5 образцам сыворотки человека без детектируемых уровней IP-10. Затем измеряли и вычисляли подвергнутые добавлению значения и среднюю степень извлечения, как показано в Таблице 25 ниже.
Figure 00000048
Линейность: Для анализа линейности анализа IP-10 пять клинических образцов, содержащих высокие концентрации IP-10 в диапазоне от 873,7 до 1110,4 пг/мл, подвергали последовательному разбавлению с применением заменителя сыворотки для получения образцов со значениями в рамках физиологического диапазона исследования. Линейность в среднем составляла 98%, 102%) и 104%) для 1:2, 1:4 и 1:8 разбавлений, соответственно, как указано в Таблице 26 ниже.
Figure 00000049
Чувствительность: Для анализа Предела измерения холостого образца (Limitation of Blank, LOB) авторы протестировали 72 холостых образца заменителя сыворотки. Среднее значение холостых образцов составляло 0,23 пг/мл, а стандартное отклонение составляло 1,26 пг/мл, что приводило к получению значения LOB 2,29 пг/мл.
Для анализа Предела обнаружения (Limitation of Detection, LOD) следовали руководствам CLSI ЕР17-А. Кратко, было охарактеризовано распределение результатов вокруг семи предварительно определенных концентраций, каждой из которых соответствовали 30 независимых результатов (всего 210 результатов), с получением значения LOD 10 пг/мл.
Калибровка: В рамках данного иммуноанализа проводили калибровку относительно высокоочищенного экспрессируемого E-coli рекомбинантного IP-10 человека.
Ожидаемые значения: Образцы, полученные от очевидно здоровых добровольцев, подвергали анализу на наличие IP-10. Значения диапазона и средний величины приведены в Таблице 27 ниже.
Figure 00000050
Перекрестная реактивность и интерференция: ТДанный анализ обеспечивает различение естественного и рекомбинантного IP-10 человека. Факторы BLC/BCA-1, ENA-78, GCP-2, GROα, GROγ, IFN-γ, IL-8, I-TAC, MIG, NAP-2, SDF-1α и SDF-1β получали в количестве 50 нг/мл в заменителе сыворотки и анализировали на перекрестную реактивность. Дополнительно, препараты на основе данных факторов в количестве 50 пг/мл в контроле на основе рекомбинантного IP-10 человека среднего диапазона тестировали на интерференцию. Значительная перекрестная реактивность или интерференция не наблюдалась.
ПРИМЕР 10
TRAIL И ПРОГНОЗ РАЗВИТИЯ ЗАБОЛЕВАНИЯ
Часто является полезным с клинической точки зрения проанализировать у пациентов прогноз, тяжесть заболевания и конечный исход. Авторы настоящего изобретения определили, что низкие уровни TRAIL значительно коррелируют с плохим прогнозом и конечным исходом у пациента, а также с высокой тяжестью заболевания. Например, взрослые пациенты в отделении интенсивной терапии (ICU) имели значительно более низкие уровни TRAIL по сравнению со всеми другими пациентами, которые были менее больными вне зависимости от инфекционной или неинфекционной этиологии заболевания. Медианные значения концентрации в сыворотке составляли 9 пг/мл против 80 пг, соответственно (p-значение ранговой суммы <0,001, Фиг. 36А), для тяжелобольных пациентов и остальных пациентов, соответственно.
40 пациентов детского возраста из Нидерландов в возрасте от 3 месяцев до 5 лет. Уровень TRAIL в сыворотке измеряли у 40 пациентов детского возраста из Нидерландов в возрасте от 3 месяцев до 5 лет. Было обнаружено, что пациенты, которые соответствовали критериям поступления в ICU (что являлось признаком осложнения заболевания и плохого прогноза) или даже умирали, имели значительно более низкие концентрации TRAIL в сыворотке по сравнению с остальными пациентами (медиана 11 против 85, соответственно, P-значение ранговой суммы Р<0,001), как изображено на Фиг. 36В. Удивительно, что наиболее низкие уровни TRAIL (<5 пг/мл) определяли только у двух детей из всей группы, которые умерли. Данные результаты свидетельствуют о том, что TRAIL может применяться в качестве прогностического маркера для прогнозирования тяжести заболевания и конечного исхода.
ПРИМЕР 11
TRAIL - ПАРАМЕТРЫ ВОЗРАСТА И ПОЛА
Базальные уровни TRAIL у здоровых субъектов или пациентов с неинфекционным заболеванием являются более низкими у женщин по сравнению с мужчинами в рамках детородного возраста (P-значение t-теста<0,001) (см. Фиг. 37А), однако не различаются в рамках пре- или пост-детородного возраста (Р-значение t-теста=0,9, Фиг. 37А). Данный тренд не наблюдался у пациентов с инфекционным заболеванием.
ПРИМЕР 12
Примеры многообразий, гиперплоскостей и координат
Одномерное многообразие
Если n=1, то многообразие S представляет собой кривую, а гиперплоскость π представляет собой ось, образующую одно направление δ 1. Координата δ1 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию b0+b1D1+b2D2+… полипептидов D1, D2 и так далее.
В Таблице 28 ниже перечислены показатели диагностической эффективности (в виде AUC), достигнутые при n=1. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на группе, указанной в каждой строке. В строках 1-4 анализируемые субъекты имели либо бактериальные или вирусные инфекции и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 5-8 анализируемые субъекты имели либо инфекционные или неинфекционные заболевания и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел инфекционное заболевание. В строках 10-12 анализируемые субъекты имели бактериальную или небактериальную инфекцию и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 1-4 столбцы Р и N соответствуют количеству пациентов с бактериальным и вирусным заболеванием, соответственно, в строках 5-8 столбцы Р и N соответствуют количеству пациентов с инфекционным и неинфекционным заболеванием, соответственно, а в строках 9-12 столбцы Р и N соответствуют количеству пациентов с бактериальным и небактериальным заболеванием, соответственно. "Мажоритарная" и "Единогласная" указывают на тип группы, в рамках которой была проверена модель.
Figure 00000051
В Таблице 29 ниже перечислены коэффициенты b0, b1, b2 и так далее, которые применяли для определения координаты δ1, для каждого из 12 случаев, перечисленных в Таблице 28, соответственно. Первый коэффициент слева представляет собой b0 и затем слева направо указаны коэффициенты, соответствующие порядку полипептидов в каждой строке Таблицы 28. Коэффициенты соответствуют следующим показателям концентрации для каждого полипептида: TRAIL (пг/мл), IP-10 (пг/мл) и CRP (мкг/мл).
Для указанного набора полипептидов полученные коэффициенты обладают небольшими вариациями среди разных групп. Тем не менее, коэффициенты для функций вероятностной классификации и координаты в рамках настоящих вариантов осуществления изобретения предпочтительно соответствуют тем, которые были получены для Мажоритарной группы.
Figure 00000052
В Таблице 30 ниже перечислены показатели диагностической эффективности (в AUC), полученные для одномерного многообразия. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на Мажоритарной группе. В строках 1-55 анализируемые субъекты имели либо бактериальные или вирусные инфекции, а функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 56-110 анализируемые субъекты имели либо инфекционные или неинфекционные заболевания, а функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел инфекционное заболевание. В строках 1-55 столбцы Р и N соответствуют количеству пациентов с бактериальным и вирусным заболеванием, соответственно, а в строках 56-110 столбцы Р и N соответствуют количеству пациентов с инфекционным и неинфекционным заболеванием, соответственно.
Figure 00000053
Figure 00000054
Figure 00000055
В Таблице 31 ниже перечислены коэффициенты b0, b1, b2 и так далее, которые применяли для определения координаты δ1, для каждого из 110 случаев, перечисленных в Таблице 30, соответственно. Первый коэффициент слева представляет собой b0 и затем слева направо указаны коэффициенты, соответствующие порядку полипептидов в каждой строке Таблицы 30.
Коэффициенты соответствуют следующим показателям концентрации для каждого полипептида: TRAIL (пг/мл), IP-10 (пг/мл), CRP (мкг/мл), РСТ (нг/мл), SAA (г/мл) и IL1ra (г/мл).
Figure 00000056
Figure 00000057
Figure 00000058
Двумерное многообразие
Если n=2, то многообразие S представляет собой кривую поверхность, а гиперплоскость π представляет собой плоскую плоскость, образованную первым направлением δ 0 и вторым направлением δ 1. Координата δ0 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию a0+a1D1+a2D2+… полипептидов D1, D2 и так далее; а координата δ1 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию b0+b1D1+b2D2+… полипептидов D1, D2 и так далее.
В Таблицах 32-35 ниже перечислены показатели диагностической эффективности (в AUC), полученные для случая n=2. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на подмножестве Мажоритарной группы, которое имело достаточное количество сыворотки для измерения уровней всех белков. Вычисляли координаты δ0 и δ1, таким образом что функция вероятностной классификации f(δ01) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. Значения AUC соответствуют классификациям в соответствии с условием Бактериальное заболевание/Вирусное заболевание (второй столбец справа - Б/В) и Инфекционное заболевание/Неинфекционное заболевание (самый левый столбец - И/НИ). Показаны результаты для вариантов осуществления, в рамках которых множество полипептидов включает два полипептида (Таблица 32), три полипептида (Таблица 33), четыре полипептида (Таблица 34) и пять полипептидов (Таблица 35). Для каждого полипептида указаны коэффициенты для координат δ0 и δ1, при этом "Конст." соответствует а0 при применении в отношении координаты δ0 и b0 при применении в отношении координаты δ1. Коэффициенты соответствуют следующим показателям концентрации для каждого белка: TRAIL (пг/мл), IP-10 (пг/мл), CRP (мкг/мл), РСТ (нг/мл), SAA (г/мл) и IL1ra (г/мл).
Figure 00000059
Figure 00000060
Figure 00000061
Figure 00000062
Figure 00000063
Figure 00000064
Figure 00000065
Figure 00000066
Figure 00000067
ПРИМЕР 13
Примеры координат, которые включают нелинейные функции
Авторами настоящего изобретения неожиданно было обнаружено, что включение нелинейных функций φ0 и φ1 при вычислении координат δ1 и δ2 позволяет охватывать большее количество неочевидных трендов в данных, в то же время обеспечивая сохранение вероятностного каркаса, способствующего содержательной интерпретации результатов. В данном Примере координаты δ0 и δ1 вычисляли в соответствии со следующими уравнениями:
δ001С+a2I+a3T+φ0
δ1=b0+b1C+b2I+b3T+φ1,
а нелинейные функции были определены как:
φ0=q1Cγ1+q2Cγ2+q3Tγ3
φ1=r1Cγ1+r2Cγ2+r3Tγ3.
где γ1=0.5, γ2=2 и γ3=0.5.
В Таблице 36 приведены коэффициенты и константы, используемые в рамках данного Примера.
Figure 00000068
Эффективность модели, представленной в Таблице 36, анализировали на Группе с подтвержденным микробиологическим диагнозом (AUC 0,95±0,03), Единогласной группе (AUC 0,95±0,02) и Исследуемой группе (AUC 0,93±0,02). Эффективность сигнатуры повышалась с ростом размера экивокального участка.
В Таблицах 37А-С ниже показаны меры точности сигнатуры при диагностике бактериальных и вирусных инфекций при использовании нелинейной модели настоящего Примера. Величины эффективности и их 95% доверительные интервалы были получены на Подгруппе с подтвержденным микробиологическим диагнозом (Таблица 37А; n=241), Единогласной подгруппе (Таблица 37В; n=527) и Исследуемой группе (Таблица 37С; n=653) с применением различных размеров экивокальных участков, как указано. В Таблицах 37D-F ниже показаны процентные доли пациентов в Исследуемой группе, имеющих экивокальные иммунные реакции, при использовании различных пороговых значений, а в Таблицах 37G-H ниже показана чувствительность и специфичность сигнатуры при использовании различных пороговых значений экивокальных иммунных реакций, полученных в рамках Исследуемой группы. В Таблицах 37D-H самые левые столбцы соответствуют минимальному пороговому значению экивокальной иммунной реакции, а самая верхняя строка соответствует максимальному пороговому значению экивокальной иммунной реакции.
Figure 00000069
Figure 00000070
Figure 00000071
Figure 00000072
Figure 00000073
Figure 00000074
Figure 00000075
Figure 00000076
Эффективность сигнатуры также анализировали на Исследуемой группе при исключении следующих двух подгрупп: (i) пациентов, чьи образцы крови были получены спустя более чем 3 дня лечения антибиотиком в больнице и (ii) пациентов с предполагаемым гастроэнтеритом. Сведения об эффективности модели у Группы с подтвержденным микробиологическим диагнозом (AUC 0,96±0,04), Единогласной группы (AUC 0,96±0,02) и Исследуемой группы (AUC 0,95±0,02) указаны далее в Таблицах 38А-С.
В таблицах 38А-С указаны меры точности сигнатуры в плане диагностики бактериальных и вирусных инфекций с применением нелинейной MLR модели. Анализы эффективности и их 95% доверительные интервалы получали для Подгруппы с подтвержденным микробиологическим диагнозом (Таблица 38А; n=200), Единогласной подгруппы (Таблица 38 В; n=402) и Исследуемой группы (Таблица 38С; n=491) при исключении пациентов, которые подвергались лечению антибиотиками в течение более 3 дней в больнице и/или имеющих предполагаемый гастроэнтерит.
Figure 00000077
Figure 00000078
Figure 00000079
ПРИМЕР 14
Стратификация на основе антибиотиков
Из 653 пациентов с подозрением на острую инфекцию 427 получали антибиотики (299 имели диагностированное бактериальное заболевание и 128 имели диагностированное вирусное заболевание). AUC сигнатуры для различения пациентов с бактериальной и вирусной инфекцией в рамках подгруппы пациентов, подвергаемых лечению антибиотиками, составляла 0,93±0,02. Статистически значимое различие между эффективностью у подгруппы подвергаемых лечению антибиотиками пациентов и общей группой не наблюдалось (0,94±0,02 против 0,93±0,02; Р=0,5).
Несмотря на то, что изобретение было описано в рамках определенных вариантов его осуществления, специалистам в данной области будут очевидны многие его альтернативы, модификации и вариации. Соответственно, оно предполагает охват всех подобных альтернатив, модификаций и вариаций, которые соответствуют духу и области, определенной прилагаемой формулой изобретения.
Все публикации, патенты и патентные заявки, указанные в данном описании, полностью приведены здесь для ссылки в той же степени, как если бы каждая отдельная публикация, патент или патентная заявка была явно и отдельно указана для включения для ссылки. Кроме того, цитирование или указание любой ссылки в данном описании не должно рассматриваться в качестве допущения того, что подобная ссылка является доступной в качестве уровня техники по отношению к настоящему изобретению. Заголовки разделов в их приведенном здесь виде не должны рассматриваться в качестве обязательно ограничивающих.
--->
перечень последовательностей
<110> МЕМЕД ДИАГНОСТИКС ЛТД.
ЭДЕН, Эран
ОВЕД, Кфир
НАВОН, Рой
КОЭН-ДОТАН, Ассаф
БОЙКО, Ольга
<120> ВЫЧИСЛИТЕЛЬНЫЙ АНАЛИЗ БИОЛОГИЧЕСКИХ ДАННЫХ С ПРИМЕНЕНИЕМ МНОГООБРАЗИЯ И ГИПЕРПЛОСКОСТИ
<130> 62853
<150> US 62/037,180
<151> 2014-08-14
<150> US 62/105,938
<151> 2015-01-21
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 1953
<212> DNA
<213> Homo sapiens
<400> 1
acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60
gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120
atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180
gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240
aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300
gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360
gtcaagtggc aactccgtca gctcgttaga aagatgattt tgagaacctc tgaggaaacc 420
atttctacag ttcaagaaaa gcaacaaaat atttctcccc tagtgagaga aagaggtcct 480
cagagagtag cagctcacat aactgggacc agaggaagaa gcaacacatt gtcttctcca 540
aactccaaga atgaaaaggc tctgggccgc aaaataaact cctgggaatc atcaaggagt 600
gggcattcat tcctgagcaa cttgcacttg aggaatggtg aactggtcat ccatgaaaaa 660
gggttttact acatctattc ccaaacatac tttcgatttc aggaggaaat aaaagaaaac 720
acaaagaacg acaaacaaat ggtccaatat atttacaaat acacaagtta tcctgaccct 780
atattgttga tgaaaagtgc tagaaatagt tgttggtcta aagatgcaga atatggactc 840
tattccatct atcaaggggg aatatttgag cttaaggaaa atgacagaat ttttgtttct 900
gtaacaaatg agcacttgat agacatggac catgaagcca gtttttttgg ggccttttta 960
gttggctaac tgacctggaa agaaaaagca ataacctcaa agtgactatt cagttttcag 1020
gatgatacac tatgaagatg tttcaaaaaa tctgaccaaa acaaacaaac agaaaacaga 1080
aaacaaaaaa acctctatgc aatctgagta gagcagccac aaccaaaaaa ttctacaaca 1140
cacactgttc tgaaagtgac tcacttatcc caagagaatg aaattgctga aagatctttc 1200
aggactctac ctcatatcag tttgctagca gaaatctaga agactgtcag cttccaaaca 1260
ttaatgcaat ggttaacatc ttctgtcttt ataatctact ccttgtaaag actgtagaag 1320
aaagagcaac aatccatctc tcaagtagtg tatcacagta gtagcctcca ggtttcctta 1380
agggacaaca tccttaagtc aaaagagaga agaggcacca ctaaaagatc gcagtttgcc 1440
tggtgcagtg gctcacacct gtaatcccaa cattttggga acccaaggtg ggtagatcac 1500
gagatcaaga gatcaagacc atagtgacca acatagtgaa accccatctc tactgaaagt 1560
acaaaaatta gctgggtgtg ttggcacatg cctgtagtcc cagctacttg agaggctgag 1620
gcaagagaat tgtttgaacc cgggaggcag aggttgcagt gtggtgagat catgccacta 1680
cactccagcc tggcgacaga gcgagacttg gtttcaaaaa aaaaaaaaaa aaaaacttca 1740
gtaagtacgt gttatttttt tcaataaaat tctattacag tatgtcatgt ttgctgtagt 1800
gctcatattt attgttgttt ttgttttagt actcacttgt ttcataatat caagattact 1860
aaaaatgggg gaaaagactt ctaatctttt tttcataata tctttgacac atattacaga 1920
agaaataaat ttcttacttt taatttaata tga 1953
<210> 2
<211> 1805
<212> DNA
<213> Homo sapiens
<400> 2
acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60
gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120
atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180
gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240
aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300
gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360
gtcaagtggc aactccgtca gctcgttaga aagactccaa gaatgaaaag gctctgggcc 420
gcaaaataaa ctcctgggaa tcatcaagga gtgggcattc attcctgagc aacttgcact 480
tgaggaatgg tgaactggtc atccatgaaa aagggtttta ctacatctat tcccaaacat 540
actttcgatt tcaggaggaa ataaaagaaa acacaaagaa cgacaaacaa atggtccaat 600
atatttacaa atacacaagt tatcctgacc ctatattgtt gatgaaaagt gctagaaata 660
gttgttggtc taaagatgca gaatatggac tctattccat ctatcaaggg ggaatatttg 720
agcttaagga aaatgacaga atttttgttt ctgtaacaaa tgagcacttg atagacatgg 780
accatgaagc cagttttttt ggggcctttt tagttggcta actgacctgg aaagaaaaag 840
caataacctc aaagtgacta ttcagttttc aggatgatac actatgaaga tgtttcaaaa 900
aatctgacca aaacaaacaa acagaaaaca gaaaacaaaa aaacctctat gcaatctgag 960
tagagcagcc acaaccaaaa aattctacaa cacacactgt tctgaaagtg actcacttat 1020
cccaagagaa tgaaattgct gaaagatctt tcaggactct acctcatatc agtttgctag 1080
cagaaatcta gaagactgtc agcttccaaa cattaatgca atggttaaca tcttctgtct 1140
ttataatcta ctccttgtaa agactgtaga agaaagagca acaatccatc tctcaagtag 1200
tgtatcacag tagtagcctc caggtttcct taagggacaa catccttaag tcaaaagaga 1260
gaagaggcac cactaaaaga tcgcagtttg cctggtgcag tggctcacac ctgtaatccc 1320
aacattttgg gaacccaagg tgggtagatc acgagatcaa gagatcaaga ccatagtgac 1380
caacatagtg aaaccccatc tctactgaaa gtacaaaaat tagctgggtg tgttggcaca 1440
tgcctgtagt cccagctact tgagaggctg aggcaagaga attgtttgaa cccgggaggc 1500
agaggttgca gtgtggtgag atcatgccac tacactccag cctggcgaca gagcgagact 1560
tggtttcaaa aaaaaaaaaa aaaaaaactt cagtaagtac gtgttatttt tttcaataaa 1620
attctattac agtatgtcat gtttgctgta gtgctcatat ttattgttgt ttttgtttta 1680
gtactcactt gtttcataat atcaagatta ctaaaaatgg gggaaaagac ttctaatctt 1740
tttttcataa tatctttgac acatattaca gaagaaataa atttcttact tttaatttaa 1800
tatga 1805
<210> 3
<211> 1334
<212> DNA
<213> Homo sapiens
<400> 3
atttcctcac tgactataaa agaatagaga aggaagggct tcagtgaccg gctgcctggc 60
tgacttacag cagtcagact ctgacaggat catggctatg atggaggtcc aggggggacc 120
cagcctggga cagacctgcg tgctgatcgt gatcttcaca gtgctcctgc agtctctctg 180
tgtggctgta acttacgtgt actttaccaa cgagctgaag cagtttgcag aaaatgattg 240
ccagagacta atgtctgggc agcagacagg gtcattgctg ccatcttgaa gtctaccttg 300
ctgagtctac cctgctgacc tcaagcccca tcaaggactg gttgaccctg gcctagacaa 360
ccaccgtgtt tgtaacagca ccaagagcag tcaccatgga aatccacttt tcagaaccaa 420
gggcttctgg agctgaagaa caggcaccca gtgcaagagc tttcttttca gaggcacgca 480
aatgaaaata atccccacac gctaccttct gcccccaatg cccaagtgtg gttagttaga 540
gaatatagcc tcagcctatg atatgctgca ggaaactcat attttgaagt ggaaaggatg 600
ggaggaggcg ggggagacgt atcgtattaa ttatcattct tggaataacc acagcacctc 660
acgtcaaccc gccatgtgtc tagtcaccag cattggccaa gttctatagg agaaactacc 720
aaaattcatg atgcaagaaa catgtgaggg tggagagagt gactggggct tcctctctgg 780
atttctattg ttcagaaatc aatatttatg cataaaaagg tctagaaaga gaaacaccaa 840
aatgacaatg tgatctctag atggtatgat tatgggtact ttttttcctt tttatttttc 900
tatattttac aaattttcta cagggaatgt tataaaaata tccatgctat ccatgtataa 960
ttttcataca gatttaaaga acacagcatt tttatatagt cttatgagaa aacaaccata 1020
ctcaaaatta tgcacacaca cagtctgatc tcacccctgt aaacaagaga tatcatccaa 1080
aggttaagta ggaggtgaga atatagctgc tattagtggt tgttttgttt tgtttttgtg 1140
atttacttat ttagtttttg gagggttttt tttttctttt agaaaagtgt tctttacttt 1200
tccatgcttc cctgcttgcc tgtgtatcct gaatgtatcc aggctttata aactcctggg 1260
taataatgta gctacattaa cttgttaacc tcccatccac ttatacccag gaccttactc 1320
aattttccag gttc 1334
<210> 4
<211> 281
<212> PRT
<213> Homo sapiens
<400> 4
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys
35 40 45
Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr
50 55 60
Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val
65 70 75 80
Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Met Ile Leu Arg Thr Ser
85 90 95
Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro
100 105 110
Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly
115 120 125
Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu
130 135 140
Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly
145 150 155 160
His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile
165 170 175
His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe
180 185 190
Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln
195 200 205
Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys
210 215 220
Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr
225 230 235 240
Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile
245 250 255
Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala
260 265 270
Ser Phe Phe Gly Ala Phe Leu Val Gly
275 280
<210> 5
<211> 101
<212> PRT
<213> Homo sapiens
<400> 5
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys
35 40 45
Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr
50 55 60
Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val
65 70 75 80
Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Thr Pro Arg Met Lys Arg
85 90 95
Leu Trp Ala Ala Lys
100
<210> 6
<211> 65
<212> PRT
<213> Homo sapiens
<400> 6
Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys
1 5 10 15
Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala
20 25 30
Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Phe Ala Glu Asn
35 40 45
Asp Cys Gln Arg Leu Met Ser Gly Gln Gln Thr Gly Ser Leu Leu Pro
50 55 60
Ser
65
<210> 7
<211> 223
<212> PRT
<213> Homo sapiens
<400> 7
Gln Asp His Gly Tyr Asp Gly Gly Pro Gly Gly Thr Gln Pro Gly Thr
1 5 10 15
Asp Leu Arg Ala Asp Arg Asp Leu His Ser Ala Pro Ala Val Ser Leu
20 25 30
Cys Gly Cys Asn Leu Arg Val Leu Tyr Gln Arg Ala Glu Ala Glu Lys
35 40 45
Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val
50 55 60
Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser
65 70 75 80
Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp
85 90 95
Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg
100 105 110
Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser
115 120 125
Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn
130 135 140
Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp
145 150 155 160
Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp
165 170 175
Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu
180 185 190
Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile
195 200 205
Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
210 215 220
<210> 8
<211> 178
<212> PRT
<213> Homo sapiens
<400> 8
Lys Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro
1 5 10 15
Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
20 25 30
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
35 40 45
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
50 55 60
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
65 70 75 80
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
85 90 95
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
100 105 110
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
115 120 125
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
130 135 140
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
145 150 155 160
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
165 170 175
Val Gly
<210> 9
<211> 2421
<212> DNA
<213> Homo sapiens
<400> 9
caccctcatg agccccgggt acgtttaact attgagggcc aggaaattgc cttcctcctg 60
gacactggcg cagccttctc agggttaatc tcctgtcctg gatgactgtc ttcaaggtcc 120
gttaccaccc gaggaatcct gggacagcct ataaccaggt atttctccca catcctcagt 180
tgtaattgag agactttaat cttttcacat gccttttttg ttattcctga aagtcccaca 240
cccttattaa ggagggatat attagccaag gctggagcta ttatctacat gaatatgggg 300
aaaaagttac ccatttgctg tcccctactt gaggagggaa tcaaccctga agtctgggca 360
ttggaaggac aatttggaag ggcaaaaaat gcctgcccag tccaaatcag gttaaaagat 420
cccaccactt ttccgtatca aaggcaatat cccttaaggc ctgaagctca taaaggatta 480
tagaatattg ttaaacattt aaaagctcaa ggcttagtga ggaaatgcag cagtccctgc 540
aacaccccag ttctaggagt acaaaaacca aacagtcagt ggagactagt gcaagatctt 600
agactcatta atgaggcagt aattcctcta tatccagttg tacccaaccc ctataccctg 660
ctctctcaaa taccagggga agcagaatgg ttcacggttc tggacctcaa ggatgccttc 720
ttctttattc ccctgcactc tgactcccag tttctctttg cttttgagga tcccacagac 780
cacacgtccc aacttacaca gatggtcttg ccccaagggt ttagggatag ccctcatctg 840
tttggtcagg cactggccca agatctatag gccacttctc aagtccaggc actctggtcc 900
ttcaatatgt ggatgattta cttttggcta ccagtttgga agcctcgtgc cagcaggcta 960
ctctggatct cttgaacttt ctggctaatc aagggtacaa ggtgtctagg tcgaaggccc 1020
agctttgcct acagcaggtt aaatatctaa gcctaatctt agccaaaggg accagggccc 1080
tcagcaagga atgaatacag cctatactgg cttatcctca ccctaagaca ttaaaacagt 1140
tgcggggatt ccttggaatt actggctttt gctgactatg gatctccaga tacagcgaga 1200
cagccaggcc cctctatact ctaatcaagg aaacccagag ggcaaatact catctagtcg 1260
aaagggaacc agaggcagaa acagccttca aaagcttaaa gcaggctcta gtacaagctc 1320
cagctttaag ccttcccaca ggacagaact tctctttata catcacagag agagccaaga 1380
tagctcttgg agtccttaga ctcgtgggac aaccccacaa ccagtggcat acctaagtaa 1440
ggaaattgat gtagtagcaa aaggctggcc tcactgttta agggtagttg cagcagcggc 1500
cgtcttagcg tcagaggcta tcagaataat acaaggaaag gatctcactg tctggactac 1560
tcatgatgta aatggcatac taggtgccaa aggaagttta tggctatcag acaaccgcct 1620
cttagatgcc aggcactact ccttgaggga ctggtgctta aaatatgcac gtgcgtggcc 1680
ctcaaccctg ccacttttct cccagaggat ggggaaccaa ttgagcatga ctgccaacaa 1740
attatagtcc agacttatgc cgcccgagat gatctcttag aagtcccctt aactaatcct 1800
gaccttaacc tatataccga cggaagttca tttgtggaga atgggatacg aagggcaggt 1860
tacgccatag tgatgtaacc acacttgaaa gcaagcctct tcccccaggg accagtgccc 1920
agttagcaga actagtggca cttacccgag ccttagaact gggaaaggga aaaagaataa 1980
atgtgtatac agataacaag tatgcttatc taatcctaca tgcccatgct gcaatatgga 2040
aagaatggga gttcctaacc tctgggaacc cccgctggat gccacaggga agttatggag 2100
ttattgcaca tggtgcagga acccaaagag gtgggagtct tacactacca aggccatcaa 2160
aatgggaagg agaggggaga acagcagcat aagcggctgg cagaggtagg gaaagaccag 2220
caagaaggaa agagagaaag agaaagtcag agaaagagac agagagagga agagacagag 2280
agacagaacg ttaaagaggg tgtcagaaac agagacaaac aaaaggagtc agaaagaagg 2340
acagacacag aaagtcaaag agagagttaa aaagagagga agagacaaag aagtcgaaga 2400
gagaaagaga gagatggaag t 2421
<210> 10
<211> 2421
<212> DNA
<213> Homo sapiens
<400> 10
ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60
gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120
attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggtaa ggaacatcaa 180
aggatactta atttgtaaaa tgagaaatag gaataggtat aaattctaaa aatacagaaa 240
taatgtattt gtaaaagttt cactgcatgc ttataaataa gagggaaata aatagagatt 300
ccctcagatc ataaaactta tatgaattga agtgagagaa acaaatagaa taagagaaag 360
agaaggaaaa agggaaggag gacagaagag atggggaaga gggaggatag agagagaaaa 420
tgtgagggaa tgcggacaga gatgagatac agatacttcc ttacctaact aagctcaatg 480
aaccacatga actgtgctta agggtttgac tttataatca acaagctgca attcttttct 540
tccagataat caactcttta atcatttaca gttgtgttat gatgtgatcc attcctcctc 600
agattaagtg actatttgct gatatgggga tataggttct gctaaatacc accagtctac 660
attaaatgcc taaaatgaac actgtgctaa ccttctctgc tgttcctctt ttcctacagg 720
agtacctctc tctagaactg tacgctgtac ctgcatcagc attagtaatc aacctgttaa 780
tccaaggtct ttagaaaaac ttgaaattat tcctgcaagc caattttgtc cacgtgttga 840
gatcatgtga gtgaaatccc atctgattat cacttccctg gttgtaatta tatactgtat 900
taaatatgta atgataataa aaaaagatca gtaaagggtt tgtgatgatt ctaaaactaa 960
tgtacagcaa acaaaaacat gcagagtgaa acttaaatgt ctgacttcag aactgcgtat 1020
gccatctgtt ttattgaccc aacacagttt taaatatttt catccctatt tatttctaca 1080
gtgctacaat gaaaaagaag ggtgagaaga gatgtctgaa tccagaatcg aaggccatca 1140
agaatttact gaaagcagtt agcaaggaaa ggtaggtttg ctgttgcctg cagaagaatt 1200
gctctttagg aaacggcaat cttgggagtc agaaatactt gcattgtggt ttgctgtgca 1260
atcgctggtt taaaagtatg ttaccaccac gccctcccct acctccattt atttaaatgc 1320
tgaggcacca tcttgtgtga taagtatcag aagttaccct gattaccagt caaccttgaa 1380
gtacagctat aactatctaa gcaaaactga caacattttc cccaagtctt tcatggttga 1440
aaaaagcaac ccctataatc cataatgaat gcatagcagc aggaaagctc agttatctat 1500
tctatgaact cggtactttc caaacacaac ccaatctgaa gccagagtca gactatcaca 1560
cttttatatc ccctttctct tcttacaggt ctaaaagatc tccttaaaac cagaggggag 1620
caaaatcgat gcagtgcttc caaggatgga ccacacagag gctgcctctc ccatcacttc 1680
cctacatgga gtatatgtca agccataatt gttcttagtt tgcagttaca ctaaaaggtg 1740
accaatgatg gtcaccaaat cagctgctac tactcctgta ggaaggttaa tgttcatcat 1800
cctaagctat tcagtaataa ctctaccctg gcactataat gtaagctcta ctgaggtgct 1860
atgttcttag tggatgttct gaccctgctt caaatatttc cctcaccttt cccatcttcc 1920
aagggtacta aggaatcttt ctgctttggg gtttatcaga attctcagaa tctcaaataa 1980
ctaaaaggta tgcaatcaaa tctgcttttt aaagaatgct ctttacttca tggacttcca 2040
ctgccatcct cccaaggggc ccaaattctt tcagtggcta cctacataca attccaaaca 2100
catacaggaa ggtagaaata tctgaaaatg tatgtgtaag tattcttatt taatgaaaga 2160
ctgtacaaag tagaagtctt agatgtatat atttcctata ttgttttcag tgtacatgga 2220
ataacatgta attaagtact atgtatcaat gagtaacagg aaaattttaa aaatacagat 2280
agatatatgc tctgcatgtt acataagata aatgtgctga atggttttca aaataaaaat 2340
gaggtactct cctggaaata ttaagaaaga ctatctaaat gttgaaagat caaaaggtta 2400
ataaagtaat tataactaag a 2421
<210> 11
<211> 2421
<212> DNA
<213> Homo sapiens
<400> 11
agatgacttt tttctattta tatttaataa gatgatgaac ccttcttgca ttcccgaaat 60
aaacctcaac tgttacagtg ttttattctt ttaatatgta cgaagtacat gttaagcaag 120
ttatttccta agcagcccca caaactgggc actactacca tcctgctctg cccctccctc 180
actctacttc agccacttca gccacaatgg cctctcctca ctgcccctct gatgcaccaa 240
gcttgttctc acctcaggaa tgtgcaacac ctgccagact tgctgttccc cggagcctcc 300
atccccagat atcctcatat atcatcctcc tcttcatttg tgtctctgct tacatatgac 360
ctatttacag aagcctttcc tgtctacccc ccatgaaata gaaatcgcat tccaatcttg 420
tctctacccc aatgctgttt cattttgtct gtagcaattg tcatcatctc atatatattc 480
acatgtggaa aatacacaaa atgtttaact tcttttaatt tacattccat ttccccatga 540
attgaagctc catgacagcg gagatttttc tctgctttcc ctgttgctca cttcccagca 600
ccaagagcag gcctggcaca tgggaagtac ttactattta ttgaatggat gaatgaacaa 660
atgaatgaat ggatacttat tttacacata agaaaactga agcttataga aattaagtaa 720
ctaaaatcac acagaagcac agctgaaact aaaacctacg tctaactttc aattcctgac 780
ccttaaccat taaaacaaat gacaggtgac tttaggccac tgaaaatgct catataatct 840
tatgaattct aaagcacaag ttaatcacac cattgattga aagtctgagg aatactgtat 900
agacaagccc ctgtacaagg taagcaaaag aatcagagga tggcctccaa agaattccct 960
ggacattatg ggaattacat tgttagcctt cctactgata cccataagcc tcacagcaag 1020
catcatgaag ctgtgacctt catctgcaca tgcccttgta tacccaaaag ataaaactgg 1080
atgcttcagg gccgaatggc caataaacac gtgtttatta ctggcatggg cagacacaca 1140
tactgaaagt accatttccc agcggactag ccatattatg atcagtacag acactaaaga 1200
tttagctttg aaaaaactat ttgctcttcc aaagctgaag aatcttctgt gatttcaaca 1260
ggcaagttac agtcaggtat tcttaatgtt cttttcctcc tctctcactg ggatactttc 1320
tttccttcag acaacgtcaa gcgaaaaaca aaatttcaca aatctccatt tctgacacta 1380
aacagtacag tatctttatt ttttttataa tttaatcaaa ccctgtattt tagaactgtg 1440
gggctgatcc aacattgcaa tgtgtcacat ttaattccat caatgtaaag cataatgagc 1500
aaagattaag gtagtgaggc ataactaaat gttttgaacc tgtgaatttc aaaagcaagg 1560
cccatttgtg ttattttcta aatagtaaat aaaatcattt tccaacattt cactatcaaa 1620
ttacagtaat ttttccacca gtacacactt gaggaaagcc acaaaaagac ttttccaaca 1680
gttcattctg ttattgctca taaccttcta aatacttctc ctcattggct tctattcaaa 1740
ggtaaatgga aagcagtaaa atttatggaa aatatattca actgcttaaa atacatcaac 1800
caaaaaaaag attttagagc tgtattatga gttgtgaaat tgcattgcct tcacttacct 1860
ttcagtttca ctggtaggta acaaaactga cagactggtc aagttccaaa acatccccta 1920
tatagagcct gactcttcca tctcaaattc tcaccttggt caaggccaga gtaaacacct 1980
gtccttcaca tttttacaca acatcacttt gtatgctaca aatataagct ttcataccag 2040
ggaggaagca aattccagga cactggaaac atttctgctc tcttaaacca gtctgttgat 2100
tgttcccttg actttctcag ctgtcaggat agtgaaagga ggaaaactgc aaaactgtaa 2160
agtataacct gataagtttg ccctttaagc ttttcacaca gagagaggta aaataaaact 2220
caagtctaag gtttaaaatt gagctatgaa tattatattc tagcactaga caaaaatgtt 2280
gcaagatttt aataaaataa gattattaaa atcaattttt acatttcatg ggccaaggag 2340
agacatcaaa gaatgtttaa ctaacatttt aaagatacta tactttataa agttaagaag 2400
aaaaatgaca actgcaccag t 2421
<210> 12
<211> 1227
<212> DNA
<213> Homo sapiens
<400> 12
ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60
gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120
attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggagt acctctctct 180
agaactgtac gctgtacctg catcagcatt agtaatcaac ctgttaatcc aaggtcttta 240
gaaaaacttg aaattattcc tgcaagccaa ttttgtccac gtgttgagat cattgctaca 300
atgaaaaaga agggtgagaa gagatgtctg aatccagaat cgaaggccat caagaattta 360
ctgaaagcag ttagcaagga aaggtctaaa agatctcctt aaaaccagag gggagcaaaa 420
tcgatgcagt gcttccaagg atggaccaca cagaggctgc ctctcccatc acttccctac 480
atggagtata tgtcaagcca taattgttct tagtttgcag ttacactaaa aggtgaccaa 540
tgatggtcac caaatcagct gctactactc ctgtaggaag gttaatgttc atcatcctaa 600
gctattcagt aataactcta ccctggcact ataatgtaag ctctactgag gtgctatgtt 660
cttagtggat gttctgaccc tgcttcaaat atttccctca cctttcccat cttccaaggg 720
tactaaggaa tctttctgct ttggggttta tcagaattct cagaatctca aataactaaa 780
aggtatgcaa tcaaatctgc tttttaaaga atgctcttta cttcatggac ttccactgcc 840
atcctcccaa ggggcccaaa ttctttcagt ggctacctac atacaattcc aaacacatac 900
aggaaggtag aaatatctga aaatgtatgt gtaagtattc ttatttaatg aaagactgta 960
caaagtagaa gtcttagatg tatatatttc ctatattgtt ttcagtgtac atggaataac 1020
atgtaattaa gtactatgta tcaatgagta acaggaaaat tttaaaaata cagatagata 1080
tatgctctgc atgttacata agataaatgt gctgaatggt tttcaaaata aaaatgaggt 1140
actctcctgg aaatattaag aaagactatc taaatgttga aagatcaaaa ggttaataaa 1200
gtaattataa ctaagaaaaa aaaaaaa 1227
<210> 13
<211> 98
<212> PRT
<213> Homo sapiens
<400> 13
Met Asn Gln Thr Ala Ile Leu Ile Cys Cys Leu Ile Phe Leu Thr Leu
1 5 10 15
Ser Gly Ile Gln Gly Val Pro Leu Ser Arg Thr Val Arg Cys Thr Cys
20 25 30
Ile Ser Ile Ser Asn Gln Pro Val Asn Pro Arg Ser Leu Glu Lys Leu
35 40 45
Glu Ile Ile Pro Ala Ser Gln Phe Cys Pro Arg Val Glu Ile Ile Ala
50 55 60
Thr Met Lys Lys Lys Gly Glu Lys Arg Cys Leu Asn Pro Glu Ser Lys
65 70 75 80
Ala Ile Lys Asn Leu Leu Lys Ala Val Ser Lys Glu Arg Ser Lys Arg
85 90 95
Ser Pro
<210> 14
<211> 2301
<212> DNA
<213> Homo sapiens
<400> 14
aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60
ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120
gtttcttggt cttgaccagc ctctctcatg cttttggcca gacaggtaag ggccacccca 180
ggctatggga gagatttgat ctgaggtatg ggggtggggt ctaagactgc atgaacagtc 240
tcaaaaaaaa aaaaaaaaga ctgtatgaac agaacagtgg agcatccttc atggtgtgtg 300
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tggtgtgtaa ctggagaagg ggtcagtctg 360
tttctcaatc ttaaattcta tacgtaagtg aggggataga tctgtgtgat ctgagaaacc 420
tctcacattt gcttgttttt ctggctcaca gacatgtcga ggaaggcttt tgtgtttccc 480
aaagagtcgg atacttccta tgtatccctc aaagcaccgt taacgaagcc tctcaaagcc 540
ttcactgtgt gcctccactt ctacacggaa ctgtcctcga cccgtgggta cagtattttc 600
tcgtatgcca ccaagagaca agacaatgag attctcatat tttggtctaa ggatatagga 660
tacagtttta cagtgggtgg gtctgaaata ttattcgagg ttcctgaagt cacagtagct 720
ccagtacaca tttgtacaag ctgggagtcc gcctcaggga tcgtggagtt ctgggtagat 780
gggaagccca gggtgaggaa gagtctgaag aagggataca ctgtgggggc agaagcaagc 840
atcatcttgg ggcaggagca ggattccttc ggtgggaact ttgaaggaag ccagtccctg 900
gtgggagaca ttggaaatgt gaacatgtgg gactttgtgc tgtcaccaga tgagattaac 960
accatctatc ttggcgggcc cttcagtcct aatgtcctga actggcgggc actgaagtat 1020
gaagtgcaag gcgaagtgtt caccaaaccc cagctgtggc cctgaggccc agctgtgggt 1080
cctgaaggta cctcccggtt ttttacaccg catgggcccc acgtctctgt ctctggtacc 1140
tcccgctttt ttacactgca tggttcccac gtctctgtct ctgggccttt gttcccctat 1200
atgcattgca ggcctgctcc accctcctca gcgcctgaga atggaggtaa agtgtctggt 1260
ctgggagctc gttaactatg ctgggaaacg gtccaaaaga atcagaattt gaggtgtttt 1320
gttttcattt ttatttcaag ttggacagat cttggagata atttcttacc tcacatagat 1380
gagaaaacta acacccagaa aggagaaatg atgttataaa aaactcataa ggcaagagct 1440
gagaaggaag cgctgatctt ctatttaatt ccccacccat gacccccaga aagcaggagg 1500
gcattgccca cattcacagg gctcttcagt ctcagaatca ggacactggc caggtgtctg 1560
gtttgggtcc agagtgctca tcatcatgtc atagaactgc tgggcccagg tctcctgaaa 1620
tgggaagccc agcaatacca cgcagtccct ccactttctc aaagcacact ggaaaggcca 1680
ttagaattgc cccagcagag cagatctgct ttttttccag agcaaaatga agcactaggt 1740
ataaatatgt tgttactgcc aagaacttaa atgactggtt tttgtttgct tgcagtgctt 1800
tcttaatttt atggctcttc tgggaaactc ctcccctttt ccacacgaac cttgtggggc 1860
tgtgaattct ttcttcatcc ccgcattccc aatataccca ggccacaaga gtggacgtga 1920
accacagggt gtcctgtcag aggagcccat ctcccatctc cccagctccc tatctggagg 1980
atagttggat agttacgtgt tcctagcagg accaactaca gtcttcccaa ggattgagtt 2040
atggactttg ggagtgagac atcttcttgc tgctggattt ccaagctgag aggacgtgaa 2100
cctgggacca ccagtagcca tcttgtttgc cacatggaga gagactgtga ggacagaagc 2160
caaactggaa gtggaggagc caagggattg acaaacaaca gagccttgac cacgtggagt 2220
ctctgaatca gccttgtctg gaaccagatc tacacctgga ctgcccaggt ctataagcca 2280
ataaagcccc tgtttacttg a 2301
<210> 15
<211> 2301
<212> DNA
<213> Homo sapiens
<400> 15
aggaattgaa ctcagctctg ccccaagcgg acctaataga catctacaga actctccacc 60
ccaaatcaac agaatataca tttttttcag caccacacca cacctattcc aaaattgatc 120
acatagttgg cagtaaagct ctcctcagca aatgtaaagg aacagaaatt ataacaaact 180
atctctcaga ccacagtgca atcaaattag aactcagaat taagaatctc actcaaaacc 240
gcacaactac atggaaactg aacaacctgc ttctgaatga ctactgggta cataatgaaa 300
tgaaggcaga aataaagatg ttctttgaaa tgaacaagaa caaacacaca acataccaga 360
atctctggga cgcattcaaa gcagtgtgta gagggaaatt tatagcacta aatgcccaca 420
agagaaagca ggaaacatcc aaaattgaca tcctaacatc acagttaaaa gaactagaaa 480
agcaagagca aacacattca aaagctagca gaaggcaaga gataactaaa atcagagcag 540
aactgaagga aatagagaca caaaaaccct tcaaaaaatt aatgaatcca ggagctggtt 600
ttttgaaagg atcaacaaaa tagatagacc actagcaaga ctaataaaga aaaaaagaga 660
gaagaatcaa atagacacaa taaaaaaatg ataaagggga tatcaccacc gatcccacgg 720
aaatacaaac taccatcaga gaatactaca aacacctcta cgcaaataaa ctagaaaatc 780
aagaagaaat ggataaattc ctcgacacat acactctccc aagactaaac caggaagaag 840
ttgaatctct gaatagacca ataacaggat atgaaattgt ggcaataatc aataccttac 900
caacaaaaaa gagtccagga ccagatggat tcacagccga attctaccag aggtacaagg 960
aggaactggt accattcctt ctgaaactat tccaatcaat agaaaaagag ggaatcctcc 1020
ctaactcatt ttatgaggcc agcatcattc tgataccaaa gccgggcaga gacacaacca 1080
aaaaagagaa ttttagacca atcaatatcc ttgatgaaca ttgatgcaaa aatcctcaat 1140
aaaatactgc caaaccaaat ccagcagcac atcaaaaagc ttatccacca tgatcaagtg 1200
ggcttcatcc ctgggatgca aggctggttc aatatacgca aatcaataaa tgtaatccag 1260
catataaaca gagccaaaga caaaaaccac atgattatct caatagatgc agaaaagacc 1320
tttgacaaaa ttcaacaacc cttcatgctc aaaactctca ataaattagg tattgatggg 1380
acgtatttca aaataataag agctatctat gacaaaccca cagccaatat catactgaat 1440
gggcaaaaac tggaagtatt cactttgaaa actggcacaa gacagggatg ccctctctca 1500
ccactcctat tcaacatagt gttggaagtt ctggccaggg caattaggca ggagaaggaa 1560
ataaagggta ttcaattagg aaaagaggaa gtcaaattgt ccctgtttgc agacgacatg 1620
attgtatatc tagaaaaccc cattgtctca gcccaaaatc tccttaagca gataagcaac 1680
ttcagcaaaa tctcaggata caaaatcaat gtacaaaaat cacaagcatt cttatacacc 1740
aacaacagac aaacagagag ccaaatcatg agtgaaatcc cattcacaat tgctttaaag 1800
agaataaaat acctaggaat ccaacttaca agggatgtga aggacctctt caaggagaac 1860
tacaaaccac tgctcaatga aataaaagag gataaaaaca aatggaagaa cattccatgc 1920
tcatgggtag gaagaatcaa tatcatgaaa atggccatac tgcccaaggt aatttacaga 1980
ttcaatgcca tccccatcaa gctaccaatg cctttcttca cagaattgga aaaaactatt 2040
tttagttcat atggaaccaa aaaagagccc gcattgccaa gtcaatccta agccaaaaga 2100
acaaagctgg aggcatcaca ctacctgact tcaaactata ctacaaggct acagtaacca 2160
aaacagcatg gtactggaac caaaacagag atatagatca atggaacaga acagagccct 2220
caaaattaat gccacatatc tacaactatc tgatctttga caaacctgag aaaaaccagc 2280
aatggggaaa ggattcccca t 2301
<210> 16
<211> 2024
<212> DNA
<213> Homo sapiens
<400> 16
aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60
ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120
gtttcttggt cttgaccagc ctctctcatg cttttggcca gacagacatg tcgaggaagg 180
cttttgtgtt tcccaaagag tcggatactt cctatgtatc cctcaaagca ccgttaacga 240
agcctctcaa agccttcact gtgtgcctcc acttctacac ggaactgtcc tcgacccgtg 300
ggtacagtat tttctcgtat gccaccaaga gacaagacaa tgagattctc atattttggt 360
ctaaggatat aggatacagt tttacagtgg gtgggtctga aatattattc gaggttcctg 420
aagtcacagt agctccagta cacatttgta caagctggga gtccgcctca gggatcgtgg 480
agttctgggt agatgggaag cccagggtga ggaagagtct gaagaaggga tacactgtgg 540
gggcagaagc aagcatcatc ttggggcagg agcaggattc cttcggtggg aactttgaag 600
gaagccagtc cctggtggga gacattggaa atgtgaacat gtgggacttt gtgctgtcac 660
cagatgagat taacaccatc tatcttggcg ggcccttcag tcctaatgtc ctgaactggc 720
gggcactgaa gtatgaagtg caaggcgaag tgttcaccaa accccagctg tggccctgag 780
gcccagctgt gggtcctgaa ggtacctccc ggttttttac accgcatggg ccccacgtct 840
ctgtctctgg tacctcccgc ttttttacac tgcatggttc ccacgtctct gtctctgggc 900
ctttgttccc ctatatgcat tgcaggcctg ctccaccctc ctcagcgcct gagaatggag 960
gtaaagtgtc tggtctggga gctcgttaac tatgctggga aacggtccaa aagaatcaga 1020
atttgaggtg ttttgttttc atttttattt caagttggac agatcttgga gataatttct 1080
tacctcacat agatgagaaa actaacaccc agaaaggaga aatgatgtta taaaaaactc 1140
ataaggcaag agctgagaag gaagcgctga tcttctattt aattccccac ccatgacccc 1200
cagaaagcag gagggcattg cccacattca cagggctctt cagtctcaga atcaggacac 1260
tggccaggtg tctggtttgg gtccagagtg ctcatcatca tgtcatagaa ctgctgggcc 1320
caggtctcct gaaatgggaa gcccagcaat accacgcagt ccctccactt tctcaaagca 1380
cactggaaag gccattagaa ttgccccagc agagcagatc tgcttttttt ccagagcaaa 1440
atgaagcact aggtataaat atgttgttac tgccaagaac ttaaatgact ggtttttgtt 1500
tgcttgcagt gctttcttaa ttttatggct cttctgggaa actcctcccc ttttccacac 1560
gaaccttgtg gggctgtgaa ttctttcttc atccccgcat tcccaatata cccaggccac 1620
aagagtggac gtgaaccaca gggtgtcctg tcagaggagc ccatctccca tctccccagc 1680
tccctatctg gaggatagtt ggatagttac gtgttcctag caggaccaac tacagtcttc 1740
ccaaggattg agttatggac tttgggagtg agacatcttc ttgctgctgg atttccaagc 1800
tgagaggacg tgaacctggg accaccagta gccatcttgt ttgccacatg gagagagact 1860
gtgaggacag aagccaaact ggaagtggag gagccaaggg attgacaaac aacagagcct 1920
tgaccacgtg gagtctctga atcagccttg tctggaacca gatctacacc tggactgccc 1980
aggtctataa gccaataaag cccctgttta cttgaaaaaa aaaa 2024
<210> 17
<211> 224
<212> PRT
<213> Homo sapiens
<400> 17
Met Glu Lys Leu Leu Cys Phe Leu Val Leu Thr Ser Leu Ser His Ala
1 5 10 15
Phe Gly Gln Thr Asp Met Ser Arg Lys Ala Phe Val Phe Pro Lys Glu
20 25 30
Ser Asp Thr Ser Tyr Val Ser Leu Lys Ala Pro Leu Thr Lys Pro Leu
35 40 45
Lys Ala Phe Thr Val Cys Leu His Phe Tyr Thr Glu Leu Ser Ser Thr
50 55 60
Arg Gly Tyr Ser Ile Phe Ser Tyr Ala Thr Lys Arg Gln Asp Asn Glu
65 70 75 80
Ile Leu Ile Phe Trp Ser Lys Asp Ile Gly Tyr Ser Phe Thr Val Gly
85 90 95
Gly Ser Glu Ile Leu Phe Glu Val Pro Glu Val Thr Val Ala Pro Val
100 105 110
His Ile Cys Thr Ser Trp Glu Ser Ala Ser Gly Ile Val Glu Phe Trp
115 120 125
Val Asp Gly Lys Pro Arg Val Arg Lys Ser Leu Lys Lys Gly Tyr Thr
130 135 140
Val Gly Ala Glu Ala Ser Ile Ile Leu Gly Gln Glu Gln Asp Ser Phe
145 150 155 160
Gly Gly Asn Phe Glu Gly Ser Gln Ser Leu Val Gly Asp Ile Gly Asn
165 170 175
Val Asn Met Trp Asp Phe Val Leu Ser Pro Asp Glu Ile Asn Thr Ile
180 185 190
Tyr Leu Gly Gly Pro Phe Ser Pro Asn Val Leu Asn Trp Arg Ala Leu
195 200 205
Lys Tyr Glu Val Gln Gly Glu Val Phe Thr Lys Pro Gln Leu Trp Pro
210 215 220
<210> 18
<211> 26803
<212> DNA
<213> Homo sapiens
<400> 18
cttgctctgt cacccaggct ggagtgcagt gctgtgatca tggttcactg cagccttgaa 60
ctcctgggct ctggcaatcc tcctgcctga gccttctgag tagctgagac tatagatatg 120
ggccaccaca cctggctaat ttttaatttt ttttagtaga gatgaagtct tgctatgttg 180
accaggcttg tgggagttca gtcaggctgg tggaaaaaat tttaaagata gttataagaa 240
atagacacaa accttcttgt aaggctggag agggtttaca ttgcttcagt aacagatttg 300
gctgaaagca gcctaatcct ctctaccttt agctgatagc aaaaatgaaa ataacaaggg 360
aatgtgagga agtttatcta aatagcttgc ttactcatgt ggtcctaaaa ccaaactttg 420
atcaacctca ggtgcataat tgctctctac tcagggggtg agcaatgtta attaccctct 480
agtggtgttt actcgagacc tttgtcattt aatctgtatt aaataaatgt gaactttgct 540
agcttattga ggtgatgctc cagatgcaga gcagagcccc ttagccagac tgacaggcaa 600
aatatctgtg tcagtgtatg tctctcatcc atcactggtt cagggtctgc gggctggatt 660
cctgcacagg ctggtcttga actcctgggc tcaagcaatc ctcccgcctg agccttctga 720
gtagctgaga ctacagatat gggccaccac acctggctat ttttaacatt ttttagtaga 780
gatgaagtct tgctgtgttg cccaggctgg tcttaaactc ctgggctcaa gagctcctcc 840
tgccttggcc tcccaaagtg ctgggagtac aggcatgagt catggtgccc agacggacat 900
ttttttaaaa ataaaggaat actcctgaaa cgctgaagtc ttctttgtac ccctctgtga 960
taacatgaat agcctcttaa tgacaccaag gagcaagaca agttagtccc aaagtagctc 1020
acatagatga tgataaagga atgaggggtg ggtgtgatct atgcaaaaaa cccttactct 1080
ttaatgggtt gctgtttcta acataattgc aacagtaccc tacattgcta taatgcatta 1140
tagttttcaa agtgcttttg tggcctccat aatagagagg ttgtgaggta agcttcaacc 1200
acggctgccc tactacccaa gagtggacac acaatgatga ataggtcaat ttctgcctct 1260
tagtttctta gctagggagg ggcacttact ggaacagcac agaaaacaga gtctttggcc 1320
cagttggaga atctttatca ggttatgcta cttcaagctt tcctcctgtt aaatgtgaga 1380
ggaataaatc cctgttcctt ggatcagtgt gactctgaaa cagctggagg agagacagct 1440
ttaggcaggt tgaaacagag agctccagca tatgtacttt tttttttttt ttgagatgga 1500
gtctcgctct gtctcccagg ctggagtgca gtggctcgat cttggctcac tgcaagctct 1560
gcctcccagg ttcatgccat tctcccgcct cagcctccct agtagctggg actacaggct 1620
cccgccacca cgcccggcta atttttttgt atttttagta gagacagggt ttcaccatgt 1680
tggccaggcc agtcttgaac tcctgacctg aggtgatcca cctgcctcag tctcccaaag 1740
tgctgggatt acaggcgtga gccactgaac ttggccaagt gcactacttt taaaagttaa 1800
agtattatgc agccatgagg gaatattgtg caagaagaaa gcttttacaa gaaaaacttg 1860
aaacattggt atttttgcct cctttttaac aactagagtc gttttgggag ttgtttcttg 1920
tcgaagaaac aacccatgtt tattttccca gtatggcagg accatgtagg aaagcaaaat 1980
tacccctcag gagaggaaat tctctgacac tctataaggc tccataaccc tcctctgaac 2040
tgtggccaac aagattgggt agcacttttt aaggtagttt aagaaaaata ggctgtgcat 2100
ggtggtttat gcctgtaatc ccagcacttt gggaggccga ggtgagtgga tcacctgagg 2160
tcaggagttt gagaccagcc tgaccaatat ggtgaaaccc catctctact gaaaatacaa 2220
aaattagccg ggtgtggtgg cgggcacctg tagtcccagc tactcgggag gctgaggcag 2280
gagaattgct tgaacctggg aggcggaggt tgcagtgagc cgagactgtg ccactgcact 2340
ccagcctggg tgacagagca ggactccatc tcaaaaaaaa aaaaaaaaaa aagaaagaaa 2400
gaaaaatata tagtgagccc aataaagctg tataatctaa atcaaacatg acttgcatgc 2460
ctggagactt tgcactagaa aaatatttct acctaaaaaa tcaaatttta ttttctttct 2520
cacaaatatt caatctgctt tcatctcagt tcttcctacc ttgtcaaacc tctccccaca 2580
tttcctattc tttttctctc cagcctgata tctctcatta tactgcttaa gagaaatgtt 2640
atgttactat tcttttctcc cagaactgtt tctctggttc tttaaggtgt ctgagtacac 2700
actgtgcctt cttcctttta gccctctctt ctccttgttc cctgagcctt acctttatga 2760
ccttagaact tcaagttccc actacaattt taaatataga ctattttgct tttcctccta 2820
ctagggagct taaattgcct ctaattacac tgttttcccg agtccttcct ctcctttgca 2880
atttagatat agcacagaag cacattttgc ttgactgtcc tctgaactgt catgctgttt 2940
tgatgtggtt ctattgtcca agagtcttgg ttaaataata gcccagcatc ccacctgtgt 3000
ttaaaagaac tgcttcacag gcaaatcaaa aagcccatgg atccgaagtc acaatgggcg 3060
ttgctattca aacagcacca gattgctatt caacgcttgg ttgaaaaata aatttcagtt 3120
tcattcacct aatatatttc cttctatttt gtaggatggt atgctcttac ttcaatttgg 3180
acttgttcac aattgaacgt taacatagcc ttatagatta gcctgttttc attggtccag 3240
agtattctcc aaataaagca gggtctgtgc attttaagca actcccctga acaatttcat 3300
gggcattctc aaatttgaga actacctgaa aagctgtgtt ggagaaaaga acaaccaatg 3360
aatgtggcag gacagaatat tgaacattaa cttccctttt cctcttctcc catctgttct 3420
cttccattat ccctacccgt ccgctcagtc tcgttattca ggcaacagtt attttgccat 3480
tatttcctca agaaaggaac aaaagtaaac acaattgctt tctgattttt tttttttttt 3540
tgcattttaa aatggacttt gaaaccataa gcaaagaggt gtttaagagt ctttccaaag 3600
ccaaaaatga aggttttgaa atttcaaagt cactgccttg aagagactcg aggtttggag 3660
tgtgtacagt atgtcggagc tggacttttc tccttcctga gactagataa cggtctgaat 3720
ccaagacagt tttcatgatt tcagaggaag tggtcaagtg gtctgtgagg tagaccttct 3780
gcttaagagc agtcaggagg ccgggtgccg tggctcacgc ctgtaatccc agcactttgg 3840
gagaccgagg tgggcggatc acctgaggtc aggagttcaa gacaagcctg accaacatgc 3900
agaaaccctg tctctactaa aaatacaaaa aattggccgg gcacggtggc acatgcactc 3960
cagcctgggc aacaatagtg aaactccatc tcaaaaaaaa aacaaaaaaa agagaagaaa 4020
agaaaagaaa aggagcagtc aggatgtgtg cctccaaagc tgaggtagac aaaaagatac 4080
cagagttcta gaggcctgcc aggcacagca gcagcagcag aaggaaggtg tgggcgagaa 4140
cagggcagcc aggcgtgtgc cacctcccag acacaattat tgggaatgga gggcaagtgg 4200
tgatgggaga aaatcttgac ttaattgatg tcaagattaa agaaatgcca cctggtggca 4260
tttaagttca cacataggta aagaaagtta tgcatttact gtgaaagtca tcccactatt 4320
tagtagaaac aggagatctg gattctggtc aagagtctct tttgccaact gtggcaccac 4380
tgagcagcgg cacagctttt gtgaatcctg ggttcttcat tattaaaatg gggacattag 4440
cgttgggttg agtataagaa atggacattt ttgcaggtca aaaatggttg aatatttgca 4500
ttttcatatg attcaaccga atacttactt cacaggcata aggaaaaaaa tagaataaca 4560
tactaacaac tgtccctgga gtaagtactt aacaaataca tgatttataa agaagatatg 4620
tgaaagatat ttgtaagtac atgatttata gaaagatatg aaagtatgta aacccttgtg 4680
gtctaatggt cacagaataa tctgagctta atatccctgc tccctaccat acagaaggca 4740
aaatgcctat taggggtttt ctttcttcac cctctccttc tttttcctcc tcctcttgac 4800
tcctcctcat cctcctcttt cttcttcccc ttattaatgt ctaaaaaggg gctgagcatg 4860
gtggctcatg cctgtaatcc tagcactctg ggaagctgcg gcaggtggat cacctgaggc 4920
caggagtttg aaaccagcct ggtcaacatg gcaaaacccc atccctacta aaaatacaaa 4980
aattacccag gtgtggtggc aggcacctgt aattccaact acccgggagg ctgaggcagg 5040
agaatcgctt aaacccggga ggcagaggtt gcagtgagcc aagattgtgc cactgttgtc 5100
catcctgggt gacagaggga gactctgtct caagataaat aataataata ataataattt 5160
ctaaaaaggt aatacatttt catagttcaa aaaccaaaag gtataaaagg aaatacagta 5220
aaaaatttcc tatcatatca ctgtctagag tactattcct tatatatttt cctgattttt 5280
gagtatttta aaatgtgagt gttggatatg agtgttggat ttaaaaagtt ttatgataat 5340
ttgtgtatat ttgtgtgtgt gtgtgtgtgt gtgtgtgtgt atagtagtcc aagactatca 5400
gtttatgaat aataagagga gacccatgga aaaccagtcc ctttgaccaa gttcactcag 5460
ataatcagca gcagggcttg gacattaatt acagttatcc aacatccttt gaggtctcac 5520
atgacaaatt acaaatatgg agtgtaaatg taacccactt tgctaggcaa aaaaagccct 5580
gtttttttaa aaaatatata tttttggctt atgggcaaca gaagccaggg agacgtacag 5640
tcaaacctca tttctcatgg ctttcatatc tgcaaattct cctactcatt aaaagttatt 5700
tataactccc gaatcaatac ccacagcact tttgtgatca ttggcagaca tgtgcagaaa 5760
agaaaaaaaa attgagttgt tgattgcaca cattcccagc tgaatttcaa caaagcaaca 5820
ctctgccttc ccacttcagc tttcttacta tatgtgtgtc ctttttctgt ttatttagta 5880
ccatgttttt cacactttcg ttctttttgg tggtgatttt gctgtttaaa atggccaaca 5940
agtgtagtgc taagtgctgc gtagggttct taagcacaag aaggctatga tgtgccttat 6000
ggagaaaata cgtgtgttgg atcagtttca ctcaagcatg agttatggcg ctattagctg 6060
tgagttcaat gttaacaaat caacaatata tgctaaagtg tctttaaaca gaaacacaca 6120
taaaacaagg ttatatgttt ggttggcaaa aatgttataa ccagaagctt gcagaaacct 6180
aaccctgtat ttcccttaag agcaatggtt cattattcac taattcaatg tttacagcaa 6240
ctttataaac tataactacc atgaataatg agaattgact atgttttaga tcataatacc 6300
tgaagtgaag ttttccatca tggtttttag ttcttagagt ccatttaagt tttttaaaaa 6360
tatgatagct atcctatcac atcccacatt cttgagatta aaaaattaat cttttatttg 6420
gtacagaaaa ggctcctgcg tgcatttttg gaggggctgg accgctgagg aagtcatggt 6480
tggctcaagt ggtttaaatg cattgctaat ttcatagcct ctgaaccact tatgaaacaa 6540
tactgatgat atgtcagtag ctatgtttgc agctccttca ggaatgctta tatcttttac 6600
tgctggtaaa gaagaaattt atagtaatag attttttttt tttttagata gagtctcact 6660
ctgtcgccta ggctggatta cagcggcttg atcacggttt actgcagcct ggatctccca 6720
ggctctccta ctgtagcctc cccagtaact agggccccca cacaggcatc accacaccca 6780
gctcattttt ttatgtttta tagagacagg gtcttactat gttttccagg ctggtctcaa 6840
acttctgggc tcaagcaatc ctcctacttt ggcctcccaa agtgctgaaa ttacaggcat 6900
gaaccactgc acctggttta tggtcatctt aagtagagac ttatgagtgc gtatcattgt 6960
atcaccaatc tgagactcaa ttttatcttt ctgttaatag acaatgcagt ttttctgtta 7020
attacaatga aaatcaaggg ttgcttagca agtttttact cataactcca agttttgtga 7080
cttatagtga gaaatgggta taattctttg tgatttgtta aaatgcagta tttcgaggag 7140
ggataacata taaaatttaa cagtttccta tcattatttt tatccttttg aaccactgta 7200
tactacagat agacaaaggc agctttggcc acttactcct cagtgtgact aagttgacca 7260
gatgttttcc agaccacagg ttctgtcaag agacagtgtg gagagaaatg ggtaggcagg 7320
tatggaaaga agagtcagaa acagatagtg agctaatctc tacaaatggc tcgttatggc 7380
ctgagctgtg ttctcctccc cgcaaaaaga tatgttggag tcgtaatccc cagtacctca 7440
gaatgtggcc ttatttggag attcgatatt tacagaggta agcaagttaa aatgagatca 7500
ctatagtggg tcctaattca atacgactgg tatccttaca aaaaagggga aatttaacca 7560
cagatacaga cacacacata gggagagtgc tagtgaaggt gaagtcagag attggaatga 7620
tgtagcagaa gcctaggaat gccaaagatt gccagcaaac caccagaagc tgggagagcc 7680
acatggaaca gattctcctt cacagtcccc tgaaagaacc aactctcctg acacctcgat 7740
ttcagacttc tagcctccag agctggggtc aatgagcttc tctcattaag ccatcatcca 7800
gtgtatggta ctttgttaca gcagtcttag caaatgcatg gttcctcact ggaaccatga 7860
atttccatgc atttatttca tttaaataat aaaacggatc ccctttgtgg cttgtagttc 7920
tgttccattt caaaaatcca gaaaaaagat ttgttcagaa gctagaaatg atgaactgga 7980
tcttgcccaa ggtcataaaa ccacaaaacc ctttacagag cacaaaagtc tgatttttca 8040
aagcttctct caaaagatgg gtcactcctt agtcatttag gccactgaca actgccctgg 8100
actctttatt tatttattta tttatttatt tatttaattt ttttgagaca gagtcttgct 8160
ttgtcgccca ggctggagtg cagtggcgtg atctgagctc actgcaagcc ctgcctcccg 8220
ggttgacgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cacccgccac 8280
cacgcccggc taattttttg tattttgttt agtagagaca gggtttcacc atgttagcca 8340
ggatggtctc gaggtcctga ccttgtgatc cacccgcctt ggcctcccaa agtgctggga 8400
ttacaggcgt gagccactgc gcctggcctg gactcttaca tataataagc ttgacttatc 8460
gtacaactta taattgatgc tttcacgtca tgggaagatc aaattaatgc agagagcgac 8520
tacgtttctg gtgggagagc agcaggggtc ttgagaggaa cagcagtgtt gactgtttcg 8580
ctacctactc tgggtgctga ttacatcttt ctttcgtgca ggcaaatcca cttggagcta 8640
ttttgggctc actgtgggca tcattctttg tatactctgc tcctttcccc catagtttct 8700
ctattgatgg gggattacta aagaatgaag aaaagaacaa aatgaaagtg gcttttgaaa 8760
aattttaaat gactgtcact atgtaacata ttcattattt catgtctcca ctggacattt 8820
tggagatgtg agccttgcaa tacctacatg aatgcttcta tgattatgat tattgttttg 8880
ctcttcgcct aacaacttgc caagtattgt caacctcagt gtgtgagatg gggtccactc 8940
aaacatcagg gccgaagtca ggtagttcag ttaagtgaat ttgataccag gaactagtta 9000
caaaggagtt ggaagggctg gaaagccaaa ctggagaaga aggggaaccc cagagtaaca 9060
atagcaggaa gcctctaccg tctacctcta gaactgggga ggagctgagt taacagagtc 9120
ctggagccat tgctggggaa gaagaacccc aactgcagag gaaaagtggc cattgtgaag 9180
aaggtgatgg tggagaagtc gtctgaatca aaggggagag gatatgttgg ctcctttatc 9240
tttttatctt tcattgtcct aattccttct gggcatggtt aaatgagccc aggaaatgca 9300
gttggcagga atcagcttcc tgtgacatag acagagtaag agaaggacaa aaataatgaa 9360
tctgagagca agcaggcaaa tgaccagcac attaagccta gcacacagta tgttatacgg 9420
gatttggggt agcaaaagat gaaggcaggt cagagaagcc acaactaggg gatgggcaag 9480
gtcaatgagg tatgacgggt attgtataca ggaagagggt cataaacagg agtggagtca 9540
atacaggaga ctaacatata cacatcataa atattagtag agaagcataa aatagtctcc 9600
tggagatcag ggaaacagga aattataggt tttcaggata attcagccat atccaggaaa 9660
cacacacagt gaagtaacaa agagtcaata ggcttagagt ggtacaattc attatgcaca 9720
tgtaggaatt cattccaaat aataggctga aatgtagaca tgagaatcca aaaaagatgt 9780
tttcttagtt tttgccaata tcttagctac gttttttttg gttcaacaaa gtaagttaac 9840
agtcatatct gcttggaaat tgtatttagg ccaggtgcag tgtctcacgc ctgtaatccc 9900
agcacttggg gtggctgagg caggaggatc ccttgagccc aggagttaga ggctgcagtg 9960
agcgacaact acaccactgc attccagtct gggtgacaga acaaaaactt attaaaaaaa 10020
gaaaaaaaaa aggtcgggcg cggtggctca cgcctgtaat cccagcactt tgggaggtcg 10080
aggtgggcgg atcacgagtc aagagatgga gaccatcttg gtcaacatgg tgaaacccca 10140
tctctactaa aaatacaaaa attagctggg catggtggca tgcacctgta gtcccaccta 10200
ttcaggaggc tgaggcagga gaatcgcttg aacccgggaa gcggaggttg cagtgagctg 10260
agattgcacc actgcactcc atcctgtcga gactctgtct caaaaagaaa aaaaaggaaa 10320
agaaactatt gaaatagctg atattagttt gcttacttgt cgttactctt tttcatgatg 10380
gattataaag aaaagttata actatttgaa ttttctgctg atttgaagtc tctataaaca 10440
gtacattcct ttttggtaca cagagggcac ttatctgcaa gaaaggcaaa gaaaatggaa 10500
aagttaatga aagaggaatc atccaatcca cgaacagaat gaaaccacat acacagtgaa 10560
gaaacttgtc ttacattttc ttccttatat tacttatcat tcatggtagt gactactttg 10620
gggcttgagt aaagcttctc taatttattc catgtagcat catatgtgaa aaagacaaat 10680
agatacttta gacatgataa taacacttta ttttttattt atttgtttat tttgagacag 10740
agttttgctc ttgttgccca ggctggagtg caatggtgca atctcagctc actgcaacct 10800
ctgcctcctg ggttcaagcg actctcctga ctcagcctcc caagtagctg ggattacagg 10860
cacgcatcac cacgcccagc taattttttg taattttagt agagacaggg tttctccgtg 10920
ttggccgggc tggcctcaaa ctcctgacct caggtgatcc acccaccttg gtctcccgaa 10980
gtgctgggat tataggtgtg agccaccatg cctggcccat aacaccttat ttaaaaataa 11040
tctgtctgga tccatacaac ttgtctggat aactaaattg gaaattattc cttgttttaa 11100
agtaattcaa ttgaaaattt ttaaattttt ttgttaatca agcacttttt ggtggaatct 11160
aaattaacac atgtaggaga tgcctgtttc actaattaca caggcatctt gcagtaatta 11220
atgtctggga ggaaggaatg tcttttgctt actctcttct tcttcacaaa aatgtgaatt 11280
ttggaaagca ataatggaag catgtagaat tatagaaata caaatgtata taactatcac 11340
aaaaaaatga ggccaaagga ctattcagat ataattaggc tatggtagct gtaattatct 11400
aggaaattaa taaaattcat tcacctagaa attattagtg agcatcaaat atgtgtcagc 11460
actaggctag ggtctcagaa cgtacagata aatcatagtt ctggcttcag ggagttatat 11520
agattagaga taaaacctaa ctacaggggc tgggcacggt agctcatacc tgtaatccca 11580
ccactttggg aggccgaggc gggtggatcg cctgaggtca aggagtttga gaccagcctg 11640
gccaacatga taaaatcctg tcactactaa aaatacaaaa gttagccggg aggtagtatg 11700
tgcacctgta atcccagcta ctcgggaggc tgaggcagga gaatctcttg agcctgcggt 11760
ggaggttgtg gtgagctgag atcacgacac tgcactccaa tctgggcgag agagtgagac 11820
cctatctcaa aaccccaaac aaaacaaaca aaaaaaccaa acctaactac agggctatga 11880
gagatgacta ctggcaagga gccacaggta gaacaaaggg gatgtgtccc caggcaaagg 11940
gtagtcagca agcctgcaac ctcagggttc ccggatctga gcctctggct cttggctagg 12000
caggccccaa gcgttggcct cctgccatgg caagctccag cctggtctcc caccttgagc 12060
taacattcat atgttgtaga cacagccacg cttcctgctt acctgtcact tccagttctc 12120
gaaggcaccc ttttcaaatg aaaatccgcc ccttttcaca tcaaacagct catctggtcc 12180
tgtggattac atttctcaga aatgcctctg aacattcgcc tcctctccac ccccactgcc 12240
tctgctacag tgcaggtgct cgccatttct gatttgttct gtcacacact cgtttatcag 12300
gtctctccat ctcctgtttt gacatgctgt aaagcaattt gccactggaa aaaagggctc 12360
tctttttttt tttgagacgg agtctcgctc tgctgcccag gctggagtgc aatggcatga 12420
tctcggctca ctgcaacctc tgcctcccaa gttcaagtga ttctcctgcc tcagcctccc 12480
taaagtctgg gattacaggt gcacgccacc aagcccggct aatttttgta tttttagtag 12540
acgtggggtt tcaccatatt ggccaagctg gtctcgaact cctgacctca ggtgatccac 12600
ccgcctcggc ctcccaaagt gctgggattt caggtgtgag gcatcgtgcc cggcctctct 12660
ttccaaagta tgttattatt tttcccaaga ccctttgacg gatcctcatt tcctacacac 12720
agtggttctc aaacttggat gtactccaga attacatagg aaattcttca tttttttaga 12780
cgaggtcttg ctatgtttct caggttggtc tcaaactctt gacctcgtgt gatcctccgg 12840
ccgcagtctc ccaagtagct gagattatag gcgtgccact gagcccagct ggaaattttt 12900
ttaaaacaca gattcctctg aatcaaaatt tctagaagtg aggtctgagc aatctgtatt 12960
tttaacaagt tatccagatg gctctttact gtcagtctgg ttccagctga gggagtttta 13020
gaattacaag gcaaagtcca aacttagcac acaaagtcat tcacatcaac tcttcccctg 13080
tacacaccct atgtcatagc cagagttgta acccatttct taaacaccca gggttctttt 13140
aagtctctgt gtcattgtat gttattttct ctagaattgc ctttaacctc ctttccaccc 13200
tggaaagcat tccctaagcc atctttgaag ctttctttga tctctaactt agagtcctcc 13260
tctccttcta aagccctgtg ttaatcactt gtcatggtgt actttaattt ttacttgcct 13320
gtttctcttt acggtacttt gacttcaaag ggtggggctg caaattagtc atctccttag 13380
agtccagcct tgttcctagt tcctaactgg cacttaatat aaacgaatga atgaatggac 13440
aaatgaagag aatgctagtt atgataaaga attggccgtg tatgagacta cttctcttta 13500
tgaactaaat aattatatgc ctttcaataa aatactagta cacgtagcta gcacaagctc 13560
atcagcattt gagatgatat ggaaaccaaa ataaacaaat gctaccacaa aaacataatg 13620
actgctttcc ccagtgcagg actgatggaa tcatcaaaca ttgagattaa tgtaatgttt 13680
ggcagatgtc cagtgttttt atttttcatt tgcctttgtg ttcatttatg gactaacaat 13740
ataataaaca cacacatact cacagtacat cttttttttt tttttttttg caaagcccag 13800
ttttcttcat cgcatatctt tgttttcttc aagtatcccc ttacttaatg ttggtagtat 13860
tttttttaat gaaatataaa tccctaacca ccaagcaaga aatgagactc ttaattgcat 13920
cagtttacag tgcaatgtga gtgtaaatag tgtaaattga atttttaatg gacttttttt 13980
tttcccgttt ttgcttgcct tacattcatt atccctccct gggtaataaa catttatttt 14040
tccctttgta accactcctc cccttctgtc catgtggttc tttttagtgg agctggtggt 14100
agggatgtgg catgagattc aagcttggcc acctggagtc actgtgttgt gctccagaag 14160
gacacctgat ccaagtcagc cagtaagagt gagccccagg atttttgctt ggaccactga 14220
ggaaaagtgt actctgccct gtggctgatc aaccattagg atataagcca ttgttgtagc 14280
tgtgtgagtc aagctacctg agaatgagga caacacagtg gcaagcaaca ccaagagaga 14340
aaaagaggca gattctgatg acatttttga gcctttgcat ccagctatgc ctgaatccaa 14400
tttatcccct ggaatttaca cttacttgag ctccacccac ttgaaagaaa acatttcttt 14460
ttattcttag cctgatttga atttggcctc tctcatttac tacccaaagt gtcttgacca 14520
ctagaatatt atgccagact ttacagcatc attgaatttg ccactttcca gaagagttgt 14580
gtgaattttc aatgtagctt ttaccttcta tgagtatcta gagatatatt taagtagaag 14640
tactccacta gtttgttgtg agatcttaag tcacttaatt tctctgtacc ctagttccct 14700
catttgctag acctagggag ctataatgtt ccttctgcaa aattcttatt ttgtgaaata 14760
ttctagaatg tctaactgat acactgctag aacaactgac tgctatttaa gaagagttga 14820
ctgctattta aggatcataa ttctctaggc ataagtgctg tgacggcaca gcgtgtgcat 14880
cggggctgag gggtggggtg gagcagaaag taggaggaga aagtttgata aacttccttt 14940
tggataaatt gaaaacagtc aaataattta taatttctta tattatcatt attagcttct 15000
tctataatta ggagacttgt tccaaaatgt gagaattgtc acaagttgtc aaattcatca 15060
aaggaagaaa atggatgtct cacaaaaaag tatgctcagt ccaatttctt ctcgtcacac 15120
tggaacaaac tgaacagttt tacacagaga tgagaagcct ggacattttt caaatatgtt 15180
ttgaagagaa tggcaatgcc tgagacagaa gtaggaaaaa gcaatgaata tttaaaaatc 15240
tgagctggtg taaaactaga aatagtttta gtaagaacaa tgtgatgtgc tacactaagt 15300
gaaatgtata cattgggcca cattataatc aaaaataaga atgtactttt attcatcttt 15360
tatttaaaca ataatcaagg tggcgggcgc ggtggctcat gcctgtaatc ccagcacttt 15420
gggaggccaa ggtgggtgga tcatgaggtc aggagttcaa gaccagcctg gacaacgtgg 15480
tgaaaccccg tctctactaa aaatacaaaa attagctggg tggggtggca tatgcctgta 15540
ataccagctg ctcggggggc tgaggcagga gaatcgcttg aacttgggaa gtggaggttg 15600
cagtcagcca agattgtgcc attgcgctcc agcctgggtg acagagcaag agactctgtc 15660
tcaaaaggaa aaaagaaaaa aaaaaaatca aggtaccatt tgtaccattt cctggaattt 15720
ctccaaagtg gcaaggtcac atgtttatac attagactcc cagtttaaca cacagcagac 15780
aataactttt tttttttttt tttgagatgg agtctcgctc tgtcacccag gctggagtgc 15840
agtggcacaa tcttggctga ctgcaacctc cgcttcccga gttcaagcga ttctcctgcc 15900
tcagcctccc gagtagctgg gattacaggc atatgccacc atgcccagct aatttttgta 15960
tttttagtgg agatggggtt tcaccacatt gtccaggctg gtctcaaact cctgacctca 16020
taatccagcc acctcagcct cccgaagtgc tggtccaccc ttccttcttt tctcccttcc 16080
atccttctcc cttttattcc atttttctaa atattagacc atagtacaaa tcaaaagtca 16140
caaactgata ggctgcaatg tagatacagc tgggaaaatg ttttgtttgc agaacactgg 16200
ggaaatttaa catgaaaaac tggaagatct caatccacat ggccacatgg taatattatt 16260
aatgttgcag gggctttcca attcaacatg tcctctgcat ccctactatt tatactgcca 16320
ctcatccacc tttctgtatt actggcctat cacctataca cgtttgagtt tatattcttc 16380
tggctttact tagcaactta ccttttatat ttaacattac aacatggtat tatcaattag 16440
tattcgattc agttgcatat aaccaaaaat gccaaattat actggcttaa acactaagga 16500
tttatttttc tgtcatataa aacaagtctg gaggtgggta gtccagggct aatatgacac 16560
tccagtgtca caaggtacct gggctccttc tatttatctt tttttttttt ttttttgaga 16620
cggagtcttg ctctgtagcc caggctggag tgcagtggtg cgatctgggc tcactgcaag 16680
cttcgcctcc cgggttcaca ccattctcct gcctcagcct ccggagtagc tgggactaca 16740
ggcgcccgcc accacgcccg gctaattttt ttgttatttt taatagagac gaggtttaca 16800
ccgtgttagc caggatggtc tcgatctcct gacctcgtga tccactcatc tcggcctccc 16860
aaagtgctgg gattagaggc gtgagccacc gcgcctggcc ctatttatct tttataggac 16920
atggcttcca gtctcaagtt cagtttgtca cccataatgg ccaaagagca gtagtcacct 16980
tacctgtttc aggcaggaag ggcagagggc aagaaacaaa atggtgctcc tcctgattga 17040
gtcagcgttc tttaaagatg ttttccagat gttccaccca gccgcgtttt tttttttttg 17100
agagacaggg tcttgctctt gtcacccagg ctggagtaca gtggcatgat catggctcac 17160
tgaggcctca atctcccagg ctcaagcgat ccttccattt tagcctccca agtagctgga 17220
agtagctggg accacaggca catgccacca taccctgcta actttttcat tttgtgtaga 17280
gacaaggtgt cactgtgttc tccaggctgg tctgcagttt ccaactcctg agtgcaagtg 17340
atcctcctgc tttggcctcc caaagggctg ggattacagg tgtgagccac tgtgtctggc 17400
caagctactt ctacttatat ctcattggtc ataacttgat cacacagcca catccagcta 17460
caatggagat tgagaaatgt agtcttttgg ctgggtacac agcatctgaa taaaatccag 17520
gcattgttac taaggaagaa ggagtaagtg tcaatctctg ctccataact ctctaggtta 17580
atacacacag atggaggaga ttgctagttg cccctcaaga tccagccttg ccttctgggc 17640
taagaaagcc cctgagattt acctggccat agtggcactg ggaacaaaca atgtatttct 17700
aaatcttctg attttaaaat ctttcagaat cacgatttct ccgacatcag tatttttatg 17760
tctttagaat tcaacaaaat gaaattccta agtctaatat atgtgaatat taagttttag 17820
cagatactgc tacataactt tccagaaggg tgtggcaatt cacatctcca ccagtgatca 17880
gcatgttcat tttccataca gctctggata ttttgtctat tttaaaatat cttcttctaa 17940
tctataattt aaaaatgtaa cttagtagga atttaattgt tcatgtaacc aaatcttccc 18000
attaatggct atgggtttct tcttttactt cagaaagtcc tccccacctt cagagtatat 18060
aaacattttt ttctaaattc ccttctaatt tcttataatt tatagtttta tttttgttat 18120
ttgattcatt tattctctca acagatattt attgagcact tattatacgt caggctctct 18180
tcaaactctg gtgagagtat tttctaactg ggagagacaa ccctagttga taagaaacaa 18240
acaaaccaat aagtaaataa gacatttccc ccagataatt aatacttggt gacgggggaa 18300
gacagtgaga caggctactt tacactggca ggtcaggaaa ggcttctctg aggaggcaag 18360
tgattcagga ttaattgatg actggtggag aagtccgggg agtggacaca ggtgggaaca 18420
gcctggtggg tgtgaacagc aacaagaagg ttaatgtggc ttcatggaac agggtgaaga 18480
tgagacaagc tgaacactga ggtgggcacc agaacatgga gggctttgta ggtcccaata 18540
aggagtatgg attttattgt atactggaga tttgtcatcc atctagaatc tgtttttata 18600
tataagaaaa ggtgtatatg tttgcgcaag tgtgtgtgtg tgtgtttggg ggggcggggt 18660
gggggcagac agggcgtaac ttttctttaa attagagtca aaatttaatt aaactattca 18720
ttctttacag gcagtgaggg gattaggatc ttatcccaca gaatctcacc tcatttcaaa 18780
tgttgtacag atattatctg agatatattt tcaggccggg tgcggtggct cacgcctgta 18840
atctcagcac tttgggaagc cgaggcgggt ggatcatttg aggtcaggag ttcaagacca 18900
tcctggccaa catggtgaaa ccccatctct actaaaaata caaaaattag ccgggtgtgg 18960
tggtacacgt ctataatccc agctacttga gaggctgagg caggagaatc gcttgaatcc 19020
aggaggtgga gcttgcagtg agccgagaaa acgccactgc actccagcct gggcgacagg 19080
gcaagactct gtctcaaaaa aaaaaacgaa aaaagaaata tattttcaat gaaatcaagc 19140
atataatgac tatttttatc ccagcatctt ggcttcttca ggctgctata acaaagcatc 19200
cctagtggag catccctaat ctgaaaatcc aaaatccaaa acgttccaaa atctgaaacc 19260
ttctgaacac tgacatgaca ccacaaatgg aaaattctac atgtaaatac acgtaaatac 19320
aaactttgtt tcatgcacaa attaaaaata ttgtataaaa ttaccttcag gctatgcata 19380
taaggcatat atgaaatata aatgaatttt gtgtttaccc atgggtctca tccccaagat 19440
gtttcatttt gtatatgtgc atactcccaa atctgaaaaa atccaaaatc ttaaatatct 19500
gtagtcctaa gcattttaga taagggatat tcaatccctt atccataaac aatttattta 19560
taaacaacac aaatttaggc tttgtaaaaa atagaaattt ggccgggtgt ggtggctcac 19620
gcttgtaatc ccagcacttt gggaggccga ggcaggcaca tcacttgagc tcaggagttt 19680
gagaccagcc tggtcaacat ggtgaaacct tgtctctacc aaaaatacaa aaattagcag 19740
ggcttcgtgg catgcgcctg ttgtcccagc tactcgggag gctgaggcag gagaattgct 19800
tgaacccgga aggcagaggt tgcagtgagc caagattgag ccactgcact ccagcctggg 19860
ggacaagtga gactccacct caaaaaacaa acaatcaaac acaatataaa tttatttctc 19920
atagttctgc aagctgagaa gtccaagatc aagatgtgag cagatccacc tttggtgaag 19980
ggctgctttc catttgatag atggctgtct tcttgtgtcc tcacatggtg gaaagggtga 20040
ggcagttttt tgaggtctct tttaaaagag aactaatccc attcatgtgg gggtctgccc 20100
tcatgaccta atcactttcc aaaggcccca cttcctaata ccatcaccct gggggttaaa 20160
ttttcaacac acaaattggt tggagagtga gcgaacatag acattcagtc tatagccccc 20220
agggatgtag ccactgaata aaataatcta gaacttcatc tagaggcagt ttataagtca 20280
cataagaaaa ccagttttac ttatagtcac ataaaacttt tgataaaaaa caaccctagt 20340
tgataagcca tttgtttact ggacttggct ctgaagaaat gacttttggc taatcctcaa 20400
aatgaaatct actcacagag ggcaagatct gccaccagtg aagatgttta aaacaatgtg 20460
ctgtaggctt tgaaggcaag tctaaagaag agcttctaaa aatattttgc acaatggtag 20520
cattaaaaga gtaggcacat gggccccaag ataacatctg tgaagaggag gaccagtgtg 20580
tgtttccttt tgtatgttta agtactaagt cagtgattac tttataatta aaccatattc 20640
ctcttgatct gtccataata aggtcactct gtaatttata ataggcttct taccaaattc 20700
aagctttaca acaaccctat aggttaaata ttcctgtgaa ttttatagat gaagaaacag 20760
agtaagtgaa agagttcata ctcaattcaa gtctcttgag tctaaaatca gtgctctctc 20820
tacataagaa gttagttgct aagatcacac aacttgagaa gagagaagac agttttcaca 20880
gtccctcccc tctgaccact aggctgcttg gggtactttt acaacttacc tgctctgaat 20940
taaggctctc tgtgaatctg attcatctgc caatttgcaa acagtcagcc ctgtagtacg 21000
tacctaagtt gatttttaaa atactatttc tcatcttaaa ataatggaaa ttgagtgaca 21060
taaatttcct ggacactttt taagatccaa agacaatttg ctaatttgtc gttacaatta 21120
aagagccccc caaaaggcgt aagaactgga ttttgacttg gacttctgtt ccttagtttc 21180
tttaacatat tgggggccgg gagtggtggc tcacacctgt aatcccagca ctttgggagg 21240
ccgaggcggg cagatcacga ggtcaggaga ttgagaccat cctggctaac acagtgaaac 21300
cccgtctcta caaaaaatac aaaaaaaaaa aaaaaaaatt agccgggtat ggtggcgggc 21360
gcctgtagtc ccagctactc aggaggctga ggtaggagaa tggcatgaac ccaggaggca 21420
gagcttgcag tgagccgaga tcgcactaca ctgcactcca gcctgggcga cagagcaaga 21480
ttccatctca aaaaaaaaaa gaaaaagata ttgggaaaac tcacttaaac tctatgggct 21540
tctgtaccac taaggcttct caaatttgat gcaagtaatg ggaacttgct gtggctaact 21600
tgagccacag gagaaggata ctgcaagact cacaaatgct tgaaagtttc ggaacaggtt 21660
tggaaatggg taagaaccaa ggaccgggtt gacctgaact gaaaggaaat tgaggtgcta 21720
ttagggacaa atatgaaatg aaggatgaac tgtctctgac atcctttgct tctgtgtttg 21780
gagatgagta agcagggagt gggtgcatat gcaaacaggg tggtcagaaa tgctttggcc 21840
ggatgtgtga ctgaaggcta tgtgcagctg aggaaggctg ggccaccaca gtagcagaga 21900
ggctgaccaa tttggcatgc agcaagcagg aagtagaagg gatcttaagc aagcaaagtg 21960
tttgggtaga caagattatg aggaatgagc accaatgaca tttccaacaa gcactgaaag 22020
cttccaaatg cttctaacag ttactgcctg tacaaacaca ggacagtctt gactatgtga 22080
gactgtgaca gtttcctcat gcctatgaaa tgagagacag tacttagcac tgacatgagc 22140
ttcatatttg aaggcagcaa actactgaac cacatgtagc ttccgaaatc aaaagatgca 22200
aactggcaga ccacaggtca gatatgacat gcagaaaaaa attagttact atcttagcct 22260
agtttgtgct gcttacagaa tatcagagac tgggtacttt atagagaaca caaattattt 22320
ttcatagttt tagaggctgg gaagtccaag atcaaagggc catcatctcg tgaaggcgtc 22380
cctgctgtgt caaaacatgg tggaaggcat cacatgggca aaagagagag agggaagcgg 22440
gggcaaactc ctttttatca ggcacccagt cctgtgattc attcatgaag acagtgtcct 22500
cctggcctaa tcacctctta aagctcccac ctctcagcac tgttgcactg gaaattatat 22560
ttctcacaca tgaactttgg ggaacacatt caaaccatta cagttaccaa agataaaaat 22620
gcagatttca gatttctctt ggggaagaaa aaaggctctg gcaataccag ggctgtattt 22680
ccacatggca acagttgtct gttgccttct gttgggttgt gggctctcac attgccatac 22740
cctcctcatg gcccccttca ctcataacag tacctgccta gacctcgaag cactagtttc 22800
caaccctgct tgagttaact acttccatga caactgtgca aggccagagt gtgggcagct 22860
accttgaggg ccaccggcat gggctgccca agtgaccgag ggcactaacc tctgctctcg 22920
aaacttcttt ggtaggatct cttcactcct gacttactac ttgtaactgc tggaaacaac 22980
catttattct acccctacta aaccacatct gtcttttctg tcagagccaa tcttcaagca 23040
tatgcttcct caaaagactt taattaccag gtagtagaag cggcagcaaa gagtccccat 23100
ctagcatctt ctaaaatgta gtggagaaac caacgacaac gaatctgaga caaccagttg 23160
tttgacttct ctgaaaacaa cctctaaaaa aagccttctc tcgtgaatag ctgcagacat 23220
gctgggcact aattgatgat gatgcccttt agtgagtctc ctctgcacat acctgattcc 23280
atttggatgc tggccctcac atacttctat ctgcgaactc cggaacacag aatatcatac 23340
aatgtatgat tcaatctgga ctctgctgga gccattctct acaaagcaga cacaactttt 23400
tcttgcctaa atcctttcaa gttgctttat ttttattttt aaactaatta ccataaatct 23460
aatttatcaa gctgctttta agataaactt taaaatgctt agagcagtct acaaattctt 23520
gcactgtttc actcttcctt atctctcagt cttcatctcc cattgcatct tctctgactc 23580
tttcatatgg atcttctttc aatttgtgga agaagccaag cttgttcctg cctcaggtcc 23640
ttgacacttg ctgttcactc tcctgggaga ctcttccccc catcttagct tttaaatacc 23700
agctggtcag actccttacc tgccttccac cttcctctca ttctcccact cctcgccttc 23760
atttctcaga gtcctccgct ctcttctttc tattgctctt aacacaattt gtctgttttc 23820
cgctaatctg taaactctac aagagcactt aactattttg catcccaccg aatattcgga 23880
gtcagcacag accccgtcat aatagagtag gtaagcaatg cttacctgtc aaatgaatga 23940
atgaaacacc cgattcatcc cccaagccag cttaatacat tagatgatct tatggactga 24000
ataagacatc cctcctttta aagaatattt ttgttttagc ttcacatcag caaaccccga 24060
acggttcatc ctaagataag cctggtagag aggaaagata ctaaccttct agggtcctaa 24120
agtggaacta ggaacttatt agatatgcac attctcaggc attatttccg atagcccagt 24180
cagagaattc tgggggtatg gcccagcaat ctgttttaac aaacctttca ggtaattctg 24240
atacacacta aagtttgaaa ggtttcttta aggctttcca gttttctttt cttttttgga 24300
gggatggggg ggggtctccc catgttgccc aggctggtct cgaactccta gcctcaagct 24360
atcctatcct cccacctcgg ccttccaaag cattgaaatt acaggcatga cccactgcgg 24420
ctcgcctccg tttctaactt aaaaaaattt tctttggagg ggagccttaa tcctttctat 24480
tatcctgcta gtagaatctt actactcctg agggtaatct ttgtcataat ccaaaagcct 24540
tgaataaagg cctatttgta tagttatgca gaatatattc ctgggaggtt tgccttccta 24600
ggagcacagg tcggccctgg gaggtggggg ttggggggca gggctgcatt ctaaagtcct 24660
gtaacaacgc acaagtacaa ctgaatagaa ctcggaacaa aggcatcagg gccacggtgc 24720
aagtctttgt tcatccgttc cccgactgct caccctgtct gataccgctc ttttccaccc 24780
agaaaagcag ccactcaagt tttaagaatg gatgtatgcc gcggacgttt tcgattaggc 24840
cgttttctct caggcactgg aggatattcg tggctgcagg aggcgcttcc accctttcct 24900
caacctagca aagaagtaac tgaaactaac ccaagggtta caaccgaaaa gccccttcca 24960
gcttcagaag cagaactgga agctcggata gacttctccg cctctacact cctggaaaac 25020
ccgcagtgga tttcaccaac ttcaggatcg gagcccaggc aggcgaacgt accttattgc 25080
gcatgctcgc tagcccctcc cgctcggagc ggaaggggga gcgctggggg cctgggcctg 25140
gcctggccgg ggcgtcggca ccggcggcca tcttggcttc ccggggaaag gcggcgtgag 25200
gggaagaagt tgtagggtgg gggcaggagt gaggaggagg gaagagagag ggggaggagg 25260
ccgcggcggg gcagggcggg gactgcctgc ctgcctgggt tgcggaagtg atagccgccg 25320
accgagcctg ctgctttctt gctactgctt cggcttcccg gctacccccc ggacggtgaa 25380
ggcggcccag ctgtggatgg tcagatagcc cttgtctccc gccgccaatc tctggcccct 25440
agcagcacgg agcagacggc ggcagcagca gcagcaggcg aggaggaaga tggcgggacg 25500
gctgccggcc tgtgtggtgg actgtggcac ggggtaaggg ggcttacggg cgggggtggg 25560
gaaactgagg cggaggaagg aagatggcgg gggagggagg aggccgggaa atgaatggtg 25620
cggcgaggtg ccgccgccgg ctgtcagtcc tagacccgcc ggccagcgag gggtggggcc 25680
cgcagccagg gcctcgcggg tcccctcgtt tctccctcct gggactgggg cgggggcgcg 25740
ggcccgagat tcaaccccca accctcccag cggctttctc cgcgcgaccc ctcccggccc 25800
ttcccccact acggtgggca gcgccgccca aagggcgctg gggacggtcg tcttgggggt 25860
ggtccccggg cccgacccat ccggctttcc tttccctccg cgcccgtttt tgccagtcgg 25920
tttggggacc caggggccga gctcggggac tggcctggca ggggagctag aaaagagaag 25980
cgctcctggt aggtttgaca agatcgctgt gacaacattc tgcccagggt gtgggtgggg 26040
aaagggaaga atcggactct gaaaatggga acctacagtg gggctttcat ttgaccaccc 26100
accttctcct ttcgactcct ggtcatttcc atctccctct gcgttttaac cggtgaacca 26160
agtcacattt taattcgagg gagaaagatg tcatgtgtta cttctgtagc ctcaaaaaag 26220
tcccccagtg agcaagcgcg ctgcaacttc cttagttttg tcaaagccgc ttcctgcttt 26280
cagtctttta tacccttata aggtagtttt tagtttccaa cctgagcaca tcttactaga 26340
acttttaagc aggttttaaa gagactgaat taccggtgct tggtgtccat ttatatgact 26400
taaaaaaatg tacttatgtt tcatggagtg ggggaaagga agcaccctgg aaaataaact 26460
aatttaagtt gtattcgttc attctgtgat ggtatcttga aggaagcagg aaggtataga 26520
ggtatatagg agggtgttta agttgcaaat agttactcgt agatatgtag ggtagtttgc 26580
gaaaatgtag agtggcttta aagtgtggtc gttcattttg tattaataga cgttttagag 26640
agttgtacca cactcataac tgcatagaga atagactacc cttattttta tgtagaatca 26700
ctgcttcagg atgacatata ggaaagtggt ttttttttct gtgctgatga catctctcca 26760
attcccagaa cactcccagt tttttttttt tgagggggaa gtc 26803
<210> 19
<211> 26803
<212> DNA
<213> Homo sapiens
<400> 19
gccgcaccta ccgctggcct cagacatcag caccccaaag ggtatgttgg agtcccatgg 60
tggaggtgcc ggccgctcct ccacgcactt gatgtatacc gaggatccca tgcttgacgt 120
cgcagggggc attagccagg agcacgttgc tgggatgcca gtccaggctg aggatggtgg 180
agccaatggg cttcttgatg tacttgcaca cccaccagtt attctcccgc tggaaataac 240
agatggcgat gacacacagc tgccgcccac agcaaacttg tcctgtgggc ccagcacaca 300
cagcaggcag tgggtgcggg cttaccctcc tggcccgtca gcgtccacac agaggccttg 360
tggcctgtgc cataggtcac gatgaggtta ctcttggagg cccagttgat gccttttacc 420
tgcccgttgt gctccttgag ctcgggcacc ttggcccact tggccccact cttacagctt 480
cgtggttgtt gaggcagatg gtggccatct gggtgcggcc cttgctccag gtttggcagc 540
aatgggttcc tgcagtcagc tgtgggaggc tgtagttgct ctccttttca gagtacccca 600
gctgcagact ctgggcagga cgcacccaac cagtgctctg gttttttgaa gtaaaaaatg 660
cataatgcaa ttttaccatc ttaaccattt tttaattatg aaatccggta gtgttaagta 720
taattgtgtt gttgtgaaac agatctccac aactttttca ttttgcaaaa ctaaataact 780
cctctttccc cctactccca agctccaggc agctaccatt tctgtttcta tgaatttgac 840
tacttatatt acctcatata aaggggttca taagtatttg tcttttcttg cttggttaca 900
tcacttagca tgatttctta agtttcattc atgttgtagc acatgtcaag atttcctttt 960
ttttttttaa aaaaaaggat gaagactatt cgtttgtatg tatatgccac attttgttta 1020
tccatccatt tttcttcaaa tgtttgagtt gtgtgatgtt taattatgtg tcaccttgac 1080
ggggcaaagg gttgcccaga cagctggtaa aacattattt ctgggtatgt tagtgaggct 1140
gtttccagaa gagattagca tttgaattgg caggctgaat aatgaagatc tgccctcatc 1200
aatgtggatg ggccagaaca aaccaaaaag gtggagaaag gaccagttat ctccccacca 1260
cccctgtgcc ctttagctgg gacatccatc ttctgccatc agacatcaga gcttctggtt 1320
ctcaggcctt cagactccag aagttatacc agtggcttcc ctggcttttg gactcagact 1380
ggggtttcac tgtatgtttc cctgattctc aggcctttgg acttgaattg aattacagca 1440
tgaactttcc tagttctcta gcttgcatat ggcatattgt gggacttctt gacctccata 1500
atcatgtgag ctaattccca taataaatct cctcttatgt atctataatt catatagata 1560
tgatatctat atatcaatcc catagataaa tagatgtctc atatatatat caatgtctct 1620
atatgtagat gtctcatata tggtatctat gtatctgtat catctctata tatctaatca 1680
tctaatatag atgtctcatg atatctatat agatatatct atatcataga tgcagagata 1740
tcatatatat gtctgtttct ttggagaatt ctgactgata caggttgctt ccgccttttg 1800
gctatcatga gtaatgccgc tgtaaccatg ggtatgcaaa tacttctttg agaccctgct 1860
ctgagttctt ttgggtaaat acccagaagt ggattgctgg atgatttggt ggttctactt 1920
ttaatttttt gaggaaatgc catactgttt tccataatgg ttgcaccatt ttataatctc 1980
accaagagtg cacagggttt caatttctct acatccatac caacacttat tagtgtgtgt 2040
gtgtgtgtgt gtgtgtgttt aatggctgtc ctaatgggtg tgaggtgaca tttcactgtg 2100
gttctgattt gcacatctct gataattgct ggtgttgagc atccttccat atgcttgttg 2160
gtcatttata tatcatcttt ggaaaaaatg tctattcaag tcttttgtct attttttttc 2220
cttccaactt ttattttagg tctgggggta catgtgcagg tttgttacat ggataaattg 2280
tgtgtcatgg gggtttggtg tacagattat ttggtcgcct aggtaaatga gcatagtacc 2340
tgataggtag ttttttgacc ctcccccttc tcccaccctc caccctgaag taggccccag 2400
tgtttattgt tcccttctta gcatctgtgt gtagtcaatg tttagctccc acttataagt 2460
gagaaaatgt ggtatttggt tttctgttct tacattaact tgcttagaat gatggcctcc 2520
agcagcatcc atgttgctgc aaaggacatg atttcgttct tcttatagct gtggtgtata 2580
tgtaccacat tttctttacc cagtccactg ctgatgggca tctaggttga ttccatgtct 2640
ttgatattgt gaatagtgct atgatgaaca tatgtgtgca tgtgtctttg tggcagaaca 2700
atttacattt ctttgggtat atatccagta atggggttgc taggtggaat gattaattca 2760
cttttaagtt ctttaagaaa tctctaaacc tctttcccca gtggctgaac taacttacat 2820
tcccaccagc agtgtccaag tgtttccttt tctgcacaac cttactaaca tctgttattt 2880
tttgactttt taatgatagc cattctgact catatgagat cgtatctctc tgtggttttg 2940
acttgcattt ctctgatgat tagtgatgta gagcattttt tcaaatgctt gttggccgca 3000
tgtgtcttct tttgagaagt gtctgctcct gtcatttgcc cactttttaa tgggcttgtt 3060
tgttttttgc ttgttaattt aagtttcatg tagattctgg atattagacc tttgtcaaat 3120
gcatagtttg tgaatatttt ctcccattcc ataggttgtt tactctgttg atagtttctt 3180
ttgctatgca gaagctcttt agtttagtta ggtactactt gtcaattttt gtttttgttg 3240
ctttgtccat tttaaaaaat agagtaattt gattattttg ttgttgaatt gtaggaattc 3300
tttatatatt atggatgcta acatcttatc aaatatgatt tgcaaaacat tttccctcat 3360
tctgtaggtt gccttttcac tattgtgtcc ttcaatgaac aaaagttttt atgtttgatg 3420
cagtcccatt tgtccatttt ttttggttgc ctgtgatttt ggtgtcatat ccaagaatgt 3480
ggaatgtgtc atatccacat tcaatgtcct gacgattttt ttctatgttt tcttccagaa 3540
gttttattgc tttgggtctt tggtttaagt ctttagtcca ttttgagtta atttttgtat 3600
gtggtgtaag aaacaggtcc aactgcattg ttttgcatgt aaatatccag ttttcccagc 3660
atcatttgtt gaccagactg tccttttccc atttagtgct gttggagctc ttcttggagg 3720
tcagttggcc atgtgtacac aagtttattt ctgggctctt tattctgttc tattgatttg 3780
tatatctgtc tttattccag taccacactg ttttattctt ctttttcaaa attgtttgac 3840
tcttagggcc ctttgagatt ccatatcaat tttaggatga attcttctat ttctgcaaca 3900
aatgctattg gaattttgat aaggattgaa ttgaatctgt agactgtttt gagtgatatt 3960
aacatcttaa taatattaag tctaatccat gaatgtgaga tgtttctatt tatttatctc 4020
ttctttgatt tctttcagta atgttttata gttttcatta tataagtttt tacttcctta 4080
gtcaatttct aagaattgtt ttctttttga tgccattgca acgggaatca ttttcttaat 4140
tttttcagat gctttcacta tttgtgtata gaaatgtaac tgattttttg tatgtgtgtt 4200
gattttgtat ctggtaactt tactgaattt ttaaatttgt tctaacctgt tttttttttt 4260
tggtggaatc tttaggattt tctgcatata agatcatgcc atctacaaac agaaattttt 4320
acttctttct tcccaatttg gatgcctttt attgcttttt cttgtctaat tgctttggac 4380
tggagttcca atactctgtt gaatagaagt gtccagaaca gacatttttg ccttgttctt 4440
aatcttagag gaaaagcttc cagtttttca ctgagtatgc cgttagctgt ggacttttcc 4500
taaacaacct ttattatgtg caggtaattt ccttctcttt ccacttttga gtgttttttt 4560
tcttttcttt tctttttttg tgtgtgaaag gatattgaat tttgccaaat gcttttcctg 4620
catcagtgga gatggtcatg tgggttttgt cctttattct gtaaatgtgg tgtactacat 4680
tgattttcat atgttgaacc atccttgcat cccagggata aatcccactt gatcatggtg 4740
aatgatcttt tgagtgtgct gttgaattta ttttgctagt atttttttga ctacgttcat 4800
cagacatatt gggtaattat ttattttttc ttgtagtatt tttgcctagc tttgatatca 4860
cactaatgct gcccctcaaa gaatgacctt ggaagtattc ctttctcttc agtttttggg 4920
ggattgatgt aaattctttt tttttttttt ttggagacag ggtctcactg tcacccaggc 4980
tggagtgcag cggcacaatc atagctcact gcagcctcta actcctgggc tcaagcaatt 5040
ctgcttcagc ctcctgagta gctgggacta taagcatgtg ccaccatgca cagctaattt 5100
atatatatat aatataatag ataaatatat atatatatat atatatatat atatattttt 5160
tttttttttt tttttttttt tttttttttt tgcagagaca aggtaggtct tgctatgttg 5220
cccaggctgg tctcagactc ctaggctcaa gtgaacctct cacctcagtc tcccaaagtt 5280
ctgggattac aggcatgagc caccacgtct ggccagtgtt aattcttcaa tatttggtag 5340
aattcttcag tgaagtcttc tagtcctggg cttttctttg ttgggaggtt tttaattacc 5400
aactcaattt ccttactagt tattggtcta tttatatctt ctatttcttc atgattcagt 5460
cttggcaggt ttggtgtttc tagaaattta tccatttctt ataggtcatc cagtttgttg 5520
gtatagttca tagtcttctc ttataatcct ttcttatctg tagctcagta cctcctatct 5580
ggagatgcag aattaggaat tgaaactata ataggccccc cttttataat ggggtgtcct 5640
tatttttacc ttctcacctt gcaataccct tgtcttgcta gtaaagaaag aagggaaatt 5700
tgattcagga ggtaatcata cttttcaatt tgtacaagat ctaatagcca tgaactccta 5760
tgtcattcct caccatccca taattcttag cccagccatc atccttacct caatccctgc 5820
tggtgcagcc tggtttattc tgttaatgtg ctgtactgca ttgaggtaag gacttctgct 5880
cagctttctt cttgatacca ttgtaccttg attcacactt cctcttgtga aataaagttt 5940
agcatgaagc tgctttctta catattttaa gttcggctta aaggtttttc tgtacatcgt 6000
gaactgtaac aagtggaata taaccagacc gtagcttaca cttgtgccat ttaccaagtt 6060
ttggccaatc aaatgtagcc aactgtttga actgtattca aataagggaa atgctcagct 6120
gtaaccaagc caactgtttc tgtacctcac ttctgttttc tgtatgtcac tttccttttt 6180
ctgtccataa atcatcttcc atggcgtagg tgtgctggag tctcagagtc tattctggct 6240
caggaggctg cctgattttg aatcattcat ggctcaatta aacttcttta attttttttt 6300
tttttgagat tgagtttcac ccttgttgcc caagttggag tgcaatggtg cagtctctgc 6360
tcactgcagc ctctgcctcc tgggttcaag cgattctcct gcctcagcct cctgagtagc 6420
tgagattaca ggcacatgcc accatgccca gctaattttt ctatttttag tagagacagg 6480
gtttcgccat gttggccagg ctggtctcga actcctgacc tcagcctccc aaagtgctga 6540
gattacagat gtgagccact gcacctggct tcactccttc aaatttaatt cagctaaagt 6600
ttttattttt ttctctttct tttttttttt tttttttgag acagagtcac tgtcacccag 6660
gctgaagtgc agtggcacaa tctcggctca ctgcaacctc cgcctcccag actcaagcga 6720
tttctggcta atttttgtgt ttttagtaga gatgggtttt caccatattg gccaggctga 6780
tcttgaactc ctgacctcag gtgatctgcc tgccttggcc tcccaaagtg ctaggattac 6840
aggcatgagc cactgtgccc agcctcaaat ttaagaagaa acagttaaca tggacttgca 6900
tacctccagg atattgtgaa tacctctcaa tatttttcta agttctcaaa gtcaaattag 6960
actctatgac aatcactcaa ggttcccttt gtttccaata tgttgatgac ctgctacttt 7020
gcaaccaaag caaacagggt gctcttctgg actcccttac tcaccttaag gcactgactg 7080
actaaggtta taaatcttcc aggtccaaat gccaacaggt acaaaaaatt cttacctact 7140
taggccataa aatattttag ggtactcaaa aactcgtccc aaaatgcctt gaatcaattt 7200
tattcattat ctctcaaaga caaacaatta cgtgaatttt taggagcaac tggatattgc 7260
caatggattc ccaattttgc tgcccatgtc taacctttat atgctgtcct cttagataca 7320
accacagagc actttacctg gtactctgag gcaccagcct ccttggaagc attgtccaca 7380
ccccagccct tcgactaccc aactttgaca atctttttta cctatattac tgtgaaaatg 7440
atgggattgt tgtgggtatc ttaggacaat ctttttgtcc cataacatat ttctcatgtc 7500
aacctagata tgtcccacag tacctttctc atgttaagta gcatcaggca ttcctccatg 7560
cttatatgca atagacttag ctgccatcct aattgacaaa gcaagtattc ttatactgcc 7620
ccaccattca cctctctgtt ctccatgctg ttcctctaca ttggtatccc tttcaaagtg 7680
gatcttgcct caactaaccc ttaactgttt tttttttgtt tttgtttttt gttttttgac 7740
aattctggca ctaccccaac acctgcttgt tccaatcttt caaagcctgg ccaccttaaa 7800
tagttaatct ggttactggt taggttaaca tctacataat gcagaagagt ttttgttcct 7860
accaatgtaa atatacctgg tgaacccatt ctggacaatg gatatataaa agcatatggt 7920
atccataagc aggaagacaa agtcactctg tctcctcctc tggtagatta atttggcact 7980
gggaagcctc catggaagct caaggtcagt gctttaccca agtaagacta ttggaaggaa 8040
atctctctac attgaaaata aatacagtac tggacctttt ctgggtaaca tttcaaaaat 8100
gtattgcaat caaattctgt gatttggctt cacagatggc actaaacaac cctccactgt 8160
cattgttact tggattataa ctaagtattt caatgtgagt gaatgtcaga ttacaggata 8220
atattcctgg tttgtaggaa aaagtagtgg gatatggaat agctcaagtg ttcccctagt 8280
tggcttgacc agcacccatg actatagttg gatggatgga ccttaacttg gtcaataaat 8340
aaaatacatt tctatagtaa ccaaggctaa attaaagggt ttctctgcca ggtgtttcac 8400
aacctgtttt accctcatag cctaacagaa gcacattgga agtgaagatg tgcagatgcc 8460
aacatgattg atgataaggg ttgtgaaaga cacagaattc caacttggtt gttcacaggt 8520
tccaccacta tgaccttgtc tgtaaacaac actggtctct ctctcttttt tttttttttt 8580
agaaggaatc tcactctgtt acccaggctg gagggcagtg gcacaatctc agctcactgc 8640
accctccacc ttccggttca agcgattctc ctgcctcagt ctcccgagta gctgggagta 8700
caggtgccca ccaccatgcc cggcttattt ttgtagtttt agtagagaca ggatttctcc 8760
atgttggcca ggctggtctt cacctcaagt gatccgccag cctcggcctc ccaaagtgct 8820
gggattacaa gcgtgagcca ctgtgcctgg cctggtctca tttttatgta gcaataagat 8880
atataaaagg ttcccaccta agtggtcaga gaaatgtgaa gttggatatc tggtgccttc 8940
ccttaccaga tatcccactt tgaatgctag ccacattaca actggggttc ttttatatat 9000
aaattaatgc catgtagatg cacctgatga gacatcatag acaacgcact tatgtattgc 9060
aaccctaagt tctcagtaat gagaatgctt ttccaaagcc tggcaatgta cgatgtagaa 9120
agaacaatcc taagcattcc aaagtaatga acaagcatct ggtgccacta tacagactgg 9180
gaagcctgcc atttacaagt tagcagtgta gcctctgttg cactccaaaa ttgtgtccta 9240
gatatgctga ctgcccaaca gagaggagct tgtacaatca ctggcaacaa tgctacttct 9300
atataaatta gaaaggaaaa attgtgtcta atctatatca tttaaaaaga aaggttggcc 9360
gggcacggtg gctcacgcct gtaatcacag cacttcggga ggccgaagcg ggcggatcat 9420
gaggtcaggg gatcgagacc atcctagcta acatggtgaa accctgtctc tactaaaaat 9480
acaaaaaatt agccaggcat ggtggcgggc acctgtagtc ccagctactt gggaggctga 9540
ggcaggagaa tggcgtgaac atgggaggcg gagcttgcag tgagcagaga tcacaccact 9600
gcaccccagc ctgggcgaca gaacgagact ccgtctcaaa aaaaaaaaaa aaaaaaaaaa 9660
aaaaaaaaaa gaaaggtcaa cattctacgt taggtaaata aggcatagtc caattaactg 9720
aactgaactg acctattccc acgactggga gactggttca acagaatatg gaccagtgtg 9780
ttcagatttt tctctgttgt aatctatgtt cttctttcat tttgcagatc tcttacctcc 9840
cagcacctaa tatgagtctt ttctacatag gaaataatcc aaatatttgt gaaacttcat 9900
gtgaagtttc aaatggggga agtgaaggaa cgaacaaccc acctcctaac cccaatttat 9960
acccacctgt gttagttcat ttgtattgct atgaagagat acctggaggc tgggaaattt 10020
ataaagaaaa gaggcttaat tggctcacag ttctgcaggg tgtataggca tggcatcagt 10080
atgtgctcag ctcctggtga gggcttcagg gagcttacaa tcatagctga aggtgaaggg 10140
ggagcatgca tcttacatgg tgatagaggg agcaagagag agggtcgggg ggtgccaggc 10200
tctttaaaca accagctctc atgtgaaata ccagagccag aactcactca tcaccatggg 10260
gatggcacta agccattcat gagggatctg cctcatcacc caaacacttc ccagtaggcc 10320
ccacctccaa cttggggatt gtatttcaac atgacatttt gaggggacag atatccaata 10380
ttcaaaccat atcaccacca gaaaggcata aagattactt taaactgaaa atattggaac 10440
aaacaatcgc tgcggaaagc agccttatct gaccgaaagc agacctgtcc aagagttctg 10500
ctatcatcaa ctccttctga gggactttcc agacagcgag gtgacagatg tttacaaacg 10560
tgacgttaaa aaataaagtt gtgtaaatga gtcttatcag aaccttttat actttctcac 10620
tgaagcctca gttggtatat aaacccttac cactggctgt ttgggaagtg actccttaca 10680
gagtgctccc tcaggcatgg agaataaact tttctcctgt taatgtattt tcaactaatt 10740
cgcaggccct agaccactca gatctaagtt gacagatgaa atgttttcct cccaacatga 10800
ccaagcttat agtgctttta tggtatatct gtagagattg cggtcaggca taacattgtt 10860
tgttagggtt gcagtacctt tcaggaaatg ctcaaagttt aattgattta ggggactttc 10920
actggatgag atgcctctct gagtcatcat aggttgcaaa gtattagttt tttgccactc 10980
actgtgtgtt gtgatatgac atactcataa tggggtagga caagatgtca gttttgcttc 11040
caaactttcc ttacttgttt cctttttggt tcaccactaa tgttgaagaa atgcaagatg 11100
gaaaatctca atagttgaca ctgattgatt gattgagatg gagtctcact ctgtcacctg 11160
ggctggagtg cagtggcgtg atatcggctc actgcaacct ccacctccca ggttcaagca 11220
gttctcctgc ctcagcctcc cgaacagctg ggattacagg tgcccgccac tactctcagc 11280
taattttttg tatttttagt agagatgggg tttcaccatg ttggccagac tagtctcgaa 11340
ttcctaacct tgtgattcgc ccgcctcggc ctcccaaggt gctgggatta caggcatgag 11400
tagttgacat ttattaagtg tttatatgtg ataagcactg ttagattatc ccatgtaata 11460
catcacttga ttgatttaag agattgtcat ttgaaagatt aaagaatatt tcccagaaag 11520
gatgcttggt caagcctcat catcctggga tggatgggac cttggttttg ggcaagttta 11580
ttacaattta agactattct aggtcatgga agtgtgtgtt aggacatata agtagttttc 11640
ttgtccagaa tactttgtaa taatataccc taagtttgat cagctttttg gcattcactt 11700
aattaaaatg ttcacaagta ggtacatttt tagaattgtt aagtaatata ctatttgtag 11760
tagcaaaaca ctacaaacaa atacctaata taataagagg gagtggttga ataaactagg 11820
gcatgtcaac taaaaaacat atttgaaatg cagggaaaat gcttactcta ggcaatagtt 11880
acaacttttg tccattatag gtacataaag gaaaagagta cacaaagaat tctattaatg 11940
atgaaattag gaacaatgtt cccatcccca atttataccc aaaagaaaat atgttctggc 12000
tgggcgcggt ggctcatgcc tgtaatccta gcagtttggg aggctgagac aggtggatcg 12060
cctgagctca ggagttcaaa accagtctgg gcaacatggc aaaaccccgt ctccaccaaa 12120
aatacaaaaa attagccagg cgtgatggca catgcctgta ggtccagcta cttgggaggc 12180
cgaggtggga ggatcgcttg agctcgggat gtggaggctg cagtgagcaa agctcacacc 12240
actgcactct agcatgggtg acagagtgag accccgtctc aaataaataa ataaataaat 12300
gaaaacttat attctataac atgtattctt atgtctttgg ctaaaacaaa agagaagaaa 12360
aataagtaga gagctaagtg aagtgaagtg tcttgaaaca gataagccat aaagtgagat 12420
atatgagtaa atgagtagtt gctggcctag gaattgtttc tgatgttttc acctattgaa 12480
agaatttttt tctttttgta aatctttttt ttggtttgtt aaactgaaaa ataaaagcaa 12540
tgaagagata atattgctgt agtaatgtcc cttagtgcat ccttggagtt agttgtcttg 12600
aatttggcct gctctgattg tcatttgctg tttgctgcat tgaaaaaatt tcagatttac 12660
aaaaatatgt gtgccagggt ggaggaaatt tttaacttga tgaattctca cctttaggac 12720
actgtctgct cttatatggc acttagcaag atgctgcaac aattgtccct gctcatactg 12780
ttggaggaag agggtatttg cagggagatt gctggagtca agatgatcca aatttaaatt 12840
gcagtggtga gcagtggcca ctagagggct gtgaagtact taattctaaa atttccacat 12900
tttaatctgg agcagaggaa actctggaag gaccactggg actaagggag ctcaatccca 12960
aacatcttta tctgagccct aaatgtcttc tacgttattc tttgacaata ctttgttaca 13020
tctcagaatt tgtagttttg aggtggaggt ttaagttaga aatagtttaa tatattctat 13080
tccagaatat aattcgcttt tttccaaatg aaactggcac taaaagcttt ttacttgaaa 13140
gcaaatacac ttcatatgct ttatgtattt ttgtccctat atcattgaaa tagtagattc 13200
aaggctgttt gtaaaaataa gtgactatac tgcatatagg aatagcccca ccttaaagac 13260
tttgatttta aggacattaa gtgggagggt cttttttgcc tttttttttt tgactatcaa 13320
aatactttca catttcttca attcaaagaa caactgttct aaatttagaa gacagacaag 13380
tgaaagagaa tatgctgcca tttccgatgg ttctttttta ctcttgatcc atcactctcc 13440
tgtctttggc tgactctttc tccaaaaagt accccttatt tttcctatgc ctttaacttc 13500
tgttttactt actctattgt agaactttga gaagttgtac accacattca ctgctacctc 13560
acattaactc tgcttactca ttgcagtctg ccttctgctc ctcaatgatt gctcctgtga 13620
aggtcatctt tggtttagca cttgtttgaa atctaatagc ctaaatgcac atcgattact 13680
gtttagaatt caaacgacat ttatttattt actttgagat ggagtttcat tcttgtcgcc 13740
cagctggagt acaatggcat gatcttggct cactgcaacc tccacctccc aggttcaagc 13800
gattctcctg cctcagcctc ctgagtagct gggattacag gcaccctcaa ccacgcctgg 13860
ctaagttttg tatttttttt agtagagatg gggtttcgcc atcttggcca ggctggtctc 13920
gaactcctga cctcaggtga tctgcctgcc tcagccccac aaagtgctgg gattacaagc 13980
gtgagccacc acgcccggcc caaatgacat ttatttttaa aagcaactaa accaggaaag 14040
accttcactc attcaatcaa aaaacatgca ttgaacacgt attcttggct agatccggtg 14100
ctgcaaagat gaaagacgcc actcctagcc tcaaggagct tgcagtttag tggtggcact 14160
ggatgtaaaa taatcataag atgtgaggtg aagactgatg aggtctattt tgttgacaca 14220
ggtaaacatt ctcagagaat atttaattag caacatgaca aaaattagtt gatttatttg 14280
aaggatattt aagtgaattt agagatgaga tttgttttta cttttttaat ttcagagagt 14340
tatgttggtt gcaaaaatct ttgttttcta gtatctattt tataagccat ctgagaccag 14400
gatgttttct ttttaacatg taaacttgat gcagtctctt tgtaaagtaa tgaatccccc 14460
cgtgaacctc aaggagaaga aagtttagct tgaacactta atttcaagta ccttgagaag 14520
ggaacaggct gtattgctca gagaagaagg ctctattagc taaggtagaa ggacaatgta 14580
aaactcttgt gaagacacct aaatgtcatt ccactcaaag cccattatta ataatttgaa 14640
actgtctgct ctgtgaaggc aacgacctat ctttactcat ttttgactct gctaacattt 14700
ctttttatag ttgaactaga ggcaaggcaa ggaacttgac atgcttgttt tccctttaga 14760
ataaagtggc cagaagcagt ttcttctgtg tgatccaaca ctttcttatc cccagagcaa 14820
ctctgcatag tctagatgta ccagagccca gcagcctgtg aggtgatgtg atgtgatgtg 14880
atgtgaacag aaaggctcca tgttggatga tgcctatgaa tctaatcaga ttctctttct 14940
tggtcatttt gatttccaga gaaggcagta gaagcaggtt ctgtgtgtat aaccagagac 15000
tagagggagg aactgacagg gaagctgggt catgagagtg gtgtgctcag cagagtaggg 15060
agtaagagag agctggctcc agagaggatg acaaaatgcc catgtctcca gcacttcttt 15120
agcattctga gttcccatcc tatcatgaat aggaagagtt ttctagctct ccatgaagcc 15180
gaaataggtt tcagactttc ctttctttcc cacacacata ataaataccc atcaggtaac 15240
ctgggcatgg ccttttattt aggcactaac aattctaaaa ggaattaata aatgcttcac 15300
tgccatttca cagtgtaaca gcatgccagt ttaccatacc attaacattt agcctcgtgg 15360
tatttctgtg ttttttcagt cagtaatgat ggcatttttg ccaagataat atagtgttaa 15420
actgtattgg ttgaaatcct aggcttttta aatgtaaact agcactttac aaagtattac 15480
aaaggaaacg aaccagggaa acttgagaag gaactttctt atccacattg ttataggtta 15540
taaaatagtt cctatttaaa ttaaaatacc tactgttgca cttttatgtg tgtttttata 15600
tataaataac atctgggttg gcaaatatgt gattttcgtc aaataggctt tgattgaaga 15660
tgaaatattt ttgtaaaact agtccttttt taaagttaaa attttatgtt accacatgaa 15720
ttgatcagca gaaatttatt tacattatgt aaattgattt ttaagagtat ccacaaggtt 15780
ttagctatta tttttgaact tgcttcctag cccacacaat taagtaataa gagtaagaaa 15840
aaagaaagca cacatccaaa tcatctatca aaacccagct tctacccaat gacacatcat 15900
tttatttctt gatcttgtaa tgttgagcac atgccttgga catattccta tatgtgggct 15960
ctattctctg cagcacgtca ctccctcttt tatccgcccc tcttatgtgc tcccactcct 16020
atcctcttca attaaaaatg cctctttctt ttttttttaa gttaattaat taattaattt 16080
ttttttattg atcattcttg ggtgtttctc gcagaggggg atttggcagg gtcataggat 16140
aatagtggag ggaaggtcag cagataaaca agtgaacaaa ggtctctggt tttcctaggc 16200
agaggaccct gcgggcttcc acagtatttg tgtccctggg tacttgagat tagggagtgg 16260
tgatgactct taacgagtct gctgccttca agcatctgtt taacaaagca catcttgcat 16320
ggcccttaat ccatttaacc ctgagtggac acagcacatg tttcagagag cacagggttg 16380
ggggtaaggt catagatcaa cagcatccca aggcacagga atttttctta gtacagaaca 16440
aaatgaagtc tcccatgtct acttctttct acacagacac agcaacaatc tgatttctct 16500
atcctttccc cacctttccc cctttcctat tccacaaaaa ccgccatcgt catcatggcc 16560
cgttctcaat gagctgttgg gtacacctcc cagacggggt ggtggccggg cagaggggct 16620
cctcacttcc cagaaggggc ggccgggcag aggtgccccc cacctcccgg atggggcggc 16680
ggctgggtgg aggcgggccc ccacctccct cccagacggg gcggctggcc gggcgggggc 16740
tgacccccca cctgcctctg ggacggggcg gctggccggg cgggggctga ccccccacct 16800
gcctccggga cagggtggct gctgggcaga ggggctcctc acttctcaga cggggcagct 16860
gccgggcgga ggggctcctc acttctcaga cggggtggcc gggcagagac gctcctcacc 16920
tcccagacgg ggtcgcggct gggcagaggc gctcctcaca tcccagacgg ggcggcgggg 16980
cagaggcgct tcccgcatct cagacgatgg gcggccgggc agagacgctc ctcacttcct 17040
agacgtgatg gtggccggga agaggcgctc ctcacttccc agactgggca gccaggcaga 17100
ggggctcctc acatcccaga cgatgggcgg ccaggcagag acgctcctca cttcccagac 17160
ggggtggcgg ccaggcagag gctgcaatct cggcactttg ggaggccaag gcaggctgct 17220
gggaggtgga ggttgtagct agccgagatc acgccactgc actccagcct gggcaacatt 17280
gagcactgag tgaaccagac tccgtctgca atcccggcac ctcgggaggc cgaggctggc 17340
ggatcactcg cggttaggag ctggagacca gcccggccaa cacagcgaaa ccctgtctcc 17400
accaaaaaaa tacgaaaacc agtcaggcgt ggcggcgcgc acctgcaatc ccaggcactc 17460
ggcaggctga ggcaggagaa tcaggcaggg aggttgcagt gagccgcgat ggcagcagta 17520
cagtccagct ttggctcggc atcagaggga taccgtggaa agagagggag agggagactg 17580
tggggagagg gagagggaga gaaaaatgcc tctttcaata tgtaaggtaa gattgataga 17640
tgattgcctt ccgtagttcc tcccaaaatt cataggttga aatcttagcc ctcagagtgg 17700
tggtattagg aagtatggag cctttgggag ataattagct caggagggtg gagccctccc 17760
gaataaattt aatgccttta taagcaagac cccagagagc cctttcaccc ttttctaccc 17820
tatgaggaca cagcgagaag acagctgtct gtgaaccagg aagcaggccc tcactacata 17880
ccgaatctac aagcaacttg atctcagact tcccagtctc ctgaactgcg agatataaat 17940
gtttgctgtt taagtcaccc agtctaaggt atttttgtta tagcagcctg aatggactca 18000
ggcggtaggc aagaggagga cagtgcacct gagttataca ttgggcaagt catttacctt 18060
cattggagcc tcggtttact tgtgttagat atgggaataa tgatagttac actgcagggt 18120
ggttgtgaag attagagaaa gtgcatatac tctgatcagc acagtgcatg gtacttcagt 18180
acacagtgtt aactgaagac acagtgttaa ctgaagacac agttgaaaac taaagatagc 18240
tagtgaaaca catgttctct gcacatcata cagtttcttg ggcagttttc aaagtgtgac 18300
tctgcagttc ataccaccat tatcacttag tctctaacaa ataatcatat ttgacacatt 18360
tggctgggac ttaataattt tatttgggca gcagctggtt tctggaagtg ttcatgggaa 18420
gaaaatgtat attaataaag ttagcaggta atgttctttg ttgaaatgtt ggatattgtg 18480
ggacacaaaa gagtcagggt aaatgtacat ttacagaatt gagcgtcaga gtgtcatagt 18540
tctctaatga tttacaaaga aagaattcct ggaacaagtg aaatacttaa taattaattc 18600
agcctgtatt tctgcaggta atcaactgca gtgataaaaa aataaaaatg gaactgtctt 18660
ttgctcattg gaaagatatt tgctgcattc aaagtcatca aaaaggcgaa gcaatgaaac 18720
ttaagacttt tgggttttaa taattaaaaa tccatcttaa agagaacctt gggctctggc 18780
acggtggctc attcttgtaa tcctagcact ttcggaggcc caggtgggcg gatcacttga 18840
ggtcaggagt ttgagaccag cctggttaac atggtgaaac cccatctcta ctaaaaatac 18900
aaaaattagc tgggtgtggt ggtgtgcgcc tgtaatccca gctacttggg aggctgaggc 18960
acgagaatca cttgaacctg ggagatggag gttgcagtga gccaagattg tgccactgca 19020
ttccagcctg ggtgacacag tgagactctg tcttgaaaaa aaaaaaaaga gagagagacc 19080
gtttgtgaag gtgtgttaca cagagaattc ctgattccta atctccagaa tagaaaaatt 19140
caaaggctca gaatcatccc aaatcaatta tccagtggca tctgcatttt ccgatttcat 19200
tctcactagc cgtgtgaaca tgggcatgac cccaggagcc aaggaattct ctaatgccta 19260
aggacagcca tgaggtcaat gaataacatg tgtcaggttt ccctggcaca gaggagcttc 19320
ccagtaaatg ttattttcct tagctatttc ccatttaaca tgtcaattat tcttagtgag 19380
tttccattca atatgagagt ttatataatt tgtcatattg aataggaact tgctaaggaa 19440
agctgtgtag cagaggaagc agccccaagt gacaggacat aaactttaaa ttcacaagat 19500
gcttgtatgt gaattatgat ggtatctgaa ttaacagtga tatttacagt ttagtaatac 19560
atttttcttc ccttgtcttg ggctttataa aaaccctgta agtcatgtat gtcaggaatt 19620
ttatcctcat aattgagaga aaaatactcc atattttatt ggaaataaga tcagtagatt 19680
ctctgtatat catacaatgt cttgcctact taaattatca ccccccttcc tatttcaaca 19740
aagactttct ctaagtaccc ctggcctctt gccctgatcc atactgttct ccttggtaat 19800
ggagtgagtt tcctgcctgg tgggtgcagc cattggccac atttctctag tgtatggaac 19860
tcaccggata aaaggcctca gatgtaggtc tctttctgct gtcttcaccc aggtgttgtg 19920
gagtgtgtct gtccttgagc actagctttc ccctgtgtgg gctgcctcaa ggcctgcatt 19980
catcaggtag ggactgttag ctggtagacc taagccacca ctccagtact gactgtcagt 20040
aaggaaggtg acatgctgac ctccatctgc tacatcattg tgtatatgtc ttcattagtt 20100
ctgcatattg gtgagaaaat ggatgctctg attcctcttg aaccccaaga gaatgaaggt 20160
aaaaaaattg aggtcctaat gcaaattttc ttagtacacc caaatctttg gatagagtcc 20220
tgcactcttt gagatatatc acacaatctg tctcactttc ttttcgcata tgttatatat 20280
tttaaaactt ttgtttttgg ggccaccact tactggctct gtgattttag gaaagctttt 20340
cagaccctca gaaccccagt ctcttcatct ctaaagtaat aaaatatatg taaagaacct 20400
atttcagcat gtgaattctg ttttcctttt tcctctagat gtatcatatc cagttaaaaa 20460
aaaatctact tgaactttgc aggtatcttc agtgtttatt acttctcatt tttaacattt 20520
attggaaatt agcatattgt cagaattgat ataatacaat atgtaacctc tttcattaag 20580
cttatcattt ttaaaataca aataactatt ctttacttaa atttttattt ctagacacag 20640
ggtcctgctc tctcgaaccc aggctggagt gcagtggcac aatcatagct cactgcagcc 20700
tcaaactctt gggcttaagt gatcctcctg cctcacactc tggagtagct gggattatag 20760
acctgagcca tggtgtccag catgacttaa attttgaata agttgcactt actaattaca 20820
cttacactgc tgcatctgaa agagtaatac aacaatagaa gccttttata gtaattattt 20880
gtggcaggta gactcctaaa atgactccca aatgacccac acccttgtac aatcaatacc 20940
ctgtcccttg agtgacagtg acttgctcta atcagttggc tttcagttaa tcaaaagaga 21000
gattatcttg ggctgaacta aactaatccc agcaagataa cagggacttc agtcttgcaa 21060
acagatatca tataaaggga atcatatctg cacatttgat tcttggaccc tgggtaggaa 21120
tttgttagag agcaaggatg tgaataaagg tgggaaataa aggtgtatct ggtgtctctg 21180
ctcaaaagct cacatgtagc tacaaggcag agatttaggg gagtggtatc cacagtcaag 21240
aagaattaat acatagtgtt tgagtctggc ttcttccaat tagcataatg cttttgaggt 21300
tcatccatat tgttgcatta ccagtagttt ttatttattt attttatcag tagtttctaa 21360
attgttgagt agtatattac attgtgtaga tatatcctgt gtgtttatcc atacacattt 21420
atggatattt gggagttgct agtttttagc tattctatga gcattcacat acatgtcttt 21480
gtgtggaaat aggttttcat atctcttggg taaatatacg ggagtggaat tgctagatca 21540
tatggtaaat actctgtata cttaaaatga agagaaactg tcaaactatt ttccataatg 21600
gctctaccat acttgatgtt ttagaaaaga ggaaaaacac tagcaatttt gatgctgtat 21660
gtctacaacc taagagaatc taataatagc gtcctggtct gtcagtgtag gaattgccta 21720
ggtaatacat ggaaggtgtg gagggagcag gtacacagaa aatgtgcgtc agaaagtttt 21780
gcttttccta tcccacgtca tttctgagtc tgatcctccc tactcctcac aaataaattg 21840
gtagattcat ctgtttttgg acccttttct gctctagtta ctgaactatc agagacttca 21900
ggaagagctt aagctaagct attccaggga agttttggtg ttactctgta cttacggact 21960
cctgcgtgtc tgtctctgtc accccagctg ccaactcaac ttagagttta ttagcctggc 22020
attgaccagc acactgtgat attctctgag gcacactgca tgctgctagt gtgccctggt 22080
tcataaagct gggccttcag cattgatccc actccaagtt ccttgctctg tcttcccaca 22140
gctgtcccct tgggggatgt ggggggtctg acatcatttg cattattagt ctattccaag 22200
aaatgcacct gtgcactaat cagttcactt tttctgtctt agtcggcaga tctagccata 22260
gcccaatccc tcaatttcta tactaagcct tttatattag taaaactgtt atgttatcta 22320
gaaattcatc agtgggaaaa ctacttcaag ggaggtagtt agaggctgca aggtgctaaa 22380
tatttttctt tctttctttt taaatgtaac ttggatctaa agtaaggacg aatttccttt 22440
tattatttgt tcagaatata ccagctggtc ctgtgggcag aagtttgtta aggggcctgg 22500
atgtgaaata acagtgtatc tcgtgtctct gctcaagagc tcacatgtag ctacaaggca 22560
gagatttagg ggagtggcat atacggccaa ctgagaaata acaatattgt cagggactcc 22620
aaggcacttt ggaagatata aagaatttct taaattttct tgtagaattg ttgcaaaagg 22680
cagacatgct taaatgttta aataagcttc ttgaaaactc atggaacatt caatcacaac 22740
tccaacagtt ctccaaaatt tgatttattc tggccatatt atgcagcaaa gaaacacttg 22800
gctatttatc taaatctctt ctgtcttgta aatgatccta gaaaataatc tagaaataca 22860
ttttattaaa gtaatgcatg aggtacatat cgattaccag ccaatagttg aacttaaaca 22920
taatgcatgg gtgtgagggc tggcattgat gattcacaat gaacacagtt gaatatcact 22980
tccctgctga gactcgggta tcatcgcaaa accacagtga gcatcagtgg ggatctgcat 23040
gctctggtca agacagatct ccatgctgag tgtctgtttg ccatgatgaa gagaacagtc 23100
aacaggagtg tttgccatga tgtagagaac agtccgggag gagtgaatgg aggatggggg 23160
catgaggaaa gatgaggctt tctctagtta tgaccctttg tgtagaagtt aggagtaggg 23220
gataaatgtt tctgcctaat atttaacttg gaagagaaga tgtccatgtg aaaaactgct 23280
aaatactgaa acaagagagc atgtgactaa gcaataccat gtgtggcaca gaaaacaagt 23340
gcaatagcag tttagcaaag tgagttcagt gtaggctgaa ctggttagag caggtttccg 23400
ggtgaaggtg aggattggtg agggtttgga ttggtagaaa gagacgggga ggacatctca 23460
catcaagaag ttatgccagt ggatttcagg agaattgagt gtttgtgtct gaaaagcctg 23520
taagaatagg gcatgacagt gtggagaaat gcatgaaagt atgaaggatc gtgatatcca 23580
gtttgaggag tgctaactag aggctctgaa gatttgagaa gaaacataat gaaaggtgtt 23640
ctcagcctga tcttggtatg caggactggt aaaccccaaa caccttacca ttctattacc 23700
tctccctcaa ggaatgggtc ccttgataag aatttagtgt aaaaaagatt gtcaattcag 23760
tgctgctgct gagtgctagt ttctttaaac acacacagtt ttcttttgag aatttttttt 23820
ctattagata gacgaactgt tatttaaatg aaaaaggcac atagtcccat aaaacaatta 23880
cacattcggg tgataacttc aaaaggagaa attaaaatgt tcttatgttt tgagcaagca 23940
tttccacttc cagactttgc tgcataaaca tctgtggtca tctagggaat gcctgacctg 24000
gttcagaggt gtcagagcaa tgtaaagtca cggaagtgct gcagttctat tctgggctct 24060
catctttttg cagcggtcca ttctctaatt ttcaaccaca tattaccaga caatctctta 24120
agtcatacac aacaaactga ttctgtttca atgcttagaa ttagaataaa aaagcctaag 24180
caaaaatagc acaaacattt gaaaaacact ccttttttct accactccct tcttagaaca 24240
gaaataaaag ccctgtactt taagaaaatg gatggaagaa ttttctttgt acttcttatt 24300
ctccaagtta catttactac ctgatagtgt taataccttt ttgtagtacc tttctttaaa 24360
atatacaggg aaatgatctg ttccaagaaa ctgtgttttt aaatttaatt atagtgtgct 24420
atgatgattt aaaaaatggc cttttgagta aaggacacga acaagttatt taaaaagtga 24480
gcagtaagtg tggtcagtaa acacatcaaa aagttccctt cactaatatt caaagaaatg 24540
caaattagaa taataatacc cttgttgctt gtcaaattaa tactttaaca attattatgt 24600
aaattttatg gataggattg caaatcaaca cacctttcct ggccactggt gtacataata 24660
gaaattctaa aaatgttctt aggcttgacc aagcatttcc acttctagac tttgctgcac 24720
aaagatctgt ggtcatctag gagaaggctt gacctggttc agaggtatca gagcaatgca 24780
aagtcatgaa aatgctgcaa ttctatcctg gactgtcatc ttttttgtag tggtccattc 24840
tctaattttt caatgacgta gtaccagaca gtctcttaag tcaaatgtat ttgtagggct 24900
ctggatttga aattcaatct ggctttcagc cttgatgtgg ccactcccaa cttgtaaagg 24960
acctgtgaag acttagacac agaataaaac acagaagata agaaaaccaa ctttgaaaga 25020
aaatttattg tcaaaattgt actgggtcaa ttgagcaaaa acttcaaaga gcgttttcat 25080
attaaccaaa gcatccctcc tcaattgaaa catataaaga tattgttcac ccctatcctg 25140
actcagagat ccacaaatct gggcattcat catcaccata ttctgctggc aatagtttta 25200
agcagctaaa ttactgttct ctactcttga gtttcctcca tctcttcaga tacagaaagt 25260
tctagaatat attcaaataa tcaaatcttt aattcattcc atatatctgg ctcaagacag 25320
tgtcccaata accttattct agagaaagtc agatttagac ttgtgctcat catcatactc 25380
atgttcttga catcatttta agctctgagg agacatctca cataactctc attgatacgt 25440
gtatacatct gtcactctgt gtttgtgctg tgatggatgg acttggatgt agatatgcat 25500
agatgatgaa gcagatagct atatatatgg tattgatgta gattcagtac agctgtataa 25560
ttgcatctgt gtttcacata tcttgtgtac tgtatcttga ctgtatctgt gtcaatacct 25620
aattgagtta taaggcataa atatgtggag ctcttagcac aatacctggc acactgcaat 25680
cagtcgatgt atgtgtttgt gtgtgtgcgt gtgtgtgtgt gtgatacaga cagaacctgc 25740
taatatgcat aatagtcagg ttgggttgtt ataacaaaat actatagact gtgtggctta 25800
aacggcagac atttgtttct cacagttctg gagtctggga aatccaaggt caagattagt 25860
ttctggtgag agcagtcttc ctcttttgca gctccccatg gtttgcaaat cacagatttc 25920
tcgctgtatt ctcacatagt gtaggaggaa cagagggagg gaagggagga agtgcctaag 25980
gacactaatc ccatgatgag agttctatcc accatgacct aattacctcc taatgccacc 26040
atctccaaat actatcacac tgggaattag gtctttaaca tgtgaatcat ttggggtgga 26100
gaagacaaac attcagctca taacaggtaa ggtagaaaat ctcaagaatt tatattttgt 26160
atatgaaaga tcattaatga gcagaatttt aagtttaatg ccaattttaa tctattttta 26220
tcttttctac gattcttttt tactttttaa tttttaaact ttcatataca aagggataat 26280
atttggctaa atgttctctt ctttttgagc tctggatcat tgttacgatc accccataat 26340
tgtatgtgtg cagagatagt gctttataca tttttaaaac aattttatat acagtattaa 26400
attttatttt tcaataaaca atccatgaga tagaaagaac atatattttg ttttacagat 26460
aagctccagg gagagtctag ggtaccttag attgtatggg taaaacatgg tttatttaaa 26520
tcataaataa acagtcttat ttccctaaat gcacatacag gcatccacat caaatgaaat 26580
cacatcacat gaattgaaca ggcagttact gacttagaac tttgcactca caaaagacac 26640
actctcctaa atgtctccat catactatac tttttgtccc caaatgccta atcactgaag 26700
cttcagactt tgttgctttg attcccttag gaaaaattcc tggtgtttca gaaaaaaaga 26760
gccatttaac tacattagaa gttaaccctc ctttaaaaat gtg 26803
<210> 20
<211> 26803
<212> DNA
<213> Homo sapiens
<400> 20
cagttaaggt ggggcaggaa taaatcacaa tggtggaatg tcatcagtta aggcaggaac 60
tggccatttt cacttctttt gtgattcttc acttgcttca ggccatctgg atgtatatgt 120
gcaggtcaca gggcatacat tggcttagct tgggctcaga ggcctgacaa ggcacagaag 180
gagctgggat agaggtgcaa agtactcatg ctgacctgac atcccatgcc cacggcagac 240
atgactactt gatcggacaa tactttcttg gaatcaaaga cacaacttca cagtcctcag 300
catcatagtt caggcagcct gtatcagtag atcagagtgg gcacatggcc tggtgctatc 360
actccatcct gtgaggggag atgggattgg aatggaggtg gaggagtcac aggtggtcct 420
gatatcacag gcctgggagt ctgaaagaag tgcagtaggt agtattatgg ccctcaaaga 480
catctgtgtc ctactgtcta gagtcaatta aagtgttacc taacatagaa aaaaggattt 540
tgcaggtggg attaaactaa ggatctcaag atagaaagac tctcctggag tatccagttg 600
tgtccaatgt aagaacaagc gttctcaaaa tagggacaca ggagattgaa ttgcaaagga 660
gatgtgctga taaacggaga ggttggagtg atgccgccat gaggcaagga atgtgggtgg 720
cctctagcag ctagcaatga ttcggaaatg gattctcccc cagagtccag aaagatcaca 780
gcagtgctga caccttgatt tgagcccagt gtcacctctg tcagacttct gccctataga 840
actgtaagag gataaatttg tgttttaagg cacaaagttt atggtaattt gttatagcag 900
caatgggaaa ctaatacaag aagggttgtg ttatcaacag aaatacagca atcagaagaa 960
agatggttgg ggagagcaga gggtggggtg ggaaggtgat ggattctgtt tgggacattc 1020
tgggtgtcat atgaatatta ttggggaact gtccatcaaa agctcagact tcaaagaaag 1080
aaaggaagga gcaacaatat tttgaaaggg agaaagtagg taatattcaa tatgtgttga 1140
gtacctacaa ggtttttagt tctttcacca agttatttta tttaattttt atggcatcaa 1200
ggggtgtttt ttttttttct taaaccaaat tttctcagtt aagcatccca tgtaagtggc 1260
caggggttaa gagatgtgac taagactaga cagagtgatt ttcatcatta catggtacta 1320
tggttctact gaagcactga ggaaggaagt caagagagtt cctgagaaat gtctggagtc 1380
ttagtaacat gcaaagtgag gcagaggtat tgtcagtgtt agctggtcac tttgaaaggt 1440
tagaggtaaa taaagttcag ggcaatggta cttggagagg agtgaatctt tggtaacctg 1500
gaggagatgc ttctcagagg aaaatttctt cacagcatga agtcaccagc tctaagacta 1560
gtgggtgttc tgggggatgt tagcagtgac tcactgactg ttggcccagt gaggggaggg 1620
atgaaaggct gggtagtggg tagagaatct gactcctcct gcccccacat gtctattcct 1680
gggccttctc ttggtggggg caaaaggtat gcaaagggat ttccgcagtg tctgagtgct 1740
cccaggagac ggaaaagtaa ctgatgactt ggagttggag tcttgttggc tcaggcagct 1800
ggggcgtttt gggatttcaa cacctccctt tagtttctat gtatggtgct gagcaagtag 1860
tcaaagactt tggtcttgct ttaccccagt agcccacaag cctgagtaca tggctaacat 1920
ttattgggca cttagtgtgt gccaaagagc tttatgagac aggttctttt tgagtcccat 1980
tatactgata atgggactga taagaaacag aaggtcagaa aggcccagta acttgggcaa 2040
ggtcatgtag ctagtaagtg gtccagctga aatttaaaac caggtttatc caactccaaa 2100
tcccacatct gatttatttt gccatgaatt aaaacatagt tctgattttg agaaactccc 2160
agtcccagtg ggaaaacaga tggaatcaca aattaccata acacagtgta gtgatgtaga 2220
tataaaaaca aagacatggg aaccctgaaa ggaagttgta acaccaatag aggaatgcat 2280
ggaggagatc tttcagagga ggtagcctcg tagctgggct caggggtgga tgagtttctg 2340
gctagaagcg cattgtgggt agagggagaa catatataga aaggcatgaa gatggtggac 2400
atgtttggaa agagtgagta ctagactgat gaacacgatg agtcaggagc ttatgacgtc 2460
aggggctact gctagcctag ctaatgactg aagattctgt gaaaagaaaa ccctaacatt 2520
tccagctgag tactagggcc atggtgatta tatatcatct ctcatgacaa cacaaatgtt 2580
tgggcttact tatcatcctg ctcagtaatc attatgtcac tcattaaaga tgtatcaggg 2640
taaattttag gtgagaattg attagaaatg taaactctat atatgtagtt acaggcttca 2700
cagtttgcca ctcaaacaat atggtcatcc aatcatgagg cacaaccttc tgctcagaac 2760
ttttttataa ttgggagaaa gtgacatccg agttccatct cttctgagaa ctgtgcagct 2820
cagaaatctt cttccctttt ttgatccccc agttgggtga gatgacatta acagtgtgtt 2880
ataagcactt ttcatgttta ctaccccata ttcaaaatta agcatttcaa acaactgtat 2940
aattgtctat aaatgtagca ttattagtta attttccttt taacacattg aggttacctc 3000
taatgttttg ctatttttaa ctatgttgaa ataatcatgt ggtttttatt ctttgaatta 3060
ttttatattg taatgttccc tgaaatgaaa ttagttgatc aaaagatgag taatcttttc 3120
atgacttttg atacatgtca ctcaatcacc ttctggaaga gttggaacaa gagcctattg 3180
ctggcatccc atttcatagc catctcacca atgttggaaa atgggctttt cctattttct 3240
gctaattcat tagttgttaa tggcttattt taactattaa tcccttgtta ttgatgaaag 3300
ttaagcattt tctgtatttt tattttctgt ctaaattcta ctttttgcac aatttccttt 3360
gctcacttct tcactggaat ttagtatttt tctttccaat ttgtatgact ccaaaatcag 3420
tgataaaata agcaaagggt ctttcttaga ggctaaacaa gggaatgaat aaggaacaag 3480
aacagcaaag ggatagtgaa taaagataca aaataataac ttatttttat ttttgaagct 3540
ttccccaggc agtaattctt gaccttttta agattataaa ttattttgag atatgcattc 3600
ttatcctcaa aatgaattag tacataaaat ttaaatgggt tgatagatcc cctgaagtgt 3660
atccacaaaa tgctctcagg ttaagcaaca ttgttctata ataactgctt taaccaaaat 3720
gtttaattat tgcttgtgtt tacctgtcct agcaaagagc taattgttaa attttgtgtt 3780
agagggtcaa tattataaat aacttaatgt ggcctctctt tcctttcctt tttttgagag 3840
ttttgaggct atcactaagt gggctttaga gtaccaggtg ggaatctgac ctcactgctc 3900
aaactttcaa cttcaggcat gaagtggtcc cagtgatgtg ggaacctcag agtctaaaac 3960
aaaaatagta gactgaggcc ctcagaaacc agacttatca gattcagaat ttaatataac 4020
tatgtttgaa agatttaaag aaaataaatc aaattaaaaa gtgagcaaga agcaagaata 4080
acaaatgaac tggcatattt gagaaagaat tttgagcttt tagaaataat acatacactt 4140
attgaaataa aaactcaagt caataggttt aaacagcaaa atgaatatag ttaaagaaaa 4200
ctattgtgct gaaagattta aaaaactatt acacagaatg caaaatgatg aaatagggta 4260
atttaatata tggcagatat gttaagacac tatgaggata gtatgagaag acctgataga 4320
catctaatca cagcacctta aggtgaaaat agagagagtg caccaatatt gaggagttaa 4380
tgtctgagac tattccagaa ctgataaata gatgaatcta cagatctcag aaacacagct 4440
tttacaaagg ataaatgaag agaaattcac cagagataca ttgtaatgaa tctgtaaatc 4500
accaaagcta aagatattat ttcacaagtg gaatgacagc tgacttctca acaacaacga 4560
aagcaaggag acagttgaaa gacatcttga aaatggtgag agaaaaacta actgttaata 4620
taaaattgtg tacctatcaa aaatatcttt tggccaggcg tggtggctca cgcctataat 4680
cctagcactt tgggaagcca aggaacgtgg atcacttgag gtcaggagtt tgagaccgag 4740
accgtcctgg ccaacatggt gaaaccccat ctctactaaa aatacaaaaa aaaaaaaaaa 4800
atagccatgt gtggtggtgt gcacctgtaa tcccagctac ttgggaggct gaggcaggag 4860
aatcgcttga acccaggagg tagaggttgc agtgagctga gatcatgctg ctgcactcca 4920
gtctgggtga cagagtgaga ctgcctcaaa accaaaccaa accaaaccaa accaatcttt 4980
caagaagtac accataaaga catttccgga taaacagtga atgagattac ttcctaaacg 5040
aatatgtaag gatgtttctt tttaaaattt tttttgggtg tattcatcac ctcaagcatt 5100
tattcttttg tgttgttaca actgataaga atatctaagg atgtttcaaa aggaagaaaa 5160
atgatcccta aagtctggta tattagtttc ttattagttg ctctaagaaa ttactgcaaa 5220
cttagtggct ttaaaaaaca cgaaattatc tttcagttct gtaggtcaga aatttaacct 5280
cctgatttct ggtcagaagt cttactgggc taaaatcagg gtatcagcag ggctgctgga 5340
ggctctggag atgatgtttc tctaatttct agaggcattt gcattcctta gctagtggct 5400
tcttcccaca tcttcaaagc taacagtggc agtcgagtcc ttctcttatc tttttttttt 5460
ggggggggtt ataaattttt tttattatta ttatacttta agttttaggg tacatgtgca 5520
caacgtgcag gtttgttaca tatgtataca tgtgccacat tggtgtgctg cacccattaa 5580
ctcatcattt agcattaggt atatctccta atgctatccg tcccccctcc cccaccccac 5640
aacagtcccc agtgtgtgat gttccccttc ccttctctta tcttatcact ctgacctctt 5700
ctgcctcctt tctctacttt taaggaccct tgtgattaga ttgggtccac ctaaataatc 5760
caggataatc tctttatttt aaggttagct gattagcaac ctcaattcca tctgtaacct 5820
taatttcttt tttgccatgt aacctaacat agtcacaggc ccaagggaat aataggatgt 5880
gggaattgcg ggtggtggag taggggcatt attctgctta ccacagggga ccttggatgt 5940
cagtaaaaaa tggtgaggaa gaaaacagga aacgtagaat aatctaaaca aatctttgaa 6000
aaataagttg aaatgtgggg ttagaaaaag ggcagaacta aaatgttaag acaaattaaa 6060
atgttaagcc tataagttga gagggagatg atcaaggtta aaaatactca taaatcatat 6120
ttttttgggt agggggttag atatttatta attttagacc ctgagaagta aaatagtcat 6180
gacaaaaatt taatagtaac cactaaaaca agagaaacag agtatataac ttctaaatca 6240
atatgggaag gggaatggaa taagaaaaca atagcaacca ccaacacccc acccaaaata 6300
aataataagg tgagagagaa aaagaagcat tgaaaagggg ctaaaataaa ataaaaaatt 6360
aagtcatgcc cgtaatccca gcactttgag aggccaagat gggtggatca cctgaggtca 6420
ggagttcgag accagcctga ccaacatggg gaaaccccat ctctactaaa aattcaaaat 6480
tagctgggtg tgggggtgca tgcctgtaat cccagctact ctggaggctg aggcaggaga 6540
atcgcttgaa cccaggaggc agaggttgtg gtgagcagag attgtgccat tgcattccag 6600
cctgggcagc aagagcgaaa cgccatctaa aaaaaaaaaa aaaaaaatta agatagtaaa 6660
acaaatccaa atacattaaa gattacaaaa aatgaaaatg aactaaactt cctagttgaa 6720
agacatattg tcagattgga ttttaaaatc tggcaatgat atttccagga cacagtccta 6780
aaatattaaa cacagaaaag ttgaaagtaa agggatggaa gaacacagtc aaactaacta 6840
gaagagagct gggttcaccc ttttatatca gagcagaatt tcactgagaa aacactaaca 6900
ggaaggggga aaggcacaac atagtgatga agcacttaat tctcaacaaa tgtatgacac 6960
ttctaaacta ttatgactgc aaaaaaaaaa aaaacctcag catatataaa attttggaag 7020
agccatggct atcagctgac atgcacttac catatttgca ttgtcctact acaaacttta 7080
cccatatgac caaggtgctg tcttcatccc cattttacag atggggaaat ttccccatag 7140
agaaaaagat ttgggccatg ccttggtttc ttcttgactc tgcttcctgc tgattgatcc 7200
tcacacctca cctggagacc tacttcacat tatccatcag gatgagaact ggtgtgcctt 7260
taccaaagga ccacagtcac cttcaaaacg tgtttagata gatctggatg gagacttatg 7320
tggttgcaga tgaaaaaaaa gtccccatgg tatatctgac tccatgtcat tcactgcatg 7380
aacactcaca cacatgcaca cgtacacagg caaacacaat cctgttctgg tccggcagta 7440
gtgccaacac tcaaatccca ggtcctactc tgaagccttt gaggaaacca ttgtcattct 7500
ggggtttatg ggaatatttc ttcttggtgc cccttgttcc tcacagaagc tttttttctg 7560
tgctgtgggc ttgctatcct agctttccaa gctatcctag ttttgcaaat ttctctgatc 7620
aatcacatca ggttcttgga tcatcccaaa attaaagagg tacgttttgc tgcaagagac 7680
aaagacattc acctctcaca cagtttgaat tcctgggtag aaacagattt caatgctggc 7740
cagcctctgt agctcccagt gccccctcaa ttatgactcc cgaggcattg gagcaggatc 7800
ctcaccttgc gcaaagataa ttaggtgtgc tgaagaaagc cagacactgc tctttcttag 7860
ctctgcatcc ttaaaaagtt accactactc cttctctttg aatctttgac ttgtcaatgg 7920
taaagtgcct atgattctta aagggataaa aacgcaacct atataaagca cctggcatag 7980
tgcctggcac aggtgggtgt ttaacaaatg ttaactcctt tctatcccac tgtgggtgtc 8040
catatcctct tgggtaggct gcctctggtt tccattgtgt catcagagcc atactaaatc 8100
gatgtgttgg acatggatcc caagaactaa tttctggaat gagttatgcc taccaacttc 8160
cctgatactt acttctgtct ctccatttat caaatggaaa tgtttgcatt tggcctctgc 8220
cagttggagt aaccaaaagg cttagaggtt ttggagaggt cctacactgc catctgtttg 8280
accacatact gcctttcacg tgtaataagc attgtttctt acatttgtct aggaattagc 8340
agttcacaaa gcacattcgc atataagggc ttgttttgaa ttgatcttgg cagcaattct 8400
atgagacaag taaaaggtag gtcaagcatt ataatcctca ttttaaatct gggaaaactg 8460
aatctcaaaa aggttgaaag acttgtctag gggacagtgt gtgggtaaat gagaagttaa 8520
gatttgctga actggcattt cctgactaca tatctagtgt ttatttatgg agaaggcact 8580
acggtggcca agtggctcag agtcacacag ctctgtgcct cagtttattt gtctgtaaaa 8640
tgaagataat aatatattct gaatactgtt gtggaatttc attgagatag ttcacataat 8700
ggcatggata ctgtagtaca ccgcctagat tcacaacccc acgactatcc atgagaatgg 8760
cccatagctc aagaggtcac attctttccc caggtgaagc ccgcatccaa tgactgctca 8820
gtgtgggtat ataaaggcct ggctcccttg ccagtgccac cctacctcct ggcgaatgga 8880
ctgaggcttg cattatgact gcattgcagc tcaactgttc tttccattca gtctttcctt 8940
tacactcaca caggtgagga cccagccatt aaatgcctca catgatgacc tctattgcat 9000
gctaggcttc gtgtgcacac acaaaaacca tcctctatca gtcaggcccc ttacttgcag 9060
aggcaaagag gccagtctgg gttagatgtg caccctgttt ttacaacaga acgagacaaa 9120
caggtcctcc ttaggtgtaa gttcatggcc ttggccccac ccctgaaact cagccatctg 9180
agacagtttt aggactgagg caaccccaga ctttgggttg ttgtttgctg ggcacagcct 9240
ccttttgcca atgttgcaat cctttgtaag agaccacagg ttgatcaccc gttcctgtta 9300
ctgagcacag agaggtttgt aggccagtct ctccaggaat tctgacgcac tgcaaaatcc 9360
catggtctga atgcttctac cttccctgtg aaagcccctg gcctcagaaa aggaagctgg 9420
tttaagtgac caacatttgg ggtggagctt ccgagggccc agccaccgtg ttacatgcaa 9480
caatcaacag agatattctt tggctagagt tgtttttctg ggtataggac cctataatta 9540
aaatcagctc tccaacttcc cttcctccaa aaagtataca atgtaaggag gaaaatgcaa 9600
attgaaaagt tgctagccct tcccgccaga atgccacccc aagcctcccc tgcaggaagt 9660
tctggagtcc ccaactctgc cccaagcctg aggcccttga taaggtaaag ggatgtgagt 9720
gtggaggccg gagcccccct cgccctgtag gctgctcccc ttgcttttcc ctttgaatgt 9780
tacagtttag ttctgtgact tacttataat tgcctgaatt ccccgcccac gctttctctt 9840
actttggggc ttctcaccgt tcctcttcct ccatcttcct cctctgaccc cactcccaag 9900
cctgaatggg gtgttcctct tccgtgctcc cacaaaaccc tgtgcctctt tcatcgttgc 9960
atatattatg ctgtaatgta gttttctgga ggtgtgaaga ctatgaatcc tatgaagaca 10020
aatacacacc taccttgctg accgttgtat cctcagaatc taatactgca cttggcacac 10080
agtggttggg agtaaatatt catgaggcaa acacacagga aggactcttt tgttatggtt 10140
gtttgttgtt gttgcaagta acataacccc accttgatct agctgactga cggctctacc 10200
accttgtctt ttgcagcaca agaggaatag gaactgcacc tcttccttca gtttcagctt 10260
gaataatatc aggaagattc gtatcggtct gagttgggtc acgtacccga cgtgctatag 10320
ctgaggatgg ggtaagctga ttggagtttg caacactgtt cacatagcca agatatggaa 10380
agaacctaaa tgtcaactgg tggatgaatg gataaagaaa ttgtggtata tacatacact 10440
ggaatattat tcaaccttaa aaagaaggaa atcctaacat ttgtgacaac atggatggac 10500
ctggagggaa ttatgctgag tgaaataaga cagacacaaa aagacatttc ttgcaggagc 10560
tcacttatat gtggaatcta aaatagtcaa gcttaaagaa gagagtagac tactggttgt 10620
caggagcagg agaaaagtgg aaatgaagag gtgatagtta aagggtacaa agtttcagtt 10680
atacaagata aataagttct ggaggtttac tattaatata tcacatagta cctataagta 10740
acaatactgt attgtatact taaaattgct aagagggtat atcttatatg ttcttaccaa 10800
taataataat aatggtaata attaaggggc aggaggacac ttcaaaaggt gatggatatg 10860
tttatggcct tgatggtggt gatggtttca tgagagtata cttatcccca aactaattga 10920
gatgtaaata ttaaatatgt acagcttttt gtatgtcaat cgtacctcag taaagtagtt 10980
taaaaatggt tggactgaga aaaggaggag ctgctcagca acatgaggct gggtgctggg 11040
cagacaaaac ctcacacatg cattactgaa cccacggact catgtctgtg agctttgtgg 11100
ctgtggatgc accatgccaa tgtagtcaag gattcttcaa tgtgtacctt actggattag 11160
ttccctctgt ttatttgtat tgactcctca gttcccttat gggttgcttg ttggctcttg 11220
tggaattatt taagtaaggc tttggttgca ggagtcagac atgcttaagc tggttttggc 11280
tgtaatgggg aatttgtgag atgtgacaca gtgacaggaa gtgcagccag acgttgtgag 11340
aggcagtaac tgggaatagg aaagttatga gaagttaagg cagtagtaat tgtttctcta 11400
tcgaaggcca taatgttatc attcctgcct ctatctgttt gcttgttctt ctctctcagc 11460
agaatggtct tctctgcttc tctgtgcacc tgcagaaggt gaccacccta aggcttatgg 11520
attcaggagt cctcagtttg agagcagtta ccaaatgcct cgcccctgtg aactctagtc 11580
ccagtttctt attcctggta ctggcttagt ttgaggcagc tgcccaccgt aagtccagtg 11640
agccatggcc tggggacaag gtcaggtaca tgtgtaatca gctgggtcta tgagttgtgg 11700
tggtggcgat ggaggtagct cccagaaaaa tggattacag gttaagaaga gtctatatat 11760
cttgaccaca tttgatgtga cttggaagtt tcaatgtgtg accacttaca aagttatgat 11820
caggtgtctc atttatttat ggtgatgtat gagtccgtgt gtgagtgtgt gtgtgtctgt 11880
gtttgtgtgt gtgtgtgaga gagagagaga gaatgagaat atgagtggtg gtttcccatt 11940
tatttttcta tgggccaaat cctgggctat gagctggaga tataagagta aacaaaatag 12000
acacggtgct tgctgtgacc tgccctggga gacagatatt acacggagga tcacataaat 12060
gcagagtctg agctgaggtc ttaagggtga ggataagtaa ctagtcagtg gagcagggga 12120
gggaagggtg ttccatgcct gtgtcaaggt cctgaggtga gagaaagagg tgaatttgag 12180
gaaccaaaag gagttcaggg aacaagaggg gctgtttcac aagctgagtc tggaagctga 12240
gcaggctgag cagattctta ggaactctgc aaaaacttaa gggcttgtct atgaccgtaa 12300
acaactacgg tcgtagataa acaagttggc aaacaactca aggatttaca gtcatcagaa 12360
ttgtaaaact gatcccatgt attttcaaac ctcaaatccc ttgctctgac cttgtgtgtc 12420
taagctagaa ggaagcagga tgcacctctc ccctggctgg aatgaaggga ttcacccaag 12480
ctctcagtct tctcacggca tccagggccc ccctgcttgt gtgtggtcta gatttccatt 12540
cccatagtag gaattccttt gggagccttg gggtctctcc tgctagaggg cttcacctgt 12600
gactgtctca attcaaggga ggggttctaa taacattaaa cctcaatatc ttgctcttcc 12660
attcctgatg cctccctttc cttctaccct tcccctacct ccttctttcc tatgccacag 12720
gctggcaggt tagtgccaga gcaagtggcc agtcaccatc attggggttg tggatcctca 12780
gggttcttca gaagcccctt caccatgatc aagagtctcc agtcactcag aattccacgg 12840
ttcccaaatg ccagctctcc cactactccc agcgttctcc atctctggga tgttgggctc 12900
caggcttctc agatgcactg agtaccctag gctaagccac tgatccatca gaacttcata 12960
gcctgagagg agagggagac aggcttgcaa aggagagttc tgactagaca ctggggtgct 13020
acagatgccc gtaagttgtc cctttaccct cgatgtcccc agtgttggga ccacctggga 13080
atgcccagcc ttgtgtgctg attgacttgt agtcccctgg ccctgactgg aagcctagtt 13140
ttctctctca tgaccagcta ggcccctagc tccccaggga agaaatccaa tctatttcct 13200
ctgatagtaa tggctaatac ttaaataatg ccaaccacat gccaagcact ttacagttgt 13260
tagcccagtc ttcacaagca ccttgtgagg tgggcaagag tcttatctta ctctcatttt 13320
atagatgtgg cccaggatcc cacagctata gttcatggtg ctgggatttg aacctctggc 13380
caccagagcc caccttaatg tgtcctcctc ctgttgtcat aacagaaaag tacaacacca 13440
tgatgacaca tcaggctatc ctggcaggtt cccaggctgc cccaatgccc aactttctag 13500
gtttacaaag ttgacattta cgaagtttcc aggtttacaa atctagtttc tgattcttta 13560
gtcagcagga atttctctac aaaagctgct tcgaaaattt ccagccaaac cttacacacc 13620
ttggcattac atcttggtga gccaaggcgg aagagaacag gaagtgaagg ccccatggga 13680
agtccctgcg gtcgggagca cccaggcggg gcggggggtg gggggctttc ctgtggccgg 13740
ctccctgccc ctcccacccc cattcaggcc ctgtgagttg aatgaagaga ccctgggaat 13800
gagtccaggt ctgcagggtt agaggaaatt gaaggccctt accagatccc tgttgagaag 13860
tttatgaatt atgagccctt ctgcaaatga gagggttctt ccctgtcagg agggacagat 13920
tgtaggtggc aagattggtg gcagccagta ggctggtctg ctccttcctc tctatttcat 13980
atgtgtatga aggcattacc tgcagcaagg gcctgtgtaa atgcatgtga tttacagagc 14040
attttatgta ctgcgtgtca ttcatgcttc cggtgagccc taagtctaag atagggcaga 14100
tagcatcagg tccattttgc agctgtcaaa atgaggtctg aagggcagaa gtggtgtgcc 14160
cacacacaca caactggttg gctgcagacc tggggactag acccgggact tcgtcctgcc 14220
caggggtctc ttgccactgc tccccatcaa cttggatggc tttaagcatt tgtgagttgt 14280
ctgctccctg atggcagaat gcagagacat gaagctacaa gcaggttcgc tcccaacggc 14340
aaaaaggagg aggggtgttc agaacatcag gtgcttctag agaaagcagg gagagagtat 14400
ctggccttgt ggacaatgtc acggcagagg ccaggtatag ggcatggggg taactggaag 14460
cgggatggac cctgttattc cctaagacat ggcttccacg tagtgctcaa acaaggcctt 14520
tgcccttgct gttccctcca cctggaatat tcttcccctt ccttgacatt gctcaggtct 14580
ccactcttat gtcaccctct cagagagggc ttccctggcc actttcccta aaatagccac 14640
ccactcctag gtccctcaaa agcatatcct gctttggatt ttccctatag caatatgccc 14700
tatgaagtta ttttatttgc taacttgttt cttgtctgtt ttcctttgtt agagcgttgg 14760
ggaccttgtc tggcttgttc ccaatgcctg gaagagtgcc tggcacacag gattaagcca 14820
acacatatgt tttgaatgaa tgtgtgcaca catgcatgag ctggcggcag tcggggttgg 14880
ggtaagcacg aaggcccagc tcagttctct gcatgtgacc tcccatctta cgcagataag 14940
aaccagtttg gtttctgcta gcctgagtca ccctcctgga aactgggcct gcttggcatc 15000
aagtcagcca tcagccggcc catctcctca tgctggccaa ccctctgtga gtgtgtggga 15060
ggggaggctg ggctcctcct tgtactctct gaggtgctct ggaaggaggg gcagctccac 15120
cctgggaggg actgtggccc aggtactgcc cgggtgctac tttatgggca gcagctcagt 15180
tgagttagag tctggaagac ctcagaagac ctcctgtcct atgaggccct ccccatggct 15240
ttaggtaagc tccttccact ctcatttttt cacctgagaa atgagagagg aaaatgtcta 15300
caattggtgt ttatcaaatg ctttcaggct ctggtgagca agcgtccagg aaaatgtcaa 15360
gcgcatggag ctccaggcct gtctggggga tctgggcacg gggaggcatc catgggagac 15420
catgcaggca ctctgaggca ggggctgcaa gcctagtgcc tgctggggca gcaggtgaac 15480
agagaggtgt aactgctgtg acagaagtca tggagtcctt ggagtgtgag ggtcattttc 15540
cactgttgat agaataggga aattggtgaa atagccctgt taaatgagag aaagaacagt 15600
gtgagctcaa tgagaaatac taatagaatg tggcactgag ccacaaggtc tgaggcttga 15660
ttgataagga agggtgggga ctgtggagaa ttaagggctt ggcacaggtc agttccacca 15720
gttgtcacaa gagaatgcag gctcaggtgg ccagaacttc tcgcttttcc agaagagtcc 15780
gatattctga tttcattata tatagtattc tgattaaacc agacaataaa gcaagcagat 15840
aaaatattta aagtataagc tgccagtttg caacctccgg ttaggatttg tgtggggcaa 15900
agaaaaaaac tctcaggatc attggtatgt agactctaat tttaagtttc taatttaaaa 15960
ttggcccctg aggctgggcg tggtggctca cacctgtaat cccagcattt tgggaggcca 16020
aggtgggtgg atctcttgag gtcaagagtt caaggcctgc ctggccaaca tggtgaaacc 16080
ctgtctctat taaaaataca aaaattagct gggcatggtg gtgcatgtct gcaatcttag 16140
ctacttgggt agctaaggca ggagaattgc tggaacccgg gaggtagagg ttgcagtgaa 16200
tggagatcac accactgcac tccagtctgg gcaatagaga gagacgctct ctctaaaaaa 16260
aaatatgtaa agataaataa aatgaaataa aataggcctc taatgagcag gccattctcc 16320
tttctgggtc ttactttcct tgcactcctt tctgggtgtt aagaggaggt ctagaggaag 16380
ctggacaact cttagcttgt agtaagcaca gtggaagtat cagctcttaa tgggtcatgg 16440
acacgttaca agctaggcgc cgtgctgagc actttacatg gtttatccca ctgaaccctc 16500
tcaataaccc tatgaggaag ggctattatt gctcacattt tcagaagagg aaatggatat 16560
agagagatta gataatttgc ccatggccag acagctagta taagaggagg aggtggattg 16620
actgcagaca ttctgtcttc aaaccactac actatgctat ggaggcacag agacttaatg 16680
aaatcatgga gaggggaatt gctttgtcaa ccacaagcag ttattccggg ggcagcagat 16740
cctcccctgt cccccagtgg gtacaatggt ccctggtggg ttgtgctaca atgttagccc 16800
atggtcttat gtgtttttca aatgtgtaaa gtaggatgct ggaaccactc ttagaaccag 16860
ataccaatac attgtgaaga aataaatctc tgtgcttaaa actggttcat cccaaaatat 16920
tttgaactga cacacaatag gtgctaaata aatgtgtgtt aacttgaatt ggattgaatt 16980
cgggaaaaaa gtgcaataag cttagtgaag acaccatgtt ccctgggtag aggaaccaca 17040
ttctccatct aaggccagga gtatgggagg tatcaatgtt tgcccagcac agaacagggt 17100
gccaagaaga gaaaagttga cggggtgcat actctgactg gaaactggaa gggtgagaac 17160
agagggtaaa ggatagagat ggaaccatgt gcatacactt tgtgttacct tggacaagtc 17220
attcatttct ctggacctct gctttctctc tacacaatgg ggtcccacca cttcccttac 17280
agctgacttg tatgaagaag gaggtggagg aggaggagaa ggtgaagaca atgctgactc 17340
aaagggtaaa ttatttttag gatccaagtt tgaaaacaat tttaggctac tagatatgaa 17400
caacatcttg attatgtagt tgaaggaaat taaagatgaa tggtttaatt aaaaattaat 17460
cagaatgaaa acgattgatt actaatatat ctgcaatggt ttattttcct gagtggcaga 17520
ctcactaagg tttttgaata ctcctgtgtg attgctctat gtatgtatgt atgtatgtat 17580
gtatgcatgt atctatctat ctgttgtcta ataaaatgga tcacatctct gctaataaaa 17640
acactacact ggcagggtac aattataatc attaactgtg cctggaattt gcagcagcag 17700
ccaccagagg taccagtgcc ctttaagggt tcataattta gaataatcca attatctgag 17760
tttttcaggg actgaggggt ttggcaaggt gtagaacttt cagtaataaa gtcaagaaag 17820
tcctggacaa accaaggtag ttggtcactc tagtccataa ccaggtaaag agctttccct 17880
gtaacctgtg taaggtttta gaatcatttc tttccttatt accaaaaatc ctccccaaat 17940
tttcaagaaa ttatgaacta aatagttact ctatgagata ggagttcagc ccaaaagaaa 18000
caccataaga acaaatataa ttcttgctta tgttaaccat gcaatgaagc agagagaaaa 18060
agtcagtggc ctctttagga ggactgtagt gtgggaagaa ataactaaac tgggtttcaa 18120
tcctggcctg gccaggatct ggagcaagtg agttaatctt tctaagcctt gagtagtttc 18180
ttcttcttct tcttcttctt cctccccctt ctcctcttct tcttcctcct ccttctcctc 18240
ttcttcttct tcttcttctt cctcttcttc ttcttcctcc tcctcctcct cctcttcttc 18300
ttcttcctct tcctcttcct cttcctcttc ttcctcttcc tcttattctt cttcgtcgtc 18360
ttcgtcttct ttttattttc aaagtgaaag caagtttatt aagaaagtaa aggaataaaa 18420
gaatggccac tccatagaca gagtagcctg aaccttgagt tcttctataa agtcactatg 18480
aatttatact cattttgaaa gtgggtgtca atatgtctgt ccactttgca cagctgttat 18540
gtggacaaaa ggagatctgt gtgaaagtgt aacacagagc ctaaactata acaggtaagc 18600
aacacagttg tccccttccc catggtgtct gttcttctcc atttcctcct gtctgcaggg 18660
ggattataaa actaatcatc aaagccaaga aggcaagagc aagcatgtac cgctgaaaac 18720
acaagataac tgcataagta atgactttca gtgcagattc atagctaacc cataaactgc 18780
tggggcaaaa atcatcttgg aaggctctga acctcagaaa ggattcacag taagttaacc 18840
atgtagatct gagaggagag tagcttcttg tagataacag ttggattata taccatgtcc 18900
tgatcccctt catcatccag gagagcagag gtggtcaccc tgatagcagc aagcctgggg 18960
gctgcagctt ggtgggtaga ggtactcagg ggtacagatg tctccaaacc tgtcctgctg 19020
ccttagggag cttctaataa gttgatggat ttggttaaaa ttaacttggc tacttggcag 19080
gactgggtca gtgaggacca acaaaaagaa gacatcagat tataccctgg gggtttgtat 19140
ttcttgtgtt tctttctctt ctttgtacta aaatatttac ccatgactgg gaaagagcaa 19200
ctggagtctt tgtagcatta tcttagcaaa aatttacaaa gtttggaaaa caatattgcc 19260
catattgtgt ggtgtgtcct gtgacactca ggattcaagt gttggccgaa gccactaaat 19320
gtgagatgaa gccattacaa ggcagtgtgc acatctgtcc acccaagctg gatgccaaca 19380
tttcacaaat agtgcttgcg tgacacaaat gcagttccag gaggcccaaa tgaaaatgtt 19440
tgtactgaaa tttgttaaag cttcccgaca aactagattt atcagtaagg attgttttct 19500
gcaaggggga tgaaacttgt ggggtgagcc atttgggctg aggaggaggg aggttggagc 19560
tgagaaatgt ggagacaatt tccctttaga aggactgaat ctccctgcct ctctggggtg 19620
cggcagccag caggatccaa tggtgtatat gtctccccag ctccccattc agtgatatca 19680
tgtcagtagc ttgaaattat ccgtggtggg agtattatgt catggaaatt ggcaaatgga 19740
aacttttatt ggagattcaa ttgttaaact tttaccagca caacactgcc ctgccttcag 19800
agtcaatgac cctatccaag tttaatccat ctgtccactg tctccaacac gatctttata 19860
aaacacacct gacaacatta cccttttatt cagtttttta aaagataagt ttccagctca 19920
tcggggtggc tttaaaggcc atttctcctc tggacctcac ccaacttttc aaatcacttt 19980
tcctacccct acctctaaat gctactcaaa ctccagccat cctgaataat aagacttttg 20040
aaaagtagat tatgggctgg gcacagtggc tcacacctgt aatcccagca ctttgggagg 20100
ccaagatggg tggatcacct gaggtcggga gttcgagacc agcctgacta acatagtgaa 20160
accctgtctc tactaaaaat acaaaattag ttgggggtgg tggcacaagc ctgtaatccc 20220
agctactcag gaggttgagg caggggaatt gcttgaacct gggaggcgga ggttgcggtg 20280
agcctagatt gctccactgc actccagcct gggcaacaag agcgaaactc catctcaaaa 20340
aaataaataa ataaataaag tagattacat cagatacctc tggcctaggt tgtttatgac 20400
caactctcct gctgagaata actagaaaag ctagacaaaa catatttcca aaagatctct 20460
ttggaggcat cagagaatgg ccaaggctgt aaggaactgc ctgagcccag agaggtggag 20520
cccagcactg gtgcccttta ctcctgggga catgtgctgg tttcaaaaac ttcagctgag 20580
cttttgagca ttcatggaac ttggtggggg agatgaaatt tgtaccttaa atcctgccta 20640
cagggagggt ccctgataat ccccacccaa tttggaaatc tgggtcagcc ttcacaggta 20700
ctgaagccct cctctgaatg atctcaagtc ctgctagggt agaggttacc tgcttttgaa 20760
aggctcctgg cctacctgtg cagcaggagc aaaagtgaac catctcaggg tacagataac 20820
aatcatccag agccttgaat gacctctact gtgcttaata tatagtattc agcagtcagt 20880
aaaaaggatt taggcacatg caagatgacc tgtgtatcag ggagaaatag gcaataaatt 20940
gagatccagc agggatttga atcatggatt tgaatcaggg gcagccttcg aaagaactat 21000
ggagaatata ctcagattta aaacataaga ttggaatttt tggcagagaa ctaacaactg 21060
tacaaaaaag gaaccaaatg gaaatcctag aactgaaaga tgcaattaac cgatgttgag 21120
aaatagccaa catctattga acacttccca tgtggacagc tgtgctaaac actttacagg 21180
catcaacata agatgtgtcc ccttacagca gtgcagtgtc cctcctaaga catggacagc 21240
ctggtttccc tatctctctg cttcatcaaa acccctttac gtggggctta gacactcctg 21300
ttgtctctag tgtctagtag cacagggctc agcacatgga agccactaga tacaatttga 21360
tgaccaggac ctccgatgaa agccatgggt gctgattggg aaggcattgt cttttatgtg 21420
ctatggtctt aaagcttcat ccaggaagca gaactcgggg ggtgctgagg acccagaacc 21480
gagaataaga ttagtcagag atttcctgtg ggcagaaatc ataaggacgc caactgtttg 21540
ggtgagataa gacgaaacca agagtggact tgtggccaga agcgtgagga agagggagag 21600
agcttccctt gtcccctttc ttcctctccc taagccacag tgattgacag ccccccccct 21660
ttggagtcag agcaggcttg agactggact gggaaaggag ggtgggtcag gatacagagc 21720
aggaaggctg ggagtgcagg gcaggagcaa ggggctgggg cattcattgt gcctgatctc 21780
tcccacttta cctggggtaa agaagcatat gcaaaagcca cggtgtgagt atttcccaag 21840
tgccagggtc agggcatgat tcatcacgtg cagcatttca ttcaatcctt atagtaaccg 21900
atgatgtggc ttctattatt agctctatca gataatgaaa ctgagaccaa gacaggctct 21960
gcacattgtg tggggtaatg acacaggggg attcagacct agactccata actcctgccc 22020
cagggaccac ccccaccctc accctgtgca tgtcgacaaa ggacagactg ggccacttct 22080
caggacacag cggggaaatg acacagagca gggaggttcc aggagccccg agcgtctttt 22140
ctccaggaga atactctctg aattcagact ggggtcagag aaacatttac ccaggagccg 22200
cagtgtgggt ggggcttttt acttgaaacg ctgtctgaag gcagtggcca ggatggaact 22260
ctccacccta ccttggcaag ccacttctct tctgcaatct gtaaggacat tgttgagaga 22320
attatggtct tccaattccg gagggttgaa gaaagacaaa taggagagaa cctatcatag 22380
tcaggtgcta gctgccttct ctttcagaga gtgtgagaat aaagtgatac acttgattat 22440
tagcaaatac tttggaaatt ttaaacgcta atattcaaca cactctggaa gaggcaaata 22500
agtagacagg ttcatataca tcatctcctt cagctagtcc tcacaaaaac aaacaaatga 22560
ataaacaaaa ttcttctttg gccctcatag gaagacactg tttcttgaac gtgtttcaaa 22620
aaggatgggt gactcactca aggtcacact gtttatgagg acagtacagg aatacagaca 22680
tgccattttg cctgaaaaaa tccatcaccc agggaggtga cacaattttg cagaaatgtt 22740
ctatttcctc tgaaggatac attctttaaa cctttgggaa attcattcat agtcttcctc 22800
ctttgaagga ttaactctct ggacacaaag tgtttgattc tgatttgttg gttggaagat 22860
gtgttggttg agagaaagat tctgatttgt tggttgaaaa tagactcatc aagatcaact 22920
gctgtagtag taaatatttt gacattttgt ctgtattcct gtgctgccct cacaagctgc 22980
atcaccttga gtgagtcatt catacttttt tgtttgtttt tgttttggag atggagtctt 23040
actctgttgc ctaggctgga gtgcggtggc gtgatcttgg ctcactgcga cctccatctc 23100
ctgggttcaa gtgatcctcc tgcctcagcc tcccgagtag ctgggattac aggcacatgc 23160
caccatccct gctaattttt gcattttcag tagagacgga gtttcaccat gttggtcagg 23220
ttggtcttga actcctgacc tcaggtgatc cgcccacctc agcctcccca agtgctggga 23280
ttacaggtgt gagccaccgt gcccagccca gccatcattt ttgaaacacg tttgagaaac 23340
agtgtcttcc tttgagggcc aaggagacat tttttttgtt tatttgtttg tttttgtgag 23400
gactagctga agggggtgat gtatattaac ctgcctactt atttgcctct tcccagagtg 23460
tgatgaatat tagggtttaa agtttctgaa gcatttgtta ataaagcccg gggctggagg 23520
tcagaagacc tggatttctc tgcatacttt tgccatcagc aagctgtgtg accttggaca 23580
gatccctttt ttgtctaaat ctttctgagt cttcttgaaa acaatgccag gttgggacag 23640
gatgattgcc aagctcccgt ccagctctaa aacactgcaa cgtatgcttc tgcaccagca 23700
ctgtccatcc tgtagatcat gcagaaattc tcttcaactt tttcctaccc ataaaatagg 23760
agcatgctta cctttttcct aatgttccag gccccgggtc tagaatattg taagtaagga 23820
agttaatgtg tatcagagcc cattatgggc cagaagttct cctcttcctt cctacacctg 23880
cttcctccct ccctccctcc ctctttccct tccttccttc catccatttg tgaagaagac 23940
atgatcaccc tcattctgag agtgaagaga cagaggctca actaatgaaa tgatttgttc 24000
aaggtcacac gggtggcaca aggcaagtgg cagaggttga atttagaccc attcctgtcc 24060
aaatgctgag tttatgtcat cgtcccgaga ccataacttt aaagatgtaa gatagtggga 24120
aaagagttga tttcaaagca cctctcagaa ggactcactt tacatcaggg gtcagcagac 24180
tcaggccaaa tccggtccat tccccgcttt tgcaaagaaa gttgtagtgg aacacagcta 24240
ggcttattga tttatggatt gccaacgtcc ttttgtgaaa cagacagctg agctgagtaa 24300
tcgtggcgca caaaacctaa aatatttact atctcgtcct ttacagaatg tttgccaatc 24360
tatggtccgg agtccaaggc tgtccatttt tcaaagaaca caaagtgaca tgagactgtc 24420
ccatgtgcag ggagccctat cattttatta tgaaaaaacg gcctttctgc tcaaatctgt 24480
tttttaaaaa gtcaacaaac agactctggg tacctgtcag gaacagtagg gagtttggtt 24540
tccattgtgc tcttcttccc aggaactcaa tgaaggggaa atagaaatct taattttggg 24600
gaaattgcac aggggaaaaa ggggagggaa tcagttacaa cactccattg cgacacttag 24660
tggggttgaa agtgacaaca gcaagggttt ctctttttgg aaatgcgagg agggtatttc 24720
cgcttctcgc agtggggcag ggtggcagac gcctagcttg ggtgagtgac tatttcttta 24780
taaaccacaa ctctgggccc gcaatggcag tccactgcct tgctgcagtc acagaatgga 24840
aatctgcaga ggcctccgca gtcacctaat cactctcctc ctcttcctgt tccattcaga 24900
gacgatctgc cgaccctctg ggagaaaatc cagcaagatg caagccttca ggtaaggcta 24960
ccccaaggag gagaaggtga gggtggatca gctggagact ggaaacatat cacagctgcc 25020
aggggctgcc aggccccaga gggcctgaga actgggtttg ggctggagag gatgtccatt 25080
attcaagaaa gaggctgtta catgcatggg cttcaggact tgtgtttcaa aatatcccag 25140
atgtggatag tgcgaccgga gggctgtctt actttcccag agactcagga acccagtgag 25200
taatagatgc atgccaagga gtgggactgc gattcaggcc tagttgaatg tgctgacaga 25260
gaagcagaga ggggcaccag gggcacagcc cgaaggccca gactgatatg ggcaaggcct 25320
gtctgtgctg acatgtcgga gggtcccact ctccagggac cttggtttcc ccgtctgtga 25380
catctgtgac atgagagtca cgataactcc ttgtgtgcct tacagggttg ttgtgaaaat 25440
taaatgcaca gataatagcg taacagtatt ccgtgcattg taaagagcct gaaaaccatt 25500
atgatttgaa aatggaatcg gctttgtgag accatcacta ttgtaaagat gtgatgctga 25560
tagaaatgac aggactgctt gtgcatgccc tctgcagtgt gacattccag cagtgaaatc 25620
atgttggggt gacttctccc ccactctgac ctttatgttt gtctgggccg aggctgcaag 25680
tcgggctctg tgggtgtatg agtgacaagt ctctcccttc cagatatggg gactgtctgc 25740
ttccctaggt tgcctctccc tgctctgatc agctagaagc tccaggagat cctcctggag 25800
gccccagcag gtgatgttta tccctccaga ctgaggctaa atctagaaac taggataatc 25860
acaaacaggc caatgctgcc atatgcaaag cactttggtt tgcctggcca cccctcgtcg 25920
agcatgtggg ctcttcagag ccacctgatg aggtgggtac agttagccac acttcacagg 25980
tgaagaggtg aggcacaggt cccaggtcag gctggccgga gctctgttta ttacgtctca 26040
cagctttgag tcctgctctc aaccagagag gccctttacc aagaagaaag gattgggacc 26100
cagaatcagg tcactggctg aggtagagag gaagccgggt tgttcccaag ggtagctgct 26160
cctgcaggac tctgagcagg tcaccagcta atggaggaaa ggctctaggg aaagaccctt 26220
ctggtctcag actcagagcg agttagctgc aaggtgttcc gtctcttgaa acttctacct 26280
aggtgctatg gtagccacta gtctcaggtg gctatttaaa tttatactta aatgaatgaa 26340
aatagaagaa aatttaaaat ccagaccctt ggtcacacta tccacattta aagaggtcaa 26400
tagccacatg tggttagtgg ccaccctatt gggcagtgca gctacagaac atttttgcat 26460
cccagaaagt tcttttggat gttgctgctc tacagcatgc tttgctgaaa cagaagtgcc 26520
ttccctggga atctcagatg ggaagcaagt aaggagggga gtcaaatgtg ggctcactgc 26580
tcaccagctg tgagggttgg gcctgcctct taaccattgt cagcctcagt cttctcatcc 26640
atgcatgccg tgggtatact aaaatactat acccctggaa gagctggatg caaatttgac 26700
aagttctggg ggacacagga aggtgccaag cacaaggctg ggcacatggt ggctgtgcac 26760
tacagctgag tccttttcct tttcagaatc tgggatgtta acc 26803
<210> 21
<211> 177
<212> PRT
<213> Homo sapiens
<400> 21
Met Glu Ile Cys Arg Gly Leu Arg Ser His Leu Ile Thr Leu Leu Leu
1 5 10 15
Phe Leu Phe His Ser Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser
20 25 30
Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe
35 40 45
Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn
50 55 60
Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala
65 70 75 80
Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys
85 90 95
Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp
100 105 110
Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser
115 120 125
Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp
130 135 140
Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn
145 150 155 160
Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp
165 170 175
Glu
<210> 22
<211> 159
<212> PRT
<213> Homo sapiens
<400> 22
Met Ala Leu Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser Lys
1 5 10 15
Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu
20 25 30
Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn
35 40 45
Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe
50 55 60
Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly
65 70 75 80
Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser
85 90 95
Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser
100 105 110
Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu
115 120 125
Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro
130 135 140
Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
145 150 155
<210> 23
<211> 180
<212> PRT
<213> Homo sapiens
<400> 23
Met Ala Leu Ala Asp Leu Tyr Glu Glu Gly Gly Gly Gly Gly Gly Glu
1 5 10 15
Gly Glu Asp Asn Ala Asp Ser Lys Glu Thr Ile Cys Arg Pro Ser Gly
20 25 30
Arg Lys Ser Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln
35 40 45
Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln
50 55 60
Gly Pro Asn Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu
65 70 75 80
Pro His Ala Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser
85 90 95
Cys Val Lys Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn
100 105 110
Ile Thr Asp Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe
115 120 125
Ile Arg Ser Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys
130 135 140
Pro Gly Trp Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser
145 150 155 160
Leu Thr Asn Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe
165 170 175
Gln Glu Asp Glu
180
<210> 24
<211> 143
<212> PRT
<213> Homo sapiens
<400> 24
Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu
1 5 10 15
Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn
20 25 30
Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe
35 40 45
Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly
50 55 60
Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser
65 70 75 80
Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser
85 90 95
Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu
100 105 110
Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro
115 120 125
Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
130 135 140
<210> 25
<211> 3804
<212> DNA
<213> Homo sapiens
<400> 25
taatttcagt gaaattatat aacttggtta catttaggtt acttattaca aatgaaaata 60
aatatactaa cagaagctgc ctcatatgca aatgagtaac atgttagaga ctaaaataca 120
caaaaaaatg catgtgcttt agctcatata aacaatatac aggacaactt accgggtagc 180
ataaacaacc aacaacggac tatcaaaagg aacctcgtca tctagtaact ttaaccttgt 240
tggtagatct cctttttcca tctccatata cacaggattg gaacttgcca tttctgaaat 300
ataaagcata tccttttcca aactttatct cttaggcgga aatattcaat ttatgaacat 360
gttcattcag caatcattag tcacgtacct actgtgtgga cctattatgt gcaaggccca 420
atattaagca ttacaagaga aacaaataaa agtacaagag atgtaatttc tacttttaag 480
aaccttaaaa tctaattggg aggcaaagca tattaaaagt tttaaataag acgaaggaac 540
atataattaa tacatcagtg actattactc ttaaaataat gagtatctag gcctatatat 600
agcaactgtc catataagca cacatcaaaa accaatatac atagctatca tcaatgccaa 660
gttgctcagt tttttctaga actagtattc ctactccatc ttttagaatt aaattcaatg 720
aaattaattt taaaatattt gacctttttt taaagttacc agtatagcaa atactcattc 780
tctgaagaac agaagatttg actttttgga atagccaaaa gtcacttaaa atcaagtctg 840
gtgaaaggag tgatgatcta aaactatttg tggtttaaaa aaaaaaagta tgaatctaaa 900
gtaaagtggg tttttttcca agtagttttc ttttttagtt ttttagaaac agggtctcat 960
tctgttgccc aggctggagt gcagtggtga tcactgcaac cttgaactcc tggctgtgtg 1020
tgtgtgtgtg tgtgtgtgca gcgacggggt cttcctacgt tgcctagctg cagtgcctgt 1080
gtgcacacat gcgcacatgc gtgtgtggag agacagggtc ttgctacgtt gcctagctgc 1140
aatacctggg tgtgtgcatg tgtgtgtgtg tagagacaag gtcttgaaac gttgtctagg 1200
ctggcatgtg tgtgtgtgtt tatatgtatg tgtgtgtaga cagggtcttg ctacattgca 1260
taggctggtg tgtgtgtttt tgtgtgtgta gagacggggt cttgctacgt tgcctaagct 1320
gggcaagtat ttttcaactg cctctgaaga caaatcccaa ataacagttc caaaagctgt 1380
ttcccataat tatcacatca ttagaagggt gaggcctact caccaggttc taagagccaa 1440
cattcatttt ctgatacatg cttttttaaa aaagtcattt tttccccagt ctcattgttt 1500
cccatttgac tgtgtcaggc aataagtact ttaaaggaat tcagaggagg aggccattca 1560
gaggtttggg gaagcctgat gactgcgcgg gagctaaacc agacatatcc acctaaattc 1620
aagtaagcag ccatatcact caaattgccc accatgcttc ctctagccag cactggtagt 1680
aacaactatc actctggctg atggagactc ttttctgctc ttctgtgact gggtatgatc 1740
acataataga gacagataca gtaaatttcc aatgagtaat aatgtcacac atttgaactt 1800
acctgaggag aaatagcttg tttcttattt cacacaaaag acaatctacc tcaactcaga 1860
aaaaaaaaaa ttattatgct tttaactgct atatttgaat taaagcagat ctgtaactat 1920
agatccatgt ttctagaaag ctaaaatatc tttaagtaag atgacataaa aatgtatctc 1980
tattcacttt tggtaatgaa tgaaaagttg cttaaagtct aaagtattag aaatatggca 2040
tctgttattc aagtaggatt tggaattaag aaaattcact tcttcaaaaa catgggacta 2100
tggctgcaga aagggcaatg catatagttt ttagggtatg atagctggtt tctattatat 2160
gtcaggatga catatgcgac cttccgccaa ggtagatact gcgggctatg caccaaagtc 2220
tctgaggcag acatgtaagc gagctcttca cctatattca ttcttttcct cctggacagg 2280
ttacatttcc cagtttcctt tgcagttagt tgtggctata tgacagaatt ctcatcaatg 2340
gaaatgtaca cagaagagag gtaagccact accaggccag gcctataaga cagcactttc 2400
tacatgcttt ccccagacat agcaacccaa acatgaccac atcccttaag ggaagatgga 2460
gctgaaaata atggaaggaa cttggaatgc tagaatgctg aattaccacc tgggagacag 2520
ctacccactg acctggaata cctgtcctgg actgttacat gagcaagaaa tacacttcta 2580
tttatgtatg agttacttca ttatcagata tttattacag cagtttagct acctaagatc 2640
tctctctgcc tcagactgct tatctataaa atggaataac accatctact ccaaacatta 2700
ttgtaaggat gaaatgagac aatgctgaaa agtgtttacc ataatatctg ccacacaata 2760
agtaccccat atagtatttc tgtattagta agttacatga gagattttct tcttttaata 2820
catctgcatt tataaacatt ttactttaac ctcaacttcc ccagcactgc tctaccattt 2880
tctgaatgtc attatgagag aaataaaact aatttctagg gccaggcatg gtggctcaca 2940
cctataatcc cagcattttg ggaggccaag gtgggaagac tgctttgagg tcaggatttc 3000
aagaccaacc tgggcaacac agtaagaccc catctctata aaaaaatgaa gaaatcagag 3060
ggtacagtgg cacatgcctg taatcccacg actcagaaaa ctgaggcagg aggatcgctt 3120
gaacccaagg gatcaaggct acagtgagcc atgatcacac cactgcattc cagcctgggc 3180
acagagtgag accctgtctc taaaaataaa aaatagggcc aggcacagtg gttgatgcct 3240
gtgatcccaa cactttggga ggccaaggca ggtagatcac ttgaggtcag gcgtttgaga 3300
ccagcttggc cgacatggca aaaccctgtc tctactaaaa tacaaaaatt agctgggcgt 3360
ggtggtgcac gcctgcagtc ccagctactt gggaggctga ggcaagacaa tcacttgaac 3420
ccaggaggcg gaggttgcag tgagccaaga tggcgccact gcactcaaac agaatgaaac 3480
tctgtctcaa aaaaaataaa ataaataaaa atttaaaaac taatttctta taatccagtt 3540
gtgaatttaa ccaatgtctg aaagaactat taaaagttaa aatgaatgga aaacagaata 3600
aagggttgac cagaacagat gtgattttct acttaaatct tttttttaaa ccccaaaatt 3660
caaaactgct aatgtttttt aatacgaatt tctatctttg ataaggcaat ctgagtatta 3720
cctttcaatc cttcaataaa agtatcccaa acagaagggc tattactgta actaagcttg 3780
atactctcct tcgctctttt caag 3804
<210> 26
<211> 3804
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (2122)..(2131)
<223> n is a, c, g, or t
<400> 26
ggcttctggc tctgagtgag gtcctgctgc aaggtttcct agatgagcca ctgagactct 60
aataagatcc agtggaaata accaggctct cgtcggaata taagtcccaa gggaagctgt 120
gccagtcttg tgggcgactg cctgacttct cctttcattt cagcaccatg aagcttctca 180
cgggcctggt tttctgctcc ttggtcctgg gtgtcagcag ccgaagcttc ttttcgttcc 240
ttggcgaggc ttttgatggt aaggcttcag aaggtttgca ggatttctga agagaaacat 300
caccctggac ctgataaact ggggaaaatg atgctttcgg aaggctgctt ttgaaccaca 360
gagttgctag tgtctgcgtt gctgaggcct gccaggaact agggtttgct gggttgcctg 420
tctcgagtct ttcagagctg ctgggaatat cccctttccc cgtagtgcag cttctcagga 480
tgtgttaagt ggatggatca catttcagaa gccgctgcaa ggtgtatcaa aaacacatct 540
cctgagccgt aagggacggg gcatccagta acaacgcaca cggggtattt ttgggcttcc 600
ttaagatttg agccgctgcc ttaggttgtg ctgcccaatg tgcctgggga gctgctaaac 660
agattagaga gtcgaggatt gttgtcagtt actcagagaa agaacaatca tcctttccag 720
gagcacctga gctgtttgtt ttgcgtagaa gatgcaaaat aaggcctgca atgggtataa 780
aatgtccctc agcataaatc gcataggagt atgactaagg ctgttgactc ttctgtcttc 840
tttctccttc ctccttcgat ttcctagttg gataatgtac agggctcttt agcctcgctc 900
tgtcaggggc tcccttcctg gtttgttctg tttccattct tccttctcca gccttcttga 960
caagagctgg gaactaacgt gcctcaagcc cccacaagga ccacagcatt ttctcattta 1020
gtttcagaat gactctgtga cgcaatcttc ctctcttgga aggtgagaaa gctgatcttg 1080
gaaggtgaga aagctgagac ttagagcagc tgaagccaat gcccagggac ttactgccag 1140
tcagcaggtg gcagggcaga ggtttgagcc cggctgtgct tgaggtcagg gctcttgcca 1200
ggtagacgca tcactgacca cctcctagag gttgatggtt atgaatctca ggcacacctt 1260
ggcatcacct gaaataccca tgccttcaac tccccagcag agtctgcaga aactggcctg 1320
gggtgtggcc tgggcactgg gactttcagt ttctctctgg gtgattagaa agtgcagcca 1380
aggctcacgc ctgtaattcc agcactttgg gaggccaagg tggatgaatc acttgaggtc 1440
atgagttccg gagcagcctg gccaacatgg tgaaaccccg tctctactaa aaatactaaa 1500
atgtagccag gcgtggtggc aggcacctgt aatcccagct actcaggagg ctgaagcacg 1560
agaatcactt gaacccgaga agcagaggtt gcagtgacta gagatcgcac cagtgtcctc 1620
caacctgggt gacagagcga gactccatct aaaaaaaatg aaaaagaaag tgcagccaag 1680
gcagagcacc actgccctat tgcttcctca agcaacccac agcatcagta cagcctacta 1740
agaaagtatt tagggacttt tatgctccta acagtcactg gaactcacgt cacaatgacg 1800
tgtattccat ttgcaagaat atatacttta ggtcggggtg cggtggctca cgcctgtaat 1860
cccagcactt tgggaggcca aggcaggggg atcacgaggt caggagttcg agaccagcct 1920
gaccaacatg gtgaaatccc cgtctctact aaaaatacaa aaattagcca ggcgtgatgg 1980
cgcatgcctg taatctcagc tactcaggag gctgaggcag aagaatctct tgaacctggg 2040
aggtggaggt tgcgatgagc tgagatagca ccactgcact ccagcctggg cgacagagca 2100
agactctgtc taaaaaaaaa annnnnnnnn naaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaagaatata aactttagta gtcagggcag aagtactctg tgtctgccac ctttctcagc 2220
atcagtattc catgtcacta cctcattcat acacactcct ggatcttatc ataggcagct 2280
tcattctata gcagtggctc ttcaccaggg cacttgaaga agccaactag gataaaggaa 2340
tgtgcttctc aacccatggt atccaaggct gctatgatca caggctgaaa gcttgaagtc 2400
agtggaagat ttgtccttcc tcattcccct ctaaggtgtt gttggagtct ttatgttctc 2460
ctgatgtccc ttctgccttt cctttccttt ccaggggctc gggacatgtg gagagcctac 2520
tctgacatga gagaagccaa ttacatcggc tcagacaaat acttccatgc tcgggggaac 2580
tatgatgctg ccaaaagggg acctgggggt gcctgggctg cagaagtgat caggtaactg 2640
gagctcctgg gacgttaggg ctgggtgagc agagcttgcc tgccttggac agtcaggagg 2700
gagacgagct ccttgtggag aagttagagg ctgcggcccc tcctcctctt gccctctctc 2760
tgcctctgtg ctcagtgtga ggtctgagtg gatggtagga gtgagtgatt cctcatcctc 2820
cctctctggg tgctgttcat ccagcctagg ggtgcccagc ctggctgaat ggggtggtgc 2880
ccagtgtttt catccctcct tccttggcct ttctgggctc ctctctgagc cctcccttgg 2940
aacagggaga atgggagggt gggctattgc tcactggcct gattattaat ctccttcttg 3000
cctgccttga ttacagcgat gccagagaga atatccagag attctttggc catggtgcgg 3060
aggactcgct ggctgatcag gctgccaatg aatggggcag gagtggcaaa gaccccaatc 3120
acttccgacc tgctggcctg cctgagaaat actgagcttc ctcttcactc tgctctcagg 3180
agatctggct gtgaggccct cagggcaggg atacaaagcg gggagagggt acacaatggg 3240
tatctaataa atacttaaga ggtggaattt gtggaaactg ggtgttatac tttgtggtat 3300
agactgcctg tttagtatga aggggcgatc catgcacatc taagtgaacg tggaggctgg 3360
gtgggtggga gacgactcct gggcacacag ggcatcctgg gcatccctga ggcaaggaca 3420
tgatgagttc agtggccacc cccacaggat cccaggggct tcagcagatc ccacccctta 3480
ccccatgtga gcagctgccc agtgagtctg taggaacccg agccacattc ccagtgagtt 3540
caactgcacc ccggcacgtt ttgctagcac ctcaatggag agctccttgc ttgcagcttt 3600
ggcttgtggc acccagcaaa agcttcctgc cacccagtgg ctacagccac acactctcca 3660
gcaagattta atctcagcct tgtgaggagc cctttcccaa atttatttct ttctgtgttt 3720
tttatccctt agtagctaat ctcatgttag ccattaataa ctctctatgt taaacccttc 3780
cttttgtatc tgcggctaca ttga 3804
<210> 27
<211> 3804
<212> DNA
<213> Homo sapiens
<400> 27
gtataaatgc agaggtgcag taactgggct tttcaggata tccagatgga gttgtggtgt 60
tgttttgctt gtggttttta acgttaactt ttttttcccc tttattttaa gagaagcaca 120
aaatgaacaa actagtgagc ccagcaacat ggatggaaat tccggagatg cagactgctt 180
tcagccagca gtcaaaaggg tatgggcaaa aaaatatgaa ccatttgggg ctcaagtttc 240
tccaaatact ttatgtgact gcaagtactg tatacgctta tttcctgtga ctcagttctt 300
ctaactaaga tgttaagcat ttggcttaaa gtgtatagca ttacaaagag tatttcccca 360
gctttggctt gccagccaac tttccattga ctctagcctg ttagccattt ttattgtttt 420
ttgtttgttt gtttgtttgt tttcctcaca tgtacacata catacagatt gttcttatat 480
gtgattttgt tctctgggaa taaaatcttc attcaacaga ggcaatatga cagaaaaacc 540
gaagtttcat gtatatgatt tttcaaagaa agtgaattgg ccctcatgtt aaacctagca 600
tttcagagct gaaagtgtct tctcattaaa tattgaagaa atcatttgag ggtgtggaga 660
aggatggaca gaattagctg cttgtgtatt tattcttctc ctgcaacttt gccacgctat 720
tttgtacctc ccttcctaat tatgataaag ctttcttaga gagcagtcag gcaatgtgta 780
ttaaatgttt aaagctttac acccttagtt ctacttgtgg acatttattt cttaagaaag 840
atgtatacta agatttagat agaaatattc attacagtat cataataaag acagtagcaa 900
ggattctgtt atctgtgttg cattaataca atagagattg atgcaactgt tcattatttt 960
gaaagcatta atgataatat tgcatcaaag agttcactga acagattgta cagtacagtt 1020
ttacacacaa aaaaaatagt ttgtgagctt taaaagggcc ttcaaatgaa tatgctaaac 1080
ggttatcttt caataaagag agtatgggta agtcttaatt tctttcattt atttcagtaa 1140
tttaatgttt ttgttgttgt tattgtttgt ttttttgaga cagagtcttg ctctgtcacc 1200
caggctggag tgcagtggtg caatctcagc tcactgcaat ctcggctcac tgcaacgtct 1260
gcctcctgga ttcaagcaat tcttctgcct cagcctccgg agtagctggg attacaggcg 1320
tgcaccacca tacctagcta atttttgtat ttttagtaga gacggagttt tgccatattg 1380
gccaggctgg tgttgaactc ctggcctcat gtgatccgcc catctcagcc tcccaaagtg 1440
ctggggttac aggcatgagc cactgtgcca gcctatttca gtaacttaat gtttttacag 1500
gcatgtatta cctataaaat taataaagcc agtgaggtat ttcttttttg aactaaagca 1560
aagctaataa taagttatag agaagttaga gaagaaatct attaagtgat actttctttg 1620
tatactgttg ggctgagtac ccttgattct tggtggtgaa caagttatca gaaatttctt 1680
ggccaggagc cgtggctcac acctgtagtc ccagcacttt gggagtccaa ggtgggtgga 1740
tcacttgagg tcagaatttc tagatcagcc tggccagcat ggtgaaaccc tgtctctatt 1800
aaaaatacag aaattagcca ggcatggtga cgtgcgcctg taattccagc tacctgggag 1860
gctgaggcag caaaatcact tgaacctggc aggcggagtt cgcagtgagc tgggatcgcg 1920
tcgctgcact ccagcctgga tgacagagca agactccatc tcaaagaaaa aataaaaaag 1980
aaatttattt acttgtgtga atttttacaa tacagatgct tctcgactta aatggggcta 2040
catcccaata aactcataag ttgcaaatac tgtaaatcaa aaatgcattg aatacaccta 2100
atgtatggaa caccatagtt tagcctatcc tactttaaat gtgttccgaa cacttagatt 2160
agcctgtagt tgggcagcat tacctactat aaagtgtatt ttctaataaa atgttgaata 2220
tctcatgtaa ctcattgaat actgaaagtg aaaaacaatg tatgggtact caaaatatgg 2280
tttctctact gaatgtgaat cactttgaca ccatcataaa gttgaaaaat tccaagtcaa 2340
accattgtaa gtcaggggct atcagtattc agtggtaaat gctggctcta actattcttc 2400
caagtcagtg gttgactgct gtttattcta taaagggtta caatttatag attctctcac 2460
ttgtagaatg agagattcag aattaatagc agacagagtc cctaccttga tggagctttc 2520
atttaagtgt gaaagtcagg tgacctaaca aggccttggc ataagtttag gatttggatt 2580
gttatgggag cttgggtagg gacatgtcat aggtaaggca acagcagggg tagagataag 2640
cttgacatat gtcaaaaatc atgaagacat cagtaatcct tgaagttggc tgaaaggtat 2700
agagttgaga aagtagttaa aaaaaaaaaa gtcaggctga gtctaggtaa ggatgtgttt 2760
ctctgaggtc agatttgttc ctgtaccata aagggactat ttagaatctt aaagctggag 2820
caatttaaaa cgttaagttt tcagattgag gtcagatttg tgacttcatg tgaggtcaga 2880
tttgttcctg taccataaag ggactattta gaatcttaaa gctggagcaa tttaaaacgt 2940
taagttttca gattgacgtt ttttgaggta tagttaataa cctgaatgtt ctgattctag 3000
tcttggtagt caataagagt tgaccagatg aatttcatag ctttgtagag gatgaaatat 3060
ttcaaggctg atttgcacaa atgtttacat agatcatgta tctttcataa gtaatatgtt 3120
tgtattatta caaggctgta aaaatttaag caggttgtta atagcacagg gggtaacaga 3180
ttaataaaat taatgaataa aattactaaa agagtccaga agtaaaccca aatacgtgga 3240
ggaattaagc atatgtatga tacacatgac attttaaaaa tcagtgggaa aaggtaaatt 3300
attttacaaa tggtgttaga agcactgatt gataattttg ttaaaagaaa cttagattcc 3360
ctattttact cctaatccaa aataaattct gagtggatct aagattaagc aaaaattaag 3420
ccggaagctg agcatggtag catgtgtctg taatctccgc aatttaggag actgagtttg 3480
gctggggagg tggtgatatg cgcctagaaa aaaaaaattt tttaagccac agatgtataa 3540
gcaaaaagcg ggcaaagagg cggaattttt tttttttttt ttgatgaagt ctcacttgtc 3600
gcccaggctg gaacgcagtg gcgtgatctc agctcactgc aacctctgcc tcccgggttc 3660
aagcgattct cctgcctcag cctcccaagt agctgggatt acaggcacct gccgaggaga 3720
ggattttttt ataattaaaa caaaacaaaa caaaaaaaca ccaaactgga agataaagta 3780
tttacaacat gtaaaagact gttt 3804
<210> 28
<211> 122
<212> PRT
<213> Homo sapiens
<400> 28
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 29
<211> 122
<212> PRT
<213> Homo sapiens
<400> 29
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 30
<211> 122
<212> PRT
<213> Homo sapiens
<400> 30
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1 5 10 15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
20 25 30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
35 40 45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
50 55 60
Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg
65 70 75 80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
85 90 95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
100 105 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
115 120
<210> 31
<211> 5687
<212> DNA
<213> Homo sapiens
<400> 31
ctctctggtt gcccttaaca ttttttcctt catttcaact ttggtgggtc tgatgattat 60
gtgtcttggg gttgctcttc tcgaggagta tcttagtagt attctctgta tttcctgaat 120
ttgaatgttg gcctgtcttt ctaggttggg gaagttctcc tggataatat cctgaagagt 180
atttttcaac ttggttctat tctccttgtt actttcaggt acaccaatca aacgtagatt 240
tggtcttgtc acatagtccc atatttcttg gaggttttat tcgttccttt ttattctttt 300
ttctctagtt ttgtcttctc gctttatttc actaagttga tcttcaatct ctgatatcct 360
tgcttctgct tgattgattc agctatcccc cgctcgatat tacaaaccat gtcacgaggc 420
gtggacaccc cccatgatat ggggagtatt atcacccccc tcttccccca ctggatatta 480
caaaccatgt catagggagg tggacatccc ccacaatatg aggagtaata tcacacccct 540
ttccccgcag tggatattat gaaccatgtc acaggcggtt aaacaccccc aacgatatgg 600
ggagtaatat cacactcctc tcccccctgg atattacgaa ccatgtcatg gggggtggac 660
accctttgca atatggggag taaaatcacc cccctctccc ccaactggat attatgaacc 720
atgtcacagt gggggaaaaa tcctctgtga tatgcagagt aatatcaccc cactctcacc 780
acctggatat tacgaaccat gtcacagggg ggtggacacc ccccaagatg ggggagtaat 840
atcacctcac tctctgccac cagatattac aaactgtgtc acaggggggt gaacaacccc 900
cacaatatgg ggagcactat cacccccctc ccccagggta ttatgatcca tgtcacaggg 960
gggtggatac cacccactat atggggagta atatcacctt tctctcccgc cctggttttt 1020
atgaaccgtg tcacaggggg gtggacaccc cttgcgatat ggggagtaat atcacccccc 1080
tctccaccat ctggatatta cgaaccatgt cacagggggg tggacacccc tgcgatatgg 1140
ggaggaatat gcccctctcc ccacctggat attacaaatc atgtcacggg ggacggacat 1200
cccccacaat atggggagta atatcaccac actctcccct gctggatatt acgaaccata 1260
tcacaggcgg ctggagacac aaggcattaa caatatttcg agtaatatta tctttccctt 1320
tgaacattat gaacaatatg acagaggggt gtacacctcc tgcgatattg ggagtaatgt 1380
catcccctcc cccactggat attaggaacc atattactgg gggatgtatt cccccttcta 1440
gattgggagg aagatcatac ttgccctccc tgaatatttg aaacaatatc ataggggttt 1500
gtacactttt acgatattgg gagtaatatc atcctttctc cccctggaaa ttaggaacaa 1560
tatcacaggg gtggtgtaca cccctgcaat atttagggta atattattgt cttctcccct 1620
cgatattagg aacaatatta caaggacggt gtaaagtacc tgccaaattg ggaaaaatac 1680
tatcctctcc ctcttgtata ttagaaacaa taacacaggg ggaatgtaca cccactgcca 1740
tattgggagt aatatcatac tcgccccatc ccccagatat taggaacaat atcacagcag 1800
gggtgtacac ttttacgata ttgggagtaa tatcatactc tctccccctg gaaattagga 1860
ataatatcac agagatggtg tagaccctct gcaatactta ggataatatt atcatctccc 1920
ccctcgatat taggaacaat attacgggga gtgtaaatta cctgccaaat tggaggtaat 1980
cctctcctct ctctccctgt attttagaaa atataacaca caggaaatgt acaacactgc 2040
gatattcgga gtaatatctt cttctcccca cctggatatt aggaacaata acacggacgg 2100
ggcgtacacc cctcgcgata ttgaatgtaa tgtcatcctc tccctccctt tatattacga 2160
acaatatcac aggggggtgt acaacccctg caatattgga agtagtatca tccattctcc 2220
catgaatatt aggaacaata tcacaggggt agagtacacc ctctgcaatt tcgggagtaa 2280
catcatcctc tcgttccctg gatattataa acaacaccac gggggggtgg gggtgtacac 2340
acccttcgat attgggagta atataatcct ttccctccct atatattaga agcaatatca 2400
caggggttgg tgtaaacttc ttgcgatatg gggattaata tcacccccct ctcctgccct 2460
ggatattatg aaccatatca cagggaggtg gacacacttt gcgatatggg gagtaatatc 2520
acgcccctct cccccccgat attacgaacc atatcacaag ggagtggacc ccccccacga 2580
tatggggagt aatatcaccc ccctctcccg ccctggatat tacgaaccat atcacagggg 2640
gatggacacc ccccgcgatg cggggagtaa tgtcaccccc ttctgccccc taggatatta 2700
cgaaccatat catggacacc ctccacgata ttggaaataa tatcatcctc tcccccttgg 2760
atattaggaa caatatcaca gggggttgta cacctcctat gatattggaa gtaatatcat 2820
cctctccctc ctggatatta gcaacaatat cacagggagt gtgtacaacc ccagcgatat 2880
ttggagtaat atcaccctct caccccatgg atatgagaaa caatatcaca ggggaggtgt 2940
acatcccacg tgatattgtg tgtaatatca ttcttcccca acccctgcaa tattgtggtg 3000
taatataatt ctctcccttc ctggacatta tgaacaatat cactactagg tgatacatta 3060
ggagtaatgt atccatagga tattatgagg aatatcacag ggtgtacacc cactgtgata 3120
ttagaggtaa tatctcccta aaatattaag aagaatatct tacacccact gtgactttag 3180
aagtaatatc tccctaaaac gttacaaata acatcgcagg gtgtacactc acagtgatat 3240
taggagtaat atctccctag aatattacaa atacacatgg tgtaaaccca ctgtgacttt 3300
agaagaacta tctccctaaa ataatacaaa aatatcgcag tgtataccat aatatcccct 3360
agaatatcat aaataatatc acagggtgta cacccactgt gataatagga ataataccac 3420
cccaggatat tatgaataat gtcacaggct gtacacccac tatgacatta ggagtaatat 3480
ctccctagga cactatgaat aacatcacag attttacacc catggtgtgc acccactatg 3540
atattaggag taatatctgc acaggatata acaaataata gtacagggtg tacacatatg 3600
atatacaccc actgtgatat taggagaaat atatccctag gatattatga ataacctctc 3660
agagtacaca cacatggtat acaccctctg tggcattagg aacaataact ttctaaaaca 3720
ttacgaataa catcacagaa tgtacacaca tggtttacac ccactgtgac aggtgcaata 3780
tctcccttgg atattatgaa taacaacaaa ctatcactgt catattagga gtaatttctc 3840
cctagaatat tacaaataac atcacagggt gttcatttat ggtgcacacc cactgtgata 3900
ttaggagtaa tatctcccta ggatattact tttcatataa aagtgtgtac atccactgtg 3960
atattgggaa aaatatttct ctaggatatt atgaataata tcacagagcg tacacccact 4020
gtgatattag gagtaataat tccctgggtt attatgaata atatcacagg atgtacaacc 4080
actgtgatat taggagcaat atcttcctag gatattacaa ataatatcac agggtgtaca 4140
cccactgtga tattaaagta atttttaggt tattgtgaat aatatcacca agtgtacaaa 4200
catggtgtac actcactgtg atatcaggag taatatctca gtaaaatatt atgaataata 4260
tcacagggta tacacccact gtgatattag cagtagtatc tttgtaggat attacaaata 4320
atatcacagg gtgtatgccc actatgacat tagaagcaat atctccctag gatatcaaaa 4380
ataatatcac agggtgtaca acttctacat cccaggttct aagggattct cctgcttcag 4440
cctcctgagt ggctgggatt acagatgccc accaccacac ctggctaatt tcgtattttc 4500
agtagagatg gggtatcacc atgctggtca ggctggtctg gaacttctga cctcaggtga 4560
tccaccagcc tcggccttcc aaagtgctgg gaatacaggt gtgagccaac gtgcttggca 4620
gagagttata tattaaataa atctggaaac atagctccca tgtttgagtg tgcatttact 4680
tttatgaaga aattatgtca gaaaacctaa ggatgataat aaatatgaaa agtaactggc 4740
atgtaaaaag gtcttttgat taagaactat aaggttcgat ttcattttta gataacgtga 4800
tcctagctct tgtatagtgc ttataaatat tctacatcaa aggaatttgt tgcacagtgt 4860
cagaataaaa taaagtgtat ttcactgctt cttaattttt aaattagact gagtttgttt 4920
tcctagagag agaagaacat tttttatttt ttctgaaaag agtaggccat attttactga 4980
gatcttagat ttgttatata ttaggttttg gtcttctaac attctccagt ggattttctc 5040
taaagtaggt atgcacagaa agagttgaat agcaaaaaag taaatcatgt aataattctg 5100
agatttttgg gtttgtcaca actgagaaat attgctgagg gtgtatggtc ctcaagtgtg 5160
aaaatgttcc ttgtgaattg cttgtatccg aaatatacac acaacattaa gtcctggttt 5220
ttatctttta ttttttccaa tccttttttc ttctcaaggt gtccaagtca cacagagcca 5280
cagaatctca caggtgtctc agaattcctc ctcctgggac tctcagagga tccagaactg 5340
cagccactcc ttgctgggct gttcctatcc atgtgcctgg tcacgatgct ggggaacctg 5400
ctcatcatcc tggccgtcag ccctgactcc cacctccaca tccccatgta cttcttcctc 5460
tccaacctgt ccttgcctga cattggtttc accttggcca cggtccccaa gatgattgta 5520
gacatgcaat cacatagcag agtcatctcc catgcaggct gtctgacaca gatacctttc 5580
tttgtccttt ttgtatgtat agatgacatg ctcctgactg tgatggccta tgactgattt 5640
gtggccatct gtcaccccct gcactaccca gtcatcatga atcctca 5687
<210> 32
<211> 5687
<212> DNA
<213> Homo sapiens
<400> 32
attgaatttt atctcagagc ccacatgaag caggatcaaa gtcagtacac atgaaaacta 60
gagcccaaag actataaagc atgaaataag gatttaagct aaccctatct tgtaaggggt 120
ttgtaaagcc cagcttgcat ctgagctaca ctagcaccag gacagccact cagtaatggg 180
gtttctcaag gttattgctt ttcattcagt tgaaatgaga gtcatttctt acccttatgc 240
cctgtgagat ttcactggag gttgttcact gaaacatttt catatcattg catcaaccct 300
cttgaactca ctgtgcctgc ccccagttca gtctgtgact cacaagtacc ctgcagcaaa 360
agaaatccaa tagagggcaa atccctcacc ttaccttcct ttctaagacc tttgatgttc 420
tcatgtgtca tttcataatt gggattgtca attagtcgcc tcatctctgg tcctcacttt 480
cctctctccc agccaaactc aaccttcagc ccacacaatg gaattcaaca aaatgaggta 540
acagttttct gtgtgagtca ctctgggcaa ctctgttcac agagcactgt gaggtgagca 600
gccagaaccc aggcaagtgt ttcagccatc caagaactgg caggcagccc aagagacact 660
ctcacctgat gacagactag caggatgagt cctggaggaa atggttccca acagctgcag 720
aaggagtctc ttggctcatg cacagcaatg ctcttctcaa ttaaaaacgt tgtcattatt 780
gacactgcag tgtaaaatcc ttttacactg tgctcacatt tctacaggcc ttcacctgct 840
ctgcccatta aagacaagac ccttccatga gatgatgaca tctctaagtt actgttccac 900
ccaaacagtc ctatataatg aagagaaaaa ttttgctggc cctcaaaagg caaacacaag 960
gagaaagatt tccacaagct gtttctcttt gctgagcact tagaggaaaa ctgtaagtgg 1020
ttggaagaag gctttgtttt ctacaagact tttagttatt cctcagaaat tttcctgctt 1080
attcccagag gaggtcatct cttagatgct gtcagtcaga tagggattgg cagccaagca 1140
gaggtgctca gagaggtttc caactaatgt ggccagcgga aaactgccaa agaagcaggg 1200
atccttagga caaataaact ggaagatatt ttggggataa aaataaatcc ttttgaaaat 1260
gaaagatgga gagatgctgt atatacaaat tgccctgttc tgaacaatgt tgtcactagg 1320
actggccctg gagaccaatg atacaaacca aaatgttctc agacatgctt tgatggtctt 1380
tttctccaaa gttatctatt ctgtttccat ttcattctca caggacttgc catggggttc 1440
tcataagatt tcacattggt cataatccag gtggccctgg actgcaacct ctgagttggc 1500
aacatcagaa taggaattac gaaaaaccaa tttaaagtta aatacagaca caggcaaaag 1560
agagatgggt tgtcgaagct agtgcctagg tggacactgc ctcacatttt taattccaga 1620
agccatcagt actgagtgtc agatctcatt agtcaaacac agtgatcagg aatcctgttt 1680
tcctggagga tttccttgag ggagggacca ctcaagagtc tgaaatattt cacgtcatag 1740
agtatggatc tcaccccaac acccaatcag aaaataggga gaactggaaa ccaaaattcc 1800
ccctcccgct gtggaaggat gaaaaccaga gtgttggagt tctgtcctga taatggagca 1860
gacagctagg cagcaatcaa tgagggccag tacaggaatt cagtgctaag tattgggtca 1920
taacagaagt agggaaggta ttaatccagt gctatatgag gatcctggga cactggctcc 1980
tagtaatcta gttataacta ttagcaaaaa agaaaaaaaa aatcagtgat gtgaagagat 2040
ggcctaaagg agctccagca atatagctaa gcagctggca agtggtctga ggagcattgc 2100
aattccaggc ctcctaaggt ggcagtacgg gcactggtaa gacattctgc tgtggtgaaa 2160
ctagtttacc atagaggatt cacaattaaa ataggcaaac aggaaatgca agacagaggc 2220
taacaaaggg tttttttttt ggtggggggg agttgtttgt ttgtttgttt gttttctgag 2280
acggagtctt cctctgttgc ccaggctgga atgcagtggc acgatctcag ctcactacaa 2340
cctctgcctc ccaggttcaa gcagttcttc tgcctcagcc tcccaggttc aagcagttct 2400
tctgcctcag cctcccaagt acctgggact atagctgtgt gccaccacat tgactaattt 2460
ttgtactttt agtacagact gggtttcacc atgttggcca ggctggtgtc gaactcctga 2520
cctcaagtaa tccccccgcc ttggcctccc aaagtgctgg aattacaggc atgagccacc 2580
acacctggcc agtttttggt aattcttaaa gaactcaatg agcaacactc aaacaaccat 2640
aaagactata gagctcatgg ttgaatttta gatagctaaa cagacaggag tttttgtaag 2700
ttttgtaagt cttgctcatc cttccctctt ccatcctcta tctcaactat tctgtctacc 2760
attaaagcac cttagacctt gagtttggca atgcaacaag tgtgtgctca acacgaaata 2820
ggtaattcaa tagcaaagcc ctaaaacagc ctggcttgat tatttctcag ggcatgcagt 2880
tcctttgaag caggatcatt ttaataataa taataataga aataataata gaaattgaag 2940
acaattattt cacaatttcc atacacctaa gagctataca tatgaatgat aatgcataat 3000
tgtaaagcat gcatattaca ggtaataaat atgttagcta attataaaca atgcccattt 3060
tcatatagtt tatccttgcc aaataaaact gtaaaaaaaa gacacctttc aaatgctgct 3120
aaggagtaat acctgaatga ggttgattta atggagtctt agttcctgca tgtgttctaa 3180
ttgaatagac tatgtagtaa ttcccttaca tacccatcca tgtccaagaa cagtgaagat 3240
ctttatttaa tatgaattat tgcagatgat tagcacagtc tagccaaacc attccagtaa 3300
ttgtttttac ttgttatatt aatatataaa ttctcaaagg atataacagt gatgttgggt 3360
gaatttcact gaatgatagc tcaaacacct gaaatattga ctaagaaaac taatttatca 3420
atactgataa tcaattttaa tatgttaatt gattgtaata caggattctg tggttcaaaa 3480
aaaaagaaca agcaaaaaaa ctttcttcca tttccaaata ccaattaata gatctctact 3540
tccccttgga tttcttctta ccacctacca cctccaatct tcattctttc ctcacaaact 3600
aaacataaaa gttacctaca aagcatagaa tctgtgttaa aggatattct tgcttgtttt 3660
aagtccaaaa ttaaacagct ctgaattatt aaaaagcaca tgaattcaaa tgtcctattc 3720
taataagaaa atggtttaca tttctctatg ttcaaggaaa aaaatagtca agggtgtaca 3780
agtggggtaa aaattatttc cagtaggtta tgtgatttaa gttatagaaa cgaaccaggc 3840
aattcaatta aatgtcatgg aaagtaggtt ttttcttttc ctcttttttt ctaatatgta 3900
cactttgtga gaagataaat ccatagtgtg ataatttgtc cactgggtcc atcagacact 3960
ggagacagct tcctaagaat tataaggctt ctaaaggctt ctaaagccta aattgcctag 4020
agcattttgt gtgccaggca ctttgctagg tgccctaggg atgcaagaag tataaatgtt 4080
ttatgagaat acaggctgga aatgtattct tgattattcc tgtggaattt ctaggcagaa 4140
aagagtctaa tggggtatag gtatattttc tcaacacaat tttctgagcc tttaccagat 4200
gcagttctat ggtttgaatg tgtccctcag agtttgtgtg ttggaaactt aatccccaat 4260
gcaataatgt tggtgaggcc taatgaaagc ctaataatgt aggtgaggcc taatgagagc 4320
tgtttagacc atgaaggctc ttccctcatg gatggattaa tgctgttatg gtgggaatgg 4380
gttcattatt actggggtgg gttcataata aaaagatgag tttggcctgc tattctctct 4440
ctttctcatc ctctcttcca ccatgggatg acacagcaag aaggcccctg caagatgccc 4500
tcccctcagt attggacttc acagcctcca ggaccataag ccaataaatt tttgttcatt 4560
ataaatttcc cagtctgtgg tattctgtta tagcaacact caatttatgc attacttcca 4620
gattcttatg gctataccta cttctcacag tttgtattca cccctccttc aaccaagtac 4680
ccttaacaca gttcccatag tcacaaagcc aggtcactga agctgccctc tctccaacca 4740
cacacatata gatcaaatga ccccagacat agagctgatt gagaaggagg gaccagtacg 4800
agctctgctt ccccagcagc ttcctggaaa gaagaggcaa tacaacccaa cccaaaagtg 4860
caagagaagt aacacctcat gggatgagct taattaatca atgggagagg acactagaag 4920
acactagagg atctcccttc ctccctttct ttcccacttc accccctcca gtctctgaac 4980
catgagctat ttcaaaggtg cagtaatgct atatttggct tctctgaaga tatcctatga 5040
ggccaagtca tcagctttgt tcattatcta agagtggtgg ccagctcacc agcacttccc 5100
atcatgtttg ccctccctct ttcccttgtg ttacttccca ttttccctta cttctgcttt 5160
cttggcatta aattctactc tgcaatgtta ggatataagt ttttgcctca gattctgttt 5220
tctaggaaac ccatgctaag acaacactgg cagtggccct ggaaaagtaa acctcatgat 5280
ggatttggag ttggattgtt cactgatctg aaggacagag gactccactt aagtggtaag 5340
cagtgtagct atgaactctg ccacgcaggc ctcacaatta ctgaggcttc ttttacctgt 5400
ggttaactgg gacacagaac agcaggaaat tgagtgtaga ggttatcaag tagctgcttc 5460
acttaattgg tataatttta tggagttaac ctggtttaga gtccagagaa cattccacat 5520
agcctagaaa gggtagttat ttgtccttac cataatcaag tcatactttg aatatgagtt 5580
ttccttccct gttcagcacc acttctctta gacttaagaa tgcctgatct gttgatatta 5640
tgtcccatgt aacattgcct gagacaaaga tatccatgta ccttaaa 5687
<210> 33
<211> 140
<212> PRT
<213> Homo sapiens
<400> 33
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro
65 70 75 80
Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr
85 90 95
Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
100 105 110
Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg
115 120 125
Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala
130 135 140
<210> 34
<211> 128
<212> PRT
<213> Homo sapiens
<400> 34
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Arg Ile Ile Ala Gln
65 70 75 80
Lys Arg Ala Cys Asp Thr Ala Thr Cys Val Thr His Arg Leu Ala Gly
85 90 95
Leu Leu Ser Arg Ser Gly Gly Val Val Lys Asn Asn Phe Val Pro Thr
100 105 110
Asn Val Gly Ser Lys Ala Phe Gly Arg Arg Arg Arg Asp Leu Gln Ala
115 120 125
<210> 35
<211> 141
<212> PRT
<213> Homo sapiens
<400> 35
Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val
1 5 10 15
Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu
20 25 30
Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg
35 40 45
Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser
50 55 60
Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro
65 70 75 80
Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr
85 90 95
Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
100 105 110
Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg
115 120 125
Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala Asn
130 135 140
<210> 36
<211> 116
<212> PRT
<213> Homo sapiens
<400> 36
Ala Pro Phe Arg Ser Ala Leu Glu Ser Ser Pro Ala Asp Pro Ala Thr
1 5 10 15
Leu Ser Glu Asp Glu Ala Arg Leu Leu Leu Ala Ala Leu Val Gln Asp
20 25 30
Tyr Val Gln Met Lys Ala Ser Glu Leu Glu Gln Glu Gln Glu Arg Glu
35 40 45
Gly Ser Ser Leu Asp Ser Pro Arg Ser Lys Arg Cys Gly Asn Leu Ser
50 55 60
Thr Cys Met Leu Gly Thr Tyr Thr Gln Asp Phe Asn Lys Phe His Thr
65 70 75 80
Phe Pro Gln Thr Ala Ile Gly Val Gly Ala Pro Gly Lys Lys Arg Asp
85 90 95
Met Ser Ser Asp Leu Glu Arg Asp His Arg Pro His Val Ser Met Pro
100 105 110
Gln Asn Ala Asn
115
<210> 37
<211> 187
<212> PRT
<213> Homo sapiens
<400> 37
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185
<210> 38
<211> 168
<212> PRT
<213> Homo sapiens
<400> 38
Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr
1 5 10 15
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
20 25 30
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
35 40 45
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
50 55 60
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
65 70 75 80
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
85 90 95
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
100 105 110
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
115 120 125
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
130 135 140
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
145 150 155 160
Phe Phe Gly Ala Phe Leu Val Gly
165
<---

Claims (27)

1. Способ определения бактериальной инфекции на основании биологических данных, содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, при этом способ включает:
использование аппаратного обрабатывающего устройства для выполнения компьютерных программных инструкций, хранимых на машиночитаемом носителе, при этом указанные компьютерные программные инструкции включают:
компьютерные программные инструкции для вычисления расстояния d между сегментом SROI кривой S и осью π, образованной направлением, при этом указанное расстояние d, вычисляемое, перпендикулярно указанной оси π, между точкой Р на указанной оси π и соответствующей точкой на указанной кривой, при этом указанные точки образованы координатой δ1 вдоль указанного направления; и
компьютерные программные инструкции для коррелирования указанного расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, при этом если указанное расстояние d выше предварительно определенного уровня ωB, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию;
при этом указанная координата δ1 образована комбинацией указанных значений экспрессии, причем указанная комбинация включает линейную комбинацию указанных значений экспрессии, при этом по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей прямой f(δ1)-ε0 и верхней ограничивающей прямой f(δ1)+ε1, при этом указанный f(δ1) равняется 1/(1+exp(δ1)), и при этом каждый из указанных ε0 и ε1 составляет менее 0,5.
2. Способ по п. 1, в котором указанные значения экспрессии измеряют с помощью измерительной системы, выполняющей по меньшей мере один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.
3. Способ по п. 1, дополнительно включающий получение указанной вероятности на основе указанного расстояния d, сравнение указанной вероятности с предварительно определенным пороговым значением и лечение указанной бактериальной инфекции у субъекта, если указанная вероятность превышает указанное предварительно определенное пороговое значение.
4. Способ определения бактериальной инфекции на основании биологических данных содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, при этом способ включает:
использование аппаратного обрабатывающего устройства для выполнения компьютерных программных инструкций, хранимых на машиночитаемом носителе, при этом указанные компьютерные программные инструкции включают:
компьютерные программные инструкции для вычисления первого расстояния d между сегментом SROI кривой поверхности S и плоскостью π, образованной первым направлением и вторым направлением, при этом указанное первое расстояние d вычисляют, перпендикулярно указанной плоскости π, между точкой Р на указанной плоскости π и соответствующей точкой на указанной поверхности S, причем указанная точка образованна первой координатой δ0 вдоль указанного первого направления и второй координатой δ1 вдоль указанного второго направления; и
компьютерные программные инструкции для коррелирования указанного первого расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, причем когда указанное первое расстояние d выше предварительно определенного уровня ωB, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию;
при этом каждая из указанной первой координаты δ0 и указанной второй координаты δ1 образована различной комбинацией указанных значений экспрессии причем каждая комбинация включает линейную комбинацию указанных значений экспрессии, при этом по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей поверхностью f(δ01)-ε0 и верхней ограничивающей поверхностью f(δ01)+ε1, при этом указанная f(δ01) равняется exp(δ1)/(1+exp(δ0)+exp(δ1)), и при этом каждый из указанных ε0 и ε1 составляет менее 0,5.
5. Способ по п. 4, в котором указанные значения экспрессии измеряют с помощью измерительной системы, выполняющей по меньшей мере один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.
6. Способ по п. 4, дополнительно включающий получение указанной вероятности на основе указанного первого расстояния d, сравнение указанной вероятности с предварительно определенным пороговым значением и лечение указанной бактериальной инфекции у субъекта, если указанная вероятность превышает указанное предварительно определенное пороговое значение.
7. Способ по п. 4, дополнительно включающий вычисление второго расстояния между сегментом второй кривой поверхности и указанной плоскости, причем указанное второе расстояние перпендикулярно указанной плоскости π, между указанной точкой Р на указанной плоскости π и в соответствующей точке на указанной второй кривой поверхности; и
определение корреляции указанного второго расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию, причем когда указанное второе расстояние выше предварительно определенного уровня ωv, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет вирусную инфекцию;
при этом по меньшей мере 90% указанного сегмента указанной второй поверхности заключено между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом указанная g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε2 и ε3 составляет менее 0,5.
8. Способ по п. 7, дополнительно включающий получение указанной вероятности на основе указанного второго расстояния, сравнение указанной вероятности со вторым предварительно определенным пороговым значением и лечение у субъекта указанной вирусной инфекции, если указанная вероятность превышает указанное второе предварительно определенное пороговое значение.
9. Способ по п. 7, дополнительно включающий получение указанной вероятности того, что субъект имеет бактериальную инфекцию, на основе указанного первого расстояния d, получение указанной вероятности того, что субъект имеет вирусную инфекцию, на основе указанного второго расстояния, сравнение каждой из указанных вероятностей с соответствующим предварительно определенным пороговым значением и, если каждая из указанных вероятностей находится ниже указанного соответствующего предварительно определенного порогового значения, определение того, что пациент, вероятно, имеет неинфекционное заболевание.
10. Способ по любому из пп. 1-9, в котором каждое из указанных множеств полипептидов выбрано из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.
11. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере три полипептида.
12. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере три полипептида, выбранных из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA
13. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере CRP и TRAIL.
14. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере CRP, TRAIL и IP-10
15. Способ по любому из пп. 1-9, дополнительно включающий генерирование выходных данных по указанной вероятности, при этом указанные выходные данные представлены графически.
16. Способ по любому из пп. 1-9, дополнительно включающий определение указанных значений экспрессии, и при этом по меньшей мере одно из указанных значений экспрессии определяется с помощью электрофореза или иммунохимического анализа.
17. Машиночитаемый носитель данных, на котором хранятся программные инструкции, которые при чтении аппаратным обрабатывающим устройством заставляют аппаратное обрабатывающее устройство получать значения экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, и выполнять способ по любому из пп. 1, 2, 4, 5, 7 и 9.
RU2017107750A 2014-08-14 2015-08-12 Вычислительный анализ биологических данных с применением многообразия и гиперплоскости RU2730836C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462037180P 2014-08-14 2014-08-14
US62/037,180 2014-08-14
US201562105938P 2015-01-21 2015-01-21
US62/105,938 2015-01-21
PCT/IL2015/050823 WO2016024278A1 (en) 2014-08-14 2015-08-12 Computational analysis of biological data using manifold and a hyperplane

Publications (3)

Publication Number Publication Date
RU2017107750A RU2017107750A (ru) 2018-09-17
RU2017107750A3 RU2017107750A3 (ru) 2019-01-22
RU2730836C2 true RU2730836C2 (ru) 2020-08-26

Family

ID=55303939

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017107750A RU2730836C2 (ru) 2014-08-14 2015-08-12 Вычислительный анализ биологических данных с применением многообразия и гиперплоскости

Country Status (12)

Country Link
US (4) US10303846B2 (ru)
EP (2) EP3180621B1 (ru)
JP (2) JP6661607B2 (ru)
KR (1) KR20170041907A (ru)
CN (2) CN107076746B (ru)
AU (2) AU2015302870B2 (ru)
BR (1) BR112017002884A2 (ru)
CA (2) CA2954601C (ru)
IL (1) IL250585B (ru)
RU (1) RU2730836C2 (ru)
WO (1) WO2016024278A1 (ru)
ZA (1) ZA201700939B (ru)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106442984B (zh) 2010-04-21 2020-03-13 米密德诊断学有限公司 区分细菌与病毒感染的标记物和决定因素以及其使用方法
CA2863819C (en) 2012-02-09 2021-11-23 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
EP3180621B1 (en) 2014-08-14 2020-04-01 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
WO2016059636A1 (en) 2014-10-14 2016-04-21 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections in non-human subjects and methods of use thereof
US11868851B2 (en) * 2015-03-11 2024-01-09 Symphonyai Sensa Llc Systems and methods for predicting outcomes using a prediction learning model
US20190050793A1 (en) * 2016-02-12 2019-02-14 Carrier Corporation Shelf life estimation system
CN108699583B (zh) 2016-03-03 2022-11-01 米密德诊断学有限公司 用于区分细菌和病毒感染的rna决定子
US20200124593A1 (en) * 2016-06-23 2020-04-23 Memed Diagnostics Ltd. Measuring trail by lateral flow immunoassay
CA3027341A1 (en) 2016-07-10 2018-01-18 Memed Diagnostics Ltd. Protein signatures for distinguishing between bacterial and viral infections
US11340223B2 (en) 2016-07-10 2022-05-24 Memed Diagnostics Ltd. Early diagnosis of infections
CN109844532B (zh) * 2016-08-10 2022-06-17 米密德诊断学有限公司 分析生物数据的系统和方法
KR101739703B1 (ko) * 2016-09-13 2017-05-24 (주) 어드밴스드 엔티 Trail 기반 뇌염 감별진단 방법 및 장치
US11353456B2 (en) 2016-09-29 2022-06-07 Memed Diagnostics Ltd. Methods of risk assessment and disease classification for appendicitis
US11385241B2 (en) 2016-09-29 2022-07-12 Memed Diagnostics Ltd. Methods of prognosis and treatment
EP3568864A1 (en) 2017-01-11 2019-11-20 Koninklijke Philips N.V. Method and system for automated inclusion or exclusion criteria detection
WO2018152527A1 (en) * 2017-02-17 2018-08-23 Accuweather, Inc. System and method for forecasting economic trends using statistical analysis of weather data
US20200035214A1 (en) * 2017-03-16 2020-01-30 Mitsubishi Electric Corporation Signal processing device
US10209260B2 (en) 2017-07-05 2019-02-19 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
US10474681B1 (en) * 2017-09-26 2019-11-12 Microsoft Technology Licensing, Llc Filtering mapped datasets
US11504071B2 (en) * 2018-04-10 2022-11-22 Hill-Rom Services, Inc. Patient risk assessment based on data from multiple sources in a healthcare facility
US11908581B2 (en) 2018-04-10 2024-02-20 Hill-Rom Services, Inc. Patient risk assessment based on data from multiple sources in a healthcare facility
WO2020036571A1 (en) 2018-08-16 2020-02-20 RICHARDSON, Paul, Stephen Systems and methods for automatic bias monitoring of cohort models and un-deployment of biased models
TW202018727A (zh) 2018-11-09 2020-05-16 財團法人工業技術研究院 整體式學習預測方法與系統
FR3088652A1 (fr) * 2018-11-21 2020-05-22 Nanotracks Diagnostics Détection in vitro de la présence d’au moins un agent pathogène microbien dans un échantillon biologique
WO2020169511A1 (en) * 2019-02-18 2020-08-27 The University Of Liverpool Method of diagnosis
CA3132655A1 (en) * 2019-03-12 2020-09-17 Novartis Ag Digital solutions for differentiating asthma from copd
US11104946B2 (en) * 2019-04-23 2021-08-31 Inflammatix, Inc. DNA sequences related to diagnosis and treatment of systemic inflammatory response syndrome
CN111816297A (zh) * 2020-03-31 2020-10-23 复旦大学附属中山医院 一种基于云端的nCoV病毒诊疗系统和方法
EP4152000A4 (en) * 2020-06-30 2024-07-03 Horiba Ltd BODY FLUID ANALYSIS DEVICE, BODY FLUID SAMPLE DETERMINATION METHOD AND COMPUTER PROGRAM
CN111657961B (zh) * 2020-07-03 2021-04-27 北京印刷学院 一种在皮肤上制备超表面用于血糖检测的方法
JP2023145811A (ja) * 2020-08-17 2023-10-12 孝章 赤池 学習モデルの生成方法、プログラム、演算装置
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
US11430575B2 (en) * 2020-11-13 2022-08-30 Specialty Diagnostic (SDI) Laboratories, Inc. Systems and methods for a data driven disease test result prediction
CN112632151B (zh) * 2020-12-25 2023-02-10 南京邮电大学 一种基于二分过滤的移动对象传染行为挖掘方法
US11361847B1 (en) 2021-02-06 2022-06-14 Timothy A. Hodge System and method for rapidly reporting testing results

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2348695C2 (ru) * 2006-05-23 2009-03-10 Закрытое акционерное общество "Молекулярно-медицинские технологии" Дифференцирующий и специфический олигонуклеотиды для идентификации последовательностей днк инфекционных агентов в биологических материалах, способ видовой идентификации инфекционных агентов, биочип и набор для осуществления этого способа
US20110312534A1 (en) * 2010-03-05 2011-12-22 Erasmus University Medical Center Rotterdam Method for prediction of human iris color
WO2013117746A1 (en) * 2012-02-09 2013-08-15 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
WO2014117873A1 (en) * 2013-01-29 2014-08-07 Molecular Health Ag Systems and methods for clinical decision support

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154600B (nl) 1971-02-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen.
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
NL154599B (nl) 1970-12-28 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen, alsmede testverpakking.
US3901654A (en) 1971-06-21 1975-08-26 Biological Developments Receptor assays of biologically active compounds employing biologically specific receptors
US3853987A (en) 1971-09-01 1974-12-10 W Dreyer Immunological reagent and radioimmuno assay
US3867517A (en) 1971-12-21 1975-02-18 Abbott Lab Direct radioimmunoassay for antigens and their antibodies
NL171930C (nl) 1972-05-11 1983-06-01 Akzo Nv Werkwijze voor het aantonen en bepalen van haptenen, alsmede testverpakkingen.
US3850578A (en) 1973-03-12 1974-11-26 H Mcconnell Process for assaying for biologically active molecules
US3935074A (en) 1973-12-17 1976-01-27 Syva Company Antibody steric hindrance immunoassay with two antibodies
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4034074A (en) 1974-09-19 1977-07-05 The Board Of Trustees Of Leland Stanford Junior University Universal reagent 2-site immunoradiometric assay using labelled anti (IgG)
US3984533A (en) 1975-11-13 1976-10-05 General Electric Company Electrophoretic method of detecting antigen-antibody reaction
US4098876A (en) 1976-10-26 1978-07-04 Corning Glass Works Reverse sandwich immunoassay
CA1178414A (en) 1978-02-08 1984-11-27 Toyo Boseki Kabushiki Kaisha (Trading Under The Name Of Toyobo Co., Ltd.) Packaging material having excellent seal packaging property
US4275149A (en) 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4233402A (en) 1978-04-05 1980-11-11 Syva Company Reagents and method employing channeling
US4376110A (en) 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US4879219A (en) 1980-09-19 1989-11-07 General Hospital Corporation Immunoassay utilizing monoclonal high affinity IgM antibodies
US4659678A (en) 1982-09-29 1987-04-21 Serono Diagnostics Limited Immunoassay of antigens
US4727022A (en) 1984-03-14 1988-02-23 Syntex (U.S.A.) Inc. Methods for modulating ligand-receptor interactions and their application
US5011771A (en) 1984-04-12 1991-04-30 The General Hospital Corporation Multiepitopic immunometric assay
US4666828A (en) 1984-08-15 1987-05-19 The General Hospital Corporation Test for Huntington's disease
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4801531A (en) 1985-04-17 1989-01-31 Biotechnology Research Partners, Ltd. Apo AI/CIII genomic polymorphisms predictive of atherosclerosis
US5018067A (en) 1987-01-12 1991-05-21 Iameter Incorporated Apparatus and method for improved estimation of health resource consumption through use of diagnostic and/or procedure grouping and severity of illness indicators
US5272057A (en) 1988-10-14 1993-12-21 Georgetown University Method of detecting a predisposition to cancer by the use of restriction fragment length polymorphism of the gene for human poly (ADP-ribose) polymerase
US5192659A (en) 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
DE4322330A1 (de) 1992-08-31 1994-03-03 Behringwerke Ag Verwendung des IL-4-Rezeptors zur Therapie, Prophylaxe und Diagnose von allergischen, viralen, parasitären und bakteriellen Erkrankungen sowie von Pilzinfektionen
US5281521A (en) 1992-07-20 1994-01-25 The Trustees Of The University Of Pennsylvania Modified avidin-biotin technique
DE4227454C1 (de) 1992-08-19 1994-02-03 Henning Berlin Gmbh Verfahren zur Früherkennung, zur Erkennung des Schweregrads sowie zur therapiebegleitenden Verlaufsbeurteilung einer Sepsis sowie Mittel zur Durchführung des Verfahrens
US6283761B1 (en) 1992-09-08 2001-09-04 Raymond Anthony Joao Apparatus and method for processing and/or for providing healthcare information and/or healthcare-related information
SE9401351D0 (sv) 1994-04-21 1994-04-21 Venge A method for diagnosis
US5910421A (en) 1995-12-21 1999-06-08 University Of Florida Rapid diagnostic method for distinguishing allergies and infections
US6077665A (en) 1996-05-07 2000-06-20 The Board Of Trustees Of The Leland Stanford Junior University Rapid assay for infection in neonates
EP1042459A4 (en) 1997-12-24 2003-07-23 Diatech Pty Ltd BIFUNCTIONAL MOLECULES
CA2329868A1 (en) 1998-05-18 1999-11-25 Apoptosis Technology, Inc. Compounds, screening methods, and uses involving anti-apoptotic genes and gene products
DE19847690A1 (de) 1998-10-15 2000-04-20 Brahms Diagnostica Gmbh Verfahren und Substanzen für die Diagnose und Therapie von Sepsis und sepsisähnlichen systemischen Infektionen
US6709855B1 (en) 1998-12-18 2004-03-23 Scios, Inc. Methods for detection and use of differentially expressed genes in disease states
WO2000040749A2 (en) 1999-01-06 2000-07-13 Genenews Inc. Method for the detection of gene transcripts in blood and uses thereof
CA2384978C (en) 1999-08-24 2012-10-23 Glycozym Aps Udp-n-acetylglucosamine: galactose-.beta.1,3-n-acetylgalactosamine-.alpha.-r/(glcnac to galnac) .beta.1,6-n-acetylglucosaminyltransferase, c2gnt3
IL132687A0 (en) * 1999-11-01 2001-03-19 Keren Mechkarim Ichilov Pnimit System and method for evaluating body fluid samples
US20020038227A1 (en) 2000-02-25 2002-03-28 Fey Christopher T. Method for centralized health data management
US7668661B2 (en) * 2000-04-28 2010-02-23 Siemens Healthcare Diagnostics Inc. Liver disease-related methods and systems
RU2229719C2 (ru) 2001-03-27 2004-05-27 Кабусики Кайся Тосиба Обнаружение имеющей отношение к заболеванию нуклеиновой кислоты
US7713705B2 (en) * 2002-12-24 2010-05-11 Biosite, Inc. Markers for differential diagnosis and methods of use thereof
DE10119804A1 (de) 2001-04-23 2002-10-24 Brahms Ag Entzündungsspezifische Peptide und deren Verwendungen
JP3665316B2 (ja) * 2001-05-18 2005-06-29 麒麟麦酒株式会社 抗trail−r抗体
FI115165B (fi) 2001-06-04 2005-03-15 Aboatech Ab Oy Menetelmä infektion laadun määrittämiseksi
DE10130985B4 (de) 2001-06-27 2004-03-18 B.R.A.H.M.S Ag Verfahren zur Diagnose von Sepsis und schweren Infektionen unter Bestimmung löslicher Cytokeratin-1-Fragmente
US20040209307A1 (en) 2001-08-20 2004-10-21 Biosite Incorporated Diagnostic markers of stroke and cerebral injury and methods of use thereof
EP1318407B1 (de) 2001-12-07 2004-09-29 B.R.A.H.M.S Aktiengesellschaft Verwendungen der Aldose-1-Epimerase (Mutarotase) für die Diagnose von Entzündungserkrankungen und Sepsis
EP1317902B1 (en) 2001-12-10 2005-11-09 Kabushiki Gaisha K-and-S Biological data observation apparatus
US20040038201A1 (en) 2002-01-22 2004-02-26 Whitehead Institute For Biomedical Research Diagnostic and therapeutic applications for biomarkers of infection
US7468032B2 (en) 2002-12-18 2008-12-23 Cardiac Pacemakers, Inc. Advanced patient management for identifying, displaying and assisting with correlating health-related data
US20040122296A1 (en) 2002-12-18 2004-06-24 John Hatlestad Advanced patient management for triaging health-related data
US20050227223A1 (en) 2002-03-22 2005-10-13 Toshio Miyawaki Method of judging viral infection
US7485298B2 (en) 2002-05-23 2009-02-03 Michael Powell Diagnosis and treatment of human dormancy-related sequellae
KR20050040866A (ko) 2002-06-11 2005-05-03 아이다호 리서치 파운데이션 바이러스 감염의 검출을 위한 ⅰ형 인터페론-유도성 단백질
US8563476B2 (en) 2002-11-15 2013-10-22 Morehouse School Of Medicine Anti-CXCL9, anti-CXCL10, anti-CXCL11, anti-CXCL13, anti-CXCR3 and anti-CXCR5 agents for inflammatory disorders
WO2004108899A2 (en) 2003-06-04 2004-12-16 The Government Of The United States As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Pni microarray and uses
JP2007518062A (ja) 2003-09-29 2007-07-05 バイオサイト インコーポレイテッド 敗血症を診断する方法および診断するための組成物
JP2005106694A (ja) * 2003-09-30 2005-04-21 Mochida Pharmaceut Co Ltd 敗血症早期検出及び重篤度評価
GB0401730D0 (en) 2004-01-27 2004-03-03 Bioxell Spa Diagnosis method
US8906630B2 (en) 2004-02-27 2014-12-09 The Trustees Of The University Of Pennsylvania Assays for detecting pathogenic respiratory bacteria
US7892539B2 (en) 2004-03-24 2011-02-22 The Regents Of The University Of California Modulation of an innate immune response by altering TRIAL-R signaling
US8155993B2 (en) * 2004-06-15 2012-04-10 Janssen Pharmaceutica, N.V. Apparatus and methods for assessing a pharmaceutical product
AU2005327199A1 (en) * 2004-07-09 2006-08-17 Amaox, Inc. Immune cell biosensors and methods of using same
US7572640B2 (en) 2004-09-28 2009-08-11 Singulex, Inc. Method for highly sensitive detection of single protein molecules labeled with fluorescent moieties
AU2005290314A1 (en) * 2004-09-28 2006-04-06 Singulex, Inc. System and method for spectroscopic analysis of single particles
EP1807540A4 (en) 2004-11-05 2008-12-10 Us Gov Sec Navy DIAGNOSIS AND PROGNOSIS OF CLINICAL PHENOTYPES OF INFECTIOUS DISEASES AND OTHER BIOLOGICAL CONDITIONS USING HOST GENE EXPRESSION MARKERS IN BLOOD
US20060099628A1 (en) 2004-11-10 2006-05-11 Wei-Mei Ching Diagnostic assay for rickettsia prowazekii disease by detection of responsive gene expression
CN101208602A (zh) 2005-04-15 2008-06-25 贝克顿迪金森公司 脓毒症的诊断
KR20080006617A (ko) 2005-04-15 2008-01-16 백톤 디킨슨 앤드 컴퍼니 패혈증의 진단
US20070015172A1 (en) 2005-06-01 2007-01-18 Z-Biomed, Inc. Expression profiles for microbial infection
UA78641C2 (en) 2005-08-29 2007-04-10 Open Joint Stock Company Conce A process for the preparation of carbamide-formaldehyde resin
DE102005050933A1 (de) 2005-10-21 2007-04-26 Justus-Liebig-Universität Giessen Erfindung betreffend Expressionsprofile zur Vorhersage von septischen Zuständen
CN101378764A (zh) 2005-12-09 2009-03-04 贝勒研究院 通过血液白细胞微阵列分析对系统性红斑狼疮的诊断、预后和疾病发展的监测
GB0601959D0 (en) 2006-01-31 2006-03-15 King S College London Sepsis test
US20070184460A1 (en) 2006-02-09 2007-08-09 Wei-Mei Ching Diagnostic assay for Orientia tsutsugamushi by detection of responsive gene expression
EP2016195A4 (en) 2006-04-26 2010-03-10 Vertex Pharma BIOMARKERS FOR HEPATITIS C VIRUS INFECTION
AU2007286915B2 (en) 2006-08-11 2014-05-15 Baylor Research Institute Gene expression signatures in blood leukocytes permit differential diagnosis of acute infections
ATE504000T1 (de) 2006-09-05 2011-04-15 Hvidovre Hospital Auf ip-10 basierende immunologische überwachung
AU2012244350B2 (en) 2006-09-05 2013-08-15 Statens Serum Institut Ip-10 based immunological monitoring
JP2010506166A (ja) 2006-10-05 2010-02-25 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ デング熱の診断及び治療
BRPI0720035A2 (pt) 2006-12-06 2019-05-07 Medimmune, Llc métodos para tratar um paciente tendo uma doença ou distúrbio, para tratar um paciente com doença autoimune, para neutralizar um perfil de expressão do marcador pd indutível por ifn do tipo 1 ou ifnalfa em um paciente, para monitorar ou prognosticar progressão de doença autoimune de um paciente, para monitorar a progressão da doença de um paciente que recebe o tratamento com um agente terapêutico que liga-se a e modula a atividade de ifnalfa, para identificar um paciente como um candidato para um agente terapêutico que liga-se a e modula a atividade de ifnalfa, para diagnosticar um paciente como tendo um distùrbio associado com níveis aumentados de ifnalfa, para identificar um terapêutico candidato para o tratamento de distùrbios mediados por ifnalfa e para detectar atividade de ifn em uma amostra, conjunto de sondas, e, kit
DE102006060112A1 (de) 2006-12-20 2008-06-26 Brahms Aktiengesellschaft Diagnose und Risikostratifizierung mittels dem neuen Marker CT-proADM
WO2008076077A1 (en) 2006-12-21 2008-06-26 Innogene Kalbiotech Pte Ltd Method of early diagnosis of epstein-barr virus-related cancer and respective reagents and kits
US20100221700A1 (en) 2007-01-11 2010-09-02 Haynes Barton F Method of monitoring hiv infection
WO2008095136A2 (en) 2007-01-31 2008-08-07 Henkin Robert I Methods for detection of biological substances
US20090155180A1 (en) 2007-02-28 2009-06-18 Mary Lynn Jump Methods and targets for identifying compounds for regulating rhinovirus infection
DE102007009751A1 (de) 2007-02-28 2008-09-04 B.R.A.H.M.S Aktiengesellschaft Verfahren zur selektiven Bestimmung von Procalcitonin 1-116 für diagnostische Zwecke sowie Antikörper und Kits zur Durchführung eines solchen Verfahrens
US8465951B2 (en) 2007-06-01 2013-06-18 Council Of Scientific & Industrial Research Method for simultaneous detection and discrimination of bacterial, fungal, parasitic and viral infections of eye and central nervous system
RU2352948C1 (ru) 2007-06-15 2009-04-20 Государственное образовательное учреждение высшего профессионального образования "КРАСНОЯРСКАЯ ГОСУДАРСТВЕННАЯ МЕДИЦИНСКАЯ АКАДЕМИЯ ФЕДЕРАЛЬНОГО АГЕНТСТВА ПО ЗДРАВООХРАНЕНИЮ И СОЦИАЛЬНОМУ РАЗВИТИЮ" Способ прогноза исхода заболевания пациентов с ургентной хирургической патологией органов брюшной полости
IL184478A (en) 2007-07-08 2017-07-31 Hadasit Medical Res Services & Development Ltd Preparations, methods and kits for identifying carriers of mutations in genes 1brca and 2brca and for the early detection of cancers associated with mutations in these genes
DE102007035640A1 (de) 2007-07-27 2009-01-29 Lkh-Kunststoffwerk Gmbh & Co. Kg Tauchkolben
EP2020603A1 (en) 2007-08-03 2009-02-04 BRAHMS Aktiengesellschaft Method for risk stratification in stable coronary artery disease
ATE533061T1 (de) 2007-08-03 2011-11-15 Brahms Gmbh Verfahren zur diagnose bakterieller infektionen
TW200920358A (en) 2007-08-13 2009-05-16 Lundbeck & Co As H Method of treating stress-mediated depression
WO2009025743A2 (en) 2007-08-17 2009-02-26 University Of Massachusetts Medical School Use of trail compositions as antiviral agents
EP2039980B1 (de) 2007-09-24 2010-04-07 BMDSys Production GmbH Kryostat mit stabilisiertem Aussengefäss
EP2071334A1 (en) 2007-12-14 2009-06-17 Transmedi SA Compositions and methods of detecting TIABS
WO2009100907A1 (en) 2008-02-14 2009-08-20 Dianeering Diagnostics Engineering And Research Gmbh Means and methods for assessing the risk of patients presenting to emergency departments based on very low concentrations of troponin i or t or using a combination of markers
WO2009120800A2 (en) * 2008-03-25 2009-10-01 University Of Southern California Prognostic panel for urinary bladder cancer
CN102016072A (zh) 2008-04-21 2011-04-13 诺瓦提斯研究基金会弗里德里克·米谢尔生物医学研究所 抗病毒疗法
US9910036B2 (en) 2008-05-20 2018-03-06 Rapid Pathogen Screening, Inc. Method and device for combined detection of viral and bacterial infections
CA2721742A1 (en) 2008-05-23 2009-11-26 Pronota N.V. New biomarkers for diagnosis, prediction and/or prognosis of sepsis and uses thereof
SG182951A1 (en) 2008-06-25 2012-08-30 Baylor Res Inst Blood transcriptional signature of mycobacterium tuberculosis infection
US20110263821A1 (en) 2008-10-24 2011-10-27 B.R.A.H.M.S. Gmbh Prognosis and risk assessment in stroke patients by determining the level of marker peptides
TW201021778A (en) 2008-11-12 2010-06-16 Alcon Res Ltd Intraocular lens delivery device with a multi-part plunger tip
GB2463401B (en) 2008-11-12 2014-01-29 Caris Life Sciences Luxembourg Holdings S A R L Characterizing prostate disorders by analysis of microvesicles
UA92843C2 (ru) 2009-05-21 2010-12-10 Институт Технической Теплофизики Национальной Академии Наук Украины Способ получения порошкообразного пищевого красителя из столовой свеклы
WO2010138618A1 (en) 2009-05-26 2010-12-02 Duke University Molecular predictors of fungal infection
JP5731489B2 (ja) 2009-06-05 2015-06-10 ベー.エル.アー.ハー.エム.エス ゲゼルシャフト ミット ベシュレンクテル ハフツング 呼吸困難を起こした患者における細菌感染の検出
US8735080B2 (en) 2009-08-07 2014-05-27 Rules-Based Medicine, Inc. Methods and devices for detecting obstructive uropathy and associated disorders
JP5667353B2 (ja) * 2009-09-25 2015-02-12 シスメックス株式会社 血球計数装置、診断支援装置、診断支援方法及びコンピュータプログラム
ES2601104T3 (es) 2009-10-13 2017-02-14 B.R.A.H.M.S Gmbh Procalcitonina para el diagnóstico de infecciones bacterianas y la guía del tratamiento antibiótico en pacientes con apoplejía aguda o accidente isquémico transitorio
WO2011047358A1 (en) 2009-10-15 2011-04-21 Crescendo Bioscience Biomarkers and methods for measuring and monitoring inflammatory disease activity
CN106442984B (zh) 2010-04-21 2020-03-13 米密德诊断学有限公司 区分细菌与病毒感染的标记物和决定因素以及其使用方法
WO2011152012A1 (ja) 2010-05-31 2011-12-08 国立大学法人徳島大学 病気の重症度の検査方法
GB2482187A (en) * 2010-07-23 2012-01-25 Univ Exeter Predicting response to surgery
US8877212B2 (en) 2011-02-07 2014-11-04 Trudeau Institute Use of an IL12 receptor-beta 1 splice variant to diagnose active tuberculosis
RU2476887C2 (ru) 2011-03-29 2013-02-27 Учреждение Российской академии медицинских наук Дальневосточный научный центр физиологии и патологии дыхания Сибирского отделения РАМН Способ прогнозирования развития осложнений у больных внебольничной пневмонией
AU2012274461A1 (en) * 2011-06-20 2014-01-16 Kyowa Hakko Kirin Co., Ltd. Anti-erbB3 antibody
US20140329242A1 (en) 2011-09-12 2014-11-06 Thomas M. Aune Characterizing multiple sclerosis
JP5842107B2 (ja) * 2011-10-19 2016-01-13 パナソニックIpマネジメント株式会社 循環動態測定装置
ES2656150T3 (es) 2011-11-14 2018-02-23 Universitätsklinikum Jena Diagnóstico de la sepsis y del síndrome de respuesta inflamatoria sistémica
EP2637023A1 (en) 2012-03-08 2013-09-11 B.R.A.H.M.S GmbH Prediction of outcome in patients with chronic obstructive pulmonary disease
WO2013131993A2 (en) 2012-03-08 2013-09-12 Thommen Medical Ag Device for the diagnosis of inflammatory tissues in dental applications
EP2831264B1 (en) * 2012-03-30 2019-07-10 VisEn Medical, Inc. Bacterial imaging agents and methods of using same
GB201211982D0 (en) 2012-07-05 2012-08-22 Isis Innovation Biomarker
WO2014008545A1 (en) 2012-07-10 2014-01-16 Nepean Blue Mountains Local Health District Risk stratification in influenza
FR2996003B1 (fr) 2012-09-25 2014-10-17 Commissariat Energie Atomique Methode pour detecter specifiquement dans un echantillon une metalloprotease matricielle (mmp) d'interet uniquement dans sa forme active
US20140127827A1 (en) 2012-11-05 2014-05-08 Gwangju Institute Of Science And Technology Method for detection of antigen using fluorescence resonance energy transfer immunoassay
CA2893158A1 (en) 2012-11-30 2014-06-05 Applied Proteomics, Inc. Method for evaluation of presence of or risk of colon tumors
EP3608416A1 (en) 2013-01-22 2020-02-12 Imicroq, S.L. Rapid method for detection of pathogen
US9474903B2 (en) * 2013-03-15 2016-10-25 Boston Scientific Neuromodulation Corporation Clinical response data mapping
US10689701B2 (en) 2013-03-15 2020-06-23 Duke University Biomarkers for the molecular classification of bacterial infection
EP3693738A1 (en) 2013-09-20 2020-08-12 Astute Medical, Inc. Methods and compositions for diagnosis and prognosis of appendicitis and differentiation of causes of abdominal pain
WO2015048098A1 (en) 2013-09-24 2015-04-02 Washington University Diagnostic methods for infectious disease using endogenous gene expression
EP3180621B1 (en) 2014-08-14 2020-04-01 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
WO2016059636A1 (en) 2014-10-14 2016-04-21 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections in non-human subjects and methods of use thereof
RU2758608C2 (ru) 2014-11-19 2021-11-01 Конинклейке Филипс Н.В. Способ диагностики с использованием hnl
CA2968650A1 (en) 2014-12-11 2016-06-16 Memed Diagnostics Ltd. Marker combinations for diagnosing infections and methods of use thereof
KR20160072626A (ko) 2014-12-15 2016-06-23 전북대학교산학협력단 패혈증 인자 il-6 간이 진단 키트
EP3367895A4 (en) * 2015-11-01 2019-07-03 Elminda Ltd. METHOD AND SYSTEM FOR ESTIMATING POTENTIAL DISTRIBUTION ON A CORTICAL SURFACE
CN108699583B (zh) 2016-03-03 2022-11-01 米密德诊断学有限公司 用于区分细菌和病毒感染的rna决定子
CN114959084A (zh) 2016-03-03 2022-08-30 米密德诊断学有限公司 分析rna用于诊断感染类型
US20200124593A1 (en) 2016-06-23 2020-04-23 Memed Diagnostics Ltd. Measuring trail by lateral flow immunoassay
US11340223B2 (en) 2016-07-10 2022-05-24 Memed Diagnostics Ltd. Early diagnosis of infections
CA3027341A1 (en) 2016-07-10 2018-01-18 Memed Diagnostics Ltd. Protein signatures for distinguishing between bacterial and viral infections
WO2018052137A1 (ja) 2016-09-16 2018-03-22 株式会社オンチップ・バイオテクノロジーズ 微粒子分注装置、微粒子解析装置、及び反応検出装置、並びにそれらを用いる方法
US11385241B2 (en) 2016-09-29 2022-07-12 Memed Diagnostics Ltd. Methods of prognosis and treatment
US11353456B2 (en) * 2016-09-29 2022-06-07 Memed Diagnostics Ltd. Methods of risk assessment and disease classification for appendicitis
US10209260B2 (en) 2017-07-05 2019-02-19 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
US20220329345A1 (en) 2021-04-08 2022-10-13 Infinidome Ltd. Adjustable null steering in a stationary network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2348695C2 (ru) * 2006-05-23 2009-03-10 Закрытое акционерное общество "Молекулярно-медицинские технологии" Дифференцирующий и специфический олигонуклеотиды для идентификации последовательностей днк инфекционных агентов в биологических материалах, способ видовой идентификации инфекционных агентов, биочип и набор для осуществления этого способа
US20110312534A1 (en) * 2010-03-05 2011-12-22 Erasmus University Medical Center Rotterdam Method for prediction of human iris color
WO2013117746A1 (en) * 2012-02-09 2013-08-15 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
WO2014117873A1 (en) * 2013-01-29 2014-08-07 Molecular Health Ag Systems and methods for clinical decision support

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PEPE M.S. Combining diagnostic test results to increase accuracy / BIOSTATISTICS, 2000, V.1, N.2, pp.123-140. *

Also Published As

Publication number Publication date
US11081206B2 (en) 2021-08-03
US11450406B2 (en) 2022-09-20
JP6661607B2 (ja) 2020-03-11
JP2020113285A (ja) 2020-07-27
US10303846B2 (en) 2019-05-28
CN111624346A (zh) 2020-09-04
AU2015302870A1 (en) 2017-03-16
CN107076746A (zh) 2017-08-18
CA3190715A1 (en) 2016-02-18
JP7095001B2 (ja) 2022-07-04
RU2017107750A3 (ru) 2019-01-22
EP3180621B1 (en) 2020-04-01
JP2017532633A (ja) 2017-11-02
EP3180621A1 (en) 2017-06-21
US11776658B2 (en) 2023-10-03
EP3180621A4 (en) 2018-04-18
US20220399074A1 (en) 2022-12-15
EP3699930B1 (en) 2024-02-07
AU2015302870B2 (en) 2021-12-23
US20170235871A1 (en) 2017-08-17
CA2954601A1 (en) 2016-02-18
RU2017107750A (ru) 2018-09-17
US20190237156A1 (en) 2019-08-01
US20240029818A1 (en) 2024-01-25
EP3699930A2 (en) 2020-08-26
CN107076746B (zh) 2020-05-29
IL250585B (en) 2020-10-29
EP3699930A3 (en) 2020-10-28
KR20170041907A (ko) 2017-04-17
BR112017002884A2 (pt) 2018-01-30
US20200388347A1 (en) 2020-12-10
CA2954601C (en) 2023-04-18
AU2022200802A1 (en) 2022-03-03
IL250585A0 (en) 2017-04-30
WO2016024278A1 (en) 2016-02-18
ZA201700939B (en) 2021-05-26

Similar Documents

Publication Publication Date Title
RU2730836C2 (ru) Вычислительный анализ биологических данных с применением многообразия и гиперплоскости
CN109661578B (zh) 用于区分细菌和病毒感染的蛋白质特征
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
AU2015257483B2 (en) Biomarkers and combinations thereof for diagnosising tuberculosis
KR20150090246A (ko) 암을 위한 분자 진단 테스트
US6117654A (en) Nucleic acid molecules encoding Tango-77-polypeptides
KR20140044341A (ko) 암에 대한 분자적 진단 검사
CN111183234A (zh) 在表达pnpla3 i148m变异的患者的肝病治疗中对hsd17b13的抑制
TW201632629A (zh) 用於癌症診斷與預後的方法
CN107478843A (zh) 用于炎性疾病的抗‑cxcl9、抗‑cxcl10、抗‑cxcl11、抗‑cxcl13、抗‑cxcr3和抗‑cxcr5试剂
KR20150023904A (ko) 전립선암의 진단 및 치료에서의 마커의 용도
CA2561669A1 (en) Methods for identifying risk of osteoarthritis and treatments thereof
TWI849576B (zh) 基因標記的用途
CN102459645B (zh) 作为前列腺癌标记的磷酸二酯酶9a
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
US20140065610A1 (en) Method for predicting clinical benefit in the treatment of neurodevelopmental, neurological or neuropsychiatric disorders
WO2006022633A1 (en) Methods for identifying a risk of type ii diabetes and treatments thereof
KR20220138230A (ko) 암 예후 예측용 바이오마커
CN111615631A (zh) 以高灵敏度检测脑梗塞的发病风险的体液抗体生物标志物
KR102647920B1 (ko) 거짓비늘 녹내장 바이오 마커
KR102326582B1 (ko) 청각장애의 진단용 마커 및 그의 용도
KR102110600B1 (ko) Frrs1l 유전자 녹아웃 자폐 스펙트럼 장애 동물모델 및 이의 용도
KR20120073261A (ko) 카텝신 h의 용도
KR20050008644A (ko) 위암에서의 유전자 발현 프로파일
CN111989572A (zh) 评估疑似感染、sofa评分低于2的患者中的并发症风险