RU2815068C2 - Variants of protein related to interleukin-1 receptor and containing single immunoglobulin domain (sigirr), and use thereof - Google Patents

Variants of protein related to interleukin-1 receptor and containing single immunoglobulin domain (sigirr), and use thereof Download PDF

Info

Publication number
RU2815068C2
RU2815068C2 RU2020112474A RU2020112474A RU2815068C2 RU 2815068 C2 RU2815068 C2 RU 2815068C2 RU 2020112474 A RU2020112474 A RU 2020112474A RU 2020112474 A RU2020112474 A RU 2020112474A RU 2815068 C2 RU2815068 C2 RU 2815068C2
Authority
RU
Russia
Prior art keywords
nucleic acid
seq
sigirr
accordance
truncated
Prior art date
Application number
RU2020112474A
Other languages
Russian (ru)
Other versions
RU2020112474A (en
RU2020112474A3 (en
Inventor
Клаудиа Г. ГОНЗАГА-ХАУРЕГИ
Джули ХОРОВИЦ
Original Assignee
Ридженерон Фармасьютикалз, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ридженерон Фармасьютикалз, Инк. filed Critical Ридженерон Фармасьютикалз, Инк.
Priority claimed from PCT/US2018/049478 external-priority patent/WO2019050899A1/en
Publication of RU2020112474A publication Critical patent/RU2020112474A/en
Publication of RU2020112474A3 publication Critical patent/RU2020112474A3/ru
Application granted granted Critical
Publication of RU2815068C2 publication Critical patent/RU2815068C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to biotechnology, specifically to biomarkers of inflammatory bowel disease, and can be used in medicine to detect inflammatory bowel disease with onset at an early age or to detect the risk of inflammatory bowel disease with onset at an early age. Inflammatory bowel disease (IBD) with onset at an early age is diagnosed when a human protein related to the interleukin-1 receptor and containing a single immunoglobulin domain (SIGIRR) is detected, which contains serine in position corresponding to position 186 in accordance with SEQ ID NO: 9 and is truncated in position corresponding to position 215 in accordance with SEQ ID NO: 9, or nucleic acid coding it.
EFFECT: invention makes it possible to facilitate diagnosis of IBD in children with inflammatory bowel disease with onset at an early age.
80 cl, 3 dwg, 5 ex

Description

Перекрестная ссылка на родственные заявкиCross reference to related applications

Данная заявка заявляет приоритет по предварительной заявке США № 62/554857, поданной 6 сентября 2017 г., которая в полном объеме включена в данный документ посредством ссылки.This application claims priority to US Provisional Application No. 62/554857, filed September 6, 2017, which is incorporated herein by reference in its entirety.

Ссылка на Перечень последовательностейLink to Sequence List

Данная заявка включает Перечень последовательностей, поданный в электронной форме в виде текстового файла под названием 18923800602SEQ, созданного 30 августа 2018 г., с размером 56 килобайт. Перечень последовательностей включен в данный документ посредством ссылки.This application includes a Sequence Listing filed electronically as a text file entitled 18923800602SEQ, created on August 30, 2018, with a size of 56 kilobytes. The sequence listing is incorporated herein by reference.

Область техники изобретенияTechnical field of the invention

Данное раскрытие в целом относится к области генетики. В частности, данное раскрытие относится к генным изменениям и полипептидным вариантам белка, родственного рецептору интерлейкина-1 и содержащего одиночный домен иммуноглобулина (SIGIRR; англ. «Single Immunoglobulin Interleukin-1 Receptor Related»), которые связаны, например, с воспалительным заболеванием кишечника с началом в раннем возрасте (ВЗК-РВ).This disclosure relates generally to the field of genetics. In particular, this disclosure relates to gene changes and polypeptide variants of the Single Immunoglobulin Interleukin-1 Receptor Related (SIGIRR) protein that are associated, for example, with inflammatory bowel disease with onset at an early age (IBD-RV).

Уровень техники изобретенияBACKGROUND OF THE INVENTION

Различные ссылки, включая патенты, патентные заявки, номера доступа, технические статьи и научные статьи, цитируются в тексте данного описания. Каждая ссылка в полном объеме и во всех целях включена в данный документ посредством ссылки.Various references, including patents, patent applications, accession numbers, technical articles and scientific articles, are cited throughout the text of this specification. Each reference is incorporated herein by reference in its entirety and for all purposes.

Воспалительное заболевание кишечника (ВЗК) является генетически гетерогенным, хроническим воспалительным расстройством, вызванным неадекватным иммунным ответом на комменсальную микробиоту в желудочно-кишечном тракте, со средним возрастом начала в 30 лет. Тяжелые моногенные формы ВЗК могут наблюдаться с началом в детском возрасте (<18 лет) и были связаны с редкими высокопенетрантными вариантами в около 50 «менделевских» генах. Однако генетическая архитектура воспалительного заболевания кишечника с началом в раннем возрасте (ВЗК-РВ) плохо изучена, а большинство пациентов остаются генетически не диагностированными.Inflammatory bowel disease (IBD) is a genetically heterogeneous, chronic inflammatory disorder caused by an inappropriate immune response to commensal microbiota in the gastrointestinal tract, with a median age of onset of 30 years. Severe monogenic forms of IBD can occur with childhood onset (<18 years) and have been associated with rare, highly penetrant variants in about 50 “Mendelian” genes. However, the genetic architecture of early-onset inflammatory bowel disease (IBD-ER) is poorly understood and most patients remain genetically undiagnosed.

В данном раскрытии предложены варианты SIGIRR, которые помогут понять биологию SIGIRR и облегчат диагностику и лечение детей с воспалительным заболеванием кишечника с началом в раннем возрасте.This disclosure provides variants of SIGIRR that will help understand the biology of SIGIRR and facilitate diagnosis and treatment of children with early-onset inflammatory bowel disease.

Краткое описание сущности изобретенияBrief description of the invention

В данном раскрытии предложены новые молекулы нуклеиновых кислот (т.е. геномная ДНК, мРНК и кДНК), кодирующие вариантные полипептиды SIGIRR, и вариантные полипептиды SIGIRR, которые, как продемонстрировано в данном документе, связаны с воспалительным заболеванием кишечника, таким как воспалительное заболевание кишечника с началом в раннем возрасте.This disclosure provides novel nucleic acid molecules (i.e., genomic DNA, mRNA, and cDNA) encoding variant SIGIRR polypeptides and variant SIGIRR polypeptides that have been demonstrated herein to be associated with inflammatory bowel disease, such as inflammatory bowel disease with onset at an early age.

В частности, в данном раскрытии предложены выделенные молекулы нуклеиновых кислот, содержащие последовательность нуклеиновой кислоты, кодирующую человеческий белок SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь последовательности нуклеиновой кислоты.In particular, this disclosure provides isolated nucleic acid molecules containing a nucleic acid sequence encoding a human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, or a complementary strand of the nucleic acid sequence.

В данном раскрытии также предложены молекулы геномной ДНК, содержащие последовательность нуклеиновой кислоты, кодирующую по меньшей мере часть человеческого белка SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь последовательности нуклеиновой кислоты.This disclosure also provides genomic DNA molecules containing a nucleic acid sequence encoding at least a portion of the human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, or a complementary strand of the nucleic acid sequence.

В данном раскрытии также предложены молекулы кДНК, содержащие последовательность нуклеиновой кислоты, кодирующую по меньшей мере часть человеческого белка SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь последовательности нуклеиновой кислоты.This disclosure also provides cDNA molecules containing a nucleic acid sequence encoding at least a portion of the human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, or a complementary strand of the nucleic acid sequence.

В данном раскрытии также предложены молекулы мРНК, содержащие последовательность нуклеиновой кислоты, кодирующую по меньшей мере часть человеческого белка SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь последовательности нуклеиновой кислоты.This disclosure also provides mRNA molecules comprising a nucleic acid sequence encoding at least a portion of the human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, or a complementary strand of the nucleic acid sequence.

В данном раскрытии также предложены векторы, содержащие любую из выделенных молекул нуклеиновых кислот, раскрытых в данном документе.This disclosure also provides vectors containing any of the isolated nucleic acid molecules disclosed herein.

В данном раскрытии также предложены композиции, содержащие любые из выделенных молекул нуклеиновых кислот или векторов, раскрытых в данном документе, и носитель.This disclosure also provides compositions comprising any of the isolated nucleic acid molecules or vectors disclosed herein and a carrier.

В данном раскрытии также предложены клетки-хозяева, содержащие любые из выделенных молекул нуклеиновых кислот или векторов, раскрытых в данном документе.This disclosure also provides host cells containing any of the isolated nucleic acid molecules or vectors disclosed herein.

В данном раскрытии также предложены выделенные рекомбинантные полипептиды, содержащие по меньшей мере часть человеческого белка SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9.This disclosure also provides isolated recombinant polypeptides containing at least a portion of the human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9.

В данном раскрытии также предложены композиции, содержащие любые из выделенных или рекомбинантных полипептидов, раскрытых в данном документе, и носитель.This disclosure also provides compositions comprising any of the isolated or recombinant polypeptides disclosed herein and a carrier.

В данном раскрытии также предложены зонд или праймер, содержащие последовательность нуклеиновой кислоты, содержащую по меньшей мере около 5 нуклеотидов, которая гибридизируется с последовательностью нуклеиновой кислоты, кодирующей человеческий белок SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью последовательности нуклеиновой кислоты, кодирующей человеческий белок SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9.This disclosure also provides a probe or primer comprising a nucleic acid sequence of at least about 5 nucleotides that hybridizes to a nucleic acid sequence encoding the human SIGIRR protein, wherein the protein is truncated at a position corresponding to position 215 in accordance with SEQ ID NO :9, or which hybridizes to the complementary strand of a nucleic acid sequence encoding the human SIGIRR protein, wherein the protein is truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9.

В данном раскрытии также предложены подложки, содержащие субстрат, с которым может гибридизироваться любой из раскрытых в данном документе зондов.This disclosure also provides supports containing a substrate to which any of the probes disclosed herein can hybridize.

В данном раскрытии также предложен специфический в отношении изменения зонд или праймер, содержащий последовательность нуклеиновой кислоты, которая является комплементарной к последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, при этом специфический в отношении изменения зонд или праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной к части молекулы нуклеиновой кислоты, кодирующей любую из некоторого количества позиций, соответствующих позициям 186-209 или 211-215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или праймер специфически гибридизируется с частью молекулы нуклеиновой кислоты, кодирующей позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9, или ее комплементарной цепью. Специфический в отношении изменения зонд или праймер не гибридизируется с молекулой нуклеиновой кислоты, имеющей последовательность нуклеиновой кислоты, кодирующую белок SIGIRR дикого типа.This disclosure also provides a change-specific probe or primer comprising a nucleic acid sequence that is complementary to a nucleic acid sequence encoding a SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, wherein specific in regarding the change, the probe or primer contains a nucleic acid sequence that is complementary to a portion of the nucleic acid molecule encoding any of a number of positions corresponding to positions 186-209 or 211-215 in accordance with SEQ ID NO:9. In some embodiments, the change-specific probe or primer specifically hybridizes to a portion of the nucleic acid molecule encoding the position corresponding to position 186 of SEQ ID NO:9, or a complementary strand thereof. The change-specific probe or primer does not hybridize to a nucleic acid molecule having a nucleic acid sequence encoding a wild-type SIGIRR protein.

В данном раскрытии также предложены способы идентификации субъекта-человека, имеющего воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, при этом способ включает обнаружение в образце, полученном от субъекта, наличия или отсутствия усеченного белка SIGIRR; и/или молекулы нуклеиновой кислоты, кодирующей усеченный белок SIGIRR; причем наличие усеченного белка SIGIRR и/или молекулы нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, указывает на то, что субъект имеет воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте.This disclosure also provides methods for identifying a human subject having inflammatory bowel disease or early-onset inflammatory bowel disease, or a risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease, the method comprising detecting in a sample obtained from subject, presence or absence of truncated SIGIRR protein; and/or a nucleic acid molecule encoding a truncated SIGIRR protein; wherein the presence of a truncated SIGIRR protein and/or a nucleic acid molecule encoding a truncated SIGIRR protein indicates that the subject has inflammatory bowel disease or early-onset inflammatory bowel disease, or is at risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease at an early age.

В данном раскрытии также предложены способы идентификации субъекта-человека, имеющего воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, при этом способ включает обнаружение в образце, полученном от субъекта, наличия или отсутствия: белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/или молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; причем наличие усеченного белка SIGIRR и/или молекулы нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, указывает на то, что субъект имеет воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте.This disclosure also provides methods for identifying a human subject having inflammatory bowel disease or early-onset inflammatory bowel disease, or a risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease, the method comprising detecting in a sample obtained from the subject, presence or absence of: SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9; and/or a nucleic acid molecule encoding a SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9; wherein the presence of a truncated SIGIRR protein and/or a nucleic acid molecule encoding a truncated SIGIRR protein indicates that the subject has inflammatory bowel disease or early-onset inflammatory bowel disease, or is at risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease at an early age.

В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение изменения в молекуле нуклеиновой кислоты, кодирующей белок SIGIRR, полученной от субъекта-человека, причем указанное изменение кодирует усеченный белок SIGIRR; и диагностирование у субъекта-человека воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте.This disclosure also provides methods for diagnosing inflammatory bowel disease or early-onset inflammatory bowel disease or identifying the risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease in a human subject, comprising: detecting a change in a nucleic acid molecule encoding a SIGIRR protein obtained from a human subject, wherein the change encodes a truncated SIGIRR protein; and diagnosing a human subject with early-onset inflammatory bowel disease if the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk of developing inflammatory bowel disease or an inflammatory disease early-onset bowel disease, unless the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease.

В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение изменения в молекуле нуклеиновой кислоты, кодирующей белок SIGIRR, полученной от субъекта-человека, причем указанное изменение кодирует белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и диагностирование у субъекта-человека воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте.This disclosure also provides methods for diagnosing inflammatory bowel disease or early-onset inflammatory bowel disease or identifying the risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease in a human subject, comprising: detecting a change in a nucleic acid molecule encoding a SIGIRR protein obtained from a human subject, wherein the change encodes a SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9; and diagnosing a human subject with early-onset inflammatory bowel disease if the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk for developing inflammatory bowel disease or an inflammatory disease early-onset bowel disease, unless the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease.

Краткое описание графических материаловBrief description of graphic materials

Прилагающиеся фигуры, которые включены в это описание и составляют его часть, иллюстрируют несколько аспектов и вместе с описанием служат для пояснения принципов данного изобретения.The accompanying figures, which are included in and constitute a part of this specification, illustrate several aspects and, together with the description, serve to explain the principles of the present invention.

На Фиг. 1, панели A, B и C, проиллюстрирован усеченный вариант в SIGIRR с доминантной сегрегацией в семье с болезнью Крона.In FIG. Figure 1, panels A, B, and C, illustrates the truncated variant in SIGIRR with dominant segregation in a family with Crohn's disease.

На Фиг. 2 проиллюстрированы результаты из панели провоспалительных цитокинов мезомасштабного первичного исследования, проводимого на клеточных культуральных супернатантах, взятых из ЛКЛ, созданных из клеток здоровых доноров, пациента с ПФ-SIGIRR и 4 пациентов с ВЗК-РВ, не имеющих ПФ-SIGIRR, без стимуляции или с обработкой 2 мг/мл ЛПС в течение 72 часов.In FIG. Figure 2 illustrates the results from a panel of pro-inflammatory cytokines from a mesoscale primary study conducted on cell culture supernatants taken from LCL generated from cells from healthy donors, a patient with PF-SIGIRR, and 4 patients with IBD-RV without PF-SIGIRR, without or with stimulation treatment with 2 mg/ml LPS for 72 hours.

На Фиг. 3 проиллюстрированы результаты из панели провоспалительных цитокинов мезомасштабного первичного исследования, проводимого на клеточных культуральных супернатантах, взятых из ЛКЛ, созданных из клеток здоровых доноров, пациента с ПФ-SIGIRR и 4 пациентов с ВЗК-РВ, не имеющих ПФ-SIGIRR, без стимуляции или с обработкой 2 мг/мл анти-IgM/анти-CD40 в течение 16 часов.In FIG. Figure 3 illustrates the results from a panel of pro-inflammatory cytokines from a mesoscale primary study conducted on cell culture supernatants taken from LCL generated from cells from healthy donors, a patient with PF-SIGIRR, and 4 patients with IBD-RV without PF-SIGIRR, without or with stimulation treatment with 2 mg/ml anti-IgM/anti-CD40 for 16 hours.

Дополнительные преимущества данного раскрытия будут частично приведены в нижеследующем описании, и частично станут очевидны из описания или же могут быть определены при практической реализации раскрытых в данном документе вариантов осуществления. Преимущества данного раскрытия будут реализованы и обеспечены с помощью элементов и комбинаций, явно указанных в прилагаемой формуле изобретения. Следует понимать, что как вышеприведенное общее описание, так и нижеприведенное подробное описание являются исключительно иллюстративными и пояснительными и не ограничивают заявляемых вариантов осуществления.Additional advantages of this disclosure will be set forth in part in the description that follows, and in part will be apparent from the description or may be learned by practice of the embodiments disclosed herein. The advantages of this disclosure will be realized and achieved by the elements and combinations expressly set forth in the appended claims. It should be understood that both the foregoing general description and the following detailed description are illustrative and explanatory only and are not limiting of the claimed embodiments.

ОписаниеDescription

В тексте описания и в формуле изобретения используются различные термины, относящиеся к аспектам раскрытия. Таким терминам следует приписывать их обычное значение в данной области техники, если не указано иное. Другие явным образом определенные термины следует толковать образом, согласующимся с приведенным в данном документе определением.Various terms are used throughout the specification and claims to relate to aspects of the disclosure. Such terms should be assigned their ordinary meaning in the art unless otherwise noted. Other expressly defined terms should be construed in a manner consistent with the definition provided herein.

Если явным образом не указано иное, никоим образом не подразумевается, что любой приведенный в данном документе способ или аспект следует толковать как требующий проведения его этапов в конкретном порядке. Соответственно, если в связанном со способом пункте в формуле изобретения или описаниях явным образом не указано, что этапы следует ограничить конкретным порядком, никоим образом не подразумевается, что порядок следует нарушать, в любом отношении. Это справедливо для любого возможного не заявленного базиса для интерпретации, включая вопросы логики в отношении порядка этапов или технологической схемы, очевидное значение, вытекающее из грамматического построения или пунктуации, или число или тип аспектов, описанных в изобретении.Unless expressly stated otherwise, it is not in any way intended that any method or aspect described herein should be construed as requiring its steps to be carried out in a particular order. Accordingly, unless a method-related claim or description expressly states that the steps are to be limited to a particular order, it is in no way intended that the order should be disturbed in any respect. This is true for any possible unstated basis for interpretation, including questions of logic regarding the order of steps or flowchart, obvious meaning implied by grammatical construction or punctuation, or the number or type of aspects described in the invention.

В контексте данного документа формы единственного числа включают отсылки на множественное число, если из контекста явным образом не следует иное.As used herein, singular forms include references to the plural unless the context clearly indicates otherwise.

В контексте данного документа термины «субъект» и «пациент» используются взаимозаменяемо. Субъект может включать любое животное, включая млекопитающих. Млекопитающие включают, без ограничения, сельскохозяйственных животных (например, лошадей, коров, свиней), домашних животных (например, собак, кошек), лабораторных животных (например, мышей, крыс, кроликов) и отличных от человека приматов. В некоторых вариантах осуществления субъект является человеком.In the context of this document, the terms “subject” and “patient” are used interchangeably. The subject may include any animal, including mammals. Mammals include, but are not limited to, farm animals ( eg , horses, cows, pigs), domestic animals ( eg , dogs, cats), laboratory animals ( eg , mice, rats, rabbits) and non-human primates. In some embodiments, the subject is a human.

В контексте данного документа «нуклеиновая кислота», «молекула нуклеиновой кислоты», «последовательность нуклеиновой кислоты», «полинуклеотид» или «олигонуклеотид» могут содержать полимерную форму нуклеотидов любой длины, могут содержать ДНК и/или РНК и могут быть одноцепочечными, двухцепочечными или многоцепочечными. Одна цепь нуклеиновой кислоты также называется ее комплементарной цепью.As used herein, a “nucleic acid,” “nucleic acid molecule,” “nucleic acid sequence,” “polynucleotide,” or “oligonucleotide” may contain a polymeric form of nucleotides of any length, may contain DNA and/or RNA, and may be single-stranded, double-stranded, or multi-chain. One strand of a nucleic acid is also called its complementary strand.

В контексте данного документа выражение «соответствует» или его грамматические вариации, употребляемые в контексте нумерации заданной аминокислотной или нуклеотидной последовательности или позиции, относятся к нумерации конкретной референсной последовательности, когда заданную аминокислотную или нуклеотидную последовательность сравнивают с референсной последовательностью (например, в данном документе референсная последовательность представляет собой молекулу нуклеиновой кислоты или полипептид (дикого типа или полноразмерные) SIGIRR). Другими словами, номер остатка (например, аминокислоты или нуклеотида) или позицию остатка (например, аминокислоты или нуклеотида) заданного полимера обозначают относительно референсной последовательности, а не согласно действительной числовой позиции остатка в заданной аминокислотной или нуклеотидной последовательности. Например, заданную аминокислотную последовательность можно выровнять с референсной последовательностью путем внесения промежутков для оптимизации совпадений остатков между двумя последовательностями. В таких случаях, хотя промежутки и присутствуют, нумерацию остатка в заданной аминокислотной или нуклеотидной последовательности делают относительно референсной последовательности, с которой ее выравнивали.As used herein, the expression "corresponds" or its grammatical variations when used in the context of numbering a given amino acid or nucleotide sequence or position, refers to the numbering of a particular reference sequence when the given amino acid or nucleotide sequence is compared with a reference sequence ( e.g. , in this document, reference sequence is a nucleic acid molecule or polypeptide (wild type or full length) SIGIRR). In other words, the residue number ( eg , amino acid or nucleotide) or residue position ( eg , amino acid or nucleotide) of a given polymer is designated relative to a reference sequence, and not according to the actual numerical position of the residue in a given amino acid or nucleotide sequence. For example, a given amino acid sequence can be aligned with a reference sequence by introducing gaps to optimize residue matches between the two sequences. In such cases, although gaps are present, the numbering of the residue in a given amino acid or nucleotide sequence is relative to the reference sequence to which it was aligned.

Например, выражение «белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9» (и подобные выражения) означает, что если аминокислотную последовательность белка SIGIRR выравнивают с последовательностью SEQ ID NO:9, белок SIGIRR усечен по позиции, которая соответствует позиции 215 в SEQ ID NO:9 (например, концевой аминокислотой белка SIGIRR является аминокислота в позиции 215). Или, другими словами, эти выражения относятся к белку SIGIRR, который имеет усечение в позиции, которая является гомологичной позиции 215 в SEQ ID NO:9. В данном документе такой белок также называют «усеченным белком SIGIRR» или «вариантом p.K186fs*31».For example, the expression “SIGIRR protein truncated at position 215 in SEQ ID NO:9” (and similar expressions) means that if the amino acid sequence of the SIGIRR protein is aligned with the sequence of SEQ ID NO:9, the SIGIRR protein is truncated at the position , which corresponds to position 215 in SEQ ID NO:9 (eg, the terminal amino acid of the SIGIRR protein is the amino acid at position 215). Or, in other words, these expressions refer to a SIGIRR protein that is truncated at a position that is homologous to position 215 in SEQ ID NO:9. This protein is also referred to herein as the “truncated SIGIRR protein” or “variant p.K186fs*31.”

Белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, легко можно идентифицировать, проводя выравнивание последовательностей между заданным белком SIGIRR и аминокислотной последовательностью SEQ ID NO:9. Аналогично, белок SIGIRR, имеющий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, легко можно идентифицировать, проводя выравнивание последовательностей между заданным белком SIGIRR и аминокислотной последовательностью SEQ ID NO:9. Существует ряд вычислительных алгоритмов, которые можно использовать для проведения выравнивания последовательностей с целью идентификации усечения в позиции, которая соответствует позиции 215 в SEQ ID NO:9, или идентификации серина в позиции, которая соответствует позиции 186 в SEQ ID NO:9. Например, используя алгоритм NCBI BLAST (Altschul et al., 1997, Nucleic Acids Res., 25, 3389-3402) или программное обеспечение CLUSTALW (Sievers et al., 2014, Methods Mol. Biol., 1079, 105-116), можно проводить выравнивание последовательностей. При этом последовательности также можно выравнивать вручную.The SIGIRR protein truncated at position 215 in SEQ ID NO:9 can be readily identified by performing a sequence alignment between the specified SIGIRR protein and the amino acid sequence of SEQ ID NO:9. Likewise, a SIGIRR protein having a serine at a position corresponding to position 186 in SEQ ID NO:9 can be readily identified by performing a sequence alignment between a given SIGIRR protein and the amino acid sequence of SEQ ID NO:9. There are a number of computational algorithms that can be used to perform sequence alignments to identify a truncation at a position that corresponds to position 215 in SEQ ID NO:9, or to identify a serine at a position that corresponds to position 186 in SEQ ID NO:9. For example, using the NCBI BLAST algorithm (Altschul et al., 1997, Nucleic Acids Res., 25, 3389-3402) or CLUSTALW software (Sievers et al., 2014, Methods Mol. Biol., 1079, 105-116), sequence alignment can be performed. In this case, sequences can also be aligned manually.

В соответствии с раскрытием наблюдали, что определенные вариации в SIGIRR связаны с риском развития воспалительного заболевания кишечника с началом в раннем возрасте. В общем случае функция этого белка не до конца понятна, в частности, у детей возрастом до 18 лет. Считается, что ни один из вариантов в гене SIGIRR или белке не имеет известных ассоциаций с воспалительным заболеванием кишечника с началом в раннем возрасте у человека. Дополнительно считается, что ни один из вариантов в гене SIGIRR или белке не имеет известных ассоциаций с воспалительным заболеванием кишечника с началом в раннем возрасте, в частности, у детей. В соответствии с данным раскрытием был идентифицирован редкий вариант в гене SIGIRR, сегрегирующий с фенотипом воспалительного заболевания кишечника с началом в раннем возрасте у пораженных членов одной семьи. Например, согласно наблюдениям, генетическое изменение, которое приводит к делеции аденина в позиции 557 мРНК или кДНК человеческого SIGIRR (например, SEQ ID NO:3 и SEQ ID NO:5 дикого типа соответственно), которая приводит к сдвигу рамки с получением белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9 (например, концевая аминокислота расположена в позиции 215), указывает на то, что у человека, имеющего такое изменение, может развиваться воспалительное заболевание кишечника с началом в раннем возрасте. В целом, описанный в данном документе генетический анализ позволил предположить, что ген SIGIRR и, в частности, варианты с усечением или потерей функции в гене SIGIRR, связаны с повышенной подверженностью развитию воспалительного заболевания кишечника с началом в раннем возрасте. Следовательно, субъектов-людей, которые имеют изменения SIGIRR, которые связаны с воспалительным заболеванием кишечника с началом в раннем возрасте, можно лечить так, чтобы ингибировать воспалительное заболевание кишечника с началом в раннем возрасте, уменьшать его симптомы и/или подавлять развитие симптомов. Соответственно, в данном раскрытии предложены выделенные или рекомбинантные вариантные гены SIGIRR, включая кДНК и мРНК, а также выделенные или рекомбинантные вариантные полипептиды SIGIRR. Дополнительно, в данном раскрытии предложены способы максимального использования идентификации таких вариантов у субъектов для идентификации или стратификации риска развития у таких субъектов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или для диагностики субъектов как имеющих воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте так, чтобы можно было проводить лечение субъектов, подверженных риску, или субъектов с активным заболеванием.According to the disclosure, certain variations in SIGIRR have been observed to be associated with the risk of developing early-onset inflammatory bowel disease. In general, the function of this protein is not fully understood, particularly in children under 18 years of age. None of the variants in the SIGIRR gene or protein are thought to have known associations with early-onset inflammatory bowel disease in humans. Additionally, none of the variants in the SIGIRR gene or protein are thought to have known associations with early-onset inflammatory bowel disease, particularly in children. Consistent with this disclosure, a rare variant in the SIGIRR gene was identified that cosegregates with an early-onset inflammatory bowel disease phenotype in affected members of the same family. For example, a genetic change that results in a deletion of adenine at position 557 of the human SIGIRR mRNA or cDNA (e.g., wild-type SEQ ID NO:3 and SEQ ID NO:5, respectively) has been observed to result in a frameshift yielding the SIGIRR protein, truncated at position corresponding to position 215 in accordance with SEQ ID NO:9 (eg, the terminal amino acid is located at position 215), indicates that a person having such a change may develop inflammatory bowel disease with early onset. Overall, the genetic analyzes described herein suggested that the SIGIRR gene, and in particular truncating or loss-of-function variants in the SIGIRR gene, are associated with increased susceptibility to the development of early-onset inflammatory bowel disease. Therefore, human subjects who have SIGIRR changes that are associated with early-onset inflammatory bowel disease can be treated to inhibit early-onset inflammatory bowel disease, reduce its symptoms, and/or suppress the development of symptoms. Accordingly, this disclosure provides isolated or recombinant variant SIGIRR genes, including cDNA and mRNA, as well as isolated or recombinant variant SIGIRR polypeptides. Additionally, this disclosure provides methods for leveraging the identification of such variants in subjects to identify or stratify the risk of such subjects developing inflammatory bowel disease or early-onset inflammatory bowel disease or for diagnosing subjects as having inflammatory bowel disease or early-onset inflammatory bowel disease. at an early age so that treatment can be given to subjects at risk or subjects with active disease.

Аминокислотные последовательности двух белков SIGIRR дикого типа приведены в SEQ ID NO:7 и SEQ ID NO:8. Белок SIGIRR дикого типа, имеющий SEQ ID NO:7, имеет длину 410 аминокислот, тогда как белок SIGIRR дикого типа, имеющий SEQ ID NO:8, имеет длину 504 аминокислоты. В случае как SEQ ID NO:7, так и SEQ ID NO:8, позиции 186-215 белков дикого типа содержат следующие аминокислоты в указанном порядке: Lys-Pro-Gln-Leu-Glu-Arg-Arg-Arg-Gly-Tyr-Lys-Leu-Phe-Leu-Asp-Asp-Arg-Asp-Leu-Leu-Pro-Arg-Ala-Glu-Pro-Ser-Ala-Asp-Leu-Leu (SEQ ID NO:10).The amino acid sequences of the two wild-type SIGIRR proteins are shown in SEQ ID NO:7 and SEQ ID NO:8. The wild type SIGIRR protein having SEQ ID NO:7 is 410 amino acids long, while the wild type SIGIRR protein having SEQ ID NO:8 is 504 amino acids long. In the case of both SEQ ID NO:7 and SEQ ID NO:8, positions 186-215 of the wild-type proteins contain the following amino acids in this order: Lys-Pro-Gln-Leu-Glu-Arg-Arg-Arg-Gly-Tyr -Lys-Leu-Phe-Leu-Asp-Asp-Arg-Asp-Leu-Leu-Pro-Arg-Ala-Glu-Pro-Ser-Ala-Asp-Leu-Leu (SEQ ID NO:10).

В данном раскрытии предложены молекулы нуклеиновых кислот, кодирующие вариантные белки SIGIRR, которые связаны с воспалительным заболеванием кишечника или воспалительным заболеванием кишечника с началом в раннем возрасте. В некоторых вариантах осуществления молекулы нуклеиновых кислот кодируют усеченный вариантный белок SIGIRR. Например, в данном раскрытии предложены выделенные молекулы нуклеиновых кислот, содержащие последовательность нуклеиновой кислоты, кодирующую человеческий белок SIGIRR, при этом белок усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь последовательности нуклеиновой кислоты.This disclosure provides nucleic acid molecules encoding variant SIGIRR proteins that are associated with inflammatory bowel disease or early-onset inflammatory bowel disease. In some embodiments, the nucleic acid molecules encode a truncated variant protein of SIGIRR. For example, this disclosure provides isolated nucleic acid molecules containing a nucleic acid sequence encoding a human SIGIRR protein, wherein the protein is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, or the complementary strand of the nucleic acid sequence.

В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, the isolated nucleic acid molecule contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein containing a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, содержащий аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.In some embodiments, the isolated nucleic acid molecule contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein comprising the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9.

В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует человеческий белок SIGIRR, имеющий аминокислотную последовательность, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9, или комплементарной цепи последовательности нуклеиновой кислоты. В данном документе, если приводится ссылка на процент идентичности последовательностей, более высокие значения процента идентичности последовательностей предпочтительнее более низких.In some embodiments, the nucleic acid molecule contains or consists of a nucleic acid sequence that encodes a human SIGIRR protein having an amino acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9, or the complementary strand of the nucleic acid sequence. As used herein, when reference is made to percentage sequence identity, higher percentage sequence identity values are preferred to lower values.

В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, причем усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9 или аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, the isolated nucleic acid molecule contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein, wherein the truncated SIGIRR protein comprises an amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9, and contains serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

Последовательность нуклеиновой кислоты геномной ДНК SIGIRR дикого типа приведена в SEQ ID NO:1. Геномная ДНК SIGIRR дикого типа, содержащая SEQ ID NO:1, имеет длину 11739 нуклеотидов. В случае SEQ ID NO:1, позиция 9962 геномной ДНК SIGIRR дикого типа представлена аденином.The nucleic acid sequence of the wild type SIGIRR genomic DNA is shown in SEQ ID NO:1. The wild type SIGIRR genomic DNA containing SEQ ID NO:1 is 11,739 nucleotides in length. In the case of SEQ ID NO:1, position 9962 of wild type SIGIRR genomic DNA is represented by adenine.

В данном раскрытии предложены молекулы геномной ДНК, кодирующие вариантный белок SIGIRR. В некоторых вариантах осуществления молекулы геномной ДНК кодируют усеченный белок SIGIRR. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, причем усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9 или аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure provides genomic DNA molecules encoding a variant SIGIRR protein. In some embodiments, the genomic DNA molecules encode a truncated SIGIRR protein. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO: 9. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence that encodes a variant SIGIRR protein having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein having SEQ ID NO:9. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein, wherein the truncated SIGIRR protein comprises the amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity to SEQ ID NO: 9, and contains serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2. В противоположность этому, геномная ДНК SIGIRR дикого типа содержит аденин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:1. Изменение в геномной ДНК вариантного SIGIRR связано с делецией этого аденина, что приводит к сдвигу рамки на один нуклеотид, таким образом, приводя к появлению гуанина в позиции, соответствующей позиции 9962 в SEQ ID NO:2. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:2. В некоторых вариантах осуществления геномная ДНК содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:2.In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence containing guanine at the position corresponding to position 9962 in accordance with SEQ ID NO:2. In contrast, wild-type SIGIRR genomic DNA contains an adenine at the position corresponding to position 9962 according to SEQ ID NO:1. The change in the genomic DNA of the variant SIGIRR is due to the deletion of this adenine, which results in a frame shift of one nucleotide, thereby resulting in the appearance of a guanine at the position corresponding to position 9962 in SEQ ID NO:2. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94% , at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:2. In some embodiments, the genomic DNA contains or consists of a nucleic acid sequence according to SEQ ID NO:2.

В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат меньше, чем полную последовательность геномной ДНК. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400, по меньшей мере около 500, по меньшей мере около 600, по меньшей мере около 700, по меньшей мере около 800, по меньшей мере около 900, по меньшей мере около 1000, по меньшей мере около 2000, по меньшей мере около 3000, по меньшей мере около 4000, по меньшей мере около 5000, по меньшей мере около 6000, по меньшей мере около 7000, по меньшей мере около 8000, по меньшей мере около 9000, по меньшей мере около 10000, по меньшей мере около 11000 или по меньшей мере около 11500 смежных нуклеотидов SEQ ID NO:2. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из от по меньшей мере около 1000 до по меньшей мере около 2000 смежных нуклеотидов SEQ ID NO:2.In some embodiments, the isolated nucleic acid molecules contain less than the complete genomic DNA sequence. In some embodiments, the isolated nucleic acid molecules contain or consist of at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least at least about 45, at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least about 200, at least about 300, at least about 400, at least about 500, at least about 600, at least about 700, at least about 800, at least about 900, at least about 1000, at least about 2000, at least about 3000, at least about 4000, at least about 5000, at least about 6000, at least about 7000, at least about 8000, at least about 9000, at least about 10000, at least at least about 11,000 or at least about 11,500 contiguous nucleotides of SEQ ID NO:2. In some embodiments, the isolated nucleic acid molecules contain or consist of from at least about 1000 to at least about 2000 contiguous nucleotides of SEQ ID NO:2.

В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400, по меньшей мере около 500, по меньшей мере около 600, по меньшей мере около 700, по меньшей мере около 800, по меньшей мере около 900, по меньшей мере около 1000, по меньшей мере около 1000, по меньшей мере около 1100, по меньшей мере около 1200, по меньшей мере около 1300, по меньшей мере около 1400, по меньшей мере около 1500, по меньшей мере около 1600, по меньшей мере около 1700, по меньшей мере около 1800, по меньшей мере около 1900, по меньшей мере около 2000, по меньшей мере около 2100, по меньшей мере около 2200, по меньшей мере около 2300, по меньшей мере около 2400 или по меньшей мере около 2500 смежных нуклеотидов SEQ ID NO:2. В некоторых вариантах осуществления такие смежные нуклеотиды можно комбинировать с другими молекулами нуклеиновых кислот из смежных нуклеотидов для получения молекул кДНК, описанных в данном документе.In some embodiments, the isolated nucleic acid molecules contain or consist of at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least at least about 45, at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least about 200, at least about 300, at least about 400, at least about 500, at least about 600, at least about 700, at least about 800, at least about 900, at least about 1000, at least about 1000, at least about 1100, at least about 1200, at least about 1300, at least about 1400, at least about 1500, at least about 1600, at least about 1700, at least about 1800, at least at least about 1900, at least about 2000, at least about 2100, at least about 2200, at least about 2300, at least about 2400, or at least about 2500 contiguous nucleotides of SEQ ID NO:2. In some embodiments, such contiguous nucleotides can be combined with other nucleic acid molecules from contiguous nucleotides to produce the cDNA molecules described herein.

Такие выделенные молекулы нуклеиновых кислот можно использовать, например, для экспрессии мРНК и белков вариантного SIGIRR или в качестве экзогенных донорных последовательностей. Следует понимать, что генные последовательности в популяции могут варьироваться вследствие полиморфизмов, таких как ОНП. Приведенные в данном документе примеры представляют всего лишь типовые последовательности, но также возможны и другие последовательности.Such isolated nucleic acid molecules can be used, for example, to express variant SIGIRR mRNA and proteins or as exogenous donor sequences. It should be understood that gene sequences within a population may vary due to polymorphisms such as SNPs. The examples given herein represent only exemplary sequences, but other sequences are also possible.

В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат миниген вариантного SIGIRR, в котором были удалены один или более несущественных сегментов, кодирующих SEQ ID NO:9, относительно соответствующей геномной ДНК SIGIRR дикого типа. В некоторых вариантах осуществления удаленные несущественные сегменты содержат одну или более интронных последовательностей. В некоторых вариантах осуществления миниген SIGIRR имеет по меньшей мере около 70%, по меньшей мере около 75%, по меньшей мере около 80%, по меньшей мере около 85%, по меньшей мере около 90%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98%, по меньшей мере около 99% или 100% идентичности последовательности с частью SEQ ID NO:2, причем миниген содержит последовательность нуклеиновой кислоты, имеющую гуанин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2.In some embodiments, the isolated nucleic acid molecules comprise a variant SIGIRR minigene in which one or more nonessential coding segments of SEQ ID NO:9 have been deleted relative to the corresponding wild-type SIGIRR genomic DNA. In some embodiments, the deleted non-essential segments contain one or more intronic sequences. In some embodiments, the SIGIRR minigene has at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or 100% sequence identity to a portion of SEQ ID NO:2, wherein the minigene comprises a nucleic acid sequence having a guanine at position , corresponding to position 9962 in accordance with SEQ ID NO:2.

Последовательность нуклеиновой кислоты мРНК SIGIRR дикого типа приведена в SEQ ID NO:3. мРНК SIGIRR дикого типа, содержащая SEQ ID NO:3, имеет длину 1230 нуклеотидов. В случае SEQ ID NO:3, позиция 557 мРНК SIGIRR дикого типа представлена аденином.The nucleic acid sequence of wild type SIGIRR mRNA is shown in SEQ ID NO:3. The wild type SIGIRR mRNA containing SEQ ID NO:3 is 1230 nucleotides in length. In the case of SEQ ID NO:3, position 557 of the wild type SIGIRR mRNA is represented by adenine.

В данном раскрытии также предложены молекулы мРНК, кодирующие вариантный белок SIGIRR. В некоторых вариантах осуществления молекулы мРНК кодируют усеченный белок SIGIRR. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, причем усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9 или аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides mRNA molecules encoding a variant SIGIRR protein. In some embodiments, the mRNA molecules encode a truncated SIGIRR protein. In some embodiments, the mRNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the mRNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 . In some embodiments, the mRNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the mRNA contains or consists of a nucleic acid sequence that encodes a SIGIRR variant protein having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the mRNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein having SEQ ID NO:9. In some embodiments, the mRNA contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein, wherein the truncated SIGIRR protein comprises an amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity to SEQ ID NO:9 , and contains a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4. В противоположность этому, мРНК SIGIRR дикого типа содержит аденин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:3. Изменение в мРНК вариантного SIGIRR связано с делецией этого аденина, что приводит к сдвигу рамки на один нуклеотид, таким образом, приводя к появлению гуанина в позиции, соответствующей позиции 557 в SEQ ID NO:4. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, содержащей кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4. В противоположность этому, мРНК SIGIRR дикого типа содержит кодоны CUA и AAG в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:3. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:4. В некоторых вариантах осуществления мРНК содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:4.In some embodiments, the mRNA contains or consists of a nucleic acid sequence containing guanine at the position corresponding to position 557 in accordance with SEQ ID NO:4. In contrast, wild-type SIGIRR mRNA contains an adenine at the position corresponding to position 557 according to SEQ ID NO:3. The change in the variant SIGIRR mRNA is due to the deletion of this adenine, which results in a frame shift of one nucleotide, thereby resulting in the appearance of a guanine at a position corresponding to position 557 in SEQ ID NO:4. In some embodiments, the mRNA contains or consists of a nucleic acid sequence containing codons CUA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:4. In contrast, wild-type SIGIRR mRNA contains codons CUA and AAG at positions corresponding to positions 553-555 and 556-558, respectively, according to SEQ ID NO:3. In some embodiments, the mRNA contains or consists of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:4. In some embodiments, the mRNA contains or consists of a nucleic acid sequence according to SEQ ID NO:4.

В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит меньше нуклеотидов, чем полная последовательность мРНК SIGIRR. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 12, по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400, по меньшей мере около 500, или по меньшей мере около 600 смежных нуклеотидов SEQ ID NO:4. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из от по меньшей мере около 200 до по меньшей мере около 500 смежных нуклеотидов SEQ ID NO:4. В этом отношении более длинные молекулы мРНК предпочтительнее более коротких. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400 или по меньшей мере около 500 смежных нуклеотидов SEQ ID NO:4. В этом отношении более длинные молекулы мРНК предпочтительнее более коротких. В некоторых вариантах осуществления такие молекулы мРНК содержат кодон, который кодирует серин в позиции, которая соответствует позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления такие молекулы мРНК содержат гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4. В некоторых вариантах осуществления такие молекулы мРНК содержат кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4. In some embodiments, the isolated nucleic acid molecule contains fewer nucleotides than the complete SIGIRR mRNA sequence. In some embodiments, the isolated nucleic acid molecules contain or consist of at least about 5, at least about 8, at least about 10, at least about 12, at least about 15, at least about 20, at least at least about 25, at least about 30, at least about 35, at least about 40, at least about 45, at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least about 200, at least about 300, at least about 400, at least about 500, or at least about 600 contiguous nucleotides SEQ ID NO: 4. In some embodiments, the isolated nucleic acid molecules contain or consist of at least about 200 to at least about 500 contiguous nucleotides of SEQ ID NO:4. In this regard, longer mRNA molecules are preferable to shorter ones. In some embodiments, the isolated nucleic acid molecules contain or consist of at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least at least about 200, at least about 300, at least about 400, or at least about 500 contiguous nucleotides of SEQ ID NO:4. In this regard, longer mRNA molecules are preferable to shorter ones. In some embodiments, such mRNA molecules contain a codon that encodes a serine at a position that corresponds to position 186 in accordance with SEQ ID NO:9. In some embodiments, such mRNA molecules contain guanine at a position corresponding to position 557 in accordance with SEQ ID NO:4. In some embodiments, such mRNA molecules contain codons CUA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:4.

Последовательность нуклеиновой кислоты кДНК SIGIRR дикого типа приведена в SEQ ID NO:5. кДНК SIGIRR дикого типа, содержащая SEQ ID NO:5, имеет длину 1233 нуклеотида, включая стоп-кодон. В случае SEQ ID NO:5, позиция 557 кДНК SIGIRR дикого типа представлена аденином.The nucleic acid sequence of the wild type SIGIRR cDNA is shown in SEQ ID NO:5. The wild type SIGIRR cDNA containing SEQ ID NO:5 is 1233 nucleotides in length, including the stop codon. In the case of SEQ ID NO:5, position 557 of the wild type SIGIRR cDNA is adenine.

В данном раскрытии также предложены молекулы кДНК, кодирующие вариантный белок SIGIRR. В некоторых вариантах осуществления молекулы кДНК кодируют усеченный белок SIGIRR. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, причем усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9 или аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides cDNA molecules encoding a variant SIGIRR protein. In some embodiments, the cDNA molecules encode a truncated SIGIRR protein. In some embodiments, the cDNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the cDNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 . In some embodiments, the cDNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the cDNA contains or consists of a nucleic acid sequence that encodes a variant SIGIRR protein having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the cDNA contains or consists of a nucleic acid sequence encoding a SIGIRR protein having SEQ ID NO:9. In some embodiments, the cDNA contains or consists of a nucleic acid sequence that encodes a truncated SIGIRR protein, wherein the truncated SIGIRR protein comprises the amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity to SEQ ID NO:9 , and contains a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6. В противоположность этому, кДНК SIGIRR дикого типа содержит аденин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:5. Изменение в кДНК вариантного SIGIRR связано с делецией этого аденина, что приводит к сдвигу рамки на один нуклеотид, таким образом, приводя к появлению гуанина в позиции, соответствующей позиции 557 в SEQ ID NO:6. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, содержащей кодоны CTA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:6. В противоположность этому, кДНК SIGIRR дикого типа содержит кодоны CTA and AAG в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:5. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:6. В некоторых вариантах осуществления кДНК содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:6.In some embodiments, the cDNA contains or consists of a nucleic acid sequence containing guanine at the position corresponding to position 557 in accordance with SEQ ID NO:6. In contrast, the wild type SIGIRR cDNA contains an adenine at the position corresponding to position 557 according to SEQ ID NO:5. The change in the cDNA of the variant SIGIRR is due to the deletion of this adenine, which results in a frame shift of one nucleotide, thereby resulting in the appearance of a guanine at a position corresponding to position 557 in SEQ ID NO:6. In some embodiments, the cDNA contains or consists of a nucleic acid sequence containing codons CTA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:6. In contrast, the wild-type SIGIRR cDNA contains codons CTA and AAG at positions corresponding to positions 553-555 and 556-558, respectively, according to SEQ ID NO:5. In some embodiments, the cDNA contains or consists of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:6. In some embodiments, the cDNA contains or consists of a nucleic acid sequence according to SEQ ID NO:6.

В некоторых вариантах осуществления молекулы кДНК содержат менее, чем целую последовательность молекулы кДНК вариантного SIGIRR. В некоторых вариантах осуществления молекулы кДНК содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 12, по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400, по меньшей мере около 500, или по меньшей мере около 600 смежных нуклеотидов SEQ ID NO:6. В некоторых вариантах осуществления молекулы кДНК содержат или состоят из от по меньшей мере около 200 до по меньшей мере около 500 смежных нуклеотидов SEQ ID NO:6. В этом отношении более длинные молекулы кДНК предпочтительнее более коротких. В некоторых вариантах осуществления молекулы кДНК содержат или состоят из по меньшей мере около 50, по меньшей мере около 60, по меньшей мере около 70, по меньшей мере около 80, по меньшей мере около 90, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400 или по меньшей мере около 500 смежных нуклеотидов SEQ ID NO:6. В этом отношении более длинные молекулы кДНК предпочтительнее более коротких. В некоторых вариантах осуществления такие молекулы кДНК содержат кодон, который кодирует серин в позиции, которая соответствует позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления такие молекулы кДНК содержат гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6. В некоторых вариантах осуществления такие молекулы кДНК содержат кодоны CTA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4.In some embodiments, the cDNA molecules contain less than the entire sequence of the SIGIRR variant cDNA molecule. In some embodiments, the cDNA molecules contain or consist of at least about 5, at least about 8, at least about 10, at least about 12, at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least about 45, at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least about 200, at least about 300, at least about 400, at least about 500, or at least about 600 contiguous nucleotides of SEQ ID NO:6. In some embodiments, the cDNA molecules contain or consist of at least about 200 to at least about 500 contiguous nucleotides of SEQ ID NO:6. In this regard, longer cDNA molecules are preferable to shorter ones. In some embodiments, the cDNA molecules contain or consist of at least about 50, at least about 60, at least about 70, at least about 80, at least about 90, at least about 100, at least about 200, at least about 300, at least about 400, or at least about 500 contiguous nucleotides of SEQ ID NO:6. In this regard, longer cDNA molecules are preferable to shorter ones. In some embodiments, such cDNA molecules contain a codon that encodes a serine at a position that corresponds to position 186 in accordance with SEQ ID NO:9. In some embodiments, such cDNA molecules contain guanine at the position corresponding to position 557 in accordance with SEQ ID NO:6. In some embodiments, such cDNA molecules contain CTA and AGC codons at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:4.

В данном раскрытии также предложены выделенные молекулы нуклеиновых кислот, которые гибридизируются с геномной ДНК вариантного SIGIRR (такой как SEQ ID NO:2), минигенами вариантного SIGIRR, мРНК вариантного SIGIRR (такой как SEQ ID NO:4) и/или кДНК вариантного SIGIRR (такой как SEQ ID NO:6). В некоторых вариантах осуществления такие выделенные молекулы нуклеиновых кислот содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 55, по меньшей мере около 60, по меньшей мере около 65, по меньшей мере около 70, по меньшей мере около 75, по меньшей мере около 80, по меньшей мере около 85, по меньшей мере около 90, по меньшей мере около 95, по меньшей мере около 100, по меньшей мере около 200, по меньшей мере около 300, по меньшей мере около 400, по меньшей мере около 500, по меньшей мере около 600, по меньшей мере около 700, по меньшей мере около 800, по меньшей мере около 900, по меньшей мере около 1000, по меньшей мере около 2000, по меньшей мере около 3000, по меньшей мере около 4000, по меньшей мере около 5000, по меньшей мере около 6000, по меньшей мере около 7000, по меньшей мере около 8000, по меньшей мере около 9000, по меньшей мере около 10000, по меньшей мере около 11000 или по меньшей мере около 11500 нуклеотидов. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит или состоит из по меньшей мере 15 нуклеотидов. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит или состоит из от по меньшей мере 15 нуклеотидов до по меньшей мере около 35 нуклеотидов. В некоторых вариантах осуществления такие выделенные молекулы нуклеиновых кислот гибридизируются с геномной ДНК вариантного SIGIRR (такой как SEQ ID NO:2), минигенами вариантного SIGIRR, мРНК вариантного SIGIRR (такой как SEQ ID NO:4) и/или кДНК вариантного SIGIRR (такой как SEQ ID NO:6) в жестких условиях. Такие молекулы нуклеиновых кислот можно использовать, например, в качестве зондов, в качестве праймеров или в качестве специфических в отношении изменения зондов или праймеров, как описано и проиллюстрировано в данном документе.This disclosure also provides isolated nucleic acid molecules that hybridize to variant SIGIRR genomic DNA (such as SEQ ID NO:2), variant SIGIRR minigenes, variant SIGIRR mRNA (such as SEQ ID NO:4) and/or variant SIGIRR cDNA ( such as SEQ ID NO:6). In some embodiments, such isolated nucleic acid molecules contain or consist of at least about 5, at least about 8, at least about 10, at least about 11, at least about 12, at least about 13, at least about 14, at least about 15, at least about 16, at least about 17, at least about 18, at least about 19, at least about 20, at least about 21, at least about 22, at least about 23, at least about 24, at least about 25, at least about 30, at least about 35, at least about 40, at least about 45, at least about 50 , at least about 55, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, at least about 90, according to at least about 95, at least about 100, at least about 200, at least about 300, at least about 400, at least about 500, at least about 600, at least about 700, at least about 800, at least about 900, at least about 1000, at least about 2000, at least about 3000, at least about 4000, at least about 5000, at least about 6000, at least about 7000 , at least about 8000, at least about 9000, at least about 10000, at least about 11000, or at least about 11500 nucleotides. In some embodiments, the isolated nucleic acid molecule contains or consists of at least 15 nucleotides. In some embodiments, the isolated nucleic acid molecule contains or consists of from at least 15 nucleotides to at least about 35 nucleotides. In some embodiments, such isolated nucleic acid molecules hybridize to variant SIGIRR genomic DNA (such as SEQ ID NO:2), variant SIGIRR minigenes, variant SIGIRR mRNA (such as SEQ ID NO:4), and/or variant SIGIRR cDNA (such as SEQ ID NO:6) under harsh conditions. Such nucleic acid molecules can be used, for example, as probes, as primers, or as variation-specific probes or primers, as described and illustrated herein.

В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот гибридизируются с по меньшей мере около 15 смежными нуклеотидами молекулы нуклеиновой кислоты, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или 100% идентична геномной ДНК вариантного SIGIRR (такой как SEQ ID NO:2), минигенам вариантного SIGIRR, мРНК вариантного SIGIRR (такой как SEQ ID NO:4) и/или кДНК вариантного SIGIRR (такой как SEQ ID NO:6). В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из от около 15 до около 100 нуклеотидов или от около 15 до около 35 нуклеотидов. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из от около 15 до около 100 нуклеотидов. В некоторых вариантах осуществления выделенные молекулы нуклеиновых кислот содержат или состоят из от около 15 до около 35 нуклеотидовIn some embodiments, the isolated nucleic acid molecules hybridize to at least about 15 contiguous nucleotides of the nucleic acid molecule that are at least about 70%, at least about 75%, at least about 80%, at least about about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99 % or 100% identical to variant SIGIRR genomic DNA (such as SEQ ID NO:2), variant SIGIRR minigenes, variant SIGIRR mRNA (such as SEQ ID NO:4) and/or variant SIGIRR cDNA (such as SEQ ID NO:6) . In some embodiments, the isolated nucleic acid molecules contain or consist of from about 15 to about 100 nucleotides, or from about 15 to about 35 nucleotides. In some embodiments, the isolated nucleic acid molecules contain or consist of from about 15 to about 100 nucleotides. In some embodiments, the isolated nucleic acid molecules contain or consist of from about 15 to about 35 nucleotides

В некоторых вариантах осуществления любые из молекул нуклеиновых кислот, молекул геномной ДНК, молекул кДНК или молекул мРНК, раскрытых в данном документе, могут быть очищены, например, являются по меньшей мере на около 90% чистыми. В некоторых вариантах осуществления любые из молекул нуклеиновых кислот, молекул геномной ДНК, молекул кДНК или молекул мРНК, раскрытых в данном документе, могут быть очищены, например, являются по меньшей мере на около 95% чистыми. В некоторых вариантах осуществления любые из молекул нуклеиновых кислот, молекул геномной ДНК, молекул кДНК или молекул мРНК, раскрытых в данном документе, могут быть очищены, например, являются по меньшей мере на около 99% чистыми. Очистка проводится человеком с помощью разработанных человеком методик очистки.In some embodiments, any of the nucleic acid molecules, genomic DNA molecules, cDNA molecules, or mRNA molecules disclosed herein may be purified, for example , are at least about 90% pure. In some embodiments, any of the nucleic acid molecules, genomic DNA molecules, cDNA molecules, or mRNA molecules disclosed herein may be purified, e.g. , are at least about 95% pure. In some embodiments, any of the nucleic acid molecules, genomic DNA molecules, cDNA molecules, or mRNA molecules disclosed herein may be purified, e.g. , are at least about 99% pure. Cleaning is performed by humans using human-designed cleaning techniques.

В данном раскрытии также предложены фрагменты любой из выделенных молекул нуклеиновых кислот, молекул геномной ДНК, молекул кДНК или молекул мРНК, раскрытых в данном документе. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 55, по меньшей мере около 60, по меньшей мере около 65, по меньшей мере около 70, по меньшей мере около 75, по меньшей мере около 80, по меньшей мере около 85, по меньшей мере около 90, по меньшей мере около 95 или по меньшей мере около 100 смежных остатков любой из раскрытых в данном документе последовательностей нуклеиновых кислот или любой их комплементарной цепи. В этом отношении более длинные фрагменты предпочтительнее более коротких. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45 или по меньшей мере около 50 смежных остатков. В этом отношении более длинные фрагменты предпочтительнее более коротких. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30 или по меньшей мере около 35 смежных остатков. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 20 смежных остатков. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 25 смежных остатков. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 30 смежных остатков. В некоторых вариантах осуществления фрагменты содержат или состоят из по меньшей мере около 35 смежных остатков. Подразумевается, что фрагменты содержат или состоят из части молекулы нуклеиновой кислоты, которая кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, или кодирует позиции, соответствующие позициям 186-215 в соответствии с SEQ ID NO:9. Такие фрагменты можно использовать, например, в качестве зондов, в качестве праймеров или в качестве аллель-специфических праймеров, как описано и проиллюстрировано в данном документе.This disclosure also provides fragments of any of the isolated nucleic acid molecules, genomic DNA molecules, cDNA molecules, or mRNA molecules disclosed herein. In some embodiments, the fragments contain or consist of at least about 5, at least about 8, at least about 10, at least about 11, at least about 12, at least about 13, at least about 14 , at least about 15, at least about 16, at least about 17, at least about 18, at least about 19, at least about 20, at least about 21, at least about 22, according to at least about 23, at least about 24, at least about 25, at least about 30, at least about 35, at least about 40, at least about 45, at least about 50, at least about 55, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, at least about 90, at least about 95 or at least about 100 contiguous residues of any of the nucleic acid sequences disclosed herein or any complementary strand thereof. In this regard, longer fragments are preferable to shorter ones. In some embodiments, the fragments contain or consist of at least about 5, at least about 8, at least about 10, at least about 11, at least about 12, at least about 13, at least about 14 , at least about 15, at least about 16, at least about 17, at least about 18, at least about 19, at least about 20, at least about 21, at least about 22, according to at least about 23, at least about 24, at least about 25, at least about 30, at least about 35, at least about 40, at least about 45 or at least about 50 contiguous residues. In this regard, longer fragments are preferable to shorter ones. In some embodiments, the fragments contain or consist of at least about 20, at least about 25, at least about 30, or at least about 35 contiguous residues. In some embodiments, the fragments contain or consist of at least about 20 contiguous residues. In some embodiments, the fragments contain or consist of at least about 25 contiguous residues. In some embodiments, the fragments contain or consist of at least about 30 contiguous residues. In some embodiments, the fragments contain or consist of at least about 35 contiguous residues. The fragments are intended to contain or consist of a portion of a nucleic acid molecule that encodes a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, or encodes a position corresponding to positions 186-215 in accordance with SEQ ID NO:9. Such fragments can be used, for example, as probes, as primers, or as allele-specific primers, as described and illustrated herein.

В данном раскрытии также предложены зонды и праймеры. Зонд или праймер согласно данному раскрытию имеют последовательность нуклеиновой кислоты, которая специфически гибридизируется с любой из раскрытых в данном документе молекул нуклеиновых кислот или их комплементарной цепью. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с любой из раскрытых в данном документе молекул нуклеиновых кислот в жестких условиях. В данном раскрытии также предложены молекулы нуклеиновых кислот, имеющие последовательности нуклеиновых кислот, которые гибридизируются в умеренных условиях с любой из раскрытых в данном документе молекул нуклеиновых кислот или их комплементарной цепью. Зонд или праймер в соответствии с раскрытием предпочтительно включает кодон нуклеиновой кислоты, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, или ее комплементарной цепи. Таким образом, в предпочтительном варианте осуществления в данном раскрытии предложены специфические в отношении изменения праймеры, которые более подробно определены выше и ниже по тексту.This disclosure also provides probes and primers. A probe or primer according to this disclosure has a nucleic acid sequence that specifically hybridizes to any of the nucleic acid molecules disclosed herein or a complementary strand thereof. In some embodiments, the probe or primer specifically hybridizes to any of the nucleic acid molecules disclosed herein under stringent conditions. This disclosure also provides nucleic acid molecules having nucleic acid sequences that hybridize under moderate conditions with any of the nucleic acid molecules disclosed herein or a complementary strand thereof. The probe or primer according to the disclosure preferably includes a nucleic acid codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, or a complementary strand thereof. Thus, in a preferred embodiment, this disclosure provides variation-specific primers, which are defined in more detail above and below.

Зонд в соответствии с данным раскрытием можно использовать для обнаружения молекулы нуклеиновой кислоты вариантного SIGIRR (например, геномной ДНК, мРНК и/или кДНК), кодирующей вариантный белок SIGIRR (например, в соответствии с SEQ ID NO:9). Кроме того, праймер в соответствии с данным раскрытием можно использовать для амплификации молекулы нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, или ее фрагмента. В данном раскрытии также предложена пара праймеров, содержащая один из праймеров, описанных выше. Для геномной амплификации методом полимеразной цепной реакции (ПЦР) фрагмента SIGIRR, содержащего вариант со сдвигом рамки, приводящий к усечению, подходящие последовательности праймеров включают, но не ограничиваются этим: прямой праймер (от 5' к 3'): TCAGTGGCTCTGAACTGCAC (SEQ ID NO:12) и обратный праймер (от 5' к 3'): GGTCCTGTTGAGCAGAGGAG (SEQ ID NO:13).A probe in accordance with this disclosure can be used to detect a variant SIGIRR nucleic acid molecule (eg, genomic DNA, mRNA and/or cDNA) encoding a variant SIGIRR protein ( eg , in accordance with SEQ ID NO:9). In addition, a primer in accordance with this disclosure can be used to amplify a nucleic acid molecule encoding a variant SIGIRR protein, or a fragment thereof. This disclosure also provides a primer pair comprising one of the primers described above. For genomic polymerase chain reaction (PCR) amplification of a SIGIRR fragment containing a truncating frameshift variant, suitable primer sequences include, but are not limited to: forward primer (5' to 3'): TCAGTGGCTCTGAACTGCAC (SEQ ID NO: 12) and reverse primer (5' to 3'): GGTCCTGTTGAGCAGAGGAG (SEQ ID NO:13).

Раскрытые в данном документе молекулы нуклеиновых кислот могут содержать встречающуюся в природе последовательность нуклеиновой кислоты геномной ДНК, кДНК или мРНК-транскрипта SIGIRR или могут содержать не встречающуюся в природе последовательность. В некоторых вариантах осуществления встречающаяся в природе последовательность может отличаться от не встречающейся в природе последовательности вследствие синонимичных мутаций или мутаций, которые не влияют на кодируемый полипептид SIGIRR. Например, последовательность может быть идентичной за исключением синонимичных мутаций или мутаций, которые не влияют на кодируемый полипептид SIGIRR. Синонимичная мутация или замена представляет собой замену одного нуклеотида другим в экзоне гена, кодирующего белок, так, что получаемая аминокислотная последовательность остается немодифицированной. Это возможно вследствие вырожденности генетического кода, когда некоторые аминокислоты кодируются более чем одним кодоном из трех пар оснований. Синонимичные замены используют, например, в процессе оптимизации кодонов. Раскрытые в данном документе молекулы нуклеиновых кислот могут быть кодон-оптимизированными.The nucleic acid molecules disclosed herein may contain a naturally occurring genomic DNA, cDNA, or SIGIRR mRNA transcript nucleic acid sequence, or may contain a non-naturally occurring sequence. In some embodiments, a naturally occurring sequence may differ from a non-naturally occurring sequence due to synonymous mutations or mutations that do not affect the encoded SIGIRR polypeptide. For example, the sequence may be identical except for synonymous mutations or mutations that do not affect the encoded SIGIRR polypeptide. A synonymous mutation or substitution is the replacement of one nucleotide with another in an exon of a protein-coding gene so that the resulting amino acid sequence remains unmodified. This is possible due to the degeneracy of the genetic code, when some amino acids are encoded by more than one codon of three base pairs. Synonymous substitutions are used, for example, in the process of codon optimization. The nucleic acid molecules disclosed herein may be codon optimized.

Также в данном документе предложены функциональные полинуклеотиды, которые могут взаимодействовать с раскрытыми молекулами нуклеиновых кислот. Функциональные полинуклеотиды представляют собой молекулы нуклеиновых кислот, которые имеют конкретную функцию, такую как связывание целевой молекулы или катализ конкретной реакции. Примеры функциональных полинуклеотидов включают, но не ограничиваются этим, антисмысловые молекулы, аптамеры, рибозимы, образующие тройную спираль молекулы и внешние направляющие последовательности. Функциональные полинуклеотиды могут действовать как эффекторы, ингибиторы, модуляторы и стимуляторы конкретной активности, которой обладает целевая молекула, или же функциональные полинуклеотиды могут обладать de novo активностью независимо от каких-либо других молекул.Also provided herein are functional polynucleotides that can interact with the disclosed nucleic acid molecules. Functional polynucleotides are nucleic acid molecules that have a specific function, such as binding a target molecule or catalyzing a specific reaction. Examples of functional polynucleotides include, but are not limited to, antisense molecules, aptamers, ribozymes, triple helix forming molecules and external guide sequences. Functional polynucleotides can act as effectors, inhibitors, modulators and stimulators of a particular activity possessed by the target molecule, or functional polynucleotides can have de novo activity independent of any other molecules.

Антисмысловые молекулы предназначены для взаимодействия с целевой молекулой нуклеиновой кислоты посредством канонического или неканонического спаривания оснований. Взаимодействие антисмысловой молекулы и целевой молекулы направлено на стимуляцию разрушения целевой молекулы посредством, например, опосредованной РНКазой-H деградации гибрида РНК-ДНК. В альтернативном варианте антисмысловая молекула предназначена для прерывания функции процессинга, который обычно имеет место в случае целевой молекулы, такого как транскрипция или репликация. Антисмысловые молекулы могут быть сконструированы на основании последовательности целевой молекулы. Существуют многочисленные способы оптимизации эффективности антисмысловых молекул путем идентификации наиболее доступных областей целевой молекулы. Типовые способы включают, но не ограничиваются этим, эксперименты по in vitro селекции и исследования модификации ДНК с применением ДМС и ДЭПК. В общем случае антисмысловые молекулы связывают целевую молекулу с константой диссоциации (kд), меньшей или равной около 10-6, меньшей или равной около 10-8, меньшей или равной около 10-10 или меньшей или равной около 10-12. Типовые примеры способов и методик, которые помогают при разработке и применении антисмысловых молекул, можно найти в следующем неограничивающем перечне патентов США: 5135917; 5294533; 5627158; 5641754; 5691317; 5780607; 5786138; 5849903; 5856103; 5919772; 5955590; 5990088; 5994320; 5998602; 6005095; 6007995; 6013522; 6017898; 6018042; 6025198; 6033910; 6040296; 6046004; 6046319; и 6057437. Примеры антисмысловых молекул включают, но не ограничиваются этим, антисмысловые РНК, малые интерферирующие РНК (миРНК) и короткие шпилечные РНК (кшРНК).Antisense molecules are designed to interact with a target nucleic acid molecule through canonical or non-canonical base pairing. The interaction of the antisense molecule and the target molecule is aimed at promoting the destruction of the target molecule through, for example, RNase-H-mediated degradation of the RNA-DNA hybrid. Alternatively, the antisense molecule is designed to interrupt a processing function that would normally occur with the target molecule, such as transcription or replication. Antisense molecules can be designed based on the sequence of the target molecule. There are numerous ways to optimize the effectiveness of antisense molecules by identifying the most accessible regions of the target molecule. Typical methods include, but are not limited to, in vitro selection experiments and DNA modification studies using DMS and DEPC. In general, antisense molecules bind the target molecule with a dissociation constant ( kd ) of less than or equal to about 10 -6 , less than or equal to about 10 -8 , less than or equal to about 10 -10 , or less than or equal to about 10 -12 . Typical examples of methods and techniques that assist in the development and use of antisense molecules can be found in the following non-limiting list of US patents: 5135917; 5294533; 5627158; 5641754; 5691317; 5780607; 5786138; 5849903; 5856103; 5919772; 5955590; 5990088; 5994320; 5998602; 6005095; 6007995; 6013522; 6017898; 6018042; 6025198; 6033910; 6040296; 6046004; 6046319; and 6,057,437. Examples of antisense molecules include, but are not limited to, antisense RNAs, small interfering RNAs (siRNAs), and short hairpin RNAs (shRNAs).

Раскрытые в данном документе выделенные молекулы нуклеиновых кислот могут включать РНК, ДНК или как РНК, так и ДНК. Выделенные молекулы нуклеиновых кислот также могут быть связаны или слиты с гетерологичной последовательностью нуклеиновой кислоты, такой как вектор, или гетерологичной меткой. Например, раскрытые в данном документе выделенные молекулы нуклеиновых кислот могут находиться в векторе или экзогенной донорной последовательности, содержащих выделенную молекулу нуклеиновой кислоты и гетерологичную последовательность нуклеиновой кислоты. Выделенные молекулы нуклеиновых кислот также могут быть связаны или слиты с гетерологичной меткой, такой как флуоресцентная метка. Другие примеры меток раскрыты в другом месте данного документа.The isolated nucleic acid molecules disclosed herein may include RNA, DNA, or both RNA and DNA. The isolated nucleic acid molecules can also be linked or fused to a heterologous nucleic acid sequence, such as a vector, or a heterologous tag. For example, the isolated nucleic acid molecules disclosed herein may be contained in a vector or exogenous donor sequence containing the isolated nucleic acid molecule and a heterologous nucleic acid sequence. The isolated nucleic acid molecules can also be associated or fused with a heterologous label, such as a fluorescent tag. Other examples of labels are disclosed elsewhere in this document.

Метка может быть пригодной для прямого обнаружения (например, флуорофор) или непрямого обнаружения (например, гаптен, фермент или гаситель флуорофоров). Такие метки можно обнаруживать спектроскопическими, фотохимическими, биохимическими, иммунохимическими или химическими способами. Такие метки включают, например, радиоактивные метки, измерения которых можно проводить с помощью устройств для измерения уровня радиации; пигменты, красители или другие хромогены, которые можно наблюдать визуально или измерять с помощью спектрофотометра; спиновые метки, измерения которых можно проводить с помощью анализатора спиновых меток; и флуоресцентные метки (например, флуорофоры), в случае которых выходной сигнал генерируется за счет возбуждения подходящего молекулярного аддукта и которые можно визуализировать путем возбуждения светом, который поглощается красителем, или можно измерить с помощью стандартных флуорометров или систем визуализации. Метка также может представлять собой, например, хемилюминесцентное вещество, в случае которого выходной сигнал генерируется химической модификацией сигнального соединения; металл-содержащее вещество; или фермент, в случае чего происходит фермент-зависимая вторичная генерация сигнала, такая как образование окрашенного продукта из бесцветного субстрата. Термин «метка» также может называться «тэгом» или гаптеном, которые могут избирательно связываться с конъюгированной молекулой так, чтобы использовать конъюгированную молекулу при последовательном добавлении наряду с субстратом для генерации обнаруживаемого сигнала. Например, в качестве тэга можно использовать биотин, а затем использовать авидиновый или стрептавидиновый конъюгат пероксидазы хрена (HRP) для связывания метки, а затем использовать калориметрический субстрат (например, тетраметилбензидин (ТМБ)) или флуорогенный субстрат для обнаружения присутствия HRP. Типовые метки, которые можно использовать в качестве тэгов для облегчения очистки, включают, но не ограничиваются этим, myc, HA, FLAG или 3XFLAG, 6XHis или полигистидин, глутатион-S-трансферазу (GST), мальтозосвязывающий белок, эпитопный тэг или Fc-часть иммуноглобулина. Многочисленные метки являются известными и включают, например, частицы, флуорофоры, гаптены, ферменты и их калориметрические, флуорогенные и хемилюминесцентные субстраты, а также другие метки.The label may be suitable for direct detection ( eg a fluorophore) or indirect detection ( eg a hapten, enzyme or fluorophore quencher). Such labels can be detected by spectroscopic, photochemical, biochemical, immunochemical or chemical methods. Such tags include, for example, radioactive tags, which can be measured using radiation measuring devices; pigments, dyes or other chromogens that can be observed visually or measured using a spectrophotometer; spin labels, which can be measured using a spin label analyzer; and fluorescent tags ( eg fluorophores), in which the output signal is generated by excitation of a suitable molecular adduct and which can be visualized by excitation with light that is absorbed by the dye, or can be measured using standard fluorometers or imaging systems. The label may also be, for example, a chemiluminescent substance, in which case the output signal is generated by chemical modification of the signal compound; metal-containing substance; or an enzyme, in which case enzyme-dependent secondary signal generation occurs, such as the formation of a colored product from a colorless substrate. The term “tag” may also be referred to as a “tag” or hapten, which can selectively bind to a conjugated molecule so as to utilize the conjugated molecule when added sequentially along with a substrate to generate a detectable signal. For example, biotin can be used as a tag, and then use an avidin or streptavidin conjugate of horseradish peroxidase (HRP) to bind the tag, and then use a calorimetric substrate ( e.g. , tetramethylbenzidine (TMB)) or a fluorogenic substrate to detect the presence of HRP. Typical tags that can be used as tags to facilitate purification include, but are not limited to, myc, HA, FLAG or 3XFLAG, 6XHis or polyhistidine, glutathione S-transferase (GST), maltose binding protein, epitope tag or Fc moiety immunoglobulin. Numerous labels are known and include, for example, particles, fluorophores, haptens, enzymes and their calorimetric, fluorogenic and chemiluminescent substrates, as well as other labels.

Раскрытые молекулы нуклеиновых кислот могут содержать, например, нуклеотиды или неприродные или модифицированные нуклеотиды, такие как нуклеотидные аналоги или нуклеотидные заместители. Такие нуклеотиды включают нуклеотид, который содержит модифицированное основание, сахар или фосфатную группу, или в структуру которого входит неприродное соединение. Примеры неприродных нуклеотидов включают, но не ограничиваются этим, дидезоксинуклеотиды, биотинилированные, аминированные, дезаминированные, алкилированные, бензилированные или меченные флуорофором нуклеотиды.The disclosed nucleic acid molecules may contain, for example, nucleotides or non-natural or modified nucleotides, such as nucleotide analogues or nucleotide substituents. Such nucleotides include a nucleotide that contains a modified base, sugar or phosphate group, or whose structure includes a non-natural compound. Examples of non-natural nucleotides include, but are not limited to, dideoxynucleotides, biotinylated, aminated, deaminated, alkylated, benzylated, or fluorophore-labeled nucleotides.

Раскрытые в данном документе молекулы нуклеиновых кислот также могут содержать один или более нуклеотидных аналогов или одну или более замен. Нуклеотидный аналог представляет собой нуклеотид, который содержит модификацию в любом из основного, сахарного или фосфатного фрагментов. Модификации в основном фрагменте включают, но не ограничиваются этим, природные и синтетические модификации A, C, G и T/U, а также разные пуриновые или пиримидиновые основания, такие как, например, псевдоуридин, урацил-5-ил, гипоксантин-9-ил (I) и 2-аминоаденин-9-ил. Модифицированные основания включают, но не ограничиваются этим, 5-метилцитозин. The nucleic acid molecules disclosed herein may also contain one or more nucleotide analogues or one or more substitutions. A nucleotide analog is a nucleotide that contains a modification in any of the base, sugar, or phosphate moieties. Modifications in the main fragment include, but are not limited to, natural and synthetic modifications A, C, G and T/U, as well as various purine or pyrimidine bases, such as, for example, pseudouridine, uracil-5-yl, hypoxanthine-9- yl (I) and 2-aminoadenin-9-yl. Modified bases include, but are not limited to, 5-methylcytosine.

(5-me-C), 5-гидроксиметилцитозин, ксантин, гипоксантин, 2-аминоаденин, 6-метил и другие алкильные производные аденина и гуанина, 2-пропил и другие алкильные производные аденина и гуанина, 2-тиоурацил, 2-тиотимин и 2-тиоцитозин, 5-галогенурацил и цитозин,(5-me-C), 5-hydroxymethylcytosine, xanthine, hypoxanthine, 2-aminoadenine, 6-methyl and other alkyl derivatives of adenine and guanine, 2-propyl and other alkyl derivatives of adenine and guanine, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halogenuracil and cytosine,

5-пропинилурацил и цитозин, 6-азоурацил, цитозин и тимин, 5-урацил (псевдоурацил),5-propynyluracil and cytosine, 6-azouracil, cytosine and thymine, 5-uracil (pseudouracil),

4-тиоурацил, 8-галоген, 8-амино, 8-тиол, 8-тиоалкил, 8-гидроксил и другие 8-замещенные аденины и гуанины, 5-галоген, в частности, 5-бром, 5-трифторметил и другие 5-замещенные урацилы и цитозины, 7-метилгуанин и 7-метиладенин, 8-азагуанин и 8-азааденин, 4-thiouracil, 8-halogen, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxyl and other 8-substituted adenines and guanines, 5-halogen, in particular 5-bromo, 5-trifluoromethyl and other 5- substituted uracils and cytosines, 7-methylguanine and 7-methyladenine, 8-azaguanine and 8-azaadenine,

7-деазагуанин и 7-деазааденин и 3-деазагуанин и 3-деазааденин. Определенные нуклеотидные аналоги, такие как, например, 5-замещенные пиримидины, 6-азапиримидины и N-2, N-6 и O-6 замещенные пурины, включая, но не ограничиваясь этим, 2-аминопропиладенин,7-deazaguanine and 7-deazaadenine and 3-deazaguanine and 3-deazaadenine. Certain nucleotide analogues, such as, for example, 5-substituted pyrimidines, 6-azapyrimidines and N-2, N-6 and O-6 substituted purines, including, but not limited to, 2-aminopropyladenine,

5-пропинилурацил, 5-пропинилцитозин и 5-метилцитозин могут повышать стабильность образования двойной спирали. Часто модификации основания можно комбинировать, например, с модификацией сахара, такой как 2'-O-метоксиэтил, для обеспечения уникальных свойств, таких как повышенная стабильность двойной спирали. 5-propynyluracil, 5-propynylcytosine and 5-methylcytosine can increase the stability of double helix formation. Often base modifications can be combined, for example with a sugar modification such as 2'-O-methoxyethyl, to provide unique properties such as increased double helix stability.

Нуклеотидные аналоги также могут включать модификации в сахарном фрагменте. Модификации в сахарном фрагменте включают, но не ограничиваются этим, природные модификации рибозы и дезоксирибозы, а также синтетические модификации. Сахарные модификации включают, но не ограничиваются этим, следующие модификации в 2' позиции: OH; F; O-, S- или N-алкил; O-, S- или N-алкенил; O-, S- или N-алкинил; или O-алкил-O-алкил, где алкил, алкенил, и алкинил могут представлять собой замещенный или незамещенный C1-10алкил или C2-10алкенил и C2-10алкинил. Типовые 2' сахарные модификации также включают, но не ограничиваются этим, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-ONH2 и -O(CH2)nON[(CH2)nCH3)]2, где n и m равны от 1 до около 10.Nucleotide analogues may also include modifications in the sugar moiety. Modifications to the sugar moiety include, but are not limited to, natural modifications of ribose and deoxyribose, as well as synthetic modifications. Sugar modifications include, but are not limited to, the following modifications at the 2' position: OH; F; O-, S- or N-alkyl; O-, S- or N-alkenyl; O-, S- or N-alkynyl; or O-alkyl-O-alkyl, wherein alkyl, alkenyl, and alkynyl may be substituted or unsubstituted C 1-10 alkyl or C 2-10 alkenyl and C 2-10 alkynyl. Typical 2' sugar modifications also include, but are not limited to, -O[(CH 2 ) n O] m CH 3 , -O(CH 2 ) n OCH 3 , -O(CH 2 ) n NH 2 , -O( CH 2 ) n CH 3 , -O(CH 2 ) n -ONH 2 and -O(CH 2 ) n ON[(CH 2 ) n CH 3 )] 2 , where n and m are from 1 to about 10.

Другие модификации в 2' позиции включают, но не ограничиваются этим, C1-10алкил, замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, РНК-расщепляющую группу, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида, и другие заместители, имеющие аналогичные свойства. Аналогичные модификации можно проводить в других позициях в сахаре, в частности, в 3' позиции сахара в 3' концевом нуклеотиде или в 2'-5' связанных олигонуклеотидах и в 5' позиции 5' концевого нуклеотиды. Модифицированные сахара также включают те, которые содержат модификации в соединительном кислороде кольца, например, CH2 и S. нуклеотидные сахарные аналоги также могут содержать сахарные миметики, такие как соединения циклобутила, на месте пентофуранозильного сахара.Other modifications at the 2' position include, but are not limited to, C 1-10 alkyl, substituted lower alkyl, alkaryl, aralkyl, O-alkaryl or O-aralkyl, SH, SCH 3 , OCN, Cl, Br, CN, CF 3 , OCF 3 , SOCH 3 , SO 2 CH 3 , ONO 2 , NO 2 , N 3 , NH 2 , heterocycloalkyl, heterocycloalkaryl, aminoalkylamino, polyalkylamino, substituted silyl, RNA cleaving group, reporter group, intercalator, group to improve pharmacokinetic properties oligonucleotide or a group to improve the pharmacodynamic properties of the oligonucleotide, and other substituents having similar properties. Similar modifications can be made at other positions in the sugar, in particular at the 3' position of the sugar in the 3' terminal nucleotide or in the 2'-5' linked oligonucleotides and at the 5' position of the 5' terminal nucleotide. Modified sugars also include those that contain modifications in the connecting oxygen of the ring, such as CH 2 and S. Nucleotide sugar analogues may also contain sugar mimetics, such as cyclobutyl compounds, in place of the pentofuranosyl sugar.

Нуклеотидные аналоги также могут быть модифицированы в фосфатном фрагменте. Модифицированные фосфатные фрагменты включают, но не ограничиваются этим, те, которые можно модифицировать так, чтобы связь между двумя нуклеотидами содержала тиофосфат, хиральный тиофосфат, дитиофосфат, фосфотриэфир, аминоалкилфосфотриэфир, метил- и другие алкильные фосфонаты, включая 3'-алкиленфосфонат и хиральные фосфонаты, фосфинаты, фосфорамидаты, включая 3'-аминофосфорамидат и аминоалкилфосфорамидаты, тионофосфорамидаты, тионоалкилфосфонаты, тионоалкилфосфотриэфиры и боранофосфаты. Эта фосфатная или модифицированная фосфатная связь между двумя нуклеотидами может быть обусловлена 3'-5' связью или 2'-5' связью и может включать инвертированную полярность, такую как от 3'-5' к 5'-3' или от 2'-5' к 5'-2'. Также включены различные формы солей, смешанных солей и свободных кислот.Nucleotide analogues can also be modified in the phosphate moiety. Modified phosphate moieties include, but are not limited to, those that can be modified so that the linkage between two nucleotides contains a thiophosphate, chiral thiophosphate, dithiophosphate, phosphotriester, aminoalkyl phosphotriester, methyl and other alkyl phosphonates, including 3'-alkylene phosphonate and chiral phosphonates, phosphinates, phosphoramidates, including 3'-aminophosphoramidate and aminoalkylphosphoramidates, thionophosphoramidates, thionoalkylphosphonates, thionoalkylphosphorotriesters and boranophosphates. This phosphate or modified phosphate bond between two nucleotides may be due to a 3'-5' bond or a 2'-5' bond and may involve inverted polarity such as from 3'-5' to 5'-3' or from 2'- 5' to 5'-2'. Also included are various forms of salts, mixed salts and free acids.

Нуклеотидные замены включают молекулы, имеющие аналогичные функциональные свойства с нуклеотидами, но которые не содержат фосфатный фрагмент, такие как пептидная нуклеиновая кислота (ПНК). Нуклеотидные заменители включают молекулы, которые распознают нуклеиновые кислоты Уотсон-Криковским или Хугстеновским образом, но которые связаны друг с другом посредством фрагмента, отличного от фосфатного фрагмента. Нуклеотидные заменители способны принимать конформацию структуры типа двойной спирали при взаимодействии с соответствующей целевой нуклеиновой кислотой.Nucleotide substitutions include molecules that have similar functional properties to nucleotides, but which do not contain a phosphate moiety, such as peptide nucleic acid (PNA). Nucleotide surrogates include molecules that recognize nucleic acids in a Watson-Crick or Hoogsten manner, but which are linked to each other through a moiety other than a phosphate moiety. Nucleotide substitutes are capable of adopting a double helix structure when interacting with the corresponding target nucleic acid.

Нуклеотидные заменители также включают нуклеотиды и нуклеотидные аналоги с замещенными фосфатными фрагментами или сахарными фрагментами. В некоторых вариантах осуществления нуклеотидные заменители могут не содержать стандартный атом фосфора. Заменителями фосфата могут быть, например, межнуклеозидные связи на основе короткоцепочечного алкила или циклоалкила, межнуклеозидные связи на основе сложного гетероатома и алкила или циклоалкила или одна или более короткоцепочечных гетероатомных или гетероциклических межнуклеозидных связей. Они включают компоненты, имеющие морфолино-связи (частично образованные из сахарной части нуклеозида); силоксановые остовы; сульфидные, сульфоксидные и сульфоновые остовы; формацетильные и тиоформацетильные остовы; метилен-формацетильные и тиоформацетильные остовы; алкен-содержащие остовы; сульфаматные остовы; метиленимино- и метиленгидразино-остовы; сульфонатные и сульфонамидные остовы; амидные остовы; и другие, имеющие смешанные N-, O-, S- и CH2-составляющие.Nucleotide substitutes also include nucleotides and nucleotide analogues with substituted phosphate moieties or sugar moieties. In some embodiments, the nucleotide replacements may not contain a standard phosphorus atom. The phosphate substitutes may be, for example, short-chain alkyl or cycloalkyl internucleoside linkages, complex heteroatom-alkyl or cycloalkyl internucleoside linkages, or one or more short-chain heteroatom or heterocyclic internucleoside linkages. They include components having morpholino bonds (derived in part from the sugar moiety of the nucleoside); siloxane backbones; sulfide, sulfoxide and sulfone skeletons; formacetyl and thioformacetyl backbones; methylene-formacetyl and thioformacetyl backbones; alkene-containing backbones; sulfamate backbones; methylene imino and methylene hydrazine backbones; sulfonate and sulfonamide backbones; amide backbones; and others having mixed N-, O-, S- and CH 2 components.

Также следует понимать, что в нуклеотидном заменителе как сахарный, так и фосфатный компоненты нуклеотида могут быть замещены, например, связью амидного типа (аминоэтилглицин) (ПНК). It should also be understood that in a nucleotide substitute, both the sugar and phosphate components of the nucleotide can be replaced, for example, by an amide-type (aminoethylglycine) (PNA) bond.

Также возможна связь других типов молекул (конъюгаты) с нуклеотидами или нуклеотидными аналогами для повышения, например, клеточного поглощения. Конъюгаты могут быть химически связаны с нуклеотидами или нуклеотидными аналогами. Такие конъюгаты включают, например, липидные фрагменты, такие как холестериновый фрагмент, холевую кислоту, тиоэфир, такой как гексил-S-тритилтиол, тиохолестерин, алифатическую цепь, такую как остатки додекандиола или ундецила, фосфолипид, такой как дигексадецил-рац-глицерин или триэтиламмоний 1,2-ди-O-гексадецил-рац-глицеро-3-H-фосфонат, цепь полиамина или полиэтиленгликоля, адамантан-уксусную кислоту, пальмитиловый фрагмент или фрагмент октадециламина или гексиламинокарбонилоксихолестерина. It is also possible to link other types of molecules (conjugates) with nucleotides or nucleotide analogues to enhance, for example, cellular uptake. Conjugates can be chemically linked to nucleotides or nucleotide analogues. Such conjugates include, for example, lipid moieties such as a cholesterol moiety, cholic acid, a thioester such as hexyl-S-tritylthiol, thiocholesterol, an aliphatic chain such as dodecanediol or undecyl units, a phospholipid such as dihexadecyl-rac-glycerol or triethylammonium 1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate, polyamine or polyethylene glycol chain, adamantane acetic acid, palmityl moiety or octadecylamine moiety or hexylaminocarbonyloxycholesterol.

В данном раскрытии также предложены векторы, содержащие любую одну или более из молекул нуклеиновых кислот, раскрытых в данном документе. В некоторых вариантах осуществления векторы содержат одну или более из молекул нуклеиновых кислот, раскрытых в данном документе, и гетерологичную нуклеиновую кислоту. Векторы могут быть вирусными или невирусными векторами, способными переносить молекулу нуклеиновой кислоты. В некоторых вариантах осуществления вектор представляет собой плазмиду или космиду (например, кольцевую двух цепочечную ДНК, в которую могут быть лигированы дополнительные сегменты ДНК). В некоторых вариантах осуществления вектор представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном. В некоторых вариантах осуществления вектор может автономно реплицироваться в клетке-хозяине, в которую он внесен (например, бактериальные векторы, имеющие бактериальную точку начала репликации, и эписомальные векторы млекопитающих). В некоторых вариантах осуществления вектор (например, не-эписомальные векторы млекопитающих) может интегрироваться в геном клетки-хозяина после внесения в клетку-хозяина и, таким образом, реплицироваться вместе с геномом хозяина. Кроме того, конкретные векторы могут управлять экспрессией генов, с которыми они функционально связаны. Такие векторы называются в данном документе «рекомбинантными экспрессионными векторами» или «экспрессионными векторами». Такие векторы также могут быть нацеливающими векторами (т. е. экзогенными донорными последовательностями).This disclosure also provides vectors containing any one or more of the nucleic acid molecules disclosed herein. In some embodiments, the vectors contain one or more of the nucleic acid molecules disclosed herein and a heterologous nucleic acid. Vectors may be viral or non-viral vectors capable of carrying a nucleic acid molecule. In some embodiments, the vector is a plasmid or cosmid ( eg , circular double-stranded DNA into which additional DNA segments can be ligated). In some embodiments, the vector is a viral vector in which additional DNA segments can be ligated into the viral genome. In some embodiments, the vector can autonomously replicate in the host cell into which it is introduced ( eg , bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). In some embodiments, the vector ( eg , mammalian non-episomal vectors) may be integrated into the genome of a host cell upon entry into the host cell and thereby replicate along with the host genome. In addition, specific vectors can control the expression of genes to which they are functionally linked. Such vectors are referred to herein as “recombinant expression vectors” or “expression vectors”. Such vectors may also be targeting vectors (ie, exogenous donor sequences).

В некоторых вариантах осуществления раскрытые в данном документе белки, кодируемые различными генетическими вариантами, экспрессируют посредством вставки молекул нуклеиновых кислот, кодирующих раскрытые генетические варианты, в экспрессионные векторы так, чтобы гены были функционально связаны с последовательностями регуляции экспрессии, такими как последовательности регуляции транскрипции и трансляции. Экспрессионные векторы включают, но не ограничиваются этим, плазмиды, космиды, ретровирусы, аденовирусы, аденоассоциированные вирусы (ААВ), растительные вирусы, такие как вирус мозаики цветной капусты и вирус табачной мозаики, дрожжевые искусственные хромосомы (ДИХ), эписомы вируса Эпштейна-Барр (ВЭБ) и другие экспрессионные векторы, известные в данной области техники. В некоторых вариантах осуществления молекулы нуклеиновых кислот, содержащие раскрытые генетические варианты, могут быть лигированы в вектор так, чтобы последовательности регуляции транскрипции и трансляции в векторах выполняли свою предусмотренную функцию регуляции транскрипции и трансляции генетического варианта. Экспрессионный вектор и последовательности регуляции экспрессии выбирают так, чтобы они были совместимыми с используемой для экспрессии клеткой-хозяином. Последовательности нуклеиновых кислот, содержащие раскрытые генетические варианты, могут быть вставлены в отдельные векторы или в один экспрессионный вектор в качестве вариантной генетической информации. Последовательность нуклеиновой кислоты, содержащую раскрытые генетические варианты, можно вставлять в экспрессионный вектор стандартными способами (например, лигирования комплементраных рестрикционных сайтов в нуклеиновой кислоте, содержащей раскрытые генетические варианты, и вектора, или лигирование тупых концов, в случае отсутствия рестрикционных сайтов).In some embodiments, proteins encoded by various genetic variants disclosed herein are expressed by inserting nucleic acid molecules encoding the disclosed genetic variants into expression vectors such that the genes are operably linked to expression control sequences, such as transcriptional and translational control sequences. Expression vectors include, but are not limited to, plasmids, cosmids, retroviruses, adenoviruses, adeno-associated viruses (AAV), plant viruses such as cauliflower mosaic virus and tobacco mosaic virus, yeast artificial chromosomes (YAC), Epstein-Barr virus episomes ( EBV) and other expression vectors known in the art. In some embodiments, nucleic acid molecules containing the disclosed genetic variants can be ligated into a vector such that the transcriptional and translational control sequences in the vectors perform their intended function of regulating the transcription and translation of the genetic variant. The expression vector and expression control sequences are selected to be compatible with the host cell used for expression. Nucleic acid sequences containing the disclosed genetic variants can be inserted into separate vectors or into a single expression vector as variant genetic information. The nucleic acid sequence containing the disclosed genetic variants can be inserted into an expression vector by standard methods ( for example , ligation of complementary restriction sites in the nucleic acid containing the disclosed genetic variants and the vector, or blunt-end ligation in the case of no restriction sites).

Кроме последовательности нуклеиновой кислоты, содержащей раскрытые генетические варианты, рекомбинантные экспрессионные векторы могут нести регуляторные последовательности, которые управляют экспрессией генетического варианта в клетке-хозяине. Конструкция экспрессионного вектора, включая выбор регуляторных последовательностей, может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, необходимый уровень экспрессии белка и т. д. Необходимые регуляторные последовательности для экспрессии в клетках-хозяевах млекопитающих могут включать, например, вирусные элементы, которые обеспечивают высокие уровни экспрессии белка в клетках млекопитающих, такие как промоторы и/или энхансеры, полученные из ретровирусных ДКП, цитомегаловируса (CMV) (такие как промотор/энхансер CMV), вируса обезьян 40 (SV40) (такие как промотор/энхансер SV40), аденовируса, (например, главный поздний промотор аденовируса (AdMLP)), полиомы, и сильные промоторы млекопитающих, такие как промоторы нативного иммуноглобулина и актина. Также хорошо известны способы экспрессии полипептидов в бактериальных клетках или грибных клетках (например, дрожжевых клетках).In addition to the nucleic acid sequence containing the disclosed genetic variants, recombinant expression vectors may carry regulatory sequences that direct expression of the genetic variant in a host cell. The design of the expression vector, including the choice of regulatory sequences, may depend on factors such as the choice of host cell to be transformed, the desired level of protein expression, etc. The necessary regulatory sequences for expression in mammalian host cells may include, for example, viral elements that mediate high levels of protein expression in mammalian cells, such as promoters and/or enhancers derived from retroviral LTRs, cytomegalovirus (CMV) (such as the CMV promoter/enhancer), simian virus 40 (SV40) (such as the SV40 promoter/enhancer ), adenovirus, ( eg adenovirus major late promoter (AdMLP)), polyomas, and strong mammalian promoters such as native immunoglobulin and actin promoters. Methods for expressing polypeptides in bacterial cells or fungal cells ( eg yeast cells) are also well known.

Промотор может быть, например, конститутивно активным промотором, кондициональным промотором, индуцибельным промотором, временно-ограниченным промотором (например, регулируемым развитием промотором) или пространственно-ограниченным промотором (например, клеточноспецифическим или тканеспецифическим промотором). Примеры промоторов можно найти, например, в WO 2013/176772.The promoter may be, for example, a constitutively active promoter, a conditional promoter, an inducible promoter, a temporally restricted promoter ( eg , a developmentally regulated promoter), or a spatially restricted promoter ( eg , a cell-specific or tissue-specific promoter). Examples of promoters can be found, for example, in WO 2013/176772.

Примеры индуцибельных промоторов включают, например, химически регулируемые промоторы и физически регулируемые промоторы. Химически регулируемые промоторы включают, например, регулируемые спиртами промоторы (например, промотор гена алкогольдегидрогеназы (alcA)), тетрациклин-регулируемые промоторы (например, тетрациклин-чувствительный промотор, последовательность оператора тетрациклина (tetO), промотор tet-On или промотор tet-Off), регулируемые стероидами промоторы (например, крысиный глюкокортикоидный рецептор, промотор эстрогенового рецептора или промотор экдизонового рецептора) или металл-регулируемые промоторы (например, промотор металлопротеина). Физически регулируемые промоторы включают, например, температурно-регулируемые промоторы (например, промотор теплового шока) и свето-регулируемые промоторы (например, свето-индуцибельный промотор или свето-репрессируемый промотор).Examples of inducible promoters include, for example, chemically regulated promoters and physically regulated promoters. Chemically regulated promoters include, for example, alcohol-regulated promoters ( e.g. , alcohol dehydrogenase (alcA) gene promoter), tetracycline-regulated promoters ( e.g. , tetracycline-responsive promoter, tetracycline operator sequence (tetO), tet-On promoter, or tet-Off promoter) , steroid-regulated promoters ( eg , rat glucocorticoid receptor, estrogen receptor promoter, or ecdysone receptor promoter) or metal-regulated promoters ( eg , metalloprotein promoter). Physically regulated promoters include, for example, temperature-regulated promoters ( eg , heat shock promoter) and light-regulated promoters ( eg , light-inducible promoter or light-repressible promoter).

Тканеспецифические промоторы могут представлять собой, например, нейрон-специфические промоторы, глия-специфические промоторы, клеточноспецифические промоторы мышц, клеточноспецифические промоторы сердца, клеточноспецифические промоторы почек, клеточноспецифические промоторы костной ткани, клеточноспецифические промоторы эндотелия или иммунные клеточноспецифические промоторы (например, B-клеточный промотор или T-клеточный промотор).Tissue-specific promoters may be, for example, neuron-specific promoters, glia-specific promoters, muscle cell-specific promoters, cardiac cell-specific promoters, kidney cell-specific promoters, bone cell-specific promoters, endothelial cell-specific promoters, or immune cell-specific promoters ( e.g. , B-cell promoter or T cell promoter).

Регулируемые развитием промоторы включают, например, промоторы, активные только в течение эмбриональной стадии развития или только во взрослой клетке.Developmentally regulated promoters include, for example, promoters that are active only during the embryonic stage of development or only in the adult cell.

Кроме последовательности нуклеиновой кислоты, содержащей раскрытые генетические варианты и регуляторные последовательности, рекомбинантные экспрессионные векторы могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селективных маркеров. Ген селективного маркера может облегчать отбор клеток-хозяев, в которые был внесен вектор (смотрите, например, патенты США 4399216; 4634665; и 5179017). Например, ген селективного маркера может придавать устойчивость к лекарственным препаратам, таким как G418, гигромицин или метотрексат, клетке-хозяину, в которую был внесен вектор. Типовые гены селективных маркеров включают, но не ограничиваются этим, ген дигидрофолатредуктазы (DHFR) (для применения в dhfr-клетках-хозяевах с отбором по метотрексату/амплификацией), ген neo (для отбора по G418) и ген глутаматсинтетазы (GS).In addition to the nucleic acid sequence containing disclosed genetic variants and regulatory sequences, recombinant expression vectors may carry additional sequences, such as sequences that regulate the replication of the vector in host cells ( eg , origins of replication) and selectable marker genes. The selectable marker gene may facilitate selection of host cells into which the vector has been introduced ( see, for example , US Pat. Nos. 4,399,216; 4,634,665; and 5,179,017). For example, a selectable marker gene may confer resistance to drugs, such as G418, hygromycin, or methotrexate, to the host cell into which the vector has been introduced. Exemplary selectable marker genes include, but are not limited to, the dihydrofolate reductase (DHFR) gene (for use in dhfr host cells with methotrexate selection/amplification), the neo gene (for G418 selection), and the glutamate synthetase (GS) gene.

Дополнительные векторы описаны, например, в предварительной заявке США № 62/367973, поданной 28 июля 2016 г., которая в полном объеме включена в данный документ посредством ссылки.Additional vectors are described, for example, in US Provisional Application No. 62/367973, filed July 28, 2016, which is incorporated herein by reference in its entirety.

В данном раскрытии также предложены композиции, содержащие любую одну или более из выделенных молекул нуклеиновых кислот, молекул геномной ДНК, молекул кДНК или молекул мРНК, раскрытых в данном документе. В некоторых вариантах осуществления композиция представляет собой фармацевтическую композицию.This disclosure also provides compositions containing any one or more of the isolated nucleic acid molecules, genomic DNA molecules, cDNA molecules, or mRNA molecules disclosed herein. In some embodiments, the composition is a pharmaceutical composition.

В данном раскрытии также предложены вариантные полипептиды SIGIRR. В некоторых вариантах осуществления вариантный полипептид SIGIRR является усеченным. В некоторых вариантах осуществления вариантный полипептид SIGIRR является усеченным в позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления вариантный полипептид SIGIRR усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления вариантный полипептид SIGIRR усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит некоторое количество аминокислот в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления вариантный полипептид SIGIRR усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления вариантный полипептид SIGIRR имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с аминокислотной последовательностью в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления вариантный полипептид SIGIRR содержит или состоит из аминокислотной последовательности в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления усеченный белок SIGIRR содержит или состоит из аминокислотной последовательности SEQ ID NO:9 или аминокислотной последовательности, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides variant SIGIRR polypeptides. In some embodiments, the SIGIRR variant polypeptide is truncated. In some embodiments, the SIGIRR variant polypeptide is truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the SIGIRR variant polypeptide is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and contains a serine at position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the SIGIRR variant polypeptide is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and contains a number of amino acids at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. In some embodiments, the SIGIRR variant polypeptide is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and contains the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the variant SIGIRR polypeptide has at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity with the amino acid sequence according to SEQ ID NO:9. In some embodiments, the SIGIRR variant polypeptide contains or consists of an amino acid sequence according to SEQ ID NO:9. In some embodiments, the truncated SIGIRR protein contains or consists of an amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9, and contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9.

В данном раскрытии также предложены фрагменты любых из полипептидов, раскрытых в данном документе. В некоторых вариантах осуществления фрагменты содержат по меньшей мере около 10, по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 55, по меньшей мере около 60, по меньшей мере около 65, по меньшей мере около 70, по меньшей мере около 75, по меньшей мере около 80, по меньшей мере около 85, по меньшей мере около 90, по меньшей мере около 95, по меньшей мере около 100, по меньшей мере около 150 или по меньшей мере около 200 смежных аминокислотных остатков кодируемого полипептида (такого как полипептиды, имеющие аминокислотную последовательность SEQ ID NO:9). В этом отношении более длинные фрагменты предпочтительнее более коротких. В некоторых вариантах осуществления фрагменты содержат по меньшей мере около 10, по меньшей мере около 15, по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 55, по меньшей мере около 60, по меньшей мере около 65, по меньшей мере около 70, по меньшей мере около 75, по меньшей мере около 80, по меньшей мере около 85, по меньшей мере около 90, по меньшей мере около 95 или по меньшей мере около 100 смежных аминокислотных остатков кодируемого полипептида. В этом отношении более длинные фрагменты предпочтительнее более коротких.This disclosure also provides fragments of any of the polypeptides disclosed herein. In some embodiments, the fragments comprise at least about 10, at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least at least about 45, at least about 50, at least about 55, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, at least about 90, at least about 95, at least about 100, at least about 150, or at least about 200 contiguous amino acid residues of the encoded polypeptide (such as polypeptides having the amino acid sequence of SEQ ID NO:9) . In this regard, longer fragments are preferable to shorter ones. In some embodiments, the fragments comprise at least about 10, at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least at least about 45, at least about 50, at least about 55, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, at least about 90, at least about 95, or at least about 100 contiguous amino acid residues of the encoded polypeptide. In this regard, longer fragments are preferable to shorter ones.

В данном раскрытии также предложены димеры, содержащие выделенный полипептид, содержащий вариантный полипептид SIGIRR, причем полипептид выбран из любых полипептидов, раскрытых в данном документе.This disclosure also provides dimers comprising an isolated polypeptide comprising a variant SIGIRR polypeptide, the polypeptide being selected from any of the polypeptides disclosed herein.

В некоторых вариантах осуществления раскрытые в данном документе выделенные полипептиды связаны или слиты с гетерологичными полипептидами или гетерологичными молекулами или метками, многочисленные примеры которых раскрыты в другом месте данного документа. Например, белки могут быть слиты с гетерологичным полипептидом, обеспечивающим повышение или снижение стабильности. Слитый домен гетерологичного полипептида может располагаться в N-конце, C-конце или внутри полипептида. Партнер по слиянию может, например, способствовать обеспечению Т-хелперных эпитопов (иммунологический партнер по слиянию) или может способствовать экспрессии белка (энхансер экспрессии) с более высоким выходом, чем в случае нативного рекомбинантного полипептида. Определенные партнеры по слиянию являются как иммунологическими, так и усиливающими экспрессию партнерами по слиянию. Другие партнеры по слиянию могут быть выбраны для повышения растворимости полипептида или для облегчения нацеливания полипептида не необходимые внутриклеточные компартменты. Некоторые партнеры по слиянию включают аффинные тэги, которые облегчают очистку полипептида.In some embodiments, isolated polypeptides disclosed herein are linked or fused to heterologous polypeptides or heterologous molecules or tags, numerous examples of which are disclosed elsewhere herein. For example, proteins can be fused to a heterologous polypeptide to provide increased or decreased stability. The fusion domain of a heterologous polypeptide may be located at the N-terminus, C-terminus, or within the polypeptide. The fusion partner may, for example, help provide T helper epitopes (immunological fusion partner) or may promote expression of the protein (expression enhancer) at a higher yield than the native recombinant polypeptide. Certain fusion partners are both immunological and expression enhancing fusion partners. Other fusion partners may be selected to increase the solubility of the polypeptide or to facilitate targeting of the polypeptide to unnecessary intracellular compartments. Some fusion partners include affinity tags that facilitate purification of the polypeptide.

В некоторых вариантах осуществления слитый белок напрямую слит с гетерологичной молекулой или слит с гетерологичной молекулой посредством линкера, такого как пептидный линкер. Подходящие последовательности пептидных линкеров можно выбирать, например, на основании следующих факторов: 1) способность принимать гибкую удлиненную конформацию; 2) устойчивость к образованию вторичной структуры, которая могла бы взаимодействовать с функциональными эпитопами на первом и втором полипептидах; и 3) отсутствие гидрофобных или заряженных остатков, которые могут вступать в реакцию с функциональными эпитопами полипептида. Например, последовательности пептидных линкеров могут содержать остатки Gly, Asn и Ser. Другие нейтральные аминокислоты, такие как Thr и Ala, также можно использовать в линкерной последовательности. Аминокислотные последовательности, которые можно применять в качестве линкеров, включают, например, раскрытые в, Maratea et al., Gene, 1985, 40, 39-46; Murphy et al., Proc. Natl. Acad. Sci. USA, 1986, 83, 8258-8262; и патентах США 4935233 и 4751180. Длина линкерной последовательности в общем случае может составлять, например, от 1 до около 50 аминокислот. Линкерные последовательности в общем случае не нужны, когда первый и второй полипептиды имеют области из заменимых N-концевых аминокислот, которые можно использовать для разделения функциональных доменов и предотвращения стерического влияния.In some embodiments, the fusion protein is directly fused to a heterologous molecule or fused to a heterologous molecule through a linker, such as a peptide linker. Suitable peptide linker sequences can be selected, for example, based on the following factors: 1) ability to adopt a flexible elongated conformation; 2) resistance to the formation of a secondary structure that could interact with functional epitopes on the first and second polypeptides; and 3) the absence of hydrophobic or charged residues that can react with functional epitopes of the polypeptide. For example, peptide linker sequences may contain Gly, Asn and Ser residues. Other neutral amino acids such as Thr and Ala can also be used in the linker sequence. Amino acid sequences that can be used as linkers include, for example, those disclosed in Maratea et al. , Gene , 1985, 40, 39-46; Murphy et al. , Proc. Natl. Acad. Sci. USA , 1986, 83, 8258-8262; and US Patents 4,935,233 and 4,751,180. The length of the linker sequence can generally be, for example, from 1 to about 50 amino acids. Linker sequences are generally not needed when the first and second polypeptides have regions of non-essential N-terminal amino acids that can be used to separate functional domains and avoid steric interference.

В некоторых вариантах осуществления полипептиды функционально связаны с доменом проникновения в клетки. Например, домен проникновения в клетки может быть получен из белка TAT ВИЧ-1, TLM-мотива проникновения в клетки из вируса гепатита B человека, MPG, Pep-1, VP22, пептида проникновения в клетки из вируса простого герпеса или последовательности пептида полиаргинина. Смотрите, например, WO 2014/089290. Домен проникновения в клетки может располагаться в N-конце, C-конце или в любом месте внутри белка.In some embodiments, the polypeptides are operably linked to a cell entry domain. For example, the cell entry domain may be derived from the HIV-1 TAT protein, the TLM cell entry motif from human hepatitis B virus, MPG, Pep-1, VP22, the cell entry peptide from herpes simplex virus, or a polyarginine peptide sequence. See for example WO 2014/089290. The cell entry domain can be located at the N-terminus, C-terminus, or anywhere within the protein.

В некоторых вариантах осуществления полипептиды функционально связаны с гетерологичным полипептидом для облегчения отслеживания или очистки, таким как флуоресцентный белок, тэг очистки или эпитопный тэг. Примеры флуоресцентных белков включают, но не ограничиваются этим, зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), синие флуоресцентные белки (например, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), голубые флуоресцентные белки (например, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), красные флуоресцентные белки (например, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) и любой другой подходящий флуоресцентный белок. Примеры тэгов включают, но не ограничиваются этим, глутатион-S-трансферазу (GST), хитин-связывающий белок (CBP), мальтозосвязывающий белок, тиоредоксин (TRX), поли(NANP), тэг тандемной аффинной очистки (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, гемагглютинин (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, гистидин (His), белок-носитель биотина и карбоксила (BCCP) и кальмодулин. В некоторых вариантах осуществления гетерологичная молекула представляет собой Fc-домен иммуноглобулина, пептидный тэг, домен трансдукции, поли(этиленгликоль), полисиаловую кислоту или гликолевую кислоту.In some embodiments, the polypeptides are operably linked to a heterologous polypeptide to facilitate tracking or purification, such as a fluorescent protein, purification tag, or epitope tag. Examples of fluorescent proteins include, but are not limited to, green fluorescent proteins ( e.g. GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreenl), yellow fluorescent proteins ( e.g. YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), blue fluorescent proteins ( e.g. eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), blue fluorescent proteins ( e.g. eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), red fluorescent proteins ( for example , mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), orange fluorescent proteins ( eg mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) and any other suitable fluorescent protein. Examples of tags include, but are not limited to, glutathione S-transferase (GST), chitin binding protein (CBP), maltose binding protein, thioredoxin (TRX), poly(NANP), tandem affinity purification (TAP) tag, myc, AcV5 , AU1, AU5, E, ECS, E2, FLAG, hemagglutinin (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, histidine (His), biotin and carboxyl carrier protein (BCCP) and calmodulin. In some embodiments, the heterologous molecule is an immunoglobulin Fc domain, a peptide tag, a transduction domain, a poly(ethylene glycol), a polysialic acid, or a glycolic acid.

В некоторых вариантах осуществления выделенные полипептиды содержат неприродные или модифицированные аминокислоты или пептидные аналоги. Например, существуют многочисленные D-аминокислоты или аминокислоты, которые имеют отличный функциональный заместитель от аминокислот, встречающихся в природе. Раскрыты противоположные стереоизомеры встречающихся в природе пептидов, а также стереоизомеры пептидных аналогов. Эти аминокислоты легко могут быть включены в полипептидные цепи путем заряжения молекул тРНК выбранной аминокислотой и конструирования генетических конструкций, в которых используются, например, амбер-кодоны, для вставки аналога аминокислоты в пептидную цепь сайт-специфическим образом. In some embodiments, the isolated polypeptides contain unnatural or modified amino acids or peptide analogs. For example, there are numerous D-amino acids or amino acids that have a different functional substituent from naturally occurring amino acids. Opposite stereoisomers of naturally occurring peptides, as well as stereoisomers of peptide analogues, are disclosed. These amino acids can easily be incorporated into polypeptide chains by charging tRNA molecules with the amino acid of choice and designing genetic constructs that use, for example, amber codons to insert the amino acid analogue into the peptide chain in a site-specific manner.

В некоторых вариантах осуществления выделенные полипептиды представляют собой пептидные миметики, которые могут быть созданы так, чтобы напоминать пептиды, но которые не соединены посредством природной пептидной связи. Например, связи для аминокислот и аминокислотных аналогов включают, но не ограничиваются этим, -CH2NH-, -CH2S-, -CH2-, -CH=CH- (цис и транс), -COCH2-, -CH(OH)CH2- и -CHH2SO-. Пептидные аналоги могут иметь более одного атома между атомами связи, такие как бета-аланин, гамма-аминомасляная кислота и т.п. Аминокислотные аналоги и пептидные аналоги часто имеют усиленные или необходимые свойства, такие как более экономное производство, большая химическая стабильность, усиленные фармакокинетические свойства (время полужизни, всасывание, действие, эффективности и т.д.), измененная специфичность (например, биологическая активность широкого спектра), сниженная антигенность и другие необходимые свойства.In some embodiments, the isolated polypeptides are peptide mimetics, which can be designed to resemble peptides but which are not linked through a natural peptide bond. For example, bonds for amino acids and amino acid analogues include, but are not limited to, -CH 2 NH-, -CH 2 S-, -CH 2 -, -CH=CH- (cis and trans), -COCH 2 -, -CH (OH)CH 2 - and -CHH 2 SO-. Peptide analogues may have more than one atom between bonding atoms, such as beta-alanine, gamma-aminobutyric acid, and the like. Amino acid analogues and peptide analogues often have enhanced or desirable properties, such as more economical production, greater chemical stability, enhanced pharmacokinetic properties (half-life, absorption, potency, potency, etc.), altered specificity ( e.g. broad-spectrum biological activity ), reduced antigenicity and other necessary properties.

В некоторых вариантах осуществления выделенные полипептиды содержат D-аминокислоты, которые можно использовать для создания более стабильных пептидов, поскольку D-аминокислоты не распознаются пептидазами. Систематическую замену одной или более аминокислот консенсусной последовательности D-аминокислотой того же типа (например, D-лизин вместо L-лизина) можно использовать для создания более стабильных пептидов. Остатки цистеина можно использовать для циклизации или соединения двух или более пептидов вместе. Это может быть целесообразно при ограничении пептидов конкретными конформациями (смотрите, например, Rizo and Gierasch, Ann. Rev. Biochem., 1992, 61, 387).In some embodiments, the isolated polypeptides contain D-amino acids, which can be used to create more stable peptides since D-amino acids are not recognized by peptidases. Systematic replacement of one or more amino acids of the consensus sequence with a D-amino acid of the same type ( e.g. D-lysine instead of L-lysine) can be used to create more stable peptides. Cysteine residues can be used to cyclize or link two or more peptides together. This may be useful when restricting peptides to specific conformations ( see, for example , Rizo and Gierasch, Ann. Rev. Biochem ., 1992, 61, 387).

В данном раскрытии также предложены молекулы нуклеиновых кислот, кодирующие любые из полипептидов, раскрытых в данном документе. Это включает все вырожденные последовательности, связанные с конкретной полипептидной последовательностью (все нуклеиновые кислоты, имеющие последовательность, которая кодирует одну конкретную полипептидную последовательность, а также нуклеиновые кислоты, включая вырожденные нуклеиновые кислоты, кодирующие раскрытые варианты и производные белковых последовательностей). Таким образом, хотя конкретная последовательность нуклеиновой кислоты может не быть выписана в данном документе, по факту каждая последовательность раскрыта и описана в данном документе посредством раскрытых полипептидных последовательностей.This disclosure also provides nucleic acid molecules encoding any of the polypeptides disclosed herein. This includes all degenerate sequences associated with a particular polypeptide sequence (all nucleic acids having a sequence that encodes one particular polypeptide sequence, as well as nucleic acids, including degenerate nucleic acids encoding disclosed variants and derivatives of protein sequences). Thus, although a specific nucleic acid sequence may not be set forth herein, in fact each sequence is disclosed and described herein by means of the disclosed polypeptide sequences.

Процент идентичности (или процент комплементарности) между конкретными участками нуклеотидных последовательностей в нуклеиновых кислотах или аминокислотных последовательностей в полипептидах можно рутинным образом определять, используя программы BLAST (basic local alignment search tools (средство поиска основного локального выравнивания)) и программы PowerBLAST (Altschul et al., J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656) или используя программу Gap (Wisconsin Sequence Analysis Package, версия 8 для Unix, Genetics Computer Group, University Research Park, Madison Wis.) с настройками по умолчанию, в которой используется алгоритм Смита и Уотермана (Adv. Appl. Math., 1981, 2, 482-489). В данном документе, если приводится ссылка на процент идентичности последовательностей, более высокие значения процента идентичности последовательностей предпочтительнее более низких.The percentage identity (or percentage complementarity) between specific regions of nucleotide sequences in nucleic acids or amino acid sequences in polypeptides can be routinely determined using the BLAST (basic local alignment search tools) and PowerBLAST programs (Altschul et al. , J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656) or using the Gap program (Wisconsin Sequence Analysis Package, version 8 for Unix, Genetics Computer Group , University Research Park, Madison Wis.) with default settings, which uses the Smith and Waterman algorithm (Adv. Appl. Math., 1981, 2, 482-489). As used herein, when reference is made to percent sequence identity, higher percent sequence identity values are preferred to lower values.

В данном раскрытии также предложены композиции, содержащие любую одну или более из молекул нуклеиновых кислот и/или любой один или более из полипептидов, раскрытых в данном документе, и носитель и/или наполнитель. В некоторых вариантах осуществления носитель повышает стабильность молекулы нуклеиновой кислоты и/или полипептида (например, продлевает период в заданных условиях хранения (например, при -20°C, 4°C или температуре окружающей среды), на протяжении которого продукты распада остаются ниже порогового значения, например, ниже 0,5% по массе исходных нуклеиновой кислоты или белка; или повышает стабильность in vivo). Примеры носителей включают, но не ограничиваются этим, микросферы поли(молочной кислоты) (ПМК), микросферы поли(D, L-молочной-ко-гликолевой кислоты) (ПМГК), липосомы, мицеллы, инверсные мицеллы, липидные кохелаты и липидные микротрубочки. Носитель может содержать забуференный солевой раствор, такой как ФСБ, ССРХ и т.д.This disclosure also provides compositions comprising any one or more of the nucleic acid molecules and/or any one or more of the polypeptides disclosed herein, and a carrier and/or excipient. In some embodiments, the carrier increases the stability of the nucleic acid molecule and/or polypeptide ( e.g. , prolongs the period under specified storage conditions ( e.g. , -20°C, 4°C, or ambient temperature) during which degradation products remain below a threshold value , for example, below 0.5% by weight of the original nucleic acid or protein; or increases stability in vivo ). Examples of carriers include, but are not limited to, poly(lactic acid) (PLA) microspheres, poly(D,L-lactic-co-glycolic acid) (PLGA) microspheres, liposomes, micelles, inverse micelles, lipid cochelates, and lipid microtubules. The carrier may contain a buffered saline solution such as PBS, SBS, etc.

В данном раскрытии также предложены способы получения любых полипептидов или их фрагментов, раскрытых в данном документе. Такие полипептиды или их фрагменты можно получать любым подходящим способом. Например, полипептиды или их фрагменты можно получать из клеток-хозяев, содержащих молекулы нуклеиновых кислот (например, рекомбинантные экспрессионные векторы), кодирующие такие полипептиды или их фрагменты. Такие способы могут включать культивирование клетки-хозяина, содержащей молекулу нуклеиновой кислоты (например, рекомбинантный экспрессионный вектор), кодирующую полипептид или его фрагмент, в условиях, достаточных для получения полипептида или его фрагмента, получая, таким образом, полипептид или его фрагмент. Нуклеиновая кислота может быть функционально связана с промотором, активным в клетке-хозяине, и культивирование можно проводить в условиях, в которых происходит экспрессия нуклеиновой кислоты. Такие способы могут дополнительно включать выделение экспрессируемого полипептида или его фрагмента. Выделение может дополнительно включать очистку полипептида или его фрагмента.This disclosure also provides methods for producing any of the polypeptides or fragments thereof disclosed herein. Such polypeptides or fragments thereof can be prepared by any suitable method. For example, polypeptides or fragments thereof can be obtained from host cells containing nucleic acid molecules ( eg , recombinant expression vectors) encoding such polypeptides or fragments thereof. Such methods may involve culturing a host cell containing a nucleic acid molecule ( eg , a recombinant expression vector) encoding a polypeptide or fragment thereof under conditions sufficient to produce the polypeptide or fragment thereof, thereby producing a polypeptide or fragment thereof. The nucleic acid can be operably linked to a promoter active in the host cell, and culture can be carried out under conditions in which the nucleic acid is expressed. Such methods may further include isolating the expressed polypeptide or fragment thereof. Isolation may further include purification of the polypeptide or fragment thereof.

Примеры подходящих систем для белковой экспрессии включают клетки-хозяев, такие как, например, экспрессионные системы на основе бактериальных клеток (например, Escherichia coli, Lactococcus lactis), экспрессионные системы на основе дрожжевых клеток (например, Saccharomyces cerevisiae, Pichia pastoris), экспрессионные системы на основе клеток насекомых (например, для опосредованной бакуловирусом белковой экспрессии) и экспрессионные системы на основе клеток млекопитающих.Examples of suitable systems for protein expression include host cells, such as, for example, bacterial cell-based expression systems ( eg , Escherichia coli , Lactococcus lactis ), yeast cell-based expression systems ( eg , Saccharomyces cerevisiae , Pichia pastoris ), expression systems insect cell-based ( e.g. for baculovirus-mediated protein expression) and mammalian cell-based expression systems.

Примеры молекул нуклеиновых кислот, кодирующих полипептиды или их фрагменты, более подробно раскрыты в другом месте данного документа. В некоторых вариантах осуществления молекулы нуклеиновых кислот являются кодон-оптимизированными для экспрессии в клетке-хозяине. В некоторых вариантах осуществления молекулы нуклеиновых кислот функционально связаны с промотором, активным в клетке-хозяине. Промотор может быть гетерологичным промотором (например, промотором, который не является встречающимся в природе промотором). Примеры промоторов, подходящих для Escherichia coli, включают, но не ограничиваются этим, промоторы арабинозы, lac, tac, и T7. Примеры промоторов, подходящих для Lactococcus lactis, включают, но не ограничиваются этим, промоторы P170 и низина. Примеры промоторов, подходящих для Saccharomyces cerevisiae, включают, но не ограничиваются этим, конститутивные промоторы, такие как промоторы алкогольдегидрогеназы (ADHI) или энолазы (ENO), или индуцибельные промоторы, такие как PHO, CUP1, GAL1 и G10. Примеры промоторов, подходящих для Pichia pastoris, включают, но не ограничиваются этим, промотор алкогольоксидаза I (AOX I), промотор глицеральдегид-3-фосфатдегидрогеназа (GAP) и промотор глютатионзависимой формальдегиддегидрогеназы (FLDI). Примером промотора, подходящего для опосредованной бакуловирусом системы, является поздний вирусный сильный промотор полиэдрина.Examples of nucleic acid molecules encoding polypeptides or fragments thereof are disclosed in more detail elsewhere herein. In some embodiments, the nucleic acid molecules are codon optimized for expression in a host cell. In some embodiments, the nucleic acid molecules are operably linked to a promoter active in a host cell. The promoter may be a heterologous promoter (For example, a promoter that is not a naturally occurring promoter). Examples of promoters suitable forEscherichia coliinclude, but are not limited to, arabinose promoters,lac,tac, and T7. Examples of promoters suitable forLactococcus lactis, include, but are not limited to, the P170 and nisin promoters. Examples of promoters suitable forSaccharomyces cerevisiae, include, but are not limited to, constitutive promoters such as alcohol dehydrogenase (ADHI) or enolase (ENO) promoters, or inducible promoters such as PHO, CUP1, GAL1 and G10. Examples of promoters suitable forPichia pastoris, include, but are not limited to, the alcohol oxidase I (AOX I) promoter, the glyceraldehyde-3-phosphate dehydrogenase (GAP) promoter, and the glutathione-dependent formaldehyde dehydrogenase (FLDI) promoter. An example of a promoter suitable for a baculovirus-mediated system is the late viral polyhedrin strong promoter.

В некоторых вариантах осуществления молекулы нуклеиновых кислот кодируют тэг в рамке с полипептидом или его фрагментом для облегчения очистки белка. Примеры тэгов раскрыты в другом месте данного документа. Такие тэги могут, например, связываться с лигандом-партнером (например, иммобилизованным на смоле) так, чтобы снабженный тэгом белок можно было отделять от всех других белков (например, белков клетки-хозяина). Аффинная хроматография, высокоэффективная жидкостная хроматография (ВЭЖХ) и эксклюзионная хроматография (ЭХ) являются примерами методов, которые можно использовать для улучшения чистоты экспрессируемого белка.In some embodiments, the nucleic acid molecules encode a tag in frame with a polypeptide or fragment thereof to facilitate protein purification. Examples of tags are disclosed elsewhere in this document. Such tags may, for example, bind to a partner ligand ( eg , immobilized on a resin) so that the tagged protein can be separated from all other proteins ( eg , host cell proteins). Affinity chromatography, high performance liquid chromatography (HPLC), and size exclusion chromatography (SEC) are examples of techniques that can be used to improve the purity of the expressed protein.

Также можно использовать другие способы для получения полипептидов или их фрагментов. Например, два или более пептидов или полипептидов можно связывать вместе с помощью методов белковой химии. Например, пептиды или полипептиды можно химически синтезировать, используя химию Fmoc (9-фторенилметилоксикарбонил) или Boc (трет-бутилоксикарбонил). Такие пептиды или полипептиды можно синтезировать с помощью стандартных химических реакций. Например, пептид или полипептид можно синтезировать и не отделять от смолы для синтеза, тогда как другой фрагмент пептида или белка можно синтезировать и впоследствии отделить от смолы, оголяя, таким образом, концевую группу, которая функционально заблокирована на другом фрагменте. С помощью реакций пептидной конденсации эти два фрагмента можно ковалентно соединить пептидной связью в карбоксильном и амино-конце соответственно. В альтернативном варианте пептид или полипептид можно независимо синтезировать in vivo, как описано в данном документе. После выделения эти независимые пептиды или полипептиды можно связывать для образования пептида или его фрагмента посредством аналогичных реакций пептидной конденсации.Other methods may also be used to obtain polypeptides or fragments thereof. For example, two or more peptides or polypeptides can be linked together using protein chemistry techniques. For example, peptides or polypeptides can be chemically synthesized using Fmoc (9-fluorenylmethyloxycarbonyl) or Boc ( tert -butyloxycarbonyl) chemistry. Such peptides or polypeptides can be synthesized using standard chemical reactions. For example, a peptide or polypeptide can be synthesized and not separated from the synthesis resin, while another fragment of the peptide or protein can be synthesized and subsequently separated from the resin, thereby exposing an end group that is operably blocked on the other fragment. Using peptide condensation reactions, these two fragments can be covalently joined by a peptide bond at the carboxyl and amino terminus, respectively. Alternatively, the peptide or polypeptide can be independently synthesized in vivo as described herein. Once isolated, these independent peptides or polypeptides can be linked to form a peptide or fragment thereof through similar peptide condensation reactions.

В некоторых вариантах осуществления ферментативное лигирование клонированных или синтетических пептидных сегментов обеспечивает возможность соединения относительно коротких пептидных фрагментов для получения больших пептидных фрагментов, полипептидов или целых белковых доменов (Abrahmsen et al., Biochemistry, 1991, 30, 4151). В альтернативном варианте можно использовать нативное химическое лигирование синтетических пептидов, чтобы синтетически конструировать крупные пептиды или полипептиды из более коротких пептидных фрагментов. Этот способ может состоять из двухэтапной химической реакции (Dawson et al., Science, 1994, 266, 776-779). Первый этап может представлять собой хемоселективную реакцию незащищенного синтетического пептида-тиоэфира с другим незащищенным пептидным сегментом, содержащим амино-концевой остаток Cys, для получения тиоэфир-связанного промежуточного продукта в качестве исходного ковалентного продукта. Без изменения реакционных условий этот промежуточный продукт может подвергаться спонтанной быстрой внутримолекулярной реакции с образованием нативной пептидной связи в сайте лигирования.In some embodiments, enzymatic ligation of cloned or synthetic peptide segments allows relatively short peptide fragments to be joined to produce larger peptide fragments, polypeptides, or entire protein domains (Abrahmsen et al. , Biochemistry , 1991, 30, 4151). Alternatively, native chemical ligation of synthetic peptides can be used to synthetically construct large peptides or polypeptides from shorter peptide fragments. This method may consist of a two-step chemical reaction (Dawson et al. , Science , 1994, 266, 776-779). The first step may be a chemoselective reaction of an unprotected synthetic thioester peptide with another unprotected peptide segment containing an amino-terminal Cys residue to produce a thioester-linked intermediate as the starting covalent product. Without changing the reaction conditions, this intermediate can undergo a spontaneous, rapid intramolecular reaction to form a native peptide bond at the ligation site.

В некоторых вариантах осуществления незащищенные пептидные сегменты могут быть химически связаны, при этом связь, образуемая между пептидными сегментами в результате химического лигирования, является неприродной (непептидной) связью (Schnolzer et al., Science, 1992, 256, 221).In some embodiments, the exposed peptide segments may be chemically linked, wherein the bond formed between the peptide segments by chemical ligation is a non-peptide bond (Schnolzer et al. , Science , 1992, 256, 221).

В некоторых вариантах осуществления полипептиды могут иметь постэкспрессионные модификации, такие как, например, гликозилирование, ацетилирование и фосфорилирование, а также другие модификации, известные в данной области техники, как встречающиеся в природе, так и не встречающиеся в природе. Полипептид может представлять собой целый белок или его подпоследовательность.In some embodiments, polypeptides may have post-expression modifications, such as, for example, glycosylation, acetylation, and phosphorylation, as well as other modifications known in the art, both naturally occurring and non-naturally occurring. The polypeptide may be a whole protein or a subsequence thereof.

В данном раскрытии также предложены способы получения любых раскрытых в данном документе полипептидов, включающие культивирование клетки-хозяина, содержащей рекомбинантные экспрессионные векторы, содержащие молекулы нуклеиновых кислот, содержащие полинуклеотид, способный кодировать один или более раскрытых в данном документе полипептидов, или его комплементарную цепь, получая, таким образом, полипептид.This disclosure also provides methods for producing any of the polypeptides disclosed herein, comprising culturing a host cell containing recombinant expression vectors containing nucleic acid molecules containing a polynucleotide capable of encoding one or more of the polypeptides disclosed herein, or a complementary strand thereof, producing , thus a polypeptide.

В данном раскрытии также предложены клетки (например, рекомбинантные клетки-хозяева), содержащие любую одну или более молекул нуклеиновых кислот, включая векторы, содержащие молекулы нуклеиновых кислот, и/или любой один или более полипептидов, раскрытых в данном документе. Клетки могут быть in vitro, ex vivo или in vivo. Молекулы нуклеиновых кислот могут быть связаны с промотором и другими регуляторными последовательностями так, чтобы происходила их экспрессия с выработкой кодируемого белка. дополнительно предложены линии таких клеток.This disclosure also provides cells ( eg , recombinant host cells) containing any one or more nucleic acid molecules, including vectors containing nucleic acid molecules, and/or any one or more polypeptides disclosed herein. Cells can be in vitro , ex vivo or in vivo . Nucleic acid molecules can be linked to a promoter and other regulatory sequences so that they are expressed to produce the encoded protein. additional lines of such cells have been proposed.

В некоторых вариантах осуществления клетка является тотипотентной клеткой или плюрипотентной клеткой (например, эмбриональной стволовой (ЭС) клеткой, такой как ЭС клетка грызуна, ЭС клетка мыши или ЭС клетка крысы). Тотипотентные клетки включают недифференцированные клетки, из которых можно получить любой тип клеток, а плюрипотентные клетки включают недифференцированные клетки, которые обладают способностью развиваться в более чем один тип дифференцированных клеток. Такие плюрипотентные и/или тотипотентные клетки могут представлять собой, например, ЭС клетки или ЭС-подобные клетки, такие как индуцированные плюрипотентные стволовые (иПС) клетки. ЭС клетки включают эмбриональные тотипотентные или плюрипотентные клетки, которые способны обеспечивать вклад в любую ткань развивающегося эмбриона после внесения в эмбрион. ЭС клетки могут быть получены из внутренней клеточной массы бластоцисты и способны дифференцироваться в клетки любого из трех зародышевых листков позвоночных (эндодерма, эктодерма и мезодерма). В соответствии с данным раскрытием, эмбриональные стволовые клетки могут быть не человеческими эмбриональными стволовыми клетками.In some embodiments, the cell is a totipotent cell or a pluripotent cell ( eg , an embryonic stem (ES) cell such as a rodent ES cell, a mouse ES cell, or a rat ES cell). Totipotent cells include undifferentiated cells that can develop into any cell type, and pluripotent cells include undifferentiated cells that have the ability to develop into more than one differentiated cell type. Such pluripotent and/or totipotent cells may be, for example, ES cells or ES-like cells, such as induced pluripotent stem (iPS) cells. ES cells include embryonic totipotent or pluripotent cells that are capable of contributing to any tissue of the developing embryo once introduced into the embryo. ES cells can be derived from the inner cell mass of the blastocyst and are capable of differentiating into cells of any of the three vertebrate germ layers (endoderm, ectoderm and mesoderm). In accordance with this disclosure, the embryonic stem cells may be non-human embryonic stem cells.

В некоторых вариантах осуществления клетка является первичной соматической клеткой или же клеткой, которая не является первичной соматической клеткой. Соматические клетки могут включать любую клетку, которая не является гаметой, зародышевой клеткой, гаметоцитом или недифференцированной стволовой клеткой. В некоторых вариантах осуществления клетка также может быть первичной клеткой. Первичные клетки включают клетки или культуры клеток, которые были непосредственно выделены из организма, органа или ткани. Первичные клетки включают клетки, которые не являются ни трансформированными, ни иммортализованными. Первичные клетки включают любую клетку, полученную из организма, органа или ткани, которую ранее не пассировали в тканевой культуре или которую ранее пассировали в тканевой культуре, но которую невозможно бесконечно пассировать в тканевой культуре. Такие клетки могут быть выделены традиционными способами и включают, например, соматические клетки, гемопоэтические клетки, эндотелиальные клетки, эпителиальные клетки, фибробласты, мезенхимальные клетки, кератиноциты, меланоциты, моноциты, мононуклеарные клетки, адипоциты, преадипоциты, нейроны, глиальные клетки, гепатоциты, скелетные миобласты и гладкомышечные клетки. Например, первичные клетки могут быть получены из соединительных тканей, мышечных тканей, тканей нервной системы или эпителиальных тканей.In some embodiments, the cell is a primary somatic cell or a cell that is not a primary somatic cell. Somatic cells can include any cell that is not a gamete, germ cell, gametocyte, or undifferentiated stem cell. In some embodiments, the cell may also be a primary cell. Primary cells include cells or cell cultures that have been directly isolated from an organism, organ, or tissue. Primary cells include cells that are neither transformed nor immortalized. Primary cells include any cell obtained from an organism, organ, or tissue that has not previously been passaged in tissue culture or that has been previously passaged in tissue culture but which cannot be passaged indefinitely in tissue culture. Such cells can be isolated by conventional methods and include, for example, somatic cells, hematopoietic cells, endothelial cells, epithelial cells, fibroblasts, mesenchymal cells, keratinocytes, melanocytes, monocytes, mononuclear cells, adipocytes, preadipocytes, neurons, glial cells, hepatocytes, skeletal myoblasts and smooth muscle cells. For example, primary cells can be obtained from connective tissues, muscle tissues, nervous system tissues, or epithelial tissues.

В некоторых вариантах осуществления клетки обычно не могут бесконечно пролиферировать, но вследствие мутации или изменения избежали нормального клеточного старения и вместо этого продолжают делиться. Такие мутации или изменения могут возникать природным образом или быть индуцированными намеренно. Примеры иммортализованных клеток включают, но не ограничиваются этим, клетки яичника китайского хомяка (CHO), человеческие эмбриональные клетки почек (например, клетки HEK 293) и мышиные эмбриональные фибробласты (например, клетки 3T3). Многочисленные типы иммортализованных клеток хорошо известны. Иммортализованные или первичные клетки включают клетки, которые обычно используют для культивирования или для экспрессии рекомбинантных генов или белков. В некоторых вариантах осуществления клетка является дифференцированной клеткой, такой как клетка печени (например, клетка печени человека).In some embodiments, cells typically cannot proliferate indefinitely, but due to mutation or change have escaped normal cellular aging and instead continue to divide. Such mutations or changes may occur naturally or be intentionally induced. Examples of immortalized cells include, but are not limited to, Chinese hamster ovary (CHO) cells, human embryonic kidney cells ( eg HEK 293 cells) and mouse embryonic fibroblasts ( eg 3T3 cells). Numerous types of immortalized cells are well known. Immortalized or primary cells include cells that are typically used for culture or for the expression of recombinant genes or proteins. In some embodiments, the cell is a differentiated cell, such as a liver cell ( eg , a human liver cell).

Клетка может быть получена из любого источника. Например, клетка может быть эукариотической клеткой, клеткой животного, клеткой растения или клеткой гриба (например, дрожжей). Такие клетки могут представлять собой клетки рыб или клетки птиц, или же такие клетки могут представлять собой клетки млекопитающих, такие как клетки человека, клетки отличных от человека млекопитающих, клетки грызунов, клетки мышей или клетки крыс. Млекопитающие включают, но не ограничиваются этим, человека, отличных от человека приматов, мартышек, обезьян, кошек, собак, лошадей, быков, оленей, бизонов, овец, грызунов (например, мышей, крыс, хомяков, морских свинок), сельскохозяйственных животных (например, виды бычьих, такие как коровы, быки и т. д.; виды овечьих, такие как овцы, козы и т.д.; и виды свиных, такие как свиньи и боровы). Птицы включают, но не ограничиваются этим, кур, индеек, страусов, гусей, уток и т.д. Также включены домашние и сельскохозяйственные животные. Термин «отличное от человека животное» исключает человека.The cell can be obtained from any source. For example, the cell may be a eukaryotic cell, an animal cell, a plant cell, or a fungal cell ( such as yeast). Such cells may be fish cells or avian cells, or such cells may be mammalian cells, such as human cells, non-human mammalian cells, rodent cells, mouse cells, or rat cells. Mammals include, but are not limited to, humans, non-human primates, monkeys, monkeys, cats, dogs, horses, bovines, deer, bison, sheep, rodents ( e.g. mice, rats, hamsters, guinea pigs), farm animals ( e.g. bovine species such as cows, bulls, etc.; ovine species such as sheep, goats, etc.; and porcine species such as pigs and hogs). Birds include, but are not limited to, chickens, turkeys, ostriches, geese, ducks, etc. Pets and farm animals are also included. The term "non-human animal" excludes humans.

Дополнительные клетки-хозяева описаны, например, в публикации заявки на патент США № US2018/0030114, которая в полном объеме включена в данный документ посредством ссылки.Additional host cells are described, for example, in US Patent Application Publication No. US2018/0030114, which is incorporated herein by reference in its entirety.

Раскрытые в данном документе молекулы нуклеиновых кислот и полипептиды можно вносить в клетку любыми способами. Протоколы трансфекции, а также протоколы внесения нуклеиновых кислот или белков могут варьироваться. Неограничивающие методы трансфекции включают химические методы трансфекции с применением липосом, наночастиц, кальция, дендримеров и катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин. Нехимические методы включают электропорацию, сонопорацию и оптическую трансфекцию. Трансфекция на основе применения частиц включает применение генной пушки или магнитную трансфекцию. Также для трансфекции можно использовать вирусные методы.The nucleic acid molecules and polypeptides disclosed herein can be introduced into a cell by any means. Transfection protocols, as well as protocols for introducing nucleic acids or proteins, may vary. Non-limiting transfection methods include chemical transfection methods using liposomes, nanoparticles, calcium, dendrimers, and cationic polymers such as DEAE-dextran or polyethylenimine. Non-chemical methods include electroporation, sonoporation and optical transfection. Particle-based transfection includes the use of a gene gun or magnetic transfection. Viral methods can also be used for transfection.

Внесение нуклеиновых кислот или белков в клетку также может быть опосредовано электропорацией, внутрицитоплазматическим введением, вирусной инфекцией, аденовирусом, аденоассоциированным вирусом, лентивирусом, ретровирусом, трансфекцией, липид-опосредованной трансфекцией или нуклеофекцией. Нуклеофекция представляет собой усовершенствованный метод электропорации, который позволяет обеспечивать доставку субстратов нуклеиновых кислот не только в цитоплазму, но также через ядерную мембрану и в ядро. Кроме того, применение нуклеофекции в раскрытых в данном документе способах, как правило, требует меньше клеток, чем обычная электропорация (например, только около 2 миллионов по сравнению с 7 миллионами при обычной электропорации). В некоторых вариантах осуществления нуклеофекцию проводят, используя систему LONZA® NUCLEOFECTOR™.Introduction of nucleic acids or proteins into a cell may also be mediated by electroporation, intracytoplasmic injection, viral infection, adenovirus, adeno-associated virus, lentivirus, retrovirus, transfection, lipid-mediated transfection, or nucleofection. Nucleofection is an improved electroporation technique that allows delivery of nucleic acid substrates not only into the cytoplasm, but also across the nuclear membrane and into the nucleus. In addition, the use of nucleofection in the methods disclosed herein typically requires fewer cells than conventional electroporation ( eg , only about 2 million compared to 7 million for conventional electroporation). In some embodiments, nucleofection is performed using the LONZA® NUCLEOFECTOR™ system.

Внесение нуклеиновых кислот или белков в клетку также можно осуществлять посредством микроинъекции. Микроинъекцию мРНК обычно проводят в цитоплазму (например, для доставки мРНК непосредственно к аппарату трансляции), тогда как микроинъекцию белка или ДНК обычно проводят в ядро. В альтернативном варианте микроинъекцию можно проводить посредством инъекции как в ядро, так и в цитоплазму: сначала иглу можно ввести в ядро и инъецировать первое количество, а при удалении иглы из клетки ввести второе количество в цитоплазму. Если в цитоплазму вводят белок нуклеазного агента, белок может содержать сигнал ядерной локализации, чтобы обеспечить доставку в ядро/пронуклеус.The introduction of nucleic acids or proteins into a cell can also be accomplished through microinjection. Microinjection of mRNA is usually carried out into the cytoplasm (for example, to deliver mRNA directly to the translation apparatus), while microinjection of protein or DNA is usually carried out into the nucleus. Alternatively, microinjection can be performed by injecting into both the nucleus and the cytoplasm: the needle can first be inserted into the nucleus and inject a first amount, and when the needle is removed from the cell, inject a second amount into the cytoplasm. If a nuclease agent protein is introduced into the cytoplasm, the protein may contain a nuclear localization signal to ensure delivery to the nucleus/pronucleus.

Другие способы внесения нуклеиновых кислот или белков в клетку могут включать, например, векторную доставку, опосредованную частицами доставку, опосредованную экзосомами доставку, опосредованную липидными наночастицами доставку, опосредованную проникающим в клетки пептидом доставку или опосредованную имплантируемым устройством доставку. Способы введение нуклеиновых кислот или белков субъекту для модификации клеток in vivo раскрыты в другом месте данного документа. Внесение нуклеиновых кислот и белков в клетки также можно осуществлять посредством гидродинамической доставки (ГДД). Other methods of delivering nucleic acids or proteins into a cell may include, for example, vector delivery, particle-mediated delivery, exosome-mediated delivery, lipid nanoparticle-mediated delivery, cell-penetrating peptide-mediated delivery, or implantable device-mediated delivery. Methods for administering nucleic acids or proteins to a subject to modify cells in vivo are disclosed elsewhere herein. The introduction of nucleic acids and proteins into cells can also be achieved through hydrodynamic delivery (HDD).

Другие способы внесения нуклеиновых кислот или белков в клетку могут включать, например, векторную доставку, опосредованную частицами доставку, опосредованную экзосомами доставку, опосредованную липидными наночастицами доставку, опосредованную проникающим в клетки пептидом доставку или опосредованную имплантируемым устройством доставку. В некоторых вариантах осуществления нуклеиновую кислоту или белок можно вносить в клетку в носителе, таком как микросфера на основе поли(молочной кислоты) (ПМА), микросфера на основе поли(D, L-молочной-ко-гликолевой кислоты) (ПМГА), липосома, мицелла, инверсная мицелла, липидный кохелат или липидная микротрубочка.Other methods of delivering nucleic acids or proteins into a cell may include, for example, vector delivery, particle-mediated delivery, exosome-mediated delivery, lipid nanoparticle-mediated delivery, cell-penetrating peptide-mediated delivery, or implantable device-mediated delivery. In some embodiments, the nucleic acid or protein can be delivered into a cell in a carrier such as a poly(lactic acid) (PMA) microsphere, a poly(D,L-lactic-co-glycolic acid) (PMGA) microsphere, a liposome , micelle, inverse micelle, lipid cochelate or lipid microtubule.

В данном раскрытии также предложены зонды и праймеры. Примеры зондов и праймеров раскрыты, например, выше. В данном раскрытии предложены зонды и праймеры, содержащие последовательность нуклеиновой кислоты, которая специфически гибридизируется с любой из раскрытых в данном документе молекул нуклеиновых кислот. Например, зонд или праймер может содержать последовательность нуклеиновой кислоты, которая гибридизируется с любой из описанных в данном документе молекул нуклеиновых кислот, которые кодируют вариантный белок SIGIRR, который усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный белок SIGIRR в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный полипептид SIGIRR, который усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный полипептид SIGIRR, который усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит некоторое количество аминокислот в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный полипептид SIGIRR, который усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержит следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9: Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11), или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный полипептид SIGIRR, который имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с аминокислотной последовательностью в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер содержит последовательность нуклеиновой кислоты, которая гибридизируется с молекулой нуклеиновой кислоты, кодирующей вариантный полипептид SIGIRR, который содержит или состоит из аминокислотной последовательности в соответствии с SEQ ID NO:9, или которая гибридизируется с комплементарной цепью этой молекулы нуклеиновой кислоты. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с частью молекулы нуклеиновой кислоты, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides probes and primers. Examples of probes and primers are disclosed, for example, above. This disclosure provides probes and primers containing a nucleic acid sequence that specifically hybridizes to any of the nucleic acid molecules disclosed herein. For example, the probe or primer may contain a nucleic acid sequence that hybridizes to or that hybridizes to any of the nucleic acid molecules described herein that encode a variant SIGIRR protein that is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9 with the complementary chain of a nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR protein according to SEQ ID NO:9, or that hybridizes to a complementary strand of that nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR polypeptide that is truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9 and contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, or which hybridizes with the complementary strand of this nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR polypeptide that is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and contains a number of amino acids at positions corresponding to positions 186-215 according to SEQ ID NO:9, or which hybridizes to the complementary strand of that nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR polypeptide that is truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and contains the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9: Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser -Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11), or which hybridizes to the complementary strand of that nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR polypeptide that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to the amino acid sequence in accordance with SEQ ID NO:9, or which hybridizes with the complementary strand of this nucleic acid molecule. In some embodiments, the probe or primer comprises a nucleic acid sequence that hybridizes to a nucleic acid molecule encoding a variant SIGIRR polypeptide that contains or consists of an amino acid sequence according to SEQ ID NO:9, or that hybridizes to a complementary strand of that nucleic acid molecule . In some embodiments, the probe or primer specifically hybridizes to a portion of the nucleic acid molecule containing a codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

Зонд или праймер может иметь любую подходящую длину, неограничивающие примеры которой включают по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24 или по меньшей мере около 25 нуклеотидов. В предпочтительных вариантах осуществления зонд или праймер имеет длину по меньшей мере около 18 нуклеотидов. Зонд или праймер может иметь длину, составляющую от около 10 до около 35, от около 10 до около 30, от около 10 до около 25, от около 12 до около 30, от около 12 до около 28, от около 12 до около 24, от около 15 до около 30, от около 15 до около 25, от около 18 до около 30, от около 18 до около 25, от около 18 до около 24 или от около 18 до около 22 нуклеотидов. В предпочтительных вариантах осуществления зонд или праймер имеет длину, составляющую от около 18 до около 30 нуклеотидов.The probe or primer may be of any suitable length, non-limiting examples of which include at least about 5, at least about 8, at least about 10, at least about 11, at least about 12, at least about 13, at least about 14, at least about 15, at least about 16, at least about 17, at least about 18, at least about 19, at least about 20, at least about 21, at least about 22, at least about 23, at least about 24, or at least about 25 nucleotides. In preferred embodiments, the probe or primer is at least about 18 nucleotides in length. The probe or primer may have a length of about 10 to about 35, about 10 to about 30, about 10 to about 25, about 12 to about 30, about 12 to about 28, about 12 to about 24, about 15 to about 30, about 15 to about 25, about 18 to about 30, about 18 to about 25, about 18 to about 24, or about 18 to about 22 nucleotides. In preferred embodiments, the probe or primer is between about 18 and about 30 nucleotides in length.

В данном раскрытии также предложены специфические в отношении изменения зонды и специфические в отношении изменения праймеры. Специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с последовательностью нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, который усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или с ее комплементарной цепью. В контексте данного раскрытия «специфически гибридизируется» означает, что зонд или праймер (например, специфический в отношении изменения зонд или специфический в отношении изменения праймер) не гибридизируется с молекулой нуклеиновой кислоты, кодирующей белок SIGIRR дикого типа. В некоторых вариантах осуществления специфический в отношении изменения зонд специфически гибридизируется с кодоном нуклеиновой кислоты, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, или его комплементарной цепью. В некоторых вариантах осуществления специфический в отношении изменения праймер или пара праймеров специфически гибридизируются с областью(ями) молекулы нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, так, что кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, оказывается включенным в любой транскрипт, получаемый из него. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с частью молекулы нуклеиновой кислоты, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides variation-specific probes and variation-specific primers. The variation-specific probe or variation-specific primer contains a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a nucleic acid sequence encoding a variant SIGIRR protein that is truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, or its complementary chain. As used herein, “specifically hybridizes” means that the probe or primer ( eg , a variation-specific probe or variation-specific primer) does not hybridize to a nucleic acid molecule encoding a wild-type SIGIRR protein. In some embodiments, the change-specific probe specifically hybridizes to a nucleic acid codon that encodes a serine at the position corresponding to position 186 of SEQ ID NO:9, or a complementary strand thereof. In some embodiments, the variation-specific primer or pair of primers specifically hybridizes to the region(s) of a nucleic acid molecule encoding the SIGIRR variant protein such that a codon that encodes a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 , appears to be included in any transcript obtained from it. In some embodiments, the probe or primer specifically hybridizes to a portion of the nucleic acid molecule containing a codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с последовательностью нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, причем указанный белок содержит усечение в позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или с ее комплементарной цепью.In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a nucleic acid sequence encoding a variant SIGIRR protein, wherein said protein comprises a truncation at a position corresponding to position 215 in accordance with SEQ ID NO:9, or its complementary chain.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или с ее комплементарной цепью. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с частью геномной ДНК, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a genomic DNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to with SEQ ID NO:9, or its complementary chain. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a genomic DNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to with SEQ ID NO:9, and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a genomic DNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to with SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to a genomic DNA molecule encoding a variant SIGIRR protein having at least about 90% at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least at least about 98% or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to a genomic DNA molecule encoding a variant SIGIRR protein having SEQ ID NO:9. In some embodiments, the probe or primer specifically hybridizes to a portion of genomic DNA containing a codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:2. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:2. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a genomic DNA molecule that contains or consists of a nucleic acid sequence containing a guanine at the position corresponding to position 9962 in accordance with SEQ ID NO:2. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes, or specifically hybridizes, to a genomic DNA molecule that contains or consists of a nucleic acid sequence that has at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:2. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a genomic DNA molecule that contains or consists of a nucleic acid sequence in accordance with SEQ ID NO :2.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с частью молекулы мРНК, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to SEQ ID NO:9, and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 according to SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to an mRNA molecule encoding a variant SIGIRR protein having at least about 90% of at least at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98% or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to an mRNA molecule encoding the variant SIGIRR protein having SEQ ID NO:9. In some embodiments, the probe or primer specifically hybridizes to a portion of the mRNA molecule containing a codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, которая содержит кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:4. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:4. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule that contains or consists of a nucleic acid sequence containing guanine at a position corresponding to position 557 in accordance with SEQ ID NO:4. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule that contains codons CUA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:4. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule that contains or consists of a nucleic acid sequence that has at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97 %, at least about 98%, or at least about 99% sequence identity with SEQ ID NO:4. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, an mRNA molecule that contains or consists of a nucleic acid sequence according to SEQ ID NO: 4.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную последовательность в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9. В некоторых вариантах осуществления зонд или праймер специфически гибридизируется с частью молекулы кДНК, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule encoding a variant SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid sequence at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to a cDNA molecule encoding a variant SIGIRR protein having at least about 90% of at least at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98% or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes or specifically hybridizes to a cDNA molecule encoding a variant SIGIRR protein having SEQ ID NO:9. In some embodiments, the probe or primer specifically hybridizes to a portion of a cDNA molecule containing a codon that encodes a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, которая содержит кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:6. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:6. В некоторых вариантах осуществления специфический в отношении изменения зонд или специфический в отношении изменения праймер содержит последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется, или специфически гибридизируется с молекулой кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:6. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule that contains or consists of a nucleic acid sequence containing guanine at a position corresponding to position 557 in accordance with SEQ ID NO:6. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule that contains codons CUA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:6. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule that contains or consists of a nucleic acid sequence that has at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97 %, at least about 98%, or at least about 99% sequence identity with SEQ ID NO:6. In some embodiments, the variation-specific probe or variation-specific primer comprises a nucleic acid sequence that is complementary to and/or hybridizes to, or specifically hybridizes to, a cDNA molecule that contains or consists of a nucleic acid sequence according to SEQ ID NO: 6.

Длина, описанная выше в связи с зондом или праймером согласно раскрытию, применима с соответствующими изменениями также для специфического в отношении изменения зонда или специфического в отношении изменения праймера согласно раскрытию. The length described above in connection with the probe or primer of the disclosure applies mutatis mutandis also to the variation-specific probe or variation-specific primer of the disclosure.

В данном раскрытии также предложена пара специфических в отношении изменения праймеров, содержащая два из специфических в отношении изменения праймеров, описанных выше.This disclosure also provides a pair of variation-specific primers comprising two of the variation-specific primers described above.

В некоторых вариантах осуществления зонд или праймер (например, специфический в отношении изменения зонд или специфический в отношении изменения праймер) содержит ДНК. В некоторых вариантах осуществления зонд или праймер (например, специфический в отношении изменения зонд или специфический в отношении изменения праймер) содержит РНК. В некоторых вариантах осуществления зонд или праймер (например, специфический в отношении изменения зонд или специфический в отношении изменения праймер) гибридизируется с последовательностью нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, в жестких условиях, таких как условия высокой жесткости. In some embodiments, the probe or primer ( eg , a variation-specific probe or variation-specific primer) comprises DNA. In some embodiments, the probe or primer ( eg , a variation-specific probe or a variation-specific primer) comprises RNA. In some embodiments, a probe or primer ( eg , a variation-specific probe or a variation-specific primer) hybridizes to a nucleic acid sequence encoding a variant SIGIRR protein under stringent conditions, such as high stringency conditions.

В некоторых вариантах осуществления зонд содержит метку. В некоторых вариантах осуществления метка представляет собой флуоресцентную метку, радиоактивную метку или биотин. В некоторых вариантах осуществления длина зонда описана выше. В альтернативном варианте, в некоторых вариантах осуществления, зонд содержит или состоит из по меньшей мере около 20, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45, по меньшей мере около 50, по меньшей мере около 55, по меньшей мере около 60, по меньшей мере около 65, по меньшей мере около 70, по меньшей мере около 75, по меньшей мере около 80, по меньшей мере около 85, по меньшей мере около 90, по меньшей мере около 95 или по меньшей мере около 100 нуклеотидов. Зонд (например, аллель-специфический зонд) можно использовать, например, для обнаружения любой из раскрытых в данном документе молекул нуклеиновых кислот. В предпочтительных вариантах осуществления зонд имеет длину по меньшей мере около 18 нуклеотидов. Зонд может иметь длину, составляющую от около 10 до около 35, от около 10 до около 30, от около 10 до около 25, от около 12 до около 30, от около 12 до около 28, от около 12 до около 24, от около 15 до около 30, от около 15 до около 25, от около 18 до около 30, от около 18 до около 25, от около 18 до около 24 или от около 18 до около 22 нуклеотидов. В предпочтительных вариантах осуществления зонд имеет длину, составляющую от около 18 до около 30 нуклеотидов.In some embodiments, the probe contains a label. In some embodiments, the label is a fluorescent label, a radioactive label, or biotin. In some embodiments, the length of the probe is described above. Alternatively, in some embodiments, the probe comprises or consists of at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, at least about 45, at least about 50, at least about 55, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, at least at least about 90, at least about 95, or at least about 100 nucleotides. A probe ( eg , an allele-specific probe) can be used, for example, to detect any of the nucleic acid molecules disclosed herein. In preferred embodiments, the probe is at least about 18 nucleotides in length. The probe may have a length of from about 10 to about 35, from about 10 to about 30, from about 10 to about 25, from about 12 to about 30, from about 12 to about 28, from about 12 to about 24, from about 15 to about 30, about 15 to about 25, about 18 to about 30, about 18 to about 25, about 18 to about 24, or about 18 to about 22 nucleotides. In preferred embodiments, the probe has a length of from about 18 to about 30 nucleotides.

В данном раскрытии также предложены подложки, содержащие субстрат, к которому присоединен любой один или более из раскрытых в данном документе зондов. Твердые подложки представляют собой твердофазные субстраты или подложки, с которыми могут связываться молекулы, такие как любые раскрытые в данном документе зонды. Формой твердой подложки является матрица. Другой формой твердой подложки является матричный детектор. Матричный детектор представляет собой твердую подложку, с которой было сопряжено некоторое количество разных зондов в виде матрицы, решетки или в другом упорядочении.This disclosure also provides supports containing a substrate to which is attached any one or more of the probes disclosed herein. Solid supports are solid phase substrates or supports to which molecules, such as any probes disclosed herein, can bind. The form of the solid support is a matrix. Another form of solid substrate is an array detector. An array detector is a solid substrate to which a number of different probes have been coupled in the form of a matrix, lattice, or other arrangement.

Твердофазные субстраты для применения в твердых подложках могут включать любой твердый материал, с которым могут быть сопряжены молекулы. Это подразумевает такие материалы, как акриламид, агароза, целлюлоза, нитроцеллюлоза, стекло, полистирол, полиэтиленвинилацетат, полипропилен, полиметакрилат, полиэтилен, полиэтиленоксид, полисиликаты, поликарбонаты, тефлон, фторуглероды, нейлон, силиконовый каучук, полиангидриды, полигликолевая кислота, полимолочная кислота, сложные полиортоэфиры, полипропилфумарат, коллаген, гликозаминогликаны и полиаминокислоты. Твердофазные субстраты могут иметь любую удобную форму, включая тонкую пленку, мембрану, бутылки, планшеты, волокна, шерстяные волокна, формованные полимеры, частицы, гранулы, микрочастицы или их комбинацию. Твердофазные субстраты и твердые подложки могут быть пористыми и непористыми. Одной из форм твердофазного субстрата является микротитровальный планшет, например, стандартного 96-луночного типа. В некоторых вариантах осуществления можно использовать многолуночный стеклянный слайд, который обычно содержит одну матрицу на лунку. Это позволяет осуществлять лучший контроль воспроизводимости анализа, повышать производительность и обработку образца, и облегчает автоматизацию. В некоторых вариантах осуществления подложка представляет собой микромассив.Solid phase substrates for use in solid supports can include any solid material to which molecules can be bonded. This includes materials such as acrylamide, agarose, cellulose, nitrocellulose, glass, polystyrene, polyethylene vinyl acetate, polypropylene, polymethacrylate, polyethylene, polyethylene oxide, polysilicates, polycarbonates, Teflon, fluorocarbons, nylon, silicone rubber, polyanhydrides, polyglycolic acid, polylactic acid, complex polyorthoesters, polypropyl fumarate, collagen, glycosaminoglycans and polyamino acids. Solid phase substrates can be in any convenient form, including thin film, membrane, bottles, tablets, fibers, wool fibers, molded polymers, particles, granules, microparticles, or a combination thereof. Solid phase substrates and solid supports can be porous or non-porous. One form of solid phase substrate is a microtiter plate, for example the standard 96-well type. In some embodiments, a multi-well glass slide may be used, which typically contains one array per well. This allows for better control of assay reproducibility, improved throughput and sample handling, and facilitates automation. In some embodiments, the substrate is a microarray.

Любые из раскрытых в данном документе полипептидов могут дополнительно содержать одну или более замен (таких как консервативные аминокислотные замены), вставок или делеций. Вставки включают, например, амино- или карбокси-концевые слияния, а также вставки одного или нескольких аминокислотных остатков внутри последовательности. Способы создания замен в предопределенных сайтах в ДНК, имеющей известную последовательность, хорошо известны, например, это мутагенез с праймером M13 и ПЦР-мутагенез. Аминокислотные замены, как правило, проводят в одном остатке, но могут проводиться сразу в некотором числе разных локаций; вставки, как правило, имеют порядок от 1 до 10 аминокислотных остатков; а делеции находятся в диапазоне от 1 до 30 остатков. Делеции или вставки можно осуществлять в смежных парах, т.е. делецию 2 остатков или вставку 2 остатков. Замены, делеции, вставки или любую их комбинацию можно комбинировать для получения конечной конструкции. В некоторых вариантах осуществления мутации не вытесняют последовательность за рамку считывания и не создают комплементарные области, которые могут приводить к образованию вторичной структуры мРНК.Any of the polypeptides disclosed herein may further contain one or more substitutions (such as conservative amino acid substitutions), insertions or deletions. Insertions include, for example, amino- or carboxy-terminal fusions, as well as insertions of one or more amino acid residues within a sequence. Methods for creating substitutions at predetermined sites in DNA having a known sequence are well known, for example, mutagenesis with primer M13 and PCR mutagenesis. Amino acid substitutions, as a rule, are carried out at one residue, but can be carried out simultaneously in a number of different locations; insertions typically range from 1 to 10 amino acid residues; and deletions range from 1 to 30 residues. Deletions or insertions can be made in adjacent pairs, i.e. deletion of 2 residues or insertion of 2 residues. Substitutions, deletions, insertions, or any combination thereof can be combined to produce the final construct. In some embodiments, the mutations do not displace the sequence out of reading frame or create complementary regions that may result in the formation of secondary structure of the mRNA.

В данном раскрытии также предложены наборы для создания композиций и применения способов, описанных в данном документе. Описанные в данном документе наборы могут содержать компоненты для проведения анализа или анализов для обнаружения одного или более генетических вариантов в образце субъекта. This disclosure also provides kits for creating the compositions and using the methods described herein. The kits described herein may contain components for performing an assay or assays for detecting one or more genetic variants in a subject's sample.

В некоторых вариантах осуществления в наборах для идентификации вариантов SIGIRR используются композиции и способы, описанные выше. В некоторых вариантах осуществления базовый набор может содержать контейнер, содержащий по меньшей мере одну пару олигонуклеотидных праймеров или зондов, таких как специфические в отношении изменения зонды или специфические в отношении изменения праймеры, для локуса в любой из раскрытых в данном документе молекул нуклеиновых кислот (таких как, например, SEQ ID NO:2, SEQ ID NO:4 и/или SEQ ID NO:6). Набор может, необязательно, содержать инструкции по применению. Набор также может содержать другие необязательные компоненты набора, такие как, например, один или более аллельных лэддеров, направленных на каждый из амплифицируемых локусов, достаточное количество фермента для амплификации, буфер для амплификации для облегчения амплификации, раствор двухвалентного катиона для улучшения активности фермента, дНТФ для удлинения цепей во время амплификации, загрузочный раствор для подготовки амплифицированного материала для электрофореза, геномную ДНК в качестве матричного контроля, размерный маркер для гарантии, что материалы перемещаются как положено в среде для разделения, и протокол и руководство для обучения пользователя и ограничения числа ошибок при применении. Количества различных реагентов в наборах также можно варьировать в зависимости от ряда факторов, таких как оптимальная чувствительность способа. В объем этих принципов входит предоставление тестовых наборов для использования в ручных применениях или тестовых наборов для использования с автоматическими устройствами для приготовления образцов, установками для проведения реакций, детекторами и анализаторами.In some embodiments, SIGIRR variant identification kits utilize the compositions and methods described above. In some embodiments, the base set may comprise a container containing at least one pair of oligonucleotide primers or probes, such as variation-specific probes or variation-specific primers, for a locus at any of the nucleic acid molecules disclosed herein (such as eg SEQ ID NO:2, SEQ ID NO:4 and/or SEQ ID NO:6). The kit may optionally contain instructions for use. The kit may also contain other optional kit components, such as, for example, one or more allelic ladders targeting each of the loci to be amplified, a sufficient amount of enzyme for amplification, an amplification buffer to facilitate amplification, a divalent cation solution to improve enzyme activity, dNTPs for chain extension during amplification, a loading solution for preparing amplified material for electrophoresis, genomic DNA as a template control, a size marker to ensure that materials move as expected in the separation media, and a protocol and guide to train the user and limit application errors . The amounts of different reagents in the kits can also be varied depending on a number of factors, such as the optimal sensitivity of the method. The scope of these principles includes the provision of test kits for use in manual applications or test kits for use with automatic sample preparation devices, reaction units, detectors and analyzers.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или ее комплементарной цепи. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную позицию в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9.In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule encoding the variant protein SIGIRR, truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, or its complementary chain. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule encoding the variant protein SIGIRR, truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule encoding the variant protein SIGIRR, truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid position at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule encoding the variant protein SIGIRR having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 %, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule encoding the variant protein SIGIRR having SEQ ID NO:9.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:2. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы геномной ДНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:2. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule that contains or consists of a nucleic acid sequence containing guanine at the position corresponding to position 9962 in accordance with SEQ ID NO:2. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule that contains or consists of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:2. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a genomic DNA molecule that contains or consists of a nucleic acid sequence according to SEQ ID NO:2.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную позицию в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9.In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule encoding the variant SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule encoding the variant SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule encoding the variant SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid position at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule encoding the variant SIGIRR protein having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96% , at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule encoding the variant SIGIRR protein having SEQ ID NO:9.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, которая содержит кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:4. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы мРНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:4. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule that contains or consists of from a nucleic acid sequence containing guanine at a position corresponding to position 557 in accordance with SEQ ID NO:4. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule that contains CUA codons and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:4. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule that contains or consists of of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:4. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting an mRNA molecule that contains or consists of from a nucleic acid sequence according to SEQ ID NO:4.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, кодирующей вариантный белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий следующую аминокислотную позицию в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, кодирующей вариантный белок SIGIRR, имеющий по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:9. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, кодирующей вариантный белок SIGIRR, имеющий SEQ ID NO:9.In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule encoding a variant SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule encoding a variant SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule encoding a variant SIGIRR protein truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, and containing the following amino acid position at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro- Pro-Pro-Thr-Ser-Trp (SEQ ID NO:11). In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule encoding a variant SIGIRR protein having at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96% , at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:9. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule encoding a variant SIGIRR protein having SEQ ID NO:9.

В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, содержащей гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, которая содержит кодоны CTA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:6. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты, которая имеет по меньшей мере около 90%, по меньшей мере около 91%, по меньшей мере около 92%, по меньшей мере около 93%, по меньшей мере около 94%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98% или по меньшей мере около 99% идентичности последовательности с SEQ ID NO:6. В некоторых вариантах осуществления наборы содержат по меньшей мере одну пару олигонуклеотидных праймеров (например, специфических в отношении изменения праймеров) для амплификации или по меньшей мере один меченный олигонуклеотидный зонд (например, специфический в отношении изменения зонд) для обнаружения молекулы кДНК, которая содержит или состоит из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO:6. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification, or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a cDNA molecule that contains or consists of from a nucleic acid sequence containing guanine at a position corresponding to position 557 in accordance with SEQ ID NO:6. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , change-specific primers) for amplification or at least one labeled oligonucleotide probe ( e.g. , change-specific probe) for detecting a cDNA molecule that contains CTA codons and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:6. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification, or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a cDNA molecule that contains or consists of of a nucleic acid sequence that is at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity to SEQ ID NO:6. In some embodiments, the kits contain at least one pair of oligonucleotide primers ( e.g. , variation-specific primers) for amplification, or at least one labeled oligonucleotide probe ( e.g. , variation-specific probe) for detecting a cDNA molecule that contains or consists of from a nucleic acid sequence according to SEQ ID NO:6.

В некоторых вариантах осуществления любые из раскрытых в данном документе наборов могут дополнительно содержать любое одно или более из: нуклеотидного лэддера, протокола, фермента (такого как фермент, используемый для амплификации, такой как полимеразная цепная реакция (ПЦР)), дНТФ, буфера, соли или солей и контрольного образца нуклеиновой кислоты. В некоторых вариантах осуществления любые из раскрытых в данном документе наборов могут дополнительно содержать любое одно или более из: пригодной для обнаружения метки, продуктов и реагентов, необходимых для проведения реакции отжига, и инструкций.In some embodiments, any of the kits disclosed herein may further comprise any one or more of: a nucleotide ladder, a protocol, an enzyme (such as an enzyme used for amplification such as polymerase chain reaction (PCR)), a dNTP, a buffer, a salt or salts and a nucleic acid control. In some embodiments, any of the kits disclosed herein may further comprise any one or more of a detectable label, products and reagents necessary to perform the annealing reaction, and instructions.

В некоторых вариантах осуществления раскрытые в данном документе наборы могут содержать праймер или зонд, или специфический в отношении изменения праймер или специфический в отношении изменения зонд, содержащий 3' концевой нуклеотид, который гибридизируется непосредственно с гуанином в позиции, соответствующей позиции 9962 в SEQ ID NO:2, или в позиции, соответствующей позиции 557 в SEQ ID NO:4 и/или SEQ ID NO:6.In some embodiments, kits disclosed herein may contain a primer or probe, or a variation-specific primer or variation-specific probe, containing a 3' terminal nucleotide that hybridizes directly to guanine at a position corresponding to position 9962 in SEQ ID NO: 2, or at the position corresponding to position 557 in SEQ ID NO:4 and/or SEQ ID NO:6.

Специалистам в данной области техники понятно, что применяемые методики обнаружения в общем случае не являются ограничивающими. Точнее, в объем раскрытых способов и наборов входит широкий ряд средств обнаружения при условии, что они позволяют определять наличие или отсутствие ампликона.Those skilled in the art will appreciate that the detection techniques employed are generally not limiting. More precisely, the disclosed methods and kits include a wide range of detection means, provided they are capable of detecting the presence or absence of an amplicon.

В некоторых аспектах наборы могут содержать один или более праймеров или зондов, раскрытых в данном документе. Например, набор может содержать один или более зондов, которые гибридизируются с одним или более из раскрытых генетических вариантов.In some aspects, the kits may contain one or more primers or probes disclosed herein. For example, the kit may contain one or more probes that hybridize to one or more of the disclosed genetic variants.

В некоторых аспектах набор может содержать одну из раскрытых клеток или клеточных линий. В некоторых аспектах набор может содержать материалы, необходимые для создания трансгенной клетки или клеточной линии. Например, в некоторых аспектах набор может содержать клетку и вектор, содержащий последовательность нуклеиновой кислоты, содержащую один или более из раскрытых генетических вариантов. Набор может дополнительно содержать среду для клеточной культуры.In some aspects, the kit may contain one of the disclosed cells or cell lines. In some aspects, the kit may contain materials necessary to create a transgenic cell or cell line. For example, in some aspects, the kit may contain a cell and a vector containing a nucleic acid sequence containing one or more of the disclosed genetic variants. The kit may additionally contain cell culture medium.

В данном раскрытии также предложены способы обнаружения наличия геномной ДНК, мРНК, кДНК и/или полипептида вариантного SIGIRR в биологическом образце от субъекта-человека. Следует понимать, что генные последовательности в популяции, а также мРНК и белки, кодируемые такими генами, могут варьироваться вследствие полиморфизма, такого как однонуклеотидный полиморфизм. Последовательности, приведенные в данном документе для геномной ДНК, мРНК, кДНК и полипептида SIGIRR, являются всего лишь типовыми последовательностями. Также возможны другие последовательности геномной ДНК, мРНК, кДНК и полипептида SIGIRR.This disclosure also provides methods for detecting the presence of genomic DNA, mRNA, cDNA and/or polypeptide of a variant SIGIRR in a biological sample from a human subject. It should be understood that gene sequences in a population, as well as the mRNA and proteins encoded by such genes, may vary due to polymorphism, such as single nucleotide polymorphism. The sequences given herein for genomic DNA, mRNA, cDNA and SIGIRR polypeptide are representative sequences only. Other genomic DNA, mRNA, cDNA and SIGIRR polypeptide sequences are also possible.

Биологический образец может быть получен из любой клетки, ткани или биологической жидкости от субъекта. Образец может содержать любую клинически релевантную ткань, такую как образец костного мозга, биопсия опухоли, тонкоигольный аспират, или образец жидкости организма, такой как кровь, зубодесневая жидкость, плазма, сыворотка, лимфа, асцитная жидкость, кистозная жидкость или моча. В некоторых случаях образец содержит ротовой мазок. Образец, используемый в раскрытых в данном документе способах, будет варьироваться в зависимости от формата анализа, природы способа обнаружения, а также тканей, клеток или экстрактов, которые используются как образец. Биологический образец можно по-разному обрабатывать в зависимости от применяемого анализа. Например, при обнаружении молекулы нуклеиновой кислоты вариантного SIGIRR можно использовать предварительную обработку, предназначенную для выделения или обогащения образца в отношении геномной ДНК. В этих целях можно использовать ряд известных техник. При обнаружении уровня мРНК вариантного SIGIRR можно использовать разные техники для обогащения биологического образца мРНК. Можно использовать различные способы для обнаружения наличия или уровня мРНК или наличия конкретного вариантного локуса геномной ДНК.A biological sample can be obtained from any cell, tissue, or biological fluid from a subject. The sample may contain any clinically relevant tissue, such as a bone marrow sample, a tumor biopsy, a fine needle aspirate, or a body fluid sample such as blood, periodontal fluid, plasma, serum, lymph, ascites fluid, cystic fluid, or urine. In some cases, the sample contains a mouth swab. The sample used in the methods disclosed herein will vary depending on the assay format, the nature of the detection method, and the tissue, cells, or extracts that are used as the sample. A biological sample can be processed differently depending on the assay used. For example, when a SIGIRR variant nucleic acid molecule is detected, preprocessing may be used to isolate or enrich the sample for genomic DNA. A number of known techniques can be used for these purposes. Once the mRNA level of a variant SIGIRR is detected, different techniques can be used to enrich the biological sample for mRNA. Various methods can be used to detect the presence or level of mRNA or the presence of a particular variant locus in genomic DNA.

В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия вариантного белка SIGIRR, включающие секвенирование по меньшей мере части белка в биологическом образце для определения, содержит ли белок аминокислотную последовательность, кодирующую усеченный белок SIGIRR. В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия вариантного белка SIGIRR, включающие секвенирование по меньшей мере части белка в биологическом образце для определения, содержит ли белок аминокислотную последовательность, кодирующую белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия вариантного белка SIGIRR, включающие секвенирование по меньшей мере части белка в биологическом образце для определения, содержит ли белок аминокислотную последовательность, кодирующую белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR protein, comprising sequencing at least a portion of the protein in a biological sample to determine whether the protein contains an amino acid sequence encoding a truncated SIGIRR protein. In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR protein, comprising sequencing at least a portion of the protein in a biological sample to determine whether the protein contains an amino acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR protein, comprising sequencing at least a portion of the protein in a biological sample to determine whether the protein contains an amino acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия молекулы нуклеиновой кислоты вариантного SIGIRR, включающие секвенирование по меньшей мере части нуклеиновой кислоты в биологическом образце для определения, содержит ли нуклеиновая кислота последовательность нуклеиновой кислоты, кодирующую усеченный белок SIGIRR. В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия молекулы нуклеиновой кислоты вариантного SIGIRR, включающие секвенирование по меньшей мере части нуклеиновой кислоты в биологическом образце для определения, содержит ли нуклеиновая кислота последовательность нуклеиновой кислоты, кодирующую белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления в данном раскрытии предложены способы обнаружения наличия или отсутствия молекулы нуклеиновой кислоты вариантного SIGIRR, включающие секвенирование по меньшей мере части нуклеиновой кислоты в биологическом образце для определения, содержит ли нуклеиновая кислота последовательность нуклеиновой кислоты, кодирующую белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. Любую их раскрытых в данном документе вариантных молекул нуклеиновых кислот можно обнаруживать, используя любые из описанных в данном документе зондов и праймеров.In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR nucleic acid molecule, comprising sequencing at least a portion of the nucleic acid in a biological sample to determine whether the nucleic acid contains a nucleic acid sequence encoding a truncated SIGIRR protein. In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR nucleic acid molecule, comprising sequencing at least a portion of the nucleic acid in a biological sample to determine whether the nucleic acid contains a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9. In some embodiments, this disclosure provides methods for detecting the presence or absence of a variant SIGIRR nucleic acid molecule, comprising sequencing at least a portion of the nucleic acid in a biological sample to determine whether the nucleic acid contains a nucleic acid sequence encoding a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, and containing serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. Any of the variant nucleic acid molecules disclosed herein can be detected using any of the probes and primers described herein.

В некоторых вариантах осуществления способы обнаружения наличия или отсутствия связанной с воспалительных заболеванием кишечника молекулы нуклеиновой кислоты вариантного SIGIRR или связанной с воспалительных заболеванием кишечника с началом в раннем возрасте молекулы нуклеиновой кислоты вариантного SIGIRR (например, геномной ДНК, мРНК или кДНК) у субъекта, включающие: проведение анализа биологического образца, полученного от субъекта, который позволяет определить, содержит ли молекула нуклеиновой кислоты в биологическом образце любые из раскрытых в данном документе последовательностей нуклеиновых кислот вариантного SIGIRR (например, молекулу нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, молекулу нуклеиновой кислоты, которая кодирует белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, молекулу нуклеиновой кислоты, которая кодирует белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащий серин в позиции, соответствующей позиции 186 в соответствии SEQ ID NO:9). В некоторых вариантах осуществления биологический образец содержит клетку или клеточный лизат. Такие способы могут дополнительно включать, например, получение биологического образца от субъекта, содержащего геномную ДНК или мРНК SIGIRR, и, в случае мРНК, необязательно, обратное транскрибирование мРНК в кДНК, и проведение анализа биологического образца, который позволяет определить, кодирует ли позиция геномной ДНК, мРНК или кДНК SIGIRR усеченный белок SIGIRR. Такие способы могут дополнительно включать, например, получение биологического образца от субъекта, содержащего геномную ДНК или мРНК SIGIRR, и, в случае мРНК, необязательно, обратное транскрибирование мРНК в кДНК, и проведение анализа биологического образца, который позволяет определить, кодирует ли позиция геномной ДНК, мРНК или кДНК SIGIRR белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии SEQ ID NO:9, проведение анализа биологического образца, который позволяет определить, кодирует ли позиция геномной ДНК, мРНК или кДНК SIGIRR белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии SEQ ID NO:9 и содержащий серин в позиции, соответствующей позиции 186 в соответствии SEQ ID NO:9. Такие методы анализа могут включать, например, определение идентичности этих позиций конкретной молекулы нуклеиновой кислоты SIGIRR. В некоторых вариантах осуществления субъект является человеком.In some embodiments, methods for detecting the presence or absence of an inflammatory bowel disease-associated variant SIGIRR nucleic acid molecule or an early-onset inflammatory bowel disease-associated variant SIGIRR nucleic acid molecule ( e.g. , genomic DNA, mRNA, or cDNA) in a subject, comprising: performing an assay on a biological sample obtained from a subject that determines whether a nucleic acid molecule in the biological sample contains any of the variant SIGIRR nucleic acid sequences disclosed herein ( e.g. , a nucleic acid molecule that encodes a truncated SIGIRR protein, a nucleic acid molecule that encodes a SIGIRR protein truncated at position 215 according to SEQ ID NO:9, a nucleic acid molecule that encodes a SIGIRR protein truncated at position 215 according to SEQ ID NO:9 and containing a serine at position , corresponding to position 186 in accordance with SEQ ID NO:9). In some embodiments, the biological sample comprises a cell or cell lysate. Such methods may further include, for example, obtaining a biological sample from a subject containing genomic DNA or SIGIRR mRNA, and, in the case of mRNA, optionally, reverse transcribing the mRNA into cDNA, and performing an analysis of the biological sample that determines whether the position encodes the genomic DNA , SIGIRR mRNA or cDNA truncated SIGIRR protein. Such methods may further include, for example, obtaining a biological sample from a subject containing genomic DNA or SIGIRR mRNA, and, in the case of mRNA, optionally, reverse transcribing the mRNA into cDNA, and performing an analysis of the biological sample that determines whether the position encodes the genomic DNA , SIGIRR mRNA, or cDNA SIGIRR protein truncated at position 215 of SEQ ID NO:9, performing an assay on a biological sample that determines whether a position in the genomic DNA, mRNA, or cDNA encodes a SIGIRR protein truncated at position corresponding to position 215 in accordance with SEQ ID NO:9 and containing serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. Such assays may include, for example, determining the identity of these positions on a particular SIGIRR nucleic acid molecule. In some embodiments, the subject is a human.

В некоторых вариантах осуществления анализ включает: секвенирование по меньшей мере части последовательности геномной ДНК SIGIRR молекулы нуклеиновой кислоты в биологическом образце от субъекта, причем секвенируемая часть включает позицию, соответствующую позиции, кодирующей серин в позиции 186 в белке SIGIRR в соответствии с SEQ ID NO:9; секвенирование по меньшей мере части последовательности мРНК SIGIRR молекулы нуклеиновой кислоты в биологическом образце от субъекта, причем секвенируемая часть включает позицию, соответствующую позиции, кодирующей серин в позиции 186 в белке SIGIRR в соответствии с SEQ ID NO:9; или секвенирование по меньшей мере части последовательности кДНК SIGIRR молекулы нуклеиновой кислоты в биологическом образце от субъекта, причем секвенируемая часть включает позицию, соответствующую позиции, кодирующей серин в позиции 186 в белке SIGIRR в соответствии с SEQ ID NO:9.In some embodiments, the analysis includes: sequencing at least a portion of the genomic DNA sequence of a SIGIRR nucleic acid molecule in a biological sample from the subject, wherein the portion to be sequenced includes a position corresponding to the position encoding serine at position 186 in the SIGIRR protein in accordance with SEQ ID NO:9 ; sequencing at least a portion of the SIGIRR mRNA sequence of a nucleic acid molecule in a biological sample from the subject, wherein the sequenced portion includes a position corresponding to the position encoding serine at position 186 in the SIGIRR protein in accordance with SEQ ID NO:9; or sequencing at least a portion of the SIGIRR cDNA sequence of a nucleic acid molecule in a biological sample from the subject, wherein the sequenced portion includes a position corresponding to the position encoding serine at position 186 in the SIGIRR protein in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления анализ включает: a) приведение биологического образца в контакт с праймером, гибридизирующимся с: i) частью последовательности геномной ДНК SIGIRR, которая находится вблизи позиции геномной последовательности SIGIRR в позиции, соответствующей позиции, кодирующей серин в позиции 186 в соответствии с SEQ ID NO:9; ii) частью последовательности мРНК SIGIRR, которая находится вблизи позиции последовательности мРНК SIGIRR в позиции, соответствующей позиции, кодирующей серин в позиции 186 в соответствии с SEQ ID NO:9; или iii) частью последовательности кДНК SIGIRR, которая находится вблизи позиции последовательности кДНК SIGIRR в позиции, соответствующей позиции, кодирующей серин в позиции 186 в соответствии с SEQ ID NO:9; b) удлинение праймера по меньшей мере через: i) позицию последовательности геномной ДНК SIGIRR, соответствующую нуклеотидным позициям за пределами кодона, кодирующего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; ii) позицию последовательности мРНК SIGIRR, соответствующую нуклеотидным позициям за пределами кодона, кодирующего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; или iii) позицию последовательности кДНК SIGIRR, соответствующую нуклеотидным позициям за пределами кодона, кодирующего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; и c) определение, содержит ли продукт удлинения праймера нуклеотиды, кодирующие серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления проводят анализ только геномной ДНК SIGIRR. В некоторых вариантах осуществления проводят анализ только мРНК SIGIRR. В некоторых вариантах осуществления проводят анализ только кДНК SIGIRR, полученной из мРНК SIGIRR.In some embodiments, the analysis includes: a) contacting the biological sample with a primer that hybridizes to: i) a portion of the SIGIRR genomic DNA sequence that is proximal to the position of the SIGIRR genomic DNA sequence at a position corresponding to the position encoding serine at position 186 in accordance with SEQ ID NO:9; ii) part of the SIGIRR mRNA sequence which is adjacent to the position of the SIGIRR mRNA sequence at a position corresponding to the position encoding serine at position 186 in accordance with SEQ ID NO:9; or iii) a portion of the SIGIRR cDNA sequence that is adjacent to a position of the SIGIRR cDNA sequence at a position corresponding to the position encoding serine at position 186 in accordance with SEQ ID NO:9; b) extending the primer through at least: i) a genomic DNA sequence position SIGIRR corresponding to nucleotide positions beyond the codon encoding the serine at the position corresponding to position 186 in accordance with SEQ ID NO:9; ii) a SIGIRR mRNA sequence position corresponding to nucleotide positions beyond the codon encoding serine at the position corresponding to position 186 according to SEQ ID NO:9; or iii) a SIGIRR cDNA sequence position corresponding to nucleotide positions beyond the codon encoding the serine at the position corresponding to position 186 in accordance with SEQ ID NO:9; and c) determining whether the primer extension product contains nucleotides encoding a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, only SIGIRR genomic DNA is analyzed. In some embodiments, only SIGIRR mRNA is analyzed. In some embodiments, only the SIGIRR cDNA derived from the SIGIRR mRNA is analyzed.

В некоторых вариантах осуществления анализ включает: a) приведение биологического образца в контакт со специфическим в отношении изменения праймером, гибридизирующимся с i) частью последовательности геномной ДНК SIGIRR, содержащей нуклеотиды, кодирующие серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; ii) частью последовательности мРНК SIGIRR, содержащей нуклеотиды, кодирующие серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; или iii) частью последовательности кДНК SIGIRR, содержащей нуклеотиды, кодирующие серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; b) удлинение праймера, используя метод специфической в отношении изменения полимеразной цепной реакции; и c) определение, произошло ли удлинение. Методы специфической в отношении изменения полимеразной цепной реакции можно использовать для обнаружения мутаций, таких как делеции в последовательности нуклеиновой кислоты. Специфические в отношении изменения праймеры используют, поскольку ДНК-полимераза не обеспечивает удлинение при наличии несовпадения с матрицей. В распоряжении специалистов в данной области техники имеется ряд вариаций базового метода специфической в отношении изменения полимеразной цепной реакции.In some embodiments, the analysis includes: a) contacting the biological sample with a variation-specific primer that hybridizes to i) a portion of the genomic DNA sequence SIGIRR containing nucleotides encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 ; ii) part of the SIGIRR mRNA sequence containing nucleotides encoding serine at a position corresponding to position 186 in accordance with SEQ ID NO:9; or iii) part of the SIGIRR cDNA sequence containing nucleotides encoding serine at the position corresponding to position 186 in accordance with SEQ ID NO:9; b) primer extension using a variation-specific polymerase chain reaction method; and c) determining whether elongation has occurred. Variation-specific polymerase chain reaction techniques can be used to detect mutations such as deletions in a nucleic acid sequence. Variation-specific primers are used because DNA polymerase does not provide extension in the presence of a template mismatch. A number of variations on the basic variation-specific polymerase chain reaction method are available to those skilled in the art.

Специфический в отношении изменения праймер может содержать последовательность нуклеиновой кислоты, которая является комплементарной к последовательности нуклеиновой кислоты, кодирующей белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, или комплементарной цепи к последовательности нуклеиновой кислоты. Например, специфический в отношении изменения праймер может содержать последовательность нуклеиновой кислоты, которая является комплементарной к последовательности нуклеиновой кислоты, кодирующей SEQ ID NO:9, или к комплементарной цепи к этой последовательности нуклеиновой кислоты. Специфический в отношении изменения праймер предпочтительно специфически гибридизируется с последовательностью нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, когда последовательность нуклеиновой кислоты кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. The change-specific primer may contain a nucleic acid sequence that is complementary to a nucleic acid sequence encoding a SIGIRR protein containing a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, or a complementary strand to the nucleic acid sequence. For example, the variation-specific primer may contain a nucleic acid sequence that is complementary to the nucleic acid sequence encoding SEQ ID NO:9, or to a complementary strand to that nucleic acid sequence. The variation-specific primer preferably specifically hybridizes to a nucleic acid sequence encoding the variant SIGIRR protein when the nucleic acid sequence encodes a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления анализ включает приведение биологического образца в контакт с праймером или зондом, который специфически гибридизируется с последовательностью геномной ДНК, последовательностью мРНК или последовательностью кДНК вариантного SIGIRR, но не с соответствующей последовательностью SIGIRR дикого типа, в жестких условиях, и определение, произошла ли гибридизация.In some embodiments, the assay includes contacting a biological sample with a primer or probe that specifically hybridizes to a genomic DNA sequence, an mRNA sequence, or a cDNA sequence of a variant SIGIRR , but not to a corresponding wild-type SIGIRR sequence, under stringent conditions, and determining whether hybridization.

В некоторых вариантах осуществления анализ включает секвенирование РНК (РНК-секвенирование). В некоторых вариантах осуществления анализ также включает обратное транскрибирование мРНК в кДНК посредством полимеразной цепной реакции с обратной транскриптазой (ОТ-ПЦР). In some embodiments, the analysis includes RNA sequencing (RNA-seq). In some embodiments, the analysis also includes reverse transcribing the mRNA into cDNA via reverse transcriptase polymerase chain reaction (RT-PCR).

В некоторых вариантах осуществления в способах используют зонды и праймеры достаточной нуклеотидной длины, чтобы связывать целевую последовательность нуклеиновой кислоты и специфически обнаруживать и/или идентифицировать полинуклеотид, содержащий геномную ДНК, мРНК или кДНК вариантного SIGIRR. Гибридизационные условия или реакционные условия могут быть определены оператором для достижения этого результата. Нуклеотидная длина может представлять собой любую длину, достаточную для применения в выбранном способе обнаружения, включая любой анализ, описанный или проиллюстрированный в данном документе. В общем случае, например, используют зонды или праймеры, имеющие около 8, около 10, около 11, около 12, около 14, около 15, около 16, около 18, около 20, около 22, около 24, около 26, около 28, около 30, около 40, около 50, около 75, около 100, около 200, около 300, около 400, около 500, около 600 или около 700 нуклеотидов или более, или от около 11 до около 20, от около 20 до около 30, от около 30 до около 40, от около 40 до около 50, от около 50 до около 100, от около 100 до около 200, от около 200 до около 300, от около 300 до около 400, от около 400 до около 500, от около 500 до около 600, от около 600 до около 700 или от около 700 до около 800 или более нуклеотидов в длину. В предпочтительных вариантах осуществления зонд или праймер имеет длину по меньшей мере около 18 нуклеотидов. Зонд или праймер может иметь длину, составляющую от около 10 до около 35, от около 10 до около 30, от около 10 до около 25, от около 12 до около 30, от около 12 до около 28, от около 12 до около 24, от около 15 до около 30, от около 15 до около 25, от около 18 до около 30, от около 18 до около 25, от около 18 до около 24 или от около 18 до около 22 нуклеотидов. В предпочтительных вариантах осуществления зонд или праймер имеет длину, составляющую от около 18 до около 30 нуклеотидов.In some embodiments, the methods use probes and primers of sufficient nucleotide length to bind a target nucleic acid sequence and specifically detect and/or identify a polynucleotide comprising genomic DNA, mRNA, or cDNA of a SIGIRR variant. Hybridization conditions or reaction conditions can be determined by the operator to achieve this result. The nucleotide length can be any length sufficient for use in the selected detection method, including any assay described or illustrated herein. In general, for example, probes or primers having about 8, about 10, about 11, about 12, about 14, about 15, about 16, about 18, about 20, about 22, about 24, about 26, about 28 are used. , about 30, about 40, about 50, about 75, about 100, about 200, about 300, about 400, about 500, about 600 or about 700 nucleotides or more, or about 11 to about 20, about 20 to about 30, from about 30 to about 40, from about 40 to about 50, from about 50 to about 100, from about 100 to about 200, from about 200 to about 300, from about 300 to about 400, from about 400 to about 500 , from about 500 to about 600, from about 600 to about 700, or from about 700 to about 800 or more nucleotides in length. In preferred embodiments, the probe or primer is at least about 18 nucleotides in length. The probe or primer may have a length of about 10 to about 35, about 10 to about 30, about 10 to about 25, about 12 to about 30, about 12 to about 28, about 12 to about 24, about 15 to about 30, about 15 to about 25, about 18 to about 30, about 18 to about 25, about 18 to about 24, or about 18 to about 22 nucleotides. In preferred embodiments, the probe or primer is between about 18 and about 30 nucleotides in length.

Такие зонды и праймеры могут специфически гибридизироваться с целевой последовательностью в условиях гибридизации высокой жесткости. Зонды и праймеры могут иметь полную идентичность последовательности нуклеиновой кислоты из смежных нуклеотидов с целевой последовательностью, хотя с помощью традиционных способов можно конструировать зонды, отличающиеся от последовательности целевой нуклеиновой кислоты, но которые сохраняют способность специфически обнаруживать и/или идентифицировать последовательность целевой нуклеиновой кислоты. Соответственно, зонды и праймеры могут иметь около 80%, около 85%, около 90%, около 91%, около 92%, около 93%, около 94%, около 95%, около 96%, около 97%, около 98%, около 99% или 100% идентичности или комплементарности последовательности с целевой молекулой нуклеиновой кислоты.Such probes and primers can hybridize specifically to the target sequence under high stringency hybridization conditions. Probes and primers may have complete nucleic acid sequence identity from contiguous nucleotides to the target sequence, although conventional methods can construct probes that differ from the target nucleic acid sequence but retain the ability to specifically detect and/or identify the target nucleic acid sequence. Accordingly, probes and primers may have about 80%, about 85%, about 90%, about 91%, about 92%, about 93%, about 94%, about 95%, about 96%, about 97%, about 98% , about 99% or 100% sequence identity or complementarity with the target nucleic acid molecule.

В некоторых вариантах осуществления специфические праймеры можно использовать, чтобы амплифицировать локус вариантного SIGIRR и/или мРНК или кДНК вариантного SIGIRR, чтобы получить ампликон, который можно использовать в качестве специфического зонда, или который можно обнаруживать сам по себе для идентификации локуса вариантного SIGIRR или для определения уровня специфических мРНК или кДНК SIGIRR в биологическом образце. Локус вариантного SIGIRR можно использовать для обозначения последовательности геномной нуклеиновой кислоты, включающей позиции, соответствующие позициям, кодирующим серин в позиции 186 в соответствии с SEQ ID NO:9. Когда зонд гибридизируют с молекулой нуклеиновой кислоты в биологическом образце в условиях, которые обеспечивают связывание зонда с молекулой нуклеиновой кислоты, это связывание может быть обнаружено и обеспечивать показание наличия локуса вариантного SIGIRR или наличия уровня мРНК или кДНК вариантного SIGIRR в биологическом образце. Такая идентификация связанного зонда была описана. Специфический зонд может содержать последовательность, которая является на по меньшей мере около 80%, от около 80% до около 85%, от около 85% до около 90%, от около 90% до около 95% и от около 95% до около 100% идентичной (или комплементарной) конкретной области гена вариантного SIGIRR. Специфический зонд может содержать последовательность, которая является на по меньшей мере около 80%, от около 80% до около 85%, от около 85% до около 90%, от около 90% до около 95% и от около 95% до около 100% идентичной (или комплементарной) конкретной области мРНК вариантного SIGIRR. Специфический зонд может содержать последовательность, которая является на по меньшей мере около 80%, от около 80% до около 85%, от около 85% до около 90%, от около 90% до около 95% и от около 95% до около 100% идентичной (или комплементарной) конкретной области кДНК вариантного SIGIRR.In some embodiments, specific primers can be used to amplify the variant SIGIRR locus and/or variant SIGIRR mRNA or cDNA to produce an amplicon that can be used as a specific probe, or that can be detected on its own to identify the variant SIGIRR locus or to detect the level of specific SIGIRR mRNA or cDNA in a biological sample. The variant SIGIRR locus can be used to designate a genomic nucleic acid sequence comprising positions corresponding to the positions encoding serine at position 186 in accordance with SEQ ID NO:9. When a probe is hybridized to a nucleic acid molecule in a biological sample under conditions that allow the probe to bind to the nucleic acid molecule, this binding can be detected and provide an indication of the presence of a variant SIGIRR locus or the presence of a variant SIGIRR mRNA or cDNA level in the biological sample. Such identification of the associated probe has been described. The specific probe may contain a sequence that is at least about 80%, from about 80% to about 85%, from about 85% to about 90%, from about 90% to about 95%, and from about 95% to about 100 % identical (or complementary) to a specific region of the variant SIGIRR gene. The specific probe may contain a sequence that is at least about 80%, from about 80% to about 85%, from about 85% to about 90%, from about 90% to about 95%, and from about 95% to about 100 % identical (or complementary) to a specific region of the variant SIGIRR mRNA. The specific probe may contain a sequence that is at least about 80%, from about 80% to about 85%, from about 85% to about 90%, from about 90% to about 95%, and from about 95% to about 100 % identical (or complementary) to a specific cDNA region of a variant SIGIRR .

В некоторых вариантах осуществления, чтобы определить, содержит ли комплементарная цепь нуклеиновой кислоты биологического образца последовательность нуклеиновой кислоты, кодирующую вариантный белок SIGIRR (например, усеченный белок SIGIRR или вариантный белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9), биологический образец можно подвергать амплификации нуклеиновой кислоты, используя пару праймеров, которая содержит первый праймер, полученный из 5' фланкирующей последовательности, смежной с позициями, кодирующими серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и второй праймер, полученный из 3' фланкирующей последовательности, смежной с позициями, кодирующими серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, для получения ампликона, являющегося диагностическим в отношении наличия нуклеотидов в позициях, кодирующих серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления длина ампликона может варьироваться от комбинированной длины пар праймеров плюс одна пара нуклеотидных оснований до любой длины ампликона, получаемой с помощью протокола амплификации ДНК. Это расстояние может варьироваться от одной пары нуклеотидных оснований до ограничения реакции амплификации или до около двадцати тысяч пар нуклеотидных оснований. Необязательно, пара праймеров фланкирует область, включающую позиции, кодирующие серин в позиции 186 в соответствии с SEQ ID NO:9, и по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более нуклеотидов с каждой стороны позиций, кодирующих серин в позиции 186 в соответствии с SEQ ID NO:9. Аналогичные ампликоны можно создавать из последовательностей мРНК и/или кДНК.In some embodiments, to determine whether the complementary nucleic acid strand of a biological sample contains a nucleic acid sequence encoding a variant SIGIRR protein (e.g., a truncated SIGIRR protein or a variant SIGIRR protein containing a serine at the position corresponding to position 186 according to SEQ ID NO: 9), a biological sample can be subjected to nucleic acid amplification using a primer pair that contains a first primer derived from the 5' flanking sequence adjacent to the positions encoding the serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, and a second a primer derived from the 3' flanking sequence adjacent to the positions encoding the serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, to produce an amplicon that is diagnostic of the presence of nucleotides at the positions encoding the serine at the position corresponding to the position 186 according to SEQ ID NO:9. In some embodiments, the amplicon length may vary from the combined length of the primer pairs plus one nucleotide base pair to any amplicon length obtained using a DNA amplification protocol. This distance can vary from one nucleotide base pair to the limit of the amplification reaction, or up to about twenty thousand nucleotide base pairs. Optionally, the primer pair flanks a region including positions encoding serine at position 186 according to SEQ ID NO:9, and at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more nucleotides on each side of positions encoding serine at position 186 in accordance with SEQ ID NO:9. Similar amplicons can be generated from mRNA and/or cDNA sequences.

Типовые способы получения и применения зондов и праймеров описаны, например, в Molecular Cloning: A Laboratory Manual, 2nd Ed., Vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. 1989 (hereinafter, “Sambrook et al., 1989”); Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, New York, 1992 (с периодическими обновлениями) (далее по тексту “Ausubel et al., 1992”); и Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990). Пары ПЦР-праймеров могут быть получены из известной последовательности, например, с помощью компьютерных программ, предназначенных для этих целей, таких как инструмент анализа ПЦР-праймеров в Vector NTI, версия 10 (Informax Inc., Bethesda Md.); PrimerSelect (DNASTAR Inc., Madison, Wis.); и Primer3 (Version 0.4.0.COPYRGT., 1991, Whitehead Institute for Biomedical Research, Cambridge, Mass.). Кроме того, последовательность можно изучать визуально и идентифицировать праймеры вручную, используя известные руководства.Typical methods for preparing and using probes and primers are described, for example, in Molecular Cloning: A Laboratory Manual, 2 nd Ed., Vol. 1-3, ed. Sambrook et al. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 1989 (hereinafter, “Sambrook et al. , 1989”); Current Protocols in Molecular Biology , ed. Ausubel et al. , Greene Publishing and Wiley-Interscience, New York, 1992 (with periodic updates) (hereinafter referred to as “Ausubel et al. , 1992”); and Innis et al. , PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990). PCR primer pairs can be generated from a known sequence, for example, using computer programs designed for this purpose, such as the Vector NTI PCR Primer Analysis Tool, version 10 (Informax Inc., Bethesda Md.); PrimerSelect (DNASTAR Inc., Madison, Wis.); and Primer3 (Version 0.4.0.COPYRGT., 1991, Whitehead Institute for Biomedical Research, Cambridge, Mass.). In addition, the sequence can be examined visually and primers can be identified manually using known guidelines.

Любой способ гибридизации или амплификации, или секвенирования нуклеиновых кислот можно использовать для специфического обнаружения наличия генного локуса вариантного SIGIRR и/или уровня мРНК или кДНК, полученной из мРНК, вариантного SIGIRR. В некоторых вариантах осуществления молекулу нуклеиновой кислоты можно использовать в качестве праймера для амплификации области нуклеиновой кислоты SIGIRR или же молекулу нуклеиновой кислоты можно использовать в качестве зонда, который специфически гибридизируется, например, в жестких условиях, с молекулой нуклеиновой кислоты, содержащей генный локус вариантного SIGIRR, или молекулой нуклеиновой кислоты, содержащей мРНК или кДНК, полученную из мРНК, вариантного SIGIRR.Any hybridization or amplification or nucleic acid sequencing method can be used to specifically detect the presence of the SIGIRR variant gene locus and/or the level of mRNA or cDNA derived from the SIGIRR variant mRNA. In some embodiments, the nucleic acid molecule can be used as a primer to amplify a region of a SIGIRR nucleic acid, or the nucleic acid molecule can be used as a probe that specifically hybridizes, for example, under stringent conditions, to a nucleic acid molecule containing a variant SIGIRR gene locus. or a nucleic acid molecule containing mRNA or cDNA derived from a SIGIRR variant mRNA.

В данной области техники доступен ряд методик, включая, например, секвенирование нуклеиновых кислот, гибридизацию нуклеиновых кислот и амплификацию нуклеиновых кислот. Иллюстративные примеры методик секвенирования нуклеиновых кислот включают, но не ограничиваются этим, секвенирование с терминатором синтеза цепи (по Сэнгеру) и секвенирование с меченным красителем терминатором. A number of techniques are available in the art, including, for example, nucleic acid sequencing, nucleic acid hybridization, and nucleic acid amplification. Illustrative examples of nucleic acid sequencing techniques include, but are not limited to, strand terminator (Sanger) sequencing and dye terminator sequencing.

Другие способы включают способы гибридизации нуклеиновых кислот, отличные от секвенирования, включая применение меченных праймеров и зондов, направленных против очищенной ДНК, амплифицированной ДНК и фиксированных клеточных препаратов (флуоресцентная гибридизация in situ (FISH)). В некоторых способах целевую нуклеиновую кислоту можно амплифицировать до обнаружения или одновременно с ним. Иллюстративные примеры методик амплификации нуклеиновых кислот включают, но не ограничиваются этим, полимеразную цепную реакцию (ПЦР), лигазную цепную реакцию (ЛЦР), амплификацию с замещением цепей (АЗЦ) и амплификацию на основании последовательности нуклеиновой кислоты (АОПНК). Другие способы включают, но не ограничиваются этим, лигазную цепную реакцию, амплификацию с замещением цепей и термофильную АЗЦ (тАЗЦ).Other methods include nucleic acid hybridization methods other than sequencing, including the use of labeled primers and probes directed against purified DNA, amplified DNA, and fixed cell preparations (fluorescence in situ hybridization (FISH)). In some methods, the target nucleic acid can be amplified prior to or simultaneously with detection. Illustrative examples of nucleic acid amplification techniques include, but are not limited to, polymerase chain reaction (PCR), ligase chain reaction (LCR), strand displacement amplification (CDA), and nucleic acid sequence-based amplification (NASA). Other methods include, but are not limited to, ligase chain reaction, strand displacement amplification, and thermophilic ADZ (tAZC).

Для обнаружения как неамплифицированных, так и амплифицированных полинуклеотидов можно применять любой способ, включая, например, анализ защиты гибридизации (АЗГ), количественную оценку процесса амплификации в режиме реального времени и определение количества целевой последовательности, изначально присутствующего в образце, в основе которого не лежит амплификация в режиме реального времени.Any method can be used to detect both unamplified and amplified polynucleotides, including, for example, hybridization protection analysis (HPA), real-time quantification of the amplification process, and determination of the amount of target sequence initially present in a non-amplified sample. in real time.

Также предложены способы идентификации нуклеиновых кислот, которые необязательно требуют амплификации последовательности и которые основаны, например, на известных способах саузерн-блот гибридизации (ДНК:ДНК), гибридизации in situ (ISH) и флуоресцентной гибридизации in situ (FISH) хромосомного материала. Саузерн-блоттинг можно применять для обнаружения конкретных последовательностей нуклеиновых кислот. В таких способах нуклеиновую кислоту, которую экстрагируют из образца, фрагментируют, электрофоретически разделяют на матричном геле и переносят на мембранный фильтр. Связанную с фильтром нуклеиновую кислоту подвергают гибридизации с меченым зондом, комплементарным представляющей интерес последовательности. Проводят обнаружение гибридизированного зонда, связанного с фильтром. В любом из таких способов процесс может включать гибридизацию с использованием любого из зондов, описанных или проиллюстрированных в данном документе.Also provided are methods for identifying nucleic acids that do not necessarily require sequence amplification and that are based, for example, on known Southern blot hybridization (DNA:DNA), in situ hybridization (ISH) and fluorescence in situ hybridization (FISH) methods of chromosomal material. Southern blotting can be used to detect specific nucleic acid sequences. In such methods, the nucleic acid that is extracted from the sample is fragmented, electrophoretically separated on a matrix gel, and transferred to a membrane filter. The filter-bound nucleic acid is hybridized with a labeled probe complementary to the sequence of interest. Detection of the hybridized probe associated with the filter is carried out. In any such method, the process may involve hybridization using any of the probes described or illustrated herein.

В способах гибридизации можно применять жесткие условия так, чтобы зонд или праймер специфически гибридизировался со своей мишенью. В некоторых вариантах осуществления полинуклеотидный праймер или зонд будет гибридизироваться в жестких условиях со своей целевой последовательностью (например, генным локусом вариантного SIGIRR, мРНК вариантного SIGIRR или кДНК вариантного SIGIRR) в заметно большей степени, чем с другими последовательностями (например, соответствующим локусом SIGIRR дикого типа, мРНК дикого типа или кДНК дикого типа), например, по меньшей мере в 2 раза, по меньшей мере в 3 раза, по меньшей мере в 4 раза или более превышающей фон, включая более чем 10-кратное превышение фона. В некоторых вариантах осуществления полинуклеотидный праймер или зонд будет гибридизироваться в жестких условиях со своей целевой последовательностью в заметно большей степени, чем с другими последовательностями, по меньшей мере в 2 раза. В некоторых вариантах осуществления полинуклеотидный праймер или зонд будет гибридизироваться в жестких условиях со своей целевой последовательностью в заметно большей степени, чем с другими последовательностями, по меньшей мере в 3 раза. В некоторых вариантах осуществления полинуклеотидный праймер или зонд будет гибридизироваться в жестких условиях со своей целевой последовательностью в заметно большей степени, чем с другими последовательностями, по меньшей мере в 4 раза. В некоторых вариантах осуществления полинуклеотидный праймер или зонд будет гибридизироваться в жестких условиях со своей целевой последовательностью в заметно большей степени, чем с другими последовательностями, более чем в 10 раза превышающей фон. Условия жесткости зависят от последовательности и будут разниться в разных обстоятельствах. Регулируя условия жесткости гибридизации и/или промывки, можно идентифицировать целевые последовательности, которые на 100% комплементарны зонду (гомологичное зондирование). В альтернативном варианте, условия жесткости можно регулировать так, чтобы допустить некоторое несовпадение в последовательностях так, чтобы можно было обнаруживать идентичность меньшей степени (гетерологичное зондирование). Hybridization methods can employ stringent conditions so that the probe or primer specifically hybridizes to its target. In some embodiments, the polynucleotide primer or probe will hybridize under stringent conditions to its target sequence ( e.g. , a variant SIGIRR gene locus, variant SIGIRR mRNA, or variant SIGIRR cDNA) to a markedly greater extent than to other sequences ( e.g. , the corresponding wild-type SIGIRR locus , wild-type mRNA or wild-type cDNA), for example, at least 2 times, at least 3 times, at least 4 times or more above background, including more than 10 times above background. In some embodiments, the polynucleotide primer or probe will hybridize under stringent conditions to its target sequence to a markedly greater extent than to other sequences, by at least a factor of 2. In some embodiments, the polynucleotide primer or probe will hybridize under stringent conditions to its target sequence to a markedly greater extent than to other sequences, by at least 3-fold. In some embodiments, the polynucleotide primer or probe will hybridize under stringent conditions to its target sequence to a markedly greater extent than to other sequences, by at least 4-fold. In some embodiments, the polynucleotide primer or probe will hybridize under stringent conditions to its target sequence to a markedly greater extent than to other sequences, greater than 10 times background. The stringency conditions depend on the sequence and will vary in different circumstances. By adjusting the hybridization stringency and/or washing conditions, target sequences that are 100% complementary to the probe can be identified (homologous probing). Alternatively, the stringency conditions can be adjusted to allow some sequence mismatch so that lesser degrees of identity can be detected (heterologous probing).

Соответствующие условия жесткости, которые стимулируют гибридизацию ДНК, например, 6X хлорид натрия/цитрат натрия (SSC) при около 45°C с последующей промывкой 2X SSC при 50°C, являются известными и описаны в Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. Как правило, жесткие условия для гибридизации и обнаружения являются такими, при которых концентрация соли составляет менее чем около 1,5 М ионов Na, как правило, это концентрация от около 0,01 до 1,0 М ионов Na (или других солей) при pH 7,0-8,3 и температуре, составляющей по меньшей мере 30°C для коротких зондов (например, 10-50 нуклеотидов) и по меньшей мере около 60°C для более длинных зондов (например, более 50 нуклеотидов). Жесткие условия также можно обеспечить путем добавления дестабилизирующих агентов, таких как формамид. Типовые условия низкой жесткости включают гибридизацию с буферным раствором из 30-35% формамида, 1 М NaCl, 1% ДСН (додецилсульфат натрия) при 37°C и промывку в 1X - 2X SSC (20X SSC=3,0 М NaCl/0,3 М тринатрийцитрат) при 50-55°C. Типовые условия умеренной жесткости включают гибридизацию в 40-45% формамиде, 1,0 М NaCl, 1% ДСН при 37°C и промывку в 0,5X - 1X SSC при 55-60°C. Типовые условия высокой жесткости включают гибридизацию в 50% формамиде, 1 М NaCl, 1% ДСН при 37°C и промывку в 0,1X SSC при 60-65°C. Необязательно, промывочные буферы могут содержать от около 0,1% до около 1% ДСН. Длительность гибридизации в общем случае составляет менее 24 часов, обычно от около 4 до около 12 часов. Длительность промывки должна составлять по меньшей мере отрезок времени, достаточный для достижения равновесия.Appropriate stringency conditions that stimulate DNA hybridization, such as 6X sodium chloride/sodium citrate (SSC) at about 45°C followed by a 2X SSC wash at 50°C, are known and are described in Current Protocols in Molecular Biology , John Wiley & Sons , NY (1989), 6.3.1-6.3.6. Typically, stringent conditions for hybridization and detection are those where the salt concentration is less than about 1.5 M Na ions, typically a concentration of about 0.01 to 1.0 M Na ions (or other salts) at pH 7.0-8.3 and a temperature of at least 30°C for short probes ( eg , 10-50 nucleotides) and at least about 60°C for longer probes ( eg , more than 50 nucleotides). Harsh conditions can also be achieved by adding destabilizing agents such as formamide. Typical low stringency conditions include hybridization with a buffer solution of 30-35% formamide, 1 M NaCl, 1% SDS (sodium dodecyl sulfate) at 37°C and wash in 1X - 2X SSC (20X SSC = 3.0 M NaCl/0, 3 M trisodium citrate) at 50-55°C. Typical moderate stringency conditions include hybridization in 40-45% formamide, 1.0 M NaCl, 1% SDS at 37°C and wash in 0.5X - 1X SSC at 55-60°C. Typical high stringency conditions include hybridization in 50% formamide, 1 M NaCl, 1% SDS at 37°C and wash in 0.1X SSC at 60-65°C. Optionally, wash buffers may contain from about 0.1% to about 1% SDS. The duration of hybridization is generally less than 24 hours, typically from about 4 to about 12 hours. The flushing period should be at least long enough to achieve equilibrium.

В реакциях гибридизации специфичность, как правило, является функцией промывок после гибридизации, при этом важными факторами являются ионная сила и температура конечного промывочного раствора. В случае гибридов ДНК-ДНК Tm можно аппроксимировать из уравнения из Meinkoth and Wahl, Anal. Biochem., 1984, 138, 267-284: Tm=81,5°C+16,6 (log М) + 0,41 (% GC) - 0,61 (% форм.) - 500/L; где M - молярность одновалентных катионов, %GC - процентное содержание нуклеотидов гуанозина и цитозина в ДНК, % форм. - процентное содержание формамида в гибридизационном растворе, а L - длина гибрида в парах оснований. Tm представляет собой температуру (при определенных ионной силе и pH), при которой 50% комплементарной целевой последовательности гибридизируется с идеально совпадающим зондом. Tm снижается на около 1°C для каждого 1% несовпадения; таким образом, Tm, гибридизацию и/или условия промывки можно корректировать для гибридизации последовательностей с необходимой идентичностью. Например, если проводится поиск последовательностей с ≥ 90% идентичности, Tm можно снизить на 10°C. В общем случае условия жесткости выбирают так, чтобы температура была на около 5°C ниже, чем температура плавления (Tm) для конкретной последовательности и ее комплементарной цепи при определенных ионной силе и pH. При этом в условиях очень высокой жесткости можно использовать гибридизацию и/или промывку при температуре на 1°C, 2°C, 3°C или 4°C ниже, чем температура плавления (Tm); в условиях умеренной жесткости можно использовать гибридизацию и/или промывку при температуре на 6°C, 7°C, 8°C, 9°C или 10°C ниже, чем температура плавления (Tm); в условиях низкой жесткости можно использовать гибридизацию и/или промывку при температуре на 11°C, 12°C, 13°C, 14°C, 15°C или 20°C ниже, чем температура плавления (Tm). Используя уравнение, композиции для гибридизации и промывки, а также необходимую Tm, специалистам в данной области техники понятно, что в данном случае заведомо описаны вариации жесткости растворов для гибридизации и/или промывки. Если необходимая степень несовпадения приводит к Tm менее 45°C (водный раствор) или 32°C (раствор формамида), оптимально повысить концентрацию SSC так, чтобы можно было использовать более высокую температуру. In hybridization reactions, specificity is generally a function of post-hybridization washes, with the ionic strength and temperature of the final wash solution being important factors. In the case of DNA-DNA hybrids, T m can be approximated from the equation in Meinkoth and Wahl, Anal. Biochem ., 1984, 138, 267-284: T m =81.5°C+16.6 (log M) + 0.41 (% GC) - 0.61 (% form.) - 500/L; where M is the molarity of monovalent cations, %GC is the percentage of guanosine and cytosine nucleotides in DNA, % forms. is the percentage of formamide in the hybridization solution, and L is the length of the hybrid in base pairs. T m is the temperature (at a certain ionic strength and pH) at which 50% of the complementary target sequence hybridizes to a perfectly matching probe. T m decreases by about 1°C for every 1% mismatch; thus, T m , hybridization and/or washing conditions can be adjusted to hybridize sequences with the desired identity. For example, if sequences with ≥ 90% identity are being searched, T m can be reduced by 10°C. In general, stringency conditions are chosen such that the temperature is about 5°C lower than the melting temperature ( Tm ) for a particular sequence and its complementary chain at a particular ionic strength and pH. However, under conditions of very high stringency, hybridization and/or washing at a temperature of 1°C, 2°C, 3°C or 4°C lower than the melting temperature ( Tm ) can be used; under moderate stringency conditions, hybridization and/or washing at 6°C, 7°C, 8°C, 9°C or 10°C lower than the melting temperature ( Tm ) can be used; in low stringency conditions, hybridization and/or washing at temperatures 11°C, 12°C, 13°C, 14°C, 15°C or 20°C lower than the melting temperature (T m ) can be used. Using the equation, the hybridization and wash compositions, and the required T m , those skilled in the art will understand that variations in the stringency of the hybridization and/or wash solutions are inherently described here. If the required degree of mismatch results in a T m less than 45°C (aqueous solution) or 32°C (formamide solution), it is optimal to increase the SSC concentration so that a higher temperature can be used.

Также предложены способы для обнаружения наличия или количественной оценки уровней полипептида вариантного SIGIRR в биологическом образце, включающие, например, секвенирование белка и иммуноанализ. В некоторых вариантах осуществления способ обнаружения наличия вариантного белка SIGIRR (например, SEQ D NO:9) у субъекта-человека включает проведение анализа биологического образца от субъекта-человека, который позволяет обнаруживать наличие вариантного белка SIGIRR (например, SEQ D NO:4) в биологическом образце. Also provided are methods for detecting the presence or quantifying levels of a variant SIGIRR polypeptide in a biological sample, including, for example, protein sequencing and immunoassays. In some embodiments, a method of detecting the presence of a variant SIGIRR protein ( e.g. , SEQ D NO:9) in a human subject includes performing an assay on a biological sample from the human subject that detects the presence of a variant SIGIRR protein ( e.g. , SEQ D NO:4) in biological sample.

Иллюстративные неограничивающие примеры техник белкового секвенирования включают, но не ограничиваются этим, масс-спектрометрию и расщепление по Эдману. Иллюстративные примеры методов иммуноанализа включают, но не ограничиваются этим, иммунопреципитацию, вестерн-блоттинг, иммуногистохимию, ИФА, иммуноцитохимию, проточную цитометрию и иммуно-ПЦР. Поликлональные или моноклональные антитела, помеченные с возможностью обнаружения с помощью разных известных методик (например, калориметрических, флуоресцентных, хемилюминесцентных или радиоактивных), подходят для применения в иммуноанализе. что касается иммуноанализа, вариантный белок SIGIRR имеет отличный размер по сравнению с белком SIGIRR дикого типа и, следовательно, соответствует отличной молекулярной масса в белковом геле. Таким образом, используя одно антитело, можно отличить белок SIGIRR дикого типа от вариантного белка SIGIRR, например, в анализе вестерн-блоттинга.Illustrative non-limiting examples of protein sequencing techniques include, but are not limited to, mass spectrometry and Edman digestion. Illustrative examples of immunoassay methods include, but are not limited to, immunoprecipitation, Western blotting, immunohistochemistry, ELISA, immunocytochemistry, flow cytometry, and immuno-PCR. Polyclonal or monoclonal antibodies labeled for detection by various known techniques ( eg calorimetric, fluorescent, chemiluminescent or radioactive) are suitable for use in immunoassays. As for the immunoassay, the variant SIGIRR protein has a different size compared to the wild-type SIGIRR protein and therefore corresponds to a different molecular weight in the protein gel. Thus, using a single antibody, it is possible to distinguish wild-type SIGIRR protein from variant SIGIRR protein, for example, in a Western blot analysis.

В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение в молекуле нуклеиновой кислоты, полученной от субъекта-человека, любого из изменений в любой из молекул нуклеиновых кислот SIGIRR, описанных в данном документе; и диагностирование у субъекта-человека воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления субъект-человек нуждается в таком диагностировании. В некоторых вариантах осуществления субъект-человек может иметь родственников, у которых было диагностировано воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте. This disclosure also provides methods for diagnosing inflammatory bowel disease or early-onset inflammatory bowel disease or identifying the risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease in a human subject, comprising: detecting a nucleic acid molecule derived from a human subject, any of the changes in any of the SIGIRR nucleic acid molecules described herein; and diagnosing a human subject with inflammatory bowel disease or early-onset inflammatory bowel disease if the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk of developing an inflammatory disease inflammatory bowel disease or early-onset inflammatory bowel disease, unless the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease. In some embodiments, the human subject requires such a diagnosis. In some embodiments, the human subject may have relatives who have been diagnosed with inflammatory bowel disease or early-onset inflammatory bowel disease.

Симптомы воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте включают, но не ограничиваются этим, диарею, высокую температуру, слабость, боль в области живота, спазмы в животе, тошноту, рвоту, наличие крови в стуле, анемию, снижение аппетита и непреднамеренную потерю массы, или любую их комбинацию. Symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease include, but are not limited to, diarrhea, fever, weakness, abdominal pain, abdominal cramps, nausea, vomiting, blood in the stool, anemia, decreased appetite, and unintentional weight loss, or any combination thereof.

В некоторых вариантах осуществления способы включают обнаружение наличия геномной ДНК, мРНК или кДНК, полученной из мРНК, вариантного SIGIRR, полученных из биологического образца, полученного от субъекта. Следует понимать, что генные последовательности в популяции, а также мРНК и белки, кодируемые такими генами, могут варьироваться вследствие полиморфизма, такого как однонуклеотидный полиморфизм (ОНП). Последовательности, приведенные в данном документе для геномной ДНК, мРНК, кДНК и полипептида SIGIRR, являются всего лишь типовыми последовательностями, но также возможны другие подобные последовательности, включая дополнительные аллели SIGIRR.In some embodiments, the methods include detecting the presence of genomic DNA, mRNA, or mRNA-derived cDNA of a variant SIGIRR obtained from a biological sample obtained from the subject. It should be understood that gene sequences in a population, as well as the mRNA and proteins encoded by such genes, may vary due to polymorphisms such as single nucleotide polymorphisms (SNPs). The sequences given herein for genomic DNA, mRNA, cDNA, and SIGIRR polypeptide are representative sequences only, but other similar sequences are possible, including additional SIGIRR alleles.

В некоторых вариантах осуществления этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR. В некоторых вариантах осуществления этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует усеченный SIGIRR, причем секвенируемая молекула нуклеиновой кислоты кодирует аминокислотную последовательность, которая содержит позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9. Секвенировать можно любые молекулы нуклеиновых кислот, раскрытые в данном документе (например, геномную ДНК, мРНК или кДНК). В некоторых вариантах осуществления этап обнаружения включает секвенирование всей молекулы нуклеиновой кислоты. In some embodiments, the discovery step includes sequencing at least a portion of a nucleic acid molecule that encodes the truncated SIGIRR protein. In some embodiments, the discovery step includes sequencing at least a portion of a nucleic acid molecule that encodes a truncated SIGIRR, wherein the nucleic acid molecule to be sequenced encodes an amino acid sequence that contains a position corresponding to position 186 in accordance with SEQ ID NO:9. Any nucleic acid molecules disclosed herein ( eg , genomic DNA, mRNA, or cDNA) may be sequenced. In some embodiments, the discovery step includes sequencing the entire nucleic acid molecule.

В некоторых вариантах осуществления этап обнаружения включает: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR; мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой; приведение меченной нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, кодирующей усеченный белок SIGIRR; и обнаружение пригодной для обнаружения метки. В некоторых вариантах осуществления этап обнаружения включает: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем амплифицированная молекула нуклеиновой кислоты кодирует аминокислотную последовательность, которая содержит позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9; мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой; приведение меченной нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, кодирующей аспарагиновую кислоту в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; и обнаружение пригодной для обнаружения метки. Амплифицировать можно любые раскрытые в данном документе молекулы нуклеиновых кислот. Например, можно амплифицировать любые из молекул геномной ДНК, кДНК или мРНК, раскрытых в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты представляет собой мРНК, а способ дополнительно включает обратное транскрибирование мРНК в кДНК перед этапом амплификации.In some embodiments, the discovery step includes: amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein; labeling the nucleic acid molecule with a detectable label; bringing the labeled nucleic acid into contact with a support containing a probe, the probe comprising a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid sequence encoding a truncated SIGIRR protein; and detecting a detectable label. In some embodiments, the detection step includes: amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the amplified nucleic acid molecule encodes an amino acid sequence that contains a position corresponding to position 186 in accordance with SEQ ID NO:9; labeling the nucleic acid molecule with a detectable label; bringing the labeled nucleic acid into contact with a support containing a probe, the probe comprising a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid sequence encoding aspartic acid at a position corresponding to position 186 in accordance with SEQ ID NO:9; and detecting a detectable label. Any nucleic acid molecules disclosed herein can be amplified. For example, any of the genomic DNA, cDNA, or mRNA molecules disclosed herein can be amplified. In some embodiments, the nucleic acid molecule is mRNA, and the method further includes reverse transcribing the mRNA into cDNA prior to the amplification step.

В некоторых вариантах осуществления этап обнаружения включает: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, и обнаружение пригодной для обнаружения метки. В некоторых вариантах осуществления этап обнаружения включает: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, кодирующей аминокислотную последовательность, которая содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и обнаружение пригодной для обнаружения метки. В некоторых вариантах осуществления молекула нуклеиновой кислоты присутствует в клетке, полученной от субъекта-человека, а обнаружение проводят в соответствии с методом гибридизации in situ.In some embodiments, the detection step includes: contacting a nucleic acid molecule that encodes a SIGIRR protein with a probe containing a detectable label, the probe comprising a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid sequence encoding a truncated SIGIRR protein , and detecting a detectable label. In some embodiments, the detection step includes: contacting a nucleic acid molecule that encodes a SIGIRR protein with a probe containing a detectable label, the probe comprising a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid sequence encoding an amino acid sequence, which contains a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, and detection of a detectable label. In some embodiments, the nucleic acid molecule is present in a cell obtained from a human subject and detection is carried out in accordance with an in situ hybridization method.

В некоторых вариантах осуществления этап обнаружения включает приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт со специфическим в отношении изменения праймером и амплификацию молекулы нуклеиновой кислоты с применением методов специфической к изменениям ПЦР. Специфический в отношении изменения праймер может представлять собой любой такой праймер, описанный в данном документе, и может быть специфическим в отношении вариантных белков SIGIRR, которые кодируют серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. In some embodiments, the detection step includes contacting a nucleic acid molecule that encodes the SIGIRR protein with a variation-specific primer and amplifying the nucleic acid molecule using variation-specific PCR techniques. The variation-specific primer may be any such primer described herein and may be specific for variant SIGIRR proteins that encode a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9.

Другие методы анализа, которые можно использовать в раскрытых в данном документе способах, включают, например, полимеразную цепную реакцию с обратной транскрипцией (ОТ-ПЦР) или количественную ОТ-ПЦР (кОТ-ПЦР). Другие методы анализа, которые можно использовать в раскрытых в данном документе способах, включают, например, секвенирование РНК (РНК-секвенирование) с последующим обнаружением наличия и количества вариантной мРНК или кДНК в биологическом образце.Other assays that may be used in the methods disclosed herein include, for example, reverse transcription polymerase chain reaction (RT-PCR) or quantitative RT-PCR (qRT-PCR). Other analytical methods that can be used in the methods disclosed herein include, for example, RNA sequencing (RNA-seq) and then detecting the presence and amount of variant mRNA or cDNA in a biological sample.

В данном раскрытии также предложены способы идентификации субъекта-человека, имеющего воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. указанные способы в общем случае включают обнаружение в образце, полученном от субъекта, наличия или отсутствия вариантного белка SIGIRR; и/или наличия или отсутствия любой из описанных в данном документе молекул нуклеиновых кислот, кодирующих вариантный белок SIGIRR. Наличие усеченного белка SIGIRR указывает на то, что субъект имеет воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. Наличие гуанина (вследствие делеции аденина) в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2 (например, геномной ДНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4 (например, мРНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6 (например, кДНК), что в каждом случае приводит к получению вариантного белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, указывает на то, что субъект имеет воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. Указанный способ можно проводить in vitro, in situ или in vivo.This disclosure also provides methods for identifying a human subject having inflammatory bowel disease or early-onset inflammatory bowel disease, or a risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease. these methods generally involve detecting the presence or absence of a variant SIGIRR protein in a sample obtained from a subject; and/or the presence or absence of any of the nucleic acid molecules encoding the SIGIRR variant protein described herein. The presence of a truncated SIGIRR protein indicates that the subject has inflammatory bowel disease or early-onset inflammatory bowel disease, or is at risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease. The presence of guanine (due to deletion of adenine) at a position corresponding to position 9962 according to SEQ ID NO:2 ( for example , genomic DNA), or at a position corresponding to position 557 according to SEQ ID NO:4 ( for example , mRNA), or at position corresponding to position 557 of SEQ ID NO:6 ( e.g. , cDNA), which in each case results in a variant SIGIRR protein truncated at position corresponding to position 215 of SEQ ID NO:9 and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9, indicates that the subject has inflammatory bowel disease or early-onset inflammatory bowel disease, or is at risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease . This method can be carried out in vitro , in situ or in vivo .

В данном раскрытии также предложены способы идентификации субъекта-человека, имеющего воспалительное заболевание кишечника с началом в раннем возрасте или риск развития воспалительного заболевания кишечника с началом в раннем возрасте, при этом способ включает обнаружение в образце, полученном от субъекта, наличия или отсутствия: белка SIGIRR, содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/или молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; причем наличие усеченного белка SIGIRR и/или молекулы нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, указывает на то, что субъект имеет воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. This disclosure also provides methods for identifying a human subject having early-onset inflammatory bowel disease or a risk of developing early-onset inflammatory bowel disease, the method comprising detecting in a sample obtained from the subject the presence or absence of: SIGIRR protein containing serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; and/or a nucleic acid molecule encoding a SIGIRR protein containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; wherein the presence of a truncated SIGIRR protein and/or a nucleic acid molecule encoding a truncated SIGIRR protein indicates that the subject has early-onset inflammatory bowel disease or is at risk of developing early-onset inflammatory bowel disease. In some embodiments, the truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 according to SEQ ID NO:9. In some embodiments, the truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9.

В некоторых вариантах осуществления обнаружение наличия или отсутствия усеченного белка SIGIRR в образцах проводят с помощью антитела, специфического в отношении усеченного SIGIRR. В некоторых вариантах осуществления антитело, которое является специфическим в отношении усеченного SIGIRR, является специфическим в отношении: i) серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; или ii) эпитопа, созданного в белке SIGIRR вследствие мутации со сдвигом рамки, которая приводит к появлению серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления обнаружение дополнительно включает сравнение реакции антитела, специфического в отношении усеченного SIGIRR, с реакцией антитела, специфического в отношении SIGIRR дикого типа. В некоторых вариантах осуществления обнаружение наличия или отсутствия усеченного белка SIGIRR в указанном образце проводят с помощью иммуноферментного анализа (ИФА). В некоторых вариантах осуществления обнаружение наличия или отсутствия указанной молекулы нуклеиновой кислоты, кодирующей вариантный белок SIGIRR, в образце проводят путем определения, есть ли мутация со сдвигом рамки в молекуле нуклеиновой кислоты, создающая кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления секвенируемая часть молекулы нуклеиновой кислоты содержит некоторое количество позиций, охватывающих кодон, кодирующий позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9.In some embodiments, detection of the presence or absence of truncated SIGIRR protein in samples is performed using an antibody specific for truncated SIGIRR. In some embodiments, an antibody that is specific for a truncated SIGIRR is specific for: i) a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9; or ii) an epitope created in the SIGIRR protein due to a frameshift mutation that results in a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the detection further includes comparing the response of an antibody specific for the truncated SIGIRR with that of an antibody specific for the wild type SIGIRR. In some embodiments, detection of the presence or absence of a truncated SIGIRR protein in a specified sample is performed using an enzyme-linked immunosorbent assay (ELISA). In some embodiments, detecting the presence or absence of a specified nucleic acid molecule encoding a variant SIGIRR protein in a sample is accomplished by determining whether there is a frameshift mutation in the nucleic acid molecule creating a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the portion of the nucleic acid molecule to be sequenced contains a number of positions spanning the codon encoding the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления способа этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR. В некоторых вариантах осуществления способа этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR. Секвенируемая молекула нуклеиновой кислоты может кодировать аминокислотную последовательность, которая содержит позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9. Наличие гуанина (вследствие делеции аденина) в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2 (например, геномной ДНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4 (например, мРНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6 (например, кДНК), что в каждом случае приводит к получению вариантного белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. Этап обнаружения может включать секвенирование молекулы нуклеиновой кислоты, кодирующей весь белок SIGIRR. In some embodiments of the method, the discovery step includes sequencing at least a portion of the nucleic acid molecule that encodes the SIGIRR protein. In some embodiments of the method, the discovery step includes sequencing at least a portion of the nucleic acid molecule that encodes the truncated SIGIRR protein. The nucleic acid molecule to be sequenced may encode an amino acid sequence that contains a position corresponding to position 186 in accordance with SEQ ID NO:9. The presence of guanine (due to deletion of adenine) at a position corresponding to position 9962 according to SEQ ID NO:2 ( for example , genomic DNA), or at a position corresponding to position 557 according to SEQ ID NO:4 ( for example , mRNA), or at position corresponding to position 557 of SEQ ID NO:6 ( e.g. , cDNA), which in each case results in a variant SIGIRR protein truncated at position corresponding to position 215 of SEQ ID NO:9 and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. The discovery step may involve sequencing the nucleic acid molecule encoding the entire SIGIRR protein.

В некоторых вариантах осуществления способа этап обнаружения включает амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует усеченный белок SIGIRR, мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой, приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется, в том числе, например, в жестких условиях, с последовательностью нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, и обнаружение пригодной для обнаружения метки. В некоторых вариантах осуществления способа этап обнаружения включает амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, мечение амплифицированной молекулы нуклеиновой кислоты пригодной для обнаружения меткой, приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется, в том числе, например, в жестких условиях, с последовательностью нуклеиновой кислоты, кодирующей серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9 (или с последовательностью нуклеиновой кислоты, содержащей гуанин (вследствие делеции аденина) в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2 (например, геномная ДНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4 (например, мРНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6 (например, кДНК), что в каждом случае приводит к получению вариантного белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9), и обнаружение пригодной для обнаружения метки. Амплифицируемая молекула нуклеиновой кислоты предпочтительно кодирует аминокислотную последовательность, которая содержит позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9. Если нуклеиновая кислота включает мРНК, способ может дополнительно включать обратное транскрибирование мРНК в кДНК перед этапом амплификации. В некоторых вариантах осуществления этап обнаружения включает приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, и обнаружение пригодной для обнаружения метки. Зонд предпочтительно содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется, в том числе, например, в жестких условиях, с последовательностью нуклеиновой кислоты, кодирующей аминокислотную последовательность, которая содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9 (или с последовательностью нуклеиновой кислоты, содержащей гуанин (вследствие делеции аденина) в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2 (например, геномная ДНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4 (например, мРНК), или в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6 (например, кДНК), что в каждом случае приводит к получению вариантного белка SIGIRR, усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, и содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9). Молекула нуклеиновой кислоты может находиться внутри клетки, полученной от субъекта-человека. In some embodiments of the method, the detection step includes amplifying at least a portion of a nucleic acid molecule that encodes a truncated SIGIRR protein, labeling the nucleic acid molecule with a detectable label, contacting the labeled nucleic acid molecule with a support containing a probe, wherein the probe contains a nucleic acid sequence an acid that specifically hybridizes, including, for example, under stringent conditions, with a nucleic acid sequence encoding a truncated SIGIRR protein, and detecting a detectable label. In some embodiments of the method, the detection step includes amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, labeling the amplified nucleic acid molecule with a detectable label, contacting the labeled nucleic acid molecule with a support containing a probe, wherein the probe contains a nucleic acid sequence an acid that specifically hybridizes, including, for example, under stringent conditions, with a nucleic acid sequence encoding a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9 (or with a nucleic acid sequence containing guanine (due to deletion of adenine ) at a position corresponding to position 9962 in accordance with SEQ ID NO:2 ( for example , genomic DNA), or at a position corresponding to position 557 in accordance with SEQ ID NO:4 ( for example , mRNA), or at a position corresponding to position 557 according to SEQ ID NO:6 ( e.g. cDNA), which in each case results in a variant SIGIRR protein truncated at the position corresponding to position 215 according to SEQ ID NO:9 and containing a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9), and detecting a detectable label. The nucleic acid molecule to be amplified preferably encodes an amino acid sequence that contains the position corresponding to position 186 in accordance with SEQ ID NO:9. If the nucleic acid includes mRNA, the method may further include reverse transcribing the mRNA into cDNA before the amplification step. In some embodiments, the detection step includes contacting a nucleic acid molecule that encodes a SIGIRR protein with a probe containing a detectable label and detecting the detectable label. The probe preferably contains a nucleic acid sequence that specifically hybridizes, including, for example, under stringent conditions, with a nucleic acid sequence encoding an amino acid sequence that contains a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9 (or a nucleic acid sequence containing guanine (due to deletion of adenine) at a position corresponding to position 9962 according to SEQ ID NO:2 ( for example , genomic DNA), or at a position corresponding to position 557 according to SEQ ID NO:4 ( for example , mRNA), or at the position corresponding to position 557 according to SEQ ID NO:6 ( for example , cDNA), which in each case results in a variant protein SIGIRR truncated at the position corresponding to position 215 according to SEQ ID NO:9 , and containing serine at the position corresponding to position 186 in accordance with SEQ ID NO:9). The nucleic acid molecule may be located within a cell obtained from a human subject.

В некоторых вариантах осуществления этап обнаружения включает: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем амплифицированная молекула нуклеиновой кислоты включает кодон, кодирующий аминокислоту в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой; приведение меченной молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; и обнаружение пригодной для обнаружения метки.In some embodiments, the detection step includes: amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the amplified nucleic acid molecule includes a codon encoding an amino acid at a position corresponding to position 186 in accordance with SEQ ID NO:9; labeling the nucleic acid molecule with a detectable label; bringing a labeled nucleic acid molecule into contact with a support containing a probe, wherein the probe contains a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 ; and detecting a detectable label.

В некоторых вариантах осуществления этап обнаружения включает: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и обнаружение пригодной для обнаружения метки. В некоторых вариантах осуществления субъект-человек моложе 18 лет. В некоторых вариантах осуществления субъект-человек идентифицирован как имеющий болезнь Крона или риск развития болезни Крона.In some embodiments, the detection step includes: contacting a nucleic acid molecule that encodes a SIGIRR protein with a probe containing a detectable label, wherein the probe contains a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon, encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and detecting a detectable tag. In some embodiments, the human subject is under 18 years of age. In some embodiments, the human subject is identified as having Crohn's disease or at risk of developing Crohn's disease.

В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение усеченного белка SIGIRR в образце, полученном от субъекта-человека; и диагностирование у субъекта-человека воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления субъект-человек нуждается в таком диагностировании. В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение вариантного белка SIGIRR, такого как белок, содержащий SEQ ID NO:9, в образце, полученном от субъекта-человека; и диагностирование у субъекта-человека воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску развития воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления субъект-человек нуждается в таком диагностировании. В некоторых вариантах осуществления субъект-человек может иметь родственников, у которых было диагностировано воспалительное заболевание кишечника или воспалительное заболевание кишечника с началом в раннем возрасте.This disclosure also provides methods for diagnosing inflammatory bowel disease or early-onset inflammatory bowel disease or identifying the risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease in a human subject, comprising: detecting a truncated SIGIRR protein in a sample obtained from a human subject; and diagnosing a human subject with inflammatory bowel disease or early-onset inflammatory bowel disease if the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk of developing an inflammatory disease inflammatory bowel disease or early-onset inflammatory bowel disease, unless the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease. In some embodiments, the human subject requires such a diagnosis. This disclosure also provides methods for diagnosing inflammatory bowel disease or early-onset inflammatory bowel disease or identifying the risk of developing inflammatory bowel disease or early-onset inflammatory bowel disease in a human subject, comprising: detecting a variant SIGIRR protein, such as containing SEQ ID NO:9, in a sample obtained from a human subject; and diagnosing a human subject with inflammatory bowel disease or early-onset inflammatory bowel disease if the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk of developing an inflammatory disease inflammatory bowel disease or early-onset inflammatory bowel disease, unless the subject has one or more symptoms of inflammatory bowel disease or early-onset inflammatory bowel disease. In some embodiments, the human subject requires such a diagnosis. In some embodiments, the human subject may have relatives who have been diagnosed with inflammatory bowel disease or early-onset inflammatory bowel disease.

В данном раскрытии также предложены способы диагностирования воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающие: обнаружение молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, в образце, полученном от субъекта-человека, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/или обнаружение белка SIGIRR, в образце, полученном от субъекта-человека, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и диагностирование у субъекта-человека воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет один или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:13 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления обнаружение усеченного белка SIGIRR проводят с помощью антитела, специфического в отношении усеченного SIGIRR. В некоторых вариантах осуществления антитело, которое является специфическим в отношении усеченного SIGIRR, является специфическим в отношении: i) серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; или ii) эпитопа, созданного в белке SIGIRR вследствие мутации со сдвигом рамки, которая приводит к появлению серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления обнаружение дополнительно включает сравнение реакции антитела, специфического в отношении усеченного SIGIRR, с реакцией антитела, специфического в отношении SIGIRR дикого типа. В некоторых вариантах осуществления обнаружение усеченного белка SIGIRR проводят с помощью иммуноферментного анализа (ИФА). В некоторых вариантах осуществления обнаружение молекулы нуклеиновой кислоты, кодирующей указанный усеченный белок SIGIRR, проводят путем обнаружения, есть ли мутация со сдвигом рамки в указанной молекуле нуклеиновой кислоты, создающая кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. В некоторых вариантах осуществления секвенируемая часть молекулы нуклеиновой кислоты содержит некоторое количество позиций, охватывающих кодон, кодирующий позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9.This disclosure also provides methods for diagnosing early-onset inflammatory bowel disease or identifying the risk of early-onset inflammatory bowel disease in a human subject, comprising: detecting a nucleic acid molecule encoding the SIGIRR protein in a sample obtained from the human subject , wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and is truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; and/or detection of a SIGIRR protein, in a sample obtained from a human subject, wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO: :9; and diagnosing a human subject as having early-onset inflammatory bowel disease if the subject has one or more symptoms of early-onset inflammatory bowel disease, or diagnosing the human subject as being at risk for early-onset inflammatory bowel disease if the subject does not have one or more symptoms of early-onset inflammatory bowel disease. In some embodiments, the truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 according to SEQ ID NO:9. In some embodiments, the truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:13 at positions corresponding to positions 186-215 of SEQ ID NO:9. In some embodiments, detection of the truncated SIGIRR protein is performed using an antibody specific for the truncated SIGIRR. In some embodiments, an antibody that is specific for a truncated SIGIRR is specific for: i) a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9; or ii) an epitope created in the SIGIRR protein due to a frameshift mutation that results in a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. In some embodiments, the detection further includes comparing the response of an antibody specific for the truncated SIGIRR with that of an antibody specific for the wild type SIGIRR. In some embodiments, detection of the truncated SIGIRR protein is performed using an enzyme-linked immunosorbent assay (ELISA). In some embodiments, detection of a nucleic acid molecule encoding said truncated SIGIRR protein is performed by detecting whether there is a frameshift mutation in said nucleic acid molecule creating a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 . In some embodiments, the portion of the nucleic acid molecule to be sequenced contains a number of positions spanning the codon encoding the position corresponding to position 186 in accordance with SEQ ID NO:9.

В некоторых вариантах осуществления этап обнаружения включает: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем амплифицированная молекула нуклеиновой кислоты включает кодон, кодирующий аминокислоту в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой; приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; и обнаружение пригодной для обнаружения метки.In some embodiments, the detection step includes: amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the amplified nucleic acid molecule includes a codon encoding an amino acid at a position corresponding to position 186 in accordance with SEQ ID NO:9; labeling the nucleic acid molecule with a detectable label; bringing a labeled nucleic acid molecule into contact with a support containing a probe, the probe comprising a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 ; and detecting a detectable label.

В некоторых вариантах осуществления этап обнаружения включает: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; и обнаружение пригодной для обнаружения метки.In some embodiments, the detection step includes: contacting a nucleic acid molecule that encodes a SIGIRR protein with a probe containing a detectable label, wherein the probe contains a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon, encoding serine at a position corresponding to position 186 in accordance with SEQ ID NO:9; and detecting a detectable label.

В некоторых вариантах осуществления описанный в данном документе субъект-человек, от которого получен образец (например, субъект-человек, которого диагностируют или лечат), не является взрослым. В некоторых вариантах осуществления описанный в данном документе субъект-человек, от которого получен образец, имеет возраст 18 лет или меньше. В некоторых вариантах осуществления описанный в данном документе субъект-человек, от которого получен образец, имеет возраст 15 лет или меньше. В некоторых вариантах осуществления описанный в данном документе субъект-человек, от которого получен образец, имеет возраст 13 лет или меньше. В некоторых вариантах осуществления описанный в данном документе субъект-человек, от которого получен образец, имеет возраст 10 лет или меньше. В некоторых вариантах осуществления субъект-человек, который имеет возраст 6 лет или менее, может иметь воспалительное заболевание кишечника с очень ранним началом. В некоторых вариантах осуществления субъект-человек не имеет некротизирующий энтероколит.In some embodiments, the human subject described herein from whom the sample is obtained ( eg , the human subject being diagnosed or treated) is not an adult. In some embodiments, the human subject described herein from which the sample is obtained is 18 years of age or younger. In some embodiments, the human subject described herein from which the sample is obtained is 15 years of age or younger. In some embodiments, the human subject described herein from which the sample is obtained is 13 years of age or younger. In some embodiments, the human subject described herein from which the sample is obtained is 10 years of age or less. In some embodiments, a human subject who is 6 years of age or less may have very early onset inflammatory bowel disease. In some embodiments, the human subject does not have necrotizing enterocolitis.

В некоторых вариантах осуществления любые из описанных в данном документе способов могут дополнительно включать лечение субъекта агентом, эффективным для лечения воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте. В некоторых вариантах осуществления указанные способы дополнительно включают лечение субъекта агентом, эффективным для лечения воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте, при обнаружении изменения у субъекта и диагностировании у субъекта воспалительного заболевания кишечника или воспалительного заболевания кишечника с началом в раннем возрасте.In some embodiments, any of the methods described herein may further comprise treating the subject with an agent effective for treating inflammatory bowel disease or early-onset inflammatory bowel disease. In some embodiments, the methods further comprise treating the subject with an agent effective for treating inflammatory bowel disease or early-onset inflammatory bowel disease when a change is detected in the subject and the subject is diagnosed with inflammatory bowel disease or early-onset inflammatory bowel disease.

В данном раскрытии также предложено применение любых раскрытых в данном документе молекул геномной ДНК, мРНК, кДНК, полипептидов вариантного SIGIRR и гибридизацию раскрытых в данном документе молекул нуклеиновых кислот при диагностике воспалительного заболевания кишечника с началом в раннем возрасте или диагностике риска развития воспалительного заболевания кишечника с началом в раннем возрасте. This disclosure also provides the use of any genomic DNA molecules, mRNA, cDNA, variant SIGIRR polypeptides disclosed herein, and hybridization of nucleic acid molecules disclosed herein in diagnosing early-onset inflammatory bowel disease or diagnosing the risk of developing early-onset inflammatory bowel disease. in young years.

Все патентные документы, веб-сайты, другие публикации, номера доступа и т.п., цитируемые выше или ниже, в полном объеме и во всех целях включены посредством ссылки в той же степени, как если бы каждый отдельный источник был бы специально и отдельно указан как включенный посредством ссылки. Если в разное время к номеру доступа были привязаны разные версии последовательности, подразумевается версия, привязанная к номеру доступа на момент действительной даты подачи этой заявки. Действительная дата подачи означает более раннюю из фактической даты подачи или даты подачи приоритетной заявки, ссылающуюся на номер доступа, в случае применимости. Аналогично, если разные версии публикации, веб-сайта и т.п. опубликованы в разное время, подразумевается самая последняя опубликованная версия на момент действительной даты подачи заявки, если не указано иное. Любой признак, этап, элемент, вариант осуществления или аспект данного раскрытия можно применять в комбинации с любым другим признаком, этапом, элементом, вариантом осуществления или аспектом, если специально не указано иное. Хотя данное изобретение было описано в некоторых подробностях посредством иллюстраций и примеров в целях ясности и понимания, следует понимать, что практически можно осуществлять определенные изменения и модификации, входящие в объем прилагаемой формулы изобретения.All patent documents, websites, other publications, accession numbers, etc. cited above or below are incorporated by reference in their entirety and for all purposes to the same extent as if each individual source had been specifically and separately indicated as being incorporated by reference. If different versions of a sequence have been associated with an accession number at different times, the version associated with the accession number at the time of the effective filing date of this application is assumed to be the version associated with the accession number. Effective filing date means the earlier of the actual filing date or the filing date of the priority application, referring to the accession number, if applicable. Likewise, if different versions of a publication, website, etc. published at different times, the most recent published version as of the effective date of application is implied, unless otherwise stated. Any feature, step, element, embodiment, or aspect of this disclosure may be used in combination with any other feature, step, element, embodiment, or aspect unless specifically stated otherwise. Although the present invention has been described in some detail by way of illustrations and examples for the purposes of clarity and understanding, it should be understood that certain changes and modifications may be practically made within the scope of the appended claims.

Приведенные в данном документе нуклеотидные и аминокислотные последовательности показаны с помощью стандартных буквенных сокращений для нуклеотидных оснований и однобуквенного кода для аминокислот. Нуклеотидные последовательности соответствуют стандартной конвенции с началом в 5' конце последовательности и продолжением (т.е. слева направо в каждой линии) до 3' конца. Показана только одна цепь каждой нуклеотидной последовательности, но подразумевается, что комплементарная цепь включена при любом упоминании приведенной цепи. Аминокислотные последовательности соответствуют стандартной конвенции с началом в амино-конце последовательности и продолжением (т.е. слева направо в каждой линии) до карбокси-конца.Nucleotide and amino acid sequences given herein are shown using standard letter abbreviations for nucleotide bases and single letter codes for amino acids. The nucleotide sequences follow the standard convention of starting at the 5' end of the sequence and continuing (ie from left to right in each line) to the 3' end. Only one strand of each nucleotide sequence is shown, but the complementary strand is intended to be included whenever the strand shown is mentioned. Amino acid sequences follow the standard convention of starting at the amino end of the sequence and continuing (i.e., from left to right in each line) to the carboxy end.

Следующие примеры приведены для более подробного описания вариантов осуществления. Они предназначены для иллюстрации, но не ограничения заявляемых вариантов осуществления.The following examples are provided to describe the embodiments in more detail. They are intended to illustrate, but not limit, the claimed embodiments.

ПримерыExamples

Следующие примеры приведены для того, чтобы предоставить специалистам в данной области техники полное раскрытие и описание того, как получать и оценивать соединения, композиции, изделия, устройства и/или способы, заявленные в данном документе, и предназначены исключительно для иллюстрации и не предназначены для ограничения объема того, что авторы изобретения считают объектом изобретения. Были предприняты меры, чтобы гарантировать точность в отношении чисел (например, количества, температуры и т.д.), но следует учитывать возможность некоторых погрешностей и отклонений. Если не указано иное, доли представляют собой массовые доли, температура выражена в °C или равна окружающей температуре, а давление равно атмосферному или близко к нему.The following examples are provided to provide those skilled in the art with a complete disclosure and description of how to prepare and evaluate the compounds, compositions, articles, devices and/or methods claimed herein and are intended to be illustrative only and not intended to be limiting. the scope of what the inventors consider to be the subject matter of the invention. Care has been taken to ensure accuracy in terms of numbers ( eg quantity, temperature, etc.), but the possibility of some errors and deviations should be taken into account. Unless otherwise noted, fractions are fractions by mass, temperature is in °C or equal to ambient temperature, and pressure is at or near atmospheric pressure.

Пример 1: Набор пациентов и фенотипированиеExample 1: Patient Recruitment and Phenotyping

Проводили полногеномное секвенирование и тройной анализ вариантов для 13-летнего пациента с ВЗК-РВ, его матери с ВЗК и его не имеющего заболевания отца. Эта семья была определена для генетической оценки ВЗК-РВ у пациента.Whole genome sequencing and triple variant analysis were performed on a 13-year-old patient with IBD-RV, his mother with IBD, and his unaffected father. This family was identified for genetic evaluation of the patient's IBD-RV.

Пример 2: Геномные образцыExample 2: Genomic samples

Геномную ДНК экстрагировали из образцов периферической крови и перевозили в генетический центр Regeneron (RGC, Regeneron Genetics Center) для полноэкзомного секвенирования, и хранили в автоматизированных биобанках при -80°C. Проводили флуоресцентную количественную оценку для того, чтобы убедиться в соответствующем качестве и количестве ДНК в целях секвенирования.Genomic DNA was extracted from peripheral blood samples and transported to the Regeneron Genetics Center (RGC) for whole exome sequencing and stored in automated biobanks at -80°C. Fluorescence quantification was performed to ensure adequate quality and quantity of DNA for sequencing purposes.

1 мкг ДНК разрезали до средней длины фрагментов 150 пар оснований (Covaris LE220) и готовили для захвата экзома с помощью специального набора реагентов от Kapa Biosystems. Захват образцов проводили, используя разработанные для экзома схемы NimbleGen SeqCap VCRome 2.1 или Integrated DNA Technologies xGen. Образцы снабжали штрих-кодом, объединяли и мультиплексировали для секвенирования, используя 75 п.о. секвенирование спаренных концов на Illumina HiSeq 2500 с химией v4. Захваченные фрагменты секвенировали до достижения минимум 85% охвата целевых оснований при охвате 20x или более. После секвенирования данные обрабатывали, используя облачный технологический процесс, разработанный RGC, в котором используются DNAnexus и AWS для работы стандартных инструментов для получения и анализа данных типа образец-уровень. Вкратце, генерировали данные секвенирования и демультиплексировали, используя программное обеспечение Illumina's CASAVA. Риды последовательностей картировали и выравнивали относительно референсной сборки человеческого генома GRCh37/hg19, используя BWA-mem. После выравнивания дублирующиеся риды помечали и снабжали флажком, используя инструменты Picard, а инделы повторно выравнивали, используя GATK, для улучшения качества определения вариантов. ОНП- и ИНДЕЛ-варианты и генотипы определяли, используя GATK's HaplotypeCaller, и применяли перекалибровку оценки качества вариантов (VQSR, Variant Quality Score Recalibration) от GATK, чтобы обозначить общие оценки качества вариантов. Статистику секвенирования и метрику качества данных получали для каждого образца, чтобы оценить эффективность захвата, эффективность выравнивания и определение вариантов. 1 μg of DNA was cut to an average fragment length of 150 bp (Covaris LE220) and prepared for exome capture using a custom reagent kit from Kapa Biosystems. Sample capture was performed using exome-specific NimbleGen SeqCap VCRome 2.1 or Integrated DNA Technologies xGen designs. Samples were barcoded, pooled, and multiplexed for sequencing using 75 bp. paired-end sequencing on Illumina HiSeq 2500 with v4 chemistry. Captured fragments were sequenced to achieve a minimum of 85% target base coverage with coverage of 20x or greater. After sequencing, the data were processed using a cloud-based workflow developed by RGC, which leverages DNAnexus and AWS to run standard tools for sample-level data acquisition and analysis. Briefly, sequencing data were generated and demultiplexed using Illumina's CASAVA software. Sequence reads were mapped and aligned to the reference human genome assembly GRCh37/hg19 using BWA-mem. After alignment, duplicate reads were marked and flagged using Picard tools, and indels were realigned using GATK to improve the quality of variant detection. SNP and INdel variants and genotypes were determined using GATK's HaplotypeCaller, and GATK's Variant Quality Score Recalibration (VQSR) was used to indicate overall variant quality scores. Sequencing statistics and data quality metrics were obtained for each sample to evaluate capture efficiency, alignment efficiency, and variant detection.

Пример 3: Анализ геномных данныхExample 3: Genomic Data Analysis

К определенным вариантам применяли стандартные фильтры контроля качества для минимальной глубины рида (>10), качества генотипа (>30) и аллельного баланса (>20%). Проходящие варианты классифицировали и обозначали на основании их потенциальных функциональных эффектов (синонимичные, несинонимичные, сплайсинг-варианты, варианты со сдвигом рамки или без сдвига рамки), используя разработанную RGC технологическую схему обозначения и анализа. Фамильную взаимосвязь верифицировали с помощью метрики идентичности по происхождению из генетических данных, чтобы определить родство и взаимосвязь в группе, используя PRIMUS (Staples et al., Amer. J. Human Genet., 2014, 95, 553-564) и перекрестные ссылки с сообщенным происхождением для данной семьи.Standard quality control filters for minimum read depth (>10), genotype quality (>30) and allelic balance (>20%) were applied to certain variants. Passing variants were classified and annotated based on their potential functional effects (synonymous, nonsynonymous, splice variants, frameshift or non-frameshift variants) using an RGC-developed notation and analysis workflow. Familial relationships were verified using a descent identity metric from genetic data to determine relatedness and relationships within a group using PRIMUS (Staples et al ., Amer. J. Human Genet., 2014, 95, 553-564) and cross-referencing with reported origin for this family.

Анализ вариантов на основе происхождения и сегрегацию проводили, чтобы идентифицировать кандидатные гены заболевания с аутосомно-доминантным профилем наследования с учетом известного семейного анамнеза. Общие варианты для больного пробанда и его больной матери, но не общие с не имеющим заболевания отцом, впоследствии обозначали и фильтровали по наблюдаемой частоте в популяционных контрольных базах данных, таких как dbSNP, 1000 Genomes Project, NHLBI Exome Sequencing Project, Exome Aggregation Consortium Database (ExAc), и внутренним базам данных RGC, чтобы отфильтровать стандартные полиморфизмы и высокочастотные вероятные доброкачественные варианты. Алгоритмы биоинформационного прогнозирования функциональных эффектов вариантов, такие как LRT, Poly-phen2, SIFT, CADD и Mutation Taster, наряду с оценками консервативности на основании выравнивания для множества видов (т.е. GERP, PhastCons, PhyloP) были включены как часть процесса обозначения вариантов и использовались для информирования о потенциальной вредоносности идентифицированных кандидатных вариантов.Ancestry-based variant analysis and segregation were performed to identify candidate disease genes with an autosomal dominant inheritance profile given known family history. Variants common to the affected proband and his affected mother, but not common to the unaffected father, were subsequently designated and filtered by observed frequency in population-based benchmark databases such as dbSNP, 1000 Genomes Project, NHLBI Exome Sequencing Project, Exome Aggregation Consortium Database ( ExAc), and internal RGC databases to filter common polymorphisms and high-frequency probable benign variants. Bioinformatic prediction algorithms for the functional effects of variants, such as LRT, Poly-phen2, SIFT, CADD, and Mutation Taster, along with alignment-based conservation estimates for multiple species (i.e., GERP, PhastCons, PhyloP) were included as part of the variant designation process and were used to communicate the potential harmfulness of identified candidate variants.

В гене SIGIRR был идентифицирован редкий, обуславливающий усечение индел-вариант (SIGIRR: c.557delA; p.K186fs*31), сегрегирующий с воспалительным заболеванием кишечника с началом в раннем возрасте у 13-летнего пациента, которое было унаследовано от его имеющей ВЗК матери. На Фиг. 1 (панели A, B и C) проиллюстрирована идентификация обуславливающего усечение варианта в гене SIGIRR с доминантной сегрегацией в семье с болезнью Крона (БК). На панели A приведена таблица, описывающая обуславливающий усечение вариант SIGIRR в c.557delA/p.K186fs*31 с наследованием по материнской линии; сайт варианта имеет нейтральную оценку консервативности среди видов и по прогнозам нарушает функцию белка; этот вариант имеет частоту альтернирующей аллели 0,000471 в браузере ExAC. На панели B приведена генеалогия для больного ВЗК-РВ пациента (Utah81427), его имеющей болезнь Крона матери (Utah81428) и не имеющего заболевание отца (Utah81429); окрашенные символы обозначают имеющих БК индивидов, неокрашенные символы обозначают не имеющих заболевание индивидов; круги обозначают женщин, а квадраты обозначают мужчин. На панели C приведено визуальное подтверждение обуславливающего усечение варианта SIGIRR, сегрегирующего у имеющего БК Utah81427 и его имеющей БК матери, но отсутствующего у не имеющего заболевание отца.A rare truncation indel variant (SIGIRR: c.557delA; p.K186fs*31) has been identified in the SIGIRR gene, cosegregating with early-onset inflammatory bowel disease in a 13-year-old patient, which was inherited from his IBD mother . In FIG. Figure 1 (Panels A, B, and C) illustrates the identification of a truncation variant in the SIGIRR gene with dominant segregation in a family with Crohn's disease (CD). Panel A shows a table describing the truncating SIGIRR variant in c.557delA/p.K186fs*31 with maternal inheritance; the variant site has a neutral conservation score among species and is predicted to disrupt protein function; this variant has an alternating allele frequency of 0.000471 in the ExAC browser. Panel B shows the genealogy for an IBD-RV patient (Utah81427), his Crohn's disease-affected mother (Utah81428), and his unaffected father (Utah81429); colored symbols indicate individuals with CD, uncolored symbols indicate individuals without the disease; circles represent women and squares represent men. Panel C provides visual confirmation of the truncation-causing SIGIRR variant that segregates in CD-affected Utah81427 and his CD-affected mother, but is absent in his non-diseased father.

Пример 4: ОбнаружениеExample 4: Detection

Наличие определенного генетического варианта у субъекта может указывать на то, что субъект имеет повышенный риск развития воспалительного заболевания кишечника с началом в раннем возрасте. Образец, такой как образец крови, можно получить от субъекта. Нуклеиновые кислоты можно выделить из образца, используя обычные наборы для экстракции нуклеиновых кислот. После выделения нуклеиновой кислоты из образца, полученного от субъекта, нуклеиновую кислоту секвенируют для определения наличия генетического варианта в ней. Последовательность нуклеиновой кислоты можно сравнивать с контрольной последовательностью (последовательностью дикого типа). Обнаружение разницы между нуклеиновой кислотой, полученной из образца, полученного от субъекта, и контрольной последовательностью, указывает на наличие генетического варианта. Эти этапы можно проводить, как описано в примерах выше и в тексте данного раскрытия. Наличие одного или более генетических вариантов указывает на повышенный риск развития у субъекта воспалительного заболевания кишечника с началом в раннем возрасте.The presence of a particular genetic variant in a subject may indicate that the subject is at increased risk of developing early-onset inflammatory bowel disease. A sample, such as a blood sample, may be obtained from the subject. Nucleic acids can be isolated from a sample using conventional nucleic acid extraction kits. After nucleic acid is isolated from a sample obtained from a subject, the nucleic acid is sequenced to determine whether it contains a genetic variant. The nucleic acid sequence can be compared to a control sequence (wild type sequence). Detection of a difference between the nucleic acid obtained from the sample obtained from the subject and the reference sequence indicates the presence of a genetic variant. These steps can be carried out as described in the examples above and throughout the text of this disclosure. The presence of one or more genetic variants indicates an increased risk for a subject to develop early-onset inflammatory bowel disease.

Пример 5: ИсследованияExample 5: Research

Материалы и методыMaterials and methods

Клеточные линии и культуральные условия: Cell lines and culture conditions:

Трансформированные вирусом Эпштейна-Барр лимфобластные клеточные линии (ЛКЛ) создавали из клеток педиатрических пациентов с ВЗК при одобрении IRB (Institutional Review Board, институциональный наблюдательный совет) в Научном центре здоровья Университета Юты. Здоровые ЛКЛ приобретали у Американской коллекции типовых культур (ATCC; Manassas, VA). Клетки культивировали в среде RPMI 1640 (Gibco product ID: 12633), дополненной 10% фетальной бычьей сывороткой (Gibco product ID: 10438026), 1X пенициллина-стрептомицина (Gibco product ID: 15140122) и 1X L-глутамина (Gibco product ID: 25030081). Epstein-Barr virus-transformed lymphoblastic cell lines (EBLs) were established from cells from pediatric IBD patients under IRB (Institutional Review Board) approval at the University of Utah Health Science Center. Healthy LCL were purchased from the American Type Culture Collection (ATCC; Manassas, VA). Cells were cultured in RPMI 1640 medium (Gibco product ID: 12633) supplemented with 10% fetal bovine serum (Gibco product ID: 10438026), 1X penicillin-streptomycin (Gibco product ID: 15140122) and 1X L-glutamine (Gibco product ID: 25030081 ).

Условия стимуляции: Stimulation conditions:

ЛКЛ, полученные из клеток здоровых контролей, пациента с потерей функции SIGIRR и ЛКЛ от 4 пациентов с ВЗК-РВ, не имеющих SIGIRR с потерей функции, стимулировали 2 мг/мл ЛПС (InvivoGen, San Diego, CA) в течение 72 часов или 2 мг/мл αIgM/αCD40 (Affymetrix, Santa Clara, CA) в течение 16 часов. После стимуляции собирали клеточные культуральные супернатанты и использовали для количественной оценки секреции провоспалительных цитокинов, используя панель человеческих провоспалительных цитокинов для мезомасштабного исследования V-Plex (K15049D), и количественно оценивали, используя QuickPlex SQ 120 для мезомасштабного исследования, а после этого дополняли РНК-секвенированием.LCLs derived from cells from healthy controls, a patient with SIGIRR loss of function, and LCLs from 4 IBD-RV patients without SIGIRR loss of function were stimulated with 2 mg/ml LPS (InvivoGen, San Diego, CA) for 72 hours or 2 mg/ml αIgM/αCD40 (Affymetrix, Santa Clara, CA) for 16 hours. Following stimulation, cell culture supernatants were collected and used to quantify pro-inflammatory cytokine secretion using the V-Plex Mesoscale Human Proinflammatory Cytokine Panel (K15049D) and quantified using the QuickPlex SQ 120 Mesoscale Assay and then complemented by RNA-seq.

Статистика:Statistics:

Значимость определяли, используя 2-факторный дисперсионный анализ ANOVA, а СПС рассчитывали, используя результаты по 3 независимым экспериментам, используя GraphPad PRISM (La Jolla, CA)Significance was determined using 2-way ANOVA, and PCA was calculated using results from 3 independent experiments using GraphPad PRISM (La Jolla, CA)

Результаты:Results:

Как проиллюстрировано на Фиг. 2, ЛКЛ, созданные из клеток пациента с SIGIRR с потерей функции, вырабатывали больше ИФН-γ, ИЛ-2, ИЛ-4, ИЛ-6, ИЛ-8, ИЛ-10, ИЛ-12p70 и ФНО-α, чем здоровые ЛКЛ или ЛКЛ от пациентов с ВЗК-РВ, не имеющих SIGIRR с потерей функции. Кроме того, нестимулированные ЛКЛ, созданные из клеток пациента с SIGIRR с потерей функции, секретировали повышенные уровни ИФН-γ, ИЛ-1β, ИЛ-2, ИЛ-4, ИЛ-6, ИЛ-8, ИЛ-10, ИЛ-12p70 и ФНО-α по сравнению со здоровыми ЛКЛ или некоторым ЛКЛ от пациентов с ВЗК-РВ, что указывает на то, что ЛКЛ с SIGIRR с потерей функции являются конститутивно активными и устойчивыми к стимуляции ЛПС. На Фиг. 2 синие столбики обозначают супернатанты, выделенные из нестимулированных клеток; красные столбики обозначают супернатанты, выделенные из стимулированных ЛПС клеток. «*» обозначает p < 0,05 по двухфакторному Anova; планки погрешностей указывают СПС по 3 независимым экспериментам.As illustrated in FIG. 2, LCLs generated from loss-of-function SIGIRR patient cells produced more IFN-γ, IL-2, IL-4, IL-6, IL-8, IL-10, IL-12p70, and TNF-α than healthy controls LCL or LCL from IBD-RV patients without SIGIRR with loss of function. Additionally, unstimulated LCL generated from loss-of-function SIGIRR patient cells secreted increased levels of IFN-γ, IL-1β, IL-2, IL-4, IL-6, IL-8, IL-10, IL-12p70 and TNF-α compared with healthy LCL or some LCL from IBD-RV patients, indicating that SIGIRR loss-of-function LCL are constitutively active and resistant to LPS stimulation. In FIG. 2 blue bars indicate supernatants isolated from unstimulated cells; red bars indicate supernatants isolated from LPS-stimulated cells. “*” denotes p < 0.05 by two-way Anova; Error bars indicate PCA from 3 independent experiments.

Как проиллюстрировано на Фиг. 3, после стимуляции αIgM/αCD40, ЛКЛ, созданные из клеток пациента с SIGIRR с потерей функции, вырабатывали больше ИФН-γ, ИЛ-2, ИЛ-4, ИЛ-6, ИЛ-8, ИЛ-10, ИЛ-12p70 и ФНО-α, чем здоровые ЛКЛ или некоторые ЛКЛ от пациентов с ВЗК-РВ, не имеющих SIGIRR с потерей функции. Кроме того, нестимулированные ЛКЛ, созданные из клеток пациента с SIGIRR с потерей функции, секретировали повышенные уровни ИФН-γ, ИЛ-2, ИЛ-4, ИЛ-6, ИЛ-8, ИЛ-10 и ФНО-α по сравнению со здоровыми ЛКЛ или некоторыми ЛКЛ от пациентов с ВЗК-РВ, что указывает на то, что ЛКЛ с SIGIRR с потерей функции являются конститутивно активными и устойчивыми к стимуляции анти-IgM/анти-CD40. На Фиг. 3 синие столбики обозначают супернатанты, выделенные из нестимулированных клеток; красные столбики обозначают супернатанты, выделенные из стимулированных анти-IgM/анти-CD40 клеток. «*» обозначает p<0,05 по двухфакторному Anova; планки погрешностей указывают СПС по 3 независимым экспериментам.As illustrated in FIG. 3, after stimulation with αIgM/αCD40, LCLs generated from SIGIRR loss-of-function patient cells produced more IFN-γ, IL-2, IL-4, IL-6, IL-8, IL-10, IL-12p70 and TNF-α than healthy LCL or some LCL from IBD-RV patients without SIGIRR with loss of function. In addition, unstimulated LCL generated from SIGIRR loss-of-function patient cells secreted increased levels of IFN-γ, IL-2, IL-4, IL-6, IL-8, IL-10, and TNF-α compared to healthy controls. LCL or some LCL from IBD-RV patients, indicating that SIGIRR loss-of-function LCL are constitutively active and resistant to anti-IgM/anti-CD40 stimulation. In FIG. 3 blue bars indicate supernatants isolated from unstimulated cells; red bars indicate supernatants isolated from anti-IgM/anti-CD40 stimulated cells. “*” denotes p<0.05 by two-way Anova; Error bars indicate PCA from 3 independent experiments.

В нестимулированных клетках наблюдали повышающую регуляцию ключевых иммунных стимуляторов, включая ИЛ-1β, ИЛ-8 и ИЛ-6 в ЛКЛ пациента с ВЗК-РВ с усеченным (c.557delA; p.K186fs*31) SIGIRR по сравнению с ЛКЛ, созданными из здоровых контрольных клеток, и с ЛКЛ, созданными из клеток пациентов с ВЗК-РВ, не имеющих вариантов SIGIRR с потерей функции (ПФ). Это наблюдение подтверждает уникальную воспалительную сигнатуру у пациентов с ВЗК, несущих варианты SIGIRR с потерей функции. Кроме того, согласно наблюдениям, ЛКЛ пациентов с ВЗК-РВ с SIGIRR являются устойчивыми к стимуляции ИЛ-1β или ТПР, что подтверждает конститутивную активацию этих провоспалительных путей в отсутствие SIGIRR.In unstimulated cells, up-regulation of key immune stimulators including IL-1β, IL-8 and IL-6 was observed in IBD-RV patient LCLs with a truncated (c.557delA; p.K186fs*31) SIGIRR compared to LCLs generated from healthy control cells, and with LCLs generated from cells from IBD-RV patients lacking SIGIRR loss-of-function (LF) variants. This observation supports a unique inflammatory signature in IBD patients harboring loss-of-function SIGIRR variants. Additionally, MCL from IBD-RV patients with SIGIRR have been observed to be resistant to IL-1β or TPR stimulation, suggesting constitutive activation of these proinflammatory pathways in the absence of SIGIRR.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES

<110> Regeneron Pharmaceuticals, Inc.<110> Regeneron Pharmaceuticals, Inc.

<120> ВАРИАНТЫ БЕЛКА, РОДСТВЕННОГО РЕЦЕПТОРУ ИНТЕРЛЕЙКИНА-1<120> INTERLEUKIN-1 RECEPTOR-RELATED PROTEIN VARIANTS

И СОДЕРЖАЩЕГО ОДИНОЧНЫЙ ДОМЕН ИММУНОГЛОБУЛИНА (SIGIRR), AND CONTAINING A SINGLE IMMUNOGLOBULIN DOMAIN (SIGIRR),

И ИХ ПРИМЕНЕНИЕ AND THEIR APPLICATION

<130> 189238.00602<130> 189238.00602

<150> 62/554,857<150> 62/554,857

<151> 2017-09-06<151> 2017-09-06

<160> 16<160> 16

<170> PatentIn, версия 3.5<170> PatentIn, version 3.5

<210> 1<210> 1

<211> 11739<211> 11739

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> геномная последовательность SIGIRR дикого типа<223> wild-type SIGIRR genomic sequence

<400> 1<400> 1

actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60

gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120

ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180

ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240

gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300

gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360

gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420

agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480

tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540

ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600

cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660

gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720

gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780

gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840

gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900

tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960

gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020

tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080

ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140

agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200

ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260

gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320

caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380

tgggaccctg agcccaaggc ccaccatcac ccaaggctga gtaccgggac aaaggaaggt 1440tgggaccctg agcccaaggc cccacatcac ccaaggctga gtaccgggac aaaggaaggt 1440

cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagagggt 1500cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagaggt 1500

gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560

ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620

ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680

aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740

tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800

atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860

ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920

gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980

gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040

gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100

aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160

acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220

cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280

ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340

ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400

tgggtggggt ttagggttag gagaggatgt gactgcaagg ccaggaagct acagggaaag 2460tgggtggggt ttagggttag gagaggatgt gactgcaagg cccaggaagct acagggaaag 2460

ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520

tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580

aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640

cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700

ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760

gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820

ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880

gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940

tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000

acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060

gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120

agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180

gagagggtgc aggggaaggt gtgcagggaa aggtggggag gggagagggt gcaggggaag 3240gagagggtgc aggggaaggt gtgcagggaa aggtggggag ggggagaggt gcaggggaag 3240

gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300

ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360

ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420

ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480

ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540

agagagggtg caggggaagg tggggagggg agagggtgca gggggaggca ggcagaggag 3600agagaggtg caggggaagg tggggagggg agaggtgca gggggaggca ggcagaggag 3600

agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660

tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720

ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggagaggg tgcaggggag 3780ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggaggg tgcaggggag 3780

agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840

cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900

ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960

ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020

tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080

actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140

catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200

gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260

cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320

cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380

acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440

tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500

gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560

cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620

ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680

gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740

gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800

gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860

ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920

gcaccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980gcacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980

gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040

ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100

tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160

cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220

gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280

cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340

gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400

cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460

gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520

cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580

gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640

gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700

gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760

tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820

actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880

gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940

cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000

gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060

cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120

cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180

ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240

gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300

ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360

cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420

ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480

ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540

cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600

ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660

gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720

cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780

ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840

catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900

agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960

actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020

cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080

tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140

agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200

ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260

acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320

cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380

taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440

caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500

gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560

ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620

cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680

ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740

cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800

gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860

cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920

gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980

gtggtgggga gggcttgcct gtggccagga gcagagggcc ccaagacccc caaggcagga 8040gtggtgggga gggcttgcct gtggccagga gcagaggggcc ccaagacccc caaggcagga 8040

atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100

tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160

gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220

accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280

acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340

tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400

cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460

gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520

gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580

tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640

tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700

gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760

gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820

tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880

ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940

ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000

aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060

gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120

ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180

gacaggtggg gttcgggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240gacaggtggg gttcggggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240

atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300

gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360

tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420

ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480

aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540

cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600

ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660

cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720

gcggcgggga ggggttagcc cccgggtgct ctgtgcggcc cggctggggt taaagtccgg 9780gcggcgggga ggggttagcc cccggggtgct ctgtgcggcc cggctggggt taaagtccgg 9780

ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840

gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900

gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960

aagccgcagc tggagcggcg tcggggctac aagctcttcc tggacgaccg cgacctcctg 10020aagccgcagc tggagcggcg tcggggctac aagctcttcc tggacgaccg cgacctcctg 10020

ccgcgcgctg gtatcccggg ccccaccccg tgccccgccc acccggaggg cccgccccgc 10080ccgcgcgctg gtatcccggg ccccaccccg tgccccgccc acccggaggg cccgccccgc 10080

cccgccccat gctccgtccc acccggggcc ccacccccac catcgagctc cgcccccatc 10140cccgccccat gctccgtccc acccggggcc ccacccccac catcgagctc cgcccccatc 10140

cccgcccacc cgaggccccg cctcaaaaac ccgcccaccc cgcaggcccc gcccctccct 10200cccgcccacc cgaggccccg cctcaaaaac ccgcccaccc cgcaggcccc gcccctccct 10200

tagagctctg cgtccggcac cgcccctgag cctccggccc cgccctcccc cgcccccgcc 10260tagagctctg cgtccggcac cgcccctgag cctccggccc cgccctcccc cgcccccgcc 10260

cctgcgccgc cgacgcccgc cctcccgcag agccctccgc cgacctcttg gtgaacctga 10320cctgcgccgc cgacgcccgc cctcccgcag agccctccgc cgacctcttg gtgaacctga 10320

gccgctgccg acgcctcatc gtggtgcttt cggacgcctt cctgagccgg gcctggtgca 10380gccgctgccg acgcctcatc gtggtgcttt cggacgcctt cctgagccgg gcctggtgca 10380

gccacagctt ccggtgggtc ccgcgcgggg ttgggtgggc cccagcgtag cacccacccc 10440gccacagctt ccggtgggtc ccgcgcgggg ttgggtgggc cccagcgtag cacccacccc 10440

cctgacggtc ccgccccgca gggagggcct gtgccggctg ctggagctca cccgcagacc 10500cctgacggtc ccgccccgca gggagggcct gtgccggctg ctggagctca cccgcagacc 10500

catcttcatc accttcgagg gccagaggcg cgaccccgcg cacccggcgc tccgcctgct 10560catcttcatc accttcgagg gccagaggcg cgaccccgcg cacccggcgc tccgcctgct 10560

gcgccagcac cgccacctgg tgaccttgct gctctggagg cccggctccg tggtgcggag 10620gcgccagcac cgccacctgg tgaccttgct gctctggagg cccggctccg tggtgcggag 10620

caggcgcggg agggtccggg gctagcggcg ggttagagat gggcggtgcc cgggctccag 10680caggcgcggg agggtccggg gctagcggcg ggttagagat gggcggtgcc cgggctccag 10680

gctgggaccc ctccgtgggg agctctgcgg caccacgctt tgtgaatggg ccctgggggg 10740gctgggaccc ctccgtgggg agctctgcgg caccacgctt tgtgaatggg ccctgggggg 10740

aggttccgct gcctggggcc ccgatgcggg gagccgccct tgaggccccc ggagccacgg 10800aggttccgct gcctggggcc ccgatgcggg gagccgccct tgaggccccc ggagccacgg 10800

aatagctgtc gcagggcgtg gaacccgtgg gcagccgcag gtgtgctctt gggggccagg 10860aatagctgtc gcagggcgtg gaacccgtgg gcagccgcag gtgtgctctt gggggccagg 10860

acgccagggg cttccgaggt gttcacacct gcaaaccgcc ccgacctggc ccccagactc 10920acgccagggg cttccgaggt gttcacacct gcaaaccgcc ccgacctggc ccccagactc 10920

cttcctccga tttttggaaa gaagtgcagc tggcgctgcc gcggaaggtg cagtacaggc 10980cttcctccga tttttggaaa gaagtgcagc tggcgctgcc gcggaaggtg cagtacaggc 10980

ctgtggaagg agacccccag acgcagctgc aggacgacaa ggaccccatg ctgattcttc 11040ctgtggaagg agacccccag acgcagctgc aggacgacaa ggaccccatg ctgattcttc 11040

gaggccgagt ccctgagggc cgggccctgg actcagaggt ggacccggac cctgagggcg 11100gaggccgagt ccctgagggc cgggccctgg actcagaggt ggacccggac cctgagggcg 11100

acctgggtat gcccgcccag ccccactccc caactggaga agctcagcac agggcggagt 11160acctgggtat gcccgcccag ccccactccc caactggaga agctcagcac agggcggagt 11160

gggggcaggc acagggcaca gggcctggag gggctccagg tgttgaggac tcttcccggc 11220gggggcaggc acagggcaca gggcctggag gggctccagg tgttgaggac tcttcccggc 11220

accgggagcc cctgcacggc ctctgccctg gaggtgctcg gccctcggtc tgcctgggaa 11280accgggagcc cctgcacggc ctctgccctg gaggtgctcg gccctcggtc tgcctgggaa 11280

cttcctgggc ctcacaggcc atcacagcag ggggtgagca ggggcagccc ctggcagtgg 11340cttcctgggc ctcacaggcc atcacagcag ggggtgagca ggggcagccc ctggcagtgg 11340

gtctgggcca aggctgtggg tggccacctc aggcgtctcg gtctccccac cccaggtgtc 11400gtctgggcca aggctgtggg tggccacctc aggcgtctcg gtctccccac cccaggtgtc 11400

cgggggcctg tctttggaga gccatcagct ccaccgcaca ccagtggggt ctcgctggga 11460cggggggcctg tctttggaga gccatcagct ccaccgcaca ccagtggggt ctcgctggga 11460

gagagccgga gcagcgaagt ggacgtctcg gatctcggct cgcgaaacta cagtgcccgc 11520gagagccgga gcagcgaagt ggacgtctcg gatctcggct cgcgaaacta cagtgcccgc 11520

acagacttct actgcctggt gtccaaggat gatatgtagc tcccacccca gagtgcagga 11580acagacttct actgcctggt gtccaaggat gatatgtagc tcccacccca gagtgcagga 11580

tcatagggac agcgggggcc agggcagcgg cgtcgctcct ctgctcaaca ggaccacaac 11640tcatagggac agcggggggcc agggcagcgg cgtcgctcct ctgctcaaca ggaccacaac 11640

ccctgccagc agccctggga ccctgccagc agccctggga aaaggctgtg gcctcagggc 11700ccctgccagc agccctggga ccctgccagc agccctggga aaaggctgtg gcctcagggc 11700

gcctcccagt gccagaaaat aaagtccttt tggattctg 11739gcctcccagt gccagaaaat aaagtccttt tggattctg 11739

<210> 2<210> 2

<211> 11738<211> 11738

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> Геномная последовательность вариантного SIGIRR(c.557delA)<223> Genomic sequence of variant SIGIRR(c.557delA)

<400> 2<400> 2

actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60

gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120

ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180

ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240

gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300

gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360

gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420

agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480

tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540

ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600

cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660

gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720

gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780

gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840

gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900

tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960

gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020

tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080

ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140

agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200

ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260

gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320

caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380

tgggaccctg agcccaaggc ccaccatcac ccaaggctga gtaccgggac aaaggaaggt 1440tgggaccctg agcccaaggc cccacatcac ccaaggctga gtaccgggac aaaggaaggt 1440

cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagagggt 1500cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagaggt 1500

gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560

ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620

ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680

aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740

tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800

atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860

ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920

gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980

gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040

gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100

aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160

acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220

cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280

ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340

ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400

tgggtggggt ttagggttag gagaggatgt gactgcaagg ccaggaagct acagggaaag 2460tgggtggggt ttagggttag gagaggatgt gactgcaagg cccaggaagct acagggaaag 2460

ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520

tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580

aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640

cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700

ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760

gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820

ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880

gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940

tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000

acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060

gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120

agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180

gagagggtgc aggggaaggt gtgcagggaa aggtggggag gggagagggt gcaggggaag 3240gagagggtgc aggggaaggt gtgcagggaa aggtggggag ggggagaggt gcaggggaag 3240

gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300

ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360

ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420

ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480

ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540

agagagggtg caggggaagg tggggagggg agagggtgca gggggaggca ggcagaggag 3600agagaggtg caggggaagg tggggagggg agaggtgca gggggaggca ggcagaggag 3600

agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660

tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720

ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggagaggg tgcaggggag 3780ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggaggg tgcaggggag 3780

agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840

cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900

ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960

ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020

tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080

actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140

catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200

gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260

cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320

cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380

acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440

tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500

gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560

cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620

ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680

gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740

gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800

gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860

ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920

gcaccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980gcacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980

gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040

ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100

tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160

cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220

gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280

cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340

gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400

cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460

gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520

cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580

gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640

gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700

gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760

tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820

actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880

gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940

cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000

gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060

cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120

cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180

ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240

gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300

ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360

cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420

ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480

ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540

cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600

ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660

gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720

cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780

ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840

catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900

agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960

actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020

cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080

tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140

agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200

ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260

acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320

cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380

taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440

caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500

gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560

ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620

cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680

ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740

cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800

gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860

cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920

gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980

gtggtgggga gggcttgcct gtggccagga gcagagggcc ccaagacccc caaggcagga 8040gtggtgggga gggcttgcct gtggccagga gcagaggggcc ccaagacccc caaggcagga 8040

atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100

tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160

gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220

accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280

acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340

tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400

cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460

gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520

gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580

tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640

tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700

gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760

gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820

tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880

ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940

ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000

aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060

gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120

ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180

gacaggtggg gttcgggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240gacaggtggg gttcggggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240

atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300

gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360

tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420

ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480

aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540

cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600

ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660

cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720

gcggcgggga ggggttagcc cccgggtgct ctgtgcggcc cggctggggt taaagtccgg 9780gcggcgggga ggggttagcc cccggggtgct ctgtgcggcc cggctggggt taaagtccgg 9780

ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840

gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900

gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960

agccgcagct ggagcggcgt cggggctaca agctcttcct ggacgaccgc gacctcctgc 10020agccgcagct ggagcggcgt cggggctaca agctcttcct ggacgaccgc gacctcctgc 10020

cgcgcgctgg tatcccgggc cccaccccgt gccccgccca cccggagggc ccgccccgcc 10080cgcgcgctgg tatcccgggc cccaccccgt gccccgccca cccggagggc ccgccccgcc 10080

ccgccccatg ctccgtccca cccggggccc cacccccacc atcgagctcc gcccccatcc 10140ccgccccatg ctccgtccca cccggggccc cacccccacc atcgagctcc gcccccatcc 10140

ccgcccaccc gaggccccgc ctcaaaaacc cgcccacccc gcaggccccg cccctccctt 10200ccgcccaccc gaggccccgc ctcaaaaacc cgcccacccc gcaggccccg cccctccctt 10200

agagctctgc gtccggcacc gcccctgagc ctccggcccc gccctccccc gcccccgccc 10260agagctctgc gtccggcacc gcccctgagc ctccggcccc gccctccccc gcccccgccc 10260

ctgcgccgcc gacgcccgcc ctcccgcaga gccctccgcc gacctcttgg tgaacctgag 10320ctgcgccgcc gacgcccgcc ctcccgcaga gccctccgcc gacctcttgg tgaacctgag 10320

ccgctgccga cgcctcatcg tggtgctttc ggacgccttc ctgagccggg cctggtgcag 10380ccgctgccga cgcctcatcg tggtgctttc ggacgccttc ctgagccggg cctggtgcag 10380

ccacagcttc cggtgggtcc cgcgcggggt tgggtgggcc ccagcgtagc acccaccccc 10440ccacagcttc cggtgggtcc cgcgcggggt tgggtggggcc ccagcgtagc acccaccccc 10440

ctgacggtcc cgccccgcag ggagggcctg tgccggctgc tggagctcac ccgcagaccc 10500ctgacggtcc cgccccgcag ggagggcctg tgccggctgc tggagctcac ccgcagaccc 10500

atcttcatca ccttcgaggg ccagaggcgc gaccccgcgc acccggcgct ccgcctgctg 10560atcttcatca ccttcgaggg ccagaggcgc gaccccgcgc acccggcgct ccgcctgctg 10560

cgccagcacc gccacctggt gaccttgctg ctctggaggc ccggctccgt ggtgcggagc 10620cgccagcacc gccacctggt gaccttgctg ctctggaggc ccggctccgt ggtgcggagc 10620

aggcgcggga gggtccgggg ctagcggcgg gttagagatg ggcggtgccc gggctccagg 10680aggcgcggga gggtccgggg ctagcggcgg gttagagatg ggcggtgccc gggctccagg 10680

ctgggacccc tccgtgggga gctctgcggc accacgcttt gtgaatgggc cctgggggga 10740ctgggacccc tccgtgggga gctctgcggc accacgcttt gtgaatgggc cctgggggga 10740

ggttccgctg cctggggccc cgatgcgggg agccgccctt gaggcccccg gagccacgga 10800ggttccgctg cctggggccc cgatgcgggg agccgccctt gaggcccccg gagccacgga 10800

atagctgtcg cagggcgtgg aacccgtggg cagccgcagg tgtgctcttg ggggccagga 10860atagctgtcg cagggcgtgg aacccgtggg cagccgcagg tgtgctcttg ggggccagga 10860

cgccaggggc ttccgaggtg ttcacacctg caaaccgccc cgacctggcc cccagactcc 10920cgccaggggc ttccgaggtg ttcacacctg caaaccgccc cgacctggcc cccagactcc 10920

ttcctccgat ttttggaaag aagtgcagct ggcgctgccg cggaaggtgc agtacaggcc 10980ttcctccgat ttttggaaag aagtgcagct ggcgctgccg cggaaggtgc agtacaggcc 10980

tgtggaagga gacccccaga cgcagctgca ggacgacaag gaccccatgc tgattcttcg 11040tgtggaagga gacccccaga cgcagctgca ggacgacaag gaccccatgc tgattcttcg 11040

aggccgagtc cctgagggcc gggccctgga ctcagaggtg gacccggacc ctgagggcga 11100aggccgagtc cctgagggcc gggccctgga ctcagaggtg gacccggacc ctgaggcga 11100

cctgggtatg cccgcccagc cccactcccc aactggagaa gctcagcaca gggcggagtg 11160cctgggtatg cccgcccagc cccactcccc aactggagaa gctcagcaca gggcggagtg 11160

ggggcaggca cagggcacag ggcctggagg ggctccaggt gttgaggact cttcccggca 11220ggggcaggca cagggcacag ggcctggagg ggctccaggt gttgaggact cttcccggca 11220

ccgggagccc ctgcacggcc tctgccctgg aggtgctcgg ccctcggtct gcctgggaac 11280ccgggagccc ctgcacggcc tctgccctgg aggtgctcgg ccctcggtct gcctgggaac 11280

ttcctgggcc tcacaggcca tcacagcagg gggtgagcag gggcagcccc tggcagtggg 11340ttcctgggcc tcacaggcca tcacagcagg gggtgagcag gggcagcccc tggcagtggg 11340

tctgggccaa ggctgtgggt ggccacctca ggcgtctcgg tctccccacc ccaggtgtcc 11400tctgggccaa ggctgtgggt ggccacctca ggcgtctcgg tctccccacc ccaggtgtcc 11400

gggggcctgt ctttggagag ccatcagctc caccgcacac cagtggggtc tcgctgggag 11460gggggcctgt ctttggagag ccatcagctc caccgcacac cagtggggtc tcgctgggag 11460

agagccggag cagcgaagtg gacgtctcgg atctcggctc gcgaaactac agtgcccgca 11520agagccggag cagcgaagtg gacgtctcgg atctcggctc gcgaaactac agtgcccgca 11520

cagacttcta ctgcctggtg tccaaggatg atatgtagct cccaccccag agtgcaggat 11580cagacttcta ctgcctggtg tccaaggatg atatgtagct cccaccccag agtgcaggat 11580

catagggaca gcgggggcca gggcagcggc gtcgctcctc tgctcaacag gaccacaacc 11640catagggaca gcggggggcca gggcagcggc gtcgctcctc tgctcaacag gaccacaacc 11640

cctgccagca gccctgggac cctgccagca gccctgggaa aaggctgtgg cctcagggcg 11700cctgccagca gccctgggac cctgccagca gccctgggaa aaggctgtgg cctcagggcg 11700

cctcccagtg ccagaaaata aagtcctttt ggattctg 11738cctcccagtg ccagaaaata aagtcctttt ggattctg 11738

<210> 3<210> 3

<211> 1230<211> 1230

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> мРНК SIGIRR дикого типа<223> wild type SIGIRR mRNA

<400> 3<400> 3

augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60

aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120

cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180

cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240

aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300

cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360

gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420

aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480

gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540

gugaacuuca uccuaaagcc gcagcuggag cggcgucggg gcuacaagcu cuuccuggac 600gugaacuuca uccuaaagcc gcagcuggag cggcgucggg gcuacaagcu cuuccuggac 600

gaccgcgacc uccugccgcg cgcugagccc uccgccgacc ucuuggugaa ccugagccgc 660gaccgcgacc uccugccgcg cgcugagccc uccgccgacc ucuuggugaa ccugagccgc 660

ugccgacgcc ucaucguggu gcuuucggac gccuuccuga gccgggccug gugcagccac 720ugccgacgcc ucaucguggu gcuuucggac gccuuccuga gccgggccug gugcagccac 720

agcuuccggg agggccugug ccggcugcug gagcucaccc gcagacccau cuucaucacc 780agcuuccggg agggccugug ccggcugcug gagcucaccc gcagacccau cuucaucacc 780

uucgagggcc agaggcgcga ccccgcgcac ccggcgcucc gccugcugcg ccagcaccgc 840uucgagggcc agaggcgcga ccccgcgcac ccggcgcucc gccugcugcg ccagcaccgc 840

caccugguga ccuugcugcu cuggaggccc ggcuccguga cuccuuccuc cgauuuuugg 900caccugguga ccuugcugcu cuggaggccc ggcuccguga cuccuuccuc cgauuuuugg 900

aaagaagugc agcuggcgcu gccgcggaag gugcaguaca ggccugugga aggagacccc 960aaagaagugc agcuggcgcu gccgcggaag gugcaguaca ggccugugga aggagacccc 960

cagacgcagc ugcaggacga caaggacccc augcugauuc uucgaggccg agucccugag 1020cagacgcagc ugcaggacga caaggacccc augcugauuc uucgaggccg agucccugag 1020

ggccgggccc uggacucaga gguggacccg gacccugagg gcgaccuggg uguccggggg 1080ggccgggccc uggacucaga gguggacccg gacccugagg gcgaccuggg uguccggggg 1080

ccugucuuug gagagccauc agcuccaccg cacaccagug gggucucgcu gggagagagc 1140ccugucuuug gagagccauc agcuccaccg cacaccagug gggucucgcu gggagagagc 1140

cggagcagcg aaguggacgu cucggaucuc ggcucgcgaa acuacagugc ccgcacagac 1200cggagcagcg aaguggacgu cucggaucuc ggcucgcgaa acuacagugc ccgcacagac 1200

uucuacugcc ugguguccaa ggaugauaug 1230uucuacugcc ugguguccaa ggaugauaug 1230

<210> 4<210> 4

<211> 645<211> 645

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> мРНК вариантного (c.557delA) SIGIRR<223> mRNA variant (c.557delA) SIGIRR

<400> 4<400> 4

augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60

aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120

cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180

cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240

aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300

cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360

gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420

aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480

gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540

gugaacuuca uccuaagccg cagcuggagc ggcgucgggg cuacaagcuc uuccuggacg 600gugaacuuca uccuaagccg cagcuggagc ggcgucgggg cuacaagcuc uuccuggacg 600

accgcgaccu ccugccgcgc gcugagcccu ccgccgaccu cuugg 645accgcgaccu ccugccgcgc gcugagcccu ccgccgaccu cuugg 645

<210> 5<210> 5

<211> 1233<211> 1233

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кДНК SIGIRR дикого типа<223> wild-type SIGIRR cDNA

<400> 5<400> 5

atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60

aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120

cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattgggggc 180cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattggggggc 180

cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240

agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300

cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360

gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420

aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480

gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540

gtgaacttca tcctaaagcc gcagctggag cggcgtcggg gctacaagct cttcctggac 600gtgaacttca tcctaaagcc gcagctggag cggcgtcggg gctacaagct cttcctggac 600

gaccgcgacc tcctgccgcg cgctgagccc tccgccgacc tcttggtgaa cctgagccgc 660gaccgcgacc tcctgccgcg cgctgagccc tccgccgacc tcttggtgaa cctgagccgc 660

tgccgacgcc tcatcgtggt gctttcggac gccttcctga gccgggcctg gtgcagccac 720tgccgacgcc tcatcgtggt gctttcggac gccttcctga gccgggcctg gtgcagccac 720

agcttccggg agggcctgtg ccggctgctg gagctcaccc gcagacccat cttcatcacc 780agcttccggg agggcctgtg ccggctgctg gagctcaccc gcagacccat cttcatcacc 780

ttcgagggcc agaggcgcga ccccgcgcac ccggcgctcc gcctgctgcg ccagcaccgc 840ttcgaggggcc agaggcgcga ccccgcgcac ccggcgctcc gcctgctgcg ccagcaccgc 840

cacctggtga ccttgctgct ctggaggccc ggctccgtga ctccttcctc cgatttttgg 900cacctggtga ccttgctgct ctggaggccc ggctccgtga ctccttcctc cgatttttgg 900

aaagaagtgc agctggcgct gccgcggaag gtgcagtaca ggcctgtgga aggagacccc 960aaagaagtgc agctggcgct gccgcggaag gtgcagtaca ggcctgtgga aggagacccc 960

cagacgcagc tgcaggacga caaggacccc atgctgattc ttcgaggccg agtccctgag 1020cagacgcagc tgcaggacga caaggacccc atgctgattc ttcgaggccg agtccctgag 1020

ggccgggccc tggactcaga ggtggacccg gaccctgagg gcgacctggg tgtccggggg 1080ggccgggccc tggactcaga ggtggacccg gaccctgagg gcgacctggg tgtccggggg 1080

cctgtctttg gagagccatc agctccaccg cacaccagtg gggtctcgct gggagagagc 1140cctgtctttg gagagccatc agctccaccg cacaccagtg gggtctcgct gggagagagc 1140

cggagcagcg aagtggacgt ctcggatctc ggctcgcgaa actacagtgc ccgcacagac 1200cggagcagcg aagtggacgt ctcggatctc ggctcgcgaa actacagtgc ccgcacagac 1200

ttctactgcc tggtgtccaa ggatgatatg tag 1233ttctactgcc tggtgtccaa ggatgatatg tag 1233

<210> 6<210> 6

<211> 648<211> 648

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кДНК вариантного (c.557delA) SIGIRR<223> cDNA variant (c.557delA) SIGIRR

<400> 6<400> 6

atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60

aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120

cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattgggggc 180cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattggggggc 180

cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240

agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300

cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360

gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420

aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480

gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540

gtgaacttca tcctaagccg cagctggagc ggcgtcgggg ctacaagctc ttcctggacg 600gtgaacttca tcctaagccg cagctggagc ggcgtcgggg ctacaagctc ttcctggacg 600

accgcgacct cctgccgcgc gctgagccct ccgccgacct cttggtga 648accgcgacct cctgccgcgc gctgagccct ccgccgacct cttggtga 648

<210> 7<210> 7

<211> 410<211> 410

<212> Белок<212> Protein

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> белок SIGIRR дикого типа<223> wild type SIGIRR protein

<400> 7<400> 7

Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu

1 5 10 15 1 5 10 15

Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys

20 25 30 20 25 30

Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln

35 40 45 35 40 45

Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu

50 55 60 50 55 60

His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser

65 70 75 80 65 70 75 80

Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe

85 90 95 85 90 95

Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg

100 105 110 100 105 110

Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val

115 120 125 115 120 125

Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu

130 135 140 130 135 140

Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn

145 150 155 160 145 150 155 160

Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu

165 170 175 165 170 175

Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg

180 185 190 180 185 190

Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala

195 200 205 195 200 205

Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu

210 215 220 210 215 220

Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His

225 230 235 240 225 230 235 240

Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro

245 250 255 245 250 255

Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala

260 265 270 260 265 270

Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp

275 280 285 275 280 285

Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln

290 295 300 290 295 300

Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro

305 310 315 320 305 310 315 320

Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly

325 330 335 325 330 335

Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro

340 345 350 340 345 350

Glu Gly Asp Leu Gly Val Arg Gly Pro Val Phe Gly Glu Pro Ser Ala Glu Gly Asp Leu Gly Val Arg Gly Pro Val Phe Gly Glu Pro Ser Ala

355 360 365 355 360 365

Pro Pro His Thr Ser Gly Val Ser Leu Gly Glu Ser Arg Ser Ser Glu Pro Pro His Thr Ser Gly Val Ser Leu Gly Glu Ser Arg Ser Ser Glu

370 375 380 370 375 380

Val Asp Val Ser Asp Leu Gly Ser Arg Asn Tyr Ser Ala Arg Thr Asp Val Asp Val Ser Asp Leu Gly Ser Arg Asn Tyr Ser Ala Arg Thr Asp

385 390 395 400 385 390 395 400

Phe Tyr Cys Leu Val Ser Lys Asp Asp Met Phe Tyr Cys Leu Val Ser Lys Asp Asp Met

405 410 405 410

<210> 8<210> 8

<211> 504<211> 504

<212> Белок<212> Protein

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> изоформа белка SIGIRR дикого типа<223> wild-type SIGIRR protein isoform

<400> 8<400> 8

Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu

1 5 10 15 1 5 10 15

Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys

20 25 30 20 25 30

Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln

35 40 45 35 40 45

Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu

50 55 60 50 55 60

His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser

65 70 75 80 65 70 75 80

Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe

85 90 95 85 90 95

Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg

100 105 110 100 105 110

Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val

115 120 125 115 120 125

Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu

130 135 140 130 135 140

Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn

145 150 155 160 145 150 155 160

Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu

165 170 175 165 170 175

Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg

180 185 190 180 185 190

Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala

195 200 205 195 200 205

Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu

210 215 220 210 215 220

Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His

225 230 235 240 225 230 235 240

Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro

245 250 255 245 250 255

Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala

260 265 270 260 265 270

Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp

275 280 285 275 280 285

Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln

290 295 300 290 295 300

Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro

305 310 315 320 305 310 315 320

Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly

325 330 335 325 330 335

Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro

340 345 350 340 345 350

Glu Gly Asp Leu Gly Met Pro Ala Gln Pro His Ser Pro Thr Gly Glu Glu Gly Asp Leu Gly Met Pro Ala Gln Pro His Ser Pro Thr Gly Glu

355 360 365 355 360 365

Ala Gln His Arg Ala Glu Trp Gly Gln Ala Gln Gly Thr Gly Pro Gly Ala Gln His Arg Ala Glu Trp Gly Gln Ala Gln Gly Thr Gly Pro Gly

370 375 380 370 375 380

Gly Ala Leu Gly Val Glu Asp Ser Ser Arg His Arg Glu Pro Leu His Gly Ala Leu Gly Val Glu Asp Ser Ser Arg His Arg Glu Pro Leu His

385 390 395 400 385 390 395 400

Gly Leu Cys Pro Gly Gly Ala Arg Pro Ser Val Cys Leu Gly Thr Ser Gly Leu Cys Pro Gly Gly Ala Arg Pro Ser Val Cys Leu Gly Thr Ser

405 410 415 405 410 415

Trp Ala Ser Gln Ala Ile Thr Ala Gly Gly Glu Gln Gly Gln Pro Leu Trp Ala Ser Gln Ala Ile Thr Ala Gly Gly Glu Gln Gly Gln Pro Leu

420 425 430 420 425 430

Ala Val Gly Leu Gly Gln Gly Cys Gly Trp Pro Pro Gln Ala Ser Arg Ala Val Gly Leu Gly Gln Gly Cys Gly Trp Pro Pro Gln Ala Ser Arg

435 440 445 435 440 445

Ser Pro His Pro Arg Cys Pro Gly Ala Cys Phe Trp Arg Ala Ile Ser Ser Pro His Pro Arg Cys Pro Gly Ala Cys Phe Trp Arg Ala Ile Ser

450 455 460 450 455 460

Ser Thr Ala His Gln Trp Gly Leu Ala Gly Arg Glu Pro Glu Gln Arg Ser Thr Ala His Gln Trp Gly Leu Ala Gly Arg Glu Pro Glu Gln Arg

465 470 475 480 465 470 475 480

Ser Gly Arg Leu Gly Ser Arg Leu Ala Lys Leu Gln Cys Pro His Arg Ser Gly Arg Leu Gly Ser Arg Leu Ala Lys Leu Gln Cys Pro His Arg

485 490 495 485 490 495

Leu Leu Leu Pro Gly Val Gln Gly Leu Leu Leu Pro Gly Val Gln Gly

500 500

<210> 9<210> 9

<211> 215<211> 215

<212> Белок<212> Protein

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> Вариантный SIGIRR (c.557delA)<223> Variant SIGIRR (c.557delA)

<400> 9<400> 9

Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu

1 5 10 15 1 5 10 15

Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys

20 25 30 20 25 30

Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln

35 40 45 35 40 45

Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu

50 55 60 50 55 60

His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser

65 70 75 80 65 70 75 80

Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe

85 90 95 85 90 95

Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg

100 105 110 100 105 110

Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val

115 120 125 115 120 125

Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu

130 135 140 130 135 140

Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn

145 150 155 160 145 150 155 160

Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu

165 170 175 165 170 175

Asp Arg Lys Phe Val Asn Phe Ile Leu Ser Arg Ser Trp Ser Gly Val Asp Arg Lys Phe Val Asn Phe Ile Leu Ser Arg Ser Trp Ser Gly Val

180 185 190 180 185 190

Gly Ala Thr Ser Ser Ser Trp Thr Thr Ala Thr Ser Cys Arg Ala Leu Gly Ala Thr Ser Ser Ser Trp Thr Thr Ala Thr Ser Cys Arg Ala Leu

195 200 205 195 200 205

Ser Pro Pro Pro Thr Ser Trp Ser Pro Pro Pro Thr Ser Trp

210 215 210 215

<210> 10<210> 10

<211> 30<211> 30

<212> Белок<212> Protein

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> Аминокислоты 186–215 SIGIRR дикого типа<223> Amino acids 186–215 SIGIRR wild type

<400> 10<400> 10

Lys Pro Gln Leu Glu Arg Arg Arg Gly Tyr Lys Leu Phe Leu Asp Asp Lys Pro Gln Leu Glu Arg Arg Arg Gly Tyr Lys Leu Phe Leu Asp Asp

1 5 10 151 5 10 15

Arg Asp Leu Leu Pro Arg Ala Glu Pro Ser Ala Asp Leu LeuArg Asp Leu Leu Pro Arg Ala Glu Pro Ser Ala Asp Leu Leu

20 25 30 20 25 30

<210> 11<210> 11

<211> 30<211> 30

<212> Белок<212> Protein

<213> Homo sapiens<213> Homo sapiens

<220><220>

<223> Аминокислоты 186–215 вариантного SIGIRR<223> Amino acids 186–215 of variant SIGIRR

<400> 11<400> 11

Ser Arg Ser Trp Ser Gly Val Gly Ala Thr Ser Ser Ser Trp Thr ThrSer Arg Ser Trp Ser Gly Val Gly Ala Thr Ser Ser Ser Trp Thr Thr

1 5 10 151 5 10 15

Ala Thr Ser Cys Arg Ala Leu Ser Pro Pro Pro Thr Ser TrpAla Thr Ser Cys Arg Ala Leu Ser Pro Pro Pro Thr Ser Trp

20 25 30 20 25 30

<210> 12<210> 12

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> прямой ПЦР-праймер для SIGIRR<223> forward PCR primer for SIGIRR

<400> 12<400> 12

tcagtggctc tgaactgcac 20tcagtggctc tgaactgcac 20

<210> 13<210> 13

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> обратный ПЦР-праймер для SIGIRR<223> reverse PCR primer for SIGIRR

<400> 13<400> 13

ggtcctgttg agcagaggag 20ggtcctgttg agcagaggag 20

<210> 14<210> 14

<211> 910<211> 910

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> рилонацепт-слитый белок<223> rilonacept fusion protein

<400> 14<400> 14

Met Val Leu Leu Trp Cys Val Val Ser Leu Tyr Phe Tyr Gly Ile Leu Met Val Leu Leu Trp Cys Val Val Ser Leu Tyr Phe Tyr Gly Ile Leu

1 5 10 15 1 5 10 15

Gln Ser Asp Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met Gln Ser Asp Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met

20 25 30 20 25 30

Arg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys ProArg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys Pro

35 40 45 35 40 45

Leu Phe Glu His Phe Leu Lys Phe Asn Tyr Ser Thr Ala His Ser Ala Leu Phe Glu His Phe Leu Lys Phe Asn Tyr Ser Thr Ala His Ser Ala

50 55 60 50 55 60

Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu

65 70 75 8065 70 75 80

Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys

85 90 95 85 90 95

Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr

100 105 110 100 105 110

Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro

115 120 125 115 120 125

Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Pro Met Lys Leu Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Pro Met Lys Leu

130 135 140 130 135 140

Pro Val His Lys Leu Tyr Ile Glu Tyr Gly Ile Gln Arg Ile Thr Cys Pro Val His Lys Leu Tyr Ile Glu Tyr Gly Ile Gln Arg Ile Thr Cys

145 150 155 160145 150 155 160

Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Thr Ile Thr Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Thr Ile Thr

165 170 175 165 170 175

Trp Tyr Met Gly Cys Tyr Lys Ile Gln Asn Phe Asn Asn Val Ile Pro Trp Tyr Met Gly Cys Tyr Lys Ile Gln Asn Phe Asn Asn Val Ile Pro

180 185 190 180 185 190

Glu Gly Met Asn Leu Ser Phe Leu Ile Ala Leu Ile Ser Asn Asn Gly Glu Gly Met Asn Leu Ser Phe Leu Ile Ala Leu Ile Ser Asn Asn Gly

195 200 205 195 200 205

Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Thr Phe His Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Thr Phe His

210 215 220 210 215 220

Leu Thr Arg Thr Leu Thr Val Lys Val Val Gly Ser Pro Lys Asn Ala Leu Thr Arg Thr Leu Thr Val Lys Val Val Gly Ser Pro Lys Asn Ala

225 230 235 240225 230 235 240

Val Pro Pro Val Ile His Ser Pro Asn Asp His Val Val Tyr Glu Lys Val Pro Pro Val Ile His Ser Pro Asn Asp His Val Val Tyr Glu Lys

245 250 255 245 250 255

Glu Pro Gly Glu Glu Leu Leu Ile Pro Cys Thr Val Tyr Phe Ser Phe Glu Pro Gly Glu Glu Leu Leu Ile Pro Cys Thr Val Tyr Phe Ser Phe

260 265 270 260 265 270

Leu Met Asp Ser Arg Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys Leu Met Asp Ser Arg Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys

275 280 285 275 280 285

Pro Asp Asp Ile Thr Ile Asp Val Thr Ile Asn Glu Ser Ile Ser His Pro Asp Asp Ile Thr Ile Asp Val Thr Ile Asn Glu Ser Ile Ser His

290 295 300 290 295 300

Ser Arg Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys Ser Arg Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys

305 310 315 320305 310 315 320

Val Thr Ser Glu Asp Leu Lys Arg Ser Tyr Val Cys His Ala Arg Ser Val Thr Ser Glu Asp Leu Lys Arg Ser Tyr Val Cys His Ala Arg Ser

325 330 335 325 330 335

Ala Lys Gly Glu Val Ala Lys Ala Ala Lys Val Lys Gln Lys Val Pro Ala Lys Gly Glu Val Ala Lys Ala Ala Lys Val Lys Gln Lys Val Pro

340 345 350 340 345 350

Ala Pro Arg Tyr Thr Val Ser Gly Gly Ala Pro Met Leu Ser Glu Ala Ala Pro Arg Tyr Thr Val Ser Gly Gly Ala Pro Met Leu Ser Glu Ala

355 360 365 355 360 365

Asp Lys Cys Lys Glu Arg Glu Glu Lys Ile Ile Leu Val Ser Ser Ala Asp Lys Cys Lys Glu Arg Glu Glu Lys Ile Ile Leu Val Ser Ser Ala

370 375 380 370 375 380

Asn Glu Ile Asp Val Arg Pro Cys Pro Leu Asn Pro Asn Glu His Lys Asn Glu Ile Asp Val Arg Pro Cys Pro Leu Asn Pro Asn Glu His Lys

385 390 395 400385 390 395 400

Gly Thr Ile Thr Trp Tyr Lys Asp Asp Ser Lys Thr Pro Val Ser Thr Gly Thr Ile Thr Trp Tyr Lys Asp Asp Ser Lys Thr Pro Val Ser Thr

405 410 415 405 410 415

Glu Gln Ala Ser Arg Ile His Gln His Lys Glu Lys Leu Trp Phe Val Glu Gln Ala Ser Arg Ile His Gln His Lys Glu Lys Leu Trp Phe Val

420 425 430 420 425 430

Pro Ala Lys Val Glu Asp Ser Gly His Tyr Tyr Cys Val Val Arg Asn Pro Ala Lys Val Glu Asp Ser Gly His Tyr Tyr Cys Val Val Arg Asn

435 440 445 435 440 445

Ser Ser Tyr Cys Leu Arg Ile Lys Ile Ser Ala Lys Phe Val Glu Asn Ser Ser Tyr Cys Leu Arg Ile Lys Ile Ser Ala Lys Phe Val Glu Asn

450 455 460 450 455 460

Glu Pro Asn Leu Cys Tyr Asn Ala Gln Ala Ile Phe Lys Gln Lys LeuGlu Pro Asn Leu Cys Tyr Asn Ala Gln Ala Ile Phe Lys Gln Lys Leu

465 470 475 480465 470 475 480

Pro Val Ala Gly Asp Gly Gly Leu Val Cys Pro Tyr Met Glu Phe Phe Pro Val Ala Gly Asp Gly Gly Leu Val Cys Pro Tyr Met Glu Phe Phe

485 490 495 485 490 495

Lys Asn Glu Asn Asn Glu Leu Pro Lys Leu Gln Trp Tyr Lys Asp Cys Lys Asn Glu Asn Asn Glu Leu Pro Lys Leu Gln Trp Tyr Lys Asp Cys

500 505 510 500 505 510

Lys Pro Leu Leu Leu Asp Asn Ile His Phe Ser Gly Val Lys Asp Arg Lys Pro Leu Leu Leu Asp Asn Ile His Phe Ser Gly Val Lys Asp Arg

515 520 525 515 520 525

Leu Ile Val Met Asn Val Ala Glu Lys His Arg Gly Asn Tyr Thr Cys Leu Ile Val Met Asn Val Ala Glu Lys His Arg Gly Asn Tyr Thr Cys

530 535 540 530 535 540

His Ala Ser Tyr Thr Tyr Leu Gly Lys Gln Tyr Pro Ile Thr Arg Val His Ala Ser Tyr Thr Tyr Leu Gly Lys Gln Tyr Pro Ile Thr Arg Val

545 550 555 560545 550 555 560

Ile Glu Phe Ile Thr Leu Glu Glu Asn Lys Pro Thr Arg Pro Val Ile Ile Glu Phe Ile Thr Leu Glu Glu Asn Lys Pro Thr Arg Pro Val Ile

565 570 575 565 570 575

Val Ser Pro Ala Asn Glu Thr Met Glu Val Asp Leu Gly Ser Gln Ile Val Ser Pro Ala Asn Glu Thr Met Glu Val Asp Leu Gly Ser Gln Ile

580 585 590 580 585 590

Gln Leu Ile Cys Asn Val Thr Gly Gln Leu Ser Asp Ile Ala Tyr Trp Gln Leu Ile Cys Asn Val Thr Gly Gln Leu Ser Asp Ile Ala Tyr Trp

595 600 605 595 600 605

Lys Trp Asn Gly Ser Val Ile Asp Glu Asp Asp Pro Val Leu Gly Glu Lys Trp Asn Gly Ser Val Ile Asp Glu Asp Asp Pro Val Leu Gly Glu

610 615 620 610 615 620

Asp Tyr Tyr Ser Val Glu Asn Pro Ala Asn Lys Arg Arg Ser Thr Leu Asp Tyr Tyr Ser Val Glu Asn Pro Ala Asn Lys Arg Arg Ser Thr Leu

625 630 635 640625 630 635 640

Ile Thr Val Leu Asn Ile Ser Glu Ile Glu Ser Arg Phe Tyr Lys His Ile Thr Val Leu Asn Ile Ser Glu Ile Glu Ser Arg Phe Tyr Lys His

645 650 655 645 650 655

Pro Phe Thr Cys Phe Ala Lys Asn Thr His Gly Ile Asp Ala Ala Tyr Pro Phe Thr Cys Phe Ala Lys Asn Thr His Gly Ile Asp Ala Ala Tyr

660 665 670 660 665 670

Ile Gln Leu Ile Tyr Pro Val Thr Asn Ser Gly Asp Lys Thr His Thr Ile Gln Leu Ile Tyr Pro Val Thr Asn Ser Gly Asp Lys Thr His Thr

675 680 685 675 680 685

Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe

690 695 700 690 695 700

Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro

705 710 715 720705 710 715 720

Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val

725 730 735 725 730 735

Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr

740 745 750 740 745 750

Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val

755 760 765 755 760 765

Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys

770 775 780 770 775 780

Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser

785 790 795 800785 790 795 800

Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro

805 810 815 805 810 815

Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val

820 825 830 820 825 830

Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly

835 840 845 835 840 845

Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp

850 855 860 850 855 860

Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp

865 870 875 880865 870 875 880

Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His

885 890 895 885 890 895

Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly LysAsn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

900 905 910 900 905 910

<210> 15<210> 15

<211> 116<211> 116

<212> Белок<212> Protein

<213> Искусственная последовательность <213> Artificial sequence

<220><220>

<223> вариабельная область тяжелой цепи антитела, нацеленного на IL-6R<223> heavy chain variable region of an antibody targeting IL-6R

<400> 15<400> 15

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly ArgGlu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg

1 5 10 151 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Arg Phe Thr Phe Asp Asp TyrSer Leu Arg Leu Ser Cys Ala Ala Ser Arg Phe Thr Phe Asp Asp Tyr

20 25 30 20 25 30

Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp ValAla Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45 35 40 45

Ser Gly Ile Ser Trp Asn Ser Gly Arg Ile Gly Tyr Ala Asp Ser ValSer Gly Ile Ser Trp Asn Ser Gly Arg Ile Gly Tyr Ala Asp Ser Val

50 55 60 50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Glu Asn Ser Leu PheLys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Glu Asn Ser Leu Phe

65 70 75 8065 70 75 80

Leu Gln Met Asn Gly Leu Arg Ala Glu Asp Thr Ala Leu Tyr Tyr CysLeu Gln Met Asn Gly Leu Arg Ala Glu Asp Thr Ala Leu Tyr Tyr Cys

85 90 95 85 90 95

Ala Lys Gly Arg Asp Ser Phe Asp Ile Trp Gly Gln Gly Thr Met ValAla Lys Gly Arg Asp Ser Phe Asp Ile Trp Gly Gln Gly Thr Met Val

100 105 110 100 105 110

Thr Val Ser SerThr Val Ser Ser

115 115

<210> 16<210> 16

<211> 107<211> 107

<212> Белок<212> Protein

<213> Искусственная последовательность <213> Artificial sequence

<220><220>

<223> вариабельная область легкой цепи антитела, нацеленного на IL-6R<223> light chain variable region of an antibody targeting IL-6R

<400> 16<400> 16

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser Ala Ser Val GlyAsp Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly

1 5 10 151 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Ser TrpAsp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Ser Trp

20 25 30 20 25 30

Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu IleLeu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

35 40 45 35 40 45

Tyr Gly Ala Ser Ser Leu Glu Ser Gly Val Pro Ser Arg Phe Ser GlyTyr Gly Ala Ser Ser Leu Glu Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60 50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln ProSer Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 8065 70 75 80

Glu Asp Phe Ala Ser Tyr Tyr Cys Gln Gln Ala Asn Ser Phe Pro TyrGlu Asp Phe Ala Ser Tyr Tyr Cys Gln Gln Ala Asn Ser Phe Pro Tyr

85 90 95 85 90 95

Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile LysThr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys

100 105 100 105

<---<---

Claims (109)

1. Способ идентификации субъекта-человека, имеющего воспалительное заболевание кишечника с началом в раннем возрасте или риск развития воспалительного заболевания кишечника с началом в раннем возрасте, причем указанный способ включает обнаружение в образце, полученном от субъекта, наличия или отсутствия:1. A method for identifying a human subject having early-onset inflammatory bowel disease or a risk of developing early-onset inflammatory bowel disease, the method comprising detecting in a sample obtained from the subject the presence or absence of: белка SIGIRR, содержащего серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усеченного по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/или a SIGIRR protein containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; and/or молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9;a nucleic acid molecule encoding a SIGIRR protein containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; причем наличие указанного усеченного белка SIGIRR и/или молекулы нуклеиновой кислоты, кодирующей указанный усеченный белок SIGIRR, указывает на то, что субъект имеет воспалительное заболевание кишечника с началом в раннем возрасте, или риск развития воспалительного заболевания кишечника с началом в раннем возрасте,wherein the presence of said truncated SIGIRR protein and/or a nucleic acid molecule encoding said truncated SIGIRR protein indicates that the subject has early-onset inflammatory bowel disease, or is at risk of developing early-onset inflammatory bowel disease, где указанный усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9. wherein said truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9. 2. Способ по п. 1, отличающийся тем, что указанный усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. 2. The method of claim 1, wherein said truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 in accordance with SEQ ID NO:9. 3. Способ по п. 1 или 2, отличающийся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.3. The method according to claim 1 or 2, characterized in that said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 in accordance with SEQ ID NO:9. 4. Способ по п. 1, отличающийся тем, что если у субъекта-человека проявляются один или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте, указанного субъекта-человека идентифицируют как имеющего воспалительное заболевание кишечника с началом в раннем возрасте.4. The method of claim 1, wherein if a human subject exhibits one or more symptoms of early-onset inflammatory bowel disease, said human subject is identified as having early-onset inflammatory bowel disease. 5. Способ по п. 1, отличающийся тем, что указанный способ представляет собой способ in vitro. 5. The method according to claim 1, characterized in that said method is an in vitro method. 6. Способ по п. 1, отличающийся тем, что обнаружение наличия или отсутствия указанного усеченного белка SIGIRR в указанном образце проводят с помощью антитела, специфического в отношении усеченного SIGIRR. 6. The method according to claim 1, characterized in that the detection of the presence or absence of the specified truncated SIGIRR protein in the specified sample is carried out using an antibody specific for the truncated SIGIRR. 7. Способ по п. 6, отличающийся тем, что указанное антитело, специфическое в отношении усеченного SIGIRR, является специфическим в отношении: 7. The method according to claim 6, characterized in that said antibody specific for truncated SIGIRR is specific for: i) серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; илиi) serine at a position corresponding to position 186 in accordance with SEQ ID NO:9; or ii) эпитопа, созданного в белке SIGIRR вследствие мутации со сдвигом рамки, которая приводит к появлению серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. ii) an epitope created in the SIGIRR protein due to a frameshift mutation that results in a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. 8. Способ по п. 6 или 7, отличающийся тем, что обнаружение дополнительно включает сравнение реакции антитела, специфического в отношении усеченного SIGIRR, с реакцией антитела, специфического в отношении SIGIRR дикого типа. 8. The method of claim 6 or 7, wherein the detection further comprises comparing the response of an antibody specific for truncated SIGIRR with that of an antibody specific for wild-type SIGIRR. 9. Способ по п. 1, отличающийся тем, что обнаружение наличия или отсутствия указанного усеченного белка SIGIRR в указанном образце проводят с помощью иммуноферментного анализа (ИФА).9. The method according to claim 1, characterized in that the detection of the presence or absence of the specified truncated SIGIRR protein in the specified sample is carried out using an enzyme-linked immunosorbent assay (ELISA). 10. Способ по п. 1, отличающийся тем, что обнаружение наличия или отсутствия указанной молекулы нуклеиновой кислоты, кодирующей указанный усеченный белок SIGIRR, в указанном образце проводят путем определения, есть ли мутация со сдвигом рамки в указанной молекуле нуклеиновой кислоты, создающая кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.10. The method according to claim 1, characterized in that the detection of the presence or absence of the specified nucleic acid molecule encoding the specified truncated SIGIRR protein in the specified sample is carried out by determining whether there is a frameshift mutation in the specified nucleic acid molecule creating a codon encoding serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. 11. Способ по п. 1, отличающийся тем, что этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем отсеквенированная молекула нуклеиновой кислоты кодирует белок SIGIRR, усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9.11. The method of claim 1, wherein the discovery step comprises sequencing at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the sequenced nucleic acid molecule encodes a SIGIRR protein truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9. 12. Способ по п. 11, отличающийся тем, что отсеквенированная часть молекулы нуклеиновой кислоты содержит некоторое количество позиций, охватывающих кодон, кодирующий позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9.12. The method of claim 11, wherein the sequenced portion of the nucleic acid molecule contains a number of positions spanning the codon encoding the position corresponding to position 186 in accordance with SEQ ID NO:9. 13. Способ по п. 11 или 12, отличающийся тем, что этап обнаружения включает секвенирование всей молекулы нуклеиновой кислоты, кодирующей белок SIGIRR.13. The method according to claim 11 or 12, characterized in that the discovery step includes sequencing the entire nucleic acid molecule encoding the SIGIRR protein. 14. Способ по п. 1, отличающийся тем, что этап обнаружения включает:14. The method according to claim 1, characterized in that the detection step includes: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем амплифицируемая молекула нуклеиновой кислоты включает кодон, кодирующий аминокислоту в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the nucleic acid molecule to be amplified includes a codon encoding an amino acid at a position corresponding to position 186 in accordance with SEQ ID NO:9. мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой;labeling the nucleic acid molecule with a detectable label; приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; иbringing a labeled nucleic acid molecule into contact with a support containing a probe, wherein the probe contains a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 ; And обнаружение пригодной для обнаружения метки.detection of a detectable tag. 15. Способ по п. 14, отличающийся тем, что молекула нуклеиновой кислоты в образце представляет собой мРНК, а этап обнаружения дополнительно включает обратное транскрибирование мРНК в кДНК перед этапом амплификации.15. The method according to claim 14, wherein the nucleic acid molecule in the sample is mRNA, and the detection step further includes reverse transcribing the mRNA into cDNA before the amplification step. 16. Способ по п. 1, отличающийся тем, что этап обнаружения включает:16. The method according to claim 1, characterized in that the detection step includes: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, иbringing a nucleic acid molecule that encodes the SIGIRR protein into contact with a probe containing a detectable tag, the probe comprising a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and обнаружение пригодной для обнаружения метки.detection of a detectable tag. 17. Способ по п. 16, отличающийся тем, что молекула нуклеиновой кислоты находится в клетке, полученной от субъекта-человека.17. The method of claim 16, wherein the nucleic acid molecule is present in a cell obtained from a human subject. 18. Способ по п. 16 или 17, отличающийся тем, что указанный субъект-человек моложе 18 лет.18. The method according to claim 16 or 17, characterized in that said human subject is under 18 years of age. 19. Способ по п. 1, отличающийся тем, что указанный субъект-человек идентифицирован как имеющий болезнь Крона или риск развития болезни Крона.19. The method of claim 1, wherein said human subject is identified as having Crohn's disease or at risk of developing Crohn's disease. 20. Способ диагностирования воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска воспалительного заболевания кишечника с началом в раннем возрасте у субъекта-человека, включающий:20. A method for diagnosing early-onset inflammatory bowel disease or identifying the risk of early-onset inflammatory bowel disease in a human subject, comprising: обнаружение молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, полученный от субъекта-человека, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/илиdetecting a nucleic acid molecule encoding a SIGIRR protein obtained from a human subject, wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO: 9; and/or обнаружение белка SIGIRR, полученного от субъекта-человека, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; иdetecting a SIGIRR protein obtained from a human subject, wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; And диагностирование у субъекта-человека воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта-человека как подверженного риску воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет одного или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте;diagnosing a human subject with early-onset inflammatory bowel disease if the subject has one or more symptoms of early-onset inflammatory bowel disease, or diagnosing the human subject as at risk for early-onset inflammatory bowel disease if the subject does not has one or more symptoms of early-onset inflammatory bowel disease; где указанный усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9.wherein said truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9. 21. Способ по п. 20, отличающийся тем, что указанный усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. 21. The method of claim 20, wherein said truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 in accordance with SEQ ID NO:9. 22. Способ по п. 20 или 21, отличающийся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.22. The method of claim 20 or 21, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9. 23. Способ по п. 20, отличающийся тем, что обнаружение указанного усеченного белка SIGIRR проводят с помощью антитела, специфического в отношении усеченного SIGIRR. 23. The method according to claim 20, characterized in that the detection of said truncated SIGIRR protein is carried out using an antibody specific for the truncated SIGIRR. 24. Способ по п. 23, отличающийся тем, что указанное антитело, специфическое в отношении усеченного SIGIRR, является специфическим в отношении: 24. The method according to claim 23, characterized in that said antibody specific for truncated SIGIRR is specific for: i) серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; илиi) serine at a position corresponding to position 186 in accordance with SEQ ID NO:9; or ii) эпитопа, созданного в белке SIGIRR вследствие мутации со сдвигом рамки, которая приводит к появлению серина в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. ii) an epitope created in the SIGIRR protein due to a frameshift mutation that results in a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. 25. Способ по п. 23 или 24, отличающийся тем, что обнаружение дополнительно включает сравнение реакции антитела, специфического в отношении усеченного SIGIRR, с реакцией антитела, специфического в отношении SIGIRR дикого типа. 25. The method of claim 23 or 24, wherein the detection further comprises comparing the response of an antibody specific for truncated SIGIRR with that of an antibody specific for wild-type SIGIRR. 26. Способ по п. 20, отличающийся тем, что обнаружение указанного усеченного белка SIGIRR проводят с помощью иммуноферментного анализа (ИФА).26. The method according to claim 20, characterized in that the detection of said truncated SIGIRR protein is carried out using an enzyme-linked immunosorbent assay (ELISA). 27. Способ по п. 20, отличающийся тем, что обнаружение указанной молекулы нуклеиновой кислоты, кодирующей указанный усеченный белок SIGIRR, проводят путем определения, есть ли мутация со сдвигом рамки в указанной молекуле нуклеиновой кислоты, создающая кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.27. The method of claim 20, wherein the detection of said nucleic acid molecule encoding said truncated SIGIRR protein is carried out by determining whether there is a frameshift mutation in said nucleic acid molecule creating a codon encoding a serine at a position corresponding to the position 186 according to SEQ ID NO:9. 28. Способ по п. 20, отличающийся тем, что этап обнаружения включает секвенирование по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR.28. The method of claim 20, wherein the discovery step comprises sequencing at least a portion of the nucleic acid molecule that encodes the SIGIRR protein. 29. Способ по п. 28, отличающийся тем, что отсеквенированная часть молекулы нуклеиновой кислоты содержит некоторое количество позиций, охватывающих кодон, кодирующий позицию, соответствующую позиции 186 в соответствии с SEQ ID NO:9.29. The method of claim 28, wherein the sequenced portion of the nucleic acid molecule contains a number of positions spanning the codon encoding the position corresponding to position 186 in accordance with SEQ ID NO:9. 30. Способ по п. 20, отличающийся тем, что этап обнаружения включает секвенирование всей молекулы нуклеиновой кислоты, кодирующей белок SIGIRR.30. The method of claim 20, wherein the discovery step includes sequencing the entire nucleic acid molecule encoding the SIGIRR protein. 31. Способ по п. 20, отличающийся тем, что этап обнаружения включает:31. The method according to claim 20, characterized in that the detection step includes: амплификацию по меньшей мере части молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, причем амплифицированная молекула нуклеиновой кислоты охватывает кодон, кодирующий аминокислоту в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9;amplifying at least a portion of a nucleic acid molecule that encodes a SIGIRR protein, wherein the amplified nucleic acid molecule spans a codon encoding an amino acid at a position corresponding to position 186 in accordance with SEQ ID NO:9; мечение молекулы нуклеиновой кислоты пригодной для обнаружения меткой;labeling the nucleic acid molecule with a detectable label; приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей зонд, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; иbringing a labeled nucleic acid molecule into contact with a support containing a probe, wherein the probe contains a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9 ; And обнаружение пригодной для обнаружения метки.detection of a detectable tag. 32. Способ по п. 31, отличающийся тем, что молекула нуклеиновой кислоты представляет собой мРНК, а указанный способ дополнительно включает обратное транскрибирование мРНК в кДНК перед этапом амплификации.32. The method according to claim 31, characterized in that the nucleic acid molecule is mRNA, and said method further includes reverse transcribing the mRNA into cDNA before the amplification step. 33. Способ по п. 20, отличающийся тем, что этап обнаружения включает:33. The method according to claim 20, characterized in that the detection step includes: приведение молекулы нуклеиновой кислоты, которая кодирует белок SIGIRR, в контакт с зондом, содержащим пригодную для обнаружения метку, причем зонд содержит последовательность нуклеиновой кислоты, которая специфически гибридизируется в жестких условиях с последовательностью нуклеиновой кислоты, содержащей кодон, кодирующий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9; иbringing a nucleic acid molecule that encodes the SIGIRR protein into contact with a probe containing a detectable tag, the probe comprising a nucleic acid sequence that specifically hybridizes under stringent conditions to a nucleic acid sequence containing a codon encoding a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9; And обнаружение пригодной для обнаружения метки.detection of a detectable tag. 34. Способ по п. 33, отличающийся тем, что молекула нуклеиновой кислоты находится в клетке, полученной от субъекта-человека.34. The method of claim 33, wherein the nucleic acid molecule is present in a cell obtained from a human subject. 35. Способ по п. 20, отличающийся тем, что указанный субъект-человек моложе 18 лет.35. The method according to claim 20, characterized in that said human subject is under 18 years of age. 36. Способ по п. 20, отличающийся тем, что указанный субъект-человек идентифицирован как имеющий болезнь Крона или риск развития болезни Крона.36. The method of claim 20, wherein said human subject is identified as having Crohn's disease or at risk of developing Crohn's disease. 37. Способ лечения воспалительного заболевания кишечника с началом в раннем возрасте или риска воспалительного заболевания кишечника с началом в раннем возрасте у субъекта, включающий:37. A method of treating early-onset inflammatory bowel disease or risk of early-onset inflammatory bowel disease in a subject, comprising: обнаружение молекулы нуклеиновой кислоты, кодирующей белок SIGIRR, полученный от субъекта, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; и/илиdetecting a nucleic acid molecule encoding a SIGIRR protein obtained from a subject, wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; and/or обнаружение белка SIGIRR, полученного от субъекта, причем белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9; иdetecting a SIGIRR protein obtained from a subject, wherein the SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9; And диагностирование у субъекта воспалительного заболевания кишечника с началом в раннем возрасте, если субъект имеет один или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте, или диагностирование субъекта как подверженного риску воспалительного заболевания кишечника с началом в раннем возрасте, если субъект не имеет одного или более симптомов воспалительного заболевания кишечника с началом в раннем возрасте; иdiagnosing a subject with early-onset inflammatory bowel disease if the subject has one or more symptoms of early-onset inflammatory bowel disease, or diagnosing the subject as being at risk for early-onset inflammatory bowel disease if the subject does not have one or more symptoms of inflammatory bowel disease with early onset; And лечение субъекта агентом, эффективным для лечения воспалительного заболевания кишечника с началом в раннем возрасте или имеющего риск воспалительного заболевания кишечника; treating a subject with an agent effective for treating early-onset inflammatory bowel disease or at risk for inflammatory bowel disease; где указанный усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9.wherein said truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9. 38. Способ по п. 20, отличающийся тем, что указанный субъект-человек моложе 18 лет.38. The method according to claim 20, characterized in that said human subject is under 18 years of age. 39. Способ по п. 20, отличающийся тем, что указанный субъект-человек идентифицирован как имеющий болезнь Крона или риск развития болезни Крона.39. The method of claim 20, wherein said human subject is identified as having Crohn's disease or at risk of developing Crohn's disease. 40. Выделенная молекула нуклеиновой кислоты для введения в клетку, при этом выделенная молекула нуклеиновой кислоты содержит последовательность нуклеиновой кислоты, кодирующую человеческий белок, родственный рецептору интерлейкина-1 и содержащий одиночный домен иммуноглобулина (SIGIRR), при этом указанный SIGIRR белок содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или комплементарную цепь нуклеиновой кислоты, кодирующую указанный SIGIRR белок, при этом обнаружение наличия нуклеиновой кислоты в образце, полученном от субъекта, означает, что субъект имеет риск развития воспалительного заболевания кишечника с началом в раннем возрасте, причем усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9.40. An isolated nucleic acid molecule for introduction into a cell, wherein the isolated nucleic acid molecule contains a nucleic acid sequence encoding a human interleukin-1 receptor related protein containing a single immunoglobulin domain (SIGIRR), wherein said SIGIRR protein contains a serine at the position, corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, or a complementary nucleic acid strand encoding the specified SIGIRR protein, wherein detecting the presence of the nucleic acid in the sample obtained from a subject means that the subject is at risk of developing early-onset inflammatory bowel disease, wherein the truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9. 41. Выделенная молекула нуклеиновой кислоты по п. 40 или 41, отличающаяся тем, что указанная молекула нуклеиновой кислоты содержит ДНК.41. The isolated nucleic acid molecule according to claim 40 or 41, characterized in that said nucleic acid molecule contains DNA. 42. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанная молекула нуклеиновой кислоты представляет собой кДНК.42. The isolated nucleic acid molecule according to claim 40, characterized in that said nucleic acid molecule is a cDNA. 43. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанная молекула нуклеиновой кислоты содержит РНК.43. The isolated nucleic acid molecule according to claim 40, characterized in that said nucleic acid molecule contains RNA. 44. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанная молекула нуклеиновой кислоты представляет собой геномную ДНК и содержит гуанин в позиции, соответствующей позиции 9962 в соответствии с SEQ ID NO:2.44. The isolated nucleic acid molecule of claim 40, wherein said nucleic acid molecule is genomic DNA and contains guanine at the position corresponding to position 9962 in accordance with SEQ ID NO:2. 45. Выделенная молекула нуклеиновой кислоты по п. 44, отличающаяся тем, что указанная молекула нуклеиновой кислоты содержит SEQ ID NO:2.45. The isolated nucleic acid molecule of claim 44, wherein said nucleic acid molecule contains SEQ ID NO:2. 46. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанная молекула нуклеиновой кислоты представляет собой мРНК и содержит гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:4.46. The isolated nucleic acid molecule of claim 40, wherein said nucleic acid molecule is mRNA and contains guanine at the position corresponding to position 557 in accordance with SEQ ID NO:4. 47. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанная молекула нуклеиновой кислоты представляет собой мРНК и содержит кодоны CUA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:4.47. The isolated nucleic acid molecule according to claim 40, characterized in that said nucleic acid molecule is mRNA and contains codons CUA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO: 4. 48. Выделенная молекула нуклеиновой кислоты по п. 46, отличающаяся тем, что указанная молекула нуклеиновой кислоты содержит SEQ ID NO:4.48. The isolated nucleic acid molecule of claim 46, wherein said nucleic acid molecule contains SEQ ID NO:4. 49. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанный усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. 49. The isolated nucleic acid molecule of claim 40, wherein said truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 in accordance with SEQ ID NO: 9. 50. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.50. The isolated nucleic acid molecule of claim 40, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9. 51. Выделенная молекула нуклеиновой кислоты по п. 40, отличающаяся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9.51. The isolated nucleic acid molecule of claim 40, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:9. 52. Экспрессионный вектор, содержащий выделенную молекулу нуклеиновой кислоты по любому из пп. 40-51.52. An expression vector containing an isolated nucleic acid molecule according to any one of claims. 40-51. 53. Вектор по п. 52, отличающийся тем, что указанный вектор представляет собой плазмиду.53. The vector according to claim 52, characterized in that said vector is a plasmid. 54. Вектор по п. 52, отличающийся тем, что указанный вектор представляет собой вирус.54. The vector according to claim 52, characterized in that said vector is a virus. 55. кДНК, транскрибированная из молекулы нуклеиновой кислоты мРНК из образца, полученного от субъекта, при этом молекула нуклеиновой кислоты мРНК содержит последовательность нуклеиновой кислоты, кодирующую белок SIGIRR, при этом указанный белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, при этом наличие указанной молекулы нуклеиновой кислоты мРНК, способной транскрибироваться в кДНК, означает, что субъект имеет риск развития воспалительного заболевания кишечника с началом в раннем возрасте, и причем усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9.55. cDNA transcribed from an mRNA nucleic acid molecule from a sample obtained from a subject, wherein the mRNA nucleic acid molecule contains a nucleic acid sequence encoding a SIGIRR protein, wherein said SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at position corresponding to position 215 in accordance with SEQ ID NO:9, wherein the presence of said mRNA nucleic acid molecule capable of being transcribed into cDNA means that the subject is at risk of developing early-onset inflammatory bowel disease and wherein the truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9. 56. кДНК по п. 55, отличающаяся тем, что указанный усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. 56. The cDNA of claim 55, wherein said truncated SIGIRR protein contains a different amino acid from the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 according to SEQ ID NO:9. 57. кДНК по п. 55, отличающаяся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.57. The cDNA of claim 55, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9. 58. кДНК по п. 55, отличающаяся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9 или аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.58. The cDNA of claim 55, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:9 or an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9, and contains a serine at the position corresponding to position 186 in accordance with SEQ ID NO:9. 59. кДНК по п. 55, отличающаяся тем, что указанная кДНК содержит гуанин в позиции, соответствующей позиции 557 в соответствии с SEQ ID NO:6.59. The cDNA according to claim 55, wherein said cDNA contains guanine at a position corresponding to position 557 in accordance with SEQ ID NO:6. 60. кДНК по п. 55, отличающаяся тем, что указанная кДНК содержит кодоны CTA и AGC в позициях, соответствующих позициям 553-555 и 556-558, соответственно, в соответствии с SEQ ID NO:6.60. The cDNA of claim 55, wherein said cDNA contains codons CTA and AGC at positions corresponding to positions 553-555 and 556-558, respectively, in accordance with SEQ ID NO:6. 61. кДНК по п. 55, отличающаяся тем, что указанная кДНК содержит SEQ ID NO:6.61. The cDNA of claim 55, wherein said cDNA contains SEQ ID NO:6. 62. Экспрессионный вектор, содержащий кДНК по любому из пп. 55-61.62. An expression vector containing cDNA according to any one of paragraphs. 55-61. 63. Вектор по п. 62, отличающийся тем, что указанный вектор представляет собой плазмиду.63. The vector according to claim 62, characterized in that said vector is a plasmid. 64. Вектор по п. 62, отличающийся тем, что указанный вектор представляет собой вирус.64. The vector according to claim 62, characterized in that said vector is a virus. 65. Выделенный или рекомбинантный полипептид для диагностирования воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска развития воспалительного заболевания кишечника с началом в раннем возрасте у субъекта, содержащий усеченный белок SIGIRR, отличающийся тем, что указанный белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усечен по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, при этом наличие указанной молекулы нуклеиновой кислоты в образце, полученном от субъекта, означает, что субъект имеет риск развития воспалительного заболевания кишечника с началом в раннем возрасте, причем усеченный белок SIGIRR содержит аминокислотную последовательность, которая имеет по меньшей мере 90% идентичности последовательности с SEQ ID NO:9, и при этом усеченный белок SIGIRR представляет собой вариант с потерей функции в отношении белка SIGIRR дикого типа.65. An isolated or recombinant polypeptide for diagnosing early-onset inflammatory bowel disease or identifying the risk of developing early-onset inflammatory bowel disease in a subject, comprising a truncated SIGIRR protein, characterized in that said SIGIRR protein contains a serine at a position corresponding to the position 186 in accordance with SEQ ID NO:9, and truncated at the position corresponding to position 215 in accordance with SEQ ID NO:9, wherein the presence of the specified nucleic acid molecule in a sample obtained from the subject means that the subject is at risk of developing an inflammatory disease intestine with early onset, wherein the truncated SIGIRR protein contains an amino acid sequence that has at least 90% sequence identity with SEQ ID NO:9, and wherein the truncated SIGIRR protein is a loss-of-function variant of the wild-type SIGIRR protein. 66. Выделенный или рекомбинантный полипептид по п. 65, отличающийся тем, что указанный усеченный белок SIGIRR содержит отличную аминокислоту по сравнению с белком SIGIRR дикого типа в любой из позиций, соответствующих позициям 186-209 и 211-215 в соответствии с SEQ ID NO:9. 66. The isolated or recombinant polypeptide of claim 65, wherein said truncated SIGIRR protein contains a different amino acid compared to the wild-type SIGIRR protein at any of the positions corresponding to positions 186-209 and 211-215 in accordance with SEQ ID NO: 9. 67. Выделенный или рекомбинантный полипептид по п. 65, отличающийся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:11 в позициях, соответствующих позициям 186-215 в соответствии с SEQ ID NO:9.67. The isolated or recombinant polypeptide of claim 65, wherein said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:11 at positions corresponding to positions 186-215 of SEQ ID NO:9. 68. Выделенный или рекомбинантный полипептид по п. 66, отличающийся тем, что указанный усеченный белок SIGIRR содержит серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9. 68. The isolated or recombinant polypeptide of claim 66, wherein said truncated SIGIRR protein contains a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. 69. Выделенный или рекомбинантный полипептид п. 65, отличающийся тем, что указанный усеченный белок SIGIRR содержит аминокислотную последовательность SEQ ID NO:9.69. The isolated or recombinant polypeptide of claim 65, characterized in that said truncated SIGIRR protein contains the amino acid sequence of SEQ ID NO:9. 70. Выделенный или рекомбинантный полипептид по п. 65, отличающийся тем, что указанный полипептид слит с гетерологичным полипептидом.70. An isolated or recombinant polypeptide according to claim 65, characterized in that said polypeptide is fused to a heterologous polypeptide. 71. Выделенный или рекомбинантный полипептид по п. 70, отличающийся тем, что указанный гетерологичный полипептид содержит пептидный тэг для очистки, флуоресцентный белок или как пептидный тэг для очистки, так и флуоресцентный белок.71. The isolated or recombinant polypeptide of claim 70, wherein said heterologous polypeptide contains a purification peptide tag, a fluorescent protein, or both a purification peptide tag and a fluorescent protein. 72. Выделенный или рекомбинантный полипептид по п. 65, отличающийся тем, что указанный полипептид связан с пригодной для выявления меткой.72. The isolated or recombinant polypeptide of claim 65, characterized in that said polypeptide is associated with a detectable label. 73. Выделенный или рекомбинантный полипептид по п. 72, отличающийся тем, что указанная пригодная для выявления метка представляет собой флуоресцентную метку или радиоактивную метку.73. The isolated or recombinant polypeptide according to claim 72, characterized in that said detectable label is a fluorescent label or a radioactive label. 74. Набор зондов или праймеров для выявления воспалительного заболевания кишечника с началом в раннем возрасте или выявления риска воспалительного заболевания кишечника с началом в раннем возрасте, в котором зонд или праймер содержат последовательность нуклеиновой кислоты, содержащую по меньшей мере около 15 нуклеотидов, которая специфически гибридизируется с молекулой нуклеиновой кислоты, имеющей последовательность нуклеиновой кислоты, кодирующую человеческий белок SIGIRR, содержащий серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9, и усеченный по позиции, соответствующей позиции 215 в соответствии с SEQ ID NO:9, или которая специфически гибридизируется с комплементарной цепью последовательности нуклеиновой кислоты, кодирующей указанный усеченный человеческий белок SIGIRR.74. A set of probes or primers for detecting early-onset inflammatory bowel disease or identifying the risk of early-onset inflammatory bowel disease, wherein the probe or primer comprises a nucleic acid sequence of at least about 15 nucleotides that specifically hybridizes to a nucleic acid molecule having a nucleic acid sequence encoding a human SIGIRR protein containing a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9, and truncated at a position corresponding to position 215 in accordance with SEQ ID NO:9, or which specifically hybridizes to the complementary strand of the nucleic acid sequence encoding the specified truncated human SIGIRR protein. 75. Набор по п. 74, отличающийся тем, что указанные зонд или праймер содержат ДНК.75. The kit according to claim 74, characterized in that said probe or primer contains DNA. 76. Набор по п. 74, отличающийся тем, что указанные зонд или праймер содержат РНК.76. The kit according to claim 74, characterized in that said probe or primer contains RNA. 77. Набор по любому из пп. 74-76, отличающийся тем, что указанные зонд или праймер специфически гибридизируются с частью молекулы нуклеиновой кислоты, содержащей кодон, который кодирует серин в позиции, соответствующей позиции 186 в соответствии с SEQ ID NO:9.77. Set according to any one of paragraphs. 74-76, characterized in that said probe or primer specifically hybridizes to a portion of a nucleic acid molecule containing a codon that encodes a serine at a position corresponding to position 186 in accordance with SEQ ID NO:9. 78. Набор по п. 74, отличающийся тем, что указанные зонд или праймер специфически гибридизируются с последовательностью нуклеиновой кислоты, кодирующей усеченный белок SIGIRR, или ее комплементарной цепью, в жестких условиях.78. The kit according to claim 74, characterized in that said probe or primer specifically hybridizes to a nucleic acid sequence encoding a truncated SIGIRR protein, or its complementary strand, under stringent conditions. 79. Набор по п. 74, отличающийся тем, что указанные зонд или праймер содержат метку.79. The kit according to claim 74, characterized in that said probe or primer contains a label. 80. Набор по п. 79, отличающийся тем, что указанная метка представляет собой флуоресцентную метку, радиоактивную метку или биотин.80. The kit according to claim 79, characterized in that the specified label is a fluorescent label, a radioactive label or biotin.
RU2020112474A 2017-09-06 2018-09-05 Variants of protein related to interleukin-1 receptor and containing single immunoglobulin domain (sigirr), and use thereof RU2815068C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762554857P 2017-09-06 2017-09-06
US62/554,857 2017-09-06
PCT/US2018/049478 WO2019050899A1 (en) 2017-09-06 2018-09-05 Single immunoglobulin interleukin-1 receptor related (sigirr) variants and uses thereof

Publications (3)

Publication Number Publication Date
RU2020112474A RU2020112474A (en) 2021-10-06
RU2020112474A3 RU2020112474A3 (en) 2021-12-29
RU2815068C2 true RU2815068C2 (en) 2024-03-11

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999032626A1 (en) * 1997-12-23 1999-07-01 Immunex Corporation Sigirr dna and polypeptides
WO2005084696A1 (en) * 2004-03-08 2005-09-15 Universita'degli Studi Di Milano Methods and agents for controlling intestinal inflammation and mucosal immunity using agents interacting with tir8/sigirr
RU2502806C2 (en) * 2007-02-22 2013-12-27 Дженентек, Инк. Detection method of intestine inflammatory disease

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999032626A1 (en) * 1997-12-23 1999-07-01 Immunex Corporation Sigirr dna and polypeptides
WO2005084696A1 (en) * 2004-03-08 2005-09-15 Universita'degli Studi Di Milano Methods and agents for controlling intestinal inflammation and mucosal immunity using agents interacting with tir8/sigirr
RU2502806C2 (en) * 2007-02-22 2013-12-27 Дженентек, Инк. Detection method of intestine inflammatory disease

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SAMPATH V. et al., SIGIRR genetic variants in premature infants with necrotizing enterocolitis, Pediatrics, 2015, v.135, n.6, p.e1530-1534, реферат, е1531;. СЛОВАРЬ БИОТЕХНОЛОГИЧЕСКИХ ТЕРМИНОВ, под ред. Тарантула В.З., Москва, 2005, 127с., с.42-43. *
SHUNJI ISHIHARA et al., Inflammatory bowel disease: review from the aspect of genetics, JOURNAL OF GASTROENTEROLOGY, 2009, v. 44, n. 11, p.1097-1108. GARLANDA C. et al., TIR8/SIGIRR: an IL-1R/TLR family member with regulatory functions in inflammation and T cell polarization, TRENDS IN IMMUNOLOGY, 2009, v. 30, n. 9, p. 439- 446. ZHAO JUNJIE et al., Human Colon Tumors Express a Dominant-Negative Form of SIGIRR That Promotes Inflammation and Colitis-Associated Colon Cancer in Mice, GASTROENTEROLOGY, 2015, v. 149, n. 7, p.1860. *
XIONG HUIFANG et al., The sinomenine enteric-coated microspheres suppressed the TLR/NF-[kappa]B signaling in DSS-induced experimental colitis, INTERNATIONAL IMMUNOPHARMACOLOGY, 2017, v. 50, p. 251-262. *
База данных "dbSNP" номер ss1711956220, размещен 04.03.2015. *

Similar Documents

Publication Publication Date Title
US20220267743A1 (en) HSD17B13 Variants And Uses Thereof
US20220073589A1 (en) GPR156 Variants And Uses Thereof
US20220017964A1 (en) Cornulin (CRNN) Variants And Uses Thereof
RU2815068C2 (en) Variants of protein related to interleukin-1 receptor and containing single immunoglobulin domain (sigirr), and use thereof
JP7237064B2 (en) Single immunoglobulin interleukin-1 receptor-related (SIGIRR) variants and uses thereof
US20210230609A1 (en) Solute Carrier Family 14 Member 1 (SLC14A1) Variants And Uses Thereof