CN111373053A - 单免疫球蛋白白介素-1受体相关分子(sigirr)变体及其用途 - Google Patents

单免疫球蛋白白介素-1受体相关分子(sigirr)变体及其用途 Download PDF

Info

Publication number
CN111373053A
CN111373053A CN201880071851.1A CN201880071851A CN111373053A CN 111373053 A CN111373053 A CN 111373053A CN 201880071851 A CN201880071851 A CN 201880071851A CN 111373053 A CN111373053 A CN 111373053A
Authority
CN
China
Prior art keywords
nucleic acid
seq
sigirr
truncated
acid molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880071851.1A
Other languages
English (en)
Inventor
C·G·贡萨加-贾雷吉
J·霍罗威茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN111373053A publication Critical patent/CN111373053A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/06Gastro-intestinal diseases
    • G01N2800/065Bowel diseases, e.g. Crohn, ulcerative colitis, IBS

Abstract

本公开提供包含编码截短人单免疫球蛋白白介素‑1受体相关(SIGIRR)蛋白的改变的核酸分子,包括cDNA。本公开还提供在对应于位置215的位置处包含截短的经分离和重组人SIGIRR蛋白变体。所述截短以及编码这个变化的核酸分子与早期发作型炎症性肠病(EO‑IBD)相关。本公开还提供用于基于对编码SIGIRR的核酸分子中的所述改变的鉴定来确定受试者是否患有EO‑IBD或具有显现EO‑IBD的风险的方法。

Description

单免疫球蛋白白介素-1受体相关分子(SIGIRR)变体及其用途
相关申请的交叉引用
本申请要求2017年9月6日提交的美国临时申请序列号62/554,857的优先权,所述美国临时申请以引用的方式整体并入本文。
序列表的引用
本申请包括以文本文件形式电子提交的序列表,所述文本文件名为18923800602SEQ,于2018年8月30日创建,大小是56千字节。所述序列表以引用的方式并入本文。
技术领域
本公开总体上涉及遗传学领域。更特别地,本公开涉及单免疫球蛋白白介素-1受体相关分子(Single Immunoglobulin Interleukin-1 Receptor Related,SIGIRR)中的与例如早期发作型炎症性肠病(EO-IBD)相关的基因改变和多肽变体。
背景技术
在整篇说明书中引用各种参考资料,包括专利、专利申请、登录号、技术文章和学术文章。每个参考资料都以引用的方式整体以及出于所有目的并入本文。
炎症性肠病(IBD)是一种遗传异质性慢性炎症性病症,由对胃肠道中的偏利共生微生物丛的不当免疫应答引发,并且平均发作年龄在30岁。重度单基因形式的IBD可在儿科发作年龄(<18岁)下呈现,并且已被归因于约50种‘孟德尔(Mendelian)’基因中的罕见、高度外显变体。然而,对早期发作型炎症性肠病(EO-IBD)的遗传组构的了解不充分,并且大多数患者仍然未得以遗传诊断。
本公开提供将有助于了解SIGIRR的生物学,并且将促进对患有早期发作型炎症性肠病的儿童的诊断和治疗的新型SIGIRR变体。
发明内容
本公开提供已在本文中证明与炎症性肠病诸如早期发作型炎症性肠病相关的编码SIGIRR变异多肽的新型核酸分子(即基因组DNA、mRNA和cDNA)和SIGIRR变异多肽。
本公开提供包含编码人SIGIRR蛋白的核酸序列,其中所述蛋白在对应于根据SEQID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的经分离核酸分子。
本公开还提供包含编码人SIGIRR蛋白的至少一部分的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的基因组DNA分子。
本公开还提供包含编码人SIGIRR蛋白的至少一部分的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的cDNA分子。
本公开还提供包含编码人SIGIRR蛋白的至少一部分的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的mRNA分子。
本公开还提供包含本文公开的经分离核酸分子中的任一者的载体。
本公开还提供包含本文公开的经分离核酸分子或载体中的任一者以及载剂的组合物。
本公开还提供包含本文公开的经分离核酸分子或载体中的任一者的宿主细胞。
本公开还提供包含人SIGIRR蛋白的至少一部分的经分离或重组多肽,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。
本公开还提供包含本文公开的经分离或重组多肽中的任一者以及载剂的组合物。
本公开还提供包含核酸序列的一种探针或一种引物,所述核酸序列包含至少约5个核苷酸,所述探针或引物杂交于编码人SIGIRR蛋白的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,或所述探针或引物杂交于编码所述人SIGIRR蛋白的所述核酸序列的互补序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。
本公开还提供包含本文公开的探针中的任一者与其杂交的基底的支撑物。
本公开还提供一种包含互补于编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸序列的核酸序列的改变特异性探针或引物,其中所述改变特异性探针或引物包含互补于核酸分子的编码对应于根据SEQ ID NO:9的位置186至209或211至215的任何多个位置的部分的核酸序列。在一些实施方案中,改变特异性探针或引物特异性杂交于核酸分子的编码对应于根据SEQ ID NO:9的位置186的位置的部分或其互补序列。改变特异性探针或引物不杂交于具有编码野生型SIGIRR蛋白的核酸序列的核酸分子。
本公开还提供用于鉴定患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险的人受试者的方法,其中所述方法包括在从所述受试者获得的样品中检测截短SIGIRR蛋白;和/或编码截短SIGIRR蛋白的核酸分子的存在性或不存在性;其中存在所述截短SIGIRR蛋白和/或编码所述截短SIGIRR蛋白的所述核酸分子指示所述受试者患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险。
本公开还提供用于鉴定患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险的人受试者的方法,其中所述方法包括在从所述受试者获得的样品中检测在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白;和/或编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸分子的存在性或不存在性;其中存在所述截短SIGIRR蛋白和/或编码所述截短SIGIRR蛋白的所述核酸分子指示所述受试者患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险。
本公开还提供用于在人受试者中诊断炎症性肠病或早期发作型炎症性肠病或检测显现炎症性肠病或早期发作型炎症性肠病的风险的方法,所述方法包括:检测从所述人受试者获得的编码SIGIRR蛋白的核酸分子中的改变,其中所述改变编码截短SIGIRR蛋白;以及如果所述受试者具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有早期发作型炎症性肠病,或如果所述受试者不具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于显现炎症性肠病或早期发作型炎症性肠病的风险下。
本公开还提供用于在人受试者中诊断炎症性肠病或早期发作型炎症性肠病或检测显现炎症性肠病或早期发作型炎症性肠病的风险的方法,所述方法包括:检测从所述人受试者获得的编码SIGIRR蛋白的核酸分子中的改变,其中所述改变编码在对应于根据SEQID NO:9的位置215的位置处被截短的SIGIRR蛋白;以及如果所述受试者具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有早期发作型炎症性肠病,或如果所述受试者不具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于显现炎症性肠病或早期发作型炎症性肠病的风险下。
附图说明
并入本说明书中并构成本说明书的一部分的附图说明若干方面,并且连同描述一起用于解释本公开的原理。
图1图版A、图版B和图版C显示在具有克罗恩氏病(Crohn’s Disease)的家庭中SIGIRR中的具有显性分离的致截短变体。
图2显示来自对细胞培养上清液运用的Mesoscale Discovery促炎性细胞因子组套的结果,所述细胞培养上清液取自从健康对照、SIGIRR LoF患者和4名不具有SIGIRR LoF的EO IBD患者产生的LCL,所述LCL未经刺激或用2mg/ml LPS处理72小时。
图3显示来自对细胞培养上清液运用的Mesoscale Discovery促炎性细胞因子组套的结果,所述细胞培养上清液取自从健康对照、SIGIRR LoF患者和4名不具有SIGIRR LoF的EO IBD患者产生的LCL,所述LCL未经刺激或用2mg/ml抗IgM抗体/抗CD40抗体处理16小时。
本公开的额外优势将部分地阐述于随后描述中,并且部分地将根据描述而显而易知,或可通过实施本文公开的实施方案来获悉。本公开的优势将借助于在随附权利要求中特别指出的要素和组合来实现和获得。应了解上文一般性描述与下文详细描述两者均仅具有示例性和说明性,并且不限制如要求保护的实施方案。
具体实施方式
与本公开的各个方面相关的各种术语在整篇说明书和权利要求中使用。除非另外指示,否则所述术语将被给与它们在本领域中的普通含义。其他明确定义的术语应以与本文提供的定义一致的方式加以解释。
除非另外明确陈述,否则决不意图本文阐述的任何方法或方面被解释为要求它的步骤以特定顺序进行。因此,当方法权利要求在权利要求或描述中未明确陈述步骤将限于特定顺序时,在任何方面都决不意图推断某一顺序。这适用于任何可能的非明确的解释基础,包括关于安排步骤或操作流程的逻辑事项、由语法组织或标点获得的普通含义、或说明书中所述的方面的数目或类型。
如本文所用,除非上下文另外明确规定,否则单数形式“一个(种)(a/an)”和“这个(种)(the)”包括复数个(种)指示物。
如本文所用,术语“受试者”和“患者”可互换使用。受试者可包括任何动物,包括哺乳动物。哺乳动物包括不限于农场动物(例如马、母牛、猪)、伴侣动物(例如狗、猫)、实验室动物(例如小鼠、大鼠、兔)和非人灵长类动物。在一些实施方案中,受试者是人类。
如本文所用,“核酸”、“核酸分子”、“核酸序列”、“多核苷酸”或“寡核苷酸”可包含任何长度的聚合核苷酸形式,可包括DNA和/或RNA,并且可为单链、双链或多链。核酸的一个链还涉及它的互补序列。
如本文所用,当在给定氨基酸或核酸序列或位置的编号的情形下使用时,短语“对应于”或其语法变化形式是指当将所述给定氨基酸或核酸序列与参照序列(例如其中本文参照序列是(野生型或全长)SIGIRR的核酸分子或多肽)进行比较时,指定参照序列的编号。换句话说,相对于参照序列而非根据残基在给定氨基酸或核酸序列内的实际数值位置来指定给定聚合物的残基(例如氨基酸或核苷酸)编号或残基(例如氨基酸或核苷酸)位置。举例来说,可通过引入空位以使两个序列之间的残基匹配最优化来将给定氨基酸序列与参照序列进行比对。在这些情况下,尽管存在空位,但给定氨基酸或核酸序列中的残基的编号相对于它已与其进行比对的参照序列来作出。
举例来说,短语“在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白”(以及类似短语)意指如果将所述SIGIRR蛋白的氨基酸序列与SEQ ID NO:9的序列进行比对,那么所述SIGIRR蛋白在对应于SEQ ID NO:9的位置215的位置处截短(例如所述SIGIRR蛋白的末端氨基酸是在位置215处的氨基酸)。或者,换句话说,这些短语是指在与SEQ ID NO:9的位置215同源的位置处具有截短的SIGIRR蛋白。在本文中,这种蛋白质也被称为“截短SIGIRR蛋白”或“变异SIGIRR蛋白”或“p.K186fs*31变体”。
通过在给定SIGIRR蛋白与SEQ ID NO:9的氨基酸序列之间进行序列比对,可易于鉴定在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白。同样地,通过在给定SIGIRR蛋白与SEQ ID NO:9的氨基酸序列之间进行序列比对,可易于鉴定在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸的SIGIRR蛋白。存在可用于进行序列比对以鉴定在对应于SEQ ID NO:9中的位置215的位置处的截短,或鉴定在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的多种计算算法。举例来说,通过使用NCBI BLAST算法(Altschul等,1997,Nucleic Acids Res.,25,3389-3402)或CLUSTALW软件(Sievers等,2014,Methods Mol.Biol.,1079,105-116),可进行序列比对。然而,也可手动比对序列。
根据本公开,已观察到SIGIRR中的某些变化与显现早期发作型炎症性肠病的风险相关。一般来说,未完全了解这个蛋白质的功能,特别是在年龄不到18岁的儿童中的功能。据信没有SIGIRR基因或蛋白质的变体与人类的早期发作型炎症性肠病具有任何已知关联。还据信没有SIGIRR基因或蛋白质的变体与特别是儿童的早期发作型炎症性肠病具有任何已知关联。根据本公开,已鉴定SIGIRR基因中的一种罕见变体,所述变体与受影响家庭成员的早期发作型炎症性肠病的表型一起分离。举例来说,已观察到导致在人SIGIRR mRNA或cDNA(例如分别是野生型SEQ ID NO:3和SEQ ID NO:5)的位置557处的腺嘌呤的缺失的遗传改变指示具有这种改变的人可显现早期发作型炎症性肠病,所述缺失导致框移,从而产生在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白(例如末端氨基酸位于位置215处)。总之,本文所述的遗传分析表明SIGIRR基因,并且特别是SIGIRR基因中的致截短或功能丧失变体与对显现早期发作型炎症性肠病的易感性增加相关。因此,可治疗具有与早期发作型炎症性肠病相关的SIGIRR改变的人受试者以抑制早期发作型炎症性肠病,减轻所述早期发作型炎症性肠病的症状,和/或压制症状的发展。因此,本公开提供经分离或重组SIGIRR变异基因,包括cDNA和mRNA,以及经分离或重组SIGIRR变异多肽。另外,本公开提供用于利用对受试者中所述变体的鉴定来鉴定所述受试者中的显现炎症性肠病或早期发作型炎症性肠病的风险或将所述风险分层,或将受试者诊断为患有炎症性肠病或早期发作型炎症性肠病,以使处于风险下的受试者或患有活动性疾病的受试者可被治疗的方法。
两种野生型SIGIRR蛋白的氨基酸序列以SEQ ID NO:7和SEQ ID NO:8阐述。具有SEQ ID NO:7的野生型SIGIRR蛋白在长度方面是410个氨基酸,而具有SEQ ID NO:8的野生型SIGIRR蛋白在长度方面是504个氨基酸。参照SEQ ID NO:7与SEQ ID NO:8两者,野生型蛋白质的位置186至215包含按照所叙述顺序的以下氨基酸:Lys-Pro-Gln-Leu-Glu-Arg-Arg-Arg-Gly-Tyr-Lys-Leu-Phe-Leu-Asp-Asp-Arg-Asp-Leu-Leu-Pro-Arg-Ala-Glu-Pro-Ser-Ala-Asp-Leu-Leu(SEQ ID NO:10)。
本公开提供编码与炎症性肠病或早期发作型炎症性肠病相关的SIGIRR变异蛋白的核酸分子。在一些实施方案中,核酸分子编码截短SIGIRR变异蛋白。举例来说,本公开提供包含编码人SIGIRR蛋白的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的经分离核酸分子。
在一些实施方案中,经分离核酸分子包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。
在一些实施方案中,经分离核酸分子包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
在一些实施方案中,核酸分子包含以下或由以下组成:编码人SIGIRR蛋白的核酸序列,所述人SIGIRR蛋白具有与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列;或所述核酸序列的互补序列。在本文中,如果提及序列同一性百分比,那么相比于较低序列同一性百分比,较高序列同一性百分比是优选的。
在一些实施方案中,经分离核酸分子包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
野生型SIGIRR基因组DNA的核酸序列以SEQ ID NO:1阐述。包含SEQ ID NO:1的野生型SIGIRR基因组DNA在长度方面是11,739个核苷酸。参照SEQ ID NO:1,野生型SIGIRR基因组DNA的位置9962是腺嘌呤。
本公开提供编码变异SIGIRR蛋白的基因组DNA分子。在一些实施方案中,基因组DNA分子编码截短SIGIRR蛋白。在一些实施方案中,基因组DNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,基因组DNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,基因组DNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,基因组DNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,基因组DNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,基因组DNA包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
在一些实施方案中,基因组DNA包含以下或由以下组成:在对应于根据SEQ ID NO:2的位置9962的位置处包含鸟嘌呤的核酸序列。相比之下,野生型SIGIRR基因组DNA在对应于根据SEQ ID NO:1的位置9962的位置处包含腺嘌呤。变异SIGIRR基因组DNA中的改变归因于这个腺嘌呤的缺失,所述缺失产生单核苷酸碱基框移,由此导致鸟嘌呤在对应于SEQ IDNO:2的位置9962的位置处。在一些实施方案中,基因组DNA包含以下或由以下组成:与SEQID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,基因组DNA包含以下或由以下组成:根据SEQ ID NO:2的核酸序列。
在一些实施方案中,经分离核酸分子包含少于整个基因组DNA序列的序列。在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:2的至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约2000、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、至少约10000、至少约11000或至少约11500个连续核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:2的至少约1000至至少约2000个连续核苷酸。
在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:2的至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约1000、至少约1100、至少约1200、至少约1300、至少约1400、至少约1500、至少约1600、至少约1700、至少约1800、至少约1900、至少约2000、至少约2100、至少约2200、至少约2300、至少约2400或至少约2500个连续核苷酸。在一些实施方案中,所述连续核苷酸可与具有连续核苷酸的其他核酸分子组合以产生本文所述的cDNA分子。
所述经分离核酸分子可例如用于表达变异SIGIRR mRNA和蛋白质,或用作外源性供体序列。应了解某一群体内的基因序列可由于多态性诸如SNP而不同。本文提供的实例仅是示例性序列,并且其他序列也是可能的。
在一些实施方案中,经分离核酸分子包含变异SIGIRR小基因,其中一个或多个编码SEQ ID NO:9的非必需区段已相对于相应野生型SIGIRR基因组DNA加以缺失。在一些实施方案中,一个或多个缺失的非必需区段包含一个或多个内含子序列。在一些实施方案中,SIGIRR小基因与SEQ ID NO:2的一部分具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%序列同一性,其中所述小基因包含在对应于根据SEQ ID NO:2的位置9962的位置处具有鸟嘌呤的核酸序列。
野生型SIGIRR mRNA的核酸序列以SEQ ID NO:3阐述。包含SEQ ID NO:3的野生型SIGIRR mRNA在长度方面是1230个核苷酸。参照SEQ ID NO:3,野生型SIGIRR mRNA的位置557是腺嘌呤。
本公开还提供编码变异SIGIRR蛋白的mRNA分子。在一些实施方案中,mRNA分子编码截短SIGIRR蛋白。在一些实施方案中,mRNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,mRNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,mRNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,mRNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,mRNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,mRNA包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
在一些实施方案中,mRNA包含以下或由以下组成:在对应于根据SEQ ID NO:4的位置557的位置处包含鸟嘌呤的核酸序列。相比之下,野生型SIGIRR mRNA在对应于根据SEQID NO:3的位置557的位置处包含腺嘌呤。变异SIGIRR mRNA中的改变归因于这个腺嘌呤的缺失,所述缺失产生单核苷酸碱基框移,由此导致鸟嘌呤在对应于SEQ ID NO:4的位置557的位置处。在一些实施方案中,mRNA包含以下或由以下组成:在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包含密码子CUA和AGC的核酸序列。相比之下,野生型SIGIRR mRNA在分别对应于根据SEQ ID NO:3的位置553至555和556至558的位置处包含密码子CUA和AAG。在一些实施方案中,mRNA包含以下或由以下组成:与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,mRNA包含以下或由以下组成:根据SEQ ID NO:4的核酸序列。
在一些实施方案中,经分离核酸分子包含少于整个SIGIRR mRNA序列的核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:4的至少约5、至少约8、至少约10、至少约12、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400、至少约500或至少约600个连续核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:4的至少约200至至少约500个连续核苷酸。就此而言,相比于较短mRNA分子,较长mRNA分子是优选的。在一些实施方案中,经分离核酸分子包含以下或由以下组成:SEQ ID NO:4的至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400或至少约500个连续核苷酸。就此而言,相比于较短mRNA分子,较长mRNA分子是优选的。在一些实施方案中,所述mRNA分子包括编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子。在一些实施方案中,所述mRNA分子在对应于根据SEQ ID NO:4的位置557的位置处包括鸟嘌呤。在一些实施方案中,所述mRNA分子在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包括密码子CUA和AGC。
野生型SIGIRR cDNA的核酸序列以SEQ ID NO:5阐述。包含SEQ ID NO:5的野生型SIGIRR cDNA在长度方面是1233个核苷酸,包括终止密码子。参照SEQ ID NO:5,野生型SIGIRR cDNA的位置557是腺嘌呤。
本公开还提供编码变异SIGIRR蛋白的cDNA分子。在一些实施方案中,cDNA分子编码截短SIGIRR蛋白。在一些实施方案中,cDNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,cDNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,cDNA包含以下或由以下组成:编码SIGIRR蛋白的核酸序列,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,cDNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,cDNA包含以下或由以下组成:编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,cDNA包含以下或由以下组成:编码截短SIGIRR蛋白的核酸序列,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
在一些实施方案中,cDNA包含以下或由以下组成:在对应于根据SEQ ID NO:6的位置557的位置处包含鸟嘌呤的核酸序列。相比之下,野生型SIGIRR cDNA在对应于根据SEQID NO:5的位置557的位置处包含腺嘌呤。变异SIGIRR cDNA中的改变归因于这个腺嘌呤的缺失,所述缺失产生单核苷酸碱基框移,由此导致鸟嘌呤在对应于SEQ ID NO:6的位置557的位置处。在一些实施方案中,cDNA包含以下或由以下组成:在分别对应于根据SEQ ID NO:6的位置553至555和556至558的位置处包含密码子CTA和AGC的核酸序列。相比之下,野生型SIGIRR cDNA在分别对应于根据SEQ ID NO:5的位置553至555和556至558的位置处包含密码子CTA和AAG。在一些实施方案中,cDNA包含以下或由以下组成:与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,cDNA包含以下或由以下组成:根据SEQ ID NO:6的核酸序列。
在一些实施方案中,cDNA分子包含少于变异SIGIRR cDNA分子的整个序列的序列。在一些实施方案中,cDNA分子包含以下或由以下组成:SEQ ID NO:6的至少约5、至少约8、至少约10、至少约12、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400、至少约500或至少约600个连续核苷酸。在一些实施方案中,cDNA分子包含以下或由以下组成:SEQ ID NO:6的至少约200至至少约500个连续核苷酸。就此而言,相比于较短cDNA分子,较长cDNA分子是优选的。在一些实施方案中,cDNA分子包含以下或由以下组成:SEQ ID NO:6的至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约200、至少约300、至少约400或至少约500个连续核苷酸。就此而言,相比于较短cDNA分子,较长cDNA分子是优选的。在一些实施方案中,所述cDNA分子包括编码在对应于根据SEQ IDNO:9的位置186的位置处的丝氨酸的密码子。在一些实施方案中,所述cDNA分子在对应于根据SEQ ID NO:6的位置557的位置处包括鸟嘌呤。在一些实施方案中,所述cDNA分子在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包括密码子CTA和AGC。
本公开还提供杂交于变异SIGIRR基因组DNA(诸如SEQ ID NO:2)、变异SIGIRR小基因、变异SIGIRR mRNA(诸如SEQ ID NO:4)和/或变异SIGIRR cDNA(诸如SEQ ID NO:6)的经分离核酸分子。在一些实施方案中,所述经分离核酸分子包含以下或由以下组成:至少约5、至少约8、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约21、至少约22、至少约23、至少约24、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约2000、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、至少约10000、至少约11000或至少约11500个核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:至少15个核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:至少15个核苷酸至至少约35个核苷酸。在一些实施方案中,所述经分离核酸分子在严格条件下杂交于变异SIGIRR基因组DNA(诸如SEQ ID NO:2)、变异SIGIRR小基因、变异SIGIRR mRNA(诸如SEQ ID NO:4)和/或变异SIGIRR cDNA(诸如SEQ ID NO:6)。所述核酸分子可例如用作如本文所描述或例示的探针、引物、或改变特异性探针或引物。
在一些实施方案中,经分离核酸分子杂交于与变异SIGIRR基因组DNA(诸如SEQ IDNO:2)、变异SIGIRR小基因、变异SIGIRR mRNA(诸如SEQ ID NO:4)和/或变异SIGIRR cDNA(诸如SEQ ID NO:6)至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核酸分子的至少约15个连续核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:约15至约100个核苷酸、或约15至约35个核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:约15至约100个核苷酸。在一些实施方案中,经分离核酸分子包含以下或由以下组成:约15至约35个核苷酸。
在一些实施方案中,本文公开的核酸分子、基因组DNA分子、cDNA分子或mRNA分子中的任一者都可为纯化的,例如是至少约90%纯净的。在一些实施方案中,本文公开的核酸分子、基因组DNA分子、cDNA分子或mRNA分子中的任一者都可为纯化的,例如是至少约95%纯净的。在一些实施方案中,本文公开的核酸分子、基因组DNA分子、cDNA分子或mRNA分子中的任一者都可为纯化的,例如是至少约99%纯净的。纯化以人造纯化技术手动达成。
本公开还提供本文公开的经分离核酸分子、基因组DNA分子、cDNA分子或mRNA分子中的任一者的片段。在一些实施方案中,片段包含以下或由以下组成:本文公开的核酸序列中的任一者或其任何互补序列的至少约5、至少约8、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约21、至少约22、至少约23、至少约24、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95或至少约100个连续残基。就此而言,相比于较短片段,较长片段是优选的。在一些实施方案中,片段包含以下或由以下组成:至少约5、至少约8、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约21、至少约22、至少约23、至少约24、至少约25、至少约30、至少约35、至少约40、至少约45或至少约50个连续残基。就此而言,相比于较短片段,较长片段是优选的。在一些实施方案中,片段包含以下或由以下组成:至少约20、至少约25、至少约30或至少约35个连续残基。在一些实施方案中,片段包含以下或由以下组成:至少约20个连续残基。在一些实施方案中,片段包含以下或由以下组成:至少约25个连续残基。在一些实施方案中,片段包含以下或由以下组成:至少约30个连续残基。在一些实施方案中,片段包含以下或由以下组成:至少约35个连续残基。设想的是片段包含以下或由以下组成:核酸分子的编码在对应于根据SEQID NO:9的位置186的位置处的丝氨酸,或编码对应于根据SEQ ID NO:9的位置186至215的位置的部分。所述片段可例如用作如本文所描述或例示的探针、引物或等位基因特异性引物。
本公开还提供探针和引物。本公开的探针或引物具有特异性杂交于本文公开的核酸分子中的任一者或其互补序列的核酸序列。在一些实施方案中,探针或引物在严格条件下特异性杂交于本文公开的核酸分子中的任一者。本公开还提供具有在中等条件下杂交于本文公开的核酸分子中的任一者或其互补序列的核酸序列的核酸分子。本公开的探针或引物优选涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核酸密码子或其互补序列。因此,在一优选实施方案中,本公开提供在上文和下文中更详细定义的改变特异性引物。
本公开的探针可用于检测编码变异SIGIRR蛋白(例如根据SEQ ID NO:9)的变异SIGIRR核酸分子(例如基因组DNA、mRNA和/或cDNA)。此外,本公开的引物可用于扩增编码变异SIGIRR蛋白的核酸分子或其片段。本公开还提供包含上述引物中的一者的一对引物。对于以基因组聚合酶链式反应(PCR)扩增含有导致截短的框移变体的SIGIRR片段,适合引物序列包括但不限于:正向引物(5’至3’)TCAGTGGCTCTGAACTGCAC(SEQ ID NO:12)和反向引物(5’至3’):GGTCCTGTTGAGCAGAGGAG(SEQ ID NO:13)。
本文公开的核酸分子可包含天然存在的SIGIRR基因组DNA、cDNA或mRNA转录物的核酸序列,或可包含非天然存在的序列。在一些实施方案中,天然存在的序列可由于同义突变或不影响所编码SIGIRR多肽的突变而不同于非天然存在的序列。举例来说,除同义突变或不影响所编码SIGIRR多肽的突变之外,序列可为相同的。同义突变或取代是在编码蛋白质的基因的外显子中一个核苷酸取代另一核苷酸以致产生的氨基酸序列不改变。由于遗传密码具有简并性,即一些氨基酸由超过一种三碱基对密码子编码,所以这是可能的。同义取代例如用于密码子优化的过程中。本文公开的核酸分子可为密码子优化的。
本文还提供可与所公开核酸分子相互作用的功能性多核苷酸。功能性多核苷酸是具有特定功能诸如结合靶标分子或催化特定反应的核酸分子。功能性多核苷酸的实例包括但不限于反义分子、适体、核酶、形成三链体的分子和外部引导序列。功能性多核苷酸可充当由靶标分子具有的特定活性的效应物、抑制剂、调节剂和刺激物,或功能性多核苷酸可具有不依赖于任何其他分子的全新活性。
反义分子被设计来通过典型或非典型碱基配对与靶标核酸分子相互作用。反义分子和靶标分子的相互作用被设计来通过例如RNA酶-H介导的RNA-DNA杂交物降解促进对靶标分子的破坏。或者,反义分子被设计来阻断通常将发生在靶标分子上的加工功能,诸如转录或复制。反义分子可基于靶标分子的序列来设计。存在用于通过鉴定靶标分子的最可及区域来优化反义效率的众多方法。示例性方法包括但不限于体外选择实验和使用DMS和DEPC进行的DNA修饰研究。反义分子通常以小于或等于约10-6、小于或等于约10-8、小于或等于约10-10、或小于或等于约10-12的解离常数(kd)结合靶标分子。有助于设计和使用反义分子的方法和技术的代表性样例可见于以下非限制性美国专利清单中:5,135,917;5,294,533;5,627,158;5,641,754;5,691,317;5,780,607;5,786,138;5,849,903;5,856,103;5,919,772;5,955,590;5,990,088;5,994,320;5,998,602;6,005,095;6,007,995;6,013,522;6,017,898;6,018,042;6,025,198;6,033,910;6,040,296;6,046,004;6,046,319;和6,057,437。反义分子的实例包括但不限于反义RNA、小干扰RNA(siRNA)和短发夹RNA(shRNA)。
本文公开的经分离核酸分子可包括RNA、DNA、或RNA与DNA两者。经分离核酸分子还可连接于或融合于诸如载体中的异源性核酸序列,或异源性标记。举例来说,本文公开的经分离核酸分子可在包含经分离核酸分子和异源性核酸序列的载体或外源性供体序列中。经分离核酸分子还可连接于或融合于异源性标记,诸如荧光标记。标记的其他实例在本文中其他地方公开。
标记可为可直接检测的(例如荧光团)或可间接检测的(例如半抗原、酶或荧光团淬灭剂)。所述标记可通过分光、光化学、生物化学、免疫化学或化学手段检测。所述标记包括例如可用辐射计数装置测量的放射性标记;可目视观察或用分光光度计测量的颜料、染料或其他色原体;可用自旋标记分析器测量的自旋标记;以及荧光标记(例如荧光团),其中输出信号由对适合分子加合物的激发产生,并且那个输出信号可通过用由染料吸收的光进行激发来显现,或可用标准荧光计或成像系统测量。标记也可为例如化学发光物质,其中输出信号由对信号化合物的化学修饰产生;含金属物质;或酶,其中发生酶依赖性次级信号产生,诸如从无色底物形成有色产物。术语“标记”也可指可选择性结合缀合的分子以使所述缀合的分子在随后连同底物一起添加时用于产生可检测信号的“标签”或半抗原。举例来说,可使用生物素作为标签,接着使用辣根过氧化物酶(HRP)的亲和素或链霉亲和素缀合物来结合所述标签,接着使用发色底物(例如四甲基联苯胺(TMB))或荧光底物来检测HRP的存在性。可作为标签用于促进纯化的示例性标记包括但不限于myc、HA、FLAG或3XFLAG、6XHis或多组氨酸、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白、表位标签、或免疫球蛋白的Fc部分。众多标记是已知的,并且包括例如粒子、荧光团、半抗原、酶和它们的比色、荧光产生性和化学发光底物、以及其他标记。
所公开核酸分子可包含例如核苷酸或非天然或经修饰核苷酸,诸如核苷酸类似物或核苷酸替代物。所述核苷酸包括含有经修饰碱基、糖或磷酸酯基团,或在它的结构中并有非天然部分的核苷酸。非天然核苷酸的实例包括但不限于二脱氧核苷酸、生物素化核苷酸、氨化核苷酸、脱胺化核苷酸、烷基化核苷酸、苯甲基化核苷酸和经荧光体标记核苷酸。
本文公开的核酸分子还可包含一个或多个核苷酸类似物或取代。核苷酸类似物是含有对碱基、糖或磷酸酯部分的修饰的核苷酸。对碱基部分的修饰包括但不限于对A、C、G和T/U以及不同嘌呤或嘧啶碱基的天然和合成修饰,所述不同嘌呤或嘧啶碱基诸如像假尿苷、尿嘧啶-5-基、次黄嘌呤-9-基(I)和2-氨基腺嘌呤-9-基。经修饰碱基包括但不限于5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮杂鸟嘌呤和7-脱氮杂腺嘌呤、以及3-脱氮杂鸟嘌呤和3-脱氮杂腺嘌呤。某些核苷酸类似物可使双链体形成的稳定性增加,所述类似物诸如像5-取代的嘧啶、6-氮杂嘧啶,以及N-2、N-6和O-6取代的嘌呤,包括但不限于2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶和5-甲基胞嘧啶。常常,碱基修饰可与例如糖修饰诸如2’-O-甲氧基乙基组合以实现独特性质诸如双链体稳定性增加。
核苷酸类似物也可包括对糖部分的修饰。对糖部分的修饰包括但不限于对核糖和脱氧核糖的天然修饰以及合成修饰。糖修饰包括但不限于在2’位置处的以下修饰:OH;F;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔基可为取代或未取代的C1-10烷基或C2-10烯基和C2-10炔基。示例性2’糖修饰也包括但不限于-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-ONH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10。
在2’位置处的其他修饰包括但不限于C1-10烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、多烷基氨基、取代的甲硅烷基、RNA裂解基团、报道基团、嵌入剂、用于改进寡核苷酸的药物代谢动力学性质的基团、或用于改进寡核苷酸的药物效应动力学性质的基团、以及具有类似性质的其他取代基。类似修饰也可在糖上的其他位置处进行,特别是在3’末端核苷酸上或在2’-5’连接的寡核苷酸中的糖的3’位置以及5’末端核苷酸的5’位置。经修饰糖也可包括在桥接环氧处含有修饰诸如CH2和S的那些。核苷酸糖类似物也可具有糖模拟物,诸如环丁基部分,而非戊呋喃糖基糖。
核苷酸类似物也可在磷酸酯部分处加以修饰。经修饰磷酸酯部分包括但不限于可被修饰以使两个核苷酸之间的键联含有硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基膦酸酯和其他烷基膦酸酯,包括3’-亚烷基膦酸酯和手性膦酸酯,次膦酸酯、氨基磷酸酯,包括3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯,硫羰氨基磷酸酯、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和硼代磷酸酯的那些。两个核苷酸之间的这些磷酸酯或经修饰磷酸酯键联可通过3’-5’键联或2’-5’键联达成,并且键联可含有倒转极性诸如3'-5'成为5'-3'或2'-5'成为5'-2'。也包括各种盐、混合盐和游离酸形式。
核苷酸替代物包括与核苷酸具有类似功能性质,但不含有磷酸酯部分的分子诸如肽核酸(PNA)。核苷酸替代物包括将以Watson-Crick或Hoogsteen方式识别核酸,但通过除磷酸酯部分以外的部分连接在一起的分子。当与适当靶标核酸相互作用时,核苷酸替代物能够遵循双螺旋型结构。
核苷酸替代物也包括已替换了磷酸酯部分或糖部分的核苷酸或核苷酸类似物。在一些实施方案中,核苷酸替代物可不含有标准磷原子。磷酸酯的替代物可为例如短链烷基或环烷基核苷间键联、混合杂原子和烷基或环烷基核苷间键联、或一个或多个短链杂原子或杂环核苷间键联。这些替代物包括具有吗啉代基键联(部分地由核苷的糖部分形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲缩醛基和硫代甲缩醛基骨架;亚甲基甲缩醛基和硫代甲缩醛基骨架;含烯骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及具有混合N、O、S和CH2组成部分的其他骨架的那些。
还应了解在核苷酸替代物中,核苷酸的糖部分与磷酸酯部分两者均可由例如酰胺型键联(氨基乙基甘氨酸)(PNA)替换。
还有可能使其他类型的分子(缀合物)连接于核苷酸或核苷酸类似物以使例如细胞摄取增强。缀合物可化学连接于核苷酸或核苷酸类似物。所述缀合物包括例如脂质部分诸如胆固醇部分、胆酸、硫醚诸如己基-S-三苯甲基硫醇、硫代胆固醇、脂肪链诸如十二烷二醇或十一基残基、磷脂诸如二-十六基-rac-甘油或1,2-二-O-十六基-rac-甘油基-3-H-膦酸三乙铵、多胺或聚乙二醇链、金刚烷乙酸、棕榈基部分、或十八胺或己基氨基-羰基-羟胆固醇部分。
本公开还提供包含本文公开的核酸分子中的任何一者或多者的载体。在一些实施方案中,载体包含本文公开的核酸分子中的任何一者或多者以及异源性核酸。载体可为能够运送核酸分子的病毒载体或非病毒载体。在一些实施方案中,载体是质粒或粘粒(例如可向其中连接额外DNA区段的环状双链DNA)。在一些实施方案中,载体是病毒载体,其中额外DNA区段可被连接至病毒基因组中。在一些实施方案中,载体可在它所引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型哺乳动物载体)。在一些实施方案中,载体(例如非游离型哺乳动物载体)可在引入宿主细胞中后整合至宿主细胞的基因组中,并且由此连同宿主基因组一起复制。此外,特定载体可引导它们所操作性地连接的基因的表达。所述载体在本文中被称为“重组表达载体”或“表达载体”。所述载体也可为靶向载体(即外源性供体序列)。
在一些实施方案中,由本文公开的各种遗传变体编码的蛋白质通过以下方式来表达:将编码所公开遗传变体的核酸分子插入表达载体中,以使基因操作性地连接于表达控制序列,诸如转录和翻译控制序列。表达载体包括但不限于质粒、粘粒、逆转录病毒、腺病毒、腺相关病毒(AAV)、植物病毒诸如花椰菜花叶病毒和烟草花叶病毒、酵母人工染色体(YAC)、艾伯斯坦-巴尔(Epstein-Barr,EBV)源性游离体、以及本领域中已知的其他表达载体。在一些实施方案中,可将包含所公开遗传变体的核酸分子连接至载体中,以使所述载体内的转录和翻译控制序列发挥它们调控遗传变体的转录和翻译的预定功能。选择表达载体和表达控制序列以可与所用表达宿主细胞相容。可将包含所公开遗传变体的核酸序列作为变异遗传信息插入单独载体中或同一表达载体中。包含所公开遗传变体的核酸序列可通过标准方法(例如连接包含所公开遗传变体的核酸和载体上的互补性限制位点,或如果不存在限制位点,那么进行钝性末端连接)插入表达载体中。
除包含所公开遗传变体的核酸序列之外,重组表达载体也可携带控制遗传变体在宿主细胞中的表达的调控序列。对表达载体的设计,包括对调控序列的选择,可取决于诸如对于待转化宿主细胞的选择、所需蛋白质表达水平等的因素。用于哺乳动物宿主细胞表达的所需调控序列可包括例如引导在哺乳动物细胞中进行高水平的蛋白质表达的病毒元件,诸如源于逆转录病毒LTR、巨细胞病毒(CMV)(诸如CMV启动子/增强子)、猿猴病毒40(SV40)(诸如SV40启动子/增强子)、腺病毒(例如腺病毒主要晚期启动子(AdMLP))、多瘤病毒的启动子和/或增强子;以及强力哺乳动物启动子诸如天然免疫球蛋白和肌动蛋白启动子。在细菌细胞或真菌细胞(例如酵母细胞)中表达多肽的方法也是熟知的。
启动子可为例如组成型活性启动子、条件型启动子、诱导型启动子、时间限制启动子(例如发育调控的启动子)、或空间限制启动子(例如细胞特异性或组织特异性启动子)。启动子的实例可例如见于WO 2013/176772中。
诱导型启动子的实例包括例如化学调控的启动子和物理调控的启动子。化学调控的启动子包括例如醇调控的启动子(例如醇脱氢酶(alcA)基因启动子)、四环素调控的启动子(例如四环素应答型启动子、四环素操纵子序列(tetO)、tet-On启动子或tet-Off启动子)、类固醇调控的启动子(例如大鼠糖皮质素受体的启动子、雌激素受体的启动子、或蜕皮激素(ecdysone)受体的启动子)、或金属调控的启动子(例如金属蛋白(metalloprotein)启动子)。物理调控的启动子包括例如温度调控的启动子(例如热激启动子)和光调控的启动子(例如光诱导型启动子或光阻遏型启动子)。
组织特异性启动子可为例如神经元特异性启动子、神经胶质特异性启动子、肌肉细胞特异性启动子、心脏细胞特异性启动子、肾细胞特异性启动子、骨细胞特异性启动子、内皮细胞特异性启动子或免疫细胞特异性启动子(例如B细胞启动子或T细胞启动子)。
发育调控的启动子包括例如仅在胚胎发育阶段期间或仅在成人细胞中具有活性的启动子。
除包含所公开遗传变体和调控序列的核酸序列之外,重组表达载体也可携带额外序列,诸如调控载体在宿主细胞中的复制的序列(例如复制起点)和可选择标记基因。可选择标记基因可促进对已向其中引入载体的宿主细胞的选择(参见例如美国专利4,399,216;4,634,665;和5,179,017)。举例来说,可选择标记基因可对已向其中引入载体的宿主细胞赋予对诸如G418、潮霉素(hygromycin)或甲氨蝶呤(methotrexate)的药物的抗性。示例性可选择标记基因包括但不限于二氢叶酸还原酶(DHFR)基因(联合甲氨蝶呤选择/扩增一起用于dhfr-宿主细胞中)、neo基因(用于G418选择)和谷氨酸合成酶(GS)基因。
额外载体描述于例如2016年7月28日提交的美国临时申请号62/367,973中,所述美国临时申请以引用的方式整体并入本文。
本公开还提供包含本文公开的经分离核酸分子、基因组DNA分子、cDNA分子或mRNA分子中的任何一者或多者的组合物。在一些实施方案中,组合物是药物组合物。
本公开还提供变异SIGIRR多肽。在一些实施方案中,变异SIGIRR多肽是截短的。在一些实施方案中,变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含多个氨基酸。在一些实施方案中,变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,变异SIGIRR多肽与根据SEQ ID NO:9的氨基酸序列具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,变异SIGIRR多肽包含以下或由以下组成:根据SEQ ID NO:9的氨基酸序列。在一些实施方案中,截短SIGIRR蛋白包含以下或由以下组成:根据SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
本公开还提供本文公开的多肽中的任一者的片段。在一些实施方案中,片段包含所编码多肽(诸如具有SEQ ID NO:9的氨基酸序列的多肽)的至少约10、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95、至少约100、至少约150或至少约200个连续氨基酸残基。就此而言,相比于较短片段,较长片段是优选的。在一些实施方案中,片段包含所编码多肽的至少约10、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95或至少约100个连续氨基酸残基。就此而言,相比于较短片段,较长片段是优选的。
本公开还提供包含经分离多肽的二聚体,所述经分离多肽包含变异SIGIRR多肽,其中所述经分离多肽选自本文公开的多肽中的任一者。
在一些实施方案中,本文公开的经分离多肽连接于或融合于异源性多肽或异源性分子或标记,所述异源性多肽或异源性分子或标记的众多实例在本文中其他地方公开。举例来说,蛋白质可融合于提供增加或降低的稳定性的异源性多肽。融合的结构域或异源性多肽可位于N末端、C末端或多肽内部。融合配偶体可例如有助于提供T辅助细胞表位(免疫融合配偶体),或可有助于相比于天然重组多肽在更高产率下表达蛋白质(表达增强剂)。某些融合配偶体是免疫融合配偶体与表达增强融合配偶体两者。可选择其他融合配偶体以使多肽的溶解性增加,或促进多肽靶向所需细胞内区室。一些融合配偶体包括亲和标签,所述亲和标签促进对多肽的纯化。
在一些实施方案中,融合蛋白直接融合于异源性分子,或通过接头诸如肽接头来连接于异源性分子。适合肽接头序列可例如基于以下因素来选择:1)能够采用柔性扩展构象;2)对采用可与第一多肽和第二多肽上的功能性表位相互作用的二级结构具有抗性;和3)缺乏可能与多肽功能性表位反应的疏水性或带电荷残基。举例来说,肽接头序列可含有Gly、Asn和Ser残基。其他接近中性的氨基酸诸如Thr和Ala也可用于接头序列中。可有益地用作接头的氨基酸序列包括例如Maratea等,Gene,1985,40,39-46;Murphy等,Proc.Natl.Acad.Sci.USA,1986,83,8258-8262;以及美国专利4,935,233和4,751,180中公开的那些。接头序列在长度方面可通常是1至约50个氨基酸。当第一多肽和第二多肽具有可用于分隔功能性结构域以及防止位阻干扰的非必需N末端氨基酸区域时,通常不需要接头序列。
在一些实施方案中,多肽可操作地连接于细胞穿透结构域。举例来说,细胞穿透结构域可源于HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透肽或多精氨酸肽序列。参见例如WO 2014/089290。细胞穿透结构域可位于N末端、C末端或蛋白质内的任何地方。
在一些实施方案中,多肽可操作地连接于异源性多肽以便追踪或纯化,所述异源性多肽诸如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包括但不限于绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、eGFP、Emerald、Azami Green、Monomeric AzamiGreen、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如YFP、eYFP、Citrine、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如eCFP、Cerulean、CyPet、AmCyanl、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-单体、HcRed-串联体、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)以及任何其他适合荧光蛋白。标签的实例包括但不限于谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白(calmodulin)。在一些实施方案中,异源性分子是免疫球蛋白Fc结构域、肽标签、转导结构域、聚(乙二醇)、聚唾液酸、或乙醇酸。
在一些实施方案中,经分离多肽包含非天然或经修饰氨基酸或肽类似物。举例来说,存在众多D-氨基酸或相比于天然存在的氨基酸具有不同功能性取代基的氨基酸。公开了天然存在的肽的相对立体异构体,以及肽类似物的立体异构体。这些氨基酸可易于通过以下方式来并入多肽链中:使tRNA分子装有所选氨基酸,以及对利用例如琥珀密码子的遗传构建体进行工程改造来以位点特异性方式将类似物氨基酸插入肽链中。
在一些实施方案中,经分离多肽是肽模拟物,所述肽模拟物可被产生来与肽类似,但不通过天然肽键连接。举例来说,氨基酸或氨基酸类似物的键联包括但不限于-CH2NH-、-CH2S-、-CH2-、-CH=CH-(顺式和反式)、-COCH2-、-CH(OH)CH2-和-CHH2SO-。肽类似物在键合原子之间可具有超过一个原子,诸如b-丙氨酸、g氨基丁酸等。氨基酸类似物和肽类似物常常具有增强的或合乎需要的性质,诸如生产更经济,化学稳定性更大,药理学性质(半衰期、吸收、效能、功效等)得以增强,特异性得以改变(例如具有广谱生物活性),抗原性得以降低,以及其他合乎需要的性质。
在一些实施方案中,经分离多肽包含D-氨基酸,所述D-氨基酸可用于产生更稳定的肽,因为D氨基酸不由肽酶识别。用相同类型的D-氨基酸系统性取代共有序列的一个或多个氨基酸(例如D-赖氨酸替代L-赖氨酸)可用于产生更稳定的肽。半胱氨酸残基可用于使两个或更多个肽环化或连接在一起。这可有益于将肽约束成特定构象(参见例如Rizo和Gierasch,Ann.Rev.Biochem.,1992,61,387)。
本公开还提供编码本文公开的多肽中的任一者的核酸分子。这包括与特定多肽序列相关的所有简并序列(具有编码一个特定多肽序列的序列的所有核酸以及编码蛋白质序列的所公开变体和衍生物的所有核酸,包括简并核酸)。因此,尽管每个特定核酸序列可能未在本文中写出,但每一个序列都实际上通过所公开多肽序列在本文中公开和描述。
核酸内核酸序列或多肽内氨基酸序列的特定链段之间的同一性百分比(或互补性百分比)可通过以下方式常规确定:使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656),或通过使用Gap程序(Wisconsin序列分析包,用于Unix的第8版,GeneticsComputer Group,University Research Park,Madison Wis.)利用缺省设置,所述Gap程序使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)。在本文中,如果提及序列同一性百分比,那么相比于较低序列同一性百分比,较高序列同一性百分比是优选的。
本公开还提供包含本文公开的核酸分子中的任何一者或多者和/或本文公开的多肽中的任何一者或多者以及载剂和/或赋形剂的组合物。在一些实施方案中,载剂使核酸分子和/或多肽的稳定性增加(例如延长在给定储存条件(例如-20℃、4℃或环境温度)下降解产物保持低于阈值,诸如低于起始核酸或蛋白质的0.5重量%所持续的时期;或使体内稳定性增加)。载剂的实例包括但不限于聚(乳酸)(PLA)微球体、聚(D,L-乳酸共乙醇酸)(PLGA)微球体、脂质体、胶束、反胶束、脂质卷和脂质微管。载剂可包括缓冲盐溶液诸如PBS、HBSS等。
本公开还提供产生本文公开的多肽或其片段中的任一者的方法。所述多肽或其片段可通过任何适合方法产生。举例来说,多肽或其片段可由包含编码所述多肽或其片段的核酸分子(例如重组表达载体)的宿主细胞产生。所述方法可包括在足以产生多肽或其片段的条件下培养包含编码所述多肽或其片段的核酸分子(例如重组表达载体)的宿主细胞,由此产生所述多肽或其片段。核酸可以可操作方式连接于在宿主细胞中具有活性的启动子,并且培养可在核酸借此得以表达的条件下进行。所述方法可还包括回收所表达多肽或其片段。回收可还包括纯化多肽或其片段。
适于蛋白质表达的系统的实例包括宿主细胞诸如像:细菌细胞表达系统(例如大肠杆菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis))、酵母细胞表达系统(例如酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichia pastoris))、昆虫细胞表达系统(例如杆状病毒介导的蛋白质表达)和哺乳动物细胞表达系统。
编码多肽或其片段的核酸分子的实例在本文中其他地方更详细公开。在一些实施方案中,核酸分子针对在宿主细胞中的表达加以密码子优化。在一些实施方案中,核酸分子可操作地连接于在宿主细胞中具有活性的启动子。启动子可为异源性启动子(例如不是天然存在的启动子的启动子)。适于大肠杆菌的启动子的实例包括但不限于阿拉伯糖、lac、tac和T7启动子。适于乳酸乳球菌的启动子的实例包括但不限于P170和乳链菌肽(nisin)启动子。适于酿酒酵母的启动子的实例包括但不限于组成型启动子诸如醇脱氢酶(ADHI)或烯醇酶(ENO)启动子,或诱导型启动子诸如PHO、CUP1、GAL1和G10。适于巴斯德毕赤酵母的启动子的实例包括但不限于醇氧化酶I(AOX I)启动子、甘油醛3磷酸脱氢酶(GAP)启动子、和谷胱甘肽依赖性甲醛脱氢酶(FLDI)启动子。适于杆状病毒介导的系统的启动子的一实例是晚期病毒强力多角体蛋白启动子。
在一些实施方案中,核酸分子编码与多肽或其片段同框的标签以促进蛋白质纯化。标签的实例在本文中其他地方公开。所述标签可例如结合配偶体配体(例如固定在树脂上)以致标签化蛋白质可从所有其他蛋白质(例如宿主细胞蛋白质)分离。亲和色谱法、高效液相色谱法(HPLC)和尺寸排阻色谱法(SEC)是可用于改进所表达蛋白质的纯度的方法的实例。
其他方法也可用于产生多肽或其片段。举例来说,两个或更多个肽或多肽可通过蛋白质化学技术连接在一起。举例来说,肽或多肽可使用Fmoc(9-芴基甲基氧基羰基)或Boc(叔丁基氧基羰基)化学加以化学合成。所述肽或多肽可通过标准化学反应合成。举例来说,肽或多肽可被合成并且不从它的合成树脂裂解,而肽或蛋白质的另一片段可被合成并且随后从树脂裂解,由此暴露在另一片段上加以功能性封阻的末端基团。通过肽缩合反应,这两个片段可分别在它们的羧基末端和氨基末端通过肽键来共价接合。或者,肽或多肽可如本文所述在体内独立地合成。一旦分离,这些独立肽或多肽即可通过类似肽缩合反应加以连接以形成肽或其片段。
在一些实施方案中,酶促连接所克隆或合成的肽区段允许相对较短的肽片段接合以产生较大肽片段、多肽、或整个蛋白质结构域(Abrahmsen等,Biochemistry,1991,30,4151)。或者,合成肽的天然化学连接可用于从较短肽片段合成构建大型肽或多肽。这个方法可由两步化学反应组成(Dawson等,Science,1994,266,776-779)。第一步骤可为未保护的合成肽-硫酯与另一未保护的含有氨基末端Cys残基的肽区段的化学选择性反应以产生硫酯连接的中间体作为初始共价产物。在不改变反应条件下,这个中间体可经受自发性快速分子内反应以在连接位点处形成天然肽键。
在一些实施方案中,可化学连接未保护的肽区段,其中由于化学连接而在肽区段之间形成的键是非天然(非肽)键(Schnolzer等,Science,1992,256,221)。
在一些实施方案中,多肽可具有天然存在的和非天然存在的表达后修饰,诸如像糖基化、乙酰化和磷酸化,以及本领域中已知的其他修饰。多肽可为整个蛋白质或其子序列。
本公开还提供产生本文公开的多肽中的任一者的方法,所述方法包括培养包含重组表达载体的宿主细胞,所述重组表达载体包含核酸分子,所述核酸分子包含能够编码本文公开的多肽中的一者或多者的多核苷酸或它的互补序列,由此产生多肽。
本公开还提供包含本文公开的核酸分子中的任何一者或多者,和/或本文公开的多肽中的任何一者或多者的细胞(例如重组宿主细胞),所述核酸分子包括包含所述核酸分子的载体。细胞可在体外,处于离体状态,或在体内。核酸分子可连接于启动子和其他调控序列,以便它们被表达以产生所编码蛋白质。还提供了所述细胞的细胞系。
在一些实施方案中,细胞是全能细胞或多能细胞(例如胚胎干(ES)细胞,诸如啮齿动物ES细胞、小鼠ES细胞、或大鼠ES细胞)。全能细胞包括可产生任何细胞类型的未分化细胞,并且多能细胞包括具有发育成超过一种分化细胞类型的能力的未分化细胞。所述多能和/或全能细胞可为例如ES细胞或ES样细胞,诸如诱导多能干(iPS)细胞。ES细胞包括在引入胚胎中后能够促成发育胚胎的任何组织的胚胎源性全能或多能细胞。ES细胞可源于胚泡的内细胞群,并且能够分化成三个脊椎动物胚层(内胚层、外胚层和中胚层)中的任一者的细胞。根据本公开,胚胎干细胞可为非人胚胎干细胞。
在一些实施方案中,细胞是原代体细胞,或不是原代体细胞的细胞。体细胞可包括不是配子、生殖细胞、配子体或未分化干细胞的任何细胞。在一些实施方案中,细胞也可为原代细胞。原代细胞包括已直接从生物体、器官或组织分离的细胞或细胞的培养物。原代细胞包括既不是转化的也不是永生的细胞。原代细胞包括从生物体、器官或组织获得的先前未在组织培养中传代,或先前已在组织培养中传代但不能在组织培养中无限传代的任何细胞。所述细胞可通过常规技术分离,并且包括例如体细胞、造血细胞、内皮细胞、上皮细胞、纤维母细胞、间质细胞、角质化细胞、黑素细胞、单核细胞(monocyte)、单核细胞(mononuclear cell)、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、肝细胞、骨骼肌母细胞和平滑肌细胞。举例来说,原代细胞可源于结缔组织、肌肉组织、神经系统组织或上皮组织。
在一些实施方案中,细胞通常可不无限增殖,但由于突变或改变而已逃避正常细胞衰老,并且代之以可保持经受分裂。所述突变或改变可天然地发生,或可有意地诱导。永生化细胞的实例包括但不限于中国仓鼠卵巢(CHO)细胞、人胚肾细胞(例如HEK 293细胞)和小鼠胚胎纤维母细胞(例如3T3细胞)。众多类型的永生化细胞是熟知的。永生化或原代细胞包括通常用于培养或用于表达重组基因或蛋白质的细胞。在一些实施方案中,细胞是经分化细胞,诸如肝细胞(例如人肝细胞)。
细胞可来自任何来源。举例来说,细胞可为真核细胞、动物细胞、植物细胞或真菌(例如酵母)细胞。所述细胞可为鱼细胞或鸟细胞,或所述细胞可为哺乳动物细胞,诸如人细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞或大鼠细胞。哺乳动物包括但不限于人、非人灵长类动物、猴、猿、猫、狗、马、公牛、鹿、野牛、绵羊、啮齿动物(例如小鼠、大鼠、仓鼠、豚鼠)、家畜(例如牛科动物物种诸如母牛、阉牛等;羊科动物物种诸如绵羊、山羊等;以及猪科动物物种诸如猪和公猪)。鸟包括但不限于鸡、火鸡、鸵鸟、鹅、鸭等。也包括驯化动物和农业动物。术语“非人动物”排除人。
额外宿主细胞描述于例如美国专利申请公布号US2018/0030114中,所述美国专利申请公布以引用的方式整体并入本文。
本文公开的核酸分子和多肽可通过任何手段引入细胞中。转染方案以及用于将核酸或蛋白质引入细胞中的方案可变化。非限制性转染方法包括使用脂质体、纳米粒子、钙、树枝状聚合物和阳离子聚合物诸如DEAE-右旋糖酐或聚乙烯亚胺的基于化学的转染方法。非化学方法包括电穿孔、声致穿孔和光学转染。基于粒子的转染包括使用基因枪,或磁体辅助转染。病毒方法也可用于转染。
将核酸或蛋白质引入细胞中也可由电穿孔、细胞质内注射、病毒性感染、腺病毒、腺相关病毒、慢病毒、逆转录病毒、转染、脂质介导的转染或核转染介导。核转染是一种改进的电穿孔技术,其使得核酸基质能够不仅被递送至细胞质中,而且还穿过核膜以及进入核中。此外,在本文公开的方法中使用核转染通常需要比常规电穿孔少得多的细胞(例如相较于由常规电穿孔所需的700万,仅需要约200万)。在一些实施方案中,核转染使用
Figure BDA0002479256910000351
NUCLEOFECTORTM系统进行。
将核酸或蛋白质引入细胞中也可通过显微注射实现。mRNA的显微注射通常向细胞质中进行(例如以将mRNA直接递送至翻译机构中),而蛋白质或DNA的显微注射通常向核中进行。或者,显微注射可通过向核与细胞质两者中注射来进行:可首先将针引入核中并可注射第一量,并且当将所述针从细胞移除时可向细胞质中注射第二量。如果将核酸酶试剂蛋白质注射至细胞质中,那么所述蛋白质可包含核定位信号以确保递送至核/前核中。
用于将核酸或蛋白质引入细胞中的其他方法可包括例如载体递送、粒子介导的递送、外体介导的递送、脂质纳米粒子介导的递送、细胞穿透肽介导的递送或可植入装置介导的递送。向受试者施用核酸或蛋白质以在体内修饰细胞的方法在本文中其他地方公开。将核酸和蛋白质引入细胞中也可通过流体动力学递送(HDD)实现。
用于将核酸或蛋白质引入细胞中的其他方法可包括例如载体递送、粒子介导的递送、外体介导的递送、脂质纳米粒子介导的递送、细胞穿透肽介导的递送或可植入装置介导的递送。在一些实施方案中,核酸或蛋白质可于载剂中引入细胞中,所述载剂诸如聚(乳酸)(PLA)微球体、聚(D,L-乳酸共乙醇酸)(PLGA)微球体、脂质体、胶束、反胶束、脂质卷或脂质微管。
本公开还提供探针和引物。探针和引物的实例例如在以上加以公开。本公开提供包含特异性杂交于本文公开的核酸分子中的任一者的核酸序列的探针和引物。举例来说,探针或引物可包含杂交于本文所述的编码变异SIGIRR蛋白的核酸分子中的任一者,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或杂交于核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码根据SEQ ID NO:9的变异SIGIRR蛋白的核酸分子,或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码变异SIGIRR多肽的核酸分子,所述变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸;或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码变异SIGIRR多肽的核酸分子,所述变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含多个氨基酸;或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码变异SIGIRR多肽的核酸分子,所述变异SIGIRR多肽在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11);或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码变异SIGIRR多肽的核酸分子,所述变异SIGIRR多肽与根据SEQ ID NO:9的氨基酸序列具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物包含杂交于编码变异SIGIRR多肽的核酸分子,所述变异SIGIRR多肽包含以下或由以下组成:根据SEQID NO:9的氨基酸序列;或杂交于这个核酸分子的互补序列的核酸序列。在一些实施方案中,探针或引物特异性杂交于核酸分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
探针或引物可包含任何适合长度,所述适合长度的非限制性实例包括在长度方面是至少约5、至少约8、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约21、至少约22、至少约23、至少约24或至少约25个核苷酸。在优选实施方案中,探针或引物在长度方面包含至少约18个核苷酸。探针或引物在长度方面可包含约10至约35、约10至约30、约10至约25、约12至约30、约12至约28、约12至约24、约15至约30、约15至约25、约18至约30、约18至约25、约18至约24、或约18至约22个核苷酸。在优选实施方案中,探针或引物在长度方面是约18至约30个核苷酸。
本公开还提供改变特异性探针和改变特异性引物。改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列的核酸序列。在本公开的情形下,“特异性杂交”意指探针或引物(例如改变特异性探针或改变特异性引物)不杂交于编码野生型SIGIRR蛋白的核酸分子。在一些实施方案中,改变特异性探针特异性杂交于编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核酸密码子或其互补序列。在一些实施方案中,改变特异性引物或引物对特异性杂交于编码变异SIGIRR蛋白的核酸分子的一个或多个区域,以使编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子被涵盖在由所述改变特异性引物或引物对产生的任何转录物内。在一些实施方案中,探针或引物特异性杂交于核酸分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处包含截短;或所述核酸序列的互补序列的核酸序列。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的基因组DNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述基因组DNA分子的互补序列的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的基因组DNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的基因组DNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的基因组DNA分子的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的基因组DNA分子的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,探针或引物特异性杂交于基因组DNA的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的基因组DNA分子的核酸序列:在对应于根据SEQID NO:2的位置9962的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的基因组DNA分子的核酸序列:与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的基因组DNA分子的核酸序列:根据SEQ IDNO:2的核酸序列。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的mRNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的mRNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的mRNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的mRNA分子的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的mRNA分子的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,探针或引物特异性杂交于mRNA分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的mRNA分子的核酸序列:在对应于根据SEQ ID NO:4的位置557的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于mRNA分子的核酸序列,所述mRNA分子在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包含密码子CUA和AGC。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的mRNA分子的核酸序列:与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的mRNA分子的核酸序列:根据SEQ ID NO:4的核酸序列。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的cDNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的cDNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的cDNA分子的核酸序列,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的cDNA分子的核酸序列,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于编码变异SIGIRR蛋白的cDNA分子的核酸序列,所述变异SIGIRR蛋白具有SEQ ID NO:9。在一些实施方案中,探针或引物特异性杂交于cDNA分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的cDNA分子的核酸序列:在对应于根据SEQ ID NO:6的位置557的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于cDNA分子的核酸序列,所述cDNA分子在分别对应于根据SEQ ID NO:6的位置553至555和556至558的位置处包含密码子CUA和AGC。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的cDNA分子的核酸序列:与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,改变特异性探针或改变特异性引物包含互补于和/或杂交于或特异性杂交于包含以下或由以下组成的cDNA分子的核酸序列:根据SEQ ID NO:6的核酸序列。
以上关于本公开的探针或引物所述的长度在加以必要的变更下也适用于本公开的改变特异性探针或改变特异性引物。
本公开还提供包含如上所述的改变特异性引物中的两者的一对改变特异性引物。
在一些实施方案中,探针或引物(例如改变特异性探针或改变特异性引物)包括DNA。在一些实施方案中,探针或引物(例如改变特异性探针或改变特异性引物)包括RNA。在一些实施方案中,探针或引物(例如改变特异性探针或改变特异性引物)在严格条件诸如高度严格条件下杂交于编码变异SIGIRR蛋白的核酸序列。
在一些实施方案中,探针包含标记。在一些实施方案中,标记是荧光标记、放射性标记或生物素。在一些实施方案中,探针的长度在以上加以描述。或者,在一些实施方案中,探针包含以下或由以下组成:至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95或至少约100个核苷酸。探针(例如等位基因特异性探针)可例如用于检测本文公开的核酸分子中的任一者。在优选实施方案中,探针在长度方面包含至少约18个核苷酸。探针在长度方面可包含约10至约35、约10至约30、约10至约25、约12至约30、约12至约28、约12至约24、约15至约30、约15至约25、约18至约30、约18至约25、约18至约24、或约18至约22个核苷酸。在优选实施方案中,探针在长度方面是约18至约30个核苷酸。
本公开还提供包含本文公开的探针中的任何一者或多者与其连接的基底的支撑物。固体支撑物是分子诸如本文公开的探针中的任一者可与其缔合的固态基底或支撑物。一种形式的固体支撑物是阵列。另一形式的固体支撑物是阵列检测器。阵列检测器是多种不同探针已以阵列样式、栅格样式或其他组织化样式与其偶联的固体支撑物。
用于固体支撑物中的固态基底可包括分子可与其偶联的任何固体材料。这包括诸如丙烯酰胺、琼脂糖、纤维素、硝化纤维素、玻璃、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚氧化乙烯、聚硅酸盐、聚碳酸酯、特氟龙(teflon)、氟碳化合物、尼龙(nylon)、硅橡胶、聚酐、聚乙醇酸、聚乳酸酸、聚原酸酯、聚反丁烯二酸丙酯、胶原、糖胺聚糖和聚氨基酸的材料。固态基底可具有任何可用形式,包括薄膜、膜、瓶、盘、纤维、编织纤维、成形聚合物、粒子、珠粒、微粒或组合形式。固态基底和固体支撑物可为多孔的或无孔的。固态基底的一种形式是微量滴定盘,诸如标准96孔型。在一些实施方案中,可采用通常含有每孔一个阵列的多孔玻璃载片。这个特征允许更大控制测定可重现性,增加通量和样品处理,以及易于自动化。在一些实施方案中,支撑物是微阵列。
本文公开的多肽中的任一者都可还具有一个或多个取代(诸如保守性氨基酸取代)、插入或缺失。插入包括例如氨基或羧基末端融合以及序列内插入单一或多个氨基酸残基。用于在具有已知序列的DNA中的预定位点处进行取代的技术是熟知的,所述技术例如是M13引物诱变和PCR诱变。氨基酸取代通常是单一残基取代,但可同时在许多不同位置处发生;插入通常将是约1至10个个氨基酸残基;并且缺失将在约1至30个残基的范围内。缺失或插入可以邻近成对形式进行,即缺失2个残基或插入2个残基。取代、缺失、插入或它们的任何组合可加以组合以获得最终构建体。在一些实施方案中,突变不将序列置于阅读框外部,并且不创建可产生二级mRNA结构的互补性区域。
本公开还提供用于制备本文所述的组合物以及利用本文所述的方法的试剂盒。本文所述的试剂盒可包括一种或多种用于检测受试者的样品中的一种或多种遗传变体的测定。
在一些实施方案中,用于鉴定人SIGIRR变体的试剂盒利用上述组合物和方法。在一些实施方案中,基本试剂盒可包括具有至少一对针对本文公开的核酸分子(诸如像SEQID NO:2、SEQ ID NO:4和/或SEQ ID NO:6)中的任一者中的位置的寡核苷酸引物或探针诸如改变特异性探针或改变特异性引物的容器。试剂盒还可任选包括使用说明书。试剂盒还可包括其他任选试剂盒组成部分,诸如像以下中的一者或多者:针对所扩增基因座中的每一者的等位基因阶梯、足量的用于扩增的酶、用以促进扩增的扩增缓冲液、用以促进酶活性的二价阳离子溶液、用于在扩增期间的链延伸的dNTP、用以制备用于电泳的所扩增物质的上样溶液、作为模板对照的基因组DNA、用以确保物质在分离介质中如所预期进行迁移的大小标记、以及用以教导使用者和限制使用中的错误的方案和手册。试剂盒中各种试剂的量还可视许多因素诸如方法的最优灵敏性而变化。在这些教义的范围内的是提供用于手动应用中的测试试剂盒或供与自动化样品制备、反应设置、检测器或分析器一起使用的测试试剂盒。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的变异SIGIRR蛋白的基因组DNA分子或其互补序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的基因组DNA分子,所述变异SIGIRR蛋白在对应于根据SEQID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的基因组DNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的基因组DNA分子,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的基因组DNA分子,所述变异SIGIRR蛋白具有SEQ IDNO:9。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):基因组DNA分子,所述基因组DNA分子包含以下或由以下组成:在对应于根据SEQ ID NO:2的位置9962的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):基因组DNA分子,所述基因组DNA分子包含以下或由以下组成:与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):基因组DNA分子,所述基因组DNA分子包含以下或由以下组成:根据SEQ ID NO:2的核酸序列。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的mRNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的mRNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的mRNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的mRNA分子,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的mRNA分子,所述变异SIGIRR蛋白具有SEQ ID NO:9。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):mRNA分子,所述mRNA分子包含以下或由以下组成:在对应于根据SEQ ID NO:4的位置557的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):mRNA分子,所述mRNA分子在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包含密码子CUA和AGC。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):mRNA分子,所述mRNA分子包含以下或由以下组成:与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):mRNA分子,所述mRNA分子包含以下或由以下组成:根据SEQ ID NO:4的核酸序列。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的cDNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的cDNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的cDNA分子,所述变异SIGIRR蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186至215的位置处包含以下氨基酸序列:Ser-Arg-Ser-Trp-Ser-Gly-Val-Gly-Ala-Thr-Ser-Ser-Ser-Trp-Thr-Thr-Ala-Thr-Ser-Cys-Arg-Ala-Leu-Ser-Pro-Pro-Pro-Thr-Ser-Trp(SEQ ID NO:11)。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的cDNA分子,所述变异SIGIRR蛋白与SEQ ID NO:9具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):编码变异SIGIRR蛋白的cDNA分子,所述变异SIGIRR蛋白具有SEQ ID NO:9。
在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):cDNA分子,所述cDNA分子包含以下或由以下组成:在对应于根据SEQ ID NO:6的位置557的位置处包含鸟嘌呤的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):cDNA分子,所述cDNA分子在分别对应于根据SEQ ID NO:6的位置553至555和556至558的位置处包含密码子CTA和AGC。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):cDNA分子,所述cDNA分子包含以下或由以下组成:与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列。在一些实施方案中,试剂盒包括至少一对用于扩增以下的寡核苷酸引物(例如改变特异性引物)或至少一种用于检测以下的经标记寡核苷酸探针(例如改变特异性探针):cDNA分子,所述cDNA分子包含以下或由以下组成:根据SEQ ID NO:6的核酸序列。
在一些实施方案中,本文公开的试剂盒中的任一者都可还包括以下中的任何一者或多者:核苷酸阶梯、方案、酶(诸如用于扩增诸如聚合酶链式反应(PCR)的酶)、dNTP、缓冲液、一种或多种盐、以及对照核酸样品。在一些实施方案中,本文公开的试剂盒中的任一者都可还包括以下中的任何一者或多者:可检测标记、为进行退火反应所需的产品和试剂、以及说明书。
在一些实施方案中,本文公开的试剂盒可包括包含3’末端核苷酸的引物或探针或改变特异性引物或改变特异性探针,所述3’末端核苷酸直接杂交于在对应于SEQ ID NO:2的位置9962的位置处,或在对应于SEQ ID NO:4和/或SEQ ID NO:6的位置557的位置处的鸟嘌呤。
本领域中的人士了解的是采用的检测技术通常不具有限制性。更确切来说,广泛多种检测手段在所公开方法和试剂盒的范围内,条件是它们允许确定扩增子的存在性或不存在性。
在一些方面,试剂盒可包括本文公开的引物或探针中的一者或多者。举例来说,试剂盒可包括一种或多种杂交于所公开遗传变体中的一者或多者的探针。
在一些方面,试剂盒可包括所公开细胞或细胞系中的一者。在一些方面,试剂盒可包括为创建转基因细胞或细胞系所必需的材料。举例来说,在一些方面,试剂盒可包括包含核酸序列的细胞和载体,所述核酸序列包含所公开遗传变体中的一者或多者。试剂盒可还包括用于细胞培养的培养基。
本公开还提供用于检测来自受试人的生物样品中SIGIRR变异基因组DNA、mRNA、cDNA和/或多肽的存在性的方法。应了解某一群体内的基因序列以及由所述基因编码的mRNA和蛋白质可由于多态性诸如单核苷酸多态性而不同。本文对于SIGIRR基因组DNA、mRNA、cDNA和多肽提供的序列仅是示例性序列。SIGIRR基因组DNA、mRNA、cDNA和多肽的其他序列也是可能的。
生物样品可源于来自受试者的任何细胞、组织或生物流体。样品可包括任何临床相关组织,诸如骨髓样品、肿瘤活检体、细针抽吸物,或体液样品,诸如血液、龈沟液、血浆、血清、淋巴液、腹水、囊液或尿。在一些情况下,样品包括口颊拭擦物。用于本文公开的方法中的样品将基于测定形式、检测方法的性质、以及用作样品的组织、细胞或提取物而变化。视所采用的测定而定,生物样品可以不同方式加以处理。举例来说,当检测变异SIGIRR核酸分子时,可采用旨在分离或富集基因组DNA的样品的初步处理。多种已知技术可用于达成这个目的。当检测变异SIGIRR mRNA的水平时,不同技术可用于使具有mRNA的生物样品富集。可使用用以检测mRNA的存在性或水平或特定变异基因组DNA基因座的存在性的各种方法。
在一些实施方案中,本公开提供检测变异SIGIRR蛋白的存在性或不存在性的方法,所述方法包括对生物样品中的蛋白质的至少一部分测序以确定所述蛋白质是否包含编码截短SIGIRR蛋白的氨基酸序列。在一些实施方案中,本公开提供检测变异SIGIRR蛋白的存在性或不存在性的方法,所述方法包括对生物样品中的蛋白质的至少一部分测序以确定所述蛋白质是否包含编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的氨基酸序列。在一些实施方案中,本公开提供检测变异SIGIRR蛋白的存在性或不存在性的方法,所述方法包括对生物样品中的蛋白质的至少一部分测序以确定所述蛋白质是否包含编码在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQID NO:9的位置186的位置处包含丝氨酸的SIGIRR蛋白的氨基酸序列。
在一些实施方案中,本公开提供检测变异SIGIRR核酸分子的存在性或不存在性的方法,所述方法包括对生物样品中的核酸的至少一部分测序以确定所述核酸是否包含编码截短SIGIRR蛋白的核酸序列。在一些实施方案中,本公开提供检测变异SIGIRR核酸分子的存在性或不存在性的方法,所述方法包括对生物样品中的核酸的至少一部分测序以确定所述核酸是否包含编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸序列。在一些实施方案中,本公开提供检测变异SIGIRR核酸分子的存在性或不存在性的方法,所述方法包括对生物样品中的核酸的至少一部分测序以确定所述核酸是否包含编码在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的SIGIRR蛋白的核酸序列。本文公开的变异核酸分子中的任一者都可使用本文所述的探针和引物中的任一者检测。
在一些实施方案中,检测受试者中炎症性肠病相关变异SIGIRR核酸分子或早期发作型炎症性肠病相关变异SIGIRR核酸分子(例如基因组DNA、mRNA或cDNA)的存在性或不存在性的方法包括:对从所述受试者获得的生物样品进行测定,所述测定确定所述生物样品中的核酸分子是否包含本文公开的变异SIGIRR核酸序列中的任一者(例如编码截短SIGIRR蛋白的核酸分子、编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸分子、编码在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的SIGIRR蛋白的核酸分子)。在一些实施方案中,生物样品包括细胞或细胞溶解产物。所述方法可还包括例如从受试者获得包含SIGIRR基因组DNA或mRNA的生物样品,并且如果包含mRNA,那么任选地使所述mRNA逆转录成cDNA;以及对所述生物样品进行测定,所述测定确定所述SIGIRR基因组DNA、mRNA或cDNA的某一位置是否编码截短SIGIRR蛋白。所述方法可还包括例如从受试者获得包含SIGIRR基因组DNA或mRNA的生物样品,并且如果包含mRNA,那么任选地使所述mRNA逆转录成cDNA;以及对所述生物样品进行测定,所述测定确定所述SIGIRR基因组DNA、mRNA或cDNA的某一位置是否编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白,或对所述生物样品进行测定,所述测定确定所述SIGIRR基因组DNA、mRNA或cDNA的某一位置是否编码在对应于根据SEQID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的SIGIRR蛋白。所述测定可包括例如确定特定SIGIRR核酸分子的这些位置的身份。在一些实施方案中,受试者是人。
在一些实施方案中,测定包括:对来自受试者的生物样品中的核酸分子的SIGIRR基因组DNA序列的至少一部分测序,其中测序的所述部分包括对应于编码在根据SEQ IDNO:9的SIGIRR蛋白中的位置186处的丝氨酸的位置的位置;对来自受试者的生物样品中的核酸分子的SIGIRR mRNA序列的至少一部分测序,其中测序的所述部分包括对应于编码在根据SEQ ID NO:9的SIGIRR蛋白中的位置186处的丝氨酸的位置的位置;或对来自受试者的生物样品中的核酸分子的SIGIRR cDNA序列的至少一部分测序,其中测序的所述部分包括对应于编码在根据SEQ ID NO:9的SIGIRR蛋白中的位置186处的丝氨酸的位置的位置。
在一些实施方案中,测定包括:a)使生物样品与引物接触,所述引物杂交于:i)SIGIRR基因组DNA序列的邻近于SIGIRR基因组序列的在对应于编码在根据SEQ ID NO:9的位置186处的丝氨酸的位置的位置处的位置的部分;ii)SIGIRR mRNA序列的邻近于SIGIRRmRNA序列的在对应于编码在根据SEQ ID NO:9的位置186处的丝氨酸的位置的位置处的位置的部分;或iii)SIGIRR cDNA序列的邻近于SIGIRR cDNA序列的在对应于编码在根据SEQID NO:9的位置186处的丝氨酸的位置的位置处的位置的部分;b)使所述引物延伸至少穿过:i)SIGIRR基因组DNA序列的对应于超出编码在根据SEQ ID NO:9的位置186处的丝氨酸的密码子的核苷酸位置的位置;ii)SIGIRR mRNA序列的对应于超出编码在根据SEQ ID NO:9的位置186处的丝氨酸的密码子的核苷酸位置的位置;或iii)SIGIRR cDNA序列的对应于超出编码在根据SEQ ID NO:9的位置186处的丝氨酸的密码子的核苷酸位置的位置;和c)确定所述引物的延伸产物是否包含编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核苷酸。在一些实施方案中,仅分析SIGIRR基因组DNA。在一些实施方案中,仅分析SIGIRR mRNA。在一些实施方案中,仅分析从SIGIRR mRNA获得的SIGIRR cDNA。
在一些实施方案中,测定包括:a)使生物样品与改变特异性引物接触,所述改变特异性引物杂交于i)SIGIRR基因组DNA序列的包括编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核苷酸的部分;ii)SIGIRR mRNA序列的包括编码在对应于根据SEQ IDNO:9的位置186的位置处的丝氨酸的核苷酸的部分;或iii)SIGIRR cDNA序列的包括编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核苷酸的部分;b)使用改变特异性聚合酶链式反应技术使所述引物延伸;和c)确定延伸是否发生。改变特异性聚合酶链式反应技术可用于检测核酸序列中的突变诸如缺失。使用改变特异性引物,因为当存在与模板的不匹配时,DNA聚合酶将不进行延伸。基本改变特异性聚合酶链式反应技术的许多变化由熟练技术人员掌控。
改变特异性引物可包含互补于编码SIGIRR蛋白的核酸序列,的SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸;或所述核酸序列的互补序列的核酸序列。举例来说,改变特异性引物可包含互补于编码SEQ ID NO:9的核酸序列或这个核酸序列的互补序列的核酸序列。当核酸序列编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸时,改变特异性引物优选特异性杂交于编码变异SIGIRR蛋白的核酸序列。
在一些实施方案中,测定包括使生物样品与在严格条件下特异性杂交于变异SIGIRR基因组DNA序列、mRNA序列或cDNA序列而非相应野生型SIGIRR序列的引物或探针接触,以及确定杂交是否已发生。
在一些实施方案中,测定包括RNA测序(RNA-Seq)。在一些实施方案中,测定还包括通过逆转录酶聚合酶链式反应(RT-PCR)使mRNA逆转录成cDNA。
在一些实施方案中,方法利用具有足够核苷酸长度的探针和引物来结合靶标核酸序列,并且特异性检测和/或鉴定包含变异SIGIRR基因组DNA、mRNA或cDNA的多核苷酸。杂交条件或反应条件可由操作者确定以实现这个结果。核苷酸长度可为足以用于所选检测方法中的任何长度,所述检测方法包括本文描述或例示的任何测定。通常,举例来说,使用在长度方面具有约8、约10、约11、约12、约14、约15、约16、约18、约20、约22、约24、约26、约28、约30、约40、约50、约75、约100、约200、约300、约400、约500、约600或约700个核苷酸或更多个核苷酸,或约11至约20、约20至约30、约30至约40、约40至约50、约50至约100、约100至约200、约200至约300、约300至约400、约400至约500、约500至约600、约600至约700、或约700至约800个或更多个核苷酸的引物或探针。在优选实施方案中,探针或引物在长度方面包含至少约18个核苷酸。探针或引物在长度方面可包含约10至约35、约10至约30、约10至约25、约12至约30、约12至约28、约12至约24、约15至约30、约15至约25、约18至约30、约18至约25、约18至约24、或约18至约22个核苷酸。在优选实施方案中,探针或引物在长度方面是约18至约30个核苷酸。
所述探针和引物可在高严格性杂交条件下特异性杂交于靶标序列。探针和引物可与靶标序列具有连续核苷酸的完全核酸序列同一性,但可通过常规方法设计不同于靶标核酸序列,并且保留特异性检测和/或鉴定靶标核酸序列的能力的探针。因此,探针和引物可与靶标核酸分子共有约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或100%序列同一性或互补性。
在一些实施方案中,特异性引物可用于扩增变异SIGIRR基因座和/或SIGIRR变异mRNA或cDNA以产生扩增子,所述扩增子可用作特异性探针,或可自身被检测以鉴定变异SIGIRR基因座或测定生物样品中特定SIGIRR mRNA或cDNA的水平。SIGIRR变异基因座可用于表示包括对应于编码在根据SEQ ID NO:9的位置186处的丝氨酸的位置的位置的基因组核酸序列。当探针与生物样品中的核酸分子在允许所述探针结合所述核酸分子的条件下杂交时,这个结合可被检测,并且允许指示在所述生物样品中,变异SIGIRR基因座的存在性或变异SIGIRR mRNA或cDNA的存在性或水平。已描述对结合的探针的所述鉴定。特异性探针可包含与变异SIGIRR基因的特定区域至少约80%、约80%至约85%、约85%至约90%、约90%至约95%、以及约95%至约100%同一(或互补)的序列。特异性探针可包含与变异SIGIRRmRNA的特定区域至少约80%、约80%至约85%、约85%至约90%、约90%至约95%、以及约95%至约100%同一(或互补)的序列。特异性探针可包含与变异SIGIRR cDNA的特定区域至少约80%、约80%至约85%、约85%至约90%、约90%至约95%、以及约95%至约100%同一(或互补)的序列。
在一些实施方案中,为确定生物样品的核酸互补序列是否包含编码变异SIGIRR蛋白(例如截短SIGIRR蛋白、或在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸的变异SIGIRR蛋白)的核酸序列,可使所述生物样品经受使用引物对进行的核酸扩增方法,所述引物对包括源于邻近于编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的位置的5’侧接序列的第一引物,以及源于邻近于编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的位置的3’侧接序列的第二引物,以产生扩增子,所述扩增子可对于在所述侧接序列所邻近的所述位置处存在编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核苷酸进行诊断。在一些实施方案中,扩增子在长度方面可在从引物对加一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度的范围内。这个距离可在一个核苷酸碱基对直至扩增反应的限值或约二万个核苷酸碱基对的范围内。任选地,引物对侧接于包括编码在根据SEQ ID NO:9的位置186处的丝氨酸的位置,以及在编码在根据SEQ ID NO:9的位置186处的丝氨酸的位置的每侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的区域。类似扩增子可从mRNA和/或cDNA序列产生。
用于制备和使用探针和引物的代表性方法例如描述于以下中:MolecularCloning:A Laboratory Manual,第2版,第1-3卷,Sambrook等人编,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.1989(在下文中称为“Sambrook等,1989”);Current Protocolsin Molecular Biology,Ausubel等人编,Greene Publishing andWiley-Interscience,New York,1992(定期更新)(在下文中称为“Ausubel等,1992”);以及Innis等,PCR Protocols:A Guide to Methods and Applications,Academic Press:SanDiego,1990)。PCR引物对可由已知序列获得,例如通过使用意图达成那个目的的计算机程序,诸如Vector NTI版本10(Informax Inc.,Bethesda Md.)中的PCR引物分析工具;PrimerSelect(DNASTAR Inc.,Madison,Wis.);以及Primer3(版本0.4.0.COPYRGT.,1991,Whitehead Institute for Biomedical Research,Cambridge,Mass.)。另外,可目视扫描序列,并且使用已知指导方针手动鉴定引物。
任何核酸杂交或扩增或测序方法都可用于特异性检测变异SIGIRR基因座的存在性和/或变异SIGIRR mRNA或由mRNA产生的cDNA的水平。在一些实施方案中,核酸分子可作为引物用于扩增SIGIRR核酸的区域,或核酸分子可用作例如在严格条件下特异性杂交于包含变异SIGIRR基因座的核酸分子或包含变异SIGIRR mRNA或由mRNA产生的cDNA的核酸分子的探针。
多种技术在本领域中是可用的,所述技术包括例如核酸测序、核酸杂交和核酸扩增。核酸测序技术的说明性实例包括但不限于链终止剂(Sanger)测序和染料终止剂测序。
其他方法涉及除测序以外的核酸杂交方法,包括使用针对纯化DNA、所扩增DNA和固定细胞制备物(荧光原位杂交(FISH))的经标记引物或探针。在一些方法中,可在检测之前或与检测同时使靶标核酸扩增。核酸扩增技术的说明性实例包括但不限于聚合酶链式反应(PCR)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。其他方法包括但不限于连接酶链式反应、链置换扩增和嗜热SDA(tSDA)。
任何方法都可用于检测非扩增或所扩增多核苷酸,所述方法包括例如杂交保护测定(HPA);实时定量评估扩增过程;以及测定初始存在于样品中的靶标序列的量,但所述测定不基于实时扩增。
还提供用于鉴定核酸的方法,所述方法未必需要序列扩增,并且基于例如染色体物质的Southern(DNA:DNA)印迹杂交、原位杂交(ISH)和荧光原位杂交(FISH)的已知方法。Southern印迹可用于检测特定核酸序列。在所述方法中,使从样品提取的核酸碎裂,在基质凝胶上加以电泳分离,并且转移至滤膜中。使滤膜结合的核酸经受与互补于目标序列的经标记探针的杂交。检测结合于滤膜的杂交探针。在任何所述方法中,过程都可包括使用本文描述或例示的探针中的任一者进行杂交。
在杂交技术中,可采用严格条件以使探针或引物将特异性杂交于它的靶标。在一些实施方案中,相比于与其他序列(例如相应野生型SIGIRR基因座、野生型mRNA或野生型cDNA)的杂交,多核苷酸引物或探针在严格条件下将在可检测地更大程度上杂交于它的靶标序列(例如变异SIGIRR基因座、变异SIGIRR mRNA或变异SIGIRR cDNA),诸如相比于背景是至少2倍、至少3倍、至少4倍或更多倍,包括相比于背景是超过10倍。在一些实施方案中,相比于与其他序列的杂交,多核苷酸引物或探针在严格条件下将以至少2倍在可检测地更大程度上杂交于它的靶标序列。在一些实施方案中,相比于与其他序列的杂交,多核苷酸引物或探针在严格条件下将以至少3倍在可检测地更大程度上杂交于它的靶标序列。在一些实施方案中,相比于与其他序列的杂交,多核苷酸引物或探针在严格条件下将以至少4倍在可检测地更大程度上杂交于它的靶标序列。在一些实施方案中,相比于与其他序列的杂交,多核苷酸引物或探针在严格条件下将以相比于背景是超过10倍来在可检测地更大程度上杂交于它的靶标序列。严格条件依赖于序列,并且在不同情况下将是不同的。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶标序列(同源性探测)。或者,可调整严格性条件以允许在序列方面存在一定不匹配以致检测到较低同一性程度(异源性探测)。
促进DNA杂交的适当严格性条件,例如6X氯化钠/柠檬酸钠(SSC)在约45℃下,继之以在50℃下用2X SSC洗涤,是已知的,或可见于Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6中。通常,用于杂交和检测的严格条件将是其中在pH 7.0至8.3下,盐浓度小于约1.5M Na离子,通常是约0.01至1.0M Na离子浓度(或其他盐),并且温度对于短探针(例如10至50个核苷酸)来说是至少约30℃而对于较长探针(例如大于50个核苷酸)来说是至少约60℃的那些。严格条件也可在添加去稳定剂诸如甲酰胺下实现。示例性低严格性条件包括在37℃下用30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液进行杂交,以及在50至55℃下于1X至2X SSC(20X SSC=3.0MNaCl/0.3M柠檬酸钠)中洗涤。示例性中度严格性条件包括在37℃下于40至45%甲酰胺、1.0M NaCl、1%SDS中杂交,以及在55至60℃下于0.5X至1X SSC中洗涤。示例性高严格性条件包括在37℃下于50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60至65℃下于0.1X SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%SDS。杂交的持续时间通常是小于约24小时,通常是约4至约12小时。洗涤时间的持续期将是至少足以达到平衡的时长。
在杂交反应中,特异性通常随杂交后洗涤而变化,关键因素是最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交物,Tm可从Meinkoth和Wahl,Anal.Biochem.,1984,138,267-284的方程:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L加以估计;其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,并且L是杂交物的碱基对长度。Tm是50%的互补性靶标序列杂交于完全匹配探针所处的温度(在确定离子强度和pH下)。对于每1%的不匹配,Tm降低约1℃;因此,可调整Tm、杂交和/或洗涤条件以杂交于具有所需同一性的序列。举例来说,如果寻求具有≥90%同一性的序列,那么Tm可降低10℃。通常,将严格条件选择为比特定序列和它的互补序列在确定离子强度和pH下的热熔点(Tm)低约5℃。然而,极度严格条件可利用在比热熔点(Tm)低1℃、2℃、3℃或4℃下进行的杂交和/或洗涤;中度严格条件可利用在比热熔点(Tm)低6℃、7℃、8℃、9℃或10℃下进行的杂交和/或洗涤;低严格性条件可利用在比热熔点(Tm)低11℃、12℃、13℃、14℃、15℃或20℃下进行的杂交和/或洗涤。使用所述方程、杂交和洗涤组合物、以及所需Tm,普通技术人员将了解,在杂交和/或洗涤溶液的严格性方面的变化以内在方式加以描述。如果所需不匹配程度导致Tm小于45℃(水溶液)或32℃(甲酰胺溶液),那么最优的是使SSC浓度增加以致可使用较高温度。
还提供用于检测生物样品中变异SIGIRR多肽的存在性或定量所述变异SIGIRR多肽的水平的方法,包括例如蛋白质测序和免疫测定。在一些实施方案中,检测人受试者中变异SIGIRR蛋白(例如SEQ ID NO:9)的存在性的方法包括对来自所述人受试者的生物样品进行测定,所述测定检测所述生物样品中所述变异SIGIRR蛋白(例如SEQ ID NO:4)的存在性。
蛋白质测序技术的说明性非限制性实例包括但不限于质谱测定法和Edman降解。免疫测定的说明性实例包括但不限于免疫沉淀、Western印迹、免疫组织化学分析、ELISA、免疫细胞化学分析、流式细胞计量术和免疫PCR。使用各种已知技术(例如比色、荧光、化学发光或放射性)以可检测方式加以标记的多克隆或单克隆抗体适于在免疫测定中使用。关于免疫测定,变异SIGIRR蛋白相较于野生型SIGIRR蛋白具有不同大小,因此,在蛋白凝胶上在不同分子量下泳动。因此,通过使用相同抗体,在例如Western印迹测定中,野生型SIGIRR蛋白可与变异SIGIRR蛋白区分。
本公开还提供用于在人受试者中诊断炎症性肠病或早期发作型炎症性肠病或检测显现炎症性肠病或早期发作型炎症性肠病的风险的方法,所述方法包括:在从所述人受试者获得的核酸分子中检测本文所述的SIGIRR核酸分子中的任一者中的改变中的任一者;以及如果所述受试者具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有炎症性肠病或早期发作型炎症性肠病,或如果所述受试者不具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于显现炎症性肠病或早期发作型炎症性肠病的风险下。在一些实施方案中,人受试者需要所述诊断。在一些实施方案中,人受试者可具有已被诊断有炎症性肠病或早期发作型炎症性肠病的亲属。
炎症性肠病或早期发作型炎症性肠病的症状包括但不限于腹泻、发热、疲劳、腹部疼痛、腹部痉挛、恶心、呕吐、粪便中存在血液、贫血、食欲减退和非故意的重量减轻或它们的任何组合。
在一些实施方案中,方法包括检测从生物样品获得的变异SIGIRR基因组DNA、mRNA或从mRNA获得的cDNA的存在性,所述生物样品从受试者获得。应了解某一群体内的基因序列以及由所述基因编码的mRNA可由于多态性诸如单核苷酸多态性(SNP)而不同。本文对于SIGIRR基因组DNA、mRNA、cDNA和多肽提供的序列仅是示例性序列,并且包括额外SIGIRR等位基因的其他所述序列也是可能的。
在一些实施方案中,检测步骤包括对编码截短SIGIRR蛋白的核酸分子的至少一部分测序。在一些实施方案中,检测步骤包括对编码SIGIRR蛋白的核酸分子的至少一部分测序,其中测序的核酸分子编码包含对应于根据SEQ ID NO:9的位置186的位置的氨基酸序列。可对本文公开的核酸分子(例如基因组DNA、mRNA或cDNA)中的任一者测序。在一些实施方案中,检测步骤包括对整个核酸分子测序。
在一些实施方案中,检测步骤包括:扩增编码截短SIGIRR蛋白的核酸分子的至少一部分;用可检测标记对核酸分子进行标记;使经标记核酸与包含探针的支撑物接触,其中所述探针包含在严格条件下杂交于编码所述截短SIGIRR蛋白的核酸序列的核酸序列;以及检测所述可检测标记。在一些实施方案中,检测步骤包括:扩增编码SIGIRR蛋白的核酸分子的至少一部分,其中所扩增核酸分子编码包含对应于根据SEQ ID NO:9的位置186的位置的氨基酸序列;用可检测标记对核酸分子进行标记;使经标记核酸与包含探针的支撑物接触,其中所述探针包含在严格条件下杂交于编码在对应于根据SEQ ID NO:9的位置186的位置处的天冬氨酸的核酸序列的核酸序列;以及检测所述可检测标记。可扩增本文公开的核酸分子中的任一者。举例来说,可扩增本文公开的基因组DNA、cDNA或mRNA分子中的任一者。在一些实施方案中,核酸分子是mRNA,并且方法还包括在扩增步骤之前使mRNA逆转录成cDNA。
在一些实施方案中,检测步骤包括:使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下杂交于编码截短SIGIRR蛋白的核酸序列的核酸序列,以及检测所述可检测标记。在一些实施方案中,检测步骤包括:使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下杂交于编码在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列的核酸序列的核酸序列,以及检测所述可检测标记。在一些实施方案中,核酸分子存在于从人受试者获得的细胞内,以致检测根据原位杂交技术进行。
在一些实施方案中,检测步骤包括使编码SIGIRR蛋白的核酸分子与改变特异性引物接触,以及使用改变特异性PCR技术扩增核酸分子。改变特异性引物可为本文所述的任何所述引物,并且可对编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的变异SIGIRR蛋白具有特异性。
可用于本文公开的方法中的其他测定包括例如逆转录聚合酶链式反应(RT-PCR)或定量RT-PCR(qRT-PCR)。可用于本文公开的方法中的其他测定包括例如RNA测序(RNA-Seq),继之以检测生物样品中变异mRNA或cDNA的存在性和数量。
本公开还提供用于鉴定患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险的人受试者的方法。方法通常包括在从受试者获得的样品中检测变异SIGIRR蛋白的存在性或不存在性;和/或本文所述的编码变异SIGIRR蛋白的核酸分子中的任一者的存在性或不存在性。存在截短SIGIRR蛋白指示受试者患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险。在对应于根据SEQ ID NO:2的位置9962的位置处(例如基因组DNA),或在对应于根据SEQID NO:4的位置557的位置处(例如mRNA),或在对应于根据SEQ ID NO:6的位置557的位置处(例如cDNA)存在鸟嘌呤(归因于腺嘌呤的缺失)指示受试者患有炎症性肠病或早期发作型炎症性肠病或具有显现炎症性肠病或早期发作型炎症性肠病的风险,在所述位置处存在鸟嘌呤各自都导致在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处含有丝氨酸的变异SIGIRR蛋白。方法可在体外、原位或在体内进行。
本公开还提供用于鉴定患有早期发作型炎症性肠病或具有显现早期发作型炎症性肠病的风险的人受试者的方法,其中所述方法包括在从所述受试者获得的样品中检测在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白;和/或编码在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸分子的存在性或不存在性;其中存在所述截短SIGIRR蛋白和/或编码所述截短SIGIRR蛋白的所述核酸分子指示所述受试者患有早期发作型炎症性肠病或具有显现早期发作型炎症性肠病的风险。在一些实施方案中,相较于野生型SIGIRR蛋白,在对应于根据SEQ ID NO:9的位置186至209和211至215的位置中的任一者处,截短SIGIRR蛋白都包含不同氨基酸。在一些实施方案中,截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
在一些实施方案中,用对截短SIGIRR具有特异性的抗体检测样品中截短SIGIRR蛋白的存在性或不存在性。在一些实施方案中,对截短SIGIRR具有特异性的抗体对:i)在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸;或ii)由于框移突变而在SIGIRR蛋白中创建的表位具有特异性,所述框移突变导致丝氨酸在对应于根据SEQ ID NO:9的位置186的位置处。在一些实施方案中,检测还包括将对截短SIGIRR具有特异性的抗体的反应与对野生型SIGIRR具有特异性的抗体的反应进行比较。在一些实施方案中,通过酶联免疫吸附测定(ELISA)来检测所述样品中所述截短SIGIRR蛋白的存在性或不存在性。在一些实施方案中,通过确定核酸分子中是否存在创建编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的框移突变来检测样品中编码所述截短SIGIRR蛋白的所述核酸分子的存在性或不存在性。在一些实施方案中,核酸分子的测序的部分包含涵盖编码对应于根据SEQ ID NO:9的位置186的位置的密码子的多个位置。
在方法的一些实施方案中,检测步骤包括对编码SIGIRR蛋白的核酸分子的至少一部分测序。在方法的一些实施方案中,检测步骤包括对编码截短SIGIRR蛋白的核酸分子的至少一部分测序。测序的核酸分子可编码包含对应于根据SEQ ID NO:9的位置186的位置的氨基酸序列。在对应于根据SEQ ID NO:2的位置9962的位置处(例如基因组DNA),或在对应于根据SEQ ID NO:4的位置557的位置处(例如mRNA),或在对应于根据SEQ ID NO:6的位置557的位置处(例如cDNA)存在鸟嘌呤(归因于腺嘌呤的缺失)各自都导致在对应于根据SEQID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处含有丝氨酸的变异SIGIRR蛋白。检测步骤可包括对编码整个SIGIRR蛋白的核酸分子测序。
在方法的一些实施方案中,检测步骤包括扩增编码截短SIGIRR蛋白的核酸分子的至少一部分,用可检测标记对所扩增核酸分子进行标记,使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含包括例如在严格条件下特异性杂交于编码所述截短SIGIRR蛋白的核酸序列的核酸序列,以及检测所述可检测标记。在方法的一些实施方案中,检测步骤包括扩增编码SIGIRR蛋白的核酸分子的至少一部分,用可检测标记对所扩增核酸分子进行标记,使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含包括例如在严格条件下特异性杂交于编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的核酸序列(或在对应于根据SEQ ID NO:2的位置9962的位置处(例如基因组DNA),或在对应于根据SEQ ID NO:4的位置557的位置处(例如mRNA),或在对应于根据SEQ ID NO:6的位置557的位置处(例如cDNA)具有鸟嘌呤(归因于腺嘌呤的缺失)的核酸序列,在所述位置处具有鸟嘌呤各自都导致在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处含有丝氨酸的变异SIGIRR蛋白)的核酸序列,以及检测所述可检测标记。所扩增核酸分子优选编码包含对应于根据SEQ ID NO:9的位置186的位置的氨基酸序列。如果核酸包括mRNA,那么方法可还包括在扩增步骤之前使mRNA逆转录成cDNA。在一些实施方案中,确定步骤包括使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,以及检测所述可检测标记。探针优选包含包括例如在严格条件下特异性杂交于编码在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列的核酸序列(或在对应于根据SEQ ID NO:2的位置9962的位置处(例如基因组DNA),或在对应于根据SEQ IDNO:4的位置557的位置处(例如mRNA),或在对应于根据SEQ ID NO:6的位置557的位置处(例如cDNA)具有鸟嘌呤(归因于腺嘌呤的缺失)的核酸序列,在所述位置处具有鸟嘌呤各自都导致在对应于根据SEQ ID NO:9的位置215的位置处被截短,并且在对应于根据SEQ ID NO:9的位置186的位置处含有丝氨酸的变异SIGIRR蛋白)的核酸序列。核酸分子可存在于从人受试者获得的细胞内。
在一些实施方案中,检测步骤包括:扩增编码SIGIRR蛋白的核酸分子的至少一部分,其中所扩增核酸分子涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的氨基酸的密码子;用可检测标记对所扩增核酸分子进行标记;使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ IDNO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及检测所述可检测标记。
在一些实施方案中,检测步骤包括:使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及检测所述可检测标记。在一些实施方案中,人受试者小于18岁。在一些实施方案中,人受试者被鉴定为患有克罗恩氏病或具有显现克罗恩氏病的风险。
本公开还提供用于在人受试者中诊断炎症性肠病或早期发作型炎症性肠病或检测显现炎症性肠病或早期发作型炎症性肠病的风险的方法,所述方法包括:检测从所述人受试者获得的截短SIGIRR蛋白;以及如果所述受试者具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有炎症性肠病或早期发作型炎症性肠病,或如果所述受试者不具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于显现炎症性肠病或早期发作型炎症性肠病的风险下。在一些实施方案中,人受试者需要所述诊断。本公开还提供用于在人受试者中诊断炎症性肠病或早期发作型炎症性肠病或检测显现炎症性肠病或早期发作型炎症性肠病的风险的方法,所述方法包括:检测从所述人受试者获得的变异SIGIRR蛋白,诸如包含SEQ ID NO:9的蛋白质;以及如果所述受试者具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有炎症性肠病或早期发作型炎症性肠病,或如果所述受试者不具有炎症性肠病或早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于显现炎症性肠病或早期发作型炎症性肠病的风险下。在一些实施方案中,人受试者需要所述诊断。在一些实施方案中,人受试者可具有已被诊断有炎症性肠病或早期发作型炎症性肠病的亲属。
本公开还提供用于在人受试者中诊断早期发作型炎症性肠病或检测早期发作型炎症性肠病的风险的方法,所述方法包括:检测从所述人受试者获得的编码SIGIRR蛋白的核酸分子,其中所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;和/或检测从所述人受试者获得的SIGIRR蛋白,其中所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;以及如果所述受试者具有早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有早期发作型炎症性肠病,或如果所述受试者不具有早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于早期发作型炎症性肠病的风险下。在一些实施方案中,相较于野生型SIGIRR蛋白,在对应于根据SEQ ID NO:9的位置186至209和211至215的位置中的任一者处,截短SIGIRR蛋白都包含不同氨基酸。在一些实施方案中,在对应于根据SEQ IDNO:9的位置186至215的位置处,截短SIGIRR蛋白包含SEQ ID NO:13的氨基酸序列。在一些实施方案中,用对截短SIGIRR具有特异性的抗体检测截短SIGIRR蛋白。在一些实施方案中,对截短SIGIRR具有特异性的抗体对:i)在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸;或ii)由于框移突变而在SIGIRR蛋白中创建的表位具有特异性,所述框移突变导致丝氨酸在对应于根据SEQ ID NO:9的位置186的位置处。在一些实施方案中,检测还包括将对截短SIGIRR具有特异性的抗体的反应与对野生型SIGIRR具有特异性的抗体的反应进行比较。在一些实施方案中,通过酶联免疫吸附测定(ELISA)来检测截短SIGIRR蛋白。在一些实施方案中,通过检测所述核酸分子中的创建编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的框移突变来检测编码所述截短SIGIRR蛋白的核酸分子。在一些实施方案中,核酸分子的测序的部分包含涵盖编码对应于根据SEQ ID NO:9的位置186的位置的密码子的多个位置。
在一些实施方案中,检测步骤包括:扩增编码SIGIRR蛋白的核酸分子的至少一部分,其中所扩增核酸分子涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的氨基酸的密码子;用可检测标记对所扩增核酸分子进行标记;使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ IDNO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及检测所述可检测标记。
在一些实施方案中,检测步骤包括:使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及检测所述可检测标记。
在一些实施方案中,本文所述的从其获得样品的人受试者(例如所诊断和/或治疗的人受试者)不是成人。在一些实施方案中,本文所述的从其获得样品的人受试者是18岁或更年轻。在一些实施方案中,本文所述的从其获得样品的人受试者是15岁或更年轻。在一些实施方案中,本文所述的从其获得样品的人受试者是13岁或更年轻。在一些实施方案中,本文所述的从其获得样品的人受试者是10岁或更年轻。在一些实施方案中,是6岁或更年轻的人受试者可患有极其早期发作型炎症性肠病。在一些实施方案中,人受试者不患有坏死性小肠结肠炎。
在一些实施方案中,本文所述的方法中的任一者都可还包括用有效治疗炎症性肠病或早期发作型炎症性肠病的药剂治疗受试者。在一些实施方案中,方法还包括当在受试者中检测到改变,并且受试者被诊断为患有炎症性肠病或早期发作型炎症性肠病时,用有效治疗炎症性肠病或早期发作型炎症性肠病的药剂治疗受试者。
本公开还提供本文公开的变异SIGIRR基因组DNA、mRNA、cDNA、多肽和杂交核酸分子中的任一者诊断早期发作型炎症性肠病或诊断显现早期发作型炎症性肠病的风险的用途。
以上或以下引用的所有专利文件、网站、其他出版物、登录号等都出于所有目的以引用的方式整体并入本文,所述引用的程度就好像特定地和个别地指出将每个单独的条目都如此以引用的方式并入本文一样。如果在不同时间有序列的不同版本与登录号相关联,那么意指的是在本申请的有效申请日期时与所述登录号相关联的版本。有效申请日期意指实际申请日期或涉及所述登录号的优先权申请的申请日期(如果可适用)的早先日期。同样,如果在不同时间有出版物、网站等的不同版本被公布,那么除非另外指示,否则意指的是在申请的有效申请日期时最新近公布的版本。除非另外明确指示,否则本公开的任何特征、步骤、要素、实施方案或方面都可与任何其他特征、步骤、要素、实施方案或方面组合使用。尽管本公开已出于明晰和理解的目的通过说明和举例的方式相当详细地加以描述,但将显而易知的是某些变化和修改可在随附权利要求的范围内加以实施。
本文叙述的核苷酸和氨基酸序列使用核苷酸碱基的标准字母缩写和氨基酸的单字母代码加以显示。核苷酸序列遵循在序列的5′末端开始,并且前进(即在各行中从左至右)直至3′末端的标准惯例。仅显示各核苷酸序列的一个链,但互补链应理解为通过对所显示链的任何提及来包括。氨基酸序列遵循在序列的氨基末端开始,并且前进(即在各行中从左至右)直至羧基末端的标准惯例。
提供以下实施例以更详细描述实施方案。它们意图说明而非限制所要求保护的实施方案。
实施例
提出以下实施例以便向本领域普通技术人员提供对如何制备(进行)和评估本文要求保护的化合物、组合物、物品、装置和/或方法的完整公开和描述,并且意图仅具有示例性,而不意图限制本发明者视为他们的发明的发明的范围。已努力确保关于数值(例如量、温度等)的准确性,但应虑及一些实验误差和偏差。除非另外指示,否则份是重量份,温度以℃计或在环境温度下,并且压力处于或接近大气压。
实施例1:患者招募和表型分析
对13岁EO-IBD患者、他的受IBD影响的母亲和他的未受影响的父亲进行基于整个外显子组测序和三人组的变体分析。为遗传评估所述患者的EO-IBD,已对这个家庭进行探查。
实施例2:基因组样品
从外周血液样品提取基因组DNA,并且转移至再生元遗传学中心(RGC)以进行整个外显子组测序,并且在-80℃下储存在自动化生物库中。进行基于荧光的定量以确保DNA数量和品质适于测序目的。
将1μg DNA剪切成150个碱基对的平均片段长度(Covaris LE220),并且准备用于用来自Kapa Biosystems的定制试剂盒进行外显子组捕集。使用NimbleGen SeqCap VCRome2.1或Integrated DNA Technologies xGen外显子组靶标设计来捕集样品。使样品条形码化、汇合和多路化以采用v4化学,使用75bp双端测序在Illumina HiSeq 2500上测序。对所捕集片段测序以实现在20倍或更大覆盖度下覆盖最少85%的靶标碱基。在测序之后,使用在RGC开发的基于云的管道处理数据,所述管道使用DNAnexus和AWS来运行用于样品水平数据产生和分析的标准工具。简要来说,使用Illumina的CASAVA软件产生序列数据,并且去多路化。使用BWA-mem,使序列读段相对于GRCh37/hg19人基因组参照集合来定位和比对。在比对之后,使用Picard工具对重复读段进行标记和标示,并且使用GATK对插入缺失(indel)进行再比对以改进变体识别品质。使用GATK的HaplotypeCaller识别SNP和INDEL变体和基因型,并且来自GATK的变体品质评分再校准(VQSR)被应用于注释总体变体品质评分。捕集每个样品的测序和数据品质量度统计资料以评估捕集性能、比对性能和变体识别。
实施例3:基因组数据分析
最小读段深度(>10)、基因型品质(>30)和等位基因平衡(>20%)的标准品质控制过滤程序被应用于所识别变体。使用RGC开发的注释和分析管道将通过的变体基于它们的潜在功能性影响来分类和注释(无论是同义、非同义、剪接、框移变体还是非框移变体)。使用PRIMUS(Staples等,Amer.J.Human Genet.,2014,95,553-564)以及与对于这个家庭所报告的谱系进行交叉引用,通过来自遗传数据的由血统同一性获得的量度来验证家庭关系以推断群组中的关联和关系。
鉴于报告的家史,进行基于谱系的变体分析和分离以鉴定在常染色体显性遗传样式下的候选疾病基因。在受影响先证者与他的受影响的母亲之间共有而非与未受影响的父亲共有的变体随后通过它们的在群体对照数据库诸如dbSNP、千人基因组计划(1000Genomes Project)、NHLBI外显子组测序计划(NHLBI Exome Sequencing Project)、外显子组集成联合数据库(Exome Aggregation Consortium Database,ExAc)和内部RGC数据库中观察到的频率来注释和过滤以滤出可能是良性变体的常见多态性和高频率。用于生物信息学预测变体的功能性影响的算法诸如LRT、Poly-phen2、SIFT、CADD和Mutation Taster连同基于多物种比对的保守评分(即GERP、PhastCons、PhyloP)一起作为变体的注释过程的一部分加以并入,并且用于提供关于所鉴定的候选变体的潜在有害性的信息。
在13岁患者中鉴定到SIGIRR基因的一种与早期发作型炎症性肠病一起分离的罕见致截短插入缺失变体(SIGIRR:c.557delA;p.K186fs*31),所述变体从他的受IBD影响的母亲遗传。参照图1(图版A、图版B和图版C),显示的是在具有克罗恩氏病(CD)的家庭中对SIGIRR基因中的具有显性分离的致截短变体的鉴定。图版A显示描述SIGIRR中的处于c.557delA/p.K186fs*31下的具有母体遗传的致截短变体的表格;变异位点在物种之间具有中性保守评分,并且被预测对蛋白质功能具有损害;这个变体在ExAC浏览器中具有0.000471的可选等位基因频率。图版B显示来自受影响的EO-IBD患者(Utah81427)、他的受克罗恩氏病影响的母亲(Utah81428)和未受影响的父亲(Utah81429)的谱系;实心符号指示受CD影响的个体,空心符号指示未受影响的个体;圆圈表示女性,并且方块表示男性。图版C显示对在受CD影响的Utah81427和他的受CD影响的母亲中分离,但未在未受影响的父亲中观察到的所鉴定SIGIRR致截短变体的目视确认。
实施例4:检测
某一遗传变体在受试者中存在可指示所述受试者具有增加的患有或显现早期发作型炎症性肠病的风险。诸如血液样品的样品可从受试者获得。可使用常见核酸提取试剂盒从样品分离核酸。在从由受试者获得的样品分离核酸之后,对核酸测序以确定是否有遗传变体存在。可将核酸的序列与对照序列(野生型序列)进行比较。发现在从由受试者获得的样品获得的核酸与对照序列之间的差异指示存在遗传变体。这些步骤可如在以上实施例中以及在整篇本公开中所述加以进行。存在一种或多种遗传变体指示受试者具有或显现早期发作型炎症性肠病的风险增加。
实施例5:研究
材料和方法
细胞系和培养条件:
在犹他大学健康科学中心(University of Utah Health Sciences Center)在IRB核准下从儿科IBD患者产生艾伯斯坦-巴尔病毒转化的淋巴母细胞样细胞系(LCL)。健康LCL从美国典型细胞培养物中心(ATCC;Manassas,VA)购买。在补充以10%胎牛血清(Gibco产品标识号:10438026)、1X青霉素-链霉素(Gibco产品标识号:15140122)和1X L-谷氨酰胺(Gibco产品标识号:25030081)的RPMI培养基1640(Gibco产品标识号:12633)中培养细胞。
刺激条件:
从健康对照、SIGIRR LoF患者产生的LCL和来自4名不具有SIGIRR LoF的EO IBD患者的LCL用2mg/ml LPS(InvivoGen,San Diego,CA)刺激72小时,或用2mg/mlαIgM/αCD40(Affymetrix,Santa Clara,CA)刺激16小时。在刺激之后,将细胞培养上清液收集并用于使用Mesoscale Discovery V-Plex人促炎性细胞因子组套(K15049D)来定量促炎性细胞因子的分泌,并且使用Mesoscale Discovery QuickPlex SQ 120加以定量,并随后补充以RNA测序。
统计:
使用2因素ANOVA检验确定显著性,并且利用GraphPad PRISM(La Jolla,CA),使用来自3个独立实验的结果计算S.E.M.。
结果:
参照图2,相比于健康LCL或来自不具有SIGIRR LoF的EO IBD患者的LCL,从SIGIRRLoF患者产生的LCL产生更多IFN-γ、IL-2、IL-4、IL-6、IL-8、IL-10、IL-12p70和TNF-α。此外,相比于健康LCL或来自EO IBD患者的一些LCL,从SIGIRR LoF患者产生的未刺激LCL分泌升高水平的IFN-γ、IL-1β、IL-2、IL-4、IL-6、IL-8、IL-10、IL-12p70和TNF-α,从而指示SIGIRR LoF LCL具有组成型活性,并且对LPS刺激无感受。参照图2,蓝色棒条指示从未刺激细胞分离的上清液;红色棒条指示从LPS刺激的细胞分离的上清液。“*”指示根据两因素Anova,p<0.05;误差棒指示来自3个独立实验的S.E.M.。
参照图3,在αIgM/αCD40刺激之后,相比于健康LCL或来自不具有SIGIRR LoF的EOIBD患者的一些LCL,从SIGIRR LoF患者产生的LCL产生更多IFN-γ、IL-2、IL-4、IL-6、IL-8、IL-10、IL-12p70和TNF-α。此外,相比于健康LCL或来自EO IBD患者的一些LCL,从SIGIRRLoF患者产生的未刺激LCL分泌更加升高水平的IFN-γ、IL-2、IL-4、IL-6、IL-8、IL-10和TNF-α,从而指示SIGIRR LoF LCL具有组成型活性,并且对抗IgM抗体/抗CD40抗体刺激无感受。参照图3,蓝色棒条指示从未刺激细胞分离的上清液;红色棒条指示从抗IgM抗体/抗CD40抗体刺激的细胞分离的上清液;“*”指示根据两因素Anova,p<0.05;误差棒指示来自3个独立实验的S.E.M.。
在未刺激细胞的情况下,观察到相对于从健康对照产生的LCL与从不具有SIGIRR功能丧失(LoF)变体的EO-IBD患者产生的LCL两者,在截短(c.557delA;p.K186fs*31)SIGIRR EO-IBD患者LCL中,包括IL-1β、IL-8和IL-6的关键免疫调节物得以上调。这个观察结果支持携带SIGIRR LoF变体的IBD患者中的独特炎症性特征。此外,观察到SIGIRR EO-IBD患者源性LCL对用IL-1β或TLR刺激进行的刺激无感受,从而支持在不存在SIGIRR下,这些促炎性路径具有组成型活化。
序列表
<110> 雷杰纳荣制药公司(Regeneron Pharmaceuticals, Inc.)
<120> 单免疫球蛋白白介素-1受体相关分子(SIGIRR)变体及其用途
<130> 189238.00602
<150> 62/554,857
<151> 2017-09-06
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 11739
<212> DNA
<213> 智人(Homo sapien)
<220>
<223> 基因组野生型SIGIRR
<400> 1
actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60
gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120
ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180
ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240
gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300
gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360
gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420
agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480
tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540
ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600
cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660
gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720
gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780
gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840
gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900
tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960
gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020
tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080
ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140
agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200
ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260
gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320
caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380
tgggaccctg agcccaaggc ccaccatcac ccaaggctga gtaccgggac aaaggaaggt 1440
cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagagggt 1500
gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560
ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620
ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680
aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740
tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800
atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860
ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920
gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980
gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040
gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100
aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160
acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220
cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280
ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340
ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400
tgggtggggt ttagggttag gagaggatgt gactgcaagg ccaggaagct acagggaaag 2460
ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520
tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580
aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640
cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700
ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760
gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820
ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880
gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940
tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000
acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060
gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120
agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180
gagagggtgc aggggaaggt gtgcagggaa aggtggggag gggagagggt gcaggggaag 3240
gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300
ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360
ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420
ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480
ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540
agagagggtg caggggaagg tggggagggg agagggtgca gggggaggca ggcagaggag 3600
agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660
tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720
ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggagaggg tgcaggggag 3780
agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840
cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900
ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960
ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020
tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080
actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140
catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200
gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260
cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320
cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380
acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440
tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500
gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560
cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620
ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680
gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740
gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800
gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860
ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920
gcaccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980
gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040
ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100
tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160
cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220
gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280
cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340
gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400
cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460
gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520
cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580
gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640
gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700
gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760
tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820
actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880
gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940
cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000
gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060
cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120
cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180
ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240
gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300
ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360
cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420
ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480
ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540
cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600
ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660
gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720
cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780
ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840
catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900
agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960
actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020
cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080
tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140
agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200
ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260
acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320
cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380
taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440
caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500
gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560
ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620
cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680
ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740
cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800
gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860
cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920
gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980
gtggtgggga gggcttgcct gtggccagga gcagagggcc ccaagacccc caaggcagga 8040
atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100
tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160
gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220
accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280
acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340
tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400
cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460
gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520
gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580
tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640
tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700
gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760
gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820
tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880
ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940
ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000
aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060
gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120
ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180
gacaggtggg gttcgggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240
atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300
gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360
tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420
ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480
aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540
cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600
ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660
cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720
gcggcgggga ggggttagcc cccgggtgct ctgtgcggcc cggctggggt taaagtccgg 9780
ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840
gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900
gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960
aagccgcagc tggagcggcg tcggggctac aagctcttcc tggacgaccg cgacctcctg 10020
ccgcgcgctg gtatcccggg ccccaccccg tgccccgccc acccggaggg cccgccccgc 10080
cccgccccat gctccgtccc acccggggcc ccacccccac catcgagctc cgcccccatc 10140
cccgcccacc cgaggccccg cctcaaaaac ccgcccaccc cgcaggcccc gcccctccct 10200
tagagctctg cgtccggcac cgcccctgag cctccggccc cgccctcccc cgcccccgcc 10260
cctgcgccgc cgacgcccgc cctcccgcag agccctccgc cgacctcttg gtgaacctga 10320
gccgctgccg acgcctcatc gtggtgcttt cggacgcctt cctgagccgg gcctggtgca 10380
gccacagctt ccggtgggtc ccgcgcgggg ttgggtgggc cccagcgtag cacccacccc 10440
cctgacggtc ccgccccgca gggagggcct gtgccggctg ctggagctca cccgcagacc 10500
catcttcatc accttcgagg gccagaggcg cgaccccgcg cacccggcgc tccgcctgct 10560
gcgccagcac cgccacctgg tgaccttgct gctctggagg cccggctccg tggtgcggag 10620
caggcgcggg agggtccggg gctagcggcg ggttagagat gggcggtgcc cgggctccag 10680
gctgggaccc ctccgtgggg agctctgcgg caccacgctt tgtgaatggg ccctgggggg 10740
aggttccgct gcctggggcc ccgatgcggg gagccgccct tgaggccccc ggagccacgg 10800
aatagctgtc gcagggcgtg gaacccgtgg gcagccgcag gtgtgctctt gggggccagg 10860
acgccagggg cttccgaggt gttcacacct gcaaaccgcc ccgacctggc ccccagactc 10920
cttcctccga tttttggaaa gaagtgcagc tggcgctgcc gcggaaggtg cagtacaggc 10980
ctgtggaagg agacccccag acgcagctgc aggacgacaa ggaccccatg ctgattcttc 11040
gaggccgagt ccctgagggc cgggccctgg actcagaggt ggacccggac cctgagggcg 11100
acctgggtat gcccgcccag ccccactccc caactggaga agctcagcac agggcggagt 11160
gggggcaggc acagggcaca gggcctggag gggctccagg tgttgaggac tcttcccggc 11220
accgggagcc cctgcacggc ctctgccctg gaggtgctcg gccctcggtc tgcctgggaa 11280
cttcctgggc ctcacaggcc atcacagcag ggggtgagca ggggcagccc ctggcagtgg 11340
gtctgggcca aggctgtggg tggccacctc aggcgtctcg gtctccccac cccaggtgtc 11400
cgggggcctg tctttggaga gccatcagct ccaccgcaca ccagtggggt ctcgctggga 11460
gagagccgga gcagcgaagt ggacgtctcg gatctcggct cgcgaaacta cagtgcccgc 11520
acagacttct actgcctggt gtccaaggat gatatgtagc tcccacccca gagtgcagga 11580
tcatagggac agcgggggcc agggcagcgg cgtcgctcct ctgctcaaca ggaccacaac 11640
ccctgccagc agccctggga ccctgccagc agccctggga aaaggctgtg gcctcagggc 11700
gcctcccagt gccagaaaat aaagtccttt tggattctg 11739
<210> 2
<211> 11738
<212> DNA
<213> 智人(Homo sapien)
<220>
<223> 变异SIGIRR基因组序列(c.557delA)
<400> 2
actgcggggc ggggccgcac ctgctgccgc tgccggggct acgccgccgc cggggctgtt 60
gccgctgcgc acctggctca ggtgagctgc cccgcccccg cccggcgcga gccccaggtc 120
ctggcagcag gtgagtggcg gtcgccatca gacccgcgaa ggtgagtgga ggtcgcagtc 180
ctcccagagc cgctgcaggc ctggagtcgg ggcccggggc gctgcttgtc cctgggcgcg 240
gtctctcagg aaatggctcg gggccgggga ggttcccgcg tcgcccggaa gcccgagctc 300
gcccgcgtcc tggccctttc cagggctggg ggaagggagg aaagtgggcg aagggggcgg 360
gggccaccct ttcctctgcc cgacgtggtc agcggctttt tggtgaccct cgcgcagaac 420
agagcggggc taggagcgcc gaggcgcgca gggatcccac ctcggtcgcc caagcctgga 480
tcccagctcg aggcttcctg aggcgccgag ggcggaccaa gagtcaggct ggggcccgag 540
ctcgcccggc gccgggtgga gcttccgcca tccgcgcgcc tctgccccgg ccgagcgccc 600
cgagccgcac ccccgtgccc gcctcccgcg cgcgtcctcg ttctccgccc tcctcacttg 660
gagggcgccc agggcgcagg tgggcgcggg gtaggggagc gaaccagagc ccctcggcct 720
gcggggccgc agccttttac ccacgttcct gcttcaggac aggcgctggg ggcccagcgc 780
gcacggggag cggaggggcg gcgcgtccga gctgagcggg agtcgcccgc agggtgctgg 840
gtgctgagcg tcgaacccac cgggcagggg cggccgcgga ccgaggacgc tggctgggtc 900
tgagggcggg aggagctggc gctttctaag aacctcaagg tgcccagcag agtgcggtgg 960
gcagtgcgag gcgaccaggg ccaggcttgg actgagattc tgggcgcctc ggaagagctg 1020
tgcgggcgag ggtcggagac tttgtgggtg ttcatgctca ccctggacgg tggacctggg 1080
ggctcggggg tgcaggacgt tagcagagag agggaaggag agggtgccaa gccagccctg 1140
agagatggtg acgctgagac cgggtgcaca gagcagccgc cgagccgggg cttcacagtt 1200
ggcggctgac cccagggcct gtgctggagg ccctgctcct gcttcctgcg ggggtgccct 1260
gggccctgct gtgcctgctt cctgacctgc agtgtgggga gaaccttctt gaggggcttc 1320
caaggaccca cttcaaggag gggctggtac caggctctgt gggggaaggg gtgctgtctt 1380
tgggaccctg agcccaaggc ccaccatcac ccaaggctga gtaccgggac aaaggaaggt 1440
cctagcaggg ctgggactca gtcagacaag tacctgtaga aagcctgctg ctgagagggt 1500
gctcagccag ggccgggagg ctggatggca gccctccaca atgaagccct gcccccatgt 1560
ggctgagggc agggccaggg tccaaaggag acccttgtct gattctgtgg gcaataccag 1620
ccaccggtca ctgggtcccc agtcccaggt caacctgggg agtgtcagtt tggtgacaac 1680
aggagatgcc atctgcccct catctgctct gagccaggag cctcggccac ctgtgtttgc 1740
tccttatttg gaaaaggggg cgctgccctc ccaccccagc ctgaagggaa ggtccacaag 1800
atgccatagt cccttgtaac tgctcaccca tcgggggagc tatgtctggg agagggacgg 1860
ggagagggcg gaagagttct gctggagccc cattgttgac cgggagtttc tgaaggccct 1920
gttccccggg gtcagaggtc aaagacacat gggggagcaa accggcccct tggctcctga 1980
gtgtgagctc tagtagcgtc tggaaggcat gccgcgcggt ccccggtcct ccttgtatgt 2040
gtgcagggtg gccctggcgg gggtctcctg gctggaggac cccccatgca ttacccctgg 2100
aacctgcccc tttgagcacc ccccacccca caacacacac gcacacacac aaacgcacgc 2160
acacgcacat actgcacaca cattgcacac acgcagacac actgcacaca cacacacaca 2220
cacacacaca cacacacaca cacacacgct gcacagagga aagtgccgtg cctgggtggg 2280
ttggggcggg ctccagagga aggagccgct tgactcagag ctacaggaag agccggggca 2340
ggcggggtga gaaccaccaa ctgcccgtcc tcccgcccgc ctagggaagg ggtgggtgcc 2400
tgggtggggt ttagggttag gagaggatgt gactgcaagg ccaggaagct acagggaaag 2460
ttctgatcaa aatacacaaa gacacaagcc aggtccccac cgcgcttggc gatgcatcca 2520
tagcagcctt ggtgctgtgg acactccctg gggcccagcg aaggggagag tttgctccca 2580
aaggcgcacc aatgaccaac atttgccccc cggaggaaag aactggaacc aggtgactgc 2640
cttccccgct gctctgagtg agcctgtgtc agggcctggc tgagaggagg cccacggcgc 2700
ccaagaccca tatgcatgtg tgtgcatgtg tgtgtgagac agagcgaggg gcagcaggag 2760
gctgtgtcgc atcagcggcc aagggtgggt gtcaggtgca gtgtgtgtgc tgtggggtgc 2820
ctgtggtcct aggctctgtg acaagcgttg caatgggtgt tgtatatact caacagttgt 2880
gtgaggggtc tgcagcctaa gctgtgtgca gtggtaatgg gaggtgtgtg tggtaggaag 2940
tgtgctgtgt aggaggtgca agtgtgcaca cgggctgaga ctgaagctct gtgcaggtgc 3000
acatgggcca gagggctgtg tgtatgtgat gtgtgcaggg gaggaggggc agaggagagg 3060
gtgcagggga agttagggag gggagggggt acaaggaaag gtgtgcaggg gagagggtgc 3120
agggaaaggt ggggagggga gagggtgcag gggaaggtag gcagaggaga gggtgcaggg 3180
gagagggtgc aggggaaggt gtgcagggaa aggtggggag gggagagggt gcaggggaag 3240
gtaggcagag gagagggtgc aggggaaggt gtgcagggga gagggtgcag ggaaaggtgg 3300
ggaggggaga gggtgcaggg gaaggtaggc agaggagagg gtgcagggga aggtgtgcag 3360
ggaaaggtgg ggagggagag ggtgcagggg aaggtaggca gaggagagag tgcaggggaa 3420
ggtgtgcagg ggagagggtg cagggaaagg tggggagggg agagggtgca ggggaaggta 3480
ggcagacgag agtacaggga aaggtaggga ggagagaagg tgcaggagga ggcaggcaga 3540
agagagggtg caggggaagg tggggagggg agagggtgca gggggaggca ggcagaggag 3600
agggttcagg ggagagggtg caggggaagg tgggcagggg aaggtgggga gtggagagcg 3660
tgcaggggga ggcaggcaga ggagagggtg caggggaagg tgcgtagggg agagggagca 3720
ggggagaggg tgcgggaaga gggtgcaggg gagggtttgc agggagaggg tgcaggggag 3780
agggtgcaag gagaggcagg cagcggagag ggtgcagagg agggtttgca ggggagggca 3840
cctgctttct tgctgtgctc gtatcctggc agtctgccct tgacttccag aaggctctga 3900
ggctgctttt ggagggagga ctttgaggtc tgagcttggg gcggtcacgg aagcactgca 3960
ggagatgcca ggggttctgc tgggctggcg gtgtgacctc ccgggcttgc tgtgaggggt 4020
tggtttcctg ggaagtgtgt gctttaagga ccctcagtgg gtggttcccc tgggtcaagg 4080
actttccttg gagtgtcctc caccgcaaag gacttcttca aggaccccct ggccatcccc 4140
catgggtgtg tgcctcatgc tgtatcggtt cccgaggaaa ctgccaaaca gtcaaacctg 4200
gggcctctgg ctgtgcttca cccatggaga gggaataggt ggcaggctaa gaggactgtc 4260
cctgccactg cctctggggc cttagcgggg aggaatcctg agggagctgg ggtgcagaaa 4320
cttaggcttg atccccacat ccccacttcc actgtgtccc tgcagcaggg aggggagtag 4380
acagtcagtg cctgttggat aaacagggtg accctgtggc atccagtgag gagaggcccc 4440
tggggccctg ggctgccaag gaagaggctc tgggcttctc cctgcagcca cctcactgag 4500
gagctttggg agacttgagg tgtgtgtggc tgctgctacg ggctgggaaa ggacatggga 4560
cccgagacct ccatccccac cgggcgctgt tcaccctccg gcctcacaac cgcagggcga 4620
ggctaagctg agggttcccg aggtgtttcc cgaggtgttt cgaggtgtct gtgctcacgt 4680
gcactcctga ctgtaaccag acgtgggcca gagctgggca ccccccctcg actgcatcca 4740
gacatggtta gagctgggca cccccccccc ccgactgtat ccagacatgg tcagagctga 4800
gcacccctcc ccgactgtat ccagacatgt tcagagctgg gcaccccccc ccgactgtat 4860
ccagacatgt tcagagctgg gcaccccccc ccgactgtat ccagacatgg tcagagctgg 4920
gcaccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 4980
gacatggtca gagctgagca cccccccccg cccgactgta tccagacatg gtcagagctg 5040
ggcacccccc gactgcatcc agacatggtc agagctgggc acccccctcc ccgactgcat 5100
tcagacatgg tcagagctgg gcacccccgc cgactgcatc cagacatggt cagagttggg 5160
cacccccccc ccgactgtat ccagacatgg tcagagctgg gcaccccccg actgcatcca 5220
gacatggtca gagctgggca cccctccccg actgtatcca gacatggtca gagctgggca 5280
cccccccccg actgtatcca gacatggtca gagctgggca cctccccccg actgtatcca 5340
gacatggtca gagctgggca cctcccccga ctgcatccag acatggtcag agctgggcac 5400
cccccccgac tgcatccaga catggtcaga gctgggcacc cccccccccc actgtatcca 5460
gacatggtca gagctgggca cccccctccc cgactgcatc cagacatggt cagagctgag 5520
cacccccccc ccccgactgt atccagacat ggtcagagct gggcaccccc ctccccgact 5580
gtatccagac atggtcagag ctgagccccc cccccgcccg actgtatcca gacatggtca 5640
gagctgggca ccccccgact gcatccagac atggtcagag ctgagcaccc ctccccgact 5700
gcatccagac atggtcagag ctgggcaccc ccccccccca ccgactgtat ccagacatgg 5760
tcagagctgg gcaaccccca ccgactgtat ccagacatgg tcagagctgg gcaccccccg 5820
actgcatcca gacatggtca gagctgggca ccccccgccg actgtatcca gacatggtca 5880
gagctgggca cccccctccc cgactgcatc cagacatggt cagagctggg cacccccctc 5940
cccgactgca tccagacatg gtcagagctg ggcacccctc cccgactgta tccagacatg 6000
gtcagagctg ggcacccccc tccccgactg tatccagaca tggtcagagc tgggcacccc 6060
cgccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc cagacatggt 6120
cagagctggg cacccctccc cgactgtatc cagacatggt cagagctggg cacccccccc 6180
ccccgactgt atccagacat ggtcagagct gagcacccct ccccgactgt atccagacat 6240
gttcagagct gggcaccccc ccccccgact gtatccagac atggtcagag ctgggcaccc 6300
ccctccccga ctgcatccag acatggtcag agctgagcac cccccccgcc cgactgcatc 6360
cagacatggt cagagctggg caccccccga ctgcatccag acatggtcag agctgggcac 6420
ccccctcccc gactgcattc agacatggtc agagctgggc acccccctcc ccgactgcat 6480
ccagacatgg tcagagctgg gcacccccgc cgactgtatc cagacatggt cagagctggg 6540
cacccccctc cccgactgta tccagacatg gtcagagctg ggcacccccg ccgactgtat 6600
ccagacatgg tcagagctgg gcacccccct ccccgactgc atccagacat gttcagagct 6660
gggcaccccc ccccgactgt atccagacat ggtcagagct gggcaccccc cgactgcatc 6720
cagacatggt cagagctggg caaccccctc cctgactgca tccagacatg gtcagagctg 6780
ggcacccccc ccggctgtat ccagacatgg tcagagctgg gcaccccccc cccccgactg 6840
catccagaca tggtcagagc taagcaaagc cccccgccga ctgtatccag acatggtcag 6900
agctgggcac ccccacccca actgcatcca gacatggtca gagctgagca ccccccaccg 6960
actgtatcca gacatggtca gagctgggca tctcccatgg tgtaggttac atcactcaca 7020
cccctgcccc aaggccaggc tgtgtctctg gcactgcagc accccctgca gtggcagctc 7080
tgttgaaggg gacagccagg agtgaggcca actgccatgt cgggagacag ggtcccacct 7140
agtgttcgtc cactgcaccc tggggccgtc atggtggccc cagggccggt ggaggtgatc 7200
ctggacttga tggcccctcc ccgtggtcct gggctgcgtg aagtggtgcc cattctggcc 7260
acgtgtgagg ggctcaaaga gacaccctgc tggcctccga gaactctgcc agcatccatg 7320
cggctgctca gggtcgcatc tggtcagggc cagtgctgtc tgtggccggc agttactggt 7380
taactcatcc tgttcctgtt taacttgttc cctggggatg gcggcagcct ctgacctgtc 7440
caggtgccct gtccagctga ctgcaaggac agagaggagt cctgcccagc tcttggatca 7500
gtctgctggc cgaggagccc ggtggagcca ggggtgaccc tggagcccag cctgccccga 7560
ggaggccccg gctcagagcc atgccaggta ggcaggtcag agagggatgg gcttgaattc 7620
cccactccca cctcctgccc ctcaggctgg ctccacattg tgcatcctgc tcttatccca 7680
ggcactctgc ctggccacat gccgggggta caaaggcccc tgctcacccc tcccactggg 7740
cccttggccc tgaaaccagg gcgagtggtg aggatgagcc ctgcaccctc tcctgcccca 7800
gaccaggctc atgagggtca gtaaagccca ggaatgctag gagtgggcac tgctggggcc 7860
cacagcaggg tgtggccgat gtgagctggc aggagaccat accctactga gaagatggtg 7920
gtttgacctc ccgctagggc tcatcaccct gatgtaaaga tgaacaagtt caggcctcag 7980
gtggtgggga gggcttgcct gtggccagga gcagagggcc ccaagacccc caaggcagga 8040
atgaggccaa ctgctccagg ctcccagctg tgcccatcca ggtggaaggt gctggcacac 8100
tgggcatctg ggtccccaaa cccactggtg cccacactct ctgcagattc cccagcagag 8160
gcaggccagg ctgaggggtg cagtgcccgg cccctcctat gagacaggca tcatggtgtc 8220
accaggggtg ggcaacaggt gcatctggga aatggggggc tggactcaca tcctgggtgg 8280
acaagcagcc agatggggct tgagcgtggg cctggggcag ctcaactgtg gccactgctc 8340
tctgtcccct cagcacaggg tgggcggaac acccaaagcc tggccactac tggggaaaga 8400
cgtgccaagt gctaagcctg tccccatggg actcgtggac agacatggtg tgactgccaa 8460
gccacacaga ggccttattt cttcctgcac cacggaccac tgtggaggtg gtggggccag 8520
gcaccctggc acagctgacc cactgtgtcc tctctcttca ggtgtctgtg atagggcccc 8580
tgacttcctc tccccgtctg aagaccaggt gctgaggcct gccttgggca gctcagtggc 8640
tctgaactgc acggcttggg tagtctctgg gccccactgc tccctgcctt cagtccagtg 8700
gctgaaagac gggcttccat tgggaattgg gggccactac agcctccacg agtactcctg 8760
gtaagagacc cgggtatcca gggtcagagt gacctctcag acatgccaag ggcagtggtc 8820
tccctgacct atgcctgggt ctgtaaccac ctggccagac atgtcacgag cagagtgcct 8880
ctgtggaccc agacggaggg tcagtaatgt cagggacaga cccttgggtc tgcatggccc 8940
ctgtaggcac acacctcgta actgcccagg gctacgggtg tcagcaaagt ctagggtctg 9000
aatgaacacc gaccagctgg ccaagtctgt gatcaaagga cctccaggcc ccagacccag 9060
gactgggacg gctgttctga aacaaatctg catcccctcc aggttcaggt cacttctctt 9120
ggcttaaggc ccaagaacca cccaggaggc ccaattctgc agcctccctg ggtgaaccca 9180
gacaggtggg gttcgggggt gtccactggt atccccagtc gaccctgacc ctggcttggt 9240
atccccaggg tcaaggccaa cctgtcagag gtgcttgtgt ccagtgtcct gggggtcaac 9300
gtgaccagca ctgaagtcta tggggccttc acctgctcca tccagaacat cagcttctcc 9360
tccttcactc ttcagagagc tggtgatggg ggttccccaa ggtggagggt agaaggggac 9420
ctagacctag tgaggcccag ggatcttgag gcttgggggc tgctggaggg gcagcggctc 9480
aggcaaccca tccgcaggcc ctacaagcca cgtggctgcg gtgctggcct ccctcctggt 9540
cctgctggcc ctgctgctgg ccgccctgct ctatgtcaag tgccgtctca acgtgctgct 9600
ctggtaccag gacgcgtatg gggaggtgga gataaacggt gcgtggggcc cgcgtgggcg 9660
cgaggagggg tcgccacggc ctccctgaga gtgcgctgct gagctcggct ttggaggcgt 9720
gcggcgggga ggggttagcc cccgggtgct ctgtgcggcc cggctggggt taaagtccgg 9780
ggcgggtctg cccctgtgca cgtgggagat ggttaggggt gttggggacc ccgagggctg 9840
gtgtgaggcc tcgggagcca tcggggtgac tggccgccgt ccgcagacgg gaagctctac 9900
gacgcctacg tctcctacag cgactgcccc gaggaccgca agttcgtgaa cttcatccta 9960
agccgcagct ggagcggcgt cggggctaca agctcttcct ggacgaccgc gacctcctgc 10020
cgcgcgctgg tatcccgggc cccaccccgt gccccgccca cccggagggc ccgccccgcc 10080
ccgccccatg ctccgtccca cccggggccc cacccccacc atcgagctcc gcccccatcc 10140
ccgcccaccc gaggccccgc ctcaaaaacc cgcccacccc gcaggccccg cccctccctt 10200
agagctctgc gtccggcacc gcccctgagc ctccggcccc gccctccccc gcccccgccc 10260
ctgcgccgcc gacgcccgcc ctcccgcaga gccctccgcc gacctcttgg tgaacctgag 10320
ccgctgccga cgcctcatcg tggtgctttc ggacgccttc ctgagccggg cctggtgcag 10380
ccacagcttc cggtgggtcc cgcgcggggt tgggtgggcc ccagcgtagc acccaccccc 10440
ctgacggtcc cgccccgcag ggagggcctg tgccggctgc tggagctcac ccgcagaccc 10500
atcttcatca ccttcgaggg ccagaggcgc gaccccgcgc acccggcgct ccgcctgctg 10560
cgccagcacc gccacctggt gaccttgctg ctctggaggc ccggctccgt ggtgcggagc 10620
aggcgcggga gggtccgggg ctagcggcgg gttagagatg ggcggtgccc gggctccagg 10680
ctgggacccc tccgtgggga gctctgcggc accacgcttt gtgaatgggc cctgggggga 10740
ggttccgctg cctggggccc cgatgcgggg agccgccctt gaggcccccg gagccacgga 10800
atagctgtcg cagggcgtgg aacccgtggg cagccgcagg tgtgctcttg ggggccagga 10860
cgccaggggc ttccgaggtg ttcacacctg caaaccgccc cgacctggcc cccagactcc 10920
ttcctccgat ttttggaaag aagtgcagct ggcgctgccg cggaaggtgc agtacaggcc 10980
tgtggaagga gacccccaga cgcagctgca ggacgacaag gaccccatgc tgattcttcg 11040
aggccgagtc cctgagggcc gggccctgga ctcagaggtg gacccggacc ctgagggcga 11100
cctgggtatg cccgcccagc cccactcccc aactggagaa gctcagcaca gggcggagtg 11160
ggggcaggca cagggcacag ggcctggagg ggctccaggt gttgaggact cttcccggca 11220
ccgggagccc ctgcacggcc tctgccctgg aggtgctcgg ccctcggtct gcctgggaac 11280
ttcctgggcc tcacaggcca tcacagcagg gggtgagcag gggcagcccc tggcagtggg 11340
tctgggccaa ggctgtgggt ggccacctca ggcgtctcgg tctccccacc ccaggtgtcc 11400
gggggcctgt ctttggagag ccatcagctc caccgcacac cagtggggtc tcgctgggag 11460
agagccggag cagcgaagtg gacgtctcgg atctcggctc gcgaaactac agtgcccgca 11520
cagacttcta ctgcctggtg tccaaggatg atatgtagct cccaccccag agtgcaggat 11580
catagggaca gcgggggcca gggcagcggc gtcgctcctc tgctcaacag gaccacaacc 11640
cctgccagca gccctgggac cctgccagca gccctgggaa aaggctgtgg cctcagggcg 11700
cctcccagtg ccagaaaata aagtcctttt ggattctg 11738
<210> 3
<211> 1230
<212> DNA
<213> 智人(Homo sapien)
<220>
<223> 野生型SIGIRR mRNA
<400> 3
augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60
aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120
cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180
cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240
aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300
cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360
gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420
aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480
gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540
gugaacuuca uccuaaagcc gcagcuggag cggcgucggg gcuacaagcu cuuccuggac 600
gaccgcgacc uccugccgcg cgcugagccc uccgccgacc ucuuggugaa ccugagccgc 660
ugccgacgcc ucaucguggu gcuuucggac gccuuccuga gccgggccug gugcagccac 720
agcuuccggg agggccugug ccggcugcug gagcucaccc gcagacccau cuucaucacc 780
uucgagggcc agaggcgcga ccccgcgcac ccggcgcucc gccugcugcg ccagcaccgc 840
caccugguga ccuugcugcu cuggaggccc ggcuccguga cuccuuccuc cgauuuuugg 900
aaagaagugc agcuggcgcu gccgcggaag gugcaguaca ggccugugga aggagacccc 960
cagacgcagc ugcaggacga caaggacccc augcugauuc uucgaggccg agucccugag 1020
ggccgggccc uggacucaga gguggacccg gacccugagg gcgaccuggg uguccggggg 1080
ccugucuuug gagagccauc agcuccaccg cacaccagug gggucucgcu gggagagagc 1140
cggagcagcg aaguggacgu cucggaucuc ggcucgcgaa acuacagugc ccgcacagac 1200
uucuacugcc ugguguccaa ggaugauaug 1230
<210> 4
<211> 645
<212> DNA
<213> 智人(Homo sapien)
<220>
<223> 变异(c.557delA) SIGIRR mRNA
<400> 4
augccaggug ucugugauag ggccccugac uuccucuccc cgucugaaga ccaggugcug 60
aggccugccu ugggcagcuc aguggcucug aacugcacgg cuuggguagu cucugggccc 120
cacugcuccc ugccuucagu ccaguggcug aaagacgggc uuccauuggg aauugggggc 180
cacuacagcc uccacgagua cuccuggguc aaggccaacc ugucagaggu gcuugugucc 240
aguguccugg gggucaacgu gaccagcacu gaagucuaug gggccuucac cugcuccauc 300
cagaacauca gcuucuccuc cuucacucuu cagagagcug gcccuacaag ccacguggcu 360
gcggugcugg ccucccuccu gguccugcug gcccugcugc uggccgcccu gcucuauguc 420
aagugccguc ucaacgugcu gcucugguac caggacgcgu auggggaggu ggagauaaac 480
gacgggaagc ucuacgacgc cuacgucucc uacagcgacu gccccgagga ccgcaaguuc 540
gugaacuuca uccuaagccg cagcuggagc ggcgucgggg cuacaagcuc uuccuggacg 600
accgcgaccu ccugccgcgc gcugagcccu ccgccgaccu cuugg 645
<210> 5
<211> 1233
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 野生型SIGIRR cDNA
<400> 5
atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60
aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120
cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattgggggc 180
cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240
agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300
cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360
gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420
aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480
gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540
gtgaacttca tcctaaagcc gcagctggag cggcgtcggg gctacaagct cttcctggac 600
gaccgcgacc tcctgccgcg cgctgagccc tccgccgacc tcttggtgaa cctgagccgc 660
tgccgacgcc tcatcgtggt gctttcggac gccttcctga gccgggcctg gtgcagccac 720
agcttccggg agggcctgtg ccggctgctg gagctcaccc gcagacccat cttcatcacc 780
ttcgagggcc agaggcgcga ccccgcgcac ccggcgctcc gcctgctgcg ccagcaccgc 840
cacctggtga ccttgctgct ctggaggccc ggctccgtga ctccttcctc cgatttttgg 900
aaagaagtgc agctggcgct gccgcggaag gtgcagtaca ggcctgtgga aggagacccc 960
cagacgcagc tgcaggacga caaggacccc atgctgattc ttcgaggccg agtccctgag 1020
ggccgggccc tggactcaga ggtggacccg gaccctgagg gcgacctggg tgtccggggg 1080
cctgtctttg gagagccatc agctccaccg cacaccagtg gggtctcgct gggagagagc 1140
cggagcagcg aagtggacgt ctcggatctc ggctcgcgaa actacagtgc ccgcacagac 1200
ttctactgcc tggtgtccaa ggatgatatg tag 1233
<210> 6
<211> 648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 变异(c.557delA) SIGIRR cDNA
<400> 6
atgccaggtg tctgtgatag ggcccctgac ttcctctccc cgtctgaaga ccaggtgctg 60
aggcctgcct tgggcagctc agtggctctg aactgcacgg cttgggtagt ctctgggccc 120
cactgctccc tgccttcagt ccagtggctg aaagacgggc ttccattggg aattgggggc 180
cactacagcc tccacgagta ctcctgggtc aaggccaacc tgtcagaggt gcttgtgtcc 240
agtgtcctgg gggtcaacgt gaccagcact gaagtctatg gggccttcac ctgctccatc 300
cagaacatca gcttctcctc cttcactctt cagagagctg gccctacaag ccacgtggct 360
gcggtgctgg cctccctcct ggtcctgctg gccctgctgc tggccgccct gctctatgtc 420
aagtgccgtc tcaacgtgct gctctggtac caggacgcgt atggggaggt ggagataaac 480
gacgggaagc tctacgacgc ctacgtctcc tacagcgact gccccgagga ccgcaagttc 540
gtgaacttca tcctaagccg cagctggagc ggcgtcgggg ctacaagctc ttcctggacg 600
accgcgacct cctgccgcgc gctgagccct ccgccgacct cttggtga 648
<210> 7
<211> 410
<212> PRT
<213> 智人(Homo sapien)
<220>
<223> 野生型SIGIRR蛋白
<400> 7
Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu
1 5 10 15
Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys
20 25 30
Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln
35 40 45
Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu
50 55 60
His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser
65 70 75 80
Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe
85 90 95
Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg
100 105 110
Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val
115 120 125
Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu
130 135 140
Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn
145 150 155 160
Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu
165 170 175
Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg
180 185 190
Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala
195 200 205
Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu
210 215 220
Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His
225 230 235 240
Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro
245 250 255
Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala
260 265 270
Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp
275 280 285
Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln
290 295 300
Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro
305 310 315 320
Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly
325 330 335
Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro
340 345 350
Glu Gly Asp Leu Gly Val Arg Gly Pro Val Phe Gly Glu Pro Ser Ala
355 360 365
Pro Pro His Thr Ser Gly Val Ser Leu Gly Glu Ser Arg Ser Ser Glu
370 375 380
Val Asp Val Ser Asp Leu Gly Ser Arg Asn Tyr Ser Ala Arg Thr Asp
385 390 395 400
Phe Tyr Cys Leu Val Ser Lys Asp Asp Met
405 410
<210> 8
<211> 504
<212> PRT
<213> 智人(Homo sapien)
<220>
<223> 野生型SIGIRR亚型蛋白
<400> 8
Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu
1 5 10 15
Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys
20 25 30
Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln
35 40 45
Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu
50 55 60
His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser
65 70 75 80
Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe
85 90 95
Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg
100 105 110
Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val
115 120 125
Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu
130 135 140
Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn
145 150 155 160
Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu
165 170 175
Asp Arg Lys Phe Val Asn Phe Ile Leu Lys Pro Gln Leu Glu Arg Arg
180 185 190
Arg Gly Tyr Lys Leu Phe Leu Asp Asp Arg Asp Leu Leu Pro Arg Ala
195 200 205
Glu Pro Ser Ala Asp Leu Leu Val Asn Leu Ser Arg Cys Arg Arg Leu
210 215 220
Ile Val Val Leu Ser Asp Ala Phe Leu Ser Arg Ala Trp Cys Ser His
225 230 235 240
Ser Phe Arg Glu Gly Leu Cys Arg Leu Leu Glu Leu Thr Arg Arg Pro
245 250 255
Ile Phe Ile Thr Phe Glu Gly Gln Arg Arg Asp Pro Ala His Pro Ala
260 265 270
Leu Arg Leu Leu Arg Gln His Arg His Leu Val Thr Leu Leu Leu Trp
275 280 285
Arg Pro Gly Ser Val Thr Pro Ser Ser Asp Phe Trp Lys Glu Val Gln
290 295 300
Leu Ala Leu Pro Arg Lys Val Gln Tyr Arg Pro Val Glu Gly Asp Pro
305 310 315 320
Gln Thr Gln Leu Gln Asp Asp Lys Asp Pro Met Leu Ile Leu Arg Gly
325 330 335
Arg Val Pro Glu Gly Arg Ala Leu Asp Ser Glu Val Asp Pro Asp Pro
340 345 350
Glu Gly Asp Leu Gly Met Pro Ala Gln Pro His Ser Pro Thr Gly Glu
355 360 365
Ala Gln His Arg Ala Glu Trp Gly Gln Ala Gln Gly Thr Gly Pro Gly
370 375 380
Gly Ala Leu Gly Val Glu Asp Ser Ser Arg His Arg Glu Pro Leu His
385 390 395 400
Gly Leu Cys Pro Gly Gly Ala Arg Pro Ser Val Cys Leu Gly Thr Ser
405 410 415
Trp Ala Ser Gln Ala Ile Thr Ala Gly Gly Glu Gln Gly Gln Pro Leu
420 425 430
Ala Val Gly Leu Gly Gln Gly Cys Gly Trp Pro Pro Gln Ala Ser Arg
435 440 445
Ser Pro His Pro Arg Cys Pro Gly Ala Cys Phe Trp Arg Ala Ile Ser
450 455 460
Ser Thr Ala His Gln Trp Gly Leu Ala Gly Arg Glu Pro Glu Gln Arg
465 470 475 480
Ser Gly Arg Leu Gly Ser Arg Leu Ala Lys Leu Gln Cys Pro His Arg
485 490 495
Leu Leu Leu Pro Gly Val Gln Gly
500
<210> 9
<211> 215
<212> PRT
<213> 智人(Homo sapien)
<220>
<223> 变异SIGIRR (c.557delA)
<400> 9
Met Pro Gly Val Cys Asp Arg Ala Pro Asp Phe Leu Ser Pro Ser Glu
1 5 10 15
Asp Gln Val Leu Arg Pro Ala Leu Gly Ser Ser Val Ala Leu Asn Cys
20 25 30
Thr Ala Trp Val Val Ser Gly Pro His Cys Ser Leu Pro Ser Val Gln
35 40 45
Trp Leu Lys Asp Gly Leu Pro Leu Gly Ile Gly Gly His Tyr Ser Leu
50 55 60
His Glu Tyr Ser Trp Val Lys Ala Asn Leu Ser Glu Val Leu Val Ser
65 70 75 80
Ser Val Leu Gly Val Asn Val Thr Ser Thr Glu Val Tyr Gly Ala Phe
85 90 95
Thr Cys Ser Ile Gln Asn Ile Ser Phe Ser Ser Phe Thr Leu Gln Arg
100 105 110
Ala Gly Pro Thr Ser His Val Ala Ala Val Leu Ala Ser Leu Leu Val
115 120 125
Leu Leu Ala Leu Leu Leu Ala Ala Leu Leu Tyr Val Lys Cys Arg Leu
130 135 140
Asn Val Leu Leu Trp Tyr Gln Asp Ala Tyr Gly Glu Val Glu Ile Asn
145 150 155 160
Asp Gly Lys Leu Tyr Asp Ala Tyr Val Ser Tyr Ser Asp Cys Pro Glu
165 170 175
Asp Arg Lys Phe Val Asn Phe Ile Leu Ser Arg Ser Trp Ser Gly Val
180 185 190
Gly Ala Thr Ser Ser Ser Trp Thr Thr Ala Thr Ser Cys Arg Ala Leu
195 200 205
Ser Pro Pro Pro Thr Ser Trp
210 215
<210> 10
<211> 30
<212> PRT
<213> 智人(Homo sapien)
<220>
<223> 野生型SIGIRR氨基酸186至215
<400> 10
Lys Pro Gln Leu Glu Arg Arg Arg Gly Tyr Lys Leu Phe Leu Asp Asp
1 5 10 15
Arg Asp Leu Leu Pro Arg Ala Glu Pro Ser Ala Asp Leu Leu
20 25 30
<210> 11
<211> 30
<212> PRT
<213> 智人(Homo sapien)
<220>
<223> 变异SIGIRR氨基酸186至215
<400> 11
Ser Arg Ser Trp Ser Gly Val Gly Ala Thr Ser Ser Ser Trp Thr Thr
1 5 10 15
Ala Thr Ser Cys Arg Ala Leu Ser Pro Pro Pro Thr Ser Trp
20 25 30
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对SIGIRR的正向PCR引物
<400> 12
tcagtggctc tgaactgcac 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对SIGIRR的反向PCR引物
<400> 13
ggtcctgttg agcagaggag 20
<210> 14
<211> 910
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 利纳西普(rilonacept)融合蛋白
<400> 14
Met Val Leu Leu Trp Cys Val Val Ser Leu Tyr Phe Tyr Gly Ile Leu
1 5 10 15
Gln Ser Asp Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met
20 25 30
Arg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys Pro
35 40 45
Leu Phe Glu His Phe Leu Lys Phe Asn Tyr Ser Thr Ala His Ser Ala
50 55 60
Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu
65 70 75 80
Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys
85 90 95
Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr
100 105 110
Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro
115 120 125
Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Pro Met Lys Leu
130 135 140
Pro Val His Lys Leu Tyr Ile Glu Tyr Gly Ile Gln Arg Ile Thr Cys
145 150 155 160
Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Thr Ile Thr
165 170 175
Trp Tyr Met Gly Cys Tyr Lys Ile Gln Asn Phe Asn Asn Val Ile Pro
180 185 190
Glu Gly Met Asn Leu Ser Phe Leu Ile Ala Leu Ile Ser Asn Asn Gly
195 200 205
Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Thr Phe His
210 215 220
Leu Thr Arg Thr Leu Thr Val Lys Val Val Gly Ser Pro Lys Asn Ala
225 230 235 240
Val Pro Pro Val Ile His Ser Pro Asn Asp His Val Val Tyr Glu Lys
245 250 255
Glu Pro Gly Glu Glu Leu Leu Ile Pro Cys Thr Val Tyr Phe Ser Phe
260 265 270
Leu Met Asp Ser Arg Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys
275 280 285
Pro Asp Asp Ile Thr Ile Asp Val Thr Ile Asn Glu Ser Ile Ser His
290 295 300
Ser Arg Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys
305 310 315 320
Val Thr Ser Glu Asp Leu Lys Arg Ser Tyr Val Cys His Ala Arg Ser
325 330 335
Ala Lys Gly Glu Val Ala Lys Ala Ala Lys Val Lys Gln Lys Val Pro
340 345 350
Ala Pro Arg Tyr Thr Val Ser Gly Gly Ala Pro Met Leu Ser Glu Ala
355 360 365
Asp Lys Cys Lys Glu Arg Glu Glu Lys Ile Ile Leu Val Ser Ser Ala
370 375 380
Asn Glu Ile Asp Val Arg Pro Cys Pro Leu Asn Pro Asn Glu His Lys
385 390 395 400
Gly Thr Ile Thr Trp Tyr Lys Asp Asp Ser Lys Thr Pro Val Ser Thr
405 410 415
Glu Gln Ala Ser Arg Ile His Gln His Lys Glu Lys Leu Trp Phe Val
420 425 430
Pro Ala Lys Val Glu Asp Ser Gly His Tyr Tyr Cys Val Val Arg Asn
435 440 445
Ser Ser Tyr Cys Leu Arg Ile Lys Ile Ser Ala Lys Phe Val Glu Asn
450 455 460
Glu Pro Asn Leu Cys Tyr Asn Ala Gln Ala Ile Phe Lys Gln Lys Leu
465 470 475 480
Pro Val Ala Gly Asp Gly Gly Leu Val Cys Pro Tyr Met Glu Phe Phe
485 490 495
Lys Asn Glu Asn Asn Glu Leu Pro Lys Leu Gln Trp Tyr Lys Asp Cys
500 505 510
Lys Pro Leu Leu Leu Asp Asn Ile His Phe Ser Gly Val Lys Asp Arg
515 520 525
Leu Ile Val Met Asn Val Ala Glu Lys His Arg Gly Asn Tyr Thr Cys
530 535 540
His Ala Ser Tyr Thr Tyr Leu Gly Lys Gln Tyr Pro Ile Thr Arg Val
545 550 555 560
Ile Glu Phe Ile Thr Leu Glu Glu Asn Lys Pro Thr Arg Pro Val Ile
565 570 575
Val Ser Pro Ala Asn Glu Thr Met Glu Val Asp Leu Gly Ser Gln Ile
580 585 590
Gln Leu Ile Cys Asn Val Thr Gly Gln Leu Ser Asp Ile Ala Tyr Trp
595 600 605
Lys Trp Asn Gly Ser Val Ile Asp Glu Asp Asp Pro Val Leu Gly Glu
610 615 620
Asp Tyr Tyr Ser Val Glu Asn Pro Ala Asn Lys Arg Arg Ser Thr Leu
625 630 635 640
Ile Thr Val Leu Asn Ile Ser Glu Ile Glu Ser Arg Phe Tyr Lys His
645 650 655
Pro Phe Thr Cys Phe Ala Lys Asn Thr His Gly Ile Asp Ala Ala Tyr
660 665 670
Ile Gln Leu Ile Tyr Pro Val Thr Asn Ser Gly Asp Lys Thr His Thr
675 680 685
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
690 695 700
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
705 710 715 720
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
725 730 735
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
740 745 750
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
755 760 765
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
770 775 780
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
785 790 795 800
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
805 810 815
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
820 825 830
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
835 840 845
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
850 855 860
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
865 870 875 880
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
885 890 895
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
900 905 910
<210> 15
<211> 116
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对IL-6R的抗体的重链可变区
<400> 15
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Arg Phe Thr Phe Asp Asp Tyr
20 25 30
Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Gly Ile Ser Trp Asn Ser Gly Arg Ile Gly Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Glu Asn Ser Leu Phe
65 70 75 80
Leu Gln Met Asn Gly Leu Arg Ala Glu Asp Thr Ala Leu Tyr Tyr Cys
85 90 95
Ala Lys Gly Arg Asp Ser Phe Asp Ile Trp Gly Gln Gly Thr Met Val
100 105 110
Thr Val Ser Ser
115
<210> 16
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对IL-6R的抗体的轻链可变区
<400> 16
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Ser Trp
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Gly Ala Ser Ser Leu Glu Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Ser Tyr Tyr Cys Gln Gln Ala Asn Ser Phe Pro Tyr
85 90 95
Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105

Claims (100)

1.一种用于鉴定患有早期发作型炎症性肠病或具有显现早期发作型炎症性肠病的风险的人受试者的方法,其中所述方法包括在从所述受试者获得的样品中检测以下各物的存在性或不存在性:
SIGIRR蛋白,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;和/或
编码SIGIRR蛋白的核酸分子,所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;
其中存在所述截短SIGIRR蛋白和/或编码所述截短SIGIRR蛋白的所述核酸分子指示所述受试者患有早期发作型炎症性肠病或具有显现早期发作型炎症性肠病的风险。
2.根据权利要求1所述的方法,其中相较于野生型SIGIRR蛋白,在对应于根据SEQ IDNO:9的位置186至209和211至215的位置中的任一者处,所述截短SIGIRR蛋白都包含不同氨基酸。
3.根据权利要求1或2所述的方法,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
4.根据权利要求1至3中任一项所述的方法,其中如果所述人受试者展现早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者鉴定为患有早期发作型炎症性肠病。
5.根据权利要求1至4中任一项所述的方法,其中所述方法是体外方法。
6.根据权利要求1至5中任一项所述的方法,其中用对截短SIGIRR具有特异性的抗体检测所述样品中所述截短SIGIRR蛋白的存在性或不存在性。
7.根据权利要求6所述的方法,其中对截短SIGIRR具有特异性的所述抗体对以下各物具有特异性:
i)在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸;或
ii)由于框移突变而在所述SIGIRR蛋白中创建的表位,所述框移突变导致丝氨酸在对应于根据SEQ ID NO:9的位置186的位置处。
8.根据权利要求6或7所述的方法,其中所述检测还包括将对截短SIGIRR具有特异性的所述抗体的反应与对野生型SIGIRR具有特异性的抗体的反应进行比较。
9.根据权利要求1至8中任一项所述的方法,其中通过酶联免疫吸附测定(ELISA)来检测所述样品中所述截短SIGIRR蛋白的存在性或不存在性。
10.根据权利要求1至9中任一项所述的方法,其中通过确定所述核酸分子中是否存在创建编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的框移突变来检测所述样品中编码所述截短SIGIRR蛋白的所述核酸分子的存在性或不存在性。
11.根据权利要求1至10中任一项所述的方法,其中所述检测步骤包括对编码SIGIRR蛋白的所述核酸分子的至少一部分测序,其中测序的核酸分子编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白。
12.根据权利要求11所述的方法,其中所述核酸分子的测序的所述部分包含涵盖编码对应于根据SEQ ID NO:9的位置186的位置的密码子的多个位置。
13.根据权利要求11或12所述的方法,其中所述检测步骤包括对编码所述SIGIRR蛋白的整个核酸分子测序。
14.根据权利要求1至10中任一项所述的方法,其中所述检测步骤包括:
扩增编码SIGIRR蛋白的所述核酸分子的至少一部分,其中所扩增核酸分子涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的氨基酸的密码子;
用可检测标记对所扩增核酸分子进行标记;
使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及
检测所述可检测标记。
15.根据权利要求14所述的方法,其中所述样品中的所述核酸分子是mRNA,并且所述检测步骤还包括在所述扩增步骤之前使所述mRNA逆转录成cDNA。
16.根据权利要求1至10中任一项所述的方法,其中所述检测步骤包括:
使编码SIGIRR蛋白的核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及
检测所述可检测标记。
17.根据权利要求16所述的方法,其中所述核酸分子存在于从所述人受试者获得的细胞内。
18.根据权利要求1至17中任一项所述的方法,其中所述人受试者小于18岁。
19.根据权利要求1至18中任一项所述的方法,其中所述人受试者被鉴定为患有克罗恩氏病或具有显现克罗恩氏病的风险。
20.一种用于在人受试者中诊断早期发作型炎症性肠病或检测早期发作型炎症性肠病的风险的方法,所述方法包括:
检测从所述人受试者获得的编码SIGIRR蛋白的核酸分子,其中所述SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;和/或
检测从所述人受试者获得的SIGIRR蛋白,其中所述SIGIRR蛋白在对应于根据SEQ IDNO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短;以及
如果所述受试者具有早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为患有早期发作型炎症性肠病,或如果所述受试者不具有早期发作型炎症性肠病的一种或多种症状,那么将所述人受试者诊断为处于早期发作型炎症性肠病的风险下。
21.根据权利要求20所述的方法,其中相较于野生型SIGIRR蛋白,在对应于根据SEQ IDNO:9的位置186至209和211至215的位置中的任一者处,所述截短SIGIRR蛋白都包含不同氨基酸。
22.根据权利要求20或21所述的方法,其中所述截短SIGIRR蛋白在对应于根据SEQ IDNO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
23.根据权利要求20至22中任一项所述的方法,其中用对截短SIGIRR具有特异性的抗体检测所述截短SIGIRR蛋白。
24.根据权利要求23所述的方法,其中对截短SIGIRR具有特异性的所述抗体对以下各物具有特异性:
i)在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸;或
ii)由于框移突变而在所述SIGIRR蛋白中创建的表位,所述框移突变导致丝氨酸在对应于根据SEQ ID NO:9的位置186的位置处。
25.根据权利要求23或24所述的方法,其中所述检测还包括将对截短SIGIRR具有特异性的所述抗体的反应与对野生型SIGIRR具有特异性的抗体的反应进行比较。
26.根据权利要求20至25中任一项所述的方法,其中通过酶联免疫吸附测定(ELISA)来检测所述截短SIGIRR蛋白。
27.根据权利要求20至26中任一项所述的方法,其中通过检测所述核酸分子中的创建编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的框移突变来检测编码所述截短SIGIRR蛋白的所述核酸分子。
28.根据权利要求20至27中任一项所述的方法,其中所述检测步骤包括对编码SIGIRR蛋白的所述核酸分子的至少一部分测序。
29.根据权利要求28所述的方法,其中所述核酸分子的测序的所述部分包含涵盖编码对应于根据SEQ ID NO:9的位置186的位置的密码子的多个位置。
30.根据权利要求20至29中任一项所述的方法,其中所述检测步骤包括对编码所述SIGIRR蛋白的整个核酸分子测序。
31.根据权利要求20至27中任一项所述的方法,其中所述检测步骤包括:
扩增编码SIGIRR蛋白的所述核酸分子的至少一部分,其中所扩增核酸分子涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的氨基酸的密码子;
用可检测标记对所扩增核酸分子进行标记;
使经标记核酸分子与包含探针的支撑物接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及
检测所述可检测标记。
32.根据权利要求31所述的方法,其中所述核酸分子是mRNA,并且所述方法还包括在所述扩增步骤之前使所述mRNA逆转录成cDNA。
33.根据权利要求20至27中任一项所述的方法,其中所述检测步骤包括:
使编码SIGIRR蛋白的所述核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下特异性杂交于涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的核酸序列的核酸序列;以及
检测所述可检测标记。
34.根据权利要求33所述的方法,其中所述核酸分子存在于从所述人受试者获得的细胞内。
35.根据权利要求20至34中任一项所述的方法,其中所述人受试者小于18岁。
36.根据权利要求20至35中任一项所述的方法,其中所述人受试者被鉴定为患有克罗恩氏病或具有显现克罗恩氏病的风险。
37.根据权利要求20至36中任一项所述的方法,其中所述方法还包括当在所述受试者中检测到改变,并且所述受试者被诊断为患有早期发作型炎症性肠病时,用有效治疗早期发作型炎症性肠病的药剂治疗所述受试者。
38.根据权利要求20至37中任一项所述的方法,其中所述人受试者小于18岁。
39.根据权利要求20至38中任一项所述的方法,其中所述人受试者被鉴定为患有克罗恩氏病或具有显现克罗恩氏病的风险。
40.一种经分离核酸分子,所述经分离核酸分子包含编码人单免疫球蛋白白介素-1受体相关(SIGIRR)蛋白的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短;或所述核酸序列的互补序列。
41.根据权利要求40所述的经分离核酸分子,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。
42.根据权利要求40或权利要求41所述的经分离核酸分子,其中所述核酸分子包括DNA。
43.根据权利要求40至42中任一项所述的经分离核酸分子,其中所述核酸分子是cDNA。
44.根据权利要求40或权利要求41所述的经分离核酸分子,其中所述核酸分子包括RNA。
45.根据权利要求40至42中任一项所述的经分离核酸分子,其中所述核酸分子是基因组DNA,并且在对应于根据SEQ ID NO:2的位置9962的位置处包含鸟嘌呤。
46.根据权利要求45所述的经分离核酸分子,其中所述核酸分子包含SEQ ID NO:2。
47.根据权利要求40、41和44中任一项所述的经分离核酸分子,其中所述核酸分子是mRNA,并且在对应于根据SEQ ID NO:4的位置557的位置处包含鸟嘌呤。
48.根据权利要求40、41、44和47中任一项所述的经分离核酸分子,其中所述核酸分子是mRNA,并且在分别对应于根据SEQ ID NO:4的位置553至555和556至558的位置处包含密码子CUA和AGC。
49.根据权利要求47所述的经分离核酸分子,其中所述核酸分子包含SEQ ID NO:4。
50.根据权利要求40至49中任一项所述的经分离核酸分子,其中相较于野生型SIGIRR蛋白,在对应于根据SEQ ID NO:9的位置186至209和211至215的位置中的任一者处,所述截短SIGIRR蛋白都包含不同氨基酸。
51.根据权利要求40至50中任一项所述的经分离核酸分子,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
52.根据权利要求40至51中任一项所述的经分离核酸分子,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
53.一种载体,所述载体包含根据权利要求40至52中任一项所述的经分离核酸分子。
54.根据权利要求53所述的载体,其中所述载体是质粒。
55.根据权利要求53所述的载体,其中所述载体是病毒。
56.一种宿主细胞,所述宿主细胞包含根据权利要求40至52中任一项所述的经分离核酸分子。
57.一种宿主细胞,所述宿主细胞包含根据权利要求53至55中任一项所述的载体。
58.根据权利要求56或权利要求57所述的宿主细胞,其中所述核酸序列可操作地连接于在所述宿主细胞中具有活性的启动子。
59.根据权利要求58所述的宿主细胞,其中所述启动子是外源性启动子。
60.根据权利要求58或权利要求59所述的宿主细胞,其中所述启动子是诱导型启动子。
61.根据权利要求56至60中任一项所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞。
62.一种cDNA,所述cDNA包含编码SIGIRR蛋白的核酸序列,其中所述蛋白在对应于根据SEQ ID NO:9的位置215的位置处被截短。
63.根据权利要求62所述的cDNA,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。
64.根据权利要求62或权利要求63所述的cDNA,其中相较于野生型SIGIRR蛋白,在对应于根据SEQ ID NO:9的位置186至209和211至215的位置中的任一者处,所述截短SIGIRR蛋白都包含不同氨基酸。
65.根据权利要求62至64中任一项所述的cDNA,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
66.根据权利要求62至65中任一项所述的cDNA,其中所述截短SIGIRR蛋白包含SEQ IDNO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ IDNO:9的位置186的位置处包含丝氨酸的氨基酸序列。
67.根据权利要求62至66中任一项所述的cDNA,其中所述cDNA在对应于根据SEQ IDNO:6的位置557的位置处包含鸟嘌呤。
68.根据权利要求62至67中任一项所述的cDNA,其中所述cDNA在分别对应于根据SEQID NO:6的位置553至555和556至558的位置处包含密码子CTA和AGC。
69.根据权利要求62至68中任一项所述的cDNA,其中所述cDNA包含SEQ ID NO:6。
70.一种载体,所述载体包含根据权利要求62至69中任一项所述的cDNA。
71.根据权利要求70所述的载体,其中所述载体是质粒。
72.根据权利要求70所述的载体,其中所述载体是病毒。
73.一种宿主细胞,所述宿主细胞包含根据权利要求62至69中任一项所述的cDNA。
74.一种宿主细胞,所述宿主细胞包含根据权利要求70至72中任一项所述的载体。
75.根据权利要求73或权利要求74所述的宿主细胞,其中所述cDNA可操作地连接于在所述宿主细胞中具有活性的启动子。
76.根据权利要求75所述的宿主细胞,其中所述启动子是外源性启动子。
77.根据权利要求75或权利要求76所述的宿主细胞,其中所述启动子是诱导型启动子。
78.根据权利要求73至77中任一项所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞。
79.一种包含截短SIGIRR蛋白的经分离或重组多肽,其中所述蛋白在对应于根据SEQID NO:9的位置215的位置处被截短。
80.根据权利要求79所述的经分离或重组多肽,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。
81.根据权利要求79或权利要求80所述的经分离或重组多肽,其中相较于野生型SIGIRR蛋白,在对应于根据SEQ ID NO:9的位置186至209和211至215的位置中的任一者处,所述截短SIGIRR蛋白都包含不同氨基酸。
82.根据权利要求79至81中任一项所述的经分离或重组多肽,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186至215的位置处包含SEQ ID NO:11的氨基酸序列。
83.根据权利要求56或权利要求57所述的经分离或重组多肽,其中所述截短SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸。
84.根据权利要求79至83中任一项所述的经分离或重组多肽,其中所述截短SIGIRR蛋白包含SEQ ID NO:9的氨基酸序列,或与SEQ ID NO:9具有至少90%序列同一性,并且在对应于根据SEQ ID NO:9的位置186的位置处包含丝氨酸的氨基酸序列。
85.根据权利要求79至84中任一项所述的经分离或重组多肽,其中所述多肽融合于异源性多肽。
86.根据权利要求85所述的经分离或重组多肽,其中所述异源性多肽包括肽纯化标签、荧光蛋白、或肽纯化标签与荧光蛋白两者。
87.根据权利要求79至84中任一项所述的经分离或重组多肽,其中所述多肽连接于可检测标记。
88.根据权利要求87所述的经分离或重组多肽,其中所述可检测标记是荧光标记或放射性标记。
89.一种组合物,所述组合物包含根据权利要求79至88中任一项所述的经分离或重组多肽以及载剂。
90.一种包含核酸序列的探针或引物,所述核酸序列包含至少约15个核苷酸,所述探针或引物特异性杂交于具有编码人SIGIRR蛋白的核酸序列的核酸分子,所述人SIGIRR蛋白在对应于根据SEQ ID NO:9的位置186的位置处具有丝氨酸,并且在对应于根据SEQ ID NO:9的位置215的位置处被截短,或所述探针或引物特异性杂交于编码所述截短人SIGIRR蛋白的所述核酸序列的互补序列。
91.根据权利要求90所述的探针或引物,其中所述探针或引物包括DNA。
92.根据权利要求90所述的探针或引物,其中所述探针或引物包括RNA。
93.根据权利要求90至92中任一项所述的探针或引物,其中所述探针或引物特异性杂交于所述核酸分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分。
94.根据权利要求90至93中任一项所述的探针或引物,其中所述探针或引物在严格条件下特异性杂交于编码所述截短人SIGIRR蛋白的所述核酸序列或它的互补序列。
95.根据权利要求90至94中任一项所述的探针或引物,其中所述探针或引物包含标记。
96.根据权利要求95所述的探针或引物,其中所述标记是荧光标记、放射性标记或生物素。
97.一种支撑物,所述支撑物包含根据权利要求90至94中任一项所述的探针与其连接的基底。
98.根据权利要求97所述的支撑物,其中所述支撑物是微阵列。
99.一种改变特异性探针或引物,所述改变特异性探针或引物包含互补于编码在对应于根据SEQ ID NO:9的位置215的位置处被截短的SIGIRR蛋白的核酸分子的核酸序列的核酸序列,其中所述改变特异性探针或引物包含互补于所述核酸分子的涵盖编码在对应于根据SEQ ID NO:9的位置186的位置处的丝氨酸的密码子的部分的核酸序列。
100.根据权利要求99所述的改变特异性探针或引物,其中所述改变特异性探针或引物包含至少约15个核苷酸。
CN201880071851.1A 2017-09-06 2018-09-05 单免疫球蛋白白介素-1受体相关分子(sigirr)变体及其用途 Pending CN111373053A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762554857P 2017-09-06 2017-09-06
US62/554,857 2017-09-06
PCT/US2018/049478 WO2019050899A1 (en) 2017-09-06 2018-09-05 SINGLE IMMUNOGLOBULIN INTERLEUKIN 1 (SIGIRR) RELATED INTERCEPTOR-RELATED VARIANTS AND USES THEREOF

Publications (1)

Publication Number Publication Date
CN111373053A true CN111373053A (zh) 2020-07-03

Family

ID=63708447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880071851.1A Pending CN111373053A (zh) 2017-09-06 2018-09-05 单免疫球蛋白白介素-1受体相关分子(sigirr)变体及其用途

Country Status (11)

Country Link
US (1) US20210071251A1 (zh)
EP (1) EP3679158A1 (zh)
JP (1) JP7237064B2 (zh)
KR (1) KR20200058435A (zh)
CN (1) CN111373053A (zh)
AU (1) AU2018328120A1 (zh)
CA (1) CA3074652A1 (zh)
IL (1) IL272940B1 (zh)
MX (1) MX2020002643A (zh)
SG (1) SG11202001754RA (zh)
WO (1) WO2019050899A1 (zh)

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US5179017A (en) 1980-02-25 1993-01-12 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US5294533A (en) 1988-07-05 1994-03-15 Baylor College Of Medicine Antisense oligonucleotide antibiotics complementary to the macromolecular synthesis operon, methods of treating bacterial infections and methods for identification of bacteria
US5135917A (en) 1990-07-12 1992-08-04 Nova Pharmaceutical Corporation Interleukin receptor expression inhibiting antisense oligonucleotides
US5271941A (en) 1990-11-02 1993-12-21 Cho Chung Yoon S Antisense oligonucleotides of human regulatory subunit RI.sub.α of cAMP-dependent protein kinases
US5786138A (en) 1993-01-29 1998-07-28 Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College Hyperstabilizing antisense nucleic acid binding agents
AU693097B2 (en) 1993-06-04 1998-06-25 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Method for treating kaposi's sarcoma with antisense oligonucleotides
US5578716A (en) 1993-12-01 1996-11-26 Mcgill University DNA methyltransferase antisense oligonucleotides
US5641754A (en) 1994-01-10 1997-06-24 The Board Of Regents Of The University Of Nebraska Antisense oligonucleotide compositions for selectively killing cancer cells
EP0775204A1 (en) 1994-08-09 1997-05-28 Novartis AG Antitumor antisense oligonucleotides
US5856103A (en) 1994-10-07 1999-01-05 Board Of Regents The University Of Texas Method for selectively ranking sequences for antisense targeting
US5994320A (en) 1995-02-06 1999-11-30 Regents Of The University Of Minnesota Antisense oligonucleotides and methods for treating central nervous system tumors
IT1275862B1 (it) 1995-03-03 1997-10-24 Consiglio Nazionale Ricerche Trascritto antisenso associato ad alcuni tipi di cellule tumorali ed oligodeossinucleotidi sintetici utili nella diagnosi e nel trattamento
US6040296A (en) 1995-06-07 2000-03-21 East Carolina University Specific antisense oligonucleotide composition & method for treatment of disorders associated with bronchoconstriction and lung inflammation
AU7286696A (en) 1995-10-13 1997-05-07 F. Hoffmann-La Roche Ag Antisense oligomers
SK66098A3 (en) 1995-11-21 1998-11-04 Icn Pharmaceuticals Inhibition of tumor growth by antisense oligonucleotides for il-8 and il-8 receptor
US5998602A (en) 1996-02-15 1999-12-07 The Cleveland Clinic Fouindation And Government RNase L activators and antisense oligonucleotides effective to treat RSV infections
US5955590A (en) 1996-07-15 1999-09-21 Worcester Foundation For Biomedical Research Conjugates of minor groove DNA binders with antisense oligonucleotides
US6046004A (en) 1997-02-27 2000-04-04 Lorne Park Research, Inc. Solution hybridization of nucleic acids with antisense probes having modified backbones
JPH1142091A (ja) 1997-07-25 1999-02-16 Toagosei Co Ltd アンチセンス核酸化合物
US6046319A (en) 1997-10-22 2000-04-04 University Technologies International, Inc. Antisense oligodeoxynucleotides regulating expression of TNF-α
IL136696A0 (en) 1997-12-23 2001-06-14 Immunex Corp Sigirr dna and polypeptides
US6007995A (en) 1998-06-26 1999-12-28 Isis Pharmaceuticals Inc. Antisense inhibition of TNFR1 expression
US6013522A (en) 1999-02-23 2000-01-11 Isis Pharmaceuticals Inc. Antisense inhibition of human Smad1 expression
US6025198A (en) 1999-06-25 2000-02-15 Isis Pharmaceuticals Inc. Antisense modulation of Ship-2 expression
US6033910A (en) 1999-07-19 2000-03-07 Isis Pharmaceuticals Inc. Antisense inhibition of MAP kinase kinase 6 expression
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
EP3138911B1 (en) 2012-12-06 2018-12-05 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
WO2018022967A1 (en) 2016-07-28 2018-02-01 Regeneron Pharmaceuticals, Inc. Gpr156 variants and uses thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"rs752858122" *

Also Published As

Publication number Publication date
US20210071251A1 (en) 2021-03-11
WO2019050899A1 (en) 2019-03-14
JP7237064B2 (ja) 2023-03-10
JP2020537495A (ja) 2020-12-24
RU2020112474A (ru) 2021-10-06
RU2020112474A3 (zh) 2021-12-29
IL272940B1 (en) 2024-02-01
IL272940A (en) 2020-04-30
CA3074652A1 (en) 2019-03-14
MX2020002643A (es) 2020-09-25
AU2018328120A1 (en) 2020-03-19
KR20200058435A (ko) 2020-05-27
SG11202001754RA (en) 2020-03-30
EP3679158A1 (en) 2020-07-15

Similar Documents

Publication Publication Date Title
AU2018209950A1 (en) Hydroxysteroid 17-beta dehydrogenase 13 (HSD17B13) variants and uses thereof
US20220073589A1 (en) GPR156 Variants And Uses Thereof
US20220017964A1 (en) Cornulin (CRNN) Variants And Uses Thereof
CN111373053A (zh) 单免疫球蛋白白介素-1受体相关分子(sigirr)变体及其用途
RU2815068C2 (ru) Варианты белка, родственного рецептору интерлейкина-1 и содержащего одиночный домен иммуноглобулина (sigirr), и их применение
US20210230609A1 (en) Solute Carrier Family 14 Member 1 (SLC14A1) Variants And Uses Thereof
JP2003334076A (ja) S−iiタンパク質、festaタンパク質、および、それらの利用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination