CN110913897A - 人内源性逆转录病毒蛋白 - Google Patents

人内源性逆转录病毒蛋白 Download PDF

Info

Publication number
CN110913897A
CN110913897A CN201880047480.3A CN201880047480A CN110913897A CN 110913897 A CN110913897 A CN 110913897A CN 201880047480 A CN201880047480 A CN 201880047480A CN 110913897 A CN110913897 A CN 110913897A
Authority
CN
China
Prior art keywords
sequence
seq
cancer
tumor
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880047480.3A
Other languages
English (en)
Inventor
O·海德曼
T·海德曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gustavus Institute
Institut Gustave Roussy (IGR)
Original Assignee
Gustavus Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gustavus Institute filed Critical Gustavus Institute
Publication of CN110913897A publication Critical patent/CN110913897A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/15Retroviridae, e.g. bovine leukaemia virus, feline leukaemia virus human T-cell leukaemia-lymphoma virus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • C07K16/1036Retroviridae, e.g. leukemia viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/30Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
    • C07K16/3069Reproductive system, e.g. ovaria, uterus, testes, prostate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/54F(ab')2
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses
    • G01N2333/15Retroviridae, e.g. bovine leukaemia virus, feline leukaemia virus, feline leukaemia virus, human T-cell leukaemia-lymphoma virus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Hospice & Palliative Care (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)

Abstract

本申请涉及人内源性逆转录病毒蛋白。该人内源性逆转录病毒蛋白在本文中一般称为HEMO。本申请更具体地涉及脱落形式的HEMO蛋白,更具体地涉及在循环血液中释放的那些脱落形式。本申请还涉及衍生自脱落形式的HEMO的产品,例如抗体、核酸载体和工程改造的细胞,以及涉及这些脱落形式或衍生产品的医学或生物技术应用,更具体地在胎盘发育、胎儿保护、癌症治疗和干细胞生产的领域中的应用。

Description

人内源性逆转录病毒蛋白
领域
本申请涉及人内源性逆转录病毒蛋白,更具体地涉及由基因ERVMER34-1(ORFLP9056)编码的人内源性逆转录病毒蛋白。该人内源性逆转录病毒蛋白在本文中称为人内源性MER34 ORF(Human Endogenous MER34 ORF,即HEMO)。HEMO蛋白在北方兽类(Boreoeutheria)中、更具体地在灵长总目(Euarchontoglires)和劳亚兽总目(Laurasiatheria)中、更具体地在灵长类动物中是保守的。
本申请更具体地涉及脱落形式的HEMO蛋白,更具体地涉及在循环血液中释放的那些脱落形式的HEMO。本申请还涉及衍生自脱落形式HEMO的产品,例如抗体、核酸载体和工程改造的细胞,以及涉及这些脱落形式或衍生产品的医学或生物技术应用,尤其是在胎盘发育、胎儿保护、癌症诊断、癌症治疗和干细胞生产的领域中的应用。
背景
内源性逆转录病毒序列占人基因组的约8%。这些序列(称为人内源性逆转录病毒(Human Endogenous Retrovirus,HERV))与当今的逆转录病毒有很强的相似性,并且是活性逆转录病毒(其随后以孟德尔方式传播)的祖传种系感染的原病毒残体。在人基因组中发现的大于30,000个原病毒拷贝可以分为大约80个不同的家族,其中这些元件中的大多数由于突变、插入、缺失和/或截短的积累而不编码蛋白质。然而,一些逆转录病毒基因仍保留了编码能力,其中一些甚至被远缘的灵长类祖先转换以发挥生理作用。这就是所谓的“合胞素”的情况,即人中的合胞素1和合胞素2,它们是分别捕获25和40Mya的逆转录病毒包膜(env)基因,具有全长蛋白质编码序列、促融合活性和强胎盘表达(Mi等人,2000;Blond等人,2000;Blaise等人,2003;Lavialle等人,2013)。这些基因已被证明参与胎盘的形成,其促融合活性促成母胎-胎儿界面处合体滋养层的形成,这是由于潜在的单核细胞滋养层的合胞素介导的细胞融合的结果。此后,在已搜寻过的所有胎盘哺乳动物中鉴定出合胞素,并通过敲除小鼠的产生和表征证明了它们在胎盘形成中的明确作用。合胞素也存在于有袋动物中,其中它们在短期存在的胎盘(其在胚胎在外部囊中发育之前非常短暂地形成(几天))中表达。
先前对人基因组中编码内源性逆转录病毒Env蛋白的基因的系统搜寻导致鉴定了18个具有全长编码序列的基因(其中有合胞素-1和-2)(de Parseval等人,2003;Villesen等人,2004)。这些分析是使用基于对逆转录病毒Env携带的特征性基序进行搜索的方法进行的,该特征性基序从N-末端到C-末端主要包括:
信号肽,
表面(SU)和跨膜(TM)亚基之间的(经典)弗林蛋白酶切割位点(R-X-R/K-R),其中跨膜(TM)亚基携带额外的特征,包括免疫抑制结构域(ISD,17个氨基酸的基序),在大多数肿瘤逆转录病毒中也发现了该特征,
特征性的C-(X)6-7-C基序,以及
跨膜疏水结构域,其将Env蛋白锚定在细胞或病毒体膜中(de Parseval等人,2005;Henzy等人,2013)。
本申请涉及人内源性逆转录病毒Env蛋白,其共有现有技术的人内源性逆转录病毒Env蛋白的一些但不是全部结构特征,并显示出前所未有的特性,更具体地前所未有的脱落特性。
概述
本申请涉及人内源性逆转录病毒蛋白,其由基因ERVMER34-1(ORF LP9056)编码。该蛋白质在本文中通常称为HEMO,代表人内源性MER34 ORF(Human Endogenous MER34ORF)。
本发明人证明,编码HEMO蛋白的基因进入哺乳动物祖先的基因组的时间超过100Mya,并且HEMO蛋白在北方兽类中、更具体地在灵长总目和劳亚兽总目中、更具体地在灵长总目中、更具体地在灵长类动物中是保守的(参见例如图10B)。
与现有技术的人内源性逆转录病毒Env蛋白相反,人HEMO蛋白缺乏经典的弗林蛋白酶切割位点(其缺乏经典的R-X-R/K-R位点,但显示出不常见的CTQG位点(在图1C中的位置352-355处)),并且缺乏相邻的疏水融合肽(参见图1A、1B和1C)。
HEMO表现出前所未有的特性,更具体地前所未有的脱落特性。实际上,HEMO蛋白的胞外域通过脱落被切割,导致循环血中的HEMO胞外域片段的释放(参见图13)。通过脱落人HEMO产生的主要可溶性片段从信号肽后的第一个氨基酸延伸到(并包括)位置432或433的氨基酸(参见图1C:从位置25、26或27的氨基酸即L到位置432的氨基酸Q或位置433的氨基酸R;参见图13:切割位点n°1)。次要可溶性片段包括人HEMO片段,其从信号肽后的第一个氨基酸延伸到(并包括)选自位置450-480和380-420(参见图13,切割位点n°2和3)和421-449的位置的氨基酸。
HEMO蛋白在干细胞和胎盘中高表达,导致妊娠女性血液中的浓度增加。它还在某些(人)肿瘤中表达,因此提供了病理状态的标志物以及可能地免疫疗法靶标。
HEMO蛋白可以被视为正常细胞的“干细胞特性”标志物,和癌症免疫疗法的“靶标”。
本申请更具体地涉及脱落形式的HEMO蛋白,更具体地涉及在循环血液中释放的脱落形式的HEMO。
本申请还涉及衍生自脱落形式的HEMO的产品,例如抗体、核酸载体和工程改造的细胞。
本申请还涉及这些脱落形式或衍生产物的医学或生物技术应用,特别是在胎盘发育、胎儿保护、癌症治疗和干细胞生产的领域中的应用。
本申请特别涉及用于以下方面的手段:
-癌症诊断,
-肿瘤分型,
-癌症免疫疗法,
-筛选治疗剂,例如筛选可用于治疗癌症(包括减轻或预防癌症)的药剂,或筛选可用于治疗胎盘发育缺陷(例如,胎盘早剥、先兆子痫、子痫)的药剂或筛选可用于胎儿保护(例如,针对病毒或微生物感染的保护)的药剂,
-纯化循环细胞(例如,纯化肿瘤循环细胞或循环滋养层细胞),以及
-产生诱导的多能干细胞(来自体细胞)。
附图简要说明
本申请引用的一些附图是彩色的。提交的申请含有附图的彩色输出,其能够因此通过检查原始申请文件来获得。
图1A、1B、1C和1D:经典逆转录病毒Env蛋白的结构和人HEMO Env的表征。
(A)逆转录病毒Env蛋白的示意图,描绘了SU和TM亚基。显示了两个亚基之间的弗林蛋白酶切割位点(共有序列:R-X-R/K-R)、参与SU–TM相互作用的C-X-X-C基序、疏水信号肽(紫色)、融合肽(绿色)、跨膜域(红色)和推定的免疫抑制结构域(ISD)(蓝色)以及保守的C-X5/6/7-CC基序。
(B)HEMO Env的疏水性特征谱。A中突出显示的经典结构特征已定位并以A中使用的颜色代码显示。突变的弗林蛋白酶位点(CTQG)显示为虚线。
(C)具有相同颜色代码的HEMO Env蛋白的氨基酸序列。
(D)基于逆转录病毒Env蛋白的系统发育树,其中有已鉴定出的HEMO-Env蛋白。最大似然树是使用来自HERV Env的全长SU-TM氨基酸序列(包括HERV-K共有序列)、所有先前鉴定的合胞素以及一系列内源性和感染性逆转录病毒构建的。水平分支的长度与每个位点的氨基酸取代的平均数量成正比(参见左下方的比例尺),并且在节点显示从1,000个重复获得的自举值百分比。ALV,禽白血病病毒;BaEV,狒狒内源性病毒;BLV,牛白血病病毒;Env-Cav1,合胞素样土拨鼠Env1蛋白;FeLV,猫白血病病毒;FIV,猫免疫缺陷病毒;GaLV,长臂猿类白血病病毒;HERV,人内源性逆转录病毒;HIV1,1型HIV;HTLV-2,人2型T淋巴病毒;mIAPE,具有env基因的小家鼠脑池内A型颗粒;JSRV,绵羊肺腺瘤逆转录病毒;KoRV,无尾熊逆转录病毒;MMTV,鼠乳腺肿瘤病毒;MoMLV,莫洛尼氏鼠白血病病毒;MPMV,Mason–Pfizer猴病毒;PERV-A,猪内源性逆转录病毒;RD114,猫内源性C型逆转录病毒;ReV-A,网状内皮细胞增生病毒A型,BIV,牛免疫缺陷病毒;Env-panMars,保守的有袋动物Env-2。
图2A、2B、2C、2D、2E和2F:HEMO env基因的表征。
(A)染色体4(4q12,具有基因组参考合作体的GRCh38装配坐标)上的HEMO基因基因座的示意图。
上图:MER34-int共有序列(Repbase),根据共有氨基酸序列显示了推定的gag、pro和pol逆转录病毒ORF。虚线描绘了在HEMO基因座中发现的MER34序列的一部分。
中图:HEMO基因座(11kb)位于RASL11B基因(约120kb 5')和USP46基因(约120kb3')之间。HEMO env ORF显示为橙色框,在Dfam.org网站上鉴定的重复序列显示为不同的彩色框,其中有义序列在行上方,反义序列在行下方。值得注意的是,该基因是MER34原病毒的一部分,该MER34原病毒仅保留简并的pol序列(大部分方向相反)、截短的推定3'LTR(MER34-A)并且没有5'LTR。没有发现与该基因相距100kb的其他MER34序列。由EMBOSS-newcpgreport软件检测的CpG岛(染色体4:52750911-52751703)表示为绿色框。
下图:从NCBI和RNA转录物预测的内含子-外显子结构:显示了如通过5'和3'RACE实验确定的在胎盘RNA中发现的外显子,其中在下方有主要的E1-E2-E4剪接的env亚基因组转录物。描述了HEMO env ORF的起始位点核苷酸序列(ACTTC...)和受体剪接位点。箭头具体说明了qRT-PCR引物(表4)。
(B)在20种人组织和16种人细胞系的实验组中进行的HEMO转录物的实时qRT-PCR分析。转录物水平以最大百分比表示,并相对于管家基因的量标准化(参见方法)。胎盘值是来自妊娠的第一个三个月的12个样品的平均值,而其他组织则来自商业机构(Zyagen)。
(C)转录起始位点(+1,红色显示的ACTTC)附近的CpG岛启动子序列,其中以绿色突出显示CG二核苷酸。外显子1和外显子2以框体表示。灰色的核苷酸序列代表用于扩增在亚硫酸氢盐处理后分析的两个片段(I和II,左侧的竖线)的引物序列(图E)。
(D)CpG岛启动子的萤光素酶测定。
上图:具有包含外显子E1和E2的CpG岛(绿色)的启动子萤光素酶构建体的示意图。E2在其3'端在供体剪接位点上游缩短28bp,以限制从萤光素酶基因剪接。
下图:每个pGL3构建体中的启动子序列用白框表示,坐标相对于该基因的+1转录起始位点。对照(无)对应于基本pGL3载体,没有插入序列。使用萤光素酶报告基因测定法测定了用pGL3载体转染的293T细胞的裂解液中以光单位(LU)表示的启动子活性。绘制的数据是来自三个独立实验的平均值。
(E)在图C中描绘了通过来自不表达(293T和BeWo细胞)或表达(iPSC和CaCo-2)HEMO基因的细胞系的基因组DNA的亚硫酸氢盐处理以及片段I(26CpG)和II(33CpG)的PCR扩增所显示的HEMO启动子区域的甲基化状态。该图代表了每个PCR扩增片段的10个克隆的测序,其中标明了甲基化(黑色圆圈)和未甲基化(白色圆圈)的CpG。
(F)DNA去甲基化对HEMO基因表达的影响。通过RT-qPCR检测未处理(仅DMSO)或用0.1至5μM的5-氮杂-2'-脱氧胞苷(Aza-dC)处理3天的细胞系(293T,BeWo)中的HEMO基因转录水平,并将其针对管家基因RPLP0进行标准化。数据表示为平均值+/-SEM。星号(*)表示值与未经处理的细胞获得的值显著不同(未配对的双尾t检验;*,P<0.05;***,P<0.001)。
图3:转染的HeLa细胞中HEMO蛋白表达的免疫荧光分析。
用phCMV-HEMO表达载体(或空载体作为阴性对照)转染细胞(HeLa),固定、透化(上图)或未透化(下图),并使用特异性抗HEMO多克隆抗体就HEMO蛋白表达进行染色(参见方法)。上图:phCMV-HEMO转染的细胞相对空载体转染的细胞的特异性染色。下图:连续的共聚焦图像显示了蛋白质在细胞表面的定位。
图4A、4B和4C:脱落的HEMO蛋白的表征。
(A)通过蛋白质印迹分析检测脱落的HEMO Env蛋白。(左)用抗Env-W多克隆抗体检测phCMV-Env-W转染的293T细胞的细胞裂解液中的合胞素-1蛋白。(中间和右边)用抗HEMO多克隆抗体检测phCMV-HEMO转染的293T细胞的细胞裂解液和上清液中(中间)和第一个三个月的胎盘组织和胎盘血液中(右;同一个体的匹配的代表性样品)的两种形式的HEMO蛋白(全长SU-TM和脱落的Env);样品用PNGase F处理(+)或不用PNGase F处理(-)。
(B)脱落的HEMO蛋白的N-和C-末端的质谱测定。从phCMV-HEMO转染的293T细胞的上清液中纯化的脱落Env形式的蛋白质覆盖率在所得肽的胰蛋白酶水解和质谱表征后以绿色字符显示,并且对于胰凝乳蛋白酶水解以下划线字符显示(参见方法)。HEMO N和C-末端用大写字母表示,(*)表示在C中生成和分析的突变体中终止密码子的位置。
(C)突变体HEMO形式的迁移模式,如A中所分析。左:HEMO蛋白的示意图,其中定位了生成的突变体的终止密码子,以及具有重构的弗林蛋白酶位点(H-fur+,具有RTKR弗林蛋白酶位点)的突变体的终止密码子。右:转染了野生型(WT)表达载体和突变型HEMO质粒的293T细胞的上清液,如A中在经过PNGase F处理、SDS凝胶电泳和蛋白质印迹后进行了分析。
图5:转染细胞上清液中HEMO释放的抑制。
使用多克隆抗HEMO多克隆抗体对经phCMV-HEMO表达载体转染的293T细胞的细胞裂解液和上清液进行蛋白质印迹分析(参见方法)。用指定剂量的ADAM和MMP化学抑制剂Batismastat、Marismastat和GM6001或单独的DMSO处理细胞3天。抗γ-微管蛋白抗体被用作细胞裂解液蛋白上样的对照。全长HEMO蛋白(SU-TM)和分泌形式(脱落的Env)用箭头指示。
图6:妊娠期间外周血中HEMO蛋白的释放。
使用多克隆抗-HEMO抗体(上图)和抗-hCG-β抗体(下图)对纯化的血液样品进行蛋白质印迹分析。在来自第一个三个月的妊娠(T1)的胎盘血液中和来自男性(M)、未妊娠的女性(F)和第一个(T1)、第二个(T2)和第三个(T3)三个月妊娠的女性的外周血中检测脱落的HEMO蛋白。在较高和较低分子量下均观察到的条带可能对应于次要的交替加工/脱落形式的HEMO蛋白。
图7A、7B和7C:第一个三个月人胎盘的福尔马林固定组织中的HEMO蛋白的免疫组织化学检测。
(A)胎儿胎盘单位的示意图,其中母体血液浸润了扩大的锚定绒毛,并显示合体细胞滋养层(ST)、下面的单核细胞滋养层(CT)和侵袭性绒毛外细胞滋养层(EVT)。
(B)用对照IgG2a小鼠同种型(左)或抗-HEMO单克隆抗体2F7(右,CNCM I-5211)染色的多个胎盘绒毛和绒毛膜的连续切片。放大倍数4倍。
(C)在B中描绘的4个结构域的放大图:用优先的CT(1-2)和EVT(3)染色的胎盘绒毛;用CT染色的绒毛膜(4)。放大倍率60倍。
图8A、8B、8C和8D:通过计算机RNA-seq分析在发育过程中HEMO基因的表达。
A-C:三个RNA-seq数据图的计算机分析,其分别针对HEMO、合胞素-1(env-W)和合胞素-2(env-FRD)、GCM1(缺少同源物1(一种特定的胎盘表达基因)的胶质细胞)和OCT4(在干细胞中高表达)。用每个基因的编码部分筛选RNA-seq原始数据,并以对数尺度、每千碱基筛选序列和在用两个管家基因RPLP0和RPS6标准化后报告命中。
(A)人植入前胚胎和胚胎干细胞的124个单细胞RNA-seq的图(从参考文献(30)中的涵盖了卵母细胞至桑椹胚期的数据获得了相似的模式)。
(B)正常胎盘组织7个样品的图。
(C)来自人CD34+细胞(NT)重编程为iPS细胞和来自人ES细胞系的28个RNA-seq样品的图。
D:WGA纯化的胎盘血(第一个三个月的妊娠)和汇合的iPSC-cloneN的WGA纯化的上清液(在无血清的情况下生长另外36小时,并浓缩20倍)的蛋白质印迹分析。用PNGase F处理样品。使用多克隆抗HEMO抗体检测脱落的HEMO形式。
图9A、9B、9C和9D:正常组织和肿瘤样品中HEMO表达的微阵列分析。
(A、B)从E-MTAB62数据集中提取的针对HEMO基因表达获得的标准化值的箱形图表示(在对数尺度上)。调整了原始组织的类别,以将来自同一生物学来源的样品归为一组,并保留了作者描述的主要类别:正常组织(A)和肿瘤样品(B)。
(C)从扩大的卵巢肿瘤样品中获得的标准化值(从各种AE和GEO研究中提取为raw.CEL文件)的箱形图表示(参见方法)。在标准化过程中,将正常卵巢组织的值作为对照。肿瘤的卵巢组织型对应于60个透明细胞癌、96个子宫内膜样、34个粘液性和289个浆液性肿瘤样品。(Wilcoxon秩和检验;**,P<0.01)。
(D)使用特异于HEMO蛋白(或对照同种型)的2F7单克隆抗体(CNCM I-5211)对福尔马林固定的正常卵巢组织(左)和卵巢透明细胞癌(右,以两个放大倍数)的免疫组织化学分析。
图10A、10B和10C:猿猴中HEMO基因的序列保守性和纯化选择。
(A)在哺乳动物物种中的HEMO基因座的同线保守性。从UCSC基因组浏览器恢复了人染色体4上HEMO基因的基因组基因座连同周围的RASL11B和USP46基因(间隔275kb),以及黑猩猩、猕猴、狨猴、眼镜猴、鼠狐猴、猫猴、小鼠、豚鼠、兔、刺猬、牛、马、狗、猫、大象、马岛猬、犰狳和负鼠基因组的同线基因座;指出了RASL11B和USP46基因的外显子和转录方向(箭头)。在15kb HEMO基因座的放大图上显示了HEMO基因的外显子(E1至E4),以及同线基因座的同源性(使用MultiPipMaker比对构建工具进行分析)。同源区域显示为绿色框,高度保守的区域(无缺口的大于100bp显示至少70%的同一性)显示为红色框。具有(+)或不具有(-)全长HEMO ORF的序列显示在右侧(nr:不相关)。
(B)使用RAxML程序推论,使用HEMO基因的核苷酸比对确定基于HEMO的最大似然系统树。水平分支长度和比例尺表示核苷酸取代的百分比。从1,000个重复获得的自举值百分比在节点上指示。系统树左侧列出和以相同的顺序以缩写形式在顶部列出的各个猿猴物种的HEMO基因之间的氨基酸序列同一性的成对百分比(下方的三角)和dN/dS的成对值(上方的三角)的双输入表。为这两个系列的值提供了颜色代码。(OWM:旧大陆猴;NWM:新大陆猴;AGM:非洲绿猴;m.:猴)。
(C)通过用指定的猿猴HEMO基因或具有共有弗林蛋白酶位点(H-fur+)的人HEMO突变体的表达载体转染的293T细胞的蛋白质印迹分析,说明了猿猴中HEMO脱落的保守性。收集细胞裂解液和上清液,并用PNGase F处理,然后用多克隆抗HEMO抗体进行蛋白质印迹分析。整个SU-TM HEMO蛋白是细胞裂解液中观察到的主要形式,而主要在上清液中观察到的是脱落和游离SU形式(对于具有弗林蛋白酶位点的NWM基因和H-fur+突变体)。
图11A和11B:猿猴HEMO蛋白的比对的氨基酸序列。描绘了特征结构域,具有在SU和TM亚基之间的推定的蛋白水解弗林蛋白酶切割位点(黑色的RXKR)、SU亚基中的信号肽(紫色)和CWLC基序(CXXC,黑色)、TM亚基中的免疫抑制结构域(ISD,蓝色)、C6XCC序列(黑色)和跨膜域(红色)。点表示氨基酸同一性和连字符密码子缺失。HUM(人);CPZ(黑猩猩);GOR(大猩猩);ORA(猩猩);GIB(长臂猿);MAC(猕猴);BAB(狒狒);AGM(非洲绿猴);COL(疣猴);LAN(叶猴);RHI(仰鼻猴);MAR(狨猴);SQM(松鼠猴);SPI(蜘蛛猴);SAK(狐尾猴)。
图12A、12B、12C、12D和12E:有袋动物env-panMars基因和蛋白质的表征。
(A、B和C)代表性猿猴物种和家猫的有袋动物env-panMars和HEMO蛋白之间的氨基酸序列同源性。在猿猴或猫的序列中相同位置发现的有袋动物序列的每个氨基酸都以黄色突出显示。星号(*):终止密码子。HUM(人)、GIB(长臂猿)、MAC(猕猴)、MAR(狨猴)、CAT(猫)、OPO(负鼠)、WAL(小袋鼠)和TAS(袋獾)。与图1C中的特征性env结构域相同的颜色代码。
(D)检测HA标记的负鼠和小袋鼠env-panMars蛋白。用phCMV-空、phCMV-负鼠-env或phCMV-小袋鼠-env表达载体转染的293T细胞的细胞裂解液(L)和上清液(S)的蛋白质印迹。用抗HA抗体(上)和抗γ-微管蛋白抗体(下)进行检测。
(E)负鼠(上)和小袋鼠(下)的env-panMars基因座和转录物的结构。env-panMars基因座的示意图,其中env-ORF为橙色,CpG岛为绿色。N代表未表征的序列。黑色箭头定位AATAAA聚腺苷酸化信号序列。内含子外显子结构来自负鼠的UCSC,并通过RACE-PCR实验对小袋鼠(来自卵巢的RNA)进行了表征;指示了起始位点(CTTTCTA...)和env ORF受体剪接位点的核苷酸序列;E2-E3内含子加虚线以指示E3基因在部分小袋鼠转录物中跳跃,如对于HEMO基因所观察到的。
图13:HEMO蛋白脱落的示意图。
“1”是主要切割位点(脱落碎片的C-末端=位置432或433的氨基酸)。
“2”和“3”是次要切割位点(“2”:脱落片段的C-末端位于位置450-480的氨基酸;“3”:脱落片段的C-末端位于位置380-420的氨基酸)。
图14:肿瘤样品内HEMO表达的微阵列分析。
对从GSE2109数据集中提取的HEMO基因表达所获得的标准化值的箱形图表示(在对数尺度上)。
图15A和15B:肿瘤样品内HEMO表达的TGCA RNAseq分析。
(A)对HEMO基因表达获得的标准化值的箱形图表示(在FPKM尺度上)。该图是使用完整的Mer34-cDNA序列(约3000bp,包括5'和3'非翻译序列)对17种不同肿瘤类型的实验组进行的互联网TCGA数据分析的副本。
(B)一系列TCGA肿瘤(头颈部鳞状细胞癌,HNSC;肺腺癌,LUAD;子宫体子宫内膜癌,UCEC)和TCGA对照侧正常组织(对照)的RNAseq数据集中的HEMO表达。
图16A和16B:来自Gustave Roussy的肿瘤样品中的HEMO表达。
(A)对卵巢癌(E=子宫内膜样,C=透明细胞)和对照(N=正常卵巢,PL=胎盘)的冷冻样品进行蛋白质印迹分析。
(B)在不同的放大倍数下对来自两个患者(I和II)的子宫内膜样卵巢癌的FFPE样品进行HES染色和HEMO免疫化学分析。正常的卵巢对照示于图9D。
图17:来自Gustave Roussy的肿瘤样品中的HEMO表达。
在不同的放大倍数下对来自两个患者(I和II)的子宫内膜样子宫癌的FFPE样品进行HES染色和HEMO免疫化学分析。
图18:来自Gustave Roussy的肿瘤样品中的HEMO表达。
在不同放大倍数下对来自两个患者(HER2+和三阴性)和正常组织对照的乳腺癌的FFPE样品进行HES染色和HEMO免疫化学分析。
图19A和19B:开发用于检测循环HEMO脱落蛋白的血液-ELISA测定法。
(A)夹心ELISA的示意图。
(B)女性血液中循环HEMO脱落蛋白的ELISA测定。
图20A和20B:针对HEMO胞外域的C-末端部分产生的抗体
(A)用HTM5-多克隆抗体对转染的293T细胞裂解液进行蛋白质印迹分析(1=全长-HEMO-pHCMV载体,2=SU-HEMO-pHCMV载体,3=TM-HEMO-pHCMV载体,4=脱落后-HEMO-pHCMV载体)。
(B)用HTM5-多克隆抗体对转染的293T细胞进行流式细胞术分析(左=空载体,中=全长HEMO载体,右=脱落后HEMO载体)。HTM5抗体可以检测天然形式的全长HEMO和胞外域的C-末端部分。
图21A、21B和21C:通过CrispR-Cas9获得HEMO的KO(敲除)细胞克隆。
(A和B)使用2F7单克隆抗体(CNCM I-5211)对WT(野生型)和KO-HEMO CaCo-2细胞或上清液进行免疫化学和蛋白质印迹分析。无论是通过IHC对FFPE细胞沉淀样品(A)还是在浓缩(20x)上清液(B)中,都无法在CaCo-2 KO HEMO细胞中检测到HEMO。
(C)用2F7单克隆抗体(CNCM I-5211)对WT iPSC上清液、CrispR-KO iPSC上清液(来自细胞克隆1、2和3)和非KO(对照CrispR处理的)iPSC上清液(T)进行蛋白质印迹分析。在CrispR-KO iPSC的上清液中未检测到HEMO。
图22A和22B:克隆mAB作为ScFv片段
(A)用ScFV-2F7-Fc和2F7单克隆抗体(CNCM I-5211)对转染的293T细胞(空载体或全长HEMO载体)上清液进行ELISA分析。通过ScFV-2F7-Fc和2F7单克隆抗体(CNCM I-5211)仅在表达HEMO的293T细胞中检测到HEMO。
(B)用ScFV-2F7-Fc、ScFv-2F7-His和2F7单克隆抗体(CNCM I-5211)对转染的293T细胞(空载体或全长HEMO载体)进行流式细胞术分析。通过ScFV片段(具有Fc和His-Tag)和2F7单克隆抗体(CNCM I-5211)仅在表达HEMO的293T细胞中检测到HEMO。
详述
本申请涉及如在此申请的权利要求中所限定并在本文描述的主题。
在本申请中,除非另有说明或上下文另有规定,否则所有术语在相关领域均具有其普通含义。
本申请涉及逆转录病毒Env蛋白,其对北方兽类哺乳动物进化枝、更具体地对人而言是内源性的,即涉及人内源性逆转录病毒(HERV)蛋白。
所述逆转录病毒Env蛋白已被本发明人命名为HEMO。HEMO代表人内源性MER34ORF,但HEMO蛋白并不限于人:HEMO蛋白在非人的北方兽类(例如非人的灵长类动物)以及人中表达(参见图10A和图10B)。
人HEMO的RNA转录物已经在现有技术中进行了描述,例如在UNIPROTKB中以编号Q9H9K5(MER34_HUMAN)(名称:ERVMER34-1;ORF名称:LP9056)描述。已经从所述现有技术的RNA序列推导了推定蛋白质的序列,但是该蛋白质的实际存在仅仅是假设的。
本发明人提供了该蛋白质实际上表达的证明,并且该蛋白质在北方兽类中、特别是在人中表达。本发明人进一步描述了该蛋白质的新功能(特征)。
HEMO是跨膜蛋白:它由信号肽(被切割掉以形成成熟蛋白)、胞外域、跨膜域和细胞内结构域组成。
HEMO蛋白的举例说明性序列包括:
-SEQ ID NO:1的人HEMO氨基酸序列(参见图1C,图1B;参见图11A-11B和12A-12C中的序列HUM),和
-SEQ ID NO:129-143的非人HEMO蛋白(参见图11A-11B和12A-12C),它们分别是黑猩猩(CPZ)、大猩猩(GOR)、猩猩(ORA)、长臂猿(GIBB)、猕猴(MAC)、狒狒(BAB)、非洲绿猴(AGM)、疣猴(Angolensis palliates)(COL)、叶猴(LAN)、狨猴(MAR)、仰鼻猴(roxellana)(RHI)、松鼠猴(SQM)、蜘蛛猴(SPI)、狐尾猴(SAK)和猫(CAT)的HEMO蛋白序列。
在本申请中,HEMO参考氨基酸序列(特别是用于计算氨基酸位置)是包括N-末端信号肽的人HEMO蛋白序列,即SEQ ID NO:1的序列(563个氨基酸)。
图11A-11B和12A-12C中所示的序列比对使得能够鉴定非人北方兽类中的相应位置。
本发明人特别地证明,在北方兽类中、更具体地在人中,HEMO蛋白在胎盘细胞、干细胞和某些肿瘤细胞中高表达。
本申请一般性涉及HEMO蛋白、HEMO胞外域、HEMO跨膜域和HEMO细胞内结构域,以及这些结构域的片段。
本发明人进一步证明,HEMO蛋白通过脱落被切割。因此,可以在北方兽类的血液中、特别是在循环血液中发现HEMO蛋白的可溶性片段。
本发明人更具体地证明,HEMO蛋白在其胞外域中脱落。
HEMO胞外域的脱落导致可溶性片段的释放,其为HEMO胞外域的N-末端片段。由(可溶的)N-末端片段的切割产生的C-末端片段保留在细胞表面。
因此,本申请一般性涉及HEMO蛋白的片段,更具体地涉及HEMO胞外域的片段。本申请更具体地涉及:
-HEMO胞外域的可溶性片段,更具体地为HEMO胞外域的N-末端可溶性片段,和
-由HEMO胞外域的可溶性片段的脱落产生的HEMO胞外域或HEMO蛋白的片段,更具体地是由HEMO胞外域的N-末端可溶性片段的脱落产生的HEMO胞外域的C-末端片段或蛋白。
本发明人已经鉴定了HEMO胞外域中至少三个不同的切割位点。主要切割位点位于HEMO胞外域的免疫抑制结构域中。其他切割位点可位于所述免疫抑制结构域的上游或下游(在N-至C-方向上)。
因此,北方兽类、更具体地人的血液、更具体地循环血液可以包含以下三个项中的一项或几项:
-HEMO胞外域的一个或几个可溶性(脱落的)N-末端片段,和
-在其表面表达HEMO胞外域的C-末端片段(由所述可溶性(脱落的)N-末端片段之一的切割而产生)的一种或几种细胞(或细胞的一部分,例如外来体)。
北方兽类、更具体地人的胎盘细胞、干细胞和肿瘤细胞因此可以包含细胞(或细胞的一部分,例如外来体),其在其表面表达HEMO胞外域的C-末端片段(由HEMO胞外域的N-末端片段的脱落产生)。这些细胞可以是细胞组织的一部分(例如,胎盘的胎盘细胞;肿瘤组织的肿瘤细胞;骨髓或正常组织或肿瘤组织中所含的干细胞),或者可以是循环细胞(例如循环胎盘细胞,循环干细胞或循环肿瘤细胞)。
本申请特别涉及:
-多肽,其是HEMO胞外域的所述N-末端可溶性(脱落的)片段之一,和涉及
-多肽,其是HEMO胞外域的所述C-末端片段之一,以及涉及在其表面表达所述C-末端片段的细胞(或细胞的一部分,例如外来体)。
本申请还涉及所述多肽的(子)片段,更具体地涉及HEMO胞外域的所述N-末端可溶性(脱落的)片段的(子)片段,其中所述(子)片段可用于抗体生产,更具体地用于单克隆抗体生产。
在整个申请中,除非上下文另外指出,否则多肽(或多肽(子)片段)可以是处于可溶形式(即非膜形式)的多肽(或多肽(子)片段)。
在整个申请中,除非上下文另外指出,否则多肽(或多肽(子)片段、核酸、核酸载体)可以是处于分离的(或纯化的)形式的多肽(或分别地多肽(子)片段、核酸、核酸载体)。
本申请还涉及衍生自所述多肽、细胞或多肽(子)片段的产品。
本申请更具体地涉及:
-组合物,更具体地涉及药物组合物,其包含至少一种本申请的多肽、细胞或多肽(子)片段,
-特异性结合本申请的至少一种多肽、细胞或多肽(子)片段的抗体、单克隆抗体、Fab片段、Fab'片段、F(ab)2片段、scFv、sdAb或sdAb的可变结构域,
-杂交瘤,其产生本申请的单克隆抗体,
-遗传工程改造的T细胞,更具体地嵌合抗原受体T细胞(CAR-T细胞),其中所述嵌合抗原受体(CAR)的胞外域包含或是本申请的scFv,
-编码本申请的多肽或多肽(子片段)的核酸,更具体地是RNA,
-重组包含本申请的至少一种核酸的核酸载体,
-宿主细胞,更具体地说是基因工程改造的细胞,其重组包含本申请的至少一种核酸或核酸载体,
-与本申请的核酸特异性结合的核酸探针,或一组寡核苷酸,其包含引物对(或引物对和探针),其中所述引物对(或所述引物对和探针)与本申请的核酸特异性结合(结合),
-试剂盒,其包含本申请的至少一种所述产品,例如至少一种抗体、单克隆抗体、Fab片段、Fab'片段、F(ab)2片段、scFv、sdAb、sdAb可变结构域或CAR-T细胞,
-其上连接了本申请的多肽、细胞或多肽(子)片段中的至少一种的固体支持物,例如合成膜或核酸阵列,或其上连接或移植了本申请的至少一种抗体、单克隆抗体、Fab片段、Fab'片段、F(ab)2片段、scFv、sdAb、sdAb可变结构域或CAR-T细胞的至少一种所述产品,例如(合成)膜,或其中连接或移植了本申请的至少一种探针的核酸阵列。
本申请涉及本申请的至少一种多肽、多肽(子)片段、细胞或产品的用途或应用,以及涉及本申请的至少一种多肽或产品的方法。
HEMO蛋白
HEMO蛋白在北方兽类中、特别是在人中表达。
胎盘细胞、干细胞和某些肿瘤细胞高表达HEMO蛋白,更具体地人HEMO蛋白。
在整个申请中,哺乳动物或胎盘哺乳动物特别地包括北方兽类,更具体地为灵长总目或劳亚兽总目,更具体地为灵长总目,更具体地为灵长类动物,更具体地为人或猿猴。
在整个申请中,北方兽类包括灵长总目或劳亚兽总目,更具体地为灵长总目,更具体地为灵长类动物,更具体地为人或猿猴。
例如,所述胎盘哺乳动物或北方兽类可以是智人(人)、黑猩猩属(黑猩猩)、大猩猩属(大猩猩)、猩猩属(猩猩)、长臂猿属(长臂猿)、猕猴属(猕猴)、狒狒属(狒狒)、Chlorocebus sabeus(非洲绿猴或AGM)、Colobus angolensis palliatus(疣猴)、Semnopithecus entellus(叶猴)、Rhinopithecus roxellana(仰鼻猴)、狨猴属(狨猴)、松鼠猴属(松鼠猴)、蛛猴属(蜘蛛猴)或狐尾猴属(狐尾猴)。
例如,所述胎盘哺乳动物或北方兽类可以是智人(人)、黑猩猩属(黑猩猩)、大猩猩属(大猩猩)、猩猩属(猩猩)、长臂猿属(长臂猿)、猕猴属(猕猴)、狒狒属(狒狒)、Chlorocebus sabeus(非洲绿猴或AGM)、Colobus angolensis palliatus(疣猴)、Semnopithecus entellus(叶猴)或Rhinopithecus roxellana(仰鼻猴)。
例如,所述胎盘哺乳动物或北方兽类可以是智人(人)、黑猩猩属(黑猩猩)、大猩猩属(大猩猩)、猩猩属(猩猩)或长臂猿属(长臂猿)。
更具体地,所述胎盘哺乳动物或北方兽类是智人(人)。
可以将HEMO蛋白看作是逆转录病毒Env蛋白,其对北方兽类、特别是人的细胞是内源性的。
所述细胞可以是例如胎盘细胞(例如滋养层细胞)、干细胞、肿瘤细胞或肿瘤干细胞。
所述滋养层细胞可以是例如绒毛滋养层细胞、绒毛外滋养层细胞或绒毛膜滋养层细胞。
所述肿瘤细胞可以例如是卵巢癌、子宫癌(更具体地子宫内膜癌、子宫颈癌、妊娠癌(包括胎盘癌,例如绒毛膜癌))、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌症、骨癌或骨髓癌。由于尿路上皮癌包括膀胱癌、输尿管癌和肾盂癌,因此所述癌症也可以是尿路上皮癌,包括膀胱癌、输尿管癌或肾盂癌。
氨基酸或核酸序列描述于下表8以及附图和实施例中。还提供了符合ST25的序列表。
HEMO参考序列是SEQ ID NO:1的人HEMO蛋白的序列(参见例如,图1C或11A-11B)。SEQ ID NO:1的HEMO蛋白包含:
-信号肽(SEQ ID NO:1中的氨基位置1-26或1-24或1-25,即分别为SEQ ID NO:2、168和169),
-胞外域(SEQ ID NO:1中的氨基位置27-489或25-489或26-489或27-488或25-488或26-488或27-491或25-491或26-491或27-486或25-486或26-486,即分别为SEQ ID NO:4和172-182;或氨基位置25-487或25-490或25-492或26-487或26-490或26-492或27-487或27-490或27-492,即分别为SEQ ID NO:910-918),
-跨膜域(例如SEQ ID NO:1中的氨基位置490-512或489-512或492-512或487-512或490-509或489-509或492-509或487-509或490-513或489-513或492-513或487-513,即分别为SEQ ID NO:5和427-437),和
-细胞内结构域(SEQ ID NO:1的氨基位置513-563或510-563或514-563,即分别为SEQ ID NO:6、417和418)。
除人以外的北方兽类的HEMO蛋白的序列可以被定义为由517-578个氨基酸组成(更具体地由536、562、527、517或578个氨基酸组成,更具体地由563或562个氨基酸组成,更具体地由563个氨基酸组成)并且与SEQ ID NO:1(在SEQ ID NO:1的整个长度上)至少有59%的同一性的序列。
表述“至少59%的同一性”涵盖在SEQ ID NO:1的全长上与SEQ ID NO:1具有至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、更具体地至少80%的同一性,更具体地至少80%的同一性,更具体地至少81%的同一性,更具体地至少82%的同一性,更具体地至少83%的同一性,更具体地至少84%的同一性,更具体地至少85%的同一性,更具体地至少86%的同一性,更具体地至少87%的同一性,更具体地在至少88%的同一性,更具体地至少89%的同一性,更具体地至少90%的同一性,更具体地至少91%的同一性,更具体地至少92%的同一性,更具体地至少93%的同一性,更具体地至少94%的同一性、更具体地至少95%的同一性,更具体地至少96%的同一性,更具体地至少97%的同一性,更具体地至少98%的同一性,更具体地是至少99%的同一性。
此类非人HEMO蛋白的实例包含SEQ ID NO:129-143的序列(参见图11A-11B和12A-12C),它们分别是黑猩猩(CPZ)、大猩猩(GOR)、猩猩(ORA)、长臂猿(GIB)、猕猴(MAC)、狒狒(BAB)、非洲绿猴(AGM)、疣猴(Angolensis palliates)(COL)、叶猴(LAN)、狨猴(MAR)、仰鼻猴(roxellana)(RHI)、松鼠猴(SQM)、蜘蛛猴(SPI)、狐尾猴(SAK)和猫(CAT)的HEMO蛋白序列。
这种非人HEMO蛋白的实例更具体地是SEQ ID NO:129-142的序列(即,从CPZ至SAK),更具体地是SEQ ID NO:129-138的序列(即,从CPZ至RHI),更具体地是SEQ ID NO:129-132的序列(即,从CPZ至GIB)。
HEMO信号肽
HEMO蛋白的信号肽由24、25或26个氨基酸组成,并包含SEQ ID NO:405的序列。
例如,HEMO蛋白的信号肽可能由SEQ ID NO:147(26个氨基酸)、SEQ ID NO:405(24个氨基酸)或SEQ ID NO:406(25个氨基酸)的序列组成。
例如,(人)HEMO蛋白的信号肽可以由SEQ ID NO:2(26个氨基酸)、SEQ ID NO:168(24个氨基酸)或SEQ ID NO:169(25个氨基酸)的序列组成。
HEMO蛋白的成熟形式不包含信号肽(已被切割掉)。因此,在信号肽切割后成熟的人HEMO蛋白可以具有SEQ ID NO:3、170或171(起始位置分别为27、25或26)的序列。
HEMO胞外域
HEMO蛋白的胞外域在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列、RTQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的任选氨基酸序列(其特征在于HEMO蛋白的免疫抑制结构域(或ISD)),以及
iv.SEQ ID NO:149的氨基酸序列,
这是逆转录病毒Env蛋白的特征。
请参见例如图1C或4B所示的人HEMO序列。
HEMO蛋白的胞外域的氨基酸序列可以由443-468个氨基酸或443-467个氨基酸组成,更具体地由460-467个氨基酸或459-466个氨基酸或453-460个氨基酸或443-450个氨基酸,例如463或462或456或446个氨基酸组成。
HEMO胞外域可能始于信号肽后的第一个氨基酸(在N-至C-方向)。HEMO胞外域在跨膜域的第一个氨基酸之前(在N-至C-方向)结束。
ii的氨基酸序列更具体地选自CTQG序列、CTQR序列和CIQR序列。更具体地,ii的氨基酸序列是CTQG序列。
iii的任选氨基酸序列即SEQ ID NO:148的特征在于HEMO蛋白的免疫抑制结构域(或ISD),并且对于北方兽类是通用的。在人HEMO蛋白中,SEQ ID NO:148的所述序列(ISD)可以由SEQ ID NO:7的序列组成。
iv的氨基酸序列即SEQ ID NO:149的特征在于CX6CC基序,并且对于北方兽类是通用的。在人HEMO蛋白中,SEQ ID NO:149的所述序列可以由SEQ ID NO:410的序列组成。
例如,HEMO胞外域可以由选自以下的序列组成:
a)SEQ ID NO:4和172-182(人HEMO胞外域;起始位置27、25或26;终止位置489、488、491或486),
b)SEQ ID NO:910-918(人HEMO胞外域;起始位置25、26或27;终止位置487、490或492),以及
c)由443-468或443-467个氨基酸组成并且与SEQ ID NO:4和172-182中的至少一个具有至少76%的同一性(在SEQ ID NO:4和172-182和910-918的所述至少一个的全长上)的序列。
表述至少76%的同一性包括至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%的同一性。
b中的序列包括非人北方兽类的HEMO胞外域。例如,它们可以选自:
-SEQ ID NO:547-561的序列,和
-作为SEQ ID NO:547-561的序列中的至少一个序列的片段并且在SEQ ID NO:547-561的序列中的所述至少一个序列的长度上相差最多7或8个氨基酸的序列。b中的序列可以例如选自SEQ ID NO:442-621的序列。
例如,(人)HEMO胞外域可以由选自以下的序列组成:
d)SEQ ID NO:178、912和547-561的序列,和
e)作为SEQ ID NO:172、911和457-471的序列中的至少一个序列的片段并且在SEQID NO:178、912和547-561的序列中的所述至少一个序列的长度上相差最多7氨基酸的序列并且
d和e中的序列可以例如选自SEQ ID NO:4、172-182和442-621的序列。
从信号肽的第一个氨基酸延伸至(人)HEMO蛋白胞外域的最后一个氨基酸(以N-至C-方向)的序列可以例如是选自以下序列:SEQ ID NO:438-441(起始位置=1;终止位置=489、488、491或486)。
HEMO跨膜域
HEMO蛋白的跨膜域从紧接在胞外域的最后一个氨基酸之后的氨基酸延伸到紧接在细胞内结构域的第一个氨基酸之前的氨基酸(在N-至C-方向上)。
HEMO蛋白的跨膜域的氨基酸序列可能由17或18-27个氨基酸组成。它可以包含SEQID NO:421的序列。
更具体地,所述跨膜域的氨基酸序列可以由17或18-27个氨基酸组成,并且可以包含选自SEQ ID NO:151、407-409和419-426的序列或由其组成。
更具体地,(人)HEMO蛋白的跨膜域的氨基酸序列可以由17或18-27个氨基酸组成,并且可以包含SEQ ID NO:432的序列。
更具体地,(人)HEMO蛋白的跨膜域的氨基酸序列可以由17或18-27个氨基酸组成,并且可以包含选自SEQ ID NO:5和427-437的序列或由其组成。
更具体地,(人)HEMO蛋白的跨膜域的氨基酸序列由选自SEQ ID NO:5和427-437的序列组成。
HEMO细胞内结构域
HEMO蛋白的细胞内结构域从紧接在跨膜的最后一个氨基酸之后的氨基酸延伸到HEMO蛋白的最后一个氨基酸(在N-至C-方向上)。
HEMO蛋白的细胞内结构域的氨基酸序列可以由20-54个氨基酸组成,例如由30-54、40-54或50-54个氨基酸组成。它可能包含SEQ ID NO:413的序列。更具体地,HEMO蛋白的细胞内结构域的氨基酸序列可以由选自SEQ ID NO:411-413的序列组成。
例如,HEMO蛋白的细胞内结构域的氨基酸序列可以由50-54个氨基酸组成,并且可以包含SEQ ID NO:416的序列。更具体地,HEMO蛋白的细胞内结构域的氨基酸序列可以由选自SEQ ID NO:414-416的序列组成。
例如,(人)HEMO蛋白的细胞内结构域的氨基酸序列可以由50-54个氨基酸组成,并且可以包含SEQ ID NO:418的序列。更具体地,(人)HEMO蛋白的细胞内结构域的氨基酸序列可以由选自SEQ ID NO:6、417和418的序列组成。
HEMO脱落
本发明人证明了HEMO蛋白在其胞外域中脱落。
本发明人已经确定了在HEMO胞外域中的脱落(或切割)位点,更具体地,在HEMO胞外域中具有至少三个不同的脱落位点。
这些脱落位点可位于这样的区域中,该区域在SEQ ID NO:1的人HEMO蛋白中从氨基酸位置380延伸到氨基酸位置480,即在SEQ ID NO:150的HEMO多肽中。
更具体地,所述脱落位点中的至少一个可位于这样的区域中,该区域在SEQ IDNO:1的人HEMO蛋白中从氨基酸位置380延伸至氨基酸位置420,或从氨基酸位置421延伸至氨基酸位置449,或从氨基酸位置450延伸至氨基酸位置480。
更具体地,所述脱落位点中的至少一个可位于这样的区域中,该区域在SEQ IDNO:1的人HEMO蛋白中从氨基酸位置421延伸至氨基酸位置449;其中所述脱落位点可位于氨基酸位置421和422,或422和423,或423和424,或424和425,或425和426,或426和427,或427和428,或428和429,或429和430,或430和431,或431和432,或432和433,或433和434,或434和435,或435和436,或436和437,或437和438,或438和439,或439和440,或440和441,或441和442,或442和443,或443和444,或444和445,或445和446,或446和447,或447和448,或448和449之间。
更具体地,所述脱落位点中的至少一个可位于这样的区域中,该区域在SEQ IDNO:1的人HEMO蛋白中从氨基酸位置428延伸至氨基酸位置438,即在SEQ ID NO:623的HEMO多肽中。它是HEMO蛋白的主要脱落位点,并位于HEMO胞外域的免疫抑制结构域中。
例如,所述脱落位点中的至少一个可位于氨基酸位置432和433或433和434之间(通过参考SEQ ID NO:1的人HEMO蛋白来计算;参见图11A-11B或12A-12C用于鉴定非人HEMO蛋白中的相应氨基位置)。
其他脱落位点可能位于所述免疫抑制结构域的上游或下游(在N-至C-方向上)。
通过参考SEQ ID NO:1的人HEMO蛋白序列,下游脱落位点可位于选自氨基酸位置450-480的两个(不同)氨基酸位置之间(即它可能位于SEQ ID NO:624中),例如在氨基酸位置472和473之间。
通过参考SEQ ID NO:1的人HEMO蛋白序列,上游脱落位点可位于选自氨基酸位置380-420的两个(不同)氨基酸位置之间(即它可能位于SEQ ID NO:622中),例如在位置406和407之间。
HEMO胞外域的脱落导致可溶性片段的释放,其是HEMO胞外域的N-末端片段。
由(可溶的)N-末端片段的切割产生的C-末端片段保留在细胞(或细胞的一部分,例如外来体)表面,更具体地在胎盘细胞(或胎盘细胞的一部分)、干细胞(或干细胞的一部分)或(某些)肿瘤细胞(或(某些)肿瘤细胞的一部分)的表面。
本发明人特别地证明,HEMO蛋白的脱落可以指示多能性和/或致瘤性(或可以是标志物)。
HEMO胞外域的可溶性N-末端片段(通过HEMO蛋白的脱落产生)
表述“可溶形式的多肽”(或类似表述)旨在符合其在本领域中的普通含义。该表述通常是指无细胞或不含细胞的多肽,即其没有包含在细胞中或与细胞连接。该表述更具体地指不是膜的、不是跨膜的且不是胞质的多肽。
因此,本申请涉及多肽,其氨基酸序列是逆转录病毒Env蛋白胞外域的片段的序列,更具体地是N-末端片段的序列,其中所述逆转录病毒Env蛋白是如上定义的HEMO蛋白。
所述HEMO蛋白可以例如被定义为逆转录病毒Env蛋白,其对于北方兽类是内源性的,其中所述HEMO蛋白的氨基酸序列可以是例如:
a.SEQ ID NO:1的氨基酸序列;或与SEQ ID NO:1具有至少59%同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,或
b.由517-578个氨基酸组成,并在SEQ ID NO:1的全长上与SEQ ID NO:1具有至少78%的同一性的序列。
所述逆转录病毒Env蛋白的胞外域的氨基酸序列如上定义,例如,其可以由443-467个氨基酸的序列组成,其可以在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列、RTQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的任选氨基酸序列(其特征为HEMO蛋白的ISD),以及
iv.SEQ ID NO:149的氨基酸序列。
所述胞外域的片段的序列由比所述胞外域少的氨基酸数量组成,比所述胞外域少的氨基酸数量更具体地选自344-457或352-457或354-456或374-446,更具体地选自344-373或354-373或406-409或374-396或424-446或447-456或447-457。
所述胞外域的片段的序列可以包含i的所述序列和ii的所述序列。
本申请使用人的HEMO蛋白序列作为参考,并且包括黑猩猩(CPZ)、大猩猩(GOR)、猩猩(ORA)、长臂猿(GIB)、猕猴(MAC)、狒狒(BAB)、非洲绿猴(AGM)、疣猴(Angolensispalliates)(COL)、叶猴(LAN)、狨猴(MAR)、仰鼻猴(roxellana)(RHI)、松鼠猴(SQM)、蜘蛛猴(SPI)、狐尾猴(SAK)和猫(CAT)的HEMO蛋白序列,其中对应的本文定义的胞外域的不同基序和位置如下:
表1.与人HEMO蛋白相比,北方兽类HEMO蛋白上的等效位置和基序。
Figure BDA0002369588140000271
因此,本发明的总体方面涉及多肽,其由内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段组成,
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1具有至少59%同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列;或
·选自SEQ ID NO:129-143的序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列、RTQR序列和RTKR序列的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:178、912和547-561的序列和作为SEQ ID NO:172、911和457-471的序列中的至少一个序列的片段并且在SEQ ID NO:178、912和547-561的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自344-457或374-446,
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
根据一个具体的实施方案,本发明涉及多肽,该多肽由如上定义的内源性北方兽类(例如人、CPZ、GOR、ORA、GIB、MAC、BAB、AGM、COL、LAN、MAR、RHI、SQM、SPI、SAK)的胞外域N- 末端片段组成,
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1具有至少59%同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列;或
·选自SEQ ID NO:129-142的序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:178、912和547-560的序列和作为SEQ ID NO:172、911和457-470的序列中的至少一个序列的片段并且在SEQ ID NO:178、912和547-560的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,比所述胞外域少的氨基酸数量选自344-457或374-446,
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
更具体地,上述肽是如上所定义的内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段,其中所述N-末端片段的序列由比所述胞外域少的氨基酸数量组成,比所述胞外域少的氨基酸数量选自354-456或374-446。
根据另一个具体的实施方案,本发明涉及如上定义的由内源性北方兽类(例如人、CPZ、GOR、ORA、GIB、MAC、BAB、AGM、COL、LAN、MAR、RHI、SQM、SPI、SAK)逆转录病毒Env蛋白的胞外域的N-末端片段组成,其中
a.所述N-末端片段的C-末端位于序列SEQ ID NO:1、129-134和136-137的序列的380位氨基酸至480位氨基酸,并且在序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端之前,位于序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端上游6至112个氨基酸的位置;或
b.所述N-末端片段的C-末端位于序列SEQ ID NO:135的379位氨基酸至479位氨基酸,并且序列SEQ ID NO:135的跨膜域的N-末端之前,位于序列SEQ ID NO:135的跨膜域的N-末端上游6至112个氨基酸的位置;或
c.所述N-末端片段的C-末端位于序列SEQ ID NO:138的380位氨基酸至479位氨基酸,并且在序列SEQ ID NO:138的跨膜域的N-末端之前,位于序列SEQ ID NO:138的跨膜域的N-末端上游6至111个氨基酸的位置;或
d.所述N-末端片段的C-末端位于序列SEQ ID NO:139-140和142的380位氨基酸至476位氨基酸,并且在序列SEQ ID NO:139-140和142的跨膜域的N-末端之前,位于在序列SEQ ID NO:139-140和142的跨膜域的N-末端上游3至105个氨基酸的位置;或
e.所述N-末端片段的C-末端位于序列SEQ ID NO:141的370位氨基酸至466位氨基酸,并且在序列SEQ ID NO:141的跨膜域的N-末端之前,位于序列SEQ ID NO:141的跨膜域的N-末端上游3至105个氨基酸的位置。
表述“在序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端之前,位于序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端上游6至112个氨基酸的位置”对应于以下事实:例如
如果人HEMO胞外域对应于序列SEQ ID NO:1的位置27-492,则跨膜域的N-末端为序列SEQ ID NO:1的氨基酸493;
结果,如果人HEMO胞外域的N-末端片段大小为354个氨基酸,则人HEMO胞外域的所述N-末端片段为从序列SEQ ID NO:1的氨基酸27到氨基酸380,380位的氨基酸位于493位氨基酸(其是序列SEQ ID NO:1的跨膜域的N-末端)的上游112个氨基酸的位置处;
并且如果人HEMO胞外域对应于序列SEQ ID NO:1的位置25-486,则跨膜域的N-末端是序列SEQ ID NO:1的氨基酸487;
结果,如果人HEMO胞外域的N-末端片段大小为456个氨基酸,则人HEMO胞外域的所述N-末端片段为从序列SEQ ID NO:1的氨基酸25位到氨基酸480,480位的氨基酸位于487位氨基酸(其是序列SEQ ID NO:1的跨膜域的N-末端)上游6个氨基酸的位置处。
根据另一个具体的实施方案,本发明涉及由上述内源性人逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽,
a.其中所述人逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1至少80%的同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述人逆转录病毒Env蛋白的胞外域更具体地由以下组成:
·选自SEQ ID NO:178和912的序列和作为SEQ ID NO:172和911的序列中的至少一个序列的片段并且在SEQ ID NO:178和912的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,比所述胞外域少的氨基酸数量选自354-456或374-446,
·从所述胞外域的N-末端开始;
·包含b.i.的所述序列和b.ii.的所述序列;和
·所述N-末端片段的C-末端位于序列SEQ ID NO:1的380位氨基酸至480位氨基酸,并且在序列SEQ ID NO:1的跨膜域的N-末端之前,位于序列SEQ ID NO:1的跨膜域的N-末端上游6至112个氨基酸的位置。
所述(可溶性)胞外域片段的序列可以不包含iii的全长序列,但是可以包含iii的所述序列的片段。当脱落位点是如上所述的主要脱落位点时,尤其是这种情况。例如,(可溶性)胞外域片段的序列可以包含选自SEQ ID NO:9-10、183-184和185-186的序列或由其组成。
所述(可溶性)胞外域片段的序列可以不包含iii的序列,并且可以不包含iii的序列的任何片段。当脱落位点是如上所述的次要(上游)脱落位点时,尤其是这种情况。例如,所述(可溶性)胞外域片段的序列可包含选自SEQ ID NO:13-33、670-689、195-215、690-709、216-236和710-729的序列或由其组成。
所述(可溶性)胞外域片段的序列可以包含iii的序列。当脱落位点是如上所述的次要(下游)脱落位点时,尤其是这种情况。例如,所述(可溶性)胞外域片段的序列可包含选自SEQ ID NO:55-75、830-839、300-320、840-849、321-341和850-859的序列或由其组成。
更具体地,本发明涉及如上定义的多肽,
a.其中所述胞外域的N-末端片段的序列不包含b.iii.的全长序列,但包含b.iii.的所述序列的片段;
b.更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQ ID NO:9-10、183-184和185-186。
更具体地,本发明涉及如上定义的多肽,
a.其中所述胞外域的N-末端片段的序列不包含权利要求2.b.iii.的序列,并且不b.iii.的序列的任何片段,
更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQ ID NO:13-33、670-689、195-215、690-709、216-236和710-729;
b.其中所述胞外域的N-末端片段的序列包含b.iii.的序列,
更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQ ID NO:55-75、830-839、300-320、840-849、321-341和850-859。
更具体地,本发明涉及如上定义的多肽,
a.其中所述胞外域的N-末端片段的序列始于所述胞外域的N-末端,所述胞外域的所述N-末端对应于序列SEQ ID NO:1的第25位的氨基酸,和
其中所述N-末端片段的C-末端对应于序列SEQ ID NO:1的位置421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、445、446、447、448或449的氨基酸;或
b.其中所述胞外域的N-末端片段的序列始于所述胞外域的N-末端,所述胞外域的所述N-末端对应于序列SEQ ID NO:1的第26位的氨基酸,和
其中所述N-末端片段的C-末端对应于序列SEQ ID NO:1的位置421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、445、446、447、448或449的氨基酸;或
c.其中所述胞外域的N-末端片段的序列始于所述胞外域的N-末端,所述胞外域的所述N-末端对应于序列SEQ ID NO:1的第27位的氨基酸,和
其中所述N-末端片段的C-末端对应于序列SEQ ID NO:1的位置421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、445、446、447、448或449的氨基酸。
更具体地,本发明涉及如上所定义的多肽,其中所述胞外域的N-末端片段的序列包含选自SEQ ID NO:9-10、184-186和991-1071的序列或由其组成。
根据一个具体的实施方案,本发明涉及多肽,该多肽由如上定义的内源性猫逆转录病毒Env蛋白的胞外域的N-末端片段组成,
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:143的氨基酸序列;或
·与SEQ ID NO:143具有至少80%同一性的氨基酸序列,更具体地是与SEQ IDNO:143具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由所述序列的443-468或443-467个氨基酸组成,更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.RTQR序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:561和951的序列和作为SEQ ID NO:471和949的序列的片段并且在SEQ ID NO:561和951的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,比所述胞外域少的氨基酸数量选自352-457或374-446;
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
更具体地,本发明涉及与本文定义的所述多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性百分比的上述多肽。
特别地,本发明的上述肽以冻干形式或浓缩形式在任何生理上可接受的载体中(例如0.001至10,000nM,或0.01至10,000nM,或0.001至1,000nM,或0.01至1,000nM,或0.1至1,000nM,或0.1至100nM,或0.1至10nM,或10至100nM,或10至1,000nM,或100至1,000nM,或1,000至10,000nM,或5,000至10,000nM)。
所述(可溶性)胞外域片段可以包含HEMO胞外域的第一氨基酸(在N-末端至C-末端方向上)。
所述(可溶性)胞外域片段在本文中可以称为可溶性多肽或N-末端片段或可溶性N-末端胞外域片段。
可用于例如抗体生产的可溶性N-末端胞外域片段的(子)片段
本申请还涉及上述(可溶性)胞外域片段的(子)片段。这些(子)片段特别地包括(子)片段,其可用于抗体生产,更具体地用于单克隆抗体生产(参见下面的实施例2)。
因此,本申请涉及HEMO胞外域的所述(可溶)N-末端片段的(子)片段(通过HEMO蛋白的脱落产生的可溶性N-末端片段),其中所述(子)片段包含:
-至少10个氨基酸,更具体地至少50个氨基酸,100个氨基酸,更具体地至少150个氨基酸,更具体地至少160个氨基酸,更具体地至少164个氨基酸;和/或
-少于400个氨基酸,更具体地少于300个氨基酸,更具体地少于250个氨基酸,更具体地少于200个氨基酸。
例如,所述(子)片段可包含至少100个氨基酸和少于200个氨基酸,例如164-199个氨基酸,例如164个氨基酸。
例如,所述(子)片段可包含SEQ ID NO:8的序列。
所述(子)片段有利地包含至少一种抗原或表位。所述(子)片段可以是免疫原性的,例如,当例如通过全身施用给药于小鼠时。
HEMO胞外域的C-末端片段(由所述N-末端胞外域片段之一的脱落产生)和在其表 面表达所述C-末端片段的细胞
本申请还涉及HEMO胞外域或HEMO蛋白的(C-末端)片段,其是由所述可溶性N-末端胞外域片段之一的脱落产生的。
本申请还涉及表达(或其上已经保留)HEMO胞外域或HEMO蛋白的此类(C-末端)片段的细胞(或细胞的一部分,例如外来体)。
因此,本申请涉及多肽,其氨基酸序列是HEMO蛋白的片段的序列(如上所定义),其中所述片段包含HEMO蛋白的胞外域的C-末端片段,
其中逆转录病毒Env蛋白的所述片段不包含所述胞外域的全长氨基酸序列,更具体地,其中所述C-末端片段包含所述胞外域的C-末端而不包含所述胞外域的N-末端,和
其中所述胞外域的C-末端片段是C-末端片段,其在所述可溶性N-末端胞外域片段之一脱落(或切割)后保留。
所述多肽的序列可以包含(或胞外域的C-末端片段的序列可以由以下组成):
选自SEQ ID NO:11-12、189-190、191-192和193-194的序列;或
选自SEQ ID NO:34-54、730-749、237-257、750-769、258-278、770-789、279-299和790-809的序列;或
选自SEQ ID NO:76-96、860-869、342-362、870-、879、363-383、880-889、384-404和890-899的序列。
例如,所述多肽的序列可以例如选自SEQ ID NO:625-626、627-647、810-829、648-668和900-909的序列。
所述多肽在本文中可以被称为C-末端蛋白片段。
本申请还涉及(分离的)细胞,更具体地天然存在的或基因工程改造的细胞,其表达所述C-末端蛋白片段,其中所述C-末端蛋白片段的一部分在所述细胞的表面表达,并且其中所述表面表达的部分包含胞外域的C-末端片段,其包含在所述C-末端蛋白片段中。
本申请还涉及多肽,其氨基酸序列是HEMO蛋白胞外域的C-末端片段的序列,
其中所述HEMO蛋白和所述胞外域如本文所定义,和
其中所述C-末端片段是所述胞外域的C-末端片段,其在从所述胞外域中脱落(或切割)所述可溶性N-末端胞外域片段之一后保留。
所述多肽可以由以下组成:
选自SEQ ID NO:11-12、189-190、191-192和193-194的序列;或
选自SEQ ID NO:34-54、730-749、237-257、750-769、258-278、770-789、279-299和790-809的序列;或
选自SEQ ID NO:76-96、860-869、342-362、870-、879、363-383、880-889、384-404和890-899的序列。
所述多肽可以被称为C-末端胞外域片段。
本申请还涉及多肽,其序列在N-末端至C-末端方向上以C-末端胞外域片段的序列(如上所述)起始,并且其中C-末端胞外域片段的序列的C-末端(直接)连接至HEMO蛋白的跨膜域,或连接至HEMO蛋白的跨膜域和细胞内结构域,其中所述HEMO蛋白如本文所定义。
本申请还涉及表达所述C-末端胞外域片段的(分离的)细胞,更具体地天然存在的或基因工程改造的细胞,其中所述C-末端胞外域片段在所述细胞的表面表达。
所述细胞可以是天然存在的(但是分离的)细胞或基因工程改造的细胞。
所述细胞可以是北方兽类细胞,更具体地是人细胞。
所述细胞可以是胎盘细胞(例如滋养层细胞)、干细胞、肿瘤细胞或肿瘤干细胞。所述胎盘细胞可以是例如滋养层细胞,更具体地是绒毛滋养层细胞、绒毛外滋养层细胞或绒毛膜滋养层细胞。
所述肿瘤细胞可以例如是卵巢肿瘤、子宫肿瘤(更具体地是子宫内膜肿瘤、宫颈肿瘤、妊娠肿瘤(包括胎盘肿瘤,例如绒毛膜癌))、乳腺肿瘤、肺肿瘤、胃肿瘤、结肠肿瘤、肝肿瘤、肾肿瘤、前列腺肿瘤、尿路上皮肿瘤、生殖细胞肿瘤、脑肿瘤、头颈肿瘤、胰腺肿瘤、甲状腺肿瘤、胸腺肿瘤、皮肤肿瘤、骨肿瘤或骨髓肿瘤。由于尿路上皮肿瘤包括膀胱癌、输尿管癌和肾盂癌,所以所述肿瘤也可以是包括膀胱肿瘤、输尿管肿瘤或肾盂肿瘤的尿路上皮肿瘤。
根据一个具体的实施方案,本发明涉及由内源性北方兽类逆转录病毒Env蛋白的胞外域的片段组成的多肽,其中所述片段包含所述逆转录病毒Env蛋白的胞外域的C-末端片段,
a.其中所述逆转录病毒Env蛋白和所述胞外域如本文所定义,
b.其中所述C-末端片段包含所述胞外域的C-末端而不包含所述胞外域的N-末端,
c.其中所述胞外域的C-末端片段是C-末端片段,其在从所述胞外域切割先前定义的多肽后保留,更具体地,其中胞外域的所述C-末端片段的序列由选自SEQ ID NO:11-12和189-194,或选自SEQ ID NO:34-54、237-299和730-809,或选自SEQ ID NO:76-96、342-404和860-899的序列组成。
更具体地,本发明涉及与本文定义的所述多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性百分比的如上所述的多肽。
可用于例如抗体生产的HEMO胞外域的C-末端片段的(子)片段(由所述N-末端胞外 域片段之一的脱落而产生)
本申请还涉及HEMO胞外域的上述C-末端片段的(子)片段(其在可溶性N-末端片段的脱落后保留在细胞表面上)。这些(子)片段特别地包括可用于抗体生产,更具体地用于单克隆抗体生产的(子)片段(参见下面的实施例3)。
因此,本申请涉及HEMO胞外域的所述C-末端片段的(子)片段,其中所述(子)片段不含:
-至少10个氨基酸,更具体地至少15、16或17个氨基酸;和/或
-少于200个氨基酸,更具体地少于30个氨基酸。
所述(子)片段有利地包含至少一种抗原或表位。所述(子)片段可以是免疫原性的,例如,当例如通过全身施用而施用至小鼠时。
包含或衍生自本申请的多肽、多肽(子)片段或细胞的产品或用途
本申请还涉及包含、涉及或直接衍生自所述可溶性N-末端胞外域片段、(可溶性)胞外域片段的所述(子)片段、所述C-末端蛋白片段、所述C-末端胞外域片段和所述细胞的产品或用途。
更具体地,本申请涉及所述可溶性N-末端胞外域片段、所述C-末端蛋白片段、所述C-末端胞外域片段和所述细胞用于诊断例如用于肿瘤的诊断,用于胎盘形成缺陷的诊断,或用于诊断妊娠北方兽类中胎儿的针对微生物(更具体地病毒)感染的保护缺陷;或用于治疗,例如,用于肿瘤的治疗,用于治疗胎盘形成缺陷,或用于治疗妊娠北方兽类中胎儿的针对微生物(更具体地病毒)感染的保护缺陷。
更具体地,本申请涉及(可溶性)胞外域片段的所述(子)片段,其用于通过在非人哺乳动物中免疫来产生抗体,更具体地产生单克隆抗体。
本申请还涉及任何组合物,更具体地,任何药物组合物,其包含本申请的至少一种多肽或细胞,更具体地所述可溶性N-末端胞外域片段、所述C-末端蛋白片段、所述C-末端胞外域片段和所述细胞中的至少一种。所述组合物(或药物组合物)可以任选地进一步包含至少一种(药学上可接受的)媒介物,和/或来自北方兽类的血液或组织细胞和/或至少一种免疫佐剂,和/或至少一种缓冲剂。
更具体地,本申请涉及组合物,其包含所述可溶性N-末端胞外域片段的至少一种和/或所述细胞的一种,并且其任选地还包含北方兽类的血液。
更具体地,本申请涉及组合物或药物组合物或药物,其包含所述可溶性N-末端胞外域片段中的至少一种,并且任选地还包含至少一种药学上可接受的媒介物。这样的药物组合物或药物可能例如用于治疗胎盘形成缺陷,或用于治疗妊娠北方兽类中胎儿的针对微生物(更具体地病毒)感染的保护缺陷。
更具体地,本申请涉及组合物或药物组合物,其包含(可溶性)胞外域片段的所述(子)片段中的至少一种,并且任选地还包含至少一种疫苗佐剂。该组合物可用于向非人哺乳动物施用以产生抗体,更具体地与本申请的多肽结合,更具体地特异性结合的单克隆抗体。
更具体地,本申请涉及组合物或药物组合物,其包含所述C-末端蛋白片段和所述C-末端胞外域片段中的至少一种,并且可以任选地进一步包含至少一种缓冲剂。
更具体地,本申请涉及组合物或药物组合物,其包含所述细胞(其表达所述C-末端蛋白片段和所述C-末端胞外域片段中的至少一种)中的至少一种,并且可以任选地进一步包含来自北方兽类的血液或细胞组织。
更具体地,本申请涉及组合物或药物组合物或药物,其包含所述细胞或所述细胞的一部分(例如外来体)(其表达所述C-末端蛋白片段和所述C-末端胞外域片段中的至少一种)中的至少一种,并且任选地还包含至少一种药学上可接受的媒介物。这样的药物组合物或药物可以用于例如胎盘形成缺陷的治疗。
表述“细胞”包括细胞和细胞的一部分,例如外来体,更具体地,表述“细胞”包括细胞和外来体。
本申请还涉及产品,更具体地涉及蛋白质或蛋白质性产品,其中所述产品是:
-抗体,或
-单克隆抗体,更具体地是根据《布达佩斯条约》条款于2017年6月20日以保藏号I-5211保藏在CNCM的杂交瘤产生的单克隆抗体,或
-(单克隆)抗体的片段,其保留了所述(单克隆)抗体的抗原结合特异性,例如Fab、Fab'或F(ab)2片段,或
-融合蛋白,其保留了所述(单克隆)抗体的抗原结合特异性,例如scFv,或
-单结构域抗体(sdAb),或
-sdAb的可变结构域,
其中所述产品特异性结合至:
-所述可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段之一;或
-所述C-末端蛋白片段和C-末端胞外域片段之一。
CNCM是Collection Nationale de Culture de Microorganismes(InstitutPasteur;28,rue du Docteur Roux;75724Paris CEDEX 15;France)。
更具体地,本申请还涉及(蛋白质性)产品,其中所述(蛋白质性)产品特异性结合所述可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段之一,而不结合所述的C-末端蛋白片段和C-末端胞外域片段之一。
更具体地,本申请还涉及产品,更具体地涉及蛋白质或(蛋白质性)产品,其中所述产品特异性结合所述C-末端蛋白片段和C-末端胞外域片段之一,而不结合所述可溶性N-末端胞外域片段和(可溶)胞外域片段的(子)片段之一。
短语“抗体”或“单克隆抗体”包括常规抗体(其包含重链和轻链)以及单结构域抗体(sdAb;与常规抗体相反,其没有轻链并且由单个单体可变抗体结构域组成),例如重链抗体(hcAb)。
短语“抗体”或“单克隆抗体”包括单特异性、双特异性或三特异性抗体。
表述“保留抗原结合特异性的(单克隆)抗体片段”包括Fab、Fab'和F(ab)2片段(常规Ab或mAb的片段),以及sdAb或hcAb的可变结构域(VHH或纳米抗体)。
表述“保留所述(单克隆)抗体的抗原结合特异性的融合蛋白”包括scFv。
所述抗体、抗体片段或融合蛋白的CDR(或CDR1、CDR2和CDR3中的至少一个)可以是在2017年6月20日以保藏号I-5211保藏在CNCM的杂交瘤产生的单克隆抗体的CDR(或分别为CDR1、CDR2和CDR3中的至少一个)。
所述抗体、抗体片段或融合蛋白可以任选地与至少一种检测标记或标志物或标签或药物连接或结合。
本申请还涉及靶向HEMO肿瘤细胞的药物缀合的抗体,其中所述抗体是本文定义的抗体之一。
所述HEMO肿瘤细胞在其表面表达多肽,所述多肽是本申请的所述N-末端(可溶性)胞外域片段之一或所述C-末端蛋白片段之一。
本申请还涉及产品,更具体地涉及蛋白质或蛋白质性产品,其中所述产品是:
-抗体,或
-单克隆抗体,或
-(单克隆)抗体的片段,其保留了所述(单克隆)抗体的抗原结合特异性,例如Fab、Fab'或F(ab)2片段,或
-融合蛋白,其保留了所述(单克隆)抗体的抗原结合特异性,例如scFv,或
-单结构域抗体(sdAb),或
-sdAb的可变结构域,
其中所述产品任选地与至少一种检测标记或标志物或标签或药物连接,并且其中所述产品特异性结合选自SEQ ID NO:8、919、924-939、981-988和990的序列的(人)HEMO抗原。
本申请还涉及杂交瘤,其产生本申请的单克隆抗体。更具体地,本申请涉及在2017年6月20日以保藏号I-5211保藏在CNCM的杂交瘤(2F7-E8)(其针对人HEMO胞外域的片段,即本申请的N-末端可溶性多肽的子片段,即SEQ ID NO:1的片段123-286(SEQ ID NO:8的片段)。更具体地,本申请涉及由在2017年6月20日以保藏号I-5211保藏在CNCM的杂交瘤(2F7-E8)产生的单克隆抗体(可为人源化的),其与至少一种检测标记或标志物或标签或药物连接或结合。所述杂交瘤(2F7-E8)或由在2017年6月20日以保藏号I-5211保藏在CNCM的杂交瘤(2F7-E8)产生的单克隆抗体能够鉴定本申请的N-末端可溶性多肽的子片段以及当HEMO蛋白尚未脱落时本申请的N-末端可溶性多肽的所述子片段的不溶形式。
本申请还涉及嵌合抗原受体T细胞(即CAR-T细胞),其中所述嵌合抗原受体包含与细胞内T细胞受体(TCR)信号传导结构域连接的细胞外单链可变片段(scFv),并且其中所述scFv是本申请的scFv。
所述细胞内TCR信号传导结构域可以是例如CD3ζ。
所述scFv可以例如经由铰链/间隔肽和/或跨膜域间接连接至所述TCR信号传导结构域。除所述TCR信号传导结构域外,CAR的细胞内部分还可包含至少一个共刺激结构域,例如CD28或4-1BB。
本申请还涉及本申请的抗体或单克隆抗体或本申请的CAR-T细胞,其用于治疗,例如用于抗癌治疗,更具体地用于实体瘤的治疗。
所述抗体、单克隆抗体、CAR-T细胞可以(特异性地)结合至肿瘤细胞或肿瘤干细胞。
所述癌症是例如卵巢癌、子宫癌(更具体地是子宫内膜癌、子宫颈癌、妊娠癌(包括胎盘癌,例如绒毛膜癌))、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌。由于尿路上皮癌包括膀胱癌、输尿管癌和肾盂癌,因此所述癌症也可以是尿路上皮癌,包括膀胱癌、输尿管癌或肾盂癌。
本申请还涉及本申请的抗体或单克隆抗体或本申请的CAR-T细胞,其用于诊断,更具体地,用于(体外)癌症诊断,更具体地,用于确定受试者的肿瘤的组织型、等级或分期的(体外)方法,或用于检测妊娠受试者的胎盘形成缺陷、更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷的(体外)方法。
本申请还涉及本申请的抗体或单克隆抗体或本申请的CAR-T细胞,其用于纯化或分离北方兽类的循环细胞的(体外)方法,更具体地用于纯化或分离循环细胞,其是肿瘤细胞、肿瘤干细胞或胎盘细胞,或用于从体细胞诱导多能干细胞的(体外)方法。
本申请还涉及本申请的药物缀合的(单克隆)抗体或本申请的CAR-T细胞,其用于治疗,更具体地用于靶向患有肿瘤的北方兽类的肿瘤细胞,其中所述肿瘤细胞在其表面表达多肽,所述多肽是本申请的所述N-末端(可溶)胞外域片段之一或所述C-末端蛋白片段之一。
所述肿瘤是例如卵巢肿瘤、子宫肿瘤(更具体地是子宫内膜肿瘤、宫颈肿瘤、妊娠肿瘤(包括胎盘肿瘤,例如绒毛膜癌))、乳腺肿瘤、肺肿瘤、胃肿瘤、结肠肿瘤、肝肿瘤、肾肿瘤、前列腺肿瘤、尿路上皮肿瘤、生殖细胞肿瘤、脑肿瘤、头颈肿瘤、胰腺肿瘤、甲状腺肿瘤、胸腺肿瘤、皮肤肿瘤、骨肿瘤或骨髓肿瘤。由于尿路上皮肿瘤包括膀胱癌、输尿管癌和肾盂癌,因此所述肿瘤也可以是包括膀胱肿瘤、输尿管肿瘤或肾盂肿瘤的尿路上皮肿瘤。
本申请还涉及试剂盒,其包括产品,更具体地蛋白质或蛋白质性产品,并且还包括说明书,其指导使用所述产品用于以下五种用途中的至少一种:
-检测受试者中肿瘤的出现或追踪肿瘤的发展,其中所述受试者是北方兽类,
-确定肿瘤的组织型、等级或分期,其中所述癌症更具体地是卵巢癌、子宫癌(更具体地是子宫内膜癌、子宫颈癌、妊娠癌(包括胎盘癌,例如绒毛膜癌))、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌(包括膀胱癌、输尿管癌或肾盂癌)、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌,
-检测妊娠受试者的胎盘形成的缺陷,更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷,
-纯化或分离北方兽类的循环细胞,更具体地用于纯化或分离北方兽类循环细胞,其是肿瘤细胞或肿瘤干细胞或胎盘细胞,
-纯化或分离北方兽类的非循环细胞,更具体地用于纯化或分离来自北方兽类的新鲜肿瘤或活检样品中的非循环细胞,
其中所述(蛋白质性)产品是本申请的(蛋白质性)产品,和
其中所述(蛋白质性)产品任选地与检测标记连接或结合。
本申请还涉及编码多肽的核酸,其中所述多肽由所述可溶性N-末端胞外域片段、(可溶性)胞外域片段的所述(子)片段、所述C-末端蛋白片段和所述C-末端胞外域片段之一组成。所述核酸可以是DNA、RNA或cDNA。
编码人HEMO的核酸是SEQ ID NO:152的序列。编码非人HEMO的核酸可以选自SEQID NO:153-167的序列。
本申请更具体地涉及编码多肽的SEQ ID NO:152和153-167的序列的片段,其中所述多肽由所述可溶性N-末端胞外域片段、(可溶性)胞外域片段的所述(子)片段、所述C-末端蛋白片段和所述C-末端胞外域片段之一组成。
本申请还涉及核酸载体,更具体地涉及核酸表达载体,其(重组地)包含本申请的至少一种核酸。
本申请还涉及工程改造的宿主细胞,其(重组地)包含本申请的至少一种核酸或载体。
本申请还涉及与该申请的核酸特异性杂交的核酸探针。
本申请还涉及引物对,其特异性扩增本申请的至少一种核酸。
本申请还涉及HEMO启动子,更具体地涉及人HEMO启动子,更具体地涉及SEQ IDNO:669的人HEMO启动子。
本申请还涉及试剂盒,其包含本申请的至少一种(蛋白质性)产品,或本申请的至少探针、引物对或寡核苷酸组,其中所述试剂盒任选地进一步包括使用试剂盒用于检测脱落形式的HEMO蛋白和/或用于检测肿瘤细胞、干细胞或肿瘤干细胞的说明书。
本申请还涉及其上结合、连接或附接本申请的至少一种(蛋白质性)产品或本申请的至少探针、引物对或寡核苷酸组的固体支持物,例如膜或阵列。
本申请还涉及任何组合物、药物组合物或药物,其包含本申请的至少一种产品,并且任选地还包含至少一种缓冲剂或药学上可接受的媒介物(或稀释剂或佐剂)。
本申请更具体地涉及这样的药物组合物或药物,其中本申请的所述至少一种产品是本申请的至少一种抗体、单克隆抗体或CAR-T细胞。这样的药物组合物或药物可以例如用于治疗癌症,更具体地卵巢癌、子宫癌(更具体地子宫内膜癌、子宫颈癌、妊娠癌(包括胎盘癌,例如绒毛膜癌))、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌。由于尿路上皮癌包括膀胱癌、输尿管癌和肾盂癌,因此所述癌症也可以是尿路上皮癌,包括膀胱癌、输尿管癌或肾盂癌。
根据一个具体的实施方案,本发明涉及分离的细胞或细胞的一部分(例如外来体),其表达本文定义的C-末端蛋白片段和C-末端胞外域片段,其中本文定义的C-末端蛋白片段和C-末端胞外域片段的一部分在所述细胞或所述细胞的所述部分的表面表达,并且其中所述表面表达的部分包含在本文定义的所述C-末端蛋白片段和C-末端胞外域片段中包含的胞外域的C-末端片段,
更具体地,其中所述细胞或所述细胞的所述部分是胎盘细胞或胎盘细胞的一部分、干细胞或干细胞的一部分、肿瘤细胞或肿瘤细胞的一部分或肿瘤干细胞或肿瘤干细胞的一部分。
根据一个具体的实施方案,本发明涉及表达本文定义的C-末端蛋白片段和C-末端胞外域片段的分离的细胞,其中本文定义的C-末端蛋白片段和C-末端胞外域片段的一部分在所述细胞的表面表达,并且其中所述表面表达的部分包含在本文定义的所述C-末端蛋白片段和C-末端胞外域片段中包含的胞外域的C-末端片段,
更具体地,其中所述细胞是胎盘细胞、干细胞、肿瘤细胞或肿瘤干细胞。
根据另一个具体的实施方案,本发明涉及本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段,其用于治疗,更具体地用于治疗北方兽类的胎盘形成缺陷或用于治疗北方兽类携带的胎儿的针对微生物感染(更具体地病毒感染)的保护缺陷。
根据另一个具体的实施方案,本发明还涉及产品,其中所述产品是:
a.抗体,或
b.单克隆抗体,更具体地是由以保藏号I-5211保藏在CNCM的杂交瘤产生的单克隆抗体,或
c.Fab、Fab'或F(ab)2片段,或
d.scFv,或
e.sdAb,或
f.sdAb的可变结构域,
并且其中所述产品任选地与至少一种药物连接,
并且其中所述产品特异性结合本文定义的所述可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段。
根据另一个具体的实施方案,本发明还涉及产品,其中所述产品是:
a.抗体,或
b.Fab、Fab'或F(ab)2片段,或
c.scFv,或
d.sdAb,或
e.sdAb的可变结构域,
并且其中所述产品任选地与至少一种药物连接,
并且其中所述产品特异性结合本文定义的所述C-末端蛋白片段和C-末端胞外域片段。
根据另一个具体的实施方案,本发明涉及嵌合抗原受体T细胞(CAR-T细胞),其中所述嵌合抗原受体包含连接至TCR信号传导结构域的scFv,并且其中所述scFv是本文定义的所述产品的scFv。
更具体地,本发明涉及本文定义的所述产品或本文定义的CAR-T细胞,其用于治疗,更具体地用于抗癌治疗,其中所述产品或CAR-T细胞结合肿瘤细胞或肿瘤干细胞,并且其中所述癌症更具体地是卵巢癌、子宫癌、子宫颈癌、妊娠癌、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌(包括膀胱癌、输尿管癌或肾盂癌)、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌症、骨癌或骨髓癌。
更具体地,本发明还涉及包含产品的试剂盒,其中所述产品用于以下五种用途中的至少一种:
a.检测受试者中肿瘤的出现或追踪肿瘤的发展,其中所述受试者是北方兽类;
和/或
b.确定肿瘤的组织型、等级或分期,其中所述癌症是卵巢癌、子宫癌、子宫颈癌、妊娠癌、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌(包括膀胱癌、输尿管癌或肾盂癌)、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌;
和/或
c.检测妊娠受试者的胎盘形成的缺陷,更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷;
和/或
d.纯化或分离北方兽类的循环细胞,更具体地用于纯化或分离北方兽类循环细胞,其是肿瘤细胞或肿瘤干细胞或胎盘细胞;
和/或
e.纯化或分离北方兽类非循环细胞,更具体地用于纯化或分离来自所述北方兽类的活检或肿瘤样品的北方兽类非循环细胞,以及
其中所述(蛋白质性)产品是本申请的(蛋白质性)产品,和
其中所述(蛋白质性)产品任选地连接或结合至检测标记。
方法
本申请涉及方法,其涉及或实施本申请的至少一种产品,更具体地所述可溶性N-末端胞外域片段、(可溶性)胞外域片段的所述(子)片段、所述C-末端蛋白片段、所述C-末端胞外域片段、所述细胞、所述(蛋白质性)产品以及所述探针和/或引物中的至少一种。
本申请的方法特别包括以下方法:
-肿瘤分型,
-癌症诊断,
-癌症免疫疗法,
-筛选治疗剂,例如筛选可用于治疗癌症(包括减轻或预防癌症)的药剂,或筛选可用于治疗胎盘发育缺陷(例如,胎盘早剥、先兆子痫、子痫)的药剂或筛选可用于胎儿保护(例如,针对病毒或微生物感染的保护)的药剂,
-纯化循环细胞(例如,纯化肿瘤循环细胞或循环滋养层细胞),以及
-产生诱导的多能干细胞(来自体细胞)。
更具体地,本申请涉及用于检测受试者中肿瘤细胞或肿瘤干细胞的存在的(体外)方法,其中所述受试者为北方兽类,并且其中所述体外方法包括以下两个步骤i和ii中的至少一个:
i.检测以可溶形式包含在样品中的多肽,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,其中所述样品是所述受试者的血液样品或尿液样品或腹水样品,或来自所述受试者的组织的活检样品,或所述血液样品或尿液样品或腹水样品或活检样品的蛋白质提取物(更具体地,所述血液样品或尿液样品或活检样品的可溶性蛋白质提取物),并且在所述样品中检测可溶性形式的所述多肽指示所述受试者中存在肿瘤细胞或肿瘤干细胞;和
ii.检测样品中的细胞,其中所述细胞是或包含本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),其中所述样品是来自所述受试者的血液样品或尿液样品或腹水样品,来自所述受试者的组织的活检样品,或所述血液或尿液或腹水或活检样品的细胞级分,并且其中在所述样品中检测所述细胞指示所述受试者中存在肿瘤细胞或肿瘤干细胞。
本申请还涉及用于检测受试者中肿瘤的出现或用于追踪受试者中肿瘤的发展的(体外)方法,其中所述受试者是北方兽类,并且其中所述(体外)方法包括以下两个步骤i和ii中的至少一个:
i.检测以可溶形式包含在样品中的多肽,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,其中所述样品是所述受试者的血液样品或尿液样品或腹水样品,或来自所述受试者的组织的活检样品,或所述血液样品或尿液样品或腹水样品或活检样品的蛋白质提取物(更具体地,所述血液样品或尿液样品或活检样品的可溶性蛋白质提取物),并且在所述样品中检测可溶性形式的所述多肽指示所述受试者中存在肿瘤细胞或肿瘤干细胞;和
ii.检测样品中的细胞,其中所述细胞是或包含本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),其中所述样品是来自所述受试者的血液样品或尿液样品或腹水样品,来自所述受试者的组织的活检样品,或所述血液或尿液或腹水或活检样品的细胞级分,并且其中在所述样品中检测所述细胞指示所述受试者中存在肿瘤细胞或肿瘤干细胞。
表述“追踪受试者中的肿瘤的发展”包括检测所述肿瘤的出现或检测所述肿瘤在治疗后的复发,以及确定所述肿瘤在治疗前和治疗期间的组织型、等级或分期。
更具体地,本申请涉及本文定义的(体外)方法,该方法用于检测以高于对照受试者样品中所测量的平均浓度的浓度分泌本发明的可溶性N-末端胞外域片段之一的肿瘤的出现。
更具体地,本申请涉及本文定义的用于检测治疗后肿瘤的复发的(体外)方法。
所述肿瘤可以例如是卵巢肿瘤、子宫肿瘤(更具体地子宫内膜肿瘤、宫颈肿瘤、妊娠肿瘤(包括胎盘肿瘤,例如绒毛膜癌))、乳腺肿瘤、肺肿瘤、胃肿瘤、结肠肿瘤、肝肿瘤、肾肿瘤、前列腺肿瘤、尿路上皮肿瘤、生殖细胞肿瘤、脑肿瘤、头颈肿瘤、胰腺肿瘤、甲状腺肿瘤、胸腺肿瘤、皮肤肿瘤、骨肿瘤或骨髓肿瘤。由于尿路上皮肿瘤包括膀胱癌、输尿管癌和肾盂癌,所以所述肿瘤也可以是包括膀胱肿瘤、输尿管肿瘤或肾盂肿瘤的尿路上皮肿瘤的尿路上皮肿瘤。
本申请还涉及用于确定受试者的肿瘤的组织型、等级或分期的(体外)方法,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤i和ii中的至少一个:
i.检测以可溶形式包含在样品中的多肽,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,其中所述样品是所述受试者的血液样品或尿液样品或腹水样品,或所述肿瘤的活检样品,或所述血液样品或尿液样品或腹水样品或肿瘤活检样品的蛋白提取物(更具体地,所述血液样品或尿液样品或肿瘤活检样品的可溶性蛋白提取物),并且其中在所述样品中检测可溶形式的所述多肽确定所述肿瘤的组织型、等级或分期;和
ii.检测样品中的细胞,其中所述细胞是或包含本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),其中所述样品是来自所述受试者的血液样品或尿液样品或腹水样品,所述肿瘤的活检样品,或所述血液或尿液或腹水液体或活检样品的细胞级分,并且其中在所述样品中检测所述细胞确定所述肿瘤的组织型、等级或分期。
更具体地,本申请涉及用于确定受试者的肿瘤的组织型、等级或分期的(体外)方法,其中所述受试者是北方兽类,并且其中所述体外方法包括检测样品中的细胞,其中所述细胞是或包含本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),其中所述样品是所述肿瘤的活检样品或所述活检样品的细胞级分,并且其中检测所述样品中的所述细胞确定所述肿瘤的组织型、等级或分期。
检测可溶形式的所述多肽或检测所述细胞可以包括分别测量所述多肽或细胞的数量或浓度,并且任选地将所测量的数量或浓度与参考数量或浓度(例如,对照数量或浓度)进行比较。
所述肿瘤可以例如是卵巢肿瘤、子宫肿瘤(更具体地是子宫内膜肿瘤、宫颈肿瘤、妊娠肿瘤(包括胎盘肿瘤,例如绒毛膜癌))、乳腺肿瘤、肺肿瘤、胃肿瘤、结肠肿瘤、肝肿瘤、肾肿瘤、前列腺肿瘤、尿路上皮肿瘤、生殖细胞肿瘤、脑肿瘤、头颈肿瘤、胰腺肿瘤、甲状腺肿瘤、胸腺肿瘤、皮肤肿瘤、骨肿瘤或骨髓肿瘤。由于尿路上皮肿瘤包括膀胱癌、输尿管癌和肾盂癌,所以所述肿瘤也可以是包括膀胱肿瘤、输尿管肿瘤或肾盂肿瘤的尿路上皮肿瘤。
(显著)高于以下的浓度可能指示所述受试者中肿瘤的存在:
-对照受试者(无癌症和无肿瘤的对照受试者)的血液中测量的平均浓度,或
-受试者血液中常规测量的平均浓度。对照受试者(无癌症/无肿瘤)的血液中测得的平均浓度可以例如为1fM–1mM或1fM–1μM或1fM–1nM或1fM–1pM或1pM–1mM或1pM–1μM或1pM–1nM或1nM–1mM或1nM–1μM或1μM–1mM或1fM–100pM或1fM–10pM或1pM–100nM或1pM–10nM或1nM–100μM或1nM–10μM或1μM–100mM或1μM–10mM或1pM–10nM或1pM–10pM或1pM–100pM或100pM–10nM或1nM–100nM或1nM–10nM或10nM–100nM或5nM–100nM或1nM–5nM。超出这些正常范围和高于所述范围的上端的浓度,例如,1mM或1μM或1nM,或1pM或100nM或100pM或10nM或10pM或5nM,可指示所述受试者中肿瘤的存在。
如此确定的肿瘤组织型、等级或分期可以指导医师选择抗肿瘤治疗和/或调整抗肿瘤治疗。因此,本申请涉及为有此需要的受试者选择抗癌治疗的方法,该方法包括使用本申请的组织分型/分级/分期方法确定所述肿瘤的组织型、等级或分期,并选择通过手术、化学疗法、放射疗法和激素疗法的抗癌治疗、适合于所述肿瘤组织型、等级或分期的治疗。
本申请还涉及用于检测妊娠受试者的胎盘形成缺陷、更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷的(体外)方法,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤i和ii中的至少一个:
i.测量样品中可溶形式的多肽的量或浓度,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,其中所述样品是来自所述受试者的血液样品或尿液样品或羊水样品或所述血液或尿液或羊水样品的(可溶性)蛋白提取物,并且其中(测量)所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷;和
ii.测量样品中细胞的数量或浓度,其中所述细胞是本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),其中所述样品是来自所述北方兽类的血液样品或尿液样品或羊水样品或来自所述北方兽类的胎盘样品或来自所述血液或尿液或羊水或胎盘样品的细胞提取物,并且其中(测量)所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷。
更具体地,本申请涉及用于检测妊娠受试者的胎盘形成缺陷(例如,胎盘早剥、先兆子痫、子痫)的体外方法,其中所述受试者是北方兽类,其中所述体外方法包括测量样品中可溶形式的多肽的数量或浓度,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,其中所述样品是来自所述北方兽类的血液样品或从所述血液样品提取的(可溶)蛋白质提取物,并且其中(测量)所述样品中的所述数量或浓度指示所述受试者胎盘形成缺陷。
(显著)高于或低于对照受试者(具有正常胎盘形成的妊娠对照受试者)的血液中测得的平均浓度的浓度可能指示所述受试者的胎盘形成的缺陷。
对照受试者(具有正常胎盘形成的妊娠对照受试者)在血液中测得的平均浓度可以为1fM–1mM或1fM–1μM或1fM–1nM或1fM–1pM或1pM–1mM或1pM–1μM或1pM–1nM或1nM–1mM或1nM–1μM或1μM–1mM或1fM–100pM或1fM–10pM或1pM–100nM或1pM–10nM或1nM–100μM或1nM–10μM或1μM–100mM或1μM–10mM或1pM–10nM或1pM–10pM或1pM–100pM或100pM–10nM或1nM–100nM或1nM–10nM或10nM–100nM或5nM–100nM或1nM–5nM,更具体地1nM–10nM(例如,在妊娠的第三个三个月)。在例如妊娠的第三个三个月超出该正常范围的浓度(例如,在妊娠第三个三个月的浓度低于所述正常范围)可以指示所述受试者的胎盘形成缺陷。
本申请还涉及用于测试北方兽类的妊娠的(体外)方法,该方法包括
i.测量来自所述受试者的血液样品中可溶形式的多肽的数量或浓度,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,并且其中测量所述样品中的所述数量或浓度指示所述北方兽类的妊娠或未妊娠;和
ii.测量来自所述受试者的血液样品中的细胞的数量或浓度,其中所述细胞是本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),并且其中测量所述样品中的所述数量或浓度指示所述北方兽类的妊娠或未妊娠。
(显著)高于或低于对照受试者(未妊娠对照受试者)的血液中测得的平均数量或浓度的数量或浓度可能指示所述北方兽类已妊娠或未妊娠。
本申请还涉及(体外)方法,该方法用于检测妊娠的北方兽类中胎儿的针对微生物(更具体地病毒)感染的保护的缺陷,其中所述体外方法包括以下两个步骤i和ii中的至少一个:
i.测量来自所述妊娠的北方兽类的血液样品中可溶形式的多肽的数量或浓度,其中所述可溶形式的多肽是本申请的可溶性N-末端胞外域片段之一,并且其中测量所述样品中的所述数量或浓度指示所述胎儿的针对微生物(更具体地病毒)感染的保护的缺陷;和
ii.测量来自所述妊娠的北方兽类的血液样品中的细胞或细胞的一部分(例如外来体)的数量或浓度,其中所述细胞是本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段),(任选地通过遗传分析确定所述细胞是母体细胞还是胎儿细胞),并且其中测量所述样品中的所述数量或浓度指示所述胎儿的针对微生物(更具体地病毒)感染的保护缺陷。
(显著)高于或低于对照受试者(具有正常胎盘形成的妊娠对照受试者)的血液中测得的平均浓度的数量或浓度可能指示所述受试者的胎盘形成的缺陷。
本申请还涉及用于确定化合物是否是用于治疗北方兽类的候选活性成分的(体外)方法,其中所述治疗是治疗所述北方兽类的胎盘形成缺陷或治疗由所述北方兽类携带的胎儿的针对微生物(更具体地是病毒)感染的保护的缺陷,其中所述(体外)方法包括使所述化合物与本申请的可溶性N-末端胞外域片段之一的配体接触以进行配体结合测定,和检测所述化合物是否与所述配体结合,其中检测所述结合指示所述化合物是所述治疗的候选活性成分。
除了与本申请的可溶性N-末端胞外域片段之一的配体接触之外,所述化合物还可以与本申请的可溶性N-末端胞外域片段之一接触以进行竞争性结合测定。检测所述化合物与所述多肽之间竞争结合所述配体可能指示所述化合物是所述治疗的候选活性成分。
所述配体可以例如是本申请的单克隆抗体或scFv。
本申请还涉及用于确定化合物是否是用于治疗北方兽类的候选活性成分的(体外)方法,其中所述治疗是治疗所述北方兽类的癌症,其中所述方法包括:
使所述化合物与本申请的可溶性N-末端胞外域片段之一接触以进行多肽结合测定,并检测所述化合物是否与所述多肽结合,其中检测所述结合指示所述化合物是用于所述治疗的候选活性成分。
除了与本申请的可溶性N-末端胞外域片段之一接触之外,所述化合物还可以与所述多肽的配体接触以进行竞争性结合测定。检测所述化合物与所述配体之间竞争结合所述多肽可能指示所述化合物是所述治疗的候选活性成分。
所述配体可以例如是本申请的单克隆抗体或scFv。
本申请还涉及用于纯化或分离北方兽类的循环细胞的(体外)方法,其中所述方法包括从所述北方兽类的循环血液的样品或这样的样品的细胞级分纯化或分离细胞,其中所述细胞纯化或分离包括阳性分选细胞,其在其表面表达细胞标志物,并且其中所述细胞是本申请的细胞(在其表面表达至少一种所述C-末端胞外域片段)。
更具体地,本申请还涉及用于纯化或分离北方兽类的循环细胞的(体外)方法,更具体地用于纯化或分离北方兽类的循环细胞(其是肿瘤细胞或肿瘤干细胞或胎盘细胞)的(体外)方法,其中所述方法包括从所述北方兽类的循环血液的样品或此类样品的细胞级分中纯化或分离细胞,其中所述细胞纯化或分离包括阳性分选与配体结合的细胞,其中所述配体为本申请的(蛋白质性)产品。
所述阳性分选可以例如使用配体进行,所述配体特异性结合在所述循环细胞表面表达的多肽,并且其中所述多肽是所述N-末端(可溶性)胞外域片段之一或所述C-末端蛋白片段和C-末端胞外域片段之一,更具体地是所述C-末端蛋白片段和C-末端胞外域片段之一。
所述循环细胞可以是例如肿瘤细胞或肿瘤干细胞或胎盘细胞。
本申请还涉及(体外)方法,该方法用于纯化或分离来自北方兽类的新鲜肿瘤或活检样品中的非循环(肿瘤)细胞以表征所述非循环(肿瘤)细胞(例如,使用RNAseq或DNAseq或PDXmice技术),其中所述非循环(肿瘤)细胞的纯化或分离包括阳性分选与配体结合的细胞,其中所述配体是本申请的(蛋白质性)产品。
本申请还涉及从体细胞诱导多能干细胞的(体外)方法,该方法包括将多能性相关基因引入体细胞(例如成纤维细胞),并选择表达所引入的多能性相关基因的那些细胞,其中所述多能性相关基因包括编码多肽的基因,所述多肽由本申请的可溶性N-末端胞外域片段之一组成。
所述多能性相关基因可以进一步包括编码转录因子的一种或几种基因,例如选自编码Oct4(Pou5f1)、Sox、Klf、Myc、Nanog、LIN28和Glis1转录因子的基因的一种或几种基因,例如选自编码Oct4(Pou5f1)、Sox2、cMyc和Klf4转录因子的基因的一种或几种基因。所述多能性相关基因可以携带在一种或几种病毒载体上,更具体地携带在一种或几种逆转录病毒上。
所述方法可以进一步包括将选择的细胞在细胞培养基中生长。所述细胞培养基可包含选自碱性成纤维细胞生长因子(bFGF)、细胞因子(例如肿瘤生长因子(TGF)或Wnt3a)、胎牛血清(FBS)、人血清、胶原蛋白、白蛋白、胆固醇和胰岛素的一种或几种组分。
本申请还涉及用于检测受试者样品中的本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段的(体外)方法,其包括(或由其组成)在ELISA夹心测定中至少使用:
-针对所述可溶性N-末端胞外域片段或(可溶性)胞外域片段的所述(子)片段的第一表位的第一单克隆或多克隆抗体,和
-针对所述可溶性N-末端胞外域片段或(可溶性)胞外域片段的所述(子)片段的第二表位的第二单克隆或多克隆抗体,
所述第一和第二表位是不同的,并且其中所述样品是来自所述受试者的血液或尿液或羊水或腹水样品或所述血液或尿液或羊水或腹水样品的(可溶性)蛋白提取物。
例如,这种ELISA测定可用于检测在正常和病理条件下HEMO血清水平的变异性和/或跟踪病理条件下的发展。
与“包括”或“包含”同义的术语“含有”是开放式的,并不排除其他未引用的要素、成分或方法步骤,而术语“由......组成”是封闭式术语,其排除了未明确叙述的任何其他要素、步骤或成分。
术语“基本上由......组成”是部分开放的术语,其不排除其他未引用的要素、步骤或成分,只要这些附加要素、步骤或成分不会实质性地影响本发明的基本和新颖特性。
因此,术语“包括(comprising)”(或“包含(comprise(s))”)包括术语“由......组成(consisting of)”(“组成(consist(s)of)”)以及术语“基本上由......组成(essentially consisting of)”(“基本上组成(essentially consist(s)of)”)。因此,在本申请中,术语“包括”(或“包含”)更具体地意指涵盖术语“由…...组成”(“组成”)和“基本上由......组成”(“基本上组成”)。
为了帮助本申请的读者,本说明书分为不同的段落或部分。这些分隔不应视为将一个段落或部分的实质内容与另一个段落或部分的实质内容分离。相反,本说明书涵盖了可以预期的各个部分、段落和句子的所有组合。
本文引用的所有参考文献的相关公开内容均各自通过引用明确地并入本文。下列实施例是作为举例说明而非限制提供的。
根据一个具体的实施方案,本发明涉及用于检测本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段或本文定义的表达C-末端蛋白片段和C-末端胞外域片段的细胞的体外方法,其包括以下两个步骤a和b中的至少一个:
a.检测以可溶性形式包含在样品中的多肽,其中所述多肽是本文定义的可溶的N-末端胞外域片段和(可溶性)胞外域片段的(子)片段;
和/或
b.检测样品中的细胞,其中所述细胞是或包含本文定义的表达C-末端蛋白片段和C-末端胞外域片段的细胞。
根据另一个具体的实施方案,本发明涉及上述用于确定受试者的肿瘤的组织型、等级或分期的体外方法,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤a和b中的至少一个:
a.检测以可溶形式包含在样品中的多肽,其中所述多肽是本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段,其中所述样品为:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,
·或所述血液或尿液或腹水或肿瘤活检样品的可溶性蛋白提取物,以及
其中在所述样品中检测可溶性形式的所述多肽确定所述肿瘤的组织型、等级或分期;
和/或
b.检测样品中的细胞,其中所述细胞是或包含本文定义的表达C-末端蛋白片段和C-末端胞外域片段的细胞,并且其中所述样品是:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,或
·所述血液或尿液或腹水或活检样品的细胞级分,以及
其中在所述样品中检测所述细胞确定所述肿瘤的组织型、等级或分期。
根据另一个具体的实施方案,本发明涉及上述体外方法,其用于检测妊娠受试者的胎盘形成缺陷,更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤a和b中的至少一个:
a.测量样品中可溶形式的多肽的数量或浓度,其中所述可溶形式的多肽是本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段,其中所述样品为:
·所述受试者的血液、尿液或羊水样品,
·或所述血液或尿液或羊水样品的可溶性蛋白提取物,以及
其中所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷;
和/或
b.测量样品中细胞的数量或浓度,其中所述细胞是本文定义的表达C-末端蛋白片段和C-末端胞外域片段的细胞,并且其中所述样品是:
·所述北方兽类的血液、尿液或羊水样品,
·或来自所述北方兽类的胎盘样品,
·或所述血液或尿液、羊水或胎盘样品的细胞提取物,以及
其中所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷。
根据另一个具体的实施方案,本发明涉及体外方法,其用于纯化或分离北方兽类的循环细胞,更具体地用于纯化或分离北方兽类的循环细胞,其是肿瘤细胞或肿瘤干细胞或胎盘细胞,
其中所述方法包括从所述北方兽类的循环血液样品或此类样品的细胞级分中纯化或分离细胞,其中所述细胞纯化或分离包括阳性分选与配体结合的细胞,其中所述配体是本文定义的产品。
根据另一个具体的实施方案,本发明涉及体外方法,该方法用于纯化或分离来自北方兽类的新鲜肿瘤或活检样品中的非循环细胞以表征所述非循环细胞,
其中所述非循环细胞的纯化或分离包括阳性分选与配体结合的细胞,其中所述配体是本申请的(蛋白质性)产品。
根据另一个具体的实施方案,本发明涉及从体细胞诱导多能干细胞的体外方法,该方法包括将多能相关基因导入体细胞,并选择表达所引入的多能相关基因的那些细胞,
其中所述多能性相关基因包含编码多肽的基因,所述多肽由本文定义的可溶性N-末端胞外域片段和(可溶性)胞外域片段的(子)片段和/或本文定义的C-末端蛋白片段和C末端胞外域片段组成。
实施例
实施例1:
逆转录病毒包膜基因的捕获一直是胎盘哺乳动物出现的关键,证据表明在哺乳动物中发生多次重复和独立的捕获事件,这些事件是当今胎盘结构多样性的原因。在这里,我们发现了一种具有前所未有的特性的全长内源性逆转录病毒包膜蛋白,因为它通过跨膜域上游的前体包膜蛋白的特异性切割而在人的血液循环中活跃地脱落。与先前确定的逆转录病毒包膜基因不同,发现其编码基因是从与逆转录病毒LTR无关的富含CpG的独特启动子转录而成,其表达部位包括胎盘以及其他组织,而出乎意料的是干细胞以及重新编程的iPS细胞,其中也可以检测到该蛋白。我们提供的证据表明,相关的逆转录病毒捕获事件最有可能发生在劳亚兽总目和灵长总目分离之前、大于100Mya,经过鉴定的逆转录病毒包膜基因编码了所有猿猴的全长蛋白质,其在纯化选择下并具有相似的脱落能力。最后,对该基因表达的全面筛选揭示了几种肿瘤组织(例如生殖细胞、乳腺和卵巢肿瘤)中的高转录水平,在后一种情况下,有证据表明在透明细胞癌中有组织型依赖性和特异性蛋白表达。结论是,鉴定出的蛋白质很可能构成正常细胞的“干细胞特性标志物”,并且是确定肿瘤中免疫治疗方法的“靶标”。
意义
逆转录病毒的内生化在脊椎动物中是一种罕见但共有的事件,捕获的逆转录病毒包膜合胞素在哺乳动物(包括有袋动物)的胎盘形成中起主要作用。在这里,我们鉴定了一种具有前所未有性能的内源性逆转录病毒包膜蛋白,包括导致其胞外部分在人血液循环中的脱落的特定切割过程。该蛋白在所有猿猴中均是保守的(在有袋动物中发现了同源蛋白),在胚胎和重新编程的干细胞以及胎盘和某些人肿瘤(更具体地卵巢肿瘤)中具有“干细胞特性”表达。这种蛋白质可能构成特定细胞状态的通用标志物(和可能是效应物),并且脱落后可以在血液中免疫检测到。
方法
生物样品
在父母的书面知情同意下,在Department of Obstetrics and Gynecology atthe COCHIN Hospital,Paris 75014,France从合法的选择性妊娠终止(孕周为8至12周)获得第一个三个月的人胎盘组织。
所有血液样品的获得均有知情同意书。妊娠女性(无月经的11至18周)和非妊娠女性(排卵诱导激素治疗前)的样品均在MTA协议MTA2015-45下来自Laboratoire EYLAU(34,avenue du Roule;92200Neuilly sur Seine;France)。男性血液样品在协议15EFS018下来自ETABLISSEMENT
Figure BDA0002369588140000622
DU SANG(20Avenue du Stade de France;93218Saint-Denis;France)。
卵巢组织样品在研究协议RT09916下来自Biological Resource Centre and theDepartment of Laboratory Medicine and Pathology of the GUSTAVE ROUSSYINSTITUTE(114,rue Edouard Vaillant;94800Villejuif;France)。
来自hESC(H1、H7、H9)的RNA来自GUSTAVE ROUSSY INSTITUTE的U1170-INSERM。
iPSC(经过重编程的CD34+人细胞,处于传代的第24代)及其上清液来自GUSTAVEROUSSY INSTITUTE的iPSC平台。
非人的灵长类动物基因组DNA的来源描述于Esnault等人,2013,以及小袋鼠RNA的来源描述于Cornelis等人,2015。
伦理声明
实验得到GUSTAVE ROUSSY INSTITUTE伦理委员会的批准。严格按照法国和欧洲有关动物实验的法律和法规(关于保护用于实验和其他科学目的的动物的86/609/EEC号指令)进行此研究。
多克隆和单克隆抗HEMO抗体
将编码HEMO SU包膜亚基(氨基酸123至286;SEQ ID NO:8)的163个氨基酸的DNA片段插入pET28b(NOVAGEN)原核表达载体中,并在BL21(DE3)细菌中表达。通过镍亲和层析从细菌裂解液中纯化重组的C-末端His标记的蛋白。根据标准程序进行小鼠免疫。从10只小鼠中独立回收含多克隆抗体的血清,并使用瞬时转染了HEMO Env表达载体的293T细胞的裂解液通过蛋白质印迹分析进行测试。通过AGRO-BIO(2allée de la Chavannerie;45240LaFertéSaint-Aubin;France)选择一只小鼠用于单克隆抗体生产,并分离了一个杂交瘤克隆(2F7,IgG2a同种型)用于IgG生产。
数据库筛选和序列分析
通过
Figure BDA0002369588140000621
在人基因组(GRCh38/hg38基因组参考合作体人参考38(GCA_000001405.15),2013年12月)上搜索逆转录病毒内源性env基因序列。首先,使用EMBOSS软件包的GETORF程序(http://emboss.sourceforge.net/apps/cvs/emboss/apps/getorf.html)从hg38人数据库中提取含有长度超过400aa(从起始密码子到终止密码子)的ORF的所有基因组序列并翻译成氨基酸序列。然后,使用美国国家生物技术信息中心(
Figure BDA0002369588140000631
www.ncbi.nlm.nih.gov/BLAST)的BLASTP程序,对这些氨基酸序列针对42种逆转录病毒包膜糖蛋白(来自代表性的ERV,其中是已知的合胞素,和感染性逆转录病毒)的SU-TM氨基酸序列进行了BLAST。通过使用ClustalW方案(www.ebi.ac.uk)对其氨基酸序列进行多次比对,对含有包膜的阳性ORF进行分类。丢弃由高度重复序列组成的ORF。
使用RaxML 7.3.2构建最大似然系统树,其中使用GAMMA+GTR模型进行快速自举算法来计算1000次重复后的自举百分比。
使用多种平台和软件分析序列:Santa Cruz University of California的UCSC浏览器(https://genome.ucsc.edu/);REPBASE(http://www.girinst.org/repbase/);REPEATMASKER(http://www.repeatmasker.org);University of Montana的DFAM(http://www.dfam.org/);CBiB-Bordeaux,France的
Figure BDA0002369588140000633
软件(http://services.cbib.u-bordeaux.fr/galaxy/),(http://www.cbs.dtu.dk/services/)和(http://www.expasy.org/)的预测服务器和用于CpG岛表征的NEWCPGREPORT(http://www.ebi.ac.uk/Tools/emboss/)。
在PAMLX图形用户界面(1.2版)上使用PAML程序包获得dN/dS比率。所选的HEMOORF序列的坐标在下表2中列出。如下所示,对长臂猿、狒狒、蜘蛛猴和狐尾猴核苷酸HEMOORF进行PCR扩增,并将序列保存在
Figure BDA0002369588140000632
中。
对于代表性数量的物种,从UCSC浏览器在所有物种中保守的两个基因(在HEMO基因座的5'和3',即RASL11B和USP46)之间的250kb基因组区域上恢复同线基因座。使用MULTIPIPMAKER比对工具(http://pipmaker.bx.psu.edu/pipmaker/)以人基因组序列为参考对它们进行了分析。所选序列的坐标在下表3中列出。
表2:猿猴HEMO ORF序列的基因组坐标列表
Figure BDA0002369588140000641
表3:250kb RAS-USP46基因座的基因组坐标列表
Figure BDA0002369588140000642
细胞培养、5-氮杂-2'-脱氧胞苷处理和金属蛋白酶抑制剂
在37℃、5%CO2下将细胞维持在DULBECCO改良EAGLE培养基(293T(胚胎肾)、HeLa(宫颈腺癌)、CaCo-2(结肠腺癌)、TE671(横纹肌肉瘤)、SH-SY5Y(神经母细胞瘤)和HuH7(肝癌)人细胞)、RPMI培养基1640(JAR(绒毛膜癌)、2102Ep(畸胎癌)和NCCIT(畸胎癌)人细胞)和F-12K培养基(BeWo(绒毛膜癌)、JEG-3(绒毛膜癌)和NTera2D1(畸胎瘤)人细胞)中。所有培养基均补充有10%热灭活的胎牛血清(FCS)、100U/ml青霉素和100μg/ml链霉素(所有试剂均来自LIFE TECHNOLOGY)。iPSC在GUSTAVE ROUSSY iPSC平台上在经辐照的MEF上生长。达到汇合后,将细胞去除血清36小时,并收集上清液,过滤(0.22μm Millipore过滤器),并在AMICON Ultra 0.5mL(MILLIPORE,10K)上浓缩20倍。
对于用5-氮杂-2'-脱氧胞苷(5-氮杂-dC;SIGMA-ALDRICH)处理,将2×105个BeWo和293T细胞铺在6孔培养皿中。然后将0.1至5μM剂量的5-氮杂-dC添加到培养物中3天,每天更换新鲜培养基。一天后收获细胞用于RNA提取。
对于用金属蛋白酶抑制剂处理,将5×105个293T细胞接种在6孔培养皿中,其中每孔2mL培养基。接种后一天,每孔用1.5μg phCMV-HEMO质粒和4.5μL Lipofectamine LTX(THERMOFISHER)瞬时转染细胞。转染后一天,将细胞用添加了指定浓度的金属蛋白酶抑制剂(CALBIOCHEM):(巴马司他(0.1至10μM)、马利马司他(0.1至10μM)或GM6001(1至50μM))的培养基孵育。另外两天用含有抑制剂的培养基进行补充,并在一天后收集上清液并通过0.45μm MILLIPORE过滤器过滤。同一天收获细胞用于蛋白质分析。
萤光素酶启动子测定
为了进行HEMO启动子活性测定,从人基因组DNA中PCR扩增包含TSS(+1)的不同大小的片段,并以有义和反义方向克隆到pGL3基本载体(PROMEGA)中萤光素酶报告基因上游的HindIII-NheI位点(757bp片段:-290至+472;467bp片段:+1(TSS)至+472;408bp片段:+57至+472;使用的引物列在下表4中,其中(NNN)代表HindIII和NheI位点)。
将293T细胞接种到96孔培养皿中,每孔2×104个细胞。接种后一天,将细胞用100ng DNA质粒和0.2μL
Figure BDA0002369588140000661
(POLYPLUS TRANSFECTION;850boulevard Sébastien Brant;67400Illkirch;France)转染。转染后两天,弃去培养基,并按照制造商的说明使用PIERCETM RENILLA-萤火虫萤光素酶双重测定试剂盒和
Figure BDA0002369588140000662
-Multi+发光仪器(PROMEGA)检测萤光素酶的活性。
表4:引物列表
Figure BDA0002369588140000671
亚硫酸氢盐基因组测序分析
使用EpiTect Plus DNA亚硫酸氢盐试剂盒(QIAGEN)对来自293T、BeWo、iPSC-NP24和CaCo-2细胞的基因组DNA进行亚硫酸氢盐处理。使用上表4中列出的特异性引物,使用ACCUPRIMETM高保真聚合酶(INVITROGEN,@THERMO-FISCHER),通过嵌套PCR(2轮35个循环)对50至150ng的经亚硫酸氢盐处理的DNA扩增启动子区域的2个DNA片段。然后将PCR产物克隆到pGEMT-Easy载体(PROMEGA)中并最少选择10个克隆进行测序。
用于人和猿猴的HEMO ORF的表达载体以及离体测定
使用PHUSION DNA聚合酶(THERMO SCIENTIFIC),使用独特的正向引物(由于ATG密码子的5'高度保守性)(hemoGe-F-Xho)以及两个反向引物之一(hemoGe-R-Mlu或特定的NWM猴hemoNWM-R-Mlu引物)(参见上面的表4)从相应的基因组DNA PCR扩增人和选定的猿猴的HEMO ORF(图11A和11B)。直接测序PCR产物(BIGDYE TERMINATOR v3.1,THERMOFISCHER)。然后将扩增的HEMO基因片段克隆到phCMV-G表达载体(
Figure BDA0002369588140000681
登录号AJ318514)的Xho I和Mlu I位点用于转染实验。通过在用于PCR扩增phCMV-HEMO的所示片段的反向引物中插入TGA终止密码子,构建提前终止密码子HEMO突变体(图4),并如上所述再次克隆。共有序列弗林蛋白酶位点RTKR对CTQG序列的置换(如在NWM HEMO基因中)通过多次PCR反应进行定点诱变来完成。
在6孔培养皿中使用转染了1.5μg phCMV-HEMO质粒和7.5μl Fugene 6(PROMEGA)的5×105个293T细胞测定HEMO蛋白质的产生和释放。转染后12小时,用无血清培养基代替细胞培养基。转染后48小时,收集上清液和细胞。过滤上清液(0.45μm MILLIPORE过滤器)并保存在-80℃。对于细胞裂解液,将样品溶解在具有1X蛋白酶和磷酸酶抑制剂混合物(THERMO SCIENTIFIC)的RIPA缓冲液(150mM NaCl,25mM Tris HCl pH 7.6、0.1%SDS和1%脱氧胆酸钠,THERMO SCIENTIFIC)中,离心(14,000g 20分钟以去除碎片),并在测试前储存在-80℃。
免疫荧光和免疫组织化学测定
对于HEMO免疫荧光测定,HeLa细胞在玻璃盖玻片上生长,并每孔12孔培养皿用phCMV-HEMO表达载体或对照空载体(500ng)和1.5μL Lipofectamine LTX(THERMOFISHER)瞬时转染。转染后48小时,将细胞固定在4%多聚甲醛中,用0.2%TRITON X100透化或不透化,并用小鼠抗HEMO多克隆抗体(参见上文)和ALEXA Fluor 488缀合的抗小鼠第二抗体(MOLECULAR PROBES)染色。细胞核用DAPI(SIGMA-ALDRICH)染成蓝色。在LEICA TCS SP8MP共聚焦显微镜下进行观察。
对于免疫组织化学测定,将新鲜收集的胎盘组织固定在4%多聚甲醛中并包埋在石蜡中。切片(4μm)用苏木精曙红和番红花染色。处理石蜡切片以进行热诱导的抗原修复(Tris EDTA pH 9,ABCAM),并与单克隆小鼠抗HEMO(2F7)抗体(1/10稀释度)或对照IgG2a同种型孵育过夜。使用过氧化物酶/二氨基联苯胺Mouse PowerVision试剂盒(IMMUNOVISIONTECHNOLOGIES)观察染色。
蛋白质印迹分析、小麦胚芽凝集素纯化和肽N-糖苷酶F处理
在梯度预制凝胶(NuPAGE NOVEX 4–12%Bis-Tris凝胶,LIFE TECHNOLOGIES)上通过SDS/PAGE分析样品、细胞上清液或细胞裂解液,并使用半干转移系统将其转移到硝酸纤维素膜上。在含0.1%Tween-20和5%脱脂牛奶的PBS中封闭后,将膜与一抗(抗HEMO小鼠多克隆抗体1/5000,抗CGB/hCG-β兔多克隆抗体(ABGENT)1/100000,抗γ-微管蛋白小鼠单克隆抗体(SIGMA-ALDRICH)1/1000)在4℃孵育过夜,洗涤3次然后与适合物种的辣根过氧化物酶(HRP)缀合的二抗在室温下孵育45分钟。通过使用增强的化学发光系统(ECL,PIERCE)检测蛋白质。
当指定时,首先使用凝集素小麦胚芽凝集素(WGA)试剂盒(THERMO SCIENTIFIC)从胎盘组织或血清提取糖蛋白。按照制造商的指南制备600微升全蛋白提取物,并用200μl洗脱缓冲液洗脱。当指定时,在SDS-PAGE之前将样品用肽N-糖苷酶F(PNGase F;NEB BIOLABS)处理。
HEMO蛋白的N-末端和C-末端的质谱表征
为了获得足够的HEMO蛋白用于MS表征,将293T细胞(4个10厘米培养皿,每个培养皿3×106个细胞)用phCMV-HEMO表达载体(来自人)(每平板10μg)在DMEM-FCS培养基中转染。2天后,用无血清DMEM代替培养基,再过2天后,回收上清液。使用VIVASPIN 20(SARTORIUS,30,000MWCO PES)将总分泌蛋白浓缩约60倍。使用WGA-试剂盒回收浓缩的提取物中的糖蛋白,以200μL洗脱,然后上样至4-12%NuPAGE凝胶上。切下80kDa的丙烯酰胺凝胶部分,并在透析袋中电泳洗脱蛋白质。再次使用AMICON超离心过滤器(ULTRACEL-50K)浓缩蛋白质,用PNGase处理,然后重新上样至4-12%NuPAGE凝胶上以进行额外的纯化步骤。切下主条带(在考马斯亮蓝染色后看到并对应于脱落的48kDa HEMO蛋白),并分别进行不同的酶消化(胰蛋白酶、胰凝乳蛋白酶)。脱落的HEMO蛋白相关片段通过Gif-sur-Yvette的IMAGIF平台(France)、通过使用三重TOF 4600质谱仪(AB Sciex,Framingham,MA,USA)的nanoLC-MS/MS分析表征,因此允许测定蛋白质的N-末端和C-末端。
RNA、实时RT-PCR和RACE实验
来自人组织和细胞的总RNA从ZYAGEN(San Diego)购买,或根据制造商的说明使用RNAeasy分离试剂盒(QIAGEN)进行分离,并用Dnase I(AMBION)处理。使用MLV逆转录酶(APPLIED BIOSYSTEMS)用1μg RNA进行逆转录。通过使用SYBR green PCR Master Mix(QIAGEN),用5μl稀释(1:20)的cDNA以25μl终体积进行实时定量PCR。使用上表4中列出的引物,使用ABI Prism 7000序列检测系统进行qPCR。转录水平相对于管家基因(RPLP0或G6PD)mRNA的量进行标准化。一式两份测定样品。
使用SMARter RACE cDNA扩增试剂盒(CLONTECH)和上面表4中列出的引物,对100ng经DNase处理的RNA进行5'-RACE和3'-RACE。
RNA-seq数据挖掘
RNA-seq原始数据是从
Figure BDA0002369588140000701
Sequence Read Archive(SRA)下载的,其登录号为:SRP011546(GSE36552)、ERP003613(PRJEB4337)和SRP042153(GSE57866)。将RNA-seq原始数据用TOPHAT2(v2.0.14)与感兴趣的定制基因数据库(包括一些逆转录病毒包膜和管家基因)比对,并使用以下参数:“--读长-错配0-g 1--无-覆盖-搜索”。使用SAMtools(v0.1.19)选择唯一映射的读长以进行进一步分析。为了避免检测其他类似的ERV基因,只对完全匹配的命中进行计数。将读长计数通过基因的长度(以千碱基合并后)和两个管家基因(RPLP0和RPS6)的读长计数进行标准化,并进行对数转换。还通过在
Figure BDA0002369588140000711
-TraceArchive Nucleotide
Figure BDA0002369588140000712
平台上进行blast验证了基因的特定转录物(内含子和侧翼序列中不存在读长计数,并且存在与特定剪接点相对应的分裂RNA-seq读长)。对于每个感兴趣的基因,在Integrative Genomics Viewer可视化工具(http://software.broadinstitute.org/software/igv)上,已验证读长计数在编码序列上均等分布。
微阵列数据挖掘
为了深入了解HEMO基因在正常和肿瘤人体组织中的表达谱,使用了Lukk等人,2010阐述的数据集E-MTAB-62(https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-62/files/)进行了微阵列数据的计算机分析(其中包括从正常组织中提取的1033个样品和从各种AE和Gene Expression Omnibus(GEO)研究获得的2315个肿瘤样品)。数据集E-MTAB-62下载为已处理的表达数据。使用Wilcoxon的秩和检验评估统计学显著性。对于较大的实验组分析,其他卵巢癌数据集(AE E-GEOD-63885、E-GEOD-30311、E-GEOD-54809、E-GEOD-6008、E-GEOD-14764,来自https://www.ebi.ac.uk/arrayexpress)使用affy软件包(v1.48.0)(Gautier等人,2004)的“expresso”功能进行预处理,其中使用以下参数:用于背景校正的稳健多阵列平均值(RMA),仅保留完美匹配(PM)探针(“pmonly”)和分位数标准化。为了使log2转换值和探针集强度log2转换值均具有标准化值,“medianpolish”和“avgdiff”均被应用为汇总方法。数据预处理后,提取HEMO基因的表达值,并用R 3.2.3(www.r-project.org)作图。卵巢癌数据集使用inSilicoMerging R软件包(Taminau等人,2012)(版本1.14)进行了合并,并应用COMBAT作为批量效应校正方法。
结果
HEMO、编码全长蛋白的HERV env基因的鉴定
通过BLAST搜索大于400aa的ORF(从Met起始密码子到终止密码子),使用选定的一系列42个Env序列(代表传染性逆转录病毒和ERV家族,包括所有先前鉴定的合胞素(见“方法”),筛选了最新发布的人基因组序列(GRCh38基因组参考合作体人参考38,2013年12月),以寻找编码全长ERV Env蛋白的基因的存在。这产生了45个编码Env的ORF,除一个以外,其全部可以通过clustalW比对分组为已知的HERV Env家族(其中HERV-K的24个编码Env的ORF,以及属于12个先前描述的HERV Env的集合的20个编码Env的ORF,请见下面的表5)。
表5:人包膜蛋白编码序列的基因组坐标
Figure BDA0002369588140000721
Figure BDA0002369588140000731
还能够鉴定出具有全长563个氨基酸ORF的不相关的env基因(人内源性MER34 ORF的HEMO)(见图1),其表现出真正的逆转录病毒Env蛋白的某些但不是全部特征,即信号肽、推定的SU亚基中的CWLC基序和推定的TM亚基中的C-X6-CC基序,位于TM跨膜域中的23aa疏水结构域和ISD结构域。值得注意的是,推定的HEMO蛋白缺乏明确鉴定的弗林蛋白酶切割位点(CTQG,而不是经典的R/K-X-R/K-R),以及邻近的疏水融合肽(图1B)。将HEMO序列整合到图1D所示的Env系统发育树中,其中包含用于基因组筛选的42个逆转录病毒包膜氨基酸序列。该图显示与HEMO蛋白最密切相关的序列是Env-panMars,由在所有的有袋动物中发现的保守的祖先捕获的逆转录病毒env基因编码,并且在跨膜域上游具有提前终止密码子(图12A-E)。
最后,对人基因组的BLAST分析表明,HEMO基因是被称为MER34(MEdium重复频率家族34的简写,首次在Toth和Jurka,1994中进行了描述)的非常古老的简并多基因家族的一部分。在这个家族中,在RepBase中已经描述并报道了具有Gag-Pro-Pol-Env逆转录病毒结构的MER34-int共有序列和LTR-MER34序列(Jurka等人,2005)。具有MER34-int共有序列的基因组blast无法检测gag或pol基因的任何全长推定ORF。在人基因组中分散的MER34家族的env序列(通过blast鉴定出20个具有大于200bp的同源性的拷贝,参见下面的表6)中,HEMO显然是一个异常值(1692bp/563aa),所有其他序列都包含许多停止密码子、Alu或LINE插入,且没有ORF超过147个氨基酸。
表6:人基因组中与MER34相关的env序列
Figure BDA0002369588140000741
HEMO基因座和转录特征谱
HEMO基因位于染色体4q12上RASL11B和USP46基因之间,距每个基因约120kb(还参见图10)。通过与RepBase MER34-int共有序列(Jurka等人,2005)的BLAST比较,仔细检查了HEMO env基因座(10kb),发现了处于复杂的混乱结构的仅残留部分的逆转录病毒pol基因(见图2A),其一部分处于逆向的方向并被大量Alu(SINE)插入进一步破坏。该基因座组织表明原病毒非env基因的低选择压力,如在先前表征的具有捕获的env的基因座中经常观察到的。
使用鉴定出的ORF中的引物和来自一组人组织和细胞系的RNA的定量RT-PCR(RT-qPCR)分析(图2B)显示HEMO在胎盘中以高水平表达。它也在肾脏中显著表达,但水平较低。在细胞系中,HEMO基因的表达看起来是异质的,除了其在干细胞(ESC和iPSC)中的系统性表达外。出乎意料的是,在几种胎盘绒毛膜癌细胞系(BeWo、JAR、JEG-3)以及一系列胚胎癌(NT2D1、2102Ep、NCCIT)和肿瘤细胞系中均没有可检测的转录物(但在CaCo-2结肠腺癌中见到)。
通过来自胎盘的Env编码转录物的RACE-PCR分析确定HEMO env转录物的结构。它允许鉴定多重剪接的转录物,具有对应于从基因组序列预测的供体/受体剪接位点的内含子边界和如通常对逆转录病毒env基因所观察到的,靠近env ATG起始位点的功能性受体位点。有趣的是,如对逆转录病毒转录物所预期的,转录物3'末端位于可鉴定的MER34 LTR内。但是,位于env基因5'大约5kb处的转录起始位点不对应于任何可鉴定的LTR结构。而是,与转录起始位点相关的序列位于富含CpG的结构域中(图2A和2C),并最可能对应于与任何逆转录病毒元件无关的细胞启动子。转录物5'-末端,即tc|ACTTC,落入经典的RNA聚合酶II核心启动子起始基序(yy|ANWYY)内。
使用萤光素酶报告基因,通过离体转染测定进一步研究了含有富含CpG的起始位点的区域(CpG岛,在Deaton和Bird,2011中进行了综述)的启动子活性。如图2D所示,在该测定中包含已鉴定的起始位点的760bp片段充当强启动子(与没有的相比,超过500倍)。在部分缺失突变体中以及如对CpG启动子所预期的当以反义方向放置时,观察到较低的表达(与没有的相比,10到50倍)。
通过亚硫酸氢盐处理分析了鉴定的CpG岛内转录起始位点周围序列的DNA甲基化模式。如图2E所示,大多数CpG在HEMO阴性细胞系(293T、BeWo)中被甲基化,而在表达HEMO的细胞系(iPSC和CaCo-2)中未甲基化。为了进一步了解启动子活性对CpG岛甲基化模式的该依赖性,在BeWo和293T细胞上以0.1至5μM的剂量进行了5-氮杂-2'-脱氧胞苷(5-氮杂-dC)处理(图2F)。处理3天后,可以通过qRT-PCR在BeWo细胞中以低剂量(0.1μM)和在293T细胞中以高剂量(5μM)检测到转录物。值得注意的是,通过类似的5-氮杂-dC处理无法进一步扩增CaCo-2细胞中HEMO基因的高转录水平。总而言之,这些结果表明HEMO表达对CpG启动子的甲基化状态敏感。
HEMO蛋白质的合成和结构:特异性脱落
通过将env ORF引入CMV启动子驱动的表达载体中,并进行离体瞬时转染测定,测试鉴定出的基因产生包膜蛋白的能力。通过用重组蛋白免疫小鼠来产生多克隆抗体和单克隆抗体,该重组蛋白对应于蛋白的推定的SU部分的163个氨基酸的片段(参见方法)。如图3的上图中显示的免疫荧光测定所示,使用抗HEMO抗体,在转染的细胞(而不是用空载体转染的对照细胞)的透化后,可以观察到强烈的标记。此外,HEMO蛋白可以在细胞表面被检测到,如图3的下图中显示的连续的共聚焦图像中未透化的转染的HeLa细胞的细胞膜的特异性免疫荧光标记所证明的,这与HEMO是逆转录病毒env基因一致。
如全细胞裂解液的蛋白质印迹所示(图4A,泳道3),用上述HEMO表达载体转染产生具有大于80kDa的表观分子量的强条带,比对HEMO全长SU-TM蛋白所预期的(理论MW 61kDa)大得多,但与它的糖基化一致(如对逆转录病毒蛋白所预期的)。实际上,用肽N-糖苷酶F(PNGase F)处理细胞提取物以使蛋白去糖基化,可将大于80kDa的条带分解为两条分子量较低的条带(泳道4):约58kDa的主条带,以及48kDa的较弱条带。主条带最可能对应于全长SU-TM蛋白(预期大小为61kDa),而较低条带的大小与单独的SU亚基的大小(预期大小为37kDa)不一致——可能是由弗林蛋白酶位点SU-TM切割产生的(尽管在人HEMO中不是经典的(CTQG代替RXKR,参见下文)。
细胞上清液的分析为48kDa蛋白的起源提供了意想不到的答案。实际上,这种48kDa的蛋白质是细胞上清液中的主要形式(见图4A,泳道6,用PNGase F处理上清液),而在整个细胞提取物中观察到的较大的58kDa的条带(图4A,泳道4,用相似的PNGase F处理)几乎是不可检测的,如对附接细胞膜的全长Env蛋白所预期的那样(图4A,泳道6)。该分泌的48kDa蛋白被糖基化,在未经PNGase-F处理的细胞上清液中以高得多的分子量被观察到(图4A,泳道5)。总而言之,这些数据强烈表明,HEMO蛋白是一种在细胞表面上输出的跨膜蛋白,但其仍可以在上清液中以其MW大于单独SU的MW的蛋白的形式定量释放(脱落)。对于逆转录病毒Env蛋白来说,这种特性是出乎意料的,实际上,使用相同的实验方案和作为阴性对照的用于合胞素-1(HERV env-W)的表达载体未观察到这种特性(图4A,泳道1、2)。
为了进一步表征这种脱落的可溶性蛋白,我们从转染的293T细胞的上清液中纯化了该蛋白(参见“方法”),并使用质谱(MS)表征其序列用于测定其N-和C-末端。如图4B所示,它通过胰蛋白酶或胰凝乳蛋白酶产生的肽的MS分析提供了HEMO蛋白质序列覆盖,结果证明,脱落的蛋白质在其C-末端被截短,主要是在ISD结构域中的位置处,其中两个C-末端位点以不同的丰度鉴定(即Q432和R433的比例为4:1)。在N-末端,HEMO蛋白从位置27开始,即在预测的信号肽切割位点之后2个氨基酸(使用SignalP 4.1Server软件,http://www.cbs.dtu.dk/services/SignalP/)。为了进一步确定脱落的HEMO蛋白的MS大小,通过在指定位置插入终止密码子(图4B、C中用星号(*)标记的:433R-终止密码子,472P-终止密码子和489S-终止密码子)或在预期位置引入共有弗林蛋白酶位点RTKR(人弗林蛋白酶+构建体,H-fur+)构建了几个突变体。然后,对HEMO突变体转染细胞的上清液进行的蛋白质印迹分析清楚地表明,野生型去糖基化的脱落的HEMO蛋白迁移为R433终止密码子突变体。此外,正如预期的那样,H-fur+突变体显示出较小的37kDa条带,与去糖基化SU亚基的预期大小一致。值得注意的是,虽然472和489终止密码子突变体仍包含脱落位点序列(aa 432/433),但不包含跨膜域(aa 490至512),它们被简单地分泌(没有进一步加工成野生型HEMO)蛋白),这表明脱落过程需要将env蛋白锚定在细胞表面。
为了确定是否可以在体内条件下观察到脱落形式的HEMO蛋白,从第一个三个月合法流产以及局部胎盘血(其沐浴胎盘绒毛并可以进行平行分析)回收了胎盘组织(其显示出HEMO基因的高转录水平,图2B),然后提取蛋白质并进行去糖基化以进行蛋白质印迹分析。如图4A泳道7所示,在胎盘组织提取物中可以检测小的48kDa条带(和非常微弱的SU-TM58kDa条带)。在胎盘血液中也检测48kDa的条带,最可能与胎盘分泌的蛋白质相对应。相应凝胶条带中48kDa蛋白的质谱分析(如上所述)证实了免疫学检测的相关性。
经加工的HEMO蛋白的释放使人联想到对于完全无关的病毒(即埃博拉病毒)的病毒包膜蛋白所观察到的,对于其进一步证实裂解是由细胞相关的ADAM蛋白介导的(Dolnik等人,2004)。因此,我们测试了金属蛋白酶的化学抑制剂(包括ADAM和MMP蛋白(Dolnik等人,2004;Okazaki等人,2012;Weber和Saftig,2012))是否对293T转染细胞中的HEMO脱落有任何影响。如图5所示的,广泛范围的ADAM和MMP抑制剂巴马司他和马立马司他以及MMP抑制剂GM6001以不同程度和剂量依赖性方式明显抑制上清液中的HEMO释放,在细胞裂解液中存在非分泌形式的可见积累。这些实验表明,在体内,HEMO脱落可能是由一种或几种金属蛋白酶驱动的,已知这些酶通常在胎盘细胞中存在。
体内HEMO表达:妊娠女性血液循环中的HEMO释放
图2B所示的人体组织的图上的RT-qPCR和图4所示的蛋白质脱落的综合结果使我们假设可以在血液循环中更具体地在妊娠女性中检测到HEMO。因此,收集血清并通过蛋白质印迹法测定是否存在脱落的HEMO。用小麦胚芽凝集素(WGA)处理血清以分离糖基化的蛋白质,其随后被去糖基化。如图6的下图所示,hCG-β蛋白(其是众所周知的妊娠早期生物标志物(Cole,2009))在男性和非妊娠女性的外周血中均显示检测不到的水平(泳道2、3),而在妊娠的第一个三个月的女性中观察到非常高的水平(20kDa条带,泳道4至6),其在较晚的阶段有所下降(泳道7至12)。值得注意的是,还可以在妊娠女性的外周血中检测到去糖基化的脱落的HEMO形式(48kDa,先前在胎盘血液中鉴定出来,图4A泳道8和图6的上图,泳道1),从在第一个三个月妊娠中的微弱的水平开始(图6的上图,泳道4-12)。随着妊娠的进展,HEMO蛋白的水平非常显著地增加,这与妊娠期间胎盘重量的大量增加相一致。峰值处的HEMO浓度可以估计为1-10nM的范围(通过对纯化的脱落的重组HEMO蛋白的系列稀释进行的蛋白质印迹比较分析),即比峰值处hCG的浓度(T1)低约1至2个对数,并且对于进一步比较,与妊娠女性血液中峰值处的甲胎蛋白的浓度(T2)大致相同。值得注意的是,在男性和非妊娠女性血液中也观察到脱落的HEMO蛋白的微弱水平(图6,上图,泳道2和3),这与其在其他器官(如肾脏)中的不可忽略的表达相一致(参见图2B的RTqPCR结果)
如图6所示,在较高和较低MW处观察到的条带可能对应于HEMO蛋白的次要选择性加工/脱落形式(即,除27-432/433片段以外;参见用于计算氨基酸位置的图1C;SEQ ID NO:9;SEQ ID NO:10)。这些选择性加工/脱落的形式包括片段,其从氨基酸位置27(信号肽后的第一个氨基酸)延伸直至(并包括)选自位置450-480和380-420的氨基酸位置(SEQ ID NO:35-55和13-23)。这些其他HEMO可溶性片段对应于图13中的切割位点n°2和n°3(切割位点n°1:氨基酸位置27到432-433(主切割位点);切割位点n°2=氨基酸位置27至450-480;切割位点n°3=氨基酸位置27至380-420)。
胎盘中产生HEMO的细胞的鉴定
人胎盘是绒毛膜受血类型的,其特征在于存在与母体胎盘血液直接接触并由其沐浴的胎儿绒毛(图7A)。这些绒毛来自胎儿来源的绒毛膜,并在表面合胞体层(合体滋养层(ST))下方有一个内部单核细胞滋养层(CT)(在Bischof等人,2005;Maltepe和Fisher,2015中综述)。胎盘侵入母体子宫部分,其锚定以侵袭性绒毛外滋养层细胞(EVT)为特征的绒毛。
为了精确定位胎盘中HEMO的表达,随后在来自流产病例的第一个三个月胎盘组织切片上进行了免疫组织化学实验。如图7B和7C所示,用单克隆抗-HEMO抗体而不是如图B所示的对照同种型(4倍放大)获得了特异性染色。在图C所示的四个放大图(放大60倍)中(对应于图B的加框的胎盘绒毛和绒毛膜),在滋养层细胞(包括绒毛滋养层细胞(CT)、绒毛滋养层细胞(EVT)和绒毛膜滋养层细胞)中观察到了强烈的染色,这表明这些细胞确实产生了HEMO。在合体滋养层(ST)中观察到更弥漫性的染色,ST是由CT融合产生的,并参与胎儿和母体血液之间的交换。
总之,用上述抗HEMO抗体对胎盘进行的免疫组织化学分析显示基本上在滋养层水平上的强标记,并且与母体血液中观察到的HEMO脱落是一致的(图6)。
发育中HEMO表达的特征谱
为了深入了解HEMO在胚胎发育中的可能的参与性,我们通过数据挖掘进一步分析了存储在SRA-NCBI平台上的一系列人RNA-seq实验,对应于不同的发育阶段(Yan等人,2013;Xue等人,2013;Friedli等人,2014;Uhlén等人,2015)。进行了一组人基因的表达特征谱的提取,在图8A-C中显示了HEMO、合胞素1(Env-W)和合胞素2(Env-FRD)env基因以及在胎盘(GCM1)或干细胞(OCT4/POU5F1)中表达的特定基因的结果。对于每个感兴趣的基因,已验证读长计数在编码序列上均等分布(参见“方法”)。图8A清楚地表明,HEMO具有广泛的表达特征谱,在胚胎发育的早期表达,从8-细胞阶段开始直至胚泡后期,并在衍生的胚胎干细胞中永久表达,从传代的第0代直到传代的第10代。在干细胞中发现的HEMO基因RNA-seq表达特征谱证实了图2B所示的RT-qPCR结果,并且明显不同于两个人合胞素基因所观察到的结果:在发育早期表达的Env-W在人干细胞中被完全下调,Env-FRD仍然几乎不可检测。如预期的那样,在胎盘组织的RNA-seq样品中发现了所有三个env基因(连同胎盘GCM1特异性基因)(图8B)。最后,如Friedli等人,2014所述,在分化的体细胞重编程为iPSC的重编程实验中分析了HEMO的RNA-seq表达,并且在图8C中报道的命中结果突出显示了HEMO基因的特定重编程(对于Env-W和Env-FRD未观察到),这与OCT4/POU5F1转录因子表达的预期特征谱相似。值得注意的是,如图8D所示,在蛋白质水平上,我们可以通过对培养物中iPSC的蛋白质印迹分析来验证上面揭示的HEMO基因表达也导致HEMO蛋白质脱落,其中在iPSC上清液中检测到48kDa的条带。
结论是,HEMO基因表现出特定的表达模式(包括ES细胞),一种可能与非LTR起源的特定富含CpG的启动子的“捕获”有关的特征,其真正从至少滋养层细胞和干细胞产生可溶性蛋白质形式的HEMO。
HEMO在肿瘤中的表达
为了深入了解人肿瘤中HEMO基因的可能表达,我们使用了Lukk等人,2010阐述的数据集E-MTAB-62对微阵列数据进行了计算机分析,该数据集包括来自正常组织的1033个样品和来自从各种ArrayExpress(AE)和Gene Expression Omnibus(GEO)研究获得的肿瘤组织的2315个样品。在正常组织中,如从图2B中的RT-qPCR分析所预期的,基本上在胎盘组织中观察到了显著水平的表达和在肾脏中观察到有限程度的表达(图9A)。如图9B所示,在几种肿瘤中,在同一器官的样品中检测到异质性(由表示为黑点的离群值表示),在某些情况下,有证据表明HEMO基因的高水平表达:例如在种系中、肝、肺或乳腺肿瘤中,其中最明显的异质性是卵巢肿瘤所观察到的。在后一种情况下,进一步搜索与各种组织型的卵巢癌相关的注释数据(Cho和Shih,2009;Kurman和Shih,2016),导致最高值与特定的肿瘤组织型(主要是透明细胞癌)相关。
为了扩大该数据集,收集了来自其他5个GEO数据库的卵巢肿瘤样品,并将其与E-MTAB-62一起进一步标准化(参见方法),总共得到479个肿瘤样品。如图9C所示,在透明细胞癌(60个样品)中观察到该基因的较高表达值,而在子宫内膜样癌样品(96个样品)中观察到该基因的较小程度的表达值。在浆液性癌组织型(289个样品,尽管有一些异质性)和粘液组织型(34个样品)中未观察到明确的HEMO基因上调。
与这些转录数据一致,与对照同种型染色相比,使用抗HEMO单克隆抗体对正常组织相对透明细胞癌卵巢组织进行的免疫组织化学分析显示肿瘤透明细胞的高度特异性的染色(图9D)。
HEMO插入日期和跨哺乳动物基因组的保守性
捕获基因的生理作用的一个强烈暗示是其在进化中的保守性以及其所经受的选择的性质。因此,我们通过计算机筛选、PCR克隆和测序对在真哺乳亚纲哺乳动物中的HEMO基因进行了广泛的搜索,并将其进一步扩展到有袋动物中(图1中的系统树显示HEMO与env-panMars具有同源性,并参见下文)。这些分析还旨在确定将HEMO插入哺乳动物祖先基因组的日期,确定各种物种中已鉴定基因的编码能力,并在某些情况下确定将克隆的基因引入表达载体并转染293T细胞后是否存在脱落的HEMO蛋白。总体数据汇总在图10中。我们通过使用MultiPipMaker同线性构建工具在所有哺乳动物基因组中均保守的RASL11B和USP46基因(各自距人HEMO基因约120kb)之间进行了同线基因座的计算机分析。对15kb HEMO区域的聚焦(图10A)显示,HEMO基因在劳亚兽总目和灵长总目的放射状分布(radiation)之前进入哺乳动物的基因组,即在100-120Mya之间(37),在Afrotherian(象、马岛猬)和Xenarthran(犰狳)中均未发现。它还允许鉴定灵长类动物(以及在啮齿动物中作为非常简并的序列)以及一系列反刍动物和食肉动物的劳亚兽总目中的直系同源HEMO基因。进一步的分析进一步表明,在所有猿猴(图11A和11B)中,以及出乎意料的是,在猫(图12A-E)中,HEMO基因已作为全长蛋白质编码序列保守。鉴定出的全长HEMO ORF显示很高的相似性,氨基酸同一性为84%到99%(图10B,下部三角形),并且显示出纯化选择的迹象,所有成对物种之间的非同义与同义的比(dN/dS)均低于统一(平均值0.46),除了非常接近的物种(例如人/黑猩猩),其突变数不足以提供显著的dN/dS值。例如,如对真正的细胞基因所预期的,在大猿猴和旧大陆猴之间观察到0.29-0.42的dN/dS值(OWM;图10B,上三角)。
为了测试在人中观察到的特异性脱落特性的保守性,如上所述克隆了一系列猿猴HEMO基因,将其引入phCMV表达载体中,并通过转染293T细胞进行了测试。如图10C所示,来自所有被测物种的HEMO基因编码一种蛋白质,该蛋白质可以被人HEMO抗体检测到(但对于遥远的新大陆猴(NWM)强度较低),在所有情况下都证明在细胞上清液中的蛋白脱落。即使在HEMO蛋白保留了功能性弗林蛋白酶位点的NWM分支中(参见图11A和11B),该蛋白的脱落形式也与较小的SU形式一起释放到上清液中。蜘蛛猴蛋白观察到的较小尺寸与该基因的5'部分中的10个氨基酸的小缺失(氨基酸182至191,图11A和11B)一致。因此,HEMO蛋白的脱落似乎在猿猴中是一个非常保守的特性,这一特征与对该基因的纯化选择一起提示了这种分泌蛋白的可能作用,特别是在妊娠的女性中。值得注意的是,在猿猴中,脱落蛋白形式的3'结构域在序列水平上的保守性要低得多,除了跨膜锚定结构域最可能是在细胞膜上脱落HEMO蛋白所必需的(见图11A和11B)。
有袋动物中的相关的HEMO基因
为了确定在无法鉴定直系同源基因的某些物种中是否存在类似HEMO的序列,进行了较不严格的BLAST搜索,该搜索在有袋动物中提供了命中,但仍未在Afrotherian和Xenarthran中提供命中。值得注意的是,鉴定出的最接近的env基因是我们先前鉴定过的保守的有袋动物env基因(Cornelis等人,2015),即env-panMars(参见图1D中的系统树)。
该保守的有袋动物包膜蛋白与HEMO的氨基酸序列比较表明只有20%至30%的相似性,但是猿猴、猫和有袋动物(来自负鼠、小袋鼠和袋獾)序列的比对(图12A-E)显示出在细胞外结构域上明显的同一性区域。由于跨膜域上游的终止密码子,env-panMars序列对应于截短的env。因此,预期编码的蛋白质是可溶性蛋白质。如图12D中用HA标记的env-panMars蛋白所示,负鼠和小袋鼠env蛋白确实在用相应表达载体转染的细胞的上清液中释放。在来自小袋鼠转染细胞的上清液中,还可以观察到15kDa的微弱条带,这可能对应于在简并弗林蛋白酶位点(FHKR)部分裂解后产生的HA-标记的-TM亚基。对于负鼠(弗林蛋白酶位点的序列,VHKP)未观察到类似的条带。
此外,对小袋鼠的卵巢RNA转录物进行的RACE-PCR实验(图12E)将转录起始位点定位在富含CpG的区域内,在启动子区域有多个剪接的RNA,如对HEMO基因所观察到的。对于负鼠,在UCSC中汇编的RNAseq数据(图12E)显示相似的组织(具有相同的转录起始位点,位于同源CpG岛中,并且使用相同的E3外显子)。总而言之,这些数据可能表明猿猴和有袋env基因都具有共同的逆转录病毒祖先,并且它们可能对应于相关感染性逆转录病毒的独立捕获。
讨论
在这里,我们鉴定了具有全长蛋白质编码序列的内源性逆转录病毒包膜基因HEMO,其在猿猴包括人中是保守的,并且由于它脱落并释放在细胞外培养基中而具有对逆转录病毒包膜前所未有的特征,其在妊娠女性的血液中的水平很高。在大多数哺乳动物中,已经报道了几种逆转录病毒包膜基因“捕获”,并且在许多情况下,这些基因被证明是“合胞素”,即在胎盘形成中起作用的基因,具有从其参与有益于宿主的生理功能的祖先逆转录病毒祖细胞遗传而来的经典免疫抑制和促融合特性(Mangeney等人,2007;Lavialle等人,2013;Denner 2016)。目前鉴定出的HEMO基因共有合胞素的某些特性,但却是不同的,因为它在细胞外环境中脱落,且没有促融合活性的证据。此外,尽管胎盘是其表达最高的器官,但其表达模式并不严格限于胎盘。然而,它在进化中与真正基因的特征的保守性(即纯化选择的证据),以及与HEMO共有富含CpG的启动子的在遥远的有袋动物进化枝(其与真哺乳亚纲哺乳动物分离超过150Mya)中捕获并保守的密切相关的逆转录病毒env基因的鉴定及其蛋白产品在细胞外培养基中释放的能力(在这种情况下,是由于位于TM亚基的跨膜域上游的终止密码子所致(Cornelis等人,2015))强烈暗示了在猿猴中的潜在的生理作用(见下文)。
鉴定出的逆转录病毒env基因属于不良表征且适度重复的ERV家族,即MER34家族,仅具有高度简并的元件(Vargiu等人,2016;Toth和Jurka,1994;Jurka等人,2005)。可以鉴定出HEMO的基因组基因座的结构分析仅揭示了祖先原病毒的痕迹,具有高度重排的基因组织。值得注意的是,LTR结构在HEMO的3'仅勉强检测到,并且5'LTR不再存在。实际上,HEMO转录物的RACE-PCR分析揭示了富含CpG的结构域中的转录起始位点,与LTR无关,但显然具有启动子活性,如培养的细胞中报告质粒的转染所显示的(启动子处于两个方向上)。这个异常的启动子很可能是引起HEMO基因表达的特定模式的原因,该基因在离体的一系列干细胞中以及在体内在发育中的胚胎的非常早期都具有活性。编码的蛋白质本身具有一些非同寻常的特征,因为它不再具有弗林蛋白酶切割位点(尽管对于新大陆猴基因组中存在的HEMO直系同源物仍可以证明存在功能正常的弗林蛋白酶切割位点),更重要的是因为它通过导致其胞外域脱落到细胞外培养基中的金属蛋白酶介导的加工而在细胞膜被特异性切割-对于包括新世界猴在内的所有猿猴均观察到。脱落是对于逆转录病毒包膜以前尚未报道的过程,尽管这样的过程已被细胞机器用于参与例如信号传导、细胞运动和迁移的一系列细胞基因(例如Notch、TNF-α)。值得注意的是,在埃博拉丝状病毒包膜蛋白的情况下,也发生了密切相关的分子事件,其通过跨膜域上游的特定ADAM介导的切割而部分脱落在细胞培养基中。同样在这种情况下,脱落的蛋白在血液中被检测到,并预期通过对抗Env抗体产生诱饵作用或甚至通过在被感染的个体中直接的免疫激活和增加的血管透性而在相关的病理学中发挥关键作用。目前观察到的HEMO逆转录病毒包膜蛋白的脱落事实上在无关病毒(例如丝状病毒和逆转录病毒)之间建立了联系。在进化水平上,这可能暗示了不同类别的病毒元件之间的基因捕获,和/或通过脱落过程触发系统性效应的趋同进化。
另一个问题涉及HEMO在人生理学和/或病理学中的可能作用。由于i)由于在猿猴中对该基因的高水平的纯化选择,ii)有袋动物中由相似启动子类型转录的基因的保守性和编码在序列和成熟蛋白质结构上都密切相关的蛋白质,iii)在发育中表达的相当不常见的特征谱,和iv)由蛋白质的胎盘大量脱落到血液中,可以预期HEMO最可能在妊娠中发挥作用。针对病毒和/或逆转录病毒的感染的保护作用也很重要。这种保护作用可以通过经典的“干扰”通过隔离进入病毒的受体来介导,这种作用可以通过血液循环中HEMO蛋白的释放和这种受体的直接靶向而进一步增强。另外,HEMO可能具有细胞因子样或激素样活性,其可能在妊娠中起作用。还应考虑到HEMO在发育中的作用,考虑到它的表达在早至8-细胞阶段被观察到,并在随后的所有胚胎阶段均持续存在。值得注意的是,其他ERV(包括HERV-H和HERV-K-)具有相关的表达特征谱,并且最近已证明大量HERV-H RNA是人中的细胞“干细胞特性”的标志物,并可能通过转录作用和/或特定的ERV驱动的转录物在维持人干细胞的多能性中发挥作用。就HEMO而言,其明确编码可以被进一步检测的逆转录病毒包膜蛋白,其表达不仅可能是“干细胞特性”标志物,如对于上述高度重申的ERV,而且其编码的蛋白自身也可能构成了多能性的分子效应子。最后,我们可以揭示一系列人肿瘤中的HEMO基因表达,并证明卵巢肿瘤中的HEMO蛋白表达。必须进行基于大量肿瘤和对照组织的进一步免疫学分析以将HEMO蛋白表达与卵巢肿瘤中表达的其他逆转录病毒Env的特定肿瘤组织型明确相关,并评估该蛋白是否可以被认为是给定肿瘤状态的可靠的标志物,并暂时作为免疫治疗方法的可能靶标。
现在正在进行实验以鉴定HEMO蛋白的细胞相互作用伴侣,以进一步表征HEMO在正常发育和病理过程发作中的体内功能。
实施例2:mAb产生
如上文实施例1中所述,通过用编码HEMO SU包膜亚基的163个氨基酸(aa 123至286;SEQ ID NO:8)的DNA片段免疫小鼠来产生抗体。
使用标准细胞融合产生在以上实施例1中提及的杂交瘤2F7(IgG2a同种型)以及其他杂交瘤。
根据布达佩斯条约的规定,将杂交瘤保藏在CNCM。CNCM是Collection Nationalede Culture de Microorganismes(Institut Pasteur;28,rue du Docteur Roux;75724Paris CEDEX 15;France)。
表6:保藏在CNCM的mAb
杂交瘤 CNCM保藏编号 CNCM保藏日期 已用于抗体生产的抗原
2F7-E8 I-5211 2017年6月20日 SEQ ID NO:8
位于SEQ ID NO:1的位置280至400的121个氨基酸的HEMO胞外域片段(称为HST5)用作抗原:
280-TWWLTGSNLTLSVNNSGLFFLCGNGVYKGFPPKWSGRCGLGYLVPSLTRYLTLNASQITNLRSFIHKVTPHRCTQGDTDNPPLYCNPKDNSTIRALFPSLGTYDLEKAILNISKAMEQEFS-400(SEQ ID NO:988)
将其克隆到真核表达载体中作为N-末端-Strep标签(StrepTaglinker(GGGS)x3)-StrepTag)-HEMO片段,并在果蝇S2细胞中表达。通过两步法从上清液中纯化抗原-StrepTag蛋白片段:首先在Strep Tactin柱上,其次在HiLoad 16/60Superdex 75柱上。合并级分并调节至1mg/ml,并在第0天、第15天、第45天和第60天的4次注射用于免疫小鼠和大鼠。在第25天和第55天通过ELISA测试多克隆抗体的产生。注射Streptag-HST5后回收血清多克隆抗体。多克隆抗体通过蛋白质印迹、ELISA和流式细胞术进行测试。还完成了单克隆抗体的克隆。
Streptag-HST5肽的序列(SEQ ID NO:989):
MTMITPSLHAGLCILLAVVAFVGLSLGASWSHPQFEKGGGSGGGSGGGSWSHPQFEKGADDDDKTGTWW LTGSNLTLSVNNSGLFFLCGNGVYKGFPPKWSGRCGLGYLVPSLTRYLTLNASQITNLRSFIHKVTPHRCTQGDTDN PPLYCNPKDNSTIRALFPSLGTYDLEKAILNISKAMEQEFS
Strep标签:斜体
接头:粗体
Hemo-HST5序列aa 280至400:带下划线
实施例3:(特异性地)结合HEMO胞外域的膜附着部分[其在可溶性片段脱落后保留在细胞表面上]的抗体的产生
可以将编码HEMO蛋白的胞外域部分的57个氨基酸(aa 433至489;SEQ ID NO:990)(对应于脱落后片段)的DNA片段插入pET28b中,并在实施例1中描述的BL21细菌中表达,并将重组蛋白片段用于免疫小鼠。
可以合成与膜附着的胞外域蛋白(aa 433至489;SEQ ID NO:990)的部分相对应的合成肽(10至20个氨基酸),并将其与载体蛋白例如KLH(匙孔血蓝蛋白)缀合。将肽施用于小鼠以进行免疫。
收集产生的抗体。使用标准细胞融合产生杂交瘤。
实施例4:一个大的肿瘤实验组的筛选/组织分型
HEMO蛋白可以被认为是潜在的癌症生物标志物和有希望的治疗靶标。根据实施例1中所述的方案,通过免疫组织化学筛选肿瘤组织样品中是否存在HEMO蛋白,特别是是否存在HEMO胞外域的(N-末端)可溶性片段和/或是否存在HEMO胞外域HEMO的膜锚定(C-末端)片段(片段,其在可溶性片段脱落后保留在细胞表面上)。实施例2和/或3的抗体,更具体地单克隆抗体可以用于该检测。对照(非肿瘤)组织进行平行筛选。
肿瘤组织包括但不限于:
-卵巢
-子宫:子宫内膜、子宫颈、妊娠(宫颈癌)
-乳腺
-肺
-结肠
-生殖细胞
-头颈
-骨髓
可以使用实施例2和3所述的抗体,通过FACS分析,从新鲜的肿瘤样品(更具体地是活检样品)中分离表达HEMO的细胞,并进一步分析用于细胞标志物的鉴定,更具体地,用于鉴定干细胞标志物。对照(非肿瘤)细胞进行平行分析。
实施例5:血液检测测试的优化(用于诊断、预后和进化)
ELISA测定可用于检测正常和病理条件下HEMO血清水平的变异性和/或跟踪病理条件下的变异性。这种测定可以包含实施例2中描述的抗体。
实施例6:肿瘤中HEMO蛋白的表达
1-微阵列
方法
如实施例1(微阵列数据挖掘)所示,对来自肿瘤表达项目(expO)数据集(GEO登录号GSE2109)的其他数据进行了微阵列的计算机分析,并根据肿瘤的主要部位绘制了箱线图表示形式。
结果
微阵列数据集分析(图9A和9B,以及图14)显示了许多肿瘤类型中的异源表达。使用NIH-GDC数据门户网站的TCGA RNAseq数据集(图15A,https://portal.gdc.cancer.gov/projects)也观察到了这一点。
总之,具有高HEMO表达的肿瘤是:
妇科癌症:
ο卵巢:组织学亚型“透明细胞癌”和“子宫内膜样”
ο子宫:子宫内膜和宫颈癌
乳腺癌
肺癌
消化道癌症:结直肠,胃,肝
头颈癌
生殖细胞癌
尿路上皮癌(包括膀胱)
骨髓癌
并且具有较小程度的肿瘤来自肾脏、前列腺和脑。
异质性可能取决于样品中癌细胞的数量以及肿瘤阶段。
2–TGCA RNAseq
方法
从TCGA网站下载了TCGA RNAseq-肿瘤的FastQ文件,从TCGA网站portal.gdc.cancer.gov/projects下载了从TCGA RNAseq-肿瘤的FastQ文件,并定量了HEMO的读长和一组管家基因,并使用R-DESeq2软件包标准化。Hemo表达使用R ggplot2软件包显示为箱线图。
结果
图15B,I:显示了对照和肿瘤组织的病例数。每个点代表一个病例。
图15B,II:显示了箱线图放大图,不包括最高值。
箱线图显示,与HNSC和UCEC中的正常对照组织相比,HEMO在肿瘤中的表达高而异质。在3个数据集中观察到了HEMO表达的异质性,其中UCEC数据集中的数值最高(图15B)。
3–HEMO在来自Gustave Roussy的肿瘤样品中的表达
方法
如下对代表性实验组(每种肿瘤类型20至30个样品:卵巢、子宫、乳腺和头颈)进行分析:
-按照指示处理肿瘤组织和正常对照组织的冷冻样品:
ο蛋白质印迹(参见实施例1):在20个50μM的冷冻切片上进行蛋白质提取,并使用单克隆抗体2F7(CNCM I-5211);
ο在5μm的对照冷冻切片上进行组织染色(苏木精曙红番红花);和
-如下用单克隆抗体2F7(CNCM I-5211)在相应的福尔马林固定石蜡包埋(FFPE)样品上进行免疫化学(IHC):处理石蜡切片以进行热诱导的抗原回收(Tris·EDTA,pH 9;Abcam)并与单克隆小鼠抗HEMO(2F7,CNCM I-5211)抗体(1/10稀释)或对照IgG2a同种型孵育过夜。使用过氧化物酶/二氨基联苯胺小鼠Power
Figure BDA0002369588140000911
试剂盒(ImmunoVision
Figure BDA0002369588140000912
)将染色可视化。
结果
卵巢癌(图16A、16B)
蛋白提取物的蛋白质印迹分析(使用2F7 mAB)显示HEMO在胎盘样品以及卵巢子宫内膜样(E)和透明细胞癌(C1至C5)样品中的表达。在正常卵巢组织(N1和N2)中未检测到表达。将膜与抗微管蛋白Ab重新杂交以定量样品中的蛋白质量。
来自两名患者的福尔马林固定的卵巢子宫内膜样肿瘤的免疫组织化学分析(使用2F7 mAb)显示,HEMO在特定肿瘤细胞中高表达。患者II的HES部分中的详细信息显示了肿瘤细胞中的异质性。
子宫癌(图17)
在不同的放大倍数下的HES和IHC(使用2F7 mAb)显示HEMO蛋白在来自两名患者的内膜癌的特定肿瘤细胞中特异性表达。在相同切片上的正常组织中未检测到HEMO表达。
乳腺癌(图18)
在不同放大倍数下的HES和IHC(使用2F7 mAb)显示正常对照乳腺组织中没有HEMO表达,并且显示在两名具有不同分子特征的乳腺肿瘤患者中HEMO以不同水平表达:在HER2+乳腺癌的肿瘤细胞中观察到高染色并在三阴性乳腺癌中观察到癌和更弥漫的染色。
4–HEMO阳性肿瘤细胞的表征
从肿瘤中分离在干细胞(ES和iPSC)和胎盘滋养层细胞(均为高增殖性的HEMO阳性细胞)中表达的HEMO,以表征其潜在的增殖特性。肿瘤-HES和IHC(参见实施例6,第3部分)显示了肿瘤样品中HEMO阳性细胞的特定形态,这些细胞可以被特异性抗体(药物偶联的单或双特异性)靶向。
为了研究在肿瘤中靶向HEMO阳性细胞的潜力和实用性,将这些细胞分离并通过流式细胞仪分选(使用实施例2和3中所述的抗HEMO抗体),然后与HEMO阴性相比分析它们的增殖状态细胞。在不同肿瘤类型中的HEMO阳性和阴性细胞上进行RNAseq分析,并进行比较以寻找特定的分子途径和干细胞标志物的表达。还研究了离体模型和PDX-小鼠的增殖特性。
实施例7:开发用于检测循环HEMO脱落蛋白的血液ELISA测定
在生理条件下,通过蛋白质印迹法在人血清的去糖基化样品上检测蛋白质,发现在妊娠期间其水平升高(图6)。目的是开发一种灵敏的测定法,以检测HEMO阳性肿瘤患者或病理妊娠女性的血清水平的变化。
开发了一种夹心ELISA测试(图19A),该测试由以高浓度(在
Figure BDA0002369588140000921
平板的每个孔中有200ng捕获抗体)包被的至少一种纯化的单克隆抗体以捕获血清HEMO脱落蛋白以及针对该蛋白质的不同表位的第二多克隆或单克隆抗体以检测捕获的HEMO组成。
方法
试剂:
-PBST:PBS 1X+0.1%吐温20
-BSA(牛血清白蛋白)
-捕获抗体(兔Hemo-TM-捕获多克隆抗体,SIGMA-
Figure BDA0002369588140000934
产品名称=Anti-ERVMER34-1)
-一抗(参见实施例1:小鼠抗HEMO多克隆抗体)或纯化的2F7mAb,或杂交瘤的上清液,或ScFv HIS-标签或兔-Fc mAb
-二抗(抗小鼠HRP),抗HIS HRP或抗兔HRP
-显色溶液TMB
-磷酸1M
材料:
Figure BDA0002369588140000931
板(Nunc,Thermo
Figure BDA0002369588140000932
)
-移液器
Figure BDA0002369588140000933
读板器
-封口膜
步骤:
第-1天:
-在Maxisorp板的每个孔中包被200ng捕获抗体
-密封板并在4℃下孵育过夜
第0天:
-保留包被溶液
-用100μL PBST(PBS 1X+0.1%Tween)+5%BSA饱和平板,并在室温下孵育1h
-在每个孔中添加50μL抗原溶液(通常在SVF以1:50稀释的HH1转染细胞的上清液)或样品或血清样品
-在每个孔中用300μL PBST洗涤板3次
-在PBST+1%BSA(1/1000)中制备一抗溶液
-在每个孔中添加50μL一抗溶液,并在室温下孵育至少1h
-在每个孔中用300μL PBST洗涤板3次
-在PBST+1%BSA(1/5000)中制备二抗溶液
-在每个孔中加入50μL二抗溶液,并在室温下孵育45分钟
-在每个孔中用300μL PBST洗涤板3次
-将溶液A混合到溶液B中(比例1:1)后,添加50μL显色溶液
-加入50μL磷酸(1M)以终止反应
-用读板器在450nm处读板
结果
用ELISA测定获得的曲线(图19B)显示的结果与通过蛋白质印迹检测妊娠女性外周血中的HEMO的结果相同(图6):妊娠时间越长,检测的HEMO越多。
实施例8:针对HEMO-胞外域的C-末端部分产生的抗体
脱落后,胞外域的C-末端部分(即主要的脱落位点(SEQ ID NO:1的432-433)和跨膜域的起点(SEQ ID NO:1的492位附近)之间)仍然存在于细胞膜的细胞外侧,由HEMO的下游跨膜区域锚定。脱落后HEMO的该N-末端部分可由特定抗体接触。
为了高效靶向产生HEMO的肿瘤细胞,开发了用于进一步药物缀合物Ab靶向的抗体。
方法
从SEQ ID NO:1的位置387到471即在脱落位点QR的两侧的85个氨基酸的HEMO胞外域片段(称为HTM5)用作抗原:
387-AILNISKAMEQEFSATKQTLEAHQSKVSSLASASRKDHVLDIPTTQRQTACGTVGKQCCLYINYSEEIKSNIQRLHEASENLKNV-471(SEQ ID NO:919)
将其作为N-末端-Strep-标签(StrepTaglinker(GGGS)x3)-StrepTag)-HEMO片段克隆到真核表达载体中,并在果蝇细胞S2中表达。通过两步方法从上清液中纯化HTM5-StrepTag蛋白片段:首先在Strep Tactin柱上,其次在HiLoad 16/60Superdex 75柱上。合并级分并调节至1mg/ml,并用于在第0天、第15天、第45天和第60天的4次注射用于免疫小鼠和大鼠。在第25天和第55天通过ELISA测试多克隆抗体的产生。在注射Streptag-HTM5后回收血清多克隆抗体。通过蛋白质印迹、ELISA和流式细胞术测试多克隆抗体。实验中只使用了含有针对单独的StrepTag-HTM5肽的多克隆抗体的一只小鼠的血清(图20A和20B)。还完成了单克隆抗体的克隆。
Streptag-HTM5肽的序列(SEQ ID NO:920):
MTMITPSLHAGLCILLAVVAFVGLSLGASWSHPQFEKGGGSGGGSGGGSWSHPQFEKGADDDDKTGAIL NISKAMEQEFSATKQTLEAHQSKVSSLASASRKDHVLDIPTTQRQTACGTVGKQCCLYINYSEEIKSNIQRLHEASE NLKNV
Strep标签:斜体
接头:粗体
Hemo-HTM5序列aa 387至471:下划线
为了测试小鼠pAb-antiHTM5是否可以检测蛋白质的天然形式以及脱落位点的两侧,即脱落-HEMO的C-末端和膜附着的HEMO的N-末端,各种产生HEMO的载体被构建并转染到293T细胞中:
1.全长HEMO-pHCMV载体
2.SU-HEMO-pHCMV载体(SEQ ID NO:1的aa 1至351=SEQ ID NO:921)
3.TM-HEMO-pHCMV载体(从aa 34至352的内部缺失=SEQ ID NO:1的1-33+353-563):
MGSLSNYALLQLTLTAFLTILVQPQHLLAPVFRTQGDTDNPPLYCNPKDNSTIRALFPSLGTYDLEKAILNISKAMEQEFSATKQTLEAHQSKVSSLASASRKDHVLDIPTTQRQTACGTVGKQCCLYINYSEEIKSNIQRLHEASENLKNVPLLDWQGIFAKVGDWFRSWGYVLLIVLFCLFIFVLIYVRVFRKSRRSLNSQPLNLALSPQQSAQLLVSETSCQVSNRAMKGLTTHQYDTSLL(SEQ ID NO:922)
4.脱落后-HEMO-pHCMV载体(从aa 34至432的内部缺失=SEQ ID NO:1的1-33+433-563):
MGSLSNYALLQLTLTAFLTILVQPQHLLAPVFRRQTACGTVGKQCCLYINYSEEIKSNIQRLHEASENLKNVPLLDWQGIFAKVGDWFRSWGYVLLIVLFCLFIFVLIYVRVFRKSRRSLNSQPLNLALSPQQSAQLLVSETSCQVSNRAMKGLTTHQYDTSLL(SEQ ID NO:923)
转染后,使用HTM5-pAB通过蛋白质印迹分析任一细胞裂解液(图20A)或使用小鼠pAB-HTM5通过流式细胞术分析细胞(图20B)。
小鼠和大鼠的免疫还通过与KLH(钥孔血蓝蛋白)蛋白质载体连接(由于所述人HEMO胞外域片段的C-末端的半胱氨酸氨基酸)的其他人HEMO胞外域片段(参见下文)进行:
表7.用于产生针对HEMO胞外域的C-末端部分的抗体的人HEMO胞外域片段。
从氨基酸 至氨基酸 人HEMO胞外域片段 SEQ ID NO:
466 492 ENLKNVPLLDWQGIFAKVGDWFRSWGY 924
466 491 ENLKNVPLLDWQGIFAKVGDWFRSWG 925
466 490 ENLKNVPLLDWQGIFAKVGDWFRSW 926
466 489 ENLKNVPLLDWQGIFAKVGDWFRS 927
466 488 ENLKNVPLLDWQGIFAKVGDWFR 928
467 492 NLKNVPLLDWQGIFAKVGDWFRSWGY 929
467 491 NLKNVPLLDWQGIFAKVGDWFRSWG 930
467 490 NLKNVPLLDWQGIFAKVGDWFRSW 931
467 489 NLKNVPLLDWQGIFAKVGDWFRS 932
467 488 NLKNVPLLDWQGIFAKVGDWFR 933
468 492 LKNVPLLDWQGIFAKVGDWFRSWGY 934
468 491 LKNVPLLDWQGIFAKVGDWFRSWG 935
468 490 LKNVPLLDWQGIFAKVGDWFRSW 936
468 489 LKNVPLLDWQGIFAKVGDWFRS 937
468 488 LKNVPLLDWQGIFAKVGDWFR 938
468 486 LKNVPLLDWQGIFAKVGDW 939
465 492 SENLKNVPLLDWQGIFAKVGDWFRSWGY 981
465 491 SENLKNVPLLDWQGIFAKVGDWFRSWG 982
465 490 SENLKNVPLLDWQGIFAKVGDWFRSW 983
465 489 SENLKNVPLLDWQGIFAKVGDWFRS 984
465 488 SENLKNVPLLDWQGIFAKVGDWFR 985
465 484 SENLKNVPLLDWQGIFAKVG 986
473 492 LLDWQGIFAKVGDWFRSWGY 987
结果
HTM5抗体(小鼠多克隆抗SEQ ID NO:1的aa 387-471=SEQ ID NO:919)可以检测天然形式的(图20A–20B):
-全长HEMO
-HEMO的TM部分,而不是SU
-胞外域的C-末端部分(aa 433-471)。
实施例9:通过CrispR-Cas9获得HEMO的KO(敲除)细胞克隆。
CaCo-2细胞株
在CaCo-2细胞系(人结肠腺癌,强烈表达HEMO)上的CrispR技术的开发(见图2B):
1.转染含有Cas9基因以及靶向HEMO基因的各种向导RNA(选择了4个不同区域)的质粒;
2.通过有限稀释获得不再表达HEMO蛋白的在两个等位基因上的KO克隆;和
3.通过测序克隆DNA进行验证:ORF的突变(具有移码和提前终止密码子的核苷酸插入/缺失);和
4.在FFPE块细胞上用单克隆抗体2F7(CNCM I-5211)通过IHC进行验证,并通过蛋白质印迹对培养的WT(野生型)和KO细胞的浓缩上清液中进行验证。
诱导多能干细胞(iPSC)
通过以下步骤获得在两个等位基因上的几个iPSC KO克隆:
1.电穿孔Cas9-向导质粒,用2种最佳的向导质粒(在用CaCo-2测试的4种中);
2.通过对HEMO基因进行测序验证突变;
3.验证iPSC-KO克隆的浓缩培养上清液中蛋白质的不存在;和
4.通过以下能力验证获得的KO克隆的多能性
-在培养物中发育胚胎体,
-和在NSG(Nod Scid Gamma)小鼠中发育畸胎瘤。
结果
如由IHC和蛋白质印迹分析证实的,CaCo-2(图21A,21B)和iPSC(图21C)均允许KOHEMO细胞的发育。必须指出,这些KO克隆(CaCo-2或iPSC)代表用于研究以下的工具:
-HEMO的作用(WT细胞和KO细胞的RNAseq的转录组分析:搜索其表达受HEMO调节的基因);和
-在培养的细胞系统或小鼠异种移植物(PDX)中,针对蛋白质的特定药物的作用。
实施例10:检测胎盘形成缺陷的方法
评估妊娠女性血液中HEMO蛋白的表达变化,以查看是否存在与妊娠病理(子宫内生长延迟、先兆子痫等)的相关性。
队列包括妊娠女性的200个样品。
其获得来自妊娠第二个三个月取样(第6个月)期间约第28个WA(无月经周)的妊娠女性的血液样品:
-在凝胶上的一根干管,以回收血清(通过蛋白质印迹和/或ELISA测试分析胎盘产生的HEMO蛋白的血清水平);
-可选:一根EDTA试管,以从淋巴细胞中回收母体DNA(验证HEMO基因序列)。
也可以
-返回医疗档案,查找相关的病理,
-获取第二份血液样品(当前的妊娠第三个三个月或分娩前),以检查HEMO的血清水平,
-发生异常时,在分娩时获得胎盘组织或胎儿脐带的片段以分析胎儿DNA,以检查HEMO基因序列(胎儿来源的胎盘产生的蛋白质)。
妊娠女性已签署了有关血液样品的研究的同意书,并提供了以下所需信息:
-是否是双胎妊娠,以及是否单胎或双胎妊娠,
-是否已经存在妊娠和目前的感染(更具体地艾滋病毒)的进展的已知病理,
-儿童人数,以及
-其他病理(肿瘤,其他)
实施例11:作为ScFv片段的mAB的克隆
方法
已经获得了一种针对SU结构域的mAb(2F7,CNCM I-5211,参见实施例2),其为小鼠IgG2a抗体。为了将来使用(ELISA血液测试、交叉造影实验和推定的癌症靶向),该mAb经过工程改造并克隆为scFv片段,如下所示:
1.从杂交瘤Ab的RNA中克隆ScFv作为VH-(接头{GGGGS}x4)-Vκ片段;
2.通过常规的RACE方法生产细胞系;
3.序列测定;和
4.通过蛋白质印迹、ELISA、流式细胞术或IHC测试产生和验证ScFv与HEMO蛋白的结合。
结果
与空载体转染的上清液相比,ScFv-2F7-Fc和ScFv-2F7-His与293T转染的细胞上清液中产生的脱落-HEMO蛋白的ELISA结合(图22A)和流式细胞术结合(图22B)显示scFV片段可用作完整的2F7抗体(CNCM I-5211)。
序列
参照附图和实施例描述序列。还附有ST25序列表。
表8:序列
Figure BDA0002369588140001001
Figure BDA0002369588140001011
Figure BDA0002369588140001021
Figure BDA0002369588140001031
Figure BDA0002369588140001041
Figure BDA0002369588140001051
Figure BDA0002369588140001061
Figure BDA0002369588140001071
Figure BDA0002369588140001081
Bischof P,Irminger-Finger I(2005)The human cytotrophoblastic cell,amononuclear chameleon.Int J Biochem Cell Biol 37(1):1–16.
Blaise S,de Parseval N,Benit L,Heidmann T(2003)Genomewide screeningfor fusogenic human endogenous retrovirus envelopes identifies syncytin 2,agene conserved on primate evolution.Proc Natl Acad Sci USA.100(22):13013–8.
Blond JL,Lavillette D,Cheynet V,Bouton O,Oriol G,Chapel-Fernandes S,Mandrand B,Mallet F,Cosset FL(2000)An envelope glycoprotein of the humanendogenous retrovirus HERV-W is expressed in the human placenta and fusescells expressing the type D mammalian retrovirus receptor.J Virol.74(7):3321–9.
Cho K,Shih L(2009)Ovarian Cancer.Annu Rev Pathol 1(4):287–313.
Cole LA(2009)New discoveries on the biology and detection of humanchorionic gonadotropin.Reprod Biol Endocrinol.7:8.
Cornelis G,Vernochet C,Carradec Q,Souquere S,Mulot B,Catzeflis F,Nilsson MA,Menzies BR,Renfree MB,Pierron G,Zeller U,Heidmann O,Dupressoir A,Heidmann T(2015)Retroviral envelope gene captures and syncytin exaptation forplacentation in marsupials.Proc Natl Acad Sci USA 112(5):E487-96.
Deaton A,Bird A(2011)CpG islands and the regulation oftranscription.Genes Dev 24(10):1010–22.
Denner J.(2016)Expression and function of endogenous retroviruses inthe placenta.Apmis 124(1–2):31–43.
Dolnik O,Volchkova V,Garten W,Carbonnelle C,Becker S,Kahnt J,
Figure BDA0002369588140001091
U,Klenk HD,Volchkov V(2004)Ectodomain shedding of the glycoprotein GP ofEbola virus.Embo J 23(10):2175–84.
Esnault C,Cornelis G,Heidmann O,Heidmann T(2013)DifferentialEvolutionary Fate of an Ancestral Primate Endogenous Retrovirus EnvelopeGene,the EnvV Syncytin,Captured for a Function in Placentation.PLoS Genet 9(3):1–12.
Friedli M,Turelli P,Kapopoulou A,Rauwel B,Castro-d N,Rowe HM,Ecco G,Unzu C,Planet E,Lombardo A,Mangeat B,Wildhaber BE,Naldini L,Trono D(2014)Lossof transcriptional control over endogenous retroelements during reprogrammingto pluripotency Genome Res 24(8):1251–59.
Gautier L,Cope L,Bolstad BM,Irizarry RA(2004)Affy-Analysis ofAffymetrix GeneChip data at the probe level.Bioinformatics 20(3):307–15.
Henzy JE,Johnson WE(2013)Pushing the endogenous envelope.Philos TransR Soc Lond B Biol Sci.368(1626):20120506.
Jurka J,Kapitonov VV,Pavlicek A,Klonowski P,Kohany O,Walichiewicz J(2005)Repbase Update,a database of eukaryotic repetitive elements.CytogenetGenome Res.110(1–4):462–7.
Kurman RJ,Shih I-M(2016)The Dualistic Model of OvarianCarcinogenesis.Am J Pathol 186(4):733–47.
Lavialle C,Cornelis G,Dupressoir A,Esnault C,Heidmann O,Vernochet C,Heidmann T(2013)Paleovirology of“syncytins”,retroviral env genes exapted fora role in placentation.Philos Trans R Soc L B Biol Sci.368(1626):20120507.
Lukk M,Kapushesky M,Nikkila J,Parkinson H,Goncalves A,Huber W,UkkonenE,Brazma A(2010)A global map of human gene expression.Nat Biotechnol 28(4):322–4.
Maltepe E,Fisher SJ(2015)Placenta:the forgotten organ.Annu Rev CellDev Biol 31(1):523–52.
Mangeney M,Renard M,Schlecht-Louf G,Bouallaga I,Heidmann O,LetzelterC,Richaud 1,Ducos B,Heidmann T(2007)Placental syncytins:Genetic disjunctionbetween the fusogenic and immunosuppressive activity of retroviral envelopeproteins.Proc Natl Acad Sci USA 104(51):20534–9.
Mi S,Lee X,Li X,Veldman GM,Finnerty H,Racie L,LaVallie E,Tang XY,Edouard P,Howes S,Keith JC Jr,McCoy JM(2000)Syncytin is a captive retroviralenvelope protein involved in human placental morphogenesis.Nature 403(February):785–9.
Okazaki I,Nabeshima K(2012)Introduction:MMPs,ADAMs/ADAMTSs researchproducts to achieve big dream.Anticancer Agents Med Chem 12(7):688–706.
de Parseval N,Lazar V,Casella J-F,Benit L,Heidmann T.Survey of humangenes of retroviral origin:identification and transcriptome of the genes withcoding capacity for complete envelope proteins.J Virol 2003;77(19):10414–22.
Taminau J,Meganck S,Lazar C,Steenhoff D,Coletta a,Molter C,Duque R,deSchaetzen V,Weiss Solís DY,Bersini H,NowéA(2012)Unlocking the potential ofpublicly available microarray data using inSilicoDb and inSilicoMerging R/Bioconductor packages.BMC Bioinformatics 13:335.
Toth G,Jurka J(1994)Repetitive DNA in and around translocationbreakpoints of the Philadelphia chromosome.Gene 140(2):285–8.
Uhlén M,Fagerberg L,
Figure BDA0002369588140001101
BM,Lindskog C,Oksvold P,Mardinoglu A,Sivertsson
Figure BDA0002369588140001102
Kampf C,
Figure BDA0002369588140001103
E,Asplund A,Olsson I,Edlund K,Lundberg E,Navani S,Szigyarto CA,Odeberg J,Djureinovic D,Takanen JO,Hober S,Alm T,Edqvist PH,Berling H,Tegel H,Mulder J,Rockberg J,Nilsson P,Schwenk JM,Hamsten M,vonFeilitzen K,Forsberg M,Persson L,Johansson F,Zwahlen M,von Heijne G,NielsenJ,Pontén F(2015)Tissue-based map of the human proteome.Science 347(6220):1260419.
Vargiu L,Rodriguez-ToméP,Sperber GO,Cadeddu M,Grandi N,Blikstad V,Tramontano E,Blomberg J(2016)Classification and characterization of humanendogenous retroviruses;mosaic forms are common.Retrovirology 13(1):7.
Villesen P,Aagaard L,Wiuf C,Pedersen FS(2004)Identification ofendogenous retroviral reading frames in the human genome.Retrovirology 1:32.
Weber S,Saftig P(2012)Ectodomain shedding and ADAMs indevelopment.Development 139(20):3693–709.
Xue Z,Huang K,Cai C,Cai L,Jiang CY,Feng Y,Liu Z,Zeng Q,Cheng L,SunYE,Liu JY,Horvath S,Fan G(2013)Genetic programs in human and mouse earlyembryos revealed by single-cell RNA sequencing.Nature 500(7464):593–7.
Yan L,Yang M,Guo H,Yang L,Wu J,Li R,Liu P,Lian Y,Zheng X,Yan J,HuangJ,Li M,Wu X,Wen L,Lao K,Li R,Qiao J,Tang F(2013)Single-cell RNA-Seq profilingof human preimplantation embryos and embryonic stem cells.Nat Struct Mol Biol20(9):1131–9.

Claims (27)

1.一种多肽,其由内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段组成,
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1具有至少59%同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列;或
·选自SEQ ID NO:129-143的序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列、RTQR序列和RTKR序列的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:178、912和547-561的序列和作为SEQ ID NO:172、911和457-471的序列中的至少一个序列的片段并且在SEQID NO:178、912和547-561的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自344-457或374-446,
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
2.根据权利要求1所述的由内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽,
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1具有至少59%同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列;或
·选自SEQ ID NO:129-142的序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:178、912和547-560的序列和作为SEQ ID NO:172、911和457-470的序列中的至少一个序列的片段并且在SEQID NO:178、912和547-560的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自344-457或374-446,
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
3.根据权利要求1所述的由内源性猫逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽。
a.其中所述逆转录病毒Env蛋白是
·SEQ ID NO:143的氨基酸序列;或
·与SEQ ID NO:143具有至少80%同一性的氨基酸序列,更具体地是与SEQ ID NO:143具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由所述序列的443-468或443-467个氨基酸组成,更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.RTQR序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述逆转录病毒Env蛋白的胞外域更具体地由选自SEQ ID NO:561和951的序列和作为SEQ ID NO:471和949的序列的片段并且在SEQ ID NO:561和951的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列组成,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自352-457或374-446;
·从所述胞外域的N-末端开始;和
·包含b.i.的所述序列和b.ii.的所述序列。
4.根据权利要求2所述的由内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽,其中所述N-末端片段的序列由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自354-456或374-446。
5.根据权利要求2或4所述的由内源性北方兽类逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽,其中
a.所述N-末端片段的C-末端位于序列SEQ ID NO:1、129-134和136-137的序列的380位氨基酸至480位氨基酸,并且在序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端之前,位于序列SEQ ID NO:1、129-134和136-137的跨膜域的N-末端上游6至112个氨基酸的位置;或
b.所述N-末端片段的C-末端位于序列SEQ ID NO:135的379位氨基酸至479位氨基酸,并且序列SEQ ID NO:135的跨膜域的N-末端之前,位于序列SEQ ID NO:135的跨膜域的N-末端上游6至112个氨基酸的位置;或
c.所述N-末端片段的C-末端位于序列SEQ ID NO:138的380位氨基酸至479位氨基酸,并且在序列SEQ ID NO:138的跨膜域的N-末端之前,位于序列SEQ ID NO:138的跨膜域的N-末端上游6至111个氨基酸的位置;或
d.所述N-末端片段的C-末端位于序列SEQ ID NO:139-140和142的380位氨基酸至476位氨基酸,并且在序列SEQ ID NO:139-140和142的跨膜域的N-末端之前,位于在序列SEQID NO:139-140和142的跨膜域的N-末端上游3至105个氨基酸的位置;或
e.所述N-末端片段的C-末端位于序列SEQ ID NO:141的370位氨基酸至466位氨基酸,并且在序列SEQ ID NO:141的跨膜域的N-末端之前,位于序列SEQ ID NO:141的跨膜域的N-末端上游3至105个氨基酸的位置。
6.根据权利要求2和4-5中任一项所述的由内源性人逆转录病毒Env蛋白的胞外域的N-末端片段组成的多肽,
a.其中所述人逆转录病毒Env蛋白是
·SEQ ID NO:1的氨基酸序列;或
·与SEQ ID NO:1至少80%的同一性的氨基酸序列,更具体地是与SEQ ID NO:1具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,
b.其中所述逆转录病毒Env蛋白的所述胞外域在不含其信号肽或其片段的情况下由以下组成:
·所述序列的443-468或443-467个氨基酸,其更具体地在N-末端至C-末端方向上包含:
i.CWLC氨基酸序列,
ii.选自CTQG序列、CTQR序列、CIQR序列和RTKR序列的氨基酸序列,
iii.SEQ ID NO:148的氨基酸序列,和
iv.SEQ ID NO:149的氨基酸序列;
其中所述人逆转录病毒Env蛋白的胞外域更具体地由以下组成:
·选自SEQ ID NO:178和912的序列和作为SEQ ID NO:172和911的序列中的至少一个序列的片段并且在SEQ ID NO:178和912的序列中的至少一个序列的长度上相差最多7个或8个氨基酸的序列的序列,
其中所述N-末端片段的序列:
·由比所述胞外域少的氨基酸数量组成,所述比所述胞外域少的氨基酸数量选自354-456或374-446,
·从所述胞外域的N-末端开始;
·包含b.i.的所述序列和b.ii.的所述序列;和
·所述N-末端片段的C-末端位于序列SEQ ID NO:1的380位氨基酸至480位氨基酸,并且在序列SEQ ID NO:1的跨膜域的N-末端之前,位于序列SEQ ID NO:1的跨膜域的N-末端上游6至112个氨基酸的位置。
7.根据权利要求2和4-6中任一项所述的多肽,
a.其中所述胞外域的N-末端片段的序列不包含权利要求2.b.iii.的全长序列,但包含权利要求2.b.iii.的所述序列的片段;
b.更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQ ID NO:9-10、183-184和185-186。
8.根据权利要求2和4-6中任一项所述的多肽,
a.其中所述胞外域的N-末端片段的序列不包含权利要求2.b.iii.的序列,并且不包含权利要求2.b.iii.的序列的任何片段,
更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQID NO:13-33、670-689、195-215、690-709、216-236和710-729;
b.其中所述胞外域的N-末端片段的序列包含权利要求2.b.iii.的序列,
更具体地,其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQID NO:55-75、830-839、300-320、840-849、321-341和850-859。
9.根据权利要求2和4-6中任一项所述的多肽,
其中所述胞外域的N-末端片段的序列包含选自以下的序列或由其组成:SEQ ID NO:9-10、184-186和991-1071。
10.一种多肽,其由内源性北方兽类逆转录病毒Env蛋白的胞外域的片段组成,其中所述片段包含所述逆转录病毒Env蛋白的胞外域的C-末端片段,
a.其中所述逆转录病毒Env蛋白和所述胞外域如权利要求1-9中任一项所定义,
b.其中所述C-末端片段包含所述胞外域的C-末端而不包含所述胞外域的N-末端,
c.其中胞外域的所述C-末端片段是在从所述胞外域切下权利要求1-9中任一项的多肽后保留的C-末端片段,更具体地其中胞外域的所述C-末端片段的序列由选自SEQ ID NO:11-12和189-194,或选自SEQ ID NO:34-54、237-299和730-809,或选自SEQ ID NO:76-96、342-404和860-899的序列组成。
11.根据权利要求1-10中任一项所述的多肽,其与权利要求1-10中任一项所定义的所述多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性百分比。
12.分离的细胞或细胞的一部分,其表达权利要求10的多肽,其中权利要求10的多肽的一部分在所述细胞或所述细胞的所述部分的表面表达,并且其中所述表面表达的部分包含权利要求10的所述多肽中所包含的胞外域的C-末端片段,
更具体地,其中所述细胞或所述细胞的所述部分是胎盘细胞或胎盘细胞的一部分、干细胞或干细胞的一部分、肿瘤细胞或肿瘤细胞的一部分或肿瘤干细胞或肿瘤干细胞的一部分。
13.根据权利要求1-9中任一项所述的多肽,其用于治疗,更具体地用于治疗北方兽类的胎盘形成缺陷或用于治疗针对由北方兽类携带的胎儿的微生物感染、更具体地病毒感染的保护的缺陷。
14.一种产品,其中所述产品是:
a.抗体,或
b.单克隆抗体,更具体地是由以保藏号I-5211保藏在CNCM的杂交瘤产生的单克隆抗体,或
c.Fab、Fab’或F(ab)2片段,或
d.scFv,或
e.sdAb,或
f.sdAb的可变结构域,
并且其中所述产品任选地与至少一种药物连接,并且其中所述产品特异性结合权利要求1-9中任一项的多肽。
15.一种产品,其中所述产品是:
a.抗体,或
b.Fab、Fab’或F(ab)2片段,或
c.scFv,或
d.sdAb,或
e.sdAb的可变结构域,
并且其中所述产品任选地与至少一种药物连接,并且其中所述产品特异性结合权利要求10的多肽。
16.一种嵌合抗原受体T细胞(CAR-T细胞),其中所述嵌合抗原受体包含与TCR信号传导结构域连接的scFv,并且其中所述scFv是权利要求14或15的scFv。
17.根据权利要求14或15所述的产品或根据权利要求16所述的CAR-T细胞,其用于治疗,更具体地用于抗癌治疗,其中所述产品或CAR-T细胞结合肿瘤细胞或肿瘤干细胞,并且其中所述癌症更具体地是卵巢癌、子宫癌、子宫颈癌、妊娠癌、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌。
18.一种用于检测权利要求1-9中任一项的多肽或权利要求12的细胞的体外方法,其包括以下两个步骤a和b中的至少一个:
a.检测以可溶性形式包含在样品中的多肽,其中所述多肽是权利要求1-9中任一项的多肽;
和/或
b.检测样品中的细胞,其中所述细胞是或包含权利要求12的细胞。
19.根据权利要求18所述的体外方法,其用于检测受试者中肿瘤的出现或追踪受试者中肿瘤的发展,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤a和b中的至少一个:
a.检测以可溶形式包含在样品中的多肽,其中所述多肽是权利要求1-9中任一项的多肽,并且其中所述样品是:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,或
·所述血液或尿液或腹水或肿瘤活检样品的可溶性蛋白提取物,以及
其中在所述样品中检测可溶性形式的所述多肽指示所述受试者中存在肿瘤细胞或肿瘤干细胞;
和/或
b.检测样品中的细胞,其中所述细胞是或包含权利要求12的细胞,并且其中所述样品是:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,或
·所述血液或尿液或腹水或活检样品的细胞级分,以及
其中在所述样品中检测所述细胞指示所述受试者中存在肿瘤细胞或肿瘤干细胞。
20.根据权利要求19所述的体外方法,其用于检测以高于对照受试者样品中所测量的平均浓度的浓度分泌权利要求1-9中任一项的多肽的肿瘤的出现。
21.根据权利要求19所述的体外方法,其用于检测治疗后肿瘤的复发。
22.就权利要求18所述的体外方法,其用于确定受试者的肿瘤的组织型、等级或分期,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤a和b中的至少一个:
a.检测以可溶形式包含在样品中的多肽,其中所述多肽是权利要求1-9中任一项的多肽,并且其中所述样品是:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,或
·所述血液或尿液或腹水或肿瘤活检样品的可溶性蛋白提取物,以及
其中在所述样品中检测可溶形式的所述多肽确定所述肿瘤的组织型、等级或分期;
和/或
b.检测样品中的细胞,其中所述细胞是或包含权利要求12的细胞,并且其中所述样品是:
·所述受试者的血液或尿液或腹水样品,或
·所述肿瘤的活检样品,或
·所述血液或尿液或腹水或活检样品的细胞级分,以及
其中在所述样品中检测所述细胞确定所述肿瘤的组织型、等级或分期。
23.根据权利要求18所述的体外方法,其用于检测妊娠受试者的胎盘形成缺陷,更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷,其中所述受试者是北方兽类,并且其中所述体外方法包括以下两个步骤a和b中的至少一个:
a.测量样品中可溶形式的多肽的数量或浓度,其中所述可溶形式的多肽是权利要求1-9中任一项的多肽,并且其中所述样品是:
·所述受试者的血液、尿液或羊水样品,或
·所述血液或尿液或羊水样品的可溶性蛋白提取物,以及
其中所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷;
和/或
b.测量样品中细胞的数量或浓度,其中所述细胞是权利要求12的细胞,并且其中所述样品是:
·所述北方兽类的血液、尿液或羊水样品,或
·来自所述北方兽类的胎盘样品,或
·所述血液或尿液、羊水或胎盘样品的细胞提取物,以及
其中所述样品中的所述数量或浓度指示所述受试者的胎盘形成缺陷。
24.一种体外方法,其用于纯化或分离北方兽类的循环细胞,更具体地用于纯化或分离北方兽类循环细胞,其是肿瘤细胞或肿瘤干细胞或胎盘细胞,
其中所述方法包括从所述北方兽类的循环血液样品或此类样品的细胞级分中纯化或分离细胞,其中所述细胞纯化或分离包括阳性分选与配体结合的细胞,其中所述配体是权利要求14或15的产品。
25.一种体外方法,其用于纯化或分离来自北方兽类的新鲜肿瘤或活检样品中的非循环细胞以表征所述非循环细胞,
其中所述非循环细胞的纯化或分离包括阳性分选与配体结合的细胞,其中所述配体是权利要求14或15的产品。
26.一种用于从体细胞诱导多能干细胞的体外方法,其包括将多能相关基因导入体细胞,并选择表达所引入的多能相关基因的那些细胞,
其中所述多能性相关基因包含编码多肽的基因,所述多肽由权利要求1-9中任一项的多肽和/或权利要求10的多肽组成。
27.一种包含产品的试剂盒,其中所述产品用于以下五种用途中的至少一种:
a.检测受试者中肿瘤的出现或追踪肿瘤的发展,其中所述受试者是北方兽类;
和/或
b.确定肿瘤的组织型、等级或分期,其中所述癌症是卵巢癌、子宫癌、子宫颈癌、妊娠癌、乳腺癌、肺癌、胃癌、结肠癌、肝癌、肾癌、前列腺癌、尿路上皮癌、生殖细胞癌、脑癌、头颈癌、胰腺癌、甲状腺癌、胸腺癌、皮肤癌、骨癌或骨髓癌;
和/或
c.检测妊娠受试者的胎盘形成的缺陷,更具体地使所述妊娠受试者处于胎盘早剥、先兆子痫或子痫的风险中的胎盘形成缺陷;
和/或
d.纯化或分离北方兽类的循环细胞,更具体地用于纯化或分离北方兽类循环细胞,其是肿瘤细胞或肿瘤干细胞或胎盘细胞;
和/或
e.纯化或分离北方兽类的非循环细胞,更具体地用于纯化或分离来自北方兽类的新鲜肿瘤或活检样品中的非循环细胞,以及
其中所述产品是权利要求14或15的产品,并且其中所述产品任选地与检测标记连接或结合。
CN201880047480.3A 2017-06-22 2018-06-22 人内源性逆转录病毒蛋白 Pending CN110913897A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17305775.3 2017-06-22
EP17305775 2017-06-22
PCT/EP2018/066837 WO2018234576A1 (en) 2017-06-22 2018-06-22 HUMAN ENDOGENOUS RETROVIRAL PROTEIN

Publications (1)

Publication Number Publication Date
CN110913897A true CN110913897A (zh) 2020-03-24

Family

ID=59388018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880047480.3A Pending CN110913897A (zh) 2017-06-22 2018-06-22 人内源性逆转录病毒蛋白

Country Status (6)

Country Link
US (1) US20200102353A1 (zh)
EP (1) EP3641804A1 (zh)
JP (1) JP2020530438A (zh)
CN (1) CN110913897A (zh)
CA (1) CA3066894A1 (zh)
WO (1) WO2018234576A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111630060A (zh) * 2017-09-01 2020-09-04 盈珀治疗有限公司 用于在疾病的预防和/或治疗中使用的疫苗
CN113702646A (zh) * 2021-08-30 2021-11-26 杭州师范大学 Hemo作为衰老标记物的应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220088224A1 (en) 2018-09-18 2022-03-24 Vnv Newco Inc. Arc-based capsids and uses thereof
EP4093432A1 (en) * 2020-01-21 2022-11-30 The United States of America, as represented by the Secretary, Department of Health and Human Services Human immunogenic epitopes of hemo and hhla2 human endogenous retroviruses (hervs)
US11129892B1 (en) 2020-05-18 2021-09-28 Vnv Newco Inc. Vaccine compositions comprising endogenous Gag polypeptides
WO2024108001A2 (en) * 2022-11-16 2024-05-23 The General Hospital Corporation Minimal human-derived virus-like particles and methods of use thereof for delivery of biomolecules

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001062925A2 (en) * 2000-02-24 2001-08-30 Agensys, Inc. 103p2d6: tissue specific protein highly expressed in various cancers
CN1502626A (zh) * 2002-11-20 2004-06-09 上海新世界基因技术开发有限公司 具有抑癌功能的新的人蛋白及其编码序列
US20070099251A1 (en) * 2005-10-17 2007-05-03 Institute For Systems Biology Tissue-and serum-derived glycoproteins and methods of their use

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004014946A1 (fr) * 2002-08-07 2004-02-19 Neworgen Limited Nouvelle proteine homo avec fonction de suppression du cancer et sa sequence de codage

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001062925A2 (en) * 2000-02-24 2001-08-30 Agensys, Inc. 103p2d6: tissue specific protein highly expressed in various cancers
CN1502626A (zh) * 2002-11-20 2004-06-09 上海新世界基因技术开发有限公司 具有抑癌功能的新的人蛋白及其编码序列
US20070099251A1 (en) * 2005-10-17 2007-05-03 Institute For Systems Biology Tissue-and serum-derived glycoproteins and methods of their use

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUILLAUME CORNELISA等: "Retroviral envelope syncytin capture in an ancestrally diverged mammalian clade for placentation in the primitive Afrotherian tenrecs" *
MARIANNE MANGENEY等: "Placental syncytins: Genetic disjunction between the fusogenic and immunosuppressive activity of retroviral envelope proteins" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111630060A (zh) * 2017-09-01 2020-09-04 盈珀治疗有限公司 用于在疾病的预防和/或治疗中使用的疫苗
CN111630060B (zh) * 2017-09-01 2024-01-23 盈珀治疗有限公司 用于在疾病的预防和/或治疗中使用的疫苗
CN113702646A (zh) * 2021-08-30 2021-11-26 杭州师范大学 Hemo作为衰老标记物的应用
CN113702646B (zh) * 2021-08-30 2022-05-03 杭州师范大学 Hemo作为衰老标记物的应用

Also Published As

Publication number Publication date
CA3066894A1 (en) 2018-12-27
WO2018234576A1 (en) 2018-12-27
JP2020530438A (ja) 2020-10-22
EP3641804A1 (en) 2020-04-29
US20200102353A1 (en) 2020-04-02

Similar Documents

Publication Publication Date Title
CN110913897A (zh) 人内源性逆转录病毒蛋白
Esnault et al. Differential evolutionary fate of an ancestral primate endogenous retrovirus envelope gene, the EnvV syncytin, captured for a function in placentation
Heidmann et al. HEMO, an ancestral endogenous retroviral envelope protein shed in the blood of pregnant women and expressed in pluripotent stem cells and tumors
Sacha et al. Vaccination with cancer-and HIV infection-associated endogenous retrotransposable elements is safe and immunogenic
ES2339433T3 (es) Aumento de la expresion de retrovirus endogeno en cancer de prostata.
Bolze et al. Contribution of syncytins and other endogenous retroviral envelopes to human placenta pathologies
JP5901046B2 (ja) OATP1B3mRNAの新規な選択的スプライシングバリアント
EP1415005B1 (en) Endogenous retroviruses up-regulated in prostate cancer
UA124519C2 (uk) Пептид, здатний зв&#39;язуватися з молекулою головного комплексу гістосумісності (mhc) людини i класу
US20150177246A1 (en) Fusion gene of cep55 gene and ret gene
NZ754139A (en) Novel peptides and combination of peptides for use in immunotherapy against ovarian cancer and other cancers
JP2008043337A (ja) 乳癌の処置および診断のための組成物および方法
US11318197B2 (en) Compositions and methods for inducing HIV-1 antibodies
EP2396660B1 (en) Prediction of response to platinum-based therapy
US11655283B2 (en) HLA-G transcripts and isoforms and their uses
WO2016104439A1 (ja) 抗活性型gip抗体
WO2022174234A2 (en) Biomarkers for cancer treatment
KR101918342B1 (ko) B형 간염 바이러스 표면 유전자 넌센스 돌연변이의 검출 방법
US20230197192A1 (en) Selecting neoantigens for personalized cancer vaccine
US8332159B2 (en) Method for enhancing efficacy of preparation of monoclonal antibody
CN106699892B (zh) 肺鳞癌中dnah5融合基因及其用途
Li et al. Molecular detection and analysis of a Enzootic Nasal Tumor Virus 2 in china
EP2527361B1 (en) Biomarkers for in vitro prognosis and diagnosis of graft and transplant rejection
Safe Vaccination with Cancer-and HIV
NZ796665A (en) Novel peptides and combination of peptides for use in immunotherapy against ovarian cancer and other cancers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200324

WD01 Invention patent application deemed withdrawn after publication