CN109890982A - 通过nrf2及其下游目标基因的表达状态和突变状态诊断和治疗癌症的方法 - Google Patents

通过nrf2及其下游目标基因的表达状态和突变状态诊断和治疗癌症的方法 Download PDF

Info

Publication number
CN109890982A
CN109890982A CN201780047447.6A CN201780047447A CN109890982A CN 109890982 A CN109890982 A CN 109890982A CN 201780047447 A CN201780047447 A CN 201780047447A CN 109890982 A CN109890982 A CN 109890982A
Authority
CN
China
Prior art keywords
nrf2
expression
subject
kinds
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780047447.6A
Other languages
English (en)
Other versions
CN109890982B (zh
Inventor
C·N·克里昂
J·李
D·H·斯托科
R·珍特曼
F·格纳德
L·D·戈德斯坦
J·基米勒基
R·J·哈特迈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genentech Inc
Foundation Medicine Inc
Original Assignee
Genentech Inc
Foundation Medicine Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genentech Inc, Foundation Medicine Inc filed Critical Genentech Inc
Publication of CN109890982A publication Critical patent/CN109890982A/zh
Application granted granted Critical
Publication of CN109890982B publication Critical patent/CN109890982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/335Heterocyclic compounds having oxygen as the only ring hetero atom, e.g. fungichromin
    • A61K31/337Heterocyclic compounds having oxygen as the only ring hetero atom, e.g. fungichromin having four-membered rings, e.g. taxol
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Epidemiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明提供了通过分析一种或多种NRF2剪接变体或NRF2靶基因的表达水平来鉴定患有癌症诸如肺癌的受试者的方法。本发明还提供了用NRF2途径拮抗剂治疗受试者的癌症的方法,其中受试者表达一种或多种NRF2剪接变体或过表达一种或多种NRF2靶基因。

Description

通过NRF2及其下游目标基因的表达状态和突变状态诊断和治 疗癌症的方法
序列表
本申请含有已经呈ASCII格式以电子方式提交并且在此通过引用整体并入的的序列表。在2017年7月10日创建的所述ASCII拷贝命名为50474-127WO2_Sequence_Listing_7.10.17_ST25并且大小为 216,092字节。
技术领域
本发明总体上涉及用于诊断、治疗癌症(例如肺癌)和提供癌症(例如肺癌)预后的方法。
发明背景
癌症仍然是对人健康最致命的威胁之一。尽管最近在治疗方面取得了进展,但肺癌尤其在美国是男性和女性癌症相关死亡的主要原因。大多数肺癌是非小细胞肺癌(NSCLC),并且最常见的是腺瘤或鳞状亚型。最近的研究已经确定了这些适应症背后的点突变模式 (Imielinski等Cell.150(6):1107-1120,2012),但尽管与各种细胞途径相关的已鉴定的突变的数量越来越多,缺乏对这些突变对这些细胞途径的性质和影响的全面理解。
因此,本领域存在未满足的需求,以开发用于癌症(诸如肺癌)的有效诊断和治疗策略。
发明内容
本发明提供用于诊断、治疗(例如,肺癌(例如,非小细胞肺癌 (NSCLC))和头颈癌)和提供所述癌症的预后的组合物和方法。
在一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9 种、10种、11种、12种、13种、14种、15种、16种、17种、18 种、19种、20种、21种、22种、23种、24种、25种、26种或27 种)基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、 GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL;(b)将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者。
在另一个方面,本发明的特征在于鉴定患有为NRF2依赖性癌症的癌症的受试者的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种(例如,1种、2种、3种、4种、5 种、6种、7种、8种、9种、10种、11种、12种、13种、14种、 15种、16种、17种、18种、19种、20种、21种、22种、23种、 24种、25种、26种或27种)基因的表达水平:AKR1B10、AKR1C2、 SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、 SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、 NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、 NQO1和FTL;(b)将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较;和(c)确定所述受试者的癌症是否是 NRF2依赖性癌症,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有NRF2依赖性癌症的受试者。在任一前述方面的一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少两种(例如,2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、 14种、15种、16种、17种、18种、19种、20种、21种、22种、 23种、24种、25种、26种或27种))基因的表达水平:AKR1B10、 AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、 CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、 AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、 PGD、TXN、NQO1和FTL。在一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种(例如,3种、4种、5种、6 种、7种、8种、9种、10种、11种、12种、13种、14种、15种、 16种、17种、18种、19种、20种、21种、22种、23种、24种、 25种、26种或27种))基因的表达水平:AKR1B10、AKR1C2、SRXN1、 OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、 TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、 UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1 和FTL。在一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少四种(例如,4种、5种、6种、7种、8种、9种、10 种、11种、12种、13种、14种、15种、16种、17种、18种、19 种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。在一些实施方案中,测定获自受试者的样品中的AKR1B10、AKR1C2、SRXN1、 OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、 TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、 UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1 和FTL的表达水平。
在一些实施方案中,测定AKR1B10、AKR1C2、SRXN1、OSGIN1、 FECH、GCLM、TRIM16、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN或NQO1中的至少一种或多种(例如,1种、2种、3种、4种、5 种、6种、7种、8种、9种、10种、11种、12种、13种、14种、 15种、16种、17种、18种、19种、20种和21种)的表达水平。在一些实施方案中,测定AKR1B10、AKR1C2、ME1、KYNU、CABYR、 TRIM16L、AKR1C4、CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3 的一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8 种、9种、10种、11种或12种)的表达水平。
在一些实施方案中,(a)样品中至少两种基因的表达水平是样品的至少两种基因的平均值(例如,平均值或中值);(b)所述至少两个基因的参照照表达水平是所述参照的至少两个基因的平均值(例如,平均值或中值);以及(c)将样品的所述至少两个基因的平均值(例如,平均值或中值)与所述参照的至少两个基因的平均值进行比较。
在一些实施方案中,参照表达水平是受试者群体中所述至少一种基因的平均表达水平。在一些实施方案中,受试者群体是共享共同种族性的受试者群体。
在一些实施方案中,参照表达水平是患有癌症(例如,肺癌,例如,非小细胞肺癌(NSCLC),例如鳞状NSCLC)的受试者群体中的至少一种基因的平均表达水平。
在一些实施方案中,表达水平是mRNA表达水平。在一些实施方案中,通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mRNA表达水平。
在一些实施方案中,表达水平是蛋白质表达水平。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在一些实施方案中,任何前述方法还包括测定NRF2的DNA序列。在一些实施方案中,通过PCR、外显子组测序(exome-seq)、微阵列分析或全基因组测序确定DNA序列。
在另一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品中的DNA序列,其中包含其外显子2的全部或部分缺失的NRF2DNA的存在将受试者鉴定为患有癌症。在一些实施方案中,通过PCR、外显子组测序、微阵列分析或全基因组测序确定DNA序列。
在另一个方面,本发明的特征在于鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的NRF2的mRNA表达水平,所述NRF2包含其外显子2的全部或部分缺失,其中包含其外显子2的全部或部分缺失的NRF2的存在将受试者鉴定为患有癌症。在一些实施方案中,通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mRNA表达水平。在一些实施方案中,所述方法还包括测定NRF2的DNA序列。在一些实施方案中,通过PCR、外显子组测序、微阵列分析或全基因组测序确定DNA 序列。
在任何前述方面的一些实施方案中,NRF2还包含其外显子3的全部或部分的缺失。
在另一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品中的NRF2的蛋白质表达水平,所述NRF2包含其Neh2结构域的全部或部分缺失,其中包含其Neh2 结构域的的全部或部分缺失的NRF2的存在将受试者鉴定为患有癌症。
在另一个方面,本发明的特征在于鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的NRF2的蛋白质表达水平,所述NRF2包含其Neh2结构域的全部或部分缺失,其中包含其 Neh2结构域的全部或部分缺失的NRF2的存在将受试者鉴定为患有癌症。
在任何前述方面的一些实施方案中,NRF2还包含其Neh4结构域的全部或部分的缺失。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在一些实施方案中,所述方法还包括向受试者施用治疗有效量的 NRF2途径拮抗剂。在一些实施方案中,所述方法还包括向受试者施用治疗有效量的抗癌剂。在其它实施方案中,该方法包括施用抗癌剂和NRF2途径拮抗剂。在一些实施方案中,共同施用抗癌剂和NRF2 途径拮抗剂。在一些实施方案中,相继地施用抗癌剂和NRF2途径拮抗剂。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。在一些实施方案中,抗血管生成剂是VEGF拮抗剂。在一些实施方案中,NRF2途径拮抗剂选自由以下组成的组:CREB拮抗剂、CREB结合蛋白(CBP) 拮抗剂、Maf拮抗剂、激活转录因子4(ATF4)拮抗剂、蛋白激酶C(PKC) 拮抗剂、Jun拮抗剂、糖皮质激素受体拮抗剂、UbcM2拮抗剂、HACE1 拮抗剂、c-Myc激动剂、SUMO激动剂、KEAP1激动剂、CUL3激动剂或视黄酸受体α(RARα)激动剂。
在一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:向所述受试者施用治疗有效量的NRF2途径拮抗剂,其中以下基因中的至少一种(例如,1种、2种、3种、4种、5种、6种、 7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、 17种、18种、19种、20种、21种、22种、23种、24种、25种、 26种或27种)在获自受试者的样品中的表达水平经测定相对于所述至少一种基因的参照表达水平得以升高:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、 TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、 UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1 和FTL。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少两种(例如,2种、3种、4种、5种、6种、7种、8 种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或 27种))基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、 GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种 (例如,3种、4种、5种、6种、7种、8种、9种、10种、11种、12 种、13种、14种、15种、16种、17种、18种、19种、20种、21 种、22种、23种、24种、25种、26种或27种))基因的表达水平: AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、 ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、 TALDO1、PGD、TXN、NQO1和FTL。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种(例如,4种、5 种、6种、7种、8种、9种、10种、11种、12种、13种、14种、 15种、16种、17种、18种、19种、20种、21种、22种、23种、 24种、25种、26种或27种))基因的表达水平:AKR1B10、AKR1C2、 SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、 SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、 NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、 NQO1和FTL。在其它实施方案中,测定获自受试者的样品中的 AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、 ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、 RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、 TALDO1、PGD、TXN、NQO1和FTL的表达水平。
在一些实施方案中,测定AKR1B10、AKR1C2、SRXN1、OSGIN1、 FECH、GCLM、TRIM16、KYNU、CABYR、SLC7A11、TRIM16L、 AKR1C4、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN或NQO1中的至少一种或多种(例如,1种、2种、3种、4种、5 种、6种、7种、8种、9种、10种、11种、12种、13种、14种、 15种、16种、17种、18种、19种、20种和21种)的表达水平。在其它实施方案中,测定AKR1B10、AKR1C2、ME1、KYNU、CABYR、 TRIM16L、AKR1C4、CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3 的一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8 种、9种、10种、11种或12种)的表达水平。
在一些实施方案中,(a)样品中至少两种基因的表达水平是所述样品的所述至少两种基因的平均值(例如,平均值或中值);(b)所述至少两个基因的参照表达水平是所述参照的所述至少两个基因的平均值 (例如,平均值或中值);以及(c)将样品的所述至少两个基因的平均值 (例如,平均值或中值)与所述参照的所述至少两个基因的平均值进行比较。在一些实施方案中,参照表达水平是受试者群体中所述至少一种基因的平均表达水平。在一些实施方案中,受试者群体是共享共同种族性的受试者群体。在一些实施方案中,参照表达水平是患有癌症的受试者群体中所述至少一种基因的平均表达水平。
在一些实施方案中,肺癌是非小细胞肺癌(NSCLC),例如鳞状 NSCLC。
在一些实施方案中,表达水平是mRNA表达水平。在一些实施方案中,通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mRNA表达水平。在一些实施方案中, mRNA表达水平通过RNA测序来测定。
在一些实施方案中,方法还包括测定NRF2的DNA序列(通过 PCR、外显子组测序、微阵列分析或全基因组测序)。
在一些实施方案中,表达水平蛋是白质表达水平。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的NRF2的mRNA表达水平,所述NRF2包含其外显子2的全部或部分缺失,其中包含其外显子2的全部或部分缺失的NRF2的存在将受试者鉴定为患有癌症;和(b)向受试者施用治疗有效量的NRF2途径拮抗剂。
在一些实施方案中,通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mRNA表达水平。在一些实施方案中,mRNA表达通过RNA测序来测定。在一些实施方案中,方法还包括测定NRF2的DNA序列(通过PCR、外显子组测序、微阵列分析或全基因组测序)。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的NRF2的DNA序列,所述NRF2包含其外显子2的全部或部分缺失,其中包含其外显子2 的全部或部分缺失的NRF2DNA的存在将受试者鉴定为患有癌症;和(b)向受试者施用治疗有效量的NRF2途径拮抗剂。在一些实施方案中,通过PCR、外显子组测序、微阵列分析或全基因组测序确定DNA 序列。在一些实施方案中,NRF2(例如,mRNA或DNA)还包含其外显子3的全部或部分的缺失。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的NRF2的蛋白质表达水平,所述NRF2包含其Neh2的全部或部分缺失,其中包含其Neh2 的全部或部分缺失的NRF2蛋白的存在将受试者鉴定为患有癌症;和 (b)向受试者施用治疗有效量的NRF2途径拮抗剂。
在一些实施方案中,NRF2蛋白还包含其Neh4结构域的全部或部分的缺失。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。在一些实施方案中,方法还包括测定 NRF2的DNA序列(通过PCR、外显子组测序、微阵列分析或全基因组测序)。
在一些实施方案中,方法包括向受试者施用治疗有效量的抗癌剂。在一些实施方案中,共同施用抗癌剂和NRF2途径拮抗剂。在一些实施方案中,相继地施用抗癌剂和NRF2途径拮抗剂。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。在一些实施方案中,抗血管生成剂是VEGF拮抗剂。在一些实施方案中,NRF2途径拮抗剂选自由以下组成的组:CREB拮抗剂、CREB结合蛋白(CBP)拮抗剂、Maf拮抗剂、激活转录因子4(ATF4)拮抗剂、蛋白激酶C(PKC)拮抗剂、Jun 拮抗剂、糖皮质激素受体拮抗剂、UbcM2拮抗剂、HACE1拮抗剂、 c-Myc激动剂、SUMO激动剂、KEAP1激动剂、CUL3激动剂或视黄酸受体α(RARα)激动剂。
在一些实施方案中,获自受试者的样品是肿瘤样品,例如来自活检样品。在一些实施方案中,样品获自先前未治疗的受试者。在一些实施方案中,受试者患有肺癌(例如,非小细胞肺癌(NSCLC),例如鳞状NSCLC)或头颈癌(例如,鳞状头颈癌)。
附图说明
图1A是显示经历RNA测序、外显子组测序和SNP阵列分析的 96个肺癌细胞系的图。显示了KRAS、TP53、KEAP1、EGFR、STK11、 NFE2L2和NF1的改变。
图1B是显示NFE2L2(NRF2)基因中的点突变的蛋白质序列表示。
图1C是显示KEAP1基因中的点突变的蛋白质序列表示。
图1D是KEAP1/NRF2肽复合物的晶体结构的图像。
图2A是说明突变型(n=25)对比野生型(WT)(n=74)KEAP1 NSCLC细胞系中所有基因的平均表达水平的比率以及由差异表达分析产生的相关调整的p值的火山图。指示了显著差异表达的基因(>2 倍,p<0.01),并且先前鉴定为NRF2靶标的基因组被鉴定为黑点。
图2B是显示无监督沃德聚类(unsupervised ward clustering)结果的热图,所述无监督病房聚类结果显示了在NSCLC细胞系中与 KEAP1突变相关的27种基因的上调。
图3A是显示无监督沃德聚类结果的热图,所述无监督病房聚类结果显示了NSCLC细胞系衍生的KEAP1基因标签将来自癌症基因组图谱(TCGA)的40种KEAP1突变型肺腺癌中的32种(80%)进行分类。
图3B是显示无监督病房聚类结果的热图,所述无监督沃德聚类结果显示了NSCLC细胞系衍生的KEAP1基因标签将来自TCGA的 22种KEAP1突变型肺鳞状细胞癌中的19种(86%)和27种NRF2突变型肺鳞状细胞癌中的27种(100%)进行分类。
图4是显示突变型(n=6)和WT(n=37)NSCLC细胞系中KEAP1 基因标签的蛋白质产物的相对丰度的图。
图5是表示在19种肿瘤适应症中看到的复发性剪接改变的频率的热图。
图6显示了从RNA测序数据预测的NRF2外显子和剪接点。与两个带注释的refGene转录本一致的预测特征以灰色显示。对应于外显子2(J2,J5)或外显子2+3(J3,J6)的跳跃的经鉴定的外显子-外显子接合点分别以黑色和灰色显示。热图显示log2(x+1)转换后FPKM量表上482个TCGA肺鳞状细胞癌(行)中的外显子-外显子接合点(列) 的读段证据。
图7是描绘EGFR、NRF2、MET和CTNNB1中的剪接改变对蛋白质结构的影响的示意图。箭头表示作为剪接改变的结果的框内缺失。
图8A是说明鳞状NSCLC中KEAP1或NRF2中的NRF2剪接改变和突变的相互排斥发生的维恩图。
图8B是显示基于27个候选NRF2靶基因的鳞状NSCLC的聚类的热图。针对每个样品指示突变状态和NRF2剪接改变。
图9A是说明头颈癌中KEAP1或NRF2中的NRF2剪接改变和突变的相互排斥发生的维恩图。
图9B是显示基于27个候选NRF2靶基因的头颈癌的聚类的热图。针对每个样品指示突变状态和NRF2剪接改变。
图10是显示通过RNA测序定量的在KMS-27和JHH-6细胞中跳过外显子2的接合读段(junction read)的存在的图。
图11A是显示WT和外显子2缺失的NRF2(Δe2NRF2)mRNA 中的外显子的位置的示意图,所述位置与源自外显子1和外显子3/4 的正向和反向引物(分别由右侧朝向和左侧朝向的箭头指示的)相关。
图11B是一系列琼脂糖凝胶图像,其显示通过RT-PCR从正常白细胞、JHH-6细胞和KMS-27细胞的总RNA扩增的RNA产物。用指定的引物扩增NRF2外显子2周围的区域。显示来自野生型NRF2、Δe2NRF2和引物二聚体的片段。表明存在Δe2NRF2RNA的条带在 JHH-6和KMS-27细胞中是可见的。
图12A是显示来自JHH-6和KMS-27细胞的PCR产物的测序结果的图,指示了NRF2中外显子2的缺失。
图12B显示Δe2NRF2的核酸和氨基酸序列。
图12C显示野生型NRF2的核酸和氨基酸序列。外显子2序列加阴影。
图13显示蛋白质印迹实验的结果,其显示HUH-1、JHH-6和HuCCT1细胞的磷酸化NRF2、野生型NRF2和Δe2NRF2的相对表达。通过SDS PAGE分离来自指定细胞系的蛋白质裂解物。*代表可能的非特异性条带,因为其不被NRF2 siRNA转染耗尽。
图14A显示蛋白质印迹实验的结果,其显示在λ磷酸酶(λP’tase) 存在和不存在的情况下HUH-1、JHH-6和HuCCT1细胞的磷酸化 NRF2、野生型NRF2和Δe2NRF2的相对表达。使细胞在6孔培养皿中生长,并用100μg/ml环己酰胺(CHX)处理指定的时间。将裂解物与缓冲液或400单位λ磷酸酶一起孵育30分钟,然后通过SDS PAGE 分离并用NRF2抗体进行蛋白质印迹。
图14B是显示在CHX存在的情况下由HuCCT1细胞(圆圈)、 JHH-6细胞(正方形)和HUH1细胞(三角形)表达的NRF2蛋白质的稳定性的图。对来自图14A中所示结果的条带强度进行定量并与单相衰减曲线拟合以获得蛋白质半衰期估计,其示于每条曲线旁边。将相对蛋白质表达作为每种细胞系的初始浓度的百分比。
图14C显示蛋白质印迹实验的结果,其显示在用siNTC(50nM) 或siKEAP1(50nM)处理后HUH-1、JHH-6和HuCCT1细胞的NRF2 和Δe2NRF2的相对表达。使细胞在6孔培养皿中生长,并用100μg/ml 环己酰胺(CHX)处理指定的时间。将裂解物与400单位λ磷酸酶一起孵育30分钟,然后通过SDS PAGE分离并用NRF2抗体进行蛋白质印迹。
图14D是显示在用siNTC(实线)或siKEAP1(虚线)转染后在 CHX存在的情况下由HuCCT1细胞(圆圈)、JHH-6细胞(正方形)和 HUH1细胞(三角形)表达的NRF2蛋白质的稳定性的图。对来自图14C 中所示结果的条带强度进行定量并将其拟合至单相衰减曲线以获得蛋白质半衰期估计,其示于每条曲线旁边。将相对蛋白质表达作为每种细胞系的初始浓度的百分比。
图15显示蛋白质印迹实验的结果,其表明KMS-27细胞表达Δe2 NRF2。制备来自HCC-1354、KMS-27和HuCCT1细胞的20μg裂解物,并且除HuCCT1外用λP'tase处理所有细胞。然后将未处理和处理的裂解物进行SDS PAGE,并检测NRF2和肌动蛋白。
图16显示蛋白质印迹实验的结果,其显示NRF2的核定位。将 HuCCT1、HUH-1和JHH-6细胞在10cm培养皿中培养,并分成核和细胞溶质级分。通过SDS PAGE分离级分,并观察NRF2。使用Hsp90 作为细胞溶质标志物以及HDAC2作为核标志物来估计核和细胞溶质纯度。
图17A是显示在16个肝细胞癌细胞系(由黑色方块、实心灰色圆圈和空心灰色圆圈表示)中KEAP1基因标记的27个标签NRF2靶基因(各自显示在x轴上)的表达的图,该图使用在Klijn等(Nat Biotechnol. 33(3):306-312,2014)中描述的RNA测序数据。。实心灰色圆圈代表突变型KEAP1肝癌细胞系,而空心灰色圆圈代表JHH-6细胞系。
图17B是显示在18个多发性骨髓瘤细胞系(由黑色方块和空心灰色圆圈表示)中KEAP1基因标签的27个标签NRF2靶基因(各自显示在x轴上)的表达的图,该图使用在Klijn等(Nat Biotechnol.33(3): 306-312,2014)中描述的RNA测序数据。。空心灰色圆圈代表KMS-27 细胞系。
图18A是显示16个肝细胞癌细胞系中NRF2靶基因评分(在整个数据集上测定的27个NRF2靶基因的平均z-评分)的条形图。KEAP1 和NRF2改变分别表示为实心和轮廓框。
图18B是显示18个多发性骨髓瘤细胞系中NRF2靶基因评分(在整个数据集上测定的27个NRF2靶基因的平均z-评分)的条形图。概述框表示NRF2改变。
图19是显示在存在或不存在靶向NRF2的siRNA的情况下 HUH-1、JHH-6和HuCCT1细胞的活力的条形图。将细胞接种到96 孔板中,所述96孔板含有非靶向siRNA对照(NTC)或靶向NRF2的 siRNA(NRF2)。4天后使用CellTiter-Glo测量活力。活力表示为NTC 发光的百分比。
图20是显示转染试剂对HUH-1、JHH-6和HuCCT1细胞的相对 NRF2表达的影响的一系列条形图。使细胞在6孔培养皿中生长,并用靶向NRF2的NRF2外显子5的siRNA进行转染。48小时后分离总RNA,并使用靶向外显子5的Taqman探针测量NRF2表达。
图21是一系列条形图,其显示转染试剂对由HUH-1细胞(深灰色阴影条)、JHH-6细胞(江灰色阴影条)和HuCCT1细胞(黑色阴影条) 表达的四种充分表征的NRF2靶基因SLC7A11、GCLC、NR0B1和 SGRN的影响。使细胞在6孔培养皿中生长,并用靶向NRF2的NRF2 外显子5的siRNA或非靶向siRNA(NTC)进行转染。48小时后分离总RNA,并使用靶向指定的NRF2靶基因的Taqman探针测量基因表达。
图22是显示NRF2靶向siRNA对HUH-1、JHH-6和HuCCT1 细胞中DNA片段的影响的一系列代表性FACS柱状图。用星形孢菌素处理细胞作为阳性对照。
图23是显示NRF2外显子2和外显子2+3缺失对KEAP1相互作用的影响的一系列免疫印迹。用表达FLAG-NRF2、Δe2FLAG-NRF2、Δe2+3FLAG-NRF2或HA-KEAP1的质粒转染293细胞。转染后48 小时,裂解细胞,并使用所示抗体通过蛋白质印迹分析裂解物(顶部凝胶)或抗FLAG免疫沉淀物。
图24A是列显示环己酰胺对NRF2稳定性的影响的一系免疫印迹。用与图23中所述的相同的质粒转染293种细胞,并用100μg/ml 环己酰亚胺(CHX)处理指定的时间。裂解细胞并通过SDS PAGE分离,并使用NRF2和抗肌动蛋白抗体进行蛋白质印迹。
图24B是显示KEAP1表达后随时间推移的截短的NRF2的稳定性的图。
图25是显示各种NRF2靶基因在各种条件下的表达的一系列条形图。如图24A-24B所述处理细胞,但收获总RNA,将所述总RNA 用于使用Taqman RT-PCR分析所示基因的表达。
图26是显示根据KEAP1和NRF2的突变状态绘制的TCGA鳞状NSCLC肿瘤中指示的NRF2靶基因的mRNA表达水平的一系列图。仅考虑了对于其可获外显子组测序和RNA测序数据的样品。排除一个在NRF2和KEAP1中都具有突变的样品。另外,具有NRF2 拷贝数变化│log2(CAN)│>0.5的证据的样品被排除在外。
图27A是外显子组测序图,其显示了808个癌细胞系中的相对 NRF2外显子丰度,显示了作图至外显子2的读段减少。
图27B是显示了1,218个鳞状NSCLC肿瘤中外显子读段覆盖的归一化z评分的外显子组测序图。将显示外显子2或外显子2+3的读段计数减少的11个肿瘤与附近的对照区域进行比较。
图28A是显示支持影响NRF2外显子2或外显子2+3的基因组改变的七个肿瘤中的不一致的读段对的基因组位置的示意图。
图28B是显示染色体2的拷贝数分析的一系列图,其显示具有 NRF2外显子2(左图)和外显子2+3(右图)局部缺失(focal deletion)的四个肿瘤样品。箭头指向NRF2外显子2和/或外显子3。靶区域的对数比以黑色显示,对照区域以灰色显示。
图28C是一系列全基因组测序图,其显示在JHH-6细胞、KMS-27 细胞以及原发性肿瘤中在NRF2外显子2周围以及邻近匹配的DNA 中存在微缺失。跨越缺失的读段的序列显示为NRF2NRF2。
图29是一系列琼脂糖凝胶图像,其显示从具有磷状NSCLC的选定患者的总RNA扩增的RNA产物。显示通过RT-PCR获得的自患者#58肿瘤组织、患者#64肿瘤组织、患者#63正常组织和患者 #63肿瘤组织的扩增产物。用图11A中指定的引物扩增NRF2外显子2周围的区域。显示来自野生型NRF2和Δe2NRF2的片段。RT-PCR 分析将患者#63鉴定为具有NRF2外显子2的丢失,其与邻近的正常组织相比在肿瘤中强烈富集。
图30是显示通过RNA测序定量的跳过外显子2的接合读段在肿瘤和正常细胞中的存在的图。
图31是来自肺鳞状细胞癌(LUSC)的TCGA样品的突变型KEAP1 基因标签评分的直方图。深灰色直方图代表KEAP1/NRF2突变型肿瘤,浅灰色直方图代表外显子2/3缺失的肿瘤,中灰色直方图代表 KEAP1/NRF2野生型肿瘤。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图32是来自肺鳞状细胞癌(LUSC)、肺腺瘤(LUAD)和头颈鳞状细胞癌(HNSC)的TCGA样品的突变型KEAP1基因标签评分的一系列直方图。深灰色直方图代表KEAP1/NRF2突变型肿瘤,浅灰色直方图代表外显子2/3缺失的肿瘤,中灰色直方图代表KEAP1/NRF2野生型肿瘤。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图33是来自肺鳞状细胞癌(LUSC)、肺腺瘤(LUAD)和头颈鳞状细胞癌(HNSC)的TCGA样品的突变型KEAP1基因标签评分的一系列直方图。深灰色直方图代表肿瘤样品,浅灰色直方图代表正常样品。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图34是显示通过WGS鉴定的JHH-6细胞、KMS-26细胞和原发性肿瘤中的缺失的结构的一系列连接读段序列。JHH-6细胞的3'末端、 5'末端和连接读段的DNA序列分别由SEQ IDNO:61-63提供。KMS-27细胞的3'末端、5'末端和连接读段的DNA序列分别由SEQ ID NO:64-66提供。原代肿瘤细胞的3'末端、5'末端和连接读段的DNA 序列分别由SEQ ID NO:67-69提供。
图35是显示NRF2的相对表达的一系列蛋白质印迹。用表达独立的非靶对照(NTC)或三个独立的NRF2 shRNA序列(sh1、sh2和sh3) 的慢病毒感染指定的细胞系,并在嘌呤霉素选择后用(+)或不用(-)500 ng/mL多西环素(dox)孵育48小时。
图36是显示在用或不用dox孵育7天后图35中所示细胞系的活力的图。使用CellTiter-Glo(CTG)ATP检测来测量活力。每个圆圈是六个技术重复的平均值,并且将其针对三个独立的NTC+dox的平均百分比活力进行归一化。
图37是显示用dox对比没有dox处理的细胞系的存活力的图。使细胞生长4天,并使用CTG ATP测量法测量活力。使用学生氏t 检验计算显著性。
图38是显示用NRF2 siRNA处理后相对于NTC处理后的28种 NSCLC细胞系的活力的图。将细胞按KEAP1基因型分组。使用学生氏t检验计算显著性。
图39是蛋白质印迹实验,其显示了NRF2在KEAP1突变型肿瘤中的表达。给小鼠植入表达NRF2 sh10的A549细胞。当肿瘤达到~200 mm3时,向饮用水中加入1mg/ml多西环素或5%蔗糖。五天后,将肿瘤提取物印迹以用于NRF2。
图40是显示NRF2在KEAP1突变型肿瘤中的表达的蛋白质印迹实验。给小鼠植入表达NRF2 sh10的H441细胞。当肿瘤达到~200mm 3时,向饮用水中加入1mg/ml多西环素或5%蔗糖。五天后,将肿瘤提取物印迹以用于NRF2。
图41A是显示植入KEAP1突变型肿瘤的小鼠中肿瘤体积的动力学的图。给小鼠植入表达NRF2 sh10的A549细胞系。当肿瘤达到~200 mm3时,将小鼠随机化至组(每组10只)中,并向饮用水中加入1mg/ml 多西环素或5%蔗糖。在28天的时期内测量肿瘤。误差棒代表SEM(n=10)。
图41B是显示植入KEAP1突变型肿瘤的小鼠中肿瘤体积的动力学的图。给小鼠植入表达NRF2 sh10的H441细胞系。当肿瘤达到~200 mm3时,将小鼠随机化至组(每组10只)中,并向饮用水中加入1mg/ml 多西环素或5%蔗糖。在28天的时期内测量肿瘤。误差棒代表SEM(n=10)。
图42是显示A549或H441细胞在各种生长条件下的表达的存活力的一系列条形图。将表达NTC或NRF2 sh10 shRNA的A549和H460 细胞接种到2D组织培养物处理的塑料皿或超低附着(ULA)包被的组织培养板中。然后将它们在环境氧浓度或0.5%氧气(缺氧)中培养5天。通过CTG ATP测量评估细胞活力。
图43是一系列照片,其显示用媒介物500ng/ml dox或1mM还原型谷胱甘肽(GSH)处理的软琼脂中KEAP1突变型细胞系(A549、 H1437和H460)和KEAP1野生型细胞系(H1048、H441和Calu6)的集落形成。拍摄了该板的代表性区域。
图44是显示图43中所示的每种细胞类型和处理组的定量集落形成的一系列条形图。误差棒表示生物一式三份孔的标准偏差。
图45是显示在微图案化纳米培养皿上形成A549菌落的一系列照片。在500ng/ml dox存在或不存在的情况下培养约5天后拍摄细胞。
图46是显示来自图45的细胞活力(通过CTG ATP测量法定量的) 的条形图。每个处理组的左栏代表1,000个细胞培养物,右栏代表 5,000个细胞培养物。
图47是显示在含甲基纤维素的组织培养皿中铺板的5,000个、 50,000个或500,000个NTC或NRF2sh10 shRNA表达A549细胞的一系列照片。在500ng/ml dox存在或不存在的情况下培养约10天后拍摄细胞。
图48是显示在常规组织培养皿(顶部)或软琼脂(底部)中铺板的表达NRF2sh10shRNA的A549细胞的一系列照片。在2mM N-乙酰半胱氨酸(NAC)存在或不存在的情况下,用媒介物或500ng/ml多西环素处理细胞。通过CTG ATP测量在约5天后测量2D生长的活力,并且在生长约10天后拍摄软琼脂中的细胞照片。
图49是显示在使用2',7'-二氯二氢荧光素二乙酸酯(H2DCF)测量的指定条件下的活性氧种类(ROS)水平的条形图。误差棒表示来自一式三份孔的标准偏差。
图50是显示NRF2敲低对SLC7A11的表达的影响的蛋白质印迹实验。将表达NRF2sh10的A549细胞用媒介物或500ng/ml dox处理指定的时间点,并使用SLC7A11和β-肌动蛋白抗体进行印迹。
图51是显示在各种浓度的埃拉斯汀(erastin)下表达NTC1或 NRF2 sh10的A549细胞摄取胱氨酸的条形图。将表达NTC1或NRF2 sh10的A549细胞与载体或dox孵育48小时,然后与0.5uCi14C-胱氨酸孵育20分钟。裂解细胞并通过液体闪烁计数测量细胞内胱氨酸。
图52是显示响应于NRF2敲低的A549和H1437细胞中的谷胱甘肽(GSH)水平的条形图。
图53是显示如通过H2DCF测量的响应于shNRF2和/或埃拉斯汀的ROS水平升高的直方图。
图54是显示如使用CTG ATP测量法测量的约4天后在表达 shNTC或shNFR2的A549细胞相对于埃拉斯汀的剂量响应的活力的图。
图55A是显示如从图54中显示的剂量反应图推断的埃拉斯汀对 KEAP1野生型细胞系对比KEAP1突变型细胞系的IC50的图。
图55B是显示作为图54中显示的剂量反应图的曲线下面积的 KEAP1野生型细胞系对比KEAP1突变型细胞系的活力的图。
图56A是显示谷氨酰胺酶抑制剂BPTES对KEAP1野生型细胞系对比KEAP1突变型细胞系的IC50的图。
图56B是显示KEAP1野生型细胞系对比KEAP1突变型细胞系响应于谷氨酰胺酶抑制剂BPTES的活力的图。
图57A是显示谷氨酰胺酶抑制剂丁硫氨酸亚砜亚胺(buthionine sylphoximine)(BSO)对KEAP1野生型细胞系对比KEAP1突变型细胞系的IC50的图。
图57B是显示KEAP1野生型细胞系对比KEAP1突变型细胞系响应于BSO的活力的图。
图58是显示在3D甲基纤维素培养皿相对于2D塑料组织培养皿中生长15天的KEAP1突变型NSCLC细胞中每个指定基因的平均 gRNA表达的散点图。用表达包含481个NRF2/KEAP1靶基因和37 个对照基因的gRNA文库的慢病毒(在1000x覆盖度下0.3MOI)感染 A549细胞。然后将嘌呤霉素抗性细胞接种到2D塑料组织培养皿中或在甲基纤维素中生长。在不同时间点之后,收集细胞并通过下一代测序鉴定gRNA。
图59是显示植入裸小鼠(xeno)中的对比在2D塑料组织培养皿中生长15天的KEAP1突变型NSCLC细胞中每个指定基因的平均 gRNA表达的散点图。用表达包含481个NRF2/KEAP1靶基因和37 个对照基因的gRNA文库的慢病毒(在1000x覆盖下0.3MOI)感染 A549细胞。然后将嘌呤霉素抗性细胞铺板到2D塑料组织培养皿中或植入裸小鼠中。在不同时间点之后,收集细胞并通过下一代测序鉴定gRNA。
图60是显示植入裸小鼠(xeno)的对比在3D甲基纤维素培养物中生长15天的KEAP1突变型NSCLC细胞中每个指定基因的平均 gRNA表达的散点图。用表达包含481个NRF2/KEAP1靶基因和37 个对照基因的gRNA文库的慢病毒(在1000x覆盖下0.3MOI)感染 A549细胞。然后将嘌呤霉素抗性细胞在甲基纤维素中生长或植入到裸小鼠中。在不同时间点之后,收集细胞并通过下一代测序鉴定 gRNA。
图61是显示响应于利用Erb2抗体YW57.88.5的处理的A549异种移植肿瘤体积的动力学的图。
图62是一系列照片,其显示在IGF1R抑制剂林西替尼和 NVP-AEW541存在的情况以及在谷胱甘肽存在或不存在的情况下,在软琼脂(非贴壁依赖性条件)中生长的KEAP1突变型细胞系和 KEAP1野生型细胞系的集落形成。
具体实施方式
I.引言
本发明提供癌症诸如肺癌(例如,NSCLC)或头颈鳞状癌(例如, HNSC)的诊断和伴随治疗方法。本发明至少部分基于以下发现:NRF2 中去除外显子2或外显子2+3的剪接变体导致在癌症中赋予NRF2激活的意外机制。NRF2剪接变体通过KEAP1或NRF2中的突变的互斥机制导致NRF2激活,但产生相似的NRF2靶基因表达谱。在具有导致这些NRF2剪接变体的微缺失的细胞系中,存在NRF2-KEAP1 相互作用的丧失,增加的NRF2稳定化,NRF2转录反应的诱导和 NRF2途径依赖性。这发生在3-6%的鳞状NSCLC和1-2%的HNSC 中,并且导致NRF2靶基因的类似激活和作为KEAP1突变的对途径的依赖性。
该发现可用于诊断患有癌症的受试者(例如,通过检测NRF2剪接变体或通过检测与NRF2剪接变体的存在一致的基因或蛋白质表达谱)和用于根据此类诊断治疗受试者(例如,通过施用治疗有效量的 NRF2途径拮抗剂,例如cAMP应答元件结合蛋白(CREB)结合蛋白(CBP)抑制剂)。
II.定义
术语“诊断(diagnose)”、“诊断(diagnosing)”或“诊断(diagnosis)”在本文中用于指分子或病理状态、疾病或病症(例如,癌症)的鉴定或分类。例如,“诊断”可以是指特定类型的癌症的鉴别。“诊断”还可以是指例如通过组织病理学标准或通过分子特征(例如,特征在于生物标志物(例如,特定基因或由所述基因编码的蛋白质)中的一种或组合的表达的亚型)进行的癌症的特定亚型的分类。
术语“癌症”和“癌性”是指或描述哺乳动物中的生理学病状,其特征通常在于细胞生长不受调控。该定义包括良性和恶性癌症以及休眠肿瘤或微转移(micrometastatses)。癌症的实例包括但不限于癌、淋巴瘤、胚细胞瘤、胶质母细胞瘤、肉瘤和白血病。癌症可包括例如乳腺癌、鳞状细胞癌、肺癌(包括小细胞肺癌、非小细胞肺癌(NSCLC)、肺腺癌和肺鳞状细胞癌(例如、鳞状NSCLC))、各种类型的头颈癌(例如、HNSC)、腹膜癌、肝细胞癌、胃癌或胃癌(stomach cancer)(包括胃肠癌)、胰腺癌、卵巢癌、宫颈癌、肝癌、膀胱癌、肝瘤、结肠癌、结直肠癌、子宫内膜癌或子宫癌、唾液腺癌、肾癌或肾癌、肝癌、前列腺癌、外阴癌、甲状腺癌和肝癌、以及B细胞淋巴瘤(包括低级/滤泡性非霍奇金淋巴瘤(NHL)、小淋巴细胞性(SL)NHL、中级/滤泡性 NHL、中级弥漫性NHL、高级成免疫细胞性NHL、高级成淋巴细胞性NHL、高级小无核裂细胞性NHL、贮积病NHL(bulky disease NHL)、套细胞淋巴瘤、AIDS相关淋巴瘤和瓦尔登斯特伦氏巨球蛋白血症)、慢性淋巴细胞性白血病(CLL)、急性淋巴细胞性白血病(ALL)、毛细胞性白血病、慢性成髓细胞性白血病和移植后淋巴细胞增殖性疾病(PTLD)、以及与瘢痣病(phakomatoses)、水肿(诸如与脑瘤有关的)和梅格斯氏综合征相关的异常血管增殖。
本文中的“患者”或“受试者”是指有资格接受治疗,正在经历或经历过疾病或病症诸如癌症的一种或多种体征、症状或其它指标的任何单个动物(包括例如哺乳动物,诸如狗、猫、马、兔、动物园动物、牛、猪、羊、非人灵长类动物和人),诸如人。作为患者而被包括的是参与临床研究试验但未显示任何疾病临床体征的任何患者,参与流行病学研究的患者或曾用作对照的患者。患者可能先前已经用NRF2 途径拮抗剂或另一种药物治疗,或者未经如此治疗。当开始本文的治疗时,患者可能初次接触使用的一种或多种另外的药物,即,患者可能先前在“基线”(即,在本文的治疗方法中施用第一剂量的NRF2途径拮抗剂之前的设定时间点,诸如在治疗开始前筛选受试者的当天)时未使用例如除NRF2途径拮抗剂(例如,VEGF拮抗剂或PD-1轴结合拮抗剂)外的疗法进行治疗。这种“首次接触药物真的”患者或受试者通常被认为是用一种或多种此类另外的药物治疗的候选者。
术语“表达的水平”或“表达水平”通常可互换使用,并且通常是指生物样品中生物标志物的量。“表达”通常是指籍以将信息(例如,基因编码的信息和/或表观遗传信息)转换成在细胞中存在和操作的结构的过程。因此,如本文中所用,“表达”可以指转录成多核苷酸、翻译成多肽,或甚至多核苷酸和/或多肽修饰(例如,多肽的翻译后修饰)。转录的多核苷酸、翻译的多肽的片段或多核苷酸和/或多肽修饰(例如,多肽的翻译后修饰),无论它们源自通过可变剪接产生的转录物或降解的转录物还是源自多肽的翻译后加工(例如通过蛋白水解),也应被视为表达的。“表达的基因”包括转录成多核苷酸(作为mRNA)然后翻译成多肽的那些基因,以及转录成RNA但不翻译成多肽的那些基因 (例如,转运RNA和核糖体RNA)。
术语“生物标志物”和“标志物”在本文中可互换使用,是指DNA、 RNA、蛋白质、碳水化合物或基于糖脂的分子标志物,可通过标准方法(或本文公开的方法)检测其在受试者或患者样品中的表达或存在。此类生物标志物包括但不限于表1中列出的mRNA序列及其编码的蛋白质。可以确定此类生物标志物的表达在获自对NRF2途径拮抗剂敏感或作出响应的患者的样品中比参照水平(包括例如,来自患者(例如,患有癌症并将测试其对NRF2途径拮抗剂的响应性的患者)的组/ 群体的样品中生物标志物的平均(例如,平均值或中位值)表达水平;来自患者(例如,患有癌症并且被鉴定为不响应于NRF2途径拮抗剂的患者)的组/群体的样品中生物标志物的中位表达水平;先前获自个体的样品中的水平;或者来自在原发性肿瘤的情况下接受了利用 NRF2途径拮抗剂的先前治疗并且现在可能正在经历转移的患者的样品中的水平)高或低。具有大于或小于至少一种基因(诸如表1中列出的那些基因)的参照表达水平的表达水平的个体,可被鉴定为可能对利用NRF2途径拮抗剂的治疗起反应的受试者/患者。例如,表现出相对于(即,高于或低于)参照水平(诸如平均水平)最极端50%、45%、 40%、35%、30%、25%、20%、15%、10%或5%的基因表达水平的受试者/患者可被鉴定为可能响应于NRF2途径拮抗剂治疗的受试者/ 患者(例如,患有癌症的患者)。
表1.
如本文中所用,除非另有说明,否则术语“ABCC2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然ABCC2(ATP结合盒亚家族C,成员2)。该术语包括“全长”,未加工的ABCC2以及由细胞中的加工产生的 ABCC2的任何形式。该术语还包括天然存在的ABCC2变体,例如剪接变体或等位基因变体。示例性人ABCC2的核酸序列示于SEQ ID NO:1中。由人ABCC2编码的示例性蛋白质的氨基酸序列显于SEQ ID NO:33中。
如本文中所用,除非另有说明,否则术语“AKR1B10”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然AKR1B10(醛-酮还原酶家族1,成员 B10)。该术语包括“全长”、未加工的AKR1B10以及由细胞中的加工产生的AKR1B10的任何形式。该术语还包括天然存在的AKR1B10 变体,例如剪接变体或等位基因变体。示例性人AKR1B10的核苷酸序列示于SEQ ID NO:2中。由人AKR1B10编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:34中。
如本文中所用,除非另有说明,否则术语“AKR1B15”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然AKR1B15(醛-酮还原酶家族1,成员 B15)。该术语包括“全长”、未加工的AKR1B15以及由细胞中的加工产生的AKR1B15的任何形式。该术语还包括天然存在的AKR1B15 变体,例如剪接变体或等位基因变体。示例性人AKR1B15的核苷酸序列示于SEQ ID NO:3中。由人AKR1B15编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:35中。
如本文中所用,除非另有说明,否则术语“AKR1C2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然AKR1C2(醛-酮还原酶家族1,成员 C2)。该术语包括“全长”、未加工的AKR1C2以及由细胞中的加工产生的AKR1C2的任何形式。该术语还包括天然存在的AKR1C2变体,例如剪接变体或等位基因变体。示例性人AKR1C2的核苷酸序列示于SEQ ID NO:4中。由人AKR1C2编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:36中。
如本文中所用,除非另有说明,否则术语“AKR1C3”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然AKR1C3(醛-酮还原酶家族1,成员 C3)。该术语包括“全长”、未加工的AKR1C3以及由细胞中的加工产生的AKR1C3的任何形式。该术语还包括天然存在的AKR1C3变体,例如剪接变体或等位基因变体。示例性人AKR1C3的核苷酸序列示于SEQ ID NO:5中。由人AKR1C3编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:37中。
如本文中所用,除非另有说明,否则术语“AKR1C4”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然AKR1C4(醛-酮还原酶家族1,成员 C4)。该术语包括“全长”、未加工的AKR1C4以及由细胞中的加工产生的AKR1C4的任何形式。该术语还包括天然存在的AKR1C4变体,例如剪接变体或等位基因变体。示例性人AKR1C4的核苷酸序列示于SEQ ID NO:6中。由人AKR1C4编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:38中。
如本文中所用,除非另有说明,否则术语“CABYR”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然CABYR(钙结合酪氨酸-(Y)-磷酸化调节的)。该术语包括“全长”、未加工的CABYR以及由细胞中的加工产生的CABYR的任何形式。该术语还包括天然存在的CABYR变体,例如剪接变体或等位基因变体。示例性人CABYR的核苷酸序列示于 SEQ ID NO:7中。由人CABYR编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:39中。
如本文中所用,除非另有说明,否则术语“CYP4F11”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然CYP4F11(细胞色素P450,家族4,亚家族F,多肽11)。该术语包括“全长”、未加工的CYP4F11以及由细胞中的加工产生的CYP4F11的任何形式。该术语还包括天然存在的CYP4F11变体,例如剪接变体或等位基因变体。示例性人CYP4F11 的核苷酸序列示于SEQ ID NO:8中。由人CYP4F11编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:40中。
如本文中所用,除非另有说明,否则术语“FECH”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然FECH(亚铁螯合酶)。该术语包括“全长”、未加工的FECH以及由细胞中的加工产生的FECH的任何形式。该术语还包括天然存在的FECH变体,例如剪接变体或等位基因变体。示例性人FECH的核苷酸序列示于SEQ ID NO:9中。由人FECH编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:41中。
如本文中所用,除非另有说明,否则术语“FTL”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然FTL(铁蛋白,轻多肽(Light Polypeptide))。该术语包括“全长”、未加工的FTL以及由细胞中的加工产生的FTL 的任何形式。该术语还包括天然存在的FTL变体,例如剪接变体或等位基因变体。示例性人FTL的核苷酸序列示于SEQ ID NO:10中。由人FTL编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:42中。
如本文中所用,除非另有说明,否则术语“GCLM”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然GCLM(谷氨酰胺-半胱氨酸连接酶,修饰亚基)。该术语包括“全长”、未加工的GCLM以及由细胞中的加工产生的GCLM的任何形式。该术语还包括天然存在的GCLM变体,例如剪接变体或等位基因变体。示例性人GCLM的核苷酸序列示于 SEQ ID NO:11中。由人GCLM编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:43中。
如本文中所用,除非另有说明,否则术语“GSR”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然GSR(谷胱甘肽还原酶)。该术语包括“全长”、未加工的GSR以及由细胞中的加工产生的GSR的任何形式。该术语还包括天然存在的GSR变体,例如剪接变体或等位基因变体。示例性人GSR的核苷酸序列示于SEQ ID NO:12中。由人GSR编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:44中。
如本文中所用,除非另有说明,否则术语“KYNU”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然KYNU(犬尿氨酸酶)。该术语包括“全长”、未加工的KYNU以及由细胞中的加工产生的KYNU的任何形式。该术语还包括天然存在的KYNU变体,例如剪接变体或等位基因变体。示例性人KYNU的核苷酸序列示于SEQ ID NO:13中。由人KYNU 编码的示例性蛋白质的氨基酸序列示于SEQ IDNO:45中。
如本文中所用,除非另有说明,否则术语“ME1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然ME1(苹果酸酶1,NADP(+)-依赖性的,细胞溶质的)。该术语包括“全长”、未加工的ME1以及由细胞中的加工产生的ME1的任何形式。该术语还包括天然存在的ME1变体,例如剪接变体或等位基因变体。示例性人ME1的核苷酸序列示于SEQ ID NO:14中。由人ME1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:46中。
如本文中所用,除非另有说明,否则术语“NFE2L2”或“NRF2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然NFE2L2或NRF2(核因子,红细胞样2-2)。该术语包括“全长”、未加工的NFE2L2以及由细胞中的加工产生的NFE2L2的任何形式。该术语还包括天然存在的 NFE2L2变体,例如剪接变体或等位基因变体。示例性人NFE2L2的核苷酸序列示于SEQ ID NO:15中。由人NFE2L2编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:47中。
如本文中所用,除非另有说明,否则术语“NQO1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然NQO1(NAD(P)H脱氢酶,醌1)。该术语包括“全长”、未加工的NQO1以及由细胞中的加工产生的NQO1 的任何形式。该术语还包括天然存在的NQO1变体,例如剪接变体或等位基因变体。示例性人NQO1的核苷酸序列示于SEQ ID NO:16 中。由人NQO1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO: 48中。
如本文中所用,除非另有说明,否则术语“NR0B1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然NR0B1(核受体亚家族0,组B,成员1)。该术语包括“全长”、未加工的NR0B1以及由细胞中的加工产生的NR0B1的任何形式。该术语还包括天然存在的NR0B1变体,例如剪接变体或等位基因变体。示例性人NR0B1的核苷酸序列示于SEQ ID NO:17中。由人NR0B1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:49中。
如本文中所用,除非另有说明,否则术语“OSGIN1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然OSGIN1(氧化应激诱导的生长抑制剂 1)。该术语包括“全长”、未加工的OSGIN1以及由细胞中的加工产生的OSGIN1的任何形式。该术语还包括天然存在的OSGIN1变体,例如剪接变体或等位基因变体。示例性人OSGIN1的核苷酸序列示于 SEQ ID NO:18中。由人OSGIN1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:50中。
如本文中所用,除非另有说明,否则术语“PGD”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然PGD(磷酸葡萄糖酸脱氢酶)。该术语包括“全长”、未加工的PGD以及由细胞中的加工产生的PGD的任何形式。该术语还包括天然存在的PGD变体,例如剪接变体或等位基因变体。示例性人PGD的核苷酸序列示于SEQ ID NO:19中。由人PGD 编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:51中。
如本文中所用,除非另有说明,否则术语“RSPO3”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然RSPO3(R-脊椎蛋白3)。该术语包括“全长”、未加工的RSPO3以及由细胞中的加工产生的RSPO3的任何形式。该术语还包括天然存在的RSPO3变体,例如剪接变体或等位基因变体。示例性人RSPO3的核苷酸序列示于SEQ ID NO:20中。由人RSPO3编码的示例性蛋白质的氨基酸序列示于SEQID NO:52中。
如本文中所用,除非另有说明,否则术语“SLC7A11”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然SLC7A11(溶质载体家族7(阴离子型氨基酸转运蛋白轻链,Xc-系统),成员11)。该术语包括“全长”、未加工的SLC7A11以及由细胞中的加工产生的SLC7A11的任何形式。该术语还包括天然存在的SLC7A11变体,例如剪接变体或等位基因变体。示例性人SLC7A11的核苷酸序列示于SEQ ID NO:21中。由人SLC7A11编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:53中。
如本文中所用,除非另有说明,否则术语“SRXN1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然SRXN1(硫氧还蛋白1)。该术语包括“全长”、未加工的SRXN1以及由细胞中的加工产生的SRXN1的任何形式。该术语还包括天然存在的SRXN1变体,例如剪接变体或等位基因变体。示例性人SRXN1的核苷酸序列示于SEQ ID NO:22中。由人SRXN1编码的示例性蛋白质的氨基酸序列示于SEQID NO:54中。
如本文中所用,除非另有说明,否则术语“TALDO1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然TALDO1(转醛醇酶1)。该术语包括“全长”、未加工的TALDO1以及由细胞中的加工产生的TALDO1的任何形式。该术语还包括天然存在的TALDO1变体,例如剪接变体或等位基因变体。示例性人TALDO1的核苷酸序列示于SEQ ID NO:23 中。由人TALDO1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO: 55中。
如本文中所用,除非另有说明,否则术语“TRIM16”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然TRIM16(含三重基序的16)。该术语包括“全长”、未加工的TRIM16以及由细胞中的加工产生的TRIM16 的任何形式。该术语还包括天然存在的TRIM16变体,例如剪接变体或等位基因变体。示例性人TRIM16的核苷酸序列示于SEQ ID NO: 24中。由人TRIM16编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:56中。
如本文中所用,除非另有说明,否则术语“TRIM16L”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然TRIM16L(含三重基序的16-样)。该术语包括“全长”、未加工的TRIM16L以及由细胞中的加工产生的 TRIM16L的任何形式。该术语还包括天然存在的TRIM16L变体,例如剪接变体或等位基因变体。示例性人TRIM16L的核苷酸序列示于 SEQ ID NO:25中。由人TRIM16L编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:57中。
如本文中所用,除非另有说明,否则术语“TXN”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然TXN(硫氧还蛋白)。该术语包括“全长”、未加工的TXN以及由细胞中的加工产生的TXN的任何形式。该术语还包括天然存在的TXN变体,例如剪接变体或等位基因变体。示例性人TXN的核苷酸序列示于SEQ ID NO:26中。由人TXN编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:58中。
如本文中所用,除非另有说明,否则术语“TXNRD1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物 (例如,小鼠和大鼠)的任何天然TXNRD1(硫氧环蛋白还原酶1)。该术语包括“全长”、未加工的TXNRD1以及由细胞中的加工产生的TXNRD1的任何形式。该术语还包括天然存在的TXNRD1变体,例如剪接变体或等位基因变体。示例性人TXNRD1的核苷酸序列示于 SEQ ID NO:27中。由人TXNRD1编码的示例性蛋白质的氨基酸序列示于SEQ ID NO:59中。
如本文中所用,除非另有说明,否则术语“UGDH”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然UGDH(尿苷二磷酸(UDP)-葡萄糖-6-脱氢酶)。该术语包括“全长”、未加工的UGDH以及由细胞中的加工产生的UGDH的任何形式。该术语还包括天然存在的UGDH变体,例如剪接变体或等位基因变体。示例性人UGDH的核苷酸序列示于SEQ ID NO:28中。由人UGDH编码的示例性蛋白质的氨基酸序列示于 SEQ ID NO:60中。
术语“样品”和“生物样品”可互换使用,是指从个体(包括体液、身体组织(例如,肿瘤组织)、细胞)或其它来源获得的任何生物样品。体液是例如淋巴液、血清、新鲜全血、外周血单核细胞、冷冻全血、血浆(包括新鲜或冷冻的)、尿液、唾液、精液、滑液和脊髓液。样品还包括乳腺组织、肾组织、结肠组织、脑组织、肌肉组织、滑膜组织、皮肤、毛囊、骨髓和肿瘤组织。从哺乳动物获得组织活检物和体液的方法是本领域熟知的。
“组织样品”或“细胞样品”是指从受试者或个体的组织获得的相似细胞的集合。组织或细胞样品的来源可以是来自新鲜、冷冻和/或保存的器官、组织样品、活检物和/或抽吸物的实体组织;血液或任何血液成分诸如血浆;体液诸如脑脊髓液、羊水、腹膜液或间质液;来自受试者的妊娠或发育中的任何时间的细胞。组织样品也可以是原代或培养的细胞或细胞系。任选地,组织或细胞样品获自疾病组织/ 器官。组织样品可含有在自然界中不与组织天然混杂的化合物,诸如防腐剂、抗凝血剂、缓冲剂、固定剂、营养物、抗生素等。
如本文所用的“参照样品”、“参照细胞”、“参照组织”、“对照样品”、“对照细胞”或“对照组织”是指用于比较目的的样品、细胞、组织、标准或水平。在一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自同一受试者或个体的身体的健康和 /或非患病部分(例如,组织或细胞)。例如,健康和/或非患病细胞或与患病细胞或组织相邻的组织(例如,与肿瘤相邻的细胞或组织)。在另一个实施方案中,参照样品获自同一受试者或个体的身体的未处理组织和/或细胞。在另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自不是受试者或个体的个体的身体的健康和/或非患病部分(例如,组织或细胞)。在甚至另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自非受试者或个体的身体的未治疗组织和/或细胞。在另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自一种或多种细胞系(例如,一种或多种正常细胞系)。
如本文中所用,短语“鉴定患者(identifying a patient)”或“鉴定患者(identifies a patient)”是指使用与表1中所列的基因中的至少一种的水平相关的生成的信息或数据、具有其外显子2或外显子2+3的全部或部分的缺失的NRF2mRNA或具有其Neh2或Neh2+4的全部或部分的缺失的NRF2蛋白在患者样品中的存在,来将患者鉴定或选择为更可能受益于或不太可能受益于包含NRF2途径拮抗剂的疗法。所使用或生成的信息或数据可以为任何形式(书面、口头或电子的)。在一些实施方案中,使用所生成的信息或数据包括传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合。在一些实施方案中,传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合是由计算设备、分析器单元或其组合来执行。在一些其它实施方案中,传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合是由实验室或医学专业人员来执行。在一些实施方案中,信息或数据包括表 1中所列的基因中的至少一种的水平与参照水平的比较。在一些实施方案中,信息或数据包括表1中所列的基因中的至少一种存在或不存在于样品中的指示。在一些实施方案中,信息或数据包括NRF2 mRNA具有其外显子2或外显子2+3的全部或部分的缺失的指示。在一些实施方案中,信息或数据包括NRF2蛋白具有其Neh2或 Neh2+4的全部或部分的缺失的指示。在一些实施方案中,信息或数据包括患者更可能或不太可能响应包含NRF2途径拮抗剂的疗法的指示。
术语“引物”是指单链多核苷酸,其能够与核酸杂交并允许互补核酸聚合(通常通过提供游离的3'-OH基团)。
如本文中所用,术语“治疗(treatment)”(及其语法变化形式,诸如“治疗(treat)”或“治疗(treating)”)是指试图改变所治疗个体的天然病程的临床介入,且可为了预防或在临床病理学过程中而进行。理想的治疗效果包括但不限于防止疾病发生或复发性、减轻症状、减弱疾病的任何直接或间接病理学后果、防止转移、降低疾病进展速度、改善或缓解疾病状态以及缓和或改善预后。在一些实施方案中,本发明的抗体用于延迟疾病的发展或减缓疾病的进展。
如本文中所用,“施用”意指向受试者施用一定剂量的化合物(例如,NRF2途径拮抗剂)的方法。本文所述方法中使用的组合物可以例如通过玻璃体内(例如,通过玻璃体内注射)、通过滴眼、肌内、静脉内、皮内、经皮、动脉内、腹膜内、病灶内、颅内、关节内、前列腺内(intraprostatically)、胸膜内、气管内、鞘内、鼻内、阴道内、直肠内、局部、瘤内、腹膜内、皮下、结膜下、囊内、粘膜、心包内、脐带内、眼内、眶内、口服、局部、透皮、通过吸入、通过注射、通过植入、通过输注、通过连续输注、通过直接局部灌注靶细胞、通过导管、通过灌洗、在乳膏中或在脂质组合物中的途径进行施用。用于本文所述方法中的组合物还可以以全身方式或以局部方式施用。施用方法可以根据各种因素(例如,所施用的化合物或组合物以及所治疗的病状、疾病或病症的严重性)而变化。
试剂(例如,药物制剂)的“有效量”是指以剂量和在需要的时间段内能有效获得所需的治疗或预防结果的量。
本文中的术语“抗体”以最广泛的含义使用,并且包括各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们显示出所需的抗原-结合活性。
关于参照多肽序列的“氨基酸序列同一性百分比(%)”定义为在比对序列并且必要时引入间隙以实现最大序列同一性百分比,并且不考虑任何保守性取代作为序列同一性的一部分之后,候选序列中与参照多肽序列中的氨基酸残基相同的氨基酸残基的百分比。用于测定氨基酸序列同一性百分比的目的的比对可以属于本领域中的技能的多种方式实现,所述方式例如使用可公开获得的计算机软件,诸如 BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。本领域技术人员可确定用于比对序列的适当参数,包括在所比较的序列的全长上实现最大对准所需的任何算法。然而,出于本文目的,使用序列比较计算机程序ALIGN-2产生氨基酸序列同一性%值。ALIGN-2序列比较计算机程序由Genentech,Inc.创造,且原始码已与用户文件一起在美国版权办公室(U.S.Copyright Office,WashingtonD.C.,20559)备案,其中其在美国版权登记号TXU510087下登记。ALIGN-2程序可从Genentech,Inc.,South San Francisco,Calif.公开获得,或者可以从源代码编译。ALIGN-2程序应编译用于UNIX操作系统(包括数字UNIX V4.0D)上。所有序列比较参数皆由ALIGN-2程序设置且不改变。
在ALIGN-2用于氨基酸序列比较的情形下,给定氨基酸序列A 对于、与或针对给定氨基酸序列B的氨基酸序列同一性%(其可选地表述为对于、与或针对给定的氨基酸序列B具有或包含一定的氨基酸序列同一性%的给定氨基酸序列A)如下计算:
100×分数X/Y
其中X为在对A与B进行该程序比对时由序列比对程序 ALIGN-2评分为相同匹配的氨基酸残基数目,且其中Y为B中的氨基酸残基总数。应了解,在氨基酸序列A的长度不等于氨基酸序列B 的长度的情况下,A与B的氨基酸序列同一性%将不等于B与A的氨基酸序列同一性%。除非另外特定陈述,否则本文中所使用的所有氨基酸序列同一性%值使用ALIGN-2计算机程序如前一段落中所描述而获得。
术语“抗肿瘤的”是指可用于治疗癌症的组合物,其包含至少一种活性治疗剂,例如“抗癌剂”。治疗剂(抗癌剂)的实例包括但不限于,例如,化学治疗剂、生长抑制剂、细胞毒剂、放射治疗中使用的药剂、抗血管生成剂、凋亡剂、抗微管蛋白剂和治疗癌症的其它药剂,诸如抗HER-2抗体、抗CD20抗体、表皮生长因子受体(EGFR)拮抗剂(例如,酪氨酸激酶抑制剂)、HER1/EGFR抑制剂(例如厄洛替尼 (TARCEVATM))、血小板衍生生长因子抑制剂(例如,GLEEVECTM(甲磺酸伊马替尼))、COX-2抑制剂(例如,塞来昔布)、干扰素、细胞因子、拮抗剂(例如,中和抗体),其与一种或多种以下靶标结合:ErbB2、 ErbB3、ErbB4、PDGFR-β、BlyS、APRIL、BCMA或一种或多种VEGF 受体、TRAIL/Apo2和其它生物活性和有机化学试剂等等。其组合物也包括在本发明中。
如本文中所用,术语“细胞毒剂”是指抑制或阻止细胞功能和/或导致细胞死亡或破坏的物质。细胞毒剂包括但不限于放射性同位素(例如,At211、I131、I125、Y90、Re186、Re188、Sm153、Bi212、P32、Pb212和 Lu的放射性同位素);化学治疗剂或药物(例如,甲氨蝶呤、阿霉素、长春花生物碱(长春新碱、长春碱、依托泊苷)、多柔比星、美法仑、丝裂霉素C、苯丁酸氮芥、柔红霉素或其它嵌入剂);生长抑制剂;酶及其片段如溶核酶、抗生素、毒素诸如小分子毒素或细菌、真菌、植物或动物来源的酶促活性毒素,包括其片段和/或变体,以及下文公开的各种抗肿瘤剂或抗癌剂。
“化学治疗剂”是用于治疗癌症的化合物。“化学治疗剂”的实例包括用于治疗癌症的化合物。化学治疗剂的实例包括烷化剂,诸如,例如替莫唑胺(TMZ)、烷化剂达卡巴嗪的咪唑四嗪衍生物。化学治疗剂的另外实例包括例如紫杉醇或托泊替康或聚乙二醇化脂质体多柔比星(PLD)。化学治疗剂的其它实例包括烷化剂诸如噻替派和环磷酰胺;烷基磺酸盐,诸如白消安、英丙舒凡和哌泊舒凡;氮丙啶类诸如苯佐替派、卡波醌、美妥替哌和乌瑞替派;乙烯亚胺类和甲基蜜胺类,包括六甲蜜胺、三乙撑蜜胺、三乙撑憐酸胺、三乙撑硫代憐酸胺和三轻甲蜜胺;番蒸枝内酯类(尤其是布拉他辛 (bullatacin)和布拉他辛酮(bullatacinone));喜树碱;苔藓抑素; callystatin;CC_1065(包括其阿多来新、卡折来新和比折来新合成类似物);隐藻素类(cryptophycins)(特别是隐藻素1和隐藻素8);多拉司他汀;多卡米星(包括合成类似物KW-2189和CB1-TM1);艾植塞洛素(eleutherobin);水鬼蕉碱;匍枝珊瑚醇(sarcodictyin);海绵抑制素;氮芥类,诸如苯丁酸氮芥、萘氮芥、胆磷酰胺(cholophosphamide)、雌莫司汀、异环磷酸胺、双氯乙基甲胺(mechlorethamine)、盐酸氧氮芥(mechlorethamine oxide hydrochloride)、美法仑、新恩比兴 (novembichin)、苯芥胆固醇(phenesterine)、泼尼莫司汀、曲磷胺、鸟嘧啶氮芥;亚硝基脲类诸如卡莫司汀、氯脲菌素(chlorozotocin)、福莫司汀、洛莫司汀、尼莫司汀和雷莫司汀;抗生素诸如烯二炔类(enediyne) 抗生素(例如,加利车霉素,尤其是加利车霉素γ1I和加利车霉素ωI1 (参见,例如,Agnew,Chem.Intl.编辑Engl.,33:183-186(1994));达内霉素,包括达内霉素A;二膦酸盐类,诸如氯膦酸盐;埃斯波霉素;以及新制癌素发色团和相关色蛋白烯二炔类抗生素发色团、阿克拉霉素、放线菌素、氨茴霉素、重氮丝氨酸、博来霉素、放线菌素C、卡拉比星)、洋红霉素、嗜癌霉素)、色霉素、更生霉素、柔红霉素、地托比星、6-重氮-5-氧代-L-正亮氨酸、多柔比星(包括吗啉代多柔比星、氰基吗啉代多柔比星、2-吡咯啉多柔比星和脱氧多柔比星)、表柔比星)、依索比星、伊达比星、麻西罗霉素、丝裂霉素类诸如丝裂霉素C、霉酚酸、诺加霉素、橄榄霉素、培洛霉素、泊非霉素、嘌呤霉素)、三铁阿霉素、罗多比星、链黑菌素、链佐星、杀结核菌素、乌苯美司、净司他丁、佐柔比星;抗代谢物类,诸如甲氨蝶呤和5-氟尿嘧啶(5-FU);叶酸类似物,诸如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙;嘌呤类似物,诸如氟达拉滨、6-疏基嘌呤、硫咪嘌呤、硫鸟嘌呤;嘧啶类似物,诸如安西他滨、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、双脱氧尿苷、去氧氟尿苷、依诺他滨)和氟尿苷;雄激素类,诸如卡鲁睾酮、丙酸屈他雄酮、环硫雄醇(epitiostanol)、美雄烷、睾内酯;抗肾上腺类,诸如氨鲁米特、米托坦、曲洛司坦;叶酸补充剂,诸如亚叶酸;醋葡醛内酯;醛磷酰胺糖苷;氨基乙酰丙酸;恩尿嘧啶;安吖啶;贝他布昔;比生群;依达曲沙;地磷酰胺;地美可辛;地吖醌;依氟鸟氨酸;依利醋铵;埃博霉素;依托格鲁;硝酸镓;羟基脲;香菇多糖;氯尼达宁;类美登素,诸如美登素和安丝菌素;米托胍腙;米托蒽醌;莫哌达醇;硝嗪;喷司他丁;苯来美特;吡柔比星;洛索蒽醌;足叶草酸;2-乙基酰肼;甲基苄肼;多糖复合物(JHS NaturalProducts,Eugene,Oreg.);雷佐;利索新 (rhizoxin);西佐喃;锗螺胺;替奴佐酸;三亚胺醌;2,2',2”-三氯三乙胺;单端孢霉烯类(尤其是T-2毒素、维拉可瑞A、杆孢菌素A(roridinA)和蛇形菌素(anguidine));乌拉坦(urethan);长春地辛;达卡巴嗪;甘露醇氮芥;二溴甘露醇;二溴卫矛醇;哌泊溴烷;加托因;阿拉伯糖苷(arabinoside)(“Ara-C”);环磷酰胺;噻替哌;紫衫烷类,例如紫杉醇(Bristol-Myers Squibb Oncology,Princeton,N.J.)、不含Cremophor、紫杉醇的白蛋白工程纳米颗粒制剂 (AmericanPharmaceutical Partners,Schaumberg,Ill.)和多西紫杉醇(Rhone-Poulenc Rorer,Antony,France);苯丁酸氮芥;吉西他滨;6-硫鸟嘌呤;巯基嘌呤;甲氨蝶呤;铂类似物,如顺铂、奥沙利铂和卡铂;长春碱;铂;依托泊苷(VP-16);异环磷酰胺;米托蒽醌;长春新碱;长春瑞滨;诺消灵 (novantrone);替尼泊苷;依达曲沙;柔红霉素;氨基蝶呤;希罗达;伊班膦酸盐;伊立替康(Camptosar,CPT-11)(包括伊立替康与5-FU和甲酰四氢叶酸的治疗方案);拓扑异构酶抑制剂RFS 2000;二氟甲基鸟氨酸(DMFO);类维生素A,诸如维甲酸;卡培他滨;考布他丁;甲酰四氢叶酸(LV);奥沙利铂,包括奥沙利铂治疗方案(FOLFOX);拉帕替尼(Tykerb.RTM.);PKC-α、Raf、H-Ras、EGFR的抑制剂(例如,厄洛替尼(Tarceva.RTM.))和降低细胞增殖的VEGF和任何上述药剂的药学上可接受的盐、酸或衍生物。
术语“程序化死亡配体1”和“PD-L1”在本文中是指天然序列 PD-L1多肽、多肽变体和天然序列多肽和多肽变体的片段。本文所述的PD-L1多肽可以是从多种来源分离的(诸如来自人组织类型或来自另一个来源),或通过重组或合成方法制备的PD-L1多肽。
术语“PD-L1轴结合拮抗剂”是指抑制PD-L1轴结合配偶体与其结合配偶体的一种或多种相互作用,以便去除由在PD-1信号传导轴上发信号引起的T细胞功能障碍,结果恢复或增强T细胞功能的分子。如本文中所用,PD-L1轴结合拮抗剂包括PD-L1结合拮抗剂和 PD-1结合拮抗剂以及干扰PD-L1与PD-1之间相互作用的分子(例如, PD-L2-Fc融合物)。
如本文所用,“PD-L1结合拮抗剂”是减少、阻断、抑制、消除或干扰由PD-L1与其结合伴侣中的一种或多种(诸如PD-1和/或B7-1) 的相互作用所产生的信号传导的分子。在一些实施方案中,PD-L1结合拮抗剂是抑制PD-L1与其结合伴侣的结合的分子。在具体方面,PD-L1结合拮抗剂抑制PD-L1与PD-1和/或B7-1的结合。在一些实施方案中,PD-L1结合拮抗剂包括抗PD-L1抗体及其抗原结合片段、免疫粘附素、融合蛋白、寡肽、小分子拮抗剂、多核苷酸拮抗剂以及减少、阻断、抑制、消除或干扰由PD-L1与其结合伴侣中的一种或多种(诸如PD-1和/或B7-1)的相互作用所产生的信号传导的其它分子。在一个实施方案中,PD-1结合拮抗剂减少由或通过T淋巴细胞上表达的细胞表面蛋白介导的和其它细胞通过PD-1或PD-L1介导的信号传导的负信号,使得功能失调性T细胞成为较少功能失调的。在一些实施方案中,PD-L1结合拮抗剂是抗PD-L1抗体。在具体方面,抗PD-L1抗体是YW243.55.S70。在另一个具体方面,抗PD-L1抗体是MDX-1105。在另一个具体方面,抗PD-L1抗体是阿替珠单抗(atezolizumab)(MPDL3280A)。在另一个具体方面,抗PD-L1抗体是 MEDI4736(阿替珠单抗)。在又一个具体方面,抗PD-L1抗体是 MSB0010718C(阿维单抗(avelumab))。
如本文所用,“PD-1结合拮抗剂”是减少、阻断、抑制、消除或干扰由PD-1与其结合伴侣中(诸如PD-L1和/或PD-L2)的一种或多种的相互作用所产生的信号传导的分子。在一些实施方案中,PD-1结合拮抗剂是抑制PD-1与其结合伴侣的结合的分子。在具体方面,PD-1结合拮抗剂抑制PD-1与PD-L1和/或PD-L2的结合。例如,PD-L1 结合拮抗剂包括抗PD-L1抗体及其抗原结合片段、免疫粘附素、融合蛋白、寡肽、小分子拮抗剂、多核苷酸拮抗剂以及减少、阻断、抑制、消除或干扰由PD-1与PD-L1和/或PD-L2的相互作用所产生的信号传导的其它分子。在一个实施方案中,PD-1结合拮抗剂减少由或通过T淋巴细胞上表达的细胞表面蛋白介导的和其它细胞通过 PD-1或PD-L1介导的信号传导的负信号,使得功能失调性T细胞成为较少功能失调的。在一些实施方案中,PD-1结合拮抗剂为抗PD-1 抗体。在具体方面,PD-1结合拮抗剂为MDX-1106(纳武单抗)。在另一个具体方面,PD-1结合拮抗剂为MK-3475(派姆单抗)。在另一个具体方面,PD-1结合拮抗剂为CT-011(皮地利珠单抗)。在另一个具体方面,PD-1结合拮抗剂为MEDI-0680(AMP-514)。在另一个具体方面,PD-1结合拮抗剂为PDR001。在另一个具体方面,PD-1结合拮抗剂为本文所述的REGN2810。在另一个具体方面,PD-1结合拮抗剂为本文所述的BGB-108。在另一个具体方面,PD-1结合拮抗剂为AMP-224。
术语“血管内皮生长因子”或“VEGF”是指血管内皮生长因子。术语“VEGF”包括其同源物和同种型。术语“VEGF”还包括VEGF的已知同种型,例如剪接同种型,例如VEGF111、VEGF121、VEGF145、VEGF165、 VEGF189、和VEGF206,以及其天然存在的等位基因和加工的形式,包括通过VEGF165的纤溶酶裂解产生的110个氨基酸的人血管内皮细胞生长因子,如FerraraMol.Biol.Cell.21:687(2010),Leung等, Science,246:1306(1989)和Houck等,Mol.Endocrin.,5:1806(1991)中所述。术语“VEGF”还指来自非人物种诸如小鼠、大鼠或灵长类动物的VEGF。有时,来自特定物种的VEGF由诸如人VEGF的hVEGF、鼠VEGF的mVEGF等术语表示。术语“VEGF”还用于指包含165个氨基酸的人血管内皮细胞生长因子的氨基酸8至109或1至109的多肽的截短形式。可以在本申请中鉴定对VEGF的任何此类形式的提及,例如,通过“VEGF109”、“VEGF(8-109)”、“VEGF(1-109)”或“VEGF165”。“截短的”天然VEGF的氨基酸位置按天然VEGF序列中所示进行编号。例如,截短的天然VEGF中的氨基酸位置17(甲硫氨酸)也是天然VEGF中的位置17(甲硫氨酸)。截短的天然VEGF对KDR 和Flt-1受体具有与天然VEGF相当的结合亲和力。如本文中所用,术语“VEGF变体”是指VEGF多肽,其在天然VEGF序列中包含一个或多个氨基酸突变。任选地,一个或多个氨基酸突变包括氨基酸取代。出于本文所述的VEGF变体的简化名称的目的,注意数字是指沿着推定的天然VEGF的氨基酸序列的氨基酸残基位置(Leung等,同上和 Houck等,同上中提供的)。
如本文中所用,术语“VEGF拮抗剂”是指能够结合VEGF,降低 VEGF表达水平,或中和、阻断、抑制、消除、减少或干扰VEGF生物活性(包括但不限于,VEGF与一种或多种VEGF受体的结合、VEGF 信号传导和VEGF介导的血管生成和内皮细胞存活或增殖)的分子。例如,能够中和、阻断、抑制、消除、减少或干扰VEGF生物活性的分子可通过与一种或多种VEGF受体(VEGFR)(例如VEGFR1、 VEGFR2、VEGFR3、膜结合的VEGF受体(mbVEGFR)或可溶性VEGF 受体(sVEGFR))结合而发挥其作用。可用于本发明方法的VEGF拮抗剂包括特异性结合VEGF的多肽、抗VEGF抗体及其抗原结合片段、受体分子和与VEGF特异性结合,从而隔离其与一种或多种受体的结合的衍生物、融合蛋白(例如,VEGF-Trap(Regeneron))和VEGF121- 白树霉素(Peregrine)。VEGF拮抗剂还包括VEGF多肽的拮抗剂变体、与编码VEGF多肽的核酸分子的至少一个片段互补的反义核碱基寡聚物、与编码VEGF多肽的核酸分子的至少一个片段互补的小RNA、靶向VEGF的核酶、针对VEGF的肽体(peptibody)和VEGF适体。 VEGF拮抗剂还包括结合VEGFR的多肽、抗VEGFR抗体及其抗原结合片段,以及结合VEGFR从而阻断、抑制、消除、减少或干扰 VEGF生物学活性(例如,VEGF信号传导)的衍生物,或融合蛋白。VEGF拮抗剂还包括与VEGF或VEGFR结合并且能够阻断、抑制、消除、减少或干扰VEGF生物活性的非肽小分子。因此,术语“VEGF 活性”特别地包括VEGF介导的VEGF的生物学活性。在某些实施方案中,VEGF拮抗剂使VEGF的表达水平或生物活性降低或抑制至少 10%、20%、30%、40%、50%、60%、70%、80%、90%或更高。在一些实施方案中,VEGF特异性拮抗剂抑制的VEGF是VEGF(8-109)、 VEGF(1-109)或VEGF165
如本文中所用,VEGF拮抗剂可包括但不限于抗VEGFR2抗体和相关分子(例如,雷莫芦单抗、tanibirumab、阿普西柏)、抗VEGFR1 抗体和相关分子(例如,依库单抗(icrucumab)、阿柏西普(VEGF Trap-Eye;)和ziv-阿柏西普(VEGF Trap;)、双特异性VEGF抗体(例如,MP-0250、vanucizumab(VEGF-ANG2)和 US 2001/0236388中公开的双特异性抗体)、双特异性抗体,包括以下抗体中的两种的组合:抗VEGF、抗VEGFR1和抗VEGFR2臂、抗 VEGF抗体(例如贝伐单抗、赛伐珠单抗和雷珠单抗),和非肽小分子 VEGF拮抗剂(例如,帕唑帕尼、阿西替尼、凡德他尼、瑞戈非尼 (stivarga)、卡赞替尼(cabozantinib)、乐伐替尼、尼达尼布(nintedanib)、 orantinib、拉帕替尼(telatinib)、多韦替尼(dovitinig)、西地尼布 (cediranib)、莫替沙尼(motesanib)、索凡替尼(sulfatinib)、阿帕替尼 (apatinib)、福替尼(foretinib)、法米替尼(famitinib)和替沃扎尼 (tivozanib))。
术语“抗VEGF抗体”、“与VEGF结合的抗体”和“特异性结合 VEGF的抗体”是指这样的抗体,其能够以足够的亲和力结合VEGF,使得该抗体可用作靶向VEGF的诊断和/或治疗剂。在一个实施方案中,如例如通过放射免疫测定法(RIA)所测量的,抗VEGF抗体与不相关的非VEGF蛋白的结合程度低于约10%的抗体与VEGF结合。在某些实施方案中,与VEGF结合的抗体具有≤1μM、≤100nM、≤10 nM、≤1nM、≤0.1nM、≤0.01nM或≤0.001nM(例如,10-8M或更小,例如,10-8M至10-13M,例如10-9M至10-13M)的解离常数(Kd)。在某些实施方案中,抗VEGF抗体与VEGF的表位结合,所述表位在不同物种的VEGF之间是保守的。
在某些实施方案中,抗VEGF抗体可用作靶向和干扰其中涉及 VEGF活性的疾病或病症的治疗剂。此外,可将抗体进行其它生物活性测定,例如,以评估其作为治疗剂的有效性。此类测定是本领域已知的,并且取决于靶抗原和抗体的预期用途。实例包括HUVEC抑制测定;肿瘤细胞生长抑制测定(例如,如WO 89/06692中所述的);抗体依赖性细胞毒性(ADCC)和补体介导的细胞毒性(CDC)测定(美国专利第5,500,362号);和激动活性或造血作用分析(参见WO 95/27062)。抗VEGF抗体通常不与其它VEGF同源物诸如VEGF-B或VEGF-C 结合,也不与其它生长因子诸如PIGF、PDGF或bFGF结合。在一个实施方案中,抗VEGF抗体是单克隆抗体,其与由杂交瘤ATCC HB 10709产生的单克隆抗VEGF抗体A4.6.1结合相同的表位。在另一个实施方案中,抗VEGF抗体是根据Presta等(1997)Cancer Res. 57:4593-4599产生的重组人源化抗VEGF单克隆抗体,包括但不限于称为贝伐单抗(BV;)的抗体。
抗VEGF抗体“雷珠单抗”也称为或者“rhuFab V2”是人源化、亲和力成熟的抗人VEGF Fab片段。雷珠单抗通过标准重组技术方法在大肠杆菌(Escherichiacoli)表达载体和细菌发酵中产生。雷珠单抗不被糖基化,分子量约为48,000道尔顿。参见WO 98/45331 和US 2003/0190317。另外的优选抗体包括G6或B20系列抗体(例如, G6-31、B20-4.1),如PCT申请公开第WO 2005/012359号和第WO 2005/044853号(其各自通过引用整体并入本文)中所述。对于另外的优选抗体,参见美国专利第7,060,269号、第6,582,959号、第6,703,020 号、第6,054,297号;WO98/45332、WO 96/30046;WO94/10202; EP 0666868B1;美国专利申请公开第2006009360号、第20050186208 号、第20030206899号、第20030190317号、第20030203409号和第 20050112126号;和Popkov等,Journal of ImmunologicalMethods 288:149-164(2004)。其它优选抗体包括与人VEGF上的功能性表位结合的抗体,所述功能性表位包含残基F17、M18、D19、Y21、Y25、 Q89、191、K101、E103和C104,或者包含残基F17、Y21、Q22、 Y25、D63、183和Q89。另外的抗VEGF抗体包括PCT申请公开第 WO 2009/155724号中描述的抗VEGF抗体。
术语“共施用的”在本文中用于指施用两种或更多种治疗剂,其中至少部分施用在时间上重叠。因此,共同施用包括在停止施用一种或多种其它药剂后继续施用一种或多种药剂时的给药方案。
如本文中所用,“肿瘤”是指所有赘生性细胞生长和增殖(无论恶性的还是良性的)以及所有癌前和癌性细胞和组织。术语“癌症”、“癌性的”、“细胞增殖性疾病”、“增殖性疾病”和“肿瘤”不是如本文所提及的相互排斥的。
III.方法
A.诊断方法
本文提供了用于诊断受试者中的癌症(例如,肺癌(例如,鳞状 NSCLC或非鳞状NSCLC)或头颈癌(例如,HNSC))的方法。本文还提供了鉴定患有癌症的受试者的方法,所述癌症是NRF2依赖性癌症(例如,肺癌,例如鳞状非小细胞肺癌或非鳞状非小细胞肺癌,或头颈癌))。所述方法中的任何方法可以基于本文提供的生物标志物(例如 NRF2(例如,NRF2mRNA或NRF2蛋白)的剪接变体)的表达水平,或一种或多种NRF2靶基因的增加的表达。所述方法中的任何方法可进一步包括向受试者施用NRF2途径拮抗剂。所述方法中的任何方法可进一步包括向受试者施用有效量的第二治疗剂(例如,一种或多种 (例如,1种、2种、3种或4种或更多种)另外的NRF2途径拮抗剂或一种或多种(例如,1种、2种、3种或4种或更多种)抗癌剂)。
本发明提供了诊断受试者中的癌症的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、 11种、12种、13种、14种、15种、16种、17种、18种、19种、 20种、21种、22种、23种、24种、25种、26种或27种基因)的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL;以及将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者。
本发明还提供了鉴定患有为NRF2依赖性癌症的癌症的受试者的方法,该方法包括测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、 8种、9种、10种、11种、12种、13种、14种、15种、16种、17 种、18种、19种、20种、21种、22种、23种、24种、25种、26 种或27种基因)的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、 FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、 AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、 TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL;将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较;和确定所述受试者的癌症是否是NRF2依赖性癌症,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有NRF2依赖性癌症的受试者。
在任何先前的方法中,测定AKR1B10、AKR1C2、SRXN1、OSGIN1、 FECH、GCLM、TRIM16、KYNU、CABYR、SLC7A11、TRIM16L、 AKR1C4、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN或NQO1中的一种或多种(例如,1种、2种、3种、4种、5种、 6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、 16种、17种、18种、19种、20种和21种)的表达水平。
在任何前述方法中,测定一种或多种(例如,(例如,1种、2种、 3种、4种、5种、6种、7种、8种、9种、10种、11种或12种)新鉴定的NRF2靶基因的表达水平。新鉴定的NRF2靶基因包括 AKR1B10、AKR1C2、ME1、KYNU、CABYR、TRIM16L、AKR1C4、 CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3。
本发明还提供了诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品(例如,肿瘤样品)中的NRF2的mRNA表达水平,所述NRF2包含其外显子2的全部或部分的缺失,其中包含其外显子2 的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症。在一些实施方案中,NRF2还包含其外显子3的全部或部分的缺失。可以基于本领域已知的任何合适的标准(包括但不限于DNA、mRNA、 cDNA、蛋白质片段和/或基因拷贝数)定性或定量地测定基因(例如, NRF2、KEAP1、AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1或FTL)的存在和/或表达水平。
本发明还提供了鉴定受试者中的癌症的方法,该方法包括测定获自受试者的样品中的NRF2的蛋白质表达水平,所述NRF2包含其 Neh2结构域的全部或部分的缺失,其中包含其Neh2结构域的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症。在一些实施方案中,NRF2还包含其Neh4的全部或部分的缺失。
本发明还提供了鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品(例如,肿瘤样品)中的NRF2的mRNA表达水平,所述NRF2包含其外显子2的全部或部分的缺失,其中包含其外显子 2的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症。在一些实施方案中,NRF2还包含其外显子3的全部或部分的缺失。可以基于本领域已知的任何合适的标准(包括但不限于DNA、mRNA、cDNA、蛋白质片段和/或基因拷贝数)定性或定量地测定基因(例如, NRF2、KEAP1、AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1或FTL)的存在和/或表达水平。
本发明还提供了鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的NRF2的蛋白质表达水平,所述NRF2包含其 Neh2结构域的全部或部分的缺失,其中包含其Neh2结构域的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症。在一些实施方案中,NRF2还包含其Neh4结构域的全部或部分的缺失。
可以通过许多方法分析样品中本文所述的各种生物标志物的存在和/或表达水平/量,所述方法中的许多方法是本领域已知的并且是技术人员所理解的,包括但不限于免疫组织化学(“IHC”)、蛋白质印迹分析、免疫沉淀、分子结合测定、ELISA、ELIFA、荧光激活细胞分选(“FACS”)、MassARRAY、蛋白质组学、基于定量血液的分析(例如,血清ELISA)、生化酶活性测定、原位杂交、荧光原位杂交(FISH)、 DNA分析、RNA分析、全基因组测序、大规模平行DNA测序(例如,新一代测序)、聚合酶链反应(PCR),包括定量实时 PCR(qRT-PCR)和其它扩增类型检测方法,诸如,例如,分枝状DNA、 SISBA、TMA等、RNA测序、微阵列分析、基因表达谱分析和/或基因表达系列分析(“SAGE”),以及可通过蛋白质、基因和/或组织阵列分析进行的多种测定中的任何一种。用于评估多种基因和基因产物的状态的典型方案见于例如Ausubel等,编辑,1995,Current Protocols In Molecular Biology,第2单元(RNA印迹)、第4单元(DNA印迹)、第15单元(免疫印迹)和第18单元(PCR分析)。还可使用多重免疫测定,诸如可从Rules Based Medicine或Meso Scale Discovery(“MSD”) 获得的那些多重免疫测定。
在本文所述任何方法的一些实施方案中,可使用下一代测序方法,诸例如Frampton等(Nature Biotechnology.31(11):1023-1033, 2013)(其通过引用整体并入本文)中描述的靶向基因下拉和测序方法对来自临床肿瘤样品的DNA进行测序。可将此种下一代测序方法与本文公开的任何方法一起使用以检测各种突变(例如,插入、缺失、碱基取代、局部基因扩增和/或纯合基因缺失),同时允许使用小样品 (例如,来自小芯针穿刺活检、细针穿刺和/或细胞块)或固定的样品(例如,福尔马林固定和石蜡包埋(FFPE)的样品)。
在任何前述方法中,生物标志物的存在和/或表达水平/量(例如, NRF2、KEAP1、AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1或FTL)通过测定生物标志物的蛋白质表达水平来测量。在某些实施方案中,该方法包括在允许生物标志物结合的条件下使生物样品与特异性结合生物标志物的抗体(例如,抗-NRF2抗体)接触,并检测所述抗体与生物标志物之间是否形成复合物。此类方法可为体外或体内方法。可以使用本领域已知的或本文提供的测量蛋白质表达水平的任何方法。例如,在一些实施方案中,使用选自由以下组成的组的方法测定生物标志物的蛋白质表达水平:流式细胞术(例如,荧光激活细胞分选(FACSTM))、蛋白质印迹、酶联免疫吸附测定(ELISA)、免疫沉淀、免疫组织化学(IHC)、免疫荧光、放射免疫测定、斑点印迹、免疫检测方法、HPLC、表面等离子体共振、光光谱学、质谱和HPLC。在一些实施方案中,在肿瘤细胞中测定生物标志物的蛋白质表达水平。
在一些实施方案中,生物标志物的存在和/或表达水平/量(例如, NRF2、KEAP1、AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1或FTL)通过测定生物标志物的mRNA表达水平来测量。在某些实施方案中,使用方法测定基因的存在和/或表达水平/量,所述方法包括:(a)对样品(诸如受试者癌症样品)进行基因表达谱分析、PCR(例如RT-PCR)、RNA测序、微阵列分析、SAGE、MassARRAY技术或FISH;b)测定样品中生物标志物的存在和/或表达水平/量。在一个实施方案中,PCR方法是 qRT-PCR。在一个实施方案中,PCR方法是多重-PCR。在一些实施方案中,通过微阵列测量基因表达。在一些实施方案中,通过qRT-PCR 测量基因表达。在一些实施方案中,通过多重-PCR测量表达。
用于评估细胞中mRNA的方法是众所周知的,包括例如使用互补DNA探针的杂交测定(诸如使用对一种或多种基因特异的标记的核糖核酸探针进行的原位杂交、RNA印迹和相关技术)和各种核酸扩增测定(诸如使用对一种或多种基因特异的互补引物的RT-PCR,和其它扩增类型检测方法,诸如,例如支链DNA、SISBA、TMA等)。可以使用RNA、斑点印迹或PCR分析方便地测定来自哺乳动物的样品的mRNA。另外,此类方法可包括一个或多个步骤,其允许测定生物样品中靶mRNA的水平(例如,通过同时检查“管家”基因(诸如肌动蛋白家族成员)的比较对照mRNA序列的水平)。
在任何方法的一些实施方案中,生物标志物是NRF2(例如,外显子2缺失的NRF2或外显子2+3缺失的NRF2)。在一个实施方案中,使用方法测定生物标志物的表达水平,所述方法包括对样品(例如从患者获得的肿瘤样品)进行WGS分析并测定样品中生物标志物的表达水平。在一些实施方案中,相对于参照测定外显子2缺失的NRF2 或外显子2+3缺失的NRF2的存在。在一些实施方案中,所述参照为参照值。在一些实施方案中,所述参照是参照样品(例如,对照细胞系样品、来自非癌症患者的组织样品或野生型NRF2组织样品)。
除了mRNA表达分析以外或作为另外一种选择,可以根据上述方法定量其它生物标志物,诸如蛋白质表达。例如,本发明的方法包括测试样品的基因组生物标志物(例如,外显子2缺失的NRF2或外显子2+3缺失的NRF2的存在,或一种或多种NRF2靶基因(AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、 CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、 AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、 PGD、TXN、NQO1或FTL)的上调,并且另外测试样品的蛋白质生物标志物(例如,AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、 GSR、AKR1C3、TALDO1、PGD、TXN、NQO1或FTL中的一种或多种蛋白质的蛋白质转录物)。
在任何方法的一些实施方案中,DNA序列可以用作生物标志物。可以根据本领域已知的任何方法定(包括但不限于PCR、外显子组测定(例如,全外显子组测序)、DNA微阵列分析、或全基因组测序)量DNA。
在一些情况下,样品中基因的表达水平是基因的平均值(例如,平均表达或中位表达),所述基因的参照考表达水平是所述参照的所述基因的平均值(例如,平均表达或中位表达),并且将样品的所述基因的平均值与所述参照的所述基因的平均值进行比较。
在某些实施方案中,与第二样品中的存在/不存在和/或表达水平/ 量相比,第一样品中生物标志物的存在和/或表达水平/量得以增加或升高。在某些实施方案中,与第二样品中的存在和/或表达水平/量相比,第一样品中生物标志物的存在/不存在和/或表达水平/量得以减少或降低。在某些实施方案中,第二样品是参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织。本文中描述了用于确定基因的存在/不存在和/或表达水平/量的其它公开内容。
在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自同一受试者或个体的单个样品或组合的多个样品,在与获得测试样品的时间不同的一个或多个时间点获得所述样品。在某些实施方案中,在比获得测试样品的时间更早的时间,从同一受试者或个体获得参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织。如果在癌症的初始诊断期间获得参照样品并且随后在癌症变为转移时获得测试样品,则此类参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织可以是有用的。
在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个非患者的健康个体的组合的多个样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个不为所述受试者或个体的患有疾病或病症(例如,癌症)的个体的组合的多个样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个非患者的个体的正常组织或合并的血浆或血清样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个不为所述患者的患有疾病或病症(例如,癌症)的个体的肿瘤组织或合并和血浆或血清样品。
在任何方法的一些实施方案中,升高或增加的表达是指通过本领域已知的标准方法(诸如本文所述的那些方法)检测的相较于参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织的生物标志物(例如,蛋白质或核酸(例如,基因(DNA或mRNA)))水平的约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、 97%、98%、99%或更多中的任一百分比的总体增加。在某些实施方案中,升高的表达是指样品中生物标志物的表达水平/量的增加,其中所述增加为参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织中的相应生物标志物的表达水平/量的至少约1.5倍、1.75 倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、 50倍、75倍或100倍中的任何倍数。在一些实施方案中,升高的表达是指与参照样品、参照细胞、参照组织、对照样品、对照细胞、对照组织或内部对照(例如,管家基因)相比的大于约1.5倍、约1.75倍、约2倍、约2.25倍、约2.5倍、约2.75倍、约3.0倍或约3.25倍的总体增加。
在任何方法的一些实施方案中,降低的表达是指通过本领域已知的标准方法(诸如本文所述的那些方法)检测的相较于参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织的生物标志物(例如,蛋白质或核酸(例如,基因(DNA或mRNA)))水平的约10%、20%、 30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、 99%或更多中的任一百分比的总体下降。在某些实施方案中,降低的表达是指样品中生物标志物的表达水平/量的减少,其中所述减少为参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织中的相应生物标志物的表达水平/量的至少约0.9倍、0.8倍、0.7倍、0.6 倍、0.5倍、0.4倍、0.3倍、0.2倍、0.1倍、0.05倍或0.01倍中的任何倍数。
B.治疗方法
本发明提供了用于治疗患有(例如,肺癌(例如,鳞状NSCLC或非鳞状NSCLC)或头颈癌(例如,HNSC))的患者的方法。在某些情况下,本发明的方法包括向患者施用有效量的NRF2途径拮抗剂。本文所述的或本领域已知的任何NRF2途径拮抗剂均可用于该方法中。在一些情况下,该方法涉及例如,使用本文中、以下实施例中描述的或本领域已知的方法中的任何方法,确定获自患者的样品中NRF2剪接变体(例如,外显子2缺失的NRF2或外显子2+3缺失的NRF2)或NRF2 靶基因的存在和/或表达水平,并基于NRF2剪接变体(例如,外显子 2缺失的NRF2或外显子2+3缺失的NRF2)或NRF2靶基因的存在和 /或表达水平向患者施用NRF2途径拮抗剂。
本发明提供了治疗患有癌症(例如,肺癌(例如,鳞状NSCLC或非鳞状NSCLC)或头颈癌(例如,HNSC))的受试者的方法,该方法包括测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10 种、11种、12种、13种、14种、15种、16种、17种、18种、19 种、20种、21种、22种、23种、24种、25种、26种或27种基因) 的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、 TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、 CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL;以及将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者,以及向所述受试者施用治疗有效量的一种或多种NRF2途径拮抗剂。
本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状NSCLC 或非鳞状NSCLC)或头颈癌)的受试者的方法,其中测定一种或多种 (例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10 种、11种或12种)新鉴定的NRF2靶基因的表达水平。新鉴定的NRF2 靶基因包括AKR1B10、AKR1C2、ME1、KYNU、CABYR、TRIM16L、 AKR1C4、CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3。
在一些情况下,本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状NSCLC或非鳞状NSCLC)或头颈癌)的受试者的方法,其中获自受试者的样品中的NRF2的mRNA表达水平包含其外显子2的全部或部分的缺失,并且其中包含其外显子2的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症;以及向受试者施用治疗有效量的一种或多种NRF2途径拮抗剂。在一些实施方案中,NRF2还包含其外显子3的全部或部分的缺失。
在一些情况下,本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状NSCLC或非鳞状NSCLC)或头颈癌(例如,HNSC))的受试者的方法,其中获自受试者的样品中的NRF2蛋白包含其Neh2结构域的全部或部分的缺失,并且其中包含其Neh2结构域的全部或部分的缺失的NRF2的存在将受试者鉴定为患有癌症;以及向受试者施用治疗有效量的一种或多种NRF2途径拮抗剂。在一些实施方案中,NRF2 还包含其Neh4结构域的全部或部分的缺失。
在任何前述方法中,NRF2途径拮抗剂可以是本领域已知的或本文描述的任何NRF2途径拮抗剂。
在一些情况下,所述方法还包括向受试者施用有效量的第二治疗剂(例如,一种或多种抗癌剂)。在一些情况下,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂、免疫疗法及其组合。在一些实施方案中,免疫疗法是VEGF拮抗剂(例如,抗VEGFR2抗体和相关分子(例如,雷莫芦单抗、tanibirumab、阿普西柏)、抗VEGFR1抗体和相关分子(例如,依库单抗、阿柏西普(VEGF Trap-Eye;)和ziv-阿柏西普(VEGF Trap;))、双特异性VEGF抗体(例如,MP-0250、vanucizumab(VEGF-ANG2)和 US 2001/0236388中公开的双特异性抗体)、双特异性抗体,包括以下抗体中的两种的组合:抗VEGF、抗VEGFR1和抗VEGFR2臂、抗 VEGF抗体(例如贝伐单抗、赛伐珠单抗和雷珠单抗),和非肽小分子 VEGF拮抗剂(例如,帕唑帕尼、阿西替尼、凡德他尼、瑞戈非尼、卡赞替尼、乐伐替尼,尼达尼布、orantinib、拉帕替尼、多韦替尼、西地尼布、莫替沙尼、索凡替尼、阿帕替尼、福替尼、法米替尼和替沃扎尼))。在其它实施方案中,免疫疗法是PD-1轴结合拮抗剂(例如, YW243.55.S70、MDX-1105、MPDL3280A(阿特珠单抗)、MEDI4736 (度伐单抗(druvalumab))、MSB0010718C(阿维单抗)、MDX-1106(纳武单抗)、MK-3475(派姆单抗)、CT-011(皮地利珠单抗)、MEDI-0680 (AMP-514)、PDR001、REGN2810、BGB-108或AMP-224)。
本文所述方法中使用的组合物(例如,NRF2途径拮抗剂)可以通过任何合适的方法施用,包括例如静脉内、肌内、皮下、皮内、经皮、动脉内、腹膜内、病灶内、颅内、关节内、前列腺内(intraprostatically)、胸膜内、气管内、鞘内、鼻内、阴道内、直肠内、局部、瘤内、腹膜内、结膜下、囊内、粘膜、心包内、脐带内、眼内、眶内、口服、局部、透皮、玻璃体内(例如,通过玻璃体内注射)、通过滴眼、通过吸入、通过注射、通过植入、通过输注、通过连续输注、通过直接局部灌注靶细胞、通过导管、通过灌洗、在乳膏中或在脂质组合物中的途径进行施用。用于本文描述的方法中的组合物还可以全身方式或以局部方式施用。施用方法可以根据各种因素(例如,所施用的化合物或组合物以及所治疗的病状、疾病或病症的严重性)而变化。在一些实施方案中,NRF2途径拮抗剂通过静脉内、肌内、皮下、局部、口服、透皮、腹膜内、眶内、通过植入、通过吸入、鞘内、心室内或鼻内给药。部分地根据施用是短暂的还是长期的,给药可通过任何适合的途径进行,例如通过注射,诸如静脉内或皮下注射。本文设想了各种给药时间表,包括但不限于单次施用或各种时间点内的多次施用、推注施用和脉冲输注。
本文所述的NRF2途径拮抗剂(和任何另外的抗癌剂)可以以符合良好医学实践的方式配制、给药和施用。在此情形下的考虑因素包括所治疗的特定病症、所治疗的特定哺乳动物、各个患者的临床病状、病症的病因、药剂递送部位、施用方法、施用排程和医学从业者已知的其它因素。NRF2途径拮抗剂不必与,但任选地与一种或多种目前用于预防或治疗所述病症的药剂一起配制和/或同时施用。此类其它药剂的有效量取决于制剂中存在的Nrd2途径抑制剂的量、病症或治疗的类型,以及上面讨论的其它因素。这些药剂通常以如本文所述的相同剂量以及用如本文所述的施用途径,或以本文所述的剂量的约 1%至99%,或以凭经验/临床上确定为适当的任何剂量且通过凭经验 /临床上确定为适当的任何途径加以使用。
在一些实施方案中,所述方法还包括向患者施用有效量的第二治疗剂(例如,一种或多种抗癌剂)。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂、免疫疗法及其组合。
上述此类联合疗法包括联合施用(其中两种或更多种治疗剂(例如,NRF2途径拮抗剂和抗癌剂)包括在相同或分开的制剂中)和单独施用,在该情况下,NRF2途径拮抗剂的施用可以在施用所述另外的抗癌剂之前、同时和/或之后发生。在一个实施方案中,NRF2途径拮抗剂的施用和另外的抗癌剂的施用在彼此的约一个月内,或在约1 周、2周或3周内,或在约1天、2天、3天、4天、5天或6天内发生。
C.用于本发明方法的NRF2途径拮抗剂
本文提供了用于治疗或延迟受试者中癌症(例如,肺癌(例如,鳞状NSCLC)或头颈癌)的进展的方法,其包括向受试者施用治疗有效量的NRF2途径拮抗剂。任何前述方法可以基于本文提供肿瘤样品(例如含有肿瘤细胞的活检物)的生物标志物的表达水平,例如,NRF2表达或NRF2途径中涉及的任何蛋白质或mRNA的表达。
在一些实施方案中,NRF2途径拮抗剂是小分子,例如能够结合 NRF2的小分子或调节NRF2的表达、稳定性或活性的蛋白质或基因。
在一些实施方案中,NRF2途径拮抗剂为NRF2激动剂的拮抗剂。 NRF2激动剂的实例包括但不限于cAMP应答元件结合蛋白(CREB)、 CREB结合蛋白(CBP)、Maf、激活转录因子4(ATF4)、蛋白激酶C (PKC)、Jun、糖皮质激素受体、UbcM2,以及含有E6-AP羧基末端结构域和锚定蛋白重复序列的E3遍在蛋白蛋白连接酶1的同源物 (HACE1)。因此,NRF2途径拮抗剂的实例包括但不限于CREB拮抗剂、CBP拮抗剂、Maf拮抗剂、ATF4拮抗剂、PKC拮抗剂、Jun拮抗剂、糖皮质激素受体拮抗剂、UbcM2拮抗剂和HACE1拮抗剂,诸如表2中所列的那些。
在一些实施方案中,NRF2途径拮抗剂为NRF2拮抗剂的激动剂。 NRF2拮抗剂的实例包括但不限于c-Myc、SUMO、KEAP1、CUL3、视黄酸受体α(RARα)。因此,NRF2途径拮抗剂的实例包括但不限于c-Myc激动剂、SUMO、KEAP1激动剂、CUL3激动剂和RARα激动剂,诸如表3中列出的那些。
表2.
表3.
在本发明的一些实施方案中,表2或3中列出的化合物的衍生物也可以作为NRF2途径拮抗剂施用。表2或3中列出的化合物的衍生物是结构与母体化合物不同的小分子,但保留了拮抗NRF2途径的能力。化合物的衍生物可以相对于母体化合物改变其与某些其它分子或蛋白质的相互作用。化合物的衍生物还可包括母体化合物的盐、加合物或其它变体。在本发明的一些实施方案中,可以使用本文所述化合物(例如,表2或3中列出的化合物的任何一种化合物)的任何衍生物代替母体化合物。在一些实施方案中,表2或3中列出的化合物的任何衍生物可用于治疗患有癌症(诸如肺癌)的受试者的方法中。
在一些实施方案中,NRF2途径拮抗剂是抗体(例如,抗-NRF2抗体或针对调节NRF2表达、稳定性或活性的蛋白质或基因(例如表2 或3中列出的靶标)的抗体)。在一些实施方案中,抗-NRF2抗体能够抑制NRF2与抗氧化应答元件之间的结合。在一些实施方案中,抗 -NRF2抗体能够抑制NRF2与辅助因子(例如,Maf、PKC、Jun、ATF4 或CBP)之间的结合。在一些实施方案中,本发明的抗体是选自由以下组成的组的抗体片段:Fab、Fab’-SH、Fv、scFv和(Fab’)2片段。在一些实施方案中,所述抗体是人源化抗体。在一些实施方案中,抗体是人抗体。在一些实施方案中,抗体是具有任何上述特性的已知抗体的衍生物。抗体的衍生物包括与其亲本具有约99%、98%、97%、96%、 95%、94%、93%、92%、91%、90%、85%、80%或更低序列同一性的抗体变体。百分比(%)氨基酸序列同一性根据本领域已知的方法测定,包括通过如上所述的ALIGN-2来测定。
在一些实施方案中,NRF2途径拮抗剂包括任何下游生物标志物的抑制剂(例如,基因或蛋白质,例如参与铁螯合(例如,铁蛋白、轻多肽(FTL)、铁蛋白、重多肽1(FTH)或血红素加氧酶1(HMOX1))、 GSH利用(例如,谷胱甘肽过氧化物酶2(GPX2)、谷胱甘肽S-转移酶α1(GSTA1)、谷胱甘肽S-转移酶α2(GSTA2)、谷胱甘肽S-转移酶α3 (GSTA3)、谷胱甘肽S-转移酶α5(GSTA5)、谷胱甘肽S-转移酶Mu1 (GSTM1)、谷胱甘肽S-转移酶Mu2(GSTM2)、谷胱甘肽S-转移酶 Mu3(GSTM3)或谷胱甘肽S-转移酶Pi 1(GSTP1))、奎宁解毒(例如, NAD(P)H脱氢酶、醌1(NQO1))、GSH产生和再生(例如,谷氨酸- 半胱氨酸连接酶修饰亚基(GCLM)、谷氨酸-半胱氨酸连接酶催化亚基 (GCLC)、谷胱甘肽还原酶(GSR)或溶质载体家族7(阴离子氨基酸转运蛋白轻链,Xc-系统)、成员11(SLC7A11或XCT))、硫氧还蛋白(TXN) 的产生、再生和利用(例如,硫氧还蛋白1(TXN1)、硫氧还蛋白还原酶1(TXNRD1)或过氧化物酶(Peroxiredoxin)1(PRDX1))、NADPH产生(例如,葡萄糖-6-磷酸脱氢酶(G6PD)、磷酸葡萄糖酸脱氢酶(PGD)、细胞溶质中的NADP(+)-依赖性、苹果酸酶(ME1)、可溶性的异柠檬酸脱氢酶1(NADP+)(IDH1))的基因或蛋白质,或表1的基因或其蛋白质中的任一种)。
在一些实施方案中,NRF2途径拮抗剂包括抑制(例如,通过竞争性结合NRF2上的ARE结合位点,通过竞争性结合ARE,或通过其它方式干扰转录辅因子(例如,小的Maf蛋白))NRF2与抗氧化应答元件(ARE)结合的化合物。
在一些实施方案中,NRF2途径拮抗剂包括NRF2相关基因的激动剂或拮抗剂,使得化合物的药理学作用涉及NRF2介导的转录下游的一个或多个途径的下调。此类NRF2相关基因包括例如Kelch样ECH相关蛋白1(KEAP1)、外胚层神经皮质1(具有BTB结构域)(ENC1)、蛋白激酶C、δ(PRKCD)、蛋白激酶C、β(PRKCB)、多胺调节因子1(PMF1)、Cullin 3(CUL3)、核因子、红细胞2(NFE2)、激活转录因子4(ATF4)、血红素加氧酶1(HMOX1)、血红素加氧酶2(HMOX2)、遍在蛋白C(UBC)、V-Maf禽肌肉腱膜纤维肉瘤癌基因同源物K(MAFK)、UDP葡糖醛酸基转移酶1家族、多肽A6(UGT1A6)、 V-Maf禽肌肉腱膜纤维肉瘤癌基因同源物F(MAFF)、CREB结合蛋白(CREBBP)、V-Maf禽肌肉腱膜纤维肉瘤癌基因同源物G(MAFG)、 CAMP响应元件结合蛋白1(CREB1)、含FXYD结构域的离子转运调节因子2(FXYD2)、Jun原癌基因(JUN)、小遍在蛋白样修饰剂 2(SUMO2)、小遍在蛋白样修饰因子1(SUMO1)、V-Myc禽骨髓细胞瘤病病毒癌基因同源物(MYC)、晶体蛋白(Crystallin)、ζ(醌还原酶)(CRYZ)、醛-酮还原酶家族7、成员A2(黄曲霉毒素醛还原酶)(AKR7A2)和谷胱甘肽S-转移酶α2(GSTA2)。
在一些实施方案中,提供了增加细胞中NRF2泛素化的方法,该方法包括在允许抑制细胞中的NRF2途径的条件下使细胞与NRF2途径的抑制剂接触。可以例如按照已知方法,通过在胰蛋白酶消化后免疫亲和富集泛素化的NRF2,然后进行质谱分析来测定增加的NRF2泛素化。在一些实施方案中,遍在蛋白的增加可以通过将与NRF2途径拮抗剂接触的细胞或细胞群中的野生型NRF2的泛素化与与NRF2 途径拮抗剂接触的细胞或细胞群体中的缺失外显子2或外显子2+3 的NRF2的泛素化和/或未与NRF2途径拮抗剂接触的细胞或细胞群体中的缺失外显子2或外显子2+3的NRF2的泛素化进行比较来测定。
在本发明的一些实施方案中,NRF2途径拮抗剂是抗坏血酸、鸦胆子苦醇、木犀草素或赭曲霉毒素A。
实施例
实施例1:材料和实验方法
A.突变和拷贝数分析
对于99个NSCLC细胞系,KRas、LKB1、KEAP1和NRF2的非同义突变和拷贝数数据获自Klijn等(Nat Biotechnol.33(3):306-312,2015)。对另外13个NSCLC细胞系进行拷贝数分析。另外,将外显子组测序应用于104个NSCLC细胞系。对于癌症基因组图谱 (TCGA),使用R软件包CGDS-R(Cerami等Cancer Discovery. 2:401-404,2012;Gao等Sci.Signal.6:11,2013)从cBioPortal检索肿瘤突变和拷贝数数据。
B.突变型KEAP1基因表达标签的RNA测序分析和推导
从European Genome-phenome Archive(登录号 EGAS00001000610)(PMID:25485619)检索99个NSCLC细胞系的原始RNA测序数据。表4中提供了每种NSCLC细胞系中KEAP1和 NRF2的突变。使用GSNAP 2013-10-10版(Wu和Nacu. Bioinformatics 26:873-881,2010)从TCGA下载原始RNA测序数据并将其与人参照基因组(GRCh37/hgI9)进行比对,允许最多2个错配(参数:“-M 2-n 10-B 2-i 1-N 1-w 200000-E 1-- pairmax-rna=200000”)。用源自作图至每个RefSeq基因的读段的数目的RPKM(每千碱基靶标的读段,并且百万读段已进行了测序)值定量基因表达水平。使用DESeq R包(PMID:20979621)测量KEAP1突变型与KEAP1野生型细胞系之间的差异基因表达,报告为倍数变化和相关的调整的p值。对于样品和基因在方差上的沃德聚类(使用 Euclidean距离),使用稳定的计数数据。'NMF’R包用于生成相关的热图。
表4.
C.剪接变体分析
使用可从Bioconductor项目网站获得的SGSeq软件包(Gentleman 等GenomeBiol.5:R80,2004)进行剪接变体的分析。使用参数α=2、 psi=0、β=0.2、γ=0.2,从已知癌基因的54个基因组基因座的7,384个 TCGA样品的BAM文件预测外显子和剪接点。将预测的特征在样品之间合并,并且外显子被处理成不相交的外显子箱(exon bin)。将剪接点和外显子箱组装成全基因组剪接图。从图中识别出由两个或更多个可变剪接变体组成的剪接事件。根据FPKM和相对使用率(relative usage)Ψ定量剪接变体。简言之,获得变体在开始和结束时的相对使用率的局部估计值作为与变体相容的片段的分数。使用加权平均值组合事件开始和结束时的估计值,其中权重与跨越边界的片段总数成比例。将分母小于20的相对使用率估计值设为NA。为了获得变体在开始和结束时的绝对表达的局部估计值,将相容计数n转换为FPKM (为n I(N x L)x 109),其中N是对齐的片段的总数并且L是有效长度(相容片段的允许位置数)。也在来自正常人组织的2,958个基因型-组织表达项目(GTEx)样品中定量在TCGA样品中检测到的剪接变体 (Consortium.Science.348:648-660,2015)。
D.癌症特异性剪接变体的鉴定
仅考虑内部剪接变体(不涉及可变转录物的开始或结束),并且需要每个剪接变体的开始和结束重叠或延伸属于从UCSC基因组浏览器网站(Pruitt等Nucleic AcidsRes.33:D501-504,2005;Rosenbloom等 Nucleic Acids Res.43:D670-681,2015)下载的注释ref基因转录物的外显子。保留的内含子被排除在外。考虑包括至少100个癌症样品(总共6,359个癌症样品)的19个TCGA适应症,并且选择(i)在至少一个癌症样品中FPKM>2且相对使用率Ψ>0.2以及(ii)在>99.9%的GTEx 样品中FPKM<1和(iii)在>97.5%的GTE x样品中FPKM~0的剪接变体。需要在剪接变体的开始和结束时满足基于FPKM的标准。在人工检查后,包括对于其无法估计Ψ的满足基于FPKM的标准的变体。
E.靶向配对末端外显子组测序数据的分析
如前所述(Frampton等Nat.Biotechnol.31,1023-1031,2014),类似地对FoundationCORE中的所有样品进行处理和测序。在使用两种截然不同的方法在整个FoundationCORE数据集(n=58,707)中筛选 NRF2外显子2和外显子2+3缺失。
首先,检查基于不一致读段对和/或拆分读段的重排识别,以寻找NRF2外显子2或外显子2+3丢失的直接证据。虽然这种方法提供了目标缺失的直接证据,但如果断点位于诱饵区域内,则只能通过这种方法发现缺失,因为未捕获NRF2的内含子区域。因此,该方法鉴定了NRF2外显子2或外显子2+3缺失的有限子集,其中断点发生在内含子-外显子边界附近或外显子内。
第二方法利用来自各个诱饵区域的拷贝数对数比数据。使用针对每个样品的特定肿瘤细胞性进行训练的内部算法测定拷贝数对数比值。计算z评分,比较NRF2中与紧邻NRF2的对照多态性捕获区域 (n=15;从NRF2的上游~3MB和下游~12MB每隔~1MB均匀地间隔)中的每个外显子的对数比。特别地检查具有和不具有同时发生的外显子3缺失的外显子2缺失。这些在本文中称为目标外显子(EOI)。如果(1)在NRF2中,对EOI,z评分<-2,但对于非EOI,z评分不小于 -2并且(2)计算NRF2中非EOI的对数比下降0.2,则识别EOI缺失。 NRF2外显子2或外显子2+3缺失与NRF2或KEAP1中的短变体之间的相互排斥性在肺鳞状细胞癌中被特异性地检查到(n=1,218)。
F.细胞培养
KMS-27(RPMI-1640)、JHH-6(Williams培养基E)、HuCCT1 (RPMI-1640)和HUH-1(DMEM)细胞来自JCRB,并且293(EMEM) 细胞来自ATCC。在2mM谷氨酰胺和10%FBS存在的情况下,在指定的培养基中培养细胞。
G.蛋白质印迹
用补充有完全无EDTA蛋白酶抑制剂(Roche)和phoSTOP (Roche)、磷酸酶抑制剂混合物2(Sigma)和磷酸酶抑制剂混合物3 (Sigma)磷酸酶抑制剂的RIPA缓冲液(Sigma)制备细胞裂解物。将裂解物在Novex Tris-甘氨酸4-12%梯度凝胶(ThermoFisher)上运行并转移到iBlot硝酸纤维素(Invitrogen)上。将印迹在TBST(10mM Tris pH8,150mM NaCl,0.1%TWEEN-20)中的5%脱脂奶粉(Merck)中预孵育,然后在含有抗体的TBST中的5%牛血清白蛋白(Sigma)中孵育。使用的二抗是ECL抗兔HRP和ECL抗小鼠HRP(均来自GE Heathcare)。用化学发光底物试剂盒(Protein Simple)使印迹显色,并用 FluorChem HD2成像仪(ProteinSimple)进行显现。本研究中使用的抗体针对KEAP1(Cell Signaling G1010)、NRF2(Abcamab62352)、HSP90 (Cell Signaling 4877)、HDAC2(Cell Signaling 5113)、β-肌动蛋白(Sigma A2228)、HA(Roche 11815016001)和FLAG(Sigma F2426)。λ磷酸酶来自NEB(P0753L),并且在这些实验中从裂解缓冲液中省略了磷酸酶抑制剂。
H.细胞活力和DNA片段化分析
用Dharmafect 2试剂(ThermoFisher)和OptiMEM(Gibco)将siRNA 逆转染到细胞中。转染后4天,使用CellTiter-Glo试剂(Promega)测量细胞的活力,并在EnVision多标签读数器(Perkin Elmer)上检测发光。用Dharmafect 2试剂(ThermoFisher)和OptiMEM(Gibco)将siRNA 逆转染到细胞中。转染后4天,使用碘化丙啶(PI)(Life Technologies)染色和流式细胞术,按照公布的方案(Riccardi和Nicoletti Nat.Protoc. 1:1458-1461,2006)测量细胞的凋亡。在染色前24小时将星形孢菌素 (1μM)(Enzo)加入阳性对照细胞中。靶向NRF2外显子2的siRNA具有序列:5’-TGGAGTAAGTCGAGAAGTA-3’(SEQ ID NO:29)和 5’-ACAACTAGATGAAGAGACA-3’(SEQ ID NO:30)。靶向NRF2外显子5的siRNA具有序列:5’-TGACAGAAGTTGACAATTA-3’(SEQ ID NO:31)和5’-GTAAGAAGCCAGATGTTAA-3’(SEQ ID NO:32),并将其与非靶siRNA一起使用作为对照siRNA。用Becton Dickinson FACS Caliber仪器分析染色的细胞。靶向KEAP1的siRNA来自 Dhamacon(L012453-00)。
根据Riccardi等(Nature Protocols,1:1458-1461(2006)),通过碘化丙啶(PI)染色定量DNA片段化并通过流式细胞术测量。
I.Taqman分析
用RNeasy试剂盒(Qiagen)提取总细胞RNA。使用高容量cDNA 反转录试剂盒(Applied Biosystems)将RNA转化为cDNA,并使用 Taqman基因表达预混合试剂(AppliedBiosystems)用Taqman基因表达引物-探针组(ThermoFisher)扩增cDNA。在QuantStudio7Flex实时 PCR系统上进行Taqman扩增/检测。使用的引物-探针组是Hs00232352_ml和Hs00975961_g1以分别检测NRF2外显子2和5 (ThermoFisher)。使用的NRF2靶基因Taqman引物-探针组是: SLC7A11(Hs00921938_ml)、SGRN(Hs00921938_ml)、NR0B1 (Hs03043658_ml)、GCLC(HsOOI55249_ml)和GPX2 (Hs01591589_ml),均来自ThermoFisher。
J.293转染。
按照制造商的方案推荐,使用Lipofectamine 2000(ThermoFisher) 和OptiMEM(Gibco)将质粒DNA转染到细胞中。转染后2-3天制备裂解物。使用的表达质粒是pRK5.NRF2、pRK5.NRF2.delta.e2、 pRK5.NRF2.delta.e2,3、pRK5.NRF2.FLAG和pRK5.KEAP1.HA。
K.肿瘤异种移植模型
将11至12周龄雌性C.B-17SCID.米色小鼠(Charles River Laboratories)在右侧腹侧皮下接种每小鼠10x106个A549shRNA细胞 (于100μl(BDBiosciences)中)或10x106个H441 shRNA细胞(于100μl HBSS中)。当肿瘤体积达到约150-250mm3时,使小鼠随机接受含有1mg/ml多西环素(于5%蔗糖中)或不含多西环素(仅5%蔗糖)的饮用水,随意获得饮用水。多西环素每周更换3次,并且每周更换一次蔗糖。使用数字卡尺(Fred V.Fowler Company, Inc.),使用公式(L x W x W)/2测定肿瘤体积,并将其绘制为平均肿瘤体积(mm3)+/-SEM。将肿瘤生长抑制(TGI%)计算为每日相应剂量组相对媒介物的拟合曲线下面积(AUC)的百分比,使得TGI%=100×1- (AUC治疗/天)/(AUC媒介物/天)。在分开的研究中,向具有150-250 mm3的肿瘤的小鼠施用1mg/ml多西环素,进行5天,然后切取肿瘤,并通过蛋白质印迹分析其NRF2水平。
L.用ErbB3抗体处理的A549异种移植物
在第1天通过静脉内施用,用媒介物或50mg/kg YW57.88.5(100 mg/kg负荷剂量)处理携带皮下A549肿瘤(75–144mm3)的雌性裸鼠(n =10),每周一次,持续4周(qwk x 4)。每周测量肿瘤两次,并且在其肿瘤达到1000mm3的体积的早期终点或在治疗方案的最后一天对每只动物实施安乐死。
实施例2:在KEAP1和NRF2中具有突变的NSCLC细胞系的鉴定
为了鉴定NSCLC中KEAP1和NRF2的突变、拷贝数和杂合性丢失(LOH),记录了通过RNA测序、外显子组测序或SNP阵列分析的113个NSCLC细胞系小组(图1A)。在29/113(26%)的细胞系中发现KEAP1突变,并且在4/113(4%)的细胞系中检测到NRF2突变。除NCI-H661细胞系外,所有KEAP1突变的细胞系均显示突变等位基因的纯合表达,其通常与拷贝中性LOH相关。相反,NRF2突变是杂合的并且与LOH无关。另外两种细胞系(HCC1534和NCI-HI437) 通过KEAP1DNA的双等位基因丢失显示没有可检测的KEAP1 mRNA。NRF2突变位于KEAP1界面区域中的先前鉴定的热点中(图 1B)(Shibata等Proc.Natl.Acad.Sci.U.S.A.105:13568-13573,2008),并且包括点突变和框内3-氨基酸缺失。KEAP1中的突变遍布整个一级序列(图1C),几乎没有明显的热点。然而,当作图至KEAP1/NRF2 肽晶体结构上时(Fukutomi等Mol.Cell.Biol.34:832-846,2014),环中的突变聚簇从KEAP1核心β螺旋推进区域延伸靠近与NRF2相互作用的位点(图1D)。
实施例3:突变型KEAP1基因标签的鉴定
为了确定KEAP1突变在NSCLC细胞系中的转录后果,鉴定了与野生型KEAP1细胞系相比在KEAP1突变型细胞系中显著地差异表达的基因(p<0.01,绝对平均倍数变化>2)。总体而言,KEAP1突变型细胞系中有27个基因被显著上调(图2A-2B),其中15个先前已被鉴定为来自ChIP-测序或RNA测序研究的NRF2靶基因(Chorley等 Nucleic Acids Res.4:7416-7429,2012;Hirotsu等Nucleic Acids Res. 40:10228-10239,2012;Malhotra等NucleicAcids Res.38:5718-5734, 2010)。通过使用这些截断值,只有一种基因HSPB1被鉴定为被显著下调。
基于这27个基因的表达的230个TCGA肺腺癌的无监督聚类导致分成两个主要的组(图3A)。一个组的主要特征是27个标签基因的高表达,并包含43个肿瘤,其中32个(74%)是KEAP1突变体。另一组以低表达为特征,包含187个肿瘤,其中179个为KEAP1野生型。令人惊讶的是,通过使用相同的基因组来对肺鳞状细胞癌进行聚类, NRF2以及KEAP1突变型肿瘤可与NRF2/KEAP1野生型肿瘤区别开来(图3B),表明NRF2介导了大部分KEAP1丢失/突变的转录后果。有趣的是,有几个鳞状NSCLC肿瘤显示KEAP1突变型基因的高表达,而在KEAP1或NRF2中没有任何已知的突变。在KEAP1突变型细胞系中上调的27个基因当中,蛋白质组学数据可用于较小的细胞系亚组(37个野生型KEAP1,6个突变型KEAP1)中的17个细胞系。与突变型KEAP1细胞系中这些基因的mRNA水平升高一致,这17 个基因中除一个(SLC7A11,其具有低肽覆盖度)外的所有基因的蛋白质靶标也显示相对于野生型细胞系在突变型KEAP1细胞系中表达增加(图4)。
实施例4:肿瘤样品中NRF2的异常剪接的鉴定
对于大多数具有27个候选NRF2靶基因的高表达的肿瘤,可以通过KEAP1或NRF2中的突变来解释升高的基因表达。然而,存在一些在KEAP1或NRF2中缺乏表征的突变的情况下显示候选NRF2 靶基因的高表达的肿瘤。癌症相关的转录物改变越来越多地被认为是可能的驱动者事件(driver event)。因此,假设这些肿瘤中的NRF2途径激活可能是由不被全外显子组测序识别的剪接改变驱动的。分析了 54种已知的癌基因以鉴定在来自TCGA的癌症样品中被反复观察到、但在来自GTEx的正常样品中很少被检测到的剪接变体(参见实施例1)。选择了19种癌症类型,每种类型包括至少100个癌症样品(总共 6,359个样品)。在54种被考虑的癌基因中,鉴定了9个复发的候选癌症特异性剪接变体(对于给定的癌症类型,≥2个样品和>1%的样品)。使用与癌症样品中相同的检测标准,在正常对照(总共2,958个样品)中均未检测到这些变体。将具有共有剪接位点的相关变体组合在一起,在四个癌基因中产生了五个独立的改变(图5)。这些改变包括几个良好记录的致癌剪接变体,包括脑癌中的EGFRvIII、肺腺癌中的MET外显子14跳跃和结肠直肠癌中的CTNNB1外显子3缺失 (Cho等Cancer Res.71(24):7587-7596,2011;Kong-Beltran等Cancer Res.66(1):283-289,2006;Iwao等Cancer Res.58(5):1021-1026,1998)。有趣的是,先前未表征的NRF2中的剪接变体在患有鳞状NSCLC (3.3%;16/481)的患者中频繁地被观察到和发生,并且在患有HNSC 的患者(1.5%;6/403)以较低的发生率被观察到和发生(图5A)。对肺鳞癌中NRF2剪接变体的更详细分析显示,在同一患者中同时存在两种剪接变体,对应于从两种可变启动子中的任一种转录的mRNA中的 NRF2外显子2的跳跃(2.1%;10/481)(图6)。在不同组的患者中(1.2%; 6/481)同时存在两种另外的剪接变体,对应于从两种可变转录起始中的任一种转录的mRNA中的NRF2外显子2和3两者(外显子2+3)的跳跃(图6)。表达缺乏外显子2或外显子2+3的NRF2剪接变体的所有患者也显示出如通过支持外显子2的包含的拆分读段所证明的正常NRF2转录物的表达。外显子2和3均为NRF2编码序列的一部分,并且预测外显子2或外显子2+3的跳跃导致具有N-末端截短或框内缺失的蛋白质同种型(图7)。缺乏外显子2的NRF2转录物的高复发和编码潜力的保持表明这些剪接变体可以呈现赋予选择性优势的功能获得事件。这得到了外显子2编码Neh2结构域的发现的支持,所述Neh2结构域允许与KEAP1相互作用(Itoh等Genes Dev.13(1):76-86, 1999),其在15%的鳞状肺癌中发生突变。
为了评估观察到的NRF2剪接变体是否可以解释没有KEAP1或 NRF2突变的患者中的NRF2途径激活,观察到NRF2剪接变体和 NRF2途径突变的共同发生。在TCGA集合中,通过外显子组测序对所述鳞状肺肿瘤中的178个进行了谱分析。在该亚组中,显示外显子 2或外显子2+3缺失的10个肿瘤(6%)与48个(27%)显示NRF2或 KEAP1中的突变的肿瘤相互排斥(图8A)。此外,所有外显子-2缺失的肿瘤显示出27个候选NRF2靶基因的高表达(图8B)。对头颈癌进行了类似的观察,其中5个(2%)肿瘤中的NRF2外显子缺失与26个 (9%)肿瘤中的NRF2或KEAP1中的突变相互排斥(图9A-9B)。这些结果表明,外显子2的缺失代表了在鳞状NSCLC和头颈肿瘤亚组中激活NRF2的替代机制。重要的是,这些结果表明,除了外显子组测序以外,还考虑了剪接改变,其使被鉴定为具有推定的NRF2途径激活的患者的百分比从27%(48/178)增加至33%(58/178)(在肺鳞癌中) 和从9%(26/275)增加至11%(31/275)(在头颈鳞癌中)。
实施例5:细胞系中NRF2剪接缺陷的验证
为了鉴定用于进一步研究的细胞系模型,从大的人癌细胞系小组中分析了RNA测序数据中鉴定的剪接变体的读段证据(在Klijn等 Nat.Biotechnol.33(3):306-312,2014中描述的)。在611个细胞系中,鉴定出一个多发性骨髓瘤细胞系KMS-27和一个肝细胞癌细胞系 JHH-6,两者均显示通过接合读段NRF2外显子2的杂合跳跃的证据 (图10)。JHH-6和KMS-27mRNA中通过RT-PCR显示的NRF2外显子2跳跃被验证。使用分别源自外显子1和外显子3/4的一系列正向和反向引物(图11A),证实了从JHH-6和KMS-27细胞分离的mRNA 中的外显子2缺失(Δe2NRF2)(图11B)。PCR产物的测序证实了预期的外显子2缺失(图12A-12C)。基于RNA测序数据,在JHH-6或 KMS-27中的NRF2或KEAP1的编码序列中未检测到点突变(Klijn等Nat.Biotechnol.33(3):306-312,2014)。
由于NRF2/KEAP1改变在肝细胞癌(10%)中相当常见,但在多发性骨髓瘤(0%)中不常见,因此进一步测试了JHH-6细胞。具体地,测试了NRF2蛋白的外显子2缺失形式的表达。对来自JHH-6细胞以及 KEAP1突变型HUH-1系和作为代表性野生型KEAP1肝癌细胞系的HuCCT1细胞的全细胞裂解物进行蛋白质印迹。JHH-6细胞中NRF2 的水平与在HUH-1细胞中看到的水平相当,所述水平远高于野生型 KEAP1HuCCT1细胞中的水平(图13)。此外,在JHH-6中可检测到与外显子2缺失一致的较小分子量种类,并且其在NFE2L2 siRNA转染后减少,证实其确实代表NRF2的一种形式。虽然改变的NRF2同种型是可见的,但令人惊讶的是,由于缺乏KEAP1相互作用基序,其并不更丰富。假设外显子2缺失的NRF2的磷酸化形式可能与野生型NRF2的未磷酸化形式在所用的4-12%凝胶中共迁移。实际上, JHH-6裂解物的去磷酸化显示NRF2的外显子2缺失形式比野生型形式显著更丰富(图14A,中图)。类似地,KMS-27细胞表达NRF2的外显子2缺失形式,其是去磷酸化后明显的主要种类(图15)。
使用环己酰亚胺(以消除总蛋白质合成)测试NRF2在三种肝癌细胞系中的稳定性。使用去磷酸化的裂解物以允许更准确地定量总 NRF2。实验显示在JHH-6细胞中Δe2NRF2的稳定性增加,与HUH-1 细胞中的NRF2相当,两者均比HuCCT1细胞中的NRF2更稳定(图 14A-14B)。此外当与HUH-1细胞相比时,JHH-6细胞中NRF2的外显子2缺失形式还显示出显著的核定位(图16)。
为了确定JHH-6细胞中外显子2的缺失是否使得NRF2难以通过 KEAP1调控,测试了NRF2响应于KEAP1敲低的稳定性。由于稳定性增加,HuCCT1细胞中KEAP1的敲低导致NRF2的稳态水平增加(图 14C)。然而,JHH-6细胞中KEAP1的敲低不影响外显子2缺失的NRF2 的水平或稳定性。如所预期的,KEAP1的敲低不会增加KEAP1突变型HUH-1细胞系中野生型NRF2的稳定性(图14D)。
实施例6:对NRF2的外显子2和/或外显子2+3缺失的评估
使用实施例3中描述的NRF2/KEAP1基因标签,确定了在16个肝细胞癌细胞系当中,JHH-6细胞显示NRF2靶基因的最高表达(根据RNA测序数据),与在表达突变型KEAP1的细胞系中所见的那些类似(图17A)。类似地,在检查的18个多发性骨髓瘤细胞系中, KMS-27细胞显示这些基因的最高表达(图17B)。这些基因的表达可以通过“NRF2靶基因评分”来概括,该评分计算为所检查的611细胞系中各个靶基因的z-评分的平均值。这产生反映给定细胞系中标签基因的过表达程度的每细胞系的单个评分。NRF2靶标评分证实JHH-6 细胞显示与表达KEAP1突变的肝癌细胞系相似的评分(图18A),并且KMS-27细胞显示多发性骨髓瘤细胞系中的最高评分(图18B),尽管多发性骨髓瘤显示低的总NRF2靶基因评分(由负值表示的)。
接下来,将表达外显子2缺失的NRF2的JHH-6细胞对NRF2蛋白表达的依赖性与表达野生型NRF2的HuCCT1细胞进行比较。在 JHH-6细胞中敲低NRF2引起细胞活力的显著降低,类似于在突变型 KEAP1肝细胞癌细胞系HUH-1中观察到的。相反,NRF2敲低对 HuCCT1细胞的活力具有更加适度的影响(图19)。这不归因于 HuCCT1细胞中的缺陷型NRF2敲低,因为NRF2敲低在所有三种细胞系中同样有效(图20)。NRF2的敲低还导致四种充分表征的NRF2靶基因的表达降低,尽管这在野生型KEAP1HuCCT1细胞系中略微降低(图21)。如通过片段化DNA的增加所测量的,降低的活力可能至少部分地由凋亡造成(图22)。
为了解决NRF2外显子2的丢失如何影响NRF2受KEAP1调控的能力,使用293细胞中的瞬时表达。KEAP1降低了全长NRF2的表达,但对缺乏外显子2或外显子2+3的NRF2的表达具有较小的影响(图23,上图)。正如预期的那样,KEAP1对全长NRF2表达的抑制作用大部分被蛋白酶体抑制剂MG132消除。全长NRF2和KEAP1 彼此相互作用,而外显子2或外显子2+3的缺失完全消除了KEAP1 结合NRF2的能力(图23,下图)。结果,与野生型NRF2相比,截短的NRF2在KEAP1表达后保持稳定(图24A-24B),尽管截短形式的 NRF2似乎具有略微降低的内在稳定性。然而,改变的NRF2同种型具有转录活性,这可通过它们增加NRF2靶基因表达的能力来判断(图 25)。与全长NRF2相比,外显子2-或外显子2+3-缺失的NRF2类似地使大多数基因增加,并且大多数基因对KEAP1过表达的作用具有抗性。有趣的是,外显子2+3缺失的NRF2在增加GPX2表达方面存在缺陷,这表明这种形式的NRF2的转录激活可能存在细微差异。与该观察结果一致,除了GPX2之外,实施例3中描述的27种靶基因中的22种与外显子2缺失的肿瘤相比在外显子2+3缺失的鳞状肺肿瘤中显示出较低的中值表达(图26)。
实施例7:NRF2外显子2剪接改变的机理分析
对KMS-27和JHH-6的外显子组测序数据的分析显示了作图至外显子2的读段的减少,这表明观察到的转录物变体可能是基因组改变的结果(图27A)。JHH-6和KMS-27的全基因组测序(WGS)显示这些细胞系具有围绕NRF2外显子2的微缺失,分别跨越4,685和2,981个核苷酸(图27B)。为了研究患者的因果机制,分析了具有高读段覆盖度(>300x)的临床鳞状NSCLC肿瘤的大型群组(n=1,218)的靶向配对末端外显子组测序数据。在该数据集中,与附近的对照区域相比, 11个肿瘤显示外显子2或外显子2+3的拷贝数减少(材料和方法;图27B)。通过研究靶向测序的确定的基因组区域的对数比,可以理解缺失的局部性质(图28B)。具有不一致读段对的七个肿瘤与包含数千碱基的DNA并影响外显子2或外显子2+3的结构变体一致(图28A)。总共有16名患者显示出影响NRF2外显子2或外显子2+3的基因组改变的证据,并且所鉴定的事件与NRF2和KEAP1中的点突变或插入缺失相互排斥,已知所述点突变或插入缺失可激活该途径。分析了另外一个群组的45个鳞状NSCLC肿瘤,其中RNA和DNA均可获得。RT-PCR分鉴定了具有外显子2丢失的患者,与邻近的正常组织相比所述外显子2丢失在肿瘤中强烈富集(图29)。RNA测序分析证实转录物变体在鉴定的肿瘤中表达,但在相邻的正常组织中不存在 (图30)。NRF2靶基因的表达也升高至与该途径中具有已知突变的TCGA肿瘤中的所述表达相似的程度,而相邻的正常组织显示这些基因的低表达(图31)。最后,全基因组测序证实转录物变体是外显子2 周围5,233个核苷酸的体细胞基因组微缺失的结果(图28C)。这些数据表明基因组微缺失是NRF2途径激活的临床相关机制。
这些数据表明,由NRF2调控的一组基因在不同的组织和条件下是保守的。这在使用单个基因标签来鉴定NSCLC和HNSC中具有 NRF2激活的肿瘤方面具有实用价值(图32)。有趣的是,这种 NRF2/KEAP1标签仅在肿瘤中被激活。肺和头颈肿瘤的匹配正常样品仅显示低NRF2靶基因活性(图33)。这表明与正常组织相比,NRF2 途径的抑制可能在显示通路失调的肿瘤中具有选择性益处。
先前已经报道了许多基因(包括EGFR和CTNNB1)的导致原癌基因激活的基因内基因组缺失。部分归因于当前基因组技术的限制,此类变体不是常规测定的。特别是,仅通过外显子组测序难以检测到影响个体外显子并且涉及小拷贝数变化的小畸变。因此,基因内缺失仍然是相对未开发的,并且仍在发现新的变体。最近对小细胞肺癌和成人T细胞白血病/淋巴瘤的研究使用全基因组测序鉴定了TP73、IKZF2 和CARD11中的复发性微缺失(George等Nature 524,47-53:2015; Kataoka等Nat.Genet.47:1304-1315,2015)。在本研究中,作为TCGA 项目的一部分产生的公开可获得的RNA测序数据用于鉴定已知癌基因中的复发转录物改变。由于患者群组之间的差异,很难评估NRF2 外显子缺失的一般发生率。例如,当用可用的RNA测序数据分析 TCGA肺鳞癌(n=481)时,我们鉴定出3%(16/481)的具有NRF2外显子2或外显子2+3缺失的患者。当用可用的外显子组-测序数据分析可对其进行体细胞突变识别的患者的亚组(n=178)时,具有NRF2外显子缺失的患者的比例为6%(10/178)。NRF2外显子缺失的计数将具有推定NRF2途径激活的患者的百分比与仅通过外显子组测序评估 NRF2或KEAP1的突变相比,从27%(48/178)增加至33%(58/178)(在肺鳞癌中),以及从9%(26/275)增加至11%(31/275)(在头颈鳞状细胞癌中)(图8A和9A)。来自接受基因组谱分析的患者的真实临床样品的分析表明在1-2%的肺鳞状细胞癌中发生NRF2外显子缺失。然而,后一种分析缺乏灵敏度,因为尚未建立用于确定具有可变肿瘤含量的样品中单外显子缺失的优化标准,并且仅考虑明确的缺失。然而,本文提供的结果与在特定肿瘤适应症(诸如鳞状NSCLC和头颈癌)中经常改变该途径的调节的概念一致。还可以通过对完整基因座(包括内含子)的测序或通过组合来自外显子组和RNA测序实验的数据来进一步筛选已知的癌基因。
对由WGS鉴定的三个缺失的结构的分析显示断裂点是不同的,但在每种情况下,侧接有缺失的基因组区域显示具有序列同源性的 2-6个核苷酸(图34)。JHH-6细胞的3'末端、5'末端和接合读段的DNA 序列分别由SEQ ID NO:61-63提供。KMS-27细胞的3'末端、5'末端和接合读段的DNA序列分别由SEQ ID NO:64-66提供。原代肿瘤细胞的3'末端、5'末端和接合读段的DNA序列分别由SEQ ID NO:67-69 提供。
除点突变以外,NRF2通常还显示基因组扩增。有趣的是,虽然通过RT-PCR分析获得的KMS-27细胞中的NRF2缺失产物的强度似乎与野生型NRF2相似,但其在JHH-6细胞中似乎更丰富(图13)。这也反映在WGS读段计数中,这表明与野生型等位基因相比,缺失形式的丰度更高(图27B)。这些结果与JHH-6细胞携带5个拷贝的NRF2 基因基因座(通过SNP测定检测的)而KMS-27细胞携带2个拷贝的观察结果一致。在所分析的TCGA样品中NRF2的扩增相当频繁,包括鳞状(4.5%)和腺瘤(2.6%)NSCLC、HNSC(12.2%)和肝癌(3.6%),并且代表增加NRF2转录输出的机制。在JHH-6细胞的情况下,这些数据表明缺失的等位基因已被优先扩增,提供了增强该细胞系中的NRF2 信号传导的另外机制。然而,在原发性肿瘤中未观察到截短的/剪接的等位基因的优先扩增,表明单独的外显子2或2+3缺失可为克隆选择提供足够的NRF2活性。
外显子2的缺失提供了一种优雅的机制,通过除去与KEAP1的相互作用位点来增加NRF2活性,同时使基因的其余部分在DNA结合和转录激活功能上保持功能完整。实际上,我们的生化分析证实,当缺失外显子2时,KEAP1结合几乎完全丧失并导致NRF2的稳定化(图23和24)。当考虑在肿瘤中发现的NRF2点突变时,围绕ETGE 高亲和力结合位点的突变导致KEAP1相互作用的完全丧失,而较低亲和力DLG基序中的突变在其破坏NRF2/KEAP1复合物的能力方面不同(Fukutomi等Mol Cell Biol.34(5):832-846,2014;Shibata等Proc.Natl.Acad.Sci.USA.105(36):13568-13573,2008)。然而,即使不破坏复合物的点突变也会改变相互作用的性质,诸如阻止KEAP1介导的 NRF2泛素化(Shibata等Proc.Natl.Acad.Sci.USA. 105(36):13568-13573,2008)。虽然在缺失外显子2和3的情况下与 KEAP1的相互作用类似地被消除,但外显子3含有Neh4结构域,该结构域先前参与通过与CREB(cAMP应答元件结合蛋白)结合蛋白 (CBP)结合而被NRF2转录激活(Katoh等GenesCells.6(10):857-868, 2001)。Neh4(包含在外显子3中)和Neh5(包含在外显子4中)显示出在募集CBP中协同作用。与此一致,观察到与Δe2NRF2或NRF2 中的肿瘤相关点突变相比,Δe2+3NRF2诱导一些NRF2靶基因的能力降低(图25和26)。
在其它基因中也已观察到在人肿瘤中发现的去除与E3连接酶的相互作用的结构域的缺失。例如,222个结直肠肿瘤中的7个显示围绕β-连环蛋白的外显子3的小基因组缺失(234-677bp)(Iwao等Cancer Res.58(5):1021-1026,1998)去除了其E3连接酶β-TRCP的相互作用位点(Hart等Curr.Biol.9(4):207-210,1999)。类似地,在前列腺癌中发现的大多数TMPRSS-ERG融合蛋白编码ERG的截短形式,这使得它们对泛素化和降解(由SPOP介导)具有抗性(An等Mol.Cell. 59(6):904-916,2015)。
另外,导致MET外显子14跳跃的突变去除了氨基酸残基Y1003,所述氨基酸残基是Cbl募集和随后泛素化和下调所需的。因此,小的基因内缺失代表了新生癌基因在肿瘤起始和进化过程中逃避正常降解的有效机制。
实施例8:突变型KEAP1细胞中的NRF2敲低
该实施例提供了KEAP1突变对不同生长环境下NRF2活性需求的影响的表征,并且表明NRF2活性对于非贴壁依赖性条件下的生长是必需的。
检测了NRF2抑制对野生型以及突变型KEAP1和NRF2细胞系的结果。建立了在多西环素控制下表达三种独立的NRF2 shRNA的稳定细胞系,以及三种独立的非靶向对照(NTC)。这些NRF2 shRNA 在五种KEAP1突变细胞系、两种NRF2突变型细胞系和五种野生型 NSCLC细胞系中以及永生化但未转化的肺上皮细胞BEAS2B细胞中有效降低NRF2蛋白水平(图35)。加入多西环素后,大多数细胞系的活力降低至不同程度,其中KEAP1突变型细胞系通常表现出显著更大的降低(图36和37)。在较大的一小组NSCLC细胞系中通过siRNA 敲低NRF2证实了对细胞活力的基因型依赖性作用(图38)。
表征了肿瘤异种移植物中NRF2敲低的结果。将表达dox诱导型 NRF2 shRNA的KEAP1突变型A549细胞系和KEAP1野生型H441 细胞系植入雌性SCID小鼠的侧腹。在两种肿瘤中,在多西环素处理的小鼠中NRF2被有效地敲低(图39和40)。KEAP1突变型A549细胞系中的NRF2敲低对肿瘤生长具有显著影响,导致在10个肿瘤中的5个中完全肿瘤消退(图41A)。相反,对KEAP1野生型H441生长的影响更为温和,导致肿瘤生长减少37%,所有动物均显示出维持的肿瘤负荷(图41B)。
为了理解NRF2敲低对异种移植物肿瘤扩增与塑料上的2D生长之间的差异作用,测试了几种额外的细胞培养环境。在低粘附板和/ 或低氧(0.5%)中生长的细胞中的NRF2敲低显示出与在塑料上生长的细胞类似的后果(图42)。相反,当在软琼脂(图43和44)中、微图案化塑料薄膜(图45和46)上或甲基纤维素(图47)中培养时,KEAP1突变型细胞系的生长受到严重损害。软琼脂中的生长用于更详细地表征 NRF2敲低的后果。虽然NRF2的敲低完全消除了三种KEAP1突变型细胞系中的集落形成,但其在H1048和H441(两种野生型KEAP1 NSCLC细胞系)中几乎没有影响(图43和44)。评估了谷胱甘肽途径响应于NRF2敲低的作用,因为已经显示该途径介导由高NRF2活性促进的存活性质。虽然添加还原型谷胱甘肽通常会增加所有测试细胞系在软琼脂中形成集落的能力,但其无法挽救NRF2敲低的后果(图 43和44)。用N-乙酰基半胱氨酸(NAC;图48)观察到类似的阴性结果。如通过测量二氯荧光素染色所测量的,外源性谷胱甘肽能够进入细胞并降低活性氧(ROS)水平(图49)。因此,对NRF2活性的要求令人惊讶地独立于谷胱甘肽合成途径。
为了进一步探索谷胱甘肽途径在NRF2响应中的作用,监测了 xCT谷胱甘肽/半胱氨酸逆向转运蛋白的表达和活性(谷胱甘肽合成中的限速步骤之一)。NRF2敲低后SLC7A11表达降低(图50),导致与还原型谷胱甘肽相关(图52)的胱氨酸摄取减少(图51)。NRF2敲低也导致ROS水平大幅增加(图53)。为了确定抑制SLC7A11表达和胱氨酸摄取是否有助于降低NRF2敲低后的活力,使用埃拉汀(erastin)启动xCT功能,这抑制胱氨酸摄取(图51)和增加了氧化应激(图53)。然而,这不足以降低KEAP1突变型细胞系A549(图54)或大多数其它KEAP1突变型细胞系(图55)的活力。然而,埃拉汀和NRF2敲低的组合确实导致活力的显著降低(图54)。类似地,谷胱甘肽合酶抑制剂丁硫氨酸亚砜亚胺(BSO)或谷氨酰胺酶抑制剂BPTES也未显示出对 KEAP1突变型细胞系的优先毒性(图56和57)。这些结果表明补充谷胱甘肽不足以挽救NRF2敲低诱导的致死率,谷胱甘肽的耗尽也不足以杀死KEAP1突变型细胞系。
为了了解哪些途径由于NRF2激活或KEAP1丢失而被激活,使用基因库进行CRISPR筛选,所述基因库在A549细胞中于NRF2敲低后降低和/或在一小组KEAP1突变型NSCLC细胞系中升高。由于在于2D、3D和异种移植物生长条件下进行NRF2敲低后观察到明显的后果,在所有三种环境下进行筛选以确定是否可以鉴定离散的依赖性。对于所有三个条件在15-天的时间点,所有三个筛选表现相似,其中gRNA仅代表少量显示显著退出的基因(图58-60)。NFE2L2及其结合伴侣MAFG,是最重要的基因之一,表明筛选按预期进行。磷酸戊糖途径基因PGD、G6PD和TKT(已知的NRF2靶基因)也显示出强烈的退出。该筛选中的其它强命中是两个生长因子受体基因IGF1R 和ERBB3,以及编码氧化还原信号传导传递的三个组成部分的基因 PRDX1、TXN和TXNRD1。
在A549细胞中进行NRF2敲低后ErbB3的表达降低(图58-60)。在肿瘤异种移植模型中利用YW57.88.5的处理表明ErbB3是A549增殖所需的(图61)。
相对于KEAP1野生型NSCLC细胞系,KEAP1突变型NSCLC 细胞中IGF1R的表达更高。为了测试IGF1R抑制对KEAP1突变型和 KEAP1野生型细胞的影响,用林西替尼(一种高效且选择性IGF1R小分子抑制剂)处理细胞系。当在三种野生型和三种突变型KEAP1 NSCLC细胞系中测试时,林西替尼对增殖几乎没有影响。然而,该化合物在抑制A549细胞在软琼脂中的集落生长方面非常有效,具有约20nM的IC50。此外,当针对大的NSCLC细胞系小组进行测试时,在KEAP1突变型细胞系中该化合物的软琼脂中似乎存在选择性生长抑制。当在非贴壁依赖性条件下生长时,对于独立的IGF1R抑制剂 NVP-AEW541也观察到对KEAP1突变型细胞系的类似选择性作用 (图62)。
因此,通过IGF1R和ErbB3进行信号传导的生长因子是KEAP1 突变型细胞生长的重要介质。
其它实施方案
尽管上述本发明已出于清楚理解的目的通过说明和实施例的方式进行了详细描述,但描述和实施例不应解释为限制本发明的范围。本文引用的所有专利和科学文献的公开内容皆以全文引用的方式明确并入本文。
序列表
<110> Genentech, Inc.
Foundation Medicine, Inc.
<120> 用于诊断和治疗癌症的方法
<130> 50474-127WO2
<150> US 62/360,294
<151> 2016-07-08
<160> 69
<170> PatentIn 3.5版
<210> 1
<211> 5446
<212> RNA
<213> 智人
<400> 1
uacuuuggga acuggugagu cucccugucc cuagggcuuu uuagucacau guccauccac 60
uguuucaaug uaacaugcau cuaggcaagg uuaacgauua aaugguuggg augaaagguc 120
auccuuuacg gagaacauca gaaugguaga uaauuccugu uccacuuucu uugaugaaac 180
aaguaaagaa gaaacaacac aaucauauua auagaagagu cuucguucca gacgcagucc 240
aggaaucaug cuggagaagu ucugcaacuc uacuuuuugg aauuccucau uccuggacag 300
uccggaggca gaccugccac uuuguuuuga gcaaacuguu cuggugugga uucccuuggg 360
cuuccuaugg cuccuggccc ccuggcagcu ucuccacgug uauaaaucca ggaccaagag 420
auccucuacc accaaacucu aucuugcuaa gcagguauuc guugguuuuc uucuuauucu 480
agcagccaua gagcuggccc uuguacucac agaagacucu ggacaagcca cagucccugc 540
uguucgauau accaauccaa gccucuaccu aggcacaugg cuccugguuu ugcugaucca 600
auacagcaga caauggugug uacagaaaaa cuccugguuc cugucccuau ucuggauucu 660
cucgauacuc uguggcacuu uccaauuuca gacucugauc cggacacucu uacaggguga 720
caauucuaau cuagccuacu ccugccuguu cuucaucucc uacggauucc agauccugau 780
ccugaucuuu ucagcauuuu cagaaaauaa ugagucauca aauaauccau cauccauagc 840
uucauuccug aguagcauua ccuacagcug guaugacagc aucauucuga aaggcuacaa 900
gcguccucug acacucgagg augucuggga aguugaugaa gagaugaaaa ccaagacauu 960
agugagcaag uuugaaacgc acaugaagag agagcugcag aaagccaggc gggcacucca 1020
gagacggcag gagaagagcu cccagcagaa cucuggagcc aggcugccug gcuugaacaa 1080
gaaucagagu caaagccaag augcccuugu ccuggaagau guugaaaaga aaaaaaagaa 1140
gucugggacc aaaaaagaug uuccaaaauc cugguugaug aaggcucugu ucaaaacuuu 1200
cuacauggug cuccugaaau cauuccuacu gaagcuagug aaugacaucu ucacguuugu 1260
gaguccucag cugcugaaau ugcugaucuc cuuugcaagu gaccgugaca cauauuugug 1320
gauuggauau cucugugcaa uccucuuauu cacugcggcu cucauucagu cuuucugccu 1380
ucaguguuau uuccaacugu gcuucaagcu ggguguaaaa guacggacag cuaucauggc 1440
uucuguauau aagaaggcau ugacccuauc caacuuggcc aggaaggagu acaccguugg 1500
agaaacagug aaccugaugu cuguggaugc ccagaagcuc auggauguga ccaacuucau 1560
gcacaugcug uggucaagug uucuacagau ugucuuaucu aucuucuucc uauggagaga 1620
guugggaccc ucagucuuag cagguguugg ggugauggug cuuguaaucc caauuaaugc 1680
gauacugucc accaagagua agaccauuca ggucaaaaau augaagaaua aagacaaacg 1740
uuuaaagauc augaaugaga uucuuagugg aaucaagauc cugaaauauu uugccuggga 1800
accuucauuc agagaccaag uacaaaaccu ccggaagaaa gagcucaaga accugcuggc 1860
cuuuagucaa cuacagugug uaguaauauu cgucuuccag uuaacuccag uccugguauc 1920
uguggucaca uuuucuguuu auguccuggu ggauagcaac aauauuuugg augcacaaaa 1980
ggccuucacc uccauuaccc ucuucaauau ccugcgcuuu ccccugagca ugcuucccau 2040
gaugaucucc uccaugcucc aggccagugu uuccacagag cggcuagaga aguacuuggg 2100
aggggaugac uuggacacau cugccauucg acaugacugc aauuuugaca aagccaugca 2160
guuuucugag gccuccuuua ccugggaaca ugauucggaa gccacagucc gagaugugaa 2220
ccuggacauu auggcaggcc aacuuguggc ugugauaggc ccugucggcu cugggaaauc 2280
cuccuugaua ucagccaugc ugggagaaau ggaaaauguc cacgggcaca ucaccaucaa 2340
gggcaccacu gccuaugucc cacagcaguc cuggauucag aauggcacca uaaaggacaa 2400
cauccuuuuu ggaacagagu uuaaugaaaa gagguaccag caaguacugg aggccugugc 2460
ucuccuccca gacuuggaaa ugcugccugg aggagauuug gcugagauug gagagaaggg 2520
uauaaaucuu aguggggguc agaagcagcg gaucagccug gccagagcua ccuaccaaaa 2580
uuuagacauc uaucuucuag augacccccu gucugcagug gaugcucaug uaggaaaaca 2640
uauuuuuaau aaggucuugg gccccaaugg ccuguugaaa ggcaagacuc gacucuuggu 2700
uacacauagc augcacuuuc uuccucaagu ggaugagauu guaguucugg ggaauggaac 2760
aauuguagag aaaggauccu acagugcucu ccuggccaaa aaaggagagu uugcuaagaa 2820
ucugaagaca uuucuaagac auacaggccc ugaagaggaa gccacagucc augauggcag 2880
ugaagaagaa gacgaugacu augggcugau auccagugug gaagagaucc ccgaagaugc 2940
agccuccaua accaugagaa gagagaacag cuuucgucga acacuuagcc gcaguucuag 3000
guccaauggc aggcaucuga agucccugag aaacuccuug aaaacucgga augugaauag 3060
ccugaaggaa gacgaagaac uagugaaagg acaaaaacua auuaagaagg aauucauaga 3120
aacuggaaag gugaaguucu ccaucuaccu ggaguaccua caagcaauag gauuguuuuc 3180
gauauucuuc aucauccuug cguuugugau gaauucugug gcuuuuauug gauccaaccu 3240
cuggcucagu gcuuggacca gugacucuaa aaucuucaau agcaccgacu auccagcauc 3300
ucagagggac augagaguug gagucuacgg agcucuggga uuagcccaag guauauuugu 3360
guucauagca cauuucugga gugccuuugg uuucguccau gcaucaaaua ucuugcacaa 3420
gcaacugcug aacaauaucc uucgagcacc uaugagauuu uuugacacaa cacccacagg 3480
ccggauugug aacagguuug ccggcgauau uuccacagug gaugacaccc ugccucaguc 3540
cuugcgcagc uggauuacau gcuuccuggg gauaaucagc acccuuguca ugaucugcau 3600
ggccacuccu gucuucacca ucaucgucau uccucuuggc auuauuuaug uaucuguuca 3660
gauguuuuau gugucuaccu cccgccagcu gaggcgucug gacucuguca ccaggucccc 3720
aaucuacucu cacuucagcg agaccguauc agguuugcca guuauccgug ccuuugagca 3780
ccagcagcga uuucugaaac acaaugaggu gaggauugac accaaccaga aaugugucuu 3840
uuccuggauc accuccaaca gguggcuugc aauucgccug gagcugguug ggaaccugac 3900
ugucuucuuu ucagccuuga ugaugguuau uuauagagau acccuaagug gggacacugu 3960
uggcuuuguu cuguccaaug cacucaauau cacacaaacc cugaacuggc uggugaggau 4020
gacaucagaa auagagacca acauuguggc uguugagcga auaacugagu acacaaaagu 4080
ggaaaaugag gcacccuggg ugacugauaa gaggccuccg ccagauuggc ccagcaaagg 4140
caagauccag uuuaacaacu accaagugcg guaccgaccu gagcuggauc ugguccucag 4200
agggaucacu ugugacaucg guagcaugga gaagauuggu guggugggca ggacaggagc 4260
uggaaaguca ucccucacaa acugccucuu cagaaucuua gaggcugccg guggucagau 4320
uaucauugau ggaguagaua uugcuuccau ugggcuccac gaccuccgag agaagcugac 4380
caucaucccc caggacccca uccuguucuc uggaagccug aggaugaauc ucgacccuuu 4440
caacaacuac ucagaugagg agauuuggaa ggccuuggag cuggcucacc ucaagucuuu 4500
uguggccagc cugcaacuug gguuauccca cgaagugaca gaggcuggug gcaaccugag 4560
cauaggccag aggcagcugc ugugccuggg cagggcucug cuucggaaau ccaagauccu 4620
gguccuggau gaggccacug cugcggugga ucuagagaca gacaaccuca uucagacgac 4680
cauccaaaac gaguucgccc acugcacagu gaucaccauc gcccacaggc ugcacaccau 4740
cauggacagu gacaagguaa ugguccuaga caacgggaag auuauagagu gcggcagccc 4800
ugaagaacug cuacaaaucc cuggacccuu uuacuuuaug gcuaaggaag cuggcauuga 4860
gaaugugaac agcacaaaau ucuagcagaa ggccccaugg guuagaaaag gacuauaaga 4920
auaauuucuu auuuaauuuu auuuuuuaua aaauacagaa uacauacaaa aguguguaua 4980
aaauguacgu uuuaaaaaag gauaagugaa cacccaugaa ccuacuaccc agguuaagaa 5040
aauaaauguc accagguacu ugagaaaccc cucgauuguc uaccucgauc guacuuccuu 5100
gcuacccacc ccucccaggg acaaccacug uccugaauuu cacgauaauu auuccuuugc 5160
cuuucauuuc uguuuuauca ccuuuguaug uaucuuuaaa caacauauac ccuuuuuuac 5220
uuauguaaau ggacugacuc auacugcaua caucuucuau gacuugauuc uuuuguucaa 5280
uauuauaucu gagauucauc cauggugaug caaauaggug cauuauuuuu uuucacugcu 5340
cuguagucug gcauuguaug aauacagcac aauguaucag uuuuaauauu ggggaucauu 5400
agcauuauuc ucagguuuuu aaaaauuaua agcaguacua cuaugg 5446
<210> 2
<211> 1610
<212> RNA
<213> 智人
<400> 2
acaguagcuc acaccuguaa ucccagcacu uuggaaggcc gaggugggcg gaucaccuga 60
gcucaggagu uugagaccag ccugucucua cuaacaauau aaaaauuagc ugggagucac 120
ggugggcgcc uguaauccca gcuacucggg aggcugaggc aggagaauug cuugaaccca 180
ggagacagag guuguaguga gcugagaucg caccacugca cucuagccuu ggcaacagug 240
caagacuguc ucaaaaacag caacagagag caggacguga gacuucuacc ugcucacuca 300
gaaucauuuc ugcaccaacc auggccacgu uuguggagcu caguaccaaa gccaagaugc 360
ccauuguggg ccugggcacu uggaagucuc cucuuggcaa agugaaagaa gcagugaagg 420
uggccauuga ugcaggauau cggcacauug acugugccua ugucuaucag aaugaacaug 480
aaguggggga agccauccaa gagaagaucc aagagaaggc ugugaagcgg gaggaccugu 540
ucaucgucag caaguugugg cccacuuucu uugagagacc ccuugugagg aaagccuuug 600
agaagacccu caaggaccug aagcugagcu aucuggacgu cuaucuuauu cacuggccac 660
agggauucaa gucuggggau gaccuuuucc ccaaagauga uaaagguaau gccaucggug 720
gaaaagcaac guucuuggau gccugggagg ccauggagga gcugguggau gaggggcugg 780
ugaaagcccu uggggucucc aauuucagcc acuuccagau cgagaagcuc uugaacaaac 840
cuggacugaa auauaaacca gugacuaacc agguugagug ucacccauac cucacacagg 900
agaaacugau ccaguacugc cacuccaagg gcaucaccgu uacggccuac agcccccugg 960
gcucuccgga uagaccuugg gccaagccag aagacccuuc ccugcuggag gaucccaaga 1020
uuaaggagau ugcugcaaag cacaaaaaaa ccgcagccca gguucugauc cguuuccaua 1080
uccagaggaa ugugauuguc auccccaagu cugugacacc agcacgcauu guugagaaca 1140
uucaggucuu ugacuuuaaa uugagugaug aggagauggc aaccauacuc agcuucaaca 1200
gaaacuggag ggccuguaac guguugcaau ccucucauuu ggaagacuau cccuucaaug 1260
cagaauauug agguugaauc uccuggugag auuauacagg agauucucuu ucuucgcuga 1320
agugugacua ccuccacuca ugucccauuu uagccaagcu uauuuaagau cacagugaac 1380
uuaguccugu uauagacgag aaucgaggug cuguuuuaga cauuuauuuc uguauguuca 1440
acuaggauca gaauaucaca gaaaagcaug gcuugaauaa ggaaaugaca auuuuuucca 1500
cuuaucugau cagaacaaau guuuauuaag caucagaaac ucugccaaca cugaggaugu 1560
aaagaucaau aaaaaaaaua auaaucauaa ccaacaaaaa aaaaaaaaaa 1610
<210> 3
<211> 1625
<212> RNA
<213> 智人
<400> 3
uccgggcuuc cccagacaga cagcuggcuu acagggccac cugaagacgu uccagggcuc 60
cacaggccac ugucuucugg aggggaacgg aucgacugcc ggugcgccca gccaaauuca 120
acuccugagu ccucagucuc uagucccggg aagguuucac cgagcugccc uacuccuugu 180
accccuucua gcuggccuua gcauagcuac gucagcagcu auuggcacga cugcccugau 240
ucaaggagaa acuggacuaa uaucacuauc ucaacaggau cgaggccauc aagcuacaga 300
uggucuuaca aauggaaccc caagugaacu caacuaacaa cuuccaccaa ggaccccugg 360
accaacccgu uggcccuuug acuggccuaa agaguucccu ucugaaggac acuacaagug 420
cagggccccu ucuucgcccc uauccagcau cucuucucgg caaagugaaa gaagcgguga 480
agguggccau ugaugcagaa uaucgccaca uugacugugc cuauuucuau gagaaucaac 540
augagguggg agaagccauc caagagaaga uccaagagaa ggcugugaug cgggaggacc 600
uguucaucgu cagcaaggug uggcccacuu ucuuugagag accccuugug aggaaagccu 660
uugagaagac ccucaaggac cugaagcuga gcuaucugga cgucuaucuu auucacuggc 720
cacagggauu caagacuggg gaugacuuuu uccccaaaga ugauaaaggu aauaugauca 780
guggaaaagg aacguucuug gaugccuggg aggccaugga ggagcuggug gacgaggggc 840
uggugaaagc ccuugggguc ucaaauuuca accacuucca gaucgagagg cucuugaaca 900
aaccuggacu gaaauauaaa ccagugacua accagguuga gugucaccca uaccucacgc 960
aggagaaacu gauccaguac ugccacucca agggcaucac cguuacggcc uacagccccc 1020
ugggcucucc ggauagaccu ugggccaaac cugaggaccc uucccugcug gaggauccca 1080
agauuaagga gauugcugca aagcacaaaa aaaccacagc ccagguucug auccguuucc 1140
auauccagag gaaugugaca gugaucccca agucuaugac accagcacac auuguugaga 1200
acauucaggu cuuugacuuu aaauugagug augaggagau ggcaaccaua cucagcuuca 1260
acagaaacug gagggccuuu gacuucaagg aauucucuca uuuggaggac uuucccuucg 1320
augcagaaua uugagguuga aucuccuggu gagauuacac aggggauucu cuuucuucgc 1380
ugaaguguga cugucuccac ucaagaacua uuuuagccaa gcuuaucuga gaucacagug 1440
aacuuugucc uguuguagac cagaauggag gugcuguuuu agacauguau uucuguaugu 1500
ucaacuagga uaagaauauc acagaaaagc auggccugaa uaagcaaaug acaauuuuuu 1560
ccacuuaucu gaucugauca aaugucuguu aagcaccaga aacucugcca acacugagga 1620
uguaa 1625
<210> 4
<211> 1098
<212> RNA
<213> 智人
<400> 4
guaagaaacg guugaacugg augcaauuuu uaucacagcu uguguaagac ugccucuguc 60
ccuccucuca caugccauug guuaaccagc agacagugug cucaggggcg uugccagcuc 120
auugcucuua uagccuguga gggaggaaga aacauuugcu aaccaggcca gugacagaaa 180
uggauucgaa auaccagugu gugaagcuga augaugguca cuucaugccu guccugggau 240
uuggcaccua ugcgccugca gagguuccua aaaguaaagc ucuagaggcc gucaaauugg 300
caauagaagc cggguuccac cauauugauu cugcacaugu uuacaauaau gaggagcagg 360
uuggacuggc cauccgaagc aagauugcag auggcagugu gaagagagaa gacauauucu 420
acacuucaaa gcuuuggagc aauucccauc gaccagaguu gguccgacca gccuuggaaa 480
ggucacugaa aaaucuucaa uuggacuaug uugaccucua ucuuauucau uuuccagugu 540
cuguaaagga ggacauaggg auuuuaacau ggaagaagag cccuaaacau aacuccuaau 600
uccuuucuau ggaacagaaa gcaauuuuga auccauacuu ccgugauugc augucuacaa 660
gaaaagagag ugcagaaucc ucaaagccuc ugccucaaaa acuugaggaa augacaauca 720
ucuccuugaa ggcacaaggu cuuauuuaug auuccugauu ucaccucuug ggauguucac 780
agacacagag uuucaugaag cugugguguc cagaaaaccu gcugcacaua gggugcacaa 840
ugaguuucca ucuucuugcc ucuuuucaag gggcaagaac ucaguccggg aaugucuuaa 900
acuacaaacc uucaugggaa accuuguugc uucugcuucc ucucuuuuca cacuggaggu 960
uuuauuuuug cuuagccaug aauucuugug ucauucauaa cuuuugucuu aagguacuga 1020
aaacuaguca ggcuaguuaa ugcaaaaggg uauauuagau augauaaugg gaaaucaaag 1080
ccagggcuac auuaagaa 1098
<210> 5
<211> 1064
<212> RNA
<213> 智人
<400> 5
gcccauuguu uuuguaaucu cugaggagaa gcagcagcaa acauuugcua gucagacaag 60
ugacagggaa uggauuccaa acaccagugu guaaagcuaa augauggcca cuucaugccu 120
guauugggau uuggcaccua ugcaccucca gagguuccga gaaguaaagc uuuggagguc 180
acaaaauuag caauagaagc uggguuccgc cauauagauu cugcucauuu auacaauaau 240
gaggagcagg uuggacuggc cauccgaagc aagauugcag auggcagugu gaagagagaa 300
gacauauucu acacuucaaa gcuuuggucc acuuuucauc gaccagaguu gguccgacca 360
gccuuggaaa acucacugaa gaaagcucaa uuggacuaug uugaccucua ucuuauucau 420
ucuccaaugu cucuaaaggu augcaguuug uaugagcaua aaauugcgcu ucugcuguca 480
uuauaaacau uguuuaucug gauaguugaa cagagcuuuu uauuaggagg auguagggau 540
uaucacacag aagaagaacc guaaguggaa caccuaauuu ccuuucuuuc gaguaaauuu 600
ugaauccuac uucucuaaug cacaccuaca agagaagaga guacagcaac cucaaagccu 660
cuuccucaaa aacuugaaau uacaauaguc ucuuucaagg cacugucuua guuguggcuu 720
uugaguccau cucuugggau guucccagac acagaguuuc augcaguugu ggugcccaau 780
aaaacugcug cacaugugau gcacaaugag uuuccaccau cucuccccau uucaagcuga 840
agcagauuug guggaagcca cuaugcaugg uucuuaaauu agaaacccuu aauguggacu 900
ugcaaagcuu uauuauucug cugccucuuc uuucacaaua gaguuugaag cuguauuuag 960
ccaggaauua cuguguagug uauaacuuuu gauuuaaagu uacagaaaac uacucaggcu 1020
aguuaaugca aaagaguuua cugaguuaug uaaaauggga aguc 1064
<210> 6
<211> 1192
<212> RNA
<213> 智人
<400> 6
acaggaucug cuuagugaaa gaaguggcaa gcaauggauc ccaaauauca gcguguagag 60
cuaaaugaug gucacuucau gcccguauug ggauuuggca ccuaugcacc uccagagguu 120
ccgaggaaca gagcuguaga ggucaccaaa uuagcaauag aagcuggcuu ccgccauauu 180
gauucugcuu auuuauacaa uaaugaggag cagguuggac uggccauccg aagcaagauu 240
gcagauggca gugugaagag agaagacaua uucuacacuu caaagcuuug gugcacuuuc 300
uuucaaccac agauggucca accagccuug gaaagcucac ugaaaaaacu ucaacuggac 360
uauguugacc ucuaucuucu ucauuuccca auggcucuca agccagguga gacgccacua 420
ccaaaagaug aaaauggaaa aguaauauuc gacacagugg aucucucugc cacaugggag 480
gucauggaga aguguaagga ugcaggauug gccaagucca ucgggguguc aaacuucaac 540
ugcaggcagc uggagaugau ccucaacaag ccaggacuca aguacaagcc ugucugcaac 600
cagguagaau gucauccuua ccucaaccag agcaaacugc uggauuucug caagucaaaa 660
gacauuguuc ugguugccca cagugcucug ggaacccaac gacauaaacu auggguggac 720
ccaaacuccc caguucuuuu ggaggaccca guucuuugug ccuuagcaaa gaaacacaaa 780
cgaaccccag cccugauugc ccugcgcuac cagcugcagc gugggguugu gguccuggcc 840
aagagcuaca augagcagcg gaucagagag aacauccagg uuuuugaauu ccaguugaca 900
ucagaggaua ugaaaguucu agauggucua aacagaaauu aucgauaugu ugucauggau 960
uuucuuaugg accauccuga uuauccauuu ucagaugaau auuagcauag aggguguugc 1020
acgacaucua gcagaaggcc cugugugugg auggugaugc agaggauguc ucuaugcugg 1080
ugacuggaca cacggccucu gguuaaaucc cuccccuccu gcuuggcaac uucagcuagc 1140
uagauauauc caugguccag aaagcaaaca uaauaaauuu uuaucuugaa gu 1192
<210> 7
<211> 1425
<212> RNA
<213> 智人
<400> 7
ggccccgccu ccuugagugg ugcggagcuu ugugaugcgg agcuucguga ugcacgcccc 60
gaugccugcg gggcuauaaa aacgcucgca agcgccaagu cuccucagga gccgccggca 120
agggggcaac gaggaagcuc uuaagagcgc ggccggaaag caguugaguu acagacaucc 180
ugccaaaaug auuucuucaa agcccagacu ugucguaccc uauggccuca agacucugcu 240
cgagggaauu agcagagcug uucucaaaac caacccauca aacaucaacc aguuugcagc 300
agcuuauuuu caagaacuua cuauguauag agggaauacu acuauggaua uaaaagaucu 360
gguuaaacaa uuucaucaga uuaaaguaga gaaaugguca gaaggaacga caccacagaa 420
gaaauuagaa uguuuaaaag aaccaggaaa aacaucugua gaaucuaaag uaccuaccca 480
gauggaaaaa ucuacagaca cagacgagga caauguaacc agaacagaau auagugacaa 540
aaccacccag uuuccaucag uuuaugcugu gccaggcacu gagcaaacgg aagcaguugg 600
uggucuuucu uccaaaccag ccaccccuaa gacuacuacc ccacccucau caccaccucc 660
aacagcuguc ucaccagagu uugccuacgu cccagcugac ccagcucagc uugcugcuca 720
gauguuagca auggcaacaa gugaacgagg acaaccacca ccauguucua acauguggac 780
ccuuuauugu cuaacugaua agaaucaaca aggucaccca ucaccgccac cugcaccugg 840
gccuuuuccc caagcaaccc ucuauuuacc uaauccuaag gauccacagu uucagcagca 900
uccaccaaaa gucacuuuuc caacuuaugu gaugggcgac accaagaaga ccagugcccc 960
accuuuuauc uuaguaggcu caaauguuca ggaagcacag ggauggaaac cucuuccugg 1020
acaugcuguc guuucacagu cagaugucuu gagauauguu gcaaugcaag ugcccauugc 1080
uguuccugca gaugagaaau accagaaaca uacccuaagu ccccagaaug cuaauccucc 1140
aaguggacaa gaugucccca ggccaaaaag cccuguuuuc cuuucuguug cuuucccagu 1200
agaagaugua gcuaaaaaaa guucaggauc uggugacaaa ugugcucccu uuggaaguua 1260
cgguauugcu ggggagguaa ccgugacuac ugcucacaaa cgucgcaaag cagaaacuga 1320
aaacugaucc agaaaugacg cugucugggu caacauuuca gggaggaguc ugccaccagu 1380
guaauguauc aauaaacuuc augcaagcau aaaaaaaaaa aaaaa 1425
<210> 8
<211> 1765
<212> RNA
<213> 智人
<400> 8
aucugccucc agcacugccc auccuugccc cuuuccacug uccuuggagc uuccugggcc 60
cuucccuggg ccucaggauc ccacccucca ucccgucugc ccugcaggau gccgcagcug 120
agccuguccu ggcugggccu cgggcccgug gcagcauccc cguggcugcu ucugcugcug 180
guugggggcu ccuggcuccu ggcccgcguc cuggccugga ccuacaccuu cuaugacaac 240
ugccgccguc uccaguguuu uccucaaccc ccgaaacaga acugguuuug gggacaccag 300
ggccugguca cucccacgga agagggcaug aagacauuga cccagcuggu gaccacauau 360
ccccagggcu uuaaguugug gcuggguccu accuuccccc uccucauuuu augccacccu 420
gacaucaucc ggccuaucac cagugccuca gcugcugucg cacccaagga uaugauuuuc 480
uauggcuucc ugaagcccug gcugggggau gggcuccugc ugaguggugg ugacaagugg 540
agccgccacc gucggauguu gacgccugcc uuccauuuca acaucuugaa gccuuauaug 600
aagauuuuca acaagagugu gaacaucaug cacgacaagu ggcagcgccu ggccucagag 660
ggcagcgcca gacuggacau guuugaacac aucagccuca ugaccuugga cagucugcag 720
aaaugugucu ucagcuuuga aagcaauugu caggagaagc ccagugaaua uauugccgcc 780
aucuuggagc ucagugccuu uguagaaaag agaaaccagc agauucucuu gcacacggac 840
uuccuguauu aucucacucc ugaugggcag cgcuuccgca gggccugcca ccuggugcac 900
gacuucacag augccgucau ccaggagcgg cgccgcaccc uccccacuca ggguauugau 960
gauuuccuca agaacaaggc aaaguccaag acuuuagacu ucauugaugu gcuucugcug 1020
agcaaggaug aagaugggaa ggaauugucu gaugaggaca uaagagcaga agcugacacc 1080
uucauguuug agggccauga cacuacagcc aguggucucu ccuggguccu auaccaccuu 1140
gcaaagcacc cagaauacca ggaacagugc cggcaagaag ugcaagagcu ucugaaggac 1200
cgugaaccua uagagauuga augggacgac cuggcccagc ugcccuuccu gaccaugugc 1260
auuaaggaga gccugcgguu gcauccccca gucccgguca ucucccgaug uugcacgcag 1320
gacuuugugc ucccagacgg ccgcgucauc cccaaaggca uugucugccu uaucaauauu 1380
aucgggaucc auuacaaccc aacugugugg ccagacccug aggucuacga ccccuuccgu 1440
uucaaccaag agaacaucaa ggagagguca ccucuggcuu uuauucccuu cucggcaggg 1500
cccagaaacu gcaucgggca ggcguucgcc auggcugaga ugaagguggu ccuggcgcuc 1560
acguugcugc acuuccgcau ccugccgacc cacauugaac cccgcaggaa acccgagcug 1620
auauugcgcg cagagggugg acuuuggcug cggguggagc cccugggugc gaacucacag 1680
ugacugcccu acccacccac ccaccuuugu agagucccag aaacaaaacu augcugacaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaa 1765
<210> 9
<211> 7277
<212> RNA
<213> 智人
<400> 9
aggucagggg gcuggggacg cgcgugggga ucgcuacccg gcucggccac ugcugggcgg 60
acaccugggc gcgccgccgc gggaggagcc cggacucggg ccgaggcugc ccaggcaaug 120
cguucacucg gcgcaaacau ggcugcggcc cugcgcgccg cgggcguccu gcuccgcgau 180
ccgcuggcau ccagcagcug gagggucugu cagccaugga gguggaaguc aggugcagcu 240
gcagcggccg ucaccacaga aacagcccag caugcccagg gugcaaaacc ucaaguucaa 300
ccgcagaaga ggaagccgaa aacuggaaua uuaaugcuaa acaugggagg cccugaaacu 360
cuuggagaug uucacgacuu ccuucugaga cucuucuugg accgagaccu caugacacuu 420
ccuauucaga auaagcuggc accauucauc gccaaacgcc gaacccccaa gauucaagag 480
caguaccgca ggauuggagg cggauccccc aucaagauau ggacuuccaa gcagggagag 540
ggcaugguga agcugcugga ugaauugucc cccaacacag ccccucacaa auacuauauu 600
ggauuucggu acguccaucc uuuaacagaa gaagcaauug aagagaugga gagagauggc 660
cuagaaaggg cuauugcuuu cacacaguau ccacaguaca gcugcuccac cacaggcagc 720
agcuuaaaug ccauuuacag auacuauaau caagugggac ggaagcccac gaugaagugg 780
agcacuauug acagguggcc cacacaucac cuccucaucc agugcuuugc agaucauauu 840
cuaaaggaac uggaccauuu uccacuugag aagagaagcg agguggucau ucuguuuucu 900
gcucacucac ugcccauguc uguggucaac agaggcgacc cauauccuca ggagguaagc 960
gccacugucc aaaaagucau ggaaaggcug gaguacugca accccuaccg acuggugugg 1020
caauccaagg uugguccaau gcccugguug gguccucaaa cagacgaauc uaucaaaggg 1080
cuuugugaga gggggaggaa gaauauccuc uugguuccga uagcauuuac cagugaccau 1140
auugaaacgc uguaugagcu ggacaucgag uacucucaag uuuuagccaa ggagugugga 1200
guugaaaaca ucagaagagc ugagucucuu aauggaaauc cauuguucuc uaaggcccug 1260
gccgacuugg ugcauucaca cauccaguca aacgagcugu guuccaagca gcugacccug 1320
agcuguccgc ucugugucaa uccugucugc agggagacua aauccuucuu caccagccag 1380
cagcugugac ccccgccggu ggaccccgug gcguuaggca aaugcccaac cuccagauac 1440
cuccgaugug gagagggugu uauuuagaga ucaaggaagg aagucauccu uccuugauau 1500
auauacagcc uuuggguaca aauugugugg uuucuugagg auuggacucu ugauggauuu 1560
cuauuuuuau auaacuauac aguaagcauu uguauuuucu cucucuaggu auaaguuacu 1620
aguuuggaau guccaucagg accuuuaaua aaugaguuaa aaauuugucu uaugagacac 1680
accuauuuaa guacagauuu uggcuuuauu gcccaaaacc cuccugaaag gguacggaga 1740
guccccucug ugggcuggca gugugaauga gaucuguuua gucucgugca uauaguugcu 1800
guuuuuuaaa ugaacacagu ugaguauuug aagugaauuu gaaaaagaaa uguuacuuaa 1860
ucuuucccua agcccauggg uuacagaaug cuagggaggc aauuugguua ccugcaaugg 1920
cugcuuuugc cagcgaggcc accauucauu ggucaucuug guauuugugu gugaaucuca 1980
cuuuccucaa uguaaaaagg aaucaaguau ggauuucaga ggugcucuua gauuccccau 2040
acacccaagg guaauaaacg uguacaagua caguguucau gauacgugcc uuggugggag 2100
uccguggugc cacagggaag gggcucccac ugcuucuggu cuccagggac agugcugcug 2160
gaaaggcuag ugaugagcuu cacccuggag cuccucccgg gaccuugcaa gccucuccau 2220
ccagcaucuu cucuaucuua guugaaugcc uucuuucuga acauuuguuu uaagaauuau 2280
uuuauaaagu caacaauacu uugcuugaau ucuuucuuaa uuuacgauuu uuuauuauaa 2340
aaauguauag ugauacaaug ggacauguga agaauacaga aaaguaacca cuuuaaugca 2400
auaacuguua ucauaauauu guauuucgug guaguccuuu ccuguagaua uuuuuaaugc 2460
cauuuaaugc cauugucacc uuggauuuau gagugaaaag uguuucuaaa aauauagaaa 2520
uaaugucaga ucagagucug aucuucuaug uuuguauuua aauggauuaa aagauccccg 2580
gugguuccau gaagaauuug uaaagaucac uuucucuuuc cuccaagccc ugaaacuuug 2640
uucuucaaaa gagcguuucu uuuuuuuuuu uuuuuuagcc aguuuauaaa guggaaguau 2700
uaggagauuc auaaaucuuc uauauugaga auuggcuaug uuaauaaaua uuacaacauc 2760
auuaagguuu uagcuaaguu ugauucaugc ugucuguuaa aucaaaacug aucuaaauca 2820
gaauuauuaa augugaggag cuuuuuuaau acaggaaaag aaacauguca uccacuugag 2880
uuaauaguuu uccuacguug augacagccc ucaugaguag cauccacauu uuuaaaauuu 2940
caaauugguu uuucuacuag uagauugugu uucuagagaa agauacaagg cauaggugau 3000
uguuuaggau uuuccucuag ccuuugccau uaccuuuuug gggaugaggu ucacaguaga 3060
cuuugaguga ccgucccacc gugaagugaa uucucugagc ugguggugug gugcuggaag 3120
gaagguuauu uuuggagcca cucucucccc uuaaggauau uucccaaggg ccugcuucaa 3180
uucuuugaug acuuuagagg ugaaaaaaua uuuuuaugga gaugaugcag aaaacuccaa 3240
uucaggagcc cuugcgagua uaucugaagc acuuauuugc uaaggaaacc ugaauugaua 3300
gcaguacugu gcugucugga auaauguccu ugauacugag uugggaccag acuggcuuuu 3360
auagugacag gcaaagagga auuuauugag aucacugcuc auggcauuug uugcuguaag 3420
aaguguugcc uuugauuguu acuaaccacg gauggguaac ggucauacau uaggcuagug 3480
uuugguagga caaaaucuuu uuagagcuuu gagaauuguc auccuguugg ucaacuuuga 3540
aauacaaaug uuugcccugg uaauuagcaa ugaacugcug gcaguuucuu cagcugugua 3600
uauacggauc uggcuuuuaa uugaugaauc aacuucuaca gaaacuuuug cagggacagu 3660
guugaugagg caguuuagcu ugccagggug augauaaagc ccaggucccu gcauguauag 3720
ugcucuucua aagaauaugc auucuugaac uacuuaacuu uuuaaaaauc acaauaaauu 3780
uuugcacuca aaauuugcuu cguaucagga gaaaugaacu cauuguuuug uuuuguuuuu 3840
uuuuuuuuuu aagauggagu cuugcuaugu cacccaggcu ggagggcagu ggugcgaucu 3900
cggcucacug cuacuuccac cuccugggcu caagugaucc ucccaccuca gccuccaagu 3960
agcugggacu acaggagugc uucaccacgc ugggcuacuu uuuuauauuu uuuguagaga 4020
ugggguuuug ccauguuguc caggcugguc uugaacuccu gggcucaagg gauucuccug 4080
ccucagucuc ccaaagugcu gggauuacaa ggaugagccu cugcaccugg cccugaacuc 4140
auuauuaaaa gcccuuuaaa ugugaggcug ggugccgugc cuuacaugug uaauuccaau 4200
acuuuggaag gccaagguug gaggauugcu ugaucccaag aguucaagac cagccugggc 4260
aacauaggga gacccugacu cuacaaaaaa uaaaguaaaa auuaacuggg uguaguguca 4320
caugccugua guuccagcua cuuaggaggc ugagguggua ggauugcuug agcccagcag 4380
uuugagguug cagugaggug ugauugcacc acugcacucc agccugggug acagaggaag 4440
acccuguccc aaaaccaaaa aaaagaaaag aaauacagag acugggucau uuacaaagga 4500
aagagguuua auugacucgg uucggcuuuc ugaggaagcc uuaggaaauu gacaaucaug 4560
gcagaagggg aagcagaugu cuuacauggc agugagugag agcaagcaaa ggggaagagc 4620
ccccuuauaa aaccaucaga ucucgugaga acuggcuguc acaagaacag caugggggaa 4680
cugucuccau guuccaaucu ccuuccacca ggucccuccc ucaacacgug gggauuaugg 4740
ggauuacaau uugaaaugag auuugggugg ggaacagagc caaaucauau cauuccaccc 4800
uggccccucc caaaucacau guccuuuuua cauuucaaaa ccaaucaugc cuucacaaca 4860
guccuccaga gucuuaacuc auuccagcau uaacccaaaa guccaaguuc aaagucucau 4920
ccaagacaag gcaagucccu ucugccugug agccuguaac auuaaaagca aguuagugac 4980
uuccaagaua caaugggagu acagacauug guaaauguuc ccauuccaaa ugggagaaau 5040
uggccaaaac acaggggcua caggccccau gcaccacugc acuccacugu gcaagucuga 5100
aacccggcag ggcacuccuu aaauuuuuuu uuuuuuuuuu ugagauggag ucucgcucug 5160
uugcccaagc uggaguacag uggcacgauc ucggcucacu gcaaccuccg ccucuugggu 5220
ucaaaggauc auccugccuc agccuccgga guagcugggc uacucaggcg ugugccacca 5280
ugcccggcua auuuuuguau uuuuaguaga gauggggccu gaccauguug gucaggcugg 5340
ucucuaauuc cugaccucgu gauccacccg ccucagccuc ugaaaguguu gggauuacag 5400
gcgugagcca ccauccccgg ccuacucaau aaaucuuaaa guuccggaau aaucuccuuu 5460
gacuccaugu cucaccucca ggucacgcug augcaagagg ugggcuaauc uuucuaguaa 5520
auuccauauu uaauucaaga aaccauaacu uaaggcaugu aaaagagauc cuuugcucaa 5580
ugugaugcca uugugcuuau ccaaaguaua uuauuauuac ccacaaaggg ugagagauua 5640
ggcugcagcc auaccccaag uggagugagc agcaagaccu gcccccugcu cagaguguag 5700
augacugggg gcaccugcau uccuaggggc ucugccguau gagcuccugu cgaugcggca 5760
aaggaccacc uugcccaacg acagcgggaa ggcagaauuu aaagcuggca gcuguaagcg 5820
aacgucuaug ugugcgcacg ggggcacgug aaggcacagg ugcaucagcc aagaaccucc 5880
aauucaccuc uuaaccuucu caccucaccu gaaaccccuu cugccagaau ccugaaggug 5940
gcccaggaac agggcuccua acguuaggug gaaaugggaa auucauugag augucacaag 6000
cuggaauaag aaaauucuga gcucacccgg aaacuaaugc ccuaaauuaa gauuauucag 6060
cuucucaauu uuuaauagca aaauggagac cugagugugg auaacuuuua guaucugugg 6120
gggauccugg aaccaauucc cugccaauau agaaggacaa cugucuacag uacuugaagu 6180
auuauuaacu acauucgcca ugcuguaugu uagaucccca gaacauauuu auccugcaua 6240
ucuaaaauuu ugaucauuuu acaaacuuuc uauuuuuuuu gucaauuuuc uccagcuaga 6300
cacuugugca auacggcuau uaucugaucu uugccuuaaa uguugugcuu cuuuuccaua 6360
ugcacguauu uugcaaaaua uaaagugugu agagcuauau agcacucagc caaguggugg 6420
guaccugcag gugcuucaga gaaguaaauu gaugcugcua auauuuguug aauggcacga 6480
auaugaugag caauagcagg uggugcccuu cagccagacc aucgcuccgu gcgucugaug 6540
caucuugcca aagaguaguu cugggaggug guugccucua gagaacacau uccuccuauu 6600
cugggguccc gugagagaaa gaaaugcuuu ugcuuuugau gugggacucu uacuaagccu 6660
uucuucagag aaaaggaagu gaaaaaugca ccccaugaua aucaguuucu uacaacauac 6720
ugugauagua ccggcuucgu uguuuuuagc uggaaucauu agcuuccauu uuuagaauaa 6780
cagcuauugg cuaaauuagg cuacaguagg ccauuaagau ggauguugga auuaaaaaca 6840
uuuuuggaaa aaagccugcu uugagccuuu guuauaagcc cuuggguaga gaucuggguc 6900
cuguuucuga uuucuuguga gccuucacuc ugacaguuuu guuuccagaa acacacucuu 6960
agccugcucc ugaaauggga acagacaggc caacuucccc ucuccagucu ccccugcggg 7020
ucaaagcuuu acuuuccugu cauguuaaga aagaauagau uuaaccuuga uaauccaugu 7080
aguauucugu auuuuuaccu uuuccuuauc ugaaaaaaag uguauauaug gcauggaauu 7140
gauugcacag gcacauggca uguuggcuug ugaaccaauu guuaaaauuu caaguuaauc 7200
auuaaaauaa uaucuuucaa auuaaguuau auuaaaaaca aagguaacau ucuaaauuca 7260
aaaaaaaaaa aaaaaaa 7277
<210> 10
<211> 889
<212> RNA
<213> 智人
<400> 10
gcaguucggc ggucccgcgg gucugucucu ugcuucaaca guguuuggac ggaacagauc 60
cggggacucu cuuccagccu ccgaccgccc uccgauuucc ucuccgcuug caaccuccgg 120
gaccaucuuc ucggccaucu ccugcuucug ggaccugcca gcaccguuuu ugugguuagc 180
uccuucuugc caaccaacca ugagcuccca gauucgucag aauuauucca ccgacgugga 240
ggcagccguc aacagccugg ucaauuugua ccugcaggcc uccuacaccu accucucucu 300
gggcuucuau uucgaccgcg augauguggc ucuggaaggc gugagccacu ucuuccgcga 360
auuggccgag gagaagcgcg agggcuacga gcgucuccug aagaugcaaa accagcgugg 420
cggccgcgcu cucuuccagg acaucaagaa gccagcugaa gaugaguggg guaaaacccc 480
agacgccaug aaagcugcca uggcccugga gaaaaagcug aaccaggccc uuuuggaucu 540
ucaugcccug gguucugccc gcacggaccc ccaucucugu gacuuccugg agacucacuu 600
ccuagaugag gaagugaagc uuaucaagaa gaugggugac caccugacca accuccacag 660
gcuggguggc ccggaggcug ggcugggcga guaucucuuc gaaaggcuca cucucaagca 720
cgacuaagag ccuucugagc ccagcgacuu cugaagggcc ccuugcaaag uaauagggcu 780
ucugccuaag ccucucccuc cagccaauag gcagcuuucu uaacuauccu aacaagccuu 840
ggaccaaaug gaaauaaagc uuuuugaugc aaaaaaaaaa aaaaaaaaa 889
<210> 11
<211> 5000
<212> RNA
<213> 智人
<400> 11
acccgucgcc acgcccgccg caggccaagg gccagucacu ugcgggccgg cgucccgcag 60
cccauucgcg ccccgccccu gccccgccgc gggaugagua acgguuacga agcacuuucu 120
cggcuacgau uucugcuuag ucauugucuu ccaggaaaca gcucccucag uuuggaauca 180
gcucucccgc ugcggccgca guagccggag ccggagccgc agccaccggu gccuuccuuu 240
cccgccgccg cccagccgcc guccggccuc ccucgggccc gagcgcagac caggcuccag 300
ccgcgcggcg ccggcagccu cgcgcucccu cucgggucuc ucucgggccu cgggcaccgc 360
guccuguggg gcggccgccu gccugcccgc ccgcccgcag ccccuucgcu gcgcggcccc 420
ugggcggccg cugccauggg caccgacagc cgcgcggcca aggcgcuccu ggcgcgggcc 480
cgcacccugc accugcagac ggggaaccug cugaacuggg gccgccugcg gaagaagugc 540
ccguccacgc acagcgagga ggaguuucca gaugucuugg aaugcacugu aucucaugca 600
guagaaaaga uaaauccuga ugaaagagaa gaaaugaaag uuucugcaaa acuguucauu 660
guagaaucaa acucuucauc aucaacuaga agugcaguug acauggccug uucaguccuu 720
ggaguugcac agcuggauuc ugugaucauu gcuucaccuc cuauugaaga uggaguuaau 780
cuuuccuugg agcauuuaca gccuuacugg gaggaauuag aaaacuuagu ucagagcaaa 840
aagauuguug ccauagguac cucugaucua gacaaaacac aguuggaaca gcuguaucag 900
ugggcacagg uaaaaccaaa uaguaaccaa guuaaucuug ccuccugcug ugugaugcca 960
ccagauuuga cugcauuugc uaaacaauuu gacauacagc uguugacuca caaugaucca 1020
aaagaacugc uuucugaagc aaguuuccaa gaagcucuuc aggaaagcau uccugacauu 1080
caagcgcacg agugggugcc gcuguggcua cugcgguauu cggucauugu gaaaaguaga 1140
ggaauuauca aaucaaaagg cuacauuuua caagcuaaaa gaagggguuc uuaacugacu 1200
uaggagcaua acuuaccugu aauuuccuuc aauaugagag aaaauugaga uguguaaaaa 1260
ucuaguuacu gccuguaaau ggugucauug aggcagauau ucuuucguca uauuugacag 1320
uauguugucu gucaaguuuu aaauacuuau cuugccucca uaucaaucca uucucaugaa 1380
ccucuguauu gcuuuccuua aacuauuguu uucuaauuga aauugucuau aaagaaaaua 1440
cuugcaauau auuuuuccuu uauuuuuaug acuaauauaa aucaagaaaa uuuguuguua 1500
gauauauuuu ggccuaggua ucaggguaau guauauacau auuuuuuauu uccaaaaaaa 1560
auucauuaau ugcuucuuaa cucuuauuau aaccaagcaa uuuaauuaca auuguuaaaa 1620
cugaaauacu ggaagaagau auuuuuccug ucauugauga gauauaucag aguaacugga 1680
guagcuggga uuuacuagua guguaaauaa aauucacucu ucaauacaug aauggaaacu 1740
uaaauuuuuu uuuauguguc cuugcuuaua guuuagcugu aauaauuuaa ccuuguauuc 1800
uugugccaua uucugucuuu uuauuacuua uaaagacaaa ccaaaguaaa ucugaaagga 1860
gacuagaagc uuugaaauua uuguuugggg guuuuauaaa agcaacuacu gucaccucca 1920
uccagauucu uuuaaauuau ugauccaucc auaguauaua uugcuacuca uucaagaauc 1980
cucaauaagu auugaguauu uaccauaugu ugggauacug ugggcucugg agagaggagg 2040
gggcaauaga gcuaggaauu aagaaucagu ugaguaaaau guguaauauu uauuccccau 2100
uaauaacuga cuaggaagga cuaaaagcca gaaaggggau gaaaaaaaaa uccuuaauuc 2160
agggccgaca uuaucuacuu aaacaacuuu gagauauggu cuuaauuauu uuaaagcaga 2220
auaauauaau ugaaaguuua uagcuaaaag agacuauaua ggucauuuag uauaauucuu 2280
cauuaguuua cgaaccacaa aauugcaaau aaauaagcua ugaacuuuga uguacacuau 2340
aaaucuccuu aauucuauaa auuugugucu guaaccugaa uaguuugaaa acuucuuuaa 2400
aaaucucuug uauuucaucc gggcgcagug gcucacaccu guaaucccag cacuuuggga 2460
ggccgaggug ggcagaucac gaggucagga guuugagacc agccugacca acaugguaaa 2520
accccaucuc uacuaaaaua caaaaauugg cugggcgugg uggcacucgc cuguaaucuc 2580
agcuacuugg gaggcugagg caggagaauc gcuugaaccc gggaggcgga gguuacagug 2640
agccgagauc acaucacugc acuccagccu gggcgacaga gcgagacucc aucucaaaaa 2700
aaaaaaaaaa cucuuguauc ucaauauuuu uaaaccacag gccuaaauaa aacuaauuuu 2760
gcucaaguuu ucucaaccua gggaaaaaga acuaugguuc cauauucaaa auaaauauua 2820
uagacccuuu uccuaaguag gauuuugugg uuuacugauu ggguaauuug aucauuaaaa 2880
uuaugugaaa ucugcccggg cacaccucau gccuguaauc ccagcacucu gggaggccaa 2940
ggcagaugau caccugaggu caggaguucu agaccagccu ggcuaacaug gugaaacccu 3000
guaucugcua aaaauacaaa aauuagccag gcgugguggc gggcuccugu aaucccagcu 3060
acuuuggagg cgaggcacga gaaucgcuug aaccugggag gcggaguuug cagugagccg 3120
agaucacgcc auugcacucc agccugggcg acagagcgag acugcgucuc aaaaaaaaaa 3180
aaaaaagaaa aauuauguga aaucauguga uuugccuggg aaaacuuguu uagauauuga 3240
gcuacuuaug ccuucuagcc uuuauauuaa uuguauguaa uguuauuaaa uauauauaua 3300
guucaucuuu acauuuggaa augcccaaca uuuuuuucau auaaguccuu aaacaagcgu 3360
ucauuuuauu uuaaaucuau acagugaacu ggccaagaua uuuuaagagg gaacuuuaau 3420
aucccauuua uuguuuuuau aacccuggac uuauaaaaau ggguuguuug aaggguuauu 3480
uugaaagugg gggaaaaaaa aacuuaguug cuaauguauc uaaacuucag cagagcuuuu 3540
uggugaucuc cuaccugcac ccucaacucu ugacaaagaa gcaagacuau agauucauuu 3600
ucugaagggg aucauguaug gaauuuuuug augaguuuuu acuuuuaccu cucuacucuu 3660
gauuuucuau uauugaauac ucuuuuaaaa cacugauuuu uaaggcuuua uauauguuuu 3720
ccaggcugau guucacaucu uuuuuucaug aacuaucaga auauagugaa cacuuuucaa 3780
auauuuaagg acuuaauguu uaaaaagcca uaaaauagag agugguaaua cuaccaaaua 3840
auuacuuaaa acugaaagcu aaguuaucaa uaguuuauau aagagauguu uucugaggag 3900
augugcaucc agugagacca agguagaaag uuuauauaau uguuuuuuuu ccaguaaaua 3960
ugaaaaaaaa agcuguagcu uguuuauuac auguccaaaa uacaguggag ccuuacuuua 4020
acacaaugua cuguaacuug gaauuuguuc uguuaugagu cuaucuugaa uucccaucca 4080
ugaaacugua gucaccaaaa gcaacaagua uuuucacaug auguaaaaga ccauacuaug 4140
auggccauug cuagaaauug aaucacaaau aauagcuaau aauuuuucau uuuucaaaaa 4200
agaucauuug gauagcagcu auguauaaaa uggaaaauaa aaaauuauuc uauuuugcau 4260
gaauaguuca gacuuuccca uaccacagcc aagcaguaac uaaaauuagg aucuuaauuu 4320
ucaaugauaa aaggucuaag guucauuuaa uuaugcuccu uuaacacugu cuuucuagau 4380
uuuucaccca guauuuucaa aauuugggaa uguaaacaau ugauauauuu auuguauguu 4440
ggcuagcagu ucauccuucu gcaaaauaug cauucagaga aaugugaagc uuguuuuaau 4500
gaagacuuaa accauuugug ucauuugugu uuucauauuc aaauacacca aauuaaaauu 4560
cugaaccuau auuuuucauc auuaacuucc uaauauacca gaacauauac cuuuuucaug 4620
uaaaguuggc aaugggauau ggcaguuuua uuuuugaaaa auauguaaca ugacuuuaau 4680
auuuuuauag uuuucagaau uagaaacaua ggaagggaaa auguuuuaau uagauaaguc 4740
aacuuuuuau gugucuguag ugguguacua uaauagcaaa uuauaaagca uuauuaaaug 4800
uuuauaauaa uuuuuaauau uaccuacauu augaauuuaa cuaaaauaaa gugugaguug 4860
uauauuuuuu aauuggguug uuucaauagc uggaagcauc cugaagcauu auauugauuu 4920
uugaacuauu ugaacucaaa cugaguauga uuugaaaaua aauuaauaau uuaaaaacau 4980
ccaaaaaaaa aaaaaaaaaa 5000
<210> 12
<211> 2928
<212> RNA
<213> 智人
<400> 12
uccuccuggg ucuugccuag cggcgggcgc augcuuaguc accgugaggc ugcgcuugcc 60
cggggcccgc gccccccuac cccggggacc gcccccgggc cgcccgcccc acuuggcgcg 120
ccacuuccgc gugcauggcc cugcugcccc gagcccugag cgccggcgcg ggaccgagcu 180
ggcggcgggc ggcgcgcgcc uuccgaggcu uccugcugcu ucugcccgag cccgcggccc 240
ucacgcgcgc ccucucccgu gccauggccu gcaggcagga gccgcagccg cagggcccgc 300
cgcccgcugc uggcgccgug gccuccuaug acuaccuggu gaucgggggc ggcucgggcg 360
ggcuggccag cgcgcgcagg gcggccgagc ugggugccag ggccgccgug guggagagcc 420
acaagcuggg uggcacuugc gugaauguug gauguguacc caaaaaggua auguggaaca 480
cagcugucca cucugaauuc augcaugauc augcugauua uggcuuucca aguugugagg 540
guaaauucaa uuggcguguu auuaaggaaa agcgggaugc cuaugugagc cgccugaaug 600
ccaucuauca aaacaaucuc accaaguccc auauagaaau cauccguggc caugcagccu 660
ucacgaguga ucccaagccc acaauagagg ucagugggaa aaaguacacc gccccacaca 720
uccugaucgc cacagguggu augcccucca ccccucauga gagccagauc cccggugcca 780
gcuuaggaau aaccagcgau ggauuuuuuc agcuggaaga auugcccggc cgcagcguca 840
uuguuggugc agguuacauu gcuguggaga uggcagggau ccugucagcc cuggguucua 900
agacaucacu gaugauacgg caugauaagg ggauucaaac cgaugacaag ggucauauca 960
ucguagacga auuccagaau accaacguca aaggcaucua ugcaguuggg gauguaugug 1020
gaaaagcucu ucuuacucca guugcaauag cugcuggccg aaaacuugcc caucgacuuu 1080
uugaauauaa ggaagauucc aaauuagauu auaacaacau cccaacugug gucuucagcc 1140
accccccuau ugggacagug ggacucacgg aagaugaagc cauucauaaa uauggaauag 1200
aaaaugugaa gaccuauuca acgagcuuua ccccgaugua ucacgcaguu accaaaagga 1260
aaacaaaaug ugugaugaaa auggucugug cuaacaagga agaaaaggug guugggaucc 1320
auaugcaggg acuugggugu gaugaaaugc ugcaggguuu ugcuguugca gugaagaugg 1380
gagcaacgaa ggcagacuuu gacaacacag ucgccauuca cccuaccucu ucagaagagc 1440
uggucacacu ucguugagaa ccaggagaca cguguggcgg gcagugggac ccauagaucu 1500
ucugaaauga aacaaauaau cacauugacu uacuguuuga guuuuaugua uuucuuuauu 1560
uuaaucagga ucuucugaua guggaaauuu uuaguacaua auagaacuua uuuauggagu 1620
uagaaauuug uaguguuauc caggauugau uuucauuuga ucacaucuca caguaauuaa 1680
uauuuucaag uuuuuuuuuu auuaacagcu cugugcuagu uuuuuuuuuc uguuuuagcc 1740
ucaucccaaa uauaaagcuu ugugaaguac aauuaacuua auguacuuga augaauagaa 1800
cuugcuacuu uuuuuuuuuu uuuuuuugag acagaguuuu gcucucauug cccaggcugg 1860
agugcggugg ugcuauuuca gcucaccaca accucugccu ccuggguuca agugauucuc 1920
cugccuuagc cucccgaaua gcuggaauua caggcacgca ccaccaugcc ugacuaauuu 1980
uguauuuuua guagacaugg gguuucucca uguuggucag gcuggucuca aacucccacc 2040
uucaggugau ccgcccaccu cggccuccug aggugcugag auuacaggcg ugagccacug 2100
ugccagcuug cuaauuuuca cagaaguuga uggcaauucu ucacauguaa acagugccag 2160
ugcacagaac cuuuauauau uuuuugaagc caguacugug cucugcauau aacaaagcug 2220
cuucaaggau gagaccuuuu ucuaaaagca uguaauguga gaagccggcc ugccuuauuu 2280
ucuuuuuucu uuuuuaauga uuaaaaauag uuuguggcaa ggcacggugg cucaggccug 2340
uaauucuagc acuuugggag gccgaggcag gaggauuacu ugagccuaca aguuugaggc 2400
cagcaugcac agcauagcaa gacugcaucu cuacagagag uaaaaaaaau uacccgagug 2460
uggugaugug caucuguaau cucagcuacu ugggaggcug aggugagagg aucacuugag 2520
cuugggugag gugaggcugc agugaguccu gaucaugcug cugcacucaa ucuuggacaa 2580
cagagcaaga cccugucuca aaaaaaaaaa aaaaaaauau auauauauau auauauuauu 2640
uuuaugaggu gaagugcauc aaacuuggga aagauuugag gaggcuggga accuccugga 2700
aaaccacucc uugaagaaag auaugagaga cauuuagaag ugauuccugc uuucagaagg 2760
agguggauuc aaauacauca aaagucccuu ccucugcuaa guguuuauag uucaaugaau 2820
aauuucaaua uuuguaugug uucuugucau uuuauuuuuu ucugaaaaac uuccaaaaau 2880
uugaaaauaa aauuacagcc uuuucuucuu auaaaaaaaa aaaaaaaa 2928
<210> 13
<211> 1774
<212> RNA
<213> 智人
<400> 13
gcaguucuuu gaauuucuca cccuaagauc uggccuguac auuuucaagg aauucuugag 60
agguucuugg agagauucug ggagccaaac acuccauugg gauccuagcu ggaauauaaa 120
gaauggcuua ucaguggaga ccaucgacag uugagaaaag aagaagccca aaaaguacaa 180
gaaugaaaau cgagaguuuu uagagaacaa cuuguaaugg agccuucauc ucuugagcug 240
ccggcugaca cagugcagcg cauugcggcu gaacucaaau gccacccaac ggaugagagg 300
guggcucucc accuagauga ggaagauaag cugaggcacu ucagggagug cuuuuauauu 360
cccaaaauac aggaucugcc uccaguugau uuaucauuag ugaauaaaga ugaaaaugcc 420
aucuauuucu ugggaaauuc ucuuggccuu caaccaaaaa ugguuaaaac auaucuugaa 480
gaagaacuag auaagugggc caaaauagca gccuaugguc augaaguggg gaagcguccu 540
uggauuacag gagaugagag uauuguaggc cuuaugaagg acauuguagg agccaaugag 600
aaagaaauag cccuaaugaa ugcuuugacu guaaauuuac aucuucuaau guuaucauuu 660
uuuaagccua cgccaaaacg auauaaaauu cuucuagaag ccaaagccuu cccuucugau 720
cauuaugcua uugagucaca acuacaacuu cacggacuua acauugaaga aaguaugcgg 780
augauaaagc caagagaggg ggaagaaacc uuaagaauag aggauauccu ugaaguaauu 840
gagaaggaag gagacucaau ugcagugauc cuguucagug gggugcauuu uuacacugga 900
cagcacuuua auauuccugc caucacaaaa gcuggacaag cgaaggguug uuauguuggc 960
uuugaucuag cacaugcagu uggaaauguu gaacucuacu uacaugacug gggaguugau 1020
uuugccugcu gguguuccua caaguauuua aaugcaggag caggaggaau ugcuggugcc 1080
uucauucaug aaaagcaugc ccauacgauu aaaccugcau uagugggaug guuuggccau 1140
gaacucagca ccagauuuaa gauggauaac aaacugcagu uaaucccugg ggucugugga 1200
uuccgaauuu caaauccucc cauuuuguug gucuguuccu ugcaugcuag uuuagagauc 1260
uuuaagcaag cgacaaugaa ggcauugcgg aaaaaaucug uuuugcuaac uggcuaucug 1320
gaauaccuga ucaagcauaa cuauggcaaa gauaaagcag caaccaagaa accaguugug 1380
aacauaauua cuccgucuca uguagaggag cgggggugcc agcuaacaau aacauuuucu 1440
guuccaaaca aagauguuuu ccaagaacua gaaaaaagag gagugguuug ugacaagcgg 1500
aauccaaaug gcauucgagu ggcuccaguu ccucucuaua auucuuucca ugauguuuau 1560
aaauuuacca aucugcucac uucuauacuu gacucugcag aaacaaaaaa uuagcagugu 1620
uuucuagaac aacuuaagca aauuauacug aaagcugcug ugguuauuuc aguauuauuc 1680
gauuuuuaau uauugaaagu augucaccau ugaccacaug uaacuaacaa uaaauaauau 1740
accuuacaga aaaucugaaa aaaaaaaaaa aaaa 1774
<210> 14
<211> 3519
<212> RNA
<213> 智人
<400> 14
cucacacgcc ggcucggaug aucuccugcc augacucagc gcuucucgca ggcugcccug 60
cuggggacac cggcuucgcu cgggccccuc ccgacgcguc cacccccucu cgccacccac 120
gcccgccccc agccgcuggg ccuuucccag ugcggccgcc gccgccacag cugcagucag 180
caccgucacc ccagcagcau ccgccgccug caccgcgcgu gcggcccgcc ccggccugac 240
cccgccgccg aacccggcgc cagccaugga gcccgaagcc ccccgucgcc gccacaccca 300
ucagcgcggc uaccugcuga cacggaaccc ucaccucaac aaggacuugg ccuuuacccu 360
ggaagagaga cagcaauuga acauucaugg auuguugcca ccuuccuuca acagucagga 420
gauccagguu cuuagaguag uaaaaaauuu cgagcaucug aacucugacu uugacaggua 480
ucuucucuua auggaucucc aagauagaaa ugaaaaacuc uuuuauagag ugcugacauc 540
ugacauugag aaauucaugc cuauuguuua uacucccacu gugggucugg cuugccaaca 600
auauaguuug guguuucgga agccaagagg ucucuuuauu acuauccacg aucgagggca 660
uauugcuuca guucucaaug cauggccaga agaugucauc aaggccauug uggugacuga 720
uggagagcgu auucuuggcu ugggagaccu uggcuguaau ggaaugggca ucccuguggg 780
uaaauuggcu cuauauacag cuugcggagg gaugaauccu caagaauguc ugccugucau 840
ucuggaugug ggaaccgaaa augaggaguu acuuaaagau ccacucuaca uuggacuacg 900
gcagagaaga guaagagguu cugaauauga ugauuuuuug gacgaauuca uggaggcagu 960
uucuuccaag uauggcauga auugccuuau ucaguuugaa gauuuugcca augugaaugc 1020
auuucgucuc cugaacaagu aucgaaacca guauugcaca uucaaugaug auauucaagg 1080
aacagcaucu guugcaguug caggucuccu ugcagcucuu cgaauaacca agaacaaacu 1140
gucugaucaa acaauacuau uccaaggagc uggagaggcu gcccuaggga uugcacaccu 1200
gauugugaug gccuuggaaa aagaagguuu accaaaagag aaagccauca aaaagauaug 1260
gcugguugau ucaaaaggau uaauaguuaa gggacgugcu uccuuaacac aagagaaaga 1320
gaaguuugcc caugaacaug aagaaaugaa gaaccuagaa gccauuguuc aagaaauaaa 1380
accaacugcc cucauaggag uugcugcaau ugguggugca uucucagaac aaauucucaa 1440
agauauggcu gccuucaaug aacggccuau uauuuuugcu uugaguaauc caacuagcaa 1500
agcagaaugu ucugcagagc agugcuacaa aauaaccaag ggacgugcaa uuuuugccag 1560
uggcaguccu uuugauccag ucacucuucc aaauggacag acccuauauc cuggccaagg 1620
caacaauucc uauguguucc cuggaguugc ucuugguguu guggcgugug gauugaggca 1680
gaucacagau aauauuuucc ucacuacugc ugagguuaua gcucagcaag ugucagauaa 1740
acacuuggaa gagggucggc uuuauccucc uuugaauacc auuagagaug uuucucugaa 1800
aauugcagaa aagauuguga aagaugcaua ccaagaaaag acagccacag uuuauccuga 1860
accgcaaaac aaagaagcau uuguccgcuc ccagauguau aguacugauu augaccagau 1920
ucuaccugau uguuauucuu ggccugaaga ggugcagaaa auacagacca aaguugacca 1980
guaggauaau agcaaacauu ucuaacucua uuaaugaggu cuuuaaaccu uucauaauuu 2040
uuaaagguug gaaucuuuua uaaugauuca uaagacacuu agauuaagau uuuacuuuaa 2100
cagucuaaaa auugauagaa gaauaucgau auaaauuggg auaaacauca caugagacaa 2160
uuuugcuuca cuuugccuuc ugguuauuua ugguuucugu cugaauuauu cugccuacgu 2220
ucucuuuaaa agcuguugua cguacuacgg agaaacucau cauuuuuaua caggacacua 2280
augggaagac caaaauuacu aauaaauuga cauaaccaac auuaaaacuc auaauuauuu 2340
uguugaccau uuuguuaaaa ucuacuuuuc aaaaaaaaaa agcuagaaau gaaucuaggc 2400
guaggugaac uuuugcuaag cagaaauaac acuacuuugu ugccuagaga aagauaacuu 2460
cucaaguauu uuuauuccag uccuagauca uauauguucu uuugugcaac ggaauucuaa 2520
caguucuaag agaaagauca cugcuguuua cagcgccuug ugcagccuua gauuuuaaua 2580
uucuuuuguc auuguuacau cucauagagu aaagcucuua uuaccuugau ccugagucag 2640
aaaucccacc ugaaaucacc uuuuuucccc cuugaucaaa caucccaucc uucagcuacc 2700
auacuguugc uacagggauu uuguggacug uggccccugu cccgagguug gcaccuucag 2760
uucagcacag ccugagcagu gagaaggucu gaaaggagag uauauaguua agauccuuga 2820
gaaagggcug ccugaggaac ugaccucuua aagaucucag gaucuuuaag acaacaaguu 2880
agguuccuac uggaguuacc ugccagaaug gccucuuaau uaacucaggu aaugaagagc 2940
uaacuguguu auaaucaucu ugcuuuugcc ugaauuugga gaaaguauua uaauuaaguu 3000
cccaguauca gaaauguccu uacauaagau uaaaauaucu ugaugacuaa uaccauucua 3060
ugagaaagag uaguuauaug cccagacugu auuaauuuac uuuagaaacu aauguuugaa 3120
guaauggaaa aaauuuuaaa uuauaaagcu aaggugcaau aacauuugcu acuuauuuau 3180
agaauuauuu gaagaauuuu guuuuugaag uaaugcuuua aggaguauaa gauauucaag 3240
auaaauuaua cuauaaaaug auuuuauuga aaguugaagg uuacacaaau uguuuuaggu 3300
augagcagaa gagguuaagg uauuucuaaa gguaacauau agucaagagu uuccucaaaa 3360
uaguuauuug gagaagaauc agaaugucug uguauuucuu gucuguuucu auguugucuu 3420
auagcucuga cuaaaugugu uuaccuaugc aaaagauuua uuaaagcaua gaaaagguga 3480
augaauaaaa auauaaaaua auuguccuuu uucuuaaaa 3519
<210> 15
<211> 2917
<212> RNA
<213> 智人
<400> 15
ggcccuuccg gggcugcgcg gcucccccgc cucggugccg gcaaaaaugu gccuagucac 60
ggggccgcuc ucgggggaac ugaggucgcc uucgggcugg gacccggagc cccuucgccg 120
cgccccaaga ccuccuugag ugcgggcugc gacgcgcuca ccccgcuggg ccgucugugg 180
gcgcggcuuu gcgaagucau ccaucucucg gaucacucuc uggcagccuu gagcucucuu 240
gaaagcccag ccccgggacg agggaggagc gccuuaagug cccagcgggc ucagaagccc 300
cgacgugugg cggcugagcc gggccccgcg cacuuucucg gccggggagg gguucgggcu 360
cgggcacccg gaguuggccc cucguaacgc cgcgggaaag ugcgggcgag ggcaguggac 420
ucugaggccg gagucggcgg cacccggggc uucuaguucg gacgcggugc ccccuggugg 480
cgcucaccgc gcgcguggcc uuggcuuccg ugacagcgcu cgguuggccg ucacagcagc 540
ccucgguugg cccuuuccug cuuuauagcg ugcaaaccuc gccgcgccag ggccaaggga 600
cagguuggag cuguugaucu guugcgcaau ugcuauuuuc cccagagcgg cuuugucuuu 660
ggauuuagcg uuucagaauu gcaauuccaa aauguguaag acgggauauu cucuucugug 720
cugucaaggg acauggauuu gauugacaua cuuuggaggc aagauauaga ucuuggagua 780
agucgagaag uauuugacuu cagucagcga cggaaagagu augagcugga aaaacagaaa 840
aaacuugaaa aggaaagaca agaacaacuc caaaaggagc aagagaaagc cuuuuucgcu 900
caguuacaac uagaugaaga gacagguugc ccacauuccc aaaucagaug cuuuguacuu 960
ugaugacugc augcagcuuu uggcgcagac auucccguuu guagaugaca augagguuuc 1020
uucggcuacg uuucagucac uuguuccuga uauucccggu cacaucgaga gcccagucuu 1080
cauugcuacu aaucaggcuc agucaccuga aacuucuguu gcucagguag ccccuguuga 1140
uuuagacggu augcaacagg acauugagca aguuugggag gagcuauuau ccauuccuga 1200
guuacagugu cuuaauauug aaaaugacaa gcugguugag acuaccaugg uuccaagucc 1260
agaagccaaa cugacagaag uugacaauua ucauuuuuac ucaucuauac ccucaaugga 1320
aaaagaagua gguaacugua guccacauuu ucuuaaugcu uuugaggauu ccuucagcag 1380
cauccucucc acagaagacc ccaaccaguu gacagugaac ucauuaaauu cagaugccac 1440
agucaacaca gauuuuggug augaauuuua uucugcuuuc auagcugagc ccaguaucag 1500
caacagcaug cccucaccug cuacuuuaag ccauucacuc ucugaacuuc uaaaugggcc 1560
cauugauguu ucugaucuau cacuuugcaa agcuuucaac caaaaccacc cugaaagcac 1620
agcagaauuc aaugauucug acuccggcau uucacuaaac acaaguccca guguggcauc 1680
accagaacac ucaguggaau cuuccagcua uggagacaca cuacuuggcc ucagugauuc 1740
ugaaguggaa gagcuagaua gugccccugg aagugucaaa cagaaugguc cuaaaacacc 1800
aguacauucu ucuggggaua ugguacaacc cuugucacca ucucaggggc agagcacuca 1860
cgugcaugau gcccaaugug agaacacacc agagaaagaa uugccuguaa guccugguca 1920
ucggaaaacc ccauucacaa aagacaaaca uucaagccgc uuggaggcuc aucucacaag 1980
agaugaacuu agggcaaaag cucuccauau cccauucccu guagaaaaaa ucauuaaccu 2040
cccuguuguu gacuucaacg aaaugauguc caaagagcag uucaaugaag cucaacuugc 2100
auuaauucgg gauauacgua ggagggguaa gaauaaagug gcugcucaga auugcagaaa 2160
aagaaaacug gaaaauauag uagaacuaga gcaagauuua gaucauuuga aagaugaaaa 2220
agaaaaauug cucaaagaaa aaggagaaaa ugacaaaagc cuucaccuac ugaaaaaaca 2280
acucagcacc uuauaucucg aaguuuucag caugcuacgu gaugaagaug gaaaaccuua 2340
uucuccuagu gaauacuccc ugcagcaaac aagagauggc aauguuuucc uuguucccaa 2400
aaguaagaag ccagauguua agaaaaacua gauuuaggag gauuugaccu uuucugagcu 2460
aguuuuuuug uacuauuaua cuaaaagcuc cuacugugau gugaaaugcu cauacuuuau 2520
aaguaauucu augcaaaauc auagccaaaa cuaguauaga aaauaauacg aaacuuuaaa 2580
aagcauugga gugucaguau guugaaucag uaguuucacu uuaacuguaa acaauuucuu 2640
aggacaccau uugggcuagu uucuguguaa guguaaauac uacaaaaacu uauuuauacu 2700
guucuuaugu cauuuguuau auucauagau uuauaugaug auaugacauc uggcuaaaaa 2760
gaaauuauug caaaacuaac cacuauguac uuuuuuauaa auacuguaug gacaaaaaau 2820
ggcauuuuuu auauuaaauu guuuagcucu ggcaaaaaaa aaaaauuuua agagcuggua 2880
cuaauaaagg auuauuauga cuguuaaauu auuaaaa 2917
<210> 16
<211> 2423
<212> RNA
<213> 智人
<400> 16
auccuccgcc cagcacccca ggauucaggc guuggguccc gcccuuguag gcuguccacc 60
ucaaacgggc cggacaggau auauaagaga gaaugcaccg ugcacuacac acgcgacucc 120
cacaagguug cagccggagc cgcccagcuc accgagagcc uaguuccggc cagggucgcc 180
ccggcaacca cgagcccagc caaucagcgc cccggacugc accagagcca uggucggcag 240
aagagcacug aucguacugg cucacucaga gaggacgucc uucaacuaug ccaugaagga 300
ggcugcugca gcggcuuuga agaagaaagg augggaggug guggagucgg accucuaugc 360
caugaacuuc aaucccauca uuuccagaaa ggacaucaca gguaaacuga aggacccugc 420
gaacuuucag uauccugccg agucuguucu ggcuuauaaa gaaggccauc ugagcccaga 480
uauuguggcu gaacaaaaga agcuggaagc cgcagaccuu gugauauucc agaguggcau 540
ucugcauuuc uguggcuucc aagucuuaga accucaacug acauauagca uugggcacac 600
uccagcagac gcccgaauuc aaauccugga aggauggaag aaacgccugg agaauauuug 660
ggaugagaca ccacuguauu uugcuccaag cagccucuuu gaccuaaacu uccaggcagg 720
auucuuaaug aaaaaagagg uacaggauga ggagaaaaac aagaaauuug gccuuucugu 780
gggccaucac uugggcaagu ccaucccaac ugacaaccag aucaaagcua gaaaaugaga 840
uuccuuagcc uggauuuccu ucuaacaugu uaucaaaucu ggguaucuuu ccaggcuucc 900
cugacuugcu uuaguuuuua agauuugugu uuuucuuuuu ccacaaggaa uaaaugagag 960
ggaaucgacu guauucgugc auuuuuggau cauuuuuaac ugauucuuau gauuacuauc 1020
auggcauaua accaaaaucc gacugggcuc aagaggccac uuagggaaag auguagaaag 1080
augcuagaaa aauguucuuu aaaggcaucu acacaauuua auuccucuuu uuagggcuaa 1140
aguuuuaggg uacaguuugg cuagguauca uucaacucuc caauguucua uuaaucaccu 1200
cucuguaguu uauggcagaa gggaauugcu cagagaagga aaagacugaa ucuaccugcc 1260
cuaagggacu uaacuuguuu gguaguuagc caucuaaugc uuguuuauga uauuucuugc 1320
uuucaauuac aaagcaguua cuaauaugcc uagcacaagu accacucuug gucagcuuuu 1380
guuguuuaua uacaguacac agauaccuug aaaggaagag cuaauaaauc ucuucuuugc 1440
ugcagucauc uacuuuuuuu uuaauuaaaa aaaauuuuuu uuugaagcag ucuugcucug 1500
uuacccaggc uggagugcag uggugugauc ucggcucacu gcaaccucug ccucccaggu 1560
uccagcaauu cuccugccuc agccucccua guagcuggga ugacaggcgc cugccaucau 1620
gccugacuaa uuuuuguauu uuuaguagag acggcguuuc accauguugg ccaggcuggu 1680
cucaaacucc ugaccucagg ugauccgccu accucagccu cccaaagugc ugggauuaca 1740
ggcgugaucc accacaccug gcccuugcaa ucuucuacuu uaagguuugc agagauaaac 1800
caauaaaucc acaccguaca ucugcaauau gaauucaaga aaggaaauag uaccuucaau 1860
acuuaaaaau agucuuccac aaaaaauacu uuauuucuga ucuauacaaa uuuucagaag 1920
guuauuuucu uuaucauugc uaaacugaug acuuacuaug ggaugggguc cagucccaug 1980
accuuggggu acaauuguaa accuagaguu uuaucaacuu uggugaacag uuuuggcaua 2040
auagucaauu ucuacuucug gaagucaucu cauuccacug uugguauuau auaauucaag 2100
gagaauauga uaaaacacug cccucuugug gugcauugaa agaagagaug agaaaugaug 2160
aaaagguugc cugaaaaaug ggagacagcc ucuuacuugc caagaaaaug aagggauugg 2220
accgagcugg aaaaccuccu uuaccagaug cugacuggca cuggugguuu uugcucucga 2280
caguauccac aauagcugac ggcugggugu uucaguuuga aaauauuuug uugccuucau 2340
cuucacugca auuuugugua aauuucucaa agaucugaau uaaauaaaua aaauucauuu 2400
cuacagaccc acaaaaaaaa aaa 2423
<210> 17
<211> 1591
<212> RNA
<213> 智人
<400> 17
cgggcgccgc gggccauggc gggcgagaac caccaguggc agggcagcau ccucuacaac 60
augcuuauga gcgcgaagca aacgcgcgcg gcuccugagg cuccagagac gcggcuggug 120
gaucagugcu ggggcuguuc gugcggcgau gagcccgggg ugggcagaga ggggcugcug 180
ggcgggcgga acguggcgcu ccuguaccgc ugcugcuuuu gcgguaaaga ccacccacgg 240
cagggcagca uccucuacag caugcugacg agcgcaaagc aaacguacgc ggcaccgaag 300
gcgcccgagg cgacgcuggg uccgugcugg ggcuguucgu gcggcucuga ucccggggug 360
ggcagagcgg ggcuuccggg ugggcggccc guggcacucc uguaccgcug cugcuuuugu 420
ggugaagacc acccgcggca gggcagcauc cucuacagcu ugcucacuag cucaaagcaa 480
acgcacgugg cuccggcagc gcccgaggca cggccagggg gcgcguggug ggaccgcucc 540
uacuucgcgc agaggccagg ggguaaagag gcgcuaccag gcgggcgggc cacggcgcuu 600
cuguaccgcu gcugcuuuug cggugaagac cacccgcagc agggcagcac ccucuacugc 660
gugcccacga gcacaaauca agcgcaggcg gcuccggagg agcggccgag ggcccccugg 720
ugggacaccu ccucuggugc gcugcggccg guggcgcuca agaguccaca gguggucugc 780
gaggcagccu cagcgggccu guugaagacg cugcgcuucg ucaaguacuu gcccugcuuc 840
caggugcugc cccuggacca gcagcuggug cuggugcgca acugcugggc gucccugcuc 900
augcuugagc uggcccagga ccgcuugcag uucgagacug uggaagucuc ggagcccagc 960
augcugcaga agauccucac caccaggcgg cgggagaccg ggggcaacga gccacugccc 1020
gugcccacgc ugcagcacca uuuggcaccg ccggcggagg ccaggaaggu gcccuccgcc 1080
ucccaggucc aagccaucaa gugcuuucuu uccaaaugcu ggagucugaa caucaguacc 1140
aaggaguacg ccuaccucaa ggggaccgug cucuuuaacc cggacgugcc gggccugcag 1200
ugcgugaagu acauucaggg acuccagugg ggaacucagc aaauacucag ugaacacacc 1260
aggaugacgc accaagggcc ccaugacaga uucaucgaac uuaauaguac ccuuuuccug 1320
cugagauuca ucaaugccaa ugucauugcu gaacuguucu ucaggcccau caucggcaca 1380
gucagcaugg augauaugau gcuggaaaug cucuguacaa agauauaaag ucaugugggc 1440
cacacaagug caguagugca guucaccaug agggaagaau aaagagcugu gggcaaaaga 1500
guguaaaaua uuuuaaaaua aacuuucuua auauuuuuac augcagagua uuuuuguauu 1560
caauuaaaga aauaauuuua uuccaaaaaa a 1591
<210> 18
<211> 1958
<212> RNA
<213> 智人
<400> 18
acuucccucu ggccucucag agccucuugg auccccacag gguaaugggu gucccgaucu 60
cgcgggggac ucugugaucc guguuccccu gacccuccua gugcacaacu uggccgggcu 120
cacugggcuc cugcaccacu gccugucagg uccgcugcca gccccaagcc ccccaccagc 180
caugagcucc uccagaaagg accaccucgg cgccagcagc ucagagcccc ucccggucau 240
cauugugggu aacggccccu cugguaucug ccuguccuac cugcucuccg gcuacacacc 300
cuacacgaag ccagaugcca uccacccaca cccccugcug cagaggaagc ucaccgaggc 360
cccggggguc uccauccugg accaggaccu ggacuaccug uccgaaggcc ucgaaggccg 420
aucccaaagc cccguggccc ugcucuuuga ugcccuucua cgcccagaca cagacuuugg 480
gggaaacaug aagucggucc ucaccuggaa gcaccggaag gagcacgcca ucccccacgu 540
gguucugggc cggaaccucc ccgggggagc cuggcacucc aucgaaggcu ccauggugau 600
ccugagccaa ggccagugga uggggcuccc ggaccuggag gucaaggacu ggaugcagaa 660
gaagcgaaga ggucuucgca acagccgggc cacugccggg gacaucgccc acuacuacag 720
ggacuacgug gucaagaagg gucuggggca uaacuuugug uccggugcug uagucacagc 780
cguggagugg gggacccccg aucccagcag cuguggggcc caggacucca gcccccucuu 840
ccaggugagc ggcuuccuga ccaggaacca ggcccagcag cccuucucgc ugugggcccg 900
caacgugguc cucgccacag gcacguucga cagcccggcc cggcugggca uccccgggga 960
ggcccugccc uucauccacc augagcuguc ugcccuggag gccgccacaa gggugggugc 1020
ggugaccccg gccucagacc cuguccucau cauuggcgcg gggcugucag cggccgacgc 1080
gguccucuac gcccgccacu acaacauccc ggugauccau gccuuccgcc gggccgugga 1140
cgacccuggc cugguguuca accagcugcc caagaugcug uaccccgagu accacaaggu 1200
gcaccagaug augcgggagc aguccauccu gucgcccagc cccuaugagg guuaccgcag 1260
ccuccccagg caccagcugc ugugcuucaa ggaagacugc caggccgugu uccaggaccu 1320
cgaggguguc gagaaggugu uuggggucuc ccuggugcug guccucaucg gcucccaccc 1380
cgaccucucc uuccugccug gggcaggggc ugacuuugca guggauccug accagccgcu 1440
gagcgccaag aggaacccca uugacgugga ccccuucacc uaccagagca cccgccagga 1500
gggccuguac gccauggggc cgcuggccgg ggacaacuuc gugagguuug ugcagggggg 1560
cgccuuggcu guggccagcu cccugcuaag gaaggagacc aggaagccac ccuaacacuc 1620
ggccagaccc gcuggcuccc aggcccugag aggacagaga ugaccacauc ccugcuggau 1680
gcaggacccg uccaaagaug ccccggggag gggugucagc ccacguugcu ggccuuuggg 1740
gucaagagga guagggaucc caggcugccc uggacuuaga ccagugucug aggugguaac 1800
agcggccgca ggccaggguu ggccuagacc ugggauuugu ggggaaagcu gcugguguga 1860
ccagcugagc acccagccag gagaccugca gcccugcgcc uuccagaagc aggucccaaa 1920
uaaagccagu gcccaccugc aaaaaaaaaa aaaaaaaa 1958
<210> 19
<211> 2432
<212> RNA
<213> 智人
<400> 19
auggcccagu gagugacucg ccaggggcag cccggcucgg ccucagcggg cggggaacuc 60
uuuggggguc gagaucuccc ucguucucuc cgacgccucc cacccugggg gucgccugag 120
cucacuuggg gcucugugac ccuggcccua cggcgucucg ggcccagagc uccuucccug 180
cgggcccggc ccccugcccu cucggccgcg cagagcugac aucgcgcuga ucggauuggc 240
cgucaugggc cagaacuuaa uucugaacau gaaugaccac ggcuuugugg ucugugcuuu 300
uaauaggacu gucuccaaag uugaugauuu cuuggccaau gaggcaaagg gaaccaaagu 360
ggugggugcc cagucccuga aagagauggu cuccaagcug aagaagcccc ggcggaucau 420
ccuccuggug aaggcugggc aagcugugga ugauuucauc gagaaauugg uaccauuguu 480
ggauacuggu gacaucauca uugacggagg aaauucugaa uauagggaca ccacaagacg 540
gugccgagac cucaaggcca agggaauuuu auuugugggg agcggaguca gugguggaga 600
ggaaggggcc cgguauggcc caucgcucau gccaggaggg aacaaagaag cguggcccca 660
caucaagacc aucuuccaag gcauugcugc aaaaguggga acuggagaac ccugcuguga 720
cuggguggga gaugagggag caggccacuu cgugaagaug gugcacaacg ggauagagua 780
uggggacaug cagcugaucu gugaggcaua ccaccugaug aaagacgugc ugggcauggc 840
gcaggacgag auggcccagg ccuuugagga uuggaauaag acagagcuag acucauuccu 900
gauugaaauc acagccaaua uucucaaguu ccaagacacc gauggcaaac accugcugcc 960
aaagaucagg gacagcgcgg ggcagaaggg cacagggaag uggaccgcca ucuccgcccu 1020
ggaauacggc guacccguca cccucauugg agaagcuguc uuugcucggu gcuuaucauc 1080
ucugaaggau gagagaauuc aagcuagcaa aaagcugaag gguccccaga aguuccaguu 1140
ugauggugau aagaaaucau uccuggagga cauucggaag gcacucuacg cuuccaagau 1200
caucucuuac gcucaaggcu uuaugcugcu aaggcaggca gccaccgagu uuggcuggac 1260
ucucaauuau gguggcaucg cccugaugug gagagggggc ugcaucauua gaaguguauu 1320
ccuaggaaag auaaaggaug cauuugaucg aaacccggaa cuucagaacc uccuacugga 1380
cgacuucuuu aagucagcug uugaaaacug ccaggacucc uggcggcggg cagucagcac 1440
ugggguccag gcuggcauuc ccaugcccug uuuuaccacu gcccucuccu ucuaugacgg 1500
guacagacau gagaugcuuc cagccagccu cauccaggcu cagcgggauu acuucggggc 1560
ucacaccuau gaacucuugg ccaaaccagg gcaguuuauc cacaccaacu ggacaggcca 1620
ugguggcacc gugucauccu cgucauacaa ugccugauca ugcugcuccu gucacccucc 1680
acgauuccac agaccaggac auuccaugug ccucauggca cugccaccug gcccuuugcc 1740
cuauuuucug uucaguuuuu uaaaaguguu guaagagacu ccugaggaag acacacaguu 1800
uauuuguaaa guagcucugu gagagccacc augcccucug cccuugccuc uugggacuga 1860
ccaggagcug cucaugugcg ugagaguggg aaccaucucc uugcggcagu ggcuuccgcg 1920
ugccccgugu gcuggugcgg uucccaucac gcagacagga aggguguuug cgcacucuga 1980
ucaacuggaa ccucuguauc augcggcuga auucccuuuu uccuuuacuc aauaaaagcu 2040
acaucagacu gaugcucuuu cuccagauuc uuagucucac cucggccaca uggagccauu 2100
auccccauug gcagaaagau uuuucuuuaa aaaaaaagac uagaauaaca caagaaacca 2160
cauuuaggau uaugcuucac ucagaggagg caggcaggga ggacacacca ggggcuuuaa 2220
uacacugggc auguuuucuu ucuccaauug ggcaaugggu acauggacgu ucacuguaac 2280
gugcuuuuuc uuucgucuuu uuuuuuuuuu uuuuuuuuuu ugcuccuggc aagcugugcg 2340
ugacauucuu uauggcuuuu uguaugucaa auacuucaua cuaaacuuuc uagagaauua 2400
aacuuuaaug augggcucaa aaaaaaaaaa aa 2432
<210> 20
<211> 4583
<212> RNA
<213> 智人
<400> 20
gcggccgccc cggcggcucc uggaaccccg guucgcggcg augccagcca ccccagcgaa 60
gccgccgcag uucagugcuu ggauaauuug aaaguacaau aguugguuuc ccuguccacc 120
cgccccacuu cgcuugccau cacagcacgc cuaucggaug ugagaggaga agucccgcug 180
cucgggcacu gucuauauac gccuaacacc uacauauauu uuaaaaacau uaaauauaau 240
uaacaaucaa aagaaagagg agaaaggaag ggaagcauua cuggguuacu augcacuugc 300
gacugauuuc uuggcuuuuu aucauuuuga acuuuaugga auacaucggc agccaaaacg 360
ccucccgggg aaggcgccag cgaagaaugc auccuaacgu uagucaaggc ugccaaggag 420
gcugugcaac augcucagau uacaauggau guuugucaug uaagcccaga cuauuuuuug 480
cucuggaaag aauuggcaug aagcagauug gaguaugucu cucuucaugu ccaaguggau 540
auuauggaac ucgauaucca gauauaaaua aguguacaaa augcaaagcu gacugugaua 600
ccuguuucaa caaaaauuuc ugcacaaaau guaaaagugg auuuuacuua caccuuggaa 660
agugccuuga caauugccca gaaggguugg aagccaacaa ccauacuaug gaguguguca 720
guauugugca cugugagguc agugaaugga auccuuggag uccaugcacg aagaagggaa 780
aaacaugugg cuucaaaaga gggacugaaa cacggguccg agaaauaaua cagcauccuu 840
cagcaaaggg uaaccugugu cccccaacaa augagacaag aaaguguaca gugcaaagga 900
agaaguguca gaagggagaa cgaggaaaaa aaggaaggga gaggaaaaga aaaaaaccua 960
auaaaggaga aaguaaagaa gcaauaccug acagcaaaag ucuggaaucc agcaaagaaa 1020
ucccagagca acgagaaaac aaacagcagc agaagaagcg aaaaguccaa gauaaacaga 1080
aaucgguauc agucagcacu guacacuaga ggguuccaug agauuauugu agacucauga 1140
ugcugcuauc ucaaccagau gcccaggaca ggugcucuag ccauuaggac cacaaaugga 1200
caugucaguu auugcucugu cuaaacaaca uucccaguag uugcuauauu cuucauacaa 1260
gcauaguuaa caacaaagag ccaaaagauc aaagaaggga uacuuucaga ugguugucuu 1320
gugugcuucu cugcauuuuu aaaagacaag acauucuugu acauauuauc aauaggcuau 1380
aagauguaac aacgaaauga ugacaucugg agaagaaaca ucuuuuccuu auaaaaaugu 1440
guuuucaagc uguuguuuua agaagcaaaa gauaguucug caaauucaaa gauacaguau 1500
cccuucaaaa caaauaggag uucagggaag agaaacaucc uucaaaggac aguguuguuu 1560
ugaccgggag aucuagagag ugcucagaau uagggccugg cauuuggaau cacaggauuu 1620
aucaucacag aaacaacugu uuuaagauua guuccaucac ucucauccug uauuuuuaua 1680
agaaacacaa gagugcauac cagaauugaa uauaccauau gggauuggag aaagacaaau 1740
guggaagaaa ucauagagcu ggagacuacu uuugugcuuu acaaaacugu gaaggauugu 1800
ggucaccugg aacaggucuc caaucuaugu uagcacuaug uggcucagcc ucuguuaccc 1860
cuuggauuau auaucaaccu guaaacaugu gccuguaacu uacuuccaaa aacaaaauca 1920
uacuuauuag aagaaaauuc ugauuuuaua gaaaaaaaau agagcaagga gaauauaaca 1980
uguuugcaaa gucauguguu uucuuucuca augagggaaa aacaauuuua uuaccugcuu 2040
aaugguccac cuggaacuaa aagggauacu auuuucuaac aagguauauc uaguagggga 2100
gaaagccacc acaauaaaua uauuuguuaa uaguuuuuca aguuuuguuc acucuguuuu 2160
auuguuuguu uuauugagaa auucuuacuc uuagagacuc augaauuaag aaagagaauu 2220
cugcuaacuc agagaaccug guuccuaugu aauucagaau auauuacauu ucucaguaau 2280
auuuguuuuu ugaauccacc uuuaucugag ccaauggaga uuuacuuaua gcguauuagg 2340
agauauuuau uccauuuucu uauuuuaauc aacauucuaa uuauagacac augggccucc 2400
cuagcugauu ucacugcucc cccuucauug cuuagaaaug ggcaucauuu cuuguauguc 2460
agaucccccu gcaucuucaa cauuuagucu uuucuucucc auauuuucua ucuguggauc 2520
ucuuuagggg auugaaguca cccuagcuga aggccucacc aguguuucac agaggacaca 2580
gcccaccccu ugcaggagga gguaucucug agugugcagc acagaaucgc augacccacc 2640
uuaaccuucc uguugucaug gaaggaugca cggcugcucu guccacugug auuccuagcc 2700
cucucaagau cacugcuuuc ugaagaauuu gcaaugacuc uggcuucugg cugcuuaucu 2760
cuggacaccc guucuccacc aguuguacag uucauguaau cuacuuggcu uaauugauuu 2820
uccacuucuc ucuuccucuu cuaagauaua aacauuuuaa augauuuauu ccuguuucuu 2880
auucuggugu uucuuuccuu gucccuauga gauaaguguc ucaacucacu aaaucuauuc 2940
ccaauguaua aaauaauucu aauuccauuu ucagcuaaaa cauauauuac caagaagaaa 3000
caaacuuuau ccuacagaau gauguuaggu agaaauaugu ccccagguuu gagaccuuuc 3060
ggaugauuuc auauaccauc uuucuucuga guguuaccca gucaaguaua aguagccaaa 3120
uuauuuuugc acaucuuucu guuucucaug ucuucauuua uucaacaagc acuuacuggg 3180
aaggucuaca ccugcauagg caaugcugga aaaaggguua aguaaaccag gacaugacaa 3240
ugguggcaaa ugacuaucag gucuucccau guguuugacu caaacuuauu acccuauggu 3300
ccuucugaca auggcagaag gucugaaucc uugaugcuaa acuuauauaa aaguagaauu 3360
auuacaaagg aaaaagaaau aaaaacuaac auucauuuuc auauguugga ugaaauauaa 3420
augaagaaaa agauaacauc aauuuuaacu guaauucucc auccaccagu aacagauccu 3480
uaagacaaua gaaucauaca guauucaaac cagcagccuu cucaaauuug agcaaaaacu 3540
cuaucaaccu cugguaaagu uccuacacua gucacagaag guguuaacuu ucuacucuga 3600
uucugucucc auaauggggu aaacuguuga uaguuuaccc caucaacaga uggucgguaa 3660
auuauugauu cgaagaaucg agagagugca gcaacauaaa ucuguuaaug ucugaucaag 3720
cuccugcccu guucuccgaa uucagcuuca uaauuaaggg aaggccuguu uucuauccuc 3780
agauuuaggu ucuaguagca guuguguaac cacuagugag ucacuuaacu ccucuggguc 3840
cccauuucuc augugcaaca agaaagaggg gaacuggaga ugaucacucu aguuccagac 3900
aagggaacau uucacacuuu guuuacuuca gggugauguc ccugaguccu cauuagugac 3960
ugcguccuuu ggaaguuauc ccaacccugc uuuucucaaa agugaaaaug uauaggcucu 4020
cagaggagac agauuuaacu cugcuucucu aauguuauug aauuaaaagc uguucacauu 4080
agugguuauu aaauauugaa auaacacugg gaagaaaaag cauauauaaa uacagcuaaa 4140
aacaagaaua gauauucauu cucacaaagg gagacagcaa agaaaaugga aagugcacug 4200
gugcuagcgu uagacagcuu guguuaaugu cucaauucug cuacuaacug guugcagcuu 4260
gugugaccuu gggcacauug uaugaucucg cagaauauca ucccaaaucu gcaaaaugga 4320
auuggcauca ucucuuuugc aagauuguua ugagaauuaa aagguucuuc auucaauaua 4380
auaauaaaua uuuuguauau aaaugaauau caauuaaaag uuaugacuaa uuccacaagu 4440
caaacauaua aauuuuauuu cuugauucau gauaugugau aguauucaua aaaauguaca 4500
ugcaugauaa uuucaaggaa uaaguauaua ugugagaauc auggaaauga aauuaauaau 4560
auuaacuagu aauuaaauug uaa 4583
<210> 21
<211> 9648
<212> RNA
<213> 智人
<400> 21
gguuuguaau gauagggcgg cagcagcagc agcagcagca gugguggaac gaggaggugg 60
agaauugaga gcacgaugca uacacaggug uuucugagua guaauuagau cgcugugaag 120
gaaaaagcac accuuugagu uuucaccugu gaacacuaua gcgcugagag agacagucug 180
aaagcagagg aagacaucga ucaguaacac caagagacac caaaguugaa aguuuuguuu 240
ucuuucccuc uguuuuauuu uucccccgug ugucccuacu auggucagaa agccuguugu 300
guccaccauc uccaaaggag guuaccugca gggaaauguu aacgggaggc ugccuucccu 360
gggcaacaag gagccaccug ggcaggagaa agugcagcug aagaggaaag ucacuuuacu 420
gaggggaguc uccauuauca uuggcaccau cauuggagca ggaaucuuca ucucuccuaa 480
gggcgugcuc cagaacacgg gcagcguggg caugucucug accaucugga cggugugugg 540
gguccuguca cuauuuggag cuuugucuua ugcugaauug ggaacaacua uaaagaaauc 600
uggaggucau uacacauaua uuuuggaagu cuuuggucca uuaccagcuu uuguacgagu 660
cuggguggaa cuccucauaa uacgcccugc agcuacugcu gugauauccc uggcauuugg 720
acgcuacauu cuggaaccau uuuuuauuca augugaaauc ccugaacuug cgaucaagcu 780
cauuacagcu gugggcauaa cuguagugau gguccuaaau agcaugagug ucagcuggag 840
cgcccggauc cagauuuucu uaaccuuuug caagcucaca gcaauucuga uaauuauagu 900
cccuggaguu augcagcuaa uuaaagguca aacgcagaac uuuaaagacg ccuuuucagg 960
aagagauuca aguauuacgc gguugccacu ggcuuuuuau uauggaaugu augcauaugc 1020
uggcugguuu uaccucaacu uuguuacuga agaaguagaa aacccugaaa aaaccauucc 1080
ccuugcaaua uguauaucca uggccauugu caccauuggc uaugugcuga caaauguggc 1140
cuacuuuacg accauuaaug cugaggagcu gcugcuuuca aaugcagugg cagugaccuu 1200
uucugagcgg cuacugggaa auuucucauu agcaguuccg aucuuuguug cccucuccug 1260
cuuuggcucc augaacggug guguguuugc ugucuccagg uuauucuaug uugcgucucg 1320
agagggucac cuuccagaaa uccucuccau gauucauguc cgcaagcaca cuccucuacc 1380
agcuguuauu guuuugcacc cuuugacaau gauaaugcuc uucucuggag accucgacag 1440
ucuuuugaau uuccucaguu uugccaggug gcuuuuuauu gggcuggcag uugcugggcu 1500
gauuuaucuu cgauacaaau gcccagauau gcaucguccu uucaaggugc cacuguucau 1560
cccagcuuug uuuuccuuca caugccucuu caugguugcc cuuucccucu auucggaccc 1620
auuuaguaca gggauuggcu ucgucaucac ucugacugga gucccugcgu auuaucucuu 1680
uauuauaugg gacaagaaac ccaggugguu uagaauaaug ucagagaaaa uaaccagaac 1740
auuacaaaua auacuggaag uuguaccaga agaagauaag uuaugaacua auggacuuga 1800
gaucuuggca aucugcccaa ggggagacac aaaauaggga uuuuuacuuc auuuucugaa 1860
agucuagaga auuacaacuu uggugauaaa caaaaggagu caguuauuuu uauucauaua 1920
uuuuagcaua uucgaacuaa uuucuaagaa auuuaguuau aacucuaugu aguuauagaa 1980
agugaauaug caguuauucu augagucgca caauucuuga gucucugaua ccuaccuauu 2040
gggguuagga gaaaagacua gacaauuacu auguggucau ucucuacaac auauguuagc 2100
acggcaaaga accuucaaau ugaagacuga gauuuuucug uauauauggg uuuuguaaag 2160
augguuuuac acacuauaga ugucuauacu gugaaaagug uuuucaauuc ugaaaaaaag 2220
cauacaucau gauuauggca aagaggagag aaagaaauuu auuuuacauu gacauugcau 2280
ugcuuccccu uagauaccaa uuuagauaac aaacacucau gcuuuaaugg auuauaccca 2340
gagcacuuug aacaaagguc aguggggauu guugaauaca uuaaagaaga guuucuaggg 2400
gcuacuguuu augagacaca uccaggaguu auguuuaagu aaaaauccuu gagaauuuau 2460
uaugucagau guuuuuucau ucauuaucag gaaguuuuag uuaucuguca uuuuuuuuuu 2520
ucacaucagu uugaucagga aaguguauaa cacaucuuag agcaagaguu aguuugguau 2580
uaaauccuca uuagaacaac caccuguuuc acuaauaacu uaccccugau gagucuaucu 2640
aaacauaugc auuuuaagcc uucaaauuac auuaucaaca ugagagaaau caccaacaaa 2700
gaagauguuc aaaauaauag ucccauaucu guaaucauau cuacaugcaa uguuaguaau 2760
ucugaaguuu uuuaaauuua uggcuauuuu uacacgauga ugaauuuuga caguuugugc 2820
auuuucuuua uacauuuuau auucuucugu uaaaauaucu cuucagauga aacuguccag 2880
auuaauuagg aaaaggcaua uauuaacaua aaaauugcaa aagaaauguc gcuguaaaua 2940
agauuuacaa cugauguuuc uagaaaauuu ccacuucuau aucuaggcuu ugucaguaau 3000
uuccacaccu uaauuaucau ucaacuugca aaagagacaa cugauaagaa gaaaauugaa 3060
augagaaucu guggauaagu guuuguguuc agaagauguu guuuugccag uauuagaaaa 3120
uacugugagc cgggcauggu ggcuuacauc uguaauccca gcacuuuggg aggcugaggg 3180
gguggaucac cugaggucgg gaguucuaga ccagccugac caacauggag aaaccccauc 3240
ucuacuaaaa auacaaaauu agcugggcau gguggcacau gcugguaauc ucagcuauug 3300
aggaggcuga ggcaggagaa uugcuugaac ccgggaggcg gagguugcag ugagccaaga 3360
uugcaccacu guacuccagc cugggugaca aagucagacu ccaucuccaa aaaaaaaaga 3420
uuauauauau auauauaugu guguguaugu gugugugugu gugugugugu auauauauau 3480
auauauauau acacacacac acacacacuu uuuauauaua uauauauaua uauauagugg 3540
aacuuacaaa ugagaguaau auaaugauga aauuuugaac uguuauuuau aaacaucuaa 3600
gguaaaaugg uuagucaugg ccagaguaug uuucauccuu uaauuuuugu ccauuugaaa 3660
auaaggauuu uugaaagaau uauaccaauu aaaauuauua aaggcaaaca uagaauucau 3720
aaaaaauugu ccaaaguaga aaugaugacc uauaauuugg agcauuucca auucaguaau 3780
uucaauuuug cucuugaaaa cauuuaauau auauccaaga cugacauuuc uuuagcugaa 3840
ccuaacguuu gggucucuga gugaauuuau aauaacuccu uccuuccuua gcauaggguu 3900
uucaaaauuu gauuuauaau uccuauuucc aguaaauauu guucauuugu ccacaucucu 3960
cccuaugaua uguugcugga gguaagaauu ucuuucauau uccuauuuuu uuuuucccca 4020
uagacuaggc ucauagaauu uaaacaagca aauuuuccug agcuuuuucu ugccaaauga 4080
aagaagacug guaaauucuc auagagaggu uuguguaguu cuuggcucuu ccugggguua 4140
augugcuuau auucacagug gcaaauuggu cucagacuuu aauuuauuua uuuuugauuu 4200
gaauuucucu uuaaaaguau caauuuaaaa gguaacuaga auuauucuuu cucauuuuca 4260
aaagugauuu uugcauuauu aaauuucccu gccauuguaa ugccauuuca cgcagaaaaa 4320
aagucagcca guaauuaaga aaaaaaguga uggagauuaa guaguauuuu ggcuuauuuu 4380
uaggacucau caugagaaga cacaguuccu uuaaucagga aauuaauauc cauaauuuuc 4440
acucaaaauu gcaguaugua aagcagauuc ucaaaaacuc uccugaacac uuauuuauau 4500
auauguuuuu auauaaguaa aauuuuucuc auauuuuuau acgauaugca cacacacaca 4560
uacaugcaca uacuacuuac uacauguucu guacuuguac uuuguaccau gcauauucaa 4620
auguuuauau acauaaguuu auuauaacau aaacaguaaa aguaaugaau acuguuuaaa 4680
auaacuaaua uaguauuuuu uaauuuuugu ggggauggau ucucaaauac uugugauuuu 4740
aaaagauucu aaagcuaaaa cacaacuuga uuuuaaaaag aaugauucuc cuuacacaau 4800
uauaaauauu ugcaguaaau auuuuccuua uaauacuguu uugaccccau uuaaaaagua 4860
uuagauuaua uuccuuugau ccaaugaaaa cugaaccuua uaaaugguua gcugaaagua 4920
gaccuuauuc uuguccuucu uuagaagagu aaagauuugu ccuagggaag auggcugacu 4980
ucgguuccca acaugcguau gcauuuagac uguagcuccu cagcccugug gacacaaaau 5040
uuggacagcu uauuagguua cguuagcaau gcaugacggu uucuccaaca cuaagauauu 5100
cacguugaaa cagauuuccu guucgucuua ugugucuggu aaaauuguuu ccccaauuac 5160
aauuugacau aucaauagag gguuaacaag aguauaauua cauaacagaa uuccucauga 5220
acuguaauca gucuacagga aaaucauuau uuuaucuuga uuugcagaug aauauacugc 5280
uaagaaaggg agcaacucug accuuuguua aaguugaucu uuuguaauug agguauaagg 5340
uaugaaaaga uaaaaaaccg aaggccagag aaucaggaaa ugaaagauag uauggacuga 5400
agguaacaau auuuuaaugu uaugcaauau agucagagaa auauuaaaaa uuaguuguuu 5460
gcugugcaua gguggaucuc gcaggaagcu aaugaaaccu aagcuucagu gccucucacu 5520
uagacauguu ccauucgagg uccugaaccu aacuuuguau uaggaauucu guacuaauuu 5580
uguugaagaa gaccagcaaa guuguguaca cuucuacccc cacaaaaucu gcauugucca 5640
ugugaguaaa guaaaauaau uccuguuauu uuuuucuguu agaaauaagu auggaggaua 5700
uguuuuuaaa aauuuaugag uuaauugaaa uauccauaua uaacaaguga cuuucucaca 5760
auauauauga ugugauauau agggagauag uuucacuuuc aucauauuuu auacguugau 5820
ucugaacuau agaaaaauaa uaaaugggau uuuaauuaua gcucuuaguu gggaaagaaa 5880
uauagagaga ugugggauuu gaaugcccau gaaagacauu uuauuuuacu ugaauauauu 5940
cuugcuucac uuuacccucc auaauauguu guacauuagu gcugaucaag uuuacagagu 6000
uacauuuugc uuuccuaacc auucagucag gaauuaaaau auggcauugu auaacaacug 6060
ggaagaagcu cauaguggau auaaauuaga guagauaaug ggucaccuug auagccucug 6120
uuuacauuac uuguauaugg gcaaaauaau uauuaccuau acguguauuu aagcuuaauu 6180
uucauauaaa caguauuuuu aaucuauguu aaaauagaua auaucuaaaa gugugaucuc 6240
uagguagucc uuaguuuauu aguacuguac uucaaaaaga uuuuuaaaua gguccggcac 6300
gguggcucau gccuguaauc ccagcacuuu gggaggcuga ggcgggcgaa ucaccugagg 6360
ucaggaguuc gagaucagcc uggccaacau ggugaaaccc ugucucaacu aaaaauauaa 6420
aaauuagccg ggcguggugg caggcgccug uaaucccagc uacucgggag gcugaggcag 6480
gagaaucacu ugaacccaag gggcagaagc ugcaguuagc caagaucgca ucauugcacu 6540
ccagccuagg ggacaagagc gcgagacuuc aucucaaaaa aaaaaaaaaa aaaaaaaaaa 6600
gauuuuuaaa uaauagcuaa agguaugcuc ucuaggucau ccuuaguuua uuaguacugu 6660
acuuaaaaau uauuuuuuaa uagucaauuu ugggagauaa uuauuucuuu ccuuauauuu 6720
uccaauuagu uggugucuaa aaauaaaugu uuugucuaau uuuagaucag guauacauuc 6780
acaaaagcau aaaucauagu cucacaggaa auucaccaau uuuccauaug ucgugagaua 6840
acuguccuuu cuacaaccuc auaacaauga auuuauauaa uuaccuagau uuucuuagug 6900
ugaaucuacc cauuaguuuu auuuucuugg uaguuauuuu uuucccuccu cucuguuacu 6960
auuggccuua aaauacacag aggacgguua caguguccua auagcuguua caugugugug 7020
uuucagcgua cuugaaucaa guguacauuu auaguaccaa uaaccgccuu uacagcuuua 7080
caguuaacaa uucucucaca aaacuguaga gcauuaggca ucugagagcc auagagggcc 7140
aacuuuguuc cagagugaac augcuuuuuu uccucaacau auacacuacu gauuuuuuuu 7200
aaaaguauga cuuucaagug aauuaaugua uugguuagga gaacugcuug cuaaguccuu 7260
auuaccucuu guuaaagccu cagaaggccg ugcugaaagc cagaggggaa aaaaagagua 7320
augcacaggu aucucuuuug caguggugac uguauuuuga guaccuugug ugacagggua 7380
uuauuacagc aucuuguggg aaaaccuauu aggccuuugc auguuaaagc uguauaauuu 7440
guuggguugu gaguggucug acuuaaaugu guauuauaaa auuuagacau caaauuuucc 7500
uacuaacuaa cuuuauuaga ugcauacuug gaagcacagu cauaucacac ugggaggcaa 7560
ugcaaugugg uuaccugguc cuagguuuga acugucuuau uucaaaagau uucugaauua 7620
auuuuucccu agaauuucuc cuucauucca aaguacaaac auacuuugaa gaaugaaaca 7680
gauuguuccc augaauguau gcucauacuc gacuagaaac gaucuauguu aaaugacugu 7740
guauaugaau uauuucaagu acuaccccaa auaacuuucu uauugcucug aaagaagaaa 7800
agcaauguaa aucacuauga uuauugcaca aacaaccaga auucuccaac aauuuuaagu 7860
aaucugaucc ucuucuugga gaaaauuguu accuaauagu uuuuccuuau gaauguuauu 7920
acuacuggua uaaaucaaau uucuauaaau uuccuacuua agucuuaaga acuggguucu 7980
uccuuugaug uuauucaugu ucagaaagga aacaacacuu uacucuuuua ggacaauucc 8040
uagaaucuau aguaguauca ggauauauuu ugcuuuaaaa uauauuuugg uuauuuugaa 8100
uacagacauu ggcuccaaau uuucaucuuu gcacaauagu augacuuuuc acuagaacuu 8160
cucaacauuu gggaacuuug caaauaugag caucauaugu guuaaggcug uaucauuuaa 8220
ugcuaugaga uacauuguuu ucucccuaug ccaaacaggu gaacaaacgu aguuguuuuu 8280
uacugauacu aaauguuggc uaccugugau uuuauaguau gcacauguca gaaaaaggca 8340
agacaaaugg ccucuuguac ugaauacuuc ggcaaacuua uugggucuuc auuuucugac 8400
agacaggauu ugacucaaua uuuguagagc uugcguagaa uggauuacau gguagugaug 8460
cacugguaga aaugguuuuu aguuauugac ucagaauuca ucucaggaug aaucuuuuau 8520
gucuuuuuau uguaagcaua ucugaauuua cuuuauaaag augguuuuag aaagcuuugu 8580
cuaaaaauuu ggccuaggaa ugguaacuuc auuuucaguu gccaaggggu agaaaaauaa 8640
uauguguguu guuauguuua uguuaacaua uuauuaggua cuaucuauga auguauuuaa 8700
auauuuuuca uauucuguga caagcauuua uaauuugcaa caaguggagu ccauuuagcc 8760
cagugggaaa gucuuggaac ucagguuacc cuugaaggau augcuggcag ccaucucuuu 8820
gaucugugcu uaaacuguaa uuuauagacc agcuaaaucc cuaacuugga ucuggaaugc 8880
auuaguuaug accuuguacc auucccagaa uuucaggggc aucguggguu uggucuagug 8940
auugaaaaca caagaacaga gagauccagc ugaaaaagag ugauccucaa uauccuaacu 9000
aacugguccu caacucaagc agaguuucuu cacucuggca cugugaucau gaaacuuagu 9060
agaggggauu guguguauuu uauacaaauu uaauacaaug ucuuacauug auaaaauucu 9120
uaaagagcaa aacugcauuu uauuucugca uccacauucc aaucauauua gaacuaagau 9180
auuuaucuau gaagauauaa auggugcaga gagacuuuca ucuguggauu gcguuguuuc 9240
uuaggguucc uagcacugau gccugcacaa gcaugugaua ugugaaauaa aauggauucu 9300
ucuauagcua aaugaguucc cucuggggag aguucuggua cugcaaucac aaugccagau 9360
gguguuuaug ggcuauuugu guaaguaagu gguaagaugc uaugaaguaa guguguuugu 9420
uuucaucuua uggaaacucu ugaugcaugu gcuuuuguau ggaauaaauu uuggugcaau 9480
augaugucau ucaacuuugc auugaauuga auuuugguug uauuuauaug uauuauaccu 9540
gucacgcuuc uaguugcuuc aaccauuuua uaaccauuuu uguacauauu uuacuugaaa 9600
auauuuuaaa uggaaauuua aauaaacauu ugauaguuua cauaauaa 9648
<210> 22
<211> 2704
<212> RNA
<213> 智人
<400> 22
cggcaccugg cgagcggagc cggagucggg cuggggaccg cggggucgag gccggaccgc 60
ggcggggucg ggggagaaac gcgcgcugcc cuggcacggg cccccccccc cggccgcgcg 120
gaaugguaug gcccggccgg aguuaaggcc ggggggaggc ggcgaguccc gcggcggcgg 180
cgacgauggg gcugcgugca ggaggaacgc ugggcagggc cggcgcgggu cggggggcgc 240
ccgaggggcc cgggccgagc ggcggcgcgc agggcggcag cauccacucg ggccgcaucg 300
ccgcggugca caacgugccg cugagcgugc ucauccggcc gcugccgucc guguuggacc 360
ccgccaaggu gcagagccuc guggacacga uccgggagga cccagacagc gugcccccca 420
ucgauguccu cuggaucaaa ggggcccagg gaggugacua cuucuacucc uuugggggcu 480
gccaccgcua cgcggccuac cagcaacugc agcgagagac cauccccgcc aagcuugucc 540
aguccacucu cucagaccua aggguguacc ugggagcauc cacaccagac uugcaguagc 600
agccuccuug gcaccugcug ccaccuucaa gagcccagaa gacacaccug gccuccagca 660
ggcugggcca ugcagaaggg auagcagggg ugcauucucu uugcaccugg cgagaggguc 720
ugacucuggg caccccucuc accagcuaca aggccuugga cucacuguac agugugggag 780
ccccaguucc caccucugug acaauaggau cauggccuua cccuugaagc auuaccgaga 840
aggagaacag agaugggcuu gaagagccac gugcugccgg cuccaaauuc ccaaggacaa 900
ggaucccucu gcauuuuugu cuauguaacc ucuuauaugg acuacauuca gcugcaagga 960
aaggaaaacc uugauugcag ugguuuaaac aaacagaaga uuguuuuucc acauagcaug 1020
gauucuggag auggguggcu aaugguauug guucaacaac uccacgaagg uaggggucac 1080
gucuuggauc cuuuugccuu aaucucagug cucguuacuu caugguccca agauggcugc 1140
uguaucccca agaaucaugu cugcguucaa ggaaggaggg guggaggaag aggaagggcc 1200
aaacuagcug gacccgucac cuucuaucag aaaguaaaac cucgucagaa gucuguuucc 1260
ugcucucucc cucugcauau cuucacuuag augcccuugg cccgagccag cuaccauugc 1320
accucuagcu gcaaacaaag cuaagacagc agggaacaga auugucaugg cugaauagac 1380
caaucguguu ccaucuacug agacuggcac acugccuccu gcaauaaaac ugggauccca 1440
uuaccaagag agaaaugcag aauuguguac caguuagcuu uugcugugua acaaaccauc 1500
cccaaacuug gcagcuagaa acaaacccug uauuuuccca caauccuaug gguuggcaau 1560
uugggcuggg cucaacaggg caguucugcu gcucacaccu gggaucccuc auggagcuaa 1620
ggucagcugu uaccucagcu gggccuggau ggucuaggau agccuuacuc acuugccugg 1680
caggugacag gcuguuggcu ggaauugcuu gguucuccuc cauguggccu cuccagcagg 1740
cuagcucagg cuuauucaca ugauggcuuc aggauuccaa agagagugag aguagaagcu 1800
gaaagacuuc uugaguucuu ggccuggaac ugggacuagg acagugucac uucugcuaag 1860
uucuuuuggu cagagcaaau cacaaggcuu uacccagauu caagggauga gaaacagacu 1920
acaugucuug augaggggaa ccacaaagag cuuguggcca uuuuucaccu aucacaaaua 1980
auuuuggaug gguauuuauu uggauaaagg uauuucccuc uucccccuuu cucucugucu 2040
cauggggccu cacucugcca aguuggaagg cacuaagaca uuguccuggc ccucaggguc 2100
uaggggaaga gguguugggg caggaaguga gucucuccau gggcuggacc cacuguagua 2160
ggagugccuc cuugucugca cugcugguau gggguuaggc cagguaggac auuccagagg 2220
ggcuucugaa aaccaagagu cccuggggaa agggaacaga guaaggcagg ccuuguucuc 2280
acugcccucu aagggaacuu ggucacucgg cacuuuuaag ccucaguuuc uccaguucaa 2340
uaauaaggac aagagcuuuu cccaugcauu cucuuucccc gggaaaguug acugagguga 2400
ccaguaauag aauugaaaag ggagaguguc uucagugcaa uguggcaucc uggauugggu 2460
cuuggaacaa aaacaggaca uuagugggaa aauuggaaau cugaaaaaag ucugaauuuu 2520
aguuaauaua ccaauuucag ucucuugguu uugacagaug uaccauggug auguaagaug 2580
uugaccuugg gguaggcugg gugaagggua uacaggaacu cuuuguacua ucucugcaac 2640
uucucuguaa aucuaguauc auuccaaaau aaaaguuuau uuaauuuaaa aaaaaaaaaa 2700
aaaa 2704
<210> 23
<211> 1319
<212> RNA
<213> 智人
<400> 23
cgcgcccguc ccgucgccgc cgccgccgcc gcagaccccu cggucuugcu augucgagcu 60
cacccgugaa gcgucagagg auggaguccg cgcuggacca gcucaagcag uucaccaccg 120
ugguggccga cacgggcgac uuccacgcca ucgacgagua caagccccag gaugcuacca 180
ccaacccguc ccugauccug gccgcagcac agaugcccgc uuaccaggag cugguggagg 240
aggcgauugc cuauggccgg aagcugggcg ggucacaaga ggaccagauu aaaaaugcua 300
uugauaaacu uuuuguguug uuuggagcag aaauacuaaa gaagauuccg ggccgaguau 360
ccacagaagu agacgcaagg cucuccuuug auaaagaugc gaugguggcc agagccaggc 420
ggcucaucga gcucuacaag gaagcuggga ucagcaagga ccgaauucuu auaaagcugu 480
caucaaccug ggaaggaauu caggcuggaa aggagcucga ggagcagcac ggcauccacu 540
gcaacaugac guuacucuuc uccuucgccc aggcuguggc cugugccgag gcggguguga 600
cccucaucuc cccauuuguu gggcgcaucc uugauuggca uguggcaaac accgacaaga 660
aauccuauga gccccuggaa gacccugggg uaaagagugu cacuaaaauc uacaacuacu 720
acaagaaguu uagcuacaaa accauuguca ugggcgccuc cuuccgcaac acgggcgaga 780
ucaaagcacu ggccggcugu gacuuccuca ccaucucacc caagcuccug ggagagcugc 840
ugcaggacaa cgccaagcug gugccugugc ucucagccaa ggcggcccaa gccagugacc 900
uggaaaaaau ccaccuggau gagaagucuu uccguugguu gcacaacgag gaccagaugg 960
cuguggagaa gcucucugac gggauccgca aguuugccgc ugaugcagug aagcuggagc 1020
ggaugcugac agaacgaaug uucaaugcag agaauggaaa guagcgcauc ccugaggcug 1080
gacuccagau cugcaccgcc ggccagcugg gaucugacug cacguggcuu cugaugaauc 1140
uugcguuuuu uacaaauugg agcagggaca gaucauagau uucugauuuu auguaaaauu 1200
uugccuaaua cauuaaagca gucacuuuuc cugugcuguu ucaaaaaaaa aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 1319
<210> 24
<211> 2920
<212> RNA
<213> 智人
<400> 24
gauuuaugga aagcaccugg ugcguguucu gcccucugag gacccugccc uuucccaaaa 60
gggguaucuu aagaaggaaa auauggcugc ucuuugccgg acagcagagu cccaguagga 120
uuuccauuuu ccaaaccugg uaucaucucc uaguuggaag aagugguaag cccacgaaca 180
caaaugcagg agggagaggu gccaagaagc agcgguacac agcaggcaca gagacacgug 240
gucuucagca gagccuaugg gguucagaug auucacauaa gaauagaagu uucagggcug 300
gaccugggga ggcagccuga gccugagccg gcuguccuga gccugaguac ucuagcugcc 360
uugucgucau cgcaucuggc ugccauccag cgccagcaca caguaaugag uggccgagcu 420
uccucuggga gggaggaaac aguuaaaauc uugcagcagc ugcaaucauc uaggcguggu 480
ucucuugucu gacuugggcu gcacagaucc ugggccaagg gacagaagaa agacagccua 540
ggagcagagc cucccagaug gcugaguugg aucuaauggc uccagggcca cugcccaggg 600
ccacugcuca gcccccagcc ccucucagcc cagacucugg gucacccagc ccagauucug 660
ggucagccag cccaguggaa gaagaggacg ugggcuccuc ggagaagcuu ggcagggaga 720
cggaggaaca ggacagcgac ucugcagagc agggggaucc ugcuggugag gggaaagagg 780
uccuguguga cuucugccuu gaugacacca gaagagugaa ggcagugaag uccugucuaa 840
ccugcauggu gaauuacugu gaagagcacu ugcagccgca ucaggugaac aucaaacugc 900
aaagccaccu gcugaccgag ccagugaagg accacaacug gcgauacugc ccugcccacc 960
acagcccacu gucugccuuc ugcugcccug aucagcagug caucugccag gacuguugcc 1020
aggagcacag uggccacacc auagucuccc uggaugcagc ccgcagggac aaggaggcug 1080
aacuccagug cacccaguua gacuuggagc ggaaacucaa guugaaugaa aaugccaucu 1140
ccaggcucca ggcuaaccaa aagucuguuc uggugucggu gucagagguc aaagcggugg 1200
cugaaaugca guuuggggaa cuccuugcug cugugaggaa ggcccaggcc aaugugaugc 1260
ucuucuuaga ggagaaggag caagcugcgc ugagccaggc caacgguauc aaggcccacc 1320
uggaguacag gagugccgag auggagaaga gcaagcagga gcuggagagg auggcggcca 1380
ucagcaacac uguccaguuc uuggaggagu acugcaaguu uaagaacacu gaagacauca 1440
ccuucccuag uguuuacgua gggcugaagg auaaacucuc gggcauccgc aaaguuauca 1500
cggaauccac uguacacuua auccaguugc uggagaacua uaagaaaaag cuccaggagu 1560
uuuccaagga agaggaguau gacaucagaa cucaaguguc ugccguuguu cagcgcaaau 1620
auuggacuuc caaaccugag cccagcacca gggaacaguu ccuccaauau gcguaugaca 1680
ucacguuuga cccggacaca gcacacaagu aucuccggcu gcaggaggag aaccgcaagg 1740
ucaccaacac cacgcccugg gagcaucccu acccggaccu ccccagcagg uuccugcacu 1800
ggcggcaggu gcugucccag cagagucugu accugcacag guacuauuuu gagguggaga 1860
ucuucggggc aggcaccuau guuggccuga ccugcaaagg caucgaccgg aaaggggagg 1920
agcgcaacag uugcauuucc ggaaacaacu ucuccuggag ccuccaaugg aacgggaagg 1980
aguucacggc cugguacagu gacauggaga ccccacucaa agcuggcccu uuccggaggc 2040
ucggggucua uaucgacuuc ccgggaggga uccuuuccuu cuauggcgua gaguaugaua 2100
ccaugacucu gguucacaag uuugccugca aauuuucaga accagucuau gcugccuucu 2160
ggcuuuccaa gaaggaaaac gccauccgga uuguagaucu gggagaggaa cccgagaagc 2220
cagcaccguc cuuggugggg acugcucccu agacuccagg agccauaucc cagaccuuug 2280
ccagcuacag ugaugggauu ugcauuuuag ggugauuugg gggcagaaau aacugcugau 2340
gguagcuggc uuuugaaauc cuaugggguc ucugaaugaa aacauucucc agcugcucuc 2400
uuuugcucca uauggugcug uucucuaugu guuugcagua auucuuuuuu uuuuuuuuga 2460
gacggagucu cgcacuguug cccaggcugg agagcagugg cgcgaucuug gcucacugca 2520
agcuccgccu cccgaguuca agcaauucuc cugccucagc cucccgagua gcugggauua 2580
caggugccug ccaccacacc cagcuaaugu uuuguauuuu uaguagagau gggguuucac 2640
cauguuggcc aggcagaucu caaacuccug accucgugau gcacccaccu cggccuccca 2700
aagugcuggg auuacaugcg ugagccacug cgcccugccu guuuguagua auuuuuaggc 2760
accaaaucuc ccucaucuuc uagugccauu cuccucucug uucagguaaa ugucacacug 2820
ugcccagaau ggaugaccag gaaccuuaaa gaguggcuga aaagauugca gaguuaucau 2880
aauaaauugc uaacuugcgu aaaaaaaaaa aaaaaaaaaa 2920
<210> 25
<211> 1982
<212> RNA
<213> 智人
<400> 25
gugccucccg gcugguuucu gagaucagcc acagaaguua aacuucuuuc cagggaagaa 60
gggcggggau gucagggcug gagagugccc guguccuucu gugugcauug ggcuccuucc 120
uccuuaauuc ucugcuuucc acuuuuaggc ugaacuccag ugcacccagu uagacuugga 180
gcggaaacuc aaguugaaug aaaaugccau cuccaggcuc caggcuaacc aaaagucugu 240
ucuggugucg gugucagagg ucaaagcagu ggcugaaaug caguuugggg aacuccuugc 300
ugcugugagg aaggcccagg ccaaugugau gcucuucuua gaggagaagg agcaagcugc 360
gcugagccag gccaacggua ucaaggccca ccuggaguac aggagugccg agauggagaa 420
gaguaagcag gagcuggaga cgauggcggc caucagcaac acuguccagu ucuuggagga 480
guacugcaag uuuaagaaca cugaagacau caccuucccu aguguuuaca uagggcugaa 540
ggauaaacuc ucgggcaucc gcaaaguuau cacggaaucc acuguacacu uaauccaguu 600
gcuggagaac uauaagaaaa agcuccagga guuuuccaag gaagaggagu augacaucag 660
aacucaagug ucugccauug uucagcgcaa auauuggacu uccaaaccug agcccagcac 720
cagggaacag uuccuccaau augugcauga caucacguuc gacccggaca cagcacacaa 780
guaucuccgg cugcaggagg agaaccgcaa ggucaccaac accacgcccu gggagcaucc 840
cuacccggac cuccccagca gguuccugca cuggcggcag gugcuguccc agcagagucu 900
guaccugcac agguacuauu uugaggugga gaucuucggg gcaggcaccu auguuggccu 960
gaccugcaaa ggcaucgacc agaaagggga ggagcgcagc aguugcauuu ccggaaacaa 1020
cuucuccugg agccuccaau ggaacgggaa ggaguucacg gccugguaca gugacaugga 1080
gaccccacuc aaagcuggcc cuuucuggag gcucgggguc uauauugacu ucccaggagg 1140
gauccuuucc uucuauggcg uagaguauga uuccaugacu cugguucaca aguuugccug 1200
caaguuuuca gaaccagucu augcugccuu cuggcuuucc aagaaggaaa acgccauccg 1260
gauuguagau cugggagagg aacccgagaa gccagcaccg uccuuggugg ggacugcucc 1320
cuagacucca ggagccauau cccagaccuu ugccagcuac agugauggga uuugcauuuu 1380
agggugauuu gggggcaaaa auaacugcug augguagcug gcuuuugaaa uccuaugggg 1440
ucucugaaug aaaacauucu ccagcugcuc ucuuuugcuc cauauggugc uguucucuau 1500
guguuugcag uaauucuuuu uuuuuuuuuu uuugagacgg agucucgcac uguugcccag 1560
gcuggagugc aguggcguga ucuuggcuca cugcaagcuc cgccucccga guucaagcaa 1620
uucuccugcc ucagccuccc gaguagcugg gauuacaggu gccugccacc acacccagcu 1680
aacguuuugu auuuuuagua gagauggggu uucaccaugu uggccaggca gaucucaaac 1740
uucugaccuc gugaugcacu caccucggcc ucccaaagug cugggauuac aggcgugagc 1800
cacugcgccc ugccuguuug uaguaauuuu uaggcaccaa aucucccuca ucuucuagug 1860
ccauucuccu cucuguucag guaaauguca cacugugccc agaauggaug accaggaacc 1920
uucaagagug gcugaaaaga uugcagaguu aucauaauaa auugcuaacu ugcguauuuc 1980
cu 1982
<210> 26
<211> 826
<212> RNA
<213> 智人
<400> 26
cucgcaggcu ccaggggcgg ggcguggccg gggcgcagcg acgggcgcgg agguccggcc 60
gggcgcgcgc gcccccgcca cacgcacgcc gggcgugcca guuuauaaag ggagagagca 120
agcagcgagu cuugaagcuc uguuuggugc uuuggaucca uuuccaucgg uccuuacagc 180
cgcucgucag acuccagcag ccaagauggu gaagcagauc gagagcaaga cugcuuuuca 240
ggaagccuug gacgcugcag gugauaaacu uguaguaguu gacuucucag ccacguggug 300
ugggccuugc aaaaugauca agccuuucuu ucaugauguu gcuucagagu gugaagucaa 360
augcaugcca acauuccagu uuuuuaagaa gggacaaaag gugggugaau uuucuggagc 420
caauaaggaa aagcuugaag ccaccauuaa ugaauuaguc uaaucauguu uucugaaaau 480
auaaccagcc auuggcuauu uaaaacuugu aauuuuuuua auuuacaaaa auauaaaaua 540
ugaagacaua aacccaguug ccaucugcgu gacaauaaaa cauuaaugcu aacacuuuuu 600
aaaaccgucu caugucugaa uagcuuucaa aauaaaugug aaauggucau uuaauguauu 660
uuccuauauu cucaaucacu uuuuaguaac cuuguaggcc acugauuauu uuaagauuuu 720
aaaaauuauu auugcuaccu uaauguauug cuacaaaaau cucuuguugg gggcaaugca 780
gguaauaaag uaguauguug uuauuuguaa aaaaaaaaaa aaaaaa 826
<210> 27
<211> 3846
<212> RNA
<213> 智人
<400> 27
agacccucac gugaugacaa cagcuagcaa aguucuguag cuacugccuu agggcauagu 60
cuaauuucuu caguaaaaac acacuuauuc caaauuuggu uccagaauug ccuuaaauug 120
uuuuugcucu guucuuaggu ugggggcggc uaugagcagg cagaggaugu ggugucaccc 180
aauuaggagc ucucagcuua cgaggcaauu agcauagguu gccagggcug cacgaggagu 240
ggauuucugc uuugucauuc ugacucuggc aguuagcccg cccgcucggc gcagggcgug 300
gcuucucgua gccauuagga aacagcaacc cuuucaccuc aguuuucuuc acuccggcau 360
uugcagcaga gcgaaaggug gucgaguccu gaaggagggc cugaugucuu caucauucuc 420
aaauucuuag gacggucggg cccuggaagg aacgcucucg gaauuggccg cggaaaccga 480
ucugcccguu guguuuguga aacagagaaa gauaggcggc caugguccaa ccuugaagga 540
ggcagcccaa uauggcaaga aggugauggu ccuggacuuu gucacuccca ccccucuugg 600
aacuagaugg ggucucggag gaacaugugu gaaugugggu ugcauaccua aaaaacugau 660
gcaucaagca gcuuuguuag gacaagcccu gcaagacucu cgaaauuaug gauggaaagu 720
cgaggagaca guuaagcaug auugggacag aaugauagaa gcuguacaga aucacauugg 780
cucuuugaau uggggcuacc gaguagcucu gcgggagaaa aaagucgucu augagaaugc 840
uuaugggcaa uuuauugguc cucacaggau uaaggcaaca aauaauaaag gcaaagaaaa 900
aauuuauuca gcagagagau uucucauugc cacuggugaa agaccacguu acuugggcau 960
cccuggugac aaagaauacu gcaucagcag ugaugaucuu uucuccuugc cuuacugccc 1020
ggguaagacc cugguuguug gagcauccua ugucgcuuug gagugcgcug gauuucuugc 1080
ugguauuggu uuagacguca cuguuauggu uagguccauu cuucuuagag gauuugacca 1140
ggacauggcc aacaaaauug gugaacacau ggaagaacau ggcaucaagu uuauaagaca 1200
guucguacca auuaaaguug aacaaauuga agcagggaca ccaggccgac ucagaguagu 1260
agcucagucc accaauagug aggaaaucau ugaaggagaa uauaauacgg ugaugcuggc 1320
aauaggaaga gaugcuugca caagaaaaau uggcuuagaa accguagggg ugaagauaaa 1380
ugaaaagacu ggaaaaauac cugucacaga ugaagaacag accaaugugc cuuacaucua 1440
ugccauuggc gauauauugg aggauaaggu ggagcucacc ccaguugcaa uccaggcagg 1500
aagauugcug gcucagaggc ucuaugcagg uuccacuguc aagugugacu augaaaaugu 1560
uccaaccacu guauuuacuc cuuuggaaua uggugcuugu ggccuuucug aggagaaagc 1620
uguggagaag uuuggggaag aaaauauuga gguuuaccau aguuacuuuu ggccauugga 1680
auggacgauu ccgucaagag auaacaacaa auguuaugca aaaauaaucu guaauacuaa 1740
agacaaugaa cguguugugg gcuuucacgu acugggucca aaugcuggag aaguuacaca 1800
aggcuuugca gcugcgcuca aauguggacu gaccaaaaag cagcuggaca gcacaauugg 1860
aauccacccu gucugugcag agguauucac aacauugucu gugaccaagc gcucuggggc 1920
aagcauccuc caggcuggcu gcugagguua agccccagug uggaugcugu ugccaagacu 1980
gcaaaccacu ggcucguuuc cgugcccaaa uccaaggcga aguuuucuag aggguucuug 2040
ggcucuuggc accugcgugu ccugugcuua ccaccgccca aggcccccuu ggaucucuug 2100
gauaggaguu ggugaauaga aggcaggcag caucacacug gggucacuga cagacuugaa 2160
gcugacauuu ggcagggcau cgaagggaug cauccaugaa gucaccaguc ucaagcccau 2220
gugguaggcg gugauggaac aacugucaaa ucaguuuuag caugaccuuu ccuuguggau 2280
uuucuuauuc ucguugucaa guuuucuagg guugaauuuu uuucuuuuuu cuccauggug 2340
uuaaugauau uagagaugaa aaacguuagc aguugauuuu uguccaaaag caagucaugg 2400
cuagaguauc caugcaaggu gucuuguugc auggaaggga uaguuuggcu cccuuggagg 2460
cuauguaggc uugucccggg aaagagaacu guccugcagc ugaaauggac uguucuuuac 2520
ugaccugcuc agcaguuucu ucucucauau auucccaaaa caaguacauc ugcgaucaac 2580
ucuagccaaa uuugccccug ugugcuacau gauggaugau uauuauuuua aggucuguuu 2640
aggaagggaa auggcuacuu ggccagccau ugccuggcau uugguaguau aguaugauuc 2700
ucaccauuau uugucaugga ggcagacaua caccagaaau gggggagaaa caguacauau 2760
cuuucugucu uuaguuuauu gugugcuggu cuaagcaagc ugagaucauu ugcaauggaa 2820
aacacguaac uuguuuaaaa guuuuucugg uagcuuuagc uuuaugcuaa aaaaaauaau 2880
gacauugggu aucuauuucu uucuaagacu acauuaguag gaaaauaagu cuuuucaugc 2940
uuaugauuua gcuguuuugu gguaauugcu uuuuaaagga aguuauuaau aucauaaguu 3000
auuauuaaua uuuugaacac agguggaugu gaaggauuuu cauuuaaaaa ccaagugguu 3060
uugacuuuuu cuguugaaug aacaacugug ccuuguggaa uuuuugcaga aguguuuaug 3120
cuuuguuagc auuucaacuu gcauuauuau aaagagguau uaaugccuca guuauguguu 3180
ugucaaugua cuggcugagg auucuaucuc agcugucuuu ucuaacugug uagguugagu 3240
uuugaacacg ugcuugugga caucaggccu ccugccagca guucuugaag cuucuuuuuc 3300
auuccugcua cucuaccugu auuucucagu ugcagcacug aguggucaaa auacauuucu 3360
gggccaccuc agggaaccca ugcaucugcc uggcauuuag gcagcagagc cccugaccgu 3420
cccccacagg gcucugccuc acguccucau cucauuuggc uguguaaaga aaugggaaaa 3480
gggaaaagga gagagcaauu gaggcaguug accauauuca guuuuauuua uuuauuuuua 3540
auuuguuuuu uucuccaagu ccaccagucu cugaaauuag aacaguaggc gguaugagau 3600
aaucaggccu aaucauguug ugauucucuu uucuuagugg aguggaaugu ucuaucccca 3660
caagaaggau uauaucuuau agacuugucu uguucagauu cuguauuuac ccauuuuauu 3720
gaaacauaua cuaaguucca uguauuuuug uuacaaaucu ucugaaaaaa aacaaaacaa 3780
ugugaaacau uaaaauuaaa aggcauuaau aauauccacg ugugccuucu uacugaaaaa 3840
aaaaaa 3846
<210> 28
<211> 3013
<212> RNA
<213> 智人
<400> 28
gugaaggaaa uagggaccug gcccugggcc uuguguagcg ggagggggag cuaggaagca 60
gcugagggca gaauccagga gggccuggcu gcgggggaau gaagccuccg ccuucgcagg 120
caaaagccuu uaaauacggg cucaggcccg ggacucagag uguaacgcgu ggcagccuga 180
gggaggggcg ugcgccgaga gggagcucag aucgagcggg gcgcgggugg agaagcugcg 240
gcggcgcggc ccguaggaag gugcuguccg aacgaucggg auaggagcgg ucccugcgcu 300
ugcugcuggg aagugguaca aucauguuug aaauuaagaa gaucuguugc aucggugcag 360
gcuauguugg aggacccaca uguaguguca uugcucauau guguccugaa aucaggguaa 420
cgguuguuga ugucaaugaa ucaagaauca augcguggaa uucuccuaca cuuccuauuu 480
augagccagg acuaaaagaa gugguagaau ccugucgagg aaaaaaucuu uuuuuuucua 540
ccaauauuga ugaugccauc aaagaagcug aucuuguauu uauuucugug cuguccaacc 600
cugaguuucu ggcagaggga acagccauca aggaccuaaa gaacccagac agaguacuga 660
uuggagggga ugaaacucca gagggccaga gagcugugca ggcccugugu gcuguauaug 720
agcacugggu ucccagagaa aagauccuca ccacuaauac uuggucuuca gagcuuucca 780
aacuggcagc aaaugcuuuu cuugcccaga gaauaagcag cauuaacucc auaagugcuc 840
ugugugaagc aacaggagcu gauguagaag agguagcaac agcgauugga auggaccaga 900
gaauuggaaa caaguuucua aaagccagug uuggguuugg ugggagcugu uuccaaaagg 960
auguucugaa uuugguuuau cucugugagg cucugaauuu gccagaagua gcucguuauu 1020
ggcagcaggu cauagacaug aaugacuacc agaggaggag guuugcuucc cggaucauag 1080
auagucuguu uaauacagua acugauaaga agauagcuau uuugggauuu gcauucaaaa 1140
aggacacugg ugauacaaga gaaucuucua guauauauau uagcaaauau uugauggaug 1200
aaggugcaca ucuacauaua uaugauccaa aaguaccuag ggaacaaaua guuguggauc 1260
uuucucaucc agguguuuca gaggaugacc aagugucccg gcucgugacc auuuccaagg 1320
auccauauga agcaugugau ggugcccaug cuguuguuau uugcacugag ugggacaugu 1380
uuaaggaauu ggauuaugaa cgcauucaua aaaaaaugcu aaagccagcc uuuaucuucg 1440
auggacggcg uguccuggau gggcuccaca augaacuaca aaccauuggc uuccagauug 1500
aaacaauugg caaaaaggug ucuucaaaga gaauuccaua ugcuccuucu ggugaaauuc 1560
cgaaguuuag ucuucaagau ccaccuaaca agaaaccuaa aguguagaga uugccauuuu 1620
uauuugugau uuuuuuuuuu uuuuuuuggu acuucaggau agcaaauauc uaucugcuau 1680
uaaaugguaa augaaccaag uguuuuuuuu uguuuuuuuu uugagacaga gucucacugu 1740
ugcccaggcu ggagugcagu ggugcaaucu cggcucacug caagcucugc uucccagguu 1800
cacgccauuc uccuggcuca gccucccaag uagcugggac uacaggcacc cgccacagug 1860
ccuggcuaau uuuuuguauu uuuaguagag acaggguuuc accaugugag ccaggauggu 1920
cucaaucucc ugaccuugug aaccacccgu cucggccucc caaagugcug ggauuacagg 1980
ugugagccac cacgccuggc ccaugaacca aguguuuuua aggaaacaaa acuauuuuuu 2040
uaaucaucag auuuauacua gcuauaugga uauuagcaua ucugguaauu augaaucuag 2100
aauuuuuuua cauauuuuua uaauacuguu agcucaguua uuggaugagu gaaagauaau 2160
cauguugguu uuaauagugu caauuuuugu aaaauaaaaa uuaaacuuca aacucuuuac 2220
uuuauaaauu guccauaggc cacacuuuaa uaucacauua uaaagggaag gacagucuuc 2280
auuccuccug guuauugguu uguuugucau uaaagauaua uuuugaaucc augaaauugc 2340
uaugcuaaac agccuuuaca uguauggucu gguuaaaguu ccuuuguucc uuuuguuuua 2400
auaaaaugug ucacugauuu uuuagcucaa aaucaucacu guuaauuucc agucacccca 2460
aauaugguua aaagauuuuu uuuuuaauca ugaagagaaa auuaguagca uuucuuucuc 2520
uccccauuau uuauugguuu uccucacuaa ucuuuuuuuu uuuaguccaa aagccaaaaa 2580
uauuuaucuu gguuuuacau uuuaauuucc auucuuaauu guaauuuuuu ucuuuaaaua 2640
aggaaaccaa uauaaucuca uguauaaaaa cuuaaauauu uuacaaguua cauauagcau 2700
cauucuaaaa uaagaauuuu uuuuguuuuc ugucugcuuu uuucuuaugu cucuuguuga 2760
guuuuauauu uucagugguu auuuuugcuu guguuagauc auuauuaaaa uauauccaau 2820
gucccuuuga uacuugugcu cugcugagaa uguacaguuu gcauuaaaca ucccaggucu 2880
cauccuucag gaauuuugca guucaaugag aagagggaga caaauauaaa gaugaggaca 2940
gaagcaucuc uacagaugaa aauuacauaa auaaaacauu cuccaucaac aacuaaaaaa 3000
aaaaaaaaaa aaa 3013
<210> 29
<211> 19
<212> RNA
<213> 智人
<400> 29
uggaguaagu cgagaagua 19
<210> 30
<211> 19
<212> RNA
<213> 智人
<400> 30
acaacuagau gaagagaca 19
<210> 31
<211> 19
<212> RNA
<213> 智人
<400> 31
ugacagaagu ugacaauua 19
<210> 32
<211> 19
<212> RNA
<213> 智人
<400> 32
guaagaagcc agauguuaa 19
<210> 33
<211> 1545
<212> PRT
<213> 智人
<400> 33
Met Leu Glu Lys Phe Cys Asn Ser Thr Phe Trp Asn Ser Ser Phe Leu
1 5 10 15
Asp Ser Pro Glu Ala Asp Leu Pro Leu Cys Phe Glu Gln Thr Val Leu
20 25 30
Val Trp Ile Pro Leu Gly Tyr Leu Trp Leu Leu Ala Pro Trp Gln Leu
35 40 45
Leu His Val Tyr Lys Ser Arg Thr Lys Arg Ser Ser Thr Thr Lys Leu
50 55 60
Tyr Leu Ala Lys Gln Val Phe Val Gly Phe Leu Leu Ile Leu Ala Ala
65 70 75 80
Ile Glu Leu Ala Leu Val Leu Thr Glu Asp Ser Gly Gln Ala Thr Val
85 90 95
Pro Ala Val Arg Tyr Thr Asn Pro Ser Leu Tyr Leu Gly Thr Trp Leu
100 105 110
Leu Val Leu Leu Ile Gln Tyr Ser Arg Gln Trp Cys Val Gln Lys Asn
115 120 125
Ser Trp Phe Leu Ser Leu Phe Trp Ile Leu Ser Ile Leu Cys Gly Thr
130 135 140
Phe Gln Phe Gln Thr Leu Ile Arg Thr Leu Leu Gln Gly Asp Asn Ser
145 150 155 160
Asn Leu Ala Tyr Ser Cys Leu Phe Phe Ile Ser Tyr Gly Phe Gln Ile
165 170 175
Leu Ile Leu Ile Phe Ser Ala Phe Ser Glu Asn Asn Glu Ser Ser Asn
180 185 190
Asn Pro Ser Ser Ile Ala Ser Phe Leu Ser Ser Ile Thr Tyr Ser Trp
195 200 205
Tyr Asp Ser Ile Ile Leu Lys Gly Tyr Lys Arg Pro Leu Thr Leu Glu
210 215 220
Asp Val Trp Glu Val Asp Glu Glu Met Lys Thr Lys Thr Leu Val Ser
225 230 235 240
Lys Phe Glu Thr His Met Lys Arg Glu Leu Gln Lys Ala Arg Arg Ala
245 250 255
Leu Gln Arg Arg Gln Glu Lys Ser Ser Gln Gln Asn Ser Gly Ala Arg
260 265 270
Leu Pro Gly Leu Asn Lys Asn Gln Ser Gln Ser Gln Asp Ala Leu Val
275 280 285
Leu Glu Asp Val Glu Lys Lys Lys Lys Lys Ser Gly Thr Lys Lys Asp
290 295 300
Val Pro Lys Ser Trp Leu Met Lys Ala Leu Phe Lys Thr Phe Tyr Met
305 310 315 320
Val Leu Leu Lys Ser Phe Leu Leu Lys Leu Val Asn Asp Ile Phe Thr
325 330 335
Phe Val Ser Pro Gln Leu Leu Lys Leu Leu Ile Ser Phe Ala Ser Asp
340 345 350
Arg Asp Thr Tyr Leu Trp Ile Gly Tyr Leu Cys Ala Ile Leu Leu Phe
355 360 365
Thr Ala Ala Leu Ile Gln Ser Phe Cys Leu Gln Cys Tyr Phe Gln Leu
370 375 380
Cys Phe Lys Leu Gly Val Lys Val Arg Thr Ala Ile Met Ala Ser Val
385 390 395 400
Tyr Lys Lys Ala Leu Thr Leu Ser Asn Leu Ala Arg Lys Glu Tyr Thr
405 410 415
Val Gly Glu Thr Val Asn Leu Met Ser Val Asp Ala Gln Lys Leu Met
420 425 430
Asp Val Thr Asn Phe Met His Met Leu Trp Ser Ser Val Leu Gln Ile
435 440 445
Val Leu Ser Ile Phe Phe Leu Trp Arg Glu Leu Gly Pro Ser Val Leu
450 455 460
Ala Gly Val Gly Val Met Val Leu Val Ile Pro Ile Asn Ala Ile Leu
465 470 475 480
Ser Thr Lys Ser Lys Thr Ile Gln Val Lys Asn Met Lys Asn Lys Asp
485 490 495
Lys Arg Leu Lys Ile Met Asn Glu Ile Leu Ser Gly Ile Lys Ile Leu
500 505 510
Lys Tyr Phe Ala Trp Glu Pro Ser Phe Arg Asp Gln Val Gln Asn Leu
515 520 525
Arg Lys Lys Glu Leu Lys Asn Leu Leu Ala Phe Ser Gln Leu Gln Cys
530 535 540
Val Val Ile Phe Val Phe Gln Leu Thr Pro Val Leu Val Ser Val Val
545 550 555 560
Thr Phe Ser Val Tyr Val Leu Val Asp Ser Asn Asn Ile Leu Asp Ala
565 570 575
Gln Lys Ala Phe Thr Ser Ile Thr Leu Phe Asn Ile Leu Arg Phe Pro
580 585 590
Leu Ser Met Leu Pro Met Met Ile Ser Ser Met Leu Gln Ala Ser Val
595 600 605
Ser Thr Glu Arg Leu Glu Lys Tyr Leu Gly Gly Asp Asp Leu Asp Thr
610 615 620
Ser Ala Ile Arg His Asp Cys Asn Phe Asp Lys Ala Met Gln Phe Ser
625 630 635 640
Glu Ala Ser Phe Thr Trp Glu His Asp Ser Glu Ala Thr Val Arg Asp
645 650 655
Val Asn Leu Asp Ile Met Ala Gly Gln Leu Val Ala Val Ile Gly Pro
660 665 670
Val Gly Ser Gly Lys Ser Ser Leu Ile Ser Ala Met Leu Gly Glu Met
675 680 685
Glu Asn Val His Gly His Ile Thr Ile Lys Gly Thr Thr Ala Tyr Val
690 695 700
Pro Gln Gln Ser Trp Ile Gln Asn Gly Thr Ile Lys Asp Asn Ile Leu
705 710 715 720
Phe Gly Thr Glu Phe Asn Glu Lys Arg Tyr Gln Gln Val Leu Glu Ala
725 730 735
Cys Ala Leu Leu Pro Asp Leu Glu Met Leu Pro Gly Gly Asp Leu Ala
740 745 750
Glu Ile Gly Glu Lys Gly Ile Asn Leu Ser Gly Gly Gln Lys Gln Arg
755 760 765
Ile Ser Leu Ala Arg Ala Thr Tyr Gln Asn Leu Asp Ile Tyr Leu Leu
770 775 780
Asp Asp Pro Leu Ser Ala Val Asp Ala His Val Gly Lys His Ile Phe
785 790 795 800
Asn Lys Val Leu Gly Pro Asn Gly Leu Leu Lys Gly Lys Thr Arg Leu
805 810 815
Leu Val Thr His Ser Met His Phe Leu Pro Gln Val Asp Glu Ile Val
820 825 830
Val Leu Gly Asn Gly Thr Ile Val Glu Lys Gly Ser Tyr Ser Ala Leu
835 840 845
Leu Ala Lys Lys Gly Glu Phe Ala Lys Asn Leu Lys Thr Phe Leu Arg
850 855 860
His Thr Gly Pro Glu Glu Glu Ala Thr Val His Asp Gly Ser Glu Glu
865 870 875 880
Glu Asp Asp Asp Tyr Gly Leu Ile Ser Ser Val Glu Glu Ile Pro Glu
885 890 895
Asp Ala Ala Ser Ile Thr Met Arg Arg Glu Asn Ser Phe Arg Arg Thr
900 905 910
Leu Ser Arg Ser Ser Arg Ser Asn Gly Arg His Leu Lys Ser Leu Arg
915 920 925
Asn Ser Leu Lys Thr Arg Asn Val Asn Ser Leu Lys Glu Asp Glu Glu
930 935 940
Leu Val Lys Gly Gln Lys Leu Ile Lys Lys Glu Phe Ile Glu Thr Gly
945 950 955 960
Lys Val Lys Phe Ser Ile Tyr Leu Glu Tyr Leu Gln Ala Ile Gly Leu
965 970 975
Phe Ser Ile Phe Phe Ile Ile Leu Ala Phe Val Met Asn Ser Val Ala
980 985 990
Phe Ile Gly Ser Asn Leu Trp Leu Ser Ala Trp Thr Ser Asp Ser Lys
995 1000 1005
Ile Phe Asn Ser Thr Asp Tyr Pro Ala Ser Gln Arg Asp Met Arg
1010 1015 1020
Val Gly Val Tyr Gly Ala Leu Gly Leu Ala Gln Gly Ile Phe Val
1025 1030 1035
Phe Ile Ala His Phe Trp Ser Ala Phe Gly Phe Val His Ala Ser
1040 1045 1050
Asn Ile Leu His Lys Gln Leu Leu Asn Asn Ile Leu Arg Ala Pro
1055 1060 1065
Met Arg Phe Phe Asp Thr Thr Pro Thr Gly Arg Ile Val Asn Arg
1070 1075 1080
Phe Ala Gly Asp Ile Ser Thr Val Asp Asp Thr Leu Pro Gln Ser
1085 1090 1095
Leu Arg Ser Trp Ile Thr Cys Phe Leu Gly Ile Ile Ser Thr Leu
1100 1105 1110
Val Met Ile Cys Met Ala Thr Pro Val Phe Thr Ile Ile Val Ile
1115 1120 1125
Pro Leu Gly Ile Ile Tyr Val Ser Val Gln Met Phe Tyr Val Ser
1130 1135 1140
Thr Ser Arg Gln Leu Arg Arg Leu Asp Ser Val Thr Arg Ser Pro
1145 1150 1155
Ile Tyr Ser His Phe Ser Glu Thr Val Ser Gly Leu Pro Val Ile
1160 1165 1170
Arg Ala Phe Glu His Gln Gln Arg Phe Leu Lys His Asn Glu Val
1175 1180 1185
Arg Ile Asp Thr Asn Gln Lys Cys Val Phe Ser Trp Ile Thr Ser
1190 1195 1200
Asn Arg Trp Leu Ala Ile Arg Leu Glu Leu Val Gly Asn Leu Thr
1205 1210 1215
Val Phe Phe Ser Ala Leu Met Met Val Ile Tyr Arg Asp Thr Leu
1220 1225 1230
Ser Gly Asp Thr Val Gly Phe Val Leu Ser Asn Ala Leu Asn Ile
1235 1240 1245
Thr Gln Thr Leu Asn Trp Leu Val Arg Met Thr Ser Glu Ile Glu
1250 1255 1260
Thr Asn Ile Val Ala Val Glu Arg Ile Thr Glu Tyr Thr Lys Val
1265 1270 1275
Glu Asn Glu Ala Pro Trp Val Thr Asp Lys Arg Pro Pro Pro Asp
1280 1285 1290
Trp Pro Ser Lys Gly Lys Ile Gln Phe Asn Asn Tyr Gln Val Arg
1295 1300 1305
Tyr Arg Pro Glu Leu Asp Leu Val Leu Arg Gly Ile Thr Cys Asp
1310 1315 1320
Ile Gly Ser Met Glu Lys Ile Gly Val Val Gly Arg Thr Gly Ala
1325 1330 1335
Gly Lys Ser Ser Leu Thr Asn Cys Leu Phe Arg Ile Leu Glu Ala
1340 1345 1350
Ala Gly Gly Gln Ile Ile Ile Asp Gly Val Asp Ile Ala Ser Ile
1355 1360 1365
Gly Leu His Asp Leu Arg Glu Lys Leu Thr Ile Ile Pro Gln Asp
1370 1375 1380
Pro Ile Leu Phe Ser Gly Ser Leu Arg Met Asn Leu Asp Pro Phe
1385 1390 1395
Asn Asn Tyr Ser Asp Glu Glu Ile Trp Lys Ala Leu Glu Leu Ala
1400 1405 1410
His Leu Lys Ser Phe Val Ala Ser Leu Gln Leu Gly Leu Ser His
1415 1420 1425
Glu Val Thr Glu Ala Gly Gly Asn Leu Ser Ile Gly Gln Arg Gln
1430 1435 1440
Leu Leu Cys Leu Gly Arg Ala Leu Leu Arg Lys Ser Lys Ile Leu
1445 1450 1455
Val Leu Asp Glu Ala Thr Ala Ala Val Asp Leu Glu Thr Asp Asn
1460 1465 1470
Leu Ile Gln Thr Thr Ile Gln Asn Glu Phe Ala His Cys Thr Val
1475 1480 1485
Ile Thr Ile Ala His Arg Leu His Thr Ile Met Asp Ser Asp Lys
1490 1495 1500
Val Met Val Leu Asp Asn Gly Lys Ile Ile Glu Cys Gly Ser Pro
1505 1510 1515
Glu Glu Leu Leu Gln Ile Pro Gly Pro Phe Tyr Phe Met Ala Lys
1520 1525 1530
Glu Ala Gly Ile Glu Asn Val Asn Ser Thr Lys Phe
1535 1540 1545
<210> 34
<211> 316
<212> PRT
<213> 智人
<400> 34
Met Ala Thr Phe Val Glu Leu Ser Thr Lys Ala Lys Met Pro Ile Val
1 5 10 15
Gly Leu Gly Thr Trp Lys Ser Pro Leu Gly Lys Val Lys Glu Ala Val
20 25 30
Lys Val Ala Ile Asp Ala Gly Tyr Arg His Ile Asp Cys Ala Tyr Val
35 40 45
Tyr Gln Asn Glu His Glu Val Gly Glu Ala Ile Gln Glu Lys Ile Gln
50 55 60
Glu Lys Ala Val Lys Arg Glu Asp Leu Phe Ile Val Ser Lys Leu Trp
65 70 75 80
Pro Thr Phe Phe Glu Arg Pro Leu Val Arg Lys Ala Phe Glu Lys Thr
85 90 95
Leu Lys Asp Leu Lys Leu Ser Tyr Leu Asp Val Tyr Leu Ile His Trp
100 105 110
Pro Gln Gly Phe Lys Ser Gly Asp Asp Leu Phe Pro Lys Asp Asp Lys
115 120 125
Gly Asn Ala Ile Gly Gly Lys Ala Thr Phe Leu Asp Ala Trp Glu Ala
130 135 140
Met Glu Glu Leu Val Asp Glu Gly Leu Val Lys Ala Leu Gly Val Ser
145 150 155 160
Asn Phe Ser His Phe Gln Ile Glu Lys Leu Leu Asn Lys Pro Gly Leu
165 170 175
Lys Tyr Lys Pro Val Thr Asn Gln Val Glu Cys His Pro Tyr Leu Thr
180 185 190
Gln Glu Lys Leu Ile Gln Tyr Cys His Ser Lys Gly Ile Thr Val Thr
195 200 205
Ala Tyr Ser Pro Leu Gly Ser Pro Asp Arg Pro Trp Ala Lys Pro Glu
210 215 220
Asp Pro Ser Leu Leu Glu Asp Pro Lys Ile Lys Glu Ile Ala Ala Lys
225 230 235 240
His Lys Lys Thr Ala Ala Gln Val Leu Ile Arg Phe His Ile Gln Arg
245 250 255
Asn Val Ile Val Ile Pro Lys Ser Val Thr Pro Ala Arg Ile Val Glu
260 265 270
Asn Ile Gln Val Phe Asp Phe Lys Leu Ser Asp Glu Glu Met Ala Thr
275 280 285
Ile Leu Ser Phe Asn Arg Asn Trp Arg Ala Cys Asn Val Leu Gln Ser
290 295 300
Ser His Leu Glu Asp Tyr Pro Phe Asn Ala Glu Tyr
305 310 315
<210> 35
<211> 316
<212> PRT
<213> 智人
<400> 35
Met Ala Thr Phe Val Glu Leu Ser Thr Lys Ala Lys Met Pro Ile Val
1 5 10 15
Gly Leu Gly Thr Trp Arg Ser Leu Leu Gly Lys Val Lys Glu Ala Val
20 25 30
Lys Val Ala Ile Asp Ala Glu Tyr Arg His Ile Asp Cys Ala Tyr Phe
35 40 45
Tyr Glu Asn Gln His Glu Val Gly Glu Ala Ile Gln Glu Lys Ile Gln
50 55 60
Glu Lys Ala Val Met Arg Glu Asp Leu Phe Ile Val Ser Lys Val Trp
65 70 75 80
Pro Thr Phe Phe Glu Arg Pro Leu Val Arg Lys Ala Phe Glu Lys Thr
85 90 95
Leu Lys Asp Leu Lys Leu Ser Tyr Leu Asp Val Tyr Leu Ile His Trp
100 105 110
Pro Gln Gly Phe Lys Thr Gly Asp Asp Phe Phe Pro Lys Asp Asp Lys
115 120 125
Gly Asn Met Ile Ser Gly Lys Gly Thr Phe Leu Asp Ala Trp Glu Ala
130 135 140
Met Glu Glu Leu Val Asp Glu Gly Leu Val Lys Ala Leu Gly Val Ser
145 150 155 160
Asn Phe Asn His Phe Gln Ile Glu Arg Leu Leu Asn Lys Pro Gly Leu
165 170 175
Lys Tyr Lys Pro Val Thr Asn Gln Val Glu Cys His Pro Tyr Leu Thr
180 185 190
Gln Glu Lys Leu Ile Gln Tyr Cys His Ser Lys Gly Ile Thr Val Thr
195 200 205
Ala Tyr Ser Pro Leu Gly Ser Pro Asp Arg Pro Trp Ala Lys Pro Glu
210 215 220
Asp Pro Ser Leu Leu Glu Asp Pro Lys Ile Lys Glu Ile Ala Ala Lys
225 230 235 240
His Lys Lys Thr Thr Ala Gln Val Leu Ile Arg Phe His Ile Gln Arg
245 250 255
Asn Val Thr Val Ile Pro Lys Ser Met Thr Pro Ala His Ile Val Glu
260 265 270
Asn Ile Gln Val Phe Asp Phe Lys Leu Ser Asp Glu Glu Met Ala Thr
275 280 285
Ile Leu Ser Phe Asn Arg Asn Trp Arg Ala Phe Asp Phe Lys Glu Phe
290 295 300
Ser His Leu Glu Asp Phe Pro Phe Asp Ala Glu Tyr
305 310 315
<210> 36
<211> 323
<212> PRT
<213> 智人
<400> 36
Met Asp Ser Lys Tyr Gln Cys Val Lys Leu Asn Asp Gly His Phe Met
1 5 10 15
Pro Val Leu Gly Phe Gly Thr Tyr Ala Pro Ala Glu Val Pro Lys Ser
20 25 30
Lys Ala Leu Glu Ala Val Lys Leu Ala Ile Glu Ala Gly Phe His His
35 40 45
Ile Asp Ser Ala His Val Tyr Asn Asn Glu Glu Gln Val Gly Leu Ala
50 55 60
Ile Arg Ser Lys Ile Ala Asp Gly Ser Val Lys Arg Glu Asp Ile Phe
65 70 75 80
Tyr Thr Ser Lys Leu Trp Ser Asn Ser His Arg Pro Glu Leu Val Arg
85 90 95
Pro Ala Leu Glu Arg Ser Leu Lys Asn Leu Gln Leu Asp Tyr Val Asp
100 105 110
Leu Tyr Leu Ile His Phe Pro Val Ser Val Lys Pro Gly Glu Glu Val
115 120 125
Ile Pro Lys Asp Glu Asn Gly Lys Ile Leu Phe Asp Thr Val Asp Leu
130 135 140
Cys Ala Thr Trp Glu Ala Met Glu Lys Cys Lys Asp Ala Gly Leu Ala
145 150 155 160
Lys Ser Ile Gly Val Ser Asn Phe Asn His Arg Leu Leu Glu Met Ile
165 170 175
Leu Asn Lys Pro Gly Leu Lys Tyr Lys Pro Val Cys Asn Gln Val Glu
180 185 190
Cys His Pro Tyr Phe Asn Gln Arg Lys Leu Leu Asp Phe Cys Lys Ser
195 200 205
Lys Asp Ile Val Leu Val Ala Tyr Ser Ala Leu Gly Ser His Arg Glu
210 215 220
Glu Pro Trp Val Asp Pro Asn Ser Pro Val Leu Leu Glu Asp Pro Val
225 230 235 240
Leu Cys Ala Leu Ala Lys Lys His Lys Arg Thr Pro Ala Leu Ile Ala
245 250 255
Leu Arg Tyr Gln Leu Gln Arg Gly Val Val Val Leu Ala Lys Ser Tyr
260 265 270
Asn Glu Gln Arg Ile Arg Gln Asn Val Gln Val Phe Glu Phe Gln Leu
275 280 285
Thr Ser Glu Glu Met Lys Ala Ile Asp Gly Leu Asn Arg Asn Val Arg
290 295 300
Tyr Leu Thr Leu Asp Ile Phe Ala Gly Pro Pro Asn Tyr Pro Phe Ser
305 310 315 320
Asp Glu Tyr
<210> 37
<211> 323
<212> PRT
<213> 智人
<400> 37
Met Asp Ser Lys His Gln Cys Val Lys Leu Asn Asp Gly His Phe Met
1 5 10 15
Pro Val Leu Gly Phe Gly Thr Tyr Ala Pro Pro Glu Val Pro Arg Ser
20 25 30
Lys Ala Leu Glu Val Thr Lys Leu Ala Ile Glu Ala Gly Phe Arg His
35 40 45
Ile Asp Ser Ala His Leu Tyr Asn Asn Glu Glu Gln Val Gly Leu Ala
50 55 60
Ile Arg Ser Lys Ile Ala Asp Gly Ser Val Lys Arg Glu Asp Ile Phe
65 70 75 80
Tyr Thr Ser Lys Leu Trp Ser Thr Phe His Arg Pro Glu Leu Val Arg
85 90 95
Pro Ala Leu Glu Asn Ser Leu Lys Lys Ala Gln Leu Asp Tyr Val Asp
100 105 110
Leu Tyr Leu Ile His Ser Pro Met Ser Leu Lys Pro Gly Glu Glu Leu
115 120 125
Ser Pro Thr Asp Glu Asn Gly Lys Val Ile Phe Asp Ile Val Asp Leu
130 135 140
Cys Thr Thr Trp Glu Ala Met Glu Lys Cys Lys Asp Ala Gly Leu Ala
145 150 155 160
Lys Ser Ile Gly Val Ser Asn Phe Asn Arg Arg Gln Leu Glu Met Ile
165 170 175
Leu Asn Lys Pro Gly Leu Lys Tyr Lys Pro Val Cys Asn Gln Val Glu
180 185 190
Cys His Pro Tyr Phe Asn Arg Ser Lys Leu Leu Asp Phe Cys Lys Ser
195 200 205
Lys Asp Ile Val Leu Val Ala Tyr Ser Ala Leu Gly Ser Gln Arg Asp
210 215 220
Lys Arg Trp Val Asp Pro Asn Ser Pro Val Leu Leu Glu Asp Pro Val
225 230 235 240
Leu Cys Ala Leu Ala Lys Lys His Lys Arg Thr Pro Ala Leu Ile Ala
245 250 255
Leu Arg Tyr Gln Leu Gln Arg Gly Val Val Val Leu Ala Lys Ser Tyr
260 265 270
Asn Glu Gln Arg Ile Arg Gln Asn Val Gln Val Phe Glu Phe Gln Leu
275 280 285
Thr Ala Glu Asp Met Lys Ala Ile Asp Gly Leu Asp Arg Asn Leu His
290 295 300
Tyr Phe Asn Ser Asp Ser Phe Ala Ser His Pro Asn Tyr Pro Tyr Ser
305 310 315 320
Asp Glu Tyr
<210> 38
<211> 323
<212> PRT
<213> 智人
<400> 38
Met Asp Pro Lys Tyr Gln Arg Val Glu Leu Asn Asp Gly His Phe Met
1 5 10 15
Pro Val Leu Gly Phe Gly Thr Tyr Ala Pro Pro Glu Val Pro Arg Asn
20 25 30
Arg Ala Val Glu Val Thr Lys Leu Ala Ile Glu Ala Gly Phe Arg His
35 40 45
Ile Asp Ser Ala Tyr Leu Tyr Asn Asn Glu Glu Gln Val Gly Leu Ala
50 55 60
Ile Arg Ser Lys Ile Ala Asp Gly Ser Val Lys Arg Glu Asp Ile Phe
65 70 75 80
Tyr Thr Ser Lys Leu Trp Cys Thr Phe Phe Gln Pro Gln Met Val Gln
85 90 95
Pro Ala Leu Glu Ser Ser Leu Lys Lys Leu Gln Leu Asp Tyr Val Asp
100 105 110
Leu Tyr Leu Leu His Phe Pro Met Ala Leu Lys Pro Gly Glu Thr Pro
115 120 125
Leu Pro Lys Asp Glu Asn Gly Lys Val Ile Phe Asp Thr Val Asp Leu
130 135 140
Ser Ala Thr Trp Glu Val Met Glu Lys Cys Lys Asp Ala Gly Leu Ala
145 150 155 160
Lys Ser Ile Gly Val Ser Asn Phe Asn Cys Arg Gln Leu Glu Met Ile
165 170 175
Leu Asn Lys Pro Gly Leu Lys Tyr Lys Pro Val Cys Asn Gln Val Glu
180 185 190
Cys His Pro Tyr Leu Asn Gln Ser Lys Leu Leu Asp Phe Cys Lys Ser
195 200 205
Lys Asp Ile Val Leu Val Ala His Ser Ala Leu Gly Thr Gln Arg His
210 215 220
Lys Leu Trp Val Asp Pro Asn Ser Pro Val Leu Leu Glu Asp Pro Val
225 230 235 240
Leu Cys Ala Leu Ala Lys Lys His Lys Gln Thr Pro Ala Leu Ile Ala
245 250 255
Leu Arg Tyr Gln Leu Gln Arg Gly Val Val Val Leu Ala Lys Ser Tyr
260 265 270
Asn Glu Gln Arg Ile Arg Glu Asn Ile Gln Val Phe Glu Phe Gln Leu
275 280 285
Thr Ser Glu Asp Met Lys Val Leu Asp Gly Leu Asn Arg Asn Tyr Arg
290 295 300
Tyr Val Val Met Asp Phe Leu Met Asp His Pro Asp Tyr Pro Phe Ser
305 310 315 320
Asp Glu Tyr
<210> 39
<211> 493
<212> PRT
<213> 智人
<400> 39
Met Ile Ser Ser Lys Pro Arg Leu Val Val Pro Tyr Gly Leu Lys Thr
1 5 10 15
Leu Leu Glu Gly Ile Ser Arg Ala Val Leu Lys Thr Asn Pro Ser Asn
20 25 30
Ile Asn Gln Phe Ala Ala Ala Tyr Phe Gln Glu Leu Thr Met Tyr Arg
35 40 45
Gly Asn Thr Thr Met Asp Ile Lys Asp Leu Val Lys Gln Phe His Gln
50 55 60
Ile Lys Val Glu Lys Trp Ser Glu Gly Thr Thr Pro Gln Lys Lys Leu
65 70 75 80
Glu Cys Leu Lys Glu Pro Gly Lys Thr Ser Val Glu Ser Lys Val Pro
85 90 95
Thr Gln Met Glu Lys Ser Thr Asp Thr Asp Glu Asp Asn Val Thr Arg
100 105 110
Thr Glu Tyr Ser Asp Lys Thr Thr Gln Phe Pro Ser Val Tyr Ala Val
115 120 125
Pro Gly Thr Glu Gln Thr Glu Ala Val Gly Gly Leu Ser Ser Lys Pro
130 135 140
Ala Thr Pro Lys Thr Thr Thr Pro Pro Ser Ser Pro Pro Pro Thr Ala
145 150 155 160
Val Ser Pro Glu Phe Ala Tyr Val Pro Ala Asp Pro Ala Gln Leu Ala
165 170 175
Ala Gln Met Leu Gly Lys Val Ser Ser Ile His Ser Asp Gln Ser Asp
180 185 190
Val Leu Met Val Asp Val Ala Thr Ser Met Pro Val Val Ile Lys Glu
195 200 205
Val Pro Ser Ser Glu Ala Ala Glu Asp Val Met Val Ala Ala Pro Leu
210 215 220
Val Cys Ser Gly Lys Val Leu Glu Val Gln Val Val Asn Gln Thr Ser
225 230 235 240
Val His Val Asp Leu Gly Ser Gln Pro Lys Glu Asn Glu Ala Glu Pro
245 250 255
Ser Thr Ala Ser Ser Val Pro Leu Gln Asp Glu Gln Glu Pro Pro Ala
260 265 270
Tyr Asp Gln Ala Pro Glu Val Thr Leu Gln Ala Asp Ile Glu Val Met
275 280 285
Ser Thr Val His Ile Ser Ser Val Tyr Asn Asp Val Pro Val Thr Glu
290 295 300
Gly Val Val Tyr Ile Glu Gln Leu Pro Glu Gln Ile Val Ile Pro Phe
305 310 315 320
Thr Asp Gln Val Ala Cys Leu Lys Glu Asn Glu Gln Ser Lys Glu Asn
325 330 335
Glu Gln Ser Pro Arg Val Ser Pro Lys Ser Val Val Glu Lys Thr Thr
340 345 350
Ser Gly Met Ser Lys Lys Ser Val Glu Ser Val Lys Leu Ala Gln Leu
355 360 365
Glu Glu Asn Ala Lys Tyr Ser Ser Val Tyr Met Glu Ala Glu Ala Thr
370 375 380
Ala Leu Leu Ser Asp Thr Ser Leu Lys Gly Gln Pro Glu Val Pro Ala
385 390 395 400
Gln Leu Leu Asp Ala Glu Gly Ala Ile Lys Ile Gly Ser Glu Lys Ser
405 410 415
Leu His Leu Glu Val Glu Ile Thr Ser Ile Val Ser Asp Asn Thr Gly
420 425 430
Gln Glu Glu Ser Gly Glu Asn Ser Val Pro Gln Glu Met Glu Gly Lys
435 440 445
Pro Val Leu Ser Gly Glu Ala Ala Glu Ala Val His Ser Gly Thr Ser
450 455 460
Val Lys Ser Ser Ser Gly Pro Phe Pro Pro Ala Pro Glu Gly Leu Thr
465 470 475 480
Ala Pro Glu Ile Glu Pro Glu Gly Glu Ser Thr Ala Glu
485 490
<210> 40
<211> 524
<212> PRT
<213> 智人
<400> 40
Met Pro Gln Leu Ser Leu Ser Trp Leu Gly Leu Gly Pro Val Ala Ala
1 5 10 15
Ser Pro Trp Leu Leu Leu Leu Leu Val Gly Gly Ser Trp Leu Leu Ala
20 25 30
Arg Val Leu Ala Trp Thr Tyr Thr Phe Tyr Asp Asn Cys Arg Arg Leu
35 40 45
Gln Cys Phe Pro Gln Pro Pro Lys Gln Asn Trp Phe Trp Gly His Gln
50 55 60
Gly Leu Val Thr Pro Thr Glu Glu Gly Met Lys Thr Leu Thr Gln Leu
65 70 75 80
Val Thr Thr Tyr Pro Gln Gly Phe Lys Leu Trp Leu Gly Pro Thr Phe
85 90 95
Pro Leu Leu Ile Leu Cys His Pro Asp Ile Ile Arg Pro Ile Thr Ser
100 105 110
Ala Ser Ala Ala Val Ala Pro Lys Asp Met Ile Phe Tyr Gly Phe Leu
115 120 125
Lys Pro Trp Leu Gly Asp Gly Leu Leu Leu Ser Gly Gly Asp Lys Trp
130 135 140
Ser Arg His Arg Arg Met Leu Thr Pro Ala Phe His Phe Asn Ile Leu
145 150 155 160
Lys Pro Tyr Met Lys Ile Phe Asn Lys Ser Val Asn Ile Met His Asp
165 170 175
Lys Trp Gln Arg Leu Ala Ser Glu Gly Ser Ala Arg Leu Asp Met Phe
180 185 190
Glu His Ile Ser Leu Met Thr Leu Asp Ser Leu Gln Lys Cys Val Phe
195 200 205
Ser Phe Glu Ser Asn Cys Gln Glu Lys Pro Ser Glu Tyr Ile Ala Ala
210 215 220
Ile Leu Glu Leu Ser Ala Phe Val Glu Lys Arg Asn Gln Gln Ile Leu
225 230 235 240
Leu His Thr Asp Phe Leu Tyr Tyr Leu Thr Pro Asp Gly Gln Arg Phe
245 250 255
Arg Arg Ala Cys His Leu Val His Asp Phe Thr Asp Ala Val Ile Gln
260 265 270
Glu Arg Arg Cys Thr Leu Pro Thr Gln Gly Ile Asp Asp Phe Leu Lys
275 280 285
Asn Lys Ala Lys Ser Lys Thr Leu Asp Phe Ile Asp Val Leu Leu Leu
290 295 300
Ser Lys Asp Glu Asp Gly Lys Glu Leu Ser Asp Glu Asp Ile Arg Ala
305 310 315 320
Glu Ala Asp Thr Phe Met Phe Glu Gly His Asp Thr Thr Ala Ser Gly
325 330 335
Leu Ser Trp Val Leu Tyr His Leu Ala Lys His Pro Glu Tyr Gln Glu
340 345 350
Gln Cys Arg Gln Glu Val Gln Glu Leu Leu Lys Asp Arg Glu Pro Ile
355 360 365
Glu Ile Glu Trp Asp Asp Leu Ala Gln Leu Pro Phe Leu Thr Met Cys
370 375 380
Ile Lys Glu Ser Leu Arg Leu His Pro Pro Val Pro Val Ile Ser Arg
385 390 395 400
Cys Cys Thr Gln Asp Phe Val Leu Pro Asp Gly Arg Val Ile Pro Lys
405 410 415
Gly Ile Val Cys Leu Ile Asn Ile Ile Gly Ile His Tyr Asn Pro Thr
420 425 430
Val Trp Pro Asp Pro Glu Val Tyr Asp Pro Phe Arg Phe Asp Gln Glu
435 440 445
Asn Ile Lys Glu Arg Ser Pro Leu Ala Phe Ile Pro Phe Ser Ala Gly
450 455 460
Pro Arg Asn Cys Ile Gly Gln Ala Phe Ala Met Ala Glu Met Lys Val
465 470 475 480
Val Leu Ala Leu Thr Leu Leu His Phe Arg Ile Leu Pro Thr His Thr
485 490 495
Glu Pro Arg Arg Lys Pro Glu Leu Ile Leu Arg Ala Glu Gly Gly Leu
500 505 510
Trp Leu Arg Val Glu Pro Leu Gly Ala Asn Ser Gln
515 520
<210> 41
<211> 423
<212> PRT
<213> 智人
<400> 41
Met Arg Ser Leu Gly Ala Asn Met Ala Ala Ala Leu Arg Ala Ala Gly
1 5 10 15
Val Leu Leu Arg Asp Pro Leu Ala Ser Ser Ser Trp Arg Val Cys Gln
20 25 30
Pro Trp Arg Trp Lys Ser Gly Ala Ala Ala Ala Ala Val Thr Thr Glu
35 40 45
Thr Ala Gln His Ala Gln Gly Ala Lys Pro Gln Val Gln Pro Gln Lys
50 55 60
Arg Lys Pro Lys Thr Gly Ile Leu Met Leu Asn Met Gly Gly Pro Glu
65 70 75 80
Thr Leu Gly Asp Val His Asp Phe Leu Leu Arg Leu Phe Leu Asp Arg
85 90 95
Asp Leu Met Thr Leu Pro Ile Gln Asn Lys Leu Ala Pro Phe Ile Ala
100 105 110
Lys Arg Arg Thr Pro Lys Ile Gln Glu Gln Tyr Arg Arg Ile Gly Gly
115 120 125
Gly Ser Pro Ile Lys Ile Trp Thr Ser Lys Gln Gly Glu Gly Met Val
130 135 140
Lys Leu Leu Asp Glu Leu Ser Pro Asn Thr Ala Pro His Lys Tyr Tyr
145 150 155 160
Ile Gly Phe Arg Tyr Val His Pro Leu Thr Glu Glu Ala Ile Glu Glu
165 170 175
Met Glu Arg Asp Gly Leu Glu Arg Ala Ile Ala Phe Thr Gln Tyr Pro
180 185 190
Gln Tyr Ser Cys Ser Thr Thr Gly Ser Ser Leu Asn Ala Ile Tyr Arg
195 200 205
Tyr Tyr Asn Gln Val Gly Arg Lys Pro Thr Met Lys Trp Ser Thr Ile
210 215 220
Asp Arg Trp Pro Thr His His Leu Leu Ile Gln Cys Phe Ala Asp His
225 230 235 240
Ile Leu Lys Glu Leu Asp His Phe Pro Leu Glu Lys Arg Ser Glu Val
245 250 255
Val Ile Leu Phe Ser Ala His Ser Leu Pro Met Ser Val Val Asn Arg
260 265 270
Gly Asp Pro Tyr Pro Gln Glu Val Ser Ala Thr Val Gln Lys Val Met
275 280 285
Glu Arg Leu Glu Tyr Cys Asn Pro Tyr Arg Leu Val Trp Gln Ser Lys
290 295 300
Val Gly Pro Met Pro Trp Leu Gly Pro Gln Thr Asp Glu Ser Ile Lys
305 310 315 320
Gly Leu Cys Glu Arg Gly Arg Lys Asn Ile Leu Leu Val Pro Ile Ala
325 330 335
Phe Thr Ser Asp His Ile Glu Thr Leu Tyr Glu Leu Asp Ile Glu Tyr
340 345 350
Ser Gln Val Leu Ala Lys Glu Cys Gly Val Glu Asn Ile Arg Arg Ala
355 360 365
Glu Ser Leu Asn Gly Asn Pro Leu Phe Ser Lys Ala Leu Ala Asp Leu
370 375 380
Val His Ser His Ile Gln Ser Asn Glu Leu Cys Ser Lys Gln Leu Thr
385 390 395 400
Leu Ser Cys Pro Leu Cys Val Asn Pro Val Cys Arg Glu Thr Lys Ser
405 410 415
Phe Phe Thr Ser Gln Gln Leu
420
<210> 42
<211> 175
<212> PRT
<213> 智人
<400> 42
Met Ser Ser Gln Ile Arg Gln Asn Tyr Ser Thr Asp Val Glu Ala Ala
1 5 10 15
Val Asn Ser Leu Val Asn Leu Tyr Leu Gln Ala Ser Tyr Thr Tyr Leu
20 25 30
Ser Leu Gly Phe Tyr Phe Asp Arg Asp Asp Val Ala Leu Glu Gly Val
35 40 45
Ser His Phe Phe Arg Glu Leu Ala Glu Glu Lys Arg Glu Gly Tyr Glu
50 55 60
Arg Leu Leu Lys Met Gln Asn Gln Arg Gly Gly Arg Ala Leu Phe Gln
65 70 75 80
Asp Ile Lys Lys Pro Ala Glu Asp Glu Trp Gly Lys Thr Pro Asp Ala
85 90 95
Met Lys Ala Ala Met Ala Leu Glu Lys Lys Leu Asn Gln Ala Leu Leu
100 105 110
Asp Leu His Ala Leu Gly Ser Ala Arg Thr Asp Pro His Leu Cys Asp
115 120 125
Phe Leu Glu Thr His Phe Leu Asp Glu Glu Val Lys Leu Ile Lys Lys
130 135 140
Met Gly Asp His Leu Thr Asn Leu His Arg Leu Gly Gly Pro Glu Ala
145 150 155 160
Gly Leu Gly Glu Tyr Leu Phe Glu Arg Leu Thr Leu Lys His Asp
165 170 175
<210> 43
<211> 274
<212> PRT
<213> 智人
<400> 43
Met Gly Thr Asp Ser Arg Ala Ala Lys Ala Leu Leu Ala Arg Ala Arg
1 5 10 15
Thr Leu His Leu Gln Thr Gly Asn Leu Leu Asn Trp Gly Arg Leu Arg
20 25 30
Lys Lys Cys Pro Ser Thr His Ser Glu Glu Leu His Asp Cys Ile Gln
35 40 45
Lys Thr Leu Asn Glu Trp Ser Ser Gln Ile Asn Pro Asp Leu Val Arg
50 55 60
Glu Phe Pro Asp Val Leu Glu Cys Thr Val Ser His Ala Val Glu Lys
65 70 75 80
Ile Asn Pro Asp Glu Arg Glu Glu Met Lys Val Ser Ala Lys Leu Phe
85 90 95
Ile Val Glu Ser Asn Ser Ser Ser Ser Thr Arg Ser Ala Val Asp Met
100 105 110
Ala Cys Ser Val Leu Gly Val Ala Gln Leu Asp Ser Val Ile Ile Ala
115 120 125
Ser Pro Pro Ile Glu Asp Gly Val Asn Leu Ser Leu Glu His Leu Gln
130 135 140
Pro Tyr Trp Glu Glu Leu Glu Asn Leu Val Gln Ser Lys Lys Ile Val
145 150 155 160
Ala Ile Gly Thr Ser Asp Leu Asp Lys Thr Gln Leu Glu Gln Leu Tyr
165 170 175
Gln Trp Ala Gln Val Lys Pro Asn Ser Asn Gln Val Asn Leu Ala Ser
180 185 190
Cys Cys Val Met Pro Pro Asp Leu Thr Ala Phe Ala Lys Gln Phe Asp
195 200 205
Ile Gln Leu Leu Thr His Asn Asp Pro Lys Glu Leu Leu Ser Glu Ala
210 215 220
Ser Phe Gln Glu Ala Leu Gln Glu Ser Ile Pro Asp Ile Gln Ala His
225 230 235 240
Glu Trp Val Pro Leu Trp Leu Leu Arg Tyr Ser Val Ile Val Lys Ser
245 250 255
Arg Gly Ile Ile Lys Ser Lys Gly Tyr Ile Leu Gln Ala Lys Arg Arg
260 265 270
Gly Ser
<210> 44
<211> 522
<212> PRT
<213> 智人
<400> 44
Met Ala Leu Leu Pro Arg Ala Leu Ser Ala Gly Ala Gly Pro Ser Trp
1 5 10 15
Arg Arg Ala Ala Arg Ala Phe Arg Gly Phe Leu Leu Leu Leu Pro Glu
20 25 30
Pro Ala Ala Leu Thr Arg Ala Leu Ser Arg Ala Met Ala Cys Arg Gln
35 40 45
Glu Pro Gln Pro Gln Gly Pro Pro Pro Ala Ala Gly Ala Val Ala Ser
50 55 60
Tyr Asp Tyr Leu Val Ile Gly Gly Gly Ser Gly Gly Leu Ala Ser Ala
65 70 75 80
Arg Arg Ala Ala Glu Leu Gly Ala Arg Ala Ala Val Val Glu Ser His
85 90 95
Lys Leu Gly Gly Thr Cys Val Asn Val Gly Cys Val Pro Lys Lys Val
100 105 110
Met Trp Asn Thr Ala Val His Ser Glu Phe Met His Asp His Ala Asp
115 120 125
Tyr Gly Phe Pro Ser Cys Glu Gly Lys Phe Asn Trp Arg Val Ile Lys
130 135 140
Glu Lys Arg Asp Ala Tyr Val Ser Arg Leu Asn Ala Ile Tyr Gln Asn
145 150 155 160
Asn Leu Thr Lys Ser His Ile Glu Ile Ile Arg Gly His Ala Ala Phe
165 170 175
Thr Ser Asp Pro Lys Pro Thr Ile Glu Val Ser Gly Lys Lys Tyr Thr
180 185 190
Ala Pro His Ile Leu Ile Ala Thr Gly Gly Met Pro Ser Thr Pro His
195 200 205
Glu Ser Gln Ile Pro Gly Ala Ser Leu Gly Ile Thr Ser Asp Gly Phe
210 215 220
Phe Gln Leu Glu Glu Leu Pro Gly Arg Ser Val Ile Val Gly Ala Gly
225 230 235 240
Tyr Ile Ala Val Glu Met Ala Gly Ile Leu Ser Ala Leu Gly Ser Lys
245 250 255
Thr Ser Leu Met Ile Arg His Asp Lys Val Leu Arg Ser Phe Asp Ser
260 265 270
Met Ile Ser Thr Asn Cys Thr Glu Glu Leu Glu Asn Ala Gly Val Glu
275 280 285
Val Leu Lys Phe Ser Gln Val Lys Glu Val Lys Lys Thr Leu Ser Gly
290 295 300
Leu Glu Val Ser Met Val Thr Ala Val Pro Gly Arg Leu Pro Val Met
305 310 315 320
Thr Met Ile Pro Asp Val Asp Cys Leu Leu Trp Ala Ile Gly Arg Val
325 330 335
Pro Asn Thr Lys Asp Leu Ser Leu Asn Lys Leu Gly Ile Gln Thr Asp
340 345 350
Asp Lys Gly His Ile Ile Val Asp Glu Phe Gln Asn Thr Asn Val Lys
355 360 365
Gly Ile Tyr Ala Val Gly Asp Val Cys Gly Lys Ala Leu Leu Thr Pro
370 375 380
Val Ala Ile Ala Ala Gly Arg Lys Leu Ala His Arg Leu Phe Glu Tyr
385 390 395 400
Lys Glu Asp Ser Lys Leu Asp Tyr Asn Asn Ile Pro Thr Val Val Phe
405 410 415
Ser His Pro Pro Ile Gly Thr Val Gly Leu Thr Glu Asp Glu Ala Ile
420 425 430
His Lys Tyr Gly Ile Glu Asn Val Lys Thr Tyr Ser Thr Ser Phe Thr
435 440 445
Pro Met Tyr His Ala Val Thr Lys Arg Lys Thr Lys Cys Val Met Lys
450 455 460
Met Val Cys Ala Asn Lys Glu Glu Lys Val Val Gly Ile His Met Gln
465 470 475 480
Gly Leu Gly Cys Asp Glu Met Leu Gln Gly Phe Ala Val Ala Val Lys
485 490 495
Met Gly Ala Thr Lys Ala Asp Phe Asp Asn Thr Val Ala Ile His Pro
500 505 510
Thr Ser Ser Glu Glu Leu Val Thr Leu Arg
515 520
<210> 45
<211> 465
<212> PRT
<213> 智人
<400> 45
Met Glu Pro Ser Ser Leu Glu Leu Pro Ala Asp Thr Val Gln Arg Ile
1 5 10 15
Ala Ala Glu Leu Lys Cys His Pro Thr Asp Glu Arg Val Ala Leu His
20 25 30
Leu Asp Glu Glu Asp Lys Leu Arg His Phe Arg Glu Cys Phe Tyr Ile
35 40 45
Pro Lys Ile Gln Asp Leu Pro Pro Val Asp Leu Ser Leu Val Asn Lys
50 55 60
Asp Glu Asn Ala Ile Tyr Phe Leu Gly Asn Ser Leu Gly Leu Gln Pro
65 70 75 80
Lys Met Val Lys Thr Tyr Leu Glu Glu Glu Leu Asp Lys Trp Ala Lys
85 90 95
Ile Ala Ala Tyr Gly His Glu Val Gly Lys Arg Pro Trp Ile Thr Gly
100 105 110
Asp Glu Ser Ile Val Gly Leu Met Lys Asp Ile Val Gly Ala Asn Glu
115 120 125
Lys Glu Ile Ala Leu Met Asn Ala Leu Thr Val Asn Leu His Leu Leu
130 135 140
Met Leu Ser Phe Phe Lys Pro Thr Pro Lys Arg Tyr Lys Ile Leu Leu
145 150 155 160
Glu Ala Lys Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser Gln Leu
165 170 175
Gln Leu His Gly Leu Asn Ile Glu Glu Ser Met Arg Met Ile Lys Pro
180 185 190
Arg Glu Gly Glu Glu Thr Leu Arg Ile Glu Asp Ile Leu Glu Val Ile
195 200 205
Glu Lys Glu Gly Asp Ser Ile Ala Val Ile Leu Phe Ser Gly Val His
210 215 220
Phe Tyr Thr Gly Gln His Phe Asn Ile Pro Ala Ile Thr Lys Ala Gly
225 230 235 240
Gln Ala Lys Gly Cys Tyr Val Gly Phe Asp Leu Ala His Ala Val Gly
245 250 255
Asn Val Glu Leu Tyr Leu His Asp Trp Gly Val Asp Phe Ala Cys Trp
260 265 270
Cys Ser Tyr Lys Tyr Leu Asn Ala Gly Ala Gly Gly Ile Ala Gly Ala
275 280 285
Phe Ile His Glu Lys His Ala His Thr Ile Lys Pro Ala Leu Val Gly
290 295 300
Trp Phe Gly His Glu Leu Ser Thr Arg Phe Lys Met Asp Asn Lys Leu
305 310 315 320
Gln Leu Ile Pro Gly Val Cys Gly Phe Arg Ile Ser Asn Pro Pro Ile
325 330 335
Leu Leu Val Cys Ser Leu His Ala Ser Leu Glu Ile Phe Lys Gln Ala
340 345 350
Thr Met Lys Ala Leu Arg Lys Lys Ser Val Leu Leu Thr Gly Tyr Leu
355 360 365
Glu Tyr Leu Ile Lys His Asn Tyr Gly Lys Asp Lys Ala Ala Thr Lys
370 375 380
Lys Pro Val Val Asn Ile Ile Thr Pro Ser His Val Glu Glu Arg Gly
385 390 395 400
Cys Gln Leu Thr Ile Thr Phe Ser Val Pro Asn Lys Asp Val Phe Gln
405 410 415
Glu Leu Glu Lys Arg Gly Val Val Cys Asp Lys Arg Asn Pro Asn Gly
420 425 430
Ile Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe His Asp Val Tyr
435 440 445
Lys Phe Thr Asn Leu Leu Thr Ser Ile Leu Asp Ser Ala Glu Thr Lys
450 455 460
Asn
465
<210> 46
<211> 572
<212> PRT
<213> 智人
<400> 46
Met Glu Pro Glu Ala Pro Arg Arg Arg His Thr His Gln Arg Gly Tyr
1 5 10 15
Leu Leu Thr Arg Asn Pro His Leu Asn Lys Asp Leu Ala Phe Thr Leu
20 25 30
Glu Glu Arg Gln Gln Leu Asn Ile His Gly Leu Leu Pro Pro Ser Phe
35 40 45
Asn Ser Gln Glu Ile Gln Val Leu Arg Val Val Lys Asn Phe Glu His
50 55 60
Leu Asn Ser Asp Phe Asp Arg Tyr Leu Leu Leu Met Asp Leu Gln Asp
65 70 75 80
Arg Asn Glu Lys Leu Phe Tyr Arg Val Leu Thr Ser Asp Ile Glu Lys
85 90 95
Phe Met Pro Ile Val Tyr Thr Pro Thr Val Gly Leu Ala Cys Gln Gln
100 105 110
Tyr Ser Leu Val Phe Arg Lys Pro Arg Gly Leu Phe Ile Thr Ile His
115 120 125
Asp Arg Gly His Ile Ala Ser Val Leu Asn Ala Trp Pro Glu Asp Val
130 135 140
Ile Lys Ala Ile Val Val Thr Asp Gly Glu Arg Ile Leu Gly Leu Gly
145 150 155 160
Asp Leu Gly Cys Asn Gly Met Gly Ile Pro Val Gly Lys Leu Ala Leu
165 170 175
Tyr Thr Ala Cys Gly Gly Met Asn Pro Gln Glu Cys Leu Pro Val Ile
180 185 190
Leu Asp Val Gly Thr Glu Asn Glu Glu Leu Leu Lys Asp Pro Leu Tyr
195 200 205
Ile Gly Leu Arg Gln Arg Arg Val Arg Gly Ser Glu Tyr Asp Asp Phe
210 215 220
Leu Asp Glu Phe Met Glu Ala Val Ser Ser Lys Tyr Gly Met Asn Cys
225 230 235 240
Leu Ile Gln Phe Glu Asp Phe Ala Asn Val Asn Ala Phe Arg Leu Leu
245 250 255
Asn Lys Tyr Arg Asn Gln Tyr Cys Thr Phe Asn Asp Asp Ile Gln Gly
260 265 270
Thr Ala Ser Val Ala Val Ala Gly Leu Leu Ala Ala Leu Arg Ile Thr
275 280 285
Lys Asn Lys Leu Ser Asp Gln Thr Ile Leu Phe Gln Gly Ala Gly Glu
290 295 300
Ala Ala Leu Gly Ile Ala His Leu Ile Val Met Ala Leu Glu Lys Glu
305 310 315 320
Gly Leu Pro Lys Glu Lys Ala Ile Lys Lys Ile Trp Leu Val Asp Ser
325 330 335
Lys Gly Leu Ile Val Lys Gly Arg Ala Ser Leu Thr Gln Glu Lys Glu
340 345 350
Lys Phe Ala His Glu His Glu Glu Met Lys Asn Leu Glu Ala Ile Val
355 360 365
Gln Glu Ile Lys Pro Thr Ala Leu Ile Gly Val Ala Ala Ile Gly Gly
370 375 380
Ala Phe Ser Glu Gln Ile Leu Lys Asp Met Ala Ala Phe Asn Glu Arg
385 390 395 400
Pro Ile Ile Phe Ala Leu Ser Asn Pro Thr Ser Lys Ala Glu Cys Ser
405 410 415
Ala Glu Gln Cys Tyr Lys Ile Thr Lys Gly Arg Ala Ile Phe Ala Ser
420 425 430
Gly Ser Pro Phe Asp Pro Val Thr Leu Pro Asn Gly Gln Thr Leu Tyr
435 440 445
Pro Gly Gln Gly Asn Asn Ser Tyr Val Phe Pro Gly Val Ala Leu Gly
450 455 460
Val Val Ala Cys Gly Leu Arg Gln Ile Thr Asp Asn Ile Phe Leu Thr
465 470 475 480
Thr Ala Glu Val Ile Ala Gln Gln Val Ser Asp Lys His Leu Glu Glu
485 490 495
Gly Arg Leu Tyr Pro Pro Leu Asn Thr Ile Arg Asp Val Ser Leu Lys
500 505 510
Ile Ala Glu Lys Ile Val Lys Asp Ala Tyr Gln Glu Lys Thr Ala Thr
515 520 525
Val Tyr Pro Glu Pro Gln Asn Lys Glu Ala Phe Val Arg Ser Gln Met
530 535 540
Tyr Ser Thr Asp Tyr Asp Gln Ile Leu Pro Asp Cys Tyr Ser Trp Pro
545 550 555 560
Glu Glu Val Gln Lys Ile Gln Thr Lys Val Asp Gln
565 570
<210> 47
<211> 605
<212> PRT
<213> 智人
<400> 47
Met Met Asp Leu Glu Leu Pro Pro Pro Gly Leu Pro Ser Gln Gln Asp
1 5 10 15
Met Asp Leu Ile Asp Ile Leu Trp Arg Gln Asp Ile Asp Leu Gly Val
20 25 30
Ser Arg Glu Val Phe Asp Phe Ser Gln Arg Arg Lys Glu Tyr Glu Leu
35 40 45
Glu Lys Gln Lys Lys Leu Glu Lys Glu Arg Gln Glu Gln Leu Gln Lys
50 55 60
Glu Gln Glu Lys Ala Phe Phe Ala Gln Leu Gln Leu Asp Glu Glu Thr
65 70 75 80
Gly Glu Phe Leu Pro Ile Gln Pro Ala Gln His Ile Gln Ser Glu Thr
85 90 95
Ser Gly Ser Ala Asn Tyr Ser Gln Val Ala His Ile Pro Lys Ser Asp
100 105 110
Ala Leu Tyr Phe Asp Asp Cys Met Gln Leu Leu Ala Gln Thr Phe Pro
115 120 125
Phe Val Asp Asp Asn Glu Val Ser Ser Ala Thr Phe Gln Ser Leu Val
130 135 140
Pro Asp Ile Pro Gly His Ile Glu Ser Pro Val Phe Ile Ala Thr Asn
145 150 155 160
Gln Ala Gln Ser Pro Glu Thr Ser Val Ala Gln Val Ala Pro Val Asp
165 170 175
Leu Asp Gly Met Gln Gln Asp Ile Glu Gln Val Trp Glu Glu Leu Leu
180 185 190
Ser Ile Pro Glu Leu Gln Cys Leu Asn Ile Glu Asn Asp Lys Leu Val
195 200 205
Glu Thr Thr Met Val Pro Ser Pro Glu Ala Lys Leu Thr Glu Val Asp
210 215 220
Asn Tyr His Phe Tyr Ser Ser Ile Pro Ser Met Glu Lys Glu Val Gly
225 230 235 240
Asn Cys Ser Pro His Phe Leu Asn Ala Phe Glu Asp Ser Phe Ser Ser
245 250 255
Ile Leu Ser Thr Glu Asp Pro Asn Gln Leu Thr Val Asn Ser Leu Asn
260 265 270
Ser Asp Ala Thr Val Asn Thr Asp Phe Gly Asp Glu Phe Tyr Ser Ala
275 280 285
Phe Ile Ala Glu Pro Ser Ile Ser Asn Ser Met Pro Ser Pro Ala Thr
290 295 300
Leu Ser His Ser Leu Ser Glu Leu Leu Asn Gly Pro Ile Asp Val Ser
305 310 315 320
Asp Leu Ser Leu Cys Lys Ala Phe Asn Gln Asn His Pro Glu Ser Thr
325 330 335
Ala Glu Phe Asn Asp Ser Asp Ser Gly Ile Ser Leu Asn Thr Ser Pro
340 345 350
Ser Val Ala Ser Pro Glu His Ser Val Glu Ser Ser Ser Tyr Gly Asp
355 360 365
Thr Leu Leu Gly Leu Ser Asp Ser Glu Val Glu Glu Leu Asp Ser Ala
370 375 380
Pro Gly Ser Val Lys Gln Asn Gly Pro Lys Thr Pro Val His Ser Ser
385 390 395 400
Gly Asp Met Val Gln Pro Leu Ser Pro Ser Gln Gly Gln Ser Thr His
405 410 415
Val His Asp Ala Gln Cys Glu Asn Thr Pro Glu Lys Glu Leu Pro Val
420 425 430
Ser Pro Gly His Arg Lys Thr Pro Phe Thr Lys Asp Lys His Ser Ser
435 440 445
Arg Leu Glu Ala His Leu Thr Arg Asp Glu Leu Arg Ala Lys Ala Leu
450 455 460
His Ile Pro Phe Pro Val Glu Lys Ile Ile Asn Leu Pro Val Val Asp
465 470 475 480
Phe Asn Glu Met Met Ser Lys Glu Gln Phe Asn Glu Ala Gln Leu Ala
485 490 495
Leu Ile Arg Asp Ile Arg Arg Arg Gly Lys Asn Lys Val Ala Ala Gln
500 505 510
Asn Cys Arg Lys Arg Lys Leu Glu Asn Ile Val Glu Leu Glu Gln Asp
515 520 525
Leu Asp His Leu Lys Asp Glu Lys Glu Lys Leu Leu Lys Glu Lys Gly
530 535 540
Glu Asn Asp Lys Ser Leu His Leu Leu Lys Lys Gln Leu Ser Thr Leu
545 550 555 560
Tyr Leu Glu Val Phe Ser Met Leu Arg Asp Glu Asp Gly Lys Pro Tyr
565 570 575
Ser Pro Ser Glu Tyr Ser Leu Gln Gln Thr Arg Asp Gly Asn Val Phe
580 585 590
Leu Val Pro Lys Ser Lys Lys Pro Asp Val Lys Lys Asn
595 600 605
<210> 48
<211> 274
<212> PRT
<213> 智人
<400> 48
Met Val Gly Arg Arg Ala Leu Ile Val Leu Ala His Ser Glu Arg Thr
1 5 10 15
Ser Phe Asn Tyr Ala Met Lys Glu Ala Ala Ala Ala Ala Leu Lys Lys
20 25 30
Lys Gly Trp Glu Val Val Glu Ser Asp Leu Tyr Ala Met Asn Phe Asn
35 40 45
Pro Ile Ile Ser Arg Lys Asp Ile Thr Gly Lys Leu Lys Asp Pro Ala
50 55 60
Asn Phe Gln Tyr Pro Ala Glu Ser Val Leu Ala Tyr Lys Glu Gly His
65 70 75 80
Leu Ser Pro Asp Ile Val Ala Glu Gln Lys Lys Leu Glu Ala Ala Asp
85 90 95
Leu Val Ile Phe Gln Phe Pro Leu Gln Trp Phe Gly Val Pro Ala Ile
100 105 110
Leu Lys Gly Trp Phe Glu Arg Val Phe Ile Gly Glu Phe Ala Tyr Thr
115 120 125
Tyr Ala Ala Met Tyr Asp Lys Gly Pro Phe Arg Ser Lys Lys Ala Val
130 135 140
Leu Ser Ile Thr Thr Gly Gly Ser Gly Ser Met Tyr Ser Leu Gln Gly
145 150 155 160
Ile His Gly Asp Met Asn Val Ile Leu Trp Pro Ile Gln Ser Gly Ile
165 170 175
Leu His Phe Cys Gly Phe Gln Val Leu Glu Pro Gln Leu Thr Tyr Ser
180 185 190
Ile Gly His Thr Pro Ala Asp Ala Arg Ile Gln Ile Leu Glu Gly Trp
195 200 205
Lys Lys Arg Leu Glu Asn Ile Trp Asp Glu Thr Pro Leu Tyr Phe Ala
210 215 220
Pro Ser Ser Leu Phe Asp Leu Asn Phe Gln Ala Gly Phe Leu Met Lys
225 230 235 240
Lys Glu Val Gln Asp Glu Glu Lys Asn Lys Lys Phe Gly Leu Ser Val
245 250 255
Gly His His Leu Gly Lys Ser Ile Pro Thr Asp Asn Gln Ile Lys Ala
260 265 270
Arg Lys
<210> 49
<211> 470
<212> PRT
<213> 智人
<400> 49
Met Ala Gly Glu Asn His Gln Trp Gln Gly Ser Ile Leu Tyr Asn Met
1 5 10 15
Leu Met Ser Ala Lys Gln Thr Arg Ala Ala Pro Glu Ala Pro Glu Thr
20 25 30
Arg Leu Val Asp Gln Cys Trp Gly Cys Ser Cys Gly Asp Glu Pro Gly
35 40 45
Val Gly Arg Glu Gly Leu Leu Gly Gly Arg Asn Val Ala Leu Leu Tyr
50 55 60
Arg Cys Cys Phe Cys Gly Lys Asp His Pro Arg Gln Gly Ser Ile Leu
65 70 75 80
Tyr Ser Met Leu Thr Ser Ala Lys Gln Thr Tyr Ala Ala Pro Lys Ala
85 90 95
Pro Glu Ala Thr Leu Gly Pro Cys Trp Gly Cys Ser Cys Gly Ser Asp
100 105 110
Pro Gly Val Gly Arg Ala Gly Leu Pro Gly Gly Arg Pro Val Ala Leu
115 120 125
Leu Tyr Arg Cys Cys Phe Cys Gly Glu Asp His Pro Arg Gln Gly Ser
130 135 140
Ile Leu Tyr Ser Leu Leu Thr Ser Ser Lys Gln Thr His Val Ala Pro
145 150 155 160
Ala Ala Pro Glu Ala Arg Pro Gly Gly Ala Trp Trp Asp Arg Ser Tyr
165 170 175
Phe Ala Gln Arg Pro Gly Gly Lys Glu Ala Leu Pro Gly Gly Arg Ala
180 185 190
Thr Ala Leu Leu Tyr Arg Cys Cys Phe Cys Gly Glu Asp His Pro Gln
195 200 205
Gln Gly Ser Thr Leu Tyr Cys Val Pro Thr Ser Thr Asn Gln Ala Gln
210 215 220
Ala Ala Pro Glu Glu Arg Pro Arg Ala Pro Trp Trp Asp Thr Ser Ser
225 230 235 240
Gly Ala Leu Arg Pro Val Ala Leu Lys Ser Pro Gln Val Val Cys Glu
245 250 255
Ala Ala Ser Ala Gly Leu Leu Lys Thr Leu Arg Phe Val Lys Tyr Leu
260 265 270
Pro Cys Phe Gln Val Leu Pro Leu Asp Gln Gln Leu Val Leu Val Arg
275 280 285
Asn Cys Trp Ala Ser Leu Leu Met Leu Glu Leu Ala Gln Asp Arg Leu
290 295 300
Gln Phe Glu Thr Val Glu Val Ser Glu Pro Ser Met Leu Gln Lys Ile
305 310 315 320
Leu Thr Thr Arg Arg Arg Glu Thr Gly Gly Asn Glu Pro Leu Pro Val
325 330 335
Pro Thr Leu Gln His His Leu Ala Pro Pro Ala Glu Ala Arg Lys Val
340 345 350
Pro Ser Ala Ser Gln Val Gln Ala Ile Lys Cys Phe Leu Ser Lys Cys
355 360 365
Trp Ser Leu Asn Ile Ser Thr Lys Glu Tyr Ala Tyr Leu Lys Gly Thr
370 375 380
Val Leu Phe Asn Pro Asp Val Pro Gly Leu Gln Cys Val Lys Tyr Ile
385 390 395 400
Gln Gly Leu Gln Trp Gly Thr Gln Gln Ile Leu Ser Glu His Thr Arg
405 410 415
Met Thr His Gln Gly Pro His Asp Arg Phe Ile Glu Leu Asn Ser Thr
420 425 430
Leu Phe Leu Leu Arg Phe Ile Asn Ala Asn Val Ile Ala Glu Leu Phe
435 440 445
Phe Arg Pro Ile Ile Gly Thr Val Ser Met Asp Asp Met Met Leu Glu
450 455 460
Met Leu Cys Thr Lys Ile
465 470
<210> 50
<211> 560
<212> PRT
<213> 智人
<400> 50
Met Gly Lys Trp Arg Pro Arg Gly Cys Cys Arg Gly Asn Met Gln Cys
1 5 10 15
Arg Gln Glu Val Pro Ala Thr Leu Thr Ser Ser Glu Leu Phe Ser Thr
20 25 30
Arg Asn Gln Pro Gln Pro Gln Pro Gln Pro Leu Leu Ala Asp Ala Pro
35 40 45
Val Pro Trp Ala Val Ala Ser Arg Met Cys Leu Thr Pro Gly Gln Gly
50 55 60
Cys Gly His Gln Gly Gln Asp Glu Gly Pro Leu Pro Ala Pro Ser Pro
65 70 75 80
Pro Pro Ala Met Ser Ser Ser Arg Lys Asp His Leu Gly Ala Ser Ser
85 90 95
Ser Glu Pro Leu Pro Val Ile Ile Val Gly Asn Gly Pro Ser Gly Ile
100 105 110
Cys Leu Ser Tyr Leu Leu Ser Gly Tyr Thr Pro Tyr Thr Lys Pro Asp
115 120 125
Ala Ile His Pro His Pro Leu Leu Gln Arg Lys Leu Thr Glu Ala Pro
130 135 140
Gly Val Ser Ile Leu Asp Gln Asp Leu Asp Tyr Leu Ser Glu Gly Leu
145 150 155 160
Glu Gly Arg Ser Gln Ser Pro Val Ala Leu Leu Phe Asp Ala Leu Leu
165 170 175
Arg Pro Asp Thr Asp Phe Gly Gly Asn Met Lys Ser Val Leu Thr Trp
180 185 190
Lys His Arg Lys Glu His Ala Ile Pro His Val Val Leu Gly Arg Asn
195 200 205
Leu Pro Gly Gly Ala Trp His Ser Ile Glu Gly Ser Met Val Ile Leu
210 215 220
Ser Gln Gly Gln Trp Met Gly Leu Pro Asp Leu Glu Val Lys Asp Trp
225 230 235 240
Met Gln Lys Lys Arg Arg Gly Leu Arg Asn Ser Arg Ala Thr Ala Gly
245 250 255
Asp Ile Ala His Tyr Tyr Arg Asp Tyr Val Val Lys Lys Gly Leu Gly
260 265 270
His Asn Phe Val Ser Gly Ala Val Val Thr Ala Val Glu Trp Gly Thr
275 280 285
Pro Asp Pro Ser Ser Cys Gly Ala Gln Asp Ser Ser Pro Leu Phe Gln
290 295 300
Val Ser Gly Phe Leu Thr Arg Asn Gln Ala Gln Gln Pro Phe Ser Leu
305 310 315 320
Trp Ala Arg Asn Val Val Leu Ala Thr Gly Thr Phe Asp Ser Pro Ala
325 330 335
Arg Leu Gly Ile Pro Gly Glu Ala Leu Pro Phe Ile His His Glu Leu
340 345 350
Ser Ala Leu Glu Ala Ala Thr Arg Val Gly Ala Val Thr Pro Ala Ser
355 360 365
Asp Pro Val Leu Ile Ile Gly Ala Gly Leu Ser Ala Ala Asp Ala Val
370 375 380
Leu Tyr Ala Arg His Tyr Asn Ile Pro Val Ile His Ala Phe Arg Arg
385 390 395 400
Ala Val Asp Asp Pro Gly Leu Val Phe Asn Gln Leu Pro Lys Met Leu
405 410 415
Tyr Pro Glu Tyr His Lys Val His Gln Met Met Arg Glu Gln Ser Ile
420 425 430
Leu Ser Pro Ser Pro Tyr Glu Gly Tyr Arg Ser Leu Pro Arg His Gln
435 440 445
Leu Leu Cys Phe Lys Glu Asp Cys Gln Ala Val Phe Gln Asp Leu Glu
450 455 460
Gly Val Glu Lys Val Phe Gly Val Ser Leu Val Leu Val Leu Ile Gly
465 470 475 480
Ser His Pro Asp Leu Ser Phe Leu Pro Gly Ala Gly Ala Asp Phe Ala
485 490 495
Val Asp Pro Asp Gln Pro Leu Ser Ala Lys Arg Asn Pro Ile Asp Val
500 505 510
Asp Pro Phe Thr Tyr Gln Ser Thr Arg Gln Glu Gly Leu Tyr Ala Met
515 520 525
Gly Pro Leu Ala Gly Asp Asn Phe Val Arg Phe Val Gln Gly Gly Ala
530 535 540
Leu Ala Val Ala Ser Ser Leu Leu Arg Lys Glu Thr Arg Lys Pro Pro
545 550 555 560
<210> 51
<211> 483
<212> PRT
<213> 智人
<400> 51
Met Ala Gln Ala Asp Ile Ala Leu Ile Gly Leu Ala Val Met Gly Gln
1 5 10 15
Asn Leu Ile Leu Asn Met Asn Asp His Gly Phe Val Val Cys Ala Phe
20 25 30
Asn Arg Thr Val Ser Lys Val Asp Asp Phe Leu Ala Asn Glu Ala Lys
35 40 45
Gly Thr Lys Val Val Gly Ala Gln Ser Leu Lys Glu Met Val Ser Lys
50 55 60
Leu Lys Lys Pro Arg Arg Ile Ile Leu Leu Val Lys Ala Gly Gln Ala
65 70 75 80
Val Asp Asp Phe Ile Glu Lys Leu Val Pro Leu Leu Asp Thr Gly Asp
85 90 95
Ile Ile Ile Asp Gly Gly Asn Ser Glu Tyr Arg Asp Thr Thr Arg Arg
100 105 110
Cys Arg Asp Leu Lys Ala Lys Gly Ile Leu Phe Val Gly Ser Gly Val
115 120 125
Ser Gly Gly Glu Glu Gly Ala Arg Tyr Gly Pro Ser Leu Met Pro Gly
130 135 140
Gly Asn Lys Glu Ala Trp Pro His Ile Lys Thr Ile Phe Gln Gly Ile
145 150 155 160
Ala Ala Lys Val Gly Thr Gly Glu Pro Cys Cys Asp Trp Val Gly Asp
165 170 175
Glu Gly Ala Gly His Phe Val Lys Met Val His Asn Gly Ile Glu Tyr
180 185 190
Gly Asp Met Gln Leu Ile Cys Glu Ala Tyr His Leu Met Lys Asp Val
195 200 205
Leu Gly Met Ala Gln Asp Glu Met Ala Gln Ala Phe Glu Asp Trp Asn
210 215 220
Lys Thr Glu Leu Asp Ser Phe Leu Ile Glu Ile Thr Ala Asn Ile Leu
225 230 235 240
Lys Phe Gln Asp Thr Asp Gly Lys His Leu Leu Pro Lys Ile Arg Asp
245 250 255
Ser Ala Gly Gln Lys Gly Thr Gly Lys Trp Thr Ala Ile Ser Ala Leu
260 265 270
Glu Tyr Gly Val Pro Val Thr Leu Ile Gly Glu Ala Val Phe Ala Arg
275 280 285
Cys Leu Ser Ser Leu Lys Asp Glu Arg Ile Gln Ala Ser Lys Lys Leu
290 295 300
Lys Gly Pro Gln Lys Phe Gln Phe Asp Gly Asp Lys Lys Ser Phe Leu
305 310 315 320
Glu Asp Ile Arg Lys Ala Leu Tyr Ala Ser Lys Ile Ile Ser Tyr Ala
325 330 335
Gln Gly Phe Met Leu Leu Arg Gln Ala Ala Thr Glu Phe Gly Trp Thr
340 345 350
Leu Asn Tyr Gly Gly Ile Ala Leu Met Trp Arg Gly Gly Cys Ile Ile
355 360 365
Arg Ser Val Phe Leu Gly Lys Ile Lys Asp Ala Phe Asp Arg Asn Pro
370 375 380
Glu Leu Gln Asn Leu Leu Leu Asp Asp Phe Phe Lys Ser Ala Val Glu
385 390 395 400
Asn Cys Gln Asp Ser Trp Arg Arg Ala Val Ser Thr Gly Val Gln Ala
405 410 415
Gly Ile Pro Met Pro Cys Phe Thr Thr Ala Leu Ser Phe Tyr Asp Gly
420 425 430
Tyr Arg His Glu Met Leu Pro Ala Ser Leu Ile Gln Ala Gln Arg Asp
435 440 445
Tyr Phe Gly Ala His Thr Tyr Glu Leu Leu Ala Lys Pro Gly Gln Phe
450 455 460
Ile His Thr Asn Trp Thr Gly His Gly Gly Thr Val Ser Ser Ser Ser
465 470 475 480
Tyr Asn Ala
<210> 52
<211> 272
<212> PRT
<213> 智人
<400> 52
Met His Leu Arg Leu Ile Ser Trp Leu Phe Ile Ile Leu Asn Phe Met
1 5 10 15
Glu Tyr Ile Gly Ser Gln Asn Ala Ser Arg Gly Arg Arg Gln Arg Arg
20 25 30
Met His Pro Asn Val Ser Gln Gly Cys Gln Gly Gly Cys Ala Thr Cys
35 40 45
Ser Asp Tyr Asn Gly Cys Leu Ser Cys Lys Pro Arg Leu Phe Phe Ala
50 55 60
Leu Glu Arg Ile Gly Met Lys Gln Ile Gly Val Cys Leu Ser Ser Cys
65 70 75 80
Pro Ser Gly Tyr Tyr Gly Thr Arg Tyr Pro Asp Ile Asn Lys Cys Thr
85 90 95
Lys Cys Lys Ala Asp Cys Asp Thr Cys Phe Asn Lys Asn Phe Cys Thr
100 105 110
Lys Cys Lys Ser Gly Phe Tyr Leu His Leu Gly Lys Cys Leu Asp Asn
115 120 125
Cys Pro Glu Gly Leu Glu Ala Asn Asn His Thr Met Glu Cys Val Ser
130 135 140
Ile Val His Cys Glu Val Ser Glu Trp Asn Pro Trp Ser Pro Cys Thr
145 150 155 160
Lys Lys Gly Lys Thr Cys Gly Phe Lys Arg Gly Thr Glu Thr Arg Val
165 170 175
Arg Glu Ile Ile Gln His Pro Ser Ala Lys Gly Asn Leu Cys Pro Pro
180 185 190
Thr Asn Glu Thr Arg Lys Cys Thr Val Gln Arg Lys Lys Cys Gln Lys
195 200 205
Gly Glu Arg Gly Lys Lys Gly Arg Glu Arg Lys Arg Lys Lys Pro Asn
210 215 220
Lys Gly Glu Ser Lys Glu Ala Ile Pro Asp Ser Lys Ser Leu Glu Ser
225 230 235 240
Ser Lys Glu Ile Pro Glu Gln Arg Glu Asn Lys Gln Gln Gln Lys Lys
245 250 255
Arg Lys Val Gln Asp Lys Gln Lys Ser Val Ser Val Ser Thr Val His
260 265 270
<210> 53
<211> 501
<212> PRT
<213> 智人
<400> 53
Met Val Arg Lys Pro Val Val Ser Thr Ile Ser Lys Gly Gly Tyr Leu
1 5 10 15
Gln Gly Asn Val Asn Gly Arg Leu Pro Ser Leu Gly Asn Lys Glu Pro
20 25 30
Pro Gly Gln Glu Lys Val Gln Leu Lys Arg Lys Val Thr Leu Leu Arg
35 40 45
Gly Val Ser Ile Ile Ile Gly Thr Ile Ile Gly Ala Gly Ile Phe Ile
50 55 60
Ser Pro Lys Gly Val Leu Gln Asn Thr Gly Ser Val Gly Met Ser Leu
65 70 75 80
Thr Ile Trp Thr Val Cys Gly Val Leu Ser Leu Phe Gly Ala Leu Ser
85 90 95
Tyr Ala Glu Leu Gly Thr Thr Ile Lys Lys Ser Gly Gly His Tyr Thr
100 105 110
Tyr Ile Leu Glu Val Phe Gly Pro Leu Pro Ala Phe Val Arg Val Trp
115 120 125
Val Glu Leu Leu Ile Ile Arg Pro Ala Ala Thr Ala Val Ile Ser Leu
130 135 140
Ala Phe Gly Arg Tyr Ile Leu Glu Pro Phe Phe Ile Gln Cys Glu Ile
145 150 155 160
Pro Glu Leu Ala Ile Lys Leu Ile Thr Ala Val Gly Ile Thr Val Val
165 170 175
Met Val Leu Asn Ser Met Ser Val Ser Trp Ser Ala Arg Ile Gln Ile
180 185 190
Phe Leu Thr Phe Cys Lys Leu Thr Ala Ile Leu Ile Ile Ile Val Pro
195 200 205
Gly Val Met Gln Leu Ile Lys Gly Gln Thr Gln Asn Phe Lys Asp Ala
210 215 220
Phe Ser Gly Arg Asp Ser Ser Ile Thr Arg Leu Pro Leu Ala Phe Tyr
225 230 235 240
Tyr Gly Met Tyr Ala Tyr Ala Gly Trp Phe Tyr Leu Asn Phe Val Thr
245 250 255
Glu Glu Val Glu Asn Pro Glu Lys Thr Ile Pro Leu Ala Ile Cys Ile
260 265 270
Ser Met Ala Ile Val Thr Ile Gly Tyr Val Leu Thr Asn Val Ala Tyr
275 280 285
Phe Thr Thr Ile Asn Ala Glu Glu Leu Leu Leu Ser Asn Ala Val Ala
290 295 300
Val Thr Phe Ser Glu Arg Leu Leu Gly Asn Phe Ser Leu Ala Val Pro
305 310 315 320
Ile Phe Val Ala Leu Ser Cys Phe Gly Ser Met Asn Gly Gly Val Phe
325 330 335
Ala Val Ser Arg Leu Phe Tyr Val Ala Ser Arg Glu Gly His Leu Pro
340 345 350
Glu Ile Leu Ser Met Ile His Val Arg Lys His Thr Pro Leu Pro Ala
355 360 365
Val Ile Val Leu His Pro Leu Thr Met Ile Met Leu Phe Ser Gly Asp
370 375 380
Leu Asp Ser Leu Leu Asn Phe Leu Ser Phe Ala Arg Trp Leu Phe Ile
385 390 395 400
Gly Leu Ala Val Ala Gly Leu Ile Tyr Leu Arg Tyr Lys Cys Pro Asp
405 410 415
Met His Arg Pro Phe Lys Val Pro Leu Phe Ile Pro Ala Leu Phe Ser
420 425 430
Phe Thr Cys Leu Phe Met Val Ala Leu Ser Leu Tyr Ser Asp Pro Phe
435 440 445
Ser Thr Gly Ile Gly Phe Val Ile Thr Leu Thr Gly Val Pro Ala Tyr
450 455 460
Tyr Leu Phe Ile Ile Trp Asp Lys Lys Pro Arg Trp Phe Arg Ile Met
465 470 475 480
Ser Glu Lys Ile Thr Arg Thr Leu Gln Ile Ile Leu Glu Val Val Pro
485 490 495
Glu Glu Asp Lys Leu
500
<210> 54
<211> 137
<212> PRT
<213> 智人
<400> 54
Met Gly Leu Arg Ala Gly Gly Thr Leu Gly Arg Ala Gly Ala Gly Arg
1 5 10 15
Gly Ala Pro Glu Gly Pro Gly Pro Ser Gly Gly Ala Gln Gly Gly Ser
20 25 30
Ile His Ser Gly Arg Ile Ala Ala Val His Asn Val Pro Leu Ser Val
35 40 45
Leu Ile Arg Pro Leu Pro Ser Val Leu Asp Pro Ala Lys Val Gln Ser
50 55 60
Leu Val Asp Thr Ile Arg Glu Asp Pro Asp Ser Val Pro Pro Ile Asp
65 70 75 80
Val Leu Trp Ile Lys Gly Ala Gln Gly Gly Asp Tyr Phe Tyr Ser Phe
85 90 95
Gly Gly Cys His Arg Tyr Ala Ala Tyr Gln Gln Leu Gln Arg Glu Thr
100 105 110
Ile Pro Ala Lys Leu Val Gln Ser Thr Leu Ser Asp Leu Arg Val Tyr
115 120 125
Leu Gly Ala Ser Thr Pro Asp Leu Gln
130 135
<210> 55
<211> 337
<212> PRT
<213> 智人
<400> 55
Met Ser Ser Ser Pro Val Lys Arg Gln Arg Met Glu Ser Ala Leu Asp
1 5 10 15
Gln Leu Lys Gln Phe Thr Thr Val Val Ala Asp Thr Gly Asp Phe His
20 25 30
Ala Ile Asp Glu Tyr Lys Pro Gln Asp Ala Thr Thr Asn Pro Ser Leu
35 40 45
Ile Leu Ala Ala Ala Gln Met Pro Ala Tyr Gln Glu Leu Val Glu Glu
50 55 60
Ala Ile Ala Tyr Gly Arg Lys Leu Gly Gly Ser Gln Glu Asp Gln Ile
65 70 75 80
Lys Asn Ala Ile Asp Lys Leu Phe Val Leu Phe Gly Ala Glu Ile Leu
85 90 95
Lys Lys Ile Pro Gly Arg Val Ser Thr Glu Val Asp Ala Arg Leu Ser
100 105 110
Phe Asp Lys Asp Ala Met Val Ala Arg Ala Arg Arg Leu Ile Glu Leu
115 120 125
Tyr Lys Glu Ala Gly Ile Ser Lys Asp Arg Ile Leu Ile Lys Leu Ser
130 135 140
Ser Thr Trp Glu Gly Ile Gln Ala Gly Lys Glu Leu Glu Glu Gln His
145 150 155 160
Gly Ile His Cys Asn Met Thr Leu Leu Phe Ser Phe Ala Gln Ala Val
165 170 175
Ala Cys Ala Glu Ala Gly Val Thr Leu Ile Ser Pro Phe Val Gly Arg
180 185 190
Ile Leu Asp Trp His Val Ala Asn Thr Asp Lys Lys Ser Tyr Glu Pro
195 200 205
Leu Glu Asp Pro Gly Val Lys Ser Val Thr Lys Ile Tyr Asn Tyr Tyr
210 215 220
Lys Lys Phe Ser Tyr Lys Thr Ile Val Met Gly Ala Ser Phe Arg Asn
225 230 235 240
Thr Gly Glu Ile Lys Ala Leu Ala Gly Cys Asp Phe Leu Thr Ile Ser
245 250 255
Pro Lys Leu Leu Gly Glu Leu Leu Gln Asp Asn Ala Lys Leu Val Pro
260 265 270
Val Leu Ser Ala Lys Ala Ala Gln Ala Ser Asp Leu Glu Lys Ile His
275 280 285
Leu Asp Glu Lys Ser Phe Arg Trp Leu His Asn Glu Asp Gln Met Ala
290 295 300
Val Glu Lys Leu Ser Asp Gly Ile Arg Lys Phe Ala Ala Asp Ala Val
305 310 315 320
Lys Leu Glu Arg Met Leu Thr Glu Arg Met Phe Asn Ala Glu Asn Gly
325 330 335
Lys
<210> 56
<211> 564
<212> PRT
<213> 智人
<400> 56
Met Ala Glu Leu Asp Leu Met Ala Pro Gly Pro Leu Pro Arg Ala Thr
1 5 10 15
Ala Gln Pro Pro Ala Pro Leu Ser Pro Asp Ser Gly Ser Pro Ser Pro
20 25 30
Asp Ser Gly Ser Ala Ser Pro Val Glu Glu Glu Asp Val Gly Ser Ser
35 40 45
Glu Lys Leu Gly Arg Glu Thr Glu Glu Gln Asp Ser Asp Ser Ala Glu
50 55 60
Gln Gly Asp Pro Ala Gly Glu Gly Lys Glu Val Leu Cys Asp Phe Cys
65 70 75 80
Leu Asp Asp Thr Arg Arg Val Lys Ala Val Lys Ser Cys Leu Thr Cys
85 90 95
Met Val Asn Tyr Cys Glu Glu His Leu Gln Pro His Gln Val Asn Ile
100 105 110
Lys Leu Gln Ser His Leu Leu Thr Glu Pro Val Lys Asp His Asn Trp
115 120 125
Arg Tyr Cys Pro Ala His His Ser Pro Leu Ser Ala Phe Cys Cys Pro
130 135 140
Asp Gln Gln Cys Ile Cys Gln Asp Cys Cys Gln Glu His Ser Gly His
145 150 155 160
Thr Ile Val Ser Leu Asp Ala Ala Arg Arg Asp Lys Glu Ala Glu Leu
165 170 175
Gln Cys Thr Gln Leu Asp Leu Glu Arg Lys Leu Lys Leu Asn Glu Asn
180 185 190
Ala Ile Ser Arg Leu Gln Ala Asn Gln Lys Ser Val Leu Val Ser Val
195 200 205
Ser Glu Val Lys Ala Val Ala Glu Met Gln Phe Gly Glu Leu Leu Ala
210 215 220
Ala Val Arg Lys Ala Gln Ala Asn Val Met Leu Phe Leu Glu Glu Lys
225 230 235 240
Glu Gln Ala Ala Leu Ser Gln Ala Asn Gly Ile Lys Ala His Leu Glu
245 250 255
Tyr Arg Ser Ala Glu Met Glu Lys Ser Lys Gln Glu Leu Glu Arg Met
260 265 270
Ala Ala Ile Ser Asn Thr Val Gln Phe Leu Glu Glu Tyr Cys Lys Phe
275 280 285
Lys Asn Thr Glu Asp Ile Thr Phe Pro Ser Val Tyr Val Gly Leu Lys
290 295 300
Asp Lys Leu Ser Gly Ile Arg Lys Val Ile Thr Glu Ser Thr Val His
305 310 315 320
Leu Ile Gln Leu Leu Glu Asn Tyr Lys Lys Lys Leu Gln Glu Phe Ser
325 330 335
Lys Glu Glu Glu Tyr Asp Ile Arg Thr Gln Val Ser Ala Val Val Gln
340 345 350
Arg Lys Tyr Trp Thr Ser Lys Pro Glu Pro Ser Thr Arg Glu Gln Phe
355 360 365
Leu Gln Tyr Ala Tyr Asp Ile Thr Phe Asp Pro Asp Thr Ala His Lys
370 375 380
Tyr Leu Arg Leu Gln Glu Glu Asn Arg Lys Val Thr Asn Thr Thr Pro
385 390 395 400
Trp Glu His Pro Tyr Pro Asp Leu Pro Ser Arg Phe Leu His Trp Arg
405 410 415
Gln Val Leu Ser Gln Gln Ser Leu Tyr Leu His Arg Tyr Tyr Phe Glu
420 425 430
Val Glu Ile Phe Gly Ala Gly Thr Tyr Val Gly Leu Thr Cys Lys Gly
435 440 445
Ile Asp Arg Lys Gly Glu Glu Arg Asn Ser Cys Ile Ser Gly Asn Asn
450 455 460
Phe Ser Trp Ser Leu Gln Trp Asn Gly Lys Glu Phe Thr Ala Trp Tyr
465 470 475 480
Ser Asp Met Glu Thr Pro Leu Lys Ala Gly Pro Phe Arg Arg Leu Gly
485 490 495
Val Tyr Ile Asp Phe Pro Gly Gly Ile Leu Ser Phe Tyr Gly Val Glu
500 505 510
Tyr Asp Thr Met Thr Leu Val His Lys Phe Ala Cys Lys Phe Ser Glu
515 520 525
Pro Val Tyr Ala Ala Phe Trp Leu Ser Lys Lys Glu Asn Ala Ile Arg
530 535 540
Ile Val Asp Leu Gly Glu Glu Pro Glu Lys Pro Ala Pro Ser Leu Val
545 550 555 560
Gly Thr Ala Pro
<210> 57
<211> 348
<212> PRT
<213> 智人
<400> 57
Met Gln Phe Gly Glu Leu Leu Ala Ala Val Arg Lys Ala Gln Ala Asn
1 5 10 15
Val Met Leu Phe Leu Glu Glu Lys Glu Gln Ala Ala Leu Ser Gln Ala
20 25 30
Asn Gly Ile Lys Ala His Leu Glu Tyr Arg Ser Ala Glu Met Glu Lys
35 40 45
Ser Lys Gln Glu Leu Glu Thr Met Ala Ala Ile Ser Asn Thr Val Gln
50 55 60
Phe Leu Glu Glu Tyr Cys Lys Phe Lys Asn Thr Glu Asp Ile Thr Phe
65 70 75 80
Pro Ser Val Tyr Ile Gly Leu Lys Asp Lys Leu Ser Gly Ile Arg Lys
85 90 95
Val Ile Thr Glu Ser Thr Val His Leu Ile Gln Leu Leu Glu Asn Tyr
100 105 110
Lys Lys Lys Leu Gln Glu Phe Ser Lys Glu Glu Glu Tyr Asp Ile Arg
115 120 125
Thr Gln Val Ser Ala Ile Val Gln Arg Lys Tyr Trp Thr Ser Lys Pro
130 135 140
Glu Pro Ser Thr Arg Glu Gln Phe Leu Gln Tyr Val His Asp Ile Thr
145 150 155 160
Phe Asp Pro Asp Thr Ala His Lys Tyr Leu Arg Leu Gln Glu Glu Asn
165 170 175
Arg Lys Val Thr Asn Thr Thr Pro Trp Glu His Pro Tyr Pro Asp Leu
180 185 190
Pro Ser Arg Phe Leu His Trp Arg Gln Val Leu Ser Gln Gln Ser Leu
195 200 205
Tyr Leu His Arg Tyr Tyr Phe Glu Val Glu Ile Phe Gly Ala Gly Thr
210 215 220
Tyr Val Gly Leu Thr Cys Lys Gly Ile Asp Gln Lys Gly Glu Glu Arg
225 230 235 240
Ser Ser Cys Ile Ser Gly Asn Asn Phe Ser Trp Ser Leu Gln Trp Asn
245 250 255
Gly Lys Glu Phe Thr Ala Trp Tyr Ser Asp Met Glu Thr Pro Leu Lys
260 265 270
Ala Gly Pro Phe Trp Arg Leu Gly Val Tyr Ile Asp Phe Pro Gly Gly
275 280 285
Ile Leu Ser Phe Tyr Gly Val Glu Tyr Asp Ser Met Thr Leu Val His
290 295 300
Lys Phe Ala Cys Lys Phe Ser Glu Pro Val Tyr Ala Ala Phe Trp Leu
305 310 315 320
Ser Lys Lys Glu Asn Ala Ile Arg Ile Val Asp Leu Gly Glu Glu Pro
325 330 335
Glu Lys Pro Ala Pro Ser Leu Val Gly Thr Ala Pro
340 345
<210> 58
<211> 105
<212> PRT
<213> 智人
<400> 58
Met Val Lys Gln Ile Glu Ser Lys Thr Ala Phe Gln Glu Ala Leu Asp
1 5 10 15
Ala Ala Gly Asp Lys Leu Val Val Val Asp Phe Ser Ala Thr Trp Cys
20 25 30
Gly Pro Cys Lys Met Ile Lys Pro Phe Phe His Ser Leu Ser Glu Lys
35 40 45
Tyr Ser Asn Val Ile Phe Leu Glu Val Asp Val Asp Asp Cys Gln Asp
50 55 60
Val Ala Ser Glu Cys Glu Val Lys Cys Met Pro Thr Phe Gln Phe Phe
65 70 75 80
Lys Lys Gly Gln Lys Val Gly Glu Phe Ser Gly Ala Asn Lys Glu Lys
85 90 95
Leu Glu Ala Thr Ile Asn Glu Leu Val
100 105
<210> 59
<211> 649
<212> PRT
<213> 智人
<220>
<221> MISC_FEATURE
<222> (648)..(648)
<223> Xaa为吡咯烷酮羧酸
<400> 59
Met Gly Cys Ala Glu Gly Lys Ala Val Ala Ala Ala Ala Pro Thr Glu
1 5 10 15
Leu Gln Thr Lys Gly Lys Asn Gly Asp Gly Arg Arg Arg Ser Ala Lys
20 25 30
Asp His His Pro Gly Lys Thr Leu Pro Glu Asn Pro Ala Gly Phe Thr
35 40 45
Ser Thr Ala Thr Ala Asp Ser Arg Ala Leu Leu Gln Ala Tyr Ile Asp
50 55 60
Gly His Ser Val Val Ile Phe Ser Arg Ser Thr Cys Thr Arg Cys Thr
65 70 75 80
Glu Val Lys Lys Leu Phe Lys Ser Leu Cys Val Pro Tyr Phe Val Leu
85 90 95
Glu Leu Asp Gln Thr Glu Asp Gly Arg Ala Leu Glu Gly Thr Leu Ser
100 105 110
Glu Leu Ala Ala Glu Thr Asp Leu Pro Val Val Phe Val Lys Gln Arg
115 120 125
Lys Ile Gly Gly His Gly Pro Thr Leu Lys Ala Tyr Gln Glu Gly Arg
130 135 140
Leu Gln Lys Leu Leu Lys Met Asn Gly Pro Glu Asp Leu Pro Lys Ser
145 150 155 160
Tyr Asp Tyr Asp Leu Ile Ile Ile Gly Gly Gly Ser Gly Gly Leu Ala
165 170 175
Ala Ala Lys Glu Ala Ala Gln Tyr Gly Lys Lys Val Met Val Leu Asp
180 185 190
Phe Val Thr Pro Thr Pro Leu Gly Thr Arg Trp Gly Leu Gly Gly Thr
195 200 205
Cys Val Asn Val Gly Cys Ile Pro Lys Lys Leu Met His Gln Ala Ala
210 215 220
Leu Leu Gly Gln Ala Leu Gln Asp Ser Arg Asn Tyr Gly Trp Lys Val
225 230 235 240
Glu Glu Thr Val Lys His Asp Trp Asp Arg Met Ile Glu Ala Val Gln
245 250 255
Asn His Ile Gly Ser Leu Asn Trp Gly Tyr Arg Val Ala Leu Arg Glu
260 265 270
Lys Lys Val Val Tyr Glu Asn Ala Tyr Gly Gln Phe Ile Gly Pro His
275 280 285
Arg Ile Lys Ala Thr Asn Asn Lys Gly Lys Glu Lys Ile Tyr Ser Ala
290 295 300
Glu Arg Phe Leu Ile Ala Thr Gly Glu Arg Pro Arg Tyr Leu Gly Ile
305 310 315 320
Pro Gly Asp Lys Glu Tyr Cys Ile Ser Ser Asp Asp Leu Phe Ser Leu
325 330 335
Pro Tyr Cys Pro Gly Lys Thr Leu Val Val Gly Ala Ser Tyr Val Ala
340 345 350
Leu Glu Cys Ala Gly Phe Leu Ala Gly Ile Gly Leu Asp Val Thr Val
355 360 365
Met Val Arg Ser Ile Leu Leu Arg Gly Phe Asp Gln Asp Met Ala Asn
370 375 380
Lys Ile Gly Glu His Met Glu Glu His Gly Ile Lys Phe Ile Arg Gln
385 390 395 400
Phe Val Pro Ile Lys Val Glu Gln Ile Glu Ala Gly Thr Pro Gly Arg
405 410 415
Leu Arg Val Val Ala Gln Ser Thr Asn Ser Glu Glu Ile Ile Glu Gly
420 425 430
Glu Tyr Asn Thr Val Met Leu Ala Ile Gly Arg Asp Ala Cys Thr Arg
435 440 445
Lys Ile Gly Leu Glu Thr Val Gly Val Lys Ile Asn Glu Lys Thr Gly
450 455 460
Lys Ile Pro Val Thr Asp Glu Glu Gln Thr Asn Val Pro Tyr Ile Tyr
465 470 475 480
Ala Ile Gly Asp Ile Leu Glu Asp Lys Val Glu Leu Thr Pro Val Ala
485 490 495
Ile Gln Ala Gly Arg Leu Leu Ala Gln Arg Leu Tyr Ala Gly Ser Thr
500 505 510
Val Lys Cys Asp Tyr Glu Asn Val Pro Thr Thr Val Phe Thr Pro Leu
515 520 525
Glu Tyr Gly Ala Cys Gly Leu Ser Glu Glu Lys Ala Val Glu Lys Phe
530 535 540
Gly Glu Glu Asn Ile Glu Val Tyr His Ser Tyr Phe Trp Pro Leu Glu
545 550 555 560
Trp Thr Ile Pro Ser Arg Asp Asn Asn Lys Cys Tyr Ala Lys Ile Ile
565 570 575
Cys Asn Thr Lys Asp Asn Glu Arg Val Val Gly Phe His Val Leu Gly
580 585 590
Pro Asn Ala Gly Glu Val Thr Gln Gly Phe Ala Ala Ala Leu Lys Cys
595 600 605
Gly Leu Thr Lys Lys Gln Leu Asp Ser Thr Ile Gly Ile His Pro Val
610 615 620
Cys Ala Glu Val Phe Thr Thr Leu Ser Val Thr Lys Arg Ser Gly Ala
625 630 635 640
Ser Ile Leu Gln Ala Gly Cys Xaa Gly
645
<210> 60
<211> 494
<212> PRT
<213> 智人
<400> 60
Met Phe Glu Ile Lys Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly
1 5 10 15
Gly Pro Thr Cys Ser Val Ile Ala His Met Cys Pro Glu Ile Arg Val
20 25 30
Thr Val Val Asp Val Asn Glu Ser Arg Ile Asn Ala Trp Asn Ser Pro
35 40 45
Thr Leu Pro Ile Tyr Glu Pro Gly Leu Lys Glu Val Val Glu Ser Cys
50 55 60
Arg Gly Lys Asn Leu Phe Phe Ser Thr Asn Ile Asp Asp Ala Ile Lys
65 70 75 80
Glu Ala Asp Leu Val Phe Ile Ser Val Asn Thr Pro Thr Lys Thr Tyr
85 90 95
Gly Met Gly Lys Gly Arg Ala Ala Asp Leu Lys Tyr Ile Glu Ala Cys
100 105 110
Ala Arg Arg Ile Val Gln Asn Ser Asn Gly Tyr Lys Ile Val Thr Glu
115 120 125
Lys Ser Thr Val Pro Val Arg Ala Ala Glu Ser Ile Arg Arg Ile Phe
130 135 140
Asp Ala Asn Thr Lys Pro Asn Leu Asn Leu Gln Val Leu Ser Asn Pro
145 150 155 160
Glu Phe Leu Ala Glu Gly Thr Ala Ile Lys Asp Leu Lys Asn Pro Asp
165 170 175
Arg Val Leu Ile Gly Gly Asp Glu Thr Pro Glu Gly Gln Arg Ala Val
180 185 190
Gln Ala Leu Cys Ala Val Tyr Glu His Trp Val Pro Arg Glu Lys Ile
195 200 205
Leu Thr Thr Asn Thr Trp Ser Ser Glu Leu Ser Lys Leu Ala Ala Asn
210 215 220
Ala Phe Leu Ala Gln Arg Ile Ser Ser Ile Asn Ser Ile Ser Ala Leu
225 230 235 240
Cys Glu Ala Thr Gly Ala Asp Val Glu Glu Val Ala Thr Ala Ile Gly
245 250 255
Met Asp Gln Arg Ile Gly Asn Lys Phe Leu Lys Ala Ser Val Gly Phe
260 265 270
Gly Gly Ser Cys Phe Gln Lys Asp Val Leu Asn Leu Val Tyr Leu Cys
275 280 285
Glu Ala Leu Asn Leu Pro Glu Val Ala Arg Tyr Trp Gln Gln Val Ile
290 295 300
Asp Met Asn Asp Tyr Gln Arg Arg Arg Phe Ala Ser Arg Ile Ile Asp
305 310 315 320
Ser Leu Phe Asn Thr Val Thr Asp Lys Lys Ile Ala Ile Leu Gly Phe
325 330 335
Ala Phe Lys Lys Asp Thr Gly Asp Thr Arg Glu Ser Ser Ser Ile Tyr
340 345 350
Ile Ser Lys Tyr Leu Met Asp Glu Gly Ala His Leu His Ile Tyr Asp
355 360 365
Pro Lys Val Pro Arg Glu Gln Ile Val Val Asp Leu Ser His Pro Gly
370 375 380
Val Ser Glu Asp Asp Gln Val Ser Arg Leu Val Thr Ile Ser Lys Asp
385 390 395 400
Pro Tyr Glu Ala Cys Asp Gly Ala His Ala Val Val Ile Cys Thr Glu
405 410 415
Trp Asp Met Phe Lys Glu Leu Asp Tyr Glu Arg Ile His Lys Lys Met
420 425 430
Leu Lys Pro Ala Phe Ile Phe Asp Gly Arg Arg Val Leu Asp Gly Leu
435 440 445
His Asn Glu Leu Gln Thr Ile Gly Phe Gln Ile Glu Thr Ile Gly Lys
450 455 460
Lys Val Ser Ser Lys Arg Ile Pro Tyr Ala Pro Ser Gly Glu Ile Pro
465 470 475 480
Lys Phe Ser Leu Gln Asp Pro Pro Asn Lys Lys Pro Lys Val
485 490
<210> 61
<211> 78
<212> DNA
<213> 智人
<400> 61
aaacctgcca taactttccc aagaactgag tactctgtac ctgggagtag ttggcagatc 60
cactggtttc tgactgga 78
<210> 62
<211> 78
<212> DNA
<213> 智人
<400> 62
tgtggaccta actaggggga gcctaaaata atgttgggac tacctagatg gtcagaaaga 60
atgagccaat taacttct 78
<210> 63
<211> 78
<212> DNA
<213> 智人
<400> 63
aaacctgcca taactttccc aagaactgag tactctgtac tacctagatg gtcagaaaga 60
atgagccaat taacttct 78
<210> 64
<211> 79
<212> DNA
<213> 智人
<400> 64
aggttaggta ctgaactcat caggaggctg aggttggaaa gtagatttga caaggttaag 60
taaaagaaag gcaaagctg 79
<210> 65
<211> 79
<212> DNA
<213> 智人
<400> 65
attttttcgg gttttttttc cacttttttc cttttgaaat tttattattt atttactcat 60
tttgagatag ggtctcact 79
<210> 66
<211> 79
<212> DNA
<213> 智人
<400> 66
aggttgggta ctgaactcat caggaggctg agtttgaaat tttattattt atttactcat 60
tttgagatag ggtctcact 79
<210> 67
<211> 79
<212> DNA
<213> 智人
<400> 67
cttggttctc ctgctactac ttctgttgct gctacttgat ccttacagga tgtttctata 60
ctttacaaaa ctctttggt 79
<210> 68
<211> 79
<212> DNA
<213> 智人
<400> 68
gtgatggcag tgggcacgcc catatacatt tgcatacact ctaatataaa tgtttacaaa 60
catacacaca cacacattc 79
<210> 69
<211> 79
<212> DNA
<213> 智人
<400> 69
cttggttctc ctgctactac ttctgttgct gctacttgat ctaatataaa tgtttacaaa 60
catacacaca cacacattc 79

Claims (84)

1.一种诊断受试者中的癌症的方法,所述方法包括:
(a)测定获自所述受试者的样品中的选自由以下组成的组的至少一种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL;以及
(b)将所述少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定了患有癌症的受试者。
2.一种鉴定患有为NRF2依赖性癌症的癌症的受试者的方法,所述方法包括:
(a)测定获自所述受试者的样品中的选自由以下组成的组的至少一种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
(b)将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较;以及
(c)确定所述受试者的癌症是否是NRF2依赖性癌症,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定了患有NRF2依赖性癌症的受试者。
3.如权利要求1或2所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少两种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
4.如权利要求3所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少三种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRI16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
5.如权利要求4所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少四种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
6.如权利要求5所述的方法,其中测定获自所述受试者的样品中的AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL的表达水平。
7.如权利要求1-6中任一项所述的方法,其中测定AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN或NQO1中的一种或多种的表达水平。
8.如权利要求1-6中任一项所述的方法,其中测定AKR1B10、AKR1C2、ME1、KYNU、CABYR、TRIM16L、AKR1C4、CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3中的一种或多种的表达水平。
9.如权利要求3-6中任一项所述的方法,其中,
(a)所述样品中的所述至少两种基因的表达水平是所述样品的至少两种基因的平均值;
(b)所述至少两种基因的参照表达水平是所述参照的至少两种基因的平均值;以及
(c)将所述样品的至少两种基因的平均值与所述参照的至少两种基因的平均值进行比较。
10.如权利要求1-9中任一项所述的方法,其中所述参照表达水平是受试者群体中所述至少一种基因的平均表达水平。
11.如权利要求10所述的方法,其中所述受试者群体是共享共同种族性的受试者群体。
12.如权利要求1-11中任一项所述的方法,其中所述参照表达水平是患有癌症的受试者群体中所述至少一种基因的平均表达水平。
13.如权利要求12所述的方法,其中所述参照表达水平是患有肺癌的受试者群体中所述至少一种基因的平均表达水平。
14.如权利要求13所述的方法,其中所述肺癌是非小细胞肺癌(NSCLC)。
15.如权利要求14所述的方法,其中所述NSCLC是鳞状NSCLC。
16.如权利要求1-15中任一项所述的方法,其中其中所述表达水平是mRNA表达水平。
17.如权利要求16所述的方法,其中通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定所述mRNA表达水平。
18.如权利要求1-15中任一项所述的方法,其中所述表达水平是蛋白质表达水平。
19.如权利要求18所述的方法,其中通过蛋白质印迹、免疫组织化学或质谱法测定所述蛋白质表达水平。
20.如权利要求1-19中任一项所述的方法,所述方法还包括测定NRF2的DNA序列。
21.如权利要求20所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
22.一种诊断受试者中的癌症的方法,所述方法包括测定获自所述受试者的样品中的NRF2的DNA序列,其中包含其外显子2的全部或部分的缺失的NRF2 DNA的存在将所述受试者鉴定为患有癌症。
23.如权利要求22所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
24.一种鉴定患有癌症的受试者的方法,所述方法包括测定获自所述受试者的样品中的包含其外显子2的全部或部分的缺失的NRF2的mRNA表达水平,其中包含其外显子2的全部或部分的缺失的NRF2的存在将所述受试者鉴定为患有癌症。
25.如权利要求23或24所述的方法,其中通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定所述mRNA表达水平。
26.如权利要求24或25所述的方法,其还包括测定所述NRF2的DNA序列。
27.如权利要求26所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
28.如权利要求22-27中任一项所述的方法,其中所述NRF2还包含其外显子3的全部或部分的缺失。
29.一种诊断受试者中的癌症的方法,所述方法包括测定获自所述受试者的样品中的包含其Neh2结构域的全部或部分的缺失的NRF2的蛋白质表达水平,其中包含其Neh2结构域的全部或部分的缺失的NRF2的存在将所述受试者鉴定为患有癌症。
30.一种鉴定患有癌症的受试者的方法,所述方法包括测定获自所述受试者的样品中的包含其Neh2结构域的全部或部分的缺失的NRF2的蛋白质表达水平,其中包含其Neh2结构域的全部或部分的缺失的NRF2的存在将所述受试者鉴定为患有癌症。
31.如权利要求29或30所述的方法,其中所述NRF2还包含其Neh4结构域的全部或部分的缺失。
32.如权利要求29-31中任一项所述的方法,其中通过蛋白质印迹、免疫组织化学或质谱法测定所述蛋白质表达。
33.如权利要求1-32中任一项所述的方法,其还包括向所述受试者施用治疗有效量的NRF2途径拮抗剂。
34.如权利要求1-33中任一项所述的方法,其还包括向所述受试者施用治疗有效量的抗癌剂。
35.如权利要求1-34中任一项所述的方法,其中所述方法包括施用抗癌剂和NRF2途径拮抗剂。
36.如权利要求34或35所述的方法,其中共施用所述抗癌剂和所述NRF2途径拮抗剂。
37.如权利要求34或35所述的方法,其中相继地施用所述抗癌剂和所述NRF2途径拮抗剂。
38.如权利要求34-37中任一项所述的方法,其中所述抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。
39.如权利要求38所述的方法,其中所述抗血管生成剂是VEGF拮抗剂。
40.如权利要求33-39中任一项所述的方法,其中所述NRF2途径拮抗剂选自由以下组成的组:CREB拮抗剂、CREB结合蛋白(CBP)拮抗剂、Maf拮抗剂、激活转录因子4(ATF4)拮抗剂、蛋白激酶C(PKC)拮抗剂、Jun拮抗剂、糖皮质激素受体拮抗剂、UbcM2拮抗剂、HACE1拮抗剂、c-Myc激动剂、SUMO激动剂、KEAP1激动剂、CUL3激动剂或视黄酸受体α(RARα)激动剂。
41.一种治疗患有癌症的受试者的方法,所述方法包括:向所述受试者施用治疗有效量的NRF2途径拮抗剂,其中以下基因中的至少一种在获自所述受试者的样品中的表达水平经测定相对于所述至少一种基因的参照表达水平得以升高:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
42.如权利要求41所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少两种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
43.如权利要求42所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少三种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NOO1和FTL。
44.如权利要求43所述的方法,其中测定获自所述受试者的样品中的选自由以下组成的组的至少四种基因的表达水平:AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL。
45.如权利要求44所述的方法,其中测定获自所述受试者的样品中的AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、ME1、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、CYP4F11、RSPO3、ABCC2、AKR1B15、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN、NQO1和FTL的表达水平。
46.如权利要求41-45中任一项所述的方法,其中测定AKR1B10、AKR1C2、SRXN1、OSGIN1、FECH、GCLM、TRIM16、KYNU、CABYR、SLC7A11、TRIM16L、AKR1C4、NR0B1、UGDH、TXNRD1、GSR、AKR1C3、TALDO1、PGD、TXN或NQO1中的一种或多种的表达水平。
47.如权利要求41-45中任一项所述的方法,其中测定AKR1B10、AKR1C2、ME1、KYNU、CABYR、TRIM16L、AKR1C4、CYP4F11、RSPO3、AKR1B15、NR0B1和AKR1C3中的一种或多种的表达水平。
48.如权利要求41-45中任一项所述的方法,其中,
(a)所述样品中的所述至少两种基因的表达水平是所述样品的至少两种基因的平均值;
(b)所述至少两种基因的参照表达水平是所述参照的至少两种基因的平均值;以及
(c)将所述样品的至少两种基因的平均值与所述参照的至少两种基因的平均值进行比较。
49.如权利要求41-48中任一项所述的方法,其中所述参照表达水平是受试者群体中所述至少一种基因的平均表达水平。
50.如权利要求49所述的方法,其中所述受试者群体是共享共同种族性的受试者群体。
51.如权利要求41-50中任一项所述的方法,其中所述参照表达水平是患有癌症的受试者群体中所述至少一种基因的平均表达水平。
52.如权利要求51所述的方法,其中所述肺癌是非小细胞肺癌(NSCLC)。
53.如权利要求52所述的方法,其中所述NSCLC是鳞状NSCLC。
54.如权利要求41-53中任一项所述的方法,其中所述表达水平是mRNA表达水平。
55.如权利要求54所述的方法,其中通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定所述mRNA表达水平。
56.如权利要求55所述的方法,其中通过RNA测序测定所述mRNA表达水平。
57.如权利要求41-53中任一项所述的方法,其中所述表达水平是蛋白质表达水平。
58.如权利要求57所述的方法,其中通过蛋白质印迹、免疫组织化学或质谱法测定所述蛋白质表达。
59.如权利要求41-58中任一项所述的方法,其还包括测定所述NRF2的DNA序列。
60.如权利要求59所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
61.一种治疗患有癌症的受试者的方法,所述方法包括:
(a)测定获自所述受试者的样品中的包含其外显子2的全部或部分的缺失的NRF2的mRNA表达水平,其中包含其外显子2的全部或部分的缺失的NRF2mRNA的存在将所述受试者鉴定为患有癌症;以及
(b)向所述试者施用治疗有效量的NRF2途径拮抗剂。
62.如权利要求61所述的方法,其中通过PCR、RT-PCR、RNA测序、基因表达谱分析、基因表达系列分析或微阵列分析测定所述mRNA表达。
63.如权利要求62所述的方法,其中通过RNA测序测定所述mRNA表达。
64.如权利要求61-63中任一项所述的方法,所述方法还包括测定所述NRF2的DNA序列。
65.如权利要求64所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
66.一种治疗患有癌症的受试者的方法,所述方法包括:
(a)测定获自所述受试者的样品中的包含其外显子2的全部或部分的缺失的NRF2的DNA序列,其中包含其外显子2的全部或部分的缺失的NRF2DNA的存在将所述受试者鉴定为患有癌症;以及
(b)向所述试者施用治疗有效量的NRF2途径拮抗剂。
67.如权利要求66所述的方法,其中通过PCR、外显子组测序、微阵列分析或全基因组测序测定所述DNA序列。
68.如权利要求61-67中任一项所述的方法,其中所述NRF2还包含其外显子3的全部或部分的缺失。
69.一种治疗患有癌症的受试者的方法,所述方法包括;
(a)测定获自所述受试者的样品中的包含其Neh2的全部或部分的缺失的NRF2的蛋白质表达水平,其中包含其Neh2的全部或部分的缺失的NRF2蛋白的存在将所述受试者鉴定为患有癌症;以及
(b)向所述试者施用治疗有效量的NRF2途径拮抗剂。
70.如权利要求69所述的方法,其中所述NRF2还包含其Neh4结构域的全部或部分的缺失。
71.如权利要求69或70所述的方法,其中通过蛋白质印迹、免疫组织化学或质谱法测定所述蛋白质表达水平。
72.如权利要求41-71中任一项所述的方法,其中所述方法包括向所述受试者施用治疗有效量的抗癌剂。
73.如权利要求72所述的方法,其中共施用所述抗癌剂和所述NRF2途径拮抗剂。
74.如权利要求72所述的方法,其中相继地施用所述抗癌剂和所述NRF2途径拮抗剂。
75.如权利要求72-74中任一项所述的方法,其中所述抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。
76.如权利要求75所述的方法,其中所述抗血管生成剂是VEGF拮抗剂。
77.如权利要求41-76中任一项所述的方法,其中所述NRF2途径拮抗剂选自由以下组成的组:CREB拮抗剂、CREB结合蛋白(CBP)拮抗剂、Maf拮抗剂、激活转录因子4(ATF4)拮抗剂、蛋白激酶C(PKC)拮抗剂、Jun拮抗剂、糖皮质激素受体拮抗剂、UbcM2拮抗剂、HACE1拮抗剂、c-Myc激动剂、SUMO激动剂、KEAP1激动剂、CUL3激动剂或视黄酸受体α(RARα)激动剂。
78.如权利要求1-77中任一项所述的方法,其中从所述受试者获得的所述样品是肿瘤样品。
79.如权利要求1-78中任一项所述的方法,其中从所述受试者获得的所述样品来自活检样品。
80.如权利要求1-79中任一项所述的方法,其中所述样品获自先前未治疗的受试者。
81.如权利要求1-80中任一项所述的方法,其中所述受试者患有肺癌或头颈癌。
82.如权利要求81所述的方法,其中所述肺癌是非小细胞肺癌(NSCLC)。
83.如权利要求82所述的方法,其中所述NSCLC是鳞状NSCLC。
84.如权利要求81所述的方法,其中所述头颈癌是鳞状头颈癌。
CN201780047447.6A 2016-07-08 2017-07-10 通过nrf2及其下游目标基因的表达状态和突变状态诊断和治疗癌症的方法 Active CN109890982B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662360294P 2016-07-08 2016-07-08
US62/360,294 2016-07-08
PCT/US2017/041398 WO2018009939A1 (en) 2016-07-08 2017-07-10 Methods for diagnosing and treating cancer by means of the expression status and mutational status of nrf2 and downstream target genes of said gene.

Publications (2)

Publication Number Publication Date
CN109890982A true CN109890982A (zh) 2019-06-14
CN109890982B CN109890982B (zh) 2023-07-07

Family

ID=59388149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780047447.6A Active CN109890982B (zh) 2016-07-08 2017-07-10 通过nrf2及其下游目标基因的表达状态和突变状态诊断和治疗癌症的方法

Country Status (5)

Country Link
US (2) US11066709B2 (zh)
EP (1) EP3481963A1 (zh)
JP (2) JP7050702B2 (zh)
CN (1) CN109890982B (zh)
WO (1) WO2018009939A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112746112A (zh) * 2021-01-28 2021-05-04 武汉市农业科学院 与中国南方荷斯坦奶牛产奶高峰日相关的snp标记及其应用
CN113444793A (zh) * 2021-05-31 2021-09-28 复旦大学附属中山医院 检测肺腺癌抗氧化应激通路相关基因突变的试剂盒
CN114480658A (zh) * 2022-03-11 2022-05-13 中国人民解放军陆军军医大学第一附属医院 一种用于胶质瘤预后的基因标志物及其应用
CN114573668A (zh) * 2020-11-30 2022-06-03 中国人民解放军军事科学院军事医学研究院 一种乙脑病毒样颗粒及其制备方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11725247B2 (en) 2016-02-29 2023-08-15 Foundation Medicine, Inc. Methods of treating cancer
US10786471B2 (en) * 2017-02-06 2020-09-29 Massachusetts Institute Of Technology Methods and products related to glutaminase inhibitors
US12071671B2 (en) * 2018-02-08 2024-08-27 Centre National De La Recherche Scientifique Methods for the in vitro determination of the outcome and for the treatment of individuals having multiple myeloma
GB201814350D0 (en) * 2018-09-04 2018-10-17 Owlstone Med Ltd Diagnosis of cancer
WO2020150633A1 (en) 2019-01-18 2020-07-23 Orthobio Therapeutics, Inc. Gene editing to improve joint function
CN109609646B (zh) * 2019-01-23 2022-04-26 浙江大学 一种用于监测上皮性卵巢癌易感性的检测试剂盒
WO2020178399A1 (en) * 2019-03-05 2020-09-10 Norwegian University Of Science And Technology (Ntnu) Breast cancer signature genes
WO2020237186A1 (en) * 2019-05-23 2020-11-26 Christiana Care Health Services, Inc. Gene knockout of nrf2 for treatment of cancer
WO2022020785A2 (en) * 2020-07-23 2022-01-27 Orthobio Therapeutics, Inc. Gene editing to improve joint function
WO2023081934A1 (en) * 2021-11-08 2023-05-11 The University Of Chicago Methods and compositions for pkc-delta inhibition and cancer immunotherapy
WO2024097929A1 (en) * 2022-11-04 2024-05-10 Mayo Foundation For Medical Education And Research T cells with increased expression of malic enzyme 1 and uses thereof in cancer therapy

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047368A1 (en) * 2005-05-26 2010-02-25 Shyam Biswal Compositions and methods for the treatment or prevention of chemoresistant neoplasia
WO2015178508A1 (en) * 2014-05-22 2015-11-26 Canbas Co., Ltd. Nrf2-based cancer treatment and detection methods and uses

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL85035A0 (en) 1987-01-08 1988-06-30 Int Genetic Eng Polynucleotide molecule,a chimeric antibody with specificity for human b cell surface antigen,a process for the preparation and methods utilizing the same
WO1989006692A1 (en) 1988-01-12 1989-07-27 Genentech, Inc. Method of treating tumor cells by inhibiting growth factor receptor function
US20030206899A1 (en) 1991-03-29 2003-11-06 Genentech, Inc. Vascular endothelial cell growth factor antagonists
US6582959B2 (en) 1991-03-29 2003-06-24 Genentech, Inc. Antibodies to vascular endothelial cell growth factor
WO1994004679A1 (en) 1991-06-14 1994-03-03 Genentech, Inc. Method for making humanized antibodies
DE69233803D1 (de) 1992-10-28 2011-03-31 Genentech Inc Verwendung von vaskulären Endothelwachstumsfaktor-Antagonisten
US5635388A (en) 1994-04-04 1997-06-03 Genentech, Inc. Agonist antibodies against the flk2/flt3 receptor and uses thereof
IL117645A (en) 1995-03-30 2005-08-31 Genentech Inc Vascular endothelial cell growth factor antagonists for use as medicaments in the treatment of age-related macular degeneration
US20020032315A1 (en) 1997-08-06 2002-03-14 Manuel Baca Anti-vegf antibodies
DK1695985T3 (da) 1997-04-07 2011-06-14 Genentech Inc Fremgangsmåde til dannelse af humaniserede antistoffer ved tilfældig mutagenese
DK0973804T3 (da) 1997-04-07 2007-05-07 Genentech Inc Anti-VEGF-antistoffer
US6703020B1 (en) 1999-04-28 2004-03-09 Board Of Regents, The University Of Texas System Antibody conjugate methods for selectively inhibiting VEGF
MXPA05012723A (es) 2003-05-30 2006-02-08 Genentech Inc Tratamiento con anticuerpos anti-vgf.
WO2005000098A2 (en) * 2003-06-10 2005-01-06 The Trustees Of Boston University Detection methods for disorders of the lung
WO2005044853A2 (en) 2003-11-01 2005-05-19 Genentech, Inc. Anti-vegf antibodies
US20050106667A1 (en) 2003-08-01 2005-05-19 Genentech, Inc Binding polypeptides with restricted diversity sequences
US20060009360A1 (en) 2004-06-25 2006-01-12 Robert Pifer New adjuvant composition
EP2360277A1 (en) 2006-05-03 2011-08-24 Geisinger Clinic Methods for diagnosing and predicting non-alcoholic steatohepatitis (NASH)
JP2009544679A (ja) * 2006-07-25 2009-12-17 ザ ユニヴァーシティー コート オブ ザ ユニヴァーシティー オブ ダンディー 異常な細胞増殖に関連する疾患の治療におけるレチノイド及び小分子のNrf2アンタゴニストとしての使用
US20100215588A1 (en) * 2007-04-26 2010-08-26 Rami Skaliter Therapeutic delivery of inhibitory nucleic acid molecules to the respiratory system
DK3216803T3 (da) 2008-06-25 2020-06-02 Novartis Ag Stabile og opløselige antistoffer, der hæmmer vegf
JP5301652B2 (ja) * 2008-07-25 2013-09-25 インフォコム株式会社 新規がん遺伝子nrf2
AR080794A1 (es) 2010-03-26 2012-05-09 Hoffmann La Roche Anticuerpos bivalentes biespecificos anti- vegf/ anti-ang-2
US20160201132A1 (en) 2013-09-12 2016-07-14 Teva Pharmaceutical Industries Ltd. Gene expression biomarkers of laquinimod responsiveness

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047368A1 (en) * 2005-05-26 2010-02-25 Shyam Biswal Compositions and methods for the treatment or prevention of chemoresistant neoplasia
WO2015178508A1 (en) * 2014-05-22 2015-11-26 Canbas Co., Ltd. Nrf2-based cancer treatment and detection methods and uses

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HIRONORI TSUZURA等: "Expression of Aldo-Keto Reductase Family 1 Member B10 in the Early Stages of Human Hepatocarcinogenesis", 《INT. J. MOL. SCI.》 *
TORU NISHINAKA等: "Regulation of aldo–keto reductase AKR1B10 gene expression: Involvement of transcription factor Nrf2", 《CHEMICO-BIOLOGICAL INTERACTIONS》 *
王秀君等: "Nrf2通路在肿瘤化学预防中的研究进展", 《化学进展》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114573668A (zh) * 2020-11-30 2022-06-03 中国人民解放军军事科学院军事医学研究院 一种乙脑病毒样颗粒及其制备方法
CN112746112A (zh) * 2021-01-28 2021-05-04 武汉市农业科学院 与中国南方荷斯坦奶牛产奶高峰日相关的snp标记及其应用
CN113444793A (zh) * 2021-05-31 2021-09-28 复旦大学附属中山医院 检测肺腺癌抗氧化应激通路相关基因突变的试剂盒
CN113444793B (zh) * 2021-05-31 2022-09-23 复旦大学附属中山医院 检测肺腺癌抗氧化应激通路相关基因突变的试剂盒
CN114480658A (zh) * 2022-03-11 2022-05-13 中国人民解放军陆军军医大学第一附属医院 一种用于胶质瘤预后的基因标志物及其应用
CN114480658B (zh) * 2022-03-11 2024-01-26 中国人民解放军陆军军医大学第一附属医院 一种用于胶质瘤预后的基因标志物及其应用

Also Published As

Publication number Publication date
WO2018009939A9 (en) 2019-02-21
US11066709B2 (en) 2021-07-20
EP3481963A1 (en) 2019-05-15
WO2018009939A1 (en) 2018-01-11
JP7050702B2 (ja) 2022-04-08
JP2019531699A (ja) 2019-11-07
US20190218618A1 (en) 2019-07-18
JP2022101567A (ja) 2022-07-06
CN109890982B (zh) 2023-07-07
US20220090205A1 (en) 2022-03-24

Similar Documents

Publication Publication Date Title
CN109890982A (zh) 通过nrf2及其下游目标基因的表达状态和突变状态诊断和治疗癌症的方法
Chen et al. Thymidylate synthase and dihydrofolate reductase expression in non-small cell lung carcinoma: the association with treatment efficacy of pemetrexed
JP5719322B2 (ja) 腫瘍の治療
KR20180134347A (ko) 암의 진단 및 치료 방법
US20170114124A1 (en) SLIT-ROBO-Myo9-RHOA PATHWAY AND CANCER
JP2017523776A (ja) 膠芽腫の診断方法及びその治療用組成物
WO2011123427A2 (en) Treatment of cancer by inhibiting activity or expression of late sv-40 factor
KR20210065064A (ko) ERRγ 억제제를 유효성분으로 포함하는 항암 효과 증진용 약학적 조성물
KR102194746B1 (ko) Wnt 억제제와 연관된 마커
US10106853B2 (en) CUL4B as predictive biomarker for cancer treatment
CN110191897A (zh) 用于预防暴露于诱导p38活化的癌症治疗的受试者的转移的治疗
CN109562121A (zh) 转移性癌症的诊断和治疗方法
WO2011129427A1 (ja) 癌の診断剤および治療剤
Tepeoglu et al. Microsatellite instability in glioblastoma: is it really relevant in tumor prognosis?
Du et al. Precise diagnosis and treatment of thymic epithelial tumors based on molecular biomarkers
US20220218708A1 (en) Methods for treating smarcb1 deficient cancer or pazopanib resistant cancer
Gharzeddine Targeting the mechanism of 5-FU chemoresistance in colorectal cancer by metabolic reprogramming of tumor associated macrophages
JP2022513375A (ja) NAMPTi感受性のバイオマーカーとしてのPPM1D変異の同定法
Ewers Overcoming Cisplatin Resistance in Pancreatic Cancer
Tumbrink 3.3 MIZ1-∆ POZ shapes treatment response in small cell lung cancer
Coffey Investigation of the pharmacogenetics of colorectal cancer
WO2023077104A2 (en) Novel kinase fusions detected by liquid biopsy
JP2022505047A (ja) 抗がん療法のための標的
Class et al. Patent application title: METHODS AND COMPOSITIONS FOR THE TREATMENT OF CANCER Inventors: Johnathan R. Whetstine (Winchester, MA, US)
Ding Involvement of lipocalin 2 in leukemia and breast cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40012059

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TG01 Patent term adjustment
TG01 Patent term adjustment