CN110418801A - 鉴定恶臭调节化合物的方法 - Google Patents

鉴定恶臭调节化合物的方法 Download PDF

Info

Publication number
CN110418801A
CN110418801A CN201880016397.XA CN201880016397A CN110418801A CN 110418801 A CN110418801 A CN 110418801A CN 201880016397 A CN201880016397 A CN 201880016397A CN 110418801 A CN110418801 A CN 110418801A
Authority
CN
China
Prior art keywords
seq
leu
ile
ser
phe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880016397.XA
Other languages
English (en)
Other versions
CN110418801B (zh
Inventor
P·菲斯特
M·罗杰斯
H-L·考
C·A·阿比比
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA filed Critical Firmenich SA
Priority to CN202311093055.7A priority Critical patent/CN117330756A/zh
Publication of CN110418801A publication Critical patent/CN110418801A/zh
Application granted granted Critical
Publication of CN110418801B publication Critical patent/CN110418801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/20Screening for compounds of potential therapeutic value cell-free systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了与引起恶臭的物质DMTS结合的多肽。还提供了编码多肽的核酸序列。本发明进一步提供了鉴定化合物的方法,所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质DMTS激活的一种或多种嗅觉受体活性,该方法包括a)使受体、或其嵌合体或其片段与化合物接触;和b)确定化合物是否对受体活性有影响。还提供了一种表达载体,其包含编码所述多肽的核酸,以及非人生物体或宿主细胞,其经修饰以表达被DMTS激活的受体。还提供了多肽用于鉴定恶臭调节化合物的用途。

Description

鉴定恶臭调节化合物的方法
技术领域
技术领域涉及气味和芳香受体以及可用于鉴定气味和/或芳香化合物的试验,更具体地,鉴定恶臭化合物如二甲基三硫化物(DMTS)的抑制剂、调节剂或拮抗剂。
背景技术
嗅觉是人类感官系统中最复杂和最缺少理解的一种。从嗅觉受体(OR)激活到感知,还有许多步骤仍需要进一步研究。如果我们能够理解单个气味剂和混合物的OR代码如何转化为感知,那么我们就可以利用这些知识在几个方面带来显著的益处。这些方面包括:气味调节剂,如恶臭拮抗剂,其可阻止令人不快的气味;新的调味料和香料成分,其替代不可生物降解或有毒的化合物;以及气味增强剂,其会限制我们对天然来源难以获取的源化合物的依赖。“嗅觉代码”组合范例的核心是观察到任何单个OR可以被多种气味剂激活,相反,大多数气味剂能够激活几种OR。在小鼠基因组中,有大约1,200种不同的完整OR。相比之下,人类有大约400种不同的完整OR。在这两种情况下、OR的所有组成部分都被世界上数以千计的气味剂激活,正是这种组合复杂性使我们能够感知到嗅觉的广泛性。然而,截至2014年,使用传统的脱孤法(deorphanization)仅对82种小鼠(~8%)和17种人类OR(~10%)的气味剂或配体进行了鉴定。此外,尚未测试基本上在体外鉴定的大多数配体对人OR的生理相关性。
在WO2014/210585中描述了一种方法,该方法能够快速且可靠地鉴定存在于生物体中的全体OR中的相对一小部分的OR,所述OR由一种或多种气味剂特异性地激活或抑制。然而,使用这种方法,仍然需要鉴定气味受体,更特别地是由特定的引起恶臭物质激活的恶臭受体。
引起恶臭的化合物如二甲基三硫化物(DMTS)和其他密切相关的多硫化合物如二甲基二硫醚(DMDS)会产生令人不快的气味,例如来自厕所和含有粪便物质的其他“盥洗室”来源、或来自口臭。因此,需要结合、抑制、阻断、限制和/或调节由特定恶臭物质如DMTS或DMDS激活的一种或多种嗅觉受体活性的恶臭调节剂或拮抗剂。进一步需要试验,其依赖于这种新的恶臭受体或新鉴定为与特定引起恶臭物质相关的恶臭受体,以鉴定与这些受体结合的新化合物或化合物混合物。
发明内容
本发明提供了一种非人宿主生物体或宿主细胞,其经过修饰以表达由DMTS激活的受体,其中所述受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出。
进一步提供了一种非人宿主生物体或宿主细胞,其经转化以表达包含与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。
本发明进一步提供了一种表达载体,其包含编码多肽的核酸,所述多肽包含与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
本发明还提供了一种具有核酸的表达载体,其中所述核酸包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQID NO:39,或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。
本发明提供了一种包含如上所述的核酸序列的核酸,并且还提供了一种包含如上所述的氨基酸序列的多肽。
本发明进一步提供了一种用于鉴定化合物的方法,该化合物结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性,所述嗅觉受体由引起恶臭物质如二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)激活,其中所述受体是包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ IDNO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽,其中该方法包括:
a)使受体、或其嵌合体或其片段与化合物接触;
b)确定该化合物是否对受体活性有影响。
还提供了一种鉴定化合物的方法,该化合物结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性,所述嗅觉受体由引起恶臭的物质激活,该方法包括:
a.使受试物质和引起恶臭的物质接触至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的嗅觉受体;
b.通过测量在受试物质存在和不存在的情况下嗅觉受体的响应来测量嗅觉受体对引起恶臭的物质的反应;
c.根据在受试物质存在和不存在时测量的响应,鉴定调节嗅觉受体反应的受试物质;和
d.选择鉴定的受试物质作为调节嗅觉受体对引起恶臭物质反应的化合物,
其中引起恶臭物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
还提供了一种用于鉴定恶臭调节剂的方法,包括:
a.使受试物质和引起恶臭物质与至少一种嗅觉受体接触,其中所述受体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽;
b.测量嗅觉受体多肽对引起恶臭物质的反应;
c.基于所测量的反应,鉴定出能抑制嗅觉受体反应的受试物质;和
d.选择结合、抑制、阻断、限制和/或调节嗅觉受体反应的受试物质作为恶臭调节剂,
其中引起恶臭物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
另外提供了一种重组核酸分子,其包含:包含Lucy标签、标签和/或Rho标签中的至少一种的核酸,以及编码从Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的受体的核酸或其反向互补序列。
还进一步提供了一种非人宿主生物体或宿主细胞,其经重组修饰以表达如上所述的核酸或多肽。
附图说明
图1表示本发明提到的受体之间的成对氨基酸同一性水平。
图2表示小鼠气味受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738和Olfr742以及人类气味受体OR4S2和OR52N5的DMTS剂量响应曲线。
图3表示人类气味受体OR2L13、OR4C15、OR8H3、OR11G2和OR52N2的DMTS剂量响应曲线。
图4表示对DMTS受体活性具有特异性抑制作用的挥发性化合物的等级。
图5表示小鼠气味受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742和人类气味受体OR4S2的DMTS和DMDS剂量响应曲线。
具体实施方式
对于本发明和所附权利要求的描述,除非另有说明,“或”的使用意指“和/或”。类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”可以互换使用并且旨在不限制。
还应当理解的是,在描述各个实施方案使用的术语“包含”的情况下,本领域技术人员能够理解,在一些具体情形中,可以替代地使用语言“基本上由……组成”或“由……组成”来描述一个实施方案。
除非另有说明,以下术语具有归属于它们的含义。
“OR”是指在嗅觉细胞中表达的G蛋白偶联受体(GPCR)家族的一个或多个成员。还可以基于形态学或通过嗅觉细胞中特异性表达的蛋白质的表达来鉴定嗅觉受体细胞。OR家族成员可以具有作为嗅觉信号转导受体的能力。
“DMTS OR”或“DMDS OR”是指在嗅觉细胞中表达的G蛋白偶联受体家族的成员,该受体在结合或活性测定中结合和/或被DMTS或DMDS激活以用于鉴定结合和/或激活GPCR的配体。所述测定如下所述。本发明的DMTS或DMDS受体包括片段、变体,包括合成的和天然存在的,以及响应或结合DMTS或DMDS的嵌合体或重组核酸或蛋白质。
认为“OR”多肽是这样的,它们属于由单个~1kb长外显子编码的7-跨膜结构域G蛋白偶联受体超家族并且表现出特征性嗅觉受体特异性氨基酸基序。这七个结构域被称为“跨膜”或称“TM”结构域TM I~TM VII,其通过三个“内部细胞环”或称“IC”结构域IC I~ICIII,以及三个“外部细胞环”或称“EC”结构域EC I~EC III连接。基序及其变体定义为但不限于与TM III和IC II重叠的MAYDRYVAIC基序(SEQ ID NO:53),与IC III和TM VI重叠的FSTCSSH基序(SEQ ID NO:54),TM VII中的PMLNPFIY基序(SEQ ID NO:55)以及EC II中的三个保守C残基,以及TM I中高度保守的GN残基的存在[Zhang,X.&Firestein,S.Nat.Neurosci.5,124–133(2002);Malnic,B.,et al.Proc.Natl.Acad.Sci.U.S.A.101,2584–2589(2004)]。
“OR”核酸编码具有7个具有“G蛋白偶联受体活性”的跨膜区的GPCR家族,例如,它们可响应细胞外刺激而结合G蛋白并通过刺激酶如磷脂酶C和腺苷酸环化酶而促进第二信使如IP3、cAMP、cGMP和Ca2+的产生。
“旁系同源”OR基因或“旁系同源物”是基因重复的结果,是指同一物种内密切相关的同源基因。“直系同源”OR基因或“直系同源物”定义为由共同祖先中存在的基因系统发育连接,并且指其他物种中密切相关的同源基因。
“N末端结构域”区域在N末端开始并延伸至靠近第一跨膜区起点的区域。“跨膜区”包含七个“跨膜结构域”,其是指位于质膜内的OR多肽的结构域,并且还可以包括相应的细胞质环(细胞内)和细胞外环。七个跨膜区、细胞外环和细胞质环可以使用标准方法鉴定,例如疏水性分布图,或如Kyte&Doolittle,J.Mol.Biol.,157:105-32(1982)或在Stryer中所描述的。跨膜结构域的一般二级和三级结构,特别是G蛋白偶联受体的七个跨膜结构域,例如嗅觉受体是本领域已知的。因此,可以基于已知的跨膜结构域序列预测一级结构序列,如下文详细描述的。这些跨膜结构域可用于体外配体结合测定。
在测试调节OR家族成员介导的嗅觉转导的化合物的测定中,该语境中的短语“功能性效应”包括确定间接或直接受到受体影响的任何参数,例如功能性、物理的和化学的作用。它包括配体结合、离子通量的变化、膜电位、电流、转录、G蛋白结合、GPCR磷酸化或去磷酸化、信号转导受体-配体相互作用、第二信使浓度(例如,cAMP、cGMP IP3或细胞内Ca2+),体外、体内和离体,还包括其他生理作用,例如神经递质或激素释放的增加或减少。
在测定的语境中“确定功能性效应”或“确认活性”是指化合物的测定,其增加或减少间接或直接受OR家族成员影响的参数,例如功能性、物理性和化学性效应。这些功能性效应可以通过本领域技术人员已知的任何方法测量,例如,光谱特征(例如,荧光、吸光度、折射率)、流体动力学(例如,形状)、色谱或溶解度性质、膜片钳、电压敏感染料、全细胞电流、放射性同位素外排、诱导型标记、卵母细胞OR基因表达的变化;组织培养细胞OR表达;OR基因或活性诱导基因(如egr-1或c-fos)的转录激活;配体结合试验;电压、膜电位和电导变化;离子通量测定;细胞内第二信使如cAMP、cGMP和肌醇三磷酸(IP3)的变化;细胞内钙水平的变化;神经递质释放等。
OR基因或蛋白质的“粘合剂”、“抑制剂”、“阻断剂”、“限制剂”、“激活剂”和/或“调节剂”可互换使用,是指结合、抑制、阻断、限制、激活或调节用于鉴定嗅觉转导的体内、体外和离体测定的分子,例如配体、激动剂、拮抗剂、增强剂及其同源物和模拟物。限制剂(inhibitors)是例如结合、部分或完全阻断刺激、减少、抑制、预防、延迟激活、失活、脱敏或下调嗅觉转导的化合物,例如拮抗剂(antagonists)。激活剂(activators)是例如结合、刺激、增加、开放激活、促进、增强激活、敏化或上调嗅觉转导的化合物,例如激动剂(agonists)。调节剂包括例如改变受体与结合激活剂或限制剂的细胞外蛋白质(例如气味结合蛋白质、ebnerin和疏水性载体家族的其他成员、或脂质运载蛋白家族成员)的相互作用的化合物;G蛋白;激酶(例如,视紫红质激酶和β肾上腺素能受体激酶的同源物,其参与受体的失活和脱敏);和抑制蛋白,其也使受体失活和脱敏。调节剂还包括改变OR的亲和力或转导功效的化合物,其改变激活剂对OR的作用。调节剂可包括OR家族成员的遗传修饰形式,例如具有改变的活性,以及天然存在的和合成的配体、拮抗剂、激动剂、小化学分子等。限制剂和激活剂的这种测定包括例如,在细胞或细胞膜中表达OR家族成员,在存在或不存在调味料、香料或恶臭分子(例如,如上所述的引起恶臭的物质如DMTS)的情况下应用推定的调节剂化合物,然后确定对嗅觉转导的功能影响。将包含用潜在激活剂、限制剂或调节剂处理的OR家族成员的样品或测定与不含限制剂、激活剂或调节剂的对照样品进行比较,以检查调节程度。对照样品(未用调节剂处理)的相对OR活性值为100%。当OR活性值相对于对照为约80%,任选地为50%,或25~0%时,实现对OR的限制。
本发明所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含本发明化合物通常与其天然状态相关的其他不同化合物的状态,因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5%、1%、5%、10%或20%,最优选至少50%或75%。在一个优选的实施方案中,这些术语是指本发明的化合物占给定样品质量按重量计至少95%。如本发明所用,当提及核酸或蛋白质时,核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”、“分离的”,也指不同于天然存在于哺乳动物,特别是人体中的该核酸或蛋白质的纯化或浓缩状态。任何纯化程度或浓度,只要大于天然存在于哺乳动物,特别是人体中的纯度或浓度,包括(1)从其他相关结构或化合物中的纯化;或(2)与在哺乳动物,特别是人体中通常不相关的结构或化合物的缔合,都在“分离的”的含义内。根据本领域技术人员已知的各种方法和过程,本发明所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的,或如若不然与它们通常在性质上不相关的结构或化合物相缔合。
如本发明所用,术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体,如下文详细描述的。例如,本发明提供用于扩增(例如,通过聚合酶链反应,PCR)天然表达的(例如,基因组DNA或mRNA)或本发明在体内、离体或体外的重组核酸(例如cDNA)的方法和试剂(例如,特异性简并寡核苷酸引物对,寡聚dT引物)。
术语“7-跨膜受体”是指属于跨膜蛋白超家族的多肽,其具有跨越质膜7次的7个结构域(因此,7个结构域被称为“跨膜”或称“TM”结构域TM I~TM VII)。嗅觉和某些味觉受体的家族都属于这个超级家庭。7-跨膜受体多肽具有相似和特征性的一级、二级和三级结构,如下面进一步详细讨论的。
术语“核酸”或“核酸序列”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸寡核苷酸。该术语包括含有天然核苷酸的已知类似物的核酸,即寡核苷酸。该术语还包括具有合成骨架的核酸样结构。除非另有说明,否则特定核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)和互补序列、以及明确指出的序列。具体地,简并密码子取代可以通过产生例如其中一个或多个选定密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现。
除了本发明公开的序列中显示的基因序列之外,变体还包括可能存在于给定群体内的DNA序列多态性,其可能导致本发明公开的多肽的氨基酸序列的变化,这对于本领域技术人员来说是显而易见的。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位变异还可包括功能性等同物。
其他实施方案还涉及通过来自具体公开的核酸的此类序列多态性衍生的分子。这些天然变异通常在基因的核苷酸序列或本发明公开的多肽的氨基酸序列中产生约1~5%的变化。如上所述,编码本发明实施方案的多肽的核酸是修饰旨在用于本发明所述方法的非人宿主生物体或宿主细胞的有用工具。
术语“多肽”、“肽”和“蛋白质”在本发明中可互换使用,是指氨基酸残基的聚合物,无论是否包含天然存在的氨基酸或聚合物和非天然存在的氨基酸或聚合物。当参考核酸的部分使用时,术语“异源的”表示核酸包含两个或更多个在自然界中彼此不存在相同关系的子序列。例如,核酸通常是重组产生的,具有来自无关基因的两个或更多个序列,其被排列以产生新的功能性核酸,例如来自一个来源的启动子和来自另一个来源的编码区。类似地,异源蛋白质表明该蛋白质包含两个或更多个在自然界中彼此不存在相同关系的子序列(例如,融合蛋白)。
“启动子”定义为指导核酸转录的核酸序列阵列。如本发明所用,启动子包括转录起始位点附近的必要核酸序列的TATA盒,例如,在聚合酶II型启动子的情况下。启动子还任选地包括远端增强剂或阻遏元素,其可以位于距转录起始位点数千碱基对的位置。“组成型”启动子是在大多数环境和发育条件下具有活性的启动子。“诱导型”启动子是在环境或发育调节下有活性的启动子。术语“可操作地连接”是指核酸表达控制序列(例如启动子或转录因子结合位点阵列)与第二核酸序列之间的功能性连接,其中表达控制序列指导核酸对应于第二序列的转录。
如本发明所用,“重组体”是指在体外合成或以其他方式操作的多核苷酸(例如,“重组多核苷酸”);是指使用重组多核苷酸在细胞或其他生物系统产生基因产物的方法;或是指重组多核苷酸编码的多肽(“重组蛋白质”)。“重组体”还意指将具有来自不同来源的各种编码区或结构域或启动子序列的核酸连接到表达盒或载体中,用于表达例如包含本发明的易位结构域的融合蛋白的诱导型或组成型表达和使用引物潜在扩增的核酸序列。“重组体”还指通过基因组编辑技术(例如CRISPR/Cas9)获得的导致内源基因(例如本发明提及的受体基因)稳定或瞬时表达的细胞的修饰。
术语“表达载体”是指用于在体外、离体或体内、组成型或诱导型地在任何细胞中,包括原核、酵母、真菌、植物、昆虫或哺乳动物细胞内表达本发明的核酸序列的任何重组表达系统。该术语包括任何线性或环状表达系统,包括但不限于病毒载体、噬菌体和质粒。技术人员能够根据表达系统选择合适的载体。该术语包括保持附加型或整合到宿主细胞基因组中的表达系统。该表达系统可以具有自我复制或非自我复制的能力,即驱动细胞中的瞬时表达。该术语包括重组“表达盒”,其可含有转录重组核酸所需的最小元素。该术语还涵盖用于通过例如基因组编辑方法(例如CRISPR/Cas9)表达内源基因的盒或载体。
“非人生物体或宿主细胞”是指含有本发明所述核酸或表达载体并支持表达载体复制或表达的非人生物体或细胞。宿主细胞可以是原核细胞,例如大肠杆菌,或真核细胞,例如酵母、昆虫、两栖动物或哺乳动物细胞,例如CHO、HeLa、HEK-293等,例如培养的细胞、外植体和体内细胞。
“标签”(tag)或“标签组合”是指可以添加到气味受体蛋白质中的短多肽序列。通常,将编码“标签”或“标签组合”的DNA添加到编码受体的DNA中,最终产生融合蛋白,其中“标签”或“标签组合”融合到受体的N-末端或C-末端。Lucy、和/或Rho标签可以增强受体向细胞膜的运输,因此可以帮助表达功能性气味受体,用于体外基于细胞的测定[Shepard,B.et al.PLoS One 8,e68758–e68758(2013),and Zhuang,H.&Matsunami,H.J.Biol.Chem.282,15284–15293(2007)]。
在一个实施方案中,本发明提供了分离的核酸分子,其包含与SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在一个实施方案中,本发明提供了如上所述的分离的核酸序列,其编码包含与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽,
在另一个实施方案中,本发明提供了分离的多肽,其包含与SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,非人生物体或宿主细胞经转化以表达包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。
在一个实施方案中,非人生物体或宿主细胞经转化以表达包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40相同的氨基酸序列的多肽。
本发明进一步提供了表达载体,其包含编码多肽的核酸,所述多肽包含与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
本发明还提供了表达载体,其包含核酸,所述核酸包含与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
本发明还提供了具有核酸的表达载体,其中所述核酸包含与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列相同的核苷酸序列。
在一个实施方案中,本发明是一种用于鉴定化合物的方法,所述化合物结合、抑制、阻断、限制和/或调节嗅觉受体的活性,所述嗅觉受体由引起恶臭的物质如二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)激活,其中所述受体为包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。其中该方法包括:
a)使受体、或其嵌合体或其片段与化合物接触;
b)确定该化合物是否对受体的活性有影响。
在一个实施方案中是一种用于鉴定化合物的方法,所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的嗅觉受体的活性,所述方法包括:
a.使受试物质和引起恶臭的物质与至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的嗅觉受体接触;
b.通过测量在受试物质存在和不存在的情况下嗅觉受体的响应来测量嗅觉受体对引起恶臭的物质的反应;
c.根据在受试物质存在和不存在时测量的反应,鉴定出调节嗅觉受体反应的受试物质;和
d.选择所鉴定的受试物质作为调节嗅觉受体对恶臭物质反应的化合物,
其中引起恶臭的物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
在本发明的另一个实施方案中,本发明是一种用于鉴定恶臭调节剂的方法,包括:
a.使受试物质和引起恶臭的物质与至少一种嗅觉受体接触,其中所述受体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽;
b.测量嗅觉受体多肽对引起恶臭的物质的反应;
c.基于所测量的反应,鉴定出能调节或抑制嗅觉受体反应的受试物质;和
d.选择结合、抑制、阻断、限制和/或调节嗅觉受体反应的受试物质作为恶臭调节剂;
其中引起恶臭的物质为二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
一个实施方案是一种用于鉴定恶臭限制剂的方法,包括:
a.使受试物质和引起恶臭的物质与至少一种嗅觉受体接触,其中所述受体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽;
b.测量嗅觉受体多肽对引起恶臭的物质的反应;
c.基于所测量的反应,鉴定出能调节或抑制嗅觉受体反应的受试物质;和
d.选择抑制嗅觉受体反应的受试物质作为恶臭限制剂;
其中引起恶臭的物质为DMTS,恶臭是粪便恶臭或口臭。
一个实施方案是一种鉴定化合物的方法,推定该化合物调节DMTS相关的恶臭,该方法包括:(i)使表达DMTS受体多肽的细胞系与至少一种化合物接触,所述DMTS受体多肽包含与SEQ ID NO:2、ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少90%序列同一性的氨基酸序列;(ii)筛选出结合、抑制、阻断、限制和/或调节所述嗅觉受体多肽的活性的化合物;和(iii)如果一种化合物结合、抑制、阻断、限制和/或调节所述DMTS受体多肽的活性,则鉴定出推定调节DMTS相关恶臭的化合物。
在另一个实施方案中,本发明所述方法中的引起恶臭的物质为二甲基三硫化物(DMTS)。
另外提供了一种重组核酸分子,其包含:
a.包含标签组合的核酸,所述标签组合包含Lucy、和/或Rho标签中的一种或多种;和
b.编码从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的受体的核酸或其互补序列。
在进一步的实施方案中,Lucy标签包含SEQ ID NO:47,标签包含SEQ IDNO:43,而Rho标签包含SEQ ID NO:45。
进一步提供了许多恶臭调节化合物中的任何一种,其结合、抑制、阻断、限制和/或调节由引起恶臭的物质如二甲基三硫化物(DMTS)激活的嗅觉受体的活性,并且通过本发明公开的方法鉴定。
在一个实施方案中,本发明是一种恶臭调节化合物,其结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性,所述嗅觉受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出,并且通过本发明公开的方法鉴定。
另一个实施方案涉及由DMTS或DMDS激活或可以被其激活的多肽的用途,所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,用于鉴定一种恶臭调节化合物,该化合物结合、抑制、阻断、限制和/或调节嗅觉受体的活性。
还进一步提供了一种经重组修饰以表达上述多肽的细胞。
在一个实施方案中,本发明是一种非人宿主生物体或宿主细胞,其已经转化或修饰以表达由DMTS激活的受体,所述受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742,Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出。
在一个实施方案中,本发明是一种非人宿主生物体或宿主细胞,其已经转化或修饰以表达由DMTS激活的受体,其中所述受体包含如本发明所述的多肽或由本发明所述的核酸编码的多肽。
在本发明的另一个实施方案中,本发明是一种非人宿主生物体或宿主细胞,其包含如本发明所述的核酸或表达载体。
在一个实施方案中,本发明提供一种细胞,其中所述细胞为原核细胞。在另一个实施方案中,本发明提供的细胞为一种真核细胞。在一个具体实施方案中,本发明提供的细胞由从酵母细胞和植物细胞构成的群组中选出。在本发明提供的更具体的一个实施方案中,所述细胞由从HEK293、CHO、非洲爪蟾卵母细胞(Xenopus oocytes)、COS、酵母、细菌和源自嗅觉基板的细胞构成的群组中选出。
为了鉴定未知的DMTS或DMDS特异性受体,DMTS和DMDS可用于筛选解离的嗅觉感觉神经元(OSN)。DMTS和DMDS可进一步用于对特定DMTS或DMDS受体进行的基于细胞的剂量反应实验,以评估受体的特异性和敏感性。
在一个方面,本发明提供鉴定用于恶臭调节化合物的哺乳动物气味受体的方法以及用于筛选的受体的用途,特别是用于恶臭调节剂的高通量筛选(HTS)(该调节剂例如结合、抑制、阻断、限制和/或调节OR的活性)。
本发明特别提供的是小鼠受体,例如,Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr669、Olfr665、Olfr207、Olfr1211,及其人类对应物OR4S2、OR5T1、OR8H3、OR2L13、OR2AJ1、OR11G2、OR52N5、OR52N2、OR5AC2和OR4C15,作为引起恶臭的物质DMTS、DMDS或其他多硫化合物的受体,如表1所示。
表1.直系同源小鼠和人类气味受体对及其在氨基酸水平上的相应同一性。
小鼠直系同源物 人类直系同源物 氨基酸同一性
Olfr1193 OR4S2 90%
Olfr1093 OR5T1 77%
Olfr1097 OR8H3 70%
Olfr166 OR2L13 85%
Olfr169 OR2AJ1 72%
Olfr738 OR11G2 79%
Olfr742 OR11G2 74%
Olfr669 OR52N5 87%
Olfr665 OR52N2 77%
Olfr207 OR5AC2 64%
Olfr1211 OR4C15 83%
虽然不希望受任何理论束缚,但小鼠受体Olfr738是受体Olfr742的旁系同源物,而人类受体OR11G2是这些小鼠受体的直系同源物;小鼠受体Olfr669是受体Olfr665的旁系同源物和人类受体OR52N5的直系同源物;而小鼠受体Olfr665是人类受体OR52N2的直系同源物。在WO2014/210585中,先前已将几种受体鉴定为吲哚和/或粪臭素反应性气味受体。然而,这些受体先前未与引起恶臭的物质DMTS或DMDS或其他相关的多硫化物化合物相关联。吲哚和粪臭素与多硫化合物没有化学相关性,因此基于化学结构的方法如结构-活性-关系(SAR)以鉴定其他配体不会将DMTS定义为这些受体的潜在拮抗剂。
在另一个实施方案中,用于监测嗅觉受体活性的指示剂选自荧光钙指示剂染料、钙指示剂蛋白、荧光cAMP指示剂、细胞流动测定、细胞动态质量再分布测定、基于无标记的细胞测定、cAMP反应元件(CRE)介导的报告蛋白、生物化学cAMP HTRF测定、β-抑制蛋白测定或电生理学记录。特别地,选择钙指示剂染料可用于监测在嗅觉神经元(例如,Fura-2AM)的膜上表达的嗅觉受体的活性。
在一个具体的实施方案中,依次筛选化合物,并使用荧光显微镜或荧光激活细胞分选仪(FACS)测量钙染料荧光的气味依赖性变化。
在另一个实施方案中,嗅觉受体的分子3D受体模型用于评估计算机中的结合潜力并鉴定可以激活、模拟、阻断、限制、调节和/或增强嗅觉受体活性的化合物。
例如,使用连接到显微操纵器的玻璃微电极或FACS机器来分离由DMTS或DMDS激活的嗅觉神经元。通过Ca2+成像筛选小鼠嗅觉感觉神经元,类似于先前描述的程序[Malnic,B.,et al.Cell 96,713–723(1999);Araneda,R.C.et al.J.Physiol.555,743–756(2004);和WO2014/210585,其全部内容通过引用并入本发明。特别地,使用电动可移动显微镜台来增加每个实验可筛选的数量至至少1,500个细胞。由于小鼠中约有1,200种不同的嗅觉受体,并且每种嗅觉感觉神经元仅表达1,200种嗅觉受体基因中的1种,因此该筛选能力几乎涵盖整个小鼠气味受体库。换言之,用于高通量嗅觉感觉神经元筛选的钙成像的组合导致几乎所有气味受体的识别,其响应于特定的气味特征。在一个特定方面,可以分离响应DMTS或DMDS的气味受体。例如,分离至少一个神经元。
对于嗅觉神经元的钙成像,可以在神经元解离之前从小鼠解剖主要的嗅觉上皮细胞。然后可以将解剖的嗅觉上皮细胞转移到解离缓冲液中进行机械和酶促解离。然后可以将解离的神经元接种到盖玻片上,允许通过荧光显微镜筛选数千个细胞,并且可以在例如约30分钟、31℃下将细胞加载钙敏感染料(Fura-2AM)并转移到显微镜准备筛查。通过在解离的嗅觉神经元上灌注稀释的气味剂溶液(在生理盐水中)来刺激细胞。通过例如用50μm的恶臭化合物刺激受体,然后通过监测由Fura-2荧光的变化指示的细胞内Ca2+通量来鉴定响应恶臭化合物的稀有细胞。在分析之后,可以使用抽吸微量移液管从玻璃盖玻片取回响应细胞。然后将分离的细胞合并到一个样品中或单独处理以随后鉴定在响应细胞中表达为mRNA的气味剂受体基因。
在一个具体的实施方案中,根据Marko,N.F.,et al.,(2005)A robust methodfor the amplification of RNA in the sense orientation。BMC genomics,6,27;doi:10.1186/1471-2164-6-27(Eberwine方法)中通常描述的方法纯化和扩增嗅觉神经元的mRNA。使用下一代测序(NGS)技术对至少一部分转录组(直至包括整个转录组)进行测序或使用微阵列技术与已知基因杂交。NGS通常在Metzker,M.L.Nat.Rev.Genet.11,31–46(2010)中讨论和描述。在具体的实施方案中,汇集至少5个呈现相同响应谱的神经元。挑选后立即通过细胞裂解释放mRNA;没有DNA酶,也没有进行纯化步骤。通过连续两轮体外转录(IVT)来扩增mRNA。扩增可以根据MesageAmpII aRNA试剂盒(Ambion,AMA1751)进行,参数如下:两轮连续14小时长IVT。
在另一个实施方案中,使用基于LD-PCR(长距离聚合酶链式反应)的方法纯化和扩增单个嗅觉神经元的mRNA,例如在NGS-ready试剂盒中描述的方法(例如,Clontech/Takara, Low Input RNA Kit for Sequencing-v3,目录号634848)。首先将单细胞mRNA逆转录成相应的cDNA,随后用18个PCR循环扩增,并用作转录组测序的NGS样品。
在另一个实施方案中,通过将从分离的激活的嗅觉感觉神经元获得的NGS读数的结果与相同物种的参考基因组序列进行比较,确定DMTS嗅觉受体的组或基因家族的同一性(例如,多达所挑选的神经元的数量)。特别地,推定的DMTS受体将是嗅觉神经元衍生的NGS样品中最高度丰富的嗅觉受体mRNA,或存在于多于一个的独立的生物复制品中。由于嗅觉代码的组合性质(一种化合物激活许多OR,而一种OR可被许多化合物激活),汇集由给定化合物激活的几种神经元,允许在单个NGS实验中检索几乎所有负责感知这些分子的受体。因此,汇集功能相似的神经元极大地提高了脱模吞吐量和速度。
然后使用标准生物信息学工具在假设同源序列受体保留相似功能的情况下鉴定与其他推定的哺乳动物(非人)DMTS受体最密切相关的人类气味受体。几种方法基于该假设[Armelin-Correa and Malnic(2017)]成功鉴定人OR-配体对,并且高达80%的小鼠-人类直系同源物似乎保持相似的功能反应谱[Adipietro,K.A,et al.PLoS Genet.8,e1002821–e1002821(2012)]。可以使用BLASTP和/或BLASTN算法的默认参数,或其他直系同源对识别算法,例如InParanoid。
人类或非人类哺乳动物DMTS受体可适用于功能测定,其可用于鉴定结合、抑制、阻断、限制和/或调节嗅觉受体活性的化合物。特别地,该测定可以是基于细胞的测定或结合测定,而用于鉴定化合物的方法可以是高通量筛选测定。更具体地,本发明提供了基于受体的测定,其适于用化合物文库高通量筛选受体,以发现调节化合物(例如,结合、阻断、抑制、限制和掩蔽)。
在一个具体的实施方案中,DMTS受体基因序列从如下DMTS敏感细胞鉴定:将汇集的神经元加热至75℃10分钟以破坏细胞膜并使其mRNA可用于扩增。当在有限量的起始材料下(通常为1~15个细胞)应用NGS技术时,该扩增步骤是重要的。根据Eberwine方法(IVT)的线性扩增确保维持表达基因的相对转录水平。连续两轮过夜(14h)的体外转录用于产生足够量的cRNA;然后使用扩增的cRNA产生Illumina HiSeq cDNA文库。得到的通常为75~150个碱基对的短序列(通常称为“读段”(reads))与小鼠的参考基因组(例如UCSC版本mm9或mm10)对齐,以构建这些细胞的完整转录组。转录组数据的定量分析产生转录的气味受体基因列表及其各自的表达水平。显示最丰富的mRNA水平(最丰富的“读段”)或存在于一次以上重复实验中的气味受体基因被认为是推定的DMTS受体。
然后使用预测的小鼠OR基因挖掘小鼠和人类基因组数据库的最新版本,以鉴定小鼠(旁系同源基因)和人类(直系同源基因)中最密切相关的受体(即最高序列相似性)。该过程可以使用BLAST搜索算法(在NCBI网站上公开获得),一种序列相似性搜索工具,其中先前从初始转录组分析获得的每个推定的基因序列被用作查询序列。在认为旁系同源和直系同源基因极有可能具有相似活性的假设下,从该数据挖掘过程中鉴定的新鉴定的基因被认为是潜在的DMTS受体。在一个具体的实施方案中,进行序列同源性的成对比较以鉴定小鼠和人类中密切相关的受体,并如WO2014/210585中所述鉴定受体。也可以使用其他方法,例如RT-PCR和微阵列方法。
在另一个实施方案中,为了完成脱孤法,在体外进一步表达候选OR基因,以确认针对用于分离嗅觉感觉神经元和其他结构相关的目标化合物的化合物的活性。从对DMTS起反应的分离的嗅觉神经元中鉴定的小鼠受体在其N-末端用短多肽序列(例如,(SEQID NO:44)、Rho(SEQ ID NO:46;牛视紫红质受体的头20个氨基酸)和/或Lucy(SEQ ID NO:48;可裂解的亮氨酸信号肽序列)标签),在HEK 293T细胞中瞬时表达,并用DMTS分别刺激以证实它们作为真正的DMTS受体的身份。在另一个实施方案中,无论是通过内源RTP1基因的激活还是通过转化,RTP1基因也可以在细胞系中表达。在该基于细胞的测定中,人类Gα亚基Gαolf的共表达激活Gs转导途径,其导致在与合适的配体结合后内部cAMP增加。或者,在基于细胞的测定中,人类Gα亚基Gα15的共表达激活Gq转导途径,其导致在与合适的配体结合后内部Ca2+增加。上述过程和迄今为止获得的结果用于验证快速和可靠地鉴定DMTS或DMDS的哺乳动物气味受体的过程。
还提供了用于鉴定与DMTS或DMDS气味受体结合的化合物的测定方法。在另一个实施方案中,本发明提供了一种恶臭调节化合物,其结合、抑制、阻断、限制和/或调节至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、OR52N5、OR2L13、OR4C15、OR5AC2、OR8H3、OR11G2和OR52N2所构成的群组中选出的嗅觉受体的活性,并且通过本发明描述的方法鉴定,例如,图4中描述的化合物。
在一个实施方案中,化合物的活性通过比较其与DMTS或DMDS的结合来确定。在另一个实施方案中,在允许化合物与DMTS或DMDS结合到受体上的条件下,使受体、或其嵌合体或其片段在DMTS或DMDS存在下与化合物接触。
在另一个实施方案中,使化合物与由DMTS或DMDS激活的受体、或其嵌合体或其片段接触,其中所述受体、或其嵌合体或其片段在经重组修饰以表达受体多肽的细胞中表达。
可以使用体内、离体、体外和合成筛选系统来测定化合物的活性。
在另一个实施方案中,用含有本发明所述多肽的脂质体或病毒诱导的芽殖膜(budding membranes)进行接触。
在另一个实施方案中,用于鉴定结合、抑制、阻断、限制和/或调节可由DMTS或DMDS激活的嗅觉受体活性的化合物的方法可以在完整细胞或来自表达本发明描述的多肽的细胞的膜部分、或在培养物中被修饰以表达内源或外源气味受体的嗅觉感觉神经元上进行。
因此,本发明所述的21种OR参与DMTS或DMDS引发的恶臭的感知,并且构成用于鉴定调节剂、拮抗剂和/或阻断剂的有价值的候选受体,所述调节剂、拮抗剂和/或阻断剂将调节、减少、抑制、限制和/或阻断恶臭的感知。
本发明鉴定和/或使用的核酸和氨基酸序列如下:
Olfr1193
DNA-SEQ ID NO:1
atggcctcaaggacttattccatggaagaagtaaataatgtcactgaattcattttcttgggtctttctcagaaccctgaggttgaaaaagtgtgctttgtggtgttctccttcttttacatggtcattctgctaggaaacctcctcatcatgttgacagtttgcagtggcaatcttttcaagtttcccatgtattttttcctcaactttctgtcttttgtggacatttgctactcctcagtcacagcacccaagatgattattgacctgttagtgaagaaaaagactatatcctatgtggggtgcatgttacaactctttgtggttcatttctttggttgcactgagatcttcattcttactgtcatggcctatgatagatatgtggccatttgtaaacctctccactatatgactatgatggaccgggaaagatgcaataagatgttgctcggaacatggatcggtggcttcttacattctattatccaagtggctcttgtggtccagctccccttttgtggaccgaatgagattgatcactatttctgtgatgtacatcctgtactgaaacttgcctgcactgacacttacattgttggtatttttgtgacagcaaacagtggcaccattgcattgggaagttttgtcatcttgctgatctcatacacagtcattctcatgtctctgagaaagcagtcatctgaaggcagacgcaaagctctctccacttgtggatcccacattgctgttgtcatcattttttttggcccctgtacttttatgtatatgcggcctgacactaccttctctgaggacaagatggtagctatattttacaccattatcactcccatgctgaatcctctaatttacactctaagaaatgcagaagtaaagaatgcaatgagaaaactgtgggctagaaagttttcctgggaaactactgggaaatag
蛋白质-SEQ ID NO:2
MASRTYSMEEVNNVTEFIFLGLSQNPEVEKVCFVVFSFFYMVILLGNLLIMLTVCSGNLFKFPMYFFLNFLSFVDICYSSVTAPKMIIDLLVKKKTISYVGCMLQLFVVHFFGCTEIFILTVMAYDRYVAICKPLHYMTMMDRERCNKMLLGTWIGGFLHSIIQVALVVQLPFCGPNEIDHYFCDVHPVLKLACTDTYIVGIFVTANSGTIALGSFVILLISYTVILMSLRKQSSEGRRKALSTCGSHIAVVIIFFGPCTFMYMRPDTTFSEDKMVAIFYTIITPMLNPLIYTLRNAEVKNAMRKLWARKFSWETTGK
Olfr1093
DNA-SEQ ID NO:3
atggaaaagatcacatcagctgtggatgtccacaatattccattaaagaacatgactgaagccaccatgtttattctcttaggattcacagatgactttgaactccaagtcttcctgtttttactgtttcttgctatttatctcttcactctggtaggaaactttggactggttgttttggtcattggggattgtcggctacacaaccccatgtactatttcctaagtgttttgtctttcctggatgcttgctattctacagttgttacacccaaaatgttggtcaactttctaagtgaaaataagtccatttcattccttgcatgtgcaacccaaatgcttctctttgtttcgttgggaaccacagaatgctttctcctggcagcaatggcttatgaccgatatgtagccatctacaacccacttctgtatacagtggccatgtcacccagagtatacctgccactcatcattgcttcctatgctggtggagttgtgcatggtgctatccacacagtggccactttcagtctgtccttctgtggatccaatgaaattaagcatgtcttctgtgacatccctgcattgcttgctctttcttgttctgatacccacacaaatgagcttctagtcttgtacttggtgggcttgattgagattgttaccatcctgattgttctggtctcctatggattcatcctctttgccattctgaacatgcattctgctgagggtaggaggaaagtgttctctacatgtggctctcacctcactggagtctctatttaccatggtacaatccttttcacttatatgaggcctagttccagttatgcttcaaatcatgacatggtagtgtcaatattttacaccattgtgatacccatgttgaatcctatcatctatagtttgaggaacaaagatgtaaaagtagcatttaataaattgtggagaaaatgtgattcataa
蛋白质-SEQ ID NO:4
MEKITSAVDVHNIPLKNMTEATMFILLGFTDDFELQVFLFLLFLAIYLFTLVGNFGLVVLVIGDCRLHNPMYYFLSVLSFLDACYSTVVTPKMLVNFLSENKSISFLACATQMLLFVSLGTTECFLLAAMAYDRYVAIYNPLLYTVAMSPRVYLPLIIASYAGGVVHGAIHTVATFSLSFCGSNEIKHVFCDIPALLALSCSDTHTNELLVLYLVGLIEIVTILIVLVSYGFILFAILNMHSAEGRRKVFSTCGSHLTGVSIYHGTILFTYMRPSSSYASNHDMVVSIFYTIVIPMLNPIIYSLRNKDVKVAFNKLWRKCDS
Olfr1097
DNA-SEQ ID NO:5
atgagtgcctgtaatcatacaaatgaacctgagttcacgcttgtgggactgacagactccaaggagattcagctggtcctctctgttttgtttctcctgatatacatgctcactgtcttgggaaacataggtatgatactgatcattcatctagatgtccagctccacactccaatgtattttttcctcacccacttgtcattccttgacctcagttactcaactgtaatcacacctaaaaccttacagaatacgctgacctccataaaaaatatttccttcatgggatgcttcacccagttgtatttctttgtcctcttggcagcttctgaatgttttatactttcgtcaatggcctatgaccgctatgtagctatctgcaaccctctacactatccagttattatgtcccctaggcgctcatatactctcatcactgtgtcctacatgattggagttttggattcttctgtcactgtcttttgcttaagcacactggatttctgcaactccaaagtaattcatcacttcttttgtgacacattcccaattttagctctgtcctgcagtgatacctataatgcagaagccactatattcgttttagctggttccactctattgctgtcgctcatcacgatatcctcatcctatgtatctattctctctacaattttgaagataaattcttcttcaggaaagcacaaagccttctctacatgtgcctcacatcttataggagtcactgttttttatggtacaatgatctttacttatttaaaaccaagtacgtcctactccctgggaaaggatcaagtagcctctgttttttatactatagtgattcccatgctgaacccacttatctatagtctcaggaacaaagaagtgaaaagtgctgttgttagagttatgaagaagagagagtgcatccagaaactagaataa
蛋白质-SEQ ID NO:6
MSACNHTNEPEFTLVGLTDSKEIQLVLSVLFLLIYMLTVLGNIGMILIIHLDVQLHTPMYFFLTHLSFLDLSYSTVITPKTLQNTLTSIKNISFMGCFTQLYFFVLLAASECFILSSMAYDRYVAICNPLHYPVIMSPRRSYTLITVSYMIGVLDSSVTVFCLSTLDFCNSKVIHHFFCDTFPILALSCSDTYNAEATIFVLAGSTLLLSLITISSSYVSILSTILKINSSSGKHKAFSTCASHLIGVTVFYGTMIFTYLKPSTSYSLGKDQVASVFYTIVIPMLNPLIYSLRNKEVKSAVVRVMKKRECIQKLE
Olfr166
DNA-SEQ ID NO:7
atggagaaatggaatcagagctcaagtgattttactctgttaggactgcttccacaaaaccaaacaggcctgctacttttgatgctcatcatctttgtcttctctctggctttgtgtggcaactcaggaatgatccacctcattcgtgtggatccaaggctccacacccccatgtactttctcctcagtcagctctctctcatggacctgatgtacatttctaccactgttcccaagatggcatttaacttcctttctggccagaaaagcatctcttttctgggctgtggagtgcaatccttcttcttcctgactatggcatgttctgagggcttgctcttggcttccatggcttatgatcgttttgtggctatctgccatccccttcactatcccattcgcatgagcaaaataatgtgtctgaagatgatcataggatcctggatattgggctcaatcaactctttagcacataccgtctatgcccttcatattccttactgccattctaggtccattaaccatttcttctgtgatgttccagccatgttgcccctggcctgtatggacacttgggtttatgagtacatggtgtttgtgagcacaagcctgtttctcctactgcctttccttggtatcacagcttcctatggtcgggtcctttttgctgtcttccacatgcgctcaaaagagggaaagaagaaggccttcaccacatgctcaactcacttaactgtggtgacattttactatgcaccttttgtctatacctatcttcgacctaggagtcttcgctccccaacagaagataagattctggctgttttctacactatccttacccccatgctcaaccccatcatttatagtctgaggaataaggaggtcctgggggccatgacaagagtccttggtacttttccttcaactaaaccgtaa
蛋白质-SEQ ID NO:8
MEKWNQSSSDFTLLGLLPQNQTGLLLLMLIIFVFSLALCGNSGMIHLIRVDPRLHTPMYFLLSQLSLMDLMYISTTVPKMAFNFLSGQKSISFLGCGVQSFFFLTMACSEGLLLASMAYDRFVAICHPLHYPIRMSKIMCLKMIIGSWILGSINSLAHTVYALHIPYCHSRSINHFFCDVPAMLPLACMDTWVYEYMVFVSTSLFLLLPFLGITASYGRVLFAVFHMRSKEGKKKAFTTCSTHLTVVTFYYAPFVYTYLRPRSLRSPTEDKILAVFYTILTPMLNPIIYSLRNKEVLGAMTRVLGTFPSTKP
Olfr169
DNA-SEQ ID NO:9
atggaatatgagaactacacttttaacagcgacttcatcctcttgggactgttctcttcttcaaagacaagcttaacttttttctcatttatatttttcatttttattatggctataacagaaaatgccctcatgatcctcctaatccacagggattctcgactccataccccaatgtatttcctgcttagtcatctctccttcatggatatcttgcacatttccaacattgttcctaaaatgattgctgacttcctctcaggcagcagaactatttcctttgcaggctgtgccttccagatatttctctctcttaccttgctaggtggtgagtgccttctcctggcagccatgtcctatgatcgatatgtggccatctgccacccacttcgctaccctgtgctgatgagggataactccagtaggctcctggctgcaggctcctggctggtggggatcctcaactccatagtacacacagtttttgcactccactttcccttctgccactcaagagccattgatcactttttctgcgaagtccctgccatgttgaaattgtcatgtatagacacaacacactatgaacgaggcgtttatgtgagtggcattatttttctgctgatcccattttccatgatctctatatcttatgtgcaaattctcctcactgtattccaaatgcagtcatcaggggcccggcaaaagtccttttccacctgttccttccacatggttgttgtcataatgtactatgggccattcatttttacatatatgagacctcgctcataccacactccagggcaggataaatttttggcaatattctacaccatcctgacacccacactcaaccccataatctacagctttcgtaataaagatgtccttatggctgtgaaaaacatcgtccaaagtaattttttgaataaaaaatga
蛋白质-SEQ ID NO:10
MEYENYTFNSDFILLGLFSSSKTSLTFFSFIFFIFIMAITENALMILLIHRDSRLHTPMYFLLSHLSFMDILHISNIVPKMIADFLSGSRTISFAGCAFQIFLSLTLLGGECLLLAAMSYDRYVAICHPLRYPVLMRDNSSRLLAAGSWLVGILNSIVHTVFALHFPFCHSRAIDHFFCEVPAMLKLSCIDTTHYERGVYVSGIIFLLIPFSMISISYVQILLTVFQMQSSGARQKSFSTCSFHMVVVIMYYGPFIFTYMRPRSYHTPGQDKFLAIFYTILTPTLNPIIYSFRNKDVLMAVKNIVQSNFLNKK
Olfr738
DNA-SEQ ID NO:11
atgaaagcctttagcagccccagcaactccagcatcatcactggcttcatcctcctgggcttcccctgccccaaggaggggcaaatcctcctctttgtgctcttcttcattatctacatccttaccctcatgggcaatgcttccatcatatgtgctgtgtgctatgataagaaacttcacagccccatgtacctcctgctggccaacttctccttcctagaaatctggtatgtcacctccacagtccccaacatgttggccaacttcctctctgacacgaaggtcatctctttctctggatgcttcctgcagttctatttcttcttctccttgggttctacagaatgctttttcctggcagtcatggcatttgatcgataccttgccatctgcagacctctacattatccttctctcatgactgggcgcctctgcaacatccttgtgatcagttgctgggtgcttggtttcctctggttccctgttcccatcatcatcatctcccaaatgtccttctgtggatccagaattatagaccacttcctgtgtgacccaggccctctgttggccctcacctgtgtgagaaattctttaattgagatgactagctctactttaagttccctgcttttatttgttccatttttttttatcatggggtcttatgctctagtaatgagggctgtgctcagggtcccttcagcagctggacgaagaaaggccttctccacctgtgggtcacacttgactgtggtttctcttttctatggctcagtgatggtcatgtatgtgagcccaacatctgaacatgcagctggagtgcaaaaacttgtgactctgttttattctgtggttactcccctccttaatcctgtgatatacagtctgaggaacagagatatgaaacatgcaatgaaaaagttactgaaaatgtaa
蛋白质-SEQ ID NO:12
MKAFSSPSNSSIITGFILLGFPCPKEGQILLFVLFFIIYILTLMGNASIICAVCYDKKLHSPMYLLLANFSFLEIWYVTSTVPNMLANFLSDTKVISFSGCFLQFYFFFSLGSTECFFLAVMAFDRYLAICRPLHYPSLMTGRLCNILVISCWVLGFLWFPVPIIIISQMSFCGSRIIDHFLCDPGPLLALTCVRNSLIEMTSSTLSSLLLFVPFFFIMGSYALVMRAVLRVPSAAGRRKAFSTCGSHLTVVSLFYGSVMVMYVSPTSEHAAGVQKLVTLFYSVVTPLLNPVIYSLRNRDMKHAMKKLLKM
Olfr742
DNA-SEQ ID NO:13
Atgaaaaccctcagcagccccagcaactccagcaccatcactggcttcatcctcttgggcttcccctgccccagggaggggcaaatcctcctctttgtgaccttcttcattgtttacatactcattcttatgggcaatgcttccatcatctgtgctgtgtactgtgatcagagcctccacacccccatgtacttcctgctggccaacttctccttcctggagatctggtatgtcacctccacagtccccaacatgttggccaacttcctttcagacaccaaggtcatctctttctctggatgcttcctgcagttctatttcttcttctcctttggttctacagaatgctttttcctggcagtcatggcatttgatcgataccttgccatctgtaggccactacattatccttctctcatgactgggcacctctgcaacatccttgtgatcagttgctgggtgcttggtttcctctggttccctgtacccatcatcatcatctcccagatgtccttctgtgggtccagaattatagaccacttcctgtgtgacccaggccctcttttggcccttgcctgttccagagccccattgatggaggttttctggacaattataatgtctatgctcctggttattcctttcctcttcatcatgggaacttacatattggtcctaagagctgtgtttagacttccttcaagagatggacaaaaaaaggccttctccacttgcgggtctcatctcacagtagtttcactcttttattgctcagtgatgaaaatgtatttgagcccaacatctgagcatgaagctggaatgcagaagcttgtaactctattttattctgtgggtactccactacttaatcctgtgatatacagtctgaggaacaaagatatgaaaaatgccctgcagaagattttaagaacataa
蛋白质-SEQ ID NO:14
MKTLSSPSNSSTITGFILLGFPCPREGQILLFVTFFIVYILILMGNASIICAVYCDQSLHTPMYFLLANFSFLEIWYVTSTVPNMLANFLSDTKVISFSGCFLQFYFFFSFGSTECFFLAVMAFDRYLAICRPLHYPSLMTGHLCNILVISCWVLGFLWFPVPIIIISQMSFCGSRIIDHFLCDPGPLLALACSRAPLMEVFWTIIMSMLLVIPFLFIMGTYILVLRAVFRLPSRDGQKKAFSTCGSHLTVVSLFYCSVMKMYLSPTSEHEAGMQKLVTLFYSVGTPLLNPVIYSLRNKDMKNALQKILRT
Olfr207
DNA-SEQ ID NO:15
atggaactgaacaggacccagctgactgaatttgttctcagaggaataacagatcgttcagagctgcaagtccccctgttcctggtgttctttctcatctatgttatcaccatggtgggcaaccttggcttaatctttgtcatctggaaggaccctcatcttcacacacccatgtaccttttccttggaaatttggcctttgctgatgcctgtaattcatcctctgtgacaccaaagatgcttatgaaatttttaaataagaatgacatgatatccatgggtgagtgttttgctcaattttatttcttttgttcaagtgtaactgcagaagccttcattctggtagctatggcctatgaccgctatgtagccatatgcaaacctctgctctatgtagtggtgatgtccaacagactctgtattcagttcataggtgtatcctatctaattggacttctacatggcttacttcatgtaggattgttatttaggttaacgttttgtagttccaatgtaatagattatttctactgtgacatcctgccactttataggatttcttgcactgacccatcgatcaatgtactggtagctttcattatgggtattttattacaagtgagtacctttatgagtattatagtctcctatgtccgtgtcctctttgccatcctgagaacaaagtctgagaggggcagaaacaaagccttctctacttgcagttcccacctgtcatctgtgtctttgttctatggcactctcttcatcatatatgtcctctctggctctgacacagataattatcagggtaaaatgtattcactgttctataccattatcattcctctgctaaaccccttcatttacagcctaagaaataaagaagtcatcggtgccttgagaaaagtcagaaaatga
蛋白质-SEQ ID NO:16
MELNRTQLTEFVLRGITDRSELQVPLFLVFFLIYVITMVGNLGLIFVIWKDPHLHTPMYLFLGNLAFADACNSSSVTPKMLMKFLNKNDMISMGECFAQFYFFCSSVTAEAFILVAMAYDRYVAICKPLLYVVVMSNRLCIQFIGVSYLIGLLHGLLHVGLLFRLTFCSSNVIDYFYCDILPLYRISCTDPSINVLVAFIMGILLQVSTFMSIIVSYVRVLFAILRTKSERGRNKAFSTCSSHLSSVSLFYGTLFIIYVLSGSDTDNYQGKMYSLFYTIIIPLLNPFIYSLRNKEVIGALRKVRK
Olfr665
DNA-SEQ ID NO:17
atgcctggggtcaatacctccagcctgacaccaagatactttattctcaatgggattcctgggttggaagctgcacacatctggatctctctgccattcttcattatgtacctcattgctgtcacaggtaactgtggacttatctacctcatcagtcatgaggaggctctgcaccggcccatgtactactttctagccatgttgtctgctacagatatttctgggtgtaatacaattgtccccagtatgttatgcatcttttggttcagtgtcaaggagattgatttcaatgcctgccttgtacagatgtttttcatccacatgttaacaggcatggagtctggtgtgctcatgcttatggctctcgaccgctatgtggctatatgctatccattacgctatactaccatactcaccaacactatgattaccaagattggattggcagcacttgttagaagtgtgttactcatggtcccttttgctttcctgatcaagcgtcttccatactgtagaggaaacctcatccaacatacctattgtgatcacatggctgtggctaaactatcctgtggcaatattaagattaatgctatctatggtcttataattgctatatttattgggggttttgatatattctgtatctccatgtcttatgccatgattatccatgctgtggtgaagctatcttcggcagatgctcgccataaagccttcagtacctgtacatcacacatatgtgctattgttattacctatgtcccagcattcttcaacttctttactcatcgctttgggagaaccactataccccatcatatccacattattatagccaacctgtatctattgctacctcccaccttgaatccaattgtatatggagtaaagaccaagcagattcgtgaaggtgtgatcaaactgtttgctagacaaaaagttgtttga
蛋白质-SEQ ID NO:18
MPGVNTSSLTPRYFILNGIPGLEAAHIWISLPFFIMYLIAVTGNCGLIYLISHEEALHRPMYYFLAMLSATDISGCNTIVPSMLCIFWFSVKEIDFNACLVQMFFIHMLTGMESGVLMLMALDRYVAICYPLRYTTILTNTMITKIGLAALVRSVLLMVPFAFLIKRLPYCRGNLIQHTYCDHMAVAKLSCGNIKINAIYGLIIAIFIGGFDIFCISMSYAMIIHAVVKLSSADARHKAFSTCTSHICAIVITYVPAFFNFFTHRFGRTTIPHHIHIIIANLYLLLPPTLNPIVYGVKTKQIREGVIKLFARQKVV
Olfr669
DNA-SEQ ID NO:19
atgctgatttccaacaactcatatgaagccccgcagtctttcattcttaatggaattcctggtctcgaagcagtgcatatatggatctctcttccactctgtacaatgtacatcatctccctagtaggcaaccttggccttgtatatctcatttactatgaggaatccttacatcgcccaatgtatttctttctggccatgctttctctcatagacctgtttacttgcacaaccactgtccccaatgccctcttcattttctggttcaaactcaaggaaattaacttcactgcttgcctagttcagatgttctttgtgcacggattcacaggtgtggagtctggggtactcatgctcatggccttggaccgctatgtggccatttgctacccactacgctatgcaaccatacttaccaaccctgtcattgccaaagctgggcttgccaccttcttgagaggtgtgttactgatgattccttttccattcttggttaaacgtttgcccttctgccgaagcaatgtcatctcccatacatattgtgaccacatgtctgtggtaaagttatcctgtgccagcatcaaaatcaatgtcatctatggtctcatggttgcacttctgattggagtgtttgacatatgttgtatatctgtgtcctacactatgatcctccgggcagtggtcagcctgtcctctgcagatgctcggcagaaggccttcagcacctgcacagcccacatatctgccatcatcattacttatgttccagccttcttcaccttctttactcatcgttttggaggtcacaccatccctccttctcttcatatcattgtggctaatctttatcttcttctccctccaactctaaatcccattgtttatgggatgaagaccaaacagatcagagatagtatcattaaattctttcacggtgaaaaaggttcaaggtga
蛋白质-SEQ ID NO:20
MLISNNSYEAPQSFILNGIPGLEAVHIWISLPLCTMYIISLVGNLGLVYLIYYEESLHRPMYFFLAMLSLIDLFTCTTTVPNALFIFWFKLKEINFTACLVQMFFVHGFTGVESGVLMLMALDRYVAICYPLRYATILTNPVIAKAGLATFLRGVLLMIPFPFLVKRLPFCRSNVISHTYCDHMSVVKLSCASIKINVIYGLMVALLIGVFDICCISVSYTMILRAVVSLSSADARQKAFSTCTAHISAIIITYVPAFFTFFTHRFGGHTIPPSLHIIVANLYLLLPPTLNPIVYGMKTKQIRDSIIKFFHGEKGSR
Olfr1211
DNA-SEQ ID NO:21
atgcaaaaccagagttttgtaacagaattcatattccttggactttcacagaaccctaaagtccagaaaatagtttttattgtatttttatttgtctacattgcaactgttgggggcaacatgataattgtggtgaccattgtctgtagcccagcattgatagactgccccatgtacttctttttggcattcttgtccctattggatgcatgcttctcttctgtcatcacaccaaagatggttgtggactccctgtatgagaagaaaactatctcctttgaaggatgtatgatgcagttatttgctgagcacttccttgcagcagtagaagtgattgtcttgacagccatggcctatgaccgctatgtagcaatttgcaagcccttgcactactcttccatcatgaactggaggctctgtggcacacttatggggatagcatggacagggggcttcttgcattctatcatacaaattatcttcacgttgcaattgcccttctgtggaccaaatgtcatcgatcatttcatgtgtgacttgttcccattactggaacttgcctgcactgatactcatatctttggccttttagtggttgccaacagtgggtctatctgcatcataatcttctctattttgctggtctcctatggtgtcatcctgttctctctgaaagctcacagttctgaagggcgatggaaagctctctccacatgtggatcccacattgcagttgtggttttgttctttgtcccgtgtatatttatttatgcacgtcctccatctgctttctcctttgataaaatggtggcgatattttatactatcctaactcccttgctcaatcctgtgatttatacttttcggaataaggacatgaaaaatgctatgaagaaagtgtggaagaggttggcagtggtttctgatggaaagtga
蛋白质-SEQ ID NO:22
MQNQSFVTEFIFLGLSQNPKVQKIVFIVFLFVYIATVGGNMIIVVTIVCSPALIDCPMYFFLAFLSLLDACFSSVITPKMVVDSLYEKKTISFEGCMMQLFAEHFLAAVEVIVLTAMAYDRYVAICKPLHYSSIMNWRLCGTLMGIAWTGGFLHSIIQIIFTLQLPFCGPNVIDHFMCDLFPLLELACTDTHIFGLLVVANSGSICIIIFSILLVSYGVILFSLKAHSSEGRWKALSTCGSHIAVVVLFFVPCIFIYARPPSAFSFDKMVAIFYTILTPLLNPVIYTFRNKDMKNAMKKVWKRLAVVSDGK
OR52N5
DNA-SEQ ID NO:23
atgcctctatttaattcattatgctggtttccaacaattcatgtgactcctccatcttttattcttaatggaatacctggtctggaaagagtacatgtatggatctccctcccactctgcacaatgtacatcatcttccttgtggggaatcttggtcttgtgtacctcatttattatgaggagtccttacatcatccgatgtattttttttttggccatgctctctccctcattgacctccttacctgcaccaccactctacccaatgcactctgcatcttctggttcagtctcaaagaaattaacttcaatgcttgcttggcccagatgttctttgttcatgggttcacaggtgtggagtctggggtgctcatgctcatggctctagaccgctatgtagccatttgctaccctttgcgttatgctaccacactcaccaaccctatcattgccaaggctgagcttgccaccttcctgaggggtgtattgctgatgattcctttcccattcttggttaagcgtttgcctttctgccaaagcaatattatctcccatacgtactgcgaccacatgtctgtagtaaagctatcttgtgccagcatcaaggtcaatgtaatctatggtctaatggttgctctcctgattggagtgtttgacatttgttgtatatctttgtcttacactttgatcctcaaggcagcgatcagcctctcttcatcagatgctcggcagaaggctttcagcacctgcactgcccatatatctgccatcatcatcacctatgttccagcattcttcactttctttgcccaccgttttgggggacacacaattcccccttctcttcacatcattgtggctaatctttatcttcttcttcccccaactctaaaccctattgtttatggagtaaagacaaaacagatacgcaagagtgtcataaagttcttccagggtgataagggtgcaggttga
蛋白质-SEQ ID NO:24
MPLFNSLCWFPTIHVTPPSFILNGIPGLERVHVWISLPLCTMYIIFLVGNLGLVYLIYYEESLHHPMYFFFGHALSLIDLLTCTTTLPNALCIFWFSLKEINFNACLAQMFFVHGFTGVESGVLMLMALDRYVAICYPLRYATTLTNPIIAKAELATFLRGVLLMIPFPFLVKRLPFCQSNIISHTYCDHMSVVKLSCASIKVNVIYGLMVALLIGVFDICCISLSYTLILKAAISLSSSDARQKAFSTCTAHISAIIITYVPAFFTFFAHRFGGHTIPPSLHIIVANLYLLLPPTLNPIVYGVKTKQIRKSVIKFFQGDKGAG
OR2L13
DNA-SEQ ID NO:25
atggagaaatggaatcacacttcaaatgatttcattttgttgggtctgcttcccccaaatcaaactggaatatttctcttgtgccttatcatcctcatattctttctggcctcggtgggtaactcggccatgattcacctcatccacgtggatcctcgtctccacacaccgatgtactttcttctcagccagctctcccttatggacctgatgtacatctccaccaccgtccccaagatggcgtacaacttcctgtccggccagaaaggcatctccttcctgggatgtggtgtgcaaagcttcttcttcctgaccatggcgtgttctgaaggcttactcctgacctccatggcctacgaccgttatttggccatctgccactctctctattatcctatccgcatgagtaaaatgatgtgtgtgaagatgattggaggctcttggacactggggtccatcaactccttggcacacacagtctttgcccttcatattccctactgcaggtctagggctattgaccatttcttctgcgatgtcccagccatgttgcttcttgcctgtacagatacttgggtctatgaatatatggtttttgtaagtacaagcctctttctccttttccctttcattggcatcacttcttcctgtggccgagtcctatttgctgtctatcatatgcactcaaaggaggggagaaaaaaggccttcaccaccatttcaacacatttaactgtagtgatcttttactatgcaccttttgtctacacctatcttcggcccaggaatctccgctcaccagctgaagacaagatcctggcagtcttctacaccatccttacccccatgctcaatcccattatctacagcctgaggaataaggaagtcctgggggctatgaggagagtgtttgggatattctctttcctgaaagaataa
蛋白质-SEQ ID NO:26
MEKWNHTSNDFILLGLLPPNQTGIFLLCLIILIFFLASVGNSAMIHLIHVDPRLHTPMYFLLSQLSLMDLMYISTTVPKMAYNFLSGQKGISFLGCGVQSFFFLTMACSEGLLLTSMAYDRYLAICHSLYYPIRMSKMMCVKMIGGSWTLGSINSLAHTVFALHIPYCRSRAIDHFFCDVPAMLLLACTDTWVYEYMVFVSTSLFLLFPFIGITSSCGRVLFAVYHMHSKEGRKKAFTTISTHLTVVIFYYAPFVYTYLRPRNLRSPAEDKILAVFYTILTPMLNPIIYSLRNKEVLGAMRRVFGIFSFLKE
OR2AJ1
DNA-SEQ ID NO:27
atgagtgtaacagaaaatacgctcatgatcctcctcattcgcagtgactcccgactccacactccaatgtattttctgctcagccatctctccttaatggatatcttgcatgtttccaacatcgttcccaaaatggtcactaactttctgtcaggcagcagaactatttcatttgcaggttgtgggttccaggtatttctgtccctcaccctcctgggtggtgagtgccttctcctggctgcaatgtcctgtgatcgctatgtggctatctgtcacccgctgcgctatccgattcttatgaaggagtatgccagcgctctcatggctggaggctcctggctcattggggttttcaactccacagtccacacagcttatgcactgcagtttcccttctgtggctctagggcaattgatcacttcttctgtgaagtccctgccatgttgaagttgtcctgtgcagacacaacacgctatgaacgaggggtttgtgtaagtgctgtgatcttcctgctgatccctttctccttgatctctgcttcttatggccaaattattcttactgtcctccagatgaaatcatcagaggcaaggaaaaagtcattttccacttgttccttccacatgattgtggtcacgatgtactatgggccatttatttttacatatatgagacctaaatcataccacactccagggcaggataagttcctggcaatattctatacgatcctcacacccacactcaaccctttcatctacagctttaggaataaagatgttctggcggtgatgaaaaatatgctcaaaagtaactttctgcacaaaaaaatgaataggaaaattcctgaatgtgtgttctgtctatttctatgttaa
蛋白质-SEQ ID NO:28
MSVTENTLMILLIRSDSRLHTPMYFLLSHLSLMDILHVSNIVPKMVTNFLSGSRTISFAGCGFQVFLSLTLLGGECLLLAAMSCDRYVAICHPLRYPILMKEYASALMAGGSWLIGVFNSTVHTAYALQFPFCGSRAIDHFFCEVPAMLKLSCADTTRYERGVCVSAVIFLLIPFSLISASYGQIILTVLQMKSSEARKKSFSTCSFHMIVVTMYYGPFIFTYMRPKSYHTPGQDKFLAIFYTILTPTLNPFIYSFRNKDVLAVMKNMLKSNFLHKKMNRKIPECVFCLFLC
OR4C15
DNA-SEQ ID NO:29
atgttctcaatgacaacagaagcactcaataattttgcacttggatgtaccaacttgttaatgactatgataccacaaattgatctgaagcaaattttcctttgtcctaattgcagactatacatgatccctgttggagctttcatcttttccttgggaaacatgcaaaaccaaagctttgtaactgagtttgtcctcctgggactttcacagaatccaaatgttcaggaaatagtatttgttgtatttttgtttgtctacattgcaactgttgggggcaacatgctaattgtagtaaccattctcagcagccctgctcttctggtgtctcctatgtacttcttcttgggcttcctgtccttcctggatgcgtgcttctcatctgtcatcaccccaaagatgattgtagactccctctatgtgacaaaaaccatctcttttgaaggctgcatgatgcagctctttgctgaacacttctttgctggggtggaggtgattgtcctcacagccatggcctatgatcgttatgtggccatttgcaagcccttgcattactcttctatcatgaacaggaggctctgtggcattctgatgggggtagcctggacagggggcctcttgcattccatgatacaaattctttttactttccagcttcccttttgtggccccaatgtcatcaatcactttatgtgtgacttgtacccgttactggagcttgcctgcactgatactcacatctttggcctcatggtggtcatcaacagtgggtttatctgcatcataaacttctccttgttgcttgtctcctatgctgtcatcttgctctctctgagaacacacagttctgaagggcgctggaaagctctctccacctgtggatctcacattgctgttgtgattttgttctttgtcccatgcatatttgtatatacacgacctccatctgctttttcccttgacaaaatggcggcaatattttatatcatcttaaatcccttgctcaatcctttgatttacactttcaggaataaggaagtaaaacaggccatgaggagaatatggaacagactgatggtggtttctgatgagaaagaaaatattaaactttaa
蛋白质-SEQ ID NO:30
MFSMTTEALNNFALGCTNLLMTMIPQIDLKQIFLCPNCRLYMIPVGAFIFSLGNMQNQSFVTEFVLLGLSQNPNVQEIVFVVFLFVYIATVGGNMLIVVTILSSPALLVSPMYFFLGFLSFLDACFSSVITPKMIVDSLYVTKTISFEGCMMQLFAEHFFAGVEVIVLTAMAYDRYVAICKPLHYSSIMNRRLCGILMGVAWTGGLLHSMIQILFTFQLPFCGPNVINHFMCDLYPLLELACTDTHIFGLMVVINSGFICIINFSLLLVSYAVILLSLRTHSSEGRWKALSTCGSHIAVVILFFVPCIFVYTRPPSAFSLDKMAAIFYIILNPLLNPLIYTFRNKEVKQAMRRIWNRLMVVSDEKENIKL
OR5AC2
DNA-SEQ ID NO:31
atggatatatcagagggaaataagactcttgtgacagagtttgttctcacaggacttacagatcgaccatggctgcacgtcctcttctttgttgtgtttttggtggtctatctcatcaccatggtgggcaaccttggactgatagttctaatttggaacgacccccatcttcatatgcccatgtacttattccttggtggtttagccttttcagatgcttgtacttcaacctctataacccctaggatgctggtcaatttcttagacaagactgcaatgatatccctagctgagtgcatcacccagttttacttttttgcttccagtgcaactacagaatgcttcctcctggtgatgatggcctatgaccgctatgtagccatatgtaatcccttgctttatccagtgatgatgtccaacaaactcagcgctcagttgctaagtatttcatatgtaattggtttcctgcatcctctggttcatgtgagtttactattgcgactaactttctgcaggtttaacataatacattatttctactgtgaaattttacaactgttcaaaatttcatgcaatggtccatctattaacgcactaatgatatttatttttggtgcttttatacaaatacccactttaatgactatcataatctcttatactcgtgtgctctttgatattctgaaaaaaaagtctgaaaagggcagaagcaaagccttctccacatgcggcgcccatctgctttctgtctcattgtactacggaactctgatcttcatgtatgtgcgtcctgcatctggcttagctgaagaccaagacaaagtgtattctctgttttacacgattataattcccctgctaaacccatttatttacagcttgagaaataaaaaagtcatgcatgcattgagaagagttataaggaagtaa
蛋白质-SEQ ID NO:32
MDISEGNKTLVTEFVLTGLTDRPWLHVLFFVVFLVVYLITMVGNLGLIVLIWNDPHLHMPMYLFLGGLAFSDACTSTSITPRMLVNFLDKTAMISLAECITQFYFFASSATTECFLLVMMAYDRYVAICNPLLYPVMMSNKLSAQLLSISYVIGFLHPLVHVSLLLRLTFCRFNIIHYFYCEILQLFKISCNGPSINALMIFIFGAFIQIPTLMTIIISYTRVLFDILKKKSEKGRSKAFSTCGAHLLSVSLYYGTLIFMYVRPASGLAEDQDKVYSLFYTIIIPLLNPFIYSLRNKKVMHALRRVIRK
OR8H3
DNA-SEQ ID NO:33
atgatgggtagaaggaatgacacaaatgtggctgacttcatccttacgggactgtcagactctgaagaggtccagatggctctgtttatgctatttctcctcatatacctaattactatgctggggaatgtggggatgctattgataatccgcctggacctccagcttcacactcccatgtattttttccttactcacctgtcatttattgacctcagttactcaactgtcgtcacacctaaaaccttagcgaacttactgacttccaactatatttccttcacgggctgctttgcccagatgttctgttttgtcttcttgggtactgctgaatgttatcttctctcctcaatggcctatgatcgctatgcagcgatctgcagtcctctacactacacagttattatgcccaaaaggctctgcctcgctctcatcactgggccttatgtgattggctttatggactcctttgtcaatgtggtttccatgagcagattgcatttctgtgactcaaacataattcatcactttttctgtgacacttccccaattttagctctgtcctgcactgacacagacaacactgaaatgctgatattcattatcgctggttccaccctgatggtgtcccttatcacaatatctgcatcctatgtgtccattctctctaccatcctgaaaattaattccacttcaggaaagcagaaagctttctctacttgcgtctctcatctcttgggagtcaccatcttctatggaactatgatttttacttacttaaagccaagaaagtcttattccttgggaagagatcaagtggctcctgtgttttatactattgtgattcccatgctgaatccactcatttatagtcttagaaacagagaagtgaaaaatgctctcattagagtcatgcagagaagacaggactccaggtag
蛋白质-SEQ ID NO:34
MMGRRNDTNVADFILTGLSDSEEVQMALFMLFLLIYLITMLGNVGMLLIIRLDLQLHTPMYFFLTHLSFIDLSYSTVVTPKTLANLLTSNYISFTGCFAQMFCFVFLGTAECYLLSSMAYDRYAAICSPLHYTVIMPKRLCLALITGPYVIGFMDSFVNVVSMSRLHFCDSNIIHHFFCDTSPILALSCTDTDNTEMLIFIIAGSTLMVSLITISASYVSILSTILKINSTSGKQKAFSTCVSHLLGVTIFYGTMIFTYLKPRKSYSLGRDQVAPVFYTIVIPMLNPLIYSLRNREVKNALIRVMQRRQDSR
OR11G2
DNA-SEQ ID NO:35
atgaaaatcttcaacagccccagcaactccagcaccttcactggcttcatcctcctgggcttcccttgccccagggaggggcagatcctcctctttgtgctcttcactgttgtttacctcctgaccctcatgggcaatggttccatcatctgtgctgtgcactgggatcagagactccacgcccccatgtacatcctgctcgccaacttctccttcttggagatatgttatgtcacctccacagtccccagcatgctggccaacttcctctctgacaccaagatcatctcgttctctggctgcttcctccagttctactttttcttctccttgggctctacagaatgctttttcctggcagttatggcatttgatcgataccttgccatctgtcggcctctacgctatccaaccattatgaccagacgtctctgtaccaatcttgtggtcaattgctgggtacttggtttcatctggttcttgattcctatcgtcaacatctcccaaatgtccttctgtggatctaggattattgaccacttcctatgtgacccagctcctcttctaactctcacttgcaaaaaaggccctgtgatagagcttgtcttttctgtcttaagtcctctgcctgtctttatgctctttctcttcattgtggggtcctatgctctggtcgtgagagctgtgttgagggtcccttcagcagctgggagaagaaaggctttctccacctgtgggtctcacctggctgtggtttcactgttctacggctcagtactggtcatgtatgggagcccaccatctaagaatgaagctggaaagcagaagactgtgactctgttttattctgttgttaccccactgcttaaccctgtgatatatagtcttaggaacaaagatatgagaaaagctctgaagaaattttggggaacataa
蛋白质-SEQ ID NO:36
MKIFNSPSNSSTFTGFILLGFPCPREGQILLFVLFTVVYLLTLMGNGSIICAVHWDQRLHAPMYILLANFSFLEICYVTSTVPSMLANFLSDTKIISFSGCFLQFYFFFSLGSTECFFLAVMAFDRYLAICRPLRYPTIMTRRLCTNLVVNCWVLGFIWFLIPIVNISQMSFCGSRIIDHFLCDPAPLLTLTCKKGPVIELVFSVLSPLPVFMLFLFIVGSYALVVRAVLRVPSAAGRRKAFSTCGSHLAVVSLFYGSVLVMYGSPPSKNEAGKQKTVTLFYSVVTPLLNPVIYSLRNKDMRKALKKFWGT
OR52N2
DNA-SEQ ID NO:37
atgtctggggacaacagctccagcctgaccccaggattctttatcttgaatggcgttcctgggctggaagccacacacatctggatctccctgccattctgctttatgtacatcattgctgtcgtggggaactgtgggctcatctgcctcatcagccatgaggaggccctgcaccggcccatgtactacttcctggccctgctctccttcactgatgtcaccttgtgcaccaccatggtacctaatatgctgtgcatattctggttcaacctcaaggagattgactttaacgcctgcctggcccagatgttttttgtccatatgctgacagggatggagtctggggtgctcatgctcatggccctggaccgctatgtggccatctgctaccccttacgctatgccaccatccttaccaaccctgtcatcgccaaggctggtcttgccaccttcttgaggaatgtgatgctcatcatcccattcactctcctcaccaagcgcctgccctattgccgggggaacttcatcccccacacctactgtgaccatatgtctgtggccaaggtatcctgtggcaatttcaaggtcaatgctatttatggtctgatggttgctctcctgattggtgtgtttgatatctgctgtatctctgtatcttacactatgattttgcaggctgttatgagcctgtcatcagcagatgctcgtcacaaagccttcagcacctgcacatctcacatgtgttccattgtgatcacctatgttgctgcttttttcacttttttcactcatcgttttgtaggacacaatatcccaaaccacatacacatcatcgtggccaacctttatctgctactgcctcctaccatgaacccaattgtttatggagtcaagaccaagcagattcaggaaggtgtaattaaatttttacttggagacaaggttagttttacctatgacaaatga
蛋白质-SEQ ID NO:38
MSGDNSSSLTPGFFILNGVPGLEATHIWISLPFCFMYIIAVVGNCGLICLISHEEALHRPMYYFLALLSFTDVTLCTTMVPNMLCIFWFNLKEIDFNACLAQMFFVHMLTGMESGVLMLMALDRYVAICYPLRYATILTNPVIAKAGLATFLRNVMLIIPFTLLTKRLPYCRGNFIPHTYCDHMSVAKVSCGNFKVNAIYGLMVALLIGVFDICCISVSYTMILQAVMSLSSADARHKAFSTCTSHMCSIVITYVAAFFTFFTHRFVGHNIPNHIHIIVANLYLLLPPTMNPIVYGVKTKQIQEGVIKFLLGDKVSFTYDK
OR5T1
DNA-SEQ ID NO:39
atgtttatattaataagcttcacagaagaatttgatgtgcaagtcttcctatttttattatttttagcaatctatctattcactctaataggcaatttagggctggttgtaccgatcattggggatttctggcttcacagcccaatgtactattttcttggtgttttatcattcttggatgtctgctattctacagttgtcactccaaaaatgttggtcaatttcctggcaaaaaataaatctatttcatttcttggatgtgcaacacagatgtttcttgcttgtacttttggaaccacagaatgctttctcttggctgcaatggcttatgatcgctatgtagccatctacaaccctctcctgtattcagtgagcatgtcacccagagtctatgtgccactcatcactgcttcctatgttgctagcattttacatgctactatacatacagtggctacatttagcctgtccttctgtggatccaatgaaattaggcatgtcttttgtaatatgcctcctctccttgctatttcttgttctgacactcacgtaatccagcttctattcttctactttgtgggctctattgagatagtcactatcctgattgtcctgatctcctatggttttattctgttggccattctgaagatgcagtctgctgaagggaggagaaaagtcttctctacatgtggagctcacctaactggagtgacaatttatcatgggacaatcctcttcatgtatgtgagaccaagttccagctacacttcggacaatgacatgatagtgtcaatattttataccattgtgattcccatgctgaatcccatcatctacagtttgcggaacaaagatgtaaaggaggcaatcaaaagattgcttgtgagaaattggttcataaataagttatag
蛋白质-SEQ ID NO:40
MFILISFTEEFDVQVFLFLLFLAIYLFTLIGNLGLVVPIIGDFWLHSPMYYFLGVLSFLDVCYSTVVTPKMLVNFLAKNKSISFLGCATQMFLACTFGTTECFLLAAMAYDRYVAIYNPLLYSVSMSPRVYVPLITASYVASILHATIHTVATFSLSFCGSNEIRHVFCNMPPLLAISCSDTHVIQLLFFYFVGSIEIVTILIVLISYGFILLAILKMQSAEGRRKVFSTCGAHLTGVTIYHGTILFMYVRPSSSYTSDNDMIVSIFYTIVIPMLNPIIYSLRNKDVKEAIKRLLVRNWFINKL
OR4S2
DNA-SEQ ID NO:41
atggaaaaaataaacaacgtaactgaattcattttctggggtctttctcagagcccagagattgagaaagtttgttttgtggtgttttctttcttctacataatcattcttctgggaaatctcctcatcatgctgacagtttgcctgagcaacctgtttaagtcacccatgtatttctttctcagcttcttgtcttttgtggacatttgttactcttcagtcacagctcccaagatgattgttgacctgttagcaaaggacaaaaccatctcctatgtggggtgcatgttgcaactgtttggagtacatttctttggttgcactgagatcttcatccttactgtaatggcctatgatcgttatgtggctatctgtaaacccctacattatatgaccatcatgaaccgggagacatgcaataaaatgttattagggacgtgggtaggtgggttcttacactccattatccaagtggctctggtagtccaactacccttttgtggacccaatgagatagatcactacttttgtgatgttcaccctgtgttgaaacttgcctgcacagaaacatacattgttggtgttgttgtgacagccaacagtggtaccattgctctggggagttttgttatcttgctaatctcctacagcatcatcctagtttccctgagaaagcagtcagcagaaggcaggcgcaaagccctctccacctgtggctcccacattgccatggtcgttatctttttcggcccctgtacttttatgtacatgcgccctgatacgaccttttcagaggataagatggtggctgtattttacaccattatcactcccatgttaaatcctctgatttatacactgagaaatgcagaagtaaagaatgcaatgaagaaactgtggggcagaaatgttttcttggaggctaaagggaaatag
蛋白质-SEQ ID NO:42
MEKINNVTEFIFWGLSQSPEIEKVCFVVFSFFYIIILLGNLLIMLTVCLSNLFKSPMYFFLSFLSFVDICYSSVTAPKMIVDLLAKDKTISYVGCMLQLFGVHFFGCTEIFILTVMAYDRYVAICKPLHYMTIMNRETCNKMLLGTWVGGFLHSIIQVALVVQLPFCGPNEIDHYFCDVHPVLKLACTETYIVGVVVTANSGTIALGSFVILLISYSIILVSLRKQSAEGRRKALSTCGSHIAMVVIFFGPCTFMYMRPDTTFSEDKMVAVFYTIITPMLNPLIYTLRNAEVKNAMKKLWGRNVFLEAKGK
tag
DNA-SEQ ID NO:43
gattacaaggacgacgacgataag
蛋白质-SEQ ID NO:44
DYKDDDDK
Rho tag
DNA-SEQ ID NO:45
atgaacgggaccgagggcccaaacttctacgtgcctttctccaacaagacgggcgtggtg
蛋白质-SEQ ID NO:46
MNGTEGPNFYVPFSNKTGVV
Lucy tag
DNA-SEQ ID NO:47
atgagaccccagatcctgctgctcctggccctgctgaccctaggcctggct
蛋白质-SEQ ID NO:48
MRPQILLLLALLTLGLA
人类G-蛋白α亚基Golf
DNA-SEQ ID NO:49
atgggtctgtgctacagtctgcggccgctgcttttcgggggcccaggggacgacccctgcgcggcctcggagccgccggtggaggacgcgcagcccgccccggccccggccctggccccagtccgggcggccgcaagggacacggcccggaccctgctccctcggggcggcgaagggagcccggcatgcgctcggcccaaagcagacaagccgaaggagaagcggcagcgcaccgagcagcttagtgccgaggagcgcgaggcggccaaggagcgcgaggcggtcaaggaggcgaggaaagtgagccggggcatcgaccgcatgctgcgcgaccagaagcgcgacctgcagcagacgcaccggctcctgctgctcggggctggtgagtctgggaaaagcactatcgtcaaacagatgaggatcctgcacgtcaatgggtttaatcccgaggaaaagaaacagaaaattctggacatccggaaaaatgttaaagatgctatcgtgacaattgtttcagcaatgagtactataatacctccagttccgctggccaaccctgaaaaccaatttcgatcagactacatcaagagcatagcccctatcactgactttgaatattcccaggaattctttgaccatgtgaaaaaactttgggacgatgaaggcgtgaaggcatgctttgagagatccaacgaataccagctgattgactgtgcacaatacttcctggaaagaatcgacagcgtcagcttggttgactacacacccacagaccaggacctcctcagatgcagagttctgacatctgggatttttgagaacgattccaagtggacaaagtaaacttccacatgtttgatgttggtggccagagggatgagaggagaaaatggatccagtgctttaacgatgtcacagctatcatttacgtcgcagcctgcagtagctacaacatggtgattcgagaagataacaacaccaacaggctgagagagtccctggatctttttgaaagcatctggaacaacaggtggttacggaccatttctatcatcttgttcttgaacaaacaagatatgctggcagaaaaagtcttggcagggaaatcaaaaattgaagactatttcccagaatatgcaaattatactgttcctgaagacgcaacaccagatgcaggagaagatcccaaagttacaagagccaagttctttatccgggacctgtttttgaggatcagcacggccaccggtgacggcaaacattactgctacccgcacttcacctgcgccgtggacacagagaacatccgcagggtgttcaacgactgccgcgacatcatccagcggatgcacctcaagcagtatgagctcttgtga
蛋白质-SEQ ID NO:50
MGLCYSLRPLLFGGPGDDPCAASEPPVEDAQPAPAPALAPVRAAARDTARTLLPRGGEGSPACARPKADKPKEKRQRTEQLSAEEREAAKEREAVKEARKVSRGIDRMLRDQKRDLQQTHRLLLLGAGESGKSTIVKQMRILHVNGFNPEEKKQKILDIRKNVKDAIVTIVSAMSTIIPPVPLANPENQFRSDYIKSIAPITDFEYSQEFFDHVKKLWDDEGVKACFERSNEYQLIDCAQYFLERIDSVSLVDYTPTDQDLLRCRVLTSGIFETRFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIYVAACSSYNMVIREDNNTNRLRESLDLFESIWNNRWLRTISIILFLNKQDMLAEKVLAGKSKIEDYFPEYANYTVPEDATPDAGEDPKVTRAKFFIRDLFLRISTATGDGKHYCYPHFTCAVDTENIRRVFNDCRDIIQRMHLKQYELL
人类G-蛋白α亚基Gα15
DNA-SEQ ID NO:51
atggcccggtcgctgacctggcgctgctgcccctggtgcctgacggaggatgagaaggccgccgcccgggtggaccaggagatcaacaggatcctcttggagcagaagaagcaggaccgcggggagctgaagctgctgcttttgggcccaggcgagagcgggaagagcaccttcatcaagcagatgcggatcatccacggcgccggctactcggaggaggagcgcaagggcttccggcccctggtctaccagaacatcttcgtgtccatgcgggccatgatcgaggccatggagcggctgcagattccattcagcaggcccgagagcaagcaccacgccagcctggtcatgagccaggacccctataaagtgaccacgtttgagaagcgctacgctgcggccatgcagtggctgtggagggatgccggcatccgggcctgctatgagcgtcggcgggaattccacctgctcgattcagccgtgtactacctgtcccacctggagcgcatcaccgaggagggctacgtccccacagctcaggacgtgctccgcagccgcatgcccaccactggcatcaacgagtactgcttctccgtgcagaaaaccaacctgcggatcgtggacgtcgggggccagaagtcagagcgtaagaaatggatccattgtttcgagaacgtgatcgccctcatctacctggcctcactgagtgaatacgaccagtgcctggaggagaacaaccaggagaaccgcatgaaggagagcctcgcattgtttgggactatcctggaactaccctggttcaaaagcacatccgtcatcctctttctcaacaaaaccgacatcctggaggagaaaatccccacctcccacctggctacctatttccccagtttccagggccctaagcaggatgctgaggcagccaagaggttcatcctggacatgtacacgaggatgtacaccgggtgcgtggacggccccgagggcagcaagaagggcgcacgatcccgacgcctcttcagccactacacatgtgccacagacacacagaacatccgcaaggtcttcaaggacgtgcgggactcggtgctcgcccgctacctggacgagatcaacctgctgtga
蛋白质-SEQ ID NO:52
MARSLTWRCCPWCLTEDEKAAARVDQEINRILLEQKKQDRGELKLLLLGPGESGKSTFIKQMRIIHGAGYSEEERKGFRPLVYQNIFVSMRAMIEAMERLQIPFSRPESKHHASLVMSQDPYKVTTFEKRYAAAMQWLWRDAGIRACYERRREFHLLDSAVYYLSHLERITEEGYVPTAQDVLRSRMPTTGINEYCFSVQKTNLRIVDVGGQKSERKKWIHCFENVIALIYLASLSEYDQCLEENNQENRMKESLALFGTILELPWFKSTSVILFLNKTDILEEKIPTSHLATYFPSFQGPKQDAEAAKRFILDMYTRMYTGCVDGPEGSKKGARSRRLFSHYTCATDTQNIRKVFKDVRDSVLARYLDEINLL
SEQ ID NO:53
基序
MAYDRYVAIC
SEQ ID NO:54
基序
FSTCSSH
SEQ ID NO:55
基序
PMLNPFIY
以下实施例仅是说明性的,并不意味着限制如发明内容、说明书或权利要求中所述的本发明的范围。
实施例
实施例1
鉴定新的小鼠和人类DMTS激活的气味受体
根据WO2014/210585中公开的方法进行新气味受体的鉴定。简而言之,将鼠嗅觉感觉神经元暴露于DMTS并使用Ca2+成像技术进行筛选。进一步分离由DMTS激活的神经元用于完整转录组分析以鉴定响应性气味受体。产生对应于分离的细胞mRNA的cDNA,并通过基于PCR的方法(Clontech/Takara, Low Input RNA Kit for Sequencing-v3,cat.634848)进行扩增。然后使用扩增出的cDNA产生用于下一代测序的Illumina cDNA文库和产生100个碱基对的单读序列。将序列与小鼠参考基因组(例如UCSC版本mm10)比对,以产生完整的转录组。因为每个嗅觉感觉神经元仅强烈转录单一气味受体(OR),所以可以实现DMTS响应性OR的后续鉴定。然后使用序列相似性搜索的系统发育关系评估来鉴定相应的人类OR。通常观察到直系同源OR对之间的类似功能反应谱[例如Adipietro,K.A,etal.PLoS Genet.8,e1002821–e1002821(2012),Sato-Akuhara,N.et al.J.Neurosci.36,4482–4491(2016)和WO2016/201152]并且可以用于人类OR鉴定[例如,Armelin-CorreaL.M.and Malnic B.J Agric Food Chem.doi:10.1021/acs.jafc.6b04998(2017)]。图1显示了本发明提到的受体之间的成对同一性水平。不具有直系同源物和/或旁系同源物关系的OR仅平均为39%±13.1%。所有直系同源物和旁系同源物关系平均为77%±7.5%。所有旁系同源物和直系同源物对用灰色阴影细胞表示。它们代表了由所示氨基酸同一性水平支持的最高同一性水平。
实施例2
小鼠和人类DMTS受体的功能表征
进行功能性剂量-反应实验以评估表达个体推定DMTS受体的修饰细胞系的DMTS活性水平。使用基于细胞的测定,在HEK293T细胞系中测试小鼠受体Olfr1193、Olfr1093、Olfr1097、Olrf166、Olfr169、Olfr738和Olfr742,以及人类受体OR4S2和OR52N5,该细胞系中内源RTP1基因已被激活并且气味受体伴侣蛋白已被表达(在WO2016/201153中描述)。用Lucy--Rho标签组合标记小鼠受体基因,并用Rho-标签组合标记人类受体,产生用于基于细胞测定的标签::受体融合蛋白。将受体基因与经典嗅觉人类G蛋白α亚基Golf基因共转染,并暴露于增加浓度的恶臭气味剂。人类Golf的共表达激活Gs转导途径,其导致在与合适的配体结合后内部cAMP增加。通过使用基于均相时间分辨荧光(HTRF)的试剂盒(CisBio,cAMP dynamic 2kit,cat.62AM4PEJ)测量细胞溶质中的cAMP增加来检测气味诱导的活性。对于DMTS特异性地观察到受体活性的剂量依赖性增加,但对于丁酸(用作阴性对照的另一种已知恶臭)没有观察到(图1)。通过每种受体的DMTS诱导-反应的效力来报告活性水平,作为EC50值的量度(受体响应于给定化合物的半数最大激活功效水平的有效浓度)。
实施例3
其他人类DMTS受体的功能表征
进行功能性剂量-反应实验以评估表达个体推定DMTS受体的修饰细胞系的DMTS活性水平。对于以下人类受体中的每一种,在HEK293T细胞系中产生稳定表达人类受体的细胞系:OR2L13、OR4C15、OR5AC2、OR8H3、OR11G2或OR52N2。受体用-Rho标签组合标记,并与人G蛋白α亚基Gα15稳定共表达用于基于细胞的测定。人Gα15的共表达激活Gq转导途径,其导致在与合适的配体结合后内部Ca2+增加。受体暴露于增加浓度的DMTS。通过使用钙敏感荧光染料(Molecular Devices,Calcium 5dye,cat.R8186)测量细胞溶质中Ca2+的增加,以及使用荧光成像板读数器(Molecular Devices,FLIPR)测量在气味暴露后气味诱导的活性相对荧光比(RFU)的变化。记录受体活性的剂量依赖性增加,以及显示DMTS的相应剂量-反应曲线(图2)。缺乏受体的细胞系用作高化合物浓度下非特异性活性的对照(‘无受体’)。通过每种受体的DMTS诱导-反应的效力来报告活性水平,作为EC50值的量度。
实施例4
鉴定DMTS受体限制剂
将实施例3中描述的稳定细胞系用作拮抗剂筛选平台,以鉴定具有降低DMTS诱导的受体活性的特性的化合物。用挥发性化合物文库筛选表达人类气味剂受体的每种稳定细胞系的限制特性和潜在的DMTS气味限制。首先,将DMTS与每种测试化合物的单独二元混合物提供给细胞。在测试化合物存在或不存在的情况下单点监测DMTS诱导的细胞活性,允许鉴定具有推定的抑制或限制作用的化合物。在限制性剂量-反应曲线测定中进一步证实了这些命中(hits),以评估活性限制的效力,作为IC50的量度(受体活性被给定试验化合物的半数最大限制效力水平限制的限制剂浓度)。在单一激活浓度的DMTS(EC80)存在下,用增加浓度的测试化合物记录受体活性的剂量-依赖性降低,并获得相应的剂量-反应限制曲线。下表中的化合物是降低DMTS诱导的至少一种受体活性的化合物的实施例,如图4所示。
在图4中,条的长度表示所选化合物对每种受体的活性限制效力(IC50,以负对数摩尔浓度表示)。没有条表示不存在对相应受体化合物对的限制。这些化合物可特异性结合并阻断DMTS或DMDS受体的活性,因此可抑制或限制DMTS或DMDS的气味。因此,这些化合物可用作厕所或口腔气味控制应用的恶臭冲消剂。
实施例5
小鼠和人类DMTS受体对DMDS的反应谱
进行功能性剂量-反应实验以证实对实施例2中鉴定的DMTS受体的DMTS活性,并进一步表征它们对DMDS的反应。使用实施例2中描述的相同的基于细胞的测定,用递增浓度的DMTS、DMDS或丁酸(对照)测试小鼠受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742和人类气味剂受体OR4S2。相对于丁酸对照化合物,观察到DMTS和DMDS的受体活性的强烈剂量-依赖性增加。OR4S2和Olfr169对丁酸的反应很弱,但是太弱而不能考虑丁酸作为这些受体的代表性配体。通过每种受体的DMTS或DMDS诱导-应答的效力报告活性水平,分别作为EC50值、EC50DMTS和EC50DMDS的量度。其中细胞不表达气味受体的模拟转染对照实验在DMTS或DMDS暴露时未显示出活性。在这些受体的恶臭结合位点处的竞争性拮抗剂具有减少DMTS和DMDS的令人不快的感知的潜力。
SEQUENCE LISTING
<110> Firmenich SA
<120> 鉴定恶臭调节化合物的方法(Method of identifying malodor modulatingcompounds)
<130> 10020/WO
<160> 55
<170> PatentIn version 3.5
<210> 1
<211> 957
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 1
atggcctcaa ggacttattc catggaagaa gtaaataatg tcactgaatt cattttcttg 60
ggtctttctc agaaccctga ggttgaaaaa gtgtgctttg tggtgttctc cttcttttac 120
atggtcattc tgctaggaaa cctcctcatc atgttgacag tttgcagtgg caatcttttc 180
aagtttccca tgtatttttt cctcaacttt ctgtcttttg tggacatttg ctactcctca 240
gtcacagcac ccaagatgat tattgacctg ttagtgaaga aaaagactat atcctatgtg 300
gggtgcatgt tacaactctt tgtggttcat ttctttggtt gcactgagat cttcattctt 360
actgtcatgg cctatgatag atatgtggcc atttgtaaac ctctccacta tatgactatg 420
atggaccggg aaagatgcaa taagatgttg ctcggaacat ggatcggtgg cttcttacat 480
tctattatcc aagtggctct tgtggtccag ctcccctttt gtggaccgaa tgagattgat 540
cactatttct gtgatgtaca tcctgtactg aaacttgcct gcactgacac ttacattgtt 600
ggtatttttg tgacagcaaa cagtggcacc attgcattgg gaagttttgt catcttgctg 660
atctcataca cagtcattct catgtctctg agaaagcagt catctgaagg cagacgcaaa 720
gctctctcca cttgtggatc ccacattgct gttgtcatca ttttttttgg cccctgtact 780
tttatgtata tgcggcctga cactaccttc tctgaggaca agatggtagc tatattttac 840
accattatca ctcccatgct gaatcctcta atttacactc taagaaatgc agaagtaaag 900
aatgcaatga gaaaactgtg ggctagaaag ttttcctggg aaactactgg gaaatag 957
<210> 2
<211> 318
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 2
Met Ala Ser Arg Thr Tyr Ser Met Glu Glu Val Asn Asn Val Thr Glu
1 5 10 15
Phe Ile Phe Leu Gly Leu Ser Gln Asn Pro Glu Val Glu Lys Val Cys
20 25 30
Phe Val Val Phe Ser Phe Phe Tyr Met Val Ile Leu Leu Gly Asn Leu
35 40 45
Leu Ile Met Leu Thr Val Cys Ser Gly Asn Leu Phe Lys Phe Pro Met
50 55 60
Tyr Phe Phe Leu Asn Phe Leu Ser Phe Val Asp Ile Cys Tyr Ser Ser
65 70 75 80
Val Thr Ala Pro Lys Met Ile Ile Asp Leu Leu Val Lys Lys Lys Thr
85 90 95
Ile Ser Tyr Val Gly Cys Met Leu Gln Leu Phe Val Val His Phe Phe
100 105 110
Gly Cys Thr Glu Ile Phe Ile Leu Thr Val Met Ala Tyr Asp Arg Tyr
115 120 125
Val Ala Ile Cys Lys Pro Leu His Tyr Met Thr Met Met Asp Arg Glu
130 135 140
Arg Cys Asn Lys Met Leu Leu Gly Thr Trp Ile Gly Gly Phe Leu His
145 150 155 160
Ser Ile Ile Gln Val Ala Leu Val Val Gln Leu Pro Phe Cys Gly Pro
165 170 175
Asn Glu Ile Asp His Tyr Phe Cys Asp Val His Pro Val Leu Lys Leu
180 185 190
Ala Cys Thr Asp Thr Tyr Ile Val Gly Ile Phe Val Thr Ala Asn Ser
195 200 205
Gly Thr Ile Ala Leu Gly Ser Phe Val Ile Leu Leu Ile Ser Tyr Thr
210 215 220
Val Ile Leu Met Ser Leu Arg Lys Gln Ser Ser Glu Gly Arg Arg Lys
225 230 235 240
Ala Leu Ser Thr Cys Gly Ser His Ile Ala Val Val Ile Ile Phe Phe
245 250 255
Gly Pro Cys Thr Phe Met Tyr Met Arg Pro Asp Thr Thr Phe Ser Glu
260 265 270
Asp Lys Met Val Ala Ile Phe Tyr Thr Ile Ile Thr Pro Met Leu Asn
275 280 285
Pro Leu Ile Tyr Thr Leu Arg Asn Ala Glu Val Lys Asn Ala Met Arg
290 295 300
Lys Leu Trp Ala Arg Lys Phe Ser Trp Glu Thr Thr Gly Lys
305 310 315
<210> 3
<211> 969
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 3
atggaaaaga tcacatcagc tgtggatgtc cacaatattc cattaaagaa catgactgaa 60
gccaccatgt ttattctctt aggattcaca gatgactttg aactccaagt cttcctgttt 120
ttactgtttc ttgctattta tctcttcact ctggtaggaa actttggact ggttgttttg 180
gtcattgggg attgtcggct acacaacccc atgtactatt tcctaagtgt tttgtctttc 240
ctggatgctt gctattctac agttgttaca cccaaaatgt tggtcaactt tctaagtgaa 300
aataagtcca tttcattcct tgcatgtgca acccaaatgc ttctctttgt ttcgttggga 360
accacagaat gctttctcct ggcagcaatg gcttatgacc gatatgtagc catctacaac 420
ccacttctgt atacagtggc catgtcaccc agagtatacc tgccactcat cattgcttcc 480
tatgctggtg gagttgtgca tggtgctatc cacacagtgg ccactttcag tctgtccttc 540
tgtggatcca atgaaattaa gcatgtcttc tgtgacatcc ctgcattgct tgctctttct 600
tgttctgata cccacacaaa tgagcttcta gtcttgtact tggtgggctt gattgagatt 660
gttaccatcc tgattgttct ggtctcctat ggattcatcc tctttgccat tctgaacatg 720
cattctgctg agggtaggag gaaagtgttc tctacatgtg gctctcacct cactggagtc 780
tctatttacc atggtacaat ccttttcact tatatgaggc ctagttccag ttatgcttca 840
aatcatgaca tggtagtgtc aatattttac accattgtga tacccatgtt gaatcctatc 900
atctatagtt tgaggaacaa agatgtaaaa gtagcattta ataaattgtg gagaaaatgt 960
gattcataa 969
<210> 4
<211> 322
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 4
Met Glu Lys Ile Thr Ser Ala Val Asp Val His Asn Ile Pro Leu Lys
1 5 10 15
Asn Met Thr Glu Ala Thr Met Phe Ile Leu Leu Gly Phe Thr Asp Asp
20 25 30
Phe Glu Leu Gln Val Phe Leu Phe Leu Leu Phe Leu Ala Ile Tyr Leu
35 40 45
Phe Thr Leu Val Gly Asn Phe Gly Leu Val Val Leu Val Ile Gly Asp
50 55 60
Cys Arg Leu His Asn Pro Met Tyr Tyr Phe Leu Ser Val Leu Ser Phe
65 70 75 80
Leu Asp Ala Cys Tyr Ser Thr Val Val Thr Pro Lys Met Leu Val Asn
85 90 95
Phe Leu Ser Glu Asn Lys Ser Ile Ser Phe Leu Ala Cys Ala Thr Gln
100 105 110
Met Leu Leu Phe Val Ser Leu Gly Thr Thr Glu Cys Phe Leu Leu Ala
115 120 125
Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Tyr Asn Pro Leu Leu Tyr
130 135 140
Thr Val Ala Met Ser Pro Arg Val Tyr Leu Pro Leu Ile Ile Ala Ser
145 150 155 160
Tyr Ala Gly Gly Val Val His Gly Ala Ile His Thr Val Ala Thr Phe
165 170 175
Ser Leu Ser Phe Cys Gly Ser Asn Glu Ile Lys His Val Phe Cys Asp
180 185 190
Ile Pro Ala Leu Leu Ala Leu Ser Cys Ser Asp Thr His Thr Asn Glu
195 200 205
Leu Leu Val Leu Tyr Leu Val Gly Leu Ile Glu Ile Val Thr Ile Leu
210 215 220
Ile Val Leu Val Ser Tyr Gly Phe Ile Leu Phe Ala Ile Leu Asn Met
225 230 235 240
His Ser Ala Glu Gly Arg Arg Lys Val Phe Ser Thr Cys Gly Ser His
245 250 255
Leu Thr Gly Val Ser Ile Tyr His Gly Thr Ile Leu Phe Thr Tyr Met
260 265 270
Arg Pro Ser Ser Ser Tyr Ala Ser Asn His Asp Met Val Val Ser Ile
275 280 285
Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Ile Ile Tyr Ser Leu
290 295 300
Arg Asn Lys Asp Val Lys Val Ala Phe Asn Lys Leu Trp Arg Lys Cys
305 310 315 320
Asp Ser
<210> 5
<211> 948
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 5
atgagtgcct gtaatcatac aaatgaacct gagttcacgc ttgtgggact gacagactcc 60
aaggagattc agctggtcct ctctgttttg tttctcctga tatacatgct cactgtcttg 120
ggaaacatag gtatgatact gatcattcat ctagatgtcc agctccacac tccaatgtat 180
tttttcctca cccacttgtc attccttgac ctcagttact caactgtaat cacacctaaa 240
accttacaga atacgctgac ctccataaaa aatatttcct tcatgggatg cttcacccag 300
ttgtatttct ttgtcctctt ggcagcttct gaatgtttta tactttcgtc aatggcctat 360
gaccgctatg tagctatctg caaccctcta cactatccag ttattatgtc ccctaggcgc 420
tcatatactc tcatcactgt gtcctacatg attggagttt tggattcttc tgtcactgtc 480
ttttgcttaa gcacactgga tttctgcaac tccaaagtaa ttcatcactt cttttgtgac 540
acattcccaa ttttagctct gtcctgcagt gatacctata atgcagaagc cactatattc 600
gttttagctg gttccactct attgctgtcg ctcatcacga tatcctcatc ctatgtatct 660
attctctcta caattttgaa gataaattct tcttcaggaa agcacaaagc cttctctaca 720
tgtgcctcac atcttatagg agtcactgtt ttttatggta caatgatctt tacttattta 780
aaaccaagta cgtcctactc cctgggaaag gatcaagtag cctctgtttt ttatactata 840
gtgattccca tgctgaaccc acttatctat agtctcagga acaaagaagt gaaaagtgct 900
gttgttagag ttatgaagaa gagagagtgc atccagaaac tagaataa 948
<210> 6
<211> 315
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 6
Met Ser Ala Cys Asn His Thr Asn Glu Pro Glu Phe Thr Leu Val Gly
1 5 10 15
Leu Thr Asp Ser Lys Glu Ile Gln Leu Val Leu Ser Val Leu Phe Leu
20 25 30
Leu Ile Tyr Met Leu Thr Val Leu Gly Asn Ile Gly Met Ile Leu Ile
35 40 45
Ile His Leu Asp Val Gln Leu His Thr Pro Met Tyr Phe Phe Leu Thr
50 55 60
His Leu Ser Phe Leu Asp Leu Ser Tyr Ser Thr Val Ile Thr Pro Lys
65 70 75 80
Thr Leu Gln Asn Thr Leu Thr Ser Ile Lys Asn Ile Ser Phe Met Gly
85 90 95
Cys Phe Thr Gln Leu Tyr Phe Phe Val Leu Leu Ala Ala Ser Glu Cys
100 105 110
Phe Ile Leu Ser Ser Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Asn
115 120 125
Pro Leu His Tyr Pro Val Ile Met Ser Pro Arg Arg Ser Tyr Thr Leu
130 135 140
Ile Thr Val Ser Tyr Met Ile Gly Val Leu Asp Ser Ser Val Thr Val
145 150 155 160
Phe Cys Leu Ser Thr Leu Asp Phe Cys Asn Ser Lys Val Ile His His
165 170 175
Phe Phe Cys Asp Thr Phe Pro Ile Leu Ala Leu Ser Cys Ser Asp Thr
180 185 190
Tyr Asn Ala Glu Ala Thr Ile Phe Val Leu Ala Gly Ser Thr Leu Leu
195 200 205
Leu Ser Leu Ile Thr Ile Ser Ser Ser Tyr Val Ser Ile Leu Ser Thr
210 215 220
Ile Leu Lys Ile Asn Ser Ser Ser Gly Lys His Lys Ala Phe Ser Thr
225 230 235 240
Cys Ala Ser His Leu Ile Gly Val Thr Val Phe Tyr Gly Thr Met Ile
245 250 255
Phe Thr Tyr Leu Lys Pro Ser Thr Ser Tyr Ser Leu Gly Lys Asp Gln
260 265 270
Val Ala Ser Val Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Leu
275 280 285
Ile Tyr Ser Leu Arg Asn Lys Glu Val Lys Ser Ala Val Val Arg Val
290 295 300
Met Lys Lys Arg Glu Cys Ile Gln Lys Leu Glu
305 310 315
<210> 7
<211> 939
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 7
atggagaaat ggaatcagag ctcaagtgat tttactctgt taggactgct tccacaaaac 60
caaacaggcc tgctactttt gatgctcatc atctttgtct tctctctggc tttgtgtggc 120
aactcaggaa tgatccacct cattcgtgtg gatccaaggc tccacacccc catgtacttt 180
ctcctcagtc agctctctct catggacctg atgtacattt ctaccactgt tcccaagatg 240
gcatttaact tcctttctgg ccagaaaagc atctcttttc tgggctgtgg agtgcaatcc 300
ttcttcttcc tgactatggc atgttctgag ggcttgctct tggcttccat ggcttatgat 360
cgttttgtgg ctatctgcca tccccttcac tatcccattc gcatgagcaa aataatgtgt 420
ctgaagatga tcataggatc ctggatattg ggctcaatca actctttagc acataccgtc 480
tatgcccttc atattcctta ctgccattct aggtccatta accatttctt ctgtgatgtt 540
ccagccatgt tgcccctggc ctgtatggac acttgggttt atgagtacat ggtgtttgtg 600
agcacaagcc tgtttctcct actgcctttc cttggtatca cagcttccta tggtcgggtc 660
ctttttgctg tcttccacat gcgctcaaaa gagggaaaga agaaggcctt caccacatgc 720
tcaactcact taactgtggt gacattttac tatgcacctt ttgtctatac ctatcttcga 780
cctaggagtc ttcgctcccc aacagaagat aagattctgg ctgttttcta cactatcctt 840
acccccatgc tcaaccccat catttatagt ctgaggaata aggaggtcct gggggccatg 900
acaagagtcc ttggtacttt tccttcaact aaaccgtaa 939
<210> 8
<211> 312
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 8
Met Glu Lys Trp Asn Gln Ser Ser Ser Asp Phe Thr Leu Leu Gly Leu
1 5 10 15
Leu Pro Gln Asn Gln Thr Gly Leu Leu Leu Leu Met Leu Ile Ile Phe
20 25 30
Val Phe Ser Leu Ala Leu Cys Gly Asn Ser Gly Met Ile His Leu Ile
35 40 45
Arg Val Asp Pro Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser Gln
50 55 60
Leu Ser Leu Met Asp Leu Met Tyr Ile Ser Thr Thr Val Pro Lys Met
65 70 75 80
Ala Phe Asn Phe Leu Ser Gly Gln Lys Ser Ile Ser Phe Leu Gly Cys
85 90 95
Gly Val Gln Ser Phe Phe Phe Leu Thr Met Ala Cys Ser Glu Gly Leu
100 105 110
Leu Leu Ala Ser Met Ala Tyr Asp Arg Phe Val Ala Ile Cys His Pro
115 120 125
Leu His Tyr Pro Ile Arg Met Ser Lys Ile Met Cys Leu Lys Met Ile
130 135 140
Ile Gly Ser Trp Ile Leu Gly Ser Ile Asn Ser Leu Ala His Thr Val
145 150 155 160
Tyr Ala Leu His Ile Pro Tyr Cys His Ser Arg Ser Ile Asn His Phe
165 170 175
Phe Cys Asp Val Pro Ala Met Leu Pro Leu Ala Cys Met Asp Thr Trp
180 185 190
Val Tyr Glu Tyr Met Val Phe Val Ser Thr Ser Leu Phe Leu Leu Leu
195 200 205
Pro Phe Leu Gly Ile Thr Ala Ser Tyr Gly Arg Val Leu Phe Ala Val
210 215 220
Phe His Met Arg Ser Lys Glu Gly Lys Lys Lys Ala Phe Thr Thr Cys
225 230 235 240
Ser Thr His Leu Thr Val Val Thr Phe Tyr Tyr Ala Pro Phe Val Tyr
245 250 255
Thr Tyr Leu Arg Pro Arg Ser Leu Arg Ser Pro Thr Glu Asp Lys Ile
260 265 270
Leu Ala Val Phe Tyr Thr Ile Leu Thr Pro Met Leu Asn Pro Ile Ile
275 280 285
Tyr Ser Leu Arg Asn Lys Glu Val Leu Gly Ala Met Thr Arg Val Leu
290 295 300
Gly Thr Phe Pro Ser Thr Lys Pro
305 310
<210> 9
<211> 942
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 9
atggaatatg agaactacac ttttaacagc gacttcatcc tcttgggact gttctcttct 60
tcaaagacaa gcttaacttt tttctcattt atatttttca tttttattat ggctataaca 120
gaaaatgccc tcatgatcct cctaatccac agggattctc gactccatac cccaatgtat 180
ttcctgctta gtcatctctc cttcatggat atcttgcaca tttccaacat tgttcctaaa 240
atgattgctg acttcctctc aggcagcaga actatttcct ttgcaggctg tgccttccag 300
atatttctct ctcttacctt gctaggtggt gagtgccttc tcctggcagc catgtcctat 360
gatcgatatg tggccatctg ccacccactt cgctaccctg tgctgatgag ggataactcc 420
agtaggctcc tggctgcagg ctcctggctg gtggggatcc tcaactccat agtacacaca 480
gtttttgcac tccactttcc cttctgccac tcaagagcca ttgatcactt tttctgcgaa 540
gtccctgcca tgttgaaatt gtcatgtata gacacaacac actatgaacg aggcgtttat 600
gtgagtggca ttatttttct gctgatccca ttttccatga tctctatatc ttatgtgcaa 660
attctcctca ctgtattcca aatgcagtca tcaggggccc ggcaaaagtc cttttccacc 720
tgttccttcc acatggttgt tgtcataatg tactatgggc cattcatttt tacatatatg 780
agacctcgct cataccacac tccagggcag gataaatttt tggcaatatt ctacaccatc 840
ctgacaccca cactcaaccc cataatctac agctttcgta ataaagatgt ccttatggct 900
gtgaaaaaca tcgtccaaag taattttttg aataaaaaat ga 942
<210> 10
<211> 313
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 10
Met Glu Tyr Glu Asn Tyr Thr Phe Asn Ser Asp Phe Ile Leu Leu Gly
1 5 10 15
Leu Phe Ser Ser Ser Lys Thr Ser Leu Thr Phe Phe Ser Phe Ile Phe
20 25 30
Phe Ile Phe Ile Met Ala Ile Thr Glu Asn Ala Leu Met Ile Leu Leu
35 40 45
Ile His Arg Asp Ser Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser
50 55 60
His Leu Ser Phe Met Asp Ile Leu His Ile Ser Asn Ile Val Pro Lys
65 70 75 80
Met Ile Ala Asp Phe Leu Ser Gly Ser Arg Thr Ile Ser Phe Ala Gly
85 90 95
Cys Ala Phe Gln Ile Phe Leu Ser Leu Thr Leu Leu Gly Gly Glu Cys
100 105 110
Leu Leu Leu Ala Ala Met Ser Tyr Asp Arg Tyr Val Ala Ile Cys His
115 120 125
Pro Leu Arg Tyr Pro Val Leu Met Arg Asp Asn Ser Ser Arg Leu Leu
130 135 140
Ala Ala Gly Ser Trp Leu Val Gly Ile Leu Asn Ser Ile Val His Thr
145 150 155 160
Val Phe Ala Leu His Phe Pro Phe Cys His Ser Arg Ala Ile Asp His
165 170 175
Phe Phe Cys Glu Val Pro Ala Met Leu Lys Leu Ser Cys Ile Asp Thr
180 185 190
Thr His Tyr Glu Arg Gly Val Tyr Val Ser Gly Ile Ile Phe Leu Leu
195 200 205
Ile Pro Phe Ser Met Ile Ser Ile Ser Tyr Val Gln Ile Leu Leu Thr
210 215 220
Val Phe Gln Met Gln Ser Ser Gly Ala Arg Gln Lys Ser Phe Ser Thr
225 230 235 240
Cys Ser Phe His Met Val Val Val Ile Met Tyr Tyr Gly Pro Phe Ile
245 250 255
Phe Thr Tyr Met Arg Pro Arg Ser Tyr His Thr Pro Gly Gln Asp Lys
260 265 270
Phe Leu Ala Ile Phe Tyr Thr Ile Leu Thr Pro Thr Leu Asn Pro Ile
275 280 285
Ile Tyr Ser Phe Arg Asn Lys Asp Val Leu Met Ala Val Lys Asn Ile
290 295 300
Val Gln Ser Asn Phe Leu Asn Lys Lys
305 310
<210> 11
<211> 936
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 11
atgaaagcct ttagcagccc cagcaactcc agcatcatca ctggcttcat cctcctgggc 60
ttcccctgcc ccaaggaggg gcaaatcctc ctctttgtgc tcttcttcat tatctacatc 120
cttaccctca tgggcaatgc ttccatcata tgtgctgtgt gctatgataa gaaacttcac 180
agccccatgt acctcctgct ggccaacttc tccttcctag aaatctggta tgtcacctcc 240
acagtcccca acatgttggc caacttcctc tctgacacga aggtcatctc tttctctgga 300
tgcttcctgc agttctattt cttcttctcc ttgggttcta cagaatgctt tttcctggca 360
gtcatggcat ttgatcgata ccttgccatc tgcagacctc tacattatcc ttctctcatg 420
actgggcgcc tctgcaacat ccttgtgatc agttgctggg tgcttggttt cctctggttc 480
cctgttccca tcatcatcat ctcccaaatg tccttctgtg gatccagaat tatagaccac 540
ttcctgtgtg acccaggccc tctgttggcc ctcacctgtg tgagaaattc tttaattgag 600
atgactagct ctactttaag ttccctgctt ttatttgttc catttttttt tatcatgggg 660
tcttatgctc tagtaatgag ggctgtgctc agggtccctt cagcagctgg acgaagaaag 720
gccttctcca cctgtgggtc acacttgact gtggtttctc ttttctatgg ctcagtgatg 780
gtcatgtatg tgagcccaac atctgaacat gcagctggag tgcaaaaact tgtgactctg 840
ttttattctg tggttactcc cctccttaat cctgtgatat acagtctgag gaacagagat 900
atgaaacatg caatgaaaaa gttactgaaa atgtaa 936
<210> 12
<211> 311
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 12
Met Lys Ala Phe Ser Ser Pro Ser Asn Ser Ser Ile Ile Thr Gly Phe
1 5 10 15
Ile Leu Leu Gly Phe Pro Cys Pro Lys Glu Gly Gln Ile Leu Leu Phe
20 25 30
Val Leu Phe Phe Ile Ile Tyr Ile Leu Thr Leu Met Gly Asn Ala Ser
35 40 45
Ile Ile Cys Ala Val Cys Tyr Asp Lys Lys Leu His Ser Pro Met Tyr
50 55 60
Leu Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Trp Tyr Val Thr Ser
65 70 75 80
Thr Val Pro Asn Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Val Ile
85 90 95
Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Leu Gly
100 105 110
Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu
115 120 125
Ala Ile Cys Arg Pro Leu His Tyr Pro Ser Leu Met Thr Gly Arg Leu
130 135 140
Cys Asn Ile Leu Val Ile Ser Cys Trp Val Leu Gly Phe Leu Trp Phe
145 150 155 160
Pro Val Pro Ile Ile Ile Ile Ser Gln Met Ser Phe Cys Gly Ser Arg
165 170 175
Ile Ile Asp His Phe Leu Cys Asp Pro Gly Pro Leu Leu Ala Leu Thr
180 185 190
Cys Val Arg Asn Ser Leu Ile Glu Met Thr Ser Ser Thr Leu Ser Ser
195 200 205
Leu Leu Leu Phe Val Pro Phe Phe Phe Ile Met Gly Ser Tyr Ala Leu
210 215 220
Val Met Arg Ala Val Leu Arg Val Pro Ser Ala Ala Gly Arg Arg Lys
225 230 235 240
Ala Phe Ser Thr Cys Gly Ser His Leu Thr Val Val Ser Leu Phe Tyr
245 250 255
Gly Ser Val Met Val Met Tyr Val Ser Pro Thr Ser Glu His Ala Ala
260 265 270
Gly Val Gln Lys Leu Val Thr Leu Phe Tyr Ser Val Val Thr Pro Leu
275 280 285
Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Arg Asp Met Lys His Ala
290 295 300
Met Lys Lys Leu Leu Lys Met
305 310
<210> 13
<211> 936
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 13
atgaaaaccc tcagcagccc cagcaactcc agcaccatca ctggcttcat cctcttgggc 60
ttcccctgcc ccagggaggg gcaaatcctc ctctttgtga ccttcttcat tgtttacata 120
ctcattctta tgggcaatgc ttccatcatc tgtgctgtgt actgtgatca gagcctccac 180
acccccatgt acttcctgct ggccaacttc tccttcctgg agatctggta tgtcacctcc 240
acagtcccca acatgttggc caacttcctt tcagacacca aggtcatctc tttctctgga 300
tgcttcctgc agttctattt cttcttctcc tttggttcta cagaatgctt tttcctggca 360
gtcatggcat ttgatcgata ccttgccatc tgtaggccac tacattatcc ttctctcatg 420
actgggcacc tctgcaacat ccttgtgatc agttgctggg tgcttggttt cctctggttc 480
cctgtaccca tcatcatcat ctcccagatg tccttctgtg ggtccagaat tatagaccac 540
ttcctgtgtg acccaggccc tcttttggcc cttgcctgtt ccagagcccc attgatggag 600
gttttctgga caattataat gtctatgctc ctggttattc ctttcctctt catcatggga 660
acttacatat tggtcctaag agctgtgttt agacttcctt caagagatgg acaaaaaaag 720
gccttctcca cttgcgggtc tcatctcaca gtagtttcac tcttttattg ctcagtgatg 780
aaaatgtatt tgagcccaac atctgagcat gaagctggaa tgcagaagct tgtaactcta 840
ttttattctg tgggtactcc actacttaat cctgtgatat acagtctgag gaacaaagat 900
atgaaaaatg ccctgcagaa gattttaaga acataa 936
<210> 14
<211> 311
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 14
Met Lys Thr Leu Ser Ser Pro Ser Asn Ser Ser Thr Ile Thr Gly Phe
1 5 10 15
Ile Leu Leu Gly Phe Pro Cys Pro Arg Glu Gly Gln Ile Leu Leu Phe
20 25 30
Val Thr Phe Phe Ile Val Tyr Ile Leu Ile Leu Met Gly Asn Ala Ser
35 40 45
Ile Ile Cys Ala Val Tyr Cys Asp Gln Ser Leu His Thr Pro Met Tyr
50 55 60
Phe Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Trp Tyr Val Thr Ser
65 70 75 80
Thr Val Pro Asn Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Val Ile
85 90 95
Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Phe Gly
100 105 110
Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu
115 120 125
Ala Ile Cys Arg Pro Leu His Tyr Pro Ser Leu Met Thr Gly His Leu
130 135 140
Cys Asn Ile Leu Val Ile Ser Cys Trp Val Leu Gly Phe Leu Trp Phe
145 150 155 160
Pro Val Pro Ile Ile Ile Ile Ser Gln Met Ser Phe Cys Gly Ser Arg
165 170 175
Ile Ile Asp His Phe Leu Cys Asp Pro Gly Pro Leu Leu Ala Leu Ala
180 185 190
Cys Ser Arg Ala Pro Leu Met Glu Val Phe Trp Thr Ile Ile Met Ser
195 200 205
Met Leu Leu Val Ile Pro Phe Leu Phe Ile Met Gly Thr Tyr Ile Leu
210 215 220
Val Leu Arg Ala Val Phe Arg Leu Pro Ser Arg Asp Gly Gln Lys Lys
225 230 235 240
Ala Phe Ser Thr Cys Gly Ser His Leu Thr Val Val Ser Leu Phe Tyr
245 250 255
Cys Ser Val Met Lys Met Tyr Leu Ser Pro Thr Ser Glu His Glu Ala
260 265 270
Gly Met Gln Lys Leu Val Thr Leu Phe Tyr Ser Val Gly Thr Pro Leu
275 280 285
Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Lys Asp Met Lys Asn Ala
290 295 300
Leu Gln Lys Ile Leu Arg Thr
305 310
<210> 15
<211> 918
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 15
atggaactga acaggaccca gctgactgaa tttgttctca gaggaataac agatcgttca 60
gagctgcaag tccccctgtt cctggtgttc tttctcatct atgttatcac catggtgggc 120
aaccttggct taatctttgt catctggaag gaccctcatc ttcacacacc catgtacctt 180
ttccttggaa atttggcctt tgctgatgcc tgtaattcat cctctgtgac accaaagatg 240
cttatgaaat ttttaaataa gaatgacatg atatccatgg gtgagtgttt tgctcaattt 300
tatttctttt gttcaagtgt aactgcagaa gccttcattc tggtagctat ggcctatgac 360
cgctatgtag ccatatgcaa acctctgctc tatgtagtgg tgatgtccaa cagactctgt 420
attcagttca taggtgtatc ctatctaatt ggacttctac atggcttact tcatgtagga 480
ttgttattta ggttaacgtt ttgtagttcc aatgtaatag attatttcta ctgtgacatc 540
ctgccacttt ataggatttc ttgcactgac ccatcgatca atgtactggt agctttcatt 600
atgggtattt tattacaagt gagtaccttt atgagtatta tagtctccta tgtccgtgtc 660
ctctttgcca tcctgagaac aaagtctgag aggggcagaa acaaagcctt ctctacttgc 720
agttcccacc tgtcatctgt gtctttgttc tatggcactc tcttcatcat atatgtcctc 780
tctggctctg acacagataa ttatcagggt aaaatgtatt cactgttcta taccattatc 840
attcctctgc taaacccctt catttacagc ctaagaaata aagaagtcat cggtgccttg 900
agaaaagtca gaaaatga 918
<210> 16
<211> 305
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 16
Met Glu Leu Asn Arg Thr Gln Leu Thr Glu Phe Val Leu Arg Gly Ile
1 5 10 15
Thr Asp Arg Ser Glu Leu Gln Val Pro Leu Phe Leu Val Phe Phe Leu
20 25 30
Ile Tyr Val Ile Thr Met Val Gly Asn Leu Gly Leu Ile Phe Val Ile
35 40 45
Trp Lys Asp Pro His Leu His Thr Pro Met Tyr Leu Phe Leu Gly Asn
50 55 60
Leu Ala Phe Ala Asp Ala Cys Asn Ser Ser Ser Val Thr Pro Lys Met
65 70 75 80
Leu Met Lys Phe Leu Asn Lys Asn Asp Met Ile Ser Met Gly Glu Cys
85 90 95
Phe Ala Gln Phe Tyr Phe Phe Cys Ser Ser Val Thr Ala Glu Ala Phe
100 105 110
Ile Leu Val Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro
115 120 125
Leu Leu Tyr Val Val Val Met Ser Asn Arg Leu Cys Ile Gln Phe Ile
130 135 140
Gly Val Ser Tyr Leu Ile Gly Leu Leu His Gly Leu Leu His Val Gly
145 150 155 160
Leu Leu Phe Arg Leu Thr Phe Cys Ser Ser Asn Val Ile Asp Tyr Phe
165 170 175
Tyr Cys Asp Ile Leu Pro Leu Tyr Arg Ile Ser Cys Thr Asp Pro Ser
180 185 190
Ile Asn Val Leu Val Ala Phe Ile Met Gly Ile Leu Leu Gln Val Ser
195 200 205
Thr Phe Met Ser Ile Ile Val Ser Tyr Val Arg Val Leu Phe Ala Ile
210 215 220
Leu Arg Thr Lys Ser Glu Arg Gly Arg Asn Lys Ala Phe Ser Thr Cys
225 230 235 240
Ser Ser His Leu Ser Ser Val Ser Leu Phe Tyr Gly Thr Leu Phe Ile
245 250 255
Ile Tyr Val Leu Ser Gly Ser Asp Thr Asp Asn Tyr Gln Gly Lys Met
260 265 270
Tyr Ser Leu Phe Tyr Thr Ile Ile Ile Pro Leu Leu Asn Pro Phe Ile
275 280 285
Tyr Ser Leu Arg Asn Lys Glu Val Ile Gly Ala Leu Arg Lys Val Arg
290 295 300
Lys
305
<210> 17
<211> 951
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 17
atgcctgggg tcaatacctc cagcctgaca ccaagatact ttattctcaa tgggattcct 60
gggttggaag ctgcacacat ctggatctct ctgccattct tcattatgta cctcattgct 120
gtcacaggta actgtggact tatctacctc atcagtcatg aggaggctct gcaccggccc 180
atgtactact ttctagccat gttgtctgct acagatattt ctgggtgtaa tacaattgtc 240
cccagtatgt tatgcatctt ttggttcagt gtcaaggaga ttgatttcaa tgcctgcctt 300
gtacagatgt ttttcatcca catgttaaca ggcatggagt ctggtgtgct catgcttatg 360
gctctcgacc gctatgtggc tatatgctat ccattacgct atactaccat actcaccaac 420
actatgatta ccaagattgg attggcagca cttgttagaa gtgtgttact catggtccct 480
tttgctttcc tgatcaagcg tcttccatac tgtagaggaa acctcatcca acatacctat 540
tgtgatcaca tggctgtggc taaactatcc tgtggcaata ttaagattaa tgctatctat 600
ggtcttataa ttgctatatt tattgggggt tttgatatat tctgtatctc catgtcttat 660
gccatgatta tccatgctgt ggtgaagcta tcttcggcag atgctcgcca taaagccttc 720
agtacctgta catcacacat atgtgctatt gttattacct atgtcccagc attcttcaac 780
ttctttactc atcgctttgg gagaaccact ataccccatc atatccacat tattatagcc 840
aacctgtatc tattgctacc tcccaccttg aatccaattg tatatggagt aaagaccaag 900
cagattcgtg aaggtgtgat caaactgttt gctagacaaa aagttgtttg a 951
<210> 18
<211> 316
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 18
Met Pro Gly Val Asn Thr Ser Ser Leu Thr Pro Arg Tyr Phe Ile Leu
1 5 10 15
Asn Gly Ile Pro Gly Leu Glu Ala Ala His Ile Trp Ile Ser Leu Pro
20 25 30
Phe Phe Ile Met Tyr Leu Ile Ala Val Thr Gly Asn Cys Gly Leu Ile
35 40 45
Tyr Leu Ile Ser His Glu Glu Ala Leu His Arg Pro Met Tyr Tyr Phe
50 55 60
Leu Ala Met Leu Ser Ala Thr Asp Ile Ser Gly Cys Asn Thr Ile Val
65 70 75 80
Pro Ser Met Leu Cys Ile Phe Trp Phe Ser Val Lys Glu Ile Asp Phe
85 90 95
Asn Ala Cys Leu Val Gln Met Phe Phe Ile His Met Leu Thr Gly Met
100 105 110
Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile
115 120 125
Cys Tyr Pro Leu Arg Tyr Thr Thr Ile Leu Thr Asn Thr Met Ile Thr
130 135 140
Lys Ile Gly Leu Ala Ala Leu Val Arg Ser Val Leu Leu Met Val Pro
145 150 155 160
Phe Ala Phe Leu Ile Lys Arg Leu Pro Tyr Cys Arg Gly Asn Leu Ile
165 170 175
Gln His Thr Tyr Cys Asp His Met Ala Val Ala Lys Leu Ser Cys Gly
180 185 190
Asn Ile Lys Ile Asn Ala Ile Tyr Gly Leu Ile Ile Ala Ile Phe Ile
195 200 205
Gly Gly Phe Asp Ile Phe Cys Ile Ser Met Ser Tyr Ala Met Ile Ile
210 215 220
His Ala Val Val Lys Leu Ser Ser Ala Asp Ala Arg His Lys Ala Phe
225 230 235 240
Ser Thr Cys Thr Ser His Ile Cys Ala Ile Val Ile Thr Tyr Val Pro
245 250 255
Ala Phe Phe Asn Phe Phe Thr His Arg Phe Gly Arg Thr Thr Ile Pro
260 265 270
His His Ile His Ile Ile Ile Ala Asn Leu Tyr Leu Leu Leu Pro Pro
275 280 285
Thr Leu Asn Pro Ile Val Tyr Gly Val Lys Thr Lys Gln Ile Arg Glu
290 295 300
Gly Val Ile Lys Leu Phe Ala Arg Gln Lys Val Val
305 310 315
<210> 19
<211> 954
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 19
atgctgattt ccaacaactc atatgaagcc ccgcagtctt tcattcttaa tggaattcct 60
ggtctcgaag cagtgcatat atggatctct cttccactct gtacaatgta catcatctcc 120
ctagtaggca accttggcct tgtatatctc atttactatg aggaatcctt acatcgccca 180
atgtatttct ttctggccat gctttctctc atagacctgt ttacttgcac aaccactgtc 240
cccaatgccc tcttcatttt ctggttcaaa ctcaaggaaa ttaacttcac tgcttgccta 300
gttcagatgt tctttgtgca cggattcaca ggtgtggagt ctggggtact catgctcatg 360
gccttggacc gctatgtggc catttgctac ccactacgct atgcaaccat acttaccaac 420
cctgtcattg ccaaagctgg gcttgccacc ttcttgagag gtgtgttact gatgattcct 480
tttccattct tggttaaacg tttgcccttc tgccgaagca atgtcatctc ccatacatat 540
tgtgaccaca tgtctgtggt aaagttatcc tgtgccagca tcaaaatcaa tgtcatctat 600
ggtctcatgg ttgcacttct gattggagtg tttgacatat gttgtatatc tgtgtcctac 660
actatgatcc tccgggcagt ggtcagcctg tcctctgcag atgctcggca gaaggccttc 720
agcacctgca cagcccacat atctgccatc atcattactt atgttccagc cttcttcacc 780
ttctttactc atcgttttgg aggtcacacc atccctcctt ctcttcatat cattgtggct 840
aatctttatc ttcttctccc tccaactcta aatcccattg tttatgggat gaagaccaaa 900
cagatcagag atagtatcat taaattcttt cacggtgaaa aaggttcaag gtga 954
<210> 20
<211> 317
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 20
Met Leu Ile Ser Asn Asn Ser Tyr Glu Ala Pro Gln Ser Phe Ile Leu
1 5 10 15
Asn Gly Ile Pro Gly Leu Glu Ala Val His Ile Trp Ile Ser Leu Pro
20 25 30
Leu Cys Thr Met Tyr Ile Ile Ser Leu Val Gly Asn Leu Gly Leu Val
35 40 45
Tyr Leu Ile Tyr Tyr Glu Glu Ser Leu His Arg Pro Met Tyr Phe Phe
50 55 60
Leu Ala Met Leu Ser Leu Ile Asp Leu Phe Thr Cys Thr Thr Thr Val
65 70 75 80
Pro Asn Ala Leu Phe Ile Phe Trp Phe Lys Leu Lys Glu Ile Asn Phe
85 90 95
Thr Ala Cys Leu Val Gln Met Phe Phe Val His Gly Phe Thr Gly Val
100 105 110
Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile
115 120 125
Cys Tyr Pro Leu Arg Tyr Ala Thr Ile Leu Thr Asn Pro Val Ile Ala
130 135 140
Lys Ala Gly Leu Ala Thr Phe Leu Arg Gly Val Leu Leu Met Ile Pro
145 150 155 160
Phe Pro Phe Leu Val Lys Arg Leu Pro Phe Cys Arg Ser Asn Val Ile
165 170 175
Ser His Thr Tyr Cys Asp His Met Ser Val Val Lys Leu Ser Cys Ala
180 185 190
Ser Ile Lys Ile Asn Val Ile Tyr Gly Leu Met Val Ala Leu Leu Ile
195 200 205
Gly Val Phe Asp Ile Cys Cys Ile Ser Val Ser Tyr Thr Met Ile Leu
210 215 220
Arg Ala Val Val Ser Leu Ser Ser Ala Asp Ala Arg Gln Lys Ala Phe
225 230 235 240
Ser Thr Cys Thr Ala His Ile Ser Ala Ile Ile Ile Thr Tyr Val Pro
245 250 255
Ala Phe Phe Thr Phe Phe Thr His Arg Phe Gly Gly His Thr Ile Pro
260 265 270
Pro Ser Leu His Ile Ile Val Ala Asn Leu Tyr Leu Leu Leu Pro Pro
275 280 285
Thr Leu Asn Pro Ile Val Tyr Gly Met Lys Thr Lys Gln Ile Arg Asp
290 295 300
Ser Ile Ile Lys Phe Phe His Gly Glu Lys Gly Ser Arg
305 310 315
<210> 21
<211> 936
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 21
atgcaaaacc agagttttgt aacagaattc atattccttg gactttcaca gaaccctaaa 60
gtccagaaaa tagtttttat tgtattttta tttgtctaca ttgcaactgt tgggggcaac 120
atgataattg tggtgaccat tgtctgtagc ccagcattga tagactgccc catgtacttc 180
tttttggcat tcttgtccct attggatgca tgcttctctt ctgtcatcac accaaagatg 240
gttgtggact ccctgtatga gaagaaaact atctcctttg aaggatgtat gatgcagtta 300
tttgctgagc acttccttgc agcagtagaa gtgattgtct tgacagccat ggcctatgac 360
cgctatgtag caatttgcaa gcccttgcac tactcttcca tcatgaactg gaggctctgt 420
ggcacactta tggggatagc atggacaggg ggcttcttgc attctatcat acaaattatc 480
ttcacgttgc aattgccctt ctgtggacca aatgtcatcg atcatttcat gtgtgacttg 540
ttcccattac tggaacttgc ctgcactgat actcatatct ttggcctttt agtggttgcc 600
aacagtgggt ctatctgcat cataatcttc tctattttgc tggtctccta tggtgtcatc 660
ctgttctctc tgaaagctca cagttctgaa gggcgatgga aagctctctc cacatgtgga 720
tcccacattg cagttgtggt tttgttcttt gtcccgtgta tatttattta tgcacgtcct 780
ccatctgctt tctcctttga taaaatggtg gcgatatttt atactatcct aactcccttg 840
ctcaatcctg tgatttatac ttttcggaat aaggacatga aaaatgctat gaagaaagtg 900
tggaagaggt tggcagtggt ttctgatgga aagtga 936
<210> 22
<211> 311
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 22
Met Gln Asn Gln Ser Phe Val Thr Glu Phe Ile Phe Leu Gly Leu Ser
1 5 10 15
Gln Asn Pro Lys Val Gln Lys Ile Val Phe Ile Val Phe Leu Phe Val
20 25 30
Tyr Ile Ala Thr Val Gly Gly Asn Met Ile Ile Val Val Thr Ile Val
35 40 45
Cys Ser Pro Ala Leu Ile Asp Cys Pro Met Tyr Phe Phe Leu Ala Phe
50 55 60
Leu Ser Leu Leu Asp Ala Cys Phe Ser Ser Val Ile Thr Pro Lys Met
65 70 75 80
Val Val Asp Ser Leu Tyr Glu Lys Lys Thr Ile Ser Phe Glu Gly Cys
85 90 95
Met Met Gln Leu Phe Ala Glu His Phe Leu Ala Ala Val Glu Val Ile
100 105 110
Val Leu Thr Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro
115 120 125
Leu His Tyr Ser Ser Ile Met Asn Trp Arg Leu Cys Gly Thr Leu Met
130 135 140
Gly Ile Ala Trp Thr Gly Gly Phe Leu His Ser Ile Ile Gln Ile Ile
145 150 155 160
Phe Thr Leu Gln Leu Pro Phe Cys Gly Pro Asn Val Ile Asp His Phe
165 170 175
Met Cys Asp Leu Phe Pro Leu Leu Glu Leu Ala Cys Thr Asp Thr His
180 185 190
Ile Phe Gly Leu Leu Val Val Ala Asn Ser Gly Ser Ile Cys Ile Ile
195 200 205
Ile Phe Ser Ile Leu Leu Val Ser Tyr Gly Val Ile Leu Phe Ser Leu
210 215 220
Lys Ala His Ser Ser Glu Gly Arg Trp Lys Ala Leu Ser Thr Cys Gly
225 230 235 240
Ser His Ile Ala Val Val Val Leu Phe Phe Val Pro Cys Ile Phe Ile
245 250 255
Tyr Ala Arg Pro Pro Ser Ala Phe Ser Phe Asp Lys Met Val Ala Ile
260 265 270
Phe Tyr Thr Ile Leu Thr Pro Leu Leu Asn Pro Val Ile Tyr Thr Phe
275 280 285
Arg Asn Lys Asp Met Lys Asn Ala Met Lys Lys Val Trp Lys Arg Leu
290 295 300
Ala Val Val Ser Asp Gly Lys
305 310
<210> 23
<211> 975
<212> DNA
<213> 人(Homo sapiens)
<400> 23
atgcctctat ttaattcatt atgctggttt ccaacaattc atgtgactcc tccatctttt 60
attcttaatg gaatacctgg tctggaaaga gtacatgtat ggatctccct cccactctgc 120
acaatgtaca tcatcttcct tgtggggaat cttggtcttg tgtacctcat ttattatgag 180
gagtccttac atcatccgat gtattttttt tttggccatg ctctctccct cattgacctc 240
cttacctgca ccaccactct acccaatgca ctctgcatct tctggttcag tctcaaagaa 300
attaacttca atgcttgctt ggcccagatg ttctttgttc atgggttcac aggtgtggag 360
tctggggtgc tcatgctcat ggctctagac cgctatgtag ccatttgcta ccctttgcgt 420
tatgctacca cactcaccaa ccctatcatt gccaaggctg agcttgccac cttcctgagg 480
ggtgtattgc tgatgattcc tttcccattc ttggttaagc gtttgccttt ctgccaaagc 540
aatattatct cccatacgta ctgcgaccac atgtctgtag taaagctatc ttgtgccagc 600
atcaaggtca atgtaatcta tggtctaatg gttgctctcc tgattggagt gtttgacatt 660
tgttgtatat ctttgtctta cactttgatc ctcaaggcag cgatcagcct ctcttcatca 720
gatgctcggc agaaggcttt cagcacctgc actgcccata tatctgccat catcatcacc 780
tatgttccag cattcttcac tttctttgcc caccgttttg ggggacacac aattccccct 840
tctcttcaca tcattgtggc taatctttat cttcttcttc ccccaactct aaaccctatt 900
gtttatggag taaagacaaa acagatacgc aagagtgtca taaagttctt ccagggtgat 960
aagggtgcag gttga 975
<210> 24
<211> 324
<212> PRT
<213> 人(Homo sapiens)
<400> 24
Met Pro Leu Phe Asn Ser Leu Cys Trp Phe Pro Thr Ile His Val Thr
1 5 10 15
Pro Pro Ser Phe Ile Leu Asn Gly Ile Pro Gly Leu Glu Arg Val His
20 25 30
Val Trp Ile Ser Leu Pro Leu Cys Thr Met Tyr Ile Ile Phe Leu Val
35 40 45
Gly Asn Leu Gly Leu Val Tyr Leu Ile Tyr Tyr Glu Glu Ser Leu His
50 55 60
His Pro Met Tyr Phe Phe Phe Gly His Ala Leu Ser Leu Ile Asp Leu
65 70 75 80
Leu Thr Cys Thr Thr Thr Leu Pro Asn Ala Leu Cys Ile Phe Trp Phe
85 90 95
Ser Leu Lys Glu Ile Asn Phe Asn Ala Cys Leu Ala Gln Met Phe Phe
100 105 110
Val His Gly Phe Thr Gly Val Glu Ser Gly Val Leu Met Leu Met Ala
115 120 125
Leu Asp Arg Tyr Val Ala Ile Cys Tyr Pro Leu Arg Tyr Ala Thr Thr
130 135 140
Leu Thr Asn Pro Ile Ile Ala Lys Ala Glu Leu Ala Thr Phe Leu Arg
145 150 155 160
Gly Val Leu Leu Met Ile Pro Phe Pro Phe Leu Val Lys Arg Leu Pro
165 170 175
Phe Cys Gln Ser Asn Ile Ile Ser His Thr Tyr Cys Asp His Met Ser
180 185 190
Val Val Lys Leu Ser Cys Ala Ser Ile Lys Val Asn Val Ile Tyr Gly
195 200 205
Leu Met Val Ala Leu Leu Ile Gly Val Phe Asp Ile Cys Cys Ile Ser
210 215 220
Leu Ser Tyr Thr Leu Ile Leu Lys Ala Ala Ile Ser Leu Ser Ser Ser
225 230 235 240
Asp Ala Arg Gln Lys Ala Phe Ser Thr Cys Thr Ala His Ile Ser Ala
245 250 255
Ile Ile Ile Thr Tyr Val Pro Ala Phe Phe Thr Phe Phe Ala His Arg
260 265 270
Phe Gly Gly His Thr Ile Pro Pro Ser Leu His Ile Ile Val Ala Asn
275 280 285
Leu Tyr Leu Leu Leu Pro Pro Thr Leu Asn Pro Ile Val Tyr Gly Val
290 295 300
Lys Thr Lys Gln Ile Arg Lys Ser Val Ile Lys Phe Phe Gln Gly Asp
305 310 315 320
Lys Gly Ala Gly
<210> 25
<211> 939
<212> DNA
<213> 人(Homo sapiens)
<400> 25
atggagaaat ggaatcacac ttcaaatgat ttcattttgt tgggtctgct tcccccaaat 60
caaactggaa tatttctctt gtgccttatc atcctcatat tctttctggc ctcggtgggt 120
aactcggcca tgattcacct catccacgtg gatcctcgtc tccacacacc gatgtacttt 180
cttctcagcc agctctccct tatggacctg atgtacatct ccaccaccgt ccccaagatg 240
gcgtacaact tcctgtccgg ccagaaaggc atctccttcc tgggatgtgg tgtgcaaagc 300
ttcttcttcc tgaccatggc gtgttctgaa ggcttactcc tgacctccat ggcctacgac 360
cgttatttgg ccatctgcca ctctctctat tatcctatcc gcatgagtaa aatgatgtgt 420
gtgaagatga ttggaggctc ttggacactg gggtccatca actccttggc acacacagtc 480
tttgcccttc atattcccta ctgcaggtct agggctattg accatttctt ctgcgatgtc 540
ccagccatgt tgcttcttgc ctgtacagat acttgggtct atgaatatat ggtttttgta 600
agtacaagcc tctttctcct tttccctttc attggcatca cttcttcctg tggccgagtc 660
ctatttgctg tctatcatat gcactcaaag gaggggagaa aaaaggcctt caccaccatt 720
tcaacacatt taactgtagt gatcttttac tatgcacctt ttgtctacac ctatcttcgg 780
cccaggaatc tccgctcacc agctgaagac aagatcctgg cagtcttcta caccatcctt 840
acccccatgc tcaatcccat tatctacagc ctgaggaata aggaagtcct gggggctatg 900
aggagagtgt ttgggatatt ctctttcctg aaagaataa 939
<210> 26
<211> 312
<212> PRT
<213> 人(Homo sapiens)
<400> 26
Met Glu Lys Trp Asn His Thr Ser Asn Asp Phe Ile Leu Leu Gly Leu
1 5 10 15
Leu Pro Pro Asn Gln Thr Gly Ile Phe Leu Leu Cys Leu Ile Ile Leu
20 25 30
Ile Phe Phe Leu Ala Ser Val Gly Asn Ser Ala Met Ile His Leu Ile
35 40 45
His Val Asp Pro Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser Gln
50 55 60
Leu Ser Leu Met Asp Leu Met Tyr Ile Ser Thr Thr Val Pro Lys Met
65 70 75 80
Ala Tyr Asn Phe Leu Ser Gly Gln Lys Gly Ile Ser Phe Leu Gly Cys
85 90 95
Gly Val Gln Ser Phe Phe Phe Leu Thr Met Ala Cys Ser Glu Gly Leu
100 105 110
Leu Leu Thr Ser Met Ala Tyr Asp Arg Tyr Leu Ala Ile Cys His Ser
115 120 125
Leu Tyr Tyr Pro Ile Arg Met Ser Lys Met Met Cys Val Lys Met Ile
130 135 140
Gly Gly Ser Trp Thr Leu Gly Ser Ile Asn Ser Leu Ala His Thr Val
145 150 155 160
Phe Ala Leu His Ile Pro Tyr Cys Arg Ser Arg Ala Ile Asp His Phe
165 170 175
Phe Cys Asp Val Pro Ala Met Leu Leu Leu Ala Cys Thr Asp Thr Trp
180 185 190
Val Tyr Glu Tyr Met Val Phe Val Ser Thr Ser Leu Phe Leu Leu Phe
195 200 205
Pro Phe Ile Gly Ile Thr Ser Ser Cys Gly Arg Val Leu Phe Ala Val
210 215 220
Tyr His Met His Ser Lys Glu Gly Arg Lys Lys Ala Phe Thr Thr Ile
225 230 235 240
Ser Thr His Leu Thr Val Val Ile Phe Tyr Tyr Ala Pro Phe Val Tyr
245 250 255
Thr Tyr Leu Arg Pro Arg Asn Leu Arg Ser Pro Ala Glu Asp Lys Ile
260 265 270
Leu Ala Val Phe Tyr Thr Ile Leu Thr Pro Met Leu Asn Pro Ile Ile
275 280 285
Tyr Ser Leu Arg Asn Lys Glu Val Leu Gly Ala Met Arg Arg Val Phe
290 295 300
Gly Ile Phe Ser Phe Leu Lys Glu
305 310
<210> 27
<211> 879
<212> DNA
<213> 人(Homo sapiens)
<400> 27
atgagtgtaa cagaaaatac gctcatgatc ctcctcattc gcagtgactc ccgactccac 60
actccaatgt attttctgct cagccatctc tccttaatgg atatcttgca tgtttccaac 120
atcgttccca aaatggtcac taactttctg tcaggcagca gaactatttc atttgcaggt 180
tgtgggttcc aggtatttct gtccctcacc ctcctgggtg gtgagtgcct tctcctggct 240
gcaatgtcct gtgatcgcta tgtggctatc tgtcacccgc tgcgctatcc gattcttatg 300
aaggagtatg ccagcgctct catggctgga ggctcctggc tcattggggt tttcaactcc 360
acagtccaca cagcttatgc actgcagttt cccttctgtg gctctagggc aattgatcac 420
ttcttctgtg aagtccctgc catgttgaag ttgtcctgtg cagacacaac acgctatgaa 480
cgaggggttt gtgtaagtgc tgtgatcttc ctgctgatcc ctttctcctt gatctctgct 540
tcttatggcc aaattattct tactgtcctc cagatgaaat catcagaggc aaggaaaaag 600
tcattttcca cttgttcctt ccacatgatt gtggtcacga tgtactatgg gccatttatt 660
tttacatata tgagacctaa atcataccac actccagggc aggataagtt cctggcaata 720
ttctatacga tcctcacacc cacactcaac cctttcatct acagctttag gaataaagat 780
gttctggcgg tgatgaaaaa tatgctcaaa agtaactttc tgcacaaaaa aatgaatagg 840
aaaattcctg aatgtgtgtt ctgtctattt ctatgttaa 879
<210> 28
<211> 292
<212> PRT
<213> 人(Homo sapiens)
<400> 28
Met Ser Val Thr Glu Asn Thr Leu Met Ile Leu Leu Ile Arg Ser Asp
1 5 10 15
Ser Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser His Leu Ser Leu
20 25 30
Met Asp Ile Leu His Val Ser Asn Ile Val Pro Lys Met Val Thr Asn
35 40 45
Phe Leu Ser Gly Ser Arg Thr Ile Ser Phe Ala Gly Cys Gly Phe Gln
50 55 60
Val Phe Leu Ser Leu Thr Leu Leu Gly Gly Glu Cys Leu Leu Leu Ala
65 70 75 80
Ala Met Ser Cys Asp Arg Tyr Val Ala Ile Cys His Pro Leu Arg Tyr
85 90 95
Pro Ile Leu Met Lys Glu Tyr Ala Ser Ala Leu Met Ala Gly Gly Ser
100 105 110
Trp Leu Ile Gly Val Phe Asn Ser Thr Val His Thr Ala Tyr Ala Leu
115 120 125
Gln Phe Pro Phe Cys Gly Ser Arg Ala Ile Asp His Phe Phe Cys Glu
130 135 140
Val Pro Ala Met Leu Lys Leu Ser Cys Ala Asp Thr Thr Arg Tyr Glu
145 150 155 160
Arg Gly Val Cys Val Ser Ala Val Ile Phe Leu Leu Ile Pro Phe Ser
165 170 175
Leu Ile Ser Ala Ser Tyr Gly Gln Ile Ile Leu Thr Val Leu Gln Met
180 185 190
Lys Ser Ser Glu Ala Arg Lys Lys Ser Phe Ser Thr Cys Ser Phe His
195 200 205
Met Ile Val Val Thr Met Tyr Tyr Gly Pro Phe Ile Phe Thr Tyr Met
210 215 220
Arg Pro Lys Ser Tyr His Thr Pro Gly Gln Asp Lys Phe Leu Ala Ile
225 230 235 240
Phe Tyr Thr Ile Leu Thr Pro Thr Leu Asn Pro Phe Ile Tyr Ser Phe
245 250 255
Arg Asn Lys Asp Val Leu Ala Val Met Lys Asn Met Leu Lys Ser Asn
260 265 270
Phe Leu His Lys Lys Met Asn Arg Lys Ile Pro Glu Cys Val Phe Cys
275 280 285
Leu Phe Leu Cys
290
<210> 29
<211> 1113
<212> DNA
<213> 人(Homo sapiens)
<400> 29
atgttctcaa tgacaacaga agcactcaat aattttgcac ttggatgtac caacttgtta 60
atgactatga taccacaaat tgatctgaag caaattttcc tttgtcctaa ttgcagacta 120
tacatgatcc ctgttggagc tttcatcttt tccttgggaa acatgcaaaa ccaaagcttt 180
gtaactgagt ttgtcctcct gggactttca cagaatccaa atgttcagga aatagtattt 240
gttgtatttt tgtttgtcta cattgcaact gttgggggca acatgctaat tgtagtaacc 300
attctcagca gccctgctct tctggtgtct cctatgtact tcttcttggg cttcctgtcc 360
ttcctggatg cgtgcttctc atctgtcatc accccaaaga tgattgtaga ctccctctat 420
gtgacaaaaa ccatctcttt tgaaggctgc atgatgcagc tctttgctga acacttcttt 480
gctggggtgg aggtgattgt cctcacagcc atggcctatg atcgttatgt ggccatttgc 540
aagcccttgc attactcttc tatcatgaac aggaggctct gtggcattct gatgggggta 600
gcctggacag ggggcctctt gcattccatg atacaaattc tttttacttt ccagcttccc 660
ttttgtggcc ccaatgtcat caatcacttt atgtgtgact tgtacccgtt actggagctt 720
gcctgcactg atactcacat ctttggcctc atggtggtca tcaacagtgg gtttatctgc 780
atcataaact tctccttgtt gcttgtctcc tatgctgtca tcttgctctc tctgagaaca 840
cacagttctg aagggcgctg gaaagctctc tccacctgtg gatctcacat tgctgttgtg 900
attttgttct ttgtcccatg catatttgta tatacacgac ctccatctgc tttttccctt 960
gacaaaatgg cggcaatatt ttatatcatc ttaaatccct tgctcaatcc tttgatttac 1020
actttcagga ataaggaagt aaaacaggcc atgaggagaa tatggaacag actgatggtg 1080
gtttctgatg agaaagaaaa tattaaactt taa 1113
<210> 30
<211> 370
<212> PRT
<213> 人(Homo sapiens)
<400> 30
Met Phe Ser Met Thr Thr Glu Ala Leu Asn Asn Phe Ala Leu Gly Cys
1 5 10 15
Thr Asn Leu Leu Met Thr Met Ile Pro Gln Ile Asp Leu Lys Gln Ile
20 25 30
Phe Leu Cys Pro Asn Cys Arg Leu Tyr Met Ile Pro Val Gly Ala Phe
35 40 45
Ile Phe Ser Leu Gly Asn Met Gln Asn Gln Ser Phe Val Thr Glu Phe
50 55 60
Val Leu Leu Gly Leu Ser Gln Asn Pro Asn Val Gln Glu Ile Val Phe
65 70 75 80
Val Val Phe Leu Phe Val Tyr Ile Ala Thr Val Gly Gly Asn Met Leu
85 90 95
Ile Val Val Thr Ile Leu Ser Ser Pro Ala Leu Leu Val Ser Pro Met
100 105 110
Tyr Phe Phe Leu Gly Phe Leu Ser Phe Leu Asp Ala Cys Phe Ser Ser
115 120 125
Val Ile Thr Pro Lys Met Ile Val Asp Ser Leu Tyr Val Thr Lys Thr
130 135 140
Ile Ser Phe Glu Gly Cys Met Met Gln Leu Phe Ala Glu His Phe Phe
145 150 155 160
Ala Gly Val Glu Val Ile Val Leu Thr Ala Met Ala Tyr Asp Arg Tyr
165 170 175
Val Ala Ile Cys Lys Pro Leu His Tyr Ser Ser Ile Met Asn Arg Arg
180 185 190
Leu Cys Gly Ile Leu Met Gly Val Ala Trp Thr Gly Gly Leu Leu His
195 200 205
Ser Met Ile Gln Ile Leu Phe Thr Phe Gln Leu Pro Phe Cys Gly Pro
210 215 220
Asn Val Ile Asn His Phe Met Cys Asp Leu Tyr Pro Leu Leu Glu Leu
225 230 235 240
Ala Cys Thr Asp Thr His Ile Phe Gly Leu Met Val Val Ile Asn Ser
245 250 255
Gly Phe Ile Cys Ile Ile Asn Phe Ser Leu Leu Leu Val Ser Tyr Ala
260 265 270
Val Ile Leu Leu Ser Leu Arg Thr His Ser Ser Glu Gly Arg Trp Lys
275 280 285
Ala Leu Ser Thr Cys Gly Ser His Ile Ala Val Val Ile Leu Phe Phe
290 295 300
Val Pro Cys Ile Phe Val Tyr Thr Arg Pro Pro Ser Ala Phe Ser Leu
305 310 315 320
Asp Lys Met Ala Ala Ile Phe Tyr Ile Ile Leu Asn Pro Leu Leu Asn
325 330 335
Pro Leu Ile Tyr Thr Phe Arg Asn Lys Glu Val Lys Gln Ala Met Arg
340 345 350
Arg Ile Trp Asn Arg Leu Met Val Val Ser Asp Glu Lys Glu Asn Ile
355 360 365
Lys Leu
370
<210> 31
<211> 930
<212> DNA
<213> 人(Homo sapiens)
<400> 31
atggatatat cagagggaaa taagactctt gtgacagagt ttgttctcac aggacttaca 60
gatcgaccat ggctgcacgt cctcttcttt gttgtgtttt tggtggtcta tctcatcacc 120
atggtgggca accttggact gatagttcta atttggaacg acccccatct tcatatgccc 180
atgtacttat tccttggtgg tttagccttt tcagatgctt gtacttcaac ctctataacc 240
cctaggatgc tggtcaattt cttagacaag actgcaatga tatccctagc tgagtgcatc 300
acccagtttt acttttttgc ttccagtgca actacagaat gcttcctcct ggtgatgatg 360
gcctatgacc gctatgtagc catatgtaat cccttgcttt atccagtgat gatgtccaac 420
aaactcagcg ctcagttgct aagtatttca tatgtaattg gtttcctgca tcctctggtt 480
catgtgagtt tactattgcg actaactttc tgcaggttta acataataca ttatttctac 540
tgtgaaattt tacaactgtt caaaatttca tgcaatggtc catctattaa cgcactaatg 600
atatttattt ttggtgcttt tatacaaata cccactttaa tgactatcat aatctcttat 660
actcgtgtgc tctttgatat tctgaaaaaa aagtctgaaa agggcagaag caaagccttc 720
tccacatgcg gcgcccatct gctttctgtc tcattgtact acggaactct gatcttcatg 780
tatgtgcgtc ctgcatctgg cttagctgaa gaccaagaca aagtgtattc tctgttttac 840
acgattataa ttcccctgct aaacccattt atttacagct tgagaaataa aaaagtcatg 900
catgcattga gaagagttat aaggaagtaa 930
<210> 32
<211> 309
<212> PRT
<213> 人(Homo sapiens)
<400> 32
Met Asp Ile Ser Glu Gly Asn Lys Thr Leu Val Thr Glu Phe Val Leu
1 5 10 15
Thr Gly Leu Thr Asp Arg Pro Trp Leu His Val Leu Phe Phe Val Val
20 25 30
Phe Leu Val Val Tyr Leu Ile Thr Met Val Gly Asn Leu Gly Leu Ile
35 40 45
Val Leu Ile Trp Asn Asp Pro His Leu His Met Pro Met Tyr Leu Phe
50 55 60
Leu Gly Gly Leu Ala Phe Ser Asp Ala Cys Thr Ser Thr Ser Ile Thr
65 70 75 80
Pro Arg Met Leu Val Asn Phe Leu Asp Lys Thr Ala Met Ile Ser Leu
85 90 95
Ala Glu Cys Ile Thr Gln Phe Tyr Phe Phe Ala Ser Ser Ala Thr Thr
100 105 110
Glu Cys Phe Leu Leu Val Met Met Ala Tyr Asp Arg Tyr Val Ala Ile
115 120 125
Cys Asn Pro Leu Leu Tyr Pro Val Met Met Ser Asn Lys Leu Ser Ala
130 135 140
Gln Leu Leu Ser Ile Ser Tyr Val Ile Gly Phe Leu His Pro Leu Val
145 150 155 160
His Val Ser Leu Leu Leu Arg Leu Thr Phe Cys Arg Phe Asn Ile Ile
165 170 175
His Tyr Phe Tyr Cys Glu Ile Leu Gln Leu Phe Lys Ile Ser Cys Asn
180 185 190
Gly Pro Ser Ile Asn Ala Leu Met Ile Phe Ile Phe Gly Ala Phe Ile
195 200 205
Gln Ile Pro Thr Leu Met Thr Ile Ile Ile Ser Tyr Thr Arg Val Leu
210 215 220
Phe Asp Ile Leu Lys Lys Lys Ser Glu Lys Gly Arg Ser Lys Ala Phe
225 230 235 240
Ser Thr Cys Gly Ala His Leu Leu Ser Val Ser Leu Tyr Tyr Gly Thr
245 250 255
Leu Ile Phe Met Tyr Val Arg Pro Ala Ser Gly Leu Ala Glu Asp Gln
260 265 270
Asp Lys Val Tyr Ser Leu Phe Tyr Thr Ile Ile Ile Pro Leu Leu Asn
275 280 285
Pro Phe Ile Tyr Ser Leu Arg Asn Lys Lys Val Met His Ala Leu Arg
290 295 300
Arg Val Ile Arg Lys
305
<210> 33
<211> 939
<212> DNA
<213> 人(Homo sapiens)
<400> 33
atgatgggta gaaggaatga cacaaatgtg gctgacttca tccttacggg actgtcagac 60
tctgaagagg tccagatggc tctgtttatg ctatttctcc tcatatacct aattactatg 120
ctggggaatg tggggatgct attgataatc cgcctggacc tccagcttca cactcccatg 180
tattttttcc ttactcacct gtcatttatt gacctcagtt actcaactgt cgtcacacct 240
aaaaccttag cgaacttact gacttccaac tatatttcct tcacgggctg ctttgcccag 300
atgttctgtt ttgtcttctt gggtactgct gaatgttatc ttctctcctc aatggcctat 360
gatcgctatg cagcgatctg cagtcctcta cactacacag ttattatgcc caaaaggctc 420
tgcctcgctc tcatcactgg gccttatgtg attggcttta tggactcctt tgtcaatgtg 480
gtttccatga gcagattgca tttctgtgac tcaaacataa ttcatcactt tttctgtgac 540
acttccccaa ttttagctct gtcctgcact gacacagaca acactgaaat gctgatattc 600
attatcgctg gttccaccct gatggtgtcc cttatcacaa tatctgcatc ctatgtgtcc 660
attctctcta ccatcctgaa aattaattcc acttcaggaa agcagaaagc tttctctact 720
tgcgtctctc atctcttggg agtcaccatc ttctatggaa ctatgatttt tacttactta 780
aagccaagaa agtcttattc cttgggaaga gatcaagtgg ctcctgtgtt ttatactatt 840
gtgattccca tgctgaatcc actcatttat agtcttagaa acagagaagt gaaaaatgct 900
ctcattagag tcatgcagag aagacaggac tccaggtag 939
<210> 34
<211> 312
<212> PRT
<213> 人(Homo sapiens)
<400> 34
Met Met Gly Arg Arg Asn Asp Thr Asn Val Ala Asp Phe Ile Leu Thr
1 5 10 15
Gly Leu Ser Asp Ser Glu Glu Val Gln Met Ala Leu Phe Met Leu Phe
20 25 30
Leu Leu Ile Tyr Leu Ile Thr Met Leu Gly Asn Val Gly Met Leu Leu
35 40 45
Ile Ile Arg Leu Asp Leu Gln Leu His Thr Pro Met Tyr Phe Phe Leu
50 55 60
Thr His Leu Ser Phe Ile Asp Leu Ser Tyr Ser Thr Val Val Thr Pro
65 70 75 80
Lys Thr Leu Ala Asn Leu Leu Thr Ser Asn Tyr Ile Ser Phe Thr Gly
85 90 95
Cys Phe Ala Gln Met Phe Cys Phe Val Phe Leu Gly Thr Ala Glu Cys
100 105 110
Tyr Leu Leu Ser Ser Met Ala Tyr Asp Arg Tyr Ala Ala Ile Cys Ser
115 120 125
Pro Leu His Tyr Thr Val Ile Met Pro Lys Arg Leu Cys Leu Ala Leu
130 135 140
Ile Thr Gly Pro Tyr Val Ile Gly Phe Met Asp Ser Phe Val Asn Val
145 150 155 160
Val Ser Met Ser Arg Leu His Phe Cys Asp Ser Asn Ile Ile His His
165 170 175
Phe Phe Cys Asp Thr Ser Pro Ile Leu Ala Leu Ser Cys Thr Asp Thr
180 185 190
Asp Asn Thr Glu Met Leu Ile Phe Ile Ile Ala Gly Ser Thr Leu Met
195 200 205
Val Ser Leu Ile Thr Ile Ser Ala Ser Tyr Val Ser Ile Leu Ser Thr
210 215 220
Ile Leu Lys Ile Asn Ser Thr Ser Gly Lys Gln Lys Ala Phe Ser Thr
225 230 235 240
Cys Val Ser His Leu Leu Gly Val Thr Ile Phe Tyr Gly Thr Met Ile
245 250 255
Phe Thr Tyr Leu Lys Pro Arg Lys Ser Tyr Ser Leu Gly Arg Asp Gln
260 265 270
Val Ala Pro Val Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Leu
275 280 285
Ile Tyr Ser Leu Arg Asn Arg Glu Val Lys Asn Ala Leu Ile Arg Val
290 295 300
Met Gln Arg Arg Gln Asp Ser Arg
305 310
<210> 35
<211> 936
<212> DNA
<213> 人(Homo sapiens)
<400> 35
atgaaaatct tcaacagccc cagcaactcc agcaccttca ctggcttcat cctcctgggc 60
ttcccttgcc ccagggaggg gcagatcctc ctctttgtgc tcttcactgt tgtttacctc 120
ctgaccctca tgggcaatgg ttccatcatc tgtgctgtgc actgggatca gagactccac 180
gcccccatgt acatcctgct cgccaacttc tccttcttgg agatatgtta tgtcacctcc 240
acagtcccca gcatgctggc caacttcctc tctgacacca agatcatctc gttctctggc 300
tgcttcctcc agttctactt tttcttctcc ttgggctcta cagaatgctt tttcctggca 360
gttatggcat ttgatcgata ccttgccatc tgtcggcctc tacgctatcc aaccattatg 420
accagacgtc tctgtaccaa tcttgtggtc aattgctggg tacttggttt catctggttc 480
ttgattccta tcgtcaacat ctcccaaatg tccttctgtg gatctaggat tattgaccac 540
ttcctatgtg acccagctcc tcttctaact ctcacttgca aaaaaggccc tgtgatagag 600
cttgtctttt ctgtcttaag tcctctgcct gtctttatgc tctttctctt cattgtgggg 660
tcctatgctc tggtcgtgag agctgtgttg agggtccctt cagcagctgg gagaagaaag 720
gctttctcca cctgtgggtc tcacctggct gtggtttcac tgttctacgg ctcagtactg 780
gtcatgtatg ggagcccacc atctaagaat gaagctggaa agcagaagac tgtgactctg 840
ttttattctg ttgttacccc actgcttaac cctgtgatat atagtcttag gaacaaagat 900
atgagaaaag ctctgaagaa attttgggga acataa 936
<210> 36
<211> 311
<212> PRT
<213> 人(Homo sapiens)
<400> 36
Met Lys Ile Phe Asn Ser Pro Ser Asn Ser Ser Thr Phe Thr Gly Phe
1 5 10 15
Ile Leu Leu Gly Phe Pro Cys Pro Arg Glu Gly Gln Ile Leu Leu Phe
20 25 30
Val Leu Phe Thr Val Val Tyr Leu Leu Thr Leu Met Gly Asn Gly Ser
35 40 45
Ile Ile Cys Ala Val His Trp Asp Gln Arg Leu His Ala Pro Met Tyr
50 55 60
Ile Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Cys Tyr Val Thr Ser
65 70 75 80
Thr Val Pro Ser Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Ile Ile
85 90 95
Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Leu Gly
100 105 110
Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu
115 120 125
Ala Ile Cys Arg Pro Leu Arg Tyr Pro Thr Ile Met Thr Arg Arg Leu
130 135 140
Cys Thr Asn Leu Val Val Asn Cys Trp Val Leu Gly Phe Ile Trp Phe
145 150 155 160
Leu Ile Pro Ile Val Asn Ile Ser Gln Met Ser Phe Cys Gly Ser Arg
165 170 175
Ile Ile Asp His Phe Leu Cys Asp Pro Ala Pro Leu Leu Thr Leu Thr
180 185 190
Cys Lys Lys Gly Pro Val Ile Glu Leu Val Phe Ser Val Leu Ser Pro
195 200 205
Leu Pro Val Phe Met Leu Phe Leu Phe Ile Val Gly Ser Tyr Ala Leu
210 215 220
Val Val Arg Ala Val Leu Arg Val Pro Ser Ala Ala Gly Arg Arg Lys
225 230 235 240
Ala Phe Ser Thr Cys Gly Ser His Leu Ala Val Val Ser Leu Phe Tyr
245 250 255
Gly Ser Val Leu Val Met Tyr Gly Ser Pro Pro Ser Lys Asn Glu Ala
260 265 270
Gly Lys Gln Lys Thr Val Thr Leu Phe Tyr Ser Val Val Thr Pro Leu
275 280 285
Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Lys Asp Met Arg Lys Ala
290 295 300
Leu Lys Lys Phe Trp Gly Thr
305 310
<210> 37
<211> 966
<212> DNA
<213> 人(Homo sapiens)
<400> 37
atgtctgggg acaacagctc cagcctgacc ccaggattct ttatcttgaa tggcgttcct 60
gggctggaag ccacacacat ctggatctcc ctgccattct gctttatgta catcattgct 120
gtcgtgggga actgtgggct catctgcctc atcagccatg aggaggccct gcaccggccc 180
atgtactact tcctggccct gctctccttc actgatgtca ccttgtgcac caccatggta 240
cctaatatgc tgtgcatatt ctggttcaac ctcaaggaga ttgactttaa cgcctgcctg 300
gcccagatgt tttttgtcca tatgctgaca gggatggagt ctggggtgct catgctcatg 360
gccctggacc gctatgtggc catctgctac cccttacgct atgccaccat ccttaccaac 420
cctgtcatcg ccaaggctgg tcttgccacc ttcttgagga atgtgatgct catcatccca 480
ttcactctcc tcaccaagcg cctgccctat tgccggggga acttcatccc ccacacctac 540
tgtgaccata tgtctgtggc caaggtatcc tgtggcaatt tcaaggtcaa tgctatttat 600
ggtctgatgg ttgctctcct gattggtgtg tttgatatct gctgtatctc tgtatcttac 660
actatgattt tgcaggctgt tatgagcctg tcatcagcag atgctcgtca caaagccttc 720
agcacctgca catctcacat gtgttccatt gtgatcacct atgttgctgc ttttttcact 780
tttttcactc atcgttttgt aggacacaat atcccaaacc acatacacat catcgtggcc 840
aacctttatc tgctactgcc tcctaccatg aacccaattg tttatggagt caagaccaag 900
cagattcagg aaggtgtaat taaattttta cttggagaca aggttagttt tacctatgac 960
aaatga 966
<210> 38
<211> 321
<212> PRT
<213> 人(Homo sapiens)
<400> 38
Met Ser Gly Asp Asn Ser Ser Ser Leu Thr Pro Gly Phe Phe Ile Leu
1 5 10 15
Asn Gly Val Pro Gly Leu Glu Ala Thr His Ile Trp Ile Ser Leu Pro
20 25 30
Phe Cys Phe Met Tyr Ile Ile Ala Val Val Gly Asn Cys Gly Leu Ile
35 40 45
Cys Leu Ile Ser His Glu Glu Ala Leu His Arg Pro Met Tyr Tyr Phe
50 55 60
Leu Ala Leu Leu Ser Phe Thr Asp Val Thr Leu Cys Thr Thr Met Val
65 70 75 80
Pro Asn Met Leu Cys Ile Phe Trp Phe Asn Leu Lys Glu Ile Asp Phe
85 90 95
Asn Ala Cys Leu Ala Gln Met Phe Phe Val His Met Leu Thr Gly Met
100 105 110
Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile
115 120 125
Cys Tyr Pro Leu Arg Tyr Ala Thr Ile Leu Thr Asn Pro Val Ile Ala
130 135 140
Lys Ala Gly Leu Ala Thr Phe Leu Arg Asn Val Met Leu Ile Ile Pro
145 150 155 160
Phe Thr Leu Leu Thr Lys Arg Leu Pro Tyr Cys Arg Gly Asn Phe Ile
165 170 175
Pro His Thr Tyr Cys Asp His Met Ser Val Ala Lys Val Ser Cys Gly
180 185 190
Asn Phe Lys Val Asn Ala Ile Tyr Gly Leu Met Val Ala Leu Leu Ile
195 200 205
Gly Val Phe Asp Ile Cys Cys Ile Ser Val Ser Tyr Thr Met Ile Leu
210 215 220
Gln Ala Val Met Ser Leu Ser Ser Ala Asp Ala Arg His Lys Ala Phe
225 230 235 240
Ser Thr Cys Thr Ser His Met Cys Ser Ile Val Ile Thr Tyr Val Ala
245 250 255
Ala Phe Phe Thr Phe Phe Thr His Arg Phe Val Gly His Asn Ile Pro
260 265 270
Asn His Ile His Ile Ile Val Ala Asn Leu Tyr Leu Leu Leu Pro Pro
275 280 285
Thr Met Asn Pro Ile Val Tyr Gly Val Lys Thr Lys Gln Ile Gln Glu
290 295 300
Gly Val Ile Lys Phe Leu Leu Gly Asp Lys Val Ser Phe Thr Tyr Asp
305 310 315 320
Lys
<210> 39
<211> 915
<212> DNA
<213> 人(Homo sapiens)
<400> 39
atgtttatat taataagctt cacagaagaa tttgatgtgc aagtcttcct atttttatta 60
tttttagcaa tctatctatt cactctaata ggcaatttag ggctggttgt accgatcatt 120
ggggatttct ggcttcacag cccaatgtac tattttcttg gtgttttatc attcttggat 180
gtctgctatt ctacagttgt cactccaaaa atgttggtca atttcctggc aaaaaataaa 240
tctatttcat ttcttggatg tgcaacacag atgtttcttg cttgtacttt tggaaccaca 300
gaatgctttc tcttggctgc aatggcttat gatcgctatg tagccatcta caaccctctc 360
ctgtattcag tgagcatgtc acccagagtc tatgtgccac tcatcactgc ttcctatgtt 420
gctagcattt tacatgctac tatacataca gtggctacat ttagcctgtc cttctgtgga 480
tccaatgaaa ttaggcatgt cttttgtaat atgcctcctc tccttgctat ttcttgttct 540
gacactcacg taatccagct tctattcttc tactttgtgg gctctattga gatagtcact 600
atcctgattg tcctgatctc ctatggtttt attctgttgg ccattctgaa gatgcagtct 660
gctgaaggga ggagaaaagt cttctctaca tgtggagctc acctaactgg agtgacaatt 720
tatcatggga caatcctctt catgtatgtg agaccaagtt ccagctacac ttcggacaat 780
gacatgatag tgtcaatatt ttataccatt gtgattccca tgctgaatcc catcatctac 840
agtttgcgga acaaagatgt aaaggaggca atcaaaagat tgcttgtgag aaattggttc 900
ataaataagt tatag 915
<210> 40
<211> 304
<212> PRT
<213> 人(Homo sapiens)
<400> 40
Met Phe Ile Leu Ile Ser Phe Thr Glu Glu Phe Asp Val Gln Val Phe
1 5 10 15
Leu Phe Leu Leu Phe Leu Ala Ile Tyr Leu Phe Thr Leu Ile Gly Asn
20 25 30
Leu Gly Leu Val Val Pro Ile Ile Gly Asp Phe Trp Leu His Ser Pro
35 40 45
Met Tyr Tyr Phe Leu Gly Val Leu Ser Phe Leu Asp Val Cys Tyr Ser
50 55 60
Thr Val Val Thr Pro Lys Met Leu Val Asn Phe Leu Ala Lys Asn Lys
65 70 75 80
Ser Ile Ser Phe Leu Gly Cys Ala Thr Gln Met Phe Leu Ala Cys Thr
85 90 95
Phe Gly Thr Thr Glu Cys Phe Leu Leu Ala Ala Met Ala Tyr Asp Arg
100 105 110
Tyr Val Ala Ile Tyr Asn Pro Leu Leu Tyr Ser Val Ser Met Ser Pro
115 120 125
Arg Val Tyr Val Pro Leu Ile Thr Ala Ser Tyr Val Ala Ser Ile Leu
130 135 140
His Ala Thr Ile His Thr Val Ala Thr Phe Ser Leu Ser Phe Cys Gly
145 150 155 160
Ser Asn Glu Ile Arg His Val Phe Cys Asn Met Pro Pro Leu Leu Ala
165 170 175
Ile Ser Cys Ser Asp Thr His Val Ile Gln Leu Leu Phe Phe Tyr Phe
180 185 190
Val Gly Ser Ile Glu Ile Val Thr Ile Leu Ile Val Leu Ile Ser Tyr
195 200 205
Gly Phe Ile Leu Leu Ala Ile Leu Lys Met Gln Ser Ala Glu Gly Arg
210 215 220
Arg Lys Val Phe Ser Thr Cys Gly Ala His Leu Thr Gly Val Thr Ile
225 230 235 240
Tyr His Gly Thr Ile Leu Phe Met Tyr Val Arg Pro Ser Ser Ser Tyr
245 250 255
Thr Ser Asp Asn Asp Met Ile Val Ser Ile Phe Tyr Thr Ile Val Ile
260 265 270
Pro Met Leu Asn Pro Ile Ile Tyr Ser Leu Arg Asn Lys Asp Val Lys
275 280 285
Glu Ala Ile Lys Arg Leu Leu Val Arg Asn Trp Phe Ile Asn Lys Leu
290 295 300
<210> 41
<211> 936
<212> DNA
<213> 人(Homo sapiens)
<400> 41
atggaaaaaa taaacaacgt aactgaattc attttctggg gtctttctca gagcccagag 60
attgagaaag tttgttttgt ggtgttttct ttcttctaca taatcattct tctgggaaat 120
ctcctcatca tgctgacagt ttgcctgagc aacctgttta agtcacccat gtatttcttt 180
ctcagcttct tgtcttttgt ggacatttgt tactcttcag tcacagctcc caagatgatt 240
gttgacctgt tagcaaagga caaaaccatc tcctatgtgg ggtgcatgtt gcaactgttt 300
ggagtacatt tctttggttg cactgagatc ttcatcctta ctgtaatggc ctatgatcgt 360
tatgtggcta tctgtaaacc cctacattat atgaccatca tgaaccggga gacatgcaat 420
aaaatgttat tagggacgtg ggtaggtggg ttcttacact ccattatcca agtggctctg 480
gtagtccaac tacccttttg tggacccaat gagatagatc actacttttg tgatgttcac 540
cctgtgttga aacttgcctg cacagaaaca tacattgttg gtgttgttgt gacagccaac 600
agtggtacca ttgctctggg gagttttgtt atcttgctaa tctcctacag catcatccta 660
gtttccctga gaaagcagtc agcagaaggc aggcgcaaag ccctctccac ctgtggctcc 720
cacattgcca tggtcgttat ctttttcggc ccctgtactt ttatgtacat gcgccctgat 780
acgacctttt cagaggataa gatggtggct gtattttaca ccattatcac tcccatgtta 840
aatcctctga tttatacact gagaaatgca gaagtaaaga atgcaatgaa gaaactgtgg 900
ggcagaaatg ttttcttgga ggctaaaggg aaatag 936
<210> 42
<211> 311
<212> PRT
<213> 人(Homo sapiens)
<400> 42
Met Glu Lys Ile Asn Asn Val Thr Glu Phe Ile Phe Trp Gly Leu Ser
1 5 10 15
Gln Ser Pro Glu Ile Glu Lys Val Cys Phe Val Val Phe Ser Phe Phe
20 25 30
Tyr Ile Ile Ile Leu Leu Gly Asn Leu Leu Ile Met Leu Thr Val Cys
35 40 45
Leu Ser Asn Leu Phe Lys Ser Pro Met Tyr Phe Phe Leu Ser Phe Leu
50 55 60
Ser Phe Val Asp Ile Cys Tyr Ser Ser Val Thr Ala Pro Lys Met Ile
65 70 75 80
Val Asp Leu Leu Ala Lys Asp Lys Thr Ile Ser Tyr Val Gly Cys Met
85 90 95
Leu Gln Leu Phe Gly Val His Phe Phe Gly Cys Thr Glu Ile Phe Ile
100 105 110
Leu Thr Val Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro Leu
115 120 125
His Tyr Met Thr Ile Met Asn Arg Glu Thr Cys Asn Lys Met Leu Leu
130 135 140
Gly Thr Trp Val Gly Gly Phe Leu His Ser Ile Ile Gln Val Ala Leu
145 150 155 160
Val Val Gln Leu Pro Phe Cys Gly Pro Asn Glu Ile Asp His Tyr Phe
165 170 175
Cys Asp Val His Pro Val Leu Lys Leu Ala Cys Thr Glu Thr Tyr Ile
180 185 190
Val Gly Val Val Val Thr Ala Asn Ser Gly Thr Ile Ala Leu Gly Ser
195 200 205
Phe Val Ile Leu Leu Ile Ser Tyr Ser Ile Ile Leu Val Ser Leu Arg
210 215 220
Lys Gln Ser Ala Glu Gly Arg Arg Lys Ala Leu Ser Thr Cys Gly Ser
225 230 235 240
His Ile Ala Met Val Val Ile Phe Phe Gly Pro Cys Thr Phe Met Tyr
245 250 255
Met Arg Pro Asp Thr Thr Phe Ser Glu Asp Lys Met Val Ala Val Phe
260 265 270
Tyr Thr Ile Ile Thr Pro Met Leu Asn Pro Leu Ile Tyr Thr Leu Arg
275 280 285
Asn Ala Glu Val Lys Asn Ala Met Lys Lys Leu Trp Gly Arg Asn Val
290 295 300
Phe Leu Glu Ala Lys Gly Lys
305 310
<210> 43
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> FLAG tag
<400> 43
gattacaagg acgacgacga taag 24
<210> 44
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> FLAG tag
<400> 44
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 45
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> Rho tag
<400> 45
atgaacggga ccgagggccc aaacttctac gtgcctttct ccaacaagac gggcgtggtg 60
<210> 46
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> Rho tag
<400> 46
Met Asn Gly Thr Glu Gly Pro Asn Phe Tyr Val Pro Phe Ser Asn Lys
1 5 10 15
Thr Gly Val Val
20
<210> 47
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> Lucy tag
<400> 47
atgagacccc agatcctgct gctcctggcc ctgctgaccc taggcctggc t 51
<210> 48
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> Lucy tag
<400> 48
Met Arg Pro Gln Ile Leu Leu Leu Leu Ala Leu Leu Thr Leu Gly Leu
1 5 10 15
Ala
<210> 49
<211> 1376
<212> DNA
<213> 人(Homo sapiens)
<400> 49
atgggtctgt gctacagtct gcggccgctg cttttcgggg gcccagggga cgacccctgc 60
gcggcctcgg agccgccggt ggaggacgcg cagcccgccc cggccccggc cctggcccca 120
gtccgggcgg ccgcaaggga cacggcccgg accctgctcc ctcggggcgg cgaagggagc 180
ccggcatgcg ctcggcccaa agcagacaag ccgaaggaga agcggcagcg caccgagcag 240
cttagtgccg aggagcgcga ggcggccaag gagcgcgagg cggtcaagga ggcgaggaaa 300
gtgagccggg gcatcgaccg catgctgcgc gaccagaagc gcgacctgca gcagacgcac 360
cggctcctgc tgctcggggc tggtgagtct gggaaaagca ctatcgtcaa acagatgagg 420
atcctgcacg tcaatgggtt taatcccgag gaaaagaaac agaaaattct ggacatccgg 480
aaaaatgtta aagatgctat cgtgacaatt gtttcagcaa tgagtactat aatacctcca 540
gttccgctgg ccaaccctga aaaccaattt cgatcagact acatcaagag catagcccct 600
atcactgact ttgaatattc ccaggaattc tttgaccatg tgaaaaaact ttgggacgat 660
gaaggcgtga aggcatgctt tgagagatcc aacgaatacc agctgattga ctgtgcacaa 720
tacttcctgg aaagaatcga cagcgtcagc ttggttgact acacacccac agaccaggac 780
ctcctcagat gcagagttct gacatctggg atttttgaga acgattccaa gtggacaaag 840
taaacttcca catgtttgat gttggtggcc agagggatga gaggagaaaa tggatccagt 900
gctttaacga tgtcacagct atcatttacg tcgcagcctg cagtagctac aacatggtga 960
ttcgagaaga taacaacacc aacaggctga gagagtccct ggatcttttt gaaagcatct 1020
ggaacaacag gtggttacgg accatttcta tcatcttgtt cttgaacaaa caagatatgc 1080
tggcagaaaa agtcttggca gggaaatcaa aaattgaaga ctatttccca gaatatgcaa 1140
attatactgt tcctgaagac gcaacaccag atgcaggaga agatcccaaa gttacaagag 1200
ccaagttctt tatccgggac ctgtttttga ggatcagcac ggccaccggt gacggcaaac 1260
attactgcta cccgcacttc acctgcgccg tggacacaga gaacatccgc agggtgttca 1320
acgactgccg cgacatcatc cagcggatgc acctcaagca gtatgagctc ttgtga 1376
<210> 50
<211> 458
<212> PRT
<213> 人(Homo sapiens)
<400> 50
Met Gly Leu Cys Tyr Ser Leu Arg Pro Leu Leu Phe Gly Gly Pro Gly
1 5 10 15
Asp Asp Pro Cys Ala Ala Ser Glu Pro Pro Val Glu Asp Ala Gln Pro
20 25 30
Ala Pro Ala Pro Ala Leu Ala Pro Val Arg Ala Ala Ala Arg Asp Thr
35 40 45
Ala Arg Thr Leu Leu Pro Arg Gly Gly Glu Gly Ser Pro Ala Cys Ala
50 55 60
Arg Pro Lys Ala Asp Lys Pro Lys Glu Lys Arg Gln Arg Thr Glu Gln
65 70 75 80
Leu Ser Ala Glu Glu Arg Glu Ala Ala Lys Glu Arg Glu Ala Val Lys
85 90 95
Glu Ala Arg Lys Val Ser Arg Gly Ile Asp Arg Met Leu Arg Asp Gln
100 105 110
Lys Arg Asp Leu Gln Gln Thr His Arg Leu Leu Leu Leu Gly Ala Gly
115 120 125
Glu Ser Gly Lys Ser Thr Ile Val Lys Gln Met Arg Ile Leu His Val
130 135 140
Asn Gly Phe Asn Pro Glu Glu Lys Lys Gln Lys Ile Leu Asp Ile Arg
145 150 155 160
Lys Asn Val Lys Asp Ala Ile Val Thr Ile Val Ser Ala Met Ser Thr
165 170 175
Ile Ile Pro Pro Val Pro Leu Ala Asn Pro Glu Asn Gln Phe Arg Ser
180 185 190
Asp Tyr Ile Lys Ser Ile Ala Pro Ile Thr Asp Phe Glu Tyr Ser Gln
195 200 205
Glu Phe Phe Asp His Val Lys Lys Leu Trp Asp Asp Glu Gly Val Lys
210 215 220
Ala Cys Phe Glu Arg Ser Asn Glu Tyr Gln Leu Ile Asp Cys Ala Gln
225 230 235 240
Tyr Phe Leu Glu Arg Ile Asp Ser Val Ser Leu Val Asp Tyr Thr Pro
245 250 255
Thr Asp Gln Asp Leu Leu Arg Cys Arg Val Leu Thr Ser Gly Ile Phe
260 265 270
Glu Thr Arg Phe Gln Val Asp Lys Val Asn Phe His Met Phe Asp Val
275 280 285
Gly Gly Gln Arg Asp Glu Arg Arg Lys Trp Ile Gln Cys Phe Asn Asp
290 295 300
Val Thr Ala Ile Ile Tyr Val Ala Ala Cys Ser Ser Tyr Asn Met Val
305 310 315 320
Ile Arg Glu Asp Asn Asn Thr Asn Arg Leu Arg Glu Ser Leu Asp Leu
325 330 335
Phe Glu Ser Ile Trp Asn Asn Arg Trp Leu Arg Thr Ile Ser Ile Ile
340 345 350
Leu Phe Leu Asn Lys Gln Asp Met Leu Ala Glu Lys Val Leu Ala Gly
355 360 365
Lys Ser Lys Ile Glu Asp Tyr Phe Pro Glu Tyr Ala Asn Tyr Thr Val
370 375 380
Pro Glu Asp Ala Thr Pro Asp Ala Gly Glu Asp Pro Lys Val Thr Arg
385 390 395 400
Ala Lys Phe Phe Ile Arg Asp Leu Phe Leu Arg Ile Ser Thr Ala Thr
405 410 415
Gly Asp Gly Lys His Tyr Cys Tyr Pro His Phe Thr Cys Ala Val Asp
420 425 430
Thr Glu Asn Ile Arg Arg Val Phe Asn Asp Cys Arg Asp Ile Ile Gln
435 440 445
Arg Met His Leu Lys Gln Tyr Glu Leu Leu
450 455
<210> 51
<211> 1125
<212> DNA
<213> 人(Homo sapiens)
<400> 51
atggcccggt cgctgacctg gcgctgctgc ccctggtgcc tgacggagga tgagaaggcc 60
gccgcccggg tggaccagga gatcaacagg atcctcttgg agcagaagaa gcaggaccgc 120
ggggagctga agctgctgct tttgggccca ggcgagagcg ggaagagcac cttcatcaag 180
cagatgcgga tcatccacgg cgccggctac tcggaggagg agcgcaaggg cttccggccc 240
ctggtctacc agaacatctt cgtgtccatg cgggccatga tcgaggccat ggagcggctg 300
cagattccat tcagcaggcc cgagagcaag caccacgcca gcctggtcat gagccaggac 360
ccctataaag tgaccacgtt tgagaagcgc tacgctgcgg ccatgcagtg gctgtggagg 420
gatgccggca tccgggcctg ctatgagcgt cggcgggaat tccacctgct cgattcagcc 480
gtgtactacc tgtcccacct ggagcgcatc accgaggagg gctacgtccc cacagctcag 540
gacgtgctcc gcagccgcat gcccaccact ggcatcaacg agtactgctt ctccgtgcag 600
aaaaccaacc tgcggatcgt ggacgtcggg ggccagaagt cagagcgtaa gaaatggatc 660
cattgtttcg agaacgtgat cgccctcatc tacctggcct cactgagtga atacgaccag 720
tgcctggagg agaacaacca ggagaaccgc atgaaggaga gcctcgcatt gtttgggact 780
atcctggaac taccctggtt caaaagcaca tccgtcatcc tctttctcaa caaaaccgac 840
atcctggagg agaaaatccc cacctcccac ctggctacct atttccccag tttccagggc 900
cctaagcagg atgctgaggc agccaagagg ttcatcctgg acatgtacac gaggatgtac 960
accgggtgcg tggacggccc cgagggcagc aagaagggcg cacgatcccg acgcctcttc 1020
agccactaca catgtgccac agacacacag aacatccgca aggtcttcaa ggacgtgcgg 1080
gactcggtgc tcgcccgcta cctggacgag atcaacctgc tgtga 1125
<210> 52
<211> 374
<212> PRT
<213> 人(Homo sapiens)
<400> 52
Met Ala Arg Ser Leu Thr Trp Arg Cys Cys Pro Trp Cys Leu Thr Glu
1 5 10 15
Asp Glu Lys Ala Ala Ala Arg Val Asp Gln Glu Ile Asn Arg Ile Leu
20 25 30
Leu Glu Gln Lys Lys Gln Asp Arg Gly Glu Leu Lys Leu Leu Leu Leu
35 40 45
Gly Pro Gly Glu Ser Gly Lys Ser Thr Phe Ile Lys Gln Met Arg Ile
50 55 60
Ile His Gly Ala Gly Tyr Ser Glu Glu Glu Arg Lys Gly Phe Arg Pro
65 70 75 80
Leu Val Tyr Gln Asn Ile Phe Val Ser Met Arg Ala Met Ile Glu Ala
85 90 95
Met Glu Arg Leu Gln Ile Pro Phe Ser Arg Pro Glu Ser Lys His His
100 105 110
Ala Ser Leu Val Met Ser Gln Asp Pro Tyr Lys Val Thr Thr Phe Glu
115 120 125
Lys Arg Tyr Ala Ala Ala Met Gln Trp Leu Trp Arg Asp Ala Gly Ile
130 135 140
Arg Ala Cys Tyr Glu Arg Arg Arg Glu Phe His Leu Leu Asp Ser Ala
145 150 155 160
Val Tyr Tyr Leu Ser His Leu Glu Arg Ile Thr Glu Glu Gly Tyr Val
165 170 175
Pro Thr Ala Gln Asp Val Leu Arg Ser Arg Met Pro Thr Thr Gly Ile
180 185 190
Asn Glu Tyr Cys Phe Ser Val Gln Lys Thr Asn Leu Arg Ile Val Asp
195 200 205
Val Gly Gly Gln Lys Ser Glu Arg Lys Lys Trp Ile His Cys Phe Glu
210 215 220
Asn Val Ile Ala Leu Ile Tyr Leu Ala Ser Leu Ser Glu Tyr Asp Gln
225 230 235 240
Cys Leu Glu Glu Asn Asn Gln Glu Asn Arg Met Lys Glu Ser Leu Ala
245 250 255
Leu Phe Gly Thr Ile Leu Glu Leu Pro Trp Phe Lys Ser Thr Ser Val
260 265 270
Ile Leu Phe Leu Asn Lys Thr Asp Ile Leu Glu Glu Lys Ile Pro Thr
275 280 285
Ser His Leu Ala Thr Tyr Phe Pro Ser Phe Gln Gly Pro Lys Gln Asp
290 295 300
Ala Glu Ala Ala Lys Arg Phe Ile Leu Asp Met Tyr Thr Arg Met Tyr
305 310 315 320
Thr Gly Cys Val Asp Gly Pro Glu Gly Ser Lys Lys Gly Ala Arg Ser
325 330 335
Arg Arg Leu Phe Ser His Tyr Thr Cys Ala Thr Asp Thr Gln Asn Ile
340 345 350
Arg Lys Val Phe Lys Asp Val Arg Asp Ser Val Leu Ala Arg Tyr Leu
355 360 365
Asp Glu Ile Asn Leu Leu
370
<210> 53
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 蛋白基序(Protein motif)
<400> 53
Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys
1 5 10
<210> 54
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 蛋白基序(Protein motif)
<400> 54
Phe Ser Thr Cys Ser Ser His
1 5
<210> 55
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 蛋白基序(Protein motif)
<400> 55
Pro Met Leu Asn Pro Phe Ile Tyr
1 5

Claims (15)

1.一种用于鉴定化合物的方法,该化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的嗅觉受体的活性,该方法包括:
a.使受试物质和引起恶臭的物质接触至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的嗅觉受体;
b.通过测量在所述受试物质存在和不存在的情况下所述嗅觉受体的反应来测量所述嗅觉受体对所述引起恶臭的物质的反应;
c.根据测量的在所述受试物质存在和不存在时的反应,鉴定调节所述嗅觉受体反应的受试物质;和
d.选择所鉴定的受试物质作为调节所述嗅觉受体对所述引起恶臭的物质反应的化合物,
其中所述引起恶臭的物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
2.一种用于鉴定恶臭限制剂的方法,包括:
a.使受试物质和引起恶臭的物质与至少一种嗅觉受体接触,其中所述受体包含多肽,该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
b.测量所述嗅觉受体多肽对所述引起恶臭的物质的反应;
c.基于所测量的反应,鉴定能抑制所述嗅觉受体反应的受试物质;和
d.选择抑制所述嗅觉受体反应的受试物质作为恶臭限制剂,
其中所述引起恶臭的物质为DMTS或DMDS。
3.一种用于鉴定化合物的方法,所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的至少一种嗅觉受体的活性,该方法包括:
a.使受体、或其嵌合体或其片段与化合物接触;和
b.确定所述化合物是否对所述受体的活性有影响;
其中所述受体为多肽,该多肽
i)包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;或者
ii)由核酸分子编码,所述核酸分子包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;
其中所述引起恶臭的物质为二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。
4.一种鉴定化合物的方法,推定该化合物调节DMTS或DMDS相关的恶臭,该方法包括:(i)使表达DMTS或DMDS受体多肽的细胞系与至少一种化合物接触;(ii)筛选出结合、抑制、阻断、限制和/或调节所述嗅觉受体多肽活性的化合物;和(iii)如果一种化合物结合、抑制、阻断、限制和/或调节所述DMTS或DMDS受体多肽的活性,则鉴定出推定调节DMTS或DMDS相关恶臭的化合物,
其中所述受体多肽
a.包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12,SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少90%序列同一性的氨基酸序列;或者
b.由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQID NO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列的核酸分子编码。
5.一种分离的多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
6.一种分离的核酸分子,包含:
a.编码权利要求5的多肽的核酸序列;或者
b.与SEQ ID NO:1,SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
7.一种重组核酸分子,包含:
a.包含标签组合的核酸,所述标签组合包含Lucy标签、标签和/或Rho标签中的至少一种;和
b.编码从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的受体的核酸或其互补序列。
8.根据权利要求7所述的重组核酸分子,其中所述Lucy标签包含SEQ ID NO:47,所述标签包含SEQ ID NO:43,以及所述Rho标签包含SEQ ID NO:45。
9.一种表达载体,其包含权利要求6~8中任一项所述的核酸。
10.一种非人宿主生物体或宿主细胞,其经过修饰以表达由DMTS或DMDS激活的受体,其中所述受体
a.从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出;或者
b.包含权利要求5所述的多肽或由权利要求6~8中任一项所述的核酸编码的多肽。
11.一种非人宿主生物体或宿主细胞,包含
a.权利要求6~8中任一项所述的核酸;或者
b.权利要求9所述的表达载体。
12.根据权利要求10或11所述的非人宿主生物体或宿主细胞,其中所述细胞为真核细胞。
13.根据权利要求10~11所述的非人宿主生物体或宿主细胞,其中所述细胞为原核细胞。
14.根据权利要求10~11中任一项所述的非人宿主生物体或宿主细胞,其中所述非人宿主生物体或宿主细胞从由HEK293、CHO、非洲爪蟾卵母细胞、COS、酵母和来自嗅觉基板细胞构成的群组中选出。
15.能被DMTS或DMDS激活的多肽的用途,该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,用于鉴定恶臭调节化合物。
CN201880016397.XA 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法 Active CN110418801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311093055.7A CN117330756A (zh) 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762469256P 2017-03-09 2017-03-09
US62/469256 2017-03-09
PCT/EP2018/055753 WO2018162638A1 (en) 2017-03-09 2018-03-08 Method of identifying malodor modulating compounds

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311093055.7A Division CN117330756A (zh) 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法

Publications (2)

Publication Number Publication Date
CN110418801A true CN110418801A (zh) 2019-11-05
CN110418801B CN110418801B (zh) 2024-02-09

Family

ID=61911520

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880016397.XA Active CN110418801B (zh) 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法
CN202311093055.7A Pending CN117330756A (zh) 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311093055.7A Pending CN117330756A (zh) 2017-03-09 2018-03-08 鉴定恶臭调节化合物的方法

Country Status (7)

Country Link
US (2) US11787847B2 (zh)
EP (1) EP3592766A1 (zh)
JP (2) JP2020510436A (zh)
CN (2) CN110418801B (zh)
BR (1) BR112019018196A2 (zh)
SG (1) SG11201907884XA (zh)
WO (1) WO2018162638A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11813926B2 (en) 2020-08-20 2023-11-14 Denso International America, Inc. Binding agent and olfaction sensor
US11636870B2 (en) 2020-08-20 2023-04-25 Denso International America, Inc. Smoking cessation systems and methods
US11760170B2 (en) 2020-08-20 2023-09-19 Denso International America, Inc. Olfaction sensor preservation systems and methods
US11760169B2 (en) 2020-08-20 2023-09-19 Denso International America, Inc. Particulate control systems and methods for olfaction sensors
US11932080B2 (en) 2020-08-20 2024-03-19 Denso International America, Inc. Diagnostic and recirculation control systems and methods
US11881093B2 (en) 2020-08-20 2024-01-23 Denso International America, Inc. Systems and methods for identifying smoking in vehicles
US11828210B2 (en) 2020-08-20 2023-11-28 Denso International America, Inc. Diagnostic systems and methods of vehicles using olfaction
JP7397917B2 (ja) 2021-06-22 2023-12-13 花王株式会社 嗅覚受容体の発現方法及び応答測定方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016204211A1 (ja) * 2015-06-17 2016-12-22 花王株式会社 スルフィド化合物の臭いの抑制剤の評価又は選択方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003094088A1 (en) * 2001-08-09 2003-11-13 The Trustees Of Columbia University In The City Of New York Mouse olfactory receptor gene superfamily specification
CN105339509A (zh) 2013-06-29 2016-02-17 弗门尼舍有限公司 鉴定、分离并使用气味和芳香受体的方法
CA2987078A1 (en) 2015-06-10 2016-12-15 Firmenich Sa Cell lines for screening odorant and aroma receptors
WO2016201152A1 (en) 2015-06-10 2016-12-15 Firmenich Sa Method of identifying musk compounds
JP6371336B2 (ja) * 2015-06-17 2018-08-08 花王株式会社 ポリスルフィド化合物の臭いの抑制剤
JP6920786B2 (ja) 2015-08-26 2021-08-18 ドイチェス クレブスフォルシュンクスツェントルム 免疫ウイルス療法のためのrnaウイルス

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016204211A1 (ja) * 2015-06-17 2016-12-22 花王株式会社 スルフィド化合物の臭いの抑制剤の評価又は選択方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NP_001011517: "olfactory receptor 1193 [Mus musculus]", 《NCBI数据库》 *

Also Published As

Publication number Publication date
US11787847B2 (en) 2023-10-17
JP2023052694A (ja) 2023-04-11
CN110418801B (zh) 2024-02-09
CN117330756A (zh) 2024-01-02
US20200002399A1 (en) 2020-01-02
US20240117001A1 (en) 2024-04-11
BR112019018196A2 (pt) 2020-07-28
SG11201907884XA (en) 2019-09-27
WO2018162638A1 (en) 2018-09-13
JP2020510436A (ja) 2020-04-09
EP3592766A1 (en) 2020-01-15

Similar Documents

Publication Publication Date Title
CN110418801A (zh) 鉴定恶臭调节化合物的方法
JP6835773B2 (ja) 匂い物質および香り受容体を特定、単離および使用する方法
ES2807440T3 (es) Procedimiento de identificación de compuestos de almizcle
CN111032095A (zh) 鉴定能调节衣物恶臭、发霉恶臭和/或汗液恶臭的化合物的方法
EP3194978A1 (en) Methods for identifying a receptor for a ligand and uses thereof
Verzi et al. N-twist, an evolutionarily conserved bHLH protein expressed in the developing CNS, functions as a transcriptional inhibitor
Ramsden et al. Dual NRF2 paralogs in Coho salmon and their antioxidant response element targets
WO2007121512A1 (en) Insect olfactory receptors
EP3433265B1 (en) Pheromonal receptor of spodoptera littoralis and identification of natural ligand of said receptor and uses thereof
CN101175854A (zh) 鉴定调节雄激素受体与β-联蛋白相互作用的化合物的方法
WO2019062744A1 (zh) 融合多肽
JP5284479B2 (ja) アリルハイドロカーボンレセプター転写活性化量を測定するための細胞、方法およびアッセイキット
WO2023172727A1 (en) Cells derived from polypedilum vanderplanki and odor sensor equipped therewith
Dong et al. Cell-based system for identification of olfactory receptors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant