CN110418801A

CN110418801A - 鉴定恶臭调节化合物的方法

Info

Publication number: CN110418801A
Application number: CN201880016397.XA
Authority: CN
Inventors: P·菲斯特; M·罗杰斯; H-L·考; C·A·阿比比
Original assignee: Firmenich SA
Current assignee: Firmenich SA
Priority date: 2017-03-09
Filing date: 2018-03-08
Publication date: 2019-11-05
Anticipated expiration: 2038-03-08
Also published as: US11787847B2; JP2023052694A; CN110418801B; CN117330756A; US20200002399A1; US20240117001A1; BR112019018196A2; SG11201907884XA; WO2018162638A1; JP2020510436A; EP3592766A1

Abstract

本发明提供了与引起恶臭的物质DMTS结合的多肽。还提供了编码多肽的核酸序列。本发明进一步提供了鉴定化合物的方法，所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质DMTS激活的一种或多种嗅觉受体活性，该方法包括a)使受体、或其嵌合体或其片段与化合物接触；和b)确定化合物是否对受体活性有影响。还提供了一种表达载体，其包含编码所述多肽的核酸，以及非人生物体或宿主细胞，其经修饰以表达被DMTS激活的受体。还提供了多肽用于鉴定恶臭调节化合物的用途。

Description

鉴定恶臭调节化合物的方法

技术领域

技术领域涉及气味和芳香受体以及可用于鉴定气味和/或芳香化合物的试验，更具体地，鉴定恶臭化合物如二甲基三硫化物(DMTS)的抑制剂、调节剂或拮抗剂。

背景技术

嗅觉是人类感官系统中最复杂和最缺少理解的一种。从嗅觉受体(OR)激活到感知，还有许多步骤仍需要进一步研究。如果我们能够理解单个气味剂和混合物的OR代码如何转化为感知，那么我们就可以利用这些知识在几个方面带来显著的益处。这些方面包括：气味调节剂，如恶臭拮抗剂，其可阻止令人不快的气味；新的调味料和香料成分，其替代不可生物降解或有毒的化合物；以及气味增强剂，其会限制我们对天然来源难以获取的源化合物的依赖。“嗅觉代码”组合范例的核心是观察到任何单个OR可以被多种气味剂激活，相反，大多数气味剂能够激活几种OR。在小鼠基因组中，有大约1,200种不同的完整OR。相比之下，人类有大约400种不同的完整OR。在这两种情况下、OR的所有组成部分都被世界上数以千计的气味剂激活，正是这种组合复杂性使我们能够感知到嗅觉的广泛性。然而，截至2014年，使用传统的脱孤法(deorphanization)仅对82种小鼠(～8％)和17种人类OR(～10％)的气味剂或配体进行了鉴定。此外，尚未测试基本上在体外鉴定的大多数配体对人OR的生理相关性。

在WO2014/210585中描述了一种方法，该方法能够快速且可靠地鉴定存在于生物体中的全体OR中的相对一小部分的OR，所述OR由一种或多种气味剂特异性地激活或抑制。然而，使用这种方法，仍然需要鉴定气味受体，更特别地是由特定的引起恶臭物质激活的恶臭受体。

引起恶臭的化合物如二甲基三硫化物(DMTS)和其他密切相关的多硫化合物如二甲基二硫醚(DMDS)会产生令人不快的气味，例如来自厕所和含有粪便物质的其他“盥洗室”来源、或来自口臭。因此，需要结合、抑制、阻断、限制和/或调节由特定恶臭物质如DMTS或DMDS激活的一种或多种嗅觉受体活性的恶臭调节剂或拮抗剂。进一步需要试验，其依赖于这种新的恶臭受体或新鉴定为与特定引起恶臭物质相关的恶臭受体，以鉴定与这些受体结合的新化合物或化合物混合物。

发明内容

本发明提供了一种非人宿主生物体或宿主细胞，其经过修饰以表达由DMTS激活的受体，其中所述受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出。

进一步提供了一种非人宿主生物体或宿主细胞，其经转化以表达包含与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽。

本发明进一步提供了一种表达载体，其包含编码多肽的核酸，所述多肽包含与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

本发明还提供了一种具有核酸的表达载体，其中所述核酸包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQID NO:39，或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

本发明提供了一种包含如上所述的核酸序列的核酸，并且还提供了一种包含如上所述的氨基酸序列的多肽。

本发明进一步提供了一种用于鉴定化合物的方法，该化合物结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性，所述嗅觉受体由引起恶臭物质如二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)激活，其中所述受体是包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ IDNO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽，其中该方法包括：

a)使受体、或其嵌合体或其片段与化合物接触；

b)确定该化合物是否对受体活性有影响。

还提供了一种鉴定化合物的方法，该化合物结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性，所述嗅觉受体由引起恶臭的物质激活，该方法包括：

a.使受试物质和引起恶臭的物质接触至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的嗅觉受体；

b.通过测量在受试物质存在和不存在的情况下嗅觉受体的响应来测量嗅觉受体对引起恶臭的物质的反应；

c.根据在受试物质存在和不存在时测量的响应，鉴定调节嗅觉受体反应的受试物质；和

d.选择鉴定的受试物质作为调节嗅觉受体对引起恶臭物质反应的化合物，

其中引起恶臭物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。

还提供了一种用于鉴定恶臭调节剂的方法，包括：

a.使受试物质和引起恶臭物质与至少一种嗅觉受体接触，其中所述受体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽；

b.测量嗅觉受体多肽对引起恶臭物质的反应；

c.基于所测量的反应，鉴定出能抑制嗅觉受体反应的受试物质；和

d.选择结合、抑制、阻断、限制和/或调节嗅觉受体反应的受试物质作为恶臭调节剂，

另外提供了一种重组核酸分子，其包含：包含Lucy标签、标签和/或Rho标签中的至少一种的核酸，以及编码从Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的受体的核酸或其反向互补序列。

还进一步提供了一种非人宿主生物体或宿主细胞，其经重组修饰以表达如上所述的核酸或多肽。

附图说明

图1表示本发明提到的受体之间的成对氨基酸同一性水平。

图2表示小鼠气味受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738和Olfr742以及人类气味受体OR4S2和OR52N5的DMTS剂量响应曲线。

图3表示人类气味受体OR2L13、OR4C15、OR8H3、OR11G2和OR52N2的DMTS剂量响应曲线。

图4表示对DMTS受体活性具有特异性抑制作用的挥发性化合物的等级。

图5表示小鼠气味受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742和人类气味受体OR4S2的DMTS和DMDS剂量响应曲线。

具体实施方式

对于本发明和所附权利要求的描述，除非另有说明，“或”的使用意指“和/或”。类似地，“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”可以互换使用并且旨在不限制。

还应当理解的是，在描述各个实施方案使用的术语“包含”的情况下，本领域技术人员能够理解，在一些具体情形中，可以替代地使用语言“基本上由……组成”或“由……组成”来描述一个实施方案。

除非另有说明，以下术语具有归属于它们的含义。

“OR”是指在嗅觉细胞中表达的G蛋白偶联受体(GPCR)家族的一个或多个成员。还可以基于形态学或通过嗅觉细胞中特异性表达的蛋白质的表达来鉴定嗅觉受体细胞。OR家族成员可以具有作为嗅觉信号转导受体的能力。

“DMTS OR”或“DMDS OR”是指在嗅觉细胞中表达的G蛋白偶联受体家族的成员，该受体在结合或活性测定中结合和/或被DMTS或DMDS激活以用于鉴定结合和/或激活GPCR的配体。所述测定如下所述。本发明的DMTS或DMDS受体包括片段、变体，包括合成的和天然存在的，以及响应或结合DMTS或DMDS的嵌合体或重组核酸或蛋白质。

认为“OR”多肽是这样的，它们属于由单个～1kb长外显子编码的7-跨膜结构域G蛋白偶联受体超家族并且表现出特征性嗅觉受体特异性氨基酸基序。这七个结构域被称为“跨膜”或称“TM”结构域TM I～TM VII，其通过三个“内部细胞环”或称“IC”结构域IC I～ICIII，以及三个“外部细胞环”或称“EC”结构域EC I～EC III连接。基序及其变体定义为但不限于与TM III和IC II重叠的MAYDRYVAIC基序(SEQ ID NO:53)，与IC III和TM VI重叠的FSTCSSH基序(SEQ ID NO:54)，TM VII中的PMLNPFIY基序(SEQ ID NO:55)以及EC II中的三个保守C残基，以及TM I中高度保守的GN残基的存在[Zhang,X.&Firestein,S.Nat.Neurosci.5,124–133(2002)；Malnic,B.,et al.Proc.Natl.Acad.Sci.U.S.A.101,2584–2589(2004)]。

“OR”核酸编码具有7个具有“G蛋白偶联受体活性”的跨膜区的GPCR家族，例如，它们可响应细胞外刺激而结合G蛋白并通过刺激酶如磷脂酶C和腺苷酸环化酶而促进第二信使如IP3、cAMP、cGMP和Ca²⁺的产生。

“旁系同源”OR基因或“旁系同源物”是基因重复的结果，是指同一物种内密切相关的同源基因。“直系同源”OR基因或“直系同源物”定义为由共同祖先中存在的基因系统发育连接，并且指其他物种中密切相关的同源基因。

“N末端结构域”区域在N末端开始并延伸至靠近第一跨膜区起点的区域。“跨膜区”包含七个“跨膜结构域”，其是指位于质膜内的OR多肽的结构域，并且还可以包括相应的细胞质环(细胞内)和细胞外环。七个跨膜区、细胞外环和细胞质环可以使用标准方法鉴定，例如疏水性分布图，或如Kyte&Doolittle,J.Mol.Biol.,157:105-32(1982)或在Stryer中所描述的。跨膜结构域的一般二级和三级结构，特别是G蛋白偶联受体的七个跨膜结构域，例如嗅觉受体是本领域已知的。因此，可以基于已知的跨膜结构域序列预测一级结构序列，如下文详细描述的。这些跨膜结构域可用于体外配体结合测定。

在测试调节OR家族成员介导的嗅觉转导的化合物的测定中，该语境中的短语“功能性效应”包括确定间接或直接受到受体影响的任何参数，例如功能性、物理的和化学的作用。它包括配体结合、离子通量的变化、膜电位、电流、转录、G蛋白结合、GPCR磷酸化或去磷酸化、信号转导受体-配体相互作用、第二信使浓度(例如，cAMP、cGMP IP3或细胞内Ca²⁺)，体外、体内和离体，还包括其他生理作用，例如神经递质或激素释放的增加或减少。

在测定的语境中“确定功能性效应”或“确认活性”是指化合物的测定，其增加或减少间接或直接受OR家族成员影响的参数，例如功能性、物理性和化学性效应。这些功能性效应可以通过本领域技术人员已知的任何方法测量，例如，光谱特征(例如，荧光、吸光度、折射率)、流体动力学(例如，形状)、色谱或溶解度性质、膜片钳、电压敏感染料、全细胞电流、放射性同位素外排、诱导型标记、卵母细胞OR基因表达的变化；组织培养细胞OR表达；OR基因或活性诱导基因(如egr-1或c-fos)的转录激活；配体结合试验；电压、膜电位和电导变化；离子通量测定；细胞内第二信使如cAMP、cGMP和肌醇三磷酸(IP3)的变化；细胞内钙水平的变化；神经递质释放等。

OR基因或蛋白质的“粘合剂”、“抑制剂”、“阻断剂”、“限制剂”、“激活剂”和/或“调节剂”可互换使用，是指结合、抑制、阻断、限制、激活或调节用于鉴定嗅觉转导的体内、体外和离体测定的分子，例如配体、激动剂、拮抗剂、增强剂及其同源物和模拟物。限制剂(inhibitors)是例如结合、部分或完全阻断刺激、减少、抑制、预防、延迟激活、失活、脱敏或下调嗅觉转导的化合物，例如拮抗剂(antagonists)。激活剂(activators)是例如结合、刺激、增加、开放激活、促进、增强激活、敏化或上调嗅觉转导的化合物，例如激动剂(agonists)。调节剂包括例如改变受体与结合激活剂或限制剂的细胞外蛋白质(例如气味结合蛋白质、ebnerin和疏水性载体家族的其他成员、或脂质运载蛋白家族成员)的相互作用的化合物；G蛋白；激酶(例如，视紫红质激酶和β肾上腺素能受体激酶的同源物，其参与受体的失活和脱敏)；和抑制蛋白，其也使受体失活和脱敏。调节剂还包括改变OR的亲和力或转导功效的化合物，其改变激活剂对OR的作用。调节剂可包括OR家族成员的遗传修饰形式，例如具有改变的活性，以及天然存在的和合成的配体、拮抗剂、激动剂、小化学分子等。限制剂和激活剂的这种测定包括例如，在细胞或细胞膜中表达OR家族成员，在存在或不存在调味料、香料或恶臭分子(例如，如上所述的引起恶臭的物质如DMTS)的情况下应用推定的调节剂化合物，然后确定对嗅觉转导的功能影响。将包含用潜在激活剂、限制剂或调节剂处理的OR家族成员的样品或测定与不含限制剂、激活剂或调节剂的对照样品进行比较，以检查调节程度。对照样品(未用调节剂处理)的相对OR活性值为100％。当OR活性值相对于对照为约80％，任选地为50％，或25～0％时，实现对OR的限制。

本发明所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含本发明化合物通常与其天然状态相关的其他不同化合物的状态，因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5％、1％、5％、10％或20％，最优选至少50％或75％。在一个优选的实施方案中，这些术语是指本发明的化合物占给定样品质量按重量计至少95％。如本发明所用，当提及核酸或蛋白质时，核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”、“分离的”，也指不同于天然存在于哺乳动物，特别是人体中的该核酸或蛋白质的纯化或浓缩状态。任何纯化程度或浓度，只要大于天然存在于哺乳动物，特别是人体中的纯度或浓度，包括(1)从其他相关结构或化合物中的纯化；或(2)与在哺乳动物，特别是人体中通常不相关的结构或化合物的缔合，都在“分离的”的含义内。根据本领域技术人员已知的各种方法和过程，本发明所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的，或如若不然与它们通常在性质上不相关的结构或化合物相缔合。

如本发明所用，术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体，如下文详细描述的。例如，本发明提供用于扩增(例如，通过聚合酶链反应，PCR)天然表达的(例如，基因组DNA或mRNA)或本发明在体内、离体或体外的重组核酸(例如cDNA)的方法和试剂(例如，特异性简并寡核苷酸引物对，寡聚dT引物)。

术语“7-跨膜受体”是指属于跨膜蛋白超家族的多肽，其具有跨越质膜7次的7个结构域(因此，7个结构域被称为“跨膜”或称“TM”结构域TM I～TM VII)。嗅觉和某些味觉受体的家族都属于这个超级家庭。7-跨膜受体多肽具有相似和特征性的一级、二级和三级结构，如下面进一步详细讨论的。

术语“核酸”或“核酸序列”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸寡核苷酸。该术语包括含有天然核苷酸的已知类似物的核酸，即寡核苷酸。该术语还包括具有合成骨架的核酸样结构。除非另有说明，否则特定核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)和互补序列、以及明确指出的序列。具体地，简并密码子取代可以通过产生例如其中一个或多个选定密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现。

除了本发明公开的序列中显示的基因序列之外，变体还包括可能存在于给定群体内的DNA序列多态性，其可能导致本发明公开的多肽的氨基酸序列的变化，这对于本领域技术人员来说是显而易见的。由于天然等位基因变异，这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位变异还可包括功能性等同物。

其他实施方案还涉及通过来自具体公开的核酸的此类序列多态性衍生的分子。这些天然变异通常在基因的核苷酸序列或本发明公开的多肽的氨基酸序列中产生约1～5％的变化。如上所述，编码本发明实施方案的多肽的核酸是修饰旨在用于本发明所述方法的非人宿主生物体或宿主细胞的有用工具。

术语“多肽”、“肽”和“蛋白质”在本发明中可互换使用，是指氨基酸残基的聚合物，无论是否包含天然存在的氨基酸或聚合物和非天然存在的氨基酸或聚合物。当参考核酸的部分使用时，术语“异源的”表示核酸包含两个或更多个在自然界中彼此不存在相同关系的子序列。例如，核酸通常是重组产生的，具有来自无关基因的两个或更多个序列，其被排列以产生新的功能性核酸，例如来自一个来源的启动子和来自另一个来源的编码区。类似地，异源蛋白质表明该蛋白质包含两个或更多个在自然界中彼此不存在相同关系的子序列(例如，融合蛋白)。

“启动子”定义为指导核酸转录的核酸序列阵列。如本发明所用，启动子包括转录起始位点附近的必要核酸序列的TATA盒，例如，在聚合酶II型启动子的情况下。启动子还任选地包括远端增强剂或阻遏元素，其可以位于距转录起始位点数千碱基对的位置。“组成型”启动子是在大多数环境和发育条件下具有活性的启动子。“诱导型”启动子是在环境或发育调节下有活性的启动子。术语“可操作地连接”是指核酸表达控制序列(例如启动子或转录因子结合位点阵列)与第二核酸序列之间的功能性连接，其中表达控制序列指导核酸对应于第二序列的转录。

如本发明所用，“重组体”是指在体外合成或以其他方式操作的多核苷酸(例如，“重组多核苷酸”)；是指使用重组多核苷酸在细胞或其他生物系统产生基因产物的方法；或是指重组多核苷酸编码的多肽(“重组蛋白质”)。“重组体”还意指将具有来自不同来源的各种编码区或结构域或启动子序列的核酸连接到表达盒或载体中，用于表达例如包含本发明的易位结构域的融合蛋白的诱导型或组成型表达和使用引物潜在扩增的核酸序列。“重组体”还指通过基因组编辑技术(例如CRISPR/Cas9)获得的导致内源基因(例如本发明提及的受体基因)稳定或瞬时表达的细胞的修饰。

术语“表达载体”是指用于在体外、离体或体内、组成型或诱导型地在任何细胞中，包括原核、酵母、真菌、植物、昆虫或哺乳动物细胞内表达本发明的核酸序列的任何重组表达系统。该术语包括任何线性或环状表达系统，包括但不限于病毒载体、噬菌体和质粒。技术人员能够根据表达系统选择合适的载体。该术语包括保持附加型或整合到宿主细胞基因组中的表达系统。该表达系统可以具有自我复制或非自我复制的能力，即驱动细胞中的瞬时表达。该术语包括重组“表达盒”，其可含有转录重组核酸所需的最小元素。该术语还涵盖用于通过例如基因组编辑方法(例如CRISPR/Cas9)表达内源基因的盒或载体。

“非人生物体或宿主细胞”是指含有本发明所述核酸或表达载体并支持表达载体复制或表达的非人生物体或细胞。宿主细胞可以是原核细胞，例如大肠杆菌，或真核细胞，例如酵母、昆虫、两栖动物或哺乳动物细胞，例如CHO、HeLa、HEK-293等，例如培养的细胞、外植体和体内细胞。

“标签”(tag)或“标签组合”是指可以添加到气味受体蛋白质中的短多肽序列。通常，将编码“标签”或“标签组合”的DNA添加到编码受体的DNA中，最终产生融合蛋白，其中“标签”或“标签组合”融合到受体的N-末端或C-末端。Lucy、和/或Rho标签可以增强受体向细胞膜的运输，因此可以帮助表达功能性气味受体，用于体外基于细胞的测定[Shepard,B.et al.PLoS One 8,e68758–e68758(2013),and Zhuang,H.&Matsunami,H.J.Biol.Chem.282,15284–15293(2007)]。

在一个实施方案中，本发明提供了分离的核酸分子，其包含与SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在一个实施方案中，本发明提供了如上所述的分离的核酸序列，其编码包含与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽，

在另一个实施方案中，本发明提供了分离的多肽，其包含与SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，非人生物体或宿主细胞经转化以表达包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽。

在一个实施方案中，非人生物体或宿主细胞经转化以表达包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40相同的氨基酸序列的多肽。

本发明进一步提供了表达载体，其包含编码多肽的核酸，所述多肽包含与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

本发明还提供了表达载体，其包含核酸，所述核酸包含与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

本发明还提供了具有核酸的表达载体，其中所述核酸包含与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39或其反向互补序列相同的核苷酸序列。

在一个实施方案中，本发明是一种用于鉴定化合物的方法，所述化合物结合、抑制、阻断、限制和/或调节嗅觉受体的活性，所述嗅觉受体由引起恶臭的物质如二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)激活，其中所述受体为包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽。其中该方法包括：

a)使受体、或其嵌合体或其片段与化合物接触；

b)确定该化合物是否对受体的活性有影响。

在一个实施方案中是一种用于鉴定化合物的方法，所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的嗅觉受体的活性，所述方法包括：

a.使受试物质和引起恶臭的物质与至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的嗅觉受体接触；

c.根据在受试物质存在和不存在时测量的反应，鉴定出调节嗅觉受体反应的受试物质；和

d.选择所鉴定的受试物质作为调节嗅觉受体对恶臭物质反应的化合物，

其中引起恶臭的物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。

在本发明的另一个实施方案中，本发明是一种用于鉴定恶臭调节剂的方法，包括：

a.使受试物质和引起恶臭的物质与至少一种嗅觉受体接触，其中所述受体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽；

b.测量嗅觉受体多肽对引起恶臭的物质的反应；

c.基于所测量的反应，鉴定出能调节或抑制嗅觉受体反应的受试物质；和

d.选择结合、抑制、阻断、限制和/或调节嗅觉受体反应的受试物质作为恶臭调节剂；

其中引起恶臭的物质为二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。

一个实施方案是一种用于鉴定恶臭限制剂的方法，包括：

b.测量嗅觉受体多肽对引起恶臭的物质的反应；

d.选择抑制嗅觉受体反应的受试物质作为恶臭限制剂；

其中引起恶臭的物质为DMTS，恶臭是粪便恶臭或口臭。

一个实施方案是一种鉴定化合物的方法，推定该化合物调节DMTS相关的恶臭，该方法包括：(i)使表达DMTS受体多肽的细胞系与至少一种化合物接触，所述DMTS受体多肽包含与SEQ ID NO:2、ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38或SEQ ID NO:40具有至少90％序列同一性的氨基酸序列；(ii)筛选出结合、抑制、阻断、限制和/或调节所述嗅觉受体多肽的活性的化合物；和(iii)如果一种化合物结合、抑制、阻断、限制和/或调节所述DMTS受体多肽的活性，则鉴定出推定调节DMTS相关恶臭的化合物。

在另一个实施方案中，本发明所述方法中的引起恶臭的物质为二甲基三硫化物(DMTS)。

另外提供了一种重组核酸分子，其包含:

a.包含标签组合的核酸，所述标签组合包含Lucy、和/或Rho标签中的一种或多种；和

b.编码从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出的受体的核酸或其互补序列。

在进一步的实施方案中，Lucy标签包含SEQ ID NO:47，标签包含SEQ IDNO:43，而Rho标签包含SEQ ID NO:45。

进一步提供了许多恶臭调节化合物中的任何一种，其结合、抑制、阻断、限制和/或调节由引起恶臭的物质如二甲基三硫化物(DMTS)激活的嗅觉受体的活性，并且通过本发明公开的方法鉴定。

在一个实施方案中，本发明是一种恶臭调节化合物，其结合、抑制、阻断、限制和/或调节至少一种嗅觉受体的活性，所述嗅觉受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出，并且通过本发明公开的方法鉴定。

另一个实施方案涉及由DMTS或DMDS激活或可以被其激活的多肽的用途，所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO：14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，用于鉴定一种恶臭调节化合物，该化合物结合、抑制、阻断、限制和/或调节嗅觉受体的活性。

还进一步提供了一种经重组修饰以表达上述多肽的细胞。

在一个实施方案中，本发明是一种非人宿主生物体或宿主细胞，其已经转化或修饰以表达由DMTS激活的受体，所述受体从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742，Olfr207、Olfr665、Olfr669、Olfr1211、OR4S2、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出。

在一个实施方案中，本发明是一种非人宿主生物体或宿主细胞，其已经转化或修饰以表达由DMTS激活的受体，其中所述受体包含如本发明所述的多肽或由本发明所述的核酸编码的多肽。

在本发明的另一个实施方案中，本发明是一种非人宿主生物体或宿主细胞，其包含如本发明所述的核酸或表达载体。

在一个实施方案中，本发明提供一种细胞，其中所述细胞为原核细胞。在另一个实施方案中，本发明提供的细胞为一种真核细胞。在一个具体实施方案中，本发明提供的细胞由从酵母细胞和植物细胞构成的群组中选出。在本发明提供的更具体的一个实施方案中，所述细胞由从HEK293、CHO、非洲爪蟾卵母细胞(Xenopus oocytes)、COS、酵母、细菌和源自嗅觉基板的细胞构成的群组中选出。

为了鉴定未知的DMTS或DMDS特异性受体，DMTS和DMDS可用于筛选解离的嗅觉感觉神经元(OSN)。DMTS和DMDS可进一步用于对特定DMTS或DMDS受体进行的基于细胞的剂量反应实验，以评估受体的特异性和敏感性。

在一个方面，本发明提供鉴定用于恶臭调节化合物的哺乳动物气味受体的方法以及用于筛选的受体的用途，特别是用于恶臭调节剂的高通量筛选(HTS)(该调节剂例如结合、抑制、阻断、限制和/或调节OR的活性)。

本发明特别提供的是小鼠受体，例如，Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr669、Olfr665、Olfr207、Olfr1211，及其人类对应物OR4S2、OR5T1、OR8H3、OR2L13、OR2AJ1、OR11G2、OR52N5、OR52N2、OR5AC2和OR4C15，作为引起恶臭的物质DMTS、DMDS或其他多硫化合物的受体，如表1所示。

表1.直系同源小鼠和人类气味受体对及其在氨基酸水平上的相应同一性。

小鼠直系同源物	人类直系同源物	氨基酸同一性
			Olfr1193	OR4S2	90％
Olfr1093	OR5T1	77％
			Olfr1097	OR8H3	70％
Olfr166	OR2L13	85％
			Olfr169	OR2AJ1	72％
Olfr738	OR11G2	79％
			Olfr742	OR11G2	74％
Olfr669	OR52N5	87％
			Olfr665	OR52N2	77％
Olfr207	OR5AC2	64％
			Olfr1211	OR4C15	83％

虽然不希望受任何理论束缚，但小鼠受体Olfr738是受体Olfr742的旁系同源物，而人类受体OR11G2是这些小鼠受体的直系同源物；小鼠受体Olfr669是受体Olfr665的旁系同源物和人类受体OR52N5的直系同源物；而小鼠受体Olfr665是人类受体OR52N2的直系同源物。在WO2014/210585中，先前已将几种受体鉴定为吲哚和/或粪臭素反应性气味受体。然而，这些受体先前未与引起恶臭的物质DMTS或DMDS或其他相关的多硫化物化合物相关联。吲哚和粪臭素与多硫化合物没有化学相关性，因此基于化学结构的方法如结构-活性-关系(SAR)以鉴定其他配体不会将DMTS定义为这些受体的潜在拮抗剂。

在另一个实施方案中，用于监测嗅觉受体活性的指示剂选自荧光钙指示剂染料、钙指示剂蛋白、荧光cAMP指示剂、细胞流动测定、细胞动态质量再分布测定、基于无标记的细胞测定、cAMP反应元件(CRE)介导的报告蛋白、生物化学cAMP HTRF测定、β-抑制蛋白测定或电生理学记录。特别地，选择钙指示剂染料可用于监测在嗅觉神经元(例如，Fura-2AM)的膜上表达的嗅觉受体的活性。

在一个具体的实施方案中，依次筛选化合物，并使用荧光显微镜或荧光激活细胞分选仪(FACS)测量钙染料荧光的气味依赖性变化。

在另一个实施方案中，嗅觉受体的分子3D受体模型用于评估计算机中的结合潜力并鉴定可以激活、模拟、阻断、限制、调节和/或增强嗅觉受体活性的化合物。

例如，使用连接到显微操纵器的玻璃微电极或FACS机器来分离由DMTS或DMDS激活的嗅觉神经元。通过Ca²⁺成像筛选小鼠嗅觉感觉神经元，类似于先前描述的程序[Malnic,B.,et al.Cell 96,713–723(1999)；Araneda,R.C.et al.J.Physiol.555,743–756(2004)；和WO2014/210585，其全部内容通过引用并入本发明。特别地，使用电动可移动显微镜台来增加每个实验可筛选的数量至至少1,500个细胞。由于小鼠中约有1,200种不同的嗅觉受体，并且每种嗅觉感觉神经元仅表达1,200种嗅觉受体基因中的1种，因此该筛选能力几乎涵盖整个小鼠气味受体库。换言之，用于高通量嗅觉感觉神经元筛选的钙成像的组合导致几乎所有气味受体的识别，其响应于特定的气味特征。在一个特定方面，可以分离响应DMTS或DMDS的气味受体。例如，分离至少一个神经元。

对于嗅觉神经元的钙成像，可以在神经元解离之前从小鼠解剖主要的嗅觉上皮细胞。然后可以将解剖的嗅觉上皮细胞转移到解离缓冲液中进行机械和酶促解离。然后可以将解离的神经元接种到盖玻片上，允许通过荧光显微镜筛选数千个细胞，并且可以在例如约30分钟、31℃下将细胞加载钙敏感染料(Fura-2AM)并转移到显微镜准备筛查。通过在解离的嗅觉神经元上灌注稀释的气味剂溶液(在生理盐水中)来刺激细胞。通过例如用50μm的恶臭化合物刺激受体，然后通过监测由Fura-2荧光的变化指示的细胞内Ca²⁺通量来鉴定响应恶臭化合物的稀有细胞。在分析之后，可以使用抽吸微量移液管从玻璃盖玻片取回响应细胞。然后将分离的细胞合并到一个样品中或单独处理以随后鉴定在响应细胞中表达为mRNA的气味剂受体基因。

在一个具体的实施方案中，根据Marko,N.F.,et al.,(2005)A robust methodfor the amplification of RNA in the sense orientation。BMC genomics,6,27；doi:10.1186/1471-2164-6-27(Eberwine方法)中通常描述的方法纯化和扩增嗅觉神经元的mRNA。使用下一代测序(NGS)技术对至少一部分转录组(直至包括整个转录组)进行测序或使用微阵列技术与已知基因杂交。NGS通常在Metzker,M.L.Nat.Rev.Genet.11,31–46(2010)中讨论和描述。在具体的实施方案中，汇集至少5个呈现相同响应谱的神经元。挑选后立即通过细胞裂解释放mRNA；没有DNA酶，也没有进行纯化步骤。通过连续两轮体外转录(IVT)来扩增mRNA。扩增可以根据MesageAmpII aRNA试剂盒(Ambion，AMA1751)进行，参数如下：两轮连续14小时长IVT。

在另一个实施方案中，使用基于LD-PCR(长距离聚合酶链式反应)的方法纯化和扩增单个嗅觉神经元的mRNA，例如在NGS-ready试剂盒中描述的方法(例如，Clontech/Takara， Low Input RNA Kit for Sequencing-v3，目录号634848)。首先将单细胞mRNA逆转录成相应的cDNA，随后用18个PCR循环扩增，并用作转录组测序的NGS样品。

在另一个实施方案中，通过将从分离的激活的嗅觉感觉神经元获得的NGS读数的结果与相同物种的参考基因组序列进行比较，确定DMTS嗅觉受体的组或基因家族的同一性(例如，多达所挑选的神经元的数量)。特别地，推定的DMTS受体将是嗅觉神经元衍生的NGS样品中最高度丰富的嗅觉受体mRNA，或存在于多于一个的独立的生物复制品中。由于嗅觉代码的组合性质(一种化合物激活许多OR，而一种OR可被许多化合物激活)，汇集由给定化合物激活的几种神经元，允许在单个NGS实验中检索几乎所有负责感知这些分子的受体。因此，汇集功能相似的神经元极大地提高了脱模吞吐量和速度。

然后使用标准生物信息学工具在假设同源序列受体保留相似功能的情况下鉴定与其他推定的哺乳动物(非人)DMTS受体最密切相关的人类气味受体。几种方法基于该假设[Armelin-Correa and Malnic(2017)]成功鉴定人OR-配体对，并且高达80％的小鼠-人类直系同源物似乎保持相似的功能反应谱[Adipietro,K.A,et al.PLoS Genet.8,e1002821–e1002821(2012)]。可以使用BLASTP和/或BLASTN算法的默认参数，或其他直系同源对识别算法，例如InParanoid。

人类或非人类哺乳动物DMTS受体可适用于功能测定，其可用于鉴定结合、抑制、阻断、限制和/或调节嗅觉受体活性的化合物。特别地，该测定可以是基于细胞的测定或结合测定，而用于鉴定化合物的方法可以是高通量筛选测定。更具体地，本发明提供了基于受体的测定，其适于用化合物文库高通量筛选受体，以发现调节化合物(例如，结合、阻断、抑制、限制和掩蔽)。

在一个具体的实施方案中，DMTS受体基因序列从如下DMTS敏感细胞鉴定：将汇集的神经元加热至75℃10分钟以破坏细胞膜并使其mRNA可用于扩增。当在有限量的起始材料下(通常为1～15个细胞)应用NGS技术时，该扩增步骤是重要的。根据Eberwine方法(IVT)的线性扩增确保维持表达基因的相对转录水平。连续两轮过夜(14h)的体外转录用于产生足够量的cRNA；然后使用扩增的cRNA产生Illumina HiSeq cDNA文库。得到的通常为75～150个碱基对的短序列(通常称为“读段”(reads))与小鼠的参考基因组(例如UCSC版本mm9或mm10)对齐，以构建这些细胞的完整转录组。转录组数据的定量分析产生转录的气味受体基因列表及其各自的表达水平。显示最丰富的mRNA水平(最丰富的“读段”)或存在于一次以上重复实验中的气味受体基因被认为是推定的DMTS受体。

然后使用预测的小鼠OR基因挖掘小鼠和人类基因组数据库的最新版本，以鉴定小鼠(旁系同源基因)和人类(直系同源基因)中最密切相关的受体(即最高序列相似性)。该过程可以使用BLAST搜索算法(在NCBI网站上公开获得)，一种序列相似性搜索工具，其中先前从初始转录组分析获得的每个推定的基因序列被用作查询序列。在认为旁系同源和直系同源基因极有可能具有相似活性的假设下，从该数据挖掘过程中鉴定的新鉴定的基因被认为是潜在的DMTS受体。在一个具体的实施方案中，进行序列同源性的成对比较以鉴定小鼠和人类中密切相关的受体，并如WO2014/210585中所述鉴定受体。也可以使用其他方法，例如RT-PCR和微阵列方法。

在另一个实施方案中，为了完成脱孤法，在体外进一步表达候选OR基因，以确认针对用于分离嗅觉感觉神经元和其他结构相关的目标化合物的化合物的活性。从对DMTS起反应的分离的嗅觉神经元中鉴定的小鼠受体在其N-末端用短多肽序列(例如，(SEQID NO:44)、Rho(SEQ ID NO:46；牛视紫红质受体的头20个氨基酸)和/或Lucy(SEQ ID NO:48；可裂解的亮氨酸信号肽序列)标签)，在HEK 293T细胞中瞬时表达，并用DMTS分别刺激以证实它们作为真正的DMTS受体的身份。在另一个实施方案中，无论是通过内源RTP1基因的激活还是通过转化，RTP1基因也可以在细胞系中表达。在该基于细胞的测定中，人类Gα亚基Gα_olf的共表达激活Gs转导途径，其导致在与合适的配体结合后内部cAMP增加。或者，在基于细胞的测定中，人类Gα亚基Gα₁₅的共表达激活Gq转导途径，其导致在与合适的配体结合后内部Ca²⁺增加。上述过程和迄今为止获得的结果用于验证快速和可靠地鉴定DMTS或DMDS的哺乳动物气味受体的过程。

还提供了用于鉴定与DMTS或DMDS气味受体结合的化合物的测定方法。在另一个实施方案中，本发明提供了一种恶臭调节化合物，其结合、抑制、阻断、限制和/或调节至少一种从由Olfr1193、Olfr1093、Olfr1097、Olfr166、OR52N5、OR2L13、OR4C15、OR5AC2、OR8H3、OR11G2和OR52N2所构成的群组中选出的嗅觉受体的活性，并且通过本发明描述的方法鉴定，例如，图4中描述的化合物。

在一个实施方案中，化合物的活性通过比较其与DMTS或DMDS的结合来确定。在另一个实施方案中，在允许化合物与DMTS或DMDS结合到受体上的条件下，使受体、或其嵌合体或其片段在DMTS或DMDS存在下与化合物接触。

在另一个实施方案中，使化合物与由DMTS或DMDS激活的受体、或其嵌合体或其片段接触，其中所述受体、或其嵌合体或其片段在经重组修饰以表达受体多肽的细胞中表达。

可以使用体内、离体、体外和合成筛选系统来测定化合物的活性。

在另一个实施方案中，用含有本发明所述多肽的脂质体或病毒诱导的芽殖膜(budding membranes)进行接触。

在另一个实施方案中，用于鉴定结合、抑制、阻断、限制和/或调节可由DMTS或DMDS激活的嗅觉受体活性的化合物的方法可以在完整细胞或来自表达本发明描述的多肽的细胞的膜部分、或在培养物中被修饰以表达内源或外源气味受体的嗅觉感觉神经元上进行。

因此，本发明所述的21种OR参与DMTS或DMDS引发的恶臭的感知，并且构成用于鉴定调节剂、拮抗剂和/或阻断剂的有价值的候选受体，所述调节剂、拮抗剂和/或阻断剂将调节、减少、抑制、限制和/或阻断恶臭的感知。

本发明鉴定和/或使用的核酸和氨基酸序列如下：

Olfr1193

DNA-SEQ ID NO:1

atggcctcaaggacttattccatggaagaagtaaataatgtcactgaattcattttcttgggtctttctcagaaccctgaggttgaaaaagtgtgctttgtggtgttctccttcttttacatggtcattctgctaggaaacctcctcatcatgttgacagtttgcagtggcaatcttttcaagtttcccatgtattttttcctcaactttctgtcttttgtggacatttgctactcctcagtcacagcacccaagatgattattgacctgttagtgaagaaaaagactatatcctatgtggggtgcatgttacaactctttgtggttcatttctttggttgcactgagatcttcattcttactgtcatggcctatgatagatatgtggccatttgtaaacctctccactatatgactatgatggaccgggaaagatgcaataagatgttgctcggaacatggatcggtggcttcttacattctattatccaagtggctcttgtggtccagctccccttttgtggaccgaatgagattgatcactatttctgtgatgtacatcctgtactgaaacttgcctgcactgacacttacattgttggtatttttgtgacagcaaacagtggcaccattgcattgggaagttttgtcatcttgctgatctcatacacagtcattctcatgtctctgagaaagcagtcatctgaaggcagacgcaaagctctctccacttgtggatcccacattgctgttgtcatcattttttttggcccctgtacttttatgtatatgcggcctgacactaccttctctgaggacaagatggtagctatattttacaccattatcactcccatgctgaatcctctaatttacactctaagaaatgcagaagtaaagaatgcaatgagaaaactgtgggctagaaagttttcctgggaaactactgggaaatag

蛋白质-SEQ ID NO:2

MASRTYSMEEVNNVTEFIFLGLSQNPEVEKVCFVVFSFFYMVILLGNLLIMLTVCSGNLFKFPMYFFLNFLSFVDICYSSVTAPKMIIDLLVKKKTISYVGCMLQLFVVHFFGCTEIFILTVMAYDRYVAICKPLHYMTMMDRERCNKMLLGTWIGGFLHSIIQVALVVQLPFCGPNEIDHYFCDVHPVLKLACTDTYIVGIFVTANSGTIALGSFVILLISYTVILMSLRKQSSEGRRKALSTCGSHIAVVIIFFGPCTFMYMRPDTTFSEDKMVAIFYTIITPMLNPLIYTLRNAEVKNAMRKLWARKFSWETTGK

Olfr1093

DNA-SEQ ID NO:3

atggaaaagatcacatcagctgtggatgtccacaatattccattaaagaacatgactgaagccaccatgtttattctcttaggattcacagatgactttgaactccaagtcttcctgtttttactgtttcttgctatttatctcttcactctggtaggaaactttggactggttgttttggtcattggggattgtcggctacacaaccccatgtactatttcctaagtgttttgtctttcctggatgcttgctattctacagttgttacacccaaaatgttggtcaactttctaagtgaaaataagtccatttcattccttgcatgtgcaacccaaatgcttctctttgtttcgttgggaaccacagaatgctttctcctggcagcaatggcttatgaccgatatgtagccatctacaacccacttctgtatacagtggccatgtcacccagagtatacctgccactcatcattgcttcctatgctggtggagttgtgcatggtgctatccacacagtggccactttcagtctgtccttctgtggatccaatgaaattaagcatgtcttctgtgacatccctgcattgcttgctctttcttgttctgatacccacacaaatgagcttctagtcttgtacttggtgggcttgattgagattgttaccatcctgattgttctggtctcctatggattcatcctctttgccattctgaacatgcattctgctgagggtaggaggaaagtgttctctacatgtggctctcacctcactggagtctctatttaccatggtacaatccttttcacttatatgaggcctagttccagttatgcttcaaatcatgacatggtagtgtcaatattttacaccattgtgatacccatgttgaatcctatcatctatagtttgaggaacaaagatgtaaaagtagcatttaataaattgtggagaaaatgtgattcataa

蛋白质-SEQ ID NO:4

MEKITSAVDVHNIPLKNMTEATMFILLGFTDDFELQVFLFLLFLAIYLFTLVGNFGLVVLVIGDCRLHNPMYYFLSVLSFLDACYSTVVTPKMLVNFLSENKSISFLACATQMLLFVSLGTTECFLLAAMAYDRYVAIYNPLLYTVAMSPRVYLPLIIASYAGGVVHGAIHTVATFSLSFCGSNEIKHVFCDIPALLALSCSDTHTNELLVLYLVGLIEIVTILIVLVSYGFILFAILNMHSAEGRRKVFSTCGSHLTGVSIYHGTILFTYMRPSSSYASNHDMVVSIFYTIVIPMLNPIIYSLRNKDVKVAFNKLWRKCDS

Olfr1097

DNA-SEQ ID NO:5

atgagtgcctgtaatcatacaaatgaacctgagttcacgcttgtgggactgacagactccaaggagattcagctggtcctctctgttttgtttctcctgatatacatgctcactgtcttgggaaacataggtatgatactgatcattcatctagatgtccagctccacactccaatgtattttttcctcacccacttgtcattccttgacctcagttactcaactgtaatcacacctaaaaccttacagaatacgctgacctccataaaaaatatttccttcatgggatgcttcacccagttgtatttctttgtcctcttggcagcttctgaatgttttatactttcgtcaatggcctatgaccgctatgtagctatctgcaaccctctacactatccagttattatgtcccctaggcgctcatatactctcatcactgtgtcctacatgattggagttttggattcttctgtcactgtcttttgcttaagcacactggatttctgcaactccaaagtaattcatcacttcttttgtgacacattcccaattttagctctgtcctgcagtgatacctataatgcagaagccactatattcgttttagctggttccactctattgctgtcgctcatcacgatatcctcatcctatgtatctattctctctacaattttgaagataaattcttcttcaggaaagcacaaagccttctctacatgtgcctcacatcttataggagtcactgttttttatggtacaatgatctttacttatttaaaaccaagtacgtcctactccctgggaaaggatcaagtagcctctgttttttatactatagtgattcccatgctgaacccacttatctatagtctcaggaacaaagaagtgaaaagtgctgttgttagagttatgaagaagagagagtgcatccagaaactagaataa

蛋白质-SEQ ID NO:6

MSACNHTNEPEFTLVGLTDSKEIQLVLSVLFLLIYMLTVLGNIGMILIIHLDVQLHTPMYFFLTHLSFLDLSYSTVITPKTLQNTLTSIKNISFMGCFTQLYFFVLLAASECFILSSMAYDRYVAICNPLHYPVIMSPRRSYTLITVSYMIGVLDSSVTVFCLSTLDFCNSKVIHHFFCDTFPILALSCSDTYNAEATIFVLAGSTLLLSLITISSSYVSILSTILKINSSSGKHKAFSTCASHLIGVTVFYGTMIFTYLKPSTSYSLGKDQVASVFYTIVIPMLNPLIYSLRNKEVKSAVVRVMKKRECIQKLE

Olfr166

DNA-SEQ ID NO:7

atggagaaatggaatcagagctcaagtgattttactctgttaggactgcttccacaaaaccaaacaggcctgctacttttgatgctcatcatctttgtcttctctctggctttgtgtggcaactcaggaatgatccacctcattcgtgtggatccaaggctccacacccccatgtactttctcctcagtcagctctctctcatggacctgatgtacatttctaccactgttcccaagatggcatttaacttcctttctggccagaaaagcatctcttttctgggctgtggagtgcaatccttcttcttcctgactatggcatgttctgagggcttgctcttggcttccatggcttatgatcgttttgtggctatctgccatccccttcactatcccattcgcatgagcaaaataatgtgtctgaagatgatcataggatcctggatattgggctcaatcaactctttagcacataccgtctatgcccttcatattccttactgccattctaggtccattaaccatttcttctgtgatgttccagccatgttgcccctggcctgtatggacacttgggtttatgagtacatggtgtttgtgagcacaagcctgtttctcctactgcctttccttggtatcacagcttcctatggtcgggtcctttttgctgtcttccacatgcgctcaaaagagggaaagaagaaggccttcaccacatgctcaactcacttaactgtggtgacattttactatgcaccttttgtctatacctatcttcgacctaggagtcttcgctccccaacagaagataagattctggctgttttctacactatccttacccccatgctcaaccccatcatttatagtctgaggaataaggaggtcctgggggccatgacaagagtccttggtacttttccttcaactaaaccgtaa

蛋白质-SEQ ID NO:8

MEKWNQSSSDFTLLGLLPQNQTGLLLLMLIIFVFSLALCGNSGMIHLIRVDPRLHTPMYFLLSQLSLMDLMYISTTVPKMAFNFLSGQKSISFLGCGVQSFFFLTMACSEGLLLASMAYDRFVAICHPLHYPIRMSKIMCLKMIIGSWILGSINSLAHTVYALHIPYCHSRSINHFFCDVPAMLPLACMDTWVYEYMVFVSTSLFLLLPFLGITASYGRVLFAVFHMRSKEGKKKAFTTCSTHLTVVTFYYAPFVYTYLRPRSLRSPTEDKILAVFYTILTPMLNPIIYSLRNKEVLGAMTRVLGTFPSTKP

Olfr169

DNA-SEQ ID NO:9

atggaatatgagaactacacttttaacagcgacttcatcctcttgggactgttctcttcttcaaagacaagcttaacttttttctcatttatatttttcatttttattatggctataacagaaaatgccctcatgatcctcctaatccacagggattctcgactccataccccaatgtatttcctgcttagtcatctctccttcatggatatcttgcacatttccaacattgttcctaaaatgattgctgacttcctctcaggcagcagaactatttcctttgcaggctgtgccttccagatatttctctctcttaccttgctaggtggtgagtgccttctcctggcagccatgtcctatgatcgatatgtggccatctgccacccacttcgctaccctgtgctgatgagggataactccagtaggctcctggctgcaggctcctggctggtggggatcctcaactccatagtacacacagtttttgcactccactttcccttctgccactcaagagccattgatcactttttctgcgaagtccctgccatgttgaaattgtcatgtatagacacaacacactatgaacgaggcgtttatgtgagtggcattatttttctgctgatcccattttccatgatctctatatcttatgtgcaaattctcctcactgtattccaaatgcagtcatcaggggcccggcaaaagtccttttccacctgttccttccacatggttgttgtcataatgtactatgggccattcatttttacatatatgagacctcgctcataccacactccagggcaggataaatttttggcaatattctacaccatcctgacacccacactcaaccccataatctacagctttcgtaataaagatgtccttatggctgtgaaaaacatcgtccaaagtaattttttgaataaaaaatga

蛋白质-SEQ ID NO:10

MEYENYTFNSDFILLGLFSSSKTSLTFFSFIFFIFIMAITENALMILLIHRDSRLHTPMYFLLSHLSFMDILHISNIVPKMIADFLSGSRTISFAGCAFQIFLSLTLLGGECLLLAAMSYDRYVAICHPLRYPVLMRDNSSRLLAAGSWLVGILNSIVHTVFALHFPFCHSRAIDHFFCEVPAMLKLSCIDTTHYERGVYVSGIIFLLIPFSMISISYVQILLTVFQMQSSGARQKSFSTCSFHMVVVIMYYGPFIFTYMRPRSYHTPGQDKFLAIFYTILTPTLNPIIYSFRNKDVLMAVKNIVQSNFLNKK

Olfr738

DNA-SEQ ID NO:11

atgaaagcctttagcagccccagcaactccagcatcatcactggcttcatcctcctgggcttcccctgccccaaggaggggcaaatcctcctctttgtgctcttcttcattatctacatccttaccctcatgggcaatgcttccatcatatgtgctgtgtgctatgataagaaacttcacagccccatgtacctcctgctggccaacttctccttcctagaaatctggtatgtcacctccacagtccccaacatgttggccaacttcctctctgacacgaaggtcatctctttctctggatgcttcctgcagttctatttcttcttctccttgggttctacagaatgctttttcctggcagtcatggcatttgatcgataccttgccatctgcagacctctacattatccttctctcatgactgggcgcctctgcaacatccttgtgatcagttgctgggtgcttggtttcctctggttccctgttcccatcatcatcatctcccaaatgtccttctgtggatccagaattatagaccacttcctgtgtgacccaggccctctgttggccctcacctgtgtgagaaattctttaattgagatgactagctctactttaagttccctgcttttatttgttccatttttttttatcatggggtcttatgctctagtaatgagggctgtgctcagggtcccttcagcagctggacgaagaaaggccttctccacctgtgggtcacacttgactgtggtttctcttttctatggctcagtgatggtcatgtatgtgagcccaacatctgaacatgcagctggagtgcaaaaacttgtgactctgttttattctgtggttactcccctccttaatcctgtgatatacagtctgaggaacagagatatgaaacatgcaatgaaaaagttactgaaaatgtaa

蛋白质-SEQ ID NO:12

MKAFSSPSNSSIITGFILLGFPCPKEGQILLFVLFFIIYILTLMGNASIICAVCYDKKLHSPMYLLLANFSFLEIWYVTSTVPNMLANFLSDTKVISFSGCFLQFYFFFSLGSTECFFLAVMAFDRYLAICRPLHYPSLMTGRLCNILVISCWVLGFLWFPVPIIIISQMSFCGSRIIDHFLCDPGPLLALTCVRNSLIEMTSSTLSSLLLFVPFFFIMGSYALVMRAVLRVPSAAGRRKAFSTCGSHLTVVSLFYGSVMVMYVSPTSEHAAGVQKLVTLFYSVVTPLLNPVIYSLRNRDMKHAMKKLLKM

Olfr742

DNA-SEQ ID NO:13

Atgaaaaccctcagcagccccagcaactccagcaccatcactggcttcatcctcttgggcttcccctgccccagggaggggcaaatcctcctctttgtgaccttcttcattgtttacatactcattcttatgggcaatgcttccatcatctgtgctgtgtactgtgatcagagcctccacacccccatgtacttcctgctggccaacttctccttcctggagatctggtatgtcacctccacagtccccaacatgttggccaacttcctttcagacaccaaggtcatctctttctctggatgcttcctgcagttctatttcttcttctcctttggttctacagaatgctttttcctggcagtcatggcatttgatcgataccttgccatctgtaggccactacattatccttctctcatgactgggcacctctgcaacatccttgtgatcagttgctgggtgcttggtttcctctggttccctgtacccatcatcatcatctcccagatgtccttctgtgggtccagaattatagaccacttcctgtgtgacccaggccctcttttggcccttgcctgttccagagccccattgatggaggttttctggacaattataatgtctatgctcctggttattcctttcctcttcatcatgggaacttacatattggtcctaagagctgtgtttagacttccttcaagagatggacaaaaaaaggccttctccacttgcgggtctcatctcacagtagtttcactcttttattgctcagtgatgaaaatgtatttgagcccaacatctgagcatgaagctggaatgcagaagcttgtaactctattttattctgtgggtactccactacttaatcctgtgatatacagtctgaggaacaaagatatgaaaaatgccctgcagaagattttaagaacataa

蛋白质-SEQ ID NO:14

MKTLSSPSNSSTITGFILLGFPCPREGQILLFVTFFIVYILILMGNASIICAVYCDQSLHTPMYFLLANFSFLEIWYVTSTVPNMLANFLSDTKVISFSGCFLQFYFFFSFGSTECFFLAVMAFDRYLAICRPLHYPSLMTGHLCNILVISCWVLGFLWFPVPIIIISQMSFCGSRIIDHFLCDPGPLLALACSRAPLMEVFWTIIMSMLLVIPFLFIMGTYILVLRAVFRLPSRDGQKKAFSTCGSHLTVVSLFYCSVMKMYLSPTSEHEAGMQKLVTLFYSVGTPLLNPVIYSLRNKDMKNALQKILRT

Olfr207

DNA-SEQ ID NO:15

atggaactgaacaggacccagctgactgaatttgttctcagaggaataacagatcgttcagagctgcaagtccccctgttcctggtgttctttctcatctatgttatcaccatggtgggcaaccttggcttaatctttgtcatctggaaggaccctcatcttcacacacccatgtaccttttccttggaaatttggcctttgctgatgcctgtaattcatcctctgtgacaccaaagatgcttatgaaatttttaaataagaatgacatgatatccatgggtgagtgttttgctcaattttatttcttttgttcaagtgtaactgcagaagccttcattctggtagctatggcctatgaccgctatgtagccatatgcaaacctctgctctatgtagtggtgatgtccaacagactctgtattcagttcataggtgtatcctatctaattggacttctacatggcttacttcatgtaggattgttatttaggttaacgttttgtagttccaatgtaatagattatttctactgtgacatcctgccactttataggatttcttgcactgacccatcgatcaatgtactggtagctttcattatgggtattttattacaagtgagtacctttatgagtattatagtctcctatgtccgtgtcctctttgccatcctgagaacaaagtctgagaggggcagaaacaaagccttctctacttgcagttcccacctgtcatctgtgtctttgttctatggcactctcttcatcatatatgtcctctctggctctgacacagataattatcagggtaaaatgtattcactgttctataccattatcattcctctgctaaaccccttcatttacagcctaagaaataaagaagtcatcggtgccttgagaaaagtcagaaaatga

蛋白质-SEQ ID NO:16

MELNRTQLTEFVLRGITDRSELQVPLFLVFFLIYVITMVGNLGLIFVIWKDPHLHTPMYLFLGNLAFADACNSSSVTPKMLMKFLNKNDMISMGECFAQFYFFCSSVTAEAFILVAMAYDRYVAICKPLLYVVVMSNRLCIQFIGVSYLIGLLHGLLHVGLLFRLTFCSSNVIDYFYCDILPLYRISCTDPSINVLVAFIMGILLQVSTFMSIIVSYVRVLFAILRTKSERGRNKAFSTCSSHLSSVSLFYGTLFIIYVLSGSDTDNYQGKMYSLFYTIIIPLLNPFIYSLRNKEVIGALRKVRK

Olfr665

DNA-SEQ ID NO:17

atgcctggggtcaatacctccagcctgacaccaagatactttattctcaatgggattcctgggttggaagctgcacacatctggatctctctgccattcttcattatgtacctcattgctgtcacaggtaactgtggacttatctacctcatcagtcatgaggaggctctgcaccggcccatgtactactttctagccatgttgtctgctacagatatttctgggtgtaatacaattgtccccagtatgttatgcatcttttggttcagtgtcaaggagattgatttcaatgcctgccttgtacagatgtttttcatccacatgttaacaggcatggagtctggtgtgctcatgcttatggctctcgaccgctatgtggctatatgctatccattacgctatactaccatactcaccaacactatgattaccaagattggattggcagcacttgttagaagtgtgttactcatggtcccttttgctttcctgatcaagcgtcttccatactgtagaggaaacctcatccaacatacctattgtgatcacatggctgtggctaaactatcctgtggcaatattaagattaatgctatctatggtcttataattgctatatttattgggggttttgatatattctgtatctccatgtcttatgccatgattatccatgctgtggtgaagctatcttcggcagatgctcgccataaagccttcagtacctgtacatcacacatatgtgctattgttattacctatgtcccagcattcttcaacttctttactcatcgctttgggagaaccactataccccatcatatccacattattatagccaacctgtatctattgctacctcccaccttgaatccaattgtatatggagtaaagaccaagcagattcgtgaaggtgtgatcaaactgtttgctagacaaaaagttgtttga

蛋白质-SEQ ID NO:18

MPGVNTSSLTPRYFILNGIPGLEAAHIWISLPFFIMYLIAVTGNCGLIYLISHEEALHRPMYYFLAMLSATDISGCNTIVPSMLCIFWFSVKEIDFNACLVQMFFIHMLTGMESGVLMLMALDRYVAICYPLRYTTILTNTMITKIGLAALVRSVLLMVPFAFLIKRLPYCRGNLIQHTYCDHMAVAKLSCGNIKINAIYGLIIAIFIGGFDIFCISMSYAMIIHAVVKLSSADARHKAFSTCTSHICAIVITYVPAFFNFFTHRFGRTTIPHHIHIIIANLYLLLPPTLNPIVYGVKTKQIREGVIKLFARQKVV

Olfr669

DNA-SEQ ID NO:19

atgctgatttccaacaactcatatgaagccccgcagtctttcattcttaatggaattcctggtctcgaagcagtgcatatatggatctctcttccactctgtacaatgtacatcatctccctagtaggcaaccttggccttgtatatctcatttactatgaggaatccttacatcgcccaatgtatttctttctggccatgctttctctcatagacctgtttacttgcacaaccactgtccccaatgccctcttcattttctggttcaaactcaaggaaattaacttcactgcttgcctagttcagatgttctttgtgcacggattcacaggtgtggagtctggggtactcatgctcatggccttggaccgctatgtggccatttgctacccactacgctatgcaaccatacttaccaaccctgtcattgccaaagctgggcttgccaccttcttgagaggtgtgttactgatgattccttttccattcttggttaaacgtttgcccttctgccgaagcaatgtcatctcccatacatattgtgaccacatgtctgtggtaaagttatcctgtgccagcatcaaaatcaatgtcatctatggtctcatggttgcacttctgattggagtgtttgacatatgttgtatatctgtgtcctacactatgatcctccgggcagtggtcagcctgtcctctgcagatgctcggcagaaggccttcagcacctgcacagcccacatatctgccatcatcattacttatgttccagccttcttcaccttctttactcatcgttttggaggtcacaccatccctccttctcttcatatcattgtggctaatctttatcttcttctccctccaactctaaatcccattgtttatgggatgaagaccaaacagatcagagatagtatcattaaattctttcacggtgaaaaaggttcaaggtga

蛋白质-SEQ ID NO:20

MLISNNSYEAPQSFILNGIPGLEAVHIWISLPLCTMYIISLVGNLGLVYLIYYEESLHRPMYFFLAMLSLIDLFTCTTTVPNALFIFWFKLKEINFTACLVQMFFVHGFTGVESGVLMLMALDRYVAICYPLRYATILTNPVIAKAGLATFLRGVLLMIPFPFLVKRLPFCRSNVISHTYCDHMSVVKLSCASIKINVIYGLMVALLIGVFDICCISVSYTMILRAVVSLSSADARQKAFSTCTAHISAIIITYVPAFFTFFTHRFGGHTIPPSLHIIVANLYLLLPPTLNPIVYGMKTKQIRDSIIKFFHGEKGSR

Olfr1211

DNA-SEQ ID NO:21

atgcaaaaccagagttttgtaacagaattcatattccttggactttcacagaaccctaaagtccagaaaatagtttttattgtatttttatttgtctacattgcaactgttgggggcaacatgataattgtggtgaccattgtctgtagcccagcattgatagactgccccatgtacttctttttggcattcttgtccctattggatgcatgcttctcttctgtcatcacaccaaagatggttgtggactccctgtatgagaagaaaactatctcctttgaaggatgtatgatgcagttatttgctgagcacttccttgcagcagtagaagtgattgtcttgacagccatggcctatgaccgctatgtagcaatttgcaagcccttgcactactcttccatcatgaactggaggctctgtggcacacttatggggatagcatggacagggggcttcttgcattctatcatacaaattatcttcacgttgcaattgcccttctgtggaccaaatgtcatcgatcatttcatgtgtgacttgttcccattactggaacttgcctgcactgatactcatatctttggccttttagtggttgccaacagtgggtctatctgcatcataatcttctctattttgctggtctcctatggtgtcatcctgttctctctgaaagctcacagttctgaagggcgatggaaagctctctccacatgtggatcccacattgcagttgtggttttgttctttgtcccgtgtatatttatttatgcacgtcctccatctgctttctcctttgataaaatggtggcgatattttatactatcctaactcccttgctcaatcctgtgatttatacttttcggaataaggacatgaaaaatgctatgaagaaagtgtggaagaggttggcagtggtttctgatggaaagtga

蛋白质-SEQ ID NO:22

MQNQSFVTEFIFLGLSQNPKVQKIVFIVFLFVYIATVGGNMIIVVTIVCSPALIDCPMYFFLAFLSLLDACFSSVITPKMVVDSLYEKKTISFEGCMMQLFAEHFLAAVEVIVLTAMAYDRYVAICKPLHYSSIMNWRLCGTLMGIAWTGGFLHSIIQIIFTLQLPFCGPNVIDHFMCDLFPLLELACTDTHIFGLLVVANSGSICIIIFSILLVSYGVILFSLKAHSSEGRWKALSTCGSHIAVVVLFFVPCIFIYARPPSAFSFDKMVAIFYTILTPLLNPVIYTFRNKDMKNAMKKVWKRLAVVSDGK

OR52N5

DNA-SEQ ID NO:23

atgcctctatttaattcattatgctggtttccaacaattcatgtgactcctccatcttttattcttaatggaatacctggtctggaaagagtacatgtatggatctccctcccactctgcacaatgtacatcatcttccttgtggggaatcttggtcttgtgtacctcatttattatgaggagtccttacatcatccgatgtattttttttttggccatgctctctccctcattgacctccttacctgcaccaccactctacccaatgcactctgcatcttctggttcagtctcaaagaaattaacttcaatgcttgcttggcccagatgttctttgttcatgggttcacaggtgtggagtctggggtgctcatgctcatggctctagaccgctatgtagccatttgctaccctttgcgttatgctaccacactcaccaaccctatcattgccaaggctgagcttgccaccttcctgaggggtgtattgctgatgattcctttcccattcttggttaagcgtttgcctttctgccaaagcaatattatctcccatacgtactgcgaccacatgtctgtagtaaagctatcttgtgccagcatcaaggtcaatgtaatctatggtctaatggttgctctcctgattggagtgtttgacatttgttgtatatctttgtcttacactttgatcctcaaggcagcgatcagcctctcttcatcagatgctcggcagaaggctttcagcacctgcactgcccatatatctgccatcatcatcacctatgttccagcattcttcactttctttgcccaccgttttgggggacacacaattcccccttctcttcacatcattgtggctaatctttatcttcttcttcccccaactctaaaccctattgtttatggagtaaagacaaaacagatacgcaagagtgtcataaagttcttccagggtgataagggtgcaggttga

蛋白质-SEQ ID NO:24

MPLFNSLCWFPTIHVTPPSFILNGIPGLERVHVWISLPLCTMYIIFLVGNLGLVYLIYYEESLHHPMYFFFGHALSLIDLLTCTTTLPNALCIFWFSLKEINFNACLAQMFFVHGFTGVESGVLMLMALDRYVAICYPLRYATTLTNPIIAKAELATFLRGVLLMIPFPFLVKRLPFCQSNIISHTYCDHMSVVKLSCASIKVNVIYGLMVALLIGVFDICCISLSYTLILKAAISLSSSDARQKAFSTCTAHISAIIITYVPAFFTFFAHRFGGHTIPPSLHIIVANLYLLLPPTLNPIVYGVKTKQIRKSVIKFFQGDKGAG

OR2L13

DNA-SEQ ID NO:25

atggagaaatggaatcacacttcaaatgatttcattttgttgggtctgcttcccccaaatcaaactggaatatttctcttgtgccttatcatcctcatattctttctggcctcggtgggtaactcggccatgattcacctcatccacgtggatcctcgtctccacacaccgatgtactttcttctcagccagctctcccttatggacctgatgtacatctccaccaccgtccccaagatggcgtacaacttcctgtccggccagaaaggcatctccttcctgggatgtggtgtgcaaagcttcttcttcctgaccatggcgtgttctgaaggcttactcctgacctccatggcctacgaccgttatttggccatctgccactctctctattatcctatccgcatgagtaaaatgatgtgtgtgaagatgattggaggctcttggacactggggtccatcaactccttggcacacacagtctttgcccttcatattccctactgcaggtctagggctattgaccatttcttctgcgatgtcccagccatgttgcttcttgcctgtacagatacttgggtctatgaatatatggtttttgtaagtacaagcctctttctccttttccctttcattggcatcacttcttcctgtggccgagtcctatttgctgtctatcatatgcactcaaaggaggggagaaaaaaggccttcaccaccatttcaacacatttaactgtagtgatcttttactatgcaccttttgtctacacctatcttcggcccaggaatctccgctcaccagctgaagacaagatcctggcagtcttctacaccatccttacccccatgctcaatcccattatctacagcctgaggaataaggaagtcctgggggctatgaggagagtgtttgggatattctctttcctgaaagaataa

蛋白质-SEQ ID NO:26

MEKWNHTSNDFILLGLLPPNQTGIFLLCLIILIFFLASVGNSAMIHLIHVDPRLHTPMYFLLSQLSLMDLMYISTTVPKMAYNFLSGQKGISFLGCGVQSFFFLTMACSEGLLLTSMAYDRYLAICHSLYYPIRMSKMMCVKMIGGSWTLGSINSLAHTVFALHIPYCRSRAIDHFFCDVPAMLLLACTDTWVYEYMVFVSTSLFLLFPFIGITSSCGRVLFAVYHMHSKEGRKKAFTTISTHLTVVIFYYAPFVYTYLRPRNLRSPAEDKILAVFYTILTPMLNPIIYSLRNKEVLGAMRRVFGIFSFLKE

OR2AJ1

DNA-SEQ ID NO:27

atgagtgtaacagaaaatacgctcatgatcctcctcattcgcagtgactcccgactccacactccaatgtattttctgctcagccatctctccttaatggatatcttgcatgtttccaacatcgttcccaaaatggtcactaactttctgtcaggcagcagaactatttcatttgcaggttgtgggttccaggtatttctgtccctcaccctcctgggtggtgagtgccttctcctggctgcaatgtcctgtgatcgctatgtggctatctgtcacccgctgcgctatccgattcttatgaaggagtatgccagcgctctcatggctggaggctcctggctcattggggttttcaactccacagtccacacagcttatgcactgcagtttcccttctgtggctctagggcaattgatcacttcttctgtgaagtccctgccatgttgaagttgtcctgtgcagacacaacacgctatgaacgaggggtttgtgtaagtgctgtgatcttcctgctgatccctttctccttgatctctgcttcttatggccaaattattcttactgtcctccagatgaaatcatcagaggcaaggaaaaagtcattttccacttgttccttccacatgattgtggtcacgatgtactatgggccatttatttttacatatatgagacctaaatcataccacactccagggcaggataagttcctggcaatattctatacgatcctcacacccacactcaaccctttcatctacagctttaggaataaagatgttctggcggtgatgaaaaatatgctcaaaagtaactttctgcacaaaaaaatgaataggaaaattcctgaatgtgtgttctgtctatttctatgttaa

蛋白质-SEQ ID NO:28

MSVTENTLMILLIRSDSRLHTPMYFLLSHLSLMDILHVSNIVPKMVTNFLSGSRTISFAGCGFQVFLSLTLLGGECLLLAAMSCDRYVAICHPLRYPILMKEYASALMAGGSWLIGVFNSTVHTAYALQFPFCGSRAIDHFFCEVPAMLKLSCADTTRYERGVCVSAVIFLLIPFSLISASYGQIILTVLQMKSSEARKKSFSTCSFHMIVVTMYYGPFIFTYMRPKSYHTPGQDKFLAIFYTILTPTLNPFIYSFRNKDVLAVMKNMLKSNFLHKKMNRKIPECVFCLFLC

OR4C15

DNA-SEQ ID NO:29

atgttctcaatgacaacagaagcactcaataattttgcacttggatgtaccaacttgttaatgactatgataccacaaattgatctgaagcaaattttcctttgtcctaattgcagactatacatgatccctgttggagctttcatcttttccttgggaaacatgcaaaaccaaagctttgtaactgagtttgtcctcctgggactttcacagaatccaaatgttcaggaaatagtatttgttgtatttttgtttgtctacattgcaactgttgggggcaacatgctaattgtagtaaccattctcagcagccctgctcttctggtgtctcctatgtacttcttcttgggcttcctgtccttcctggatgcgtgcttctcatctgtcatcaccccaaagatgattgtagactccctctatgtgacaaaaaccatctcttttgaaggctgcatgatgcagctctttgctgaacacttctttgctggggtggaggtgattgtcctcacagccatggcctatgatcgttatgtggccatttgcaagcccttgcattactcttctatcatgaacaggaggctctgtggcattctgatgggggtagcctggacagggggcctcttgcattccatgatacaaattctttttactttccagcttcccttttgtggccccaatgtcatcaatcactttatgtgtgacttgtacccgttactggagcttgcctgcactgatactcacatctttggcctcatggtggtcatcaacagtgggtttatctgcatcataaacttctccttgttgcttgtctcctatgctgtcatcttgctctctctgagaacacacagttctgaagggcgctggaaagctctctccacctgtggatctcacattgctgttgtgattttgttctttgtcccatgcatatttgtatatacacgacctccatctgctttttcccttgacaaaatggcggcaatattttatatcatcttaaatcccttgctcaatcctttgatttacactttcaggaataaggaagtaaaacaggccatgaggagaatatggaacagactgatggtggtttctgatgagaaagaaaatattaaactttaa

蛋白质-SEQ ID NO:30

MFSMTTEALNNFALGCTNLLMTMIPQIDLKQIFLCPNCRLYMIPVGAFIFSLGNMQNQSFVTEFVLLGLSQNPNVQEIVFVVFLFVYIATVGGNMLIVVTILSSPALLVSPMYFFLGFLSFLDACFSSVITPKMIVDSLYVTKTISFEGCMMQLFAEHFFAGVEVIVLTAMAYDRYVAICKPLHYSSIMNRRLCGILMGVAWTGGLLHSMIQILFTFQLPFCGPNVINHFMCDLYPLLELACTDTHIFGLMVVINSGFICIINFSLLLVSYAVILLSLRTHSSEGRWKALSTCGSHIAVVILFFVPCIFVYTRPPSAFSLDKMAAIFYIILNPLLNPLIYTFRNKEVKQAMRRIWNRLMVVSDEKENIKL

OR5AC2

DNA-SEQ ID NO:31

atggatatatcagagggaaataagactcttgtgacagagtttgttctcacaggacttacagatcgaccatggctgcacgtcctcttctttgttgtgtttttggtggtctatctcatcaccatggtgggcaaccttggactgatagttctaatttggaacgacccccatcttcatatgcccatgtacttattccttggtggtttagccttttcagatgcttgtacttcaacctctataacccctaggatgctggtcaatttcttagacaagactgcaatgatatccctagctgagtgcatcacccagttttacttttttgcttccagtgcaactacagaatgcttcctcctggtgatgatggcctatgaccgctatgtagccatatgtaatcccttgctttatccagtgatgatgtccaacaaactcagcgctcagttgctaagtatttcatatgtaattggtttcctgcatcctctggttcatgtgagtttactattgcgactaactttctgcaggtttaacataatacattatttctactgtgaaattttacaactgttcaaaatttcatgcaatggtccatctattaacgcactaatgatatttatttttggtgcttttatacaaatacccactttaatgactatcataatctcttatactcgtgtgctctttgatattctgaaaaaaaagtctgaaaagggcagaagcaaagccttctccacatgcggcgcccatctgctttctgtctcattgtactacggaactctgatcttcatgtatgtgcgtcctgcatctggcttagctgaagaccaagacaaagtgtattctctgttttacacgattataattcccctgctaaacccatttatttacagcttgagaaataaaaaagtcatgcatgcattgagaagagttataaggaagtaa

蛋白质-SEQ ID NO:32

MDISEGNKTLVTEFVLTGLTDRPWLHVLFFVVFLVVYLITMVGNLGLIVLIWNDPHLHMPMYLFLGGLAFSDACTSTSITPRMLVNFLDKTAMISLAECITQFYFFASSATTECFLLVMMAYDRYVAICNPLLYPVMMSNKLSAQLLSISYVIGFLHPLVHVSLLLRLTFCRFNIIHYFYCEILQLFKISCNGPSINALMIFIFGAFIQIPTLMTIIISYTRVLFDILKKKSEKGRSKAFSTCGAHLLSVSLYYGTLIFMYVRPASGLAEDQDKVYSLFYTIIIPLLNPFIYSLRNKKVMHALRRVIRK

OR8H3

DNA-SEQ ID NO:33

atgatgggtagaaggaatgacacaaatgtggctgacttcatccttacgggactgtcagactctgaagaggtccagatggctctgtttatgctatttctcctcatatacctaattactatgctggggaatgtggggatgctattgataatccgcctggacctccagcttcacactcccatgtattttttccttactcacctgtcatttattgacctcagttactcaactgtcgtcacacctaaaaccttagcgaacttactgacttccaactatatttccttcacgggctgctttgcccagatgttctgttttgtcttcttgggtactgctgaatgttatcttctctcctcaatggcctatgatcgctatgcagcgatctgcagtcctctacactacacagttattatgcccaaaaggctctgcctcgctctcatcactgggccttatgtgattggctttatggactcctttgtcaatgtggtttccatgagcagattgcatttctgtgactcaaacataattcatcactttttctgtgacacttccccaattttagctctgtcctgcactgacacagacaacactgaaatgctgatattcattatcgctggttccaccctgatggtgtcccttatcacaatatctgcatcctatgtgtccattctctctaccatcctgaaaattaattccacttcaggaaagcagaaagctttctctacttgcgtctctcatctcttgggagtcaccatcttctatggaactatgatttttacttacttaaagccaagaaagtcttattccttgggaagagatcaagtggctcctgtgttttatactattgtgattcccatgctgaatccactcatttatagtcttagaaacagagaagtgaaaaatgctctcattagagtcatgcagagaagacaggactccaggtag

蛋白质-SEQ ID NO:34

MMGRRNDTNVADFILTGLSDSEEVQMALFMLFLLIYLITMLGNVGMLLIIRLDLQLHTPMYFFLTHLSFIDLSYSTVVTPKTLANLLTSNYISFTGCFAQMFCFVFLGTAECYLLSSMAYDRYAAICSPLHYTVIMPKRLCLALITGPYVIGFMDSFVNVVSMSRLHFCDSNIIHHFFCDTSPILALSCTDTDNTEMLIFIIAGSTLMVSLITISASYVSILSTILKINSTSGKQKAFSTCVSHLLGVTIFYGTMIFTYLKPRKSYSLGRDQVAPVFYTIVIPMLNPLIYSLRNREVKNALIRVMQRRQDSR

OR11G2

DNA-SEQ ID NO:35

atgaaaatcttcaacagccccagcaactccagcaccttcactggcttcatcctcctgggcttcccttgccccagggaggggcagatcctcctctttgtgctcttcactgttgtttacctcctgaccctcatgggcaatggttccatcatctgtgctgtgcactgggatcagagactccacgcccccatgtacatcctgctcgccaacttctccttcttggagatatgttatgtcacctccacagtccccagcatgctggccaacttcctctctgacaccaagatcatctcgttctctggctgcttcctccagttctactttttcttctccttgggctctacagaatgctttttcctggcagttatggcatttgatcgataccttgccatctgtcggcctctacgctatccaaccattatgaccagacgtctctgtaccaatcttgtggtcaattgctgggtacttggtttcatctggttcttgattcctatcgtcaacatctcccaaatgtccttctgtggatctaggattattgaccacttcctatgtgacccagctcctcttctaactctcacttgcaaaaaaggccctgtgatagagcttgtcttttctgtcttaagtcctctgcctgtctttatgctctttctcttcattgtggggtcctatgctctggtcgtgagagctgtgttgagggtcccttcagcagctgggagaagaaaggctttctccacctgtgggtctcacctggctgtggtttcactgttctacggctcagtactggtcatgtatgggagcccaccatctaagaatgaagctggaaagcagaagactgtgactctgttttattctgttgttaccccactgcttaaccctgtgatatatagtcttaggaacaaagatatgagaaaagctctgaagaaattttggggaacataa

蛋白质-SEQ ID NO:36

MKIFNSPSNSSTFTGFILLGFPCPREGQILLFVLFTVVYLLTLMGNGSIICAVHWDQRLHAPMYILLANFSFLEICYVTSTVPSMLANFLSDTKIISFSGCFLQFYFFFSLGSTECFFLAVMAFDRYLAICRPLRYPTIMTRRLCTNLVVNCWVLGFIWFLIPIVNISQMSFCGSRIIDHFLCDPAPLLTLTCKKGPVIELVFSVLSPLPVFMLFLFIVGSYALVVRAVLRVPSAAGRRKAFSTCGSHLAVVSLFYGSVLVMYGSPPSKNEAGKQKTVTLFYSVVTPLLNPVIYSLRNKDMRKALKKFWGT

OR52N2

DNA-SEQ ID NO:37

atgtctggggacaacagctccagcctgaccccaggattctttatcttgaatggcgttcctgggctggaagccacacacatctggatctccctgccattctgctttatgtacatcattgctgtcgtggggaactgtgggctcatctgcctcatcagccatgaggaggccctgcaccggcccatgtactacttcctggccctgctctccttcactgatgtcaccttgtgcaccaccatggtacctaatatgctgtgcatattctggttcaacctcaaggagattgactttaacgcctgcctggcccagatgttttttgtccatatgctgacagggatggagtctggggtgctcatgctcatggccctggaccgctatgtggccatctgctaccccttacgctatgccaccatccttaccaaccctgtcatcgccaaggctggtcttgccaccttcttgaggaatgtgatgctcatcatcccattcactctcctcaccaagcgcctgccctattgccgggggaacttcatcccccacacctactgtgaccatatgtctgtggccaaggtatcctgtggcaatttcaaggtcaatgctatttatggtctgatggttgctctcctgattggtgtgtttgatatctgctgtatctctgtatcttacactatgattttgcaggctgttatgagcctgtcatcagcagatgctcgtcacaaagccttcagcacctgcacatctcacatgtgttccattgtgatcacctatgttgctgcttttttcacttttttcactcatcgttttgtaggacacaatatcccaaaccacatacacatcatcgtggccaacctttatctgctactgcctcctaccatgaacccaattgtttatggagtcaagaccaagcagattcaggaaggtgtaattaaatttttacttggagacaaggttagttttacctatgacaaatga

蛋白质-SEQ ID NO:38

MSGDNSSSLTPGFFILNGVPGLEATHIWISLPFCFMYIIAVVGNCGLICLISHEEALHRPMYYFLALLSFTDVTLCTTMVPNMLCIFWFNLKEIDFNACLAQMFFVHMLTGMESGVLMLMALDRYVAICYPLRYATILTNPVIAKAGLATFLRNVMLIIPFTLLTKRLPYCRGNFIPHTYCDHMSVAKVSCGNFKVNAIYGLMVALLIGVFDICCISVSYTMILQAVMSLSSADARHKAFSTCTSHMCSIVITYVAAFFTFFTHRFVGHNIPNHIHIIVANLYLLLPPTMNPIVYGVKTKQIQEGVIKFLLGDKVSFTYDK

OR5T1

DNA-SEQ ID NO:39

atgtttatattaataagcttcacagaagaatttgatgtgcaagtcttcctatttttattatttttagcaatctatctattcactctaataggcaatttagggctggttgtaccgatcattggggatttctggcttcacagcccaatgtactattttcttggtgttttatcattcttggatgtctgctattctacagttgtcactccaaaaatgttggtcaatttcctggcaaaaaataaatctatttcatttcttggatgtgcaacacagatgtttcttgcttgtacttttggaaccacagaatgctttctcttggctgcaatggcttatgatcgctatgtagccatctacaaccctctcctgtattcagtgagcatgtcacccagagtctatgtgccactcatcactgcttcctatgttgctagcattttacatgctactatacatacagtggctacatttagcctgtccttctgtggatccaatgaaattaggcatgtcttttgtaatatgcctcctctccttgctatttcttgttctgacactcacgtaatccagcttctattcttctactttgtgggctctattgagatagtcactatcctgattgtcctgatctcctatggttttattctgttggccattctgaagatgcagtctgctgaagggaggagaaaagtcttctctacatgtggagctcacctaactggagtgacaatttatcatgggacaatcctcttcatgtatgtgagaccaagttccagctacacttcggacaatgacatgatagtgtcaatattttataccattgtgattcccatgctgaatcccatcatctacagtttgcggaacaaagatgtaaaggaggcaatcaaaagattgcttgtgagaaattggttcataaataagttatag

蛋白质-SEQ ID NO:40

MFILISFTEEFDVQVFLFLLFLAIYLFTLIGNLGLVVPIIGDFWLHSPMYYFLGVLSFLDVCYSTVVTPKMLVNFLAKNKSISFLGCATQMFLACTFGTTECFLLAAMAYDRYVAIYNPLLYSVSMSPRVYVPLITASYVASILHATIHTVATFSLSFCGSNEIRHVFCNMPPLLAISCSDTHVIQLLFFYFVGSIEIVTILIVLISYGFILLAILKMQSAEGRRKVFSTCGAHLTGVTIYHGTILFMYVRPSSSYTSDNDMIVSIFYTIVIPMLNPIIYSLRNKDVKEAIKRLLVRNWFINKL

OR4S2

DNA-SEQ ID NO:41

atggaaaaaataaacaacgtaactgaattcattttctggggtctttctcagagcccagagattgagaaagtttgttttgtggtgttttctttcttctacataatcattcttctgggaaatctcctcatcatgctgacagtttgcctgagcaacctgtttaagtcacccatgtatttctttctcagcttcttgtcttttgtggacatttgttactcttcagtcacagctcccaagatgattgttgacctgttagcaaaggacaaaaccatctcctatgtggggtgcatgttgcaactgtttggagtacatttctttggttgcactgagatcttcatccttactgtaatggcctatgatcgttatgtggctatctgtaaacccctacattatatgaccatcatgaaccgggagacatgcaataaaatgttattagggacgtgggtaggtgggttcttacactccattatccaagtggctctggtagtccaactacccttttgtggacccaatgagatagatcactacttttgtgatgttcaccctgtgttgaaacttgcctgcacagaaacatacattgttggtgttgttgtgacagccaacagtggtaccattgctctggggagttttgttatcttgctaatctcctacagcatcatcctagtttccctgagaaagcagtcagcagaaggcaggcgcaaagccctctccacctgtggctcccacattgccatggtcgttatctttttcggcccctgtacttttatgtacatgcgccctgatacgaccttttcagaggataagatggtggctgtattttacaccattatcactcccatgttaaatcctctgatttatacactgagaaatgcagaagtaaagaatgcaatgaagaaactgtggggcagaaatgttttcttggaggctaaagggaaatag

蛋白质-SEQ ID NO:42

MEKINNVTEFIFWGLSQSPEIEKVCFVVFSFFYIIILLGNLLIMLTVCLSNLFKSPMYFFLSFLSFVDICYSSVTAPKMIVDLLAKDKTISYVGCMLQLFGVHFFGCTEIFILTVMAYDRYVAICKPLHYMTIMNRETCNKMLLGTWVGGFLHSIIQVALVVQLPFCGPNEIDHYFCDVHPVLKLACTETYIVGVVVTANSGTIALGSFVILLISYSIILVSLRKQSAEGRRKALSTCGSHIAMVVIFFGPCTFMYMRPDTTFSEDKMVAVFYTIITPMLNPLIYTLRNAEVKNAMKKLWGRNVFLEAKGK

tag

DNA-SEQ ID NO:43

gattacaaggacgacgacgataag

蛋白质-SEQ ID NO:44

DYKDDDDK

Rho tag

DNA-SEQ ID NO:45

atgaacgggaccgagggcccaaacttctacgtgcctttctccaacaagacgggcgtggtg

蛋白质-SEQ ID NO:46

MNGTEGPNFYVPFSNKTGVV

Lucy tag

DNA-SEQ ID NO:47

atgagaccccagatcctgctgctcctggccctgctgaccctaggcctggct

蛋白质-SEQ ID NO:48

MRPQILLLLALLTLGLA

人类G-蛋白α亚基G_olf

DNA-SEQ ID NO:49

atgggtctgtgctacagtctgcggccgctgcttttcgggggcccaggggacgacccctgcgcggcctcggagccgccggtggaggacgcgcagcccgccccggccccggccctggccccagtccgggcggccgcaagggacacggcccggaccctgctccctcggggcggcgaagggagcccggcatgcgctcggcccaaagcagacaagccgaaggagaagcggcagcgcaccgagcagcttagtgccgaggagcgcgaggcggccaaggagcgcgaggcggtcaaggaggcgaggaaagtgagccggggcatcgaccgcatgctgcgcgaccagaagcgcgacctgcagcagacgcaccggctcctgctgctcggggctggtgagtctgggaaaagcactatcgtcaaacagatgaggatcctgcacgtcaatgggtttaatcccgaggaaaagaaacagaaaattctggacatccggaaaaatgttaaagatgctatcgtgacaattgtttcagcaatgagtactataatacctccagttccgctggccaaccctgaaaaccaatttcgatcagactacatcaagagcatagcccctatcactgactttgaatattcccaggaattctttgaccatgtgaaaaaactttgggacgatgaaggcgtgaaggcatgctttgagagatccaacgaataccagctgattgactgtgcacaatacttcctggaaagaatcgacagcgtcagcttggttgactacacacccacagaccaggacctcctcagatgcagagttctgacatctgggatttttgagaacgattccaagtggacaaagtaaacttccacatgtttgatgttggtggccagagggatgagaggagaaaatggatccagtgctttaacgatgtcacagctatcatttacgtcgcagcctgcagtagctacaacatggtgattcgagaagataacaacaccaacaggctgagagagtccctggatctttttgaaagcatctggaacaacaggtggttacggaccatttctatcatcttgttcttgaacaaacaagatatgctggcagaaaaagtcttggcagggaaatcaaaaattgaagactatttcccagaatatgcaaattatactgttcctgaagacgcaacaccagatgcaggagaagatcccaaagttacaagagccaagttctttatccgggacctgtttttgaggatcagcacggccaccggtgacggcaaacattactgctacccgcacttcacctgcgccgtggacacagagaacatccgcagggtgttcaacgactgccgcgacatcatccagcggatgcacctcaagcagtatgagctcttgtga

蛋白质-SEQ ID NO:50

MGLCYSLRPLLFGGPGDDPCAASEPPVEDAQPAPAPALAPVRAAARDTARTLLPRGGEGSPACARPKADKPKEKRQRTEQLSAEEREAAKEREAVKEARKVSRGIDRMLRDQKRDLQQTHRLLLLGAGESGKSTIVKQMRILHVNGFNPEEKKQKILDIRKNVKDAIVTIVSAMSTIIPPVPLANPENQFRSDYIKSIAPITDFEYSQEFFDHVKKLWDDEGVKACFERSNEYQLIDCAQYFLERIDSVSLVDYTPTDQDLLRCRVLTSGIFETRFQVDKVNFHMFDVGGQRDERRKWIQCFNDVTAIIYVAACSSYNMVIREDNNTNRLRESLDLFESIWNNRWLRTISIILFLNKQDMLAEKVLAGKSKIEDYFPEYANYTVPEDATPDAGEDPKVTRAKFFIRDLFLRISTATGDGKHYCYPHFTCAVDTENIRRVFNDCRDIIQRMHLKQYELL

人类G-蛋白α亚基Gα15

DNA-SEQ ID NO:51

atggcccggtcgctgacctggcgctgctgcccctggtgcctgacggaggatgagaaggccgccgcccgggtggaccaggagatcaacaggatcctcttggagcagaagaagcaggaccgcggggagctgaagctgctgcttttgggcccaggcgagagcgggaagagcaccttcatcaagcagatgcggatcatccacggcgccggctactcggaggaggagcgcaagggcttccggcccctggtctaccagaacatcttcgtgtccatgcgggccatgatcgaggccatggagcggctgcagattccattcagcaggcccgagagcaagcaccacgccagcctggtcatgagccaggacccctataaagtgaccacgtttgagaagcgctacgctgcggccatgcagtggctgtggagggatgccggcatccgggcctgctatgagcgtcggcgggaattccacctgctcgattcagccgtgtactacctgtcccacctggagcgcatcaccgaggagggctacgtccccacagctcaggacgtgctccgcagccgcatgcccaccactggcatcaacgagtactgcttctccgtgcagaaaaccaacctgcggatcgtggacgtcgggggccagaagtcagagcgtaagaaatggatccattgtttcgagaacgtgatcgccctcatctacctggcctcactgagtgaatacgaccagtgcctggaggagaacaaccaggagaaccgcatgaaggagagcctcgcattgtttgggactatcctggaactaccctggttcaaaagcacatccgtcatcctctttctcaacaaaaccgacatcctggaggagaaaatccccacctcccacctggctacctatttccccagtttccagggccctaagcaggatgctgaggcagccaagaggttcatcctggacatgtacacgaggatgtacaccgggtgcgtggacggccccgagggcagcaagaagggcgcacgatcccgacgcctcttcagccactacacatgtgccacagacacacagaacatccgcaaggtcttcaaggacgtgcgggactcggtgctcgcccgctacctggacgagatcaacctgctgtga

蛋白质-SEQ ID NO:52

MARSLTWRCCPWCLTEDEKAAARVDQEINRILLEQKKQDRGELKLLLLGPGESGKSTFIKQMRIIHGAGYSEEERKGFRPLVYQNIFVSMRAMIEAMERLQIPFSRPESKHHASLVMSQDPYKVTTFEKRYAAAMQWLWRDAGIRACYERRREFHLLDSAVYYLSHLERITEEGYVPTAQDVLRSRMPTTGINEYCFSVQKTNLRIVDVGGQKSERKKWIHCFENVIALIYLASLSEYDQCLEENNQENRMKESLALFGTILELPWFKSTSVILFLNKTDILEEKIPTSHLATYFPSFQGPKQDAEAAKRFILDMYTRMYTGCVDGPEGSKKGARSRRLFSHYTCATDTQNIRKVFKDVRDSVLARYLDEINLL

SEQ ID NO:53

基序

MAYDRYVAIC

SEQ ID NO:54

基序

FSTCSSH

SEQ ID NO:55

基序

PMLNPFIY

以下实施例仅是说明性的，并不意味着限制如发明内容、说明书或权利要求中所述的本发明的范围。

实施例

实施例1

鉴定新的小鼠和人类DMTS激活的气味受体

根据WO2014/210585中公开的方法进行新气味受体的鉴定。简而言之，将鼠嗅觉感觉神经元暴露于DMTS并使用Ca²⁺成像技术进行筛选。进一步分离由DMTS激活的神经元用于完整转录组分析以鉴定响应性气味受体。产生对应于分离的细胞mRNA的cDNA，并通过基于PCR的方法(Clontech/Takara, Low Input RNA Kit for Sequencing-v3,cat.634848)进行扩增。然后使用扩增出的cDNA产生用于下一代测序的Illumina cDNA文库和产生100个碱基对的单读序列。将序列与小鼠参考基因组(例如UCSC版本mm10)比对，以产生完整的转录组。因为每个嗅觉感觉神经元仅强烈转录单一气味受体(OR)，所以可以实现DMTS响应性OR的后续鉴定。然后使用序列相似性搜索的系统发育关系评估来鉴定相应的人类OR。通常观察到直系同源OR对之间的类似功能反应谱[例如Adipietro,K.A,etal.PLoS Genet.8,e1002821–e1002821(2012),Sato-Akuhara,N.et al.J.Neurosci.36,4482–4491(2016)和WO2016/201152]并且可以用于人类OR鉴定[例如，Armelin-CorreaL.M.and Malnic B.J Agric Food Chem.doi:10.1021/acs.jafc.6b04998(2017)]。图1显示了本发明提到的受体之间的成对同一性水平。不具有直系同源物和/或旁系同源物关系的OR仅平均为39％±13.1％。所有直系同源物和旁系同源物关系平均为77％±7.5％。所有旁系同源物和直系同源物对用灰色阴影细胞表示。它们代表了由所示氨基酸同一性水平支持的最高同一性水平。

实施例2

小鼠和人类DMTS受体的功能表征

进行功能性剂量-反应实验以评估表达个体推定DMTS受体的修饰细胞系的DMTS活性水平。使用基于细胞的测定，在HEK293T细胞系中测试小鼠受体Olfr1193、Olfr1093、Olfr1097、Olrf166、Olfr169、Olfr738和Olfr742，以及人类受体OR4S2和OR52N5，该细胞系中内源RTP1基因已被激活并且气味受体伴侣蛋白已被表达(在WO2016/201153中描述)。用Lucy--Rho标签组合标记小鼠受体基因，并用Rho-标签组合标记人类受体，产生用于基于细胞测定的标签::受体融合蛋白。将受体基因与经典嗅觉人类G蛋白α亚基G_olf基因共转染，并暴露于增加浓度的恶臭气味剂。人类G_olf的共表达激活Gs转导途径，其导致在与合适的配体结合后内部cAMP增加。通过使用基于均相时间分辨荧光(HTRF)的试剂盒(CisBio,cAMP dynamic 2kit,cat.62AM4PEJ)测量细胞溶质中的cAMP增加来检测气味诱导的活性。对于DMTS特异性地观察到受体活性的剂量依赖性增加，但对于丁酸(用作阴性对照的另一种已知恶臭)没有观察到(图1)。通过每种受体的DMTS诱导-反应的效力来报告活性水平，作为EC50值的量度(受体响应于给定化合物的半数最大激活功效水平的有效浓度)。

实施例3

其他人类DMTS受体的功能表征

进行功能性剂量-反应实验以评估表达个体推定DMTS受体的修饰细胞系的DMTS活性水平。对于以下人类受体中的每一种，在HEK293T细胞系中产生稳定表达人类受体的细胞系：OR2L13、OR4C15、OR5AC2、OR8H3、OR11G2或OR52N2。受体用-Rho标签组合标记，并与人G蛋白α亚基Gα₁₅稳定共表达用于基于细胞的测定。人Gα₁₅的共表达激活Gq转导途径，其导致在与合适的配体结合后内部Ca²⁺增加。受体暴露于增加浓度的DMTS。通过使用钙敏感荧光染料(Molecular Devices,Calcium 5dye,cat.R8186)测量细胞溶质中Ca²⁺的增加，以及使用荧光成像板读数器(Molecular Devices,FLIPR)测量在气味暴露后气味诱导的活性相对荧光比(RFU)的变化。记录受体活性的剂量依赖性增加，以及显示DMTS的相应剂量-反应曲线(图2)。缺乏受体的细胞系用作高化合物浓度下非特异性活性的对照(‘无受体’)。通过每种受体的DMTS诱导-反应的效力来报告活性水平，作为EC50值的量度。

实施例4

鉴定DMTS受体限制剂

将实施例3中描述的稳定细胞系用作拮抗剂筛选平台，以鉴定具有降低DMTS诱导的受体活性的特性的化合物。用挥发性化合物文库筛选表达人类气味剂受体的每种稳定细胞系的限制特性和潜在的DMTS气味限制。首先，将DMTS与每种测试化合物的单独二元混合物提供给细胞。在测试化合物存在或不存在的情况下单点监测DMTS诱导的细胞活性，允许鉴定具有推定的抑制或限制作用的化合物。在限制性剂量-反应曲线测定中进一步证实了这些命中(hits)，以评估活性限制的效力，作为IC50的量度(受体活性被给定试验化合物的半数最大限制效力水平限制的限制剂浓度)。在单一激活浓度的DMTS(EC80)存在下，用增加浓度的测试化合物记录受体活性的剂量-依赖性降低，并获得相应的剂量-反应限制曲线。下表中的化合物是降低DMTS诱导的至少一种受体活性的化合物的实施例，如图4所示。

在图4中，条的长度表示所选化合物对每种受体的活性限制效力(IC50，以负对数摩尔浓度表示)。没有条表示不存在对相应受体化合物对的限制。这些化合物可特异性结合并阻断DMTS或DMDS受体的活性，因此可抑制或限制DMTS或DMDS的气味。因此，这些化合物可用作厕所或口腔气味控制应用的恶臭冲消剂。

实施例5

小鼠和人类DMTS受体对DMDS的反应谱

进行功能性剂量-反应实验以证实对实施例2中鉴定的DMTS受体的DMTS活性，并进一步表征它们对DMDS的反应。使用实施例2中描述的相同的基于细胞的测定，用递增浓度的DMTS、DMDS或丁酸(对照)测试小鼠受体Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742和人类气味剂受体OR4S2。相对于丁酸对照化合物，观察到DMTS和DMDS的受体活性的强烈剂量-依赖性增加。OR4S2和Olfr169对丁酸的反应很弱，但是太弱而不能考虑丁酸作为这些受体的代表性配体。通过每种受体的DMTS或DMDS诱导-应答的效力报告活性水平，分别作为EC50值、EC50_DMTS和EC50_DMDS的量度。其中细胞不表达气味受体的模拟转染对照实验在DMTS或DMDS暴露时未显示出活性。在这些受体的恶臭结合位点处的竞争性拮抗剂具有减少DMTS和DMDS的令人不快的感知的潜力。

SEQUENCE LISTING

<110> Firmenich SA

<120> 鉴定恶臭调节化合物的方法（Method of identifying malodor modulatingcompounds）

<130> 10020/WO

<160> 55

<170> PatentIn version 3.5

<210> 1

<211> 957

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 1

atggcctcaa ggacttattc catggaagaa gtaaataatg tcactgaatt cattttcttg 60

ggtctttctc agaaccctga ggttgaaaaa gtgtgctttg tggtgttctc cttcttttac 120

atggtcattc tgctaggaaa cctcctcatc atgttgacag tttgcagtgg caatcttttc 180

aagtttccca tgtatttttt cctcaacttt ctgtcttttg tggacatttg ctactcctca 240

gtcacagcac ccaagatgat tattgacctg ttagtgaaga aaaagactat atcctatgtg 300

gggtgcatgt tacaactctt tgtggttcat ttctttggtt gcactgagat cttcattctt 360

actgtcatgg cctatgatag atatgtggcc atttgtaaac ctctccacta tatgactatg 420

atggaccggg aaagatgcaa taagatgttg ctcggaacat ggatcggtgg cttcttacat 480

tctattatcc aagtggctct tgtggtccag ctcccctttt gtggaccgaa tgagattgat 540

cactatttct gtgatgtaca tcctgtactg aaacttgcct gcactgacac ttacattgtt 600

ggtatttttg tgacagcaaa cagtggcacc attgcattgg gaagttttgt catcttgctg 660

atctcataca cagtcattct catgtctctg agaaagcagt catctgaagg cagacgcaaa 720

gctctctcca cttgtggatc ccacattgct gttgtcatca ttttttttgg cccctgtact 780

tttatgtata tgcggcctga cactaccttc tctgaggaca agatggtagc tatattttac 840

accattatca ctcccatgct gaatcctcta atttacactc taagaaatgc agaagtaaag 900

aatgcaatga gaaaactgtg ggctagaaag ttttcctggg aaactactgg gaaatag 957

<210> 2

<211> 318

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 2

Met Ala Ser Arg Thr Tyr Ser Met Glu Glu Val Asn Asn Val Thr Glu

1 5 10 15

Phe Ile Phe Leu Gly Leu Ser Gln Asn Pro Glu Val Glu Lys Val Cys

20 25 30

Phe Val Val Phe Ser Phe Phe Tyr Met Val Ile Leu Leu Gly Asn Leu

35 40 45

Leu Ile Met Leu Thr Val Cys Ser Gly Asn Leu Phe Lys Phe Pro Met

50 55 60

Tyr Phe Phe Leu Asn Phe Leu Ser Phe Val Asp Ile Cys Tyr Ser Ser

65 70 75 80

Val Thr Ala Pro Lys Met Ile Ile Asp Leu Leu Val Lys Lys Lys Thr

85 90 95

Ile Ser Tyr Val Gly Cys Met Leu Gln Leu Phe Val Val His Phe Phe

100 105 110

Gly Cys Thr Glu Ile Phe Ile Leu Thr Val Met Ala Tyr Asp Arg Tyr

115 120 125

Val Ala Ile Cys Lys Pro Leu His Tyr Met Thr Met Met Asp Arg Glu

130 135 140

Arg Cys Asn Lys Met Leu Leu Gly Thr Trp Ile Gly Gly Phe Leu His

145 150 155 160

Ser Ile Ile Gln Val Ala Leu Val Val Gln Leu Pro Phe Cys Gly Pro

165 170 175

Asn Glu Ile Asp His Tyr Phe Cys Asp Val His Pro Val Leu Lys Leu

180 185 190

Ala Cys Thr Asp Thr Tyr Ile Val Gly Ile Phe Val Thr Ala Asn Ser

195 200 205

Gly Thr Ile Ala Leu Gly Ser Phe Val Ile Leu Leu Ile Ser Tyr Thr

210 215 220

Val Ile Leu Met Ser Leu Arg Lys Gln Ser Ser Glu Gly Arg Arg Lys

225 230 235 240

Ala Leu Ser Thr Cys Gly Ser His Ile Ala Val Val Ile Ile Phe Phe

245 250 255

Gly Pro Cys Thr Phe Met Tyr Met Arg Pro Asp Thr Thr Phe Ser Glu

260 265 270

Asp Lys Met Val Ala Ile Phe Tyr Thr Ile Ile Thr Pro Met Leu Asn

275 280 285

Pro Leu Ile Tyr Thr Leu Arg Asn Ala Glu Val Lys Asn Ala Met Arg

290 295 300

Lys Leu Trp Ala Arg Lys Phe Ser Trp Glu Thr Thr Gly Lys

305 310 315

<210> 3

<211> 969

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 3

atggaaaaga tcacatcagc tgtggatgtc cacaatattc cattaaagaa catgactgaa 60

gccaccatgt ttattctctt aggattcaca gatgactttg aactccaagt cttcctgttt 120

ttactgtttc ttgctattta tctcttcact ctggtaggaa actttggact ggttgttttg 180

gtcattgggg attgtcggct acacaacccc atgtactatt tcctaagtgt tttgtctttc 240

ctggatgctt gctattctac agttgttaca cccaaaatgt tggtcaactt tctaagtgaa 300

aataagtcca tttcattcct tgcatgtgca acccaaatgc ttctctttgt ttcgttggga 360

accacagaat gctttctcct ggcagcaatg gcttatgacc gatatgtagc catctacaac 420

ccacttctgt atacagtggc catgtcaccc agagtatacc tgccactcat cattgcttcc 480

tatgctggtg gagttgtgca tggtgctatc cacacagtgg ccactttcag tctgtccttc 540

tgtggatcca atgaaattaa gcatgtcttc tgtgacatcc ctgcattgct tgctctttct 600

tgttctgata cccacacaaa tgagcttcta gtcttgtact tggtgggctt gattgagatt 660

gttaccatcc tgattgttct ggtctcctat ggattcatcc tctttgccat tctgaacatg 720

cattctgctg agggtaggag gaaagtgttc tctacatgtg gctctcacct cactggagtc 780

tctatttacc atggtacaat ccttttcact tatatgaggc ctagttccag ttatgcttca 840

aatcatgaca tggtagtgtc aatattttac accattgtga tacccatgtt gaatcctatc 900

atctatagtt tgaggaacaa agatgtaaaa gtagcattta ataaattgtg gagaaaatgt 960

gattcataa 969

<210> 4

<211> 322

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 4

Met Glu Lys Ile Thr Ser Ala Val Asp Val His Asn Ile Pro Leu Lys

1 5 10 15

Asn Met Thr Glu Ala Thr Met Phe Ile Leu Leu Gly Phe Thr Asp Asp

20 25 30

Phe Glu Leu Gln Val Phe Leu Phe Leu Leu Phe Leu Ala Ile Tyr Leu

35 40 45

Phe Thr Leu Val Gly Asn Phe Gly Leu Val Val Leu Val Ile Gly Asp

50 55 60

Cys Arg Leu His Asn Pro Met Tyr Tyr Phe Leu Ser Val Leu Ser Phe

65 70 75 80

Leu Asp Ala Cys Tyr Ser Thr Val Val Thr Pro Lys Met Leu Val Asn

85 90 95

Phe Leu Ser Glu Asn Lys Ser Ile Ser Phe Leu Ala Cys Ala Thr Gln

100 105 110

Met Leu Leu Phe Val Ser Leu Gly Thr Thr Glu Cys Phe Leu Leu Ala

115 120 125

Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Tyr Asn Pro Leu Leu Tyr

130 135 140

Thr Val Ala Met Ser Pro Arg Val Tyr Leu Pro Leu Ile Ile Ala Ser

145 150 155 160

Tyr Ala Gly Gly Val Val His Gly Ala Ile His Thr Val Ala Thr Phe

165 170 175

Ser Leu Ser Phe Cys Gly Ser Asn Glu Ile Lys His Val Phe Cys Asp

180 185 190

Ile Pro Ala Leu Leu Ala Leu Ser Cys Ser Asp Thr His Thr Asn Glu

195 200 205

Leu Leu Val Leu Tyr Leu Val Gly Leu Ile Glu Ile Val Thr Ile Leu

210 215 220

Ile Val Leu Val Ser Tyr Gly Phe Ile Leu Phe Ala Ile Leu Asn Met

225 230 235 240

His Ser Ala Glu Gly Arg Arg Lys Val Phe Ser Thr Cys Gly Ser His

245 250 255

Leu Thr Gly Val Ser Ile Tyr His Gly Thr Ile Leu Phe Thr Tyr Met

260 265 270

Arg Pro Ser Ser Ser Tyr Ala Ser Asn His Asp Met Val Val Ser Ile

275 280 285

Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Ile Ile Tyr Ser Leu

290 295 300

Arg Asn Lys Asp Val Lys Val Ala Phe Asn Lys Leu Trp Arg Lys Cys

305 310 315 320

Asp Ser

<210> 5

<211> 948

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 5

atgagtgcct gtaatcatac aaatgaacct gagttcacgc ttgtgggact gacagactcc 60

aaggagattc agctggtcct ctctgttttg tttctcctga tatacatgct cactgtcttg 120

ggaaacatag gtatgatact gatcattcat ctagatgtcc agctccacac tccaatgtat 180

tttttcctca cccacttgtc attccttgac ctcagttact caactgtaat cacacctaaa 240

accttacaga atacgctgac ctccataaaa aatatttcct tcatgggatg cttcacccag 300

ttgtatttct ttgtcctctt ggcagcttct gaatgtttta tactttcgtc aatggcctat 360

gaccgctatg tagctatctg caaccctcta cactatccag ttattatgtc ccctaggcgc 420

tcatatactc tcatcactgt gtcctacatg attggagttt tggattcttc tgtcactgtc 480

ttttgcttaa gcacactgga tttctgcaac tccaaagtaa ttcatcactt cttttgtgac 540

acattcccaa ttttagctct gtcctgcagt gatacctata atgcagaagc cactatattc 600

gttttagctg gttccactct attgctgtcg ctcatcacga tatcctcatc ctatgtatct 660

attctctcta caattttgaa gataaattct tcttcaggaa agcacaaagc cttctctaca 720

tgtgcctcac atcttatagg agtcactgtt ttttatggta caatgatctt tacttattta 780

aaaccaagta cgtcctactc cctgggaaag gatcaagtag cctctgtttt ttatactata 840

gtgattccca tgctgaaccc acttatctat agtctcagga acaaagaagt gaaaagtgct 900

gttgttagag ttatgaagaa gagagagtgc atccagaaac tagaataa 948

<210> 6

<211> 315

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 6

Met Ser Ala Cys Asn His Thr Asn Glu Pro Glu Phe Thr Leu Val Gly

1 5 10 15

Leu Thr Asp Ser Lys Glu Ile Gln Leu Val Leu Ser Val Leu Phe Leu

20 25 30

Leu Ile Tyr Met Leu Thr Val Leu Gly Asn Ile Gly Met Ile Leu Ile

35 40 45

Ile His Leu Asp Val Gln Leu His Thr Pro Met Tyr Phe Phe Leu Thr

50 55 60

His Leu Ser Phe Leu Asp Leu Ser Tyr Ser Thr Val Ile Thr Pro Lys

65 70 75 80

Thr Leu Gln Asn Thr Leu Thr Ser Ile Lys Asn Ile Ser Phe Met Gly

85 90 95

Cys Phe Thr Gln Leu Tyr Phe Phe Val Leu Leu Ala Ala Ser Glu Cys

100 105 110

Phe Ile Leu Ser Ser Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Asn

115 120 125

Pro Leu His Tyr Pro Val Ile Met Ser Pro Arg Arg Ser Tyr Thr Leu

130 135 140

Ile Thr Val Ser Tyr Met Ile Gly Val Leu Asp Ser Ser Val Thr Val

145 150 155 160

Phe Cys Leu Ser Thr Leu Asp Phe Cys Asn Ser Lys Val Ile His His

165 170 175

Phe Phe Cys Asp Thr Phe Pro Ile Leu Ala Leu Ser Cys Ser Asp Thr

180 185 190

Tyr Asn Ala Glu Ala Thr Ile Phe Val Leu Ala Gly Ser Thr Leu Leu

195 200 205

Leu Ser Leu Ile Thr Ile Ser Ser Ser Tyr Val Ser Ile Leu Ser Thr

210 215 220

Ile Leu Lys Ile Asn Ser Ser Ser Gly Lys His Lys Ala Phe Ser Thr

225 230 235 240

Cys Ala Ser His Leu Ile Gly Val Thr Val Phe Tyr Gly Thr Met Ile

245 250 255

Phe Thr Tyr Leu Lys Pro Ser Thr Ser Tyr Ser Leu Gly Lys Asp Gln

260 265 270

Val Ala Ser Val Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Leu

275 280 285

Ile Tyr Ser Leu Arg Asn Lys Glu Val Lys Ser Ala Val Val Arg Val

290 295 300

Met Lys Lys Arg Glu Cys Ile Gln Lys Leu Glu

305 310 315

<210> 7

<211> 939

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 7

atggagaaat ggaatcagag ctcaagtgat tttactctgt taggactgct tccacaaaac 60

caaacaggcc tgctactttt gatgctcatc atctttgtct tctctctggc tttgtgtggc 120

aactcaggaa tgatccacct cattcgtgtg gatccaaggc tccacacccc catgtacttt 180

ctcctcagtc agctctctct catggacctg atgtacattt ctaccactgt tcccaagatg 240

gcatttaact tcctttctgg ccagaaaagc atctcttttc tgggctgtgg agtgcaatcc 300

ttcttcttcc tgactatggc atgttctgag ggcttgctct tggcttccat ggcttatgat 360

cgttttgtgg ctatctgcca tccccttcac tatcccattc gcatgagcaa aataatgtgt 420

ctgaagatga tcataggatc ctggatattg ggctcaatca actctttagc acataccgtc 480

tatgcccttc atattcctta ctgccattct aggtccatta accatttctt ctgtgatgtt 540

ccagccatgt tgcccctggc ctgtatggac acttgggttt atgagtacat ggtgtttgtg 600

agcacaagcc tgtttctcct actgcctttc cttggtatca cagcttccta tggtcgggtc 660

ctttttgctg tcttccacat gcgctcaaaa gagggaaaga agaaggcctt caccacatgc 720

tcaactcact taactgtggt gacattttac tatgcacctt ttgtctatac ctatcttcga 780

cctaggagtc ttcgctcccc aacagaagat aagattctgg ctgttttcta cactatcctt 840

acccccatgc tcaaccccat catttatagt ctgaggaata aggaggtcct gggggccatg 900

acaagagtcc ttggtacttt tccttcaact aaaccgtaa 939

<210> 8

<211> 312

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 8

Met Glu Lys Trp Asn Gln Ser Ser Ser Asp Phe Thr Leu Leu Gly Leu

1 5 10 15

Leu Pro Gln Asn Gln Thr Gly Leu Leu Leu Leu Met Leu Ile Ile Phe

20 25 30

Val Phe Ser Leu Ala Leu Cys Gly Asn Ser Gly Met Ile His Leu Ile

35 40 45

Arg Val Asp Pro Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser Gln

50 55 60

Leu Ser Leu Met Asp Leu Met Tyr Ile Ser Thr Thr Val Pro Lys Met

65 70 75 80

Ala Phe Asn Phe Leu Ser Gly Gln Lys Ser Ile Ser Phe Leu Gly Cys

85 90 95

Gly Val Gln Ser Phe Phe Phe Leu Thr Met Ala Cys Ser Glu Gly Leu

100 105 110

Leu Leu Ala Ser Met Ala Tyr Asp Arg Phe Val Ala Ile Cys His Pro

115 120 125

Leu His Tyr Pro Ile Arg Met Ser Lys Ile Met Cys Leu Lys Met Ile

130 135 140

Ile Gly Ser Trp Ile Leu Gly Ser Ile Asn Ser Leu Ala His Thr Val

145 150 155 160

Tyr Ala Leu His Ile Pro Tyr Cys His Ser Arg Ser Ile Asn His Phe

165 170 175

Phe Cys Asp Val Pro Ala Met Leu Pro Leu Ala Cys Met Asp Thr Trp

180 185 190

Val Tyr Glu Tyr Met Val Phe Val Ser Thr Ser Leu Phe Leu Leu Leu

195 200 205

Pro Phe Leu Gly Ile Thr Ala Ser Tyr Gly Arg Val Leu Phe Ala Val

210 215 220

Phe His Met Arg Ser Lys Glu Gly Lys Lys Lys Ala Phe Thr Thr Cys

225 230 235 240

Ser Thr His Leu Thr Val Val Thr Phe Tyr Tyr Ala Pro Phe Val Tyr

245 250 255

Thr Tyr Leu Arg Pro Arg Ser Leu Arg Ser Pro Thr Glu Asp Lys Ile

260 265 270

Leu Ala Val Phe Tyr Thr Ile Leu Thr Pro Met Leu Asn Pro Ile Ile

275 280 285

Tyr Ser Leu Arg Asn Lys Glu Val Leu Gly Ala Met Thr Arg Val Leu

290 295 300

Gly Thr Phe Pro Ser Thr Lys Pro

305 310

<210> 9

<211> 942

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 9

atggaatatg agaactacac ttttaacagc gacttcatcc tcttgggact gttctcttct 60

tcaaagacaa gcttaacttt tttctcattt atatttttca tttttattat ggctataaca 120

gaaaatgccc tcatgatcct cctaatccac agggattctc gactccatac cccaatgtat 180

ttcctgctta gtcatctctc cttcatggat atcttgcaca tttccaacat tgttcctaaa 240

atgattgctg acttcctctc aggcagcaga actatttcct ttgcaggctg tgccttccag 300

atatttctct ctcttacctt gctaggtggt gagtgccttc tcctggcagc catgtcctat 360

gatcgatatg tggccatctg ccacccactt cgctaccctg tgctgatgag ggataactcc 420

agtaggctcc tggctgcagg ctcctggctg gtggggatcc tcaactccat agtacacaca 480

gtttttgcac tccactttcc cttctgccac tcaagagcca ttgatcactt tttctgcgaa 540

gtccctgcca tgttgaaatt gtcatgtata gacacaacac actatgaacg aggcgtttat 600

gtgagtggca ttatttttct gctgatccca ttttccatga tctctatatc ttatgtgcaa 660

attctcctca ctgtattcca aatgcagtca tcaggggccc ggcaaaagtc cttttccacc 720

tgttccttcc acatggttgt tgtcataatg tactatgggc cattcatttt tacatatatg 780

agacctcgct cataccacac tccagggcag gataaatttt tggcaatatt ctacaccatc 840

ctgacaccca cactcaaccc cataatctac agctttcgta ataaagatgt ccttatggct 900

gtgaaaaaca tcgtccaaag taattttttg aataaaaaat ga 942

<210> 10

<211> 313

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 10

Met Glu Tyr Glu Asn Tyr Thr Phe Asn Ser Asp Phe Ile Leu Leu Gly

1 5 10 15

Leu Phe Ser Ser Ser Lys Thr Ser Leu Thr Phe Phe Ser Phe Ile Phe

20 25 30

Phe Ile Phe Ile Met Ala Ile Thr Glu Asn Ala Leu Met Ile Leu Leu

35 40 45

Ile His Arg Asp Ser Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser

50 55 60

His Leu Ser Phe Met Asp Ile Leu His Ile Ser Asn Ile Val Pro Lys

65 70 75 80

Met Ile Ala Asp Phe Leu Ser Gly Ser Arg Thr Ile Ser Phe Ala Gly

85 90 95

Cys Ala Phe Gln Ile Phe Leu Ser Leu Thr Leu Leu Gly Gly Glu Cys

100 105 110

Leu Leu Leu Ala Ala Met Ser Tyr Asp Arg Tyr Val Ala Ile Cys His

115 120 125

Pro Leu Arg Tyr Pro Val Leu Met Arg Asp Asn Ser Ser Arg Leu Leu

130 135 140

Ala Ala Gly Ser Trp Leu Val Gly Ile Leu Asn Ser Ile Val His Thr

145 150 155 160

Val Phe Ala Leu His Phe Pro Phe Cys His Ser Arg Ala Ile Asp His

165 170 175

Phe Phe Cys Glu Val Pro Ala Met Leu Lys Leu Ser Cys Ile Asp Thr

180 185 190

Thr His Tyr Glu Arg Gly Val Tyr Val Ser Gly Ile Ile Phe Leu Leu

195 200 205

Ile Pro Phe Ser Met Ile Ser Ile Ser Tyr Val Gln Ile Leu Leu Thr

210 215 220

Val Phe Gln Met Gln Ser Ser Gly Ala Arg Gln Lys Ser Phe Ser Thr

225 230 235 240

Cys Ser Phe His Met Val Val Val Ile Met Tyr Tyr Gly Pro Phe Ile

245 250 255

Phe Thr Tyr Met Arg Pro Arg Ser Tyr His Thr Pro Gly Gln Asp Lys

260 265 270

Phe Leu Ala Ile Phe Tyr Thr Ile Leu Thr Pro Thr Leu Asn Pro Ile

275 280 285

Ile Tyr Ser Phe Arg Asn Lys Asp Val Leu Met Ala Val Lys Asn Ile

290 295 300

Val Gln Ser Asn Phe Leu Asn Lys Lys

305 310

<210> 11

<211> 936

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 11

atgaaagcct ttagcagccc cagcaactcc agcatcatca ctggcttcat cctcctgggc 60

ttcccctgcc ccaaggaggg gcaaatcctc ctctttgtgc tcttcttcat tatctacatc 120

cttaccctca tgggcaatgc ttccatcata tgtgctgtgt gctatgataa gaaacttcac 180

agccccatgt acctcctgct ggccaacttc tccttcctag aaatctggta tgtcacctcc 240

acagtcccca acatgttggc caacttcctc tctgacacga aggtcatctc tttctctgga 300

tgcttcctgc agttctattt cttcttctcc ttgggttcta cagaatgctt tttcctggca 360

gtcatggcat ttgatcgata ccttgccatc tgcagacctc tacattatcc ttctctcatg 420

actgggcgcc tctgcaacat ccttgtgatc agttgctggg tgcttggttt cctctggttc 480

cctgttccca tcatcatcat ctcccaaatg tccttctgtg gatccagaat tatagaccac 540

ttcctgtgtg acccaggccc tctgttggcc ctcacctgtg tgagaaattc tttaattgag 600

atgactagct ctactttaag ttccctgctt ttatttgttc catttttttt tatcatgggg 660

tcttatgctc tagtaatgag ggctgtgctc agggtccctt cagcagctgg acgaagaaag 720

gccttctcca cctgtgggtc acacttgact gtggtttctc ttttctatgg ctcagtgatg 780

gtcatgtatg tgagcccaac atctgaacat gcagctggag tgcaaaaact tgtgactctg 840

ttttattctg tggttactcc cctccttaat cctgtgatat acagtctgag gaacagagat 900

atgaaacatg caatgaaaaa gttactgaaa atgtaa 936

<210> 12

<211> 311

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 12

Met Lys Ala Phe Ser Ser Pro Ser Asn Ser Ser Ile Ile Thr Gly Phe

1 5 10 15

Ile Leu Leu Gly Phe Pro Cys Pro Lys Glu Gly Gln Ile Leu Leu Phe

20 25 30

Val Leu Phe Phe Ile Ile Tyr Ile Leu Thr Leu Met Gly Asn Ala Ser

35 40 45

Ile Ile Cys Ala Val Cys Tyr Asp Lys Lys Leu His Ser Pro Met Tyr

50 55 60

Leu Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Trp Tyr Val Thr Ser

65 70 75 80

Thr Val Pro Asn Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Val Ile

85 90 95

Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Leu Gly

100 105 110

Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu

115 120 125

Ala Ile Cys Arg Pro Leu His Tyr Pro Ser Leu Met Thr Gly Arg Leu

130 135 140

Cys Asn Ile Leu Val Ile Ser Cys Trp Val Leu Gly Phe Leu Trp Phe

145 150 155 160

Pro Val Pro Ile Ile Ile Ile Ser Gln Met Ser Phe Cys Gly Ser Arg

165 170 175

Ile Ile Asp His Phe Leu Cys Asp Pro Gly Pro Leu Leu Ala Leu Thr

180 185 190

Cys Val Arg Asn Ser Leu Ile Glu Met Thr Ser Ser Thr Leu Ser Ser

195 200 205

Leu Leu Leu Phe Val Pro Phe Phe Phe Ile Met Gly Ser Tyr Ala Leu

210 215 220

Val Met Arg Ala Val Leu Arg Val Pro Ser Ala Ala Gly Arg Arg Lys

225 230 235 240

Ala Phe Ser Thr Cys Gly Ser His Leu Thr Val Val Ser Leu Phe Tyr

245 250 255

Gly Ser Val Met Val Met Tyr Val Ser Pro Thr Ser Glu His Ala Ala

260 265 270

Gly Val Gln Lys Leu Val Thr Leu Phe Tyr Ser Val Val Thr Pro Leu

275 280 285

Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Arg Asp Met Lys His Ala

290 295 300

Met Lys Lys Leu Leu Lys Met

305 310

<210> 13

<211> 936

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 13

atgaaaaccc tcagcagccc cagcaactcc agcaccatca ctggcttcat cctcttgggc 60

ttcccctgcc ccagggaggg gcaaatcctc ctctttgtga ccttcttcat tgtttacata 120

ctcattctta tgggcaatgc ttccatcatc tgtgctgtgt actgtgatca gagcctccac 180

acccccatgt acttcctgct ggccaacttc tccttcctgg agatctggta tgtcacctcc 240

acagtcccca acatgttggc caacttcctt tcagacacca aggtcatctc tttctctgga 300

tgcttcctgc agttctattt cttcttctcc tttggttcta cagaatgctt tttcctggca 360

gtcatggcat ttgatcgata ccttgccatc tgtaggccac tacattatcc ttctctcatg 420

actgggcacc tctgcaacat ccttgtgatc agttgctggg tgcttggttt cctctggttc 480

cctgtaccca tcatcatcat ctcccagatg tccttctgtg ggtccagaat tatagaccac 540

ttcctgtgtg acccaggccc tcttttggcc cttgcctgtt ccagagcccc attgatggag 600

gttttctgga caattataat gtctatgctc ctggttattc ctttcctctt catcatggga 660

acttacatat tggtcctaag agctgtgttt agacttcctt caagagatgg acaaaaaaag 720

gccttctcca cttgcgggtc tcatctcaca gtagtttcac tcttttattg ctcagtgatg 780

aaaatgtatt tgagcccaac atctgagcat gaagctggaa tgcagaagct tgtaactcta 840

ttttattctg tgggtactcc actacttaat cctgtgatat acagtctgag gaacaaagat 900

atgaaaaatg ccctgcagaa gattttaaga acataa 936

<210> 14

<211> 311

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 14

Met Lys Thr Leu Ser Ser Pro Ser Asn Ser Ser Thr Ile Thr Gly Phe

1 5 10 15

Ile Leu Leu Gly Phe Pro Cys Pro Arg Glu Gly Gln Ile Leu Leu Phe

20 25 30

Val Thr Phe Phe Ile Val Tyr Ile Leu Ile Leu Met Gly Asn Ala Ser

35 40 45

Ile Ile Cys Ala Val Tyr Cys Asp Gln Ser Leu His Thr Pro Met Tyr

50 55 60

Phe Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Trp Tyr Val Thr Ser

65 70 75 80

Thr Val Pro Asn Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Val Ile

85 90 95

Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Phe Gly

100 105 110

Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu

115 120 125

Ala Ile Cys Arg Pro Leu His Tyr Pro Ser Leu Met Thr Gly His Leu

130 135 140

Cys Asn Ile Leu Val Ile Ser Cys Trp Val Leu Gly Phe Leu Trp Phe

145 150 155 160

Pro Val Pro Ile Ile Ile Ile Ser Gln Met Ser Phe Cys Gly Ser Arg

165 170 175

Ile Ile Asp His Phe Leu Cys Asp Pro Gly Pro Leu Leu Ala Leu Ala

180 185 190

Cys Ser Arg Ala Pro Leu Met Glu Val Phe Trp Thr Ile Ile Met Ser

195 200 205

Met Leu Leu Val Ile Pro Phe Leu Phe Ile Met Gly Thr Tyr Ile Leu

210 215 220

Val Leu Arg Ala Val Phe Arg Leu Pro Ser Arg Asp Gly Gln Lys Lys

225 230 235 240

Ala Phe Ser Thr Cys Gly Ser His Leu Thr Val Val Ser Leu Phe Tyr

245 250 255

Cys Ser Val Met Lys Met Tyr Leu Ser Pro Thr Ser Glu His Glu Ala

260 265 270

Gly Met Gln Lys Leu Val Thr Leu Phe Tyr Ser Val Gly Thr Pro Leu

275 280 285

Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Lys Asp Met Lys Asn Ala

290 295 300

Leu Gln Lys Ile Leu Arg Thr

305 310

<210> 15

<211> 918

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 15

atggaactga acaggaccca gctgactgaa tttgttctca gaggaataac agatcgttca 60

gagctgcaag tccccctgtt cctggtgttc tttctcatct atgttatcac catggtgggc 120

aaccttggct taatctttgt catctggaag gaccctcatc ttcacacacc catgtacctt 180

ttccttggaa atttggcctt tgctgatgcc tgtaattcat cctctgtgac accaaagatg 240

cttatgaaat ttttaaataa gaatgacatg atatccatgg gtgagtgttt tgctcaattt 300

tatttctttt gttcaagtgt aactgcagaa gccttcattc tggtagctat ggcctatgac 360

cgctatgtag ccatatgcaa acctctgctc tatgtagtgg tgatgtccaa cagactctgt 420

attcagttca taggtgtatc ctatctaatt ggacttctac atggcttact tcatgtagga 480

ttgttattta ggttaacgtt ttgtagttcc aatgtaatag attatttcta ctgtgacatc 540

ctgccacttt ataggatttc ttgcactgac ccatcgatca atgtactggt agctttcatt 600

atgggtattt tattacaagt gagtaccttt atgagtatta tagtctccta tgtccgtgtc 660

ctctttgcca tcctgagaac aaagtctgag aggggcagaa acaaagcctt ctctacttgc 720

agttcccacc tgtcatctgt gtctttgttc tatggcactc tcttcatcat atatgtcctc 780

tctggctctg acacagataa ttatcagggt aaaatgtatt cactgttcta taccattatc 840

attcctctgc taaacccctt catttacagc ctaagaaata aagaagtcat cggtgccttg 900

agaaaagtca gaaaatga 918

<210> 16

<211> 305

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 16

Met Glu Leu Asn Arg Thr Gln Leu Thr Glu Phe Val Leu Arg Gly Ile

1 5 10 15

Thr Asp Arg Ser Glu Leu Gln Val Pro Leu Phe Leu Val Phe Phe Leu

20 25 30

Ile Tyr Val Ile Thr Met Val Gly Asn Leu Gly Leu Ile Phe Val Ile

35 40 45

Trp Lys Asp Pro His Leu His Thr Pro Met Tyr Leu Phe Leu Gly Asn

50 55 60

Leu Ala Phe Ala Asp Ala Cys Asn Ser Ser Ser Val Thr Pro Lys Met

65 70 75 80

Leu Met Lys Phe Leu Asn Lys Asn Asp Met Ile Ser Met Gly Glu Cys

85 90 95

Phe Ala Gln Phe Tyr Phe Phe Cys Ser Ser Val Thr Ala Glu Ala Phe

100 105 110

Ile Leu Val Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro

115 120 125

Leu Leu Tyr Val Val Val Met Ser Asn Arg Leu Cys Ile Gln Phe Ile

130 135 140

Gly Val Ser Tyr Leu Ile Gly Leu Leu His Gly Leu Leu His Val Gly

145 150 155 160

Leu Leu Phe Arg Leu Thr Phe Cys Ser Ser Asn Val Ile Asp Tyr Phe

165 170 175

Tyr Cys Asp Ile Leu Pro Leu Tyr Arg Ile Ser Cys Thr Asp Pro Ser

180 185 190

Ile Asn Val Leu Val Ala Phe Ile Met Gly Ile Leu Leu Gln Val Ser

195 200 205

Thr Phe Met Ser Ile Ile Val Ser Tyr Val Arg Val Leu Phe Ala Ile

210 215 220

Leu Arg Thr Lys Ser Glu Arg Gly Arg Asn Lys Ala Phe Ser Thr Cys

225 230 235 240

Ser Ser His Leu Ser Ser Val Ser Leu Phe Tyr Gly Thr Leu Phe Ile

245 250 255

Ile Tyr Val Leu Ser Gly Ser Asp Thr Asp Asn Tyr Gln Gly Lys Met

260 265 270

Tyr Ser Leu Phe Tyr Thr Ile Ile Ile Pro Leu Leu Asn Pro Phe Ile

275 280 285

Tyr Ser Leu Arg Asn Lys Glu Val Ile Gly Ala Leu Arg Lys Val Arg

290 295 300

Lys

305

<210> 17

<211> 951

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 17

atgcctgggg tcaatacctc cagcctgaca ccaagatact ttattctcaa tgggattcct 60

gggttggaag ctgcacacat ctggatctct ctgccattct tcattatgta cctcattgct 120

gtcacaggta actgtggact tatctacctc atcagtcatg aggaggctct gcaccggccc 180

atgtactact ttctagccat gttgtctgct acagatattt ctgggtgtaa tacaattgtc 240

cccagtatgt tatgcatctt ttggttcagt gtcaaggaga ttgatttcaa tgcctgcctt 300

gtacagatgt ttttcatcca catgttaaca ggcatggagt ctggtgtgct catgcttatg 360

gctctcgacc gctatgtggc tatatgctat ccattacgct atactaccat actcaccaac 420

actatgatta ccaagattgg attggcagca cttgttagaa gtgtgttact catggtccct 480

tttgctttcc tgatcaagcg tcttccatac tgtagaggaa acctcatcca acatacctat 540

tgtgatcaca tggctgtggc taaactatcc tgtggcaata ttaagattaa tgctatctat 600

ggtcttataa ttgctatatt tattgggggt tttgatatat tctgtatctc catgtcttat 660

gccatgatta tccatgctgt ggtgaagcta tcttcggcag atgctcgcca taaagccttc 720

agtacctgta catcacacat atgtgctatt gttattacct atgtcccagc attcttcaac 780

ttctttactc atcgctttgg gagaaccact ataccccatc atatccacat tattatagcc 840

aacctgtatc tattgctacc tcccaccttg aatccaattg tatatggagt aaagaccaag 900

cagattcgtg aaggtgtgat caaactgttt gctagacaaa aagttgtttg a 951

<210> 18

<211> 316

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 18

Met Pro Gly Val Asn Thr Ser Ser Leu Thr Pro Arg Tyr Phe Ile Leu

1 5 10 15

Asn Gly Ile Pro Gly Leu Glu Ala Ala His Ile Trp Ile Ser Leu Pro

20 25 30

Phe Phe Ile Met Tyr Leu Ile Ala Val Thr Gly Asn Cys Gly Leu Ile

35 40 45

Tyr Leu Ile Ser His Glu Glu Ala Leu His Arg Pro Met Tyr Tyr Phe

50 55 60

Leu Ala Met Leu Ser Ala Thr Asp Ile Ser Gly Cys Asn Thr Ile Val

65 70 75 80

Pro Ser Met Leu Cys Ile Phe Trp Phe Ser Val Lys Glu Ile Asp Phe

85 90 95

Asn Ala Cys Leu Val Gln Met Phe Phe Ile His Met Leu Thr Gly Met

100 105 110

Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile

115 120 125

Cys Tyr Pro Leu Arg Tyr Thr Thr Ile Leu Thr Asn Thr Met Ile Thr

130 135 140

Lys Ile Gly Leu Ala Ala Leu Val Arg Ser Val Leu Leu Met Val Pro

145 150 155 160

Phe Ala Phe Leu Ile Lys Arg Leu Pro Tyr Cys Arg Gly Asn Leu Ile

165 170 175

Gln His Thr Tyr Cys Asp His Met Ala Val Ala Lys Leu Ser Cys Gly

180 185 190

Asn Ile Lys Ile Asn Ala Ile Tyr Gly Leu Ile Ile Ala Ile Phe Ile

195 200 205

Gly Gly Phe Asp Ile Phe Cys Ile Ser Met Ser Tyr Ala Met Ile Ile

210 215 220

His Ala Val Val Lys Leu Ser Ser Ala Asp Ala Arg His Lys Ala Phe

225 230 235 240

Ser Thr Cys Thr Ser His Ile Cys Ala Ile Val Ile Thr Tyr Val Pro

245 250 255

Ala Phe Phe Asn Phe Phe Thr His Arg Phe Gly Arg Thr Thr Ile Pro

260 265 270

His His Ile His Ile Ile Ile Ala Asn Leu Tyr Leu Leu Leu Pro Pro

275 280 285

Thr Leu Asn Pro Ile Val Tyr Gly Val Lys Thr Lys Gln Ile Arg Glu

290 295 300

Gly Val Ile Lys Leu Phe Ala Arg Gln Lys Val Val

305 310 315

<210> 19

<211> 954

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 19

atgctgattt ccaacaactc atatgaagcc ccgcagtctt tcattcttaa tggaattcct 60

ggtctcgaag cagtgcatat atggatctct cttccactct gtacaatgta catcatctcc 120

ctagtaggca accttggcct tgtatatctc atttactatg aggaatcctt acatcgccca 180

atgtatttct ttctggccat gctttctctc atagacctgt ttacttgcac aaccactgtc 240

cccaatgccc tcttcatttt ctggttcaaa ctcaaggaaa ttaacttcac tgcttgccta 300

gttcagatgt tctttgtgca cggattcaca ggtgtggagt ctggggtact catgctcatg 360

gccttggacc gctatgtggc catttgctac ccactacgct atgcaaccat acttaccaac 420

cctgtcattg ccaaagctgg gcttgccacc ttcttgagag gtgtgttact gatgattcct 480

tttccattct tggttaaacg tttgcccttc tgccgaagca atgtcatctc ccatacatat 540

tgtgaccaca tgtctgtggt aaagttatcc tgtgccagca tcaaaatcaa tgtcatctat 600

ggtctcatgg ttgcacttct gattggagtg tttgacatat gttgtatatc tgtgtcctac 660

actatgatcc tccgggcagt ggtcagcctg tcctctgcag atgctcggca gaaggccttc 720

agcacctgca cagcccacat atctgccatc atcattactt atgttccagc cttcttcacc 780

ttctttactc atcgttttgg aggtcacacc atccctcctt ctcttcatat cattgtggct 840

aatctttatc ttcttctccc tccaactcta aatcccattg tttatgggat gaagaccaaa 900

cagatcagag atagtatcat taaattcttt cacggtgaaa aaggttcaag gtga 954

<210> 20

<211> 317

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 20

Met Leu Ile Ser Asn Asn Ser Tyr Glu Ala Pro Gln Ser Phe Ile Leu

1 5 10 15

Asn Gly Ile Pro Gly Leu Glu Ala Val His Ile Trp Ile Ser Leu Pro

20 25 30

Leu Cys Thr Met Tyr Ile Ile Ser Leu Val Gly Asn Leu Gly Leu Val

35 40 45

Tyr Leu Ile Tyr Tyr Glu Glu Ser Leu His Arg Pro Met Tyr Phe Phe

50 55 60

Leu Ala Met Leu Ser Leu Ile Asp Leu Phe Thr Cys Thr Thr Thr Val

65 70 75 80

Pro Asn Ala Leu Phe Ile Phe Trp Phe Lys Leu Lys Glu Ile Asn Phe

85 90 95

Thr Ala Cys Leu Val Gln Met Phe Phe Val His Gly Phe Thr Gly Val

100 105 110

Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile

115 120 125

Cys Tyr Pro Leu Arg Tyr Ala Thr Ile Leu Thr Asn Pro Val Ile Ala

130 135 140

Lys Ala Gly Leu Ala Thr Phe Leu Arg Gly Val Leu Leu Met Ile Pro

145 150 155 160

Phe Pro Phe Leu Val Lys Arg Leu Pro Phe Cys Arg Ser Asn Val Ile

165 170 175

Ser His Thr Tyr Cys Asp His Met Ser Val Val Lys Leu Ser Cys Ala

180 185 190

Ser Ile Lys Ile Asn Val Ile Tyr Gly Leu Met Val Ala Leu Leu Ile

195 200 205

Gly Val Phe Asp Ile Cys Cys Ile Ser Val Ser Tyr Thr Met Ile Leu

210 215 220

Arg Ala Val Val Ser Leu Ser Ser Ala Asp Ala Arg Gln Lys Ala Phe

225 230 235 240

Ser Thr Cys Thr Ala His Ile Ser Ala Ile Ile Ile Thr Tyr Val Pro

245 250 255

Ala Phe Phe Thr Phe Phe Thr His Arg Phe Gly Gly His Thr Ile Pro

260 265 270

Pro Ser Leu His Ile Ile Val Ala Asn Leu Tyr Leu Leu Leu Pro Pro

275 280 285

Thr Leu Asn Pro Ile Val Tyr Gly Met Lys Thr Lys Gln Ile Arg Asp

290 295 300

Ser Ile Ile Lys Phe Phe His Gly Glu Lys Gly Ser Arg

305 310 315

<210> 21

<211> 936

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 21

atgcaaaacc agagttttgt aacagaattc atattccttg gactttcaca gaaccctaaa 60

gtccagaaaa tagtttttat tgtattttta tttgtctaca ttgcaactgt tgggggcaac 120

atgataattg tggtgaccat tgtctgtagc ccagcattga tagactgccc catgtacttc 180

tttttggcat tcttgtccct attggatgca tgcttctctt ctgtcatcac accaaagatg 240

gttgtggact ccctgtatga gaagaaaact atctcctttg aaggatgtat gatgcagtta 300

tttgctgagc acttccttgc agcagtagaa gtgattgtct tgacagccat ggcctatgac 360

cgctatgtag caatttgcaa gcccttgcac tactcttcca tcatgaactg gaggctctgt 420

ggcacactta tggggatagc atggacaggg ggcttcttgc attctatcat acaaattatc 480

ttcacgttgc aattgccctt ctgtggacca aatgtcatcg atcatttcat gtgtgacttg 540

ttcccattac tggaacttgc ctgcactgat actcatatct ttggcctttt agtggttgcc 600

aacagtgggt ctatctgcat cataatcttc tctattttgc tggtctccta tggtgtcatc 660

ctgttctctc tgaaagctca cagttctgaa gggcgatgga aagctctctc cacatgtgga 720

tcccacattg cagttgtggt tttgttcttt gtcccgtgta tatttattta tgcacgtcct 780

ccatctgctt tctcctttga taaaatggtg gcgatatttt atactatcct aactcccttg 840

ctcaatcctg tgatttatac ttttcggaat aaggacatga aaaatgctat gaagaaagtg 900

tggaagaggt tggcagtggt ttctgatgga aagtga 936

<210> 22

<211> 311

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 22

Met Gln Asn Gln Ser Phe Val Thr Glu Phe Ile Phe Leu Gly Leu Ser

1 5 10 15

Gln Asn Pro Lys Val Gln Lys Ile Val Phe Ile Val Phe Leu Phe Val

20 25 30

Tyr Ile Ala Thr Val Gly Gly Asn Met Ile Ile Val Val Thr Ile Val

35 40 45

Cys Ser Pro Ala Leu Ile Asp Cys Pro Met Tyr Phe Phe Leu Ala Phe

50 55 60

Leu Ser Leu Leu Asp Ala Cys Phe Ser Ser Val Ile Thr Pro Lys Met

65 70 75 80

Val Val Asp Ser Leu Tyr Glu Lys Lys Thr Ile Ser Phe Glu Gly Cys

85 90 95

Met Met Gln Leu Phe Ala Glu His Phe Leu Ala Ala Val Glu Val Ile

100 105 110

Val Leu Thr Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro

115 120 125

Leu His Tyr Ser Ser Ile Met Asn Trp Arg Leu Cys Gly Thr Leu Met

130 135 140

Gly Ile Ala Trp Thr Gly Gly Phe Leu His Ser Ile Ile Gln Ile Ile

145 150 155 160

Phe Thr Leu Gln Leu Pro Phe Cys Gly Pro Asn Val Ile Asp His Phe

165 170 175

Met Cys Asp Leu Phe Pro Leu Leu Glu Leu Ala Cys Thr Asp Thr His

180 185 190

Ile Phe Gly Leu Leu Val Val Ala Asn Ser Gly Ser Ile Cys Ile Ile

195 200 205

Ile Phe Ser Ile Leu Leu Val Ser Tyr Gly Val Ile Leu Phe Ser Leu

210 215 220

Lys Ala His Ser Ser Glu Gly Arg Trp Lys Ala Leu Ser Thr Cys Gly

225 230 235 240

Ser His Ile Ala Val Val Val Leu Phe Phe Val Pro Cys Ile Phe Ile

245 250 255

Tyr Ala Arg Pro Pro Ser Ala Phe Ser Phe Asp Lys Met Val Ala Ile

260 265 270

Phe Tyr Thr Ile Leu Thr Pro Leu Leu Asn Pro Val Ile Tyr Thr Phe

275 280 285

Arg Asn Lys Asp Met Lys Asn Ala Met Lys Lys Val Trp Lys Arg Leu

290 295 300

Ala Val Val Ser Asp Gly Lys

305 310

<210> 23

<211> 975

<212> DNA

<213> 人（Homo sapiens）

<400> 23

atgcctctat ttaattcatt atgctggttt ccaacaattc atgtgactcc tccatctttt 60

attcttaatg gaatacctgg tctggaaaga gtacatgtat ggatctccct cccactctgc 120

acaatgtaca tcatcttcct tgtggggaat cttggtcttg tgtacctcat ttattatgag 180

gagtccttac atcatccgat gtattttttt tttggccatg ctctctccct cattgacctc 240

cttacctgca ccaccactct acccaatgca ctctgcatct tctggttcag tctcaaagaa 300

attaacttca atgcttgctt ggcccagatg ttctttgttc atgggttcac aggtgtggag 360

tctggggtgc tcatgctcat ggctctagac cgctatgtag ccatttgcta ccctttgcgt 420

tatgctacca cactcaccaa ccctatcatt gccaaggctg agcttgccac cttcctgagg 480

ggtgtattgc tgatgattcc tttcccattc ttggttaagc gtttgccttt ctgccaaagc 540

aatattatct cccatacgta ctgcgaccac atgtctgtag taaagctatc ttgtgccagc 600

atcaaggtca atgtaatcta tggtctaatg gttgctctcc tgattggagt gtttgacatt 660

tgttgtatat ctttgtctta cactttgatc ctcaaggcag cgatcagcct ctcttcatca 720

gatgctcggc agaaggcttt cagcacctgc actgcccata tatctgccat catcatcacc 780

tatgttccag cattcttcac tttctttgcc caccgttttg ggggacacac aattccccct 840

tctcttcaca tcattgtggc taatctttat cttcttcttc ccccaactct aaaccctatt 900

gtttatggag taaagacaaa acagatacgc aagagtgtca taaagttctt ccagggtgat 960

aagggtgcag gttga 975

<210> 24

<211> 324

<212> PRT

<213> 人（Homo sapiens）

<400> 24

Met Pro Leu Phe Asn Ser Leu Cys Trp Phe Pro Thr Ile His Val Thr

1 5 10 15

Pro Pro Ser Phe Ile Leu Asn Gly Ile Pro Gly Leu Glu Arg Val His

20 25 30

Val Trp Ile Ser Leu Pro Leu Cys Thr Met Tyr Ile Ile Phe Leu Val

35 40 45

Gly Asn Leu Gly Leu Val Tyr Leu Ile Tyr Tyr Glu Glu Ser Leu His

50 55 60

His Pro Met Tyr Phe Phe Phe Gly His Ala Leu Ser Leu Ile Asp Leu

65 70 75 80

Leu Thr Cys Thr Thr Thr Leu Pro Asn Ala Leu Cys Ile Phe Trp Phe

85 90 95

Ser Leu Lys Glu Ile Asn Phe Asn Ala Cys Leu Ala Gln Met Phe Phe

100 105 110

Val His Gly Phe Thr Gly Val Glu Ser Gly Val Leu Met Leu Met Ala

115 120 125

Leu Asp Arg Tyr Val Ala Ile Cys Tyr Pro Leu Arg Tyr Ala Thr Thr

130 135 140

Leu Thr Asn Pro Ile Ile Ala Lys Ala Glu Leu Ala Thr Phe Leu Arg

145 150 155 160

Gly Val Leu Leu Met Ile Pro Phe Pro Phe Leu Val Lys Arg Leu Pro

165 170 175

Phe Cys Gln Ser Asn Ile Ile Ser His Thr Tyr Cys Asp His Met Ser

180 185 190

Val Val Lys Leu Ser Cys Ala Ser Ile Lys Val Asn Val Ile Tyr Gly

195 200 205

Leu Met Val Ala Leu Leu Ile Gly Val Phe Asp Ile Cys Cys Ile Ser

210 215 220

Leu Ser Tyr Thr Leu Ile Leu Lys Ala Ala Ile Ser Leu Ser Ser Ser

225 230 235 240

Asp Ala Arg Gln Lys Ala Phe Ser Thr Cys Thr Ala His Ile Ser Ala

245 250 255

Ile Ile Ile Thr Tyr Val Pro Ala Phe Phe Thr Phe Phe Ala His Arg

260 265 270

Phe Gly Gly His Thr Ile Pro Pro Ser Leu His Ile Ile Val Ala Asn

275 280 285

Leu Tyr Leu Leu Leu Pro Pro Thr Leu Asn Pro Ile Val Tyr Gly Val

290 295 300

Lys Thr Lys Gln Ile Arg Lys Ser Val Ile Lys Phe Phe Gln Gly Asp

305 310 315 320

Lys Gly Ala Gly

<210> 25

<211> 939

<212> DNA

<213> 人（Homo sapiens）

<400> 25

atggagaaat ggaatcacac ttcaaatgat ttcattttgt tgggtctgct tcccccaaat 60

caaactggaa tatttctctt gtgccttatc atcctcatat tctttctggc ctcggtgggt 120

aactcggcca tgattcacct catccacgtg gatcctcgtc tccacacacc gatgtacttt 180

cttctcagcc agctctccct tatggacctg atgtacatct ccaccaccgt ccccaagatg 240

gcgtacaact tcctgtccgg ccagaaaggc atctccttcc tgggatgtgg tgtgcaaagc 300

ttcttcttcc tgaccatggc gtgttctgaa ggcttactcc tgacctccat ggcctacgac 360

cgttatttgg ccatctgcca ctctctctat tatcctatcc gcatgagtaa aatgatgtgt 420

gtgaagatga ttggaggctc ttggacactg gggtccatca actccttggc acacacagtc 480

tttgcccttc atattcccta ctgcaggtct agggctattg accatttctt ctgcgatgtc 540

ccagccatgt tgcttcttgc ctgtacagat acttgggtct atgaatatat ggtttttgta 600

agtacaagcc tctttctcct tttccctttc attggcatca cttcttcctg tggccgagtc 660

ctatttgctg tctatcatat gcactcaaag gaggggagaa aaaaggcctt caccaccatt 720

tcaacacatt taactgtagt gatcttttac tatgcacctt ttgtctacac ctatcttcgg 780

cccaggaatc tccgctcacc agctgaagac aagatcctgg cagtcttcta caccatcctt 840

acccccatgc tcaatcccat tatctacagc ctgaggaata aggaagtcct gggggctatg 900

aggagagtgt ttgggatatt ctctttcctg aaagaataa 939

<210> 26

<211> 312

<212> PRT

<213> 人（Homo sapiens）

<400> 26

Met Glu Lys Trp Asn His Thr Ser Asn Asp Phe Ile Leu Leu Gly Leu

1 5 10 15

Leu Pro Pro Asn Gln Thr Gly Ile Phe Leu Leu Cys Leu Ile Ile Leu

20 25 30

Ile Phe Phe Leu Ala Ser Val Gly Asn Ser Ala Met Ile His Leu Ile

35 40 45

His Val Asp Pro Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser Gln

50 55 60

Leu Ser Leu Met Asp Leu Met Tyr Ile Ser Thr Thr Val Pro Lys Met

65 70 75 80

Ala Tyr Asn Phe Leu Ser Gly Gln Lys Gly Ile Ser Phe Leu Gly Cys

85 90 95

Gly Val Gln Ser Phe Phe Phe Leu Thr Met Ala Cys Ser Glu Gly Leu

100 105 110

Leu Leu Thr Ser Met Ala Tyr Asp Arg Tyr Leu Ala Ile Cys His Ser

115 120 125

Leu Tyr Tyr Pro Ile Arg Met Ser Lys Met Met Cys Val Lys Met Ile

130 135 140

Gly Gly Ser Trp Thr Leu Gly Ser Ile Asn Ser Leu Ala His Thr Val

145 150 155 160

Phe Ala Leu His Ile Pro Tyr Cys Arg Ser Arg Ala Ile Asp His Phe

165 170 175

Phe Cys Asp Val Pro Ala Met Leu Leu Leu Ala Cys Thr Asp Thr Trp

180 185 190

Val Tyr Glu Tyr Met Val Phe Val Ser Thr Ser Leu Phe Leu Leu Phe

195 200 205

Pro Phe Ile Gly Ile Thr Ser Ser Cys Gly Arg Val Leu Phe Ala Val

210 215 220

Tyr His Met His Ser Lys Glu Gly Arg Lys Lys Ala Phe Thr Thr Ile

225 230 235 240

Ser Thr His Leu Thr Val Val Ile Phe Tyr Tyr Ala Pro Phe Val Tyr

245 250 255

Thr Tyr Leu Arg Pro Arg Asn Leu Arg Ser Pro Ala Glu Asp Lys Ile

260 265 270

Leu Ala Val Phe Tyr Thr Ile Leu Thr Pro Met Leu Asn Pro Ile Ile

275 280 285

Tyr Ser Leu Arg Asn Lys Glu Val Leu Gly Ala Met Arg Arg Val Phe

290 295 300

Gly Ile Phe Ser Phe Leu Lys Glu

305 310

<210> 27

<211> 879

<212> DNA

<213> 人（Homo sapiens）

<400> 27

atgagtgtaa cagaaaatac gctcatgatc ctcctcattc gcagtgactc ccgactccac 60

actccaatgt attttctgct cagccatctc tccttaatgg atatcttgca tgtttccaac 120

atcgttccca aaatggtcac taactttctg tcaggcagca gaactatttc atttgcaggt 180

tgtgggttcc aggtatttct gtccctcacc ctcctgggtg gtgagtgcct tctcctggct 240

gcaatgtcct gtgatcgcta tgtggctatc tgtcacccgc tgcgctatcc gattcttatg 300

aaggagtatg ccagcgctct catggctgga ggctcctggc tcattggggt tttcaactcc 360

acagtccaca cagcttatgc actgcagttt cccttctgtg gctctagggc aattgatcac 420

ttcttctgtg aagtccctgc catgttgaag ttgtcctgtg cagacacaac acgctatgaa 480

cgaggggttt gtgtaagtgc tgtgatcttc ctgctgatcc ctttctcctt gatctctgct 540

tcttatggcc aaattattct tactgtcctc cagatgaaat catcagaggc aaggaaaaag 600

tcattttcca cttgttcctt ccacatgatt gtggtcacga tgtactatgg gccatttatt 660

tttacatata tgagacctaa atcataccac actccagggc aggataagtt cctggcaata 720

ttctatacga tcctcacacc cacactcaac cctttcatct acagctttag gaataaagat 780

gttctggcgg tgatgaaaaa tatgctcaaa agtaactttc tgcacaaaaa aatgaatagg 840

aaaattcctg aatgtgtgtt ctgtctattt ctatgttaa 879

<210> 28

<211> 292

<212> PRT

<213> 人（Homo sapiens）

<400> 28

Met Ser Val Thr Glu Asn Thr Leu Met Ile Leu Leu Ile Arg Ser Asp

1 5 10 15

Ser Arg Leu His Thr Pro Met Tyr Phe Leu Leu Ser His Leu Ser Leu

20 25 30

Met Asp Ile Leu His Val Ser Asn Ile Val Pro Lys Met Val Thr Asn

35 40 45

Phe Leu Ser Gly Ser Arg Thr Ile Ser Phe Ala Gly Cys Gly Phe Gln

50 55 60

Val Phe Leu Ser Leu Thr Leu Leu Gly Gly Glu Cys Leu Leu Leu Ala

65 70 75 80

Ala Met Ser Cys Asp Arg Tyr Val Ala Ile Cys His Pro Leu Arg Tyr

85 90 95

Pro Ile Leu Met Lys Glu Tyr Ala Ser Ala Leu Met Ala Gly Gly Ser

100 105 110

Trp Leu Ile Gly Val Phe Asn Ser Thr Val His Thr Ala Tyr Ala Leu

115 120 125

Gln Phe Pro Phe Cys Gly Ser Arg Ala Ile Asp His Phe Phe Cys Glu

130 135 140

Val Pro Ala Met Leu Lys Leu Ser Cys Ala Asp Thr Thr Arg Tyr Glu

145 150 155 160

Arg Gly Val Cys Val Ser Ala Val Ile Phe Leu Leu Ile Pro Phe Ser

165 170 175

Leu Ile Ser Ala Ser Tyr Gly Gln Ile Ile Leu Thr Val Leu Gln Met

180 185 190

Lys Ser Ser Glu Ala Arg Lys Lys Ser Phe Ser Thr Cys Ser Phe His

195 200 205

Met Ile Val Val Thr Met Tyr Tyr Gly Pro Phe Ile Phe Thr Tyr Met

210 215 220

Arg Pro Lys Ser Tyr His Thr Pro Gly Gln Asp Lys Phe Leu Ala Ile

225 230 235 240

Phe Tyr Thr Ile Leu Thr Pro Thr Leu Asn Pro Phe Ile Tyr Ser Phe

245 250 255

Arg Asn Lys Asp Val Leu Ala Val Met Lys Asn Met Leu Lys Ser Asn

260 265 270

Phe Leu His Lys Lys Met Asn Arg Lys Ile Pro Glu Cys Val Phe Cys

275 280 285

Leu Phe Leu Cys

290

<210> 29

<211> 1113

<212> DNA

<213> 人（Homo sapiens）

<400> 29

atgttctcaa tgacaacaga agcactcaat aattttgcac ttggatgtac caacttgtta 60

atgactatga taccacaaat tgatctgaag caaattttcc tttgtcctaa ttgcagacta 120

tacatgatcc ctgttggagc tttcatcttt tccttgggaa acatgcaaaa ccaaagcttt 180

gtaactgagt ttgtcctcct gggactttca cagaatccaa atgttcagga aatagtattt 240

gttgtatttt tgtttgtcta cattgcaact gttgggggca acatgctaat tgtagtaacc 300

attctcagca gccctgctct tctggtgtct cctatgtact tcttcttggg cttcctgtcc 360

ttcctggatg cgtgcttctc atctgtcatc accccaaaga tgattgtaga ctccctctat 420

gtgacaaaaa ccatctcttt tgaaggctgc atgatgcagc tctttgctga acacttcttt 480

gctggggtgg aggtgattgt cctcacagcc atggcctatg atcgttatgt ggccatttgc 540

aagcccttgc attactcttc tatcatgaac aggaggctct gtggcattct gatgggggta 600

gcctggacag ggggcctctt gcattccatg atacaaattc tttttacttt ccagcttccc 660

ttttgtggcc ccaatgtcat caatcacttt atgtgtgact tgtacccgtt actggagctt 720

gcctgcactg atactcacat ctttggcctc atggtggtca tcaacagtgg gtttatctgc 780

atcataaact tctccttgtt gcttgtctcc tatgctgtca tcttgctctc tctgagaaca 840

cacagttctg aagggcgctg gaaagctctc tccacctgtg gatctcacat tgctgttgtg 900

attttgttct ttgtcccatg catatttgta tatacacgac ctccatctgc tttttccctt 960

gacaaaatgg cggcaatatt ttatatcatc ttaaatccct tgctcaatcc tttgatttac 1020

actttcagga ataaggaagt aaaacaggcc atgaggagaa tatggaacag actgatggtg 1080

gtttctgatg agaaagaaaa tattaaactt taa 1113

<210> 30

<211> 370

<212> PRT

<213> 人（Homo sapiens）

<400> 30

Met Phe Ser Met Thr Thr Glu Ala Leu Asn Asn Phe Ala Leu Gly Cys

1 5 10 15

Thr Asn Leu Leu Met Thr Met Ile Pro Gln Ile Asp Leu Lys Gln Ile

20 25 30

Phe Leu Cys Pro Asn Cys Arg Leu Tyr Met Ile Pro Val Gly Ala Phe

35 40 45

Ile Phe Ser Leu Gly Asn Met Gln Asn Gln Ser Phe Val Thr Glu Phe

50 55 60

Val Leu Leu Gly Leu Ser Gln Asn Pro Asn Val Gln Glu Ile Val Phe

65 70 75 80

Val Val Phe Leu Phe Val Tyr Ile Ala Thr Val Gly Gly Asn Met Leu

85 90 95

Ile Val Val Thr Ile Leu Ser Ser Pro Ala Leu Leu Val Ser Pro Met

100 105 110

Tyr Phe Phe Leu Gly Phe Leu Ser Phe Leu Asp Ala Cys Phe Ser Ser

115 120 125

Val Ile Thr Pro Lys Met Ile Val Asp Ser Leu Tyr Val Thr Lys Thr

130 135 140

Ile Ser Phe Glu Gly Cys Met Met Gln Leu Phe Ala Glu His Phe Phe

145 150 155 160

Ala Gly Val Glu Val Ile Val Leu Thr Ala Met Ala Tyr Asp Arg Tyr

165 170 175

Val Ala Ile Cys Lys Pro Leu His Tyr Ser Ser Ile Met Asn Arg Arg

180 185 190

Leu Cys Gly Ile Leu Met Gly Val Ala Trp Thr Gly Gly Leu Leu His

195 200 205

Ser Met Ile Gln Ile Leu Phe Thr Phe Gln Leu Pro Phe Cys Gly Pro

210 215 220

Asn Val Ile Asn His Phe Met Cys Asp Leu Tyr Pro Leu Leu Glu Leu

225 230 235 240

Ala Cys Thr Asp Thr His Ile Phe Gly Leu Met Val Val Ile Asn Ser

245 250 255

Gly Phe Ile Cys Ile Ile Asn Phe Ser Leu Leu Leu Val Ser Tyr Ala

260 265 270

Val Ile Leu Leu Ser Leu Arg Thr His Ser Ser Glu Gly Arg Trp Lys

275 280 285

Ala Leu Ser Thr Cys Gly Ser His Ile Ala Val Val Ile Leu Phe Phe

290 295 300

Val Pro Cys Ile Phe Val Tyr Thr Arg Pro Pro Ser Ala Phe Ser Leu

305 310 315 320

Asp Lys Met Ala Ala Ile Phe Tyr Ile Ile Leu Asn Pro Leu Leu Asn

325 330 335

Pro Leu Ile Tyr Thr Phe Arg Asn Lys Glu Val Lys Gln Ala Met Arg

340 345 350

Arg Ile Trp Asn Arg Leu Met Val Val Ser Asp Glu Lys Glu Asn Ile

355 360 365

Lys Leu

370

<210> 31

<211> 930

<212> DNA

<213> 人（Homo sapiens）

<400> 31

atggatatat cagagggaaa taagactctt gtgacagagt ttgttctcac aggacttaca 60

gatcgaccat ggctgcacgt cctcttcttt gttgtgtttt tggtggtcta tctcatcacc 120

atggtgggca accttggact gatagttcta atttggaacg acccccatct tcatatgccc 180

atgtacttat tccttggtgg tttagccttt tcagatgctt gtacttcaac ctctataacc 240

cctaggatgc tggtcaattt cttagacaag actgcaatga tatccctagc tgagtgcatc 300

acccagtttt acttttttgc ttccagtgca actacagaat gcttcctcct ggtgatgatg 360

gcctatgacc gctatgtagc catatgtaat cccttgcttt atccagtgat gatgtccaac 420

aaactcagcg ctcagttgct aagtatttca tatgtaattg gtttcctgca tcctctggtt 480

catgtgagtt tactattgcg actaactttc tgcaggttta acataataca ttatttctac 540

tgtgaaattt tacaactgtt caaaatttca tgcaatggtc catctattaa cgcactaatg 600

atatttattt ttggtgcttt tatacaaata cccactttaa tgactatcat aatctcttat 660

actcgtgtgc tctttgatat tctgaaaaaa aagtctgaaa agggcagaag caaagccttc 720

tccacatgcg gcgcccatct gctttctgtc tcattgtact acggaactct gatcttcatg 780

tatgtgcgtc ctgcatctgg cttagctgaa gaccaagaca aagtgtattc tctgttttac 840

acgattataa ttcccctgct aaacccattt atttacagct tgagaaataa aaaagtcatg 900

catgcattga gaagagttat aaggaagtaa 930

<210> 32

<211> 309

<212> PRT

<213> 人（Homo sapiens）

<400> 32

Met Asp Ile Ser Glu Gly Asn Lys Thr Leu Val Thr Glu Phe Val Leu

1 5 10 15

Thr Gly Leu Thr Asp Arg Pro Trp Leu His Val Leu Phe Phe Val Val

20 25 30

Phe Leu Val Val Tyr Leu Ile Thr Met Val Gly Asn Leu Gly Leu Ile

35 40 45

Val Leu Ile Trp Asn Asp Pro His Leu His Met Pro Met Tyr Leu Phe

50 55 60

Leu Gly Gly Leu Ala Phe Ser Asp Ala Cys Thr Ser Thr Ser Ile Thr

65 70 75 80

Pro Arg Met Leu Val Asn Phe Leu Asp Lys Thr Ala Met Ile Ser Leu

85 90 95

Ala Glu Cys Ile Thr Gln Phe Tyr Phe Phe Ala Ser Ser Ala Thr Thr

100 105 110

Glu Cys Phe Leu Leu Val Met Met Ala Tyr Asp Arg Tyr Val Ala Ile

115 120 125

Cys Asn Pro Leu Leu Tyr Pro Val Met Met Ser Asn Lys Leu Ser Ala

130 135 140

Gln Leu Leu Ser Ile Ser Tyr Val Ile Gly Phe Leu His Pro Leu Val

145 150 155 160

His Val Ser Leu Leu Leu Arg Leu Thr Phe Cys Arg Phe Asn Ile Ile

165 170 175

His Tyr Phe Tyr Cys Glu Ile Leu Gln Leu Phe Lys Ile Ser Cys Asn

180 185 190

Gly Pro Ser Ile Asn Ala Leu Met Ile Phe Ile Phe Gly Ala Phe Ile

195 200 205

Gln Ile Pro Thr Leu Met Thr Ile Ile Ile Ser Tyr Thr Arg Val Leu

210 215 220

Phe Asp Ile Leu Lys Lys Lys Ser Glu Lys Gly Arg Ser Lys Ala Phe

225 230 235 240

Ser Thr Cys Gly Ala His Leu Leu Ser Val Ser Leu Tyr Tyr Gly Thr

245 250 255

Leu Ile Phe Met Tyr Val Arg Pro Ala Ser Gly Leu Ala Glu Asp Gln

260 265 270

Asp Lys Val Tyr Ser Leu Phe Tyr Thr Ile Ile Ile Pro Leu Leu Asn

275 280 285

Pro Phe Ile Tyr Ser Leu Arg Asn Lys Lys Val Met His Ala Leu Arg

290 295 300

Arg Val Ile Arg Lys

305

<210> 33

<211> 939

<212> DNA

<213> 人（Homo sapiens）

<400> 33

atgatgggta gaaggaatga cacaaatgtg gctgacttca tccttacggg actgtcagac 60

tctgaagagg tccagatggc tctgtttatg ctatttctcc tcatatacct aattactatg 120

ctggggaatg tggggatgct attgataatc cgcctggacc tccagcttca cactcccatg 180

tattttttcc ttactcacct gtcatttatt gacctcagtt actcaactgt cgtcacacct 240

aaaaccttag cgaacttact gacttccaac tatatttcct tcacgggctg ctttgcccag 300

atgttctgtt ttgtcttctt gggtactgct gaatgttatc ttctctcctc aatggcctat 360

gatcgctatg cagcgatctg cagtcctcta cactacacag ttattatgcc caaaaggctc 420

tgcctcgctc tcatcactgg gccttatgtg attggcttta tggactcctt tgtcaatgtg 480

gtttccatga gcagattgca tttctgtgac tcaaacataa ttcatcactt tttctgtgac 540

acttccccaa ttttagctct gtcctgcact gacacagaca acactgaaat gctgatattc 600

attatcgctg gttccaccct gatggtgtcc cttatcacaa tatctgcatc ctatgtgtcc 660

attctctcta ccatcctgaa aattaattcc acttcaggaa agcagaaagc tttctctact 720

tgcgtctctc atctcttggg agtcaccatc ttctatggaa ctatgatttt tacttactta 780

aagccaagaa agtcttattc cttgggaaga gatcaagtgg ctcctgtgtt ttatactatt 840

gtgattccca tgctgaatcc actcatttat agtcttagaa acagagaagt gaaaaatgct 900

ctcattagag tcatgcagag aagacaggac tccaggtag 939

<210> 34

<211> 312

<212> PRT

<213> 人（Homo sapiens）

<400> 34

Met Met Gly Arg Arg Asn Asp Thr Asn Val Ala Asp Phe Ile Leu Thr

1 5 10 15

Gly Leu Ser Asp Ser Glu Glu Val Gln Met Ala Leu Phe Met Leu Phe

20 25 30

Leu Leu Ile Tyr Leu Ile Thr Met Leu Gly Asn Val Gly Met Leu Leu

35 40 45

Ile Ile Arg Leu Asp Leu Gln Leu His Thr Pro Met Tyr Phe Phe Leu

50 55 60

Thr His Leu Ser Phe Ile Asp Leu Ser Tyr Ser Thr Val Val Thr Pro

65 70 75 80

Lys Thr Leu Ala Asn Leu Leu Thr Ser Asn Tyr Ile Ser Phe Thr Gly

85 90 95

Cys Phe Ala Gln Met Phe Cys Phe Val Phe Leu Gly Thr Ala Glu Cys

100 105 110

Tyr Leu Leu Ser Ser Met Ala Tyr Asp Arg Tyr Ala Ala Ile Cys Ser

115 120 125

Pro Leu His Tyr Thr Val Ile Met Pro Lys Arg Leu Cys Leu Ala Leu

130 135 140

Ile Thr Gly Pro Tyr Val Ile Gly Phe Met Asp Ser Phe Val Asn Val

145 150 155 160

Val Ser Met Ser Arg Leu His Phe Cys Asp Ser Asn Ile Ile His His

165 170 175

Phe Phe Cys Asp Thr Ser Pro Ile Leu Ala Leu Ser Cys Thr Asp Thr

180 185 190

Asp Asn Thr Glu Met Leu Ile Phe Ile Ile Ala Gly Ser Thr Leu Met

195 200 205

Val Ser Leu Ile Thr Ile Ser Ala Ser Tyr Val Ser Ile Leu Ser Thr

210 215 220

Ile Leu Lys Ile Asn Ser Thr Ser Gly Lys Gln Lys Ala Phe Ser Thr

225 230 235 240

Cys Val Ser His Leu Leu Gly Val Thr Ile Phe Tyr Gly Thr Met Ile

245 250 255

Phe Thr Tyr Leu Lys Pro Arg Lys Ser Tyr Ser Leu Gly Arg Asp Gln

260 265 270

Val Ala Pro Val Phe Tyr Thr Ile Val Ile Pro Met Leu Asn Pro Leu

275 280 285

Ile Tyr Ser Leu Arg Asn Arg Glu Val Lys Asn Ala Leu Ile Arg Val

290 295 300

Met Gln Arg Arg Gln Asp Ser Arg

305 310

<210> 35

<211> 936

<212> DNA

<213> 人（Homo sapiens）

<400> 35

atgaaaatct tcaacagccc cagcaactcc agcaccttca ctggcttcat cctcctgggc 60

ttcccttgcc ccagggaggg gcagatcctc ctctttgtgc tcttcactgt tgtttacctc 120

ctgaccctca tgggcaatgg ttccatcatc tgtgctgtgc actgggatca gagactccac 180

gcccccatgt acatcctgct cgccaacttc tccttcttgg agatatgtta tgtcacctcc 240

acagtcccca gcatgctggc caacttcctc tctgacacca agatcatctc gttctctggc 300

tgcttcctcc agttctactt tttcttctcc ttgggctcta cagaatgctt tttcctggca 360

gttatggcat ttgatcgata ccttgccatc tgtcggcctc tacgctatcc aaccattatg 420

accagacgtc tctgtaccaa tcttgtggtc aattgctggg tacttggttt catctggttc 480

ttgattccta tcgtcaacat ctcccaaatg tccttctgtg gatctaggat tattgaccac 540

ttcctatgtg acccagctcc tcttctaact ctcacttgca aaaaaggccc tgtgatagag 600

cttgtctttt ctgtcttaag tcctctgcct gtctttatgc tctttctctt cattgtgggg 660

tcctatgctc tggtcgtgag agctgtgttg agggtccctt cagcagctgg gagaagaaag 720

gctttctcca cctgtgggtc tcacctggct gtggtttcac tgttctacgg ctcagtactg 780

gtcatgtatg ggagcccacc atctaagaat gaagctggaa agcagaagac tgtgactctg 840

ttttattctg ttgttacccc actgcttaac cctgtgatat atagtcttag gaacaaagat 900

atgagaaaag ctctgaagaa attttgggga acataa 936

<210> 36

<211> 311

<212> PRT

<213> 人（Homo sapiens）

<400> 36

Met Lys Ile Phe Asn Ser Pro Ser Asn Ser Ser Thr Phe Thr Gly Phe

1 5 10 15

Ile Leu Leu Gly Phe Pro Cys Pro Arg Glu Gly Gln Ile Leu Leu Phe

20 25 30

Val Leu Phe Thr Val Val Tyr Leu Leu Thr Leu Met Gly Asn Gly Ser

35 40 45

Ile Ile Cys Ala Val His Trp Asp Gln Arg Leu His Ala Pro Met Tyr

50 55 60

Ile Leu Leu Ala Asn Phe Ser Phe Leu Glu Ile Cys Tyr Val Thr Ser

65 70 75 80

Thr Val Pro Ser Met Leu Ala Asn Phe Leu Ser Asp Thr Lys Ile Ile

85 90 95

Ser Phe Ser Gly Cys Phe Leu Gln Phe Tyr Phe Phe Phe Ser Leu Gly

100 105 110

Ser Thr Glu Cys Phe Phe Leu Ala Val Met Ala Phe Asp Arg Tyr Leu

115 120 125

Ala Ile Cys Arg Pro Leu Arg Tyr Pro Thr Ile Met Thr Arg Arg Leu

130 135 140

Cys Thr Asn Leu Val Val Asn Cys Trp Val Leu Gly Phe Ile Trp Phe

145 150 155 160

Leu Ile Pro Ile Val Asn Ile Ser Gln Met Ser Phe Cys Gly Ser Arg

165 170 175

Ile Ile Asp His Phe Leu Cys Asp Pro Ala Pro Leu Leu Thr Leu Thr

180 185 190

Cys Lys Lys Gly Pro Val Ile Glu Leu Val Phe Ser Val Leu Ser Pro

195 200 205

Leu Pro Val Phe Met Leu Phe Leu Phe Ile Val Gly Ser Tyr Ala Leu

210 215 220

Val Val Arg Ala Val Leu Arg Val Pro Ser Ala Ala Gly Arg Arg Lys

225 230 235 240

Ala Phe Ser Thr Cys Gly Ser His Leu Ala Val Val Ser Leu Phe Tyr

245 250 255

Gly Ser Val Leu Val Met Tyr Gly Ser Pro Pro Ser Lys Asn Glu Ala

260 265 270

Gly Lys Gln Lys Thr Val Thr Leu Phe Tyr Ser Val Val Thr Pro Leu

275 280 285

Leu Asn Pro Val Ile Tyr Ser Leu Arg Asn Lys Asp Met Arg Lys Ala

290 295 300

Leu Lys Lys Phe Trp Gly Thr

305 310

<210> 37

<211> 966

<212> DNA

<213> 人（Homo sapiens）

<400> 37

atgtctgggg acaacagctc cagcctgacc ccaggattct ttatcttgaa tggcgttcct 60

gggctggaag ccacacacat ctggatctcc ctgccattct gctttatgta catcattgct 120

gtcgtgggga actgtgggct catctgcctc atcagccatg aggaggccct gcaccggccc 180

atgtactact tcctggccct gctctccttc actgatgtca ccttgtgcac caccatggta 240

cctaatatgc tgtgcatatt ctggttcaac ctcaaggaga ttgactttaa cgcctgcctg 300

gcccagatgt tttttgtcca tatgctgaca gggatggagt ctggggtgct catgctcatg 360

gccctggacc gctatgtggc catctgctac cccttacgct atgccaccat ccttaccaac 420

cctgtcatcg ccaaggctgg tcttgccacc ttcttgagga atgtgatgct catcatccca 480

ttcactctcc tcaccaagcg cctgccctat tgccggggga acttcatccc ccacacctac 540

tgtgaccata tgtctgtggc caaggtatcc tgtggcaatt tcaaggtcaa tgctatttat 600

ggtctgatgg ttgctctcct gattggtgtg tttgatatct gctgtatctc tgtatcttac 660

actatgattt tgcaggctgt tatgagcctg tcatcagcag atgctcgtca caaagccttc 720

agcacctgca catctcacat gtgttccatt gtgatcacct atgttgctgc ttttttcact 780

tttttcactc atcgttttgt aggacacaat atcccaaacc acatacacat catcgtggcc 840

aacctttatc tgctactgcc tcctaccatg aacccaattg tttatggagt caagaccaag 900

cagattcagg aaggtgtaat taaattttta cttggagaca aggttagttt tacctatgac 960

aaatga 966

<210> 38

<211> 321

<212> PRT

<213> 人（Homo sapiens）

<400> 38

Met Ser Gly Asp Asn Ser Ser Ser Leu Thr Pro Gly Phe Phe Ile Leu

1 5 10 15

Asn Gly Val Pro Gly Leu Glu Ala Thr His Ile Trp Ile Ser Leu Pro

20 25 30

Phe Cys Phe Met Tyr Ile Ile Ala Val Val Gly Asn Cys Gly Leu Ile

35 40 45

Cys Leu Ile Ser His Glu Glu Ala Leu His Arg Pro Met Tyr Tyr Phe

50 55 60

Leu Ala Leu Leu Ser Phe Thr Asp Val Thr Leu Cys Thr Thr Met Val

65 70 75 80

Pro Asn Met Leu Cys Ile Phe Trp Phe Asn Leu Lys Glu Ile Asp Phe

85 90 95

Asn Ala Cys Leu Ala Gln Met Phe Phe Val His Met Leu Thr Gly Met

100 105 110

Glu Ser Gly Val Leu Met Leu Met Ala Leu Asp Arg Tyr Val Ala Ile

115 120 125

Cys Tyr Pro Leu Arg Tyr Ala Thr Ile Leu Thr Asn Pro Val Ile Ala

130 135 140

Lys Ala Gly Leu Ala Thr Phe Leu Arg Asn Val Met Leu Ile Ile Pro

145 150 155 160

Phe Thr Leu Leu Thr Lys Arg Leu Pro Tyr Cys Arg Gly Asn Phe Ile

165 170 175

Pro His Thr Tyr Cys Asp His Met Ser Val Ala Lys Val Ser Cys Gly

180 185 190

Asn Phe Lys Val Asn Ala Ile Tyr Gly Leu Met Val Ala Leu Leu Ile

195 200 205

Gly Val Phe Asp Ile Cys Cys Ile Ser Val Ser Tyr Thr Met Ile Leu

210 215 220

Gln Ala Val Met Ser Leu Ser Ser Ala Asp Ala Arg His Lys Ala Phe

225 230 235 240

Ser Thr Cys Thr Ser His Met Cys Ser Ile Val Ile Thr Tyr Val Ala

245 250 255

Ala Phe Phe Thr Phe Phe Thr His Arg Phe Val Gly His Asn Ile Pro

260 265 270

Asn His Ile His Ile Ile Val Ala Asn Leu Tyr Leu Leu Leu Pro Pro

275 280 285

Thr Met Asn Pro Ile Val Tyr Gly Val Lys Thr Lys Gln Ile Gln Glu

290 295 300

Gly Val Ile Lys Phe Leu Leu Gly Asp Lys Val Ser Phe Thr Tyr Asp

305 310 315 320

Lys

<210> 39

<211> 915

<212> DNA

<213> 人（Homo sapiens）

<400> 39

atgtttatat taataagctt cacagaagaa tttgatgtgc aagtcttcct atttttatta 60

tttttagcaa tctatctatt cactctaata ggcaatttag ggctggttgt accgatcatt 120

ggggatttct ggcttcacag cccaatgtac tattttcttg gtgttttatc attcttggat 180

gtctgctatt ctacagttgt cactccaaaa atgttggtca atttcctggc aaaaaataaa 240

tctatttcat ttcttggatg tgcaacacag atgtttcttg cttgtacttt tggaaccaca 300

gaatgctttc tcttggctgc aatggcttat gatcgctatg tagccatcta caaccctctc 360

ctgtattcag tgagcatgtc acccagagtc tatgtgccac tcatcactgc ttcctatgtt 420

gctagcattt tacatgctac tatacataca gtggctacat ttagcctgtc cttctgtgga 480

tccaatgaaa ttaggcatgt cttttgtaat atgcctcctc tccttgctat ttcttgttct 540

gacactcacg taatccagct tctattcttc tactttgtgg gctctattga gatagtcact 600

atcctgattg tcctgatctc ctatggtttt attctgttgg ccattctgaa gatgcagtct 660

gctgaaggga ggagaaaagt cttctctaca tgtggagctc acctaactgg agtgacaatt 720

tatcatggga caatcctctt catgtatgtg agaccaagtt ccagctacac ttcggacaat 780

gacatgatag tgtcaatatt ttataccatt gtgattccca tgctgaatcc catcatctac 840

agtttgcgga acaaagatgt aaaggaggca atcaaaagat tgcttgtgag aaattggttc 900

ataaataagt tatag 915

<210> 40

<211> 304

<212> PRT

<213> 人（Homo sapiens）

<400> 40

Met Phe Ile Leu Ile Ser Phe Thr Glu Glu Phe Asp Val Gln Val Phe

1 5 10 15

Leu Phe Leu Leu Phe Leu Ala Ile Tyr Leu Phe Thr Leu Ile Gly Asn

20 25 30

Leu Gly Leu Val Val Pro Ile Ile Gly Asp Phe Trp Leu His Ser Pro

35 40 45

Met Tyr Tyr Phe Leu Gly Val Leu Ser Phe Leu Asp Val Cys Tyr Ser

50 55 60

Thr Val Val Thr Pro Lys Met Leu Val Asn Phe Leu Ala Lys Asn Lys

65 70 75 80

Ser Ile Ser Phe Leu Gly Cys Ala Thr Gln Met Phe Leu Ala Cys Thr

85 90 95

Phe Gly Thr Thr Glu Cys Phe Leu Leu Ala Ala Met Ala Tyr Asp Arg

100 105 110

Tyr Val Ala Ile Tyr Asn Pro Leu Leu Tyr Ser Val Ser Met Ser Pro

115 120 125

Arg Val Tyr Val Pro Leu Ile Thr Ala Ser Tyr Val Ala Ser Ile Leu

130 135 140

His Ala Thr Ile His Thr Val Ala Thr Phe Ser Leu Ser Phe Cys Gly

145 150 155 160

Ser Asn Glu Ile Arg His Val Phe Cys Asn Met Pro Pro Leu Leu Ala

165 170 175

Ile Ser Cys Ser Asp Thr His Val Ile Gln Leu Leu Phe Phe Tyr Phe

180 185 190

Val Gly Ser Ile Glu Ile Val Thr Ile Leu Ile Val Leu Ile Ser Tyr

195 200 205

Gly Phe Ile Leu Leu Ala Ile Leu Lys Met Gln Ser Ala Glu Gly Arg

210 215 220

Arg Lys Val Phe Ser Thr Cys Gly Ala His Leu Thr Gly Val Thr Ile

225 230 235 240

Tyr His Gly Thr Ile Leu Phe Met Tyr Val Arg Pro Ser Ser Ser Tyr

245 250 255

Thr Ser Asp Asn Asp Met Ile Val Ser Ile Phe Tyr Thr Ile Val Ile

260 265 270

Pro Met Leu Asn Pro Ile Ile Tyr Ser Leu Arg Asn Lys Asp Val Lys

275 280 285

Glu Ala Ile Lys Arg Leu Leu Val Arg Asn Trp Phe Ile Asn Lys Leu

290 295 300

<210> 41

<211> 936

<212> DNA

<213> 人（Homo sapiens）

<400> 41

atggaaaaaa taaacaacgt aactgaattc attttctggg gtctttctca gagcccagag 60

attgagaaag tttgttttgt ggtgttttct ttcttctaca taatcattct tctgggaaat 120

ctcctcatca tgctgacagt ttgcctgagc aacctgttta agtcacccat gtatttcttt 180

ctcagcttct tgtcttttgt ggacatttgt tactcttcag tcacagctcc caagatgatt 240

gttgacctgt tagcaaagga caaaaccatc tcctatgtgg ggtgcatgtt gcaactgttt 300

ggagtacatt tctttggttg cactgagatc ttcatcctta ctgtaatggc ctatgatcgt 360

tatgtggcta tctgtaaacc cctacattat atgaccatca tgaaccggga gacatgcaat 420

aaaatgttat tagggacgtg ggtaggtggg ttcttacact ccattatcca agtggctctg 480

gtagtccaac tacccttttg tggacccaat gagatagatc actacttttg tgatgttcac 540

cctgtgttga aacttgcctg cacagaaaca tacattgttg gtgttgttgt gacagccaac 600

agtggtacca ttgctctggg gagttttgtt atcttgctaa tctcctacag catcatccta 660

gtttccctga gaaagcagtc agcagaaggc aggcgcaaag ccctctccac ctgtggctcc 720

cacattgcca tggtcgttat ctttttcggc ccctgtactt ttatgtacat gcgccctgat 780

acgacctttt cagaggataa gatggtggct gtattttaca ccattatcac tcccatgtta 840

aatcctctga tttatacact gagaaatgca gaagtaaaga atgcaatgaa gaaactgtgg 900

ggcagaaatg ttttcttgga ggctaaaggg aaatag 936

<210> 42

<211> 311

<212> PRT

<213> 人（Homo sapiens）

<400> 42

Met Glu Lys Ile Asn Asn Val Thr Glu Phe Ile Phe Trp Gly Leu Ser

1 5 10 15

Gln Ser Pro Glu Ile Glu Lys Val Cys Phe Val Val Phe Ser Phe Phe

20 25 30

Tyr Ile Ile Ile Leu Leu Gly Asn Leu Leu Ile Met Leu Thr Val Cys

35 40 45

Leu Ser Asn Leu Phe Lys Ser Pro Met Tyr Phe Phe Leu Ser Phe Leu

50 55 60

Ser Phe Val Asp Ile Cys Tyr Ser Ser Val Thr Ala Pro Lys Met Ile

65 70 75 80

Val Asp Leu Leu Ala Lys Asp Lys Thr Ile Ser Tyr Val Gly Cys Met

85 90 95

Leu Gln Leu Phe Gly Val His Phe Phe Gly Cys Thr Glu Ile Phe Ile

100 105 110

Leu Thr Val Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Lys Pro Leu

115 120 125

His Tyr Met Thr Ile Met Asn Arg Glu Thr Cys Asn Lys Met Leu Leu

130 135 140

Gly Thr Trp Val Gly Gly Phe Leu His Ser Ile Ile Gln Val Ala Leu

145 150 155 160

Val Val Gln Leu Pro Phe Cys Gly Pro Asn Glu Ile Asp His Tyr Phe

165 170 175

Cys Asp Val His Pro Val Leu Lys Leu Ala Cys Thr Glu Thr Tyr Ile

180 185 190

Val Gly Val Val Val Thr Ala Asn Ser Gly Thr Ile Ala Leu Gly Ser

195 200 205

Phe Val Ile Leu Leu Ile Ser Tyr Ser Ile Ile Leu Val Ser Leu Arg

210 215 220

Lys Gln Ser Ala Glu Gly Arg Arg Lys Ala Leu Ser Thr Cys Gly Ser

225 230 235 240

His Ile Ala Met Val Val Ile Phe Phe Gly Pro Cys Thr Phe Met Tyr

245 250 255

Met Arg Pro Asp Thr Thr Phe Ser Glu Asp Lys Met Val Ala Val Phe

260 265 270

Tyr Thr Ile Ile Thr Pro Met Leu Asn Pro Leu Ile Tyr Thr Leu Arg

275 280 285

Asn Ala Glu Val Lys Asn Ala Met Lys Lys Leu Trp Gly Arg Asn Val

290 295 300

Phe Leu Glu Ala Lys Gly Lys

305 310

<210> 43

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<223> FLAG tag

<400> 43

gattacaagg acgacgacga taag 24

<210> 44

<211> 8

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> FLAG tag

<400> 44

Asp Tyr Lys Asp Asp Asp Asp Lys

1 5

<210> 45

<211> 60

<212> DNA

<213> 人工序列（Artificial Sequence）

<223> Rho tag

<400> 45

atgaacggga ccgagggccc aaacttctac gtgcctttct ccaacaagac gggcgtggtg 60

<210> 46

<211> 20

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> Rho tag

<400> 46

Met Asn Gly Thr Glu Gly Pro Asn Phe Tyr Val Pro Phe Ser Asn Lys

1 5 10 15

Thr Gly Val Val

20

<210> 47

<211> 51

<212> DNA

<213> 人工序列（Artificial Sequence）

<223> Lucy tag

<400> 47

atgagacccc agatcctgct gctcctggcc ctgctgaccc taggcctggc t 51

<210> 48

<211> 17

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> Lucy tag

<400> 48

Met Arg Pro Gln Ile Leu Leu Leu Leu Ala Leu Leu Thr Leu Gly Leu

1 5 10 15

Ala

<210> 49

<211> 1376

<212> DNA

<213> 人（Homo sapiens）

<400> 49

atgggtctgt gctacagtct gcggccgctg cttttcgggg gcccagggga cgacccctgc 60

gcggcctcgg agccgccggt ggaggacgcg cagcccgccc cggccccggc cctggcccca 120

gtccgggcgg ccgcaaggga cacggcccgg accctgctcc ctcggggcgg cgaagggagc 180

ccggcatgcg ctcggcccaa agcagacaag ccgaaggaga agcggcagcg caccgagcag 240

cttagtgccg aggagcgcga ggcggccaag gagcgcgagg cggtcaagga ggcgaggaaa 300

gtgagccggg gcatcgaccg catgctgcgc gaccagaagc gcgacctgca gcagacgcac 360

cggctcctgc tgctcggggc tggtgagtct gggaaaagca ctatcgtcaa acagatgagg 420

atcctgcacg tcaatgggtt taatcccgag gaaaagaaac agaaaattct ggacatccgg 480

aaaaatgtta aagatgctat cgtgacaatt gtttcagcaa tgagtactat aatacctcca 540

gttccgctgg ccaaccctga aaaccaattt cgatcagact acatcaagag catagcccct 600

atcactgact ttgaatattc ccaggaattc tttgaccatg tgaaaaaact ttgggacgat 660

gaaggcgtga aggcatgctt tgagagatcc aacgaatacc agctgattga ctgtgcacaa 720

tacttcctgg aaagaatcga cagcgtcagc ttggttgact acacacccac agaccaggac 780

ctcctcagat gcagagttct gacatctggg atttttgaga acgattccaa gtggacaaag 840

taaacttcca catgtttgat gttggtggcc agagggatga gaggagaaaa tggatccagt 900

gctttaacga tgtcacagct atcatttacg tcgcagcctg cagtagctac aacatggtga 960

ttcgagaaga taacaacacc aacaggctga gagagtccct ggatcttttt gaaagcatct 1020

ggaacaacag gtggttacgg accatttcta tcatcttgtt cttgaacaaa caagatatgc 1080

tggcagaaaa agtcttggca gggaaatcaa aaattgaaga ctatttccca gaatatgcaa 1140

attatactgt tcctgaagac gcaacaccag atgcaggaga agatcccaaa gttacaagag 1200

ccaagttctt tatccgggac ctgtttttga ggatcagcac ggccaccggt gacggcaaac 1260

attactgcta cccgcacttc acctgcgccg tggacacaga gaacatccgc agggtgttca 1320

acgactgccg cgacatcatc cagcggatgc acctcaagca gtatgagctc ttgtga 1376

<210> 50

<211> 458

<212> PRT

<213> 人（Homo sapiens）

<400> 50

Met Gly Leu Cys Tyr Ser Leu Arg Pro Leu Leu Phe Gly Gly Pro Gly

1 5 10 15

Asp Asp Pro Cys Ala Ala Ser Glu Pro Pro Val Glu Asp Ala Gln Pro

20 25 30

Ala Pro Ala Pro Ala Leu Ala Pro Val Arg Ala Ala Ala Arg Asp Thr

35 40 45

Ala Arg Thr Leu Leu Pro Arg Gly Gly Glu Gly Ser Pro Ala Cys Ala

50 55 60

Arg Pro Lys Ala Asp Lys Pro Lys Glu Lys Arg Gln Arg Thr Glu Gln

65 70 75 80

Leu Ser Ala Glu Glu Arg Glu Ala Ala Lys Glu Arg Glu Ala Val Lys

85 90 95

Glu Ala Arg Lys Val Ser Arg Gly Ile Asp Arg Met Leu Arg Asp Gln

100 105 110

Lys Arg Asp Leu Gln Gln Thr His Arg Leu Leu Leu Leu Gly Ala Gly

115 120 125

Glu Ser Gly Lys Ser Thr Ile Val Lys Gln Met Arg Ile Leu His Val

130 135 140

Asn Gly Phe Asn Pro Glu Glu Lys Lys Gln Lys Ile Leu Asp Ile Arg

145 150 155 160

Lys Asn Val Lys Asp Ala Ile Val Thr Ile Val Ser Ala Met Ser Thr

165 170 175

Ile Ile Pro Pro Val Pro Leu Ala Asn Pro Glu Asn Gln Phe Arg Ser

180 185 190

Asp Tyr Ile Lys Ser Ile Ala Pro Ile Thr Asp Phe Glu Tyr Ser Gln

195 200 205

Glu Phe Phe Asp His Val Lys Lys Leu Trp Asp Asp Glu Gly Val Lys

210 215 220

Ala Cys Phe Glu Arg Ser Asn Glu Tyr Gln Leu Ile Asp Cys Ala Gln

225 230 235 240

Tyr Phe Leu Glu Arg Ile Asp Ser Val Ser Leu Val Asp Tyr Thr Pro

245 250 255

Thr Asp Gln Asp Leu Leu Arg Cys Arg Val Leu Thr Ser Gly Ile Phe

260 265 270

Glu Thr Arg Phe Gln Val Asp Lys Val Asn Phe His Met Phe Asp Val

275 280 285

Gly Gly Gln Arg Asp Glu Arg Arg Lys Trp Ile Gln Cys Phe Asn Asp

290 295 300

Val Thr Ala Ile Ile Tyr Val Ala Ala Cys Ser Ser Tyr Asn Met Val

305 310 315 320

Ile Arg Glu Asp Asn Asn Thr Asn Arg Leu Arg Glu Ser Leu Asp Leu

325 330 335

Phe Glu Ser Ile Trp Asn Asn Arg Trp Leu Arg Thr Ile Ser Ile Ile

340 345 350

Leu Phe Leu Asn Lys Gln Asp Met Leu Ala Glu Lys Val Leu Ala Gly

355 360 365

Lys Ser Lys Ile Glu Asp Tyr Phe Pro Glu Tyr Ala Asn Tyr Thr Val

370 375 380

Pro Glu Asp Ala Thr Pro Asp Ala Gly Glu Asp Pro Lys Val Thr Arg

385 390 395 400

Ala Lys Phe Phe Ile Arg Asp Leu Phe Leu Arg Ile Ser Thr Ala Thr

405 410 415

Gly Asp Gly Lys His Tyr Cys Tyr Pro His Phe Thr Cys Ala Val Asp

420 425 430

Thr Glu Asn Ile Arg Arg Val Phe Asn Asp Cys Arg Asp Ile Ile Gln

435 440 445

Arg Met His Leu Lys Gln Tyr Glu Leu Leu

450 455

<210> 51

<211> 1125

<212> DNA

<213> 人（Homo sapiens）

<400> 51

atggcccggt cgctgacctg gcgctgctgc ccctggtgcc tgacggagga tgagaaggcc 60

gccgcccggg tggaccagga gatcaacagg atcctcttgg agcagaagaa gcaggaccgc 120

ggggagctga agctgctgct tttgggccca ggcgagagcg ggaagagcac cttcatcaag 180

cagatgcgga tcatccacgg cgccggctac tcggaggagg agcgcaaggg cttccggccc 240

ctggtctacc agaacatctt cgtgtccatg cgggccatga tcgaggccat ggagcggctg 300

cagattccat tcagcaggcc cgagagcaag caccacgcca gcctggtcat gagccaggac 360

ccctataaag tgaccacgtt tgagaagcgc tacgctgcgg ccatgcagtg gctgtggagg 420

gatgccggca tccgggcctg ctatgagcgt cggcgggaat tccacctgct cgattcagcc 480

gtgtactacc tgtcccacct ggagcgcatc accgaggagg gctacgtccc cacagctcag 540

gacgtgctcc gcagccgcat gcccaccact ggcatcaacg agtactgctt ctccgtgcag 600

aaaaccaacc tgcggatcgt ggacgtcggg ggccagaagt cagagcgtaa gaaatggatc 660

cattgtttcg agaacgtgat cgccctcatc tacctggcct cactgagtga atacgaccag 720

tgcctggagg agaacaacca ggagaaccgc atgaaggaga gcctcgcatt gtttgggact 780

atcctggaac taccctggtt caaaagcaca tccgtcatcc tctttctcaa caaaaccgac 840

atcctggagg agaaaatccc cacctcccac ctggctacct atttccccag tttccagggc 900

cctaagcagg atgctgaggc agccaagagg ttcatcctgg acatgtacac gaggatgtac 960

accgggtgcg tggacggccc cgagggcagc aagaagggcg cacgatcccg acgcctcttc 1020

agccactaca catgtgccac agacacacag aacatccgca aggtcttcaa ggacgtgcgg 1080

gactcggtgc tcgcccgcta cctggacgag atcaacctgc tgtga 1125

<210> 52

<211> 374

<212> PRT

<213> 人（Homo sapiens）

<400> 52

Met Ala Arg Ser Leu Thr Trp Arg Cys Cys Pro Trp Cys Leu Thr Glu

1 5 10 15

Asp Glu Lys Ala Ala Ala Arg Val Asp Gln Glu Ile Asn Arg Ile Leu

20 25 30

Leu Glu Gln Lys Lys Gln Asp Arg Gly Glu Leu Lys Leu Leu Leu Leu

35 40 45

Gly Pro Gly Glu Ser Gly Lys Ser Thr Phe Ile Lys Gln Met Arg Ile

50 55 60

Ile His Gly Ala Gly Tyr Ser Glu Glu Glu Arg Lys Gly Phe Arg Pro

65 70 75 80

Leu Val Tyr Gln Asn Ile Phe Val Ser Met Arg Ala Met Ile Glu Ala

85 90 95

Met Glu Arg Leu Gln Ile Pro Phe Ser Arg Pro Glu Ser Lys His His

100 105 110

Ala Ser Leu Val Met Ser Gln Asp Pro Tyr Lys Val Thr Thr Phe Glu

115 120 125

Lys Arg Tyr Ala Ala Ala Met Gln Trp Leu Trp Arg Asp Ala Gly Ile

130 135 140

Arg Ala Cys Tyr Glu Arg Arg Arg Glu Phe His Leu Leu Asp Ser Ala

145 150 155 160

Val Tyr Tyr Leu Ser His Leu Glu Arg Ile Thr Glu Glu Gly Tyr Val

165 170 175

Pro Thr Ala Gln Asp Val Leu Arg Ser Arg Met Pro Thr Thr Gly Ile

180 185 190

Asn Glu Tyr Cys Phe Ser Val Gln Lys Thr Asn Leu Arg Ile Val Asp

195 200 205

Val Gly Gly Gln Lys Ser Glu Arg Lys Lys Trp Ile His Cys Phe Glu

210 215 220

Asn Val Ile Ala Leu Ile Tyr Leu Ala Ser Leu Ser Glu Tyr Asp Gln

225 230 235 240

Cys Leu Glu Glu Asn Asn Gln Glu Asn Arg Met Lys Glu Ser Leu Ala

245 250 255

Leu Phe Gly Thr Ile Leu Glu Leu Pro Trp Phe Lys Ser Thr Ser Val

260 265 270

Ile Leu Phe Leu Asn Lys Thr Asp Ile Leu Glu Glu Lys Ile Pro Thr

275 280 285

Ser His Leu Ala Thr Tyr Phe Pro Ser Phe Gln Gly Pro Lys Gln Asp

290 295 300

Ala Glu Ala Ala Lys Arg Phe Ile Leu Asp Met Tyr Thr Arg Met Tyr

305 310 315 320

Thr Gly Cys Val Asp Gly Pro Glu Gly Ser Lys Lys Gly Ala Arg Ser

325 330 335

Arg Arg Leu Phe Ser His Tyr Thr Cys Ala Thr Asp Thr Gln Asn Ile

340 345 350

Arg Lys Val Phe Lys Asp Val Arg Asp Ser Val Leu Ala Arg Tyr Leu

355 360 365

Asp Glu Ile Asn Leu Leu

370

<210> 53

<211> 10

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> 蛋白基序（Protein motif）

<400> 53

Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys

1 5 10

<210> 54

<211> 7

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> 蛋白基序（Protein motif）

<400> 54

Phe Ser Thr Cys Ser Ser His

1 5

<210> 55

<211> 8

<212> PRT

<213> 人工序列（Artificial Sequence）

<223> 蛋白基序（Protein motif）

<400> 55

Pro Met Leu Asn Pro Phe Ile Tyr

1 5

Claims

1.一种用于鉴定化合物的方法，该化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的嗅觉受体的活性，该方法包括：

b.通过测量在所述受试物质存在和不存在的情况下所述嗅觉受体的反应来测量所述嗅觉受体对所述引起恶臭的物质的反应；

c.根据测量的在所述受试物质存在和不存在时的反应，鉴定调节所述嗅觉受体反应的受试物质；和

d.选择所鉴定的受试物质作为调节所述嗅觉受体对所述引起恶臭的物质反应的化合物，

其中所述引起恶臭的物质是二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。

2.一种用于鉴定恶臭限制剂的方法，包括：

a.使受试物质和引起恶臭的物质与至少一种嗅觉受体接触，其中所述受体包含多肽，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列；

b.测量所述嗅觉受体多肽对所述引起恶臭的物质的反应；

c.基于所测量的反应，鉴定能抑制所述嗅觉受体反应的受试物质；和

d.选择抑制所述嗅觉受体反应的受试物质作为恶臭限制剂，

其中所述引起恶臭的物质为DMTS或DMDS。

3.一种用于鉴定化合物的方法，所述化合物结合、抑制、阻断、限制和/或调节由引起恶臭的物质激活的至少一种嗅觉受体的活性，该方法包括：

a.使受体、或其嵌合体或其片段与化合物接触；和

b.确定所述化合物是否对所述受体的活性有影响；

其中所述受体为多肽，该多肽

i)包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列；或者

ii)由核酸分子编码，所述核酸分子包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列；

其中所述引起恶臭的物质为二甲基三硫化物(DMTS)或二甲基二硫醚(DMDS)。

4.一种鉴定化合物的方法，推定该化合物调节DMTS或DMDS相关的恶臭，该方法包括：(i)使表达DMTS或DMDS受体多肽的细胞系与至少一种化合物接触；(ii)筛选出结合、抑制、阻断、限制和/或调节所述嗅觉受体多肽活性的化合物；和(iii)如果一种化合物结合、抑制、阻断、限制和/或调节所述DMTS或DMDS受体多肽的活性，则鉴定出推定调节DMTS或DMDS相关恶臭的化合物，

其中所述受体多肽

a.包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12，SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少90％序列同一性的氨基酸序列；或者

b.由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQID NO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列的核酸分子编码。

5.一种分离的多肽，其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

6.一种分离的核酸分子，包含：

a.编码权利要求5的多肽的核酸序列；或者

b.与SEQ ID NO:1，SEQ ID NO：3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:39、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39或其反向互补序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

7.一种重组核酸分子，包含：

a.包含标签组合的核酸，所述标签组合包含Lucy标签、标签和/或Rho标签中的至少一种；和

8.根据权利要求7所述的重组核酸分子，其中所述Lucy标签包含SEQ ID NO:47，所述标签包含SEQ ID NO:43，以及所述Rho标签包含SEQ ID NO:45。

9.一种表达载体，其包含权利要求6～8中任一项所述的核酸。

10.一种非人宿主生物体或宿主细胞，其经过修饰以表达由DMTS或DMDS激活的受体，其中所述受体

a.从由Olfr1193、Olfr1093、Olfr1097、Olfr166、Olfr169、Olfr738、Olfr742、Olfr207、Olfr665、Olfr669、Olfr1211、OR52N5、OR2L13、OR2AJ1、OR4C15、OR5AC2、OR8H3、OR11G2、OR52N2和OR5T1构成的群组中选出；或者

b.包含权利要求5所述的多肽或由权利要求6～8中任一项所述的核酸编码的多肽。

11.一种非人宿主生物体或宿主细胞，包含

a.权利要求6～8中任一项所述的核酸；或者

b.权利要求9所述的表达载体。

12.根据权利要求10或11所述的非人宿主生物体或宿主细胞，其中所述细胞为真核细胞。

13.根据权利要求10～11所述的非人宿主生物体或宿主细胞，其中所述细胞为原核细胞。

14.根据权利要求10～11中任一项所述的非人宿主生物体或宿主细胞，其中所述非人宿主生物体或宿主细胞从由HEK293、CHO、非洲爪蟾卵母细胞、COS、酵母和来自嗅觉基板细胞构成的群组中选出。

15.能被DMTS或DMDS激活的多肽的用途，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38或SEQ ID NO:40具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，用于鉴定恶臭调节化合物。