CN111164426A - 碳水化合物传感器 - Google Patents

碳水化合物传感器 Download PDF

Info

Publication number
CN111164426A
CN111164426A CN201880063917.2A CN201880063917A CN111164426A CN 111164426 A CN111164426 A CN 111164426A CN 201880063917 A CN201880063917 A CN 201880063917A CN 111164426 A CN111164426 A CN 111164426A
Authority
CN
China
Prior art keywords
leu
lys
seq
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880063917.2A
Other languages
English (en)
Other versions
CN111164426B (zh
Inventor
K·卡龙
S·C·特罗威尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commonwealth Scientific and Industrial Research Organization CSIRO
Original Assignee
Commonwealth Scientific and Industrial Research Organization CSIRO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2017903148A external-priority patent/AU2017903148A0/en
Application filed by Commonwealth Scientific and Industrial Research Organization CSIRO filed Critical Commonwealth Scientific and Industrial Research Organization CSIRO
Publication of CN111164426A publication Critical patent/CN111164426A/zh
Application granted granted Critical
Publication of CN111164426B publication Critical patent/CN111164426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/04Dairy products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
    • C12Y113/12Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
    • C12Y113/12007Photinus-luciferin 4-monooxygenase (ATP-hydrolysing) (1.13.12.7), i.e. firefly-luciferase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6486Measuring fluorescence of biological material, e.g. DNA, RNA, cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/75Systems in which material is subjected to a chemical reaction, the progress or the result of the reaction being investigated
    • G01N21/76Chemiluminescence; Bioluminescence
    • G01N21/763Bioluminescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/536Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
    • G01N33/542Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with steric inhibition or signal modification, e.g. fluorescent quenching
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54306Solid-phase reaction mechanisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/66Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving blood sugars, e.g. galactose
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6875Nucleoproteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/902Oxidoreductases (1.)
    • G01N2333/90241Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2400/00Assays, e.g. immunoassays or enzyme assays, involving carbohydrates

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plasma & Fusion (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及用于检测样品中诸如乳糖的碳水化合物的传感器和方法。传感器和方法也可用于测定样品中碳水化合物的量。

Description

碳水化合物传感器
技术领域
本发明涉及用于检测样品中诸如乳糖的碳水化合物的传感器和方法。传感器和方法也可用于测定样品中碳水化合物的量。
背景技术
用于检测包括糖和糖衍生物的碳水化合物的测定法广泛用于食品和医疗工业。食品工业特别感兴趣的是检测乳制品中诸如乳糖的碳水化合物的测定法。
目前,乳制品中的常规乳糖分析用高效液相色谱(HPLC)实现。该方法产生对乳糖的准确、灵敏和选择性测量,但是分析需要将样品运输到实验室设备,该实验室设备具有由训练有素的人员操作的昂贵设备(Euber和Brunner,1979;Indyk等,1996;Xinmin等人,2008;Erich等人,2012)。用于检测/测量乳糖的其他技术使用酶级联来间接测量溶液中乳糖的浓度。这些测定通常通过用β-半乳糖苷酶将乳糖酶水解成半乳糖和葡萄糖,然后氧化任一种单糖来进行(Kleyn,1985;Ansari等人,2012;Gia等人,2014)。乳糖的定量通过使用分光光度法、安培法或比色法测量氧化步骤的化学计量副产物NADH或H2O2来实现。这些测定需要许多试剂和许多步骤,使得它们对于加工厂中的常规使用来说太冗长和麻烦。它们具有固有的低选择性。或者,高水平的乳糖(例如3.9-4.8%(w/v))可以通过近红外光谱测定(Tsenkova等人,1999)。然而,对于测量较低水平的乳糖,如低于1%(w/v)乳糖,该方法是不准确的,并且需要昂贵的设备。
因此,需要另外的检测和定量样品中碳水化合物的量的方法,优选可以实时进行的方法,具有增加的灵敏度和/或不必将样品送到非现场进行分析。
发明内容
本发明人已经鉴定了可用于检测样品中碳水化合物的传感器。本发明人还鉴定了使用这些传感器检测样品中碳水化合物存在的改进方法。在一些实施方案中,这些传感器和方法可用于测量样品中碳水化合物的浓度。他们还鉴定了使用这些传感器检测乳制品乳糖的改进方法。在一些实施方案中,传感器和方法可用于测量乳制品的乳糖含量。在一些实施方案中,传感器和方法可用于基于乳制品的乳糖含量对乳制品进行分类。
在一个方面,提供了用于检测碳水化合物的传感器分子,所述传感器包括:
i)螺旋-转角-螺旋转录因子的碳水化合物结合结构域,或所述碳水化合物结合结构域的变体;
ii)化学发光供体结构域;以及
iii)受体结构域;
其中当所述碳水化合物结合至所述碳水化合物结合结构域时,所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
在一些实施方案中,螺旋-转角-螺旋转录因子是细菌螺旋-转角-螺旋转录因子或其变体。在一些实施方案中,细菌螺旋-转角-螺旋转录因子是GNTR转录因子或其变体。在一些实施方案中,细菌螺旋-转角-螺旋转录因子或其变体具有与SEQ ID NO:1提供的氨基酸序列至少60%相同的氨基酸序列。在另一个实施方案中,结合结构域具有与SEQ ID NO:9提供的氨基酸序列至少60%相同的氨基酸序列。
在另一个实施方案中,结合结构域具有与SEQ ID NO:9和56-74中任何一个或多个提供的氨基酸序列至少30%相同的氨基酸序列。
在一些实施方案中,碳水化合物是糖或糖衍生物。在一些实施方案中,碳水化合物是糖。在一些实施方案中,糖是二糖。在优选的实施方案中,二糖是乳糖。在另一个实施方案中,二糖是乳果糖。在一些实施方案中,碳水化合物是糖衍生物。在一些实施方案中,糖衍生物选自由以下组成的组:氨基糖、酸性糖、脱氧糖、糖醇、葡基胺和磷酸糖。
在一些实施方案中,化学发光供体结构域是生物发光蛋白。在一些实施方案中,生物发光蛋白是荧光素酶、β-半乳糖苷酶、内酰胺酶、辣根过氧化物酶、碱性磷酸酶、β-葡糖醛酸糖苷酶或β-葡糖苷酶。在一些实施方案中,生物发光蛋白是荧光素酶。在一些实施方案中,所述萤光素酶是海肾萤光素酶、萤火虫萤光素酶、腔肠动物(Coelenterate)萤光素酶、北美萤火虫(North American glow worm)萤光素酶、叩头虫(click beetle)萤光素酶、铁路蠕虫(railroad worm)萤光素酶、细菌萤光素酶、Gaussia萤光素酶、水母(Aequorin)发光蛋白、蕈蚊(Arachnocampa)萤光素酶、Oplophorus gracilirostris萤光素酶或其任何一种的生物活性变体或片段,或其两种或更多种的嵌合体。
在一些实施方案中,化学发光供体结构域能够修饰底物。在一些实施方案中,所述底物是荧光素,钙,腔肠素,furimazine,或腔肠素、荧光素或furimazine的衍生物、类似物或稳定衍生物。
在一些实施方案中,受体结构域是荧光受体结构域。在一些实施方案中,其中所述荧光受体结构域选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。
在一些实施方案中,在存在和/或不存在碳水化合物的情况下,化学发光供体结构域和受体结构域的分离和相对取向在费尔斯特
Figure BDA0002432636120000021
距离的±50%内。在一些实施方案中,化学发光供体结构域和受体结构域的费尔斯特距离至少为5.6nm。在一些实施方案中,化学发光供体结构域和受体结构域之间费尔斯特距离在约5.6nm和约10nm之间。
另一方面,还提供了检测样品中碳水化合物的方法,该方法包括:
i)使样品与本文定义的传感器分子接触;以及
ii)确定化学发光供体结构域相对于受体结构域的空间位置和/或偶极取向在样品存在下是否已经改变,
其中所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向的改变表明所述样品中存在碳水化合物。
在一些实施方案中,所述方法还包括测定样品中碳水化合物的浓度。在一些实施方案中,所述方法在微流体装置上进行。在一些实施方案中,样品是空气、液体、生物材料或土壤。在一些实施方案中,样品包含乳制品。在优选的实施方案中,样品是乳品。
另一方面提供了一种用于检测乳糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。乳糖与传感器分子的结合产生共振能量转移(RET)的变化,例如BRET的变化或FRET的变化。因此,传感器可用于检测样品中乳糖的存在和/或测定样品中乳糖的浓度。
另一方面提供了一种用于检测乳果糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳果糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。乳果糖与传感器分子的结合产生共振能量转移(RET)的变化,例如BRET的变化或FRET的变化。因此,传感器可用于检测样品中乳果糖的存在和/或测定样品中乳糖的浓度。
在一些实施方案中,所述转录因子或其变体具有与SEQ ID NO:1中提供的氨基酸序列至少60%、70%、80%、85%、90%、95%、98%或100%相同的氨基酸序列。在一些实施方案中,转录因子或其变体具有SEQ ID NO:1提供的氨基酸序列。
传感器分子可以是基于BRET或FRET的传感器。在一些实施方案中,传感器分子是基于BRET的传感器,使得乳糖与传感器分子的结合产生BRET的变化。因此,在一些实施方案中,共振能量转移供体结构域是生物发光蛋白。合适的生物发光蛋白包括荧光素酶、β-半乳糖苷酶、内酰胺酶、辣根过氧化物酶、碱性磷酸酶、β-葡糖醛酸糖苷酶或β-葡糖苷酶。在一些实施方案中,生物发光蛋白是荧光素酶。在一些实施方案中,所述萤光素酶是海肾萤光素酶、萤火虫萤光素酶、腔肠动物(Coelenterate)萤光素酶、北美萤火虫(North Americanglow worm)萤光素酶、叩头虫(click beetle)萤光素酶、铁路蠕虫(railroad worm)萤光素酶、细菌萤光素酶、Gaussia萤光素酶、水母(Aequorin)发光蛋白、蕈蚊(Arachnocampa)萤光素酶、Oplophorus gracilirostris萤光素酶或其任何一种的生物活性变体或片段,或其两种或更多种的嵌合体。在一些实施方案中,供体结构域能够修饰底物。合适的底物包括荧光素,钙,腔肠素,furimazine,或腔肠素、荧光素或furimazine的衍生物、类似物或稳定衍生物。
在一些实施方案中,传感器分子是基于FRET的传感器,使得乳糖与传感器分子的结合产生FRET的变化。因此,在一些实施方案中,共振能量转移供体结构域是荧光蛋白。在一些实施方案中,其中所述荧光蛋白选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。
对于基于BRET和FRET的乳糖传感器,共振能量转移受体结构域可以是荧光受体结构域。在一些实施方案中,荧光受体结构域是荧光蛋白。在一些实施方案中,其中所述荧光受体结构域选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。
在一些实施方案中,共振能量转移供体结构域是海肾荧光素酶或其变体,且共振能量转移受体结构域是GFP或其变体。在一些实施例中,本发明提供了一种传感器分子,该传感器分子与选自SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17和SEQ ID NO:18组成的组的多肽序列具有至少60%、70%、80%、85%、90%、95%、98%、99%或100%的序列一致性。在这些实施方案中,乳糖与传感器分子的结合产生BRET的变化。
在一些实施方案中,共振能量转移供体结构域是CFP或其变体,且共振能量转移受体结构域是YFP或其变体。一些实施方案中,本发明提供了一种传感器分子,其与SEQ IDNO:23提供的多肽具有至少60%、70%、80%、85%、90%、95%、98%、99%或100%的序列一致性。在这些实施方案中,乳糖与传感器分子的结合产生FRET的变化。
在一些实施方案中,在存在和/或不存在乳糖的情况下,供体结构域和受体结构域的分离和相对取向在费尔斯特
Figure BDA0002432636120000041
距离的±50%内。在一些实施方案中,供体结构域和受体结构域的费尔斯特距离为至少5.6nm。在一些实施方案中,供体结构域和受体结构域的费尔斯特距离为约5.6nm-约10nm。
另一方面,还提供了检测样品中乳糖的方法,所述方法包括:
i)使样品与如本文所定义的用于检测乳糖的传感器分子接触;以及
ii)确定发光供体结构域相对于受体结构域的空间位置和/或偶极取向在所述样品存在下是否已经改变,
其中所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向的改变表明所述样品中存在乳糖。在一些实施方案中,所述方法还包括测定样品中乳糖的浓度。在一些实施方案中,所述方法在微流体装置上进行。在一些实施方案中,样品是空气、液体、生物材料或土壤。在一些实施方案中,样品包含乳制品。在一些实施方案中,乳制品是乳品。
另一方面,还提供了一种检测样品中乳果糖的方法,所述方法包括:
i)使样品与本文定义的传感器分子接触;以及
ii)确定发光供体结构域相对于受体结构域的空间位置和/或偶极取向在所述样品存在下是否已经改变,
其中供体结构域相对于受体结构域的空间位置和/或偶极取向的改变表明样品中存在乳果糖。在一些实施方案中,所述方法还包括测定样品中乳果糖的浓度。在一些实施方案中,所述方法在微流体装置上进行。在一些实施方案中,样品是空气、液体、生物材料或土壤。在一些实施方案中,样品包含乳制品。在一些实施方案中,乳制品是乳品。
在一些实施方案中,传感器分子是单个多肽。在一些实施方案中,化学发光供体结构域位于N-末端,且受体结构域位于C-末端。在另一个实施方案中,受体结构域位于N-末端,且化学发光供体结构域位于C-末端。在一些实施方案中,共振能量转移供体结构域位于N-末端,且共振能量转移受体结构域位于C-末端。在可选择的实施方案中,共振能量转移受体结构域位于N-末端,且共振能量转移供体结构域位于C-末端。
在一些实施方案中,传感器分子包含至少一个肽接头。
另一方面,还提供了编码本文定义的传感器分子的多核苷酸。另一方面,还提供了包含编码本文定义的传感器分子的多核苷酸的载体。另一方面,还提供了包含本文定义的多核苷酸和/或载体的宿主细胞。另一方面,还提供了生产传感器分子的方法,该方法包括在允许编码多肽的多核苷酸表达的条件下培养本文定义的宿主细胞或载体,并回收表达的多肽。
除非另外具体说明,否则本文中的任何实施例应被理解为比照适用于任何其他实施例。
本发明不限于这里描述的特定实施例的范围,这些实施例仅用于示例的目的。如本文所述,功能等同的产品、组合物和方法显然在本发明的范围内。
在整个说明书中,除非另有特别说明或上下文另有要求,提及单个步骤、物质组成、步骤组或物质组成组应被认为包括一个和多个(即一个或多个)那些步骤、物质组成、步骤组或物质组成组。
以下通过下述非限制性实施例并参考附图描述本发明。
附图说明
图1-本发明的实施方案的示意图。所示传感器分子LacB1包含BgaR转录因子,其N-和C-末端分别侧接GFP2和RLuc8。
图2-水(深灰色条)或1mM乳糖(浅灰色条)中1μM的LacB1和LacF1传感器的RET比率(平均值±标准偏差(SD),n=3)。添加17μM腔肠素400a底物后记录BRET2扫描。*p<0.0001。
图3-LacB1对0.000034w/v%-0.34%w/v乳糖的BRET2响应。
图4-本发明的实施方案的示意图。LacB1包含BgaR转录因子(浅灰色),在N-和C-末端分别侧接GFP2(中灰色)和RLuc8(深灰色)。LacB2包含LacB1,其氨基酸接头-GGTGGG-插入到BgaR和GFP2以及BgaR和RLuc8之间。LacB3包含LacB1,其接头-GGTGGG-插入BgaR和GFP2之间。LacB4包含LacB1,其接头-GGTGGG-插入BgaR和RLuc8之间。接头的位置由连接BgaR和GFP2和/或BgaR和RLuc8的黑色部分表示。
图5-LacB1(1)、LacB2(2)、LacB3(3)和LacB4(4)对1mM乳糖存在的BRET2响应。
图6-在二糖乳糖、麦芽糖和乳果糖以及单糖半乳糖和葡萄糖存在下,LacB1传感器的BRET2比率的变化。在与指定的糖在30℃下温育30分钟后,向1μM的LacB1中添加17μM腔肠素400a后,记录BRET2的比率(平均值±SD,n=3)。将BRET2的比例标准化为水响应,并表示为BRET2的变化百分比。
图7-LacB1对一系列二糖和单糖的响应,所有浓度均为1mM。在与指定的糖在30℃下温育5分钟后,向1μM的LacB1中添加17μM腔肠素400a后,记录BRET2的比率(平均值±SD,n=3)。将BRET2的比例标准化为水响应,并表示为BRET2的变化百分比。
图8-在PBS(A)中半乳糖和葡萄糖以及透析乳(C、E)中半乳糖和葡萄糖存在下通过LacB1传感器检测乳糖(平均值±S.D.,n=3)。在PBS(B)中半乳糖和葡萄糖以及透析乳(D)中半乳糖和葡萄糖存在下,通过LacF1传感器检测乳糖(平均值±S.D.,n=3)。
图9-在PBS和补充有乳糖、半乳糖和葡萄糖的10%(v/v)透析全脂乳中,通过LacB1传感器检测乳糖和乳果糖。实线:LacB1在PBS中的乳糖浓度依赖性。EC50=12±1μM,LOD=1μM。虚线:加入的乳糖、半乳糖和葡萄糖使得([乳糖]+[半乳糖+葡萄糖]/2=13.9mM)的10%透析全脂乳中LacB1的乳糖浓度依赖性。EC50=21±2μM,LOD=0.2μM。点画线:LacB1在PBS中的乳糖浓度依赖性。EC50=2.4±0.2mM,LOD=0.1mM。
图10-(A)使用
Figure BDA0002432636120000061
装置测定的在测定缓冲液(0.45%明胶的磷酸盐缓冲液中)中存在3mM乳糖的情况下,LacB1传感器的BRET2比值的示例迹线。(B)在测定缓冲液中存在3mM乳糖的情况下,使用
Figure BDA0002432636120000062
装置为LacB1记录的供体发射(上窗口,深灰色)和受体发射(上窗口,浅灰色)强度的示例迹线。
图11–用
Figure BDA0002432636120000063
装置确定的LacB1的BRET2比值的变化。用
Figure BDA0002432636120000064
装置记录在30μM和3mM乳糖存在下LacB1的BRET2比率。将BRET2比率标准化为测定缓冲液响应,并表示为BRET2变化的百分比(平均值±S.D.,n=2或3)。
序列表的关键字
SEQ ID NO:1-BgaR HTH转录因子的氨基酸序列。
SEQ ID NO:2-8-接头序列。
SEQ ID NO:9-BgaR HTH碳水化合物结合结构域。
SEQ ID NO:10-14-引物序列。
SEQ ID NO:15-LacB1的氨基酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:16-LacB2的氨基酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:17-LacB3的氨基酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:18-LacB4的氨基酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:19-编码LacB1的核苷酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:20-编码LacB2的核苷酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:21-编码LacB3的核苷酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:22-编码LacB4的核苷酸序列(GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:23-LacF1的氨基酸序列(His6-CFP-BgaR-YFP融合蛋白)。
SEQ ID NO:24-编码LacF1的核苷酸序列(His6-CFP-BgaR-YFP融合蛋白)。
SEQ ID NO:25-LacB1的氨基酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:26-LacB2的氨基酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:27-LacB3的氨基酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:28-LacB4的氨基酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:29-编码LacB1的核苷酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:30-编码LacB2的核苷酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:31-编码LacB3的核苷酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:32-编码LacB4的核苷酸序列(His6-GFP2-BgaR-RLuc8融合蛋白)。
SEQ ID NO:33-LacB11-171的氨基酸序列(GFP2-BgaR1-171-RLuc8融合蛋白)。根据本发明的实施方案的传感器分子,其包含侧接GFP2和RLuc8的BgaR的残基1-171。
SEQ ID NO:34-LacB11-150的氨基酸序列(GFP2-BgaR1-150-RLuc8融合蛋白)。根据本发明的实施方案的传感器分子,其包含侧接GFP2和RLuc8的BgaR的残基1-150。
SEQ ID NO:35-LacB112-171的氨基酸序列(GFP2-BgaR12-171-RLuc8融合蛋白)。根据本发明的实施方案的传感器分子,其包含侧接GFP2和RLuc8的BgaR的残基12-171。
SEQ ID NO:36-LacB112-150的氨基酸序列(GFP2-BgaR12-150-RLuc8融合蛋白)。根据本发明的实施方案的传感器分子,其包含侧接GFP2和RLuc8的BgaR的残基12-150。
SEQ ID NO:37-UniProt登录号:A0A133MUX6的氨基酸序列。
SEQ ID NO:38-UniProt登录号:B1V7N0的氨基酸序列。
SEQ ID NO:39-UniProt登录号:A0A127EGD8的氨基酸序列。
SEQ ID NO:40-UniProt登录号:A0A1C6JUB7的氨基酸序列。
SEQ ID NO:41-UniProt登录号:A0A174HYB7的氨基酸序列。
SEQ ID NO:42-UniProt登录号:A0A1C6KY47的氨基酸序列。
SEQ ID NO:43-UniProt登录号:A0A174LZQ7的氨基酸序列。
SEQ ID NO:44-UniProt登录号:N9YR91的氨基酸序列。
SEQ ID NO:45-UniProt登录号:A0A174I591的氨基酸序列。
SEQ ID NO:46-UniProt登录号:A0A2A7ME67的氨基酸序列。
SEQ ID NO:47-UniProt登录号:A0A2K4AZL9的氨基酸序列。
SEQ ID NO:48-UniProt登录号:A0A166PPM9的氨基酸序列。
SEQ ID NO:49-UniProt登录号:A0A2T4R7G1的氨基酸序列。
SEQ ID NO:50-UniProt登录号:A0A2A4HCU9的氨基酸序列。
SEQ ID NO:51-UniProt登录号:A0A2T4MS83的氨基酸序列。
SEQ ID NO:52-UniProt登录号:O33813的氨基酸序列。
SEQ ID NO:53-UniProt登录号:A0A1D4LKB2的氨基酸序列。
SEQ ID NO:54-UniProt登录号:A0A133QVV5的氨基酸序列。
SEQ ID NO:55-UniProt登录号:A9QSR3的氨基酸序列。
SEQ ID NO:56-UniProt登录号:A0A133MUX6的假定碳水化合物结合结构域(CBD)的氨基酸序列。
SEQ ID NO:57-UniProt登录号:B1V7N0的假定CBD的氨基酸序列。
SEQ ID NO:58-UniProt登录号:A0A127EGD8的假定CBD的氨基酸序列。
SEQ ID NO:59-UniProt登录号:A0A1C6JUB7的假定CBD的氨基酸序列。
SEQ ID NO:60-UniProt登录号:A0A174HYB7的假定CBD的氨基酸序列。
SEQ ID NO:61-UniProt登录号:A0A1C6KY47的假定CBD的氨基酸序列。
SEQ ID NO:62-UniProt登录号:A0A174LZQ7的假定CBD的氨基酸序列。
SEQ ID NO:63-UniProt登录号:N9YR91的假定CBD的氨基酸序列。
SEQ ID NO:64-UniProt登录号:A0A174I591的假定CBD的氨基酸序列。
SEQ ID NO:65-UniProt登录号:A0A2A7ME67的假定CBD的氨基酸序列。
SEQ ID NO:66-UniProt登录号:A0A2K4AZL9的假定CBD的氨基酸序列。
SEQ ID NO:67-UniProt登录号:A0A166PPM9的假定CBD的氨基酸序列。
SEQ ID NO:68-UniProt登录号:A0A2T4R7G1的假定CBD的氨基酸序列。
SEQ ID NO:69-UniProt登录号:A0A2A4HCU9的假定CBD的氨基酸序列。
SEQ ID NO:70-UniProt登录号:A0A2T4MS83的假定CBD的氨基酸序列。
SEQ ID NO:71-UniProt登录号:O33813的假定CBD的氨基酸序列。
SEQ ID NO:72-UniProt登录号:A0A1D4LKB2的假定CBD的氨基酸序列。
SEQ ID NO:73-UniProt登录号:A0A133QVV5的假定CBD的氨基酸序列。
SEQ ID NO:74-UniProt登录号:A9QSR3的假定CBD的氨基酸序列。
具体实施方式
一般技术和定义
除非另外具体定义,否则本文所用的所有技术和科学术语应认为具有与本领域(例如,在传感器技术、分子生物学、蛋白质化学、乳品科学、乳品技术、生物化学等中)普通技术人员通常理解的相同含义。
除非另有说明,用于本发明的重组蛋白、细胞培养物和免疫学技术是本领域技术人员熟知的标准方法。在以下来源的整个文献中描述了这种技术,诸如:J.Perbal,《分子克隆实用指南》,John Wiley and Sons(1984),J。Sambrook等,《分子克隆:实验室手册》,冷泉港实验室出版社(1989),TABrown(编辑),基本分子生物学:实用方法,第1卷和第2卷,IRL出版社(1991),DMGlover和BDHames(编辑),DNA克隆:实用方法,第1-4卷,IRL出版社(1995和1996),以及FMAusubel等(编者),《分子生物学的最新方案》,Greene.Associates和Wiley-Interscience(1988,包括到目前为止的所有更新),Ed Harlow和David Lane(编者)抗体:实验室手册,冷泉港实验室,(1988)和JEColigan等人,(编辑)《免疫学最新方案》,约翰·威利父子出版社(John Wiley&Sons)(J.Perbal,A Practical Guide to MolecularCloning,John Wiley and Sons(1984),J.Sambrook et al.,Molecular Cloning:ALaboratory Manual,Cold Spring Harbour Laboratory Press(1989),T.A.Brown(editor),Essential Molecular Biology:A Practical Approach,Volumes 1and 2,IRLPress(1991),D.M.Glover and B.D.Hames(editors),DNA Cloning:A PracticalApproach,Volumes 1-4,IRL Press(1995and 1996),and F.M.Ausubel et al.,(editors),Current Protocols in Molecular Biology,Greene Pub.Associates andWiley-Interscience(1988,including all updates until present),Ed Harlow andDavid Lane(editors)Antibodies:A Laboratory Manual,Cold Spring HarbourLaboratory,(1988),和J.E.Coligan et al.,(editors)Current Protocols inImmunology,John Wiley&Sons)(包括到目前为止的所有更新)。
适用于本发明方法的多肽可通过其氨基酸序列与参考氨基酸序列的一致性程度(%一致性)、或通过与一个参考氨基酸序列比与另一个参考氨基酸序列具有更大的%一致性来定义。多肽与参考氨基酸序列的%一致性通常通过GAP分析确定(Needleman和Wunsch,1970;GCG程序),其中参数的缺口产生罚分=5,缺口延伸罚分=0.3。查询序列长度为至少100个氨基酸,且GAP分析在至少100个氨基酸的区域上比对两个序列。甚至更优选地,查询序列长度为至少250个氨基酸,且GAP分析在至少250个氨基酸的区域上比对两个序列。甚至更优选地,查询序列长度为至少450个氨基酸,且GAP分析在至少450个氨基酸的区域上比对两个序列。甚至更优选地,GAP分析在其全长上比对两个序列。
术语“和/或”,例如“X和/或Y”应理解为意指“X和Y”或“X或Y”,并且应理解为提供对两种含义或两种含义的明确支持。
除非上下文另有说明,否则以单数形式提及的术语(例如传感器和底物)显然也意指复数形式。例如,逻辑上许多单独的传感器分子将流过该装置或包含在孔中而不是单个分子中。
如本文所用,除非另有相反说明,术语“约”是指指定值的+/-10%、更优选+/-5%、甚至更优选+/-1%。
在整个说明书中,词语“包含(comprise)”或诸如“包含(comprises)”或“包含(comprising)”的变化将被理解为暗示包含所述元件、整体或步骤,或元件、整体或步骤的组,但不排除任何其他元件、整体或步骤,或元件、整体或步骤的组。
除非另有说明或上下文另有说明,%浓度是重量/体积(%w/v)。
传感器
在整个说明书中,“传感器”和“传感器分子”可互换使用。
在一个方面,提供了用于检测碳水化合物的传感器分子,所述传感器包括:
i)螺旋-转角-螺旋转录因子的碳水化合物结合结构域,或所述碳水化合物结合结构域的变体;
ii)化学发光供体结构域;以及
iii)受体结构域;
其中当所述碳水化合物结合至所述碳水化合物结合结构域时,所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
在一些实施方案中,传感器是氨基酸的连续片段(换句话说,传感器是单个多肽)。例如,碳水化合物结合结构域、化学发光供体蛋白结构域和受体结构域是氨基酸的单个片段,例如但不限于,共价连接至碳水化合物结合结构域N末端的化学发光供体蛋白结构域和与碳水化合物结合结构域的C-末端共价连接的受体蛋白结构域,或与碳水化合物结合结构域的N-末端共价连接的受体蛋白结构域和与碳水化合物结合结构域的C-末端共价连接的化学发光供体蛋白结构域。在图1中提供了实施例。
例如,在一些实施方案中,多肽具有选自由SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ ID NO:28组成的组的序列,或其片段或变体。在一些实施方案中,多肽可具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ IDNO:28中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。如本文所用,多肽的“部分”保留多肽的相关活性,例如,多肽的部分保留结合碳水化合物的能力。
例如,在一些实施方案中,多肽具有选自由SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、和SEQ ID NO:18组成的组的序列,或其片段或变体。在一些实施方案中,多肽可具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、和SEQ ID NO:18中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。例如,多肽具有选自由SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ IDNO:28组成的组的序列,或其片段或变体。在一些实施方案中,多肽可具有与SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ ID NO:28中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些实施方案中,还提供了包含编码本文定义的传感器的多核苷酸序列的核酸。在一些实施方案中,核酸是分离的核酸。例如,在一些实施方案中,核酸分子包含编码多肽序列的序列,所述多肽序列选自由SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ ID NO:28组成的组。在一些实施方案中,核酸分子包含编码多肽序列的序列,所述多肽序列选自由SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17和SEQ ID NO:18组成的组。在一些实施方案中,核酸分子包含编码多肽序列的序列,所述多肽序列选自由SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ IDNO:28组成的组。在一些实施方案中,核酸分子包含编码SEQ ID NO:15或SEQ ID NO:25的多肽序列的序列。在一些实施方案中,所述核酸分子包含编码SEQ ID NO:15的多肽序列的序列。在一些实施方案中,所述核酸分子包含编码SEQ ID NO:25的多肽序列的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27和SEQ ID NO:28中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、和SEQ ID NO:18中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ ID NO:28中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含选自由SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO30、SEQ ID NO:31、和SEQ ID NO:32组成的组的序列,或与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:29、SEQ ID NO30、SEQ ID NO:31、和SEQ ID NO:32中的任何一个的一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含选自由SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22组成的组的序列,或与SEQ ID NO:19、SEQID NO:20、SEQ ID NO:21、和SEQ ID NO:22中的任何一个的一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含选自由SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22组成的组的序列,或与SEQ ID NO:29、SEQ ID NO30、SEQ IDNO:31、和SEQ ID NO:32中的任何一个的一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
在另一方面,本发明提供了一种用于检测乳糖或乳果糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。乳糖或乳果糖与该方面的传感器分子的结合产生共振能量转移的变化,例如BRET的变化或FRET的变化。在一些实施方案中,本发明提供用于检测乳糖的传感器分子。在一些实施方案中,本发明提供了用于检测乳果糖的传感器分子。
在一些实施方案中,传感器是氨基酸的连续片段(换句话说,传感器是单个多肽)。例如,细菌BgaR转录因子或其变体,共振能量转移供体结构域和共振能量转移受体结构域是氨基酸的单个片段,例如但不限于,共价连接至细菌BgaR转录因子的N末端的供体蛋白结构域和共价连接至细菌BgaR转录因子的C末端的受体蛋白结构域,或共价连接至细菌BgaR转录因子的N末端的受体蛋白结构域和共价连接至细菌BgaR转录因子的C末端的供体蛋白结构域。
例如,在一些实施方案中,该多肽具有SEQ ID NO:23或其片段或变体提供的序列。在一些实施方案中,多肽可具有与SEQ ID NO:23中所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些实施方案中,还提供了包含编码本文定义的传感器的多核苷酸序列的核酸分子。在一些实施方案中,核酸分子是分离的核酸分子。在一些实施方案中,核酸分子包含编码SEQ ID NO:23或其片段或变体提供的多肽序列的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽可具有与SEQ ID NO:23中所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含SEQ ID NO:24提供的序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
本发明的传感器、组合物、试剂盒、方法和用途包括具有指定序列或与其基本上相同或相似的序列的多肽和核酸,例如,与指定序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在氨基酸序列的上下文中,术语“基本上相同”在本文中用于指,第一氨基酸,其含有足够或最小数目的第二氨基酸序列中比对的氨基酸残基的i)相同的氨基酸残基,或ii)保守取代,使得第一和第二氨基酸序列可以具有共同的结构域和/或共同的功能活性。例如,含有与指定序列具有至少约85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的共同结构域的氨基酸序列被称为基本上相同的。
在核苷酸序列的上下文中,术语“基本上相同”在本文中用于指,第一核酸序列,其含有足够或最小数目的与第二核酸序列中的比对的核苷酸相同的核苷酸,使得第一和第二核苷酸序列编码具有共同功能活性的多肽,或编码共同结构多肽结构域或共同功能多肽活性。例如,与指定序列具有至少约85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的核苷酸序列被称为基本上相同的。
序列之间同源性或序列一致性的计算(术语在本文中可互换使用)使用本领域技术人员已知的技术进行。例如,为了确定两个氨基酸序列或两个核酸序列的百分比一致性,为了最佳比较的目的对序列进行比对(例如,为了最佳比对可以在第一和第二氨基酸或核酸序列中的一个或两个中引入缺口,并且为了比较的目的可以忽略非同源序列)。在优选的实施方案中,为了比较目的而比对的参考序列的长度是参考序列长度的至少30%,优选至少40%,更优选至少50%、60%,甚至更优选至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中相应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置是相同的(如本文所用,氨基酸或核酸“一致性”相当于氨基酸或核酸“同源性”)。
考虑到缺口的数目和每个缺口的长度,两个序列之间的一致性百分比是序列共有的相同位置的数目的函数,为了两个序列的最佳比对需要引入缺口的数目和每个缺口的长度。
序列的比较和两个序列之间一致性百分比的确定可以使用数学算法完成。在一些实施例中,使用已并入GCG软件包中的GAP程序中的Needleman和Wunsch(1970)算法,使用Blossum 62矩阵或PAM250矩阵,且缺口重量为16、14、12、10、8、6或4且长度重量为1、2、3、4、5或6,来确定两个氨基酸序列之间的百分比一致性。在其他实施方案中,使用GCG软件包中的GAP程序,使用NWS gapdna.CMP矩阵,且缺口重量为40、50、60、70、或80且长度重量为1、2、3、4、5或6,来测定两个核苷酸序列之间的百分比一致性。
两个氨基酸或核苷酸序列之间的百分比一致性可以使用Meyers和Miller(1989)的算法测定,该算法已经被引入ALIGN程序(2.0版),使用例如PAM120重量残基表,缺口长度罚分12和缺口罚分4。
本文所述的核酸和蛋白质序列可用作“查询序列”,以对公共数据库进行搜索,例如鉴定其他族成员或相关序列。这种搜索可以使用例如Altschul等,(1990)的NBLAST和XBLAST程序(2.0版)以及BLASTp进行。BLAST核苷酸搜索可以用NBLAST程序进行,得分=100,字长=12,以获得与本发明一些实施方案的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可以用XBLAST程序进行,得分=50,字长=3,以获得与本发明一些实施方案的蛋白质分子同源的氨基酸序列。为了获得用于比较目的的缺口比对,可以使用如Altschul等,(1997)所述的缺口BLAST。当使用BLAST和Gapped BLAST程序时,可以使用各个程序(例如BLASTp、XBLAST和NBLAST)的默认参数。参见http:www.ncbi.nlm.nih.gov/BLAST。
对应于本文所述序列的天然等位基因变体、同源物、直系同源物或其他相关序列(例如,旁系同源物)的核酸分子可以基于它们与编码本文公开的氨基酸序列的核酸的同源性而分离,例如通过使用所有或部分已知序列作为探针进行标准或严格杂交反应。这种核酸杂交和克隆方法是本领域熟知的。
本文提供的肽的同系物通常与这些肽具有结构相似性。多肽的同系物包括一个或多个保守氨基酸取代,其可以选自氨基酸所属类别的相同或不同成员。
在一些实施方案中,序列还可以具有氨基酸残基的缺失、插入或取代,其产生沉默变化并产生功能等同的物质。可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性的相似性进行有意的氨基酸取代,只要保留物质的二级结合活性即可。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;具有相似亲水性值的不带电荷的极性头基的氨基酸包括:亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。
本发明的一些实施方案还包括保守取代(取代和置换均在本文中用于指现有氨基酸残基与替代残基的互换),其可以发生例如同类取代,诸如碱性取代碱性、酸性取代酸性、极性取代极性等。非保守取代也可以例如从一类残基到另一类残基发生,或者涉及内含非天然氨基酸,诸如鸟氨酸(下文称为Z)、二氨基丁酸鸟氨酸(下文称为B)、正亮氨酸鸟氨酸(下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。可以进行的保守取代是,例如,在碱性氨基酸(精氨酸、赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),脂族氨基酸(丙氨酸、缬氨酸、亮氨酸、异亮氨酸),极性氨基酸(谷氨酰胺、天冬酰胺、丝氨酸、苏氨酸),芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸),羟基氨基酸(丝氨酸、苏氨酸),大氨基酸(苯丙氨酸和色氨酸)和小氨基酸(甘氨酸、丙氨酸)。
除了编码本发明传感器分子的序列之外,核酸分子还可以含有其他序列,例如引物位点、转录因子结合位点、载体插入位点和抗核酸分解降解的序列(例如聚腺苷尾)。核酸分子可以是DNA或RNA,并且可以包括合成的核苷酸,条件是多核苷酸仍然能够被翻译以合成本发明的蛋白质。
在一些实施方案中,核酸形成诸如质粒的载体的一部分。除上述核酸序列外,质粒还包含其他元件,例如原核复制起点(例如,大肠杆菌OR1复制起点)、自主复制序列、着丝粒序列;等等。能够在宿主细胞中表达该核酸的启动子序列,该启动子序列可操作地连接至该核酸、位于该核酸序列下游的终止子序列、抗生素抗性基因和/或分泌信号序列。包含自主复制序列的载体也是酵母人工染色体。在一些可选择的实施方案中,载体是病毒,例如噬菌体,并且除了本发明的核酸序列之外,还包含用于噬菌体复制的核酸序列,例如结构蛋白、启动子、转录激活因子等。
本发明的核酸或载体可用于转染或转化宿主细胞以合成本发明的传感器分子。合适的宿主细胞包括诸如大肠杆菌的原核细胞和诸如酵母细胞或哺乳动物或植物细胞系的真核细胞。使用本领域已知的技术转染或转化宿主细胞,如电穿孔;磷酸钙碱法;基因枪技术或使用病毒载体。
转染/转化后,根据需要转录和翻译本发明的核酸或载体。在一些实施方案中,合成的蛋白质从宿主细胞中提取,或者由于其从细胞中分泌,例如由于载体中分泌信号的存在,或者通过宿主细胞的裂解和从中纯化蛋白质。在一些实施方案中,还提供了生产本文定义的传感器分子的方法,该方法包括在允许编码多肽的多核苷酸表达的条件下培养本文定义的宿主细胞或载体,并回收表达的多肽。
在一些实施方案中,传感器作为无细胞组合物提供。如本文所用,术语“无细胞组合物”是指包含如果有的话则很少的完整细胞并包含传感器的分离的组合物。无细胞组合物的实例包括细胞(诸如酵母细胞)提取物和含有分离的和/或重组的传感器分子(诸如蛋白质)的组合物。由细胞制备无细胞组合物的方法是本领域熟知的。
传感器分子任选地包含至少一个接头。例如,传感器可包含将碳水化合物结合结构域(或包含碳水化合物结合结构域的螺旋-转角-螺旋转录因子)连接至化学发光供体结构域和/或受体结构域的接头。在另一个实例中,传感器分子可以在传感器分子的N-和/或C-末端包含接头。在一些实施方案中,传感器分子包含至少一个肽接头。在一些实施方案中,接头可以位于碳水化合物结合结构域(或包含碳水化合物结合结构域的螺旋-转角-螺旋转录因子)的N-和/或C-末端。优选地,接头是肽或多肽。在一些实施方案中,接头包含一个或多个甘氨酸、丝氨酸和/或苏氨酸残基。例如,在一些实施方案中,接头包含选自以下的氨基酸序列:GSSGGS(SEQ ID NO:2)、GGSGGS(SEQ ID NO:3)、GGTGGG(SEQ ID NO:4)、GGGGGT(SEQ ID NO:5)LQGGTGGG(SEQ ID NO:6)、FEGGTGGG(SEQ ID NO:7)和GGSGGSL(SEQ ID NO:8)。在一些实施方案中,接头是25个氨基酸或更少、20个氨基酸或更少、15个氨基酸或更少、10个氨基酸或更少、8个氨基酸或更少、6个氨基酸或更少、4个氨基酸或更少、或3个氨基酸或更少。在一些实施方案中,接头的长度为1-10个氨基酸、2-9个氨基酸或4-8个氨基酸。接头序列可以位于碳水化合物结合结构域的N-末端、碳水化合物结合结构域的C-末端或两者。当接头位于N-和C-末端时,接头序列可以相同或不同。不希望被理论所束缚,接头可用于以下目的中的一个或多个:(i)帮助确保碳水化合物结合位点处于优选的结合构象;(ii)改善碳水化合物结合位点的可及性;(iii)增加化学发光供体结构域相对于受体结构域的空间位置和/或偶极取向变化的幅度(例如,接头序列可起到增加BRET比的作用);和/或(iv)优化化学发光供体结构域相对于受体结构域的空间位置和/或偶极取向。
在一些实施方案中,传感器还包含蛋白酶切割位点和/或纯化标签。在一些实施方案中,接头包含可用于纯化和/或连接化学发光供体结构域和/或受体结构域的氨基酸或一系列氨基酸。例如,接头可包含组氨酸标签,用于纯化或与化学发光供体结构域和/或受体结构域自组装。在另一个实例中,接头可以包含用于添加化学发光供体结构域和/或受体结构域的反应基团(例如半胱氨酸或赖氨酸)。在一些实施方案中,传感器包含蛋白酶切割位点。蛋白酶切割位点可用于除去纯化标签。
本发明的多肽可以多种方式生产,包括天然多肽的生产和回收,重组多肽的生产和回收,以及多肽的化学合成。在一个实施方案中,通过在有效产生多肽的条件下培养能够表达多肽的细胞并回收多肽来产生分离的多肽。有效培养条件可由本领域技术人员确定,包括但不限于允许多肽产生的有效培养基、生物反应器、温度、pH和氧条件。有效培养基是指培养细胞以产生多肽的任何培养基。这种培养基通常包括水性培养基,水性培养基具有可同化的碳,氮和磷酸盐源,以及合适的盐、矿物质、金属和诸如维生素的其他营养物。细胞可以在常规发酵生物反应器、摇瓶、试管、微量滴定皿和陪替氏平皿中培养。培养可以在适合于重组细胞的温度、pH和氧含量下进行。这些培养条件在本领域普通技术人员的专业知识范围内。
本发明的多肽可以通过本领域技术人员已知的方法从诸如植物、细菌或酵母细胞的重组细胞中提取和纯化,产生所述多肽。在一个实施方案中,该方法包括:通过匀浆细胞/组织/植物来提取总可溶性蛋白质,并使用Ni-NTA或Talon分离六组氨酸多肽。可以用常规凝胶或亲和色谱法实现另外的纯化。
碳水化合物
本发明的传感器能够结合碳水化合物。如本文所用的术语“碳水化合物”被广义地定义并且是指单糖、寡糖和多糖以及衍生自单糖的物质,例如通过还原羰基(形成糖醇),通过将一个或多个端基氧化成羧酸,或通过用氢原子、氨基、硫醇基或类似基团置换一个或多个羟基(形成衍生物)。它还包括这些化合物的衍生物(参见IUPAC(国际理论和应用化学联合会).Compendium of Chemical Terminology(化学术语总目录)第二版.(金本),A.D.McNaught和A.Wilkinson编辑.Blackwell Scientific Publications(布莱克韦尔科学出版物),牛津(1997))。如本领域技术人员所知,碳水化合物可以含有不对称中心,因此具有立体异构体。可用于本发明的传感器、方法、试剂盒和组合物中的碳水化合物可以是D-立体异构形式和/或L-形式(对映异构体)形式。开链和闭环结构都属于碳水化合物的定义。
在一些实施方案中,碳水化合物是糖或糖衍生物。
在一些实施方案中,碳水化合物是糖。如本文所用,术语“糖”包括包含至少一个羟基和至少一个醛基或酮基的多羟基醛和多羟基酮。在一些实施方案中,糖是单糖、寡糖或多糖。合适的单糖可以包括丙糖(例如甘油醛),丁糖(例如赤藓糖和苏糖),戊糖(例如核酮糖、阿拉伯糖、木糖、核糖和来苏糖),己糖(例如葡萄糖、甘露糖、半乳糖、艾杜糖、古洛糖、果糖、阿卓糖、阿洛糖、岩藻糖和塔罗糖),庚糖(例如景天庚酮糖),辛糖(例如丙三氧基-D-甘露-辛酮糖)和戊糖环糖(例如呋喃核糖和吡喃核糖)。在一些实施方案中,单糖选自由以下组成的组:核糖、葡萄糖、甘露糖、半乳糖和果糖。本文所用的“寡糖”是含有二到十个通过糖苷键连接的糖的糖类聚合物。在一些实施方案中,寡糖包含二、三、四、五、六、七、八、九、或十种糖类。例如,寡糖包括但不限于二糖或三糖。合适的寡糖包括但不限于蔗糖、乳糖、乳果糖、海藻糖、龙胆二糖、麦芽糖、异麦芽糖、纤维二糖、松三糖、蜜三糖、水苏糖、纤维三糖、蜜二糖和毛蕊花糖。合适的寡糖包括但不限于蔗糖、乳糖、海藻糖、龙胆二糖、麦芽糖、异麦芽糖、纤维二糖、松三糖、蜜三糖、水苏糖、纤维三糖、蜜二糖和毛蕊花糖。在一些实施方案中,碳水化合物是二糖。在一些实施方案中,碳水化合物是乳糖或乳果糖。在一些实施方案中,碳水化合物是乳糖。在一些实施方案中,碳水化合物是乳果糖。在优选的实施方案中,碳水化合物是乳糖。多糖是其中单糖或寡糖通过糖苷键化学连接在一起的糖。合适的多糖包括但不限于直链淀粉、支链淀粉和糖原。
在一些实施方案中,碳水化合物是糖衍生物。如本文所用,“糖衍生物”是指已被改性以用不同取代基取代一个或多个羟基的糖,或通过糖的氧化还原反应获得的糖变体。合适的取代基包括但不限于烷基、取代的烷基、环烷基、取代的环烷基、烯基、取代的烯基、环烯基、取代的环烯基、炔基、取代的炔基、烷氧基、取代的烷氧基、碳环基团、取代的碳环基团、杂环基团、取代的杂环基团、卤素、羟基、取代的羟基、硫醇、取代的硫醇、氰基、二氧磷基、取代的二氧磷基、硝基、氨基、取代的氨基、羧基、取代的羧基、酰基、取代的酰基、硫羧基、取代的硫羧基、酰胺、取代的酰胺、取代的羰基、取代的硫羰基、取代的磺酰基和取代的亚磺酰基。在一些实施方案中,糖衍生物选自由以下组成的组:糖醇(也称为糖醛或醛糖醇)、酮糖、氨基糖(或糖胺)、脱氧糖、磷酸糖、酸性糖、糖苷和内酯。合适的糖醇包括但不限于赤藓糖醇、葡萄糖醇、山梨糖醇或甘露糖醇。合适的酮糖包括但不限于二羟基丙酮、赤藓酮糖、核酮糖、木酮糖、假果糖、果糖、山梨糖和塔格糖。合适的氨基糖包括但不限于葡糖胺、半乳糖胺、N-乙酰葡糖胺、N-乙酰半乳糖胺、胞壁酸、N-乙酰胞壁酸和N-乙酰神经氨酸(唾液酸)。合适的糖苷包括但不限于吡喃葡萄糖和甲基吡喃葡萄糖。合适的内酯包括但不限于葡糖酸内酯。合适的脱氧糖包括但不限于脱氧核糖和鼠李糖。合适的磷酸糖包括但不限于6-磷酸葡萄糖、6-磷酸果糖、4-磷酸赤藓糖、5-磷酸核糖、1,6-二磷酸果糖和5-磷酸木酮糖。
在一些实施方案中,碳水化合物是衍生自单糖的物质。在一些实施方案中,碳水化合物是通过还原羰基或通过将一个或多个端基氧化成羧酸而衍生自单糖的物质。例如,衍生自单糖的物质可以是但不限于糖醇(如赤藓糖醇、葡萄糖醇、山梨糖醇或甘露糖醇)和糖酸(如葡糖酸、甘露糖酸、苏糖酸和甘油酸)。在一些实施方案中,衍生自单糖的物质选自由乳酸盐和丙酮酸盐组成的组。
碳水化合物结合结构域
如本文所用,“碳水化合物结合结构域”是能够结合碳水化合物的多肽。碳水化合物结合结构域包含至少一个结合碳水化合物的结合位点。术语“与碳水化合物结合”是指碳水化合物与碳水化合物结合结构域的非共价结合。这种结合可以涉及碳水化合物和碳水化合物结合结构域结合结构域之间的非共价相互作用,例如盐桥、氢键、范德华力、堆积力、络合物形成或其组合。它还可以包括在结合位点与水分子的相互作用。
合适的碳水化合物结合结构域可以存在于仅由结合结构域氨基酸序列组成的多肽链上,或者可以存在于更大的多肽分子(即,包含除结合结构域之外的氨基酸的多肽分子)的上下文中。因此,碳水化合物结合结构域可以是全长蛋白质(例如,全长螺旋-转角-螺旋转录因子)或其片段(例如,包含碳水化合物结合结构域的螺旋-转角-螺旋转录因子的片段)或其变体。碳水化合物结合结构域可包含天然或非天然氨基酸序列。保持与碳水化合物结合并经历构象变化的碳水化合物结合结构域的最小长度可以由本领域技术人员确定,所述构象变化足以并适于本文所述的碳水化合物检测。
在一些实施方案中,碳水化合物结合结构域是天然存在的多肽。在一些实施方案中,碳水化合物结合结构域是天然存在的多肽的变体。例如,在一些实施方案中,碳水化合物结合结构域是改变的氨基酸(即,根据具体情况,通过至少一个氨基酸或核苷酸的插入、缺失或取代),使得碳水化合物结合结构域序列不再是天然发现的。在一些实施方案中,变异的位置在形成碳水化合物结合结构域的残基内。变体可以包含天然或非天然氨基酸序列。在一些实施方案中,变体碳水化合物结合结构域包含与螺旋-转角-螺旋转录因子的天然存在的碳水化合物结合结构域具有至少30%一致性的氨基酸序列。例如,在一些实施方案中,变体碳水化合物结合结构域包含与螺旋-转角-螺旋转录因子的天然存在的碳水化合物结合结构域至少30%相同至少35%相同至少40%相同至少45%相同至少50%相同至少55%相同至少60%相同至少65%相同至少70%相同至少75%相同至少80%相同至少85%相同至少90%相同至少95%相同至少98%相同至少99%相同或至少99.5%相同的氨基酸序列。
在一些实施方案中,碳水化合物结合结构域是糖或糖衍生物结合结构域。在一些实施方案中,碳水化合物结合结构域是糖结合结构域。在一些实施方案中,碳水化合物结合结构域是糖衍生物结合结构域。
在一些实施方案中,碳水化合物结合结构域以高亲和力结合碳水化合物。在一些实施方案中,碳水化合物结合结构域以下述的碳水化合物浓度下发生的半数最大结合与碳水化合物结合:在1nM或以下、10nM或以下、50nM或以下、100nM或以下、500nM或以下、1μM或以下、10μM或以下、50μM或以下、100μM或以下、500μM或以下、1mM以下或10mM以下。例如,在一些实施例中,EC50在约0.1μM与150μM之间、在约1μM与100μM之间或在约5μM与50μM之间。在一些实施例中,EC50在约10μM与25μM之间。或者,在一些实施方案中,EC50为约0.1mM-150mM、约1mM-100mM、约2mM-50mM或约2mM-5mM。
当碳水化合物与碳水化合物结合结构域结合时,合适的碳水化合物结合结构域经历构象变化,该构象变化足以并适于本文所述的碳水化合物检测。
可用于本发明传感器的碳水化合物结合结构域衍生自含有螺旋-转角-螺旋(HTH)结构域(也称为螺旋-转角-螺旋基序)的转录因子。即,传感器包含螺旋-转角-螺旋转录因子的碳水化合物结合结构域,或碳水化合物结构域的变体。在一些实施方案中,传感器分子包含螺旋-转角-螺旋转录因子的碳水化合物结合结构域和存在于螺旋-转角-螺旋转录因子中的一个或多个另外的氨基酸。例如,传感器还可以包含一个或多个也存在于螺旋-转角-螺旋转录因子中的功能域(例如DNA结合域)。在一个实施方案中,多肽缺乏转录因子的螺旋-转角-螺旋结构域。在另一个实施方案中,多肽具有转录因子的螺旋-转角-螺旋结构域。可用于本文所述传感器的任何变体、部分或片段保留结合碳水化合物的能力。在一些实施方案中,碳水化合物结合结构域包含公开的结合至碳水化合物的蛋白质折叠。结合至碳水化合物的蛋白质折叠的非限制性实例包括Nudix水解酶折叠、碳水化合物结合模块或AraC碳水化合物识别结构域。
在一些实施方案中,HTH转录因子是细菌HTH转录因子。在一些实施方案中,HTH转录因子可以来源于革兰氏阴性菌或革兰氏阳性菌。这种HTH转录因子的实例示于表1。除了本文所讨论的变体或其片段之外,还可以使用表1中列出的HTH转录因子的天然存在的物种变体。表1中所列HTH转录因子的同源物(例如源自相关细菌物种的直系同源物)也可用于本文所述的传感器分子中。此外,预期术语“HTH转录因子”包括任何天然存在的HTH转录因子的变体、部分、片段或衍生物,只要变体、部分、片段或衍生物保留结合碳水化合物的能力即可。还应当理解,本领域技术人员能够通过本领域已知的合适技术修饰和优化天然存在的HTH转录因子,例如体外或体内诱变、PCR改组诱变、化学修饰等。
表1.示例性螺旋-转角-螺旋转录因子
Figure BDA0002432636120000191
在一些实施方案中,HTH转录因子是转录因子GNTR家族的成员。GNTR家族,命名为枯草芽孢杆菌中的葡糖酸操纵子阻遏物,是HTH转录因子的最普遍的超家族之一(Haydon和Guest,1991;Zheng等人,2009)。该HTH蛋白家族通常具有DNA结合结构域和效应子结合结构域(Aravind和Anantharman,2003;Rigali等人,2002;Rigali等,2004)。DNA结合结构域在该超家族的成员中相对保守,具有中心β-片层簇和三个α-螺旋,其中两个与连接环一起构成HTH基序(Zheng等,2009;Rigali等人,2002;Kong等,2009)。相反,效应子结构域在GNTR超家族中是不同的,并且它们的结构差异导致GNTR转录因子的六个亚家族:四个主要亚家族(FadR、HutC、MocR、YtrA)和两个次要亚家族(AraR和PlmA)(Zheng等,2009;Rigali等人,2002;Rigali等人,2004;Wiethaus等人,2008;Lee等人,2003;Zhang等人,2012;Franco等人,2006;Franco等人,2007)。效应子结构域通常结合分子,例如碳水化合物。通常,GNTR家族成员具有N-末端DNA结合结构域和C-末端效应子结合。然而,在AraR亚家族中,DNA结合结构域通常位于C-末端,而效应子结合结构域位于N-末端。
合适的细菌HTH转录因子的一个实例是BgaR。BgaR是来自产气荚膜梭菌(Clostridium perfringins)菌株13(CPE0770;UniProt登录号:Q8XMB9)的转录因子,并且是AraR亚家族的假定成员(Hartman等,2011)。BgaR结合至乳糖并形成乳糖诱导型调节系统的一部分。
在一些实施方案中,传感器包含螺旋-转角-螺旋转录因子BgaR或其片段或变体。在一些实施方案中,碳水化合物结合结构域包含SEQ ID NO:1提供的氨基酸序列或其片段或变体。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:1提供的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同或至少99.5%相同的氨基酸序列。在一些实施方案中,碳水化合物结合结构域具有与其一部分(例如,包含SEQ IDNO:1的氨基酸1-179、氨基酸1-171、1-157、氨基酸1-150、氨基酸12-179、氨基酸12-171、氨基酸12-150、氨基酸16-179、氨基酸16-171、氨基酸16-151或氨基酸16-129)至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,碳水化合物结合结构域包含SEQID NO:9提供的氨基酸序列或是其保留碳水化合物结合活性的片段或变体。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:9至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
BgaR(或另一种HTH转录因子)的最小碳水化合物结合结构域可以使用本领域技术人员已知的技术测定。例如,本文所述的蛋白质序列可用作“查询序列”,以对保守结构域数据库进行搜索,以例如鉴定假定的碳水化合物结合结构域和/或HTH结构域(Marchler-Bauer等,2017;Marchler-Bauer等,2015;Marchler-Bauer等,2011;Marchler-Bauer和Bryant,2004)。当使用保守结构域数据库搜索保守结构域时,可以使用默认参数。参见https:www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi。预测的碳水化合物结合结构域结合碳水化合物的能力可以使用本领域技术人员已知的技术证实。
在一些实施方案中,BgaR的碳水化合物结合结构域包含SEQ ID NO:1的氨基酸1-179、氨基酸1-171、氨基酸1-157、氨基酸1-150、氨基酸12-179、氨基酸12-171、氨基酸12-157、氨基酸12-150、氨基酸16-179、氨基酸16-171、氨基酸16-157、氨基酸16-151或氨基酸16-129。在一些实施方案中,BgaR的碳水化合物结合结构域包含SEQ ID NO:1的氨基酸1-150、氨基酸1-171、氨基酸1-179、氨基酸12-171或氨基酸12-150。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:1的氨基酸1-157、氨基酸16-151、氨基酸16-129至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:1的氨基酸1-150、氨基酸1-171、氨基酸12-150或氨基酸12-171至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,碳水化合物结合结构域包含SEQID NO:9提供的氨基酸序列。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:9提供的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同、至少99.5%相同或100%相同的氨基酸序列。在一些实施方案中,碳水化合物结合结构域具有与SEQ ID NO:9的一部分具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,或与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
其他合适的转录因子可由本领域技术人员使用工具如BLASTp鉴定。例如,在一些实施方案中,转录因子包含碳水化合物结合结构域,该碳水化合物结合结构域包含氨基酸序列,该氨基酸序列与BgaR(例如,SEQ ID NO:9中的氨基酸,或与氨基酸1-179、氨基酸1-171、氨基酸1-150、氨基酸12-179、氨基酸12-171或氨基酸12-150)的碳水化合物结合结构域至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同、或至少99.5%相同。合适的转录因子包括但不限于,来自产气荚膜梭菌(Clostridium perfringens)(UniProt登录号:A0A133MUX6)的假定的乳糖操纵子转录激活剂、AraC家族转录调节因子(产气荚膜梭菌D str.(Clostridium perfringens D str.)JGS1721)(UniProt登录号:B1V7N0)、AraC家族转录调节因子(产气荚膜梭菌(Clostridium perfringens))(UniProt登录号:A0A127EGD8)、阿拉伯糖操纵子调节蛋白(未培养的梭菌属物种)(UniProt登录号:A0A1C6JUB7)、转录调节因子(甘草梭菌(Clostridium disporicum))(UniProt登录号:A0A174HYB7)、阿拉伯糖操纵子调节蛋白(未培养的梭菌属物种)(UniProt登录号:A0A1C6KY47)、转录调节因子(甘草梭菌(Clostridium disporicum))(UniProt登录号:A0A174LZQ7)、AraC家族转录调节因子(类腐败梭菌(Clostridium paraputrificum))(UniProt登录号:A0A174I591)、未表征的蛋白(丁酸梭菌(Clostridium butyricum)60E.3)(UniProt登录号:N9YR91)、AraC家族转录调节因子(新生梭状芽孢杆菌(Clostridiumneonatale))(UniProt登录号:A0A2A7ME67)、AraC家族转录调节因子(中间葡萄球菌(Staphylococcus intermedius)NCTC11048)(UniProt登录号:A0A2K4AZL9)。AraC家族转录调节因子(伪中间型葡萄球菌(Staphylococcus pseudintermedius))(UniProt登录号:A0A166PPM9)、AraC家族转录调节因子(猪葡萄球菌(Staphylococcushyicus))(UniProt登录号:A0A2T4R7G1)、AraC家族转录调节因子(海豚葡萄球菌(Staphylococcus delphini))(UniProt登录号:A0A2A44HCU9),AraC家族转录调节因子(磁葡萄球菌(Staphylococcusmagnetis))(UniProt登录号:A0A2T4MS83)、乳糖操纵子转录激活子(木糖葡萄球菌(Staphylococcus xylosus))(UniProt登录号:O333813)、乳糖操纵子转录激活子(腐生葡萄球菌(Staphylococcus saprophyticus)(UniProt登录号:A0A1D4LKB2)、假定的乳糖操纵子转录激活子(模仿葡萄球菌(Staphylococcus simulans))(UniProt登录号:A0A133QVV5)、转录调节因子AraC家族(乳酸乳球菌乳酸亚种(Lactococcus lactissubsp.lactis)菌株KF147)(UniProt登录号:A9QSR3。
在一些实施方案中,传感器包含具有氨基酸序列的转录因子,该氨基酸序列选自由SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54和SEQID NO:55提供的氨基酸序列组成的组,或者是其片段或变体。在一些实施方案中,传感器包含具有氨基酸序列的转录因子,该氨基酸序列与由SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ IDNO:52、SEQ ID NO:53、SEQ ID NO:54和SEQ ID NO:55提供的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同,至少98%相同、至少99%相同、至少99.5%相同,或者是其片段或变体。
在一些实施方案中,碳水化合物结合结构域包含氨基酸序列,该氨基酸序列选自由SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:54和SEQID NO:74提供的氨基酸序列组成的组,或者是其片段或变体。在一些实施方案中,碳水化合物结合结构域具有氨基酸序列,该氨基酸序列与SEQ ID NO:56,SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ IDNO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ IDNO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73或SEQ ID NO:74提供的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同或至少99.5%相同。
在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27或SEQ ID NO:28中的任何一个示出的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分(例如,一部分包含SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27或SEQ ID NO:28中的任何一个序列的氨基酸11-349、氨基酸18-349、氨基酸28-349、氨基酸38-349或氨基酸39-349)至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、和SEQ ID NO:18中的任何一个所示的序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分(例如SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、或SEQ ID NO:18中的任何一个的氨基酸11-349、氨基酸18-349、氨基酸28-349、氨基酸38-349或氨基酸39-349)至少30%、35%、40%、45%、50%、55%、60%、65%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ ID NO:28中的任何一个所示的序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与其一部分(例如SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ IDNO:28中的任何一个的氨基酸11-349、氨基酸18-349、氨基酸28-349、氨基酸38-349或氨基酸39-349)至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
例如,核酸分子包括选自由SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21和SEQ IDNO:22组成的组的序列,或其片段或变体。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22中的任何一个所示的序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22中的任何一个的一部分至少50%、55%、60%、65%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,核酸分子包含选自由SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31和SEQ ID NO:32组成的组的序列,或其片段或变体。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22中的任何一个序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列;或与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO30、SEQ ID NO:31、和SEQ ID NO:32中的任何一个的一部分至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。例如,核酸分子包括选自由SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31和SEQ ID NO:32组成的组的序列,或其片段或变体。在一些实施方案中,核酸分子包含编码多肽的序列,所述多肽具有与SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、和SEQ ID NO:22中的任何一个所示的序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列,或与SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、和SEQ ID NO:32中的任何一个所示的序列的一部分至少50%、55%、60%、65%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。
本发明的传感器、组合物、方法和用途包括具有指定序列或与其基本上相同或相似的序列的多肽和核酸,例如,与指定序列至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在氨基酸序列的上下文中,术语“基本上相同”在本文中用于指,第一氨基酸,其含有足够或最小数目的第二氨基酸序列中比对的氨基酸残基的i)相同的氨基酸残基,或ii)保守取代,使得第一和第二氨基酸序列可以具有共同的结构域和/或共同的功能活性。例如,含有与指定序列具有至少约85%、90%、91%、92%、93%、94%、95%、96%、97%、99%或98%或99%或100%一致性的共同结构域的氨基酸序列被称为基本上相同的。
共振能量转移
诸如乳糖的碳水化合物与本发明的传感器的结合可导致共振能量转移(RET)的变化,包括但不限于生物发光共振能量转移(“BRET”)和荧光共振能量转移(“FRET”)。
如本文所用,“BRET”是基于生物发光蛋白供体和受体分子之间能量的非辐射转移的邻近测定法。“生物发光共振能量转移”和“BRET”可互换使用。
如本文所用,“FRET”是基于例如两种荧光团的两种生色团之间的能量的非辐射转移的邻近测定。“FRET”和“荧光共振能量转移”可互换使用。
一方面,传感器分子包含共价连接至转录因子或其片段或变体的供体结构域和受体结构域。在一些实施方案中,供体结构域是化学发光供体结构域。在可选择的实施方案中,供体结构域是荧光团。在一些实施方案中,受体结构域是荧光受体结构域。
在一些实施方案中,供体结构域共价连接至转录因子或其片段或变体的N末端,受体结构域共价连接至转录因子或其片段或变体的C末端。在可选择的实施方案中,供体结构域共价连接至转录因子或其片段或变体的C-末端,且受体结构域共价连接至转录因子或其片段或变体的N-末端。
A.供体结构域
本发明的传感器分子包含供体结构域。供体结构域能够用作共振能量转移对(例如BRET对或FRET对)中的供体结构域,并且根据上下文,也称为“共振能量转移供体结构域”。如本文所用,术语“供体”是指发射光的分子,例如当用某一波长的光照射时发射光的分子或由于化学反应引起光发射的分子。合适的供体结构域包括化学发光结构域和荧光结构域。
在一些优选的实施方案中,供体结构域能够用作BRET对中的供体结构域。例如,供体结构域可以是化学发光供体结构域。化学发光是由于化学反应而具有有限的热发射(发冷光)的能量发射。本文所用的术语“化学发光”包括依赖于酶活性的生物发光。非酶化学发光是在催化剂存在下有机染料和氧化剂之间的化学反应的结果。当化学诱导的有机染料激发态的能量衰减到基态时,发生化学发光发射。化学发光发射的持续时间和强度主要取决于反应溶液中存在的化学试剂的程度。
在优选实施方案中,化学发光供体结构域是生物发光蛋白。如本文所用,术语“生物发光蛋白”是指能够作用于合适底物以产生发光的任何蛋白。
本领域应当理解,生物发光蛋白是将底物转化为活化产物,然后当其松弛时释放能量的酶。活化产物(由底物上生物发光蛋白的活性产生)是转移到受体分子上的生物发光蛋白产生的发冷光的来源。
有许多不同的生物发光蛋白可用于本发明(参见,例如,表2)。发光系统已知并分离自许多发光生物体,包括细菌、原生动物、腔肠动物、软体动物、鱼、多足类、苍蝇、真菌、蠕虫,甲壳类和甲虫,特别是火甲虫属(Pyrophorus)的叩头虫和北美萤火虫(Photinus)、妖扫萤属(Photuris)和熠萤(Luciola)属的萤火虫。显示生物发光的其他生物体列于WO00/024878,WO99/049019和Viviani(2002)。
表2.示例性生物发光蛋白。
Figure BDA0002432636120000251
Figure BDA0002432636120000261
任何合适的生物发光蛋白可用于本发明的传感器中。一个非常熟知的例子是称为荧光素酶的一类蛋白质,其催化产生能量的化学反应,其中特定的生化物质荧光素(天然存在的荧光团)被具有荧光素酶活性的酶氧化(Hastings,1996)。原核生物和真核生物(包括细菌、藻类、真菌、昆虫、鱼和其他海洋形式的物种)的巨大多样性可以以这种方式发射光能,并且各自具有与其他生物的荧光素酶活性和荧光素化学上不同的特异性荧光素酶活性和荧光素。萤光素/萤光素酶系统在形式、化学和功能上非常多样。因此,具有荧光素酶活性的生物发光蛋白可从多种来源或通过多种方法获得。具有荧光素酶活性的生物发光蛋白的实例可以在US 5,229,285、5,219,737、5,843,746、5,196,524、和5,670,356中找到。两种最广泛使用的荧光素酶是:(i)海肾荧光素酶(来自R.reniformis),一种35kDa的蛋白质,它使用腔肠素作为底物并在480nm处发光(Lorenz等,1991);和(ii)萤火虫荧光素酶(来自Photinus pyralis),一种61kDa的蛋白质,其以荧光素为底物并在560nm处发光(de Wet等,1987)。
Gaussia荧光素酶(来自Gaussia princps)已经用于生物化学测定(Verhaegen等,2002)。Gaussia荧光素酶是20kDa蛋白质,其以快速反应氧化腔肠素,导致470nm处的明亮光发射。
用于本发明的荧光素酶的特征还在于Anachnocampa sp(WO2007/019634)。这些酶的大小约为59kDa,并且是ATP依赖性荧光素酶,其催化发射光谱在光谱的蓝色部分内的发光反应。
天然存在的生物发光蛋白的生物活性变体或片段可由本领域技术人员容易地制备。可用于本发明的这些变体的三个实例是RLuc2(Loening等,2006)、RLuc8(Loening等,2006)和RLuc8.6-535(Loening等,2007),它们各自是海肾(Renilla)荧光素酶的变体。在另一个优选的实施方案中,选择BRET化学发光供体的序列以具有比掺入天然海肾(Renilla)荧光素酶传感器的传感器分子更大的热稳定性。RLuc2或RLuc8是合适选择的方便实例,其因此显示比掺入天然海肾(Renilla)荧光素酶序列的传感器高≥5x或≥10x的亮度。这种增强的亮度具有显著的益处,因为它允许对于任何给定的时间分辨率更经济地使用试剂。
或者,可用于本发明的非荧光素酶生物发光蛋白是可作用于合适底物以产生发光信号的任何酶。这些酶的具体实例是β-半乳糖苷酶,内酰胺酶,辣根过氧化物酶,碱性磷酸酶,β-葡糖醛酸糖苷酶和β-葡糖苷酶。用于这些酶的合成发光底物是本领域公知的,并且可从公司例如Tropix公司(美国马萨诸塞州贝德福德)商购获得。
Hushpulian等,(2007)描述了可用于本发明的过氧化物酶的实例。
在一些实施方案中,生物发光蛋白是荧光素酶、β-半乳糖苷酶、内酰胺酶、辣根过氧化物酶、碱性磷酸酶、β-葡糖醛酸糖苷酶或β-葡糖苷酶。在一些实施方案中,生物发光蛋白是荧光素酶。合适的萤光素酶包括但不限于,海肾萤光素酶、萤火虫萤光素酶、腔肠动物(Coelenterate)萤光素酶、北美萤火虫(North American glow worm)萤光素酶、叩头虫(click beetle)萤光素酶、铁路蠕虫(railroad worm)萤光素酶、细菌萤光素酶、Gaussia萤光素酶、水母(Aequorin)发光蛋白、蕈蚊(Arachnocampa)萤光素酶、Oplophorusgracilirostris萤光素酶或其任何一种的生物活性变体或片段,或其两种或更多种的嵌合体。在一个实例中,优选的荧光素酶是RLuc8或其变体。
如本文所用,“生物活性片段”是如本文所述的多肽的一部分,其保持全长多肽的限定的活性。如本文所用,“生物活性变体”是通过一个或多个氨基酸与天然存在的和/或确定的分子不同但保持限定的活性的分子,如以上对于生物活性片段所定义的。生物活性变体通常与天然存在和/或限定的分子具有至少50%、更优选至少80%、更优选至少90%、更优选至少95%、更优选至少97%、甚至更优选至少99%的一致性。
在一个优选的实施方案中,具有小分子量的生物发光蛋白用于防止由于空间位阻而抑制相互作用。生物发光蛋白优选由单个多肽链组成。此外,生物发光蛋白优选不形成低聚物或聚集体。生物发光蛋白Renilla荧光素酶,Gaussia荧光素酶和萤火虫(Firefly)荧光素酶满足所有或大部分这些标准。
在一些实施方案中,化学发光供体结构域能够修饰底物。如本文所用,术语“底物”是指可与化学发光供体结合使用以产生或吸收发光的任何分子。底物的选择可以影响由化学发光供体产生的光的波长和强度。在一些实施方案中,生物发光蛋白具有底物,所述底物选自荧光素,钙,腔肠素,furimazine,或腔肠素、荧光素或furimazine的衍生物、类似物或稳定衍生物。
腔肠素(coelenterazine)是广泛已知的底物,其存在于刺细胞动物(cnidarians)、桡足类(coppods)、毛颚类(chaetognaths)、栉水母类(ctenophores)、十足虾(decapod shrinps)、糠虾(myside shrinps),放射虫(radiolaris)和一些鱼类类群中(Greenr和Szalay,2002)。例如,对于海肾荧光素酶,可获得腔肠素类似物/衍生物,其导致418和547nm之间的光发射(Inouye等,1997,Loening等,2007)。已经描述了腔肠素类似物/衍生物(400A,DeepBlueC)与海肾荧光素酶一起发射400nm的光(WO01/46691)。腔肠素类似物/衍生物的其他实例是栉水母类、Prolume紫、Prolume紫II、Prolume紫III、ViviRen和Furimazine。腔肠素类似物/衍生物的其他实例包括但不限于PCT/US2013057660和US20140302539中公开的化合物。
如本文所用,术语“荧光素”被广义地定义,并且是指在能够生物发光的生物体中发现的一类发光生物颜料以及合成类似物或功能等同的化学品,其在酶荧光素酶的存在下被氧化以产生光形式的氧化荧光素和能量。首先从萤火虫Photinus pyralis中分离出D-荧光素或2-(6-羟基苯并噻唑-2-基)-2-噻唑啉-4-甲酸。从那时起,已经从各种不同的生物体,主要从海洋,例如鱼和鱿鱼中,发现和研究了荧光素的各种化学上不同的形式,然而,已经在陆地居住生物体中鉴定了许多荧光素,例如蠕虫、甲虫和各种其他昆虫(Day等,2004;Vivivani,2002)。如本文所用,荧光素还包括荧光素的衍生物或类似物。
除了完全合成的荧光素,例如环状烷基氨基荧光素(CycLuc1)之外,还存在至少五种一般类型的生物演化的荧光素,它们各自在化学上不同并且由化学和结构上不同的荧光素酶催化,所述荧光素酶使用广泛的不同辅因子。首先,萤火虫萤光素是萤火虫萤光素酶的底物,其需要ATP用于催化(EC 1.13.12.7)。第二,是细菌荧光素,也在一些鱿鱼和鱼中发现,其由长链醛和还原的核黄素磷酸酯组成。细菌荧光素酶是FMNH依赖性的。第三,是甲藻萤光素,一种在甲藻(海洋浮游生物)中发现的四吡咯叶绿素衍生物,该生物体造成夜间海洋磷光。甲藻萤光素酶催化甲藻萤光素的氧化,并且由三个相同的催化活性结构域组成。第四,是咪唑并吡嗪介形虫荧光素(vargulin),其被发现于某些介形类和深海鱼类中,例如光蟾鱼(Porichthys)。最后,是腔肠素(coelenterazine)(一种咪唑并吡嗪),一种蛋白质水母(Aequorin)发光蛋白的光发射体,发现于放射虫、栉水母类、刺细胞动物、鱿鱼、桡足类、毛颚类、鱼和虾中。
在一些实施方案中,生物发光蛋白需要辅因子。辅因子的实例包括但不一定限于ATP、镁、氧、FMNH2、钙或其任何两种或多种的组合。
在另一个实施方案中,共振能量转移供体结构域是荧光供体结构域。荧光供体结构域可以是荧光蛋白或非蛋白。在一些实施方案中,荧光供体结构域是非蛋白质。适合用作供体结构域的荧光团的非限制性实例包括但不限于Alexa Fluor染料(例如AF680、AF750)、Bodipy染料、Cy染料、荧光素、丹磺酰基、伞形酮、荧光微球、发光微球、荧光纳米晶体、Marina蓝、Cascade蓝、Cascade黄、Pacific蓝、Oregon绿、四甲基若丹明、若丹明、德克萨斯红、稀土元素螯合物或其任何组合或衍生物。
在一些实施方案中,供体结构域是荧光蛋白。非限制性实例包括诸如以下的蛋白:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、tdTomato、mCherry、Kaede蛋白、TagRFP、TurBoFB或藻胆(色素)蛋白,或其任何一个的生物活性变体或片段。在一些实施方案中,优选的荧光供体结构域是CFP。
B.受体结构域
本发明的传感器分子还包含受体结构域。受体结构域能够用作共振能量转移对(例如BRET对或FRET对)中的受体结构域,并且根据上下文,也称为“共振能量转移受体结构域”。如本文所用,“受体结构域”是能够接受由于供体结构域的活性而发射的能量的任何分子。
在一些实施方案中,受体结构域(本文也称为“受体分子”)是荧光受体结构域。如本文所用,术语“荧光受体结构域”(本文也称为“荧光受体分子”)是指能够接受由于供体结构域的活性而发射的能量并将其作为光能再发射的任何化合物。
有许多不同的受体结构域可用于本发明。合适的受体结构域可以是蛋白质或非蛋白质的。
在一些实施方案中,荧光受体结构域是荧光蛋白。一个众所周知的例子是荧光团组,其包括:来自水母维多利亚多管发光水母(Aequorea victoria)的绿色荧光蛋白,和由例如诱变和嵌合蛋白技术的分子生物学应用产生的许多其他变体(GFPs)(Tsien,1998)。GFPs基于其发色团的独特组分进行分类,每一类具有不同的激发和发射波长:第1类,中性酚和阴离子酚盐的野生型混合物:第2类,酚盐阴离子:第3类,中性酚:第4类,具有堆叠s-电子系统的酚盐阴离子:第5类,吲哚:第6类,咪唑:和第7类,苯基。
已经突变(变体)的天然存在的受体分子也可用于本发明。适用于BRET的工程化系统的一个实例是海肾荧光素酶和GFP配对的增强黄色突变体(EYFP),其在不存在介导蛋白(在这种情况下,G蛋白偶联受体)的情况下彼此不直接显著程度地相互作用(Xu等,1999)。
实例包括但不限于:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、TdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,或其任何一个的生物活性变体或片段。在一些实施方案中,优选的荧光受体结构域是GFP2。在其他实施方案中,优选的荧光受体结构域是YFP。
在一些实施方案中,荧光受体结构域是非蛋白质。非蛋白质的受体分子的实例包括但不限于Alexa Fluor染料(例如AF680、AF750)、Bodipy染料、Cy染料、荧光素、丹磺酰基、伞形酮、荧光微球、发光微球、荧光纳米晶体、Marina蓝、Cascade蓝、Cascade黄、Pacific蓝、Oregon绿、四甲基若丹明、若丹明、德克萨斯红、稀土元素螯合物或其任何组合或衍生物。
C.供体结构域和受体结构域对
在本发明的传感器中可以使用任何数量的供体-受体组合。供体-受体组合应该能够用作BRET对或FRET对。本领域技术人员能够选择允许有效能量转移的供体和受体对。
在优选的实施方案中,在存在和/或不存在碳水化合物的情况下,供体结构域和受体结构域的分离和相对取向在费尔斯特距离的±50%之内。如本文所用,术语“供体结构域和受体结构域在存在和/或不存在碳水化合物的情况下的分离和相对取向在费尔斯特距离的±50%内”是指可以在R0的±50%的范围内进行的稳态RET测量。该短语包括从供体结构域到受体结构域的发光能量转移效率为10-90%。在一些实施方案中,化学发光供体结构域和受体结构域的费尔斯特距离为至少4nm、为至少5.6nm、或为至少6nm。在一些实施方式中,该费尔斯特距离小于12nm、小于11nm、小于10nm或小于9nm。在一些实施方案中,供体结构域和受体结构域的费尔斯特距离是约4nm-约11nm、约5.6nm-约11nm或约7nm-约11nm。不希望受理论的束缚,本发明人相信供体结构域和受体结构域的费尔斯特距离与可用于本申请传感器的碳水化合物结合结构域的大小相匹配。碳水化合物结合结构域可以是:例如全长HTH转录因子,其保留碳水化合物结合活性的片段,HTH转录因子的碳水化合物结合结构域或其变体。
在确定合适配对时应考虑的标准是受体分子与供体分子相比的相对发射/荧光光谱。供体的发射光谱应当与受体分子的吸收光谱重叠,使得来自供体发射的光能的波长能够激发受体分子,从而当两个分子彼此适当接近和取向时促进受体分子荧光。例如,基于可观察到的发射光谱峰,已经证明海肾荧光素酶/EGFP配对不如海肾荧光素酶/EYEF配对(Xu等,1999;Wang等,(1997)在生物发光和化学发光:Molecular Reporting with Photons(光子分子报告),Hastings等编辑(纽约威利),第419-422页)。为了研究可能的配对,制备含有选择的供体和受体结构域的蛋白质融合体(例如),并且如果需要,在合适的底物存在下进行测试。
还应当确认供体和受体结构域彼此不虚假地缔合。例如,这可以通过在相同细胞中分别共表达生物发光蛋白和受体分子,然后监测发光光谱以确定BRET是否发生来实现。这可以例如使用Xu等(1999)的方法来实现。如果观察到几乎没有或没有BRET,则所选择的生物发光蛋白和受体分子形成合适的BRET对。可以对FRET对进行类似的实验。
在一些实施方案中,本发明的传感器分子包含化学发光供体结构域和荧光受体结构域。
在一些实施例中,可通过对底物的修改来操纵供体发射。在海肾(Renilla)荧光素酶的情况下,底物是腔肠素。改变供体发射的基本原理是提高供体发射和受体发射之间的分辨率。原始BRET系统使用海肾(Renilla)荧光素酶作为供体,EYFP(或Topaz)作为受体,腔肠素h衍生物作为底物。当在BRET测定中组合时,这些组分对于生物发光蛋白产生475-480nm范围内的光,对于受体分子产生525-530nm范围内的光,得到45-55nm的光谱分辨率。
不幸的是,海肾(Renilla)荧光素酶产生基本上与GFP发射重叠的宽发射峰,这又有助于降低系统的信噪比。用于本发明的一种BRET系统具有coe1400a作为海肾(Renilla)荧光素酶底物并提供供体和受体发射波长(-105nm)之间的宽光谱分辨率。具有coe1400a的海肾(Renilla)荧光素酶产生390-400nm之间的光,制备GFP衍生物(GFP2),其吸收该范围内的光并重新发射505-508nm的光。由于海肾(Renilla)荧光素酶和GFP发射之间光谱分辨率的增加,该BRET系统提供了监测碳水化合物与本申请传感器结合的极好的生物工具。然而,较小的斯托克斯(Stokes)位移BRET系统也将允许碳水化合物的灵敏测量。
本领域已知各种腔肠素衍生物,包括coel400a,其由于海肾荧光素酶活性而产生各种波长的光(不同于野生型腔肠素产生的光)。本领域技术人员将理解,因为供体的发光峰已经改变,所以必须选择将吸收该波长的光并由此允许有效能量转移的受体分子。这可以例如通过改变第4类GFP以使其变成第3类或第1类GFP来完成。供体的光发射和受体的光吸收峰之间的光谱重叠是有效能量转移的一个条件。已知第3类或第1类GFP吸收400nm的光并在505-511nm之间重新发射。这导致供体和受体发射之间的波长差约为111nm。
其他生物发光蛋白和受体分子对的实例提供于表3中。
表3.示例性BRET生物发光蛋白和受体分子对。
Figure BDA0002432636120000311
Figure BDA0002432636120000321
Figure BDA0002432636120000331
Figure BDA0002432636120000341
Figure BDA0002432636120000351
Figure BDA0002432636120000361
Figure BDA0002432636120000371
Figure BDA0002432636120000381
Figure BDA0002432636120000391
Figure BDA0002432636120000401
Figure BDA0002432636120000411
Figure BDA0002432636120000421
在一些实施方案中,优选的生物发光蛋白和受体结构域对是RLuc8和GFP2
在一些实施方案中,本发明的传感器分子包含荧光供体结构域和荧光受体结构域。
任何适当选择的荧光团都可以用作供体和/或受体,条件是供体的发射光谱与受体的激发光谱充分重叠即可。在确定合适配对时应考虑的标准是受体分子与供体的激发光谱相比的激发光谱。如本领域技术人员将理解的,在供体结构域的激发最大值处应该存在受体结构域的最小直接激发。
其他荧光供体和受体结构域对的实例提供于表4中。荧光供体和受体结构域对的其他实例在Bajar等(2016)中讨论。
表4.示例性FRET荧光供体和受体结构域对。
<u>荧光供体</u> <u>受体波长(Em)</u> <u>荧光受体分子</u> <u>受体波长(Exc)</u>
FITC 520nm TRITC 550nm
Cy3 566nm Cy5 649nm
EGFP 508nm Cy3 554nm
CFP 477nm YFP 514nm
EGFP 508nm YFP 514nm
GFP<sup>2</sup> YFP 514nm
ECFP 475nm EYFP 513nm
mTurquioise2 474nm mCitrine 516nm
mClover3 518nm mRuby3 558nm
eqFP650 650nm iRFP 690nm
mAmetrine 526nm tdTomato 554nm
在一些实施方案中,优选的供体结构域和受体结构域对是CFP和YFP。
碳水化合物结合
碳水化合物与本发明传感器的碳水化合物结合结构域的结合改变供体结构域相对于受体结构域的空间位置和/或偶极取向。在一些实施方案中,空间位置和/或偶极取向的改变导致BRET的改变。在一些实施方案中,空间位置和/或偶极取向的改变导致FRET的改变。
如本文所用,术语“空间位置”是指供体相对于受体分子的三维定位,其由于分析物结合或从传感器分子释放而改变。
如本文所用,术语“偶极取向”是指与供体和/或受体分子相关的偶极矩在三维空间中相对于它们在三维空间中的取向的方向。偶极矩是分子上电荷变化的结果。
以BRET为例,在一个实施方案中,将生物发光蛋白和受体分子之间发生的能量转移表示为使用选择特定波长的滤光片(一个用于受体分子发射,另一个用于生物发光蛋白发射)测量的发射的计算比率(参见等式1)。
Ea/Ed=BRET比率 (1)
其中Ea定义为受体分子发射强度(使用适合于受体发射的特定滤光器选择发射光),且Ed定义为生物发光蛋白发射强度(使用适合于生物发光蛋白发射的特定滤光器选择发射光)。
本领域技术人员应当容易理解,滤光器可以是允许适用于BRET的波长区分的任何类型的滤光器。例如,根据本发明使用的滤光器可以是干涉滤光器、长通滤光器、短通滤光器等。通过滤光器的波长的强度(通常以每秒计数(CPS)或相对发光单位(RLU))可以使用光电倍增管(PMT)、包括级联光电二极管的光电二极管、光电二极管阵列或诸如电荷耦合器件(CCD)照相机的敏感照相机来量化。量化的信号随后用于计算BRET比率并表示能量转移效率。BRET比率随着受体发射强度的增加而增加。
通常,确定受体发射强度与供体发射强度的比率(参见等式1),其是反映能量转移效率的以任意单位表示的数。该比率随着能量转移效率的增加而增加(参见Xu等人,1999)。
能量转移效率也可以使用供体发射强度与受体发射强度的反比来表示(参见等式2)。在这种情况下,比率随着能量传递效率的增加而减小。在进行该计算之前,针对背景光的存在和底物的自发光来校正发光强度。这种校正通常通过从含有底物但不含本发明的生物发光蛋白、受体分子或多肽的对照样品中减去在适当波长下测量的发射强度来进行。
Ed/Ea=BRET比率 (2)
其中Ea和Ed如上所定义。
生物发光蛋白和受体分子发射的光强度也可以使用诸如分光荧光计的基于单色器的仪器、电荷耦合器件(CCD)照相机或二极管阵列检测器来定量。使用分光荧光计,进行发射扫描,使得在加入底物时检测生物发光蛋白和受体分子发射峰。峰值下的面积代表相对光强度并用于计算比率,如上所述。能够测量来自同一样品的生物发光蛋白和受体分子的光的任何仪器都可用于监测本发明的BRET系统。
在另一个实施方案中,受体分子发射单独适用于BRET的有效检测和/或定量。在这种情况下,仅使用受体发射强度来表示能量转移效率。对于本领域技术人员显而易见的是,为了测量能量转移,可以使用受体发射强度而不进行任何比率计算。这是由于理想情况下受体分子仅在吸收从生物发光蛋白转移的光时才发光。在这种情况下,只需要一个滤光器。
在相关的实施方案中,单独的生物发光蛋白发射适于BRET的有效检测和/或定量。在这种情况下,仅使用生物发光蛋白发射强度计算能量转移效率。对于本领域技术人员显而易见的是,为了测量能量转移,可以使用供体发射强度而不进行任何比率计算。这是由于当受体分子吸收从生物发光蛋白转移的光时,生物发光蛋白的可检测发射相应减少。在这种情况下,只需要一个滤光器。
在替代实施例中,使用仅需要一个滤光器来进行测量的比率测量来表示能量转移效率。在这种情况下,使用适当的滤光器确定供体或受体的光强度,并且在不使用任何滤光器的情况下进行样品的另一测量(开放光谱的强度)。在后一测量中,量化总光输出(对于所有波长)。然后使用等式3或4进行比率计算。对于等式3,只需要用于受体的滤光器。对于等式4,只需要用于供体的滤光器。
Ea/Eo-Ea=BRET比率或=Eo-Ea/Ea (3)
Eo-Ed/Ed=BRET比率或=Ed/Eo-Ed (4)
其中Ea和Ed如上所定义,Eo定义为所有组合波长(开放光谱)的发射强度。
对于本领域技术人员显而易见的是,可以从等式1到4导出另外的等式。例如,一种这样的衍生物包括校正存在于生物发光蛋白和/或受体分子的发射波长处的背景光。
在进行BRET测定时,可以使用BRETCount测定每个孔的光发射。BRETCount仪器是改进的TopCount,其中TopCount是由帕卡德仪器(Packard Instrument)(康涅狄格州梅里登市)销售的微量滴定板闪烁和发光计数器。与利用两个光电倍增管(PMT)同时消除背景噪声的传统计数器不同,TopCount采用单PMT技术和时间分辨脉冲计数以降低噪声,从而允许在标准不透明微量滴定板中计数。不透明微滴定板的使用可以将光学串扰降低到可忽略的水平。TopCount有各种格式,包括1、2、6和12个检测器(PMT),它们分别允许同时读取1、2、6或12个样本。除了BRETCount之外,其他市售仪器能够进行BRET:Victor2(芬兰瓦拉克(珀金埃尔默生命科学))和Fusion(梅里登市帕卡德仪器)。BRET可以使用能够检测至少受体分子发射并且优选两个波长(对于受体分子和生物发光蛋白)或更多波长的读取器来进行。
BRET是一种比率测定技术,其可以消除由于测定体积、测定条件和穿过板中不同孔的信号衰减的变化引起的光输出波动引起的数据可变性。基于RET的反应是均相的,通常在没有固相附着的溶液中发生。这允许在不分离的情况下检测不同形式的分析物,例如液体、气体甚至微粒。
乳糖传感器分子
本文定义的传感器分子的一个非限制性实例是可用于检测和/或测量乳糖浓度的传感器分子。因此,在一些实施方案中,本发明提供了用于检测乳糖的传感器分子,其包含能够结合乳糖或其变体的细菌转录因子,该细菌转录因子共价连接至共振能量转移供体结构域和共振能量转移受体结构域,其中当乳糖结合至转录因子时,供体结构域相对于受体结构域的空间位置和/或偶极取向改变。在一些实施方案中,本发明提供了一种用于检测乳糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。乳糖与传感器分子的结合产生共振能量转移(RET)的变化,例如BRET的变化或FRET的变化。根据选择的供体结构域和受体结构域,RET的变化可以是BRET的变化或FRET的变化。
在一些实施方案中,BgaR转录因子或其变体具有氨基酸序列,所述氨基酸序列与SEQ ID NO:1提供的序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同,或具有与其一部分至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,BgaR转录因子与SEQ ID NO:1提供的100%相同。在一些实施方案中,所述BgaR转录因子或其变体具有与SEQ ID NO:9中提供的氨基酸序列至少50%、60%、70%、80%、85%、90%、95%、98%或100%相同的氨基酸序列。在一些实施方案中,BgaR转录因子或其变体与SEQ ID NO:9提供的100%相同。
因此,在一些实施方案中,共振能量转移供体结构域是生物发光蛋白。合适的生物发光蛋白的非限制性实例如上所述,且包括荧光素酶、β-半乳糖苷酶、内酰胺酶、辣根过氧化物酶、碱性磷酸酶、β-葡糖醛酸糖苷酶或β-葡糖苷酶。在一些实施方案中,生物发光蛋白是荧光素酶。萤光素酶可以选自海肾萤光素酶、萤火虫萤光素酶、腔肠动物(Coelenterate)萤光素酶、北美萤火虫(North American glow worm)萤光素酶、叩头虫(click beetle)萤光素酶、铁路蠕虫(railroad worm)萤光素酶、细菌萤光素酶、Gaussia萤光素酶、水母(Aequorin)发光蛋白、蕈蚊(Arachnocampa)萤光素酶、深海虾(Oplophorusgracilirostris)萤光素酶或其任何一种的生物活性变体或片段,或其两种或更多种的嵌合体。在一些实施方案中,共振能量转移供体结构域是海肾荧光素酶。在一些实施方案中,共振能量转移供体域是RLuc8。在一些实施方案中,共振能量转移供体结构域能够修饰底物。底物的非限制性实例包括荧光素,钙,腔肠素,furimazine,或腔肠素、荧光素或furimazine的衍生物、类似物或稳定衍生物。在这些实施方案中,乳糖与传感器分子的结合产生BRET的变化。
因此,在一些实施方案中,共振能量转移供体结构域是荧光蛋白。合适的荧光蛋白的非限制性实例包括:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。在一些实施方案中,供体结构域是CFP。在这些实施方案中,乳糖与传感器分子的结合产生FRET的变化。
在一些实施方案中,共振能量转移受体结构域是荧光受体结构域。在一些实施方案中,荧光受体结构域是荧光蛋白。合适的荧光蛋白的非限制性实例包括:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。在一些实施方案中,受体结构域是YFP。在其他实施方案中,受体结构域是GFP,优选GFP2
在优选的实施方案中,供体结构域是CFP或其变体,且受体结构域是YFP或其变体。在一些实施方案中,传感器还包含YFP和BgaR之间和/或CFP和BgaR之间的接头。在一些实施方案中,传感器还包含蛋白酶切割位点和/或纯化标签。在一些实施方案中,传感器包含与SEQ ID NO:23提供的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同、至少99.5%相同的氨基酸序列。在一些实施方案中,传感器与SEQ ID NO:23提供的100%相同。在这些实施方案中,乳糖与传感器分子的结合产生FRET的变化。
在优选的实施方案中,供体结构域是海肾(Renilla)荧光素酶或其变体,且受体结构域是GFP或其变体。例如,供体结构域可以是RLuc8,且受体结构域可以是GFP2。在一些实施方案中,传感器分子是包含RLuc8-BgaR-GFP2的单个多肽。在一些实施方案中,传感器分子是是包含GFP2-BgaR-RLuc8的单个多肽。在一些实施方案中,传感器还包含GFP2和BgaR之间和/或RLuc8和BgaR之间的接头。在一些实施方案中,传感器还包含蛋白酶切割位点和/或纯化标签。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列具有与选自由SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28组成的组的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同或至少99.5%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35和SEQ ID NO:36组成的组的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同、至少99.5%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17和SEQ ID NO:18组成的组的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同、至少99.5%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列具有与选自由SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、和SEQ ID NO:28组成的组的氨基酸序列至少30%相同、至少35%相同、至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少98%相同、至少99%相同或至少99.5%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ ID NO:28组成的组的氨基酸序列100%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、和SEQ ID NO:18组成的组的氨基酸序列100%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、和SEQ ID NO:28组成的组的氨基酸序列100%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自由SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、和SEQ ID NO:36组成的组的氨基酸序列100%相同。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ ID NO:28组成的组的氨基酸序列100%相同,或是其片段或变体。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、和SEQ ID NO:18组成的组的氨基酸序列100%相同,或是其片段或变体。在一些实施方案中,传感器包含氨基酸序列,该氨基酸序列与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、和SEQ ID NO:28组成的组的氨基酸序列100%相同,或是其片段或变体。在这些实施方案中,乳糖与传感器分子的结合产生BRET的变化。
可用于检测和/或测量乳糖浓度的传感器分子特别适用于测定无乳糖产品中的残留乳糖。在乳品和乳制品(奶油、黄油、冰淇淋、干酪、奶粉)中发现高水平的乳糖(5%)(Fernandes Silveira等,2015)。无乳糖和减少乳糖的产品的市场正在增长,但是并没有便宜、快速、灵敏的方法来测量在处理以除去或减少乳糖的量之后乳制品中乳糖的残留量。根据澳大利亚和新西兰食品标准局(FSANZ),乳糖减少的乳制品必须含有不超过0.3%的乳糖。不含乳糖的产品被定义为具有不可检测水平的二糖,这是经过解释的定义。然而,欧洲和中国市场需要低于0.01%的乳糖水平。
尽管已经很好地建立了导致乳中乳糖减少/消除的酶促方法,但是对于那些进行酶促方法以验证在加工时乳糖减少的程度的人来说,还没有已建立的方法。目前,将乳糖减少和不含乳糖的乳样品从加工厂送至专门实验室进行分析。这导致额外的成本,是由于物流的原因,需要专门的实验室设备和专业知识,以及需要额外地持有被评估的货物。除了与当前分析方法和储存相关的成本之外,并非所有不含乳糖的乳都被测试,导致乳的不均匀处理和产品对消费者的潜在不可靠性。因此,需要用于测量例如乳糖减少的和无乳糖的乳制品的食品中乳糖浓度的替代方法和传感器。优选地,所述方法和传感器将为乳制品加工者提供快速、灵敏、选择性、在线的方法,用于在加工厂测量乳中的低水平乳糖。
乳中残留乳糖的测量在至少两个水平上代表了一个挑战:i)经过酶处理降解乳糖后,乳中乳糖的含量约为0.01%w/v;ii)由于存在高浓度的乳糖衍生的单糖,可能会干扰乳糖的测量,因此具有选择性。优选地,在一些实施方案中描述的方法和传感器将能够检测浓度为约0约.0001%w/v或更高、约0.0003%w/v或更高、约0.0005%w/v或更高、约0.0007%w/v或更高、约0.001%w/v或更高、约0.003%w/v或更高、约0.005%w/v或更高、约0.007%w/v或更高、约0.01%w/v或更高、约0.03%w/v或更高、约0.05%w/v或更高、约0.07%w/v或更高、或约0.1%w/v或更高的乳糖。优选地,在一些实施方案中描述的方法和传感器将能够在例如乳糖衍生的单糖和/或乳果糖的其他碳水化合物存在下检测乳糖。在一些实施方案中,所述方法和传感器可在至少0.1mM、至少1mM、至少10mM、至少20mM、至少50mM、至少100mM、至少130mM、至少200mM、至少260mM碳水化合物、至少300mM或至少350mM总碳水化合物存在下检测乳糖。如本领域技术人员将理解的,总碳水化合物浓度不包括乳糖(例如,如果样品包含乳糖、半乳糖和葡萄糖,则该浓度是指葡萄糖和半乳糖的浓度)。在一些实施方案中,所述方法和传感器可在至少0.1mM、至少1mM、至少10mM、至少20mM、至少50mM、至少100mM、至少130mM、至少200mM、至少260mM碳水化合物、至少300mM或至少350mM葡萄糖和半乳糖存在下检测乳糖。
在一些实施方案中,提供了用于检测乳糖的传感器分子,所述传感器包含
i)螺旋-转角-螺旋转录因子的乳糖结合结构域,或碳水化合物结合结构域的变体;
ii)化学发光供体结构域;以及
iii)受体结构域;
其中当所述碳水化合物与所述乳糖结合结构域结合时,所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
在一些实施方案中,提供了用于检测乳糖的传感器分子,所述传感器包含
i)细菌BgaR转录因子;
ii)共振能量转移供体结构域;以及
iii)共振能量转移受体结构域;
其中当乳糖与转录因子结合时,化学发光供体结构域相对于受体结构域的空间位置和/或偶极取向改变。共振能量转移供体结构域和共振能量转移受体结构域如本文所定义。
乳果糖传感器分子
本文定义的传感器分子的另一非限制性实例是可用于检测和/或测量乳果糖浓度的传感器分子。因此,在一些实施方案中,本发明提供了如本文所定义的用于检测乳果糖的传感器分子。在一些实施方案中,本文所述的方法和传感器将能够检测浓度为约0.05mM或更高、约0.1mM或更高、约0.5mM或更高、约1mM或更高、约1.5mM或更高、约1.8mM或更高或约2mM或更高的乳果糖。在一些实施方案中,在一些实施方案中描述的方法和传感器将能够检测浓度为约0.1mM或更高的乳果糖。
组合物,试剂盒,方法和用途
本文所述的传感器可被包括在用于检测碳水化合物的组合物中。例如,本文所述的传感器可包括在用于检测糖或糖衍生物的组合物中。在一个实施方案中,本文所述的传感器可被包括在用于检测乳糖的组合物中。在一个实施方案中,本文所述的传感器可被包括在用于检测乳果糖的组合物中。在一些实施方案中,提供了包含根据本发明的传感器和可接受的载体的组合物。如本文所用,术语“可接受的载体”包括与本发明的方法和用途相容的任何和所有固体或溶剂(例如磷酸盐缓冲盐水缓冲液、水、盐水)分散介质,包衣等。在与组合物的其他成分相容的意义上,可接受的载体必须是“可接受的”,不损害被测试的碳水化合物并且不抑制碳水化合物与碳水化合物结合结构域的结合。通常,合适的可接受的载体是本领域已知的并且是基于最终用途应用来选择的。
如本领域技术人员将理解的,本申请的传感器可用于检测样品中碳水化合物的存在或不存在,并且如果存在,也可用于测定样品中碳水化合物的存在量。因此,在一些实施方式中,提供了一种检测样品中的碳水化合物的方法,该方法包括:i)使样品与本发明的传感器分子接触;以及ii)确定在样品存在下化学发光供体结构域相对于受体结构域的空间位置和/或偶极方向是否已改变,其中化学发光供体结构域的空间位置和/或偶极方向相对于受体结构域的的改变表示样品中存在碳水化合物。在一些实施方案中,确定化学发光供体结构域相对于受体结构域的空间位置和/或偶极取向在样品存在下是否已经改变包括在加入样品之前和之后测量BRET比率。
在一些实施方案中,所述方法还包括测定样品中碳水化合物的浓度。
在一些实施方案中,碳水化合物选自由乳糖和乳果糖组成的组。在一些实施方案中,碳水化合物是乳糖。在一些实施方案中,碳水化合物是乳果糖。
传感器可用于检测和定量样品中的碳水化合物。“样品”可以是可能含有碳水化合物的任何物质或组合物。在一些实施方案中,样品是空气、液体、生物材料或土壤。在一些实施方案中,样品选自由以下组成的组:乳制品或其提取物,土壤或其提取物,生物材料或其提取物等。样品可以直接从环境或来源获得,或者可以在进行本发明的方法之前通过合适的程序提取和/或至少部分纯化。
在一些实例中,样品包含生物材料。如本文所用,“生物材料”广义地定义且包括全部或部分衍生自生物体的任何材料。生物材料包括但不限于体液、细胞、软组织(如结缔组织和非结缔组织)和硬组织(如骨和软骨)。在一些实施方案中,体液是血液、血清、痰、粘液、脓、腹膜液、尿或其他体液。在一些实施方案中,这样的材料可以从活生物体中收获,然后进行进一步的加工和/或化学处理。在一个实施例中,传感器不用于检测活细胞内的碳水化合物。在一些实施例中,传感器离体使用。
在一些实施方案中,样品包含乳制品。如本文所用,术语“乳制品”包括乳品和部分或全部衍生自乳品的产品。乳品可以获自任何哺乳动物,例如牛、绵羊、山羊、马、骆驼、水牛、人等。乳制品包括但不限于,原料乳、低脂乳、脱脂乳、巴氏灭菌乳、延长保质期乳、UHT乳、乳糖改性UHT乳、强化UHT乳、调味UHT乳和这些产品的组合,以及UHT婴儿配方、乳酪、酸奶、乳清、酪乳、奶油、奶粉、粉状婴儿配方、冰淇淋和奶油等。在一些实例中,样品是乳或稀释乳。乳制品还可以是乳制品的提取物,例如部分纯化的部分,其包含或疑似包含感兴趣的碳水化合物。
在一些实施方案中,本发明的传感器可用于检测乳制品中的乳糖。因此,提供了一种检测乳制品中乳糖的方法,该方法包括:i)使样品与本发明的传感器分子接触;以及ii)确定在样品存在下化学发光供体结构域相对于受体结构域的空间位置和/或偶极方向是否已改变,其中化学发光供体结构域的空间位置和/或偶极方向相对于受体结构域的的改变表示样品中存在乳糖。
本发明的传感器还可用于监测样品中碳水化合物的浓度。
在一些实施方案中,本发明的传感器可用于检测乳制品中的乳果糖。因此,提供了一种检测乳制品中乳果糖的方法,该方法包括:i)使样品与本发明的传感器分子接触;以及ii)确定在样品存在下化学发光供体结构域相对于受体结构域的空间位置和/或偶极方向是否已改变,其中化学发光供体结构域的空间位置和/或偶极方向相对于受体结构域的的改变表示样品中乳果糖。在一些实施方案中,所述方法还包括测定样品中乳果糖的浓度。
乳果糖已经由国际乳业联盟和欧洲联盟提出作为热处理引起的乳损害的指标并且作为区分巴氏灭菌乳([乳果糖]<10μM)、超高温(UHT)处理乳([乳果糖]<1.8mM)和容器内消毒乳([乳果糖]>1.8mM)的标准(Marconi等,2004;Montilla等,1996)。在一些实施方案中,本发明的传感器可用于监测样品中乳果糖的浓度。在一些实施例中,本发明的传感器可用于提供由热处理引起的乳损坏的指示。在一些实施例中,本发明的传感器可用于区分各种形式的乳,例如巴氏杀菌乳、超高温(UHT)处理乳和容器内消毒乳。
在一些实施方案中,还提供了传感器分子用于检测碳水化合物的用途,所述传感器分子包含:
i)螺旋-转角-螺旋转录因子的碳水化合物结合结构域,或所述碳水化合物结合结构域的变体;
ii)化学发光供体结构域;以及
iii)受体结构域;
其中当所述碳水化合物结合至所述碳水化合物结合结构域时,所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。在一些实施方案中,所述用途还包括测定样品中碳水化合物的浓度。
另一方面提供了一种用于检测乳糖的传感器分子,该传感器分子包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。在一些实施方案中,所述用途还包括测定样品中乳糖的浓度。
在一些实施方案中,还提供了一种用于检测乳果糖的传感器分子,该传感器分子包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳果糖结合至转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。在一些实施方案中,所述方法还包括测定样品中乳果糖的浓度。
如本领域技术人员所知,本发明的传感器也可以是多路复用的。在该系统中,提供了检测不同碳水化合物的两种或多种不同的传感器分子。例如,检测乳糖的本发明的传感器分子可以与检测诸如乳果糖、半乳糖和/或葡萄糖的其他碳水化合物的传感器复用。在一些实施方案中,每个不同的传感器分子可以包括不同的供体和/或受体分子,使得它们以不同的波长发射,从而能够检测和定量不同的靶化合物。在一些实施方案中,每个不同的传感器分子可以包括相同的供体和/或受体分子。在一些实施方案中,使用单个流体检测室。在一些实施方案中,可以使用多通道检测设备。
在一些实施方案中,样品是水性液体。例如,样品包括但不限于乳、果汁、其他饮料和包括血清的体液。
本发明的方法可以在适于测量可检测的变化的任何系统上进行。
如本领域技术人员将理解的,本发明的方法可以分批(例如使用平板读数器的分批形式)或流动形式进行。例如,本发明的方法可以使用装备有适当过滤器的微孔板读数器以微孔板形式进行。本发明的方法还可以在微流体装置上进行,例如WO2013/155553中所述。
另一方面,本发明提供一种包括本文所述传感器的试剂盒。在一些实施方案中,试剂盒还包含标准品(例如乳糖和/或乳果糖标准品)。
实施例
实施例1-LacB1和LacF1传感器的构建
通过GenScript(美国)合成编码BgaR(为在大肠杆菌中表达而优化的密码子)的DNA构建体。如果需要,使用GenScript合成的BgaR作为模板和适当的引物,通过PCR将接头序列添加到DNA构建体中(表5)。引物包括接头序列(如果需要)和PstI或BstBI的限制性位点。扩增的PCR产物用PstI和BstBI消化并克隆到pRSET载体(澳大利亚Biolabs)中,使用PstI/BstBI限制性位点预先用GFP2和RLuc8(对于LacB传感器而言)或CFP和YFP(对于LacF传感器而言)克隆,使得表达的融合蛋白具有N-末端组氨酸标签。
表5.用于制备乳糖传感器的寡核苷酸
取向 序列
P1 正向 AAAAAA<u>CTGCAG</u>ATGCAGATTCTGTG(SEQ ID NO:10)
P2 反向 ACACAC<u>TTCGAA</u>AATGCTCGGTTTAT(SEQ ID NO:11)
P3 正向 AAAAAA<u>CTGCAG</u>GGTGGTACCGGAGGCGGCATGCAGATTCTGTGGAAAAA(SEQ ID NO:12)
P4 反向 AAAAAA<u>TTCGAA</u>GCCGCCTCCGGTACCACCAATGCTCGGTTTATTAACTT(SEQ ID NO:13)
P5 反向 AAAAAA<u>CTGCAG</u>AATGCTCGGTTTAT(SEQ ID NO:14)
用编码传感器的pRSET载体转化大肠杆菌菌株BL21(DE3)(新英格兰生物实验室)的细胞。使用本领域技术人员已知的协议在大肠杆菌菌株BL21(DE3)中表达传感器。
为了表达传感器,将补充有2%(v/v)葡萄糖和100μg/mL氨苄青霉素的50mL LB(10g胰蛋白胨,5g酵母提取物,5gNaCl/L水(pH7.4))用单个菌落接种,并在37℃,200rpm下温育,直到其达到0.8的Abs600nm。将补充有100μg/mL氨苄青霉素的250mL LB使用起始培养物接种至0.05的Abs600nm,并且在28℃,200rpm下温育16小时并且收获细胞。
或者,将含有100μg/mL氨苄青霉素的200mL LB用单个菌落接种,并将培养物在28℃温育48小时,同时以200rpm振荡,并收获细胞。
通过在5000×g(4℃)离心10分钟收获细胞,用磷酸盐缓冲盐水(PBS;137mM NaCl,2.7mM KCl,10mM Na2HPO4,1.8mM KH2PO4,pH7.4)并重悬于磷酸钠缓冲液(50mM Na2HPO4,300mM NaCl,pH7.0)中。使细胞悬浮液在≈20,000psi的压力下通过均化器(MicrofluidicsM-110P(美国马萨诸塞州牛顿市)),并通过在15,000×g(4℃)下离心15分钟分离可溶性蛋白质级分。根据制造商的说明书,使用钴亲和层析(
Figure BDA0002432636120000521
超低金属亲和树脂(澳大利亚的Takara出品公司))纯化蛋白质。用150mM咪唑洗脱纯化的蛋白质后,使用透析单元(GE Healthcare,Vivaspin6,10kDaMWCO)用三羟甲基氨基甲烷(Tris)缓冲液(50mMTris,100mM NaCl,0.1mM EDTA,pH8.0)透析样品。将500μL的纯化蛋白质的等分试样在液氮中速冻并且在-80℃储存。通过280nm处的吸光度测定蛋白质浓度。
纯化的LacB1传感器是具有序列SEQ ID NO:15的多肽。LacB1传感器含有GFP2-BgaR-RLuc8。纯化的LacF1传感器是具有序列SEQ ID NO:23的多肽。LacF1传感器含有CFP-BgaR-YFP。组氨酸(His)标记的LacB1和LacF1传感器的示意图如图2所示。
实施例2-通过LacB1和LacF1的乳糖结合
材料和方法
BRET测定在最终体积为100μL的96孔板中进行。使用PBS(58mM Na2H2PO4、17mMNaH2PO4、68mM NaCl,pH 7.4)将纯化的传感器和乳糖稀释至所需浓度。LacB1传感器用1mM乳糖或水在30℃下温育5分钟。在温育时间结束时,添加5μL的在EtOH中的腔肠素400a(至17μM的最终腔肠素400a浓度),并且立即记录光谱扫描。
FRET测量以类似于BRET2测定的方式进行,具有以下修改。LacF1传感器与1mM乳糖在30℃下温育5分钟。以荧光模式记录光谱扫描(λex=435nm,455nm截止,20nm增量)。
用SpectraMax M3读板分光荧光计(美谷分子仪器(Molecular Devices))以发光模式(20nm增量)在白色96孔板(Opti-plateTM-96,珀金埃尔默)中记录光谱扫描。
数据分析
BRET2比率计算为500nm处的受体发射强度与420nm处的供体发射强度的比率。
FRET比率计算为520nm处的受体发射强度与480nm处的供体发射强度的比率。
结果
在水或1mM乳糖存在下测量LacB1传感器和LacF1传感器的RET比率(图2)。对于两种传感器,1mM乳糖的存在导致RET比率降低。对于LacB1,变化为从1.09±0.01至0.800±0.003。对于LacF1,变化为从1.216±0.004变为1.089±0.004。因此,1mM乳糖引起LacB1传感器的RET比下降27%,而LacF1传感器下降10%。
实施例3-通过LacB1检测乳糖结合的BRET测定
材料和方法
BRET测定在最终体积为100μL的96孔板中进行。使用PBS(58mM Na2H2PO4、17mMNaH2PO4、68mM NaCl,pH 7.4)将纯化的传感器和乳糖稀释至所需浓度。将纯化的传感器(1μM)用不同量的乳糖(0.000036%-0.36%w/v)或其他碳水化合物在30℃温育30分钟。对于BRET测量,在温育期后添加5μL腔肠素400a底物(最终[coel 400a]=16.7μM))。加入底物后立即记录光谱扫描。用SpectramaxM2读板分光荧光计(美谷分子仪器)记录光谱扫描。
数据分析
BRET2比率计算为最大受体发射强度(500nm)与最大供体发射强度(420nm)的比率。
结果
在乳糖量增加的情况下,LacB1传感器的BRET2比率如图3所示。
实施例4-接头长度对乳糖结合的影响
材料和方法
为了研究改变连接碳水化合物结合结构域与化学发光供体结构域和/或受体结构域的接头长度的影响,构建了乳糖传感器,其中接头序列-GGTGGG-被包含在BgaR前后(LacB2;SEQ ID NO:16),BgaR前(LacB3;SEQ ID NO:17)和BgaR后(LacB4;SEQ ID NO:18)。LacB2传感器包含RLuc8-GGTGGG-BgaR-GGTGGG-GFP2。LacB3传感器包含RLuc8-GGTGGG-BgaR-GFP2。LacB4传感器包含RLuc8-BgaR-GGTGGG-GFP2。乳糖传感器的示意图如图4所示。与LacB1的相同区域相比,接头位置用黑色部分表示。使用实施例3中描述的BRET测定评估这些传感器与1mM乳糖的结合。
结果
在1mM乳糖存在和不存在下LacB2、LacB3和LacB4传感器的BRET2比率如图5所示。包括在存在和不存在1mM乳糖的情况下对于LacB1传感器的BRET2比率作为比较。尽管所有传感器在1mM乳糖存在下BRET2比率都发生了变化,但在1mM乳糖存在下LacB1(无接头)给出了最显着的BRET2比值变化。
实施例5-LacB1和LacF1传感器的灵敏度
用于产生无乳糖和乳糖减少的乳的方法使用β半乳糖苷酶(也称为乳糖酶)将二糖乳糖分解成其两组分单糖,半乳糖和葡萄糖。半乳糖和葡萄糖以高浓度保留在最终乳制品中。由于它们与乳糖的结构相似性,半乳糖和葡萄糖具有竞争性结合乳糖生物传感器的潜力,干扰痕量乳糖的测量。此外,对乳进行热处理以产生长寿命产品(例如UHT或奶粉,但不是巴氏灭菌的“新鲜”乳)导致二糖乳糖部分异构化为乳果糖。在UHT乳中乳果糖的水平通常达到0.32-2.16mM(0.011-0.074%(w/v))(Morales等,2000;Marconi等,2004)。乳果糖不通过β-半乳糖苷酶处理水解成其组分单糖。与单糖半乳糖和葡萄糖类似,热处理乳中乳果糖的存在可能干扰乳制品中低水平乳糖的测定。
材料和方法
为了确定LacB1传感器是否具有足够的特异性和灵敏度以避免例如半乳糖、葡萄糖和乳果糖的糖的干扰,使用实施例2和3中描述的BRET测定评估LacB1传感器结合一系列二糖以及单糖半乳糖和葡萄糖的能力,所述二糖在结构上与乳糖(β-D-半乳糖基-(1→4)-D-葡萄糖)相关的二糖,即乳果糖(4-O-β-D-半乳糖基-D-果糖)、蜜二糖(D-半乳糖基-α(1→6)-D-葡萄糖)、麦芽糖(4-O-α-D-葡萄糖基-D-葡萄糖)、纤维二糖(4-O-β-D-葡萄糖基-D-葡萄糖)、海藻糖(α-D-葡萄糖基-(1→1)-α-D-葡萄糖)和蔗糖(β-D-果糖基α-D-葡萄糖)
简言之,LacB1传感器分别与0.1mM或1mM乳糖、1mM乳果糖、蜜二糖、麦芽糖、纤维二糖、海藻糖或蔗糖或1mM或10mM半乳糖或葡萄糖温育。
接着,按照实施例3中详述的方案产生在葡萄糖和半乳糖存在下LacB1和LacF1传感器的“校正”校准曲线,然而,为了模拟在磷酸盐缓冲液(PBS)中1比10稀释的处理过的奶,包括葡萄糖和半乳糖,其浓度使得[乳糖]+0.5×[半乳糖]+0.5×[葡萄糖]=13.9mM且[半乳糖]=[葡萄糖]。例如,如果在乳糖酶处理之前在乳中发现139mM乳糖,在乳糖酶处理至1mM的残余[乳糖]之后,半乳糖和葡萄糖将以138mM的浓度存在。在这种1比10稀释在PBS中的乳糖酶处理的乳样品情况下,稀释的样品将含有0.1mM残余乳糖和13.8mM半乳糖和葡萄糖。因此,当反应混合物含有0.1mM乳糖时,也加入13.8mM葡萄糖和13.8mM半乳糖。
还构建了LacB1和LacF1传感器在葡萄糖和半乳糖存在下的“校正”校准曲线,使用无乳糖全脂乳作为稀释剂,该无乳糖全脂乳经透析除去低分子量组分,特别是乳糖、半乳糖和葡萄糖。为了除去,根据以下方案透析全奶油无乳糖乳。在4℃下,将10mL的无乳糖全脂乳用1000mLPBS透析两次,持续24h,以除去存在于无乳糖乳中的任何残留乳糖。将1mL透析的乳的等分试样冷冻在干冰上并且在-80℃储存。透析后的乳用作“乳基质”,在PBS中以1比10稀释。
结果与讨论
在乳糖、乳果糖、蜜二糖、麦芽糖、纤维二糖、海藻糖、蔗糖、半乳糖和葡萄糖存在30分钟时,LacB1传感器BRET2比率的变化如图6所示。
LacB1传感器与1mM(0.034%w/v)二糖乳果糖温育导致BRET2比率变化约21%,而其他二糖导致BRET2比率变化3-10%。相比之下,添加1mM(0.034%)乳糖时BRET2比率的变化为约35%。这表明LacB1传感器对乳糖的选择性优于其他糖类。
LacB1传感器与1和10mM(0.018%和0.18%)半乳糖或葡萄糖温育导致BRET2比率随半乳糖变化3%和13%,随葡萄糖变化9%和6%。
当在添加腔肠素400a之前在乳糖、乳果糖、蜜二糖、麦芽糖、纤维二糖、海藻糖、蔗糖、半乳糖和葡萄糖的存在下温育LacB1传感器5分钟时,获得类似的结果(图7)。
图8显示了PBS中LacB1和LacF1传感器和PBS中10%透析乳的校正校准曲线。图8A和8B显示PBS中校正的校准曲线。图8C、8D和8E显示了在PBS中的10%透析乳中的校正校准曲线。校正的校准曲线在至少2log单位上是线性的以允许乳糖定量。具有较高乳糖含量的样品可以使用相同的方法通过用缓冲液10:90稀释样品来分析(参见图8)。
实施例6-LacB1与乳糖和乳果糖的结合
在实施例5中测试的糖中,乳糖引起BRET2比率的最大变化,随后是乳果糖。由于LacB1对乳糖和乳果糖表现出最大的响应,进一步研究了生物传感器对每种糖的亲和力。
材料和方法
用SpectraMax M3读板分光荧光计(美谷分子仪器(Molecular Devices))以发光模式(20nm增量)在白色96孔板(Opti-plateTM-96,珀金埃尔默)中记录光谱扫描。将1μM的纯化蛋白质用于BRET测定,最终体积为100μL,其中蛋白质和分析物在磷酸盐缓冲盐水(PBS;10mM磷酸盐,137mMNaCl,2.7mM KCl,pH7.3)或10%(v/v)透析的无乳糖全奶油乳在PBS中的溶液。纯化的蛋白质与乳糖或乳果糖在30℃温育5分钟℃。在温育时间结束时,添加5μL的在EtOH中的腔肠素400a(至17μM的最终腔肠素400a浓度),并且立即记录光谱扫描。
数据分析
BRET2比率计算为500nm处的受体发射强度与420nm处的供体发射强度的比率。
结果与讨论
在乳糖或乳果糖存在下,LacB1传感器BRET2比率的变化如图9所示。LacB1对乳糖和乳果糖(在PBS中)的响应是浓度依赖性的。LacB1对乳糖的响应在几乎3个对数单位上是准线性的,EC50为12±1μM,检测极限为1μM。LacB1对乳果糖的亲和力大约弱150倍,EC50为2.4±0.2mM。乳果糖的检测极限为0.1mM,即比乳糖高100倍。乳果糖响应在几乎2个对数单位上是准线性的。LacB1对乳果糖(0.1mM)的检测极限比巴氏灭菌乳(10μM)中发现的乳果糖水平高10倍,这意味着其可用于测定乳糖酶处理的巴氏灭菌乳中乳糖的任何相关水平。
LacB1传感器对10%(v/v)透析乳中乳糖的响应是浓度依赖性的,EC50为21±2μM,线性超过几乎3个对数单位,检测极限为1μM。在10%(v/v)透析乳和饱和浓度的半乳糖和葡萄糖中LacB1对乳糖的敏感性在统计学上不同于仅在PBS中观察到的敏感性(11-14μM和18-23μM)。然而,由于存在10%(v/v)透析的奶或高浓度的葡萄糖和半乳糖,LacB1对乳糖的亲和力没有显著降低。不希望受理论束缚,认为这是由于传感器对乳糖的高选择性和/或由于BRET2转导机制在复杂培养基中的效率。
LacB1与乳糖和乳果糖结合的特征突出了使用结合蛋白作为生物传感的分析物识别元件的内在能力,特别是当与BRET2转导机制偶联以检测变化时。用于构建LacB1的乳糖结合转录调节因子BgaR在低微摩尔范围内产生敏感性,具有区分结构相关二糖的能力,如乳糖和测试的第二种最有效的糖乳果糖之间观察到的EC50的200倍差异所证明的。
实施例7-在模拟乳系统中LacB1与乳糖的结合
为了研究在模拟乳系统中测量乳糖浓度的效果,使用透析的乳样品,其中当乳糖浓度从13.9mM(相当于未改性的10%(v/v)全脂乳)降低到零时,通过添加补偿量的葡萄糖和半乳糖来保持糖的总浓度恒定。
材料和方法
将全奶油乳用水透析以除去小分子。简言之,将20mL全奶油无乳糖乳在D-tubeTM透析器(Merck,3.5kDa截流分子量(MWCO))中在4℃下用1L水透析90分钟两次。将1mL透析的乳的等分试样冷冻在干冰上并且在-80℃储存。
透析的乳用于以精确限定水平的乳糖、半乳糖和葡萄糖的范围重建10%(v/v)乳基质,其中([乳糖]+[半乳糖+葡萄糖]/2=13.9mM。当测量样品中的乳糖处于或低于300μM‘无乳糖'阈值时,即在乳糖酶处理之后,选择10倍稀释因子以精确地模拟测定条件。如实施例6所述进行BRET测定。
结果与讨论
模拟乳系统中LacB1传感器BRET2比率的变化如图9所示。在这些与乳样品中的情况非常相似的条件下,乳糖的LOD为0.2μM(0.00003%w/v)。在这些条件下,乳糖的EC50从12μM变化至21μM,但差异没有统计学差异。乳糖的EC50比“无乳糖”乳制品的最严格客观调节标准(0.01%w/v)低约15倍。在存在或不存在10%(w/v)全奶油乳的情况下对数浓度-响应函数的相似性是显著的,因为在后一种情况下,在较低浓度的乳糖下,在13.9mM葡萄糖和半乳糖的存在下进行测量。不希望受理论的束缚,认为生物传感器“忽略”潜在干扰物质的强能力源自传感器的选择性,BRET2转导机制的稳健的比率测定性质和/或不存在外部照明源,这将导致光散射并增加例如乳的混浊介质中的噪声,即使稀释十倍时也是如此。
实施例8–乳糖的
Figure BDA0002432636120000561
测定
材料和方法
将LacB1在测定缓冲液(磷酸盐缓冲液中的0.45%明胶:淡水鱼皮中的0.45%(w/v)明胶(Sigma Aldrich)),58 mM Na2H2PO4、17 mM NaH2PO4,68 mM NaCl,pH 7.4中)稀释至1200μM。将35μL分析物(在测定缓冲液中的30μM或3mM乳糖或单独的测定缓冲液),LacB1(1200μM)和腔肠素400a(在15%EtOH/测定缓冲液中的30μM)放置在
Figure BDA0002432636120000571
微流控芯片的三个入口中的每一个中,并且以1200μL/h的流速进行测定100秒。
使用
Figure BDA0002432636120000574
装置以1200μL/h的流速记录BRET比率并且供体和受体发光强度平均在80秒-100秒。BRET2比率由
Figure BDA0002432636120000575
装置软件程序计算为最大受体发射强度(绿色滤光片)与最大供体发射强度(蓝色滤光片)的比率。
结果
图10显示了具有3mM乳糖的测定缓冲液的示例
Figure BDA0002432636120000572
装置迹线。如图11所示,
Figure BDA0002432636120000573
测定可以用于检测30μM和3mM两者下的乳糖。添加30μM和3mM乳糖分别导致BRET2比率的大约22%和41%的变化。
实施例9-全脂乳中乳糖的估计
设计传感器以在受控实验室条件下定量确定的缓冲液中的分析物本身是一个挑战,但是在真实世界条件下精确定量分析物甚至更具有挑战性。特别地,复杂和干扰的样品基质,例如乳、乳品和其他生物样品,可能使生物传感器性能复杂化和劣化。本文所述的传感器的一种用途是定量未改性乳中乳糖水平,取决于种类,其范围为约4.5-7.0%(w/v)。本发明人比较了使用本文所述的传感器获得的乳糖估计值,相对于PBS中已知的乳糖量或10%的透析乳基质已通过目前商业上使用的两种方法进行了校正,这两种方法是偶联酶乳糖测定试剂盒(BioVision)和在NATA认可的分析实验室中进行的带折射率检测器的HPLC。
材料和方法
使用市售试剂盒(BioVision乳糖比色/荧光测定试剂盒(美国旧金山,#K624-100)),通过具有折射率(RI)检测的HPLC和使用本文所述的LacB1传感器来估计全脂乳中乳糖的浓度。
用于这些测定的样品是购自超市的全巴氏消毒牛乳。牛乳纸盒上的营养板表明乳糖的代表值为137mM。
根据制造商的说明书使用BioVision乳糖比色/荧光测定试剂盒来估计乳糖和半乳糖浓度。简言之,使用0、2、4、6、8或10μL的乳糖标准物(在所提供的乳糖测定缓冲液中1mM)制备标准曲线。将所需体积吸移到透明96孔板(格瑞纳(Greiner)的UV-StarMicroplate)的微量孔中。将购买的全巴氏消毒牛乳在水中稀释约104倍并且将10μL用于该测定。此外,向各孔中加入2μL的显色探针,2μL的酶混合物和2μL的辣根氧化酶(HRP),用乳糖测定缓冲液将体积补足至100μL并充分混合。将反应混合物在37℃温育60分钟并避光。Abs570用SpectraMaxM3读板分光荧光计(Molecular Devices)以吸收模式记录Abs570nm(终点测量Abs570nm)。测定一式三份进行。
通过商业实验室进行乳糖浓度的HPLC估计。简言之,将200mL全脂乳冷冻并储存在-80℃下并在干冰上运送至商业NATA(澳大利亚国家检测机构协会)-认可的测试实验室(澳大利亚墨尔本的DTS/asure quality)。根据实验室的标准商业方案,使用HPLC和RI检测进行分析(Chaves-Services等,2004;Southgate,1969)。结果以g糖/100mL乳报告,使用1.033g/mL作为全奶油全脂乳的密度。没有报告误差值。
使用LacB1传感器进行乳糖浓度的估计,如本文所述,相对于PBS中已知量的乳糖或10%透析的乳基质进行校准。LacB1对乳糖的EC50为12μM,即比在未改性牛乳中发现的乳糖浓度低约104倍。因此,在乳糖估计之前将全乳样品在水中稀释3200倍。
结果
使用LacB1传感器,BioVision试剂盒和HPLC测定的巴氏灭菌全牛乳的乳糖浓度列于表6中。
使用BioVision偶联酶试剂盒并按照制造商的方案,发明人估计全乳样品的乳糖浓度为129±1mM。
将相同乳的样品置于NATA认可的实验室中,通过HPLC/折射率(RI)分析进行乳糖估计。实验室报道乳糖浓度为134mM。在这种情况下,没有报告误差值。
使用本文所述的LacB1传感器,发明人估计全乳样品中的乳糖浓度为157±6mM。
表6.用LacB1传感器和两种独立方法测定巴氏灭菌全牛乳乳糖浓度的比较。
[乳糖](mM) [乳糖](%w/v)
LacB1传感器 157±6 5.4±0.2
偶联酶分析(BioVision) 129±1 4.4±0.03
HPLC用RI检测* 134* 4.6
实施例10-乳糖酶处理乳中乳糖的估计
乳糖生物传感器的另一用途是测量不同等级的乳糖酶处理的乳中的乳糖,其特征为“减少的乳糖”或“不含乳糖”。乳糖酶处理的乳中乳糖的估计是有挑战性的,因为分析物的水平低,乳培养基的复杂性,以及可能干扰乳糖本身测量的高水平葡萄糖和半乳糖的存在。澳大利亚和新西兰食品标准(FSANZ)规定乳糖减少的乳制品含有不超过0.3%(8.8mM)的乳糖,而不含乳糖的产品应当含有“不可检测的乳糖”,这是主观的方法依赖性定义。欧洲当局规定无乳糖食品的目标阈值为0.01%(w/v)(0.3mM)。
乳是一种复合基质,其包含各自浓度为约3%(w/v)的蛋白质和脂质(Kailasopathy,2009)。为了最小化干扰,分析实验室通常在通过HPLC或比色偶联酶测定分析糖含量之前从乳样品中沉淀脂肪和蛋白质。除了耗时和导致额外成本之外,在分析之前对样品进行处理增加了由于产率变化和样品体积的改变而导致的误差风险。需要一种改进的测定样品中例如乳糖的碳水化合物浓度的方法,该方法避免了与HPLC或比色偶联酶测定有关的至少一些缺点。
材料和方法
使用市售试剂盒(BioVision乳糖比色/荧光测定试剂盒(美国旧金山,#K624-100)),通过具有折射率(RI)检测的HPLC和使用如实施例9所述的LacB1传感器,估计商业获得的全奶油“无乳糖”牛乳中乳糖的浓度。
在这些试验中使用的样品是商业上获得的全奶油“无乳糖”牛乳。“无乳糖”牛乳的10倍稀释液用于LacB1测定。
还使用市售试剂盒(Biovision乳糖比色/荧光测定试剂盒(美国旧金山,#K624-100))和使用标准方案通过具有折射率(RI)检测的HPLC测定样品中半乳糖的浓度。
结果
LacB1传感器用于估计市售全奶油“无乳糖”牛乳的10倍稀释液中的乳糖浓度。BRET2比率降低16%,相当于2.7±0.1M的浓度,对应于原始乳样品中27±1μM乳糖(表7)。
使用实施例9中描述的BioVision乳糖比色/荧光测定试剂盒估计全奶油“无乳糖”牛乳的乳糖浓度的尝试是不成功的。认为这是“无乳糖”牛乳中存在高浓度半乳糖的结果。样品中半乳糖的浓度估计为163±2mM。
将相同的全奶油无乳糖牛乳的样品置于NATA认可的分析实验室,通过HPLC-折射率检测进行分析。没有检测到乳糖,检测极限为0.1%(w/v)或约3mM(表7)。
表7.用LacB1传感器和两种独立方法比较新鲜“无乳糖”全奶油牛乳中乳糖的浓度。
Figure BDA0002432636120000591
*没有引用错误
因此,LacB1传感器似乎适于直接测定无乳糖市售乳制品中残留乳糖的浓度。
本申请要求2017年8月8日提交的澳大利亚申请号2017903148的优先权,其全部内容通过引用并入本文。
本领域技术人员应当理解,在不脱离广泛描述的本发明的精神或范围的情况下,可以对具体实施例中所示的本发明进行多种变化和/或修改。因此,本实施例在所有方面都被认为是说明性的而非限制性的。
本文讨论和/或引用的所有出版物均全文引入本文。
包括在本说明书中的文件、动作、材料、装置、物品等的任何讨论仅仅是为了提供本发明的上下文。不应视为承认这些内容中的任何或全部形成现有技术基础的一部分或者是与本发明相关的领域中的公知常识,因为其存在于本申请的每个权利要求的优先权日之前。
参考文献
Ansari et al.(2012)Process Biochem.47:2427–2433.
Aravind and Anantharaman(2003)FEMS Microbiol.Rev.222:17-23.
Aravind et al.(2005)FEMS Microbiol.Rev.29:231-262.
Altschul et al.(1990)J.Mol.Biol.215:403-10.
Altschul et al.(1997)Nucleic Acids Res.25:3389-402.
Bajar et al.(2016)Sensors.16:1488-1512.
Chávez-Servi′n et al.(2004)J.of Chromatogr.A.1043:211-215.
Dacres et al.(2009a)Anal.Biochem.385:194-202.
Dacres et al.(2009b)Biosensors and Bioelectronics 24:1164-1170.
Dacres et al.(2010)Anal.Chem.82:432-435.
Dacres et al.(2011)Biosens.Bioelectron.29:119-124.
Dacres et al.(2012)Biochem.Biophys.Res.Commun.425:625-629.
Dacres et al.(2014)Poster presentation.Biosensors 2014,May 27-30th,Melbourne.
Day et al.(2004)Luminescence 19:8-20.
de Wet et al.(1987)Mol.Cell.Biol.2987:725-737.
Euber and Brunner(1979)J.Dairy Sci.62:685–690.
Erich et al.(2012)Food Chem.135:2393–2396.
Fernandes Silveira et al.(2015)J.Chem.id185967,6pages.
Figure BDA0002432636120000601
(1948)Ann.Physik.2:55.
Figure BDA0002432636120000602
(1959)Discuss.Faraday Soc.27:7–17.
Figure BDA0002432636120000603
(1960)Rad.Res.Suppl.2:326.
Franco et al.(2006)J.Bacteriol.188:3024–3036.
Franco et al.(2007)Nucleic Acids Res.35:4755–4766.
Greer and Szalay(2002)Luminescence 17:43-74.
Hartman et al.(2011)Appl.Environ.Microbiol.77:471-8.
Haydon and Guest(1991)FEMS Microbiol.Lett.63:291-295.
Hastings(1996)Gene 173:5-11.
Hushpulian et al.(2007)Biotransformation25:2–4.
Indyk et al.(1996)Food Chem.57:575–580.
Inouye et al.(1997)Biochem.J.233:349–353.
Jia et al.(2014)Biotechnol.Bioeng.111:209–222.
Kailasapathy,K.(2009)“Chemical Composition,Physical and FunctionalProperties of Milk and Milk Ingredients;Dairy Processing&Quality Assurance”,Wiley-Blackwell,chapter 4.
Kim and Kim(2012)Theranostics 2:127-138.
Kleyn(1985)J.Dairy.Sci.68:2791–2798.
Kong et al.(2009)Nucleic Acids Res.37:1915-1924.
Lee et al.(2003)J.Bacteriol.185:4315–4325.
Loening et al.(2006)Protein Eng.Des.Sel.19:391-400.
Loening et al.(2007)Nature Methods 4:641-643.
Lorenz et al.(1991)Proc.Natl.Acad.Sci.USA 88:4438-4442.
Marchler-Bauer et al.(2017),Nucleic Acids Res.45:D200-3.
Marchler-Bauer et al.(2015),Nucleic Acids Res.43:D222-6.
Marchler-Bauer et al.(2011),Nucleic Acids Res.39:D225-9.
Marchler-Bauer and Bryant(2004),Nucleic Acids Res.32:W327-331.
Marconi et al.(2004)Food Chem.84:447-450.
McSweeney et al.(1993)Food Biotechnology.7:143-158.
Milk and Milk Products–Determination of Lactose Content by HighPerformance Liquid Chromatography(Reference method)–ISO 22622:2007.
Montilla et al.(1996)J.Food Prot.59:1061-1064.
Morales et al.(2000)Int.J.Food Sci.Tech.35:193-200.
Myers and Miller(1988),Comput.Appl.Biosci.4:11-7.
Needleman and Wunsch(1970)J.Mol.Biol.48:443–53.
Pabo and Sauer(1992)Annu.Rev.Biochem.61:1053-95.
Pfleger and Eidne(2006)Nature Methods 3:165-174.
Rigali et al.(2002)J.Biol.Chem.15:12507-12515.
Rigali et al.(2004)Nuc.Acids Res.32:3418-3426.
Southgate(1969)J.Sci.Food.Agric.20:326.
Tsenkova et al.(1999).J.Dairy Sci.82:2344-2351.
Tsien(1998)Ann.Rev.Biochem.63:509-544.
Verhaegen et al.(2002)Anal.Chem.74:4378-4385.
Viviani(2002)Cell.Mol.Life Sci.59:1833-1850.
Wang et al.(1997)“Bioluminescence and Chemiluminescence:MolecularReporting with Photons",Wiley,419–422.
Wiethaus et al.(2008)J.Bacteriol.190:487–93.
Xinmin et al.(2008)J.Food Compos.Anal.21:255–258.
Xu et al.(1999)Proc.Natl.Acad.Sci.USA.96:151-156.
Zhang et al.(2012)J.Bacteriol.194:1055–64.
Zheng et al.(2009)Acta Crystallogr.D Biol.Crystallogr.,D65:356-365.
序列表
<110> 联邦科学技术研究组织
<120> 碳水化合物传感器
<130> 524959
<150> AU2017903148
<151> 2017-08-08
<160> 74
<170> PatentIn 3.5版
<210> 1
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> BgaR
<400> 1
Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr
35 40 45
Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn
100 105 110
Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys
145 150 155 160
Pro Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala
165 170 175
Leu Asn Phe Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln Glu
180 185 190
Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Ser Thr Lys Leu Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Val Asn Lys Pro Ser Ile
275
<210> 2
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 2
Gly Ser Ser Gly Gly Ser
1 5
<210> 3
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 3
Gly Gly Ser Gly Gly Ser
1 5
<210> 4
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 4
Gly Gly Thr Gly Gly Gly
1 5
<210> 5
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 5
Gly Gly Gly Gly Gly Thr
1 5
<210> 6
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 6
Leu Gln Gly Gly Thr Gly Gly Gly
1 5
<210> 7
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 7
Phe Glu Gly Gly Thr Gly Gly Gly
1 5
<210> 8
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 8
Gly Gly Ser Gly Gly Ser Leu
1 5
<210> 9
<211> 157
<212> PRT
<213> 人工序列
<220>
<223> BgaR 假定 CBD
<400> 9
Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr
35 40 45
Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn
100 105 110
Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu
145 150 155
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
aaaaaactgc agatgcagat tctgtg 26
<210> 11
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
acacacttcg aaaatgctcg gtttat 26
<210> 12
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
aaaaaactgc agggtggtac cggaggcggc atgcagattc tgtggaaaaa 50
<210> 13
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
aaaaaattcg aagccgcctc cggtaccacc aatgctcggt ttattaactt 50
<210> 14
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
aaaaaactgc agaatgctcg gtttat 26
<210> 15
<211> 833
<212> PRT
<213> 人工序列
<220>
<223> LacB1
<400> 15
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Leu
225 230 235 240
Gln Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met
245 250 255
Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr
260 265 270
Asn Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly
275 280 285
Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly
290 295 300
Asp Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser
305 310 315 320
Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn
325 330 335
Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala
340 345 350
Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys
355 360 365
Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu
370 375 380
Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro
385 390 395 400
Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp
405 410 415
Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln
420 425 430
Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met
435 440 445
Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu
450 455 460
Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys Ser Thr Lys Leu Pro Ile
465 470 475 480
Gly Glu Val Ala Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser
485 490 495
Lys Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn
500 505 510
Asn Gln Val Asn Lys Pro Ser Ile Phe Glu Met Ala Ser Lys Val Tyr
515 520 525
Asp Pro Glu Gln Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala
530 535 540
Arg Cys Lys Gln Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp
545 550 555 560
Ser Glu Lys His Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala
565 570 575
Thr Ser Ser Tyr Leu Trp Arg His Val Val Pro His Ile Glu Pro Val
580 585 590
Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys
595 600 605
Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr
610 615 620
Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly
625 630 635 640
His Asp Trp Gly Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln
645 650 655
Asp Arg Ile Lys Ala Ile Val His Met Glu Ser Val Val Asp Val Ile
660 665 670
Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile
675 680 685
Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val
690 695 700
Glu Thr Val Leu Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu
705 710 715 720
Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg
725 730 735
Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys
740 745 750
Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala
755 760 765
Ser Asp Asp Leu Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe
770 775 780
Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe
785 790 795 800
Val Lys Val Lys Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu
805 810 815
Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu
820 825 830
Gln
<210> 16
<211> 845
<212> PRT
<213> 人工序列
<220>
<223> LacB2
<400> 16
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Leu
225 230 235 240
Gln Gly Gly Thr Gly Gly Gly Met Gln Ile Leu Trp Lys Lys Tyr Val
245 250 255
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
260 265 270
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
275 280 285
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
290 295 300
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
305 310 315 320
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
325 330 335
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
340 345 350
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
355 360 365
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
370 375 380
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
385 390 395 400
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
405 410 415
His Thr Tyr Ile Gln Asp Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met
420 425 430
His Ser Ile Thr Val Gln Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg
435 440 445
Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln
450 455 460
Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys
465 470 475 480
Ser Thr Lys Leu Pro Ile Gly Glu Val Ala Ser Ser Val Gly Tyr Ser
485 490 495
Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser Lys His Phe Ser Met Ser
500 505 510
Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn Lys Pro Ser Ile Phe Glu
515 520 525
Gly Gly Thr Gly Gly Gly Met Ala Ser Lys Val Tyr Asp Pro Glu Gln
530 535 540
Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln
545 550 555 560
Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His
565 570 575
Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala Thr Ser Ser Tyr
580 585 590
Leu Trp Arg His Val Val Pro His Ile Glu Pro Val Ala Arg Cys Ile
595 600 605
Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys Ser Gly Asn Gly
610 615 620
Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu
625 630 635 640
Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly His Asp Trp Gly
645 650 655
Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys
660 665 670
Ala Ile Val His Met Glu Ser Val Val Asp Val Ile Glu Ser Trp Asp
675 680 685
Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu
690 695 700
Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val Glu Thr Val Leu
705 710 715 720
Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr
725 730 735
Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg Pro Thr Leu Ser
740 745 750
Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys Pro Asp Val Val
755 760 765
Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu
770 775 780
Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile
785 790 795 800
Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys Val Lys
805 810 815
Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr
820 825 830
Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
835 840 845
<210> 17
<211> 839
<212> PRT
<213> 人工序列
<220>
<223> LacB3
<400> 17
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Leu
225 230 235 240
Gln Gly Gly Thr Gly Gly Gly Met Gln Ile Leu Trp Lys Lys Tyr Val
245 250 255
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
260 265 270
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
275 280 285
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
290 295 300
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
305 310 315 320
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
325 330 335
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
340 345 350
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
355 360 365
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
370 375 380
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
385 390 395 400
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
405 410 415
His Thr Tyr Ile Gln Asp Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met
420 425 430
His Ser Ile Thr Val Gln Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg
435 440 445
Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln
450 455 460
Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys
465 470 475 480
Ser Thr Lys Leu Pro Ile Gly Glu Val Ala Ser Ser Val Gly Tyr Ser
485 490 495
Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser Lys His Phe Ser Met Ser
500 505 510
Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn Lys Pro Ser Ile Phe Glu
515 520 525
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
530 535 540
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
545 550 555 560
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
565 570 575
Phe Leu His Gly Asn Ala Thr Ser Ser Tyr Leu Trp Arg His Val Val
580 585 590
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
595 600 605
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
610 615 620
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
625 630 635 640
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Ala Leu Ala Phe His
645 650 655
Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys Ala Ile Val His Met Glu
660 665 670
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
675 680 685
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
690 695 700
Glu Asn Asn Phe Phe Val Glu Thr Val Leu Pro Ser Lys Ile Met Arg
705 710 715 720
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
725 730 735
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
740 745 750
Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr
755 760 765
Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Leu Phe Ile Glu
770 775 780
Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys
785 790 795 800
Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Leu Gln
805 810 815
Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu
820 825 830
Arg Val Leu Lys Asn Glu Gln
835
<210> 18
<211> 839
<212> PRT
<213> 人工序列
<220>
<223> LacB4
<400> 18
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Leu
225 230 235 240
Gln Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met
245 250 255
Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr
260 265 270
Asn Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly
275 280 285
Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly
290 295 300
Asp Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser
305 310 315 320
Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn
325 330 335
Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala
340 345 350
Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys
355 360 365
Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu
370 375 380
Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro
385 390 395 400
Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp
405 410 415
Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln
420 425 430
Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met
435 440 445
Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu
450 455 460
Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys Ser Thr Lys Leu Pro Ile
465 470 475 480
Gly Glu Val Ala Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser
485 490 495
Lys Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn
500 505 510
Asn Gln Val Asn Lys Pro Ser Ile Phe Glu Gly Gly Thr Gly Gly Gly
515 520 525
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
530 535 540
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
545 550 555 560
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
565 570 575
Phe Leu His Gly Asn Ala Thr Ser Ser Tyr Leu Trp Arg His Val Val
580 585 590
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
595 600 605
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
610 615 620
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
625 630 635 640
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Ala Leu Ala Phe His
645 650 655
Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys Ala Ile Val His Met Glu
660 665 670
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
675 680 685
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
690 695 700
Glu Asn Asn Phe Phe Val Glu Thr Val Leu Pro Ser Lys Ile Met Arg
705 710 715 720
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
725 730 735
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
740 745 750
Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr
755 760 765
Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Leu Phe Ile Glu
770 775 780
Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys
785 790 795 800
Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Leu Gln
805 810 815
Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu
820 825 830
Arg Val Leu Lys Asn Glu Gln
835
<210> 19
<211> 2502
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB1
<400> 19
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgagcta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagctg 720
cagatgcaga ttctgtggaa aaaatacgtc aaagaaaact ttgaaatgaa cgtggatgaa 780
tgcggcattg aacaaggcat tccgggcctg ggttataact acgaagttct gaaaaatgca 840
gtcatccatt atgtgaccaa aggctatggt acgtttaaat tcaacggcaa agtctataat 900
ctgaaacagg gtgacatttt catcctgctg aaaggcatgc aagtggaata cgttgcgagc 960
attgatgacc cgtgggaata ttactggatc ggctttagtg gttccaacgc gaatgaatat 1020
ctgaaccgta ccagcattac caacagctgc gtggccaact gtgaagaaaa tagcaaaatt 1080
ccgcagatta tcctgaacat gtgtgaaatc tctaaaacct acaacccgtc acgctcggat 1140
gacattctgc tgctgaaaga actgtattcc ctgctgtacg cactgatcga agaatttccg 1200
aaaccgtttg aatacaaaga taaagaactg catacctaca ttcaggacgc gctgaacttc 1260
atcaactcaa attatatgca ctcgattacg gtgcaagaaa tcgccgatta cgttaatctg 1320
agccgttctt acctgtacaa aatgttcatc aaaaacctgg gtatcagtcc gcagcgttat 1380
ctgattaatc tgcgcatgta caaagcaacc ctgctgctga aatctacgaa actgccgatc 1440
ggcgaagttg cgagcagcgt gggttatagt gattccctgc tgtttagtaa aaccttctcc 1500
aaacactttt caatgtcgcc gctgaactac cgcaacaatc aagttaataa accgagcatt 1560
ttcgaaatgg cttccaaggt gtacgacccc gagcaacgca aacgcatgat cactgggcct 1620
cagtggtggg ctcgctgcaa gcaaatgaac gtgctggact ccttcatcaa ctactatgat 1680
tccgagaagc acgccgagaa cgccgtgatt tttctgcatg gtaacgctac ctccagctac 1740
ctgtggaggc acgtcgtgcc tcacatcgag cccgtggcta gatgcatcat ccctgatctg 1800
atcggaatgg gtaagtccgg caagagcggg aatggctcat atcgcctcct ggatcactac 1860
aagtacctca ccgcttggtt cgagctgctg aaccttccaa agaaaatcat ctttgtgggc 1920
cacgactggg gggctgctct ggcctttcac tacgcctacg agcaccaaga caggatcaag 1980
gccatcgtcc atatggagag tgtcgtggac gtgatcgagt cctgggacga gtggcctgac 2040
atcgaggagg atatcgccct gatcaagagc gaagagggcg agaaaatggt gcttgagaat 2100
aacttcttcg tcgagaccgt gctcccaagc aagatcatgc ggaaactgga gcctgaggag 2160
ttcgctgcct acctggagcc attcaaggag aagggcgagg ttagacggcc taccctctcc 2220
tggcctcgcg agatccctct cgttaaggga ggcaagcccg acgtcgtcca gattgtccgc 2280
aactacaacg cctaccttcg ggccagcgac gatctgccta agctgttcat cgagtccgac 2340
cctgggttct tttccaacgc tattgtcgag ggagctaaga agttccctaa caccgagttc 2400
gtgaaggtga agggcctcca cttcctccag gaggacgctc cagatgaaat gggtaagtac 2460
atcaagagct tcgtggagcg cgtgctgaag aacgagcagt aa 2502
<210> 20
<211> 2538
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB2
<400> 20
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgagcta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagctg 720
cagggtggta ccggaggcgg catgcagatt ctgtggaaaa aatacgtcaa agaaaacttt 780
gaaatgaacg tggatgaatg cggcattgaa caaggcattc cgggcctggg ttataactac 840
gaagttctga aaaatgcagt catccattat gtgaccaaag gctatggtac gtttaaattc 900
aacggcaaag tctataatct gaaacagggt gacattttca tcctgctgaa aggcatgcaa 960
gtggaatacg ttgcgagcat tgatgacccg tgggaatatt actggatcgg ctttagtggt 1020
tccaacgcga atgaatatct gaaccgtacc agcattacca acagctgcgt ggccaactgt 1080
gaagaaaata gcaaaattcc gcagattatc ctgaacatgt gtgaaatctc taaaacctac 1140
aacccgtcac gctcggatga cattctgctg ctgaaagaac tgtattccct gctgtacgca 1200
ctgatcgaag aatttccgaa accgtttgaa tacaaagata aagaactgca tacctacatt 1260
caggacgcgc tgaacttcat caactcaaat tatatgcact cgattacggt gcaagaaatc 1320
gccgattacg ttaatctgag ccgttcttac ctgtacaaaa tgttcatcaa aaacctgggt 1380
atcagtccgc agcgttatct gattaatctg cgcatgtaca aagcaaccct gctgctgaaa 1440
tctacgaaac tgccgatcgg cgaagttgcg agcagcgtgg gttatagtga ttccctgctg 1500
tttagtaaaa ccttctccaa acacttttca atgtcgccgc tgaactaccg caacaatcaa 1560
gttaataaac cgagcatttt cgaaggtggt accggaggcg gcatggcttc caaggtgtac 1620
gaccccgagc aacgcaaacg catgatcact gggcctcagt ggtgggctcg ctgcaagcaa 1680
atgaacgtgc tggactcctt catcaactac tatgattccg agaagcacgc cgagaacgcc 1740
gtgatttttc tgcatggtaa cgctacctcc agctacctgt ggaggcacgt cgtgcctcac 1800
atcgagcccg tggctagatg catcatccct gatctgatcg gaatgggtaa gtccggcaag 1860
agcgggaatg gctcatatcg cctcctggat cactacaagt acctcaccgc ttggttcgag 1920
ctgctgaacc ttccaaagaa aatcatcttt gtgggccacg actggggggc tgctctggcc 1980
tttcactacg cctacgagca ccaagacagg atcaaggcca tcgtccatat ggagagtgtc 2040
gtggacgtga tcgagtcctg ggacgagtgg cctgacatcg aggaggatat cgccctgatc 2100
aagagcgaag agggcgagaa aatggtgctt gagaataact tcttcgtcga gaccgtgctc 2160
ccaagcaaga tcatgcggaa actggagcct gaggagttcg ctgcctacct ggagccattc 2220
aaggagaagg gcgaggttag acggcctacc ctctcctggc ctcgcgagat ccctctcgtt 2280
aagggaggca agcccgacgt cgtccagatt gtccgcaact acaacgccta ccttcgggcc 2340
agcgacgatc tgcctaagct gttcatcgag tccgaccctg ggttcttttc caacgctatt 2400
gtcgagggag ctaagaagtt ccctaacacc gagttcgtga aggtgaaggg cctccacttc 2460
ctccaggagg acgctccaga tgaaatgggt aagtacatca agagcttcgt ggagcgcgtg 2520
ctgaagaacg agcagtaa 2538
<210> 21
<211> 2520
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB3
<400> 21
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgagcta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagctg 720
cagggtggta ccggaggcgg catgcagatt ctgtggaaaa aatacgtcaa agaaaacttt 780
gaaatgaacg tggatgaatg cggcattgaa caaggcattc cgggcctggg ttataactac 840
gaagttctga aaaatgcagt catccattat gtgaccaaag gctatggtac gtttaaattc 900
aacggcaaag tctataatct gaaacagggt gacattttca tcctgctgaa aggcatgcaa 960
gtggaatacg ttgcgagcat tgatgacccg tgggaatatt actggatcgg ctttagtggt 1020
tccaacgcga atgaatatct gaaccgtacc agcattacca acagctgcgt ggccaactgt 1080
gaagaaaata gcaaaattcc gcagattatc ctgaacatgt gtgaaatctc taaaacctac 1140
aacccgtcac gctcggatga cattctgctg ctgaaagaac tgtattccct gctgtacgca 1200
ctgatcgaag aatttccgaa accgtttgaa tacaaagata aagaactgca tacctacatt 1260
caggacgcgc tgaacttcat caactcaaat tatatgcact cgattacggt gcaagaaatc 1320
gccgattacg ttaatctgag ccgttcttac ctgtacaaaa tgttcatcaa aaacctgggt 1380
atcagtccgc agcgttatct gattaatctg cgcatgtaca aagcaaccct gctgctgaaa 1440
tctacgaaac tgccgatcgg cgaagttgcg agcagcgtgg gttatagtga ttccctgctg 1500
tttagtaaaa ccttctccaa acacttttca atgtcgccgc tgaactaccg caacaatcaa 1560
gttaataaac cgagcatttt cgaaatggct tccaaggtgt acgaccccga gcaacgcaaa 1620
cgcatgatca ctgggcctca gtggtgggct cgctgcaagc aaatgaacgt gctggactcc 1680
ttcatcaact actatgattc cgagaagcac gccgagaacg ccgtgatttt tctgcatggt 1740
aacgctacct ccagctacct gtggaggcac gtcgtgcctc acatcgagcc cgtggctaga 1800
tgcatcatcc ctgatctgat cggaatgggt aagtccggca agagcgggaa tggctcatat 1860
cgcctcctgg atcactacaa gtacctcacc gcttggttcg agctgctgaa ccttccaaag 1920
aaaatcatct ttgtgggcca cgactggggg gctgctctgg cctttcacta cgcctacgag 1980
caccaagaca ggatcaaggc catcgtccat atggagagtg tcgtggacgt gatcgagtcc 2040
tgggacgagt ggcctgacat cgaggaggat atcgccctga tcaagagcga agagggcgag 2100
aaaatggtgc ttgagaataa cttcttcgtc gagaccgtgc tcccaagcaa gatcatgcgg 2160
aaactggagc ctgaggagtt cgctgcctac ctggagccat tcaaggagaa gggcgaggtt 2220
agacggccta ccctctcctg gcctcgcgag atccctctcg ttaagggagg caagcccgac 2280
gtcgtccaga ttgtccgcaa ctacaacgcc taccttcggg ccagcgacga tctgcctaag 2340
ctgttcatcg agtccgaccc tgggttcttt tccaacgcta ttgtcgaggg agctaagaag 2400
ttccctaaca ccgagttcgt gaaggtgaag ggcctccact tcctccagga ggacgctcca 2460
gatgaaatgg gtaagtacat caagagcttc gtggagcgcg tgctgaagaa cgagcagtaa 2520
<210> 22
<211> 2520
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB4
<400> 22
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgagcta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagctg 720
cagatgcaga ttctgtggaa aaaatacgtc aaagaaaact ttgaaatgaa cgtggatgaa 780
tgcggcattg aacaaggcat tccgggcctg ggttataact acgaagttct gaaaaatgca 840
gtcatccatt atgtgaccaa aggctatggt acgtttaaat tcaacggcaa agtctataat 900
ctgaaacagg gtgacatttt catcctgctg aaaggcatgc aagtggaata cgttgcgagc 960
attgatgacc cgtgggaata ttactggatc ggctttagtg gttccaacgc gaatgaatat 1020
ctgaaccgta ccagcattac caacagctgc gtggccaact gtgaagaaaa tagcaaaatt 1080
ccgcagatta tcctgaacat gtgtgaaatc tctaaaacct acaacccgtc acgctcggat 1140
gacattctgc tgctgaaaga actgtattcc ctgctgtacg cactgatcga agaatttccg 1200
aaaccgtttg aatacaaaga taaagaactg catacctaca ttcaggacgc gctgaacttc 1260
atcaactcaa attatatgca ctcgattacg gtgcaagaaa tcgccgatta cgttaatctg 1320
agccgttctt acctgtacaa aatgttcatc aaaaacctgg gtatcagtcc gcagcgttat 1380
ctgattaatc tgcgcatgta caaagcaacc ctgctgctga aatctacgaa actgccgatc 1440
ggcgaagttg cgagcagcgt gggttatagt gattccctgc tgtttagtaa aaccttctcc 1500
aaacactttt caatgtcgcc gctgaactac cgcaacaatc aagttaataa accgagcatt 1560
ttcgaaggtg gtaccggagg cggcatggct tccaaggtgt acgaccccga gcaacgcaaa 1620
cgcatgatca ctgggcctca gtggtgggct cgctgcaagc aaatgaacgt gctggactcc 1680
ttcatcaact actatgattc cgagaagcac gccgagaacg ccgtgatttt tctgcatggt 1740
aacgctacct ccagctacct gtggaggcac gtcgtgcctc acatcgagcc cgtggctaga 1800
tgcatcatcc ctgatctgat cggaatgggt aagtccggca agagcgggaa tggctcatat 1860
cgcctcctgg atcactacaa gtacctcacc gcttggttcg agctgctgaa ccttccaaag 1920
aaaatcatct ttgtgggcca cgactggggg gctgctctgg cctttcacta cgcctacgag 1980
caccaagaca ggatcaaggc catcgtccat atggagagtg tcgtggacgt gatcgagtcc 2040
tgggacgagt ggcctgacat cgaggaggat atcgccctga tcaagagcga agagggcgag 2100
aaaatggtgc ttgagaataa cttcttcgtc gagaccgtgc tcccaagcaa gatcatgcgg 2160
aaactggagc ctgaggagtt cgctgcctac ctggagccat tcaaggagaa gggcgaggtt 2220
agacggccta ccctctcctg gcctcgcgag atccctctcg ttaagggagg caagcccgac 2280
gtcgtccaga ttgtccgcaa ctacaacgcc taccttcggg ccagcgacga tctgcctaag 2340
ctgttcatcg agtccgaccc tgggttcttt tccaacgcta ttgtcgaggg agctaagaag 2400
ttccctaaca ccgagttcgt gaaggtgaag ggcctccact tcctccagga ggacgctcca 2460
gatgaaatgg gtaagtacat caagagcttc gtggagcgcg tgctgaagaa cgagcagtaa 2520
<210> 23
<211> 799
<212> PRT
<213> 人工序列
<220>
<223> LacF1
<400> 23
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Arg Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Thr Trp Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Ile Ser His Asn Val Tyr Ile Thr
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala His Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Met Gln Ile Leu Trp Lys Lys Tyr Val
275 280 285
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
290 295 300
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
305 310 315 320
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
325 330 335
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
340 345 350
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
355 360 365
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
370 375 380
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
385 390 395 400
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
405 410 415
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
420 425 430
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
435 440 445
His Thr Tyr Ile Gln Asp Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met
450 455 460
His Ser Ile Thr Val Gln Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg
465 470 475 480
Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln
485 490 495
Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys
500 505 510
Ser Thr Lys Leu Pro Ile Gly Glu Val Ala Ser Ser Val Gly Tyr Ser
515 520 525
Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser Lys His Phe Ser Met Ser
530 535 540
Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn Lys Pro Ser Ile Phe Glu
545 550 555 560
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
565 570 575
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
580 585 590
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
595 600 605
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
610 615 620
Phe Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Arg
625 630 635 640
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
645 650 655
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
660 665 670
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
675 680 685
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
690 695 700
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
705 710 715 720
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
725 730 735
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
740 745 750
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Tyr Gln Ser Ala Leu
755 760 765
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
770 775 780
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
785 790 795
<210> 24
<211> 2397
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacF1
<400> 24
atgcggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatcgat ggggatccga attcatggtg 120
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 180
gtaaacggcc acaggttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 240
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 300
accaccctga cctggggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 360
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgtaccat cttcttcaag 420
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 480
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 540
gagtacaact acatcagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 600
aaggcccact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 660
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 720
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 780
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gctgcagatg 840
cagattctgt ggaaaaaata cgtcaaagaa aactttgaaa tgaacgtgga tgaatgcggc 900
attgaacaag gcattccggg cctgggttat aactacgaag ttctgaaaaa tgcagtcatc 960
cattatgtga ccaaaggcta tggtacgttt aaattcaacg gcaaagtcta taatctgaaa 1020
cagggtgaca ttttcatcct gctgaaaggc atgcaagtgg aatacgttgc gagcattgat 1080
gacccgtggg aatattactg gatcggcttt agtggttcca acgcgaatga atatctgaac 1140
cgtaccagca ttaccaacag ctgcgtggcc aactgtgaag aaaatagcaa aattccgcag 1200
attatcctga acatgtgtga aatctctaaa acctacaacc cgtcacgctc ggatgacatt 1260
ctgctgctga aagaactgta ttccctgctg tacgcactga tcgaagaatt tccgaaaccg 1320
tttgaataca aagataaaga actgcatacc tacattcagg acgcgctgaa cttcatcaac 1380
tcaaattata tgcactcgat tacggtgcaa gaaatcgccg attacgttaa tctgagccgt 1440
tcttacctgt acaaaatgtt catcaaaaac ctgggtatca gtccgcagcg ttatctgatt 1500
aatctgcgca tgtacaaagc aaccctgctg ctgaaatcta cgaaactgcc gatcggcgaa 1560
gttgcgagca gcgtgggtta tagtgattcc ctgctgttta gtaaaacctt ctccaaacac 1620
ttttcaatgt cgccgctgaa ctaccgcaac aatcaagtta ataaaccgag cattctgcag 1680
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 1740
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 1800
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 1860
ctcgtgacca ccttcggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgcgc 1920
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 1980
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 2040
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 2100
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 2160
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 2220
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 2280
tacctgagct accagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 2340
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 2397
<210> 25
<211> 873
<212> PRT
<213> 人工序列
<220>
<223> LacB1
<400> 25
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Met Gln Ile Leu Trp Lys Lys Tyr Val
275 280 285
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
290 295 300
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
305 310 315 320
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
325 330 335
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
340 345 350
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
355 360 365
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
370 375 380
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
385 390 395 400
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
405 410 415
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
420 425 430
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
435 440 445
His Thr Tyr Ile Gln Asp Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met
450 455 460
His Ser Ile Thr Val Gln Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg
465 470 475 480
Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln
485 490 495
Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys
500 505 510
Ser Thr Lys Leu Pro Ile Gly Glu Val Ala Ser Ser Val Gly Tyr Ser
515 520 525
Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser Lys His Phe Ser Met Ser
530 535 540
Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn Lys Pro Ser Ile Phe Glu
545 550 555 560
Leu Gln Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met
565 570 575
Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu
580 585 590
Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala
595 600 605
Val Ile Phe Leu His Gly Asn Ala Thr Ser Ser Tyr Leu Trp Arg His
610 615 620
Val Val Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu
625 630 635 640
Ile Gly Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu
645 650 655
Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu
660 665 670
Pro Lys Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Ala Leu Ala
675 680 685
Phe His Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys Ala Ile Val His
690 695 700
Met Glu Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp
705 710 715 720
Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met
725 730 735
Val Leu Glu Asn Asn Phe Phe Val Glu Thr Val Leu Pro Ser Lys Ile
740 745 750
Met Arg Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe
755 760 765
Lys Glu Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu
770 775 780
Ile Pro Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg
785 790 795 800
Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Leu Phe
805 810 815
Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala
820 825 830
Lys Lys Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe
835 840 845
Leu Gln Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe
850 855 860
Val Glu Arg Val Leu Lys Asn Glu Gln
865 870
<210> 26
<211> 885
<212> PRT
<213> 人工序列
<220>
<223> LacB2
<400> 26
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Gly Gly Thr Gly Gly Gly Met Gln Ile
275 280 285
Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn Val Asp Glu
290 295 300
Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val
305 310 315 320
Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr Gly Thr Phe
325 330 335
Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile
340 345 350
Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile Asp Asp Pro
355 360 365
Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr
370 375 380
Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn Cys Glu Glu
385 390 395 400
Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu Ile Ser Lys
405 410 415
Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu
420 425 430
Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu
435 440 445
Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala Leu Asn Phe
450 455 460
Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln Glu Ile Ala Asp
465 470 475 480
Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn
485 490 495
Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys
500 505 510
Ala Thr Leu Leu Leu Lys Ser Thr Lys Leu Pro Ile Gly Glu Val Ala
515 520 525
Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser
530 535 540
Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn
545 550 555 560
Lys Pro Ser Ile Gly Gly Thr Gly Gly Gly Phe Glu Leu Gln Met Ala
565 570 575
Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr Gly Pro
580 585 590
Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser Phe Ile
595 600 605
Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile Phe Leu
610 615 620
His Gly Asn Ala Thr Ser Ser Tyr Leu Trp Arg His Val Val Pro His
625 630 635 640
Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly Met Gly
645 650 655
Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr
660 665 670
Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys Ile
675 680 685
Ile Phe Val Gly His Asp Trp Gly Ala Ala Leu Ala Phe His Tyr Ala
690 695 700
Tyr Glu His Gln Asp Arg Ile Lys Ala Ile Val His Met Glu Ser Val
705 710 715 720
Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu Glu Asp
725 730 735
Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn
740 745 750
Asn Phe Phe Val Glu Thr Val Leu Pro Ser Lys Ile Met Arg Lys Leu
755 760 765
Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly
770 775 780
Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro Leu Val
785 790 795 800
Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala
805 810 815
Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Leu Phe Ile Glu Ser Asp
820 825 830
Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro
835 840 845
Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Leu Gln Glu Asp
850 855 860
Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val
865 870 875 880
Leu Lys Asn Glu Gln
885
<210> 27
<211> 879
<212> PRT
<213> 人工序列
<220>
<223> LacB3
<400> 27
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Gly Gly Thr Gly Gly Gly Met Gln Ile
275 280 285
Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn Val Asp Glu
290 295 300
Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val
305 310 315 320
Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr Gly Thr Phe
325 330 335
Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile
340 345 350
Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile Asp Asp Pro
355 360 365
Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr
370 375 380
Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn Cys Glu Glu
385 390 395 400
Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu Ile Ser Lys
405 410 415
Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu
420 425 430
Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu
435 440 445
Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala Leu Asn Phe
450 455 460
Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln Glu Ile Ala Asp
465 470 475 480
Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn
485 490 495
Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys
500 505 510
Ala Thr Leu Leu Leu Lys Ser Thr Lys Leu Pro Ile Gly Glu Val Ala
515 520 525
Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser
530 535 540
Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn
545 550 555 560
Lys Pro Ser Ile Phe Glu Leu Gln Met Ala Ser Lys Val Tyr Asp Pro
565 570 575
Glu Gln Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys
580 585 590
Lys Gln Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu
595 600 605
Lys His Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala Thr Ser
610 615 620
Ser Tyr Leu Trp Arg His Val Val Pro His Ile Glu Pro Val Ala Arg
625 630 635 640
Cys Ile Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys Ser Gly
645 650 655
Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp
660 665 670
Phe Glu Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly His Asp
675 680 685
Trp Gly Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln Asp Arg
690 695 700
Ile Lys Ala Ile Val His Met Glu Ser Val Val Asp Val Ile Glu Ser
705 710 715 720
Trp Asp Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser
725 730 735
Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val Glu Thr
740 745 750
Val Leu Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu Phe Ala
755 760 765
Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg Pro Thr
770 775 780
Leu Ser Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys Pro Asp
785 790 795 800
Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp
805 810 815
Asp Leu Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn
820 825 830
Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys
835 840 845
Val Lys Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu Met Gly
850 855 860
Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
865 870 875
<210> 28
<211> 879
<212> PRT
<213> 人工序列
<220>
<223> LacB4
<400> 28
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Met Gln Ile Leu Trp Lys Lys Tyr Val
275 280 285
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
290 295 300
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
305 310 315 320
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
325 330 335
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
340 345 350
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
355 360 365
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
370 375 380
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
385 390 395 400
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
405 410 415
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
420 425 430
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
435 440 445
His Thr Tyr Ile Gln Asp Ala Leu Asn Phe Ile Asn Ser Asn Tyr Met
450 455 460
His Ser Ile Thr Val Gln Glu Ile Ala Asp Tyr Val Asn Leu Ser Arg
465 470 475 480
Ser Tyr Leu Tyr Lys Met Phe Ile Lys Asn Leu Gly Ile Ser Pro Gln
485 490 495
Arg Tyr Leu Ile Asn Leu Arg Met Tyr Lys Ala Thr Leu Leu Leu Lys
500 505 510
Ser Thr Lys Leu Pro Ile Gly Glu Val Ala Ser Ser Val Gly Tyr Ser
515 520 525
Asp Ser Leu Leu Phe Ser Lys Thr Phe Ser Lys His Phe Ser Met Ser
530 535 540
Pro Leu Asn Tyr Arg Asn Asn Gln Val Asn Lys Pro Ser Ile Gly Gly
545 550 555 560
Thr Gly Gly Gly Phe Glu Leu Gln Met Ala Ser Lys Val Tyr Asp Pro
565 570 575
Glu Gln Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys
580 585 590
Lys Gln Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu
595 600 605
Lys His Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala Thr Ser
610 615 620
Ser Tyr Leu Trp Arg His Val Val Pro His Ile Glu Pro Val Ala Arg
625 630 635 640
Cys Ile Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys Ser Gly
645 650 655
Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp
660 665 670
Phe Glu Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly His Asp
675 680 685
Trp Gly Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln Asp Arg
690 695 700
Ile Lys Ala Ile Val His Met Glu Ser Val Val Asp Val Ile Glu Ser
705 710 715 720
Trp Asp Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser
725 730 735
Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val Glu Thr
740 745 750
Val Leu Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu Phe Ala
755 760 765
Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg Pro Thr
770 775 780
Leu Ser Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys Pro Asp
785 790 795 800
Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp
805 810 815
Asp Leu Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn
820 825 830
Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys
835 840 845
Val Lys Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu Met Gly
850 855 860
Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
865 870 875
<210> 29
<211> 2622
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB1
<400> 29
atgcggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatcgat ggggatccga attcatggtg 120
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 180
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 240
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 300
accaccctga gctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 360
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 420
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 480
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 540
gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc 600
aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 660
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 720
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 780
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gctgcagatg 840
cagattctgt ggaaaaaata cgtcaaagaa aactttgaaa tgaacgtgga tgaatgcggc 900
attgaacaag gcattccggg cctgggttat aactacgaag ttctgaaaaa tgcagtcatc 960
cattatgtga ccaaaggcta tggtacgttt aaattcaacg gcaaagtcta taatctgaaa 1020
cagggtgaca ttttcatcct gctgaaaggc atgcaagtgg aatacgttgc gagcattgat 1080
gacccgtggg aatattactg gatcggcttt agtggttcca acgcgaatga atatctgaac 1140
cgtaccagca ttaccaacag ctgcgtggcc aactgtgaag aaaatagcaa aattccgcag 1200
attatcctga acatgtgtga aatctctaaa acctacaacc cgtcacgctc ggatgacatt 1260
ctgctgctga aagaactgta ttccctgctg tacgcactga tcgaagaatt tccgaaaccg 1320
tttgaataca aagataaaga actgcatacc tacattcagg acgcgctgaa cttcatcaac 1380
tcaaattata tgcactcgat tacggtgcaa gaaatcgccg attacgttaa tctgagccgt 1440
tcttacctgt acaaaatgtt catcaaaaac ctgggtatca gtccgcagcg ttatctgatt 1500
aatctgcgca tgtacaaagc aaccctgctg ctgaaatcta cgaaactgcc gatcggcgaa 1560
gttgcgagca gcgtgggtta tagtgattcc ctgctgttta gtaaaacctt ctccaaacac 1620
ttttcaatgt cgccgctgaa ctaccgcaac aatcaagtta ataaaccgag cattttcgaa 1680
cttcagatgg cttccaaggt gtacgacccc gagcaacgca aacgcatgat cactgggcct 1740
cagtggtggg ctcgctgcaa gcaaatgaac gtgctggact ccttcatcaa ctactatgat 1800
tccgagaagc acgccgagaa cgccgtgatt tttctgcatg gtaacgctac ctccagctac 1860
ctgtggaggc acgtcgtgcc tcacatcgag cccgtggcta gatgcatcat ccctgatctg 1920
atcggaatgg gtaagtccgg caagagcggg aatggctcat atcgcctcct ggatcactac 1980
aagtacctca ccgcttggtt cgagctgctg aaccttccaa agaaaatcat ctttgtgggc 2040
cacgactggg gggctgctct ggcctttcac tacgcctacg agcaccaaga caggatcaag 2100
gccatcgtcc atatggagag tgtcgtggac gtgatcgagt cctgggacga gtggcctgac 2160
atcgaggagg atatcgccct gatcaagagc gaagagggcg agaaaatggt gcttgagaat 2220
aacttcttcg tcgagaccgt gctcccaagc aagatcatgc ggaaactgga gcctgaggag 2280
ttcgctgcct acctggagcc attcaaggag aagggcgagg ttagacggcc taccctctcc 2340
tggcctcgcg agatccctct cgttaaggga ggcaagcccg acgtcgtcca gattgtccgc 2400
aactacaacg cctaccttcg ggccagcgac gatctgccta agctgttcat cgagtccgac 2460
cctgggttct tttccaacgc tattgtcgag ggagctaaga agttccctaa caccgagttc 2520
gtgaaggtga agggcctcca cttcctccag gaggacgctc cagatgaaat gggtaagtac 2580
atcaagagct tcgtggagcg cgtgctgaag aacgagcagt aa 2622
<210> 30
<211> 2658
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB2
<400> 30
atgcggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatcgat ggggatccga attcatggtg 120
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 180
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 240
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 300
accaccctga gctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 360
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 420
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 480
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 540
gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc 600
aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 660
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 720
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 780
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gctgcagggt 840
ggtaccggag gcggcatgca gattctgtgg aaaaaatacg tcaaagaaaa ctttgaaatg 900
aacgtggatg aatgcggcat tgaacaaggc attccgggcc tgggttataa ctacgaagtt 960
ctgaaaaatg cagtcatcca ttatgtgacc aaaggctatg gtacgtttaa attcaacggc 1020
aaagtctata atctgaaaca gggtgacatt ttcatcctgc tgaaaggcat gcaagtggaa 1080
tacgttgcga gcattgatga cccgtgggaa tattactgga tcggctttag tggttccaac 1140
gcgaatgaat atctgaaccg taccagcatt accaacagct gcgtggccaa ctgtgaagaa 1200
aatagcaaaa ttccgcagat tatcctgaac atgtgtgaaa tctctaaaac ctacaacccg 1260
tcacgctcgg atgacattct gctgctgaaa gaactgtatt ccctgctgta cgcactgatc 1320
gaagaatttc cgaaaccgtt tgaatacaaa gataaagaac tgcataccta cattcaggac 1380
gcgctgaact tcatcaactc aaattatatg cactcgatta cggtgcaaga aatcgccgat 1440
tacgttaatc tgagccgttc ttacctgtac aaaatgttca tcaaaaacct gggtatcagt 1500
ccgcagcgtt atctgattaa tctgcgcatg tacaaagcaa ccctgctgct gaaatctacg 1560
aaactgccga tcggcgaagt tgcgagcagc gtgggttata gtgattccct gctgtttagt 1620
aaaaccttct ccaaacactt ttcaatgtcg ccgctgaact accgcaacaa tcaagttaat 1680
aaaccgagca ttggtggtac cggaggcggc ttcgaacttc agatggcttc caaggtgtac 1740
gaccccgagc aacgcaaacg catgatcact gggcctcagt ggtgggctcg ctgcaagcaa 1800
atgaacgtgc tggactcctt catcaactac tatgattccg agaagcacgc cgagaacgcc 1860
gtgatttttc tgcatggtaa cgctacctcc agctacctgt ggaggcacgt cgtgcctcac 1920
atcgagcccg tggctagatg catcatccct gatctgatcg gaatgggtaa gtccggcaag 1980
agcgggaatg gctcatatcg cctcctggat cactacaagt acctcaccgc ttggttcgag 2040
ctgctgaacc ttccaaagaa aatcatcttt gtgggccacg actggggggc tgctctggcc 2100
tttcactacg cctacgagca ccaagacagg atcaaggcca tcgtccatat ggagagtgtc 2160
gtggacgtga tcgagtcctg ggacgagtgg cctgacatcg aggaggatat cgccctgatc 2220
aagagcgaag agggcgagaa aatggtgctt gagaataact tcttcgtcga gaccgtgctc 2280
ccaagcaaga tcatgcggaa actggagcct gaggagttcg ctgcctacct ggagccattc 2340
aaggagaagg gcgaggttag acggcctacc ctctcctggc ctcgcgagat ccctctcgtt 2400
aagggaggca agcccgacgt cgtccagatt gtccgcaact acaacgccta ccttcgggcc 2460
agcgacgatc tgcctaagct gttcatcgag tccgaccctg ggttcttttc caacgctatt 2520
gtcgagggag ctaagaagtt ccctaacacc gagttcgtga aggtgaaggg cctccacttc 2580
ctccaggagg acgctccaga tgaaatgggt aagtacatca agagcttcgt ggagcgcgtg 2640
ctgaagaacg agcagtaa 2658
<210> 31
<211> 2640
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB3
<400> 31
atgcggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatcgat ggggatccga attcatggtg 120
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 180
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 240
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 300
accaccctga gctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 360
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 420
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 480
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 540
gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc 600
aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 660
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 720
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 780
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gctgcagggt 840
ggtaccggag gcggcatgca gattctgtgg aaaaaatacg tcaaagaaaa ctttgaaatg 900
aacgtggatg aatgcggcat tgaacaaggc attccgggcc tgggttataa ctacgaagtt 960
ctgaaaaatg cagtcatcca ttatgtgacc aaaggctatg gtacgtttaa attcaacggc 1020
aaagtctata atctgaaaca gggtgacatt ttcatcctgc tgaaaggcat gcaagtggaa 1080
tacgttgcga gcattgatga cccgtgggaa tattactgga tcggctttag tggttccaac 1140
gcgaatgaat atctgaaccg taccagcatt accaacagct gcgtggccaa ctgtgaagaa 1200
aatagcaaaa ttccgcagat tatcctgaac atgtgtgaaa tctctaaaac ctacaacccg 1260
tcacgctcgg atgacattct gctgctgaaa gaactgtatt ccctgctgta cgcactgatc 1320
gaagaatttc cgaaaccgtt tgaatacaaa gataaagaac tgcataccta cattcaggac 1380
gcgctgaact tcatcaactc aaattatatg cactcgatta cggtgcaaga aatcgccgat 1440
tacgttaatc tgagccgttc ttacctgtac aaaatgttca tcaaaaacct gggtatcagt 1500
ccgcagcgtt atctgattaa tctgcgcatg tacaaagcaa ccctgctgct gaaatctacg 1560
aaactgccga tcggcgaagt tgcgagcagc gtgggttata gtgattccct gctgtttagt 1620
aaaaccttct ccaaacactt ttcaatgtcg ccgctgaact accgcaacaa tcaagttaat 1680
aaaccgagca ttttcgaact tcagatggct tccaaggtgt acgaccccga gcaacgcaaa 1740
cgcatgatca ctgggcctca gtggtgggct cgctgcaagc aaatgaacgt gctggactcc 1800
ttcatcaact actatgattc cgagaagcac gccgagaacg ccgtgatttt tctgcatggt 1860
aacgctacct ccagctacct gtggaggcac gtcgtgcctc acatcgagcc cgtggctaga 1920
tgcatcatcc ctgatctgat cggaatgggt aagtccggca agagcgggaa tggctcatat 1980
cgcctcctgg atcactacaa gtacctcacc gcttggttcg agctgctgaa ccttccaaag 2040
aaaatcatct ttgtgggcca cgactggggg gctgctctgg cctttcacta cgcctacgag 2100
caccaagaca ggatcaaggc catcgtccat atggagagtg tcgtggacgt gatcgagtcc 2160
tgggacgagt ggcctgacat cgaggaggat atcgccctga tcaagagcga agagggcgag 2220
aaaatggtgc ttgagaataa cttcttcgtc gagaccgtgc tcccaagcaa gatcatgcgg 2280
aaactggagc ctgaggagtt cgctgcctac ctggagccat tcaaggagaa gggcgaggtt 2340
agacggccta ccctctcctg gcctcgcgag atccctctcg ttaagggagg caagcccgac 2400
gtcgtccaga ttgtccgcaa ctacaacgcc taccttcggg ccagcgacga tctgcctaag 2460
ctgttcatcg agtccgaccc tgggttcttt tccaacgcta ttgtcgaggg agctaagaag 2520
ttccctaaca ccgagttcgt gaaggtgaag ggcctccact tcctccagga ggacgctcca 2580
gatgaaatgg gtaagtacat caagagcttc gtggagcgcg tgctgaagaa cgagcagtaa 2640
<210> 32
<211> 2640
<212> DNA
<213> 人工序列
<220>
<223> 核苷酸序列编码 LacB4
<400> 32
atgcggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatcgat ggggatccga attcatggtg 120
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 180
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 240
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 300
accaccctga gctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 360
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 420
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 480
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 540
gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc 600
aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 660
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 720
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 780
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gctgcagatg 840
cagattctgt ggaaaaaata cgtcaaagaa aactttgaaa tgaacgtgga tgaatgcggc 900
attgaacaag gcattccggg cctgggttat aactacgaag ttctgaaaaa tgcagtcatc 960
cattatgtga ccaaaggcta tggtacgttt aaattcaacg gcaaagtcta taatctgaaa 1020
cagggtgaca ttttcatcct gctgaaaggc atgcaagtgg aatacgttgc gagcattgat 1080
gacccgtggg aatattactg gatcggcttt agtggttcca acgcgaatga atatctgaac 1140
cgtaccagca ttaccaacag ctgcgtggcc aactgtgaag aaaatagcaa aattccgcag 1200
attatcctga acatgtgtga aatctctaaa acctacaacc cgtcacgctc ggatgacatt 1260
ctgctgctga aagaactgta ttccctgctg tacgcactga tcgaagaatt tccgaaaccg 1320
tttgaataca aagataaaga actgcatacc tacattcagg acgcgctgaa cttcatcaac 1380
tcaaattata tgcactcgat tacggtgcaa gaaatcgccg attacgttaa tctgagccgt 1440
tcttacctgt acaaaatgtt catcaaaaac ctgggtatca gtccgcagcg ttatctgatt 1500
aatctgcgca tgtacaaagc aaccctgctg ctgaaatcta cgaaactgcc gatcggcgaa 1560
gttgcgagca gcgtgggtta tagtgattcc ctgctgttta gtaaaacctt ctccaaacac 1620
ttttcaatgt cgccgctgaa ctaccgcaac aatcaagtta ataaaccgag cattggtggt 1680
accggaggcg gcttcgaact tcagatggct tccaaggtgt acgaccccga gcaacgcaaa 1740
cgcatgatca ctgggcctca gtggtgggct cgctgcaagc aaatgaacgt gctggactcc 1800
ttcatcaact actatgattc cgagaagcac gccgagaacg ccgtgatttt tctgcatggt 1860
aacgctacct ccagctacct gtggaggcac gtcgtgcctc acatcgagcc cgtggctaga 1920
tgcatcatcc ctgatctgat cggaatgggt aagtccggca agagcgggaa tggctcatat 1980
cgcctcctgg atcactacaa gtacctcacc gcttggttcg agctgctgaa ccttccaaag 2040
aaaatcatct ttgtgggcca cgactggggg gctgctctgg cctttcacta cgcctacgag 2100
caccaagaca ggatcaaggc catcgtccat atggagagtg tcgtggacgt gatcgagtcc 2160
tgggacgagt ggcctgacat cgaggaggat atcgccctga tcaagagcga agagggcgag 2220
aaaatggtgc ttgagaataa cttcttcgtc gagaccgtgc tcccaagcaa gatcatgcgg 2280
aaactggagc ctgaggagtt cgctgcctac ctggagccat tcaaggagaa gggcgaggtt 2340
agacggccta ccctctcctg gcctcgcgag atccctctcg ttaagggagg caagcccgac 2400
gtcgtccaga ttgtccgcaa ctacaacgcc taccttcggg ccagcgacga tctgcctaag 2460
ctgttcatcg agtccgaccc tgggttcttt tccaacgcta ttgtcgaggg agctaagaag 2520
ttccctaaca ccgagttcgt gaaggtgaag ggcctccact tcctccagga ggacgctcca 2580
gatgaaatgg gtaagtacat caagagcttc gtggagcgcg tgctgaagaa cgagcagtaa 2640
<210> 33
<211> 765
<212> PRT
<213> 人工序列
<220>
<223> GFP2-BgaR1-171-RLuc8
<400> 33
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Met Gln Ile Leu Trp Lys Lys Tyr Val
275 280 285
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
290 295 300
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
305 310 315 320
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
325 330 335
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
340 345 350
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
355 360 365
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
370 375 380
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
385 390 395 400
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
405 410 415
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Leu Tyr Ala
420 425 430
Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr Lys Asp Lys Glu Leu
435 440 445
His Thr Phe Glu Leu Gln Met Ala Ser Lys Val Tyr Asp Pro Glu Gln
450 455 460
Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln
465 470 475 480
Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His
485 490 495
Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala Thr Ser Ser Tyr
500 505 510
Leu Trp Arg His Val Val Pro His Ile Glu Pro Val Ala Arg Cys Ile
515 520 525
Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys Ser Gly Asn Gly
530 535 540
Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu
545 550 555 560
Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly His Asp Trp Gly
565 570 575
Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys
580 585 590
Ala Ile Val His Met Glu Ser Val Val Asp Val Ile Glu Ser Trp Asp
595 600 605
Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu
610 615 620
Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val Glu Thr Val Leu
625 630 635 640
Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr
645 650 655
Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg Pro Thr Leu Ser
660 665 670
Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys Pro Asp Val Val
675 680 685
Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu
690 695 700
Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile
705 710 715 720
Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys Val Lys
725 730 735
Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr
740 745 750
Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
755 760 765
<210> 34
<211> 744
<212> PRT
<213> 人工序列
<220>
<223> GFP2-BgaR1-150-RLuc8
<400> 34
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Met Gln Ile Leu Trp Lys Lys Tyr Val
275 280 285
Lys Glu Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly
290 295 300
Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile
305 310 315 320
His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val
325 330 335
Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln
340 345 350
Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile
355 360 365
Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile
370 375 380
Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln
385 390 395 400
Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg
405 410 415
Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu Phe Glu Leu
420 425 430
Gln Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile
435 440 445
Thr Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp
450 455 460
Ser Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val
465 470 475 480
Ile Phe Leu His Gly Asn Ala Thr Ser Ser Tyr Leu Trp Arg His Val
485 490 495
Val Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile
500 505 510
Gly Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu
515 520 525
Asp His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro
530 535 540
Lys Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Ala Leu Ala Phe
545 550 555 560
His Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys Ala Ile Val His Met
565 570 575
Glu Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile
580 585 590
Glu Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val
595 600 605
Leu Glu Asn Asn Phe Phe Val Glu Thr Val Leu Pro Ser Lys Ile Met
610 615 620
Arg Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys
625 630 635 640
Glu Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile
645 650 655
Pro Leu Val Lys Gly Gly Lys Pro Asp Val Val Gln Ile Val Arg Asn
660 665 670
Tyr Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu Pro Lys Leu Phe Ile
675 680 685
Glu Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile Val Glu Gly Ala Lys
690 695 700
Lys Phe Pro Asn Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Leu
705 710 715 720
Gln Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr Ile Lys Ser Phe Val
725 730 735
Glu Arg Val Leu Lys Asn Glu Gln
740
<210> 35
<211> 754
<212> PRT
<213> 人工序列
<220>
<223> GFP2-BgaR12-171-RLuc8
<400> 35
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Asn Phe Glu Met Asn Val Asp Glu Cys
275 280 285
Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu
290 295 300
Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys
305 310 315 320
Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu
325 330 335
Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp
340 345 350
Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu
355 360 365
Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn
370 375 380
Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr
385 390 395 400
Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr
405 410 415
Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys Pro Phe Glu Tyr
420 425 430
Lys Asp Lys Glu Leu His Thr Phe Glu Leu Gln Met Ala Ser Lys Val
435 440 445
Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp
450 455 460
Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr
465 470 475 480
Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn
485 490 495
Ala Thr Ser Ser Tyr Leu Trp Arg His Val Val Pro His Ile Glu Pro
500 505 510
Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly
515 520 525
Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu
530 535 540
Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val
545 550 555 560
Gly His Asp Trp Gly Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His
565 570 575
Gln Asp Arg Ile Lys Ala Ile Val His Met Glu Ser Val Val Asp Val
580 585 590
Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu
595 600 605
Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe
610 615 620
Val Glu Thr Val Leu Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu
625 630 635 640
Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg
645 650 655
Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly
660 665 670
Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg
675 680 685
Ala Ser Asp Asp Leu Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe
690 695 700
Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu
705 710 715 720
Phe Val Lys Val Lys Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp
725 730 735
Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn
740 745 750
Glu Gln
<210> 36
<211> 733
<212> PRT
<213> 人工序列
<220>
<223> GFP2-BgaR12-150-RLuc8
<400> 36
Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr
1 5 10 15
Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys Asp
20 25 30
Arg Trp Gly Ser Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Ser Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Leu Gln Asn Phe Glu Met Asn Val Asp Glu Cys
275 280 285
Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn Tyr Glu Val Leu
290 295 300
Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr Gly Thr Phe Lys
305 310 315 320
Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp Ile Phe Ile Leu
325 330 335
Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile Asp Asp Pro Trp
340 345 350
Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala Asn Glu Tyr Leu
355 360 365
Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn Cys Glu Glu Asn
370 375 380
Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu Ile Ser Lys Thr
385 390 395 400
Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu Lys Glu Leu Tyr
405 410 415
Ser Leu Phe Glu Leu Gln Met Ala Ser Lys Val Tyr Asp Pro Glu Gln
420 425 430
Arg Lys Arg Met Ile Thr Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln
435 440 445
Met Asn Val Leu Asp Ser Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His
450 455 460
Ala Glu Asn Ala Val Ile Phe Leu His Gly Asn Ala Thr Ser Ser Tyr
465 470 475 480
Leu Trp Arg His Val Val Pro His Ile Glu Pro Val Ala Arg Cys Ile
485 490 495
Ile Pro Asp Leu Ile Gly Met Gly Lys Ser Gly Lys Ser Gly Asn Gly
500 505 510
Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu
515 520 525
Leu Leu Asn Leu Pro Lys Lys Ile Ile Phe Val Gly His Asp Trp Gly
530 535 540
Ala Ala Leu Ala Phe His Tyr Ala Tyr Glu His Gln Asp Arg Ile Lys
545 550 555 560
Ala Ile Val His Met Glu Ser Val Val Asp Val Ile Glu Ser Trp Asp
565 570 575
Glu Trp Pro Asp Ile Glu Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu
580 585 590
Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe Val Glu Thr Val Leu
595 600 605
Pro Ser Lys Ile Met Arg Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr
610 615 620
Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg Arg Pro Thr Leu Ser
625 630 635 640
Trp Pro Arg Glu Ile Pro Leu Val Lys Gly Gly Lys Pro Asp Val Val
645 650 655
Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp Asp Leu
660 665 670
Pro Lys Leu Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn Ala Ile
675 680 685
Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys Val Lys
690 695 700
Gly Leu His Phe Leu Gln Glu Asp Ala Pro Asp Glu Met Gly Lys Tyr
705 710 715 720
Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
725 730
<210> 37
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> A0A133MUX6
<400> 37
Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Asn
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr
35 40 45
Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn Leu Lys Gln Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu Tyr Val Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asp Ser Cys Val Ala Asn
100 105 110
Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys
145 150 155 160
Pro Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala
165 170 175
Leu Asn Phe Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln Glu
180 185 190
Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Gly Thr Lys Leu Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Val Asn Lys Pro Asn Ile
275
<210> 38
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> B1V7N0
<400> 38
Met Gln Ile Leu Trp Lys Lys Tyr Val Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Lys
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr
35 40 45
Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Thr Leu Lys Gln Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Gln Val Asp Tyr Val Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Cys Val Ala Asn
100 105 110
Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Leu Ile Glu Glu Phe Pro Lys
145 150 155 160
Pro Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala
165 170 175
Leu Asn Phe Ile Asn Ser Asn Tyr Met His Ser Ile Thr Val Gln Glu
180 185 190
Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Gly Thr Lys Leu Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Ser Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Val Tyr Lys Ser Ser Ile
275
<210> 39
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> A0A127EGD8
<400> 39
Met Gln Ile Leu Trp Lys Lys Tyr Ile Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Leu Gly Tyr Lys
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Val Thr Lys Gly Tyr
35 40 45
Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Thr Leu Lys Gln Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Lys Val Glu Tyr Val Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn Ser Tyr Val Ala Asn
100 105 110
Cys Glu Lys Asn Ser Lys Ile Pro Gln Ile Ile Leu Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Ser Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Thr Leu Ile Glu Glu Phe Pro Lys
145 150 155 160
Pro Phe Asp Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Asp Ala
165 170 175
Leu Asn Phe Ile Asn Ser Asn Tyr Met Asn Ser Ile Thr Val Gln Glu
180 185 190
Ile Ala Asp Tyr Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Asn Leu Gly Ile Ser Pro Gln Arg Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Gly Thr Lys Leu Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Arg Ile Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Val Asn Lys Pro Ser Ile
275
<210> 40
<211> 278
<212> PRT
<213> 人工序列
<220>
<223> A0A1C6JUB7
<400> 40
Met Gln Ile Leu Trp Lys Lys Tyr Thr Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Phe Gly Tyr Lys
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Ile Ser Lys Gly Asn
35 40 45
Gly Thr Phe Lys Phe Asn Asp Lys Val Tyr Asn Leu Lys Gln Gly Asp
50 55 60
Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu Tyr Ile Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp Ser Tyr Ala Ala Asn
100 105 110
Cys Lys Glu Asp Ser Lys Ile Pro Asp Ile Ile Ser Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Phe Ile Glu Glu Phe Pro Lys
145 150 155 160
Ala Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Glu Ala
165 170 175
Ile Asp Phe Ile Asn Ser Asn Tyr Met Asn Ser Ile Thr Val Asn Asp
180 185 190
Ile Ala Glu His Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Met Lys Asn Leu Lys Val Ser Pro Gln Lys Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Asn Thr Arg Ile Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Lys Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys Tyr Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Met Asn Gly Asn Lys
275
<210> 41
<211> 278
<212> PRT
<213> 人工序列
<220>
<223> A0A174HYB7
<400> 41
Met Gln Ile Leu Trp Lys Lys Tyr Thr Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Phe Gly Tyr Lys
20 25 30
Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr Ile Ser Lys Gly Asn
35 40 45
Gly Thr Phe Lys Phe Asn Asp Lys Val Tyr Asn Leu Lys Gln Gly Asp
50 55 60
Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu Tyr Ile Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp Ser Tyr Ala Ala Lys
100 105 110
Cys Lys Gly Asp Ser Lys Ile Pro Asp Ile Ile Ser Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Phe Ile Glu Glu Phe Pro Lys
145 150 155 160
Ala Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Glu Ala
165 170 175
Ile Asp Phe Ile Asn Ser Asn Tyr Met Asn Ser Ile Thr Val Asn Asp
180 185 190
Ile Ala Glu His Ile Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Met Lys Asn Leu Lys Val Ser Pro Gln Lys Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Gly Thr Arg Ile Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Lys Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys Tyr Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Thr Ser Asp Asn Lys
275
<210> 42
<211> 278
<212> PRT
<213> 人工序列
<220>
<223> A0A1C6KY47
<400> 42
Met Gln Ile Leu Trp Lys Lys Tyr Ile Lys Glu Asn Phe Glu Met Asn
1 5 10 15
Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro Gly Phe Gly Tyr Lys
20 25 30
Tyr Glu Val Leu Lys Asn Ser Val Ile His Tyr Ile Thr Lys Gly His
35 40 45
Gly Thr Phe Lys Ile Asn Asp Lys Leu Tyr Asn Leu Gly Gln Gly Asp
50 55 60
Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu Tyr Met Ala Ser Ile
65 70 75 80
Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe Ser Gly Ser Asn Ala
85 90 95
Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp Ser Tyr Ala Ala Thr
100 105 110
Cys Lys Glu Asp Ser Lys Ile Pro Cys Ile Ile Ser Asn Met Cys Glu
115 120 125
Ile Ser Lys Thr Tyr Asn Pro Ser Cys Cys Asp Asp Ile Leu Leu Leu
130 135 140
Lys Glu Leu Tyr Ser Leu Leu Tyr Ala Phe Ile Glu Glu Phe Pro Lys
145 150 155 160
Ala Phe Glu Tyr Lys Asp Lys Glu Leu His Thr Tyr Ile Gln Glu Ala
165 170 175
Ile Asn Phe Ile Asn Ser Asn Tyr Met Lys Ser Ile Thr Val Asn Asp
180 185 190
Ile Ala Glu His Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Met Lys Asn Leu Lys Val Ser Pro Gln Lys Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Gly Thr Arg Ile Pro Ile Gly
225 230 235 240
Glu Val Ala Ser Lys Val Gly Tyr Ser Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys Tyr Phe Ser Met Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Gln Thr Ser Asp Asn Lys
275
<210> 43
<211> 277
<212> PRT
<213> 人工序列
<220>
<223> A0A174LZQ7
<400> 43
Met Gln Ile Leu Trp Arg Lys Tyr Lys Lys Glu Asn Phe Asp Ile Asn
1 5 10 15
Leu Asp Glu Cys Gly Ile Glu His Gly Ile Pro Gly Phe Gly Tyr Arg
20 25 30
Tyr Lys Val Leu Lys Asn Ser Val Ile His Tyr Val Ile Arg Gly Tyr
35 40 45
Gly Thr Phe Lys Val Asn Asp Lys Val Tyr Asn Leu Lys Glu Gly Asp
50 55 60
Ile Phe Ile Leu Leu Lys Gly Met Asp Val Glu Tyr Met Ala Ser Met
65 70 75 80
Asp Asn Pro Trp Glu Tyr Cys Trp Ile Gly Phe Ser Gly Ser Lys Ala
85 90 95
Asp Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp Ser His Val Ala Asn
100 105 110
Cys Asn Glu Asn Ser Lys Ile Pro Cys Ile Ile Leu Asn Ile Cys Glu
115 120 125
Ile Ser Lys Asn Tyr Asn Pro Ser Asn Ser Asp Asp Ile Leu Leu Leu
130 135 140
Asn Glu Leu Tyr Ser Leu Leu Tyr Glu Leu Ile Gly Glu Phe Pro Lys
145 150 155 160
Pro Phe Glu Tyr Lys Asp Lys Glu Ile His Lys Tyr Ile Gln Asp Thr
165 170 175
Ile Asn Phe Ile Asn Ser Asn Tyr Met Asn Asn Ile Thr Val Asn Glu
180 185 190
Ile Ala Glu His Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Asn Leu Lys Ile Ser Pro Gln Lys Tyr Leu Ile Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Asn Thr Lys Leu Pro Ile Gly
225 230 235 240
Glu Ile Ala Asn Lys Val Gly Tyr Ala Asp Ser Leu Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys Tyr Phe Ser Val Ser Pro Leu Asn Tyr Arg Asn Asn
260 265 270
Lys Val Asn Lys Glu
275
<210> 44
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> N9YR91
<400> 44
Met Gln Ile Leu Trp Lys Lys Tyr Lys Asn Ile Asn Phe Asp Ser Asn
1 5 10 15
Leu Asp Glu Cys Gly Ile Glu Gln Gly Thr Pro Gly Thr Gly Tyr Lys
20 25 30
Tyr Glu Val Val Lys Asn Ala Val Ile His Tyr Ile Ser Lys Gly Ser
35 40 45
Gly Ile Phe Lys Ile Asn Asp Lys Ile Tyr Asn Leu Lys Arg Gly Asp
50 55 60
Gly Phe Ile Leu Leu Lys Gly Met His Val Glu Tyr Ile Ser Ser Ile
65 70 75 80
Asp Asp Pro Trp Lys Tyr Tyr Trp Val Gly Phe Ser Gly Lys Asn Ala
85 90 95
Asn Glu Tyr Leu Lys Arg Thr Ser Ile Ile Asp Thr Cys Ile Ile Asn
100 105 110
Phe Ser Lys Lys Ser Lys Val Pro Asn Thr Ile Ile Asp Met Cys Asn
115 120 125
Ile Ser Lys Lys Tyr Asn Gln Thr Ser Ser Asp Asp Ile Leu Leu Leu
130 135 140
Ser Lys Leu His Leu Leu Leu Tyr Tyr Ile Ser Ser Glu Phe Pro Lys
145 150 155 160
Ser Phe Lys Tyr Tyr Asn Asn Leu Ala His Thr Tyr Ile Gln Glu Ala
165 170 175
Val Asp Phe Ile Asn Asn Asn Tyr Met Lys Ser Ile Thr Val Gln Glu
180 185 190
Val Ala Asn His Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys Tyr Leu Gly Gln Ser Thr Gln Ser Tyr Leu Ile Asn Ile Arg
210 215 220
Met Tyr Lys Ser Ser Leu Leu Leu Lys Glu Thr Asn Leu Ser Ile Leu
225 230 235 240
Glu Ile Ala Asn Lys Val Gly Tyr Asp Asp Pro Gly Leu Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Met Ser Ala Ser Lys Tyr Arg Lys Ile
260 265 270
Tyr Gln Lys Asn Lys Thr Asn
275
<210> 45
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> A0A174I591
<400> 45
Met Gln Ile Leu Trp Asn Lys Tyr Lys Ser Asn Asn Phe Glu Ala Asn
1 5 10 15
Leu Asp Glu Cys Gly Ile Glu Gln Gly Thr Pro Gly Ala Gly Tyr Asn
20 25 30
Tyr Lys Val Glu Lys Asn Ala Val Ile His Tyr Ile Ser Lys Gly Ser
35 40 45
Gly Thr Phe Lys Ile Asn Asp Lys Ile Tyr Thr Leu Lys Lys Gly Asp
50 55 60
Gly Phe Ile Leu Leu Lys Asp Met Asn Val Glu Tyr Ile Pro Ser Ile
65 70 75 80
Asp Asp Pro Trp Lys Tyr Tyr Trp Ile Gly Phe Ser Gly Gln Ser Leu
85 90 95
Asn Glu Tyr Leu Lys Arg Thr Ser Ile Ile Asp Ser Cys Val Ile Asn
100 105 110
Phe Ser Lys Lys Ser Lys Ile Pro Asn Leu Ile Ile Asp Met Cys Asn
115 120 125
Ile Ser Lys Lys Tyr Asp Gln Thr Ser Ser Asp Asp Ile Leu Leu Leu
130 135 140
Ser Lys Leu His Leu Leu Leu Tyr Tyr Ile Ser Ser Glu Phe Pro Lys
145 150 155 160
Ala Phe Lys Tyr Asn Asn Asn Leu Thr His Thr Tyr Ile Gln Glu Ala
165 170 175
Thr Thr Phe Ile Asn Asn Asn Tyr Met Asn Pro Ile Thr Val Gln Glu
180 185 190
Val Ala Asp His Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Ile Lys His Leu Gly Glu Ser Thr Gln Ser Tyr Leu Ile Asn Ile Arg
210 215 220
Met Tyr Lys Ser Ser Ile Leu Leu Lys Glu Thr Ser Leu Ser Ile Ala
225 230 235 240
Glu Ile Ala Asn Lys Val Gly Tyr Ser Asp Pro Leu Leu Phe Ser Lys
245 250 255
Ile Phe Ser Lys His Phe Ser Met Ser Ala Ser Lys Tyr Arg Lys Ser
260 265 270
His Gln Lys Asn Lys Lys Cys
275
<210> 46
<211> 275
<212> PRT
<213> 人工序列
<220>
<223> A0A2A7ME67
<400> 46
Met Gln Ile Leu Trp Lys Lys Tyr Lys Ile Thr Asn Phe Glu Met Asn
1 5 10 15
Leu Asp Glu Cys Gly Ile Glu Gln Cys Thr Pro Gly Ile Lys Tyr Asn
20 25 30
Tyr Glu Val Val Lys Asn Ser Val Ile His Tyr Ile Ser Glu Gly Glu
35 40 45
Gly Thr Phe Lys Ile Asn Asn Gln Ile Phe Asp Leu Lys Lys Gly Asp
50 55 60
Gly Phe Ile Leu Phe Lys Gly Met Asn Val Glu Tyr Thr Ala Ser Ile
65 70 75 80
Asp Asn Pro Trp Lys Tyr Tyr Trp Val Gly Phe Ser Gly Thr Asn Ala
85 90 95
Asn Glu Tyr Leu His Arg Ser Ser Ile Phe Asp Asn Tyr Ile Ile Asn
100 105 110
Tyr Gln Ser Asn Ser Lys Ile Pro Ser Ile Ile Lys Asn Met Cys Ala
115 120 125
Leu Ser Lys Thr Tyr Asp Gln Asn Ser Ser Asp Asp Ile Leu Leu Leu
130 135 140
Asn Lys Leu Tyr Tyr Leu Leu Tyr Thr Ile Thr Gln Glu Phe Pro Lys
145 150 155 160
Pro Phe Gln Leu Val Asn Asn Leu Thr His Thr Tyr Ile Gln Gln Ser
165 170 175
Ile Asp Phe Ile Asn Ser Lys Tyr Ala Glu Lys Ile Thr Val Gln Gln
180 185 190
Ile Ala Asp Asn Val Asn Leu Ser Arg Ser Tyr Leu Tyr Lys Leu Phe
195 200 205
Ile Lys Tyr Leu Gly Glu Ser Pro Gln Lys Tyr Leu Leu Asn Leu Arg
210 215 220
Met Tyr Lys Ala Thr Leu Leu Leu Lys Glu Thr Asp Leu Ser Ile Ser
225 230 235 240
Gln Ile Ser Ser Asn Ile Gly Tyr Asp Asp Pro Leu Phe Phe Ser Lys
245 250 255
Thr Phe Ser Lys His Phe Ser Ile Ser Ala Ser Gln Tyr Arg Lys Leu
260 265 270
Tyr Lys Lys
275
<210> 47
<211> 274
<212> PRT
<213> 人工序列
<220>
<223> A0A2K4AZL9
<400> 47
Met Gln Leu Leu Trp Lys Met Phe Lys Lys Asn Gln Phe Glu Ala Asn
1 5 10 15
Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro Gln Gly Gly Tyr Gln
20 25 30
Tyr Glu Val Thr Lys Pro Ala Val Leu His Val Val Met Ser Gly Thr
35 40 45
Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr Leu Lys Pro Gly Asp
50 55 60
Leu Phe Leu Leu Cys Arg Gly Met Lys Val His Tyr Glu Ser Thr Leu
65 70 75 80
Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe Ser Gly Lys Leu Ala
85 90 95
Met Asp Tyr Leu Asn Arg Thr Thr Leu Tyr Glu Thr Arg Val Ile Gln
100 105 110
Asn Gln Gln Thr Ser Thr Ile Arg Gln Ile Ile Tyr Gln Met Cys His
115 120 125
Arg Ser Ile Asp Tyr Asn Pro Glu His Ser Asp Asp Ile Gln His Met
130 135 140
Arg Asp Leu Tyr Asp Leu Leu Tyr Ala Leu His Gln His Phe Pro Lys
145 150 155 160
Pro Phe His Val Val Lys Asn Glu Lys Tyr Ser Asn Val Arg Glu Ala
165 170 175
Ile Arg Tyr Ile Asn Asp Asn Tyr Met His Gly Ile Ser Ile His Asp
180 185 190
Val Ala Lys His Val Asn Val Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Lys Lys His Ile Asp Gln Ser Pro Gln His Tyr Leu Ile His Ile Arg
210 215 220
Met Tyr His Ala Ser Gln Leu Phe Lys Asp Thr Asp Leu Gln Ser Gln
225 230 235 240
Glu Ile Ala Asp Arg Val Gly Tyr Lys Asp Pro Leu Leu Phe Ser Arg
245 250 255
Ala Phe Lys Lys His Phe Gly Ile Thr Ala Thr Gln Tyr Arg Glu Thr
260 265 270
His Gln
<210> 48
<211> 286
<212> PRT
<213> 人工序列
<220>
<223> A0A166PPM9
<400> 48
Met Gln Leu Leu Trp Lys Met Phe Lys Lys Asn Gln Phe Glu Ala Asn
1 5 10 15
Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro His Gly Gly Tyr Gln
20 25 30
Tyr Glu Val Thr Lys Pro Ala Val Leu His Ile Val Met Ser Gly Thr
35 40 45
Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr Leu Lys Pro Gly Asp
50 55 60
Leu Phe Leu Leu Cys Arg Gly Met Asn Val His Tyr Glu Ser Thr Leu
65 70 75 80
Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe Ser Gly Lys Leu Val
85 90 95
Phe Asp Tyr Leu Asn Arg Thr Ser Leu Tyr Glu Thr Arg Val Ile Gln
100 105 110
Asn Gln Pro Thr Asn Thr Ile Arg Gln Ile Ile Tyr Arg Met Cys Gln
115 120 125
Arg Ser Ile Glu Tyr Ala Thr Glu Asn Ser Asp Asp Ile Gln His Met
130 135 140
Arg Asp Leu Tyr Glu Leu Leu Tyr Glu Leu His Gln His Phe Pro Lys
145 150 155 160
Pro Phe His Val Val Lys Asn Glu Arg Tyr Ser Asn Val Arg Glu Ala
165 170 175
Ile Arg Tyr Ile Asn Asp Asn Tyr Met His Ala Ile Ser Ile Asn Asp
180 185 190
Val Ala Lys His Val Asn Val Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Lys Lys His Ile Asp Gln Ser Pro Gln His Tyr Leu Ile His Ile Arg
210 215 220
Met Tyr His Ala Ser Gln Leu Phe Lys Glu Thr Asp Leu Gln Ser Gln
225 230 235 240
Glu Ile Ala Asp Arg Val Gly Tyr Lys Asp Pro Leu Leu Phe Ser Arg
245 250 255
Ala Phe Lys Lys His Phe Gly Val Thr Ala Thr Gln Tyr Arg Glu Glu
260 265 270
Gln Gln Leu Arg Ile Glu Ser Thr Leu Asp Asn Gln Lys Arg
275 280 285
<210> 49
<211> 274
<212> PRT
<213> 人工序列
<220>
<223> A0A2T4R7G1
<400> 49
Met Gln Leu Leu Trp Lys Leu Phe Lys Arg Asn His Phe Glu Ala Asn
1 5 10 15
Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro Asn Val Ser Tyr Gln
20 25 30
Tyr Thr Val Val Lys Pro Ala Val Leu His Ile Ile Val Ala Gly Thr
35 40 45
Gly Ser Phe Thr Tyr Gln Gln Ser Thr Tyr Gln Leu Lys Ser Gly Asp
50 55 60
Met Phe Leu Leu Gln Glu Gly Met His Val His Tyr Glu Ala Ser Ala
65 70 75 80
Asp Asp Pro Trp Thr Tyr His Trp Val Gly Phe Ser Gly Asn Leu Ala
85 90 95
Ile Asp Tyr Leu Lys Arg Thr Ser Leu Ile Asp Cys Pro Val Val Met
100 105 110
Asn Lys Asp Thr Ser Asp Ile Ser Lys Val Met Tyr Gln Ile Cys Glu
115 120 125
Arg Ala Ile Thr Tyr Glu Thr Ala Thr Ser Asp Asp Ile His His Leu
130 135 140
Ser Asp Leu Tyr Lys Leu Leu Phe Leu Ile Thr Gln Cys Ala Pro Lys
145 150 155 160
Pro Phe Glu Lys Glu His Asn Glu Ile Tyr Ser Ser Val Gln Asp Ala
165 170 175
Val Asp Tyr Met Asn Gln Asn Tyr Met Tyr Ala Ile Thr Ile Asp Asp
180 185 190
Ile Ala Gln Tyr Ala Lys Val Ser Arg Ser Tyr Leu Tyr Lys Leu Phe
195 200 205
Ile Lys Trp Met Asp Gln Ser Pro Gln Gln Tyr Leu Ile Tyr Leu Arg
210 215 220
Leu Tyr His Ala Ser Ser Met Leu Lys Thr Thr Ser Lys Pro Ile Gln
225 230 235 240
Asp Ile Ala Gln Ala Val Gly Tyr Ser Asp Pro Leu Leu Phe Ser Lys
245 250 255
Ala Phe Arg Lys His Phe Asp Met Pro Pro Ser Thr Tyr Arg Lys Val
260 265 270
Tyr Lys
<210> 50
<211> 274
<212> PRT
<213> 人工序列
<220>
<223> A0A2A4HCU9
<400> 50
Met Gln Leu Leu Trp Lys Met Phe Lys Lys Asn Gln Phe Glu Ala Asn
1 5 10 15
Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro Gln Arg Gly Tyr Gln
20 25 30
Tyr Glu Val Thr Lys Pro Ala Val Leu His Val Val Met Ser Gly Thr
35 40 45
Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr Leu Lys Pro Gly Asp
50 55 60
Leu Phe Leu Leu Cys Arg Gly Met Asn Val His Tyr Glu Ser Thr Leu
65 70 75 80
Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe Ser Gly Lys Leu Val
85 90 95
Phe Asp Tyr Leu Asn Arg Thr Ser Leu Tyr Glu Thr Arg Val Ile Gln
100 105 110
Asn Gln Pro Thr Asn Ala Ile Arg Gln Ile Ile Tyr Arg Met Cys His
115 120 125
Arg Ser Ile Glu Tyr Ala Thr Glu Asn Ser Asp Asp Ile Gln His Met
130 135 140
Arg Asp Leu Tyr Glu Leu Leu Tyr Glu Leu His Gln His Phe Pro Lys
145 150 155 160
Pro Phe His Val Val Lys Asn Glu Lys Tyr Ser Asn Val Arg Glu Ala
165 170 175
Ile Arg Tyr Met Asn Asp Asn Tyr Met His Ala Ile Ser Ile Asn Asp
180 185 190
Val Ala Lys His Val Asn Val Ser Arg Ser Tyr Leu Tyr Lys Met Phe
195 200 205
Lys Lys His Ile Asp Gln Ser Pro Gln His Tyr Leu Ile His Ile Arg
210 215 220
Met Tyr His Ala Ser Gln Leu Phe Lys Glu Thr Asp Leu Gln Ser Gln
225 230 235 240
Glu Ile Ala Asp Arg Val Gly Tyr Lys Asp Pro Leu Leu Phe Ser Arg
245 250 255
Ala Phe Lys Lys His Phe Gly Val Thr Ala Thr Gln Tyr Arg Glu Glu
260 265 270
His Gln
<210> 51
<211> 271
<212> PRT
<213> 人工序列
<220>
<223> A0A2T4MS83
<400> 51
Met Gln Leu Leu Trp Lys Leu Phe Lys Lys Asn His Phe Glu Ala Asn
1 5 10 15
Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro Asn Val Ser Tyr Gln
20 25 30
Tyr Thr Val Val Lys Pro Ala Val Leu His Ile Ile Met Ser Gly Thr
35 40 45
Gly Thr Phe Thr His Gln His Thr Ser Tyr Glu Leu Lys Ala Gly Asp
50 55 60
Met Phe Leu Leu Arg Glu Gly Met Arg Val His Tyr Glu Ala Ser Thr
65 70 75 80
Asp Asp Pro Trp Thr Tyr His Trp Val Gly Phe Ser Gly Asn Leu Ala
85 90 95
Met Asp Tyr Leu Lys Arg Thr Thr Leu Ile Asp Cys Pro Val Val Leu
100 105 110
Asn Gln Asp Thr Ser Lys Leu Ser Lys Leu Met Tyr Gln Ile Cys Glu
115 120 125
Arg Ala Ile Thr Tyr Glu Thr Thr Ala Ser Asp Asp Ile His His Leu
130 135 140
Ser Asp Leu Tyr Lys Leu Leu Phe Leu Leu Thr Gln Leu Ser Pro Lys
145 150 155 160
Pro Phe Glu Ser His Pro Asn Glu Ile Tyr Ser Ser Val Gln Ala Ala
165 170 175
Val Asn Tyr Met Asn Gln His Tyr Met His Thr Ile Ser Ile Asp Asp
180 185 190
Val Ala Gln His Ala Lys Val Ser Arg Ser Tyr Leu Tyr Lys Leu Phe
195 200 205
Met Lys Trp Met Asp Gln Ser Pro Gln Gln Tyr Leu Val Tyr Leu Arg
210 215 220
Leu Tyr His Ala Ser Ser Met Leu Lys Thr Thr Ser Lys Pro Ile Gln
225 230 235 240
Glu Ile Ala Gln Asn Val Gly Tyr Asn Asp Pro Leu Leu Phe Ser Lys
245 250 255
Ala Phe Arg Lys His Phe Asp Met Pro Pro Ser Thr Tyr Arg Lys
260 265 270
<210> 52
<211> 279
<212> PRT
<213> 人工序列
<220>
<223> O33813
<400> 52
Met Gln Val Leu Trp Lys Lys Phe Gln Lys Lys Leu Ile Asp Ala Asn
1 5 10 15
Leu Ala Glu Cys Gly Ile Glu Ile Gly Val Pro Asn Val Gly Tyr Asn
20 25 30
Tyr Thr Val Phe Gln Lys Ser Val Leu His Ile Val Thr Gln Gly Glu
35 40 45
Gly Thr Phe Ser Tyr Ala Gly Glu Thr Tyr His Leu Thr Ala Gly Asp
50 55 60
Ile Phe Leu Leu Glu Arg Gly Met Glu Val Glu Tyr Lys Pro Ser Phe
65 70 75 80
Ser Asn Pro Trp Thr Tyr Tyr Trp Val Gly Met Asn Gly Lys Gln Ile
85 90 95
Leu Asn Tyr Leu Ser Arg Cys Ser Ile Val Asp Ser His Val Ile Leu
100 105 110
Gly Gln Asp Thr Thr Asp Ile Lys Asn Ile Ile Gln Leu Ile Cys Lys
115 120 125
Leu Ser Gln Ser Ile Glu Ser Asn Asn Ser Asn Asp Ile Leu Ile Met
130 135 140
Gln Tyr Leu Tyr Gln Leu Val Tyr Thr Leu Gln Glu Lys Phe Pro Lys
145 150 155 160
Ile Phe Ser Val Gln Val Asp Ile Val Asn Glu Asp Ile Gln His Ala
165 170 175
Val Asp Phe Ile Asn Thr Asn Tyr Gln Lys His Ile Thr Val Glu Asp
180 185 190
Val Ala Lys Ser Val Asn Ile Thr Arg Ser His Leu Tyr Lys Leu Phe
195 200 205
Lys Lys Asn Leu Gly Cys Ser Pro Lys Glu Tyr Leu Thr Tyr Ile Arg
210 215 220
Met Tyr His Ala Ser Gln Leu Leu Ile His Thr Ser Thr Leu Ile Ser
225 230 235 240
Asp Ile Ser Arg Gln Val Gly Tyr Lys Asp Pro Leu Leu Phe Ser Lys
245 250 255
Asn Phe Thr Lys His Phe Glu Ile Ser Ala Ser Glu Tyr Arg His His
260 265 270
Phe Ser Ile Asn Asn Lys Gln
275
<210> 53
<211> 277
<212> PRT
<213> 人工序列
<220>
<223> A0A1D4LKB2
<400> 53
Met Gln Ile Leu Trp Lys Lys Phe Gln Lys Lys Leu Val Asp Ala Asn
1 5 10 15
Leu Ala Glu Cys Gly Ile Glu Ile Gly Ile Pro Asn Val Gly Tyr Asp
20 25 30
Tyr Thr Val Leu Gln Gln Ser Val Leu His Ile Val Thr Asp Gly Glu
35 40 45
Gly Val Phe Lys Tyr Asn Asn Glu Ile Tyr His Leu Lys Lys Gly Asp
50 55 60
Ile Phe Leu Leu Glu Arg Gly Met Ser Val Lys Tyr Met Pro Ser Phe
65 70 75 80
Ser Asn Pro Trp Thr Tyr Tyr Trp Val Gly Ile Asn Gly Lys Gln Leu
85 90 95
Leu Asn Tyr Leu Met Arg Ser Tyr Ile Val Asp Thr His Val Ile Ile
100 105 110
Gly Lys Asp Thr Gln Asp Ile Lys Val Ile Ile Gln Lys Leu Cys Lys
115 120 125
Leu Ala Lys Asp Ile Gln Ser Thr Asn Ser Asn Asp Ile Leu Ile Met
130 135 140
Gln Tyr Leu Tyr Lys Leu Val Tyr Thr Phe Gln Asp Lys Phe Pro Lys
145 150 155 160
Thr Phe Thr Val Pro Leu Asp Ile Val Asn Glu Asp Ile Gln His Ala
165 170 175
Ile Glu Phe Ile Asn Thr His Tyr Gln Asn Gly Ile Thr Ile Thr Asp
180 185 190
Val Thr Asn Ser Val Asn Met Ser Arg Ser Tyr Leu Tyr Lys Leu Phe
195 200 205
Lys Lys His Leu Asn Cys Ser Pro Lys Ser Tyr Leu Thr Tyr Ile Arg
210 215 220
Met Tyr His Ala Ser Gln Leu Leu Ile Asn Ser Asn Leu Leu Val Ser
225 230 235 240
Glu Ile Ser Gln Arg Val Gly Tyr Ser Asp Pro Leu Leu Phe Ser Lys
245 250 255
Asn Phe Thr Lys His Phe Glu Ile Ser Ala Ser Ala Tyr Arg Phe His
260 265 270
Phe Gln Gln Asn Lys
275
<210> 54
<211> 314
<212> PRT
<213> 人工序列
<220>
<223> A0A133QVV5
<400> 54
Met Thr Leu Leu Ser Ile Phe Gln Lys Leu Tyr Asn Phe Val Lys Tyr
1 5 10 15
Thr Cys Tyr Asn Gly Ser Ile Ile Glu Arg Lys Arg Val Arg Gln Val
20 25 30
Gln Val Phe Trp Thr Lys Leu Lys Lys Thr Ser Tyr Glu Ala Gln Val
35 40 45
Asp Glu Cys Gly Lys Glu Asn Leu Tyr Val Gly Asn Gly Tyr Glu Tyr
50 55 60
Glu Val Thr Lys Pro Ala Val Leu His Ile Val Thr Gln Gly Thr Gly
65 70 75 80
Thr Phe Thr Val Asn Asp Thr Thr Tyr His Leu Lys Lys Gly Asp Val
85 90 95
Phe Leu Leu Leu Lys Gly Met His Val Lys Tyr His Ala Thr Gly Glu
100 105 110
Thr Pro Trp His Tyr Met Trp Val Gly Phe Ser Gly Thr His Ala Ile
115 120 125
Ser Phe Ile Thr Arg Thr Ser Leu Ser Asp Glu Phe Val Leu Leu Asn
130 135 140
Gln Asn Thr Glu Thr Leu Phe Lys Leu Ile Phe Lys Ile Cys Ile Leu
145 150 155 160
Ala Asn Ser His Thr Pro Glu Asp Thr His Asp Ile Leu Leu Lys Ile
165 170 175
Arg Leu Phe Glu Leu Leu Tyr Phe Leu Thr Gln Gln Asn Gln Lys Glu
180 185 190
Ile Val Ile Pro Asp Gln Arg Glu Ala Thr Asp Leu Lys Asp Ala Leu
195 200 205
Glu Tyr Phe Asn Asp Asn Phe Lys Ser Lys Asp Thr Thr Val Asp Asn
210 215 220
Ala Ala Gln Val Ala Asn Met Ser Arg Ser Gln Leu Tyr Lys Arg Phe
225 230 235 240
Lys Lys Gln Phe Gly Ala Ser Pro Ser Arg Tyr Leu Thr Asp Leu Arg
245 250 255
Met Ala Phe Ala Ala Glu Gln Leu Lys Phe Thr Asn Lys Thr Val Gln
260 265 270
Ala Ile Ala Asp Glu Leu Asn Tyr Asp Val Ser Leu Ala Phe Ser Lys
275 280 285
Ala Phe Ser Lys Tyr Phe Asn Cys Pro Pro Thr Gln Tyr Arg Lys Asn
290 295 300
Tyr Lys Ala Arg Lys Ala Leu Gln Ser Glu
305 310
<210> 55
<211> 289
<212> PRT
<213> 人工序列
<220>
<223> A9QSR3
<400> 55
Met Glu Tyr Lys Glu Phe His Gln Asn Phe Leu Asp Ile Asn Leu Asp
1 5 10 15
Phe Val Gly Asn Glu Ala Thr Ile Pro Asn Phe Ser Phe Gly Pro Ala
20 25 30
Ile Arg Glu Asn Tyr Val Ile His Tyr Ile Thr Ser Gly Ser Gly Arg
35 40 45
Tyr Met Ile Tyr Gly Phe Glu His Gln Leu Lys Ala Gly Asp Cys Phe
50 55 60
Ile Ile Pro Ala Asp Val Glu Thr Phe Tyr Gln Ser Asp Ala Leu Thr
65 70 75 80
Pro Trp Ala Tyr Tyr Trp Leu Gly Leu Ser Gly His Val Val Asn Asp
85 90 95
Leu Phe Ala Arg Thr Ala Leu Asp Asp Lys Gly Trp Ile Leu Glu Asn
100 105 110
Val Ser Lys Thr Glu Phe Ile Glu His Phe Ser Lys Ile Gln Asn Leu
115 120 125
Ile Ser Asp Asp Asp Lys Thr Val Asp Leu Asp Ile Gln Val Glu Leu
130 135 140
Phe Ala Leu Met Lys Ser Leu Ile Thr Leu Phe Pro Lys Ser Ile Thr
145 150 155 160
Glu His Lys Asn Gln Ser Asp Tyr Tyr Ala Glu Lys Ala Tyr Thr Phe
165 170 175
Ile Asn Gln Asn Tyr Ser Gln Ser Ile Lys Ile Lys Asp Val Leu Ala
180 185 190
His Val Met Ile Ser Arg Ala Tyr Leu Phe Thr Ile Phe Lys His Lys
195 200 205
Tyr Gly Leu Ser Pro Gln Lys Tyr Leu Ile Asp Leu Arg Met Ala Lys
210 215 220
Ala Ala Met Leu Leu Ile His Ser Asp Asn Leu Val Ser Gln Ile Ser
225 230 235 240
Glu Ala Val Gly Phe Ser Asp Ser Leu Ser Phe Ser Ser Ala Phe Lys
245 250 255
Lys Arg Tyr Gly Val Ser Pro Thr Lys Phe Lys Thr Gln Lys His Asp
260 265 270
Asn Leu Met Leu Glu Thr Leu Asn Asn Met Asn Leu Asn Arg Leu Lys
275 280 285
Lys
<210> 56
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A133MUX6 CBD
<400> 56
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Leu Gly Tyr Asn Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr
20 25 30
Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Asn
35 40 45
Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln Val Glu
50 55 60
Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asp
85 90 95
Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile
100 105 110
Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 57
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> B1V7N0 CBD
<400> 57
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Leu Gly Tyr Lys Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr
20 25 30
Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Thr
35 40 45
Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Gln Val Asp
50 55 60
Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn
85 90 95
Ser Cys Val Ala Asn Cys Glu Glu Asn Ser Lys Ile Pro Gln Ile Ile
100 105 110
Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 58
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A127EGD8 CBD
<400> 58
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Leu Gly Tyr Lys Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr
20 25 30
Val Thr Lys Gly Tyr Gly Thr Phe Lys Phe Asn Gly Lys Val Tyr Thr
35 40 45
Leu Lys Gln Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Lys Val Glu
50 55 60
Tyr Val Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Thr Asn
85 90 95
Ser Tyr Val Ala Asn Cys Glu Lys Asn Ser Lys Ile Pro Gln Ile Ile
100 105 110
Leu Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Ser Ser Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 59
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A1C6JUB7 CBD
<400> 59
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Phe Gly Tyr Lys Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr
20 25 30
Ile Ser Lys Gly Asn Gly Thr Phe Lys Phe Asn Asp Lys Val Tyr Asn
35 40 45
Leu Lys Gln Gly Asp Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu
50 55 60
Tyr Ile Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp
85 90 95
Ser Tyr Ala Ala Asn Cys Lys Glu Asp Ser Lys Ile Pro Asp Ile Ile
100 105 110
Ser Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 60
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A174HYB7 CBD
<400> 60
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Phe Gly Tyr Lys Tyr Glu Val Leu Lys Asn Ala Val Ile His Tyr
20 25 30
Ile Ser Lys Gly Asn Gly Thr Phe Lys Phe Asn Asp Lys Val Tyr Asn
35 40 45
Leu Lys Gln Gly Asp Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu
50 55 60
Tyr Ile Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp
85 90 95
Ser Tyr Ala Ala Lys Cys Lys Gly Asp Ser Lys Ile Pro Asp Ile Ile
100 105 110
Ser Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Arg Ser Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 61
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A1C6KY47 CBD
<400> 61
Asn Phe Glu Met Asn Val Asp Glu Cys Gly Ile Glu Gln Gly Ile Pro
1 5 10 15
Gly Phe Gly Tyr Lys Tyr Glu Val Leu Lys Asn Ser Val Ile His Tyr
20 25 30
Ile Thr Lys Gly His Gly Thr Phe Lys Ile Asn Asp Lys Leu Tyr Asn
35 40 45
Leu Gly Gln Gly Asp Val Phe Ile Leu Leu Lys Gly Met Lys Val Glu
50 55 60
Tyr Met Ala Ser Ile Asp Asp Pro Trp Glu Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Asn Ala Asn Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp
85 90 95
Ser Tyr Ala Ala Thr Cys Lys Glu Asp Ser Lys Ile Pro Cys Ile Ile
100 105 110
Ser Asn Met Cys Glu Ile Ser Lys Thr Tyr Asn Pro Ser Cys Cys Asp
115 120 125
Asp Ile Leu Leu Leu Lys Glu Leu Tyr Ser Leu
130 135
<210> 62
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A174LZQ7 CBD
<400> 62
Asn Phe Asp Ile Asn Leu Asp Glu Cys Gly Ile Glu His Gly Ile Pro
1 5 10 15
Gly Phe Gly Tyr Arg Tyr Lys Val Leu Lys Asn Ser Val Ile His Tyr
20 25 30
Val Ile Arg Gly Tyr Gly Thr Phe Lys Val Asn Asp Lys Val Tyr Asn
35 40 45
Leu Lys Glu Gly Asp Ile Phe Ile Leu Leu Lys Gly Met Asp Val Glu
50 55 60
Tyr Met Ala Ser Met Asp Asn Pro Trp Glu Tyr Cys Trp Ile Gly Phe
65 70 75 80
Ser Gly Ser Lys Ala Asp Glu Tyr Leu Asn Arg Thr Ser Ile Ile Asp
85 90 95
Ser His Val Ala Asn Cys Asn Glu Asn Ser Lys Ile Pro Cys Ile Ile
100 105 110
Leu Asn Ile Cys Glu Ile Ser Lys Asn Tyr Asn Pro Ser Asn Ser Asp
115 120 125
Asp Ile Leu Leu Leu Asn Glu Leu Tyr Ser Leu
130 135
<210> 63
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> N9YR91 CBD
<400> 63
Asn Phe Asp Ser Asn Leu Asp Glu Cys Gly Ile Glu Gln Gly Thr Pro
1 5 10 15
Gly Thr Gly Tyr Lys Tyr Glu Val Val Lys Asn Ala Val Ile His Tyr
20 25 30
Ile Ser Lys Gly Ser Gly Ile Phe Lys Ile Asn Asp Lys Ile Tyr Asn
35 40 45
Leu Lys Arg Gly Asp Gly Phe Ile Leu Leu Lys Gly Met His Val Glu
50 55 60
Tyr Ile Ser Ser Ile Asp Asp Pro Trp Lys Tyr Tyr Trp Val Gly Phe
65 70 75 80
Ser Gly Lys Asn Ala Asn Glu Tyr Leu Lys Arg Thr Ser Ile Ile Asp
85 90 95
Thr Cys Ile Ile Asn Phe Ser Lys Lys Ser Lys Val Pro Asn Thr Ile
100 105 110
Ile Asp Met Cys Asn Ile Ser Lys Lys Tyr Asn Gln Thr Ser Ser Asp
115 120 125
Asp Ile Leu Leu Leu Ser Lys Leu His Leu Leu
130 135
<210> 64
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A174I591 CBD
<400> 64
Asn Phe Glu Ala Asn Leu Asp Glu Cys Gly Ile Glu Gln Gly Thr Pro
1 5 10 15
Gly Ala Gly Tyr Asn Tyr Lys Val Glu Lys Asn Ala Val Ile His Tyr
20 25 30
Ile Ser Lys Gly Ser Gly Thr Phe Lys Ile Asn Asp Lys Ile Tyr Thr
35 40 45
Leu Lys Lys Gly Asp Gly Phe Ile Leu Leu Lys Asp Met Asn Val Glu
50 55 60
Tyr Ile Pro Ser Ile Asp Asp Pro Trp Lys Tyr Tyr Trp Ile Gly Phe
65 70 75 80
Ser Gly Gln Ser Leu Asn Glu Tyr Leu Lys Arg Thr Ser Ile Ile Asp
85 90 95
Ser Cys Val Ile Asn Phe Ser Lys Lys Ser Lys Ile Pro Asn Leu Ile
100 105 110
Ile Asp Met Cys Asn Ile Ser Lys Lys Tyr Asp Gln Thr Ser Ser Asp
115 120 125
Asp Ile Leu Leu Leu Ser Lys Leu His Leu Leu
130 135
<210> 65
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A2A7ME67 CBD
<400> 65
Asn Phe Glu Met Asn Leu Asp Glu Cys Gly Ile Glu Gln Cys Thr Pro
1 5 10 15
Gly Ile Lys Tyr Asn Tyr Glu Val Val Lys Asn Ser Val Ile His Tyr
20 25 30
Ile Ser Glu Gly Glu Gly Thr Phe Lys Ile Asn Asn Gln Ile Phe Asp
35 40 45
Leu Lys Lys Gly Asp Gly Phe Ile Leu Phe Lys Gly Met Asn Val Glu
50 55 60
Tyr Thr Ala Ser Ile Asp Asn Pro Trp Lys Tyr Tyr Trp Val Gly Phe
65 70 75 80
Ser Gly Thr Asn Ala Asn Glu Tyr Leu His Arg Ser Ser Ile Phe Asp
85 90 95
Asn Tyr Ile Ile Asn Tyr Gln Ser Asn Ser Lys Ile Pro Ser Ile Ile
100 105 110
Lys Asn Met Cys Ala Leu Ser Lys Thr Tyr Asp Gln Asn Ser Ser Asp
115 120 125
Asp Ile Leu Leu Leu Asn Lys Leu Tyr Tyr Leu
130 135
<210> 66
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A2K4AZL9 CBD
<400> 66
Gln Phe Glu Ala Asn Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro
1 5 10 15
Gln Gly Gly Tyr Gln Tyr Glu Val Thr Lys Pro Ala Val Leu His Val
20 25 30
Val Met Ser Gly Thr Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr
35 40 45
Leu Lys Pro Gly Asp Leu Phe Leu Leu Cys Arg Gly Met Lys Val His
50 55 60
Tyr Glu Ser Thr Leu Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe
65 70 75 80
Ser Gly Lys Leu Ala Met Asp Tyr Leu Asn Arg Thr Thr Leu Tyr Glu
85 90 95
Thr Arg Val Ile Gln Asn Gln Gln Thr Ser Thr Ile Arg Gln Ile Ile
100 105 110
Tyr Gln Met Cys His Arg Ser Ile Asp Tyr Asn Pro Glu His Ser Asp
115 120 125
Asp Ile Gln His Met Arg Asp Leu Tyr Asp Leu
130 135
<210> 67
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A166PPM9 CBD
<400> 67
Gln Phe Glu Ala Asn Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro
1 5 10 15
His Gly Gly Tyr Gln Tyr Glu Val Thr Lys Pro Ala Val Leu His Ile
20 25 30
Val Met Ser Gly Thr Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr
35 40 45
Leu Lys Pro Gly Asp Leu Phe Leu Leu Cys Arg Gly Met Asn Val His
50 55 60
Tyr Glu Ser Thr Leu Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe
65 70 75 80
Ser Gly Lys Leu Val Phe Asp Tyr Leu Asn Arg Thr Ser Leu Tyr Glu
85 90 95
Thr Arg Val Ile Gln Asn Gln Pro Thr Asn Thr Ile Arg Gln Ile Ile
100 105 110
Tyr Arg Met Cys Gln Arg Ser Ile Glu Tyr Ala Thr Glu Asn Ser Asp
115 120 125
Asp Ile Gln His Met Arg Asp Leu Tyr Glu Leu
130 135
<210> 68
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A2T4R7G1 CBD
<400> 68
His Phe Glu Ala Asn Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro
1 5 10 15
Asn Val Ser Tyr Gln Tyr Thr Val Val Lys Pro Ala Val Leu His Ile
20 25 30
Ile Val Ala Gly Thr Gly Ser Phe Thr Tyr Gln Gln Ser Thr Tyr Gln
35 40 45
Leu Lys Ser Gly Asp Met Phe Leu Leu Gln Glu Gly Met His Val His
50 55 60
Tyr Glu Ala Ser Ala Asp Asp Pro Trp Thr Tyr His Trp Val Gly Phe
65 70 75 80
Ser Gly Asn Leu Ala Ile Asp Tyr Leu Lys Arg Thr Ser Leu Ile Asp
85 90 95
Cys Pro Val Val Met Asn Lys Asp Thr Ser Asp Ile Ser Lys Val Met
100 105 110
Tyr Gln Ile Cys Glu Arg Ala Ile Thr Tyr Glu Thr Ala Thr Ser Asp
115 120 125
Asp Ile His His Leu Ser Asp Leu Tyr Lys Leu
130 135
<210> 69
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A2A4HCU9 CBD
<400> 69
Gln Phe Glu Ala Asn Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro
1 5 10 15
Gln Arg Gly Tyr Gln Tyr Glu Val Thr Lys Pro Ala Val Leu His Val
20 25 30
Val Met Ser Gly Thr Gly Thr Leu Thr Tyr Asn Gln Lys Lys Tyr Thr
35 40 45
Leu Lys Pro Gly Asp Leu Phe Leu Leu Cys Arg Gly Met Asn Val His
50 55 60
Tyr Glu Ser Thr Leu Asp Glu Pro Trp Thr Tyr Tyr Trp Val Gly Phe
65 70 75 80
Ser Gly Lys Leu Val Phe Asp Tyr Leu Asn Arg Thr Ser Leu Tyr Glu
85 90 95
Thr Arg Val Ile Gln Asn Gln Pro Thr Asn Ala Ile Arg Gln Ile Ile
100 105 110
Tyr Arg Met Cys His Arg Ser Ile Glu Tyr Ala Thr Glu Asn Ser Asp
115 120 125
Asp Ile Gln His Met Arg Asp Leu Tyr Glu Leu
130 135
<210> 70
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A2T4MS83 CBD
<400> 70
His Phe Glu Ala Asn Ile Asp Glu Cys Gly Ile Glu Ile Gly Thr Pro
1 5 10 15
Asn Val Ser Tyr Gln Tyr Thr Val Val Lys Pro Ala Val Leu His Ile
20 25 30
Ile Met Ser Gly Thr Gly Thr Phe Thr His Gln His Thr Ser Tyr Glu
35 40 45
Leu Lys Ala Gly Asp Met Phe Leu Leu Arg Glu Gly Met Arg Val His
50 55 60
Tyr Glu Ala Ser Thr Asp Asp Pro Trp Thr Tyr His Trp Val Gly Phe
65 70 75 80
Ser Gly Asn Leu Ala Met Asp Tyr Leu Lys Arg Thr Thr Leu Ile Asp
85 90 95
Cys Pro Val Val Leu Asn Gln Asp Thr Ser Lys Leu Ser Lys Leu Met
100 105 110
Tyr Gln Ile Cys Glu Arg Ala Ile Thr Tyr Glu Thr Thr Ala Ser Asp
115 120 125
Asp Ile His His Leu Ser Asp Leu Tyr Lys Leu
130 135
<210> 71
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> O33813 CBD
<400> 71
Leu Ile Asp Ala Asn Leu Ala Glu Cys Gly Ile Glu Ile Gly Val Pro
1 5 10 15
Asn Val Gly Tyr Asn Tyr Thr Val Phe Gln Lys Ser Val Leu His Ile
20 25 30
Val Thr Gln Gly Glu Gly Thr Phe Ser Tyr Ala Gly Glu Thr Tyr His
35 40 45
Leu Thr Ala Gly Asp Ile Phe Leu Leu Glu Arg Gly Met Glu Val Glu
50 55 60
Tyr Lys Pro Ser Phe Ser Asn Pro Trp Thr Tyr Tyr Trp Val Gly Met
65 70 75 80
Asn Gly Lys Gln Ile Leu Asn Tyr Leu Ser Arg Cys Ser Ile Val Asp
85 90 95
Ser His Val Ile Leu Gly Gln Asp Thr Thr Asp Ile Lys Asn Ile Ile
100 105 110
Gln Leu Ile Cys Lys Leu Ser Gln Ser Ile Glu Ser Asn Asn Ser Asn
115 120 125
Asp Ile Leu Ile Met Gln Tyr Leu Tyr Gln Leu
130 135
<210> 72
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A1D4LKB2 CBD
<400> 72
Leu Val Asp Ala Asn Leu Ala Glu Cys Gly Ile Glu Ile Gly Ile Pro
1 5 10 15
Asn Val Gly Tyr Asp Tyr Thr Val Leu Gln Gln Ser Val Leu His Ile
20 25 30
Val Thr Asp Gly Glu Gly Val Phe Lys Tyr Asn Asn Glu Ile Tyr His
35 40 45
Leu Lys Lys Gly Asp Ile Phe Leu Leu Glu Arg Gly Met Ser Val Lys
50 55 60
Tyr Met Pro Ser Phe Ser Asn Pro Trp Thr Tyr Tyr Trp Val Gly Ile
65 70 75 80
Asn Gly Lys Gln Leu Leu Asn Tyr Leu Met Arg Ser Tyr Ile Val Asp
85 90 95
Thr His Val Ile Ile Gly Lys Asp Thr Gln Asp Ile Lys Val Ile Ile
100 105 110
Gln Lys Leu Cys Lys Leu Ala Lys Asp Ile Gln Ser Thr Asn Ser Asn
115 120 125
Asp Ile Leu Ile Met Gln Tyr Leu Tyr Lys Leu
130 135
<210> 73
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A0A133QVV5 CBD
<400> 73
Asn Phe Val Lys Tyr Thr Cys Tyr Asn Gly Ser Ile Ile Glu Arg Lys
1 5 10 15
Arg Val Arg Gln Val Gln Val Phe Trp Thr Lys Leu Lys Lys Thr Ser
20 25 30
Tyr Glu Ala Gln Val Asp Glu Cys Gly Lys Glu Asn Leu Tyr Val Gly
35 40 45
Asn Gly Tyr Glu Tyr Glu Val Thr Lys Pro Ala Val Leu His Ile Val
50 55 60
Thr Gln Gly Thr Gly Thr Phe Thr Val Asn Asp Thr Thr Tyr His Leu
65 70 75 80
Lys Lys Gly Asp Val Phe Leu Leu Leu Lys Gly Met His Val Lys Tyr
85 90 95
His Ala Thr Gly Glu Thr Pro Trp His Tyr Met Trp Val Gly Phe Ser
100 105 110
Gly Thr His Ala Ile Ser Phe Ile Thr Arg Thr Ser Leu Ser Asp Glu
115 120 125
Phe Val Leu Leu Asn Gln Asn Thr Glu Thr Leu
130 135
<210> 74
<211> 139
<212> PRT
<213> 人工序列
<220>
<223> A9QSR3
<400> 74
Asp Ile Asn Leu Asp Phe Val Gly Asn Glu Ala Thr Ile Pro Asn Phe
1 5 10 15
Ser Phe Gly Pro Ala Ile Arg Glu Asn Tyr Val Ile His Tyr Ile Thr
20 25 30
Ser Gly Ser Gly Arg Tyr Met Ile Tyr Gly Phe Glu His Gln Leu Lys
35 40 45
Ala Gly Asp Cys Phe Ile Ile Pro Ala Asp Val Glu Thr Phe Tyr Gln
50 55 60
Ser Asp Ala Leu Thr Pro Trp Ala Tyr Tyr Trp Leu Gly Leu Ser Gly
65 70 75 80
His Val Val Asn Asp Leu Phe Ala Arg Thr Ala Leu Asp Asp Lys Gly
85 90 95
Trp Ile Leu Glu Asn Val Ser Lys Thr Glu Phe Ile Glu His Phe Ser
100 105 110
Lys Ile Gln Asn Leu Ile Ser Asp Asp Asp Lys Thr Val Asp Leu Asp
115 120 125
Ile Gln Val Glu Leu Phe Ala Leu Met Lys Ser
130 135

Claims (47)

1.一种用于检测碳水化合物的传感器分子,传感器包括:
i)螺旋-转角-螺旋转录因子的碳水化合物结合结构域,或所述碳水化合物结合结构域的变体;
ii)化学发光供体结构域;以及
iii)受体结构域;
其中当所述碳水化合物结合至所述碳水化合物结合结构域时,所述化学发光供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
2.根据权利要求1所述的传感器分子,其中所述螺旋-转角-螺旋转录因子是细菌螺旋-转角-螺旋转录因子或其变体。
3.根据权利要求1或2所述的传感器分子,其中所述细菌螺旋-转角-螺旋转录因子是GNTR转录因子或其变体。
4.根据权利要求1至3中任一项所述的传感器分子,其中所述细菌螺旋-转角-螺旋转录因子或其变体具有与SEQ ID NO 9和56-74中任一个或多个中提供的氨基酸序列至少30%相同的氨基酸序列。
5.根据权利要求1至4中任一项所述的传感器分子,其中所述碳水化合物是糖或糖衍生物。
6.根据权利要求5所述的传感器分子,其中所述糖是二糖。
7.根据权利要求6所述的传感器分子,其中所述二糖是乳糖。
8.根据权利要求5所述的传感器分子,其中所述糖衍生物选自由以下组成的组:氨基糖、酸性糖、脱氧糖、糖醇、葡基胺和磷酸糖。
9.根据权利要求1-8中任一项所述的传感器分子,其中所述化学发光供体结构域是生物发光蛋白。
10.根据权利要求9所述的传感器分子,其中所述生物发光蛋白是荧光素酶、β-半乳糖苷酶、内酰胺酶、辣根过氧化物酶、碱性磷酸酶、β-葡糖醛酸糖苷酶或β-葡糖苷酶。
11.根据权利要求10所述的传感器分子,其中所述萤光素酶是海肾(Renilla)萤光素酶、萤火虫萤光素酶、腔肠动物(Coelenterate)萤光素酶、北美萤火虫(North Americanglow worm)萤光素酶、叩头虫(click beetle)萤光素酶、铁路蠕虫(railroad worm)萤光素酶、细菌萤光素酶、Gaussia萤光素酶、水母(Aequorin)发光蛋白、蕈蚊(Arachnocampa)萤光素酶、深海虾(Oplophorus gracilirostris)萤光素酶或其任何一种的生物活性变体或片段,或其两种或更多种的嵌合体。
12.根据权利要求1-11中任一项所述的传感器分子,其中所述化学发光供体结构域能够修饰底物。
13.根据权利要求12所述的传感器分子,其中所述底物是荧光素、钙、腔肠素、furimazine,或腔肠素、荧光素或furimazine的衍生物、类似物或稳定衍生物。
14.根据权利要求1至13中任一项所述的传感器分子,其中所述受体结构域是荧光受体结构域。
15.根据权利要求14所述的传感器分子,其中所述荧光受体结构域选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白、和其任何一个的生物活性变体或片段。
16.根据权利要求1至15中任一项所述的传感器分子,其中在存在和/或不存在碳水化合物的情况下,所述化学发光供体结构域和所述受体结构域的分离和相对取向在费尔斯特
Figure FDA0002432636110000021
距离的±50%之内。
17.根据权利要求16所述的传感器分子,其中,所述化学发光供体结构域和所述受体结构域的费尔斯特距离至少为5.6nm。
18.根据权利要求17所述的传感器分子,其中,所述化学发光供体结构域和所述受体结构域的费尔斯特距离为约5.6nm至约10nm。
19.根据权利要求1-18中任一项所述的传感器分子,其是单个多肽。
20.根据权利要求19所述的传感器分子,其中所述化学发光供体结构域在N-末端,且所述受体结构域在C-末端。
21.根据权利要求19所述的传感器分子,其中所述受体结构域在N-末端,且所述化学发光供体结构域在C-末端。
22.根据权利要求19-21中任一项所述的传感器分子,其包含至少一个肽接头。
23.一种检测样品中碳水化合物的方法,所述方法包括:
i)使样品与根据权利要求1至22中任一项所述的传感器分子接触;以及
ii)确定所述化学发光供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向在所述样品存在下是否已经改变,
其中所述化学发光供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向的改变表明所述样品中存在所述碳水化合物。
24.根据权利要求23所述的方法,其还包括测定所述样品中的所述碳水化合物的浓度。
25.根据权利要求23或24所述的方法,其在微流体装置上进行。
26.根据权利要求23至25中任一项所述的方法,其中所述样品是空气、液体、生物材料或土壤。
27.根据权利要求23-26中任一项所述的方法,其中所述样品包含乳制品。
28.根据权利要求27所述的方法,其中所述样品是乳品。
29.一种编码根据权利要求19-22中任一项所述的传感器分子的多核苷酸。
30.一种包含根据权利要求29所述的多核苷酸的载体。
31.一种包含根据权利要求29所述的多核苷酸和/或根据权利要求30所述的载体的宿主细胞。
32.一种生产传感器分子的工艺,所述工艺包括在允许编码多肽的所述多核苷酸表达的条件下培养根据权利要求31所述的宿主细胞或根据权利要求30所述的载体,并回收所述表达的多肽。
33.一种用于检测乳糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳糖结合至所述转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
34.一种用于检测乳果糖的传感器分子,其包含共价连接至共振能量转移供体结构域和共振能量转移受体结构域的细菌BgaR转录因子或其变体,其中当乳果糖结合至所述转录因子时,所述供体结构域相对于所述受体结构域的空间位置和/或偶极取向改变。
35.根据权利要求33或权利要求34所述的传感器分子,其中所述转录因子或其变体具有与SEQ ID NO:1中提供的氨基酸序列至少60%、70%、80%、85%、90%、95%、98%或99%相同的氨基酸序列。
36.根据权利要求33-35中任一项所述的传感器分子,其中所述共振能量转移供体结构域是荧光蛋白。
37.根据权利要求36所述的传感器分子,其中所述荧光蛋白选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。
38.根据权利要求33至37中任一项所述的传感器分子,其中所述共振能量转移受体结构域是荧光蛋白。
39.根据权利要求38所述的传感器分子,其中所述荧光蛋白选自由以下组成的组:绿色荧光蛋白(GFP)、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强的GFP(EGFP)、增强的CFP(ECFP)、增强的YFP(EYFP)、GFPS65T、Emerald、Venus、mOrange、Topaz、GFPuv、去稳定EGFP(dEGFP)、去稳定ECFP(dECFP)、去稳定EYFP(dEYFP)、Hc红(HcRed)、t-Hc红(t-HcRed)、Ds红(DsRed)、Ds红2(DsRed2)、t-二聚体2、t二聚体2(12)、mRFP1、杯型珊瑚色(pocilloporin)、海肾GFP(Renilla GFP)、Monster GFP、paGFP、Kaede蛋白、tdTomato、mCherry、TagRFP、TurBoFB和藻胆蛋白,和其任何一个的生物活性变体或片段。
40.根据权利要求33-39中任一项所述的传感器分子,其中所述供体结构域是CFP或其变体,并且所述受体结构域是YFP或其变体。
41.根据权利要求40所述的传感器分子,其与SEQ ID NO:23提供的多肽具有至少60%、70%、80%、85%、90%、95%、98%、99%或100%的序列一致性。
42.一种检测样品中乳糖的方法,所述方法包括:
i)使样品与根据权利要求33和35至41中任一项所述的传感器分子接触;以及
ii)确定所述供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向在所述样品存在下是否已经改变,
其中所述化学发光供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向的改变表明所述样品中存在乳糖。
43.根据权利要求42所述的方法,其还包括测定所述样品中的乳糖的浓度。
44.一种检测样品中乳果糖的方法,所述方法包括:
i)使样品与根据权利要求34至41中任一项所述的传感器分子接触;以及
ii)确定所述发光供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向在所述样品存在下是否已经改变,
其中所述化学发光供体结构域相对于所述受体结构域的所述空间位置和/或偶极取向的改变表明所述样品中存在乳果糖。
45.根据权利要求44所述的方法,其还包括测定所述样品中的乳果糖的浓度。
46.根据权利要求42-45中任一项所述的方法,其在微流体装置上进行。
47.根据权利要求42-46中任一项所述的方法,其中所述样品包括乳制品。
CN201880063917.2A 2017-08-08 2018-08-07 碳水化合物传感器 Active CN111164426B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2017903148A AU2017903148A0 (en) 2017-08-08 Carbohydrate sensors
AU2017903148 2017-08-08
PCT/AU2018/050824 WO2019028504A1 (en) 2017-08-08 2018-08-07 CARBON HYDRATES SENSORS

Publications (2)

Publication Number Publication Date
CN111164426A true CN111164426A (zh) 2020-05-15
CN111164426B CN111164426B (zh) 2023-12-08

Family

ID=65273001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880063917.2A Active CN111164426B (zh) 2017-08-08 2018-08-07 碳水化合物传感器

Country Status (13)

Country Link
US (1) US11662349B2 (zh)
EP (1) EP3665481B1 (zh)
JP (1) JP7246372B2 (zh)
KR (1) KR102660777B1 (zh)
CN (1) CN111164426B (zh)
AR (1) AR112932A1 (zh)
AU (1) AU2018315053B2 (zh)
CA (1) CA3071994A1 (zh)
IL (1) IL272468A (zh)
PL (1) PL3665481T3 (zh)
SG (1) SG11202001121WA (zh)
WO (1) WO2019028504A1 (zh)
ZA (1) ZA202001115B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116083465A (zh) * 2023-01-03 2023-05-09 态创生物科技(广州)有限公司 乳糖负传感质粒及负反馈乳糖生物传感器

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013204332B2 (en) 2012-04-16 2015-07-16 Commonwealth Scientific And Industrial Research Organisation Methods and systems for detecting an analyte or classifying a sample
US11952612B2 (en) 2016-11-14 2024-04-09 Commonwealth Scientific And Industrial Research Organisation Protease sensor molecules
US11662349B2 (en) 2017-08-08 2023-05-30 Commonwealth Scientific And Industrial Research Organisation Carbohydrate sensors
KR20210072040A (ko) * 2018-10-03 2021-06-16 프로메가 코포레이션 코엘렌테라진 및 이의 유사체 및 유도체를 안정화하기 위한 조성물 및 방법
WO2024082024A1 (en) * 2022-10-21 2024-04-25 PPB Technology Pty Ltd Method of detecting an analyte in a sample

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060078888A1 (en) * 2004-10-08 2006-04-13 Medical Research Council Harvard University In vitro evolution in microfluidic systems
WO2007059297A2 (en) * 2005-11-16 2007-05-24 Carnegie Institution Of Washington Multimeric biosensors and methods of using the same
WO2010138794A2 (en) * 2009-05-29 2010-12-02 The University Of North Carolina At Chapel Hill Regulation of sodium channels by plunc proteins
US20120064587A1 (en) * 2010-09-10 2012-03-15 University Of Delaware Recombinant clostridia that fix co2 and co and uses thereof
WO2017087912A2 (en) * 2015-11-20 2017-05-26 Duke University Ratiometric biosensors and non-geometrically modulated fret

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2191110B (en) 1986-06-06 1989-12-06 Plessey Co Plc Chromatographic separation device
US4908112A (en) 1988-06-16 1990-03-13 E. I. Du Pont De Nemours & Co. Silicon semiconductor wafer for analyzing micronic biological samples
US5196524A (en) 1989-01-06 1993-03-23 Eli Lilly And Company Fusion reporter gene for bacterial luciferase
US5126022A (en) 1990-02-28 1992-06-30 Soane Tecnologies, Inc. Method and device for moving molecules by the application of a plurality of electrical fields
US5750015A (en) 1990-02-28 1998-05-12 Soane Biosciences Method and device for moving molecules by the application of a plurality of electrical fields
US5219737A (en) 1990-03-27 1993-06-15 Kikkoman Corporation Mutant luciferase of a firefly, mutant luciferase genes, recombinant dnas containing the genes and a method of producing mutant luciferase
US5229285A (en) 1991-06-27 1993-07-20 Kikkoman Corporation Thermostable luciferase of firefly, thermostable luciferase gene of firefly, novel recombinant dna, and process for the preparation of thermostable luciferase of firefly
US5580523A (en) 1994-04-01 1996-12-03 Bard; Allen J. Integrated chemical synthesizers
JP3466765B2 (ja) 1994-07-27 2003-11-17 キッコーマン株式会社 ビオチン化ホタルルシフェラーゼ、ビオチン化ホタルルシフェラーゼ遺伝子、新規な組み換え体dna、ビオチン化ホタルルシフェラーゼの製造法及び生物発光分析法
US6001229A (en) 1994-08-01 1999-12-14 Lockheed Martin Energy Systems, Inc. Apparatus and method for performing microfluidic manipulations for chemical analysis
US5571410A (en) 1994-10-19 1996-11-05 Hewlett Packard Company Fully integrated miniaturized planar liquid sample handling and analysis device
US5670356A (en) 1994-12-12 1997-09-23 Promega Corporation Modified luciferase
US6228604B1 (en) 1996-04-10 2001-05-08 Loma Linda University Secreted renilla luciferase
US5885470A (en) 1997-04-14 1999-03-23 Caliper Technologies Corporation Controlled fluid transport in microfabricated polymeric substrates
AU765703B2 (en) 1998-03-27 2003-09-25 Bruce J. Bryan Luciferases, fluorescent proteins, nucleic acids encoding the luciferases and fluorescent proteins and the use thereof in diagnostics, high throughput screening and novelty items
ES2329850T3 (es) * 1998-07-17 2009-12-01 University Of Maryland, Baltimore Proteinas manipuladas para la deteccion de analitos.
GB9823468D0 (en) 1998-10-28 1998-12-23 Secr Defence Novel enzyme
DE60031540T2 (de) 1999-06-28 2007-05-16 California Institute Of Technology, Pasadena Mikromechanische pump- und ventilsysteme
WO2001046691A1 (en) 1999-12-22 2001-06-28 Biosignal Packard Inc. A bioluminescence resonance energy transfer (bret) system with broad spectral resolution between donor and acceptor emission wavelengths and its use
US20040214227A1 (en) 1999-12-22 2004-10-28 Erik Joly Bioluminescence resonance energy transfer (bret) fusion molecule and method of use
CA2412071A1 (en) 2000-05-03 2002-02-07 Expressive Constructs, Inc. A device for detecting bacterial contamination and method of use
US20030049799A1 (en) * 2000-10-23 2003-03-13 Schwartz John Jacob Engineered stimulus-responsive switches
US6949377B2 (en) 2001-03-05 2005-09-27 Ho Winston Z Chemiluminescence-based microfluidic biochip
WO2003015923A1 (en) 2001-08-20 2003-02-27 Biomicro Systems, Inc. Fluid mixing in low aspect ratio chambers
US7338760B2 (en) 2001-10-26 2008-03-04 Ntu Ventures Private Limited Sample preparation integrated chip
AU2003222253A1 (en) 2002-03-05 2003-09-22 Monogram Biosciences, Inc. Multiplex analysis using membrane-bound sensitizers
DK1413584T3 (da) 2002-10-21 2005-07-04 Axxam S R L Fotoprotein med forbedret bioluminescens
US7262859B2 (en) 2004-10-13 2007-08-28 U.S. Genomics, Inc. Systems and methods for measurement optimization
US8530633B2 (en) 2004-10-14 2013-09-10 Carnegie Institution Of Washington Development of sensitive FRET sensors and methods of using the same
WO2006105616A1 (en) 2005-04-08 2006-10-12 Commonwealth Scientific And Industrial Research Organisation Method for microfluidic mixing and mixing device
NZ565938A (en) 2005-08-19 2011-10-28 Commw Scient Ind Res Org Arachnocampa (Diptera) ATP-dependent luciferases
EP1938101A2 (en) 2005-09-13 2008-07-02 Fluidigm Corporation Microfluidic assay devices and methods
WO2007092909A2 (en) 2006-02-07 2007-08-16 Expressive Constructs, Inc. Molecular interaction sensors
DE102007002580A1 (de) 2007-01-11 2008-07-17 C-Lecta Gmbh Proteolytische Abspaltung von Protein-Tags in der rekombinanten Protein-Herstellung
US9034402B2 (en) 2007-04-16 2015-05-19 Solae, Llc Protein hydrolysate compositions having improved sensory characteristics and physical properties
WO2009020479A2 (en) 2007-04-27 2009-02-12 The Regents Of The University Of California Device and methods for detection of airborne agents
WO2009018467A2 (en) 2007-07-31 2009-02-05 Massachusetts Institute Of Technology Bio-sensing nanodevice
EP2205357B1 (en) 2007-10-02 2020-07-15 Abbott Rapid Diagnostics International Unlimited Company Assay device and method
WO2010052939A1 (ja) 2008-11-10 2010-05-14 国立大学法人名古屋大学 アレルゲンのエピトープ又はその候補の検出方法及びその利用
US8268977B2 (en) 2008-11-20 2012-09-18 The Board Of Trustees Of The Leland Stanford Junior University Strongly quenching oligomeric excimer/quencher pairs for detection schemes
EP2382470B1 (en) 2009-01-29 2014-12-10 Commonwealth Scientific and Industrial Research Organisation Measuring g protein coupled receptor activation
EP2221606A3 (en) 2009-02-11 2012-06-06 Samsung Electronics Co., Ltd. Integrated bio-chip and method of fabricating the integrated bio-chip
JP2011038922A (ja) 2009-08-12 2011-02-24 Sony Corp 光検出用チップおよび該光検出用チップを用いた光検出装置
US8524457B2 (en) 2009-09-22 2013-09-03 William Patterson Method for the selection of specific affinity binders by homogeneous noncompetitive assay
EP2526427A4 (en) 2010-01-19 2013-07-24 Harvard College DEVICE AND METHOD FOR FAST DIAGNOSIS OF DISEASES
US8828678B2 (en) 2010-11-16 2014-09-09 Enzo Life Sciences, Inc. Self-immolative probes for enzyme activity detection
US8951736B2 (en) 2011-04-29 2015-02-10 Sequenom, Inc. Multimer glycosylated nucleic acid binding protein conjugates and uses thereof
AU2013204332B2 (en) 2012-04-16 2015-07-16 Commonwealth Scientific And Industrial Research Organisation Methods and systems for detecting an analyte or classifying a sample
CA2890360C (en) 2012-07-02 2020-03-31 Dead Sea Works Ltd. Submerged plate forward osmosis systems
US9193990B2 (en) 2013-03-15 2015-11-24 Richard B. Thompson Bioluminescent metal ion assay
JP6040846B2 (ja) 2013-04-08 2016-12-07 Jnc株式会社 セレンテラジン類縁体
WO2014207515A1 (en) 2013-06-25 2014-12-31 Tubitak (Turkiye Bilimsel Ve Teknolojik Arastirma Kurumu) Fluorescence method for detecting nuclease activity
AU2013394649B2 (en) 2013-07-18 2020-07-16 Ecole Polytechnique Federale De Lausanne (Epfl) Means and methods for bioluminescence resonance energy transfer (BRET) analysis in a biological sample
AU2015241380B2 (en) 2014-04-03 2020-11-26 AllerGenis LLC Peptides, reagents and methods for detecting food allergy
US9610358B2 (en) 2014-04-17 2017-04-04 Marker Gene Technologies, Inc Targeted pharmacological chaperones
EP3259365B1 (en) 2015-02-16 2020-04-01 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Sensors, methods and kits for detecting nicotinamide adenine dinucleotides
US11662349B2 (en) 2017-08-08 2023-05-30 Commonwealth Scientific And Industrial Research Organisation Carbohydrate sensors
EP3673076A4 (en) 2017-08-24 2021-05-26 Commonwealth Scientific and Industrial Research Organisation BRET SENSOR MOLECULES FOR DETECTION OF HYDROLASES

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060078888A1 (en) * 2004-10-08 2006-04-13 Medical Research Council Harvard University In vitro evolution in microfluidic systems
WO2007059297A2 (en) * 2005-11-16 2007-05-24 Carnegie Institution Of Washington Multimeric biosensors and methods of using the same
JP2009520462A (ja) * 2005-11-16 2009-05-28 カーネギー インスチチューション オブ ワシントン 多量体バイオセンサーおよびそれを用いる方法
WO2010138794A2 (en) * 2009-05-29 2010-12-02 The University Of North Carolina At Chapel Hill Regulation of sodium channels by plunc proteins
US20120064587A1 (en) * 2010-09-10 2012-03-15 University Of Delaware Recombinant clostridia that fix co2 and co and uses thereof
WO2017087912A2 (en) * 2015-11-20 2017-05-26 Duke University Ratiometric biosensors and non-geometrically modulated fret

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANDREA H HARTMAN 等: "Construction and characterization of a lactose-inducible promoter system for controlled gene expression in Clostridium perfringens", pages 475 *
LE NC 等: "Real-time, continuous detection of maltose using bioluminescence resonance energy transfer (BRET) on a microfluidic system", pages 177 *
SAN MARTÍN A 等: "A Genetically Encoded FRET Lactate Sensor and Its Use To Detect the Warburg Effect in Single Cancer Cells", pages 2 *
WU J 等: "Design and application of a lactulose biosensor", pages 2 - 3 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116083465A (zh) * 2023-01-03 2023-05-09 态创生物科技(广州)有限公司 乳糖负传感质粒及负反馈乳糖生物传感器
CN116083465B (zh) * 2023-01-03 2024-01-05 态创生物科技(广州)有限公司 乳糖负传感质粒及负反馈乳糖生物传感器

Also Published As

Publication number Publication date
US20200319195A1 (en) 2020-10-08
AU2018315053B2 (en) 2022-04-28
SG11202001121WA (en) 2020-03-30
AR112932A1 (es) 2020-01-08
EP3665481C0 (en) 2023-10-11
WO2019028504A1 (en) 2019-02-14
CN111164426B (zh) 2023-12-08
KR20200052284A (ko) 2020-05-14
EP3665481A1 (en) 2020-06-17
IL272468A (en) 2020-03-31
JP2020537489A (ja) 2020-12-24
PL3665481T3 (pl) 2024-02-05
ZA202001115B (en) 2021-08-25
KR102660777B1 (ko) 2024-04-24
JP7246372B2 (ja) 2023-03-27
EP3665481B1 (en) 2023-10-11
CA3071994A1 (en) 2019-02-14
US11662349B2 (en) 2023-05-30
AU2018315053A1 (en) 2020-02-27
EP3665481A4 (en) 2021-08-11

Similar Documents

Publication Publication Date Title
CN111164426B (zh) 碳水化合物传感器
EP3538665B1 (en) Protease sensor molecules
CN110088624A (zh) 用于测量肉毒杆菌神经毒素活性的体外和基于细胞的测定
CN109991211A (zh) 用于检测分析物或分类样本的方法和系统
AU2018321580B2 (en) BRET sensor molecules for detecting hydrolases
US8173863B2 (en) Sucrose biosensors and methods of using the same
JP2010517543A (ja) 分泌型MLuc7ルシフェラーゼおよびその使用
Zhang et al. Novel signal-on immunosensors for rapid and sensitive detection of Microcystin-LR
CN110226087A (zh) 生物体物质的检测方法、该方法中使用的化学发光指示剂
KR101234583B1 (ko) 형광단백질 his-mBFP를 이용한 NADPH 정량법 및 그의 용도
CN116287106B (zh) 增强萤火虫萤光素酶atp生物发光法检测性能的方法及试剂
US20150198533A1 (en) LUCIGEN YELLOW (LucY), A YELLOW FLUORESCENT PROTEIN
Wu et al. A novel screening system based on VanX‐mediated autolysis—Application to Gaussia luciferase
US9625466B2 (en) Signal amplification methods for the imaging of protein synthesis and neurotransmitter transport
JP2007325546A (ja) 分割ルシフェラーゼ
KR20080021018A (ko) 단리된 광단백질 aq디케이 및 그의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant