CN113470751A - 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用 - Google Patents

一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用 Download PDF

Info

Publication number
CN113470751A
CN113470751A CN202110739359.0A CN202110739359A CN113470751A CN 113470751 A CN113470751 A CN 113470751A CN 202110739359 A CN202110739359 A CN 202110739359A CN 113470751 A CN113470751 A CN 113470751A
Authority
CN
China
Prior art keywords
sequence
protein nanopore
protein
amino acid
nanopore
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110739359.0A
Other languages
English (en)
Other versions
CN113470751B (zh
Inventor
李毅
刘荣辉
傅暘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern University of Science and Technology
Original Assignee
Southern University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern University of Science and Technology filed Critical Southern University of Science and Technology
Priority to CN202110739359.0A priority Critical patent/CN113470751B/zh
Publication of CN113470751A publication Critical patent/CN113470751A/zh
Priority to PCT/CN2022/099535 priority patent/WO2023273924A1/zh
Priority to US18/399,973 priority patent/US20240125791A1/en
Application granted granted Critical
Publication of CN113470751B publication Critical patent/CN113470751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • G01N33/54373Apparatus specially adapted for solid-phase testing involving physiochemical end-point determination, e.g. wave-guides, FETS, gratings
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Materials For Photolithography (AREA)

Abstract

本发明提供一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用。所述筛选方法包括:评估双孔结构的特征序列,利用模型搜索与所述双孔结构的特征序列相匹配的氨基酸序列,去除冗余候选序列后进行定位和筛选,计算候选序列的匹配长度和包络长度,再进行配准得到与已知的蛋白纳米孔的相对失配关系,分析得到最终序列。通过该方法筛选得到的氨基酸序列形成的蛋白纳米孔与已知T2SS、T3SS以及T4SS的分泌素蛋白相似度较低,所述蛋白纳米孔特有的序列缩小了孔的内径,使其通道孔径较小且选择性较高,是一类新型的选择性较好的蛋白纳米孔,能够应用于在物质检测或海水淡化等多个领域。

Description

一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其 应用
技术领域
本发明涉及纳米孔单分子技术领域,尤其涉及一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用。
背景技术
对于生化物质在单分子水平的精准检测是医疗、卫生与环境领域关注的重点问题。然而,传统的物质分析技术主要是依赖于光信号特异性标记的物质进行检测,不仅速度缓慢,而且价格昂贵。纳米孔单分子技术是在电生理基础之上发展起来的新型检测方法,这要求将待测物质输运通过一个薄而小的纳米孔,由于被测物的理化性质存在差异,会导致其在孔内停留时对纳米孔电流的阻塞效应具有区分度,因此,通过对阻塞电流的分辨,可以得到被测物质的相关理化信息。
当被测物是核酸序列时,纳米孔技术可以从过孔电流的变化中按序读取出单分子核酸单链的序列信息。这一方法具有非标记、高通量、成本低廉、样本需求量小等优点,目前在基因测序的不同手段当中,纳米孔单分子检测以及其在物质结构分析等方面具有广阔的前景。
生物纳米孔,也就是孔蛋白,由于其具有高灵敏度,重复性高等特点,已经成为纳米孔单分子检测技术中最主要的焦点。目前已研究表明α-溶血素(α-HL),耻垢分枝杆菌毒素蛋白A(MspA),气单胞菌溶素(aerolysin),噬菌体phi29连接器马达蛋白(phi29connector)以及外膜蛋白(OmpG)和促胰液素纳米孔(GspD、InvG)等不同蛋白纳米孔,均能够进行核酸序列检测、金属离子检测和物质构型构向等变化分析。特别需要指出的是,蛋白纳米孔在核酸测序上因其读长更长而成为了第三代测序技术的主要方向,目前牛津纳米孔也分别基于MspA(R7),Lysenin(R8),CsgG(R9)和GspD(R10)的突变体开发了一系列的测序仪器。
目前,商用稳定的R9.4.1孔蛋白以及之前版本的孔蛋白仅存在单一读取区域,对于长重复碱基序列的读取在原理上存在漏检的可能。尽管CN110914290A公开了CsgG的一种复合体CsgG-CsgF,具备两个读取位点,这极大地将6个碱基重复序列的识别正确率提高到90%以上。CN110267974A中公开了一种与来自霍乱弧菌的VcGspD、来自大肠杆菌的K12-GspD和来自霍乱弧菌的InvG具有95%以上氨基酸序列同源,以及经过修饰的GspD和InvG蛋白纳米孔。该发明通过改变蛋白的帽门结构和中间孔的带电性,减小了开孔电流的噪音。此外,其中还公开了修饰的GspD包含腔表面,腔表面限定内腔以及内腔在两开口之间跨膜,并对腔表面进行了一种或多种氨基酸修饰。虽然该公开的蛋白纳米孔能够有效的对核酸进行检测,特别是对重复碱基序列的检测,其错误率高达20%,在更长重复序列的正确读取上仍然充满了挑战。此外该蛋白对溶液环境的适应能力较弱,杂信号多。
因此,获得更优良的蛋白质纳米孔或其替代物将是本领域长期的研究难点和技术瓶颈。
发明内容
鉴于现有技术中存在的问题,本发明提供了一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用。所述蛋白纳米孔是一种新型的具有两个读取单元的蛋白体系,在纳米孔单分子检测以及其在物质结构分析等方面具有广阔的前景。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供一种蛋白纳米孔氨基酸序列的筛选方法,所述筛选方法包括如下步骤:
(1)获取已知的蛋白纳米孔的氨基酸信息,通过多重序列比对算法得到双孔结构的特征序列;
(2)利用隐马尔科夫模型搜索与所述双孔结构的特征序列匹配的氨基酸序列信息,并去除冗余数据信息;
(3)定位并筛选步骤(2)所得的氨基酸序列得到候选序列,并计算所述候选序列的匹配长度和包络长度;
(4)通过多重序列比对算法对所述候选序列进行配准,计算与已知的蛋白纳米孔的相对失配关系,并分析所述候选序列的结构得到最终序列。
本发明提供的筛选方法首先从数据库中搜索得到T2SS和T3SS的已知结构域序列的氨基酸信息,将这些氨基酸序列通过多重序列比对算法得到双孔结构的特征序列,通过隐马尔科夫模型HMMER v3.3或者HmmerWeb v2.41.1搜索与双孔结构模板匹配的氨基酸序列信息;再通过脚本定位和筛选候选序列的保守匹配区域,得到候选序列,并计算所述候选序列的匹配长度和包络长度,所有候选序列通过多重序列比对算法(MAFFT v7.273)进行配准,可以计算与已知的蛋白纳米孔相对的失配关系,同时,采用MODELLER v10.1和HOLE2v2.2.005以已知的蛋白纳米孔的促胰液素结构域的序列为模板对所有候选序列进行结构分析。经过上述筛选办法得到的最终序列具有高度可控的中央门狭窄通道以及帽门通道,能够作为一种新型的蛋白纳米孔进行使用。
作为本发明优选的技术方案,步骤(1)所述双孔结构的特征序列为蛋白SEQ IDNO.1~4中所示的任意一条氨基酸序列。
所述SEQ ID NO.1~4(其中,下划线加粗区域为帽门和中央门区域的序列,斜体加粗部分为骨架结构保守区)如下所示:
SEQ ID NO.1(PDB:5WQ8):
Figure BDA0003142533440000021
SEQ ID NO.2(PDB:6I1Y):
Figure BDA0003142533440000022
SEQ ID NO.3(PDB:5W68):
Figure BDA0003142533440000031
SEQ ID NO.4(PDB:5ZDH):
Figure BDA0003142533440000032
优选地,步骤(3)所述定位并筛选候选序列使用的保守匹配区域为KDT和LAS。
优选地,步骤(4)所述最终序列与所述已知的蛋白纳米孔的相似度≤75%,例如可以是75%、70%、65%、60%、55%、50%、45%、40%或35%等。
第二方面,本发明还提供一种蛋白纳米孔,所述蛋白纳米孔包含帽门和中央门结构,其氨基酸序列为如第一方面所述的方法筛选得到的氨基酸序列中的任意一种。
其中,所述第一方面所述的方法筛选得到的氨基酸序列如下表1所示:
表1
Figure BDA0003142533440000033
Figure BDA0003142533440000041
Figure BDA0003142533440000051
Figure BDA0003142533440000061
Figure BDA0003142533440000071
Figure BDA0003142533440000081
Figure BDA0003142533440000091
Figure BDA0003142533440000101
本发明提供的氨基酸序列源于极端环境微生物,与已知的第二类(T2SS)和第三类(T3SS)促胰液素蛋白的完整序列和核心序列的相似度小于75%,甚至低于50%;所述氨基酸序列能够形成蛋白纳米孔结构,且所得的蛋白纳米孔具有内壁和外壁,其外壁形成柱状孔结构,内壁形成限定的双孔结构,是一种新的具有两个读取单元的体系。
本发明提供的蛋白纳米孔,相比蛋白VcGspD形成的纳米孔、与VcGspD具有95%以上同源的氨基酸序列形成的纳米孔以及复合体CsgG-CsgF等,其特有的氨基酸序列缩小了孔的内径,使其通道孔径较小。
根据预测的蛋白结构可知,本发明中提供的蛋白纳米孔在帽门区(Cap Gate)新增一小段螺旋结构,在中央区域(Central Gate)具有更长的连接片段。另外,相比于在Vc-GspD中N3端与S区通过氢键相互作用,本发明中提供的蛋白纳米孔的单体蛋白在N3端更加简单,此外,所述蛋白纳米孔特有的序列还改变了孔周围的电荷,具有更高的等电点,增强了孔的选择性,在检测长重复碱基序列时,其错误率明显降低。
作为本发明优选的技术方案,所述蛋白纳米孔为所述氨基酸序列中任意一种的单体蛋白组成的多聚体。
优选地,所述多聚体包括12~16聚体。本发明提供的氨基酸序列所表达的单体蛋白能够组装成的寡聚体(一般为12聚体,14聚体、15聚体或16聚体),形成纳米孔通道,且与已报道的蛋白纳米孔序列相似性低于50%。该蛋白形可以用于制备纳米孔通道。
本发明中筛选得到的蛋白,相比于报道的GspD和InvG,其组装过程更加简单,简化了形成纳米孔通道的复杂性。
在一些具体的实施方案中,本发明提供的蛋白纳米孔的等电点为9.71,相比于GspD和InvG(等电点小于7),该蛋白纳米孔能够在更大pH范围内进行物质检测。
在一些实施方案中,所述寡聚体为12~16聚体,本发明所述氨基酸序列所表达的单体蛋白组装成的寡聚体一般为12聚体,14聚体、15聚体或16聚体。
优选地,所述蛋白纳米孔包含中央门特征序列、帽门特征序列和等电点决定序列。
在一些实施方案中,本发明的蛋白纳米孔具有更加完善的帽门和中央门氨基酸序列,能够进一步提高门控区域的精度,提高检测的准确性。与此同时,这也为该蛋白纳米孔的改造提供了更加广泛的氨基酸位点选择范围。
优选地,所述等电点决定序列为SEQ IDNO.5所示的氨基酸序列或与SEQ IDNO.5同源性大于75%的序列;所述SEQ IDNO.5为:
KAKITVGEDVPFITGQSQTVGGNVMTMIQRQNVGIT。
优选地,所述帽门特征序列为SEQ ID NO.6所示的氨基酸序列或与SEQ ID NO.6同源性大于75%的序列,所述SEQ ID NO.6序列为:
5'-GATGASSLSGSTTGAAGSLGVVSGAAGAASALSG-3'。
优选地,所述中央门特征序列为SEQ ID NO.7或SEQ ID NO.8所示的氨基酸序列,或与SEQ ID NO.7或SEQ ID NO.8同源性大于75%的序列;
其中,所述SEQ ID NO.7序列为:QSQTVGGNVMTMIQ;
所述SEQ ID NO.8为:QTITALTNASQLIGTMAVGPTTT。
此外,本发明中所述蛋白纳米孔还包含修饰结构。所述序列结构缩小了孔的内径,改变了孔周围的电荷,增强了孔的选择性,此外孔区域为中性氨基酸,不带电荷。
优选地,所述修饰结构修饰的位置包括中央门、帽门、N端或C端。
作为示例,在一些实施方案中,所述蛋白纳米孔的腔体上的274和279号氨基酸为G,特异地构成腔体壁上形成α-螺旋结构。
在一些实施方案中,可以通过S262-G322段进行一个或多个缺失,去除帽门区域,将孔改变为单孔蛋白纳米孔。在一些实施方案中,也可以对该序列进行插入或突变一个或多个氨基酸,改变帽门孔的尺寸和稳定性。
在一些实施方案中,V416-T447之间进行插入、突变和缺失,改变中央孔的大小。在一些实施方案中,也可以通过K364-T403的插入、突变和缺失来实现中央孔的调节。
第三方面,本发明提供一种核苷酸序列,所述核苷酸序列编码如第一方面所述的筛选方法筛选得到的氨基酸序列,或者,所述核苷酸序列编码如第二方面所述的蛋白纳米孔。
第四方面,本发明还提供一种含有如第三方面所述的核苷酸序列的重组载体、表达盒或重组菌。
第五方面,本发明还提供一种如第二方面所述的蛋白纳米孔、如第四方面所述的重组载体、表达盒或重组菌在检测待测物电信号中的应用。
优选地,所述应用包括如下步骤:
制备含有蛋白纳米孔的生物芯片,所述蛋白纳米孔镶嵌在磷脂双分子层中所组成,借助于计算机处理器和传感设备,加入待测物后,记录所述生物芯片两端电信号;
其中,所述待测物包括核酸、蛋白、多糖、神经递质、手性化合物、重金属和毒素中的任意一种或至少两种的组合。
本发明也提供了一种蛋白纳米孔的使用示例方法,该方法包括制备一种生物芯片,将蛋白纳米孔镶嵌在磷脂双分子层及其类似物中所组成;借助于计算机处理器和传感设备,加入待测物后,记录芯片两端电信号,通过电信号来反应所测物质的信息。其中所述物质检测的样品包括核酸、蛋白、多糖、神经递质、手性化合物、重金属和毒素中的任意一种及其组合。
与现有技术相比,本发明至少具有以下有益效果:
本发明提供了一种蛋白纳米孔的筛选方法,通过该方法能够筛选获得序列和结构更加新颖的蛋白纳米孔,筛选获得的一系列蛋白纳米孔氨基酸序列与第二类(T2SS)和第三类(T3SS)促胰液素蛋白的完整序列和核心序列的相似度较低,如与CsgG和VcGspD等氨基酸序列明显不同。
本发明筛选得到的蛋白纳米孔在中央门控区域和帽门区域具有更长的氨基酸,且在帽门关键区域具有新增一小段螺旋结构,在中央区域具有更长的连接片段,在N3端更加简单;
本发明提供的一种新型蛋白纳米孔及其序列,所述序列的同源性与现有技术中公开的序列的相似度较低;所述蛋白纳米孔特有的序列缩小了孔的内径,使其通道孔径较小,某些特定氨基酸形成的蛋白纳米孔仅为
Figure BDA0003142533440000121
且其序列改变了孔周围的电荷,增强了孔的选择性,所述纳米孔通道蛋白具有更高的等电点,能够应用于在物质检测或海水淡化等多个领域。
附图说明
图1为实施例1中VcGspD(PDB:5WQ8)作为模板序列得到的初始候选序列长度示意图;自上而下分别是模板序列(QUERY)匹配部分的匹配长度、候选序列(TARGET)匹配部分的长度以及候选序列的包络长度(TARGET ENVELOPE)。
图2为实施例1中通过MAFFT比对后,候选序列与VcGspD的失配关系示意图;其中,上方两条虚线为4个已知双孔结构的失配值(-4~0),其余下方虚线为已知单孔分泌通道的失配值。
图3为实施例1筛选后的序列与VcGspD通道的半径关系曲线图,其中VcGspD-PDB表示VcGspD在PDB中通道的尺寸,VcGspD-Predicted表示VcGspD计算分析后的尺寸,LfGspD-Predicted表示LfGspD计算分析后的尺寸。
图4为本发明提供的蛋白纳米孔的结构预测图。
图5为霍乱弧菌(V.cholerae)中蛋白VcGspD形成的蛋白纳米孔的结构预测图。
图6为DNA穿越突变体蛋白纳米孔的示意图。
图7为DNA穿越野生型孔蛋白的示意图。
图8为本发明提供的蛋白序列C6HW33_9BACT形成的单体蛋白的结构分析图。
图9为霍乱弧菌(V.cholerae)中蛋白Vc-GspD的结构分析图。
图10为使用SWISS-model分析本发明提供的15聚体后得到的通道宽度示意图。
图11为使用SWISS-model分析蛋白VcGspD 15聚体后得到的通道宽度示意图。
图12为VcGspD、ETEC_GspD和InvG的蛋白纳米孔的孔径分析图。
图13为蛋白纳米孔C6HW33_9BACT的电生理图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案,但下述的实例仅仅是本发明的简易例子,并不代表或限制本发明的权利保护范围,本发明的保护范围以权利要求书为准。
以下实施例中,若无特殊说明,所以的试剂及耗材均购自本领域常规试剂厂商;若无特殊说明,所用的实验方法和技术手段均为本领域常规的方法和手段。
实施例1蛋白纳米孔氨基酸序列的筛选
本实施例提供一种蛋白纳米孔氨基酸序列的筛选方法,所述筛选方法包括如下步骤:
(1)获取已知的蛋白纳米孔的氨基酸信息,通过多重序列比对算法得到双孔结构的特征序列;
首先,从https://www.rcsb.org/search搜索得到T2SS和T3SS的已知结构域序列的氨基酸信息。其次,将这些氨基酸序列通过多重序列比对算法(MAFFT v7.273)得到模板。已知双孔结构的特征序列如SEQ ID NO.1~4所示;
(2)利用隐马尔科夫模型搜索与所述双孔结构的特征序列匹配的氨基酸序列信息,并去除冗余数据信息;
通过隐马尔科夫模型HMMER v3.3(也可以通过HmmerWeb v2.41.1)搜索与双孔结构模板匹配的氨基酸序列信息;
使用的参数为-E 1--domE 1--incE 0.01--incdomE 0.03--mx BLOSUM62--pextend 0.4--popen 0.02--seqdb uniprotrefprot;
其中,uniprotrefprot(v.2019_09)是对于UniProtKB(v.2019_09)的相似度100%去冗余后的数据库信息,可以极大地避免重复氨基酸序列信息的收集。
(3)定位并筛选步骤(2)所得的氨基酸序列得到候选序列,并计算所述候选序列的匹配长度和包络长度;
图1展示了搜索VcGspD(PDB:5WQ8)模板后得到的初始候选序列长度,自上而下分别是模板序列(QUERY)匹配部分的匹配长度、候选序列(TARGET)匹配部分的长度以及候选序列的包络长度(TARGET ENVELOPE)。
通过脚本定位和筛选候选序列的“KDT”和“LAS”两个保守匹配区域,绝大多数序列长度大于150个氨基酸,这与促胰液素核心区域大小相符,同时序列长度粗略地服从两个高斯分布,其中一个与模板序列长度近似,另一个与去除了S域或者S+N3域的长度相符。
(4)通过多重序列比对算法对所述候选序列进行配准,计算与已知的蛋白纳米孔的相对失配关系,并分析所述候选序列的结构得到最终序列。
所有候选序列通过多重序列比对算法(MAFFT v7.273)进行配准,可以计算与VcGspD相对的失配关系,候选序列与VcGspD的失配关系如图2所示。
其中,虚线是表1中的4个已知双孔结构的失配值(-4~0)和已知单孔分泌通道的失配值。
同时,采用MODELLER v10.1和HOLE2 v2.2.005以VcGspD的促胰液素结构域的序列为模板对所有候选序列进行结构分析。
图3筛选后的序列与VcGspD通道的半径关系。其中,包括VcGspD-PDB中通道的尺寸、计算分析后的尺寸和候选序列LfGspD计算分析后的尺寸。
由于门控区域具有开关作用,因此实际分析中为了保持生物物理弹性,以一定的圆心半径范围内均为有效值。左侧散点为候选序列的中央门区域,而右侧散点为候选序列的帽门区域,后者半径比前者略大
Figure BDA0003142533440000141
经上述筛选办法得到的最终序列具有高度可控的中央门狭窄通道以及帽门通道,剔除与已知双孔结构的特征序列相同的重复序列,具有75%相似度的代表性序列如前所述。
实施例2C6HW33_9BACT蛋白纳米孔的信息特征
本实施例以本发明提供的蛋白纳米孔氨基酸序列(C6HW33_9BACT)与已报道的二型分泌系统(T2SS)和三型分泌系统(T3SS)中蛋白的同源性。
C6HW33_9BACT的氨基酸序列如SEQ ID NO.9所示。
已报道的T2SS的蛋白参见文献Korotkov,K.V.;Sandkvist,M.;Hol,W.G.J.TheType II Secretion System:Biogenesis,Molecular Architecture and Mechanism.Nat.Rev.Microbiol.2012,10(5),336-351.https://doi.org/10.1038/nrmicro2762.,本发明提供的蛋白序列C6HW33_9BACT与T2SS的蛋白同源性分析如表2所示。
表2
Figure BDA0003142533440000142
已报道的T3SS的蛋白参见文献Deng,W.;Marshall,N.C.;Rowland,J.L.;McCoy,J.M.;Worrall,L.J.;Santos,A.S.;Strynadka,N.C.J.;Finlay,B.B.Assembly,Structure,Function and Regulation of Type III Secretion Systems.Nat.Rev.Microbiol.2017,15(6),323–337.https://doi.org/10.1038/nrmicro.2017.20.,本发明提供的蛋白序列C6HW33_9BACT与T3SS的蛋白同源性分析如表3所示。
表3
Figure BDA0003142533440000151
通过分析,本发明中所提供的序列C6HW33_9BACT与已报道的功能序列相似性低于40%,而且与T8SS(CsgG)和RhcC1-RhcC2等不具有相似性,因此是一种新型的可以用于纳米孔单分子检测的分泌蛋白。
实施例3
本实施例用于预测本发明提供的蛋白序列形成的蛋白纳米孔的结构。
本实施例中预测的蛋白纳米孔C6HW33_9BACT的结构如图4所示,相比霍乱弧菌(V.cholerae)中的蛋白VcGspD形成的纳米孔结构(如图5)。
本发明提供的蛋白纳米孔序列更短,氨基酸数为565个,比VcGspD少119个,等电点更高,为9.71,而VcGspD为4.8,具有更长的帽门和中央门氨基酸序列。
此外,图6为核酸穿越突变体蛋白纳米孔的示意图,图7是单分子核酸跨越野生型蛋白纳米孔。
本实施例中预测的蛋白结构显示(如图8),蛋白纳米孔在帽门区(Cap Gate)新增一小段螺旋结构,在中央区域(Central Gate)具有更长的连接片段。
另外,相比于在VcGspD(如图9)中N3端与S区通过氢键相互作用,本发明中的单体蛋白在N3端更加简单。
根据SWISS-model进行分析,本发明提供的蛋白能够形成纳米孔结构,其中,天然形成的15聚体纳米孔结构中,如图10所示,其孔通道仅为
Figure BDA0003142533440000161
远小于VcGspD(如图11)以及目前已报到的蛋白质纳米孔结构。
此外,图12表示了VcGspD、ETEC_GspD和InvG的蛋白纳米孔的孔径。
实施例4蛋白纳米孔的突变改造
以C6HW33_9BACT为例,对获得的序列通过如下设计突变体,所得突变体及突变效果如下表4所示:
表4
Figure BDA0003142533440000162
由上表可知,对所述序列进行点突变改造后,所得蛋白纳米孔的结构以及各部分氨基酸残基的功能更加清晰,为后续改造和应用蛋白纳米孔提供了研究基础。
实施例5蛋白纳米孔表达和纯化方法
以C6HW33_9BACT为例,合成编码蛋白纳米孔的基因,在基因的N端添加组氨酸标签和多肽酶切蛋白酶序列,转化至E.coli C43表达菌株中,在含有100μg/mL抗生素的琼脂平板上筛选获得单菌落。
挑取单菌落,在200rpm条件下37℃培养至OD大于1.2,按1:200(种子液/培养基)扩大培养,当OD600大于0.6后,加入IPTG并将温度调低至16℃以下继续培养14小时以上,4000g收集菌体,用pH 7.4的磷酸盐缓冲液清洗一遍。
按1:10的重量体积比加入150mM NaCl,15mM Tris-HCl,1mM咪唑,0.5mM PMSF,25U/mL核酸酶混匀。
然后通过超声破碎裂解细胞(1s开,2s关,40min),4000g去除细胞碎片,加入0.2%Zw3-14,冰上混匀1h,用0.22μm的过滤器过滤获得上清液,然后将其注入Ni琼脂糖柱;
通过溶液A(150mM NaCl,15mM Tris-HCl,1mM咪唑,0.2%Zw3-14)、溶液B(150mMNaCl,15mM Tris-HCl,20mM咪唑,0.2%Zw3-14)、溶液C(150mM NaCl,15mM Tris-HCl,50mM咪唑,0.2%Zw3-14)依次洗涤,加入洗脱液(150mM NaCl,15mM Tris-HCl,500mM咪唑,0.2%Zw3-14)收集获得蛋白。
将收集获得的蛋白通过凝胶色谱分子筛进一步进行多聚体和单体分离,洗脱液体为150mM NaCl、15mM Tris-HCl、0.2%Zw3-14。
实施例6蛋白纳米孔的电生理
使用实施例5所述的方法表达蛋白纳米孔C6HW33_9BACT蛋白纳米孔,并储存至150mM NaCl、15mM Tris-HCl、0.1%DDM/LDAO的缓冲液中;
将其通过Blue-native PAGE跑胶,并对其多聚体切胶采用上述液体提取。用于350mM KCl的溶液中稀释备用,在100μm的生物芯片中涂一层磷脂并插入蛋白;
通过电生理仪器检测电信号,结果如图13所示,电流存在二级跃迁,该白帽门和中央门同时会反应电流信号。
本发明中同时随机挑选其余筛选得到的蛋白纳米孔,对其进行模拟,包括:A0A2R4XIB8_9BORD、U4KHA5_9VIBR、D4ZEB1_SHEVD、A0A1M5Z8V4_9GAMM、K7AHG1_9ALTE、A3WP11_9GAMM、C6XJ47_HIRBI、G4E4N3_9GAMM、N9BSP8_9GAMM、G0AE23_COLFT、A0A3N8KT41_9BURK、B9TP47_RICCO、H5WJ69_9BURK、A0A1P8WL02_9PLAN、M5TB48_9PLAN、Q221L0_RHOFT等;所得蛋白纳米孔的特征与C6HW33_9BACT相似,均在中央门控区域和帽门区域具有更长的氨基酸,且在帽门关键区域具有新增一小段螺旋结构,在中央区域具有更长的连接片段,在N3端更加简单;由于筛选得到的氨基酸序列较多,此处仅展示C6HW33_9BACT的相关数据和图片作为代表性数据,避免赘述。
综上所述,本发明利用所述蛋白纳米孔的筛选方法,筛选获得的一系列蛋白纳米孔氨基酸序列与第二类(T2SS)和第三类(T3SS)促胰液素蛋白的完整序列和核心序列的相似度较低,而中央门控区域和帽门区域具有更长的氨基酸序列,所述蛋白纳米孔特有的序列缩小了孔的内径,使其通道孔径较小,仅为
Figure BDA0003142533440000171
且其序列改变了孔周围的电荷,增强了孔的选择性,所述纳米孔通道蛋白具有更高的等电点,能够应用于在物质检测或海水淡化等多个领域。
申请人声明,以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,本文中描述的所有参数、尺寸、材料以及构造都是示例性的,所属技术领域的技术人员应该明了,任何属于本技术领域的技术人员在本发明揭露的技术范围内,基于本发明可轻易想到的变化或替换,均落在本发明的保护范围和公开范围之内。
SEQUENCE LISTING
<110> 南方科技大学
<120> 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
<130> 20210601
<160> 9
<170> PatentIn version 3.3
<210> 1
<211> 104
<212> PRT
<213> 人工合成
<400> 1
Lys Asp Thr Thr Gln Thr Lys Ala Val Tyr Asp Thr Asn Asn Asn Phe
1 5 10 15
Leu Arg Asn Glu Thr Thr Thr Thr Lys Gly Asp Tyr Thr Lys Leu Ala
20 25 30
Ser Ala Leu Ser Ser Ile Gln Gly Ala Ala Val Ser Ile Ala Met Gly
35 40 45
Asp Trp Thr Ala Leu Ile Asn Ala Val Ser Asn Asp Ser Ser Ser Asn
50 55 60
Ile Leu Ser Ser Pro Ser Ile Thr Val Met Asp Asn Gly Glu Ala Ser
65 70 75 80
Phe Ile Val Gly Glu Glu Val Pro Val Ile Thr Gly Ser Thr Ala Gly
85 90 95
Ser Asn Asn Asp Asn Pro Phe Gln
100
<210> 2
<211> 104
<212> PRT
<213> 人工合成
<400> 2
Lys Asp Lys Thr Val Thr Asp Ser Arg Trp Asn Ser Asp Thr Asp Lys
1 5 10 15
Tyr Glu Pro Tyr Ser Arg Thr Glu Ala Gly Asp Tyr Ser Thr Leu Ala
20 25 30
Ala Ala Leu Ala Gly Val Asn Gly Ala Ala Met Ser Leu Val Met Gly
35 40 45
Asp Trp Thr Ala Leu Ile Ser Ala Val Ser Ser Asp Ser Asn Ser Asn
50 55 60
Ile Leu Ser Ser Pro Ser Ile Thr Val Met Asp Asn Gly Glu Ala Ser
65 70 75 80
Phe Ile Val Gly Glu Glu Val Pro Val Ile Thr Gly Ser Thr Ala Gly
85 90 95
Ser Asn Asn Asp Asn Pro Phe Gln
100
<210> 3
<211> 101
<212> PRT
<213> 人工合成
<400> 3
Lys Pro Gln Lys Gly Ser Thr Val Ile Ser Glu Asn Gly Ala Thr Thr
1 5 10 15
Ile Asn Pro Asp Thr Asn Gly Asp Leu Ser Thr Leu Ala Gln Leu Leu
20 25 30
Ser Gly Phe Ser Gly Thr Ala Val Gly Val Val Lys Gly Asp Trp Met
35 40 45
Ala Leu Val Gln Ala Val Lys Asn Asp Ser Ser Ser Asn Val Leu Ser
50 55 60
Thr Pro Ser Ile Thr Thr Leu Asp Asn Gln Glu Ala Phe Phe Met Val
65 70 75 80
Gly Gln Asp Val Pro Val Leu Thr Gly Ser Thr Val Gly Ser Asn Asn
85 90 95
Ser Asn Pro Phe Asn
100
<210> 4
<211> 101
<212> PRT
<213> 人工合成
<400> 4
Lys Pro Gln Lys Gly Ser Thr Val Ile Ser Glu Asn Gly Ala Thr Thr
1 5 10 15
Ile Asn Pro Asp Thr Asn Gly Asp Leu Ser Thr Leu Ala Gln Leu Leu
20 25 30
Ser Gly Phe Ser Gly Thr Ala Val Gly Val Val Lys Gly Asp Trp Met
35 40 45
Ala Leu Val Gln Ala Val Lys Asn Asp Ser Ser Ser Asn Val Leu Ser
50 55 60
Thr Pro Ser Ile Thr Thr Leu Asp Asn Gln Glu Ala Phe Phe Met Val
65 70 75 80
Gly Gln Asp Val Pro Val Leu Thr Gly Ser Thr Val Gly Ser Asn Asn
85 90 95
Ser Asn Pro Phe Asn
100
<210> 5
<211> 36
<212> PRT
<213> 人工合成
<400> 5
Lys Ala Lys Ile Thr Val Gly Glu Asp Val Pro Phe Ile Thr Gly Gln
1 5 10 15
Ser Gln Thr Val Gly Gly Asn Val Met Thr Met Ile Gln Arg Gln Asn
20 25 30
Val Gly Ile Thr
35
<210> 6
<211> 34
<212> PRT
<213> 人工合成
<400> 6
Gly Ala Thr Gly Ala Ser Ser Leu Ser Gly Ser Thr Thr Gly Ala Ala
1 5 10 15
Gly Ser Leu Gly Val Val Ser Gly Ala Ala Gly Ala Ala Ser Ala Leu
20 25 30
Ser Gly
<210> 7
<211> 14
<212> PRT
<213> 人工合成
<400> 7
Gln Ser Gln Thr Val Gly Gly Asn Val Met Thr Met Ile Gln
1 5 10
<210> 8
<211> 23
<212> PRT
<213> 人工合成
<400> 8
Gln Thr Ile Thr Ala Leu Thr Asn Ala Ser Gln Leu Ile Gly Thr Met
1 5 10 15
Ala Val Gly Pro Thr Thr Thr
20
<210> 9
<211> 565
<212> PRT
<213> 人工合成
<400> 9
Met Arg Gln Ala Leu Leu Ser Val Pro Thr Asp Gln His Leu Arg Thr
1 5 10 15
Phe Pro Leu Arg Ser Arg Thr Gly Arg Ala Phe Trp Ala Val Leu Phe
20 25 30
Leu Leu Phe Leu Val Pro Gly Pro Gly Thr Val Pro Val Ala Val Ala
35 40 45
Ala Ala Pro Gly Ala Pro Pro Ala Pro Thr Pro Leu Ala Leu Pro Ala
50 55 60
Pro Val Gln Lys Val Ser Met Asn Phe Arg Asn Val Asp Val Ser Val
65 70 75 80
Leu Val Arg Phe Met Ser Glu Leu Leu Gln Gln Asn Ile Val Met Asp
85 90 95
Glu Arg Val Lys Gly Lys Leu Thr Ile Leu Ser Pro Ala Glu Val Thr
100 105 110
Val Pro Glu Ala Phe Arg Ile Phe Ser Asp Ala Leu Arg Met Lys Gly
115 120 125
Phe Glu Ala Val Ser Lys Lys Gly Met Ile Tyr Ile Val Pro Glu Thr
130 135 140
Gln Ala Pro Pro Thr Arg Glu Met Phe Leu Tyr Thr Leu Glu Asn Thr
145 150 155 160
Ser Ala Lys Ser Ile Ala Lys Thr Val Asn Ala Ile Leu Ser Lys Gly
165 170 175
Phe Ala Pro Arg Pro Val Gly Gly Val Arg Glu Gly Gly Phe Asp Gly
180 185 190
Pro Ile Gln Ile Val Pro Asp Lys Ser Ser Asn Ser Leu Ile Val Ser
195 200 205
Ala Thr Ala His Asp Tyr Glu Arg Leu Lys Pro Ile Leu His Ser Leu
210 215 220
Asp Ala Gln Pro Gly Glu Val Tyr Val Lys Ala Ser Leu Ile Glu Ile
225 230 235 240
Ser Thr Asp Lys Leu Asn Asn Ile Gln Val Asn Leu Leu Gly Gly Val
245 250 255
Leu Gly Ser Asn Asn Ser Gly Val Val Gly Leu Thr Asn Tyr Gly Met
260 265 270
Leu Gly Ser Ile Val Asn Gly Ala Thr Gly Ala Ser Ser Leu Ser Gly
275 280 285
Ser Thr Thr Gly Ala Ala Gly Ser Leu Gly Val Val Ser Gly Ala Ala
290 295 300
Gly Ala Ala Ser Ala Leu Ser Gly Leu Asn Gly Leu Val Ala Gly Val
305 310 315 320
Leu Thr Gly Gly Thr Phe Lys Tyr Asn Gly Val Asn Tyr Pro Asn Ile
325 330 335
Gly Glu Leu Leu Asn Ala Leu Glu Thr Tyr Ser Asp Val Arg Thr Leu
340 345 350
Ser Thr Pro Glu Ile Leu Ala Thr Asp Gly Val Lys Ala Lys Ile Thr
355 360 365
Ile Gly Glu Asp Val Pro Phe Ile Thr Gly Gln Ser Gln Thr Val Gly
370 375 380
Gly Asn Val Met Thr Met Ile Gln Arg Gln Asn Val Gly Ile Thr Leu
385 390 395 400
Glu Leu Thr Pro His Ile Leu Ser His Asn Arg Val Arg Leu Asp Val
405 410 415
Lys Gln Thr Ile Ser Ala Leu Thr Asn Ala Ser Gln Val Ile Gly Thr
420 425 430
Ile Ala Val Gly Pro Thr Thr Thr Lys Arg Ser Ala Lys Thr Asn Leu
435 440 445
Thr Ile Ser Ser Gly Gln Thr Val Val Ile Gly Gly Leu Ile Ser Lys
450 455 460
Glu Thr Ser Ile Asn Asp Gln Gly Ile Pro Phe Leu Ser Asp Ile Pro
465 470 475 480
Ile Leu Gly Tyr Leu Phe Ser Asn Thr Asn Asn Glu Lys Lys Arg Asp
485 490 495
Asp Leu Leu Ile Phe Leu Thr Pro Tyr Val Ile Arg Asn Ala Gln Asp
500 505 510
Leu Ala Val Val Lys His Asp Ala Pro Glu Gly Leu Lys Lys Phe Ala
515 520 525
Ser Asn Asn Lys Leu Leu Gln Lys Leu Leu Leu Asp Arg Lys Thr Thr
530 535 540
Ser Thr Ser Ser Asp Gln Phe Leu Asn Thr Val Asp Val Pro Gly Asp
545 550 555 560
Pro Gly Ala Pro Glu
565

Claims (10)

1.一种蛋白纳米孔氨基酸序列的筛选方法,其特征在于,所述筛选方法按顺序包括如下步骤:
(1)获取已知的蛋白纳米孔的氨基酸信息,通过多重序列比对算法评估双孔结构的特征序列;
(2)利用隐马尔科夫模型搜索与所述双孔结构的特征序列匹配的氨基酸序列信息,并去除冗余数据信息;
(3)定位并筛选步骤(2)所得的氨基酸序列得到候选序列,并计算所述候选序列的匹配长度和包络长度;
(4)通过多重序列比对算法对所述候选序列进行配准,计算与已知的蛋白纳米孔的相对失配关系,并分析所述候选序列的结构得到最终序列。
2.根据权利要求1所述的筛选方法,其特征在于,步骤(1)所述双孔结构的特征序列为蛋白SEQ ID NO.1~4中所示的任意一条的氨基酸序列;
优选地,步骤(3)所述定位并筛选候选序列使用的保守匹配区域为KDT和LAS;
优选地,步骤(4)所述最终序列与所述已知的蛋白纳米孔的相似度≤75%;
优选地,所述筛选方法筛选得到的氨基酸如下表1所示。
表1
Figure FDA0003142533430000011
Figure FDA0003142533430000021
Figure FDA0003142533430000031
Figure FDA0003142533430000041
Figure FDA0003142533430000051
Figure FDA0003142533430000061
Figure FDA0003142533430000071
Figure FDA0003142533430000081
3.一种蛋白纳米孔,其特征在于,所述蛋白纳米孔包含帽门和中央门结构;
所述蛋白纳米孔的氨基酸序列为如权利要求1或2所述的筛选方法筛选得到的氨基酸序列中的任意一种。
4.根据权利要求3所述的蛋白纳米孔,其特征在于,所述蛋白纳米孔为所述氨基酸序列中任意一种的单体蛋白组成的多聚体;
优选地,所述多聚体包括12~16聚体。
5.根据权利要求3或4所述的蛋白纳米孔,其特征在于,所述蛋白纳米孔包含中央门特征序列、帽门特征序列和等电点决定序列;
优选地,所述等电点决定序列为SEQ ID NO.5所示的氨基酸序列或与SEQ ID NO.5同源性大于75%的序列;
所述SEQ ID NO.5为:
KAKITVGEDVPFITGQSQTVGGNVMTMIQRQNVGIT;
优选地,所述帽门特征序列为SEQ ID NO.6所示的氨基酸序列或与SEQ ID NO.6同源性大于75%的序列;
所述SEQ ID NO.6序列为:
GATGASSLSGSTTGAAGSLGVVSGAAGAASALSG;
优选地,所述中央门特征序列为SEQ ID NO.7或SEQ ID NO.8所示的氨基酸序列,或与SEQ ID NO.7或SEQ ID NO.8同源性大于75%的序列;
其中,所述SEQ ID NO.7序列为:QSQTVGGNVMTMIQ;
所述SEQ ID NO.8为:QTITALTNASQLIGTMAVGPTTT。
6.根据权利要求3~5任一项所述的蛋白纳米孔,其特征在于,所述蛋白纳米孔包含修饰结构;
优选地,所述修饰结构修饰的位置包括中央门、帽门、N端或C端。
7.核苷酸序列,其特征在于,所述核苷酸序列编码如权利要求1或2所述的筛选方法筛选得到的氨基酸序列,或者,所述核苷酸序列编码如权利要求3~6任一项所述的蛋白纳米孔。
8.含有如权利要求7所述的核苷酸序列的重组载体、表达盒或重组菌。
9.如权利要求1或2所述的筛选方法、如权利要求3~6任一项所述的蛋白纳米孔、如权利要求7所述的核苷酸序列或如权利要求8所述的重组载体、表达盒或重组菌在检测待测物电学和/或光学信号中的应用。
10.如权利要求9所述的应用,其特征在于,所述应用包括如下步骤:
制备含有蛋白纳米孔的生物芯片,所述蛋白纳米孔镶嵌在磷脂双分子层中所组成,借助于计算机处理器和传感设备,加入待测物后,记录所述生物芯片两端的电信号和/或光信号;
其中,所述待测物包括核酸、蛋白、多糖、神经递质、手性化合物、重金属和毒素中的任意一种或至少两种的组合。
CN202110739359.0A 2021-06-30 2021-06-30 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用 Active CN113470751B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110739359.0A CN113470751B (zh) 2021-06-30 2021-06-30 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
PCT/CN2022/099535 WO2023273924A1 (zh) 2021-06-30 2022-06-17 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
US18/399,973 US20240125791A1 (en) 2021-06-30 2023-12-29 Screening method for amino acid sequence of protein nanopore, protein nanopore, and applications thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110739359.0A CN113470751B (zh) 2021-06-30 2021-06-30 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用

Publications (2)

Publication Number Publication Date
CN113470751A true CN113470751A (zh) 2021-10-01
CN113470751B CN113470751B (zh) 2024-09-20

Family

ID=77876683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110739359.0A Active CN113470751B (zh) 2021-06-30 2021-06-30 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用

Country Status (3)

Country Link
US (1) US20240125791A1 (zh)
CN (1) CN113470751B (zh)
WO (1) WO2023273924A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023273924A1 (zh) * 2021-06-30 2023-01-05 南方科技大学 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
CN116721700A (zh) * 2023-08-08 2023-09-08 中国人民解放军军事科学院军事医学研究院 鉴定新型双链dna胞苷脱氨酶的方法、装置和计算机可读存储介质及应用
CN117594130A (zh) * 2024-01-19 2024-02-23 北京普译生物科技有限公司 纳米孔测序信号评价方法、装置、电子设备和存储介质
CN117886907A (zh) * 2022-10-14 2024-04-16 北京普译生物科技有限公司 一种pht纳米孔突变体蛋白及其应用
WO2024152432A1 (zh) * 2023-01-17 2024-07-25 南方科技大学 双门孔道蛋白、孔道蛋白突变体、核苷酸序列及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014071250A1 (en) * 2012-11-01 2014-05-08 University Of Washington Through Its Center For Commercialization Methods for detecting and mapping modifications to nucleic acid polymers using nanopore systems
CN112578106A (zh) * 2020-04-13 2021-03-30 南京大学 一种纳米孔道单分子蛋白质测序仪
CN112826943A (zh) * 2021-01-14 2021-05-25 齐鲁工业大学 一种蛋白纳米载体、负载有靶向物质的载体及制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101140780B1 (ko) * 2009-12-11 2012-05-03 한국생명공학연구원 히든 마코브 모델을 이용한 식물 저항성 유전자 동정 및 분류를 위한 시스템 및 방법
CN114502741A (zh) * 2019-08-06 2022-05-13 诺玛生物公司 用于在纳米孔隙装置中定位特征的逻辑驱动多核苷酸扫描
CN113470751B (zh) * 2021-06-30 2024-09-20 南方科技大学 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014071250A1 (en) * 2012-11-01 2014-05-08 University Of Washington Through Its Center For Commercialization Methods for detecting and mapping modifications to nucleic acid polymers using nanopore systems
CN112578106A (zh) * 2020-04-13 2021-03-30 南京大学 一种纳米孔道单分子蛋白质测序仪
CN112826943A (zh) * 2021-01-14 2021-05-25 齐鲁工业大学 一种蛋白纳米载体、负载有靶向物质的载体及制备方法和应用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HENRY BRINKERHOFF 等: ""Supplementary Materials for Multiple rereads of single proteins at single–amino acid resolution using nanopores"", 《SCIENCE》, pages 1 *
尚积祯;李志;郗冬梅;张书圣;: "生物纳米孔分析技术研究进展", 应用化学, no. 08, pages 855 *
杨森 等: ""基于纳米孔的单分子检测技术及其研究进展"", 《材料导报》, vol. 34, pages 1177 *
浓香鸭腿面: "《使用Blastp和Hmmer筛选出包含特定结构域的蛋白》", HTTPS://BLOG.CSDN.NET/SINAT_41621566/ARTICLE/DETAILS/109811764, 19 November 2020 (2020-11-19), pages 1 *
程双怀: "基因工程原理与技术研究", 30 June 2020, 重庆大学出版社, pages: 69 *
陈厚凯 等: ""蛋白质测序技术进展"", 《科学通报》, vol. 66, no. 25, pages 3309 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023273924A1 (zh) * 2021-06-30 2023-01-05 南方科技大学 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
CN117886907A (zh) * 2022-10-14 2024-04-16 北京普译生物科技有限公司 一种pht纳米孔突变体蛋白及其应用
WO2024152432A1 (zh) * 2023-01-17 2024-07-25 南方科技大学 双门孔道蛋白、孔道蛋白突变体、核苷酸序列及其应用
CN116721700A (zh) * 2023-08-08 2023-09-08 中国人民解放军军事科学院军事医学研究院 鉴定新型双链dna胞苷脱氨酶的方法、装置和计算机可读存储介质及应用
CN116721700B (zh) * 2023-08-08 2024-01-12 中国人民解放军军事科学院军事医学研究院 鉴定新型双链dna胞苷脱氨酶的方法、装置及应用
CN117594130A (zh) * 2024-01-19 2024-02-23 北京普译生物科技有限公司 纳米孔测序信号评价方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
WO2023273924A1 (zh) 2023-01-05
US20240125791A1 (en) 2024-04-18
CN113470751B (zh) 2024-09-20

Similar Documents

Publication Publication Date Title
CN113470751B (zh) 一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用
CN113480620B (zh) 孔蛋白单体的突变体、蛋白孔及其应用
US20230079731A1 (en) Novel protein pores
US20240060126A1 (en) Method
KR102472805B1 (ko) 돌연변이체 포어
CN113754743B (zh) 孔蛋白单体的突变体、蛋白孔及其应用
CN113912683B (zh) 孔蛋白单体的突变体、蛋白孔及其应用
Lucas et al. The manipulation of the internal hydrophobicity of FraC nanopores augments peptide capture and recognition
JP2022518095A (ja) 細孔
JP2009540838A5 (zh)
CN113773373B (zh) 孔蛋白单体的突变体、蛋白孔及其应用
CN113735948B (zh) 孔蛋白单体的突变体、蛋白孔及其应用
CN112500459B (zh) Aerolysin突变纳米孔及其在分子生物检测方面的应用
JP2020508983A (ja) 修飾ナノポア、それを含む組成物、およびそれらの使用
Wu et al. Precise construction and tuning of an aerolysin single-biomolecule interface for single-molecule sensing
CN115777019A (zh) 经修饰的Prp43解旋酶及其用途
JP2009118749A (ja) 安定な抗体結合性タンパク質
CN113024642B (zh) 一种基于肺炎支原体的蛋白质及其制备方法和应用
CN111349623B (zh) 9°n dna聚合酶突变体
CN117384260B (zh) 一种新型纳米孔蛋白突变体及其应用
Stankunas et al. Docking a flexible basket onto the core of the nuclear pore complex
CN117886907B (zh) 一种pht纳米孔突变体蛋白及其应用
WO2024138425A1 (zh) 一种新型纳米孔蛋白及其应用
CN114437223B (zh) 一种特异识别sarm1的纳米抗体及其应用
WO2024138565A1 (zh) 纳米孔蛋白及其突变体和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant