CN118077011A - 一种降低外源核酸免疫原性的密码子优化 - Google Patents

一种降低外源核酸免疫原性的密码子优化 Download PDF

Info

Publication number
CN118077011A
CN118077011A CN202380011162.2A CN202380011162A CN118077011A CN 118077011 A CN118077011 A CN 118077011A CN 202380011162 A CN202380011162 A CN 202380011162A CN 118077011 A CN118077011 A CN 118077011A
Authority
CN
China
Prior art keywords
nucleic acid
acid sequences
acid sequence
cpg
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380011162.2A
Other languages
English (en)
Inventor
樊隆
贺玉卓
李竑
刘家栋
段江波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinjinkang Biotechnology Co ltd
Nanjing Jinsirui Science and Technology Biology Corp
Original Assignee
Shanghai Jinjinkang Biotechnology Co ltd
Nanjing Jinsirui Science and Technology Biology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinjinkang Biotechnology Co ltd, Nanjing Jinsirui Science and Technology Biology Corp filed Critical Shanghai Jinjinkang Biotechnology Co ltd
Publication of CN118077011A publication Critical patent/CN118077011A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供一种用于降低外源核酸免疫原性的密码子优化方法,该方法包括以下步骤:a)获得初始核酸序列群体集,其中所述初始核酸序列群体集包含能够表达目标蛋白质的多个初始候选核酸序列;b)基于所述初始核酸序列群体集,使用组合优化问题求解算法执行受到限制的CpG指数和协调指数的优化,从而获得能够表达所述蛋白质的多个优化的低免疫原性核酸序列。

Description

一种降低外源核酸免疫原性的密码子优化
相关申请的交叉引用
本申请要求2022年9月30日提交的申请号为202211212152.9的中国专利申请的优先权,其全部内容通过引入并入本文。
技术领域
本发明涉及蛋白质工程技术,尤其涉及蛋白质工程中的密码子优化方法,具体涉及一种降低外源核酸免疫原性的密码子优化。
背景技术
对用于疫苗开发、临床治疗和基因治疗方法的药物相关蛋白的需求不断增加,这就需要改进生产策略,以实现持续和高转基因表达。同时,疫苗成分或重组疗法的开发关键取决于相应转基因的持续表达。这些在哺乳动物表达系统(例如CHO、HEK293T和免疫细胞)中表达的转基因主要来自病毒、细菌、真菌和同源基因,病毒和细菌DNA以及细菌衍生的质粒DNA等通常含有多数情况下未甲基化的CpG二核苷酸,而在哺乳动物DNA中,CpG二核苷酸多数情况下是甲基化的。因此,由于外源核酸异源表达的免疫刺激特性,经常可以观测到毒性反应,并且异源蛋白只能瞬时表达,而无法持续表达。
近年来,有研究指出去除核酸序列中的CpG二核苷酸这一优化可降低异源基因转基因表达过程中的抗病毒和抗菌反应,但同时将大大降低重组蛋白的表达水平。
因此,CpG的个数对蛋白表达水平提高和免疫原性降低之间存在矛盾,生物医学和生物技术研究及工业生产需要具有正确折叠和修饰的高质量蛋白质,所以如何探索和总结反映高表达的基因的密码子使用偏好性的潜在有益规则和模式对于降低免疫原性同时提高蛋白质的表达水平至关重要。
发明内容
为解决上述问题,本发明提出一种的密码子优化方法,所述方法包括以下步骤:
a)获得初始核酸序列群体集,其中所述初始核酸序列群体集包含能够表达目标蛋白质的多个初始候选核酸序列;
b)基于所述初始核酸序列群体集,使用组合优化问题求解算法执行受到限制的CpG指数和协调指数的优化,从而获得能够表达所述蛋白质的多个优化的核酸序列,其中所述受到限制的CpG指数是CpG二核苷酸的个数,变化范围被设为从0到所述目标蛋白质野生型基因的CpG二核苷酸的个数之间,所述协调指数指示多个高表达的基因和所述候选核酸序列之间的同义密码子的使用频率分布的一致性。所述密码子优化方法能够降低优化的核酸序列在体内的免疫原性。
进一步地,所述获得初始核酸序列群体集包括:获得目标蛋白质序列;基于所述目标蛋白质序列产生所述初始核酸序列群体集。
进一步地,所述获得初始核酸序列群体集包括:获得第一核酸序列;将所述第一核酸序列翻译成蛋白质序列;基于所述蛋白质序列产生所述初始核酸序列群体集。
进一步地,所述初始核酸序列群体集具有预设大小。
进一步地,所述初始核酸序列群体集包括所述多个初始候选核酸序列的二进制表示。
进一步地,所述执行CpG指数和协调指数的优化包括:在受限范围内最小化所述CpG指数;最大化所述协调指数。
进一步地,所述协调指数基于下式计算:H=1-D(Fhs,Fts),其中D()指示距离函数;其中Fhs包括包含多个高表达的基因内的多个氨基酸的同义密码子的频率的矢量;并且其中Fts包括包含所述候选核酸序列的编码基因内的多个氨基酸的同义密码子的频率的矢量。
进一步地,所述D()指示测量两个矢量之间的距离的函数。
进一步地,所述D()为距离函数,其包括:两个矢量的欧几里德 距离、余弦距离、曼哈顿距离或闵可夫斯基距离。
进一步地,所述多个高表达的基因或候选核酸序列的同义密码子的频率被定义为:
个同义密码子。
进一步地,所述组合优化问题求解算法包括启发式算法;优选地,所述启发式算法选自粒子群算法、遗传算法、免疫算法、蚁群算法、模拟退火算法及其变种算法中的一种或多种。
进一步地,所述组合优化问题求解算法是NSGA-II算法。
进一步地,所述方法包括以下步骤:
a)初始化核酸序列群体集Pt并将当前进化代数Gen设置为1;
b)基于Pt产生后代核酸序列群体集Qt
c)将Pt与Qt合并为新的核酸序列群体集Rt
d)计算Rt中候选核酸序列的CpG指数和协调指数,并执行快速非支配排序、计算拥挤度生成新的核酸序列群体集Pt
e)判断当前代数是否小于进化世代数T:若是,则进化代数Gen自增1,并返回b);否则,输出非支配解集,并停止。
进一步地,所述后代核酸序列群体集通过二进制锦标赛选择、交叉/重组、突变或其任何组合产生。
进一步地,所述初始核酸序列群体集和所述后代核酸序列群体集具有相同的大小。
进一步地,所述方法还包括提供指示分布在帕累托最优前沿的多个优化核酸序列的输出,其中CpG二核苷酸的数量在限制范围内均匀变化。
进一步地,所述方法还包括:设置一个或多个参数,其中所述一个或多个参数包括群体大小、进化世代数、二进制交叉的分布指数、二 进制交叉的单点交叉率、比特翻转突变的突变率、比特翻转突变的分布指数参数或其任何组合。
进一步地,所述方法的终止条件包括:达到固定迭代数、最佳适应度达到平稳期且未产生更好的结果、一些解满足近最优解的最低标准,或其任何组合。
进一步地,所述执行CpG指数和协调指数的优化包括:按照CpG指数的升序和协调指数的降序对所述多个优化的核酸序列进行排名;选择一个或多个排名最高的优化的核酸序列用于合成。
进一步地,所述方法还包括:c)从所述多个优化的核酸序列的一个优化核酸序列中去除预定的不利子序列或基序。
进一步地,所述预定的不利子序列或基序基于对多个文本部分的分析来鉴定。
进一步地,去除所述预定的不利子序列或基序包括:鉴定所述优化的核酸序列中的所述预定的不利子序列或基序;基于所鉴定的预定的不利子序列或基序鉴定多个同义密码子;从所述多个同义密码子中选择同义密码子,以替换所述优化的核酸序列中所述所鉴定的预定的不利子序列或基序。
本发明提供一种存储一个或多个程序的非暂时性计算机可读存储介质,所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备实施上述方法。
本发明提供一种密码子优化的系统,所述系统包括:一个或多个处理器;内存;和一个或多个程序,其中所述一个或多个程序存储在所述内存中并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于实施上述方法的指令。
本发明提供一种密码子优化的电子设备,所述设备包括用于实施上述方法的工具。
本发明提供一种存储在可记录介质上的用于密码子优化的程序产品,所述程序产品包括用于实施上述方法的计算机软件。
本发明提供一种分离的核酸分子,所述核酸分子包含由上述方法获得的所述优化的核酸序列。
本发明提供一种载体,所述载体包含上述分离的核酸分子。
本发明提供一种重组宿主细胞,所述重组宿主细胞包含上述分离的核酸分子或载体。
本发明提供一种使蛋白质在宿主细胞中表达的方法,所述方法包括以下步骤:
a)使用上述方法获得在所述宿主细胞中表达所述蛋白质的优化的核酸序列;
b)合成包含所述优化的核酸序列的核酸分子;
c)将所述核酸分子转染到所述宿主细胞中以获得重组宿主细胞;
d)在允许所述优化的核酸序列表达所述蛋白质的条件下培养所述重组宿主细胞。
因此,本发明提供了基于CpG的密码子优化算法,解决CpG在蛋白表达水平和核酸免疫原性之间的矛盾。本发明的算法通过直接优化CpG指数和协调指数来降低核酸免疫原性的同时,还能很好地增强基因的表达量和表达持续性,无论基因是属于自体还是异源的。
附图说明
图1示出了本发明中密码子优化方法的流程图。
图2示出了实施例中序号1-10的CpG-ODNs序列。
图3示出了实施例中基于遗传算法NSGA-II的流程图。
图4示出了实施例中EGFP融合蛋白进行密码子优化前后的蛋白质印迹结果。
具体实施方式
本发明提供了一种降低外源核酸免疫原性的密码子优化方法。外源核酸,如转入哺乳动物细胞的外源DNA质粒、DNA疫苗、合成的寡脱氧核苷酸、RNA疫苗等,其本身也是一种抗原,会引起免疫反应, 如细胞因子的增加。“降低外源核酸免疫原性”是指通过本发明提供的密码子优化方法,降低这些外源核酸转入动物细胞中产生的免疫反应。
根据一些实施方案,密码子优化尤其基于两个目标:(i)优化CpG二核苷酸的个数;(ii)在优化CpG二核苷酸的个数的前提下将同义密码子置于其最合适的位置并使其和已知高表达序列在同义密码子的分布频率上高度协调。在一些实施方案中,这两个目标被量化为CpG指数和协调指数。在优化过程中,使用组合优化问题求解算法包括启发式算法(例如粒子群算法、遗传算法、免疫算法、蚁群算法、模拟退火等算法及其变种算法)来考虑目标。具体而言,对于给定的候选核酸序列,可以参考高表达的基因的已知特征来计算目标。在一些实施方案中,在基因合成和蛋白质表达之前,从一个或多个优化的序列中去除各种已知的不利基序和/或特征(例如,从文献中鉴定的)。
本发明还提供了系统、非暂时性计算机可读存储介质、电子设备和程序产品,其用于存储实施本文所述的方法的任何一个或多个步骤的一个或多个程序。还提供了包含从本文所述的方法获得的优化的核酸序列的分离的核酸分子;包含所述分离的核酸分子的载体;包含所述分离的核酸分子或所述载体的重组宿主细胞。还提供了用于使蛋白质在宿主细胞中表达的方法,其涉及本文所述的任何方法。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
密码子优化方法
本发明提出一种用于降低外源核酸免疫原性的密码子优化方法(图1),包括以下步骤:
a)获得初始核酸序列群体集,其中初始核酸序列群体集包含能够表达目标蛋白质的多个初始候选核酸序列;
b)基于初始核酸序列群体集,使用组合优化问题求解算法执行受 到限制的CpG指数和协调指数的优化,从而获得能够表达蛋白质的多个优化的低免疫原性核酸序列,其中受到限制的CpG指数是CpG二核苷酸的个数,变化范围被设为从0到目标蛋白质野生型基因的CpG二核苷酸的个数之间,协调指数指示多个高表达的基因和候选核酸序列之间的同义密码子的使用频率分布的一致性。
在一些实施方案中,高表达的基因来自于私有或公共数据库。对于一个蛋白而言,表达其的基因序列可能有多种,表达该蛋白的基因必然有表达水平的高低,所谓高表达的基因是表达水平相对高的那些基因。例如,高表达的基因可以取有表达数据的基因的前若干名,例如10名、20名、50名或100名;高表达的基因可以取有表达数据的基因的一个百分数,例如10%、20%或30%。不同基因的表达可以是绝对值的比较,例如相同条件下的比较;也可以是相对值,例如比野生型表达提高的倍数。发明人发现,高表达的基因的个数并不会实质性影响结果的趋势性,但为了结果的稳定性,优选大于5个或10个,更优选大于20个。例如,数据库可以是专有数据库,其包含从公司的订单系统收集的先前成功优化的订单。此外,高表达的基因也可以通过对各种培养条件下的RNA‐seq数据进行数据挖掘来获得,所述RNA‐seq数据可以是公共信息。进行数据处理的目的是获取高表达的基因的基本信息,如同义密码子频率。
获得初始核酸序列群体集包括:获得目标蛋白质序列;基于目标蛋白质序列产生初始核酸序列群体集。
获得初始核酸序列群体集包括:获得第一核酸序列;将第一核酸序列翻译成蛋白质序列;基于蛋白质序列产生初始核酸序列群体集。
初始核酸序列群体集具有预设大小。
初始核酸序列群体集包括多个初始候选核酸序列的二进制表示。
执行CpG指数和协调指数的优化包括:在受限范围内最小化CpG指数;最大化协调指数。
协调指数基于下式计算:H=1-D(Fhs,Fts),其中D()指示距离函数;其中Fhs包括包含多个高表达的基因内的多个氨基酸的同义密码子 的频率的矢量;并且其中Fts包括包含候选核酸序列的编码基因内的多个氨基酸的同义密码子的频率的矢量。
D()指示测量两个矢量之间的距离的函数。
D()为距离函数,其包括但不限于:两个矢量的欧几里德距离、余弦距离、曼哈顿距离或闵可夫斯基距离。
多个高表达的基因或候选核酸序列的同义密码子的频率被定义为:
个同义密码子。
组合优化问题求解算法包括启发式算法,例如粒子群算法、遗传算法、免疫算法、蚁群算法、模拟退火算法及其变种算法。
上述方法的终止条件包括:达到固定迭代数、最佳适应度达到平稳期且未产生更好的结果、一些解满足近最优解的最低标准,或其任何组合。
执行CpG指数和协调指数的优化包括:按照CpG指数的升序和协调指数的降序对多个优化的核酸序列进行排名;选择一个或多个排名最高的优化的核酸序列用于合成。
上述方法还包括:c)从多个优化的核酸序列的一个优化核酸序列中去除预定的不利子序列或基序。
不利子序列或基序是指导致蛋白质表达减少的负面因素,去除这些不利特征以便保持核酸序列已确立的优势。
预定的不利子序列或基序基于对多个文本部分的分析来鉴定。
去除预定的不利子序列或基序包括:鉴定优化的核酸序列中的预定的不利子序列或基序;基于所鉴定的预定的不利子序列或基序鉴定多个同义密码子;从多个同义密码子中选择同义密码子,以替换优化的核酸序列中所鉴定的预定的不利子序列或基序。
示例性实现方式
本文描述的示例性实现方式通过优化和表达Expi293F细胞系中一个EGFP融合基因(即EGFP基因融合CpG-ODNs序列)来举例说明本发明对密码子优化的效率。
CpG-ODNs序列是一类容易引起和诱导免疫反应的核苷酸序列。含有CpG-ODNs的外源DNA的表达可以直观的展示CpG个数在优化前后对融合蛋白编码基因的核苷酸序列的免疫原性影响。对原始CpG-ODNs添加额外碱基使序列长度变成三的整数倍并成为蛋白编码序列。碱基添加过程中尽量增加CpG个数的同时避免引入终止密码子。将添加了额外碱基的CpG-ODNs按序号1-10(见图2)的顺序首尾相连形成CpG-ODN-X序列(GGTGCATCGATGCAGGGGGGTTCCATGGACGTTCCTGAGCGTTCGTTCGTCGTTCGAACGACGTTGATCCGGTGCATCGATGCAGGGGGGCGTCCATGGACGTTCCTGAGCGTTCGTCGTCGTTCGAACGACGTTGATTCGTCGACGATCGGCGCGCGCCGC,SEQ ID NO:1),CpG-ODN-X能够编码氨基酸序列GASMQGGSMDVPERSFVVRTTLIRCIDAGGRPWTFLSVRRRSNDVDSSTIGARR(SEQ ID NO:2)。
由于应用Flag标签的抗体执行蛋白质印迹以便评估表达水平,所以在两个融合蛋白编码序列的C末端附加Flag标签,同时使用β-肌动蛋白(即beta-actin)作为加载对照,具体信息如表1所示。
表1:EGFP融合蛋白序列优化前后的信息
EGFP融合蛋白A序列含有40个CpG二核苷酸,序列为
EGFP融合蛋白B序列通过遗传算法NSGA-II进行密码子优化得到,EGFP融合蛋白B序列与EGFP融合蛋白A序列编码同样的融合蛋白。NSGA-II算法是Srinivas和Deb于2000年在NSGA的基础上提出的,该算法采用快速非支配排序算法,计算复杂度比NSGA大大的降低;该算法采用拥挤度和拥挤度比较算子,在快速排序后的同级比较中作为胜出标准,使准帕累托(Pareto)域中的个体能扩展到整个Pareto域,并均匀分布,保持了种群的多样性;此外,该算法还引入了精英策略,扩大了采样空间,防止最佳个体的丢失,提高了算法的运算速度和 鲁棒性。优化过程如图3所示。优化期间,群体大小被设置为100,个体被二进制编码并随机产生,其长度等于蛋白质氨基酸数目的3倍,进化世代数等于200,000,划分数目取决于适应度函数的数目,所模拟二进制交叉的分布指数为15.0,所模拟二进制交叉的单点交叉率为0.9,比特翻转突变的突变率为1.0/L,比特翻转突变的分布指数为20.0。
在最小化CpG指数和最大化协调指数后,上述蛋白质具有几个输出最佳编码基因,其中只有一个具有最小化CpG指数、最大协调指数的基因被选择用于随后的表达测试。
EGFP融合蛋白B序列含有0个CpG二核苷酸,序列为
本文提交的序列表包括四个序列:CpG-ODN-X序列(SEQ ID NO:1)、CpG-ODN-X编码的氨基酸序列(SEQ ID NO:2)、EGFP融合蛋白A序列(SEQ ID NO:3)和EGFP融合蛋白B序列(SEQ ID NO:4)。
下面描述用于评价优化基因相对于相同基因的野生型性能的实验的详细步骤。
步骤1:瞬时转染和细胞培养
1.使用EcoRI和HindIII酶将上述合成的基因克隆到pcDNA3.4 载体中。在FreeStyle 293表达培养基中培养Expi293F细胞,并使用标准分子生物学技术以合适的细胞-载体比率(即,相对于1μg/mL的载体浓度,转染密度2.0-3.0×106/mL)完成载体的瞬时转染。
2.瞬时转染后,将Expi293F细胞在37℃下在5%CO2下悬浮培养,持续培养4天。
步骤2:细胞破碎
1.培养到第4天取样检测,从上游获取培养的细胞,在4℃下离心(10,000 x g)2min。分离去除上清液,上清液留作后续细胞因子检测实验。
2.添加1mL 1×PBS以重悬在Eppendorf管底部的细胞。然后在4℃离心(10,000 x g)2min,弃去上清液。
3.每1×106个细胞向Eppendorf管中添加200μL裂解缓冲液(低渗缓冲液[10mM Tris、1.5mM MgCl2、10mM KCl,pH 7.9]+0.5%DDM、PMSF[终浓度1mM]、核酸酶混合液)。用移液器重悬细胞。
4.将细胞置于杯状超声细胞破碎器中进行细胞破碎(4℃,3s超声,1s间隔,共10min)。
5.破碎后,在4℃下离心(12,000x g)20min。回收上清液。
步骤3:样品处理
1.使用BCA法测量上清液的蛋白浓度。
2.用上样缓冲液处理部分上清液。
步骤4:电泳和蛋白质印迹
1.加载步骤3经处理的样品进行SDS-PAGE电泳(每个样品加入量为5μg)。
2.电泳后,按照以下步骤完成蛋白质印迹实验:
1)转移:在SDS-PAGE后取出凝胶,并将蛋白质从凝胶转移至PVDF膜上(转移缓冲液:将200mL 5x转移溶液添加到150mL绝对乙醇中并稀释至1L,并转移17min)。
2)封闭:转移后,用快速封闭溶液将PVDF封闭10min。
3)孵育:封闭后,与5%牛奶和相应的标记的抗体一起孵育45min。Flag标签蛋白检测:添加1:3000稀释的鼠抗flag mAb(GenScript,Cat.No.A00187),检测目标蛋白为原样稀释5倍的上样液(5μL),然后添加100ng的Marker(GenScript,Cat.No.M0101);β-肌动蛋白检测:添加1:1000稀释的THETM β肌动蛋白鼠抗mAb(GenScript,Cat.No.A00702),然后均添加1:2500稀释的标记的二抗抗鼠IgG(全分子)-过氧化物酶抗体(兔子产生,Sigma,Cat.No.A9044)。
4)暴露:抗体孵育后,使用ChemiDocTM接触成像系统执行暴露成像(24s),并将图像保存到指定位置进行编辑。
图4是蛋白质印迹结果,其阐明了根据本公开的实施方案的Expi293F细胞系中EGFP融合蛋白A序列(泳道1)和EGFP融合蛋白B序列(泳道2)的表达比较,其中仅测试最小CpG指数和最高协调指数的优化解以进行表达比较(野生型作为对照)。显然证明,相对于几乎未改变的内部对照β-肌动蛋白(即beta-actin),本发明通过密码子优化的EGFP融合蛋白序列B是有效的并且促进了表达,其表达量远远多于未进行优化的EGFP融合蛋白A序列。左侧泳道是Marker。
5)使用CISBIO Human IL2kit试剂盒(货号:62HIL02PET)和CISBIO Human IFN gamma kit试剂盒(货号:62HIFNGPET)分别对步骤2留存的培养第4天的细胞上清以及空白培养基进行细胞因子IL-2和IFN-g的检测。检测结果如下表2所示(已扣除空白对照培养基中细胞因子背景值)。
表2:EGFP融合蛋白A序列和B序列的IL-2和IFN-g检测结果
从表2中可见,优化后的融合蛋白编码序列的CG个数下降,诱导产生的细胞因子数量随之降低,免疫原性也降低。综上,使用NSGA-II算法根据本发明的方法对核酸序列进行密码子优化,使得优化后的核酸序列CG个数减少,实现了蛋白质表达量增加同时降低免疫原性。可以预见利用本发明的方法使用其他算法也可以实现上述结果。
相关应用
本发明提供一种存储一个或多个程序的非暂时性计算机可读存储介质,所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备实施上述方法。
本发明提供一种用于降低外源核酸免疫原性的密码子优化的系统,所述系统包括:一个或多个处理器;内存;和一个或多个程序,其中所述一个或多个程序存储在所述内存中并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于实施上述方法的指令。
本发明提供一种用于降低外源核酸免疫原性的密码子优化的电子设备,所述设备包括用于实施上述方法的工具。
本发明提供一种存储在可记录介质上的用于降低外源核酸免疫原性的密码子优化的程序产品,所述程序产品包括用于实施上述方法的计算机软件。
本发明提供一种分离的核酸分子,所述核酸分子包含由上述方法获得的所述优化的核酸序列。
本发明提供一种载体,所述载体包含上述分离的核酸分子。
本发明提供一种重组宿主细胞,所述重组宿主细胞包含上述分离的核酸分子或载体。
本发明提供一种使蛋白质在宿主细胞中表达的方法,所述方法包括以下步骤:
a)使用上述方法获得在所述宿主细胞中表达所述蛋白质的优化的核酸序列;
b)合成包含所述优化的核酸序列的核酸分子;
c)将所述核酸分子转染到所述宿主细胞中以获得重组宿主细胞;
d)在允许所述优化的核酸序列表达所述蛋白质的条件下培养所述重组宿主细胞。
最后需要说明的是,以上实施例仅用以说明本发明的技术方案而非限制技术方案,本领域的普通技术人员应当理解,那些对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,均应涵盖在本发明的权利要求范围当中。

Claims (30)

  1. 一种密码子优化方法,其特征在于,所述方法包括以下步骤:
    a)获得初始核酸序列群体集,其中所述初始核酸序列群体集包含能够表达目标蛋白质的多个初始候选核酸序列;和
    b)基于所述初始核酸序列群体集,使用组合优化问题求解算法执行受到限制的CpG指数和协调指数的优化,从而获得能够表达所述蛋白质的多个优化的核酸序列,
    其中所述受到限制的CpG指数是CpG二核苷酸的个数,变化范围被设为从0到所述目标蛋白质野生型基因的CpG二核苷酸的个数之间,
    所述协调指数指示多个高表达的基因和所述候选核酸序列之间的同义密码子的使用频率分布的一致性。
  2. 根据权利要求1所述的方法,其特征在于,所述获得初始核酸序列群体集包括:
    获得目标蛋白质序列;
    基于所述目标蛋白质序列产生所述初始核酸序列群体集。
  3. 根据权利要求1所述的方法,其特征在于,所述获得初始核酸序列群体集包括:
    获得第一核酸序列;
    将所述第一核酸序列翻译成蛋白质序列;
    基于所述蛋白质序列产生所述初始核酸序列群体集。
  4. 根据权利要求1‐3中任一项所述的方法,其特征在于,所述初始核酸序列群体集具有预设大小。
  5. 根据权利要求1‐4中任一项所述的方法,其特征在于,所述初始核酸序列群体集包括所述多个初始候选核酸序列的二进制表示。
  6. 根据权利要求1‐5中任一项所述的方法,其特征在于,所述执行CpG指数和协调指数的优化包括:
    在受限范围内最小化所述CpG指数;
    最大化所述协调指数。
  7. 根据权利要求1-6中任一项所述的方法,其特征在于,所述协 调指数基于下式计算:H=1-D(Fhs,Fts),
    其中D()指示距离函数;
    其中Fhs包括包含多个高表达的基因内的多个氨基酸的同义密码子的频率的矢量;并且
    其中Fts包括包含所述候选核酸序列的编码基因内的多个氨基酸的同义密码子的频率的矢量。
  8. 根据权利要求7所述的方法,其特征在于,所述D()指示测量两个矢量之间的距离的函数。
  9. 根据权利要求8所述的方法,其特征在于,所述D()为距离函数,其包括:两个矢量的欧几里德距离、余弦距离、曼哈顿距离或闵可夫斯基距离。
  10. 根据权利要求7-9中任一项所述的方法,其特征在于,所述多个高表达的基因或候选核酸序列的同义密码子的频率被定义为:
    个同义密码子。
  11. 根据权利要求1-10中任一项所述的方法,其特征在于,所述组合优化问题求解算法包括启发式算法;优选地,所述启发式算法选自粒子群算法、遗传算法、免疫算法、蚁群算法、模拟退火算法及其变种算法中的一种或多种。
  12. 根据权利要求1-10中任一项所述的方法,其特征在于,所述组合优化问题求解算法是NSGA-II算法。
  13. 根据权利要求12所述的方法,其特征在于,所述方法包括以下步骤:
    a)初始化核酸序列群体集Pt并将当前进化代数Gen设置为1;
    b)基于Pt产生后代核酸序列群体集Qt
    c)将Pt与Qt合并为新的核酸序列群体集Rt
    d)计算Rt中候选核酸序列的CpG指数和协调指数,并执行快速非支配排序、计算拥挤度生成新的核酸序列群体集Pt
    e)判断当前代数是否小于进化世代数T:若是,则进化代数Gen 自增1,并返回b);否则,输出非支配解集,并停止。
  14. 根据权利要求13所述的方法,其特征在于,所述后代核酸序列群体集通过二进制锦标赛选择、交叉/重组、突变或其任何组合产生。
  15. 根据权利要求13或14所述的方法,其特征在于,所述初始核酸序列群体集和所述后代核酸序列群体集具有相同的大小。
  16. 根据权利要求13-15中任一项所述的方法,其特征在于,所述方法还包括提供指示分布在帕累托最优前沿的多个优化核酸序列的输出,其中CpG二核苷酸的数量在限制范围内均匀变化。
  17. 根据权利要求13-16中任一项所述的方法,其特征在于,所述方法还包括:设置一个或多个参数,其中所述一个或多个参数包括群体大小、进化世代数、二进制交叉的分布指数、二进制交叉的单点交叉率、比特翻转突变的突变率、比特翻转突变的分布指数参数或其任何组合。
  18. 根据权利要求1-17中任一项所述的方法,其特征在于,所述方法的终止条件包括:达到固定迭代数、最佳适应度达到平稳期且未产生更好的结果、一些解满足近最优解的最低标准,或其任何组合。
  19. 根据权利要求1-18中任一项所述的方法,其特征在于,所述执行CpG指数和协调指数的优化包括:
    按照CpG指数的升序和协调指数的降序对所述多个优化的核酸序列进行排名;
    选择一个或多个排名最高的优化的核酸序列用于合成。
  20. 根据权利要求1-19中任一项所述的方法,其特征在于,所述方法还包括:
    c)从所述多个优化的核酸序列的一个优化核酸序列中去除预定的不利子序列或基序。
  21. 根据权利要求20所述的方法,其特征在于,所述预定的不利子序列或基序基于对多个文本部分的分析来鉴定。
  22. 根据权利要求20所述的方法,其特征在于,去除所述预定的不利子序列或基序包括:
    鉴定所述优化的核酸序列中的所述预定的不利子序列或基序;
    基于所鉴定的预定的不利子序列或基序鉴定多个同义密码子;
    从所述多个同义密码子中选择同义密码子,以替换所述优化的核酸序列中所述所鉴定的预定的不利子序列或基序。
  23. 一种存储一个或多个程序的非暂时性计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备实施权利要求1‐22中任一项所述的方法。
  24. 一种密码子优化的系统,其特征在于,所述系统包括:
    一个或多个处理器;
    内存;和
    一个或多个程序,其中所述一个或多个程序存储在所述内存中并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于实施权利要求1‐22中任一项所述的方法的指令。
  25. 一种密码子优化的电子设备,其特征在于,所述设备包括用于实施权利要求1‐22中任一项所述的方法的工具。
  26. 一种存储在可记录介质上的用于密码子优化的程序产品,其特征在于,所述程序产品包括用于实施权利要求1‐22中任一项所述的方法的计算机软件。
  27. 一种分离的核酸分子,其特征在于,所述核酸分子包含由权利要求1‐22中任一项所述的方法获得的所述优化的核酸序列。
  28. 一种载体,其特征在于,所述载体包含权利要求27所述的分离的核酸分子。
  29. 一种重组宿主细胞,其特征在于,所述重组宿主细胞包含权利要求27所述的分离的核酸分子或权利要求28所述的载体。
  30. 一种使蛋白质在宿主细胞中表达的方法,其特征在于,所述方法包括以下步骤:
    a)使用权利要求1‐22中任一项所述的方法获得在所述宿主细胞中表达所述蛋白质的优化的核酸序列;
    b)合成包含所述优化的核酸序列的核酸分子;
    c)将所述核酸分子转染到所述宿主细胞中以获得重组宿主细胞;和
    d)在允许所述优化的核酸序列表达所述蛋白质的条件下培养所述重组宿主细胞。
CN202380011162.2A 2022-09-30 2023-09-28 一种降低外源核酸免疫原性的密码子优化 Pending CN118077011A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202211212152 2022-09-30
CN2022112121529 2022-09-30
PCT/CN2023/122460 WO2024067780A1 (zh) 2022-09-30 2023-09-28 一种降低外源核酸免疫原性的密码子优化

Publications (1)

Publication Number Publication Date
CN118077011A true CN118077011A (zh) 2024-05-24

Family

ID=90476278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380011162.2A Pending CN118077011A (zh) 2022-09-30 2023-09-28 一种降低外源核酸免疫原性的密码子优化

Country Status (2)

Country Link
CN (1) CN118077011A (zh)
WO (1) WO2024067780A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002317771A1 (en) * 2001-06-05 2002-12-16 Cellectis Methods for modifying the cpg content of polynucleotides
ATE453716T1 (de) * 2004-08-03 2010-01-15 Geneart Ag Verfahren zur modulation der genexpression durch änderung des cpg gehalts
US8326547B2 (en) * 2009-10-07 2012-12-04 Nanjingjinsirui Science & Technology Biology Corp. Method of sequence optimization for improved recombinant protein expression using a particle swarm optimization algorithm
CN102864141A (zh) * 2012-09-13 2013-01-09 成都生物制品研究所有限责任公司 一种构建大容量同义密码库及优化基因模板的方法
EP3551758B1 (en) * 2016-12-07 2024-05-29 Gottfried Wilhelm Leibniz Universität Hannover Method and computersystem for codon optimisation
SG11202011455SA (en) * 2018-07-30 2020-12-30 Nanjing Genscript Biotech Co Ltd Codon optimization
CN116153402A (zh) * 2023-02-03 2023-05-23 深圳元育生物科技有限公司 基于深度学习模型进行密码子序列设计的方法和装置

Also Published As

Publication number Publication date
WO2024067780A1 (zh) 2024-04-04

Similar Documents

Publication Publication Date Title
EP3660852B1 (en) Codon optimization method based on immune algorithm
CN112513989B (zh) 密码子优化
Rout et al. A distinct nuclear import pathway used by ribosomal proteins
Smith et al. Expression and purification of glutathione‐S‐transferase fusion proteins
Matsuyama et al. pDUAL, a multipurpose, multicopy vector capable of chromosomal integration in fission yeast
JP4510640B2 (ja) タンパク質の発現を目的としてヌクレオチド配列を最適化する方法及び装置
WO2022253185A1 (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
EP2061883A2 (en) Matrix attachment regions (mars) for increasing transcription and uses thereof
CN113234702A (zh) 一种Lt1Cas13d蛋白及基因编辑系统
CN118077011A (zh) 一种降低外源核酸免疫原性的密码子优化
CN111378047A (zh) 一种提高蛋白表达的融合标签蛋白及其应用
Cregg et al. Expression of recombinant genes in the yeast Pichia pastoris
CN107034219B (zh) 一种gata2蛋白可结合dna片段及在gata2活性检测中的应用
EP0232845A2 (en) Inducible heat shock and amplification system
Suresh et al. Tools for retargeting proteins within Aspergillus nidulans
KR102617593B1 (ko) 바이러스 뉴클레오캡시드를 이용한 목적 단백질 발현 플랫폼
EP1291423A1 (en) Polyfunctional base sequence and artificial gene containing the same
Schendel Overview of Protein Expression in E. coli
CN113481218B (zh) 巨型病毒或巨型噬菌体来源氨酰tRNA合成酶/tRNA正交体系构建方法及正交体系
Kumagai et al. Minimum genome factories in Schizosaccharomyces pombe
WO2020204055A1 (ja) 標的特異的な外来遺伝子の導入方法
CN106978417B (zh) 一种HuR蛋白可识别的RNA片段及在HuR活性检测中的应用
Wheway Genetic Engineering of Ciliated Cells
Hustedt High-Throughput Sequencing Characterization of DNA Cyclization, with Applications to DNA Looping
US20030119068A1 (en) Use of proteinaceous molecules in methods for molecular computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination