CN106650307B - 一种基于密码子对使用频度的基因密码子优化方法 - Google Patents

一种基于密码子对使用频度的基因密码子优化方法 Download PDF

Info

Publication number
CN106650307B
CN106650307B CN201610838127.XA CN201610838127A CN106650307B CN 106650307 B CN106650307 B CN 106650307B CN 201610838127 A CN201610838127 A CN 201610838127A CN 106650307 B CN106650307 B CN 106650307B
Authority
CN
China
Prior art keywords
codon
inefficient
usage frequency
pair
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610838127.XA
Other languages
English (en)
Other versions
CN106650307A (zh
Inventor
李阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN BIORUN BIO-TECH Co Ltd
Original Assignee
WUHAN BIORUN BIO-TECH Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN BIORUN BIO-TECH Co Ltd filed Critical WUHAN BIORUN BIO-TECH Co Ltd
Priority to CN201610838127.XA priority Critical patent/CN106650307B/zh
Publication of CN106650307A publication Critical patent/CN106650307A/zh
Application granted granted Critical
Publication of CN106650307B publication Critical patent/CN106650307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提出了一种基于密码子对使用频度的基因密码子优化方法,本方案采用密码子对使用频度对目的基因进行优化,不光考虑单个密码子使用频度,同时考虑两个密码子联合使用情况,即:相邻密码子的关系,挑选物种中两个tRNA连用时频度较高的密码子对对目标基因进行优化起到关键作用。

Description

一种基于密码子对使用频度的基因密码子优化方法
技术领域
本发明涉及一种基于密码子对使用频度的基因密码子优化方法。
背景技术
为了提高基因产物的表达量,基因密码优化是分子生物学基因表达调控的常用手段,密码子优化在基因表达调控中起到非常关键的作用。常用的方式是通过分析某物种的密码子使用频度,选择频度高的密码子作为优化目的基因的候选密码。
“密码子对”是由orf中相邻两个密码子组成,因为蛋白翻译过程中核糖体的A位和P位要同时与两个tRNA结合然后逐个将氨基酸添加到以合成的多肽上,使多肽延长。但是同时结合在核糖体的tRNA的空间结构决定了其进入的难易程度,如果两个tRNA结合核糖体后相互抵触,就很难结合进入,那么蛋白合成就会被阻碍或者合成速度减慢。所以挑选物种中两个tRNA连用时频度较高的密码子对对目标基因进行优化起到关键作用。
发明内容
本发明提出一种基于密码子对使用频度的基因密码子优化方法,采用密码子对使用频度对目的基因进行优化,不光考虑单个密码子使用频度,同时考虑两个密码子联合使用情况,即:相邻密码子的关系。
本发明的技术方案是这样实现的:
一种基于密码子对使用频度的基因密码子优化方法,包括以下步骤:
(1)选择一个表达目的基因的物种,选取该物种大于1000条蛋白高表达的基因,根据这些基因统计该物种的密码子对实际使用频度;
(2)根据互联网数据库获得该物种密码子表,计算出该物种密码子对理论使用频度;
(3)根据实际使用频度和理论使用频度建立该物种的密码子对使用频度表
(4)选择一个要优化的目的基因,设定低效密码子对的参数标准,根据需要设定划分低效密码子对的参数,主要有两个参数:1,密码子对的实际使用频度mov;2,密码子对在该物种中的实际使用频度和理论使用频度的比值R=mov/mev;mov和R值越大表明此密码子对越容易被物种采用,即使R值比较大mov的绝对值也可能小,所以要两个参数联合限制,判定密码子对使用频度表中低效密码子对和高效密码子对;
(5)根据此标准逐个将orf中的密码子对到密码子对使用频度表中去对比分析,并将所有被认为低效的密码子对标定出来;
(6)对低效密码子对用高效的统一密码子对代替,对替换后的序列重复步骤(5)操作,直到orf序列中不存在低效密码子对。
优选地,密码子对优化时先对orf序列进行扫描,记录下所有符合参数设定的低效密码子对,然后对低效密码子对用高效的统一密码子对代替;对替代后的新的DNA序列进行扫描,记录下符合设定参数的低效密码子对,如果仍然存在低效密码子对,继续执行优化替代,直到新的DNA序列中不再有低效密码子对,即完成了对整条ORF所有的密码子对的优化。
本发明产生的有益效果为:基因优化现有常用的的是方式是通过分析某物种的密码子使用频度,选择频度高的密码子作为优化目的基因的候选密码,本方案采用密码子对使用频度对目的基因进行优化,不光考虑单个密码子使用频度,同时考虑两个密码子联合使用情况,即:相邻密码子的关系,挑选物种中两个tRNA连用时频度较高的密码子对对目标基因进行优化起到关键作用。
附图说明
图1为优化前的荧光亮度。
图2为优化后的同等条件下荧光亮度。
具体实施方式
一种基于密码子对使用频度的基因密码子优化方法,包括以下步骤:
(1)选择一个表达目的基因的物种,选取该物种大于1000条蛋白高表达的基因,根据这些基因统计该物种的密码子对实际使用频度;
(2)根据互联网数据库获得该物种密码子表,计算出该物种密码子对理论使用频度;
(3)根据实际使用频度和理论使用频度建立该物种的密码子对使用频度表
(4)选择一个要优化的目的基因,设定低效密码子对的参数标准,根据需要设定划分低效密码子对的参数,主要有两个参数:1,密码子对的实际使用频度mov;2,密码子对在该物种中的实际使用频度和理论使用频度的比值R=mov/mev;mov和R值越大表明此密码子对越容易被物种采用,即使R值比较大mov的绝对值也可能小,所以要两个参数联合限制,判定密码子对使用频度表中低效密码子对和高效密码子对;
(5)根据此标准逐个将orf中的密码子对到密码子对使用频度表中去对比分析,并将所有被认为低效的密码子对标定出来;
(6)对低效密码子对用高效的统一密码子对代替,对替换后的序列重复步骤(5)操作,直到orf序列中不存在低效密码子对。
优选地,密码子对优化时先对orf序列进行扫描,记录下所有符合参数设定的低效密码子对,然后对低效密码子对用高效的统一密码子对代替;对替代后的新的DNA序列进行扫描,记录下符合设定参数的低效密码子对,如果仍然存在低效密码子对,继续执行优化替代,直到新的DNA序列中不再有低效密码子对,即完成了对整条ORF所有的密码子对的优化。
实施例
建立水稻密码子对使用频度表
优化mGFP序列并进行表达测试:
mGFP原始序列:
对应氨基酸序列:
MKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKTRHNIEDGGVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYN*
含有低效密码子对:
判定条件:mov<100或者mov/mev<1/3。
荧光亮度如图1所示。
优化后序列
DNA序列:
氨基酸序列:
MKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKTRHNIEDGGVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYN*
含有低效密码子对:
判定条件:mov<100或者mov/mev<1/3。
1; aactga(N*):MOV:22; MEV:22; 709
同等条件下荧光亮度如图2所示。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于密码子对使用频度的基因密码子优化方法,其特征在于,包括以下步骤:
(1)选择一个表达目的基因的物种,选取该物种大于1000条蛋白高表达的基因,根据这些基因统计该物种的密码子对实际使用频度;
(2)根据互联网数据库获得该物种密码子表,计算出该物种密码子对理论使用频度;
(3)根据实际使用频度和理论使用频度建立该物种的密码子对使用频度表
(4)选择一个要优化的目的基因,设定低效密码子对的参数标准,根据需要设定划分低效密码子对的参数,主要有两个参数:1,密码子对的实际使用频度mov;2,密码子对在该物种中的实际使用频度和理论使用频度的比值R=mov/mev;mov和R值越大表明此密码子对越容易被物种采用,即使R值比较大mov的绝对值也可能小,所以要两个参数联合限制,判定密码子对使用频度表中低效密码子对和高效密码子对;
(5)根据此标准逐个将orf中的密码子对到密码子对使用频度表中去对比分析,并将所有被认为低效的密码子对标定出来;
(6)对低效密码子对用高效的统一密码子对代替,对替换后的序列重复步骤(5)操作,直到orf序列中不存在低效密码子对。
2.如权利要求1所述的一种基于密码子对使用频度的基因密码子优化方法,其特征在于,密码子对优化时先对orf序列进行扫描,记录下所有符合参数设定的低效密码子对,然后对低效密码子对用高效的统一密码子对代替;对替代后的新的DNA序列进行扫描,记录下符合设定参数的低效密码子对,如果仍然存在低效密码子对,继续执行优化替代,直到新的DNA序列中不再有低效密码子对,即完成了对整条ORF所有的密码子对的优化。
CN201610838127.XA 2016-09-21 2016-09-21 一种基于密码子对使用频度的基因密码子优化方法 Active CN106650307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610838127.XA CN106650307B (zh) 2016-09-21 2016-09-21 一种基于密码子对使用频度的基因密码子优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610838127.XA CN106650307B (zh) 2016-09-21 2016-09-21 一种基于密码子对使用频度的基因密码子优化方法

Publications (2)

Publication Number Publication Date
CN106650307A CN106650307A (zh) 2017-05-10
CN106650307B true CN106650307B (zh) 2019-04-05

Family

ID=58853072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610838127.XA Active CN106650307B (zh) 2016-09-21 2016-09-21 一种基于密码子对使用频度的基因密码子优化方法

Country Status (1)

Country Link
CN (1) CN106650307B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363904B (zh) * 2018-02-07 2019-06-28 南京林业大学 一种用于木本植物遗传密码子优化的CodonNX系统及其优化方法
CN109979539B (zh) * 2019-04-10 2020-10-02 电子科技大学 基因序列优化方法、装置及数据处理终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008137958A1 (en) * 2007-05-07 2008-11-13 The Regents Of The University Of California Cellobiohydrolase-encoding nucleotide sequences with refined translational kinetics and methods of making same
US7561972B1 (en) * 2008-06-06 2009-07-14 Dna Twopointo, Inc. Synthetic nucleic acids for expression of encoded proteins
CN101490262A (zh) * 2006-06-29 2009-07-22 帝斯曼知识产权资产管理有限公司 实现改进的多肽表达的方法
CN102693368A (zh) * 2012-05-10 2012-09-26 西北农林科技大学 一种牛全基因组密码对使用偏好性的检测方法
CN103476425A (zh) * 2007-03-30 2013-12-25 纽约州州立大学研究基金会 用于疫苗的减毒病毒

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6838256B2 (en) * 1996-02-12 2005-01-04 Gene Logic Inc. Coding sequences of the human BRCA1 gene
US20080046192A1 (en) * 2006-08-16 2008-02-21 Richard Lathrop Polypepetide-encoding nucleotide sequences with refined translational kinetics and methods of making same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101490262A (zh) * 2006-06-29 2009-07-22 帝斯曼知识产权资产管理有限公司 实现改进的多肽表达的方法
CN103476425A (zh) * 2007-03-30 2013-12-25 纽约州州立大学研究基金会 用于疫苗的减毒病毒
WO2008137958A1 (en) * 2007-05-07 2008-11-13 The Regents Of The University Of California Cellobiohydrolase-encoding nucleotide sequences with refined translational kinetics and methods of making same
US7561972B1 (en) * 2008-06-06 2009-07-14 Dna Twopointo, Inc. Synthetic nucleic acids for expression of encoded proteins
CN102693368A (zh) * 2012-05-10 2012-09-26 西北农林科技大学 一种牛全基因组密码对使用偏好性的检测方法

Also Published As

Publication number Publication date
CN106650307A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106650307B (zh) 一种基于密码子对使用频度的基因密码子优化方法
Woodruff et al. Registry in a tube: multiplexed pools of retrievable parts for genetic design space exploration
EP1796005A3 (en) A method of configuring a product
Nagaraj et al. Color image steganography based on pixel value modification method using modulus function
CN103810200B (zh) 开放式蛋白质鉴定的数据库搜索方法及其系统
KR101930253B1 (ko) 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법
O'Bryon et al. Flying blind, or just flying under the radar? The underappreciated power of de novo methods of mass spectrometric peptide identification
Vierstraete et al. Amplicon_sorter: A tool for reference‐free amplicon sorting based on sequence similarity and for building consensus sequences
CN110491447B (zh) 一种用于异源基因体外表达的密码子优化方法及应用
CN106529204B (zh) 一种基于半监督学习的交联质谱多谱排序方法
CN104036187A (zh) 计算机病毒类型确定方法及其系统
Bresler et al. Telescoper: de novo assembly of highly repetitive regions
CN111755067A (zh) 一种肿瘤新生抗原的筛选方法
CN106530361A (zh) 彩色人脸图像的颜色校正方法
CN104182658A (zh) 一种串联质谱谱图鉴定方法
CN114360645A (zh) 一种蛋白质表达体系的密码子优化方法及蛋白质表达体系
CN102789553B (zh) 利用长转录组测序结果装配基因组的方法及装置
Frisby et al. Identifying promising sequences for protein engineering using a deep transformer protein language model
Kuśmirek et al. Linking De Novo Assembly Results with Long DNA Reads Using the dnaasm‐link Application
Sebastiana et al. A possible approach for gel-based proteomic studies in recalcitrant woody plants
CN105219765A (zh) 利用蛋白质序列构建基因组的方法和装置
Zhang et al. A complexity-based method to compare RNA secondary structures and its application
CN110021356A (zh) 利用转录组数据获取岷县龙胆叶绿体基因组序列的方法
CN106404878B (zh) 基于多组学丰度信息的蛋白质二级质谱鉴定方法
CN107292125B (zh) 设计目标区域特异性液相探针的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A gene codon optimization method based on codon pair usage frequency

Effective date of registration: 20230324

Granted publication date: 20190405

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: WUHAN BIORUN BIOTECHNOLOGY LLC

Registration number: Y2023420000120

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20190405

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: WUHAN BIORUN BIOTECHNOLOGY LLC

Registration number: Y2023420000120

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A gene codon optimization method based on codon pair usage frequency

Granted publication date: 20190405

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: WUHAN BIORUN BIOTECHNOLOGY LLC

Registration number: Y2024980010183

PE01 Entry into force of the registration of the contract for pledge of patent right