CN113096731B - 载体生产周期的预估方法、计算机存储介质及电子设备 - Google Patents

载体生产周期的预估方法、计算机存储介质及电子设备 Download PDF

Info

Publication number
CN113096731B
CN113096731B CN202110271778.6A CN202110271778A CN113096731B CN 113096731 B CN113096731 B CN 113096731B CN 202110271778 A CN202110271778 A CN 202110271778A CN 113096731 B CN113096731 B CN 113096731B
Authority
CN
China
Prior art keywords
time
gene sequence
production cycle
vector
set value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110271778.6A
Other languages
English (en)
Other versions
CN113096731A (zh
Inventor
胡杨俊
韩永红
丘佳倩
蓝田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunzhou Biotechnology (Guangzhou) Co.,Ltd.
Original Assignee
Yunzhou Biosciences (guangzhou) Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunzhou Biosciences (guangzhou) Inc filed Critical Yunzhou Biosciences (guangzhou) Inc
Priority to CN202110271778.6A priority Critical patent/CN113096731B/zh
Publication of CN113096731A publication Critical patent/CN113096731A/zh
Application granted granted Critical
Publication of CN113096731B publication Critical patent/CN113096731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种载体生产周期的预估方法、存储介质和电子设备,方法包括以下步骤:S1、获取需要插入载体的基因序列的序列信息;S2、判断基因序列的长度是否大于第一设定值,当基因序列的长度小于等于第一设定值时,载体的生产周期为第一时间,当基因序列的长度大于第一设定值时,执行步骤S3;S3、计算基因序列的长度与第一设定值的差值;S4、判断基因序列的长度是否大于第二设定值,当基因序列的长度小于等于第二设定值时,载体的生产周期为第二时间,当基因序列的长度大于第二设定值时,执行步骤S5;S5、判断基因序列是否符合第一条件和第二条件,当基因序列不符合第一条件和第二条件时,载体的生产周期为第三时间。

Description

载体生产周期的预估方法、计算机存储介质及电子设备
技术领域
本发明涉及载体构建领域,更具体地,涉及一种载体生产周期的预估方法、计算机存储介质以及电子设备。
背景技术
随着生物技术的不断进步,带来载体的极大市场需求。目前载体都是通过Gateway,Gibson,退火连接等构建方法把一个载体分解成不同的步骤,然后把完成这些步骤的所有周期加起来就是这个载体的构建周期。但是因为载体种类很多、基因毒性、序列的复杂程度、载体拼接的效率等不同,导致很难实现载体生成周期的预估,影响了技术人员对载体的构建周期的时间安排和规划,存在改进需要。
发明内容
为解决上述技术问题,本发明提供一种载体生产周期的预估方法、计算机存储介质和电子设备,可以准确估算出载体生产周期,方便技术人员对载体生产过程中的操作进行合理的时间分配。
根据本发明第一方面实施例的载体生产周期的预估方法,包括以下步骤:S1、获取需要插入载体的基因序列的序列信息;S2、判断所述基因序列的长度是否大于第一设定值,当所述基因序列的长度小于等于所述第一设定值时,所述载体的生产周期为第一时间,当所述基因序列的长度大于所述第一设定值时,执行步骤S3;S3、计算所述基因序列的长度与所述第一设定值的差值,所述差值n为大于0的整数,所述差值n每增加1KB,所述载体的生产周期在所述第一时间的基础上增加第一时间段,所述载体的生产周期为第二时间,所述第二时间为所述第一时间与n个所述第一时间段之和;S4、判断所述基因序列的长度是否大于第二设定值,所述第二设定值大于所述第一设定值,当所述基因序列的长度小于等于所述第二设定值时,所述载体的生产周期为第二时间,当所述基因序列的长度大于所述第二设定值时,执行步骤S5;S5、判断所述基因序列是否符合第一条件和第二条件,当所述基因序列不符合所述第一条件和所述第二条件时,所述载体的生产周期为第三时间,所述第三时间为在所述第二时间的基础上增加第二时间段,当所述基因序列符合所述第一条件和所述第二条件中的至少一个时,所述载体的生产周期为在所述第二时间的基础上增加不超过两个所述第二时间段,其中,所述第一条件为所述基因序列中GC含量大于设定比例,所述第二条件为所述基因序列中存在重复序列。
根据本发明实施例的载体生产周期的预估方法,通过对插入载体的基因序列的特征进行分析,结合基因序列的长度、GC含量、是否存在重复序列等特征进行综合判断,进而估算出载体生产周期的具体时间,便于技术人员对于载体生产周期内其他操作的时间进行合理安排,从而整体提高载体生产的效率。
根据本发明的一个实施例,所述重复序列包括:连续超过15个单一碱基的序列。
根据本发明的一个实施例,所述重复序列还包括:多个碱基段连续重复8次以上的序列,每个所述碱基段包括2-10个碱基。
根据本发明的一个实施例,所述重复序列还包括:连续30个及30个以上的不同碱基出现超过两次及两次以上的序列。
根据本发明的一个实施例,还包括以下步骤:S6、判断所述载体的培养温度是否处于设定温度范围,若所述培养温度处于所述设定温度范围,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述培养温度低于所述设定温度范围,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第三时间段。
根据本发明的一个实施例,还包括以下步骤:S7、判断所述基因序列是否具有毒性,若所述基因序列没有毒性,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述基因序列具有毒性,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第四时间段。
根据本发明的一个实施例,所述第一设定值为3KB,所述第一时间为15天-16天,所述第一时间段为2天。
根据本发明的一个实施例,所述第二设定值为7KB,所述第二时间段为10天。
第二方面,本发明实施例提供一种计算机存储介质,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如上述实施例所述的方法。
根据本发明第三方面实施例的电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令;所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如上述任一实施例所述的方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例的电子设备的示意图。
附图标记:
电子设备300;
存储器310;操作系统311;应用程序312;
处理器320;网络接口330;输入设备340;硬盘350;显示设备360。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面首先对本申请中所提到的专有名词进行解释。
载体:指在基因工程重组DNA技术中将DNA片段(目的基因)转移至受体细胞的一种能自我复制的DNA分子。三种最常用的载体是细菌质粒、噬菌体和动植物病毒。在实际生活中,胰岛素就可以通过使用载体将已插入胰岛素基因片段的质粒放入大肠杆菌内。经过插入基因片段的质粒就称作载体。该质粒在细菌内可以进行自我复制,并且不会影响到生物原来的活动。
载体生产周期:通过Gateway,Gibson,退火连接等构建方法把一个载体分解成不同的步骤,然后把完成这些步骤的所有周期加起来就是这个载体的构建周期。
下面具体描述根据本发明实施例的载体生产周期的预估方法。
根据本发明实施例的载体生产周期的预估方法包括以下步骤:
S1、获取需要插入载体的基因序列的序列信息。
S2、判断所述基因序列的长度是否大于第一设定值,当所述基因序列的长度小于等于所述第一设定值时,所述载体的生产周期为第一时间,当所述基因序列的长度大于所述第一设定值时,执行步骤S3。
S3、计算所述基因序列的长度与所述第一设定值的差值,所述差值n为大于0的整数,所述差值n每增加1KB,所述载体的生产周期在所述第一时间的基础上增加第一时间段,所述载体的生产周期为第二时间,所述第二时间为所述第一时间与n个所述第一时间段之和。
S4、判断所述基因序列的长度是否大于第二设定值,所述第二设定值大于所述第一设定值,当所述基因序列的长度小于等于所述第二设定值时,所述载体的生产周期为第二时间,当所述基因序列的长度大于所述第二设定值时,执行步骤S5。
S5、判断所述基因序列是否符合第一条件和第二条件,当所述基因序列不符合所述第一条件和所述第二条件时,所述载体的生产周期为第三时间,所述第三时间为在所述第二时间的基础上增加第二时间段,
当所述基因序列符合所述第一条件和所述第二条件中的至少一个时,所述载体的生产周期为在所述第二时间的基础上增加不超过两个所述第二时间段,
其中,所述第一条件为所述基因序列中GC含量大于设定比例,所述第二条件为所述基因序列中存在重复序列。
换句话说,根据本发明实施例的载体生产周期的预估方法在估算载体的生产周期时,首先确定需要插入该载体的基因序列,然后根据该基因序列的序列信息,例如长度信息,GC含量信息,是否有重复序列等信息,结合特定的设定条件,综合判断该载体的生产周期。
其中,对于基因序列的长度信息,当基因序列的长度较小时,例如小于等于第一设定值时,则载体的生产周期为载体进行培养的基础时间,例如基于复制子为puc ori的载体的生产周期为15天-16天。当基因序列的长度较大时,例如大于第一设定值时,载体的生产周期则会根据基因序列的长度进行相应的变化,例如可以是:基因序列的长度每增加1KB,对应的,载体的生产周期就会增加第一时间段。
例如,所述第一设定值为3KB,所述第一时间为15天-16天,所述第一时间段为2天。
也就是说,当插入的基因序列的长度小于或等于3KB时,该载体的生产周期为15天-16天;当插入的基因序列的长度为4KB时,基因序列的长度与第一设定值的差值为1,则载体的生产周期在15天-16天的基础上增加2天,为17天-18天;当插入的基因序列的长度为5KB时,基因序列的长度与第一设定值的差值为2,则载体的生产周期在15天-16天的基础上增加4天,为19天-20天,其他时间以此类推。
当基因序列的长度很大时,判断基因序列的长度是否大于第二设定值,如果不大于第二设定值,则依然按照步骤S3估算载体的生产周期,即第二时间。如果基因序列的长度大于第二设定值,则需要判断该基因序列是否符合第一条件或者第二条件。
其中,第一条件是指基因序列中GC含量大于设定比例,例如GC含量大于80%,判断基因序列是否符合第一条件则是判断基因序列中GC含量是否大于80%,若GC含量大于80%,则说明符合第一条件,若不大于80%,则说明不符合第一条件。第二条件是指基因序列中含有重复序列,如果基因序列中含有重复序列,则说明符合第二条件,如果基因序列中不含有重复序列,则说明不符合第二条件。
当基因序列既不符合第一条件,也不符合第二条件时,在该情况下,则在第二时间的基础上,再增加一个第二时间段作为载体的生产周期。
当基因序列符合第一条件和第二条件中的任何一个时,则在第二时间的基础上,增加一个第二时间段之后,再增加一个第二时间段,即增加两个第二时间段作为载体的生产周期。
当基因序列同时符合第一条件和第二条件时,依然按照基因序列符合第一条件和第二条件中的任何一个的方式估算载体的生产周期,即根据基因序列的长度特征,在第二时间的基础上,最多增加两个第二时间段作为载体的生产周期。
例如,所述第二设定值为7KB,所述第二时间段为10天。
也就是说,当插入的基因序列的长度为4KB-7KB之间时,如果基因序列的长度与第一设定值的差值为1,则载体的生产周期在15天-16天的基础上增加2天,为17天-18天;当基因序列的长度与第一设定值的差值为2,则载体的生产周期在15天-16天的基础上增加4天,为19天-20天,其他时间以此类推。
当基因序列的长度大于7KB时,则继续判断基因序列中GC含量是否大于80%,以及基因序列中是否含有重复序列。如果基因序列的GC含量既不大于80%,基因序列中也不存在重复序列,则载体的生产周期=第一时间+2n+10天。如果基因序列符合第一条件和第二条件中的任意一个或两个,则载体的生产周期=第一时间+2n+10天+10天。
由此,根据本发明实施例的载体生产周期的预估方法,通过对插入载体的基因序列的特征进行分析,结合基因序列的长度、GC含量、是否存在重复序列等特征进行综合判断,进而估算出载体生产周期的具体时间,便于技术人员对于载体生产周期内其他操作的时间进行合理安排,从而整体提高载体生产的效率。
根据本发明的一个实施例,所述重复序列包括:连续超过15个单一碱基的序列。
也就是说,当基因序列中有连续超过(包括15)15个单一碱基的重复序列,例如20个连续的A重复,出现一次即判定基因序列中存在重复序列。
在本发明的另一个具体实施方式中,所述重复序列还包括:多个碱基段连续重复8次以上的序列,每个所述碱基段包括2-10个碱基。
具体地,当基因序列中具有连续的2个或者3个或者4或者5个或者6个或者7个或者8个或者9个或者10个碱基连续重复8次以上,即判断该基因序列中存在重复序列,例如基因序列中含有如下基因片段时即判断存在重复序列:CACACACACACA,CAGCAGCAGCAGCAG,CAGTCAGTCAGTCAGTCAGT等。
可选地,根据本发明的一个实施例,所述重复序列还可以包括:连续30个及30个以上的不同碱基出现超过两次及两次以上的序列。其中需要说明的是,Popular Promoters和Popular ORF序列不包含在上述判断重复序列的情况。
在本发明的一些优选实施方式中,载体生产周期的预估方法还包括以下步骤:
S6、判断所述载体的培养温度是否处于设定温度范围,若所述培养温度处于所述设定温度范围,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述培养温度低于所述设定温度范围,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第三时间段。
换句话说,在对基因序列的长度、GC含量以及是否存在重复序列的特征进行分析的基础上,本申请还对载体的培养环境进行了考虑,尤其是培养温度。当载体的培养温度处于设定的温度范围之内时,例如35℃-38℃之间,此时,载体的生产周期则是以基因序列的长度、GC含量以及是否存在重复序列的特征所估算得到的时间;当载体的培养温度低于该设定温度范围时,则需要在以基因序列的长度、GC含量以及是否存在重复序列的特征所估算得到的时间的基础上增加第三时间段,例如增加10天。
可选地,根据本发明的一个实施例,载体生产周期的预估方法还包括以下步骤:S7、判断所述基因序列是否具有毒性,若所述基因序列没有毒性,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述基因序列具有毒性,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第四时间段。
也就是说,在对基因序列的长度、GC含量以及是否存在重复序列的特征进行分析的基础上,本申请还对基因序列是否存在毒性进行分析,如果基因没有毒性,此时,载体的生产周期则是以基因序列的长度、GC含量以及是否存在重复序列的特征所估算得到的时间;如果基因序列具有毒性,则需要在以基因序列的长度、GC含量以及是否存在重复序列的特征所估算得到的时间的基础上增加第四时间段,例如增加10天。
其中,判断基因序列是否有毒性的方法为:
毒性主要会在克隆生长,序列复制上面出现一些现象,比如菌落生长很慢,甚至不生长,或者复制出来的序列对比原序列有碱基突变,缺失,插入等,而且这种现象是在多数克隆中出现,如果仅仅只是个别克隆出现这种情况的可能由于序列复制自身的一些错误。
目前判断基因序列是否具有毒性的范围很广,但目前经验判定有毒性基因居多的是通过比对原基因是否出现缺失、突变以及插入等情况,假如有上述情况出现,很大几率就是基因有毒性。
由此,通过对载体培养的环境,以及基因序列是否有毒性,可以进一步提高判断载体的生产周期的准确性。
此外,本发明还提供一种计算机存储介质,计算机存储介质包括一条或多条计算机指令,一条或多条计算机指令在执行时实现上述任一的载体生产周期的预估方法。
也就是说,计算机存储介质存储有计算机程序,计算机程序被处理器运行时,使得处理器执行上述任一的载体生产周期的预估方法。
如图1所示,本发明实施例提供了一种电子设备300,包括存储器310和处理器320,所述存储器310用于存储一条或多条计算机指令,所述处理器320用于调用并执行所述一条或多条计算机指令,从而实现上述任一所述的方法。
也就是说,电子设备300包括:处理器320和存储器310,在所述存储器310中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器320执行上述任一所述的方法。
进一步地,如图1所示,电子设备300还包括网络接口330、输入设备340、硬盘350、和显示设备360。
上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器320代表的一个或者多个中央处理器(CPU),以及由存储器310代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
所述网络接口330,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘350中。
所述输入设备340,可以接收操作人员输入的各种指令,并发送给处理器320以供执行。所述输入设备340可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
所述显示设备360,可以将处理器320执行指令获得的结果进行显示。
所述存储器310,用于存储操作系统运行所必须的程序和数据,以及处理器320计算过程中的中间结果等数据。
可以理解,本发明实施例中的存储器310可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。本文描述的装置和方法的存储器310旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器310存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统311和应用程序312。
其中,操作系统311,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序312,包含各种应用程序,例如浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序312中。
本发明上述实施例揭示的方法可以应用于处理器320中,或者由处理器320实现。处理器320可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器320可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器310,处理器320读取存储器310中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ASIC)、数字信号处理器DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
具体地,处理器320还用于读取所述计算机程序,执行上述任一所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种载体生产周期的预估方法,其特征在于,包括以下步骤:
S1、获取需要插入载体的基因序列的序列信息;
S2、判断所述基因序列的长度是否大于第一设定值,当所述基因序列的长度小于等于所述第一设定值时,所述载体的生产周期为第一时间,当所述基因序列的长度大于所述第一设定值时,执行步骤S3;
S3、计算所述基因序列的长度与所述第一设定值的差值,所述差值n为大于0的整数,所述差值n每增加1KB,所述载体的生产周期在所述第一时间的基础上增加第一时间段,所述载体的生产周期为第二时间,所述第二时间为所述第一时间与n个所述第一时间段之和;
S4、判断所述基因序列的长度是否大于第二设定值,所述第二设定值大于所述第一设定值,当所述基因序列的长度小于等于所述第二设定值时,所述载体的生产周期为第二时间,当所述基因序列的长度大于所述第二设定值时,执行步骤S5;
S5、判断所述基因序列是否符合第一条件和第二条件,当所述基因序列不符合所述第一条件和所述第二条件时,所述载体的生产周期为第三时间,所述第三时间为在所述第二时间的基础上增加一个第二时间段;当所述基因序列符合所述第一条件和所述第二条件中的任何一个时,所述载体的生产周期为在所述第二时间的基础上增加两个第二时间段;当所述基因序列同时符合第一条件和第二条件时,所述载体的生产周期为在第二时间的基础上,最多增加两个所述第二时间段;
其中,所述第一条件为所述基因序列中GC含量大于设定比例,所述第二条件为所述基因序列中存在重复序列。
2.根据权利要求1所述的方法,其特征在于,所述重复序列包括:连续超过15个单一碱基的序列。
3.根据权利要求1所述的方法,其特征在于,所述重复序列还包括:多个碱基段连续重复8次以上的序列,每个所述碱基段包括2-10个碱基。
4.根据权利要求1所述的方法,其特征在于,所述重复序列还包括:连续30个以上的不同碱基出现两次以上的序列。
5.根据权利要求1所述的方法,其特征在于,还包括以下步骤:
S6、判断所述载体的培养温度是否处于设定温度范围,若所述培养温度处于所述设定温度范围,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述培养温度低于所述设定温度范围,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第三时间段。
6.根据权利要求1所述的方法,其特征在于,还包括以下步骤:
S7、判断所述基因序列是否具有毒性,若所述基因序列没有毒性,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述基因序列具有毒性,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第四时间段。
7.根据权利要求1所述的方法,其特征在于,所述第一设定值为3KB,所述第一时间为15天-16天,所述第一时间段为2天。
8.根据权利要求1所述的方法,其特征在于,所述第二设定值为7KB,所述第二时间段为10天。
9.一种计算机存储介质,其特征在于,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如权利要求1-8中任一项所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,
所述存储器用于存储一条或多条计算机指令;
所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如权利要求1-8中任一项所述的方法。
CN202110271778.6A 2021-03-12 2021-03-12 载体生产周期的预估方法、计算机存储介质及电子设备 Active CN113096731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110271778.6A CN113096731B (zh) 2021-03-12 2021-03-12 载体生产周期的预估方法、计算机存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110271778.6A CN113096731B (zh) 2021-03-12 2021-03-12 载体生产周期的预估方法、计算机存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN113096731A CN113096731A (zh) 2021-07-09
CN113096731B true CN113096731B (zh) 2022-01-11

Family

ID=76667104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110271778.6A Active CN113096731B (zh) 2021-03-12 2021-03-12 载体生产周期的预估方法、计算机存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113096731B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115881227B (zh) * 2022-12-28 2024-01-26 云舟生物科技(广州)股份有限公司 载体定制方法及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058059A (zh) * 2011-09-26 2017-08-18 基因技术股份公司 高效的小体积核酸合成
CN109942698A (zh) * 2019-04-28 2019-06-28 吉林大学 一种新型雌激素受体蛋白ERβX制备方法及应用
CN111462818A (zh) * 2019-01-22 2020-07-28 武汉华大医学检验所有限公司 测序产量预测方法和建立测序产量预测模型的方法及装置
CN111575272A (zh) * 2019-12-11 2020-08-25 清华大学 基于阻断型链式聚合扩增反应体外快速合成中高拷贝dna重复序列

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040840A1 (en) * 2004-09-02 2013-02-14 Bioarray Solutions, Ltd. Nucleic acid amplification with integrated multiplex detection
CN102533738B (zh) * 2012-03-15 2013-07-31 田敬东 一种基因合成方法、基因芯片及试剂盒
US20140039798A1 (en) * 2012-07-31 2014-02-06 Chetan K. Gupta System and methods for grouping similar items within a set
US9200327B2 (en) * 2012-11-30 2015-12-01 Geron Corporation Diagnostic markers for treating cell proliferative disorders with telomerase inhibitors
CN110322931B (zh) * 2019-05-29 2024-05-14 南昌大学 一种碱基识别方法、装置、设备及存储介质
CN112288090B (zh) * 2020-10-22 2022-07-12 中国科学院深圳先进技术研究院 存有数据信息的dna序列的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058059A (zh) * 2011-09-26 2017-08-18 基因技术股份公司 高效的小体积核酸合成
CN111462818A (zh) * 2019-01-22 2020-07-28 武汉华大医学检验所有限公司 测序产量预测方法和建立测序产量预测模型的方法及装置
CN109942698A (zh) * 2019-04-28 2019-06-28 吉林大学 一种新型雌激素受体蛋白ERβX制备方法及应用
CN111575272A (zh) * 2019-12-11 2020-08-25 清华大学 基于阻断型链式聚合扩增反应体外快速合成中高拷贝dna重复序列

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Effects of high temperature on photosynthesis and related gene expression in poplar;Yuepeng Song等;《BMC Plant Biology》;20141231;第1-20页 *
Paenibacillus elgii B69胞外多糖结构鉴定及生物合成途径研究;李欧;《中国博士学位论文全文数据库 (基础科学辑)》;20150115;第1-134页 *

Also Published As

Publication number Publication date
CN113096731A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
Bernard et al. Alignment-free inference of hierarchical and reticulate phylogenomic relationships
Chikhi et al. Informed and automated k-mer size selection for genome assembly
Edwards et al. Implementing and testing the multispecies coalescent model: a valuable paradigm for phylogenomics
Nowicka et al. DRIMSeq: a Dirichlet-multinomial framework for multivariate count outcomes in genomics
Heo et al. BLESS: bloom filter-based error correction solution for high-throughput sequencing reads
Sun et al. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts
Treangen et al. Repetitive DNA and next-generation sequencing: computational challenges and solutions
Pertsemlidis et al. Having a BLAST with bioinformatics (and avoiding BLASTphemy)
Dalquen et al. Bidirectional best hits miss many orthologs in duplication-rich clades such as plants and animals
Sahm et al. PosiGene: automated and easy-to-use pipeline for genome-wide detection of positively selected genes
Zheng et al. Detecting distant-homology protein structures by aligning deep neural-network based contact maps
Liu et al. COStar: a D-star Lite-based dynamic search algorithm for codon optimization
US20170199959A1 (en) Genetic analysis systems and methods
Goodswen et al. Evaluating high-throughput ab initio gene finders to discover proteins encoded in eukaryotic pathogen genomes missed by laboratory techniques
Zhang et al. A scalable and accurate targeted gene assembly tool (SAT-Assembler) for next-generation sequencing data
Loewenthal et al. A probabilistic model for indel evolution: differentiating insertions from deletions
CN111145836A (zh) 插入基因核酸序列的方法、计算机存储介质及电子设备
CN103065067B (zh) 短序列组装中序列片段的过滤方法及系统
Ochoa et al. Beyond the E-value: stratified statistics for protein domain prediction
CN113096731B (zh) 载体生产周期的预估方法、计算机存储介质及电子设备
Strauch et al. CI-SpliceAI—improving machine learning predictions of disease causing splicing variants using curated alternative splice sites
Tran et al. Detection of generic differential RNA processing events from RNA-seq data
Anwar et al. Patterns of genome-wide codon usage bias in tobacco, tomato and potato
Bi et al. Bipartite pattern discovery by entropy minimization-based multiple local alignment
Hoang et al. De novo assembly and characterizing of the culm-derived meta-transcriptome from the polyploid sugarcane genome based on coding transcripts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room d301-d309, Zone D, Guangzhou International Business Incubator, No. 3, Juquan Road, Science City, Guangzhou, Guangdong 510663

Patentee after: Yunzhou Biotechnology (Guangzhou) Co.,Ltd.

Address before: 510663 room d301-d309, 3 / F, building D, international business incubator, Science City, Huangpu District, Guangzhou, Guangdong

Patentee before: YUNZHOU BIOSCIENCES (GUANGZHOU) Inc.

CP03 Change of name, title or address