CN111696623B - 一种基于dna编码化合物库的实验室信息管理系统 - Google Patents

一种基于dna编码化合物库的实验室信息管理系统 Download PDF

Info

Publication number
CN111696623B
CN111696623B CN202010467298.2A CN202010467298A CN111696623B CN 111696623 B CN111696623 B CN 111696623B CN 202010467298 A CN202010467298 A CN 202010467298A CN 111696623 B CN111696623 B CN 111696623B
Authority
CN
China
Prior art keywords
module
library
dna
information
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010467298.2A
Other languages
English (en)
Other versions
CN111696623A (zh
Inventor
吴阿亮
温菁
崔维仁
袁友浪
董真真
林源智
苏文姬
蒯乐天
杨洪芳
彭宣嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Apptec Co Ltd
Original Assignee
Wuxi Apptec Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Apptec Co Ltd filed Critical Wuxi Apptec Co Ltd
Priority to CN202010467298.2A priority Critical patent/CN111696623B/zh
Publication of CN111696623A publication Critical patent/CN111696623A/zh
Application granted granted Critical
Publication of CN111696623B publication Critical patent/CN111696623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于DNA编码化合物库的实验室信息管理系统,包括电子实验记录本子系统、分析样品子系统、测序和解码子系统和DNA编码化合物库信息储存子系统;其中,电子实验记录本子系统用于实时记录方法开发、试剂验证和库生产实验内容;分析样品子系统用于分析样品的登记和结果反馈;测序和解码子系统用于筛选后的样品的DNA测序和测序数据解析;DNA编码化合物库信息储存子系统用于基础信息和电子实验记录本模块产生的数据的储存和统计分析。本发明的实验室信息管理系统,可以实时、方便、快速地记录、汇总反应数据和最终实验结果,提供可靠的、分类的原始数据,使DNA编码化合物库的合成、筛选、数据解析的过程标准化、数据化、可视化、智能化。

Description

一种基于DNA编码化合物库的实验室信息管理系统
技术领域
本发明涉及实验室信息管理系统,尤其涉及一种基于DNA编码化合物库的实验室信息管理系统。
背景技术
美国Scripps研究院的Sydney Brenner和Richard Lerner教授于1992年提出了DNA编码化合物库(DNA Encoded Library,简称DEL)的概念(参考文献:Proc.Natl.Acad.Sci.,1992,89,5381),该方法通过将一个有机小分子试剂与一段独特序列的DNA在分子水平进行连接,利用组合化学的“组合-拆分”策略,通过两至多个循环快速地构建数量巨大的化合物库,该化合物库中每一个化合物都由不同有机小分子试剂残基组成,并由相应的唯一碱基序列的DNA标识,将少量的DNA编码化合物库与靶标进行亲和筛选,与靶标没有吸附的库分子先被洗掉,留下与靶标有吸附的库分子再洗脱下来,这时得到的库分子浓度很低,常规手段难以分析和识别,通过DNA独有的聚合酶链式反应(PolymeraseChain Reaction,简称PCR)可以把得到的与靶标有吸附的库分子中的DNA部分进行复制扩增直至得到的DNA量可以被DNA测序仪识别,测序后的数据再通过构建DNA编码化合物库时创建的小分子试剂与DNA碱基序列之间的关系表来解码,进而找到具有潜在活性分子相对应的具体化合物对应的小分子试剂,再通过传统的有机合成方法把这些小分子试剂组合在一起得到筛选的目标分子,检测并确认其对靶标的生物活性。
DNA编码化合物库的构建方法主要有三种,第一种是以美国Ensemble公司为主,利用DNA模板技术得到的DNA导向分子库(DNA-Templated Chemical Library Synthesis,简称DTCL),第二种是以美国GSK公司、X-Chem公司和国内的成都先导为主利用DNA标记技术得到的DNA记录分子库(DNA-Recorded Chemical Library,简称DRCL),第三种是以瑞士Philogen公司为主基于片段的药物设计(Fragment-Based Drug Discovery,简称FBDD)技术得到的编码自组装分子库(Encoded Self-Assembling Chemical Libraries,简称ESAC),目前工业上被大量运用的构建DNA编码化合物库的方法主要是第二种,该方法操作简单,成本更低,能更快速地利用组合化学方法得到含有海量的化合物的DNA编码化合物库。
不管采用哪一种方法,DNA编码化合物库的研发、生产、筛选、测序、解码、数据解析和苗头化合物挑选过程中,会使用到不同用途的各型仪器,如DNA定量设备、低温保存设备、移液设备、离心设备、加热或超声等反应设备、LCMS分析设备、HPLC纯化设备、浓缩冻干设备、PCR设备、测序设备、解码软件和设备、解码数据分析处理软件、生物活性测试设备等,并产生大量的实验数据。由于DNA编码化合物库研发、生产涉及DNA大分子的结构式表达和相关的小分子化学的反应和计算,目前的公开信息中,还没有可以直接适用的电子实验记录本,而使用纸质记录本会给后续的数据储存、检索等工作带来严重挑战;DNA编码化合物库的研发、生产、筛选等过程中产生的大量数据,如果仅仅依靠Excel表格等基础的办公软件来管理,不但数据零散、容易丢失、还会因为多个环节的数据更新不同步导致数据不一致、标准难以统一、数据信息不能分级管理、海量的数据得不到充分利用等问题,不利于DNA编码化合物库最后解码数据分析处理过程的顺利开展,从而延误苗头化合物的发现和验证的实验周期,甚至由于假阳性数据而引入歧途。如何实现DNA编码化合物库技术全流程的数据按照统一的标准实时进行汇总、分级管理,是每一个已经或是准备研发DNA编码化合物库技术的药物研发机构或企业不可回避的问题。
虽然上海药物研究所的郑明月等在其专利(专利:CN110021366A)中提及了一种包含实体库模块、测序模块、解码模块和构效关系存储模块的DNA编码化合物数据库系统,但是该专利并没有对DNA编码化合物库研发、生产、筛选、测序和解析产生的数据的管理进行详细的描述。礼来公司的JoséPablo Román等也在文献中(参考文献:SLAS Discov.,2018,23(5),387-396)提及一种DNA编码化合物库的生产和筛选平台,其介绍的该系统和Tecan移液工作站的整合使得操作更加自动化和信息化,但是并没有介绍DNA编码化合物库实验室的数据信息流是如何在该系统中传递的。
鉴于目前的DNA编码化合物库产生数据多、可视化程度低、各个实验阶段的数据信息传递流程不清晰的缺陷,本领域需要提出了一种DNA编码化合物库的实验室信息管理系统,使DNA编码化合物库的研发、合成、筛选和数据分析等过程中产生的数据更加标准化、可视化、流程化,进而方便整个流程的数据追踪、解析和处理。
发明内容
本发明所要解决的技术问题在于,提供一种基于DNA编码化合物库的实验室信息管理系统,能够实时、快速地记录DNA编码化合物库研发、生产、筛选、测序、解码和苗头化合物挑选等过程中产生的大量数据并及时对相关完成的实验数据进行汇总分类,使DNA编码化合物库的研发、合成、筛选和数据分析等过程中产生的数据更加标准化、可视化、流程化,进而方便整个流程的数据追踪、解析和处理。
为解决上述技术问题,本发明提供一种基于DNA编码化合物库的实验室信息管理系统,包括:电子实验记录本子系统、分析样品子系统、测序和解码子系统、及DNA编码化合物库信息储存子系统;
所述电子实验记录本子系统用于实时记录DNA编码化合物库的DNA化学反应开发的实验内容、DNA上小分子化学试剂反应活性验证的实验内容、带有或不带有DNA活性化合物的合成的实验内容、及DNA编码化合物库的库生产和筛选的实验内容;
所述分析样品子系统用于DNA编码化合物库的分析或纯化样品的登记和结果反馈,以及用于管理分析纯化仪器;
所述测序和解码子系统用于对筛选后的DNA编码化合物库样品的DNA测序和测序数据解码;
所述DNA编码化合物库信息储存子系统用于DNA编码化合物库的基础信息和电子实验记录本模块产生的数据的储存和统计分析、信息分级管理。
本发明中所述电子实验记录本子系统包括电子实验记录本书写模块、电子实验记录本支持模块和电子实验记录本审批模块,所述电子实验记录本书写模块用于DNA编码化合物库的日常实验记录的实时书写和实验数据的实时存储;所述电子实验记录本支持模块用于给具体的电子实验记录本提供具体的支持信息,方便实验书写;所述电子实验记录本审批模块用于主管人员对每一个实验人员完成的实验信息和提交的请求进行审批。
进一步地,所述电子实验记录本书写模块分为化学、生物两大模块;所述电子实验记录本书写模块的化学书写模块有:DNA兼容化学反应开发模板、试剂反应活性验证模板、库生产-DNA连接反应模板、库生产-化学反应模板、库生产-混合后反应模板、常规小分子合成反应模板;所述电子实验记录本书写模块的生物书写模块有:混合标签库的盖帽引物连接模板、靶标筛选实验模板、测序样本制备模板;所述DNA兼容化学反应开发模板用于DNA编码化合物库中DNA兼容的化学反应方法开发实验的书写;所述试剂反应活性验证模板用于DNA兼容的化学反应方法高通量筛选,也能用于DNA编码化合物库生产的库存小分子化学试剂的实验的书写;所述库生产-DNA连接反应模板用于DNA编码化合物库生产中DNA标签片段与前一步DNA模板原料的连接反应的书写;所述库生产-化学反应模板用于DNA编码化合物库生产中DNA原料与化学反应活性验证过的小分子化学试剂按照DNA兼容的化学反应方法进行化学反应实验的书写;所述库生产-混合后反应模板用于DNA编码化合物库生产中按照“组合-拆分”策略进行样品混合后需要统一进行的化学反应实验的书写;所述常规小分子合成反应模板用于小分子化学试剂之间的化学反应实验的书写;所述混合标签库的盖帽引物连接模板用于单个或是混合标签库与盖帽引物进行连接反应实验的书写;所述靶标筛选实验模板用于已经接好盖帽引物的单个或是混合标签库与目标靶标进行亲和筛选实验的书写;所述测序样本制备模板用于亲和筛选后的库样品经过PCR处理可以进行二代测序实验的书写。
进一步地,所述电子实验记录本支持模块包括电子实验记录本项目信息模板、用户汇报和审批关系模板、用户属性模板、通用试剂登记模板、标准实验步骤模板、耗材信息模板、共同作者模板;所述电子实验记录本支持模块的项目信息模板用于对实验记录本进行分类管理;所述的用户汇报和审批关系模板用于对用户完成的实验记录进行分级审批;所述的用户属性模板用于对用户进行分类,包括化学工作者、生物学工作者、分析工作者、通用用户、管理员;所述通用试剂登记模板用于常用生物或化学试剂的信息注册;所述标准实验步骤模板用于模板化常用的操作步骤语句以便书写时调取;所述耗材信息模板用于常用实验耗材的信息登记;所述共同作者模板用于多人合作的实验记录在多个用户账号之间相互间分配书写。
进一步地,所述电子实验记录本审批模块包括每一页实验记录的审批或退回、一个实验项目完成后相关实验信息传递到DNA编码化合物库信息储存子系统的审批或退回。
本发明中所述分析样品子系统包括LCMS模块、HPLC模块、分析样品子系统支持模块和仪器管理模块;所述LCMS模块用于实验人员提交待分析样品信息、分析人员批量返回样品LCMS信息;所述HPLC模块用于实验人员提交待纯化样品信息、分析人员返回HPLC信息和纯化样品;所述分析样品子系统支持模块用于给系统不同用户提供分类和信息支持;所述仪器管理模块用于注册、管理、预约使用相关DNA编码化合物库研发、合成、筛选和测序过程中使用到的仪器。
进一步地,所述LCMS模块可以通过Excel模块进行分析样品的LCMS单个或是批量注册和结果的单个或是批量返回;所述的批量是指数目为2~100000范围内的自然数。
进一步地,所述分析样品子系统支持模块包括分析样品项目信息模板、分析样品用户汇报关系模板、分析样品用户属性模板;所述分析样品项目信息模板用于对分析样品进行分类管理;所述分析样品用户汇报关系模板用于对用户进行分级管理;所述分析样品用户属性模板用于对用户进行分类管理,包括化学工作者、生物学工作者、分析工作者、通用用户、管理员。
进一步地,所述分析样品子系统仪器管理模块包括仪器注册模块、仪器预约模块、仪器数据调取模块;所述仪器注册模块用于注册各类仪器信息;所述仪器预约模块用于不同用户根据实验安排预定所需仪器的时间段;所述仪器数据调取模块用于仪器产生的数据按照样品文件的文件名前缀一致原则归类到注册时的样品信息所在行。
本发明所述测序和解码子系统包括DNA测序信息存储模块、解码模块和解码结果查询模块;所述DNA测序信息存储模块用于DNA编码化合物库的DNA标签与对应的小分子试剂原始文件、引物配置文件和DNA测序原始文件的存储;所述解码模块用于将DNA测序原始文件和所述的DNA标签与对应的小分子试剂原始文件、引物配置文件的DNA序列进行匹配计算,得到以每个库和对应靶标和条件为基础单位的解码文件;所述解码结果查询模块用于根据筛选条件下载需要的具体解码文件。
进一步地,所述测序和解码子系统的DNA测序信息存储模块所存储的信息有:库生产过程中产生的DNA标签序列和小分子试剂的对应关系表,库生产过程中引入的起始DNA引物序列、库标签DNA序列、盖帽引物序列信息表,PCR过程中引入的上游引物和下游引物信息,二代测序使用的接头引物序列信息。
进一步地,所述解码模块是一整套解码解决方案,可以按照提供的PCR的上游引物和下游引物、库标签DNA序列、盖帽引物序列和DNA标签序列和小分子试剂的对应关系表对测序数据进行解析,将得到的DNA序列转换为库合成中加入的对应的小分子试剂,并可以根据提供的逻辑对不同筛选条件的每个小分子试剂的富集数据进行标准化和归一化处理。
进一步地,所述解码结果查询模块包含的词条有:项目、库注册流水号、靶标、筛选条件、完成日期,并且具有可视化统计报表,显示每个库的富集历史概况和靶标类别统计。
所述DNA编码化合物库信息储存子系统包括试剂存储模块、DNA标签存储模块、小分子试剂反应活性验证数据存储模块、DNA编码化合物库基本信息模块、筛选信息存储模块、活性化合物信息存储模块和DNA编码化合物库支持模块。
进一步地,所述试剂存储模块用于单个或是批量试剂信息的归类、存储和使用后信息更新管理。所述的试剂存储模块包括小分子化学试剂存储模块和蛋白试剂存储模块。所述小分子化学试剂存储模块支持将小分子试剂的Smiles归一化,并支持按照小分子试剂的功能团种类和个数、分子量范围、CAS、MDL、注册流水号、供应商、项目、结构式相似度和库存量范围进行检索和批量下载;所述的蛋白试剂存储模块支持将蛋白的氨基酸序列信息进行注册,并支持按照蛋白的部分氨基酸序列、种类、商品号、注册流水号、突变位点、疾病领域、项目和库存量范围进行检索和批量下载。
进一步地,所述DNA标签存储模块用于DNA编码化合物库库生产过程中使用的DNA标签的信息的归类、存储和日常使用后信息更新管理,包括库标签、盖帽引物、PCR引物,支持按照DNA标签的部分核苷酸序列、粘末端序列、种类、商品号、注册流水号、修饰基团、项目、库存量范围进行检索和批量下载。
进一步地,所述小分子试剂反应活性验证数据存储模块用于电子实验记录本子系统中试剂反应活性验证模板产生数据的系统自动汇总和其他外来实验数据的手动单个或是批量上传汇总。
进一步地,所述DNA编码化合物库基本信息模块用于电子实验记录本子系统中库生产的三个模板(库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板)记录的生产完毕的DNA编码化合物库数据的系统自动汇总和其他外来实验数据的手动单个或是批量上传汇总,包括库基本信息模块、库循环模块、DNA标签与小分子试剂对应关系模块、标签库模块。所述库基本信息模块记录DNA编码化合物库的基本信息,包含词条:库注册流水号、项目、父库编号、库编号、母核信息、库分子数、库循环数、多倍重复DNA标签所在循环、多倍重复DNA标签倍数、库平均分子量、实验页、验证页、完成人员、完成日期、库存量、状态、每页显示数;所述库循环模块记录库每个循环的信息,包含词条:库注册流水号、库名、项目、循环数、反应类型、标准实验步骤注册流水号、母核注册流水号、试剂类型、试剂数量、完成人员、完成日期;所述DNA标签与小分子试剂对应关系模块记录每一个循环DNA标签和小分子试剂的对应关系,包含词条:库注册流水号、库名、项目、循环数、小分子试剂信息(注册流水号、CAS、MDL)、DNA标签信息(注册流水号、核苷酸序列信息);所述标签库模块记录连接了库标签的DEL库的信息,包含词条:标签库注册流水号、库注册流水号、库名、项目、库标签注册流水号、标签库平均分子量、实验页、完成人员、完成日期、标签库存量;进一步地,所述库循环模块、DNA标签与对应的小分子试剂模块、库标签模块不仅在每个DNA编码化合物库信息下单独显示,同时分别在一个独立的界面可以汇总显示,满足批量下载、查询、删除的需求。
进一步地,所述筛选信息存储模块用于记录DNA编码化合物库和靶标筛选过程中产生的信息,包括盖帽引物连接的混合标签库模块、靶标筛选实验模块、测序样本制备模块;所述盖帽引物连接的混合标签库模块记录不同的标签库混合后与盖帽引物的连接实验数据,包含词条:盖帽引物连接的混合标签库注册流水号、库名、项目、盖帽引物注册流水号、混合的标签库个数、混合的每个标签库的信息、混合的标签库的分子数、混合的标签库的平均分子量、标签库的投入量、实验页、完成人员、完成日期;所述靶标筛选实验模块用于记录每个批次进行的盖帽引物连接的混合标签库与靶标完成的筛选实验数据,包含词条:筛选实验注册流水号、项目、靶标注册流水号、靶标投入量、阳性对照物注册流水号、阳性对照物投入量、盖帽引物连接的混合标签库注册流水号、盖帽引物连接的混合标签库投入量、筛选标准实验步骤注册流水号、缓冲液、耗材、实验页、完成人员、完成日期;所述测序样本制备模块用于记录靶标筛选实验产生的样品经过PCR、纯化后进行二代测序前的实验数据,包含词条:靶标筛选实验样品注册流水号、PCR前样品定量、PCR投入量、上游引物、下游引物、测序样品核苷酸序列长度、PCR轮数、PCR后样品定量、测序深度、预计数据大小、实验页、完成人员、完成日期。
进一步地,所述活性化合物信息存储模块用于记录测序数据解码后的数据进一步分析后产生的数据,包括DNA活性化合物信息模块、小分子活性化合物信息模块。所述的DNA化合物信息模块用于记录挑选出来的按照DNA编码化合物库的生产过程合成出来的单一的具有潜在亲和活性的DNA编码化合物分子的信息,包含词条:DNA化合物注册流水号、项目、库注册流水号、库生产对应信息(每个循环的小分子注册信息和对应的DNA标签注册信息)、靶标筛选实验注册流水号、靶标注册流水号、筛选标准实验步骤注册流水号、挑选标准步骤注册流水号、拷贝数、富集倍数、空白对照富集倍数、挑选人员、挑选日期、纯度、合成实验页、合成人员、合成完成日期、活性数据、活性测试方法、活性测试实验页、活性测试人员、活性测试日期;所述的小分子活性化合物信息模块用于记录挑选出来的去除DNA部分具有潜在生物活性的小分子化合物的信息,包含词条:小分子化合物注册流水号、项目、库注册流水号、库生产对应信息(每个循环的小分子注册信息和对应的DNA标签注册信息)、靶标筛选实验注册流水号、靶标注册流水号、筛选标准实验步骤注册流水号、挑选标准步骤注册流水号、拷贝数、富集倍数、空白对照富集倍数、挑选人员、挑选日期、纯度、合成实验页、合成人员、合成完成日期、活性数据、活性测试方法、活性测试实验页、活性测试人员和活性测试日期。
进一步,本发明所述的DNA编码化合物库信息储存子系统的DNA编码化合物库支持模块包括项目信息模块、用户属性模块、标准实验步骤汇总模块、盐信息模块、功能团模块、试剂骨架模块、大分子图形定义化模块;所述DNA编码化合物库信息储存子系统的DNA编码化合物库支持模块的项目信息模块用于对汇总的电子记录本产生的信息和注册的试剂、DNA标签信息进行分级管理;所述的用户属性模块用于对用户进行分类,包括化学工作者、生物学工作者、分析工作者、通用用户、管理员;所述标准实验步骤汇总模块用于电子实验记录本的DNA兼容化学反应开发模板产生的标准实验步骤信息的注册、汇总和再次调用;所述盐信息模块用于注册小分子试剂信息时,自动化除盐,按照不含盐的父结构Smiles信息统一注册不同批次的小分子试剂信息;所述的功能团模块用于注册小分子试剂信息时,按照优先级自动识别小分子试剂的被保护或未被保护的具有反应活性的功能团,所述的试剂骨架模块用于按照注册的试剂骨架对已经注册的小分子试剂信息进行分类、汇总和调用;所述的大分子图形定义化模块用于注册DNA、RNA和蛋白大分子后,设定一定颜色的图形来代表该大分子以展示在反应式中,实现反应式的可视化、图形化显示。
进一步,本发明所述的批量是指2~100000范围内的自然数;所述的批量上传或是下载可以使用的文件格式有:sdf、csv、excel。
本发明的一种基于DNA编码化合物库的实验室信息管理系统,提供了一种高效的、分级管理实验数据的方法,能够将DNA编码化合物库的库合成立项、化学反应研发、库生产、靶标筛选、DNA测序、序列解码、化合物挑选和之后的带有或不带有DNA的目标分子合成和活性测试等全过程的数据收录并管理,实现了DNA编码化合物库技术全流程数据的标准化、可视化、流程化,满足不同权限的用户大批量数据的上传、查询、删除、录入和信息传递、下载。
名词解释:
DNA编码化合物库(DEL库):在实验流程中未特别指定时,均是指尚未和库标签连接的DEL库。
标签库:一个DNA编码化合物库与一个库标签完成连接后的DEL库。
混合标签库:一至多个标签库混合在一起形成的混合DEL库。
库标签:一段用于区别不同的DEL库的DNA序列。
盖帽引物连接的混合标签库:混合标签库与盖帽引物(closing tags)完成连接后,形成的可以用于和靶标进行筛选的DEL库。
附图说明
图1为本发明所述的基于DNA编码化合物库的实验室信息管理系统的结构示意图。
图2为本发明所述的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统化学书写模块完成一个循环存在的库生产模板之间数据流传递方式示意图。
图3为本发明所述的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统化学书写模块完成两个循环存在的库生产模板之间数据流传递方式示意图。
具体实施方式
下面,结合附图,对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的基于DNA编码化合物库的实验室信息管理系统的结构示意图包括电子实验记录本子系统、分析样品子系统、DNA编码化合物库信息储存子系统和测序和解码子系统;所述分析样品子系统与所述电子实验记录本子系统相连接,所述电子实验记录本子系统与所述DNA编码化合物库信息储存子系统相连接,所述DNA编码化合物库信息储存子系统与测序和解码子系统相连接,所述测序和解码子系统与电子实验记录本子系统相连接;所述分析样品子系统用于DNA编码化合物库的分析或纯化样品的登记和结果反馈、分析纯化仪器的管理;所述电子实验记录本模块用于实时记录DNA编码化合物库的DNA化学反应开发、DNA上小分子试剂反应验证、带有或不带有DNA活性化合物的合成和DNA编码化合物库的库生产和筛选实验内容;所述测序和解码子系统用于筛选后的DNA编码化合物库样品的DNA测序和测序数据解码;所述DNA编码化合物库信息储存子系统用于DNA编码化合物库的基础信息和电子实验记录本模块产生的数据的储存和统计分析、信息分级管理。
所述的分析样品子系统包括LCMS模块、HPLC模块、分析样品子系统支持模块和仪器管理模块;所述仪器管理模块与LCMS模块、HPLC模块相连接,所述分析样品子系统支持模块与仪器管理模块、LCMS模块、HPLC模块相连接;所述LCMS模块用于实验人员提交待分析样品信息、分析人员批量返回样品LCMS信息;所述HPLC模块用于实验人员提交待纯化样品信息、分析人员返回HPLC信息和纯化样品;所述仪器管理模块用于注册、管理、预约使用相关DNA编码化合物库研发、合成、筛选和测序过程中使用到的仪器;所述分析样品子系统支持模块用于给系统不同用户提供分类和信息支持;所述LCMS模块和HPLC模块分别与所述的电子实验记录本子系统的常规小分子合成反应模板、DNA兼容化学反应开发模板、小分子试剂反应活性验证模板、库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板相连接,所述常规小分子合成反应模板、DNA兼容化学反应开发模板、小分子试剂反应活性验证模板、库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板产生的LCMS、HPLC需求数据,可以分别提交到LCMS模块和HPLC模块,LCMS模块和HPLC模块产生的测试数据会分别返回原来的实验记录模板;所述LCMS模块可以通过Excel模块进行分析样品的LCMS单个或是批量注册和结果的单个或是批量返回;所述的批量是指2~100000范围内的自然数。
所述的电子实验记录本子系统包括电子实验记录本书写模块、电子实验记录本支持模块和电子实验记录本审批模块。所述电子实验记录本书写模块还包括化学和生物两大书写模块,所述化学书写模块和和生物书写模块分别与电子实验记录本支持模块相连接,所述化学书写模块和和生物书写模块分别与电子实验记录本审批模块相连接。
所述化学书写模块分别与DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块、活性化合物信息存储模块相连接,所述化学模块分别与DNA编码化合物库信息储存子系统的试剂存储模块、DNA标签存储模块和小分子试剂反应验证数据模块相连接,所述生物书写模块与DNA编码化合物库信息储存子系统的筛选信息存储模块相连接,所述生物书写模块与DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块相连接;所述的化学书写模块包括DNA兼容化学反应开发模板、试剂反应活性验证模板、库生产-DNA连接反应模板、库生产-化学反应模板、库生产-混合后反应模板和常规小分子合成反应模板;所述的DNA兼容化学反应开发模板用于DNA编码化合物库中DNA兼容的化学反应方法开发实验的书写,所述的DNA兼容化学反应开发模板与所述的DNA编码化合物库信息储存子系统的DNA编码化合物库支持模块的标准实验步骤汇总模块相连接,所述的DNA兼容化学反应开发模板完成的实验记录,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的DNA编码化合物库支持模块的标准实验步骤汇总模块;所述试剂反应活性验证模板用于DNA兼容的化学反应方法高通量筛选可能用于DNA编码化合物库生产的库存小分子化学试剂的实验的书写,所述的试剂反应活性验证模板与所述的DNA编码化合物库信息储存子系统的小分子试剂反应活性验证数据存储模块相连接,所述的试剂反应活性验证模板完成的实验记录,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的小分子试剂反应活性验证数据存储模块;所述库生产-DNA连接反应模板用于DNA编码化合物库生产中DNA标签片段与前一步DNA模板原料的连接反应的书写,所述库生产-化学反应模板用于DNA编码化合物库生产中DNA原料与化学反应活性验证过的小分子化学试剂按照DNA兼容的化学反应方法进行化学反应实验的书写,所述库生产-混合后反应模板用于DNA编码化合物库生产中按照“组合-拆分”策略进行样品混合后需要统一进行的化学反应实验的书写,所述的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板分别与DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块相连接,所述的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板完成的实验记录,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块的下一级4个模块中,也即分别汇总到库基本信息模块、库循环模块、DNA标签与小分子试剂对应表和标签库;所述的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板还用于一个或多个单一的不需要进行“组合-拆分”策略的DNA模板分子与DNA标签的链接反应、与小分子试剂按照DNA兼容的化学反应方法进行化学反应、化学反应后需要进一步进行功能团转化的化学反应,此时,所述的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板还与DNA编码化合物库信息储存子系统的活性化合物信息存储模块的DNA活性化合物信息模块相连接,所述的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板完成的单一非混合物的DNA编码化合物分子的实验记录后,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的活性化合物信息存储模块的DNA活性化合物信息模块;所述常规小分子合成反应模板用于小分子化学试剂之间的化学反应实验的书写,所述的常规小分子合成反应模板与DNA编码化合物库信息储存子系统的活性化合物信息存储模块的小分子活性化合物信息模块相连接,所述的常规小分子合成反应模板完成实验后,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的活性化合物信息存储模块的小分子活性化合物信息模块。
所述的电子实验记录本子系统的生物书写模块包括混合标签库的盖帽引物连接模板、靶标筛选实验模板和测序样本制备模板;所述混合标签库的盖帽引物连接模板用于单个或是混合标签库与盖帽引物进行连接反应实验的书写,所述混合标签库的盖帽引物连接模板与所述的DNA编码化合物库信息储存子系统的混合标签库的信息模块相连接,所述的混合标签库的盖帽引物连接模板完成实验后,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的混合标签库信息模块;所述靶标筛选实验模板用于已经接好盖帽引物的单个或是混合标签库与目标靶标进行亲和筛选实验的书写,所述靶标筛选实验模板与所述的DNA编码化合物库信息储存子系统的靶标筛选信息模块相连接,所述靶标筛选实验模板完成实验后,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的靶标筛选信息模块;所述测序样本制备模板用于亲和筛选后的库样品经过PCR处理可以进行二代测序实验的书写,所述测序样本制备模板与所述的DNA编码化合物库信息储存子系统的测序样本信息模块相连接,所述测序样本制备模板完成实验后,经过两级审批,数据最终汇总到DNA编码化合物库信息储存子系统的测序样本信息模块;所述的化学书写模块和生物书写模块均可以批量完成数据的上传、下载和书写模板内数据检索,所述的批量是指100000以内的自然数,可以使用的文件格式有:sdf、csv、excel。
所述的电子实验记录本审批模块有实验记录审批模块和实验信息传递审批模块,所述的电子实验记录本子系统的化学书写模块的6个实验记录模板和生物书写模块的3个实验记录模板完成实验后,需要经过实验记录审批模块完成实验信息验证,验证完的实验信息需要再经过实验信息传递审批模块完成实验信息从电子实验记录本子系统的书写模块传递汇总到DNA编码化合物库信息储存子系统;所述的电子实验记录本子系统和所述的DNA编码化合物库信息储存子系统之间有连接的模块的信息可以进行正向和反向查询。
所述的DNA编码化合物库信息储存子系统包括试剂存储模块、DNA标签存储模块、小分子试剂反应验证数据存储模块、DNA编码化合物库基本信息模块、筛选信息存储模块、活性化合物信息存储模块和DNA编码化合物库支持模块;所述的DNA编码化合物库基本信息模块与所述的筛选信息存储模块相连接,所述的筛选信息存储模块中DNA编码化合物库的信息均来自于DNA编码化合物库基本信息模块;所述的试剂存储模块和DNA标签存储模块分别与所述的电子实验记录本子系统的化学书写模块相连接,所述的试剂存储模块和DNA标签存储模块存储的小分子试剂、DNA标签信息为电子实验记录本子系统的化学书写模块的具体实验内容提供基础信息;所述的小分子试剂反应数据存储模块和所述的电子实验记录本子系统的试剂反应活性验证模板相连接,所述的小分子试剂反应数据存储模块根据小分子试剂唯一性来存储电子实验记录本子系统的试剂反应活性验证模板产生的小分子试剂在各种DNA兼容的化学反应方法下产生的经过审批的验证数据;所述的DNA编码化合物库基本信息模块分别与所述的电子实验记录本子系统的化学书写模块的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板和生物书写模块相连接,所述的DNA编码化合物库基本信息模块汇总存储所述的电子实验记录本子系统的化学书写模块的库生产-DNA连接反应模板、库生产-化学反应模板和库生产-混合后反应模板经过2至15步反应得到的DNA编码化合物库的实验信息,并为生物书写模块的实验书写提供DNA编码化合物库的基本信息;所述的筛选信息存储模块的混合标签库信息模块、靶标筛选信息模块和测序样本信息模块与所述的电子实验记录本子系统的生物书写模块的混合标签库的盖帽引物连接模块、靶标筛选实验模块和测序样本制备模块一一对应相连接,所述的筛选信息存储模块的混合标签库信息模块、靶标筛选信息模块和测序样本信息模块用于一一对应汇总存储所述的电子实验记录本子系统的生物书写模块的混合标签库的盖帽引物连接模块、靶标筛选实验模块和测序样本制备模块产生的经过审批的实验数据;所述的筛选信息存储模块还与所述的测序和解码子系统相连接,所述的筛选信息存储模块将实验产生的靶标、筛选条件和使用的DEL库对应信息汇总提供给测序和解码子系统,测序和解码子系统可以使用这些信息解析测序后的文件获得可读数据;所述的活性化合物信息存储模块分别与测序和解码子系统、电子实验记录本子系统的化学书写模块相连接,所述的活性化合物信息存储模块即存储根据测序和解码子系统的可读数据进行分析获得的可能具有活性的化合物的信息,也存储最终经过化学合成得到的活性经过检测的小分子活性化合物或DNA活性化合物;所述的DNA编码化合物库支持模块与所述的试剂存储模块和DNA标签存储模块相连接,所述的DNA编码化合物库支持模块包括项目信息模块、用户属性模块、标准实验步骤汇总模块、盐信息模块、功能团模块、试剂骨架模块和大分子图形定义化模块,其中,所述的项目信息模块用于对汇总的电子记录本产生的信息和注册的试剂、DNA标签信息进行分级管理,所述的用户属性模块用于对用户进行分类,包括化学工作者、生物学工作者、分析工作者、通用用户、管理员,所述标准实验步骤汇总模块用于电子实验记录本子系统的DNA兼容化学反应开发模板产生的标准实验步骤信息的注册、汇总和再次调用;所述的盐信息模块、功能团模块、试剂骨架模块对试剂存储模块注册的小分子试剂按照盐、功能团和试剂骨架进行分类管理,以便后续查询、下载,所述的大分子图形定义化模块对DNA标签存储模块的注册DNA标签提供可视化图形,为电子实验记录本子系统的化学书写模块的化学式书写提供可视化、图形化反应式。
所述的DNA编码化合物库信息储存子系统的试剂存储模块和DNA标签存储模块的数据来自系统管理员的批量注册,所述的小分子试剂反应验证数据存储模块、DNA编码化合物库基本信息模块、筛选信息存储模块、活性化合物信息存储模块的数据既可以来自电子实验记录本子系统相连接模板产生的数据汇总,也可以由系统管理员的批量注册非电子实验记录本子系统的数据;所述的DNA编码化合物库信息储存子系统的试剂存储模块、DNA标签存储模块、小分子试剂反应验证数据存储模块、DNA编码化合物库基本信息模块、筛选信息存储模块、活性化合物信息存储模块均可以根据项目信息和用户属性来确定用户可以批量上传、查询和下载,所述的批量是指100000以内的自然数,可以使用的文件格式有:sdf、csv、excel;
所述的测序和解码子系统包括DNA测序信息存储模块、解码模块和解码结果查询模块;所述的测序和解码子系统分别与所述的DNA编码化合物库信息储存子系统的筛选信息存储模块和活性化合物信息存储模块和电子实验记录本子系统的化学书写模块相连接,所述的测序和解码子系统需要使用DNA编码化合物库信息储存子系统产生的靶标、筛选条件和DNA编码化合物库的对应信息并进行解码过程,所述的测序和解码子系统经过半自动数据解析后产生的可能具有生物活性的小分子活性化合物或DNA活性化合物存储在DNA编码化合物库信息储存子系统的活性化合物信息存储模块,其中,通过电子实验记录本子系统的化学书写模块实际合成的可能具有生物活性的化合物的相关信息也汇总存储到DNA编码化合物库信息储存子系统的活性化合物信息存储模块;所述的DNA测序信息存储模块和所述的解码模块相连接,所述的DNA测序信息存储模块用于DNA编码化合物库的DNA标签与对应的小分子试剂原始文件、引物配置文件和DNA测序原始文件的存储,所述的解码模块通过设定的程序对DNA测序信息存储模块中的DNA测序原始文件与DNA编码化合物库的DNA标签与小分子试剂对应表文件和引物配置文件进行匹配,解码得到单个DNA编码化合物库的小分子试剂与特定靶标和筛选条件下的DNA测序的富集倍数之间的对应关系表;所述的解码模块和所述的解码结果查询模块相连接,所述的解码模块解码得到的单个DNA编码化合物库的小分子试剂与特定靶标和筛选条件下的DNA测序的富集倍数之间的对应关系表存储到面对终端用户的解码结果查询模块,终端用户可以根据具体的筛选条件下载需要的具体解码文件,并通过对数据解析,挑选出最终可以存储到DNA编码化合物库信息储存子系统的活性化合物信息存储模块的可能具有生物活性的化合物
如图2所示,本发明的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统完成一个循环的库合成的不同实验记录模板之间存在的数据流传递示意图,包括四种方式:一是如图2的A所示的库合成-DNA连接反应模板通过创建下一步反应的方式到库合成-化学反应模板,在库合成-DNA连接反应模板录入的DNA标签和DNA产物的信息会传递到库合成-化学反应模板,所述的库合成-化学反应模板通过创建下一步反应的方式到库合成-混合后反应模板,在库合成-化学反应模板存在的上一步的DNA标签、本步骤录入的化学试剂和最终得到的DNA产物会传递到库合成-混合后反应模板,一个循环的DNA标签和化学试剂对应关系在该循环的最后一个实验记录库合成-混合后反应模板中得到保存;二是如图2的B所示的库合成-DNA连接反应模板通过创建下一步反应的方式到库合成-化学反应模板,在库合成-DNA连接反应模板录入的DNA标签和DNA产物的信息会传递到库合成-化学反应模板,加上在本步骤录入的化学试剂和最终得到的DNA产物,一个循环的DNA标签和化学试剂对应关系在该循环的最后一个实验记录库合成-化学反应模板中得到保存,该种方式适用于不需要进行功能团转化的DNA编码化合物库分子的合成;三是如图2的C所示的库合成-化学反应模板通过创建下一步反应的方式到库合成-DNA连接反应模板,在库合成-化学反应模板录入的化学试剂和DNA模板产物的信息会传递到库合成-DNA连接反应模板,所述的库合成-DNA连接反应模板通过创建下一步反应的方式到库合成-混合后反应模板,在库合成-DNA连接反应模板存在的上一步的化学试剂、本步骤录入的DNA标签和最终得到的DNA产物会传递到库合成-混合后反应模板,一个循环的DNA标签和化学试剂对应关系在该循环的最后一个实验记录库合成-混合后反应模板中得到保存,该种方法适用于化学反应比较敏感的DNA编码化合物库分子的合成;四是如图2的D所示的库合成-化学反应模板通过创建下一步反应的方式到库合成-DNA连接反应模板,在库合成-化学反应模板录入的化学试剂和DNA模板产物的信息会传递到库合成-DNA连接反应模板,加上在本步骤录入的DNA标签和最终得到的DNA产物,一个循环的DNA标签和化学试剂对应关系在该循环的最后一个实验记录库合成-DNA连接反应模板中得到保存,该种方式适用于不需要进行功能团转化且化学反应比较敏感的DNA编码化合物库分子的合成;在一个循环中,所述的库合成-DNA连接反应可以进行一至三次DNA连接反应,适用于循环数少于3的DNA编码化合物库的库合成,用于补足DNA标签的长度;所述的库合成-化学反应可以进行一至三次化学反应,适用于需要在该循环加入单一的骨架试剂或是转化试剂的DNA编码化合物库的库合成,用于得到骨架试剂库或是不同功能团的试剂库的DNA编码化合物库;所述的库合成-混合后反应可以进行一至三次DNA连接反应,适用于需要在最终的化合物中加入单一的盖帽试剂或是DNA上小分子端化合物进一步关环或是其他转化的DNA编码化合物库的库合成,得到不同盖帽、或是大环化合物、或是进一步转化的目标分子的DNA编码化合物库;
如图3所示,本发明的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统完成两个循环的库合成的不同实验记录模板之间存在的数据流传递示意图,包括十六种方式,一是如图3的A所示,第一个循环的数据流按照图2的A所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流也按照图2A所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环的库生产-混合后反应模板数据;二是如图3的B所示,第一个循环的数据流按照图2的A所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的B所示最终汇总在第二个库生产-化学反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环的库生产-混合后反应模板和第二个循环的库生产-化学反应模板数据;三是如图3的C所示,第一个循环的数据流按照图2的A所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的C所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环的库生产-混合后反应模板数据;四是如图3的D所示,第一个循环的数据流按照图2的A所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的D所示最终汇总在第二个库生产-DNA连接反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环的库生产-混合后反应模板和第二个循环库生产-DNA连接反应模板的数据;五是如图3的E所示,第一个循环的数据流按照图2的B所示最终汇总在第一个循环的库生产-化学反应模板,第二个循环的数据流按照图2的A所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环的库生产-化学反应模板和第二个循环库生产-混合后反应模板的数据;六是如图3的F所示,第一个循环的数据流按照图2的B所示最终汇总在第一个循环的库生产-化学反应模板,第二个循环的数据流也按照图2的B所示最终汇总在第二个库生产-化学反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环库生产-化学反应模板的数据;七是如图3的G所示,第一个循环的数据流按照图2的B所示最终汇总在第一个循环的库生产-化学反应模板,第二个循环的数据流也按照图2的C所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-化学反应模板和第二个循环库生产-混合后反应模板的数据;八是如图3的H所示,第一个循环的数据流按照图2的B所示最终汇总在第一个循环的库生产-化学反应模板,第二个循环的数据流也按照图2的D所示最终汇总在第二个库生产-DNA连接反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-化学反应模板和第二个循环库生产-DNA连接反应模板的数据;九是如图3I所示,第一个循环的数据流按照图2的C所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的A所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环库生产-混合后反应模板的数据;十是如图3的J所示,第一个循环的数据流按照图2的C所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的B所示最终汇总在第二个库生产-化学反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-混合后反应模板和第二个循环库生产-化学反应模板的数据;十一是如图3的K所示,第一个循环的数据流按照图2的C所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流也按照图2的C所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环库生产-混合后反应模板的数据;十二是如图3的L所示,第一个循环的数据流按照图2的C所示最终汇总在第一个循环的库生产-混合后反应模板,第二个循环的数据流按照图2的D所示最终汇总在第二个库生产-DNA连接反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-混合后反应模板和第二个循环的库生产-DNA连接反应模板的数据;十三是如图3的M所示,第一个循环的数据流按照图2的D所示最终汇总在第一个循环的库生产-DNA连接反应模板,第二个循环的数据流按照图2的A所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-DNA连接反应模板和第二个循环的库生产-混合后反应模板的数据;十四是如图3的N所示,第一个循环的数据流按照图2的D所示最终汇总在第一个循环的库生产-DNA连接反应模板,第二个循环的数据流按照图2的B所示最终汇总在第二个库生产-化学反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-DNA连接反应模板和第二个循环的库生产-化学反应模板的数据;十五是如图3的O所示,第一个循环的数据流按照图2的D所示最终汇总在第一个循环的库生产-DNA连接反应模板,第二个循环的数据流按照图2的C所示最终汇总在第二个库生产-混合后反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一个循环库生产-DNA连接反应模板和第二个循环的库生产-混合后反应模板的数据;十六是如图3的P所示,第一个循环的数据流按照图2的D所示最终汇总在第一个循环的库生产-DNA连接反应模板,第二个循环的数据流也按照图2的D所示最终汇总在第二个库生产-DNA连接反应模板,实验数据传递到DNA编码化合物库信息储存子系统的DNA编码化合物库基本信息模块时,汇总第一和第二个循环的库生产-DNA连接反应模板的数据;
本发明的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统完成三个循环的库合成的不同实验记录模板之间存在的数据流传递是图2和图3的随机组合,共有64种不同的反应模板组合方式。
本发明的基于DNA编码化合物库的实验室信息管理系统的电子实验记录本子系统完成四个循环的库合成的不同实验记录模板之间存在的数据流传递是图2和图3的随机组合,共有256种不同的反应模板组合方式。
综上所述,上述各实施例仅为本发明的较佳实施例而已,并不用以限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,皆应包含在本发明的保护范围内。

Claims (11)

1.一种基于DNA编码化合物库技术的实验室信息管理系统,其特征在于,包括电子实验记录本子系统、分析样品子系统、测序和解码子系统和DNA编码化合物库信息储存子系统;
所述的电子实验记录本子系统用于实时记录DNA编码化合物库的方法开发、库生产、筛选和挑选的活性化合物合成的实验数据;
所述的分析样品子系统用于DNA编码化合物库的样品分析或纯化的登记和结果反馈、仪器管理;
所述的测序和解码子系统用于筛选后的DNA编码化合物库样品的DNA测序数据解码及其和解码数据的存储;
所述的DNA编码化合物库信息储存子系统用于DNA编码化合物库的基础信息和电子实验记录本模块产生的数据的储存和统计分析、信息分级管理。
2.如权利要求1所述的实验室信息管理系统,其特征在于,所述的电子实验记录本子系统还包括电子实验记录本书写模块、电子实验记录本支持模块和电子实验记录本审批模块;所述电子实验记录本书写模块分为化学书写模块和生物书写模块;
所述的化学书写模块还包括DNA兼容化学反应开发模板、试剂反应活性验证模板、库生产-DNA连接反应模板、库生产-化学反应模板、库生产-混合后反应模板、常规小分子合成反应模板;
所述的生物书写模块还包括混合标签库的盖帽引物连接模板、靶标筛选实验模板、测序样本制备模板;
所述的电子实验记录本支持模块包括项目信息模板、用户汇报和审批关系模板、用户属性模板、通用试剂登记模板、标准实验步骤模板、耗材信息模板、共同作者模板。
3.如权利要求1所述的实验室信息管理系统,其特征在于,所述的分析样品子系统还包括LCMS模块、HPLC模块、分析样品子系统支持模块和仪器管理模块;
所述的LCMS模块用于LCMS样品信息的提交和反馈;
所述的HPLC模块用于HPLC样品信息的提交和反馈;
所述的仪器管理模块用于注册、管理、预约使用仪器。
4.如权利要求1所述的实验室信息管理系统,其特征在于,所述的测序和解码子系统还包括DNA测序信息存储模块、解码模块和解码结果查询模块;
所述的DNA测序信息存储模块用于DNA编码化合物库试剂和DNA标签信息与DNA测序信息以及测序结果的存储;
所述的解码模块用于DNA测序原始文件的解码;
所述的解码结果查询模块用于根据不同筛选条件下载解码文件。
5.如权利要求1所述的实验室信息管理系统,其特征在于,所述的DNA编码化合物库信息储存子系统还包括试剂存储模块、DNA标签存储模块、小分子试剂反应活性验证数据存储模块、DNA编码化合物库基本信息模块、筛选信息存储模块、活性化合物信息存储模块和DNA编码化合物库支持模块;
所述的试剂存储模块用于小分子化学试剂、蛋白的信息注册;
所述的DNA标签存储模块用于DNA引物的信息注册;
所述的小分子试剂反应活性验证数据存储模块用于小分子试剂在DNA上的化学反应活性数据存储;
所述的筛选信息存储模块用于记录筛选过程中产生的实验数据;
所述的活性化合物信息存储模块用于记录解码后挑选得到的化合物;
所述的DNA编码化合物库支持模块包括项目信息模块、用户属性模块、标准实验步骤汇总模块、盐信息模块、功能团模块、试剂骨架模块、大分子图形定义化模块。
6.如权利要求5所述的DNA编码化合物库信息储存子系统,其特征在于,所述的DNA编码化合物库基本信息模块还包括库基本信息模块、库循环模块、DNA标签与小分子试剂对应关系模块和标签库模块;
所述的库基本信息模块用于记录DNA编码化合物库的描述性信息;
所述的库循环模块用于记录库的每个循环的信息;
所述的DNA标签与小分子试剂对应关系模块用于记录库的每一个循环DNA标签和小分子试剂的对应关系信息;
所述的标签库模块用于记录连接了库标签的DNA编码化合物库的信息。
7.如权利要求1所述的实验室信息管理系统,其特征在于,所述分析样品子系统与所述电子实验记录本子系统相连接,所述电子实验记录本子系统与所述DNA编码化合物库信息储存子系统相连接,所述DNA编码化合物库信息储存子系统与测序和解码子系统相连接,所述测序和解码子系统与电子实验记录本子系统相连接。
8.如权利要求2所述的电子实验记录本子系统,其特征在于,所述的化学书写模块之间的数据可以实现相互传递;传递方式是库生产-DNA连接反应模板传递到库生产-化学反应模板,或是库生产-化学反应模板传递到库生产-混合后反应模板,或是库生产-化学反应模板传递到库生产-DNA连接反应模板,或是库生产-DNA连接反应模板传递到库生产-混合后反应模板。
9.如权利要求8所述的电子实验记录本子系统,其特征在于,一个循环内的传递方式是库生产-DNA连接反应模板传递到库生产-化学反应模板,库生产-化学反应模板传递到库生产-混合后反应模板。
10.如权利要求1所述的实验室信息管理系统,其特征在于,所述的电子实验记录本子系统、分析样品子系统、测序和解码子系统和DNA编码化合物库信息储存子系统可以实现批量上传、查询、下载、删除功能;
所述的批量是指2~100000范围内的自然数。
11.如权利要求1所述的实验室信息管理系统,其特征在于,该实验室信息管理系统用于DNA编码化合物库技术产生的数据的储存和使用。
CN202010467298.2A 2020-05-28 2020-05-28 一种基于dna编码化合物库的实验室信息管理系统 Active CN111696623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010467298.2A CN111696623B (zh) 2020-05-28 2020-05-28 一种基于dna编码化合物库的实验室信息管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010467298.2A CN111696623B (zh) 2020-05-28 2020-05-28 一种基于dna编码化合物库的实验室信息管理系统

Publications (2)

Publication Number Publication Date
CN111696623A CN111696623A (zh) 2020-09-22
CN111696623B true CN111696623B (zh) 2023-06-13

Family

ID=72478729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010467298.2A Active CN111696623B (zh) 2020-05-28 2020-05-28 一种基于dna编码化合物库的实验室信息管理系统

Country Status (1)

Country Link
CN (1) CN111696623B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116864036A (zh) * 2023-08-02 2023-10-10 山东政法学院 一种基于人工智能的化合物库构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000065421A2 (en) * 1999-04-26 2000-11-02 Novascreen Biosciences Corporation Receptor selectivity mapping
CN110021366A (zh) * 2018-11-21 2019-07-16 中国科学院上海药物研究所 一种基于dna编码化合物数据库的系统及其分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000065421A2 (en) * 1999-04-26 2000-11-02 Novascreen Biosciences Corporation Receptor selectivity mapping
CN110021366A (zh) * 2018-11-21 2019-07-16 中国科学院上海药物研究所 一种基于dna编码化合物数据库的系统及其分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王小平 ; 谢春华 ; 李群 ; 裴倩 ; .实验室电子记录报告自动化实现方式――电子实验记录的发展及要求.电子产品可靠性与环境试验.2019,(06),全文. *
王超 ; 袁一 ; 吴坚 ; 郭景康 ; 王健 ; .基于核酸测序流程的信息管理系统.生物信息学.2009,(03),全文. *

Also Published As

Publication number Publication date
CN111696623A (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
US20240218445A1 (en) Methods for clonotype screening
US7650351B2 (en) Internet-linked system for directory protocol based data storage, retrieval and analysis
Cox et al. Application of high-throughput screening techniques to drug discovery
Potyrailo et al. High-throughput analysis: a tool for combinatorial materials science
US20040142371A1 (en) Process for requesting biological experiments and for the delivery of experimental information
Lenoir et al. The emergence and diffusion of DNA microarray technology
Fellenberg et al. Microarray data warehouse allowing for inclusion of experiment annotations in statistical analysis
US20020150966A1 (en) Specimen-linked database
US20020049548A1 (en) Chemistry resource database
US20070048863A1 (en) Computerized factorial experimental design and control of reaction sites and arrays thereof
CN111696623B (zh) 一种基于dna编码化合物库的实验室信息管理系统
US20010032060A1 (en) Tracking of clinical study samples, information and results
Saito et al. A nutrigenomics database–integrated repository for publications and associated microarray data in nutrigenomics research
Giacoletto et al. The history and conceptual framework of assays and screens
EP1134687B1 (en) Method for displaying results of hybridization experiments
Li et al. De Novo SNP Discovery and Genotyping of Masson Pine (Pinus massoniana Lamb.) via Genotyping-by-Sequencing
Husser et al. Standardization of microarray and pharmacogenomics data
US20030087334A1 (en) Method of flexibly generating diverse reaction chemistries
Gurevitch et al. A novel three-dimensional hydrogel-based microarray platform
Otto et al. Automated high-throughput purification of PCR products using Wizard® MagneSil™ paramagnetic particles
Cheu et al. Increasing Productivity through a Combination of Automation and Robotics: A Case Study of Assay Services
US20220319634A1 (en) Methods and systems for assessing drug development outcomes
CN116189810A (zh) 一种dna编码化合物库筛选数据可视化在线分析的软件系统
Felder Lab Automation′ 97 Conference Highlights
Otto et al. Automated High Throughput Purification of BigDye™ Terminator Fluorescent DNA Sequencing Reactions Using Wizard™ MagneSil™ Paramagnetic Particles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant