CN112272764A - 化学合成路线和方法的计算生成 - Google Patents

化学合成路线和方法的计算生成 Download PDF

Info

Publication number
CN112272764A
CN112272764A CN201980024189.9A CN201980024189A CN112272764A CN 112272764 A CN112272764 A CN 112272764A CN 201980024189 A CN201980024189 A CN 201980024189A CN 112272764 A CN112272764 A CN 112272764A
Authority
CN
China
Prior art keywords
reaction
chemical reactions
reactions
chemical
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980024189.9A
Other languages
English (en)
Inventor
彼得·马德里
内森·柯林斯
马里奥·拉藤德烈斯
耶利米·马莱里奇
马库斯·库曼耐克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stanford International Institute
SRI International Inc
Original Assignee
Stanford International Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stanford International Institute filed Critical Stanford International Institute
Publication of CN112272764A publication Critical patent/CN112272764A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明描述了用于确定一个或多个最佳合成路线以生成目标化合物的逆合成方法。

Description

化学合成路线和方法的计算生成
相关专利申请的交叉引用
本申请要求2018年3月8日提交的第62/640,282号和2018年1月30日提交的第62/624,047号美国临时申请的优先权,所述美国临时申请以引用的方式全文并入本文中。
关于联邦政府资助研究的声明
本发明是在陆军研究办公室授予的合同编号W911NF-16-C-0051的政府支持下进行的。政府拥有本发明的某些权利。
背景技术
逆合成分析是一种问题解决技术,其将目标化合物的结构沿合成路线转化成一系列逐渐更简单的结构,最终为化学合成产生简单和/或商业可用的起始材料(也称作“原料”)。目前,化学家必须依靠已知的化学反应,以便以逆合成方式构建这种合成路线。需要能够构建不受已知化学反应约束的合成路线的技术。
发明内容
应当理解,下述一般描述和下述详细描述仅是示例性和说明性的,而不是限制性的。描述了用于确定合成路线的方法和系统。
描述了一种用于识别用于产生目标化合物的一个或多个合成路线的方法,所述方法包括:确定多个已知化学反应和/或多个新颖化学反应;基于经训练的分类器,从所述多个新颖化学反应确定多个预测化学反应;基于所述多个预测化学反应和所述多个已知化学反应生成多个化学反应;确定至少一种目标化合物;确定与所述至少一种目标化合物相关联的多种化学反应路线;以及从为产生所述目标化合物识别出的所述多个化学反应路线中确定一个或多个最佳化学反应路线。
描述了一种用于识别用于产生目标化合物的一个或多个合成路线的方法,所述方法包括:基于多个已知化学反应的一部分训练一个或多个机器学习分类器;基于所述多个已知化学反应确定产生目标化合物的一个或多个已知化学反应;基于化学反应转化确定产生所述目标化合物的一个或多个预测化学反应,其中所述一个或多个预测化学反应被所述一个或多个机器学习分类器预测为成功;以逆合成方式确定多个合成路线,其中每个合成路线产生所述目标化合物,其中至少一个合成路线包括所述一个或多个已知化学反应中的至少一个和所述一个或多个预测化学反应中的至少一个;以及基于反应的预定数量和成本函数,从所述多个合成路线中确定最佳合成路线。
此概述并不意图识别本公开的关键或必要特征,而仅仅是概述某些特征及其变型。其他详细信息和特征将在随后的部分中进行描述。
附图说明
并入本说明书并构成本说明书的一部分的附图示出了实施例,并且连同说明书一起用于解释方法和系统的原理:
图1示出了用于确定合成路线的示例性过程;
图2示出了用于训练机器学习分类器的示例性过程;
图3示出了示例性反应的编码;
图4示出了用于确定合成路线的示例性过程;
图5示出了示例性用户界面;
图6示出了树数据结构中的多个合成路线;
图7示出了合成路线选择的实例;
图8示出了用于合成路线选择的成本函数的示例性应用;
图9A示出了示例性方法;
图9B示出了示例性方法;
图10示出了使用所描述的方法生成的示例性合成路线;
图11示出了使用所描述的方法生成的示例性合成路线;
图12为描绘了本文所公开的模块化反应系统和方法与用于设计、执行、分析和修改化学反应的总过程的关系的示意图;
图13为示例性反应系统的一部分的示意图,该反应系统的一部分具有如本文所公开的表面安装到基板层的多个模块;
图14为示例性反应系统的一部分的示意图(系统的侧视图),该反应系统的一部分具有歧管层;
图15为示例性反应系统的一部分的示意图(系统的端视图),该反应系统的一部分具有歧管层;
图16为描绘了本文公开的示例性表面安装部件、流动连接器以及基板层、歧管层之间的相互作用的透视图;
图17为提供本文公开的示例性反应系统的俯视图的示意图,该示例性反应系统具有表面安装过程模块(反应器、分离器)、调节器模块(温度模块、阀、压力传感器模块)和分析模块(用于连接到分析装置);
图18为具有温度传感器和加热/冷却元件的示例性温度模块的示意图;
图19为描绘了本文公开的计算装置与模块化反应器系统的各种部件之间的通信的示意图;以及
图20示出了执行反应筛选和优化的设备的实例;以及
图21示出了用于实施所描述的方法的操作环境的框图。
具体实施方式
如说明书和所附权利要求书中所用,除非上下文另外明确指出,否则单数形式“一个”、“一种”和“该”包括复数指代物。在本文中,范围可以表述为从“约”一个特定值和/或到“约”另一个特定值。当表示这类范围时,另一种配置包括从一个具体值和/或到另一个具体值。通过使用先行词“约”将数值表述为近似值时,应当理解,该特定值构成了另一种配置。应进一步理解,每个范围的端点在与另一端点相关和独立于另一端点的情况下都是有效的。
“任选的”或“可选地”意指随后描述的事件或情形可能发生或可能不发生,并且该描述包括所述事件或情形发生的情况和不发生的情况。
在本说明书的描述和权利要求书全篇中,词语“包括(comprise)”和该词的变型如“包括(comprising)”和“包括(comprises)”意指“具有但不限于”,并且不旨在排除其他部件、整数或步骤。“示例性”意指“…的一个实例”,并非旨在表达对优选或理想配置的指示。“例如”不是在限制性意义上使用,而是用于解释目的。
应理解,当描述部件的组合、子集、相互作用、群组等时,虽然可能未明确地描述这些部件的每个各种个体和集体组合和排列的特定参考,但是在本文中具体地考虑和描述了每一个部件。这适用于本申请的所有部分,包括但不限于所描述方法中的步骤。因此,如果存在可以执行的多个额外步骤,应理解,这些额外步骤中的每一个可以与所描述的方法的任何特定配置或配置的组合一起执行。
如本领域技术人员将理解的,可以实施硬件、软件或软件和硬件的组合。此外,计算机可读存储介质(例如,非瞬态)上的计算机程序产品具有包含在存储介质中的处理器可执行指令(例如,计算机软件)。可以使用任何合适的计算机可读存储介质,包括硬盘、CD-ROM、光存储设备、磁存储设备、忆阻器、非易失性随机存取存储器(NVRAM)、闪存或其组合。
在本申请中,参考框图和流程图。应当理解,框图和流程图的每个方框以及框图和流程图中方框的组合分别可以通过处理器可执行指令实现。这些处理器可执行指令可以加载到通用计算机、专用计算机或其他可编程数据处理设备上以产生机器,使得在计算机或其他可编程数据处理设备上执行的处理器可执行指令产生用于实现流程图的一个或多个方框中指定的功能的装置。
这些处理器可执行指令也可以存储在计算机可读存储器中,该计算机可读存储器可以指示计算机或其他可编程数据处理装置以特定方式起作用,使得存储在计算机可读存储器中的处理器可执行指令产生包括用于实现流程图的一个或多个方框中指定的功能的计算机可执行指令的制品。处理器可执行指令也可以加载到计算机或其他可编程数据处理装置上,以使一系列操作步骤在计算机或其他可编程装置上执行,以产生计算机实现的过程,使得在计算机或其他可编程装置上执行的处理器可执行指令提供用于实现流程图的一个或多个方框中指定的功能的步骤。
因此,方框图和流程图的方框支持用于执行指定功能的装置的组合、用于执行指定功能的步骤的组合和用于执行指定功能的程序指令装置。还应理解,方框图和流程图的每个方框以及方框图和流程图中方框的组合可以由执行指定功能或步骤的基于专用硬件的计算机系统,或专用硬件和计算机指令的组合来实现。
该详细描述可以指执行某些动作的给定实体。应当理解,在一些情况下,该语言可能意味着由给定实体拥有和/或控制的系统(例如,计算机)实际上正在执行该动作。
在一个方面,描述了用于使用逆合成分析生成合成策略的方法和系统。策略是指合成目标化合物的计划。逆合成分析是一种问题解决技术,其将目标化合物的结构沿路径转化成一系列逐渐更简单的结构,最终为化学合成产生简单和/或商业可用的起始材料(也称作“原料”)。将化合物转化成合成前体是通过将转化、合成反应的精确反向应用到目标化合物来实现的。接着,从目标相反地得到的每个结构自身成为目标化合物以进行进一步分析。重复此过程最终产生到达目标化合物的合成路线(或简单地说路线),此合成路线具有作为节点的化学结构和作为反应的边。
可以选择目标化合物以用于调查,并且可以导出用于合成的合适路线。选择用于合成的目标化合物后,可确定合成计划,其将总结用于合成目标化合物的一些或所有合理路线。逆合成可以描述为以这样的方式在策略结合处的逻辑断开,以致于该过程将通过若干合成计划逐渐地产生可用起始材料。因此演变来的每个计划描述了基于逆合成的路线。每个断开产生简化的结构。这种断开的逻辑形成了对给定目标化合物的逆合成分析的基础。如本文所述,可以使用已知的化学反应和/或计算生成的化学反应生成路线。因此,可构造可以总结给定目标化合物的一些或所有可能路线的合成树。
基于对若干参数的评估,路线可被认为是有效的或最佳的。例如,整个过程的总产率何时在所有调查路线中是最好的。这不仅取决于合成中涉及的步骤数量,而且取决于所遵循策略的类型。策略可涉及仅涉及后续步骤的线性合成,或涉及较少后续步骤的会聚合成。当每个断开过程仅产生一个可行的中间体并且该过程以这种方式一直继续到一组起始材料时,该过程被称为线性合成。当中间体可以两种或更多种方式断开时,产生不同的中间体,在计划中发生分支。该过程可以一直继续到起始材料。在这些路线中,合成路径的不同分支朝中间体会聚。此类方案被称为会聚合成。
如图1所示,所描述的方法和系统依赖于针对逆合成的多个反应110。反应110可以包括已知反应120和预测反应130两者。已知反应120可以源自任何已知反应源,例如反应数据库。反应数据库可包括例如Reaxys、SciFinder、ChemInform或OrgSyn,以及专有反应数据库,诸如来自内部电子实验室笔记本电脑的数据库。预测反应130(计算生成的反应)可以基于已知反应转化,例如MCT(药物化学家的工具箱)生成,所述MCT包含:药物化学家常用的一组可靠反应(Roughley和Jordan,J.Med.Chem.,2011,3451),其通过引用并入本文中;所称的“命名反应”或通过在反应数据库上聚类方法以识别广义的反应转化来计算提取的列表(J.Chem.Inf.Model.,2009,49(3),pp 593–602),其通过引用并入本文中。“反应转化”可以是在各种原子类型之间形成和断裂的键的模式的概括。预测反应130可通过人工智能技术(例如机器学习和分类)被分类为成功或不成功。例如,可以使用人工神经网络、支持向量机、增强和袋装决策树、k最近邻技术、朴素贝叶斯技术、判别分析、逻辑回归、其组合等中的一个或多个对预测反应130进行分类。已知反应120和预测反应130两者可由路线引擎140使用。路线引擎140可以接收目标化合物作为输入,并且以逆合成方式应用源自反应110的反应转化以生成一个或多个合成路线150。
在一个方面,描述了用于使用人工智能技术生成预测反应130的方法和系统。在图2中示出了使用人工智能技术生成预测反应130的实例。已知反应120可用作训练数据以训练机器学习分类器。机器学习包括若干方法、装置和/或其他特征中的任何一个,这些方法、装置和/或其他特征使用给定形式的数据的实例被优化以执行特定的信息任务(例如,分类或回归),然后能够在相同类型和形式的未知数据上执行此相同任务。机器(例如,计算机)将例如通过识别由训练数据展现的模式、类别、统计关系等来学习。然后,使用学习的结果来预测新数据是否表现出相同的模式、类别、统计关系。机器学习分类器可以是以下各项中的一者或多者:人工神经网络、支持向量机、增强和袋装决策树、k最近邻技术、朴素贝叶斯技术、判别分析、逻辑回归、其组合等。
为了训练机器学习分类器,在210处,可通过对已知反应120进行编码来处理已知反应120以用作训练数据。对已知反应进行编码可包括根据一组固定的特性对反应物的所有原子进行编码。特性可包括例如:
i.基于每个原子的邻近原子(CH4、CH3、C芳族等),将每个原子分类为多个类别(例如78个类别)之一
ii.固定长度为156个整数(2*78)的向量作为类别的直方图。
在Scott A.Wildman,Gordon M.Crippen发表于J.Chem.Inf.Comput.Sci.,1999,39,pp.868—873的“Prediction of Physicochemical Parameters by AtomicContributions”中描述了原子类型分类系统,其以引用方式并入本文中。
原子类可以定义为原子种类、其特性,以及与其键类型直接相邻的原子种类和特性。对已知反应120进行编码可以使用原子类的稀疏向量。可以通过考虑已知反应120中的所有原子(例如,在产生27,429个类的Reaxys数据库中)来提取类的数量。可排除出现次数小于阈值次数的原子类。阈值次数可以是例如10、20、30、40、50、60、70、80、90等等。
图3示出了涉及MCT类型“异氰酸酯与亲核试剂反应”的示例性反应。在这个例子中,具有异氰酸酯官能团的分子(1-异硫氰酸根-3,5-双(三氟甲基)苯)的特定实例与胺亲核试剂(N1,N1-二甲基环己烷-1,2-二胺)反应,以得到具有硫脲官能团的单一产物(1-(3,5-双(三氟甲基)苯基)-3-(2-(二甲基氨基)环己基)硫脲)。将此特定反应编码为含有如所示的两种反应物中的每一种中存在的原子类的直方图的稀疏向量。此编码以及关于产率和/或反应条件的信息可用作对机器学习分类器的训练的输入。
返回图2,在步骤220处,已知反应120中的一些或所有反应定义为正或负。正实例可以定义为已知反应120中产率大于阈值(例如,10%、20%30%、40%、50%、60%、70%、80%、90%,等等)的所有反应。负实例可以定义为已知反应120中产率小于阈值(例如,10%、20%30%、40%、50%、60%、70%、80%、90%,等等)的反应,其中,反应物是适用的,但报告的产物来自不同反应类型。
已被识别为正或负的被编码的反应可划分成训练数据集和测试数据集。可以在230处使用训练数据集来训练一个或多个机器学习分类器。例如,可将80%的被编码的反应用于训练,并且可将20%的被编码的反应用于测试。
在一个方面,可以在230处为每一个化学转化创建机器学习分类器并对其进行训练。本文中描述的方法和系统可以各种方式和上下文执行步骤230。在一个实例中,本文中描述的方法和系统可通过对训练数据集执行以下操作来训练基于机器学习的分类器:(1)从训练数据集提取包括训练数据集内的正实例的统计显著特征和训练数据集内的负实例的统计显著特征的特征集;接着(2)使用所述特征集构建基于机器学习的分类模型,该分类模型能够指示新数据项是否包含属于与训练数据集关联的特定反应类别的信息。
如本文中所使用的术语“特征”可指数据项的任何特性,其可用于确定数据项是否落入化学反应的一个或多个特定类别中。此类特征的实例包括但不限于:键合到两个其他芳族碳的芳族碳、具有两个键合氢的碳、与碳双键合的氧、溶剂、催化剂、试剂、反应温度、反应时间、其组合等等。
本文中描述的方法和系统可以多种方式从训练数据集提取特征集。在一些实例中,权重可以与每个提取特征相关联,以便指示该特征相对于其他特征的相对重要性。例如,所述方法和系统可(1)确定训练数据集内的正实例和负实例内的各种特征的出现频率,(2)基于例如发生频率对这些正特征和负特征进行排序,接着(3)选择包括在特征集内的最高排序的特征。在此实例中,与每个特征相关联的权重可以是特定特征的出现频率。
如上文详细描述的,在所述方法和系统已经生成特定训练数据集的特征集之后,所述方法和系统可以基于所述特征集生成基于机器学习的分类模型。如本文所使用的术语“基于机器学习的分类模型”可以指使用机器学习技术生成的用于数据分类的复杂数学模型。在一个实例中,此基于机器学习的分类器可包括表示边界特征的支持向量的图。在此实例中,这些边界特征可以选自特征集和/或表示特征集中的最高排序的特征。
所述方法和系统可使用从训练数据集提取的特征集以针对从被编码的反应210确定的每个化学转化构建基于机器学习的分类模型(例如,机器学习分类器)。在一些实例中,可将多个基于机器学习的分类模型组合成单个基于机器学习的分类模型。类似地,基于机器学习的分类器可以表示含有单个或多个基于机器学习的分类模型的单个分类器和/或含有单个或多个基于机器学习的分类模型的多个分类器。
在240处,可使用测试数据集测试经训练的机器学习分类器。可分析经训练的机器学习分类器的测试输出以评估经训练的机器学习分类器的性能。经训练的机器学习分类器的性能可通过多个度量来评估。举例来说,经训练的机器学习分类器的性能可以通过五个度量(TP=真阳性,FP=假阳性,TN=真阴性,和FN=假阴性)来评估:1)准确度=(TP+TN)/(TP+FP+FN+TN);2)正精度=TP/(TP+FP);3)负精度=TN/(TN+FN);4)正召回=TP/(TP+FN);和5)负召回=TN/(TN+FP)。
在一个方面,不管性能如何,都可以使用所有经训练的机器学习分类器。经训练的机器学习分类器在使用时生成概率正确的预测。在使用时,可由用户选择概率值以接受或拒绝预测反应的分类。
返回图1,可使用经训练的机器学习分类器来确定在构建合成路线时包括或不包括预测反应130。来自被编码的(已知的)反应120的多种反应物可以被输入到经训练的机器学习分类器中,所述机器学习分类器可以被配置成将反应物组合成一个或多个预测反应130。经训练的机器学习分类器可被配置成在路线引擎140接收输入之前或“在进行”路线引擎140确定一个或多个路线时生成预测反应130。在一个方面,经训练的机器学习分类器可以是路线引擎140的一部分。
路线引擎140可以接收目标化合物(例如,用户给定的化合物)作为输入,并且以逆合成方式应用源自反应110的反应转化以生成一个或多个合成路线150。目标化合物可以是任何化学结构,并且可以通过字母数字输入和/或绘制的化学结构进行输入。目标化合物应被识别为在一个或多个化学反应结束时实现的化合物。
如图4中所示,路线引擎140可以使用目标化合物410(和/或下游/上游反应物)搜索反应110(包括已知反应120,或者如果预测反应130已经预先生成包括已知反应120和预测反应130两者)以识别含有目标化合物410(和/或下游/上游反应物)的反应,并且以逆合成方式应用反应转化以生成一系列潜在化学反应,从而产生目标化合物410(和/或下游/上游反应物)。在一个方面,在430处,路线引擎140可以将目标化合物410(和/或下游/上游反应物)应用到一个或多个已知反应转化(例如,MCT转化)以生成预测反应130。路线引擎140可确定目标化合物410是否包含为一个一般反应转化中的产物指定的最小结构元素(或子结构)。可以将预测反应130提供给一个或多个机器学习分类器,以评估涉及该试剂的预测反应130是否成功。如果预测是预测反应130成功,则预测反应130可以包括在路线生成中。如果预测是预测反应130不成功,则可以从路线生成中排除预测反应130。
在430处,可以指定一个或多个参数440以修改反应转化的应用。一个或多个参数440可包括一个或多个路线修改器,例如原料数据、设备数据(例如,化学设备)等。原料数据可包括指示用于化学反应的可用和/或优选试剂的数据。设备数据可包括指示用于化学反应的可用和/或优选设备的数据。设备数据可从图12至图19中描述的模块化化学反应系统和/或从图20中描述的设备2000获得。例如,设备数据可以指示模块化化学反应系统或设备2000的一个或多个操作参数。因此,通过本文描述的方法生成的合成路线可以基于提供给路线引擎140的设备数据被定制以在模块化化学反应系统或设备2000上执行。
图5提供了示例性用户界面500,其用于向路线引擎140提供输入。用户界面500可包括用户界面元素501,其被配置成例如以指示InChl-key、公用名称、框架编号的字母数字值和/或通过使用化合物结构编辑器接收目标化合物410。用户界面500可包括用户界面元素502,其被配置成例如以数字值接收最大数量的最佳路线。用户界面500可包括用户界面元素503,其被配置成例如以指示每摩尔所需化合物的美元的数字值接收实施任何反应的成本。用户界面500可包括用户界面元素504,其被配置成例如以指示每摩尔量的特定溶剂的美元的数字值接收易于交换溶剂的成本。用户界面500可包括用户界面元素505,其被配置成例如以指示每摩尔量的特定溶剂的美元的数字值接收难以交换溶剂的成本。用户界面500可包括用户界面元素506,其被配置成例如以指示百分比产率的数字值接收没有产率的反应的产率。用户界面500可包括用户界面元素506,其被配置成例如以二进制指示(例如,复选框)接收在找到最佳路线之后应显示更多路线的指示。用户界面500可包括用户界面元素508,其被配置成例如以指示反应编号、化合物编号、化合物名称或inchi key的字母数字值接收排除考虑的化合物(反应物)。用户界面500可包括用户界面元素509,其被配置成例如以数字值接收要创建的多个新反应。用户界面500可包括用户界面元素510,其被配置成例如以数字值接收新反应的最大深度。用户界面500可包括用户界面元素511,其被配置成例如以二进制指示(例如,复选框)接收应用机器学习分类器的指示。用户界面500可包括用户界面元素512,其被配置成例如以二进制指示(例如,复选框)接收仅使用用于路线的新反应的指示。用户界面500可包括用户界面元素513,其被配置成例如以二进制指示(例如,复选框)接收关于路线引擎140是否应创建新化合物的指示。用户界面500可包括用户界面元素514,其被配置成例如以二进制指示(例如,复选框)接收关于路线引擎140是否应在网络中创建新反应的指示。
返回图4,在450处,路线引擎140可以使用Morgan算法将生成的反应物从一系列潜在化学反应映射到固定反应网络。Morgan算法为反应的每种化合物创建唯一的名称(或代码),从该反应可以确定固定反应网络中是否已经存在每种化合物。Morgan算法对化合物的同类原子进行分类并选择不变标记的原子。分类使用考虑原子的邻近原子数(连接)的概念并且以迭代方式(延长的连接)使用所述概念。基于某些规则,Morgan算法在网络中产生明确且唯一的化合物编号(例如,生成的反应物)。
在460处,对于每种化合物(作为反应物),远离目标化合物410(和/或下游/上游反应物)的一次反应,步骤430和450可重复,直到新反应达到最大数目,从而建立具有每个新路线的路线网络。作为实例,新反应的最大数目可以≤100k、≤200k、≤300k、≤400k、≤500k、≤600k、≤700k、≤800k、≤900k、≤1000k等。路线引擎可因此生成一个或多个化学反应序列,所述一个或多个化学反应序列被设计成产生目标化合物410。化学反应的序列可被称为路线。目标化合物410的路线网络可以树数据结构表示,并输出以供显示。
图6示出了包括多个路线的示例性树数据结构600。目标化合物410可以位于树数据结构600的中心。每个边可包括一个反应,并且每个节点可包括一个化合物(反应物)。如图所示,边610表示源自已知反应120的反应,节点620表示边610的反应中涉及的化合物(反应物)。边630表示源自预测反应130的反应,节点640表示边630的反应中涉及的化合物(反应物)。区域650内包含的节点表示化学中间体,而区域660内包含的节点表示可购买的原料化合物。因此,区域660内的节点可以用作一系列化学反应中的初始化合物,所述化学反应将追踪到起始(目标)化合物410的路线(一系列化学反应)。
返回图4,一旦达到从目标化合物410以逆向合成方式形成的反应的最大数目,路线引擎140可在470处确定最佳路线。路线引擎140可使用Dijkstra类算法利用快速搜索路线网络以确定最佳路线。
路线引擎140可根据两阶段方法在470处确定最佳路线。在第一阶段中,路线引擎140可以确定可在k个反应或更少反应(最多k个反应)中产生目标化合物的化合物。在第二阶段中,路线引擎140可以确定至目标化合物410的最小成本路线。可以将具有最低最小成本的路线识别为最佳路线。可以将具有低于阈值的成本的多个路线识别为最佳路线。第二阶段可以在不考虑反应叠缩(reaction telescoping)的情况下确定最佳路线。在无诊断检查或溶剂交换步骤的情况下,当两个或更多个反应以某反应顺序出现时,发生反应叠缩。
如图7中所示,在第一阶段中,路线引擎140可以从起始(目标)化合物开始并识别产生目标化合物410的化学反应710。路线引擎140可确定这些反应710的反应物720,并在距目标化合物410为1的距离处标记反应物720。路线引擎140可以通过确定产生反应物720的反应,确定那些反应的反应物,并在距目标化合物410距离为2处标记那些反应物,来重复自反应物720的过程。可重复此过程,从而标记每种反应物直到达到距目标化合物410的距离k。每种反应物仅被标记一次,直到达到距离k。没有到目标化合物410的路径的反应和反应物将被排除在考虑范围内。超出k的反应和反应物将被排除在考虑范围内。第一阶段可用于限制要考虑的原料和反应。
如图8中所示,在第二阶段中,路线引擎140可确定最低成本路线。路线引擎140可以使用可从原料激活的反应初始化优先级队列。如果反应所需的所有反应物是原料的话,则反应可以激活。反应成本可以被确定为原料成本的总和除以产率。路线引擎140可以确定具有最小成本的活性反应,并且识别由具有最小成本的活性反应的产物激活的下一反应。可以将下一反应添加到优先级队列,并且可以重复该过程直到达到目标化合物410为止。每个反应仅被考虑一次。如图8中所示,反应A、反应B、反应C和反应D各自利用反应物的原料。反应A利用反应物C1和C2。反应物C1的确定成本为1,并且反应物C2的确定成本为3。反应A的产率为0.5。反应A的总成本由(1+3)/0.5确定,产生为8的成本。反应A之后的下一反应是反应C。反应C利用反应物C4。反应物C4的确定成本为8。反应C的产率为0.8。反应C的总成本由8/0.8确定,产生为10的成本。反应C的结果是起始(目标)化合物410。路线反应A-反应C的总成本是8+10=18。
反应B利用反应物C3。反应物C3的确定成本为6。反应B的产率为0.9。反应B的总成本由6/0.9确定,产生为6.6的成本。反应B之后的下一反应是反应D。反应D利用反应物C5。反应物C5的确定成本为6.6。反应D的产率为0.6。反应D的总成本由6.6/0.6确定,产生为10.9的成本。反应D的结果是起始(目标)化合物410。路线反应B-反应D的总成本是6.6+10.9=17.5。在第二阶段,路线引擎140可以比较总成本,并选择具有最低成本的路线。如图8中所示,路线反应B-反应D具有比反应A-反应C(18)更低的成本(17.5)。因此,路线引擎140可以确定路线反应B-反应D为最小成本路线。
路线引擎140可以多种方式确定路线的成本。路线的成本可为生产起始(目标)化合物410的财务(例如货币)成本,这是产生起始(目标)化合物410的反应的成本加上所有溶剂交换成本的总和(例如,所有成本均以每摩尔美元为单位)。反应的成本可以是反应物(包括试剂)的财务(例如货币)成本的总和除以反应的产率加上实施反应的固定财务(例如货币)成本。在两次反应之间或反应的阶段中,溶剂交换的财务(例如货币)成本可以是固定成本。具有最小成本的路线可被识别为最佳路线。
在一个方面,路线引擎140可以根据以下公式确定成本:
Figure BDA0002711598820000121
其中,
CR是由反应R产生的化合物C
I成本(R)是实施反应R的固定成本
CRi是由某反应Ri产生的R的反应物
f成本是原料f的固定成本
R产率是反应R的产率,0<R产率≤1
返回图1,由路线引擎140确定的最佳路线可被识别为最佳合成路线150,并且以化学家可理解的图形方式作为用化合物的名称文本描述的反应树,或使用公共交换格式(例如,JavaScript对象标记(JSON)或可扩展标记语言(XML))以计算图式输出。
图9A示出了一种用于识别用于产生目标化合物的一个或多个现有或新颖化学合成路线的计算方法900,所述计算方法包括在901处确定多个已知化学反应和/或多个新颖化学反应。多个新颖反应可从广义的已知化学转化推断得到。
方法900可包括在902处,基于经训练的分类器从多个新颖化学反应确定多个预测化学反应。可以在从作为给定化学转化的实例的已知为成功的多个化学反应和已知为不成功的多个化学反应得到的数据上训练所述经训练的分类器。
方法900可以包括在903处基于多个预测化学反应和多个已知化学反应而生成多个化学反应。多个化学反应的每一化学转变可表示一种化合物到另一种化合物的转化。
方法900可以包括在904处确定至少一种目标化合物。
方法900可以包括在905处确定与至少一种目标化合物相关联的多个化学反应路线。每一化学反应路线可包括产生目标化合物的多种化学反应中的一个或多个化学反应。
方法900可以包括在906处从识别为用于产生目标化合物的多个化学反应路线中确定一个或多个最佳化学反应路线。一个或多个最佳化学反应路线中的至少一个可包含至少一种已知反应转化和至少一种预测反应转化。
方法900还可包括在训练数据集上训练分类器,其中训练数据集包括一个或多个化学反应的化学反应数据库、估计产率或预测产率中的一者或多者。在训练数据集上训练分类器可包括接收包含基于一个或多个化学转化的一个或多个化学反应的数据集,其中所述一个或多个化学反应中的每一个包含至少一种反应物,其中每种反应物由一个或多个原子组成。对于每种反应物,方法900可以基于邻近原子、键级和/或存在的氢原子的数量将一个或多个原子分类成某类别。对于每种反应物,方法900可以基于类别的直方图来确定向量。方法900可确定由a)与特定转化相关联的反应的向量和b)与特定转化相关联但从不同反应类型产生产物的反应的向量组成的训练数据集;将分类器暴露于训练数据集的一部分以训练分类器;以及将经训练的分类器暴露于训练数据集的另一部分以测试经训练的分类器。
将经训练的分类器暴露于训练数据集的另一部分以测试经训练的分类器可包括基于一个或多个度量评估经训练的分类器的性能。一个或多个度量可包括准确度、正精度、负精度、正召回或负召回中的一者或多者。
方法900还可以包括生成树数据结构,其中目标化合物是树数据结构的根节点。方法900还可以包括向树数据结构添加多个分支,其中多个分支中的每个分支包括多个合成路线中的一个合成路线。
确定与目标化合物相关联的多个合成路线可基于一个或多个参数。一个或多个参数可包括可用原料、可用化学物质或可用设备中的一者或多者。
从多个合成路线中确定一个或多个最佳合成路线可以基于一个或多个参数。一个或多个参数包括可用原料、可用化学物质、可用设备、产率、财务成本、时间、反应条件或反应成功的可能性中的一者或多者。从多个合成路线中确定一个或多个最佳合成路线可包括:确定在至多预定义数目的步骤中可达到目标的所有化合物;并且在不考虑转变叠缩的情况下确定到目标化合物的最小成本合成路线。
确定最小成本路线可以包括评估成本函数。成本函数可包括
Figure BDA0002711598820000131
其中,
CR是由反应R产生的化合物C
I成本(R)是实施反应R的固定成本
CRi是由某反应Ri产生的R的反应物
f成本是原料f的固定成本
R产率是反应R的产率,0<R产率≤1
图9B示出了方法910,其用于识别用于合成目标化合物的一个或多个合成路线,所述方法包括在911处基于多个已知化学反应的一部分而训练一个或多个机器学习分类器。多个已知化学反应可以从一个或多个化学反应的化学反应数据库、估计产率或预测产率中的一者或多者得到。基于多个已知化学反应的一部分训练一个或多个机器学习分类器可包括:接收包含基于一个或多个化学转化的一个或多个化学反应的数据集,其中,一个或多个化学反应中的每一个包括至少一种反应物,其中,每种反应物由一个或多个原子组成;对于每种反应物,基于邻近原子、键级和/或存在的氢原子的数量将一个或多个原子分类成某类别;对于每种反应物,基于类别的直方图确定向量;确定由a)与特定转化相关联的反应的向量和b)与特定转化相关联但从不同反应类型产生的产物的反应向量组成的训练数据集;将分类器暴露于训练数据集的一部分以训练分类器;以及将经训练的分类器暴露于训练数据集的另一部分以测试经训练的分类器。将经训练的分类器暴露于训练数据集的另一部分以测试经训练的分类器可包括基于一个或多个度量评估经训练的分类器的性能。一个或多个度量可包括准确度、正精度、负精度、正召回或负召回中的一者或多者。
方法910可以包括在912处基于多个已知化学反应确定产生目标化合物的一个或多个已知化学反应。
方法910可以包括在913处基于化学反应转化确定产生目标化合物的一个或多个预测化学反应。一个或多个预测化学反应可以被一个或多个机器学习分类器预测为成功。
方法910可以包括在914处以逆合成方式确定多个合成路线。每一个合成路线可产生目标化合物,其中至少一个合成路线包含一个或多个已知化学反应中的至少一个和一个或多个预测化学反应中的至少一个。以逆合成方式确定多个合成路线可以基于一个或多个参数。一个或多个参数可包括可用原料、可用化学物质或可用设备中的一者或多者。
方法910可以包括在915处基于反应的预定数量和成本函数从多个合成路线中确定最佳合成路线。基于反应的预定数量和成本函数从多个合成路线中确定最佳合成路线可进一步基于一个或多个参数。一个或多个参数包括可用原料、可用化学物质、可用设备、产率、财务成本、时间、反应条件或反应成功的可能性中的一者或多者。基于反应的预定数量和成本函数从多个合成路线中确定最佳合成路线可包括:确定在至多预定义数目的步骤中可达到目标的所有化合物;并且在不考虑转变叠缩的情况下确定到目标化合物的最小成本合成路线。成本函数可包括:
Figure BDA0002711598820000141
其中,
CR是由反应R产生的化合物C
I成本(R)是实施反应R的固定成本
CRi是由某反应Ri产生的R的反应物
f成本是原料f的固定成本
R产率是反应R的产率,0<R产率≤1
方法910还可以包括生成树数据结构,其中目标化合物是树数据结构的根节点。方法910还可以包括向树数据结构添加多个分支,其中多个分支中的每个分支包括多个合成路线中的一个合成路线。
图10示出了用于产生从所描述方的法和系统得出的安定(Diazepam)的路线。在不利用机器学习分类器对预测反应进行分类的情况下生成的最佳路线产生包含在Reaxys数据库中的熟知的两步合成路线。图10中所示的路线是利用机器学习分类器使用所描述的方法和系统生成的。如所示的,最佳路线的第一步是2-氨基-5-氯二苯甲酮的酰化,导致5-氯-2-(氯乙酰氨基)二苯甲酮。第一步的反应得自已知反应(例如Reaxys)。最佳路线的第二步是具有推荐反应条件的酰胺N-烷基化,其由路线引擎140生成,并且由经训练的机器学习分类器确定为成功。第二反应的结果是2-(2-氯-N-甲基-乙酰胺)-5-氯二苯甲酮。最佳途径的第三步是导致地西泮的环环化反应。第三步的反应得自已知反应(例如Reaxys)。该路线在多步流动合成仪上执行,在161mg的规模下提供以78%产率的地西泮。
图11显示了源自所述方法和系统的用于产生伊马替尼的途径。图10中所示的路线是利用机器学习分类器使用所描述的方法和系统生成的。如所示的,最佳路线的第一步是对甲苯甲酸的溴化,导致4-溴甲基苯甲酸。第一步的反应得自已知反应(例如Reaxys)。最佳路线的第二步是来自酸反应的酰胺合成,所述酸反应由路线引擎140生成,并且由经训练的机器学习分类器确定为成功。第二反应的结果是4-(溴甲基)-N-(4-甲基-3-((4-(吡啶-3-基)嘧啶-2-基)氨基)苯基)苯甲酰胺。最佳路线的第三步是导致伊马替尼的烷基化反应。第三步的反应由路线引擎140生成,并且由经训练的机器学习分类器确定为成功。该路线在多步流动合成仪上执行,在8.4g的规模下提供以91%产率的伊马替尼。
在各种方面并参考图12-图19,本文中公开了模块化化学反应系统10。该设备的完整公开内容可参见2018年4月6日提交的名称为“Modular Systems For PerformingMultistep Chemical Reactions,And Methods Of Using Same”的PCT/US2018/026557,其内容以引用方式全文并入本文中。系统10可以具有基板层20和表面安装层40,所述表面安装层包括如本文进一步公开的多个模块50。系统10还可包括多个密封元件90。
在使用中,并且如在图12中示意性地描绘的,设想了模块化化学反应系统10可以提供自动化化学合成和监测能力,其可以结合到综合系统中,以用于设计、模拟、筛选、执行、分析和修改/优化化学反应。如本文进一步公开的,设想了所公开的系统10可提供模块化,其允许快速重新配置(可选地,重排)系统部件以快速改变与多个不同的反应相关联的流体流动路径。在一些方面,重新配置意味着在具有限定路径和预定位模块和/或分析装置的系统内选择替代性路径。在这些方面,设想了可以通过如本文所公开的阀模块来分离限定路径,所述阀模块可以被调节以修改限定路径内和限定路径之间的流体流动。在其它方面,重新配置可包括将新模块或分析装置物理地添加到所公开的系统10。另外或替代地,重新配置可包括移除或更换如本文所公开的至少一个模块或分析装置。还设想了所公开的系统10可以提供用于使用反应模块的单个配置来执行多种化学反应的框架。另外,设想了所公开的系统10可以在先前不可实现的化学反应的执行期间提供监测能力。另外,设想了所公开的系统10可以基于在发生反应时从各种模块和分析装置接收的反馈来控制和/或优化反应条件。
在示例性方面,并且参考图13-16,基板层20可以具有基板22和定位在基板内的多个流动部件(例如,流动连接器26)。在这些方面,基板22可以具有外表面24。可选地,在示例性方面,基板22可包括多个基板主体,其被选择性地平行定位以建立如本文公开的用于平行流体通路的框架。尽管基板主体在本文中大体上描述为平行的,但可以设想,基板主体可以任何期望的构造,包括垂直构造和成角度的构造定位。替代性地,设想了基板22可为单个连续平台结构。在示例性方面,基板层20(以及本文中进一步公开的歧管层)可以被构造成选择性地附接到下面的栅格支撑结构,所述栅格支撑结构限定用于接收紧固件的多个开口,以将基板层和/或歧管层固定到网格支撑结构。
可选地,多个模块中的每个模块50可具有至少第一入口51和第一出口53,如图13所描绘的。然而,可以设想,一些模块可以被配置成用于存储材料和/或以其它方式仅包括入口51或出口53。
在另外的方面,表面安装层40的多个模块50可以与多个流动部件(例如,流动连接器26)呈重叠关系选择性地安装到基板22的外表面24(例如,上表面)。在这些方面,设想了多个模块50可包括多个流动模块52,其接收在系统10内形成流体流动路径的一部分的流体。还设想多个流动模块中的每个流动模块52可定位成与多个流动部件中的至少一个流动部件(例如,流动连接器26)在相应接口30处流体连通,如图13中所示的。在另外的方面,多个密封元件90可以被构造成在多个流动模块中的流动模块52与多个流动部件中的流动部件(例如,流动连接器26)之间的每个接口30处建立不透流体的密封。如本文进一步公开的,多个流动模块52中的至少一部分和多个流动部件中的至少一部分(例如,流动连接器26)可协作以建立流体流动路径12(例如,第一流体流动路径),其用于执行化学反应的至少一个步骤或一系列化学反应。如本文进一步公开的,设想了流动模块和流动部件的配置可被选择性地修改以产生与第一流体流动路径不同的第二流体流动路径。可选地,在示例性方面,流体流动路径可以是液体流动路径。在这些方面,设想了密封元件90可以被构造成在流动模块52与流动连接器26之间的每个接口30处建立不透液体的密封。在另外的示例性方面,设想了化学反应可以是连续流的多步骤化学反应。
在另外的方面,每个流动连接器26可被构造成选择性地形成流体流动路径12的一部分,以用于执行化学反应的至少一个步骤。替代性地,每个流动连接器26可被构造成选择性地从形成流体流动路径的流动连接器脱离,使得流动连接器不与流体流动路径流体连通。在示例性方面,每个流动连接器26可以具有相对的入口/出口开口28,其可取决于具体流动路径构造中的流体流动方向而充当入口或出口。如图16中所描绘的,设想了流动连接器26可定位在沿着基板22的长度延伸的通道23内。在另外的方面,设想了基板22的外表面24可限定连接开口25,其被构造成允许将表面安装部件(例如,模块)紧固到基板。还设想了流动连接器26的入口/出口开口28可从流动连接器的邻接部分向上或向下突出,以接合如本文中所公开的模块或其它流动连接器的入口或出口。
在示例性方面,设想了多个模块中的每个模块50可具有共同基底结构,所述共同基底结构包括多个开口,所述多个开口被构造成接收用于将模块安装到基板22的外表面24的紧固件(例如,螺栓或螺钉)。在这些方面,设想了每个模块50的基底结构内的开口的位置可与基板层20内限定的相应连接开口25互补。还设想共同基底结构可包括共同尺寸轮廓,例如但不限于方形轮廓,该轮廓可任选地包括约1.5英寸的长度和宽度尺寸。在一些示例性方面,所公开的模块50可直接安装到如本文所公开的基板22。替代性地,在其它示例性方面,并且如图16中所示,所公开的模块50可安装到底板55,所述底板继而安装到如本文所公开的基板22。
可选地,在另外的方面,并且如图14-图16中所示,模块化化学反应系统10还可包括歧管层1410。在这些方面,歧管层1410可包括在基底层20下方的至少一个歧管主体1420。可选地,歧管主体1420可包括多个歧管主体,所述多个歧管主体被选择性地平行定位以建立如本文公开的用于平行流体通路的框架。替代性地,设想了歧管主体1420可为单个连续平台结构。在使用中,设想了歧管主体1420可垂直于本文公开的基板22定向,以便在平行基板之间提供反应成分的输送。替代性地,在其它方面,歧管主体1420可以平行于基板主体(或直接位于基板主体下方)定向,以允许绕过与特定基板主体对准的某些反应模块。在示例性方面,设想系统的多个流动连接器26可包括位于基板层20内的第一多个流动连接器26和位于歧管层1410内的第二多个流动连接器1430。歧管层1410的每个流动连接器1430可以具有相对的入口/出口开口1440,其可取决于具体流动路径构造中的流体流动方向而充当入口或出口。如图16中所描绘的,设想了流动连接器1430可定位在沿着歧管主体1420的长度延伸的通道1630内。在另外的方面,设想了歧管主体1420可以具有外表面1610,其限定了连接开口1620,所述连接开口被构造成允许将基板22紧固到歧管主体。还设想了流动连接器1430的入口/出口开口1440可从流动连接器的邻接部分向上或向下突出,以接合如本文中所公开的模块或其它流动连接器的入口或出口。
设想了可以以一系列不同长度和形状设置所公开的基板层和歧管层的流动连接器26、1430,以允许与本文公开的其它流动连接器和多种模块连接。
尽管在图14-图16中描绘为在表面安装层40下方具有两层(基板层20和歧管层1410),设想了所公开的系统可以在歧管层1410下方具有附加层以允许进一步的流体路径修改。
在另外的方面,并且参考图17–图18,多个模块50可包括至少一个监测模块58,所述至少一个监测模块被配置成产生指示化学反应的至少一个条件的至少一个输出。在这些方面,设想了至少一个监测模块58(可选地,多个监测模块)可以通信耦合到处理电路,如本文进一步公开的。可由至少一个监测模块58监测的示例性条件包括但不限于温度、压力、流速、对由反应生成的产物的识别、试剂的消耗速率、副产物的识别、产率、选择性、纯度等。设想了至少一个监测模块可包括足够的传感器、硬件或能够生成对应于由至少一个监测模块58监测的条件的输出的处理部件。
在其它示例性方面,多个流动模块中的至少一个流动模块52可为过程模块54,其可以对应于化学反应的步骤的位置。可选地,本文公开的每个过程模块54还可充当监测模块58,其中,过程模块54还被配置成将至少一个输出提供到如本文进一步公开的处理电路。此类过程模块54的实例包括如本文进一步公开的反应器56或分离器60。在一个方面,当至少一个过程模块52包括反应器56时,设想该反应器可以是加热管反应器、填充床反应器或其组合。然而,设想了可使用其它反应器,前提条件是其具有本文公开的表面安装能力。在另一方面,当至少一个过程模块52包括分离器60时,所述分离器可以是液/液分离器或气/液分离器。在一个可选方面,分离器60可包括基于膜的液-液分离器,如本申请的实例部分中进一步公开的。在另一可选方面,分离器60可包括基于重力的液-液分离器,如本申请的实例部分中进一步公开的。在此方面中,且如本文进一步描述的,可设想基于重力的液-液分离器可被构造成如常规的那样在高于大气条件的压力下使用。还设想了所公开的基于重力的液-液分离器可包括允许分离过程可见的玻璃。还进一步设想了所公开的基于重力的液-液分离器可提供入口和出口流动路径,其在共同平面中行进而不像常规的那样在不同的平面中行进。在另外的方面,设想了分离器60可包括基于重力的气-液分离器,如本申请的实例部分中进一步公开的。
可选地,在示例性构造中,系统的多个流动模块52可包括至少一个反应器56和至少一个分离器60。
可选地,在示例性方面,设想了基板层20的每个流动连接器26(和当存在时,歧管层1410的每个流动连接器1430)沿其整个长度可具有一致的内径(可选地在约0.04英寸到约0.08英寸的范围内)。可选地,在这些方面,系统10的至少一个流动模块52可包括反应器56和/或分离器60,并且至少一个流动模块52的流体入口51和流体出口53中的至少一个可以与多个流动连接器中的相邻流动连接器26共享一致的内径。可选地,在又一示例性方面,多个流动连接器中的流动连接器26、1430(可选地,每个流动连接器)的至少一部分可以包括Hastelloy(哈氏合金)C276。与在各种位置处具有可变内径的已知流动连接器相比,设想了所公开的流动连接器可通过最小化死空间并提供改善的流体流动(特别是在液体反应中)来提供改善的性能。
可选地,在另外的示例性方面,模块化化学反应系统10的多个模块50可包括至少一个调节器模块64。可选地,在这些方面,本文中公开的每个调节器模块64还可充当监测模块58,其中,调节器模块64还被配置成将至少一个输出提供到如本文进一步公开的处理电路。在示例性方面,设想了每个调节器模块64可以定位成与流体流动路径12流体连通或热连通,且被配置成实现、维持和/或测量化学反应的一个或多个所需条件。可选地,系统10的多个模块50可包括至少一个过程模块54和至少一个调节器模块64。示例性调节器模块64包括例如但不限于:止回阀、T形过滤器、流量调节器、压力感测模块、泄压阀、背压调节器、管适配器、阀、泵、流量选择器、控制阀模块、温度监测模块、温度控制模块、加热器、冷却器或其组合。在示例性方面,设想了至少一个调节器模块64可以包括传感器(例如,温度、压力或流量传感器),其定位成与流体流动路径的一部分流体连通和/或热连通,并且被配置成产生指示调节器模块(在此情况下,也是流动模块)内的流体(例如,液体)的至少一个特性的输出。例如,如图18中所示,温度模块70可包括温度传感器71,并且可选地,还包括加热和/或冷却元件72,如本领域已知并且在本文中进一步公开的。在其它示例性方面,设想了至少一个调节器模块64可被配置成实现流体流动路径内的流体的至少一个特性的调整。例如,阀模块74可被配置成在至少第一位置和第二位置之间移动以修改流体通过流体流动路径的流动。可选地,设想了每个阀模块74可包括伺服电动机和位置传感器(例如,编码器),其可通信耦合到如本文进一步公开的处理电路,以允许选择性监测和/或控制阀定位。
在示例性方面,设想了系统10可以包括至少一个分析装置1700。在这些方面,每个分析装置1700可以被定位成与流体流动路径12通过至少一个模块50可操作地连通。如在此上下文中所使用,术语“可操作地连通”可指允许由如本文所公开的分析装置1700分析所需的任何形式的连通。还设想了每个分析装置1700可被配置成产生指示化学反应发生时化学反应的至少一个特性的至少一个输出。在另外的方面,每个分析装置1700可包括:UV-Vis光谱仪、近红外(NIR)光谱仪、拉曼光谱仪、傅里叶变换红外(FT-IR)光谱仪、核磁共振(NMR)光谱仪或质谱仪(MS)。更一般地,设想了分析装置1700可以是适合在化学反应的至少一个步骤或一系列化学反应中使用的任何常规的过程分析技术(PAT)装置。还设想了可以沿着系统10的流动路径放置一个或多个分析装置,其中每个分析装置可向处理电路发送输出分析以用于监测或进一步优化所执行的化学反应的一个步骤或一系列化学反应。在示例性方面,多个模块50可包括具有至少第二出口84的至少一个分析模块80,所述第二出口定位成与如本文所公开的分析装置1700可操作地连通。可选地,在这些方面,设想了分析模块80可定位在多个流动模块中的至少一个其它流动模块的上游。然而,在其他方面,设想了分析模块80可定位在对应于反应结束或完成的位置。在一些示例性方面,设想了分析模块80可以通信耦合到分析装置1700。在这些方面,设想了分析模块80可充当如本文进一步公开的监测模块58。
在其它示例性方面,系统10可包括处理电路110。在这些方面,设想了处理电路110可以通信耦合到多个模块50中的至少一个模块(例如,至少一个监测模块58)和至少一个分析装置1700。还设想了处理电路110可以被配置成从所述至少一个模块(例如,监测模块58)接收至少一个输出。可选地,处理电路110可依序或同时从多个模块(例如,监测模块)接收多个输出。可选地,处理电路110可以使用至少一个输出调整至少一个模块50(例如,过程模块54和/或调节器模块64)的操作,以优化化学反应或化学反应的一部分。另外或替代地,还设想了处理电路110可以被配置成从至少一个分析装置1700接收至少一个输出。可选地,处理电路110可以依序或同时从多个分析装置接收多个输出。可选地,处理电路110可以使用至少一个输出调整至少一个模块50(例如,过程模块54和/或调节器模块64)的操作,以优化化学反应或化学反应的一部分。在示例性方面,处理电路可在发生反应时同时或依序从至少一个模块(例如,监测模块)和至少一个分析装置接收输出。
在另外的方面,设想了处理电路可响应于从监测模块58和/或分析装置1700接收的输出,以基于保存在处理电路内(即,在处理电路的存储器内)的预设条件或基于通过用户输入(即,通过定位成与处理电路通信的用户接口)做出的调整来调整特定的反应参数。
在一些方面,用户可基于来自如本文中公开的一个或多个监测模块和/或一个或多个分析装置的输出,通过改变处理电路中的一个或多个参数来手动触发模块中的任一个模块的变化。
在一些方面,所公开的处理电路(可选地,呈控制器的形式)可用于基于来自如本文中公开的一个或多个监测模块和/或一个或多个分析装置的输出自动地协调对系统的一个或多个模块的改变,其中改变基于预设触发器(例如预定阈值温度或产率参数),其可以可选地存储在处理电路的存储器中。例如,如果给定反应的温度超出预设阈值温度,那么处理电路可向相应的温度调节器发送指令/命令以降低用于该特定反应的该反应器的温度,直到温度下降到阈值温度值以下为止。
在图17中提供了系统10的示例性示意流程图。每个相邻框对应于相应的模块50;尽管相邻地示出,但应理解,这些模块不需要彼此直接接触。相邻框内的实心箭头表示如本文所公开的流体路径内的流体流动,而虚线箭头表示系统部件之间的连通。模块50a接收流体的入口进料,且下面的流动连接器将流体输送到相邻的分离器模块60。分离器模块60显示为与监测模块58热连通,并与反应器56和模块50b流体连通,所述反应器和模块中的每一个均接收不同的分离产物。监测模块58可以监测分离步骤期间的一个或多个条件。可选地,在一个实例中,监测模块58可为温度模块70,其可被配置成监测分离步骤期间的温度,且可选地被配置成提供额外热或冷却以维持如本文中所公开的所需或选择温度。模块50c表示将额外的流体输送到反应器56中的另一个入口进料源。反应器56内反应的产物被输送至模块50d,该模块与分析模块80流体连通,所述分析模块又与如本文所公开的分析装置1700可操作地连通。模块50d也与阀74流体连通,所述阀可选择性地调整以将流体向模块50e或模块50f引导。如本文进一步公开的,设想了所公开的模块中的至少一部分可以通信耦合到处理电路110,所述处理电路可用于向表面安装系统部件提供主动反馈和/或修改。
图19描绘了系统的表面安装部件可以通信耦合到如本文进一步公开的处理电路,例如计算装置1900(可选地,多个计算装置)的示例性配置。计算装置1900的非限制性实例包括台式计算机、笔记本电脑、中央服务器、大型计算机、平板电脑、智能手机等。在示例性方面,计算装置1900可以位于系统10附近。例如,在示例性方面,并且如图17中所示,设想了系统的至少一个计算装置1900可为控制模块1702,其可如本文所公开的选择性地表面安装或以其它方式定位在表面安装部件附近。在这些方面,设想了多个控制模块1702可选择性地定位在系统10内以形成如本文所公开的所需反馈回路。计算装置1900可以被配置成生成、接收、存储和/或传输与模块化化学反应系统相关的设备数据。例如,计算装置1900可从过程模块54、调节器模块64、监测模块58、阀74和/或分析装置1700中的一个或多个接收此设备数据。计算装置1900可将此设备数据提供到路线引擎140和/或到与路线引擎140相关联的计算装置。计算装置1900还可以被配置成从路线引擎140接收一个或多个合成路线,并且使得在模块化化学反应系统上执行一个或多个合成路线。
如图19中所示,设想了计算装置1900可包括与存储器1906通信的处理单元1904(例如,CPU)。在示例性方面,处理单元1904可以使用常规有线(例如,电缆、USB)或无线(WiFi、蓝牙)通信协议通信耦合到系统10的至少一个模块50。另外或替代地,设想了处理单元1904可以使用常规有线(例如,电缆、USB)或无线(WiFi、蓝牙)通信协议通信耦合到至少一个分析装置1700。设想了处理单元1904可以通信耦合到如本文进一步公开的至少一个监测模块58(例如,多个监测模块)。在示例性方面,处理单元1904可以通信耦合到至少一个过程模块54。另外或替代地,在其它示例性方面,处理单元1904可以通信耦合到至少一个调节器模块64,例如温度模块70或阀74。
可选地,计算装置1900可包括无线收发器1908(例如,WiFi或蓝牙无线电),其被配置成无线发送和接收信息。在示例性方面,设想了无线收发器1908可以通信耦合到远程计算装置1902,例如平板电脑、智能手机或定位在远离系统的位置的其他计算装置。在这些方面,远程计算装置1902可被配置成基于(可选地,通过WiFi、蜂窝网络或基于云的系统)从计算装置1900接收的输出,提供远程用户输入或监测正在进行的反应的进程。远程计算装置可包括处理单元1910。
图17还包括系统10的示例性示意通信图。如图所示,设想了系统的多个模块可以通信耦合到处理电路,此处显示为控制模块1702。在使用所公开的系统执行反应的至少一个步骤期间,设想了一个或多个监测模块58和一个或多个分析装置100可被配置成向如本文进一步公开的处理电路提供输出。在所描绘的实例中,监测模块58、反应器模块56、分离器60、分析模块80、阀模块74和分析装置1700全部通信耦合到控制模块1702,由此允许在反应发生时直接监测各种反应条件和特性。然而,在其它示例性配置中,少到只有一个模块可与处理电路通信。可选地,还设想了控制模块1702(单独或与其它处理电路或如本文公开的远程计算装置组合)可以被配置成选择性地调整至少一个模块(例如,过程模块(反应器56、分离器60)或调节器模块(阀74))的操作,以优化化学反应。可使用所公开的反馈回路优化的示例性特性和条件包括例如但不限于压力、温度、对生成的产物的识别、试剂消耗速率、对副产物的识别、产物产率、选择性和纯度中的一个或多个。
在示例性方面,多个模块中的至少一部分可与多个流动部件中的至少一部分协作以产生第一配置,所述第一配置形成用于执行第一化学反应的至少一个步骤的第一流体流动路径。在完成第一化学反应之后,所述多个模块和基板层内的流动部件可被配置成在最小转换周期内选择性重排到第二配置,以产生用于执行第二化学反应的至少一个步骤的第二流体流动路径。在这些方面,设想了模块和流动部件的第二配置可以包括至少一个模块,该模块不限定第一流体流动路径的一部分。还设想了限定第二流体流动路径的模块和流动部件可以包括限定第一流体流动路径的模块和流动部件的至少一部分。还设想了包括在第二流体流动路径中的模块的数量可以小于、等于或大于包括在第一流体流动路径中的模块的数量。可选地,在示例性方面,多个模块和多个流动连接器相对于基板(和歧管层)的位置在第一流体流动路径和第二流体流动路径中可保持不变。在这些方面,设想了可以通过改变阀内的流动位置(但不调整阀模块相对于基板的安装位置)来修改第一流体流动路径,从而调整该流动路径。可选地,这种修改可允许绕过第一流体路径的部分(例如,过程模块)和/或将流体引导到先前不与第一流体流动路径流体连通的其它模块(例如,过程模块)。尽管不是必需的,但是在一些可选的方面,设想了可以移除、添加或更换模块以选择性地调整流体流动路径。因此,在一些示例性方面,可通过调整阀模块内的流体流动并移除、添加或更换系统的至少一个模块来产生经修改的第二流体流动路径。在添加或移除本文中所公开的模块的情况下,设想了可以调整流动连接器的位置和/或数量和/或类型以适应流体流动路径的变化。
在另外的示例性方面,设想了最小转换周期可允许在有限的时间窗中顺序执行多种化学反应,所述时间窗远远小于常规反应结构的可能时间窗。可选地,最小转换周期可以在约30分钟到约4小时的范围内,或更通常约1小时到约2小时,这取决于反应的复杂性。
可选地,所公开的系统10可包括多个调节器模块64。在示例性方面,设想了多个模块和多个流动部件的第一配置和第二配置可以包括调节器模块的相应的第一布置和第二布置,其中调节器模块的第一布置和第二布置关于模块定位和模块类型中的至少一者彼此不同。可选地,在一些示例性方面,设想了调节器模块的每个布置可以包括以下中的至少五个:止回阀、T形过滤器、流量调节器、压力感测模块、泄压阀、压力调节器、管适配器、阀、泵、控制阀模块、温度监测模块、温度控制模块、加热器或冷却器。可选地,在这些方面,第二配置可包括第一配置中不存在的至少一个模块类型。还设想了第二配置可包括比第一配置中包括的更多或更少的调节器模块。
在另外的示例性方面,设想了所公开的系统可以允许同时执行多个反应步骤或单独的反应步骤。例如,在一个示例性应用中,可将来自过程模块(例如,分离步骤之后的分离器模块)的分离的产物或副产物输送到不同的模块(和分离的下游流动路径)以用于如本文所公开的进一步分析和/或处理(反应、分离)。
可选地,所公开的系统10可以包括多个分析装置。在示例性方面,设想了多个分析装置的第一配置可以与第一流体流动路径可操作地连通,并且多个模块和基板层内的流动部件可以被配置成用于选择性重排以在多个分析装置的第二配置与第二流体流动路径之间建立可操作地连通。在这些方面,设想了多个分析装置的第一配置和第二配置可以包括以下中的至少两个:UV-Vis光谱仪、近红外(NIR)光谱仪、拉曼光谱仪、傅里叶变换红外(FT-IR)光谱仪、核磁共振(NMR)光谱仪或质谱仪(MS)。可选地,在这些方面,分析装置的第二配置可以包括第一配置中不存在的至少一个分析装置类型。还设想了第二配置可以包括比第一配置中包括的更多或更少的分析装置。
使用所公开的系统的示例性方法可包括将至少一种试剂(例如,液体试剂)引入到系统的流体流动路径中,然后使用所述至少一种试剂(例如,液体试剂)进行化学反应。
可选地,在一些方面中,至少一个过程模块包括多个过程模块,且化学反应可为包括多个连续步骤的多步化学合成。在这些方面,设想了多个连续步骤中的每个步骤可以对应于相应的过程模块内的试剂流。
在另外的方面,所述方法可包括修改流体流动路径以产生不同于如本文公开的第一流体流动路径的第二流体流动路径。如本文进一步描述的,第二流体流动路径可以在以下方面不同于第一流体流动路径:流动模块的数目、监测模块的数目、监测模块的位置、过程模块的数目、过程模块的类型、过程模块的顺序、过程模块的位置、调节器模块的数目、调节器模块的类型、调节器模块的位置、分析模块的数目、分析模块的位置、流动方向以及它们的组合。此外,所述方法可包括使用包括额外过程模块的经修改的流体流动路径运行第二化学反应。
可选地,对第一流体流动路径的修改可包括调整通过多个模块中的至少一个阀模块的液体的流动,而不需要调整任何模块相对于基板层(或歧管层)的位置。可选地,设想了可以使用阀来调整化学反应的流体(例如,液体)流动路径,而不需要调节表面安装部件的位置和/或如本文所公开的流动连接器的位置和取向。另外或替代地,在其它方面,对第一流体流动路径的修改可包括将附加的过程模块安装到基板的外表面。在这些方面,设想了附加的过程模块可为如本文中所公开的反应器或分离器。所述方法还可包括建立附加的过程模块与流体流动路径之间的流体连通。
在另外的方面,所述方法可包括使用如本文所公开的处理电路从至少一个分析装置接收至少一个输出。在这些方面,所述方法还可包括使用处理电路调整至少一个模块,例如过程模块或调节器模块的操作,以优化化学反应。另外或替代地,所述方法可包括使用处理电路从如本文中所公开的监测模块(例如,配备有传感器的过程模块或调节器模块)接收至少一个输出。所述方法还可包括使用处理电路基于所接收的至少一个输出来调整至少一个模块的操作以优化化学反应。可选地,对化学反应的监测和优化可在系统中对应于化学反应的中间步骤的位置处发生。还设想了在反应发生时可进行化学反应的监测和优化。
如本文进一步公开的,设想了根据用户希望监测的特定反应步骤/位置和条件/特性,监测模块和分析模块可以选择性地定位在沿着反应流动路径的各个位置。
在另外的示例性方面,设想了所公开的系统可以充当用于运行和修改化学反应的完全集成平台。可选地,系统的每个模块可以通信耦合到计算装置1900,其可以用于基于来自分析工具(包括由处理单元1904执行的软件)的反馈,监测并调整系统内的每个模块。在示例性方面,且如本文中进一步公开的,系统10可包括用于输入用于配置化学反应的指令的用户界面,且处理单元可被配置成确定实现所选配置的适当修改,且接着根据需要实现对多个模块的自动修改以实现所选配置。
在使用中,设想了所公开的系统可以以先前不可实现的连续方式执行多步骤化学合成反应。还设想了所公开的系统可以允许使用其它表面安装反应器系统执行不可实现的模块化液体流反应。还进一步设想了所公开的系统可以以先前不可实现的方式提供中间处理步骤(在反应中的中间步骤处);先前此类处理仅可在反应序列结束时执行。另外,设想了与先前的化学反应相比,所公开的系统可以使用较小体积的试剂、较短的驻留时间和/或较短的加热时间提供反应。
在另一方面,本文还公开了使用上述逆合成方法来发现潜在的新合成路线的集成方法以及能够快速和廉价地筛选并优化此类化学反应的系统。示例性设备包括多个反应容器、分配子系统、至少一个反应器模块、分析子系统、自动化子系统和控制电路。分配子系统将试剂递送到多个反应容器以用于具有变化的反应条件的多种反应混合物。至少一个反应器模块在多个反应容器内驱动多个反应。分析子系统分析包含在多个反应容器中的组合物。自动化子系统基于实验设计参数将多个反应容器从邻近分配子系统的位置选择性地移动到至少一个反应器模块。并且,控制电路基于该分析识别目标最终产物的最优反应条件。该设备的完整公开内容可参见2018年6月29日提交的名称为“Apparatus for reactionscreening and optimization,and methods thereof”的PCT/US2018/040421号专利申请,其内容以引用方式全文并入本文。
在各种具体实施例中,一种设备包括多个反应容器、分配子系统、至少一个反应器模块、自动化子系统和控制电路。反应容器可以被设置或包含在基板内。分配子系统将试剂递送到多个反应容器以用于具有变化的反应条件的多种反应混合物。至少一个反应器模块根据变化的反应条件在多个反应容器内驱动多个反应。例如,至少一个反应器模块包括能量发射器,所述能量发射器向多个反应容器提供能量输出并由此驱动多个反应。变化的反应条件可包括温度、时间、试剂的浓度、试剂以及其它变化。分析子系统在反应已经开始之后并且可选地在一组反应时间期间的任何时间分析多个反应容器中包含的反应混合物(例如,反应物、副反应产物、最终产物和副产物)的组成。分析可以每秒一个反应(或更多)和/或高达每秒一个反应(或更多)的量级的速度执行。自动化子系统基于实验设计参数(例如,限定变化的反应条件的参数)将多个反应容器从邻近分配子系统的位置选择性地移动到至少一个反应器模块。控制电路将实验设计参数提供到分配子系统和自动化子系统,以用于在阈值时间段内对多个反应进行反馈控制,并且基于对从分析子系统接收的组合物的分析识别目标最终产物的最优反应条件。
在更具体的实施例中,由控制电路提供的反馈控制基于比较之前的反应结果与存储在分析子系统中的最佳反应产物产率调整多个附加反应的变化的反应条件。例如,控制电路将经调整的变化的反应条件作为修改的实验设计参数提供至分配子系统和自动化子系统,这可以是瞬时或接近瞬时的。
多种反应混合物可暴露于相同或不同的附件反应条件(例如,相同温度、相同的暴露时间,或温度和/或暴露时间的各种组合)。作为具体实例,变化的反应条件可包括在不同的时间段内暴露于不同温度。至少一个反应器模块可包括多个反应器模块或具有不同区的一个反应模块,所述不同区并行地且在多个不同温度下驱动多个反应,并且每个反应器模块包括热能发射器,所述热能发射器向多个反应混合物中的至少一部分提供热能。在此示例性实施例中,反应容器可彼此独立地选择,并且自动化子系统选择性地将多个反应容器中的第一个容器移动到与至少一个反应器模块相关联的第一位置,选择性地将多个反应容器中的第二个容器移动到与至少一个反应器模块相关联的第二位置,并且在完成相应反应后将多个反应容器中的第一容器和第二容器中的每一个移动到邻近分析子系统的位置。在其它实施例中,反应容器或子集可以位于基板上,并且基板(作为整体)被移动到反应器模块并暴露于某温度。
自动化子系统可将反应容器、反应混合物、基板或其它部件(例如,盖)移动到与设备相关联的各种位置。反应混合物可从邻近分配子系统的位置移动到至少一个反应器模块,以用于驱动反应。自动化子系统可另外将反应混合物(全部或选择的)移回到分配子系统以添加额外试剂和/或移回到分析子系统。例如,自动化子系统将反应混合物从至少一个反应器模块移动到邻近分析子系统的位置,并且分析子系统向大致平行于反应容器的顶部部分的多个反应容器中的每一个发射分析束。在更具体的实施例中,控制电路和自动化子系统在多个反应在反应容器内被驱动之前密封多个反应容器中的每一个,并且在反应中启封多个反应容器中的每一个以引入其它试剂来对反应混合物采样,或在分析反应混合物(例如,反应物、副反应产物、最终产物和副产物)的组成之前启封。
此外,该设备可以可选地包括用于将反应容器和盖分配到自动化子系统的一个或多个分配室。
分配系统可包括喷墨打印机、液体分配器及其组合。例如,喷墨打印机可以具有用于将试剂分散到反应容器的打印机头,诸如8通道打印机头、9通道打印机头或96通道打印机头。
分析子系统可包括液相色谱质谱仪(LC-MS)、实时(DART)-质谱仪(MS)、光谱成像器及其组合。例如,DART-MS的部件依序提供指向每种反应混合物的气体束,并将每种反应混合物的采样运送到DART-MS的另一部件。所述气体束可以例如以相对于法线成0-45度的角度朝反应容器的顶部提供。所述气体束可以产生或者引起可检测的音频,所述音频可以用于验证正在发生的分析。在一些具体实施例中,所述设备还包括传感器电路,所述传感器电路响应于每种反应混合物的分析束采样而向控制电路提供可检测的音频信号,且控制电路将检测到的音频信号与阈值音频进行比较且由此验证分析是否正在发生。在其它实施例中,所述设备可包括用于捕获(例如,每个)反应容器的视觉图像并且根据视觉图像验证分析是否正在进行的成像电路。
本公开的其它相关和具体实施例涉及一种设备,所述设备包括可独立选择且可分离的多个反应容器、至少一个反应器模块、分析子系统、自动化子系统、控制电路。根据针对具有变化的反应条件的多种反应混合物的试验设计参数,多个反应容器包括其中包含的试剂。至少一个反应器模块根据变化的反应条件在多个反应容器内驱动多个反应,所述变化的条件反应包括在不同时间段暴露于不同温度。分析子系统在反应已经开始之后并且在一组反应时间期间的任何时间,通过以每秒一个反应的量级的速度(例如,高达每秒一个反应或更多反应的速度)选择性地向多种反应混合物提供分析束并由此分析结果,来分析包含在多个反应容器内的反应混合物(例如,反应物、副反应产物、最终产物和副产物)的组成。自动化子系统密封多个反应容器,基于实验设计参数在不同的时间段将多个反应容器选择性地移动到至少一个反应器模块并且从至少一个反应器模块移走,并且启封多个反应容器并在反应后将反应混合物选择性地移动到分析子系统附近。控制电路将实验设计参数提供到自动化子系统,以用于控制多个反应容器内的反应,并且基于对从分析子系统接收的组合物的分析识别目标最终产物的最佳反应条件。
在具体方面,自动化电路包括可移动臂和分配室。分配室容纳多个反应容器的多个盖。可移动臂和分配室分配多个反应容器的多个盖,并使用分布式盖密封多个反应容器。如本文进一步描述的,可移动臂可以包括用于选择反应容器的头部组件以及可以用来移动头部组件的一组互连的连杆和动力接头。
在具体实施例中,上述设备还可包括分配子系统,所述分配子系统将试剂递送到多个反应容器以用于具有变化的反应条件的多种反应混合物。自动化子系统可将多个反应容器从邻近分配子系统的位置选择性地移动到至少一个反应器模块。并且,控制电路将实验设计参数提供到分配子系统,实验设计参数包括对试剂标识、对于多个反应容器中的每一个的试剂的浓度以及其它变化的反应条件。
根据本公开的具体实施例涉及一种使用上述设备的方法。所述方法可包括通过控制电路将多个实验设计参数提供到分配子系统和自动化子系统,以用于控制多个反应容器内的多个反应。所述方法还包括通过分配子系统并且根据实验设计参数将不同量的试剂递送到多个反应容器中的相应反应容器。子系统可将多个反应容器从邻近分配子系统的位置选择性地移动到至少一个反应器模块,其中多个反应被驱动。例如,根据变化的反应条件,在多个反应容器内驱动多个反应,所述变化的反应条件包括暴露于不同温度和不同时间段,如由实验设计参数和至少一个反应器模块所定义的。所述方法还包括以(例如,高达或多于)每秒一个反应的量级的速度分析包含在多个反应容器内的组合物,并基于所述分析识别目标最终产物的最佳反应条件。
如上所述,在一些方面,所述方法还包括响应于多个反应被驱动完成,将多个反应容器选择性地移动到邻近分析子系统的位置。所述分析子系统提供可移动地指向所述多个反应容器中的每一个反应容器的气体束。气体束可以以大致平行于多个反应容器的顶部部分的角度引导,并且气体束将反应混合物的采样运送到分析子系统,以用于基于由其生成的离子分析包含在反应容器中的组合物。
在各种相关方面,所述方法包括根据实验设计参数通过向多个反应容器中的不同反应容器提供具有不同试剂浓度的多种反应混合物来递送不同量的试剂。可在整个实验中相同时间或在不同时间提供试剂。
识别目标最终产物的最佳反应条件还可包括识别选自由以下各项组成的组的优化实验设计参数:试剂、试剂浓度、温度、时间、化学计量以及它们的组合。最佳反应条件可通过提供反馈得到进一步优化。例如,所述方法还可包括基于对包含在反应容器内的组合物的分析,对于为达到目标最终产物的修改的最佳反应条件设计的多个附加反应提供经调整的变化的反应条件,并将经调整的变化的反应条件作为修改的试验设计参数提供到分配子系统和自动化子系统。使用修改的实验设计参数,所述设备可以运行额外测试并且根据由此进行的组合物的分析进一步优化反应条件。
图20示出了根据各种实施例执行反应筛选和优化的设备的实例。设备2000包括多个反应容器2012、控制电路2002、分配子系统2004、自动化子系统2006、至少一个反应器模块2008和分析子系统2010。设备2000可用于目标最终产物的合成设计。更具体地,具有变化的反应条件的多个合成路线可以被探索并用于筛选或优化达到目标最终产品的反应条件。
不同实验设计参数2001可输入到设备2000的控制电路2002,并且用于探索具有用于达到目标最终产物的变化的反应条件的多个合成路线。实验设计参数2001可以包括由路线引擎140生成的一个或多个合成路线。实验设计参数2001可以包括设备数据,所述设备数据提供至路线引擎140以便在生成合成路线时予以考虑。也可称为DOE信息的实验设计参数可包括具有值的不同组合的多组反应条件。示例性的变化的反应条件可包括试剂、试剂的浓度或化学计量、添加试剂时的时间和温度以及其他条件,这些值可包括实验条件的不同动作或值(例如50度和2000度)。根据本公开的一些DOE信息可消除一次性优化的一个反应条件的使用。例如,用于四个实验设计参数(n<n>)的DOE信息可以从256个可能性降低到三十二个实验或反应混合物。如可了解,DOE信息可被设计和存储为控制电路2002的存储器电路中的数据。
控制电路2002接收实验设计参数2001,并将至少部分实验设计参数(例如,若干组反应条件)提供至设备2000的其它部件,例如提供至分配子系统2004和自动化子系统2006,并且基于变化的反应条件来控制反应。例如,实验设计参数2001可限定变化的反应条件,且可包括化合物和溶剂、化学计量范围、时间和温度条件以及归一化体积的列表。DOE信息可包括或提供为包括待运行实验的表。在具体实施例中,可由控制电路2002生成文件并发送到分配子系统2004以用于分散试剂。例如,控制电路2002可以将试剂以特定浓度的组合提供至分配子系统2004,并且可将对暴露反应混合物的时间(或将每种反应混合物暴露于用于驱动反应的特定温度或其他类型的能量的特定时间)的识别提供到自动化子系统2006。可以向自动化子系统2006提供关于至少一个反应器模块2008的信息,例如温度,所述一个反应器模块2008(或其区)被配置成将反应混合物暴露于提供每个反应器容器的哪个反应器模块或区,和/或持续多长时间。
多个反应容器2012被构造成包含参与被设计成生成目标最终产物的反应的试剂。可使用多种类型的反应容器2012,诸如单个小瓶或孔。在一些实施例中,反应容器2012可以放置在基板2014中或形成该基板的一部分,所述基板诸如在其上形成有孔的板和/或具有小瓶可放置在其中的尺寸的空间(例如洞)的板。基板2014可采取各种形式。例如,基板2014可包括平坦且结合有孔洞的带、用以收集和混合试剂的吸收材料,例如聚四氟乙烯或不锈钢网格,或多个容器可形成为容纳混合物的孔。作为另一个实例,可以通过使用钯或其它反应性金属网格研究催化化学。根据各种实施例,反应容器2012可彼此独立地选择(例如,小瓶),并且可以针对不同的合成路线选择性地移动。在其它实施例中,反应容器2012的至少一个子集联接在一起(例如,板上的孔),并且对于合成路线一起移动。
分配子系统2004基于由实验设计参数2001限定的变化的条件,将试剂递送到多个反应容器2012以用于具有变化的反应条件的多种反应混合物。更具体地,多种反应混合物可包含不同量或浓度的一组试剂和/或不同试剂。示例性分配子系统2004包括喷墨打印机或液体分配器。如本文进一步示出和描述的,喷墨打印机基于喷墨打印而递送试剂。示例性喷墨打印机可以使用多通道打印头(例如,9通道、12通道、96通道)将皮升体积到微升体积分配至微升板。每个打印头可包含特定试剂。喷墨打印机可例如以每秒一次反应的速率打印反应混合物。另外,试剂可直接装载到设备2000中。例如,可以将装载在基质管中的预称重试剂输入到设备2000中。预称重试剂可在96个管托盘保持器中格式化,所述保持器标有条形码以用于试剂位置追踪,并且可选地用可直接安装到喷墨打印机的打印头上的内缝隙隔板盖进行密封。示例性分配器包括喷墨打印机和打印头。
然而,实施例不限于喷墨打印机,并且可包括多种不同的分配子系统。例如,分配子系统可以包括液体分配器,所述液体分配器可用于填充板和/或小瓶,所述板和/或小瓶递交到自动化子系统2006和/或手动分配器(例如,移液管)。
设备2000包括至少一个反应器模块2008,所述至少一个反应器模块具有能量发射器,例如热能工具或散热器,其向反应混合物提供能量输出(例如,热量)以用于驱动多个反应。示例性能量发射器包括加热器、烘箱、微波或光源等。每个反应器模块具有至少一个区,该至少一个区被配置成提供特定温度或以其它方式不同地驱动反应(例如,提供不同的光或微波)。例如,至少一个反应器模块2008根据变化的反应条件驱动多个反应容器2012内的多个反应。在多个实施例中,设备2000包括一个反应器模块,所述一个反应器模块具有一个区或另外被配置成提供单一温度。替代性地和/或另外,所述一个反应器模块可以具有多个区和/或所述设备可以包括多个反应器模块,每个反应器模块具有一个或多个区,并且用于提供多个不同的温度(例如,两个或更多个、六个、九十六个等)。在此类示例性实施例中,所述至少一个反应器模块2008可以通过将反应混合物暴露于不同温度以及可选地暴露不同时间段来驱动反应容器2012内的多个反应。可经由自动化子系统2006提供不同时间段,所述自动化子系统在不同时间段结束时从至少一个反应器模块2008移动一个或多个反应容器2012。不同区或不同反应器模块可用于并行地并且在多个不同温度(或其它类型的能量)下驱动多个反应。如本文进一步示出和描述的,反应器模块可以包含反应容器2012的至少一个子集,其通过自动化子系统2006提供给反应器模块。
自动化子系统2006可基于实验设计参数2001选择性地移动反应容器2012和/或反应容器2012内的反应混合物。更具体地,自动化子系统2006将反应容器2012从邻近分配子系统2004的位置移动到至少一个反应器模块2008以用于驱动反应。如本文进一步示出的,自动化子系统2006可以包括可移动目标(例如,机器人臂)和用于选择性地移动反应容器2012和/或反应混合物的其他可移动部件。在一些具体实施例中,此移动可包括不同反应混合物(例如,容器)到不同反应器模块或区的选择性移动和/或不同时间段的选择性移动。以此方式,通过分配子系统2004分散的反应混合物被移动到至少一个反应器模块2008以用于驱动其内的反应以及可选地持续不同时间段。自动化子系统2006可以将反应混合物进一步移动到邻近分析子系统2010的位置,以用于分析其中包含的组合物,尽管实施例并不限于此,并且所述移动可使用如本文进一步描述的其它机构进行。所述组合物可包括反应物、副反应产物、最终产物和副产物以及它们的各种组合。
作为特定实例,如在下文进一步描述的,对于可单独选择的反应容器和具有用于提供多个温度的多个反应器模块或区的设备,变化的反应条件可以包括暴露于不同的温度并持续不同时间段。自动化子系统2006将多个反应容器的第一子集选择性地移动到与至少一个反应器模块2008相关联的第一位置,以将容器的第一子集暴露于第一温度,并将反应容器的第二子集移动到至少一个反应器模块2008的第二位置,以将容器的第二子集暴露于不同于所述第一温度的第二温度。在完成相应反应时,或如由实验设计参数2001另外定义的,将第一子集和第二子集中的每个反应容器移动到邻近分析子系统2010的位置。此移动可通过自动化子系统2006和/或附加部件,例如,如本文进一步描述的传送带进行。
根据多个实施例,自动化子系统2006(基于控制电路2002的控制)可密封和/或启封反应容器2012内的反应混合物。例如,多个反应容器2012中的每一个可在多个反应在反应容器2012内被驱动之前由自动化子系统2006密封,并且在反应中间被启封以引入其它试剂以对反应混合物进行采样,或基于实验设计参数2001在分析组合物之前被启封。例如,自动化子系统2006可以包括可移动臂和分配室。分配室可以包含用于反应容器2012的多个盖。可移动臂连同分配室可以将盖分配到多个反应容器2012中的每一个并使用所述盖密封反应容器。可移动臂可以包括或者可以接近用于随后启封盖的工具,如本文进一步示出的。
在反应已经开始之后(且在由实验设计参数2001限定的一段反应时间期间内的任何时间),分析子系统2010分析多个反应容器2012中包含的组合物。可以例如对于特定目标或目标集合(例如产物产率、选择性、成本、纯度、m/z值和各种组合)分析组合物。举例来说,分析最终产物的产率、纯度和成本,并且生成经修改的反应条件以进一步优化一个或多个目标。该分析可以每秒一次反应的量级的速度(例如,高达每秒一次反应或更多和/或如先前所描述的范围)进行。示例性分析子系统包括例如经由通过UV板读取器的96孔板(其中板不包括小瓶或不包括透明的小瓶)的液相色谱法-质谱仪(LC-MS)、光谱图像(例如,UV-Vis小瓶、FT-IR单元等),和经由个体化小瓶的实时直接分析(DART)-质谱仪(MS),以及它们的各种组合。在各种具体实施例中,分析子系统2010包括DART-源(例如,DART-MS),该DART-源依序提供指向每个反应混合物表面的气体束,并将每种反应混合物的样品运送到DART-MS的MS中。在特定实施例中,分析束是电离源(例如,DART-MS的气体束),并且以与反应容器2012的顶部部分近似平行(例如,以相对于法线成角度)的方式朝多个反应容器中的每一个发射,但是实施例并不限于此。气体束可以朝向多个反应容器2012的顶部部分成角度地引导,并且气体束将反应混合物的采样运送到分析子系统2010的另一部件(例如,MS),该另一部件基于从其生成的离子来分析包含在反应容器中的组合物。该角度可以包括与延伸到顶的法线呈零度。以此方式,例如具有从5-10i和最多20ul(或小瓶的最大体积)的液体的反应容器2012打开,并且引导DART头部通过小瓶直接进入MS中。该气体束可以以与反应容器2012的法线呈0-45度之间的角度引导。
在一些实施例中,气体束的角度可生成可检测的音频信号。在此类示例性实施例中,设备2000可以可选地包括传感器电路,所述传感器电路响应于可检测的音频信号向控制电路2002输出信号。传感器电路可以提供信号作为响应,所述信号用于验证分析束正在(或没有)对每种反应混合物进行采样。例如,控制电路2002可以将检测到的音频信号与阈值音频信号(其指示采样)进行比较并由此验证分析是否正在发生。在其它实施例中,设备2000可以包括成像电路,所述成像电路用于捕获反应容器2012的视觉图像,并根据视觉图像验证分析是否正在发生。
在具体实施例中,针对目标,例如,目标最终产物的选择性和产率定义,可将最终产物或其他组合物与目标最终产物或目标组合物进行比较。分析子系统2010将组合物的分析提供至控制电路2002。控制电路2002基于对组合物的分析,(从变化的反应条件中)识别目标最终产物的最佳反应条件。更具体地,最佳反应条件包括用于达到目标最终产物的变化的反应条件中的一组反应条件,该组反应条件可包括试剂、试剂的浓度、温度、时间、化学计量以及它们的组合。如先前所描述,控制电路2002还可在阈值时间内提供多个反应的反馈控制。反馈控制可包括以下所述或通过以下所述提供:基于比较以前的反应结果与存储在分析子系统2010中的最佳反应产物产率,调整多个附加反应的变化的反应条件;并且将经调整的变化的反应条件作为修正的实验设计参数(例如,新的多组反应条件)提供至分配子系统2004和自动化子系统2006。在一些具体实施例中,阈值时间段可包括瞬时控制或接近瞬时控制。经调整的变化的条件可以针对多个附加反应,所述多个附加反应被设计为达到目标最终产物和/或其他目标组合物的修正的最佳反应条件产品(例如,优化一个或多个目标)。控制电路2002可将反馈控制(例如,经调整的变化的反应条件)作为修正的实验设计参数提供至分配子系统2004和自动化子系统2006。设备2000使用修正的实验设计参数运行额外测试,并且从由此对组合物的分析进一步优化反应条件。
反馈控制可使用机器学习提供经调整的变化的条件。例如,控制电路2002用数据训练分子特性,例如抑制酶、用作抗微生物剂、催化特定反应和预测分子是否具有相关特性的能力。随着时间推移,控制电路2002更新其训练以预测哪些反应条件和/或其值影响特定目标。控制电路2002随着时间推移而被更新,并使用此训练以针对一个或多个目标提供经调整的变化的反应条件并且进一步如上文所述优化反应条件。
作为特定实例,并且与上文提供的具体实例一致,多个反应容器2012包括个别和可分离的反应容器。自动化子系统2006将反应容器2012放置到邻近分配子系统2004的基板2014中。分配子系统2004根据实验设计参数2001将不同量的试剂分配到多个反应容器中的相应反应容器。具有反应混合物的多个反应容器2012通过所述自动化子系统2006,例如通过上述和进一步示出的盖密封。反应容器2012由自动化子系统2006从邻近分配子系统2004的基板2014选择性地移动至至少一个反应器模块2008。自动化子系统2006将特定容器移动到与不同温度相关的不同区或反应器模块。例如,将多个反应容器的第一子集移动到第一区和/或第一反应器模块,该第一区和/或该第一反应器模块通过将反应混合物暴露于第一温度(例如,50℃)而驱动反应容器的第一子集内的反应。将反应容器的第二子集移动到第二区和/或第二反应器模块,该第二区和/或该第二反应器模块将反应容器的第二子集暴露于第二温度(例如75℃)。将第三子集移动到第三区和/或第三反应器模块并暴露于第三温度。实施例不限于三个区、三个反应器模块和/或三个温度,并且可包括多于或少于三个,例如一个、两个、四个、五个、六个、二十个等区、反应器模块和/或温度。
另外,在各种实施例中,子集的相应反应混合物可暴露于相应温度不同时间段。例如,自动化子系统2006可以基于试验设计参数2001在不同时间从至少一个反应器模块2008选择性地移动(例如,从暴露于温度移除)反应容器。使用上述实例,在第一时间段(例如2分钟)到期之后,从第一区和/或第一反应器模块移除第一子集中的第一反应容器,并且在第二时间段(例如,2分钟二十秒)到期后,从第一区和/或第一反应器模块移除第一子集中的第二反应容器。尽管实施例并不限于此,但是多个反应容器可以响应于多个反应正被驱动完成而在同一时间或在不同时间段移动到邻近分析子系统2010的位置。例如,自动化子系统2006可以启封多个反应容器2012,并且选择性地将反应混合物移动到分析子系统2010附近。与目标最终产物相比,分析子系统2010接着可以分析组合物。在各种实施例中,可以通过打开反应容器2012的盖(例如,移除密封反应容器2012的盖)或刺穿反应容器2012的密封来启封反应容器2012。例如,反应容器2012可包括具有可刺破位置的密封件,所述可刺破位置可被刺穿以促进产物获取和分析。
此移动可以由自动化子系统2006进行。例如,为了与DART-MS相接,反应容器2012可以放置在基板2014(诸如96孔板)上。自动化子系统2006为反应容器2012加盖,将加盖的反应容器放入由DOE信息限定的至少一个反应器模块2008中,然后将它们从至少一个反应器模块2008中移除。自动化子系统2006打开反应容器2012的盖(或置于打开盖的位置),并依序地将打开盖的反应容器定位在DART入口的前方。例如,自动化子系统2006可以将打开盖的反应容器放置在传送机上,该传送机依序地将反应容器输送到DART入口的前方,如本文进一步示出的。
根据多个实施例,合成反应路线中的一个或多个可包括在不同时间添加试剂。在此类实施例中,一个或多个反应容器从至少一个反应器模块2008移动、启封或打开盖、移回到分配子系统2004以用于分配一个或多个另外的试剂,并且可选地再次盖上盖并移动回至少一个反应器模块2008中的一个以进一步驱动所述反应。自动化子系统2006将反应容器从至少一个反应器模块2008和/或分配子系统2004选择性地移动到DART-MS前方的位置。在另外的实施例中,反应容器返回到基板2014或附加基板(例如,孔板),然后用X-Y台移动基板以将小瓶定位在DART-MS的前方。
尽管上述实例描述了DART-MS的使用,但是实施例并不限于DART-MS,不限于包括不同温度和时间的变化的反应条件,和/或不限于可以单独移动的反应容器。例如,如上所述,可将反应混合物分配在个别反应容器中,加盖并发生反应。自动化子系统2006可以将开盖或者另外启封(例如刺穿)的反应容器放回到基板2014上或放回该基板,并且反应混合物可以直接用LC-MS采样。在其他实施例中,反应容器不是单独可选和/或可移动的小瓶。例如,试剂可以直接分配到具有孔(例如微升孔板)的基板2014中。基板2014(例如,板)可以是传统的实心板,或板与UV板读取器相容。在一些实施例中,设备2000在所有孔都暴露于相同温度和相同时间的筛选模式下运行。在筛选模式下,可测试输入试剂的变化以识别哪些化学物质起作用。分配子系统2004将试剂分配到孔板中。例如,将板输送到至少一个反应器模块2008进行处理(如需要),然后将板放置在LC-MS自动取样机上。在其他实施例中,将试剂分配到透明微量滴定板中。反应混合物在一组反应条件下进行反应并且被放置在板读取器上以进行快速UV/Vis评估。在其它具体实施例中,(个体)反应容器2012包括透明小瓶,在该透明小瓶中,试剂被分配,单独反应(优化),并且然后重新放置在透明板上进行UV/Vis分析,如上文所述。
图21为描绘了环境2100的框图,所述环境包括通过网络2104连接的服务器2102和客户端2106的非限制性实例。在一个方面,分析装置1700、控制模块1702、计算装置1900、远程计算装置1902和/或设备2000(及其任何子部件)可包括服务器2102和/或客户端2106中的一个或多个。在一个方面,可以在如本文中描述的计算装置上执行任何描述的方法的一些或所有步骤。服务器2102可以包括一个或多个计算机,所述一个或多个计算机被配置成存储路线引擎140、反应110、机器学习分类器、合成路线150等中的一个或多个。客户端2106可包括被配置成(例如,通过网络浏览器)操作用户界面500的一个或多个计算机,例如,膝上型计算机或台式计算机。多个客户端2106可通过网络2104(例如,互联网)连接至服务器2102。客户端2106的用户可以利用用户界面500连接到路线引擎140。
服务器2102和客户端2106可以是数字计算机,其在硬件架构方面通常包括处理器2108、存储器系统2110、输入/输出(I/O)接口2112以及网络接口2114。这些部件(2108、2110、2112和2114)通过本地接口2116通信耦合。本地接口2116可以是例如但不限于如本领域已知的一个或多个总线或其他有线或无线连接。本地接口2116可以具有用以实现通信的额外元件(其为了简单起见被省略),例如,控制器、缓冲器(缓存)、驱动器、中继器和接收器。此外,本地接口可以包括用以实现前述部件之间的适当通信的地址、控制和/或数据连接。
处理器2108可以是用于执行特别是存储在存储器系统2110中的软件的硬件装置。处理器2108可以是任何定制的或可商购获得的处理器、中央处理单元(CPU)、与服务器2102和客户端2106相关联的若干处理器中的辅助处理器、基于半导体的微处理器(呈微芯片或芯片组的形式),或通常用于执行软件指令的任何装置。当服务器2102或客户端2106正在操作时,处理器2108可以被配置成执行存储在存储器系统2110内的软件,以将数据传送到存储器系统2110和从该存储器系统传送数据,并通常按照软件控制服务器2102和客户端2106的操作。
I/O接口2112可用于从一个或多个设备或部件接收用户输入和/或将系统输出提供至一个或多个设备或部件。用户输入可通过例如键盘和/或鼠标提供。系统输出可通过显示器装置和打印机(未显示)提供。I/O接口2112可包括例如串行端口、并行端口、小型计算机系统接口(SCSI)、IR接口、RF接口和/或通用串行总线(USB)接口。
网络接口2114可用于在网络2104上从外部服务器2102或客户端2106发送和接收。网络接口2114可包括例如10BaseT以太网适配器、100BaseT以太网适配器、LAN PHY以太网适配器、令牌环适配器、无线网络适配器(例如,WiFi)或任何其它合适的网络接口装置。网络接口2114可包括用以在网络2104上实现适当通信的地址、控制和/或数据连接。
存储器系统2110可包括易失性存储器元件(例如,随机存取存储器(RAM,例如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如,ROM、硬盘驱动器、磁带、CDROM、DVDROM等)中的任一个或组合。此外,存储器系统2110可以包括电子、磁性、光学和/或其他类型的存储介质。注意,存储器系统2110可以具有分布式架构,其中各种部件彼此远程定位,但可以由处理器2108访问。
存储器系统2110中的软件可以包括一个或多个软件程序,所述一个或多个软件程序中的每一个包括用于实现逻辑功能的可执行指令的有序列表。在图21的实例中,服务器2102的存储器系统2110中的软件可以包括路线引擎140和合适的操作系统(O/S)2118。在图21的实例中,客户端2106的存储器系统2110中的软件可以包括用户界面500和合适的操作系统(O/S)2118。操作系统2118基本上控制其他计算机程序(例如,操作系统2118、用户界面500)的执行,并提供调度、输入-输出控制、文件和数据管理、存储器管理以及通信控制及相关服务。
为了说明的目的,应用程序和其他可执行程序组件(例如,操作系统2118)在本文中以离散的方框示出,尽管认识到此类程序和组件可在不同时间驻留在服务器2102和/或客户端2106的不同存储组件中。路线引擎140和/或用户界面500的实现可以存储在某种形式的计算机可读介质上或通过某种形式的计算机可读介质传输。所公开的任何方法均可由计算机可读介质上包含的计算机可读指令来执行。计算机可读介质可以是可由计算机访问的任何可用介质。通过实例并且不意味着限制,计算机可读介质可包括“计算机存储介质”和“通信介质”。“计算机存储介质”可以包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。示例性计算机存储介质可以包括RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备,或可用于存储所需信息并且可由计算机访问的任何其他介质。
虽然已描述了具体配置,但并不意图将范围限制到所陈述的特定配置,因为本文中的配置在所有方面都旨在为可能的配置而非限制性的。
除非另有明确说明,否则决非旨在将本文阐述的任何方法解释为要求其步骤以特定顺序执行。因此,在方法权利要求实际上没有列举其步骤所遵循的顺序,或者在权利要求或说明书中没有另外特别说明将步骤限于特定顺序的情况下,决非旨在在任何方面推断出顺序。这适用于任何可能的非明确的解释基础,包括:关于步骤安排或操作流程的逻辑问题;从语法组织或标点符号中得出的简单含义;说明书中描述的配置的数量或类型。
对于本领域技术人员将显而易见的是,在不脱离范围或精神的情况下,可以进行各种修改和变化。通过考虑本文描述的说明书和实践,其他配置对于本领域技术人员而言将显而易见。意图是说明书和所描述的配置仅被视为是示例性的,真正的范围和精神由以下权利要求指出。

Claims (20)

1.一种用于识别用于产生目标化合物的一个或多个现有或新颖化学合成路线的计算方法,所述计算方法包括:
确定多个已知化学反应和/或多个新颖化学反应,其中多个新颖反应从广义的已知化学转化推断得出;
基于经训练的分类器,从所述多个新颖化学反应确定多个预测化学反应,其中,在从作为给定化学转化的实例的已知成功的多个化学反应和已知不成功的多个化学反应得到的数据上训练所述经训练的分类器;
基于所述多个预测化学反应和所述多个已知化学反应生成多个化学反应,其中所述多个化学反应中的每个化学转变表示一种化合物到另一种化合物的转化;
确定至少一种目标化合物;
确定与所述至少一种目标化合物相关联的多个化学反应路线,其中每个化学反应路线包括产生所述目标化合物的所述多个化学反应中的一个或多个化学反应;以及
从为产生所述目标化合物识别出的所述多个化学反应路线中确定一个或多个最佳化学反应路线,其中所述一个或多个最佳化学反应路线中的至少一个包括至少一个已知反应转化和至少一个预测反应转化。
2.根据权利要求1所述的方法,还包括在训练数据集上训练分类器,其中所述训练数据集包括所述一个或多个化学反应的化学反应数据库、估计产率或预测产率中的一者或多者。
3.根据权利要求2所述的方法,其中在训练数据集上训练分类器包括:
接收包括基于一个或多个化学转化的一个或多个化学反应的数据集,其中所述一个或多个化学反应中的每一个包括至少一种反应物,其中每种反应物由一个或多个原子组成;
对于每种反应物,基于邻近原子、键级和/或存在的氢原子的数目将所述一个或多个原子分类成某类别;
对于每种反应物,基于类别直方图确定向量;
确定由a)与特定转化相关联的反应的向量和b)与所述特定转化相关联但从不同反应类型产生产物的反应的向量组成的训练数据集;
将分类器暴露于所述训练数据集的一部分以训练所述分类器;以及
将所述经训练的分类器暴露于所述训练数据集的另一部分以测试所述经训练的分类器。
4.根据权利要求3所述的方法,其中将所述经训练的分类器暴露于所述训练数据集的另一部分以测试所述经训练的分类器包括基于一个或多个度量评估所述经训练的分类器的性能。
5.根据权利要求4所述的方法,其中所述一个或多个度量包括准确度、正精度、负精度、正召回或负召回中的一者或多者。
6.根据权利要求1所述的方法,还包括生成树数据结构,其中所述目标化合物是所述树数据结构的根节点。
7.根据权利要求6所述的方法,还包括向所述树数据结构添加多个分支,其中,所述多个分支中的每个分支包括所述多个合成路线中的一个合成路线。
8.根据权利要求1所述的方法,其中确定与所述目标化合物相关联的多个合成路线是基于一个或多个参数的。
9.根据权利要求8所述的方法,其中所述一个或多个参数包括可用原料、可用化学物质或可用设备中的一者或多者。
10.根据权利要求1所述的方法,其中从所述多个合成路线中确定一个或多个最佳合成路线是基于一个或多个参数的。
11.根据权利要求10所述的方法,其中所述一个或多个参数包括可用原料、可用化学物质、可用设备、产率、财务成本、时间、反应条件或反应成功的可能性中的一者或多者。
12.根据权利要求1所述的方法,其中从所述多个合成路线中确定一个或多个最佳合成路线包括:
在至多预定义数目的步骤中确定能够达到目标的所有化合物;以及
在不考虑转变叠缩的情况下确定到所述目标化合物的最小成本合成路线。
13.根据权利要求1所述的方法,其中确定最小成本路线包括评估成本函数。
14.根据权利要求13所述的方法,其中所述成本函数包括:
Figure FDA0002711598810000021
其中,
CR是由反应R产生的化合物C
I成本(R)是实施反应R的固定成本
CRi是由某反应Ri产生的R的反应物
f成本是原料f的固定成本
R产率是反应R的产率,0<R产率≤1
15.一种方法,包括:
基于多个已知化学反应的一部分训练一个或多个机器学习分类器;
基于所述多个已知化学反应确定产生目标化合物的一个或多个已知化学反应;
基于化学反应转化确定产生所述目标化合物的一个或多个预测化学反应,其中所述一个或多个预测化学反应被所述一个或多个机器学习分类器预测为成功;
以逆合成方式确定多个合成路线,其中每个合成路线产生所述目标化合物,其中至少一个合成路线包括所述一个或多个已知化学反应中的至少一个和所述一个或多个预测化学反应中的至少一个;以及
基于反应的预定数量和成本函数,从所述多个合成路线中确定最佳合成路线。
16.根据权利要求15所述的方法,其中所述多个已知化学反应从所述一个或多个化学反应的化学反应数据库、估计产率或预测产率中的一者或多者得到。
17.根据权利要求15所述的方法,其中基于多个已知化学反应的一部分训练一个或多个机器学习分类器包括:
接收包括基于一个或多个化学转化的一个或多个化学反应的数据集,其中所述一个或多个化学反应中的每一个包括至少一种反应物,其中每种反应物由一个或多个原子组成;
对于每种反应物,基于邻近原子、键级和/或存在的氢原子的数目将所述一个或多个原子分类成某类别;
对于每种反应物,基于类别直方图确定向量;
确定由a)与特定转化相关联的反应的向量和b)与所述特定转化相关联但从不同反应类型产生产物的反应的向量组成的训练数据集;
将分类器暴露于所述训练数据集的一部分以训练所述分类器;以及
将所述经训练的分类器暴露于所述训练数据集的另一部分以测试所述经训练的分类器。
18.根据权利要求17所述的方法,其中将所述经训练的分类器暴露于所述训练数据集的另一部分以测试所述经训练的分类器包括基于一个或多个度量评估所述经训练的分类器的性能。
19.根据权利要求18所述的方法,其中所述一个或多个度量包括准确度、正精度、负精度、正召回或负召回中的一者或多者。
20.一种系统,包括:
计算装置,所述计算装置被配置成,
基于多个已知化学反应的一部分训练一个或多个机器学习分类器;
基于所述多个已知化学反应确定产生目标化合物的一个或多个已知化学反应;
基于化学反应转化确定产生所述目标化合物的一个或多个预测化学反应,其中所述一个或多个预测化学反应被所述一个或多个机器学习分类器预测为成功;
以逆合成方式确定多个合成路线,其中每个合成路线产生所述目标化合物,其中至少一个合成路线包括所述一个或多个已知化学反应中的至少一个和所述一个或多个预测化学反应中的至少一个;以及
基于反应的预定数量和成本函数,从所述多个合成路线中确定最佳合成路线;和
与所述计算装置通信的化学反应系统,所述化学反应系统被配置成,
接收所述最佳合成路线,以及
基于所述最佳合成路线发起一个或多个化学反应。
CN201980024189.9A 2018-01-30 2019-01-30 化学合成路线和方法的计算生成 Pending CN112272764A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862624047P 2018-01-30 2018-01-30
US62/624,047 2018-01-30
US201862640282P 2018-03-08 2018-03-08
US62/640,282 2018-03-08
PCT/US2019/015868 WO2019156872A1 (en) 2018-01-30 2019-01-30 Computational generation of chemical synthesis routes and methods

Publications (1)

Publication Number Publication Date
CN112272764A true CN112272764A (zh) 2021-01-26

Family

ID=67548551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980024189.9A Pending CN112272764A (zh) 2018-01-30 2019-01-30 化学合成路线和方法的计算生成

Country Status (6)

Country Link
US (1) US11961595B2 (zh)
EP (1) EP3746772A4 (zh)
JP (2) JP7357183B2 (zh)
CN (1) CN112272764A (zh)
AU (1) AU2019217331A1 (zh)
WO (1) WO2019156872A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113517033A (zh) * 2021-03-23 2021-10-19 河南大学 小样本环境下基于XGBoost的化学反应产率智能预测与分析方法
CN114613446A (zh) * 2022-03-11 2022-06-10 冰洲石生物科技(上海)有限公司 交互式/化学合成路线设计方法、系统、介质及电子设备
CN115206450A (zh) * 2022-09-15 2022-10-18 药融云数字科技(成都)有限公司 一种合成路线推荐方法及终端

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11495331B2 (en) * 2017-11-27 2022-11-08 Takeda Pharmaceutical Company Limited Document creation assistance server and document creation assistance method
WO2020236314A1 (en) * 2019-05-21 2020-11-26 The Regents Of The University Of Michigan Property modulation with chemical transformations
EP4042433A1 (en) * 2019-10-01 2022-08-17 Molecule One Sp. z o.o. Systems and method for designing organic synthesis pathways for desired organic molecules
US20210280276A1 (en) * 2020-03-06 2021-09-09 Accenture Global Solutions Limited Using machine learning for generating chemical product formulations
US11610652B2 (en) * 2020-05-06 2023-03-21 Toyota Research Institute, Inc. Autonomous inorganic material synthesis machine
JP2023085836A (ja) * 2021-12-09 2023-06-21 株式会社日立製作所 化学プラント管理装置、化学プラント管理システム及び化学プラント管理方法
WO2023133678A1 (zh) * 2022-01-11 2023-07-20 上海药明康德新药开发有限公司 一种预测化学反应的方法
JP2023151364A (ja) * 2022-03-31 2023-10-16 Eneos株式会社 情報処理装置、情報処理方法、プログラム及び非一時的コンピュータ可読媒体
JP7302075B1 (ja) * 2022-07-06 2023-07-03 日本曹達株式会社 反応条件を推定する推定モデルの生成方法/生成装置、反応条件の提供方法/提供装置、並びにプログラム
CN115312135B (zh) * 2022-07-21 2023-10-20 苏州沃时数字科技有限公司 一种化学反应条件的预测方法、系统、装置及存储介质
US20240112760A1 (en) * 2022-09-30 2024-04-04 Microsoft Technology Licensing, Llc Chemical synthesis recipe extraction for life cycle inventory

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030087334A1 (en) * 2001-04-02 2003-05-08 Libraria, Inc. Method of flexibly generating diverse reaction chemistries
US6571226B1 (en) * 1999-03-12 2003-05-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
US20030154003A1 (en) * 2002-01-23 2003-08-14 Eker Steven Mark Modeling reaction pathways
US20030220716A1 (en) * 1999-03-12 2003-11-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
CN101261497A (zh) * 2008-03-17 2008-09-10 华东理工大学 一种工业装置粗对苯二甲酸加氢精制反应过程优化运行方法
CN101329698A (zh) * 2008-07-31 2008-12-24 四川大学 基于药效团模型的全新药物分子构建方法
EP2030136A1 (en) * 2006-06-19 2009-03-04 Cresset Biomolecular Discovery Limited Automated iterative drug discovery and synthesis
CN101789047A (zh) * 2010-02-05 2010-07-28 四川大学 基于逆向合成的有机小分子化合物可合成性评价方法
US20110124001A1 (en) * 2000-05-04 2011-05-26 Siemens Healthcare Diagnostics Products Gmbh Compositions For Use In Detection Of Multiple Analytes
US20120076692A1 (en) * 2010-09-23 2012-03-29 Siemens Medical Solutions Usa, Inc. Modular Component Synthesis Unit
CN102633880A (zh) * 2003-05-02 2012-08-15 赞科股份有限公司 优化的Fc变体及其产生方法
EP2502173A2 (en) * 2009-11-20 2012-09-26 University of Dundee Design of molecules
CN106156405A (zh) * 2016-06-24 2016-11-23 上海网化化工科技有限公司 基于化学反应数据库的有机合成路线设计方法
CN106198980A (zh) * 2010-08-13 2016-12-07 私募蛋白质体公司 胰腺癌生物标记及其用途
US20170116369A1 (en) * 2015-05-05 2017-04-27 The Penn State Research Foundation Method for designing overall stoichiometric conversions and intervening metabolic reactions
CN107109701A (zh) * 2014-09-16 2017-08-29 斯坦福国际研究院 通过光纤阵列扫描技术发现亲和试剂和催化剂

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003044219A1 (en) * 2001-11-20 2003-05-30 Libraria, Inc. Method of flexibly generating diverse reaction chemistries
US8401797B2 (en) * 2006-09-28 2013-03-19 Los Alamos National Security, Llc Method for predicting enzyme-catalyzed reactions

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6571226B1 (en) * 1999-03-12 2003-05-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
US20030220716A1 (en) * 1999-03-12 2003-11-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
US20110124001A1 (en) * 2000-05-04 2011-05-26 Siemens Healthcare Diagnostics Products Gmbh Compositions For Use In Detection Of Multiple Analytes
US20030087334A1 (en) * 2001-04-02 2003-05-08 Libraria, Inc. Method of flexibly generating diverse reaction chemistries
US20030154003A1 (en) * 2002-01-23 2003-08-14 Eker Steven Mark Modeling reaction pathways
CN102633880A (zh) * 2003-05-02 2012-08-15 赞科股份有限公司 优化的Fc变体及其产生方法
EP2030136A1 (en) * 2006-06-19 2009-03-04 Cresset Biomolecular Discovery Limited Automated iterative drug discovery and synthesis
CN101261497A (zh) * 2008-03-17 2008-09-10 华东理工大学 一种工业装置粗对苯二甲酸加氢精制反应过程优化运行方法
CN101329698A (zh) * 2008-07-31 2008-12-24 四川大学 基于药效团模型的全新药物分子构建方法
EP2502173A2 (en) * 2009-11-20 2012-09-26 University of Dundee Design of molecules
CN101789047A (zh) * 2010-02-05 2010-07-28 四川大学 基于逆向合成的有机小分子化合物可合成性评价方法
CN106198980A (zh) * 2010-08-13 2016-12-07 私募蛋白质体公司 胰腺癌生物标记及其用途
US20120076692A1 (en) * 2010-09-23 2012-03-29 Siemens Medical Solutions Usa, Inc. Modular Component Synthesis Unit
CN107109701A (zh) * 2014-09-16 2017-08-29 斯坦福国际研究院 通过光纤阵列扫描技术发现亲和试剂和催化剂
US20170116369A1 (en) * 2015-05-05 2017-04-27 The Penn State Research Foundation Method for designing overall stoichiometric conversions and intervening metabolic reactions
CN106156405A (zh) * 2016-06-24 2016-11-23 上海网化化工科技有限公司 基于化学反应数据库的有机合成路线设计方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BAUDOIN D, ET AL: "RetroPath2.0: A retrosynthesis workflow for metabolic engineers", 《METABOLIC ENGINEERS》, vol. 45, 1 January 2018 (2018-01-01), pages 158 - 170, XP055792640, DOI: 10.1016/j.ymben.2017.12.002 *
CHO A, ET AL: "Prediction of novel synthetic pathways for the production of desired chemicals", 《BMC SYSTEMS BIOLOGY》, vol. 4, no. 1, 28 March 2010 (2010-03-28), pages 35, XP021082124, DOI: 10.1186/1752-0509-4-35 *
SMITH G, ET AL: "Local sensitivity analysis for observed hydrocarbons in a Jupiter photochemistry model", 《CARUS》, vol. 182, no. 1, 30 May 2006 (2006-05-30), pages 181 - 201, XP024912378, DOI: 10.1016/j.icarus.2005.12.005 *
WARR W, ET AL: "A Short Review of Chemical Reaction Database Systems, Computer-Aided Synthesis Design, Reaction Prediction and Synthetic Feasibility", 《MOLECULAR INFORMATICS》, vol. 33, no. 6, 2 June 2014 (2014-06-02), pages 469 - 476, XP055845515, DOI: 10.1002/minf.201400052 *
张书莹,等: "生理毒代动力学模型在化学品生态风险评价中的应用", 《科学通报》, vol. 24, no. 35, 20 December 2017 (2017-12-20), pages 69 - 80 *
杨震,等: "活性天然产物和结构多样性类天然产物的合成", 《化学进展》, no. 01, 24 January 2009 (2009-01-24), pages 49 - 56 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113517033A (zh) * 2021-03-23 2021-10-19 河南大学 小样本环境下基于XGBoost的化学反应产率智能预测与分析方法
CN114613446A (zh) * 2022-03-11 2022-06-10 冰洲石生物科技(上海)有限公司 交互式/化学合成路线设计方法、系统、介质及电子设备
CN115206450A (zh) * 2022-09-15 2022-10-18 药融云数字科技(成都)有限公司 一种合成路线推荐方法及终端

Also Published As

Publication number Publication date
JP2023138963A (ja) 2023-10-03
EP3746772A4 (en) 2021-11-10
WO2019156872A9 (en) 2019-10-03
JP2021513177A (ja) 2021-05-20
WO2019156872A1 (en) 2019-08-15
AU2019217331A1 (en) 2020-07-30
JP7357183B2 (ja) 2023-10-06
EP3746772A1 (en) 2020-12-09
US11961595B2 (en) 2024-04-16
US20210065851A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
CN112272764A (zh) 化学合成路线和方法的计算生成
Eyke et al. Toward machine learning-enhanced high-throughput experimentation
Amar et al. Machine learning and molecular descriptors enable rational solvent selection in asymmetric catalysis
Coley et al. Autonomous discovery in the chemical sciences part I: Progress
Breen et al. Ready, set, flow! Automated continuous synthesis and optimization
Shi et al. Automated experimentation powers data science in chemistry
Xiouras et al. Applications of artificial intelligence and machine learning algorithms to crystallization
Caramelli et al. Discovering new chemistry with an autonomous robotic platform driven by a reactivity-seeking neural network
US20210233620A1 (en) Machine learning
Hardwick et al. Digitising chemical synthesis in automated and robotic flow
Oliveira et al. When machine learning meets molecular synthesis
CN111201085B (zh) 用于反应筛选和优化的装置及其方法
Miyazato et al. Data-driven identification of the reaction network in oxidative coupling of the methane reaction via experimental data
Guo et al. Bayesian optimization for chemical reactions
Fong et al. Utilization of machine learning to accelerate colloidal synthesis and discovery
Shim et al. Machine learning strategies for reaction development: Toward the low-data limit
Raghavan et al. Dataset design for building models of chemical reactivity
Hirst et al. ML meets MLn: machine learning in ligand promoted homogeneous catalysis
Reker et al. Evolving and nano data enabled machine intelligence for chemical reaction optimization
Sumpter et al. Autonomous continuous flow reactor synthesis for scalable atom-precision
Ng et al. Multivariate temporal data analysis using self-organizing maps. 2. Monitoring and diagnosis of multistate operations
Schunk et al. High throughput technology: approaches of research in homogeneous and heterogeneous catalysis
Filipa de Almeida et al. Machine Learning for the Optimization of Chemical Reaction Conditions
Powell Improving continuous crystallisation using process analytical technologies: design of a novel periodic flow process
Lapkin Rational Design of Continuous Flow Processes for Synthesis of Functional Molecules

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination