CN109243528B - 基于知识图谱有向图的生物过程控制方法 - Google Patents

基于知识图谱有向图的生物过程控制方法 Download PDF

Info

Publication number
CN109243528B
CN109243528B CN201810921093.XA CN201810921093A CN109243528B CN 109243528 B CN109243528 B CN 109243528B CN 201810921093 A CN201810921093 A CN 201810921093A CN 109243528 B CN109243528 B CN 109243528B
Authority
CN
China
Prior art keywords
expert
biological
state
knowledge graph
biological process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810921093.XA
Other languages
English (en)
Other versions
CN109243528A (zh
Inventor
张嗣良
张旭蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810921093.XA priority Critical patent/CN109243528B/zh
Publication of CN109243528A publication Critical patent/CN109243528A/zh
Application granted granted Critical
Publication of CN109243528B publication Critical patent/CN109243528B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及一种基于知识图谱有向图的生物过程控制方法,首先把生物过程中的生物学特性与工程学特性,以及生产过程表现为工艺环节多、物料介入频繁引起的问题,把数据库与知识图谱深度学习相结合,把不同数据库中数据所蕴含的知识连接与挖掘,形成具有统一术语结构的超级知识库;然后通过专家规则的建立与流数据状态识别比较,把隐藏在大数据中与过程有关的本体特性从复杂系统中抽取出来;在此基础上把细胞内高度分支的生命科学研究以及合成生物学的设计、构建和检验等不同环节结合起来,通过有向图的规划,全面考察大规模细胞培养过程中的各种因素的相互关系,最终可实现合成生物学与发酵工程细胞大规模培养技术对接,实现过程工艺控制的智能决策。

Description

基于知识图谱有向图的生物过程控制方法
技术领域
本发明涉及一种生物制造技术,特别涉及一种基于知识图谱有向图的生物过程控制方法。
背景技术
工业生物过程是指利用细胞生命代谢过程生产人们所需的各类物质的过程,生产的物质可涉及医药、食品、化工、农业等多个领域,是社会可持续发展中一个重要的工业过程。
生物过程研究解决实际生产问题时,面对细胞内高度分支研究的海量数据和反应器过程中所获得的各种传感器数据,以及发酵过程具有生命系统的复杂性、时变性、全局性等特点,遇到极大困难。人们习惯于以预先设立的少量假设的工程学基础,把注意力放在因果关系的发现和使用上。生物过程控制与优化有以下几个发展阶段:
一、操作参数控制阶段
各有关生物反应过程已普遍采用计算机在线控制,在反应器上又进一步配置了溶氧电极、pH电极,甚至排气氧和二氧化碳浓度测量等,由此建立生物过程参数检测与控制系统。但这种控制系统适应能力弱,不能找到过程优化与放大的关键问题。
二、发酵过程模型控制
其中包括动力学模型控制与化学计量学和热力学研究控制,但效果不明显。
为了实现过程优化,在过程动力学研究基础上,又引进了一系列现代控制理论的应用:其中包括静态和动态优化、系统识别、自适应控制、专家系统、模糊控制、神经元网络、直到各种混沌现象的研究。以上研究为人工智能深度学习提供早期数学方法,但当时由于生物过程大数据系统的不完整,快速处理计算机以及搜索技术的限制,没有发挥作用。
三、生物过程优化与放大的多尺度理论与方法
在生物反应器中所发生的反应大致上在分子尺度的遗传特性,细胞尺度的代谢调节和工程尺度的传递特性三个尺度上发生的,只要某一尺度上的某一因素成为限制条件就会对生物过程产生影响。细胞内部代谢流分布的变化信息及其现象特征的准确获取对过程研究十分重要。以细胞为对象的生物反应过程产物实质上是细胞代谢产物,胞内基因尺度及酶动力学尺度的信息流决定了胞内代谢流分布的空间与时间的基本特征,而反应器只是在环境条件和过程传递特性上,从物料和能量供应上对其产生影响。细胞生理状态及其对生长和产物形成的影响是胞外环境和胞内机制复杂作用的结果,理解并控制细胞的表型差异将为我们实现生物过程强化提供一条崭新的技术路线。
实现生物过程多尺度相关分析的高效优化与放大,具体技术路线可通过下图1所示。具体来说主要包括以下解决思路:
(1)利用先进的过程检测装备技术实现发酵过程各种参数的实时准确获取:其中包括利用高精度在线尾气质谱、活细胞传感仪、在线电子鼻、在线红外光谱仪等对发酵液中的各种参数获得准确的实时数据。
(2)不同条件下的过程微观代谢信息的获取:利用过程代谢谱、组学数据、稳定性同位素标记等实验方法获取生物过程的微观代谢机制信息。
(3)获取不同过程条件下细胞宏观生理代谢特性与微观生理代谢特性的关联信息:利用准确获取的过程参数,根据多参数相关分析原理,从海量数据中获取敏感参数,并将获得的宏观参数与微观代谢特性参数相结合实现过程优化研究。
(4)宏观与微观生理代谢特性与反应器流场特性结合,实现过程的优化与放大:利用先进的流场检测技术PIV及反应器流场数值模拟技术CFD获得反应器内流程特性变化规律,与此同时与过程中细胞生理代谢参数相结合实现过程的放大。
四、大数据时代的生物过程研究
如今,一个大规模生产、分享和应用数据的时代正在开始。"大数据"是一个体量特别大,数据类别特别多的数据集,并且这样的数据集无法用传统数据库工具在合理时间内达到对其内容进行抓取、管理和处理。大数据的4V特征,即数据体量大,数据类别大,数据处理速度快,数据真实性高。并指出了大数据处理观念的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。大数据这种处理观念的转变将引起全球科学研究的方式、规范、战略的转型。
大数据时代的这种变革为生物过程优化研究提供了新的思维方向,在工业生物过程研究中,引入大数据处理理念,讨论生物过程大数据特点、数据获得、处理方式与实际效果,将产生重大影响。
图2为通过“BIOSTAR”软件包所获得的发酵过程检测的多尺度参数趋势曲线图,表现为多样性、时变性、相关耦合性与不确定性的过程参数特征。面对上述多参数变化情况,我们认为之前的采用精确的动力学模型,或者采用高度分支的生命科学研究实现过程优化是极端困难的。大数据分析告诉我们,不再追求精确性,承认混杂性,从对因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。大量事实告诉我们,采用数据驱动型的相关分析能较好的解决过程优化问题。我们前面提出的基因、细胞、反应器多尺度参数相关分析的理论与方法,其实就是延着大数据思维方式的转变而发展,通过使用数据驱动的多参数相关性分析的方法对生物反应过程的大数据的分析,验证了我们前面提出的基因、细胞、反应器多尺度参数相关分析的理论与方法,其实就是延着大数据思维方式的转变而发展,并由此获得了一系列成果。
但是,目前以上问题的研究与数据处理基本上是依靠低效的人工处理与判断。于是在工业生产中普遍存在的问题:菌种、种子质量、不同来源原材料、不同的工艺操作条件都会引起发酵单位波动,只能事后总结;按照工厂生产规程要求,整个生产操作都有批报记录,但基本上成为摆设性的数据孤岛;对于生物工程产品生产而言,各种因素互相嵌套、动态影响,用简单的单因子关系无法处理生产中的问题,只是一大堆互不联系的实验或生产数据;由于人工能力的局限性,缺乏深层次的全局因素考虑;即使有了多尺度相关分析理论,但相关分析基本仍然靠人工判断,不能在车间普遍推广使用。
综上所述,目前存在基因、代谢、过程到生产组织,或从菌体、基因、代谢、发酵过程控制到最终得到产品,均为一大堆互不联系的实验或生产数据,形成数据孤岛,无法快速搜索并形成新的知识管理平台而用于对生物发酵过程的快速诊断、快速控制等技术问题。
由此可见,在大数据时代如何利用全部数据概念,抛开“小数据时代”的推理和因果关系为主导的统计学方法的局限性,通过无理数与模糊理念,实现精确观察。其中核心问题是数据处理方式,即数据库、信息共享、检索或查寻的建立。即形成新的数据处理理念与研究程序,建立快速精确的寻找方法与知识管理平台是势在必行。
举个例子,抗体疫苗等大分子生物活性药物生产的严格要求。
与小分子化合物药品生产不同,抗体疫苗等大分子药物的应用性能受生物活性与结构的严重影响。保证一致的产品质量,从细胞株或菌株的筛选与培养产品生产过程,临床试验与应用,到公司产品报证和市场推广,需要大量的过程高级控制,数据记录和数据文件系统。公司必须对整个生命周期中所获得的数据进行分析和解释,以获得最大的产品生产和过程认知,由此改善产品质量。目前主要采用多变量(MVA)方法和实验设计(DoE)来解决上述问题。
MVA主要分析在某一时间的多个统计参数,发现这些参数之间的关系或模式。DoE是指包括一系列预定参数对过程或对象影响的变化计划的结构性试验,以最少量的研究获得生产最大化和过程认知,在通过R&D实现过程放大与技术转移到工业生产时,DoE是评估过程变化与设备变动影响的重要手段,由此确定设计空间,进而确定对过程主要影响的控制策略。
但是MVA所指出的参数变化之间的关系只是数理统计意义上的关系,不能真正代表过程状态,并没有从生化工程和菌体生理特性角度提出概念性的状态认知。由此可见,本专利方法获得过程的感知和状态,快速搜索并形成新的知识管理平台而用于对生物发酵过程的快速诊断、快速控制等,并在上述方法基础上建立的实验设计(DoE)以及通过R&D的过程变化评估,是根据生理或环境状态变量,以及由此获得的过程知识所决定的,可以更好的解决过程优化放大与技术转移中所发生的问题。
发明内容
本发明是针对如何在海量的生物过程数据中抽提出反映过程本体特性的关系,克服生物过程中高度分支的生命科学研究与多生产环节形成的数据孤岛,弥补生物过程各种控制方法的缺陷,将其运用到具体生物生产控制中去的问题,提出了一种基于知识图谱有向图的生物过程控制方法,将大数据与人工智能相结合,对生物过程中的专家规则变化的进行研究,在生物过程流数据基础上,做到在生物过程状态识别过程中智能控制,真实做到生物过程制造中的实时状态控制。
本发明的技术方案为:一种基于知识图谱有向图的生物过程控制方法,具体包括如下步骤:
1)生物过程中发生作用时,物质或事件之间按一定的规律或模型发生关系,此规律定义为专家规则,专家规则的关系表现为严格按照质量守恒定则、动态速率、本体动力学特性、各有关学科技术定则、经过验证的相关特征或其他有严格定义认可的关系;
2)将生物过程中各种因素之间交叉耦合与动态影响采用知识图谱有向图的方式表达出来,点表示实体或概念,边表示属性或关系;通过知识图谱的实体关系表达,将生物过程中的问题求解或状态识别,转化为知识图谱中的子问题的集合中的相关问题的实体搜索,从而通过知识图谱中实体的链接建立生物过程问题的解的集合;把子问题和子问题的子问题序列,通过问题实体在知识图谱中链接的关系搜索,最后把初始问题归约到一个本源问题;
3)同时相对应的建立生物过程的问题求解集合作为专家规则库,通过知识图谱的实体链接关系,采用问题归约方法,在问题集合的状态空间通过实体间的有向图链接形式把问题的求解过程描述出来,最终识别出生物过程的状态;
4)按步骤3)求解出步骤2)描述生物过程的知识图谱有向图中的所有专家规则,建立专家规则库;
5)现场生产,通过BIOSTAR软件包采集到的流数据曲线所表现出来的状态与步骤4)所得专家规则库中定义的状态进行识别比较,确定不同生物反应过程阶段或时期的状态识别;
6)在专家规则库中确定专家规则,或在人工专家前提研究基础上引导建立生物过程知识图谱和初始专家规则库;如确定状态识别不能在专家规则库中搜索到相应的专家规则,则形成新的状态空间的问题实体加入步骤2)的知识图谱实体关系有向图中,再通过步骤3)进行求解;
7)人工智能化引导的过程工艺优化与放大:通过不同批次的发酵过程流数据过程中的状态与专家规则中定义的状态比较,获得过程的感知与状态识别;然后通过聚类与回归统计分析,找到不同发酵批次中同一个共性问题,对批发酵过程不同时期状态智能识别;最后在满足特定生理状态与环境条件状态条件,即稳定条件下,通过关键操作变量细调,进行工艺参数优化,并通过智能决策系统下传至现场指导生产,即在专家规则预报指导下实现过程最优化和放大;
8)专家规则库在系统运行过程中通过新过程数据的获取进行不断迭代求解自我优化其状态识别能力,不断完善专家规则,预报指导过程优化;
9)大规模标注数据的形成,不同对象条件下的专用规则在原有专用规则基础上不断优化,自动完善生物过程控制工艺参数。
本发明的有益效果在于:本发明基于知识图谱有向图的生物过程控制方法,通过使用知识图谱将原本复杂的生物反应过程所蕴含的知识和问题求解方式形式化成本体映射的关系,并在此之上建立了体现生物反应过程的本质的问题求解的方式的集合,即专家规则库,把不同数据库中数据所蕴含的知识连接与挖掘形成智能的决策系统,解决了大规模细胞培养过程中的各种因素的相互复杂关系所导致的过程工艺控制无法全面有效控制的问题,实现了过程工艺控制的智能化,最终提升了工业生物制造的产物获得能力。此外,鉴于大分子药物的性能受生物活性物质与结构的严重影响,将本发明方法应用于工厂生物制造过程中,能有效保证产品质量的一致性。本发明方法对于作为细胞治疗的干细胞、肿瘤细胞体外培养的生物过程研究也具有意义。
附图说明
图1为生物过程多尺度相关分析图;
图2为发酵过程检测的多尺度参数趋势曲线图;
图3为本发明知识图谱有向图;
图4为本发明生物过程流数据处理示意框图;
图5为本发明智能化数字化技术方案架构图;
图6为本发明专用有向图建立专家规则库示意图;
图7为青霉素发酵新菌种老工艺与结果图;
图8为本发明方法下青霉素发酵新菌种新工艺与结果图。
具体实施方式
本发明具体实施方式包括如下若干步骤:
一、专家规则的定义、分类与形成:
物质或事件之间按一定的规律发生关系,只要在生物过程中发生作用,都可以收集到生物过程智能化中所用的专家规则。专家规则的关系表现为各种形式,如严格按照质量守恒定则、动态速率、本体动力学特性(显性或隐性)、各有关学科技术定则,经过验证的相关特征、参考有关文献知识(可能适合应用)、或其他有严格的定义认可的关系。作为专家规则在处理过程对象的流数据状态识别时是不变的,但由于生物过程的极端复杂性,各种因素交叉耦合,许多问题不是单因素所能决定的,所以上述特性或专家规则随着不同的操作条件有时会发生变化,因此不同的产品、菌种、工艺、装备有不同的专家规则,差异有大小。
专家规则的分类
1、永恒不变的规则:主要是严格按照质量守恒定则,如在供氧(OTR)不变(如发酵罐转速、流量、罐压、培养基流变特性等)的情况下,OUR增加时,DO下降。也就是说无论生物过程条件不变,这个规则永远不变。
2、不同的条件有不同的规则:如产品、菌种、工艺、设备、原材料等不同时就有不同的规则相对应,表现为不同的动力学特性(显性或隐性)。如前述,OUR增加时,DO下降,但有时在某一时间段却发生OUR下降,对应的DO也下降,这是由于工艺操作补糖太多,OUR上升使DO下降到临界氧浓度以下,由此引起OUR下降,即因果关系发生了变化。引起DO下降的因素很多,如搅拌转速、设备设计制造、菌体形态发生变化引起的流变特性变化等都可以引起DO下降,也就是说都有可能发生上述临界氧的问题,但一般的生产工艺研究人员或操作人员是不可能发现的,即使在这方面有经验的专家,在有关数据没有展示在他的面前也不可能发现,也就是这些本体现象的隐蔽性,但又是至关重要的状态特性。
3、人工引导下的专家规则变化研究:在一个产品投产前或已经投产生产,研究人员对菌体细胞生理特性或上游基因工程已经做了深入研究并形成了一些很有价值的结论,但由于生物过程的极端复杂性,这些结论不一定明显表现出来,这时我们可以开展人工引导下的生物过程专家规则变化研究。如辅酶Q10生产,上游基因工程研究认为生物合成途径改造对辅酶Q10的产量影响不大,主要调节因素来自电子传递呼吸链,由此可见电势差、供氧、NADH、OUR调控,搅拌转速以及与通常考虑的菌体生长、碳氮源补料的动态平衡与阶段性特征成为关键。从上述观点出发,工厂生产中大量出现的粘性物质可能是菌体为适应外界条件而产生的夹馍,由此产生的电势差有利于辅酶Q的产生,如果情况果真是这样,为适应上述情况研究,我们必须进一步在提供的智能化实验室发酵罐基础上设计实验,开展人工导向性的关联分析和经验性解释。上面基因工程研究发现的辅酶Q10生产中的现象将为我们设计导向性人工智能化提供依据,形成辅酶Q10生产中特有的专家规则与自学习系统。
4、不同时间段的状态变化(动态变化)。在批发酵过程不同时期菌体生长与产物形成的过程特征是不同的,这是过程状态判别的重要依据。因此如何实现状态判别的时间段的划分,以及这些关键时间段的状态判别方法就成为重要内容。可以采用不同的时间划分法进行试差,也可以动态(场景)变化数据的知识图谱的数据储存实现场景化、个性化、动态化、模糊化。
二、有向图的概念与方法建立
生物过程或生产中的问题中各种因素之间交叉耦合与动态影响,用简单的单因子关系无法处理研究,因而不能理解或发现深层次或隐含的问题,面对的只是基因、代谢、过程到生产组织的一大推互不联系的实验或生产数据。为此我们采用有向图的概念与方法建立互相的联系。
如图3所示知识图谱有向图,带标记的有向图,其中点表示实体或概念,边表示属性或关系,这就是资源描述框架RDF或属性图(property graph)。基于“概念-实体-属性-关系”数据模型,由此形成不同的专家规则。点与线除了已提供的以外,可以根据研究的需要增加。
以知识图谱的数据储存实现对大数据动态变化的支持,以及对非结构数据与半结构数据进行抽取与转换。
利用知识图谱有向图建立专家规则与问题描述求解:专家规则采用问题归约(problem reduction)的方法从有向图的状态空间的问题描述中求解出来。已知问题的描述,通过一系列变换把问题最终变为一个子问题集合,这些子问题的解可以通过搜索法直接得到,从而解决了初始问题。问题规约表示可有下列3部分组成:
(1)一个初始问题的描述;
(2)一套把问题变换为子问题的操作符;
(3)一套本源问题的描述。
从目标出发(要解决的问题)逆向推理,建立子问题及子问题的子问题,直至最后把初始问题归约为一个本源问题,这就是问题归纳的实质。就是利用有向图提供的空间,建立一个个子问题的专家规则,最终识别生物过程的状态,这是一个本源问题。
应用问题规约方法中的算符来把问题变换为子问题的描述,采用各趋势曲线变化(↑↓→)以及变化幅度和延续时间的相互关系来决定各自问题的解。由于这些简化了的难题中的每一个都是较小的,所以都比原始难题容易解决。这些子问题可作为本源问题考虑,但它的解只包含一步移动。
应用一系列相似的推理。采用与或结构(AND/OR graph)的图式结构,能有效的说明如何由问题规约法求得问题的解答。把一个问题描述变换为一个规约或后继问题描述的集合,这是由问题归约算符进行的。变换得到的所有后继问题的解就是父辈问题的一个解。
所有问题归约的目的是最终产生具有明显解答的专家规则。这些问题可能是能够拥由状态空间搜索中走动一步来解决的,或者可能是其他具有已知解答的更复杂的问题,如开展人工引导下的专家规则变化研究,或产品生产实验研究所得到的结论。
三、生物过程流数据与专家规则对比应用:
如图4为本发明生物过程流数据处理示意框图,方法如下:
(1)解决过程状态判断问题,需要把专家规则输入到系统中与流数据进行比较,形成自动状态机。
(2)本发明的知识图谱有向图的是基于生物学和生化工程原理基础上发展起来,由此形成各种父节点或子节点关系,需要解决语义消除歧义,原理上逻辑验证,规则冗余等问题。
(3)放映过程状态的专家规则可以由人工经验输入或少量规则泛化问题,采用Inductive Logic Programming来进行少量样本的自动规则归纳生成,同时考虑到生成模型的新数据适应性和鲁棒性。
(4)自动状态机的观察值使用hmm等模型进行推理比较,对结果进行概率评估,然后调整规则分类概率。
(5)专家规则系统是一个反复验证扩增的系统,规则的尺度决定了专家系统的正确性与稳定性,规则的尺度决定语义的表达空间疏密程度,语义的完备性要求状态点的完全唯一解。若状态点不能被规则系统解析,一个可行的方法为规则细分化,通过增加语义空间密度来解析状态点。同样若状态点得不到解析,可行的方法为规则细分化,或修改规则。在修改规则或规则细分化的同时,仍然要保持语义的完整性。
(6)上述自动状态机所得到的观察值就是过程状态,通过观察值及概率分布,获得不同批次发酵的共性状态估计,用于生物过程工艺优化的根据,下传至生产现场。
四、生物过程智能化总体技术方案与执行
如图5所示智能化数字化技术方案架构,在此架构下,进行生物过程智能化控制:
(1)收集或建立各种通用专家规则库(可以有上百条),并建立通用有向图,如图3所示;
(2)根据不同条件(产品、菌种、工艺、设备等)下,在上述规则库中找到较接近的相关规则群;
(3)在前期已经初步研究基础上开展人工引导下的专家规则研究,并形成专用有向图;
(4)根据建立的专用有向图专家规则库,如图6所示:
2,9,11,5,1:dc/dt=KLa(C*-C)-OUR,Kla=∫(F、RPM、罐压、粘度)→质量守恒定则;
11,4,8:RPM↑Kla↑DO↑OUR→临界氧以上→质量守恒定则;
11,4,8:RPM↑Kla↑DO↑OUR↑出现6,7→临界氧以下→质量守恒定则+动力学特性;
19,20,21:CER↑RQ↑→油或氧化程度低的碳源作为碳源利用→每产生一分子子CO2耗用较多的氧分子→质量守恒定则;
5:粘度↗Kla↘→氧传递能力下降→培养液粘度增加引起的氧传递能力下降→化学工程学科技术定则。
(5)现场生产,通过BIOSTAR等软件包采集到的流数据曲线与专家规则比较,确定不同时期的状态识别;
如图7所示青霉素发酵新菌种老工艺与结果图,发酵单位为6-8万u/ml;图8为青霉素发酵新菌种新工艺与结果图,发酵单位可达11-12万u/ml。
(6)多批多条流数据与多专家规则的比较,进行状态识别,在专家规则库中确定专家规则,或在人工专家前提研究基础上引导建立生物过程有向图和初始专家规则;如确定状态识别不能在专家规则库中确定专家规则,则形成新的状态空间的问题加入的知识图谱有向图中,再进行求解;
(7)实现人工智能化引导的过程优化与放大:
(7.1)通过每批发酵过程多参数相关,即通过流数据与专家规则比较,获得过程的感知,了解过程状态。(大数据挖掘)
(7.2)在不同发酵批次中找到同一个共性问题。(聚类与回归统计)
(7.2.1)生产效价(或其他目标)与不同参数(操作变量与状态变量)比较
(7.2.2)批发酵过程不同状态智能识别,
(7.2.3)找出与效价关联的共性问题。
(7.3)在满足基本状态(具体生理状态与环境条件状态)条件,即稳定条件下,通过关键操作变量细调实现过程最优化和放大,即规则预报指导下的工艺参数优化,下传至现场生产。(预报)
(8)专家规则库在系统运行过程中通过新过程数据的获取进行不断迭代求解自我优化其状态识别能力,不断完善专家规则,预报指导过程优化;
(9)大规模标注数据的形成,成为核心竞争力。不同对象条件下的专用规则的形成,即在原有专用规则基础上的专用规则不断优化与自动形成,自动完善生物过程控制工艺参数。
本发明适合于不同目标的生物过程的研究智能化:
(1)基因工程与合成生物学;
(2)菌种改造与高通量筛选;
(3)工艺技术路线(菌种、发酵、分离纯化、三废处理);
(4)工艺技术条件(种子、培养基、操作方式与条件、装备);
(5)设备设计放大与改造(流场特性与生理特性);
(6)大分子生物药物生产(大分子药物);
(7)干细胞、肿瘤细胞体外大规模培养(细胞治疗)。

Claims (1)

1.一种基于知识图谱有向图的生物过程控制方法,其特征在于,具体包括如下步骤:
1)生物过程中发生作用时,物质或事件之间按一定的规律或模型发生关系,此规律定义为专家规则,专家规则的关系表现为严格按照质量守恒定则、动态速率、本体动力学特性、各有关学科技术定则、经过验证的相关特征或其他有严格定义认可的关系;
2)将生物过程中各种因素之间交叉耦合与动态影响采用知识图谱有向图的方式表达出来,点表示实体或概念,边表示属性或关系;通过知识图谱的实体关系表达,将生物过程中的问题求解或状态识别,转化为知识图谱中的子问题的集合中的相关问题的实体搜索,从而通过知识图谱中实体的链接建立生物过程问题的解的集合;把子问题和子问题的子问题序列,通过问题实体在知识图谱中链接的关系搜索,最后把初始问题归约到一个本源问题;
3)同时相对应的建立生物过程的问题求解集合作为专家规则库,通过知识图谱的实体链接关系,采用问题归约方法,在问题集合的状态空间通过实体间的有向图链接形式把问题的求解过程描述出来,最终识别出生物过程的状态;
4)按步骤3)求解出步骤2)描述生物过程的知识图谱有向图中的所有专家规则,建立专家规则库;
5)现场生产,通过BIOSTAR软件包采集到的流数据曲线所表现出来的状态与步骤4)所得专家规则库中定义的状态进行识别比较,确定不同生物反应过程阶段或时期的状态识别;
6)在专家规则库中确定专家规则,或在人工专家前提研究基础上引导建立生物过程知识图谱和初始专家规则库;如确定状态识别不能在专家规则库中搜索到相应的专家规则,则形成新的状态空间的问题实体加入步骤2)的知识图谱实体关系有向图中,再通过步骤3)进行求解;
7)人工智能化引导的过程工艺优化与放大:通过不同批次的发酵过程流数据过程中的状态与专家规则中定义的状态比较,获得过程的感知与状态识别;然后通过聚类与回归统计分析,找到不同发酵批次中同一个共性问题,对批发酵过程不同时期状态智能识别;最后在满足特定生理状态与环境条件状态条件,即稳定条件下,通过关键操作变量细调,进行工艺参数优化,并通过智能决策系统下传至现场指导生产,即在专家规则预报指导下实现过程最优化和放大;
8)专家规则库在系统运行过程中通过新过程数据的获取进行不断迭代求解自我优化其状态识别能力,不断完善专家规则,预报指导过程优化;
9)大规模标注数据的形成,不同对象条件下的专用规则在原有专用规则基础上不断优化,自动完善生物过程控制工艺参数。
CN201810921093.XA 2018-08-14 2018-08-14 基于知识图谱有向图的生物过程控制方法 Active CN109243528B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810921093.XA CN109243528B (zh) 2018-08-14 2018-08-14 基于知识图谱有向图的生物过程控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810921093.XA CN109243528B (zh) 2018-08-14 2018-08-14 基于知识图谱有向图的生物过程控制方法

Publications (2)

Publication Number Publication Date
CN109243528A CN109243528A (zh) 2019-01-18
CN109243528B true CN109243528B (zh) 2022-02-08

Family

ID=65071522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810921093.XA Active CN109243528B (zh) 2018-08-14 2018-08-14 基于知识图谱有向图的生物过程控制方法

Country Status (1)

Country Link
CN (1) CN109243528B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349636B (zh) * 2019-06-14 2021-07-13 厦门邑通软件科技有限公司 一种抗生素生产中提升化学效价的方法
JP7181849B2 (ja) * 2019-10-31 2022-12-01 横河電機株式会社 装置、方法およびプログラム
CN112199518B (zh) * 2020-11-17 2023-08-15 西安交通大学 生产技术中知识图谱推荐驱动的生产技术路线图配置方法
CN114329928B (zh) * 2021-12-14 2024-04-09 中国运载火箭技术研究院 一种装备模型的模块化组装与总体参数快速生成方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093559A (zh) * 2007-06-12 2007-12-26 北京科技大学 一种基于知识发现的专家系统构造方法
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104774902A (zh) * 2008-09-11 2015-07-15 华东理工大学 一种发酵过程优化与放大的方法与装置
CN105302096A (zh) * 2015-11-10 2016-02-03 湖南千盟物联信息技术有限公司 一种工厂智能调度方法
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN106770509A (zh) * 2015-11-23 2017-05-31 上海国佳生化工程技术研究中心有限公司 一种动态过程中微生物氧消耗速率的测定方法
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN107436976A (zh) * 2017-07-21 2017-12-05 南京理工大学 智能道岔辅助设计系统
CN108304382A (zh) * 2018-01-25 2018-07-20 山东大学 基于制造过程文本数据挖掘的质量分析方法与系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170277841A1 (en) * 2016-03-23 2017-09-28 HealthPals, Inc. Self-learning clinical intelligence system based on biological information and medical data metrics

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093559A (zh) * 2007-06-12 2007-12-26 北京科技大学 一种基于知识发现的专家系统构造方法
CN104774902A (zh) * 2008-09-11 2015-07-15 华东理工大学 一种发酵过程优化与放大的方法与装置
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN105302096A (zh) * 2015-11-10 2016-02-03 湖南千盟物联信息技术有限公司 一种工厂智能调度方法
CN106770509A (zh) * 2015-11-23 2017-05-31 上海国佳生化工程技术研究中心有限公司 一种动态过程中微生物氧消耗速率的测定方法
CN107436976A (zh) * 2017-07-21 2017-12-05 南京理工大学 智能道岔辅助设计系统
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN108304382A (zh) * 2018-01-25 2018-07-20 山东大学 基于制造过程文本数据挖掘的质量分析方法与系统

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
BioGrakn: A Knowledge Graph-Based Semantic Database for Biomedical Sciences;Antonio Messina等;《CISIS 2017》;20170705;第299-209页 *
Finding melanoma drugs through a probabilistic knowledge graph;James P. McCusker等;《PeerJ Comput.Sci.》;20170213;第1-20页 *
Knowledge Graph Embedding: A Survey of Approaches and Applications;Quan Wang等;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20171231;第29卷(第12期);第2724-2743页 *
医学知识图谱构建技术与研究进展;袁凯琦等;《计算机应用研究》;20180731;第35卷(第7期);第1929-1936页 *
基于多尺度参数相关分析的细胞培养过程优化与放大;庄英萍等;《生物产业技术》;20180115(第01期);第49-55页 *
大数据时代的生物过程研究;张嗣良;《生物产业技术》;20160515(第03期);第34-39页 *
生物过程大数据分析与智能化;张嗣良等;《生物产业技术》;20180131(第01期);第86-93页 *
知识自动化及工业应用;桂卫华等;《中国科学》;20160601;第46卷(第8期);第1016-1034页 *

Also Published As

Publication number Publication date
CN109243528A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
Lawson et al. Machine learning for metabolic engineering: A review
CN109243528B (zh) 基于知识图谱有向图的生物过程控制方法
Mowbray et al. Machine learning for biochemical engineering: A review
del Rio‐Chanona et al. Deep learning‐based surrogate modeling and optimization for microalgal biofuel production and photobioreactor design
Chen et al. Modelling and optimization of fed-batch fermentation processes using dynamic neural networks and genetic algorithms
Williams et al. Data-driven model development for cardiomyocyte production experimental failure prediction
Kirdar et al. Application of multivariate data analysis for identification and successful resolution of a root cause for a bioprocessing application
Komives et al. Bioreactor state estimation and control
Arauzo-Bravo et al. Automatization of a penicillin production process with soft sensors and an adaptive controller based on neuro fuzzy systems
Simutis et al. Exploratory analysis of bioprocesses using artificial neural network‐based methods
Duong-Trung et al. When bioprocess engineering meets machine learning: A survey from the perspective of automated bioprocess development
Goel et al. Biological systems modeling and analysis: a biomolecular technique of the twenty-first century
Dama et al. BacterAI maps microbial metabolism without prior knowledge
Oweida et al. Merging materials and data science: opportunities, challenges, and education in materials informatics
Shirsat et al. Modelling of mammalian cell cultures
Fernández et al. A new approach for nonlinear multivariable fed-batch bioprocess trajectory tracking control
Shene et al. Neural networks for the prediction of the state of Zymomonas mobilis CP4 batch fermentations
Hashizume et al. Challenges in developing cell culture media using machine learning
Julien et al. Bioreactor monitoring, modeling, and simulation
Gao et al. Application of agent‐based system for bioprocess description and process improvement
Ruggeri et al. On the modelling approaches of biomass behaviour in bioreactor
Caño De Las Heras et al. NyctiDB: A non-relational bioprocesses modeling database supported by an ontology
PROKOP Systems analysis and synthesis in biology and biotechnology
Loettgers Synthetic biology and the emergence of a dual meaning of noise
Albino et al. Hybrid Modeling for On-Line Fermentation Optimization and Scale-Up: A Review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant