CN114528288A - 一种多类型器官芯片数据库的设计方法 - Google Patents
一种多类型器官芯片数据库的设计方法 Download PDFInfo
- Publication number
- CN114528288A CN114528288A CN202111009531.3A CN202111009531A CN114528288A CN 114528288 A CN114528288 A CN 114528288A CN 202111009531 A CN202111009531 A CN 202111009531A CN 114528288 A CN114528288 A CN 114528288A
- Authority
- CN
- China
- Prior art keywords
- data
- chip
- data table
- information
- organ
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000000056 organ Anatomy 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013461 design Methods 0.000 title claims description 6
- 239000003814 drug Substances 0.000 claims abstract description 41
- 239000000463 material Substances 0.000 claims abstract description 22
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 16
- 210000000936 intestine Anatomy 0.000 claims abstract description 8
- 210000003734 kidney Anatomy 0.000 claims abstract description 8
- 210000004185 liver Anatomy 0.000 claims abstract description 8
- 210000004072 lung Anatomy 0.000 claims abstract description 8
- 210000004556 brain Anatomy 0.000 claims abstract description 6
- 238000002474 experimental method Methods 0.000 claims description 37
- 229940079593 drug Drugs 0.000 claims description 35
- 210000000988 bone and bone Anatomy 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 8
- 238000007405 data analysis Methods 0.000 abstract description 4
- 238000013136 deep learning model Methods 0.000 abstract description 4
- 210000004027 cell Anatomy 0.000 description 33
- 238000011160 research Methods 0.000 description 20
- 238000013473 artificial intelligence Methods 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 8
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000002032 lab-on-a-chip Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 239000012620 biological material Substances 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000002207 metabolite Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 239000002771 cell marker Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002107 myocardial effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- -1 cell lines Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 239000013583 drug formulation Substances 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本专利主要描述了一种包含不同器官芯片数据的数据库构建方法,多个不同类型的器官芯片数据,分别为肝芯片数据、心脏芯片数据、肠芯片数据、肺芯片数据、肾脏芯片数据、脑芯片数据、皮肤芯片数据、骨骼芯片数据等,同时还包括了各种器官芯片数据都会用到的一些公用信息,主要有药物信息、细胞信息、材料信息、生物试剂信息、器官芯片型号信息、器官芯片参数配置信息、实验结果信息。本数据库可以为各种应用于器官芯片领域的数据分析方法,包括深度学习模型等,提供更加充足、更全面的数据。
Description
技术领域
本发明属于生物医学工程和计算机技术相结合的领域,通过计算机技术、数据库技术、人工智能技术等,和器官芯片这一生物医学工程领域中的尖端技术紧密结合起来,运用关系型数据库搭建技术有效的解决了器官芯片与人工智能相结合的关键环节——如何建立器官芯片数据库。
本专利主要描述了一种包含不同器官芯片数据的数据库构建方法,多个不同类型的器官芯片数据,分别为肝芯片数据、心脏芯片数据、肠芯片数据、肺芯片数据、肾脏芯片数据、脑芯片数据、皮肤芯片数据、骨骼芯片数据等,同时还包括了各种器官芯片数据都会用到的一些公用信息,主要有药物信息、细胞信息、材料信息、生物试剂信息、器官芯片型号信息、器官芯片参数配置信息、实验结果信息。
背景技术
器官芯片(Organ-On-A-Chip)是将人体的微型组织或器官构建于微环境之中,主要利用微流控技术,通过与细胞生物学、生物材料和工程学等多种方法相结合,可以在体外,模拟构建出与接近人体的多细胞组织器官,微环境和代谢系统。使用多种不同类型的器官芯片组合到一起,就模拟了一个人体内的整体生理微环境,本预测方法适用于所有类型器官芯片,包括心脏芯片、肝芯片、肾芯片、肠芯片、脑芯片、肺芯片等,进而可以预测整个人体内不同器官对药物的评价。它可以加快药物发现和药物筛选的研发速度,缩短研发周期。同时在精准医疗领域,器官芯片依然发挥着重要作用。器官芯片可以避免或者减少动物实验次数,用自体细胞搭建肿瘤模型实现药物临床前测试和筛选。
器官芯片在培养和在其进行实验的过程中,会产生大量的实验数据,但是在以前的研究中,研究者们并没有仔细分析数据之间的关联,特别是对不同的器官芯片实验之间,由于实验团队不同,数据并没有实现共享,只是看重实验结果。同时,目前市面上也没有一款辅助工具可以在线分析以往曾经做过的类似实验结果,把自己的设计参数和其他实验进行在线分析和对比,进而预测自己开展的器官芯片实验结果。
因此,需要开发一个与器官芯片相关的数据库,其中包含着各种与器官芯片相关的数据,可以为各种应用于器官芯片领域的数据分析方法与深度学习模型提供全面、可靠的数据支撑。
发明内容
发明目的:
针对上述研究的问题,本发明的目的在于建立一个包含了多种类型器官芯片数据的数据库。此数据库存储着与器官芯片相关的各种数据,包括生物支架材料、试剂、细胞系、药物、器官芯片型号、器官芯片参数配置(试剂和药物浓度、细胞类型等),以及可以作为标签数据的时间信息和实验结果(细胞代谢物浓度、细胞的数量和存活率、芯片内微环境的PH、温度、氧气浓度、二氧化碳浓度、TEER、气压、是否加入药物、药物的释放速度、降解速率)。此方法构建的数据库可以为各种应用于器官芯片领域的数据分析方法,包括深度学习模型等,提供更加充足和全面的数据。
本发明采用如下技术方案,一种包括了多种类型器官芯片数据的数据库构建方法,本方法建立数据库需要四个步骤完成。
第一步,首先要建立起公用信息数据表集合,包括药物信息相关的数据表(存储着药物名称、分子式、二维和三维结构式、靶蛋白、SMILE格式表达式、MOL2VEC编码等,其中靶蛋白信息需要建立蛋白质数据表和靶点数据表来表述Drug Target Interaction,简称DTI关联信息)、细胞信息相关的数据表(存储着细胞系名称、来源、基因序列、GENE2VEC编码等)、生物支架材料信息相关的数据表(存储着分子式、结构式、编码表示等)、生物试剂信息相关的数据表(存储着成份、比例、浓度、化学式、结构式、编码等)、器官芯片型号相关的数据表(存储着芯片型号ID、枚举型变量的器官芯片种类、开发者、机构、文章名称及链接、官网介绍链接、芯片结构和组件描述、工作原理描述、WORD2VEC编码等)、器官芯片参数配置数据表(存储着参数配置ID,便于和实验数据表关联,一行参数配置ID信息对应着带有时间数据的多行实验数据表信息,还存储着器官芯片型号ID,一种或者几种药物调配信息,生物试剂调配信息,所采用的支架材料调配信息,采用了哪几种细胞系等)、带有时间信息的实验结果数据表(存储着细胞代谢物浓度、细胞的数量和存活率、芯片内微环境的PH、温度、氧气浓度、二氧化碳浓度、TEER、气压、是否加入药物、药物的释放速度、降解速率等),这些存储着的数据信息都有可能与实验结果数据之间存在着某种直接或者间接的联系,这种联系可以通过人工智能的方法进行大数据学习和模式识别,进而用于预测实验结果。
第二步,利用网络数据库和实验室数据,向各个公用数据表中填充数据。
(1)药物信息数据表:在器官芯片实验中,有些实验内容是会用到药物,此数据表正是用于存储目前已知的较为全面的药物数据信息。此数据表中全部数据,一部分来源于网络数据库,例如PubChem、DrugBank、NCBI等,另一部分也可以来自于国内外实验室及研究机构的实验数据。
(2)细胞信息数据表:在器官芯片实验中会用到细胞,此数据表正是存储着目前已知的较为全面的细胞数据信息。此数据表中全部数据,一部分来源于网络数据库,例如Panglaodb、CellMarker、Cancer Cell line、Human Cell Atlas、Mouse Cell Atlas等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(3)生物支架材料信息数据表:在器官芯片实验中会用到各种支架材料供细胞生长,针对此类实验需要有各种支架材料的相关信息进行存储,而此数据表正是存储着目前全球已知的较为全面的材料数据信息。此数据表中全部数据,一部分来源于网络数据库,例如Matweb、Matmatch、ASM International、Material Connexion等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(4)生物试剂信息数据表:在器官芯片实验中会用到各种生物试剂,此数据表正是存储着目前全球已知的较为全面的生物试剂数据信息。此数据表中全部数据,一部分来源于网络数据库,例如ThermoFisher等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(5)器官芯片型号数据表:由于器官芯片的设计来源于不同单位,包括生产制造商、工厂、科研机构及实验室、研究团队等,他们所设计的每一款器官芯片都与众不同,即使是同一器官类型的器官芯片也是不尽相同。此数据表用于搜集目前所有已知的器官芯片信息,将它们分类和编号存储到数据库中,这里存储着制造商、创作人员、部件组成、框架结构、所用材料、使用方法、器官类型、工作原理描述、文章名称及链接、产品官网链接等。这些数据一部分来源于产片的官网,知名期刊的文章,例如Lab On A Chip等,另一部分可以来自于国内外实验室及研究机构的实验作品设计。
(6)器官芯片参数配置数据表:进行器官芯片实验的过程中,会在指定型号的器官芯片中加入不同的药物和试剂,混合的比例和浓度也有所不同,采用何种细胞系放入器官芯片内,以及采用何种支架材料支撑起细胞组织的三维空间结构,这些数据都存储在此数据库中。此数据表中的每一行数据要有一个“配置ID”用于关联后面的实验结果数据表,此数据表中的全部数据,主要来源于不同科研机构的实验数据集合,也可以来源于知名期刊文章,例如Lab On A Chip,Biomaterials,Disease Models&Mechanisms,Journal ofChemical Information and Modeling等。
(7)带有时间信息的实验结果数据表:在器官芯片实验中会有整个实验结果的数据信息,包括细胞的数量和存活率、代谢物成份及浓度等,芯片内微环境的CO2浓度、PH值、温度、氧气浓度、TEER、气压等,药物的是否加药、释放速率、降解速率等,针对各种不同器官芯片实验的数据结果,需要有一个数据库表储这些实验结果信息,而此数据表正是存储着较为全面的有关器官芯片实验结果的数据信息。此数据表中全部数据,主要来源于不同科研机构的实验数据集合,也可以来源于知名期刊文章,例如Lab On A Chip,Biomaterials,Disease Models&Mechanisms,Journal of Chemical Information and Modeling等。
第三步是基于已经建立好的公用数据,把公用数据按照器官芯片类型(器官芯片型号表中枚举类型的器官芯片种类这个字段)进行分类提取,导入到新的对应的器官芯片数据表中。这些新建的器官芯片数据表实际上是对上一步已经建立好的公用数据的重新分类组合,并没有增加新的数据到数据库中,这样做的目的是便于后续的人工智能算法对数据进行集中运算,而不是从不同的表中提取数据后再集中运算,省去了查询检索数据的时间,有利于提高人工智能算法执行效率和缩短预测所消耗的时间。
新建的数据表依据器官芯片类型的不同,包括肝芯片数据表、心脏芯片数据表、肠芯片数据表、肺芯片数据表、肾脏芯片数据表、脑芯片数据表、皮肤芯片数据表、骨骼芯片数据表等。这些数据表中都存储着同类型的器官芯片型号ID,芯片参数配置ID,实验结果ID和时间信息,以及这些ID关联的相关实体属性信息,构建成一张汇总后的数据大表。值得注意的是,不同类型的器官芯片数据表是用于考察不同的药物治疗评价目标的,例如骨髓芯片数据表主要用于检测药物免疫反应,肝芯片数据表主要用于检测药物代谢能力,肠芯片数据表主要用于检测药物吸收,肺芯片数据表也是主要用于检测药物吸收,心脏芯片数据表主要用于检测心肌收缩力和导电能力对药物的反应,肾芯片数据表主要用于排泄物检测。
第四步,数据库建立完成后,要对数据库中的数据进行反复的数据清洗。数据清洗的主要目的是对缺失值进行填补和对不准确、不相关的数据进行替换或删除,以提高数据库质量,保证不同数据源数据格式的统一。
本发明优点在于:
(1)目前还没有与器官芯片相关的数据库,本发明为器官芯片数据库的建立提供了切实可行方法。
(2)本数据库可以为各种应用于器官芯片领域的数据分析方法,包括机器学习、深度学习模型等,提供更加标准化、更全面的数据。
附图说明
图1为数据库构建方法的流程图;
图2为公用信息数据表集合示意图;
图3为“多种器官芯片信息数据库”建立的示意图
具体实施方式
本发明采用如下技术方案,一种包括了多种类型器官芯片数据的数据库构建方法,本方法建立数据库需要四个步骤完成,如图1所示。
第一步,首先要建立起公用信息数据表集合,如图2所示,包括药物信息相关的数据表(存储着药物名称、分子式、二维和三维结构式、靶蛋白、SMILE格式表达式、MOL2VEC编码等,其中靶蛋白信息需要建立蛋白质数据表和靶点数据表来表述Drug TargetInteraction,简称DTI关联信息)、细胞信息相关的数据表(存储着细胞系名称、来源、基因序列、GENE2VEC编码等)、生物支架材料信息相关的数据表(存储着分子式、结构式、编码表示等)、生物试剂信息相关的数据表(存储着成份、比例、浓度、化学式、结构式、编码等)、器官芯片型号相关的数据表(存储着芯片型号ID、枚举型变量的器官芯片种类、开发者、机构、文章名称及链接、官网介绍链接、芯片结构和组件描述、工作原理描述、WORD2VEC编码等)、器官芯片参数配置数据表(存储着参数配置ID,便于和实验数据表关联,一行参数配置ID信息对应着带有时间数据的多行实验数据表信息,还存储着器官芯片型号ID,一种或者几种药物调配信息,生物试剂调配信息,所采用的支架材料调配信息,采用了哪几种细胞系等)、带有时间信息的实验结果数据表(存储着细胞代谢物浓度、细胞的数量和存活率、芯片内微环境的PH、温度、氧气浓度、二氧化碳浓度、TEER、气压、是否加入药物、药物的释放速度、降解速率等),这些存储着的数据信息都有可能与实验结果数据之间存在着某种直接或者间接的联系,这种联系可以通过人工智能的方法进行大数据学习和模式识别,进而用于预测实验结果。
第二步,利用网络数据库和实验室数据,向各个公用数据表中填充数据。
(1)药物信息数据表:在器官芯片实验中,有些实验内容是会用到药物,此数据表正是用于存储目前已知的较为全面的药物数据信息。此数据表中全部数据,一部分来源于网络数据库,例如PubChem、DrugBank、NCBI等,另一部分也可以来自于国内外实验室及研究机构的实验数据。
(2)细胞信息数据表:在器官芯片实验中会用到细胞,此数据表正是存储着目前已知的较为全面的细胞数据信息。此数据表中全部数据,一部分来源于网络数据库,例如Panglaodb、CellMarker、Cancer Cell line、Human Cell Atlas、Mouse Cell Atlas等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(3)生物支架材料信息数据表:在器官芯片实验中会用到各种支架材料供细胞生长,针对此类实验需要有各种支架材料的相关信息进行存储,而此数据表正是存储着目前全球已知的较为全面的材料数据信息。此数据表中全部数据,一部分来源于网络数据库,例如Matweb、Matmatch、ASM Intemational、Material Connexion等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(4)生物试剂信息数据表:在器官芯片实验中会用到各种生物试剂,此数据表正是存储着目前全球已知的较为全面的生物试剂数据信息。此数据表中全部数据,一部分来源于网络数据库,例如ThermoFisher等,另一部分可以来自于国内外实验室及研究机构的实验数据。
(5)器官芯片型号数据表:由于器官芯片的设计来源于不同单位,包括生产制造商、工厂、科研机构及实验室、研究团队等,他们所设计的每一款器官芯片都与众不同,即使是同一器官类型的器官芯片也是不尽相同。此数据表用于搜集目前所有已知的器官芯片信息,将它们分类和编号存储到数据库中,这里存储着制造商、创作人员、部件组成、框架结构、所用材料、使用方法、器官类型、工作原理描述、文章名称及链接、产品官网链接等。这些数据一部分来源于产片的官网,知名期刊的文章,例如Lab On A Chip等,另一部分可以来自于国内外实验室及研究机构的实验作品设计。
(6)器官芯片参数配置数据表:进行器官芯片实验的过程中,会在指定型号的器官芯片中加入不同的药物和试剂,混合的比例和浓度也有所不同,采用何种细胞系放入器官芯片内,以及采用何种支架材料支撑起细胞组织的三维空间结构,这些数据都存储在此数据库中。此数据表中的每一行数据要有一个“配置ID”用于关联后面的实验结果数据表,此数据表中的全部数据,主要来源于不同科研机构的实验数据集合,也可以来源于知名期刊文章,例如Lab On A Chip,Biomaterials,Disease Models&Mechanisms,Journal ofChemical Information and Modeling等。
(7)带有时间信息的实验结果数据表:在器官芯片实验中会有整个实验结果的数据信息,包括细胞的数量和存活率、代谢物成份及浓度等,芯片内微环境的CO2浓度、PH值、温度、氧气浓度、TEER、气压等,药物的是否加药、释放速率、降解速率等,针对各种不同器官芯片实验的数据结果,需要有一个数据库表储这些实验结果信息,而此数据表正是存储着较为全面的有关器官芯片实验结果的数据信息。此数据表中全部数据,主要来源于不同科研机构的实验数据集合,也可以来源于知名期刊文章,例如Lab On A Chip,Biomaterials,Disease Models&Mechanisms,Journal of Chemical Information and Modeling等。
第三步是基于已经建立好的公用数据,把公用数据按照器官芯片类型(器官芯片型号表中枚举类型的器官芯片种类这个字段)进行分类提取,导入到新的对应的器官芯片数据表中,如图3所示。这些新建的器官芯片数据表实际上是对上一步已经建立好的公用数据的重新分类组合,并没有增加新的数据到数据库中,这样做的目的是便于后续的人工智能算法对数据进行集中运算,而不是从不同的表中提取数据后再集中运算,省去了查询检索数据的时间,有利于提高人工智能算法执行效率和缩短预测所消耗的时间。
新建的数据表依据器官芯片类型的不同,包括肝芯片数据表、心脏芯片数据表、肠芯片数据表、肺芯片数据表、肾脏芯片数据表、脑芯片数据表、皮肤芯片数据表、骨骼芯片数据表等。这些数据表中都存储着同类型的器官芯片型号ID,芯片参数配置ID,实验结果ID和时间信息,以及这些ID关联的相关实体属性信息,构建成一张汇总后的数据大表。值得注意的是,不同类型的器官芯片数据表是用于考察不同的药物治疗评价目标的,例如骨髓芯片数据表主要用于检测药物免疫反应,肝芯片数据表主要用于检测药物代谢能力,肠芯片数据表主要用于检测药物吸收,肺芯片数据表也是主要用于检测药物吸收,心脏芯片数据表主要用于检测心肌收缩力和导电能力对药物的反应,肾芯片数据表主要用于排泄物检测。
第四步,数据库建立完成后,要对数据库中的数据进行反复的数据清洗。数据清洗的主要目的是对缺失值进行填补和对不准确、不相关的数据进行替换或删除,以提高数据库质量,保证不同数据源数据格式的统一。
Claims (4)
1.一种多类型器官芯片数据库的设计方法,其特征在于如下步骤:
步骤1:首先要建立起公用信息数据表集合;
步骤2:利用网络数据库和实验室数据,向各个公用数据表中填充数据。;
步骤3:基于已经建立好的公用数据,把公用数据按照器官芯片类型(器官芯片型号表中枚举类型的器官芯片种类这个字段)进行分类提取,导入到新的对应的器官芯片数据表中;
步骤4:数据库建立完成后,要对数据库中的数据进行反复的数据清洗。
2.根据权利要求1所述的一种包括了多种类型器官芯片数据库的数据仓库构建方法,其特征在于,所述步骤1中的公用信息数据表集合包括药物信息相关的数据表、细胞信息相关的数据表、生物支架材料信息相关的数据表、生物试剂信息相关的数据表、器官芯片型号相关的数据表、器官芯片参数配置数据表和带有时间信息的实验结果数据表。
3.根据权利要求1中所述的一种包括了多种类型器官芯片数据库的数据仓库构建方法,其特征在于,所述步骤3的器官芯片数据表包括肝芯片数据表、心脏芯片数据表、肠芯片数据表、肺芯片数据表、肾脏芯片数据表、脑芯片数据表、皮肤芯片数据表、骨骼芯片数据表等。
4.根据权利要求1中所述的一种包括了多种类型器官芯片数据库的数据仓库构建方法,其特征在于,所述步骤4的具体步骤为:对缺失值进行填补和对不准确、不相关的数据进行替换或删除,以提高数据库质量,保证不同数据源数据格式的统一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111009531.3A CN114528288A (zh) | 2021-08-31 | 2021-08-31 | 一种多类型器官芯片数据库的设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111009531.3A CN114528288A (zh) | 2021-08-31 | 2021-08-31 | 一种多类型器官芯片数据库的设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114528288A true CN114528288A (zh) | 2022-05-24 |
Family
ID=81619289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111009531.3A Pending CN114528288A (zh) | 2021-08-31 | 2021-08-31 | 一种多类型器官芯片数据库的设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528288A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1396800A2 (en) * | 1997-07-25 | 2004-03-10 | Affymetrix, Inc. | Method and apparatus for providing a bioinformatics database |
CN103853838A (zh) * | 2014-03-17 | 2014-06-11 | 中国联合网络通信集团有限公司 | 一种数据处理方法和装置 |
CN105512142A (zh) * | 2014-09-26 | 2016-04-20 | 深圳华大基因股份有限公司 | 基因变异与药物关系数据库和数据库系统 |
CN109213820A (zh) * | 2018-08-30 | 2019-01-15 | 成都索贝数码科技股份有限公司 | 一种实现多种类型的数据库融合使用的方法 |
CN109977119A (zh) * | 2019-03-25 | 2019-07-05 | 浙江大学 | 用于生物电子混合人造器官系统的数据分类及存储方法 |
CN111104466A (zh) * | 2019-12-25 | 2020-05-05 | 航天科工网络信息发展有限公司 | 一种海量数据库表快速分类的方法 |
JP2021056570A (ja) * | 2019-09-27 | 2021-04-08 | 日本電気株式会社 | データベースの分割システム、データベースの分割方法、及びデータベースの分割プログラム |
-
2021
- 2021-08-31 CN CN202111009531.3A patent/CN114528288A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1396800A2 (en) * | 1997-07-25 | 2004-03-10 | Affymetrix, Inc. | Method and apparatus for providing a bioinformatics database |
CN103853838A (zh) * | 2014-03-17 | 2014-06-11 | 中国联合网络通信集团有限公司 | 一种数据处理方法和装置 |
CN105512142A (zh) * | 2014-09-26 | 2016-04-20 | 深圳华大基因股份有限公司 | 基因变异与药物关系数据库和数据库系统 |
CN109213820A (zh) * | 2018-08-30 | 2019-01-15 | 成都索贝数码科技股份有限公司 | 一种实现多种类型的数据库融合使用的方法 |
CN109977119A (zh) * | 2019-03-25 | 2019-07-05 | 浙江大学 | 用于生物电子混合人造器官系统的数据分类及存储方法 |
JP2021056570A (ja) * | 2019-09-27 | 2021-04-08 | 日本電気株式会社 | データベースの分割システム、データベースの分割方法、及びデータベースの分割プログラム |
CN111104466A (zh) * | 2019-12-25 | 2020-05-05 | 航天科工网络信息发展有限公司 | 一种海量数据库表快速分类的方法 |
Non-Patent Citations (1)
Title |
---|
何林等: "区域自动气象站数据库整合设计与实现", 《陕西气象》, 31 December 2014 (2014-12-31), pages 44 - 46 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eisen | Mathematical models in cell biology and cancer chemotherapy | |
Tagle | The NIH microphysiological systems program: developing in vitro tools for safety and efficacy in drug development | |
Lecault et al. | High-throughput analysis of single hematopoietic stem cell proliferation in microfluidic cell culture arrays | |
Wang et al. | 3D cell cultures toward quantitative high-throughput drug screening | |
Watson et al. | Fitting tissue chips and microphysiological systems into the grand scheme of medicine, biology, pharmacology, and toxicology | |
Low et al. | Microphysiological systems (“organs‐on‐chips”) for drug efficacy and toxicity testing | |
Low et al. | Tissue chips to aid drug development and modeling for rare diseases | |
Kubanov et al. | Development of 3d bioprinting technology using modified natural and synthetic hydrogels for engineering construction of organs | |
CN114530196A (zh) | 一种基于深度学习预测的器官芯片药物评价方法 | |
Ma et al. | Integrating engineering, automation, and intelligence to catalyze the biomedical translation of organoids | |
CN114528288A (zh) | 一种多类型器官芯片数据库的设计方法 | |
Zhang et al. | Global trends and hotspots in research on organoids between 2011 and 2020: a bibliometric analysis | |
吴玥 et al. | Establishment of a comparative transcriptomics database of heart disease animal models | |
Dernowsek et al. | BioCAE: a new strategy of complex biological systems for biofabrication of tissues and organs | |
Patra et al. | Role of Innovation System in Development of Biotechnology in South Africa. | |
Lara-Bertrand et al. | Technological search of patents for the identification of devices with potential use in tumor-infiltrating lymphocytes (TILs) research | |
Ribba et al. | Q x db: a generic database to support mathematical modelling in biology | |
Moderator: et al. | The promise and potential of “organs-on-chips” as preclinical models | |
Balhoff et al. | Tailoring the NCI Thesaurus for Use in The OBO Library. | |
He et al. | Emergent trends in organ-on-a-chip applications for investigating metastasis within tumor microenvironment: A comprehensive bibliometric analysis | |
Henn et al. | Cytocentric measurement for regenerative medicine | |
Der | Living with Animals: Human–Animal Relations and Society at Çatalhöyük | |
Jagdeesh | A Three-Dimensional in vitro Model of Disease That Improves Preclinical Research by Incorporating Genetic Diversity and Increasing Physiological Accuracy | |
Minger | Developing technologies to unlock the therapeutic and research potential of human stem cells | |
Garr | The human body shop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |