CN113948153A - 一种多尺度数据分析方法、装置、终端及介质 - Google Patents
一种多尺度数据分析方法、装置、终端及介质 Download PDFInfo
- Publication number
- CN113948153A CN113948153A CN202011263697.3A CN202011263697A CN113948153A CN 113948153 A CN113948153 A CN 113948153A CN 202011263697 A CN202011263697 A CN 202011263697A CN 113948153 A CN113948153 A CN 113948153A
- Authority
- CN
- China
- Prior art keywords
- target
- drug
- interface
- user
- drug molecule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Epidemiology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Primary Health Care (AREA)
- Medicinal Chemistry (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Crystallography & Structural Chemistry (AREA)
- Toxicology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
Abstract
本申请实施例公开了一种多尺度数据分析方法,包括:获取多个第一样本与多个第二样本的结合参数,结合参数用于表示多个第一样本与多个第二样本两两之间的结合情况;将结合参数显示在目标表格上,目标表格的行标题用于记录多个第一样本的信息,目标表格的列标题用于记录多个第二样本的信息;目标表格包括多个单元格,其中,每个单元格用于表示单元格行标题的第一样本与单元格列标题中的第二样本的结合参数。本申请实施例还提供一种装置、终端及介质。通过目标表格直观地展示多个药物分子分别与多个病毒蛋白的结合能情况。从而克服了当前一次只能模拟单个药物分子与单个病毒蛋白对接的情形,提升了药物分子与病毒蛋白结合的模拟和展示效率。
Description
本申请要求于2020年7月16日提交中国专利局、申请号为202010690507.X、申请名称为“一种显示方法及实现该方法的装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及电子领域,尤其涉及一种多尺度数据分析方法、装置、终端及介质。
背景技术
在很多行业的未知领域,经常需要利用已知的知识作为线索进行探索分析来发现新的知识,从而解决该领域的某些问题或者推动该领域一定程度的前进。
特别是在医疗行业,尤其是当前面对新型冠状病毒(SARS-CoV-2)感染不断扩散的严峻形势下,科研人员需要针对病毒和抗病毒药物进行全面的研究,通过对比新型病毒和已知的类似病毒,以及对已知的抗病毒药物、小分子化合物的研究,寻找出对新型病毒可能有效的药物。但是目前现有的分析工具能力相对匮乏只能反映有限维度的信息,相关研究文献散落在多个数据库,科研人员需要使用能力有限的小工具进行信息有限维度的分析,并人工查阅大量文献探寻各种线索来进行综合分析,严重影响效率。
因此,现有技术中存在的上述问题还有待于解决。
发明内容
本申请实施例提供了一种多尺度数据分析方法、装置、终端及介质,能够提供多维度的数据分析。
本申请实施例第一方面提供了一种多尺度数据分析方法,包括:获取多个第一样本与多个第二样本的结合参数,可选地,第一样本为药物分子,第二样本为病毒蛋白,例如新型冠状病毒(SARS-CoV-2),该结合参数用于表示该多个第一样本与该多个第二样本两两之间的结合情况;将该结合参数显示在目标表格上,该目标表格的行标题用于记录该多个第一样本的信息,该目标表格的列标题用于记录该多个第二样本的信息;该目标表格包括多个单元格,其中,每个单元格用于表示该单元格行标题的第一样本与该单元格列标题中的第二样本的结合参数。
本实施例中,通过目标表格能够直观地展示多个药物分子分别与多个病毒蛋白的结合能情况。从而克服了现有技术中一次只能模拟单个药物分子与单个病毒蛋白对接的情形,提升了药物分子与病毒蛋白结合的模拟和展示效率。
可选地,该将该结合参数显示在目标表格上,包括:根据该结合参数的数值大小,对该列标题记录的第二样本进行排序。
本实施例中,通过结合参数的数值大小对第二样本进行排序,从而在目标表格中能够优先向用户展示用户最感兴趣的内容。
可选地,该第一样本为药物分子,该第二样本为病毒蛋白,该结合参数为该药物分子与该病毒蛋白的结合能,该结合能用于表示该药物分子与该病毒蛋白的结合情况;该行标题用于记录该药物分子的信息;该列标题用于记录该病毒蛋白的信息。
本实施例中,通过目标表格的形式展示多个药物分子与分别与多个病毒蛋白的结合能,从而直观地了解多种药物与病毒分子的结合情况,提升了药物筛选的效率。
可选地,该方法还包括:当检测到用户对该目标表格中的目标行执行预设操作时,在该目标行的上方显示该列标题,可选地,该预设操作为鼠标悬停操作,鼠标点击操作,或触摸操作。该列标题记录有每个病毒蛋白分别与该目标行的行标题所记录药物分子结合的三维结构图;和/或:当检测到用户对该目标表格中的目标列执行预设操作时,在该目标列的左侧或右侧显示该行标题,该行标题记录有每个药物分子分别与该目标列的列标题所记录病毒蛋白结合的三维结构图。
本实施例中,当检测到用户对目标表格的目标行执行预设操作时,在该目标行的上方显示该列标题,从而实现了列标题在每一行上的吸附显示,使得用户能够一次性查看同一药物分子分别与各个病毒蛋白结合的三维结构图,可选地,各个三维结构图的下方还显示有每个病毒蛋白的名称,以及,具体的结合能数值。以使得用户能够直观地同时看到第一行对应的药物分子与各个病毒蛋白结合的三维结构图和结合能。
可选地,该将该结合参数显示在目标表格上之后,还包括:当获取到用户对目标单元格的选择操作时进入第二界面,该目标单元格为该目标表格中的一个单元格,该第二界面为该目标表格所在第一界面的子界面;在该第二界面中显示目标药物分子与目标病毒蛋白结合的三维结构图,该目标药物分子为该目标单元格对应行标题所记录的药物分子,该病毒蛋白为该目标单元格对应列标题所记录的病毒蛋白。
本实施例中,目标表格中的多个单元格可以通过色块的方式,展示行标题所对应药物分子与列标题所对应病毒蛋白的结合能。当用户对某一组药物分子与病毒蛋白的结合情况感兴趣时,点击对应的单元格,即可进入第二界面,对特定药物分子与病毒蛋白结合的详细情况进行深入探索。
可选地,该第二界面中还包括第一列表,该第一列表用于记录该目标药物分子与该列标题中每个病毒蛋白的结合能,该方法还包括:当获取到用户对该第一列表中第一单元格的选择操作时,在该第二界面中显示该目标药物分子与该第一单元格所对应病毒蛋白结合的三维结构图,该第一单元格为该第一列表中的一个单元格;和/或,该第二界面中还包括第二列表,该第二列表用于记录该目标病毒蛋白与该行标题中每个药物分子的结合能,该方法还包括:当获取到用户对该第二列表中第二单元格的选择操作时,在该第二界面中显示该目标病毒蛋白与该第二单元格所对应药物分子结合的三维结构图,该第二单元格为该第二列表中的一个单元格。
本实施例中,通过第一列表和/或第二列表,用户可以在第二界面下直接切换显示其他药物分子与其他病毒蛋白的结合详情,而不需要退回到第一界面重新操作,提高了第二界面下浏览的检索效率。
可选地,该方法还包括:根据用户输入的预设操作进入第三界面;在该第三界面中显示第一知识图谱,该第一知识图谱包括第一核心节点,以及与该第一核心节点连接的至少一个第一子节点,该第一核心节点用于记录第一药物分子的信息,该第一药物分子为该行标题所记录的任意一个药物分子;该第一子节点用于记录的信息包括:该第一药物分子的副作用、该第一药物分子可治疗的第一病症、该第一药物分子可作用的第一病毒蛋白或者该第一药物分子可作用的第一人类蛋白中的至少一种。
本实施例中,用户可以根据第一知识图谱知晓第一药物分子的详细情况。知识图谱表现形式包括但不限于原点、圆环、球体等形式。同时,在第三界面中,在第一知识图谱的一侧还显示有一个面板,该面板用于显示第一药物分子的所有公开科研文献信息及出处。这些第一药物分子的所有公开科研文献信息及出处,可以是存储在本地数据库中的数据,也可以是系统通过自然语言处理(Natural Language Processing,NLP)技术在线爬取获得的。
可选地,该在该第三界面中的第一区域显示第一知识图谱之后,还包括:当获取到用户选择目标第一子节点的选择操作时进入第四界面,该目标第一子节点为与该第一核心节点连接的至少一个第一子节点中的一个;在该第四界面中的第一区域显示第二知识图谱,该第二知识图谱包括第二核心节点,以及与该第二核心节点连接的至少一个第二子节点,该第二核心节点用于记录该目标第一子节点所记录的信息,该第二子节点用于记录至少一个关联药物,该关联药物能够治愈该目标第一子节点所记录的该第一病症,或者,该关联药物能够与该目标第一子节点所记录的该第一病毒蛋白作用,或者,该关联药物可作用于该目标第一子节点所记录的该第一人类蛋白;在该第四界面中的第二区域显示排序表,该排序表用于根据该关联药物与该第一药物分子的相似度对该关联药物进行排序;该排序表中显示有每个关联药物与该第一药物分子的相似度数值;该第四界面中的第一区域与该第四界面中的第二区域为相邻区域。
本实施例中,由于在第二界面中用户已经发现第一药物分子与病毒蛋白具有较好的结合效果,已知第一药物分子可用于治疗第一病毒蛋白,而第二子节点中所记录的药物分子同样能够用于治疗第一病毒蛋白,从而可以推测,关联药物同样有治疗新冠病毒的可能性。则此时,第二子节点中所记录的药物分子与第一药物分子构成关联药物。从而实现了对药物知识的深入探索。
可选地,该在该第四界面中的第二区域显示排序表之后,还包括:当获取到用户在该排序表中选择第一关联药物的选择操作时,在该第四界面的第三区域显示该第一关联药物的详细信息,该第一关联药物为该至少一个关联药物中的一个,该第四界面的第三区域与该第四界面中的第二区域为相邻区域;当获取到用户将该第一关联药物添加为筛选项的确认操作时,存储该第一关联药物的药物信息,以及,用户通过该第一知识图谱和该第二知识图谱获取到该第一关联药物的第一路径信息。
本实施例中,当用户在排序表中选择了感兴趣的第一关联药物时,第四界面弹出展示卡片,该展示卡片中显示第一关联药物的详细信息。从而使得用户可以对第一关联药物进行深入的了解。
可选地,该方法还包括:根据用户输入的预设操作进入第五界面;在该第五界面中的第一区域显示至少一个筛选关联药物的信息,该至少一个筛选关联药物为用户通过知识图谱筛选出的与该第一药物分子相似的药物;在该第五界面中的第一区域显示该至少一个筛选关联药物的检索路径,该检索路径为用户通过该知识图谱获取该筛选关联药物的筛选路径。
本实施例中,检索路径为用户通过知识图谱获取筛选关联药物的筛选路径。在每个关联药物的详细信息后面的第二区域,进一步显示了当前关联药物的筛选路径,通过该这些路径信息,用户能够回忆起自己检索到该关联药物的路径,能够通过路径信息记录探索关联药物过程的检索思路。
本申请实施例第二方面提供了一种多尺度数据分析装置,包括:
获取单元,用于获取多个第一样本与多个第二样本的结合参数,所述结合参数用于表示所述多个第一样本与所述多个第二样本两两之间的结合情况;
展示单元,用于将所述结合参数显示在目标表格上,所述目标表格的行标题用于记录所述多个第一样本的信息,所述目标表格的列标题用于记录所述多个第二样本的信息;所述目标表格包括多个单元格,其中,每个单元格用于表示所述单元格行标题的第一样本与所述单元格列标题中的第二样本的结合参数。
可选地,该展示单元,还用于:
根据该结合参数的数值大小,对该列标题记录的第二样本进行排序。
可选地,该第一样本为药物分子,该第二样本为病毒蛋白,该结合参数为该药物分子与该病毒蛋白的结合能,该结合能用于表示该药物分子与该病毒蛋白的结合情况;
该行标题用于记录该药物分子的信息;
该列标题用于记录该病毒蛋白的信息。
可选地,该展示单元还用于:
当检测到用户对该目标表格中的目标行执行预设操作时,在该目标行的上方显示该列标题,该列标题记录有每个病毒蛋白分别与该目标行的行标题所记录药物分子结合的三维结构图;和/或:
当检测到用户对该目标表格中的目标列执行预设操作时,在该目标列的左侧或右侧显示该行标题,该行标题记录有每个药物分子分别与该目标列的列标题所记录病毒蛋白结合的三维结构图。
可选地,该装置还包括:
执行单元,用于当获取到用户对目标单元格的选择操作时进入第二界面,该目标单元格为该目标表格中的一个单元格,该第二界面为该目标表格所在第一界面的子界面;
该展示单元,还用于在该第二界面中显示目标药物分子与目标病毒蛋白结合的三维结构图,该目标药物分子为该目标单元格对应行标题所记录的药物分子,该病毒蛋白为该目标单元格对应列标题所记录的病毒蛋白。
可选地,该第二界面中还包括第一列表,该第一列表用于记录该目标药物分子与该列标题中每个病毒蛋白的结合能,该展示单元还用于:
当获取到用户对该第一列表中第一单元格的选择操作时,在该第二界面中显示该目标药物分子与该第一单元格所对应病毒蛋白结合的三维结构图,该第一单元格为该第一列表中的一个单元格;和/或,
该第二界面中还包括第二列表,该第二列表用于记录该目标病毒蛋白与该行标题中每个药物分子的结合能,该展示单元还用于:
当获取到用户对该第二列表中第二单元格的选择操作时,在该第二界面中显示该目标病毒蛋白与该第二单元格所对应药物分子结合的三维结构图,该第二单元格为该第二列表中的一个单元格。
可选地,该执行单元还用于:
根据用户输入的预设操作进入第三界面;
该展示单元还用于,在该第三界面中显示第一知识图谱,该第一知识图谱包括第一核心节点,以及与该第一核心节点连接的至少一个第一子节点,该第一核心节点用于记录第一药物分子的信息,该第一药物分子为该行标题所记录的任意一个药物分子;该第一子节点用于记录的信息包括:该第一药物分子的副作用、该第一药物分子可治疗的第一病症、该第一药物分子可作用的第一病毒蛋白或者该第一药物分子可作用的第一人类蛋白中的至少一种。
可选地,该执行单元,还用于:
当获取到用户选择目标第一子节点的选择操作时进入第四界面,该目标第一子节点为与该第一核心节点连接的至少一个第一子节点中的一个;
该展示单元还用于,在该第四界面中的第一区域显示第二知识图谱,该第二知识图谱包括第二核心节点,以及与该第二核心节点连接的至少一个第二子节点,该第二核心节点用于记录该目标第一子节点所记录的信息,该第二子节点用于记录至少一个关联药物,该关联药物能够治愈该目标第一子节点所记录的该第一病症,或者,该关联药物能够与该目标第一子节点所记录的该第一病毒蛋白作用,或者,该关联药物可作用于该目标第一子节点所记录的该第一人类蛋白;
在该第四界面中的第二区域显示排序表,该排序表用于根据该关联药物与该第一药物分子的相似度对该关联药物进行排序;该排序表中显示有每个关联药物与该第一药物分子的相似度数值;该第四界面中的第一区域与该第四界面中的第二区域为相邻区域。
可选地,该展示单元还用于,
当获取到用户在该排序表中选择第一关联药物的选择操作时,在该第四界面的第三区域显示该第一关联药物的详细信息,该第一关联药物为该至少一个关联药物中的一个,该第四界面的第三区域与该第四界面中的第二区域为相邻区域;
该执行单元还用于,当获取到用户将该第一关联药物添加为筛选项的确认操作时,存储该第一关联药物的药物信息,以及,用户通过该第一知识图谱和该第二知识图谱获取到该第一关联药物的第一路径信息。
可选地,该执行单元还用于:
根据用户输入的预设操作进入第五界面;
该展示单元还用于,在该第五界面中的第一区域显示至少一个筛选关联药物的信息,该至少一个筛选关联药物为用户通过知识图谱筛选出的与该第一药物分子相似的药物;
在该第五界面中的第一区域显示该至少一个筛选关联药物的检索路径,该检索路径为用户通过该知识图谱获取该筛选关联药物的筛选路径。
上述第二方面的有益效果可参阅前述第一方面的相关记载,此处不再赘述。
本申请实施例第三方面提供了一种终端,包括:处理器和存储器,该存储器用于存储指令;该处理器用于根据该指令以执行上述第一方面任意一种可能的实现方式所述的方法。
本申请实施例第四方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得该计算机执行上述第一方面任意一种可能的实现方式所述的方法。
本申请实施例第七方面提供了一种计算机可读存储介质,包括指令,当该指令在计算机上运行时,使得该计算机执行上述第一方面任意一种可能的实现方式所述的方法。
附图说明
图1为本申请实施例所提供的多尺度数据分析方法的运行系统的示意图;
图2为本申请实施例所提供的多尺度数据分析方法的运行装置的示意图;
图3为本申请实施例所提供的多尺度数据分析方法的一个实施例的流程图;
图4为本申请实施例所提供的多尺度数据分析方法中第一界面的一种工作场景界面图;
图5为本申请实施例所提供的多尺度数据分析方法中第一界面的另一种工作场景界面图;
图6为本申请实施例所提供的多尺度数据分析方法中第一界面的另一种工作场景界面图;
图7为本申请实施例所提供的多尺度数据分析方法中第二界面的一种工作场景界面图;
图8为本申请实施例所提供的多尺度数据分析方法中第二界面的另一种工作场景界面图;
图9为本申请实施例所提供的多尺度数据分析方法中第三界面的工作场景界面图;
图10为本申请实施例所提供的多尺度数据分析方法中第四界面的一种工作场景界面图;
图11为本申请实施例所提供的多尺度数据分析方法中第四界面之后另一种工作场景界面图;
图12为本申请实施例所提供的多尺度数据分析方法中第五界面的工作场景界面图;
图13为本申请实施例所提供的多尺度数据分析方法的另一个实施例的流程图;
图14为本申请实施例所提供的多尺度数据分析方法的另一个实施例的流程图;
图15为本申请实施例所提供的多尺度数据分析装置的示意图;
图16为本申请实施例所提供的终端的示意图。
具体实施方式
本申请实施例提供了一种多尺度数据分析方法、装置、终端及介质,能够提供多维度的数据分析,提升数据分析的效率。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在一些科研领域,例如医疗行业中,科研人员需要针对病毒和抗病毒药物进行全面的研究,从而了解药物和病毒之间的结合情况。当前,一些软件可以通过计算机模拟来实现药物分子与病毒蛋白的三维结构可视化,然而这些软件所生成的三维结构图只能粗略的了解药物分子和病毒蛋白的结合情况,没有精确的指标作为继续深入研究的依据。
进一步地,对于一个病毒而言,例如新型冠状病毒(SARS-CoV-2),往往由多个病毒蛋白组成,而现有的模拟软件智能模拟单个药物分子与单个病毒蛋白的结合情况,模拟效率较低。
为了解决上述问题,本申请实施例提供一种多尺度数据分析方法,能够实现多组样本之间的比对和量化,从而提高了数据分析的效率。为便于理解,以下结合附图,对本申请实施例所提供的多尺度数据分析方法进行详细说明。
首先,对本申请实施例提供一种多尺度数据分析方法的运行系统进行介绍,请参阅图1,如图1所示,用户通过终端101与数据展示与交互102产生交互体验;数据服务104用来存储和处理系统所需要的数据,在药物筛选系统中,主要是用来存储药物分子和病毒蛋白数据以及采集行业内公开发表的药物相关文章等数据;数据逻辑处理103用来完成对104存储和采集的数据进行处理分析,通过102来呈现给用户,并实时响应用户中102中的所有交互动作。
其中,上述终端101设备包含但不限于PC电脑、掌上电脑、手机以及触摸屏等设备。作为用户与系统发生交互关系的物理载体,识别和响应用户的外设(如鼠标、键盘等)和手势操作产生的交互事件,对104中存储和采集的数据通过103服务进行计算和处理后,通过102服务呈现给用户。
上述数据展示与交互102:主要实现终端101上用户触发事件的交互反馈,定义统一的接口规范,用于103和104服务的调用和获取。药物筛选系统中核心模块包括药物分子和病毒蛋白数据可视化、信息关联可视化以及同类实体信息对比等(药物分子与病毒蛋白结合能热力图和抗病毒药物知识图谱)。
上述数据逻辑处理端103:主要负责对系统数据的处理和模型的训练,用户通过101存储和爬取的数据,都会通过数据逻辑端103来处理,包括数据清洗、模型训练以及计算求解等。药物筛选系统通过大算力对病毒、抗病毒药物及小分子化合物数据进行处理分析。
上述数据服务104:主要使用数据库来存储三方面数据,一是病毒相关数据,包括新冠病毒(SARS-CoV-2蛋白结构、病症……)以及相似性极高的同类冠状病毒数据(如SARS);二是抗病毒药物及小分子化合物的各项数据(病症、病毒、副作用……);最后一类数据是用户使用系统时产生的数据,如科研人员对某个抗病毒药物展开深入的探索分析走过的路径及节点上的关键信息。
进一步地,基于如图1所示的系统,本申请实施例可以通过如图2所示的装置来实现多尺度数据分析方法,如图2所示,本申请实施例所提供的装置包括。
1、药物筛选数据库。
药物筛选数据库提供原始的数据,包括集成行业内公开发布的病毒及药物数据集、用户自己保存的数据集以及爬取行业内公开发表的相关科研文献等所有与抗病毒筛选相关的数据。核心数据包括:目标靶蛋白结构及所有科研数据(如新冠病毒SARS-Cov-2蛋白结构、引发的肺炎症状……)、相似的已知冠状病毒数据、作用的人类蛋白、可能的对症的药物以及在研的小分子化合物数据等。
2、数据集成层。
数据集成层主要是基于大数据平台进行存储和访问代理。具体包括以下功能。
数据存储(Data Storage):数据存储(Data Storage)指和病毒数据和药物、小分子化合物数据的存储,以及对所有相关抗病毒药物及病毒分析的科研文献数据。
图引擎(Graph Engine):图引擎是是针对以“关系”为基础的“图”结构数据,进行查询和分析。利用图引擎技术对行业内权威机构发表的所有相关科研文献进行检索爬取,形成新型冠状病毒知识图谱辅助科研人员进一步的深入研究。
数据管理(Data Mgmt):是指药物筛选系统中在科研人员筛选过程中所产生的数据进行存储,做到探索过程可追溯。
数据访问代理(Data Access Proxy):数据访问代理(Data Access Proxy)指所有外部依赖数据的统一代理层,提供统一封装的访问接口之外,还有容错、限流、缓存的功能。
3、算法引擎层。
算法引擎层主要是整合各业务运行和管理数据,针对数据规模、结构、实时性及目标匹配要求对不同类型的算法进行筛选,提升计算匹配的效率。
分子动力学模拟(Molecular Dynamics):分子动力学模拟是通过结合数学,物理和化学等多学科的技术,依靠牛顿力学来模拟分子体系的运动,分子动力学模拟对于研究蛋白质的结构以及和小分子化合物的结合情况非常重要。
虚拟对接模拟算法(Autodock):虚拟对接模拟基于靶蛋白结构,通过分子对接技术模拟计算小分子化合物数据库与靶蛋白之间的相互作用,从海量小分子化合物分子中筛选出具有潜在活性的小分子化合物,该过程可以极大的加速药物研发的过程。
成药性分析算法(ADMET):主要是针对小分子化合物进行的一种分析,即未上市的药进行成药性分析:A-吸收;D-分布;M-代谢;E-分泌;T-毒性。
知识图谱算法(Knowledge Graph):通过自然语言处理(Natural LanguageProcessing,NLP)技术对行业内权威公开发表的文献进行爬取,从而更快更准确的从新冠病毒相关分析文献构建医药图谱,方便科研人员进行更深入的探索分析,大幅降低人工各处查找文献的时间。
4、交互展现层。
交互展现层的作用是通过可视化、知识图谱等形式,展现直观的分析结论和匹配度高的信息建议,为科研人员对未知领域的探索分析提供帮助支持。
数据可视化:新型冠状病毒的病毒蛋白以及药物分子化合物的三维结构可视化,可以很直观的看出分子对接的效果从而判断药物对病毒蛋白是否有效。
知识图谱:新型冠状病毒知识图谱利用图引擎技术获取所有权威科研机构公开发表的文献知识,全方位地涵盖了新冠病毒的基础属性,梳理病毒、基因、蛋白、药物等相关概念,为科研人员针对病毒的研究和抗病毒药物研发提供了更强力的工具。
数据对比分析:在科研人员利用知识图谱进行多线索的深入探索分析过程中,每种线索的逐跳分析,系统会利用该线索下行业专家探索经验的指标来自动智能对比呈现关键信息,辅助科研人员快速决策,加速探索过程。
基于如图1所提供的系统和如图2所提供的装置,以下对本申请实施例所提供的多尺度数据分析方法进行详细说明,需要首先说明的是,本申请实施例所提供的方法不仅限于下文所公开的使用场景,还可以适用于其他领域。只要涉及对多个事物进行关联分析,以及对某个领域的探索分析发现。均可以通过本申请实施例所提供的方法进行实现,对此本申请实施例并不进行限定。
请参阅图3,如图3所示,本申请实施例所提供的多尺度数据分析方法的实施例一包括以下步骤。
301、获取多个第一样本与多个第二样本的结合参数。
本实施中,结合参数用于表示多个第一样本与多个第二样本两两之间的结合情况。可选地,第一样本为药物分子,第二样本为病毒蛋白,例如新型冠状病毒(SARS-CoV-2),结合参数为药物分子与病毒蛋白的结合能,结合能用于表示药物分子与病毒蛋白的结合情况。
具体工作过程中,组成新型冠状病毒(SARS-CoV-2)的病毒蛋白至少有13种,每种病毒蛋白称为一个靶点蛋白,若某种药物与新冠病毒的某一个靶点蛋白结合情况较好,则该药物则具有治疗新冠病毒的可能。因此为了研究可能治愈新冠病毒药物,需要研究多种药物与上述13种靶点蛋白的结合情况。
在上述步骤301之前,首先本地数据库或网络爬取可能治疗新冠肺炎的备选药物分子,通过计算机模拟和AI训练模型模拟备选药物分子分别与新型冠状病毒13种病毒蛋白的结合情况。从而得到多个备选药物分子与13种病毒蛋白两两之间的结合能(BindingEnergy)。结合能是指两个或多个粒子结合成更大的微粒释放的能量,或相应的微粒分解成原来的粒子需要吸收的能量,这两种表述是等价的。本申请实施例中结合能特指病毒蛋白与药物分子结合的能量,数值越低结合能越高,药物分子对病毒蛋白的作用越大。因此,可以通过结合能来量化药物分子和病毒蛋白的结合情况,提供精确的指标作为继续深入研究的依据。
需要说明的是,上述使用场景只是一种举例,并不能构成对本申请所提供方法使用场景的限定,在具体工作过程中,第一样本和第二样本分别可以是其他药物与其他病毒蛋白,或者,第一样本与第二样本可以是其他任意能够互相结合的样本或参数,对此本申请实施例并不进行限定,为便于理解,本申请实施例以第一样本为药物分子,第二样本为病毒蛋白,例如新型冠状病毒(SARS-CoV-2),结合参数为药物分子与病毒蛋白的结合能为例进行详细说明。
302、将结合参数显示在目标表格上。
本实施例中,可选地,该目标表格可以为二维热力图。目标表格的行标题用于记录多个第一样本的信息,目标表格的列标题用于记录多个第二样本的信息;目标表格包括多个单元格,其中,每个单元格用于表示单元格行标题的第一样本与单元格列标题中的第二样本的结合参数。
可选地,在病毒蛋白的使用场景下,如图4所示,目标表格的行标题401用于记录药物分子的信息;目标表格的列标题402用于记录病毒蛋白的信息。目标表格中包括多个单元格403,每个单元格403用于表示单元格行标题401的药物分子与单元格列标题402中的病毒蛋白的结合能,其中,每个单元格403中可以通过热力图、色块、圆点或数值等形式来表现结合能的数值,例如,如目标表格的图例404所示,单元格通过色块的方式展示,结合能越高,所对应单元格403的色块颜色就越深。从而用户可以通过图4所展示的目标表格,直观地看到多个药物分子与多个病毒蛋白的结合能情况。从而克服了现有技术中一次只能模拟单个药物分子与单个病毒蛋白对接的情形,提升了药物分子与病毒蛋白结合的模拟和展示效率。
可选地,在目标表格上,还可以根据结合参数的数值大小,对列标题402记录的第二样本进行排序。例如图4所示的目标表格中,根据药物分子与病毒蛋白结合能的大小,对行标题401的药物分子进行降序排列:药物分子中与各个病毒蛋白结合能总和最高的一个位于第一行,从而使得用户能够快速地筛选到最有可能对病毒蛋白产生作用的药物分子。
需要说明的是,对于药物分子与病毒蛋白的结合情况而言,结合能只是一个衡量的参数,科研人员还需要进一步观察药物分子与病毒蛋白结合的具体三维结构才能判断药物分子与病毒蛋白的结合情况。如图4的目标表格中包含多组药物分子与病毒蛋白的结合关系,为便于用户检索药物分子与病毒蛋白的结合情况,本申请实施例进一步提供以下步骤。
303、当检测到用户对目标表格中的目标行执行预设操作时,在目标行的上方显示列标题。
本实施例中,可选地,该目标操作可以为鼠标的点击操作或鼠标悬停操作。例如图5所示,当用户将鼠标悬浮在第一行的行标题处时,在在第一行的上方显示列标题501,该列标题501记录有每个病毒蛋白分别与第一行的行标题所记录药物分子结合的三维结构图。从而用户可以通过上述操作,一次性查看同一药物分子分别与各个病毒蛋白结合的三维结构图,可选地,各个三维结构图的下方还显示有每个病毒蛋白的名称,以及,具体的结合能数值。以使得用户能够直观地同时看到第一行对应的药物分子与各个病毒蛋白结合的三维结构图和结合能。
同理,若用户将鼠标悬浮在目标表格的第N行,在紧挨着第N行的上方显示上述列标题。可选地,也可以在紧挨着第N行的下方显示列标题。通过此种方式,对于非常长的目标表格,用户不需要在每一行都重新返回表格头部去查看对应的列标题,提高了用户的检索效率,同时能够直观地看到每个药物分子分别与每个病毒蛋白结合情况。
304、当检测到用户对目标表格中的目标列执行预设操作时,在目标列的左侧或右侧显示行标题。
本实施例中,可选地,该目标操作可以为鼠标的点击操作或鼠标悬停操作。例如图6所示,当用户将鼠标悬浮在第一列的列标题处时,在第一列的左侧或右侧显示行标题601,该行标题601记录有每个药物分子分别与第一列的列标题所记录病毒蛋白结合的三维结构图。从而用户可以通过上述操作,一次性查看同一病毒蛋白分别与各个药物分子结合的三维结构图,可选地,各个三维结构图的一侧还可以显示有每个药物分子的名称和分子结构图,以及,具体结合能数值。以使得用户能够直观地看到药物分子与病毒蛋白的结合情况。
同理,若用户将鼠标悬浮在目标表格的第N列,在紧挨着第N列的左侧或右侧显示上述行标题。通过此种方式,对于非常宽的目标表格,用户不需要在每一列都重新返回表格左侧去查看对应的行标题,提高了用户的检索效率,同时能够直观地看到每个病毒蛋白分别与每个药物分子的结合情况。
本实施例中,经过上述步骤,使得用户能够在目标表格中直观且详细的了解多个药物分子与多个病毒蛋白的结合情况,从而实现了多尺度的数据分析。当用户将鼠标悬停在行标题上时,在当前行上刷新显示列标题,从而实现目标表格的横向交互。当用户将鼠标悬停在列标题上时,在当前列上刷新显示行标题,从而实现目标表格的纵向交互。从而答复提高了用户的检索效率。
需要说明的是,基于上述目标表格,用户可以筛选出一些感兴趣的结合体进行进一步的研究,从而更详细地判断该结合体中药物分子与病毒蛋白的结合情况,实现更加深入的检索。具体通过以下步骤来实现。
305、当获取到用户对目标单元格的选择操作时进入第二界面。
本实施例中,目标单元格为目标表格中的一个单元格,第二界面为目标表格所在第一界面的子界面。例如,如图4所示的目标表格中,多个单元格通过色块的方式,展示了行标题所对应药物分子与列标题所对应病毒蛋白的结合能。当用户对某一组药物分子与病毒蛋白的结合情况感兴趣时,点击对应的单元格,即可进入第二界面,对特定药物分子与病毒蛋白结合的详细情况进行深入探索。
306、在第二界面中显示目标药物分子与目标病毒蛋白结合的三维结构图。
本实施例中,目标药物分子为目标单元格对应行标题所记录的药物分子,病毒蛋白为目标单元格对应列标题所记录的病毒蛋白。例如,如图7所示,在如图7所示的第二界面下,能够清楚的看到目标药物分子与目标病毒蛋白结合的三维结构图700,用户可以通过该三维结构图查看药物分子与病毒蛋白对接的详细结果。用户可对三维结构图700进行旋转和缩放查看对接细节;系统响应鼠标滚动或触摸屏手势触摸滑动等交互事件,调用后台分析数据实时响应三维图形对旋转和缩放。
可选地,在第二界面下,除了显示药物分子与病毒蛋白的三维结合图700以外,还可以显示更多的详细信息,例如,701是所有病毒蛋白与该药物分子结合能列表,点击可逐个切换;702区域是病毒蛋白与药物分子对接效果的各项指标展示;703区域是药物分子的基本属性信息辅助科研人员初步了解该药物特征;704区域是该药物的详细信息入口,用户可通过点击704区域进一步了解该药物的详细信息。
进一步地,基于图7所示的界面,用户可以在该第二界面下直接切换显示其他药物分子与其他病毒蛋白的结合详情,而不需要退回到如图4所示的第一界面重新操作,具体包括以下两种方式。
方式一、第二界面中还包括第一列表,第一列表用于记录目标药物分子与列标题中每个病毒蛋白的结合能。
本实施例中,该第一列表即为图7中所示的所有病毒蛋白与该药物分子结合能列表701,对于该第一列表,可以执行以下步骤。
307、当获取到用户对第一列表中第一单元格的选择操作时,在第二界面中显示目标药物分子与第一单元格所对应病毒蛋白结合的三维结构图。
本实施例中,第一单元格为第一列表中的一个单元格。用户通过在如图7所示的第一列表701中点击某一病毒蛋白,从而能够在第二界面中刷新显示所选中的病毒蛋白与当前药物分子结合的三维结构图。
方式二、第二界面中还包括第二列表,第二列表用于记录目标病毒蛋白与行标题中每个药物分子的结合能。
本实施例中,如图8所示,第二列表801为当前病毒蛋白与所有药物分子对接按照结合能高低排序的列表,同时该第二列表中显示有结合能的具体数值。用户点击可逐个切换,看到当前病毒蛋白与每一药物分子结合的三维结构图。具体通过以下步骤来实现。
308、当获取到用户对第二列表中第二单元格的选择操作时,在第二界面中显示目标病毒蛋白与第二单元格所对应药物分子结合的三维结构图。
本实施例中,第二单元格为第二列表中的一个单元格。户通过在如图8所示的第二列表801中点击某一药物分子,从而能够在第二界面中刷新显示所选中药物分子的与当前病毒蛋白结合的三维结构图。
通过上述步骤307和步骤308,用户可以在该第二界面下直接切换显示其他药物分子与其他病毒蛋白的结合详情,而不需要退回到如图4所示的第一界面重新操作,切换的方式可以如步骤307:保持药物分子不变,查看同一药物分子与不同病毒蛋白的三维结合图;也可以如步骤308:保持病毒蛋白不变,查看同一病毒蛋白与不同药物分子的三维结合图。可选地,在第二界面中也可以同时包括图7中所示的第一列表和图8中所示的第二列表,从而用户可以在第二界面下同时对第一列表和第二列表进行调整。实现了数据的多尺度分析,从而提升了检索的效率。
需要说明的是,在如图7和图8所示的界面下,均包含一个该药物的详细信息入口,通过该入口,用户可以进一步了解三维结合图像中与病毒蛋白结合药物分子的详细信息,从而对可能治疗新冠病毒的药物分子进行更进一步的详细探索。用户可以通过鼠标点击或滑动等方式进入药物的详细信息入口,进一步执行以下步骤。
309、根据用户输入的预设操作进入第三界面。
本实施中,进入第三界面的方式,可以是在如图7或图8中点击药物的详细信息入口,也可以是通过其他的操作方式,对此本申请实施例并不进行限定。
310、在第三界面中显示第一知识图谱。
本实施例中,请参阅图9,如图9所示,第一知识图谱901包括第一核心节点9011,以及与第一核心节点9011连接的至少一个第一子节点9012,第一核心节点9011用于记录第一药物分子的信息,第一药物分子为行标题所记录的任意一个药物分子,在本实施例中,作为一种举例,用户在第二界面下研究了第一药物分子与病毒蛋白的结合情况,则在第三界面下,第一核心节点9011记录了第一药物分子的信息。第一子节点9012用于记录的信息包括:第一药物分子的副作用、第一药物分子可治疗的第一病症、第一药物分子可作用的第一病毒蛋白或者第一药物分子可作用的第一人类蛋白中的至少一种。
本实施例中,如图9所示的第一知识图谱901包括一个第一核心节点9011和五个第一子节点9012,其中,第一核心节点9011用于记录第一药物分子的信息,与第一核心节点9011连接的五个子节点分别用于记录第一药物分子的副作用、第一药物分子可治疗的第一病症、第一药物分子可作用的第一病毒蛋白以及第一药物分子可作用的第一人类蛋白。从而用户可以根据第一知识图谱901,知晓第一药物分子的详细情况。知识图谱表现形式包括但不限于原点、圆环、球体等形式。同时,在第三界面中,在第一知识图谱901的一侧还显示有一个面板,该面板用于显示第一药物分子的所有公开科研文献信息及出处。这些第一药物分子的所有公开科研文献信息及出处,可以是存储在本地数据库中的数据,也可以是系统通过自然语言处理(Natural Language Processing,NLP)技术在线爬取获得的。对此本申请实施例并不进行限定。
可选地,图9所示的界面中还包括展示卡片902,该展示卡片902用于展示第一药物分子的详细信息,展示卡片902的上方包括一个筛选按钮9021,用户可以通过该筛选按钮9021将当前第一药物分子添加为筛选项,从而保存了筛选的结果。
进一步地,图9所示的界面中还包括目录框903,该目录框903的作用与该第一知识图谱相同,通过目录的形式展示了第一知识图谱中的内容,从而能够迎合用户的不同的阅读习惯。
基于图9所示的第三界面,用户能够通过第一知识图谱901看到第一药物分子的副作用、第一药物分子可治疗的第一病症、第一药物分子可作用的第一病毒蛋白以及第一药物分子可作用的第一人类蛋白五个线索,此时,基于这五个线索,用户可以进一步探索自己兴趣的信息。例如,用户选择了目标子节点,该目标子节点用于记录第一药物分子可作用的第一病毒蛋白。则此时,允许用户对第一病毒蛋白进行进一步的探索,具体步骤如下。
311、当获取到用户选择目标第一子节点的选择操作时进入第四界面。
本实施例中,目标第一子节点为与第一核心节点连接的至少一个第一子节点中的一个,例如,目标第一子节点为记录有第一药物分子可作用的第一病毒蛋白的节点。则选地,用户的选择操作可以是鼠标点击,键盘确认,或者触屏界面下的点击操作等,对此本申请实施例并不进行限定。
312、在第四界面中的第一区域显示第二知识图谱。
本实施例中,第二知识图谱包括第二核心节点,以及与第二核心节点连接的至少一个第二子节点,第二核心节点用于记录目标第一子节点所记录的信息,第二子节点用于记录至少一个关联药物,关联药物能够治愈目标第一子节点所记录的第一病症,或者,关联药物能够与目标第一子节点所记录的第一病毒蛋白作用,或者,关联药物可作用于目标第一子节点所记录的第一人类蛋白。
例如,用户在第三界面中点击的目标第一子节点为第一药物分子可作用的第一病毒蛋白,则如图10所示的第四界面中,在第二知识图谱1001的第二核心节点10011记录该第一病毒蛋白。与第二核心节点10011连接的至少一个第二子节点10012分别用于记录现有文献中能够治疗该第一病毒蛋白的药物分子信息。由于在第二界面中(即图7或图8所示的界面),用户已经发现第一药物分子与新冠病毒具有较好的结合效果,已知第一药物分子可用于治疗第一病毒蛋白,而第二子节点10012中所记录的药物分子同样能够用于治疗第一病毒蛋白,从而可以推测,关联药物同样有治疗新冠病毒的可能性。则此时,第二子节点10012中所记录的药物分子与第一药物分子构成关联药物。
进一步地,在第四界面中,依然显示第一药物分子的详细信息卡片1002,原因在于当前第四界面是对第一药物分子的深度探索,因此依然显示第一药物分子的信息,以使得用户能够知晓探索路径的情况。
313、在第四界面中的第二区域显示排序表。
本实施例中,请参阅图10,如图10所示,排序表1003用于根据关联药物与第一药物分子的相似度对关联药物进行排序;排序表1003中显示有每个关联药物与第一药物分子的相似度数值;第四界面中的第一区域与第四界面中的第二区域为相邻区域。
虽然同样都能用于治疗第一病毒蛋白,但关联药物与第一药物分子毕竟有一定差异,用户通过排序表1003可以知晓关联药物与第一药物分子的差异情况,找到与第一药物分子相似度最高的关联药物。
需要说明的是,排序表1003上方显示有设置按钮1003a,用户通过该设置按钮可以对具体的排序规则进行设置,例如,可以根据药物分子结构的相似度进行排序,也可以根据药物所能治疗疾病的相似度进行排序,还可以根据药物副作用的相似度进行排序等等。在具体工作过程中,系统可以学习用户对于排序规则的喜好,按照用户所偏爱的排序规则对关联药物的相似度进行排序。例如,在前序的检索中,用户多次选择根据药物所能治疗疾病的相似度进行排序,则系统默认选择此项标准对当前关联药物进行排序。
314、当获取到用户在排序表中选择第一关联药物的选择操作时,在第四界面的第三区域显示第一关联药物的详细信息。
本实施例中,第一关联药物为至少一个关联药物中的一个,第四界面的第三区域与第四界面中的第二区域为相邻区域。如图10所示,当用户在排序表1003中选择了感兴趣的第一关联药物时,第四界面弹出展示卡片1004,该展示卡片1004中显示第一关联药物的详细信息。从而使得用户可以对第一关联药物进行深入的了解。
本实施例中,如图10所示,展示卡片1004的上方包括一个探索按钮1004a,用户点击该按钮可以进入一个新的界面如图11所示,该新的界面下展示一个新的知识图谱,该知识图谱用于表示第一关联药物所能够治疗的各种病毒蛋白,该知识图谱的具体工作方式与前述知识图谱相同,可参阅前述记载,此处不再赘述。在图11所示的界面中,除了新的知识图谱,还显示有第一展示卡片1101和第二展示卡片1102,该第一展示卡片1101用于显示当前第一关联药物的详细信息,该第二展示卡片1102用于显示第一药物分子的详细信息,以使得用户可以比对两种药物之间的详细区别。在展示卡片1101的上方设置有一个筛选按钮1101a,通过该按钮,用户可以将当前第一关联药物设置为筛选项,具体工作方式如下。
需要说明的是,图11中左边还显示有知识图谱和排序表,该知识图谱和排序表的具体工作方式与图10相同。具体可参阅前述关于图10的记载,此处不再赘述。
315、当获取到用户将第一关联药物添加为筛选项的确认操作时,存储第一关联药物的药物信息,以及,用户通过第一知识图谱和第二知识图谱获取到第一关联药物的第一路径信息。
本实施例中,通过图11所示的界面,用户可以看到第一关联药物的详细信息,若用户对该第一关联药物感兴趣,则用户可以通过点击第一展示卡片1101上方的筛选按钮1101a,即可将第一关联药物设置为筛选项,此时,系统存储第一关联药物的详细信息,包括与该第一关联药物相关的文献信息等。同时,系统需要存储用户筛选到该第一个关联药物的第一路径信息,在本实施例的举例中,第一关联药物的筛选路径为:新冠病毒中的目标病毒蛋白->第一药物分子->第一病毒蛋白->第一关联药物。从而通过该第一路径,用户能够回忆起自己检索到该第一关联药物的路径,能够通过第一路径信息记录探索第一关联药物过程中的检索思路。
本实施例中,通过上述知识图谱的方式,实现了数据分析过程中多线索探查分析的联动可视化,基于知识图谱每个线索(实体)的深入探查都会按照与目标配体药物分子和受体病毒及病毒蛋白强相关的指标进行智能排序推荐,信息呈现自动提取关键的同类项特殊处理(高亮)显示。一方面提高了信息检索的效率,另一方面使得信息检索的过程更加直观。
316、根据用户输入的预设操作进入第五界面。
本实施例中,如图12所示,第五界面为用户存储筛选结果的汇总界面。用户可以通过第五界面,查看之前筛选的所有关联药物。
317、在第五界面中的第一区域显示至少一个筛选关联药物的信息。
本实施例中,至少一个筛选关联药物为用户通过知识图谱筛选出的与第一药物分子相似的药物,例如,筛选关联药物可以为前述步骤中所筛选得到的第一关联药物。
如图12所示,在第五界面的第一区域1201,显示有筛选关联药物的分子结构图、药物名称、药物族群以及药物类型等等信息。这些信息即为步骤315中系统所存储的关于关联药物的详细信息。以使得用户能够直观地看过所筛选出的关联药物。
318、在第五界面中的第一区域显示至少一个筛选关联药物的检索路径。
本实施例中,检索路径为用户通过知识图谱获取筛选关联药物的筛选路径。如图12所示,在每个关联药物的详细信息后面的第二区域1202,进一步显示了当前关联药物的筛选路径,这些信息即为步骤315中系统所存储的关于关联药物的路径信息。通过该这些路径信息,用户能够回忆起自己检索到该关联药物的路径,能够通过路径信息记录探索关联药物过程的检索思路。
进一步地,用户还可以点击筛选路径中的具体节点,系统响应用户的点击操作,展示用户所选择节点下的具体界面,例如,在上述举例中,第一关联药物的筛选路径为:新冠病毒中的目标病毒蛋白->第一药物分子->第一病毒蛋白->第一关联药物。当用户点击节点:“第一药物分子”时,系统向用户展示如图9所示的第三界面,从而用户可以通过第三界面中的第一知识图谱了解到第一药物分子的详细信息。同时,用户还可以基于第一路径信息对第一关联药物进行更深入的探索。
本实施例中,通过上述第五界面,实现了探索结果的存储,第五界面的存储包含探索路径等多维结果的探索分析存储方式,既要存储用户探索选中的实体又要存储用户找到该实体的探索路径,显示用户筛选出该药物的探索分析路径有助于持续探索不中断。
可选地,当用户回到如图4所示的目标表格时,对于已经添加到第五界面中的药物分子,在图4的行标题402中会所有标记,如图4所示,行标题402的药物分子前方标记有爱心形状的即为已经添加到第五界面中的筛选药物。从而有利于用户在检索过程中知晓自己之前执行的筛选操作。
本申请实施例所提供的多尺度数据分析方法,包括:获取多个第一样本与多个第二样本的结合参数,结合参数用于表示多个第一样本与多个第二样本两两之间的结合情况;将结合参数显示在目标表格上,目标表格的行标题用于记录多个第一样本的信息,目标表格的列标题用于记录多个第二样本的信息;目标表格包括多个单元格,其中,每个单元格用于表示单元格行标题的第一样本与单元格列标题中的第二样本的结合参数。从而通过电子表格的方式,系统展示了多个样本之间的结合情况,方便用户对样本之间的结合情况进行高效的检索分析。
上述对本申请实施例所提供多尺度数据分析方法进行了详细的介绍,在具体工作过程中,本申请实施例所提供的多尺度数据分析方法通过软件进行实现,为便于理解,以下以新冠病毒的药物筛选为例,结合附图对本申请方法在软件UI界面中(即用户一侧)的操作流程进行详细说明。
请参阅图13,如图13所示,本申请实施例所提供多尺度数据分析方法的实施例二包括以下步骤。
1301、用户进入分子对接热力图界面。
本实施例中,分子对接热力图界面即为如图4所示的第一界面。关于该界面的具体工作方式可参阅上述关于图4的记载,此处不再赘述。
1302、用户查看系统只能筛选出的药物清单与新冠病毒所有蛋白的结合情况。
本实施例中,药物清单与新冠病毒所有蛋白的结合情况,展示在第一界面的目标表格中,即图4所示的表格。关于该目标表格的具体展示方式,可参阅上述关于图4的记载,此处不再赘述。
1303、用户通过鼠标移动至热力图的X轴或Y轴。
本实施例中,Y轴即为图4中目标表格的行标题,用于记录药物分子的信息;X轴即为图4中目标表格的列标题,用于记录病毒蛋白的信息。用户将鼠标悬停在Y轴或X轴某一药物分子或某一病毒蛋白上,触发一下步骤。其中,当用户将鼠标悬停在Y轴的某一药物分子上,触发步骤1304,当用户将鼠标悬停在X轴的某一病毒蛋白上,触发步骤1305。
1304、用户查看目标药物分子与所有病毒蛋白的结合情况。
本实施例中,目标药物分子为用户鼠标在Y轴上所悬停的药物分子,该步骤1304的具体实现方式可参阅上述图5所示的界面。关于该本步骤的具体展示方式,可参阅上述关于图5的记载,此处不再赘述。
1305、用户查看目标病毒蛋白与所有药物分子的结合情况。
本实施例中,目标药物分子为用户鼠标在X轴上所悬停的病毒蛋白,该步骤1305的具体实现方式可参阅上述图6所示的界面。关于该本步骤的具体展示方式,可参阅上述关于图6的记载,此处不再赘述。
1306、用户点击热力图中的单元格方块。
本实施例中,热力图中的单元格方块即为图4中所示目标表格中的单元格,热力图中的每个单元格方块代表一个药物分子与一个病毒蛋白结合的结合能信息,具体可参阅上述关于图4的记载,此处不再赘述。
1307、用户在第二界面中查看目标药物分子与目标病毒蛋白对接的详细信息。
本实施例中,若用户对目标药物分子与目标病毒蛋白对接的情况感兴趣,可以通过点击对应的单元格方块进入第二界面,第二界面中显示目标药物分子与目标病毒蛋白对接的详细信息,该界面下的具体显示方式如图7所示,本步骤的具体展示方式,可参阅上述关于图7的记载,此处不再赘述。
进一步地,在第二界面下,用户确认第二界面的显示信息是否有误,若无误,则进一步执行后续探索,若有误,则排除当前数据,结束软件流程。
需要说明的是,通过步骤1307至1307,用户实现了对药物分子的筛选,接下来用户需要进入第三界面,对药物分子进行深入的探索。为便于理解,以下结合附图,对后续工作步骤的软件流程进行详细说明。
请参阅图14,如图14所示,本申请实施例所提供多尺度数据分析方法的实施例三包括以下步骤。
1401、用户进入关于第一药物分子的详情界面。
本实施例中,第一药物分子为用户在图4所示的目标表格中通过热力图单元格选择的药物分子。第一药物分子的详情界面即为如图9所示的第三界面,以实现用户的第一药物分子的深入探索。
1402、用户通过第一知识图谱查看与第一药物分子相关的五类信息。
本实施例中,第一知识图谱的具体实现方式如图9所示,可参阅上述关于图9的相关记载,此处不再赘述。
1403、用户确认第一知识图谱的五类信息是否与新冠病毒相冲突。
本实施例中,第一药物分子是可能质量新冠病毒的药物分子,若通过第一知识图谱,发现当前第一药物分子的详细信息与新冠病毒的治疗相冲突,说明第一药物分子实际上不适用于新冠病毒的治疗。则此时执行步骤1404、排除当前数据。若不冲突,则进一步执行后续步骤。
1405、用户在第一知识图谱中选择感兴趣的子节点,进入第二知识图谱所在界面。
本实施例中,与核心节点连接的子节点用于记录与第一药物分子相关的信息,包括第一药物分子的副作用、第一药物分子可治疗的第一病症、第一药物分子可作用的第一病毒蛋白或者第一药物分子可作用的第一人类蛋白等等。用户选择感兴趣的子节点,从而进行更深入的探索。
1406、用户在第二知识图谱中选择感兴趣的子节点,进入关于该子节点的详情界面。
本实施例中,第二知识图谱是用户进一步探索的知识图谱,例如用户在第一图谱中选择了第一药物分子可作用的第一病毒蛋白,则第二知识图谱的核心节点为第一病毒蛋白。第二知识图谱的子节点用于记录能够治疗第一病毒蛋白的药物。具体实现方式可参阅上述关于图10的相关记载,此处不再赘述。
需要说明的是,在用户探索的过程中,每进入一个新的知识图谱,都需要判断是否存在与新冠病毒冲突的信息,在步骤1406中。若有,则执行步骤1407、排除当前数据;若无,则继续后续步骤。
1408、用户从子节点的详情界面选择第一关联药物。
本实施例中,该子节点为能够治疗第一病毒蛋白的药物,具体界面可参阅上述图11,通过图11所示的界面,用户可以了解到第一关联药物的详细信息,具体实现方式可参阅前述图11的相关记载,此处不再赘述。
1409、用户将第一关联药物添加到筛选页面。
本实施例中,用户在图11的界面中将第一关联药物添加到筛选页面,从而可以在如图12所示的第五界面中查看到所筛选出的药物分子和该药物分子的筛选路径,本步骤的具体实现方式可参阅前述关于图11的相关记载,此处不再赘述。
本申请实施例所提供的多尺度数据分析方法,通过上述图13和图14所记载的步骤。使得用户能够在一个界面中系统了解多个样本之间的结合情况,并对其中的某些样本进行更深入的探索研究。方便用户对样本之间的结合情况进行高效的检索分析。
上面介绍了本申请实施例提供的多尺度数据分析方法,下面对实现该方法的装置进行介绍,请参阅图15,为本申请实施例中多尺度数据分析装置的一个实施例示意图。
如图15所示,本申请实施例所提供的多尺度数据分析装置,包括:
获取单元1501,用于获取多个第一样本与多个第二样本的结合参数,所述结合参数用于表示所述多个第一样本与所述多个第二样本两两之间的结合情况;
展示单元1502,用于将所述结合参数显示在目标表格上,所述目标表格的行标题用于记录所述多个第一样本的信息,所述目标表格的列标题用于记录所述多个第二样本的信息;所述目标表格包括多个单元格,其中,每个单元格用于表示所述单元格行标题的第一样本与所述单元格列标题中的第二样本的结合参数。
可选地,该展示单元1502,还用于:
根据该结合参数的数值大小,对该列标题记录的第二样本进行排序。
可选地,该第一样本为药物分子,该第二样本为病毒蛋白,该结合参数为该药物分子与该病毒蛋白的结合能,该结合能用于表示该药物分子与该病毒蛋白的结合情况;
该行标题用于记录该药物分子的信息;
该列标题用于记录该病毒蛋白的信息。
可选地,该展示单元1502还用于:
当检测到用户对该目标表格中的目标行执行预设操作时,在该目标行的上方显示该列标题,该列标题记录有每个病毒蛋白分别与该目标行的行标题所记录药物分子结合的三维结构图;和/或:
当检测到用户对该目标表格中的目标列执行预设操作时,在该目标列的左侧或右侧显示该行标题,该行标题记录有每个药物分子分别与该目标列的列标题所记录病毒蛋白结合的三维结构图。
可选地,该装置还包括:
执行单元1503,用于当获取到用户对目标单元格的选择操作时进入第二界面,该目标单元格为该目标表格中的一个单元格,该第二界面为该目标表格所在第一界面的子界面;
该展示单元1502,还用于在该第二界面中显示目标药物分子与目标病毒蛋白结合的三维结构图,该目标药物分子为该目标单元格对应行标题所记录的药物分子,该病毒蛋白为该目标单元格对应列标题所记录的病毒蛋白。
可选地,该第二界面中还包括第一列表,该第一列表用于记录该目标药物分子与该列标题中每个病毒蛋白的结合能,该展示单元1502还用于:
当获取到用户对该第一列表中第一单元格的选择操作时,在该第二界面中显示该目标药物分子与该第一单元格所对应病毒蛋白结合的三维结构图,该第一单元格为该第一列表中的一个单元格;和/或,
该第二界面中还包括第二列表,该第二列表用于记录该目标病毒蛋白与该行标题中每个药物分子的结合能,该展示单元1502还用于:
当获取到用户对该第二列表中第二单元格的选择操作时,在该第二界面中显示该目标病毒蛋白与该第二单元格所对应药物分子结合的三维结构图,该第二单元格为该第二列表中的一个单元格。
可选地,该执行单元1503还用于:
根据用户输入的预设操作进入第三界面;
该展示单元1502还用于,在该第三界面中显示第一知识图谱,该第一知识图谱包括第一核心节点,以及与该第一核心节点连接的至少一个第一子节点,该第一核心节点用于记录第一药物分子的信息,该第一药物分子为该行标题所记录的任意一个药物分子;该第一子节点用于记录的信息包括:该第一药物分子的副作用、该第一药物分子可治疗的第一病症、该第一药物分子可作用的第一病毒蛋白或者该第一药物分子可作用的第一人类蛋白中的至少一种。
可选地,该执行单元1503,还用于:
当获取到用户选择目标第一子节点的选择操作时进入第四界面,该目标第一子节点为与该第一核心节点连接的至少一个第一子节点中的一个;
该展示单元1502还用于,在该第四界面中的第一区域显示第二知识图谱,该第二知识图谱包括第二核心节点,以及与该第二核心节点连接的至少一个第二子节点,该第二核心节点用于记录该目标第一子节点所记录的信息,该第二子节点用于记录至少一个关联药物,该关联药物能够治愈该目标第一子节点所记录的该第一病症,或者,该关联药物能够与该目标第一子节点所记录的该第一病毒蛋白作用,或者,该关联药物可作用于该目标第一子节点所记录的该第一人类蛋白;
在该第四界面中的第二区域显示排序表,该排序表用于根据该关联药物与该第一药物分子的相似度对该关联药物进行排序;该排序表中显示有每个关联药物与该第一药物分子的相似度数值;该第四界面中的第一区域与该第四界面中的第二区域为相邻区域。
可选地,该展示单元1502还用于,
当获取到用户在该排序表中选择第一关联药物的选择操作时,在该第四界面的第三区域显示该第一关联药物的详细信息,该第一关联药物为该至少一个关联药物中的一个,该第四界面的第三区域与该第四界面中的第二区域为相邻区域;
该执行单元1503还用于,当获取到用户将该第一关联药物添加为筛选项的确认操作时,存储该第一关联药物的药物信息,以及,用户通过该第一知识图谱和该第二知识图谱获取到该第一关联药物的第一路径信息。
可选地,该执行单元1503还用于:
根据用户输入的预设操作进入第五界面;
该展示单元1502还用于,在该第五界面中的第一区域显示至少一个筛选关联药物的信息,该至少一个筛选关联药物为用户通过知识图谱筛选出的与该第一药物分子相似的药物;
在该第五界面中的第一区域显示该至少一个筛选关联药物的检索路径,该检索路径为用户通过该知识图谱获取该筛选关联药物的筛选路径。
本发明实施例还提供了另一种终端,如图16所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端(point of sales,POS)、车载电脑等任意终端设备,以终端为手机为例:
图16示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图16,手机包括:射频(radio frequency,RF)电路1610、存储器1620、输入单元1630、显示单元1640、传感器1650、音频电路1660、无线保真(wireless fidelity,WiFi)模块1670、处理器1680、以及电源1690等部件。本领域技术人员可以理解,图16中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图16对手机的各个构成部件进行具体的介绍:
RF电路1610可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1680处理;另外,将设计上行的数据发送给基站。通常,RF电路1610包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路1610还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
在具体工作过程中,终端通过RF电路1610来获取多个第一样本与多个第二样本的结合参数等信息。
存储器1620可用于存储软件程序以及模块,处理器1680通过运行存储在存储器1620的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在具体工作过程中,终端通过RF电路1610所获取的获取多个第一样本与多个第二样本的结合参数等信息存储在存储器1620中。
输入单元1630可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1630可包括触控面板1631以及其他输入设备1632。触控面板1631,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1631上或在触控面板1631附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1631可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1680,并能接收处理器1680发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1631。除了触控面板1631,输入单元1630还可以包括其他输入设备1632。具体地,其他输入设备1632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
在具体工作过程中,用户通过输入单元1630来执行预设操作的输入。
显示单元1640可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1640可包括显示面板1641,可选的,可以采用液晶显示器(liquidcrystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板1641。进一步的,触控面板1631可覆盖显示面板1641,当触控面板1631检测到在其上或附近的触摸操作后,传送给处理器1680以确定触摸事件的类型,随后处理器1680根据触摸事件的类型在显示面板1641上提供相应的视觉输出。虽然在图16中,触控面板1631与显示面板1641是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1631与显示面板1641集成而实现手机的输入和输出功能。
在具体工作过程中,目标表格和三维结构图通过显示单元1640向用户展示。
手机还可包括至少一种传感器1650、音频电路1660、扬声器1661,传声器1662可提供用户与手机之间的音频接口。音频电路1660可将接收到的音频数据转换后的电信号,传输到扬声器1661,由扬声器1661转换为声音信号输出。
WiFi属于短距离无线传输技术,手机通过WiFi模块1670可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图16示出了WiFi模块1670,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1680是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1620内的软件程序和/或模块,以及调用存储在存储器1620内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1680可包括一个或多个处理单元。
具体工作过程中,处理器1680用于执行本申请实施例所提供的多尺度数据分析方法。
手机还包括给各个部件供电的电源1690(比如电池),优选的,电源可以通过电源管理系统与处理器1680逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本发明实施例中,该终端所包括的处理器1680还具有实现上述各手势交互方法的功能。
本申请实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得该计算机执行本申请实施例所述的多尺度数据分析方法。
本申请实施例第七方面提供了一种计算机可读存储介质,包括指令,当该指令在计算机上运行时,使得该计算机执行本申请实施例所述的多尺度数据分析方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (13)
1.一种多尺度数据分析方法,其特征在于,包括:
获取多个第一样本与多个第二样本的结合参数,所述结合参数用于表示所述多个第一样本与所述多个第二样本两两之间的结合情况;
将所述结合参数显示在目标表格上,所述目标表格的行标题用于记录所述多个第一样本的信息,所述目标表格的列标题用于记录所述多个第二样本的信息;所述目标表格包括多个单元格,其中,每个单元格用于表示所述单元格行标题的第一样本与所述单元格列标题中的第二样本的结合参数。
2.根据权利要求1所述的方法,其特征在于,所述将所述结合参数显示在目标表格上,包括:
根据所述结合参数的数值大小,对所述列标题记录的第二样本进行排序。
3.根据权利要求1或2所述的方法,其特征在于,所述第一样本为药物分子,所述第二样本为病毒蛋白,所述结合参数为所述药物分子与所述病毒蛋白的结合能,所述结合能用于表示所述药物分子与所述病毒蛋白的结合情况;
所述行标题用于记录所述药物分子的信息;
所述列标题用于记录所述病毒蛋白的信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当检测到用户对所述目标表格中的目标行执行预设操作时,在所述目标行的上方显示所述列标题,所述列标题记录有每个病毒蛋白分别与所述目标行的行标题所记录药物分子结合的三维结构图;和/或,
当检测到用户对所述目标表格中的目标列执行预设操作时,在所述目标列的左侧或右侧显示所述行标题,所述行标题记录有每个药物分子分别与所述目标列的列标题所记录病毒蛋白结合的三维结构图。
5.根据权利要求3或4所述的方法,其特征在于,所述将所述结合参数显示在目标表格上之后,还包括:
当获取到用户对目标单元格的选择操作时进入第二界面,所述目标单元格为所述目标表格中的一个单元格,所述第二界面为所述目标表格所在第一界面的子界面;
在所述第二界面中显示目标药物分子与目标病毒蛋白结合的三维结构图,所述目标药物分子为所述目标单元格对应行标题所记录的药物分子,所述病毒蛋白为所述目标单元格对应列标题所记录的病毒蛋白。
6.根据权利要求5所述的方法,其特征在于,所述第二界面中还包括第一列表,所述第一列表用于记录所述目标药物分子与所述列标题中每个病毒蛋白的结合能,所述方法还包括:
当获取到用户对所述第一列表中第一单元格的选择操作时,在所述第二界面中显示所述目标药物分子与所述第一单元格所对应病毒蛋白结合的三维结构图,所述第一单元格为所述第一列表中的一个单元格;和/或,
所述第二界面中还包括第二列表,所述第二列表用于记录所述目标病毒蛋白与所述行标题中每个药物分子的结合能,所述方法还包括:
当获取到用户对所述第二列表中第二单元格的选择操作时,在所述第二界面中显示所述目标病毒蛋白与所述第二单元格所对应药物分子结合的三维结构图,所述第二单元格为所述第二列表中的一个单元格。
7.根据权利要求3至6任一所述的方法,其特征在于,所述方法还包括:
根据用户输入的预设操作进入第三界面;
在所述第三界面中显示第一知识图谱,所述第一知识图谱包括第一核心节点,以及与所述第一核心节点连接的至少一个第一子节点,所述第一核心节点用于记录第一药物分子的信息,所述第一药物分子为所述行标题所记录的任意一个药物分子;所述第一子节点用于记录的信息包括:所述第一药物分子的副作用、所述第一药物分子可治疗的第一病症、所述第一药物分子可作用的第一病毒蛋白或者所述第一药物分子可作用的第一人类蛋白中的至少一种。
8.根据权利要求7所述的方法,其特征在于,所述在所述第三界面中的第一区域显示第一知识图谱之后,还包括:
当获取到用户选择目标第一子节点的选择操作时进入第四界面,所述目标第一子节点为与所述第一核心节点连接的至少一个第一子节点中的一个;
在所述第四界面中的第一区域显示第二知识图谱,所述第二知识图谱包括第二核心节点,以及与所述第二核心节点连接的至少一个第二子节点,所述第二核心节点用于记录所述目标第一子节点所记录的信息,所述第二子节点用于记录至少一个关联药物,所述关联药物能够治愈所述目标第一子节点所记录的所述第一病症,或者,所述关联药物能够与所述目标第一子节点所记录的所述第一病毒蛋白作用,或者,所述关联药物可作用于所述目标第一子节点所记录的所述第一人类蛋白;
在所述第四界面中的第二区域显示排序表,所述排序表用于根据所述关联药物与所述第一药物分子的相似度对所述关联药物进行排序;所述排序表中显示有每个关联药物与所述第一药物分子的相似度数值;所述第四界面中的第一区域与所述第四界面中的第二区域为相邻区域。
9.根据权利要求8所述的方法,其特征在于,所述在所述第四界面中的第二区域显示排序表之后,还包括:
当获取到用户在所述排序表中选择第一关联药物的选择操作时,在所述第四界面的第三区域显示所述第一关联药物的详细信息,所述第一关联药物为所述至少一个关联药物中的一个,所述第四界面的第三区域与所述第四界面中的第二区域为相邻区域;
当获取到用户将所述第一关联药物添加为筛选项的确认操作时,存储所述第一关联药物的药物信息,以及,用户通过所述第一知识图谱和所述第二知识图谱获取到所述第一关联药物的第一路径信息。
10.根据权利要求7至9任一所述的方法,其特征在于,所述方法还包括:
根据用户输入的预设操作进入第五界面;
在所述第五界面中的第一区域显示至少一个筛选关联药物的信息,所述至少一个筛选关联药物为用户通过知识图谱筛选出的与所述第一药物分子相似的药物;
在所述第五界面中的第一区域显示所述至少一个筛选关联药物的检索路径,所述检索路径为用户通过所述知识图谱获取所述筛选关联药物的筛选路径。
11.一种多尺度数据分析装置,其特征在于,包括:
获取单元,用于获取多个第一样本与多个第二样本的结合参数,所述结合参数用于表示所述多个第一样本与所述多个第二样本两两之间的结合情况;
展示单元,用于将所述结合参数显示在目标表格上,所述目标表格的行标题用于记录所述多个第一样本的信息,所述目标表格的列标题用于记录所述多个第二样本的信息;所述目标表格包括多个单元格,其中,每个单元格用于表示所述单元格行标题的第一样本与所述单元格列标题中的第二样本的结合参数。
12.一种终端,其特征在于,包括:处理器和存储器,
所述存储器用于存储指令;
所述处理器用于根据所述指令以执行如权利要求1至10中任一项所述的方法。
13.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在计算机上运行时,使得计算机执行如权利要求1至10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2021/102247 WO2022012298A1 (zh) | 2020-07-16 | 2021-06-25 | 一种多尺度数据分析方法、装置、终端及介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010690507 | 2020-07-16 | ||
CN202010690507X | 2020-07-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113948153A true CN113948153A (zh) | 2022-01-18 |
Family
ID=79327206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011263697.3A Pending CN113948153A (zh) | 2020-07-16 | 2020-11-12 | 一种多尺度数据分析方法、装置、终端及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113948153A (zh) |
WO (1) | WO2022012298A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108472359B (zh) * | 2015-08-19 | 2022-02-01 | 北京先通国际医药科技股份有限公司 | Trail受体结合剂及其用途 |
US20180259533A1 (en) * | 2015-09-09 | 2018-09-13 | Somalogic, Inc. | Methods for developing personalized drug treatment plans and targeted drug development based on proteomic profiles |
CN109559831A (zh) * | 2018-10-26 | 2019-04-02 | 山东省立医院 | 一种基于抗癌药物临床实验数据的疗效评价方法 |
CN110890159A (zh) * | 2019-11-23 | 2020-03-17 | 潍坊学院 | 一种利用Excel函数进行抗菌药物组合效应评价的方法 |
-
2020
- 2020-11-12 CN CN202011263697.3A patent/CN113948153A/zh active Pending
-
2021
- 2021-06-25 WO PCT/CN2021/102247 patent/WO2022012298A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022012298A1 (zh) | 2022-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9317567B1 (en) | System and method of computational social network development environment for human intelligence | |
CN109643304A (zh) | 交互式图形表示中显示商标查询检索结果的系统和方法 | |
CN110019825B (zh) | 一种分析数据语义的方法及装置 | |
Desimoni et al. | Empirical evaluation of linked data visualization tools | |
CN111368063B (zh) | 一种基于机器学习的信息推送方法以及相关装置 | |
Meschenmoser et al. | Scraping scientific web repositories: challenges and solutions for automated content extraction | |
CN111125269A (zh) | 一种数据管理方法、血缘关系显示方法和相关装置 | |
CN111125523A (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN110910964A (zh) | 一种分子间的结合活性预测方法及装置 | |
CN110889036A (zh) | 一种多维度信息的处理方法、装置及终端设备 | |
CN115022098B (zh) | 人工智能安全靶场内容推荐方法、装置及存储介质 | |
CN110347781A (zh) | 文章倒排方法、文章推荐方法、装置、设备及存储介质 | |
Cao et al. | Web video topics discovery and structuralization with social network | |
CN107315811B (zh) | 临床药学信息交互控制方法及设备 | |
CN114595124A (zh) | 时序异常检测模型评估方法、相关装置及存储介质 | |
WO2014034383A1 (ja) | 情報処理装置、レコード位置情報特定方法および情報処理プログラム | |
JP2020098585A (ja) | 二部ネットワーク内のミッシングリンクを理解するための視覚分析フレームワーク、方法、プログラム、装置、およびシステム | |
Park et al. | Indoor positioning-based mobile resource movement data management system for smart factory operations management | |
CN113948153A (zh) | 一种多尺度数据分析方法、装置、终端及介质 | |
CN111460257A (zh) | 专题生成方法、装置、电子设备和存储介质 | |
CN105989176A (zh) | 数据处理方法及装置 | |
Hu et al. | Developing navigation graphs for TED talks | |
CN115408092A (zh) | 一种隐私告知信息显示方法及电子设备 | |
CN111612280B (zh) | 一种数据分析方法和装置 | |
CN111611369B (zh) | 基于人工智能的交互方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |