WO2024108592A1

WO2024108592A1 - 一种组学数据处理方法、装置及计算机设备

Info

Publication number: WO2024108592A1
Application number: PCT/CN2022/134484
Authority: WO
Inventors: 谢尚波; 肖贡; 罗小舟
Original assignee: 深圳先进技术研究院
Priority date: 2022-11-25
Filing date: 2022-11-25
Publication date: 2024-05-30

Abstract

本说明书涉及生物数据处理技术领域，尤其涉及一种组学数据处理方法、装置及计算机设备。其中组学数据处理方法包括根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，组学数据处理请求还包括处理标识；确定与采集待处理组学数据的仪器对应的仪器标识；根据仪器标识和处理标识，确定目标处理模型；以及基于目标处理模型，对待处理组学数据进行处理，得到数据处理结果信息。利用本说明书实施例，实现了在确定待处理组学数据、处理标识和仪器标识之后，基于仪器标识和处理标识，自动确定目标处理模型，进而依据该目标处理模型，针对待处理组学数据进行处理，从而提高了组学数据管理过程中的自动化程度，降低了资源浪费。

Description

一种组学数据处理方法、装置及计算机设备

技术领域

本说明书涉及生物数据处理技术领域，尤其涉及一种组学数据处理方法、装置及计算机设备。

背景技术

目前，在生物领域，针对通过实验得到的组学实验数据进行管理时，需要自行编写对应的用于存储或用于数据处理的脚本。且，由于生物领域，不同实验得到的数据所属的数据类别并不相同，针对不同数据类别的数据，需要采用不同的处理模型进行处理。因此，在确定和编写用于数据处理的脚本时，还需要人工确定该数据所属的数据类别，进而基于该数据类别适应性编写对应的脚本。由此，组学实验数据管理的自动化程度较低，导致对数据管理人员的要求较高，从而造成资源浪费。

如何提高组学实验数据管理的自动化程度以降低资源浪费现有技术中亟需解决的问题。

发明内容

为解决现有技术中的问题，本说明书实施例提供了一种组学数据处理方法、装置、计算机设备及存储介质，实现了在确定待处理组学数据、处理标识和仪器标识之后，基于仪器标识和处理标识，自动确定目标处理模型，进而依据该目标处理模型，针对待处理组学数据进行处理，从而提高了组学数据管理过程中的自动化程度，降低了资源浪费。

为了解决上述技术问题，本说明书的具体技术方案如下：

一方面，本说明书实施例提供了一种组学数据处理方法，包括，

根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，所述组学数据处理请求还包括处理标识；

确定与采集所述待处理组学数据的仪器对应的仪器标识；

根据所述仪器标识和所述处理标识，确定目标处理模型；以及

基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息。

进一步，在所述根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据之前进一步包括：

根据接收到的组学数据存储请求包括的所述待处理组学数据，确定所述组学数据标识；以及

基于所述组学数据标识，将所述待处理组学数据存储至目标数据库。

进一步，该处理标识包括指定数据类别，所述根据所述仪器标识和所述处理标识，确定目标处理模型进一步包括，

确定与所述仪器标识关联的第一预设数据类别；

判断所述第一预设数据类别与所述指定数据类别是否一致；以及

在确定所述第一预设数据类别与所述指定数据类别一致的情况下，确定与所述第一预设数据类别对应的第一预设处理模型为所述目标处理模型。

进一步，还包括，在确定所述第一预设数据类别与所述指定数据类别不一致的情况下，提取所述待处理组学数据的特征信息；

基于所述特征信息，从多个预设数据类别中确定第二预设数据类别；以及

将与所述第二预设数据类别对应的第二预设处理模型作为所述目标处理模型；

或；

在确定所述第一预设数据类别与所述指定数据类别不一致的情况下，发送数据类别确认请求；以及

将与接收到的更新数据类别对应的第三预设处理模型作为所述目标处理模型。

进一步，该基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息进一步包括，

获取与所述目标处理模型对应的预设处理脚本；

利用所述待处理组学数据，对所述预设处理脚本进行更新，得到可运行处理脚本；以及

运行所述可运行处理脚本，得到所述数据处理结果信息。

进一步，该在所述基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息之后，进一步包括，

根据接收到针对所述数据处理结果信息的分享请求，确定所述分享请求包括的用户标识；

根据所述分享请求，获取预设分享脚本；

利用所述数据处理结果信息和所述用户标识，对所述预设分享脚本进行更新，得到可运行分享脚本；以及

运行所述可运行分享脚本，得到目标地址链接。

另一方面，本说明书实施例还提供了一种组学数据处理装置，包括，

第一确定单元，用于根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，所述组学数据处理请求还包括处理标识；

第二确定单元，用于确定与采集所述待处理组学数据的仪器对应的仪器标识；

第三确定单元，用于根据所述仪器标识和所述处理标识，确定目标处理模型；以及

处理单元，用于基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息。

进一步，在所述处理单元之后，进一步包括，

第四确定单元，用于根据接收到针对所述数据处理结果信息的分享请求，确定所述分享请求包括的用户标识；

获取单元，用于根据所述分享请求，获取预设分享脚本；

更新单元，用于利用所述数据处理结果信息和所述用户标识，对所述预设分享脚本进行更新，得到可运行分享脚本；以及

运行单元，用于运行所述可运行分享脚本，得到目标地址链接。

另一方面，本说明书实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的方法。

另一方面，本说明书实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，该计算机指令被处理器执行时实现上述的方法。

利用本说明书实施例，基于接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据；确定与待处理组学数据对应的仪器标识；以该仪器标识和处理标识为索引，确定对应的数据类别，以确定对应的目标处理模型。进而，基于该目标处理模型，对待处理组学数据进行处理，得到数据处理结果信息。从而实现了自动化确定与待处理组学数据对应的数据类别，进而自动确定对应的目标处理模型，以完成针对待处理组学数据的处理。由此，提高了组学数据管理过程中的自动化程度，降低了资源浪费。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1所示为本说明书实施例一种组学数据处理方法的实施系统示意图；

图2所示为本说明书实施例一种组学数据处理方法的流程图；

图3A所示为本说明书另一实施例一种组学数据处理方法的流程图；

图3B所示为本说明书另一实施例一种组学数据处理方法的流程图；

图4所示为本说明书另一实施例一种组学数据处理方法的流程图；

图5A所示为本说明书实施例一种组学数据存储方法的原理图；

图5B所示为本说明书实施例一种数据处理结果信息分享方法的示意图；

图6A所示为本说明书实施例一种组学数据处理装置的结构示意图；

图6B所示为本说明书另一实施例的一种组学数据处理装置的结构示意图；

图6C所示为本说明书另一实施例的一种组学数据处理装置的结构示意图；

图7为本说明书实施例一种计算机设备的结构示意图。

【附图标记说明】

101、用户终端；102、服务器；610、第一确定单元；620、第二确定单元；630、第三确定单元；640、处理单元；650、第四确定单元；660、获取单元；670、更新单元；680、运行单元；6010、第五确定单元；6020、存储单元；702、计算机设备；704、处理设备；706、存储资源；708、驱动机构；710、输入/输出模块；712、输入设备；714、输出设备；716、呈现设备；718、图形用户接口；720、网络接口；722、通信链路；724、通信总线。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本说明书的技术方案中，所涉及的组学实验数据的收集、存储、使用、加工、传输、提供、公开和应用等处理，均符合相关法律法规的规定，采取了必要保密措施，且不违背公序良俗。

图1所示为本说明书实施例一种组学数据处理方法的实施系统示意图，可以包括：用户终端101和服务器102，用户终端101和服务器102之间通过网络进行通信，网络可以包括局域网(Local Area Network，简称为LAN)、广域网(Wide Area Network，简称为WAN)、因特网或其组合，并连接至网站、用户设备(例如计算设备)和后端系统。服务器102在接受到用户通过用户终端101发送的组学数据处理请求后，基于该组学数据处理请求包括的组学数据标识，确定待处理组学数据；确定与待处理组学数据对应的仪器标识；依据仪器标识和组学数据处理请求包括的处理标识，确定目标处理模型；进而利用该目标处理模型对待处理组学数据进行处理，得到数据处理结果信息，并将该数据处理结果信息发送至用户终端101。此外，服务器102在接收到用户终端101发送的针对数据处理结果信息的分享请求时，确定分享请求包括的用户标识；根据分享请求，获取预设分享脚本；利用数据处理结果信息和用户标识，对预设分享脚本进行更新，得到可运行分享脚本；以及运行可运行分享脚本，得到目标地址链接，并将该目标地址链接发送至用户终端101，以供用户通过用户终端101分享至其他用户终端。再者，服务器102在接收到用户终端101发送的组学数据存储请求时，还可以针对要存储的待处理组学数据进行存储。

可选地，服务器102可以是云计算系统的节点(图中未显示)，或者每个服务器102可以是单独的云计算系统，包括由网络互连并作为分布式处理系统工作的多台计算机。

在一个可选的实施例中，用户终端103可以包括电子设备不限于智能手机、采集设备、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(AR,Augmented Reality)/虚拟现实(VR,Virtual Reality)设备、智能可穿戴设备等类型的电子设备。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、Linux、Windows等。

此外，需要说明的是，图1所示的仅仅是本说明书提供的一种应用环境，在实际应用中，还可以包括多个用户终端101，本说明书不做限制。

如图2所示为本说明书实施例一种组学数据处理方法的流程图。在本图中描述了组学数据处理过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或装置产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图2所示，方法可以包括：

S210，根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，组学数据处理请求还包括处理标识；

S220，确定与采集待处理组学数据的仪器对应的仪器标识；

S230，根据仪器标识和处理标识，确定目标处理模型；

S240，基于目标处理模型，对待处理组学数据进行处理，得到数据处理结果信息。

根据本说明书的一个实施例，在用户想针对通过实验得到的待处理组学数据进行分析处理时，通过用户终端发送包括处理标识和与待处理组学数据对应的组学数据标识至服务器。组学数据标识表征可以索引到该待处理组学数据的唯一标识。处理标识表征可以索引到处理需求的唯一标识，例如，针对待处理组学数据进行排序，得到对应序列数据，则该处理标识例如可以为可以索引至处理需求为“确定序列数据”的唯一标识。

在接收到组学数据标识后，根据该组学数据标识，从数据库中确定待处理组学数据。

需要注意的是，在用户想针对通过实验得到的待处理组学数据进行分析处理时，也可以通过用户终端发送待处理组学数据和处理标识至服务器。

若从数据库中，确定待处理组学数据时，基于该待处理组学数据或组学数据标识，确定仪器标识。该仪器标识表征与采集该待处理组学数据的仪器对应的唯一标识。该仪器标识为用户通过用户终端存储待处理组学数据时，输入的信息。在进行待处理组学数据存储时，服务器将仪器标识与待处理组学数据关联存储或与和该待处理组学数据对应的组学数据标识关联存储。由此，在确定待处理组学数据和组学数据标识后，基于该待处理组学数据和组学数据标识中至少一个，确定对应的仪器标识。

若用户并未通过用户终端将待处理组学数据预先存储在数据库时，发送的组学数据处理请求中除了处理组学数据和处理标识至服务器之外，还包括仪器标识。

预先针对每种预设仪器标识关联的至少一个预设处理模型。此外，每个预设处理模型除了与预设仪器标识相关联，还可以与预设处理标识相关联。也就是说，一个预设仪器标识和一个预设处理标识与一个预设处理模型相互相关联。配置处理模型为用于处理组学数据的模型，例如，归一化模型、标准化模型、单变量分析模型和主成分分析模型等。需要注意的是，也可以针对多个预设仪器标识和一个预设处理标识与一个预设处理模型相互关联，例如，基于两组待处理组学数据进行处理，得到氨基酸的表达程度时，则将与该两组待处理组学数据对应的两个预设仪器标识和与“确定氨基酸的表达程度”对应的预设处理标识和对应的进行氨基酸的表达程度的预设处理模型相关联。从而实现了，针对多组待处理组学数据进行处理，得到一个数据处理结果信息。

在预先针对每个预设仪器标识和每个预设处理标识，确定预设处理模型时，例如可以获取历史组学处理数据集合，针对每个预设仪器标识和每个预设处理标识，从历史组学处理数据集合中确定包括该预设仪器标识和预设处理标识的多个目标历史组学处理数据，针对该多个目标历史组学处理数据进行处理模型提取，确定与每个目标历史组学处理数据对应的历史处理模型；确定每个历史处理模型被采用的次数，并将与被采用的次数最多次对应的历史处理模型作为与该预设仪器标识和该预设处理标识关联的预设处理模型。

在确定仪器标识和处理标识之后，从该多个预设处理模型中，确定与该仪器标识和处理标识关联的目标预设处理模型，并将该目标预设处理模型作为目标处理模型。

在确定目标处理模型之后，利用与该目标处理模型对应的处理脚本对待处理组学数据进行处理，得到与该待处理组学数据对应的数据处理结果信息，并将该数据处理结果信息发送至用户终端，以供用户终端进行可视化展示。

根据本说明书的另一个实施例，根据仪器标识和处理标识，确定目标处理模型之后例如还可以包括：针对待处理组学数据，确定对应的组学数据格式；确定目标处理模型可以处理的配置数据格式；判断该组学数据格式与该配置数据格式是否一致；在确定该组学数据格式与该配置数据格式一致的情况下，基于该目标处理模型，对待处理组学数据进行处理，得到数据待处理结果信息。

在确定该组学数据格式与该配置数据格式不一致的情况下，从与该仪器标识和处理标识关联的备用处理模型中确定更新处理模型，并将该更新处理模型作为该目标处理模型，以基于该目标处理模型，对待处理组学数据进行处理，得到数据待处理结果信息。

在基于历史组学处理数据集合，确定预设处理模型时，确定了多个历史处理模型，并将被采用的次数最多次对应的历史处理模型作为预设处理模型。此外，针对与其他被采用的次数对应的历史处理模型按照该被采用的次数的顺序，进行排序作为备用处理模型与该预设仪器标识和该预设处理标识关联。例如，历史处理模型A的采用的次数为95，历史处理模型B的采用的次数为760，历史处理模型C的采用的次数为46。则将历史处理模型B作为预设处理模型，将历史处理模型A作为第一个备用处理模型，将历史处理模型C作为第二个备用处理模型。

具体地，从与该仪器标识和处理标识关联的备用处理模型中确定更新处理模型例如可以为将第一个备用处理模型作为更新处理模型。

由此，保证了所确定的目标处理模型可以处理的数据格式与该待处理组学数据的数据格式一致，从而进一步提高了组学数据管理过程中的自动化程度，降低了资源浪费。

根据本说明的另一个实施例，还包括，根据接收到的扩展请求，确定扩展处理模型脚本、扩展仪器标识、扩展处理标识、扩展数据类别和扩展处理模型；根据该扩展请求，获取预设构建扩展脚本；利用该扩展处理模型脚本、扩展仪器标识、扩展处理标识、扩展数据类别和扩展处理模型，对该预设构建扩展脚本进行更新，得到可运行构建扩展脚本；以及运行该可运行构建扩展脚本，将扩展处理模型脚本、扩展仪器标识、扩展处理标识、扩展数据类别和扩展处理模型进行关联存储，以用于对待处理组学数据处理。

在用户想针对组学数据进行处理时，发现服务器无法进行该项处理，可以针对服务器存储的可以处理的事项进行扩展，以在下一次进行该项处理时，直接调用。

预先针对扩展请求，配置对应的用于实现扩展功能的模板脚本。该模板脚本中缺少扩展处理模型脚本、扩展仪器标识、扩展处理标识、扩展数据类别和扩展处理模型，若将扩展处理模型脚本、扩展仪器标识、扩展处理标识、扩展数据类别和扩展处理模型填充入该模板脚本中，则得到可以运行的程序。

扩展处理模型脚本例如为与扩展处理模型对应的模板脚本。扩展仪器标识为采集扩展待处理组学数据的仪器的标识。扩展处理标识为针对该扩展待处理组学数据进行相应处理的标识。扩展数据类别为与该扩展仪器标识关联的数据类别。由此，实现了用户自行扩充处理的模型，以扩展该服务器可以进行处理的范围。

图3A所示为本说明书另一实施例一种组学数据处理方法的流程图。在本图中描述了一种组学数据处理过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图3A所示，方法可以包括：

S3311，确定与仪器标识关联的第一预设数据类别；

S3312，判断第一预设数据类别与指定数据类别是否一致；

S3313，在确定第一预设数据类别与指定数据类别一致的情况下，确定与第一预设数据类别对应的第一预设处理模型为目标处理模型；

S3314，在确定第一预设数据类别与指定数据类别不一致的情况下，提取待处理组学数据的特征信息；

S3315，基于特征信息，从多个预设数据类别中确定第二预设数据类别；

S3316，将与第二预设数据类别对应的第二预设处理模型作为目标处理模型。

利用本说明书实施例，由于存在用户输入错误仪器标识的情况，为了提高确定的目标处理模型的准确率，在需要用户通过用户终端输入的处理标识中还包括指定数据类别，该指定数据类别表征用户通过用户终端输入的与该待处理组学数据对应的数据类别。进而基于该指定数据类别和基于仪器标识对应的预设数据类别，确定较准确的目标处理模型。以用于组学数据处理。

根据本说明书的另一个实施例，预先针对每个预设仪器标识关联对应的预设数据类别。该预设数据类别为组学层面的类别，例如，基因组、转录组、蛋白组和代谢组等。指定数据类别也为表征组学层面的类别，例如，基因组、转录组、蛋白组和代谢组等。

基于确定的仪器类别，从多个预设数据类别中确定关联的第一预设数据类别。针对该第一预设数据类别与处理标识包括的指定数据类别进行一致性匹配，确定匹配数值。在确定该匹配数值满足预设条件的情况下，确定该第一预设类别与指定数据类别一致，在确定该匹配数据不满足预设条件的情况下，确定该第一预设类别与指定数据类别不一致。具体地，针对该第一预设数据类别与处理标识包括的指定数据类别进行一致性匹配可以为，利用文字相似度处理模型，确定第一预设数据类别与指定数据类别之间的相似度，并将该相似度作为匹配数值。文字相似度处理模型例如可以为任意可以确定两个词语或句子相似程度的模型。预设条件例如可以为，是否大于或等于预设阈值，在大于或等于预设阈值的情况下，确定该匹配数据满足预设阈值，否则确定该匹配数值不满足该预设阈值。该预设阈值例如可以为0.99。

在确定第一预设数据类别与指定数据类别一致的情况下，执行S3313。具体地，从多个预设处理模型中，确定与该第一预设数据类别相匹配的第一预设处理模型，并将该第一预设处理模型作为目标处理模型。

在确定第一预设数据类别与指定数据类别不一致的情况下，执行S3314～S3316。具体地，提取待处理组学数据的特征信息，并基于该特征信息，从多个预设数据类别中确定第二预设数据类别。具体地，可以采用任意可以基于特征信息，针对待处理组学数据进行分类的模型实现该步骤，例如，支持向量机模型，训练后的神经网络模型和随机森林模型等。在确定第二预设数据类别之后，从多个预设处理模型中，确定与该第二预设数据类别相匹配的第二预设处理模型，并将该第二预设处理模型作为目标处理模型，以用于针对待处理组学数据的处理。

图3B所示为本说明书另一实施例一种组学数据处理方法的流程图。在本图中描述了一种组学数据处理过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图3B所示，方法可以包括：

S3324，发送数据类别确认请求；

S3325，将与接收到的更新数据类别对应的第三预设处理模型作为目标处理模型。

根据本说明书的另一个实施例，在图3A中在确定第一预设数据类别与指定数据类别不一致的情况下，执行S3314～S3316。除此之外，在在确定第一预设数据类别与指定数据类别不一致的情况下，还可以执行S3324～S3325。具体地，发送数据类别确认请求至发送组学数据处理请求的用户终端，以供用户通过用户终端选择或填入更新数据类别。该数据类别确认请求例如可以包括第一预设数据类别、指定数据类别和其他。需要注意的时，在用户通过用户终端选择“其他”时，利用可供用户通过用户终端输入信息的控件，展示可输入文字框，以供用户输入更新数据类别。

用户在看到用户终端显示的第一预设数据类别、指定数据类别和其他时，若认为第一预设数据类别和指定数据类别中存在与该待处理组学数据对应的准确数据类别时，选择对应的数据类别，并通过用户终端将该数据类别作为更新数据类别发送至服务器。若认为第一预设数据类别和指定数据类别中不存在与该待处理组学数据对应的准确数据类别时，选择其他，并输入对应的更新数据类别至用户终端，以发送至服务器。

服务器在接收到更新数据类别后，从多个预设处理模型中，确定与该更新数据类别相匹配的第三预设处理模型，并将该第三预设处理模型作为目标处理模型。

图4所示为本说明书另一实施例一种组学数据处理方法的流程图。在本图中描述了一种组学数据处理过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图4所示，方法可以包括：

S441，获取与目标处理模型对应的预设处理脚本；

S442，利用待处理组学数据，对预设处理脚本进行更新，得到可运行处理脚本；

S443，运行可运行处理脚本，得到数据处理结果信息。

利用本说明书实施例，预先针对每个预设处理模型，配置对应的处理脚本，以供调用。实现了在确定要用的目标处理模型之后，无需人员再次编写对应的脚本。从而，提高了组学实验数据处理过程的自动化程度，降低了资源的浪费。

根据本说明书的另一个实施例，预先针对每个预设处理模型，配置对应的处理脚本。该处理脚本为可以用于实现针对目标数据进行对应处理的模板程序。该模板程序中缺少需要处理的目标数据，若将目标数据填充入该模板程序中，则得到可以运行的程序。

在确定目标处理模型后，基于该目标处理模型，从多个处理脚本中，确定与该目标处理模型关联的预设处理脚本。

将待处理组学数据填充入确定的预设处理脚本中，得到可运行处理脚本。进而运行该可运行处理脚本，得到数据处理结果信息，并将该数据处理结果信息发送至用户终端，以供用户终端进行可视化展示。

图5A所示为本说明书实施例一种组学数据存储方法的原理图。在本图中描述了一种组学数据存储过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图5A所示，方法可以包括：

S5010，根据接收到的组学数据存储请求包括的待处理组学数据，确定组学数据标识；

S5020，基于组学数据标识，将待处理组学数据存储至目标数据库。

利用本说明书实施例，在用户仅想将通过实验得到的待处理组学数据存储，以用于后续查阅时，用户可以通过用户终端与服务器进行交互，以实现针对待处理组学数据的存储，提高了组学实验数据存储过程的自动化程度，降低了资源的浪费。

根据本说明书的另一个实施例，在用户想将得到的组学数据存储至该服务器的数据库中时，将该组学数据作为组学数据存储请求包括的待处理组学数据发送至服务器。服务器在接收到该待处理组学数据时，调用数据标识确定脚本针对该待处理组学数据进行处理，得到与该待处理组学数据对应的组学数据标识。并基于该组学数据标识，确定目标数据库。调用存储脚本，以将该待处理组学数据存储于该目标数据库中。例如，还可以包括将该组学数据标识与该待处理组学数据和数据库地址信息相关联，以实现用户提取该待处理组学数据。该数据库地址信息为与存储该待处理组学数据的目标数据库中的存储空间对应的地址信息。

根据本说明书的另一个实施例，在用户像针对存储后的待处理组学数据进行提取时，通过用户终端将该组学数据标识作为提取请求发送至服务器。服务器在接收到该提取请求后，根据该提取请求包括的组学数据标识，确定对应的数据库地址信息，调用提取脚本，以基于该数据库地址信息从目标数据库中获取该待处理组学数据，并将该待处理组学数据发送至用户终端，以供用户终端进行可视化显示。

图5B所示为本说明书实施例一种数据处理结果信息分享方法的示意图。在本图中描述了一种数据处理结果信息分享过程，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图5B所示，方法可以包括：

S550，根据接收到针对数据处理结果信息的分享请求，确定分享请求包括的用户标识；

S560，根据分享请求，获取预设分享脚本；

S570，利用数据处理结果信息和用户标识，对预设分享脚本进行更新，得到可运行分享脚本；

S580，运行可运行分享脚本，得到目标地址链接。

利用本说明书实施例，在用户看到数据处理结果信息之后，若想将该数据处理结果信息分享至其他用户时，用户可以通过用户终端与服务器进行交互，以实现针对待处理组学数据的分享，提高了组学实验数据分享过程的自动化程度，降低了资源的浪费。

根据本说明书的另一个实施例，在用户想将用户终端显示的数据处理结果信息展示给其他用户时，发送针对数据处理结果信息的分享请求至服务器。该分享请求包括与需要分享的用户对应的用户标识和表征该数据处理结果信息的分享标识。

服务器在接收到该分享请求后，根据该分享请求，确定该数据处理结果信息和用户标识。

预先针对分享请求，配置对应的用于实现分享功能的模板脚本。在接受到分享请求后，获取与分享请求关联的模板脚本，并将该模板脚本作为预设分享脚本。该模板脚本中缺少需要分享的内容信息和用户标识，若将内容信息和用户标识填充入该模板脚本中，则得到可以运行的程序。

将数据处理结果信息和用户标识分别填充入确定的预设分享脚本中，以对该预设分享脚本进行更新，得到可运行分享脚本。

进而运行该可运行分享脚本，得到目标地址链接，并将该目标地址链接发送至用户终端，以供用户终端进行可视化展示。从而，用户可以将用户终端展示的目标地址链接通过用户终端分享至对应的用户。

图6A所示为本说明书实施例一种组学数据处理装置的结构示意图。如图6A所示，包括，

第一确定单元610，用于根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，组学数据处理请求还包括处理标识；

第二确定单元620，用于确定与采集待处理组学数据的仪器对应的仪器标识；

第三确定单元630，用于根据仪器标识和处理标识，确定目标处理模型；以及

处理单元640，用于基于目标处理模型，对待处理组学数据进行处理，得到数据处理结果信息。

由于上述装置解决问题的原理与上述方法相似，因此上述装置的实施可以参见上述方法的实施，重复之处不再赘述。

图6B所示为本说明书另一实施例的一种组学数据处理装置的结构示意图。如图6B所示，包括，

第四确定单元650，用于根据接收到针对数据处理结果信息的分享请求，确定分享请求包括的用户标识；

获取单元660，用于根据分享请求，获取预设分享脚本；

更新单元670，用于利用数据处理结果信息和用户标识，对预设分享脚本进行更新，得到可运行分享脚本；以及

运行单元680，用于运行可运行分享脚本，得到目标地址链接。

图6C所示为本说明书实施例一种组学数据处理装置的结构示意图。如图6C所示，包括，

第五确定单元6010，用于根据接收到的组学数据存储请求包括的待处理组学数据，确定组学数据标识；以及

存储单元6020，用于基于组学数据标识，将待处理组学数据存储至目标数据库。

如图7所示为本说明书实施例一种计算机设备的结构示意图，本说明书中的装置可以为本实施例中的计算机设备，执行上述本说明书的方法。计算机设备702可以包括一个或多个处理设备704，诸如一个或多个中央处理单元(CPU)，每个处理单元可以实现一个或多个硬件线程。计算机设备702还可以包括任何存储资源706，其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的，比如，存储资源706可以包括以下任一项或多种组合：任何类型的RAM，任何类型的ROM，闪存设备，硬盘，光盘等。更一般地，任何存储资源都可以使用任何技术来存储信息。进一步地，任何存储资源可以提供信息的易失性或非易失性保留。进一步地，任何存储资源可以表示计算机设备702的固定或可移除部件。在一种情况下，当处理设备704执行被存储在任何存储资源或存储资源的组合中的相关联的指令时，计算机设备702可以执行相关联指令的任一操作。计算机设备702还包括用于与任何存储资源交互的一个或多个驱动机构708，诸如硬盘驱动机构、光盘驱动机构等。

计算机设备702还可以包括输入/输出模块710(I/O)，其用于接收各种输入(经由输入设备712)和用于提供各种输出(经由输出设备714)。一个具体输出机构可以包括呈现设备716和相关联的图形用户接口(GUI)718。在其他实施例中，还可以不包括输入/输出模块710(I/O)、输入设备712以及输出设备714，仅作为网络中的一台计算机设备。计算机设备702还可以包括一个或多个网络接口720，其用于经由一个或多个通信链路722与其他设备交换数据。一个或多个通信总线724将上文所描述的部件耦合在一起。

通信链路722可以以任何方式实现，例如，通过局域网、广域网(例如，因特网)、点对点连接等、或其任何组合。通信链路722可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。

本说明书实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述方法。

本说明书实施例还提供一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序被处理器执行时实现上述方法。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上的具体实施例，对本说明书的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上仅为本说明书的具体实施例而已，并不用于限定本说明书的保护范围，凡在本说明书的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书的保护范围之内。

Claims

一种组学数据处理方法，其特征在于，包括：

根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，所述组学数据处理请求还包括处理标识；

确定与采集所述待处理组学数据的仪器对应的仪器标识；

根据所述仪器标识和所述处理标识，确定目标处理模型；以及

基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息。
根据权利要求1所述的方法，其特征在于，在所述根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据之前还包括：

根据接收到的组学数据存储请求包括的所述待处理组学数据，确定所述组学数据标识；以及

基于所述组学数据标识，将所述待处理组学数据存储至目标数据库。
根据权利要求1所述的方法，其特征在于，所述处理标识包括指定数据类别，所述根据所述仪器标识和所述处理标识，确定目标处理模型包括：

确定与所述仪器标识关联的第一预设数据类别；

判断所述第一预设数据类别与所述指定数据类别是否一致；以及

在确定所述第一预设数据类别与所述指定数据类别一致的情况下，确定与所述第一预设数据类别对应的第一预设处理模型为所述目标处理模型。
根据权利要求3所述的方法，其特征在于，还包括：

在确定所述第一预设数据类别与所述指定数据类别不一致的情况下，提取所述待处理组学数据的特征信息；

基于所述特征信息，从多个预设数据类别中确定第二预设数据类别；以及

将与所述第二预设数据类别对应的第二预设处理模型作为所述目标处理模型；

或；

在确定所述第一预设数据类别与所述指定数据类别不一致的情况下，发送数据类别确认请求；以及

将与接收到的更新数据类别对应的第三预设处理模型作为所述目标处理模型。
根据权利要求1所述的方法，其特征在于，所述基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息包括：

获取与所述目标处理模型对应的预设处理脚本；

利用所述待处理组学数据，对所述预设处理脚本进行更新，得到可运行处理脚本；以及

运行所述可运行处理脚本，得到所述数据处理结果信息。
根据权利要求1所述的方法，其特征在于，在所述基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息之后，还包括：

根据接收到针对所述数据处理结果信息的分享请求，确定所述分享请求包括的用户标识；

根据所述分享请求，获取预设分享脚本；

利用所述数据处理结果信息和所述用户标识，对所述预设分享脚本进行更新，得到可运行分享脚本；以及

运行所述可运行分享脚本，得到目标地址链接。
一种组学数据处理装置，其特征在于，包括：

第一确定单元，用于根据接收到的组学数据处理请求包括的组学数据标识，确定待处理组学数据，所述组学数据处理请求还包括处理标识；

第二确定单元，用于确定与采集所述待处理组学数据的仪器对应的仪器标识；

第三确定单元，用于根据所述仪器标识和所述处理标识，确定目标处理模型；以及

处理单元，用于基于所述目标处理模型，对所述待处理组学数据进行处理，得到数据处理结果信息。
根据权利要求7所述的装置，其特征在于，在所述处理单元之后，还包括：

第四确定单元，用于根据接收到针对所述数据处理结果信息的分享请求，确定所述分享请求包括的用户标识；

获取单元，用于根据所述分享请求，获取预设分享脚本；

更新单元，用于利用所述数据处理结果信息和所述用户标识，对所述预设分享脚本进行更新，得到可运行分享脚本；以及

运行单元，用于运行所述可运行分享脚本，得到目标地址链接。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1-6中任一项的方法。
一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述权利要求1-6任一项的方法。