CN113204687A - 质谱数据自动上传方法及终端设备 - Google Patents

质谱数据自动上传方法及终端设备 Download PDF

Info

Publication number
CN113204687A
CN113204687A CN202110445233.2A CN202110445233A CN113204687A CN 113204687 A CN113204687 A CN 113204687A CN 202110445233 A CN202110445233 A CN 202110445233A CN 113204687 A CN113204687 A CN 113204687A
Authority
CN
China
Prior art keywords
mass spectrum
spectrum data
end server
data file
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110445233.2A
Other languages
English (en)
Inventor
张尚
王鹏飞
赵重阳
孙建
赵兴东
关灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mosaien Technology Suzhou Co ltd
Original Assignee
Mosaien Technology Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mosaien Technology Suzhou Co ltd filed Critical Mosaien Technology Suzhou Co ltd
Publication of CN113204687A publication Critical patent/CN113204687A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种质谱数据自动上传方法及终端设备,方法包括:获取满足第一预设条件的第一质谱数据文件,第一质谱数据文件包含有多种文件格式;将第一质谱数据文件转换为统一格式的第二质谱数据文件;利用HTTP协议中的Post方法,将第二质谱数据文件自动上传至后端服务器。本发明可以自动检测质谱数据文件,然后将满足预设条件的文件上传至后端服务器,耗时短,安全性高。

Description

质谱数据自动上传方法及终端设备
技术领域
本申请涉及一种质谱数据自动上传方法及终端设备,属于数据上传技术领域。
背景技术
质谱仪又称质谱计,是用来进行分离和检测不同同位素的仪器。即根据带电粒子在电磁场中能够偏转的原理,按物质原子、分子或分子碎片的质量差异进行分离和检测物质组成的一类仪器。
质谱仪生产的数据大,文件多,且类型不一。传统的质谱数据分析都需要通过硬盘拷贝至电脑设备,打开分析软件,根据所使用的文件类型的不同,手动上传,耗时长,安全性低。
发明内容
本申请的目的在于,提供一种质谱数据自动上传方法及终端设备,以解决上述背景技术中提出的问题。
本发明质谱数据自动上传方法,包括:
获取满足第一预设条件的第一质谱数据文件,所述第一质谱数据文件包含有多种文件格式;
将所述第一质谱数据文件转换为统一格式的第二质谱数据文件;
利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器。
优选地,利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
解析CSV表格,得到待上传文件列表;所述CSV表格中包括待上传的所述第二质谱数据文件的文件路径及对应的标签信息;
逐一判断所述待上传文件列表中的所述第二质谱数据文件是否存在,若存在,则利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器;若不存在,则跳过并查询下一个所述第二质谱数据文件是否存在,若查询至所述待上传文件列表末尾则重新转至开头,直至所有所述第二质谱数据文件均已生成并利用所述Post方法上传至所述后端服务器;
优选地,所述标签信息包括项目名称、实验组别和标签。
优选地,所述CSV表格中还包括待上传的所述第二质谱数据文件所属文件夹的路径及对应的标签信息。
优选地,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之前,还包括:
压缩所述第二质谱数据文件;
相应地,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
利用HTTP协议中的Post方法,将压缩后的所述第二质谱数据文件自动上传至后端服务器;
优选地,压缩所述第二质谱数据文件,具体为:
提取所述第二质谱数据文件中质谱数据中的ROI部分,具体为:
提取预设MZ差距范围内,RT方向上满足第二预设条件并连贯的一组峰值数据。
优选地,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之前,还包括:
将所述第二质谱数据文件发送至计算盒;所述计算盒中包括深度学习方法,用于进行峰计算;
获取所述计算盒输出的计算结果;
相应地,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
利用HTTP协议中的Post方法,将所述计算结果自动上传至后端服务器。
优选地,在所述获取满足第一预设条件的第一质谱数据文件之前,还包括:
获取质谱仪输出的所有质谱数据文件;
对所有所述质谱数据文件中的质谱数据进行三维矩阵化,得到预览图;
利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器;
所述后端服务器将接收的所述预览图发送至终端;
优选地,对所有所述质谱数据文件中的质谱数据进行三维矩阵化,得到预览图,具体为:
将所述质谱数据中的rt和mz分别作为行和列,对应位置的Intensity作为值,将所述质谱数据三维矩阵化;
将每个Intensity值映射为3通道32位的彩色像素点,然后把彩色像素点矩阵转化为图像或者通过读取rt-Intensity求和获得TIC图,又或者对mz-Intensity求和获得EIC图,将所述图像、所述TIC图或所述EIC图作为预览图;
优选地,所述后端服务器将接收的所述预览图发送至终端,具体为:
所述后端服务器将接收的所述预览图通过查找账号发送给浏览器、手机绑定微信号、绑定邮箱账号,以展示在pc设备或者手机移动设备上。
优选地,在所述利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器之前,还包括:
利用异常停止检测算法和/或异常峰检测算法,检测所述预览图,得到异常检测结果;
相应地,利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器;所述后端服务器将接收的所述预览图发送至终端,具体为:
利用HTTP协议中的Post方法,将所述预览图和所述异常检测结果自动上传至后端服务器;所述后端服务器将接收的所述预览图和所述异常检测结果发送至所述终端;
优选地,所述异常检测结果包括异常样本和异常情况说明。
优选地,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
从所述后端服务器获取没有标签信息的所述第二质谱数据文件的列表,记为第一数据列表;
为所述第一数据列表中的所述第二质谱数据文件添加标签信息;
将添加了标签信息的所述第一数据列表上传至所述后端服务器。
优选地,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
客户端向所述后端服务器发送所选取的分析模板;
所述后端服务器将所有所述质谱数据文件中的质谱数据和所述分析模板传输给算法服务器进行处理分析;
获取所述算法服务器的分析结果,并将其展示在质谱识别平台界面;
优选地,所述分析模板的生成步骤包括:
浏览器向所述后端服务器发起运行任务请求,所述运行任务请求中包括编辑好的节点、超节点和流程连接线的数据信息;
所述后端服务器将接收到的所述数据信息发送给算法服务器,并接收所述算法服务器返回的结果;
所述后端服务器返回运行成功状态给所述浏览器,所述浏览器向所述后端服务器发送保存为模板请求,并将数据源参数和其他所有参数传输给所述后端服务器;
所述后端服务器将其存储在数据库中,保存为可以复用的个性化模板;
优选地,所述模板包括多个不同任务子模板;
所述不同任务子模板包括分子识别子模板、样本识别子模板、样本靶向识别子模板和差异分析子模板。
优选地,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
当浏览器或客户端发起多个上传任务时,所述浏览器或客户端将所有任务的id和每个id对应的第二质谱数据发送给后端服务器;
所述后端服务器将接收的所述id和每个id对应的第二质谱数据发送给任务队列服务器,所述任务队列服务器分配计算资源和开启线程,并把所述id和每个id对应的第二质谱数据转发给算法服务器;
所述算法服务器接收数据后,开始执行第一处理,并将处理结果返回所述任务队列服务器;其中,所述第一处理包括计算、机器学习、深度学习中的任意一种;
所述任务队列服务器将接收到的处理结果通过socket转发给所述浏览器或所述客户端;
所述浏览器或所述客户端利用HTTP协议中的Post方法,将所有任务中的第二质谱数据文件自动上传至后端服务器。
优选地,在利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
客户端或浏览器请求生信数据,后端服务器将所述生信数据发送至所述客户端或所述浏览器;所述生信数据包括所述第二质谱数据文件及利用所述第二质谱数据文件生成的信息;
所述客户端或所述浏览器利用所述生信数据建立二维或三维的可视化信息图,并建立所述第二质谱数据文件及利用所述第二质谱数据文件生成的信息之间的关联关系id;
所述浏览器或所述客户端根据用户操作请求获取所述关联关系id,并通过所述关联关系id查找其对应的可视化信息图的数据信息;
所述浏览器或所述客户端根据所述关联关系id查找后端服务器返回的所述数据信息,并通过可视化组件将所述关联关系id对应的可视化信息图展示在质谱识别界面中。
本发明还公开了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本发明的质谱数据自动上传方法相较于现有技术,具有如下有益效果:
本发明可以自动检测质谱数据文件,然后将满足预设条件的文件上传至后端服务器,耗时短,安全性高。
本发明提供了一种压缩上传方式,节省后端服务器、流量、网速资源。
本发明提供了一种峰检测计算盒,计算盒装载了训练好的质谱数据深度学习算法芯片,节省GPU、提高效率。
本发明可利用质谱仪输出的质谱数据生成预览图,并将其发送至终端,以便实现远程查看实验过程,确保上传至后端服务器的第二质谱数据文件中的数据质量。
本发明在客户端还增加了异常检测算法进行报警,及时发现实验过程中的异常情况,及时处理。
质谱数据经常包含标签信息,比如疾病组与正常组、服药组与未服药组、实验组与对照组等,因此,本发明在客户端增加了标签处理,方便自动分析。
由于质谱数据实验周期长,分析周期更长,平均需要3-6个月才能解析完成,因此,本发明提供了一种自动分析方法,从实验生产环境直接发起分析任务,实验结束后,加上云服务强计算力,极大地提高效率,节省时间。同时,本发明在分析中所使用的模板是通过浏览器流程自定义生成的,传统质谱分析软件固定流程,不可以编辑,本发明提供了一种个性化自定义编辑流程方法装置,适用性更强。
上述自动运行的基础上,用户发起了多任务,需要进行多任务管理,传统质谱软件都是单个任务执行,如果多个任务需要多开几个软件,但效率会变低,而本发明提供了一种多任务管理方法,可实现同一个软件中的多任务处理,效率高。
传统质谱分析软件通过表单建立数据库,由于质谱数据种类多,实验信息更为复杂,通过表单建立数据库,操作复杂,非常繁琐,用户体验极差。而本发明在任务成功后,任务结果可通过可视化方式展示,结果更为直观。
附图说明
图1为本申请一种质谱数据自动上传方法的流程图;
图2为本申请一种质谱数据自动上传方法的详细流程图。
具体实施方式
下面结合实施例详述本发明,但本发明并不局限于这些实施例。
本发明一种质谱数据自动上传方法的流程图见图1,其详细流程图见图2,包括:
步骤1、获取满足第一预设条件的第一质谱数据文件,第一质谱数据文件包含有多种文件格式,具体为:
客户端调用.Net框架的FileSystemWatch模块监视用于存储质谱数据的文件夹,例如,文件夹为E:\桌面\New Folder。一旦有符合第一预设条件的文件生成,该模块发送通知给客户端主线程。其中第一预设条件为对文件格式的限制。
步骤2、将第一质谱数据文件转换为统一格式的第二质谱数据文件,具体为:客户端调用外部进程msconvert.exe,输入.d或.raw等后缀的文件路径,设置输出路径与输出文件所在文件夹相同,将原始文件转换为mzxml格式的文件,例如,文件路径为E:\桌面\NewFolder\Pg Reference Sample.d,转换后的文件为E:\桌面\New Folder\Pg ReferenceSample.mzXML。
步骤3、利用HTTP协议中的Post方法,将第二质谱数据文件自动上传至后端服务器,示例的,将转换后的文件E:\桌面\New Folder\Pg Reference Sample.mzXML上传至后端服务器。
上述方法可以处理无标签文件,除此之外,还可以处理有标签文件上传。在监视之前为每个文件夹配置相应的标签信息,包括项目-实验-标签等信息,上传文件至后端服务器时附带这些信息,自动完成了文件的归类整理。当处理有标签文件的上传时,步骤3具体为:将要上传的文件路径(可以不存在,等待仪器生成)及相应标签信息写入一个CSV表格。客户端软件会解析CSV表格内容,生成一个待上传文件列表,并获取以及相应的项目/实验/标签等标签信息。当用户点击开始时,客户端开始逐个判断待上传文件列表里的文件是否存在,若文件存在则上传,若文件不存在则跳过并查询下一个文件,若查询至文件末尾则重新转至文件列表开头,直至所有文件均已生成并上传至后端服务器。
除CSV表格监控外,还可以拖拽至项目-实验文件夹,示例的,拖拽Pg ReferenceSample.d文件至项目Project“test”-实验Experiment“01”文件夹,将弹出一个临时窗口,以列表的形式记录文件和标签信息Label“C”的对应关系,不关闭此窗口,继续追加其他文件和对应的其他标签,列表的项数随之增长,直至所有文件都上传至后端服务器。
从后端服务器获知上传结果。如上传文件流时在Post方法参数里附带项目-实验-标签等标签信息,则为有标签上传,否则为无标签上传。
由于质谱生产数据文件特别大,上传占用大量的流量和后端服务器资源,因此,本申请提供了一种压缩上传方式,节省后端服务器、流量、网速资源。
具体执行为:客户端调用.Net框架的FileSystemWatch模块监视一个文件夹,一旦有符合预设要求的文件生成,执行转换-Roi压缩-上传步骤,为实现步骤,首先将PgReference Sample.d执行转换“Convert”生成Pg Reference Sample.mzXML,然后执行Roi压缩“Compress”生成Pg Reference Sample_new.mzXML,最后执行上传“Upload”步骤,该模块发送通知给客户端主线程。其中的压缩算法是指提取所有质谱数据中的感兴趣部分(ROI),在极小的质荷比(MZ)差距范围内,保留时间(RT)纵坐标方向上满足一定条件并较为连贯的一组峰值数据,生成一个新的mzxml。由于数据量的减少,新文件相对原始文件所需存储空间较小,以此达成压缩目的。
客户端调用HTTP协议的Post方法,将文件流发送给后端服务器;从后端服务器获知上传结果。如上传文件流时在Post方法参数里附带项目-实验-标签等信息,则为有标签上传,否则为无标签上传。
由于质谱生产数据文件特别大,在解析质谱数据时,本发明提供了一种深度学习方法,但深度学习极大地耗用GPU,费用高,本发明提供了一种峰检测计算盒,计算盒装载了训练好的质谱数据深度学习算法芯片,节省GPU、提高效率。
具体实现:第一步,客户端调用.Net框架的FileSystemWatch模块监视一个文件夹,一旦有符合预设要求的文件生成,执行转换-Moloview峰检测-上传步骤,MoloView峰监测计算客户端步骤:在Config页Moloview子页,首先在URL地址栏输入正确的计算盒HTTPServer地址,例如http://192.168.1.104:2000,点击Connect连接至计算盒。客户端执行MoloView峰提取计算步骤时,首先将mzxml文件通过Http协议发送至计算盒,并发起峰计算相应接口,随后每隔5秒查询一次计算结果。若文件计算完成,则把新生成的.molo文件从计算盒下载到客户端所在PC,与之前选择的mzxml文件路径相同。使用计算盒的作用:节省GPU、提高效率,降低了数据量,出结果时间提高。相应地,客户端下载完成后,客户端执行后续将.molo格式文件上传,调用HTTP协议的Post方法,将文件流发送给后端服务器;从后端服务器获知上传结果。如上传文件流时在Post方法参数里附带项目-实验-标签等信息,则为有标签上传,否则为无标签上传。
实验过程中,质谱实验员做质谱实验经常需要试管查看是否设备、样品正常,并且实验中也会出现异常,而此时,实验员并不能快速知道异常情况。而用户主要通过总离子流图(TIC)、提取离子流图(EIC)、离子流图查看异常情况。基于此,本发明在自动上传的基础上,提供了一些数据处理方案,给用户提供了离开质谱实验环境还能实时监控,及时处理的方法,也方面做后续的自动分析。其具体实现为:
首先生成预览图:客户端提取所有质谱数据,按照rt-mz分别作为行和列,对应位置的质谱峰强度(Intensity)作为值,将质谱数据三维矩阵化,将每个Intensity值映射为3通道32位的彩色像素点,随后调用Opencv库Mat相关函数把彩色像素点矩阵转化为png图像或其他类型图像。或者通过读取rt-Intensity求和获得TIC图,又或者对mz-Intensity求和获得EIC图,该步骤可协助客户在上传图像之前简单预览质谱数据的大致情况。然后客户端通过上述自动上传方案把三种图发送给后端服务器。后端服务器通过查找账号发送给浏览器、手机绑定微信号、绑定邮箱账号,展示在pc设备或者手机移动设备上。
在上述数据处理方式上,客户端还增加了异常检测算法,进行报警,及时发现异常情况,及时处理。具体实现:
根据第一种数据处理方式生成预览图,客户端还增加了一种异常检测算法,无需内标,通过异常停止检测算法、异常峰检测算法,检测用户输入参数内该有峰却未检测到或质谱设备异常。客户端把异常样本和异常情况说明发送至后端服务器。后端服务器通过查找账号发送给浏览器、手机绑定微信号、绑定邮箱账号,展示在pc设备或者手机移动设备上。
质谱数据经常包含标签,比如疾病组与正常组、服药组与未服药组、实验组与对照组等,客户端增加了标签处理,方便自动分析。具体实现:
从后端服务器获取所有未打标签的文件信息列表,即之前上传的未归入项目-实验下,不具备标签的文件,文件信息主要包括文件名和上传时间,例如文件分别为PgReference Sample.mzXML和Pg Reference Sample_new.mzXML。
获取文件列表后,分别从列表右侧的项目project-实验experiment-标签label3个下拉菜单中选好相应的信息。随后在客户端可以进行单个或多个文件打标签。为选中的文件补全下拉菜单中的项目project“test”-实验experiment“01”-标签信息label“C”。
将上述信息传回至后端服务器,点击“Save to server”按钮。原无标签文件将出现在正确的项目-实验名下,并拥有相应的标签。显示在客户端或浏览器设备质谱识别界面。
由于质谱数据实验周期长,分析周期更长,平均需要3-6个月才能解析完成,本发明提供了一种从实验生产环境直接发起分析任务的方法,实验结束后,加上云服务强计算力,极大地提高效率,节省时间。具体实现:
客户端通过Http协议调取“分析模板”接口,从后端服务器获取预设的分析模板列表,通过下拉菜单选择列表中的一项,选择列表中的“差异分析”模板。当满足发起实验的条件时,客户端通过Http协议通知服务端选择的分析模板。第三步,后端服务器将数据和分析模板,传输给算法服务器,算法服务器接受后开始相应的处理和计算,展示在质谱识别平台界面。
上述分析模板是通过浏览器流程自定义生成的,传统质谱分析软件是固定流程,不可以编辑,适用性不强,本申请提供了一种个性化自定义编辑流程方法。具体实现:
浏览器设备通过把编辑好的节点、超节点、流程连接线数据信息,连接节点“mzXML-峰提取-峰对齐”,发起运行任务请求通过点击“运行”按钮发送给后端服务器;
后端服务器接受后,发送给算法服务器,运行完成后返回结果给后端服务器;
后端服务器返回运行成功状态给浏览器,浏览器设备发送“保存为模板”请求给后端服务器,并把数据源参数设置清除,其他所有参数传给后端服务器;
后端服务器接受后,存储在数据库中,保存为可以复用的个性化模板。其中模板可以是不同任务,包含“分子识别”、“样本识别”、“样本靶向识别”、“差异分析”。
客户端或浏览器发送“模板直接运行”请求,会从后端服务器获得模板列表信息和参数信息,客户端或浏览器设备把选择的模板和数据信息发送给后端服务器,就可以发起自动运行任务了。
上述自动运行的基础上,用户发起了多任务,需要进行多任务管理,传统质谱软件都是单个任务执行,如果多个任务需要多开几个软件,但效率会变低,本申请提供了一种多任务管理方法,具体实现:
浏览器或客户端设备发起多个任务后,把所有任务id和数据发送给后端服务器;
后端服务器接受所有任务id后,发送给任务队列服务器,任务队列服务器分配计算资源和开启线程,并把任务id转发给算法服务器;
算法服务器接受数据后,开始执行计算、机器学习、深度学习等处理,处理结果返回任务队列服务器;
任务队列服务器通过socket转发给浏览器设备,最终呈现在质谱识别界面中。
传统质谱分析软件通过表单建立数据库,由于质谱数据种类多,实验信息更为复杂,通过表单建立数据库,操作复杂,非常繁琐,用户体验极差,本申请提供了三种可视化交互方式,并且可以通过可视化交互方法高效建立数据库。第一种可视化交互方法具体为:
客户端或浏览器请求生信数据,后端服务器把质谱信息数据发送至前端,包含一类是生信数据转化为特征信息、数字信息、图片信息、向量信息和矩阵信息,另一类是将特征信息进行机器学习、深度学习、统计处理等第一处理方式得到统计信息,第三类是关联数据信息,即生信数据和统计信息这两类数据是相互关联的,可以是一对多,多对一,一对一的数据关联。然后浏览器将特征信息中的m/z信息、rt信息转化为横纵坐标轴,形成二维的可视化信息图;或者,将特征信息中的m/z信息、rt信息转化为横纵坐标轴,把峰提取的同位素峰、强度值、匹配次数、化合物信息转化为z坐标,形成三维的可视化信息图。
浏览器根据用户操作请求获取关联关系id,并通过关联关系id查找其对应的可视化信息图的数据信息。其中,用户操作请求为用户利用鼠标、键盘或控制面板等设备在浏览器上进行点击、框选、下钻、悬停、双击等操作。用户进行点击、框选、下钻等操作,通过关联关系id生成数据索引用来做交互;例如,点击“特征图”中m/z=620.3959Da、rt=170.39s的点,浏览器获取该点的id后,通过关联关系id找到对应“T-test”图、“ROC”图、“Box Plot”图、“HeatMap”图所在表的id信息。
浏览器根据关联关系id查找后端服务器返回的数据信息,并通过可视化组件将关联关系id对应的可视化信息图展示在质谱识别界面中。通过找到关联关系id,查找后端服务器返回的表数据,进行绘图。例如,在“T-test”图返回p=0.04,在“ROC”图返回AUC=0.6422;通过echarts组件进行相应的绘图与展示,例如,绘制“T-test”图、“ROC”图、“BoxPlot”图、“HeatMap”图。
第二种可视化交互方法为:
浏览器获取质谱信息数据,包含算法生成的统计信息和生信信息、后端服务器获取的用户信息,用户利用键盘、鼠标等设备在浏览器上对统计信息进行选择、填写参数范围等操作,例如,选择“模型”为“T-test”,选择“可选参数”为“p”,填写参数范围“小于0.05,”浏览器发送统计信息对应的参数信息给后端服务器。
后端服务器把用户提交的上述参数信息给算法服务器,算法服务器根据提交参数进行统计过滤计算,包含但不限于交、并、表联合、表过滤等,例如计算p小于0.05,得到结果“654”发送给后端服务器。
后端服务器再把算法结果数据“654”传输给浏览器,浏览器获取数据后,查找对应的可视化信息图,更新该可视化信息图,并展示在质谱识别界面中。
第二种实施例是在第一种实施例的基础上,增加了一种算法服务器、后端服务器、浏览器协同交互的技术方案,用于统计信息、可视化结果的交互。
第三种可视化交互方法,具体为:
浏览器获取质谱信息数据,包含算法生成的生信信息、后端服务器获取的用户权限信息和数据库信息,用户对数据库信息进行选择、标注等操作后产生了交互信息,例如,用户点击“标注”,浏览器发送交互信息,包含特征、样本组织、化合物、设备id、标注信息id、文件存储路径信息给后端服务器;其中的算法为峰检测、峰匹配、峰对齐算法中的任意一种。后端服务器根据交互信息更新数据库信息,并将更新后的数据库信息发送回浏览器。其中,更新数据库信息可以包括:增加信息、删除信息或修改信息等。
浏览器将更新后的数据库信息展示在质谱识别界面中。
第三种可视化交互方法是除上述方法外的普通的互联网前后端交互方式。
本发明在使用峰检测算法的基础上,将质谱信息数据数字化,从而可以进一步可视化。
另外,传统的数据处理软件并没有进行可视化交互,仅仅是算法生成图片展示,而本申请采用前端绘图,把数据之间关联id找到,从而可以进行可视化交互。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。

Claims (10)

1.一种质谱数据自动上传方法,其特征在于,包括:
获取满足第一预设条件的第一质谱数据文件,所述第一质谱数据文件包含有多种文件格式;
将所述第一质谱数据文件转换为统一格式的第二质谱数据文件;
利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器。
2.根据权利要求1所述的质谱数据自动上传方法,其特征在于,利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
解析CSV表格,得到待上传文件列表;所述CSV表格中包括待上传的所述第二质谱数据文件的文件路径及对应的标签信息;
逐一判断所述待上传文件列表中的所述第二质谱数据文件是否存在,若存在,则利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器;若不存在,则跳过并查询下一个所述第二质谱数据文件是否存在,若查询至所述待上传文件列表末尾则重新转至开头,直至所有所述第二质谱数据文件均已生成并利用所述Post方法上传至所述后端服务器;
优选地,所述标签信息包括项目名称、实验组别和标签;
优选地,所述CSV表格中还包括待上传的所述第二质谱数据文件所属文件夹的路径及对应的标签信息。
3.根据权利要求1所述的质谱数据自动上传方法,其特征在于,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之前,还包括:
压缩所述第二质谱数据文件;
相应地,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
利用HTTP协议中的Post方法,将压缩后的所述第二质谱数据文件自动上传至后端服务器;
优选地,压缩所述第二质谱数据文件,具体为:
提取所述第二质谱数据文件中质谱数据中的ROI部分,具体为:
提取预设MZ差距范围内,RT方向上满足第二预设条件并连贯的一组峰值数据。
4.根据权利要求1所述的质谱数据自动上传方法,其特征在于,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之前,还包括:
将所述第二质谱数据文件发送至计算盒;所述计算盒中包括深度学习方法,用于进行峰计算;
获取所述计算盒输出的计算结果;
相应地,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
利用HTTP协议中的Post方法,将所述计算结果自动上传至后端服务器。
5.根据权利要求1-4任一项所述的质谱数据自动上传方法,其特征在于,在所述获取满足第一预设条件的第一质谱数据文件之前,还包括:
获取质谱仪输出的所有质谱数据文件;
对所有所述质谱数据文件中的质谱数据进行三维矩阵化,得到预览图;
利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器;
所述后端服务器将接收的所述预览图发送至终端;
优选地,对所有所述质谱数据文件中的质谱数据进行三维矩阵化,得到预览图,具体为:
将所述质谱数据中的rt和mz分别作为行和列,对应位置的Intensity作为值,将所述质谱数据三维矩阵化;
将每个Intensity值映射为3通道32位的彩色像素点,然后把彩色像素点矩阵转化为图像或者通过读取rt-Intensity求和获得TIC图,又或者对mz-Intensity求和获得EIC图,将所述图像、所述TIC图或所述EIC图作为预览图;
优选地,所述后端服务器将接收的所述预览图发送至终端,具体为:
所述后端服务器将接收的所述预览图通过查找账号发送给浏览器、手机绑定微信号、绑定邮箱账号,以展示在pc设备或者手机移动设备上;
优选地,在所述利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器之前,还包括:
利用异常停止检测算法和/或异常峰检测算法,检测所述预览图,得到异常检测结果;
相应地,利用HTTP协议中的Post方法,将所述预览图自动上传至后端服务器;所述后端服务器将接收的所述预览图发送至终端,具体为:
利用HTTP协议中的Post方法,将所述预览图和所述异常检测结果自动上传至后端服务器;所述后端服务器将接收的所述预览图和所述异常检测结果发送至所述终端;
优选地,所述异常检测结果包括异常样本和异常情况说明。
6.根据权利要求2所述的质谱数据自动上传方法,其特征在于,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
从所述后端服务器获取没有标签信息的所述第二质谱数据文件的列表,记为第一数据列表;
为所述第一数据列表中的所述第二质谱数据文件添加标签信息;
将添加了标签信息的所述第一数据列表上传至所述后端服务器。
7.根据权利要求5所述的质谱数据自动上传方法,其特征在于,在所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
客户端向所述后端服务器发送所选取的分析模板;
所述后端服务器将所有所述质谱数据文件中的质谱数据和所述分析模板传输给算法服务器进行处理分析;
获取所述算法服务器的分析结果,并将其展示在质谱识别平台界面;
优选地,所述分析模板的生成步骤包括:
浏览器向所述后端服务器发起运行任务请求,所述运行任务请求中包括编辑好的节点、超节点和流程连接线的数据信息;
所述后端服务器将接收到的所述数据信息发送给算法服务器,并接收所述算法服务器返回的结果;
所述后端服务器返回运行成功状态给所述浏览器,所述浏览器向所述后端服务器发送保存为模板请求,并清除数据源参数,将剩余所有参数传输给所述后端服务器;
所述后端服务器将接收到的参数存储在数据库中,保存为可以复用的个性化模板;
优选地,所述模板包括多个不同任务子模板;
所述不同任务子模板包括分子识别子模板、样本识别子模板、样本靶向识别子模板和差异分析子模板。
8.根据权利要求1所述的质谱数据自动上传方法,其特征在于,所述利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器,具体为:
当浏览器或客户端发起多个上传任务时,所述浏览器或客户端将所有任务的id和每个id对应的第二质谱数据发送给后端服务器;
所述后端服务器将接收的所述id和每个id对应的第二质谱数据发送给任务队列服务器,所述任务队列服务器分配计算资源和开启线程,并把所述id和每个id对应的第二质谱数据转发给算法服务器;
所述算法服务器接收数据后,开始执行第一处理,并将处理结果返回所述任务队列服务器;其中,所述第一处理包括计算、机器学习、深度学习中的任意一种;
所述任务队列服务器将接收到的处理结果通过socket转发给所述浏览器或所述客户端;
所述浏览器或所述客户端利用HTTP协议中的Post方法,将所有任务中的第二质谱数据文件自动上传至后端服务器。
9.根据权利要求1所述的质谱数据自动上传方法,其特征在于,在利用HTTP协议中的Post方法,将所述第二质谱数据文件自动上传至后端服务器之后,还包括:
客户端或浏览器请求生信数据,后端服务器将所述生信数据发送至所述客户端或所述浏览器;所述生信数据包括所述第二质谱数据文件及利用所述第二质谱数据文件生成的信息;
所述客户端或所述浏览器利用所述生信数据建立二维或三维的可视化信息图,并建立所述第二质谱数据文件及利用所述第二质谱数据文件生成的信息之间的关联关系id;
所述浏览器或所述客户端根据用户操作请求获取所述关联关系id,并通过所述关联关系id查找其对应的可视化信息图的数据信息;
所述浏览器或所述客户端根据所述关联关系id查找后端服务器返回的所述数据信息,并通过可视化组件将所述关联关系id对应的可视化信息图展示在质谱识别界面中。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述方法的步骤。
CN202110445233.2A 2020-11-10 2021-04-23 质谱数据自动上传方法及终端设备 Pending CN113204687A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020112494440 2020-11-10
CN202011249444 2020-11-10

Publications (1)

Publication Number Publication Date
CN113204687A true CN113204687A (zh) 2021-08-03

Family

ID=77028355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110445233.2A Pending CN113204687A (zh) 2020-11-10 2021-04-23 质谱数据自动上传方法及终端设备

Country Status (2)

Country Link
CN (1) CN113204687A (zh)
WO (1) WO2022100007A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115239338A (zh) * 2022-08-01 2022-10-25 中科泰岳(北京)科技有限公司 一种数据自动上传的业财一体化收费系统
CN115334053A (zh) * 2022-08-03 2022-11-11 深圳乐播科技有限公司 一种云会议中关联投屏的实现方法及相关产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102739692A (zh) * 2011-03-31 2012-10-17 新奥特(北京)视频技术有限公司 一种应用于体育赛事信息系统中的报表上传方法和装置
CN108020491A (zh) * 2016-11-02 2018-05-11 厦门格林德智能精仪科技有限公司 一种实现雾霾在线监测的大数据处理方法
US20200265925A1 (en) * 2017-10-18 2020-08-20 The Regents Of The University Of California Source identification for unknown molecules using mass spectral matching
CN111814864A (zh) * 2020-07-03 2020-10-23 北京中计新科仪器有限公司 一种质谱分析数据人工智能云平台系统及数据分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055558B (zh) * 2006-04-14 2010-10-06 中国科学院计算技术研究所 基于质谱数据同位素模式的质谱有效峰选取方法
CA2726111C (en) * 2008-07-23 2015-01-27 P Devices Inc. Portable plasma based diagnostic apparatus and diagnostic method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102739692A (zh) * 2011-03-31 2012-10-17 新奥特(北京)视频技术有限公司 一种应用于体育赛事信息系统中的报表上传方法和装置
CN108020491A (zh) * 2016-11-02 2018-05-11 厦门格林德智能精仪科技有限公司 一种实现雾霾在线监测的大数据处理方法
US20200265925A1 (en) * 2017-10-18 2020-08-20 The Regents Of The University Of California Source identification for unknown molecules using mass spectral matching
CN111814864A (zh) * 2020-07-03 2020-10-23 北京中计新科仪器有限公司 一种质谱分析数据人工智能云平台系统及数据分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姚卫峰 等: "以mzXML格式文件搭建中药色谱质谱联用数据的MATLAB分析平台", 南京中医药大学学报, vol. 26, no. 05, pages 1 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115239338A (zh) * 2022-08-01 2022-10-25 中科泰岳(北京)科技有限公司 一种数据自动上传的业财一体化收费系统
CN115334053A (zh) * 2022-08-03 2022-11-11 深圳乐播科技有限公司 一种云会议中关联投屏的实现方法及相关产品
CN115334053B (zh) * 2022-08-03 2023-07-18 深圳乐播科技有限公司 一种云会议中关联投屏的实现方法及相关产品

Also Published As

Publication number Publication date
WO2022100007A1 (zh) 2022-05-19

Similar Documents

Publication Publication Date Title
US11605226B2 (en) Video data processing method and apparatus, and readable storage medium
US20210256320A1 (en) Machine learning artificialintelligence system for identifying vehicles
US11483621B2 (en) Big data acquisition and analysis system using intelligent image recognition, and application method thereof
US9639782B2 (en) Providing image search templates
CN111523566A (zh) 目标视频片段定位方法和装置
CN113204687A (zh) 质谱数据自动上传方法及终端设备
CN110362714A (zh) 视频内容的搜索方法和装置
CN112637629A (zh) 直播内容推荐方法及装置、电子设备和介质
EP3944592B1 (en) Voice packet recommendation
CN106603690A (zh) 数据分析装置、数据分析处理系统和数据分析方法
CN111352903A (zh) 日志管理平台、日志管理方法、介质以及电子设备
WO2015101074A1 (zh) 基于图片的识图方法、系统、设备及装置
US11038789B2 (en) System and method for automated generation of web decoding templates
WO2023130837A1 (zh) 面向科研应用的自动机器学习实现方法、平台及装置
CN113891105A (zh) 画面显示方法和装置、存储介质及电子设备
US10437847B1 (en) Transformation based sampling for preprocessing big data
CN115221453B (zh) 媒体资源管理方法、装置、服务器、介质
CN116578656A (zh) 一种基于交互可视化的多维数据分析方法
CN116701779A (zh) 协同标注的数据筛选方法、装置、会议系统、终端及介质
CN110765296A (zh) 图像搜索方法、终端设备及存储介质
Le et al. A large-Scale TV Dataset for partial video copy detection
CN115631374A (zh) 控件操作方法、控件检测模型的训练方法、装置和设备
WO2022012107A1 (zh) 用于显示插件的方法及装置
US20200327714A1 (en) Methods and Apparatuses for Image Control and Display of Particle Analyzer Images
CN110035298B (zh) 一种媒体快速播放方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination