CN116072230A - 一种唾液生物标志物数据库的建立方法、装置及设备 - Google Patents

一种唾液生物标志物数据库的建立方法、装置及设备 Download PDF

Info

Publication number
CN116072230A
CN116072230A CN202211723513.6A CN202211723513A CN116072230A CN 116072230 A CN116072230 A CN 116072230A CN 202211723513 A CN202211723513 A CN 202211723513A CN 116072230 A CN116072230 A CN 116072230A
Authority
CN
China
Prior art keywords
saliva
data
biomarker
matching
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211723513.6A
Other languages
English (en)
Inventor
王松
刘伟强
陈明
赖树生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Zhongheng Innovation Pharmaceutical Research Co ltd
Shenzhen Research Institute Tsinghua University
Original Assignee
Guangxi Zhongheng Innovation Pharmaceutical Research Co ltd
Shenzhen Research Institute Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Zhongheng Innovation Pharmaceutical Research Co ltd, Shenzhen Research Institute Tsinghua University filed Critical Guangxi Zhongheng Innovation Pharmaceutical Research Co ltd
Priority to CN202211723513.6A priority Critical patent/CN116072230A/zh
Publication of CN116072230A publication Critical patent/CN116072230A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请提供一种唾液生物标志物数据库的建立方法、装置及设备,涉及生物技术领域。该方法包括:获取目标数据,目标数据包括唾液样本数据和唾液样本数据所属用户的病理信息,唾液样本数据为两个或两个以上用户的唾液样本;按照不同生物标志物的含量高低,对唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;从若干组唾液数据中确定第一匹配数据,第一匹配数据为生物标志物与疾病的关联匹配数据;根据第一匹配数据,建立唾液生物标志物数据库,提高了生物标志物与疾病关联匹配的准确率,使得可以通过患者唾液中的生物标志物,快速并准确地完成对患者疾病的判定。

Description

一种唾液生物标志物数据库的建立方法、装置及设备
技术领域
本申请涉及生物技术领域,尤其涉及一种唾液生物标志物数据库的建立方法、装置及设备。
背景技术
随着基因测序技术的持续发展,可以通过专用装置比如基因测序仪检测基因变化,进行生物液体内部基因、激素或各种生物标志物的含量获取。利用生物标志物,能够方便地对生物体的病理信息进行分析,以确定生物体的病理信息。
目前,在获取生物体的病理信息时,一般是使用外置辐射仪器或者抽取生物体的体液的方式来获取生物体的病理信息。这些获取生物体的病理信息的方式中,存在着获取步骤复杂、对生物体造成一定伤害,以及多次使用时会给生物体带来一定的安全风险。
发明内容
本申请实施例提供了一种唾液生物标志物数据库的建立方法、装置及设备,可以有效地提高生物标志物与疾病关联匹配的准确率,使得可以通过患者唾液中的生物标志物,快速并准确地完成对患者疾病的判定。
第一方面,本申请提供一种唾液生物标志物数据库的建立方法,包括:获取目标数据,上述目标数据包括唾液样本数据和上述唾液样本数据所属用户的病理信息,上述唾液样本数据为两个或两个以上用户的唾液样本;按照不同生物标志物的含量高低,对上述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;从若干组上述唾液数据中确定第一匹配数据,上述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与上述生物标志物关联匹配的疾病;根据上述第一匹配数据,建立唾液生物标志物数据库。
本申请通过在获取包含唾液样本数据和上述唾液样本数据所属用户的病理信息的目标数据之后,按照不同生物标志物的含量高低,对该唾液样本数据进行分类排序,得到若干组对应不同生物标志物的唾液数据,再从该若干组唾液数据中确定第一匹配数据,即生物标志物与疾病的关联匹配数据,并根据该第一匹配数据建立唾液生物标志物数据库,提高了生物标志物与疾病关联匹配的准确率,使得可以通过患者唾液中的生物标志物,快速并准确地完成对患者疾病的判定,减少了因使用外置辐射仪器或者抽取生物体的体液的方式的步骤,降低了对生物体的伤害,具有较高的判定准确率。
在第一方面提供的一个可选方式中,上述按照不同生物标志物的含量高低,对上述唾液样本数据进行分类排序,得到若干组唾液数据,包括:
对于任意一种生物标志物,执行下述方法以对上述唾液样本数据进行分类,获取上述唾液样本数据中每个唾液样本中当前生物标志物的含量;
按照获取的当前生物标志物的含量高低,对上述唾液样本数据进行排序,得到排序后的唾液样本数据;
从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,上述M为大于1的整数。
在第一方面提供的另一个可选方式中,上述从若干组上述唾液数据中确定第一匹配数据,包括:
根据预设的生物标志物与疾病匹配条件,从若干组上述唾液数据中确定第一匹配数据,上述预设的生物标志物与疾病匹配条件为生物标志物的数量与符合预设的疾病出现次数要求的病理信息的数量的比例为第一预设比例。
在第一方面提供的另一个可选方式中,上述第一预设比例为1:3。
在第一方面提供的另一个可选方式中,上述从若干组上述唾液数据中确定第一匹配数据,包括:
对于每组唾液数据,执行下述方法以从每组唾液数据中确定上述第一匹配数据,统计每组唾液数据中的疾病出现次数;
按照疾病出现次数的高低,对当前组唾液数据中的病理信息进行排序;
从排序后的病理信息中,选取排名在前N的病理信息,作为与当前组唾液数据对应的生物标志物相关联匹配的病理信息,得到上述第一匹配数据,上述N为大于1的整数。
在第一方面提供的另一个可选方式中,上述根据上述第一匹配数据,建立唾液生物标志物数据库中,包括:
根据上述第一匹配数据,建立离散分布曲线图,上述离散分布曲线图为利用在二维平面上随机分布的离散点,进行二维拟合后得到的曲线图,在二维平面上随机分布的离散点为基于不同生物标志物种类与其所关联的疾病的出现次数进行定位的点;
将上述离散分布曲线图存储至上述唾液生物标志物数据中。
第二方面,本申请提供一种唾液生物标志物数据库的建立装置,包括:
目标数据获取单元,用于获取目标数据,上述目标数据包括唾液样本数据和上述唾液样本数据所属用户的病理信息,上述唾液样本数据为两个或两个以上用户的唾液样本;
唾液分类排序单元,用于按照不同生物标志物的含量高低,对上述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;
第一匹配数据确定单元,用于从若干组上述唾液数据中确定第一匹配数据,上述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与上述生物标志物关联匹配的疾病;
唾液生物标志物数据库建立单元,用于根据上述第一匹配数据,建立唾液生物标志物数据库。
在第二方面提供的一个可选方式中,上述唾液分类排序单元,用于:
获取上述唾液样本数据中每个唾液样本中当前生物标志物的含量;
按照获取的当前生物标志物的含量高低,对上述唾液样本数据进行排序,得到排序后的唾液样本数据;
从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,上述M为大于1的整数。
在第二方面提供的另一个可选方式中,上述第一匹配数据确定单元,用于:
根据预设的生物标志物与疾病匹配条件,从若干组上述唾液数据中确定第一匹配数据,上述预设的生物标志物与疾病匹配条件为生物标志物的数量与符合预设的疾病出现次数要求的病理信息的数量的比例为第一预设比例。
在第二方面提供的另一个可选方式中,上述第一预设比例为1:3。
在第二方面提供的另一个可选方式中,上述第一匹配数据确定单元,用于:
统计每组唾液数据中的疾病出现次数;
按照疾病出现次数的高低,对当前组唾液数据中的病理信息进行排序;
从排序后的病理信息中,选取排名在前N的病理信息,作为与当前组唾液数据对应的生物标志物相关联匹配的病理信息,得到上述第一匹配数据,上述N为大于1的整数。
在第二方面提供的另一个可选方式中,上述装置还包括:
离散分布曲线图建立单元,用于根据上述第一匹配数据,建立离散分布曲线图,上述离散分布曲线图为利用在二维平面上随机分布的离散点,进行二维拟合后得到的曲线图,在二维平面上随机分布的离散点为基于不同生物标志物种类与其所关联的疾病的出现次数进行定位的点;
离散分布曲线图存储单元,用于将上述离散分布曲线图存储至上述唾液生物标志物数据中。
第三方面,本申请提供一种唾液生物标志物数据库的建立设备,包括处理器、存储器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如第一方面或第一方面的任意可选方式上述的方法。
第四方面,本申请提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面或第一方面的任意可选方式上述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在唾液生物标志物数据库的建立设备上运行时,使得唾液生物标志物数据库的建立设备执行上述第一方面上述的唾液生物标志物数据库的建立方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种唾液生物标志物数据库的建立方法的流程示意图;
图2是本申请实施例提供的一种唾液样本数据的分类方法的流程示意图;
图3是本申请实施例提供的一种第一匹配数据的确定方法的流程示意图;
图4是本申请实施例提供的一种唾液生物标志物数据库的建立装置的结构示意图;
图5是本申请实施例提供的一种唾液生物标志物数据库的建立设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定装置结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的装置、系统、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
还应当理解,在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在说明本申请实施例提供的唾液生物标志物数据库的建立方法之前,对本申请实施例中涉及的唾液、生物标志物等进行示例性说明,具体如下:
唾液:是由唾液腺分泌液、龈沟液和黏膜渗出液等构成的混合性液体,储存了大量的人类口腔微生物和口腔局部组织以及身体其他部位感染微生物的DNA、RNA、蛋白质及代谢产物。
生物标志物:是正常生物学、病理学过程和对治疗的药理学反应过程中变化的分子特征与指标,可以为疾病的检测、诊断和预后提供有用的信息。
唾液作为一种生物标志物检测的理想诊断介质,其取材具有不侵袭性、易于采集、携带方便、贮存与运输成本低等优点。直至目前为止,已发现的人体唾液中唾液生物标志物存在120种,和唾液生物标志物相互关联的疾病有将近80多种,通过唾液能够确认多数疾病,对于大多数常见的疾病,唾液生物标志物都能够进行关联判定,并且具有较高的准确率,例如糖尿病等疾病上准确率在一定程度上和外置辐射仪器或体液抽取等病患信息获取方式相同,因此,利用唾液生物标志物和相匹配的病理信息建立唾液生物标志物数据库,可以快速并准确地对患者信息进行匹配,从而降低多次使用外置辐射仪器或者抽取生物体的体液的方式来获取生物体的病理信息而对生物体造成的伤害以及安全风险,操作步骤简单且有效,可以利用所建立的唾液生物标志物数据库快速并准确地确定患者的病理信息。
请参见图1,图1是本申请实施例提供的一种唾液生物标志物数据库的建立方法的流程示意图,详述如下:
步骤S101,获取目标数据,上述目标数据包括唾液样本数据和上述唾液样本数据所属用户的病理信息,上述唾液样本数据为两个或两个以上用户的唾液样本。
在本申请实施例中,通过唾液采集终端采集不同用户的唾液样本,并对不同用户的唾液样本进行编号标记,比如按照数字递增的方式逐一对采集到的唾液样本进行标号处理,得到由不同用户的唾液样本组成的唾液样本数据,并同时采集该唾液样本所属用户的病理信息,并将唾液样本标号和对应用户的病理信息进行关联,从而得到上述目标数据。
本申请实施例中的唾液采集终端包括唾液采集装置、电子数据采集显示面板、网络数据上传终端、移动车等,通过移动车将唾液采集装置移动到需要采集唾液的用户面前,在电子数据采集显示界面对采集到的唾液样本进行编号标记或记录进行化学分析后得到的生物标志物等参数,然后通过网络数据上传终端将数据存储在云服务器中。
在本申请的一些实施例中,通过化学分析对采集到的唾液样本进行内部生物标志物的含量分析,记录每个唾液样本中包含的生物标志物以及生物标志物的含量,将该唾液样本标号,包含的生物标志物、生物标志物的含量以及对应用户的病理信息等数据进行关联后存储到云服务器中以便于后续唾液生物标志物数据库的建立或完善。
本申请实施例中的化学分析,是以物质之间的化学反应为基础的一种经典分析方法,比如微量显色反应(主要有酸碱反应、氧化还原反应、络合反应等)、微量沉淀反应与显微结晶试验等,利用化学分析法能够获取唾液中pH值数据、隐血数据、非蛋白氮类物质种类含量数据、激素含量数据等,其中非蛋白氮类物质和激素为唾液生物标志物。
可以理解的是,将唾液样本标号,包含的生物标志物、生物标志物的含量以及对应用户的病理信息等数据进行关联的方式可以是为唾液样本标号设定唯一的标识,并基于该唯一的标识将其包含的生物标志物、生物标志物的含量以及对应用户的病理信息等数据进行关联,也可以是为生物标志物设定唯一标识,并基于这一生物标志物的唯一标识对其他数据进行关联,本申请实施例中对具体的关联方式不做限定。
步骤S102,按照不同生物标志物的含量高低,对上述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物。
在本申请实施例中,唾液中包含有多种生物标志物,唾液中包含的生物标志物包括但不限于幽门螺杆菌尿素通道蛋白基因UreI、结核杆菌rpoB基因、唾液蛋白质。
按照不同生物标志物的含量高低,对唾液样本数据进行排序,得到不同生物标志物对应的具有不同排序的唾液样本数据,比如,对于幽门螺杆菌尿素通道蛋白基因UreI这一生物标志物的含量高低,得到第一排序的唾液样本数据,对于结核杆菌rpoB基因这一生物标志物的含量高低,得到第二排序的唾液样本数据,从而得到不同生物标志物对应的若干组唾液数据。
在本申请实施例中,按照不同生物标志物的含量高低对唾液样本数据进行排序,是为了得到与该生物标志物关联程度较高的疾病,从而提高基于生物标志物确定疾病的准确率,为准确确定用户的疾病打好基础。
对于任意一种生物标志物,执行如图2所示的方法以对上述唾液样本数据进行分类。
具体的,请参见图2,图2是本申请实施例提供的一种唾液样本数据的分类方法的流程示意图,详述如下:
步骤S201,获取上述唾液样本数据中每个唾液样本中当前生物标志物的含量。
在本申请实施例中,唾液样本数据由两个或两个以上的用户的唾液样本组成,而每个唾液样本中因用户的病理信息即用户所患有的疾病不同,所包含的生物标志物或生物标志物的含量也不尽相同,为了提高生物标志物与疾病的关联程度,需要根据每个唾液样本中生物标志物的含量高低来对唾液样本数据进行排序,从而得到不同生物标志物下的唾液样本数据。
步骤S202,按照获取的当前生物标志物的含量高低,对上述唾液样本数据进行排序,得到排序后的唾液样本数据。
在本申请实施例中,按照当前生物标志物的含量高低,从高到低对唾液样本数据中的每个唾液样本进行重新排序,得到排序后的唾液样本数据,也即该排序后的唾液样本数据中的唾液样本,按照当前生物标志物的含量,从高到低进行排序。
在本申请的一些实施例中,将按照生物标志物的含量高低进行排序后的唾液样本数据进行表格绘制,以生物标志物为类别,得到不同区块集合的唾液样本数据,通过表格对该不同区分集合中的唾液样本进行分类,以便于建立唾液生物标志物数据库。
步骤S203,从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,上述M为大于1的整数。
在本申请实施例中,唾液样本数据一般包含两位或两位数以上的唾液样本,当唾液样本越多,唾液样本数据越大,如果对全部的唾液样本进行疾病关联,不仅效率低下,而且可能会降低生物标志物与疾病的关联程度,因此,需要从排序后的唾液样本数据中,选取排名在前M比如排名在前100的唾液样本,作为当前生物标志物对应的一组唾液数据。
当基于已知的生物标志物,得到对应数量的唾液数据后,也即得到与生物标志物数量一致的若干组唾液数据后,再基于该若干组唾液数据确定与每种生物标志物相关联匹配的疾病,从而建立唾液生物标志物数据库,以便于在该唾液生物标志物数据库中根据生物标志物快速地匹配到该生物标志物相关联匹配的疾病。
步骤S103,从若干组上述唾液数据中确定第一匹配数据,上述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与上述生物标志物关联匹配的疾病。
在本申请实施例中,根据预设的生物标志物与疾病匹配条件,从若干组上述唾液数据中确定第一匹配数据,上述预设的生物标志物与疾病匹配条件为生物标志物的数量与符合预设的疾病出现次数要求的病理信息的数量的比例为第一预设比例。
在本申请的一些实施例中,第一预设比例优选为1:3,即生物标志物数量与符合预设的疾病出现次数要求的病理信息的数量的比例1:3。
需要说明的是,第一预设比例也可以为1:3之外的其他比例值,这里不做具体限定。
本申请实施例中符合预设的疾病出现次数要求的病理信息的数量,是指疾病出现次数排名在前的若干个病理信息。
对于每组唾液数据,执行如图3所示的方法以从每组唾液数据中确定上述第一匹配数据。
具体的,请参见图3,图3是本申请实施例提供的一种第一匹配数据的确定方法的流程示意图,详述如下:
步骤S301,统计每组唾液数据中的疾病出现次数。
在本申请实施例中,每组唾液数据为根据某一生物标志物的含量高低后进行排序后选取的排名在前M的唾液样本数据,当排名在前M的唾液样本中相关联的疾病的出现次数越高,说明该出现次数越高的疾病与该生物标志物的关联程度越高,因此,可以通过统计每组唾液数据中的疾病出现次数,以便于确定与当前生物标志物相关联匹配的疾病。
步骤S302,按照疾病出现次数的高低,对当前组唾液数据中的病理信息进行排序。
在本申请实施例中,按照疾病出现次数的高低,从高到低对当前组唾液数据中的病理信息进行排序。
步骤S303,从排序后的病理信息中,选取排名在前N的病理信息,作为与当前组唾液数据对应的生物标志物相关联匹配的病理信息,得到上述第一匹配数据,上述N为大于1的整数。
在本申请实施例中,当统计出每组唾液数据中的疾病出现次数后,按照疾病出现次数的高低,从高到低地对每组唾液数据中的病理信息进行排序,这时,出现次数较高的疾病也即病理信息将排名在前,选取排名在前N的病理信息,比如排名在前3的病理信息,作为当前组唾液数据对应的生物标志物相关联匹配的病理信息,这时,每一生物标志物与三个病理信息相关联匹配,满足第一预设比例的要求,每一组唾液数据对应得到三个病理信息作为该组唾液数据对应的生物标志物相关联匹配的疾病,从而得到第一匹配数据。
步骤S104,根据上述第一匹配数据,建立唾液生物标志物数据库。
在本申请实施例中,将第一匹配数据中的生物标志物和与该生物标志物关联匹配的疾病建立关联标识,并将建立关联标识的第一匹配数据存储到指定位置中,建立唾液生物标志物数据库,通过该关联标识,可以在该唾液生物标志数据库中通过查找生物标志物的方式确定该生物标志物相关联匹配的N个病理信息,或者通过该N个病理信息中的任意一个或多个,确定相关联匹配的生物标志物。
在本申请的一些实施例中,在建立唾液生物标志物数据库时,根据上述第一匹配数据,建立离散分布曲线图,并将上述离散分布曲线图存储至上述唾液生物标志物数据中。
本申请实施例中的离散分布曲线图为利用在二维平面上随机分布的离散点,进行二维拟合后得到的曲线图,在二维平面上随机分布的离散点为基于不同生物标志物种类与其所关联的疾病的出现次数进行定位的点。
在本申请实施例中,离散分布曲线图可以方便并直观地显示病理信息和生物标志物的关联匹配关系,出现在y轴上的病理信息的次数约到,证明生物标志物的识别准确率越高,通过离散分布曲线图也可以帮助医生快速并准确地判定患者的病理信息。
需要说明的是,当唾液样本数据更新时,比如新增一个或多个用户的唾液样本时,根据图1至图3的方法对唾液生物标志物数据库进行更新,并更新离散分布曲线图,以保证唾液生物标志物数据库和离散分布曲线图的准确性和实时性。
在本申请实施例中,通过在获取包含唾液样本数据和上述唾液样本数据所属用户的病理信息的目标数据之后,按照不同生物标志物的含量高低,对该唾液样本数据进行分类排序,得到若干组对应不同生物标志物的唾液数据,在从该若干组唾液数据中确定第一匹配数据,即生物标志物与疾病的关联匹配数据,并根据该第一匹配数据建立唾液生物标志物数据库,提高了生物标志物与疾病关联匹配的准确率,使得可以通过患者唾液中的生物标志物,快速并准确地完成对患者疾病的判定,减少了因使用外置辐射仪器或者抽取生物体的体液的方式的步骤,降低了对生物体的伤害,具有较高的判定准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
基于上述实施例所提供的唾液生物标志物数据库的建立方法,本申请实施例进一步给出实现上述方法实施例的装置实施例。
请参见图4,图4是本申请实施例提供的唾液生物标志物数据库的建立装置的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,唾液生物标志物数据库的建立装置4包括:
目标数据获取单元41,用于获取目标数据,上述目标数据包括唾液样本数据和上述唾液样本数据所属用户的病理信息,上述唾液样本数据为两个或两个以上用户的唾液样本;
唾液分类排序单元42,用于按照不同生物标志物的含量高低,对上述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;
第一匹配数据确定单元43,用于从若干组上述唾液数据中确定第一匹配数据,上述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与上述生物标志物关联匹配的疾病;
唾液生物标志物数据库建立单元44,用于根据上述第一匹配数据,建立唾液生物标志物数据库。
在本申请的一些实施例中,上述唾液分类排序单元42,用于:
获取上述唾液样本数据中每个唾液样本中当前生物标志物的含量;
按照获取的当前生物标志物的含量高低,对上述唾液样本数据进行排序,得到排序后的唾液样本数据;
从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,上述M为大于1的整数。
在本申请的另一些实施例中,上述第一匹配数据确定单元43,用于:
根据预设的生物标志物与疾病匹配条件,从若干组上述唾液数据中确定第一匹配数据,上述预设的生物标志物与疾病匹配条件为生物标志物的数量与符合预设的疾病出现次数要求的病理信息的数量的比例为第一预设比例。
在本申请的另一些实施例中,上述第一预设比例为1:3。
在本申请的另一些实施例中,上述第一匹配数据确定单元43,用于:
统计每组唾液数据中的疾病出现次数;
按照疾病出现次数的高低,对当前组唾液数据中的病理信息进行排序;
从排序后的病理信息中,选取排名在前N的病理信息,作为与当前组唾液数据对应的生物标志物相关联匹配的病理信息,得到上述第一匹配数据,上述N为大于1的整数。
在本申请的另一些实施例中,上述装置还包括:
离散分布曲线图建立单元,用于根据上述第一匹配数据,建立离散分布曲线图,上述离散分布曲线图为利用在二维平面上随机分布的离散点,进行二维拟合后得到的曲线图,在二维平面上随机分布的离散点为基于不同生物标志物种类与其所关联的疾病的出现次数进行定位的点;
离散分布曲线图存储单元,用于将上述离散分布曲线图存储至上述唾液生物标志物数据中。
在本申请实施例中,通过在获取包含唾液样本数据和上述唾液样本数据所属用户的病理信息的目标数据之后,按照不同生物标志物的含量高低,对该唾液样本数据进行分类排序,得到若干组对应不同生物标志物的唾液数据,在从该若干组唾液数据中确定第一匹配数据,即生物标志物与疾病的关联匹配数据,并根据该第一匹配数据建立唾液生物标志物数据库,提高了生物标志物与疾病关联匹配的准确率,使得可以通过患者唾液中的生物标志物,快速并准确地完成对患者疾病的判定,减少了因使用外置辐射仪器或者抽取生物体的体液的方式的步骤,降低了对生物体的伤害,具有较高的判定准确率。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图5是本申请实施例提供的唾液生物标志物数据库的建立设备的示意图。如图5所示,该实施例的唾液生物标志物数据库的建立设备5包括:处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52,例如语音识别程序。处理器50执行计算机程序52时实现上述各个唾液生物标志物数据库的建立方法实施例中的步骤,例如图1所示的步骤101-104。或者,处理器50执行计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示单元41-44的功能。
示例性的,计算机程序52可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器51中,并由处理器50执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序52在唾液生物标志物数据库的建立设备5中的执行过程。例如,计算机程序52可以被分割成目标数据获取单元41、唾液分类排序单元42、第一匹配数据确定单元43、唾液生物标志物数据库建立单元44,各单元具体功能请参阅图1对应的实施例中地相关描述,此处不赘述。
唾液生物标志物数据库的建立设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是唾液生物标志物数据库的建立设备5的示例,并不构成对唾液生物标志物数据库的建立设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如唾液生物标志物数据库的建立设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器51可以是唾液生物标志物数据库的建立设备5的内部存储单元,例如唾液生物标志物数据库的建立设备5的硬盘或内存。存储器51也可以是唾液生物标志物数据库的建立设备5的外部存储设备,例如唾液生物标志物数据库的建立设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器51还可以既包括唾液生物标志物数据库的建立设备5的内部存储单元也包括外部存储设备。存储器51用于存储计算机程序以及唾液生物标志物数据库的建立设备所需的其他程序和数据。存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时可实现上述唾液生物标志物数据库的建立方法。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在唾液生物标志物数据库的建立设备上运行时,使得唾液生物标志物数据库的建立设备执行时实现可实现上述唾液生物标志物数据库的建立方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种唾液生物标志物数据库的建立方法,其特征在于,所述方法包括:
获取目标数据,所述目标数据包括唾液样本数据和所述唾液样本数据所属用户的病理信息,所述唾液样本数据为两个或两个以上用户的唾液样本;
按照不同生物标志物的含量高低,对所述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;
从若干组所述唾液数据中确定第一匹配数据,所述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与所述生物标志物关联匹配的疾病;
根据所述第一匹配数据,建立唾液生物标志物数据库。
2.如权利要求1所述的唾液生物标志物数据库的建立方法,其特征在于,所述按照不同生物标志物的含量高低,对所述唾液样本数据进行分类排序,得到若干组唾液数据,包括:
对于任意一种生物标志物,执行下述方法以对所述唾液样本数据进行分类,获取所述唾液样本数据中每个唾液样本中当前生物标志物的含量;
按照获取的当前生物标志物的含量高低,对所述唾液样本数据进行排序,得到排序后的唾液样本数据;
从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,所述M为大于1的整数。
3.如权利要求1所述的唾液生物标志物数据库的建立方法,其特征在于,所述从若干组所述唾液数据中确定第一匹配数据,包括:
根据预设的生物标志物与疾病匹配条件,从若干组所述唾液数据中确定第一匹配数据,所述预设的生物标志物与疾病匹配条件为生物标志物的数量与符合预设的疾病出现次数要求的病理信息的数量的比例为第一预设比例。
4.如权利要求3所述的唾液生物标志物数据库的建立方法,其特征在于,所述第一预设比例为1:3。
5.如权利要求1所述的唾液生物标志物数据库的建立方法,其特征在于,所述从若干组所述唾液数据中确定第一匹配数据,包括:
对于每组唾液数据,执行下述方法以从每组唾液数据中确定所述第一匹配数据,统计每组唾液数据中的疾病出现次数;
按照疾病出现次数的高低,对当前组唾液数据中的病理信息进行排序;
从排序后的病理信息中,选取排名在前N的病理信息,作为与当前组唾液数据对应的生物标志物相关联匹配的病理信息,得到所述第一匹配数据,所述N为大于1的整数。
6.如权利要求1所述的唾液生物标志物数据库的建立方法,其特征在于,所述根据所述第一匹配数据,建立唾液生物标志物数据库中,包括:
根据所述第一匹配数据,建立离散分布曲线图,所述离散分布曲线图为利用在二维平面上随机分布的离散点,进行二维拟合后得到的曲线图,在二维平面上随机分布的离散点为基于不同生物标志物种类与其所关联的疾病的出现次数进行定位的点;
将所述离散分布曲线图存储至所述唾液生物标志物数据中。
7.一种唾液生物标志物数据库的建立装置,其特征在于,所述装置包括:
目标数据获取单元,用于获取目标数据,所述目标数据包括唾液样本数据和所述唾液样本数据所属用户的病理信息,所述唾液样本数据为两个或两个以上用户的唾液样本;
唾液分类排序单元,用于按照不同生物标志物的含量高低,对所述唾液样本数据进行分类排序,得到若干组唾液数据,每组唾液数据对应一种生物标志物;
第一匹配数据确定单元,用于从若干组所述唾液数据中确定第一匹配数据,所述第一匹配数据为生物标志物与疾病的关联匹配数据,包括生物标志物和与所述生物标志物关联匹配的疾病;
唾液生物标志物数据库建立单元,用于根据所述第一匹配数据,建立唾液生物标志物数据库。
8.如权利要求7所述的唾液生物标志物数据库的建立装置,其特征在于,所述唾液分类排序单元,用于:
获取所述唾液样本数据中每个唾液样本中当前生物标志物的含量;
按照获取的当前生物标志物的含量高低,对所述唾液样本数据进行排序,得到排序后的唾液样本数据;
从排序后的唾液样本数据中,选取排名在前M的唾液样本,作为当前生物标志物对应的一组唾液数据,所述M为大于1的整数。
9.一种唾液生物标志物数据库的建立设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的唾液生物标志物数据库的建立方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的唾液生物标志物数据库的建立方法。
CN202211723513.6A 2022-12-30 2022-12-30 一种唾液生物标志物数据库的建立方法、装置及设备 Pending CN116072230A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211723513.6A CN116072230A (zh) 2022-12-30 2022-12-30 一种唾液生物标志物数据库的建立方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211723513.6A CN116072230A (zh) 2022-12-30 2022-12-30 一种唾液生物标志物数据库的建立方法、装置及设备

Publications (1)

Publication Number Publication Date
CN116072230A true CN116072230A (zh) 2023-05-05

Family

ID=86181451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211723513.6A Pending CN116072230A (zh) 2022-12-30 2022-12-30 一种唾液生物标志物数据库的建立方法、装置及设备

Country Status (1)

Country Link
CN (1) CN116072230A (zh)

Similar Documents

Publication Publication Date Title
CN111009286B (zh) 对宿主样本进行微生物分析的方法和装置
EP2810213B1 (en) System for detecting genes in tissue samples
CN110349629A (zh) 一种利用宏基因组或宏转录组检测微生物的分析方法
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN110060733B (zh) 基于单样本的二代测序肿瘤体细胞变异检测装置
CN112634987B (zh) 一种单样本肿瘤dna拷贝数变异检测的方法和装置
CN109801680A (zh) 基于tcga数据库的肿瘤转移复发预测方法及系统
CN103776891A (zh) 一种检测差异表达蛋白质的方法
CN110875082B (zh) 一种基于靶向扩增测序的微生物检测方法和装置
CN113096736A (zh) 一种基于纳米孔测序的病毒实时自动分析方法及系统
CN113470743A (zh) 一种基于bd单细胞转录组和蛋白组测序数据的差异基因分析方法
US20140288844A1 (en) Characterization of biological material in a sample or isolate using unassembled sequence information, probabilistic methods and trait-specific database catalogs
CN111370065B (zh) 一种检测rna跨样本交叉污染率的方法和装置
CN113862351B (zh) 体液样本中鉴定胞外rna生物标志物的试剂盒及方法
CN113096737A (zh) 一种用于对病原体类型进行自动分析的方法及系统
CN110570901B (zh) 一种基于测序数据进行ssr分型的方法及系统
CN117275585A (zh) 基于lp-wgs和dna甲基化的肺癌早筛模型构建方法及电子设备
CN116072230A (zh) 一种唾液生物标志物数据库的建立方法、装置及设备
CN108715891B (zh) 一种转录组数据的表达定量方法及系统
CN115831232A (zh) 一种癌症原发灶溯源方法、装置、系统及存储介质
CN110148443B (zh) 一种临床检验样本的标识方法及系统
CN114974432A (zh) 一种生物标志物的筛选方法及其相关应用
CN112735533B (zh) 一种基于eDNA的水生生态分析方法及系统
CN116994647A (zh) 用于分析变异检测结果的模型的构建方法
CN114625939A (zh) 医学数据管理方法和系统、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination