CN111180071B - 高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 - Google Patents
高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 Download PDFInfo
- Publication number
- CN111180071B CN111180071B CN201911420979.7A CN201911420979A CN111180071B CN 111180071 B CN111180071 B CN 111180071B CN 201911420979 A CN201911420979 A CN 201911420979A CN 111180071 B CN111180071 B CN 111180071B
- Authority
- CN
- China
- Prior art keywords
- infection
- hpv
- risk
- lesion
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种高危型HPV型别和宫颈癌前病变阶段间关系的计算方法和装置,该方法包括:对通过薄层细胞学检查(TCT)和HPV基因分型检测得到的M种宫颈癌前病变阶段下的N种高危型HPV感染数据进行分类整理,获得不同感染方式下的HPV感染预处理数据;基于HPV预处理数据作聚类分析,并基于聚类分析结果获取不同高危型HPV的相似性;基于所述的单重感染和多重感染方式下的HPV预处理数据按泊松分布建模,进行回归分析,获取HPV单重感染和多重感染对宫颈癌前病变的影响比重。该方法结合聚类技术、统计分析方法,对生物数据进行挖掘,发现不同高危型HPV与不同宫颈癌前病变阶段间的关系。
Description
技术领域
本发明涉及一种结合生物医学数据,利用计算机数据挖掘技术和统计分析技术对不同高危型HPV型别和宫颈癌前病变阶段关系进行挖掘研究的方法,尤其是涉及一种高危型HPV型别和宫颈癌前病变阶段关系的计算方法及装置。
背景技术
宫颈癌作为威胁全球女性健康的第四大常见肿瘤,已被研究证实主要由人乳头瘤病毒(HPV)引起。据报告估计,与HPV感染相关的癌症病例占全球新发癌症总数的4.5%,其中宫颈癌在这些HPV感染相关癌症中的占比又高达83%,对女性健康(尤其在发展中国家)造成了极大的威胁。流行病学相关研究表明N种HPV类型(16,18,31,33,35,39,45,51,52,56,58,59和68型)根据其引发宫颈癌变的可能性而被归为高危型HPV(HR-HPV)。由于宫颈癌变是一个多因素、多步骤的缓慢的渐进过程,大约持续感染HR-HPV的癌变发生时间约为20年,因此宫颈癌是唯一可以通过HPV分型筛查早期预防和治疗的恶性肿瘤,对改善患者预后具有重要作用。目前,我国已成为宫颈癌高发国家之一,HPV感染在女性中较为普遍,因此在我国开展高危型HPV感染的研究具有十分重要的意义。
从国内外研究来看,在宫颈的HPV数据收集层面上,液基细胞学检查(LCT)和(TCT)是细胞水平上常见的两种宫颈鳞状上皮内病变的宫颈筛查方法,但它们并不擅长检测特定的HR-HPV基因型感染;而HPV基因分型方法不仅比LCT和TCT方法更容易检测到特定的HPV基因型,而且能够区分单一感染和多重感染,但该方法的高灵敏度可能会导致过度诊断。因此,为了兼顾灵敏度和准确性,在收集数据阶段将HR-HPV基因分型筛查与细胞学诊断相结合,能有效减少错误诊断,避免过度治疗。例如,在用LCT/TCT和HR-HPV基因分型方法收集样本数据后,Catteau等人计算了比利时女性在不同癌前病变阶段分组下总的N种HR-HPV感染流行率;而Ying等人则以总的癌前病变阶段中不同HR-HPV型别流行率来刻画北京地区主要的感染型别分布情况。然而,由于在同一种癌前病变阶段中有些HR-HPV型别的流行率会明显高于其他的HR-HPV型别;而且对同一种HR-HPV而言,该亚型在不同的癌前病变阶段分组中的流行率也并不一致,因此用总的癌前病变阶段数据来描述HR-HPV型别与癌前病变阶段间的感染关系存在争议。
另一方面,在HPV多重感染层面上,尚不清楚多重感染(两种或两种以上HPV型别感染)是否比单重感染(只感染一种HPV型别)对宫颈癌变影响的风险性更大。很多学者对此进行了研究,例如,Chaturvedi等人研究了25种HPV基因型的共同感染模式,并计算每个基因型与24个其他基因型组合感染的优势比(OR),其结果表明多重感染的患病风险与个体类型估计风险的总和相接近,几乎没有HPV基因型协同相互作用的证据;然而,Ying等人和Dickson等人的研究结果却均认为多重感染的女性的癌变风险明显高于单重感染的女性。可能由于这些不同的多重感染研究收集到的HPV类型、患者年龄等相关影响因素存在差异,从而导致了多重感染引起宫颈病变风险的不一致结论。此外,以往的大多数研究主要使用队列分析方法而没有考虑使用回归模型来研究不同的HPV型别在不同癌前病变阶段下的单重感染和多重感染的影响比重。
发明内容
鉴于上述提出的研究不足,本发明实施范例提供一种研究不同高危型人乳头瘤病毒(HPV)和不同宫颈癌前病变阶段间关系的方法,所述方法包括:
步骤1、结合TCT和HPV基因分型检测方法,从临床上收集到的M种宫颈癌前病变阶段下的N种高危型HPV感染数据进行分类整理,获得不同感染方式(包括全部感染、单重感染和多重感染)下的HPV感染预处理数据,并根据不同的癌前病变阶段对感染不同的高危型HPV的流行率进行统计;
步骤2、基于所述的全部感染和单重感染方式下的HPV预处理数据作聚类分析,并基于聚类分析结果获取不同高危型HPV的相似性;
步骤3、基于所述的单重感染和多重感染方式下的HPV预处理数据按泊松分布建模,进行回归分析,获取HPV单重感染和多重感染对宫颈癌前病变的影响比重。
所述回归分析模型为公式1,具体为:
其中,λ表示结果变量(感染患者数)的均值,X1…Xp表示预测变量(不同高危型HPV类型的单重感染和多重感染),β0…βp是回归系数,由样本估计而得。
优选地,所述步骤2进一步包括:
步骤201、分别计算全部感染数据集和单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变阶段中N种高危型HPV的最佳聚类个数,其中最佳聚类个数通过R语言包的NbClust包进行计算参考;
步骤202、根据步骤201得到相对应的最佳聚类个数后,使用K-means聚类算法对全部感染数据集和单重感染数据集中的N种高危型HPV进行聚类分析得到不同数据集下的HPV感染相似性;
优选地,步骤202所述的聚类分析的具体过程包括:
步骤2021、基于步骤201分别得到全部感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果;
步骤2022、整合步骤2021中得到的四组癌前病变阶段的聚类结果,得到整体癌前病变阶段下N种高危型HPV感染趋势的相似性;
步骤2023、基于步骤201分别得到单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果。
步骤2024、整合步骤2023中得到的四组癌前病变阶段的聚类结果,得到整体癌前病变阶段下N种高危型HPV感染趋势的相似性;
另外,步骤2021和步骤2023中的K-means算法采用欧几里得距离来测量两个观测值间的距离,它的计算距离公式为公式2,具体为:
其中,dij表示第i个观测对象和第j个观测对象间的距离,p表示观测对象的变量数,xip和xjp分别表示第i个观测对象的第p个变量的值和第j个观测对象的第p个变量的值。
优选地,所述步骤3中的回归分析,具体通过以下步骤进行:
步骤301、通过泊松分布建立回归模型;
步骤302、基于步骤301得到的回归模型和极大似然估计法,在统计应用软件R3.4.3中推导各个参数的估计值;
步骤303、由于在泊松回归中,变量以条件均值的对数函数log(λ)来建模,为了在因变量的初始尺度(感染人数,而非感染人数的对数)上解释回归系数,对步骤302得到的参数估计结果作指数化处理,得到更易于解释的参数估计结果;
步骤304、基于统计假设检验的标准方法,在统计应用软件R3.4.3中,使用plot()算法生成评价模型拟合情况的评价结果,来对所述的步骤3建模部分进行检验。
同时,本发明还提供了一种高危型HPV型别和宫颈癌前病变阶段关系的计算装置,所述装置包括:
数据获取装置,其用于使用薄层细胞学检查(TCT)和HPV基因分型检测方法从临床上收集到的M种宫颈癌前病变阶段下的N种高危型HPV感染数据,并将上述数据进行分类整理;
预处理及统计装置:其用于获得不同感染方式(包括全部感染、单重感染和多重感染)下的HPV感染预处理数据,并根据不同的癌前病变阶段对不同的高危型HPV的流行率进行统计;
聚类分析装置:其接收预处理及统计装置的基于所述的全部感染和单重感染方式下的HPV预处理数据,并进行聚类分析,基于聚类分析结果获取不同高危型HPV的相似性;
回归分析装置:其接收预处理及统计装置的所述的单重感染和多重感染方式下的HPV预处理数据,并按泊松分布建模进行回归分析,获取HPV单重感染和多重感染对宫颈癌前病变的影响比重。
优选的,所述预处理及统计装置进一步包括:
最佳聚类个数处理单元:分别计算全部感染数据集和单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变阶段中N种高危型HPV的最佳聚类个数,其中最佳聚类个数通过R语言包的NbClust包进行计算参考;
HPV感染相似性处理单元:根据最佳聚类个数处理单元得到相对应的最佳聚类个数后,使用K-means聚类算法对全部感染数据集和单重感染数据集中的N种高危型HPV进行聚类分析得到不同数据集下的HPV感染相似性。
其中,M=4,N=13。
与以往研究发明相比,本发明技术通过下列三点创新来克服上述背景技术中的不足:(1)将TCT和HR-HPV分型检测相结合,收集4个不同癌前病变阶段分组下N种HR-HPV型的临床数据;(2)对4个不同阶段的13个不同基因型进行聚类分析;(3)利用泊松分布探讨不同HR-HPV的不同感染方式对宫颈病变的影响。该方法结合了计算机聚类技术、统计分析方法,对生物医学数据进行挖掘,提供了研究不同高危型HPV与不同宫颈癌前病变阶段间的关系的新思路。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的方法流程图;
图2为本发明实施例的聚类分析过程流程图;
图3为本发明实施例的回归分析过程流程图。
具体实施方式
下面结合附图对本发明实施例一种应用程序推荐方法及装置进行详细描述。应当明确,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而这些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
在一个具体的实施例中,本发明的具体技术方案可通过如下的实施例进行详尽说明。本发明的技术方案包括以下步骤:
数据预处理
对使用TCT和HPV基因分型检测方法从临床上收集到的M种宫颈癌前病变阶段(Normal组、ASCUS组、LSIL组和HSIL组)下的N种高危型HPV(16,18,31,33,35,39,45,51,52,56,58,59和68型)感染人数进行分类整理,获得不同感染方式(包括全部感染、单重感染和多重感染)下的关系型的HPV感染预处理数据,并统计M种不同的癌前病变阶段下N种不同的高危型HPV的流行率。
聚类分析
N种高危型HPV型别中存在某些型别具有共同的生物特性,从而导致这些HPV型别表现出的感染性状可能存在相似性。基于此原因,对得到的全部感染和单重感染方式下的HPV预处理数据作聚类分析,并根据聚类结果获取不同高危型HPV的相似性。其中,具体的聚类实施过程如下所述:
步骤1、分别计算全部感染数据集和单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变阶段中N种高危型HPV的最佳聚类个数,其中最佳聚类个数通过R语言包的NbClust包进行计算参考;
步骤2、基于步骤1分别得到全部感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果,并对这些结果进行整理从而得到整体癌前病变阶段下N种高危型HPV感染趋势的相似性;
步骤3、基于步骤1分别得到单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果,并对这些结果进行整理从而得到整体癌前病变阶段下N种高危型HPV单重感染趋势的相似性;
回归分析
为了研究HPV单重感染和多重感染对宫颈癌前病变的影响比重,对单重感染和多重感染方式下的HPV预处理数据根据泊松分布建模,进行回归分析。具体回归分析实施过程如下:
步骤1、通过泊松分布建立回归模型(公式1);
其中,λ表示结果变量(感染患者数)的均值,X1…Xp表示预测变量(不同高危型HPV类型的单重感染和多重感染),β0…βp是回归系数,由样本估计而得。
步骤2、根据单重感染和多重感染的样本数据,在统计应用软件R3.4.3中使用极大似然法推导各个参数的估计值;
步骤3、由于在泊松回归中,变量以条件均值的对数函数log(λ)来建模,为了在因变量的初始尺度(感染人数,而非感染人数的对数)上解释回归系数,对步骤2得到的参数估计结果作指数化处理,得到更易于解释的参数估计结果;
步骤4、基于统计假设检验的标准方法,在统计应用软件R3.4.3中,使用plot()函数生成评价模型拟合情况的评价结果,来对本次回归实施进行检验。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.高危型HPV型别和宫颈癌前病变阶段关系的计算方法,所述方法包括:
步骤1、对使用薄层细胞学检查(TCT)和HPV基因分型检测方法从临床上收集到的M种宫颈癌前病变阶段下的N种高危型HPV感染数据进行分类整理,获得不同感染方式下的HPV感染预处理数据,并根据不同的癌前病变阶段对不同的高危型HPV的流行率进行统计;所述不同感染方式包括全部感染、单重感染和多重感染;
步骤2、基于所述的全部感染和单重感染方式下的HPV预处理数据作聚类分析,并基于聚类分析结果获取不同高危型HPV的相似性;
步骤3、基于所述的单重感染和多重感染方式下的HPV预处理数据按泊松分布建模,进行回归分析,获取HPV单重感染和多重感染对宫颈癌前病变的影响比重;
所述回归分析模型为公式1,具体为:
其中,λ表示结果变量的均值,p表示观测对象的变量数,j为1到p之间的整数,Xj表示第j个预测变量,β0…βp是回归系数,由样本估计而得;
其中,所述结果变量为感染患者数;所述预测变量为不同高危型HPV类型的单重感染和多重感染。
2.根据权利要求1所述的高危型HPV型别和宫颈癌前病变阶段关系的计算方法,其特征在于,所述步骤2进一步包括:
步骤201、分别计算全部感染数据集和单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变阶段中N种高危型HPV的最佳聚类个数,其中最佳聚类个数通过R语言包的NbClust包进行计算参考;
步骤202、根据步骤201得到相对应的最佳聚类个数后,使用K-means聚类算法对全部感染数据集和单重感染数据集中的N种高危型HPV进行聚类分析得到不同数据集下的HPV感染相似性。
3.根据权利要求2所述的高危型HPV型别和宫颈癌前病变阶段关系的计算方法,其特征在于,所述步骤202的聚类过程具体包括:
步骤2021、基于步骤201分别得到全部感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果;
步骤2022、整合步骤2021中得到的四组癌前病变阶段的聚类结果,得到整体癌前病变阶段下N种高危型HPV全部感染趋势的相似性;
步骤2023、基于步骤201分别得到单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变组中不同高危型HPV的最佳聚类个数后,使用R包中的K-means算法分别聚类这4个病变分组中的N种高危型HPV,得到不同的病变阶段下的HPV聚类结果;
步骤2024、整合步骤2023中得到的四组癌前病变阶段的聚类结果,得到整体癌前病变阶段下N种高危型HPV单重感染趋势的相似性;
另外,步骤2021和步骤2023中的K-means算法采用欧几里得距离来测量两个观测值间的距离,它的计算距离公式为公式2,具体为:
其中,dij表示第i个观测对象和第j个观测对象间的距离,p表示观测对象的变量数,xip和xjp分别表示第i个观测对象的第p个变量的值和第j个观测对象的第p个变量的值。
4.根据权利要求1所述的高危型HPV型别和宫颈癌前病变阶段关系的计算方法,其特征在于,所述步骤3进一步包括:
步骤301、通过泊松分布建立回归模型;
步骤302、基于步骤301得到的回归模型和极大似然估计法,推导各个参数的估计值;
步骤303、由于在泊松回归中,变量以条件均值的对数函数log(λ)来建模,为了在因变量的初始尺度上解释回归系数,对步骤302得到的参数估计结果作指数化处理,得到更易于解释的参数的估计值;
步骤304、基于统计假设检验的标准方法,生成评价模型拟合情况的评价结果,来对所述的步骤3建模部分进行检验;
其中,所述初始尺度是指感染人数,而非感染人数的对数。
5.根据权利要求1-4中任一所述的高危型HPV型别和宫颈癌前病变阶段关系的计算方法,其特征在于,M=4,N=13。
6.高危型HPV型别和宫颈癌前病变阶段关系的计算装置,所述装置包括:
数据获取装置,其用于使用薄层细胞学检查(TCT)和HPV基因分型检测方法从临床上收集到的M种宫颈癌前病变阶段下的N种高危型HPV感染数据,并将上述数据进行分类整理;
预处理及统计装置:其用于获得不同感染方式下的HPV感染预处理数据,并根据不同的癌前病变阶段对不同的高危型HPV的流行率进行统计;所述不同感染方式包括全部感染、单重感染和多重感染;
聚类分析装置:其接收预处理及统计装置的基于所述的全部感染和单重感染方式下的HPV预处理数据,并进行聚类分析,基于聚类分析结果获取不同高危型HPV的相似性;
回归分析装置:其接收预处理及统计装置的所述的单重感染和多重感染方式下的HPV预处理数据,并按泊松分布建模进行回归分析,获取HPV单重感染和多重感染对宫颈癌前病变的影响比重。
7.根据权利要求6所述的高危型HPV型别和宫颈癌前病变阶段关系的计算装置,其特征在于,所述预处理及统计装置进一步包括:
最佳聚类个数处理单元:分别计算全部感染数据集和单重感染数据集中Normal组、ASCUS组、LSIL组和HSIL组这四个癌前病变阶段中N种高危型HPV的最佳聚类个数,其中最佳聚类个数通过R语言包的NbClust包进行计算参考;
HPV感染相似性处理单元:根据最佳聚类个数处理单元得到相对应的最佳聚类个数后,使用K-means聚类算法对全部感染数据集和单重感染数据集中的N种高危型HPV进行聚类分析得到不同数据集下的HPV感染相似性。
8.根据权利要求6或7中所述的高危型HPV型别和宫颈癌前病变阶段关系的计算装置,其特征在于,M=4,N=13。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911420979.7A CN111180071B (zh) | 2019-12-31 | 2019-12-31 | 高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911420979.7A CN111180071B (zh) | 2019-12-31 | 2019-12-31 | 高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111180071A CN111180071A (zh) | 2020-05-19 |
CN111180071B true CN111180071B (zh) | 2022-02-08 |
Family
ID=70655951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911420979.7A Active CN111180071B (zh) | 2019-12-31 | 2019-12-31 | 高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111180071B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111834015B (zh) * | 2020-07-16 | 2022-01-11 | 西北民族大学 | 一种面向hpv及其导致的宫颈癌的最优疫苗接种策略和筛查策略制定方法 |
CN112185585A (zh) * | 2020-11-03 | 2021-01-05 | 浙江大学滨海产业技术研究院 | 一种基于代谢组学的糖尿病早期预警方法 |
CN114093500B (zh) * | 2021-10-12 | 2022-12-02 | 湖南索莱智能科技有限公司 | 融合多个检测结果的诊断模型建立方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000040749A2 (en) * | 1999-01-06 | 2000-07-13 | Genenews Inc. | Method for the detection of gene transcripts in blood and uses thereof |
AU2006205638A1 (en) * | 2005-01-14 | 2006-07-20 | The Regents Of The University Of Michigan | Systems, methods, and compositions for detection of human papilloma virus in biological samples |
CN102510905B (zh) * | 2009-08-07 | 2013-09-18 | 博奥生物有限公司 | 用于宫颈上皮内瘤样病变和宫颈癌的诊断和预后的方法与组合物 |
JP2013521000A (ja) * | 2010-03-04 | 2013-06-10 | パーデュー・リサーチ・ファウンデーション | フローサイトメトリーと多重hpv遺伝子型同定を併用する統合試験法 |
SG11201707540QA (en) * | 2015-03-16 | 2017-10-30 | Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft | Method of detecting new immunogenic t cell epitopes and isolating new antigen-specific t cell receptors by means of an mhc cell library |
US10829820B2 (en) * | 2015-08-31 | 2020-11-10 | The United States Government As Represented By The Secretary Of The Army | Methods for molecularly characterizing cervical cell samples |
CN109977955B (zh) * | 2019-04-03 | 2021-11-30 | 南昌航空大学 | 一种基于深度学习的宫颈癌前病变识别的方法 |
-
2019
- 2019-12-31 CN CN201911420979.7A patent/CN111180071B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111180071A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111180071B (zh) | 高危型hpv型别和宫颈癌前病变阶段关系的计算方法及装置 | |
CN108464840B (zh) | 一种乳腺肿块自动检测方法及系统 | |
Lytwyn et al. | Interobserver agreement in the interpretation of anal intraepithelial neoplasia | |
CN108511055B (zh) | 基于分类器融合及诊断规则的室性早搏识别系统及方法 | |
CN105139390A (zh) | 一种检测胸透dr片中肺结核病灶的图像处理方法 | |
CN111710427A (zh) | 宫颈癌癌前早期病变阶段诊断模型及建立方法 | |
Li et al. | Closer to a uniform language in colposcopy: study on the potential application of 2011 International Federation for Cervical Pathology and Colposcopy Terminology in clinical practice | |
CN111440869A (zh) | 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用 | |
Jothi et al. | Soft set based feature selection approach for lung cancer images | |
ŞENTÜRK et al. | An improved deep learning based cervical cancer detection using a median filter based preprocessing | |
CN114587381A (zh) | 基于多通道脑电智能筛选与加权样本生成的棘波检测方法 | |
CN110169767A (zh) | 一种心电信号的检索方法 | |
WO2019001040A1 (zh) | 用于亚裔人群的肺癌检测方法及系统 | |
CN110010246A (zh) | 一种基于神经网络和置信区间的疾病智能诊断技术 | |
Tosun et al. | Unsupervised tissue image segmentation through object-oriented texture | |
CN115862856A (zh) | 甲状腺癌远端转移风险的预测方法、装置 | |
CN113854971B (zh) | 一种基于多通道多特征融合的睡眠呼吸暂停检测方法 | |
Sari et al. | Best performance comparative analysis of architecture deep learning on ct images for lung nodules classification | |
CN115414043A (zh) | 基于脑电信号分析的抑郁障碍识别系统、装置及存储介质 | |
CN113555112A (zh) | 基于影像组学的肝癌肝外转移预测模型、其构建方法及应用 | |
CN114141360A (zh) | 基于惩罚cox回归的乳腺癌预测方法 | |
CN113921116A (zh) | 利用计算机芯片评估急性缺血性卒中ct影像数据模型方法 | |
Yuan et al. | DenseNet Convolutional Neural Network for Breast Cancer Diagnosis | |
Chen et al. | Support Vector Machine Based Diagnosis of Breast Cancer | |
CN109468381A (zh) | 用于宫颈癌筛查的甲基化位点及其检测引物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |