CN111382756A - 影像电脑辅助直肠癌治疗反应预测系统、方法及电脑程序 - Google Patents
影像电脑辅助直肠癌治疗反应预测系统、方法及电脑程序 Download PDFInfo
- Publication number
- CN111382756A CN111382756A CN201811619836.4A CN201811619836A CN111382756A CN 111382756 A CN111382756 A CN 111382756A CN 201811619836 A CN201811619836 A CN 201811619836A CN 111382756 A CN111382756 A CN 111382756A
- Authority
- CN
- China
- Prior art keywords
- random forest
- forest model
- decision tree
- binary decision
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
一种电脑辅助直肠癌治疗反应预测系统,用于预测直肠癌患者在治疗后达成病理完成反应(pathological complete response,pCR)的机率,包括:具有至少一个二元决策树模型的随机森林模型。每个二元决策树模型具有至少一特征节点,每个特征节点根据一特征门槛值产生两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率。该随机森林模型整合每个二元决策树模型所产生的该初步pCR预测机率,进而产生一最终pCR预测机率。
Description
技术领域
本发明涉及电脑辅助预测技术领域,特别涉及直肠癌影像的电脑辅助治疗反应预测技术领域。
背景技术
手术前的前导性化疗(Neoadjuvant Chemoradiotherapy,NCRT)是直肠癌患者的基本治疗方式。每个患者对于NCRT的反应可能不同:依照统计,大约有15%至27%的患者可达到病理完全反应(Pathological complete response,pCR),约有54%至75%的患者仅达到部分病理反应(Partial response),而其余患者则无病理反应。由于达到pCR对于患者的后续治疗十分有利,但也可能会造成患者身体的诸多不适,因此预测肿瘤对于NCRT的反应对于患者疗程安排上有极大的效益。然而目前仍缺乏精准的预测技术来达到上述目的。
因此,目前仍需要一种电脑辅助预测技术,能够预测直肠癌患者在进行NCRT后能达到pCR的机率。
发明内容
本发明提出一种电脑辅助直肠癌治疗反应预测技术,是以随机森林技术为基础,并配合大量直肠癌的影像组学来对随机森林的二元决策树模型训练,当训练完成后,随机森林模型即可准确预测患者在治疗后达到pCR的机率。
根据本发明的一个方面,现提出一种电脑辅助直肠癌治疗反应预测系统,用于预测直肠癌患者在治疗后达成pCR的机率。该系统包含随机森林模型。随机森林模型包含至少一个二元决策树模型。每个二元决策树模型具有至少一特征节点。特征节点对应一特征门槛值,并根据特征门槛值而产生两个分支,每个分支可接续一特征节点或对应一初步pCR预测机率。其中,每个决策树模型根据特征节点来分析患者的直肠肿瘤影像的多个影像组学特征,进而产生患者的初步pCR预测机率,随机森林模型整合每个二元决策树模型所产生的初步pCR预测机率,进而产生最终pCR预测机率。
根据本发明的另一个方面,提供一种电脑辅助直肠癌治疗反应预测方法,用于预测一直肠癌患者在治疗后达成pCR的机率,该方法是通过电脑辅助直肠癌治疗反应预测系统来执行,其中电脑辅助直肠癌治疗反应预测系统包含一随机森林模型,且随机森林模型包含至少一个二元决策树模型,每个二元决策树模型包含对应一特征门槛值的特征节点,每个特征节点具有两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率,该方法包含步骤:通过二元决策树模型,根据特征节点来分析患者的直肠肿瘤影像的多个影像组学特征,进而产生患者的初步pCR预测机率;以及通过该随机森林模型整合每个二元决策树模型所产生的初步pCR预测机率,进而产生最终pCR预测机率。
根据本发明的另一个方面,提供一种电脑程序产品,储存于一非暂态电脑可读取媒体之中,用于使电脑辅助直肠癌治疗反应预测系统进行运作,该电脑程序产品包含:一指令,使直肠癌电脑辅助直肠癌治疗反应预测系统的随机森林模型取得患者的直肠肿瘤影像的特征,其中该随机森林模型包含至少一二元决策树模型,每个二元决策树模型包含对应一特征门槛值的至少一特征节点,且每个特征节点具有两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率;一指令,使随机森林模型的二元决策树模型根据特征节点来分析该特征,进而产生患者的初步pCR预测机率;以及一指令,使随机森林模型整合每个二元决策树模型所产生的初步pCR预测机率,进而产生一最终pCR预测机率。
附图说明
图1(A)是本发明一实施例的电脑辅助直肠癌治疗反应预测系统的系统架构图;
图1(B)是本发明一实施例的随机森林模型的二元决策树模型的结构示意图;
图2是本发明一实施例的随机森林模型(已完成训练)的架构示意图;
图3是本发明一实施例的电脑辅助直肠癌治疗反应预测方法的基本步骤流程图;
图4是本发明一实施例的随机森林模型的建立方法的步骤流程图;
图5是本发明一实施例的候选随机森林群组的预测能力的统计归纳示意图;
图6是本发明一实施例的实验数据示意图。
【附图标记说明】
1 直肠癌电脑辅助预测系统
12 影像取得模块
14 随机森林模型
18 特征取得模块
20 二元决策树模型
22 特征节点
23 分支
24 特征门槛值
26 初步pCR预测机率
28 最终pCR预测机率
23 卷积神经网络模块
S31~S34 步骤
S41~S45 步骤
具体实施方式
以下说明书将提供本发明的多个实施例。可以理解的是,这些实施例并非用于限制。本发明的各实施例的特征可加以修饰、置换、组合、分离及设计以应用于其他实施例。
图1(A)是本发明一实施例的电脑辅助直肠癌治疗反应预测系统1的系统架构图,图1(B)是本发明一实施例的随机森林模型14的二元决策树模型20的结构示意图,请同时参考图1(A)及图1(B)。如图1(A)所示,电脑辅助直肠癌治疗反应预测系统1包含一随机森林模型14,而在一实施例中,电脑辅助直肠癌治疗反应预测系统1还可包含一影像取得模块12。影像取得模块12用于取得来自外部的影像数据,也即使用者(例如医师)可通过影像取得模块12将影像数据输入至电脑辅助直肠癌治疗反应预测系统1中。此处所指的“影像数据”可以是一直肠癌患者的直肠肿瘤影像,例如直肠肿瘤的正电子发射计算机断层扫描(PET/CT)影像,并且“影像数据”包含了多个直肠肿瘤影像特征,例如影像组学特征(radiomics),在一实施例中,“影像数据”可以是指PET影像的代谢肿瘤体积(Metabolic Tumor Volume,MTV)范围,但不限于此;为方便说明,后续段落皆以影像数据是PET影像的MTV范围的示例来说明。如图1(B)所示,随机森林模型14包含了至少一个二元决策树模型20,而每个二元决策树模型20包含至少一特征节点22。每个特征节点22对应至少一特征门槛值24,特征节点22具有两个分支23,其中每个分支23可接续另一特征节点22或对应一初步pCR预测机率26,且至少一分支23可对应该初步pCR预测机率26。当影像取得模块12取得影像数据时,每个二元决策树模型20将根据特征节点22的特征门槛值24来分析影像数据的影像组学特征,进而产生患者的初步pCR预测机率26。随机森林模型14可整合每个二元决策树模型20所产生的初步pCR预测机率26,进而产生一最终pCR预测机率28。此外,在一实施例中,电脑辅助直肠癌治疗反应预测系统1还可包含一特征取得模块18,用于从影像数据中取得影像组学特征。借此,电脑辅助直肠癌治疗反应预测系统1可预测患者在接受治疗(例如NCRT)后达到pCR的机率。
电脑辅助直肠癌治疗反应预测系统1可以是一影像处理装置,其可通过任何具有微处理器的装置来实现,例如台式电脑、笔记本电脑、智能移动装置、伺服器或云端主机等类似装置。在一实施例中,电脑辅助直肠癌治疗反应预测系统1可具备网络通信功能,以将数据通过网络进行传输,其中网络通信可以是有线网络或无线网络,因此电脑辅助直肠癌治疗反应预测系统1还可通过网络来取得影像数据。在一实施例中,电脑辅助直肠癌治疗反应预测系统1可由微处理器中执行一电脑程序产品30来实现其功能,其中电脑程序产品30可具有多个指令,该指令可使处理器执行特殊运作,进而使处理器实现如随机森林模型14、二元决策树模型20或特征取得模块18的功能。在一实施例中,电脑程序产品30可储存在一非暂态电脑可读取媒体(例如存储器)之中,但不限于此。在一实施例中,电脑程序产品30还可预先储存在网络伺服器中,以供使用者下载。
在一实施例中,影像取得模块12可以用于取得外部数据的一实体连接端口,例如当电脑辅助直肠癌治疗反应预测系统1是由电脑实现时,影像取得模块12可以是电脑上USB介面、各种传输线接头等,但并非限定。此外,影像取得模块12还可与无线通信芯片整合,因此能以无线传输的方式接收数据。
本发明的随机森林模型14是一种分析影像特征的人工智能模型,其由二元决策树模型20所组成。每个二元决策树模型20可通过分析大量的影像数据来训练,并从大量的影像数据中找出与达成pCR关联度较高的影像组学特征,并且根据该影像组学特征建立出该特征的分析路径,也即二元决策树模型20可经由训练而决定特征节点为何、特征节点对应的特征门槛值为何、特征节点之间如何连接等。二元决策树模型20可由程序代码来实现。在一实施例中,在训练之前,二元决策树模型20的初步模型(即未训练的架构)可预先被构建出来,例如将基本参数设定好,而电脑辅助直肠癌治疗反应预测系统1可通过电脑程序产品30中的指令使二元决策树模型20进行训练,进而构建出二元决策树模型20的最终特征路径(即构建出特征节点22的分支23、特征门槛值24及初步pCR预测机率26等)。当多个二元决策树模型20被训练完成后,电脑辅助直肠癌治疗反应预测系统1的处理器可通过电脑程序产品30中的指令将该二元决策树模型20整合为随机森林模型14。需注意的是,为区分训练前与训练后的二元决策树模型20,下文中对于未训练的二元决策树模型20将以“初步模型”来称之。在一实施例中,初步模型可经历一训练阶段来进行训练,借此建立出特征路径,并且可经历一测试阶段来测试特征路径的准确度。
图2是本发明一实施例的随机森林模型14(已完成训练)的架构示意图,请同时参考图1(A)及图1(B)。为了要准确预测NCRT后的pCR机率,本发明的随机森林模型14的二元决策树模型20的数量可视为“第一变量参数”,而每个二元决策树模型20所具有的特征节点22的数量可视为“第二变量参数”,通过第一变量参数及第二变量参数的调整,可找出最适合的随机森林模型14的基本架构。在一实施例中,第一变量参数的最佳值可视为一临界值(定义为第一临界值),且第一临界值定义为当二元决策树模型20的数量在未超出第一临界值时(例如小于或等于第一临界值时),随机森林模型14的预测能力将随着二元决策树模型20的数量的增加而提升,而当二元决策树模型20的数量超过第一临界值时(例如大于第一临界值时),随机森林模型14的预测能力将会趋缓。在一实施例中,第二变量参数的最佳值也可视为一个临界值(定义为第二临界值),且第二临界值定义为当特征节点的数量未超出第二临界值时(例如小于或等于第二临界值时),随机森林模型14的预测能力将随着每个二元决策树模型20的特征节点数量的增加而提升,而当特征节点数量超出第二临界值时(例如大于第二临界值),随机森林模型14的预测能力将会下滑。换言之,当第一变量参数等于第一临界值且第二变量参数等于第二临界值时,随机森林模型14将具备最佳可重现性的预测能力。在图2的实施例中,每个二元决策树模型20所具有的特征节点22的数量是7个,而随机森林模型14所具有的二元决策树模型20的数量是6个,但本发明不限于此。
如图2所示,随机森林模型14由二元决策树模型20-1~20-6所组成,其中每个二元决策树模型20-1~20-6皆具有相同数量的特征节点22,但特征节点22的内容、特征节点22的分支23的内容及每个特征节点22所对应的特征门槛值24可不相同。此外每个二元决策树模型20-1~20-6的特征路径的架构也可不同(也即各特征节点22之间的连接方式可不相同)。以下以二元决策树模型20-1来进行其架构的局部说明,而其它二元决策树模型的架构可由此推知。
在本实施例中,二元决策树模型20-1具有7个特征节点22,各自代表一个影像组学特征,其中该特征节点22分别是ContrastN特征(门槛值.006)、LRE特征(门槛值1.346)、information measure of correlation 1特征(门槛值-0.355)、LRE特征(门槛值1.275)、DiversityD4特征(门槛值95.727)、DiversityD2特征(门槛值58.5)及LGRE特征(门槛值.143)。每个特征节点22对应的特征门槛值24则是该影像组学特征的临界值。每个特征节点22各自具有两个分支,其中每个分支的内容可以是对应初步pCR预测机率或接续另一个特征节点22。
如图2所示,以特征节点为ContrastN特征来举例,其特征门槛值为0.006,其分支分别是LPE特征及information measure of correlation 1特征,其中LPE特征及information measure of correlation 1特征是以ContrastN特征的特征门槛值来区分。在一实施例中,当一影像数据被输入至二元决策树模型20-1之中,二元决策树模型20-1会分析该影像数据中的ContrastN特征为“小于0.006”或“大于或等于0.006”,当该影像数据中的ContrastN特征为“小于0.006”,则二元决策树模型20-1会对影像数据进行第二特征节点的特征门槛值的分析,反之当该影像数据中的ContrastN特征为“大于或等于0.006”,则二元决策树模型20-1会对影像数据进行第三特征节点的特征门槛值的分析。依此类推,可知二元决策树模型20-1的运作方式。
又如图2所示,以特征节点为DiversityD4特征来举例,其特征门槛值为95.727,其分支分别是对应“pCR的预测机率为0.125”的输出及“pCR的预测机率为0.14”的输出,其中“pCR的预测机率为0.125”的结果对应至“小于特征门槛值245”。在一实施例中,当二元决策树模型20-1利用DiversityD4特征的特征门槛值分析该影像数据时,若影像数据中的DiversityD4特征为“小于95.727”,则二元决策树模型20-1会输出“pCR的预测机率为0.125”的结果,即表示患者的pCR预测机率为12.5%;反之假如该影像数据中的DiversityD4特征为“大于或等于95.727”,则二元决策树模型20-1会输出“pCR的机率为0.14”的结果,即表示患者的pCR预测机率为14%。依此类推,可知二元决策树模型20-1的运作方式。
由上述两个示例,本领域技术人员可清楚了解二元决策树模型20-1的运作细节,并且也可依此类推至其它二元决策树模型的运作方式。
由于PET影像的影像组学特征数量庞大,为了要使随机森林模型14能够准确预测pCR的机率,且为避免二元决策树模型20的训练过于发散,预先将一些与达成pCR有关的影像组学特征设定为候选特征将可以提升系统1的运作效率。在一实施例中,多个影像组学特征可被预先设定为候选特征,并记录在系统1的储存区域(例如但不限定为存储器)之中,而二元决策树模型20在训练时可自动从这些候选特征中挑选出最适合的特征作为特征节点,借此建立出特征路径。在一实施例中,对于一PET影像而言,共有68个影像组学特征被设定为基本候选特征。
此外,该影像组学特征的类型包含了从PET影像的MTV范围中提取出的多个典型PET相关特征、机率性特征及纹理性特征。以下将说明“PET相关特征”、“机率性特征”及“纹理性特征”的细节。
关于PET相关特征,在一实施例中,典型PET相关特征可用于描述MTV中每个体积像素的SUV值或反映出MTV范围的活性(activity)。在一实施例中,典型PET相关特征可包含:SUVmax、Mean、Median、Variance、Std.Dev.、Skewness、Kurtosis、25th percentile、75thpercentile、Peak、MTV、TLGmax、TLGmean、TLGpeak以及上述特征的集合,且不限于此。
关于机率性特征,在一实施例中,为了要计算出机率性特征,MTV范围中的每个体积像素的SUV值将被以宽度为0.001g/ml的固定级距(bin)来进行离散化(Discretize),而离散化后的每个SUV值的出现机率将会被计算,并可用于推导出熵(entropy)、能量(energy)及/或多样性(Diversity)。在一实施例中,机率性特征可包含:Entropy、Energy、DiversityD2、DiversityD3及DiversityD4,且不限于此。
关于纹理性特征,在一实施例中,为了要计算出纹理性特征,MTV范围中的每个体积像素的SUV值将被以固定20个级距数量来进行离散化。在一实施例中,纹理性特征可包含4个主要纹理性特征,分别为GLCM(Gray-level co-occurrence matrix)、NGLDM(Neighboring gray-level dependence matrix)、GLRLM(Gray-level run-lengthmatrix)及GLSZM(Gray-level size zone matrix),该主要纹理性特征可用于描述MTV范围中的SUV值的异质性(heterogeneity)。进一步地,在一实施例中,GLCM可包含:Autocorrelation、ContrastG、Correlation、Cluster prominence、Cluster shade、Dissimilarity、Energy、Entropy、Homogeneitym、Homogeneityp、Maximum probability、Sum of squares variance、Sum average、Sum variance、Sum entropy、Differencevariance、Difference entropy、Information measure of correlation 1、Informationmeasure of correlation 2、Inverse difference normalized及Inverse differencemoment normalized等特征,且不限于此。在一实施例中,NGLDM可包含:Coarseness、ContrastN、Busyness、Complexity及Strength等特征,且不限于此。在一实施例中,GLRLM可包含:SRE(short-run emphasis)、LRE(long-run emphasis)、GLNUr(gray-levelnonuniformity for run;)、RP(run percentage)、RLNU(run-length nonuniformity)、LGRE(low gray-level run emphasis;)、HGRE(high gray-level run emphasis)、SRLGE(short-run low gray-level emphasis)、SRHGE(short-run high gray-levelemphasis)、LRLGE(long-run low gray-level emphasis)及LRHGE(long-run high gray-level emphasis)等特征,且不限于此。在一实施例中,GLSZM可包含:SZE(short-zoneemphasis)、LZE(long-zone emphasis)、GLNUz(gray-level nonuniformity for zone)、ZP(zone percentage)、ZLNU(zone length nonuniformity)、LGZE(low gray-level zoneemphasis)、HGZE(high gray-level zone emphasis)、SZLGE(short-zone low gray-levelemphasis)、SZHGE(short-zone high gray-level emphasis)、LZLGE(long-zone lowgray-level emphasis)及LZHGE(long-zone high gray-level emphasis)等特征,且不限于此。
借此,共68个影像组学特征被设定为候选特征,而每个二元决策树模型20会从该68个影像组学特征中选取出特征做为特征节点。此外,在一实施例中,这些特征也可依照对于pCR的预测能力而进一步被筛选(将在后续段落中说明)。
接着将说明电脑辅助直肠癌治疗反应预测系统1的基本运作方式。图3是本发明一实施例的电脑辅助直肠癌治疗反应预测方法的基本步骤流程图,该方法是由图1(A)及图1(B)的电脑辅助直肠癌治疗反应预测系统1执行,其中随机森林模型14属于已训练完成的状态。如图3所示,首先步骤S31被执行,影像取得模块12取得一直肠癌患者的一影像数据(直肠肿瘤影像)。之后,步骤S32被执行,随机森林模型14取得影像数据,并开始分析该影像数据。之后,步骤S33被执行,每个二元决策树模型20根据特征节点22的特征门槛值24来分析该影像数据的影像组学特征,进而产生初步pCR预测机率26。之后,步骤S34被执行,随机森林模型14整合每个二元决策树模型20所产生的初步pCR预测机率26,进而产生该患者的最终pCR预测机率28。
关于步骤S31,在一实施例中,系统的使用者(例如医师)可通过影像取得模块12将患者的影像数据输入至电脑辅助直肠癌治疗反应预测系统1中。在一实施例中,“影像数据”是指患者在摄取示踪剂(例如18F-FDG)后,患者的直肠肿瘤对示踪剂呈现异常代谢反应的PET影像的MTV范围,其中,影像数据可具有多个体积像素(voxel),且每个体积像素的像素值是指葡萄糖的标准代谢值(Standardized uptake value,以下简称SUV值)。在一实施例中,影像数据可包含68个影像组学特征,其中包含了多个典型PET相关特征、机率性特征及纹理性特征,但不限于此。在一实施例中,影像数据的该影像组学特征可以在步骤S32或S33执行时,由二元决策树模型20自行找出;但在另一实施例中,该68个影像组学特征也可通过其它方式在不同时点取得,例如可通过特征取得模块18以例如边缘检测等方法来取得,其中特征取得模块18的运作可以通过系统1的处理器执行电脑程序产品30而实现。
关于步骤S32至步骤S33,如同前述段落的记载,每个二元决策树模型20皆会对该患者的影像数据(直肠肿瘤影像的影像组学特征)进行分析,并通过特征路径找出最终的分支及分支所对应的初步pCR预测机率,借此各自产生该患者的多个初步pCR预测机率26。
关于步骤S34,在一实施例中,随机森林模型14所进行的“整合”是指将每个初步pCR预测机率26加总,再将加总结果除以二元决策树模型20的数量;换言之,随机森林模型14所产生的一个最终pCR预测机率28是该初步pCR预测机率26的平均值。在另一实施例中,本发明还可采用其它的方式来产生最终pCR预测机率28。
由此可知,当随机森林模型14建立完成后,只要将患者的直肠肿瘤的PET影像输入至直肠癌电脑辅助预测系统1中,随机森林模型14即可计算出该患者的pCR预测机率。借此,可使得患者的医疗品质大幅提升。
此外,为了使随机森林模型14能够执行步骤S31至S34,随机森林模型14必须先通过二元决策树模型20的训练来建立。以下将详细说明随机森林模型14的建立过程。
图4是本发明一实施例的随机森林模型14的建立方法的步骤流程图,其中该步骤可由电脑辅助直肠癌治疗反应预测系统1的处理器执行电脑程序产品20中的指令而实现,并请同时参考图1(A)至图4。首先,步骤S41被执行,电脑辅助直肠癌治疗反应预测系统1取得多个样本影像数据,并从每个样本影像数据中提取出特定数量的影像组学特征。之后,步骤S42被执行,电脑辅助直肠癌治疗反应预测系统1设定决策树模型二元决策树模型20的特征节点的选择规则。之后,步骤S43被执行,电脑辅助直肠癌治疗反应预测系统1根据不同的一第一变量参数及一第二变量参数而建立出多个候选随机森林模型群组。之后,步骤S44被执行,电脑辅助直肠癌治疗反应预测系统1依照一预测条件来决定该第一变量参数及该第二变量参数的最佳值。之后,步骤S45被执行,电脑辅助直肠癌治疗反应预测系统1对具有该第一变量参数及该第二变量参数的最佳值的候选随机森林模型群组中的所有随机森林模型进行评估,并找出具有最佳预测效果的随机森林模型。
关于步骤S41,此步骤是通过系统1的处理器来找出每个样本影像数据中的预设68个候选特征(关于“候选特征的预设”则可在此步骤前先预设在系统1中),此处“样本影像数据”是指多个直肠癌患者的直肠肿瘤的PET影像的数据,例如MTV范围,且这些直肠癌患者在NCRT后的pCR结果亦会被系统1得知。在一实施例中,样本影像数据的数量是设定为169个,也即共有169个患者的PET影像的MTV范围会被输入至直肠癌电脑辅助预测系统1之中,但并非限定。在一实施例中,当样本影像数据被取得后,直肠癌电脑辅助预测系统1的处理器会从每个样本影像数据中找出预设好的68个影像组学特征,其中直肠癌电脑辅助预测系统1的处理器可使用各种方式来找出该影像组学特征,例如边缘检测(edge detector)、直方图偏差(histogram deviation)、纹理分割平均距离(texture segment average distance)及灰度共生矩阵(gray-level co-occurrence matrix,GLCM)等技术,且不限于此。在某些实施例中,此步骤还可改为在二元决策树模型20建立特征路径时执行。
关于步骤S42,此步骤是通过系统1的处理器来设定二元决策树模型20的特征节点的选择规则。在一实施例中,“特征节点的选择”是设定为在每次进行选择时,从候选特征中随机取出特定数量的特征,并将随机选取出的特征中具有最佳分割纯度的特征设定为特征节点。在一实施例中,“特定数量”设定为“对候选特征的总数的平方根,且无条件进位成正整数”,例如若候选特征的总数为68(sqrt(68)=9),则每次进行选择时,将随机选取出9个特征来进行选择,但不限于此。
此外,在一实施例中,步骤S42执行之前可预先执行一筛选步骤,即系统1先对该候选特征进行筛选以缩小候选特征的数量。在一实施例中,此步骤是处理器利用ROC曲线分析来评估每个候选特征对于pCR的评估效果。在一实施例中,经由ROC曲线分析后,68个影像组学特征中会有42个影像组学特征能有效地依照pCR的结果来区分肿瘤之间的差异性,因此候选特征节点的数量可从68个减少为42个,其中典型PET相关特征、机率性特征及纹理性特征分别为2、5及35个;换言之,在此实施例中,每次进行特征节点的选择时,将随机取出7个影像组学特征(sqrt(42)=7)来进行选择。上述记载仅是举例,非本发明的限定。
关于步骤S43,此步骤是通过系统1的处理器调整参数条件(第一变量参数及第二变量参数)而建立大量的随机森林模型14,其中每个参数条件皆会产生相同数量的随机森林模型14,且在下文中,每个参数条件所产生的多个随机森林模型14是定义为“候选随机森林模型群组”,每个候选随机森林模型群组中的随机森林模型14是定义为“候选随机森林模型”。此外,为方便说明,以下将随机森林模型14的参数条件定义为RF(x1,y1),其中x1是第一变量参数,y1是第二变量参数。
在一实施例中,第一变量参数是预设为1至10,第二变量参数也预设为1至10,直肠癌电脑辅助预测系统1会在RF(1,1)至RF(10,10)的参数条件下,各自建立相同数量的候选随机森林模型。在一实施例中,对于每个参数条件(RF(1,1)至RF(10,10))而言,皆有500个候选随机森林模型被建立,也即每个参数条件会对应500候选随机森林模型。
在构建一个随机森林模型14(即一个候选随机森林模型)时,电脑辅助直肠癌治疗反应预测系统1会根据该参数条件而设定好二元决策树模型20(初步模型)的数量以及特征节点的数量。在一实施例中,当训练一个二元决策树模型20的初步模型时,电脑辅助直肠癌治疗反应预测系统1皆会从样本影像数据中随机且可重复地进行N次数据取样(每次取样1个样本影像数据),并将取样的数据作为训练用数据,其中N为所有样本影像数据的数量,举例来说,假如所有样本影像数据的数量为169个(即169个肿瘤影像),则系统1会从169个样本影像数据中随机且可重复地取样169次,因此训练用数据最终会具有169个被取样数据,并且被取样数据之间可能会有重复数据。上述记载仅是举例,非本发明的限定。
在建立一个二元决策树模型20的特征路径时,对于每个特征节点的建立而言,系统1皆会从候选特征中随机选取出多个特征,之后再根据训练用数据当下的状态来决定特征节点的实际特征以及所对应的特征门槛值,借此建立出特征路径;举例来说,当候选特征节点的数量为42个,且二元决策树模型20被设定为具有10个特征节点时(以前述步骤S42的实施例来举例,并假设有169笔训练数据),在建立每个特征节点时,系统1皆会从42个候选特征中随机选取出7个特征(sqrt(42)=7),且在建立二元决策树模型20的第一个特征节点时,7个随机选出的特征会依序评估,以取得每个特征将169笔训练数据分割为两个群组的最佳门槛值,再挑选7种分割结果中的最佳分割结果,并将最佳分割结果所对应的特征以及门槛值设定为第一个特征节点。之后,假设169笔数据被分为N1与N2两组数据,则针对N1数据再随机选取出7个特征,依前述方式找出最佳分割结果来设定为第二特征节点的候选,同样也针对N2数据随机选取出7个特征,同样找出最佳分割结果来设定为第二特征节点的候选,之后再比较两个第二特征节点的候选的分割结果,并挑选具有优选分割结果的特征与门槛值做为第二个特征节点。假设数据N1的分割结果为第二特征节点,并且被分割为N3与N4两组数据时,则在依照前述方式分别针对数据N3与数据N4在挑选出两个第三特征节点的候选,同时将先前N2所设定的第二特征节点的候选重新设定为第三特征节点的候选,之后在三个第三特征节点的候选中挑选出具有最佳分割效果的节点做为第三个特征节点;依此类推,直到10个特征节点皆被挑选出来为止。
在一实施例中,在根据当下数据状态评估每个特征的可能门槛值、挑选最佳分割门槛值以及比较不同特征的最佳分割结果时,使用的评估函数可以引用现有各种数学公式或是自行定义,例如使用熵函数(Entropy function)进行评估时,Entropy=-∑p(i)log2p(i),式中p(i)是各组数据中发生pCR与否的机率,举例来说,假设有50笔数据,其中20笔发生pCR,则该组数据的Entropy=-(0.6*log20.6+0.4*log20.4)=0.97;当某一个特征值根据某个门槛值将数据分成2组,一组数据有30笔并含有15笔pCR,则此组数据Entropy=-(0.5*log20.5+0.5*log20.5)=1,而另一组数据有20笔其中含有5笔pCR,则此组数据Entropy=-(0.75*log20.75+0.25*log20.25)=0.81,则采用这个特征与门槛值设定时,可将其效益定义为0.97-0.6*1-0.4*0.81=0.046,上述记载仅是举例,非本发明的限定。
需注意的是,对于每个候选随机森林模型而言,每个二元决策树模型20所使用的训练用数据皆是随机选取,因此可产生大量具备异质性的特征路径。
关于步骤S44,此步骤是通过系统1的处理器利用统计归纳的方式来找出符合预设条件的候选随机森林群组(统计归纳的过程可由处理器执行电脑程序产品30的指令而实现)。在一实施例中,系统1是使用所有样本影像数据做为测试用数据。在一实施例中,系统1是通过接收端操作特性曲线(receiver operating characteristic curve,ROC)技术来分析每个候选随机森林群组对于pCR的预测能力。图5是本发明一实施例的候选随机森林群组的预测能力的统计归纳示意图,其中X轴(以number of decision splits标注)是表示二元决策树模型中的特征节点的数量,Y轴(以Average AUC标注)是表示平均ROC曲线下面积(Area Under the Curve of ROC,AUC)的值,亦即预测能力,此外图5中不同粗细的线条是表示候选随机森林模型群组所具备的二元决策树模型的数量(以Number of trees标注)。如图5所示,关于二元决策树模型的数量,随机森林模型群组的pCR预测能力起初是随着二元决策树模型的数量增加而快速提升,但当二元决策树模型的数量超过第一临界值(例如数量为6)时,随机森林模型群组的pCR预测能力将会趋于缓和。此外,关于特征节点的数量,随机森林模型群组的pCR预测能力起初是随着二元决策树模型的特征节点的数量增加而提升,但当特征节点的数量超过第二临界值(例如数量为7)时,随机森林模型群组的pCR预测能力反而开始下降。借此,系统1可设定出第一变量参数及第二变量参数的最佳值(即FR(6,7))。
在一实施例中,假如系统1无法从候选随机森林模型群组的预测能力找出符合预设条件的结果时(也即从统计归纳结果中找不到预测能力下降或趋缓的趋势),表示目前候选随机森林模型群组的整体数量不足,因此系统1会扩大第一变量参数及第二变量参数的预设范围,例如第一变量参数及第二变量参数的最大值可由10增加至15,但本发明不限于此。
关于步骤S45,此步骤用于从具备最佳参数的随机森林模型群组中找出最适合的一个随机森林模型,并将该随机森林模型作为实际使用的模型。在一实施例中,系统1是以正向预测值(positive predictive value)来进行筛选以从该随机森林模型群组中找出最适合的随机森林模型,但不限于此。
图6是本发明一实施例的实验数据示意图,其是以ROC曲线来呈现本发明的随机森林模型14与传统二元逻辑回归(Binary logistic regression)模型对于预估pCR机率的准确度,其Y轴(以Sensitivity标注)为敏感度,X轴(以100-Specificity标注)为特异度,其中两者是以相同的数据进行测试。如图6所示,本发明的随机森林模型14的ROC曲线(以Rnadomforest标注)的AUC约为0.9以上,而传统二元逻辑回归模型的ROC曲线(以Binary logisticregression标注)的AUC约为0.683,由此可知,本发明的随机森林模型14拥有比传统的二元逻辑回归模型更好的预测能力。
在一实施例中,本发明的电脑辅助预测系统1、方法及电脑程序产品至少可由论文“Prediction of a Pathological Complete Response in Patients with RectalCancer after Neoadjuvant Chemoradiotherapy through Construction of a RandomForest using Radiomics Derived from Baseline [18F]-FluorodeoxyglucosePositron Emission Tomography-Computed Tomography”所记载的内容来实现,且不限于此。
借此,本发明所使用的随机森林模型可建立完成,换言之,只要将患者在接受NCRT前的直肠肿瘤的影像组学特征输入至随机森林模型中,随机森林模型即可自动预测出该患者在接受NCRT后的pCR预测机率。通过深度学习训练过的二元决策树模型所构成的随机森林模型,本发明的直肠癌电脑辅助预测系统通过精准地预测出患者的医疗效果,可辅助患者寻求最好的医疗方式。
尽管本发明已通过上述实施例来说明,可理解的是,根据本发明的精神及本发明所主张的专利保护范围,许多修饰及变化都是可能的。
Claims (11)
1.一种电脑辅助直肠癌治疗反应预测系统,用于预测一直肠癌患者在治疗后达成病理完全反应(pCR)的机率,包含:
一随机森林模型,包含至少一二元决策树模型,其中每个二元决策树模型具有:
至少一特征节点,对应一特征门槛值,并具有两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率;
其中,每个二元决策树模型根据该至少一特征节点来分析该患者的一直肠肿瘤影像的多个影像组学(radiomics)特征,进而产生该患者的该初步pCR预测机率,该随机森林模型整合每个二元决策树模型所产生的该初步pCR预测机率,进而产生一最终pCR预测机率。
2.根据权利要求1所述的电脑辅助直肠癌治疗反应预测系统,其中该影像组学特征包含多个典型PET相关特征、机率性特征及纹理性特征。
3.根据权利要求2所述的电脑辅助直肠癌治疗反应预测系统,其中该随机森林模型的建立包含步骤:
根据一第一变量参数及一第二变量参数而建立出多个候选随机森林模型群组,每个候选随机森林模型群组包含多个候选随机森林模型,其中该第一变量参数设定为随机森林模型所具有二元决策树模型的数量,该第二变量参数设定为每个二元决策树模型所包含的特征节点的数量,且相同候选随机森林模型群组中的该候选随机森林模型皆对应相同的该第一变量参数及该第二变量参数,不同的候选随机森林模型群组对应不同的该第一变量参数或该第二变量参数;以及
依照一第一预设条件来决定该第一变量参数的最佳值,以及依照一第二预设条件来决定该第二变量参数的最佳值,并将具备该最佳值的该候选随机森林模型群组设定为一最佳候选随机森林模型群组。
4.根据权利要求3所述的电脑辅助直肠癌治疗反应预测系统,其中该随机森林模型的建立方式还包含步骤:
对该最佳候选随机森林模型群组中的该候选随机森林模型进行一预测能力评估;以及
将预测能力最好的其中一候选随机森林模型设定为实际使用的该随机森林模型。
5.根据权利要求3所述的电脑辅助直肠癌治疗反应预测系统,其中该第一预设条件是当该第一变量参数增加,但该候选随机森林模型群组的预测能力的提升效果却趋缓的情况发生时,该第二预设条件是当该第二变量参数增加,但该候选随机森林模型群组的预测能力却下降的情况发生时。
6.一种电脑辅助直肠癌治疗反应预测方法,用于预测一直肠癌患者在治疗后达成pCR的机率,该方法是通过一电脑辅助直肠癌治疗反应预测系统来执行,其中该电脑辅助直肠癌治疗反应预测系统包含一随机森林模型,且该随机森林模型包含至少一二元决策树模型,每个二元决策树模型包含对应一特征门槛值的至少一特征节点,每个特征节点具有两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率,该方法包含步骤:
通过每个二元决策树模型,根据该至少一特征节点来分析该患者的一直肠肿瘤影像的多个影像组学特征,进而产生该患者的该初步pCR预测机率;以及
通过该随机森林模型,整合每个二元决策树模型所产生的该初步pCR预测机率,进而产生一最终pCR预测机率。
7.根据权利要求6所述的电脑辅助直肠癌治疗反应预测方法,其中该影像组学特征包含多个典型PET相关特征、机率性特征及纹理性特征。
8.根据权利要求7所述的电脑辅助直肠癌治疗反应预测方法,其中该随机森林模型的建立方式包含步骤:
根据一第一变量参数及一第二变量参数而建立出多个候选随机森林模型群组,每个候选随机森林模型群组包含多个候选随机森林模型,其中该第一变量参数设定为随机森林模型所具有二元决策树模型的数量,该第二变量参数设定为每个二元决策树模型所包含的特征节点的数量,且相同候选随机森林模型群组中的该候选随机森林模型皆对应相同的该第一变量参数及该第二变量参数,不同的候选随机森林模型群组对应不同的该第一变量参数或该第二变量参数;以及
依照一第一预设条件来决定该第一变量参数的最佳值,以及依照一第二预设条件来决定该第二变量参数的最佳值,并将具备该最佳值的该候选随机森林模型群组设定为一最佳候选随机森林模型群组。
9.根据权利要求8所述的电脑辅助直肠癌治疗反应预测方法,其中该随机森林模型的建立还包含步骤:
对该最佳候选随机森林模型群组中的该候选随机森林模型进行一预测能力评估;以及
将预测能力最好的其中一候选随机森林模型设定为实际使用的该随机森林模型。
10.根据权利要求8所述的电脑辅助直肠癌治疗反应预测方法,其中该第一预设条件是当该第一变量参数增加,但该候选随机森林模型群组的预测能力的提升效果却趋缓的情况发生时,该第二预设条件是当该第二变量参数增加,但该候选随机森林模型群组的预测能力却下降的情况发生时。
11.一种电脑程序产品,储存于一非暂态电脑可读取媒体之中,用于使一电脑辅助直肠癌治疗反应预测系统运作,其中该电脑辅助直肠癌治疗反应预测系统用于预测一直肠癌患者在治疗后达成病理完全反应(pCR)的机率,该电脑程序产品包含:
一指令,使该直肠癌电脑辅助预测系统的一随机森林模型取得该患者的一直肠肿瘤影像的多个特征,其中该随机森林模型包含至少一二元决策树模型,每个二元决策树模型包含对应一特征门槛值的至少一特征节点,且每个特征节点具有两个分支,其中每个分支接续另一特征节点或对应一初步pCR预测机率;以及
一指令,使每个二元决策树模型根据该至少一特征节点来分析该特征,进而产生该患者的该初步pCR预测机率;以及
一指令,使该随机森林模型整合每个二元决策树模型所产生的该初步pCR预测机率,进而产生一最终pCR预测机率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811619836.4A CN111382756B (zh) | 2018-12-28 | 2018-12-28 | 影像电脑辅助直肠癌治疗反应预测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811619836.4A CN111382756B (zh) | 2018-12-28 | 2018-12-28 | 影像电脑辅助直肠癌治疗反应预测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111382756A true CN111382756A (zh) | 2020-07-07 |
CN111382756B CN111382756B (zh) | 2023-06-02 |
Family
ID=71217127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811619836.4A Active CN111382756B (zh) | 2018-12-28 | 2018-12-28 | 影像电脑辅助直肠癌治疗反应预测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111382756B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511564A (zh) * | 2022-04-19 | 2022-05-17 | 天津市肿瘤医院(天津医科大学肿瘤医院) | 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090234628A1 (en) * | 2008-03-14 | 2009-09-17 | Siemens Medical Solutions Usa, Inc. | Prediction of complete response given treatment data |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN105640577A (zh) * | 2015-12-16 | 2016-06-08 | 深圳市智影医疗科技有限公司 | 一种自动检测放射影像中局部性病变的方法和系统 |
CN108052755A (zh) * | 2017-12-20 | 2018-05-18 | 中国地质大学(武汉) | 基于完全随机森林的矢量空间计算强度预测方法及系统 |
CN109036571A (zh) * | 2014-12-08 | 2018-12-18 | 20/20基因系统股份有限公司 | 用于预测患有癌症的可能性或风险的方法和机器学习系统 |
CN109072309A (zh) * | 2016-02-02 | 2018-12-21 | 夸登特健康公司 | 癌症进化检测和诊断 |
-
2018
- 2018-12-28 CN CN201811619836.4A patent/CN111382756B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090234628A1 (en) * | 2008-03-14 | 2009-09-17 | Siemens Medical Solutions Usa, Inc. | Prediction of complete response given treatment data |
CN109036571A (zh) * | 2014-12-08 | 2018-12-18 | 20/20基因系统股份有限公司 | 用于预测患有癌症的可能性或风险的方法和机器学习系统 |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN105640577A (zh) * | 2015-12-16 | 2016-06-08 | 深圳市智影医疗科技有限公司 | 一种自动检测放射影像中局部性病变的方法和系统 |
CN109072309A (zh) * | 2016-02-02 | 2018-12-21 | 夸登特健康公司 | 癌症进化检测和诊断 |
CN108052755A (zh) * | 2017-12-20 | 2018-05-18 | 中国地质大学(武汉) | 基于完全随机森林的矢量空间计算强度预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
NATALLY HORVAT ET AL: "MR Imaging of Rectal Cancer: Radiomics Analysis to Assess Treatment Response after Neoadjuvant Therap", 《RADIOLOGY》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511564A (zh) * | 2022-04-19 | 2022-05-17 | 天津市肿瘤医院(天津医科大学肿瘤医院) | 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111382756B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ji et al. | Learning calibrated medical image segmentation via multi-rater agreement modeling | |
US10706333B2 (en) | Medical image analysis method, medical image analysis system and storage medium | |
CN110245721B (zh) | 神经网络模型的训练方法、装置和电子设备 | |
JP7058373B2 (ja) | 医療画像に対する病変の検出及び位置決め方法、装置、デバイス、及び記憶媒体 | |
TWI723312B (zh) | 電腦輔助直腸癌治療反應預測系統、方法及電腦程式產品 | |
JP6623265B2 (ja) | 偽陽性低減での小結節検出 | |
CN111488921B (zh) | 一种全景数字病理图像智能分析系统及方法 | |
JP4767957B2 (ja) | 結合空間強度尤度比検定を使用する体積腫瘍分断 | |
CN107688815B (zh) | 医学图像的分析方法和分析系统以及存储介质 | |
CN111353998A (zh) | 一种基于人工智能的肿瘤诊疗预测模型及装置 | |
Cordeiro et al. | Analysis of supervised and semi-supervised GrowCut applied to segmentation of masses in mammography images | |
WO2022179083A1 (zh) | 图像检测方法、装置、设备、介质和程序 | |
US11684333B2 (en) | Medical image analyzing system and method thereof | |
WO2020056372A1 (en) | Multimodal learning framework for analysis of clinical trials | |
CA3100030A1 (en) | Method for diagnosing, predicting, determining prognosis, monitoring, or staging disease based on vascularization patterns | |
WO2023014789A1 (en) | System and method for pathology image analysis using a trained neural network and active learning framework | |
Li et al. | A hybrid approach for approximating the ideal observer for joint signal detection and estimation tasks by use of supervised learning and markov-chain monte carlo methods | |
CN111382756B (zh) | 影像电脑辅助直肠癌治疗反应预测系统及方法 | |
KR101473341B1 (ko) | 유전자 클래스 결정 방법 | |
Sabha et al. | Cooperative Swarm Intelligence Algorithms for Adaptive Multilevel Thresholding Segmentation of COVID-19 CT-Scan Images. | |
Bakasa et al. | Stacked ensemble deep learning for pancreas cancer classification using extreme gradient boosting | |
CN112288006B (zh) | 一种图像处理模型构建方法、装置、设备及可读存储介质 | |
CN115064270A (zh) | 一种基于影像组学图像特征的肝癌复发预测方法 | |
CN112750528A (zh) | 预测肿瘤的特性参数的计算机辅助预测系统、方法及计算机程序产品 | |
CN113222989A (zh) | 一种图像分级方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |