CN116502158B - 肺癌分期识别方法、装置、设备及存储介质 - Google Patents
肺癌分期识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116502158B CN116502158B CN202310129796.XA CN202310129796A CN116502158B CN 116502158 B CN116502158 B CN 116502158B CN 202310129796 A CN202310129796 A CN 202310129796A CN 116502158 B CN116502158 B CN 116502158B
- Authority
- CN
- China
- Prior art keywords
- lung cancer
- cancer stage
- sub
- sensor
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010058467 Lung neoplasm malignant Diseases 0.000 title claims abstract description 170
- 201000005202 lung cancer Diseases 0.000 title claims abstract description 170
- 208000020816 lung neoplasm Diseases 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000013598 vector Substances 0.000 claims abstract description 121
- 230000004927 fusion Effects 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 45
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 5
- 230000000241 respiratory effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 239000012855 volatile organic compound Substances 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/08—Detecting, measuring or recording devices for evaluating the respiratory organs
- A61B5/082—Evaluation by breath analysis, e.g. determination of the chemical composition of exhaled breath
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Physiology (AREA)
- Animal Behavior & Ethology (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Fuzzy Systems (AREA)
- Pulmonology (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本公开涉及一种肺癌分期识别方法、装置、设备及存储介质,其中,方法包括:获取采样气体的传感器阵列信号,其中,所述传感器阵列信号包括多个子传感器信号;提取所述多个子传感器信号的特征向量,并通过注意力网络分别确定每个所述特征向量对于每一肺癌分期类别的注意力分数;根据所述注意力分数和所述特征向量进行注意力加权,通过对加权后的特征向量求和,得到所述传感器阵列信号的融合特征;将所述融合特征输入多类分类器进行处理,确定肺癌分期结果。根据本公开的技术方案,能够提高肺癌分期检测的准确性。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种肺癌分期识别方法、装置、设备及存储介质。
背景技术
肺癌分期表现为4个阶段,分别为Ⅰ期、Ⅱ期、Ⅲ期、Ⅳ期,每期又分别可分为a、b期。肺癌分期不同,治疗方法不同。Ⅰ期、Ⅱ期以手术为主,Ⅲ期以放、化疗联合为主,Ⅳ期以药物治疗为主。
相关技术中,通过训练分类模型,基于呼出气体中的挥发性有机化合物(VOC)代谢轮廓输入模型,以确定肺癌分期,然而,由于不同肺癌分期阶段的特征相似度较高,通过该方式得到的肺癌分期阶段不够准确,肺癌分期检测准确度有待提高。
发明内容
为了解决上述技术问题,本公开提供了一种肺癌分期识别方法、装置、设备及存储介质。
第一方面,本公开实施例提供了一种肺癌分期识别方法,包括:
获取采样气体的传感器阵列信号,其中,所述传感器阵列信号包括多个第一子传感器信号;
提取所述多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数;
根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征;
将所述融合特征输入多类分类器进行处理,确定肺癌分期结果。
第二方面,本公开实施例提供了一种肺癌分期识别装置,包括:
获取模块,用于获取采样气体的传感器阵列信号,其中,所述传感器阵列信号包括多个第一子传感器信号;
提取模块,用于提取所述多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数;
融合模块,用于根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征;
确定模块,用于将所述融合特征输入多类分类器进行处理,确定肺癌分期结果。
第三方面,本公开实施例提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述第一方面所述的肺癌分期识别方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的肺癌分期识别方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:通过采样气体的多个子传感器信号,提取多个子传感器信号的特征向量,并通过注意力网络分别确定每个特征向量对于每一肺癌分期类别的注意力分数,根据注意力分数和特征向量生成融合特征,进而将融合特征输入多类分类器进行处理以确定肺癌分期结果,由此,针对基于电子鼻的肺癌分期场景,通过注意力分数对特征向量进行加权,能够更精准地对不同肺癌分期阶段的数据进行区分,以便准确地对病人的呼吸组学气体信号进行分类,提高肺癌分期检测的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例所提供的一种肺癌分期识别方法的流程示意图;
图2为本公开实施例所提供的一种传感器阵列信号示意图;
图3为本公开实施例所提供的另一种肺癌分期识别方法的示意图;
图4为本公开实施例所提供的一种网络结构示意图;
图5为本公开实施例所提供的一种模型训练示意图;
图6为本公开实施例所提供的一种肺癌分期识别装置的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
图1为本公开实施例所提供的一种肺癌分期识别方法的流程示意图,本公开实施例提供的方法可以由肺癌分期识别装置来执行,该装置可以采用软件和/或硬件实现,并可集成在任意具有计算能力的电子设备上。
如图1所示,本公开实施例提供的肺癌分期识别方法可包括:
步骤101,获取采样气体的传感器阵列信号,其中,传感器阵列信号包括多个第一子传感器信号。
本实施例中,采用电子鼻气体传感器阵列对病人呼吸气体样本进行信号采样,获取传感器阵列信号。其中,该气体传感器阵列由多个子传感器组成,传感器阵列信号包括多个第一子传感器信号,第一子传感器信号组成的传感器阵列信号用于单个病人样本的肺癌分类。
作为一种示例,气体传感器阵列由22个子传感器组成,本示例中采用传感器阵列中的22个子传感器信号,电子鼻气体传感器阵列从病人呼吸气体样本中采集到数据后,每个气体传感器阵列产生维度为22的呼吸组学多元时间序列,作为病人级别(传感器阵列级别)的采集信号,如图2所示。
步骤102,提取多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数。
本实施例中,由经过预训练的网络进行特征提取并生成多维向量,该网络例如为Resnet-1D网络,作为一种示例,对于上述22个子传感器信号进行特征提取,得到22个特征向量,所有特征向量均为512维,表示为hk T,用于传递至下游的分类网络。由此,通过多尺度的Resnet-1D网络进行特征提取,多尺度方面采用三个大小不同的卷积核,提取具象的细节特征和抽象的类别特征。
本实施例中,对于每种肺癌分期类别,注意力网络通过激活函数对气体传感器阵列中的每个特征向量进行排名,以为每个特征向量分配属于各肺癌分期类别的注意力分数。可选地,通过tanh函数和sigmoid函数对气体传感器阵列中的每个特征向量进行排名,并基于其对病人级别诊断的相对重要性,通过各肺癌分期类别的注意力分支的全连接层为每个特征向量分配属于各肺癌分期类别的注意力分数。由于不同肺癌分期的患者其各个气体传感器数据对于分类的贡献程度不同,不同的肺癌分期类别对各个传感器的依赖程度不同,因此对特征向量通过注意力机制网络进行加权,以通过注意力较高的N种特征向量,代表该肺癌分期类别的类别表征,并且由于不同肺癌分期阶段的特征相似度较高,通过注意力对各个子传感器在不同分期阶段的数据进行加权区别有利于提取该分期的显著类别特征。
作为一种示例,根据癌症分期为4期,即肺癌分期类别为四种,注意力网络包括与四种肺癌分期类别分别对应的四个分支网络,对于每个分支网络,通过激活函数对每个特征向量进行处理,生成每个特征向量对于该分支网络对应的肺癌分期类别的注意力分数。本示例中,将上述22个特征向量输入第一分支网络进行计算,得到每个特征向量对于第一种肺癌分期类别的注意力分数,同理,将22个特征向量输入第二分支网络,得到每个特征向量对于第二种肺癌分期类别的注意力分数,后续对于第三分支网络和第四分支网络不再赘述。
可选地,注意力分数计算公式如下,第m类的第k个特征向量的注意力分数表示为ak,m:
其中,Wa,为第m类的注意力分支分类器权重参数,Va和Ua表示注意力分支网络的权重参数,tanh、sigm分别为注意力分支网络中的激活函数。
步骤103,根据注意力分数和第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到传感器阵列信号的融合特征。
本实施例中,对于每一肺癌分期类别,根据每个特征向量对于该肺癌分期类别的注意力分数,分别对每个特征向量进行加权,对加权后的各特征向量进行求和,生成传感器阵列信号对于该肺癌分期类别的融合特征。
可选地,注意力池化层将根据特征向量各自的注意力分数对特征向量进行加权,并将各加权后的特征向量融合为病人级别的传感器阵列向量表示hpatients,m,以用于进行最终的诊断预测,公式如下:
其中,hpatients,m表示第m类的融合特征,hk为第k个特征向量,N为子传感器数量。
作为一种示例,肺癌分期类别为四种,对于其中第一种肺癌分期类别,将22个特征向量各自的属于该类的注意力分数分别对22个特征向量进行加权,并根据加权后的22个特征向量生成对于第一种肺癌分期类别的融合特征一。后续三种可参照第一种实现,不再赘述。
步骤104,将融合特征输入多类分类器进行处理,确定肺癌分期结果。
本实施例中,将每一肺癌分期类别对应的融合特征输入多类分类器,得到该肺癌分期类别的概率,将概率中最大值对应的肺癌分期类别,确定为肺癌分期结果。
可选地,通过将softmax函数应用于病人级别的预测分数Spatients,m,以计算每一肺癌分期类别上的预测概率分布,公式如下:
其中,Wc,m表示多类分类器的参数。
作为一种示例,肺癌分期类别为四种,对于其中第一种肺癌分期类别,将对应的融合特征一输入多类分类器,得到对应的预测分数一,对预测分数一进行归一化处理,得到第一种肺癌分期类别的概率一,同理,依次得到概率二、概率三和概率四,若其中最大值为概率一,则确定肺癌分期结果为第一种肺癌分期类别。
根据本公开实施例的技术方案,通过采样气体的多个子传感器信号,提取多个特征向量,并通过注意力网络分别确定每个特征向量对于每一肺癌分期类别的注意力分数,根据注意力分数和特征向量进行加权,进而对加权后的特征向量求和,获得融合特征,将融合特征输入多类分类器进行处理以确定肺癌分期结果,由此,针对基于电子鼻的肺癌分期场景,使用基于注意力的学习方法识别传感器阵列信号中具有高诊断价值的子传感器信号,通过注意力分数对特征向量进行加权,能够更精准地对不同肺癌分期阶段的数据进行区分,以便准确地对病人的呼吸组学气体信号进行分类,提高肺癌分期检测的准确性。
基于上述实施例,下面对模型训练过程进行说明。
图3为本公开实施例所提供的另一种肺癌分期识别方法的示意图,如图3所示,该方法包括:
步骤301,获取样本传感器阵列信号。
其中,样本传感器阵列信号包括多个第二子传感器信号,样本传感器阵列信号标注有对应的肺癌分期类别标记。例如,肺癌分期类别为四种,获取标记有肺癌分期类别一或二或三或四的样本传感器阵列信号,作为训练样本。
当数据中单个病人存在多个采集样本时,可进行标签选择,并重新标注,保证训练集、验证集、测试集中不存在交叉样本数据,保证数据的严谨性。
步骤302,基于样本传感器阵列信号和对应的肺癌分期类别标记,训练神经网络模型的学习参数。
其中,神经网络模型包括注意力网络和多类分类器。
本实施例中,由经过预训练的网络对第二子传感器信号进行特征提取,生成第二子传感器信号的特征向量,并通过注意力网络分别确定每个第二子传感器信号的特征向量对于每一肺癌分期类别的样本注意力分数,根据样本注意力分数和第二子传感器信号的特征向量进行加权,并根据加权后的第二子传感器信号的特征向量进行求和,得到样本传感器阵列信号的样本融合特征,将样本融合特征输入多类分类器进行处理,确定预测结果,根据预测结果与肺癌分期类别标记通过反向传播的方式更新注意力网络和多类分类器的参数,实现模型训练,使神经网络模型的输入为传感器阵列信号,输出为对应的肺癌分期类别。
在本公开的一个实施例中,对于每一种肺癌分期类别以及对应的分支网络,设置对应的聚类器,聚类器在训练过程中参与作用。其中,多个聚类器与多种肺癌分期类别一一对应,例如,肺癌分期类别为四种,注意力网络包括与四种肺癌分期类别分别对应的四个分支网络,并设置与四个分支网络分别对应的四个聚类器,每个聚类器的作用不同。若传入的样本类别与聚类器负责的类别一致,则该聚类器负责根据对应的分支网络产生的注意力分数,对N个注意力分数较高的特征向量和N个注意力分数较低的特征向量进行线性区分,以判断该类别的分支网络对子传感器信号的特征向量的关注度是否有明显的区分,起到监督注意力分支学习的作用。若传入的样本类别与聚类器负责的类别不一致,即该聚类器所对应的分支网络负责的类别与样本类别也不一致,该分支网络关注的子传感器信号的特征向量均不是该类样本的特征表征,此时挑选N个注意力分数较高的特征向量作为该聚类器的负样本进行约束学习,起到细化特征空间的作用。
本实施例中,在上述神经网络模型的训练过程中,还涉及聚类器的训练,以获取聚类器的损失函数,例如图5所示的训练过程示意图,通过在神经网络模型整体的损失函数中加入聚类器损失进行监督式惩罚,使注意力机制更好的学习,实现约束和细化特征空间,进一步提高肺癌分期识别的准确性。
可选地,聚类器的训练过程如下:对于每一肺癌分期类别,获取该肺癌分期类别的第二子传感器信号的正样本和负样本,通过各肺癌分期类别的第二子传感器信号的正样本和负样本,训练各肺癌分期类别对应的聚类器,根据训练完成的聚类器的损失函数与神经网络模型的损失函数之和,更新神经网络模型的损失函数。
其中,Loss=Σlossinst+losspatients,lossinst表示各聚类器的损失,losspatient表示原神经网络模型的损失。
下面结合神经网络模型的训练过程对聚类器部分进行说明。
获取该肺癌分期类别的第二子传感器信号的正样本和负样本,包括:对于每一肺癌分期类别,通过注意力网络确定多个第二子传感器信号的特征向量对于该肺癌分期类别的注意力分数,从多个第二子传感器信号的特征向量中,确定注意力分数较高的N个第一特征向量,以及确定注意力分数较低的N个第二特征向量;若该肺癌分期类别与样本所对应的肺癌分期类别标记一致,则将第一特征向量作为正样本,将第二特征向量作为负样本;若该肺癌分期类别与多个样本所对应的肺癌分期类别标记不一致,则将第一特征向量作为负样本。由此,多个第二子传感器信号构成的强关注区域和弱关注区域被用于代表性样本,以训练聚类器,例如图4所示,聚类器用于对特征向量(实例级别)的分类,分别用正、负类别表示传感器阵列中属于该肺癌分期类别和不属于该肺癌分期类别的实例级特征表征,当传入的病人样本的标签类别与聚类器负责的类别相同时,第一特征向量被认为是能够代表该肺癌分期类别的特征表征,第二特征向量被认为是与分类无关或者关联度较低的特征表征,聚类器通过对这两类特征进行线性分类,用作监督学习;当传入的病人样本的标签类别与聚类器负责的类别不同时,两类特征不能用于其所负责的聚类器准确线性分类,将第一特征向量作为负样本,赋予其该聚类器的负类实例标签加以学习,起到约束学习的作用,促使注意力机制和特征提取网络更好的学习,起到细化特征空间的作用。
作为一种示例,对于每一肺癌分期类别,从22个第二子传感器信号的特征向量中确定关注度最高的N个和关注度最低的N个,1<N<11,可选地N取值为8。本示例中,以肺癌分期类别一为例,将22个特征向量输入分支网络一,得到22个注意力分数,按照由高到低的顺序确定注意力分数较高的8个特征向量作为第一特征向量,以及按照由低到高的顺序确定注意力分数较低的8个特征向量作为第二特征向量,进而,若样本传感器阵列信号标注的是肺癌分期类别一,则将第一特征向量作为聚类器一的正样本,标记为1,将第二特征向量作为聚类器一的负样本,标记为0,若样本传感器阵列信号标注的不为肺癌分期类别一,则将第一特征向量作为聚类器一的负样本,标记为0。综上,获取各聚类器的训练样本,并对各聚类器进行训练,以将聚类器的损失加入到神经网络模型整体的损失函数中。
本公开实施例中,通过在神经网络模型整体的损失函数中加入聚类器损失进行监督式惩罚,使注意力机制更好的学习,实现约束和细化特征空间,提高模型的准确度,进一步提高肺癌分期识别的准确性。
图6为本公开实施例所提供的一种肺癌分期识别装置的结构示意图,如图6所示,该肺癌分期识别装置包括:获取模块61,提取模块62,融合模块63,确定模块64。
其中,获取模块61,用于获取采样气体的传感器阵列信号,其中,传感器阵列信号包括多个第一子传感器信号;
提取模块62,用于提取多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数;
融合模块63,用于根据注意力分数和第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量进行求和,得到传感器阵列信号的融合特征;
确定模块64,用于将融合特征输入多类分类器进行处理,确定肺癌分期结果。
在本公开的一个实施例中,肺癌分期类别为四种,注意力网络包括与四种肺癌分期类别分别对应的四个分支网络,提取模块62具体用于:对于每个分支网络,通过激活函数对每个所述第一子传感器信号的特征向量进行处理,生成每个所述第一子传感器信号的特征向量对于该分支网络对应的肺癌分期类别的注意力分数。
在本公开的一个实施例中,该装置还包括:训练模块,用于获取样本传感器阵列信号,其中,样本传感器阵列信号包括多个第二子传感器信号,样本传感器阵列信号标注有对应的肺癌分期类别标记;基于样本传感器阵列信号和对应的肺癌分期类别标记,训练神经网络模型的学习参数;神经网络模型包括注意力网络和多类分类器。
在本公开的一个实施例中,训练模块具体用于:对于每一肺癌分期类别,获取该肺癌分期类别的第二子传感器信号的正样本和负样本;通过各肺癌分期类别的第二子传感器信号的正样本和负样本,训练各肺癌分期类别对应的聚类器,其中,多个聚类器与多种肺癌分期类别一一对应;根据训练完成的聚类器的损失函数与神经网络模型的损失函数之和,更新神经网络模型的损失函数。
在本公开的一个实施例中,训练模块具体用于:对于每一肺癌分期类别,通过注意力网络确定多个第二子传感器信号的特征向量对于该肺癌分期类别的注意力分数;从多个第二子传感器信号的特征向量中,确定注意力分数较高的N个第一特征向量,以及确定注意力分数较低的N个第二特征向量;若该肺癌分期类别与样本所对应的肺癌分期类别标记一致,则将第一特征向量作为正样本,将第二特征向量作为负样本;若该肺癌分期类别与样本所对应的肺癌分期类别标记不一致,则将第一特征向量作为负样本。
在本公开的一个实施例中,融合模块63具体用于:对于每一肺癌分期类别,根据每个所述第一子传感器信号的特征向量对于该肺癌分期类别的注意力分数,分别对每个所述第一子传感器信号的特征向量进行加权;根据加权后的各特征向量进行求和,生成传感器阵列信号对于该肺癌分期类别的融合特征。
在本公开的一个实施例中,确定模块64具体用于:将每一肺癌分期类别对应的融合特征输入多类分类器,得到该肺癌分期类别的概率;将概率中最大值对应的肺癌分期类别,确定为肺癌分期结果。
本公开实施例所提供的肺癌分期识别装置可执行本公开实施例所提供的任意肺癌分期识别方法,具备执行方法相应的功能模块和有益效果。本公开装置实施例中未详尽描述的内容可以参考本公开任意方法实施例中的描述。
本公开实施例还提供的一种电子设备,电子设备包括一个或多个处理器和存储器。处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。存储器可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行程序指令,以实现上文的本公开的实施例的方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备还可以包括:输入装置和输出装置,这些组件通过总线系统和/或其他形式的连接机构互连。此外,该输入装置还可以包括例如键盘、鼠标等等。该输出装置可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。除此之外,根据具体应用情况,电子设备还可以包括诸如总线、输入/输出接口等任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种肺癌分期识别方法,其特征在于,包括:
获取采样气体的传感器阵列信号,其中,所述传感器阵列信号包括多个第一子传感器信号;
提取所述多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数;
根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征;
将所述融合特征输入多类分类器进行处理,确定肺癌分期结果;
其中,所述根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征,包括:
对于每一肺癌分期类别,根据每个所述第一子传感器信号的特征向量对于该肺癌分期类别的注意力分数,分别对每个所述第一子传感器信号的特征向量进行加权;
根据加权后的各第一子传感器信号的特征向量进行求和,生成所述传感器阵列信号对于该肺癌分期类别的融合特征。
2.如权利要求1所述的方法,其特征在于,所述肺癌分期类别为四种,所述注意力网络包括与四种肺癌分期类别分别对应的四个分支网络,所述通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数,包括:
对于每个分支网络,通过激活函数对每个所述第一子传感器信号的特征向量进行处理,生成每个所述第一子传感器信号的特征向量对于该分支网络对应的肺癌分期类别的注意力分数。
3.如权利要求1或2所述的方法,其特征在于,还包括:
获取样本传感器阵列信号,其中,所述样本传感器阵列信号包括多个第二子传感器信号,所述样本传感器阵列信号标注有对应的肺癌分期类别标记;
基于所述样本传感器阵列信号和所述对应的肺癌分期类别标记,训练神经网络模型的学习参数;所述神经网络模型包括所述注意力网络和所述多类分类器。
4.如权利要求3所述的方法,其特征在于,所述基于所述样本传感器阵列信号和所述对应的肺癌分期类别标记,训练神经网络模型的学习参数,包括:
对于每一肺癌分期类别,获取该肺癌分期类别的第二子传感器信号的正样本和负样本;
通过各肺癌分期类别的第二子传感器信号的正样本和负样本,训练各肺癌分期类别对应的聚类器,其中,多个聚类器与多种肺癌分期类别一一对应;
根据训练完成的所述聚类器的损失函数与所述神经网络模型的损失函数之和,更新所述神经网络模型的损失函数。
5.如权利要求4所述的方法,其特征在于,所述对于每一肺癌分期类别,获取该肺癌分期类别的第二子传感器信号的正样本和负样本,包括:
对于每一肺癌分期类别,通过注意力网络确定多个第二子传感器信号的特征向量对于该肺癌分期类别的注意力分数;
从所述多个第二子传感器信号的特征向量中,确定注意力分数较高的N个第一特征向量,以及确定注意力分数较低的N个第二特征向量;
若该肺癌分期类别与样本所对应的肺癌分期类别标记一致,则将所述第一特征向量作为所述正样本,将所述第二特征向量作为所述负样本;
若该肺癌分期类别与所述样本所对应的肺癌分期类别标记不一致,则将所述第一特征向量作为所述负样本。
6.如权利要求1所述的方法,其特征在于,所述将所述融合特征输入多类分类器进行处理,确定肺癌分期结果,包括:
将每一肺癌分期类别对应的融合特征输入所述多类分类器,得到该肺癌分期类别的概率;
将所述概率中最大值对应的肺癌分期类别,确定为所述肺癌分期结果。
7.一种肺癌分期识别装置,其特征在于,包括:
获取模块,用于获取采样气体的传感器阵列信号,其中,所述传感器阵列信号包括多个第一子传感器信号;
提取模块,用于提取所述多个第一子传感器信号的特征向量,并通过注意力网络分别确定每个所述第一子传感器信号的特征向量对于每一肺癌分期类别的注意力分数;
融合模块,用于根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征;
确定模块,用于将所述融合特征输入多类分类器进行处理,确定肺癌分期结果;
其中,所述根据所述注意力分数和所述第一子传感器信号的特征向量进行注意力加权,并通过对加权后的第一子传感器信号的特征向量求和,得到所述传感器阵列信号的融合特征,包括:
对于每一肺癌分期类别,根据每个所述第一子传感器信号的特征向量对于该肺癌分期类别的注意力分数,分别对每个所述第一子传感器信号的特征向量进行加权;
根据加权后的各第一子传感器信号的特征向量进行求和,生成所述传感器阵列信号对于该肺癌分期类别的融合特征。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6中任一所述的肺癌分期识别方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-6中任一所述的肺癌分期识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310129796.XA CN116502158B (zh) | 2023-02-07 | 2023-02-07 | 肺癌分期识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310129796.XA CN116502158B (zh) | 2023-02-07 | 2023-02-07 | 肺癌分期识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116502158A CN116502158A (zh) | 2023-07-28 |
CN116502158B true CN116502158B (zh) | 2023-10-27 |
Family
ID=87323731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310129796.XA Active CN116502158B (zh) | 2023-02-07 | 2023-02-07 | 肺癌分期识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116502158B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114529516A (zh) * | 2022-01-17 | 2022-05-24 | 重庆邮电大学 | 基于多注意力与多任务特征融合的肺结节检测与分类方法 |
CN114864076A (zh) * | 2022-05-07 | 2022-08-05 | 扬州大学 | 基于图注意力网络的多模态乳腺癌分类训练方法及系统 |
CN114970772A (zh) * | 2022-07-26 | 2022-08-30 | 北京纳通医用机器人科技有限公司 | 用于肺部疾病检测的模型训练方法、设备、装置和介质 |
CN115097064A (zh) * | 2021-09-24 | 2022-09-23 | 深圳大学 | 一种气体检测方法、装置、计算机设备及存储介质 |
WO2023006843A1 (en) * | 2021-07-28 | 2023-02-02 | Institut Curie | Prediction of brcaness/homologous recombination deficiency of breast tumors on digitalized slides |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023501126A (ja) * | 2019-11-22 | 2023-01-18 | エフ.ホフマン-ラ ロシュ アーゲー | 組織画像分類用のマルチインスタンス学習器 |
-
2023
- 2023-02-07 CN CN202310129796.XA patent/CN116502158B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023006843A1 (en) * | 2021-07-28 | 2023-02-02 | Institut Curie | Prediction of brcaness/homologous recombination deficiency of breast tumors on digitalized slides |
CN115097064A (zh) * | 2021-09-24 | 2022-09-23 | 深圳大学 | 一种气体检测方法、装置、计算机设备及存储介质 |
CN114529516A (zh) * | 2022-01-17 | 2022-05-24 | 重庆邮电大学 | 基于多注意力与多任务特征融合的肺结节检测与分类方法 |
CN114864076A (zh) * | 2022-05-07 | 2022-08-05 | 扬州大学 | 基于图注意力网络的多模态乳腺癌分类训练方法及系统 |
CN114970772A (zh) * | 2022-07-26 | 2022-08-30 | 北京纳通医用机器人科技有限公司 | 用于肺部疾病检测的模型训练方法、设备、装置和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116502158A (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961089B (zh) | 基于度量学习和元学习的小样本和零样本图像分类方法 | |
Shen et al. | Generative adversarial learning towards fast weakly supervised detection | |
CN109086658B (zh) | 一种基于生成对抗网络的传感器数据生成方法与系统 | |
Fuentes et al. | Deep learning-based phenotyping system with glocal description of plant anomalies and symptoms | |
CN111897964A (zh) | 文本分类模型训练方法、装置、设备及存储介质 | |
CN109783618A (zh) | 基于注意力机制神经网络的药物实体关系抽取方法及系统 | |
CN109241377A (zh) | 一种基于深度学习话题信息增强的文本文档表示方法和装置 | |
CN113627151B (zh) | 跨模态数据的匹配方法、装置、设备及介质 | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
Rosli et al. | Development of CNN transfer learning for dyslexia handwriting recognition | |
CN111522953B (zh) | 一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质 | |
WO2020108808A1 (en) | Method and system for classification of data | |
Song et al. | Music auto-tagging using scattering transform and convolutional neural network with self-attention | |
CN113779282B (zh) | 基于自注意力和生成对抗网络的细粒度跨媒体检索方法 | |
CN112489689B (zh) | 基于多尺度差异对抗的跨数据库语音情感识别方法及装置 | |
CN116502158B (zh) | 肺癌分期识别方法、装置、设备及存储介质 | |
Liang et al. | Accurate image recognition of plant diseases based on multiple classifiers integration | |
Wang et al. | Interpret neural networks by extracting critical subnetworks | |
Dong et al. | Scene-oriented hierarchical classification of blurry and noisy images | |
Wang et al. | Hierarchical-taxonomy-aware and attentional convolutional neural networks for acoustic identification of bird species: A phylogenetic perspective | |
CN115083511A (zh) | 基于图表示学习与注意力的外围基因调控特征提取方法 | |
CN114582449A (zh) | 基于XLNet-BiGRU-CRF模型的电子病历命名实体标准化方法和系统 | |
CN114566184A (zh) | 音频识别方法及相关装置 | |
Jiang et al. | Learning from noisy labels with noise modeling network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |