CN110473192A - 消化道内镜图像识别模型训练及识别方法、装置及系统 - Google Patents
消化道内镜图像识别模型训练及识别方法、装置及系统 Download PDFInfo
- Publication number
- CN110473192A CN110473192A CN201910739785.7A CN201910739785A CN110473192A CN 110473192 A CN110473192 A CN 110473192A CN 201910739785 A CN201910739785 A CN 201910739785A CN 110473192 A CN110473192 A CN 110473192A
- Authority
- CN
- China
- Prior art keywords
- label
- digestive endoscope
- image
- endoscope image
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 335
- 230000001079 digestive effect Effects 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000003902 lesion Effects 0.000 claims abstract description 313
- 230000006870 function Effects 0.000 claims description 140
- 238000000605 extraction Methods 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 5
- 238000003909 pattern recognition Methods 0.000 claims description 4
- 230000029087 digestion Effects 0.000 claims 3
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 28
- 238000013473 artificial intelligence Methods 0.000 abstract description 13
- 201000010099 disease Diseases 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 5
- 210000001035 gastrointestinal tract Anatomy 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 210000000436 anus Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000002052 colonoscopy Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000505 pernicious effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 208000018556 stomach disease Diseases 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10068—Endoscopic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30092—Stomach; Gastric
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Pathology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及计算机技术领域,主要涉及人工智能中计算机视觉技术,尤其涉及消化道内镜图像识别模型训练及识别方法、装置及系统,获取训练消化道内镜图像样本集,训练消化道内镜图像样本集中至少包括强标签消化道内镜训练图像样本,并基于其图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,根据标记结果,训练消化道内镜图像识别模型,直至强监督目标函数收敛,获得训练完成的消化道内镜图像识别模型,从而可以基于消化道内镜图像识别模型,获得待识别消化道内镜图像的病变类别识别结果。根据病变位置可以更准确地定位出某病变类别的图像特征信息,减少噪声,提高可靠性和准确性。
Description
本发明申请是申请日为2019年04月10日、申请号为201910284918.6发明名称为
“一种图像识别模型训练及图像识别方法、装置及系统”的发明申请的分案申请。
技术领域
本发明涉及计算机技术领域,尤其涉及消化道内镜图像识别模型训练及识别方法、装置及系统。
背景技术
针对各种医疗影像诊断分析中,例如,消化道疾病的诊断,通常是基于内镜等诊断工具,获得机体的内部图像后,相关医疗人员通过人眼观察判断是否存在病变以及存在病变的类别,识别效率较低。
现有技术中,还提供了一种识别方法,主要是获取大量内镜影像,由相关医疗人员对每张图像进行病变类别的标注,将标注后的图像作为样本进行模型训练,从而可以基于训练的模型,对其它医疗图像进行病变识别,判断是否发生病变,自动给出诊断结果。
但是,现有技术中这种方式,训练模型的样本的标注,通常是与目标任务一致,仅是单一的图像级标注信息,从而导致模型准确性较低,可能预测不准确。
发明内容
本发明实施例提供消化道内镜图像识别模型训练及识别方法、装置及系统,以解决现有技术中样本标注单一,导致训练的模型对病变预测准确性较低的问题。
本发明实施例提供的具体技术方案如下:
本发明一个实施例提供了一种图像识别模型训练方法,包括:
获取训练图像样本集,其中,所述训练图像样本集中至少包括强标签训练图像样本;其中,强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
提取所述训练图像样本集中图像样本的图像特征信息;
基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,其中,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
本发明另一个实施例提供了一种图像识别方法,包括:
获取待识别图像;
提取所述待识别图像的图像特征信息;
基于预设的图像识别模型,以所述待识别图像的图像特征信息为输入参数,获得所述待识别图像的病变类别识别结果;其中,所述图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息。
本发明另一个实施例提供了一种图像识别模型训练装置,包括:
获取模块,用于获取训练图像样本集,其中,所述训练图像样本集中至少包括强标签训练图像样本;其中,强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
提取模块,用于提取所述训练图像样本集中图像样本的图像特征信息;
训练模块,用于基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
结合本发明另一个实施例,所述训练图像样本集中还包括弱标签训练图像样本;弱标签训练图像样本表示有弱标签信息的图像样本,所述弱标签信息包括病变类别的标注信息;则训练模块进一步用于:
根据所述图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的总目标函数收敛,获得训练完成的图像识别模型;其中,所述总目标函数为强监督目标函数和弱监督目标函数的总损失函数,所述弱监督目标函数为识别出的病变类别与弱标签信息中病变类别之间的损失函数。
结合本发明另一个实施例,提取所述训练图像样本集中图像样本的图像特征信息时,提取模块具体用于:
将所述训练图像样本集中图像样本输入到神经网络;
获得基于所述神经网络对图像样本进行特征提取后输出的设定维度的图像特征信息。
结合本发明另一个实施例,所述图像特征信息为P*P*C维度,P为设定值,P*P表示将图像样本横纵向等分的P*P个图像块,C为预设病变类别数目。
结合本发明另一个实施例,基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛时,训练模块具体用于:
根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息;
并根据标记结果,确定强监督目标函数;
优化所述强监督目标函数,直至所述强监督函数收敛时,确定训练完成。
结合本发明另一个实施例,根据所述图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的总目标函数收敛时,训练模块具体用于:
若为强标签训练图像样本,根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数;
若为弱标签训练图像样本,根据所述图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数;
根据所述强监督目标函数和所述弱监督目标函数,确定总目标函数;
优化所述总目标函数,直至所述总目标函数收敛时,确定训练完成。
结合本发明另一个实施例,根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数时,训练模块具体用于:
分别针对每个强标签训练图像样本,根据强标签训练图像样本对应的强标签信息中病变位置,分别确定强标签训练图像样本的图像特征信息中每个图像块与病变位置的重叠率,若重叠率不小于阈值,则将对应图像块标记为1,否则标记为0,获得强标签训练图像样本是否属于对应的强标签信息中病变类别的标记信息;
并获得强标签训练图像样本是否属于除强标签信息中病变类别的其它预设病变类别的标记信息为0;
分别根据每个强标签训练图像样本是否属于各病变类别的标记信息和图像特征信息,确定强监督目标函数。
结合本发明另一个实施例,根据所述图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数时,训练模块具体用于:
分别针对每个弱标签训练图像样本,根据弱标签训练图像样本对应的弱标签信息中病变类别,分别确定弱标签训练图像样本的图像特征信息中每个图像块属于各预设病变类别的概率;
确定弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值;
分别根据每个弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值,以及对应的弱标签信息中病变类别,确定弱监督目标函数。
本发明另一个实施例提供了一种图像识别装置,包括:
获取模块,用于获取待识别图像;
提取模块,用于提取所述待识别图像的图像特征信息;
识别模块,用于基于预设的图像识别模型,以所述待识别图像的图像特征信息为输入参数,获得所述待识别图像的病变类别识别结果;其中,所述图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息。
本发明另一个实施例提供了一种图像识别系统,至少包括:图像采集设备、图像处理设备和输出设备,具体地:
图像采集设备,用于获取待识别图像;
处理设备,用于提取所述待识别图像的图像特征信息,并基于预设的图像识别模型,以所述待识别图像的图像特征信息为输入参数,获得所述待识别图像的病变类别识别结果;其中,所述图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
显示设备,用于输出所述待识别图像的病变类别识别结果。
本发明另一个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种图像识别模型训练方法或图像识别方法的步骤。
本发明另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种图像识别模型训练方法或图像识别方法的步骤。
本发明实施例中,获取训练图像样本集,其中,所述训练图像样本集中至少包括强标签训练图像样本;其中,强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;提取所述训练图像样本集中图像样本的图像特征信息;基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,其中,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。这样,强标签训练图像样本中标注有病变位置和病变类别,可以不仅基于病变类别标注信息,还可以利用除病变类别之外的其它标注信息,根据病变位置可以更加准确地定位出某病变类别的图像特征信息,从而可以更准确地区分属于强标签中病变类别的图像特征信息和不属于该病变类别的图像特征信息,减少训练的样本噪声,提高训练可靠性,使得图像识别模型预测更加准确。
附图说明
图1为本发明实施例中图像识别模型训练及图像识别方法的应用架构示意图;
图2为本发明实施例中图像识别模型训练方法流程图;
图3为本发明实施例中强标签训练图像样本和弱标签训练图像样本示意图;
图4为本发明实施例中强标签训练图像样本的特征图和标签图的示意图;
图5为本发明实施例中图像识别模型训练方法原理框图;
图6为本发明实施例中图像识别模型训练中监督分离层的实现逻辑示意图;
图7为本发明实施例中图像识别方法流程图;
图8为本发明实施例中图像识别方法原理框图;
图9为本发明实施例中图像识别系统的结构示意图;
图10为本发明实施例中图像识别模型训练装置结构示意图;
图11为本发明实施例中图像识别装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面先对几个概念进行简单介绍:
弱标签信息:表示仅包括单一的任务所需信息的标注信息,本发明实施例中表示仅包括病变类别的标注信息。
强标签信息:表示除包括任务所需信息外还包括其它相关信息的标注信息,本发明实施例中表示至少包括病变类别和病变位置的标注信息。其中,病变类别可以表示各种消化道病变性质的分类,例如分为良性、恶性等,病变位置表示导致被判定为某一病变类别的病变区域的位置。
深度目标检测(Deeply Supervised Object Detector,DSOD)算法:是一种不需要预先训练的检测算法。
交并比(Intersection-over-Union,IOU):表示两块区域相交的部分与两个区域的并集之间的比值,也可以理解为检测结果产生的候选框与原标记框的交叠率,即它们的交集与并集的比值,可以用于评价检测的准确率。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、三维(3Dimensions,3D)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。例如,本申请实施例中可以将人工智能技术应用到医疗领域,本申请实施例中主要涉及人工智能中的计算机视觉技术,可以通过计算机视觉技术中图像语义理解技术,实现图像特征提取,例如提取训练图像样本集中图像样本的图像特征信息,又例如,还可以基于图像语义理解技术中图像分类技术,进行标记,从而可以根据标记的预设各病变类型的图像特征信息,识别待识别图像中是否有病变,并属于哪类病变类别。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案主要涉及人工智能的计算机视觉等技术,具体通过如下实施例进行说明:
目前,消化道疾病的发生越来越频繁,发病率也居高不下,即使暂时治愈了也有很大的复发可能,然而,若能尽早发现病变并进行预防,则可以大大提高完全治愈率。针对消化道疾病的诊断分析,通常是采用内镜作为诊断工具,采集胃部、食道等部位的影像,例如,常见的内镜如胃镜,由患者的口腔进入患者的食道、胃部、十二指肠等,又如肠镜则由患者的肛门进入患者的结直肠进行检查,在检查过程中,可以进行影像存档,方便相关医疗人员后续分析,但是相关医疗人员仅通过人眼观察判断是否存在病变以及存在病变的类别,识别效率和准确性都比较低。
现有技术中还提供了一种方式,可以自动诊断消化道疾病,获取大量内镜影像,由相关医疗人员对每张图像进行病变类别的标注,将标注后的图像作为样本进行模型训练,从而可以基于训练的模型,对其它医疗图像进行病变识别,判断是否发生病变,自动给出诊断结果。
但是现有技术中,训练图像样本的标注通常是与目标任务一致,仅是与任务同等级的单一标注,例如,目标任务是判断胃部病变性质类别,则标注的就是每张图像的病变类别,从而会导致模型准确性较低,现有技术针对消化道内镜影像的识别分析中还未有基于强标签的相关研究。
因此,本发明实施例中提供了一种图像识别模型的训练方法,利用标注信息更多的强标签训练图像样本,强标签信息至少包括病变类别和病变位置的标注信息,提取训练图像样本集中图像样本的图像特征信息,根据图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,进而可以基于训练完成的图像识别模型,对待识别图像进行病变识别,这样,由于标注信息更丰富,病变位置可以进一步辅助对病变类别的识别,因此可以达到在同等数据量下更佳的效果,为消化道内镜医疗诊断方法提供一种新的训练方法,从而使得图像识别模型更加准确,提高病变识别预测准确性。
并且,本发明实施例中,还可以同时联合强标签训练图像样本和弱标签训练图像样本,来训练图像识别模型,相比于仅采用弱标签训练图像样本进行训练,也可以一定程度上提高图像识别模型的预测准确性。
参阅图1所示,为本发明实施例中图像识别模型训练及图像识别方法的应用架构示意图,包括服务器100、终端设备200。
终端设备200可以是医疗设备,例如,用户可以基于终端设备200查看图像病变识别结果。
终端设备200与服务器100之间可以通过互联网相连,实现相互之间的通信。可选地,上述的互联网使用标准通信技术和/或协议。互联网通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan AreaNetwork,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure SocketLayer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(VirtualPrivate Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
服务器100可以为终端设备200提供各种网络服务,其中,服务器100可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。
具体地,服务器100可以包括处理器110(Center Processing Unit,CPU)、存储器120、输入设备130和输出设备140等,输入设备130可以包括键盘、鼠标、触摸屏等,输出设备140可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器120可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器110提供存储器120中存储的程序指令和数据。在本发明实施例中,存储器120可以用于存储本发明实施例中图像识别模型训练方法或图像识别方法的程序。
处理器110通过调用存储器120存储的程序指令,处理器110用于按照获得的程序指令执行本发明实施例中任一种图像识别模型训练方法或图像识别方法的步骤。
需要说明的是,本发明实施例中,图像识别模型训练方法或图像识别方法主要由服务器100侧执行,例如,针对图像识别方法,终端设备200可以将采集到的消化道等机体部位的图像,发送给服务器100,由服务器100对图像进行病变识别,并可以将病变识别结果返回给终端设备200。如图1所示的应用架构,是以应用于服务器100侧为例进行说明的,当然,本发明实施例中图像识别方法也可以由终端设备200执行,例如终端设备200可以从服务器100侧获得训练好的图像识别模型,从而基于该图像识别模型,对图像进行病变识别,获得病变识别结果,对此本发明实施例中并不进行限制。
另外,本发明实施例中的应用架构图是为了更加清楚地说明本发明实施例中的技术方案,并不构成对本发明实施例提供的技术方案的限制,当然,也并不仅限于消化道疾病诊断业务应用,对于其它的应用架构和业务应用,本发明实施例提供的技术方案对于类似的问题,同样适用。
本发明各个实施例以应用于图1所示的应用架构图为例进行示意性说明。
基于上述实施例中,参阅图2所示,为本发明实施例中图像识别模型训练方法流程图,该方法包括:
步骤200:获取训练图像样本集,其中,训练图像样本集中至少包括强标签训练图像样本;其中,强标签训练图像样本表示有强标签信息的图像样本,强标签信息至少包括病变类别和病变位置的标注信息。
本发明实施例中,主要是利用强标签训练图像样本提高病变识别的准确性,在训练图像识别模型时,可以预先获取大量消化道内镜的图像,由相关医疗人员进行标注,同时标注病变类别和发生病变的病变位置,从而可以获得大量已标注的强标签训练图像样本。
进一步地,训练图像样本集中还可以包括弱标签训练图像样本;其中,弱标签训练图像样本表示有弱标签信息的图像样本,弱标签信息包括病变类别的标注信息。例如,可能相关医疗人员在标注时,只标注了病变类别,未标注病变位置,这时的样本即是弱标签训练图像样本。
这样,若训练图像样本集中包括两种标注等级的样本,即强标签训练图像样本和弱标签训练图像样本,则可以结合这两种训练图像样本联合训练图像识别模型。
参阅图3所示,为本发明实施例中强标签训练图像样本和弱标签训练图像样本示意图,如图3中左图和右图为针对同种病变的两张图,其中左图中标注有一个方框,也可以称为定位框,表示病变位置,方框内区域即表示发生属于某病变类别的病变的区域,而右图中没有定位框,仅包括病变类别标注信息,即左图为强标签训练图像样本,右图为弱标签训练图像样本。
另外需要说明的是,本发明旨在利用除病变类别之外的其它更多标注信息,来提高图像识别模型的病变预测的准确性,因此,强标签信息并不仅限于包括病变类别和病变位置,还可以是包括病变类别和其它标注信息,本发明实施例中并不进行限制。
步骤210:提取训练图像样本集中图像样本的图像特征信息。
执行步骤210时,具体包括:
1)将所述训练图像样本集中图像样本输入到神经网络。
考虑到病变类别的识别本身是一个比较复杂的问题,因此采用神经网络结构进行特征提取,神经网络例如为DSOD,当然还可以采用其它具有相同表征能力的深度神经网络,本发明实施例中并不进行限制。
2)获得基于神经网络对图像样本进行特征提取后输出的设定维度的图像特征信息。
其中,图像特征信息为P*P*C维度,P为设定值,P*P表示将图像样本横纵向等分的P*P个图像块,C为预设病变类别数目,其中,例如P为设定的任意自然数。
即经过特征提取后输出的图像特征信息维度为P*P*C,例如,将图像等分为5*5的25个图像块,预设病变类别数目为10,则最后提取的图像特征信息为5*5*10维度的数据,每个点可以对应一个图像块,每个点的取值代表了对应图像块是否属于某一病变类别的概率。
进一步地,为便于计算,提高训练效率,还可以将图像特征信息经过激活函数处理,将图像特征信息数据映射到一定取值范围内,例如,采用sigmoid函数,映射到(0,1)之间,进而可以采用经过激活函数处理后的图像特征信息,训练图像识别模型。
步骤220:基于图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,其中,强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
本发明实施例中,在训练图像识别模型时,根据训练图像样本集中样本的标注情况,相应地提供了以下几种实施方式:
第一种实施方式:训练图像样本集中仅包括强标签训练图像样本,则基于图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型。
具体包括:S1、根据图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数。
本发明实施例中,在基于强标签训练图像样本进行训练时,图像识别模型的输入为强标签训练图像样本,即有强标签信息的图像样本,输出为识别出的病变类别,目标函数即是强监督目标函数。
具体地,本发明实施例中给出了一种确定强监督目标函数的方式,包括:
S1.1、1)标记属于对应强标签中病变类别的图像特征信息,具体地:
分别针对每个强标签训练图像样本,根据强标签训练图像样本对应的强标签信息中病变位置,分别确定强标签训练图像样本的图像特征信息中每个图像块与病变位置的重叠率,若重叠率不小于阈值,则将对应图像块标记为1,否则标记为0,获得强标签训练图像样本是否属于对应的强标签信息中病变类别的标记信息。
其中,确定每个图像块与病变位置的重叠率,分别计算图像特征信息中每个图像块与病变位置的IOU值,IOU值即可以表示重叠率,若不小于一定阈值,说明该小图像块属于该病变类别的病变可能性较大,标记为1,否则标记为0,从而得到该强标签训练图像样本的各个图像块属于该强标签信息中病变类别的标记信息。
另外,确定每个图像块与病变位置的重叠率,也可以采用其它计算方式,本发明实施例中并不进行限制,例如分别计算每个图像块对于病变位置的占比,即占了定位框的比例大小,当不小于一定比例时,标记为1,认为属于该病变类别的可能性较大,否则标记为0。
需要说明的是,本发明实施例中将训练图像样本经过特征提取后得到的图像特征信息对应的称为特征图,将强标签训练图像样本是否属于各病变类别的标记信息对应的称为标签图,标签图对应的也是一个P*P*C维度的数据。
例如,参阅图4所示,为本发明实施例中强标签训练图像样本的特征图和标签图的示意图,图4中(A)图为输入的强标签训练图像样本,该图像样本中定位框区域对应的病变类别为A,将该图像样本划分为4个图像块,划分的图像块序号分别为1、2、3、4,图4中(B)图为对应的特征图,特征图中各点分别对应一个图像块,计算各图像块与定位框的重叠率,例如,1和2图像块与定位框的IOU超过了阈值,3和4图像块与定位框的IOU小于阈值,则1和2图像块标记为1,3和4图像块标记为0,即得到如图4中(C)图所示的标签图,表示该图像样本属于病变类别A的标签图。
2)进一步地,还可以确定出不属于对应强标签信息中病变类别的图像特征信息,即获得图像样本的图像特征信息是否属于除强标签信息中病变类别的其它预设病变类别的标记信息,具体地:获得强标签训练图像样本是否属于除强标签信息中病变类别的其它预设病变类别的标记信息为0。
也就是说,对于不属于强标签信息的其它病变类别,说明该图像样本中不存在属于其它病变类别的病变区域,则该图像样本对于其它病变类别的标记信息为0,即得到对应的标签图中各个图像块对应的标记为0。
例如,针对同种病变,预设的病变类别有三种,分别为A、B和C,某强标签训练图像样本的强标签信息中病变类别为A,则该强标签训练图像样本属于病变类别B和C的标记信息为0。
S1.2、分别根据每个强标签训练图像样本是否属于各病变类别的标记信息和图像特征信息,确定强监督目标函数。
具体地,将标记信息与图像特征信息的损失函数作为强监督目标函数。
例如,强监督目标函数为:
其中,表示强标签信息,Xstrong表示强标签训练图像样本, 表示经过特征提取获得的图像特征信息。
其中,其中,a表示任意变量。
S2、优化强监督目标函数,直至强监督函数收敛时,确定训练完成。
即在训练过程中不断优化强监督目标函数,使其最小化并收敛,即确定图像识别模型训练完成。
也就是说,本发明实施例中可以仅基于强标签训练图像样本,训练图像识别模型,标记信息更加丰富,可以根据病变位置,识别出属于某病变类别的更准确的图像特征信息,使得训练信息更加可靠,减少噪声,从而使得训练得到的图像识别模型更加可靠,提高了准确性。
第二种实施方式:训练图像样本集中包括强标签训练图像样本和弱标签训练图像样本,则根据图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至图像识别模型的总目标函数收敛,获得训练完成的图像识别模型;其中,总目标函数为强监督目标函数和弱监督目标函数的总损失函数,弱监督目标函数为识别出的病变类别与弱标签信息中病变类别之间的损失函数。
第二种实施方式,主要针对可能获得的训练图像样本标注等级不同的情况,例如,可能有只标注了病变类别的训练图像样本,也可能有既标注了病变类别又标注了病变位置的训练图像样本,可以不用区分这两种训练图像样本,联合进行训练,一定程度上也丰富了训练图像样本数量,这时,本发明实施例中提供了一种基于不同标注等级训练图像样本联合训练的方式,具体包括:
S1、若为强标签训练图像样本,根据图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数。
具体地确定强监督目标函数的方式和上述第一种实施方式相同,这里就不再进行赘述了。
S2、若为弱标签训练图像样本,根据图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数。
本发明实施例中,若训练图像样本为弱标签训练图像样本时,图像识别模型的输入为弱标签训练图像样本,即有弱标签信息的图像样本,输出为识别出的病变类别,目标函数即是弱监督目标函数。
具体地,本发明实施例中给出了一种确定弱监督目标函数的方式,包括:
S2.1、分别针对每个弱标签训练图像样本,根据弱标签训练图像样本对应的弱标签信息中病变类别,分别确定弱标签训练图像样本的图像特征信息中每个图像块属于各预设病变类别的概率。
这样,每个弱标签训练图像样本都可以分别针对每个预设病变类别,确定其属于该病变类别的概率,称为类别特征图,每个类别特征图表示图像样本中P*P个图像块为该病变类别的概率。
S2.2、确定弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值。
例如,预设病变类别有2种,分别为病变类别A和病变类别B,某个弱标签训练图像样本,被划分为4个图像块,其弱标签信息为病变类别A,则确定该弱标签训练图像样本的4个图像块分别属于病变类别A的概率,假设分别为0.5,0.8,0.2,0,3,并由于弱标签为病变类别A,则该弱标签训练图像样本的4个图像块分别属于病变类别B的概率均为0,然后,针对每种病变类别,选择其中概率的最大值,作为该弱标签训练图像样本整体属于各病变类别的概率,即确定该弱标签训练图像样本的4个图像块分别属于病变类别A的概率中最大值为0.8,分别属于病变类别B的概率中最大值为0,即认为该弱标签训练图像样本属于病变类别A的概率为0.8,属于病变类别B的概率为0,这样,可以获得每个弱标签训练图像样本分别针对每种病变类别的概率。
S2.3、分别根据每个弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值,以及对应的弱标签信息中病变类别,确定弱监督目标函数。
具体地,计算每个图像块属于各预设病变类别的概率中的最大值与弱标签信息中病变类别的损失函数,将该损失函数作为弱监督目标函数。
例如,弱监督目标函数为:
其中,表示弱标签信息,Xweak表示弱标签训练图像样本, 表示经过特征提取获得的图像特征信息。
S3、根据强监督目标函数和弱监督目标函数,确定总目标函数。
例如,总目标函数为:
Ltotal=λLstrong+(1-λ)Lweak
其中,λ为预设权值,用于权衡强标签训练图像样本和弱标签训练图像样本的损失函数在总损失函数中的占比。
S4、优化总目标函数,直至总目标函数收敛时,确定训练完成。
这时总目标函数收敛,即需要强监督目标函数和弱监督目标函数均收敛,当两者均收敛时完成训练过程。
本发明实施例中,可以结合强标签训练图像样本和弱标签训练图像样本,来联合训练图像识别模型,这样,可以在一定程度上允许弱标签训练图像样本存在,又可以充分利用训练图像样本中的所有标注信息,提高图像识别模型准确性。
进一步地,由于本发明实施例中主要是基于至少有病变类别和病变位置的强标签训练图像样本进行训练的,因此,训练得到的图像识别模型不仅可以用于识别病变类别,还可以用于识别病变位置。
基于上述实施例,下面采用一个具体应用场景进行说明,以训练图像样本集中同时包括强标签训练图像样本和弱标签训练图像样本为例进行说明,参阅图5所示,为本发明实施例中图像识别模型训练方法原理框图。
如图5所示,图像识别模型训练方法的整体流程可以分为两部分,具体包括:
第一部分:特征提取部分。
以基于DSOD模型进行特征提取为例,如图5所示,图5中特征提取部分为DSOD模型基本结构,训练图像样本集中图像样本分别经过卷积、密块(dense block)、卷积、池化、dense block等操作,在最后一层输出设定维度的图像特征信息,维度为P*P*C,表示图像样本的特征图。并且将特征图通过sigmoid函数后,得到监督分离层的输入特征图。
例如,监督分离层的输入特征图为:
其中,Xstrong表示强标签训练图像样本,Xweak表示弱标签训练图像样本, 表示强标签信息,表示弱标签信息,经过特征提取最后一层输出的图像特征信息为
第二部分:监督分离层。
本发明实施例中,监督分离层主要包括强监督分支和弱监督分支,将基于不同标签信息的训练图像样本分别经过不同分支进行训练,判断训练图像样本的标签信息是否为强标签信息,若是,则将强标签训练图像样本进入强监督分支进行训练,若不是强标签信息,则将弱标签训练图像样本进入弱监督分支进行训练。
如图5所示,预设病变类别有两种,分别为病变类别A和病变类别B,强监督分支主要是基于强标签信息中病变类别和病变位置,通过训练预测病变类别并确定强监督目标函数,弱监督分支主要是基于弱标签信息中病变类别,通过训练预测病变类别并确定弱监督目标函数,这样,不断优化强监督目标函数和弱监督目标函数,均达到收敛,完成训练过程,达到同步利用强标签训练图像样本和弱标签训练图像样本训练图像识别模型的目的。
具体地,参阅图6所示,为本发明实施例中图像识别模型训练中监督分离层的实现逻辑示意图。如图6所示,训练图像样本集中图像样本的图像特征信息,根据标注等级不同,经过分离器,分别进入强监督分支和弱监督分支。
强监督分支:监督分离层的输入特征图,根据强标签信息中病变位置,对输入特征图中每个图像块分别进行估计,分别获得每个图像块是否属于每个预设病变类别的标记,获得对应的标签图,即针对一个病变类别就有对应的一个标签图,标签图与输入特征图的损失函数作为强监督目标函数。
可知,由于强标签训练图像样本中有病变位置的标注信息,因此,可以分别针对每个图像块进行估计判别,分别判断每个图像块是否属于某个病变类别,能确定出更准确的表示病变的图像特征信息,从而可以实现基于病变位置,提高病变类别识别的准确性。
弱监督分支:监督分离层的输入特征图,由于弱标签训练图像样本中只有病变类别的标注信息,没有病变位置,因此,只能针对输入特征图进行整体估计,分别判断该输入特征图整体是否属于每个预设病变类别,分别针对每个预设病变类别获得一个相应的总估计的概率,得到该输入特征图的标签,即针对一个病变类别就有对应的一个概率,总估计的概率与弱标签信息中病变类别的损失函数作为弱监督目标函数。
可知,弱标签训练图像样本中仅有病变类别的标注信息,因此训练时,只能获知整体输入特征图中所有图像特征信息是否属于某个病变类别,而实际中可能只有其中几个小图像块的图像特征信息才符合相应病变类别的图像特征信息,这样,弱标签训练图像样本在训练时,会引入一些噪声图像特征信息。
因此,本发明实施例中,基于强标签训练图像样本,或者强标签训练图像样本和弱标签训练图像样本联合,训练得到图像识别模型,即至少需要使用强标签训练图像样本进行训练,这样,由于强标签训练图像样本中标注有病变位置,使得在训练时不仅仅可以利用本身的病变类别标注信息,还可以利用判断为该病变类别的位置信息,根据病变位置,可以更加准确地确定出发生病变所代表的图像特征信息,减少噪声,相比于仅使用弱标签训练图像样本进行训练,可以使得图像识别模型训练更加准确和可靠。
基于上述实施例中图像识别模型训练方法,本发明实施例中还相应提供了一种图像识别方法,具体参阅图7所示,为本发明实施例中图像识别方法流程图,该方法包括:
步骤700:获取待识别图像。
例如,若训练的图像识别模型是针对消化道疾病,则图像识别模型可以用于消化道疾病的病变类别识别,获取的待识别图像即是采集到的消化道图像。
步骤710:提取待识别图像的图像特征信息。
步骤720:基于预设的图像识别模型,以待识别图像的图像特征信息为输入参数,获得待识别图像的病变类别识别结果;其中,图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,强标签信息至少包括病变类别和病变位置的标注信息。
即这里的图像识别模型为基于上述实施例中图像识别模型训练方法获得的模型,本发明实施例中,可以将图像识别模型例如应用到内镜辅助诊断系统中,用于识别病变类别,由于主要是基于强标签训练图像样本训练得到图像识别模型,更加可靠准确,因此,基于训练得到的图像识别模型,进行病变类别预测,也更加准确。
基于上述实施例,下面采用一个具体应用场景进行说明,参阅图8所示,为本发明实施例中图像识别方法原理框图。
本发明实施例中图像识别方法原理和图像识别模型训练方法原理是类似的,同样也可以分为两部分:
第一部分:特征提取部分。
同样地,如图8所示,以采用DSOD为例,待识别图像分别经过卷积、dense block、卷积、池化、dense block等操作,在最后一层输出设定维度的图像特征信息,维度为P*P*C,表示待识别图像的特征图。
进一步地,可以将特征图通过sigmoid函数后,得到监督分离层的输入特征图。
第二部分:监督分离层。
将经过特征提取部分获得的图像特征信息,输入图像识别模型中,图像识别模型对图像特征信息进行判断,判断是属于哪种病变类别,例如预设病变类别有两种,分别为病变类别A和病变类别B,则分别判断是否属于病变类别A和是否属于病变类别B,得到最终的病变类别识别结果。
基于上述实施例,参阅图9所示,为本发明实施例中一种图像识别系统的结构示意图。
该图像识别系统至少包括图像采集设备90、处理设备91和显示设备92。本发明实施例中,图像采集设备90、处理设备91和显示设备92为相关的医疗器械,可以集成在同一医疗器械中,也可以分为多个设备,相互连接通信,组成一个医疗系统来使用等,例如针对消化道疾病诊断,图像采集设备90可以为内镜,处理设备91和显示设备92可以为与内镜相通信的计算机设备等。
具体地,图像采集设备90,用于获取待识别图像。
处理设备91,用于提取待识别图像的图像特征信息,并基于预设的图像识别模型,以待识别图像的图像特征信息为输入参数,获得待识别图像的病变类别识别结果;其中,图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,强标签信息至少包括病变类别和病变位置的标注信息;
显示设备92,用于输出待识别图像的病变类别识别结果。
基于上述实施例,参阅图10所示,本发明实施例中图像识别模型训练装置,具体包括:
获取模块1000,用于获取训练图像样本集,其中,所述训练图像样本集中至少包括强标签训练图像样本;其中,强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
提取模块1010,用于提取所述训练图像样本集中图像样本的图像特征信息;
训练模块1020,用于基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛,获得训练完成的图像识别模型,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
可选的,所述训练图像样本集中还包括弱标签训练图像样本;弱标签训练图像样本表示有弱标签信息的图像样本,所述弱标签信息包括病变类别的标注信息;则训练模块1020进一步用于:根据所述图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的总目标函数收敛,获得训练完成的图像识别模型;其中,所述总目标函数为强监督目标函数和弱监督目标函数的总损失函数,所述弱监督目标函数为识别出的病变类别与弱标签信息中病变类别之间的损失函数。
可选的,提取所述训练图像样本集中图像样本的图像特征信息时,提取模块1010具体用于:
将所述训练图像样本集中图像样本输入到神经网络;获得基于所述神经网络对图像样本进行特征提取后输出的设定维度的图像特征信息。
可选的,所述图像特征信息为P*P*C维度,P为设定值,P*P表示将图像样本横纵向等分的P*P个图像块,C为预设病变类别数目。
可选的,基于所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的强监督目标函数收敛时,训练模块1020具体用于:
根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息;
并根据标记结果,确定强监督目标函数;
优化所述强监督目标函数,直至所述强监督函数收敛时,确定训练完成。
可选的,根据所述图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练图像识别模型,直至所述图像识别模型的总目标函数收敛时,训练模块1020具体用于:
若为强标签训练图像样本,根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数;
若为弱标签训练图像样本,根据所述图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数;
根据所述强监督目标函数和所述弱监督目标函数,确定总目标函数;
优化所述总目标函数,直至所述总目标函数收敛时,确定训练完成。
可选的,根据所述图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数时,训练模块1020具体用于:
分别针对每个强标签训练图像样本,根据强标签训练图像样本对应的强标签信息中病变位置,分别确定强标签训练图像样本的图像特征信息中每个图像块与病变位置的重叠率,若重叠率不小于阈值,则将对应图像块标记为1,否则标记为0,获得强标签训练图像样本是否属于对应的强标签信息中病变类别的标记信息;
并获得强标签训练图像样本是否属于除强标签信息中病变类别的其它预设病变类别的标记信息为0;
分别根据每个强标签训练图像样本是否属于各病变类别的标记信息和图像特征信息,确定强监督目标函数。
可选的,根据所述图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数时,训练模块1020具体用于:
分别针对每个弱标签训练图像样本,根据弱标签训练图像样本对应的弱标签信息中病变类别,分别确定弱标签训练图像样本的图像特征信息中每个图像块属于各预设病变类别的概率;
确定弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值;
分别根据每个弱标签训练图像样本的每个图像块属于各预设病变类别的概率中的最大值,以及对应的弱标签信息中病变类别,确定弱监督目标函数。
基于上述实施例,参阅图11所示,本发明实施例中图像识别装置,具体包括:
获取模块1100,用于获取待识别图像;
提取模块1110,用于提取所述待识别图像的图像特征信息;
识别模块1120,用于基于预设的图像识别模型,以所述待识别图像的图像特征信息为输入参数,获得所述待识别图像的病变类别识别结果;其中,所述图像识别模型为采用至少包括强标签训练图像样本的训练图像样本集进行训练,以确定病变类别识别结果;强标签训练图像样本表示有强标签信息的图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息。
基于上述实施例,本发明实施例中还提供了另一示例性实施方式的电子设备,在一些可能的实施方式中,本发明实施例中电子设备可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行程序时可以实现上述实施例中图像识别模型训练方法或图像识别方法的步骤。
例如,以电子设备为本发明图1中的服务器100为例进行说明,则该电子设备中的处理器即为服务器100中的处理器110,该电子设备中的存储器即为服务器100中的存储器120。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的图像识别模型训练方法或图像识别方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台控制设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (12)
1.一种消化道内镜图像识别系统,其特征在于,至少包括:消化道内镜图像采集设备、消化道内镜图像处理设备和输出设备,具体地:
消化道内镜图像采集设备,用于获取待识别消化道内镜图像;
消化道内镜处理设备,用于提取所述待识别消化道内镜图像的图像特征信息,并基于预设的消化道内镜图像识别模型,以所述待识别消化道内镜图像的图像特征信息为输入参数,获得所述待识别消化道内镜图像的病变类别识别结果;其中,所述消化道内镜图像识别模型为采用至少包括强标签训练消化道内镜图像样本的训练消化道内镜图像样本集进行训练,以确定病变类别识别结果;强标签训练消化道内镜图像样本表示有强标签信息的消化道内镜图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
显示设备,用于输出所述待识别消化道内镜图像的病变类别识别结果。
2.一种消化道内镜图像识别方法,其特征在于,包括:
获取待识别消化道内镜图像;
提取所述待识别消化道内镜图像的图像特征信息;
基于预设的消化道内镜图像识别模型,以所述待识别消化道内镜图像的图像特征信息为输入参数,获得所述待识别消化道内镜图像的病变类别识别结果;其中,所述消化道内镜图像识别模型为采用至少包括强标签训练消化道内镜图像样本的训练消化道内镜图像样本集进行训练,以确定病变类别识别结果;强标签训练消化道内镜图像样本表示有强标签信息的消化道内镜图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息。
3.一种消化道内镜图像识别模型训练方法,其特征在于,包括:
获取训练消化道内镜图像样本集,其中,所述训练消化道内镜图像样本集中至少包括强标签训练消化道内镜图像样本;其中,强标签训练消化道内镜图像样本表示有强标签信息的消化道内镜图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
提取所述训练消化道内镜图像样本集中消化道内镜图像样本的图像特征信息;
基于所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练消化道内镜图像识别模型,直至所述消化道内镜图像识别模型的强监督目标函数收敛,获得训练完成的消化道内镜图像识别模型,其中,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
4.如权利要求3所述的方法,其特征在于,所述训练消化道内镜图像样本集中还包括弱标签训练消化道内镜图像样本;弱标签训练消化道内镜图像样本表示有弱标签信息的消化道内镜图像样本,所述弱标签信息包括病变类别的标注信息;则进一步包括:
根据所述消化道内镜图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练消化道内镜图像识别模型,直至所述消化道内镜图像识别模型的总目标函数收敛,获得训练完成的消化道内镜图像识别模型;其中,所述总目标函数为强监督目标函数和弱监督目标函数的总损失函数,所述弱监督目标函数为识别出的病变类别与弱标签信息中病变类别之间的损失函数。
5.如权利要求4所述的方法,其特征在于,提取所述训练消化道内镜图像样本集中消化道内镜图像样本的图像特征信息,具体包括:
将所述训练消化道内镜图像样本集中消化道内镜图像样本输入到神经网络;
获得基于所述神经网络对消化道内镜图像样本进行特征提取后输出的设定维度的图像特征信息。
6.如权利要求5所述的方法,其特征在于,所述图像特征信息为P*P*C维度,P为设定值,P*P表示将消化道内镜图像样本横纵向等分的P*P个图像块,C为预设病变类别数目。
7.如权利要求6所述的方法,其特征在于,基于所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练消化道内镜图像识别模型,直至所述消化道内镜图像识别模型的强监督目标函数收敛,具体包括:
根据所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息;
并根据标记结果,确定强监督目标函数;
优化所述强监督目标函数,直至所述强监督函数收敛时,确定训练完成。
8.如权利要求6所述的方法,其特征在于,根据所述消化道内镜图像样本的图像特征信息,以及对应的强标签信息或弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练消化道内镜图像识别模型,直至所述消化道内镜图像识别模型的总目标函数收敛,具体包括:
若为强标签训练消化道内镜图像样本,根据所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数;
若为弱标签训练消化道内镜图像样本,根据所述消化道内镜图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数;
根据所述强监督目标函数和所述弱监督目标函数,确定总目标函数;
优化所述总目标函数,直至所述总目标函数收敛时,确定训练完成。
9.如权利要求7或8所述的方法,其特征在于,根据所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定强监督目标函数,具体包括:
分别针对每个强标签训练消化道内镜图像样本,根据强标签训练消化道内镜图像样本对应的强标签信息中病变位置,分别确定强标签训练消化道内镜图像样本的图像特征信息中每个图像块与病变位置的重叠率,若重叠率不小于阈值,则将对应图像块标记为1,否则标记为0,获得强标签训练消化道内镜图像样本是否属于对应的强标签信息中病变类别的标记信息;
并获得强标签训练消化道内镜图像样本是否属于除强标签信息中病变类别的其它预设病变类别的标记信息为0;
分别根据每个强标签训练消化道内镜图像样本是否属于各病变类别的标记信息和图像特征信息,确定强监督目标函数。
10.如权利要求8所述的方法,其特征在于,根据所述消化道内镜图像样本的图像特征信息和对应的弱标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,确定弱监督目标函数,具体包括:
分别针对每个弱标签训练消化道内镜图像样本,根据弱标签训练消化道内镜图像样本对应的弱标签信息中病变类别,分别确定弱标签训练消化道内镜图像样本的图像特征信息中每个图像块属于各预设病变类别的概率;
确定弱标签训练消化道内镜图像样本的每个图像块属于各预设病变类别的概率中的最大值;
分别根据每个弱标签训练消化道内镜图像样本的每个图像块属于各预设病变类别的概率中的最大值,以及对应的弱标签信息中病变类别,确定弱监督目标函数。
11.一种消化道内镜图像识别模型训练装置,其特征在于,包括:
获取模块,用于获取训练消化道内镜图像样本集,其中,所述训练消化道内镜图像样本集中至少包括强标签训练消化道内镜图像样本;其中,强标签训练消化道内镜图像样本表示有强标签信息的消化道内镜图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息;
提取模块,用于提取所述训练消化道内镜图像样本集中消化道内镜图像样本的图像特征信息;
训练模块,用于基于所述消化道内镜图像样本的图像特征信息和对应的强标签信息,标记属于各预设病变类别的图像特征信息,并根据标记结果,训练消化道内镜图像识别模型,直至所述消化道内镜图像识别模型的强监督目标函数收敛,获得训练完成的消化道内镜图像识别模型,所述强监督目标函数为识别出的病变类别与强标签信息中病变类别之间的损失函数。
12.一种消化道内镜图像识别装置,其特征在于,包括:
获取模块,用于获取待识别消化道内镜图像;
提取模块,用于提取所述待识别消化道内镜图像的图像特征信息;
识别模块,用于基于预设的消化道内镜图像识别模型,以所述待识别消化道内镜图像的图像特征信息为输入参数,获得所述待识别消化道内镜图像的病变类别识别结果;其中,所述消化道内镜图像识别模型为采用至少包括强标签训练消化道内镜图像样本的训练消化道内镜图像样本集进行训练,以确定病变类别识别结果;强标签训练消化道内镜图像样本表示有强标签信息的消化道内镜图像样本,所述强标签信息至少包括病变类别和病变位置的标注信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910739785.7A CN110473192B (zh) | 2019-04-10 | 2019-04-10 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910284918.6A CN110009623B (zh) | 2019-04-10 | 2019-04-10 | 一种图像识别模型训练及图像识别方法、装置及系统 |
CN201910739785.7A CN110473192B (zh) | 2019-04-10 | 2019-04-10 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910284918.6A Division CN110009623B (zh) | 2019-04-10 | 2019-04-10 | 一种图像识别模型训练及图像识别方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110473192A true CN110473192A (zh) | 2019-11-19 |
CN110473192B CN110473192B (zh) | 2021-05-14 |
Family
ID=67170805
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910739785.7A Active CN110473192B (zh) | 2019-04-10 | 2019-04-10 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
CN201910284918.6A Active CN110009623B (zh) | 2019-04-10 | 2019-04-10 | 一种图像识别模型训练及图像识别方法、装置及系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910284918.6A Active CN110009623B (zh) | 2019-04-10 | 2019-04-10 | 一种图像识别模型训练及图像识别方法、装置及系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11967414B2 (zh) |
CN (2) | CN110473192B (zh) |
WO (1) | WO2020207377A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091562A (zh) * | 2019-12-23 | 2020-05-01 | 山东大学齐鲁医院 | 一种消化道病灶大小测量方法及系统 |
CN111358431A (zh) * | 2020-03-06 | 2020-07-03 | 重庆金山医疗技术研究院有限公司 | 一种食道压力云图的标识识别方法及设备 |
CN111414946A (zh) * | 2020-03-12 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111739007A (zh) * | 2020-06-22 | 2020-10-02 | 中南民族大学 | 内窥镜图像识别方法、设备、存储介质及装置 |
CN112419251A (zh) * | 2020-11-13 | 2021-02-26 | 浙江核睿医疗科技有限公司 | 上消化道内镜图像生成方法、装置、电子设备和存储介质 |
CN112712515A (zh) * | 2021-01-06 | 2021-04-27 | 重庆金山医疗器械有限公司 | 一种内镜图像处理方法、装置、电子设备及存储介质 |
CN112735554A (zh) * | 2021-01-06 | 2021-04-30 | 重庆金山医疗器械有限公司 | 一种内镜报告生成装置、方法、电子设备及可读存储介质 |
CN113534849A (zh) * | 2021-09-16 | 2021-10-22 | 中国商用飞机有限责任公司 | 集成机器视觉的飞行组合导引系统、方法和介质 |
CN114445406A (zh) * | 2022-04-07 | 2022-05-06 | 武汉大学 | 肠镜图像分析方法、装置和医学图像处理设备 |
CN114565611A (zh) * | 2022-04-28 | 2022-05-31 | 武汉大学 | 医学信息获取方法及相关设备 |
CN116596927A (zh) * | 2023-07-17 | 2023-08-15 | 浙江核睿医疗科技有限公司 | 一种内镜视频处理方法、系统及装置 |
CN116740475A (zh) * | 2023-08-15 | 2023-09-12 | 苏州凌影云诺医疗科技有限公司 | 一种基于状态分类的消化道图像识别方法和系统 |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110473192B (zh) * | 2019-04-10 | 2021-05-14 | 腾讯医疗健康(深圳)有限公司 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
CN110533086B (zh) * | 2019-08-13 | 2021-01-26 | 天津大学 | 图像数据半自动标注方法 |
CN110660055B (zh) * | 2019-09-25 | 2022-11-29 | 北京青燕祥云科技有限公司 | 疾病数据预测方法、装置、可读存储介质及电子设备 |
CN110738263B (zh) * | 2019-10-17 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种图像识别模型训练的方法、图像识别的方法及装置 |
CN111161848B (zh) * | 2019-10-31 | 2023-08-29 | 杭州深睿博联科技有限公司 | Ct图像的病灶标注方法及装置、存储介质 |
CN110909780B (zh) * | 2019-11-14 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 一种图像识别模型训练和图像识别方法、装置及系统 |
CN110909803B (zh) * | 2019-11-26 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 图像识别模型训练方法、装置和计算机可读存储介质 |
CN112926612A (zh) * | 2019-12-06 | 2021-06-08 | 中移(成都)信息通信科技有限公司 | 病理图像分类模型训练方法、病理图像分类方法及装置 |
WO2021133954A1 (en) * | 2019-12-23 | 2021-07-01 | DeepHealth, Inc. | Systems and methods for analyzing two-dimensional and three-dimensional image data |
CN111126509B (zh) * | 2019-12-31 | 2024-03-15 | 深圳开立生物医疗科技股份有限公司 | 一种图像处理系统模型构建方法和装置 |
CN111275080B (zh) * | 2020-01-14 | 2021-01-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像分类模型训练方法、分类方法及装置 |
CN111539443B (zh) * | 2020-01-22 | 2024-02-09 | 北京小米松果电子有限公司 | 一种图像识别模型训练方法及装置、存储介质 |
CN111353392B (zh) * | 2020-02-18 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 换脸检测方法、装置、设备及存储介质 |
CN111353542B (zh) * | 2020-03-03 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法、装置、计算机设备和存储介质 |
CN111428072A (zh) * | 2020-03-31 | 2020-07-17 | 南方科技大学 | 眼科多模态影像的检索方法、装置、服务器及存储介质 |
CN111626102B (zh) * | 2020-04-13 | 2022-04-26 | 上海交通大学 | 基于视频弱标记的双模态迭代去噪异常检测方法及终端 |
TWI734449B (zh) * | 2020-04-21 | 2021-07-21 | 財團法人工業技術研究院 | 用於影像辨識的特徵標註方法及其裝置 |
US11599742B2 (en) * | 2020-04-22 | 2023-03-07 | Dell Products L.P. | Dynamic image recognition and training using data center resources and data |
CN111524124A (zh) * | 2020-04-27 | 2020-08-11 | 中国人民解放军陆军特色医学中心 | 炎症性肠病消化内镜影像人工智能辅助系统 |
CN111738197B (zh) * | 2020-06-30 | 2023-09-05 | 中国联合网络通信集团有限公司 | 一种训练图像信息处理的方法和装置 |
CN111783889B (zh) * | 2020-07-03 | 2022-03-01 | 北京字节跳动网络技术有限公司 | 图像识别方法、装置、电子设备和计算机可读介质 |
CN113516614A (zh) * | 2020-07-06 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 脊柱影像的处理方法、模型训练方法、装置及存储介质 |
CN111932547B (zh) * | 2020-09-24 | 2021-06-11 | 平安科技(深圳)有限公司 | 图像中目标物的分割方法、装置、电子设备及存储介质 |
CN112434178A (zh) * | 2020-11-23 | 2021-03-02 | 北京达佳互联信息技术有限公司 | 图像分类方法、装置、电子设备和存储介质 |
CN112633276A (zh) * | 2020-12-25 | 2021-04-09 | 北京百度网讯科技有限公司 | 训练方法、识别方法、装置、设备、介质 |
CN113034114A (zh) * | 2021-04-01 | 2021-06-25 | 苏州惟信易量智能科技有限公司 | 一种基于可穿戴设备的流程控制系统及方法 |
CN113034113A (zh) * | 2021-04-01 | 2021-06-25 | 苏州惟信易量智能科技有限公司 | 一种基于可穿戴设备的流程控制系统及方法 |
CN112990362B (zh) * | 2021-04-20 | 2021-08-20 | 长沙树根互联技术有限公司 | 矿车驾驶等级识别模型训练方法、装置和终端设备 |
CN113159193A (zh) * | 2021-04-26 | 2021-07-23 | 京东数科海益信息科技有限公司 | 模型训练方法、图像识别方法、存储介质及程序产品 |
CN113792807B (zh) * | 2021-09-16 | 2023-06-27 | 平安科技(深圳)有限公司 | 皮肤病分类模型训练方法、系统、介质和电子设备 |
CN113962951B (zh) * | 2021-10-15 | 2022-05-17 | 杭州研极微电子有限公司 | 检测分割模型的训练方法及装置、目标检测方法及装置 |
CN113947701B (zh) * | 2021-10-18 | 2024-02-23 | 北京百度网讯科技有限公司 | 训练方法、对象识别方法、装置、电子设备以及存储介质 |
CN113688248B (zh) | 2021-10-26 | 2022-02-22 | 之江实验室 | 一种小样本弱标注条件下的医疗事件识别方法及系统 |
CN114972725B (zh) * | 2021-12-30 | 2023-05-23 | 华为技术有限公司 | 模型训练方法、可读介质和电子设备 |
CN114310954B (zh) * | 2021-12-31 | 2024-04-16 | 北京理工大学 | 一种护理机器人自适应升降控制方法和系统 |
CN114841970B (zh) * | 2022-05-09 | 2023-07-18 | 抖音视界有限公司 | 检查图像的识别方法、装置、可读介质和电子设备 |
CN115578394B (zh) * | 2022-12-09 | 2023-04-07 | 湖南省中医药研究院 | 一种基于非对称网络的肺炎图像处理方法 |
CN116051486A (zh) * | 2022-12-29 | 2023-05-02 | 抖音视界有限公司 | 内窥镜图像识别模型的训练方法、图像识别方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157294A (zh) * | 2016-04-28 | 2016-11-23 | 中国人民解放军第七五医院 | 一种用于消化道肿瘤内镜图像识别的方法及应用 |
CN108230322A (zh) * | 2018-01-28 | 2018-06-29 | 浙江大学 | 一种基于弱样本标记的眼底特征检测装置 |
US20180218503A1 (en) * | 2016-08-26 | 2018-08-02 | Elekta, Inc. | System and methods for image segmentation using convolutional neural network |
CN108734195A (zh) * | 2018-04-13 | 2018-11-02 | 王延峰 | 基于协同学习的弱监督检测模型训练方法及系统 |
CN109034208A (zh) * | 2018-07-03 | 2018-12-18 | 怀光智能科技(武汉)有限公司 | 一种高低分辨率组合的宫颈细胞病理切片分类方法 |
CN109359569A (zh) * | 2018-09-30 | 2019-02-19 | 桂林优利特医疗电子有限公司 | 一种基于cnn的红细胞图像亚分类方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100472556C (zh) * | 2005-10-09 | 2009-03-25 | 欧姆龙株式会社 | 特定被摄体检测装置及方法 |
US8150113B2 (en) * | 2008-01-23 | 2012-04-03 | Carestream Health, Inc. | Method for lung lesion location identification |
US8970578B2 (en) * | 2008-12-19 | 2015-03-03 | Szilard Voros | System and method for lesion-specific coronary artery calcium quantification |
US9117259B2 (en) * | 2010-09-22 | 2015-08-25 | Siemens Aktiengesellschaft | Method and system for liver lesion detection |
KR20120072961A (ko) * | 2010-12-24 | 2012-07-04 | 삼성전자주식회사 | 의료 영상을 이용한 영상진단을 보조하는 방법 및 장치, 이를 수행하는 영상진단 시스템 |
US20140233826A1 (en) * | 2011-09-27 | 2014-08-21 | Board Of Regents Of The University Of Texas System | Systems and methods for automated screening and prognosis of cancer from whole-slide biopsy images |
US9324140B2 (en) * | 2013-08-29 | 2016-04-26 | General Electric Company | Methods and systems for evaluating bone lesions |
JP6559707B2 (ja) * | 2014-05-12 | 2019-08-14 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 症例の難しさに基づくコンピュータ支援患者層別化のためのシステムの作動方法及びシステム |
WO2016097860A1 (en) * | 2014-12-19 | 2016-06-23 | Uti Limited Partnership | Metabolomics for diagnosing pancreatic cancer |
US11094058B2 (en) * | 2015-08-14 | 2021-08-17 | Elucid Bioimaging Inc. | Systems and method for computer-aided phenotyping (CAP) using radiologic images |
US9760807B2 (en) * | 2016-01-08 | 2017-09-12 | Siemens Healthcare Gmbh | Deep image-to-image network learning for medical image analysis |
US10499882B2 (en) * | 2016-07-01 | 2019-12-10 | yoR Labs, Inc. | Methods and systems for ultrasound imaging |
KR101879207B1 (ko) * | 2016-11-22 | 2018-07-17 | 주식회사 루닛 | 약한 지도 학습 방식의 객체 인식 방법 및 장치 |
CN106845374B (zh) * | 2017-01-06 | 2020-03-27 | 清华大学 | 基于深度学习的行人检测方法及检测装置 |
US10575774B2 (en) * | 2017-02-27 | 2020-03-03 | Case Western Reserve University | Predicting immunotherapy response in non-small cell lung cancer with serial radiomics |
EP3629898A4 (en) * | 2017-05-30 | 2021-01-20 | Arterys Inc. | AUTOMATED LESION DETECTION, SEGMENTATION AND LONGITUDINAL IDENTIFICATION |
EP3432263B1 (en) * | 2017-07-17 | 2020-09-16 | Siemens Healthcare GmbH | Semantic segmentation for cancer detection in digital breast tomosynthesis |
CN107368859A (zh) * | 2017-07-18 | 2017-11-21 | 北京华信佳音医疗科技发展有限责任公司 | 病变识别模型的训练方法、验证方法和病变图像识别装置 |
US10650286B2 (en) * | 2017-09-07 | 2020-05-12 | International Business Machines Corporation | Classifying medical images using deep convolution neural network (CNN) architecture |
US10496884B1 (en) * | 2017-09-19 | 2019-12-03 | Deepradiology Inc. | Transformation of textbook information |
CN107680684B (zh) * | 2017-10-12 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | 用于获取信息的方法及装置 |
EP3714467A4 (en) * | 2017-11-22 | 2021-09-15 | Arterys Inc. | CONTENT-BASED IMAGE RECOVERY FOR LESION ANALYSIS |
US11132792B2 (en) * | 2018-02-22 | 2021-09-28 | Siemens Healthcare Gmbh | Cross domain medical image segmentation |
US10878569B2 (en) * | 2018-03-28 | 2020-12-29 | International Business Machines Corporation | Systems and methods for automatic detection of an indication of abnormality in an anatomical image |
CN108961274B (zh) * | 2018-07-05 | 2021-03-02 | 四川大学 | 一种mri图像中自动头颈肿瘤分割方法 |
US20200051257A1 (en) * | 2018-08-08 | 2020-02-13 | Siemens Medical Solutions Usa, Inc. | Scan alignment based on patient-based surface in medical diagnostic ultrasound imaging |
CN108985268B (zh) * | 2018-08-16 | 2021-10-29 | 厦门大学 | 基于深度迁移学习的归纳式雷达高分辨距离像识别方法 |
CN109214386B (zh) * | 2018-09-14 | 2020-11-24 | 京东数字科技控股有限公司 | 用于生成图像识别模型的方法和装置 |
CN109359684B (zh) * | 2018-10-17 | 2021-10-29 | 苏州大学 | 基于弱监督定位和子类别相似性度量的细粒度车型识别方法 |
CN109447149B (zh) * | 2018-10-25 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
CN109584218A (zh) * | 2018-11-15 | 2019-04-05 | 首都医科大学附属北京友谊医院 | 一种胃癌图像识别模型的构建方法及其应用 |
US10430946B1 (en) * | 2019-03-14 | 2019-10-01 | Inception Institute of Artificial Intelligence, Ltd. | Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques |
CN110473192B (zh) * | 2019-04-10 | 2021-05-14 | 腾讯医疗健康(深圳)有限公司 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
CN110013264A (zh) * | 2019-04-29 | 2019-07-16 | 北京青燕祥云科技有限公司 | X光图像识别方法、装置、电子设备及存储介质 |
-
2019
- 2019-04-10 CN CN201910739785.7A patent/CN110473192B/zh active Active
- 2019-04-10 CN CN201910284918.6A patent/CN110009623B/zh active Active
-
2020
- 2020-04-07 WO PCT/CN2020/083489 patent/WO2020207377A1/zh active Application Filing
-
2021
- 2021-05-14 US US17/321,219 patent/US11967414B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157294A (zh) * | 2016-04-28 | 2016-11-23 | 中国人民解放军第七五医院 | 一种用于消化道肿瘤内镜图像识别的方法及应用 |
US20180218503A1 (en) * | 2016-08-26 | 2018-08-02 | Elekta, Inc. | System and methods for image segmentation using convolutional neural network |
CN108230322A (zh) * | 2018-01-28 | 2018-06-29 | 浙江大学 | 一种基于弱样本标记的眼底特征检测装置 |
CN108734195A (zh) * | 2018-04-13 | 2018-11-02 | 王延峰 | 基于协同学习的弱监督检测模型训练方法及系统 |
CN109034208A (zh) * | 2018-07-03 | 2018-12-18 | 怀光智能科技(武汉)有限公司 | 一种高低分辨率组合的宫颈细胞病理切片分类方法 |
CN109359569A (zh) * | 2018-09-30 | 2019-02-19 | 桂林优利特医疗电子有限公司 | 一种基于cnn的红细胞图像亚分类方法 |
Non-Patent Citations (2)
Title |
---|
JIAJIE WANG等: "Collaborative Learning forWeakly Supervised Object Detection", 《ARXIV》 * |
高灿等: "不完备弱标记数据的粗糙协同学习模型", 《模式识别与人工智能》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091562B (zh) * | 2019-12-23 | 2020-12-01 | 山东大学齐鲁医院 | 一种消化道病灶大小测量方法及系统 |
CN111091562A (zh) * | 2019-12-23 | 2020-05-01 | 山东大学齐鲁医院 | 一种消化道病灶大小测量方法及系统 |
CN111358431A (zh) * | 2020-03-06 | 2020-07-03 | 重庆金山医疗技术研究院有限公司 | 一种食道压力云图的标识识别方法及设备 |
CN111414946B (zh) * | 2020-03-12 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111414946A (zh) * | 2020-03-12 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111739007A (zh) * | 2020-06-22 | 2020-10-02 | 中南民族大学 | 内窥镜图像识别方法、设备、存储介质及装置 |
CN111739007B (zh) * | 2020-06-22 | 2024-01-26 | 中南民族大学 | 内窥镜图像识别方法、设备、存储介质及装置 |
CN112419251A (zh) * | 2020-11-13 | 2021-02-26 | 浙江核睿医疗科技有限公司 | 上消化道内镜图像生成方法、装置、电子设备和存储介质 |
CN112712515A (zh) * | 2021-01-06 | 2021-04-27 | 重庆金山医疗器械有限公司 | 一种内镜图像处理方法、装置、电子设备及存储介质 |
CN112735554A (zh) * | 2021-01-06 | 2021-04-30 | 重庆金山医疗器械有限公司 | 一种内镜报告生成装置、方法、电子设备及可读存储介质 |
CN113534849A (zh) * | 2021-09-16 | 2021-10-22 | 中国商用飞机有限责任公司 | 集成机器视觉的飞行组合导引系统、方法和介质 |
CN114445406B (zh) * | 2022-04-07 | 2022-08-09 | 武汉大学 | 肠镜图像分析方法、装置和医学图像处理设备 |
CN114445406A (zh) * | 2022-04-07 | 2022-05-06 | 武汉大学 | 肠镜图像分析方法、装置和医学图像处理设备 |
CN114565611B (zh) * | 2022-04-28 | 2022-07-19 | 武汉大学 | 医学信息获取方法及相关设备 |
CN114565611A (zh) * | 2022-04-28 | 2022-05-31 | 武汉大学 | 医学信息获取方法及相关设备 |
CN116596927A (zh) * | 2023-07-17 | 2023-08-15 | 浙江核睿医疗科技有限公司 | 一种内镜视频处理方法、系统及装置 |
CN116596927B (zh) * | 2023-07-17 | 2023-09-26 | 浙江核睿医疗科技有限公司 | 一种内镜视频处理方法、系统及装置 |
CN116740475A (zh) * | 2023-08-15 | 2023-09-12 | 苏州凌影云诺医疗科技有限公司 | 一种基于状态分类的消化道图像识别方法和系统 |
CN116740475B (zh) * | 2023-08-15 | 2023-10-17 | 苏州凌影云诺医疗科技有限公司 | 一种基于状态分类的消化道图像识别方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110009623B (zh) | 2021-05-11 |
US20210272681A1 (en) | 2021-09-02 |
CN110009623A (zh) | 2019-07-12 |
US11967414B2 (en) | 2024-04-23 |
WO2020207377A1 (zh) | 2020-10-15 |
CN110473192B (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473192A (zh) | 消化道内镜图像识别模型训练及识别方法、装置及系统 | |
CN108806792B (zh) | 深度学习面诊系统 | |
CN112446862B (zh) | 一种基于人工智能的动态乳腺超声视频全病灶实时检测和分割装置、系统及图像处理方法 | |
CN109770932A (zh) | 多模态脑部神经影像特征的处理方法 | |
CN110390674A (zh) | 图像处理方法、装置、存储介质、设备以及系统 | |
CN110135282A (zh) | 一种基于深度卷积神经网络模型的考生回头抄袭作弊检测方法 | |
CN112966792B (zh) | 血管图像分类处理方法、装置、设备及存储介质 | |
Li et al. | PSENet: Psoriasis severity evaluation network | |
CN109741316A (zh) | 医学影像智能评片系统 | |
CN109919212A (zh) | 消化道内镜影像中肿瘤的多尺度检测方法及装置 | |
Zhao et al. | An intelligent augmented reality training framework for neonatal endotracheal intubation | |
Loureiro et al. | Using a skeleton gait energy image for pathological gait classification | |
Zhang et al. | 3D reconstruction for super-resolution CT images in the Internet of health things using deep learning | |
CN109063643A (zh) | 一种用于脸部信息部分隐藏条件下的面部表情痛苦度识别方法 | |
CN114049683A (zh) | 基于三维人体骨架模型的愈后康复辅助检测系统、方法、介质 | |
CN117237351B (zh) | 一种超声图像分析方法以及相关装置 | |
Wang et al. | Explainable multitask Shapley explanation networks for real-time polyp diagnosis in videos | |
CN110473176A (zh) | 图像处理方法及装置、眼底图像处理方法、电子设备 | |
CN110517771A (zh) | 一种医学图像处理方法、医学图像识别方法及装置 | |
CN116645346A (zh) | 肩袖扫描图像的处理方法、电子设备及存储介质 | |
Dang et al. | Kashin-Beck disease diagnosis based on deep learning from hand X-ray images | |
Pradheep et al. | Fruit Disease Classification using Convolutional Neural Network | |
CN109480842A (zh) | 用于诊断功能性消化不良的方法、系统、装置及存储介质 | |
CN114240936B (zh) | 耳朵分析检测装置及设备 | |
Shanthakumari et al. | Glaucoma Detection using Fundus Images using Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |