CN113159238A - 内窥镜影像识别方法、电子设备及存储介质 - Google Patents
内窥镜影像识别方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113159238A CN113159238A CN202110695472.3A CN202110695472A CN113159238A CN 113159238 A CN113159238 A CN 113159238A CN 202110695472 A CN202110695472 A CN 202110695472A CN 113159238 A CN113159238 A CN 113159238A
- Authority
- CN
- China
- Prior art keywords
- disease
- neural network
- network model
- test sample
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 201000010099 disease Diseases 0.000 claims abstract description 111
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 111
- 238000003062 neural network model Methods 0.000 claims abstract description 53
- 238000012360 testing method Methods 0.000 claims abstract description 43
- 238000003745 diagnosis Methods 0.000 claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 41
- 239000002775 capsule Substances 0.000 claims description 31
- 230000002457 bidirectional effect Effects 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 230000000306 recurrent effect Effects 0.000 claims description 10
- 238000013135 deep learning Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 239000000835 fiber Substances 0.000 claims 1
- 238000011946 reduction process Methods 0.000 claims 1
- 241000894007 species Species 0.000 description 16
- 230000003902 lesion Effects 0.000 description 8
- 210000001035 gastrointestinal tract Anatomy 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003628 erosive effect Effects 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 208000037062 Polyps Diseases 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000740 bleeding effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 241000167880 Hirundinidae Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010013554 Diverticulum Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 206010043189 Telangiectasia Diseases 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 208000009443 Vascular Malformations Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000034158 bleeding Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 239000002861 polymer material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 208000009056 telangiectasis Diseases 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 231100000397 ulcer Toxicity 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B1/00—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
- A61B1/00002—Operational features of endoscopes
- A61B1/00004—Operational features of endoscopes characterised by electronic signal processing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B1/00—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
- A61B1/00002—Operational features of endoscopes
- A61B1/00004—Operational features of endoscopes characterised by electronic signal processing
- A61B1/00009—Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
- A61B1/000094—Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope extracting biological structures
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B1/00—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
- A61B1/00002—Operational features of endoscopes
- A61B1/00004—Operational features of endoscopes characterised by electronic signal processing
- A61B1/00009—Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
- A61B1/000096—Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope using artificial intelligence
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B1/00—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
- A61B1/00163—Optical arrangements
- A61B1/00165—Optical arrangements with light-conductive means, e.g. fibre optics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B1/00—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
- A61B1/04—Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
- A61B1/041—Capsule endoscopes for imaging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/63—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/032—Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Optics & Photonics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Animal Behavior & Ethology (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
Abstract
本发明提供了一种内窥镜影像识别方法、电子设备及存储介质。所述内窥镜影像识别方法包括:采用第一神经网络模型,对多张原始图像分别进行多个病种类别的病种预测;基于所述多张原始图像的病种预测结果,建立所述多个病种类别的测试样本集,每个测试样本集包括预定数量原始图像的图像特征;采用第二神经网络模型,对所述多个病种类别的测试样本集分别进行病种识别;以及对所述多个病种的病种识别结果进行叠加以获得病例诊断结果,其中,所述第二神经网络模型对所述测试样本集中的多个图像特征进行加权组合以获得所述病种识别结果。该内窥镜影像识别方法对测试样本集的多个图像特征进行加权组合以提高病种识别准确度。
Description
技术领域
本发明涉及医疗设备成像领域,更具体地,涉及基于深度学习的内窥镜影像识别方法、电子设备及存储介质。
背景技术
胶囊内窥镜是检查患者消化道疾病的有效诊疗工具,其中集成有摄像头、LED灯、无线通信模块等器件。在检查时,患者吞下胶囊内窥镜,胶囊内窥镜在消化道中行进的同时拍摄图像,以及将图像传送至患者体外。对胶囊内窥镜采集的图像进行分析以识别消化道中的病灶。与传统的内窥镜检查相比,胶囊内窥镜的优点是对患者造成的痛苦程度小,并且可以对整个消化道进行检查,作为革命性的技术突破已经获得了越来越广泛的应用。
胶囊内窥镜在检查过程中采集大量的图像(例如,几万张图像),对图像的阅片工作变得艰巨且耗时。随着技术的发展,利用图像处理和计算机视觉技术进行病灶识别获得了广泛的关注。然而,在现有的内窥镜影像识别方法中,经由卷积神经网络对胶囊内窥镜采集的每张图像进行病灶识别并获得诊断结果。即使内窥镜影像识别方法的正确率高达90%,对于患者消化道采集的大量图像而言,任意一张图像的病灶识别结果错误均会产生错误的病例诊断结果。
因此,仍然期待进一步改进内窥镜影像识别方法,以提高基于大量图像的病例诊断的准确度。
发明内容
为解决上述技术问题,本发明的目的在于提供一种内窥镜影像识别方法、电子设备及存储介质,其中,在对多张原始图像按照单张图像进病种预测之后,基于病种预测结果对测试样本集的多个图像特征进行病种识别准确度。
根据本发明的第一方面,提供一种内窥镜影像识别方法,包括:采用第一神经网络模型,对多张原始图像分别进行多个病种类别的病种预测;基于所述多张原始图像的病种预测结果,建立所述多个病种类别的测试样本集,每个测试样本集包括预定数量原始图像的图像特征;采用第二神经网络模型,对所述多个病种类别的测试样本集分别进行病种识别;以及对所述多个病种的病种识别结果进行叠加以获得病例诊断结果;其中,所述第二神经网络模型对所述测试样本集中的多个图像特征进行加权组合以获得所述病种识别结果。
优选地,所述第一神经网络模型为卷积神经网络模型,所述卷积神经网络模型输入所述多张原始图像的单张图像,输出所述多个病种类别的图像特征和分类概率。
优选地,所述第二神经网络模型为循环神经网络模型,所述循环神经网络模型输入所述测试样本集中的多个图像特征,输出与所述测试样本集相对应的病种识别结果。
优选地,所述第二神经网络模型包括:第一全连接层,将所述测试样本集中的多个图像特征分别进行降维处理;双向长短期记忆层,对经过降维处理的多个图像特征分别按照前向和后向预测隐藏状态;以及注意力机制,将所述多个图像特征的隐藏状态加权组合成最终特征,其中,所述第二神经网络模型基于所述最终特征获得病种识别结果。
优选地,所述第一全连接层包括多个全连接单元,所述多个全连接单元分别对相应一个图像特征进行降维处理。
优选地,所述双向长短期记忆层包括多个前向长短期记忆单元和多个后向长短期记忆单元,所述多个前向长短期记忆单元分别对相应一个图像特征进行前向预测,所述多个后向长短期记忆单元分别对相应一个图像特征进行后向预测。
优选地,所述加权组合包括对所述多个图像特征的隐藏状态加权求和,所述多个图像特征的权重系数表示对相应病种类别的病种识别影响。
优选地,所述多个图像特征的权重系数如下式所示:
优选地,建立所述多个病种类别的测试样本集的步骤包括:对于所述多个病种类别中的不同病种类别,分别从所述多张原始图像中选择所述分类概率最高的预定数量原始图像的图像特征形成测试样本集。
优选地,所述预定数量是2~128的范围内的任意整数。
优选地,所述多张图像采用以下任意一种内窥镜采集获得:光纤内窥镜、主动式胶囊内窥镜、被动式胶囊内窥镜。
根据本发明的第二方面,提供一种电子设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求任意一项所述基于深度学习的内窥镜影像识别方法中的步骤。
根据本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述权利要求任意一项所述基于深度学习的内窥镜影像识别方法中的步骤。
根据本发明实施例的内窥镜影像识别方法、电子设备及存储介质,采用第一神经网络模型进行病种预测,以及采用第二神经网络模型进行病种识别,在第二神经网络中,对测试样本集中的多个图像特征进行加权组合以获得病种识别结果,因而可以提高病种识别准确度。进一步地,基于多个病种类别相对应的多个测试样本集,获得多个病种识别结果,对多个病种类别的识别结果进行叠加以获得病例诊断结果。
在优选的实施例中,第二神经网络模型包括双向长短期记忆层,用于对于多个图像特征分别按照前向和后向预测隐藏状态,组合前后时刻的图像特征一起进行病种识别,因而可以进一步提高病种识别准确度。
在优选的实施例中,每个测试样本集包括预定数量原始图像的图像特征,例如2-128个原始图像,因而可以兼顾病种识别准确度和病种类别的计算时间。
附图说明
图1示出胶囊内窥镜系统的结构示意图。
图2示出胶囊内窥镜的一种实例的示意性截面图。
图3和图4分别示出根据本发明实施例的内窥镜影像识别方法的流程图和示意性框图。
图5示出根据本发明实施例的内窥镜影像识别方法中的第一神经网络模型的示意性框图。
图6示出根据本发明实施例的内窥镜影像识别方法中的第二神经网络模型的示意性框图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
图1示出胶囊内窥镜系统的结构示意图。胶囊内窥镜系统例如包括主机104、磁球105、三轴位移底座106、磁球支架107、以及无线接收装置108。
磁球支架107包括连接三轴位移底座106的第一端和连接磁球105的第二端。三轴位移底座106例如可以沿彼此垂直的三个坐标轴平移。磁球支架107随着三轴位移底座106一起平移,并且允许磁球105相对于磁球支架107在水平面和垂直面内旋转。例如,采用电机和丝杠驱动三轴位移底座106的平移,采用电机和皮带驱动磁球105的旋转。因而,磁球105可以在五个自由度上姿态变化。磁球105例如由永磁体组成,包括彼此相对的N极和S极。在磁球105的姿态变化时产生位置和方位相应变化的外磁场。
在检查过程中,患者101吞下胶囊内窥镜10,例如平躺在床102上。胶囊内窥镜10沿着消化道行进。如下文所述,胶囊内窥镜10的内部包括永磁体。主机104向三轴位移底座106和磁球支架107发送操作指令,从而控制磁球105的姿态变化。磁球105产生的外磁场作用于永磁体上,因而可以控制胶囊内窥镜10在患者消化道中的位置和方位。胶囊内窥镜10在消化道中行进的同时拍摄图像,以及将图像传送至患者体外的无线接收装置108。主机104与无线接收装置108相连接,用于获取胶囊内窥镜10采集的图像,以便于对图像进行分析而识别消化道中的病灶。
图2示出胶囊内窥镜的一种实例的示意性截面图。胶囊内窥镜10包括壳体11、以及位于壳体11内的电路组件。
壳体11例如由塑料等高分子材料组成,并且包括透明的端部,用于提供照明光路和拍摄光路。电路组件包括沿着壳体11的主轴依次排列的影像传感器12、第一电路板21、永磁体15、电池16、第二电路板22、以及无线发射器17。影像传感器12与壳体11的透明端部相对,例如安装在第一电路板21的中间位置上。第一电路板21上还安装有围绕影像传感器12的多个LED 13。第二电路板22上安装无线发射器17。第一电路板21和第二电路板22之间经由柔性电路板23连接,并且二者之间夹持永磁体15和电池16。采用柔性电路板23或附加的电路板提供电池16的正极和负极接触。
进一步地,电路组件还可以包括固定连接在第二电路板22上的限位块18,用于卡合柔性电路板23或者卡合壳体11。
在胶囊内窥镜10的拍摄状态下,多个LED 13点亮,经由壳体端部提供照射光,影像传感器12经由壳体端部获取患者消化道的影像。该影像数据经由柔性电路板23传送至无线发射器17发送至患者体外的无线接收装置108,使得主机104可以获取图像进行病灶分析。
图3和4分别示出根据本发明实施例的内窥镜影像识别方法的流程图和示意性框图。
在图1所示的胶囊内窥镜系统中,利用磁球控制胶囊内窥镜的位置和方位,胶囊内窥镜采集患者消化道不同位置和方位的大量原始图像,主机进一步执行图3所示的内窥镜影像识别方法以获得病例诊断结果。上述胶囊内窥镜系统包括主动式胶囊内窥镜用于采集消化道影像,仅为获取原始图像的一种方式,在其他实施例中,原始图像可以是通过光纤内窥镜获取的消化道影像,还可以是通过被动式胶囊内窥镜采集的消化道影像等。
在步骤S01中,采用第一神经网络模型,对原始图像的单张图像进行病种预测,以获得原始图像的病种类别的图像特征和分类概率,其中该分类概率指的是该单张图像被识别为不同病种对应的概率。在该实施例中,第一神经网络模型例如是卷积神经网络(缩写为CNN)模型。
参见图5,第一神经网络模型例如包括多个卷积层、至少一个池化层、至少一个全连接层和至少一个归一化指数层(例如,softmax层)。在卷积神经网络模型中,采用卷积运算可以提取图像的不同特征。多个卷积层可以依次提取低级图像特征和高级图像特征。池化层对图像特征(即低级图像特征和高级图像特征)进行下采样,从而压缩图像特征的数据和参数,同时保持图像特征的不变性。全连接层的每一个节点与上一层的所有节点相连,用来把上一层提取到的最终特征(即经过下采样的图像特征)综合起来进行分类。归一化指数层用于将上一层(例如,全连接层)的输出映射到(0,1)区间内的概率值,从而获得相应病种的分类概率。可以理解,第一神经网络模型可以经过标注的训练样本集训练得到。将检查过程中采集的原始图像的单张图像作为第一神经网络模型的输入,从池化层提取图像特征,从归一化指数层计算出分类概率。
本发明的内窥镜影像识别方法不限于特定的卷积神经网络(CNN)模型,可以采用Resnet、Densenet、MobileNet等常用的网络模型。例如,本申请人在中国专利申请202110010379.4中公开了可以应用于该步骤的卷积神经网络模型。如上所述,在患者的检查过程中,胶囊内窥镜可以采集到几万张原始图像。第一神经网络模型的输入为至少一部分原始图像的单张图像,对单张图像进行处理以获得相应的病种类别和分类概率。病种类别包括糜烂、出血、溃疡、息肉、隆起、毛细血管扩张、血管畸形、憩室、寄生虫中的至少一种。在该实施例中列举了共9个病种类别,可以理解,第一神经网络模型可以识别的病种类别的数量与训练样本集相关,本发明不限于特定数量的病种类别。
在步骤S02中,对于不同病种类别,分别从原始图像中选择病种分类概率最高的多张图像的图像特征形成测试样本集。
对于多个病种类别,按照分类概率对已经进行病种预测的多个原始图像排序,选择相应病种类别的分类概率最高的原始图像的图像特征组成各自的测试样本集。其中,测试样本集中的图像特征优选为池化层输出的图像特征。每个病种类别的测试样本集中的图像数量S例如是2~128的范围内的任意整数,从而兼顾病种识别准确度和病种识别的计算时间。在该实施例中,病种类别的数量N=9,每个病种类别的测试样本集的图像数量S=10。再其他实施例中,病种类别的数量以及每个病种类别的测试样本集可按照实际需要进行调整。
例如,参见图4所示,将采集图像输入第一神经网络模型(即卷积神经网络模型)进行病种预测。第一神经网络模型针对每张采集图像进行处理,并根据每张采集图像的图像特征,得到该采集图像被判断为不同病种类别对应的概率。据此,可以得到被分类到类别1的采集图像,图像1、图像2、图像3......图像M,并按照分类概率由高到低的顺序选择图像样本,得到图像3、图像M、图像2......图像S。其他类别的处理与类别1类似,在此不再赘述。基于选择的图像样本,第一神经网络模型输出图像样本对应的图像特征,并形成测试样本集。
在步骤S03中,采用第二神经网络模型,对多个病种的测试样本集分别进行病种识别。第二神经网络模型例如是循环神经网络(缩写为RNN)模型。
对于多个病种类别的各个测试样本集,第二神经网络模型基于多张原始图像中提取的图像特征的测试样本集进行病种识别,即基于第一神经网络模型输出的测试样本集,以提高病种识别的准确度。参见图4,例如,第一神经网络模型选取的疑似糜烂图像的概率最高的S张图像,并将该S张图像的每张图像中提取的疑似类别1(例如糜烂)的图像特征作为测试样本集,将测试样本集输入到第二神经网络模型,第二神经网络模型可以确认是否真的患有类别1的疾病(例如糜烂类型的疾病),其他类型疾病以此类推。
在步骤S04中,对多个病种的识别结果进行叠加以获得病例诊断结果。
经过上述的病种预测和病种识别步骤,对患者的检查过程中采集的海量原始图像进行处理可以获得多个病种的识别结果,进行叠加以获得病例诊断结果。在一具体实施例中,该病例诊断结果是患者的病灶包括9个病种类别的一种或多种。例如,对于上述9个病种类别,如果出血和息肉两个病种类别的识别结果是有病灶,且其他病种类别的识别结果是没有病灶,则病例诊断结果是叠加后的全部病种类别,即患者存在着出血和息肉这两个病种类别的病灶。
下文结合图6,对根据本发明实施例的内窥镜影像识别方法中的第二神经网络模型进行详细描述。
第二神经网络模型是循环神经网络模型(RNN)。循环神经网络模型是以序列数据作为输入的递归神经网络。如图所示,第二神经网络模型例如包括至少一个第一全连接层、至少一个双向长短期记忆(缩写为LSTM)层、注意力机制、至少一个第二全连接层、以及至少一个归一化指数层(例如,softmax层)。
第一神经网络模型的病种预测获得的单个病种类别的测试样本集作为第二神经网络模型的输入。测试样本集包括从多个原始图像获取的多个图像特征。
第一全连接层包括多个全连接单元,多个全连接单元分别对相应一个图像特征进行降维处理,即多个全连接单元分别将高维度的多个图像特征进行降维处理以获得低维度的多个图像特征。
双向长短期记忆层包括多个前向长短期记忆单元和多个后向长短期记忆单元,用于对于多个图像特征分别按照前向和后向预测隐藏状态。其中,多个前向长短期记忆单元分别对相应一个图像特征进行前向预测,多个后向长短期记忆单元分别对相应一个图像特征进行后向预测。
本发明的发明人注意到,医生在根据消化道影像(尤其是连续拍摄的消化道影像)进行阅片诊断时,不仅会参考前一时刻拍摄的图像,还会参考后一时刻拍摄的图像,结合前后时刻的图像一起进行诊断。现有的胶囊内窥镜影像处理方法中的循环神经网络模型采用单向长短期记忆层,因此只能依据前一时刻的输入来预测下一时刻的输出,而不能基于采集的图像获得准确的病种识别结果。与现有的循环神经网络模型不同,本发明的循环神经网络模型采用双向长短期记忆层,组合前后时刻的图像特征一起进行病种识别。
在双向长短期记忆层中,每个前向长短期记忆单元的输入为已经降维的相应一个图像特征,输出为相应一个隐藏状态。其中,前向长短期记忆单元对输入的图像特征按输入顺序从前往后计算。每个后向长短期记忆单元的输入为已经降维的相应一个图像特征,输出为相应一个隐藏状态。其中,后向长短期记忆单元对输入的图像特征按输入顺序从后往前计算。计算如下式所示:
其中, 表示反正切函数,表示sigmoid函数,表示点乘;表示长短期
记忆单元内部的4个门;分别表示图像特征和隐藏状态,表示记忆单元,下标t表
示第t步递归,t-1表示第t-1步递归;表示图像特征的权值;表示隐藏状态的权重矩阵;表示偏置项。
进一步地,将每个图像特征相对应的前向长短期记忆单元和后向长短期记忆单元的输出叠加成各自的隐藏状态H,如下式所示:
因而,双向长短期记忆层可以获得与多个图像特征相对应的多个隐藏状态。
第二神经网络模型的注意力机制用于将多个图像特征的隐藏状态加权组成最终特征。
每个图像特征的权重系数表示对病种识别的影响,如下式所示:
多个图像特征的隐藏状态加权组合以获得最终特征T,如下式所示:
进一步地,第二全连接层将上一层提取到的最终特征T综合起来进行分类。归一化指数层用于将上一层(即第二全连接层)的输出映射到(0,1)区间内的概率值,从而获得每个最终特征T分类到不同病种类别的概率,即病种类别疑似概率,再根据病种类别疑似概率得到病例诊断结果,并输出。
第二神经网络模型基于多张原始图像的图像特征的测试样本集进行病种识别,从而确认病种类别疑似概率最高的多张原始图像是否真的包含病灶。
进一步的,本发明一实施方式提供一种电子设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述基于深度学习的内窥镜影像识别方法中的步骤。
进一步的,本发明一实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述基于深度学习的内窥镜影像识别方法中的步骤。
综上所述,本发明的基于深度学习的内窥镜影像识别方法、电子设备及存储介质,在对原始图像的单张图像进病种预测之后,基于病种预测结果选择多张图像进行加权组合以提高病种识别准确度,对多个病种类别的识别结果进行叠加以获得病例诊断结果。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本发明时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (13)
1.一种内窥镜影像识别方法,包括:
采用第一神经网络模型,对多张原始图像分别进行多个病种类别的病种预测;
基于所述多张原始图像的病种预测结果,建立所述多个病种类别的测试样本集,每个所述测试样本集包括预定数量原始图像的图像特征;
采用第二神经网络模型,对所述多个病种类别的测试样本集分别进行病种识别;以及
对所述多个病种的病种识别结果进行叠加以获得病例诊断结果;
其中,所述第二神经网络模型对所述测试样本集中的多个图像特征进行加权组合以获得所述病种识别结果。
2.根据权利要求1所述的内窥镜影像识别方法,其中,所述第一神经网络模型为卷积神经网络模型,所述卷积神经网络模型输入所述多张原始图像的单张图像,输出所述多个病种类别的图像特征和分类概率。
3.根据权利要求2所述的内窥镜影像识别方法,其中,所述第二神经网络模型为循环神经网络模型,所述循环神经网络模型输入所述测试样本集中的多个图像特征,输出与所述测试样本集相对应的病种识别结果。
4.根据权利要求1-3任意一项所述的内窥镜影像识别方法,其中,所述第二神经网络模型包括:
第一全连接层,将所述测试样本集中的多个图像特征分别进行降维处理;
双向长短期记忆层,对经过降维处理的多个图像特征分别按照前向和后向预测隐藏状态;以及
注意力机制,将所述多个图像特征的隐藏状态加权组合成最终特征,
其中,所述第二神经网络模型基于所述最终特征获得病种识别结果。
5.根据权利要求4所述的内窥镜影像识别方法,其中,所述第一全连接层包括多个全连接单元,所述多个全连接单元分别对相应一个图像特征进行降维处理。
6.根据权利要求4所述的内窥镜影像识别方法,其中,所述双向长短期记忆层包括多个前向长短期记忆单元和多个后向长短期记忆单元,所述多个前向长短期记忆单元分别对相应一个图像特征进行前向预测,所述多个后向长短期记忆单元分别对相应一个图像特征进行后向预测。
7.根据权利要求4所述的内窥镜影像识别方法,其中,所述加权组合包括对所述多个图像特征的隐藏状态加权求和,所述多个图像特征的权重系数表示对相应病种类别的病种识别影响。
9.根据权利要求2所述的内窥镜影像识别方法,其中,建立所述多个病种类别的测试样本集的步骤包括:对于所述多个病种类别中的不同病种类别,分别从所述多张原始图像中选择所述分类概率最高的预定数量原始图像的图像特征形成测试样本集。
10.根据权利要求9所述的内窥镜影像识别方法,其中,所述预定数量是2~128的范围内的任意整数。
11.根据权利要求1所述的内窥镜影像识别方法,其中,所述多张原始图像采用以下任意一种内窥镜采集获得:光纤内窥镜、主动式胶囊内窥镜或被动式胶囊内窥镜。
12.一种电子设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-11任意一项所述基于深度学习的内窥镜影像识别方法中的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11任意一项所述基于深度学习的内窥镜影像识别方法中的步骤。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695472.3A CN113159238B (zh) | 2021-06-23 | 2021-06-23 | 内窥镜影像识别方法、电子设备及存储介质 |
EP22827476.7A EP4361882A1 (en) | 2021-06-23 | 2022-06-17 | Endoscopic image recognition method, electronic device, and storage medium |
PCT/CN2022/099318 WO2022267981A1 (zh) | 2021-06-23 | 2022-06-17 | 内窥镜影像识别方法、电子设备及存储介质 |
KR1020237045348A KR20240015109A (ko) | 2021-06-23 | 2022-06-17 | 내시경 영상 식별 방법, 전자 기기 및 저장 매체 |
JP2023579477A JP2024528490A (ja) | 2021-06-23 | 2022-06-17 | 内視鏡の画像識別方法、電子デバイスおよび記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695472.3A CN113159238B (zh) | 2021-06-23 | 2021-06-23 | 内窥镜影像识别方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113159238A true CN113159238A (zh) | 2021-07-23 |
CN113159238B CN113159238B (zh) | 2021-10-26 |
Family
ID=76876029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110695472.3A Active CN113159238B (zh) | 2021-06-23 | 2021-06-23 | 内窥镜影像识别方法、电子设备及存储介质 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4361882A1 (zh) |
JP (1) | JP2024528490A (zh) |
KR (1) | KR20240015109A (zh) |
CN (1) | CN113159238B (zh) |
WO (1) | WO2022267981A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022718A (zh) * | 2022-01-07 | 2022-02-08 | 安翰科技(武汉)股份有限公司 | 消化系统病理图像识别方法、系统及计算机存储介质 |
WO2022267981A1 (zh) * | 2021-06-23 | 2022-12-29 | 安翰科技(武汉)股份有限公司 | 内窥镜影像识别方法、电子设备及存储介质 |
CN116051486A (zh) * | 2022-12-29 | 2023-05-02 | 抖音视界有限公司 | 内窥镜图像识别模型的训练方法、图像识别方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118037714A (zh) * | 2024-03-29 | 2024-05-14 | 华伦医疗用品(深圳)有限公司 | 基于gpu医疗内窥镜图像的处理方法、系统和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180232883A1 (en) * | 2017-02-13 | 2018-08-16 | Amit Sethi | Systems & Methods for Computational Pathology using Points-of-interest |
CN109948733A (zh) * | 2019-04-01 | 2019-06-28 | 深圳大学 | 消化道内窥镜图像的多分类方法、分类装置及存储介质 |
CN111275118A (zh) * | 2020-01-22 | 2020-06-12 | 复旦大学 | 基于自我修正式标签生成网络的胸片多标签分类方法 |
CN111539930A (zh) * | 2020-04-21 | 2020-08-14 | 浙江德尚韵兴医疗科技有限公司 | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 |
CN111653365A (zh) * | 2020-07-23 | 2020-09-11 | 中山大学附属第一医院 | 一种鼻咽癌辅助诊断模型构建和辅助诊断方法及系统 |
WO2020243526A1 (en) * | 2019-05-31 | 2020-12-03 | 410 Ai, Llc | Estimating predisposition for disease based on classification of artificial image objects created from omics data |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
CN112348125A (zh) * | 2021-01-06 | 2021-02-09 | 安翰科技(武汉)股份有限公司 | 基于深度学习的胶囊内窥镜影像识别方法、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159238B (zh) * | 2021-06-23 | 2021-10-26 | 安翰科技(武汉)股份有限公司 | 内窥镜影像识别方法、电子设备及存储介质 |
-
2021
- 2021-06-23 CN CN202110695472.3A patent/CN113159238B/zh active Active
-
2022
- 2022-06-17 WO PCT/CN2022/099318 patent/WO2022267981A1/zh active Application Filing
- 2022-06-17 EP EP22827476.7A patent/EP4361882A1/en active Pending
- 2022-06-17 JP JP2023579477A patent/JP2024528490A/ja active Pending
- 2022-06-17 KR KR1020237045348A patent/KR20240015109A/ko unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180232883A1 (en) * | 2017-02-13 | 2018-08-16 | Amit Sethi | Systems & Methods for Computational Pathology using Points-of-interest |
CN109948733A (zh) * | 2019-04-01 | 2019-06-28 | 深圳大学 | 消化道内窥镜图像的多分类方法、分类装置及存储介质 |
WO2020243526A1 (en) * | 2019-05-31 | 2020-12-03 | 410 Ai, Llc | Estimating predisposition for disease based on classification of artificial image objects created from omics data |
CN111275118A (zh) * | 2020-01-22 | 2020-06-12 | 复旦大学 | 基于自我修正式标签生成网络的胸片多标签分类方法 |
CN111539930A (zh) * | 2020-04-21 | 2020-08-14 | 浙江德尚韵兴医疗科技有限公司 | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 |
CN111653365A (zh) * | 2020-07-23 | 2020-09-11 | 中山大学附属第一医院 | 一种鼻咽癌辅助诊断模型构建和辅助诊断方法及系统 |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
CN112348125A (zh) * | 2021-01-06 | 2021-02-09 | 安翰科技(武汉)股份有限公司 | 基于深度学习的胶囊内窥镜影像识别方法、设备及介质 |
Non-Patent Citations (2)
Title |
---|
MUAMMER TURKOGLU: ""Multi‑model LSTM‑based convolutional neural networks for detection of apple diseases and pests"", 《JOURNAL OF AMBIENT INTELLIGENCE AND HUMANIZED COMPUTING》 * |
梁敏: ""基于混合深度学习算法的疾病预测模型"", 《人工智能与机器人研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022267981A1 (zh) * | 2021-06-23 | 2022-12-29 | 安翰科技(武汉)股份有限公司 | 内窥镜影像识别方法、电子设备及存储介质 |
CN114022718A (zh) * | 2022-01-07 | 2022-02-08 | 安翰科技(武汉)股份有限公司 | 消化系统病理图像识别方法、系统及计算机存储介质 |
CN114022718B (zh) * | 2022-01-07 | 2022-03-22 | 安翰科技(武汉)股份有限公司 | 消化系统病理图像识别方法、系统及计算机存储介质 |
CN116051486A (zh) * | 2022-12-29 | 2023-05-02 | 抖音视界有限公司 | 内窥镜图像识别模型的训练方法、图像识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2022267981A1 (zh) | 2022-12-29 |
JP2024528490A (ja) | 2024-07-30 |
CN113159238B (zh) | 2021-10-26 |
EP4361882A1 (en) | 2024-05-01 |
KR20240015109A (ko) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113159238B (zh) | 内窥镜影像识别方法、电子设备及存储介质 | |
EP3876190B1 (en) | Endoscopic image processing method and system and computer device | |
Du et al. | Review on the applications of deep learning in the analysis of gastrointestinal endoscopy images | |
CN113496489B (zh) | 内窥镜图像分类模型的训练方法、图像分类方法和装置 | |
EP1997074B1 (en) | Device, system and method for automatic detection of contractile activity in an image frame | |
CN113544743B (zh) | 内窥镜用处理器、程序、信息处理方法和信息处理装置 | |
JP2021513435A (ja) | 胃腸腫瘍を診断するシステム及び方法 | |
US20220172828A1 (en) | Endoscopic image display method, apparatus, computer device, and storage medium | |
CN103458765B (zh) | 图像处理装置 | |
CN114554934A (zh) | 程序、信息处理方法、信息处理装置以及诊断支持系统 | |
CN113129293A (zh) | 医学图像分类方法、装置、计算机设备和存储介质 | |
Garbaz et al. | Bleeding classification in wireless capsule endoscopy images based on inception-resnet-v2 and cnns | |
CN114259197A (zh) | 一种胶囊内窥镜质控方法及系统 | |
CN113222957A (zh) | 一种基于胶囊镜图像的多类别病灶高速检测方法及系统 | |
Raut et al. | Transfer learning based video summarization in wireless capsule endoscopy | |
CN115223193B (zh) | 一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法 | |
UÇan et al. | Multi-class gastrointestinal images classification using EfficientNet-B0 CNN Model | |
US20240379230A1 (en) | Endoscopic image recognition method, electronic device, and storage medium | |
US20240087115A1 (en) | Machine learning enabled system for skin abnormality interventions | |
CN114557660A (zh) | 胶囊内窥镜质控方法及系统 | |
CN115908224A (zh) | 目标检测模型的训练方法、目标检测方法和训练装置 | |
CN114581402A (zh) | 胶囊内窥镜质检方法、装置及存储介质 | |
Odagawa et al. | Classification with CNN features and SVM on embedded DSP core for colorectal magnified NBI endoscopic video image | |
Malviya et al. | Gastrointestinal Disease Classification And Analysis Using GI-Net Model | |
KR102564443B1 (ko) | 딥러닝을 이용한 위내시경 검사의 신뢰성을 향상시킬 수 있는 위내시경 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |