KR102595646B1 - Tympanic disease prediction model system using deep neural network and monte carlo dropout - Google Patents

Tympanic disease prediction model system using deep neural network and monte carlo dropout Download PDF

Info

Publication number
KR102595646B1
KR102595646B1 KR1020230034518A KR20230034518A KR102595646B1 KR 102595646 B1 KR102595646 B1 KR 102595646B1 KR 1020230034518 A KR1020230034518 A KR 1020230034518A KR 20230034518 A KR20230034518 A KR 20230034518A KR 102595646 B1 KR102595646 B1 KR 102595646B1
Authority
KR
South Korea
Prior art keywords
eardrum
image
unit
disease
area
Prior art date
Application number
KR1020230034518A
Other languages
Korean (ko)
Inventor
천성태
이홍창
최성준
문경영
Original Assignee
(주)해우기술
순천향대학교 산학협력단
(주)엠디에이아이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)해우기술, 순천향대학교 산학협력단, (주)엠디에이아이 filed Critical (주)해우기술
Priority to KR1020230034518A priority Critical patent/KR102595646B1/en
Application granted granted Critical
Publication of KR102595646B1 publication Critical patent/KR102595646B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/227Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor for ears, i.e. otoscopes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/12Audiometering
    • A61B5/121Audiometering evaluating hearing capacity
    • A61B5/125Audiometering evaluating hearing capacity objective methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Abstract

본 발명은 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템에 관한 것으로서, 고막 영상의 수집 및 분류를 수행하는 고막 영상부, 상기 고막 영상부에서 분류한 상기 진단 고막 영상에 대응하는 질병명 및 청력 수치를 레이블로 생성하는 레이블 생성부, 상기 고막 영상에서 고막 부위를 인식하여 고막 영역으로 추출하는 고막 영역 추출부, 상기 고막 영역 추출부에서 추출한 고막 영역을 전역 평균 풀링(Global Average Pooling)을 이용하여 미진단 고막 벡터로 변환하는 벡터변환부, 소프트맥스(Softmax) 활성화 함수 및 몬테카를로 드롭아웃을 이용하여 상기 벡터변환부에서 변환된 상기 미진단 고막 벡터의 질병 진단을 수행하는 질병진단부를 포함하는 것을 특징으로 한다.The present invention relates to an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout, which includes an eardrum imaging unit that collects and classifies eardrum images, disease names and hearing characteristics corresponding to the diagnostic eardrum images classified by the eardrum imaging unit. A label generation unit that generates a numerical value as a label, an eardrum area extraction unit that recognizes the eardrum area in the eardrum image and extracts it as an eardrum area, and uses global average pooling to extract the eardrum area extracted from the eardrum area extraction unit. It includes a vector conversion unit that converts the undiagnosed eardrum vector into an undiagnosed eardrum vector, and a disease diagnosis unit that performs disease diagnosis on the undiagnosed eardrum vector converted by the vector conversion unit using a Softmax activation function and Monte Carlo dropout. Do it as

Description

심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템{TYMPANIC DISEASE PREDICTION MODEL SYSTEM USING DEEP NEURAL NETWORK AND MONTE CARLO DROPOUT}Eardrum disease prediction model system using deep neural network and Monte Carlo dropout {TYMPANIC DISEASE PREDICTION MODEL SYSTEM USING DEEP NEURAL NETWORK AND MONTE CARLO DROPOUT}

본 발명은 인공신경망을 이용한 고막 질병 예측 시스템에 관한 것으로서, 보다 상세하게는 인공신경망과 함수를 이용한 고막 영상 분석을 수행하여 고막의 질병 여부 및 질병을 예측하는 하는 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템에 관한 것이다.The present invention relates to an eardrum disease prediction system using an artificial neural network, and more specifically, an eardrum using a deep neural network and Monte Carlo dropout that performs eardrum image analysis using an artificial neural network and a function to determine whether the eardrum is diseased and predicts the disease. It is about a disease prediction model system.

사람의 청력과 가장 밀접한 기관인 귀는 인체의 바깥쪽부터 외이, 외이도, 고막, 반고리관, 중이, 전정기관, 달팽이관, 내이, 귀관, 유스타키오관 등으로 구성되어 있으며, 내부의 기관에 문제가 발생한 경우 이를 진단하기 위해서는 환자의 증상과 귀 내시경 영상을 종합하여 진단을 내릴 수 있다.The ear, which is the organ most closely related to human hearing, consists of the outer ear, external auditory canal, tympanic membrane, semicircular canal, middle ear, vestibular organ, cochlea, inner ear, ear canal, and Eustachian tube. The diagnosis can be made by combining the patient's symptoms and ear endoscopy images.

특히, 청력기관의 이상 신호는 환자 본인이 가장 가까이에서 느끼고 체감할 수 있기 때문에 진단시에 환자가 느낀 통증, 이명, 이상현상 등을 의사에게 제대로 설명하는 것이 진단명을 내릴 때 중요한 요소로 작용한다.In particular, because abnormal signals from the hearing organ can be felt and felt up close by the patient, it is an important factor in making a diagnosis to properly explain to the doctor the pain, tinnitus, and abnormal phenomena felt by the patient at the time of diagnosis.

그러나, 의사표현이 서툴거나 의사표현에 문제가 있는 소아, 고령의 노인, 장애인 등의 사람들로부터는 청력기관의 이상현상에 대한 표현을 제대로 들을 수 없기 때문에 내시경 영상을 통해서만 진단을 수행해야 하기 때문에 내시경 영상과 환자의 의사표현을 이용한 진단보다는 그 정확도가 떨어질 수 있으며, 내시경 영상만을 이용한 진단의 경우 진단을 수행하는 사람이 실수하는 경우, 전혀 엉뚱한 진단을 수행할 수 있다는 문제점이 있다.However, people who are poor at expressing themselves or have problems expressing their opinions, such as children, the elderly, and the disabled, cannot properly hear expressions of abnormalities in their hearing organs, so diagnosis must be performed only through endoscopic imaging. The accuracy may be lower than that of diagnosis using images and the patient's expression of opinion, and in the case of diagnosis using only endoscopic images, there is a problem that if the person performing the diagnosis makes a mistake, a completely incorrect diagnosis may be performed.

따라서, 외부기관 또는 외부데이터베이스로부터 귀 질환을 가진 내시경 영상을 수집하고, 수집된 귀 질환 영상 데이터와 분석 대상 환자의 내시경 영상을 딥러닝 이미지 분석을 통해 질환 여부를 판단하는 고막 질병 예측 모델 시스템에 대한 연구가 요구된다.Therefore, a tympanic disease prediction model system that collects endoscopic images with ear diseases from external institutions or external databases and determines the presence of disease through deep learning image analysis of the collected ear disease image data and the endoscopic images of the patient being analyzed. Research is required.

한국등록특허 제10-2047237호Korean Patent No. 10-2047237

본 발명은 내시경을 이용하여 촬영한 환자의 귀 내부 영상을 머신러닝을 통해 분석함으로써, 질환 여부와 종류를 판단함에 목적이 있다.The purpose of the present invention is to determine the presence and type of disease by analyzing images inside the patient's ear taken using an endoscope through machine learning.

또한, 환자의 귀 내부를 촬영하는 귀 내시경 촬영 장치에 다양한 종류의 센서를 통해 수집한 센싱 데이터를 분석하여 고장 여부를 진단함으로써, 고장판단된 촬영장치로부터 수집한 영상을 구별하여 영상 데이터의 신뢰도를 유지시킴에 목적이 있다.In addition, by analyzing the sensing data collected through various types of sensors in the ear endoscopic imaging device that photographs the inside of the patient's ear to diagnose failure, the reliability of the image data can be improved by distinguishing between images collected from imaging devices that have been determined to be malfunctioning. The purpose is to maintain it.

또한, 머신러닝 수행 시 몬테카를로 드롭아웃을 사용함으로써, 다수 개의 모델을 사용하여 정확도를 높이는 앙상블(Ensemble) 효과를 만들어 보다 일반화된 결과를 출력함에 목적이 있다.In addition, by using Monte Carlo dropout when performing machine learning, the purpose is to create an ensemble effect that increases accuracy by using multiple models and output more generalized results.

본 발명의 일 실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템은, 고막 영상의 수집 및 분류를 수행하는 고막 영상부, 상기 고막 영상부에서 분류한 상기 진단 고막 영상에 대응하는 질병명 및 청력 수치를 레이블로 생성하는 레이블 생성부, 상기 고막 영상에서 고막 부위를 인식하여 고막 영역으로 추출하는 고막 영역 추출부, 상기 고막 영역 추출부에서 추출한 고막 영역을 전역 평균 풀링(Global Average Pooling)을 이용하여 미진단 고막 벡터로 변환하는 벡터변환부, 소프트맥스(Softmax) 활성화 함수 및 몬테카를로 드롭아웃을 이용하여 상기 벡터변환부에서 변환된 상기 미진단 고막 벡터의 질병 진단을 수행하는 질병진단부를 포함할 수 있다.An tympanic disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention includes an tympanic membrane imaging unit that collects and classifies tympanic membrane images, and a tympanic membrane image corresponding to the diagnostic tympanic image classified by the tympanic membrane imaging unit. A label generation unit that generates the disease name and hearing level as a label, an eardrum area extraction unit that recognizes the eardrum area in the eardrum image and extracts it as an eardrum area, and a global average pooling of the eardrum area extracted from the eardrum area extraction unit. It includes a vector conversion unit that converts the undiagnosed eardrum vector into an undiagnosed eardrum vector using a Softmax activation function and a Monte Carlo dropout, and a disease diagnosis unit that performs disease diagnosis of the undiagnosed eardrum vector converted in the vector conversion unit. can do.

또한, 상기 고막 영상부는, 귀 내시경 촬영 장치를 이용하여 촬영된 환자의 미진단 고막 영상을 수집하는 미진단 고막 영상 수집부, 외부로부터 진단이 완료된 환자의 귀 내시경 촬영 영상인 진단 고막 영상, 질병명 및 청력 수치를 수집하는 진단 고막 영상 수집부 및 상기 진단 고막 영상에 대응되는 질병명 및 청력 수치를 분류하는 진단 고막 영상 분류부를 포함할 수 있다.In addition, the eardrum imaging unit includes an undiagnosed eardrum image collection unit that collects an undiagnosed eardrum image of a patient taken using an ear endoscopic imaging device, a diagnostic eardrum image that is an ear endoscopic image of a patient whose diagnosis has been completed from the outside, a disease name, and It may include a diagnostic eardrum image collection unit that collects hearing values, and a diagnostic eardrum image classification unit that classifies disease names and hearing values corresponding to the diagnostic eardrum images.

또한, 상기 고막 영상부는, 상기 귀 내시경 촬영 장치를 이용하여 수집한 고막 영상의 이미지 히스토그램 분포 데이터를 생성하는 히스토그램 생성부 및 상기 히스토그램 생성부에서 생성된 고막 영상의 이미지 히스토그램의 분포 데이터를 분석하여 신뢰도를 판단하되, 하기 [수학식 1]에 의해 산출되는 평균값(Aerr)이 기설정된 한계값(Serr)보다 큰 경우, 상기 귀 내시경 촬영 장치 및 상기 고막 영상에 오류가 발생한 것으로 판단하는 고장 진단부를 더 포함할 수 있다.In addition, the eardrum imaging unit analyzes the distribution data of the image histogram of the eardrum image generated by the histogram generator and the histogram generator for generating image histogram distribution data of the eardrum image collected using the ear endoscopic imaging device, thereby providing reliability. , but if the average value (A err ) calculated by the following [Equation 1] is greater than the preset limit value (S err ), failure diagnosis to determine that an error has occurred in the ear endoscope imaging device and the eardrum image. It can include more wealth.

[수학식 1][Equation 1]

(여기서, Aerr은 상기 고막 영상의 이미지 히스토그램 분포 데이터의 평균오차, Taver는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체평균, Paver는 상기 고막 영상 이미지 n개에 대한 히스토그램 분포 데이터의 일부평균, Tσ는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체표준편차를 의미함)(Here, A err is the average error of the image histogram distribution data of the eardrum image, T aver is the overall average of the image histogram distribution data of the eardrum image, and P aver is the partial average of the histogram distribution data for the n eardrum image images. , T σ means the overall standard deviation of the image histogram distribution data of the eardrum image)

또한, 상기 고막 영역 추출부는, 상기 고막 영상부에서 수집한 고막 영상에서 고막 영역을 인식하고, 상기 고막 영역을 허프 원 변환(Hough Circle Transform) 처리 기술을 이용하여 추출한 원형 영역을 관심 영역(Region Of Interest)으로 추출하는 관심영역 추출부 및 상기 관심 영역 내 고막 위치를 기준하여 기설정된 영역을 고막 중심부 영역으로 추출하는 고막 중심부 영역 추출부를 포함할 수 있다.In addition, the eardrum area extraction unit recognizes the eardrum area in the eardrum image collected by the eardrum imaging unit, and selects a circular area extracted from the eardrum area using Hough Circle Transform processing technology as a region of interest. It may include a region of interest extractor that extracts a region of interest (Interest) and an eardrum center region extractor that extracts a preset area based on the position of the eardrum within the region of interest as the eardrum center region.

또한, 상기 질병진단부는, 상기 미진단 고막 벡터에 상기 소프트맥스 활성화 함수를 이용하여 상기 레이블 생성부에서 생성한 다수 개의 질병 레이블에 대응하는 질병진단을 수행하고, 질병진단이 수행된 상기 미진단 고막 벡터에 대응하는 질병 레이블의 각 청력 수치를 상기 몬테카를로 드롭아웃 기법을 이용하여 산출할 수 있다.In addition, the disease diagnosis unit performs disease diagnosis corresponding to a plurality of disease labels generated by the label generation unit using the softmax activation function on the undiagnosed eardrum vector, and performs disease diagnosis on the undiagnosed eardrum for which the disease diagnosis has been performed. Each hearing value of the disease label corresponding to the vector can be calculated using the Monte Carlo dropout technique.

본 발명에 따르면, 내시경을 이용하여 촬영한 환자의 귀 내부 영상을 머신러닝을 통해 분석함으로써, 질환 여부와 종류를 판단할 수 있다.According to the present invention, the presence and type of disease can be determined by analyzing images inside the patient's ear taken using an endoscope through machine learning.

또한, 환자의 귀 내부를 촬영하는 귀 내시경 촬영 장치에 다양한 종류의 센서를 통해 수집한 센싱 데이터를 분석하여 고장 여부를 진단함으로써, 고장판단된 촬영장치로부터 수집한 영상을 구별하여 영상 데이터의 신뢰도를 유지시킬 수 있다.In addition, by analyzing the sensing data collected through various types of sensors in the ear endoscopic imaging device that photographs the inside of the patient's ear to diagnose failure, the reliability of the image data can be improved by distinguishing between images collected from imaging devices that have been determined to be malfunctioning. It can be maintained.

또한, 머신러닝 수행 시 몬테카를로 드롭아웃을 사용함으로써, 다수 개의 모델을 사용하여 정확도를 높이는 앙상블(Ensemble) 효과를 만들어 보다 일반화된 결과를 출력할 수 있다.Additionally, by using Monte Carlo dropout when performing machine learning, it is possible to output more generalized results by creating an ensemble effect that increases accuracy by using multiple models.

도 1은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 블록도를 도시한 도면이다.
도 2는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 중간블록도를 도시한 도면이다.
도 3은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 중간블록도를 도시한 도면이다.
도 4는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 고막 영상 추출 과정을 도시한 도면이다.
도 5는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템이 외부로부터 수집한 진단 고막 영상을 도시한 도면이다.
도 6은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템이 전역 평균 풀링을 적용하여 출력값을 벡터로 변환하는 과정을 도시한 도면이다.
Figure 1 is a block diagram of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention.
Figure 2 is a diagram showing an intermediate block diagram of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention.
Figure 3 is a diagram showing an intermediate block diagram of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention.
Figure 4 is a diagram illustrating the tympanic membrane image extraction process of the tympanic membrane disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention.
Figure 5 is a diagram showing a diagnostic eardrum image collected from outside by an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention.
Figure 6 is a diagram illustrating a process in which an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention converts the output value into a vector by applying global average pooling.

이상과 같은 본 발명에 대한 해결하고자 하는 과제, 과제의 해결 수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시례 및 도면들에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시례들을 참조하면 명확해질 것이다.Specific details, including the problem to be solved by the present invention, the means for solving the problem, and the effect of the invention, are included in the examples and drawings described below. The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings.

본 발명의 권리범위는 이하에서 설명하는 실시례에 한정되는 것은 아니며, 본 발명의 기술적 요지를 벗어나지 않는 범위 내에서 당해 기술분야의 통상적인 지식을 가진자에 의하여 다양하게 변형 실시될 수 있다.The scope of the present invention is not limited to the embodiments described below, and various modifications can be made by those skilled in the art without departing from the technical gist of the present invention.

이하, 본 발명인 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템은 첨부된 도 1 내지 도 5를 참고로 상세하게 설명한다.Hereinafter, the eardrum disease prediction model system using the deep neural network and Monte Carlo dropout of the present invention will be described in detail with reference to the attached FIGS. 1 to 5.

우선, 도 1은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 블록도를 도시한 도면이고, 도 2는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 중간블록도를 도시한 도면이며, 도 3은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 중간블록도를 도시한 도면이고, 도 4는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템의 고막 영상 추출 과정을 도시한 도면이며, 도 5는 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템이 외부로부터 수집한 진단 고막 영상을 도시한 도면이고, 도 6은 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템이 전역 평균 풀링을 적용하여 출력값을 벡터로 변환하는 과정을 도시한 도면이다.First, Figure 1 is a block diagram of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention, and Figure 2 is a block diagram of a deep neural network and Monte Carlo dropout according to an embodiment of the present invention. It is a diagram showing an intermediate block diagram of an eardrum disease prediction model system using dropout, and Figure 3 shows an intermediate block diagram of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention. It is a diagram, and Figure 4 is a diagram illustrating the process of extracting an eardrum image of an eardrum disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention, and Figure 5 is a diagram illustrating a deep neural network and Monte Carlo dropout according to an embodiment of the present invention. A diagram showing diagnostic eardrum images collected from outside by a tympanic disease prediction model system using a neural network and Monte Carlo dropout, and FIG. 6 is a tympanic disease prediction model system using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention. This diagram shows the process of converting the output value to a vector by applying global average pooling.

도 1을 참고하면, 본 발명의 일실시례에 따른 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템(100)은 고막 영상부(110), 레이블 생성부(120), 고막 영역 추출부(130), 벡터변환부(140) 및 질병진단부(150)를 포함할 수 있다.Referring to Figure 1, the eardrum disease prediction model system 100 using a deep neural network and Monte Carlo dropout according to an embodiment of the present invention includes an eardrum imaging unit 110, a label generation unit 120, and an eardrum area extraction unit ( 130), a vector conversion unit 140, and a disease diagnosis unit 150.

상기 고막 영상부(110)는, 고막 영상의 수집 및 분류를 수행할 수 있다.The eardrum imaging unit 110 can collect and classify eardrum images.

여기서, 상기 고막 영상부(110)는 상기 도 2를 참고하여 더욱 상세히 설명한다.Here, the eardrum imaging unit 110 will be described in more detail with reference to FIG. 2 .

도 2를 참고하면, 상기 고막 영상부(110)는, 미진단 고막 영상 수집부(111), 진단 고막 영상 수집부(112) 및 진단 고막 영상 분류부(113)를 포함할 수 있다.Referring to FIG. 2 , the eardrum imaging unit 110 may include a non-diagnosed eardrum image collection unit 111, a diagnostic eardrum image collection unit 112, and a diagnostic eardrum image classification unit 113.

상기 미진단 고막 영상 수집부(111)는, 귀 내시경 촬영 장치를 이용하여 촬영된 환자의 미진단 고막 영상을 수집할 수 있다.The undiagnosed eardrum image collection unit 111 may collect images of the patient's undiagnosed eardrum captured using an ear endoscopic imaging device.

여기서, 상기 미진단 고막 영상은, 환자의 귀를 상기 귀 내시경 촬영 장치를 이용하여 촬영한 영상으로 질병을 진단하는 담당 의료인(의사 등)으로부터 현재 질병 진단을 받지 않아 질병명 판단 및 청력 수치 산출 대상이 되는 영상을 의미할 수 있다.Here, the undiagnosed eardrum image is an image taken of the patient's ear using the ear endoscopic imaging device, and is not subject to the determination of the name of the disease and calculation of hearing values because the disease has not been currently diagnosed by a medical professional (such as a doctor) in charge of diagnosing the disease. It can mean a video that is.

상기 진단 고막 영상 수집부(112)는, 외부로부터 진단이 완료된 환자의 귀 내시경 촬영 영상인 진단 고막 영상, 질병명 및 청력 수치를 수집할 수 있다.The diagnostic eardrum image collection unit 112 may collect the diagnostic eardrum image, which is an ear endoscopic image of a patient whose diagnosis has been completed, the name of the disease, and the hearing level from the outside.

여기서, 상기 진단 고막 영상을 수집하는 이유는, 이미 진단된 고막 영상이 추후 진단을 위한 기초 자료로 사용되기 때문이며, 진단 고막 영상과 해당 영상(진단 고막 영상)에 진단된 질병명은 필수적으로 수집하되, 질병 종류에 따라 청력 수치는 필수적으로 기재되지 않아도 수집될 수 있다.Here, the reason for collecting the diagnostic eardrum images is because the already diagnosed eardrum images are used as basic data for future diagnosis, and the diagnostic eardrum images and the disease names diagnosed in the corresponding images (diagnostic eardrum images) are necessarily collected, Depending on the type of disease, hearing measurements may be collected without necessarily being recorded.

한편, 상기 진단 고막 영상 수집부(112)를 통해 수집되는 진단 고막 영상은 상기 도 5를 참고하여 더욱 상세히 설명한다.Meanwhile, the diagnostic eardrum image collected through the diagnostic eardrum image collection unit 112 will be described in more detail with reference to FIG. 5 .

도 5를 참고하면, 상기 진단 고막 영상 수집부(112)에서 수집된 진단 고막 영상은, 다양한 종류의 질병으로 진단받은 고막 영상을 의미할 수 있다.Referring to FIG. 5 , the diagnostic eardrum image collected by the diagnostic eardrum image collection unit 112 may mean an eardrum image diagnosed with various types of diseases.

일례로, 상기 진단 고막 영상 수집부(112)에서 수집한 진단 고막 영상에서 제1 진단 고막 영상(510)은 중등도 난청으로 의사로부터 질병진단 후 질병명은 '난청(중등도)', 청력 수치는 해당 진단 시 측정한 '51dBHL'로 수집되며, 제2 진단 고막 영상(520)은 정상 고막 영상으로 진단되어 질병명은 '정상', 청력 수치는 '21dBHL'로 수집될 수 있다. 또한, 제3 진단 고막 영상(530)은 의사로부터 중이염으로 질병진단 후 질병명은 '중이염(급성)', 청력 수치는 해당 진단 시 측정한 '25dbHL' 또는 '청력 수치 검사 안함'으로 표시된 고막 영상으로 수집될 수 있다.For example, in the diagnostic eardrum image collected by the diagnostic eardrum image collection unit 112, the first diagnostic eardrum image 510 is a moderate hearing loss, and after a doctor diagnoses the disease, the disease name is 'hearing loss (moderate)' and the hearing value is the corresponding diagnosis. The second diagnostic eardrum image 520 is diagnosed as a normal eardrum image, so the disease name can be collected as 'normal' and the hearing level can be collected as '21dBHL'. In addition, the third diagnostic tympanic membrane image 530 is an image of the tympanic membrane after a doctor diagnoses otitis media, with the disease name indicated as 'otitis media (acute)' and the hearing level as '25dbHL' or 'no hearing level test' measured at the time of the diagnosis. can be collected.

또한, 상기 질병명은 급성 중이염, 만성 중이염, 삼출성 중이염, 선천성 진주종, 외상성 고막 천공, 난청, 정상 고막 등으로 구분하여 분류될 수 있다.In addition, the disease name can be classified into acute otitis media, chronic otitis media, otitis media with effusion, congenital cholesteatoma, traumatic eardrum perforation, hearing loss, normal eardrum, etc.

한편, 상기 진단 고막 영상 수집부(112)는 진단받은 질병명에 따라 분류하되, 이미 진단이 수행된 고막 영상을 진단명과 관계없이 모두 수집할 수 있다.Meanwhile, the diagnostic eardrum image collection unit 112 classifies the disease according to the name of the diagnosed disease, but can collect all eardrum images for which a diagnosis has already been performed, regardless of the name of the diagnosis.

다시 도 2를 참고하면, 상기 진단 고막 영상 분류부(113)는, 상기 진단 고막 영상에 대응되는 질병명 및 청력 수치를 분류할 수 있다.Referring again to FIG. 2, the diagnostic eardrum image classification unit 113 may classify the disease name and hearing value corresponding to the diagnostic eardrum image.

보다 상세하게는, 상기 진단 고막 영상 수집부(112)에서 수집한 진단 고막 영상을 질병명 또는 청력 수치에 따라 진단 고막 영상을 세부적으로 분류할 수 있다.More specifically, the diagnostic eardrum images collected by the diagnostic eardrum image collection unit 112 may be classified in detail according to the name of the disease or hearing level.

일례로, 상기 제1 진단 고막 영상(510)의 경우, '난청(중등도)'로 진단되었으므로, '난청'으로 진단된 진단 고막 영상들과 그룹화되어 분류되고, 상기 제3 진단 고막 영상(530)의 경우, '중이염(급성)'으로 진단되었으므로, '중이염'으로 진단된 진단 고막 영상들과 그룹화되어 분류될 수 있다.For example, in the case of the first diagnostic eardrum image 510, since 'hearing loss (moderate)' was diagnosed, it is grouped and classified with diagnostic eardrum images diagnosed as 'hearing loss', and the third diagnostic eardrum image 530 In the case of, 'otitis media (acute)' was diagnosed, so it can be classified and grouped with diagnostic tympanic membrane images diagnosed as 'otitis media'.

또한, 상기 고막 영상부(110)는, 지름 1mm~3mm 내외의 크기를 가지는 조명장치와 영상촬영장치를 포함하는 장치를 귀 내시경 촬영 장치로 마련하여 환자(귀 내부 영상 촬영 대상자)의 외이도로 삽입되어 고막을 촬영하고, 촬영된 영상을 이미지 파일로 저장할 수 있다.In addition, the tympanic membrane imaging unit 110 is equipped with an ear endoscopic imaging device including a lighting device and an imaging device having a diameter of about 1 mm to 3 mm, and is inserted into the external auditory canal of a patient (subject to capture images inside the ear). You can photograph the eardrum and save the captured video as an image file.

여기서, 상기 고막 영상부(110)는, 귀 내시경 촬영 장치를 제어하는 제어기사 또는 의사의 제어에 대응하여 촬영된 환자의 귀 내부 영상에 대해 이미지 파일로의 생성 여부를 결정할 수 있다.Here, the eardrum imaging unit 110 may determine whether to create an image file for the image inside the patient's ear captured in response to the control of the control engineer or doctor controlling the ear endoscopic imaging device.

한편, 상기 고막 영상부(110)는, 히스토그램 생성부(미도시) 및 고장 진단부(미도시)를 더 포함할 수 있다.Meanwhile, the eardrum imaging unit 110 may further include a histogram generator (not shown) and a fault diagnosis unit (not shown).

상기 히스토그램 생성부(미도시)는, 귀 내시경 촬영 장치를 이용하여 수집한 환자의 고막 영상인 이미지 파일에 대한 픽셀 당 색감 분포(RGB 색상코드값 등), 콘트라스트(Contrast), 밝기(Brightness), 전체 픽셀 수 등의 이미지 특성에 대한 히스토그램 분포 데이터를 생성할 수 있다.The histogram generator (not shown) calculates the color distribution (RGB color code value, etc.), contrast, brightness, and Histogram distribution data for image characteristics such as the total number of pixels can be generated.

상기 고장 진단부(미도시)는, 상기 히스토그램 생성부(미도시)에서 생성된 고막 영상의 이미지 히스토그램 분포 데이터를 분석하여 신뢰도를 판단하되, 하기 [수학식 1]에 의해 산출되는 평균값(Aerr)이 기설정된 한계값(Serr)보다 큰 경우, 귀 내시경 촬영 장치 및 상기 귀 내시경 촬영 장치로부터 촬영된 고막 영상에 오류가 발생한 것으로 판단할 수 있다.The fault diagnosis unit (not shown) determines reliability by analyzing the image histogram distribution data of the eardrum image generated by the histogram generator (not shown), and determines the reliability by calculating the average value (A err ) is greater than the preset threshold value (S err ), it may be determined that an error has occurred in the ear endoscope imaging device and the eardrum image captured from the ear endoscopic imaging device.

[수학식 1][Equation 1]

여기서, Aerr은 상기 고막 영상의 이미지 히스토그램 분포 데이터의 평균오차, Taver는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체평균, Paver는 상기 고막 영상 이미지 n개에 대한 히스토그램 분포 데이터의 일부평균, Tσ는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체표준편차를 의미할 수 있다.Here, A err is the average error of the image histogram distribution data of the eardrum image, T aver is the overall average of the image histogram distribution data of the eardrum image, P aver is the partial average of the histogram distribution data for the n eardrum image images, T σ may mean the overall standard deviation of image histogram distribution data of the eardrum image.

보다 상세하게는, Taver는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체 평균이며, 기설정된 기간동안(ex. 한 달) 생성된 단일 고막 영상 이미지에 대하여 생성된 히스토그램 분포 데이터의 전체 평균을 산출한 값을 의미하고, Tσ는 상기 기설정된 기간동안(ex. 한 달) 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체표준편차를 산출한 값을 의미한다.More specifically, T aver is the overall average of the image histogram distribution data of the eardrum image, and calculates the overall average of the histogram distribution data generated for a single eardrum image image generated during a preset period (ex. one month). means a value, and T σ means a value calculated from the total standard deviation of the image histogram distribution data of the eardrum image during the preset period (ex. one month).

또한, Paver는 기설정된 기간동안(ex. 한 달) 생성된 고막 영상 이미지 중 n개의 진단 고막 영상 이미지에 대한 히스토그램 분포 데이터의 일부평균이며, 상기 영상촬영부(112)의 귀 내시경 촬영 장치로부터 촬영된 미진단 고막 영상 데이터를 수집하는 과정에서 기설정된 수(n개)의 진단 고막 영상 이미지에 대한 히스토그램 분포 데이터를 생성하고, 상기 기설정된 수(n개)의 진단 고막 영상에 대한 히스토그램 분포 데이터의 평균을 산출한 것으로서, 일부 히스토그램 분포 데이터의 평균에 해당하므로 일부평균이라 지칭할 수 있다.In addition, P aver is a partial average of the histogram distribution data for n diagnostic eardrum image images among the eardrum image images generated during a preset period (ex. one month), and is obtained from the ear endoscope imaging device of the image capture unit 112. In the process of collecting captured undiagnosed eardrum image data, histogram distribution data for a preset number (n) of diagnostic eardrum image images is generated, and histogram distribution data for the preset number (n) of diagnostic eardrum images are generated. The average is calculated and can be referred to as a partial average because it corresponds to the average of some histogram distribution data.

이 때, 일부평균을 이용하여 95%의 신뢰도로 추정평균값을 산출하면, 추정평균값(μ)은 범위를 갖게 된다.At this time, if the estimated average value is calculated with 95% confidence using partial averages, the estimated average value (μ) is It has a range.

따라서, 추정평균값(μ)의 상한 또는 하한과 전체평균(Taver)과의 차이값인 평균오차(Aerr)는, 상기 [수학식 1]과 같이 산출될 수 있다.Therefore, the average error (A err ), which is the difference between the upper or lower limit of the estimated average value (μ) and the overall average (T aver ), can be calculated as in [Equation 1] above.

그러므로, 상기 [수학식 1]에 의해 산출되는 평균오차(Aerr)가 기설정된 한계오차(Serr)보다 크다는 것은 상기 미진단 고막 영상 수집부(111)를 통해 수집되는 미진단 고막 영상 영상이 귀 내시경 촬영 장치 등의 고장으로 잘못 입력되고 있을 가능성이 매우 높음을 의미하므로, 상기 고장 진단부(미도시)는 상기 조건이 만족되면 상기 영상촬영부(112)를 통해 수집되는 상기 미진단 고막 영상 데이터를 신뢰할 수 없는 것으로 판단하여 사용자에게 표시할 수 있다.Therefore, the fact that the average error (A err ) calculated by [Equation 1] is greater than the preset limit error (S err ) means that the undiagnosed eardrum image collected through the undiagnosed eardrum image collection unit 111 is Since it means that there is a very high possibility that the input is incorrect due to a failure of the ear endoscope imaging device, etc., the failure diagnosis unit (not shown) collects the undiagnosed eardrum image through the image capture unit 112 when the above conditions are satisfied. Data can be judged as unreliable and displayed to the user.

한편, 고장 진단부(미도시)는 상기 미진단 고막 영상 데이터에 오류가 있는지 판단하기 위해 상기 [수학식 1]에 의해 산출되는 평균값(Aerr)과 기설정된 한계값(Serr)을 비교하는 것과 동시에 미진단 고막 영상 수집부(111)의 귀 내시경 촬영 장치에 온도를 측정하는 온도센서를 조명장치에 마련하여 사용자가 귀 내시경 촬영 시 귀 내시경 촬영 장치의 온도를 측정하여 측정된 온도가 기설정된 범위를 벗어나는지 여부, 상기 온도센서로부터 수집된 온도 데이터가 기설정된 구간크기 내에서 주기적으로 반복되는 패턴을 보이는지 여부, 미진단 고막 영상 수집부(111)의 귀 내시경 촬영 장치 주변의 습도를 측정하는 습도센서를 더 마련하여 측정된 습도가 기설정된 범위를 벗어나는지 여부, 온도 센서 또는 습도 센서가 귀 내시경 촬영 시 조명장치가 켜졌을 때만 동작된다는 조건 하에 상기 온도 센서 또는 습도 센서의 동작시간과 비동작시간의 비율을 분석하여 상기 비율이 기설정된 비율범위를 벗어나는지 여부 등을 판단하여, 상기 조건들이 적어도 하나 이상 만족되는 경우에 귀 내시경 촬영 장치에 고장이 발생한 것으로 판단하여 해당 장치에서 촬영된 고막 영상 데이터에도 오류가 발생한 것으로 판단할 수 있다.Meanwhile, the fault diagnosis unit (not shown) compares the average value (A err ) calculated by [Equation 1] and a preset threshold value (S err ) to determine whether there is an error in the undiagnosed eardrum image data. At the same time, a temperature sensor that measures the temperature in the ear endoscope imaging device of the undiagnosed eardrum image collection unit 111 is provided in the lighting device so that the user can measure the temperature of the ear endoscope imaging device during ear endoscopy, and the measured temperature is set to the preset temperature. Whether it is out of range, whether the temperature data collected from the temperature sensor shows a periodically repeating pattern within the preset section size, and measuring the humidity around the ear endoscope imaging device of the undiagnosed eardrum image collection unit 111 A humidity sensor is further provided to determine whether the measured humidity is outside the preset range, and the operation time and non-operation of the temperature sensor or humidity sensor under the condition that the temperature sensor or humidity sensor operates only when the lighting device is turned on during ear endoscopy. By analyzing the ratio of time, it is determined whether the ratio is outside the preset ratio range. If at least one of the above conditions is satisfied, it is determined that a malfunction has occurred in the ear endoscope imaging device, and the eardrum image captured by the device is determined. It may be determined that an error has occurred in the data.

다음으로, 상기 귀 내시경 촬영 장치에 마련된 온도 센서에 오류가 있는지 판단하여 고장진단을 수행하는 경우, 상기 온도 센서가 기설정된 구간크기 내에서 주기적으로 반복되는 패턴을 보이는지 여부를 모니터링할 수 있는데, 이는 미진단 고막 영상 수집부(111)의 귀 내시경 촬영 장치에 이물질이 유입된 경우, 유입된 이물질에 의해 기설정된 구간크기 내에서 온도 센서의 온도 측정값이 반복적으로 특정 패턴으로 출력될 수 있다는 기술적 원리를 이용한 것이다. 이때, 상기 기설정된 구간크기는, 아래 [수학식 2]에 따라 결정될 수 있다.Next, when performing fault diagnosis by determining whether there is an error in the temperature sensor provided in the ear endoscope imaging device, it is possible to monitor whether the temperature sensor shows a pattern that is periodically repeated within a preset section size, which is The technical principle is that when a foreign substance enters the ear endoscope imaging device of the undiagnosed eardrum image collection unit 111, the temperature measurement value of the temperature sensor can be repeatedly output in a specific pattern within a preset section size due to the injected foreign substance. is used. At this time, the preset section size can be determined according to [Equation 2] below.

[수학식 2][Equation 2]

Arange = {(Taver + Dmax) - (Taver - Dmax)}*0.3A range = {(T aver + D max ) - (T aver - D max )}*0.3

Arange는 기설정된 구간크기이고, Taver는 기설정된 기간동안의 전체 평균이며, Dmax는 기설정된 기간동안의 최대편차를 의미한다.A range is the preset section size, T aver is the overall average during the preset period, and D max means the maximum deviation during the preset period.

일례로, 기설정된 기간동안의 전체 평균이 70이고 최대편차가 20이라면 Arange는 12가 되므로, 최대값과 최소값의 차가 12를 넘지 않는 범위에서 주기적으로 반복되는 값이 출력(ex. 52, 62, 52, 62, 53, 62, 52, 63 등과 같은 유사한 값들이 반복 출력)된다면 이는 미진단 고막 영상 수집부(111)의 귀 내시경 촬영 장치에 이물질이 유입되어 온도 센서에 오류가 발생한 것으로 추정할 수 있다.For example, if the overall average during the preset period is 70 and the maximum deviation is 20, the A range is 12, so periodically repeating values are output in the range where the difference between the maximum and minimum values does not exceed 12 (ex. 52, 62 , 52, 62, 53, 62, 52, 63, etc.), it can be assumed that a foreign substance has entered the ear endoscope imaging device of the undiagnosed eardrum image collection unit 111 and an error has occurred in the temperature sensor. You can.

다음으로, 미진단 고막 영상 수집부(111)의 습도를 측정하여 측정된 습도가 기설정된 값을 초과하였는지 여부를 판단하기 위해서는, 상기 미진단 고막 영상 수집부(111)와 기설정된 거리 내에 습도센서를 별도로 마련하고, 상기 습도센서를 통해 미진단 고막 영상 수집부(111)의 습도를 실시간 모니터링할 수 있다. 이는, 미진단 고막 영상 수집부(111)에 수분이 유입된 경우에는 비정상 동작한다는 기술적 원리를 이용하는 것이며, 습도가 기설정된 값을 초과했다면 미진단 고막 영상 수집부(111)에 수분이 유입된 것으로 추측할 수 있다. 따라서 이 경우는 미진단 고막 영상 수집부(111)에 오류가 발생한 것으로 판단할 수 있고, 이는 곧 촬영된 미진단 고막 영상 데이터에 오류가 발생한 것으로 추정할 수 있다.Next, in order to measure the humidity of the undiagnosed eardrum image collection unit 111 and determine whether the measured humidity exceeds a preset value, a humidity sensor is installed within a preset distance from the undiagnosed eardrum image collection unit 111. is provided separately, and the humidity of the undiagnosed eardrum image collection unit 111 can be monitored in real time through the humidity sensor. This uses the technical principle that if moisture flows into the undiagnosed eardrum image collection unit 111, it operates abnormally. If the humidity exceeds a preset value, it is considered that moisture has flowed into the undiagnosed eardrum image collection unit 111. You can guess. Therefore, in this case, it can be determined that an error has occurred in the undiagnosed eardrum image collection unit 111, which can be inferred to have occurred in the captured undiagnosed eardrum image data.

마지막으로, 미진단 고막 영상 수집부(111)의 귀 내시경 촬영 장치의 동작시간과 비동작시간의 비율을 분석하여 상기 비율이 기설정된 비율범위를 벗어나는지 여부 등을 판단할 수 있으며, 그 결과에 따라 상기 고막 영상 데이터에 오류가 발생한 것으로 판단할 수 있다.Finally, by analyzing the ratio of the operating time and non-operating time of the ear endoscope imaging device of the undiagnosed eardrum image collection unit 111, it is possible to determine whether the ratio is outside the preset ratio range, and the results are Accordingly, it may be determined that an error has occurred in the eardrum image data.

일례로, 현장에 설치된 미진단 고막 영상 수집부(111)가 고막 영상 촬영을 위해 사용자(영상 촬영 기사 또는 의사 등)가 귀 내시경 촬영 장치가 위치한 걸이에 근접센서를 마련하여 걸이로부터 감지가 안되는 시점을 동작시간으로, 감지가 되는 시점을 비동작시간으로 인식했을 때, 최소 1개월간 하루 평균 동작시간과 비동작 시간의 비율이 10:1 내지 9:1로 기록되었으나, 실시간 모니터링을 통해 분석한 결과 그 비율이 1:10 내지 1:9로 역전되거나 현저히 다른 비율(ex. 5:5 등의 비율변화)로 변화했다면 귀 내시경 촬영장치의 오동작 또는 귀 내시경 촬영장치의 걸이에 위치한 근접센서에 오류가 발생한 것으로 판단할 수 있다.For example, the point at which the undiagnosed eardrum image collection unit 111 installed in the field cannot be detected from the hook by providing a proximity sensor to the hook where the ear endoscope imaging device is located by the user (videographer or doctor, etc.) to capture the eardrum image. When the detection point was recognized as the operating time and the point of detection as the non-operating time, the ratio of the average daily operating time to the non-operating time for at least one month was recorded as 10:1 to 9:1, but as a result of analysis through real-time monitoring, If the ratio is reversed from 1:10 to 1:9 or changes to a significantly different ratio (ex. 5:5, etc.), there may be a malfunction of the ear endoscope imaging device or an error in the proximity sensor located on the hook of the ear endoscope imaging device. It can be judged that it has occurred.

상기와 같이, 본 발명의 일실시례에서 고장 진단부(미도시)는 다수의 고장진단방법을 모두 고려하여 상기 귀 내시경 촬영 장치 및 귀 내시경 촬영 장치에 마련된 센서의 오류여부를 판단할 수 있으며, 아래 [수학식 3]과 같이 다수의 고장진단방법을 모두 반영한 Stotal값으로 최종 판단될 수도 있다.As described above, in one embodiment of the present invention, the fault diagnosis unit (not shown) can determine whether there is an error in the ear endoscopic imaging device and the sensor provided in the ear endoscopic imaging device by considering all of the multiple fault diagnosis methods, The final judgment may be made as the S total value that reflects all of the multiple fault diagnosis methods as shown in [Equation 3] below.

[수학식 3][Equation 3]

Stotal = W1*Raver + W2*Rtem + W3*Rrep + W4*Rhum + W5*Rrat S total = W1*R aver + W2*R tem + W3*R rep + W4*R hum + W5*R rat

여기서, Stotal은 다수의 오류판단값의 합산값, Raver은 [수학식 1]에 의해 산출되는 평균값(Aerr)과 기설정된 한계값(Serr)을 비교하여 도출한 오류판단값(오류 여부에 따라 0과 1중 하나의 값), Rtem은 온도가 기설정된 범위를 벗어나지 여부에 따라 오류여부를 판단한 값(오류 여부에 따라 0과 1중 하나의 값), Rrep은 반복 패턴이 나타나는지 여부에 따라 오류여부를 판단한 값(오류 여부에 따라 0과 1중 하나의 값), Rhum은 습도가 기설정된 범위를 벗어나지 여부에 따라 오류여부를 판단한 값(오류 여부에 따라 0과 1중 하나의 값), Rrat은 동작시간과 비동작시간의 비율을 분석하여 오류여부를 판단한 값(오류 여부에 따라 0과 1중 하나의 값), W1은 Raver항목 가중치, W2는 Rtem항목 가중치, W3은 Rrep항목 가중치, W4는 Rhum항목 가중치, W5는 Rrat 항목 가중치를 각각 의미한다.Here, S total is the sum of multiple error judgment values, and R aver is the error judgment value ( error A value between 0 and 1 depending on whether the temperature is outside the preset range), R tem is a value that determines whether there is an error depending on whether the temperature is outside the preset range (a value between 0 and 1 depending on whether there is an error), R rep is a value that determines whether there is an error depending on whether a repeating pattern appears (a value between 0 and 1 depending on whether there is an error), and R hum is a value that determines whether there is an error depending on whether the humidity is outside the preset range (error or not). one of 0 and 1 depending on), R rat is the value determined for error by analyzing the ratio of operating time and non-operating time (either 0 or 1 depending on whether there is an error), W1 is the R aver item weight, W2 is the R tem item weight, and W3 is R. Rep item weight, W4 means R hum item weight, and W5 means R rat item weight, respectively.

예를 들어, Stotal가 4 이상이라면 귀 내시경 촬영 장치에 오류가 있는 것으로 사전 설정할 수 있고, 발열온도가 매우 중요한 파라미터인 경우이라면 W2를 3으로 사전 설정하고, W1, W3, W4, W5는 모두 1으로 사전 설정할 수 있다.For example, if S total is 4 or more, it can be preset to indicate that there is an error in the ear endoscope imaging device. If the fever temperature is a very important parameter, W2 can be preset to 3, and W1, W3, W4, and W5 are all set to 3. Can be preset to 1.

이러한 조건에서 상기 다수의 고장진단방법에 따라 오류여부를 모니터링한 결과, Raver는 1, Rtem은 1, Rrep는 0, Rhum은 0, Rrat은 0으로 도출되었다면, Stotal는 4가 되므로, 상기 귀 내시경 촬영 장치에는 오류가 있는 것으로 최종 판단할 수 있다.Under these conditions, as a result of monitoring errors according to the above multiple fault diagnosis methods, if R aver is 1, R tem is 1, R rep is 0, R hum is 0, and R rat is 0, then S total is 4. Therefore, it can be finally determined that there is an error in the ear endoscope imaging device.

다시 도 1을 참고하면, 상기 레이블 생성부(120)는, 상기 고막 영상부(110)에서 분류한 진단 고막 영상에 대응하는 질병명 및 청력 수치를 레이블로 생성할 수 있다.Referring again to FIG. 1, the label generator 120 may generate a label with the disease name and hearing value corresponding to the diagnostic eardrum image classified by the eardrum imaging unit 110.

여기서, 상기 레이블은 상기 미진단 고막 영상을 진단하기 위한 '답' 또는 '결과'의 의미로 외부로부터 수집되어 진단이 완료된 각 진단 고막 영상에 대응되는 질병명과 청력 수치를 하나의 정답 그룹으로 정의하는 것을 의미할 수 있다.Here, the label means 'answer' or 'result' for diagnosing the undiagnosed eardrum image, and defines the disease name and hearing value corresponding to each diagnostic eardrum image collected from outside and for which diagnosis has been completed as one correct answer group. It can mean something.

이때, 상기 미진단 고막 영상의 경우는, 진단이 되지 않았으므로 해당하는 레이블 생성 대상에서 제외될 수 있다.At this time, in the case of the undiagnosed eardrum image, since it has not been diagnosed, it may be excluded from the target for creating the corresponding label.

일례로, 상기 제1 진단 고막 영상(510)은 '난청', '51dBHL'의 질병명과 청력 수치를 가지는 레이블로 생성될 수 있다.For example, the first diagnostic eardrum image 510 may be created with a label having the disease name and hearing value of 'hearing loss' and '51dBHL'.

한편, 상기 레이블 생성부(120)는, 사용자 또는 고막 분류 작업자가 고막 영상 내 고막 영역을 구분한 영역을 고막 영역 레이블로 더 생성할 수 있다.Meanwhile, the label generator 120 may further generate an area where a user or an eardrum classification worker divides the eardrum area in the eardrum image as an eardrum area label.

또한, 상기 레이블 생성부(120)는, 상기 벡터변환부(140)에서 벡터 변환된 진단 고막 벡터와 이에 해당하는 질병명, 청력수치를 레이블로 생성할 수 있다.Additionally, the label generation unit 120 may generate the diagnostic eardrum vector converted into a vector in the vector conversion unit 140, the corresponding disease name, and hearing level as a label.

상기 고막 영역 추출부(130)는, 상기 고막 영상에서 고막 부위를 인식하여 기설정된 고막 영역으로 추출할 수 있다.The eardrum area extractor 130 may recognize the eardrum area in the eardrum image and extract it as a preset eardrum area.

여기서, 상기 고막 영역 추출부(130)는, 상기 도 3을 참고하여 더욱 상세히 설명한다.Here, the eardrum area extractor 130 will be described in more detail with reference to FIG. 3 .

상기 도 3을 참고하면, 상기 고막 영역 추출부(130)는, 고막 인식부(131), 관심영역 추출부(132) 및 고막 중심부 영역 추출부(133)를 포함할 수 있다.Referring to FIG. 3, the eardrum area extractor 130 may include an eardrum recognition unit 131, a region of interest extractor 132, and an eardrum central area extractor 133.

또한, 상기 기분류된 고막 영역은, 상기 고막 영상에 대하여 상기 관심영역 추출부(132)에서 추출한 관심 영역 또는 상기 고막 중심부 영역 추출부(133)에서 추출한 고막 중심부 영역을 의미할 수 있다.Additionally, the undisturbed eardrum area may mean a region of interest extracted by the region of interest extractor 132 or a central area of the eardrum extracted by the eardrum central area extractor 133 with respect to the eardrum image.

상기 고막 인식부(131)는, 상기 고막 영상부(110)에서 수집한 고막 영상에서 고막 영역을 인식할 수 있다.The eardrum recognition unit 131 may recognize the eardrum area in the eardrum image collected by the eardrum imaging unit 110.

여기서, 상기 고막 영상은 미진단 고막 영상 및 진단 고막 영상을 전부 포함하는 고막 영상을 의미할 수 있다.Here, the eardrum image may mean an eardrum image including both a non-diagnosed eardrum image and a diagnostic eardrum image.

한편, 상기 고막 인식부(131)는, 상기 고막 영상부(110)에서 수집한 진단 고막 영상 중 상기 레이블 생성부(120)에서 고막 영역으로 구분하여 레이블링된 영역 정보를 기반으로 딥러닝(Deep Learning) 알고리즘 중 하나인 컨벌루젼 신경망(Convolutional Neural Network, CNN)을 이용하여 고막 영역 객체를 인식 및 학습 후 상기 미진단 고막 영상 내 포함된 고막 영역을 인식할 수 있다.Meanwhile, the eardrum recognition unit 131 performs deep learning based on area information labeled by dividing the diagnostic eardrum images collected by the eardrum imaging unit 110 into eardrum areas in the label generator 120. ) After recognizing and learning the eardrum area object using a convolutional neural network (CNN), one of the algorithms, the eardrum area included in the undiagnosed eardrum image can be recognized.

상기 관심영역 추출부(132)는, 상기 고막 영상부(131)에서 수집한 고막 영상에서 고막 영역을 인식하고, 상기 고막 영역을 허프 원 변환(Hough Circle Transform) 처리 기술을 이용하여 추출한 원형 영역을 관심 영역(Region Of Interest)으로 추출할 수 있다.The region of interest extraction unit 132 recognizes the eardrum area in the eardrum image collected by the eardrum imaging unit 131, and creates a circular area extracted from the eardrum area using Hough Circle Transform processing technology. It can be extracted by Region Of Interest.

보다 상세하게는, 상기 관심영역 추출부(132)는, 상기 고막 인식부(131)에서 인식된 고막 영역을 허프 원 변환(Hough Circle Transform) 처리를 통해 고막 영역에 해당하는 픽셀 값을 이용하여 원의 중심 좌표와 반지름 정보를 검출할 수 있다.More specifically, the region of interest extractor 132 processes the eardrum area recognized by the eardrum recognition unit 131 into a circle using the pixel value corresponding to the eardrum area through Hough Circle Transform processing. The center coordinates and radius information can be detected.

이를 통해, 상기 관심영역 추출부(132)는, 빠른 속도와 보다 정확한 검출률로 검출된 원을 관심 영역(Region Of Interest)으로 추출할 수 있다.Through this, the region of interest extractor 132 can extract the detected circle as a region of interest at a faster speed and more accurate detection rate.

또한, 상기 고막 영상부(110)를 통해 수집된 고막 영상의 전체 영상 내 각 픽셀에 대한 RGB 색상코드값을 산출하고, 각 픽셀과 인접한 4개의 픽셀 중 3개 픽셀 이상의 RGB 색상코드값이 기설정된 범위 내 포함되는 경우, 삭제 대상으로 판단할 수 있다.In addition, the RGB color code value for each pixel in the entire image of the eardrum image collected through the eardrum imaging unit 110 is calculated, and the RGB color code value of three or more pixels among the four pixels adjacent to each pixel is preset. If it is included within the scope, it may be judged to be subject to deletion.

여기서, 상기 고막 영상 내 RGB 색상코드값의 기설정된 범위는 각 픽셀의 RGB 색상코드값에 대하여 빨강(R)의 값이 0 내지 10, 녹색(G)의 값이 0 내지 10, 파랑(B)의 값이 0 내지 10의 범위로 측정되는 경우를 의미할 수 있다.Here, the preset range of the RGB color code value in the eardrum image is 0 to 10 for red (R), 0 to 10 for green (G), and 0 to 10 for blue (B) for the RGB color code value of each pixel. This may mean that the value is measured in the range of 0 to 10.

일례로, 상기 고막 영상은, 중심부를 기준하여 정사각형 크기의 영상으로 수집되었으나, 중심을 기준하여 특정 위치의 끝 모서리 지점부터 픽셀의 RGB 색상코드값을 산출하여 (0, 2, 7), (2, 0, 5), (3, 3, 10), (10, 10, 10), (13, 20, 5), (80, 0, 53) 으로 산출되는 경우, 상기 RGB 색상코드값이 산출된 픽셀 중 빨강, 초록, 파랑 어느 하나의 색상코드값도 10을 초과하지 못하는 (0, 2, 7), (2, 0 5), (3, 3, 10), (10, 10, 10)에 해당하는 픽셀을 삭제 대상으로 판단할 수 있다. 여기서, 상기 삭제 대상 픽셀로 분류된 픽셀과 인접한 4개의 픽셀 중 3개 픽셀이상이 삭제 대상 픽셀인 경우 자동으로 삭제하여 관심영역으로 추출하는 방법을 사용할 수 있다.For example, the eardrum image was collected as a square-sized image based on the center, but the RGB color code value of the pixel was calculated from the end corner of a specific location based on the center to (0, 2, 7), (2). , 0, 5), (3, 3, 10), (10, 10, 10), (13, 20, 5), (80, 0, 53), the RGB color code value is calculated Among the pixels, the color code value of any one of red, green, and blue does not exceed 10 (0, 2, 7), (2, 0 5), (3, 3, 10), (10, 10, 10). The corresponding pixel can be determined as a target for deletion. Here, if three or more pixels among the four pixels adjacent to the pixel classified as the pixel to be deleted are target pixels, a method of automatically deleting them and extracting them as a region of interest can be used.

상기 고막 중심부 영역 추출부(133)는, 상기 관심영역 추출부(132)에서 추출한 관심 영역 내 고막 위치를 기준하여 기설정된 영역을 고막 중심부 영역으로 추출할 수 있다.The eardrum center area extractor 133 may extract a preset area as the eardrum center area based on the eardrum location within the region of interest extracted by the interest region extractor 132.

여기서, 상기 기설정된 영역은, 상기 고막 위치를 기준하여 기설정된 크기로 설정한 영역을 의미하며, 사용자의 설정에 따라 영역의 크기가 달라질 수 있으며 픽셀 개수를 기준하여 가로 최대 픽셀 수는 70px이하, 세로 최대 픽셀 수는 80px이하로 설정할 수 있다.Here, the preset area refers to an area set to a preset size based on the position of the eardrum. The size of the area may vary depending on the user's settings, and the maximum horizontal pixel number is 70px or less based on the number of pixels. The maximum number of vertical pixels can be set to 80px or less.

이때, 상기 사용자가 설정한 영역의 크기보다 상기 고막 영역이 더 큰 경우 인식된 상기 고막 영역이 다 들어가는 최소 크기로 자동 산출되어 고막 중심부 영역으로 설정될 수 있다.At this time, if the eardrum area is larger than the size of the area set by the user, the minimum size that fits the recognized eardrum area may be automatically calculated and set as the central area of the eardrum.

즉, 상기 고막 중심부 영역 추출부(133)는 상기 관심영역 추출부(132)에서 추출한 관심 영역에서 고막 영역을 중심으로 더 작은 크기의 고막 중심부 영역을 추출할 수 있다.That is, the eardrum central region extractor 133 may extract a smaller eardrum central region centered on the eardrum region from the region of interest extracted by the region of interest extractor 132.

여기서, 상기 고막 중심부 영역은 일반적으로 사각형 형태의 이미지로 추출할 수 있다.Here, the central area of the eardrum can be extracted as a generally square-shaped image.

상기 고막 영역 추출부(130)가 상기 고막 영상부(110)에서 진단 고막 영상 및 미진단 고막 영상을 이용하여 고막 중심부 영역을 추출하는 과정을 상기 도 4를 참고하여 더욱 상세히 설명한다.The process by which the eardrum region extractor 130 extracts the central region of the eardrum using the diagnostic eardrum image and the non-diagnosed eardrum image from the eardrum imaging unit 110 will be described in more detail with reference to FIG. 4 .

상기 도 4를 참고하면, 상기 고막 영역 추출부(130)가 상기 고막 영상부(110)에서 수집한 고막 영상(410)에서 상기 고막 인식부(131)을 이용하여 고막 영역을 인식할 수 있다. 이때, 상기 관심영역 추출부(132)를 통해 고막으로 인식된 영역 중심으로부터 일정 픽셀 개수를 반지름으로 하는 원 영역으로 추출하거나, 상기 고막 영상(410)에서 RGB 각 색상코드 값이 3색상 코드 전부 10이하인 영역을 제외하여 상기 고막 영상(410) 내 관심 영역 영상(420)을 추출할 수 있다. 이후, 상기 고막 중심부 영역 추출부(133)에서 상기 고막 인식부(131)에서 인식한 고막 영역을 기준하여 가로 최대 픽셀 수 70px, 세로 최대 픽셀 수 80px 이하의 사용자가 설정한 픽셀 수에 대응하는 크기의 사각형 영상으로 고막 중심부 영역을 추출하되, 상기 사용자가 설정한 픽셀 수가 너무 작아 인식된 고막 영역이 크기를 초과하는 경우, 상기 인식된 고막 영역이 포함되는 최소 크기의 사각형 영역으로 고막 중심부 영역(430)을 추출할 수 있다.Referring to FIG. 4, the eardrum area extraction unit 130 may recognize the eardrum area in the eardrum image 410 collected by the eardrum imaging unit 110 using the eardrum recognition unit 131. At this time, a circular area with a radius of a certain number of pixels is extracted from the center of the area recognized as the eardrum through the region of interest extractor 132, or each RGB color code value in the eardrum image 410 is 10 for all three color codes. The region of interest image 420 within the eardrum image 410 can be extracted by excluding the following region. Afterwards, the eardrum center area extractor 133 generates a size corresponding to the number of pixels set by the user with a maximum horizontal pixel count of 70px and a vertical maximum pixel count of 80px based on the eardrum area recognized by the eardrum recognition unit 131. The eardrum center area is extracted from a square image, but if the number of pixels set by the user is too small and the recognized eardrum area exceeds the size, the eardrum center area 430 is converted to a rectangular area of the minimum size containing the recognized eardrum area. ) can be extracted.

다시 도 1을 참고하면, 상기 벡터변환부(140)는, 고막 영역 추출부(130)에서 추출한 고막 영역을 전역 평균 풀링(Global Average Pooling)을 이용하여 미진단 고막 벡터로 변환할 수 있다.Referring again to FIG. 1, the vector conversion unit 140 may convert the eardrum region extracted by the eardrum region extractor 130 into an undiagnosed eardrum vector using global average pooling.

여기서, 상기 전역 평균 풀링을 이용한 벡터 변환 방법은, 도 6을 참고하여 더욱 상세히 설명한다.Here, the vector conversion method using global average pooling will be described in more detail with reference to FIG. 6.

도 6을 참고하면, 전역 평균 풀링은, CNN(Convolutional Neural Network)에서 마지막 층의 출력값을 벡터 형태로 변환하는 기법 중 하나로 출력값 벡터 변환 시 평탄화 작업 없이 변환을 수행할 수 있다.Referring to FIG. 6, global average pooling is one of the techniques for converting the output value of the last layer in a CNN (Convolutional Neural Network) into vector form, and conversion can be performed without flattening when converting the output value vector.

이를 통해, 전역 평균 풀링은 출력값의 공간적인 정보를 보존하면서 벡터 형태로 변환하여 추출한 고막 영역을 미진단 고막 벡터로 분류 및 변환할 수 있다.Through this, global average pooling can classify and convert the extracted eardrum area into an undiagnosed eardrum vector by converting it into vector form while preserving the spatial information of the output value.

즉, 상기 벡터변환부(140)는, 고막 영역 추출부(130)에서 추출한 고막 영역 채널의 특징들을 모두 평균내어 1차원의 벡터로 압축할 수 있다. That is, the vector conversion unit 140 can average all the characteristics of the eardrum area channel extracted by the eardrum area extractor 130 and compress them into a one-dimensional vector.

이때, 상기 벡터변환부(140)에서 벡터로 변환되는 영역은, 상기 고막 영역 추출부(130)에서 추출한 고막 중심부 영역 중 진단되지 않은 고막 중심부 영역을 의미할 수 있다.At this time, the area converted into a vector by the vector conversion unit 140 may mean an undiagnosed central area of the eardrum among the central areas of the eardrum extracted by the eardrum area extractor 130.

여기서, 상기 벡터변환부(140)는, 상기 미진단 고막 중심부 영역인 진단 대상자의 고막 영상을 1차원 벡터로 변환 후 채널별로 평균값을 추출하여 질병 진단 시 과적합(Over Fitting)을 방지하고 파라미터(Parameter)를 감소시켜 빠른 속도의 계산 수행을 유도할 수 있다.Here, the vector conversion unit 140 converts the image of the patient's eardrum, which is the central area of the undiagnosed eardrum, into a one-dimensional vector and extracts the average value for each channel to prevent overfitting when diagnosing a disease and converts the parameters ( Parameters) can be reduced to lead to faster calculation performance.

한편, 상기 벡터변환부(140)는 상기 진단 고막 영상으로부터 고막 중심부 영역인 진단 고막 중심부 영역을 벡터로 변환할 수 있다.Meanwhile, the vector conversion unit 140 can convert the diagnostic eardrum center area, which is the eardrum center area, from the diagnostic eardrum image into a vector.

상기 질병진단부(150)는, 소프트맥스(Softmax) 활성화 함수 및 몬테카를로 드롭아웃(Monte Carlo Dropout)을 이용하여 상기 벡터변환부(140)에서 변환된 상기 미진단 고막 벡터의 질병 진단을 수행할 수 있다.The disease diagnosis unit 150 can perform disease diagnosis of the undiagnosed tympanic membrane vector converted in the vector conversion unit 140 using a Softmax activation function and Monte Carlo Dropout. there is.

보다 상세하게는, 상기 질병진단부(150)는, 상기 벡터변환부(140)에서 변환되어 입력받은 상기 미진단 고막 벡터의 값을 소프트맥스 활성화 함수를 이용하여 총합이 1이 되도록 정규화 출력하여 확률로 표현할 수 있다.More specifically, the disease diagnosis unit 150 normalizes the value of the undiagnosed eardrum vector converted and input from the vector conversion unit 140 so that the total is 1 using a softmax activation function, and outputs the probability. It can be expressed as

이때, 정규화 출력된 미진단 고막 벡터와 상기 레이블 생성부(120)에서 생성한 다수 개의 진단 고막 벡터에 대응하는 고막 질병 레이블을 비교하여 확률이 가장 높은 질병명에 따라 질병진단을 수행할 수 있다.At this time, disease diagnosis can be performed according to the disease name with the highest probability by comparing the normalized output undiagnosed eardrum vector with the eardrum disease labels corresponding to the plurality of diagnostic eardrum vectors generated by the label generator 120.

한편, 상기 질병진단부(150)는, 질병진단이 수행된 상기 미진단 고막 벡터에 대응하는 질병 레이블의 각 청력 수치를 상기 몬테카를로 드롭아웃 기법을 이용하여 산출할 수 있다.Meanwhile, the disease diagnosis unit 150 may calculate each hearing value of the disease label corresponding to the undiagnosed eardrum vector for which disease diagnosis was performed using the Monte Carlo dropout technique.

여기서, 상기 몬테카를로 드롭아웃 기법은 상기 소프트맥스 함수를 통해 산출된 출력에 대하여 불확실성을 추정하기 위해 베이지안 신경망을 사용하여 예측 분포를 추론하는 기법을 의미할 수 있다.Here, the Monte Carlo dropout technique may refer to a technique of inferring a prediction distribution using a Bayesian neural network to estimate uncertainty about the output calculated through the softmax function.

특히, 상기 질병진단부(150)는 상기 몬테카를로 드롭아웃 기법을 이용하여 상기 소프트맥스 함수를 통해 미진단 고막 벡터의 불확실성이 크게 나타나는 출력값에서 질병명 산출을 위한 과적합(Overfitting)을 방지하고 불확실성을 반영한 앙상블(Ensemble) 효과를 통한 질병 판단에 대한 성능 향상을 유도할 수 있다.In particular, the disease diagnosis unit 150 uses the Monte Carlo dropout technique to prevent overfitting for calculating the disease name in the output value where the uncertainty of the undiagnosed eardrum vector is large through the softmax function and reflects the uncertainty. Performance improvement in disease determination can be induced through the ensemble effect.

상기와 같은 과정을 통해, 상기 심층신경망과 몬테카를로 드롭아웃을 이용한 고막질병 예측 모델 시스템은 진단 고막 영상 및 미진단 고막 영상을 수집하되, 진단 고막 영상의 경우, 해당 진단 질병명 및 진단 시 수행한 청력 검사 결과를 더 수집하여 진단 고막 영상에 레이블로 생성할 수 있다. 또한, 환자로부터 촬영하여 수집한 미진단 고막 영상 내 고막 부위를 인식하여 고막 영역을 추출하고, 추출한 고막 영역을 벡터로 변환 후 소프트맥스 활성화 함수 및 몬테카를로 드롭아웃을 이용하여 미진단 고막의 질병 진단 및 청력 수치를 산출하여 의료인에게 보조자료로 제공할 수 있다.Through the above process, the eardrum disease prediction model system using the deep neural network and Monte Carlo dropout collects diagnostic eardrum images and undiagnosed eardrum images. In the case of diagnostic eardrum images, the corresponding diagnosis disease name and hearing test performed at the time of diagnosis Results can be further collected and generated as labels on diagnostic eardrum images. In addition, the eardrum area is extracted by recognizing the eardrum area in the undiagnosed eardrum image collected from the patient, and the extracted eardrum area is converted into a vector and softmax activation function and Monte Carlo dropout are used to diagnose and diagnose diseases of the undiagnosed eardrum. Hearing values can be calculated and provided as supplementary data to medical professionals.

본 발명의 일실시례에 따르면, 내시경을 이용하여 촬영한 환자의 귀 내부 영상을 머신러닝을 통해 분석함으로써, 질환 여부와 종류를 판단할 수 있다.According to one embodiment of the present invention, the presence and type of disease can be determined by analyzing images inside the patient's ear taken using an endoscope through machine learning.

또한, 환자의 귀 내부를 촬영하는 귀 내시경 촬영 장치에 다양한 종류의 센서를 통해 수집한 센싱 데이터를 분석하여 고장 여부를 진단함으로써, 고장판단된 촬영장치로부터 수집한 영상을 구별하여 영상 데이터의 신뢰도를 유지시킬 수 있다.In addition, by analyzing the sensing data collected through various types of sensors in the ear endoscopic imaging device that photographs the inside of the patient's ear to diagnose failure, the reliability of the image data can be improved by distinguishing between images collected from imaging devices that have been determined to be malfunctioning. It can be maintained.

또한, 머신러닝 수행 시 몬테카를로 드롭아웃을 사용함으로써, 다수 개의 모델을 사용하여 정확도를 높이는 앙상블(Ensemble) 효과를 만들어 보다 일반화된 결과를 출력할 수 있다.Additionally, by using Monte Carlo dropout when performing machine learning, it is possible to output more generalized results by creating an ensemble effect that increases accuracy by using multiple models.

이상과 같이 본 발명의 일실시례는 비록 한정된 실시례와 도면에 의해 설명되었으나, 본 발명의 일실시례는 상기 설명된 실시례에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서 본 발명의 일실시례는 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, although one embodiment of the present invention has been described with limited examples and drawings, one embodiment of the present invention is not limited to the above-described embodiment, which is based on common knowledge in the field to which the present invention pertains. Anyone who has the knowledge can make various modifications and variations from this description. Accordingly, one embodiment of the present invention should be understood only by the scope of the claims set forth below, and all equivalent or equivalent modifications thereof shall fall within the scope of the spirit of the present invention.

100 : 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템
110 : 고막 영상부
111 : 미진단 고막 영상 수집부
112 : 진단 고막 영상 수집부
113 : 진단 고막 영상 분류부
120 : 레이블 생성부
130 : 고막 영역 추출부
131 : 고막 인식부
132 : 관심영역 추출부
133 : 고막 중심부 영역 추출부
140 : 벡터변환부
150 : 질병진단부
410 : 고막 영상
420 : 관심 영역 영상
430 : 고막 중심부 영역
510 : 제1 진단 고막 영상
520 : 제2 진단 고막 영상
530 : 제3 진단 고막 영상
100: Eardrum disease prediction model system using deep neural network and Monte Carlo dropout
110: eardrum imaging unit
111: Undiagnosed eardrum image collection unit
112: Diagnostic eardrum image collection unit
113: Diagnostic eardrum image classification unit
120: label creation unit
130: eardrum area extraction unit
131: eardrum recognition unit
132: Region of interest extraction unit
133: Eardrum central area extraction unit
140: Vector conversion unit
150: Disease Diagnosis Department
410: Eardrum image
420: Region of interest image
430: Tympanic membrane central area
510: First diagnostic tympanic membrane image
520: Second diagnostic eardrum image
530: Third diagnostic tympanic membrane imaging

Claims (5)

고막 영상의 수집 및 분류를 수행하는 고막 영상부;
상기 고막 영상부에서 분류한 상기 고막 영상에 대응하는 질병명 및 청력 수치를 레이블로 생성하는 레이블 생성부;
상기 고막 영상에서 고막 부위를 인식하여 기설정된 고막 영역으로 추출하는 고막 영역 추출부;
상기 고막 영상 중 진단이 수행되지 않은 미진단 고막 영상에 대응하여 상기 고막 영역 추출부에서 추출한 고막 영역을 전역 평균 풀링(Global Average Pooling)을 이용하여 미진단 고막 벡터로 변환하는 벡터변환부;
소프트맥스(Softmax) 활성화 함수 및 몬테카를로 드롭아웃을 이용하여 상기 벡터변환부에서 변환된 상기 미진단 고막 벡터의 질병 진단을 수행하는 질병진단부;
를 포함하고,
상기 고막 영상부는,
귀 내시경 촬영 장치를 이용하여 수집한 고막 영상의 이미지 히스토그램 분포 데이터를 생성하는 히스토그램 생성부; 및
상기 히스토그램 생성부에서 생성된 고막 영상의 이미지 히스토그램의 분포 데이터를 분석하여 신뢰도를 판단하되, 하기 [수학식 1]에 의해 산출되는 평균값(Aerr)이 기설정된 한계값(Serr)보다 큰 경우, 상기 귀 내시경 촬영 장치 및 상기 고막 영상에 오류가 발생한 것으로 판단하는 고장 진단부;
를 더 포함하는 것을 특징으로 하는 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템.
[수학식 1]

(여기서, Aerr은 상기 고막 영상의 이미지 히스토그램 분포 데이터의 평균오차, Taver는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체평균, Paver는 상기 고막 영상 이미지 n개에 대한 히스토그램 분포 데이터의 일부평균, Tσ는 상기 고막 영상의 이미지 히스토그램 분포 데이터의 전체표준편차를 의미함)
an eardrum imaging unit that collects and classifies eardrum images;
a label generation unit that generates a disease name and hearing value corresponding to the eardrum image classified by the eardrum image unit as a label;
an eardrum area extraction unit that recognizes the eardrum area in the eardrum image and extracts it as a preset eardrum area;
a vector conversion unit that converts the eardrum region extracted by the eardrum region extraction unit in response to an undiagnosed eardrum image for which diagnosis has not been performed among the eardrum images into an undiagnosed eardrum vector using global average pooling;
a disease diagnosis unit that performs disease diagnosis on the undiagnosed eardrum vector converted by the vector conversion unit using a Softmax activation function and Monte Carlo dropout;
Including,
The eardrum imaging unit,
a histogram generator that generates image histogram distribution data of an eardrum image collected using an ear endoscope imaging device; and
Reliability is determined by analyzing the distribution data of the image histogram of the eardrum image generated by the histogram generator, but when the average value (A err ) calculated by [Equation 1] below is greater than the preset threshold value (S err ) , a fault diagnosis unit that determines that an error has occurred in the ear endoscope imaging device and the eardrum image;
An eardrum disease prediction model system using a deep neural network and Monte Carlo dropout, further comprising:
[Equation 1]

(Here, A err is the average error of the image histogram distribution data of the eardrum image, T aver is the overall average of the image histogram distribution data of the eardrum image, and P aver is the partial average of the histogram distribution data for the n eardrum image images. , T σ means the overall standard deviation of the image histogram distribution data of the eardrum image)
제1항에 있어서,
상기 고막 영상부는,
귀 내시경 촬영 장치를 이용하여 촬영된 환자의 미진단 고막 영상을 수집하는 미진단 고막 영상 수집부;
외부로부터 진단이 완료된 환자의 귀 내시경 촬영 영상인 진단 고막 영상, 질병명 및 청력 수치를 수집하는 진단 고막 영상 수집부; 및
상기 진단 고막 영상에 대응되는 질병명 및 청력 수치를 분류하는 진단 고막 영상 분류부;
를 포함하는 것을 특징으로 하는 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템.
According to paragraph 1,
The eardrum imaging unit,
An undiagnosed eardrum image collection unit that collects images of the patient's undiagnosed eardrum captured using an ear endoscope imaging device;
A diagnostic eardrum image collection unit that collects a diagnostic eardrum image, which is an ear endoscopic image of a patient whose diagnosis has been completed from the outside, the name of the disease, and hearing values; and
a diagnostic eardrum image classification unit that classifies disease names and hearing values corresponding to the diagnostic eardrum images;
An eardrum disease prediction model system using a deep neural network and Monte Carlo dropout, characterized by including.
삭제delete 제1항에 있어서,
상기 고막 영역 추출부는,
상기 고막 영상부에서 수집한 고막 영상에서 고막 영역을 인식하고, 상기 고막 영역을 허프 원 변환(Hough Circle Transform) 처리 기술을 이용하여 추출한 원형 영역을 관심 영역(Region Of Interest)으로 추출하는 관심영역 추출부; 및
상기 관심 영역 내 고막 위치를 기준하여 기설정된 영역을 고막 중심부 영역으로 추출하는 고막 중심부 영역 추출부;
를 포함하는 것을 특징으로 하는 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템.
According to paragraph 1,
The eardrum region extraction unit,
Region of interest extraction by recognizing the eardrum area in the eardrum image collected by the eardrum imaging unit and extracting the circular area extracted from the eardrum area using Hough Circle Transform processing technology as a region of interest. wealth; and
an eardrum center area extractor that extracts a preset area as the eardrum center area based on the eardrum position within the region of interest;
An eardrum disease prediction model system using a deep neural network and Monte Carlo dropout, characterized by including.
제1항에 있어서,
상기 질병진단부는,
상기 미진단 고막 벡터에 상기 소프트맥스 활성화 함수를 이용하여 상기 레이블 생성부에서 생성한 다수 개의 질병 레이블에 대응하는 질병진단을 수행하고,
질병진단이 수행된 상기 미진단 고막 벡터에 대응하는 질병 레이블의 각 청력 수치를 상기 몬테카를로 드롭아웃 기법을 이용하여 산출하는 것을 특징으로 하는 심층신경망과 몬테카를로 드롭아웃을 이용한 고막 질병 예측 모델 시스템.
According to paragraph 1,
The disease diagnosis department,
Performing disease diagnosis corresponding to a plurality of disease labels generated by the label generation unit using the softmax activation function on the undiagnosed eardrum vector,
An eardrum disease prediction model system using a deep neural network and Monte Carlo dropout, characterized in that each hearing value of the disease label corresponding to the undiagnosed eardrum vector for which a disease diagnosis was performed is calculated using the Monte Carlo dropout technique.
KR1020230034518A 2023-03-16 2023-03-16 Tympanic disease prediction model system using deep neural network and monte carlo dropout KR102595646B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230034518A KR102595646B1 (en) 2023-03-16 2023-03-16 Tympanic disease prediction model system using deep neural network and monte carlo dropout

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230034518A KR102595646B1 (en) 2023-03-16 2023-03-16 Tympanic disease prediction model system using deep neural network and monte carlo dropout

Publications (1)

Publication Number Publication Date
KR102595646B1 true KR102595646B1 (en) 2023-10-30

Family

ID=88557868

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230034518A KR102595646B1 (en) 2023-03-16 2023-03-16 Tympanic disease prediction model system using deep neural network and monte carlo dropout

Country Status (1)

Country Link
KR (1) KR102595646B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102047237B1 (en) 2017-12-13 2019-12-02 (주)엔텔스 Disease diagnosis method and system based on artificial intelligence analyzing image data
JP2019534723A (en) * 2016-09-02 2019-12-05 オハイオ・ステイト・イノベーション・ファウンデーション Otoscopy image analysis system and method for diagnosing otopathology
US20200037930A1 (en) * 2018-08-01 2020-02-06 Idx Technologies Inc. Autonomous diagnosis of ear diseases from biomarker data
CN111462146A (en) * 2020-04-16 2020-07-28 成都信息工程大学 Medical image multi-mode registration method based on space-time intelligent agent
KR20220091714A (en) * 2020-12-24 2022-07-01 한국해양과학기술원 Method and system for predicting climate indices using artificial intelligence model capable of providing uncertainty and relevance for climate index prediction result

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019534723A (en) * 2016-09-02 2019-12-05 オハイオ・ステイト・イノベーション・ファウンデーション Otoscopy image analysis system and method for diagnosing otopathology
KR102047237B1 (en) 2017-12-13 2019-12-02 (주)엔텔스 Disease diagnosis method and system based on artificial intelligence analyzing image data
US20200037930A1 (en) * 2018-08-01 2020-02-06 Idx Technologies Inc. Autonomous diagnosis of ear diseases from biomarker data
CN111462146A (en) * 2020-04-16 2020-07-28 成都信息工程大学 Medical image multi-mode registration method based on space-time intelligent agent
KR20220091714A (en) * 2020-12-24 2022-07-01 한국해양과학기술원 Method and system for predicting climate indices using artificial intelligence model capable of providing uncertainty and relevance for climate index prediction result

Similar Documents

Publication Publication Date Title
CN109190540B (en) Biopsy region prediction method, image recognition device, and storage medium
CN109117890B (en) Image classification method and device and storage medium
KR102243830B1 (en) System for providing integrated medical diagnostic service and method thereof
WO2019239813A1 (en) Information processing method, information processing program, and information processing system
TW202001929A (en) Systems and methods for processing real-time video from a medical image device and detecting objects in the video
CN108695001A (en) A kind of cancer lesion horizon prediction auxiliary system and method based on deep learning
CN108553081B (en) Diagnosis system based on tongue fur image
US20090312660A1 (en) Recognition and localisation of pathologic animal and human sounds
US11288952B2 (en) System and method for processing multiple signals
CN111524093A (en) Intelligent screening method and system for abnormal tongue picture
CN112151167A (en) Intelligent screening method for six-age dental caries of children based on deep learning
US20220133215A1 (en) Method for evaluating skin lesions using artificial intelligence
CN113096819A (en) Epidemic situation prevention, control, screening and early warning system based on neural convolutional network
KR101796871B1 (en) Apparatus for diagnosing sleep apnea using video and respiration sound
KR102162630B1 (en) A system and method for providing a result of a object state using a user terminal
KR102595646B1 (en) Tympanic disease prediction model system using deep neural network and monte carlo dropout
US20210059596A1 (en) Cognitive function evaluation method, cognitive function evaluation device, and non-transitory computer-readable recording medium in which cognitive function evaluation program is recorded
CN113197558A (en) Heart rate and respiratory rate detection method and system and computer storage medium
CN115547500B (en) Hemodialysis patient's health monitoring equipment and system
KR102540175B1 (en) Ai based pig disease management system
KR102595647B1 (en) A system for predicting hearing levels through the analysis of eardrum images based on deep learning
KR102595429B1 (en) Apparatus and method for automatic calculation of bowel preparation
KR102344084B1 (en) Method for providing information of lesions on the ear and device for providing information of lesions on the ear using the same
KR102595644B1 (en) Prediatric hearing prediction artificial intelligence system
KR102555602B1 (en) Gum care system

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant