WO2022265197A1

WO2022265197A1 - 인공지능에 기반하여 내시경 영상을 분석하기 위한 방법 및 장치

Info

Publication number: WO2022265197A1
Application number: PCT/KR2022/004521
Authority: WO
Inventors: 김원태; 강신욱; 이명재; 김동민; 송우혁; 박재명; 김준성
Original assignee: (주)제이엘케이
Priority date: 2021-06-15
Filing date: 2022-03-30
Publication date: 2022-12-22
Also published as: KR102388535B1

Abstract

본 발명은 인공지능(artificial intelligence, AI)에 기반하여 내시경 영상을 분석하기 위한 것으로, 내시경 영상을 분석하는 서버의 동작 방법은, 서버의 동작 방법은, 내시경 장비를 통해 촬영된 제1 영상 프레임이 임계 수준 이상의 선명도를 가지지 여부를 판단하는 단계, 상기 임계 수준 이상의 선명도를 가지면, 상기 제1 영상 프레임에서 용종의 영역을 판단하는 단계, 상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계, 상기 영역에 포함되는 대상이 용종이면, 상기 용종의 유형을 분류하는 단계, 및 상기 영역의 위치 및 크기, 상기 용종의 유형에 대한 정보를 송신하는 단계를 포함할 수 있다.

Description

인공지능에 기반하여 내시경 영상을 분석하기 위한 방법 및 장치

본 발명은 내시경 영상을 분석하기 위한 것으로, 특히, 인공지능(artificial intelligence, AI)에 기반하여 내시경 영상을 분석하기 위한 방법 및 장치에 대한 것이다.

인공지능(Artificial Intelligence, AI)은 인간의 지능으로 가능한 사고, 학습 및 분석 등을 컴퓨터 등의 기계가 수행하는 것을 의미한다. 최근 이러한 AI를 의료 산업에 접목하는 기술이 증가하고 있는 실정이다. 인공 신경망(Artificial Neural Network, ANN)은 기계 학습(machine learning)을 구현하는 기법들 중 하나이다.

일반적으로 인공 신경망은 입력 계층(input layer), 은닉 계층(hidden layer) 및 출력 계층(output layer)으로 이루어져 있다. 각 계층들은 뉴런(neuron)들로 구성되어 있으며, 각 계층의 뉴런들은 이전 계층의 뉴런들의 출력과 연결되어 있다. 이전 계층의 뉴런들의 각 출력 값과 그에 상응하는 연결 가중치(weight)를 내적(inner product)한 값에 바이어스(bias)를 더한 값을 일반적으로 비선형(non-linear)인 활성화 함수(activation function)에 넣고 그 출력 값을 다음 단계 계층의 뉴런들에게 전달한다.

이러한 인공지능 기술은 다양한 분야에 적용되기 위하여 활발히 연구되고 있다. 특히, 의료 분야에서 신약 개발, 질병 진단 등의 분야에서 인공지능 알고리즘을 이용한 다양한 플랫폼, 어플리케이션들이 개발되고 있다.

본 발명은 인공지능 기술을 이용하여 내시경 영상을 효과적으로 분석하기 위한 방법 및 장치를 제공하기 위한 것이다.

본 발명은 인공지능 기술을 이용하여 내시경 영상에서 실시간으로 용종(polyp)을 검출하기 위한 방법 및 장치를 제공하기 위한 것이다.

본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 발명의 일 실시 예에 따른, 내시경 영상을 분석하는 서버의 동작 방법은, 내시경 장비를 통해 촬영된 제1 영상 프레임이 임계 수준 이상의 선명도를 가지지 여부를 판단하는 단계, 상기 임계 수준 이상의 선명도를 가지면, 상기 제1 영상 프레임에서 용종의 영역을 판단하는 단계, 상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계, 상기 영역에 포함되는 대상이 용종이면, 상기 용종의 유형을 분류하는 단계, 및 상기 영역의 위치 및 크기, 상기 용종의 유형에 대한 정보를 송신하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 제1 영상 프레임이 임계 수준 이상의 선명도를 가지지 여부는, 상기 제1 영상 프레임에 포함된 이미지인 제1 이미지 및 상기 제1 이미지를 블러링(blurring)함으로써 획득되는 제2 이미지에 기반하여 판단될 수 있다.

본 발명의 일 실시 예에 따르면, 상기 제1 영상 프레임이 임계 수준 이상의 선명도를 가지지 여부를 판단하는 단계는, 상기 제1 이미지 및 상기 제2 이미지의 비교를 위한 비교 지표들을 생성하는 단계, 및 상기 비교 지표들에 기반한 입력 데이터로부터 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종을 검출할지 여부를 나타내는 출력 데이터를 생성하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 입력 데이터는, 상기 비교 지표들에 대한 주성분 분석(principal component analysis)에 의해 획득되는 차원 축소된 정보를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 영역은, 사각형 모양의 바운딩 박스에 의해 지시될 수 있다.

본 발명의 일 실시 예에 따르면, 상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계는, 상기 바운딩 박스에 포함되는 이미지의 일부의 픽셀 값들에 기반하여 상기 위치에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 용종의 유형은, 절제가 필요한 제1 유형 및 절제가 불필요한 제2 유형 중 하나일 수 있다.

본 발명의 일 실시 예에 따르면, 상기 방법은, 상기 제1 영상 프레임보다 앞서 촬영된 제2 영상 프레임에서 용종의 영역을 판단하는 단계, 및 상기 영역의 위치 및 크기에 대한 정보를 송신하는 단계를 더 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 제1 영상 프레임에서 상기 용종의 영역을 판단하는 단계는, 상기 제2 영상 프레임에서 판단된 영역을 확장한 후보 영역을 결정하는 단계, 및 상기 제1 영상 프레임 중 상기 후보 영역에 대응하는 일부에서 상기 용종의 영역을 판단하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 임계 수준 이상의 선명도를 가지지 여부, 상기 용종의 영역, 상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부, 상기 용종의 유형을 분류하는 것은, 적어도 하나의 인공지능 모델에 기반하여 수행되며, 상기 적어도 하나의 인공지능 모델은, 상기 내시경 장비와 다른 내시경 장비에서 촬영된 이미지에 기반하여 생성된 학습 데이터를 이용하여 학습되며, 상기 학습 데이터는, 상기 내시경 장비에서 촬영된 제1 이미지 및 상기 다른 내시경 장비에서 촬영된 제2 이미지에 기반하여 보상된 이미지들을 포함할 수 있다.

본 발명의 일 실시 예에 따른, 내시경 영상을 분석하는 서버는, 통신부, 및 프로세서를 포함하고, 상기 프로세서는, 내시경 장비를 통해 촬영된 제1 영상 프레임이 임계 수준 이상의 선명도를 가지지 여부를 판단하고, 상기 임계 수준 이상의 선명도를 가지면, 상기 제1 영상 프레임에서 용종의 영역을 판단하고, 상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하고, 상기 영역에 포함되는 대상이 용종이면, 상기 용종의 유형을 분류하고, 기 영역의 위치 및 크기, 상기 용종의 유형에 대한 정보를 송신하도록 제어할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 프로세서는, 상기 제1 이미지 및 상기 제2 이미지의 비교를 위한 비교 지표들을 생성하고, 상기 비교 지표들에 기반한 입력 데이터로부터 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종을 검출할지 여부를 나타내는 출력 데이터를 생성할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 프로세서는, 상기 바운딩 박스에 포함되는 이미지의 일부의 픽셀 값들에 기반하여 상기 위치에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 프로세서는, 상기 제1 영상 프레임보다 앞서 촬영된 제2 영상 프레임에서 용종의 영역을 판단하고, 상기 영역의 위치 및 크기에 대한 정보를 송신하도록 제어할 수 있다.

본 발명의 일 실시 예에 따르면, 상기 프로세서는, 상기 제2 영상 프레임에서 판단된 영역을 확장한 후보 영역을 결정하고,

상기 제1 영상 프레임 중 상기 후보 영역에 대응하는 일부에서 상기 용종의 영역을 판단할 수 있다.

본 발명에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 발명의 상세한 설명의 예시적인 양상일 뿐이며, 본 발명의 범위를 제한하는 것은 아니다.

본 발명에 따르면, 내시경 영상으로부터 보다 효과적으로 용종(polyp)이 검출될 수 있다.

본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

도 1은 본 발명의 일 실시 예에 따른 인공지능 모델을 운용하기 위한 시스템의 구조를 도시한다.

도 2는 본 발명의 일 실시 예에 따른 시스템에 적용 가능한 인공 신경망의 구조를 도시한다.

도 3은 본 발명의 일 실시 예에 따른 내시경 영상 분석을 위한 시스템의 개요를 도시한다.

도 4는 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상을 분석하는 절차의 일 예를 도시한다.

도 5a는 본 발명의 일 실시 예에 따른 시스템에서 분석 대상 이미지를 분류하기 위한 전처리를 수행하는 절차의 일 예를 도시한다.

도 5b는 본 발명의 일 실시 예에 따른 시스템에서 전처리를 위한 블러링(blurring) 전후의 이미지들의 예를 도시한다.

도 5c는 본 발명의 일 실시 예에 따른 시스템에서 영상 프레임들에 대한 주성분 분석(principal component analysis) 결과의 예를 도시한다.

도 6은 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상 분석에 필요한 연산량을 조절하는 절차의 일 예를 도시한다.

도 7은 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상으로부터 검출된 용종을 표시하는 절차의 일 예를 도시한다.

도 8은 본 발명의 일 실시 예에 따른 시스템에서 인공지능 모델을 학습하는 절차의 일 예를 도시한다.

도 9는 본 발명의 일 실시 예에 따른 시스템에서 용종 검출 결과에 대한 오류를 보고하는 절차의 일 예를 도시한다.

첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.

본 발명의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 발명에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 발명은 인공지능 기술에 기반하여 내시경 영상을 분석하는 기술에 대해 제안한다. 구체적으로, 본 발명은 인체의 대장 등을 촬영하는 내시경 장치로부터 제공되는 영상으로부터 병변(예: 용종)을 검출 및 분류하기 위한 기술에 관한 것이다.

도 1은 본 발명의 일 실시 예에 따른 인공지능 모델을 운용하기 위한 망 구조를 도시한다.

도 1을 참고하면, 인공지능 모델을 운용하기 위한 망은 통신망에 연결된 검사 장치(110), 서버(120)을 포함한다. 도 1은 1개의 검사 장치(110)를 예시하였으나, 2개 이상의 검사 장치들이 존재할 수 있다.

검사 장치(110)는 인체의 내부 장기(예: 위, 대장 등) 또는 체강 내부를 촬영할 수 있는 장치로서, 촬영을 위한 카메라, 영상 처리를 위한 프로세서, 영상을 표시하기 위한 표시부를 포함한다. 또한, 검사 장치(110)는 내시경 장비로서 일반적으로 요구되는 구성요소들을 더 포함할 수 있다. 본 발명의 일 실시 예에 따라, 검사 장치(110)는 촬영된 영상을 표시하는 제1 표시부 및 촬영된 영상에 분석 결과를 부가한 영상을 표시하는 제2 표시부를 포함할 수 있다. 다른 실시 예에 따라, 제2 표시부는 도 1에 도시되지 아니한 별도의 장치에 포함되도록 구현될 수 있다.

서버(120)는 본 발명의 실시 예들에 따른 적어도 하나의 인공지능 모델을 이용하여 추론(inference)을 수행하는 장치이다. 즉, 서버(120)는 추론을 위해 인공 신경망을 포함하는 인공지능 모델을 가지며, 인공지능 모델을 운용할 수 있다. 본 발명에 적용 가능한 인공 신경망의 일 예는 이하 도 2를 참고하여 설명된다. 또한, 서버(120)는 학습 데이터를 이용하여 인공지능 모델을 위한 학습을 수행할 수 있다. 여기서, 서버(120)는 로컬 네트워크에 존재하는 로컬 서버이거나, 외부 망을 통해 연결되는 원격 접속 서버(예: 클라우드 서버)일 수 있다. 서버(120)는 통신을 위한 통신부, 데이터, 프로그램을 저장하는 저장부, 제어를 위한 프로세서를 포함할 수 있다.

일 실시 예에 따라, 검사 장치(110)는 통신 망을 통해 서버(120)에게 촬영된 영상을 제공하고, 서버(120)는 적어도 하나의 인공지능 모델을 이용하여 영상을 분석함으로써 병변(예: 용종)을 검출 및 분류한다. 분석 결과는 검사 장치(110)에게 제공되고, 검사 장치(110)는 분석 결과를 수신 및 표시할 수 있다. 다만, 다른 실시 예에 따라, 서버(120)의 기능이 검사 장치(110)에 의해 제공될 수 있다.

도 2는 본 발명의 일 실시 예에 따른 시스템에 적용 가능한 인공 신경망의 구조를 도시한다. 도 2를 참고하면, 인공 신경망은 입력 계층(input layer)(210), 적어도 하나의 은닉 계층(hidden layer)(220), 출력 계층(output layer)(230)으로 이루어진다. 계층들(210, 220, 230) 각각은 복수의 노드(node)들로 구성되어 있으며, 노드들 각각은 이전 계층에 속한 적어도 하나의 노드의 출력과 연결되어 있다. 각 노드는 이전 계층의 노드들의 각 출력 값과 그에 상응하는 연결 가중치(weight)를 내적(inner product)한 값에 바이어스(bias)를 더한 후, 비선형(non-linear)인 활성화 함수(activation function)와 곱한 출력 값을 다음 계층의 적어도 하나의 뉴런에게 전달한다.

본 발명의 다양한 실시 예에서 사용되는 인공 신경망 모델은 완전 합성곱 신경망(fully convolutional neural network), 합성곱 신경망(convolutional neural network), 순환 신경망(recurrent neural network), 제한 볼츠만 머신(restricted Boltzmann machine, RBM) 및 심층 신뢰 신경망(deep belief neural network, DBN) 중 적어도 하나를 포함할 수 있으나, 이에 한정되지 않는다. 또는, 딥러닝 이외의 머신 러닝 방법도 포함할 수 있다. 또는 딥러닝과 머신 러닝을 결합한 하이브리드 형태의 모델도 포함할 수 있다. 예컨대, 딥러닝 기반의 모델을 적용하여 영상의 특징을 추출하고, 상기 추출된 특징에 기초하여 영상을 분류하거나 인식할 때는 머신 러닝 기반의 모델을 적용할 수도 있다. 머신 러닝 기반의 모델은 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 등을 포함할 수 있으나, 이에 한정되지 않는다.

도 3은 본 발명의 일 실시 예에 따른 내시경 영상 분석을 위한 시스템의 개요를 도시한다. 도 3은 내시경 장비(310)(예: 도 1의 검사 장치(110a 또는 110b))에서 촬영된 영상이 처리되는 과정을 예시한다.

도 3을 참고하면, 내시경 장비(310)에서 촬영된 영상은 인코딩을 통해 복수의 영상 프레임들로 변환된다. 영상 프레임은 알고리즘(320a)의 입력 데이터로서 제공되고, 알고리즘(320a)에 의해 처리된다. 이때, 다양한 실시 예들에 따라, 복수의 알고리즘들(320a, 320b, 320c)이 연쇄적으로 사용될 수 있다. 알고리즘들(320a, 320b, 320c) 각각은 학습된 인공지능 모델로 구현되는 알고리즘이거나, 또는 학습 없이 설계되는 알고리즘일 수 있다.

일 실시 예에 따라, 복수의 알고리즘들(320a 내지 320d)은 영상 프레임의 전처리(pre-processing), 용종의 판단, 판단 결과의 후처리(post-processing), 분류 등의 기능을 제공할 수 있다. 구체적으로, 제1 알고리즘(320a)은 판독에 부적절한 프레임을 제외하는 기능을 제공하는 인공지능 모델일 수 있고, 제2 알고리즘(320b)은 용종의 위치를 찾아 표시하는 기능을 제공하는 인공지능 모델일 수 있고, 제3 알고리즘(320c)은 용종으로 오판된 이물질을 배제하는 기능을 제공하는 인공지능 모델일 수 있고, 제4 알고리즘(320d)은 용종을 필요한 조치에 따라 분류하는 기능을 제공하는 인공지능 모델일 수 있다. 본 발명의 다양한 실시 예들에 따라, 복수의 알고리즘들(320a, 320b, 320c) 중 일부가 적응적으로 제외되거나, 다른 알고리즘이 적응적으로 추가될 수 있다.

본 발명의 일 실시 예에 따라, 복수의 알고리즘들(320a, 320b, 320c)을 통해 생성된 병변(예: 용종)의 검출 결과는 내시경 장비(310)를 통해 촬영된 영상과 함께 표시될 수 있다. 이를 위해, 내시경 장치(310)는 촬영 중인 영상을 실시간으로 알고리즘에 입력하고, 영상 촬영 중에 동시에 검출 결과를 표시할 수 있다. 즉, 내시경 장치(310)의 사용자는 촬영을 통해 영상을 관찰하면서, 동시에 복수의 알고리즘들(320a, 320b, 320c)에 의한 검출 결과를 제공받을 수 있다.

본 발명의 일 실시 예에 따라, 복수의 알고리즘들(320a 내지 320d)을 통해 생성된 병변(예: 용종)의 검출 결과는 다른 장치(미도시)에게 제공될 수 있다. 다른 장치는 검출 결과 및 영상을 획득하고, 검출 결과가 부가된 영상을 표시할 수 있다. 이때, 복수의 알고리즘들(320a 내지 320d)의 출력은 병변의 위치를 지시하는 바운딩 박스를 부가한 영상을 포함할 수 있다. 또는, 복수의 알고리즘들(320a 내지 320d)의 출력은 영상 프레임 별 병변의 위치를 지시하는 바운딩 박스의 위치 및 크기 데이터를 포함하고, 촬영된 영상은 내시경 장비(310)로부터 제공될 수 있다. 이에 따라, 사용자는 내시경 장치(310)를 통해 촬영된 영상의 원본을, 별도의 장치를 통해 검출 결과가 부가된 영상을 확인할 수 있다. 단, 구현 방식에 따라, 내시경 장치(310)가 2개의 표시부들을 포함하고, 2개의 표시부들을 통해 영상의 원본 및 검출 결과가 부가된 영상을 모두 표시할 수 있다.

도 4는 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상을 분석하는 절차의 일 예를 도시한다. 도 4는 서버(예: 도 1의 서버(120))의 동작 방법을 예시한다.

도 4를 참고하면, S401 단계에서, 서버는 입력 프레임 중에서 부적절한 프레임을 배제하는 전처리를 수행한다. 즉, 서버는 검사 장치(예: 도 1의 검사 장치(110))로부터 내시경 영상을 포함하는 입력 프레임들을 수신하고, 수신된 입력 프레임들을 분류한다. 예를 들어, 부적절한 프레임은 용종 검출에 사용하기 적절하지 아니한 이미지를 포함하는 프레임으로서, 구체적으로, 빛 반사가 심하거나, 초점이 맞지 않거나, 흔들림이 심한 이미지를 포함하는 프레임으로 이해될 수 있다. 즉, 부적절한 프레임은 임계 수준 이하의 선명도를 가지는 이미지를 포함하는 프레임으로 이해될 수 있다. 전처리를 통해, 적어도 하나의 입력 프레임이 제외될 수 있다. 이를 위해, 서버는 전처리를 위한 인공지능 모델을 이용할 수 있다. 예를 들어, 서버는 서포트 벡터 머신(support vector machine) 알고리즘에 기반한 인공지능 모델을 이용하여 전처리를 수행할 수 있다.

S403 단계에서, 서버는 입력 프레임들에서 용종의 위치를 판단한다. 즉, 서버는 각 입력 프레임으로부터 입력 데이터를 추출하고, 인공지능 모델을 이용하여 추출된 입력 데이터로부터 출력 데이터를 생성할 수 있다. 즉, 서버는 인공지능 모델을 이용하여 용종의 위치를 추론할 수 있다. 예를 들어, 입력 데이터는 입력 프레임의 픽셀 값들 또는 픽셀 값들로부터 도출되는 값들을 포함한다. 용종의 위치는 미리 정해진 모양(예: 사각형)의 영역 단위로 검출된다. 즉, 출력 데이터는 영상 내에서 용종의 위치를 지시하는 바운딩 박스(bounding box)를 포함할 수 있다. 이에 따라, 용종의 정확한 경계를 검출하는 경우에 대비하여, 보다 빠른 검출이 가능하다. 이를 통해, 서버는 적어도 하나의 입력 프레임에서 적어도 하나의 용종 영역을 결정한다.

S405 단계에서, 서버는 용종 영역에 대한 후처리를 수행한다. 즉, 서버는 검출된 적어도 하나의 용종 영역을 분석함으로써 용종이 아닌 다른 대상을 구분한다. 예를 들어, 다른 물질은 음식물 찌꺼기, 기포 등의 이물질을 포함할 수 있다. 즉, S403 단계에서 결정된 용종 영역은 최종적으로 용종으로 판단되는 것이 아닐 수 있다. 이에 따라, S403 단계에서 결정된 용종 영역은 용종 후보 영역이라 지칭되고, S405 단계의 후처리를 거쳐 남겨진 영역이 최종적인 용종 영역으로서 판정될 수 있다. 이를 위해, 서버는 후처리를 위한 인공지능 모델을 이용할 수 있다. 예를 들어, 서버는 CNN(convolutional neural network)에 기반한 인공지능 모델을 이용하여 후처리를 수행할 수 있다. 이때, 인공지능 모델로의 입력 데이터는 바운딩 박스 내부의 픽셀 값들 또는 픽셀 값들로부터 도출되는 값들을 포함한다.

S407 단계에서, 서버는 용종에 대한 세부 분류를 수행한다. 여기서, 세부 분류는 용종에 대해 필요한 조치에 따른 분류를 의미한다. 예를 들어, 서버는 검출된 용종들을 절제가 필요한 제1 유형(예: 선종(adenoma)) 및 절제가 불필요한 제2 유형(예: 과형성 용종(hyperplastic polyp))으로 분류할 수 있다. 이를 위해, 서버는 세부 분류를 위한 인공지능 모델을 이용할 수 있다. 예를 들어, 서버는 CNN에 기반한 인공지능 모델을 이용하여 세부 분류를 수행할 수 있다. 이때, 인공지능 모델로의 입력 데이터는 바운딩 박스 내부의 픽셀 값들 또는 픽셀 값들로부터 도출되는 값들을 포함한다.

S409 단계에서, 서버는 최종적인 검출 결과를 출력한다. 즉, 서버는 검사 장치가 최종적인 검출 결과를 실시간으로 표시할 수 있도록, 검사 장치에게 검출 결과를 나타내는 데이터를 송신한다. 이때, 데이터는 용종의 위치, 용종의 세부 분류 결과를 포함하며, 이에 따라, 검사 장치는 영상 위에 검출 결과를 나타내는 지시자를 표시할 수 있다. 이때, 표시되는 지시자는 세부 분류 결과에 따라 다르게 표현될 수 있다.

도 4를 참고하여 설명한 바와 같이, 영상 프레임들은 전처리를 통해 분류되며, 용종 검출에 사용하기 적절한 이미지를 포함하는 영상 프레임들만이 분석의 대상이 될 수 있다. 전처리를 위해 다양한 기법들이 적용될 수 있다. 전처리에 대한 일 실시 예가 이하 도 5a 내지 도 5c를 참고하여 설명된다.

도 5a는 본 발명의 일 실시 예에 따른 시스템에서 분석 대상 이미지를 분류하기 위한 전처리를 수행하는 절차의 일 예를 도시한다. 도 5a는 서버(예: 도 1의 서버(120))의 동작 방법을 예시한다. 도 5a에 예시된 절차는 각 프레임에 대하여 수행된다. 따라서, 복수의 영상 프레임들이 분석되는 경우, 도 5a에 예시된 절차는 반복될 수 있다.

도 5a를 참고하면, S501 단계에서, 서버는 프레임에 포함된 이미지를 블러링(blurring)한다. 이에 따라, 서버는 블러렁 전의 원본 이미지 및 블러링된 이미지를 획득할 수 있다. 원본 이미지 및 블러링된 이미지의 예는 도 5b와 같다. 도 5b는 본 발명의 일 실시 예에 따른 시스템에서 전처리를 위한 블러링(blurring) 전후의 이미지들의 예를 도시한다. 도 5b를 참고하면, 촛점이 맞지 않는 등의 이유로 흐릿한 이미지(502a) 및 선명한 이미지(502b) 각각이 블러링을 통해 블러링된 이미지들(504a, 504b)로 변환된다. 도 5와 같이, 블러링을 가한 경우, 선명한 이미지(502b)는 블러링된 이미지(504b)와 육안으로 식별 가능할 정도로 차이를 보이나, 흐릿한 이미지(502a) 및 블러링된 이미지(504a)는 큰 차이를 보이지 아니한다.

S503 단계에서, 서버는 블러링 전 이미지 및 블러링 후 이미지 간 적어도 하나의 비교 지표를 생성한다. 즉, 서버는 블러링 전 이미지 및 블러링 후 이미지 간 변화 정도를 데이터화하기 위하여, 비교를 위한 적어도 하나의 지표를 생성한다. 일 실시 예에 따라, 적어도 하나의 비교 지표는 SSIM(Structural similarity), NCC(Normalized Correlation Coefficient), SSD(Sum of Squared Difference), RMSE(Root Mean Squared Error) 중 적어도 하나를 포함할 수 있다.

S505 단계에서, 서버는 적어도 하나의 비교 지표 이용하여 이미지를 분류한다. 즉, 서버는 분류를 위해 학습된 인공지능 모델을 이용하여 생성된 적어도 하나의 비교 지표로부터 비교 결과를 획득한다. 인공지능 모델은 영상 프레임에 대하여 적절 또는 부적절의 출력 데이터를 제공하며, 서버는 출력 데이터에 기반하여 이미지를 분류할 수 있다. 이때, 일 실시 예에 따라, 서버는 비교 지표들에 대하여 주성분 분석(principal component analysis)을 수행함으로써 정보의 차원을 축소하고, 차원 축소된 정보를 인공지능 모델에 입력할 수 있다.

도 5a에 예시된 분류 동작을 위해, 학습된 인공지능 모델이 필요하다. 인공지능 모델은 라벨링된 선명한 이미지들 및 흐릿한 이미지들의 비교 지표들을 이용하여 학습될 수 있다. 비교 지표들에 대한 주성분 분석을 통해 정보의 차원을 축소하고, 축소된 차원의 정보를 이용하여 학습을 수행한 결과, 이하 도 5c와 같은 분포가 확인된다. 도 5c는 본 발명의 일 실시 예에 따른 시스템에서 영상 프레임들에 대한 주성분 분석 결과의 예를 도시한다. 도 5c를 참고하면, 전처리에 의해 제외되는 프레임들 및 전처리 후 유지되는 프레임들은 분리되는 군집들을 형성함이 확인된다. 이에 따라, 인공지능 모델은 도 5c와 같은 군집들의 경계 값들 기반으로 분류 결과를 출력하도록 설계될 수 있다.

도 6은 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상 분석에 필요한 연산량을 조절하는 절차의 일 예를 도시한다. 도 6은 서버(예: 도 1의 서버(120))의 동작 방법을 예시한다.

도 6을 참고하면, S601 단계에서, 서버는 입력 프레임들 간 이미지 변화 속도를 확인한다. 입력 프레임들 간 이미지 변화 속도는 픽셀 값의 차분 값들에 기반하여 평가될 수 있다. 또는, 입력 프레임들 간 이미지 변화 속도는 복수의 입력 프레임들 동안 이미지의 특징점이 이동하는 속도에 기반하여 평가될 수 있다. 이미지의 변화가 빠름은 사용자의 체감 실시간성을 확보하기 위해 더 짧은 응답 시간을 필요로 하는 것으로 이해될 수 있다. 여기서, 응답 시간은 영상 프레임이 생성된 시점부터 검출 결과가 부가된 영상이 출력되기까지의 시간을 의미한다.

S603 단계에서, 서버는 이미지 변화 속도에 대응하는 요구 응답 시간을 확인한다. 이미지 변화 속도가 빠를수록, 더 짧은 응답 시간이 요구된다. 따라서, 이미지 변화 속도가 높을수록 요구 응답 시간이 짧도록 정의된 맵핑 테이블이 사전에 정의되며, 서버는 맵핑 테이블을 참고하여 요구 응답 시간을 확인할 수 있다.

S605 단계에서, 서버는 현재 응답 시간 및 요구 응답 시간을 비교한다. 만일, 현재 응답 시간이 요구 응답 시간 이하이면, 서버는 S601 단계로 되돌아가 이미지 변화 속도에 따른 요구 응답 시간과 현재 응답 시간을 지속적으로 모니터링한다.

반면, 현재 응답 시간이 요구 응답 시간보다 크면, S607 단계에서, 서버는 연산량 감소 조치를 수행한다. 연산량 감소 조치는 다양하게 정의될 수 있다. 일 실시 예에 따라, 연산량 감소 조치는 일부 분석 단계를 생략하는 방식으로 정의될 수 있다. 예를 들어, 도 4와 같은 절차를 수행 중, 서버는 S405 단계의 후처리 동작을 생략할 수 있다. 이 경우, 이물질이 용종으로 오판되는 경우가 증가할 수 있지만, 응답 시간이 감소될 수 있다. 다른 실시 예에 따라, 연산량 감소 조치는 용종 검출 및 분류 절차의 일부에 대한 결과를 먼저 표시하고, 나머지에 대한 결과를 후속적으로 표시하는 방식으로 정의될 수 있다. 이 경우, 결과적으로 모든 연산이 완료되기 까지의 시간은 감소하지 아니하나, 일차적인 판단이 좀더 빠르게 사용자에게 제공될 수 있고, 체감 실시간성이 개선될 수 있다.

도 6을 참고하여 설명된 실시 예에 따르면, 이미지의 변화 속도가 빠른 경우, 연산량을 감소시킴으로써 체감 실시간성이 유지될 수 있다. 반대로, 이미지의 변화 속도가 느린 경우, 대응하는 조치가 수행될 수 있다. 예를 들어, 사용자가 내시경 촬영 중 특정 위치의 환부를 면밀히 관찰하기 위해 내시경의 이동을 멈추는 상황이 발생할 수 있다. 이 경우, 이미지의 변화 속도는 매우 느려지거나 또는 멈추게 되며, 이에 따라 유사하거나 동일한 영상 프레임이 반복적으로 생성될 수 있다. 이 경우, 동일한 이미지를 포함하는 영상 프레임들이 중복적으로 저장되므로, 영상 프레임을 저장 매체에 저장하기 위해 소요되는 시간, 저장 공간의 낭비 등을 감소시키기 위해, 서버는 영상 프레임의 반복적인 저장을 회피하고, 영상 프레임의 저장 및 분석을 일시 정지하거나, 저장 및 분석의 주기를 증가시킬 수 있다. 구체적으로, 서버는, 이미지의 변화가 없다면 프레임의 저장 및 분석을 일시 정지하고, 이미지의 변화 속도가 임계치 미만이면 변화 속도에 비례하여 영상 프레임의 저장 및 분석 주기를 증가시킬 수 있다.

도 6을 참고하여 설명한 바와 같이, 연산량 감소 조치가 적용될 수 있다. 연산량 감소 조치에 대한 일 예로서, 분석 결과를 단계적으로 표시하는 것이 가능하다. 예를 들어, 전체 절차를 구성하는 단계들을 복수의 수행 그룹들로 구분하고, 각 수행 그룹이 완료될 때마다 순차적으로 분석 결과를 표시하는 방안이 적용될 수 있다. 단, 이 경우, 앞선 수행 그룹의 분석 결과가 다음 수행 그룹의 연산을 가속화할 수 있도록 수행 그룹들이 설계되는 것이 바람직하다. 복수의 수행 그룹들을 이용한 실시 예가 이하 도 7을 참고하여 설명된다.

도 7은 본 발명의 일 실시 예에 따른 시스템에서 내시경 영상으로부터 검출된 용종을 표시하는 절차의 일 예를 도시한다. 도 7은 서버(예: 도 1의 서버(120))의 동작 방법을 예시한다.

도 7을 참고하면, S701 단계에서, 서버는 제1 인공지능 모델 이용하여 의심 영역을 검출한다. 예를 들어, 서버는 부적절한 영상 프레임을 제외하는 전처리를 수행하고, 나머지 영상 프레임들에서 용종의 위치를 검출할 수 있다. 이때, 영상 프레임의 전체 영역이 분석의 대상이 된다.

S703 단계에서, 서버는 의심 영역을 표현하는 제1 지시지를 표시하도록 제어한다. 서버는 용종으로 판단된 영상의 일부 영역을 의심 영역으로 선정하고, 의심 영역을 지시하는 제1 정보를 제공한다. 즉, 서버는 검출 결과를 표시하는 장치(예: 검사 장치 또는 별도의 표시 장치)가 의심 영역이 부가된 영상을 제1 지시자를 이용하여 표시할 수 있도록, 의심 영역의 위치 및 크기를 지시하는 제1 정보를 송신한다. 만일, 서버가 표시부를 구비하고, 검출 결과를 표시하는 장치인 경우, 본 단계는 제1 지시자가 부가된 영상을 표시하는 동작으로 이해될 수 있다.

S705 단계에서, 서버는 제2 인공지능 모델 이용하여 용종 여부를 판단한다. 즉, 서버는 의심 영역에 포함된 이미지의 피사체가 용종인지 여부를 검사한다. 예를 들어, 본 단계는 전술한 후처리 동작(예: 도 4의 S405 단계)를 포함할 수 있다. 이때, S703 단계에서 제1 지시자가 부가된 영상은 이미 사용자에게 표시되었으므로, 아직 사용자에게 표시되지 아니한 영상 프레임에 대하여 본 단계가 수행될 수 있다. 이때, 서버는 앞서 의심 영역에 포함된 피사체의 이미지를 이용하여, 본 단계에서 분석되는 영상 프레임에서 의심 영역을 발견하기 위한 후보 영역을 줄일 수 있다. 예를 들어, 본 발명에서 취급하는 내시경 영상은 연속성을 가지기 때문에, 인접한 영상 프레임들 간 의심 영역의 위치의 이동에 한계가 존재한다. 따라서, 서버는 앞서 의심 영역이 표현된 영상 프레임에서 의심 영역을 일정 비율로 확장함으로써 후보 영역을 결정한 후, 다음 영상 프레임에서 후보 영역에 해당하는 일부 냉에서 의심 영역을 추론하고, 용종인지 여부를 판단할 수 있다. S707 단계에서, 서버는 의심 영역 내의 피사체가 용종으로 판단되었는지 확인한다.

만일, 용종으로 판단되면, S709 단계에서, 서버는 용종임을 나타내는 제2 지시자를 표시하도록 제어한다. 반면, 용종으로 판단되지 아니하면, S711 단계에서, 서버는 용종이 아님을 나타내는 제3 지시자를 표시하도록 제어한다. 다시 말해, 의심 영역에 포함된 피사체가 용종인지 아닌지에 따라, 서버는 제2 지시자 또는 제3 지시자를 표시하도록 제어한다. 즉, 서버는 의심 영역에 포함된 피사체가 용종인지 아닌지에 대한 제2 정보를 송신한다. 여기서, 제1 지시자, 제2 지시자, 제3 지시자는 시각적으로 서로 구분 가능하도록 정의되며, 예를 들어, 제1 지시자, 제2 지시자, 제3 지시자는 서로 다른 컬러로 표현된 바운딩 박스들, 서로 다른 추가 정보(예: 아이콘, 텍스트 등)가 부착된 바운딩 박스들 중 적어도 하나로 정의될 수 있다.

도 7을 참고하여 설명한 실시 예와 같이, 1차적으로 용종을 검출 및 표시하는 제1 수행 그룹 진행 후, 2차적으로 오판 여부를 판단 및 표시하는 제2 수행 그룹이 진행될 수 있다. 이러한 단계적인 분석 및 표시는 다양하게 변형될 수 있다. 나아가, 2개의 수행 그룹들이 아닌 3개 이상의 수행 그룹들이 정의될 수 있다. 예를 들어, 다른 실시 예에 따라, 제1 수행 그룹은 도 4의 후처리 동작까지를 포함하고, 제2 수행 그룹은 도 4의 세부 분류 동작을 포함할 수 있다. 또 다른 실시 예에 따라, 제1 수행 그룹은 도 4의 용종 위치 동작까지를 포함하고, 제2 수행 그룹은 도 5의 후처리 동작을 포함하고, 제3 수행 그룹은 도 4의 세부 분류 동작을 포함할 수 있다.

도 8은 본 발명의 일 실시 예에 따른 시스템에서 인공지능 모델을 학습하는 절차의 일 예를 도시한다. 도 8은 서버(예: 도 1의 서버(120))의 동작 방법을 예시한다. 도 8은 제1 장비(예: 제1 내시경 장비)에서 생성된 이미지에 기반한 학습 데이터를 이용하여 제2 장비(예: 제2 내시경 장비)를 위한 인공지능 모델을 학습하는 절차를 예시한다.

도 8을 참고하면, S801 단계에서, 서버는 제1 장비를 통해 생성된 이미지에 기반한 학습 데이터를 수집한다. 예를 들어, 학습 데이터는 병변(예: 용종)의 위치를 바운딩 박스로 표시한 이미지들을 포함한다. 이때, 학습 데이터를 구성하는 이미지는 제1 장비에서 촬영된 이미지이다.

S803 단계에서, 서버는 인공지능 모델을 적용할 제2 장비를 통해 생성된 제1 이미지를 획득한다. 제2 장비는 본 절차를 통해 학습되는 인공지능 모델을 적용할 장비이며, 제1 장비와 동종의 장비이나, 제조사, 사용기간, 생산연도, 제품번호, 제품버전, 사용환경 등에서 다를 수 있다.

S805 단계에서, 서버는 학습 데이터 중 비교를 위한 제2 이미지를 선택한다. 다시 말해, 서버는 제1 장비에서 촬영된 이미지들 중 제1 이미지와 비교할 하나의 이미지, 즉, 제2 이미지를 선택한다. 이때, 서버는 제1 이미지에 기반하여 제2 이미지를 선택한다. 예를 들어, 서버는 제1 이미지 및 제2 이미지가 동일인을 촬영한 이미지들이 되도록 제2 이미지를 선택할 수 있다. 다른 예로, 서버는 제1 이미지 및 제2 이미지가 장기 내부에서 동일한 위치를 촬영한 이미지들이 되도록 제2 이미지를 선택할 수 있다.

S807 단계에서, 서버는 제1 이미지 및 제2 이미지 간 비교 분석 결과에 따라 학습 데이터를 보정한다, 제1 이미지 및 제2 이미지 간 컬러 차이, 선명도 차이 등 다양한 영상 요소의 차이를 분석하고, 해당 차이를 보상할 수 있도록 학습 데이터에 포함된 이미지들을 보정한다. 이때, 보다 정확한 보상을 위해, 복수의 이미지 쌍들에 대한 비교 분석이 수행될 수 있다. 이에 따라, 인공지능 모델이 적용될 제2 장비의 특성에 적합한 학습 데이터가 획득될 수 있다.

S809 단계에서, 서버는 보정된 학습 데이터를 이용하여 학습을 수행한다. 즉, 서버는 라벨링된 학습 데이터를 이용하여 인공지능 모델에 대한 학습을 수행한다. 구체적으로, 서버는 역전파 과정을 통해 인공지능 모델의 가중치들을 갱신할 수 있다. 학습된 인공지능 모델은 이후 영상 분석을 위해 사용된다.

전술한 다양한 실시 예들에 따라, 서버는 적어도 하나의 학습된 인공지능 모델을 이용하여 용종의 위치를 파악하고, 용종의 유형을 판단할 수 있다. 이에 따라, 사용자는 내시경 장비를 이용하여 위, 대장 등의 내부를 촬영함과 동시에, 실시간으로 용종에 대한 분석 결과를 관찰할 수 있다. 이때, 학습의 진행 정도, 학습 데이터의 양 등에 따라, 오류가 발생할 가능성이 있다. 오류는 용종을 용종으로 검출하지 못하는 오류와, 용종이 아닌 것을 용종으로 검출하는 오류를 포함한다. 이에 따라, 본 발명은 사용자로부터 검출 오류를 피드백 받고, 피드백된 오류에 기반하여 재학습을 수행하는 실시 예를 제안한다. 검출 오류의 피드백을 위한 실시 예는 이하 도 9와 같다.

도 9는 본 발명의 일 실시 예에 따른 시스템에서 용종 검출 결과에 대한 오류를 보고하는 절차의 일 예를 도시한다. 도 9는 표시 장치의 동작 방법을 예시한다. 여기서, 표시 장치는 검사 장치(예: 도 1의 검사 장치(110))이거나 별개의 장치일 수 있다.

도 9를 참고하면, S901 단계에서, 표시 장치는 인공지능 모델을 이용한 검출 결과를 포함하는 화면을 표시한다. 예를 들어, 표시 장치는 서버(예: 도 1의 서버(120))로부터 검출 결과를 수신하고, 수신된 검출 결과에 기반하여 용종을 지시하는 바운딩 박스가 부가된 영상을 표시할 수 있다.

S903 단계에서, 표시 장치는 오류 검사 명령이 검출되는지 확인한다. 여기서, 오류 검사 명령은 현재 표시되는 영상 프레임에 대한 검출 결과에 대해 오류가 존재한다는 사용자의 판단을 표현하고, 검사 종료 후 구체적인 오류 내용을 입력할 수 있도록 오류 보고 메뉴를 제공하라는 명령으로 이해될 수 있다. 이를 위해, 장치는 사용자의 명령을 감지하기 위한 입력 수단을 포함한다. 예를 들어, 입력 수단은 터치 스크린, 버튼, 마이크 중 적어도 하나를 포함한다. 미리 정의된 방식에 의해 오류 검사 명령이 사용자로부터 입력될 있다.

S905 단계에서, 표시 장치는 오류 검사 명령이 검출된 시점을 저장한다. 즉, 추후 입력될 오류의 내용이 어느 영상 프레임에 대한 오류인지 판단하는 것이 요구되므로, 표시 장치는 오류 검사 명령이 검출된 시점을 저장한다. 시점은 영상 프레임의 인덱스, 또는 시각 값의 형식으로 저장될 수 있다.

S907 단계에서, 서버는 검사가 종료되는지 판단한다. 예를 들어, 검사의 종료는 사용자의 종료 또는 종료에 관련된 입력에 기반하여 판단될 수 있다. 또는, 검사의 종료는 영상 촬영의 중단, 영상 송신의 중단 등에 기반하여 판단될 수 있다.

S909 단계에서, 서버는 오류 보고 메뉴를 표시하고, 사용자의 입력 정보를 확인한다. 오류 보고 메뉴는 S903 단계에서 오류 검사 명령이 적어도 1회 검출된 경우에 표시된다. 오류 보고 메뉴는 사용자가 판단한 오류의 내용을 입력하기 위한 인터페이스이다. 오류 보고 메뉴는 오류 검사 명령이 검출된 시점에 촬영된 영상 프레임, 오류의 위치(예: 용종이 아닌데 용종으로 표현된 바운딩 박스, 용종이지만 누락된 바운딩 박스)를 지정하기 위한 항목, 오류의 내용을 지정하기 위한 항목(예: 용종으로 검출되었으나 용종인 경우 또는 용종이지만 검출되지 아니한 경우를 선택적으로 지정하기 위한 체크 박스) 등을 포함할 수 있다. 오류 보고 메뉴를 통해, 사용자는 표시된 영상 프레임 내에서 오류의 위치를 지정하고, 오류의 내용을 입력할 수 있다.

S911 단계에서, 표시 장치는 입력 정보에 기반한 학습 데이터를 생성한다. 그리고, 도 9에 도시되지 아니하였으나, 표시 장치는 생성된 학습 데이터를 재학습을 위해 서버로 송신할 수 있다. 이에 따라, 서버는 오류 보고를 기반으로 생성된 학습 데이터를 이용하여 재학습을 수행할 수 있다. 이때, 서버는 미리 정의된 양만큼의 오류 보고에 기반한 학습 데이터가 누적되면, 재학습을 수행할 수 있다.

본 발명의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 발명에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.

본 발명의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 발명의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.

또한, 본 발명의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.

본 발명의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.

상술한 내용은 내시경 영상을 분석하는 분야뿐 아니라, 인공지능에 기반하여 의료 영상을 분석하는 다양한 의료 영상 분야에 적용하는 것이 가능하다.

Claims

내시경 영상을 분석하는 서버의 동작 방법은,

내시경 장비를 통해 촬영된 제1 영상 프레임이 임계 수준 이상의 선명도를 가지는지 여부를 판단하는 단계;

상기 임계 수준 이상의 선명도를 가지면, 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종의 영역을 판단하는 단계;

상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계;

상기 영역에 포함되는 대상이 용종이면, 제2 인공지능 모델을 이용하여 상기 용종의 유형을 분류하는 단계; 및

상기 영역의 위치 및 크기, 상기 용종의 유형에 대한 정보 중 적어도 하나를 포함하는 분석 결과를 송신하는 단계를 포함하고,

상기 제1 인공지능 모델 및 상기 제2 인공지능 모델은 상이한 인공지능 모델이고,

상기 영역은, 사각형 모양의 바운딩 박스에 의해 지시되는 방법.
청구항 1에 있어서,

상기 제1 영상 프레임이 임계 수준 이상의 선명도를 가지는지 여부는, 상기 제1 영상 프레임에 포함된 이미지인 제1 이미지 및 상기 제1 이미지를 블러링(blurring)함으로써 획득되는 제2 이미지에 기반하여 판단되는 방법.
청구항 2에 있어서,

상기 제1 영상 프레임이 임계 수준 이상의 선명도를 가지는지 여부를 판단하는 단계는,

상기 제1 이미지 및 상기 제2 이미지의 비교를 위한 비교 지표들을 생성하는 단계; 및

상기 비교 지표들에 기반한 입력 데이터로부터 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종을 검출할지 여부를 나타내는 출력 데이터를 생성하는 단계를 포함하는 방법.
청구항 1에 있어서,

청구항 1에 있어서,

상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계는,

상기 용종을 이물질과 구분하는 단계를 포함하고,

상기 이물질은 음식물 찌꺼기 및 기포 중 적어도 하나를 포함하는 방법.
청구항 1에 있어서,

상기 분석 결과를 토대로 수행된 오류 검사에 기반하여 생성된 학습 데이터로 학습을 수행하는 단계를 더 포함하고,

상기 오류 검사에 기반하여 생성된 학습 데이터는, 상기 분석 결과가 다른 장치에서 표시된 후, 상기 표시된 분석 결과에 대해 사용자가 용종이 아님을 지시하기 위해 입력한 오류 정보에 기반하여 생성되는 데이터이고,

상기 오류 정보는, 오류가 검출된 시점 및 오류의 위치 중 적어도 하나를 포함하는 방법.
청구항 1에 있어서,

상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계는,

상기 바운딩 박스에 포함되는 이미지의 일부의 픽셀 값들에 기반하여 상기 위치에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 단계를 포함하는 방법.
청구항 1에 있어서,

상기 제1 영상 프레임 및 상기 제1 영상 프레임 이후 촬영된 제3 영상 프레임 간의 이미지 변화 속도를 확인하는 단계;

상기 이미지 변화 속도에 대응하는 요구 응답 시간을 확인하는 단계;

상기 요구 응답 시간 및 현재 응답 시간을 비교하는 단계; 및

상기 비교 결과에 기반하여 연산량을 감소시키는 단계를 더 포함하고,

상기 요구 응답 시간은, 상기 이미지 변화 속도에 대응하여 요구되는 영상 프레임이 생성된 시점부터 검출 결과가 부가된 영상이 출력되기까지의 시간이고,

상기 현재 응답 시간은, 현재 측정된 영상 프레임이 생성된 시점부터 검출 결과가 부가된 영상이 출력되기까지의 시간인 방법.
청구항 1에 있어서,

상기 제1 영상 프레임보다 앞서 촬영된 제2 영상 프레임에서 용종의 영역을 판단하는 단계; 및

상기 영역의 위치 및 크기에 대한 정보를 송신하는 단계를 더 포함하는 방법.
청구항 8에 있어서,

상기 제1 영상 프레임에서 상기 용종의 영역을 판단하는 단계는,

상기 제2 영상 프레임에서 판단된 영역을 확장한 후보 영역을 결정하는 단계; 및

상기 제1 영상 프레임 중 상기 후보 영역에 대응하는 일부에서 상기 용종의 영역을 판단하는 단계를 포함하는 방법.
청구항 1에 있어서,

상기 제1 인공지능 모델 및 제2 인공지능 모델은, 상기 내시경 장비와 다른 내시경 장비에서 촬영된 이미지에 기반하여 생성된 학습 데이터를 이용하여 학습되며,

상기 학습 데이터는, 상기 내시경 장비에서 촬영된 제1 이미지 및 상기 다른 내시경 장비에서 촬영된 제2 이미지에 기반하여 보상된 이미지들을 포함하는 방법.
내시경 영상을 분석하는 서버는,

통신부; 및

프로세서를 포함하고,

상기 프로세서는,

내시경 장비를 통해 촬영된 제1 영상 프레임이 임계 수준 이상의 선명도를 가지는지 여부를 판단하고,

상기 임계 수준 이상의 선명도를 가지면, 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종의 영역을 판단하고,

상기 영역에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하고,

상기 영역에 포함되는 대상이 용종이면, 제2 인공지능 모델을 이용하여 상기 용종의 유형을 분류하고,

상기 영역의 위치 및 크기, 상기 용종의 유형에 대한 정보 중 적어도 하나를 포함하는 분석 결과를 송신하도록 제어하고,

상기 제1 인공지능 모델 및 상기 제2 인공지능 모델은 상이한 인공지능 모델이고,

상기 영역은, 사각형 모양의 바운딩 박스에 의해 지시되는 서버.
청구항 11에 있어서,

상기 제1 영상 프레임이 임계 수준 이상의 선명도를 가지는지 여부는, 상기 제1 영상 프레임에 포함된 이미지인 제1 이미지 및 상기 제1 이미지를 블러링(blurring)함으로써 획득되는 제2 이미지에 기반하여 판단되는 서버.
청구항 12에 있어서,

상기 프로세서는,

상기 제1 이미지 및 상기 제2 이미지의 비교를 위한 비교 지표들을 생성하고,

상기 비교 지표들에 기반한 입력 데이터로부터 제1 인공지능 모델을 이용하여 상기 제1 영상 프레임에서 용종을 검출할지 여부를 나타내는 출력 데이터를 생성하는 서버.
청구항 11에 있어서,

상기 프로세서는,

상기 용종을 이물질과 구분하고,

상기 이물질은, 음식물 찌꺼기 및 기포 중 적어도 하나를 포함하는 서버.
청구항 11에 있어서,

상기 프로세서는,

상기 분석 결과를 토대로 수행된 오류 검사에 기반하여 생성된 학습 데이터로 학습을 수행하고,

상기 오류 검사에 기반하여 생성된 학습 데이터는, 상기 분석 결과를 표시한 장치를 통해 사용자가 입력한 오류 정보에 기반하여 생성되는 데이터이고,

상기 오류 정보는, 오류가 검출된 시점 및 오류의 위치 중 적어도 하나를 포함하는 서버.
청구항 11에 있어서,

상기 프로세서는, 상기 바운딩 박스에 포함되는 이미지의 일부의 픽셀 값들에 기반하여 상기 위치에 포함되는 대상이 용종이 아닌 다른 대상인지 여부를 확인하는 서버.
청구항 11에 있어서,

상기 프로세서는,

상기 제1 영상 프레임 및 상기 제1 영상 프레임 이후 촬영된 제3 영상 프레임 간의 이미지 변화 속도를 확인하고,

상기 이미지 변화 속도에 대응하는 요구 응답 시간을 확인하고,

상기 요구 응답 시간 및 현재 응답 시간을 비교하고,

상기 비교 결과에 기반하여 연산량을 감소시키고,

상기 요구 응답 시간은, 상기 이미지 변화 속도에 대응하여 요구되는 영상 프레임이 생성된 시점부터 검출 결과가 부가된 영상이 출력되기까지의 시간이고,

상기 현재 응답 시간은, 현재 측정된 영상 프레임이 생성된 시점부터 검출 결과가 부가된 영상이 출력되기까지의 시간인, 서버.
청구항 11에 있어서,

상기 프로세서는,

상기 제1 영상 프레임보다 앞서 촬영된 제2 영상 프레임에서 용종의 영역을 판단하고,

상기 영역의 위치 및 크기에 대한 정보를 송신하도록 제어하는 서버.
청구항 18에 있어서,

상기 프로세서는,

상기 제2 영상 프레임에서 판단된 영역을 확장한 후보 영역을 결정하고,

상기 제1 영상 프레임 중 상기 후보 영역에 대응하는 일부에서 상기 용종의 영역을 판단하는 서버.
청구항 11에 있어서,

상기 제1 인공지능 모델 및 제2 인공지능 모델은, 상기 내시경 장비와 다른 내시경 장비에서 촬영된 이미지에 기반하여 생성된 학습 데이터를 이용하여 학습되며,

상기 학습 데이터는, 상기 내시경 장비에서 촬영된 제1 이미지 및 상기 다른 내시경 장비에서 촬영된 제2 이미지에 기반하여 보상된 이미지들을 포함하는 서버.