KR100520125B1 - 선충 분류 방법 - Google Patents

선충 분류 방법 Download PDF

Info

Publication number
KR100520125B1
KR100520125B1 KR10-2003-0068025A KR20030068025A KR100520125B1 KR 100520125 B1 KR100520125 B1 KR 100520125B1 KR 20030068025 A KR20030068025 A KR 20030068025A KR 100520125 B1 KR100520125 B1 KR 100520125B1
Authority
KR
South Korea
Prior art keywords
image
nematode
extracting
nematodes
feature information
Prior art date
Application number
KR10-2003-0068025A
Other languages
English (en)
Other versions
KR20050031767A (ko
Inventor
백중환
나원
홍승범
Original Assignee
학교법인 정석학원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인 정석학원 filed Critical 학교법인 정석학원
Priority to KR10-2003-0068025A priority Critical patent/KR100520125B1/ko
Publication of KR20050031767A publication Critical patent/KR20050031767A/ko
Application granted granted Critical
Publication of KR100520125B1 publication Critical patent/KR100520125B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Abstract

본 발명은 다수의 선충들을 분류하는 방법에 관한 것으로, 다수의 선충들을 분류하는 방법에 있어서, 카메라로부터 연속적으로 입력되는 선충의 영상데이터를 캡쳐하는 단계와; 상기 캡쳐된 선충의 영상데이터로부터 일차 이진화 이미지를 추출하는 단계와; 상기 추출된 일차 이진화 이미지에서 홀로 처리된 반사영역과 잡음을 제거하는 형태처리작업에 의해 이차 이진화 이미지를 추출하는 단계와; 상기 형태처리작업에 의해 추출된 이차 이진화 이미지로부터 일차 세선화 이미지를 추출하는 단계와; 상기 추출된 일차 세선화 이미지에서 불필요한 연결 픽셀 및 잡음을 제거하는 가지치기작업에 의해 이차 세선화 이미지를 추출하는 단계와; 상기 이차 이진화 및 세선화 이미지를 사용하여 적어도 선충의 면적, 길이, 비만도, 두께, 최적타원에 있어서 장축 및 단축의 길이와 이심률, 최소 외접 직사각형의 폭과 높이의 비, 진폭비율, 각도 변화율, 길이 대 이심률의 비를 포함하는 특징정보들을 추출하는 단계와; 다수의 선충들에 대해 특징정보들을 추출하고 상기 추출된 특징정보들을 이용한 소정의 분류알고리즘을 통해 상기 다수의 선충들을 분류하는 단계를 포함하는 것을 특징으로 한다.

Description

선충 분류 방법{Metheod for classifying mutants of Caenorhabditis Elegans}
본 발명은 다수의 선충들을 분류하는 방법에 관한 것으로, 선충의 영상데이터를 이용하여 상기 선충의 형태적 특징정보를 보다 정밀하게 추출하고, 상기 추출된 특징정보를 이용하여 상기 선충이 자연종인지 변종(돌연변이)인지를 객관적이고 정량적으로 분류함으로써 선충 분류에 대해 높은 신뢰성을 제공하는 선충 분류 방법에 관한 것이다.
최근 들어 유전자 연구자들은 질병과 연관된 70개의 인간 유전자 중 삼분의 일 이상이 기생충이나 효모, 박테리아와 같은 단순 유기체의 유전자와 아주 흡사하다는 사실을 발견하였다. 그리하여 많은 유전자 연구자들은 인체의 질병을 유발하는 생화학적 변화를 이해하기 위해 기생충이나 효모, 박테리아와 같은 단순 유기체의 유전자들을 연구하고 있다.
현재 유전자 연구자들이 가장 많이 사용하는 생물 모델 중의 하나는 선충(Caenorhabditis Elegans)이다. 상기 선충은 흙에서 박테리아를 먹고사는 생물로서, 수정란에서 성체에 이르기까지 세포분열 양상이 개체마다 동일하고, 자손들이 모두 부모세대와 같은 유전형을 갖기 때문에 돌연변이 개체를 번식시키기도 쉽다. 지금까지 선충의 유전자를 연구한 게놈 프로젝트로 밝혀진 바에 의하면, 선충의 염기서열은 인간 유전자의 1/3∼1/5인 수준인 유전자 19099개로 된 9천 7백만개의 DNA 염기쌍으로 이루어져 있으며, 지금까지 알려진 인간 유전자 5000개 가운데 75%를 공유하고 있다. 이러한 선충을 대상으로 하는 연구들은 주로 선충의 유전자 중 하나를 파괴하여 얻어진 돌연변이 개체에서 일어나는 변화를 관찰함으로써 인간 유전자의 기능을 추측하는 방식으로 진행되고 있으며 그 결과 현재 노화 조절, 노화 억제 등의 유전자 역할이 밝혀졌고, 이외 난치병 치료를 위한 유전자 등이 계속 연구되고 있다.
그런데, 이러한 연구가 활발히 수행됨에 따라 상기 선충이 자연종인지 변종(돌연변이)인지 더 나아가 서로 다른 변종을 자동으로 분류할 수 있는 시스템의 개발이 절실히 요구되고 있다. 종래에는 선충을 촬영하여 얻어진 영상데이터를 분석하여 특징정보를 추출하고 상기 추출된 특징정보를 이용하여 선충을 분류하는 시스템이 시도되고 있다. 이때 상기 특징정보들은 이진화된 영상과 상기 이진화 영상을 이용한 세선화 영상으로부터 추출하게 된다. 이에 상기 이진화 및 세선화 작업의 정확성이 자동 분류의 성능에 직접적으로 영향을 미치게 된다. 그러나 선충은 투명한 몸을 갖고 있고, 가끔 알을 낳거나 몸을 꼬는 등의 특별한 행동들을 보이므로 임계값을 이용한 단순한 이진화 작업으로 얻어진 이진화 이미지 및 상기 이진화 이미지로부터 얻어진 세선화 이미지에서 특징정보를 추출할 경우 많은 오류가 발생하는 문제점이 있었다. 또한, 종래 시스템은 객관적이고 정량적인 분류가 이루어지지 않고 있어 선충 분류에 대해 신뢰하기가 어렵다라는 문제점이 있었다.
본 발명은 상기와 같은 배경에서 제안된 것으로서, 선충의 형태적인 특징정보를 보다 정밀하게 추출할 수 있는 선충 분류 방법을 제공함을 그 목적으로 한다.
나아가 본 발명은 상기 추출된 특징정보를 이용하여 상기 선충이 자연종인지 변종(돌연변이)인지를 객관적이고 정량적으로 분류함으로써 선충 분류에 대해 높은 신뢰성을 제공하는 선충 분류 방법을 제공함을 그 목적으로 한다.
상기 목적을 달성하기 위한 본 발명에 따른 일 양상에 따른 다수의 선충들을 분류하는 방법은 서로 다른 종의 다수의 선충 영상을 카메라로부터 촬영한 후 상기 선충의 영상으로부터 먼저 일차 이진화 이미지를 추출하고, 추출된 일차 이진화 이미지에서 홀로 처리된 반사영역과 잡음이 제거된 이차 이진화 이미지를 추출한다. 이후 상기 이차 이진화 이미지로부터 일차 세선화 이미지를 추출하고, 추출된 일차 세선화 이미지로부터 불필요한 연결 픽셀 및 잡음이 제거된 이차 세선화 이미지를 추출한다. 이후 상기 이차 이진화 이미지와 이차 세선화 이미지를 통해 적어도 선충의 면적, 길이, 비만도, 두께, 최적타원에 있어서 장축 및 단축의 길이와 이심률, 엠.이.알, 진폭비율, 각도 변화율, 길이 대 이심률의 비를 포함하는 특징정보들을 추출한다. 이후 상기 추출된 특징정보들을 이용한 소정의 분류알고리즘을 통해 다수의 선충들을 분류한다.
이와 같은 본 발명의 특징적인 양상에 따른 선충분류방법은 선충의 형태적인 특징정보를 보다 정밀하게 추출하고, 상기 추출된 특징정보를 이용하여 상기 선충이 자연종인지 변종(돌연변이)인지를 객관적이고 정량적으로 분류함으로써 선충 분류에 대해 높은 신뢰성을 제공하는 것이다.
이하, 첨부된 도면을 참조하여 전술한, 그리고 추가적인 양상을 기술되는 바람직한 실시예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
도1 은 본 발명에 사용되는 선충 분류 장치의 전체적인 구성을 개략적으로 도시한 블록도이다. 도시된 바와 같이, 선충 분류 장치는 스테이지(stage)(10)와 스테이지 컨트롤러(stage controller)(20)와 물체확대부(30)와 촬상부(40)와 컴퓨터시스템(50)을 포함한다.
스테이지(stage)(10)는 분류하고자 하는 선충이 올려지는는 장치로서, 스테이지 컨트롤러(stage controller)(20)와 연결되는 연결대(21)를 고정하며 상기 연결대(21)와 모든 방향으로 슬라이딩 가능하게 결합되는 고정구(23)를 포함한다.
스테이지 컨트롤러(stage controller)(20)는 스테이지(stage)(10)와 연결되는 연결대(21)를 고정하는 고정구(25)와 상기 고정구(25)를 좌우 상하로 구동하기 위한 구동부(도시하지 않음.)와 상기 구동부의 동작을 제어하는 구동제어부(도시하지 않음.)를 포함한다.
물체확대부(30)는 상기 스테이지(stage)(10)에 올려지는 선충의 크기를 확대하기 위한 것으로서, 상기 선충의 크기가 대략 1㎜의 크기를 가지므로 대물렌즈의 배율이 50이상인 통상의 현미경으로 구현될 수 있으나 본 실시예에서는 입체 쌍안 현미경(Steromicroscope)으로 구현되는 것이 바람직하다.
촬상부(40)는 물체확대부(30)에서 확대된 선충을 촬영하는 것으로서, 640×480 이상의 고해상도를 가지는 CCD카메라로 구현되는 것이 바람직하다.
컴퓨터시스템(50)은 촬상부(40)로부터 입력되는 선충의 영상으로부터 이진화이미지 및 세선화 이미지를 추출하고 이를 통해 선충의 형태적인 특징정보를 추출하며 상기 추출된 특징정보를 이용하여 상기 선충이 자연종인지 변종(돌연변이)인지를 객관적이고 정량적으로 분류할 수 있는 분류프로그램을 탑재한다.
표시부(54)는 촬상부(40)에서 전송되는 영상신호를 디스플레이하는 것으로서, CRT 모니터, TFT-LCD모니터 등으로 구현될 수 있다. 조작부(53)는 사용자의 조작신호를 입력받는 것으로서, 유무선 키보드 등으로 구현될 수 있다. 메모리(52)는 분류프로그램을 포함한 프로그램 실행 파일과 관련 데이터들이 저장된다.
제어부(51)는 촬상부(40)로부터 연속적으로 전송되는 선충의 영상데이터를 캡쳐하고 이를 탑재된 분류 프로그램에 소스데이터로 사용하여 선충을 분류하는 동작을 수행한다. 또한, 제어부(51)는 스테이지 컨트롤러(stage controller)(20)의 구동제어부와 RS-232 직렬인터페이스장치로 연결되며, 상기 RS-232 직렬인터페이스장치를 통해 구동제어부로 사용자의 조작명령신호를 출력한다.
도2 는 본 발명의 실시예에 따른 선충의 특징정보 추출 및 선충의 분류 흐름도이고, 도3 은 본 발명의 일실시예에 따른 선충의 입력영상 예시도이고, 도4a 는 본 발명의 일실시예에 따른 선충의 일차 이진화 이미지 예시도이고, 도4b 는 본 발명의 일실시예에 따른 선충의 이차 이진화 이미지 예시도이고, 도5a 는 본 발명의 일실시예에 따른 선충의 일차 세선화 이미지 예시도이고, 도5b 는 본 발명의 일실시예에 따른 선충의 이차 세선화 이미지 예시도이다. 이하, 도2 내지 도5를 참조하여 설명하기로 한다.
도2를 참조하면, 선충의 특징정보를 추출하기 위해서는 우선적으로 CCD카메라로부터 입력되는 선충의 영상데이터를 캡쳐하고 상기 캡쳐된 영상데이터를 디지털 영상데이터로 변환(41단계)하여야 한다. 본 실시예에서는 전술한 바와 같이 상기 CCD카메라로부터 연속적으로 입력되는 선충의 영상데이터를 초당 2프레임씩 5분간 캡쳐하여 총 600개의 그레이영상데이터를 획득한다. 이는 면적, 길이, 비만도,두께를 포함하는 선충의 크기에 관련된 특징정보 뿐만 아니라 최적타원에 있어서 장축과 단축의 길이 이심률, 최소 외접 직사각형(M.E.R)의 폭과 높이의 비, 진폭변화율, 각도변화율, 길이 대 이심률의 비율을 포함하는 선충의 움직임에 관련된 특징정보를 객관적이고 정량적으로 추출하기 위함이다.
상술한 바와 같이 디지털화된 선충의 영상데이터들을 획득하였으면, 이후 획득된 영상데이터 각각으로부터 선충의 이진화 이미지를 추출(42단계)한다. 본 실시에에서는 각 선충영상을 5(pixel)×5(pixel) 크기의 블록으로 분할한 다음, 각 블록의 밝기(조도 또는 휘도)값을 추출한다. 여기서 블록의 밝기값은 통상적인 계조도를 사용하여 추출할 수 있는데 이는 이건 출원일 이전에 널리 공지된 것이므로 자세한 설명은 생략하기로 한다. 각 블록의 밝기값을 추출하였으면 이후 각 블록 밝기값의 평균과 표준편차를 구한다. 이후 해당 블록의 밝기값 평균을 선충영상의 배경 밝기값과 비교하여 해당 블록의 밝기값 평균이 배경 밝기값의 70% 이하일 경우 해당 블록을 선충의 이미지로 처리한다. 일 실시예에 있어서, 배경 밝기값은 도 3에서 도시된 직사각형 선충영상에서 각 꼭지점의 픽셀의 밝기값 중 가장 밝은 것으로 정한다. 나아가 본 실시예에서는 도3에 도시된 바와 같이 선충의 몸에 의한 반사광에 의해 실제 선충의 몸보다 밝게 처리된 영역을 고려하여 표준편차가 밝기값 평균의 30%이상일 경우 해당 블록을 이루는 픽셀을 선충의 이미지로 처리하여 일차 이진화 이미지를 추출한다.
도4a를 참조하면, 일차로 추출된 선충의 이진화 이미지가 완전히 선충의 몸을 이진화하지 못하였음을 알 수 있다. 이에 상기 일차로 추출된 이진화 이미지에서 홀(hole)로 처리된 반사영역과 잡음 객체로 남은 알을 제거(43단계)하는 형태처리 작업을 수행한다. 본 실시예에서 상기 형태처리 작업은 채움작업(Closing)과 라벨링(Labeling)작업을 포함하며 이는 이미 널리 공지된 것으로서 이에 대한 자세한 설명은 생략하기로 한다.
도4b를 참조하면, 형태처리작업을 통해 완전한 선충의 이차 이진화 이미지가 추출되었음을 알 수 있다. 이후 상기 이차 이진화 이미지로부터 일차 세선화 이미지를 추출(44단계)한다. 본 실시예에서는 상기 일차 세선화 이미지를 획득하기 위해 Zhang & Suen의 병렬 세선화 알고리즘을 이용한다.
도5a를 참조하면, 44단계에서 얻어진 일차 세선화 이미지에는 불필요한 연결 픽셀 및 잡음이 포함되어 있음을 알 수 있다. 이에, 본 실시예에서는 상기 일차 세선화 이미지에서 불필요한 연결 픽셀 및 잡음 제거하는 가지치기(pruning) 작업을 수행하여 보다 완전한 이차 세선화 이미지를 추출(45단계)한다. 상기 가지치기 (pruning) 작업 또한 이미 널리 공지된 것으로서 이에 대한 자세한 설명은 생략하기로 한다.
이후 43단계 및 45단계에서 획득된 이차 이진화 이미지 및 이차 세선화 이미지를 사용하여 선충의 형태적인 특징정보를 추출(46단계)한다. 여기서, 상기 선충의 형태적인 특징정보는 선충의 면적, 길이, 비만도, 두께, 최적타원에 있어서 장축과 단축의 길이 및 이심률, 최소 외접 직사각형(M.E.R)의 폭과 높이의 비, 진폭비율 각도 변화율 및 길이 대 이심률 비율을 포함한다. 상기 특징정보를 추출하는 과정에 대한 자세한 설명은 후술하기로 한다.
46단계를 통해 선충의 형태적인 특징정보를 추출하였으면, 상기 추출된 특징정보 중에 주성분분석(PCA:Principal Component Analysis)을 통해 대표 특징정보를 추출(47단계)한다. 상기 주성분분석(PCA:Principal Component Analysis)을 통한 대표 특징정보를 추출하는 과정에 대한 자세한 설명은 후술하기로 한다.
46단계 또는 47단계를 통해 선충의 형태적인 특징정보 혹은 대표 특징정보를 추출하였으면, 상기 특징정보를 이용한 소정의 분류 알고리즘을 통해 선충이 자연종인지 변종인지, 나아가 어떠한 변종인지를 분류(48단계)한다. 바람직한 실시예에 있어서, 상기 분류 알고리즘은 계층적 클러스터링(Hierarchical clustering)을 사용한다. 상기 계층적 클러스터링(Hierarchical clustering)을 사용하여 선충을 분류하는 과정에 대한 자세한 설명은 후술하기로 한다.
이하, 선충의 특징정보를 추출하는 과정을 도면을 참조하여 상세히 설명하기로 한다. 도6a, 도6b 는 선충의 두께를 구하는 예시도이고, 도7a 는 선충의 최적 타원 예시도이고, 도7b 는 도7a의 선충을 기울기 회전에 의한 MER 예시도이고, 도8 은 선충의 진폭 비율을 구하는 예시도이다. 이하, 도6 내지 도8을 참조하여 설명하기로 한다.
상술한 바와 같이 선충의 형태적인 특징정보는 선충의 면적, 길이, 비만도, 두께, 최적타원에 있어서 장축과 단축의 길이 및 이심률, 최소 외접 직사각형(M.E.R)의 폭과 높이의 비, 진폭비율, 각도 변화율 및 길이 대 이심률 비율을 포함한다. 여기서, 선충의 면적( A )은 이차 이진화 이미지(도4b 참조)에서 1값을 갖는 픽셀의 수이고, 선충의 길이( L )는 이차 세선화 이미지(도5b 참조)에서 1값을 갖는 픽셀의 수이다. 각각의 이미지의 크기를 N ×M, 이진화 이미지의 픽셀값을 b(x,y), 세선화 이미지의 픽셀값을 s(x,y)라고 하면, 선충의 면적( A )과 길이( L )는 하기 수학식 1에 근거하여 산출할 수 있다.
상술한 바와 같이 선충의 면적( A )과 길이( L )를 산출하였으면 이후 선충의 비만도(fatness)를 ( A / L )로 간단히 구할 수 있다.
이하, 도6a, 6b를 참조하여 선충의 두께를 구하는 과정을 설명하기로 한다. 상기 선충의 면적( A )과 길이( L )는 각각 이진화 이미지와 세선화 이미지를 통해 산출할 수 있으나, 도6a, 6b에 도시된 바와 같이, 상기 선충의 두께는 세선화 이미지와 이진화 이미지를 모두를 사용하여야 한다. 도6a에 도시된 바와 같이 본 실시예에서 선충의 두께는 머리와 꼬리와 중심부분( L /2이 되는 지점)으로 나누어서 산출한다. 여기서, 선충의 두께를 구하는 과정은 먼저 몸통을 가로 지르는 골격선의 기울기()를 구하고, 이후 이진화 이미지에서 상기 기울기()에 대하여 중심을 수직으로 지나는 직선 1 및 상기 직선 1에서 ±5°씩 기울어진 직선 2,3과 만나는 두점의 선충의 테두리 좌표를 이진화 이미지에서 구하고, 이후 각각의 두점 사이의 거리를 산출하는 과정으로 이루어진다. 이때 본 실시예에서는 세 개의 거리값 중 가장 긴 것을 선충의 두께로 정한다.
이제, 중심부분에서의 선충의 두께를 상술한 과정을 따라 설명하기로 한다. 먼저 도6b에 도시된 바와 같이 몸통을 가로 지르는 골격선의 기울기()를 구하기 위해 기준 픽셀과 상기 기준 픽셀 전후의 4픽셀의 좌표를 조사한다. 이후 굴곡진 선충의 몸에 가장 잘 맞는 골격선을 찾기 위해 기준 픽셀의 좌표를 s(x,y)라고 하고, 상기 기준 픽셀의 좌표를 평균으로 9픽셀의 분산(variance),과 공통분산 (covariance)를 하기 수학식 2에 근거하여 산출한다.
상술한 바와 같이 9픽셀의 분산(variance),과 공통분산(covariance) 를 구하였으면, 상기 값들을 이용하여 9픽셀의 기울기()를 하기 수학식 3에 근거하여 산출한다.
이후 전술한 바와 같이 이진화 이미지에서 상기 기울기()에 대하여 중심을 수직으로 지나는 직선 1 및 상기 직선 1에서 ±5°씩 기울어진 직선 2,3과 만나는 두점의 선충의 테두리 좌표를 구하고, 이후 각각의 두점 사이의 거리를 산출한다. 이때 본 실시예에서는 세 개의 거리값 중 가장 긴 것을 선충의 두께로 정한다.
중심부분에서의 선충의 두께를 구하였으면, 이후 머리와 꼬리부분에서의 선충의 두께도 동일한 과정으로 산출한다. 단 이때 평균이 되는 기준 픽셀의 좌표는 머리 또는 꼬리의 양 끝에서 7번째 위치한 픽셀의 좌표로 정한다.
본 실시예에서는 선충들이 종류마다 운동성이 다르다는 점에 착안하여 움직일 때마다 변하는 몸의 형태적인 특징 예를 들어, 최적타원에 있어서 장축과 단축의 길이 및 이심률, 최소 외접 직사각형(M.E.R)의 폭과 높이의 비, 진폭비율, 각도 변화율 및 길이와 이심률의 비율을 새로운 특징정보로 사용한다.
이하, 도7a 를 참조하여 선충의 최적 타원에 있어서 장축과 단축의 길이와 이심률을 구하는 과정을 설명하기로 한다. 선충의 선충의 최적 타원에 있어서 장축과 단축의 길이와 이심률을 구하는 과정은 먼저, 도7a 처럼 선충의 최적타원을 찾고, 이후 상기 최적타원에 포함된 이진화 이미지의 픽셀좌표들로부터 무게중심 좌표(,)를 구하고, 이후 상기 무게중심 좌표(,)를 평균으로 하여 분산 (variance),과 공통분산(covarianc e)를 구하고, 이후 상기 분산(varia nce),과 공통분산(covariance)를 이용하여 장축과 단축의 길이와 이심률을 산출하는 과정으로 이루어진다. 일 실시예에 있어서, 상기 선충의 최적타원은 선충의 이차 이진화 이미지에서 선충의 양끝 두점의 픽셀을 잇는 선을 장축으로 하고, 상기 장축과 직각을 이루는 선을 단축으로 설정한 후 선충의 양끝 두점의 픽셀과 임의의 픽셀을 지나는 타원선을 통해 구할 수 있다. 분산(variance), 과 공통분산(covariance)은 전술한 수학식2로 산출할 수 있고, 상기 최적타원에 포함된 이진화 이미지의 픽셀좌표로부터 무게중심 좌표(,)와 장축(m)과 단축(n)의 길이와 이심률(e)은 하기 수학식 4에 근거하여 산출한다.
이하, 도7b 를 참조하여 최소 외접 직사각형(M.E.R)의 폭과 높이의 비를 구하는 과정을 설명하기로 한다. 상기 최소 외접 직사각형(M.E.R)의 폭과 높이의 비는 도7a에 도시된 타원의 장축(m)이 기준선에 대하여 기울어진 기울기()만큼 선충을 회전시켜 얻은 영상의 최소크기를 의미한다. 본 실시예에서 상기 최소 외접 직사각형(M.E.R)의 폭과 높이의 비에 대한 특징값은 도7b에 도시된 바와 같이 기준선에 평행하게 배치된 선충의 영상에서 최소높이 대 너비의 비(w/h)를 사용한다. 여기서, 상기 타원의 장축(m)의 기준선에 대한 기울기()는 전술한 수학식 2,3에 근거하여 산출할 수 있다.
이하, 도8 를 참조하여 선충의 움직임에 의해 생긴 굴곡의 진폭 비율을 구하는 과정을 설명하기로 한다. 여기서, 진폭을 측정하기 위한 기준선은 도 8에 도시된 바와 같이 머리와 꼬리, 끝점을 잇는 선으로 한다. 선충의 진폭은 이진화 이미지 위의 픽셀들 중에서 기준선과의 수직 거리가 가장 먼 픽셀까지의 거리를 피크치로 정한다. 본 실시예에서, 진폭은 도8 에 도시된 바와 같이 기준선에 대하여 양과 음의 두방향으로 피크치를 갖으므로 각각의 진폭피크치를 구한다. 이때 진폭비율 (A,r)은 바로 두 피크치의 비율을 의미하며 하기 수학식 5에 근거하여 산출한다.
본 실시예에서는 끝점이 하나인 경우에는 끝점에서 가장 멀리 떨어진 픽셀의 위치를 임시 끝점으로 간주한다. 한편, 끝점이 아예 없는 경우 즉, 환 형태를 취한 경우에는 가장 긴 지름이 기준선이 되며, 이때 진폭비율은 1이 된다.
본 실시예에서는 선충의 또다른 형태적 특징정보로 각도 변화율을 사용한다. 상기 각도 변화율은 선충의 세선화 이미지에서 골격선의 기울기가 변화하는 정도에 대한 수치이다. 상기 각도 변화율을 구하는 과정은 먼저, 전체 골격선을 10 픽셀씩 나누어서 각각의 기울기를 계산하고, 이후 이전 기울기와의 차이를 구하고, 이후 차이값들의 평균을 산출하는 과정으로 이루어진다. 본 실시예에서 각도 변화율의 특징값은 상기 평균을 사용한다. 여기서, i번째 기울기를 각(Ai)으로 표현할 때, 세선화 이미지의 픽셀값 s(x,y)를 이용하여 각(Ai)와 전후 각들 사이의 차이(Di)와 평균()는 하기 수학식 6에 근거하여 산출한다.
,
여기서, I는 전체 차이값들의 개수이다.
본 실시예에서는 선충의 크기와 움직임의 연관성을 조사하고자 선충의 길이와 최적 타원의 이심률의 비율을 또다른 특징정보로 사용한다.
이하, 상기 특징정보를 이용한 계층적 클러스터링(Hierarchical clustering) 기법을 통해 선충 종류를 분류하는 과정을 설명하기로 한다.
일반적으로, 상기 계층적 클러스터링(Hierarchical clustering) 기법은 개개의 데이터들을 유사도에 따라 계층적으로 그룹(cluster)화해 나가는 과정을 의미하며, 작은 그룹(cluster)에서 큰 그룹(cluster)으로 묶어나가는 병합식과 큰 그룹(cluster)에서 작은 그룹(cluster)으로 나눠가는 분할식이 있다. 본 실시예에서는 병합식을 사용하며, 상기 유사도를 측정하기 위한 방법은 여러 방법 중 각 그룹(cluster)간의 거리를 비교하는 방식을 사용한다.
일실시예에 있어서 상기 계층적 클러스터링(Hierarchical clustering) 기법으로는 최소분산법(minimum variance method)을 사용할 수 있다. 상기 최소분산법 (minimum variance method)은 모든 그룹(cluster) 쌍 사이에서 반복을 통해 가장 작은 자승오차(E)를 가지는 그룹(cluster)들을 병합해 나가는 방식이다. 구체적으로, 분류하고자 하는 n개의 그룹(cluster)으로 이루어진 전체 그룹(cluster)에서 각각의 그룹(cluster)이 m개의 샘플()을 포함하며 각각의 샘플 ()은 d개의 특징정보()를 포함한다고 가정하고 상기 최소분산법의 과정을 설명하기로 한다.
a)n개의 그룹(cluster) 중 임의의 두 개의 그룹(cluster)을 병합하여 개의 새로운 전체 그룹(cluster)을 만든다.
b)이후, 개의 새로운 전체 그룹(cluster) 중 어느 것이 적합하게 병합된 전체 그룹(cluster) 인가를 알아내기 위하여 개의 전체 그룹(cluster) 각각에 대한 총 자승오차(E)를 하기 수학식 7를 근거하여 산출한다.
,
,
여기서,는 전체 그룹(cluster) 내의 하나의 그룹(cluster)에 대한 자승오차이고,는 샘플의 특징정보이고,는 임의의 특징정보에 대한 m개의 샘플들의 평균값이다.
c)개의 전체 그룹(cluster) 각각에 대한 총 자승오차(E)을 구하였으면, 개중 총 자승오차(E)가 가장 작은 전체 그룹(cluster)을 선택한다.
d)이후 c)에서 선택된 전체 그룹(cluster)에 대해 a),b),c)과정을 반복 수행하여 새로운 전체 그룹(cluster)을 선택하여 처음 전체 그룹(cluster)을 이루는 각각의 그룹(cluster)들을 병합해 나간다.
본원 출원 발명자들은 이상에서 제시한 클러스터링 방식을 이용하여 선충을 자동 분류하는 실험을 수행하였다. 본원 출원 발명자들은 객관적이고 정량적으로 선충의 종류를 분류하기 위해 선충의 자연종(Wild)과 3종의 변종(Gol-1,Nic-1,Egl-19)을 각각 100마리씩 샘플로 선택하였다. 이후 전술한 바와 같이 하나의 선충에 대해 총 600개의 영상데이터를 획득한 후, 이진화와 세선화 이미지 처리과정을 거쳐 상기 600개의 영상데이터별로 선충의 형태적인 특징정보들을 추출하고, 추출된 특징정보들 각각의 대표값을 산출하였다. 본 실시예에서 하나의 선충에 대한 상기 특징정보들 각각의 대표값은 분류의 극단적인 에러를 피하기 위해 상기 600개의 특징정보들 중 최상위 10%와 최하위 10%를 제거한 480개의 평균으로 정한다. 본원 출원 발명자들은 상기와 같은 과정을 통해 얻은 각 선충의 종류별로 선택된 100마리의 선충마다의 특징정보들 각각의 대표값을 이용한 계층적 클러스터링 (Hierarchical clustering) 과정을 통해 표1과 같은 선충 분류 결과를 확인하였다.
<표 1>
구분 분류된 선충타입
Wild Goa-1 Nic-1 Egl-19
실제선충타입 Wild 92 6 0 2
Goa-1 1 97 1 1
Nic-1 0 9 91 0
Egl-19 4 2 0 94
상기 표1에서 알 수 있듯이 자연형과 변종 모두 90% 이상 정확하게 분류되었다.
도9 는 본 발명에 따른 주성분분석(PCA:Principal Component Analysis) 결과 예시도이다. 본원 출원 발명자들은 주성분분석(PCA:Principal Component Analysis)을 통해 얻은 새로운 특징정보를 사용한 클러스터링 방식을 통해 선충을 자동 분류하는 실험을 수행하였다.
주성분분석(PCA:Principal Component Analysis)은 다량의 특징정보를 가능한 한 정보의 손실없이 소수개의 특징정보로 대표시키는 즉, 특징정보의 차수축소를 통하여 가급적 적은(2∼3개) 새로운 변수(주성분)로 전체의 변동을 설명하려는 다변량 자료분석기법이다. 이하, 본 명세서에서는 컴퓨터에서 수행되는 대표 특징정보 추출과정을 당업자가 용이하게 이해할 수 있도록 중요한 처리과정만을 기재하기로 한다.
본 실시예에서는 다수의 특징정보의 차수를 줄이기 위해 투영기법을 이용하는데 투영하여 사용될 새로운 기준성분축(Principal Component)은 기존의 각 특징축의 단위 벡터에 적절한 계수를 곱한 다항식으로 표현된다.
도 9에서 도시된 바와 같이, 상위 10개의 큰 분산을 갖는 기준성분축 (Principal Component)에 기여한 특징들의 기여회수를 측정한 결과 상위 10개의 기준성분축에 3번 이상 중요하게 기여한 특징들을 추출하여 표2와 같은 결과를 확인하였다.
<표2>
특징정보 비만도최대값 중심 두께최소값 중심 두께평균값 최적타원단축길이최소값 최적타원이심률최소값 각도변화율최대값
기여회수 3 3 3 4 3 3
상기와 같이 주성분분석(PCA:Principal Component Analysis)을 통해 중요한 몇 개의 대표 특징정보를 구하고 이들을 가지고 계층적 클러스터링(Hierarchical clustering)을 통해 선충을 분류하여 표 3과 같은 선충 분류 결과를 확인하였다.
<표 3>
구분 분류된 선충타입
Wild Goa-1 Nic-1 Egl-19
실제선충타입 Wild 100 0 0 0
Goa-1 0 100 0 0
Nic-1 0 0 100 0
Egl-19 0 2 0 100
상기 표2에서 알 수 있듯이 자연형과 변종 모두 100% 정확하게 분류되었다.
이상에서 설명한 바와 같이, 본 발명에 따른 선충분류방법은 선충 영상에서 보다 정밀한 이진화 및 세선화 이미지를 획득함으로써 상기 이진화 및 세선화 이미지로부터 정밀한 특징정보를 추출할 수 있다. 나아가 상기 추출된 특징정보를 통해 최소분산법을 사용한 계층적 클러스터링(Hierarchical clustering)을 수행하여 다수의 선충을 분류하여 90% 이상의 분류결과를 얻을 수 있었다. 더 나아가 추출된 다수의 특징정보에서 주성분분석(PCA:Principal Component Analysis)을 통해 새로운 대표 특징정보를 추출하여 이를 통해 최소분산법을 사용한 계층적 클러스터링(Hierarchical clustering)을 수행하여 다수의 선충을 분류하한 결과 100% 선충들을 각 종류대로 분류하는 결과를 얻어 수 있었다.
상술한 바와 같이 본 발명에 따른 선충분류방법은 기존의 이진화 및 세선화 작업 외에 추가적인 수정작업을 통해 보다 정밀한 이진화 및 세선화 이미지를 획득하고 이를 통해 선충의 형태적 특징정보를 추출할 수 있는 장점이 있다.
또한, 본 발명에 따른 선충분류방법은 추출된 특징정보를 이용하여 상기 선충이 자연종인지 변종(돌연변이)인지를 객관적이고 정량적으로 분류함으로써 선충 분류의 신뢰도를 높일 수 있는 효과가 있다.
본 발명은 첨부된 도면을 참조하여 바람직한 실시예를 중심으로 기술되었지만 당업자라면 이러한 기재로부터 본 발명의 범주를 벗어남이 없이 많은 다양한 자명한 변형이 가능하다라는 것은 명백하다. 따라서, 이러한 많은 변형예들을 포함하도록 기술된 특허청구범위에 의해서 해석되어져야 할 것이다.
도1 은 본 발명에 사용되는 선충 분류 장치의 개략적인 전체 구성도.
도2 는 본 발명의 실시예에 따른 선충의 특징정보 추출 및 선충의 분류 흐름도.
도3 은 본 발명의 일실시예에 따른 선충의 입력영상 예시도.
도4a 는 본 발명의 일실시예에 따른 선충의 일차 이진화 이미지 예시도.
도4b 는 본 발명의 일실시예에 따른 선충의 이차 이진화 이미지 예시도.
도5a 는 본 발명의 일실시예에 따른 선충의 일차 세선화 이미지 예시도.
도5b 는 본 발명의 일실시예에 따른 선충의 이차 세선화 이미지 예시도.
도6a 는 선충의 두께를 구하는 예시도.
도6b 는 선충의 두께를 구하는 예시도.
도7a 는 선충의 최적 타원 예시도.
도7b 는 도7a의 선충의 최소직사각형 예시도.
도8 은 선충의 진폭 비율을 구하는 예시도.
도9 는 본 발명에 따른 계층적 클러스터링 결과 예시도.

Claims (6)

  1. 다수의 선충들을 분류하는 방법에 있어서,
    카메라로부터 연속적으로 입력되는 선충의 영상데이터를 캡쳐하는 단계와;
    상기 캡쳐된 선충의 영상데이터로부터 일차 이진화 이미지를 추출하는 단계와;
    상기 추출된 일차 이진화 이미지에서 홀로 처리된 반사영역과 잡음을 제거하는 형태처리작업에 의해 이차 이진화 이미지를 추출하는 단계와;
    상기 형태처리작업에 의해 추출된 이차 이진화 이미지로부터 일차 세선화 이미지를 추출하는 단계와;
    상기 추출된 일차 세선화 이미지에서 불필요한 연결 픽셀 및 잡음을 제거하는 가지치기작업에 의해 이차 세선화 이미지를 추출하는 단계와;
    상기 이차 이진화 및 세선화 이미지를 사용하여 적어도 선충의 면적, 길이, 비만도, 두께, 최적타원에 있어서 장축 및 단축의 길이와 이심률, 최소 외접 직사각형의 폭과 높이의 비, 진폭비율, 각도 변화율, 길이 대 이심률의 비를 포함하는 특징정보들을 추출하는 단계와;
    다수의 선충들에 대해 특징정보들을 추출하고 상기 추출된 특징정보들을 이용한 소정의 분류알고리즘을 통해 상기 다수의 선충들을 분류하는 단계;
    를 포함하는 것을 특징으로 하는 선충 분류 방법.
  2. 청구항 1에 있어서, 상기 선충 분류 방법이:
    상기 추출된 특징정보 중 대표 특징정보를 추출하는 단계를 더 포함하는 것을 특징으로 하는 선충 분류 방법.
  3. 청구항 1 또는 청구항 2에 있어서, 상기 이진화 이미지를 추출하는 단계가:
    선충의 영상이미지를 일정한 크기의 블록으로 분할하는 단계와;
    상기 각 블록의 밝기값을 추출하는 단계와;
    상기 블록 밝기값의 평균을 산출하는 단계와;
    상기 블록 밝기값 평균과 상기 선충의 영상이미지의 배경 밝기값을 비교하여 그 결과에 따라 상기 블록의 화소값을 처리하는 단계;
    를 포함하는 것을 특징으로 하는 선충 분류 방법.
  4. 청구항 3에 있어서, 상기 이진화 이미지를 추출하는 단계가:
    상기 블록 밝기값의 표준편차를 산출하는 단계와;
    상기 표준편차와 블록 밝기값의 평균을 비교하여 그 결과에 따라 블록의 화소값을 처리하는 단계;
    를 포함하는 것을 특징으로 하는 선충 분류 방법.
  5. 청구항 1에 있어서, 상기 다수의 선충들을 분류하는 단계가:
    최소 분산법을 사용한 계층적 클러스터링 방식의 분류알고리즘을 통해 다수의 선충들을 분류하는 것을 특징으로 하는 선충 분류 방법.
  6. 청구항 2에 있어서, 상기 대표 특징정보를 추출하는 단계가:
    주성분분석(PCA:Principal Component Analysis)을 통해 새로운 대표 특징정보를 추출하는 것을 특징으로 하는 선충 분류 방법.
KR10-2003-0068025A 2003-09-30 2003-09-30 선충 분류 방법 KR100520125B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2003-0068025A KR100520125B1 (ko) 2003-09-30 2003-09-30 선충 분류 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0068025A KR100520125B1 (ko) 2003-09-30 2003-09-30 선충 분류 방법

Publications (2)

Publication Number Publication Date
KR20050031767A KR20050031767A (ko) 2005-04-06
KR100520125B1 true KR100520125B1 (ko) 2005-10-11

Family

ID=37236579

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0068025A KR100520125B1 (ko) 2003-09-30 2003-09-30 선충 분류 방법

Country Status (1)

Country Link
KR (1) KR100520125B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100791389B1 (ko) * 2006-12-26 2008-01-07 삼성전자주식회사 스트럭쳐드 라이트를 이용한 거리 측정 장치 및 방법
CN104933727A (zh) * 2015-07-06 2015-09-23 王跃宣 移动微型目标提取方法和装置
CN108205669B (zh) * 2018-05-21 2018-09-11 上海小慧智能科技有限公司 线虫识别方法及装置

Also Published As

Publication number Publication date
KR20050031767A (ko) 2005-04-06

Similar Documents

Publication Publication Date Title
US20230419696A1 (en) Image analysis method, apparatus, program, and learned deep learning algorithm
CN110866893B (zh) 基于病理图像的tmb分类方法、系统及tmb分析装置
US8600143B1 (en) Method and system for hierarchical tissue analysis and classification
US6529612B1 (en) Method for acquiring, storing and analyzing crystal images
US5848177A (en) Method and system for detection of biological materials using fractal dimensions
US7949181B2 (en) Segmentation of tissue images using color and texture
US8687879B2 (en) Method and apparatus for generating special-purpose image analysis algorithms
US7042639B1 (en) Identification of cells with a compact microscope imaging system with intelligent controls
Comaniciu et al. Cell image segmentation for diagnostic pathology
Dima et al. Automatic segmentation and skeletonization of neurons from confocal microscopy images based on the 3-D wavelet transform
US8306312B2 (en) Method and apparatus for detecting pattern defects
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
US7970212B2 (en) Method for automatic detection and classification of objects and patterns in low resolution environments
JP2022551683A (ja) 人工知能(ai)モデルを使用した非侵襲的遺伝子検査を行う方法及びシステム
JP2013526717A5 (ko)
US20230178187A1 (en) Synthetic ihc-stained digital sides generated using artificial neural networks
WO2017150194A1 (ja) 画像処理装置、画像処理方法及びプログラム
CN1162798C (zh) 基于多类支持向量机的中医舌色、苔色、舌苔厚度分析方法
EP2504697A1 (en) Methods and system for recognizing wood species
CN114945941A (zh) 用于支持肿瘤检测和分析的非肿瘤分割
US20040014165A1 (en) System and automated and remote histological analysis and new drug assessment
KR100520125B1 (ko) 선충 분류 방법
JP3431883B2 (ja) 細胞系譜抽出方法
KR20180007071A (ko) 디지털 병리 시스템의 환자 케이스 동일성 판단 방법
RU2295297C2 (ru) Способ исследования и диагностики состояния биологического объекта или его части

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110915

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20120823

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee