KR20230001976A - 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법 - Google Patents

이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법 Download PDF

Info

Publication number
KR20230001976A
KR20230001976A KR1020210085150A KR20210085150A KR20230001976A KR 20230001976 A KR20230001976 A KR 20230001976A KR 1020210085150 A KR1020210085150 A KR 1020210085150A KR 20210085150 A KR20210085150 A KR 20210085150A KR 20230001976 A KR20230001976 A KR 20230001976A
Authority
KR
South Korea
Prior art keywords
species
image
classification model
model
species classification
Prior art date
Application number
KR1020210085150A
Other languages
English (en)
Inventor
박현철
안으리
Original Assignee
대한민국(관리부서: 행정안전부 국립과학수사연구원장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(관리부서: 행정안전부 국립과학수사연구원장) filed Critical 대한민국(관리부서: 행정안전부 국립과학수사연구원장)
Priority to KR1020210085150A priority Critical patent/KR20230001976A/ko
Publication of KR20230001976A publication Critical patent/KR20230001976A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

생물학적 종(생물종)(Biological Species)에 대해 고유한 형태적 특징인 특정 형질을 딥러닝(Deep Learning)을 이용한 이미지 학습을 통해 생물종 분류 모델을 구축하고, 특정 형질에 대한 이미지만을 이용하여 생물학적 종을 예측할 수 있도록 한 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법에 관한 것으로서, 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하고, 수집한 이미지를 보정하며, 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하여 생물종 분류를 위한 종분류 모델을 구축하고, 구축된 종분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하여 종 분류 모델을 확정하고, 확정한 종분류 모델로 현장에서 실시간으로 분류 대상 이미지를 처리하여 생물종을 예측한다.

Description

이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법{Apparatus and method for classification biological species based on deep learning using images}
본 발명은 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법에 관한 것으로, 특히 생물학적 종(생물종)(Biological Species)에 대해 고유한 형태적 특징인 특정 형질을 딥러닝(Deep Learning)을 이용한 이미지 학습을 통해 생물종 분류 모델을 구축하고, 특정 형질에 대한 이미지만을 이용하여 생물학적 종을 예측할 수 있도록 한 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법에 관한 것이다.
생물학적 종은 자연환경에서 서로 교미하여 생식력 있는 자손을 낳을 수 있는 개체들의 집합을 의미한다. 즉, 생식의 기본 단위가 되며, 유성생식을 하는 생물에게만 적용될 수 있는 개념이다. 한 생물학적 종은 다른 종과 교미하여 자손을 이어가지 못하는 생식적으로 격리(reproductive isolation)된 상태를 유지한다.
생물 종(Biological species) 분류는 현미경 관찰을 통해 형태적 유사성 및 공유된 형질(shared character) 등을 이용하여 외형적인 특징을 이용한 분류가 주로 이루어졌다. 1990년대 이후 분자학적 분석방법(molecular analysis)이 발달하면서 DNA의 COI(Cytochrome Oxidase I) 부위 등을 이용한 종 분류가 수행되어 왔으며, 이는 형태적 분류와 함께 종을 분류하기 위한 강력한 도구로 사용되었다.
그러나 형태적 특징인 특정 형질을 현미경을 이용하여 관찰하고 DNA의 COI 부위를 이용한 종 분류 방법은 실험을 해야하기 때문에 주로 실험실 단위에서만 생물종을 분류할 수 있으며 동·식물 채집 현장에서 실시간으로 생물종의 분류가 어렵다. 특히, 현미경 관찰을 이용한 외형적인 특징이나 DNA의 COI 부위를 확인하여 생물종을 분류하는 방식은 해당 동·식물에 대한 전문적인 지식이 없는 비전공자들이 생물종을 분류하는 것에는 활용할 수 없는 단점이 있다.
한편, 생물학적 종 분류를 위해 종래에 제안된 다른 기술이 하기의 <특허문헌 1> 에 개시되어 있다.
<특허문헌 1> 에 개시된 종래기술은 시료로부터 염기 서열 데이터를 추출하고, 추출한 염기 서열 데이터를 순차적으로 입력 데이터로 입력받아 데이터 특성 별로 클러스터링하며, 클러스터링에 의해 형성된 군집의 염기 서열 데이터에 대응하는 생물종을 검색하여 해당 서열 데이터에 대한 생물종을 특정한다. 즉, 클러스터링 기법을 이용해서 미지 생물종의 염기서열을 군집화하고 군집화된 군집 내 염기서열을 이용하여 생물종을 특정한다.
이러한 종래기술도 염기 서열 데이터를 추출하고 데이터 특성별로 클러스터링하기 위해서는 염기 서열 추출기가 필요하므로 주로 실험실 단위에서만 생물종을 분류할 수 있으며 동·식물 채집 현장에서 실시간으로 생물종의 분류가 어려운 단점이 있다. 아울러 종래기술은 염기 서열 데이터 추출이라는 기술이 필요하므로 전문적인 지식이 없는 비전공자들이 생물종을 분류하는 것에는 활용할 수 없는 단점이 있다.
대한민국 공개특허 10-2020-0102182(2020.08.31. 공개)(염기 서열 클러스터링 기법을 이용한 생물종 분류 방법 및 장치)
따라서 본 발명은 상기와 같은 일반적인 동·식물의 형태적 특징인 특정 형질을 현미경을 이용하여 관찰하여 생물종을 분류하거나 분자적 방법을 이용하여 생물종을 분류하는 방법에서 발생하는 제반 문제점 및 종래기술에서 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서, 생물학적 종(생물종)(Biological Species)에 대해 고유한 형태적 특징인 특정 형질을 딥러닝(Deep Learning)을 이용한 이미지 학습을 통해 생물종 분류 모델을 구축하고, 특정 형질에 대한 이미지만을 이용하여 생물학적 종을 예측할 수 있도록 한 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법을 제공하는 데 그 목적이 있다.
상기한 바와 같은 목적을 달성하기 위하여, 본 발명에 따른 "이미지를 이용한 딥러닝 기반의 생물종 분류장치"는,
생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 이미지 데이터 수집부;
상기 이미지 데이터 수집부에서 수집한 이미지를 보정하는 이미지 보정부;
상기 이미지 보정부에 의해 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하는 이미지 학습부;
상기 이미지 학습부에서 학습된 이미지를 이용하여 생물종 분류를 위한 종분류 모델을 구축하는 종분류 모델 구축부; 및
상기 종분류 모델 구축부에서 구축한 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 생물종 예측부를 포함하는 것을 특징으로 한다.
상기에서 생물종 예측부는,
상기 구축한 종 분류 모델을 이용하여 동·식물 채집 현장에서 실시간으로 생물종의 분류를 수행하는 것을 특징으로 한다.
상기에서 생물종 예측부는,
예측 컷-오프를 0.9(90%)로 설정하고, 설정한 예측 컷-오프를 기초로 분류 대상 이미지의 생물종을 예측하는 것을 특징으로 한다.
또한, 본 발명에 따른 "이미지를 이용한 딥러닝 기반의 생물종 분류장치"는,
상기 종분류 모델 구축부에 의해 구축된 종분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 모델 검증부;
상기 모델 검증부에 의해 교차 검증한 결과를 기초로 종 분류 모델을 확정하는 종 분류 모델 확정부를 더 포함하는 것을 특징으로 한다.
상기에서 모델 검증부는,
생물종을 정확하게 찾는 비율인 민감도(Sensitivity), 거짓을 정확하게 판정하는 비율인 특이도(Specificity) 및 정확도(Accuracy)를 이용하여 이미지 학습을 통해 구축된 종 분류 모델을 검증하는 것을 특징으로 한다.
상기에서 민감도와 특이도 및 정확도는 아래의 수식을 이용하여 모델을 검증하는 것을 특징으로 한다.
민감도(Sensitivity)(Se) =
Figure pat00001
특이도(Specificity)(Sp) =
Figure pat00002
정확도(Accuracy)(Acc) =
Figure pat00003
여기서 TP: True Positive, TN: True Negative, FP: False Positive, FN: False Negative를 나타낸다.
또한, 본 발명에 따른 "이미지를 이용한 딥러닝 기반의 생물종 분류방법"은,
(a) 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 단계;
(b) 상기 수집한 이미지를 보정하는 단계;
(c) 상기 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하는 단계;
(d) 상기 학습된 이미지를 이용하여 생물종 분류를 위한 종분류 모델을 구축하는 단계;
(e) 상기 구축된 종분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 단계;
(f) 상기 교차 검증한 결과를 기초로 종분류 모델을 확정하는 단계; 및
(g) 상기 확정한 종분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 단계를 포함하는 것을 특징으로 한다.
상기에서 (g)단계는,
상기 구축한 종분류 모델을 이용하여 동·식물 채집 현장에서 실시간으로 생물종을 예측하되, 예측 컷-오프를 0.9(90%)로 설정하고, 설정한 예측 컷-오프를 기초로 분류 대상 이미지의 생물종을 예측하는 것을 특징으로 한다.
상기에서 (e)단계는,
생물종을 정확하게 찾는 비율인 민감도(Sensitivity), 거짓을 정확하게 판정하는 비율인 특이도(Specificity) 및 정확도(Accuracy)를 이용하여 이미지 학습을 통해 구축된 종분류 모델을 검증하는 것을 특징으로 한다.
본 발명에 따르면 생물학적 종(생물종)(Biological Species)에 대해 고유한 형태적 특징인 특정 형질을 딥러닝(Deep Learning)을 이용한 이미지 학습을 통해 생물종 분류 모델을 구축하고, 특정 형질에 대한 이미지만을 이용하여 생물학적 종을 예측할 수 있는 효과가 있다.
또한, 본 발명에 따르면 동·식물 채집 현장에서 실시간으로 생물종의 분류가 가능하다는 효과가 있다.
또한, 본 발명에 따르면 동·식물에 대한 전문적인 지식이 없는 비전공자들도 쉽고 편리하게 생물종을 분류할 수 있는 효과가 있다.
도 1은 본 발명에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류 개념도,
도 2는 본 발명의 바람직한 실시 예에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류장치의 구성도,
도 3은 본 발명의 바람직한 실시 예에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류방법을 보인 흐름도이다.
이하 본 발명의 바람직한 실시 예에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법을 첨부된 도면을 참조하여 상세하게 설명한다.
이하에서 설명되는 본 발명에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 안 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 바람직한 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원 시점에서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
도 1은 본 발명에서 이미지를 이용한 딥러닝 기반의 생물종 분류 개념도로서, 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하고, 수집한 이미지를 보정한다. 이어, 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하고, 학습된 이미지를 이용하여 생물종 분류를 위한 종 분류 모델을 구축한다. 그리고 구축된 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측한다.
도 2는 본 발명에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류장치의 구성도로서, 이미지 데이터 수집부(101), 이미지 보정부(102), 이미지 학습부(103), 종분류 모델 구축부(104), 모델 검증부(105), 종분류 모델 확정부(106), 생물종 예측부(108) 및 이미지 입력부(107)를 포함한다.
이미지 데이터 수집부(101)는 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 역할을 하며, 이미지 보정부(102)는 상기 이미지 데이터 수집부(101)에서 수집한 이미지를 보정하는 역할을 한다.
이미지 학습부(103)는 상기 이미지 보정부(102)에 의해 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘으로 이미지를 학습하는 역할을 하며, 종 분류 모델 구축부(104)는 상기 이미지 학습부(103)에서 학습된 이미지를 이용하여 생물종 분류를 위한 종분류 모델을 구축하는 역할을 한다.
모델 검증부(105)는 상기 종분류 모델 구축부(104)에 의해 구축된 종분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 역할을 한다.
종분류 모델 확정부(106)는 상기 모델 검증부(105)에 의해 교차 검증한 결과를 기초로 종 분류 모델을 확정하는 역할을 한다.
생물종 예측부(108)는 상기 종분류 모델 구축부(104) 또는 종분류 모델 확정부(106)에 의해 구축된 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 역할을 한다.
이미지 입력부(107)는 종 분류를 위한 대상 이미지를 상기 생물종 예측부(108)에 입력해주는 역할을 한다.
도 3은 본 발명에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류방법을 보인 흐름도로서, (a) 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 단계(S101), (b) 상기 수집한 이미지를 보정하는 단계(S102), (c) 상기 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하는 단계(S103), (d) 상기 학습된 이미지를 이용하여 생물종 분류를 위한 종 분류 모델을 구축하는 단계(S104), (e) 상기 구축된 종 분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 단계(S105), (f) 상기 교차 검증한 결과를 기초로 종 분류 모델을 확정하는 단계(S106), (g) 상기 확정한 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 단계(S107 - S108)를 포함한다.
이와 같이 구성된 본 발명에 따른 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법을 구체적으로 설명하면 다음과 같다.
먼저, 동·식물 채집 현장에서 실시간으로 생물종의 분류를 수행하기 위해서 종분류 모델을 구축해야 한다.
이를 위해서, 이미지 데이터 수집부(101)는 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집한다(S101). 여기서 이미지 데이터의 수집은 인터넷을 이용한 네트워크를 통해 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하거나, 카메라를 통해 촬영된 이미지 데이터를 외부 메모리 또는 통신 포트를 통해 수집하거나, 스마트폰과 같은 모바일 기기와 통신을 통해 이미지 데이터를 수집할 수 있다. 상기 언급한 이미지 데이터 수집 방법 외에 종 분류 모델 구축을 위한 이미지 데이터를 수집할 수 있는 알려진 모든 방법을 이용할 수 있음은 당해 분야의 통상의 지식을 가진 사람이라면 자명하다. 여기서 이미지 데이터는 종 분류 모델을 구축할 수 있는 최소한의 수 이상 이미지 데이터를 수집한다.
이미지 보정부(102)는 상기 수집한 이미지를 보정한다(S102). 여기서 다양한 경로를 통해 수집한 이미지 데이터는 사이즈나 화질이 상이할 수 있다. 따라서 선명도가 떨어지는 이미지에 대해서는 선명도를 높이는 방식으로 이미지 보정을 하고, 이미지의 크기가 큰 것은 적절한 이미지 사이즈로 조절을 하며, 이미지가 상대적으로 작은 이미지는 적절하게 크기를 확대하여 보정을 한다. 이러한 이미지 보정을 통해 각각의 이미지는 동일한 규격의 이미지로 정규화된다.
다음으로, 이미지 학습부(103)는 상기 이미지 보정부(102)에 의해 보정된 이미지를 딥러닝 알고리즘인 Teachable machine 도구를 이용하여 이미지를 학습한다. 본 발명에서는 Teachable machine 도구의 예시로 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습한다(S103). 아울러 이미지 학습부(103)는 생물종의 새로운 이미지가 발생하면 학습 결과에 새로운 이미지를 추가하여 다시 학습을 한다. 여기서 딥러닝 알고리즘인 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘으로 이미지를 학습하는 방식은, 이미지를 이용한 분류(classification), 예측(prediction) 등의 분야에 이미 적용되어 활용되는 기술이므로, 그에 대한 구체적인 설명은 생략하기로 한다.
이어, 종분류 모델 구축부(104)는 상기 학습된 이미지를 이용하여 생물종 분류를 위한 종 분류 모델을 구축한다(S104). 여기서 구축된 생물종 분류를 위한 종 분류 모델은 해당 동·식물에의 형태적 특징인 특정 형질을 이용하여 생물종을 분류하는 알고리즘이다.
아울러 상기 구축된 종 분류 모델로 새로운 이미지를 입력하면 예측된 확률을 통해 특정 종을 분류(또는, 예측)할 수 있다.
본 발명자는 상기 구축한 종 분류 모델의 정확도를 확인하기 위해 모델을 검증하였다. 즉, 모델 검증부(105)에서 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증한다(S105). 그리고 종분류 모델 확정부(106)에서 교차검증을 통해 정확도가 99% 이상인 종 분류 모델만을 종 분류 모델로 확정한다(S106).
모델 검증은 생물종을 정확하게 찾는 비율인 민감도(Sensitivity), 거짓을 정확하게 판정하는 비율인 특이도(Specificity) 및 정확도(Accuracy)를 아래의 수식을 이용하여 검증한다.
민감도(Sensitivity)(Se) =
Figure pat00004
특이도(Specificity)(Sp) =
Figure pat00005
정확도(Accuracy)(Acc) =
Figure pat00006
여기서 TP: True Positive, TN: True Negative, FP: False Positive, FN: False Negative를 나타낸다.
이후, 실제 분류 대상 이미지가 이미지 입력부(107)를 통해 입력되면, 생물종 예측부(108)는 상기 확정한 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측(또는 분류)하고, 그 예측 결과(또는 분류 결과)를 표시해준다(S107 - S108). 즉, 생물종 예측부(108)는 상기 구축한 종 분류 모델을 알고리즘으로 설치하고, 동·식물 채집 현장에서 이미지 입력부(107)를 통해 이미지가 입력되면 실시간으로 생물종의 분류를 수행한다.
여기서 이미지 입력부(107)는 분류 대상 이미지를 입력받기 위한 통신 모듈이거나, 인터넷과 같은 네트워크를 통해 입력되는 이미지 데이터를 입력받기 위한 통신 모듈이거나, 외부 메모리 장치를 결합하여 외부 메모리 장치에 저장된 이미지를 인터페이스 받기 위한 인터페이스 단자일 수 있다.
여기서 생물종 예측부(108)는 예측 컷-오프를 0.9(90%)로 설정하고, 설정한 예측 컷-오프를 기초로 분류 대상 이미지의 생물종을 예측하는 것이 바람직하다.
즉, 본 발명은 이미지 학습을 통해 구축한 종 분류 구축 모델을 현장에서 휴대 및 이동할 수 있는 단말기에 설치하고, 동·식물 채집 현장에서 이미지 입력부(107)를 통해 이미지가 입력되면 실시간으로 생물종을 예측할 수 있도록 한다.
이상 상술한 본 발명에 따르면 생물학적 종(생물종)(Biological Species)에 대해 고유한 형태적 특징인 특정 형질을 딥러닝(Deep Learning)을 이용한 이미지 학습을 통해 생물종 분류 모델을 구축하고, 특정 형질에 대한 이미지만을 이용하여 생물학적 종을 예측할 수 있다.
또한, 본 발명에 따르면 동·식물 채집 현장에서 실시간으로 생물종의 분류가 가능하며, 동·식물에 대한 전문적인 지식이 없는 비전공자들도 쉽고 편리하게 생물종의 분류에 활용할 수 있다.
이상 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명하다.
101: 이미지 데이터 수집부
102: 이미지 보정부
103: 이미지 학습부
104: 종분류 모델 구축부
105: 모델 검증부
106: 종분류 모델 확정부
107: 이미지 입력부
108: 생물종 예측부

Claims (10)

  1. 이미지를 이용한 딥러닝 기반의 생물종 예측 모델을 이용하여 생물종을 분류하는 장치로서,
    생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 이미지 데이터 수집부;
    상기 이미지 데이터 수집부에서 수집한 이미지를 보정하는 이미지 보정부;
    상기 이미지 보정부에 의해 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하는 이미지 학습부;
    상기 이미지 학습부에서 학습된 이미지를 이용하여 생물종 분류를 위한 종분류 모델을 구축하는 종분류 모델 구축부; 및
    상기 종분류 모델 구축부에서 구축한 종분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 생물종 예측부를 포함하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
  2. 청구항 1에서, 상기 생물종 예측부는,
    상기 구축한 종 분류 모델을 이용하여 동·식물 채집 현장에서 실시간으로 생물종의 분류를 수행하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
  3. 청구항 1에서, 상기 생물종 예측부는,
    예측 컷-오프를 0.9(90%)로 설정하고, 설정한 예측 컷-오프를 기초로 분류 대상 이미지의 생물종을 예측하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
  4. 청구항 1에서, 상기 종분류 모델 구축부에 의해 구축된 종 분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 모델 검증부; 및
    상기 모델 검증부에 의해 교차 검증한 결과를 기초로 종분류 모델을 확정하는 종분류 모델 확정부를 더 포함하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
  5. 청구항 4에서, 상기 모델 검증부는,
    생물종을 정확하게 찾는 비율인 민감도(Sensitivity), 거짓을 정확하게 판정하는 비율인 특이도(Specificity) 및 정확도(Accuracy)를 이용하여 이미지 학습을 통해 구축된 종분류 모델을 검증하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
  6. 청구항 5에서, 상기 민감도와 특이도 및 정확도는 아래의 수식을 이용하여 모델을 검증하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류장치.
    민감도(Sensitivity)(Se) =
    Figure pat00007

    특이도(Specificity)(Sp) =
    Figure pat00008

    정확도(Accuracy)(Acc) =
    Figure pat00009

    여기서 TP: True Positive, TN: True Negative, FP: False Positive, FN: False Negative를 나타낸다.
  7. 청구항 1 내지 청구항 6중 어느 하나의 청구항에 기재된 이미지를 이용한 딥러닝 기반의 생물종 분류장치를 이용하여 이미지 기반으로 생물종을 분류하는 방법으로서,
    (a) 생물종 분류 모델을 구축하기 위한 이미지 데이터를 수집하는 단계;
    (b) 상기 수집한 이미지를 보정하는 단계;
    (c) 상기 보정된 이미지를 Mobilenet 기반의 Convolutional Neural Network(CNN) 알고리즘을 이용하여 이미지를 학습하는 단계;
    (d) 상기 학습된 이미지를 이용하여 생물종 분류를 위한 종 분류 모델을 구축하는 단계;
    (e) 상기 구축된 종 분류 모델의 정확도를 확인하기 위해 k-fold cross validation(k = 3)의 교차검증 방법으로 모델을 검증하는 단계;
    (f) 상기 교차 검증한 결과를 기초로 종분류 모델을 확정하는 단계; 및
    (g) 상기 확정한 종 분류 모델로 분류 대상 이미지를 처리하여 생물종을 예측하는 단계를 포함하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류방법.
  8. 청구항 7에서, 상기 (g)단계는,
    상기 구축한 종분류 모델을 이용하여 동·식물 채집 현장에서 실시간으로 생물종을 예측하되, 예측 컷-오프를 0.9(90%)로 설정하고, 설정한 예측 컷-오프를 기초로 분류 대상 이미지의 생물종을 예측하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류방법.
  9. 청구항 7에서, 상기 (e)단계는,
    생물종을 정확하게 찾는 비율인 민감도(Sensitivity), 거짓을 정확하게 판정하는 비율인 특이도(Specificity) 및 정확도(Accuracy)를 이용하여 이미지 학습을 통해 구축된 종분류 모델을 검증하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류방법.
  10. 청구항 9에서, 상기 민감도와 특이도 및 정확도는 아래의 수식을 이용하여 모델을 검증하는 것을 특징으로 하는 이미지를 이용한 딥러닝 기반의 생물종 분류방법.
    민감도(Sensitivity)(Se) =
    Figure pat00010

    특이도(Specificity)(Sp) =
    Figure pat00011

    정확도(Accuracy)(Acc) =
    Figure pat00012

    여기서 TP: True Positive, TN: True Negative, FP: False Positive, FN: False Negative를 나타낸다.


KR1020210085150A 2021-06-29 2021-06-29 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법 KR20230001976A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210085150A KR20230001976A (ko) 2021-06-29 2021-06-29 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210085150A KR20230001976A (ko) 2021-06-29 2021-06-29 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법

Publications (1)

Publication Number Publication Date
KR20230001976A true KR20230001976A (ko) 2023-01-05

Family

ID=84925938

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210085150A KR20230001976A (ko) 2021-06-29 2021-06-29 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법

Country Status (1)

Country Link
KR (1) KR20230001976A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200102182A (ko) 2019-02-21 2020-08-31 상명대학교산학협력단 염기 서열 클러스터링 기법을 이용한 생물종 분류 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200102182A (ko) 2019-02-21 2020-08-31 상명대학교산학협력단 염기 서열 클러스터링 기법을 이용한 생물종 분류 방법 및 장치

Similar Documents

Publication Publication Date Title
US10977788B2 (en) Image analysis method, image analysis apparatus, and image analysis program for analyzing cell with deep learning algorithm
CN111341383B (zh) 一种检测拷贝数变异的方法、装置和存储介质
JP2017524196A (ja) コンテキストフィーチャを用いた画像解析システム
CN113344886A (zh) 晶圆表面缺陷检测方法和设备
JP2013201909A (ja) 細胞画像判定装置、方法、並びにプログラム
EP3706068A1 (en) Land use determination system, land use determination method and program
WO2023115790A1 (zh) 化学结构图像的提取方法、装置、存储介质及电子设备
CN111008576A (zh) 行人检测及其模型训练、更新方法、设备及可读存储介质
CN116287138B (zh) 基于fish的细胞检测系统及其方法
JP2016518822A (ja) アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析
CN111180013B (zh) 检测血液病融合基因的装置
CN110246544B (zh) 一种基于整合分析的生物标志物选择方法及系统
JP2020155101A (ja) 情報処理装置及び情報処理方法
Beier et al. Panakeia-a universal tool for bacterial pangenome analysis
WO2021095509A1 (ja) 推定システム、推定装置および推定方法
CN110941976A (zh) 一种基于卷积神经网络的学生课堂行为识别方法
KR20230001976A (ko) 이미지를 이용한 딥러닝 기반의 생물종 분류장치 및 방법
CN112949658A (zh) 一种具有稳定性能的深度学习方法
KR20230001977A (ko) 이미지를 이용한 딥러닝 기반의 참갯지렁이 종 분류장치 및 방법
CN115440299A (zh) 确定背景微生物的方法、设备、介质和程序产品
CN110222622B (zh) 一种环境土壤检测方法及装置
CN114238768A (zh) 资讯信息的推送方法、装置、计算机设备和存储介质
CN116994647A (zh) 用于分析变异检测结果的模型的构建方法
CN112991280A (zh) 视觉检测方法、系统及电子设备
CN112750067A (zh) 图像处理系统及其训练方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal