KR102565074B1 - 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 - Google Patents

교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 Download PDF

Info

Publication number
KR102565074B1
KR102565074B1 KR1020207035363A KR20207035363A KR102565074B1 KR 102565074 B1 KR102565074 B1 KR 102565074B1 KR 1020207035363 A KR1020207035363 A KR 1020207035363A KR 20207035363 A KR20207035363 A KR 20207035363A KR 102565074 B1 KR102565074 B1 KR 102565074B1
Authority
KR
South Korea
Prior art keywords
label
image
teacher
label image
area
Prior art date
Application number
KR1020207035363A
Other languages
English (en)
Other versions
KR20210008051A (ko
Inventor
와타루 다카하시
아야코 아카자와
쇼타 오시카와
Original Assignee
가부시키가이샤 시마쓰세사쿠쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 시마쓰세사쿠쇼 filed Critical 가부시키가이샤 시마쓰세사쿠쇼
Publication of KR20210008051A publication Critical patent/KR20210008051A/ko
Application granted granted Critical
Publication of KR102565074B1 publication Critical patent/KR102565074B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/421Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/033Recognition of patterns in medical or anatomical images of skeletal patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

이 교사 라벨 화상 수정 방법은, 학습 데이터 (10) 의 입력 화상 (11) 에 대해, 학습 데이터를 사용한 학습 완료 모델 (1) 에 의해 세그먼테이션 처리를 실시하여, 판정용 라벨 화상 (14) 을 작성하는 스텝과, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 대응하는 부분끼리의 라벨을 비교하는 스텝과, 라벨의 비교 결과에 기초하여, 교사 라벨 화상에 포함되는 라벨 영역 (13) 을 수정하는 스텝을 포함한다.

Description

교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치
본 발명은 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치에 관한 것이다.
종래, 기계 학습에 있어서 교사 라벨 화상을 수정하는 것이 알려져 있다. 이와 같은 교사 라벨 화상의 수정은, 예를 들어, 일본 공개특허공보 2014-22837호에 개시되어 있다.
상기 일본 공개특허공보 2014-22837호에는, 텔레비전 프로그램 등의 영상 데이터 중의 어느 영상 구간에, 검출 대상이 출현하고 있는지 (정례 (正例) 인지) 출현하고 있지 않는지 (부례 (否例) 인지) 를 나타내는 라벨을 부여하는 화상 분류를 실시하기 위한 식별기 (학습 완료 모델) 를, 기계 학습에 의해 구축하는 것이 개시되어 있다. 식별기의 구축에는, 영상과, 정례인지 부례인지의 라벨을 포함하는 학습 데이터가 사용된다. 학습 데이터의 라벨에는, 실수나 누락이 포함될 가능성이 있다. 그래서, 상기 일본 공개특허공보 2014-22837호에는, 초기의 학습 데이터, 혹은, 라벨이 설정된 학습 데이터에 대해, 사용자 입력 또는 다른 식별기에 의한 학습 데이터의 검출 결과에 기초하여, 학습 데이터의 라벨을 수정하는 것이 개시되어 있다.
일본 공개특허공보 2014-22837호
상기 일본 공개특허공보 2014-22837호에 개시된 식별기는, 입력된 영상을 단순히 분류하여 영상 단위로 라벨을 부여하는 것인데, 그러한 화상 분류와는 다른 기술로서, 화상 세그먼테이션이 있다. 화상 세그먼테이션은, 화상 전체가 아니라, 화상을 복수의 영역으로 분할하는 기술로서, 검출 대상이 비치는 영역에 그 검출 대상을 나타내는 라벨을 부여함으로써, 입력 화상을 복수의 라벨 영역으로 분할하는 것이다. 또한, 본 명세서에서 말하는 「화상 세그먼테이션」은, 에지 검출 등의 라벨을 부여하지 않는 단순한 영역 분할 (경계 검출) 과 달리, 라벨에 의해 영역에 의미 부여를 하는 점에서, 시맨틱 세그먼테이션이라고 불린다.
화상 세그먼테이션에 사용하는 학습 완료 모델을 구축하기 위한 기계 학습 (지도 학습) 에는, 입력 화상과, 입력 화상을 라벨마다 영역 분할한 교사 라벨 화상이 사용된다. 이 경우의 교사 라벨 화상은, 원래의 화상에 대해 임계값 처리 등에 의해 라벨 영역을 추출함으로써 작성된다. 개개의 입력 화상에는 검출 대상의 비침 정도 (신호 강도 등) 의 편차가 있기 때문에, 교사 라벨 화상의 작성은, 다수의 라벨 작성자에 의해 분담되어, 각 라벨 작성자가 수동으로 임계값 조정을 함으로써 실시된다.
그 결과, 교사 라벨 화상의 작성에는, 임계값 설정 등에 개인차가 포함되게 되어, 어느 라벨 영역이 크게 추출되거나 또는 작게 추출되는 경우가 일어난다. 또, 화상에 따라서는 라벨 영역의 경계가 되는 부분이 원래 애매한 케이스도 있어, 그 경우에는 라벨 영역의 경계가 불규칙하게 분포되기 쉽다. 이 때문에, 교사 라벨 화상의 경계를 수정하는 작업이 실시된다.
그러나, 상기 일본 공개특허공보 2014-22837호와 같은 화상 단위의 단순한 라벨 수정과는 달리, 교사 라벨 화상 중의 라벨 영역의 경계의 편차를 수정하려면, 모든 교사 라벨 화상에 대해 일관된 기준으로 라벨 영역의 수정을 실시할 것이 요망되기 때문에, 예를 들어 특정 작업자에 의해서만 수정 작업을 실시하는 등 다대한 노력이 든다. 또, 교사 라벨 화상의 수정을 위한 전용의 학습 완료 모델을 작성하는 것도 생각할 수 있지만, 그러기 위해서는 일관된 기준으로 작성된 고정밀도의 교사 라벨 화상을 학습시킬 필요가 있기 때문에, 다대한 노력이 필요해지는 점에서 마찬가지이다. 그래서, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이하게 실시할 수 있도록 할 것이 요망되고 있다.
이 발명은, 상기와 같은 과제를 해결하기 위해 이루어진 것으로, 이 발명의 하나의 목적은, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이화하는 것이 가능한 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치를 제공하는 것이다.
상기 목적을 달성하기 위해, 본원 발명자들이 예의 검토한 결과, 라벨 영역의 경계에 편차를 포함한 교사 라벨 화상이라 하더라도, 이들 교사 라벨 화상을 사용하여 충분한 기계 학습을 실시한 학습 완료 모델에서는, 다수의 교사 라벨 화상의 경계의 편차를 통계적으로 평균한 것과 같은 중간적인 세그먼테이션 결과가 얻어지기 때문에, 학습 완료 모델에 의한 세그먼테이션 결과가 교사 라벨 화상의 경계의 편차의 일관된 기준이 될 수 있는 것을 알아냈다. 이 지견에 기초하여, 이 발명의 제 1 국면에 있어서의 교사 라벨 화상 수정 방법은, 화상의 세그먼테이션 처리를 실시하기 위한 기계 학습에 있어서의 교사 라벨 화상의 수정 방법으로서, 입력 화상과 교사 라벨 화상을 포함하는 학습 데이터의 입력 화상에 대해, 학습 데이터를 사용한 학습 완료 모델에 의해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 판정용 라벨 화상을 작성하는 스텝과, 작성된 판정용 라벨 화상과 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝과, 라벨의 비교 결과에 기초하여, 교사 라벨 화상에 포함되는 라벨 영역을 수정하는 스텝을 포함한다.
이 발명의 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 상기와 같이 구성함으로써, 라벨 영역의 경계에 편차를 포함한 교사 라벨 화상을 포함하는 학습 데이터를 사용하여 학습한 학습 완료 모델에 의해 작성한 판정용 라벨 화상과 교사 라벨 화상의 비교에 기초하여, 교사 라벨 화상을 수정할 수 있다. 즉, 본래는 교사 라벨 화상의 라벨 영역이 올바르다는 전제에서 기계 학습을 실시하여 학습 완료 모델이 작성되지만, 충분한 학습을 거친 학습 완료 모델을 사용한 세그먼테이션 결과 (판정용 라벨 화상) 에서는, 라벨 영역의 경계 부분에 관하여, 다수의 교사 라벨 화상의 경계의 편차의 중간적인 결과가 되는 점에서, 편차를 포함한 개개의 교사 라벨 화상에 대해서는 판정용 라벨 화상 쪽이 경계의 타당성이 높다고 볼 수 있다. 그 때문에, 판정용 라벨 화상을 기준으로, 판정용 라벨 화상과 교사 라벨 화상의 비교 결과에 기초하여 교사 라벨 화상의 라벨 영역의 수정을 실시함으로써, 라벨 수정 작업자가 아니라, 컴퓨터를 사용한 자동적인 수정 작업으로도 일관된 기준 (판정용 라벨 화상의 라벨 영역의 경계) 에 기초하여 경계의 편차를 저감시킬 수 있다. 이로써, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 라벨 영역을 수정하는 스텝에 있어서, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 중의 라벨 영역의 범위를, 판정용 라벨 화상의 라벨 영역에 근접하도록 수정해도 된다. 이와 같이 구성하면, 교사 라벨 화상 중의 라벨 영역의 범위를, 예를 들어 판정용 라벨 화상의 라벨 영역에 일치시키거나, 또는 판정용 라벨 화상의 라벨 영역과의 사이의 중간적인 범위로 하는 것만으로, 용이하고 또한 효과적으로, 개개의 교사 라벨 화상의 라벨 영역의 편차를 작게 하는 수정을 할 수 있다.
이 경우, 라벨 영역을 수정하는 스텝에 있어서, 라벨 영역의 수정은, 교사 라벨 화상 중의 라벨 영역의 팽창 및 수축의 적어도 일방에 의해 실시해도 된다. 이와 같이 구성하면, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 중의 라벨 영역의 범위를 팽창시키거나 수축시키거나 하는 것만의 간이한 처리로, 교사 라벨 화상의 라벨 영역의 수정을 실시할 수 있다. 또한, 라벨 영역의 팽창이란, 라벨 영역의 면적을 크게 하는 것이고, 라벨 영역의 수축이란, 라벨 영역의 면적을 작게 하는 것이다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 라벨을 비교하는 스텝에 있어서, 판정용 라벨 화상과 교사 라벨 화상의 비교에 의해, 주목하는 라벨에 대하여, 판정용 라벨 화상에 있어서의 교사 라벨 화상과의 일치 부분 및 불일치 부분을 취득하고, 라벨 영역을 수정하는 스텝에 있어서, 일치 부분 및 불일치 부분에 기초하여, 주목하는 라벨이 부여된 라벨 영역의 범위를 수정해도 된다. 이와 같이 구성하면, 판정용 라벨 화상과 교사 라벨 화상의 일치 부분 및 불일치 부분으로부터, 교사 라벨 화상의 라벨 영역이, 다수의 교사 라벨 화상의 경계의 편차의 기준이 되는 판정용 라벨 화상으로부터 어떻게 괴리되어 있는지를 파악할 수 있다. 그 때문에, 일치 부분 및 불일치 부분에 기초함으로써, 용이하게, 경계의 편차가 작아지도록 라벨 영역을 수정할 수 있다.
이 경우, 라벨을 비교하는 스텝에 있어서, 일치 부분 및 불일치 부분에 기초하여, 판정용 라벨 화상에 있어서 라벨의 미검출을 평가하는 미검출 평가값 및 라벨의 오검출을 평가하는 오검출 평가값을 각각 취득하고, 라벨 영역을 수정하는 스텝에 있어서, 미검출 평가값 및 오검출 평가값의 비교에 기초하여 교사 라벨 화상의 라벨 영역을 수정해도 된다. 여기에서, 미검출은, 주목하는 라벨에 대하여, 교사 라벨 화상에서는 당해 라벨이 부여된 부분을, 판정용 라벨 화상에서는 당해 라벨 영역으로서 검출하지 않았던 것을 의미하고, 미검출이 되는 영역이 많은 경우, 교사 라벨 화상의 라벨 영역이 판정용 라벨 화상의 라벨 영역보다 크다고 추정된다. 또, 오검출은, 판정용 라벨 화상에 있어서 주목하는 라벨 영역이라고 검출되었지만, 교사 라벨 화상에서는 다른 라벨이 부여되어 있는 것을 의미하고, 오검출이 되는 영역이 많은 경우, 교사 라벨 화상의 라벨 영역이 판정용 라벨 화상의 라벨 영역보다 작다고 추정된다. 그 때문에, 미검출 평가값 및 오검출 평가값의 비교에 기초함으로써, 교사 라벨 화상의 라벨 영역을 어떻게 수정하면 되는지 (크게 하면 되는지 작게 하면 되는지) 를 파악할 수 있기 때문에, 보다 적절하게, 개개의 교사 라벨 화상의 라벨 영역을 수정할 수 있다.
상기 미검출 평가값 및 오검출 평가값을 취득하는 구성에 있어서, 미검출 평가값 및 오검출 평가값의 비교에 의해, 판정용 라벨 화상에 있어서의 라벨의 미검출에 비해 오검출이 많다고 판단된 경우, 라벨 영역을 수정하는 스텝에 있어서, 교사 라벨 화상의 라벨 영역을 팽창시켜도 된다. 이와 같이 구성하면, 오검출이 되는 영역이 많아, 교사 라벨 화상의 라벨 영역이 기준이 되는 판정용 라벨 화상의 라벨 영역보다 작다고 추정되는 경우에, 교사 라벨 화상의 라벨 영역을 팽창시킴으로써, 용이하게, 라벨 영역의 경계의 편차를 작게 하는 수정을 실시할 수 있다.
상기 미검출 평가값 및 오검출 평가값을 취득하는 구성에 있어서, 미검출 평가값 및 오검출 평가값의 비교에 의해, 판정용 라벨 화상에 있어서의 라벨의 오검출에 비해 미검출이 많다고 판단된 경우, 라벨 영역을 수정하는 스텝에 있어서, 교사 라벨 화상의 라벨 영역을 수축시켜도 된다. 이와 같이 구성하면, 미검출이 되는 영역이 많아, 교사 라벨 화상의 라벨 영역이 기준이 되는 판정용 라벨 화상의 라벨 영역보다 크다고 추정되는 경우에, 교사 라벨 화상의 라벨 영역을 수축시킴으로써, 용이하게, 라벨 영역의 경계의 편차를 작게 하는 수정을 실시할 수 있다.
상기 미검출 평가값 및 오검출 평가값을 취득하는 구성에 있어서, 미검출 및 오검출의 적어도 일방이 소정의 임계값보다 많다고 판단된 교사 라벨 화상을 포함하는 학습 데이터를, 학습용 데이터 세트로부터 제외하는 스텝을 추가로 포함해도 된다. 이와 같이 구성하면, 기준이 되는 판정용 라벨 화상과의 비교에 있어서 미검출 및 오검출의 적어도 일방이 과도하게 많은 경우, 그 교사 라벨 화상은 학습 데이터로서 부적절하다고 생각할 수 있다. 그래서, 미검출 및 오검출의 적어도 일방이 많아지는 교사 라벨 화상을 학습용 데이터 세트로부터 제외함으로써, 기계 학습의 정밀도를 저하시키는 요인이 되는, 통계상의 이른바 이상값에 상당하는 학습 데이터를 제외할 수 있기 때문에, 학습용 데이터 세트의 품질을 향상시켜 고정밀도의 기계 학습을 실시할 수 있다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에 있어서, 교사 라벨 화상의 라벨 간에 우선도를 설정하는 스텝을 추가로 포함하고, 라벨 영역을 수정하는 스텝에 있어서, 우선도에 따라, 라벨 영역의 수정량을 조정해도 된다. 여기에서, 세그먼테이션 처리는, 화상 중에서 검출 대상이 비치는 영역을 구별하여 라벨링하는 것이기 때문에, 라벨에는, 검출 대상 (우선도 : 고) 과 검출 대상 이외 (우선도 : 저) 를 구별하는 등, 처리의 목적에 따라 상이한 우선도가 설정될 수 있다. 그래서, 상기와 같이 구성하면, 예를 들어 우선도가 높은 라벨은 최대한 검출 누락을 억제할 수 있도록 수정량을 의도적으로 치우치게 할 수 있다. 그 결과, 세그먼테이션 처리의 목적에 따라 교사 라벨 화상의 수정을 적절히 실시할 수 있다.
이 경우, 라벨 영역을 수정하는 스텝에 있어서, 교사 라벨 화상의 라벨 영역을 수정할 때에, 우선도가 높은 라벨 영역으로의, 우선도가 낮은 라벨 영역의 팽창을 금지해도 된다. 이와 같이 구성하면, 우선도가 낮은 라벨 영역을 팽창시키는 수정을 해도 우선도가 높은 라벨 영역을 보존할 수 있기 때문에, 경계의 편차를 억제하면서, 우선도가 높은 라벨 영역의 검출 누락을 억제한 학습이 가능한 교사 라벨 화상 (학습 데이터) 을 얻을 수 있다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 라벨 영역을 수정하는 스텝에 있어서, 교사 라벨 화상을 복수의 부분 화상으로 분할하고, 분할된 교사 라벨 화상의 적어도 1 개의 부분 화상에 대하여 라벨 영역을 수정해도 된다. 이와 같이 구성하면, 교사 라벨 화상의 특정한 일부분만을 수정하거나, 작은 부분마다 개별적으로 수정할 수 있다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 라벨을 비교하는 스텝에 있어서, 판정용 라벨 화상과 교사 라벨 화상의 대응하는 부분끼리의 라벨의 비교를, 화상 중의 1 화소마다 또는 근방의 복수 화소마다 실시해도 된다. 이와 같이 구성하면, 판정용 라벨 화상과 교사 라벨 화상을, 1 화소 단위 또는 복수 화소 단위의 작은 영역마다 비교할 수 있기 때문에, 보다 정밀하게, 교사 라벨 화상의 라벨 영역의 편차를 평가할 수 있다.
상기 제 1 국면에 있어서의 교사 라벨 화상 수정 방법에서는, 수정된 교사 라벨 화상을 포함하는 학습 데이터를 사용한 학습 완료 모델에 의해, 판정용 라벨 화상을 작성하는 스텝을 추가로 포함하고, 라벨 영역을 수정하는 스텝에 있어서, 작성된 판정용 라벨 화상과 수정된 교사 라벨 화상의 비교 결과에 기초하여, 수정된 교사 라벨 화상에 포함되는 라벨 영역을 재수정해도 된다. 이와 같이 구성하면, 수정된 교사 라벨 화상을 사용하여 기계 학습을 실시한 후에, 다시 판정용 라벨 화상을 작성함으로써, 교사 라벨 화상의 라벨 영역의 수정을 반복하여 실시할 수 있다. 라벨 영역의 수정을 반복하여 실시함으로써, 교사 라벨 화상의 라벨 영역의 편차를, 더욱 작게 수속시킬 수 있다.
이 발명의 제 2 국면에 있어서의 학습 완료 모델의 작성 방법은, 화상의 세그먼테이션 처리를 실시하기 위한 기계 학습에 의한 학습 완료 모델의 작성 방법으로서, 입력 화상과 교사 라벨 화상을 포함하는 학습 데이터를 사용한 기계 학습에 의한 사전 학습 완료 모델을 취득하는 스텝과, 취득한 사전 학습 완료 모델에 의해, 학습 데이터의 입력 화상에 대해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 판정용 라벨 화상을 작성하는 스텝과, 작성된 판정용 라벨 화상과 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝과, 라벨의 비교 결과에 기초하여, 교사 라벨 화상에 포함되는 라벨 영역을 수정하는 스텝과, 수정된 교사 라벨 화상을 포함하는 학습 데이터를 사용하여 기계 학습을 실시함으로써, 학습 완료 모델을 작성하는 스텝을 포함한다. 또한, 학습 완료 모델을 작성하는 스텝은, (1) 사전 학습 완료 모델에 대해, 수정된 교사 라벨 화상을 포함하는 학습 데이터를 사용하여 기계 학습 (추가 학습) 을 실시함으로써, 학습 완료 모델을 작성하는 것, 및 (2) 미학습의 학습 모델에 대해, 수정된 교사 라벨 화상을 포함하는 학습 데이터를 사용하여 기계 학습을 실시함으로써, 학습 완료 모델을 작성하는 것, 의 양방을 포함할 수 있다.
이 발명의 제 2 국면에 의한 학습 완료 모델의 작성 방법에서는, 상기 제 1 국면과 마찬가지로, 판정용 라벨 화상을 기준으로, 판정용 라벨 화상과 교사 라벨 화상의 비교 결과에 기초하여 교사 라벨 화상의 라벨 영역의 수정을 실시함으로써, 컴퓨터를 사용한 자동적인 수정 작업으로도 일관된 기준 (판정용 라벨 화상의 라벨 영역의 경계) 에 기초하여 경계의 편차를 저감시킬 수 있기 때문에, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다. 그리고, 수정된 교사 라벨 화상을 포함하는 학습 데이터를 사용하여 사전 학습 완료 모델에 대한 기계 학습을 실시함으로써, 라벨 영역의 경계 부분의 판정 편차가 억제된 고품질의 세그먼테이션 처리가 가능한 학습 완료 모델을 얻을 수 있다.
이 발명의 제 3 국면에 있어서의 화상 해석 장치는, 해석용 화상의 입력을 받아들이는 화상 입력부와, 기계 학습에 의한 학습 완료 모델을 사용하여, 해석용 화상의 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 라벨 화상을 작성하는 해석 처리부와, 학습 완료 모델을 기억하는 기억부와, 기억부에 기억된 학습 완료 모델을 사전 학습 완료 모델로 하여, 입력 화상과 교사 라벨 화상을 포함하는 학습 데이터의 입력 화상에 대해 세그먼테이션 처리를 실시함으로써, 판정용 라벨 화상을 작성하는 판정용 화상 작성부와, 판정용 화상 작성부에 의해 작성된 판정용 라벨 화상과 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 비교부와, 비교부에 의한 라벨의 비교 결과에 기초하여, 교사 라벨 화상에 포함되는 라벨 영역을 수정하는 라벨 수정부를 구비한다.
이 발명의 제 3 국면에 의한 화상 해석 장치에서는, 상기 제 1 국면과 마찬가지로, 사전 학습 완료 모델에 의해 작성한 판정용 라벨 화상을 기준으로, 판정용 라벨 화상과 교사 라벨 화상의 비교 결과에 기초하여 교사 라벨 화상의 라벨 영역의 수정을 실시함으로써, 컴퓨터를 사용한 자동적인 수정 작업으로도 일관된 기준 (판정용 라벨 화상의 라벨 영역의 경계) 에 기초하여 경계의 편차를 저감시킬 수 있다. 이로써, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
본 발명에 의하면, 상기와 같이, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
도 1 은, 제 1 실시형태에 의한 교사 라벨 화상 수정 방법을 설명하기 위한 도면이다.
도 2 는, 기계 학습 및 세그먼테이션 처리의 개요를 나타낸 도면이다.
도 3 은, 골부 (骨部) 의 X 선 화상 및 2 클래스의 라벨 화상의 일례를 나타낸 도면이다.
도 4 는, 세포 화상 및 3 클래스의 라벨 화상의 일례를 나타낸 도면이다.
도 5 는, 교사 라벨 화상을 설명하기 위한 도면이다.
도 6 은, 학습 횟수의 증대에 따른 손실 함수의 변화를 설명하기 위한 그래프이다.
도 7 은, 입력 화상, 판정용 화상 및 교사 라벨 화상의 일례를 나타낸 도면이다.
도 8 은, 교사 라벨 화상의 라벨 영역의 경계의 편차를 설명하기 위한 도면이다.
도 9 는, 교사 라벨 화상의 라벨 영역의 수정을 설명하기 위한 도면이다.
도 10 은, 교사 라벨 화상의 라벨 영역의 수정 방법을 설명하기 위한 플로도이다.
도 11 은, 판정용 라벨 화상 및 교사 라벨 화상의 비교 방법을 설명하기 위한 도면이다.
도 12 는, 교사 라벨 화상의 라벨 영역을 수축시키는 예를 나타낸 모식도이다.
도 13 은, 교사 라벨 화상의 라벨 영역을 팽창시키는 예를 나타낸 모식도이다.
도 14 는, 학습 완료 모델의 작성 방법을 설명하기 위한 플로도이다.
도 15 는, 학습 데이터 처리부를 설명하기 위한 블록도이다.
도 16 은, 화상 해석 장치의 제 1 예를 나타낸 블록도이다.
도 17 은, 화상 해석 장치의 화상 해석 처리를 설명하기 위한 플로도이다.
도 18 은, 화상 해석 장치의 제 2 예를 나타낸 블록도이다.
도 19 는, 제 2 실시형태에 있어서의 라벨의 우선도를 설명하기 위한 도면이다.
도 20 은, 라벨의 우선도에 따른 라벨 영역의 수정량의 조정을 설명하는 도면이다.
도 21 은 라벨 영역의 수정을 부분 화상마다 실시하는 변형예를 나타낸 도면이다.
도 22 는 교사 라벨 화상의 수정 및 학습 완료 데이터의 작성을 서버측에서 실시하는 변형예를 나타낸 모식도이다.
도 23 은 교사 라벨 화상의 수정을 화상 해석 장치측에서 실시하고, 학습 완료 데이터의 작성을 서버측에서 실시하는 변형예를 나타낸 모식도이다.
이하, 본 발명을 구체화한 실시형태를 도면에 기초하여 설명한다.
도 1 ∼ 도 13 을 참조하여, 제 1 실시형태에 의한 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법, 화상 해석 장치에 대하여 설명한다.
도 1 에 나타내는 제 1 실시형태에 의한 교사 라벨 화상 수정 방법은, 화상의 세그먼테이션 처리를 실시하기 위한 기계 학습에 있어서의 교사 라벨 화상의 수정 방법이다. 이하, 세그먼테이션 처리를 실시하는 것을 「영역 분할한다」라고 바꾸어 말하는 경우가 있다.
도 2 에 나타내는 바와 같이, 화상의 세그먼테이션 처리는, 기계 학습에 의해 작성된 학습 완료 모델 (2) 에 의해 실시된다.
학습 완료 모델 (2) 은, 입력된 화상 (해석용 화상 (15), 입력 화상 (11)) 에 대해, 세그먼테이션 처리를 실시하여, 복수의 라벨 영역 (13) (도 3, 도 4 참조) 으로 분할한 라벨 화상 (라벨 화상 (16), 판정용 라벨 화상 (14)) 을 출력한다. 기계 학습법으로서, 전층 콘볼류션 뉴럴 네트워크 (Fully Convolutional Networks ; FCN), 뉴럴 네트워크, 서포트 벡터 머신 (SVM), 부스팅 등의 임의의 수법을 사용할 수 있다. 제 1 실시형태의 학습 완료 모델 (2) 에는, 라벨 영역의 식별 성능의 점에서, 바람직하게는 시맨틱 세그먼테이션에 자주 이용되는 콘볼류션 뉴럴 네트워크, 보다 바람직하게는 전층 콘볼류션 뉴럴 네트워크를 사용하면 된다. 그와 같은 학습 완료 모델 (2) 은, 화상이 입력되는 입력층, 콘볼류션층, 출력층을 포함하여 구성된다.
화상의 세그먼테이션 처리를 실시하는 학습 완료 모델을 작성하기 위해서는, 다수의 학습 데이터 (10) 를 포함한 학습용 데이터 세트 (1) (도 1 참조) 를 사용한 기계 학습이 실시된다.
기계 학습에 사용하는 학습 데이터 (10) 는, 적어도, 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함한다. 입력 화상 (11) 은, 세그먼테이션 처리가 실시되기 전의 원래의 화상이다. 교사 라벨 화상 (12) 은, 입력 화상 (11) 에 대한 세그먼테이션 처리의 결과로서 생성되어야 하는 정답의 화상으로서 작성된다. 요컨대, 교사 라벨 화상 (12) 은, 입력 화상 (11) 을 복수의 라벨 영역 (13) 으로 분할한 라벨 화상이다. 라벨 영역 (13) 이란, 화상 중에서 공통의 라벨이 부여된 화소군에 의해 구성되는 영역 (화상의 일부분) 이다.
라벨은, 라벨 영역 (13) 을 구성하는 화상 부분이 나타내는 의미를 나타내는 정보이다. 세그먼테이션은, 화상 중의 1 화소마다 라벨을 부여함으로써 실시된다. 라벨은, 복수 화소의 묶음 (화소군) 을 단위로 하여 부여되어도 된다. 라벨의 종류를 클래스라고 한다.
클래스의 수 (라벨의 종류) 는, 복수 (2 이상) 이면 특별히 한정되지 않는다. 가장 간단한 예에서는, 클래스는, 「검출 대상」의 라벨과 「검출 대상 이외」의 라벨의 2 클래스로 구성된다. 예를 들어 도 3 에서는, 인간의 골반부 (사타구니) 의 X 선 화상을 입력 화상 (11) 으로 하여, 검출 대상으로서의 「골부」의 라벨 영역 (13a) 과 「골부 이외」의 라벨 영역 (13b) 으로 영역 분할한 예를 나타낸다.
도 4 에서는, iPS 세포나 ES 세포 등의 다능성 간세포의 화상 (세포 화상) 을 입력 화상 (11) 으로 하여, 3 클래스로 영역 분할하는 예를 나타낸다. 도 4 에서는, 다능성을 유지한 세포인 「미분화 세포」의 라벨 영역 (13c), 미분화 상태를 일탈한 세포 (분화가 개시된 세포 또는 분화될 것 같은 세포) 인 「미분화 일탈 세포」의 라벨 영역 (13d) 과, 그것들 이외의 「배경」의 라벨 영역 (13e) 의 3 클래스로 영역 분할이 되어 있다.
학습 완료 모델을 작성할 때, 학습 모델에 입력 화상 (11) 을 입력으로 하고, 교사 라벨 화상 (12) 을 출력으로 하여, 입력 화상 (11) 으로부터 정답인 교사 라벨 화상 (12) 으로의 변환 처리 (세그먼테이션 처리) 를 학습시킨다. 기계 학습을 실시함으로써, 세그먼테이션 처리가 가능한 학습 완료 모델 (2) 이 생성된다. 그 결과, 해석의 대상이 되는 해석용 화상 (15) 을 학습 완료 모델 (2) 에 입력함으로써, 기계 학습에 의한 학습 완료 모델 (2) 을 사용하여, 해석용 화상 (15) 의 세그먼테이션 처리를 실시하여, 복수의 라벨 영역 (13) 으로 분할된 라벨 화상을 출력할 수 있다.
〈교사 라벨 화상〉
도 5 에서는, 도 4 에 나타낸 다능성 간세포의 입력 화상 (11) 에 대한, 3 클래스로 영역 분할한 교사 라벨 화상 (12) 을 작성하는 예를 나타낸다. 도 5 의 예에서는, 다능성 간세포에 대하여, 염색제에 의해 세포 영역을 염색한 세포막 염색 화상 (91) 과, 미분화 세포의 핵 염색 영역을 미분화 마커에 의해 염색한 핵 염색 화상 (92) 을 취득하고, 세포막 염색 화상 (91) 과 핵 염색 화상 (92) 을 각각 임계값 처리에 의해 2 치화한 후에 양 화상의 차분을 취득함으로써, 교사 라벨 화상 (12) 을 작성하고 있다.
이와 같은 교사 라벨 화상 (12) 에서는, 세포의 염색 화상을 기초로 교사 라벨 화상 (12) 이 작성되기 때문에, 염색 정도의 편차가 불가피적으로 존재한다. 그 때문에, 염색 정도에 따른 임계값의 수동 조정이 필요해지고, 임계값의 설정에 따라서는, 세포의 경계 부분이, 다른 교사 라벨 화상 (12) 에 비해 상대적으로 커지거나 혹은 작아져 불규칙하게 분포한다. 또, 세포막 염색 화상 (91) 에서는 핵 이외의 세포 골격도 포함하여 염색되는 데에 반해, 핵 염색 화상 (92) 에서는 핵의 부분만이 염색되기 때문에, 미분화 일탈 세포와 미분화 세포에서, 원래 염색되는 영역이 약간 상이한 경우가 있고, 이와 같은 차이가 교사 라벨 화상 (12) 에 있어서의 라벨 영역 (13) 의 경계 (크기) 의 편차의 원인이 될 수도 있다. 도 3 에 나타낸 골부의 X 선 화상에서는, 염색법의 상이에서 기인하는 염색 영역의 차이는 발생하지 않지만, 임계값 처리에 따른 경계 부분의 편차는, 세포 화상의 예와 마찬가지로 발생한다.
개개의 교사 라벨 화상 (12) 에 있어서의 라벨 영역 (13) 의 경계가 불규칙하게 분포하는 경우, 화상 중의 어느 부분을 경계로서 정할지라는 기준이 달라지게 된다. 그 때문에, 라벨 영역 (13) 의 경계가 불규칙하게 분포한 교사 라벨 화상 (12) 을 포함한 학습용 데이터 세트 (1) 를 사용하여 학습을 실시한 학습 완료 모델 (2) 에서는, 생성되는 라벨 화상 (16) (도 2 참조) 에 있어서, 라벨 영역 (13) 의 경계가 흐릿해지거나, 부자연스러운 형상이 될 우려가 있다.
그래서, 제 1 실시형태에서는, 도 1 에 나타낸 바와 같이, 라벨 영역 (13) 의 경계가 불규칙하게 분포한 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를 사용하여 학습된 학습 완료 모델 (2) (이하, 사전 학습 완료 모델 (2a) 이라고 한다) 을 사용하여, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정을 실시한다.
(교사 라벨 화상의 수정 방법)
구체적으로는, 제 1 실시형태의 교사 라벨 화상의 수정 방법은, 도 1 에 나타내는 바와 같이, 하기의 스텝을 포함한다.
(1) 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 의 입력 화상 (11) 에 대해, 학습 데이터 (10) 를 사용한 학습 완료 모델 (2) 에 의해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역 (13) 으로 분할된 판정용 라벨 화상 (14) 을 작성하는 스텝
(2) 작성된 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝
(3) 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정하는 스텝
또한, 제 1 실시형태에 있어서, 판정용 라벨 화상 (14) 을 생성하는 사전 학습 완료 모델 (2a) 은, 라벨 영역 (13) 의 경계가 불규칙하게 분포한 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를 사용하여 학습된 학습 완료 모델이다.
〈학습 완료 모델, 사전 학습 완료 모델〉
판정용 라벨 화상 (14) 을 생성하는 학습 완료 모델 (2) (사전 학습 완료 모델 (2a)) 로는, 충분한 점수의 학습 데이터 (10) 를 포함하는 학습용 데이터 세트 (1) 를 사용하여 학습되고, 또한, 학습이 적절히 수속되어 있는 학습 완료 모델이 사용된다. 즉, 사전 학습 완료 모델 (2a) 은, 기계 학습 자체는 적절히 실시되어, 라벨 영역 (13) 의 경계를 제외하고 충분한 정밀도로 세그먼테이션 처리를 실시할 수 있도록 구성되어 있다. 기계 학습의 분야에 있어서, 사전 학습 완료 모델 (2a) 의 정밀도는, 개개의 입력 화상 (11) 에 대한 세그먼테이션의 결과 (여기에서는, 판정용 라벨 화상 (14)) 와, 그 입력 화상 (11) 의 교사 라벨 화상 (12) 의 오차 (손실 함수) 를 구함으로써 평가할 수 있다. 도 6 에 나타내는 바와 같이, 충분한 점수의 학습용 데이터 세트 (1) 로, 학습이 적절히 실시되는 경우, 학습 완료 모델에서는, 학습 횟수와 함께 손실 함수의 값이 저하되어, 라벨 영역 (13) 의 경계의 편차도 포함하는 불가피적으로 존재하는 각종의 요인에서 기인한 한계에 상당하는 값으로 수속된다. 도 6 의 그래프는, 세로축이 손실 함수를 대수 표시하고, 가로축이 학습의 반복 횟수를 나타낸 것이다.
또, 교사 라벨 화상 (12) 은, 사전 학습 완료 모델 (2a) 의 학습을 적절히 수속시키는 것이 가능할 정도로 일관된 기준에 따라 작성된 교사 라벨 화상이다. 요컨대, 학습용 데이터 세트 (1) 가 포함하는 다수의 교사 라벨 화상 (12) 은, 라벨 영역 (13) 의 경계에 있어서는 상기의 임계값 처리 등의 요인에 의해 편차가 존재하기는 하지만, 학습을 적절히 수속시키는 것이 가능할 정도로 통계적인 치우침이 작은 것이다. 또한, 도 3 에 나타낸 골반부의 화상이나 도 4 에 나타낸 세포 화상으로부터 알 수 있는 바와 같이, 라벨 영역 (13) 의 전체에서 차지하는 경계 부분의 비율은 매우 적어, 경계의 편차는 학습을 수속시키는 장해는 되지 않는다.
〈교사 라벨 화상의 수정 방법의 상세〉
판정용 라벨 화상 (14) 을 작성하는 스텝에서는, 사전 학습 완료 모델 (2a) 에 입력 화상 (11) 을 입력하고, 세그먼테이션 처리를 실시함으로써, 출력으로서 판정용 라벨 화상 (14) 이 작성된다. 도 7 에 나타내는 바와 같이, 판정용 라벨 화상 (14) 은, 교사 라벨 화상 (12) 과 마찬가지로, 입력 화상 (11) 을 복수의 라벨 영역 (13) 에 의해 영역 분할한 화상이 된다.
판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 라벨을 비교하는 스텝에서는, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨이 비교된다. 대응하는 부분은, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에서 동일 지점의 이미지라고 볼 수 있는 부분이며, 각 화상의 촬상 시야가 동일일 한, 동일한 좌표를 의미한다.
판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 대응하는 부분끼리의 라벨의 비교는, 화상 중의 1 화소마다 또는 근방의 복수 화소마다 실시할 수 있다. 근방의 복수 화소는, 어느 화소와 그 주위의 화소를 포함하고, 예를 들어 2 × 2 의 4 화소, 3 × 3 의 9 화소의 정방형 영역 등일 수 있다. 제 1 실시형태에서는, 보다 바람직하게는, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 대응하는 부분끼리의 라벨을 1 화소마다 비교한다.
제 1 실시형태에서는, 라벨을 비교하는 스텝에 있어서, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 비교에 의해, 주목하는 라벨에 대하여, 판정용 라벨 화상 (14) 에 있어서의 교사 라벨 화상 (12) 과의 일치 부분 및 불일치 부분을 취득한다.
교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정하는 스텝에서는, 비교 결과로서의 일치 부분 및 불일치 부분에 기초하여, 주목하는 라벨이 부여된 라벨 영역 (13) 의 범위를 수정한다. 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 의 수정은, 예를 들어 수정 대상이 되는 라벨 영역 (13) 에 부여한 라벨을, 다른 라벨로 치환함으로써 실시한다. 도 1 에 나타낸 바와 같이, 라벨 영역 (13) 의 수정에 의해, 수정 완료 교사 라벨 화상 (12a) 이 작성된다. 작성된 수정 완료 교사 라벨 화상 (12a) 은, 학습 데이터 (10) 에 있어서 원래의 (수정 전의) 교사 라벨 화상 (12) 으로 치환된다 (즉, 교사 라벨 화상 (12) 이 갱신된다).
여기에서, 사전 학습 완료 모델 (2a) 의 학습을 적절히 수속시키는 것이 가능한 학습용 데이터 세트 (1) 라면, 라벨 영역 (13) 의 경계에 관하여, 도 8 에 나타낸 바와 같이 라벨 영역 (13) 이 상대적으로 커지는 방향으로 불규칙하게 분포한 교사 라벨 화상 (12) 과, 라벨 영역 (13) 이 상대적으로 작아지는 방향으로 불규칙하게 분포한 교사 라벨 화상 (12) 이, 대체로 균등하게 분포될 (대체로 정규 분포가 될) 것이 기대된다. 또한, 도 8 의 가로축은 편차의 크기를 나타내고, 세로축은, 해당하는 편차를 갖는 교사 라벨 화상의 수 (빈도) 를 나타낸다. 도 8 과 같이 편차가 분포된 교사 라벨 화상 (12) 을 학습한 결과, 사전 학습 완료 모델 (2a) 이 출력하는 판정용 라벨 화상 (14) 의 라벨 영역 (13) 의 경계는, 일관되게, 도 8 의 분포에 있어서의 중간적인 결과가 될 것이 기대된다. 그 때문에, 사전 학습 완료 모델 (2a) 에 의해 생성된 판정용 라벨 화상 (14) 의 라벨 영역 (13) 을 기준으로 하여, 판정용 라벨 화상 (14) 과의 차이분만큼, 개개의 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 경계 부분이 불규칙하게 분포하고 있다고 볼 수 있다.
그래서, 제 1 실시형태에서는, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 범위를, 도 9 에 나타내는 바와 같이 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 근접하도록 수정한다. 구체적으로는, 라벨 영역 (13) 의 수정은, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 팽창 및 수축의 적어도 일방에 의해 실시한다. 요컨대, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 의 경계 (18a) 에 대해, 라벨 영역 (13) 이 상대적으로 크게 (경계 (18b) 참조) 설정된 교사 라벨 화상 (12) 에 대해서는, 라벨 영역 (13) 을 수축시키는 수정이 실시되고, 라벨 영역 (13) 이 상대적으로 작게 (경계 (18c) 참조) 설정된 교사 라벨 화상 (12) 에 대해서는, 라벨 영역 (13) 을 팽창시키는 수정이 실시된다. 이로써, 학습용 데이터 세트 (1) 의 전체적인 치우침없이, 개개의 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 경계부의 편차를 감소시키는 것이 가능해진다.
라벨 영역 (13) 의 수정은, 예를 들어 모폴로지 처리에 의해 실시할 수 있다. 모폴로지 처리는, 입력 이미지 (여기에서는, 교사 라벨 화상 (12)) 의 화소와, 그 근방의 화소의 비교에 기초하여, 출력 이미지 (여기에서는, 수정 완료 교사 라벨 화상 (12a)) 에 있어서의 대응 화소의 화소값을 결정하는 것이다. 팽창 처리를 실시하는 경우, 근방의 화소와의 비교에 의해 검출된 라벨 영역 (13) 의 경계의 화소에, 라벨 영역 (13) 과 동일한 라벨을 부여한다. 수축 처리를 실시하는 경우, 근방의 화소와의 비교에 의해 검출된 라벨 영역 (13) 의 경계의 화소로부터 라벨을 제거하여, 경계의 외측의 라벨과 동일한 라벨을 부여한다. 모폴로지 처리에 의한 수정량 (몇 화소분 팽창 또는 수축할지) 은, 특별히 한정되지 않으며, 1 화소분 또는 복수 화소분 수정할 수 있다.
〈교사 라벨 화상의 수정의 구체예〉
다음으로, 교사 라벨 화상의 수정의 구체예를 나타낸다. 도 10 에 나타내는 바와 같이, 스텝 S1 에 있어서, 학습용 데이터 세트 (1) 중에서, 수정의 대상이 되는 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를 선택한다.
스텝 S2 는, 상기의 판정용 라벨 화상 (14) 을 작성하는 스텝이다. 스텝 S2 에 있어서, 사전 학습 완료 모델 (2a) 에 의해, 입력 화상 (11) 으로부터 판정용 라벨 화상 (14) 이 작성된다.
스텝 S3 은, 상기의 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 라벨을 비교하는 스텝이다. 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 비교 방법으로서, 도 11 에 나타내는 2 클래스 (정, 부) 분류의 혼동 행렬 (21) 을 예시한다. 행렬의 세로가 교사 라벨 화상 (12) 에 있어서의 세그먼테이션의 결과, 행렬의 가로가 판정용 라벨 화상 (14) 에 있어서의 세그먼테이션의 결과를 나타낸다. TP 는, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에서 일치하여 「정」의 라벨을 부여한 화소의 총수이다. TN 은, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에서 일치하여 「부」의 라벨을 부여한 화소의 총수이다. 따라서, TP, TN 은, 일치 부분의 화소수를 나타낸다. 한편, FP 는, 판정용 라벨 화상 (14) 에서는 「정」의 라벨을 부여하고 교사 라벨 화상 (12) 에서는 「부」의 라벨을 부여한 화소의 총수이다. FN 은, 판정용 라벨 화상 (14) 에서는 「부」의 라벨을 부여하고 교사 라벨 화상 (12) 에서는 「정」의 라벨을 부여한 화소의 총수이다. 따라서, FP, FN 은, 불일치 부분의 화소수를 나타낸다.
그리고, 제 1 실시형태에서는, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 괴리 정도를 평가하는 평가값을 산출한다. 구체적으로는, 라벨을 비교하는 스텝에 있어서, 일치 부분 및 불일치 부분에 기초하여, 판정용 라벨 화상 (14) 에 있어서 라벨의 미검출을 평가하는 미검출 평가값 (22) 및 라벨의 오검출을 평가하는 오검출 평가값 (23) 을 각각 취득한다. 또한, 제 1 실시형태에서는, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 (잘못한 것으로 하여) 수정하지만, 미검출 평가값 (22) 및 오검출 평가값 (23) 은, 어디까지나 교사 라벨 화상 (12) 의 각 라벨 영역 (13) 이 올바르다고 가정하여, 판정용 라벨 화상 (14) 에 있어서의 라벨의 미검출 및 오검출을 평가하는 평가값이다. 교사 라벨 화상 (12) 의 각 라벨 영역 (13) 이 올바르다고 가정한 경우, 판정용 라벨 화상 (14) 에 있어서의 교사 라벨 화상 (12) 과의 불일치 부분은, 미검출 또는 오검출이 되는 부분이기 때문에, 미검출 평가값 (22) 및 오검출 평가값 (23) 은, 판정용 라벨 화상 (14) 에 있어서의 교사 라벨 화상 (12) 과의 일치 불일치를, 수치에 의해 평가하는 것이다.
미검출 평가값 (22) 및 오검출 평가값 (23) 은, 각각 라벨의 미검출의 많음 (또는 적음) 및 오검출의 많음 (또는 적음) 을 나타내는 수치라면, 특별히 한정되지 않는다.
일례로서, 미검출 평가값 (22) 은, 하기 식 (1) 로 나타내는 검출률 (Recall 또는 True Positive Rate ; TPR) 이다. 검출률은 감도라고도 불린다.
K = TP/(TP + FN)···(1)
검출률은, 「본래 포지티브 (정) 로 분류해야 할 아이템 (화소) 을, 올바르게 포지티브로 분류할 수 있었던 아이템의 비율」을 나타내고, 미검출의 적음을 나타낸다. 요컨대 미검출 평가값 (22) 으로서 검출률을 채용하는 경우, 값이 클수록 미검출이 적은 것을 나타낸다.
오검출 평가값 (23) 은, 하기 식 (2) 로 나타나는 정밀도 (Precision) 이다.
G = TP/(TP + FP)···(2)
정밀도는, 「포지티브 (정) 로 분류된 아이템 중, 실제로 포지티브였던 아이템의 비율」을 나타내고, 오검출이 적음을 나타낸다. 요컨대 오검출 평가값 (23) 으로서 정밀도를 채용하는 경우, 값이 클수록 오검출이 적은 것을 나타낸다.
미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 의해, 교사 라벨 화상 (12) 의 라벨 영역 (13) 이 상대적으로 크게 설정되어 있는지, 라벨 영역 (13) 이 상대적으로 작게 설정되어 있는지를 판정하는 것이 가능하다. 그래서, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 기초하여 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수정한다.
미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교 결과와, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 각 라벨 영역의 크기의 관계를, 도 12 및 도 13 에 나타내는 단순화한 가상예를 사용하여 설명한다. 도 12 및 도 13 에 있어서, 착색부가 각 화상의 라벨 영역 (13) 을 나타내고, 해칭부는, 판정용 라벨 화상 (14) 의 라벨 영역 (13f) 을, 교사 라벨 화상 (12) 에 중첩하여 나타낸 것이다.
도 12 에 나타내는 바와 같이, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 을 비교하여, 미검출이 많은 (검출률 (K) 이 작은) 케이스에서는, 판정용 라벨 화상 (14) 에서 정의 라벨이 부여된 라벨 영역 (13f) 보다, 교사 라벨 화상 (12) 에서 정의 라벨이 부여된 라벨 영역 (13g) 이 커, 라벨 영역 (13f) 의 외측에 라벨 영역 (13g) 의 경계가 있다 (라벨 영역 (13f) 의 외측이 미검출이 된다).
그래서, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 의해, 판정용 라벨 화상 (14) 에 있어서의 라벨의 오검출에 비해 미검출이 많다고 판단된 경우, 라벨 영역 (13) 을 수정하는 스텝 S4 에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수축시킨다.
즉, (검출률 (K) < 정밀도 (G) ≒ 1) 이 되는 경우, 오검출이 적고, 미검출이 많다고 판단할 수 있기 때문에, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 범위를 수축시킴으로써, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 근접시킬 수 있다. 도 12 의 가상예에서는, K = 0.56, G = 1 이 되기 때문에, 조건 (검출률 (K) < 정밀도 (G) ≒ 1) 을 만족한다.
한편, 도 13 에 나타내는 바와 같이, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 을 비교하여, 오검출이 많은 (정밀도 (G) 가 작은) 케이스에서는, 판정용 라벨 화상 (14) 에서 정의 라벨이 부여된 라벨 영역 (13f) 보다, 교사 라벨 화상 (12) 에서 정의 라벨이 부여된 라벨 영역 (13g) 이 작아, 라벨 영역 (13f) 의 내측에 라벨 영역 (13g) 의 경계가 있다 (라벨 영역 (13g) 의 외측이 오검출된다).
그래서, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 의해, 판정용 라벨 화상 (14) 에 있어서의 라벨의 미검출에 비해 오검출이 많다고 판단된 경우, 라벨 영역 (13) 을 수정하는 스텝 S4 에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 팽창시킨다.
즉, (1 ≒ 검출률 (K) > 정밀도 (G)) 가 되는 경우, 미검출이 적고, 오검출이 많다고 판단할 수 있기 때문에, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 범위를 팽창시킴으로써, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 근접시킬 수 있다. 도 13 의 가상예에서는, K = 1, G = 0.56 이 되기 때문에, 조건 (1 ≒ 검출률 (K) > 정밀도 (G)) 을 만족한다. 또한, 정밀도 (G) ≒ 1 및 검출률 (K) ≒ 1 의 판단 기준으로는, 예를 들어 0.8 이상, 또는 0.9 이상 등으로 하면 된다.
또, 제 1 실시형태에서는, 미검출 및 오검출의 적어도 일방이 소정의 임계값보다 많다고 판단된 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를, 학습용 데이터 세트 (1) 로부터 제외하는 스텝을 추가로 포함한다. 미검출 및 오검출의 적어도 일방이 소정의 임계값보다 많다란, 검출률 (K) 및 정밀도 (G) 의 적어도 일방이 소정의 임계값 (Th) 을 하회하는 (K < Th 및/또는 G < Th) 것이다.
이와 같이 미검출 평가값 (22) 및 오검출 평가값 (23) 의 일방이 허용 범위 외 (소정의 임계값을 초과함) 가 되는 경우, 라벨 영역 (13) 의 경계의 편차가 실제의 사이즈에 비해 극단적으로 큰 부적절한 교사 라벨 화상 (12) 이라고 생각할 수 있어, 학습의 방해가 되기 때문에, 수정을 도모하기보다는 학습용 데이터 세트 (1) 로부터 제외하는 편이 바람직하다. 소정의 임계값은, 클래스수나, 사전 학습 완료 모델 (2a) 의 정밀도 (손실 함수) 에 따라 설정할 수 있지만, 예를 들어 2 클래스 분류의 경우, 임계값 = 0.5 로 할 수 있다.
이상과 같이 하여, 스텝 S4 에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정이 실시된다. 교사 라벨 화상 (12) 의 수정은, 학습용 데이터 세트 (1) 에 포함되는 모든 학습 데이터 (10) 의 교사 라벨 화상 (12) 에 대해 실시할 수 있다. 즉, 스텝 S5 에 있어서, 모든 학습 데이터 (10) 의 교사 라벨 화상 (12) 에 대해, 수정 처리가 완료되었는지가 판단되어, 미수정 학습 데이터 (10) (교사 라벨 화상 (12)) 가 있는 경우, 스텝 S1 로 처리가 되돌아가고, 다음으로 선택된 학습 데이터 (10) 에 대해, 스텝 S2 ∼ S4 가 실행된다. 모든 학습 데이터 (10) 의 교사 라벨 화상 (12) 에 대해 수정 처리가 완료된 경우, 학습 완료 모델 (2) 의 수정 처리가 완료된다. 이 밖에, 교사 라벨 화상 (12) 의 수정은, 특정 교사 라벨 화상 (12) 에 대해서만 실시할 수 있다. 예를 들어 손실 함수나 미검출 평가값 (22) 및 오검출 평가값 (23) 등에 수정 가부를 판정하기 위한 임계값을 마련하고, 임계값을 초과한 특정 교사 라벨 화상 (12) 에 대해서만 교사 라벨 화상 (12) 의 수정을 실시할 수 있다.
또, 제 1 실시형태에서는, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정은, 1 회 또는 복수 회 실시될 수 있다.
즉, 제 1 실시형태의 하나의 양태에서는, 수정된 교사 라벨 화상 (12) (수정 완료 교사 라벨 화상 (12a)) 을 포함하는 학습 데이터 (10) 를 사용한 학습 완료 모델 (2) 에 의해, 판정용 라벨 화상 (14) 을 작성하는 스텝을 추가로 포함하여, 라벨 영역을 수정하는 스텝에 있어서, 작성된 판정용 라벨 화상 (14) 과 수정 완료 교사 라벨 화상 (12a) 의 비교 결과에 기초하여, 수정 완료 교사 라벨 화상 (12a) 에 포함되는 라벨 영역 (13) 을 재수정한다. 상세한 내용은 후술한다.
(학습 완료 모델의 작성 방법)
다음으로, 교사 라벨 화상 수정 방법에 의해 수정된 교사 라벨 화상 (수정 완료 교사 라벨 화상 (12a)) 을 사용하여 화상 세그먼테이션을 실시하기 위한 학습 완료 모델 (2) 을 작성하는 방법에 대하여 설명한다.
학습 완료 모델의 작성 방법은, 하기의 스텝을 포함한다.
(1) 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를 사용한 기계 학습에 의한 사전 학습 완료 모델 (2a) 을 취득하는 스텝
(2) 취득한 사전 학습 완료 모델 (2a) 에 의해, 학습 데이터 (10) 의 입력 화상 (11) 에 대해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역 (13) 으로 분할된 판정용 라벨 화상 (14) 을 작성하는 스텝
(3) 작성된 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝
(4) 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정하는 스텝
(5) 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습 데이터 (10) 를 사용하여 기계 학습을 실시함으로써, 학습 완료 모델 (2) 을 작성하는 스텝
도 14 에, 학습 완료 모델의 작성 방법을 실시하는 처리의 흐름을 나타낸다. 스텝 S11 에 있어서, 사전 학습 완료 모델 (2a) 을 취득한다. 스텝 S12 에 있어서, 학습용 데이터 세트 (1) 에 포함되는 교사 라벨 화상 (12) 의 수정을 실시한다. 즉, 도 10 에 나타낸 스텝 S1 ∼ S5 의 처리를 실행함으로써, 각 학습 데이터 (10) 의 교사 라벨 화상 (12) 을 수정한다. 이로써, 스텝 S13 에 있어서, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 수정 완료의 학습용 데이터 세트 (1) 를 취득한다.
스텝 S14 에 있어서, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용하여, 기계 학습을 실시한다. 그 결과, 라벨 영역 (13) 의 경계의 편차가 억제된 수정 완료 교사 라벨 화상 (12a) 을 포함한 학습 데이터 (10) 를 이용하여, 사전 학습 완료 모델 (2a) 이 추가 학습됨으로써, 학습 완료 모델 (2) 이 생성된다. 스텝 S16 에 있어서, 작성된 학습 완료 모델 (2) 이 컴퓨터의 기억부에 기억된다. 또한, 여기에서는, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용하여, 사전 학습 완료 모델 (2a) 에 대한 기계 학습 (추가 학습) 을 실시하는 예를 나타내고 있지만, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용하여, 사전 학습 완료 모델 (2a) 과는 상이한 다른 학습 완료 모델이나, 미학습 학습 모델에 대해 기계 학습을 실시해도 된다.
학습 완료 모델 (2) 의 작성은, 소정의 반복 횟수만큼 반복하여 실시할 수 있다. 이 때, 교사 라벨 화상 (12) 의 수정 처리도, 반복하여 실시된다. 즉, 스텝 S16 에 있어서, 학습이 소정 횟수만큼 반복하여 실시되었는지 여부가 판단된다. 소정 횟수에 이르지 않은 경우, 처리가 스텝 S11 로 되돌려져, 학습 완료 모델 (2) 의 작성이 재차 실시된다.
이 때, 스텝 S11 에서는, 직전의 스텝 S15 에서 기억된 학습 완료 모델 (2) 이, 이번 사전 학습 완료 모델 (2a) 로서 취득된다. 그리고, 스텝 S12 에 있어서, 취득된 사전 학습 완료 모델 (2a) 과, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용하여, 수정 완료 교사 라벨 화상 (12a) 의 재수정이 실시된다.
그리고, 스텝 S14 에서는, 재수정된 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용하여, 사전 학습 완료 모델 (2a) 에 대한 기계 학습이 실시된다. 이와 같이 스텝 S11 ∼ S15 를 반복함으로써, 학습용 데이터 세트 (1) 에 포함되는 교사 라벨 화상 (12) 의 수정을 반복하여 실시하여 갱신하면서, 갱신된 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습용 데이터 세트 (1) 를 사용한 기계 학습에 의해, 학습 완료 모델 (2) 이 작성된다. 스텝 S16 에 있어서, 학습이 소정 횟수만큼 반복하여 실시되면, 처리가 종료한다.
이상의 교사 라벨 화상 수정 방법, 및 학습 완료 모델의 작성 방법은, 소정의 소프트웨어 (프로그램) 가 기억부에 인스톨된 컴퓨터 (퍼스널 컴퓨터나 워크 스테이션, 슈퍼컴퓨터 등) 또는 복수 대의 컴퓨터로 이루어지는 컴퓨터 시스템에 의해 실시된다. 컴퓨터는, CPU, GPU, 전용 설계된 FPGA 등의 프로세서와, ROM, RAM, 휘발성 또는 불휘발성 기억 장치 (HDD, SDD 등) 의 기억부를 구비한다.
도 15 에 나타내는 바와 같이, 컴퓨터가 구비하는 프로세서 (50a) 가, 기억부 (54) 에 기억된 프로그램을 실행함으로써, 교사 라벨 화상 수정 방법이나 학습 완료 모델의 작성 방법을 실행하기 위한 학습 데이터 처리부 (50) 로서 기능한다.
〈학습 데이터 처리부〉
제 1 실시형태의 교사 라벨 화상 수정 방법을 실시하는 학습 데이터 처리부 (50) 는, 교사 라벨 화상 수정 방법의 각 스텝 (도 10 의 스텝 S1 ∼ S5) 을 실행하기 위한 기능 블록을 포함하여, 기억부 (54) 에 기억된 각종 데이터 (사전 학습 완료 모델 (2a), 학습용 데이터 세트 (1)) 를 사용한 처리에 의해 교사 라벨 화상 수정 방법을 실행할 수 있다. 제 1 실시형태의 학습 완료 모델의 작성 방법을 실시하는 학습 데이터 처리부 (50) 는, 학습 완료 모델의 작성 방법의 각 스텝 (도 14 의 스텝 S11 ∼ S16) 을 실행하기 위한 기능 블록을 포함하여, 기억부 (54) 에 기억된 각종 데이터를 사용한 처리에 의해 학습 완료 모델의 작성 방법을 실행할 수 있다.
구체적으로는, 학습 데이터 처리부 (50) 는, 판정용 화상 작성부 (51) 와, 비교부 (52) 와, 라벨 수정부 (53) 를 기능 블록으로서 포함한다. 제 1 실시형태의 학습 완료 모델의 작성 방법을 실시하는 학습 데이터 처리부 (50) 는, 추가로, 학습부 (55) 를 기능 블록으로서 포함한다. 교사 라벨 화상 (12) 의 수정만을 실시하는 경우, 학습 데이터 처리부 (50) 는, 학습부 (55) 를 포함할 필요는 없다. 기억부 (54) 에는, 학습용 데이터 세트 (1), 및 학습 완료 모델 (2) (사전 학습 완료 모델 (2a)) 등의 각종 데이터 및 프로그램이 기억된다.
학습 데이터 처리부 (50) 는, 도 10 의 스텝 S1 에 있어서, 학습 데이터 (10) 를 선택한다. 판정용 화상 작성부 (51) 는, 기억부 (54) 에 기억된 학습 완료 모델 (2) 을 사전 학습 완료 모델 (2a) 로 하여, 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 의 입력 화상 (11) 에 대해 세그먼테이션 처리를 실시함으로써, 판정용 라벨 화상 (14) 을 작성하도록 구성되어 있다. 판정용 화상 작성부 (51) 는, 도 14 의 스텝 S11 과, 도 10 의 스텝 S1, S2 의 처리를 실시한다.
비교부 (52) 는, 판정용 화상 작성부 (51) 에 의해 작성된 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하도록 구성되어 있다. 즉, 비교부 (52) 는, 도 10 의 스텝 S3 의 처리를 실시한다.
라벨 수정부 (53) 는, 비교부 (52) 에 의한 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정하도록 구성되어 있다. 즉, 라벨 수정부 (53) 는, 도 10 의 스텝 S4 의 처리를 실시한다.
학습 데이터 처리부 (50) 는, 도 10 의 스텝 S5 에 있어서, 모든 학습 데이터 (10) 가 선택될 때까지, 학습 데이터 (10) 의 선택과 교사 라벨 화상 (12) 의 수정을 반복한다.
학습부 (55) 는, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습 데이터 (10) 를 사용하여 기계 학습을 실시함으로써, 학습 완료 모델 (2) 을 작성 (갱신) 하도록 구성되어 있다. 즉, 학습부 (55) 는, 도 14 의 스텝 S13 ∼ S15 의 처리를 실시한다. 학습 데이터 처리부 (50) 는, 도 14 의 스텝 S16 에 있어서, 교사 라벨 화상 (12) 의 수정과 학습 완료 모델 (2) 의 재학습을, 소정 횟수만큼 반복한다.
(화상 해석 장치)
다음으로, 상기의 학습 완료 모델의 작성 방법에 의해 작성된 학습 완료 모델 (2) 을 사용하여, 화상 해석 (화상 세그먼테이션) 을 실시하는 화상 해석 장치의 예에 대하여 설명한다.
(화상 해석 장치의 구성예 : 세포 해석 장치)
화상 해석 장치의 제 1 예로서, 도 16 에 나타내는 화상 해석 장치 (100) 는, 세포를 촬상한 세포 화상의 해석을 실시하는 세포 해석 장치이다.
화상 해석 장치 (100) 는, 세포를 촬상한 해석용 화상 (15) 인 IHM (In-line Holographic Microscopy) 위상 이미지에 대해, 세포에 관한 세그먼테이션을 실시하도록 구성되어 있다. 화상 해석 장치 (100) 는, 세그먼테이션 처리에 의해, 세포 화상으로부터 검출 대상이 되는 세포의 영역마다 분할한 라벨 화상 (16) 을 작성한다.
화상 해석 장치 (100) 는, 촬상부 (110) 와, 제어부 (120) 와, 유저 인터페이스인 조작부 (130) 와, 표시부 (140) 와, 학습 데이터 처리부 (50) 를 구비한다.
촬상부 (110) 는, 인라인형 홀로그래픽 현미경이며, 레이저 다이오드 등을 포함하는 광원부 (111) 와 이미지 센서 (112) 를 구비한다. 촬상시에는, 광원부 (111) 와 이미지 센서 (112) 사이에, 세포 콜로니 (또는 세포 단체) (114) 를 포함하는 배양 플레이트 (113) 가 배치된다.
제어부 (120) 는, 촬상부 (110) 의 동작을 제어함과 함께 촬상부 (110) 에서 취득된 데이터를 처리하도록 구성되어 있다. 제어부 (120) 는, 프로세서와 기억부 (126) 를 구비한 컴퓨터이고, 프로세서는, 촬상 제어부 (121) 와, 세포 화상 작성부 (122) 와, 화상 해석부 (123) 를 기능 블록으로서 포함한다.
화상 해석부 (123) 는, 해석용 화상 (15) 의 입력을 받아들이는 화상 입력부 (124) 와, 기계 학습에 의한 학습 완료 모델 (2) 을 사용하여, 해석용 화상 (15) 의 세그먼테이션 처리를 실시하여, 복수의 라벨 영역 (13) 으로 분할된 라벨 화상을 작성하는 해석 처리부 (125) 를 하위의 기능 블록으로서 포함한다.
학습 데이터 처리부 (50) 는, 도 15 에 나타낸 구성과 동일하기 때문에 설명을 생략한다. 학습 데이터 처리부 (50) 에 있어서 작성되는 학습 완료 모델 (2) 이, 제어부 (120) 에 있어서의 기억부 (126) 에 격납되어, 화상 해석부 (123) 에 의한 세포의 세그먼테이션 처리에 이용된다.
제어부 (120) 는, 작업자에 의해 세포 콜로니 (114) 를 포함하는 배양 플레이트 (113) 가 촬상부 (110) 의 소정 위치에 세팅되어, 조작부 (130) 를 개재하여 소정의 조작을 받아들이면, 촬상 제어부 (121) 에 의해 촬상부 (110) 를 제어하여 홀로그램 데이터를 취득한다.
구체적으로는, 촬상부 (110) 는, 광원부 (111) 로부터 코히런트광을 조사시켜, 배양 플레이트 (113) 및 세포 콜로니 (114) 를 투과한 광과, 배양 플레이트 (113) 상에서 세포 콜로니 (114) 의 근방 영역을 투과한 광의 간섭 무늬에 의한 이미지를, 이미지 센서 (112) 에 의해 취득한다. 이미지 센서 (112) 는, 홀로그램 데이터 (검출면 상에 형성된 홀로그램의 2 차원적인 광 강도 분포 데이터) 를 취득한다.
세포 화상 작성부 (122) 는, 촬상부 (110) 에 의해 취득된 홀로그램 데이터에 대해, 위상 회복을 위한 연산 처리를 실행함으로써, 위상 정보를 산출한다. 그리고, 세포 화상 작성부 (122) 는, 산출된 위상 정보에 기초하여 IHM 위상 이미지 (해석용 화상 (15)) 를 작성한다. 위상 정보의 산출이나 IHM 위상 이미지의 작성 수법은, 공지된 기술을 이용할 수 있기 때문에, 상세한 설명을 생략한다.
〈세포 화상 해석부〉
도 4 에 나타낸 세포 화상은, iPS 세포에 있어서의 미분화 일탈 세포 콜로니를 대상으로 하는 IHM 위상 이미지의 일례이다. 화상 해석 장치 (100) 에서는, 화상 해석부 (123) 에 의해 IHM 위상 이미지에 대한 세그먼테이션 처리를 실시함으로써, IHM 위상 이미지 (해석용 화상 (15)) 를, 미분화 세포의 라벨 영역 (13c) 과, 미분화 일탈 세포의 라벨 영역 (13d) 과, 배경의 라벨 영역 (13e) 으로 분류하여 영역 분할하는 처리를 자동적으로 실시한다.
도 17 에 나타내는 바와 같이, 스텝 S21 에 있어서, 화상 입력부 (124) 가, 해석용 화상 (15) 인 IHM 위상 이미지를 취득한다. 스텝 S22 에 있어서, 해석 처리부 (125) 가, 기억부 (126) 에 기억된 학습 완료 모델 (2) 에 의해, 해석용 화상 (15) 에 대한 세그먼테이션 처리를 실시한다. 이로써, 이번에 입력된 해석용 화상 (15) 을 복수의 라벨 영역 (13) 으로 영역 분할한 라벨 화상 (16) 이 작성된다. 스텝 S23 에 있어서, 화상 해석부 (123) 는, 작성된 라벨 화상 (16) 을 기억부 (126) 에 기억시킴과 함께, 작성된 라벨 화상 (16) 을 표시부 (140) 나 외부의 서버 등에 출력한다.
화상 해석부 (123) 에서는, 세그먼테이션 처리 외에, 세그먼테이션 처리를 실시한 결과에 기초하는 각종 해석 처리를 실시할 수 있다. 예를 들어, 화상 해석부 (123) 는, 세그먼테이션 처리에 의해 얻어진 라벨 화상 (16) 에 기초하여, 세포 영역의 면적, 세포의 수, 또는 세포의 밀도 중 적어도 어느 것을 추정한다.
(화상 해석 장치의 구성예 : 골부 화상 해석 장치)
화상 해석 장치의 제 2 예로서, 도 18 에 나타내는 화상 해석 장치 (200) 는, 피검사자의 골부를 포함하는 영역의 X 선 화상의 해석을 실시하는 골부 화상 해석 장치이다.
화상 해석 장치 (200) 는, 골부를 촬상한 해석용 화상 (15) 인 X 선 화상에 대해, 골부에 관한 세그먼테이션을 실시하도록 구성되어 있다. 화상 해석 장치 (200) 는, 세그먼테이션 처리에 의해, X 선 화상으로부터 골부의 영역을 분할한 골부의 라벨 화상 (16) 을 작성한다.
화상 해석 장치 (200) 는, 촬상부 (210) 와, 제어부 (220) 와, 조작부 (230) 와, 표시부 (240) 와, 학습 데이터 처리부 (50) 를 구비한다.
촬상부 (210) 는, 천판 (211) 과, X 선 조사부 (212) 와, X 선 검출부 (213) 를 포함하고 있다. 천판 (211) 은, 피검체 (O) (인간) 를 지지하도록 구성되어 있다. X 선 조사부 (212) 는, 피검체 (O) 를 향하여 X 선을 조사하도록 구성되어 있다. X 선 검출부 (213) 는, 예를 들어 FPD (Flat Panel Detector) 에 의해 구성되고, X 선 조사부 (212) 로부터 조사되어, 피검체 (O) 를 투과한 X 선을 검출하도록 구성되어 있다. 촬상부 (210) 에 의해, 예를 들어 도 2 에 나타낸 바와 같이, 피검사자의 골부를 포함하는 영역의 X 선 화상이, 해석용 화상 (15) 으로서 취득된다.
제어부 (220) 는, 프로세서와 기억부 (226) 를 구비한 컴퓨터이고, 프로세서는, 촬상 제어부 (221) 와, X 선 화상 작성부 (222) 와, 화상 해석부 (223) 를 기능 블록으로서 포함한다.
화상 해석부 (223) 는, 도 16 에 나타낸 예와 마찬가지로, 화상 입력부 (224) 와, 해석 처리부 (225) 를 하위의 기능 블록으로서 포함한다.
학습 데이터 처리부 (50) 는, 도 15 에 나타낸 구성과 동일하기 때문에 설명을 생략한다. 학습 데이터 처리부 (50) 에 있어서 작성되는 학습 완료 모델 (2) 이, 제어부 (220) 에 있어서의 기억부 (226) 에 격납되어, 화상 해석부 (223) 에 의한 골부의 세그먼테이션 처리에 이용된다.
골부에 관한 세그먼테이션 처리를 실시하기 위한 교사 라벨 화상 (12) 은, X 선 화상 외에, 피검사자의 CT 화상 (컴퓨터 단층 촬영 화상) 데이터를 사용하여 작성할 수 있다. 구체적으로는, 교사 라벨 화상 (12) 은, 피검사자의 CT 화상 데이터에 대해, X 선 조사부 (212) 와 X 선 검출부 (213) 의 기하학적 조건을 모의한 가상적 투영을 실시함으로써, 골부를 포함하는 영역을 나타내는 복수의 DRR 화상 (디지털 재구성 시뮬레이션 화상) 을 생성하고, CT 값이 일정 이상의 값이 되는 영역을 골부의 영역으로서 라벨링함으로써, 작성될 수 있다. 학습 데이터 처리부 (50) 는, 도시되지 않은 CT 촬영 장치로부터 CT 화상을 취득하고, 취득한 CT 화상에 기초하여, 교사 라벨 화상 (12) 을 생성할 수 있다.
도 17 에 나타낸 바와 같이, 스텝 S21 에 있어서, 화상 입력부 (224) 가, 해석용 화상 (15) 인 X 선 화상을 취득한다. 스텝 S22 에 있어서, 해석 처리부 (225) 가, 기억부 (226) 에 기억된 학습 완료 모델 (2) 에 의해, 해석용 화상 (15) 에 대한 세그먼테이션 처리를 실시한다. 이로써, 이번에 입력된 해석용 화상 (15) 이 복수의 라벨 영역 (13) 으로 영역 분할된 라벨 화상 (16) 이 작성된다. 스텝 S23 에 있어서, 화상 해석부 (223) 는, 작성된 라벨 화상 (16) 을 기억부 (226) 에 기억시킴과 함께, 작성된 라벨 화상 (16) 을 표시부 (240) 나 외부의 서버 등에 출력한다.
화상 해석부 (223) 에서는, 세그먼테이션 처리 외에, 세그먼테이션 처리를 실시한 결과에 기초하는 각종 해석 처리를 실시할 수 있다. 예를 들어, 화상 해석부 (223) 는, 세그먼테이션 처리에 의해 얻어진 라벨 화상 (16) (도 3 참조) 에 기초하여, 검출된 골부의 골밀도를 추정한다.
또한, 도 15, 도 16 및 도 18 에 있어서, 학습 데이터 처리부 (50) 및 제어부 (120, 220) 의 각 부를, 프로세서가 소프트웨어를 실행함으로써 실현되는 기능 블록으로서 구축하는 대신에, 각각의 처리를 실시하는 전용의 하드웨어에 의해 구축해도 된다.
(제 1 실시형태의 효과)
제 1 실시형태에서는, 이하와 같은 효과를 얻을 수 있다.
제 1 실시형태에서는, 상기와 같이, 판정용 라벨 화상 (14) 을 작성하고, 작성된 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하고, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정한다. 이와 같이 판정용 라벨 화상 (14) 을 기준으로, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 비교 결과에 기초하여 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정을 실시함으로써, 라벨 수정 작업자가 아니라, 컴퓨터를 사용한 자동적인 수정 작업으로도 일관된 기준에 기초하여 경계의 편차를 저감시킬 수 있다. 이로써, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상 (12) 의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 범위를, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 근접하도록 수정한다. 이와 같이 구성하면, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 범위를, 예를 들어 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 일치시키거나, 또는 판정용 라벨 화상 (14) 의 라벨 영역 (13) 사이의 중간적인 범위로 하는 것만으로, 용이하면서 또한 효과적으로, 개개의 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 편차를 작게 하는 수정을 할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 라벨 영역 (13) 의 수정은, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 팽창 및 수축의 적어도 일방에 의해 실시한다. 이와 같이 구성하면, 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 중의 라벨 영역 (13) 의 범위를 팽창시키거나 수축시키거나 하는 정도의 간이한 처리로, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정을 실시할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 판정용 라벨 화상 (14) 에 있어서의 교사 라벨 화상 (12) 과의 일치 부분 및 불일치 부분에 기초하여, 주목하는 라벨이 부여된 라벨 영역 (13) 의 범위를 수정한다. 이와 같이 구성하면, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 일치 부분 및 불일치 부분으로부터, 교사 라벨 화상 (12) 의 라벨 영역 (13) 이, 기준이 되는 판정용 라벨 화상 (14) 으로부터 어떻게 괴리되어 있는지를 파악할 수 있다. 그 때문에, 일치 부분 및 불일치 부분에 기초함으로써, 용이하게 경계의 편차가 작아지도록 라벨 영역 (13) 을 수정할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 라벨을 비교하는 스텝에 있어서, 일치 부분 및 불일치 부분에 기초하여, 판정용 라벨 화상 (14) 에 있어서 라벨의 미검출을 평가하는 미검출 평가값 (22) 및 라벨의 오검출을 평가하는 오검출 평가값 (23) 을 각각 취득하고, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 기초하여 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수정한다. 이와 같이, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 기초함으로써, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 어떻게 수정하면 되는지 (크게 하면 되는지 작게 하면 되는지) 를 파악할 수 있기 때문에, 보다 적절하게 개개의 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수정할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 의해, 판정용 라벨 화상 (14) 에 있어서의 라벨의 미검출에 비해 오검출이 많다고 판단된 경우, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 팽창시킨다. 이와 같이 구성하면, 오검출되는 영역이 많아, 교사 라벨 화상 (12) 의 라벨 영역 (13) 이 기준이 되는 판정용 라벨 화상 (14) 의 라벨 영역 (13) 보다 작다고 추정되는 경우에, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 팽창시킴으로써, 용이하게 라벨 영역 (13) 의 경계의 편차를 작게 하는 수정을 실시할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 비교에 의해, 판정용 라벨 화상 (14) 에 있어서의 라벨의 오검출에 비해 미검출이 많다고 판단된 경우, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수축시킨다. 이와 같이 구성하면, 미검출이 되는 영역이 많아, 교사 라벨 화상 (12) 의 라벨 영역 (13) 이 기준이 되는 판정용 라벨 화상 (14) 의 라벨 영역 (13) 보다 크다고 추정되는 경우에, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수축시킴으로써, 용이하게 라벨 영역 (13) 의 경계의 편차를 작게 하는 수정을 실시할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 미검출 및 오검출의 적어도 일방이 소정의 임계값보다 많다고 판단된 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 를, 학습용 데이터 세트로부터 제외하는 스텝을 추가로 포함한다. 이와 같이 구성하면, 기준이 되는 판정용 라벨 화상 (14) 과의 비교에 있어서 미검출 및 오검출의 적어도 일방이 과도하게 많은 경우, 그 교사 라벨 화상 (12) 은 학습 데이터 (10) 로서 부적절하다고 생각할 수 있다. 그래서, 미검출 및 오검출의 적어도 일방이 많아지는 교사 라벨 화상 (12) 을 학습용 데이터 세트로부터 제외함으로써, 기계 학습의 정밀도를 저하시키는 요인이 되는 학습 데이터 (10) 를 제외할 수 있기 때문에, 학습용 데이터 세트의 품질을 향상시켜 고정밀도의 기계 학습을 실시할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 라벨을 비교하는 스텝에 있어서, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 의 대응하는 부분끼리의 라벨의 비교를, 화상 중의 1 화소마다 실시한다. 이와 같이 구성하면, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 을, 1 화소 단위로 비교할 수 있기 때문에, 보다 정밀하게 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 편차를 평가할 수 있다.
또, 제 1 실시형태에서는, 상기와 같이, 수정된 교사 라벨 화상 (수정 완료 교사 라벨 화상 (12a)) 을 포함하는 학습 데이터 (10) 를 사용한 학습 완료 모델 (2) 에 의해, 판정용 라벨 화상 (14) 을 작성하는 스텝을 추가로 포함하여, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 작성된 판정용 라벨 화상 (14) 과 수정 완료 교사 라벨 화상 (12a) 의 비교 결과에 기초하여, 수정 완료 교사 라벨 화상 (12a) 에 포함되는 라벨 영역 (13) 을 재수정한다. 이와 같이 구성하면, 수정 완료 교사 라벨 화상 (12a) 을 사용하여 기계 학습을 실시한 후에, 재차 판정용 라벨 화상 (14) 을 작성함으로써, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정을 반복하여 실시할 수 있다. 라벨 영역 (13) 의 수정을 반복하여 실시함으로써, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 편차를, 더욱 작게 수속시킬 수 있다.
또, 제 1 실시형태의 학습 완료 모델의 작성 방법에서는, 상기와 같이, 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대한 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정한다. 이로써, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상 (12) 의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다. 그리고, 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습 데이터 (10) 를 사용하여 사전 학습 완료 모델 (2a) 에 대한 기계 학습을 실시함으로써, 학습 완료 모델 (2) 을 작성하기 때문에, 라벨 영역 (13) 의 경계 부분의 판정 편차가 억제된 고품질의 세그먼테이션 처리가 가능한 학습 완료 모델 (2) 을 얻을 수 있다.
또, 제 1 실시형태의 화상 해석 장치 (100, 200) 에서는, 상기와 같이, 판정용 라벨 화상 (14) 을 작성하는 판정용 화상 작성부 (51) 와, 판정용 화상 작성부 (51) 에 의해 작성된 판정용 라벨 화상 (14) 과 교사 라벨 화상 (12) 에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 비교부 (52) 와, 비교부 (52) 에 의한 라벨의 비교 결과에 기초하여, 교사 라벨 화상 (12) 에 포함되는 라벨 영역 (13) 을 수정하는 라벨 수정부 (53) 를 형성한다. 이로써, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상 (12) 의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
(제 2 실시형태)
다음으로, 도 19 및 도 20 을 참조하여, 제 2 실시형태에 의한 교사 라벨 화상 수정 방법에 대하여 설명한다. 제 2 실시형태에서는, 상기 제 1 실시형태에 의한 교사 라벨 화상 수정 방법에 더하여, 라벨 영역의 팽창 또는 수축에 의한 수정을 실시할 때에, 라벨의 우선도에 따라 수정량을 조정하는 예에 대하여 설명한다.
도 19 에 나타내는 바와 같이, 제 2 실시형태에 의한 교사 라벨 화상 수정 방법에서는, 교사 라벨 화상 (12) 의 라벨 간에 우선도 (60) 를 설정하는 스텝을 추가로 포함한다. 그리고, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 우선도 (60) 에 따라, 라벨 영역 (13) 의 수정량을 조정한다.
예를 들어 도 19 에서는, 다능성 간세포의 세포 화상에 대해, 미분화 세포, 미분화 일탈 세포, 배경의 3 개의 라벨을 설정하고, 세그먼테이션 처리에 의해 각각의 라벨 영역 (13) 으로 분할하는 예를 나타내고 있다.
이 세포 화상은, 다능성 간세포를 배양할 때에, 세포 콜로니 중으로부터 미분화 일탈 세포를 발견하여 이것을 제거함으로써, 다능성을 유지한 미분화 세포가 분화되는 것을 억제함과 함께 미분화 세포만을 배양하기 위해 사용된다. 즉, 미분화 일탈 세포를 확실하게 발견할 것이 요망되기 때문에, 미분화 세포, 미분화 일탈 세포, 배경의 각 라벨 중에서는, 우선도가 높은 쪽부터 미분화 일탈 세포, 미분화 세포, 배경의 순으로 우선도 (60) 가 설정된다.
그리고, 제 2 실시형태에서는, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수정할 때에, 우선도가 높은 라벨 영역 (13) 으로의, 우선도가 낮은 라벨 영역 (13) 의 팽창을 금지한다. 즉, 우선도가 낮은 라벨 영역 (13) 의 팽창에 의해 우선도가 높은 라벨 영역 (13) 이 작아지지 않도록, 우선도 (60) 에 따라 라벨 영역 (13) 의 수정량이 조정된다. 도 20 의 예에서는, 라벨 영역 (13) 의 팽창 수정을 실시하는 경우에, 배경의 라벨 영역 (13e) 의 미분화 세포의 라벨 영역 (13c) 및 미분화 일탈 세포의 라벨 영역 (13d) 으로의 팽창이 금지된다. 그리고, 미분화 세포의 라벨 영역 (13c) 의 미분화 일탈 세포의 라벨 영역 (13d) 으로의 팽창이 금지된다.
한편, 라벨 영역 (13) 의 팽창 수정을 실시하는 경우에, 미분화 일탈 세포의 라벨 영역 (13d) 은, 미분화 세포의 라벨 영역 (13c) 및 배경의 라벨 영역 (13e) 으로의 팽창이 허용된다. 그리고, 미분화 세포의 라벨 영역 (13c) 은, 배경의 라벨 영역 (13e) 으로의 팽창이 허용된다. 이 결과, 제 2 실시형태에서는, 교사 라벨 화상 (12) 에 있어서, 우선도가 높은 라벨의 라벨 영역 (13) 이 작아지는 방향으로의 수정이 제한된다.
제 2 실시형태의 그 밖의 구성은, 상기 제 1 실시형태와 동일하다. 또한, 제 2 실시형태의 다른 구성예에서는, 우선도가 높은 라벨 영역 (13) 으로의, 우선도가 낮은 라벨 영역 (13) 의 팽창을 금지하지 않아도 된다. 예를 들어, 우선도가 낮은 라벨 영역 (13c) 으로부터 우선도가 높은 라벨 영역 (13d) 으로의 팽창량을, 우선도가 높은 라벨 영역 (13d) 으로부터 우선도가 낮은 라벨 영역 (13c) 으로의 팽창량보다 작게 한다. 이와 같이 해도, 우선도가 높은 라벨의 라벨 영역 (13) 이 작아지는 방향으로의 수정을 억제할 수 있다.
(제 2 실시형태의 효과)
제 2 실시형태에서는, 이하와 같은 효과를 얻을 수 있다.
제 2 실시형태에서는, 상기 제 1 실시형태와 마찬가지로, 화상 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상 (12) 의 수정 작업을, 정밀도를 확보하면서 간이화할 수 있다.
또, 제 2 실시형태에서는, 상기와 같이, 교사 라벨 화상 (12) 의 라벨 간에 우선도 (60) 를 설정하는 스텝을 추가로 포함하고, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 우선도 (60) 에 따라, 라벨 영역 (13) 의 수정량을 조정한다. 이로써, 우선도가 높은 라벨은 최대한 검출 누락을 억제할 수 있도록 수정량을 의도적으로 치우치게 할 수 있다. 그 결과, 세그먼테이션 처리의 목적에 따라 교사 라벨 화상 (12) 의 수정을 적절히 실시할 수 있다.
또, 제 2 실시형태에서는, 상기와 같이, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을 수정할 때에, 우선도가 높은 라벨 영역 (13) 으로의, 우선도가 낮은 라벨 영역 (13) 의 팽창을 금지한다. 이로써, 우선도가 낮은 라벨 영역 (13) (예를 들어 라벨 영역 (13c)) 을 팽창시키는 수정을 해도 우선도가 높은 라벨 영역 (13) (예를 들어 라벨 영역 (13d)) 을 보존할 수 있다. 그 때문에, 세그먼테이션 처리의 목적에 따라, 경계의 편차를 억제하면서, 우선도가 높은 라벨 영역 (13) 의 검출 누락을 억제한 학습이 가능한 교사 라벨 화상 (12) (학습 데이터 (10)) 을 얻을 수 있다.
(변형예)
또한, 이번에 개시된 실시형태는, 모든 점에서 예시로서 제한적인 것은 아니라고 생각되어야 할 것이다. 본 발명의 범위는, 상기한 실시형태의 설명이 아니라, 특허청구범위에 의해 나타내어지고, 추가로 특허청구범위와 균등한 의미 및 범위 내에서의 모든 변경 (변형예) 이 포함된다.
예를 들어, 상기 일 실시형태에서는, 화상의 예로서, 세포 화상, X 선 화상의 예를 나타냈지만, 본 발명은 이것에 한정되지 않는다. 본 발명에 의한 교사 라벨 화상의 수정은, 세그먼테이션 처리의 기계 학습에 사용하는 교사 라벨 화상이라면, 어떠한 화상에 대해서도 적용할 수 있다. 본 발명에 의한 교사 라벨 화상의 수정은, 라벨 영역의 경계의 편차를 수정하는 것이기 때문에, 라벨 영역의 경계 부분에 높은 정밀도가 요구되는 분야에 있어서 특히 바람직하다. 그러한 화상으로서, 특히 의료용 분야 (의료 분야, 의과학 분야) 에 사용되는, 이른바 의료용 화상이 있다. 의료용 화상은, 예를 들어 의사에 의한 질환의 진단 등에 사용되기 때문에, 라벨 영역의 미세한 경계 부분이라 하더라도, 경계가 흐릿해지거나, 부자연스러운 형상이 되는 것을 최대한 억제할 것이 요망된다. 그 때문에, 교사 라벨 화상의 수정에 의해 라벨 영역의 경계의 편차를 저감시키는 것이 가능한 본 발명은, 의료용 화상의 세그먼테이션에 사용하는 경우에 특히 바람직하다. 의료용 화상으로는, 세포 화상, 골부 그 밖의 X 선 화상 외에, 예를 들어 치료 대상 부위로서의 종양 영역을 검출 대상으로 하여 세그먼테이션 처리를 하는 경우의, 종양이 비치는 화상 (내시경 화상 등) 등이어도 된다.
또, 상기 제 1 및 제 2 실시형태에서는, 교사 라벨 화상 (12) 전체를, 판정용 라벨 화상 (14) 과 1 화소마다 비교하여, 비교 결과에 기초하여 수정하는 예를 나타냈지만, 본 발명은 이것에 한정되지 않는다. 본 발명에서는, 교사 라벨 화상 (12) 의 일부에 대해 판정용 라벨 화상 (14) 과의 비교 및 수정을 실시해도 된다. 예를 들어 도 21 에 나타내는 교사 라벨 화상 수정 방법의 변형예에서는, 라벨 영역 (13) 을 수정하는 스텝에 있어서, 교사 라벨 화상 (12) 을 복수의 부분 화상 (17) 으로 분할하고, 분할된 교사 라벨 화상 (12) 의 적어도 1 개의 부분 화상 (17) 에 대하여 라벨 영역 (13) 을 수정한다. 도 21 에서는, 교사 라벨 화상 (12) 을 6 × 6 의 사각형의 부분 화상 (17a) 이 되도록 매트릭스상으로 분할하고 있다. 그리고, 변형예에서는, 판정용 라벨 화상 (14) 에 대해서도 부분 화상 (17b) 으로 분할하고, 부분 화상 (17) (17a, 17b) 마다, 교사 라벨 화상 (12) 과 판정용 라벨 화상 (14) 을 비교함과 함께, 비교 결과에 기초하여 교사 라벨 화상 (12) 의 부분 화상 (17) 을 수정한다. 각각의 부분 화상 (17) 의 형상이나, 분할수는, 특별히 한정되지 않고 임의적이다. 수정은, 특정한 1 개 또는 복수의 부분 화상 (17) 에 대해서만 실시해도 되고, 모든 부분 화상 (17) 에 대해 각각 실시해도 된다. 이 변형예와 같이 구성하면, 교사 라벨 화상 (12) 의 특정한 일부분만을 수정하거나, 작은 부분마다 개별적으로 수정할 수 있다.
또, 상기 제 1 실시형태에서는, 화상 해석 장치 (100, 200) 가, 교사 라벨 화상 (12) 의 수정 처리를 실시하는 예를 나타냈지만, 본 발명은 이것에 한정되지 않는다. 교사 라벨 화상 (12) 의 수정 처리를, 화상 해석 장치 이외의 다른 장치에 의해 실시해도 된다. 마찬가지로, 상기 제 1 및 제 2 실시형태에서는, 화상 해석 장치 (100, 200) 가, 기계 학습에 의한 학습 완료 모델 (2) 의 작성을 실시하는 예를 나타냈지만, 학습 완료 모델 (2) 의 작성을, 화상 해석 장치 이외의 다른 장치에 의해 실시해도 된다.
예를 들어 도 22 에 나타내는 변형예에서는, 학습 데이터 처리부 (50) 가, 화상 해석 장치 (300) 와는 별개의 서버 장치로서 형성되고, 화상 해석 장치 (300) 와 네트워크를 통해 접속되어 있다. 학습 데이터 처리부 (50) 는, 화상 해석 장치 (300) 로부터, 새롭게 촬상된 해석용 화상 (15) 을, 기계 학습을 위한 학습 데이터 (10) 의 입력 화상 (11) 으로서 취득한다. 학습 데이터 처리부 (50) 에 의해, 또는 다른 화상 처리 장치를 사용하여, 입력 화상 (11) 으로부터 교사 라벨 화상 (12) 이 작성되고, 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 가, 학습용 데이터 세트 (1) 에 추가된다. 학습 데이터 처리부 (50) 는, 입력 화상 (11) 으로부터 사전 학습 완료 모델 (2a) 에 의해 판정용 라벨 화상 (14) 을 작성하고, 교사 라벨 화상 (12) 과의 비교를 실시하고, 비교 결과에 기초하여 교사 라벨 화상 (12) 의 수정을 실시한다. 학습 데이터 처리부 (50) 는, 수정 완료 교사 라벨 화상 (12) 을 사용하여 사전 학습 완료 모델 (2a) 의 재학습을 실시하여, 학습 완료 모델 (2) 을 작성 (업데이트) 한다. 학습 데이터 처리부 (50) 는, 새롭게 작성된 학습 완료 모델 (2) 을, 네트워크를 통해 화상 해석 장치 (300) 에 송신한다. 이로써, 화상 해석 장치 (300) 는, 새롭게 작성된 학습 완료 모델 (2) 을 사용하여 세그먼테이션 처리를 실시할 수 있다.
또, 예를 들어 도 23 에 나타내는 변형예에서는, 화상 해석 장치 (300) 에 있어서, 교사 라벨 화상 (12) 의 수정이 실시된다. 그리고, 학습 데이터 처리부 (50) 측에서, 학습 완료 모델 (2) 이 작성된다. 화상 해석 장치 (300) 측에서, 새롭게 촬상된 해석용 화상 (15) 을, 학습 데이터 (10) 의 입력 화상 (11) 으로 하여, 교사 라벨 화상 (12) 이 작성된다. 입력 화상 (11) 과 교사 라벨 화상 (12) 을 포함하는 학습 데이터 (10) 가, 학습용 데이터 세트 (1) 에 추가된다. 화상 해석 장치 (300) 는, 입력 화상 (11) 으로부터 사전 학습 완료 모델 (2a) 에 의해 판정용 라벨 화상 (14) 을 작성하고, 교사 라벨 화상 (12) 과의 비교를 실시하고, 비교 결과에 기초하여 교사 라벨 화상 (12) 의 수정을 실시한다. 화상 해석 장치 (300) 는, 입력 화상 (11) 과 수정 완료 교사 라벨 화상 (12a) 을 포함하는 학습 데이터 (10) 를, 네트워크를 통해 학습 데이터 처리부 (50) 로 송신한다. 학습 데이터 처리부 (50) 는, 송신된 학습 데이터 (10) 를 학습용 데이터 세트 (1) 에 추가하고, 사전 학습 완료 모델 (2a) 의 재학습을 실시하여, 학습 완료 모델 (2) 을 작성 (업데이트) 한다. 학습 데이터 처리부 (50) 는, 새롭게 작성된 학습 완료 모델 (2) 을, 네트워크를 통해 화상 해석 장치 (300) 에 송신한다. 이로써, 화상 해석 장치 (300) 는, 새롭게 작성된 학습 완료 모델 (2) 을 사용하여 세그먼테이션 처리를 실시할 수 있다.
이와 같이, 본 발명의 교사 라벨 화상 수정 방법 및 학습 완료 모델의 작성 방법은, 각각 이른바 클라우드 서비스 등의 형태로, 네트워크 접속된 복수의 컴퓨터의 협동에 의해 실시해도 된다.
또, 상기 제 1 실시형태에서는, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 수정을, 모폴로지 처리에 의해 실시하는 예를 나타냈지만, 본 발명은 이것에 한정되지 않는다. 본 발명에서는, 모폴로지 처리 이외의 방법으로 라벨 영역을 수정해도 된다. 예를 들어, 미검출 또는 오검출이 소정의 임계값보다 많은 경우에, 교사 라벨 화상 (12) 의 라벨 영역 (13) 을, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 에 의해 치환해도 된다. 또, 예를 들어, 수정 완료 교사 라벨 화상 (12a) 의 라벨 영역 (13) 의 경계가, 교사 라벨 화상 (12) 의 라벨 영역 (13) 의 경계와, 판정용 라벨 화상 (14) 의 라벨 영역 (13) 의 경계의 중간에 위치하도록 수정해도 된다. 이와 같은 경우, 상기 제 1 실시형태와 같이, 반드시 미검출 평가값 (22) 및 오검출 평가값 (23) 을 사용할 필요는 없다.
또, 상기 제 1 실시형태에서는, 미검출 평가값 (22) 으로서 상기 식 (1) 로 나타내는 검출률 (K) 를 사용하고, 오검출 평가값 (23) 으로서 상기 식 (2) 로 나타내는 정밀도 (G) 를 사용하는 예를 나타냈지만, 본 발명은 이것에 한정되지 않는다. 예를 들어, 검출률 (K) 및 정밀도 (G) 의 어느 일방 대신에, 하기 식 (3) 에 나타내는 IoU (Intersectional over Union) 나, 하기 식 (4) 에 나타내는 F 값을 사용해도 된다.
IoU = TP/(TP + FN + FP)···(3)
F 값 = 2K × G/(K + G)···(4)
또한, 상기 식 (4) 에 있어서의 K 는, 상기 식 (1) 에 나타낸 검출률이고, G 는, 상기 식 (2) 에 나타낸 정밀도이다.
이들 IoU 및 F 값은, 미검출과 오검출의 양방을 평가하는 복합적인 지표이며, 미검출 평가값 (22) 및 오검출 평가값 (23) 의 양방에 해당한다. IoU 또는 F 값과, 검출률 (K) 또는 정밀도 (G) 를 조합하여 사용함으로써, 미검출과 오검출을 별개로 평가할 수 있다. 예를 들어 IoU 와 검출률 (K) 을 사용하는 경우, K ≒ IoU ≪ 1 일 때에는 오검출이 적고 미검출이 많다고 판단되고, 1 ≒ K > IoU 일 때에는 미검출이 적고 오검출이 많다고 판단된다.
또한, 상기 제 1 실시형태에서는, 도 11 에 나타낸 2 클래스의 혼동 행렬 (21) 을 전제로 하여, 미검출 평가값 (22) 및 오검출 평가값 (23) 에 대하여 설명했지만, 3 클래스 이상의 다(多)클래스의 세그먼테이션 처리에도 적용 가능하다. 설명은 생략하지만, 3 클래스 이상의 경우도, 클래스수에 따른 혼동 행렬로부터, 검출률이나 정밀도 등의 미검출 평가값 및 오검출 평가값을 구하면 된다.
1 : 학습용 데이터 세트
2 : 학습 완료 모델
2a : 사전 학습 완료 모델
10 : 학습 데이터
11 : 입력 화상
12 : 교사 라벨 화상
12a : 수정 완료 교사 라벨 화상 (수정된 교사 라벨 화상)
13, 13a, 13b, 13c, 13d, 13e, 13f, 13g : 라벨 영역
14 : 판정용 라벨 화상
15 : 해석용 화상
16 : 라벨 화상
17, 17a, 17b : 부분 화상
22 : 미검출 평가값
23 : 오검출 평가값
51 : 판정용 화상 작성부
52 : 비교부
53 : 라벨 수정부
54 : 기억부
60 : 우선도
100, 200 : 화상 해석 장치
124, 224 : 화상 입력부
125, 225 : 해석 처리부
126, 226 : 기억부

Claims (15)

  1. 프로세서에 의해 수행되는, 화상의 세그먼테이션 처리를 실시하는 기계 학습에 있어서의 교사 라벨 화상의 수정 방법으로서,
    입력 화상과 교사 라벨 화상을 포함하는 학습 데이터의 상기 입력 화상에 대해, 상기 학습 데이터를 사용한 학습 완료 모델에 의해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 판정용 라벨 화상을 작성하는 스텝과,
    작성된 상기 판정용 라벨 화상과 상기 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝과,
    라벨의 비교 결과에 기초하여, 상기 교사 라벨 화상에 포함되는 상기 라벨 영역을 수정하는 스텝을 포함하는, 교사 라벨 화상 수정 방법.
  2. 제 1 항에 있어서,
    상기 라벨 영역을 수정하는 스텝에 있어서, 라벨의 비교 결과에 기초하여, 상기 교사 라벨 화상 중의 상기 라벨 영역의 범위를, 상기 판정용 라벨 화상의 상기 라벨 영역에 근접하도록 수정하는, 교사 라벨 화상 수정 방법.
  3. 제 2 항에 있어서,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 라벨 영역의 수정은, 상기 교사 라벨 화상 중의 상기 라벨 영역의 팽창 및 수축의 적어도 일방에 의해 실시하는, 교사 라벨 화상 수정 방법.
  4. 제 1 항에 있어서,
    상기 라벨을 비교하는 스텝에 있어서, 상기 판정용 라벨 화상과 상기 교사 라벨 화상의 비교에 의해, 주목하는 라벨에 대하여, 상기 판정용 라벨 화상에 있어서의 상기 교사 라벨 화상과의 일치 부분 및 불일치 부분을 취득하고,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 일치 부분 및 상기 불일치 부분에 기초하여, 주목하는 라벨이 부여된 상기 라벨 영역의 범위를 수정하는, 교사 라벨 화상 수정 방법.
  5. 제 4 항에 있어서,
    상기 라벨을 비교하는 스텝에 있어서, 상기 일치 부분 및 상기 불일치 부분에 기초하여, 상기 판정용 라벨 화상에 있어서 라벨의 미검출을 평가하는 미검출 평가값 및 라벨의 오검출을 평가하는 오검출 평가값을 각각 취득하고,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 미검출 평가값 및 상기 오검출 평가값의 비교에 기초하여 상기 교사 라벨 화상의 상기 라벨 영역을 수정하는, 교사 라벨 화상 수정 방법.
  6. 제 5 항에 있어서,
    상기 미검출 평가값 및 상기 오검출 평가값의 비교에 의해, 상기 판정용 라벨 화상에 있어서의 라벨의 미검출에 비해 오검출이 많다고 판단된 경우, 상기 라벨 영역을 수정하는 스텝에 있어서, 상기 교사 라벨 화상의 상기 라벨 영역을 팽창시키는, 교사 라벨 화상 수정 방법.
  7. 제 5 항에 있어서,
    상기 미검출 평가값 및 상기 오검출 평가값의 비교에 의해, 상기 판정용 라벨 화상에 있어서의 라벨의 오검출에 비해 미검출이 많다고 판단된 경우, 상기 라벨 영역을 수정하는 스텝에 있어서, 상기 교사 라벨 화상의 상기 라벨 영역을 수축시키는, 교사 라벨 화상 수정 방법.
  8. 제 5 항에 있어서,
    미검출 및 오검출의 적어도 일방이 소정의 임계값보다 많다고 판단된 상기 교사 라벨 화상을 포함하는 상기 학습 데이터를, 학습용 데이터 세트로부터 제외하는 스텝을 추가로 포함하는, 교사 라벨 화상 수정 방법.
  9. 제 1 항에 있어서,
    상기 교사 라벨 화상의 라벨 간에 우선도를 설정하는 스텝을 추가로 포함하고,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 우선도에 따라, 상기 라벨 영역의 수정량을 조정하는, 교사 라벨 화상 수정 방법.
  10. 제 9 항에 있어서,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 교사 라벨 화상의 상기 라벨 영역을 수정할 때에, 상기 우선도가 높은 상기 라벨 영역으로의, 상기 우선도가 낮은 상기 라벨 영역의 팽창을 금지하는, 교사 라벨 화상 수정 방법.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 라벨 영역을 수정하는 스텝에 있어서, 상기 교사 라벨 화상을 복수의 부분 화상으로 분할하고, 분할된 상기 교사 라벨 화상의 적어도 1 개의 상기 부분 화상에 대하여 상기 라벨 영역을 수정하는, 교사 라벨 화상 수정 방법.
  12. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 라벨을 비교하는 스텝에 있어서, 상기 판정용 라벨 화상과 상기 교사 라벨 화상의 대응하는 부분끼리의 라벨의 비교를, 화상 중의 1 화소마다 또는 근방의 복수 화소마다 실시하는, 교사 라벨 화상 수정 방법.
  13. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    수정된 상기 교사 라벨 화상을 포함하는 상기 학습 데이터를 사용한 학습 완료 모델에 의해, 상기 판정용 라벨 화상을 작성하는 스텝을 추가로 포함하고,
    상기 라벨 영역을 수정하는 스텝에 있어서, 작성된 상기 판정용 라벨 화상과 상기 수정된 교사 라벨 화상의 비교 결과에 기초하여, 상기 수정된 교사 라벨 화상에 포함되는 상기 라벨 영역을 재수정하는, 교사 라벨 화상 수정 방법.
  14. 프로세서에 의해 수행되는, 화상의 세그먼테이션 처리를 실시하는 기계 학습에 의한 학습 완료 모델의 작성 방법으로서,
    입력 화상과 교사 라벨 화상을 포함하는 학습 데이터를 사용한 기계 학습에 의한 사전 학습 완료 모델을 취득하는 스텝과,
    취득한 상기 사전 학습 완료 모델에 의해, 상기 학습 데이터의 상기 입력 화상에 대해 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 판정용 라벨 화상을 작성하는 스텝과,
    작성된 상기 판정용 라벨 화상과 상기 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 스텝과,
    라벨의 비교 결과에 기초하여, 상기 교사 라벨 화상에 포함되는 상기 라벨 영역을 수정하는 스텝과,
    수정된 상기 교사 라벨 화상을 포함하는 상기 학습 데이터를 사용하여 기계 학습을 실시함으로써, 학습 완료 모델을 작성하는 스텝을 포함하는, 학습 완료 모델의 작성 방법.
  15. 해석용 화상의 입력을 받아들이는 화상 입력부와,
    기계 학습에 의한 학습 완료 모델을 사용하여, 상기 해석용 화상의 세그먼테이션 처리를 실시하여, 복수의 라벨 영역으로 분할된 라벨 화상을 작성하는 해석 처리부와,
    상기 학습 완료 모델을 기억하는 기억부와,
    상기 기억부에 기억된 상기 학습 완료 모델을 사전 학습 완료 모델로 하여, 입력 화상과 교사 라벨 화상을 포함하는 학습 데이터의 상기 입력 화상에 대해 세그먼테이션 처리를 실시함으로써, 판정용 라벨 화상을 작성하는 판정용 화상 작성부와,
    상기 판정용 화상 작성부에 의해 작성된 상기 판정용 라벨 화상과 상기 교사 라벨 화상에 대하여, 화상 중의 대응하는 부분끼리의 라벨을 비교하는 비교부와,
    상기 비교부에 의한 라벨의 비교 결과에 기초하여, 상기 교사 라벨 화상에 포함되는 상기 라벨 영역을 수정하는 라벨 수정부를 구비하는, 화상 해석 장치.
KR1020207035363A 2018-08-06 2018-08-06 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 KR102565074B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/029473 WO2020031243A1 (ja) 2018-08-06 2018-08-06 教師ラベル画像修正方法、学習済みモデルの作成方法および画像解析装置

Publications (2)

Publication Number Publication Date
KR20210008051A KR20210008051A (ko) 2021-01-20
KR102565074B1 true KR102565074B1 (ko) 2023-08-08

Family

ID=69415200

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207035363A KR102565074B1 (ko) 2018-08-06 2018-08-06 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치

Country Status (5)

Country Link
US (1) US11830195B2 (ko)
JP (1) JP6996633B2 (ko)
KR (1) KR102565074B1 (ko)
CN (1) CN112424822A (ko)
WO (1) WO2020031243A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3644275A1 (en) * 2018-10-22 2020-04-29 Koninklijke Philips N.V. Predicting correctness of algorithmic segmentation
JP7049974B2 (ja) * 2018-10-29 2022-04-07 富士フイルム株式会社 情報処理装置、情報処理方法、及びプログラム
TWI697851B (zh) * 2019-05-03 2020-07-01 宏碁股份有限公司 電子裝置與模型更新方法
JP7342950B2 (ja) * 2019-07-18 2023-09-12 株式会社島津製作所 細胞画像解析方法および細胞画像解析装置
JP7502055B2 (ja) 2020-03-18 2024-06-18 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
US11526694B2 (en) * 2020-03-31 2022-12-13 International Business Machines Corporation Model training using fully and partially-annotated images
US11449716B2 (en) 2020-03-31 2022-09-20 International Business Machines Corporation Model training using partially-annotated images
JP7457138B2 (ja) 2020-09-07 2024-03-27 富士フイルム株式会社 学習データ作成装置、方法、プログラム、及び機械学習方法
US11366983B2 (en) * 2020-09-09 2022-06-21 International Business Machines Corporation Study-level multi-view processing system
US11651499B2 (en) 2020-09-17 2023-05-16 International Business Machines Corporation Reducing structural redundancy in automatic image segmentation
WO2023008428A1 (ja) * 2021-07-29 2023-02-02 株式会社島津製作所 細胞画像解析方法
DE102022119216A1 (de) * 2021-08-04 2023-02-09 Motional Ad Llc Erzeugung eines skalierbaren und realistischen Kamerablockierungsdatensatzes
JP2023034230A (ja) * 2021-08-30 2023-03-13 公益財団法人神戸医療産業都市推進機構 細胞画像解析システム、細胞画像解析装置、および、細胞画像解析方法
WO2023078545A1 (en) * 2021-11-03 2023-05-11 Medimaps Group Sa Method for analyzing a texture of a bone from a digitized image
CN114037868B (zh) * 2021-11-04 2022-07-01 杭州医策科技有限公司 图像识别模型的生成方法及装置
TWI793865B (zh) 2021-11-18 2023-02-21 倍利科技股份有限公司 Ai自動輔助標記之系統及方法
CN114154571B (zh) * 2021-12-01 2023-04-07 北京思路智园科技有限公司 一种针对图像的智能化的辅助标注方法及系统
CN116188947B (zh) * 2023-04-28 2023-07-14 珠海横琴圣澳云智科技有限公司 基于领域知识的半监督信号点检测方法及装置
CN117953977B (zh) * 2024-03-26 2024-06-11 广东美赛尔细胞生物科技有限公司 一种重组间充质干细胞培养控制方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014215852A (ja) 2013-04-26 2014-11-17 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
JP2015087903A (ja) 2013-10-30 2015-05-07 ソニー株式会社 情報処理装置及び情報処理方法
JP2015129988A (ja) 2014-01-06 2015-07-16 日本電気株式会社 データ処理装置
JP2017117019A (ja) 2015-12-21 2017-06-29 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594809A (en) * 1995-04-28 1997-01-14 Xerox Corporation Automatic training of character templates using a text line image, a text line transcription and a line image source model
US20110099133A1 (en) * 2009-10-28 2011-04-28 Industrial Technology Research Institute Systems and methods for capturing and managing collective social intelligence information
CN102360494B (zh) * 2011-10-18 2013-09-04 中国科学院自动化研究所 一种多前景目标交互式图像分割方法
JP5953151B2 (ja) 2012-07-13 2016-07-20 日本放送協会 学習装置、及びプログラム
US9558423B2 (en) * 2013-12-17 2017-01-31 Canon Kabushiki Kaisha Observer preference model
US9767386B2 (en) * 2015-06-23 2017-09-19 Adobe Systems Incorporated Training a classifier algorithm used for automatically generating tags to be applied to images
CN106023220B (zh) * 2016-05-26 2018-10-19 史方 一种基于深度学习的车辆外观部件图像分割方法
JP6622172B2 (ja) * 2016-11-17 2019-12-18 株式会社東芝 情報抽出支援装置、情報抽出支援方法およびプログラム
US10751548B2 (en) * 2017-07-28 2020-08-25 Elekta, Inc. Automated image segmentation using DCNN such as for radiation therapy
JP2019101535A (ja) * 2017-11-29 2019-06-24 コニカミノルタ株式会社 教師データ作成装置および該方法ならびに画像セグメンテーション装置および該方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014215852A (ja) 2013-04-26 2014-11-17 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
JP2015087903A (ja) 2013-10-30 2015-05-07 ソニー株式会社 情報処理装置及び情報処理方法
JP2015129988A (ja) 2014-01-06 2015-07-16 日本電気株式会社 データ処理装置
JP2017117019A (ja) 2015-12-21 2017-06-29 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
US11830195B2 (en) 2023-11-28
JP6996633B2 (ja) 2022-01-17
JPWO2020031243A1 (ja) 2021-08-02
KR20210008051A (ko) 2021-01-20
CN112424822A (zh) 2021-02-26
US20210272288A1 (en) 2021-09-02
WO2020031243A1 (ja) 2020-02-13

Similar Documents

Publication Publication Date Title
KR102565074B1 (ko) 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치
US20240119719A1 (en) Identification and tracking of a predefined object in a set of images from a medical image scanner during a surgical procedure
US20200117991A1 (en) Learning apparatus, detecting apparatus, learning method, and detecting method
US9940545B2 (en) Method and apparatus for detecting anatomical elements
EP3939006A1 (en) Feature point detection
JP2007236939A (ja) 乳房辺縁検出のための方法および装置
JP2012512730A (ja) 医療用途のデジタルx線画像の対象領域における明るさレベルを計算する方法
US20110188743A1 (en) Image processing apparatus, image processing method, image processing system, and recording medium
WO2021000832A1 (zh) 匹配人脸的方法、装置、计算机设备和存储介质
KR101700887B1 (ko) 영상 처리를 이용한 세포 계수 장치 및 방법, 이를 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록매체
Muhammed Localizing optic disc in retinal image automatically with entropy based algorithm
CN110555860A (zh) 医学图像中肋骨区域标注的方法、电子设备和存储介质
CN114764189A (zh) 用于评估图像处理结果的显微镜系统和方法
CN110619621A (zh) 识别图像中肋骨区域的方法、装置、电子设备和存储介质
KR102255592B1 (ko) 마진 라인의 정밀도 향상을 위한 치과용 ct 영상 처리 방법
TWI675646B (zh) 乳房影像分析方法、乳房影像分析系統及非暫態電腦可讀取媒體
CN113077391A (zh) 校正扫描图像的方法和装置以及图像扫描系统
Antal et al. Evaluation of the grading performance of an ensemble-based microaneurysm detector
US20220414869A1 (en) Detecting and segmenting regions of interest in biomedical images using neural networks
EP2693397B1 (en) Method and apparatus for noise reduction in an imaging system
CN113793316B (zh) 一种超声扫查区域提取方法、装置、设备和存储介质
EP3454301A1 (en) Method for detecting and labelling coronary artery calcium
Gao et al. Full-automatic optic disc boundary extraction based on active contour model with multiple energies
CN110555850A (zh) 识别图像中肋骨区域的方法、装置、电子设备和存储介质
Salazar-Gonzalez et al. Automatic graph cut based segmentation of retinal optic disc by incorporating blood vessel compensation.

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant