KR20200106909A - 원격 감지 이미지 인식 방법, 장치, 저장 매체 및 전자 기기 - Google Patents
원격 감지 이미지 인식 방법, 장치, 저장 매체 및 전자 기기 Download PDFInfo
- Publication number
- KR20200106909A KR20200106909A KR1020207021508A KR20207021508A KR20200106909A KR 20200106909 A KR20200106909 A KR 20200106909A KR 1020207021508 A KR1020207021508 A KR 1020207021508A KR 20207021508 A KR20207021508 A KR 20207021508A KR 20200106909 A KR20200106909 A KR 20200106909A
- Authority
- KR
- South Korea
- Prior art keywords
- remote sensing
- sensing image
- recognized
- pixel
- image block
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 238000012545 processing Methods 0.000 claims abstract description 97
- 238000013528 artificial neural network Methods 0.000 claims abstract description 93
- 238000004590 computer program Methods 0.000 claims abstract description 32
- 238000003709 image segmentation Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 7
- 230000001133 acceleration Effects 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G06K9/0063—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G06K9/6277—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G06N3/0454—
-
- G06N7/005—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Biodiversity & Conservation Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
본 출원은 원격 감지 이미지 인식 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램을 개시하고, 여기서 원격 감지 이미지 인식 방법은, 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻는 단계(S100); 상기 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하는 단계(S110); 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계(S120); 상기 처리될 원격 감지 이미지 블록을 신경 네트워크에 입력하여, 신경 네트워크를 통해 입력된 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하는 단계(S130); 및 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계(S140)를 포함한다.
Description
관련 출원의 상호 참조
본 출원은 2017년 12월 26일에 중국 특허청에 제출한 출원 번호가 CN201711436470.2이고, 발명의 명칭이 “원격 감지 이미지 인식 방법, 장치, 저장 매체 및 전자 기기”인 중국 특허 출원의 우선권을 요청하며, 그 전부 내용을 인용하여 본 출원에 결합하였다.
본 출원은 컴퓨터 시각 기술에 관한 것으로서, 특히 원격 감지 이미지 인식 방법, 원격 감지 이미지 인식 장치, 컴퓨터 판독 가능한 저장 매체 및 전자 기기에 관한 것이다.
딥 러닝 기술이 이미지 인식, 타겟 검출 및 이미지 분할 등 측면에서 부단히 발전함에 따라, 컨볼루션 신경 네트워크는 이미 원격 감지 이미지 인식 분야에 적용되었다.
원격 감지 이미지 인식 과정에 있어서, 픽셀의 예측 결과는 일반적으로 상기 픽셀 주변의 일정한 영역 내의 다른 픽셀에 의해 결정되고, 상기 영역은 컨볼루션 신경 네트워크 뉴런의 수용야로 지칭될 수 있다.
컨볼루션 신경 네트워크 뉴런의 수용야가 일반적으로 한정적이지만(예를 들어 몇 백 픽셀), 원격 감지 이미지의 사이즈는 일반적으로 비교적 크므로(예를 들어 원격 감지 이미지의 길이 및 너비는 몇 천 심지어 몇 만 픽셀에 달할 수 있음), 뉴런의 한정적인 수용야는 충분한 환경 정보를 획득하지 못할 수 있음으로써, 컨볼루션 신경 네트워크가 원격 감지 이미지에서의 픽셀에 대한 감지에 오류가 쉽게 발생한다.
신경 네트워크의 계산량이 대폭으로 향상되지 않도록 최대한 보장하는 동시에, 원격 감지 이미지의 인식 정확성을 향상시키는 방법은 주목할만한 기술적 과제이다.
본 출원의 실시형태는 원격 감지 이미지 인식의 기술방안을 제공한다.
본 출원의 실시형태 중 한 측면에 따르면, 원격 감지 이미지 인식 방법을 제공하고, 상기 방법은 주로, 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻는 단계; 상기 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하는 단계; 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계; 신경 네트워크를 통해 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하는 단계; 및 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계를 포함한다.
본 출원의 실시형태의 다른 측면에 따르면, 원격 감지 이미지 인식 장치를 제공하고, 상기 장치는, 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻기 위한 해상도 다운 모듈; 상기 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하기 위한 원격 감지 이미지 분할 모듈; 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하기 위한 선택 이미지 블록 모듈; 신경 네트워크를 통해 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하기 위한 분류 처리 모듈; 및 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하기 위한 인식 결과 결정 모듈을 포함한다.
본 출원의 실시형태의 또 하나의 측면에 따르면, 전자 기기를 제공하고, 상기 전자 기기는, 컴퓨터 프로그램을 저장하기 위한 메모리; 및 상기 메모리에 저장된 컴퓨터 프로그램을 실행하기 위한 프로세서를 포함하며, 상기 컴퓨터 프로그램이 실행될 경우, 본 출원의 실시예 중 어느 하나에 따른 방법을 구현한다.
본 출원의 실시형태의 또 하나의 측면에 따르면, 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능한 저장 매체를 제공하고, 상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우, 본 출원의 실시형태 중 어느 하나에 따른 방법을 구현한다.
본 출원의 실시형태의 또 하나의 측면에 따르면, 컴퓨터 프로그램을 제공하고, 상기 컴퓨터 프로그램이 기기에서의 프로세서에 의해 실행될 경우, 본 출원의 실시형태 중 어느 하나에 따른 방법을 구현한다.
본 출원에서 제공한 원격 감지 이미지 인식 방법, 원격 감지 이미지 인식 장치, 전자 기기, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 저장 매체에 기반하여, 본 출원해상도 다운 처리된 원격 감지 이미지로부터 원격 감지 이미지 블록을 선택하여, 신경 네트워크에 입력함으로써, 각 해상도 다운 처리 후, 분할된 모든 원격 감지 이미지 블록을 신경 네트워크에 입력하여, 초래되는 신경 네트워크의 계산량이 비교적 큰 현상을 예방한다.
아래에 첨부된 도면 및 실시형태를 통해, 본 출원의 기술방안을 상세히 설명한다.
본 명세서의 일부를 구성하는 도면은 본 출원의 실시형태를 설명하고, 본 명세서의 원리를 설명과 함께 해석하기 위한 것이다.
도면을 참조하면, 본 출원은 다음의 상세한 설명에 따라, 더욱 명확하게 이해될 수 있다.
도 1은 본 출원의 원격 감지 이미지 인식 방법의 일 실시형태의 흐름 예시도이다.
도 2는 본 출원의 원격 감지 이미지 인식 방법의 다른 실시형태의 흐름 예시도이다.
도 3은 본 출원의 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 원격 감지 이미지 블록을 선택하는 일 실시형태의 흐름 예시도이다.
도 4는 본 출원의 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 유지하는 일 실시형태의 흐름 예시도이다.
도 5는 본 출원의 원격 감지 이미지 인식 장치의 일 실시형태 예시도이다.
도 6은 본 출원의 실시형태를 구현하는 일 예시적 기기의 블록도이다.
도 7은 본 출원의 응용 시나리오 예시도이다.
도면을 참조하면, 본 출원은 다음의 상세한 설명에 따라, 더욱 명확하게 이해될 수 있다.
도 1은 본 출원의 원격 감지 이미지 인식 방법의 일 실시형태의 흐름 예시도이다.
도 2는 본 출원의 원격 감지 이미지 인식 방법의 다른 실시형태의 흐름 예시도이다.
도 3은 본 출원의 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 원격 감지 이미지 블록을 선택하는 일 실시형태의 흐름 예시도이다.
도 4는 본 출원의 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 유지하는 일 실시형태의 흐름 예시도이다.
도 5는 본 출원의 원격 감지 이미지 인식 장치의 일 실시형태 예시도이다.
도 6은 본 출원의 실시형태를 구현하는 일 예시적 기기의 블록도이다.
도 7은 본 출원의 응용 시나리오 예시도이다.
아래에 첨부 도면을 참조하여 본 출원의 다양한 실시예를 상세히 설명한다. 유의해야 할 것은, 달리 구체적으로 언급되지 않는 한, 실시형태에서 반복 설명된 부재, 단계의 상대적인 배치, 수치 표현 및 값은 본 출원의 범위를 한정하려는 것이 아니다.
동시에, 도면에 도시된 각 부분의 크기는 설명의 편의를 위해, 실제 비례 관계에 의해 그려진 것이 아님을 알아야 한다.
적어도 하나의 예시적인 실시형태에 대한 이하의 설명은 실제로 설명적인 것일 뿐이며, 본 출원 및 그 응용 또는 사용을 한정하려는 것이 아니다.
관련 기술분야의 통상의 기술자에게 공지된 기술, 방법 및 기기는 상세하게 논의되지 않을 수 있지만, 적절한 경우, 상기 기술, 방법 및 기기는 명세서의 일부로 간주되어야 한다.
유의해야 할 것은, 유사한 부호 및 문자는 아래의 도면에서 유사한 항목을 표시하므로, 어느 한 항목이 하나의 도면에서 정의되면, 후속 도면에서 추가로 논의될 필요가 없다.
본 출원의 실시형태는 다수의 다른 범용 또는 특수 목적 컴퓨팅 시스템 환경 또는 구성과 함께 동작될 수 있는 단말 기기, 컴퓨터 시스템 및 서버와 같은 전자 기기에 적용될 수 있다. 단말 기기, 컴퓨터 시스템 및 서버와 같은 전자 기기와 함께 사용하기에 적절한 것으로 잘 알려진 컴퓨팅 시스템, 환경 및 구성 중 적어도 하나의 예는, 개인용 컴퓨터 시스템, 서버 컴퓨터 시스템, 씬 클라이언트, 씩 클라이언트, 핸드헬드 또는 랩톱 기기, 마이크로 프로세서 기반 시스템, 셋톱 박스, 프로그래머블 가전 제품, 네트워크 개인용 컴퓨터, 소형 컴퓨터 시스템, 메인 프레임 컴퓨터 시스템 및 상기 임의의 시스템을 포함한 분산 클라우드 컴퓨팅 기술 환경을 포함하지만 이에 한정되지 않는다.
단말 기기, 컴퓨터 시스템, 서버 등 전자 기기는 컴퓨터 시스템에 의해 실행되는 컴퓨터 시스템의 실행 가능한 명령어(예를 들어, 프로그램 모듈)의 일반적인 맥락에서 설명될 수 있다. 일반적으로, 프로그램 모듈은 특정 작업을 실행하거나 특정 추상 데이터 타입을 구현하기 위한 루틴, 프로그램, 타겟 프로그램, 컴포넌트, 논리 및 데이터 구조 등을 포함할 수 있다. 컴퓨터 시스템/서버는, 작업이 통신 네트워크를 통해 연결된 원격 처리 장치에 의해 실행되는 분산 클라우드 컴퓨팅 환경에서 실행될 수있다. 분산 클라우드 컴퓨팅 환경에서, 프로그램 모듈은 저장 기기를 포함하는 로컬 또는 원격 컴퓨팅 시스템 저장 매체에 위치할 수있다.
예시적 실시예
본 출원에서 제공한 원격 감지 이미지 인식을 구현하기 위한 기술방안은 단일 칩 마이크로컴퓨터, 필드 프로그래머블 게이트 어레이(Field Programmable Gate Array, FPGA), 마이크로 프로세서, 스마트 모바일 핸드폰, 노트북 컴퓨터, 태블릿 컴퓨터, 데스크탑 컴퓨터 또는 서버 등 컴퓨터 프로그램(프로그램 코드로도 지칭될 수 있음)을 작동 가능한 전자 기기에 의해 구현될 수 있고, 상기 컴퓨터 프로그램은 플래시 메모리, 캐시, 하드 디스크 또는 광 디스크 등과 같은 컴퓨터 판독 가능한 저장 매체에 저장될 수 있다.
아래에 도 1 내지 도 7을 결합하여 본 출원에서 제공한 원격 감지 이미지 인식을 구현하기 위한 기술방안을 설명한다.
도 1은 본 출원의 원격 감지 이미지 인식 방법의 일 실시형태의 흐름 예시도이다. 도 1에 도시된 바와 같이, 본 실시형태의 원격 감지 이미지 인식 방법은 주로, 단계 S100, 단계 S110, 단계 S120, 단계 S130 및 단계 S140을 포함한다. 아래에 본 출원의 각 단계를 상세하게 설명한다.
단계 S100에 있어서, 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻는다.
선택 가능한 예에 있어서, 본 출원은 여러 가지 방식을 사용하여 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행할 수 있고, 예를 들어, 본 출원에는 축소율 세트가 미리 설정되어 있으며, 상기 축소율 세트는 적어도 두 개의 상이한 축소값을 포함하며, 본 출원은 축소율 세트로부터 사용되지 않은 축소값을 선택할 수 있고, 선택된 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행할 수 있다. 또한, 본 출원은 사용되지 않은 축소값을 선택할 경우, 일반적으로 사용되지 않은 최소 축소값을 먼저 선택한다. 또한, 본 출원은 또한 풀링 처리 또는 다운 샘플링 처리 등 방식을 사용하여 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행할 수 있다. 본 출원은 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하는 구현 방식을 한정하지 않는다.
하나의 선택적인 예에 있어서, 상기 단계 S100은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 해상도 다운 모듈(500)에 의해 실행될 수도 있다.
단계 S110에 있어서, 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할한다.
선택 가능한 예에 있어서, 본 출원은 일반적으로 신경 네트워크가 입력 이미지의 크기에 대한 요구에 따라 해상도 다운 처리 후 획득된 원격 감지 이미지를 복수 개의 원격 감지 이미지 블록으로 분할하고, 분할된 모든 원격 감지 이미지 블록의 크기는 일반적으로 완전히 동일하다. 분할된 각 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 하나의 영역에 각각 대응되고, 상이한 원격 감지 이미지 블록에 대응되는 영역은 상이하다. 원격 감지 이미지 블록에 대응되는 영역의 크기는 일반적으로 축소값 및 신경 네트워크가 입력 이미지의 크기에 대한 요구와 관련되고; 하나의 예로서, 신경 네트워크가 입력 이미지의 크기에 대한 요구가 561×561이고, 해상도 다운 처리가 2분의 1 해상도 다운 처리일 경우, 본 출원에서 분할된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 대한 크기는 1122×1122이며, 예를 들어, 분할된 첫 번째 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 왼쪽 상단의 1122×1122 크기의 영역에 대응되고, 분할된 마지막 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 우측 하단의 1122×1122 크기의 영역에 대응된다. 본 출원은 분할된 원격 감지 이미지 블록의 개수 및 원격 감지 이미지 블록의 크기를 한정하지 않는다.
하나의 선택적인 예에 있어서, 상기 단계 S101은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 원격 감지 이미지 분할 모듈(510)에 의해 실행될 수도 있다.
단계 S120에 있어서, 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정한다.
선택 가능한 예에 있어서, 해상도 다운 처리를 첫 번째로 실행할 경우, 본 출원은 모든 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 사용할 수 있고, 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 본 출원에서 결정된 처리될 원격 감지 이미지 블록의 개수는 일반적으로 현재 분할된 모든 원격 감지 이미지 블록의 개수보다 작다.
선택 가능한 예에 있어서, 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 본 출원은 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 분할된 적어도 하나의 원격 감지 이미지 블록을 선택할 수 있고, 선택된 원격 감지 이미지 블록은 처리될 원격 감지 이미지 블록이다. 하나의 선택 가능한 예에 있어서, 본 출원은 먼저 인식될 원격 감지 이미지 중 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 적어도 하나의 픽셀의 현재 신뢰도를 결정하고, 예를 들어, 인식될 원격 감지 이미지에서의 하나의 픽셀에 대해, 상기 픽셀의 최대 분류 확률값과 다음으로 큰 분류 확률값의 비율값을 계산하고, 계산된 상기 비율값을 상기 픽셀의 현재 신뢰도로 사용하면, 상기 처리에 따라 인식될 원격 감지 이미지에서의 모든 픽셀의 현재 신뢰도를 획득할 수 있다. 다음, 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 픽셀의 현재 신뢰도가 기설정된 신뢰도에 도달한 픽셀 개수를 통계하고, 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하며, 예를 들어, 원격 감지 이미지 블록의 경우, 기설정된 신뢰도에 도달한 픽셀 개수와 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 모든 픽셀의 개수의 비율값이 기설정된 비율값보다 작을 경우, 상기 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정할 수 있다.
선택 가능한 예에 있어서, 본 출원은 아래와 같은 두 가지 방식을 이용하여 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 획득할 수 있다.
방식 1에 있어서, 해상도 다운 처리를 첫 번째로 실행할 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득한다. 본 출원은 현재 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보로 사용할 수 있다.
방식 2에 있어서, 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하고, 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보에 따라 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하며, 예를 들어, 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보와 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보의 평균값을 계산하고, 계산된 평균값을 이용하여 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보를 업데이트한다. 업데이트 처리 후, 본 출원은 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 획득한다.
하나의 선택적인 예에 있어서, 상기 단계 S102는 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 이미지 블록 선택 모듈(520)에 의해 실행될 수도 있다.
단계 S130에 있어서, 신경 네트워크를 통해 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득한다.
선택 가능한 예에 있어서, 본 출원에서의 신경 네트워크는 컨볼루션 신경 네트워크일 수 있고, 본 출원은 신경 네트워크의 표현 형태를 한정하지 않는다. 본 출원은 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하고, 해상도 다운 처리된 원격 감지 이미지에서의 처리될 이미지 블록을 신경 네트워크에 입력하는 것을 통해, 신경 네트워크에서의 뉴런의 수용야를 향상시킴에 있어서 유리함으로써, 신경 네트워크가 원격 감지 이미지의 픽셀을 잘못 인식하는 것을 예방함에 있어서 유리하다.
선택 가능한 예에 있어서, 본 출원에서의 신경 네트워크는 여러 가지 상이한 해상도를 갖는 원격 감지 이미지 샘플을 이용하여 훈련하여 획득된 것이다. 예를 들어, 모든 원격 감지 이미지 샘플의 자체 해상도는, 축소율 세트에서의 각 축소값 각각에 대응되는 해상도에 속한다. 하나의 예로서, 축소율 세트는, 제1 축소값, 제2 축소값 및 제3 축소값을 포함하고, 제1 축소값이 제1 해상도에 대응되며, 제2 축소값이 제2 해상도에 대응되며, 제3 축소값이 제3 해상도에 대응되므로, 본 출원은 제1 해상도를 갖는 원격 감지 이미지 샘플, 제2 해상도를 갖는 원격 감지 이미지 샘플 및 제3 해상도를 갖는 원격 감지 이미지 샘플을 이용하여 훈련될 신경 네트워크를 훈련할 수 있으며, 성공적으로 훈련된 신경 네트워크는 본 출원의 원격 감지 이미지 인식에 사용될 수 있다.
하나의 선택적인 예에 있어서, 상기 단계 S103은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 분류 처리 모듈(530)에 의해 실행될 수도 있다.
단계 S140에 있어서, 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정한다.
선택 가능한 예에 있어서, 본 출원은 축소율 세트에 사용되지 않은 축소값이 존재하지 않거나 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정할 수 없는 것에 응답하여, 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정하는 조작을 실행하고, 예를 들어, 인식될 원격 감지 이미지에서의 하나의 픽셀의 경우, 상기 픽셀의 현재 분류 확률 정보에서의 각 타입에 속하는 확률값에서의 최대 확률값을 결정하여, 상기 최대 확률값 및 상기 최대 확률값에 대응되는 타입을, 상기 픽셀의 인식 결과로 사용한다.
하나의 선택적인 예에 있어서, 상기 단계 S104는 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 인식 결과 결정 모듈(540)에 의해 실행될 수도 있다.
도 2는 본 출원의 원격 감지 이미지 인식 방법의 다른 실시형태의 흐름 예시도이다.
도 2에 도시된 바와 같이, 본 실시형태의 원격 감지 이미지 인식 방법은 주로, 단계 S200, 단계 S210, 단계 S220 및 단계 S230을 포함한다.
단계 S200에 있어서, 축소율 세트 중 사용되지 않은 최소 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행한다.
선택 가능한 예에 있어서, 축소율 세트는 복수 개의 축소값에 의해 형성되고, 각 축소값은 0보다 크고 1보다 작다. 일반적인 경우에 있어서, 축소율 세트는 적어도 두 개의 축소값을 포함하고, 하나의 선택 가능한 예에 있어서, Sr = [0.25, 0.5, 1.0], Sr은 축소율 세트를 나타내며, 여기서 0.25, 0.5 및 1은 축소율 세트에서의 축소값이며, 0.25는 인식될 원격 감지 이미지의 해상도를 원래 해상도의 4 분의 1로 감소시킨 것을 나타내며, 0.5는 인식될 원격 감지 이미지의 해상도를 원래 해상도의 2 분의 1로 감소시킨 것을 나타내며, 1은 인식될 원격 감지 이미지의 해상도를 나타낸다. 본 실시예에서 1을 특정한 축소값으로 사용하고, 예를 들어, 인식될 원격 감지 이미지가 원래 해상도를 유지하도록 하는 축소값으로 간주될 수 있다. 본 출원은 축소율 세트에 포함된 축소값의 크기 및 포함된 축소값의 개수를 한정하지 않는다.
선택 가능한 예에 있어서, 본 출원은 축소값의 오름순에 따라, 매 번 축소율 세트로부터 하나의 축소값을 선택하고, 선택된 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행해야 한다. 선택된 축소값은 사용된 축소값으로 된다.
하나의 선택적인 예에 있어서, 상기 단계 S200은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 해상도 다운 모듈(500)에 의해 실행될 수도 있다.
단계 S210에 있어서, 해상도 다운 처리된 원격 감지 이미지를 적어도 하나의 원격 감지 이미지 블록으로 분할한다.
선택 가능한 예에 있어서, 본 출원은 일반적으로 신경 네트워크가 입력 이미지의 크기에 대한 요구에 따라 해상도 다운 처리 후 획득된 원격 감지 이미지를 복수 개의 원격 감지 이미지 블록으로 분할하고, 분할된 모든 원격 감지 이미지 블록의 크기는 일반적으로 완전히 동일하다. 분할된 각 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 하나의 영역에 각각 대응되고, 상이한 원격 감지 이미지 블록에 대응되는 영역은 상이하다. 원격 감지 이미지 블록에 대응되는 영역의 크기는 일반적으로 축소값 및 신경 네트워크가 입력 이미지의 크기에 대한 요구와 관련되고; 하나의 예로서, 신경 네트워크가 입력 이미지의 크기에 대한 요구가 561×561이고, 해상도 다운 처리가 2분의 1 해상도 다운 처리일 경우, 본 출원에서 분할된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 대한 크기는 1122×1122이며, 예를 들어, 분할된 첫 번째 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 왼쪽 상단의 1122×1122 크기의 영역에 대응되고, 분할된 마지막 원격 감지 이미지 블록은 인식될 원격 감지 이미지에서의 우측 하단의 1122×1122 크기의 영역에 대응된다. 본 출원은 분할된 원격 감지 이미지 블록의 개수 및 원격 감지 이미지 블록의 크기를 한정하지 않는다.
하나의 선택적인 예에 있어서, 상기 단계 S201은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 원격 감지 이미지 분할 모듈(510)에 의해 실행될 수도 있다.
단계 S220에 있어서, 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 적어도 하나의 원격 감지 이미지 블록으로부터 원격 감지 이미지 블록을 선택하고, 신경 네트워크를 통해 선택된 각 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 획득한다. 여기서, 선택된 원격 감지 이미지 블록은 상기 처리될 원격 감지 이미지 블록이다.
선택 가능한 예에 있어서, 해상도 다운 처리를 첫 번째로 실행할 경우, 본 출원은 일반적으로 분할된 모든 원격 감지 이미지 블록을 선택된 원격 감지 이미지 블록으로 사용한다. 본 출원은 해상도 다운 처리를 첫 번째로 실행할 경우, 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도가 0으로 초기화되므로, 분할된 모든 원격 감지 이미지 블록은 선택될 수 있고, 신경 네트워크에 각각 입력됨으로써, 신경 네트워크를 통해 이 번에 분할된 모든 원격 감지 이미지 블록의 모든 픽셀의 분류 확률 정보를 획득할 수 있고, 이번에 획득된 모든 원격 감지 이미지 블록의 모든 픽셀의 분류 확률 정보는 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도를 업데이트하는데 사용될 수 있다. 하나의 선택 가능한 예에 있어서, 본 출원의 신경 네트워크가 C 개의 타입에 대해 분류 처리를 수행할 수 있다고 설정하면, 각 원격 감지 이미지 블록은 각각 신경 네트워크를 통한 후, 본 출원은 모든 원격 감지 이미지 블록에서의 모든 픽셀이 각각 C 개의 타입에 대한 분류 확률 정보를 획득할 수 있다.
선택 가능한 예에 있어서, 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 본 출원은 일반적으로 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라, 이 번에 분할된 모든 원격 감지 이미지 블록으로부터 원격 감지 이미지 블록을 선택한다. 특히 설명해야 할 것은, 이 번에 선택된 원격 감지 이미지 블록은 이 번에 분할된 모든 원격 감지 이미지 블록일 수 있고, 이 번에 분할된 모든 원격 감지 이미지 블록에서의 일부 원격 감지 이미지 블록일 수도 있으며; 물론, 또한 이 번에 분할된 모든 원격 감지 이미지 블록으로부터 어느 하나의 원격 감지 이미지 블록을 선택할 수 없을 가능성이 있다.
본 출원은 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하고, 해상도 다운 처리된 원격 감지 이미지에서의 이미지 블록을 신경 네트워크에 입력하는 것을 통해(예를 들어 컨볼루션 신경 네트워크), 신경 네트워크(예를 들어 컨볼루션 신경 네트워크) 뉴런의 수용야를 향상시킴에있어서 유리함으로써, 신경 네트워크가 원격 감지 이미지의 픽셀을 잘못 인식하는 것을 예방함에 있어서 유리하다.
하나의 선택적인 예에 있어서, 상기 단계 S202는 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 이미지 블록 선택 모듈(520) 및 분류 처리 모듈(530)에 의해 실행될 수도 있다.
본 출원에서 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 원격 감지 이미지 블록(즉 처리될 원격 감지 이미지 블록)을 선택하는 선택 가능한 예는 도 3에 도시된 바와 같다.
도 3에서, 단계 300에 있어서, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 적어도 하나의 픽셀의 현재 신뢰도를 결정한다.
선택 가능한 예에 있어서, 본 출원에서의 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보는, 신경 네트워크가 현재까지 입력된 적어도 하나의 원격 감지 이미지 블록에 의해 출력된 원격 감지 이미지 블록에서의 적어도 하나의 픽셀의 분류 확률 정보에 기반하여 형성된 것이다. 본 출원은 매 번 해상도 다운 처리를 실행하는 과정에서, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 유지(예를 들어 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 업데이트함)해야 한다. 본 출원에서 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 유지하는 방식은 아래의 도 4에 대한 설명을 참조할 수 있다.
선택 가능한 예에 있어서, 인식될 원격 감지 이미지에서의 어느 한 픽셀(i, j)의 경우, 본 출원에서 인식될 원격 감지 이미지의 상기 픽셀(i, j)의 현재 분류 확률 정보에 따라 상기 픽셀(i, j)의 현재 신뢰도를 결정하는 방식은, 신경 네트워크가 원격 감지 이미지로부터 C 개의 타입을 인식할 수 있다고 설정하면, 픽셀(i, j)의 현재 분류 확률 정보에는 C 개의 확률값이 포함되고, 본 출원은 이 C 개의 확률값으로부터, 최대 확률값 및 다음으로 큰 확률값(즉 두 번째로 큰 확률값)을 선택하고, 선택된 최대 분류 확률값과 다음으로 큰 분류 확률값의 비율값을 계산하는 방식이며, 본 출원은 상기 비율값을 상기 픽셀(i, j)의 현재 신뢰도로 사용할 수 있다. 본 출원은 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 다른 방식을 사용하여 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 신뢰도를 결정할 수도 있고, 본 출원은 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 신뢰도를 결정하는 방식을 한정하지 않는다.
하나의 선택적인 예에 있어서, 상기 단계 S300은 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제1 유닛에 의해 실행될 수도 있다.
단계 310에 있어서, 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 적어도 하나의 픽셀의 현재 신뢰도가 기설정된 신뢰도에 도달한 픽셀 개수를 통계한다.
선택 가능한 예에 있어서, 본 출원에서의 기설정된 신뢰도의 크기는 실제 필요에 따라 설정될 수 있고, 예를 들어, 기설정된 신뢰도는 4로 설정될 수 있다. 이전 예를 계속하여, 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 대응되는 크기가 1122×1122인 경우, 하나의 원격 감지 이미지 블록으로 말하면, 본 출원은 1122×1122 개의 픽셀의 현재 신뢰도가 기설정된 신뢰도에 각각 도달하는지 여부를 판단할 수 있음으로써, 기설정된 신뢰도에 도달한 픽셀 개수를 통계할 수 있다.
하나의 선택적인 예에 있어서, 상기 단계 S301은 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제2 유닛에 의해 실행될 수도 있다.
단계 320에 있어서, 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 선택된 원격 감지 이미지 블록으로 사용한다.
선택 가능한 예에 있어서, 어느 하나의 원격 감지 이미지 블록의 경우, 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 기설정된 신뢰도에 도달한 픽셀 개수와 상기 영역에서의 적어도 하나의 픽셀의 개수의 비율값이 기설정된 비율값에 도달하지 못하면, 상기 원격 감지 이미지 블록을 선택된 원격 감지 이미지 블록으로서, 신경 네트워크에 입력할 수 있음으로써, 상기 신경 네트워크를 통해 상기 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 획득하며; 상기 비율값이 기설정된 비율값에 도달하면, 상기 원격 감지 이미지 블록을 신경 네트워크에 입력할 필요가 없다. 본 출원에서의 기설정된 비율값은 실제 필요에 따라 설정될 수 있고, 예를 들어, 상기 기설정된 비율값은 0.97 등으로 설정될 수 있다.
또한, 본 출원은 다른 방식을 사용하여 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 결정할 수도 있고, 예를 들어, 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 기설정된 신뢰도에 도달한 픽셀 개수와 상기 영역 중 기설정된 신뢰도에 도달하지 못한 픽셀 개수의 차이값이 기설정된 차이값에 도달한 것으로 판단한 경우, 상기 원격 감지 이미지 블록을 선택된 원격 감지 이미지 블록으로서, 신경 네트워크에 입력할 수 있고, 그렇지 않은 경우, 상기 원격 감지 이미지 블록을 신경 네트워크에 입력할 필요가 없으며; 또 예를 들어, 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 기설정된 신뢰도에 도달한 픽셀 개수와 상기 영역 중 기설정된 신뢰도에 도달하지 못한 픽셀 개수의 비율값이 기설정된 비율값에 도달하지 못한 것으로 판단한 경우, 상기 원격 감지 이미지 블록을 선택된 원격 감지 이미지 블록으로서, 신경 네트워크에 입력할 수 있고, 그렇지 않은 경우, 상기 원격 감지 이미지 블록을 신경 네트워크에 입력할 필요가 없다. 본 출원은 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 결정하는 구현 방식을 한정하지 않는다.
하나의 선택적인 예에 있어서, 상기 단계 S302는 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제3 유닛에 의해 실행될 수도 있다.
본 출원에서 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 유지하는 예는 도 4에 도시된 바와 같다.
도 4에서, 단계 S400에 있어서, 본 출원의 원격 감지 이미지 인식 방법이 시작된다. 선택적으로, 본 출원은 원격 감지 이미지 인식 방법이 시작될 경우, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 초기화할 수 있고, 예를 들어 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 0으로 설정한다. 물론, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보에 대해 초기화 조작을 수행하지 않는 것도, 완전히 가능하다.
본 출원이 해상도 다운 처리를 첫 번째로 실행할 경우, 단계 S410의 실행을 트리거한다.
본 출원이 해상도 다운 처리를 두 번째 또는 세 번째로 실행하는 것 등 첫 번째로 실행하는 것이 아닐 경우, 단계 S440의 실행을 트리거한다.
단계 S410에 있어서, 이 번에 해상도 다운 처리된 원격 감지 이미지에 의해 분할된 모든 원격 감지 이미지 블록을 신경 네트워크에 입력함으로써, 신경 네트워크는 분할된 모든 원격 감지 이미지에 대해 각 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 각각 출력한다. 단계 S420으로 진입한다.
단계 S420에 있어서, 신경 네트워크에 의해 출력된 각 원격 감지 이미지 블록에서의 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 각각 맵핑함으로써, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득한다. 단계 S430으로 진입한다.
선택 가능한 예에 있어서, 본 출원이 해상도 다운 처리를 첫 번째로 실행할 경우, 신경 네트워크에 의해 출력된 각 원격 감지 이미지 블록에서의 모든 픽셀의 분류 확률 정보에 기반하여, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 분류 확률 정보()를 획득하는 것은, 으로 나타낼 수 있고;
여기서, 에서의 윗첨자 1은 해상도 다운 처리를 첫 번째로 실행하는 것을 나타내고, C는 신경 네트워크가 분류한 타입 개수를 나타내며, 은 해상도 다운 처리를 첫 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제1 타입에 속하는 분류 확률 정보를 나타내며, 은 해상도 다운 처리를 첫 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제2 타입에 속하는 분류 확률 정보를 나타내며, 은 해상도 다운 처리를 첫 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제C 타입에 속하는 분류 확률 정보를 나타낸다.
S430, 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보로 사용하고, 예를 들어, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 현재 분류 확률 정보는, 이다.
하나의 선택적인 예에 있어서, 상기 단계 S420 및 S430은 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제4 유닛에 의해 실행될 수도 있다.
단계 S440에 있어서, 이 번에 해상도 다운 처리된 원격 감지 이미지에 의해 분할된 모든 원격 감지 이미지 블록으로부터 원격 감지 이미지 블록을 선택하여, 선택된 원격 감지 이미지 블록을 신경 네트워크에 입력한다. 단계 S450으로 진입한다.
본 출원에서 원격 감지 이미지 블록을 선택하는 과정의 하나의 예는 상기 도 3에 대한 설명을 참조할 수 있고, 여기서 더이상 반복하여 설명하지 않는다.
단계 S450에 있어서, 신경 네트워크에 의해 출력된 각 원격 감지 이미지 블록에서의 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 각각 맵핑함으로써, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득한다. 단계 S460으로 진입한다.
선택 가능한 예에 있어서, 본 출원에서 해상도 다운 처리를 n 번째(n은 1보다 큼)로 실행할 경우, 신경 네트워크에 의해 출력된 각 원격 감지 이미지 블록에서의 모든 픽셀의 분류 확률 정보에 기반하여, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 분류 확률 정보()를 획득하는 것은, 으로 나타낼 수 있고;
여기서, 에서의 윗첨자 n은 해상도 다운 처리를 n 번째로 실행하는 것을 나타내고, C는 신경 네트워크가 분류한 타입 개수를 나타내며, 은 해상도 다운 처리를 n 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제1 타입에 속하는 분류 확률 정보를 나타내며, 은 해상도 다운 처리를 n 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제2 타입에 속하는 분류 확률 정보를 나타내며, 은 해상도 다운 처리를 n 번째로 실행할 경우, 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)이 제C 타입에 속하는 분류 확률 정보를 나타낸다. 특히 설명해야 할 것은, 인식될 원격 감지 이미지에서의 픽셀(i, j)이 이번에 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하면, 은 신경 네트워크에 의해 출력된 상응하는 픽셀의 분류 확률 정보이고, 픽셀(i, j)이 이번에 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하지 않으면, 본 출원은 을 0으로 설정할 수 있다.
하나의 선택적인 예에 있어서, 상기 단계 S450은 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제5 유닛에 의해 실행될 수도 있다.
단계 S460에 있어서, 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 이용하여 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트한다.
선택 가능한 예에 있어서, 해상도 다운 처리를 두 번째 또는 세 번째로 실행하는 등과 같이 첫 번째로 실행하는 것이 아닐 경우, 본 출원은 현재까지 각각 획득된 각 처리될 원격 감지 이미지 블록 중 모든 픽셀의 분류 확률 정보를 통해 인식될 원격 감지 이미지의 모든 픽셀의 현재 분류 확률 정보를 획득한다.
해상도 다운 처리를 첫 번째로 실행하는 것으로 설정할 경우, 본 출원에서 획득된 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 분류 확률 정보는 임으로써, 본 출원은 을 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 현재 분류 확률 정보()로 기록하며;
해상도 다운 처리를 두 번째로 실행할 경우, 본 출원에서 신경 네트워크에 기반하여 획득된 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 분류 확률 정보는 으로 나타낼 수 있고, 여기서, 인식될 원격 감지 이미지에서의 픽셀(i, j)이 두 번째 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하면, 은 신경 네트워크에 의해 출력된 상응하는 픽셀의 분류 확률 정보이고, 인식될 원격 감지 이미지에서의 픽셀(i, j)이 두 번째 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하지 않으면, 은 0이며; 본 출원은 0이 아닌 에 대해, 및 의 평균값을 계산하고, 계산된 평균값을 이용하여 인식될 원격 감지 이미지에서의 상응하는 픽셀(i, j)의 현재 분류 확률 정보()를 업데이트할 수 있다.
해상도 다운 처리를 세 번째로 실행할 경우, 본 출원에서 신경 네트워크에 기반하여 획득된 인식될 원격 감지 이미지 중 어느 하나의 픽셀(i, j)의 분류 확률 정보는 으로 나타낼 수 있고, 여기서, 인식될 원격 감지 이미지에서의 픽셀(i, j)이 세 번째 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하면, 은 신경 네트워크에 의해 출력된 상응하는 픽셀의 분류 확률 정보이고, 인식될 원격 감지 이미지에서의 픽셀(i, j)이 세 번째 해상도 다운 처리 과정에서 선택된 원격 감지 이미지 블록이 인식될 원격 감지 이미지에서의 영역에 맵핑된 픽셀에 속하지 않으면, 은 0이며; 본 출원은 0이 아닌 에 대해, 및의 평균값을 계산하고, 계산된 평균값을 이용하여 인식될 원격 감지 이미지에서의 상응하는 픽셀(i, j)의 현재 분류 확률 정보()를 업데이트할 수 있다.
이와 같은 방식으로, 상기 해상도 다운 처리를 두 번째 및 세 번째로 실행할 경우, 실행된 인식될 원격 감지 이미지의 모든 픽셀의 현재 분류 확률 정보를 업데이트하는 과정에 따르면, 해상도 다운 처리를 4 번째 또는 5 번째로 실행하는 등 첫 번째로 실행하는 것이 아닐(n 번째) 경우, 실행된 인식될 원격 감지 이미지의 모든 픽셀의 현재 분류 확률 정보를 업데이트하는 과정이 현재까지의 분류 확률 정보를 융합하는 것임을 알 수 있고, 예를 들어, 을 융합하여, 업데이트된 인식될 원격 감지 이미지의 모든 픽셀의 현재 분류 확률 정보를 형성한다. 그러나, 본 출원에서 신경 네트워크에 입력해야 하는 원격 감지 이미지 블록을 선택할 경우, 의거하는 인식될 원격 감지 이미지의 모든 픽셀의 현재 분류 확률 정보는 현재까지의 분류 확률 정보를 융합한 결과이고, 예를 들어, , 을 융합한 결과이다.
하나의 선택적인 예에 있어서, 상기 단계 S460은 메모리에 저장된 상응하는 명령어를 호출하는 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 제6 유닛에 의해 실행될 수도 있다.
단계 S230에 있어서, 축소율 세트에 사용되었던 최소 축소값이 존재하지 않거나 적어도 하나의 원격 감지 이미지 블록으로부터 원격 감지 이미지 블록을 선택하지 못할 경우, 각 선택된 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보에 기반하여 형성된 인식될 원격 감지 이미지 중 적어도 하나의 픽셀의 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정하고, 그렇지 않은 경우, 상기 단계 S200으로 돌아간다.
선택 가능한 예에 있어서, 축소율 세트에 사용되지 않은 최소 축소값이 존재하지 않을 경우, 본 출원은 인식될 원격 감지 이미지 중 모든 픽셀의 현재 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정할 수 있고, 즉 본 출원은 및 을 융합한 후, 을 획득하고, 에서의 최대 확률값을 인식될 원격 감지 이미지 중 픽셀(i, j)의 인식 결과로 사용한다.
선택 가능한 예에 있어서, 적어도 하나의 원격 감지 이미지 블록으로부터 원격 감지 이미지 블록을 선택하지 못할 경우, 본 출원은 인식될 원격 감지 이미지 중 모든 픽셀의 현재 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정할 수 있고, 즉 본 출원은 및을 융합한 후, 을 획득하고, 에서의 최대 확률값을 인식될 원격 감지 이미지 중 픽셀(i, j)의 인식 결과로 사용한다.
하나의 선택적인 예에 있어서, 상기 단계 S230은 메모리에 저장된 상응하는 명령어를 호출하여 프로세서에 의해 실행될 수 있거나, 프로세서에 의해 작동되는 인식 결과 결정 모듈(540)에 의해 실행될 수도 있다.
선택 가능한 예에 있어서, 본 출원이 신경 네트워크를 훈련할 경우, 사용하는 원격 감지 이미지 샘플은 일반적으로 여러 가지 해상도를 포함하는 원격 감지 이미지 샘플이고, 상이한 해상도의 개수는 일반적으로 축소율 세트에서의 축소값의 개수와 관련되며, 예를 들어, 축소율 세트가 세 가지 축소값을 포함하는 경우, 샘플 데이터 세트에는 적어도 이 세 가지 축소값에 대응되는 해상도의 원격 감지 이미지 샘플이 포함되어야 하며, 각 원격 감지 이미지 샘플은 태깅 정보(예를 들어 마스크 태깅 정보 등)를 갖는다. 일반적인 경우, 샘플 데이터 세트에서, 상이한 해상도의 원격 감지 이미지 샘플의 개수는 대체적으로 동일하다. 본 출원에서 샘플 데이터 세트에서의 상이한 해상도를 갖는 원격 감지 이미지 샘플을 이용하여 신경 네트워크를 훈련하는 것을 통해, 신경 네트워크가 입력된 처리될 원격 감지 이미지 블록에 대한 분류 확률 정보를 출력하는 정확도를 향상시킴에 있어서 유리하므로, 신경 네트워크가 원격 감지 이미지 인식에 대한 정확률을 향상시킴에 있어서 유리하다.
원격 감지 이미지는 일반적으로 종래 의미에서의 사진 또는 이미지 또는 비디오 프레임 등 이미지와 상이하고, 원격 감지 이미지의 사이즈는 일반적으로 비교적 크며, 예를 들어 원격 감지 이미지의 길이 및 너비는 몇 천 심지어 몇 만 픽셀에 도달할 수 있으며, 신경 네트워크를 직접 이용하여 인식될 원격 감지 이미지에 대해 인식 처리를 하면, 일 측면으로, 뉴런의 한정적인 수용야로 인해 인식 결과의 신뢰성에 악영향을 줄 수 있고, 다른 일 측면으로, 신경 네트워크의 계산 비용 및 시간 비용이 비교적 높을 수 있다. 본 출원은 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하고, 신경 네트워크를 통해 해상도 다운 처리된 원격 감지 이미지를 처리하도록 하므로, 신경 네트워크의 계산 비용 및 시간 비용을 절약함에 있어서 유리하다. 본 출원에서 해상도 다운 처리된 원격 감지 이미지로부터 원격 감지 이미지 블록을 선택하여, 신경 네트워크에 입력함으로써, 신경 네트워크가 해상도 다운 처리된 원격 감지 이미지에서의 상응하는 일부 영역에 대해 인식 처리를 수행하는 계산량을 감소함에 있어서 유리하다. 본 출원이 해상도 다운 처리 과정에서, 인식될 원격 감지 이미지에서의 픽셀의 현재 신뢰도에 따라 원격 감지 이미지 블록을 선택하므로, 인식될 원격 감지 이미지에서의 일부 용이하게 인식 가능한 이미지 영역의 경우, 신경 네트워크가 이를 인식하는 정확도가 높으므로, 매 번 해상도 다운 처리 후, 신경 네트워크가 이러한 이미지 영역에 대해 반복적인 분류 처리를 수행하도록 하므로, 상기 이미지 영역의 최종 분류 결과의 정확도에 대한 기여가 뚜렷하지 않지만; 인식될 원격 감지 이미지에서의 일부 용이하게 인식하지 못하는 복잡한 이미지 영역의 경우, 신경 네트워크가 이러한 이미지 영역에 대해 반복적인 분류 처리를 수행하도록 하므로, 상기 이미지 영역의 최종 분류 결과의 정확도에 대한 기여가 비교적 뚜렷하다. 또한, 여러 번의 해상도 다운 과정에서, 이전 해상도 다운 처리된 원격 감지 이미지의 해상도가 이후 해상도 다운 처리된 원격 감지 이미지의 해상도보다 작도록 하여, 이전 해상도 다운 처리된 이미지 블록의 인식 결과의 정확도가 요구를 만족하면, 본 출원은 이후 해상도 다운 처리된 상응하는 영역에서의 이미지 블록에 대해 인식 처리를 수행하지 않을 수 있음으로써, 신경 네트워크의 계산량 및 처리 시간을 비교적 많이 감소시킬 수 있다. 이로부터 알 수 있다시피, 본 출원에서 제공한 기술방안은 원격 감지 이미지 인식 정확률을 보장함에 있어서 유리한 전제하에, 신경 네트워크의 시간 비용 및 계산 비용을 감소시키고, 신경 네트워크의 원격 감지 이미지 인식 효율을 향상시킨다.
실제 테스트 과정에 있어서, 209 장의 Gaofen-1(GF-1) 위성의 팬크로매틱 멀티 스펙트럼 스캐너(Panchromatic and Multispectral Scanners, PMS)의 원격 감지 이미지 검증 세트에서, 본 출원의 기술방안을 사용하여, 축소율 세트에서의 축소값이 0.5 및 1.0일 경우, 종래 기술에서의 원격 감지 이미지 인식에 비해, 계산량이 약 35% 감소될 수 있는 반면, 인식 정밀도는 약간의 상승세를 보이며, 예를 들어, mIoU는 0.8366로부터 0.8383으로 향상된다.
본 출원의 실시예에서 제공한 어느 하나의 원격 감지 이미지 인식 방법은 임의의 데이터 처리 능력을 갖는 적절한 기기에 의해 실행될 수 있고, 단말 기기 및 서버 등을 포함하지만 이에 한정되지 않는다. 또는, 본 출원의 실시예에서 제공한 어느 하나의 원격 감지 이미지 인식 방법은, 프로세서가 메모리에 저장된 상응하는 명령어를 호출하여 본 출원의 실시예에서 언급한 어느 하나의 원격 감지 이미지 인식 방법을 실행하는 바와 같이 프로세서에 의해 실행될 수 있다. 아래에서 더이상 반복하여 설명하지 않는다.
본 기술분야의 통상의 기술자는 상기 방법의 실시예를 구현하기 위한 전부 또는 일부 단계가 프로그램 명령어에 관련된 하드웨어를 통해 완료되며, 전술한 프로그램이 컴퓨터 판독 가능한 저장 매체에 저장될 수 있으며, 상기 프로그램이 실행될 경우, 상기 방법의 실시예를 포함하는 단계를 실행하며; 전술한 저장 매체는 판독 전용 메모리(Read Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 자기 디스크 또는 광 디스크와 같은 프로그램 코드를 저장할 수 있는 적어도 하나의 매체를 포함하는 것을 이해할 수 있을 것이다.
도 5는 본 출원의 원격 감지 이미지 인식 장치의 일 실시예의 구조 예시도이다. 도 5에 도시된 바와 같이, 상기 실시예의 장치는 주로, 해상도 다운 모듈(500), 원격 감지 이미지 분할 모듈(510), 이미지 블록 선택 모듈(520), 분류 처리 모듈(530) 및 인식 결과 결정 모듈(540)을 포함한다. 선택적으로, 상기 장치는 또한 훈련 모듈(550)을 포함할 수 있다.
해상도 다운 모듈(500)은 주로, 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻기 위한 것이다. 예를 들어, 해상도 다운 모듈(500)은 축소율 세트 중 사용되지 않은 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하는데 사용될 수 있다. 상기 축소율 세트는, 적어도 두 개의 상이한 축소값을 포함하고, 비교적 작은 축소값은 비교적 큰 축소값보다 우선 순위를 갖지만, 해상도 다운 모듈(500)에 의해 사용된다. 해상도 다운 모듈(500)에 의해 실행되는 조작은 상기 도 1에서의 단계 S100 및 도 2에서의 단계 S200의 설명을 참조할 수 있고, 여기서 더이상 반복하여 설명하지 않는다.
원격 감지 이미지 분할 모듈(510)은 주로 해상도 다운 모듈(500)에 의해 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하기 위한 것이다. 원격 감지 이미지 분할 모듈(510)에 의해 실행되는 조작은 상기 도 1에서의 단계 S110 및 도 2에서의 단계 S210의 설명을 참조할 수 있고, 여기서 더이상 반복하여 설명하지 않는다.
이미지 블록 선택 모듈(520)은 주로 원격 감지 이미지 분할 모듈(510)에 의해 분할된 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하기 위한 것이다. 선택적으로, 본 출원의 장치가 해상도 다운 처리를 첫 번째로 실행할 경우, 이미지 블록 선택 모듈(520)은 원격 감지 이미지 분할 모듈(510)에 의해 분할된 모든 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 사용할 수 있다. 본 출원의 장치가 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 이미지 블록 선택 모듈(520)에 의해 선택된 처리될 원격 감지 이미지 블록의 개수는 원격 감지 이미지 분할 모듈에 의해 현재 분할된 원격 감지 이미지 블록의 개수보다 작거나 같다. 예를 들어, 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 이미지 블록 선택 모듈(520)은 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 원격 감지 이미지 분할 모듈(510)에 의해 분할된 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 선택할 수 있다.
선택 가능한 예에 있어서, 이미지 블록 선택 모듈(520)은 제1 유닛, 제2 유닛 및 제3 유닛을 포함할 수 있다. 여기서 제1 유닛은 주로 인식될 원격 감지 이미지에 포함된 복수 개의 픽셀 중 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 적어도 하나의 픽셀의 현재 신뢰도를 결정하기 위한 것이고; 제2 유닛은 주로 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 적어도 하나의 픽셀의 현재 신뢰도가 기설정된 신뢰도에 도달한 픽셀 개수를 통계하기 위한 것이며; 제3 유닛은 주로 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하기 위한 것이다. 원격 감지 이미지 블록의 경우, 기설정된 신뢰도에 도달한 픽셀 개수와 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 적어도 하나의 픽셀의 개수의 비율값이 기설정된 비율값보다 작을 경우, 제3 유닛은 상기 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정한다. 제1 유닛에 의해 실행된 조작은 상기 도 3에서의 단계 S300에 대한 설명을 참조할 수 있고, 제2 유닛에 의해 실행된 조작은 상기 도 3에서의 단계 S310에 대한 설명을 참조할 수 있으며, 제3 유닛에 의해 실행된 조작은 상기 도 3에서의 단계 S320에 대한 설명을 참조할 수 있으며, 여기서 더이상 반복하여 설명하지 않는다.
선택 가능한 예에 있어서, 이미지 블록 선택 모듈(520)은 또한 제4 유닛, 제5 유닛 및 제6 유닛을 포함할 수 있다. 제4 유닛은 주로 해상도 다운 처리를 첫 번째로 실행할 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하기 위한 것이다. 여기서 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보는 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보로 사용된다. 제5 유닛은 주로 해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하기 위한 것이다. 제6 유닛은 주로 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하기 위한 것이다. 예를 들어, 제6 유닛은 이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보와 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보의 평균값을 계산하고, 계산된 평균값을 이용하여 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하기 위한 것이다. 제4 유닛에 의해 실행된 조작은 상기 도 4에서의 단계 S420 및 단계 S430에 대한 설명을 참조할 수 있고, 제5 유닛에 의해 실행된 조작은 상기 도 4에서의 단계 S450에 대한 설명을 참조할 수 있으며, 제6 유닛에 의해 실행된 조작은 상기 도 3에서의 단계 S460에 대한 설명을 참조할 수 있으며, 여기서 더이상 반복하여 설명하지 않는다.
분류 처리 모듈(530)은 주로 신경 네트워크를 통해 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하기 위한 것이다. 분류 처리 모듈(530)에 의해 실행되는 조작은 상기 도 1에서의 단계 S130 및 도 2에서의 단계 S220의 연관 설명을 참조할 수 있고, 여기서 더이상 반복하여 설명하지 않는다.
인식 결과 결정 모듈(540)은 주로 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 인식될 원격 감지 이미지의 인식 결과를 결정하기 위한 것이다. 예를 들어, 인식 결과 결정 모듈(540)은 축소율 세트에 사용되지 않은 축소값이 존재하지 않거나 원격 감지 이미지 분할 모듈(510)에 의해 분할된 원격 감지 이미지 블록에 처리될 원격 감지 이미지 블록이 존재하지 않는 것으로 결정한 것에 응답하여, 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정할 수 있다. 예를 들어, 인식될 원격 감지 이미지에서의 하나의 픽셀의 경우, 인식 결과 결정 모듈(540)은 상기 픽셀의 현재 분류 확률 정보에서의 각 타입에 속하는 확률값에서의 최대 확률값을 결정하여, 상기 최대 확률값 및 상기 최대 확률값에 대응되는 타입을, 상기 픽셀의 인식 결과로 사용한다. 인식 결과 결정 모듈(540)에 의해 실행되는 조작은 상기 도 1에서의 단계 S140 및 도 2에서의 단계 S230의 연관 설명을 참조할 수 있고, 여기서 더이상 반복하여 설명하지 않는다.
훈련 모듈(550)은 주로 원격 감지 이미지 샘플을 이용하여 신경 네트워크를 훈련하기 위한 것이다. 여기서 원격 감지 이미지 샘플의 해상도는 축소율 세트에서의 각 축소값에 따라 각각 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 획득된 각 원격 감지 이미지의 해상도를 포함한다. 예를 들어, 축소율 세트는, 제1 축소값, 제2 축소값 및 제3 축소값을 포함하고, 제1 축소값이 제1 해상도에 대응되며, 제2 축소값이 제2 해상도에 대응되며, 제3 축소값이 제3 해상도에 대응되므로, 훈련 모듈(550)은 제1 해상도를 갖는 원격 감지 이미지 샘플, 제2 해상도를 갖는 원격 감지 이미지 샘플 및 제3 해상도를 갖는 원격 감지 이미지 샘플을 이용하여 훈련될 신경 네트워크를 훈련할 수 있으며, 성공적으로 훈련된 신경 네트워크는 본 출원의 원격 감지 이미지 인식에 사용될 수 있다.
예시적 기기
도 6은 본 출원을 구현하기에 적합한 예시적 기기(600)를 도시하고, 기기(600)는 자동차에 구성된 제어 시스템/전자 시스템, 모바일 단말(예를 들어, 스마트 모바일 핸드폰 등), 개인용 컴퓨터(PC, 예를 들어, 데스크 탑 컴퓨터 또는 노트북 컴퓨터 등), 태블릿 컴퓨터 및 서버 등일 수 있다. 도 6에서, 기기(600)는 하나 또는 복수 개의 프로세서, 통신부 등을 포함하고, 상기 하나 또는 복수 개의 프로세서는 하나 또는 복수 개의 중앙처리장치(CPU)(601) 및 하나 또는 복수 개의 신경 네트워크를 이용하여 원격 감지 이미지 인식을 수행하는 가속 유닛(613) 등일 수 있으며, 가속 유닛(613)은 GPU, FPGA, 다른 타입의 전용 프로세서 등을 포함할 수 있지만 이에 한정되지 않으며, 프로세서는 판독 전용 메모리(ROM)(802)에 저장된 실행 가능 명령어 또는 저장부(808)로부터 랜덤 액세스 메모리(RAM)(803)에 로딩된 실행 가능 명령어에 따라 다양한 적절한 동작 및 처리를 실행할 수 있다. 통신부(612)는 인피니밴드(Infiniband, IB) 네트워크 카드를 포함할 수 있지만 이에 한정되지 않는다. 프로세서는 실행 가능한 명령어를 실행하기 위해, 판독 전용 메모리(602) 및 랜덤 액세스 메모리(603)와 통신할 수 있으며, 버스(604)를 통해 통신부(612)에 연결되고, 통신부(612)를 거쳐 다른 타겟 기기와 통신함으로써, 본 출원에서의 상응하는 조작을 한다.
상기 각 명령어에 의해 실행되는 조작은 상기 방법 실시예에서의 연관 설명을 참조할 수 있고, 여기서 더이상 상세하게 설명하지 않는다.
또한, RAM(603)에는 또한 장치의 조작에 필요한 다양한 프로그램 및 데이터가 저장될 수 있다. CPU(601) 또는 가속 유닛(613), ROM(602) 및 RAM(603)은 통신 버스(604)를 통해 서로 연결된다. RAM(603)이 존재하는 경우, ROM(602)은 선택 가능한 모듈이다. RAM(603)은 실행 가능한 명령어를 저장하고, 또는 작동될 경우, ROM(602)에 실행 가능한 명령어를 기록하며, 실행 가능한 명령어는 프로세서로 하여금 상기 원격 감지 이미지 인식 방법에 대응되는 조작을 수행하도록 한다. 입력/출력(I/O) 인터페이스(605)도 버스(604)에 연결된다. 통신부(612)는 통합될 수 있거나, 각각 버스에 연결되고 복수 개의 서브 모듈(예를 들어 복수 개의 IB 랜 카드)을 갖도록 구성될 수 있다.
다음의 부재, 즉 키보드, 마우스 등을 포함하는 입력 부분(606); 음극 선관(CRT), 액정 디스플레이(LCD), 스피커 등을 포함하는 출력 부분(607); 하드웨어 등을 포함하는 저장 부분(608); 및 LAN 카드, 모뎀 등을 포함하는 네트워크 인터페이스의 통신 인터페이스(609)는 I/O 인터페이스(605)에 연결된다. 통신 부분(609)은 인터넷과 같은 네트워크를 통해 통신 처리를 실행한다. 드라이버(610)는 필요에 따라 I/O 인터페이스(605)에 연결될 수도 있다. 자기 디스크, 광 디스크, 광 자기 디스크, 반도체 메모리 등과 같은 탈착 가능한 매체(611)는 필요에 따라 저장 부분(608)에 설치된 컴퓨터 프로그램을 판독할 수 있도록 필요에 따라 드라이버(610)에 설치된다.
특히 설명해야 할 것은, 도 6에 도시된 아키텍쳐는 다만 선택적인 구현 방식일 뿐, 구체적인 실천 과정에서, 상기 도 6의 구성 요소의 개수 및 유형은 실제 필요에 따라 선택, 감소, 증가 또는 교체되며; 상이한 기능적 구성 요소 설치에서 분리 설치 또는 통합 설치 등 구현 방식을 사용할 수 있으며, 예를 들어 가속 유닛(613) 및 CPU(601)는 분리 설치될 수 있고, 또한 예를 들어, 가속 유닛(613)을 CPU(601)에 통합할 수 있으며, 통신부(612)는 분리 설치될 수 있거나, CPU(601) 또는 가속 유닛(613)에 통합 설치될 수도 있는 것 등이다. 이러한 대안적인 실시 형태는 모두 본 출원의 보호 범위 내에 속한다.
특히, 본 출원의 실시형태에 따르면, 아래에서 흐름도를 참조하여 설명된 과정은 컴퓨터 소프트웨어 프로그램으로 구현될 수 있고, 예를 들어, 본 출원의 실시형태는 기계 판독 가능 매체에 유형적으로 포함된 컴퓨터 프로그램을 포함하는 컴퓨터 프로그램 제품을 포함하며, 컴퓨터 프로그램은 흐름도에 도시된 조작을 실행하기 위한 프로그램 코드를 포함하며, 프로그램 코드는 본 출원에서 제공하는 조작을 대응하게 실행하는 명령어를 포함할 수 있다.
이러한 실시 형태에 있어서, 상기 컴퓨터 프로그램은 통신부(609)를 통해 네트워크로부터 다운로드 및 설치될 수 있는 것 및 제거 가능한 매체(611)로부터 설치될 수 있는 것 중 적어도 하나이다. 상기 컴퓨터 프로그램이 중앙처리장치(CPU)(601)에 의해 실행될 경우, 본 출원에서 기록된 상기 명령어를 실행한다.
하나 또는 복수 개의 선택 가능한 실시형태에 있어서, 본 발명의 실시예는 또한 컴퓨터 판독 가능한 명령어를 저장하기 위한 컴퓨터 프로그램 제품을 제공하고, 상기 명령어가 실행될 경우 컴퓨터로 하여금 상기 임의의 실시예에 따른 원격 감지 이미지 인식 방법을 실행하도록 한다.
상기 컴퓨터 프로그램 제품은 구체적으로 하드웨어, 소프트웨어 또는 이들의 조합을 통해 구현될 수 있다. 선택 가능한 예에 있어서, 상기 컴퓨터 프로그램 제품은 컴퓨터 저장 매체로서 구체적으로 구현되며, 다른 선택 가능한 예에 있어서, 상기 컴퓨터 프로그램 제품은 소프트웨어 개발 키트(Software Development Kit, SDK) 등과 같은 소프트웨어 제품으로서 구체적으로 구현된다.
하나 또는 복수 개의 선택적인 실시 형태에 있어서, 본 발명의 실시예는 또한 원격 감지 이미지 인식 방법 및 이에 대응되는 장치, 전자 기기, 컴퓨터 저장 매체, 컴퓨터 프로그램 및 컴퓨터 프로그램 제품을 더 제공하며, 여기서, 상기 방법은 제1 장치가 원격 감지 이미지 인식 지시를 제2 장치에 송신하는 단계 - 상기 지시는 제2 장치로 하여금 상기 가능한 실시예 중 어느 한 원격 감지 이미지 인식 방법을 수행하도록 함 - ; 및 제1 장치가 제2 장치에 의해 송신된 원격 감지 이미지 인식 결과를 수신하는 단계를 포함한다.
일부 실시예에 있어서, 상기 원격 감지 이미지 인식 지시는 호출 명령어일 수 있으며, 제1 장치는 호출을 통해 제2 장치로 하여금 원격 감지 이미지 인식을 수행하도록 지시할 수 있으며, 따라서, 호출 명령어를 수신하는 것에 응답하여, 제2 장치는 상기 원격 감지 이미지 인식 방법의 실시예 중 어느 한 단계 및 프로세스 중 적어도 하나를 수행하도록 한다.
이해해야 할 것은, 본 발명의 실시예에서 "제1", "제2" 등 용어들은 다만 구별을 위해 사용되며, 본 발명의 실시예들에 대한 한정으로서 이해되지 않아야 한다.
더 이해해야 할 것은, 본 발명에서, "복수 개의"는 두 개 이상을 의미할 수 있고, "적어도 하나"는 하나 또는 두 개 이상을 의미할 수 있다.
더 이해해야 할 것은, 본 발명에서 언급된 임의의 부재, 데이터 또는 구조에 대해 문맥상 명백한 한정이 없거나 반대 동기가 없는 경우, 일반적으로 하나 또는 복수 개로 이해될 수 있다.
더 이해해야 할 것은, 본 발명은 적어도 하나의 실시예에 대해 적어도 하나의 실시예 사이의 차이점에 초점을 맞추고, 그 동일하거나 유사한 부분은 서로 참조할 수 있으며, 간결함을 위해, 더이상 반복하여 설명하지 않는다.
본 출원의 방법, 장치 및 전자 기기 및 컴퓨터 판독 가능한 저장 매체는 많은 방식으로 구현된다. 예를 들어, 본 출원의 방법, 장치 및 전자 기기 및 컴퓨터 판독 가능한 저장 매체는 소프트웨어, 하드웨어, 펌웨어 또는 소프트웨어, 하드웨어, 펌웨어의 임의의 조합으로 구현될 수 있다. 달리 구체적으로 언급되지 않는 한, 방법을 위한 상기 단계의 상기 순서는 다만 구체적인 설명을 위한 것이며, 본 출원의 실시 형태의 방법의 단계를 한정하려는 것은 아니다. 또한, 일부 실시형태에 있어서, 본 출원은 또한 기록 매체에 기록된 프로그램으로 구현될 수 있으며, 이러한 프로그램은 본 출원에 따른 방법을 구현하기 위한 기계 판독 가능한 명령어를 포함한다. 따라서, 본 출원은 본 출원에 따른 방법들을 실행하기 위한 프로그램을 저장하는 기록 매체를 더 포함한다.
본 출원의 설명은 예시 및 설명의 목적으로 제공되며, 누락되지 않거나 본 출원을 개시된 형태로 한정하려는 것은 아니다. 많은 수정과 변경은 본 기술분야의 통상의 기술자에게 자명한 것이다. 실시형태를 선택하고 설명한 것은 본 출원의 원리 및 실제 응용을 더 잘 설명하기 위해서이고, 본 기술분야의 통상의 기술자로 하여금 본 출원을 이해하여, 특정 사용에 적용 가능한 다양한 변경들을 갖는 다양한 실시예들을 설계할 수 있도록 한다.
예시적 응용 시나리오
도 7을 참조하면, 본 출원의 실시 형태에 따라 구현될 수 있는 응용 시나리오를 예시적으로 도시한다.
도 7에서, 신경 네트워크(700)는 인식될 원격 감지 이미지를 인식(예를 들어 스노우 마스크 또는 스노우 워터 마스크 등을 형성함)하기 위한 신경 네트워크이다. 신경 네트워크(700)를 훈련하기 위한 샘플 데이터 세트는 일반적으로 복수 개의 원격 감지 이미지 샘플을 포함하고, 모든 원격 감지 이미지 샘플의 해상도는 완전히 동일한 것이 아니다. 샘플 데이터 세트 중 상이한 해상도를 갖는 원격 감지 이미지 샘플을 이용하여 신경 네트워크(700)를 성공적으로 훈련한 후, 성공적으로 훈련된 신경 네트워크(700)를 이용하여 자기 위성의 인식될 원격 감지 이미지를 인식할 수 있고, 신경 네트워크(700)의 인식 결과는 스노우 마스크 또는 스노우 워터 마스크 등을 형성할 수 있다.
그러나, 본 기술 분야의 기술자는 본 출원의 실시형태의 적용 시나리오가 상기 프레임워크의 임의의 측면에 의해 한정되지 않는다는 것을 완전히 이해할 수 있을 것이다.
본 출원의 방법, 장치 및 전자 기기, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 저장 매체는 많은 방식으로 구현된다. 예를 들어, 본 출원의 방법, 장치 및 전자 기기, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 저장 매체는 소프트웨어, 하드웨어, 펌웨어 또는 소프트웨어, 하드웨어, 펌웨어의 임의의 조합으로 구현될 수 있다. 달리 구체적으로 언급되지 않는 한, 방법을 위한 상기 단계의 상기 순서는 다만 구체적인 설명을 위한 것이며, 본 출원의 실시 형태의 방법의 단계를 한정하려는 것은 아니다. 또한, 일부 실시 형태에 있어서, 본 출원은 또한 기록 매체에 기록된 프로그램으로 구현될 수 있으며, 이러한 프로그램은 본 출원에 따른 방법을 구현하기 위한 기계 판독 가능한 명령어를 포함한다. 따라서, 본 출원은 본 출원에 따른 방법들을 실행하기 위한 프로그램을 저장하는 기록 매체를 더 포함한다.
본 출원의 설명은 예 및 설명을 목적으로 제공되며, 누락되지 않는 형태로 한정되거나 본 출원을 개시된 형태로 한정하려는 것은 아니다. 많은 수정과 변경은 본 기술분야의 통상의 기술자에게 자명한 것이다. 실시형태를 선택하고 설명한 것은 본 출원의 원리 및 실제 응용을 더 잘 설명하기 위해서이고, 본 기술분야의 통상의 기술자로 하여금 본 출원을 이해하여, 특정 사용에 적용 가능한 다양한 변경들을 갖는 다양한 실시형태들을 설계할 수 있도록 한다.
Claims (31)
- 원격 감지 이미지 인식 방법으로서,
상기 원격 감지 이미지 인식 방법은,
인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻는 단계;
상기 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하는 단계;
상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계;
신경 네트워크를 통해 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하는 단계; 및
상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제1항에 있어서,
상기 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하는 단계는,
축소율 세트 중 사용되지 않은 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제2항에 있어서,
상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계는,
축소율 세트에 사용되지 않은 축소값이 존재하지 않거나 상기 적어도 하나의 원격 감지 이미지 블록에 처리될 원격 감지 이미지 블록이 존재하지 않는 것에 응답하여, 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제2항 또는 제3항에 있어서,
상기 축소율 세트는 적어도 두 개의 상이한 축소값을 포함하고, 비교적 작은 축소값은 비교적 큰 축소값에 비해 먼저 사용되는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계는,
해상도 다운 처리를 첫 번째로 실행할 경우, 모든 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 사용하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계는,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 처리될 원격 감지 이미지 블록의 개수가 현재 분할된 원격 감지 이미지 블록의 개수보다 작거나 같은 것 및 상기 인식될 원격 감지 이미지가 현재 해상도 다운 처리된 이미지 해상도가 이전 해상도 다운 처리된 이미지 해상도보다 큰 것 중 적어도 하나인 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제6항에 있어서,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제7항에 있어서,
상기 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하는 단계는,
인식될 원격 감지 이미지에 포함된 복수 개의 픽셀 중 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 상기 적어도 하나의 픽셀의 현재 신뢰도를 결정하는 단계;
원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 상기 적어도 하나의 픽셀의 현재 신뢰도가 기설정된 신뢰도에 도달한 픽셀 개수를 통계하는 단계; 및
상기 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제8항에 있어서,
상기 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하는 단계는,
원격 감지 이미지 블록의 경우, 기설정된 신뢰도에 도달한 픽셀 개수와 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 상기 적어도 하나의 픽셀의 개수의 비율값이 기설정된 비율값보다 작을 경우, 상기 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제8항 또는 제9항에 있어서,
상기 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 획득하는 방식은,
해상도 다운 처리를 첫 번째로 실행할 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하는 단계 - 상기 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보는 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보로 사용됨 - 를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제8항 내지 제10항 중 어느 한 항에 있어서,
상기 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보를 획득하는 방식은,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하는 단계; 및
이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제11항에 있어서,
이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하는 단계는,
이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보와 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보의 평균값을 계산하는 단계; 및
계산된 평균값을 이용하여 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제12항에 있어서,
상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하는 단계는,
인식될 원격 감지 이미지에서의 하나의 픽셀의 경우, 상기 픽셀의 현재 분류 확률 정보에서의 각 타입에 속하는 확률값에서의 최대 확률값을 결정하여, 상기 최대 확률값 및 상기 최대 확률값에 대응되는 타입을, 상기 픽셀의 인식 결과로 사용하는 단계를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 제2항 내지 제13항 중 어느 한 항에 있어서,
상기 신경 네트워크를 훈련하는 원격 감지 이미지 샘플의 해상도는 축소율 세트에서의 각 축소값에 따라 각각 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 획득된 각 원격 감지 이미지의 해상도를 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 방법. - 원격 감지 이미지 인식 장치로서,
상기 장치는,
인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 해상도 다운 처리된 원격 감지 이미지를 얻기 위한 해상도 다운 모듈;
상기 해상도 다운 처리된 원격 감지 이미지로부터 적어도 하나의 원격 감지 이미지 블록을 분할하기 위한 원격 감지 이미지 분할 모듈;
상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하기 위한 이미지 블록 선택 모듈;
신경 네트워크를 통해 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보를 획득하기 위한 분류 처리 모듈; 및
상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하기 위한 인식 결과 결정 모듈을 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제15항에 있어서,
상기 해상도 다운 모듈은,
축소율 세트 중 사용되지 않은 축소값에 따라 인식될 원격 감지 이미지에 대해 해상도 다운 처리를 수행하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제16항에 있어서,
상기 인식 결과 결정 모듈은,
축소율 세트에 사용되지 않은 축소값이 존재하지 않거나 상기 적어도 하나의 원격 감지 이미지 블록에 처리될 원격 감지 이미지 블록이 존재하지 않는 것에 응답하여, 상기 처리될 원격 감지 이미지 블록에서의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 인식 결과를 결정하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제16항 또는 제17항에 있어서,
상기 축소율 세트는 적어도 두 개의 상이한 축소값을 포함하고, 작은 축소값은 큰 축소값에 비해 먼저 사용되는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제15항 내지 제18항 중 어느 한 항에 있어서,
상기 이미지 블록 선택 모듈은,
해상도 다운 처리를 첫 번째로 실행할 경우, 모든 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 사용하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제15항 내지 제19항 중 어느 한 항에 있어서,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 이미지 블록 선택 모듈에 의해 결정된 처리될 원격 감지 이미지 블록의 개수는 원격 감지 이미지 분할 모듈에 의해 현재 분할된 원격 감지 이미지 블록의 개수보다 작거나 같고, 해상도 다운 모듈에 의해 다운된 해상도는 이전 다운된 해상도보다 큰 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제20항에 있어서,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 이미지 블록 선택 모듈은 인식될 원격 감지 이미지의 픽셀의 현재 신뢰도에 따라 상기 적어도 하나의 원격 감지 이미지 블록으로부터 처리될 원격 감지 이미지 블록을 결정하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제21항에 있어서,
상기 이미지 블록 선택 모듈은,
인식될 원격 감지 이미지에 포함된 복수 개의 픽셀 중 적어도 하나의 픽셀의 현재 분류 확률 정보에 따라 상기 적어도 하나의 픽셀의 현재 신뢰도를 결정하기 위한 제1 유닛;
원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 상기 적어도 하나의 픽셀의 현재 신뢰도가 기설정된 신뢰도에 도달한 픽셀 개수를 통계하기 위한 제2 유닛; 및
상기 기설정된 신뢰도에 도달한 픽셀 개수가 기설정된 요구에 부합되지 않은 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하기 위한 제3 유닛을 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제22항에 있어서,
상기 제3 유닛은, 원격 감지 이미지 블록에 대해, 기설정된 신뢰도에 도달한 픽셀 개수와 상기 원격 감지 이미지 블록에 대응되는 인식될 원격 감지 이미지 영역 중 상기 적어도 하나의 픽셀의 개수의 비율값이 기설정된 비율값보다 작을 경우, 상기 원격 감지 이미지 블록을 처리될 원격 감지 이미지 블록으로 결정하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제22항 또는 제23항에 있어서,
상기 이미지 블록 선택 모듈은,
해상도 다운 처리를 첫 번째로 실행할 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하기 위한 제4 유닛 - 상기 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보는 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 현재 분류 확률 정보로 사용됨 - 을 더 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제22항 또는 제23항에 있어서,
상기 이미지 블록 선택 모듈은,
해상도 다운 처리를 첫 번째로 실행하는 것이 아닐 경우, 신경 네트워크에 의해 출력된 각 처리될 원격 감지 이미지 블록 중 적어도 하나의 픽셀의 분류 확률 정보를 인식될 원격 감지 이미지에 맵핑하여, 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보를 획득하기 위한 제5 유닛; 및
이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보에 따라 상기 인식될 원격 감지 이미지의 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하기 위한 제6 유닛을 더 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 제25항에 있어서,
상기 제6 유닛은,
이 번에 획득된 인식될 원격 감지 이미지의 적어도 하나의 픽셀의 분류 확률 정보와 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보의 평균값을 계산하고;
계산된 평균값을 이용하여 인식될 원격 감지 이미지 중 상응하는 픽셀의 현재 분류 확률 정보를 업데이트하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제26항에 있어서,
상기 인식 결과 결정 모듈은,
인식될 원격 감지 이미지에서의 하나의 픽셀의 경우, 상기 픽셀의 현재 분류 확률 정보에서의 각 타입에 속하는 확률값에서의 최대 확률값을 결정하여, 상기 최대 확률값 및 상기 최대 확률값에 대응되는 타입을, 상기 픽셀의 인식 결과로 사용하기 위한 것임을 특징으로 하는 원격 감지 이미지 인식 장치. - 제16항 내지 제27항 중 어느 한 항에 있어서,
상기 원격 감지 이미지 인식 장치는,
원격 감지 이미지 샘플을 이용하여 훈련될 신경 네트워크를 훈련하기 위한 훈련 모듈
- 상기 원격 감지 이미지 샘플의 해상도는 축소율 세트에서의 각 축소값에 따라 각각 원격 감지 이미지에 대해 해상도 다운 처리를 수행하여, 획득된 각 원격 감지 이미지의 해상도를 포함함 - 을 더 포함하는 것을 특징으로 하는 원격 감지 이미지 인식 장치. - 전자 기기로서,
컴퓨터 프로그램을 저장하기 위한 메모리; 및
상기 메모리에 저장된 컴퓨터 프로그램을 실행하기 위한 프로세서를 포함하며, 상기 컴퓨터 프로그램이 실행될 경우, 제1항 내지 제15항 중 어느 한 항에 따른 원격 감지 이미지 인식 방법을 구현하는 것을 특징으로 하는 전자 기기. - 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능 저장 매체로서,
상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우, 제1항 내지 제15항 중 어느 한 항에 따른 원격 감지 이미지 인식 방법을 구현하는 것을 특징으로 하는 컴퓨터 판독 가능 저장 매체. - 컴퓨터 프로그램으로서,
컴퓨터 명령어를 포함하며, 상기 컴퓨터 명령어가 기기의 프로세서에서 작동될 경우, 제1항 내지 제15항 중 어느 한 항에 따른 원격 감지 이미지 인식 방법을 구현하는 것을 특징으로 하는 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711436470.2 | 2017-12-26 | ||
CN201711436470.2A CN108304775B (zh) | 2017-12-26 | 2017-12-26 | 遥感图像识别方法、装置、存储介质以及电子设备 |
PCT/CN2018/123807 WO2019129032A1 (zh) | 2017-12-26 | 2018-12-26 | 遥感图像识别方法、装置、存储介质以及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200106909A true KR20200106909A (ko) | 2020-09-15 |
Family
ID=62867455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207021508A KR20200106909A (ko) | 2017-12-26 | 2018-12-26 | 원격 감지 이미지 인식 방법, 장치, 저장 매체 및 전자 기기 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11074445B2 (ko) |
JP (1) | JP7080978B2 (ko) |
KR (1) | KR20200106909A (ko) |
CN (1) | CN108304775B (ko) |
SG (1) | SG11202006035RA (ko) |
WO (1) | WO2019129032A1 (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304775B (zh) | 2017-12-26 | 2021-06-11 | 北京市商汤科技开发有限公司 | 遥感图像识别方法、装置、存储介质以及电子设备 |
CN108711159B (zh) * | 2018-03-30 | 2019-06-18 | 长安大学 | 基于Landsat8含雪影像的云检测方法 |
CN110189328B (zh) * | 2019-06-11 | 2021-02-23 | 北华航天工业学院 | 一种卫星遥感图像处理系统及其处理方法 |
CN111866427A (zh) * | 2019-09-06 | 2020-10-30 | 阳光学院 | 一种基于psvm和crnn的遥感影像分类显示装置 |
CN110866493B (zh) * | 2019-11-14 | 2022-03-22 | 生态环境部南京环境科学研究所 | 基于遥感影像的规模化生猪养殖场识别方法 |
CN112232249B (zh) * | 2020-10-22 | 2023-08-15 | 中国科学院空天信息创新研究院 | 一种基于深度特征的遥感图像变化检测方法及装置 |
CN112560577A (zh) * | 2020-11-13 | 2021-03-26 | 空间信息产业发展股份有限公司 | 一种基于语义分割的遥感图像地物分类方法 |
CN112579816B (zh) * | 2020-12-29 | 2022-01-07 | 二十一世纪空间技术应用股份有限公司 | 遥感图像的检索方法、装置、电子设备及存储介质 |
CN112857268B (zh) | 2021-01-21 | 2023-10-31 | 北京百度网讯科技有限公司 | 对象面积测量方法、装置、电子设备和存储介质 |
CN112818840B (zh) * | 2021-01-29 | 2024-08-02 | 中国科学院微小卫星创新研究院 | 无人机在线检测系统和方法 |
CN113011350A (zh) * | 2021-03-24 | 2021-06-22 | 深圳前海微众银行股份有限公司 | 一种地域图像的识别处理方法、装置及电子设备 |
CN113553938B (zh) * | 2021-07-19 | 2024-05-14 | 黑芝麻智能科技(上海)有限公司 | 安全带检测方法、装置、计算机设备和存储介质 |
CN113570536B (zh) * | 2021-07-31 | 2022-02-01 | 中国人民解放军61646部队 | 基于cpu和gpu协同处理的全色和多光谱影像实时融合方法 |
CN114202691B (zh) * | 2021-12-09 | 2022-10-04 | 广东省科学院广州地理研究所 | 基于遥感图像的水稻识别方法、装置以及设备 |
CN114676907B (zh) * | 2022-01-17 | 2022-09-20 | 中国地质大学(北京) | 一种区域地质灾害预警方法、装置、存储介质及设备 |
CN114663412B (zh) * | 2022-04-01 | 2023-02-10 | 中国科学院地理科学与资源研究所 | 基于陆表水域生态红线的长连续遥感图像处理方法及装置 |
CN115019198B (zh) * | 2022-08-08 | 2022-10-18 | 中国科学院空天信息创新研究院 | 高频次遥感观测影像迭代更新制图方法 |
CN115080925B (zh) * | 2022-08-19 | 2022-11-11 | 北京数慧时空信息技术有限公司 | 基于区块链的遥感成果知识产权管理方法及系统 |
CN115346124B (zh) * | 2022-09-02 | 2023-05-30 | 浙大城市学院 | 一种水稻制图的方法、装置、设备及可读存储介质 |
CN115641445B (zh) * | 2022-12-23 | 2023-03-14 | 西南石油大学 | 一种非对称内卷积与Transformer相融合的遥感图像阴影检测方法 |
CN118628841A (zh) * | 2024-08-12 | 2024-09-10 | 鹏城实验室 | 遥感图像数据处理方法、装置、设备和存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19955919C1 (de) * | 1999-11-20 | 2001-05-31 | Daimler Chrysler Ag | Verfahren zur Erkennung von Objekten in Bildern auf der Bildpixelebene |
JP2006011967A (ja) | 2004-06-28 | 2006-01-12 | Fuji Xerox Co Ltd | 文字認識装置、文字認識プログラム |
US7359555B2 (en) | 2004-10-08 | 2008-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Detecting roads in aerial images using feature-based classifiers |
US8339470B2 (en) * | 2009-11-30 | 2012-12-25 | Indian Institute Of Technology Madras | Method and system for generating a high resolution image |
CN101826157B (zh) * | 2010-04-28 | 2011-11-30 | 华中科技大学 | 一种地面静止目标实时识别跟踪方法 |
CN102186069B (zh) * | 2011-01-14 | 2013-05-08 | 王慧 | 一种保持量测性能的遥感影像数据压缩方法 |
CN103093182A (zh) * | 2011-11-03 | 2013-05-08 | 北京师范大学 | 一种基于多敏感性策略的遥感影像层次分类识别方法 |
CN103150561A (zh) | 2013-03-19 | 2013-06-12 | 华为技术有限公司 | 人脸识别方法和设备 |
CN103310195B (zh) * | 2013-06-09 | 2016-12-28 | 西北工业大学 | 车辆高分遥感图像的基于llc特征的弱监督识别方法 |
CN104463873B (zh) * | 2014-12-10 | 2017-11-07 | 西安电子科技大学 | 一种基于局部均匀缩放的图像目标重定位方法 |
CN105046231A (zh) * | 2015-07-27 | 2015-11-11 | 小米科技有限责任公司 | 人脸检测方法和装置 |
CN106548192B (zh) * | 2016-09-23 | 2019-08-09 | 北京市商汤科技开发有限公司 | 基于神经网络的图像处理方法、装置和电子设备 |
CN106778821B (zh) * | 2016-11-25 | 2019-05-03 | 西安电子科技大学 | 基于slic和改进的cnn的极化sar图像分类方法 |
CN108304775B (zh) * | 2017-12-26 | 2021-06-11 | 北京市商汤科技开发有限公司 | 遥感图像识别方法、装置、存储介质以及电子设备 |
-
2017
- 2017-12-26 CN CN201711436470.2A patent/CN108304775B/zh active Active
-
2018
- 2018-12-26 KR KR1020207021508A patent/KR20200106909A/ko not_active Application Discontinuation
- 2018-12-26 JP JP2020535252A patent/JP7080978B2/ja active Active
- 2018-12-26 WO PCT/CN2018/123807 patent/WO2019129032A1/zh active Application Filing
- 2018-12-26 SG SG11202006035RA patent/SG11202006035RA/en unknown
-
2020
- 2020-06-23 US US16/909,291 patent/US11074445B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
SG11202006035RA (en) | 2020-07-29 |
US20200320273A1 (en) | 2020-10-08 |
CN108304775A (zh) | 2018-07-20 |
JP7080978B2 (ja) | 2022-06-06 |
WO2019129032A1 (zh) | 2019-07-04 |
CN108304775B (zh) | 2021-06-11 |
US11074445B2 (en) | 2021-07-27 |
JP2021508123A (ja) | 2021-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200106909A (ko) | 원격 감지 이미지 인식 방법, 장치, 저장 매체 및 전자 기기 | |
KR102478000B1 (ko) | 이미지 처리 방법, 훈련 방법, 장치, 기기, 매체 및 프로그램 | |
US11062453B2 (en) | Method and system for scene parsing and storage medium | |
US11538244B2 (en) | Extraction of spatial-temporal feature representation | |
CN108154222B (zh) | 深度神经网络训练方法和系统、电子设备 | |
CN108427927B (zh) | 目标再识别方法和装置、电子设备、程序和存储介质 | |
TW202139183A (zh) | 基於人工智慧的物體檢測方法、裝置、設備及儲存媒體 | |
KR20200015611A (ko) | 시맨틱 분할 모델을 위한 훈련 방법 및 장치, 전자 기기, 저장 매체 | |
KR20200087808A (ko) | 인스턴스 분할 방법 및 장치, 전자 기기, 프로그램 및 매체 | |
CN108230354B (zh) | 目标跟踪、网络训练方法、装置、电子设备和存储介质 | |
CN109409288B (zh) | 图像处理方法、装置、电子设备和存储介质 | |
CN113469025B (zh) | 应用于车路协同的目标检测方法、装置、路侧设备和车辆 | |
US20210097290A1 (en) | Video retrieval in feature descriptor domain in an artificial intelligence semiconductor solution | |
US9734434B2 (en) | Feature interpolation | |
US9589179B2 (en) | Object detection techniques | |
JP6275719B2 (ja) | ビデオシーケンスの画像の色をサンプル化する方法および色クラスタリングへの適用 | |
CN108229680B (zh) | 神经网络系统、遥感图像识别方法、装置、设备及介质 | |
CN113420757A (zh) | 文本审核方法、装置、电子设备和计算机可读介质 | |
CN114399657A (zh) | 车辆检测模型训练方法、装置、车辆检测方法及电子设备 | |
CN110442719B (zh) | 一种文本处理方法、装置、设备及存储介质 | |
CN115273148B (zh) | 行人重识别模型训练方法、装置、电子设备及存储介质 | |
CN116128048A (zh) | 光学遥感图像云检测模型训练方法、检测方法和装置 | |
CN112509052B (zh) | 黄斑中心凹的检测方法、装置、计算机设备和存储介质 | |
CN113011410A (zh) | 字符识别模型的训练方法、字符识别方法及装置 | |
CN113205092A (zh) | 文本检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E601 | Decision to refuse application |