KR102240403B1 - 이미지 평활화 방법 및 이미지 평활화 장치 - Google Patents

이미지 평활화 방법 및 이미지 평활화 장치 Download PDF

Info

Publication number
KR102240403B1
KR102240403B1 KR1020190174290A KR20190174290A KR102240403B1 KR 102240403 B1 KR102240403 B1 KR 102240403B1 KR 1020190174290 A KR1020190174290 A KR 1020190174290A KR 20190174290 A KR20190174290 A KR 20190174290A KR 102240403 B1 KR102240403 B1 KR 102240403B1
Authority
KR
South Korea
Prior art keywords
smoothing
image
parameter
smoothed
smoothing parameter
Prior art date
Application number
KR1020190174290A
Other languages
English (en)
Inventor
구형일
김용균
조범근
Original Assignee
아주대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아주대학교 산학협력단 filed Critical 아주대학교 산학협력단
Priority to KR1020190174290A priority Critical patent/KR102240403B1/ko
Application granted granted Critical
Publication of KR102240403B1 publication Critical patent/KR102240403B1/ko

Links

Images

Classifications

    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001Image restoration
    • G06T5/002Denoising; Smoothing
    • G06K9/36
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Abstract

일 양상에 따르면, 평활화 파라미터 예측 모델을 통해, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측하는 단계, 평활화 파라미터에 따라 입력 이미지를 평활화하여 평활화 이미지를 생성하는 단계, 평활화 이미지의 평활화 정도를 평가하는 단계 및 평활화 이미지의 평활화 정도에 기초하여, 평활화 파라미터 예측 모델을 업데이트하는 단계를 포함하는 이미지 평활화 방법이 제공될 수 있다.

Description

이미지 평활화 방법 및 이미지 평활화 장치{IMAGE RECTIFICATION METHOD AND IMAGE RECTIFICATION APPARATUS}
본 발명은 이미지 평활화 방법 및 이미지 평활화 장치에 관한 것으로서, 보다 상세하게는 뉴럴 네트워크를 이용한 이미지 평활화 방법 및 이미지 평활화 장치에 관한 것이다.
대상 객체에 대한 이미지(Image) 또는 영상(Video)는 대상 객체의 물리적 굴곡 및 촬영 장비의 위치 등 다양한 요인에 의해, 대상 객체에 대한 왜곡을 일부 포함할 수 있다. 이 경우, 이미지에 대한 평활화(Rectification)는 OCR 등 영상 기반 문서 처리를 위한 전처리 과정으로서 필수적이다.
이에 대한 기존의 방법은, Depth sensing device 등의 특수 장비를 필요로 하거나, 밑줄(Text line) 등 원하는 특징이 부족한 문서에 대해 처리하는 것이 불가하거나, 모델로 표현할 수 없는 왜곡은 처리하기 어렵고, 방대한 연산량 등의 문제점들을 수반한다. 따라서, 효과적이고 정확하게 이미지를 평활화하는 방법에 대한 수요가 증가하는 실정이다.
본 발명의 과제는, 뉴럴 네트워크를 이용하여 평활화 파라미터를 예측하고, 평활화 정도를 평가하는 이미지 평활화 장치 및 이미지 평활화 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제가 상술한 과제로 제한되는 것은 아니며, 언급되지 아니한 과제들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 양상에 따르면, 평활화 파라미터 예측 모델을 통해, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측하는 단계, 평활화 파라미터에 따라 입력 이미지를 평활화하여 평활화 이미지를 생성하는 단계, 평활화 이미지의 평활화 정도를 평가하는 단계 및 평활화 이미지의 평활화 정도에 기초하여, 평활화 파라미터 예측 모델을 업데이트하는 단계를 포함하는 이미지 평활화 방법이 제공될 수 있다.
또, 평활화 정도는 평활화 이미지의 L1 norm 또는 Nuclear norm 값에 기초하여 평가될 수 있다.
또, 평활화 이미지의 Nuclear norm 값이 작을수록 평활화 정도는 증가할 수 있다.
또, 평활화 파라미터 예측 모델은, 평활화 이미지의 Nuclear norm 값이 최소화되도록 업데이트될 수 있다.
또, 평활화 파라미터는 입력 이미지 내 대상 객체에 대한 카메라의 위치 또는 입력 이미지에 기초하여 획득된 대상 객체의 서피스 모델(surface model) 중 적어도 어느 하나일 수 있다.
또, 평활화 이미지 생성 단계에서, spatial transformation network를 이용하여 평활화 이미지가 생성될 수 있다.
또, 평활화 파라미터 예측 모델의 뉴럴 네트워크는 CNN(Convolutional Neural Network)일 수 있다.
또, 평활화 파라미터 예측 모델은, 입력 이미지에 기초하여 대상 객체에 관한 서피스 모델을 생성하고, 서피스 모델과, 센서를 통해 획득한 대상 객체에 대한 깊이(depth) 측정값을 비교함으로써, 업데이트 될 수 있다.
다른 일 실시예에 따르면, 평활화 파라미터 예측 모델을 통해, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 제1 평활화 파라미터를 예측하는 단계, 제1 평활화 파라미터에 따라 입력 이미지를 평활화하여 제1 평활화 이미지를 생성하는 단계, 평활화 파라미터 예측 모델을 통해 제1 평활화 이미지에 대한 제2 평활화 파라미터를 예측하는 단계, 제2 평활화 파라미터에 따라 제1 평활화 이미지를 평활화하여 제2 평활화 이미지를 생성하는 단계, 제1 평활화 이미지 및 제2 평활화 이미지의 평활화 정도를 평가하는 단계 및 제1 평활화 이미지 및 제2 평활화 이미지의 평활화 정도에 기초하여, 평활화 파라미터 예측 모델을 업데이트하는 단계를 포함하는 이미지 평활화 방법이 제공될 수 있다.
또, 이미지 평활화 방법은 제1 평활화 이미지를 복수의 서브이미지들로 분할하는 단계를 더 포함하고, 제2 평활화 파라미터를 예측하는 단계에서, 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하고, 제2 평활화 이미지를 생성하는 단계에서, 제2 평활화 파라미터를 예측한 복수의 서브이미지들 중 적어도 일부를 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득할 수 있다.
또 다른 일 실시예에 따르면, 이미지 평활화를 위한 뉴럴 네트워크 장치에 있어서, 메모리 및 프로그램을 실행함으로써 뉴럴 네트워크를 처리하는 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로세서는 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측하는 평활화 파라미터 예측부, 평활화 파라미터에 따라 입력 이미지를 평활화하여 평활화 이미지를 생성하는 평활화부 및 평활화 이미지의 평활화 정도를 평가하는 평가부를 포함하고, 평활화 파라미터 예측부는 평활화 정도에 기초하여, 뉴럴 네트워크를 업데이트하는 이미지 평활화 장치가 제공될 수 있다.
또, 적어도 하나의 프로세서는 평활화 이미지를 복수의 서브이미지들로 분할하고, 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하고, 복수의 서브이미지들 중 적어도 일부를 상기 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득할 수 있다.
본 발명에 따르면, 평가한 평활화 정도에 기초하여 뉴럴 네트워크를 업데이트함으로써, 예측하는 평활화 파라미터의 정확도가 향상되고, 이에 따라 왜곡된 이미지에 대한 평활화 정도가 향상될 수 있다.
본 발명의 효과가 상술한 효과들로 제한되는 것은 아니며, 언급되지 아니한 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1은 일 실시예에 따른 이미지 평활화 장치에 관한 블록 구성도이다.
도 2는 일 실시예에 따른 이미지 평활화 장치의 이미지 평활화 방법에 관한 도면이다.
도 3은 일 실시예에 따른 이미지 평활화 장치가 평활화 정도에 기초하여 업데이트되는 것에 관한 도면이다.
도 4는 일 실시예에 따른 이미지 평활화 장치가 카메라를 이용한 depth 측정값에 의해 업데이트되는 것에 관한 도면이다.
도 5는 일 실시예에 따른 이미지 평활화 장치에 이용되는 입력 이미지, 평활화 파라미터 및 평활화 이미지에 관한 도면이다.
도 6 및 도 7은 다른 일 실시예에 따라 이미지 평활화를 수회 반복하는 이미지 평활화 장치의 이미지 평활화 방법에 관한 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되는 실시예를 참조하면 명확해질 것이다.
그러나 본 발명은 이하에서 개시되는 실시예로 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있다.
본 명세서에서 실시예는 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
따라서, 몇몇 실시예에서, 잘 알려진 구성 요소, 잘 알려진 동작 및 잘 알려진 기술들은 본 발명이 모호하게 해석되는 것을 피하기 위하여 구체적 설명이 생략될 수 있다.
본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함하며, '포함(또는, 구비)한다'로 언급된 구성 요소 및 동작은 하나 이상의 다른 구성요소 및 동작의 존재 또는 추가를 배제하지 않는다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적 으로 이해될 수 있는 의미로 사용될 수 있을 것이다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명하기로 한다. 이들 실시예 는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당 업계에서 통상의 지식을 가진 자에게 있어서 자명한 것이다.
도 1은 일 실시예에 따른 이미지 평활화 장치(100)에 관한 블록 구성도이다.
도 1을 참조하면, 이미지 평활화 장치(100)는 사용자 인터페이스(120), 프로세서(140) 및 메모리(160)를 포함할 수 있다.
이미지 평활화 장치(100)는 대상 객체의 적어도 일부가 왜곡된 입력 이미지를 수신하고, 입력 이미지에 대해 평활화 과정을 수행함으로써, 대상 객체의 왜곡된 부분이 교정되어 평활화된 이미지를 출력할 수 있다.
사용자 인터페이스(120)는 사용자 입력을 수신하고, 사용자에게 정보를 출력할 수 있다. 예를 들면, 사용자 인터페이스(120)는 사용자로부터 입력 이미지를 수신하고, 평활화 이미지를 출력할 수 있다. 사용자 인터페이스(120)는 사용자 입력을 프로세서(140)에게 전달할 수 있고, 프로세서(140)로부터, 출력할 정보를 수신할 수 있다. 사용자 인터페이스(120)는 버튼, 터치 스크린, 키보드, 카메라, 마이크 및 각종 센서 중 적어도 하나를 포함할 수 있다.
프로세서(140)는 이미지 평활화 장치(100)의 전반적 동작을 제어할 수 있다. 프로세서(140)는 메모리(160)에 저장된 프로그램들 및/또는 데이터를 처리 또는 실행할 수 있다. 예를 들면, 프로세서(140)는 입력 이미지를 평활화하기 위한 전처리/후처리 과정, 평활화 과정 및 업데이트 동작 등을 수행할 수 있다.
일 실시예에 따르면, 프로세서(140)는 그 기능에 따라 입력 이미지로부터 평활화 파라미터를 예측하는 평활화 파라미터 예측부(142), 예측한 평활화 파라미터에 따라 입력 이미지에 대한 평활화를 수행하는 평활화부(144), 평활화 정도를 수치화하여 평가하는 평가부(146) 등을 포함할 수 있다. 평활화 파라미터 예측부(142), 평활화부(144) 및 평가부(146) 등에 대해서는 도 2를 통해 더 자세히 설명한다.
프로세서(140)는 뉴럴 네트워크를 이용하여 이미지 평활화 방법을 수행할 수 있다. 프로세서(140)는 수신되는 입력 데이터를 기초로 뉴럴 네트워크의 연산을 수행하고, 수행 결과를 기초로 정보 신호를 생성할 수 있다. 뉴럴 네트워크는 Convolutional Neural Networks(CNN), Recurrent Neural Networks(RNN), Deep Belief Networks, Restricted Boltzman Machines 등을 포함할 수 있으나 이에 제한되지 않는다.
프로세서(140)의 다양한 동작 예들은 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, 프로세서(140)는 하나의 프로세서 코어(Single Core)를 포함하거나, 복수의 프로세서 코어들(Multi-Core)을 포함할 수 있다. 프로세서(140)는 CPU, GPU, AP 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 그러한 실시예들이 프로세서(140)에 의해 구현될 수 있다.
소프트웨어적인 구현에 의하면, 절차나 기능과 같은 실시예들은 적어도 하나의 기능 또는 작동을 수행하게 하는 별개의 소프트웨어 모듈과 함께 구현될 수 있다. 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다. 또한, 소프트웨어 코드는 메모리(160)에 저장되고, 프로세서(140)에 의해 실행될 수 있다.
메모리(160)는, 이미지 평활화 장치(100)의 동작을 위해 필요한 정보들을 기록할 수 있다. 메모리(160)는 예를 들면 OS(Operating System), 각종 프로그램들, 및 각종 데이터를 저장할 수 있다. 또, 메모리(160)는 뉴럴 네트워크 데이터, 예컨대, 파라미터들, 웨이트 맵 또는 웨이트 리스트를 저장할 수 있다.
메모리(160)의 예로는 하드 디스크(HDD: Hard Disk Drive), SSD(Solid State Drive), 플래쉬 메모리(flash memory), 롬(ROM: Read-Only Memory), 램(RAM: Random Access Memory) 등이 있을 수 있다.
이미지 평활화 장치(100)는 드론(drone), 첨단 운전자 보조 시스템(Advanced Drivers Assistance System; ADAS) 등과 같은 로봇 장치, 스마트 TV, 스마트폰, 의료 디바이스, 모바일 디바이스, 영상 표시 디바이스, 계측 디바이스, IoT 디바이스 등에 적용될 수 있으며, 이 외에도 다양한 종류의 전자 디바이스들 중 적어도 하나에 탑재될 수 있다.
이미지 평활화 장치(100)는 통신 모듈, 보안 모듈, 전력 제어 모듈 등을 더 포함할 수 있다. 이미지 평활화 장치(100)의 하드웨어 구성들 중 일부는 적어도 하나의 반도체 칩에 탑재될 수 있다.
도 2는 일 실시예에 따른 이미지 평활화 장치(100)의 이미지 평활화 방법에 관한 도면이다.
도 2를 참조하면, 이미지 평활화 장치(100)는 프로세서(140)의 동작 및 기능에 따라 구분할 때, 평활화 파라미터 예측부(142) 및 평활화부(144)를 포함할 수 있다. 평활화 파라미터 예측부(142) 및 평활화부(144) 등은 기능적으로 분류된 단위체이므로, 물리적으로 반드시 분리될 필요는 없으며, 하나의 프로세서(140)에서 구현될 수도 있고, 별도의 프로세서(140)에서 구현될 수도 있다. 일 실시예에 따르면, 이미지 평활화 장치(100)는 평활화 파라미터 예측부(142) 및 평활화부(144) 중 일부만을 내부 구성 요소로 포함하고, 다른 구성은 외부의 서버 또는 장치에 의해 수행될 수도 있다.
평활화 파라미터 예측부(142) 또는 평활화 파라미터 예측 모델(142)은, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측할 수 있다.
평활화 파라미터 예측부(142)의 뉴럴 네트워크는 인공 지능(AI) 기술에 따른 추론 및 예측을 위한 연산을 수행한다. 구체적으로, 뉴럴 네트워크는 복수의 계층들을 통한 연산을 수행하는 딥 뉴럴 네트워크(DNN: Deep Neural Network)가 될 수 있다. 뉴럴 네트워크는 연산을 수행하는 내부의 계층(layer)의 개수에 따라서 계층의 개수가 복수일 경우, 즉 연산을 수행하는 뉴럴 네트워크의 심도(depth)가 증가하는 경우, 딥 뉴럴 네트워크(DNN)로 분류될 수 있다. 또한, 딥 뉴럴 네트워크(DNN) 연산은 컨볼루션 뉴럴 네트워크(CNN: Convolution Neural Network) 연산 등을 포함할 수 있다.
평활화 파라미터 예측부(142)의 뉴럴 네트워크는, 대상 객체의 왜곡된 일부분을 포함하는 입력 이미지를 입력 받고, 입력 이미지로부터 특징(feature)들을 추출하고, 복수의 계층들을 통한 연산을 통해 입력 이미지의 특징으로부터 입력 이미지를 평활화하기 위한 최적의 평활화 파라미터를 예측 및 획득할 수 있다. 뉴럴 네트워크는 도 3 및 도 4를 통해 자세히 후술하는 바와 같이, 최적의 평활화 파라미터를 예측하기 위하여 소정의 방식에 따라 학습 및 업데이트될 수 있다. 예측된 평활화 파라미터는 평활화부(144)에 전달된다.
평활화 파라미터는 입력 이미지 내 대상 객체에 대한 카메라의 위치 또는 입력 이미지에 기초하여 획득된 대상 객체의 서피스 모델(surface model) 중 적어도 어느 하나를 포함할 수 있다.
보다 구체적으로, 대상 객체에 대한 카메라의 위치에 따라, 이미지 상에서 대상 객체가 왜곡되는 방향, 왜곡의 정도 및 왜곡의 종류 등이 상이할 수 있다. 여기에서, 대상 객체에 대한 카메라의 위치는 대상 객체와 카메라 간 이격 거리, 대상 객체에 대한 카메라의 각도 등을 포함한다.
일 예를 들면, 대상 객체가 평면이고, 카메라가 평면에 대해 기울어진 경우에 따라 카메라에 가까운 대상 객체의 모서리는 확대되는 반면, 카메라에 먼 대상 객체의 모서리는 축소되는 효과가 발생하며, 그러한 효과는 카메라가 평면에 대해 기울어진 각도가 커질수록, 증가하는 경향을 보인다.
따라서, 대상 객체에 대한 카메라의 위치를 이용해, 입력 이미지가 평활화될 수 있으며, 이를 위해 평활화 파라미터 예측부(142)는 입력 이미지를 입력받으면, 대상 객체에 대한 카메라의 위치를 예측하여 획득할 수 있다.
또한, 서피스 모델은 대상 객체를 3차원 상에서 표현한 방식으로서, 3차원 좌표에서의 좌표값들의 집합, 또는 수학식 등으로 표현될 수 있다. 서피스 모델은 대상 객체의 굴곡 및 구겨짐 등을 그대로 표현할 수 있으므로, 서피스 모델이 정확할수록 평활화 정도가 향상될 수 있다.
따라서, 대상 객체에 관한 서피스 모델(surface model)를 이용해 입력 이미지가 평활화될 수 있으며, 이를 위해 평활화 파라미터 예측부(142)는 입력 이미지를 입력받으면, 대상 객체에 관한 서피스 모델을 예측하여 획득할 수 있다.
평활화부(144)는 평활화 파라미터에 따라 입력 이미지를 평활화하여 평활화 이미지를 생성할 수 있다. 평활화부(144)는 평활화 파라미터를 고려하여, 대상 객체를 이미지화하는 과정에서 발생한 입력 이미지의 왜곡된 부분을 교정하거나, 대상 객체의 물리적 굴곡을 제거하여 평평한 상태의 대상 객체를 가상으로 구현함으로써 평활화 이미지를 생성할 수 있다.
평활화부(144)는 뉴럴 네트워크를 이용하거나, 미리 정해진 알고리즘에 따라 동작할 수 있다. 예를 들면, 평활화부(144)는 spatial transformation network를 이용할 수 있다. CNN을 통해 이미지 분류를 할 때, 특정 부분을 떼어내서 집중적으로 학습시키는 것을 Spatial Transformation Network라고 한다. 이로써, 이미지 평활화 장치(100)는 신속하게 정확하게 입력 이미지로부터 평활화된 이미지를 생성하여 출력할 수 있다.
일 실시예에 따르면 이미지 평활화 장치(100)는 정확성을 보다 향상시키기 위해서, 도 3에서 설명하는 평가부(146)의 처리를 수행할 수도 있다.
도 3은 일 실시예에 따른 이미지 평활화 장치(100)가 평활화 정도에 기초하여 업데이트되는 것에 관한 도면이다.
도 3을 참조하면, 이미지 평활화 장치(100)는 평활화 이미지의 평활화 정도를 평가하는 평가부(146)를 더 포함할 수 있다. 평가부(146)는 평활화 정도(rank)를 수치화한 값을 생성할 수 있다.
일 실시예에 따르면, 평가부(146)는 이미지를 행렬로 인식하여, 행렬에 대한 norm 값에 기초하여, 평활화 정도를 수치화할 수 있다. 예를 들면, 평활화 정도는 평활화 이미지의 L1 norm 또는 Nuclear norm 값에 기초하여 평가될 수 있다. 보다 구체적으로, 평활화 이미지의 Nuclear norm 값이 작을수록 평활화 정도는 증가할 수 있다.
평가부(146)는 생성한 평활화 정도를 평활화 파라미터 예측부(142)에 전달할 수 있다. 평활화 파라미터 예측부(142)는 평활화 이미지의 평활화 정도에 기초하여, 뉴럴 네트워크를 업데이트할 수 있다. 평활화 파라미터 예측부(142)는 입력 이미지로부터 생성된 평활화 이미지의 평활화 정도가 향상되도록 뉴럴 네트워크를 업데이트할 수 있다. 예를 들면, 평활화 파라미터 예측부(142)는 평활화 이미지의 Nuclear norm 값이 최소화되도록 경사 하강(gradient descent) 알고리즘을 수행할 수 있다.
역전파(back-propagation)를 통해 뉴럴 네트워크의 업데이트가 가능하도록, 평활화 파라미터 예측부(142), 평활화부(144) 및 평가부(146) 등은 미분 가능하도록 설계된다.
도 4는 일 실시예에 따른 이미지 평활화 장치(100)가 카메라를 이용한 depth 측정값에 의해 업데이트되는 것에 관한 도면이다.
도 4를 참조하면, 평활화 파라미터 예측 모델(142)은, 센서를 통해 획득한 대상 객체에 대한 깊이(depth) 측정값을 입력받을 수 있다. 센서는 카메라 또는 거리 센서 중 적어도 어느 하나일 수 있다. 대상 객체에 대한 깊이 측정값은, 센서의 위치를 기준으로 대상 객체를 구성하는 각 지점들의 이격 거리를 획득한 값으로서, 대상 객체의 구조에 대한 실측값이다.
상술한 바와 같이 평활화 파라미터 예측 모델(142)은, 입력 이미지에 기초하여 대상 객체의 서피스 모델을 생성할 수 있다.
평활화 파라미터 예측 모델(142)은, 대상 객체에 대한 깊이 측정값과, 대상 객체에 대한 서피스 모델을 비교함으로써, 오차가 최소화되도록 뉴럴 네트워크를 업데이트할 수 있다. 이로써, 평활화 파라미터 예측 모델(142)은 평활화 파라미터로 활용되는 대상 객체의 서피스 모델을 더욱 정확하게 예측할 수 있다.
도 5는 일 실시예에 따른 이미지 평활화 장치(100)에 이용되는 입력 이미지, 평활화 파라미터 및 평활화 이미지에 관한 도면이다.
도 5(a)를 참조하면, 입력 이미지는 대상 객체의 굴곡을 그대로 반영하거나, 또는 대상 객체로부터 이미지를 획득하는 과정에서 발생된 이미지의 왜곡을 포함한다.
도 5(b)를 참조하면, 평활화 파라미터 예측부(142)에서 예측하는 평활화 파라미터의 일 예로서, 대상 객체의 서피스 모델을 확인할 수 있다. 평활화 파라미터 예측부(142)가 학습을 통해 업데이트될수록 도 5(b)의 서피스 모델과 도 5(a)의 입력 이미지 간 일치하는 정도가 증가할 수 있다.
도 5(c)를 참조하면, 평활화부(144)를 거쳐 입력 이미지로부터 평활화된 이미지를 확인할 수 있다. 이미지 평활화 장치(100)는 도 5(a)의 입력 이미지를 수신하고, 입력 이미지로부터 도 5(b)의 평활화 파라미터를 획득하며, 평활화 파라미터를 이용하여 입력 이미지로부터 도 5(c)의 평활화 이미지를 생성할 수 있다. 이후, 이미지 평활화 장치(100)는 평활화 이미지의 평활화 정도를 평가하고, 평활화 파라미터를 수정할 수 있다.
도 6 및 도 7은 다른 일 실시예에 따라 이미지 평활화를 수회 반복하는 이미지 평활화 장치(100)의 이미지 평활화 방법에 관한 도면이다.
도 6을 참조하면, 이미지 평활화 장치(100)는 평활화 정도를 향상시키기 위하여, 평활화부(144)에서 생성된 평활화 이미지로부터 다시 평활화 파라미터를 획득하고, 획득한 평활화 파라미터를 이용하여 평활화 과정을 반복할 수 있다. 대상 객체의 굴곡 정도가 심하여 대상 객체가 구겨짐 및 주름 등을 포함하는 경우, 입력 이미지에 대해 수회의 평활화 처리를 반복하는 것이 효과적일 수 있다.
평활화 처리가 n번 수행될 때마다 각각 n개의 특유한 평활화 파라미터가 예측되고, n개의 평활화 이미지가 생성될 수 있다. 일 실시예에 따르면 이미지 평활화 장치(100)는 n개의 평활화 이미지 각각에 대해 평활화 정도를 평가할 수도 있다. 이로써, 이미지 평활화 장치(100)는 각 평활화 처리 단계마다 최적화된 평활화 파라미터를 이용할 수 있으므로, 평활화 정도를 향상시킬 수 있다.
일 실시예에 따르면, 이미지 평활화 장치(100)는 입력 이미지 또는 평활화부(144)에 투입될 n차 평활화 이미지를 구획별로 분할하여 복수의 서브 이미지들을 생성할 수 있다. 이미지 평활화 장치(100)는 각 서브 이미지들 대해 평활화 파라미터를 예측하고, 각 각 서브 이미지들 대해 평활화 처리를 수행할 수 있다.
이 때, 이미지 평활화 장치(100)는 복수의 서브 이미지들 모두에 대해 평활화 처리를 수행할 수도 있고, 또는 각 서브 이미지들의 평활화 파라미터 또는 평활화 정도를 고려하여, 선택적으로 서브 이미지들 일부에 대해서만 평활화 처리를 수행할 수도 있다.
이로써, 이미지 평활화 장치(100)는 입력 이미지의 각 영역별로 최적화된 평활화 파라미터를 이용하여 평활화 처리를 수행할 수 있으므로, 평활화 정도를 향상시킬 수 있다.
도 7을 참조하면, 일 실시예에 따른 이미지 평활화 장치(100)는, 제1 평활화 파라미터 예측부(142)를 통해, 입력 이미지에 대한 제1 평활화 파라미터를 예측할 수 있다. 이후, 이미지 평활화 장치(100)는 제1 평활화부(144)를 통해 제1 평활화 파라미터에 따라 입력 이미지를 평활화하여 제1 평활화 이미지를 생성할 수 있다.
이미지 평활화 장치(100)는 제2 평활화 파라미터 예측부(147)를 통해 제1 평활화 이미지에 대한 제2 평활화 파라미터를 예측할 수 있다. 이후, 이미지 평활화 장치(100)는 제2 평활화부(148)를 통해 제2 평활화 파라미터에 따라 제1 평활화 이미지를 평활화하여 제2 평활화 이미지를 생성할 수 있다.
또한, 이미지 평활화 장치(100)는 평가부(146)를 통해 제1 평활화 이미지의 평활화 정도를 평가할 수 있다. 이미지 평활화 장치(100)는 제1 평활화 이미지의 평활화 정도에 기초하여 제1 평활화 파라미터 예측부(142)를 업데이트하고, 제1 평활화 파라미터를 수정할 수 있다.
또한, 이미지 평활화 장치(100)는 평가부(146)를 통해 제2 평활화 이미지의 평활화 정도를 평가할 수 있다. 이미지 평활화 장치(100)는 제2 평활화 이미지의 평활화 정도에 기초하여 제2 평활화 파라미터 예측부(147)를 업데이트하고, 제2 평활화 파라미터를 수정할 수 있다.
제1 평활화 파라미터 예측부(142), 제2 평활화 파라미터 예측부(147), 제1 평활화부(144), 제2 평활화부(148) 및 평가부(146) 등은 기능적으로 분류된 단위체이므로, 물리적으로 반드시 분리될 필요는 없으며, 하나의 프로세서(140)에서 구현될 수도 있고, 별도의 프로세서(140)에서 구현될 수도 있다.
일 실시예에 따르면, 이미지 평활화 장치(100)는 제1 평활화 이미지를 복수의 서브이미지들로 분할하고, 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하고, 제2 평활화 파라미터를 예측한 복수의 서브이미지들 중 적어도 일부를 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득할 수 있다.
본 발명의 당업자라면 본 발명이 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로서 구현될 수 있다는 것을 잘 알 것이다. 예를 들어, 본 발명은 컴퓨터-판독가능 매체에 의해 구현될 수 있다.
컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독 가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독 가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다.
컴퓨터 판독 가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.
본 발명의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 발명의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 저장 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 발명의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
100 이미지 평활화 장치
120 사용자 인터페이스
140 프로세서
142 평활화 파라미터 예측부
144 평활화 부
146 평가부
160 메모리

Claims (12)

  1. 평활화 파라미터 예측 모델을 통해, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측하는 단계;
    상기 평활화 파라미터에 따라 상기 입력 이미지를 평활화하여 평활화 이미지를 생성하는 단계;
    상기 평활화 이미지의 평활화 정도를 평가하는 단계; 및
    상기 평활화 이미지의 평활화 정도에 기초하여, 상기 평활화 파라미터 예측 모델을 업데이트하는 단계를 포함하고,
    상기 평활화 이미지를 복수의 서브이미지들로 분할하는 단계;
    상기 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하는 단계; 및
    상기 복수의 서브이미지들 중 상기 적어도 일부를 상기 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득하는 단계를 더 포함하는,
    이미지 평활화 방법.
  2. 제1 항에 있어서,
    상기 평활화 정도는
    상기 평활화 이미지의 L1 norm 또는 Nuclear norm 값에 기초하여 평가되는
    이미지 평활화 방법.
  3. 제1 항에 있어서,
    상기 평활화 이미지의 Nuclear norm 값이 작을수록 상기 평활화 정도는 증가하는
    이미지 평활화 방법.
  4. 제1 항에 있어서,
    상기 평활화 파라미터 예측 모델은, 상기 평활화 이미지의 Nuclear norm 값이 최소화되도록 업데이트되는
    이미지 평활화 방법.
  5. 제1 항에 있어서,
    상기 평활화 파라미터는
    상기 입력 이미지 내 대상 객체에 대한 카메라의 위치 또는 상기 입력 이미지에 기초하여 획득된 대상 객체의 서피스 모델(surface model) 중 적어도 어느 하나인
    이미지 평활화 방법.
  6. 제1 항에 있어서,
    상기 평활화 이미지를 생성하는 단계에서, spatial transformation network를 이용하여 평활화 이미지가 생성되는,
    이미지 평활화 방법.
  7. 제1 항에 있어서,
    상기 평활화 파라미터 예측 모델의 상기 뉴럴 네트워크는 CNN(Convolutional Neural Network)인
    이미지 평활화 방법.
  8. 제1 항에 있어서,
    상기 평활화 파라미터 예측 모델은, 상기 입력 이미지에 기초하여 대상 객체에 관한 서피스 모델을 생성하고,
    상기 서피스 모델과, 센서를 통해 획득한 대상 객체에 대한 깊이(depth) 측정값을 비교함으로써, 업데이트되는
    이미지 평활화 방법.
  9. 평활화 파라미터 예측 모델을 통해, 학습된 뉴럴 네트워크를 이용하여 입력 이미지에 대한 제1 평활화 파라미터를 예측하는 단계;
    상기 제1 평활화 파라미터에 따라 상기 입력 이미지를 평활화하여 제1 평활화 이미지를 생성하는 단계;
    상기 평활화 파라미터 예측 모델을 통해 상기 제1 평활화 이미지에 대한 제2 평활화 파라미터를 예측하는 단계;
    상기 제2 평활화 파라미터에 따라 상기 제1 평활화 이미지를 평활화하여 제2 평활화 이미지를 생성하는 단계;
    상기 제1 평활화 이미지 및 상기 제2 평활화 이미지의 평활화 정도를 평가하는 단계;
    상기 제1 평활화 이미지 및 상기 제2 평활화 이미지의 평활화 정도에 기초하여, 상기 평활화 파라미터 예측 모델을 업데이트하는 단계; 및
    상기 제1 평활화 이미지를 복수의 서브이미지들로 분할하는 단계를 포함하고,
    상기 제2 평활화 파라미터를 예측하는 단계에서, 상기 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하고,
    상기 제2 평활화 이미지를 생성하는 단계에서, 상기 제2 평활화 파라미터를 예측한 상기 복수의 서브이미지들 중 적어도 일부를 상기 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득하는,
    이미지 평활화 방법.
  10. 삭제
  11. 이미지 평활화를 위한 장치로서,
    메모리; 및
    프로그램을 실행함으로써 뉴럴 네트워크를 처리하는 적어도 하나의 프로세서를 포함하고,
    상기 적어도 하나의 프로세서는
    학습된 상기 뉴럴 네트워크를 이용하여 입력 이미지에 대한 평활화 파라미터를 예측하는 평활화 파라미터 예측부, 상기 평활화 파라미터에 따라 상기 입력 이미지를 평활화하여 평활화 이미지를 생성하는 평활화부 및 상기 평활화 이미지의 평활화 정도를 평가하는 평가부;를 포함하고,
    상기 평활화 파라미터 예측부는 상기 평활화 정도에 기초하여, 상기 뉴럴 네트워크를 업데이트하고,
    상기 평활화 이미지를 복수의 서브이미지들로 분할하고,
    상기 복수의 서브이미지들 중 적어도 일부에 대해 제2 평활화 파라미터를 예측하고, 상기 복수의 서브이미지들 중 상기 적어도 일부를 상기 제2 평활화 파라미터에 따라 각각 평활화하여, 제2 평활화 이미지를 획득하는,
    이미지 평활화 장치.
  12. 삭제
KR1020190174290A 2019-12-24 2019-12-24 이미지 평활화 방법 및 이미지 평활화 장치 KR102240403B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190174290A KR102240403B1 (ko) 2019-12-24 2019-12-24 이미지 평활화 방법 및 이미지 평활화 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190174290A KR102240403B1 (ko) 2019-12-24 2019-12-24 이미지 평활화 방법 및 이미지 평활화 장치

Publications (1)

Publication Number Publication Date
KR102240403B1 true KR102240403B1 (ko) 2021-04-14

Family

ID=75477345

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190174290A KR102240403B1 (ko) 2019-12-24 2019-12-24 이미지 평활화 방법 및 이미지 평활화 장치

Country Status (1)

Country Link
KR (1) KR102240403B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421196A (zh) * 2021-06-08 2021-09-21 杭州逗酷软件科技有限公司 图像处理方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004040395A (ja) * 2002-07-02 2004-02-05 Fujitsu Ltd 画像歪み補正装置、方法及びプログラム
JP2018060512A (ja) * 2016-10-06 2018-04-12 株式会社アドバンスド・データ・コントロールズ 画像生成システム、プログラム及び方法並びにシミュレーションシステム、プログラム及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004040395A (ja) * 2002-07-02 2004-02-05 Fujitsu Ltd 画像歪み補正装置、方法及びプログラム
JP2018060512A (ja) * 2016-10-06 2018-04-12 株式会社アドバンスド・データ・コントロールズ 画像生成システム、プログラム及び方法並びにシミュレーションシステム、プログラム及び方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Baoguang Shi ET AL:"Robust Scene Text Recognition With Automatic Rectification", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 4168-4176(2016.06.26.) 1부.* *
Xiaoyu Li ET AL:"Document Rectification and Illumination Correction using a Patch-based CNN", Computer Science > Computer Vision and Pattern Recognition, 20 Sept. 2019(2019.09.20.) 1부.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421196A (zh) * 2021-06-08 2021-09-21 杭州逗酷软件科技有限公司 图像处理方法及相关装置
CN113421196B (zh) * 2021-06-08 2023-08-11 杭州逗酷软件科技有限公司 图像处理方法及相关装置

Similar Documents

Publication Publication Date Title
US11557085B2 (en) Neural network processing for multi-object 3D modeling
US11423695B2 (en) Face location tracking method, apparatus, and electronic device
CN106204522B (zh) 对单个图像的联合深度估计和语义标注
WO2020063475A1 (zh) 基于深度学习迭代匹配的6d姿态估计网络训练方法及装置
WO2020103647A1 (zh) 物体关键点的定位方法、图像处理方法、装置及存储介质
CN111126574B (zh) 基于内镜图像对机器学习模型进行训练的方法、装置和存储介质
CN102640168B (zh) 用于基于局部二进制模式的面部特征定位的方法和设备
US20200125947A1 (en) Method and apparatus for quantizing parameters of neural network
JP2022532460A (ja) モデル訓練方法、装置、端末及びプログラム
CN109657615B (zh) 一种目标检测的训练方法、装置及终端设备
WO2016054779A1 (en) Spatial pyramid pooling networks for image processing
CN111652250B (zh) 基于多边形的遥感影像建筑物提取方法、装置及存储介质
CN112232426B (zh) 目标检测模型的训练方法、装置、设备及可读存储介质
US20150302317A1 (en) Non-greedy machine learning for high accuracy
US10740901B2 (en) Encoder regularization of a segmentation model
CN110838122B (zh) 点云的分割方法、装置及计算机存储介质
KR102299586B1 (ko) 드론 촬영 영상의 빅데이터를 활용한 인공지능 기반 건물 시공법 도출 방법, 장치 및 시스템
US9165213B2 (en) Information processing apparatus, information processing method, and program
US20220366259A1 (en) Method, apparatus and system for training a neural network, and storage medium storing instructions
JP2023502140A (ja) タスク固有のデータ利用のための物理学により誘導されたディープマルチモーダル埋め込みのための方法及び装置
KR102240403B1 (ko) 이미지 평활화 방법 및 이미지 평활화 장치
CN113643311B (zh) 一种对边界误差鲁棒的图像分割方法和装置
KR102299295B1 (ko) 드론 촬영 영상의 빅데이터를 활용한 인공지능 기반 건물 유지 보수 견적 산출 방법, 장치 및 시스템
US20220076018A1 (en) Determining Regions of Interest for Photographic Functions
KR20220079428A (ko) 비디오에서 객체를 검출하는 방법 및 장치