WO2023121161A1

WO2023121161A1 - 모션 증폭 장치 및 이를 사용하는 방법

Info

Publication number: WO2023121161A1
Application number: PCT/KR2022/020641
Authority: WO
Inventors: 오태현; 김성빈; 박상혁; 이래경; 서준영
Original assignee: 주식회사 포스코; 재단법인 포항산업과학연구원; 포항공과대학교 산학협력단
Priority date: 2021-12-21
Filing date: 2022-12-16
Publication date: 2023-06-29
Also published as: KR20230094678A

Abstract

실시예에 따른 모션 증폭 장치는, 영상 내에서 임의의 인접하는 제1 프레임 및 제2 프레임을 수신하고, 제1 프레임을 제1 형상 정보 및 제1 텍스쳐 정보로 분해하고, 제2 프레임을 제2 형상 정보 및 제2 텍스쳐 정보로 분해하는 인코더, 제1 형상 정보, 제2 형상 정보, 및 제2 텍스쳐 정보에 기초하여 모션이 증폭된 프레임을 생성하는, 제1 모듈, 제1 형상 정보, 제2 형상 정보, 및 제1 텍스쳐 정보에 기초하여 모션의 크기를 분석하는, 제2 모듈, 그리고 모션이 증폭된 프레임 상에 모션의 크기를 표시하는 증폭 영상 데이터를 생성하는 제3 모듈을 포함한다.

Description

모션 증폭 장치 및 이를 사용하는 방법

본 개시는 모션 증폭 장치 및 이를 사용하는 방법에 관한 것이다.

산업 현장에서 사용되는 설비에서 문제가 발생한 경우에 이상 진동 혹은 거동이 발생한다. 예컨대, 노후화된 회전체 설비의 경우 회전 방향이 아닌, 회전 축 방향으로의 이상 진동이 발생할 수 있다. 보편적으로, 검사자가 육안으로 설비의 결함을 체크하는 방법이 사용되나, 이는 진동 주파수가 높을 경우 진동의 크기를 확인하기 어렵고, 검사자의 주관에 따라 판단이 달라질 수 있으며, 장기적인 모니터링이 번거롭다는 문제가 있다.

이에 따라, 설비들의 결함을 시각화하기 위하여 미세 모션을 증폭시켜 시각화 하는 모션 증폭 기술(motion magnification)이 사용된다. 모션 증폭 기술은 일반적으로 공간 상에서 고정되어 있는 각 지점을 통과하는 물체의 물리량 변화로부터 움직임을 추정하는 오일러리안 방법(Eulerian)을 사용한다.

모션 증폭 기술은 설비의 결함 여부를 판단하기 위한 필수적인 요소인 모션의 크기에 대한 정확한 수치적인 값을 제공하지 않는다는 문제가 있다.

또한, 종래의 모션 증폭 장치를 통해 증폭된 모션의 크기가 미리 설정한 증폭 계수와 동일하지 않는다는 문제가 있다. 더 나아가, 증폭된 영상의 품질이 좋지 못하다는 단점이 있다.

본 개시는 상기와 같은 문제점을 해결하기 위한 것으로, 설비의 모션 증폭과 함께 모션의 수치적인 값을 제공하기 위한 것을 목적으로 한다.

본 개시는 물체의 모션을 증폭하여 시각적으로 나타내면서 동시에 모션을 정량적으로 분석하기 위한 것이다.

일 실시예에 따른 모션 증폭 장치는, 영상 내에서 임의의 인접하는 제1 프레임 및 제2 프레임을 수신하고, 제1 프레임을 제1 형상 정보 및 제1 텍스쳐 정보로 분해하고, 제2 프레임을 제2 형상 정보 및 제2 텍스쳐 정보로 분해하는 인코더, 제1 형상 정보, 제2 형상 정보, 및 제2 텍스쳐 정보에 기초하여 모션이 증폭된 프레임을 생성하는, 제1 모듈, 제1 형상 정보, 제2 형상 정보, 및 제1 텍스쳐 정보에 기초하여 모션의 크기를 분석하는, 제2 모듈, 그리고 모션이 증폭된 프레임 상에 모션의 크기를 표시하는 증폭 영상 데이터를 생성하는 제3 모듈을 포함한다.

제1 모듈은, 제1 형상 정보와 제2 형상 정보의 차이에 미리 설정된 증폭 계수를 곱하여, 새로운 형상 정보를 생성하고 생성한 형상 정보, 제1 형상 정보, 및 제2 텍스쳐 정보를 합성하여 모션이 증폭된 프레임을 생성할 수 있다.

제2 모듈은, 제1 형상 정보 및 제2 형상 정보에 기초하여 제1 프레임 및 제2 프레임 간의 각각의 픽셀 변화를 계산하고, 계산한 각각의 픽셀 변화에 따라 물체의 모션의 크기를 분석하도록 구성될 수 있다.

제2 모듈은, 입력된 임의의 프레임들의 형상 정보로부터 모션의 크기를 분석하도록 학습된 콘볼루션 신경망(Convolutional Neural Network, CNN)을 사용하여 물체의 모션의 크기를 분석하도록 구성될 수 있다.

물체에 대한 진동 임계치를 저장하고 있는 메모리, 및 증폭 영상 데이터를 출력하는 출력부를 더 포함하고, 제3 모듈은, 모션의 크기가 진동 임계치를 초과하면, 임계치를 초과하는 모션이 검출된 영역이 확인이 필요한 위험 영역이라고 판단하고, 증폭 영상 데이터 상에 위험 영역을 표시하도록 증폭 영상 데이터를 생성할 수 있다.

일 실시예에 따른 모션 증폭 방법은, 영상 내에서 임의의 인접하는 제1 프레임 및 제2 프레임을 수신하고, 제1 프레임을 제1 형상 정보 및 제1 텍스쳐 정보로 분해하고, 제2 프레임을 제2 형상 정보 및 제2 텍스쳐 정보로 분해하는 단계, 제1 형상 정보, 제2 형상 정보, 및 제2 텍스쳐 정보에 기초하여 모션이 증폭된 프레임을 생성하는 단계, 제1 형상 정보, 제2 형상 정보, 및 제1 텍스쳐 정보에 기초하여 모션의 크기를 분석하는 단계, 그리고 모션이 증폭된 프레임 상에 모션의 크기를 표시하는 증폭 영상 데이터를 생성하는 단계를 포함한다.

모션이 증폭된 프레임을 생성하는 단계는, 제1 형상 정보와 제2 형상 정보의 차이에 미리 설정된 증폭 계수를 곱하여, 새로운 형상 정보를 생성하고 생성한 형상 정보, 제1 형상 정보, 및 제2 텍스쳐 정보를 합성하여 모션이 증폭된 프레임을 생성하는 단계를 포함할 수 있다.

모션의 크기를 분석하는 단계는, 제1 형상 정보 및 제2 형상 정보에 기초하여 제1 프레임 및 제2 프레임 간의 각각의 픽셀 변화를 계산하고, 계산한 각각의 픽셀 변화에 따라 물체의 모션의 크기를 분석하는 단계를 포함할 수 있다.

모션의 크기를 분석하는 단계는, 입력된 임의의 프레임들의 형상 정보로부터 모션의 크기를 분석하도록 학습된 콘볼루션 신경망(Convolutional Neural Network, CNN)을 사용하여 물체의 모션의 크기를 분석하는 단계를 더 포함할 수 있다.

모션이 증폭된 프레임을 생성하는 단계는, 모션의 크기가 물체에 대해 미리 저장된 진동 임계치를 초과하면, 임계치를 초과하는 모션이 검출된 영역이 확인이 필요한 위험 영역이라고 판단하고, 증폭 영상 데이터 상에 위험 영역을 표시하도록 증폭 영상 데이터를 생성하는 단계를 포함할 수 있다.

일 실시예에 따른 기록 매체는, 모션 증폭 방법을 수행하는 프로그램이 저장되어 있을 수 있다.

일 실시예에 따른 프로그램은, 모션 증폭 방법을 수행하도록 기록 매체에 저장될 수 있다.

본 개시에 따른 실시 예들 중 적어도 하나에 의하면, 더 정확한 모션 증폭 결과를 획득할 수 있다.

본 개시에 따른 실시 예들 중 적어도 하나에 의하면, 물체의 모션 분석이 용이하다.

본 개시에 따른 실시 예들 중 적어도 하나에 의하면, 물체에서 확인이 필요한 부분을 시각적으로 나타낼 수 있다.

도 1은 본 발명의 일 실시예에 따른 모션 증폭 시스템의 블록도이다.

도 2는 본 발명의 모션 증폭 장치의 제어부의 블록도이다.

도 3은 본 발명에 따른 모션 증폭 방법의 순서도이다.

도 4는 본 발명에 따른 모션 증폭 장치의 출력부에 나타난 화면의 일 예시를 도시한 도면이다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 동일하거나 유사한 구성요소에는 동일, 유사한 도면 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

본원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 첨부한 도면들을 참조하여 본 발명의 실시 예를 상세히 설명하기로 한다.

모션 증폭 시스템(1)은 카메라(10) 및 모션 증폭 장치(20)를 포함한다.

카메라(10) 및 모션 증폭 장치(20)는 네트워크를 통해 연결될 수 있다.

본 발명에서 네트워크는 장치들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 LAN(local area network), WAN(wide area network), BBN(broadband network), WLAN(wireless LAN), LTE(Long Term Evolution, LTE), LTE-A(LTE Advanced), CDMA(Code-Division Multiple Access, CDMA), WCDMA(Wideband Code Division Multiplex Access), UMTS(Universal Mobile Telecommunication System), WiBro(Wireless Broadband), GSM(Global System for Mobile Communications), BLE(Bluetooth Low Energy), 블루투스(Bluetooth), Zigbee, UWB (Ultra-WideBand), ANT, Wi-fi, IrDA(infrared data association), PAN (Personal Area Network) 등이 포함되나, 이에 한정되지는 않는다.

카메라(10)는 모션을 분석하고자 하는 물체를 촬영하는 장치로, CCD(Charge Coupled Device), CMOS(Complementary Metal Oxide Semiconductor) 등의 다양한 형상의 이미지 센서를 구비할 수 있다. 예를 들어, 카메라(10)는 조업 현장에서는 설비를 촬영할 수 있다.

카메라(10)는 물체에 대한 영상을 실시간으로 획득할 수 있다. 카메라(10)를 통해 촬영한 영상은 네트워크를 통해 모션 증폭 장치(2)에 전송될 수 있다.

모션 증폭 장치(20)는 카메라(10)로부터 수신한 영상을 분석하여, 영상 내에 존재하는 미세 모션을 검출하고, 검출한 미세 모션을 증폭 및 분석하는 장치이다.

모션 증폭 장치(20)는, 통신부(210), 제어부(230), 메모리부(250), 및 출력부(270)를 포함한다.

통신부(210)는, 네트워크를 통해 카메라(10)와 통신하기 위한 것이다. 통신부(210)는 카메라(10)로부터 수신되는 영상을 제어부(230)로 전달할 수 있다.

제어부(230)는, 메모리부(250)에 저장되어 있는 이미지를 학습하는 인공 신경망을 포함할 수 있다.

인공 신경망은 복수의 레이어를 포함하며, 복수의 레이어는 가중치가 적용되는 복수의 연산을 통해 연결된다. 다시 말하자면, 인공 신경망은 가중치가 적용되는 복수의 연산을 포함하는 복수의 레이어를 포함한다. 여기서, 복수의 연산을 포함하는 복수의 레이어는 컨볼루션 연산을 수행하는 컨볼루션 레이어(convolution layer), 다운 샘플링 연산을 수행하는 풀링 레이어(pooling layer), 업샘플링(Up Sampling) 연산을 수행하는 언풀링(UL: Unpooling Layer) 레이어, 디컨볼루션 연산을 수행하는 디컨볼루션 레이어(DL: Deconvolution Layer) 등을 포함할 수 있다.

한편, 인공 신경망을 학습시키는 것은, 예측된 출력을 생성하기 위해 신경망에 알려진 출력을 갖는 입력을 제공하고, 신경망을 통해 예측된 출력과 알려진 출력을 비교하여 그 차이값이 감소되도록 인공 신경망의 알고리즘을 수정하는 것을 의미한다. 예를 들어, 인공 신경망은 경사하강법(Gradient decent) 방식으로 학습될 수 있다. 이는, 수차례에 걸쳐 반복될 수 있으며, 반복되면서 인공 신경망은 더욱 정확한 출력을 낼 수 있다.

제어부(230)는, 인공 신경망을 사용하여 복수의 프레임을 포함하는 영상 내에 시간에 따른 미세 모션을 검출하고, 검출한 미세 모션을 증폭시킬 수 있다. 제어부(230)는 증폭된 미세 모션이 포함된 증폭 영상을 생성할 수 있다. 증폭 영상은, 전달받은 영상 내에서 미세 모션이 검출된 영역이 강조된 영상이다. 즉, 증폭 영상은 미리 설정된 증폭 계수에 따라 미세 모션이 증폭되어 재구성된 영상이다. 증폭 영상은, 복수의 증폭된 영상 프레임으로 구성될 수 있다.

제어부(230)는 인공 신경망을 사용하여 픽셀 별 이동 변위를 분석할 수 있다. 또한, 제어부(230)는 분석한 픽셀 별 이동 변위를 통해 미세 모션의 진동 크기를 도출할 수 있다. 이하에서는, 픽셀 별 이동 변위를 미세 모션의 크기라고 한다. 제어부(230)는, 미세 모션의 크기가 영상 내에 함께 표시되도록 데이터를 생성할 수 있다. 더 나아가, 제어부(230)는 미세 모션의 크기가 증폭 영상 내에 함께 표시되도록 증폭 영상 데이터를 생성할 수도 있다. 증폭 영상 데이터는, 분석한 미세 모션의 크기가 증폭 영상에 함께 표시되어 있는 데이터이다.

제어부(230)는 메모리부(250)에 저장되어 있는 이미지를 학습하는 것 이외에도, 생성한 증폭 영상 및 증폭 영상 데이터를 추가로 학습하는 인공 신경망을 포함할 수도 있다.

제어부(230)는, 분석한 미세 모션의 크기가 미리 설정되어 있는 임계치를 초과하는지 여부를 판단할 수 있다. 만일 미세 모션의 크기가 임계치를 초과하면, 제어부(230)는 임계치를 초과하는 미세 모션이 검출된 영역이 확인이 필요한 위험 영역이라고 판단할 수 있다.

제어부(230)는, 증폭 영상 및 증폭 영상 데이터를 출력부(300)에 전달할 수 있다.

메모리부(250)에는 카메라(10)로부터 수신한 영상, 제어부(230)가 생성한 증폭 영상, 미세 모션의 크기를 포함하는 증폭 영상 데이터, 제어부(230)의 인공 신경망을 학습시키는 데에 필요한 임의의 데이터 세트, 설비 당 진동의 임계치 등이 저장되어 있다. 여기서, 메모리부(250)는 모션 증폭 장치(20) 내에 위치하는 것으로 기술하였으나, 모션 증폭 장치(20) 외부에 위치하여 모션 증폭 장치(20)와 통신하는 별도의 데이터베이스일 수도 있다.

출력부(270)는 제어부(230)로부터 전달받은 데이터를 출력하는 디스플레이일 수 있다. 예를 들어, 출력부(270)는 증폭 영상, 증폭 영상 데이터를 출력할 수 있다. 또한, 출력부(270)는 카메라(10)로부터 수신한 영상 내에 모션의 크기가 표시된 영상을 출력할 수도 있다.

사용자는 출력부(270)를 통해 카메라(10)가 촬영하고 있는 물체가 확인이 필요한지 여부를 판단할 수 있다.

도 2는 본 발명의 모션 증폭 장치의 제어부의 구성을 도시한 도면이다.

제어부(230)는, 인코더(Encoder)(231), 제1 모듈(233), 제2 모듈(235), 및 제3 모듈(237)을 포함한다.

인코더(231)는 입력받은 프레임을 형상 정보(Shape) 및 텍스쳐 정보(Texture)로 분해하는 구성이다. 구체적으로, 인코더(231)는 입력받은 2개의 프레임 각각에 대해 공간상 분해(Spatial Decomposition)하여, 각각의 프레임에 대한 형상 정보(Shape n) 및 텍스쳐 정보(Texture n)를 획득할 수 있다.

인코더(231)는, 메모리부(250)로부터 임의의 인접한 2개의 프레임과 2개의 프레임에 대한 형상 정보와 텍스쳐 정보를 입력받을 수 있다. 인코더(231)는 입력받은 프레임을 형상 정보와 텍스쳐 정보로 분해하도록 제약 항(regularization term)을 만족하도록 학습될 수 있다. 제약 항은, 예를 들어, 형상 정보를 분해하기 위해 하나의 프레임 내에서 텍스쳐가 변하더라도 형상 정보는 동일해야 한다는 제약, 텍스쳐 정보를 분해하기 위해 인접한 2개의 프레임 내의 텍스쳐는 동일해야 한다는 등의 제약을 포함할 수 있다. 인코더(231)는 메모리부(250)로부터 전달받은 2개의 프레임에 대해, 이미 공지된 형상 정보와 텍스쳐 정보를 출력할 때까지 학습될 수 있다.

이후, 학습된 인코더(231)는, 통신부(210)로부터 전달받은 영상 내에서 임의의 인접한 2개의 프레임(Frame n, Frame n+1)을 입력받을 수 있다. 인코더(231)는 각각의 프레임에 대해 분해한 형상 정보(Shape n, Shape n+1) 및 텍스쳐 정보(Texture n, Texture n+1)를 제1 모듈(233) 및 제2 모듈(235)에 전달할 수 있다.

제1 모듈(233)은 인코더(231)로부터 수신한 프레임에 대한 증폭 프레임을 생성하는 구성으로, 증폭기(Manipulator)(2331) 및 디코더(Decoder)(2333)를 포함한다.

증폭기(2331)는 형상 정보(Shape n, Shape n+1) 간의 차이, 즉 미세 모션을 증폭시키는 구성이다. 구체적으로, 증폭기(2331)는 인코더(231)로부터 연속적인 두 프레임에 대하여 각각 분해된 형상 정보들(Shape n, Shape n+1)을 입력받은 후, 형상 정보의 차이를 구할 수 있다. 이후, 증폭기(2331)는 형상 정보 간의 차이에 특정 증폭 계수(α)를 곱하여, 증폭된 미세 모션을 포함하는 새로운 형상 정보(Shape n+1')를 생성할 수 있다. 여기서, 증폭 계수(α)는 미리 설정된 계수일 수 있다.

증폭기(2331)는 새로운 형상 정보(Shape n+1')를 디코더(2333)에 전달할 수 있다.

디코더(2333)는 텍스쳐 정보와 형상 정보를 하나의 프레임으로 합성하는 구성이다.

구체적으로, 디코더(2333)는 인코더(231)에 의해 분해된 텍스쳐 정보(Texture n+1) 및 증폭기(2331)에 의해 증폭된 형상 정보(Shape n+1')를 하나의 프레임으로 합성하여, 전역적으로 움직임이 증폭된 프레임(Frame n+1')을 생성할 수 있다.

제2 모듈(235)은 인코더(231)로부터 수신한 프레임 간의 미세 모션의 크기를 분석하기 위한 구성이다. 구체적으로, 제2 모듈(235)은 인코더(231)에 입력된 연속된 2개의 프레임에 대하여 옵티컬 플로(Optical Flow) 기술을 적용하여 모든 픽셀에서의 움직임을 계산한 결과를 나타낸 플로 맵(Flow map)을 생성함으로써, 미세 모션의 크기를 분석할 수 있다.

옵티컬 플로 기술은, 물체의 공간 및 시간 좌표에 대한 편도 함수를 계산함으로써 프레임 내에서 공간적으로 이동하는 물체에 대한 모션 정보, 예를 들면 순간 속도를 추정하는 기술이다. 구체적으로, 옵티컬 플로 기술은, 인접한 프레임 간의 픽셀의 변화와 인접한 프레임 간의 시간 간격을 이용하여, 입력된 2개의 프레임 사이의 대응성을 찾아 두 프레임 내의 물체의 모션에 대한 정보, 예컨대 모션의 크기(motion intensity)를 획득할 수 있다. 이러한 옵티컬 플로 기술은 라그랑지안 방법에 속한다.

제2 모듈(235)은 학습된 인공 신경망을 사용하여 물체의 모션의 크기를 분석할 수 있다. 한편, 도 2에서는, 제2 모듈(235)이 미세 모션의 크기를 분석하는 경우에 콘볼루션 신경망(Convolutional Neural Network, CNN)(2351) 모델을 사용하는 것으로 도시되어 있으나, 이에 한정되는 것은 아니며 제2 모듈(235)은 임의의 인공 신경망을 사용할 수 있다.

CNN(2351)은 컨볼루션 레이어로 구성된 인공 신경망이다. CNN(2351)은 메모리부(250)로부터 전달받은 임의의 데이터 세트를 통해 모션의 크기를 분석하도록 학습될 수 있다. CNN(2351)은 분석 결과와 정답 간의 차이인 손실값이 기준값 이하가 될 때까지 학습될 수 있다.

제2 모듈(235)은 학습된 CNN(2351)을 통해 인코더(231)로부터 입력받은 프레임들의 형상 정보 간의 모션의 크기 값을 분석할 수 있다. 즉, 플로 맵은 사전 학습된 CNN(2351)에 프레임들을 입력하여 획득한 값일 수 있다.

정리하면, 제2 모듈(235)에는 형상 정보(Shape n, Shape n+1), 및 텍스쳐 정보(Texture n)가 입력되어 2개의 형상 정보(Shape n, Shape n+1) 간 픽셀 변화를 계산하여 각 픽셀 별 이동 변위의 정량 분석을 할 수 있다.

상술한 바와 같이, 제2 모듈(235)은 인공 신경망을 사용하여 카메라(10)로부터 통신부(210)를 통해 수신된 프레임 내의 물체의 모션의 크기를 분석할 수 있다.

결론적으로, 모션 증폭 장치(20)는 제1 모듈(233)을 통해 증폭 영상을 생성하고, 제2 모듈(235)을 통해 물체에 대한 모션의 크기를 분석하여 플로 맵을 생성할 수 있다.

제3 모듈(237)은 제1 모듈(233)에 의해 모션이 증폭된 프레임 상에, 제2 모듈(235)에 의해 분석된 모션의 크기를 표시하는 증폭 영상 데이터를 생성할 수 있다. 제3 모듈(237)은 또한 분석한 물체의 이동 변위가 특정 임계값을 초과하는 경우에, 임계값을 초과하는 진동을 가지는 부분에 경고 표시를 더 표시하는 증폭 영상 데이터를 생성할 수 있다.

다만, 딥러닝을 사용하여 모션이 증폭된 증폭 영상을 생성하는 방법에서, 인코더에 단순히 제약 항을 추가하여 학습시키는 것만으로는 프레임을 완벽하게 형상 정보와 텍스쳐 정보로 분해하기가 어려울 수 있다. 프레임을 형상 정보와 텍스쳐 정보로 완전히 분해하지 못하면, 미세 모션을 가지는 물체의 경계와 배경이 함께 증폭되어 불안정하게 흔들리는 워블 이펙트(Wobble effect)가 발생할 수 있다. 이 경우에는, 정확한 모션 크기 측정이 불가하므로, 미리 설정된 증폭 계수와 일치하지 않는 증폭 영상을 출력할 수 있다.

반면에, 모션 증폭 장치(20)는 인코더(231)의 출력인 형상 정보(Shape n, Shape n+1)와 텍스쳐 정보(Texture n, Texture n+1)를 오일러리안 방법 기반의 모션 증폭 모델인 제1 모듈(233) 뿐만 아니라 라그랑지안 방법 기반의 옵티컬 플로 모델인 제2 모듈(235)에 제공한다.

모션 증폭 장치(20)는, 하나의 데이터로 제1 모듈(233)과 제2 모듈(235) 모두를 학습시키는 것이 가능하므로, 데이터 효율적이다.

이후, 제1 모듈(233)에 제2 모듈(235)의 출력인 플로 맵에 대한 정보를 제공함으로써, 인코더(231)는 입력된 프레임에 대해 플로 맵에 따라 형상 정보와 텍스쳐 정보를 완전히 분해할 수 있으므로, 워블 이펙트가 발생할 가능성이 낮다. 또한, 제2 모듈(235)을 통해 물체의 모션에 대한 크기를 정확하게 분석할 수 있어서, 제1 모듈(233)의 증폭하고자 하는 증폭 계수의 크기와 일치하는 증폭 영상을 획득할 수 있다.

도 3은 본 발명에 따른 모션 증폭 방법의 순서도이다.

먼저, 인코더(231)는, 제n 프레임 및 제n+1 프레임을 수신(S301)한다.

제n 프레임과 제n+1 프레임은 인접하는 프레임일 수 있다. 또한, 인코더(231)는 메모리부(250)에 미리 저장되어 있는 임의의 데이터 세트를 사용하여 인코더(231)에 입력된 프레임을 형상 정보 및 텍스쳐 정보로 분해하도록 학습되어 있을 수 있다.

그 다음, 인코더(231)는 제n 프레임을 제n 형상 정보 및 제n 텍스쳐 정보로 분해하고, 제n+1 프레임을 제n+1 형상 정보 및 제n+1 텍스쳐 정보로 분해(S303)한다. 인코더(231)는 분해한 제n 형상 정보 및 제n 텍스쳐 정보, 및 제n+1 형상 정보 및 제n+1 텍스쳐 정보를 제1 모듈(233) 및 제2 모듈(235)에 전달할 수 있다.

제1 모듈(233)은, 제n 형상 정보 및 제n+1 형상 정보 간의 차이에 증폭 계수를 곱하여 증폭된 제n+1’ 형상 정보를 생성(S305)한다.

제1 모듈(233)은, 증폭된 제n+1’ 형상 정보, 제n 형상 정보, 및 제n+1 텍스쳐 정보를 합성하여 모션이 증폭된 제n+1 프레임을 생성(S307)한다. 따라서, 제1 모듈(233)은 모션이 강조된 증폭 영상을 생성할 수 있다.

이와 동시에, 제2 모듈(235)은, 제n 형상 정보 및 제n+1 형상 정보에 기초하여 제n 프레임 및 제n+1 프레임 간의 각각의 픽셀 변화를 계산(S309)한다.

제2 모듈(235)은 계산한 각각의 픽셀 변화에 따라 이동 변위를 정량 분석(S311)한다.

이후, 제3 모듈(237)은, 출력부(270)를 통해 모션이 증폭된 제n+1 프레임 상에 수치화된 이동 변위를 표시(S313)한다.

제3 모듈(237)은 출력부(270)를 통해 분석한 물체의 이동 변위가 특정 임계값을 초과하는 경우에, 임계값을 초과하는 진동을 가지는 부분에 경고 표시를 함께 표시한다. 이 때, 특정 임계값은, 메모리(250)에 미리 저장되어 있는 설비 당 진동의 임계치일 수 있다.

도 4는 카메라가 회전하는 설비를 촬영하는 경우에 모션 증폭 장치의 출력부에 나타난 화면의 일 예시를 도시한 도면이다.

도 4의 (a)는, 카메라(10)가 y축을 기준으로 회전하는 설비를 촬영하는 경우에 카메라(10)가 촬영한 영상 중 하나의 프레임을 나타낸 화면이다. 카메라(10)는, 관찰이 필요한 설비의 문제가 되는 부분을 촬영하도록 설치되어 있을 수 있다. 이 때, 카메라(10)는 실시간으로 설비에 대한 영상을 촬영하여 네트워크를 통해 모션 증폭 장치(20)에 전송할 수 있다.

여기서 문제가 되는 부분은, 설비가 회전 축과 평행하게, 즉 y축 방향으로 진동할 수 있는 부분이다. 축 방향에 평행한 모션은 설비에게는 바람직하지 않은 거동으로서, 관찰할 필요성이 있다.

모션 증폭 장치(20)는, 카메라(10)로부터 영상을 수신하여 제1 모듈(233)을 통해 축 방향에 평행한 모션을 증폭하고, 제2 모듈(235)을 통해 모션을 분석할 수 있다.

도 4의 (b)는, 증폭 영상 데이터의 일 예시이다.

도 4의 (b)에는, 제2 모듈(235)을 통해 분석한 설비의 모션에 대한 이동 변위가 제1 모듈(233)이 생성한 증폭 영상에 함께 표시되어 있다. 예를 들어, y축 방향으로의 설비의 거동이 표시될 수 있다.

도 4의 (c)는, 물체가 임계값을 초과하는 진동을 가지는 부분에 경고 표시가 나타난 증폭 영상 데이터의 일 예시이다.

메모리부(250)에는 카메라(10)가 촬영하고 있는 설비가 안전하게 작동하고 있는 경우에 발생할 수 있는 진동의 임계치가 저장되어 있을 수 있다. 설비가 미리 저장되어 있는 진동의 임계치를 초과하여 진동하는 경우에, 안전하지 않은 상태일 수 있다. 제어부(230)는, 설비가 y축 방향으로 특정 임계값을 초과하여 진동하는 경우에, 해당 부분에 경고 표시를 함께 표시할 수 있다.

본 개시에 따른 모션 증폭 장치에 따르면, 설비의 진동을 증폭하고 화면에 시각화하여 육안으로 파악이 가능하다.

또한, 본 개시에 따른 모션 증폭 장치에 따르면, 결함이 의심되는 설비의 모션 크기를 정량적으로 분석 가능하다. 설비의 진동 크기를 정량적으로 측정하여 측정된 결과에 따라 결함 정도를 파악할 수 있다.

또한, 본 개시에 따른 모션 증폭 장치에 따르면, 접촉식 센서를 대체하여 경제적인 이점이 있다. 고가의 국부 진단 분석 및 계측을 위한 접촉식 센서를 GPU와 카메라로 대체하여 비용을 절감할 수 있다. 나아가, 접촉식과 다르게 단일 이동형 센서인 카메라를 사용하기 때문에, 광역적인 범위에 대해 직관적인 진단이 가능하며, 적은 수의 센서로 다수의 설비 진단이 가능하다. 이에 따라, 각종 산업 현장에서 이용되는 설비들의 결함을 정확하게 모니터링하여 안전한 시설 결함의 조기 진단이 가능하다.

이상 설명된 실시예들은 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형상으로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이 때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리부 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.

실시예들에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예를 들어, 등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 이로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 통상의 기술자는 특허청구범위 또는 그 균등물의 범주 내에서 다양한 수정, 조합 및 변경이 이루어질 수 있음을 알 수 있다.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였으나, 본 발명의 권리범위가 이에 한정되는 것은 아니며 본 발명이 속하는 분야에서 통상의 지식을 가진 자가 여러 가지로 변형 및 개량한 형상 또한 본 발명의 권리범위에 속한다.

Claims

영상 내에서 임의의 인접하는 제1 프레임 및 제2 프레임을 수신하고, 상기 제1 프레임을 제1 형상 정보 및 제1 텍스쳐 정보로 분해하고, 상기 제2 프레임을 제2 형상 정보 및 제2 텍스쳐 정보로 분해하는 인코더,

상기 제1 형상 정보, 상기 제2 형상 정보, 및 상기 제2 텍스쳐 정보에 기초하여 모션이 증폭된 프레임을 생성하는, 제1 모듈,

상기 제1 형상 정보, 상기 제2 형상 정보, 및 상기 제1 텍스쳐 정보에 기초하여 상기 모션의 크기를 분석하는, 제2 모듈, 그리고

상기 모션이 증폭된 프레임 상에 상기 모션의 크기를 표시하는 증폭 영상 데이터를 생성하는 제3 모듈

을 포함하는 모션 증폭 장치.
제1항에 있어서,

상기 제1 모듈은, 상기 제1 형상 정보와 상기 제2 형상 정보의 차이에 미리 설정된 증폭 계수를 곱하여, 새로운 형상 정보를 생성하고 생성한 형상 정보 및 상기 제2 텍스쳐 정보를 합성하여 상기 모션이 증폭된 프레임을 생성하는,

모션 증폭 장치.
제2항에 있어서,

상기 제2 모듈은, 상기 제1 형상 정보 및 상기 제2 형상 정보에 기초하여 상기 제1 프레임 및 상기 제2 프레임 간의 각각의 픽셀 변화를 계산하고, 계산한 각각의 픽셀 변화에 따라 상기 물체의 모션의 크기를 분석하도록 구성된,

모션 증폭 장치.
제3항에 있어서,

상기 제2 모듈은, 입력된 임의의 프레임들의 형상 정보로부터 모션의 크기를 분석하도록 학습된 콘볼루션 신경망(Convolutional Neural Network, CNN)을 사용하여 상기 물체의 모션의 크기를 분석하도록 구성되는,

모션 증폭 장치.
제3항에 있어서,

상기 물체에 대한 진동 임계치를 저장하고 있는 메모리, 및

상기 증폭 영상 데이터를 출력하는 출력부를 더 포함하고,

상기 제3 모듈은, 상기 모션의 크기가 상기 진동 임계치를 초과하면, 임계치를 초과하는 모션이 검출된 영역이 확인이 필요한 위험 영역이라고 판단하고, 상기 증폭 영상 데이터 상에 상기 위험 영역을 표시하도록 상기 증폭 영상 데이터를 생성하는,

모션 증폭 장치.
영상 내에서 임의의 인접하는 제1 프레임 및 제2 프레임을 수신하고, 상기 제1 프레임을 제1 형상 정보 및 제1 텍스쳐 정보로 분해하고, 상기 제2 프레임을 제2 형상 정보 및 제2 텍스쳐 정보로 분해하는 단계,

상기 제1 형상 정보, 상기 제2 형상 정보, 및 상기 제2 텍스쳐 정보에 기초하여 모션이 증폭된 프레임을 생성하는 단계,

상기 제1 형상 정보, 상기 제2 형상 정보, 및 상기 제1 텍스쳐 정보에 기초하여 상기 모션의 크기를 분석하는 단계, 그리고

상기 모션이 증폭된 프레임 상에 상기 모션의 크기를 표시하는 증폭 영상 데이터를 생성하는 단계

를 포함하는, 모션 증폭 방법.
제6항에 있어서,

상기 모션이 증폭된 프레임을 생성하는 단계는,

상기 제1 형상 정보와 상기 제2 형상 정보의 차이에 미리 설정된 증폭 계수를 곱하여, 새로운 형상 정보를 생성하고 생성한 형상 정보 및 상기 제2 텍스쳐 정보를 합성하여 상기 모션이 증폭된 프레임을 생성하는 단계를 포함하는,

모션 증폭 방법.
제7항에 있어서,

상기 모션의 크기를 분석하는 단계는,

상기 제1 형상 정보 및 상기 제2 형상 정보에 기초하여 상기 제1 프레임 및 상기 제2 프레임 간의 각각의 픽셀 변화를 계산하고, 계산한 각각의 픽셀 변화에 따라 상기 물체의 모션의 크기를 분석하는 단계를 포함하는,

모션 증폭 방법.
제8항에 있어서,

상기 모션의 크기를 분석하는 단계는,

입력된 임의의 프레임들의 형상 정보로부터 모션의 크기를 분석하도록 학습된 콘볼루션 신경망(Convolutional Neural Network, CNN)을 사용하여 상기 물체의 모션의 크기를 분석하는 단계를 더 포함하는,

모션 증폭 방법.
제9항에 있어서,

상기 모션이 증폭된 프레임을 생성하는 단계는,

상기 모션의 크기가 상기 물체에 대해 미리 저장된 진동 임계치를 초과하면, 임계치를 초과하는 모션이 검출된 영역이 확인이 필요한 위험 영역이라고 판단하고, 상기 증폭 영상 데이터 상에 상기 위험 영역을 표시하도록 상기 증폭 영상 데이터를 생성하는 단계를 포함하는,

모션 증폭 방법.
제6항 내지 제10항 중 어느 한 항에 따른 방법을 수행하는 프로그램이 저장되어 있는, 기록 매체.
제6항 내지 제10항 중 어느 한 항에 따른 방법을 수행하도록 기록 매체에 저장되는, 프로그램.