KR102593285B1 - 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치 - Google Patents

표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치 Download PDF

Info

Publication number
KR102593285B1
KR102593285B1 KR1020180014769A KR20180014769A KR102593285B1 KR 102593285 B1 KR102593285 B1 KR 102593285B1 KR 1020180014769 A KR1020180014769 A KR 1020180014769A KR 20180014769 A KR20180014769 A KR 20180014769A KR 102593285 B1 KR102593285 B1 KR 102593285B1
Authority
KR
South Korea
Prior art keywords
survey data
value
image
sample
sample survey
Prior art date
Application number
KR1020180014769A
Other languages
English (en)
Other versions
KR20190095007A (ko
Inventor
김지용
김성수
민옥기
정문영
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020180014769A priority Critical patent/KR102593285B1/ko
Publication of KR20190095007A publication Critical patent/KR20190095007A/ko
Application granted granted Critical
Publication of KR102593285B1 publication Critical patent/KR102593285B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Image Processing (AREA)

Abstract

표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치가 제공된다. 공간적 연관성이 있는 시계열 데이터인 표본 조사 데이터가 가시화되어 표본 조사 데이터 이미지가 획득되며, 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 이용하여 상기 표본 조사 데이터 이미지가 보간된다. 이후, 보간된 표본 조사 데이터 이미지를 수치화하여 대응하는 시계열 데이터를 추정한다.

Description

표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치{Method and apparatus for expanding sample survey data into total survey data}
본 발명은 데이터 확장에 관한 것으로, 더욱 상세하게 말하자면, 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치에 관한 것이다.
최근 IoT(Internet of thing) 환경에서 지능형 센서의 보급으로 인해 항상 표본 조사 정도의 데이터 수집 센서 데이터는 시계열 데이터로 시간적 연관성을 갖고 있으며 또한 공간적 연관성을 갖고 있다. IoT 센서가 곳곳에 설치되면서 예전보다 지역적으로 훨씬 조밀한 데이터를 실시간에 수집할 수 있다. 하지만, 센서가 아무리 조밀하게 설치되어 있어도 대부분의 경우에는 수집되는 데이터가 지역 전체를 다 포함할 수는 없다. 예를 들어, 교통 정보 수집 장치가 교차로나 차량 통행이 많은 주요한 지역에 산발적으로 설치되어 교통량이나 평균속도를 수집할 수 있다. 이 경우, 주기적으로 가끔 전수조사를 실시하여 교통 정보 수집 장치로부터 방대한 데이터를 수집하기도 하지만, 일상적으로 수집되는 데이터는 특정 지점에 한정된다. 일상적으로 수집되는 데이터는 지역적으로 중요한 위치를 선정하여 실시간으로 수집되는 장점이 있지만, 이러한 데이터만으로는 전역적인 상황을 파악하는데 어려움이 있다.
기존의 데이터 확장 방법은 시계열적인 특성을 분석하여 측정되지 않은 시간에 대한 데이터 확장이었다.
본 발명이 해결하고자 하는 과제는 표본 조사 데이터를 확장하여 전역적인 전수 조사 데이터를 생성하는 방법 및 장치를 제공하는 것이다.
본 발명의 특징에 따른 방법은, 장치가, 데이터를 확장하는 방법으로서, 상기 장치가, 공간적 연관성이 있는 시계열 데이터인 표본 조사 데이터를 가시화하여 표본 조사 데이터 이미지를 획득하는 단계; 상기 장치가, 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 이용하여 상기 표본 조사 데이터 이미지를 보간하는 단계; 및 상기 장치가, 상기 보간된 표본 조사 데이터 이미지를 수치화하여 대응하는 시계열 데이터를 추정하는 단계를 포함한다.
상기 보간하는 단계는, 상기 기저장된 전수 조사 데이터 이미지들 각각과, 상기 표본 조사 데이터 이미지를 비교하여 비교값을 획득하는 단계; 상기 비교값을 토대로 상기 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 선택하는 단계; 및 상기 선택된 전수 조사 데이터 이미지를 이용하여 상기 표본 조사 데이터 이미지를 보간하는 단계를 포함할 수 있다.
상기 선택하는 단계는, 상기 기저장된 전수 조사 데이터 이미지들 중 가장 적은 비교값을 가지는 적어도 2개의 전수 조사 데이터 이미지를 선택할 수 있다.
상기 선택하는 단계는, 상기 장치가, 상기 기저장된 전수 조사 데이터 이미지들을 해당 비교값에 따라 오름차순으로 정렬하는 단계; 상기 정렬된 전수 조사 데이터 이미지들을 상기 표본 조사 데이터 이미지를 가운데 두고 번갈아가면서 상기 표본 조사 데이터 이미지의 전후에 배치하는 단계; 및 상기 표본 조사 데이터 이미지와 가장 가까이 배치된 적어도 2개의 전수 조사 데이터 이미지를 선택하는 단계를 포함할 수 있다.
상기 비교값은 상기 표본 조사 데이터 이미지와 상기 전수 조사 데이터 이미지의 픽셀 차이값의 제곱평균제곱근에 대응할 수 있다.
한편, 상기 보간하는 단계는, 상기 표본 조사 데이터 이미지와 상기 적어도 2개의 전수 조사 데이터 이미지를 평균하여 최종 표본 조사 데이터 이미지를 획득하는 단계를 포함할 수 있다.
이 경우, 상기 최종 표본 조사 데이터 이미지를 획득하는 단계는, 상기 표본 조사 데이터 이미지의 제1 픽셀, 전수 조사 데이터 이미지의 제2 픽셀 그리고 다른 전수 조사 데이터 이미지의 제3 픽셀과, 그리고 각 픽셀 사이의 거리를 토대로 상기 제1 픽셀의 최종값을 산출하고, 산출된 최종값을 토대로 상기 최종 표본 조사 데이터 이미지를 획득할 수 있다.
상기 제1 픽셀의 최종값은
Figure 112018013242869-pat00001
의 조건을 토대로 산출될 수 있으며, 상기 Pt 는 최종값, 상기 P는 제1 픽셀, 상기 X는 제2 픽셀, 그리고 상기 Y는 제3 픽셀을 나타내며, 상기 d1은 상기 최종값과 상기 제2 픽셀 사이의 거리, d2는 상기 최종값과 상기 제3 픽셀 사이의 거리, 그리고 w는 상기 최종값과 상기 제1 픽셀 사이의 거리를 나타낼 수 있다.
상기 표본 조사 데이터 이미지를 획득하는 단계는, 상기 표본 조사 데이터를 HSV 형식으로 수치화하고, 수치화된 HSV 값을 토대로 상기 표본 조사 데이터를 가시화할 수 있다.
상기 표본 조사 데이터가 변량 최대값에서 변량 최소값 사이의 값을 가지고, 상기 표본 조사 데이터의 값을 변량이라고 할 경우, 상기 HSV 값은 상기 변량을 상기 변량 최대값과 상기 변량 최소값의 차이로 나눈 값에, 상기 HSV값으로 표시 가능한 형식 최대값을 곱하는 것에 의해 획득될 수 있다.
상기 시계열 데이터를 추정하는 단계는, 상기 보간된 표본 조사 데이터 이미지의 HSV 값을 상기 형식 최대값으로 나눈 값에, 상기 변량 최대값과 상기 변량 최소값의 차이를 곱하는 것에 의해, 상기 보간된 표본 조사 데이터 이미지의 HSV 값에 대응하는 수치 데이터인 시계열 데이터를 획득할 수 있다.
본 발명의 다른 특징에 따른 장치는, 데이터를 확장하는 장치로서, 데이터를 입력받도록 구성된 입출력부; 전수 조사 데이터 이미지를 저장하는 메모리; 그리고 상기 입출력부와 연결되고, 표본 조사 데이터를 전수 조사 데이터로 확장처리하도록 구성된 프로세서를 포함하며, 상기 프로세서는, 상기 입출력부를 통해 제공되는, 공간적 연관성이 있는 시계열 데이터인 표본 조사 데이터를 가시화하여 표본 조사 데이터 이미지를 획득하고, 상기 메모리에 저장된 전수 조사 데이터 이미지들 중 적어도 2개를 이용하여 상기 표본 조사 데이터 이미지를 보간하며, 상기 보간된 표본 조사 데이터 이미지를 수치화하여 대응하는 시계열 데이터를 추정하도록 구성된다.
상기 프로세서는, 상기 전수 조사 데이터 이미지들 각각과, 상기 표본 조사 데이터 이미지를 비교하여 비교값을 획득하고, 상기 비교값을 토대로 상기 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 선택하며, 상기 선택된 전수 조사 데이터 이미지를 이용하여 상기 표본 조사 데이터 이미지를 보간하도록 구성될 수 있다.
상기 프로세서는, 상기 전수 조사 데이터 이미지들 중 가장 적은 비교값을 가지는 적어도 2개의 전수 조사 데이터 이미지를 선택하도록 구성될 수 있다.
상기 비교값은 상기 표본 조사 데이터 이미지와 상기 전수 조사 데이터 이미지의 픽셀 차이값의 제곱평균제곱근에 대응할 수 있다.
상기 프로세서는, 상기 표본 조사 데이터 이미지와 상기 적어도 2개의 전수 조사 데이터 이미지를 평균하여 최종 표본 조사 데이터 이미지를 획득하도록 구성될 수 있다.
상기 프로세서는, 상기 표본 조사 데이터 이미지의 제1 픽셀, 전수 조사 데이터 이미지의 제2 픽셀 그리고 다른 전수 조사 데이터 이미지의 제3 픽셀과, 그리고 각 픽셀 사이의 거리를 토대로 상기 제1 픽셀의 최종값을 산출하고, 산출된 최종값을 토대로 상기 최종 표본 조사 데이터 이미지를 획득하도록 구성될 수 있다.
상기 프로세서는, 상기 표본 조사 데이터를 HSV 형식으로 수치화하고, 수치화된 HSV 값을 토대로 상기 표본 조사 데이터를 가시화하도록 구성될 수 있다.
본 발명의 실시 예에 따르면, 전수 조사를 하지 않더라도 일부 지역의 표본 조사를 바탕으로 전체 지역에 대한 데이터 예측이 가능하다.
또한, 과거의 전수 조사 데이터를 활용하여 항상 전수 조사 수준의 데이터 관찰 및 예측이 가능하다.
또한, 전수 조사는 시간과 비용이 많이 소요되는데 반하여, 본 발명의 실시 예에 따르면 적은 비용과 적은 시간으로 표본 조사 데이터로부터 전수 조사 수준의 데이터를 획득할 수 있다.
도 1은 본 발명의 실시 예에 따른 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법의 흐름도이다.
도 2는 본 발명의 실시 예에 따른 전수 조사 데이터를 나타낸 예시도이다.
도 3은 본 발명의 실시 예에 따른 전수 조사 데이터를 나타낸 예시도이다.
도 4는 본 발명의 실시 예에 따른 전수 조사 데이터를 가시화한 것을 나타낸 예시도이다.
도 5는 본 발명의 실시 예에 따른 표본 조사 데이터를 가시화한 것을 나타낸 예시도이다.
도 6은 본 발명의 실시 예에 따른 전수 조사 데이터 이미지 정렬 및 배치 과정을 나타낸 예시도이다.
도 7은 본 발명의 실시 예에 따른 이미지 보간 처리를 나타낸 예시도이다.
도 8은 본 발명의 실시 예에 따른 데이터 확장 장치의 구조도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 본 발명의 실시 예에 따른 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치에 대하여 설명한다.
도 1은 본 발명의 실시 예에 따른 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법의 흐름도이다.
본 발명의 실시 예에 따른 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법(이하, 설명의 편의를 위하여, 데이터 확장 방법이라고 명명함)은 데이터 확장 장치에 의해 수행될 수 있다.
첨부한 도 1에서와 같이, 데이터 확장 장치는 먼저 전수 조사 데이터를 확보한다(S100). 전수 조사 데이터는 설정 지역에서 설정 기간내에 측정되면서 설정 지역 전체에 대한 데이터를 나타낸다. 예를 들어, IoT(Internet of thing) 환경에서 설정 지역내에 설치된 모든 센서들로부터 설정 기간 내에 측정된 공간적 연관성을 가지는 시계열 데이터(예를 들어, 교차로나 차량통행이 많은 주요한 지역에서 설정 기간내에 측정된 교통 정보 데이터일 수 있음)이다. 전수 조사 데이터 확보시, 설정 기간내에서 최대한 많은 데이터를 확보하는 것이 중요하다. 각각의 사례가 표본 조사에서 전수 조사 데이터로 확장하는데 비교 기준이 되므로 사례가 충분히 확보돼야 데이터 증강의 정확성을 높일 수 있다.
전수 조사 데이터가 확보된 다음에, 확보된 전수 조사 데이터의 가시화를 수행한다(S110).
도 2는 본 발명의 실시 예에 따른 전수 조사 데이터를 나타낸 예시도이다.
데이터의 특성과 데이터를 수집하는 방식에 따라, 수집된 전수 조사 데이터의 모양이 상이하다.
예를 들어, 도 2의 (a)와 같은 위성 이미지를 통해 측정되는 수증기 데이터나, 도 2의 (b)와 같은 초분광 센서를 통해 측정된 녹조량 데이터는 전체 면적을 선형적으로 표현한다. 반면, 도 2의 (c)와 같이 맵 데이터를 통해 평균속도를 측정하는 교통 데이터는 각 링크(도로)별 속도가 나오는 형태이므로, 도로망을 따라 직선 형태를 가진다.
수집된 데이터의 형태가 도 2의 (a) 및 (b)와 같이, 원래 이미지 데이터인 경우는 말할 것도 없고, 수치 데이터인 경우에도 사용자가 이해하기 쉽도록 가시화할 수 있다. 단편적인 예로, 길 안내를 하는 네비게이션(navigation)에서, 교통 데이터를 토대로 막히는 도로는 붉은색으로 표시하고 소통이 원활한 도로는 초록색으로 표시하는 등의 가시화가 이루어진다(도 2의 (c) 참조). 또한 온도 데이터를 토대로 기온을 색으로 표시하는 가시화를 할 수 있다. 예를 들어, 사용자들의 직관적인 이해를 돕기 위해, 지도를 배경으로 표시하면서, 그 배경 위에 기온이 높은 지역은 붉은색으로 표시하고, 기온이 낮은 지역은 푸른색으로 표시하는 가시화를 할 수 있다.
본 발명의 실시 예에서는 전수 조사 데이터를 가시화하며, 효과적인 데이터 확장(보강)을 위해 HSL(HSV(hue saturation value)) 포맷을 이용하여 데이터 가시화를 수행한다. 센서 데이터가 대부분 수치 데이터이고, 고저, 장단, 대소가 존재하는 특성을 갖고 있으므로, 이러한 특성을 반영하기 용이한 이미지 파일 형식인 HSL(HSV) 포맷을 이용하여 데이터 가시화를 수행한다. 본 발명의 실시 예에서는 HSL(HSV) 포맷을 토대로 한 데이터 가시화를 예로 들었지만, 본 발명은 이에 한정되지 않으며, 임의 이미지 파일 형식을 사용하여 데이터 가시화를 수행할 수 있다.
HSL(HSV) 방법을 토대로, 데이터가 서로 연관성이 있을 경우에는 이변량까지 한번에 처리할 수 있다. 예를 들어, 교통량과 평균 속도와 같은 데이터의 경우, 교통량이 일정 수준까지 늘어나는 동안 평균속도는 변하지 않지만, 교통량이 일정 수준 이상으로 늘어나면 평균 속도는 급격하게 감소한다. 데이터에 이와 같은 연관성이 있을 경우, 하나의 HSL(HSV) 이미지를 통하여 데이터를 가시화할 수 있다.
하나의 예로, 도로 평균속도를 HSV 색상으로 가시화하는 방법을 살펴보면 다음과 같다. 시내 도로의 평균속도가 예를 들어, 최고 시속 80km에서 시속 0km까지 나온다고 가정한다. HSV에서 H(색상) 값은 색상별 정도의 차이를 비교하기 힘든 관계로 한 가지 값으로 고정하며, 여기서는 H 값을 180으로 고정하여 사용한다.
데이터 가시화를 위해 본 발명의 실시 예에서 사용하는 인자는 S(채도)값과 V(명도)값이다. 여기서는 도로 평균속도 데이터의 경우, 변량이 하나인 관계로 V값 역시 50으로 고정하고 S값만을 사용하여 데이터를 가시화한다. 다른 변량을 같이 취급할 경우에는 V값을 고정하지 않고, 마찬가지로 변량을 구해 변환하여 사용할 수 있다.
S값은 다음과 같이 산출될 수 있다.
Figure 112018013242869-pat00002
여기서, 시내 도로의 평균속도가 최고 시속 80km에서 시속 0km까지 나온다고 가정하고 있으므로, 변량 최대값은 80이고, 변량 최소값은 0이 된다. 변량은 도로 평균 속도를 나타낸다. S값 산출시 100을 곱하는데, 이는 S값이 최대로 가질 수 있는 값이 100이기 때문이다. 다른 이미지 파일 형식을 사용하여 가시화할 경우에는 그 기준에 따라 곱해지는 값이 달라질 수 있다. 예를 들어, RGB 형식을 토대로 데이터 가시화를 수행할 경우, RGB 형식은 255까지의 값을 가질 수 있으므로, 위의 수학식 1에서 100 대신에 255의 수치가 곱해진다. 100과 같이 곱해지는 값은 사용되는 형식에 따라 사용가능한 최대값이므로, 형식 최대값이라고도 명명할 수 있다.
이와 같이 산출되는 S값을 토대로 전수 조사된 도로 평균속도 데이터를 가시화할 수 있다.
도 3은 본 발명의 실시 예에 따른 전수 조사 데이터를 나타낸 예시도이며, 도 4는 본 발명의 실시 예에 따른 전수 조사 데이터를 가시화한 것을 나타낸 예시도이다.
첨부한 도 3에 예시된 바와 같이, 도로 평균속도 데이터에 대한 전수 조사 데이터를 획득할 수 있다. 도 3의 (a)에 예시된 바와 같이, 임의 도로에서 각 방향 별로 평균속도를 나타내는 전수 조사 데이터가 수집되고, 수집된 전수 조사 데이터를 도 3의 (b)와 같이 수치 조정을 한다. 도 3의 (b)는 전수 조사 데이터를 HSV 포맷을 토대로 수치를 고쳐 나타낸 도이다. 위에 예시된 바와 같이, 평균속도가 최고 시속 80km에서 시속 0km까지 나온다고 가정한 상태에서, H 값을 180으로 고정하고, V값도 50으로 고정하며, 위의 수학식 1을 토대로 S값을 산출하여, 임의 평균 속도를 HSV 값으로 나타낸다. 예를 들어, 변량인 도로의 평균속도가 "50km/h"인 경우 (180, 62, 50)의 값으로 표시된다. S 값 산출시, 소수점 이하는 버림으로 처리하였으나, 이에 한정되지 않으며, 반올림이나 올림으로 처리해도 상관없다.
따라서, 도 3의 (a)에 예시된 바와 같은 전수 조사 데이터를 도 3의 (b)과 같이 HSV 값으로 나타낼 수 있다.
도 3의 (b)와 같이 HSV 값으로 변환 처리된 전수 조사 데이터를 가시화하면 도 4와 같은 가시화된 전수 조사 데이터를 획득할 수 있다. 도 4에 예시된 가시화된 전수 조사 데이터는 도로의 외곽선(지도)을 제외하고 순수하게 현재 도로의 평균속도를 표시하고 있다. 가시화된 전수 조사 데이터는 설명의 편의상, 전수 조사 데이터 이미지라고도 명명될 수 있다. 도 4와 같이 가시화된 전수 조사 데이터 이미지의 개수를 충분히 확보할 수 있어야, 이후에 수행되는 표본 조사 데이터의 확장의 정확성이 높아질 수 있다.
이러한 전수 조사 데이터의 가시화를 통하여, 다량의 전수 조사 데이터 이미지 세트(set)가 획득된다(S120).
위에 기술된 바와 같이 획득된 전수 조사 데이터 이미지들을 토대로, 이후에 획득된 표본 조사 데이터를 전수 조사 데이터로 확장한다.
데이터 확장 장치는 표본 조사 데이터를 수집한다(S130). 표본 조사 데이터는 설정 지역 중 특정 지역에서 측정된 데이터를 나타낼 수 있다. 예를 들어, IoT 환경에서 설정 지역내에 설치된 임의 센서로부터 실시간으로 측정된 또는 설정 기간 중 소정 구간 동안 측정된 데이터일 수 있다.
표본 조사 데이터가 수집된 후, 표본 조사 데이터를 가시화한다(S140).
도 5는 본 발명의 실시 예에 따른 표본 조사 데이터를 가시화한 것을 나타낸 예시도이다.
예를 들어, 도 5의 (a)와 같은 표본 조사 데이터가 획득되고, 이러한 표본 조사 데이터를 위에 기술된 바와 같이 HSV 형식으로 수치화하고, 수치화된 값을 토대로 가시화를 하면 도 5의 (b)와 같은 가시화된 표본 조사 데이터를 획득할 수 있다. 예를 들어, 도로의 평균 속도에 대한 교통 표본 조사는 주요 교차로나 간선도로에서만 측정이 일어나기 때문에, 일부 데이터가 없는 도로는 도 5의 (b)와 같이 공백으로 표시된다. 가시화된 표본 조사 데이터는 설명의 편의상 "표본 조사 데이터 이미지"로 명명될 수도 있다.
본 발명의 실시 예에서는 이와 같이 공백 처리된 표본 조사 데이터의 값을 채워서, 목표 표본 조사 데이터를 획득한다.
표본 조사 데이터의 가시화 이후, 데이터 확장 장치는 표본 조사 데이터 이미지(목표 표본 조사 이미지)와 전수 조사 데이터 이미지 세트를 비교한다(S150). 비교 작업이 의미하는 바를 직관적으로 표현하면 표본 조사 시점의 상태와 가장 유사한 전수 조사 케이스를 찾아서 그 시기의 전수 조사 데이터와 유사하게 표본 조사 데이터의 비어있는 곳을 채우는 작업이라고 할 수 있다.
본 발명의 실시 예에서, 표본 조사 데이터 이미지와 전수 조사 데이터 이미지의 비교를 위해, 제곱평균제곱근(root mean square)를 사용한다. 이를 수식으로 나타내면 다음과 같다.
Figure 112018013242869-pat00003
여기서, Imagewhole은 전수 조사 데이터 이미지를 나타내고, Imagesample은 표본 조사 데이터 이미지를 나타낸다. WholeIPixelk은 전수 조사 데이터 이미지의 픽셀값을 나타내고, SamplePixelk은 표본 조사 데이터 이미지의 픽셀값을 나타낸다. n은 하나의 이미지를 구성하는 전체 픽셀수를 나타낸다. K는 정수를 나타낸다.
수학식 2를 토대로, 전수 조사 데이터 이미지의 임의 픽셀과 표본 조사 데이터의 이미지의 임의 픽셀 사이의 차이값을 구하고, 이러한 차이값들 토대로 제곱 평균 제곱근(Imagewhole~ Imagesample)을 구한다. 설명의 편의상 제곱 평균 제곱근을 "비교값"이라고 명명한다.
이와 같이, 전수 조사 데이터 이미지 세트의 모든 전수 조사 데이터 이미지 각각과 표본 조사 데이터 이미지 사이의 비교값을 구하면, 결과는 0~100 사이의 값으로 흩어져 있을 것이고, 발생빈도를 살펴보면 대략적으로 50을 기준으로 정규분포 모양일 것이다. 어떤 전수 조사 데이터 이미지는 표본 조사 데이터 이미지와 비슷하여 거의 차이가 없는 낮은 수치의 비교값이 나올 것이고, 어떤 전수 조사 데이터 이미지는 표본 조사 데이터 이미지와 너무 달라서 큰 수치의 비교값이 나올 것이다.
데이터 확장 장치는 표본 조사 데이터 이미지와 전수 조사 데이터 이미지 세트의 비교 작업 후 획득된 비교값들을 토대로, 전수 조사 데이터 이미지 세트의 전수 조사 데이터 이미지들을 재정렬한다(S160). 이때, 표본 조사 데이터 이미지와의 차이에 따른 비교값을 토대로, 각각의 전수 조사 데이터 이미지를 예를 들어, 오름차순 배열할 수 있다.
전수 조사 데이터 이미지 세트의 전수 조사 데이터 이미지들을 해당 비교값에 따라 재정렬한 다음에, 표본 조사 데이터 이미지를 기준으로 정렬된 전수 조사 데이터 이미지를 배치한다(S170).
도 6은 본 발명의 실시 예에 따른 전수 조사 데이터 이미지 정렬 및 배치 과정을 나타낸 예시도이다.
예를 들어, 도 6에서와 같이, 전수 조사 데이터 이미지 세트(601)의 각각의 전수 조사 이미지들이 비교값에 따라 오름차순으로 정렬된 다음, 정렬된 전수 조사 데이터 이미지들을 표본 조사 데이터 이미지(602)를 가운데 두고 번갈아가면서 표본 조사 데이터 이미지(602)의 전후로 배치한다. 예를 들어, 도 6에서와 같이, 1번, 2번, 3번, 4번 등의 순으로 전수 조사 데이터 이미지가 정렬된 경우, 제일 작은 비교값을 가지는 1번 전수 조사 데이터 이미지부터 화살표로 표시된 1번, 2번, 3번, 번 순으로 전수 조사 데이터 이미지들을 표본 조사 데이터 이미지(602)의 전후에 배치한다. 표본 조사 데이터 이미지(602)의 바로 앞에 1번 전수 조사 데이터 이미지(603)를 배치하고, 표본 조사 데이터 이미지(602)의 바로 뒤에 2번 전수 조사 데이터 이미지(605)를 배치하며, 1번 전수 조사 데이터 이미지(603)의 바로 앞에 3번 전수 조사 데이터 이미지(604)를 배치하고, 2번 전수 조사 데이터 이미지(605)의 바로 뒤에 4번 전수 조사 데이터 이미지(606)를 배치하는 방식으로, 정렬된 전수 조사 데이터 이미지들을 번갈아가면서 표본 조사 데이터 이미지의 전후에 배치한다.
이러한 배치 과정을 통하여, 표본 조사 데이터 이미지와 이를 기준으로 전후에 배치된 전수 조사 데이터 이미지들로 이루어진 일련의 이미지 시퀀스가 생성된다. 이미지 시퀀스는 영상 중간에 손상된 프레임이 하나 있는 것과 비슷하다.
이미지 시퀀스에서 표본 조사 데이터 이미지의 전후에 배치된 전수 조사 데이터 이미지를 토대로 표본 조사 데이터 이미지를 보간(또는 복원)한다(S180).
보간 방법은 다음과 같이 두 단계로 이루어질 수 있다.
첫번째 보간 단계는 표본 조사 데이터 이미지 자체의 보간을 진행하는 것이다.
두번째 단계는 보간된 표본 조사 데이터 이미지(또는 보간되지 않은 표본 조사 데이터 이미지)와 전후 전수 조사 데이터 이미지를 평균하여 최종 이미지(픽셀)를 얻는 것이다.
적용 도메인에 따라 첫번째 단계와 두 번째 단계의 중요도가 다르다. 그 중요도는 실증 서비스나 실험을 통해 가중치 형태로 반영될 수 있다. 또한, 도 6의 표본 조사 데이터 이미지(602)와 같이 자체적으로 보간(interpolation)이 불가하여 보외법(extrapolation)을 해야 할 경우에는, 첫번째 단계를 생략하고 두번째 단계만을 진행할 수도 있다.
도 7은 본 발명의 실시 예에 따른 이미지 보간 처리를 나타낸 예시도이다.
첫번째 단계에서, 이중 선형 보간(bilinear interpolation)을 사용하여 표본 조사 데이터 이미지를 자체적으로 보간할 수 있다.
예를 들어, 도 7의 (a)과 같이, 표본 조사 데이터 이미지(701)의 픽셀(P)을 전후 전수 조사 데이터 이미지(702, 703)의 픽셀(X, Y)을 이용하여 구할 수 있다. 이러한 이중 선형 보간 이외에도, 다양한 보간법을 선택하여, 표본 조사 데이터 이미지 자체의 보간을 수행할 수 있다. 적용 도메인의 데이터 특성을 고려하여 적절한 보간법을 선택할 수 있다. 여기서 전후 조사 데이터 이미지(702, 703)는 표본 조사 데이터 이미지에 가장 가까이 배치된 전수 조사 데이터 이미지이며, 실질적으로, 전수 조사 데이터 이미지 세트에서 가장 작은 비교값을 가지는 전수 조사 데이터 이미지들일 수 있다.
두번째 단계에서, 보간된 표본 조사 데이터 이미지와 전후 전수 조사 데이터 이미지를 이용하여 최종 이미지를 획득한다.
첫번째 단계에서 보간된 표본 조사 데이터 이미지의 채워진 픽셀 P(첫번째 단계가 생략된 경우에는 표본 조사 데이터 이미지의 픽셀)와 대응되는 두 개의 전수 조사 데이터 이미지의 픽셀 X, Y 즉, 총 3개의 픽셀을 통해 최종적으로 목표로 하는 픽셀 Pt를 구할 수 있다. 도 7의 (b)에서와 같이, 픽셀 Pt는 점 X, Y, P에 각각 d1, d2, w 거리만큼 떨어져 있다. Pt는 다음과 같은 수식을 통해 산출될 수 있다.
Figure 112018013242869-pat00004
여기서는, 표본 조사 데이터 이미지와 가장 가까이 배치된 두 개의 전수 조사 데이터 이미지만을 사용하였지만, 정확한 추정을 위해 여러 장의 전수 조사 데이터 이미지를 사용하여, Pt를 구할 수도 있다.
이미지 시퀀스에서 표본 조사 데이터 이미지의 전후에 배치된 전수 조사 데이터 이미지를 토대로 표본 조사 데이터 이미지를 보간하는 데 있어서, 위에 기술된 방법 이외에도, 다양한 이미지 보간(복원) 방법을 사용할 수 있다. 데이터 특성에 따라 보간 방법의 선택이 이루어질 수 있다.
최종적으로 목표로 하는 픽셀 Pt를 구하는 과정을 통해, 목표로 하는 표본 조사 데이터 이미지를 획득할 수 있다. 본 발명의 실시 예에서는 표본 조사에 따라 획득된 수치 데이터(표본 조사 데이터)를 이미지화하여 변환한 후에 보간(복원) 방법을 통해, 표본 조사 데이터의 비어 있는 데이터를 채워 넣을 수 있다. 그러므로 표본 조사 데이터를 확장하여 전수 조사 데이터와 같은 데이터를 획득할 수 있다.
이와 같이, 비어 있는 데이터가 채워진 목표 표본 조사 데이터 이미지의 픽셀을 분석하여, 원래 알고자 하는 수치 데이터를 뽑아낼 수 있다(S190).
예를 들어, 전술한 도로 평균 속도를 나타내는 경우, 평균 속도에 따른 표본 조사 데이터를 이미지화하여 보간하여 목표 표본 조사 데이터 이미지를 획득한다. 이때, 표본 조사에서 빠져 있었던 도로의 이미지를 보간 했더니 그 값이 HSV 포맷으로 (180,92,50)와 같다면, 다음 수학식을 통해 (180,92,50)에 대응하는 수치 데이터 즉, 평균 속도를 구할 수 있다.
Figure 112018013242869-pat00005
그렇게 해서 구한 값은 시속 73.6 km 가 된다.
이와 같이, 보간된 표본 조사 데이터 이미지로부터 전수 조사 데이터를 추출할 수 있다.
도 8은 본 발명의 실시 예에 따른 데이터 확장 장치의 구조도이다.
첨부한 도 8에 도시되어 있듯이, 본 발명의 실시 예에 따른 데이터 확장 장치(1)는, 프로세서(110), 메모리(120) 및 입출력부(130)를 포함한다. 프로세서(110)는 위의 도 1 내지 도 7을 토대로 설명한 방법들을 구현하도록 구성될 수 있다.
메모리(120)는 프로세서(110)와 연결되고 프로세서(110)의 동작과 관련한 다양한 정보를 저장한다. 메모리(120)는 프로세서(110)에서 수행하기 위한 동작을 위한 명령어(instructions)를 저장하고 있거나 저장 장치(도시하지 않음)로부터 명령어를 로드하여 일시 저장할 수 있다. 메모리(120)는 예를 들어, 전수 조사 데이터 이미지 세트를 저장하도록 구성될 수 있다.
프로세서(110)는 메모리(120)에 저장되어 있거나 로드된 명령어를 실행할 수 있다. 프로세서(110)와 메모리(120)는 버스(도시하지 않음)를 통해 서로 연결되어 있으며, 버스에는 입출력 인터페이스(도시하지 않음)도 연결되어 있을 수 있다.
입출력부(130)는 프로세서(110)의 처리 결과를 출력하거나, 사용자 인터페이스를 통해 입력되는 데이터를 입력받아 프로세서(110)로 제공하도록 구성된다. 입출력부(130)는 예를 들어, 전수 조사 데이터 또는 표본 조사 데이터를 입력받아 프로세서(110)로 제공할 수 있다.
본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시 예의 구성에 대응하는 기능을 실현하기 위한 프로그램, 그 프로그램이 기록된 기록 매체 등을 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시 예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (18)

  1. 장치가, 데이터를 확장하는 방법으로서,
    상기 장치가, 공간적 연관성이 있는 시계열 데이터인 표본 조사 데이터를 가시화하여 표본 조사 데이터 이미지를 획득하는 단계;
    상기 장치가, 기저장된 전수 조사 데이터 이미지들 각각과, 상기 표본 조사 데이터 이미지를 비교하여 비교값을 획득하고, 비교값을 토대로 상기 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 선택하고, 선택된 전수 조사 데이터 이미지를 이용하여 상기 표본 조사 데이터 이미지를 보간하는 단계; 및
    상기 장치가, 상기 보간된 표본 조사 데이터 이미지를 수치화하여 대응하는 시계열 데이터를 추정하는 단계
    를 포함하며,
    상기 비교값은 상기 표본 조사 데이터 이미지와 상기 전수 조사 데이터 이미지의 픽셀 차이값의 제곱평균제곱근에 대응하는, 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 선택하는 단계는, 상기 기저장된 전수 조사 데이터 이미지들 중 가장 적은 비교값을 가지는 적어도 2개의 전수 조사 데이터 이미지를 선택하는, 방법.
  4. 제1항에 있어서,
    상기 선택하는 단계는,
    상기 장치가, 상기 기저장된 전수 조사 데이터 이미지들을 해당 비교값에 따라 오름차순으로 정렬하는 단계;
    상기 정렬된 전수 조사 데이터 이미지들을 상기 표본 조사 데이터 이미지를 가운데 두고 번갈아가면서 상기 표본 조사 데이터 이미지의 전후에 배치하는 단계; 및
    상기 표본 조사 데이터 이미지와 가장 가까이 배치된 적어도 2개의 전수 조사 데이터 이미지를 선택하는 단계
    를 포함하는, 방법.
  5. 삭제
  6. 제1항에 있어서,
    상기 보간하는 단계는,
    상기 표본 조사 데이터 이미지와 상기 적어도 2개의 전수 조사 데이터 이미지를 평균하여 최종 표본 조사 데이터 이미지를 획득하는 단계
    를 포함하는, 방법.
  7. 제6항에 있어서,
    상기 최종 표본 조사 데이터 이미지를 획득하는 단계는, 상기 표본 조사 데이터 이미지의 제1 픽셀, 전수 조사 데이터 이미지의 제2 픽셀 그리고 다른 전수 조사 데이터 이미지의 제3 픽셀과, 그리고 각 픽셀 사이의 거리를 토대로 상기 제1 픽셀의 최종값을 산출하고, 산출된 최종값을 토대로 상기 최종 표본 조사 데이터 이미지를 획득하는, 방법.
  8. 제7항에 있어서,
    상기 제1 픽셀의 최종값은
    Figure 112018013242869-pat00006

    의 조건을 토대로 산출되며,
    상기 Pt 는 최종값, 상기 P는 제1 픽셀, 상기 X는 제2 픽셀, 그리고 상기 Y는 제3 픽셀을 나타내며, 상기 d1은 상기 최종값과 상기 제2 픽셀 사이의 거리, d2는 상기 최종값과 상기 제3 픽셀 사이의 거리, 그리고 w는 상기 최종값과 상기 제1 픽셀 사이의 거리를 나타내는, 방법.
  9. 제1항에 있어서,
    상기 표본 조사 데이터 이미지를 획득하는 단계는, 상기 표본 조사 데이터를 HSV 형식으로 수치화하고, 수치화된 HSV 값을 토대로 상기 표본 조사 데이터를 가시화하는, 방법.
  10. 제9항에 있어서,
    상기 표본 조사 데이터가 변량 최대값에서 변량 최소값 사이의 값을 가지고, 상기 표본 조사 데이터의 값을 변량이라고 할 경우, 상기 HSV 값은 상기 변량을 상기 변량 최대값과 상기 변량 최소값의 차이로 나눈 값에, 상기 HSV값으로 표시 가능한 형식 최대값을 곱하는 것에 의해 획득되는, 방법.
  11. 제10항에 있어서,
    상기 시계열 데이터를 추정하는 단계는, 상기 보간된 표본 조사 데이터 이미지의 HSV 값을 상기 형식 최대값으로 나눈 값에, 상기 변량 최대값과 상기 변량 최소값의 차이를 곱하는 것에 의해, 상기 보간된 표본 조사 데이터 이미지의 HSV 값에 대응하는 수치 데이터인 시계열 데이터를 획득하는, 방법.
  12. 데이터를 확장하는 장치로서,
    데이터를 입력받도록 구성된 입출력부;
    전수 조사 데이터 이미지를 저장하는 메모리; 그리고
    상기 입출력부와 연결되고, 표본 조사 데이터를 전수 조사 데이터로 확장처리하도록 구성된 프로세서를 포함하며,
    상기 프로세서는,
    상기 입출력부를 통해 제공되는, 공간적 연관성이 있는 시계열 데이터인 표본 조사 데이터를 가시화하여 표본 조사 데이터 이미지를 획득하고, 상기 메모리에 저장된 전수 조사 데이터 이미지들 각각과, 상기 표본 조사 데이터 이미지를 비교하여 비교값을 획득하고, 상기 비교값을 토대로 상기 기저장된 전수 조사 데이터 이미지들 중 적어도 2개를 선택하며, 상기 선택된 2개의 전수 조사 데이터 이미지를 이용하여 상기 표본 조사 데이터 이미지를 보간하며, 상기 보간된 표본 조사 데이터 이미지를 수치화하여 대응하는 시계열 데이터를 추정하도록 구성되며,
    상기 비교값은 상기 표본 조사 데이터 이미지와 상기 전수 조사 데이터 이미지의 픽셀 차이값의 제곱평균제곱근에 대응하는, 장치
  13. 삭제
  14. 제12항에 있어서,
    상기 프로세서는, 상기 전수 조사 데이터 이미지들 중 가장 적은 비교값을 가지는 적어도 2개의 전수 조사 데이터 이미지를 선택하도록 구성되는, 장치.
  15. 삭제
  16. 제12항에 있어서,
    상기 프로세서는, 상기 표본 조사 데이터 이미지와 상기 적어도 2개의 전수 조사 데이터 이미지를 평균하여 최종 표본 조사 데이터 이미지를 획득하도록 구성되는, 장치.
  17. 제16항에 있어서,
    상기 프로세서는, 상기 표본 조사 데이터 이미지의 제1 픽셀, 전수 조사 데이터 이미지의 제2 픽셀 그리고 다른 전수 조사 데이터 이미지의 제3 픽셀과, 그리고 각 픽셀 사이의 거리를 토대로 상기 제1 픽셀의 최종값을 산출하고, 산출된 최종값을 토대로 상기 최종 표본 조사 데이터 이미지를 획득하도록 구성되는, 장치.
  18. 삭제
KR1020180014769A 2018-02-06 2018-02-06 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치 KR102593285B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180014769A KR102593285B1 (ko) 2018-02-06 2018-02-06 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180014769A KR102593285B1 (ko) 2018-02-06 2018-02-06 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20190095007A KR20190095007A (ko) 2019-08-14
KR102593285B1 true KR102593285B1 (ko) 2023-10-24

Family

ID=67621903

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180014769A KR102593285B1 (ko) 2018-02-06 2018-02-06 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102593285B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128711A (ja) * 2008-11-26 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 天候変化検出装置、天候変化検出方法及び天候変化検出プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101088498B1 (ko) * 2009-06-08 2011-11-30 인하대학교 산학협력단 환경 정보 제공 시스템 및 그 방법
US8259198B2 (en) * 2009-10-20 2012-09-04 Apple Inc. System and method for detecting and correcting defective pixels in an image sensor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128711A (ja) * 2008-11-26 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 天候変化検出装置、天候変化検出方法及び天候変化検出プログラム

Also Published As

Publication number Publication date
KR20190095007A (ko) 2019-08-14

Similar Documents

Publication Publication Date Title
US8179393B2 (en) Fusion of a 2D electro-optical image and 3D point cloud data for scene interpretation and registration performance assessment
Xu et al. A spatio–temporal pixel-swapping algorithm for subpixel land cover mapping
JP2008538022A (ja) シーンの三次元変化検出及び測定のためのシステム及び方法
CN111191673B (zh) 一种地表温度降尺度方法及系统
Tang et al. Downscaling remotely sensed imagery using area-to-point cokriging and multiple-point geostatistical simulation
CN109472393A (zh) 空间降尺度降水数据检测方法、装置及电子设备
JP6159594B2 (ja) 観測値処理装置、観測値処理方法及び観測値処理プログラム
JP2006140886A (ja) 撮像装置および画像の高解像化方法
CN104754327B (zh) 一种检测及消除高光谱图像坏点的方法
US20080131029A1 (en) Systems and methods for visualizing and measuring real world 3-d spatial data
Cudennec et al. Accounting for sparsely observed rainfall space—time variability in a rainfall—runoff model of a semiarid Tunisian basin/Prise en compte d'observations peu denses de la variabilité spatiotemporelle de la pluie dans une modélisation pluie—débit d'un bassin semi-aride Tunisien
Chen et al. The effect of spatial autocorrelation and class proportion on the accuracy measures from different sampling designs
KR102593285B1 (ko) 표본 조사 데이터를 전수 조사 데이터로 확장하는 방법 및 장치
CN103646379B (zh) 一种图像放大方法和装置
KR101799143B1 (ko) 타깃 사이즈를 추정하기 위한 시스템 및 방법
Brus et al. An assessment of quantitative uncertainty visualization methods for interpolated meteorological data
Davidović et al. Analysis of the Display of Digital Terrain Models using different interpolation methods
CN109612588A (zh) Lst图像数据预测方法、装置以及电子设备
Zhang et al. Analyzing spatial variations in land use/cover distributions: A case study of Nanchang area, China
CN110991567A (zh) 一种由点到面的遥感瞬时地表温度数据检测方法
Gertner et al. Combining stratification and up-scaling method-block cokriging with remote sensing imagery for sampling and mapping an erosion cover factor
Chen Using nighttime lights data as a proxy in social scientific research
El-Hussainy et al. A methodology for image matching of historical maps
CN103246689B (zh) 一种栅格数据的预测方法和装置
WO2023238728A1 (ja) 情報処理方法、情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant