KR101908786B1 - 데이터 유사도 평가 시스템 - Google Patents

데이터 유사도 평가 시스템 Download PDF

Info

Publication number
KR101908786B1
KR101908786B1 KR1020160143596A KR20160143596A KR101908786B1 KR 101908786 B1 KR101908786 B1 KR 101908786B1 KR 1020160143596 A KR1020160143596 A KR 1020160143596A KR 20160143596 A KR20160143596 A KR 20160143596A KR 101908786 B1 KR101908786 B1 KR 101908786B1
Authority
KR
South Korea
Prior art keywords
data
similarity
change amount
change
value
Prior art date
Application number
KR1020160143596A
Other languages
English (en)
Other versions
KR20180047484A (ko
Inventor
조성진
최광호
류연희
김준범
Original Assignee
한국 한의학 연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국 한의학 연구원 filed Critical 한국 한의학 연구원
Priority to KR1020160143596A priority Critical patent/KR101908786B1/ko
Priority to PCT/KR2017/006499 priority patent/WO2018079975A1/ko
Publication of KR20180047484A publication Critical patent/KR20180047484A/ko
Application granted granted Critical
Publication of KR101908786B1 publication Critical patent/KR101908786B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/35Detecting specific parameters of the electrocardiograph cycle by template matching
    • A61B5/04525
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0402
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis

Abstract

일 실시예에 따른 데이터 유사도 평가 시스템은 데이터들이 수집되는 수집부; 상기 수집부를 통해 수집된 상기 데이터들을 비교하는 처리부; 및 상기 처리부로부터 비교된 결과를 표시하는 표시부;를 포함할 수 있고, 상기 처리부는 상기 데이터들 중 하나의 일 지점에서의 값과 기준 값의 차이인 제1 변화량과 다른 데이터의 동일 지점에서의 값과 기준 값의 차이인 제2 변화량의 비율인 변화량 비율를 산출하며, 상기 처리부는 상기 변화량 비율이 1일 때 상기 데이터들 사이의 유사도를 최대값으로 산정하고, 상기 변화량 비율이 -1일 때 상기 유사도를 최소값으로 산정하며, 상기 변화량 비율이 0일 때와 변화량 비율이 무한대로 발산할 때에는 상기 유사도를 0으로 계산할 수 있다.

Description

데이터 유사도 평가 시스템{DATA SIMILARITY EVALUATION SYSTEM}
데이터 유사도 평가 시스템이 개시된다. 구체적으로, 복수 개의 시계열 데이터, 2차원 및 3차원 공간 분포 데이터 등 데이터의 유사도를 평가하고, 각 유사도 값의 평균을 산출하여 전체 유사도를 제공할 수 있는, 데이터 유사도 평가 시스템이 개시된다.
시계열 데이터는 시간 경과에 따라서 일정한 간격마다 기록한 값으로서, 주식 차트 그래프, 뇌전도 그래프(EEG; electroencephalograph)와 같이 연속적인 그래프와 개별 펄스의 형태로 나누어지는 심전도 그래프(ECG;electrocardiograph) 등을 예로 들 수 있다.
이러한 시계열 데이터를 분석하여 사용자가 원하는 정보를 추출하기 위하여, 다양한 방법이 이용되고 있다. 예를 들어, 시계열 데이터의 성분 분석을 위하여 시간영역에서의 신호를 주파수영역으로 변환하여 각각의 합성 신호를 분석하는 방법으로서, 각 신호의 주파수나 특성을 할 수 있는 푸리에 변환이나 peak analysis 등이 활용되고, 추세 예측을 위하여 시간이 경과함에 따라서 수치가 변동할 것으로 예상되는 정도를 백분율로 나타내는 변동률(volatility)이나 수집된 샘플에 의해 일반적으로 어느 기간 동안 같은 방향으로 움직이는 경향을 예측하는 추세선 등이 활용된다.
시계열 데이터를 분석하고 이용하는 방법은 2013년 1월 14일 출원된 "심전도 신호 기반의 연속적 생체인식 장치 및 방법"에 개시되어 있다.
또한, 일반적으로 시계열 데이터는 두 시계열 데이터의 파형의 변동이 얼마나 유사하게 진행되는지 판단하는 피어슨 상관계수가 이용되고 있다.
일 실시예에 따른 목적은 함수를 이용하여 금융, 기후, 등 시계열로 기록되는 모든 데이터와 공간적으로 분포하는 데이터 구조도 또한 유사도를 판정할 수 있는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 유사도 정확도를 상승시키기 위해 데이터 파형의 모양과 크기, 진폭 등 데이터 파형의 전반적인 정보를 모두 고려하여 유사도를 산출할 수 있는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 심전도 안정성 평가를 비롯한 다양한 분야에서 적절하게 이용될 수 있도록 데이터 파형의 특징에 따라서 가중치를 주어 민감도를 조절할 수 있는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 실시간으로 측정되는 데이터들 간의 유사도를 측정할 수 있는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 유사도 평가 계산 방법을 간단화 시키는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 유사도 평가 계산의 오차를 저감시키는 데이터 유사도 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 데이터 유사도 평가 시스템을 이용하여 심전도의 이상을 보다 정확하게 진단할 수 있는 심전도 안정성 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 웨어러블 디바이스를 이용하여 일상에서 실시간으로 건강을 관리할 수 있는 심전도 안정성 평가 시스템을 제공하는 것이다.
일 실시예에 따른 다른 목적은 심전도 이상을 진단하는 방법을 간단화하는 심전도 안정성 평가 시스템을 제공하는 것이다.
일 실시예에 따른 데이터 유사도 평가 시스템은 데이터들이 수집되는 수집부; 상기 수집부를 통해 수집된 상기 데이터들을 비교하는 처리부; 및 상기 처리부로부터 비교된 결과를 표시하는 표시부;를 포함할 수 있고, 상기 처리부는 상기 데이터들 중 하나의 일 지점에서의 값과 기준 값의 차이인 제1 변화량과 다른 데이터의 동일 지점에서의 값과 기준 값의 차이인 제2 변화량의 비율인 변화량 비율를 산출하며, 상기 처리부는 상기 변화량 비율이 1일 때 상기 데이터들 사이의 유사도를 최대값으로 산정하고, 상기 변화량 비율이 -1일 때 상기 유사도를 최소값으로 산정하며, 상기 변화량 비율이 0일 때와 변화량 비율이 무한대로 발산할 때에는 상기 유사도를 0으로 계산할 수 있다.
또한, 상기 유사도는 다음 유사도 평가 함수
Figure 112016106253299-pat00001
에 의해 계산되며, 제1 변화량은 ΔAi로 표현되고, 제2 변화량은 ΔBi로 표현되며, 상기 n'은 상기 데이터의 지점들 중 유효한 지점들의 개수이고, 상기 ri는 상기 변화량 비율인 제1 변화량(ΔBi)/제2 변화량(ΔAi)이며, 상기 s(ri)는, ,
Figure 112016106253299-pat00002
에 의해 연산되고, 상기 f(ri)는
Figure 112016106253299-pat00003
으로 계산되고, 상기 f(ri) 에서 a 및 b는 상수 값일 수 있다.
또한, 상기 a는
Figure 112016106253299-pat00004
이며, 상기 b는
Figure 112016106253299-pat00005
일 수 있다.
또한, 상기 유사도에는 가중치가 더해져서 다음 식
Figure 112016106253299-pat00006
에 의해 계산되고, 상기 w(ri)에서 함수 w(x)는 특정 구간에 적용되는 가중치를 의미하며, 상기 제1 변화량과 상기 제2 변화량 중 어떤 것도 0의 값을 가지지 않을 때 1이고, 상기 제1 변화량과 상기 제2 변화량 둘 모두 0의 값을 가질 때 연산에서 제외될 수 있다.
또한, 상기 함수 w(x)는 펄스 형태의 시계열 데이터에서 w(ΔAi, ΔBi)으로 표현되며, w(ΔAi, ΔBi)은, 상기 제1 변화량과 상기 제2 변화량 중 어떠한 하나의 값이라도 0이 아닐 때, |ΔAi| +Bi| 으로 연산되고, 상기 제1 변화량과 상기 제2 변화량 둘 모두의 값이 0일 때, 연산에서 제외될 수 있다.
또한, 상기 제1 변화량은 상기 제1 데이터의 일 지점에서 상기 제1 데이터의 평균을 뺀 값이고, 상기 제2 변화량은 상기 제2 데이터의 일 지점에서 상기 제2 데이터의 평균을 뺀 값일 수 있다.
또한, 상기 데이터는 2차원 또는 3차원 공간에 분포되는 공간데이터이며,상기 제1 데이터 및 상기 제2 데이터는 각각 2차원 또는 3차원 좌표값을 포함하고, 상기 처리부는 일 좌표에서의 제1 데이터와 상기 일 좌표에 대응되는 좌표에서의 제2 데이터를 비교할 수 있다.
또는, 일 실시예에 따른 시계열 데이터 유사도 평가 시스템은 시계열 데이터를 수집하는 수집부; 상기 수집부를 통해 수집된 상기 시계열 데이터를 이용하여 유사도를 산출하는 처리부; 및 상기 처리부로부터 비교된 결과를 표시하는 표시부;를 포함하고, 상기 처리부는 상기 시계열 데이터의 제1 지점에서의 값과 기준 값의 차이인 제1 변화량과 상기 시계열 데이터의 제2 지점에서의 값과 기준 값의 차이인 제2 변화량의 비율인 변화량 비율를 산출하며, 상기 처리부는 상기 변화량 비율이 1일 때 상기 제1 데이터 및 상기 제2 데이터들 사이의 유사도를 최대값으로 산정하고, 상기 변화량 비율이 -1일 때 상기 유사도를 최소값으로 산정하며, 상기 변화량 비율이 0일 때와 변화량 비율이 무한대로 발산할 때에는 상기 유사도를 0으로 계산할 수 있다.
상기 유사도는 다음 유사도 평가 함수
Figure 112016106253299-pat00007
에 의해 계산되며, 제1 변화량은 ΔAi로 표현되고, 제2 변화량은 ΔBi로 표현되며, 상기 n'은 상기 데이터의 지점들 중 유효한 지점들의 개수이고, 상기 ri는 상기 변화량 비율인 제1 변화량(ΔBi)/제2 변화량(ΔAi)이며,상기 s(ri)는
Figure 112016106253299-pat00008
에 의해 연산되고, 상기 f(ri)는,
Figure 112016106253299-pat00009
으로 계산되고, 상기 f(ri)에서 상기 a는
Figure 112016106253299-pat00010
이며 상기 b는
Figure 112016106253299-pat00011
일 수 있다.
또한, 상기 시계열 데이터는 심전도 데이터이고, 상기 처리부는 상기 심전도 데이터의 복수 개의 펄스를 구간별로 구분하며, 상기 제1 변화량은 상기 심전도 데이터의 일 펄스 구간에서의 변화량이며, 상기 제2 변화량은 상기 심전도 데이터의 다른 일 펄스 구간에서의 변화량일 수 있다.
또한, 상기 제1 변화량과 상기 제2 변화량은 시계열 데이터 상에서 서로 인접한 데이터를 이용하여 산출하는 변화량일 수 있다.
또한, 상기 시계열 데이터는 측정된 심전도 데이터와 저장된 시계열 데이터를 포함하고, 상기 처리부는 각각의 상기 측정된 시계열 데이터와 상기 저장된 시계열 데이터들의 동일 시점 데이터를 서로 비교하여 유사도를 산출할 수 있다.
일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 함수를 이용하여 금융, 기후, 등 시계열로 기록되는 모든 데이터와 공간적으로 분포하는 데이터 구조도 또한 유사도를 판정할 수 있는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 유사도 정확도를 상승시키기 위해 데이터 파형의 모양과 크기, 진폭 등 데이터 파형의 전반적인 정보를 모두 고려하여 유사도를 산출할 수 있는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 심전도 안정성 평가를 비롯한 다양한 분야에서 적절하게 이용될 수 있도록 데이터 파형의 특징에 따라서 가중치를 주어 민감도를 조절할 수 있는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 실시간으로 측정되는 데이터들 간의 유사도를 측정할 수 있는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 유사도 평가 계산 방법을 간단화 시키는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 유사도 평가 계산의 오차를 저감시키는 데이터 유사도 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 데이터 유사도 평가 시스템을 이용하여 심전도의 이상을 보다 정확하게 진단할 수 있는 심전도 안정성 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면,웨어러블 디바이스를 이용하여 일상에서 실시간으로 건강을 관리할 수 있는 심전도 안정성 평가 시스템이 제공될 수 있다.
또한, 일 실시예에 따른 데이터 유사도 평가 시스템에 따르면, 심전도 이상을 진단하는 방법을 간단화하는 심전도 안정성 평가 시스템이 제공될 수 있다.
도 1은 시계열 데이터 및 시계열 데이터를 이용하여 일 실시예에 따른 유사도 평가 시스템을 통해 평가한 유사도를 도시한다.
도 2는 일 실시예에 따른 유사도 평가 시스템의 변화량 비율을 시각적으로 도시한다.
도 3은 파형이 동일한 예시적인 시계열 데이터들과 일 실시예에 따른 유사도 평가 시스템의 유사도 그래프를 도시한다.
도 4는 예시적인 시계열 데이터를 일 실시예에 따른 유사도 평가 시스템에 의해 산출된 유사도를 도시한다.
도 5는 예시적인 펄스 형태의 시계열 데이터와 일 실시예에 따른 유사도 평가 시스템에 의해 산출된 유사도 값을 도시한다.
도 6은 예시적인 2차원 공간 데이터의 도면과 데이터를 일 실시예에 따른 유사도 평가 시스템으로 산출한 유사도를 도시한다.
이하, 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
일 실시예에 따른 데이터 유사도 평가 시스템은 수집부, 처리부, 표시부 및 데이터베이스를 포함할 수 있다.
수집부는 주파수 데이터나 수치 데이터, 2차원 또는 3차원 데이터와 같은 공간 데이터 등 다양한 데이터들을 수집할 수 있다. 수집된 데이터는 아래에서 제1 데이터 및 제2 데이터로 표현될 수 있다.
처리부는 수집부를 통해서 수집된 하나 이상의 데이터를 분석하여 유사도를 산출할 수 있다.
표시부는 상기 처리부로부터 산출된 유사도를 시각화하여 출력할 수 있다.
데이터베이스는 수집된 데이터를 저장할 수 있고, 저장된 데이터를 처리부에 전달할 수 있다.
처리부에 전달된 저장된 데이터는 수집된 데이터들을 가공할 때 비교 대상이 되는 기준값이 될 수 있다.
도 1은 시계열 데이터 및 시계열 데이터를 이용하여 일 실시예에 따른 유사도 평가 시스템을 통해 평가한 유사도를 도시한다.
구체적으로, 도 1은 제1 데이터(D1) 및 제2 데이터(D2)의 시간에 따른 변화를 나타내고 시계열 데이터 및 각 시점에서 시계열 데이터를 일 실시예에 따른 유사도 평가 시스템을 이용하여 산출한 유사도(Sim)를 도시한다.
제1 데이터(D1) 및 제2 데이터(D2)는 각각 다른 데이터일 수 있거나 동일한 데이터 상에서 다른 구간을 의미할 수 있다. 유사도(Sim)는 제1 데이터(D1) 및 제2 데이터(D2)와 동일 시점에서 평가되는 유사도(Sim) 값이며 도 1에서와 같이 동일한 시점에서 표시될 수 있다.
일 실시예에 따른 유사도 평가 시스템은 아래에서 자세히 설명된다.
도 2는 일 실시예에 따른 유사도 평가 시스템의 변화량 비율을 시각적으로 도시한다.
처리부는 제1 데이터의 일 시점에서의 값과 기준 값과의 차이인 제1 변화량과, 제2 데이터의 동일 시점에서의 값과 기준 값과의 차이인 제2 변화량 사이의 비율인 변화량 비율을 산출한다.
기준 값은 데이터들의 평균 또는 이전에 지정된 값일 수 있다.
도 2에 도시된 바와 같이, 처리부는 변화량의 비율이 1일 때 제1 데이터 및 제2 데이터들 사이의 유사도를 최대값으로 평가할 수 있고, 변화량의 비율이 -1일 때 유사도를 최소값, 즉 정 반대되는 값으로 평가할 수 있으며, 변화량 비율이 0일 때는 유사도를 0으로 평가하고, 마찬가지로 변화량 비율이 무한대로 발산할 때에는 유사도를 0으로 평가할 수 있다. 즉, 변화량 비율은 -1 내지 1사이의 값일 수 있다.
또한, 두 데이터의 변화 비율에 따라 유사도는 연속적이고 미분가능할 수 있다. 이러한 조건을 만족하는 수치는,
[수학식 1]
Figure 112016106253299-pat00012
으로 계산될 수 있다. 여기서, a는 상수로써, 경험에 의해
Figure 112016106253299-pat00013
으로 이용될 수 있고, 마찬가지로 b는
Figure 112016106253299-pat00014
일 수 있다.
수학식 1에서, ri는 변화량 비율인 제1 변화량(ΔBi)/제2 변화량(ΔAi)이다.
수학식 1을 참조로 하여, s(ri)는,
[수학식 2]
Figure 112016106253299-pat00015
에 의해 연산될 수 있다.
보다 상세하게는, s(ri)는 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 둘 모두의 값이 0이 아닐 때,
Figure 112016106253299-pat00016
으로 계산되거나, 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 중 하나의 값이 0일 때, 0이며 또는, 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 둘 모두의 값이 0일 때, 연산에서 제외될 수 있다.
수학식 1과 수학식 2를 참조하여, 일 실시예에 따른 데이터 유사도 평가는
[수학식 3]
Figure 112016106253299-pat00017
으로 연산될 수 있고, 여기서 A는 데이터들 중 하나인 제1 데이터이며, B는 데이터들 중 하나인 제2 데이터이고, n은 데이터의 지점 개수이며, n'은 데이터의 지점 중 유효한 지점의 개수이다. 유효한 지점에 대한 설명은 아래에서 기술된다.
데이터 유사도 평가 시스템은 위에서 언급된
[수학식 3]
Figure 112016106253299-pat00018
에 가중치를 곱한
[수학식 4]
Figure 112016106253299-pat00019
Figure 112016106253299-pat00020
으로 연산될 수 있고, w(ri)에서 가중치 함수 함수 w(x)는 특정 구간에 적용되는 가중치를 의미하며 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 중 어떤 것도 0의 값을 가지지 않을 때 1이고, 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 둘 모두 0의 값을 가질 때 연산에서 제외될 수 있다.
특히, 펄스 형태의 시계열 데이터에서 가중치 함수 w(x)는 펄스 형태의 시계열 데이터에서 w(ΔAi, ΔBi)으로 표현되며, w(ΔAi, ΔBi)은 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 중 어떠한 하나의 값이라도 0이 아닐 때, |ΔAi| + |ΔBi|으로 연산되고, 제1 변화량(ΔAi)과 제2 변화량(ΔBi) 둘 모두의 값이 0일 때, 연산에서 제외될 수 있다.
아래에서 설명되는 도 3 내지 도 6은 본원의 일 실시예에 따른 데이터 유사도 평가 시스템(Sim)과 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값에 대한 것이다.
도 3은 파형이 동일한 예시적인 시계열 데이터들과 일 실시예에 따른 유사도 평가 시스템의 유사도 그래프를 도시한다.
도 3(a)는 파형의 주기는 동일하고 진폭은 다른 복수 개의 데이터 그래프들을 도시한다.
도 3(b)를 참조하여, 복수 개의 데이터 그래프들은 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출될 수 있으며, 또한 복수 개의 데이터 그래프들은 피어슨 상관계수(Cor)를 이용하여 산출될 수 있다.
도 3(b)에 도시된 바와 같이, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도의 그래프는 복수 개의 데이터 그래프들이 서로 진폭이 달라도 동일한 방향에서는 항상 1의 값을 가지고 서로 반대 방향으로는 항상 -1의 값을 가지도록 산출된다. 즉, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도는 데이터의 분산의 크기는 고려하지 않고 분산의 형태만을 적용하여 산출된다.
반면에, 본원의 데이터 유사도 평가 시스템(sim)을 이용하여 산출되는 유사도의 그래프는 완전히 동일한 파형(크기와 형태 모두)에서만 1의 값을 가지고, 완전히 반대인 파형에서만 -1의 값을 가질 수 있다.
도 4는 예시적인 시계열 데이터를 일 실시예에 따른 유사도 평가 시스템에 의해 산출된 유사도를 도시한다.
도 4a는 변화의 폭은 유사하지만 방향이 반대인 두 데이터 그래프의 유사도를 표현하며, 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값은 -0.981이고 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값은 -0.999이다.
도 4b는 두 변화의 폭이 다르고 방향도 다른 두 데이터 그래프의 유사도를 표현하며, 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값은 -0.500이고, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값은 -0.748이다.
도 4c는 두 데이터 그래프가 서로 무관하게 변화하는 경우의 유사도를 표현하며, 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값은 0이고, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값은 0.009이다.
도 4d는 변화 량이 다르고 유사한 방향성을 가지는 두 데이터 그래프들을 도시하며, 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값은 0.501이고, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값은 0.923이다.
도 4(e)는 거의 유사한 두 데이터 그래프들을 도시하며, 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값은 0.985이고, 피어슨 상관계수(Cor)를 이용하여 산출되는 유사도 값은 0.998이다.
도 5는 예시적인 펄스 형태의 시계열 데이터와 일 실시예에 따른 유사도 평가 시스템에 의해 산출된 유사도 값을 도시한다.
도 5에서 이용되는 본원의 데이터 유사도 평가 시스템(Sim)을 이용하여 산출되는 유사도 값에는 앞에서 언급된 가중치가 적용되어서 산출될 수 있다.
도 5(a)는 예시적인 펄스 형태 시계열 데이터인 ECG 측정 데이터를 도시한다.
도 5를 참조하여, 데이터 유사도 평가 시스템은 연속되는 하나의 주파수를 가진 시계열 데이터의 유사도를 평가할 수 있다.
예를 들어, 시계열 데이터는 심전도 데이터일 수 있다. 도 5(a)를 참조하여,처리부는 시계열 데이터의 제1 구간(a1) 내의 두 펄스를 각각 비교하여 유사도를 평가할 수 있다. 마찬가지로 처리부는 시계열 데이터의 제2 구간(a2) 내의 두 펄스를 각각 비교하여 유사도를 평가할 수 있다.
제1 구간(a1)은 상대적으로 전방 펄스와 후방 펄스의 모양이 유사한 구간이고, 제2 구간(a2)은 상대적으로 전방 펄스와 후방 펄스의 모양이 차이가 있는 구간이다.
도 5(b)는 제1 구간(a1) 및 제2 구간(a2) 각각의 인접한 전후방 펄스를 이용하여, 본원의 데이터 유사도 평가 시스템(Sim)을 통해 산출되는 유사도와 피어슨 상관계수(Cor)를 통해 산출되는 유사도의 값을 표현하는 그래프이다.
도 5(b)를 참조하여, 제1 구간(a1) 내의 두 펄스의 본원의 데이터 유사도 평가 시스템(Sim)을 통해 산출되는 유사도 값은 0.962이고, 피어슨 상관계수(Cor)를 통해 산출되는 유사도의 값은 0.995이다.
또한, 제2 구간(a2) 내의 두 펄스의 본원의 데이터 유사도 평가 시스템(Sim)을 통해 산출되는 유사도 값은 0.809이고, 피어슨 상관계수(Cor)를 통해 산출되는 유사도의 값은 0.983이다.
도 5(c)는 인접한 두 펄스를 비교하여 유사도가 가장 높은 부분인 제1 구간(a1)을 겹친 그래프를 도시하고, 도 5(d)는 인접한 두 펄스를 비교하여 유사도가 가장 적은 부분인 제2 구간(a2)을 겹친 그래프를 도시한다.
도 5(c) 및 도 5(d)를 참조하여, 도 5(c)의 두 펄스는 거의 유사한 반면, 도 5(d)의 두 펄스는 차이가 있음을 알 수 있다. 하지만 피어슨 상관계수를 이용하여 산출된 두 그래프의 유사도 값은 각각 0.995 및 0.983으로 큰 차이가 없음을 알 수 있고, 본원의 데이터 유사도 평가 시스템을 통해 산출되는 유사도 값은 각각 0.962 및 0.809로 상대적으로 차이가 있음을 알 수 있다.
이를 통해 본원의 데이터 유사도 평가 시스템을 통해 산출되는 유사도와 피어슨 상관계수를 통해 산출되는 유사도는 민감도의 차이가 있음을 알 수 있다. 특히 이러한 민감도는 가중치를 적용함으로써 증가될 수 있고 또는 감소될 수도 있다.
도 6은 예시적인 2차원 공간 데이터의 도면과 데이터를 일 실시예에 따른 유사도 평가 시스템으로 산출한 유사도를 도시한다.
구체적으로, 도 6은 도 6(a)를 기본으로 도 6(b) 내지 도 6(d)로 변화하는 2차원 공간 데이터를 도시하고, 도 6(b) 내지 도 6(d)와 도 6(a) 사이의 유사도를 표현한다.
예를 들어, 일 실시예에 따른 데이터 유사도 평가 시스템의 수집부는 복수 개의 채널을 통해서 복수 개의 2차원 데이터를 수집할 수 있다. 수집된 데이터들은 각각 2차원 좌표와 데이터 수치를 가질 수 있다. 데이터 수치는 256단계로 형성될 수 있으며, 이는 색상데이터 수치 0(검정)~255(흰색)로 표현될 수 잇다. 도 6(a)와 도 6(b)는 분포는 물론 색상데이터 수치도 거의 동일한 형태로 유사도가 0.992로 계산되었고, 도 6(a)와 도 6(c)는 분포와 색상데이터 수치와 분포도 달라 유사도가 0.646으로 계산되었다. 또한, 도 6(a)는 전반적으로 색상데이터 수치가 높고, 도 6(d)는 전체적으로 색상데이터 수치가 낮아서 0.301의 유사도로 평가되었다.
이상과 같이 본 발명의 실시예에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

Claims (12)

  1. 데이터들이 수집되는 수집부;
    상기 수집부를 통해 수집된 상기 데이터들을 비교하는 처리부; 및
    상기 처리부로부터 비교된 결과를 표시하는 표시부;
    를 포함하고,
    상기 데이터들은 제1 데이터 및 제2 데이터를 포함하며,
    상기 처리부는 상기 제1 데이터의 일 지점에서의 값과 기준 값의 차이인 제1 변화량과 상기 제2 데이터의 일 지점에서의 값과 기준 값의 차이인 제2 변화량의 비율인 변화량 비율을 산출하며,
    상기 처리부는 상기 변화량 비율이 1일 때 상기 제1 데이터 및 상기 제2 데이터들 사이의 유사도를 최대값으로 산정하고, 상기 변화량 비율이 -1일 때 상기 유사도를 최소값으로 산정하며, 상기 변화량 비율이 0일 때와 변화량 비율이 무한대로 발산할 때에는 상기 유사도를 0으로 계산하고,
    상기 유사도는 다음 유사도 평가 함수
    Figure 112018046435814-pat00021

    에 의해 계산되며,
    제1 변화량은 ΔAi로 표현되고,
    제2 변화량은 ΔBi로 표현되며,
    상기 n'은 상기 데이터의 지점들 중 유효한 지점들의 개수이고,
    상기 ri는 상기 변화량 비율인 제1 변화량(ΔBi)/제2 변화량(ΔAi)이며,
    상기 s(ri)는,
    Figure 112018046435814-pat00022

    에 의해 연산되고,
    상기 f(ri)는,
    Figure 112018046435814-pat00023

    으로 계산되고,
    상기 f(ri) 에서 a 및 b는 상수 값인, 데이터 유사도 평가 시스템.
  2. 삭제
  3. 제 1항에 있어서,
    상기 a는
    Figure 112018046435814-pat00024
    이며,
    상기 b는
    Figure 112018046435814-pat00025
    인, 데이터 유사도 평가 시스템
  4. 제 1항에 있어서,
    상기 유사도에는 가중치가 더해져서 다음 식
    Figure 112018046435814-pat00026

    에 의해 계산되고,
    상기 w(ri)에서 함수 w(x)는 특정 구간에 적용되는 가중치를 의미하며,
    상기 제1 변화량과 상기 제2 변화량 중 어떤 것도 0의 값을 가지지 않을 때 1이고,
    상기 제1 변화량과 상기 제2 변화량 둘 모두 0의 값을 가질 때 연산에서 제외되는, 데이터 유사도 평가 시스템.
  5. 제 4항에 있어서,
    상기 함수 w(x)는
    펄스 형태의 시계열 데이터에서
    w(ΔAi, ΔBi)
    으로 표현되며,
    w(ΔAi, ΔBi)은,
    상기 제1 변화량과 상기 제2 변화량 중 어떠한 하나의 값이라도 0이 아닐 때,
    Ai| + |ΔBi|
    으로 연산되고,
    상기 제1 변화량과 상기 제2 변화량 둘 모두의 값이 0일 때, 연산에서 제외되는, 데이터 유사도 평가 시스템.
  6. 제 1항에 있어서,
    상기 제1 변화량은 상기 제1 데이터의 일 지점에서 상기 제1 데이터의 평균을 뺀 값이고,
    상기 제2 변화량은 상기 제2 데이터의 일 지점에서 상기 제2 데이터의 평균을 뺀 값인, 데이터 유사도 평가 시스템.
  7. 제 1항에 있어서,
    상기 데이터는 2차원 또는 3차원 공간에 분포되는 공간데이터이며,
    상기 제1 데이터 및 상기 제2 데이터는 각각 2차원 또는 3차원 좌표값을 포함하고,
    상기 처리부는 일 좌표에서의 제1 데이터와 상기 일 좌표에 대응되는 좌표에서의 제2 데이터를 비교하는, 데이터 유사도 평가 시스템.
  8. 시계열 데이터를 수집하는 수집부;
    상기 수집부를 통해 수집된 상기 시계열 데이터를 이용하여 유사도를 산출하는 처리부; 및
    상기 처리부로부터 비교된 결과를 표시하는 표시부;
    를 포함하고,
    상기 처리부는 상기 시계열 데이터의 제1 지점에서의 값과 기준 값의 차이인 제1 변화량과 상기 시계열 데이터의 제2 지점에서의 값과 기준 값의 차이인 제2 변화량의 비율인 변화량 비율을 산출하며,
    상기 처리부는 상기 변화량 비율이 1일 때 상기 시계열 데이터의 상기 제1 지점과 상기 제2 지점 사이의 유사도를 최대값으로 산정하고, 상기 변화량 비율이 -1일 때 상기 유사도를 최소값으로 산정하며, 상기 변화량 비율이 0일 때와 변화량 비율이 무한대로 발산할 때에는 상기 유사도를 0으로 계산하고,
    상기 유사도는 다음 유사도 평가 함수
    Figure 112018046435814-pat00027

    에 의해 계산되며,
    제1 변화량은 ΔAi로 표현되고,
    제2 변화량은 ΔBi로 표현되며,
    상기 n'은 상기 데이터의 지점들 중 유효한 지점들의 개수이고,
    상기 ri는 상기 변화량 비율인 제1 변화량(ΔBi)/제2 변화량(ΔAi)이며,
    상기 s(ri)는,
    Figure 112018046435814-pat00028

    에 의해 연산되고,
    상기 f(ri) 는,
    Figure 112018046435814-pat00029

    으로 계산되고,
    상기 f(ri)에서 상기 a는
    Figure 112018046435814-pat00030
    이며 상기 b는
    Figure 112018046435814-pat00031
    인, 데이터 유사도 평가 시스템
  9. 삭제
  10. 제 8항에 있어서,
    상기 시계열 데이터는 심전도 데이터이고,
    상기 처리부는 상기 심전도 데이터의 복수 개의 펄스를 구간별로 구분하며,
    상기 제1 변화량은 상기 심전도 데이터의 일 펄스 구간에서의 변화량이며,
    상기 제2 변화량은 상기 심전도 데이터의 다른 일 펄스 구간에서의 변화량인, 데이터 유사도 평가 시스템.
  11. 제 10항에 있어서,
    상기 제1 변화량과 상기 제2 변화량은 시계열 데이터 상에서 서로 인접한 데이터를 이용하여 산출하는 변화량인, 데이터 유사도 평가 시스템.
  12. 제 8항에 있어서,
    상기 시계열 데이터는 측정된 심전도 데이터와 저장된 시계열 데이터를 포함하고,
    상기 처리부는 각각의 상기 측정된 시계열 데이터와 상기 저장된 시계열 데이터들의 동일 시점 데이터를 서로 비교하여 유사도를 산출하는, 데이터 유사도 평가 시스템.

KR1020160143596A 2016-10-31 2016-10-31 데이터 유사도 평가 시스템 KR101908786B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160143596A KR101908786B1 (ko) 2016-10-31 2016-10-31 데이터 유사도 평가 시스템
PCT/KR2017/006499 WO2018079975A1 (ko) 2016-10-31 2017-06-21 데이터 유사도 평가 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160143596A KR101908786B1 (ko) 2016-10-31 2016-10-31 데이터 유사도 평가 시스템

Publications (2)

Publication Number Publication Date
KR20180047484A KR20180047484A (ko) 2018-05-10
KR101908786B1 true KR101908786B1 (ko) 2018-10-17

Family

ID=62025085

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160143596A KR101908786B1 (ko) 2016-10-31 2016-10-31 데이터 유사도 평가 시스템

Country Status (2)

Country Link
KR (1) KR101908786B1 (ko)
WO (1) WO2018079975A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210035613A (ko) 2019-09-24 2021-04-01 주식회사 디셈버앤컴퍼니자산운용 시계열 데이터 유사도 계산 시스템 및 방법
KR20210035622A (ko) 2019-09-24 2021-04-01 주식회사 디셈버앤컴퍼니자산운용 시계열 데이터 유사도 계산 시스템 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113855040B (zh) * 2021-11-09 2023-04-14 郑州大学第一附属医院 一种嵌入式儿童心电监护设备及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016050830A (ja) * 2014-08-29 2016-04-11 日置電機株式会社 波形記録装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW342478B (en) * 1996-01-08 1998-10-11 Matsushita Electric Ind Co Ltd Time series signal predicting apparatus
JP2002015000A (ja) * 2000-06-29 2002-01-18 Toshiba Corp 多変数時系列データ類似度判定装置
KR101079785B1 (ko) * 2010-04-19 2011-11-03 주식회사 멕 아이씨에스 마취심도 지표 산출을 위한 뇌전도 분석 장치
KR101578167B1 (ko) * 2014-05-29 2015-12-17 경북대학교 산학협력단 심전도 생체정보를 이용한 실시간 개인 인증방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016050830A (ja) * 2014-08-29 2016-04-11 日置電機株式会社 波形記録装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210035613A (ko) 2019-09-24 2021-04-01 주식회사 디셈버앤컴퍼니자산운용 시계열 데이터 유사도 계산 시스템 및 방법
KR20210035622A (ko) 2019-09-24 2021-04-01 주식회사 디셈버앤컴퍼니자산운용 시계열 데이터 유사도 계산 시스템 및 방법

Also Published As

Publication number Publication date
KR20180047484A (ko) 2018-05-10
WO2018079975A1 (ko) 2018-05-03

Similar Documents

Publication Publication Date Title
US9289150B1 (en) Non-invasive method and system for characterizing cardiovascular systems
Azami et al. Amplitude-aware permutation entropy: Illustration in spike detection and signal segmentation
US20150080752A1 (en) Device for automatic mapping of complex fractionated atrial electrogram
Khoa et al. Higuchi fractal properties of onset epilepsy electroencephalogram
KR101908786B1 (ko) 데이터 유사도 평가 시스템
Satuvuori et al. Which spike train distance is most suitable for distinguishing rate and temporal coding?
CN103501694A (zh) 测量生理信号质量的装置及方法
EP3322327B1 (en) Methods for adaptive noise quantification in dynamic biosignal analysis
Mahan et al. White Noise Test: detecting autocorrelation and nonstationarities in long time series after ARIMA modeling.
CN101835421B (zh) 特征量候选生成装置和特征量候选生成方法
Mercy Cleetus et al. Multifractal application on electrocardiogram
JPWO2019069417A1 (ja) 生体情報処理装置、生体情報処理システム、生体情報処理方法、およびプログラム
US11331048B2 (en) Brain connectivity analysis system and brain connectivity analysis method
KR20190128841A (ko) 심전도 신호의 클러스터링 방법 및 이를 수행하기 위한 심전도 처리 장치
IL109721A (en) Analysis of heart wave forms
EP3202319B1 (en) Method for detecting position of signal source in living body, and device for detecting position of signal source in living body
Contoyiannis et al. Criticality in the relaxation phase of a spontaneously contracting atria isolated from a frog's heart
JP6203324B1 (ja) 認知状態推定システム及び認知状態推定方法
Brzozowska et al. Selection of phase space reconstruction parameters for EMG signals of the uterus
Cox et al. Recovering quasi-active properties of dendritic neurons from dual potential recordings
Luck et al. Standardized measurement error as a universal measure of data quality for event-related potentials: An overview
KR102147568B1 (ko) 맥파 신호의 평활도를 결정하는 장치 및 방법
Upham et al. Limits on the application of statistical correlations to continuous response data
Berief et al. Modelling and synthesizing motion artifacts in unobtrusive multimodal sensing using copulas
Pizá et al. Discriminability measures and time–frequency features: An application to vibrissal tactile discrimination

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant