KR20200082893A - 시계열 데이터 처리 장치 및 이의 동작 방법 - Google Patents

시계열 데이터 처리 장치 및 이의 동작 방법 Download PDF

Info

Publication number
KR20200082893A
KR20200082893A KR1020180173917A KR20180173917A KR20200082893A KR 20200082893 A KR20200082893 A KR 20200082893A KR 1020180173917 A KR1020180173917 A KR 1020180173917A KR 20180173917 A KR20180173917 A KR 20180173917A KR 20200082893 A KR20200082893 A KR 20200082893A
Authority
KR
South Korea
Prior art keywords
data
time series
feature
weight
time
Prior art date
Application number
KR1020180173917A
Other languages
English (en)
Other versions
KR102501530B1 (ko
Inventor
한영웅
박흰돌
최재훈
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020180173917A priority Critical patent/KR102501530B1/ko
Priority to US16/694,921 priority patent/US20200210895A1/en
Publication of KR20200082893A publication Critical patent/KR20200082893A/ko
Application granted granted Critical
Publication of KR102501530B1 publication Critical patent/KR102501530B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Public Health (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Primary Health Care (AREA)
  • Computational Mathematics (AREA)
  • Epidemiology (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)

Abstract

본 발명은 시계열 데이터 처리 장치 및 이의 동작 방법에 관한 것이다. 본 발명의 실시예에 따른 시계열 데이터 처리 장치는 전처리기, 학습기, 및 예측기를 포함한다. 전처리기는 시계열 데이터를 전처리하여 간격 데이터, 보간 데이터, 및 마스킹 데이터를 생성한다. 학습기는 간격 데이터, 보간 데이터, 및 마스킹 데이터에 기초하여, 특징 가중치 및 시계열 가중치를 생성하기 위한 예측 모델의 가중치 그룹을 생성할 수 있다. 특징 가중치는 시계열 데이터의 시간 및 특징에 의존하고, 시계열 가중치는 시계열 데이터의 시간 흐름에 의존한다. 예측기는 가중치 그룹에 기초하여 특징 가중치 및 시계열 가중치를 생성하고, 특징 가중치 및 시계열 가중치에 기초하여 예측 결과를 생성한다. 본 발명에 따르면, 시계열 데이터의 불규칙한 시간 간격 및 결측치를 보정함으로써 예측 결과의 정확성 및 신뢰성을 향상시킬 수 있다.

Description

시계열 데이터 처리 장치 및 이의 동작 방법{TIME SERIES DATA PROCESSING DEVICE AND OPERATING METHOD THEREOF}
본 발명은 시계열 데이터의 처리에 관한 것으로, 좀 더 구체적으로 예측 모델을 학습하거나 이용하는 시계열 데이터 처리 장치 및 이의 동작 방법에 관한 것이다.
의료 기술을 비롯한 각종 기술의 발달은 인간의 생활 수준을 향상시키고, 인간의 수명을 늘리고 있다. 다만, 기술 발달에 따른, 생활 양식의 변화와 잘못된 식습관 등은 다양한 질병 등을 유발시키고 있다. 건강한 삶을 영위하기 위하여, 현재의 질병을 치료하는 것에서 나아가 미래의 건강 상태를 예측하기 위한 요구가 제기되고 있다. 이에 따라, 시간의 흐름에 따른 시계열 의료 데이터의 추이를 분석함으로써, 미래 시점의 건강 상태를 예측하는 방안이 제기되고 있다.
산업 기술과 정보 통신 기술의 발달은 상당한 규모의 정보 및 데이터를 생성하게 만들고 있다. 최근에는, 이러한 수많은 정보 및 데이터를 이용하여, 컴퓨터와 같은 전자 장치를 학습시켜, 다양한 서비스를 제공하는 인공 지능과 같은 기술이 대두되고 있다. 특히, 미래의 건강 상태를 예측하기 위하여, 다양한 시계열 의료 데이터를 이용한 예측 모델을 구축하는 방안이 제기되고 있다. 예를 들어, 시계열 의료 데이터는 불규칙한 시간 간격, 및 복합적이고 특정되지 않은 특징을 갖는 점에서, 다른 분야에서 수집되는 데이터와 차이점을 갖는다. 따라서, 미래의 건강 상태를 예측하기 위하여, 시계열 의료 데이터를 효과적으로 처리하고 분석하기 위한 요구가 제기되고 있다.
본 발명은 시계열 데이터의 불규칙한 시간 간격 및 결측치(missing value)를 보정함으로써 예측 결과의 정확성 및 신뢰성을 향상시키는 시계열 데이터 처리 장치 및 이의 동작 방법을 제공할 수 있다.
본 발명의 실시예에 따른 시계열 데이터 처리 장치는 전처리기 및 학습기를 포함한다. 전처리기는 시계열 데이터의 시간 간격에 기초하여 간격 데이터를 생성하고, 시계열 데이터의 결측치에 보간 값을 추가하여 보간 데이터를 생성하고, 결측치를 구분하는 마스킹 데이터를 생성한다. 학습기는 간격 데이터, 보간 데이터, 및 마스킹 데이터에 기초하여, 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치, 및 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성하기 위한 예측 모델의 가중치 그룹을 생성한다. 가중치 그룹은 특징 가중치를 생성하기 위한 제1 파라미터, 및 시계열 가중치를 생성하기 위한 제2 파라미터를 포함한다.
일례로, 학습기는 특징 학습기, 시계열 학습기, 및 가중치 제어기를 포함할 수 있다. 특징 학습기는 마스킹 데이터, 간격 데이터, 보간 데이터, 및 제1 파라미터에 기초하여 특징 가중치를 계산하고, 특징 가중치에 기초하여 제1 학습 결과를 생성할 수 있다. 시계열 학습기는 제1 학습 결과 및 제2 파라미터에 기초하여 시계열 가중치를 계산하고, 시계열 가중치에 기초하여 제2 학습 결과를 생성할 수 있다. 가중치 제어기는 제1 학습 결과 또는 제2 학습 결과에 기초하여, 제1 파라미터 또는 제2 파라미터를 조절할 수 있다.
일례로, 특징 학습기는, 마스킹 데이터에 기초하여 보간 데이터의 제1 보정 데이터를 생성하는 결측치 처리기, 간격 데이터에 기초하여 보간 데이터의 제2 보정 데이터를 생성하는 시간 처리기, 제1 파라미터, 제1 보정 데이터, 및 제2 보정 데이터에 기초하여 특징 가중치를 계산하는 특징 가중치 계산기, 및 보간 데이터에 특징 가중치를 적용하는 특징 가중치 적용기를 포함할 수 있다. 일례로, 시계열 학습기는, 제1 학습 결과 및 제2 파라미터에 기초하여 시계열 가중치를 계산하는 시계열 가중치 계산기, 및 제1 학습 결과에 시계열 가중치를 적용하는 시게열 가중치 적용기를 포함할 수 있다.
일례로, 학습기는 특징 학습기, 시계열 학습기, 및 가중치 제어기를 포함할 수 있다. 특징 학습기는 마스킹 데이터, 보간 데이터, 및 제1 파라미터에 기초하여 특징 가중치를 계산하고, 특징 가중치에 기초하여 제1 학습 결과를 생성할 수 있다. 시계열 학습기는 간격 데이터, 제1 학습 결과, 및 제2 파라미터에 기초하여 시계열 가중치를 계산하고, 시계열 가중치에 기초하여 제2 학습 결과를 생성할 수 있다. 가중치 제어기는 제1 학습 결과 또는 제2 학습 결과에 기초하여, 제1 파라미터 또는 제2 파라미터를 조절할 수 있다.
일례로, 특징 학습기는, 마스킹 데이터에 기초하여 보간 데이터의 보정 데이터를 생성하는 결측치 처리기, 제1 파라미터 및 보정 데이터에 기초하여 특징 가중치를 계산하는 특징 가중치 계산기, 및 보간 데이터에 특징 가중치를 적용하는 특징 가중치 적용기를 포함할 수 있다. 일례로, 시계열 학습기는, 간격 데이터에 기초하여, 제1 학습 결과의 보정 데이터를 생성하는 시간 처리기, 제2 파라미터 및 보정 데이터에 기초하여 시계열 가중치를 계산하는 시계열 가중치 계산기, 및 제1 학습 결과에 시계열 가중치를 적용하는 시계열 가중치 적용기를 포함할 수 있다.
일례로, 학습기는 특징 학습기, 시계열 학습기, 통합 가중치 적용기, 및 가중치 제어기를 포함할 수 있다. 특징 학습기는 마스킹 데이터, 보간 데이터, 및 제1 파라미터에 기초하여 특징 가중치를 계산할 수 있다. 시계열 학습기는 간격 데이터, 보간 데이터, 및 제2 파라미터에 기초하여 시계열 가중치를 계산할 수 있다. 통합 가중치 적용기는 특징 가중치 및 시계열 가중치에 기초하여 학습 결과를 생성할 수 있다. 가중치 제어기는 학습 결과에 기초하여, 제1 파라미터 또는 제2 파라미터를 조절할 수 있다.
본 발명의 실시예에 따른 시계열 데이터 처리 장치는 전처리기 및 예측기를 포함한다. 전처리기는 간격 데이터, 보간 데이터, 및 마스킹 데이터를 생성한다. 예측기는 간격 데이터, 보간 데이터, 및 마스킹 데이터에 기초하여, 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치, 및 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성한다. 예측기는 특징 가중치 및 상기 시계열 가중치에 기초하여 예측 결과를 생성한다.
일례로, 예측기는 특징 예측기, 시계열 예측기, 및 결과 생성기를 포함할 수 있다. 특징 예측기는 특징 가중치에 기초하여 제1 결과를 생성할 수 있다. 시계열 예측기는 시계열 가중치에 기초하여 제2 결과를 생성할 수 있다. 결과 생성기는 제2 결과에 기초하여 예측 시간에 대응되는 예측 결과를 계산할 수 있다.
일례로, 특징 예측기는, 마스킹 데이터에 기초하여 보간 데이터를 인코딩하는 결측치 처리기, 간격 데이터를 모델링하는 시간 처리기, 인코딩된 보간 데이터에 기초하여 특징 분석 데이터를 생성하고 특징 분석 데이터 및 모델링된 간격 데이터에 기초하여 특징 가중치를 생성하는 특징 가중치 계산기, 및 특징 분석 데이터에 특징 가중치를 적용하여 제1 결과를 생성하는 특징 가중치 적용기를 포함할 수 있다.
일례로, 특징 예측기는, 마스킹 데이터 및 보간 데이터를 병합하는 결측치 처리기, 간격 데이터를 모델링하는 시간 처리기, 병합된 데이터에 기초하여 특징 분석 데이터를 생성하고 특징 분석 데이터 및 모델링된 간격 데이터에 기초하여 특징 가중치를 생성하는 특징 가중치 계산기, 및 특징 분석 데이터에 특징 가중치를 적용하여 제1 결과를 생성하는 특징 가중치 적용기를 포함할 수 있다.
일례로, 특징 예측기는, 마스킹 데이터를 모델링하는 결측치 처리기, 간격 데이터를 모델링하는 시간 처리기, 보간 데이터에 기초하여 특징 분석 데이터를 생성하고 모델링된 마스킹 데이터, 모델링된 간격 데이터, 및 특징 분석 데이터에 기초하여 특징 가중치를 생성하는 특징 가중치 계산기, 및 특징 분석 데이터에 특징 가중치를 적용하여 제1 결과를 생성하는 특징 가중치 적용기를 포함할 수 있다.
일례로, 특징 예측기는, 마스킹 데이터를 모델링하는 결측치 처리기, 간격 데이터 및 보간 데이터를 병합하는 시간 처리기, 병합된 데이터에 기초하여 특징 분석 데이터를 생성하고 특징 분석 데이터 및 모델링된 마스킹 데이터에 기초하여 특징 가중치를 생성하는 특징 가중치 계산기, 및 특징 분석 데이터에 특징 가중치를 적용하여 제1 결과를 생성하는 특징 가중치 적용기를 포함할 수 있다.
일례로, 시계열 예측기는, 제1 결과에 기초하여 시계열 분석 데이터를 생성하고 시계열 분석 데이터에 기초하여 시계열 가중치를 생성하는 시계열 가중치 계산기, 및 제1 결과 또는 시계열 분석 데이터에 시계열 가중치를 적용하는 시계열 가중치 적용기를 포함할 수 있다.
본 발명의 실시예에 따른 시계열 데이터 처리 장치의 동작 방법은 보간 데이터를 생성하는 단계, 간격 데이터를 생성하는 단계, 마스킹 데이터를 생성하는 단계, 보간 데이터, 간격 데이터, 및 마스킹 데이터에 기초하여 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치를 생성하는 단계, 특징 가중치에 기초하여 제1 결과를 생성하는 단계, 제1 결과에 기초하여 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성하는 단계, 및 시계열 가중치에 기초하여 제2 결과를 생성하는 단계를 포함한다.
일례로, 상기 방법은 제2 결과에 기초하여, 특징 가중치 또는 시계열 가중치를 생성하기 위한 파라미터를 조절하는 단계를 더 포함할 수 있다. 일례로, 상기 방법은 제2 결과에 기초하여, 예측 시간에 대응되는 예측 결과를 계산하는 단계를 더 포함할 수 있다.
본 발명의 실시예에 따른 시계열 데이터 처리 장치 및 이의 동작 방법은 불규칙한 시간 간격, 및 결측치를 고려하여 시계열 데이터를 전처리함으로써, 예측 결과의 정확성 및 신뢰성을 향상시킬 수 있다.
또한, 본 발명의 실시예에 따른 시계열 데이터 처리 장치 및 이의 동작 방법은 시계열 데이터의 시간 및 특징에 관한 가중치들을 종합적으로 고려하도록 예측 모델을 구축함으로써, 예측 결과의 정확성 및 신뢰성을 향상시킬 수 있다.
도 1은 본 발명의 실시예에 따른 시계열 데이터 처리 장치의 블록도이다.
도 2는 도 1에서 설명된 시계열 데이터의 시계열적 불규칙성 및 결측치를 설명하기 위한 그래프이다.
도 3은 도 1의 전처리기의 예시적인 블록도이다.
도 4는 도 1의 학습기의 예시적인 블록도이다.
도 5는 도 1의 예측기의 예시적인 블록도이다.
도 6 내지 도 9는 도 5의 예측기를 구체화한 도면이다.
도 10 및 도 11은 도 1의 학습기 또는 예측기의 예시적인 블록도이다.
도 12는 도 1의 시계열 데이터 처리 장치가 적용된 건강 상태 예측 시스템을 도시한 도면이다.
도 13은 도 1 또는 도 12의 시계열 데이터 처리 장치의 예시적인 블록도이다.
아래에서는, 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 정도로, 본 발명의 실시 예들이 명확하고 상세하게 기재된다.
도 1은 본 발명의 실시예에 따른 시계열 데이터 처리 장치의 블록도이다. 도 1의 시계열 데이터 처리 장치(100)는 시계열 데이터를 전처리하고, 전처리된 시계열 데이터를 분석하여 예측 모델을 학습하거나, 예측 결과를 생성하기 위한 예시적인 구성으로 이해될 것이다. 도 1을 참조하면, 시계열 데이터 처리 장치(100)는 전처리기(110), 학습기(120), 및 예측기(130)를 포함한다.
전처리기(110), 학습기(120), 및 예측기(130)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다. 일례로, 소프트웨어 (또는 펌웨어)는 시계열 데이터 처리 장치(100)에 포함되는 메모리(미도시)에 로딩되어, 프로세서(미도시)에 의하여 실행될 수 있다. 일례로, 전처리기(110), 학습기(120), 및 예측기(130)는 FPGA(Field Programmable Gate Aray) 또는 ASIC(Application Specific Integrated Circuit)와 같은 전용 논리 회로 등의 하드웨어로 구현될 수 있다.
전처리기(110)는 시계열 데이터를 전처리할 수 있다. 시계열 데이터는 시간의 흐름에 따라 기록된, 시간적 순서를 갖는 데이터 집합일 수 있다. 시계열 데이터는 시계열적으로 나열된 복수의 시간들 각각에 대응되는 적어도 하나의 특징들을 포함할 수 있다. 일례로, 시계열 데이터는 전자 의무 기록(Electronic Medical Record, EMR)과 같이, 의료 기관에서 진단, 치료, 또는 투약 처방 등에 의하여 생성된 사용자의 건강 상태를 나타내는 시계열 의료 데이터를 포함할 수 있다. 설명의 명확성을 위하여, 시계열 의료 데이터가 예시적으로 설명되었으나, 시계열 데이터의 종류는 이에 제한되지 않고, 시계열 데이터는 엔터테인먼트, 리테일, 스마트 매니지먼트 등 다양한 분야에서 생성될 수 있다.
전처리기(110)는 시계열 데이터의 시계열적 불규칙성, 결측치, 특징들 간의 형식(type) 차이 등을 보정하도록, 시계열 데이터를 전처리할 수 있다. 시계열 불규칙성은 복수의 시간들 사이의 시간 간격이 규칙성을 갖지 않음을 의미한다. 결측치는, 복수의 특징들 중 특정 시간에 누락되거나 존재하지 않는 특징을 의미한다. 특징들 간의 형식 차이는 특징마다 값을 생성하는 기준이 다름을 의미한다. 전처리기(110)는 시계열 불규칙성이 시계열 데이터에 반영되고, 결측치를 보간하고, 특징들 간의 형식을 일치시키도록, 시계열 데이터를 전처리할 수 있다. 구체적인 내용은 후술된다.
학습기(120)는 전처리된 시계열 데이터에 기초하여, 예측 모델을 학습할 수 있다. 예측 모델은 전처리된 시계열 데이터를 분석하여 미래의 예측 결과를 계산하기 위한 시계열 분석 모델을 포함할 수 있다. 일례로, 예측 모델은 인공 신경망(artificial neural network) 또는 딥러닝 기계 학습을 통하여 구축될 수 있다. 이를 위하여, 시계열 데이터 처리 장치(100)는 학습 데이터베이스(101)로부터 학습을 위한 시계열 데이터를 수신할 수 있다. 학습 데이터베이스(101)는 시계열 데이터 처리 장치(100) 외부 또는 내부의 서버 또는 저장 매체에 구현될 수 있다. 학습 데이터베이스(101)에서 데이터는 시계열적으로 관리되고, 그룹핑되어 저장될 수 있다. 전처리기(110)는 학습 데이터베이스(101)로부터 수신된 시계열 데이터를 전처리하여, 학습기(120)에 제공할 수 있다.
학습기(120)는 전처리된 시계열 데이터를 분석하여, 예측 모델의 가중치 그룹을 생성할 수 있다. 학습기(120)는 시계열 데이터의 분석을 통하여 예측 결과를 생성할 수 있고, 생성된 예측 결과가 기대 값을 갖도록 예측 모델의 가중치 그룹을 조절할 수 있다. 가중치 그룹은 예측 모델의 신경망 네트워크 구조 또는 신경망 네트워크에 포함된 모든 파라미터들의 집합일 수 있다. 가중치 그룹 및 예측 모델은 가중치 모델 데이터베이스(103)에 저장될 수 있다. 가중치 모델 데이터베이스(103)는 시계열 데이터 처리 장치(100) 외부 또는 내부의 서버 또는 저장 매체에 구현될 수 있다. 가중치 그룹 및 예측 모델은 가중치 모델 데이터베이스(103)에서 관리 및 저장될 수 있다.
예측기(130)는 전처리된 시계열 데이터를 분석하여 예측 결과를 생성할 수 있다. 예측 결과는 미래의 특정 시점과 같은 예측 시간에 대응되는 결과일 수 있다. 이를 위하여, 시계열 데이터 처리 장치(100)는 타겟 데이터베이스(102)로부터 예측을 위한 시계열 데이터를 수신할 수 있다. 타겟 데이터베이스(102)는 시계열 데이터 처리 장치(100) 외부 또는 내부의 서버 또는 저장 매체에 구현될 수 있다. 타겟 데이터베이스(102)에서 데이터는 시계열적으로 관리되고, 그룹핑되어 저장될 수 있다. 전처리기(110)는 타겟 데이터베이스(102)로부터 수신된 시계열 데이터를 전처리하여, 예측기(130)에 제공할 수 있다.
예측기(130)는 학습기(120)로부터 학습된 예측 모델 및 가중치 그룹에 기초하여, 전처리된 시계열 데이터를 분석할 수 있다. 이를 위하여, 예측기(130)는 가중치 모델 데이터베이스(103)로부터 가중치 그룹 및 예측 모델을 수신할 수 있다. 예측기(130)는 전처리된 시계열 데이터의 시계열적 추이를 분석함으로써, 예측 결과를 계산할 수 있다. 예측 결과는 예측 결과 데이터베이스(104)에 저장될 수 있다. 예측 결과 데이터베이스(104)는 시계열 데이터 처리 장치(100) 외부 또는 내부의 서버 또는 저장 매체에 구현될 수 있다.
도 2는 도 1에서 설명된 시계열 데이터의 시계열적 불규칙성 및 결측치를 설명하기 위한 그래프이다. 가로축은 시간으로 정의되고, 세로축은 특징으로 정의된다. 도 2를 참조하면, 시계열 데이터는 시계열적으로 나열된 제1 내지 제5 데이터(D1~D5)를 포함하는 것으로 가정한다. 시계열 데이터는 제1 내지 제4 특징들(f1~f4)을 포함하는 것으로 가정한다. 설명의 편의상, 도 2의 시계열 데이터는 의료 데이터를 포함하는 것으로 가정한다.
시계열 데이터는 시간 및 특징의 2개의 차원으로 구성될 수 있다. 즉, 시계열 데이터는 복수의 시간들(t1~t5)에 대응되는 복수의 특징들(f1~f4)을 포함할 수 있다. 이러한 시계열 데이터를 분석하여 미래 시점에 대응되는 예측 결과가 계산될 수 있다. 예측 결과의 정확성 및 신뢰성을 향상시키기 위하여, 시간 및 특징 모두를 고려하는 예측 모델이 요구될 수 있다. 도 1의 시계열 데이터 처리 장치(100)는 시계열 데이터의 시간 및 특징 모두를 반영하여, 학습 및 예측을 수행할 수 있다. 이러한 구체적인 내용은 후술된다.
시계열 데이터는 결측치(missing value)를 가질 수 있다. 예를 들어, 제1 데이터(D1) 및 제4 데이터(D4)는 제2 특징(f2)을 포함하지 않고, 제5 데이터(D5)는 제1 특징(f1)을 포함하지 않을 수 있다. 이러한 특징들은 결측치로 정의될 수 있다. 시계열 데이터의 특징들은 진단, 치료, 또는 투약 처방 등에 기초하여 생성될 수 있는다. 의료 기관은 항상 동일한 검사 등을 수행하지 않으므로, 시계열 데이터에 결측치가 발생될 수 있다. 시계열 데이터가 분석될 때, 결측치는 예측 결과 또는 학습 결과의 정확성 및 신뢰성을 감소시킨다. 도 1의 시계열 데이터 처리 장치(100)는 시계열 데이터의 결측치를 고려하여, 학습 및 예측을 수행할 수 있다. 이러한 구체적인 내용은 후술된다.
시계열 데이터는 불규칙한 시간 간격을 가질 수 있다. 제1 내지 제5 데이터(D1~D5)는 각각 제1 내지 제5 시간들(t1~t5)에 생성, 측정, 또는 기록될 수 있다. 예를 들어, 제1 내지 제5 시간들(t1~t5)은 의료 기관에서 진단, 치료, 또는 투약 처방을 받은 시간일 수 있다. 도 2에 도시된 바와 같이, 제1 내지 제5 시간들(t1~t5) 사이의 제1 내지 제4 시간 간격들(i1~i4)은 불규칙할 수 있다. 의료 기관의 방문은 일정하지 않기 때문이다. 일반적인 시계열 분석은 센서를 통하여 일정한 시간에 수집된 데이터와 같이, 시간 간격이 일정한 것을 가정한다. 이러한 분석은 불규칙적인 시간 간격을 고려하지 못할 수 있다. 도 1의 시계열 데이터 처리 장치(100)는 불규칙한 시간 간격을 반영하여, 학습 및 예측을 수행할 수 있다. 이러한 구체적인 내용은 후술된다.
도 3은 도 1의 전처리기의 예시적인 블록도이다. 도 3의 블록도는 도 2에서 언급된 시간과 특징의 복합성, 결측치의 존재, 및 불규칙한 시간 간격을 고려하여, 시계열 데이터(TSD)를 전처리하는 예시적인 구성으로 이해될 것이다. 도 3을 참조하면, 전처리기(110)는 특징 전처리기(111) 및 시계열 전처리기(116)를 포함할 수 있다. 도 1에서 설명된 바와 같이, 특징 전처리기(111) 및 시계열 전처리기(116)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다.
특징 전처리기(111) 및 시계열 전처리기(116)는 시계열 데이터(TSD)를 수신한다. 시계열 데이터(TSD)는 예측 모델의 학습을 위한 데이터이거나, 학습된 예측 모델을 통하여 예측 결과를 계산하기 위한 데이터일 수 있다. 예시적으로, 시계열 데이터(TSD)는 제1 내지 제3 데이터(D1~D3)를 포함하며, 도 2의 제1 내지 제3 데이터(D1~D3)에 대응된다. 제1 내지 제3 데이터(D1~D3) 각각은 제1 내지 제4 특징들을 포함할 수 있다. 도 2와 같이, 제1 데이터(D1)는 제2 특징(f2)을 포함하지 않는다.
특징 전처리기(111)는 시계열 데이터(TSD)를 전처리하여, 보간 데이터(PD)를 생성할 수 있다. 보간 데이터(PD)는 동일한 타입을 갖도록 변환된 시계열 데이터(TSD)의 특징들을 포함할 수 있다. 보간 데이터(PD)는 시계열 데이터(TSD)와 동일한 개수의 시간들 및 특징들을 가질 수 있다. 보간 데이터(PD)는 결측치를 보간한 시계열 데이터일 수 있다. 시계열 데이터(TSD)의 특징들이 동일한 타입을 갖고 결측치가 보간된 경우, 도 1의 학습기(120) 또는 예측기(130)에 의한 시계열 분석이 용이할 수 있다. 보간 데이터(PD)를 생성하기 위하여, 특징 전처리기(111)에 수치화 모듈(112), 특징 정규화 모듈(113), 및 결측치 생성 모듈(114)이 구현될 수 있다.
특징 전처리기(111)는 시계열 데이터(TSD)를 전처리하여, 마스킹 데이터(MD)를 생성할 수 있다. 마스킹 데이터(MD)는 시계열 데이터(TSD)의 결측치와 실제 값들을 구분하기 위한 데이터일 수 있다. 마스킹 데이터(MD)는 시계열 데이터(TSD)와 동일한 개수의 시간들 및 특징들을 가질 수 있다. 마스킹 데이터(MD)는 시계열 분석 시에, 결측치를 실제 값과 동일한 중요도로 취급하지 않도록 생성될 수 있다. 마스킹 데이터(MD)를 생성하기 위하여, 특징 전처리기(111)에 마스크 생성 모듈(115)이 구현될 수 있다.
수치화 모듈(112)은 시계열 데이터(TSD)에서 수치가 아닌 특징들의 형식을 수치 형식으로 변환할 수 있다. 수치가 아닌 형식은 코드 형식 또는 범주 형식(Categorical type) (예를 들어, -, +, ++ 등)을 포함할 수 있다. 예를 들어, EMR 데이터는 특정 질환, 처방, 또는 검사에 따라 약속된 데이터 형식을 가질 수 있으나, 수치 형식과 수치가 아닌 형식이 혼재될 수 있다. 예를 들어, 제1 내지 제3 데이터(D1~D3) 각각의 제4 특징은 수치가 아닌 값(E10, E10, E19)을 갖는다. 수치화 모듈(112)은 시계열 데이터(TSD)의 제4 특징들(E10, E10, E19)를 보간 데이터(PD)의 제4 특징들(0.1, 0.1, 0.2)과 같은 수치 형식으로 변환할 수 있다. 일례로, 수치화 모듈(112)은 Word2Vec과 같은 임베딩 방식으로 특징들을 수치화할 수 있다.
특징 정규화 모듈(113)은 시계열 데이터(TSD)의 수치들을 기준 범위의 값으로 변환할 수 있다. 예를 들어, 기준 범위는 0 내지 1, 또는 -1 내지 1 사이의 수치를 포함할 수 있다. 시계열 데이터(TSD)는 특징에 따라, 독립적인 범위의 수치를 가질 수 있다. 예를 들어, 제1 내지 제3 데이터(D1~D3) 각각의 제3 특징은 기준 범위를 벗어나는 수치 값(10, 20, 15)을 갖는다. 특징 정규화 모듈(113)은 시계열 데이터(TSD)의 제3 특징들(10, 20, 15)을 보간 데이터(PD)의 제3 특징들(0.4, 0.7, 0.5)과 같은 기준 범위로 정규화할 수 있다.
결측치 생성 모듈(114)은 시계열 데이터(TSD)의 결측치에 보간 값을 추가할 수 있다. 보간 값은 기설정된 값을 갖거나, 시계열 데이터(TSD)의 다른 값에 기초하여 생성될 수 있다. 예를 들어, 보간 값은 0, 다른 시간의 특징들의 중간 값, 평균 값, 또는 인접한 시간의 특징 값을 가질 수 있다. 예를 들어, 제1 데이터(D1)의 제2 특징은 결측치를 갖는다. 결측치 생성 모듈(114)은 제1 데이터(D1)에 시간적으로 인접한 제2 데이터(D2)의 제2 특징 값인 0.3으로 보간 값을 설정할 수 있다.
마스크 생성 모듈(115)은 결측치에 기초하여, 마스킹 데이터(MD)를 생성한다. 마스크 생성 모듈(115)은 결측치에 대응되는 값과 다른 값들(실제 값)에 대응되는 값을 다르게 설정하여, 마스킹 데이터(MD)를 생성할 수 있다. 예를 들어, 결측치에 대응되는 값은 0이고, 실제 값에 대응되는 값은 1일 수 있다.
시계열 전처리기(116)는 시계열 데이터(TSD)를 전처리하여, 간격 데이터(ID)를 생성할 수 있다. 간격 데이터(ID)는 시계열 데이터(TSD)의 인접한 시간의 데이터 사이의 시간 간격 정보를 포함할 수 있다. 간격 데이터(ID)는 시간 차원에서 시계열 데이터(TSD)와 동일한 개수의 값들을 가질 수 있다. 간격 데이터(ID)는 특징 차원에서 시계열 데이터(TSD)와 동일한 개수의 값들을 갖거나, 하나의 값을 가질 수 있다. 예시적으로, 제1 데이터(D1)와 제2 데이터(D2)는 제1 시간 간격(i1)을 갖고, 제2 데이터(D2)와 제3 데이터(D3)는 제2 시간 간격(i2)을 가질 수 있다. 간격 데이터(ID)는 시계열 분석 시에, 시계열적 불규칙성을 고려할 수 있도록 생성될 수 있다. 간격 데이터(ID)를 생성하기 위하여, 시계열 전처리기(116)에 불규칙성 계산 모듈(117) 및 시간 정규화 모듈(118)이 구현될 수 있다.
불규칙성 계산 모듈(117)은 시계열 데이터(TSD)의 불규칙성을 계산할 수 있다. 불규칙성 계산 모듈(117)은 특정 시간에 대응되는 데이터와 인접한 시간에 대응되는 데이터의 시간 차이에 기초하여, 시간 간격을 계산할 수 있다. 예를 들어, 제1 데이터(D1)와 제2 데이터(D2)는 제1 시간 간격(i1)을 갖고, 제2 데이터(D2)와 제3 데이터(D3)는 제2 시간 간격(i2)을 가질 수 있다. 제1 시간 간격(i1) 및 제2 시간 간격(i2) 각각은 제1 데이터(D1) 및 제2 데이터(D2)에 대응될 수 있다. 일례로, 제1 및 제2 시간 간격들(i1, i2)이 곧바로 간격 데이터(ID)에 적용될 수 있다. 또는, 이상적인 기준 시간 간격을 설정하고, 기준 시간 간격과 제1 또는 제2 시간 간격들(i1, i2)의 차이가 간격 데이터(ID)에 적용될 수 있다.
시간 정규화 모듈(118)은 불규칙성 계산 모듈(117)로부터 계산된 불규칙성을 정규화할 수 있다. 시간 정규화 모듈(118)은 불규칙성 계산 모듈(117)로부터 계산된 수치를 기준 범위의 값으로 변환할 수 있다. 예를 들어, 기준 범위는 0 내지 1, 또는 -1 내지 1 사이의 수치를 포함할 수 있다. 연, 월, 일 등으로 수치화된 시간은 기준 범위를 벗어날 수 있고, 시간 정규화 모듈은 해당 시간을 기준 범위로 정규화할 수 있다.
도 4는 도 1의 학습기의 예시적인 블록도이다. 도 4의 블록도는 전처리된 시계열 데이터에 기초하여, 예측 모델을 학습하고 가중치 그룹을 결정하는 예시적인 구성으로 이해될 것이다. 도 4를 참조하면, 학습기(120)는 특징 학습기(121), 시계열 학습기(126), 및 가중치 제어기(129)를 포함할 수 있다. 도 1에서 설명된 바와 같이, 특징 학습기(121), 시계열 학습기(126), 및 가중치 제어기(129)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다.
특징 학습기(121)는 도 3의 전처리기(110)로부터 생성된 보간 데이터(PD), 마스킹 데이터(MD), 및 간격 데이터(ID)에 기초하여, 시계열 데이터의 시간 및 특징을 분석한다. 특징 학습기(121)는 예측 모델의 적어도 일부를 학습시켜, 특징 가중치를 생성하기 위한 파라미터들을 생성할 수 있다. 이러한 파라미터들(특징 파라미터)은 가중치 그룹에 포함된다. 특징 가중치는 시계열 데이터의 시간 및 특징에 의존한다.
특징 가중치는 특정 시간에 대응되는 복수의 특징들 각각의 가중치를 포함할 수 있다. 즉, 특징 가중치는 특징 파라미터에 기초하여 계산되는, 시계열 데이터에 포함된 값들의 중요도를 판단하는 지표로 이해될 수 있다. 이를 위하여, 특징 학습기(121)에 결측치 처리기(122), 시간 처리기(123), 특징 가중치 계산기(124), 및 특징 가중치 적용기(125)가 구현될 수 있다.
결측치 처리기(122)는 마스킹 데이터(MD)에 기초하여, 보간 데이터(PD)의 보간 값을 보정하기 위한 제1 보정 데이터를 생성할 수 있다. 또는, 결측치 처리기(122)는 마스킹 데이터(MD)를 보간 데이터(PD)에 반영함으로써, 제1 보정 데이터를 생성할 수 있다. 상술하였듯이, 보간 값은 결측치를 다른 수치로 대체한 값일 수 있다. 학습기(120)는 보간 데이터(PD)에 포함된 값들이 임의로 부여된 보간 값인지 실제 값인지 알 수 없다. 따라서, 결측치 처리기(122)는 마스킹 데이터(MD)를 이용하여, 보간 값의 중요도를 조절하기 위한 제1 보정 데이터를 생성할 수 있다. 구체적인 결측치 처리기(122)의 동작은 도 6 내지 도 9에서 후술된다.
시간 처리기(123)는 간격 데이터(ID)에 기초하여, 보간 데이터(PD)의 시간 간격의 불규칙성을 보정하기 위한 제2 보정 데이터를 생성할 수 있다. 또는, 시간 처리기(123)는 간격 데이터(ID)를 보간 데이터(PD)에 반영함으로써, 제2 보정 데이터를 생성할 수 있다. 시간 처리기(123)는 간격 데이터(ID)를 이용하여, 보간 데이터(PD)에 대응되는 복수의 시간들 각각의 중요도를 조절하기 위한 제2 보정 데이터를 생성할 수 있다. 즉, 특정 시간에 대응되는 특징들은 제2 보정 데이터에 의하여 동일한 중요도로 보정될 수 있다. 구체적인 시간 처리기(123)의 동작은 도 6 내지 도 9에서 후술된다.
특징 가중치 계산기(124)는 제1 보정 데이터 및 제2 보정 데이터에 기초하여, 보간 데이터(PD)의 특징들 및 시간들에 대응되는 특징 가중치를 계산할 수 있다. 특징 가중치는 시간 차원 및 특징 차원에서 보간 데이터(PD)와 동일한 개수의 값들을 가질 수 있다. 특징 가중치 계산기(124)는 보간 값의 중요도 및 시간들 각각의 중요도를 특징 가중치에 반영할 수 있다. 예시적으로, 특징 가중치 계산기(124)는 어텐션 메커니즘(attention mechanism)을 이용하여, 예측 결과가 특정된 특징에 주목하도록 특징 가중치를 생성할 수 있다. 구체적인 특징 가중치 계산기(124)의 동작은 도 6 내지 도 9에서 후술된다.
특징 가중치 적용기(125)는 특징 가중치 계산기(124)로부터 계산된 특징 가중치를 보간 데이터(PD)에 적용할 수 있다. 적용 결과, 특징 가중치 적용기(125)는 시간 및 특징의 복합성이 보간 데이터(PD)에 반영된 제1 학습 결과를 생성할 수 있다. 예를 들어, 특징 가중치 적용기(125)는 특정 시간 및 특징에 대응되는 특징 가중치를 보간 데이터(PD)의 대응되는 특징에 곱할 수 있다. 다만, 이에 제한되지 않고, 특징 가중치는 보간 데이터(PD) 대신에 제1 또는 제2 보정 데이터에 의하여 보간 데이터(PD)를 분석한 중간 결과에 적용될 수 있다. 구체적인 특징 가중치 적용기(125)의 동작은 도 6 내지 도 9에서 후술된다.
시계열 학습기(126)는 특징 가중치 적용기(125)로부터 생성된 제1 학습 결과에 기초하여, 시계열 데이터의 시간 흐름을 분석한다. 특징 학습기(121)가 시계열 데이터의 특징 및 시간 (여기에서, 시간은 시간 간격이 반영된 특정 시점을 의미할 수 있다.)에 대응되는 값들을 분석한다면, 시계열 학습기(126)는 시간의 흐름에 따른 데이터의 추이 또는 예측 시점과 특정 시간 사이의 관계 등을 분석할 수 있다. 시계열 학습기(126)는 예측 모델의 적어도 일부를 학습시켜, 시계열 가중치를 생성하기 위한 파라미터들을 생성할 수 있다. 이러한 파라미터들(시계열 파라미터)은 가중치 그룹에 포함된다.
시계열 가중치는 시간 흐름에 대응되는 복수의 시간들 각각의 가중치를 포함할 수 있다. 즉, 시계열 가중치는 시계열 파라미터에 기초하여 계산되는, 시계열 데이터의 시간들 각각의 중요도를 판단하는 지표로 이해될 수 있다. 이를 위하여, 시계열 학습기(126)에 시계열 가중치 계산기(127) 및 시계열 가중치 적용기(128)가 구현될 수 있다.
시계열 가중치 계산기(127)는 특징 학습기(121)로부터 생성된 제1 학습 결과의 시간들에 대응되는 시계열 가중치를 계산할 수 있다. 시계열 가중치는 시간 차원에서 제1 학습 결과와 동일한 개수의 값들을 가질 수 있으나, 특징 차원에서 하나의 값을 가질 수 있다. 시계열 가중치 계산기(127)는 예측 시간에 대응되는 시간들 각각의 중요도를 시계열 가중치에 반영할 수 있다. 예시적으로, 시계열 가중치 계산기(127)는 어텐션 메커니즘(attention mechanism)을 이용하여, 예측 결과가 특정된 시간에 주목하도록 시계열 가중치를 생성할 수 있다. 구체적인 시계열 가중치 계산기(127)의 동작은 도 6 내지 도 9에서 후술된다.
시계열 가중치 적용기(128)는 시계열 가중치 계산기(127)로부터 계산된 시계열 가중치를 제1 학습 결과에 적용할 수 있다. 적용 결과, 시계열 가중치 적용기(128)는 시간 간격의 불규칙성 및 시계열적 추이가 반영된 제2 학습 결과를 생성할 수 있다. 예를 들어, 시계열 가중치 적용기(128)는 특정 시간에 대응되는 시계열 가중치를 특정 시간에 대응되는 제1 학습 결과의 특징들에 곱할 수 있다. 다만, 이에 제한되지 않고, 시계열 가중치는 제1 학습 결과 대신에 제1 학습 결과를 분석한 중간 결과에 적용될 수 있다. 구체적인 시계열 가중치 적용기(128)의 동작은 도 6 내지 도 9에서 후술된다.
가중치 제어기(129)는 제2 학습 결과에 기초하여, 특징 파라미터 및 시계열 파라미터를 조절할 수 있다. 가중치 제어기(129)는 제2 학습 결과가 원하는 실제 결과에 대응되는지 판단할 수 있다. 가중치 제어기(129)는 제2 학습 결과가 원하는 실제 결과에 도달하도록, 특징 파라미터 및 시계열 파라미터를 조절할 수 있다. 조절된 특징 파라미터 및 시계열 파라미터에 기초하여, 특징 학습기(121) 및 시계열 학습기(126)는 전처리된 시계열 데이터를 반복적으로 분석할 수 있다. 이러한 특징 파라미터 및 시계열 파라미터는 가중치 모델 데이터베이스(103)에 저장될 수 있다. 도 4에 도시된 바와 달리, 가중치 제어기(129)는 특징 학습기(121)로부터 제1 학습 결과를 더 수신할 수 있고, 제1 학습 결과에 기초하여, 특징 파라미터를 조절할 수도 있다.
도 5는 도 1의 예측기의 예시적인 블록도이다. 도 5의 블록도는 학습기에 의하여 학습된 예측 모델 및 가중치 그룹에 기초하여, 전처리된 시계열 데이터를 분석하고, 예측 결과를 생성하는 예시적인 구성으로 이해될 것이다. 도 5를 참조하면, 예측기(130)는 특징 예측기(131), 시계열 예측기(136), 및 결과 생성기(139)를 포함할 수 있다. 도 1에서 설명된 바와 같이, 특징 예측기(131), 시계열 예측기(136), 및 결과 생성기(139)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다.
특징 예측기(131)는 도 3의 전처리기(110)로부터 생성된 보간 데이터(PD), 마스킹 데이터(MD), 및 간격 데이터(ID)에 기초하여, 시계열 데이터의 시간 및 특징을 분석한다. 특징 예측기(131)에 결측치 처리기(132), 시간 처리기(133), 특징 가중치 계산기(134), 및 특징 가중치 적용기(135)가 구현될 수 있으며, 도 4의 결측치 처리기(122), 시간 처리기(123), 특징 가중치 계산기(124), 및 특징 가중치 적용기(125)와 실질적으로 동일하게 구현될 수 있다. 특징 예측기(131)는 가중치 모델 데이터베이스(103)로부터 제공된 특징 파라미터에 기초하여, 전처리된 시계열 데이터를 분석하고, 제1 결과를 생성할 수 있다.
시계열 예측기(136)는 특징 예측기(131)로부터 생성된 제1 결과에 기초하여, 시계열 데이터의 시간 흐름을 분석한다. 시계열 예측기(136)에 시계열 가중치 계산기(137) 및 시계열 가중치 적용기(138)가 구현될 수 있으며, 도 4의 시계열 가중치 계산기(127) 및 시계열 가중치 적용기(128)와 실질적으로 동일하게 구현될 수 있다. 시계열 예측기(136)는 가중치 모델 데이터베이스(103)로부터 제공된 시계열 파라미터에 기초하여, 제1 결과를 분석하고, 제2 결과를 생성할 수 있다.
결과 생성기(139)는 시계열 예측기(136)로부터 생성된 제2 결과에 기초하여, 예측 시간에 대응되는 예측 결과를 계산할 수 있다. 예를 들어, 시계열 데이터가 의료 데이터인 경우, 예측 결과는 미래 특정 시점의 건강 상태를 나타낼 수 있다. 예측 결과는 예측 결과 데이터베이스(104)에 저장될 수 있다.
도 6 내지 도 9는 도 5의 예측기를 구체화한 도면이다. 도 6 내지 도 9를 참조하면, 예측기(130_1~130_4)는 결측치 처리기(132_1~132_4), 시간 처리기(133_1~133_4), 특징 가중치 계산기(134_1~134_4), 특징 가중치 적용기(135_1~135_4), 시계열 가중치 계산기(137_1~137_4), 시계열 가중치 적용기(138_1~138_4), 및 결과 생성기(139_1~139_4)로 구현될 수 있다. 여기에서, 결측치 처리기(132_1~132_4), 시간 처리기(133_1~133_4), 특징 가중치 계산기(134_1~134_4), 및 특징 가중치 적용기(135_1~135_4)는 도 5의 특징 예측기(131)에 대응되며, 시계열 가중치 계산기(137_1~137_4) 및 시계열 가중치 적용기(138_1~138_4)는 도 5의 시계열 예측기(136)에 대응된다. 상술하였듯이, 예측기와 학습기는 서로 실질적으로 동일하게 구현될 수 있으므로, 도 6 내지 도 9의 예측기 구조는 도 4의 학습기(120)에 적용될 수 있다.
도 6을 참조하면, 결측치 처리기(132_1)는 마스킹 데이터(MD) 및 보간 데이터(PD)를 병합(merge)하여, 병합 데이터(MG)를 생성할 수 있다. 병합 데이터(MG)는 마스킹 데이터(MD) 및 보간 데이터(PD)의 값들을 단순하게 배열한 데이터일 수 있다. 즉, 병합 데이터(MG)은 마스킹 데이터(MD) 및 보간 데이터(PD)와 시간 차원에서 동일한 개수의 값들을 갖고, 특징 차원에서 두 배의 개수의 값들을 가질 수 있다.
결측치 처리기(132_1)는 병합 데이터(MG)를 인코딩하여, 인코딩 데이터(ED)를 생성할 수 있다. 인코딩을 위하여, 결측치 처리기(132_1)는 인코더(EC)를 포함할 수 있다. 예를 들어, 인코더(EC)는 1D 컨볼루션 레이어 또는 오토-인코더로 구현될 수 있다. 1D 컨볼루션 레이어로 구현되는 경우, 인코더(EC)는 동일한 위치의 마스킹 데이터(MD)의 값 및 보간 데이터(PD)의 값 각각에 가중치(We)를 적용하여 합산하기 위한 커널을 통하여, 인코딩 데이터(ED)를 생성할 수 있다. 오토-인코더로 구현되는 경우, 인코더(EC)는 가중치(We) 및 바이어스(be)가 적용된 인코딩 함수에 기초하여, 인코딩 데이터(ED)를 생성할 수 있다. 가중치(We) 및 바이어스(be)는 상술된 특징 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 인코딩 데이터(ED)는 시간 차원에서 마스킹 데이터(MD)의 값 및 보간 데이터(PD)와 동일한 개수의 값들을 가질 수 있다. 인코딩 데이터(ED)는 특징 차원에서 마스킹 데이터(MD)의 값 및 보간 데이터(PD)와 동일하거나 다른 개수의 값들을 가질 수 있다. 인코딩 데이터(ED)는 도 4에서 설명된 제1 보정 데이터에 대응된다.
시간 처리기(133_1)는 간격 데이터(ID)를 모델링할 수 있다. 예를 들어, 시간 처리기(133_1)는 tanh와 같은 비선형 함수를 이용하여, 간격 데이터(ID)를 모델링할 수 있다. 이 경우, 해당 함수에 가중치(Wt) 및 바이어스(bt)가 적용될 수 있다. 일례로, 시간 처리기(133_1)는 tanh(Wt*ID+bt) 수식을 계산함으로써, 간격 데이터(ID)를 모델링할 수 있다. 가중치(Wt) 및 바이어스(bt)는 상술된 특징 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 모델링된 간격 데이터(ID)는 도 4에서 설명된 제2 보정 데이터에 대응된다.
특징 가중치 계산기(134_1)는 어텐션 메커니즘을 이용하여, 예측 결과가 특정된 특징에 주목하도록 특징 가중치(AD)를 생성할 수 있다. 또한, 특징 가중치 계산기(134_1)는 특징 가중치(AD)가 시계열 데이터의 시간 간격을 반영하도록, 모델링된 간격 데이터를 함께 처리할 수 있다.
구체적으로, 특징 가중치 계산기(134_1)는 순방향 신경망(feed-forward neural network)을 통하여, 인코딩 데이터(ED)의 특징들을 분석할 수 있다. 인코딩 데이터(ED)는 마스킹 데이터(MD)에 의하여, 결측치의 중요도를 보간 데이터(PD)에 반영한 보정 데이터일 수 있다. 순방향 신경망은 가중치(Wf) 및 바이어스(bf)에 기초하여, 인코딩 데이터(ED)를 분석할 수 있다. 가중치(Wf) 및 바이어스(bf)는 상술된 특징 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 특징 가중치 계산기(134_1)는 인코딩 데이터(ED)를 분석하여, 특징 분석 데이터(XD)를 생성할 수 있다. 특징 분석 데이터(XD)는 시간 차원에서 보간 데이터(PD)와 동일한 개수의 값들을 가질 수 있다. 특징 분석 데이터(XD)는 특징 차원에서 보간 데이터(PD)와 동일하거나 다른 개수의 값들을 가질 수 있다.
특징 가중치 계산기(134_1)는 특징 분석 데이터(XD) 및 모델링된 간격 데이터를 softmax 함수에 적용함으로써, 특징 가중치(AD)를 계산할 수 있다. 이 경우, 해당 함수에 가중치(Wx) 및 바이어스(bx)가 적용될 수 있다. 일례로, 특징 가중치 계산기(134_1)는 AD = softmax(tanh(Wx*XD+bx) + tanh(Wt*ID+bt)) 수식을 계산함으로써, 특징 가중치(AD)를 생성할 수 있다. 가중치(Wx) 및 바이어스(bx)는 상술된 특징 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 일례로, 특징 가중치(AD)는 특징 분석 데이터(XD)와 동일한 개수의 값들을 가질 수 있다.
특징 가중치 적용기(135_1)는 특징 가중치(AD)를 특징 분석 데이터(XD)에 적용할 수 있다. 일례로, 특징 가중치 적용기(135_1)는 특징 가중치(AD)와 특징 분석 데이터(XD)를 곱하여, 제1 결과(YD)를 생성할 수 있다. 다만, 이에 제한되지 않고, 특징 가중치(AD)는 특징 분석 데이터(XD) 대신 보간 데이터(PD)에 적용될 수도 있다.
시계열 가중치 계산기(137_1)는 어텐션 메커니즘을 이용하여, 예측 결과가 특정된 시간에 주목하도록 시계열 가중치(BD)를 생성할 수 있다. 시계열 가중치 계산기(137_1)는 순환 신경망(recurrent neural network)을 통하여, 제1 결과(YD)의 시간 흐름을 분석할 수 있다. 순환 신경망은 시계열 분석 알고리즘의 일종으로, 이전 시간의 데이터 분석 내용을 다음 시간의 데이터에 반영할 수 있다. 시간 간격이 일정한 데이터가 입력될수록, 순환 신경망의 분석 정확도는 향상된다. 제1 결과(YD)는 간격 데이터(ID)에 의하여, 시간 간격의 불규칙성을 고려하여, 일정한 시간 간격을 갖는 것과 같이 보정된 결과일 수 있다. 따라서, 순환 신경망에 의한 분석 정확도가 향상될 수 있다.
시계열 가중치 계산기(137_1)는 가중치(Wr) 및 바이어스(br)을 순환 신경망에 적용하여, 제1 결과(YD)를 분석할 수 있다. 가중치(Wr) 및 바이어스(br)는 상술된 시계열 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 시계열 가중치 계산기(137_1)는 제1 결과(YD)를 분석하여, 시계열 분석 데이터(HD)를 생성할 수 있다. 시계열 분석 데이터(HD)는 시간 차원에서 보간 데이터(PD)와 동일한 개수의 값들을 가질 수 있다. 시계열 분석 데이터(HD)는 특징 차원에서 보간 데이터(PD)와 동일하거나 다른 개수의 값들을 가질 수 있다.
시계열 가중치 계산기(137_1)는 시계열 분석 데이터(HD)를 softmax 함수에 적용함으로써, 시계열 가중치(BD)를 계산할 수 있다. 이 경우, 해당 함수에 가중치(Wh) 및 바이어스(bh)가 적용될 수 있다. 일례로, 시계열 가중치 계산기(137_1)는 BD = softmax(tanh(Wh*HD+bh)) 수식을 계산함으로써, 시계열 가중치(BD)를 생성할 수 있다. 가중치(Wh) 및 바이어스(bh)는 상술된 시계열 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 시계열 가중치(BD)는 시간 차원에서 제1 결과(YD)와 동일한 개수의 값들을 가질 수 있다. 시계열 가중치(BD)는 특징 차원에서, 복수의 시간들 각각에 대응되는 하나의 값을 가질 수 있다.
시계열 가중치 적용기(138_1)는 시계열 가중치(BD)를 제1 결과(YD)에 적용할 수 있다. 일례로, 시계열 가중치 적용기(138_1)는 시계열 가중치(BD)와 제1 결과(YD)를 곱하여, 제2 결과(ZD)를 생성할 수 있다. 다만, 이에 제한되지 않고, 시계열 가중치(BD)는 제1 결과(YD) 대신 시계열 분석 데이터(HD)에 적용될 수도 있다.
결과 생성기(139_1)는 제2 결과(ZD)에 기초하여, 예측 시간에 대응되는 예측 결과(Dz)를 계산한다. 결과 생성기(139_1)는 완전-연결 신경망(fully-connected neural network)을 통하여, 제2 결과(ZD)를 분석할 수 있다. 완전-연결 신경망은 가중치(Wc) 및 바이어스(bc)에 기초하여, 제2 결과(ZD)를 분석할 수 있다. 가중치(Wc) 및 바이어스(bc)는 가중치 그룹에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다. 일례로, 예측 결과(Dz)는 미래의 특정 시점에 대응되는 특징들의 집합 또는 특징들에 기초한 건강 지표일 수 있다.
도 7을 참조하면, 예측기(130_2)는 결측치 처리기(132_2) 및 특징 가중치 계산기(134_2)를 제외하고, 도 6의 예측기(130_1)와 실질적으로 동일하게 동작할 수 있다. 실질적으로 동일하게 동작하는 구성은 설명이 생략된다.
결측치 처리기(132_2)는 마스킹 데이터(MD) 및 보간 데이터(PD)를 병합(merge)하여, 병합 데이터(MG)를 생성할 수 있다. 도 6과 달리, 결측치 처리기(132_2)는 병합 데이터(MG)를 후처리하지 않을 수 있다. 일례로, 특징 가중치 계산기(134_2)는 순방향 신경망 대신, 순환 신경망을 통하여, 병합 데이터(MG)를 분석할 수 있다. 순환 신경망은 병합 데이터(MG)를 인코딩하는 기능을 추가적으로 수행할 수 있다. 순환 신경망은 가중치(Wr1) 및 바이어스(br1)에 기초하여, 병합 데이터(MG)를 분석할 수 있다.
도 8을 참조하면, 예측기(130_3)는 결측치 처리기(132_3) 및 특징 가중치 계산기(134_3)를 제외하고, 도 6의 예측기(130_1)와 실질적으로 동일하게 동작할 수 있다. 실질적으로 동일하게 동작하는 구성은 설명이 생략된다.
결측치 처리기(132_3)는 마스킹 데이터(MD)를 모델링할 수 있다. 예를 들어, 결측치 처리기(132_3)는 tanh와 같은 비선형 함수를 이용하여, 마스킹 데이터(MD)를 모델링할 수 있다. 이 경우, 해당 함수에 가중치(Wm) 및 바이어스(bm)가 적용될 수 있다. 일례로, 결측치 처리기(132_3)는 tanh(Wm*MD+bm) 수식을 계산함으로써, 마스킹 데이터(MD)를 모델링할 수 있다. 가중치(Wm) 및 바이어스(bm)는 상술된 특징 파라미터에 포함될 수 있고, 학습기(120)에 의하여 생성될 수 있다.
특징 가중치 계산기(134_3)는 모델링된 마스킹 데이터를 모델링된 간격 데이터와 마찬가지로, 어텐션 매커니즘을 이용하여 처리할 수 있다. 특징 가중치 계산기(134_3)는 순방향 신경망을 통하여, 보간 데이터(PD)의 특징들을 분석하고, 특징 분석 데이터(XD)를 생성할 수 있다. 특징 가중치 계산기(134_3)는 특징 분석 데이터(XD), 모델링된 마스킹 데이터, 및 모델링된 간격 데이터를 softmax 함수에 적용함으로써, 특징 가중치(AD)를 계산할 수 있다. 일례로, 특징 가중치 계산기(134_3)는 AD = softmax(tanh(Wm*MD+bm) + tanh(Wx*XD+bx) + tanh(Wt*ID+bt)) 수식을 계산함으로써, 특징 가중치(AD)를 생성할 수 있다.
도 9를 참조하면, 예측기(130_4)는 시간 처리기(133_4) 및 특징 가중치 계산기(134_4)를 제외하고, 도 8의 예측기(130_1)와 실질적으로 동일하게 동작할 수 있다. 실질적으로 동일하게 동작하는 구성은 설명이 생략된다.
시간 처리기(133_4)는 간격 데이터(ID) 및 보간 데이터(PD)를 병합(merge)하여, 병합 데이터(MG)를 생성할 수 있다. 특징 가중치 계산기(134_2)는 순방향 신경망을 통하여, 병합 데이터(MG)를 분석할 수 있다. 순환 신경망은 가중치(Wr1) 및 바이어스(br1)에 기초하여, 병합 데이터(MG)를 분석하고, 특징 분석 데이터(XD)를 생성할 수 있다. 특징 가중치 계산기(134_4)는 특징 분석 데이터(XD) 및 모델링된 마스킹 데이터를 softmax 함수에 적용함으로써, 특징 가중치(AD)를 계산할 수 있다. 일례로, 특징 가중치 계산기(134_4)는 AD = softmax(tanh(Wm*MD+bm) + tanh(Wx*XD+bx)) 수식을 계산함으로써, 특징 가중치(AD)를 생성할 수 있다.
도 10은 도 1의 학습기 또는 예측기의 예시적인 블록도이다. 도 10에 도시된 분석기(200)는 도 1의 학습기(120)로 구현되거나, 예측기(130)로 구현될 수 있다. 도 10을 참조하면, 분석기(200)는 특징 분석기(210) 및 시계열 분석기(250)를 포함할 수 있다. 도 1에서 설명된 바와 같이, 특징 분석기(210) 및 시계열 분석기(250)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다.
특징 분석기(210)는 보간 데이터(PD) 및 마스킹 데이터(MD)에 기초하여, 시계열 데이터의 특징을 분석한다. 도 4의 특징 학습기(121)와 달리, 특징 분석기(210)는 간격 데이터(ID)를 사용하지 않을 수 있다. 이를 위하여, 특징 분석기(210)에 결측치 처리기(220), 특징 가중치 계산기(230), 및 특징 가중치 적용기(240)가 구현될 수 있다. 간격 데이터(ID)를 특징 가중치의 계산에 반영하지 않는 것을 제외하면, 결측치 처리기(220), 특징 가중치 계산기(230), 및 특징 가중치 적용기(240)는 도 4의 결측치 처리기(122), 특징 가중치 계산기(124), 및 특징 가중치 적용기(125)와 실질적으로 동일하게 동작할 수 있다.
구체적으로, 결측치 처리기(220)는 보간 데이터(PD) 및 마스킹 데이터(MD)에 기초하여, 보간 데이터(PD)의 보간 값을 보정한 보정 데이터를 생성할 수 있다. 특징 가중치 계산기(230)는 보정 데이터에 기초하여, 보간 데이터(PD)의 특징들 및 시간들에 대응되는 특징 가중치를 계산할 수 있다. 특징 가중치 적용기(240)는 계산된 특징 가중치를 보간 데이터(PD) 또는 보간 데이터(PD)의 중간 결과 (도 6 내지 도 9의 특징 분석 데이터(XD))에 적용함으로써, 제1 분석 결과를 생성할 수 있다.
시계열 분석기(250)는 특징 분석기(210)의 제1 분석 결과 및 간격 데이터(ID)에 기초하여, 시계열 데이터의 시간 흐름을 분석한다. 이를 위하여, 시계열 분석기(250)에 시간 처리기(260), 시계열 가중치 계산기(270), 및 시계열 가중치 적용기(280)가 구현될 수 있다. 도 4의 시계열 학습기(126)와 달리, 시계열 분석기(250)는 시간 처리기(260)를 통하여, 시간 간격의 불규칙성을 시간 흐름 분석에 반영할 수 있다. 제1 분석 결과는 불규칙한 시간 간격으로 인하여 발생되는 오차를 내포할 수 있다. 시간 처리기(260)는 이러한 오차를 간격 데이터(ID)에 기초하여 보정할 수 있다.
구체적으로, 시간 처리기(260)는 간격 데이터(ID)에 기초하여, 제1 분석 결과를 보정한 보정 데이터를 생성할 수 있다. 이는 도 4의 시간 처리기(123)가 보간 데이터(PD)를 보정하는 방식에 대응될 수 있다. 시계열 가중치 계산기(270)는 보정 데이터에 기초하여, 복수의 시간들에 대응되는 시계열 가중치를 계산할 수 있다. 시계열 가중치 적용기(280)는 계산된 시계열 가중치를 제1 분석 결과 또는 제1 분석 결과의 중간 결과 (도 6 내지 도 9의 시계열 분석 데이터(HD))에 적용함으로써, 제2 분석 결과(ZD)를 생성할 수 있다.
분석기(200)가 도 1의 학습기(120)로 구현되는 경우, 제2 분석 결과(ZD)에 기초하여, 가중치 그룹의 파라미터가 조절될 수 있다. 분석기(200)가 도 1의 예측기(130)로 구현되는 경우, 제2 분석 결과(ZD)에 기초하여, 예측 시간에 대응되는 예측 결과가 생성될 수 있다.
도 11은 도 1의 학습기 또는 예측기의 예시적인 블록도이다. 도 11에 도시된 분석기(300)는 도 1의 학습기(120)로 구현되거나, 예측기(130)로 구현될 수 있다. 도 11을 참조하면, 분석기(300)는 특징 분석기(310), 시계열 분석기(340), 및 통합 가중치 적용기(370)를 포함할 수 있다. 도 1에서 설명된 바와 같이, 특징 분석기(310), 시계열 분석기(340), 및 통합 가중치 적용기(370)는 하드웨어로 구현되거나, 펌웨어, 소프트웨어, 또는 이의 조합으로 구현될 수 있다.
특징 분석기(310)는 보간 데이터(PD) 및 마스킹 데이터(MD)에 기초하여, 시계열 데이터의 특징을 분석하고, 특징 가중치를 생성한다. 이를 위하여, 특징 분석기(310)에 결측치 처리기(320) 및 특징 가중치 계산기(330)가 구현될 수 있다. 결측치 처리기(320)는 보간 데이터(PD) 및 마스킹 데이터(MD)에 기초하여, 보간 데이터(PD)의 보간 값을 보정한 제1 보정 데이터를 생성할 수 있다. 특징 가중치 계산기(330)는 제1 보정 데이터에 기초하여, 보간 데이터(PD)의 특징들 및 시간들에 대응되는 특징 가중치를 계산할 수 있다.
시계열 분석기(340)는 보간 데이터(PD) 및 간격 데이터(ID)에 기초하여, 시계열 데이터의 시간 흐름을 분석하고, 시계열 가중치를 생성한다. 이를 위하여, 시계열 분석기(340)에 시간 처리기(350) 및 시계열 가중치 계산기(360) 가 구현될 수 있다. 시간 처리기(350)는 보간 데이터(PD) 및 간격 데이터(ID)에 기초하여, 보간 데이터(PD)의 시간 간격의 불규칙성을 보정한 제2 보정 데이터를 생성할 수 있다. 시계열 가중치 계산기(360)는 제2 보정 데이터에 기초하여, 보간 데이터(PD)의 시간들에 대응되는 시계열 가중치를 계산할 수 있다.
통합 가중치 적용기(370)는 특징 분석기(310)로부터 계산된 특징 가중치 및 시계열 분석기(340)로부터 계산된 시계열 가중치를 보간 데이터(PD)에 적용할 수 있다. 즉, 시계열 데이터의 특징 및 시간이 병렬로 분석되고, 특징 가중치 및 시계열 가중치가 함께 시계열 데이터에 적용될 수 있다. 특징 가중치 및 시계열 가중치의 적용 결과, 분석 결과(ZD)가 생성될 수 있다. 분석기(300)가 도 1의 학습기(120)로 구현되는 경우, 분석 결과(ZD)에 기초하여, 가중치 그룹의 파라미터가 조절될 수 있다. 분석기(300)가 도 1의 예측기(130)로 구현되는 경우, 분석 결과(ZD)에 기초하여, 예측 시간에 대응되는 예측 결과가 생성될 수 있다.
도 12는 도 1의 시계열 데이터 처리 장치가 적용된 건강 상태 예측 시스템을 도시한 도면이다. 도 12를 참조하면, 건강 상태 예측 시스템(1000)은 단말기(1100), 시계열 데이터 처리 장치(1200), 및 네트워크(1300)를 포함한다.
단말기(1100)는 사용자로부터 시계열 데이터를 수집하여 시계열 데이터 처리 장치(1200)에 제공할 수 있다. 일례로, 단말기(1100)는 의료 데이터베이스(1010) 등으로부터 시계열 데이터를 수집할 수 있다. 단말기(1100)는 스마트폰, 데스크탑, 랩탑, 웨어러블 장치 등 사용자로부터 시계열 데이터를 입력 받을 수 있는 다양한 전자 장치 중 하나일 수 있다. 단말기(1100)는 네트워크(1300)를 통하여 시계열 데이터를 전송하도록 통신 모듈 또는 네트워크 인터페이스를 포함할 수 있다. 도 12는 하나의 단말기(1100)를 도시하였으나, 이에 제한되지 않고, 복수의 단말기들로부터 시계열 데이터가 시계열 데이터 처리 장치(1200)에 제공될 수 있다.
의료 데이터베이스(1010)는 다양한 사용자들에 대한 의료 데이터가 통합 관리되도록 구성된다. 의료 데이터베이스(1010)는 도 1의 학습 데이터베이스(101) 또는 타겟 데이터베이스(102)를 포함할 수 있다. 예를 들어, 의료 데이터베이스(1010)는 공공기관, 병원, 사용자 등으로부터 의료 데이터를 제공 받을 수 있다. 의료 데이터베이스(1010)는 서버 또는 저장 매체에 구현될 수 있다. 의료 데이터는 의료 데이터베이스(1010)에 시계열적으로 관리되고, 그룹핑되어 저장될 수 있다. 의료 데이터베이스(1010)는 네트워크(160)를 통하여 시계열 데이터 처리 장치(1200)에 주기적으로 시계열 데이터를 제공할 수 있다.
시계열 데이터는 전자 의무 기록(Electronic Medical Record, EMR)과 같이, 의료 기관에서 진단, 치료, 또는 투약 처방 등에 의하여 생성된 사용자의 건강 상태를 나타내는 시계열 의료 데이터를 포함할 수 있다. 시계열 데이터는 진단, 치료, 또는 투약 처방 등을 위하여 의료 기관에 방문할 때 생성될 수 있다. 시계열 데이터는 의료 기관의 방문에 따라, 시계열적으로 나열된 데이터일 수 있다. 시계열 데이터는 진단, 치료, 또는 투약 처방된 특징에 기초하여 생성된 복수의 특징들을 포함할 수 있다. 예를 들어, 특징은 혈압과 같은 검사로 측정된 데이터 또는 동맥 경화와 같은 질환의 정도를 나타내는 데이터를 포함할 수 있다.
시계열 데이터 처리 장치(1200)는 의료 데이터베이스(1010) (또는 단말기(1100))로부터 수신된 시계열 데이터를 통하여 학습 모델을 구축할 수 있다. 예를 들어, 학습 모델은 시계열 데이터를 바탕으로 미래 건강 상태를 예측하기 위한 예측 모델을 포함할 수 있다. 예를 들어, 학습 모델은 시계열 데이터를 전처리하기 위한 전처리 모델을 포함할 수 있다. 시계열 데이터 처리 장치(1200)는 의료 데이터베이스(1010)로부터 수신된 시계열 데이터를 통하여, 학습 모델을 학습시키고, 가중치 그룹을 생성할 수 있다. 이를 위하여, 시계열 데이터 처리 장치(1200)에 도 1의 전처리기(110) 및 학습기(120)가 구현될 수 있다.
시계열 데이터 처리 장치(1200)는 구축된 학습 모델에 기초하여 단말기(1100) 또는 의료 데이터베이스(1010)로부터 수신된 시계열 데이터를 처리할 수 있다. 시계열 데이터 처리 장치(1200)는 구축된 전처리 모델에 기초하여 시계열 데이터를 전처리할 수 있다. 시계열 데이터 처리 장치(1200)는 구축된 예측 모델에 기초하여 전처리된 시계열 데이터를 분석할 수 있다. 분석 결과, 시계열 데이터 처리 장치(1200)는 예측 시간에 대응되는 예측 결과를 계산할 수 있다. 예측 결과는 사용자의 미래 건강 상태에 대응될 수 있다. 이를 위하여, 시계열 데이터 처리 장치(1200)에 도 1의 전처리기(110) 및 예측기(130)가 구현될 수 있다.
전처리 모델 데이터베이스(1020)는 시계열 데이터 처리 장치(1200)에서 학습되어 생성된 전처리 모델 및 가중치 그룹이 통합 관리되도록 구성된다. 전처리 모델 데이터베이스(1020)는 서버 또는 저장 매체에 구현될 수 있다. 예를 들어, 전처리 모델은 시계열 데이터에 포함된 특징들에 대한 결측 값(missing value)을 보간하기 위한 모델을 포함할 수 있다.
예측 모델 데이터베이스(1030)는 시계열 데이터 처리 장치(1200)에서 학습되어 생성된 예측 모델 및 가중치 그룹이 통합 관리되도록 구성된다. 예측 모델 데이터베이스(1030)는 도 1의 가중치 모델 데이터베이스(103)를 포함할 수 있다. 예측 모델 데이터베이스(1030)는 서버 또는 저장 매체에 구현될 수 있다.
예측 결과 데이터베이스(1040)는 시계열 데이터 처리 장치(1200)에서 분석된 예측 결과가 통합 관리되도록 구성된다. 예측 결과 데이터베이스(1040)는 도 1의 예측 결과 데이터베이스(104)를 포함할 수 있다. 예측 결과 데이터베이스(1040)는 서버 또는 저장 매체에 구현될 수 있다.
네트워크(1300)는 단말기(1100), 의료 데이터베이스(1010), 및 시계열 데이터 처리 장치(1200) 사이의 데이터 통신이 수행되도록 구성될 수 있다. 단말기(1100), 의료 데이터베이스(1010), 및 시계열 데이터 처리 장치(1200)는 네트워크(1300)를 통하여 유선 또는 무선으로 데이터를 주고 받을 수 있다.
도 13은 도 1 또는 도 12의 시계열 데이터 처리 장치의 예시적인 블록도이다. 도 13의 블록도는 시계열 데이터를 전처리하고, 전처리된 시계열 데이터에 기초하여 가중치 그룹을 생성하고, 가중치 그룹에 기초하여 예측 결과를 생성하기 위한 예시적인 구성으로 이해될 것이고, 시계열 데이터 처리 장치의 구조가 이에 제한되지 않을 것이다. 도 13을 참조하면, 시계열 데이터 처리 장치(1200)는 네트워크 인터페이스(1210), 프로세서(1220), 메모리(1230), 스토리지(1240), 및 버스(1250)를 포함할 수 있다. 예시적으로, 시계열 데이터 처리 장치(1200)는 서버로 구현될 수 있으나, 이에 제한되지 않는다.
네트워크 인터페이스(1210)는 도 12의 네트워크(1300)를 통하여 단말기(1100) 또는 의료 데이터베이스(1010)로부터 제공되는 시계열 데이터를 입력 받도록 구성된다. 네트워크 인터페이스(1210)는 수신된 시계열 데이터를 버스(1250)를 통하여 프로세서(1220), 메모리(1230) 또는 스토리지(1240)에 제공할 수 있다. 또한, 네트워크 인터페이스(1210)는 수신된 시계열 데이터에 응답하여 생성된 미래 건강 상태의 예측 결과를 도 1의 네트워크(1300)를 통하여 단말기(1100) 등에 제공하도록 구성될 수 있다.
프로세서(1220)는 시계열 데이터 처리 장치(1200)의 중앙 처리 장치로의 기능을 수행할 수 있다. 프로세서(1220)는 시계열 데이터 처리 장치(1200)의 전처리 및 데이터 분석 등을 구현하기 위하여 요구되는 제어 동작 및 연산 동작을 수행할 수 있다. 예를 들어, 프로세서(1220)의 제어에 따라, 네트워크 인터페이스(1210)는 시계열 데이터를 외부로부터 수신할 수 있다. 프로세서(1220)의 제어에 따라, 예측 모델의 가중치 그룹을 생성하기 위한 연산 동작이 수행될 수 있고, 예측 모델을 이용하여 예측 결과가 계산될 수 있다. 프로세서(1220)는 메모리(1230)의 연산 공간을 활용하여 동작할 수 있고, 스토리지(1240)로부터 운영체제를 구동하기 위한 파일들 및 어플리케이션의 실행 파일들을 읽을 수 있다. 프로세서(1220)는 운영 체제 및 다양한 어플리케이션들을 실행할 수 있다.
메모리(1230)는 프로세서(1220)에 의하여 처리되거나 처리될 예정인 데이터 및 프로세스 코드들을 저장할 수 있다. 예를 들어, 메모리(1230)는 시계열 데이터, 시계열 데이터의 전처리 동작을 수행하기 위한 정보들, 가중치 그룹을 생성하기 위한 정보들, 예측 결과를 계산하기 위한 정보들, 및 예측 모델을 구축하기 위한 정보들을 저장할 수 있다. 메모리(1230)는 시계열 데이터 처리 장치(1200)의 주기억 장치로 이용될 수 있다. 메모리(1230)는 DRAM (Dynamic RAM), SRAM (Static RAM), PRAM (Phase-change RAM), MRAM (Magnetic RAM), FeRAM (Ferroelectric RAM), RRAM (Resistive RAM) 등을 포함할 수 있다.
전처리부(1231), 학습부(1232), 및 예측부(1233)는 메모리(1230)에 로딩되어 실행될 수 있다. 전처리부(1231), 학습부(1232), 및 예측부(1233)는 각각 도 1의 전처리기(110), 학습기(120), 및 예측기(130)에 대응된다. 전처리부(1231), 학습부(1232), 및 예측부(1233)는 메모리(1230)의 연산 공간의 일부일 수 있다. 이 경우, 전처리부(1231), 학습부(1232), 및 예측부(1233)는 펌웨어 또는 소프트웨어로 구현될 수 있다. 예를 들어, 펌웨어는 스토리지(1240)에 저장되고, 펌웨어를 실행 시에 메모리(1230)에 로딩될 수 있다. 프로세서(1220)는 메모리(1230)에 로딩된 펌웨어를 실행할 수 있다. 전처리부(1231)는 프로세서(1220)의 제어 하에 시계열 데이터를 전처리하도록 동작될 수 있다. 학습부(1232)는 프로세서(1220)의 제어 하에 전처리된 시계열 데이터를 분석하여 가중치 그룹을 생성하도록 동작될 수 있다. 예측부(1233)는 프로세서(1220)의 제어 하에 생성된 가중치 그룹에 기초하여, 예측 결과를 생성하도록 동작될 수 있다.
스토리지(1240)는 운영 체제 또는 어플리케이션들에 의해 장기적인 저장을 목적으로 생성되는 데이터, 운영 체제를 구동하기 위한 파일, 또는 어플리케이션들의 실행 파일 등을 저장할 수 있다. 예를 들어, 스토리지(1240)는 전처리부(1231), 학습부(1232), 및 예측부(1233)의 실행을 위한 파일들을 저장할 수 있다. 스토리지(1240)는 시계열 데이터 처리 장치(1200)의 보조 기억 장치로 이용될 수 있다. 스토리지(1240)는 플래시 메모리, PRAM (Phase-change RAM), MRAM (Magnetic RAM), FeRAM (Ferroelectric RAM), RRAM (Resistive RAM) 등을 포함할 수 있다.
버스(1250)는 시계열 데이터 처리 장치(1200)의 구성 요소들 사이에서 통신 경로를 제공할 수 있다. 네트워크 인터페이스(1210), 프로세서(1220), 메모리(1230), 및 스토리지(1240)는 버스(1250)를 통해 서로 데이터를 교환할 수 있다. 버스(1250)는 시계열 데이터 처리 장치(1200)에서 이용되는 다양한 유형의 통신 포맷을 지원하도록 구성될 수 있다.
위에서 설명한 내용은 본 발명을 실시하기 위한 구체적인 예들이다. 본 발명에는 위에서 설명한 실시 예들뿐만 아니라, 단순하게 설계 변경하거나 용이하게 변경할 수 있는 실시 예들도 포함될 것이다. 또한, 본 발명에는 상술한 실시 예들을 이용하여 앞으로 용이하게 변형하여 실시할 수 있는 기술들도 포함될 것이다.
100: 시계열 데이터 처리 장치 110: 전처리기
111: 특징 전처리기 116: 시계열 전처리기
120: 학습기 121: 특징 학습기
126: 시계열 학습기 130: 예측기

Claims (20)

  1. 시계열 데이터의 시간 간격에 기초하여 간격 데이터를 생성하고, 상기 시계열 데이터의 결측치에 보간 값을 추가하여 보간 데이터를 생성하고, 상기 결측치를 구분하는 마스킹 데이터를 생성하는 전처리기; 및
    상기 간격 데이터, 상기 보간 데이터, 및 상기 마스킹 데이터에 기초하여, 상기 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치, 및 상기 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성하기 위한 예측 모델의 가중치 그룹을 생성하는 학습기를 포함하되,
    상기 가중치 그룹은 상기 특징 가중치를 생성하기 위한 제1 파라미터, 및 상기 시계열 가중치를 생성하기 위한 제2 파라미터를 포함하는 시계열 데이터 처리 장치.
  2. 제1 항에 있어서,
    상기 학습기는,
    상기 마스킹 데이터, 상기 간격 데이터, 상기 보간 데이터, 및 상기 제1 파라미터에 기초하여 상기 특징 가중치를 계산하고, 상기 특징 가중치에 기초하여 제1 학습 결과를 생성하는 특징 학습기;
    상기 제1 학습 결과 및 상기 제2 파라미터에 기초하여 상기 시계열 가중치를 계산하고, 상기 시계열 가중치에 기초하여 제2 학습 결과를 생성하는 시계열 학습기; 및
    상기 제1 학습 결과 또는 상기 제2 학습 결과에 기초하여, 상기 제1 파라미터 또는 상기 제2 파라미터를 조절하는 가중치 제어기를 포함하는 시계열 데이터 처리 장치.
  3. 제2 항에 있어서,
    상기 특징 학습기는,
    상기 마스킹 데이터에 기초하여, 상기 보간 데이터의 제1 보정 데이터를 생성하는 결측치 처리기;
    상기 간격 데이터에 기초하여, 상기 보간 데이터의 제2 보정 데이터를 생성하는 시간 처리기;
    상기 제1 파라미터, 상기 제1 보정 데이터, 및 상기 제2 보정 데이터에 기초하여, 상기 특징 가중치를 계산하는 특징 가중치 계산기; 및
    상기 보간 데이터에 상기 특징 가중치를 적용하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  4. 제2 항에 있어서,
    상기 시계열 학습기는,
    상기 제1 학습 결과 및 상기 제2 파라미터에 기초하여, 상기 시계열 가중치를 계산하는 시계열 가중치 계산기; 및
    상기 제1 학습 결과에 상기 시계열 가중치를 적용하는 시계열 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  5. 제1 항에 있어서,
    상기 학습기는,
    상기 마스킹 데이터, 상기 보간 데이터, 및 상기 제1 파라미터에 기초하여 상기 특징 가중치를 계산하고, 상기 특징 가중치에 기초하여 제1 학습 결과를 생성하는 특징 학습기;
    상기 간격 데이터, 상기 제1 학습 결과, 및 상기 제2 파라미터에 기초하여 상기 시계열 가중치를 계산하고, 상기 시계열 가중치에 기초하여 제2 학습 결과를 생성하는 시계열 학습기; 및
    상기 제1 학습 결과 또는 상기 제2 학습 결과에 기초하여, 상기 제1 파라미터 또는 상기 제2 파라미터를 조절하는 가중치 제어기를 포함하는 시계열 데이터 처리 장치.
  6. 제5 항에 있어서,
    상기 특징 학습기는,
    상기 마스킹 데이터에 기초하여, 상기 보간 데이터의 보정 데이터를 생성하는 결측치 처리기;
    상기 제1 파라미터 및 상기 보정 데이터에 기초하여, 상기 특징 가중치를 계산하는 특징 가중치 계산기; 및
    상기 보간 데이터에 상기 특징 가중치를 적용하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  7. 제5 항에 있어서,
    상기 시계열 학습기는,
    상기 간격 데이터에 기초하여, 상기 제1 학습 결과의 보정 데이터를 생성하는 시간 처리기;
    상기 제2 파라미터 및 상기 보정 데이터에 기초하여, 상기 시계열 가중치를 계산하는 시계열 가중치 계산기; 및
    상기 제1 학습 결과에 상기 시계열 가중치를 적용하는 시계열 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  8. 제1 항에 있어서,
    상기 학습기는,
    상기 마스킹 데이터, 상기 보간 데이터, 및 상기 제1 파라미터에 기초하여 상기 특징 가중치를 계산하는 특징 학습기;
    상기 간격 데이터, 상기 보간 데이터, 및 상기 제2 파라미터에 기초하여 상기 시계열 가중치를 계산하는 시계열 학습기;
    상기 특징 가중치 및 상기 시계열 가중치에 기초하여 학습 결과를 생성하는 통합 가중치 적용기; 및
    상기 학습 결과에 기초하여, 상기 제1 파라미터 또는 상기 제2 파라미터를 조절하는 가중치 제어기를 포함하는 시계열 데이터 처리 장치.
  9. 시계열 데이터의 시간 간격에 기초하여 간격 데이터를 생성하고, 상기 시계열 데이터의 결측치에 보간 값을 추가하여 보간 데이터를 생성하고, 상기 결측치를 구분하는 마스킹 데이터를 생성하는 전처리기; 및
    상기 간격 데이터, 상기 보간 데이터, 및 상기 마스킹 데이터에 기초하여, 상기 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치, 및 상기 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성하고, 상기 특징 가중치 및 상기 시계열 가중치에 기초하여 예측 결과를 생성하는 예측기를 포함하는 시계열 데이터 처리 장치.
  10. 제9 항에 있어서,
    상기 예측기는,
    상기 특징 가중치에 기초하여 제1 결과를 생성하는 특징 예측기;
    상기 시계열 가중치에 기초하여 제2 결과를 생성하는 시계열 예측기; 및
    상기 제2 결과에 기초하여 예측 시간에 대응되는 상기 예측 결과를 계산하는 결과 생성기를 포함하는 시계열 데이터 처리 장치.
  11. 제10 항에 있어서,
    상기 특징 예측기는,
    상기 마스킹 데이터에 기초하여 상기 보간 데이터를 인코딩하는 결측치 처리기;
    상기 간격 데이터를 모델링하는 시간 처리기;
    상기 인코딩된 보간 데이터에 기초하여 특징 분석 데이터를 생성하고, 상기 특징 분석 데이터 및 상기 모델링된 간격 데이터에 기초하여 상기 특징 가중치를 생성하는 특징 가중치 계산기; 및
    상기 특징 분석 데이터에 상기 특징 가중치를 적용하여 상기 제1 결과를 생성하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  12. 제10 항에 있어서,
    상기 특징 예측기는,
    상기 마스킹 데이터 및 상기 보간 데이터를 병합하는 결측치 처리기;
    상기 간격 데이터를 모델링하는 시간 처리기;
    상기 병합된 데이터에 기초하여 특징 분석 데이터를 생성하고, 상기 특징 분석 데이터 및 상기 모델링된 간격 데이터에 기초하여 상기 특징 가중치를 생성하는 특징 가중치 계산기; 및
    상기 특징 분석 데이터에 상기 특징 가중치를 적용하여 상기 제1 결과를 생성하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  13. 제10 항에 있어서,
    상기 특징 예측기는,
    상기 마스킹 데이터를 모델링하는 결측치 처리기;
    상기 간격 데이터를 모델링하는 시간 처리기;
    상기 보간 데이터에 기초하여 특징 분석 데이터를 생성하고, 상기 모델링된 마스킹 데이터, 상기 모델링된 간격 데이터, 및 상기 특징 분석 데이터에 기초하여 상기 특징 가중치를 생성하는 특징 가중치 계산기; 및
    상기 특징 분석 데이터에 상기 특징 가중치를 적용하여 상기 제1 결과를 생성하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  14. 제10 항에 있어서,
    상기 특징 예측기는,
    상기 마스킹 데이터를 모델링하는 결측치 처리기;
    상기 간격 데이터 및 상기 보간 데이터를 병합하는 시간 처리기;
    상기 병합된 데이터에 기초하여 특징 분석 데이터를 생성하고, 상기 특징 분석 데이터 및 상기 모델링된 마스킹 데이터에 기초하여 상기 특징 가중치를 생성하는 특징 가중치 계산기; 및
    상기 특징 분석 데이터에 상기 특징 가중치를 적용하여 상기 제1 결과를 생성하는 특징 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  15. 제10 항에 있어서,
    상기 시계열 예측기는,
    상기 제1 결과에 기초하여 시계열 분석 데이터를 생성하고, 상기 시계열 분석 데이터에 기초하여 상기 시계열 가중치를 생성하는 시계열 가중치 계산기; 및
    상기 제1 결과 또는 상기 시계열 분석 데이터에 상기 시계열 가중치를 적용하는 시계열 가중치 적용기를 포함하는 시계열 데이터 처리 장치.
  16. 제10 항에 있어서,
    상기 특징 예측기는 상기 마스킹 데이터 및 상기 보간 데이터에 기초하여 상기 특징 가중치를 계산하고,
    상기 시계열 예측기는 상기 제1 결과 및 상기 간격 데이터에 기초하여 상기 시계열 가중치를 계산하는 시계열 데이터 처리 장치.
  17. 제9 항에 있어서,
    상기 예측기는,
    상기 마스킹 데이터 및 상기 보간 데이터에 기초하여 상기 특징 가중치를 계산하는 특징 예측기;
    상기 간격 데이터 및 상기 보간 데이터에 기초하여 상기 시계열 가중치를 계산하는 시계열 예측기;
    상기 특징 가중치 및 상기 시계열 가중치에 기초하여 상기 보간 데이터에 대응되는 통합 결과를 생성하는 통합 가중치 적용기; 및
    상기 통합 결과에 기초하여 예측 시간에 대응되는 상기 예측 결과를 계산하는 결과 생성기를 포함하는 시계열 데이터 처리 장치.
  18. 시계열 데이터 처리 장치의 동작 방법에 있어서,
    시계열 데이터의 결측치에 보간 값을 추가하여 보간 데이터를 생성하는 단계;
    상기 시계열 데이터의 시간 간격에 기초하여 간격 데이터를 생성하는 단계;
    상기 결측치에 기초하여 마스킹 데이터를 생성하는 단계;
    상기 보간 데이터, 상기 간격 데이터, 및 상기 마스킹 데이터에 기초하여 상기 시계열 데이터의 시간 및 특징에 의존하는 특징 가중치를 생성하는 단계;
    상기 특징 가중치에 기초하여 제1 결과를 생성하는 단계;
    상기 제1 결과에 기초하여 상기 시계열 데이터의 시간 흐름에 의존하는 시계열 가중치를 생성하는 단계; 및
    상기 시계열 가중치에 기초하여 제2 결과를 생성하는 단계를 포함하는 방법.
  19. 제18 항에 있어서,
    상기 제2 결과에 기초하여, 상기 특징 가중치 또는 상기 시계열 가중치를 생성하기 위한 파라미터를 조절하는 단계를 더 포함하는 방법.
  20. 제18 항에 있어서,
    상기 제2 결과에 기초하여, 예측 시간에 대응되는 예측 결과를 계산하는 단계를 더 포함하는 방법.
KR1020180173917A 2018-12-31 2018-12-31 시계열 데이터 처리 장치 및 이의 동작 방법 KR102501530B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180173917A KR102501530B1 (ko) 2018-12-31 2018-12-31 시계열 데이터 처리 장치 및 이의 동작 방법
US16/694,921 US20200210895A1 (en) 2018-12-31 2019-11-25 Time series data processing device and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180173917A KR102501530B1 (ko) 2018-12-31 2018-12-31 시계열 데이터 처리 장치 및 이의 동작 방법

Publications (2)

Publication Number Publication Date
KR20200082893A true KR20200082893A (ko) 2020-07-08
KR102501530B1 KR102501530B1 (ko) 2023-02-21

Family

ID=71123101

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180173917A KR102501530B1 (ko) 2018-12-31 2018-12-31 시계열 데이터 처리 장치 및 이의 동작 방법

Country Status (2)

Country Link
US (1) US20200210895A1 (ko)
KR (1) KR102501530B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102251139B1 (ko) 2020-10-13 2021-05-12 (주)비아이매트릭스 데이터 증강 기반 기계학습 방식의 결측치 보정 시스템
WO2022145689A1 (ko) * 2020-12-30 2022-07-07 재단법인 아산사회복지재단 전자의무기록에서의 다변량 결측값 대체 방법
KR20230013485A (ko) * 2021-07-19 2023-01-26 고려대학교 산학협력단 불규칙 임상 시계열 데이터 예측 및 분류 방법, 및 장치
WO2023080365A1 (ko) * 2021-11-08 2023-05-11 (주) 위세아이텍 순환신경망 기반 이중 딥러닝 모델을 활용한 시계열 데이터 결측치 보간 시스템
KR102614798B1 (ko) * 2022-12-29 2023-12-15 전남대학교산학협력단 시계열 기반 전력 데이터의 이상 탐지 방법 및 이를 위한 장치

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11842263B2 (en) * 2020-06-11 2023-12-12 Optum Services (Ireland) Limited Cross-temporal predictive data analysis
CN112084667A (zh) * 2020-09-14 2020-12-15 北京世冠金洋科技发展有限公司 一种测试用例的生成方法、装置及电子设备
KR102535613B1 (ko) 2021-02-15 2023-05-23 한국전자통신연구원 다변량 세트에서의 매개 변량 및 매개 영향도 추출 방법 및 시스템
CN113269675B (zh) * 2021-05-18 2022-05-13 东北师范大学 基于深度学习模型的时变体数据时间超分辨率可视化方法
WO2023007921A1 (ja) * 2021-07-30 2023-02-02 株式会社Nttドコモ 時系列データ処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム
KR101182965B1 (ko) * 2004-12-06 2012-09-21 소니 주식회사 데이터 학습용 방법 및 장치, 데이터 인식용 장치, 및 데이터 생성용 장치
KR20170023770A (ko) * 2014-06-25 2017-03-06 삼성전자주식회사 진단모델 생성 시스템 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118755A (ja) * 2009-12-04 2011-06-16 Sony Corp 学習装置、学習方法、およびプログラム
JP6574527B2 (ja) * 2016-09-06 2019-09-11 日本電信電話株式会社 時系列データ特徴量抽出装置、時系列データ特徴量抽出方法及び時系列データ特徴量抽出プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム
KR101182965B1 (ko) * 2004-12-06 2012-09-21 소니 주식회사 데이터 학습용 방법 및 장치, 데이터 인식용 장치, 및 데이터 생성용 장치
KR20170023770A (ko) * 2014-06-25 2017-03-06 삼성전자주식회사 진단모델 생성 시스템 및 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102251139B1 (ko) 2020-10-13 2021-05-12 (주)비아이매트릭스 데이터 증강 기반 기계학습 방식의 결측치 보정 시스템
WO2022145689A1 (ko) * 2020-12-30 2022-07-07 재단법인 아산사회복지재단 전자의무기록에서의 다변량 결측값 대체 방법
KR20220095949A (ko) * 2020-12-30 2022-07-07 재단법인 아산사회복지재단 전자의무기록에서의 다변량 결측값 대체 방법
KR20230013485A (ko) * 2021-07-19 2023-01-26 고려대학교 산학협력단 불규칙 임상 시계열 데이터 예측 및 분류 방법, 및 장치
WO2023080365A1 (ko) * 2021-11-08 2023-05-11 (주) 위세아이텍 순환신경망 기반 이중 딥러닝 모델을 활용한 시계열 데이터 결측치 보간 시스템
KR102614798B1 (ko) * 2022-12-29 2023-12-15 전남대학교산학협력단 시계열 기반 전력 데이터의 이상 탐지 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
KR102501530B1 (ko) 2023-02-21
US20200210895A1 (en) 2020-07-02

Similar Documents

Publication Publication Date Title
KR102501530B1 (ko) 시계열 데이터 처리 장치 및 이의 동작 방법
Buehler et al. A data-driven market simulator for small data environments
KR102501525B1 (ko) 시계열 데이터 처리 장치 및 이의 동작 방법
KR102460442B1 (ko) 시계열 데이터 처리 장치, 이를 포함하는 건강 예측 시스템, 및 시계열 데이터 처리 장치의 동작 방법
KR102532909B1 (ko) 다차원의 시계열 의료 데이터를 처리하는 장치 및 방법
US20190180882A1 (en) Device and method of processing multi-dimensional time series medical data
KR102415220B1 (ko) 시계열 데이터 처리 장치 및 이의 동작 방법
US20230245777A1 (en) Systems and methods for self-supervised learning based on naturally-occurring patterns of missing data
US20190221294A1 (en) Time series data processing device, health prediction system including the same, and method for operating the time series data processing device
Hilbert et al. Using decision trees to manage hospital readmission risk for acute myocardial infarction, heart failure, and pneumonia
US20210174229A1 (en) Device for ensembling data received from prediction devices and operating method thereof
Gopakumar et al. Forecasting daily patient outflow from a ward having no real-time clinical data
US20210319341A1 (en) Device for processing time series data having irregular time interval and operating method thereof
Welchowski et al. A framework for parameter estimation and model selection in kernel deep stacking networks
Lee et al. The predictive skill of convolutional neural networks models for disease forecasting
US20220343160A1 (en) Time series data processing device configured to process time series data with irregularity
KR102557001B1 (ko) 예측 장치들로부터 수신된 데이터를 앙상블하는 장치 및 이의 동작 방법
US11941513B2 (en) Device for ensembling data received from prediction devices and operating method thereof
CN115424725A (zh) 数据的分析方法和装置、存储介质及处理器
US20200303068A1 (en) Automated treatment generation with objective based learning
Gutowski et al. Machine learning with optimization to create medicine intake schedules for Parkinson’s disease patients
Iqbal et al. Forecasting stock market using machine learning approach encoder-decoder ConvLSTM
KR102313181B1 (ko) 딥러닝 솔루션 플랫폼을 제공하는 딥러닝 플랫폼 제공장치에 의해서 수행되는 딥러닝 솔루션 제공 방법
US20220359082A1 (en) Health state prediction system including ensemble prediction model and operation method thereof
US20220207297A1 (en) Device for processing unbalanced data and operation method thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
E601 Decision to refuse application
E801 Decision on dismissal of amendment
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant