KR20230076596A - 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법 - Google Patents

멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법 Download PDF

Info

Publication number
KR20230076596A
KR20230076596A KR1020210163682A KR20210163682A KR20230076596A KR 20230076596 A KR20230076596 A KR 20230076596A KR 1020210163682 A KR1020210163682 A KR 1020210163682A KR 20210163682 A KR20210163682 A KR 20210163682A KR 20230076596 A KR20230076596 A KR 20230076596A
Authority
KR
South Korea
Prior art keywords
signal
multimodal
sensing
image generation
sensing signals
Prior art date
Application number
KR1020210163682A
Other languages
English (en)
Inventor
김유진
정재영
최원규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020210163682A priority Critical patent/KR20230076596A/ko
Priority to US17/847,799 priority patent/US20230162084A1/en
Publication of KR20230076596A publication Critical patent/KR20230076596A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Processing (AREA)

Abstract

멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템이 제공된다. 상기 시스템은 멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신하고, 상기 센싱 신호를 믹싱하고, 상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 멀티모달 결합부, 상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하고, 상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 신호 이미지 생성부 및 상기 신호 이미지 생성부로부터 신호 이미지들을 수신하여, 입력된 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성하는 데이터 셋 생성부를 포함한다.

Description

멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법{SYSTEM AND METHOD FOR GENERATING SIGNAL IMAGES USING MULTIMODAL SENSING SIGNAL}
본 발명은 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법에 관한 것이다.
인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다.
인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.
한편, 인공지능 기술은 기계학습 및 기계학습을 활용한 요소 기술들로 구성되며, 학습을 위한 다양한 멀티모달 데이터가 사용되고 있다.
하지만, 멀티모달 데이터의 경우, 각 데이터(센싱 신호)간의 이질성으로 인하여, 기계학습을 위한 표현이 서로 다른 형태로 구성되어 기계학습을 수행하는데 어려움이 있다.
공개특허공보 제10-2019-0056940호 (2019.05.27)
본 발명이 해결하고자 하는 과제는 상호 이질적인 센싱 신호들(예를 들어, 텍스트, 전파, 소리, 음파, 광파, 온도, 습도 등)로 이루어진 멀티모달 데이터를 동일 공간 상에 투영되는 신호 이미지 데이터로 표현 가능하게 하여, 기계학습을 위한 학습 데이터 셋으로 제공할 수 있는, 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법을 제공하는 것이다.
다만, 본 발명이 해결하고자 하는 과제는 상기된 바와 같은 과제로 한정되지 않으며, 또다른 과제들이 존재할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 제1 측면에 따른 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템은 멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신하고, 상기 센싱 신호를 믹싱하고, 상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 멀티모달 결합부, 상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하고, 상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 신호 이미지 생성부 및 상기 신호 이미지 생성부로부터 신호 이미지들을 수신하여, 입력된 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성하는 데이터 셋 생성부를 포함한다.
또한, 본 발명의 제2 측면에 따른 멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법은 멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신하는 단계; 상기 수신한 복수의 센싱 신호를 믹싱하는 단계; 상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 단계; 상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하는 단계; 상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 단계; 및 상기 신호 이미지들을 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성하는 단계를 포함한다.
상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 컴퓨터 프로그램은, 하드웨어인 컴퓨터와 결합되어 멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법을 실행하며, 컴퓨터 판독가능 기록매체에 저장된다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
전술한 본 발명의 일 실시예에 의하면, 멀티모달 데이터를 동일한 차원으로 생성하도록 슬라이싱하여 신호 이미지의 생성이 가능하도록 멀티모달 신호를 동시에 한 공간의 데이터로 표현이 가능하게 하고, 자동화된 정확한 데이터 셋의 다량 생성이 가능하여 기계학습 수행의 용이성 및 학습 정확도를 현저히 높일 수 있는 이점이 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 신호 이미지 생성 시스템의 구성도이다.
도 2는 본 발명이 적용되는 제1 실시예를 설명하기 위한 도면이다.
도 3은 본 발명이 적용되는 제2 실시예를 설명하기 위한 도면이다.
도 4는 본 발명의 진폭 조정기에 의한 신호 진폭 조정 과정을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에서 진리 데이터 셋을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 신호 이미지 생성 방법의 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하에서는, 당업자의 이해를 돕기 위하여 본 발명이 제안된 배경에 대하여 먼저 서술하고, 본 발명의 실시예에 대하여 서술하기로 한다.
인간은 사물을 보고, 소리를 듣고, 질감을 느끼고, 냄새를 맡고, 맛을 느낄 수 있는 멀티모달(multimodal) 능력을 가지고 있다. 모달리티(modality)는 어떤 일이 발생하거나 경험하는 방식을 의미하며, 실 생활에서는 한 가지 모달리티(Uni-modality) 보다는 다양한 여러 모달리티(modalities)를 포함하고 있으며, 이것은 다중 모달리티(multimodality)로 특성화된다.
인공지능(AI)이 인간의 주변 세계를 이해하는데 있어, 이러한 멀티모달 신호를 해석할 수 있어야만 좀 더 인공지능으로써 인간에게 편리함을 제공할 수 있다.
인공지능을 위한 "멀티모달 머신러닝"은 여러 모달리티의 정보를 처리하고 연관시킬 수 있는 모델을 구축하는 것을 목표로 하는 학습을 의미한다. 초기 멀티모달 머신러닝 기술은 단순히 모달리티 정보를 융합(fusion)하는데 초점을 맞추었다면, 지능화되고 고도화되는 현재의 인공지능 기술은 유니모달 간의 상호 연관성 특징을 파악하기 위하여, 데이터 표현 방식, 데이터의 번역, 정렬, 융합, 공동학습(co-learning) 등 이해를 높이는 기술로 발전되고 있다. 이처럼 멀티모달 머신러닝 기술이 발전되는 이유는, 인공지능이 인간의 주변 세계를 이해하기 위해 멀티모달 메시지를 해석하고 추론할 수 있어야 하기 때문이다.
한편, 멀티모달의 표현은 여러 엔티티(entity)의 정보를 사용하여 데이터를 표현한다. 그런데 다중 모달리티를 표현하려면 여러가지 어려움이 존재한다.
구체적인 어려움의 일 예로, 이기종소스의 데이터를 결합하는 방법, 다양한 수준의 노이즈를 처리하는 방법, 누락된 데이터를 처리하는 방법, 이질적인 데이터를 통일된 공간으로 표현하는 방법 등이 존재한다.
예를 들어, 사람의 기침과 재채기는 가슴의 움직이는 변위와 관련점을 가질 수 있다. 따라서, 기침이나 재채기 한 가지의 데이터만을 가지고 사람의 상태를 파악하는 것보다, 가슴 변위와 함께 상태를 파악한다면 더욱 정확도 높은 연관의 발견이 가능하다.
보다 구체적인 예로, 기침과 재채기는 신체의 중요한 방어기전으로 후두를 포함한 기도의 자극이 있는 경우, 반사적으로 발생하거나 폐와 기관지 내에 생긴 이물질을 제거하기 위해 발생한다. 또한, 호흡기 질환 등의 질병에 의해 발생하기도 한다.
이러한 기침과 재채기는 비침습과 비접촉 방식으로 소리 신호 센싱이 가능하여 신체의 이상 여부 발생을 알 수 있는 중요한 신호로 활용이 가능하다. 또한, 레이다(Radar)를 이용한 흉부 변위 획득을 통한 호흡 모니터링은 비침습과 비접촉 방식으로 흉부의 미세한 움직임을 전파의 반사에 따른 위상 변화로 감지할 수 있는 기술로, 호흡률 등의 센싱이 가능하다. 이러한 기침 소리와 흉부의 변위(displacement)의 센싱을 통해 일상생활이나 수면 중 신체의 이상증상 여부에 대한 센싱이 가능하다.
하지만, 종래기술은 기침소리 센싱과 흉부의 변위 센싱을 신호처리 기술로 개별적으로 수행하거나 독립된 모듈 또는 장치로 활용해왔다.
또한, 기침소리와 흉부 변위의 센싱 결과를 기계학습(Machine Learning)을 통해 이상여부 유무를 분류(Classification)할 때, 지도학습기(Supervised Learner)는 훈련 데이터로부터 주어진 데이터에 대해 예측하고자 하는 값을 올바로 추측하는 역할을 한다. 이 경우, 정답지(Ground Truth Label)와 같은 학습 데이터 셋(Ground Truth training datasets)이 요구된다.
하지만, 오디오 신호인 기침소리와 송출된 무선 전파 신호의 반사된 수신 신호를 받는 레이더 신호인 흉부의 변위 센싱 신호는 상이한 신호 방식이므로, 동일한 조건에서의 정답지 설정이 용이하지 않다.
기침소리와 흉부 변위에 따른 호흡률 모니터링을 동시에 하면 한 가지 신호로 이상증상 여부를 센싱하는 것보다, 두 가지 신호의 관계성 정보를 이용할 수 있으므로 정확도를 보다 증가시킬 수 있다.
그러나, 상이한 신호 입력의 멀티모달 신호는 데이터의 이질성 때문에 기계학습을 위한 데이터 표현(Data representation)을 서로 다른 형태로 이루어지게 하므로 기계학습을 어렵게 하는 문제점이 있다.
또 다른 예로, 산업현장의 작업자가 유발하는 노이즈, 기계음과 함께 주변 환경 센싱 신호(예를 들어, CO2, 온도, 습도, 속도 센싱 신호 등)를 함께 연관하면 특징 발견의 정확도가 더욱 증가될 수 있다.
보다 구체적인 예로,산업현장의 작업자가 유발하는 노이즈, 기계음은 다양한 사운드 강도(Sound intensity)가 적분(integral)되어 입력되는 현상이 있다. 종래기술은 신호처리 기술을 이용하여 사운드의 특정 주파수 성분을 추출하는 등의 전처리 과정을 거쳐, 목적하는 특정 주파수 성분을 분석하였다.
하지만, 환경 센싱 신호와 연관하여 특징을 발견하고자 할 때는, 환경 센싱 장치들의 개별 입력장치의 특성에 따라 신호처리를 하고, 그 연관성을 분석하는 과정을 거치는 등의 불편함이 존재하게 된다.
이처럼, 종래기술은 신호의 이질성으로 인해 기계학습을 위한 데이터 표현을 서로 다른 형태로 이루어지게 하므로, 기계학습 수행을 어렵게 하는 문제가 있었다.
이러한 문제를 해소하기 위해, 본 발명의 일 실시예에 따른 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법은 계(界, space)가 서로 다른 멀티모달 데이터를 동일 공간(one space) 상으로 투영될 수 있도록 하는 신호 이미지로 데이터 표현(Data representation)이 가능하게 하여, 합성곱 신경망(CNN, Convolutional Neural Network) 등 기계학습을 가능하게 하는 학습 데이터 셋을 생성 및 제공할 수 있다.
이하에서는 도 1 내지 도 5를 참조하여, 본 발명의 일 실시예에 따른 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템(100)에 대해 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 신호 이미지 생성 시스템(100)의 구성도이다.
본 발명의 일 실시예에 따른 신호 이미지 생성 시스템(100)은 멀티모달 결합부(110), 신호 이미지 생성부(120) 및 데이터 셋 생성부(130)를 포함할 수 있다.
멀티모달 결합부(110)는 멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신한다. 도 1에서는 오디오 신호와, 그 외 다양한 센싱 신호(Sensor #1 Signal, Sensor #2 Signal)을 수신하는 것으로 설명하였으나, 반드시 이에 한정되는 것은 아니다. 도 2 및 도 3을 참조하여 멀티모달 센서를 통한 센싱 신호를 수신하는 일 예시를 설명하면 다음과 같다.
도 2는 본 발명이 적용되는 제1 실시예를 설명하기 위한 도면이다.
본 발명에 따른 신호 이미지 생성 시스템(100)은, 멀티모달 구성이 가능한 다양한 센서 입력을 받을 수 있으며, 도 2에 도시된 바와 같이 일상 생활에서의 사람의 기침 또는 재채기(201)를 센싱하는 마이크(203)의 입력(204)과, 또한 사람 가슴의 움직임 변위를 센싱하는 바이탈 레이더 트랜시버(207)의 입력신호들(예를 들어, Inphase, Quadrature 신호, 205, 206)을 입력받는다.
또한, 수면 중인 사람의 기침 또는 재채기와 가슴 변위의 센싱을 입력으로 받는다(202).
이때, 본 발명의 일 실시예는 사용자에 상응하는 입력 신호들에 대한 특징을 기술한 정보, 즉 메타데이터도 함께 입력받을 수 있다.
이러한 입력 신호들을 기반으로 본 발명의 일 실시예는 신호 이미지(signal image)로 데이터가 표현(data representation)되는 진리 데이터 셋(Ground Truth Dataset, 150)을 생성할 수 있다.
도 3은 본 발명이 적용되는 제2 실시예를 설명하기 위한 도면이다.
본 발명의 일 실시예는 산업 현장의 소리(301)를 마이크 입력(303)으로 센싱하고, 환경 센싱 신호(예를 들어, CO2, 온도, 습도, 속도 센싱 신호 등, 302)를 센서 입력(304, 305)으로 입력받는다.
이러한 센싱 신호를 기반으로 본 발명의 동작 결과 진리 데이터 셋(150)을 생성할 수 있다.
다시 도 1을 참조하면, 멀티모달 결합부(110)는 입력된 센싱 신호들은 각각 개별 입력 신호마다 DC 오프셋 제거기(111-1, 2, 3)를 통해 DC 오프셋을 제거한다. DC 오프셋이 제거된 신호는 멀티모달 결합부(110) 내 슬라이서 생성기(112)의 진폭 조정기(112-1)로 입력된다.
도 4는 본 발명의 진폭 조정기(112-1)에 의한 신호 진폭 조정 과정을 설명하기 위한 도면이다.
본 발명의 일 실시예에서 진폭 조정기(112-1)는, 도 4에 도시된 바와 같이 DC 오프셋이 제거된 각 센싱 신호마다 다른 진폭 크기(Amplitude)를 가지고 있으며, 이러한 진폭 크기를 사용자가 정의한 범위의 임계치와, 최대 진폭 크기에 맞추어 자동적으로 진폭 크기의 범위(Effective Amplitude Range)를 조정한다.
일 실시예로, 진폭 조정기(112-1)는 복수의 센싱 신호 중 제1 센싱 신호의 최대 진폭 크기를 기준으로 복수의 나머지 제2 센싱 신호의 진폭 크기를 조정할 수 있다. 여기에서, 제1 센싱 신호의 선정은 복수의 센싱 신호 중 가장 큰 진폭 범위를 갖는 센싱 신호일 수 있다. 이처럼, 본 발명의 일 실시예는 제1 센싱 신호의 최대 진폭 크기를 기준으로 복수의 제2 센싱 신호의 소신호(Small signal)를 증폭할 수 있다.
이렇게 초기 Raw 입력 신호에서 변형된 진폭 신호는 멀티모달 신호 믹서(113)를 통하여 믹싱되고, 믹싱된 신호는 멀티모달 결합부(110) 내 포함된 신호 슬라이서(112-2)를 통해 슬라이싱된다. 즉, 신호 슬라이서(112-2)는 사용자에 의해 정의된 임계치와 적응적 시간 간격(Adaptive Interval Time)으로 슬라이싱하도록 하는 슬라이싱 제어 신호를 출력하여 믹싱된 신호를 슬라이싱한다.
이때, 사용자에 의해 정의된 임계치는 멀티모달 입력신호의 특성을 사용자가 사전에 획득하여 적응적 시간 간격을 정할 수 있는 최대값으로 설정될 수 있다. 이를 기반으로, 신호 슬라이서(112-2)는 믹싱된 신호의 주요 주파수 성분의 주기를 기준으로 적응적으로 시간의 간격을 제어할 수 있다. 그 결과, 멀티모달 신호 믹서(113)의 출력은 신호 이미지 생성부(120)에 입력된다.
한편, 본 발명에서는 진폭 조정기(112-1)와 신호 슬라이서(112-2)의 기능을 합쳐서 슬라이서 생성기(112)로 구성될 수 있다.
신호 이미지 생성부(120)는 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지(Signal image)로 생성한다. 이때, 기 정의된 타입의 일 예로는 MFCC Coefficient(Mel-Frequency Cepstral Coefficients), Frequency, Spectrum 등일 수 있으며, 본 발명에서는 신호 이미지 표현 타입에 관하여 특정 타입으로 한정되는 것은 아니다.
신호 이미지 생성부(120)는 신호 이미지 표현 타입 변환 기능을 통해 변환된 신호 이미지를 합성기(121)에 입력하여, 신호 이미지 재조립 또는 재구성 기능을 통해 합성한다.
이때, 신호 이미지 재조립(reassemble) 또는 재구성(reconfiguration) 기능은 신호 이미지 표현 타입 변환 기능을 통해 생성된 신호 이미지들의 순서를 셔플링(Shuffling) 또는 인터리빙(Interleaving)하는 등의 방법으로 신호 이미지들을 재조립 또는 재구성하는 것을 의미한다.
이처럼, 합성기(121)를 통해 만들어진 신호 이미지의 출력은 데이터 셋 생성부(130)로 입력된다.
다음으로, 데이터 셋 생성부(130)는 신호 이미지들을 수신하여, 메타데이터와의 논리적 메모리 연결(Logical Memory Link)를 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성한다.
일 실시예로, 사용자에 의해 입력된 메타데이터는 멀티모달 결합부(110) 내 메타데이터 메모리(114)에 저장된다. 저장된 메타데이터는 슬라이서 생성기(112)의 적응적 시간 간격에 의한 슬라이싱 제어 신호에 의하여, 멀티모달 신호 믹서(113)의 출력인 슬라이싱된 신호와 동기화되어 출력된다.
슬라이싱 제어 신호와 동기화된 멀티모달 결합부(110) 내 메타데이터 메모리(114)의 출력은, 메타데이터 기록제어부(140)로 입력된다. 메타데이터 기록제어부(140)는 동기화된 메타데이터를 수신하여, 신호 이미지들과 논리적 메모리 연결이 가능하도록 하는 기록제어 신호를 출력한다.
데이터 셋 생성부(130)는 이미지 프레임 버퍼(131)와, 각 이미지 프레임마다 논리적 메모리 연결을 가지는 이미지 프레임에 대한 메타데이터(132)를 포함한다. 이때, 데이터 셋 생성부(130)는 신호 이미지의 특징(Signal Image Features) 크기로 구성되는 제1축(예를 들어, Y축)과, 적응적 시간 간격으로 구성되는 제2축(예를 들어, X축)의 크기로 결정되는 이미지 프레임 버퍼(131)를 구성하고, 이미지 프레임 버퍼(131)마다 메타데이터(132)를 논리적 메모리 연결시켜 진리 데이터 셋(150)으로 구성할 수 있다.
도 5는 본 발명의 일 실시예에서 진리 데이터 셋(150)을 설명하기 위한 도면이다.
신호 이미지 표현 타입 1(501-1)은 슬라이스 신호 #1의 신호 이미지 표현이며, 신호 이미지 표현 타입 N(501-2)은 슬라이스 신호 #N의 신호 이미지 표현을 의미한다.
또한, TN과 TN+1은 신호 슬라이서(112-2)에 의해 생성된 적응적 시간 간격을 의미한다.
전술한 바와 같이, 본 발명의 일 실시예는 신호 이미지 재조립 또는 재구성 과정을 통해, 생성된 신호 이미지들의 순서를 셔플링하거나 인터리빙한다. 예를 들어, 도 5에서 신호 이미지를 502, 503, 504, 505와 같이 순차적으로 배열하거나, 502, 504, 503, 505 순서와 같이 셔플링하는 순서 등으로 다양한 타입의 결합, 재조립 및 재구성이 가능하다.
한편, 진리 데이터 셋(150)에는 라벨(Label)로 불리는 메타데이터가 포함된다. 메타데이터는 도 5의 예시에서와 같이 성별, 나이, 체온 등 사용자에 의해 정의된 데이터 셋이 입력될 수 있다. 이러한 메타데이터는 이미지 프레임과 하나의 쌍으로 연결되어 복수 개의 데이터 셋(511, 512, 513)으로 구성된다.
이하에서는 도 6을 참조하여, 본 발명의 일 실시예에 따른 멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법에 대해 설명하도록 한다.
도 6은 본 발명의 일 실시예에 따른 신호 이미지 생성 방법의 순서도이다.
한편, 도 6에 도시된 각 단계들은 전술한 신호 이미지 생성 시스템(100)에 의해 수행되는 것으로 이해될 수 있으나, 반드시 이에 한정되는 것은 아니다.
먼저, 멀티모달 센서를 통해 복수의 이종 센싱 신호를 수신하면(S601), 입력된 센싱 신호를 대상으로 DC 오프셋을 제거한다(S602).
그 다음, 슬라이서 생성기 내부의 진폭 조정기(112-1)는 DC 오프셋이 제거된 신호를 대상으로 진폭을 조정하는 과정을 수행한다(S603).
다음으로, 진폭이 조정된 신호들에 대한 믹싱이 수행되며, 신호 슬라이서(112-2)를 통해 적응적 시간 간격을 기준으로 믹싱된 신호를 슬라이싱한다(S604).
다음으로, 슬라이싱 신호를 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하고(S605), 신호 이미지들을 합성기(121)에 입력하여 재조립 또는 재구성한다(S606).
한편, 본 발명의 일 실시예는 메타데이터를 입력받을 수 있으며, 입력된 메타데이터는 메타데이터 메모리(114) 내에 저장된다(S607).
메타데이터는 적응적 시간 간격에 의해 슬라이싱된 신호와 동기화되며(S608), 그 결과 메타데이터 기록제어부(140)를 통해 출력되는 기록제어 신호를 기반으로(S609), 최종 생성된 이미지 프레임 별로 메타데이터가 논리적 메모리 연결되어(S610), 최종적으로 진리 데이터 셋으로 출력된다(S611).
한편, 상술한 설명에서, 단계 S601 내지 S611은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다. 아울러, 기타 생략된 내용이라 하더라도 도 1 내지 도 5의 내용은 도 6의 신호 이미지 생성 방법에도 적용될 수 있다.
이상에서 전술한 본 발명의 일 실시예는, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, Ruby, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 신호 이미지 생성 시스템
110: 멀티모달 결합부
120: 신호 이미지 생성부
130: 데이터 셋 생성부
140: 메타데이터 기록제어부

Claims (16)

  1. 멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신하고, 상기 센싱 신호를 믹싱하고, 상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 멀티모달 결합부,
    상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하고, 상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 신호 이미지 생성부 및
    상기 신호 이미지 생성부로부터 신호 이미지들을 수신하여, 입력된 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성하는 데이터 셋 생성부를 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  2. 제1항에 있어서,
    상기 멀티모달 결합부는,
    복수의 센싱 신호에 대한 DC 오프셋을 제거하는 DC 오프셋 제거기 및
    상기 복수의 센싱 신호의 진폭 크기를 조정하는 진폭 조정기 및 상기 믹싱된 신호를 슬라이싱하는 신호 슬라이서를 포함하는 슬라이서 생성기를 포함하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  3. 제2항에 있어서,
    상기 진폭 조정기는 복수의 센싱 신호 중 제1 센싱 신호의 최대 진폭 크기를 기준으로 복수의 제2 센싱 신호의 진폭 크기를 조정하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  4. 제2항에 있어서,
    상기 신호 슬라이서는 상기 믹싱된 신호의 주파수 성분의 주기를 기준으로 하는 적응적 시간 간격을 설정하여 슬라이싱을 수행하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  5. 제1항에 있어서,
    상기 신호 이미지 생성부는 상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하고, 상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  6. 제1항에 있어서,
    상기 멀티모달 결합부는 입력된 메타데이터를 저장하는 메타데이터 메모리를 포함하고, 상기 저장된 메타데이터를 상기 적응적 시간 간격에 의하여 슬라이싱된 신호와 동기화시켜 출력하고,
    상기 멀티모달 결합부로부터 상기 동기화된 메타데이터를 수신하여, 상기 신호 이미지들과 논리적 메모리 연결이 가능하도록 하는 기록제어 신호를 출력하는 메타데이터 기록제어부를 더 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  7. 제6항에 있어서,
    상기 데이터 셋 생성부는 상기 신호 이미지의 특징 크기로 구성되는 제1축과, 적응적 시간 간격으로 구성되는 제2축의 크기로 결정되는 이미지 프레임 버퍼를 구성하고, 상기 이미지 프레임 버퍼마다 상기 메타데이터를 논리적 메모리 연결시켜 상기 진리 데이터 셋으로 구성하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템.
  8. 컴퓨터에 의해 수행되는 방법에 있어서,
    멀티모달 센서를 통한 복수의 이종 센싱 신호를 수신하는 단계;
    상기 수신한 복수의 센싱 신호를 믹싱하는 단계;
    상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 단계;
    상기 슬라이싱된 신호들을 기 정의된 타입으로 변환하여 각 신호 이미지를 생성하는 단계;
    상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 단계; 및
    상기 신호 이미지들을 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋(Ground Truth Dataset)으로 구성하는 단계를 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  9. 제8항에 있어서,
    상기 복수의 센싱 신호에 대한 DC 오프셋을 제거하는 단계를 더 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  10. 제8항에 있어서,
    상기 복수의 센싱 신호의 진폭 크기를 조정하는 단계를 더 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  11. 제10항에 있어서,
    상기 복수의 센싱 신호의 진폭 크기를 조정하는 단계는,
    상기 복수의 센싱 신호 중 제1 센싱 신호의 최대 진폭 크기를 기준으로 복수의 제2 센싱 신호의 진폭 크기를 조정하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  12. 제8항에 있어서,
    상기 믹싱된 신호를 기 설정된 임계치 및 적응적 시간 간격 기준으로 슬라이싱하는 단계는,
    상기 믹싱된 신호의 주파수 성분의 주기를 기준으로 하는 적응적 시간 간격을 설정하여 슬라이싱하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  13. 제8항에 있어서,
    상기 생성된 신호 이미지들을 합성기에 입력하여 재조립 또는 재구성하는 단계는,
    상기 생성된 신호 이미지들의 순서를 셔플링(Shuffling) 또는 인터리빙(Interleaving)하여 상기 신호 이미지들을 재조립 또는 재구성하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  14. 제8항에 있어서,
    상기 메타데이터를 입력 및 저장하는 단계;
    상기 메타데이터를 상기 적응적 시간 간격에 의하여 슬라이싱된 신호와 동기화시키는 단계; 및
    상기 동기화된 메타데이터를 상기 신호 이미지들과 논리적 메모리 연결이 가능하도록 하는 기록제어 신호를 출력하는 단계를 더 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  15. 제14항에 있어서,
    상기 신호 이미지들을 메타데이터와의 논리적 메모리 연결을 통해 진리 데이터 셋으로 구성하는 단계는,
    상기 신호 이미지를 위한 이미지 프레임 버퍼를 구성하는 단계; 및
    상기 이미지 프레임 버퍼마다 상기 메타데이터를 논리적 메모리 연결시키는 단계를 포함하는,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
  16. 제15항에 있어서,
    상기 신호 이미지를 위한 이미지 프레임 버퍼를 구성하는 단계;
    상기 신호 이미지의 특징 크기로 구성되는 제1축과, 적응적 시간 간격으로 구성되는 제2축의 크기로 결정되는 이미지 프레임 버퍼를 구성하는 것인,
    멀티모달 센싱 신호를 이용한 신호 이미지 생성 방법.
KR1020210163682A 2021-11-24 2021-11-24 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법 KR20230076596A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210163682A KR20230076596A (ko) 2021-11-24 2021-11-24 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법
US17/847,799 US20230162084A1 (en) 2021-11-24 2022-06-23 System and method for generating signal images using multi-modal sensing signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210163682A KR20230076596A (ko) 2021-11-24 2021-11-24 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20230076596A true KR20230076596A (ko) 2023-05-31

Family

ID=86384015

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210163682A KR20230076596A (ko) 2021-11-24 2021-11-24 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법

Country Status (2)

Country Link
US (1) US20230162084A1 (ko)
KR (1) KR20230076596A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190056940A (ko) 2017-11-17 2019-05-27 삼성전자주식회사 멀티모달 데이터 학습 방법 및 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378455B2 (en) * 2012-05-10 2016-06-28 Yan M. Yufik Systems and methods for a computer understanding multi modal data streams
US10564622B1 (en) * 2016-07-31 2020-02-18 Splunk Inc. Control interface for metric definition specification for assets and asset groups driven by search-derived asset tree hierarchy
US11298071B1 (en) * 2017-10-16 2022-04-12 University Of South Florida Machine learning analytics in real time for health services
US11010645B2 (en) * 2018-08-27 2021-05-18 TalkMeUp Interactive artificial intelligence analytical system
US11501794B1 (en) * 2020-05-15 2022-11-15 Amazon Technologies, Inc. Multimodal sentiment detection
US11631181B2 (en) * 2020-09-02 2023-04-18 Sap Se Multimodal self-supervised learning for image analysis
US20220139074A1 (en) * 2020-10-30 2022-05-05 Flir Commercial Systems, Inc. Verification of embedded artificial neural networks systems and methods
US11764817B2 (en) * 2021-10-04 2023-09-19 Booz Allen Hamilton Inc. Spectrum-analysis-isolation-synthesis machine learning-based receiver system and method for spectrum coexistence and sharing applications

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190056940A (ko) 2017-11-17 2019-05-27 삼성전자주식회사 멀티모달 데이터 학습 방법 및 장치

Also Published As

Publication number Publication date
US20230162084A1 (en) 2023-05-25

Similar Documents

Publication Publication Date Title
US11582200B2 (en) Methods and systems of telemedicine diagnostics through remote sensing
US11984201B2 (en) Medical machine synthetic data and corresponding event generation
US12045705B2 (en) Dynamic and intuitive aggregation of a training dataset
Zemblys et al. gazeNet: End-to-end eye-movement event detection with deep neural networks
US11507822B2 (en) Scalable artificial intelligence model generation systems and methods for healthcare
Li et al. WiHF: Gesture and user recognition with WiFi
JP6885517B1 (ja) 診断支援装置及びモデル生成装置
KR102274581B1 (ko) 개인화된 hrtf 생성 방법
Fati et al. A continuous cuffless blood pressure estimation using tree-based pipeline optimization tool
Jia et al. BeAware: Convolutional neural network (CNN) based user behavior understanding through WiFi channel state information
Ba et al. Style transfer with bio-realistic appearance manipulation for skin-tone inclusive rppg
US20240164688A1 (en) System and apparatus for generating imaging information based on at least a signal
KR20230076596A (ko) 멀티모달 센싱 신호를 이용한 신호 이미지 생성 시스템 및 방법
Krenzer et al. Augmented Intelligence for Quality Control of Manual Assembly Processes using Industrial Wearable Systems.
Elnaggar et al. Sleep posture one-shot learning framework based on extremity joint kinematics: In-silico and in-vivo case studies
Chen et al. Air‐CSL: Chinese Sign Language Recognition Based on the Commercial WiFi Devices
US11751972B2 (en) Methods and systems for remote augmented reality communication for guided surgery
Sun et al. VCHAR: Variance-Driven Complex Human Activity Recognition framework with Generative Representation
Weibel et al. Hands that speak: An integrated approach to studying complex human communicative body movements
Mathur Scaling machine learning systems using domain adaptation
Li et al. Generalized Contrastive Partial Label Learning for Cross-Subject EEG-Based Emotion Recognition
Vaska et al. Evaluating the Capabilities of Multi-modal Reasoning Models with Synthetic Task Data
Calhas et al. fMRI multiple missing values imputation regularized by a recurrent denoiser
US20230260300A1 (en) View augmentation using a data profiler to detect and convert content to and/or from a profile-specific format
CN109754091B (zh) 一种基于脑波技术的自适应学习引擎训练系统及其应用

Legal Events

Date Code Title Description
E902 Notification of reason for refusal