WO2016126147A1 - 코골이 검출 장치 및 방법 - Google Patents

코골이 검출 장치 및 방법 Download PDF

Info

Publication number
WO2016126147A1
WO2016126147A1 PCT/KR2016/001357 KR2016001357W WO2016126147A1 WO 2016126147 A1 WO2016126147 A1 WO 2016126147A1 KR 2016001357 W KR2016001357 W KR 2016001357W WO 2016126147 A1 WO2016126147 A1 WO 2016126147A1
Authority
WO
WIPO (PCT)
Prior art keywords
snoring
class
value
sound signal
feature vector
Prior art date
Application number
PCT/KR2016/001357
Other languages
English (en)
French (fr)
Inventor
조위덕
최선탁
이규필
Original Assignee
아주대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아주대학교 산학협력단 filed Critical 아주대학교 산학협력단
Publication of WO2016126147A1 publication Critical patent/WO2016126147A1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Definitions

  • the following embodiments relate to an apparatus and method for detecting snoring, and more particularly, to an apparatus and method for accurately detecting snoring using a linear discriminant analysis method.
  • the present invention is derived from a study conducted as part of the University of the Future Creation Science and the Korea Research Foundation's Industry-University Cooperation Leading University (LINC) project. Development of an invisible respiratory monitoring system for judging apnea.
  • Snoring is a breathing noise caused by vibrations in body tissues such as soft palate due to narrowing of the upper respiratory tract for various reasons during sleep. Snoring reduces coral intake during breathing, which can cause symptoms such as daytime fatigue, headache, daytime sleepiness, and personality changes (aggressive personality, irritability, anxiety, depression, etc.), as well as long-term snoring. May cause Obstructive Sleep Apnea Syndrome (OSAS).
  • OSAS Obstructive Sleep Apnea Syndrome
  • the prior art discloses a technique for identifying snoring sounds using techniques such as preprocessing, A / D conversion, acoustic section detection, pattern matching for acoustic identification models, and time delay regression neural networks.
  • techniques such as preprocessing, A / D conversion, acoustic section detection, pattern matching for acoustic identification models, and time delay regression neural networks.
  • the prior art performs pattern matching on a learned time delay regression neural network to identify the sound as the nearest sound.
  • the following examples aim to accurately detect snoring.
  • the collecting unit for collecting the sound signal extracts only the sound signal of less than a predetermined frequency from the collected sound signal, divides the extracted sound signal into a plurality of frequency intervals, the divided frequency A preprocessing unit for reconstructing the sound signal to a maximum value for a predetermined time period for each section, a linear discrimination analysis unit for reducing the feature vector dimension of the reconstructed sound signal using a linear discriminant analysis method (LDA), and the feature vector dimension A snoring detection device is disclosed that includes a detector that detects snoring by comparing a value of the reduced acoustic signal with a predetermined threshold value.
  • LDA linear discriminant analysis method
  • the predetermined frequency may be 300 Hz.
  • the preprocessor may normalize the reconstructed sound signal, and the linear discriminant analyzer may reduce the feature vector dimension of the normalized sound signal.
  • the preprocessor may perform the normalization by converting the average value and the variance of the reconstructed sound signal into a constant value.
  • the preprocessor may convert the average value and the variance of the sound signal into a constant value according to Equation 1 below.
  • S i is a spectrum consisting of a frequency area by the maximum value
  • ⁇ Si is the average value of S i
  • Si ⁇ is the variance of S i
  • S i * indicates a mean value and dispersion spectrum conversion at a constant value.
  • the acoustic signal of which the feature vector dimension is reduced is compared with the threshold value to classify the snoring class or the snoring class, and the linear discriminant analyzing unit class includes the snoring class and the snoring class. It is possible to reduce the feature vector dimension of the acoustic signal by calculating an axis that maximizes the ratio of intra and inter-class dispersion.
  • the method may include collecting sound signals, extracting only sound signals having a predetermined frequency or less from the collected sound signals, dividing the extracted sound signals into a plurality of frequency sections, and Reconstructing the sound signal to a maximum value for a predetermined time for each divided frequency section, reducing a feature vector dimension of the reconstructed sound signal using a linear discriminant analysis method (LDA), and
  • LDA linear discriminant analysis method
  • a snoring detection method includes detecting a snoring by comparing a value of a reduced acoustic signal to a predetermined threshold.
  • the predetermined frequency may be 300 Hz.
  • the method may further include normalizing the reconstructed sound signal, and reducing the feature vector dimension may reduce the feature vector dimension of the normalized sound signal.
  • the normalizing may be performed by converting the average value and the variance of the reconstructed sound signal into a constant value.
  • the normalizing may convert the average value and the variance of the acoustic signal into a constant value according to Equation 2 below.
  • S i is a spectrum consisting of a frequency area by the maximum value
  • ⁇ Si is the average value of S i
  • Si ⁇ is the variance of S i
  • S i * indicates a mean value and dispersion spectrum conversion at a constant value.
  • the detecting of the snoring may include classifying the sound signal into a snoring class or a snoring class by comparing the value of the sound signal with the threshold value, and reducing the feature vector dimension.
  • a class and the snorkel can calculate an axis that maximizes the ratio of intra-class variance and inter-class variance of the class to reduce the feature vector dimension of the acoustic signal.
  • FIG. 1 is a block diagram illustrating a structure of a snoring detection device according to an exemplary embodiment.
  • FIG. 2 is a diagram illustrating an acoustic signal below a predetermined frequency extracted according to an exemplary embodiment.
  • FIG. 3 is a diagram illustrating a normalized acoustic signal according to an exemplary embodiment.
  • FIG. 4 is a diagram illustrating a linear discriminant analysis technique according to an exemplary embodiment.
  • FIG. 5 illustrates another embodiment of a linear discriminant analysis technique.
  • FIG. 6 is a diagram illustrating an acoustic signal to which a linear discriminant analysis technique is applied.
  • FIG. 7 is a diagram illustrating a distribution chart of a snoring signal and a non-snoring signal to which a linear discriminant analysis technique is applied.
  • FIG. 8 is a diagram illustrating a detection rate according to a change of a threshold value.
  • Fig. 9 is a flowchart illustrating a step-by-step method for detecting snoring according to an exemplary embodiment.
  • the snoring detection apparatus 100 includes a collector 110, a preprocessor 120, a linear discriminant analyzer 130, and a detector 140.
  • the collector 110 collects sound signals around the user while the user is sleeping. According to one side, the collecting unit 110 may collect a sound signal using a microphone of the smart phone.
  • the snoring detection apparatus 100 shown in FIG. 1 may determine whether the user is suffering from a sleep disease such as snoring based on the natural sound signal collected during the user's sleep.
  • the preprocessor 120 performs processing on the collected sound signals to facilitate linear discrimination analysis. According to one side, noise due to snoring may be concentrated in a band below 300 Hz. Therefore, the snoring detection apparatus 100 may determine whether the user snores by intensively analyzing only the sound of 300 Hz or less. According to one side, the preprocessor 120 may extract only a sound signal of a predetermined frequency or less from the collected sound signal. In this case, the predetermined frequency may be 300 Hz.
  • FIG. 2 is a diagram illustrating an acoustic signal below a predetermined frequency extracted according to an exemplary embodiment. 2 is the frequency, and the vertical axis is the intensity of the sound signal.
  • the preprocessing unit 120 extracts an acoustic signal of 300 Hz or less.
  • the preprocessor 120 may divide the extracted sound signal into a plurality of frequency sections.
  • the preprocessor 120 may reconstruct the sound signal to a maximum value for a predetermined time for each divided frequency section.
  • the predetermined time may be 1 minute. Therefore, the preprocessor 120 may reconstruct the sound signal to the maximum value for 1 minute for each frequency section of the sound signal.
  • acoustic signals typically occupy very large capacities.
  • the user does not continue to snore, but only some of the time periods snoring and do not snoring during the other time intervals, the reality is that most of the acoustic signal is wasted.
  • the acoustic signal is reconstructed to a maximum value for a predetermined time, it is determined that there is a snoring even when snoring only for a part of the predetermined time. Therefore, it is possible to detect only whether there is an snoring event in a predetermined time interval, and as a result, the acoustic signal can be effectively compressed, and the amount of computation for detection can be reduced.
  • the amount of computation of the LDA technique is difficult to handle in a mobile environment. Therefore, when the LDA technique is combined to reduce the amount of acoustic signals to reduce the object of calculation, the amount of computation is greatly reduced. In addition, it is possible to detect snoring smoothly even in a relatively poor mobile environment.
  • the intensity of the reconstructed sound signal 210 when snoring is stronger than that of the reconstructed sound signal 220 when snoring.
  • the preprocessor 120 may normalize the extracted sound signal. Normalization is to detect snoring regardless of the intensity of the acoustic signal, and to constantly convert the magnitude of the acoustic signal. According to one side, the snoring detection device 100 may detect the snoring only in the form of the extracted sound signal.
  • the acoustic signal collected by the collector 110 also includes the ambient noise component while the user sleeps. For example, in most cases, an acoustic signal of 300 Hz or less may include mechanical sounds, refrigerator noise, and the like. Therefore, when snoring is detected using the magnitude of the collected sound signal, snoring may be detected due to ambient noise even if the user does not snore.
  • the snoring can be accurately detected by extracting the shape and characteristics of the acoustic signal rather than the magnitude of the collected acoustic signal.
  • the magnitude component of the acoustic signal may be kept constant through normalization, and snoring may be accurately detected by using the shape and characteristics of the acoustic signal.
  • the preprocessor 120 may perform normalization using a whitening technique. According to this technique, the preprocessor 120 may uniformly convert the magnitude of the signal in the frequency domain. According to one side, the preprocessor 120 may perform normalization by converting the average value and the variance of the acoustic signal into a constant value. Here, the preprocessor 120 may convert the average value of the acoustic signal into '0' and the variance into '1'.
  • the preprocessor 120 may normalize according to Equation 1 below.
  • S i is a spectrum consisting of a frequency area by the maximum value
  • ⁇ Si is the average value of S i
  • Si ⁇ is the variance of S i
  • S i * indicates a mean value and dispersion spectrum conversion at a constant value.
  • FIG. 3 is a diagram illustrating a normalized acoustic signal according to an exemplary embodiment.
  • the normalized acoustic signal 320 when not snoring is relatively lower in frequency band and higher than the normalized acoustic signal 310 when snoring. Energy is concentrated in the frequency band.
  • the reconstructed sound signal 320 when snoring has more energy concentrated in the 100 Hz to 200 Hz band than the reconstructed sound signal 310 when snoring.
  • the linear discriminant analysis unit 130 reduces the feature vector dimension of the normalized acoustic signal by using a linear discriminant analysis (LDA) technique.
  • LDA linear discriminant analysis
  • FIG. 4 is a diagram illustrating a linear discriminant analysis technique according to an exemplary embodiment.
  • FIG. 4 (a) shows vectors that can be classified into two classes 410 and 420 in a two-dimensional vector space.
  • black dots represent vectors classified as the first class 410
  • white dots represent vectors classified as the second class 420.
  • the linear discriminant analysis technique is one of techniques for classifying vectors into respective classes 410 and 420.
  • the linear discriminant analysis technique projects the vectors on a one-dimensional line and classifies the vectors into classes 410 and 420 by comparing the threshold values on the one-dimensional line and the projected values of the vectors. It is a technique.
  • FIG. 4 (b) shows that the respective vectors are projected on the first axis 430.
  • the values 430 in which the respective vectors are projected on the first axis 430 are not classified for each class. Therefore, it is not appropriate to project the vectors shown in FIG. 4A on the first axis 430.
  • each vector is projected on the second axis 450.
  • the values 460 projected from the vectors classified into the first class 410 are projected onto the second axis 450, and the vectors classified into the second class 420 are included in the second axis ( Projected values 470 are clearly distinguished from one another. Therefore, it is appropriate to project the vectors shown in (a) of FIG. 4 onto the second axis 450.
  • FIG. 5 illustrates another embodiment of a linear discriminant analysis technique.
  • FIG. 5A shows the distance between each class 510 and 520 on the conventional x-y axis.
  • the average value of the first class 510 is ⁇ 1 511 and the average value of the second class 520 is ⁇ 2 521.
  • the distance difference on the x-axis of the mean value mu 1 511 and the mean value mu 2 521 is ⁇ x (530), and the distance difference on the y axis of the mean value mu 1 511 and the mean value mu 2 521 is ⁇ y (540).
  • the first class 510 and the second class 520 are arranged as shown in FIG. 5A, it is very important to determine the axes 440 and 450 for projecting the vectors. For example, when projecting respective vectors on the x-axis or y-axis, the vectors classified into the two classes 510 and 520 are mixed with each other on the projected axis and are not clearly distinguished.
  • the axis projecting the vectors may be determined such that the distance between the average values ⁇ 1 511 and ⁇ 2 521 of the two classes 510 and 520 is maximized.
  • vectors in particular classes 510 and 520 can determine the axis to project the vectors to be projected at adjacent locations.
  • vectors classified into the same class are projected in a near position, and variances between vectors classified in the same class have a small value, and vectors classified into different classes are projected in a distant position and thus different classes.
  • FIG. 5B is a diagram illustrating an axis for projecting vectors according to a linear discriminant analysis technique.
  • vectors included in the first class 550 and the second class 560 are projected onto the transformation axis 570.
  • the vectors classified into the first class 550 are projected into the first interval 572, and the vectors classified into the second class 560 are projected into the second interval 573.
  • the ranges of the first section 572 and the second section 573 are very narrow so that the variance between vectors classified into the same class has a small value.
  • the mean values 551 and 561 of each class 550 and 560 are projected far from each other, so that the variance between vectors classified into different classes has a large value.
  • FIG. 6 is a diagram illustrating an acoustic signal to which a linear discriminant analysis technique is applied.
  • the horizontal axis and the vertical axis are not two completely independent axes, but events that are dependent on each other, which is called a two-axis space.
  • the two axis spaces as shown in FIG. 6 it is possible to visually more clearly show the correlation between overlapping parameters allocated to each axis.
  • the sound signal appears as a black dot when recording snoring and as a white dot when snoring is not recorded.
  • the normalized acoustic signal is arranged in a straight line with a reduced feature vector space as shown in FIG. 6.
  • the acoustic signal shown in FIG. 6 may be projected on the horizontal axis of FIG. 6 as shown in FIG. 7.
  • FIG. 7 is a diagram illustrating a distribution chart of a snoring signal and a non-snoring signal to which a linear discriminant analysis technique is applied.
  • FIG. 7 may obtain and obtain a histogram by projecting the sound signal illustrated in FIG. 6 to the horizontal axis of FIG. 6 and dividing the projected value by 0.1 units.
  • FIG. 7 illustrates the distribution of snoring signals after applying the linear discriminant analysis technique
  • FIG. 7 illustrates the distribution of snoring signals after applying the linear discriminant analysis technique.
  • the detector 140 may detect snoring by comparing the value of the acoustic signal of which the feature vector space is reduced as shown in FIG. 6 with a threshold value between 0 and 1.
  • FIG. 7 the snoring signal is close to 1 and the snoring signal is close to zero. Accordingly, the detector 140 may detect snoring by comparing the value of the acoustic signal of which the feature vector space is reduced as shown in FIG. 6 with a threshold value between 0 and 1.
  • FIG. 8 is a diagram illustrating a detection rate according to a change of a threshold value.
  • a threshold value is changed and the success rate of the snoring signal is measured.
  • the threshold value is '0.19'
  • the detection success rate of the snoring signal is about 95%, the highest value. Therefore, the snoring detection device may use '0.19' as the threshold.
  • Fig. 9 is a flowchart illustrating a step-by-step method for detecting snoring according to an exemplary embodiment.
  • the snoring detection device collects sound signals around the user.
  • the snoring detection device may collect a sound signal using a microphone of the smartphone.
  • the snoring detection device extracts only sound signals below a predetermined frequency from the collected sound signals.
  • the snoring detection device can extract an acoustic signal of 300 Hz or less.
  • the snoring detection apparatus splits the extracted sound signal below a predetermined frequency into a plurality of frequency sections.
  • the snoring detection apparatus may reconstruct the acoustic signal to a maximum value for a predetermined time for each divided frequency interval. According to one side, the snoring detection device may reconstruct the sound signal to the maximum value for 1 minute for each frequency section of the sound signal.
  • the snoring detection device may normalize the reconstructed acoustic signal.
  • the snoring detection device may convert the average value and the variance of the acoustic signal into a constant value by using a whitening technique.
  • the snoring detection device may convert the average value of the acoustic signal into '0' and the variance into '1' according to Equation (1).
  • step 960 the snoring detection apparatus reduces the two-measurement space of the normalized acoustic signal using linear discriminant analysis. Since the embodiment of reducing the acoustic signal to the two measurement spaces using the linear discriminant analysis method has been described with reference to FIGS. 4 to 6, a detailed description thereof will be omitted.
  • the snoring detection apparatus may detect snoring by comparing the value of the acoustic signal of which the feature vector space is reduced with a predetermined threshold value. For example, the snoring detection apparatus may classify the acoustic signal into a snoring class or a snoring class by comparing the value of the acoustic signal with a threshold. In this case, when the snoring is classified as a class, the snoring is detected, and when the snoring is classified as the class, the snoring may be determined as not being detected.
  • step 960 it is possible to reduce the feature vector space of the acoustic signal by calculating the axis maximizing the ratio of the snoring class and non-snoring class in-class dispersion and inter-class dispersion.
  • the threshold value may be determined as a value maximizing the detection success rate, and may be determined as '0.19' with reference to FIG. 8.
  • the method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks.
  • Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
  • the hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

코골이 검출 장치 및 코골이 검출 방법이 개시된다. 개시된 장치 및 방법은 음향 신호를 수집하고, 수집된 음향 신호에서 코골이 신호가 집중된 주파수 대역만을 추출하고, 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 음향 신호를 재구성하는 등 선형 판별 분석 기법을 이용하기 코골이 신호를 검출하기 쉽도록 해당 음향 신호를 전처리한다.

Description

코골이 검출 장치 및 방법
하기의 실시예들은 코골이를 검출할 수 있는 장치 및 방법에 관한 것으로, 구체적으로는 선형 판별 분석법을 이용하여 코골이를 정확하게 검출하는 장치 및 방법에 관한 것이다.
본 발명은 미래창조과학부 및 한국연구재단의 산학협력선도대학(LINC) 사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2014-A-7277-0101006, 과제명: 수면상태에서의 폐쇄성무호흡증을 판단하는 무자각 호흡모니터링 시스템 개발].
코골이는 수면 중 여러 이유로 상기도가 좁아져 연구개 등의 신체 조직이 진동을 일으켜 발생하는 호흡 잡음이다. 코골이는 호흡 시 산호 흡입량을 감소시켜 주간 피로감, 두통, 주간 졸림증, 성격 변화(공격적 성격, 자극 과민성, 불안감, 우울 반응 등) 등의 증상이 나타날 수 있을 뿐만 아니라, 장시간의 코골이는 폐쇄성수면 무호흡증후군(OSAS: Obstructive Sleep Apnea Syndrome)을 유발할 수 있다.
이처럼 코골이는 신체 내분비 기관에 이상을 불러올 수 있다. 그러나 수면자가 평상시 자신의 수면 질환을 스스로 판단하는 것을 불가능하다. 전문 의료기관에서 수면 질환을 진단하는 검사는 심전도(Electrocardiography), 뇌전도(Electroencephalography) 등 측정 장비를 여러 곳에 부착하고 익숙하지 않은 곳에서 수면을 취해야 하는 등의 불편을 야기하며 또한 비용도 고가이다.
따라서, 무구속, 무자각적인 방법으로 수면 중 코골이의 발생 여부를 알아내는 것이 필요하다. 이러한 필요에 따라서, 코골이 음향으로부터 코골이 신호를 검출하는 종래의 기술로 대한민국 공개특허공보 공개 번호 제10-2000-0063265호 "신경회로망을 이용한 음향식별에 기반한 코골이 음향식별방법"이 있다.
종래 기술은 전처리, A/D 변환, 음향 구간 검출, 음향 식별 모델에 대한 패턴 정합 등의 기법과 시간 지연 회귀 신경회로망을 이용하여 코골이 음향을 식별하는 기술을 개시하고 있다. 종래 기술은 음향이 감지되었을 때, 이를 학습된 시간지연 회귀 신경 회로망에 패턴 정합을 수행하여 가장 근접한 음향으로 식별한다.
이와 같은 기술은 음향으로부터 코골이를 감지함으로써, 무구속, 무자각적인 방법으로 코골이를 검출할 수 있다고 언급하고 있다. 그러나, 이와 같은 종래기술에 따르더라도, 정해진 패턴이 아닌 코골이는 검출하기 어려운 문제점이 있다.
따라서, 무구속, 무자각적으로 수집된 음향 신호로부터 코골이를 정확하게 검출하는 검사 결과의 신뢰도를 높이는 방법이 요구된다.
하기의 실시예들은 코골이를 정확하게 검출하는 것을 목적으로 한다.
예시적 실시예에 따르면, 음향 신호를 수집하는 수집부, 상기 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호만을 추출하고, 상기 추출된 음향 신호를 복수의 주파수 구간으로 분할하고, 상기 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 상기 음향 신호를 재구성하는 전처리부, 선형 판별 분석기법(LDA)을 이용하여 상기 재구성된 음향 신호의 특징 벡터 차원을 축소하는 선형 판별 분석부 및 상기 특징 벡터 차원이 축소된 음향 신호의 값을 미리 결정된 임계값과 비교하여 코골이를 검출하는 검출부를 포함하는 코골이 검출 장치가 개시된다.
여기서, 상기 미리 결정된 주파수는 300Hz일 수 있다.
그리고, 상기 전처리부는 상기 재구성된 음향 신호를 정규화하고, 상기 선형 판별 분석부는 상기 정규화된 음향 신호의 특징 벡터 차원을 축소할 수 있다.
또한, 상기 전처리부는 상기 재구성된 음향 신호의 평균값 및 분산을 일정한 값으로 변환하여 상기 정규화를 수행할 수 있다.
여기서, 상기 전처리부는 하기 수학식 1에 따라서 상기 음향 신호의 평균값 및 분산을 일정한 값으로 변환할 수 있다.
[수학식 1]
Figure PCTKR2016001357-appb-I000001
여기서, Si는 주파수 구간별 최대값으로 이루어진 스펙트럼, μSi는 Si의 평균값, σSi는 Si의 분산이고, Si *는 평균값 및 분산이 일정한 값으로 변환된 스펙트럼을 나타낸다.
그리고, 상기 특징 벡터 차원이 축소된 음향 신호는 그 값이 상기 임계값과 비교되어 코골이 클래스 또는 비코골이 클래스로 분류되고, 상기 선형 판별 분석부는 상기 코골이 클래스 및 상기 비코골이 클래스의 클래스내 분산과 클래스간 분산의 비를 최대화하는 축을 산출하여 상기 음향 신호의 특징 벡터 차원을 축소할 수 있다.
또 다른 예시적 실시예에 따르면, 음향 신호를 수집하는 단계, 상기 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호만을 추출하는 단계, 상기 추출된 음향 신호를 복수의 주파수 구간으로 분할하는 단계, 상기 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 상기 음향 신호를 재구성하는 단계, 선형 판별 분석기법(LDA)을 이용하여 상기 재구성된 음향 신호의 특징 벡터 차원을 축소하는 단계 및 상기 특징 벡터 차원이 축소된 음향 신호의 값을 미리 결정된 임계값과 비교하여 코골이를 검출하는 단계를 포함하는 코골이 검출 방법이 제공된다.
여기서, 상기 미리 결정된 주파수는 300Hz일 수 있다.
그리고, 상기 재구성된 음향 신호를 정규화하는 단계를 더 포함하고, 상기 특징 벡터 차원을 축소하는 단계는 상기 정규화된 음향 신호의 특징 벡터 차원을 축소할 수 있다.
또한, 상기 정규화하는 단계는 상기 재구성된 음향 신호의 평균값 및 분산을 일정한 값으로 변환하여 상기 정규화를 수행할 수 있다.
여기서, 상기 정규화하는 단계는 하기 수학식 2에 따라서 상기 음향 신호의 평균값 및 분산을 일정한 값으로 변환할 수 있다.
[수학식 2]
Figure PCTKR2016001357-appb-I000002
여기서, Si는 주파수 구간별 최대값으로 이루어진 스펙트럼, μSi는 Si의 평균값, σSi는 Si의 분산이고, Si *는 평균값 및 분산이 일정한 값으로 변환된 스펙트럼을 나타낸다.
그리고, 상기 코골이를 검출하는 단계는 상기 음향 신호의 값을 상기 임계값과 비교하여 상기 음향 신호를 코골이 클래스 또는 비코골이 클래스로 분류하고, 상기 특징 벡터 차원을 축소하는 단계는 상기 코골이 클래스 및 상기 비코골이 클래스의 클래스내 분산과 클래스간 분산의 비를 최대화하는 축을 산출하여 상기 음향 신호의 특징 벡터 차원을 축소할 수 있다.
하기의 실시예들에 따르면 코골이를 정확하게 검출할 수 있다.
도 1은 예시적 실시예에 따른 코골이 검출 장치의 구조를 도시한 블록도이다.
도 2는 예시적 실시예에 따라 추출된 미리 결정된 주파수 이하의 음향 신호를 도시한 도면이다.
도 3은 예시적 실시예에 따라 정규화된 음향 신호를 도시한 도면이다.
도 4는 예시적 실시예에 따른 선형 판별 분석 기법을 도시한 도면이다.
도 5는 선형 판별 분석 기법의 또 다른 실시예를 도시한 도면이다.
도 6은 선형 판별 분석 기법이 적용된 음향 신호를 도시한 도면이다.
도 7은 선형 판별 분석 기법이 적용된 코골이 신호와 비코골이 신호의 분포도를 도시한 도면이다.
도 8은 임계값의 변화에 따른 검출률을 도시한 도면이다.
도 9는 예시적 실시예에 따른 코골이 검출 방법을 단계별로 설명한 순서도이다.
이하, 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 예시적 실시예에 따른 코골이 검출 장치의 구조를 도시한 블록도이다. 예시적 실시예에 따른 코골이 검출 장치(100)는 수집부(110), 전처리부(120), 선형 판별 분석부(130) 및 검출부(140)를 포함한다.
수집부(110)는 사용자가 수면 상태인 동안에, 사용자 주변의 음향 신호를 수집한다. 일측에 따르면, 수집부(110)는 스마트폰의 마이크 등을 이용하여 음향 신호를 수집할 수 있다.
일반적으로, 사용자는 자신이 코골이와 같은 수면 질환을 겪고 있는지 여부를 알지 못한다. 또한, 심전도, 뇌전도 등의 측정 장비를 이용하는 것은 비용이 과다하며 불편하다. 따라서, 도 1에 도시된 코골이 검출 장치(100)는 사용자의 수면 중 수집된 자연스러운 음향 신호에 기반하여 사용자가 코골이와 같은 수면 질환을 겪고 있는지 여부를 판단할 수 있다.
전처리부(120)는 선형 판별 분석을 수행하기 용이하도록 수집된 음향 신호에 대한 처리를 수행한다. 일측에 따르면, 코골이로 인한 잡음은 300Hz 이하의 대역에 집중될 수 있다. 따라서, 코골이 검출 장치(100)는 300Hz 이하의 음향만을 집중적으로 분석하여 사용자가 코를 고는지 여부를 판단할 수 있다. 일측에 따르면, 전처리부(120)는 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호만을 추출할 수 있다. 이 경우, 미리 결정된 주파수는 300Hz일 수 있다.
도 2는 예시적 실시예에 따라 추출된 미리 결정된 주파수 이하의 음향 신호를 도시한 도면이다. 도 2의 가로축은 주파수이고, 세로축은 음향 신호의 세기이다. 도 2에서는 전처리부(120)가 300Hz 이하의 음향 신호를 추출한 것이 도시되었다.
도 2에서, 전처리부(120)는 추출된 음향 신호를 복수의 주파수 구간으로 분할할 수 있다. 전처리부(120)는 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 음향 신호를 재구성할 수 있다. 일측에 따르면, 미리 결정된 시간은 1분일 수 있다. 따라서, 전처리부(120)는 음향 신호의 각각의 주파수 구간에 대하여 1분 동안의 최대값으로 음향 신호를 재구성 할 수 있다.
코골이를 검출하기 위해서 음향 신호를 수집하는 경우에는, 사용자가 잠을 자는 동안 장시간에 걸쳐 음향 신호를 수집하는 것이 대부분이다. 따라서, 음향 신호는 매우 큰 용량을 차지하는 것이 일반적이다. 그러나, 사용자는 계속하여 코를 고는 것이 아니라, 일부 시간 구간만 코를 골고 다른 시간 구간 동안에는 코를 골지 않는 경우가 많아 대부분의 음향 신호는 낭비되는 것이 현실이다.
상기의 실시예와 같이, 미리 결정된 시간 동안의 최대값으로 음향 신호를 재구성하면 그 미리 결정된 시간의 일부 시간에서만 코를 골아도 코골이가 있던 것으로 판단된다. 따라서, 미리 결정된 시간 구간에 코골이 이벤트가 있었는지 없었는지 만을 검출하는 셈이 되어 결과적으로 음향 신호를 효과적으로 압축할 수 있으며, 검출을 위한 연산량도 감소시킬 수 있다.
LDA 기법을 이용하는 경우, LDA 기법의 연산량은 모바일 환경에서 처리하기에 어려울 정도이다. 따라서, 음향 신호의 양을 감소시켜 계산의 대상을 줄이는 LDA 기법을 결합하는 경우 연산량의 절감 효과가 매우 크다. 또한, 상대적으로 열악한 모바일 환경에서도 원활하게 코골이를 검출할 수 있다.
도 2를 참고하면, 300Hz 이하의 주파수 대역에 있어서, 코를 고는 경우의 재구성된 음향 신호(210)의 세기는 코를 골지 않은 경우의 재구성된 음향 신호(220)의 세기보다 더 세다.
또한, 전처리부(120)는 추출된 음향 신호를 정규화할 수 있다. 정규화는 음향 신호의 세기에 관계없이 코골이를 검출하기 위한 것으로, 음향 신호의 크기를 일정하게 변환하는 것이다. 일측에 따르면, 코골이 검출 장치(100)는 추출된 음향 신호의 형태만으로 코골이를 검출할 수 있다. 수집부(110)가 수집한 음향 신호는 사용자가 자는 동안의 주변 잡음 성분도 포함한다. 예를 들어, 대부분의 경우 300Hz 이하의 음향 신호에는 기계음, 냉장고 소음 등이 포함될 수 있다. 따라서, 수집된 음향 신호의 크기를 이용하여 코골이를 검출하는 경우, 사용자가 코를 골지 않아도, 주변의 소음으로 인하여 코골이가 검출될 수도 있다.
그러므로, 수집된 음향 신호의 크기 보다는 음향 신호의 형태, 특성을 추출하여야 코골이를 정확히 검출할 수 있다. 예시적 실시예에 따르면, 정규화를 통해 음향 신호의 크기 성분을 일정하게 유지할 수 있으며, 음향 신호의 형태, 특성을 이용하여 코골이를 정확하게 검출할 수 있다.
일측에 따르면, 전처리부(120)는 백색화 기법을 이용하여 정규화를 수행할 수 있다. 이 기법에 따르면, 전처리부(120)는 주파수 영역에서 신호의 크기를 일정하게 변환할 수 있다. 일측에 따르면, 전처리부(120)는 음향 신호의 평균값 및 분산을 일정한 값으로 변환하여 정규화를 수행할 수 있다. 여기서, 전처리부(120)는 음향 신호의 평균값을 '0'으로, 분산을 '1'로 변환할 수 있다.
전처리부(120)는 하기의 수학식 1에 따라서 정규화를 수행할 수 있다.
Figure PCTKR2016001357-appb-M000001
여기서, Si는 주파수 구간별 최대값으로 이루어진 스펙트럼, μSi는 Si의 평균값, σSi는 Si의 분산이고, Si *는 평균값 및 분산이 일정한 값으로 변환된 스펙트럼을 나타낸다.
도 3은 예시적 실시예에 따라 정규화된 음향 신호를 도시한 도면이다.
도 3을 참고하면, 300Hz 이하의 주파수 대역에 있어서, 코를 골지 않는 경우의 정규화된 음향 신호(320)는 코를 고는 경우의 정규화된 음향 신호(310) 보다 상대적으로 더 낮은 주파수 대역과 더 높은 주파수 대역에 에너지가 집중되어 있다. 코를 고는 경우의 재구성된 음향 신호(320)는 코를 골지 않는 경우의 재구성된 음향 신호(310) 보다 상대적으로 100Hz 내지 200Hz 대역에 좀더 많은 에너지가 집중되어 있다.
선형 판별 분석부(130)는 선형 판별 분석(LDA: Linear Discriminant Analysis) 기법을 이용하여 정규화된 음향 신호의 특징 벡터 차원을 축소한다. 선형 판별 분석 기법에 대해서는 이하 도 4 내지 도 5에서 구체적으로 설명한다.
도 4는 예시적 실시예에 따른 선형 판별 분석 기법을 도시한 도면이다.
도 4의 (a)는 두 개의 클래스(410, 420)로 분류될 수 있는 벡터들을 2차원 벡터 공간에 도시한 것이다. 도 4의 (a)에서, 검은 색의 점들은 제1 클래스(410)로 분류되는 벡터를 나타내고, 흰 색의 점들은 제2 클래스(420)로 분류되는 벡터들을 나타낸다.
선형 판별 분석 기법은 벡터들을 각각의 클래스(410, 420)로 분류하는 기법의 하나이다. 선형 판별 분석 기법은 각 벡터들을 1차원의 선 위에 사영(projection)시키고, 1차원의 선 위에 존재하는 임계값과 각 벡터들이 사영된 값을 비교하여 벡터들을 각각의 클래스(410, 420)로 분류하는 기법이다.
도 4의 (b)는 각각의 벡터들이 제1 축(430)으로 사영된 것을 나타낸다. 도 4의 (b)를 참고하면, 각각의 벡터들이 제1 축(430)으로 사영된 값들(430)은 각각의 클래스별로 구분되지 않는다. 따라서, 도 4의 (a)에 도시된 벡터들을 제1 축(430)으로 사영하는 것은 적절하지 않다.
도 4의 (c)는 각각의 벡터들이 제2 축(450)으로 사영된 것을 나타낸다. 도 4의 (c)를 참고하면, 제1 클래스(410)로 분류되는 벡터들이 제2 축(450)으로 사영된 값(460)과 제2 클래스(420)로 분류되는 벡터들이 제2 축(450)으로 사영된 값(470)들은 서로 명확하게 구분된다. 따라서, 도 4의 (a)에 도시된 벡터들을 제2 축(450)으로 사영하는 것은 적절하다.
도 4에서 설명된 바와 같이, 선형 판별 분석 기법에 있어서, 벡터들을 사영하는 축(440, 450)을 결정하는 것은 매우 중요하다. 이하 도 5를 참고하여 벡터들을 사영하는 축(440, 450)을 결정하는 기법에 대해서 설명한다.
도 5는 선형 판별 분석 기법의 또 다른 실시예를 도시한 도면이다.
도 5의 (a)는 종래의 x-y 축 상에서 각 클래스(510, 520)간의 거리를 도시한 것이다. 도 5의 (a)에서, 제1 클래스(510)의 평균값은 μ1(511)이고, 제2 클래스(520)의 평균값은 μ2(521)이다. 또한, 평균값 μ1(511)과 평균값 μ2(521)의 x 축 상에서의 거리차는 Δx(530)이고, 평균값 μ1(511)과 평균값 μ2(521)의 y 축 상에서의 거리차는 Δy(540)이다.
도 5의 (a)와 같이 제1 클래스(510)와 제2 클래스(520)가 배치된 경우, 벡터들을 사영하는 축(440, 450)을 결정하는 것은 매우 중요하다. 예를 들어, x 축이나 y축으로 각각의 벡터들을 사영하는 경우, 두 클래스(510, 520)로 분류되는 벡터들은 사영된 축 위에서 서로 혼합되어 명확히 구분되지 않는다.
두 클래스(510, 520)를 명확히 구분하는 것을 목적으로 한다면, 두 클래스(510, 520)의 평균값 μ1(511), μ2(521) 사이의 거리가 최대가 되도록 벡터들을 사영하는 축을 결정할 수 있다. 또한, 특정 클래스(510, 520) 내의 벡터들은 인접한 위치에 사영되도록 벡터들을 사영하는 축을 결정할 수 있다.
선형 판별 분석 기법에서는, 동일한 클래스로 분류되는 벡터들은 가까운 위치에 사영되어 동일한 클래스로 분류되는 벡터들 사이의 분산은 작은 값을 가지고, 서로 다른 클래스로 분류되는 벡터들은 먼 위치로 사영되어 서로 다른 클래스로 분류되는 벡터들 사이의 분산은 큰 값을 가지도록 사영된다.
도 5의 (b)는 선형 판별 분석 기법에 따라 벡터들을 사영하는 축을 결정한 도면이다. 도 5의 (b)에서는 제1 클래스(550) 및 제2 클래스(560)에 포함된 벡터들이 변환축(570) 위로 사영된다. 제1 클래스(550)로 분류되는 벡터들은 제1 구간(572)으로 사영되고, 제2 클래스(560)로 분류되는 벡터들은 제2 구간(573)으로 사영된다.
도 5의 (b)에서는 제1 구간(572)과 제2 구간(573)의 범위는 매우 좁아 동일한 클래스로 분류되는 벡터들 사이의 분산은 작은 값을 가진다. 또한, 각 클래스(550, 560)의 평균값(551, 561)들은 서로 멀리 사영되어 서로 다른 클래스로 분류되는 벡터들 사이의 분산은 큰 값을 가진다.
도 5의 (b)와 같이 사영되는 경우, 클래스내 분산과 클래스간 분산의 비를 최대화하는 축으로 사영된다고 말할 수 있다.
도 6은 선형 판별 분석 기법이 적용된 음향 신호를 도시한 도면이다.
도 6에서의 가로축과 세로축은 완전히 독립된 두 개의 축이 아니고, 서로 종속적인 이벤트이며, 이를 2계축 공간이라고 한다. 도 6과 같은 2계축 공간에 도시하면, 각각의 축마다 할당하여 중복되는 파라미터 간의 연관성을 시각적으로 더욱 명확하게 보여줄 수 있다.
도 6의 가로축은 음향 신호가 코골이를 녹음한 것이 아닐 확률을 나타내고, 세로축은 음향 신호가 코골이를 녹음한 것일 확률을 나타낸다. 따라서, 각 음향 신호의 좌표가 (x,y)인 경우 x+y=1 이다. 이 경우에 코골이를 검출한 경우와 코골이를 검출하지 못한 경우는 도 6에 도시한 것과 같이 완전한 음의 연관 관계를 보인다.
음향 신호가 코골이를 녹음한 것일 경우에는 검은색 점으로, 코골이를 녹음한 것이 아닐 경우에는 흰색 점으로 나타난다.
도 4 내지 도 5에서 설명된 선형 판별 분석 기법이 도 3에 도시된 음향 신호에 적용되면, 정규화된 음향 신호는 도 6에 도시된 것과 같이 특징 벡터 공간이 축소되어 일직선상에 배치된다.
도 6에서는 서로 인접한 직선 위에 매우 많은 양의 데이터가 중첩되어 나타난다. 따라서 분류가 정확히 되었는지 판단하기 어렵다. 분류를 명확히 하기 위하여 도 6에 도시된 음향 신호를 도 7과 같이 도 6의 가로축에 사영시킬 수 있다.
도 7은 선형 판별 분석 기법이 적용된 코골이 신호와 비코골이 신호의 분포도를 도시한 도면이다. 도 7은 도 6에 도시된 음향 신호를 도 6의 가로축에 사영시키고, 사영된 값을 0.1 단위로 구분하여 히스토그램을 작성하여 얻을 수 있다.
도 7에서 가로축은 확률, 세로 축은 개수를 나타낸다. 즉, 도 7의 (a)는 선형 판별 분석 기법을 적용한 후 비코골이 신호의 분포를 나타낸 것이고, 도 7의 (b)는 선형 판별 분석 기법을 적용한 후 코골이 신호의 분포를 나타낸 것이다.
도 7을 참고하면, 비코골이 신호는 1에 가깝고, 코골이 신호는 0에 가깝다. 따라서 검출부(140)는 도 6에 도시된 것과 같은, 특징 벡터 공간이 축소된 음향 신호의 값을 0과 1 사이의 임계값과 비교하여 코골이를 검출할 수 있다.
도 8은 임계값의 변화에 따른 검출률을 도시한 도면이다.
코골이 신호의 검출률을 높이기 위하여, 임계값을 변화시키며 코골이 신호의 검출 성공률을 측정한 것이다. 도 8을 참고하면, 임계값이 '0.19'일 때 코골이 신호의 검출 성공률은 최고값인 약 95%를 보인다. 따라서, 코골이 검출 장치는 임계값으로 '0.19'를 사용할 수 있다.
도 9는 예시적 실시예에 따른 코골이 검출 방법을 단계별로 설명한 순서도이다.
단계(910)에서, 코골이 검출 장치는 사용자 주변의 음향 신호를 수집한다. 일측에 따르면, 코골이 검출 장치는 스마트폰의 마이크 등을 이용하여 음향 신호를 수집할 수도 있다.
단계(920)에서, 코골이 검출 장치는 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호만을 추출한다. 일반적으로 코골이 신호는 300Hz 이하에 분포하는 경우가 많으므로, 코골이 검출 장치는 300Hz 이하의 음향 신호를 추출할 수 있다.
단계(930)에서, 코골이 검출 장치는 추출된 미리 결정된 주파수 이하의 음향 신호를 복수의 주파수 구간으로 분할한다.
단계(940)에서, 코골이 검출 장치는 분할된 주파수 구간 별로 미리 결정된 시간 동안의 최대값으로 음향 신호를 재구성할 수있다. 일측에 따르면, 코골이 검출 장치는 음향 신호의 각각의 주파수 구간에 대하여 1분 동안의 최대값으로 음향 신호를 재구성 할 수 있다.
단계(950)에서, 코골이 검출 장치는 재구성된 음향 신호를 정규화할 수 있다. 일측에 따르면, 코골이 검출 장치는 백색화 기법을 이용하여 음향 신호의 평균값 및 분산을 일정한 값으로 변환할 수 있다. 예를 들어 코골이 검출 장치는 수학식 1에 따라서 음향 신호의 평균값을 '0'으로, 분산을 '1'로 변환할 수 있다.
단계(960)에서, 코골이 검출 장치는 선형 판별 분석법을 이용하여 정규화된 음향 신호를 2계측 공간을 축소한다. 선형 판별 분석법을 이용하여 음향 신호를 2계측 공간으로 축소하는 실시예에 대해서는 도 4 내지 도 6에서 설명하였으므로, 구체적인 설명은 생략하기로 한다.
단계(970)에서, 코골이 검출 장치는 특징 벡터 공간이 축소된 음향 신호의 값을 미리 결정된 임계값과 비교하여 코골이를 검출할 수 있다. 예를 들어, 코골이 검출 장치는 음향 신호의 값을 임계값과 비교하여 음향 신호를 코골이 클래스 또는 비코골이 클래스로 분류할 수 있다. 이 경우 음향 신호가 코골이 클래스로 분류되면 코골이가 검출된 것으로 판단하고, 음향 신호가 비코골이 클래스로 분류되면 코골이가 검출되지 않은 것으로 판단할 수 있다. 일측에 따르면, 단계(960)에서는 코골이 클래스 및 비코골이 클래스의 클래스내 분산과 클래스간 분산의 비를 최대화하는 축을 산출하여 음향 신호의 특징 벡터 공간을 축소할 수 있다.
여기서, 임계값은 검출 성공률을 최대화 하는 값으로 결정될 수 있으며, 도 8을 참고하면 '0.19'로 결정될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (13)

  1. 음향 신호를 수집하는 수집부;
    상기 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호만을 추출하고, 상기 추출된 음향 신호를 복수의 주파수 구간으로 분할하고, 상기 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 상기 음향 신호를 재구성하는 전처리부;
    선형 판별 분석기법(LDA)을 이용하여 상기 재구성된 음향 신호의 특징 벡터 차원을 축소하는 선형 판별 분석부; 및
    상기 특징 벡터 차원이 축소된 음향 신호의 값을 미리 결정된 임계값과 비교하여 코골이를 검출하는 검출부;를 포함하는, 코골이 검출 장치.
  2. 제1항에 있어서,
    상기 미리 결정된 주파수는 300Hz인 코골이 검출 장치.
  3. 제1항에 있어서,
    상기 전처리부는 상기 재구성된 음향 신호를 정규화하고,
    상기 선형 판별 분석부는 상기 정규화된 음향 신호의 특징 벡터 차원을 축소하는, 코골이 검출 장치.
  4. 제3항에 있어서,
    상기 전처리부는 상기 재구성된 음향 신호의 평균값 및 분산을 일정한 값으로 변환하여 상기 정규화를 수행하는, 코골이 검출 장치.
  5. 제4항에 있어서,
    상기 전처리부는 하기 수학식 1에 따라서 상기 음향 신호의 평균값 및 분산을 일정한 값으로 변환하는 코골이 검출 장치.
    [수학식 1]
    Figure PCTKR2016001357-appb-I000003
    (여기서, Si는 주파수 구간별 최대값으로 이루어진 스펙트럼, μSi는 Si의 평균값, σSi는 Si의 분산이고, Si *는 평균값 및 분산이 일정한 값으로 변환된 스펙트럼을 나타냄)
  6. 제1항에 있어서,
    상기 특징 벡터 차원이 축소된 음향 신호는 그 값이 상기 임계값과 비교되어 코골이 클래스 또는 비코골이 클래스로 분류되고,
    상기 선형 판별 분석부는 상기 코골이 클래스 및 상기 비코골이 클래스의 클래스내 분산과 클래스간 분산의 비를 최대화하는 축을 산출하여 상기 음향 신호의 특징 벡터 차원을 축소하는, 코골이 검출 장치.
  7. 음향 신호를 수집하는 단계;
    상기 수집된 음향 신호에서 미리 결정된 주파수 이하의 음향 신호 만을 추출하는 단계;
    상기 추출된 음향 신호를 복수의 주파수 구간으로 분할하는 단계;
    상기 분할된 주파수 구간별로 미리 결정된 시간 동안의 최대값으로 상기 음향 신호를 재구성하는 단계;
    선형 판별 분석기법(LDA)을 이용하여 상기 재구성된 음향 신호의 특징 벡터 차원을 축소하는 단계; 및
    상기 특징 벡터 차원이 축소된 음향 신호의 값을 미리 결정된 임계값과 비교하여 코골이를 검출하는 단계;를 포함하는, 코골이 검출 방법.
  8. 제7항에 있어서,
    상기 미리 결정된 주파수는 300Hz인 코골이 검출 방법.
  9. 제1항에 있어서,
    상기 재구성된 음향 신호를 정규화하는 단계;를 더 포함하고,
    상기 특징 벡터 차원을 축소하는 단계는 상기 정규화된 음향 신호의 특징 벡터 차원을 축소하는, 코골이 검출 방법.
  10. 제9항에 있어서,
    상기 정규화하는 단계는, 상기 재구성된 음향 신호의 평균값 및 분산을 일정한 값으로 변환하여 상기 정규화를 수행하는, 코골이 검출 방법.
  11. 제10항에 있어서,
    상기 정규화하는 단계는 하기 수학식 2에 따라서 상기 음향 신호의 평균값 및 분산을 일정한 값으로 변환하는 코골이 검출 방법.
    [수학식 2]
    Figure PCTKR2016001357-appb-I000004
    (여기서, Si는 주파수 구간별 최대값으로 이루어진 스펙트럼, μSi는 Si의 평균값, σSi는 Si의 분산이고, Si *는 평균값 및 분산이 일정한 값으로 변환된 스펙트럼을 나타냄)
  12. 제7항에 있어서,
    상기 코골이를 검출하는 단계는 상기 음향 신호의 값을 상기 임계값과 비교하여 상기 음향 신호를 코골이 클래스 또는 비코골이 클래스로 분류하고,
    상기 특징 벡터 차원을 축소하는 단계는 상기 코골이 클래스 및 상기 비코골이 클래스의 클래스내 분산과 클래스간 분산의 비를 최대화하는 축을 산출하여 상기 음향 신호의 특징 벡터 차원을 축소하는, 코골이 검출 방법.
  13. 제7항 내지 제12항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록매체.
PCT/KR2016/001357 2015-02-06 2016-02-05 코골이 검출 장치 및 방법 WO2016126147A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0018552 2015-02-06
KR1020150018552A KR20160096905A (ko) 2015-02-06 2015-02-06 코골이 검출 장치 및 방법

Publications (1)

Publication Number Publication Date
WO2016126147A1 true WO2016126147A1 (ko) 2016-08-11

Family

ID=56564389

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/001357 WO2016126147A1 (ko) 2015-02-06 2016-02-05 코골이 검출 장치 및 방법

Country Status (2)

Country Link
KR (1) KR20160096905A (ko)
WO (1) WO2016126147A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933181A (zh) * 2020-07-10 2020-11-13 北京理工大学 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102004219B1 (ko) 2018-05-11 2019-07-30 주식회사 라이프시맨틱스 미세진동 센서와 소리 센서 기반 수면장애 검출 시스템
KR20220021991A (ko) 2020-08-14 2022-02-23 주식회사 이피아이랩 코골이 소리 분석 기반 코골이/기도협착 위치 검출방법 및 장치
KR102346233B1 (ko) 2020-08-14 2022-01-05 주식회사 이피아이랩 생체신호 분석 기반 코골이 분석과 질병 진단 예측 서비스를 제공하는 코골이 분석 서비스 방법 및 시스템
KR20220021989A (ko) 2020-08-14 2022-02-23 주식회사 이피아이랩 수면중 코골이 소리와 수면 자세 분석 기반 수면 자세와 코골이 상관관계 모니터링 방법 및 장치
KR20220021986A (ko) 2020-08-14 2022-02-23 주식회사 이피아이랩 생체신호 기반 코골이/기도협착 위치 검출방법 및 코골이-수면무호흡 분석 서비스 시스템
KR102429256B1 (ko) * 2021-12-31 2022-08-04 주식회사 에이슬립 음향 정보를 통해 사용자의 수면 상태를 분석하기 위한 방법, 컴퓨팅 장치 및 컴퓨터 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009509575A (ja) * 2005-09-22 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響的外耳特徴付けのための方法及び装置
KR20130015071A (ko) * 2011-08-02 2013-02-13 이규성 코골이 방지 시스템 및 이를 이용한 코골이 방지 방법
JP2014502548A (ja) * 2011-01-18 2014-02-03 ユニバーシティー ヘルス ネットワーク 嚥下障害検出のための方法及び装置
KR101363654B1 (ko) * 2012-05-30 2014-02-17 단국대학교 산학협력단 코골이 및 무호흡 치료 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000063265A (ko) 2000-06-10 2000-11-06 김성석 신경회로망을 이용한 음향식별에 기반한 코골이 음향식별방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009509575A (ja) * 2005-09-22 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響的外耳特徴付けのための方法及び装置
JP2014502548A (ja) * 2011-01-18 2014-02-03 ユニバーシティー ヘルス ネットワーク 嚥下障害検出のための方法及び装置
KR20130015071A (ko) * 2011-08-02 2013-02-13 이규성 코골이 방지 시스템 및 이를 이용한 코골이 방지 방법
KR101363654B1 (ko) * 2012-05-30 2014-02-17 단국대학교 산학협력단 코골이 및 무호흡 치료 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LEE, GYU PIL ET AL.: "A Study on the Snoring Detection Using LDA", JOURNAL OF KOREAN INSTITUTE OF COMMUNICATIONS AND INFORMATION SCIENCES CONFERENCE (WINTER) 2015, January 2015 (2015-01-01) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933181A (zh) * 2020-07-10 2020-11-13 北京理工大学 基于复数阶导数处理的鼾声特征提取、检测方法及其装置
CN111933181B (zh) * 2020-07-10 2022-05-17 北京理工大学 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Also Published As

Publication number Publication date
KR20160096905A (ko) 2016-08-17

Similar Documents

Publication Publication Date Title
WO2016126147A1 (ko) 코골이 검출 장치 및 방법
Zhang et al. Pdvocal: Towards privacy-preserving parkinson's disease detection using non-speech body sounds
US6425874B1 (en) Method and apparatus for characterizing gastrointestinal sounds
Ahmed et al. Vision based hand gesture recognition using dynamic time warping for Indian sign language
JP5464072B2 (ja) 筋活動診断装置および方法、並びにプログラム
WO2019088462A1 (ko) 혈압 추정 모델 생성 시스템 및 방법과 혈압 추정 시스템 및 방법
WO2020222626A1 (ko) 근전도 측정을 통한 근육 피로도 분석 방법 및 이를 수행하는 웨어러블 디바이스
WO2021054742A1 (ko) 호흡과 관련된 소리를 분석하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
WO2022039559A1 (en) Method and system for breathing measurement and management using an electronic device
JP2007507783A (ja) 生体測定閾値を適応的に設定するシステム及び方法
CN110301890B (zh) 呼吸暂停监测的方法及装置
WO2018151357A1 (ko) 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법
WO2023059116A1 (ko) 시각적 피로발생구간 판단 방법 및 그 장치
Ren et al. Noninvasive fine-grained sleep monitoring leveraging smartphones
CN111553266A (zh) 识别验证方法、装置及电子设备
WO2021251587A1 (en) Adaptive respiratory condition assessment
WO2017082461A2 (ko) 초음파 도플러 태아감시 장치의 심박 검출 신호처리 방법
WO2018139881A1 (ko) 레이더를 이용한 생체 신호 측정 방법 및 장치
WO2015194833A1 (ko) 침식 호흡음 해석장치 및 방법
Nemati et al. Coughbuddy: Multi-modal cough event detection using earbuds platform
US4611284A (en) Method for decomposing an electromyogram into individual motor unit action potentials
WO2023200280A1 (ko) 보정된 이미지 기반 심박 추정 방법 및 그 장치
WO2017111386A1 (ko) 입력 신호의 특징 파라미터 추출 장치 및 그를 이용한 화자 인식 장치
WO2018212380A1 (ko) 개인인증을 위한 웨어러블 디바이스의 ecg 템플릿 검출 방법
JP2006110072A (ja) 非接触歩行検出方法とシステム及び該システムを用いた個人認証方法とシステム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16746888

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16746888

Country of ref document: EP

Kind code of ref document: A1