KR20150011854A - 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템 - Google Patents

소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템 Download PDF

Info

Publication number
KR20150011854A
KR20150011854A KR1020130074491A KR20130074491A KR20150011854A KR 20150011854 A KR20150011854 A KR 20150011854A KR 1020130074491 A KR1020130074491 A KR 1020130074491A KR 20130074491 A KR20130074491 A KR 20130074491A KR 20150011854 A KR20150011854 A KR 20150011854A
Authority
KR
South Korea
Prior art keywords
sound information
sound
frequency band
generated
acquisition
Prior art date
Application number
KR1020130074491A
Other languages
English (en)
Other versions
KR101491911B1 (ko
Inventor
인경준
박대희
정용화
이종욱
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR20130074491A priority Critical patent/KR101491911B1/ko
Publication of KR20150011854A publication Critical patent/KR20150011854A/ko
Application granted granted Critical
Publication of KR101491911B1 publication Critical patent/KR101491911B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단시간 에너지(short-time energy)를 결합하여 획득 대상의 사운드 정보를 얻는 사운드 획득 시스템이 제공된다. 상기 사운드 획득 시스템은, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부를 포함할 수 있다.

Description

소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템{Sound acquisition system to remove noise in the noise environment}
소음이 발생되는 환경에서 소음을 제거하는 시스템 및 방법에 연관되며, 보다 구체적으로 주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단시간 에너지(short-time energy)를 결합하여 사운드 획득 대상의 소리 정보를 얻는 사운드 획득 시스템 및 방법이 제공된다.
소리 획득 또는 음성 구간 탐지는 전체 소리 처리 과정 중에서 가장 처음 실행되어 신호를 전달하는 전처리 과정으로 소음에서 소리를 구별하는데 사용되며 특히 음성인식, 음성 코딩 및 통신 음성과 같은 많은 응용 프로그램에서 필요로 하는 기술이다. 강인한 소리 획득은 배경 소음의 다양한 유형에 따라 음성 인식률을 향상시키고 잘못된 음성 감지에 의해 유도된 계산 능력의 낭비를 줄일 수 있다.
소리 획득이라 함은 크게 분별력과 정확한 끝점 검출이라는 두 가지 기준에 대해 우수해야 한다. 즉, 소리 검출은 잡음과 소리를 잘 분별해야 할 뿐만 아니라, 정확한 끝점 검출을 하여 소리 정보 활용 시 발생되는 문제를 줄여야 한다.
소리 획득 프로세스를 위한 알고리즘은 크게 임계값에 기초한 알고리즘과 기계학습에 기반을 둔 패턴인식 기법으로 나눌 수 있다. 임계값에 기초한 알고리즘은 비교적 쉽고 간단하게 구현이 가능하나 소음에 강인하지 못하다는 단점이 있다. 반면 기계학습에 기반을 둔 패턴인식 기법은 소리 발생 구간의 특징 벡터와 소리가 아닌 구간의 특징 벡터를 SVM(Support Vector Machines)과 같은 기계학습 기법으로 학습하여 사용하는 패턴인식 기법을 말한다.
소리 획득 프로세스를 위한 기존의 알고리즘은 대부분 인간의 음성 인식을 위한 전처리 알고리즘으로써, 동물의 소리 연구 영역에서도 자체의 연구결과 없이 인간 소리를 위한 알고리즘이 그대로 동물의 소리 연구에 사용하고 있다.
물론 일부 개를 위한 혹은 새를 위한 소리 획득 프로세스 알고리즘은 발견되나, 돼지의 소리를 위한 소리 획득 프로세스 알고리즘은 발견되지 않는다. 동물의 경우, 인간의 성도의 겉모양만 같을 뿐 내부 조직이나 기능이 달라 발성에 차이가 있다는 것은 이미 검증된 사실이다. 다루고자 하는 대상에 특화된 소리 획득 프로세스 알고리즘이 필요하다.
일측에 따르면, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부를 포함하는 사운드 획득 시스템이 제공된다.
일실시예에 따르면, 상기 추출부는 상기 획득 대상의 상기 사운드 정보를 취득하는 센서부; 상기 센서부에 의해 취득된 상기 사운드 정보를 나누는 프레임 분할부; 및 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 변환부를 포함할 수 있다.
다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 것은 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출할 수 있다.
또 다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출할 수 있다.
또 다른 실시예에 따르면, 상기 판단부가 상기 단시간 에너지(short-time energy)를 사용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.
다른 일측에 따르면, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 단계; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계를 포함하는 사운드 획득 방법이 제공된다.
일실시예에 따르면, 상기 획득 대상의 상기 사운드 정보를 취득하는 단계; 취득된 상기 사운드 정보를 나누는 단계; 및 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 단계를 더 포함하는 할 수 있다.
다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 단계는 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출할 수 있다.
또 다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 단계는 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출할 수 있다.
또 다른 실시예에 따르면, 상기 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계는 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.
도 1은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 과정을 설명하기 위한 개략적인 개념도이다.
도 2는 일실시예에 따른 사운드 획득 시스템의 모듈 흐름도이다.
도 3은 일실시예에 따른 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템의 구성을 도시한 도면이다.
도 4는 일실시예에 따른 사운드 획득 시스템 추출부의 세부 구성도이다.
도 5는 일실시예에 따른 주파수 영역에서 획득 대상이 발생시키는 사운드의 신호와 소음 신호를 나타내는 그래프이다.
도 6은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 방법을 설명하기 위한 구체적인 흐름도이다.
도 7은 일실시예에 따른 획득 대상의 사운드 소리와 소음의 파형 및 스펙트럼을 나타내는 도면이다.
도 8은 일실시예에 따른 획득 대상의 사운드 파형을 나타내는 실시예를 나타내는 도면이다.
이하에서, 일부 실시예들을, 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
아래 설명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례, 새로운 기술의 출현 등에 따라 달라질 수 있다.
또한 특정한 경우는 이해를 돕거나 및/또는 설명의 편의를 위해 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 설명 부분에서 상세한 그 의미를 기재할 것이다. 따라서 아래 설명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 명세서 전반에 걸친 내용을 토대로 이해되어야 한다.
도 1은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 과정을 설명하기 위한 개략적인 개념도이다.
일실시예에 따라 획득 대상에서 사운드 신호가 방출(110)한다. 사운드 획득 시스템(130)은 추출부 중 센서부에서 상기 획득 대상의 사운드 정보를 수신(120)한다. 상기 센서부는 상기 획득 대상의 상기 사운드 정보 뿐만 아니라 소음도 수신할 수 있다.
일실시예에 따라 사운드 획득 시스템(130)은 주파수 변화를 감시하는 모듈과 에너지 변화를 감시하는 모듈로 구성될 수 있다. 주파수 변화를 감시하는 모듈은 소리 정보를 취득하는 과정과 주파수를 분석하는 과정을 포함할 수 있다. 에너지 변화를 감시하는 모듈은 획득 대상의 소리를 탐지하는 과정을 포함할 수 있다
일실시예에 따라 수신한 상기 획득 대상의 상기 사운드 정보를 프레임 분할부에서 나눌 수 있다. 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 해밍 윈도우를 적용하여 고속 퓨리에 변환을 할 수 있다. 상기 고속 퓨리에 변환(Fast Fourier Transform)을 하여 신호를 주파수 영역으로 이동시키고 이로부터 크기 주파수 스펙트럼을 얻을 수 있다. 사운드 획득 시스템(130)은 소리 발생 시 전체 주파수 대역을 감시하는 것이 아니라 주요 주파수 대역만을 감시함으로써 소리 추출에 소요되는 시간을 단축시키며 생활 소음에 의해 발생된 소리와 획득 대상에 의해 발생된 소리를 구분하고 있다.
구체적으로, 주요 주파수 대역을 추출하기 위해서는 획득 대상의 사운드가 발생되었을 때와 상기 획득 대상의 상기 사운드가 발생되지 않았을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산으로 주파수 곡선의 변화가 큰 대역을 찾는다. 찾아낸 주파수 대역의 크기(amplitude) 임계값을 구하여 상기 사운드를 추출할 기준을 정할 수 있다.
일실시예에 따라 상기 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 소리인지 단시간 에너지(short-time energy)를 이용하여 판단할 수 있다. 판단부가 상기 단시간 에너지(short-time energy)를 이용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 것이다. 상기 얻은 정보로 시간 변화에 따른 에너지 변화를 확인할 수 있다. 획득 대상의 사운드 정보를 추출하여 파일 형태로 저장(140)할 수 있다. 파일로 저장될 시 음절단위로 저장될 수 있다.
도 2는 일실시예에 따른 사운드 획득 시스템의 모듈 흐름도이다.
사운드 획득 시스템(200)은 소리 특징 정보들 중, 주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단구간 에너지(short-time energy)를 조합하여, 소음이 발생되는 환경에서도 효율적이며 정확한 소리(또는 사운드)를 획득하는 것을 목적으로 한다.
구체적으로는, 시간의 변화에 따른 주파수 스펙트럼의 변화를 확인할 수 있는 크기 주파수 스펙트럼과 그에 따른 에너지의 변화를 확인할 수 있는 단구간 에너지를 결합하여 소음이 있는 환경에서 획득 대상의 사운드를 얻기 위한 것이다.
사운드 획득 시스템(200)은 주파수 변화를 감시하는 모듈(210)과 에너지 변화를 감시하는 모듈(220)로 구성될 수 있다. 주파수 변화를 감시하는 모듈(210)은 소리 정보를 취득하는 과정과 주파수를 분석하는 과정을 포함할 수 있다. 에너지 변화를 감시하는 모듈(220)은 획득 대상의 소리를 탐지하는 과정을 포함할 수 있다. 상기 획득 대상은 소음이 발생하는 환경에서 소음을 제거하고 소리 정보를 얻고자 하는 대상을 가리킬 수 있다.
일실시예에 따른 상기 소리 정보를 취득하는 과정은 소리 센서 또는 CCTV로부터 소리 정보를 취득할 수 있다. 상기 소리 센서를 포함하는 장치에는 일상 생활에서 사용하는 휴대 전화, 녹음기, 라디오를 포함할 수 있다. 상기 소리 정보는 소음이 발생하는 환경에서 소음을 제거한 것이다.
일실시예에 따른 상기 주파수를 분석하는 과정은 상기 소리 센서 또는 상기 CCTV로부터 입력되는 신호를 고속 푸리에 변환(Fast Fourier Transform)하여 주파수 영역으로 변환하고 소리가 발생되었는지 확인하는 과정을 포함할 수 있다. 상기 소리가 발생되었는지 확인하는 과정에서는 전체 주파수 대역을 감시하는 것이 아니라, 주요 주파수 대역만을 감시함으로써 추출에 소요되는 시간을 단축시킬 수 있다.
일실시예에 따른 주요 주파수 대역을 설정하는 과정은 소리(또는 사운드)가 발생되지 않았을 때와 소리(또는 사운드)가 발생되었을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산(sine-distance calculation)을 이용하여 주파수 곡선의 변화가 가장 큰 대역을 찾는 과정을 포함할 수 있다. 주파수 대역을 설정하고 그 설정된 주파수 대역의 크기 임계값을 구하여 소리를 추출한 기준을 정할 수 있다.
일실시예에 따른 상기 획득 대상의 소리를 탐지하는 과정은 설정된 주파수 대역을 감시하면서 획득 대상에 의해 발생된 소리인지를 단시간 에너지를 이용하여 소리 정보를 획득하는 과정을 포함할 수 있다.
도 3은 일실시예에 따른 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템의 구성을 도시한 도면이다.
일실시예에 따르면, 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템(300)은 추출부(310), 판단부(320)를 포함할 수 있다.
일실시예에 따르면, 상기 추출부(310)는 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출할 수 있다. 상기 주파수 대역 구간을 추출하는 것은 전체 주파수 구간을 추출하는 것이 아니라, 주요 주파수 구간을 추출하는 것이다. 상기 주파수 구간을 추출하는 것은 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 크기 주파수 스펙트럼으로부터 추출할 수 있다.
구체적으로, 상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 주파수 전체 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출하는 것일 수 있다.
사인-거리 계산(sine-distance calculation)은 [수학식 1]과 같이 계산된다. 크기 스펙트럼(magnitude spectrum)이 주어졌을 때, 주파수 지점 근처의 개 주파수 지점들 간의 거리를 계산한다. 이는 크기(magnitude)의 차이점을 없애고 오직 주파수 형태(shape)만을 비교하는 것이다.
Figure pat00001
S(k)는 magnitude frequency spectrum의 k번째 주파수이고, M은 k번째 주파수로 부터 거리를 구할 주변 주파수 개수이다. 보통 3으로 설정할 수 있다. W(k)는 k번째의 프레임 윈도우(frame window)이다.
일실시예에 따라, 프레인 윈도우(frame window)는 해밍 윈도우(Hamming window)일 수 있다. 해밍 윈도우(Hamming window)는 [수학식 2]와 같이 정의된다.
Figure pat00002
N은 윈도우의 길이를 나타내며, 일실시예에 따라 64로 설정할 수 있다. n은 길이가 N인 윈도우의 n번째를 나타낸다. N이 64로 설정될 경우 n은 0에서 63까지의 값을 갖는다. (단, N 및 n은 정수)
일실시예에 따라 판단부(320)는 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.
다른 실시예에 따라 상기 판단부(320)가 상기 단시간 에너지(short-time energy)를 사용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하라 수 있다.
획득 대상의 사운드 정보를 얻고자 할 때에는 획득 대상의 사운드 뿐만 아니라 불필요한 소음들이 발생할 수 있다. 사운드 획득 시스템(300)은 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 사운드인지 구분하기 위해 단시간 에너지를 사용할 수 있다. 시간 영역의 특징들 중 하나인 에너지(energy)는 신호(signal)의 제곱 값으로 구할 수 있으나 시간 변화에 따른 에너지(energy)변화를 확인하는 것이 불가능하여 단시간 에너지를 이용할 수 있다. 단시간 에너지는(short-time energy)는 신호(signal)의 제곱 값에 윈도우(window)를 곱해줌으로써 구할 수 있으며, 시간 변화에 따른 에너지(energy)변화가 확인 가능하다. 단시간 에너지(short-time energy)는 [수학식 3]과 같이 수식화 된다.
Figure pat00003
X(m)은 m번째 신호(signal)를 나타내고, n은 윈도우(window) 크기를 나타낸다. W(n)은 n-m번째의 프레임 윈도우(frame window)를 나타낸다.
도 4는 일실시예에 따른 사운드 획득 시스템 추출부의 세부 구성도이다.
일실시예에 따라 추출부(310)는 센서부(410), 프레임 분할부(420), 변환부(430)를 포함할 수 있다. 상기 센서부(410)는 획득 대상의 상기 사운드 정보를 취득할 수 있다. 상기 프레임 분할부(420)는 상기 센서부(410)에 의해 취득된 상기 사운드 정보를 나눌 수 있다. 상기 변환부(430)는 상기 프레임 분할부(420)에 의해 나눠진 상기 사운드 정보를 고속 퓨리에 변환(Fast Fourier Transform)을 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환할 수 있다.
도 5는 일실시예에 따른 주파수 영역에서 획득 대상이 발생시키는 사운드의 신호와 소음 신호를 나타내는 그래프이다.
단시간 에너지를 이용하여 획득 대상의 사운드 정보를 얻기 전에 획득 대상의 사운드 정보인지를 판단하기 위하여 신호 구간을 설정(500)할 수 있다.
상기 신호 구간은 주파수 대역을 분석하여 설정할 수 있다. 전체 주파수 대역을 설정하여 단기간 에너지를 이용하는 것이 아니라, 주요 주파수 대역만을 추출하여 획득 대상으로부터 사운드가 발생하였는지 판단할 수 있다.
주요 주파수 대역을 추출하는 방법은, 소리센서로부터 입력되는 신호를 고속 퓨리에 변환을 이용하여 주파수 영역으로 변환한다. 주파수 영역으로 변환한 후, 크기 주파수 스펙트럼(magnitude frequency spectrum)을 구한다. 크기 주파수 스펙트럼으로부터 소리가 발생되지 않았을 때와 소리가 발생되었을 때를 각각 추출하여 주파수 곡선의 변화가 가장 큰 대역을 찾는다. 주파수 변화가 있는지는 상기한 바와 같이 [수학식 1] 및 [수학식 2]를 통해 알 수 있다.
일실시예에 따라 도 5에서 도시된 그래프를 살펴보면, 510은 돼지의 축사에서 돼지의 기침소리를 나타내는 주파수 신호를 나타낸 것이다. 520은 돼지의 축사에서 돼지에 의해 발생된 소리가 아닌 소음을 나타내는 주파수 신호를 나타낸 것이다. 소음은 축사의 환기 펜 혹은 주변 소음들을 가리킬 수 있다. 530은 돼지의 기침소리를 나타내는 신호와 소음을 나타내는 신호 간에 차이가 많이 나는 구간을 설정한 것이다.
일실시예에 따라 설정된 구간이 획득 대상에 의해 발생되니 소리인지는 단시간 에너지를 이용하여 판단할 수 있다.
도 6은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 방법을 설명하기 위한 구체적인 흐름도(600)이다.
단계(601)은 획득 대상에서 사운드 신호가 방출하는 단계이다. 사운드 획득 시스템은 추출부 중 센서부에서 상기 획득 대상의 사운드 정보를 수신한다. 상기 센서부는 상기 획득 대상의 상기 사운드 정보 뿐만 아니라 소음도 수신할 수 있다.
단계(602)는 수신한 상기 획득 대상의 상기 사운드 정보를 프레임 분할부에서 나눌 수 있다.
단계(604)는 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 해밍 윈도우를 적용하여 고속 퓨리에 변환을 할 수 있다.
단계(605)는 상기 고속 퓨리에 변환을 하여 신호를 주파수 영역으로 이동시키고 이로부터 크기 주파수 스펙트럼을 얻을 수 있다. 사운드 획득 시스템은 소리 발생 시 전체 주파수 대역을 감시하는 것이 아니라 주요 주파수 대역만을 감시함으로써 소리 추출에 소요되는 시간을 단축시키며 생활 소음에 의해 발생된 소리와 획득 대상에 의해 발생된 소리를 구분하고 있다.
단계(606)은 주요 주파수 대역을 추출하기 위해서는 획득 대상의 사운드가 발생되었을 때와 상기 획득 대상의 상기 사운드가 발생되지 않았을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산으로 주파수 곡선의 변화가 큰 대역을 찾는다. 찾아낸 주파수 대역의 크기(amplitude) 임계값을 구하여 상기 사운드를 추출할 기준을 정할 수 있다.
단계(607)은 상기 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 소리인지 단시간 에너지(short-time energy)를 이용하여 판단할 수 있다. 판단부가 상기 단시간 에너지(short-time energy)를 이용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 것이다.
단계(608)은 단계(607)에서 얻은 정보로 시간 변화에 따른 에너지 변화를 확인할 수 있다.
단계(609)는 획득 대상의 사운드 정보를 추출하여 파일 형태로 저장할 수 있다. 파일로 저장될 시 음절단위로 저장될 수 있다.
도 7은 일실시예에 따른 획득 대상의 사운드 소리와 소음의 파형 및 스펙트럼을 나타내는 도면(700)이다.
일실시예에 따른 획득 대상의 사운드 파형(710)에서 가로축은 시간을 나타내고, 세로축은 신호의 크기를 나타낸다. 파형에서 신호의 크기가 큰 부분을 추출할 수 있다.
다른 실시예에 따른 획득 대상의 스펙트럼(720)에서 가로축은 시간을 나타내고, 세로축은 주파수를 나타낸다. 스펙트럼에서 획득 대상의 spectral이 큰 부분을 추출할 수 있다.
또 다른 실시예에 따른 소음의 파형(730)에서 가로축은 시간을 나타내고, 세로축은 신호의 크기를 나타낸다. 파형에서 신호의 크기가 큰 부분을 추출할 수 있다.
또 다른 실시예에 따른 소음의 스펙트럼(740)에서 가로축은 시간을 나타내고, 세로축은 주파수를 나타낸다. 스펙트럼에서 획득 대상의 spectral이 큰 부분을 추출할 수 있다.
도 8은 일실시예에 따른 획득 대상의 사운드 파형을 나타내는 실시예를 나타내는 도면이다.
일실시예에 따라 800은 여러 획득 대상의 사운드 파형을 보여준다. 810은 동물의 기침 소리를 나타낸 사운드 파형이고, 820은 동물의 비명 소리를 나타내는 사운드 파형이다. 830은 동물의 발자국 소리를 나타내는 사운드 파형이다.
이상에서 설명된 시스템은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 시스템과 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 시스템은 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 시스템은 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 시스템은 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 시스템이 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 시스템은 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 시스템에 의하여 해석되거나 처리 시스템에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 시스템, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (10)

  1. 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및
    추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부
    를 포함하는 사운드 획득 시스템.
  2. 제1항에 있어서,
    상기 추출부는
    상기 획득 대상의 상기 사운드 정보를 취득하는 센서부;
    상기 센서부에 의해 취득된 상기 사운드 정보를 나누는 프레임 분할부; 및
    상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 변환부
    를 포함하는 사운드 획득 시스템.
  3. 제2항에 있어서,
    상기 주파수 대역 구간을 추출하는 것은 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출하는 것으로 하는 사운드 획득 시스템.
  4. 제3항에 있어서,
    상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출하는 것으로 하는 사운드 획득 시스템.
  5. 제1항에 있어서,
    상기 판단부가 상기 단시간 에너지(short-time energy)를 사용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 것으로 하는 사운드 획득 시스템.
  6. 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 단계; 및
    추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계
    를 포함하는 사운드 획득 방법.
  7. 제6항에 있어서,
    상기 획득 대상의 상기 사운드 정보를 취득하는 단계;
    취득된 상기 사운드 정보를 나누는 단계; 및
    나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 단계
    를 더 포함하는 사운드 획득 방법.
  8. 제7항에 있어서,
    상기 주파수 대역 구간을 추출하는 단계는 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출하는 사운드 획득 방법.
  9. 제8항에 있어서,
    상기 주파수 대역 구간을 추출하는 단계는 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출하는 사운드 획득 방법.
  10. 제6항에 있어서,
    상기 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계는 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 사운드 획득 방법.
KR20130074491A 2013-06-27 2013-06-27 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템 KR101491911B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130074491A KR101491911B1 (ko) 2013-06-27 2013-06-27 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130074491A KR101491911B1 (ko) 2013-06-27 2013-06-27 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템

Publications (2)

Publication Number Publication Date
KR20150011854A true KR20150011854A (ko) 2015-02-03
KR101491911B1 KR101491911B1 (ko) 2015-02-12

Family

ID=52488093

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130074491A KR101491911B1 (ko) 2013-06-27 2013-06-27 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템

Country Status (1)

Country Link
KR (1) KR101491911B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601233A (zh) * 2016-12-22 2017-04-26 北京元心科技有限公司 语音命令识别方法、装置及电子设备
CN108491180A (zh) * 2018-03-16 2018-09-04 北京小米移动软件有限公司 音频播放方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101897181B1 (ko) * 2017-08-18 2018-09-13 주식회사 크레스프리 액츄에이터 분석 방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3453898B2 (ja) 1995-02-17 2003-10-06 ソニー株式会社 音声信号の雑音低減方法及び装置
KR101128521B1 (ko) * 2005-11-10 2012-03-27 삼성전자주식회사 오디오 데이터를 이용한 이벤트 검출 방법 및 장치
KR20120103286A (ko) * 2011-03-10 2012-09-19 최길준 오디오 신호를 이용하여 차량에 대한 관심 대상 이벤트를 감지하기 위한 방법 및 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601233A (zh) * 2016-12-22 2017-04-26 北京元心科技有限公司 语音命令识别方法、装置及电子设备
CN108491180A (zh) * 2018-03-16 2018-09-04 北京小米移动软件有限公司 音频播放方法及装置
CN108491180B (zh) * 2018-03-16 2021-05-18 北京小米移动软件有限公司 音频播放方法及装置

Also Published As

Publication number Publication date
KR101491911B1 (ko) 2015-02-12

Similar Documents

Publication Publication Date Title
CN110383375B (zh) 用于检测噪声背景环境中的咳嗽的方法和设备
CN111445905B (zh) 混合语音识别网络训练方法、混合语音识别方法、装置及存储介质
KR102605736B1 (ko) 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치
KR101805976B1 (ko) 음성 인식 장치 및 방법
CN108701469B (zh) 咳嗽声音识别方法、设备和存储介质
US9489965B2 (en) Method and apparatus for acoustic signal characterization
CN105989836B (zh) 一种语音采集方法、装置及终端设备
KR20200115731A (ko) 컨볼루션 뉴럴 네트워크에 기반한 음향 이벤트 인식 방법 및 장치
US8046215B2 (en) Method and apparatus to detect voice activity by adding a random signal
JP6784758B2 (ja) ノイズ信号判定方法及び装置並びに音声ノイズ除去方法及び装置
JP2009008823A (ja) 音響認識装置、音響認識方法、及び、音響認識プログラム
WO2017045429A1 (zh) 一种音频数据的检测方法、系统及存储介质
KR101491911B1 (ko) 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템
AU2013204156A1 (en) Classification apparatus and program
JPWO2019220620A1 (ja) 異常検出装置、異常検出方法及びプログラム
KR20160096905A (ko) 코골이 검출 장치 및 방법
CN117076941A (zh) 一种光缆鸟害监测方法、系统、电子设备及可读存储介质
KR20170101500A (ko) 노이즈 제거를 통한 오디오 신호 식별 방법 및 장치
CN109377982B (zh) 一种有效语音获取方法
KR101558438B1 (ko) 부분 푸리에 변환을 이용한 특징벡터 추출 및 능동표적 식별 방법 및 장치
KR101116279B1 (ko) 센서를 이용한 사람/사물 식별 장치
Xie et al. Detection of anuran calling activity in long field recordings for bio-acoustic monitoring
CN107894837A (zh) 动态情感分析模型样本处理方法及装置
KR20180041072A (ko) 오디오 프레임 프로세싱을 위한 디바이스 및 방법
US9495978B2 (en) Method and device for processing a sound signal

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180118

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190207

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200106

Year of fee payment: 6