KR100580643B1 - 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 - Google Patents
충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 Download PDFInfo
- Publication number
- KR100580643B1 KR100580643B1 KR1020040008738A KR20040008738A KR100580643B1 KR 100580643 B1 KR100580643 B1 KR 100580643B1 KR 1020040008738 A KR1020040008738 A KR 1020040008738A KR 20040008738 A KR20040008738 A KR 20040008738A KR 100580643 B1 KR100580643 B1 KR 100580643B1
- Authority
- KR
- South Korea
- Prior art keywords
- onset
- power
- event
- impulse
- unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000001514 detection method Methods 0.000 claims abstract description 49
- 230000008859 change Effects 0.000 claims abstract description 33
- 230000003595 spectral effect Effects 0.000 claims abstract description 32
- 238000012795 verification Methods 0.000 claims abstract description 19
- 230000035939 shock Effects 0.000 claims abstract description 9
- 230000003139 buffering effect Effects 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000008878 coupling Effects 0.000 claims description 9
- 238000010168 coupling process Methods 0.000 claims description 9
- 238000005859 coupling reaction Methods 0.000 claims description 9
- 230000002238 attenuated effect Effects 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 6
- 238000001914 filtration Methods 0.000 claims 2
- 238000009825 accumulation Methods 0.000 claims 1
- 239000006185 dispersion Substances 0.000 claims 1
- 238000000926 separation method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000007847 structural defect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H1/00—Measuring characteristics of vibrations in solids by using direct conduction to the detector
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별 장치 및 방법이 개시된다. 본 발명의 충격음 감지 장치는 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 분리된 신호들에 대해 각각 프레임별로 파워를 측정하며, 측정된 파워의 변화를 검사하여 온셋을 감지하는 온셋 감지부; 온셋 감지부에서 측정된 파워 및 입력신호의 스펙트럴 데이터를 버퍼링하는 이벤트 버퍼; 및 감지된 온셋이 임펄스 온셋인지를 판별하여 임펄스 온셋이면 이벤트 버퍼에 저장된 파워를 검사하여 임펄스 온셋으로부터 시작되는 이벤트를 검출하고, 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 충격음 검증부를 포함함을 특징으로한다.
Description
도 1은 본 발명에 따른 충격음 감지 및 식별 장치에 대한 블록도이다.
도 2는 두 개의 이벤트를 갖는 신호의 예를 도시한 것이다.
도 3은 도 1의 온셋 감지부에 대한 상세 블록도이다.
도 4(a)는 도 2의 신호에 대해 언래핑된 위상 스펙트럼의 선형 성분을 추출하여 도시한 것이다.
도 4(b)는 도 4(a)의 위상 스펙트럼의 선형 성분을 스패닝한 결과를 도시한 것이다.
도 5(a)는 도 2의 신호에 대한 파워 증가비를 계산한 결과를 도시한 것이다.
도 5(b)는 도 2의 신호에 대한 파워 계산 결과를 도시한 것이다.
도 5(c)는 도 5(b)의 파워를 로그로 스케일링한 파워를 나타낸다.
도 5(d)는 도 3의 델타 계산부의 출력을 도시한 것이다.
도 6은 도 5(b)의 로그 파워에 온셋 필터를 적용한 결과를 도시한 것이다.
도 7은 도 1의 충격음 검증부에 대한 상세 블록도를 도시한 것이다.
도 8은 전형적인 임펄스 이벤트 신호를 도시한 것이다.
도 9(a) 내지 도 9(d)는 입력 신호에 대한 로그 파워 신호와 로그 파워 신호 에 대해 근사한 결과를 도시한 것이다.
도 10은 도 1의 충격음원 검증부에 대한 상세 블록도를 도시한 것이다.
본 발명은 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별 장치 및 방법에 관한 것으로, 특히 주변 환경에서 발생하는 여러 소리들중에서 충격음을 감지하는 장치, 방법 그리고 감지된 충격음이 타겟 충격음인지를 식별하는 충격음 식별 장치 및 방법에 관한 것이다.
충격음(impact sound 또는 impulsive sound) 또는 임펄스 음향 이벤트(Impsulsive acoustical event)는 물체들간에 기계적인 상호동작(mechanical interaction)에 의해 일어나는 소리로서, 짧은 지속시간(duration)과 상대적으로 높은 강도를 갖는다. 이러한 충격음의 성질을 충격성(impulsiveness)이라 한다. 신호 처리 이론에 의하면, 충격성은 선형 시스템의 영상태(zero-state) 임펄스 응답으로 모델링(modeling)될 수 있다.
충격음의 예로는 딱딱한 막대로 유리를 두드리는 소리와 같은 심플렉스(simplex) 소리로부터 폭발음 또는 동전이 바닥에 떨어지는 소리와 같은 복잡한 소리를 포함한다.
충격음을 식별한다는 것은 연속적인 사운드 스트림(sound stream)으로부터 임펄스 사운드 이벤트의 존재와 그 성질들을 감지하여 식별하는 것이다.
본 발명이 이루고자하는 기술적 과제는 온셋(onset)을 감지하여 충격음을 검출하는 충격음 감지 장치 및 방법을 제공하는데 있다.
본 발명이 이루고자하는 다른 기술적 과제는 검출된 충격음에 대해 충격음원을 검증함으로써 검출된 충격음이 타겟 충격음인지를 식별하는 충격음 식별 장치 및 방법을 제공하는데 있다.
상기 기술적 과제를 이루기위한, 본 발명의 충격음 감지 장치는 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 분리된 신호들에 대해 각각 프레임별로 파워를 측정하며, 측정된 파워의 변화를 검사하여 온셋을 감지하는 온셋 감지부; 상기 온셋 감지부에서 측정된 파워 및 입력신호의 스펙트럴 데이터를 버퍼링하는 이벤트 버퍼; 및 감지된 온셋이 임펄스 온셋인지를 판별하여 임펄스 온셋이면 상기 이벤트 버퍼에 저장된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하고, 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 충격음 검증부를 포함함을 특징으로한다.
상기 기술적 과제를 이루기위한, 본 발명의 충격음 감지 방법은 입력 신호를 고주파 신호인 AC성분과 저주파 신호인 DC성분으로 분리하는 단계; 분리된 신호들에 대해 각각 프레임별로 파워를 측정하고, 측정된 파워의 변화를 검사하여 온셋을 감지하는 단계; 상기 단계에서 측정된 파워 및 입력 신호를 버퍼링하고, 감지된 온셋이 임펄스 온셋인지를 판별하는 단계; 임펄스 온셋으로 판별되면, 버퍼링된 파워 를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하는 단계; 및 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 단계를 포함함을 특징으로한다.
상기 다른 기술적 과제를 이루기위한, 본 발명의 충격음 식별 장치는 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 분리된 신호들에 대해 각각 프레임별로 파워를 측정하며, 측정된 파워의 변화를 검사하여 온셋을 감지하는 온셋 감지부; 상기 온셋 감지부에서 측정된 파워 및 입력신호를 버퍼링하는 이벤트 버퍼; 감지된 온셋이 임펄스 온셋인지를 판별하여 임펄스 온셋이면 상기 이벤트 버퍼에 저장된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하고, 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 충격음 검증부; 및 상기 이벤트가 임펄스 이벤트인 것으로 판별되면, 상기 임펄스 이벤트를 타겟 충격음의 이벤트들과 비교하여 상기 임펄스 이벤트를 식별하는 충격음원 검증부를 포함함을 특징으로한다.
상기 다른 기술적 과제를 이루기위한, 본 발명의 충격음 식별 방법은 입력 신호를 고주파 신호인 AC성분과 저주파 신호인 DC성분으로 분리하는 단계; 분리된 신호들에 대해 각각 프레임별로 파워를 측정하고, 측정된 파워의 변화를 검사하여 온셋을 감지하는 단계; 상기 단계에서 측정된 파워 및 입력 신호를 버퍼링하고, 감지된 온셋이 임펄스 온셋인지를 판별하는 단계; 임펄스 온셋으로 판별되면, 버퍼링된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하는 단계; 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 단계; 및 검출된 이벤트가 임펄스 이벤트인 것으로 판별되면, 상기 임펄스 이벤트를 타겟 충격음의 이벤트들과 비교하여 상기 임펄스 이벤트를 식별하는 단계를 포함함을 특징으로한다.
이하에서 첨부된 도면을 참조하여 본 발명을 보다 상세하게 설명하기로한다.
도 1은 본 발명에 따른 충격음 감지 및 식별 장치에 대한 블록도이다. 도시된 바에 따르면, 충격음 감지 장치는 온셋 감지부(11), 이벤트 버퍼(15) 및 충격음 검증부(12)를 포함한다.
본 발명에 따른 충격음 식별 장치는 충격음 감지 장치에 충격음원 검증부(13)를 더 포함하여 이루어진다.
온셋 감지부(11)는 온셋 감지를 위해 잡음레벨 감지부(14)를 더 구비할 수 있고, 충격음원 검증부(13)는 템플릿 풀(16)을 더 구비할 수 있다.
온셋 감지부(11)는 프레임 단위의 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 각 신호의 파워를 측정하며, 각 신호에 대해 푸리에 해석 및 다른 통계적인 처리를 함으로써 온셋을 감지한다.
여기서, 온셋은 갑작스럽게 일어나는 물리적인 이벤트 신호로 급격한 진폭 혹은 파워 상승을 보이는 것을 말한다. 이벤트는 음향 이벤트를 말하는 것으로, 일반적인 이벤트와 마찬가지로 감쇄 패턴(decay pattern)을 갖는다. 이벤트는 온셋에서 시작하여 파워가 잡음레벨 이하로 떨어지거나 다른 임펄스 온셋이 일어날 때까지의 지속시간을 갖는다.
도 2는 두 개의 이벤트를 갖는 신호의 예를 도시한 것이다. 이 신호는 나무 판자를 나무 막대로 두드린 소리에 대한 신호이고, 신호의 지속시간은 0.27초이다. 참조번호 11-1 및 11-2는 각각 임펄스 이벤트의 온셋을 각각 나타내는데, 온셋간의 간격은 23ms정도이다.
이벤트 버퍼(15)는 입력신호의 스펙트럴(spectral) 데이터와 온셋 감지부(11)에서 각 신호 처리시 생성되는 파워 데이터를 저장한다.
잡음 레벨 감지부(14)는 입력 신호로부터 주변 배경 잡음(long-term noise) 레벨을 감지한다. 온셋 감지부(11)는 입력 신호로부터 배경 잡음 레벨을 감산하여 상술한 바와 같은 후속 신호처리함으로써 보다 정확하게 온셋을 감지할 수 있다.
충격음 검증부(12)는 온셋 감지부(11)에서 감지된 온셋으로부터 임펄스 이벤트의 온셋(임펄스 온셋이라 약함)을 검증하여 출력한다. 충격음 검증부(12)는 이벤트 버퍼(15)에 저장된 파워 데이터를 이용하여 온셋 감지부(11)에서 감지된 온셋이 임펄스 온셋인지를 검증한다. 임펄스 온셋은 온셋 이후로 파워 레벨의 절대값이 소정 임계치 이상 증가하고 일반적인 충격음의 패턴처럼 파워의 감쇄를 보이는지를 점검하여 검증된다.
충격음원 검증부(13)는 이벤트 퍼버(15)에 저장된 스펙트럴 데이터에 대한 특징벡터를 추출하고 분류하여 목표 충격음인지의 여부를 검증한다. 템플릿 풀(16)은 특징벡터의 분류시 참조되는 벡터들을 저장한다.
도 3은 도 1의 온셋 감지부(11)에 대한 상세 블록도이다. 온셋 감지부(11)는 입력 신호를 N(N은 짝수) 샘플링 크기를 갖는 윈도우를 이용하여 프레임 단위로 처리함으로써 온셋을 감지한다. 도시된 바에 따르면, 온셋 감지부(11)는 AC/DC 분리 부(20), 고주파 온셋 감지부(High-frequency Onset Detector, HOD, 21), 저주파 온셋 감지부(Low-frequency Onset Detector, LOD, 23) 및 온셋 판별부(24)를 포함한다.
AC/DC 분리부(20)는 저역통과필터(LPF, 201)와 가산기(202)를 구비하고, 도 1의 입력 신호로부터 AC/DC 신호를 분리한다. DC신호는 입력 신호를 LPF(201)에 통과시켜서 저주파 성분만을 추출하여 얻는다. AC신호는 입력 신호로부터 저주파 성분을 감산하여 얻을 수 있다. 이 때, 입력신호는 프레임 단위로 처리된다.
HOD(21)는 고속 푸리에 변환부(FFT, 211), 선형 위상 스팬부(Linear Phase Span portion, LPS, 212), 제1가중부(213), 파워 증가비(banked-power increasing ration) 계산부(214), 제2가중부(215), 파워계산부(216), 델타 계산부(217), 온셋 필터(218), 제3가중부(219), 결합부(220) 및 온셋 트리거(trigger)부(221)를 구비하고, 고주파 성분의 온셋을 감지한다. 여기서 FFT(211), LPS(212) 및 파워 증가비 계산부(214)는 주파수 영역에서 신호처리하는 블록들이고, 파워계산부(216), 델타 계산부(217) 및 온셋 필터(218)는 시간 영역에서 신호처리하는 블록들이다.
고속 푸리에 변환부(211)는 AC성분의 오디오 신호를 고속 푸리에 변환한다.
입력신호의 스펙트럴 데이터를 x(0), x(1), …, x(N-1)이라고 하고, 프레임을 절반으로 나눈 결과를 각각 Y1, Y2라 하면, Y1, Y2는 각각 N/2개의 엘레멘트(element)를 갖는 벡터로 다음 식과 같이 표현할 수 있다.
여기서, DFT는 이산 푸리에 변환(Discrete Fourier Transform) 결과이다.
LPS(212)는 스펙트럴 데이터의 위상을 언래핑하고(unwrap), 언래핑된 위상 스펙트럼 의 선형 특성(linearity)을 추출한다. 은 선형함수로 다음 식과 같이 근사될 수 있다.
여기서, α는 상수이다.
이를 각 스펙트럴 데이터별로 적용하면, LPS(212)는 스펙트럴 데이터의 위상을 언래핑하기위해 LPS(212)는 각(each) 위상 각(phase angle)에 2mπ(여기서, m은 자연수)를 더하여 이웃하는 위상 각들의 차의 절대값이 π보다 크지 않도록 한다. 선형 성분은 주파수 n이 0에서 N/2사이에 있고 n=0에서의 값이 0인 선형함수로 표현된다. 이 함수의 기울기는 (1,2,…,N/2)과 첫번째에서 (N/2)번째까지 언래핑된 위상 각들의 내적(inner product)에 24를 곱하고, 곱한 결과를 N(N+1)(N+2)로 나눈 값이다.
선형 위상 스팬은 위상 선형 특성의 첫번째 값과 N/2번째 값의 차로서 계산된다.
도 4(a)는 도 2의 신호에 대해 언래핑된 위상 스펙트럼의 선형 성분을 추출하여 도시한 것이고, 도 4(b)는 도 4(a)의 위상 스펙트럼의 선형 성분을 스패닝한 결과를 도시한 것이다.
제1가중부(213)는 LPS(212)의 선형 증가 형태를 따르는 최근 출력값을 검사한다. 제1가중부(213)로는 정합 필터(matched filter)가 적절하다. 제1가중부(213)의 출력은 LPS(212)의 최근 N/2개의 출력값들로 이루어진 벡터와 원하는 패턴의 벡터의 내적에 N/2를 곱한 값으로 계산된다. 여기서, 원하는 패턴 벡터는 이상적인 선형 위상 스팬으로 구성된 벡터를 말하는 것으로, k번째 선형 위상 스팬에 해당하는 이상적인 값은 24(N/2-k)/(N-1_N(N+1))π이다.
파워 증가비 계산부(214)는 다음 식과 같이 현재 프레임에서 상위 N/2개와 하위 N/2개 스펙트럴 데이터의 파워를 구하고, 소정 임계치 이상만큼 증가한 주파수의 수를 카운트하여 카운트된 수를 N/2로 나누어 출력한다. 이를 수학식으로 표현하면 다음 식과 같다.
여기서, th는 0보다 큰 임계치이고, s(t)는 t≥0인 스텝 함수이다.
수학식 4에 따른 계산 결과, 온셋 시간 근처에서는 하이레벨(거의 1)을 유지하는데, 이 하이레벨 구간의 지속시간은 윈도우의 길이에 따라 달라진다. 도 5(a)는 도 2의 신호에 대한 파워 증가비를 계산한 결과를 도시한 것이다. 도시된 바에 따르면, 온셋 근처에서 하이레벨이 일정 시간동안 유지됨을 알 수 있다.
파워 계산부(216)는 AC성분의 프레임에 대한 파워를 계산하고, 로그로 스케일링한다. 델타 계산부(217)는 현재 입력된 로그 파워와 바로 이전에 입력된 로그 파워의 차를 구한다. 파워와 델타-로그 파워는 각각 다음 식과 같이 계산된다.
도 5(b)는 도 2의 신호에 대한 파워 계산 결과를 도시한 것이다. 온셋에서 파워가 급격하게 증가함을 알 수 있다. 도 5(c)는 도 5(b)의 파워를 로그로 스케일링한 파워를 나타낸다. 참조번호 216a는 잡음 레벨을 나타내고, 216b는 잡음레벨보다 10.8dB 정도 높은 임계치를 나타낸다. 도 5(d)는 델타 계산부(217)의 출력을 도 시한 것이다. 도시된 바에 따르면 온셋의 발생 위치를 보다 정확하게 알 수 있다.
제2가중부(215)는 파워 증가비 계산부(214)의 출력과 델타 계산부(217)의 출력을 쉬프트-곱셈 연산한다(shift-multiply). 쉬프트-곱셈 연산을 상세히 설명하면 다음과 같다. X,Y의 두 벡터, 쉬프트 s, 그리고 X,Y의 쉬프트-곱셈 결과를 Z라 하면, Z의 k번째 원소(element)는 k-s부터 k+s까지 포함되는 인덱스를 갖는 X와 Y의 원소를 각각 곱해서 최대가 되는 값으로 얻어진다. s가 0이면 쉬프트-곱셈 결과는 두 벡터간 스칼라 곱셈(scalar multiplication)과 동일한 결과가 된다.
온셋 필터(218)는 파워 계산부(216)에서 출력되는 로그 파워에 대한 현재 프레임의 평균값과 이전 프레임의 평균값을 계산하여 최근 평균값에서 이전 평균값을 감산한 값을 출력한다. 두 평균값은 1차 선형 필터를 결합하여 계산되는데, 그 임펄스 응답은 다음 식과 같이 표현된다.
도 6은 도 5(b)의 로그 파워에 온셋 필터(218)를 적용한 결과를 도시한 것이다.
제3가중부(219)는 항등 연산자(identity operator)이다.
결합부(220)는 제1, 2 및 3가중부(213, 215, 219)의 출력을 가산한다. 가산 결과가 양(positive)이면 제1, 2 및 3가중부(213, 215, 219)의 출력이 모두 소정 임계치를 초과했음을 나타낸다.
온셋 트리거부(221)는 온셋 필터(218)의 출력을 제어신호로 하여 결합부(220)의 출력에 따라 양(positive) 또는 음(negative)값을 출력한다. 온셋 트리거부(221)는 제어신호가 액티브 레벨보다 작으면 음값을 출력하고, 제어신호가 액티브 레벨 이상이고 결합부(220)의 출력이 양이면 양값을, 결합부(220)의 출력이 음이면 음값을 출력한다.
LOD(23)는 필터 뱅크부(231), 파워 계산부(232), 델터 계산부(233), 비교부(234) 및 결합부(235)를 포함한다.
필터 뱅크부(231)는 복수의 대역통과필터(미도시)들을 구비하여 LPF(201)를 통과한 저주파 오디오 신호를 주파수 대역별로 다시 세분한다. 파워 계산부(232)는 각 대역별로 해당 신호들의 파워를 누적한다. 델타 계산부(233)는 i번째 대역의 파워에서 (i-1)번째 대역의 파워를 감산하고, 감산 결과에 로그를 취하여 델타-로그 파워를 출력한다. 비교부(234)는 델타-로그 파워가 소정 임계치 이상되는지를 판별하여 각 대역별로 국부(local) 온셋을 감지한다. 결합부(235)는 각 대역별로 감지된 온셋을 결합하여 저주파 대역 전체에 대한 온셋 판별값을 출력한다.
온셋 판별부(24)는 HOD(21)과 LOD(23)의 출력을 가산하여 온셋 발생여부를 나타내는 이진신호를 출력한다. LOD(23)의 출력신호가 양이고 파워 계산부(232)에서 계산된 전체 저주파 대역의 파워가 전체 오디오 신호 파워의 20%이상이거나, HOD(21)의 출력신호가 양이고 파워 계산부(216)에서 계산된 전체 고주파 대역의 파 워가 전체 오디오 신호 파워의 5%이상이면 온셋이 발생한 것으로 판별하고, 그 이외의 경우이면 온셋이 발생하지않은 것으로 판별한다.
도 7은 도 1의 충격음 검증부(12)에 대한 상세 블록도를 도시한 것이다. 도시된 바에 따른 충격음 검증부는 임펄스 온셋 선택부(31), 이벤트 형성부(event former, 32) 및 임펄스 이벤트 선택부(33)를 구비한다.
온셋 감지부(11)에 의해 온셋이 감지되면, 임펄스 온셋 선택부(31)는 이벤트 버퍼(15)에 버퍼링된 로그 파워를 모니터링하여 온셋의 파워 피크(power peak)가 발생하였는지에 대한 여부를 출력한다. 파워 피크는 로그로 스케일링된 파워가 온셋 구간(onset duration)에서 최대치에 도달하는 시점을 말한다. 온셋 구간은 도 2의 온셋 트리거부(221)가 액티브 상태인 구간동안을 말한다. 임펄스 온셋 선택부(31)는 또한 온셋 시작 시간에서부터 피크 시간까지 파워의 급격한 증가 구간을 탐색한다. 급격한 증가 구간이라 함은 제1임계치보다 짧은 지속시간(duration)동안 제2임계치보다 큰 파워 증가를 보이는 데이터가 연속되는 것을 말한다. 탐색이 성공하면 임펄스 온셋 선택부(31)는 양의 값을 출력하고, 실패하면 음의 값을 출력한다.
이벤트 형성부(32)는 임펄스 온셋 선택부(31)에서 양의 값이 출력될 때 트리거링되며, 파워 피크가 일어난 시점부터 이벤트 버퍼(15)에서 출력되는 로그 파워를 모니터링하면서 이벤트 구간을 찾는다. 이벤트 구간은 이벤트 시작 시점부터 이벤트 종료 시점까지의 구간을 말한다. 이벤트 시작 시점은 파워 피크가 일어난 시간으로 정의되고, 이벤트 종료 시점은 로그 파워가 잡음 레벨 이하로 떨어지거나 임펄스 온셋 선택부(31)에 의해 다시 트리거링이 일어날 때이다. 이벤트 형성부(32)는 이벤트의 시작과 종료 시간에 대한 타임 스탬프(time stamp)를 충격음원 검증부(13)에 출력한다.
두 경우중 어느 것이든 이벤트 종료시점이 찾아지면, 임펄스 이벤트 선택부(33)는 이벤트 구간에서 이벤트 신호가 피크 레벨로부터 적절한 방식으로 감쇄되는 지를 판별한다. 즉, 온셋으로부터 감쇄되는 전체 이벤트가 임펄스 이벤트인지를 판별한다. 여기서, 적절한 감쇄 방식은 지수함수적으로 감쇄되는 것을 말하며, 판별은 로그 파워 신호 패턴을 나타내는 파워함수를 찾고, 감쇄정도를 나타내는 파라미터의 값이 적절한 범위내에 있는지를 검사하여 이루어진다.
도 8은 전형적인 임펄스 이벤트 신호를 도시한 것이다. 참조번호 80은 입력 신호, 81은 로그 파워 신호, 82는 잡음 레벨, 그리고 83은 잡음 레벨보다 10.8dB 높은 레벨을 각각 나타낸다. 참조번호 84는 온셋을 나타낸다. 온셋은 급격한 증가를 보임을 알 수 있다. 참조번호 85는 임펄스 이벤트의 특징인 거의 선형적으로 감쇄하는 로그 파워 레벨을 나타낸다. 도시된 로그 파워의 기울기는 지수함수 로 표현할 수 있고, 이 때 λ는 로그 파워의 기울기를 근사한다.
임펄스 이벤트 선택부(33)는 로그 파워 신호에 대해 근사되는 λ값을 찾고, λ가 원하는 범위에 해당하는지를 여부를 판단한다.
도 9(a) 내지 도 9(d)는 입력 신호에 대한 로그 파워 신호와 로그 파워 신호에 대해 근사한 결과를 도시한 것이다. 참조번호 90-1,90-2, 90-3 및 90-4는 각각 원신호를 나타내고, 91-1, 91-2, 91-3 및 91-4는 각각 원신호에 대한 로그 파워 를 도시한 것이다. 92-1, 92-2, 92-3 및 92-4 는 로그 파워 신호를 근사한 것을 나타낸다. 도시된 바에 따르면, 근사된 로그 파워 신호는 각 신호에 대해 설정된 잡음 레벨과 그보다 높은 임계치 사이의 해당하는 로그 파워에 대해서는 0으로, 온셋으로부터 임계치까지 감쇄하는 로그 파워에 대해서는 λ를 각각 0.520, 0.959, 1.435 및 37.59로 하여 근사했음을 알 수 있다. 도 9(b)는 λ가 1에 근접하는 이상적인 임펄스 이벤트 신호임을 보인다. 도 9(a) 및 도 9(c)도 임펄스 이벤트 신호이다. 도 9(d)의 경우 급격한 파워 레벨 증가를 보이기는 하지만 λ>>1이므로 임펄스 이벤트로 볼 수 없다. 실제로 도 9(d)는 충격음이 아닌 음성신호에 관한 것이다.
임펄스 이벤트 선택부(33)에서 임펄스 이벤트 신호라고 판별되면, 충격음원 검증부(13)를 트리거링한다.
도 10은 도 1의 충격음원 검증부(13)에 대한 상세 블록도를 도시한 것이다. 도시된 바에 따르면, 충격음원 검증부(13)는 특징벡터 추출부(41) 및 분류부(42)를 구비한다.
특징벡터 추출부(41)는 분할부(411), 누적부(412) 및 이산 코사인 변환부(DCT, 413)를 구비하여, 이벤트의 스펙트럴 데이터로부터 적절한 특징벡터를 추출한다.
분할부(411)는 이벤트 형성부(32)로부터 입력되는 타임 스탬프내에서 이벤트 버퍼(15)로부터 입력되는 스펙트럴 데이터를 M개의 세그먼트로 분할한다. 누적부(412)는 각 세그먼트별로 스펙트럴 데이터를 누적하여, 각각 N/2개의 원소를 갖는 M개의 벡터를 생성한다. 이 때, 누적 결과를 분산(variance)에 대해 보상하기 위해 누적 결과를 정규화(normalization)할 수도 있다.
DCT(413)는 M개의 벡터에 대해 DCT를 수행하여 특징벡터로 출력한다. DCT(413)로부터 출력되는 특징벡터에 다른 특징들이 반영될 수도 있다. 특징들은 이벤트 지속시간 또는 이벤트에 대해 근사된 파워 함수로부터 얻은 감쇄 기울기가 될 수 있다.
분류부(42)는 DCT(413)에서 출력되는 특징벡터에 대해 템플릿 풀(16)로부터 출력되는 템플릿들과 비교하여 원하는 충격음이 감지되었는지를 판단한다. 여기서 템플릿 풀(16)은 타겟 이벤트의 통계적인 모델 및 감지를 위한 임계치를 저장한다. 분류부(42)는 특징벡터와 템플릿들간의 유사도(similarity)를 계산하고, 계산된 유사도가 감지를 위한 임계치보다 큰지의 여부를 판별함으로써 타겟 충격음 여부를 최종 출력한다. 분류부(42)로는 가우시안 조합 모델(Gaussian Mixture Model), N-최근접 이웃 방법, 신경회로망(neural network) 등과 같은 통계적인 분류기(statistical classifier)가 사용될 수 있다. 조합(mixture)의 개수는 학습 토큰들의 개수와 특징벡터의 크기에 의해 결정된다.
본 발명에 따르면, 주변환경에서 발생하는 충격음들중에서 원하는 충격음, 예를 들어 물체의 충격음, 유리 깨짐, 총소리 또는 발자국 소리 등을 식별할 수 있다. 따라서, 보안시스템에 응용할 수 있고, 음향 진단(acoustic diagnosis)등을 통해 구조물의 결함 등을 진단할 수도 있다.
Claims (42)
- 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 분리된 신호들에 대해 각각 프레임별로 파워를 측정하며, 측정된 파워의 변화를 검사하여 온셋을 감지하는 온셋 감지부;상기 온셋 감지부에서 측정된 파워 및 입력신호의 스펙트럴 데이터를 버퍼링하는 이벤트 버퍼; 및감지된 온셋이 임펄스 온셋인지를 판별하여 임펄스 온셋이면 상기 이벤트 버퍼에 저장된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하고, 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 충격음 검증부를 포함함을 특징으로하는 충격음 감지 장치.
- 제1항에 있어서, 상기 온셋 감지부는상기 입력 신호의 고주파 신호인 AC 성분과 저주파 신호인 DC 성분을 분리하는 AC/DC분리부;상기 AC성분에 대해 주파수 영역에서의 위상 특성과 파워의 변화량을 구하고, 시간영역에서의 파워를 변화량을 계산하여 상기 위상 특성과 파워의 변화량으로부터 상기 AC성분에 대한 온셋을 감지하는 고주파 온셋 감지부;상기 DC성분을 주파수 대역별로 세분하고, 각 주파수 대역별 파워의 변화량을 구하고, 상기 변화량을 제1임계치와 비교하여 결합함으로써 상기 DC성분에 대한 온셋을 감지하는 저주파 온셋 감지부; 및상기 고주파 온셋 감지부 및 저주파 온셋 감지부에서 각각 계산된 파워의 변화를 이용하여 상기 입력 신호에 대해 온셋이 발생하였는지의 여부를 판별하는 온셋 판별부를 구비함을 특징으로하는 충격음 감지 장치.
- 제2항에 있어서, 상기 AC/DC 분리부는상기 입력 신호에서 저주파 신호를 통과시키는 저역 통과 필터; 및상기 입력 신호로부터 상기 저주파 신호를 감산하여 고주파 신호를 출력하는 감산기를 구비함을 특징으로하는 충격음 감지 장치.
- 제2항에 있어서, 상기 고주파 온셋 감지부는상기 AC성분을 푸리에 변환하여 주파수 영역에서 위상의 선형 특성과 상기 프레임내에서 파워 변화의 비율을 주파수 영역 온셋 감지부;상기 AC성분에 대한 시간영역에서의 파워를 구하고, 파워의 변화량을 상기 입력신호의 각 스펙트럴 데이터와 프레임별로 각각 구하는 시간 영역 온셋 감지부; 및상기 주파수 영역 온셋 감지부의 출력과 상기 시간 영역 온셋 감지부의 출력 결과를 결합하는 결합부;상기 시간 영역 온셋 감지부의 파워 변화량에 따라 상기 결합부의 출력이 소정 조건을 만족하면 온셋인 것으로 판별하는 온셋 트리거부를 구비함을 특징으로하는 충격음 감지 장치.
- 제4항에 있어서, 상기 주파수 영역 온셋 감지부는상기 AC성분을 푸리에 변환하는 고속 푸리에 변환부;상기 푸리에 변환된 스펙트럴 데이터의 위상을 선형함수로 근사하고, 근사된 첫번째 스펙트럴 데이터의 위상과 상기 프레임의 중앙에 위치한 스펙트럴 데이터의 위상의 차를 구하는 선형 위상 스팬부; 및상기 푸리에 변환된 스펙트럴 데이터의 파워를 구하고, 전후반 프레임의 파워를 비교하여 제2임계치 이상의 파워 증가를 갖는 비율을 구하는 파워 증가비 계산부를 구비함을 특징으로하는 충격음 감지 장치.
- 제5항에 있어서, 상기 시간 영역 온셋 감지부는상기 AC성분에 대한 파워를 구하고 로그로 스케일링하는 파워 계산부;상기 파워 계산부에서 출력되는 현재 스펙트럴 데이터의 로그-파워와 이전 스펙트럴 데이터에 대한 로그-파워의 차를 계산하는 델타 계산부; 및상기 파워 계산부에서 출력되는 로그-파워에 대한 현재 프레임의 평균값과 이전 프레임의 평균값의 차를 출력하는 온셋 필터를 구비함을 특징으로하는 충격음 감지 장치.
- 제6항에 있어서, 상기 결합부는상기 선형 위상 스팬부의 출력을 정합필터링하는 제1가중부;상기 파워 증가비 계산부와 상기 델터 계산부의 출력을 쉬프트-곱셈 연산하는 제2가중부; 및상기 온셋 필터의 출력을 항등 연산하는 제3가중부를 더 구비하여,상기 제1, 제2 및 제3가중부의 출력을 가산하여 출력함을 특징으로하는 충격음 감지 장치.
- 제6항에 있어서, 상기 온셋 트리거부는상기 온셋 필터의 출력을 제어신호로 하여 상기 결합부의 출력에 따라 양 또는 음값을 출력하는 기능을 구비하는 것을 특징으로하는 충격음 감지 장치.
- 제2항에 있어서, 상기 저주파 온셋 감지부는상기 DC성분을 주파수 대역별로 세분하는 필터 뱅크부;각 주파수 대역별로 파워를 계산하고 로그로 스케일링하는 파워 계산부;각 주파수 대역별로 인접한 주파수 대역끼리 로그-파워의 차를 계산하는 델타 계산부;상기 델타 계산부에서 각 주파수 대역별로 출력되는 델타-로그 파워를 상기 임계치와 비교하여 국부 온셋인지의 여부를 판별하는 비교부; 및상기 비교부에 의해 각 주파수 대역별로 감지된 국부 온셋을 결합하여 저주파 대역 전체에 대한 온셋 판별값을 출력하는 결합부를 구비함을 특징으로하는 충격음 감지 장치.
- 제2항에 있어서, 상기 온셋 판별부는상기 고주파 온셋 감지부에서 온셋 감지신호가 출력되고 상기 고주파 온셋 감지부에서 측정된 파워가 입력신호의 전체 파워에 대해 차지하는 비율이 제2임계치 이상이면, 상기 고주파 온셋 감지부에서 출력되는 고주파 온셋 감지신호와 상기 저주파 온셋 감지부에서 출력되는 저주파 온셋 감지신호를 가산하여 온셋 발생여부를 나타내는 이진신호를 출력하는 기능을 구비함을 특징으로하는 충격음 감지 장치.
- 제2항에 있어서, 상기 온셋 판별부는상기 저주파 온셋 감지부에서 온셋 감지신호가 출력되고 상기 저주파 온셋 감지부에서 측정된 파워가 입력신호의 전체 파워에 대해 차지하는 비율이 제2임계치 이상이면, 상기 고주파 온셋 감지부에서 출력되는 고주파 온셋 감지신호와 상기 저주파 온셋 감지부에서 출력되는 저주파 온셋 감지신호를 가산하여 온셋 발생여부를 나타내는 이진신호를 출력하는 기능을 구비함을 특징으로하는 충격음 감지 장치.
- 제1항에 있어서, 상기 온셋 감지부는상기 입력 신호의 잡음 레벨을 감지하는 잡음 레벨 감지부를 더 구비하고, 감지된 잡음레벨을 상기 입력신호로부터 감산한 결과신호로부터 온셋을 감지하는 기능을 더 구비함을 특징으로하는 충격음 감지 장치.
- 제1항에 있어서, 상기 충격음 검증부는상기 온셋 감지부에서 온셋이 감지되면, 상기 이벤트 버퍼에 저장된 파워를 검사하여 감지된 온셋이 임펄스 온셋인지를 판별하는 임펄스 온셋 선택부;감지된 온셋이 임펄스 온셋으로 판별되면, 상기 이벤트 버퍼에 저장된 파워를 이용하여 상기 임펄스 온셋으로부터 시작되는 이벤트 구간을 찾는 이벤트 형성부; 및상기 이벤트 형성부에서 찾아진 이벤트가 임펄스 이벤트의 특성을 만족하는지를 검사하여 임펄스 이벤트인지의 여부를 판별하는 임펄스 이벤트 선택부를 구비함을 특징으로하는 충격음 감지 장치.
- 제14항에 있어서, 상기 임펄스 온셋 선택부는상기 온셋이 감지되면, 상기 이벤트 버퍼에 저장된 파워를 모니터링하여 파워 피크의 발생여부를 판별하고, 상기 온셋의 시작 시간부터 상기 파워 피크가 발생한 시간까지 파워의 증가값을 소정 임계치와 비교하여 상기 온셋이 임펄스 온셋인지를 판별하는 기능을 구비함을 특징으로하는 충격음 감지 장치.
- 제15항에 있어서, 상기 이벤트 형성부는상기 이벤트 구간의 시작 시간을 상기 파워 피크가 일어난 시간으로하고, 상기 이벤트 구간의 종료 시간을 상기 파워가 소정 레벨 이하로 떨어지거나 상기 임펄스 온셋 선택부가 다음 임펄스 온셋을 판별하여 출력하는 시간으로하여 이벤트를 형성하는 기능을 구비함을 특징으로하는 충격음 감지 장치.
- 제15항 또는 제16항에 있어서, 상기 임펄스 이벤트 선택부는상기 이벤트 형성부에서 찾아진 이벤트를 근사하는 파워함수를 찾고, 상기 파워함수가 상기 파워 피크로부터 소정 범위내에서 지수함수적으로 감쇄하는지를 판별하여 상기 이벤트가 임펄스 이벤트인지의 여부를 판별하는 것을 특징으로하는 기능을 구비함을 특징으로하는 충격음 감지 장치.
- 입력 신호를 고주파 신호인 AC성분과 저주파 신호인 DC성분으로 분리하는 단계;분리된 신호들에 대해 각각 프레임별로 파워를 측정하고, 측정된 파워의 변 화를 검사하여 온셋을 감지하는 단계;상기 단계에서 측정된 파워 및 입력 신호를 버퍼링하고, 감지된 온셋이 임펄스 온셋인지를 판별하는 단계;임펄스 온셋으로 판별되면, 버퍼링된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하는 단계; 및검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 단계를 포함함을 특징으로하는 충격음 감지 방법.
- 제18항에 있어서, 상기 온셋을 감지하는 단계는상기 AC성분에 대해 프레임별로 주파수 영역에서의 위상 특성과 파워의 변화를 구하는 단계;상기 AC성분에 대해 프레임별로 시간 영역에서의 파워 변화를 계산하는 단계;상기 위상 특성과 파워의 변화량들을 결합하여 상기 AC성분에 대한 온셋을 감지하는 단계;상기 DC성분을 주파수 대역별로 세분하여 각 주파수 대역별 파워 변화량을 구하는 단계;상기 DC성분의 각 주파수 대역별 파워 변화량을 제1임계치와 비교하고 결합하여 상기 DC성분에 대한 온셋을 감지하는 단계; 및상기 AC 및 DC성분에 대해 감지된 온셋들을 결합하여 상기 입력신호에서 발 생된 온셋을 감지하는 단계를 구비함을 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 위상 특성은상기 AC성분을 푸리에 변환하는 단계;상기 푸리에 변환된 데이터에 대한 위상을 선형함수로 근사하는 단계; 및근사된 첫번째 스펙트럴 데이터의 위상과 상기 프레임의 중앙에 위치한 스펙트럴 데이터의 위상의 차를 구하는 단계에 의해 구해지는 것을 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 AC성분의 주파수 영역에 대한 파워 변화는상기 AC성분을 푸리에 변환하는 단계; 및상기 푸리에 변환된 데이터에 대해 전후반 프레임의 파워를 비교하여 제2임계치 이상의 파워 증가가 있는 비율을 구하는 단계에 의해 구해지는 것을 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 AC성분의 시간 영역에 대한 파워 변화는상기 AC성분에 대한 파워를 구하고 로그로 스케일링하는 단계;현재 스펙트럴 데이터의 로그-파워와 이전 스펙트럴 데이터에 대한 로그-파워의 차를 계산하는 단계; 및현재 프레임의 평균 로그-파워와 이전 프레임의 평균 로그-파워의 차를 구하 는 단계에 의해 구해지는 것을 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 위상 특성과 파워의 변화량들을 결합은상기 위상 특성을 정합필터링하는 단계;상기 주파수 영역의 파워 변화량과 상기 시간 영역의 파워 변화량을 쉬프트-곱셈 연산하는 단계; 및상기 현재 프레임의 평균 로그-파워와 이전 프레임의 평균 로그-파워의 차를 항등 연산하는 단계를 구비하고,상기 정합필터링 결과, 쉬프트-곱셈 연산 결과 및 상기 항등 연산 결과들을 가산하는 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 입력신호에 대한 온셋 감지 단계는상기 AC성분에 대한 온셋 감지신호가 출력되고 상기 AC성분에 대해 측정된 파워가 입력신호의 전체 파워에 대해 차지하는 비율이 제2임계치 이상이면, 상기 AC성분에 대한 온셋 감지신호와 상기 DC성분에 대한 온셋 감지신호를 가산하여 온셋 발생여부를 나타내는 이진신호를 출력하는 것을 특징으로하는 충격음 감지 방법.
- 제19항에 있어서, 상기 입력신호에 대한 온셋 감지 단계는상기 DC성분에 대한 온셋 감지신호가 출력되고 상기 DC성분에 대해 측정된 파워가 입력신호의 전체 파워에 대해 차지하는 비율이 제2임계치 이상이면, 상기 AC성분에 대한 온셋 감지신호와 상기 DC성분에 대한 온셋 감지신호를 가산하여 온셋 발생여부를 나타내는 이진신호를 출력하는 것을 특징으로하는 충격음 감지 방법.
- 제18항에 있어서, 상기 감지된 온셋이 임펄스 온셋인지를 판별하는 단계는상기 온셋이 감지되면, 상기 버퍼링된 파워를 모니터링하여 파워 피크의 발생여부를 판별하고, 상기 온셋의 시작 시간부터 상기 파워 피크가 발생한 시간까지 파워의 증가값을 소정 임계치와 비교하여 상기 온셋이 임펄스 온셋인지를 판별하는 것을 특징으로하는 충격음 감지 방법.
- 제26항에 있어서, 상기 이벤트 검출은이벤트 구간의 시작 시간을 상기 파워 피크가 일어난 시간으로하고, 상기 이벤트 구간의 종료 시간을 상기 파워가 소정 레벨 이하로 떨어지거나 다음 임펄스 온셋이 일어나는 시간으로하여 이벤트를 형성하는 것을 특징으로하는 충격음 감지 방법.
- 제27항에 있어서, 상기 임펄스 이벤트의 판별은상기 이벤트 검출 단계에서 형성된 이벤트를 근사하는 파워함수를 찾고, 상기 파워함수가 상기 파워 피크로부터 소정 범위내에서 지수함수적으로 감쇄하는지 를 판별하여 상기 이벤트가 임펄스 이벤트인지의 여부를 판별하는 것을 특징으로하는 충격음 감지 방법.
- 입력 신호를 저주파 신호와 고주파 신호로 분리하고, 분리된 신호들에 대해 각각 프레임별로 파워를 측정하며, 측정된 파워의 변화를 검사하여 온셋을 감지하는 온셋 감지부;상기 온셋 감지부에서 측정된 파워 및 입력신호를 버퍼링하는 이벤트 버퍼;감지된 온셋이 임펄스 온셋인지를 판별하여 임펄스 온셋이면 상기 이벤트 버퍼에 저장된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하고, 검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 충격음 검증부; 및상기 이벤트가 임펄스 이벤트인 것으로 판별되면, 상기 임펄스 이벤트를 타겟 충격음의 이벤트들과 비교하여 상기 임펄스 이벤트를 식별하는 충격음원 검증부를 포함함을 특징으로하는 충격음 식별 장치.
- 제29항에 있어서, 상기 온셋 감지부는상기 입력 신호의 고주파 신호인 AC 성분과 저주파 신호인 DC 성분을 분리하는 AC/DC분리부;상기 AC성분에 대해 주파수 영역에서의 위상 특성과 파워의 변화를 구하고, 시간영역에서의 파워를 변화를 계산하여 상기 위상 특성과 파워의 변화로부터 상기 AC성분에 대한 온셋을 감지하는 고주파 온셋 감지부;상기 DC성분을 주파수 대역별로 세분하고, 각 주파수 대역별 파워의 변화를 구하고, 상기 변화량을 소정 임계치와 비교하여 결합함으로써 상기 DC성분에 대한 온셋을 감지하는 저주파 온셋 감지부; 및상기 고주파 온셋 감지부 및 저주파 온셋 감지부에서 각각 계산된 파워의 변화를 이용하여 상기 입력 신호에 대해 온셋이 발생하였는지의 여부를 판별하는 온셋 판별부를 구비함을 특징으로하는 충격음 식별 장치.
- 제29항에 있어서, 상기 충격음 검증부는상기 온셋 감지부에서 온셋이 감지되면, 상기 이벤트 버퍼에 저장된 파워를 검사하여 감지된 온셋이 임펄스 온셋인지를 판별하는 임펄스 온셋 선택부;감지된 온셋이 임펄스 온셋으로 판별되면, 상기 이벤트 버퍼에 저장된 파워를 이용하여 상기 임펄스 온셋으로부터 시작되는 이벤트 구간을 찾는 이벤트 형성부; 및상기 이벤트 형성부에서 찾아진 이벤트가 임펄스 이벤트의 특성을 만족하는지를 검사하여 임펄스 이벤트인지의 여부를 판별하는 임펄스 이벤트 선택부를 구비함을 특징으로하는 충격음 식별 장치.
- 제31항에 있어서,상기 이벤트 형성부는 상기 이벤트 구간의 시작시점과 종료시점에 대한 시간 스탬프를 출력하고,상기 충격음원 검증부는상기 이벤트 버퍼에 저장된 스펙트럴 데이터중 상기 시간 스탬프에 해당하는 스펙트럴 데이터로부터 특징벡터를 추출하는 특징벡터 추출부; 및상기 특징벡터와 상기 타켓 충격음 이벤트들의 특징벡터와의 유사도를 각각 계산하여 상기 입력신호를 식별하는 분류부를 구비하는 충격음 식별 장치.
- 제32항에 있어서, 상기 특징벡터 추출부는상기 타임 스탬프내에서 상기 이벤트 버퍼로부터 입력되는 스펙트럴 데이터를 M개의 세그먼트로 분할하는 분할부;각 세그먼트별로 스펙트럴 데이터를 누적하여 소정 크기의 벡터를 생성하는 누적부; 및상기 M개의 벡터를 이산 코사인 변환하여 특징벡터를 출력하는 이산 코사인 변환부를 구비함을 특징으로하는 충격음 식별 장치.
- 제33항에 있어서, 상기 누적부는상기 누적 결과를 분산에 대해 보상하도록 정규화하는 기능을 더 구비함을 특징으로하는 충격음 식별 장치.
- 제32항에 있어서, 상기 분류부는타겟 충격음들에 대한 특징벡터들을 저장하는 템플릿 풀을 더 구비함을 특징으로하는 충격음 식별 장치.
- 입력 신호를 고주파 신호인 AC성분과 저주파 신호인 DC성분으로 분리하는 단계;분리된 신호들에 대해 각각 프레임별로 파워를 측정하고, 측정된 파워의 변화를 검사하여 온셋을 감지하는 단계;상기 단계에서 측정된 파워 및 입력 신호를 버퍼링하고, 감지된 온셋이 임펄스 온셋인지를 판별하는 단계;임펄스 온셋으로 판별되면, 버퍼링된 파워를 검사하여 상기 임펄스 온셋으로부터 시작되는 이벤트를 검출하는 단계;검출된 이벤트가 임펄스 이벤트의 조건을 만족하는지를 판별하는 단계; 및검출된 이벤트가 임펄스 이벤트인 것으로 판별되면, 상기 임펄스 이벤트를 타겟 충격음의 이벤트들과 비교하여 상기 임펄스 이벤트를 식별하는 단계를 포함함을 특징으로하는 충격음 식별 방법.
- 제36항에 있어서, 상기 온셋을 감지하는 단계는상기 AC성분에 대해 프레임별로 주파수 영역에서의 위상 특성과 파워의 변화를 구하는 단계;상기 AC성분에 대해 프레임별로 시간 영역에서의 파워 변화를 계산하는 단 계;상기 위상 특성과 파워의 변화량들을 결합하여 상기 AC성분에 대한 온셋을 감지하는 단계;상기 DC성분을 주파수 대역별로 세분하여 각 주파수 대역별 파워 변화량을 구하는 단계;상기 DC성분의 각 주파수 대역별 파워 변화량을 소정 임계치와 비교하고 결합하여 상기 DC성분에 대한 온셋을 감지하는 단계; 및상기 AC 및 DC성분에 대해 감지된 온셋들을 결합하여 상기 입력신호에서 발생된 온셋을 감지하는 단계를 구비함을 특징으로하는 충격음 식별 방법.
- 제36항에 있어서, 상기 감지된 온셋이 임펄스 온셋인지를 판별하는 단계는상기 온셋이 감지되면, 상기 버퍼링된 파워를 모니터링하여 파워 피크의 발생여부를 판별하고, 상기 온셋의 시작 시간부터 상기 파워 피크가 발생한 시간까지 파워의 증가값을 소정 임계치와 비교하여 상기 온셋이 임펄스 온셋인지를 판별하는 것을 특징으로하는 충격음 식별 방법.
- 제38항에 있어서, 상기 이벤트 검출은이벤트 구간의 시작 시간을 상기 파워 피크가 일어난 시간으로하고, 상기 이벤트 구간의 종료 시간을 상기 파워가 소정 레벨 이하로 떨어지거나 다음 임펄스 온셋이 일어나는 시간으로하여 이벤트를 형성하는 것을 특징으로하는 충격음 식별 방법.
- 제39항에 있어서, 상기 임펄스 이벤트를 식별하는 단계는상기 이벤트 구간의 시작시점과 종료시점에 대한 시간 스탬프를 얻는 단계;상기 버퍼링된 스펙트럴 데이터중 상기 시간 스탬프에 해당하는 스펙트럴 데이터로부터 특징벡터를 추출하는 단계; 및상기 특징벡터와 상기 타켓 충격음에 대한 이벤트들의 특징벡터와의 유사도를 각각 계산하여 상기 입력신호를 식별하는 충격음 식별 방법.
- 제40항에 있어서, 상기 특징벡터 추출 단계는상기 타임 스탬프내에서 상기 버퍼링된 스펙트럴 데이터를 M개의 세그먼트로 분할하는 단계;각 세그먼트별로 스펙트럴 데이터를 누적하여 소정 크기의 벡터를 생성하는 단계; 및상기 M개의 벡터를 이산 코사인 변환하여 특징벡터를 얻는 단계를 구비함을 특징으로하는 충격음 식별 방법.
- 제41항에 있어서, 상기 누적 단계는상기 누적 결과를 분산에 대해 보상하도록 정규화하는 단계를 더 구비함을 특징으로하는 충격음 식별 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040008738A KR100580643B1 (ko) | 2004-02-10 | 2004-02-10 | 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 |
CNA2005100055325A CN1655229A (zh) | 2004-02-10 | 2005-01-20 | 检测和鉴别冲击声的设备和方法 |
US11/050,806 US7234340B2 (en) | 2004-02-10 | 2005-02-07 | Apparatus, method, and medium for detecting and discriminating impact sound |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040008738A KR100580643B1 (ko) | 2004-02-10 | 2004-02-10 | 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050080647A KR20050080647A (ko) | 2005-08-17 |
KR100580643B1 true KR100580643B1 (ko) | 2006-05-16 |
Family
ID=34909934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040008738A KR100580643B1 (ko) | 2004-02-10 | 2004-02-10 | 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7234340B2 (ko) |
KR (1) | KR100580643B1 (ko) |
CN (1) | CN1655229A (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1769887B1 (en) * | 2000-03-16 | 2008-07-30 | Makita Corporation | Power tools |
KR100612870B1 (ko) * | 2004-11-10 | 2006-08-14 | 삼성전자주식회사 | 임펄스 이벤트 분리 장치 및 방법 |
EP2031581A1 (de) | 2007-08-31 | 2009-03-04 | Deutsche Thomson OHG | Verfahren zum Erkennen eines akustischen Ereignisses in einem Audio-Signal |
KR100851602B1 (ko) * | 2008-02-14 | 2008-08-12 | (주) 펄스피어 | 충격음과 그 충격음의 리듬을 검출하는 장치와 방법 |
WO2009102141A2 (ko) * | 2008-02-14 | 2009-08-20 | Pulsphere Co., Ltd | 충격음과 그 충격음의 리듬을 검출하는 장치와 방법 |
FR2937079B1 (fr) * | 2008-10-10 | 2011-08-26 | Snecma | Procede et systeme de surveillance d'un turboreacteur |
CN101464788B (zh) * | 2008-12-31 | 2013-07-31 | 无锡中星微电子有限公司 | 二进制数是否为三的倍数的检验装置及芯片 |
KR100973740B1 (ko) * | 2009-11-06 | 2010-08-06 | 김효영 | 물질 특유의 사운드 패턴을 이용한 유리 파열음 감지장치 및 감지방법 |
US9208773B2 (en) * | 2011-12-23 | 2015-12-08 | Bose Corporation | Headset noise-based pulsed attenuation |
US8457912B1 (en) * | 2012-01-30 | 2013-06-04 | Osisoft, Llc | Unwrapping angles from phasor measurement units |
WO2014136628A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
WO2014165163A1 (en) * | 2013-03-12 | 2014-10-09 | Brigham Young University | Method and system for structural integrity assessment |
WO2015029546A1 (ja) * | 2013-08-30 | 2015-03-05 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JP6406257B2 (ja) * | 2013-08-30 | 2018-10-17 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
KR101578998B1 (ko) * | 2014-03-17 | 2015-12-22 | 재단법인 다차원 스마트 아이티 융합시스템 연구단 | 감시 카메라에서 dct 계수를 이용한 이벤트 감지 방법 및 시스템 |
CN103954552B (zh) * | 2014-04-11 | 2017-03-08 | 中国石油化工股份有限公司青岛安全工程研究院 | 提高撞击感度试验精确度的方法 |
CN103886868B (zh) * | 2014-04-16 | 2019-05-24 | 上海其高电子科技有限公司 | 冲击声检测方法及检测系统 |
US9965685B2 (en) * | 2015-06-12 | 2018-05-08 | Google Llc | Method and system for detecting an audio event for smart home devices |
WO2016205207A1 (en) | 2015-06-14 | 2016-12-22 | Brigham Young University | Flexible elements for probes and guard rings |
CN105118520B (zh) | 2015-07-13 | 2017-11-10 | 腾讯科技(深圳)有限公司 | 一种音频开头爆音的消除方法及装置 |
EP3553780B1 (en) * | 2016-12-06 | 2021-08-11 | Nippon Telegraph and Telephone Corporation | Signal feature extraction apparatus, signal feature extraction method, and program |
US11935552B2 (en) * | 2019-01-23 | 2024-03-19 | Sony Group Corporation | Electronic device, method and computer program |
KR102238429B1 (ko) * | 2019-04-24 | 2021-04-09 | 주식회사 이엠텍 | 돌발성 잡음 검출 장치 |
CN111341348A (zh) * | 2020-04-23 | 2020-06-26 | 武汉东信同邦信息技术有限公司 | 发令枪声的声音频谱识别与声压振动侦测装置及方法 |
CN111754988B (zh) * | 2020-06-23 | 2022-08-16 | 南京工程学院 | 基于注意力机制和双路径深度残差网络的声场景分类方法 |
CN114429769A (zh) * | 2020-10-29 | 2022-05-03 | 漳州立达信光电子科技有限公司 | 玻璃破碎声音侦测方法及相关设备 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5046362A (en) * | 1988-04-26 | 1991-09-10 | Ford New Holland, Inc. | Grain loss monitors for harvesting machines |
CA1315868C (en) * | 1988-05-30 | 1993-04-06 | Rene Schmidt | Blast recorder and method of displaying blast energy |
US4845464A (en) * | 1988-08-09 | 1989-07-04 | Clifford Electronics, Inc. | Programmable sensor apparatus |
US5425436A (en) * | 1992-08-26 | 1995-06-20 | Nippondenso Co., Ltd. | Automotive suspension control system utilizing variable damping force shock absorber |
US5438317A (en) * | 1994-04-08 | 1995-08-01 | Detection Systems, Inc. | Glass break detection with noise riding feature |
US5450061A (en) * | 1994-04-08 | 1995-09-12 | Detection Systems, Inc. | Glass break detection using temporal sequence of selected frequency characteristics |
US5737481A (en) * | 1994-06-22 | 1998-04-07 | Matsushita Electric Industrial Co., Ltd. | Information recording method, information recording apparatus and information recording medium |
JP3419232B2 (ja) | 1997-01-21 | 2003-06-23 | スズキ株式会社 | 波数計数方法及びこれを用いた振動測定装置 |
JPH10260075A (ja) | 1997-03-18 | 1998-09-29 | Fuji Xerox Co Ltd | 信号検出装置および信号検出方法 |
JP2003083802A (ja) | 2001-09-13 | 2003-03-19 | Fuji Xerox Co Ltd | 音響信号検出装置および音響信号検出方法 |
-
2004
- 2004-02-10 KR KR1020040008738A patent/KR100580643B1/ko not_active IP Right Cessation
-
2005
- 2005-01-20 CN CNA2005100055325A patent/CN1655229A/zh active Pending
- 2005-02-07 US US11/050,806 patent/US7234340B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050199064A1 (en) | 2005-09-15 |
US7234340B2 (en) | 2007-06-26 |
CN1655229A (zh) | 2005-08-17 |
KR20050080647A (ko) | 2005-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100580643B1 (ko) | 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 | |
Suthokumar et al. | Modulation Dynamic Features for the Detection of Replay Attacks. | |
KR0161258B1 (ko) | 음성활동 검출 방법 및 장치 | |
KR100873396B1 (ko) | 오디토리 이벤트에 기초한 특성을 이용하여 오디오를비교하는 방법 | |
Filho et al. | Preprocessing passive sonar signals for neural classification | |
CN109643552A (zh) | 用于可变噪声状况中语音增强的鲁棒噪声估计 | |
CN111415644B (zh) | 一种音频舒缓度预测方法及装置、服务器、存储介质 | |
CN110992985A (zh) | 识别跑步机异音的识别模型确定方法、识别方法、系统 | |
KR100827153B1 (ko) | 음성 신호의 유성음화 비율 검출 장치 및 방법 | |
US4920568A (en) | Method of distinguishing voice from noise | |
Singh et al. | Linear Prediction Residual based Short-term Cepstral Features for Replay Attacks Detection. | |
KR101741418B1 (ko) | 연속된 충격음에 대한 음향 특징 추출 및 확률 모델에 기반한 음향 인식 방법 | |
KR101671305B1 (ko) | 입력 신호의 특징 파라미터 추출 장치 및 그를 이용한 화자 인식 장치 | |
EP0474496B1 (en) | Speech recognition apparatus | |
EP2864969A1 (en) | Method of classifying glass break sounds in an audio signal | |
RU2697021C1 (ru) | Способ обеспечения требуемой вероятности ложных срабатываний устройства классификации сейсмических сигналов | |
KR102443221B1 (ko) | 수면 음성 분석 장치 및 방법 | |
KR100612870B1 (ko) | 임펄스 이벤트 분리 장치 및 방법 | |
KR100526110B1 (ko) | 화자인식시스템의 화자 특징벡터 생성방법 및 시스템 | |
Tarvainen | Detecting local and regional seismic events using the data-adaptive method at the VAF seismograph station in Finland | |
EP3956890B1 (en) | A dialog detector | |
JPH0114599B2 (ko) | ||
JP2002196783A (ja) | 時系列信号の識別方法及び装置 | |
JP2880683B2 (ja) | 雑音抑制装置 | |
JP2999868B2 (ja) | 信号検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |