KR20180035010A - 음향 분석 장치 및 방법 - Google Patents
음향 분석 장치 및 방법 Download PDFInfo
- Publication number
- KR20180035010A KR20180035010A KR1020160124949A KR20160124949A KR20180035010A KR 20180035010 A KR20180035010 A KR 20180035010A KR 1020160124949 A KR1020160124949 A KR 1020160124949A KR 20160124949 A KR20160124949 A KR 20160124949A KR 20180035010 A KR20180035010 A KR 20180035010A
- Authority
- KR
- South Korea
- Prior art keywords
- acoustic
- sound
- present
- sound signal
- data
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 47
- 230000005236 sound signal Effects 0.000 abstract description 40
- 230000006870 function Effects 0.000 description 11
- 238000004088 simulation Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
음향 분석 장치 및 방법이 개시된다. 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.
Description
본 발명은 음향 인식 및 음향 분석 기술에 관한 것이다.
사람의 음성이나 사물의 소리를 분석하고 인식하는 기술이 다양하게 개발되어 왔다. 음성 또는 소리 인식 기술은 일반적으로 마이크와 같은 입력 수단을 통하여 얻어진 음성 또는 소리 신호를 인식하는 기술이다. 음성 인식 기술의 경우 음소나 음절 등을 구분하고 인식하는 등 매우 복잡한 단계를 거쳐 음성을 인식하고 있으며 계산량도 많다. 소리 인식 기술도 대체적으로 복잡한 과정을 거쳐 소리 인식을 수행하고 있다. 음성이나 소리의 인식 결과는 명령이나 제어, 데이터 입력, 문서 준비 등의 응용 분야에서 사용되고 있다. 또한, 소리 명령 컴퓨터, 무인 전화번호 안내, 각종 소리 안내 시스템, 가전제품, 자동차 항법 장치 및 홈-오토메이션 등에도 이용되고 있다. 그러나 스크린 골프나 스크린 야구 등과 같은 스포츠 시뮬레이션 응용 분야에서 적용된 사례가 없다.
한편, 한국등록특허 제10-1022516호“스펙트럼 피크를 이용한 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법”는 잡음에 의해 손상된 입력 음향 신호에 대한 특징 추출 과정 없이 사전 학습된 등록 음향 신호의 스펙트럼 피크 정보를 이용하여 두 음향 간 매칭을 수행함으로써, 다양한 잡음이 발생하는 실제 생활 환경에서 배경 잡음에 무관하게 안정된 인식률을 제공하는 음성 인식 시스템에 관하여 개시하고 있다.
본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공하는 것을 목적으로 한다.
또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석하는 것을 목적으로 한다.
또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시키는 것을 목적으로 한다.
상기한 목적을 달성하기 위한 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.
본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공할 수 있다.
또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석할 수 있다.
또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시킬 수 있다.
도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.
본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 음향 분석 장치는 음향 인식부(110), 음향 분석부(120), 메모리 및 데이터베이스부(130)를 포함한다.
음향 인식부(110)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 포함할 수 있다.
음향 분석부(120)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있다.
이 때, 음향 분석부(120)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 미만인 경우, 새로운 음향 신호 데이터를 획득할 수 있다.
또한, 음향 분석부(120)는 음향 신호 데이터에서 FFT가 수행된 FFT 데이터에서 임펄스 신호가 존재하는지 판단할 수 있다.
이 때, 음향 분석부(120)는 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있다.
이 때, 음향 분석부(120)는 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다.
또한, 음향 분석부(120)는 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다.
이 때, 수학식 1에서 A는 FFT 데이터의 크기(진폭), F1은 주 주파수이고, (-α ~ +α)는 주 주파수(F1)을 중심으로 일정한 간격에 상응할 수 있다.
또한, 음향 분석부(120)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.
예를 들어, 음향 분석부(120)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.
또한, 음향 분석부(120)는 음향 발생 여부를 판단할 수 있다.
이 때, 음향 분석부(120)는 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다.
이 때, 음향 분석부(120)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다.
이 때, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있다.
예를 들어, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 음향 분석부(120)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
이 때, 음향 분석부(120)는 계산된 주파수 비와 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 2를 참조하면, 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프는 일반적인 소리와 달리 처음에는 고주파로 시작해서 저주파로 변하면서 진폭이 커졌다가, 다시 고주파로 바뀌면서 전폭이 작아지는 특성이 나타나는 것을 알 수 있다.
도 3을 참조하면, 도 2의 음향 신호를 FFT 수행하여 스팩트럼 분석하게 되면, 일정 부분에 높은 크기를 갖는 스팩트럼이 나타나는 것을 알 수 있다. 음향 분석 장치는 이러한 첫째 기본주파수(F1)를 중심으로 일정한 간격(-α~+α)에 대하여 확률 밀도 함수(Probability Density Function) 값을 계산할 수 있다. 그리고 계산된 확률 밀도 함수 값과 데이터베이스에 저장된 음향 학습 데이터의 확률 밀도 함수 값을 비교하여 타구 여부를 판단할 수 있다.
즉, 강하게 쳤을 때는 공의 타격에 대한 울림이 적으므로 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.3 이상으로 매우 크게 나타나는 것을 알 수 있다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4 및 5를 참조하면, 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프는 타격에 대한 울림이 도 2에 도시된 골프 공을 강하게 타구 했을 때보다 크고 넓게 나타나는 것을 알 수 있다.
따라서, 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.2 이하로 골프 공을 강하게 타구 했을 때에 비해 상대적으로 낮게 나타나는 것을 알 수 있다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 6을 참조하면, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S210).
즉, 단계(S210)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.
이 때, 단계(S210)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S220).
즉, 단계(S220)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S230), 임계값 이하인 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT를 수행할 수 있다(S230).
이 때, 단계(S230)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S240).
즉, 단계(S240)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S250), 임펄스 신호가 존재하지 않는 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S250).
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S260).
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 음향 학습 데이터를 저장할 수 있다(S270).
즉, 단계(S270)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.
예를 들어, 단계(S270)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7을 참조하면, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S310).
즉, 단계(S310)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.
이 때, 단계(S310)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S320).
즉, 단계(S320)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S330), 임계값 이하인 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT를 수행할 수 있다(S330).
이 때, 단계(S330)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S340).
즉, 단계(S340)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S350), 임펄스 신호가 존재하지 않는 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S350).
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S360).
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 음향 강도를 판단할 수 있다(S370).
즉, 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).
또한, 단계(S370)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다(S372).
또한, 단계(S370)는 계산한 차이값이 임계값 이하인지 판단할 수 있다(S373).
즉, 단계(S373)는 계산한 차이값이 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있고(S374), 계산한 차이값이 임계값을 초과하는 경우 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S375).
예를 들어, 단계(S373)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 단계(S373)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
이 때, 단계(S373)는 수학식 3으로부터 계산된 주파수 비와 데이터베이스부(130)에 저장된 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
또한, 단계(S370)는 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S374).
즉, 단계(S374)는 모든 음향 신호 데이터의 비교가 완료된 경우, 프로세스를 종료할 수 있고, 모든 음향 신호 데이터의 비교가 완료되지 않은 경우, 단계(S371)로 되돌아가 음향 학습 데이터를 로드하여 일련의 과정을 반복할 수 있다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.
도 8을 참조하면, 음향 강도를 판단하는 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).
또한, 단계(S370)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다(S372).
또한, 단계(S370)는 계산한 차이값이 임계값 이하인지 판단할 수 있다(S373).
즉, 단계(S373)는 계산한 차이값이 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있고(S374), 계산한 차이값이 임계값을 초과하는 경우 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S375).
예를 들어, 단계(S373)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 단계(S373)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
이 때, 단계(S373)는 수학식 3으로부터 계산된 주파수 비와 데이터베이스부(130)에 저장된 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
또한, 단계(S370)는 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S374).
즉, 단계(S374)는 모든 음향 신호 데이터의 비교가 완료된 경우, 프로세스를 종료할 수 있고, 모든 음향 신호 데이터의 비교가 완료되지 않은 경우, 단계(S371)로 되돌아가 음향 학습 데이터를 로드하여 일련의 과정을 반복할 수 있다.
이상에서와 같이 본 발명에 따른 음향 분석 장치 및 그 제어 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
110: 음향 인식부
120: 음향 분석부
130: 데이터베이스부
120: 음향 분석부
130: 데이터베이스부
Claims (1)
- 음향 분석 장치를 이용하는 음향 분석 방법에 있어서,
음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계;
상기 음향 신호의 유사 확률 밀도를 계산하는 단계; 및
상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계;
를 포함하는 것을 특징으로 하는 음향 분석 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160124949A KR102002535B1 (ko) | 2016-09-28 | 2016-09-28 | 음향 분석 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160124949A KR102002535B1 (ko) | 2016-09-28 | 2016-09-28 | 음향 분석 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180035010A true KR20180035010A (ko) | 2018-04-05 |
KR102002535B1 KR102002535B1 (ko) | 2019-10-01 |
Family
ID=61977452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160124949A KR102002535B1 (ko) | 2016-09-28 | 2016-09-28 | 음향 분석 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102002535B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014102938A1 (ja) * | 2012-12-26 | 2014-07-03 | トヨタ自動車株式会社 | 音検知装置及び音検知方法 |
-
2016
- 2016-09-28 KR KR1020160124949A patent/KR102002535B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014102938A1 (ja) * | 2012-12-26 | 2014-07-03 | トヨタ自動車株式会社 | 音検知装置及び音検知方法 |
Non-Patent Citations (1)
Title |
---|
In-chul Yoo et al., ‘Automatic sound recognition for the hearing impaired’, IEEE Trans. on Consumer Electronics, Vol.54, No.4, pp, 2029~2036, November 2008.* * |
Also Published As
Publication number | Publication date |
---|---|
KR102002535B1 (ko) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108305615B (zh) | 一种对象识别方法及其设备、存储介质、终端 | |
US9489965B2 (en) | Method and apparatus for acoustic signal characterization | |
KR102605736B1 (ko) | 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치 | |
JP2020509703A5 (ko) | ||
CN105161093A (zh) | 一种判断说话人数目的方法及系统 | |
GB2583420A (en) | Speaker identification | |
US9564134B2 (en) | Method and apparatus for speaker-calibrated speaker detection | |
CN111028845A (zh) | 多音频识别方法、装置、设备及可读存储介质 | |
CN112712809B (zh) | 一种语音检测方法、装置、电子设备及存储介质 | |
CN110751955B (zh) | 基于时频矩阵动态选择的声音事件分类方法及系统 | |
CN110890087A (zh) | 一种基于余弦相似度的语音识别方法和装置 | |
CN104103280A (zh) | 基于动态时间归整算法的离线语音端点检测的方法和装置 | |
US10997972B2 (en) | Object authentication device and object authentication method | |
KR20150061669A (ko) | 음성/무음성 구간 검출 방법 및 장치 | |
KR102002535B1 (ko) | 음향 분석 장치 및 방법 | |
KR101547261B1 (ko) | 화자 식별 방법 | |
CN111681671B (zh) | 异常音识别方法、装置及计算机存储介质 | |
CN113113051A (zh) | 音频指纹提取方法、装置、计算机设备和存储介质 | |
Shabtai et al. | Room volume classification from reverberant speech | |
JP2011139409A (ja) | 音響信号処理装置、音響信号処理方法、及びコンピュータプログラム | |
Tahliramani et al. | Performance Analysis of Speaker Identification System With and Without Spoofing Attack of Voice Conversion | |
KR20150144636A (ko) | 이상음원 위치 추적 시스템 및 방법 | |
US20230169977A1 (en) | Sound Extraction System and Sound Extraction Method | |
KR101327664B1 (ko) | 음성 영역 검출 방법 및 그 장치 | |
US10861452B2 (en) | Object authentication device and object authentication method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |