KR20180035010A - 음향 분석 장치 및 방법 - Google Patents

음향 분석 장치 및 방법 Download PDF

Info

Publication number
KR20180035010A
KR20180035010A KR1020160124949A KR20160124949A KR20180035010A KR 20180035010 A KR20180035010 A KR 20180035010A KR 1020160124949 A KR1020160124949 A KR 1020160124949A KR 20160124949 A KR20160124949 A KR 20160124949A KR 20180035010 A KR20180035010 A KR 20180035010A
Authority
KR
South Korea
Prior art keywords
acoustic
sound
present
sound signal
data
Prior art date
Application number
KR1020160124949A
Other languages
English (en)
Other versions
KR102002535B1 (ko
Inventor
서상우
김명규
김우석
김종성
백성민
홍성진
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020160124949A priority Critical patent/KR102002535B1/ko
Publication of KR20180035010A publication Critical patent/KR20180035010A/ko
Application granted granted Critical
Publication of KR102002535B1 publication Critical patent/KR102002535B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

음향 분석 장치 및 방법이 개시된다. 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.

Description

음향 분석 장치 및 방법 {APPARATUS AND METHOD FOR ANALYZING SOUND}
본 발명은 음향 인식 및 음향 분석 기술에 관한 것이다.
사람의 음성이나 사물의 소리를 분석하고 인식하는 기술이 다양하게 개발되어 왔다. 음성 또는 소리 인식 기술은 일반적으로 마이크와 같은 입력 수단을 통하여 얻어진 음성 또는 소리 신호를 인식하는 기술이다. 음성 인식 기술의 경우 음소나 음절 등을 구분하고 인식하는 등 매우 복잡한 단계를 거쳐 음성을 인식하고 있으며 계산량도 많다. 소리 인식 기술도 대체적으로 복잡한 과정을 거쳐 소리 인식을 수행하고 있다. 음성이나 소리의 인식 결과는 명령이나 제어, 데이터 입력, 문서 준비 등의 응용 분야에서 사용되고 있다. 또한, 소리 명령 컴퓨터, 무인 전화번호 안내, 각종 소리 안내 시스템, 가전제품, 자동차 항법 장치 및 홈-오토메이션 등에도 이용되고 있다. 그러나 스크린 골프나 스크린 야구 등과 같은 스포츠 시뮬레이션 응용 분야에서 적용된 사례가 없다.
한편, 한국등록특허 제10-1022516호“스펙트럼 피크를 이용한 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법”는 잡음에 의해 손상된 입력 음향 신호에 대한 특징 추출 과정 없이 사전 학습된 등록 음향 신호의 스펙트럼 피크 정보를 이용하여 두 음향 간 매칭을 수행함으로써, 다양한 잡음이 발생하는 실제 생활 환경에서 배경 잡음에 무관하게 안정된 인식률을 제공하는 음성 인식 시스템에 관하여 개시하고 있다.
본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공하는 것을 목적으로 한다.
또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석하는 것을 목적으로 한다.
또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시키는 것을 목적으로 한다.
상기한 목적을 달성하기 위한 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.
본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공할 수 있다.
또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석할 수 있다.
또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시킬 수 있다.
도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.
본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 음향 분석 장치는 음향 인식부(110), 음향 분석부(120), 메모리 및 데이터베이스부(130)를 포함한다.
음향 인식부(110)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 포함할 수 있다.
음향 분석부(120)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있다.
이 때, 음향 분석부(120)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 미만인 경우, 새로운 음향 신호 데이터를 획득할 수 있다.
또한, 음향 분석부(120)는 음향 신호 데이터에서 FFT가 수행된 FFT 데이터에서 임펄스 신호가 존재하는지 판단할 수 있다.
이 때, 음향 분석부(120)는 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있다.
이 때, 음향 분석부(120)는 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다.
또한, 음향 분석부(120)는 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다.
Figure pat00001
이 때, 수학식 1에서 A는 FFT 데이터의 크기(진폭), F1은 주 주파수이고, (-α ~ +α)는 주 주파수(F1)을 중심으로 일정한 간격에 상응할 수 있다.
또한, 음향 분석부(120)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.
예를 들어, 음향 분석부(120)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.
또한, 음향 분석부(120)는 음향 발생 여부를 판단할 수 있다.
이 때, 음향 분석부(120)는 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다.
이 때, 음향 분석부(120)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다.
Figure pat00002
이 때, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있다.
예를 들어, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 음향 분석부(120)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
Figure pat00003
이 때, 음향 분석부(120)는 계산된 주파수 비와 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 2를 참조하면, 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프는 일반적인 소리와 달리 처음에는 고주파로 시작해서 저주파로 변하면서 진폭이 커졌다가, 다시 고주파로 바뀌면서 전폭이 작아지는 특성이 나타나는 것을 알 수 있다.
도 3을 참조하면, 도 2의 음향 신호를 FFT 수행하여 스팩트럼 분석하게 되면, 일정 부분에 높은 크기를 갖는 스팩트럼이 나타나는 것을 알 수 있다. 음향 분석 장치는 이러한 첫째 기본주파수(F1)를 중심으로 일정한 간격(-α~+α)에 대하여 확률 밀도 함수(Probability Density Function) 값을 계산할 수 있다. 그리고 계산된 확률 밀도 함수 값과 데이터베이스에 저장된 음향 학습 데이터의 확률 밀도 함수 값을 비교하여 타구 여부를 판단할 수 있다.
즉, 강하게 쳤을 때는 공의 타격에 대한 울림이 적으므로 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.3 이상으로 매우 크게 나타나는 것을 알 수 있다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4 및 5를 참조하면, 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프는 타격에 대한 울림이 도 2에 도시된 골프 공을 강하게 타구 했을 때보다 크고 넓게 나타나는 것을 알 수 있다.
따라서, 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.2 이하로 골프 공을 강하게 타구 했을 때에 비해 상대적으로 낮게 나타나는 것을 알 수 있다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 6을 참조하면, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S210).
즉, 단계(S210)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.
이 때, 단계(S210)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S220).
즉, 단계(S220)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S230), 임계값 이하인 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT를 수행할 수 있다(S230).
이 때, 단계(S230)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S240).
즉, 단계(S240)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S250), 임펄스 신호가 존재하지 않는 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S250).
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S260).
또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 음향 학습 데이터를 저장할 수 있다(S270).
즉, 단계(S270)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.
예를 들어, 단계(S270)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7을 참조하면, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S310).
즉, 단계(S310)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.
이 때, 단계(S310)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S320).
즉, 단계(S320)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S330), 임계값 이하인 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT를 수행할 수 있다(S330).
이 때, 단계(S330)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S340).
즉, 단계(S340)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S350), 임펄스 신호가 존재하지 않는 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S350).
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S360).
또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 음향 강도를 판단할 수 있다(S370).
즉, 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).
또한, 단계(S370)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다(S372).
또한, 단계(S370)는 계산한 차이값이 임계값 이하인지 판단할 수 있다(S373).
즉, 단계(S373)는 계산한 차이값이 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있고(S374), 계산한 차이값이 임계값을 초과하는 경우 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S375).
예를 들어, 단계(S373)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 단계(S373)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
이 때, 단계(S373)는 수학식 3으로부터 계산된 주파수 비와 데이터베이스부(130)에 저장된 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
또한, 단계(S370)는 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S374).
즉, 단계(S374)는 모든 음향 신호 데이터의 비교가 완료된 경우, 프로세스를 종료할 수 있고, 모든 음향 신호 데이터의 비교가 완료되지 않은 경우, 단계(S371)로 되돌아가 음향 학습 데이터를 로드하여 일련의 과정을 반복할 수 있다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.
도 8을 참조하면, 음향 강도를 판단하는 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).
또한, 단계(S370)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(Ddatabase)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(Dinput)의 차이값을 계산할 수 있다(S372).
또한, 단계(S370)는 계산한 차이값이 임계값 이하인지 판단할 수 있다(S373).
즉, 단계(S373)는 계산한 차이값이 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있고(S374), 계산한 차이값이 임계값을 초과하는 경우 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S375).
예를 들어, 단계(S373)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.
이 때, 단계(S373)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.
이 때, 단계(S373)는 수학식 3으로부터 계산된 주파수 비와 데이터베이스부(130)에 저장된 기준 값을 비교하여 음향 강도를 판단할 수 있다.
즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.
또한, 단계(S370)는 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S374).
즉, 단계(S374)는 모든 음향 신호 데이터의 비교가 완료된 경우, 프로세스를 종료할 수 있고, 모든 음향 신호 데이터의 비교가 완료되지 않은 경우, 단계(S371)로 되돌아가 음향 학습 데이터를 로드하여 일련의 과정을 반복할 수 있다.
이상에서와 같이 본 발명에 따른 음향 분석 장치 및 그 제어 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
110: 음향 인식부
120: 음향 분석부
130: 데이터베이스부

Claims (1)

  1. 음향 분석 장치를 이용하는 음향 분석 방법에 있어서,
    음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계;
    상기 음향 신호의 유사 확률 밀도를 계산하는 단계; 및
    상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계;
    를 포함하는 것을 특징으로 하는 음향 분석 방법.
KR1020160124949A 2016-09-28 2016-09-28 음향 분석 장치 및 방법 KR102002535B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160124949A KR102002535B1 (ko) 2016-09-28 2016-09-28 음향 분석 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160124949A KR102002535B1 (ko) 2016-09-28 2016-09-28 음향 분석 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20180035010A true KR20180035010A (ko) 2018-04-05
KR102002535B1 KR102002535B1 (ko) 2019-10-01

Family

ID=61977452

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160124949A KR102002535B1 (ko) 2016-09-28 2016-09-28 음향 분석 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102002535B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014102938A1 (ja) * 2012-12-26 2014-07-03 トヨタ自動車株式会社 音検知装置及び音検知方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014102938A1 (ja) * 2012-12-26 2014-07-03 トヨタ自動車株式会社 音検知装置及び音検知方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
In-chul Yoo et al., ‘Automatic sound recognition for the hearing impaired’, IEEE Trans. on Consumer Electronics, Vol.54, No.4, pp, 2029~2036, November 2008.* *

Also Published As

Publication number Publication date
KR102002535B1 (ko) 2019-10-01

Similar Documents

Publication Publication Date Title
CN108305615B (zh) 一种对象识别方法及其设备、存储介质、终端
US9489965B2 (en) Method and apparatus for acoustic signal characterization
KR102605736B1 (ko) 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치
JP2020509703A5 (ko)
CN105161093A (zh) 一种判断说话人数目的方法及系统
GB2583420A (en) Speaker identification
US9564134B2 (en) Method and apparatus for speaker-calibrated speaker detection
CN111028845A (zh) 多音频识别方法、装置、设备及可读存储介质
CN112712809B (zh) 一种语音检测方法、装置、电子设备及存储介质
CN110751955B (zh) 基于时频矩阵动态选择的声音事件分类方法及系统
CN110890087A (zh) 一种基于余弦相似度的语音识别方法和装置
CN104103280A (zh) 基于动态时间归整算法的离线语音端点检测的方法和装置
US10997972B2 (en) Object authentication device and object authentication method
KR20150061669A (ko) 음성/무음성 구간 검출 방법 및 장치
KR102002535B1 (ko) 음향 분석 장치 및 방법
KR101547261B1 (ko) 화자 식별 방법
CN111681671B (zh) 异常音识别方法、装置及计算机存储介质
CN113113051A (zh) 音频指纹提取方法、装置、计算机设备和存储介质
Shabtai et al. Room volume classification from reverberant speech
JP2011139409A (ja) 音響信号処理装置、音響信号処理方法、及びコンピュータプログラム
Tahliramani et al. Performance Analysis of Speaker Identification System With and Without Spoofing Attack of Voice Conversion
KR20150144636A (ko) 이상음원 위치 추적 시스템 및 방법
US20230169977A1 (en) Sound Extraction System and Sound Extraction Method
KR101327664B1 (ko) 음성 영역 검출 방법 및 그 장치
US10861452B2 (en) Object authentication device and object authentication method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant