KR20180035010A

KR20180035010A - 음향 분석 장치 및 방법

Info

Publication number: KR20180035010A
Application number: KR1020160124949A
Authority: KR
Inventors: 서상우; 김명규; 김우석; 김종성; 백성민; 홍성진
Original assignee: 한국전자통신연구원
Priority date: 2016-09-28
Filing date: 2016-09-28
Publication date: 2018-04-05
Also published as: KR102002535B1

Abstract

음향 분석 장치 및 방법이 개시된다. 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.

Description

음향 분석 장치 및 방법 {APPARATUS AND METHOD FOR ANALYZING SOUND}

본 발명은 음향 인식 및 음향 분석 기술에 관한 것이다.

사람의 음성이나 사물의 소리를 분석하고 인식하는 기술이 다양하게 개발되어 왔다. 음성 또는 소리 인식 기술은 일반적으로 마이크와 같은 입력 수단을 통하여 얻어진 음성 또는 소리 신호를 인식하는 기술이다. 음성 인식 기술의 경우 음소나 음절 등을 구분하고 인식하는 등 매우 복잡한 단계를 거쳐 음성을 인식하고 있으며 계산량도 많다. 소리 인식 기술도 대체적으로 복잡한 과정을 거쳐 소리 인식을 수행하고 있다. 음성이나 소리의 인식 결과는 명령이나 제어, 데이터 입력, 문서 준비 등의 응용 분야에서 사용되고 있다. 또한, 소리 명령 컴퓨터, 무인 전화번호 안내, 각종 소리 안내 시스템, 가전제품, 자동차 항법 장치 및 홈-오토메이션 등에도 이용되고 있다. 그러나 스크린 골프나 스크린 야구 등과 같은 스포츠 시뮬레이션 응용 분야에서 적용된 사례가 없다.

한편, 한국등록특허 제10-1022516호“스펙트럼 피크를 이용한 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법”는 잡음에 의해 손상된 입력 음향 신호에 대한 특징 추출 과정 없이 사전 학습된 등록 음향 신호의 스펙트럼 피크 정보를 이용하여 두 음향 간 매칭을 수행함으로써, 다양한 잡음이 발생하는 실제 생활 환경에서 배경 잡음에 무관하게 안정된 인식률을 제공하는 음성 인식 시스템에 관하여 개시하고 있다.

본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공하는 것을 목적으로 한다.

또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석하는 것을 목적으로 한다.

또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시키는 것을 목적으로 한다.

상기한 목적을 달성하기 위한 본 발명의 일실시예에 따른 음향 분석 방법은 음향 분석 장치를 이용하는 음향 분석 방법에 있어서, 음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계; 상기 음향 신호의 유사 확률 밀도를 계산하는 단계 및 상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계를 포함한다.

본 발명은 낮은 연산 비용으로 고속 음향 분석을 제공할 수 있다.

또한, 본 발명은 음향 발생 여부 및 음향 강도를 분석할 수 있다.

또한, 본 발명은 스포츠 시뮬레이터에 적용하여 시뮬레이션의 정확성을 향상시킬 수 있다.

도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.
도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다.
도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.
도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.

본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일실시예에 따른 음향 분석 장치를 나타낸 블록도이다.

도 1을 참조하면, 본 발명의 일실시예에 따른 음향 분석 장치는 음향 인식부(110), 음향 분석부(120), 메모리 및 데이터베이스부(130)를 포함한다.

음향 인식부(110)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 포함할 수 있다.

음향 분석부(120)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.

이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있다.

이 때, 음향 분석부(120)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.

이 때, 음향 분석부(120)는 음향 신호 데이터가 기설정된 임계값 미만인 경우, 새로운 음향 신호 데이터를 획득할 수 있다.

또한, 음향 분석부(120)는 음향 신호 데이터에서 FFT가 수행된 FFT 데이터에서 임펄스 신호가 존재하는지 판단할 수 있다.

이 때, 음향 분석부(120)는 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있다.

이 때, 음향 분석부(120)는 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다.

또한, 음향 분석부(120)는 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다.

이 때, 수학식 1에서 A는 FFT 데이터의 크기(진폭), F1은 주 주파수이고, (-α ~ +α)는 주 주파수(F1)을 중심으로 일정한 간격에 상응할 수 있다.

또한, 음향 분석부(120)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.

예를 들어, 음향 분석부(120)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.

또한, 음향 분석부(120)는 음향 발생 여부를 판단할 수 있다.

이 때, 음향 분석부(120)는 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다.

이 때, 음향 분석부(120)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(D_database)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(D_input)의 차이값을 계산할 수 있다.

이 때, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있다.

예를 들어, 음향 분석부(120)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.

이 때, 음향 분석부(120)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.

이 때, 음향 분석부(120)는 계산된 주파수 비와 기준 값을 비교하여 음향 강도를 판단할 수 있다.

즉, 본 발명의 일실시예에 따르면, 스크린 골프나 스크린 야구 등에서 골프 공이나 야구공의 타격 여부를 판단하여 카메라로 촬영하는 데 있어서 트리거 신호로 사용할 수 있으며, 공의 궤적 등을 분석하는 데 있어서 타구의 강도를 이용할 수 있다.

도 2는 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 3은 도 2에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.

도 2를 참조하면, 본 발명의 일실시예에 따른 골프 공을 강하게 타구 했을 때 음향 신호를 나타낸 그래프는 일반적인 소리와 달리 처음에는 고주파로 시작해서 저주파로 변하면서 진폭이 커졌다가, 다시 고주파로 바뀌면서 전폭이 작아지는 특성이 나타나는 것을 알 수 있다.

도 3을 참조하면, 도 2의 음향 신호를 FFT 수행하여 스팩트럼 분석하게 되면, 일정 부분에 높은 크기를 갖는 스팩트럼이 나타나는 것을 알 수 있다. 음향 분석 장치는 이러한 첫째 기본주파수(F1)를 중심으로 일정한 간격(-α~+α)에 대하여 확률 밀도 함수(Probability Density Function) 값을 계산할 수 있다. 그리고 계산된 확률 밀도 함수 값과 데이터베이스에 저장된 음향 학습 데이터의 확률 밀도 함수 값을 비교하여 타구 여부를 판단할 수 있다.

즉, 강하게 쳤을 때는 공의 타격에 대한 울림이 적으므로 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.3 이상으로 매우 크게 나타나는 것을 알 수 있다.

도 4는 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프이다. 도 5는 도 4에 도시된 음향 신호에 대하여 FFT를 수행한 일 예를 나타낸 그래프이다.

도 4 및 5를 참조하면, 본 발명의 일실시예에 따른 골프 공을 약하게 타구 했을 때 음향 신호를 나타낸 그래프는 타격에 대한 울림이 도 2에 도시된 골프 공을 강하게 타구 했을 때보다 크고 넓게 나타나는 것을 알 수 있다.

따라서, 전체 주파수의 유사 확률 밀도 함수 값에 대한 부분 유사 확률 밀도 함수 값(기본주파수 주변)의 비가 0.2 이하로 골프 공을 강하게 타구 했을 때에 비해 상대적으로 낮게 나타나는 것을 알 수 있다.

도 6은 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법을 나타낸 동작흐름도이다.

도 6을 참조하면, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S210).

즉, 단계(S210)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.

이 때, 단계(S210)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S220).

즉, 단계(S220)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S230), 임계값 이하인 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT를 수행할 수 있다(S230).

이 때, 단계(S230)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S240).

즉, 단계(S240)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S250), 임펄스 신호가 존재하지 않는 경우, 단계(S210)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S250).

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S260).

또한, 본 발명의 일실시예에 따른 음향 학습 데이터를 저장하는 음향 분석 방법은 음향 학습 데이터를 저장할 수 있다(S270).

즉, 단계(S270)는 입력 받은 음향 신호 데이터, FFT 데이터 및 유사 확률 밀도 값을 데이터베이스부(130)에 음향 학습 데이터로 저장할 수 있다.

예를 들어, 단계(S270)는 골프 공의 타구 여부를 판단 하기 위하여, 골프 공을 타구한 경우에 음향이 발생한 것으로 음향 학습 데이터를 데이터베이스부(130)에 저장할 수 있다.

도 7은 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법을 나타낸 동작흐름도이다.

도 7을 참조하면, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 먼저 음향 신호 데이터를 획득한다(S310).

즉, 단계(S310)는 음향을 입력 받아 음향 신호로 변환하는 마이크, 음향 인식 센서 등의 음향 인식 장치와 입력 받은 아날로그 음향 신호를 디지털 음향 신호로 변환하는 A/D 변환기를 이용하여 음향 신호 데이터를 획득할 수 있다.

이 때, 단계(S310)는 디지털 변환된 음향 신호 데이터를 저역 통과 필터(low pass filter)에 통과 시켜 잡음을 제거할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 획득한 음향 신호 데이터를 임계값과 비교할 수 있다(S320).

즉, 단계(S320)는 음향 신호 데이터가 기설정된 임계값 이상인 음향 신호 데이터에 대해서만 FFT(Fast Fourier Transform)을 수행할 수 있고(S330), 임계값 이하인 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT를 수행할 수 있다(S330).

이 때, 단계(S330)는 FFT를 일정 구간 간격(2048 또는 4096 포인트 등)으로 수행할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 FFT가 수행된 FFT 데이터의 임펄스 신호 존재 여부를 판단할 수 있다(S340).

즉, 단계(S340)는 FFT 데이터에서 임펄스 신호가 존재하는 경우, LOCAL MINIMUM을 검색할 수 있고(S350), 임펄스 신호가 존재하지 않는 경우, 단계(S310)로 되돌아가 다른 음향 신호 데이터를 획득 할 수 있다.

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 주(Fundamental) 주파수 근처에서 LOCAL MINIMUM 을 검색할 수 있다(S350).

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 수학식 1을 이용하여 유사 확률 밀도(Probability Density Function) 값을 계산할 수 있다(S360).

또한, 본 발명의 일실시예에 따른 음향 강도를 판단하는 음향 분석 방법은 음향 강도를 판단할 수 있다(S370).

즉, 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).

또한, 단계(S370)는 수학식 2와 같이 음향 학습 데이터의 유사 확률 밀도 값(D_database)과 음향 강도를 판단하려는 음향 신호 데이터의 유사 확률 밀도 값(D_input)의 차이값을 계산할 수 있다(S372).

또한, 단계(S370)는 계산한 차이값이 임계값 이하인지 판단할 수 있다(S373).

즉, 단계(S373)는 계산한 차이값이 임계값 이하인 경우, 음향 신호 데이터를 검출할 수 있고(S374), 계산한 차이값이 임계값을 초과하는 경우 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S375).

예를 들어, 단계(S373)는 수학식 2로부터 계산한 차이값이 기설정된 임계값 이하인 경우, 골프 공을 타구한 것으로 판단하고, 음향이 발생한 것으로 판단할 수 있다.

이 때, 단계(S373)는 수학식 3을 이용하여 음향 강도를 판단할 수 있다.

이 때, 단계(S373)는 수학식 3으로부터 계산된 주파수 비와 데이터베이스부(130)에 저장된 기준 값을 비교하여 음향 강도를 판단할 수 있다.

또한, 단계(S370)는 모든 음향 신호 데이터의 비교가 완료됐는지 판단할 수 있다(S374).

즉, 단계(S374)는 모든 음향 신호 데이터의 비교가 완료된 경우, 프로세스를 종료할 수 있고, 모든 음향 신호 데이터의 비교가 완료되지 않은 경우, 단계(S371)로 되돌아가 음향 학습 데이터를 로드하여 일련의 과정을 반복할 수 있다.

도 8은 도 7에 도시된 음향 강도 판단 단계의 일 예를 세부적으로 나타낸 동작흐름도이다.

도 8을 참조하면, 음향 강도를 판단하는 단계(S370)는 먼저 데이터베이스부(130)에 저장된 음향 학습 데이터를 로드할 수 있다(S371).

이상에서와 같이 본 발명에 따른 음향 분석 장치 및 그 제어 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

110: 음향 인식부
120: 음향 분석부
130: 데이터베이스부

Claims

음향 분석 장치를 이용하는 음향 분석 방법에 있어서,
음향 인식 장치를 이용하여 음향 신호를 입력 받는 단계;
상기 음향 신호의 유사 확률 밀도를 계산하는 단계; 및
상기 유사 확률 밀도를 계산한 값을 이용하여 상기 음향 신호의 음향 강도를 판단하는 단계;
를 포함하는 것을 특징으로 하는 음향 분석 방법.