KR0160206B1

KR0160206B1 - 음성신호 추출장치

Info

Publication number: KR0160206B1
Application number: KR1019950020793A
Authority: KR
Inventors: 전익범
Original assignee: 구자홍; 엘지전자주식회사
Priority date: 1995-07-14
Filing date: 1995-07-14
Publication date: 1999-01-15
Anticipated expiration: 2015-07-14
Also published as: KR970009308A

Abstract

본 발명은 음성, 음악, 효과음 등의 다양한 소리로 녹음된 신호중에서 음성부만을 추출하여 출력토록하는 음성신호 추출장치에 관한 것이다.

종래기술은 입력신호에 음성신호의 유무를 판별하여 잡음 신호 입력 구간에서는 뮤팅회로를 동작시켜 잡음을 제거하고 음성신호 입력구간에서는 뮤팅동작을 해제시켜 음성신호를 추출하는 회로구성인 것이어서, 예를들면 음성과 음악이 입력신호에 혼입되어 들어올 경우에는 음성신호만을 추출할 수가 없는 문제점이 있고, 또한 FFT 및 셉트럼 분석을 행해야만 하므로 이로 인해 회로구성이 복잡해지며 실시간 구현이 용이하지 못한 문제점이 있었다.

이를 개선코자 하여 본 발명은 모노(Mono) 상태로 녹음된 영화 또는 TV드라마에서 대사부분만을 추출할 수 있도록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 함으로써 보다 탁월한 오디오/비디오(A/V) 음장 재생을 행할 수 있도록 한 것이다.

Description

음성신호 추출장치

제1도는 종래의 음성신호 추출장치의 블록 구성도.

제2도는 본 발명에 의한 음성신호 추출장치의 블록 구성도.

제3도는 본 발명에 의한 추출기의 블록 구성도.

제4도는 본 발명에서 대역 통과 필터를 통한 주파수 특성 예시도.

* 도면의 주요부분에 대한 부호의 설명

101, 102,....10n : 대역통과필터(BPF) 111, 112,....11n : 추출기

201 : 가산기 111a : 적분기

111b : 비교기 111c : 멀티플렉서

본 발명은 음성신호 추출장치에 관한 것으로 특히 음성, 음악, 효과음 등의 다양한 소리로 녹음된 신호중에서 음성부반을 추출하여 출력토록 하는 음성신호 추출장치에 관한 것이다.

종래의 음성신호 추출장치는 제1도에 도시한 바와 같이 입력되는 음서, 잡음 혼입신호를 고속푸리에 변환(Fast Fourier Transform; FFT)하여 다수개의 스펙트럼 신호를 셉트럼 분석기(2)로 출력하는 출력하는 대역분배기(1)와, 상기 대역분배기(1)의 출력신호를 셉트럼 분석하여 후단의 음성힌호 검출기(3)에 출력하는 셉트럼 분석기(2)와, 상기 셉트럼 분석기(2)로부터 입력되는 신호가 음성신호인가 여부를 판별하는 음성신호 검출기(3)와, 상기 음성신호 검출기(3)의 출력신호가 음성신호가 아닌 경우 잡음신호로 판별하는 잡음구간판별기(4)와, 상기 잡음구간 판별기(4)의 출력신호가 잡음구간일 때 뮤팅회로(6)를 구동시키는 뮤팅회로구동부(5)와, 상기 뮤팅회로구동부(5)의 제어에 따라 입력되는 음성,잡음 혼입신호를 뮤트시키는 뮤팅회로(6)로 구성되어져 있다.

또한 상기한 음성신호 검출기(3)는 상기 셉트럼 분석기(2) 출력신호에서 기본주파수를 추출하는 피크치 검출기(3a)와, 셉트럼분석기(2) 출력신호에서 평균값을 산출하는 평균치 산출기(3b)와, 상기 피크치 검출기(3a)와 평균치 산출기(3b)로부터 입력되는 신호가 모음 또는 자음인가를 판별하는 모음/자음 판별기(3c)와, 상기 모음/자음판별기(3c)의 출력신호가 음성신호인가를 판별하여 잡음구간 판별기(4)로 출력하는 음성신호 판별회로(3d)로 구성되어져 있다.

이와 같이 구성된 종래의 음성신호 추출장치의 동작을 설명하면 다음과 같다.

음성 및 잡음신호가 혼입된 신호에서 음성신호와 잡음신호가 랜덤(Random)하게 입력되면 그 신호는 뮤팅회로(6)와 FFT를 행하는 대역 분배기(1)를 거쳐 셉트럼 분석기(2)에서 셉트럼 분석을 행하게 된다.

이와 같이 셉트럼 분석을 하게 되면 고주파 성분과 저주파 성분으로 나누어 출력하게 되는데, 이때 고주파 성분은 피크치 검출기(3a) 및 평균치산출기(3b)에 입력되어 각각 입력신호의 기본주파수와 평균치 데이터를 모음/자음 판별기(3c)에 입력시킨다.

이와 같은 상태에서 모음/자음 판별기(3c)는 입력신호의 기본주파수와 평균치 데이터를 분석하여 입력되는 신호가 음성신호 또는 잡음신호인가를 판별한다.

이어서 음성신호 판별회로(3d)는 상기 모음/자음 판별기(3c)의 분석결과를 이용하여 입력신호가 음성신호 또는 잡음신호인가를 판별하여 잡음구간판별기94)에 해당 판별신호를 출력시킨다.

상기 잡음구간 판별기(4)는 뮤팅회로구동부(5)에 잡음구간 정보를 출력하므로 뮤팅회로구동부(5)에서는 입력신호가 잡음구간일때에는 뮤팅회로(6)를 뮤트동작시키고, 음성신호일때에는 뮤팅회로(6)를 구동시키지 않으므로 음성신호를 추출하게 된다.

그러나 이러한 종래기술은 입력신호에 음성신호의 유무를 판별하여 잡음신호 입력구간에서는 뮤팅회로를 동작시켜 잡음을 제거하고 음성신호 입력구간에서는 뮤팅동작을 해제시켜 음성신호를 추출하는 회로구성인 것이어서, 예를들면 음성과 음악기 입력신호에 혼입되어 들어올 경우에는 음성신호만을 추출할 수가 없는 문제점이 있고, 또한 FFT 및 셉트럼 분석을 행해야만 하므로 이로 인해 회로구성이 복잡해지며 실시간 구현이 용이하지 못한 문제점이 있었다.

따라서 본 발명은 상기한 종래기술의 문제점을 해결코자하여 제안된 것으로서, 모노(Mono) 상태로 녹음된 영화 또는 TV드라마에서 대사부분만을 추출할 수 있도록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 함으로써 보다 탁월한 오디오/비디오(A/V) 음장 재생을 행할 수 있도록함을 그 목적으로 하는 것이다.

상기한 목적을 달성하기 위한 본 발명을 첨부된 도면에 의하여 상세히 설명하면 다음과 같다.

제2도는 본 발명에 의한 음성신호추출장치의 블록구성도를 나타낸 것으로서, 입력되는 신호중 특정 주파수 대역신호(100Hz~4KHz)만을 통과시키는 다수개의 대역통과필터(101,102,....10n)와, 상기 다수개의 대역통과필터(101,102,....10n)를 통과한 신호가 음성신호인가 여부를 판별하여 음성신호인 경우에는 입력신호를 그대로 출력시키고 음성신호가 아닌 경우에는 ψ를 출력하는 다수개의 추출기(111,112,....11n)와, 상기 다수개의 추출기(111,112,....11n)의 출력신호를 가산하여 음성신호만을 추출하는 가산기(201)로 구성되어져 있다.

또한 상기한 단일의 추출기(111)는 제3도에 도시한 바와 같이 상기 대역통과필터(101)를 통과한 신호의 절대값을 적분하는 적분기(111a)와, 상기 적분기(111a)의 출력신호와 기준신호(Rf)를 비교하여 적분기(111a)의 출력신호가 기준신호(Rf)보다 크면 음성신호로 판별하여 상기 대역통과필터(101)를 통과한 신호를 그대로 멀티플렉서(111c)에 출력하고, 기준신호(Rf)보다 작으면 ψ신호를 멀티플렉서(111c)에 출력하는 비교기(111b)와, 상기 비교기(111b)의 출력제어신호에 따라 입력신호와 ψ신호를 선택적으로 출력하는 멀티플렉서(111c)로 구성되어져 있다.

이와 같이 구성된 본 발명의 동작 및 작용효과를 제4도를 참조하여 설명하면 다음과 같다.

예로서 모노(Mono)로 녹음된 영화나 TV드라마의 오디오신호에는 대사, 배경음악 그리고 효과음이 개별적 혹은 한꺼번에 송출될 수가 있다.

대사, 배경음악, 효과음이 개별적으로 송출될 때에는 종래의 경우에도 대사부분의 추출이 가능하지만 세가지 신호가 한꺼번에 송출될때에는 대사부분을 추출할 수가 없었다.

따라서 본 발명은 상기 신호들이 개별적 또는 동시에 출력되던지 상관없이 대사(음성신호)부분만을 추출할 수 있도록 한 것이다.

일반적으로 사람의 음성신호 주파수 대역은 제4도에 도시한 바와 같이 100Hz~4KHz로서, 영화나 TV드라마에서 상기 세가지 신호가 동시에 출력될 때 대사부분은 배경음악이나 효과음보다 에너지가 높다.

그러나 배경음악이나 효과음의 주파수 대역은 구성음의 특성에 따라 음성대역에 겹치는 부분이 존재하게 된다.

이러한 배경하에 본 발명에서는 음성대역내에서 배경음악이나 효과음을 제거하기 위해 다수개의 대역통과필터를 사용하여 입력신호를 다수개의 대역신호로 분리하고, 이와 같이 분리된 각 신호가 음성신호인지 여부를 판별하여 음성신호에 해당하는 대역의 신호만을 가산하여 음성신호를 추출하는 것이다.

상기한 음성신호 판별은 일정구간 대역통과필터의 출력신호의 절대값을 적분한 값이 기준값보다 크면 대역통과필터의 출력신호는 가산기로 입력되고, 만일 기준값보다 작으면 음성신호가 아닌 것으로 판별하여 그 대역의 신호는 음성신호 부분에서 삭제된다.

본 발명의 동작을 보다 구체적으로 설명하면 다음과 같다.

제2도에서와 같이 입력신호가 다수개의 대역통과필터(101,102,....10n)에 입력되면 각 대역통과필터의 통과대역은 사람의 음성대역을 필터의 설치 개수만큼 분할함으로써 각각의 필터는 해당대역의 신호를 추출하게 된다.

상기 추출된 신호들은 절대값으로 변환된 후 제3도에 도시된 적분기(111a)를 통해 적분된다.

이와 같이 적분을 하게 되면 이 신호의 일정구간 에너지를 구할 수가 있다.

상기 적분기(111a)의 출력은 비교기(111b)에 입력되어 기준값(Rf)과 비교하게 된다.

이때 상기 적분기(111a)를 통해 출력되는 적분값이 기준값(Rf)보다 클때에는 비교기(111b)에서 음성신호로 인식하여 멀티플렉서(111c)에서는 대역통과필터(101)의 출력신호를 가산기(201)에 입력시키게 된다.

한편 상기 적분값이 기준값(Rf)보다 작을때에는 비교기(111b)에서 음성신호가 아닌 것으로 인식하여 멀티플렉서(111c)에서는 ψ신호를 가산기(201)에 입력시키게 된다.

이와 같은 일련의 동작은 대역의 신호가 효과음 또는 배경음악인 것으로 간주하여 제거하기 위한 것이다.

즉 본 발명에서는 다수개의 필터(101~10n)의 각 출력이 음성신호인지 여부를 적분기(111a)와 비교기(111b)에 의해 판별한 후, 음성신호라고 판별된 대역의 신호들만 멀티플렉서(111c)를 통과하여 가산기(201)에 의해 합성된 후 음성신호만을 추출하게 되는 것이다.

이상에서와 같이 본 발명은 모노상태로 녹음된 영화나 TV드라마에서 대사부분만을 추출이 가능토록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 할 수가 있는 것이어서 종래기술에 비하여 보다 탁월한 오디오/비디오(A/V)음장 재생특성을 제공할 수가 있다.

Claims

입력되는 신호중 특정주파수 대역신호(100Hz~100Hz)만을 통과시키는 다수개의 대역통과필터(101,102,....10n)와, 상기 다수개의 대역통과필터(101,102,....10n)를 통과한 신호가 음성신호인가 여부를 판별하여 음성신호인경우에는 입력신호를 그대로 출력시키고 음성신호가 아닌 경우에는 ψ를 출력하는 다수개의 추출기(111,112,....11n)와, 상기 다수개의 추출기(111,112,....11n)의 출력신호를 가산하여 음성신호만을 추출하는 가산기(201)로 구성됨을 특징으로 하는 음성신호 추출장치.
제1항에 있어서, 상기 단일의 추출기(111)는 대역통과필터(101)를 통과한 신호의 절대값을 적분하는 적분기(111a)와, 상기 적분기(111a)의 출력신호와 기준신호(Rf)를 비교하여 적분기(111a)의 출력신호가 기준신호(Rf)보다 크면 음성신호로 판별하여 상기 대역통과필터(101)를 통과한 신호를 그대로 멀티플렉서(111c)에 출력하고, 기준신호(Rf)보다 작으면 ψ신호를 멀티플렉서(111c)에 출력하는 비교기(111b)와, 상기 비교기(111b)의 출력제어신호에 따라 입력신호와 ψ신호를 선택적으로 출력하는 멀티플렉서(111c)로 구성된 음성신호 추출장치.