KR101591704B1

KR101591704B1 - 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치

Info

Publication number: KR101591704B1
Application number: KR1020090119918A
Authority: KR
Inventors: 이준호
Original assignee: 삼성전자주식회사
Priority date: 2009-12-04
Filing date: 2009-12-04
Publication date: 2016-02-04
Also published as: KR20110063003A; US20140067384A1; US20110137658A1; US8583444B2

Abstract

두 개의 스테레오 신호 간 차 신호를 구하고, 차 신호의 주파수를 평활화(smoothing)하는 보컬 신호 제거 방법이 개시된다.

스테레오 신호, 보컬 신호, 홀

Description

스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치{Method and apparatus for cancelling vocal signal from audio signal}

본 발명은 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치에 대한 것으로, 보다 구체적으로는 주파수 평활 기법을 이용하여 스테레오 신호로부터 보컬 신호를 제거함으로써 보다 높은 음질의 반주 신호를 생성하는 보컬 신호 제거 방법 및 장치에 대한 것이다.

기술의 발달로 사용자들은 다양한 음향 기기들을 이용하여 음악을 즐길 수 있게 되었다. 이러한 음향 기기들은 단순히 음악을 재생하는 기능 외에도, 보컬 신호가 제거된 스테레오 신호를 제공하는 등 다양한 부가 기능을 제공한다.

원음에서 보컬 신호를 제거하는 방법으로 좌, 우 채널 신호의 차를 이용하는 신호 차감 기법이 널리 이용되고 있다. 이는 스테레오 신호가 보컬 신호와 악기들로 인한 연주 신호로 나눌 수 있으며 두 채널에 포함된 보컬 신호는 매우 유사하다는 점에 착안한 기법이다.

그러나 실제 두 채널의 공통 성분에는 보컬 신호뿐 아니라 배경 음악, 즉, 연주 신호도 포함되어 있기 때문에, 두 채널 간 신호 차감 기법을 이용하여 보컬 신호를 제거할 경우 보컬 신호 외에도 두 채널에 공통으로 포함되어 있는 연주 신호가 제거되어 연주 신호 일부가 손실되게 된다.

도 1은 신호 차감 기법에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다. 도 1의 스펙트로그램은 가로가 시간 축이고 세로가 주파수 축으로, 시간 축과 주파수 축의 변화에 따른 에너지의 진폭 차이를 농도로 나타낸다. 도 1에서 색이 밝은 부분은 에너지가 차 있는 것을 의미하고 색이 어두운 부분은 에너지가 비어 있는 것을 나타낸다. 도 1에는 신호 곳곳에 에너지가 비는 까만 부분들이 나타나 있음을 알 수 있다. 이러한 까만 부분들은 홀(hole)을 나타내며 불연속적인 홀은 뮤지컬 노이즈(musical noise)와 같은 왜곡의 원인이 된다. 도 1의 스펙트로그램에는 많은 불연속적인 주파수 홀(hole)들이 나타나는 것을 볼 수 있다. 따라서 이러한 홀들을 제거할 수 있는 방법 및 장치가 모색된다.

본 발명은 스테레오 신호로부터 보컬 신호를 제거할 때 발생하는 노이즈를 제거할 수 있는 보컬 신호 제거 방법 및 장치를 제공하기 위한 것이다.

본 발명의 일 측면에 따르면, 두 개의 스테레오 신호 간 차 신호를 구하는 단계; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 단계를 포함하는 보컬 신호 제거 방법을 제공할 수 있다.

바람직한 실시 예에서, 상기 차 신호의 주파수를 평활화하는 단계는 상기 차 신호를 이용하여 N개(N은 2 이상의 정수) 채널의 입력 신호를 생성하는 단계; 상기 N개 채널의 입력 신호에 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드 백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 단계; 상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 단계; 및 상기 N개 채널의 지연 신호에 상기 피드백 행렬을 적용하는 단계를 포함할 수 있다.

또한, 상기 방법은 상기 피드백 행렬이 적용된 상기 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 단계를 더 포함할 수 있다. 또한, 상기 N개의 지연 소자의 시간 지연 값들은 서로소가 될 수 있다.

또한, 상기 피드백 이득 행렬은 하다마드 행렬이 될 수 있다. 또한, 상기 피드백 이득 행렬은 직교 행렬이 될 수 있다.

또한, 상기 방법은 상기 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하는 단계를 더 포함할 수 있다. 또한, 상기 방법은 상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및 상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 모노 신호를 더하는 단계를 더 포함할 수 있다.

또한, 상기 스테레오 신호를 로우 패스 필터링하는 단계는 340Hz보다 작은 값의 차단 주파수를 갖는 로우 패스 필터로 상기 스테레오 신호를 필터링하는 단계를 포함할 수 있다.

본 발명의 다른 측면에 따르면, 두 개의 스테레오 신호 간 차 신호를 구하는 차 신호 생성부; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 평활화부를 포함하는 보컬 신호 제거 장치를 제공할 수 있다.

본 발명의 또 다른 측면에 따르면 두 개의 스테레오 신호 간 차 신호를 구하는 단계; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 단계를 포함하는 보컬 신호 제거 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 저장 매체를 제공할 수 있다.

본 발명에 따르면, 주파수 평활화를 이용하여 스테레오 신호로부터 보컬 신호를 효율적으로 제거할 수 있는 방법 및 장치를 제공할 수 있다.

또한, 본 발명에 따르면 적은 연산량으로 스테레오 신호로부터 보컬신호를 제거할 수 있는 방법 및 장치를 제공할 수 있다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.

도 2는 본 발명의 일 실시 예에 따른 보컬 신호 제거 장치(200)의 내부 블록도이다. 도 2의 보컬 신호 제거 장치(200)는 스테레오 신호 입력부(201, 202), 차 신호 생성부(203), 주파수 평활화부(204), 저 대역 통과 필터(205, 206) 및 신호 합산부(207, 208)를 포함한다.

보컬 신호 제거 장치(200)는 스테레오 신호를 사용자에게 출력할 수 있는 기기로, MP3 플레이어, PMP, CD 플레이어, DVD 플레이어, 통신 단말기 등이 될 수 있다.

스테레오 신호 입력부(201, 202)는 보컬 신호 장치(200)내의 메모리부(미도시)로부터 또는 통신망을 통해 외부 서버(미도시)로부터 스테레오 신호를 입력 받 는다. 두 개의 스테레오 신호 입력부(201, 202)는 좌, 우 두 개 채널의 스테레오 신호를 각각 입력 받는다.

차 신호 생성부(203)는 두 개의 스테레오 신호 간 차 신호를 구한다. 차 신호생성부(203)는 좌 채널의 스테레오 신호로부터 우 채널의 스테레오 신호를 빼거나 또는 그 반대로 우 채널의 스테레오 신호로부터 좌 채널의 스테레오 신호를 빼서 보컬이 제거된 차 신호를 생성한다.

다른 실시 예로, 차 신호 생성부(203)는 두 개의 스테레오 신호의 평균 값을 구하고, 두 개의 스테레오 신호 각각으로부터 평균 값을 차감함으로써 보컬이 제거된 차 신호를 생성할 수도 있다.

차 신호 생성부(203)는 생성된 차 신호를 주파수 평활화부(204)로 보낸다.

주파수 평활화부(204)는 차 신호에 존재하는 불연속적인 홀들을 제거하기 위해 주파수를 평활화한다. 주파수를 평활화(smoothing)한다는 것은 시계열의 불규칙 변동을 평준화시켜 보다 균일한 분포를 갖도록 명암 값 분포를 재분배하는 것을 말한다. 주파수 평활화부(204)는 차 신호의 에너지 변화를 억제하여 전반적으로 부드러운 변화 양상을 갖도록 하여 에너지 변동을 평준화시킨다.

주파수 평활화부(204)는 차 신호를 주파수 평활화 한 이후에 이를 두 개의 신호 합산부(207, 208)로 보낸다.

저 대역 통과 필터(205, 206)는 두 채널의 스테레오 신호 각각을 필터링한다. 저 대역 통과 필터(205, 206)는 보컬이 존재하지 않는 저주파 대역의 연주 음을 추출하기 위해 스테레오 신호에서 저 대역의 신호를 추출한다.

일반적으로 사람의 목소리는 340Hz에서 3.4KHz 사이의 주파수 성분을 가지므로 본 발명에서 저 대역 통과 필터(205, 206)는 340Hz와 같거나 이보다 작은 값을 차단 주파수로 갖는 것이 바람직하다. 저 대역 통과 필터(205, 206)는 필터링된 스테레오 신호를 신호 합산부(207, 208)로 보낸다.

도 2에는 도시하지 않았으나, 경우에 따라 보컬 신호 제거 장치(200)에는 고주파 대역의 연주 음을 추출하기 위해 고 대역 통과 필터가 더 포함될 수도 있다. 이 경우 고 대역 통과 필터는 3.4KHz와 같거나 이보다 큰 값을 차단 주파수로 갖는 것이 바람직하다.

신호 합산부(207, 208)는 저 대역 통과 필터(205, 206)에 의해 필터링된 저 대역의 스테레오 신호에 주파수 평활화부(204)를 통과한 차 신호를 각각 더하여 보컬 신호가 제거된 두 개의 스테레오 신호를 새로 생성한다.

도 2에 고 대역 통과 필터가 더 포함된 경우, 신호 합산부(207, 208)는 스테레오 신호를 생성할 때 고 대역 통과 필터에 의해 필터링된 고 대역의 스테레오 신호를 더할 수 있다.

이와 같이 본 발명의 일 실시 예에 의하면, 주파수 평활화 기법을 이용하여 차 신호의 주파수를 평활화함으로써 보다 균일한 분포를 갖는 연주 신호를 생성할 수 있다.

도 3은 도 2의 주파수 평활화부(204)의 내부 블록도이다. 도 3을 참조하면, 주파수 평활화부(204)는 합 신호 생성부(301), 지연 신호 생성부(302), 피드백 신호 생성부(303) 및 출력 신호 생성부(304)를 포함한다.

주파수 평활화부(204)는 도 2의 차 신호 생성부(203)에 의해 생성된 차 신호를 N개 채널의 입력 신호로 사용한다. 즉, N개 채널의 입력 신호는 모두 동일하다. 여기서 N은 2보다 크거나 같은 정수를 의미한다. 도 3은 N이 3인 경우를 도시한다.

합 신호 생성부(301)는 N개 채널의 입력 신호에, 피드백 신호 생성부(303)로부터 피드백된 N개 채널의 피드백 신호를 채널 별로 각각 더해 N개 채널의 합 신호를 생성한다. 합 신호 생성부(301)는 합 신호를 지연 신호 생성부(302)로 보낸다.

지연 신호 생성부(302)는 N개 채널의 합 신호 각각을 N개의 지연 소자들로 지연시킨다. N개의 지연 소자들은 서로 다른 지연 시간 값들을 가지며 이 지연 시간 값들은 서로 배수 관계에 있지 않는 것이 바람직하다. 즉, 지연 소자의 지연 시간 값들은 공약수를 갖지 않는 서로소인 것이 바람직하다. 주파수 평활화부(204)가 피드백을 반복하여 수행할 때, 지연 소자의 지연 시간 값들이 배수 관계에 있는 경우, 각 지연 시간 값들이 더해지게 되어 출력 신호 생성부(304)에서 생성되는 모노 신호 값이 커지기 때문이다.

피드백 신호 생성부(303)는 지연 신호 생성부(302)에 의해 생성된 N개 채널의 지연 신호에 피드백 이득 행렬을 적용하여 주파수 평활화를 수행한다. 피드백 이득 행렬은 각 채널의 에너지를 보존하면서 각 채널의 지연 신호들을 서로 믹싱하는 역할을 한다.

피드백 신호 생성부(303)는 피드백 이득 행렬로 직교 행렬을 이용할 수 있다. 직교 행렬은 행렬에 그 행렬의 전치 행렬을 곱했을 때 단위 행렬이 되는 행렬을 말한다. 또한, 피드백 신호 생성부(303)는 피드백 이득 행렬로 N차 하다마드 행 렬(hadamard matrix)을 이용할 수 있다. N차 하다마드 행렬은 크기가 N*N인 정방 행렬로, +1, -1로만 구성되며, 행렬과 그 행렬의 전치 행렬을 곱했을 때 그 값이 N배의 단위 행렬이 되는 행렬을 말한다.

피드백 신호 생성부(303)는 피드백 이득 행렬이 적용된 지연 신호에 게인 K를 곱하여 N개 채널의 피드백 신호를 생성한다. 여기서 게인 K는 1보다 작은 실수인 것이 바람직하다. K가 1보다 작은 실수여야 하는 이유는, 출력 신호 생성부(304)에 의해 생성된 모노 신호 값이 수렴하도록 하기 위함이다. 이에 대한 상세한 설명은 표 1을 참조하여 후술하기로 한다.

피드백 신호 생성부(303)는 N개 채널의 피드백 신호를 합 신호 생성부(301)로 피드백 한다.

합 신호 생성부(301)는 입력 신호에 피드백 신호 생성부(303)에 의해 생성된 피드백 신호들을 다시 더한 후 이를 지연 신호 생성부(302)로 보낸다.

주파수 평활화부(204)는 이 같은 과정을 반복하여 수행한다.

출력 신호 생성부(304)는 지연 신호 생성부(302)에 의해 생성된 N개 채널의 지연 신호들을 더하여 모노 신호를 생성한다. 출력 신호 생성부(304)에 의해 생성된 모노 신호는 신호 합산부(207)에 의해 저 대역 통과 필터(205, 206)를 거친 신호와 더해진다.

도 3의 주파수 평활화부(204)에 의해 생성되는 모노 신호 값이 수렴한다는 것을 아래 표 1을 참조하여 설명하기로 한다.

편의를 위해, 도 3에서 N이 2라고 가정한다. 또한, 입력 신호는 시간이 0인 지 점에서만 1의 크기를 갖고 나머지 시간에서는 0의 크기를 갖는 신호인 경우를 가정한다. 또한, 지연 소자의 시간 지연 값이 제1 채널에 대해서는 2, 제2 채널에 대해서는 3이라고 가정한다. 또한, 피드백 신호 생성부(303)에서 사용되는 피드백 이득 행렬은 2*2 하다마드 행렬

인 경우를 가정한다.

시간	입력 신호 값	합 신호 값 (301의 출력)	지연소자	지연 신호 값(302의 출력)	피드백 신호 값(303의 출력)	모노 신호 값 (304의 출력)
0	1		[1, 0] [1, 0, 0]			0
1	0		[0, 1] [0, 1, 0]			0
2	0		[0, 0] [0, 0, 1]			1
3	0		[K, 0] [K, 0, 0]			1
4	0		[K, K] [-K, K, 0]			0
5	0		[0, K] [0, -K, K]			K
6	0		[K^2, 0] [K^2, 0, -K]			2K
7	0		[2K^2, K^2] [0, K^2, 0]			-K
8	0		[-K^2, 2K^2] [K^2, 0, K^2]			K^2
9	0		[K^3, -K^2] [K^3, K^2, 0]			3K^2

표 1을 참조하여 설명하면, 시간이 0일 때, 입력 신호 1이 2개 채널에 각각 들어간다. 피드백 이득 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한 값이 1이 된다. 지연 신호 생성부(302)는 2개의 입력 신호를 제1 채널에 대해서는 2의 시간만큼, 제2 채널에 대해서는 3의 시간만큼 지연시킨다.

설명의 편의를 위해 지연 소자를 버퍼라고 생각하면, 두 채널 중 하나의 채널에 대한 지연 소자는 입력 신호 값 1을 버퍼에 저장하다가 현재 시각부터 2의 시간이 흐른 시점에 출력되도록 하고, 나머지 채널에 대한 지연 소자는 입력 신호 값 1을 버퍼에 저장하다가 현재 시각부터 3의 시간이 흐른 시점에 출력되도록 한다.

표 1의 "지연 소자" 란에는 두 개의 채널 중 제1 채널을 위에, 제2 채널을 아래에 각각 괄호로 표시하였으며, 각 괄호의 가장 왼쪽에 입력 신호의 값을 표시하고 시간이 1씩 흐를 때마다 괄호의 오른 쪽으로 입력 신호의 값이 이동하는 형태로 표시하였다. 즉, 표 1에서 "지연 소자" 란에 표시된 괄호를 버퍼라고 생각하면 버퍼는 현재 시점에서의 입력 신호 값을 버퍼의 맨 왼쪽에 저장하고 시간이 1씩 흐를 때마다 왼쪽에 저장되었던 값을 하나씩 오른쪽으로 옮기고, 더 이상 옮길 수가 없을 때 이 신호 값을 출력한다. 제1 채널에 대한 시간 지연 값이 2이고 제2 채널에 대한 시간 지연 값이 3이므로 표 1의 "지연 소자" 란의 두 괄호는 각각 2개, 3개의 간격을 갖는 괄호로 표기되어 있다.

시간이 0일 때, 지연 신호 생성부(302)를 통과한 지연 신호 값은 두 채널 모두 0이 된다. 출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 0인 경우, 두 채널의 지연 신호 값이 모두 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값 또한 0이 된다.

두 채널의 지연 신호 값을 2*1 벡터

으로 표시하면, 피드백 신호 생성부(303)는 피드백 이득 행렬

과 지연 신호 값을 표시하는 벡터

를 곱하고 그 결과에 게인 K를 곱하여 피드백 신호를 생성한다. 표 1에서 피드백 신호 값은

벡터가 된다.

이 피드백 신호는 합 신호 생성부(301)에서 시간이 1인 지점에서의 입력 신호 값과 더해진다.

시간이 1일 때 입력 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한

이 된다. 지연 소자는 각 괄호의 가장 왼쪽에 시간이 1일 때의 입력 신호의 값을 표시하고 이전의 입력 신호의 값을 한 칸 오른쪽으로 이동한다. 아직 버퍼 밖으로 출력된 값이 없으므로, 시간이 1일 때, 지연 신호 생성부(302)를 통과한 지연 신호 값은 두 채널 모두 0이 되어

로 표시된다.

피드백 신호 생성부(303)는 지연 신호 값

의 벡터에 피드백 이득 행렬을 곱하고, 게인 값 K를 곱하여 피드백 이득 신호

을 생성한다. 이 피드백 신호는 합 신호 생성부(301)에서 시간이 2인 지점에서의 입력 신호 값과 더해진다.

출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 1인 경우, 두 채널의 지연 신호 값이 모두 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값 또한 0이 된다.

시간이 2일 때 입력 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한

이 된다. 지연 소자는 각 괄호의 가장 왼쪽에 시간이 2일 때의 입력 신호의 값을 표시하고 이전의 입력 신호의 값 0을 오른쪽으로 한 칸 이동한다. 두 채널 중 제1 채널에 대한 지연 소자는 시간이 2인 지점에서의 입력 신호를 버퍼의 맨 왼쪽에 표시함에 따라 맨 오른쪽에 있던 신호 값 1을 버퍼 밖으로 밀어내어 제1 채널에 대한 지연 신호 생성부(302)의 출력 신호가 되도록 한다. 즉, 시간이 2일 때 지연 소자를 통과한 지연 신호 값은

의 벡터로 표시된다.

피드백 신호 생성부(303)는 지연 신호

의 벡터에 피드백 이득 행렬을 곱하여

벡터를 생성하고, 여기에 게인 값 K를 곱하여 피드백 신호

를 생성한다. 이 피드백 신호는 다시 합 신호 생성부(301)에서 시간이 3인 지점에서의 입력 신호 값과 더해진다.

출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 2인 경우, 두 채널의 지연 신호 값이 하나는 1, 나머지 하나는 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값은 1이 된다.이러한 과정을 반복하면 표 1에 표시된 바와 같이 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값이 K, K^2, K^3,...등과 같은 K의 지수 승에 정수 배 한 값으로 표시됨을 알 수 있다. K는 1보다 작은 게인 값이므로 지수 값이 증가할 수록 모노 신호 값 또한 지수함수적으로 감소하여 결국은 0이 되게 된다. 이는 차 신호의 주파수가 평활화됨을 의미한다.

도 4는 본 발명의 실시 예에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다. 도 4의 스펙트로그램은 가로가 시간 축이고 세로가 주파수 축으로, 시간 축과 주파수 축의 변화에 따른 에너지의 진폭 차이를 농도로 나타낸다. 도 1과 달리 도 4에는 신호 곳곳에 에너지가 비어 까맣게 나타나는 불연속적인 홀이 제거되었음을 알 수 있다. 즉, 에너지가 골고루 분포되어 있음을 알 수 있다.

도 5는 본 발명의 일 실시 예에 따른 보컬 신호 제거 방법을 도시한 순서도이다. 도 5를 참조하면, 보컬 신호 제거 장치(200)는 두 개의 스테레오 신호 각각에 대해 저 대역 필터로 필터링한다(단계 570). 예컨대, 보컬 신호 제거 장치(200)는 340Hz보다 작은 값의 차단 주파수를 갖는 저 대역 통과 필터로 스테레오 신호를 필터링할 수 있다.

또한, 보컬 신호 제거 장치(200)는 두 개의 스테레오 신호 간 차 신호를 구한다(단계 510). 보컬 신호 제거 장치(200)는 차 신호를 이용하여 N(N은 2 이상의 정수)개 채널의 입력 신호를 생성한다(단계 520).

보컬 신호 제거 장치(200)는 N개 채널의 입력 신호에, 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성한다(단계 530). 보컬 신호 제거 장치(200)는 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성한다(단계 540). 여기서 N개의 지연 소자의 시간 지연 값들은 서로소인 것이 바람직하다.

보컬 신호 제거 장치(200)는 N개 채널의 지연 신호에 피드백 행렬을 적용하고, 피드백 행렬이 적용된 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 피드백 이득 신호를 생성한다(단계 550). 피드백 이득 행렬은 직교 행렬이거나 하다마드 행렬이 될 수 있다.

보컬 신호 제거 장치(200)는 피드백 이득 신호를 입력 신호에 다시 더한다(단계 530). 보컬 신호 장치(200)는 이러한 과정을 반복한다.

한 편, 보컬 신호 제거 장치(200)는 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하고(단계 560), 로우 패스 필터링된 스테레오 신호 각각에 주파수 평활화된 모노 신호를 더하여, 보컬 신호가 제거된 스테레오 신호를 생성한다(단계 580).

이와 같이 본 발명의 실시 예에 따르면, 알고리즘의 복잡도가 낮고 적은 연산량으로 스테레오 신호로부터 보컬 신호를 효율적으로 제거할 수 있다. 즉, 컴플렉서티(complexity)가 낮다는 점에서 본 발명은 이동 단말이나 MP3와 같은 기기에서도 쉽게 구현될 수 있다.

이상 설명한 바와 같은 보컬 신호 제거 방법 및 장치는 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 기록 재생 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

도 1은 신호 차감 기법에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다.

도 2는 본 발명의 일 실시 예에 따른 보컬 신호 제거 장치(200)의 내부 블록도이다.

도 3은 도 2의 주파수 평활화부(204)의 내부 블록도이다.

도 4는 본 발명의 실시 예에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다.

도 5는 본 발명의 일 실시 예에 따른 보컬 신호 제거 방법을 도시한 순서도이다.

Claims

두 개의 스테레오 신호 간 차 신호를 구하는 단계;

상기 차 신호의 주파수를 평활화(smoothing)하는 단계;

상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및

상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차 신호를 더하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
제1 항에 있어서, 상기 차 신호의 주파수를 평활화하는 단계는

상기 차 신호를 이용하여 N개(N은 2 이상의 정수) 채널의 입력 신호를 생성하는 단계;

상기 N개 채널의 입력 신호에 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 단계;

상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 단계; 및

상기 N개 채널의 지연 신호에 상기 피드백 행렬을 적용하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
제2 항에 있어서, 상기 피드백 행렬이 적용된 상기 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
제2 항에 있어서, 상기 N개의 지연 소자의 시간 지연 값들은 서로소인 것을 특징으로 하는 보컬 신호 제거 방법.
제2 항에 있어서, 상기 피드백 이득 행렬은 하다마드 행렬인 것을 특징으로 하는 보컬 신호 제거 방법.
제2 항에 있어서, 상기 피드백 이득 행렬은 직교 행렬인 것을 특징으로 하는 보컬 신호 제거 방법.
제2 항에 있어서, 상기 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
삭제
제1항에 있어서, 상기 스테레오 신호를 로우 패스 필터링하는 단계는 340Hz보다 작은 값의 차단 주파수를 갖는 로우 패스 필터로 상기 스테레오 신호를 필터링하는 단계를 포함하는 것을 특징으로 하는 보컬 제거 방법.
두 개의 스테레오 신호 간 차 신호를 구하는 차 신호 생성부;

상기 차 신호의 주파수를 평활화(smoothing)하는 평활화부;

상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 LPF; 및

상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차신호를 더하여 보컬 신호가 제거된 스테레오 신호를 생성하는 모노 신호 생성부를 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
제10 항에 있어서, 상기 주파수를 평활화부는

상기 차 신호를 이용하여 생성된 N개(N은 2 이상의 정수) 채널의 입력 신호에, N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 합 신호 생성부;

상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 지연 신호 생성부; 및

상기 N개 채널의 지연 신호에 피드백 행렬을 적용하는 피드백 신호 생성부를 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
제11 항에 있어서, 상기 피드백 신호 생성부는 상기 피드백 행렬이 적용된 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 것을 특징으로 하는 보컬 신호 제거 장치.
제11 항에 있어서, 상기 N개의 지연 소자의 지연 시간 값들은 서로소인 것을 특징으로 하는 보컬 신호 제거 장치.
제11 항에 있어서, 상기 피드백 이득 행렬은 하다마드 행렬인 것을 특징으로 하는 보컬 신호 제거 장치.
제11 항에 있어서, 상기 피드백 이득 행렬은 직교 행렬인 것을 특징으로 하는 보컬 신호 제거 장치.
제11 항에 있어서, 상기 주파수 평활부는 N개 채널의 지연 신호를 더하여 주파수 평활화된 모노 신호를 생성하는 출력 신호 생성부를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
삭제
제10 항에 있어서, 상기 LPF는 340Hz보다 작은 값의 차단 주파수를 갖는 것을 특징으로 하는 보컬 신호 제거 장치.
두 개의 스테레오 신호 간 차 신호를 구하는 단계;

상기 차 신호의 주파수를 평활화(smoothing)하는 단계;

상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및

상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차 신호를 더하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 저장 매체.