KR101591704B1 - 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 - Google Patents
스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 Download PDFInfo
- Publication number
- KR101591704B1 KR101591704B1 KR1020090119918A KR20090119918A KR101591704B1 KR 101591704 B1 KR101591704 B1 KR 101591704B1 KR 1020090119918 A KR1020090119918 A KR 1020090119918A KR 20090119918 A KR20090119918 A KR 20090119918A KR 101591704 B1 KR101591704 B1 KR 101591704B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- signals
- feedback
- channels
- frequency
- Prior art date
Links
- 230000001755 vocal effect Effects 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005236 sound signal Effects 0.000 title 1
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims description 51
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 38
- 230000003111 delayed effect Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L21/00—Vacuum gauges
- G01L21/02—Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/04—Sound-producing devices
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Stereophonic System (AREA)
Abstract
두 개의 스테레오 신호 간 차 신호를 구하고, 차 신호의 주파수를 평활화(smoothing)하는 보컬 신호 제거 방법이 개시된다.
스테레오 신호, 보컬 신호, 홀
Description
본 발명은 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치에 대한 것으로, 보다 구체적으로는 주파수 평활 기법을 이용하여 스테레오 신호로부터 보컬 신호를 제거함으로써 보다 높은 음질의 반주 신호를 생성하는 보컬 신호 제거 방법 및 장치에 대한 것이다.
기술의 발달로 사용자들은 다양한 음향 기기들을 이용하여 음악을 즐길 수 있게 되었다. 이러한 음향 기기들은 단순히 음악을 재생하는 기능 외에도, 보컬 신호가 제거된 스테레오 신호를 제공하는 등 다양한 부가 기능을 제공한다.
원음에서 보컬 신호를 제거하는 방법으로 좌, 우 채널 신호의 차를 이용하는 신호 차감 기법이 널리 이용되고 있다. 이는 스테레오 신호가 보컬 신호와 악기들로 인한 연주 신호로 나눌 수 있으며 두 채널에 포함된 보컬 신호는 매우 유사하다는 점에 착안한 기법이다.
그러나 실제 두 채널의 공통 성분에는 보컬 신호뿐 아니라 배경 음악, 즉, 연주 신호도 포함되어 있기 때문에, 두 채널 간 신호 차감 기법을 이용하여 보컬 신호를 제거할 경우 보컬 신호 외에도 두 채널에 공통으로 포함되어 있는 연주 신호가 제거되어 연주 신호 일부가 손실되게 된다.
도 1은 신호 차감 기법에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다. 도 1의 스펙트로그램은 가로가 시간 축이고 세로가 주파수 축으로, 시간 축과 주파수 축의 변화에 따른 에너지의 진폭 차이를 농도로 나타낸다. 도 1에서 색이 밝은 부분은 에너지가 차 있는 것을 의미하고 색이 어두운 부분은 에너지가 비어 있는 것을 나타낸다. 도 1에는 신호 곳곳에 에너지가 비는 까만 부분들이 나타나 있음을 알 수 있다. 이러한 까만 부분들은 홀(hole)을 나타내며 불연속적인 홀은 뮤지컬 노이즈(musical noise)와 같은 왜곡의 원인이 된다. 도 1의 스펙트로그램에는 많은 불연속적인 주파수 홀(hole)들이 나타나는 것을 볼 수 있다. 따라서 이러한 홀들을 제거할 수 있는 방법 및 장치가 모색된다.
본 발명은 스테레오 신호로부터 보컬 신호를 제거할 때 발생하는 노이즈를 제거할 수 있는 보컬 신호 제거 방법 및 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 두 개의 스테레오 신호 간 차 신호를 구하는 단계; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 단계를 포함하는 보컬 신호 제거 방법을 제공할 수 있다.
바람직한 실시 예에서, 상기 차 신호의 주파수를 평활화하는 단계는 상기 차 신호를 이용하여 N개(N은 2 이상의 정수) 채널의 입력 신호를 생성하는 단계; 상기 N개 채널의 입력 신호에 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드 백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 단계; 상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 단계; 및 상기 N개 채널의 지연 신호에 상기 피드백 행렬을 적용하는 단계를 포함할 수 있다.
또한, 상기 방법은 상기 피드백 행렬이 적용된 상기 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 단계를 더 포함할 수 있다. 또한, 상기 N개의 지연 소자의 시간 지연 값들은 서로소가 될 수 있다.
또한, 상기 피드백 이득 행렬은 하다마드 행렬이 될 수 있다. 또한, 상기 피드백 이득 행렬은 직교 행렬이 될 수 있다.
또한, 상기 방법은 상기 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하는 단계를 더 포함할 수 있다. 또한, 상기 방법은 상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및 상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 모노 신호를 더하는 단계를 더 포함할 수 있다.
또한, 상기 스테레오 신호를 로우 패스 필터링하는 단계는 340Hz보다 작은 값의 차단 주파수를 갖는 로우 패스 필터로 상기 스테레오 신호를 필터링하는 단계를 포함할 수 있다.
본 발명의 다른 측면에 따르면, 두 개의 스테레오 신호 간 차 신호를 구하는 차 신호 생성부; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 평활화부를 포함하는 보컬 신호 제거 장치를 제공할 수 있다.
본 발명의 또 다른 측면에 따르면 두 개의 스테레오 신호 간 차 신호를 구하는 단계; 및 상기 차 신호의 주파수를 평활화(smoothing)하는 단계를 포함하는 보컬 신호 제거 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 저장 매체를 제공할 수 있다.
본 발명에 따르면, 주파수 평활화를 이용하여 스테레오 신호로부터 보컬 신호를 효율적으로 제거할 수 있는 방법 및 장치를 제공할 수 있다.
또한, 본 발명에 따르면 적은 연산량으로 스테레오 신호로부터 보컬신호를 제거할 수 있는 방법 및 장치를 제공할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.
도 2는 본 발명의 일 실시 예에 따른 보컬 신호 제거 장치(200)의 내부 블록도이다. 도 2의 보컬 신호 제거 장치(200)는 스테레오 신호 입력부(201, 202), 차 신호 생성부(203), 주파수 평활화부(204), 저 대역 통과 필터(205, 206) 및 신호 합산부(207, 208)를 포함한다.
보컬 신호 제거 장치(200)는 스테레오 신호를 사용자에게 출력할 수 있는 기기로, MP3 플레이어, PMP, CD 플레이어, DVD 플레이어, 통신 단말기 등이 될 수 있다.
스테레오 신호 입력부(201, 202)는 보컬 신호 장치(200)내의 메모리부(미도시)로부터 또는 통신망을 통해 외부 서버(미도시)로부터 스테레오 신호를 입력 받 는다. 두 개의 스테레오 신호 입력부(201, 202)는 좌, 우 두 개 채널의 스테레오 신호를 각각 입력 받는다.
차 신호 생성부(203)는 두 개의 스테레오 신호 간 차 신호를 구한다. 차 신호생성부(203)는 좌 채널의 스테레오 신호로부터 우 채널의 스테레오 신호를 빼거나 또는 그 반대로 우 채널의 스테레오 신호로부터 좌 채널의 스테레오 신호를 빼서 보컬이 제거된 차 신호를 생성한다.
다른 실시 예로, 차 신호 생성부(203)는 두 개의 스테레오 신호의 평균 값을 구하고, 두 개의 스테레오 신호 각각으로부터 평균 값을 차감함으로써 보컬이 제거된 차 신호를 생성할 수도 있다.
차 신호 생성부(203)는 생성된 차 신호를 주파수 평활화부(204)로 보낸다.
주파수 평활화부(204)는 차 신호에 존재하는 불연속적인 홀들을 제거하기 위해 주파수를 평활화한다. 주파수를 평활화(smoothing)한다는 것은 시계열의 불규칙 변동을 평준화시켜 보다 균일한 분포를 갖도록 명암 값 분포를 재분배하는 것을 말한다. 주파수 평활화부(204)는 차 신호의 에너지 변화를 억제하여 전반적으로 부드러운 변화 양상을 갖도록 하여 에너지 변동을 평준화시킨다.
주파수 평활화부(204)는 차 신호를 주파수 평활화 한 이후에 이를 두 개의 신호 합산부(207, 208)로 보낸다.
저 대역 통과 필터(205, 206)는 두 채널의 스테레오 신호 각각을 필터링한다. 저 대역 통과 필터(205, 206)는 보컬이 존재하지 않는 저주파 대역의 연주 음을 추출하기 위해 스테레오 신호에서 저 대역의 신호를 추출한다.
일반적으로 사람의 목소리는 340Hz에서 3.4KHz 사이의 주파수 성분을 가지므로 본 발명에서 저 대역 통과 필터(205, 206)는 340Hz와 같거나 이보다 작은 값을 차단 주파수로 갖는 것이 바람직하다. 저 대역 통과 필터(205, 206)는 필터링된 스테레오 신호를 신호 합산부(207, 208)로 보낸다.
도 2에는 도시하지 않았으나, 경우에 따라 보컬 신호 제거 장치(200)에는 고주파 대역의 연주 음을 추출하기 위해 고 대역 통과 필터가 더 포함될 수도 있다. 이 경우 고 대역 통과 필터는 3.4KHz와 같거나 이보다 큰 값을 차단 주파수로 갖는 것이 바람직하다.
신호 합산부(207, 208)는 저 대역 통과 필터(205, 206)에 의해 필터링된 저 대역의 스테레오 신호에 주파수 평활화부(204)를 통과한 차 신호를 각각 더하여 보컬 신호가 제거된 두 개의 스테레오 신호를 새로 생성한다.
도 2에 고 대역 통과 필터가 더 포함된 경우, 신호 합산부(207, 208)는 스테레오 신호를 생성할 때 고 대역 통과 필터에 의해 필터링된 고 대역의 스테레오 신호를 더할 수 있다.
이와 같이 본 발명의 일 실시 예에 의하면, 주파수 평활화 기법을 이용하여 차 신호의 주파수를 평활화함으로써 보다 균일한 분포를 갖는 연주 신호를 생성할 수 있다.
도 3은 도 2의 주파수 평활화부(204)의 내부 블록도이다. 도 3을 참조하면, 주파수 평활화부(204)는 합 신호 생성부(301), 지연 신호 생성부(302), 피드백 신호 생성부(303) 및 출력 신호 생성부(304)를 포함한다.
주파수 평활화부(204)는 도 2의 차 신호 생성부(203)에 의해 생성된 차 신호를 N개 채널의 입력 신호로 사용한다. 즉, N개 채널의 입력 신호는 모두 동일하다. 여기서 N은 2보다 크거나 같은 정수를 의미한다. 도 3은 N이 3인 경우를 도시한다.
합 신호 생성부(301)는 N개 채널의 입력 신호에, 피드백 신호 생성부(303)로부터 피드백된 N개 채널의 피드백 신호를 채널 별로 각각 더해 N개 채널의 합 신호를 생성한다. 합 신호 생성부(301)는 합 신호를 지연 신호 생성부(302)로 보낸다.
지연 신호 생성부(302)는 N개 채널의 합 신호 각각을 N개의 지연 소자들로 지연시킨다. N개의 지연 소자들은 서로 다른 지연 시간 값들을 가지며 이 지연 시간 값들은 서로 배수 관계에 있지 않는 것이 바람직하다. 즉, 지연 소자의 지연 시간 값들은 공약수를 갖지 않는 서로소인 것이 바람직하다. 주파수 평활화부(204)가 피드백을 반복하여 수행할 때, 지연 소자의 지연 시간 값들이 배수 관계에 있는 경우, 각 지연 시간 값들이 더해지게 되어 출력 신호 생성부(304)에서 생성되는 모노 신호 값이 커지기 때문이다.
피드백 신호 생성부(303)는 지연 신호 생성부(302)에 의해 생성된 N개 채널의 지연 신호에 피드백 이득 행렬을 적용하여 주파수 평활화를 수행한다. 피드백 이득 행렬은 각 채널의 에너지를 보존하면서 각 채널의 지연 신호들을 서로 믹싱하는 역할을 한다.
피드백 신호 생성부(303)는 피드백 이득 행렬로 직교 행렬을 이용할 수 있다. 직교 행렬은 행렬에 그 행렬의 전치 행렬을 곱했을 때 단위 행렬이 되는 행렬을 말한다. 또한, 피드백 신호 생성부(303)는 피드백 이득 행렬로 N차 하다마드 행 렬(hadamard matrix)을 이용할 수 있다. N차 하다마드 행렬은 크기가 N*N인 정방 행렬로, +1, -1로만 구성되며, 행렬과 그 행렬의 전치 행렬을 곱했을 때 그 값이 N배의 단위 행렬이 되는 행렬을 말한다.
피드백 신호 생성부(303)는 피드백 이득 행렬이 적용된 지연 신호에 게인 K를 곱하여 N개 채널의 피드백 신호를 생성한다. 여기서 게인 K는 1보다 작은 실수인 것이 바람직하다. K가 1보다 작은 실수여야 하는 이유는, 출력 신호 생성부(304)에 의해 생성된 모노 신호 값이 수렴하도록 하기 위함이다. 이에 대한 상세한 설명은 표 1을 참조하여 후술하기로 한다.
피드백 신호 생성부(303)는 N개 채널의 피드백 신호를 합 신호 생성부(301)로 피드백 한다.
합 신호 생성부(301)는 입력 신호에 피드백 신호 생성부(303)에 의해 생성된 피드백 신호들을 다시 더한 후 이를 지연 신호 생성부(302)로 보낸다.
주파수 평활화부(204)는 이 같은 과정을 반복하여 수행한다.
출력 신호 생성부(304)는 지연 신호 생성부(302)에 의해 생성된 N개 채널의 지연 신호들을 더하여 모노 신호를 생성한다. 출력 신호 생성부(304)에 의해 생성된 모노 신호는 신호 합산부(207)에 의해 저 대역 통과 필터(205, 206)를 거친 신호와 더해진다.
도 3의 주파수 평활화부(204)에 의해 생성되는 모노 신호 값이 수렴한다는 것을 아래 표 1을 참조하여 설명하기로 한다.
편의를 위해, 도 3에서 N이 2라고 가정한다. 또한, 입력 신호는 시간이 0인 지 점에서만 1의 크기를 갖고 나머지 시간에서는 0의 크기를 갖는 신호인 경우를 가정한다. 또한, 지연 소자의 시간 지연 값이 제1 채널에 대해서는 2, 제2 채널에 대해서는 3이라고 가정한다. 또한, 피드백 신호 생성부(303)에서 사용되는 피드백 이득 행렬은 2*2 하다마드 행렬인 경우를 가정한다.
시간 | 입력 신호 값 | 합 신호 값 (301의 출력) |
지연소자 | 지연 신호 값(302의 출력) |
피드백 신호 값(303의 출력) | 모노 신호 값 (304의 출력) |
0 | 1 | [1, 0] [1, 0, 0] |
0 | |||
1 | 0 | [0, 1] [0, 1, 0] |
0 | |||
2 | 0 | [0, 0] [0, 0, 1] |
1 | |||
3 | 0 | [K, 0] [K, 0, 0] |
1 | |||
4 | 0 | [K, K] [-K, K, 0] |
0 | |||
5 | 0 | [0, K] [0, -K, K] |
K | |||
6 | 0 | [K^2, 0] [K^2, 0, -K] |
2K | |||
7 | 0 | [2K^2, K^2] [0, K^2, 0] |
-K | |||
8 | 0 | [-K^2, 2K^2] [K^2, 0, K^2] |
K^2 | |||
9 | 0 | [K^3, -K^2] [K^3, K^2, 0] |
3K^2 |
표 1을 참조하여 설명하면, 시간이 0일 때, 입력 신호 1이 2개 채널에 각각 들어간다. 피드백 이득 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한 값이 1이 된다. 지연 신호 생성부(302)는 2개의 입력 신호를 제1 채널에 대해서는 2의 시간만큼, 제2 채널에 대해서는 3의 시간만큼 지연시킨다.
설명의 편의를 위해 지연 소자를 버퍼라고 생각하면, 두 채널 중 하나의 채널에 대한 지연 소자는 입력 신호 값 1을 버퍼에 저장하다가 현재 시각부터 2의 시간이 흐른 시점에 출력되도록 하고, 나머지 채널에 대한 지연 소자는 입력 신호 값 1을 버퍼에 저장하다가 현재 시각부터 3의 시간이 흐른 시점에 출력되도록 한다.
표 1의 "지연 소자" 란에는 두 개의 채널 중 제1 채널을 위에, 제2 채널을 아래에 각각 괄호로 표시하였으며, 각 괄호의 가장 왼쪽에 입력 신호의 값을 표시하고 시간이 1씩 흐를 때마다 괄호의 오른 쪽으로 입력 신호의 값이 이동하는 형태로 표시하였다. 즉, 표 1에서 "지연 소자" 란에 표시된 괄호를 버퍼라고 생각하면 버퍼는 현재 시점에서의 입력 신호 값을 버퍼의 맨 왼쪽에 저장하고 시간이 1씩 흐를 때마다 왼쪽에 저장되었던 값을 하나씩 오른쪽으로 옮기고, 더 이상 옮길 수가 없을 때 이 신호 값을 출력한다. 제1 채널에 대한 시간 지연 값이 2이고 제2 채널에 대한 시간 지연 값이 3이므로 표 1의 "지연 소자" 란의 두 괄호는 각각 2개, 3개의 간격을 갖는 괄호로 표기되어 있다.
시간이 0일 때, 지연 신호 생성부(302)를 통과한 지연 신호 값은 두 채널 모두 0이 된다. 출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 0인 경우, 두 채널의 지연 신호 값이 모두 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값 또한 0이 된다.
두 채널의 지연 신호 값을 2*1 벡터 으로 표시하면, 피드백 신호 생성부(303)는 피드백 이득 행렬 과 지연 신호 값을 표시하는 벡터 를 곱하고 그 결과에 게인 K를 곱하여 피드백 신호를 생성한다. 표 1에서 피드백 신호 값은 벡터가 된다.
이 피드백 신호는 합 신호 생성부(301)에서 시간이 1인 지점에서의 입력 신호 값과 더해진다.
시간이 1일 때 입력 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한 이 된다. 지연 소자는 각 괄호의 가장 왼쪽에 시간이 1일 때의 입력 신호의 값을 표시하고 이전의 입력 신호의 값을 한 칸 오른쪽으로 이동한다. 아직 버퍼 밖으로 출력된 값이 없으므로, 시간이 1일 때, 지연 신호 생성부(302)를 통과한 지연 신호 값은 두 채널 모두 0이 되어 로 표시된다.
피드백 신호 생성부(303)는 지연 신호 값 의 벡터에 피드백 이득 행렬을 곱하고, 게인 값 K를 곱하여 피드백 이득 신호을 생성한다. 이 피드백 신호는 합 신호 생성부(301)에서 시간이 2인 지점에서의 입력 신호 값과 더해진다.
출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 1인 경우, 두 채널의 지연 신호 값이 모두 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값 또한 0이 된다.
시간이 2일 때 입력 신호 값이 0이므로 합 신호 생성부(301)를 통과한 신호 또한 이 된다. 지연 소자는 각 괄호의 가장 왼쪽에 시간이 2일 때의 입력 신호의 값을 표시하고 이전의 입력 신호의 값 0을 오른쪽으로 한 칸 이동한다. 두 채널 중 제1 채널에 대한 지연 소자는 시간이 2인 지점에서의 입력 신호를 버퍼의 맨 왼쪽에 표시함에 따라 맨 오른쪽에 있던 신호 값 1을 버퍼 밖으로 밀어내어 제1 채널에 대한 지연 신호 생성부(302)의 출력 신호가 되도록 한다. 즉, 시간이 2일 때 지연 소자를 통과한 지연 신호 값은 의 벡터로 표시된다.
피드백 신호 생성부(303)는 지연 신호 의 벡터에 피드백 이득 행렬을 곱하여 벡터를 생성하고, 여기에 게인 값 K를 곱하여 피드백 신호 를 생성한다. 이 피드백 신호는 다시 합 신호 생성부(301)에서 시간이 3인 지점에서의 입력 신호 값과 더해진다.
출력 신호 생성부(304)는 두 채널의 지연 신호 값을 모두 더하여 하나의 신호 값을 생성한다. 시간이 2인 경우, 두 채널의 지연 신호 값이 하나는 1, 나머지 하나는 0이므로 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값은 1이 된다.이러한 과정을 반복하면 표 1에 표시된 바와 같이 출력 신호 생성부(304)에 의해 생성되는 모노 신호 값이 K, K^2, K^3,...등과 같은 K의 지수 승에 정수 배 한 값으로 표시됨을 알 수 있다. K는 1보다 작은 게인 값이므로 지수 값이 증가할 수록 모노 신호 값 또한 지수함수적으로 감소하여 결국은 0이 되게 된다. 이는 차 신호의 주파수가 평활화됨을 의미한다.
도 4는 본 발명의 실시 예에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다. 도 4의 스펙트로그램은 가로가 시간 축이고 세로가 주파수 축으로, 시간 축과 주파수 축의 변화에 따른 에너지의 진폭 차이를 농도로 나타낸다. 도 1과 달리 도 4에는 신호 곳곳에 에너지가 비어 까맣게 나타나는 불연속적인 홀이 제거되었음을 알 수 있다. 즉, 에너지가 골고루 분포되어 있음을 알 수 있다.
도 5는 본 발명의 일 실시 예에 따른 보컬 신호 제거 방법을 도시한 순서도이다. 도 5를 참조하면, 보컬 신호 제거 장치(200)는 두 개의 스테레오 신호 각각에 대해 저 대역 필터로 필터링한다(단계 570). 예컨대, 보컬 신호 제거 장치(200)는 340Hz보다 작은 값의 차단 주파수를 갖는 저 대역 통과 필터로 스테레오 신호를 필터링할 수 있다.
또한, 보컬 신호 제거 장치(200)는 두 개의 스테레오 신호 간 차 신호를 구한다(단계 510). 보컬 신호 제거 장치(200)는 차 신호를 이용하여 N(N은 2 이상의 정수)개 채널의 입력 신호를 생성한다(단계 520).
보컬 신호 제거 장치(200)는 N개 채널의 입력 신호에, 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성한다(단계 530). 보컬 신호 제거 장치(200)는 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성한다(단계 540). 여기서 N개의 지연 소자의 시간 지연 값들은 서로소인 것이 바람직하다.
보컬 신호 제거 장치(200)는 N개 채널의 지연 신호에 피드백 행렬을 적용하고, 피드백 행렬이 적용된 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 피드백 이득 신호를 생성한다(단계 550). 피드백 이득 행렬은 직교 행렬이거나 하다마드 행렬이 될 수 있다.
보컬 신호 제거 장치(200)는 피드백 이득 신호를 입력 신호에 다시 더한다(단계 530). 보컬 신호 장치(200)는 이러한 과정을 반복한다.
한 편, 보컬 신호 제거 장치(200)는 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하고(단계 560), 로우 패스 필터링된 스테레오 신호 각각에 주파수 평활화된 모노 신호를 더하여, 보컬 신호가 제거된 스테레오 신호를 생성한다(단계 580).
이와 같이 본 발명의 실시 예에 따르면, 알고리즘의 복잡도가 낮고 적은 연산량으로 스테레오 신호로부터 보컬 신호를 효율적으로 제거할 수 있다. 즉, 컴플렉서티(complexity)가 낮다는 점에서 본 발명은 이동 단말이나 MP3와 같은 기기에서도 쉽게 구현될 수 있다.
이상 설명한 바와 같은 보컬 신호 제거 방법 및 장치는 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 기록 재생 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 신호 차감 기법에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다.
도 2는 본 발명의 일 실시 예에 따른 보컬 신호 제거 장치(200)의 내부 블록도이다.
도 3은 도 2의 주파수 평활화부(204)의 내부 블록도이다.
도 4는 본 발명의 실시 예에 따라 원음에서 보컬 신호가 제거된 연주 신호에 대한 스펙트로그램(Spectrogram)이다.
도 5는 본 발명의 일 실시 예에 따른 보컬 신호 제거 방법을 도시한 순서도이다.
Claims (19)
- 두 개의 스테레오 신호 간 차 신호를 구하는 단계;상기 차 신호의 주파수를 평활화(smoothing)하는 단계;상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차 신호를 더하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
- 제1 항에 있어서, 상기 차 신호의 주파수를 평활화하는 단계는상기 차 신호를 이용하여 N개(N은 2 이상의 정수) 채널의 입력 신호를 생성하는 단계;상기 N개 채널의 입력 신호에 피드백 이득 행렬을 이용하여 생성된 N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 단계;상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 단계; 및상기 N개 채널의 지연 신호에 상기 피드백 행렬을 적용하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
- 제2 항에 있어서, 상기 피드백 행렬이 적용된 상기 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
- 제2 항에 있어서, 상기 N개의 지연 소자의 시간 지연 값들은 서로소인 것을 특징으로 하는 보컬 신호 제거 방법.
- 제2 항에 있어서, 상기 피드백 이득 행렬은 하다마드 행렬인 것을 특징으로 하는 보컬 신호 제거 방법.
- 제2 항에 있어서, 상기 피드백 이득 행렬은 직교 행렬인 것을 특징으로 하는 보컬 신호 제거 방법.
- 제2 항에 있어서, 상기 N개 채널의 지연 신호를 더하여 주파수 모노 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 방법.
- 삭제
- 제1항에 있어서, 상기 스테레오 신호를 로우 패스 필터링하는 단계는 340Hz보다 작은 값의 차단 주파수를 갖는 로우 패스 필터로 상기 스테레오 신호를 필터링하는 단계를 포함하는 것을 특징으로 하는 보컬 제거 방법.
- 두 개의 스테레오 신호 간 차 신호를 구하는 차 신호 생성부;상기 차 신호의 주파수를 평활화(smoothing)하는 평활화부;상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 LPF; 및상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차신호를 더하여 보컬 신호가 제거된 스테레오 신호를 생성하는 모노 신호 생성부를 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
- 제10 항에 있어서, 상기 주파수를 평활화부는상기 차 신호를 이용하여 생성된 N개(N은 2 이상의 정수) 채널의 입력 신호에, N개 채널의 피드백 신호를 각각 더하여 N개 채널의 합 신호를 생성하는 합 신호 생성부;상기 N개 채널의 합 신호를 N개의 지연 소자로 각각 지연 시켜 N개 채널의 지연 신호를 생성하는 지연 신호 생성부; 및상기 N개 채널의 지연 신호에 피드백 행렬을 적용하는 피드백 신호 생성부를 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
- 제11 항에 있어서, 상기 피드백 신호 생성부는 상기 피드백 행렬이 적용된 N개 채널의 지연 신호에 게인 K(K는 1보다 작은 실수)를 곱하여 상기 N개 채널의 피드백 신호를 생성하는 것을 특징으로 하는 보컬 신호 제거 장치.
- 제11 항에 있어서, 상기 N개의 지연 소자의 지연 시간 값들은 서로소인 것을 특징으로 하는 보컬 신호 제거 장치.
- 제11 항에 있어서, 상기 피드백 이득 행렬은 하다마드 행렬인 것을 특징으로 하는 보컬 신호 제거 장치.
- 제11 항에 있어서, 상기 피드백 이득 행렬은 직교 행렬인 것을 특징으로 하는 보컬 신호 제거 장치.
- 제11 항에 있어서, 상기 주파수 평활부는 N개 채널의 지연 신호를 더하여 주파수 평활화된 모노 신호를 생성하는 출력 신호 생성부를 더 포함하는 것을 특징으로 하는 보컬 신호 제거 장치.
- 삭제
- 제10 항에 있어서, 상기 LPF는 340Hz보다 작은 값의 차단 주파수를 갖는 것을 특징으로 하는 보컬 신호 제거 장치.
- 두 개의 스테레오 신호 간 차 신호를 구하는 단계;상기 차 신호의 주파수를 평활화(smoothing)하는 단계;상기 두 개의 스테레오 신호 각각을 로우 패스 필터링하는 단계; 및상기 로우 패스 필터링된 스테레오 신호 각각에 상기 주파수 평활화된 차 신호를 더하는 단계를 포함하는 것을 특징으로 하는 보컬 신호 제거 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 저장 매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090119918A KR101591704B1 (ko) | 2009-12-04 | 2009-12-04 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
US12/902,221 US8583444B2 (en) | 2009-12-04 | 2010-10-12 | Method and apparatus for canceling vocal signal from audio signal |
US14/075,815 US20140067384A1 (en) | 2009-12-04 | 2013-11-08 | Method and apparatus for canceling vocal signal from audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090119918A KR101591704B1 (ko) | 2009-12-04 | 2009-12-04 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110063003A KR20110063003A (ko) | 2011-06-10 |
KR101591704B1 true KR101591704B1 (ko) | 2016-02-04 |
Family
ID=44082882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090119918A KR101591704B1 (ko) | 2009-12-04 | 2009-12-04 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
US (2) | US8583444B2 (ko) |
KR (1) | KR101591704B1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101591704B1 (ko) * | 2009-12-04 | 2016-02-04 | 삼성전자주식회사 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
KR20120132342A (ko) * | 2011-05-25 | 2012-12-05 | 삼성전자주식회사 | 보컬 신호 제거 장치 및 방법 |
KR101803293B1 (ko) | 2011-09-09 | 2017-12-01 | 삼성전자주식회사 | 입체 음향 효과를 제공하는 신호 처리 장치 및 신호 처리 방법 |
US9071900B2 (en) | 2012-08-20 | 2015-06-30 | Nokia Technologies Oy | Multi-channel recording |
CN109185283B (zh) * | 2018-11-26 | 2019-09-03 | 中联重科股份有限公司 | 平滑过渡装置、控制系统、控制方法及工程机械 |
CN109534240B (zh) * | 2018-11-26 | 2020-01-31 | 中联重科股份有限公司 | 伸缩油缸、用于伸缩油缸的控制系统及工程机械 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100636248B1 (ko) * | 2005-09-26 | 2006-10-19 | 삼성전자주식회사 | 보컬 제거 장치 및 방법 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US6658112B1 (en) * | 1999-08-06 | 2003-12-02 | General Dynamics Decision Systems, Inc. | Voice decoder and method for detecting channel errors using spectral energy evolution |
US6251077B1 (en) * | 1999-08-13 | 2001-06-26 | General Electric Company | Method and apparatus for dynamic noise reduction for doppler audio output |
US7117145B1 (en) * | 2000-10-19 | 2006-10-03 | Lear Corporation | Adaptive filter for speech enhancement in a noisy environment |
US7660424B2 (en) * | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US7336793B2 (en) * | 2003-05-08 | 2008-02-26 | Harman International Industries, Incorporated | Loudspeaker system for virtual sound synthesis |
TWI231722B (en) | 2003-08-21 | 2005-04-21 | Mediatek Inc | Method and related apparatus for generating stereo output of vocal cancellation |
CA2581810C (en) * | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8121312B2 (en) * | 2006-03-14 | 2012-02-21 | Harman International Industries, Incorporated | Wide-band equalization system |
KR101591704B1 (ko) * | 2009-12-04 | 2016-02-04 | 삼성전자주식회사 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
EP2357649B1 (en) * | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
-
2009
- 2009-12-04 KR KR1020090119918A patent/KR101591704B1/ko not_active IP Right Cessation
-
2010
- 2010-10-12 US US12/902,221 patent/US8583444B2/en not_active Expired - Fee Related
-
2013
- 2013-11-08 US US14/075,815 patent/US20140067384A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100636248B1 (ko) * | 2005-09-26 | 2006-10-19 | 삼성전자주식회사 | 보컬 제거 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20110063003A (ko) | 2011-06-10 |
US20140067384A1 (en) | 2014-03-06 |
US20110137658A1 (en) | 2011-06-09 |
US8583444B2 (en) | 2013-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7378515B2 (ja) | ヘッドマウントスピーカのためのオーディオエンハンスメント | |
KR101591704B1 (ko) | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 | |
CN105830158B (zh) | 用于数字信号处理的系统和方法 | |
JP5607626B2 (ja) | パラメトリックステレオ変換システム及び方法 | |
US11109155B2 (en) | Bass enhancement | |
WO2007083201A1 (en) | A device for and a method of processing an audio data stream | |
CN112309426A (zh) | 语音处理模型训练方法及装置和语音处理方法及装置 | |
JP2008076988A (ja) | 低周波帯域音声復元装置、音声信号処理装置および録音機器 | |
US20080152153A1 (en) | Method for producing more than two electric time signals from one first and one second electric time signal | |
JP2008517317A (ja) | オーディオデータ処理システム、方法、プログラム要素、及びコンピュータ読み取り可能媒体 | |
JP2009513055A (ja) | オーディオデータ処理のための装置及び方法 | |
KR100750148B1 (ko) | 음성신호 제거 장치 및 그 방법 | |
KR20140017639A (ko) | 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램 | |
US20120020483A1 (en) | System and method for robust audio spatialization using frequency separation | |
TWI246866B (en) | Method and device for digital audio signal processing | |
JP2004343590A (ja) | ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体 | |
KR102089821B1 (ko) | 다중 채널 음성 시스템 내에서 다중 채널 음성을 처리하기 위한 방법 | |
JP2006005414A (ja) | 擬似ステレオ信号生成装置および擬似ステレオ信号生成プログラム | |
JP5463924B2 (ja) | 音響処理装置 | |
WO2024166710A1 (ja) | 音処理方法、音処理装置、および音処理プログラム | |
US8086448B1 (en) | Dynamic modification of a high-order perceptual attribute of an audio signal | |
CN118264954A (zh) | 音频处理方法、装置、设备和介质 | |
CN115942224A (zh) | 声场扩展方法和系统、电子设备 | |
JP6313629B2 (ja) | 音声信号処理装置、音声信号処理装置の制御方法およびプログラム | |
CN116074685A (zh) | 一种移动设备及其音频信号处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
LAPS | Lapse due to unpaid annual fee |