KR20110047852A

KR20110047852A - 동작 환경에 적응 가능한 음원녹음장치 및 그 방법

Info

Publication number: KR20110047852A
Application number: KR1020090104638A
Authority: KR
Inventors: 신기훈
Original assignee: 삼성전자주식회사
Priority date: 2009-10-30
Filing date: 2009-10-30
Publication date: 2011-05-09
Also published as: US20110103617A1; US8913761B2

Abstract

음원 특성이나 주변 잡음에 의한 영향을 받지 않고 일정한 레벨로 대상 음원을 녹음할 수 있는 동작 환경에 적응 가능한 음원녹음장치 및 방법을 개시한다. 마이크로폰 어레이에 수신된 음원 신호에서 대상 음원을 분리하고, 그 대상 음원에 대해 기준 음압레벨과 기준 거리를 이용하여 녹음 음압레벨과 게인을 각각 추정함으로서 마이크로폰의 게인을 조절할 수 있다.

음원 거리, 음원 녹음, 마이크로폰, 게인, 음압레벨

Description

동작 환경에 적응 가능한 음원녹음장치 및 그 방법{Method and Apparatus for recording sound source adaptable to operation environment}

본 발명은 음원 특성이나 주변 잡음의 영향으로부터 벗어나서 일정한 레벨로 대상 음원을 녹음을 할 수 있는 동작 환경에 적응 가능한 음원녹음장치 및 방법에 관한 것이다.

디지털 기술의 발달에 따라 캠코더, 디지털 카메라와 같은 휴대 기기에서 동영상 촬영할 때 음성 녹음할 수 있다. 또한 홈 네트워크 기술의 발달에 힘입어 가정에서 인간과 함께 생활하며 청소, 심부름 등 가사를 지원해 주는 홈 서비스 로봇과 같은 지능형 로봇이 음성 인식에 기반하여 주어진 작업을 수행하기도 한다.

음원 녹음 기능을 갖춘 기기가 보통 마이크로폰으로 음원 신호를 수신하며, 수신 음원의 음원 세기(intensity)가 음원 거리에 따라 변화된다. 음원이 다가오고 마이크로폰의 게인이 일정하면 음원 신호를 샘플링할 때 소리의 일부가 잘리는 클리핑 현상이 발생됨에 따라 음원 인식률이 떨어진다.

음원 거리에 맞는 최적 게인을 저장해 둔 후, 마이크로폰에 수신되는 음원 세기가 일정 레벨보다 크면 마이크로폰의 게인을 감소시켜 실제 녹음하는 음원 레벨을 작게 하고 음원 세기가 일정 레벨보다 작으면 마이크로폰의 게인을 증가시켜 실제 녹음하는 음원 레벨을 크게 하는 게인 조절을 통하여 음원 거리에 따라 마이크로폰의 게인을 보상하는 것을 고려할 수 있다.

실내나 실외에서 동작하는 대부분의 경우에서 기기 본체에 장착된 마이크로폰에 화자의 음성과 함께 다수의 음원 신호가 들어온다.

일반적으로 가정에서 흔히 접할 수 있는 가전제품(TV, 에어콘, 세탁기, 전화)에서 발생하는 각종 소음 외에도 초인종, 외부소음, 가족간 대화 등 다양한 잡음이 존재하는 동작 환경에서 마이크로폰에 수신되는 음원 세기에만 의존하여 마이크로폰의 게인을 조절하여 대처하는 것은 별 쓸모가 없다. 화자가 일정 거리에서 적정 레벨로 발음하고 있어도 일시적으로 솟구치거나 낮아지는 주변 잡음의 레벨 변화로 인하여 마이크로폰의 게인이 자동으로 조절되므로 녹음된 화자의 음성 레벨은 일정치 못할 수 있기 때문이다.

음원 거리가 동일하더라도 음원 특성이 다를 수 있기 때문에, 예를 들어 화자가 발성하는 음량 차이가 있으므로 단순히 음원 거리에 따라 마이크로폰의 게인을 조절하는 것만으로는 만족스러운 결과를 얻을 수 없다.

본 발명의 일 측면은 음원 특성이나 실내나 실외에서 발생하는 주변 잡음에 의한 영향을 받지 않고 일정한 레벨로 음원 녹음하는 것이다.

본 발명의 다른 측면은 수신된 음원에서 대상 음원을 분리하고 그 대상 음원에 대해 음원 거리에 따라 마이크로폰의 게인을 조절하는 것이다.

본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음방법은, 음원 수신부에 수신된 음원 신호로부터 대상 음원을 분리하고; 상기 대상 음원의 음원 세기를 조절하기 위한 게인을 추정하며; 상기 추정된 게인에 따라 음원 세기가 조절된 대상 음원을 녹음한다.

또한, 상기 음원 분리는 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용한다.

또한, 상기 게인 추정은 (식1)을 이용한다.

(식1)

여기서, L은 추정된 녹음 음압레벨, L_ref는 기준 음압레벨, d는 음원 거리, d_ref는 기준 거리, G는 추정된 게인, B는 상수이다.

또한, 상기 기준 음압레벨은 사전 설정되는 것이다.

또한, 상기 기준 음압레벨은 식(2)에 따라 얻어지는 실효적인 측정 음압레벨 로 재설정되는 것이다.

(식2)

여기서, L_T는 측정 음압레벨, E{ }는 기대값(평균값)이고, x_i[n]는 음원 신호(x_i)의 샘플링 값이다.

본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음방법은, 마이크로폰 어레이로 수신한 신호로부터 대상 음원을 분리하고; 상기 대상 음원의 음압레벨을 측정하며; 상기 측정 음압레벨과 사전 설정된 기준 음압레벨을 비교하고; 상기 측정 음압레벨과 상기 기준 음압레벨이 다르면 상기 기준 음압레벨을 재 설정하고, 재설정된 기준 음압레벨을 이용하여 녹음 음압레벨과 상기 마이크로폰의 게인을 각각 추정하고; 상기 추정된 게인에 따라 상기 마이크로폰의 게인을 조절하여 상기 대상 음원을 녹음한다.

또한, 상기 측정 음압레벨은 실효적인 음압레벨인 것이다.

또한, 상기 대상 음원에 대한 음원 거리가 변경되면 변경된 음원 거리에 따라 상기 녹음 음압레벨과 상기 마이크로폰의 게인을 다시 추정한다.

본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음방법은, 마이크로폰 어레이로 수신한 신호로부터 대상 음원을 분리하고; 상기 대상 음원에 대하여 음압레벨과 음원 거리를 측정하며; 상기 측정 음압레벨로 기준 음압레벨을 최초 설정하고, 상기 측정 음원 거리로 기준 거리를 최초 설정하며; 상기 최초 설정된 기 준 음압레벨 및 기준 거리를 이용하여 녹음 음압레벨과 상기 마이크로폰의 게인을 각각 추정하고; 상기 추정된 게인에 따라 상기 마이크로폰의 게인을 조절하여 상기 대상 음원을 녹음한다.

본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음장치는, 마이크로폰 어레이로 음원 신호를 수신하는 음원 수신부; 상기 수신 음원의 음원 세기를 조절하기 위해 게인 제어신호에 따라 상기 마이크로폰의 게인을 조절하는 게인 조절부; 상기 대상 음원에 대한 음원 거리를 측정하는 거리 측정부; 상기 수신 음원에서 대상 음원을 분리하고, 분리된 대상 음원을 분석하여 상기 마이크로폰의 게인을 추정하고, 상기 거리 측정부에 의해 측정되는 음원 거리가 변경되면 상기 마이크로폰의 게인을 다시 추정하고, 추정된 마이크로폰의 게인에 따라 상기 게인 제어신호를 제공하는 제어부를 포함한다.

또한, 상기 제어부는, 상기 수신된 음원 신호에서 대상 음원을 분리하는 음원 분리부와, 상기 대상 음원의 음압레벨을 측정하는 측정 음압레벨 계산부와, 상기 측정 음압레벨 계산부의 측정 음압레벨과 사전 설정된 기준 음압레벨이 다르면 상기 측정 음압레벨로 기준 음압레벨을 재설정하는 기준레벨 설정부와, 상기 사전 설정된 기준 음압레벨이나 재설정된 기준 음압레벨을 이용하여 녹음 음압레벨을 추정하는 녹음 음압레벨 추정부와, 상기 추정된 녹음 음압레벨을 이용하여 상기 마이크로폰의 게인을 추정하는 게인 추정부를 포함한다.

또한, 상기 음원 분리부는 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용하여 음원 분리한다.

또한, 상기 녹음 음압레벨 추정부와 상기 게인 추정부는 (식1)을 이용하여 녹음 읍압레벨과 게인을 각각 추정한다.

(식1)

또한, 상기 수신된 음원 신호를 샘플링하여 디지털 변환하는 신호 변환부를 더 포함하고,

상기 측정 음압레벨 계산부는 대상 음원의 샘플링 신호로 (식2)를 이용하여 실효적인 측정 음압레벨(L_T)을 계산하는 동작 환경에 적응 가능한 음원녹음장치.

(식2)

또한, 상기 제어부는 상기 대상 음원에 대해 측정하여 얻은 음압레벨과 음원 거리로 각각 최초 설정된 기준 음압레벨과 최초 설정된 기준 거리를 이용하여 녹음 음압레벨을 추정하고, 추정된 녹음 음압레벨을 이용하여 상기 마이크로폰의 게인을 추정한다.

이와 같은 실시 예에 따르면 동작 환경에 적응적으로 마이크로폰의 게인 조절을 통하여 일정한 레벨로 음원 녹음하므로, 음원 녹음기나 동영상 촬영기기가 일정하고 고른 음원 세기로 음원을 재생할 수 있고, 지능형 로봇에서 일정한 레벨로 녹음된 음원에 대한 인식 성능을 높일 수 있다.

이하 본 발명의 실시 예를 첨부된 도면을 참조하여 상세히 설명한다.

도 1은 본 발명의 실시 예에 따른 음원녹음장치를 이용하여 음원 녹음하는 동작을 설명하는 도면이고, 도 2는 본 발명의 실시 예에 따른 음원녹음장치의 마이크로폰 어레이와 화자 사이의 음원 거리를 설명하기 위한 도면이다.

도 1에 도시한 바와 같이, 음원녹음장치(1)가 가사를 지원하는 홈 서비스 로봇에 구현된 경우로서, 화자(2)가 음성으로 작업 명령을 로봇에게 주면 그 음성을 녹음할 수 있다. 실시 예와 같이 음원녹음장치(1)가 홈 서비스 로봇에만 적용되는 것은 아니고 캠코더, 디지털 카메라 등 동영상 촬영기기나 음원 녹음기에 적용될 수 있다.

실내나 실외에 사용하는 음원녹음장치(1)의 동작 환경에서 대부분의 경우 화자(2)를 포함하여 여러 가지 음원에서 발생된 소리에 의한 영향을 고려해야 한다. 예를 들어 다양한 가전제품(TV, 에어콘, 세탁기, 전화)이나 사무기기(프린터, 팩시밀리)들이 갖춰진 가정이나 사무실과 같은 실내 환경 또는 바람이나 차량 소음이 있는 실외 환경에서 다양한 잡음을 배제시킬 필요가 있다.

실시 예에서 마이크로폰 어레이(11)를 이용하여 많은 음원으로부터 발생된 음원 신호를 수신하고, 수신된 음원 신호로부터 녹음하려는 대상 음원을 분리한다.

음원 분리는 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용할 수 있다.

도 2에 도시한 바와 같이, 음원녹음장치(1)가 적용된 로봇 본체 외곽에 마이크로폰 어레이(11)가 등간격으로 설치된다.

마이크로폰 어레이(11)에 수신한 음원 신호로부터 음원 분리하여 화자(2)의 음성을 추출하여도, 화자(2)와 마이크로폰 어레이(11) 사이의 음원 거리(d)는 화자의 이동에 따라 변경될 수 있으므로, 대상 음원을 녹음할 때 음원 거리에 따라 마이크로폰의 게인을 조절한다. 이러한 게인 조절을 위해 때 다음 (식1)에 따라 게인(G)을 추정한다.

(식1)

여기서, L은 음원 녹음할 때 적용하기 위해 추정된 녹음 음압레벨, L_ref는 기준 음압레벨, d는 거리 측정으로 측정된 음원 거리, d_ref는 기준 거리, G는 추정 게인, B는 상수이다. 기준 음압레벨(L_ref)과 기준 거리(d_ref)는 사전에 저장해 둘 수 있다.

동일 거리에서 사람에 따라 음량이 다른 음원 특성을 고려하여 일정한 레벨로 음원 녹음하려면, 마이크로폰 어레이(11)에 수신된 음원에 대한 기준 음압레벨이 적절하게 설정될 필요가 있다. 즉, 다수회의 시험을 거쳐 기준 음압레벨(L_ref)을 사전 설정해 두었더라도 실제 동작되는 환경에서 대상 음원에 맞지 않으면 기준 음압레벨(L_ref)을 재 설정하여 음원 녹음 시 반영할 필요가 있다.

기준 음압레벨의 재 설정 여부를 파악하기 위해 일정시간 동안 실효적인 음압레벨을 측정하고 그 측정값을 측정 음압레벨(L_T)로 결정하며, 이를 위해 (식2)를 이용한다.

(식2)

여기서, L_T는 측정 음압레벨, E{ }는 기대값(평균값)이고, x_i[n]는 분리된 음원 신호(x_i)의 샘플링 값이다.

분리된 음원의 측정 음압레벨(L_T)과 기준 음압레벨(L_ref)을 비교한 결과에 따라 새로운 기준 음압레벨을 재설정할 수 있다. 예를 들어 분리된 음원의 측정 음압레벨(L_T)이 기준 음압레벨(L_ref)과 동일하면 (식1)에 따라 녹음 음압레벨(L)을 추정하면 된다.

분리된 음원의 측정 음압레벨(L_T)이 기준 음압레벨(L_ref)과 다르면 (식2)에 의해 얻어진 측정 음압레벨(L_T)을 새로운 기준 음압레벨(L_ref)로 재설정하고 동시에 분리된 음원에 대하여 측정된 음원 거리(d)를 새로운 기준 거리(d_ref)로 재설정한다. 이렇게 재설정된 기준 음압레벨(L_ref)과 기준 거리(d_ref)를 가지고 (식1)에 따라 녹음 음압레벨(L)과 게인(G)을 각각 추정하고, 추정된 게인(G)에 따라 마이크로폰의 게인을 조절하면 된다.

이렇게 게인 조절하여 음원 녹음하는 동안, 화자(2)의 이동에 따라 측정되는 음원 거리(d)가 변경될 때 마다 그 변경된 음원 거리(d)로 (식1)을 이용하여 녹음 음압레벨과 게인을 다시 추정하여 마이크로폰의 게인 조절에 반영하게 된다.

도 3은 본 발명의 실시 예에 따른 음원녹음장치의 블록도이고, 도 4는 본 발명의 실시 예에 따른 음원녹음장치의 제어부의 블록도이다.

음원 수신부(10)는 적어도 하나의 마이크로폰을 포함하며, 실시 예는 로봇 본체 외곽에 등간격으로 설치된 마이크로폰들로 구성되는 마이크로폰 어레이(11)를 이용하여 적어도 하나의 음원으로부터 발생된 음원 신호를 수신한다.

게인 조절부(20)는 마이크로폰 어레이(11)에 수신된 음원 신호에 대응하여 마이크로폰의 게인을 조절하는 적어도 하나의 앰프를 포함하며, 이 앰프는 제어부(50)의 게인 제어신호에 따라 증폭률이 변화한다.

신호 변환부(30)는 게인 조절부(20)에 의해 게인 조절된 신호를 샘플링하여 디지털 변환하는 A/D 컨버터를 포함하며, 변환된 샘플링 신호를 제어부(50)와 저장부(60)에 제공한다.

거리 측정부(40)는 대상 음원으로부터 떨어진 음원 거리(d)를 측정하며, 실시 예에서 Time-of-flight(TOF) 카메라로 음원 거리(d)를 측정한다.

제어부(50)는 음성 수신부(10)를 통해 수신한 음원 신호를 분석하여 게인 조절부(20)에 게인 제어신호를 제공하고, 화자(2)의 음성을 인식하거나 입력부(70)를 통해 입력된 명령에 따라 주어진 작업을 처리한다. 입력부(70)는 사용자 인터페이스를 위한 버튼이나 터치스크린 등으로 구현할 수 있다.

저장부(60)는 음원 녹음을 위해 필요한 데이터를 저장하며, 이 데이터는 기준 음압레벨과 기준 거리를 포함한다.

도 4를 참고하여, 제어부(50)는 음원 분리부(51), 측정 음압레벨 계산부(52), 기준레벨 설정부(53), 녹음 음압레벨 추정부(54), 및 게인 추정부(55)를 포함한다.

마이크로폰 어레이(11)에 입력되는 음원 신호가 신호 변환부(30)에 의해 샘플링 신호로 변환되고 나서 음원 분리부(51)에 제공된다. 음원 분리부(51)에 제공되는 샘플링 신호에 대상 음원인 화자(2)의 음성 뿐만 아니라 주변 잡음이 섞여서 들어 있을 수 있으므로, 음원 분리부(51)는 대상 음원을 분리하여 추출한다. 이때 신호 소스에 대해 사전 정보 없이 여러 음원이 섞인 신호로부터 원하는 음원을 분리하는 BSS 기술을 사용하여 음원 분리할 수 있는데, 그 하나의 예로 ICA 알고리즘을 이용한다. 음원 분리된 음원의 샘플링 신호가 측정 음압레벨 계산부(52)에 제공된다.

측정 음압레벨 계산부(52)는 제공받은 분리된 음원의 샘플링 신호로 (식2)를 이용하여 실효적인 측정 음압레벨(L_T)을 계산하여 기준레벨 설정부(53)에 제공한다.

기준레벨 설정부(53)는 측정 음압레벨(L_T)과 저장부(60)로부터 제공받은 기준 음압레벨(L_ref)을 비교한 결과 동일하면 저장부(60)에 저장된 기준 음압레벨(L_ref)을 (식1)에서 사용하도록 설정한다. 비교 결과 측정 음압 레벨(L_T)과 저장부(60)에 저장된 기준 음압레벨(L_ref)이 다르면 기준 음압레벨을 재 설정한다. 즉, 기준레벨 설정부(53)는 대상 음원에 대한 측정 음압레벨(L_T)을 새로운 기준 음압레벨(L_ref)로 재설정하고 저장부(60)에 저장한다. 이와 함께 거리 측정부(40)에 의해 분리된 음원에 대해 측정된 거리(d)를 새로운 기준 거리(d_ref)로 재설정하고 저장부(6)에 저장한다.

사전 설정되거나 재 설정된 저장부(60)의 데이터를 제공받아 (식1)을 이용하여 녹음 음압레벨 추정부(54)에 의해 대상 음원의 녹음 음압레벨(L)이 추정되고 게인 추정부(55)에 의해 게인(G)이 추정된다. 제어부(50)는 추정 게인(G)에 따라 게인 제어신호를 게인 조절부(20)에 제공한다. 그러면 게인 조절부(20)가 게인 제어신호에 따라 마이크로폰의 게인을 조절한다. 그 결과 마이크로폰 어레이(11)에 수신되어 증폭되는 음원 신호가 변화되어 대상 음원의 세기가 조절된다.

음원 녹음하는 동안, 대상 음원인 화자(2)가 이동함에 따라 음원 거리(d)가 변경된다. 거리 측정부(40)에 의해 측정되는 변경된 음원 거리(d)에 기초하여 (식1)을 이용하여 녹음 음압레벨(L)과 게인(G)을 다시 추정하여 대상 음원에 대한 음원 세기를 적절하게 조절하는데 반영한다.

이렇게 음원 특성과 주변 잡음의 영향을 받지 않도록 음원 세기가 조절되는 대상 음원의 음원 신호가 저장부(60)에 저장되기 때문에 일정 레벨로 음원 녹음을 할 수 있다.

도 5는 본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음방법을 설명하기 위한 흐름도이다.

가사를 지원하는 홈 서비스 로봇에 음원녹음장치(1)가 구현된 경우의 예를 들어 설명하지만, 이에 한정하는 것은 아니고 동영상 촬영할 수 있는 기기에 적용할 수 있다. 실내 또는 실외 환경에서 대상 음원 뿐만 아니라 다양한 잡음이 발생하는 동작 환경에 로봇이 존재하는 경우, 로봇 본체 외곽에 설치된 마이크로폰 어레이(11)에 대상 음원인 화자(2)의 음성 뿐만 아니라 다양한 잡음을 포함하는 음원 신호가 수신되고, 수신된 신호는 신호 변환부(30)에 의해 샘플링되어 제어부(50)에 제공된다(101).

음원 분리부(51)가 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용하여 수신된 음원 신호에서 대상 음원을 분리한다(103).

측정 음압레벨 계산부(52)가 신호 변환부(30)에 의해 샘플링된 신호로 (식2)를 이용하여 측정 음압레벨(L_T)을 계산한다(105). 이 측정 음압레벨(L_T)과 저장부(60)에 사전 설정된 기준 음압레벨(L_ref)이 동일한지 비교하고, 측정 음압레벨(L_T)과 사전 설정된 기준 음압레벨(L_ref)이 다르면(107의 다름인 경우) 측정 음압레벨(L_T)을 새로운 기준 음압레벨(L_ref)로 재설정하기 위해 저장부(60)에 저장하고(109), 거리 측정부(40)에 의해 대상 음원에 대해 측정된 음원 거리(d)를 새로운 기준 거리(d_ref)로 재설정하기 위해 저장부(6)에 저장한다(111). 이렇게 재설정된 기준 음압레벨(L_ref) 및 기준 거리(d_ref)로 (식1)을 이용하여 녹음 음압레벨(L)을 추 정한다.

측정 음압레벨(L_T)과 사전 설정된 기준 음압레벨(L_ref)이 동일하면(107의 동일한 경우) 그 사전 설정된 기준 음압레벨(L_ref) 및 기준 거리(d_ref)로 (식1)을 이용하여 녹음 음압레벨(L)을 추정한다. 그런 다음 식(1)을 이용하여 게인(G)을 추정한다(113).

제어부(50)는 추정된 게인(G)에 따라 게인 제어신호를 게인 조절부(20)에 제공하여, 대상 음원에 대해 음원 세기를 조절하면서 음원 녹음한다(115).

음원 녹음하는 동안 거리 측정부(40)를 통해 측정된 음원 거리(d)의 변경이 없으면(117의 아니오), 계속해서 대상 음원을 녹음한다.

화자(2)의 이동으로 인하여 거리 측정부(40)를 통해 측정된 음원 거리(d)가 변경되면(117의 예), 변경된 음원 거리(d)에 따라 녹음 음압레벨(L)과 게인(G)을 다시 추정하고(119)(121), 다시 추정된 게인(G)에 따라 게인 제어신호를 게인 조절부(20)에 제공하여 대상 음원의 음원 세기를 적절하게 조절하여 음원 녹음한다.

지금까지 저장부(60)에 사전 설정된 기준 음압레벨(L_ref)과 기준 거리(d_ref)를 그대로 사용하거나 재설정하여 사용하는 방식에 대하여 설명한 것이나, 이에 한정하지 않고 음원녹음장치(1)로 측정된 실효적인 음압 레벨과 측정된 음원 거리로 기준 음압레벨(L_ref)과 기준 거리(d_ref)을 설정하고, 이를 이용하여 녹음 음압레벨(L)과 게인(G)을 각각 추정함으로서 마이크로폰의 게인을 조절하여 대상 음원을 녹음할 수 있다. 이는 음원녹음장치(1)에 하드웨어의 구성 추가 없이 구현이 가능하다. 이 를 도 6에 따라 설명한다.

도 6은 본 발명의 실시 예에 따른 동작 환경에 적응 가능한 음원녹음방법을 설명하기 위한 흐름도이다.

음원녹음장치(1)가 구현된 로봇 본체 외곽에 설치된 마이크로폰 어레이(11)에 대상 음원인 화자의 음성 뿐만 아니라 다양한 잡음을 포함하는 음원 신호가 수신되고, 수신 신호는 신호 변환부(30)에 의해 샘플링되어 제어부(50)에 제공된다(201).

음원 분리부(51)가 ICA 알고리즘을 이용하여 여러 음원 신호에서 대상 음원을 분리하고(203), 측정 음압레벨 계산부(52)가 대상 음원의 샘플링 신호로 (식2)를 이용하여 측정 음압레벨(L_T)을 계산한다(205). 이 측정 음압레벨(L_T)로 기준 음압레벨(L_ref)을 최초 설정하고, 저장부(60)에 저장한다(207). 또한 대상 음원에 대해 거리 측정부(40)에 의해 측정된 음원 거리(d)로 기준 거리(d_ref)을 최초 설정하고, 저장부(60)에 저장한다(209).

녹음 음압레벨 추정부(54)가 최초 설정된 기준 음압레벨(L_ref)과 최초 설정된 기준 거리(d_ref)로 (식1)에 따라 녹음 음압레벨(L)과 게인(G)을 각각 추정한다(211). 이때 추정 녹음 음압레벨(L)은 측정 음압레벨(L_T)과 동일하게 된다.

제어부(50)의 추정된 게인(G)에 따라 게인 제어신호를 게인 조절부(20)에 제공하면 게인 조절부(20)에 의해 음원 세기가 조절된 대상 음원을 녹음한다(213).

음원 녹음하는 동안 거리 측정부(40)를 통해 측정된 음원 거리(d)가 변경되지 않으면(215의 아니오), 계속해서 이전처럼 최초 설정된 기준 음압레벨(L_ref)과 기준 거리(d_ref)를 이용하여 추정한 게인에 따라 게인 조절하면서 대상 음원을 녹음한다.

화자(2)의 이동으로 거리 측정부(40)를 통해 측정된 음원 거리(d)가 변경되면(215의 예), 변경된 음원 거리(d)에 따라 녹음 음압레벨(L)과 게인(G)을 다시 추정하고(217)(219), 다시 추정된 게인(G)에 따라 게인 제어신호를 게인 조절부(20)에 제공하여 대상 음원의 음원 세기를 조절하면서 음원 녹음한다.

도 1은 본 발명의 실시 예에 따른 음원녹음장치를 이용하여 음원 녹음하는 동작을 설명하는 도면이다.

도 2는 본 발명의 실시 예에 따른 음원녹음장치의 마이크로폰 어레이와 화자 사이의 음원 거리를 설명하기 위한 도면이다.

도 3은 본 발명의 실시 예에 따른 음원녹음장치의 블록도이다.

도 4는 본 발명의 실시 예에 따른 음원녹음장치의 제어부의 블록도이다.

*도면의 주요부분에 대한 부호 설명*

1 : 음원녹음장치 2 : 화자

10 : 음원 수신부 11 : 마이크로폰 어레이

20 : 게인 조절부 30 : 신호 변환부

40 : 거리 측정부 50 : 제어부

60 : 저장부 70 : 입력부

Claims

음원 수신부에 수신된 음원 신호로부터 대상 음원을 분리하고;

상기 대상 음원의 음원 세기를 조절하기 위한 게인을 추정하며;

상기 추정된 게인에 따라 음원 세기가 조절된 대상 음원을 녹음하는 동작 환경에 적응 가능한 음원녹음방법.
제1항에 있어서,

상기 음원 분리는 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용하는 동작 환경에 적응 가능한 음원녹음방법.
제1항에 있어서,

상기 게인 추정은 (식1)을 이용하는 동작 환경에 적응 가능한 음원녹음방법.

(식1)

여기서, L은 추정된 녹음 음압레벨, L_ref는 기준 음압레벨, d는 음원 거리, d_ref는 기준 거리, G는 추정된 게인, B는 상수이다.
제3항에 있어서,

상기 기준 음압레벨은 사전 설정되는 동작 환경에 적응 가능한 음원녹음방법.
제3항에 있어서,

상기 기준 음압레벨은 식(2)에 따라 얻어지는 실효적인 측정 음압레벨로 재설정되는 동작 환경에 적응 가능한 음원녹음방법.

(식2)

여기서, L_T는 측정 음압레벨, E{ }는 기대값(평균값)이고, x_i[n]는 음원 신호(x_i)의 샘플링 값이다.
마이크로폰 어레이로 수신한 신호로부터 대상 음원을 분리하고;

상기 대상 음원의 음압레벨을 측정하며;

상기 측정 음압레벨과 사전 설정된 기준 음압레벨을 비교하고;

상기 측정 음압레벨과 상기 기준 음압레벨이 다르면 상기 기준 음압레벨을 재 설정하고, 재설정된 기준 음압레벨을 이용하여 녹음 음압레벨과 상기 마이크로폰의 게인을 각각 추정하고;

상기 추정된 게인에 따라 상기 마이크로폰의 게인을 조절하여 상기 대상 음원을 녹음하는 동작 환경에 적응 가능한 음원녹음방법.
제6항에 있어서,

상기 측정 음압레벨은 실효적인 음압레벨인 동작 환경에 적응 가능한 음원녹음방법.
제6항에 있어서,

상기 대상 음원에 대한 음원 거리가 변경되면 변경된 음원 거리에 따라 상기 녹음 음압레벨과 상기 마이크로폰의 게인을 다시 추정하는 동작 환경에 적응 가능한 음원녹음방법.
마이크로폰 어레이로 수신한 신호로부터 대상 음원을 분리하고;

상기 대상 음원에 대하여 음압레벨과 음원 거리를 측정하며;

상기 측정 음압레벨로 기준 음압레벨을 최초 설정하고, 상기 측정 음원 거리로 기준 거리를 최초 설정하며;

상기 최초 설정된 기준 음압레벨 및 기준 거리를 이용하여 녹음 음압레벨과 상기 마이크로폰의 게인을 각각 추정하고;

상기 추정된 게인에 따라 상기 마이크로폰의 게인을 조절하여 상기 대상 음원을 녹음하는 동작 환경에 적응 가능한 음원녹음방법.
제9항에 있어서,

상기 대상 음원에 대한 음원 거리가 변경되면 변경된 음원 거리에 따라 상기 녹음 음압레벨과 상기 마이크로폰의 게인을 다시 추정하는 동작 환경에 적응 가능한 음원녹음방법.
마이크로폰 어레이로 음원 신호를 수신하는 음원 수신부;

상기 수신 음원의 음원 세기를 조절하기 위해 게인 제어신호에 따라 상기 마이크로폰의 게인을 조절하는 게인 조절부;

상기 대상 음원에 대한 음원 거리를 측정하는 거리 측정부;

상기 수신 음원에서 대상 음원을 분리하고, 분리된 대상 음원을 분석하여 상기 마이크로폰의 게인을 추정하고, 상기 거리 측정부에 의해 측정되는 음원 거리가 변경되면 상기 마이크로폰의 게인을 다시 추정하고, 추정된 마이크로폰의 게인에 따라 상기 게인 제어신호를 제공하는 제어부를 포함하는 동작 환경에 적응 가능한 음원녹음장치.
제11항에 있어서,

상기 제어부는,

상기 수신된 음원 신호에서 대상 음원을 분리하는 음원 분리부와, 상기 대상 음원의 음압레벨을 측정하는 측정 음압레벨 계산부와, 상기 측정 음압레벨 계산부의 측정 음압레벨과 사전 설정된 기준 음압레벨이 다르면 상기 측정 음압레벨로 기준 음압레벨을 재설정하는 기준레벨 설정부와, 상기 사전 설정된 기준 음압레벨이나 재설정된 기준 음압레벨을 이용하여 녹음 음압레벨을 추정하는 녹음 음압레벨 추정부와, 상기 추정된 녹음 음압레벨을 이용하여 상기 마이크로폰의 게인을 추정하는 게인 추정부를 포함하는 동작 환경에 적응 가능한 음원녹음장치.
제12항에 있어서,

상기 음원 분리부는 브라인드 소스 세퍼레이션(blind source separation; BBS) 기술에 속하는 인디펜던트 콤포넌트 아날리시스(independent component analysis; ICA)과 지오메트릭 소스 세퍼레이션(geometric source separation; GSS) 중 어느 하나를 이용하여 음원 분리하는 동작 환경에 적응 가능한 음원녹음장치.
제12항에 있어서,

상기 녹음 음압레벨 추정부와 상기 게인 추정부는 (식1)을 이용하여 녹음 읍압레벨과 게인을 각각 추정하는 동작 환경에 적응 가능한 음원녹음장치.

(식1)

여기서, L은 추정된 녹음 음압레벨, L_ref는 기준 음압레벨, d는 음원 거리, d_ref는 기준 거리, G는 추정된 게인, B는 상수이다.
제12항에 있어서,

상기 수신된 음원 신호를 샘플링하여 디지털 변환하는 신호 변환부를 더 포함하고,

상기 측정 음압레벨 계산부는 대상 음원의 샘플링 신호로 (식2)를 이용하여 실효적인 측정 음압레벨(L_T)을 계산하는 동작 환경에 적응 가능한 음원녹음장치.

(식2)

여기서, L_T는 측정 음압레벨, E{ }는 기대값(평균값)이고, x_i[n]는 음원 신호(x_i)의 샘플링 값이다.
제11항에 있어서,

상기 제어부는 상기 대상 음원에 대해 측정하여 얻은 음압레벨과 음원 거리로 각각 최초 설정된 기준 음압레벨과 최초 설정된 기준 거리를 이용하여 녹음 음압레벨을 추정하고, 추정된 녹음 음압레벨을 이용하여 상기 마이크로폰의 게인을 추정하는 동작 환경에 적응 가능한 음원녹음장치.