KR100735246B1

KR100735246B1 - 오디오 신호 전송 장치 및 방법

Info

Publication number: KR100735246B1
Application number: KR1020050084780A
Authority: KR
Inventors: 송근배; 김재범; 안철용; 박호종
Original assignee: 삼성전자주식회사
Priority date: 2005-09-12
Filing date: 2005-09-12
Publication date: 2007-07-03
Also published as: KR20070030035A; US20070088546A1

Abstract

본 발명은 이동 전화망에서 송수신되는 오디오 신호의 음질을 개선하기 위하여, 오디오 신호를 음성 부호화기에 입력하기 전에 전처리하는 오디오 신호 전송 장치 및 방법에 관한 것이다.

본 발명에 따른 오디오 신호 전송 장치는, 프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기; 상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 한다.

오디오 신호, 전처리, 필터 이득

Description

오디오 신호 전송 장치 및 방법{Apparatus and method for transmitting audio signal}

도 1과 도 2는 종래기술에 따른 오디오 신호 전송 장치의 구성도.

도 3은 본 발명에 따른 오디오 신호 전송 장치의 구성도.

도 4는 도 3의 전처리 필터(310)의 세부 구성도.

도 5와 도 6은 본 발명에 따른 주파수 분할의 일 실시 예.

도 7은 도 3의 필터 이득 및 스위치 제어기(316)의 세부 구성도.

도 8은 본 발명에 따른 필터 이득의 Smoothing의 일 실시 예.

도 9는 본 발명에 따른 오디오 신호 전송 방법의 흐름도.

본 발명은 오디오 신호 전송 장치 및 방법에 관한 것으로, 보다 상세하게는 이동 전화망에서 송수신되는 오디오 신호를 음성 부호화기에 입력하기 전에 전처리하는 오디오 신호 전송 장치 및 방법에 관한 것이다.

이동 전화망에서 사용되는 가변 전송률(Variable Rate) 음성 부호화기는 복 수의 전송률을 가지는 음성 패킷의 생성을 지원한다. 대표적인 가변 전송률 음성 부호화기는 부호 분할 다중 접속(Code Division Multiple Access : 이하 CDMA라 칭함) 시스템에 사용되는 퀄컴-CELP(QCELP)와 EVRC(Enhanced Variable Rate Codec)가 있다. 가변 전송률 음성 부호화기는 입력 음성 신호의 특성 또는 통신 시스템에서 요구하는 전송률에 따라 음성 패킷의 전송률을 선택하여 음성 신호를 압축하거나 복원할 수 있다. QCELP와 EVRC는 최대 전송률(Full Rate) 및 이를 기준으로 하여 1/2, 1/4 또는 1/8의 전송률을 가지는 음성 패킷을 생성한다. 이들은 모두 인간의 음성생성모델에 기반을 두고 만들어진 부호화기로서 음성신호를 압축하고 복호하는데 있어서는 최적의 성능을 나타내지만 음악과 같이 음성생성모델과 상이한 생성모델을 가지는 신호에 대해서는 성능이 떨어진다. 따라서 기존의 이동 전화망에서 오디오 신호를 송신하고 수신하고자 할 경우에는 음질저하를 완화시키기 위한 처리가 요구되고 있다.

도 1은 음성 부호화기를 사용하는 이동 전화망에서 오디오 신호의 음질저하를 완화시키기 위한 종래기술로서, 음악 검출기(112)를 사용하는 방법이다. 즉, 도 1에 도시된 바와 같이 음성 부호화기(114) 앞 단에 음악 검출기(112)를 구비하여, 입력신호

이 오디오 신호인지를 검출한다. 음악 검출기(112)에서 입력신호

이 오디오 신호라 판단되면 음성 부호화기(114)는 입력신호

을 최대 전송률로 압축하여 전송하고, 그렇지 않고 입력신호

이 음성신호일 경우에는 음성신호의 특성에 맞게 적당한 전송률로 압축하여 전송한다.

도 2는 음성 부호화기를 사용하는 이동 전화망에서 오디오 신호의 음질저하를 완화시키기 위한 다른 종래기술로서, 음성 부호화기(216) 앞 단에 전처리기(220)를 구비하여, 이동 전화망을 통해 전송하고자 하는 오디오 신호에 대해 사전에 음폭 압축(Dynamic Range Compression)(212) 및 피치 강화(Pitch Enhancement)(214) 등의 전처리를 하는 것이다. 이와 같이 처리된 오디오 신호는 전송 중 음성 부호화기(216)에 의해 처리될 경우 전송률이 1/8 전송률이 될 확률이 현저히 줄어들게 되어 음의 끊김 현상이 발생하는 것이 줄어들게 된다. 이러한 도 2의 방법은 전처리 과정을 통해 원래의 오디오 신호를 체감 음질에 영향을 미치지 않는 수준에서 변형하여 음성 부호화기(216)의 전송률 결정에 영향을 미치고자 하는 방법이다.

상술한 도 1과 도 2에 도시된 방법은 모두 음성 부호화기의 전송률을 높이는 것을 목적으로 한 방법으로, 음성 부호화기로 하여금 최대 전송률로 입력 오디오 신호를 처리하게 할 경우 음의 갑작스러운 끊김 현상을 방지하여 준다. 그러나 이러한 종래기술들은 최대 전송률로 오디오 신호를 처리한다 하더라도 현재 이동 전화망에서 사용되는 음성 부호화기의 경우 인간의 음성에 최적화되도록 설계되었다는 근본적인 한계 때문에 원음이 심하게 왜곡된 음질을 출력하게 되는 문제점이 있다. 따라서 이동 전화망에서 송수신 오디오 신호의 음질을 높이고자 할 경우 음성 부호화기 자체의 특성으로 인한 음질 저하를 보상해 주는 보다 근본적인 해결책이 요구되고 있다.

본 발명은 상기와 같은 문제점을 해결하기 위하여, 합성에 의한 분석 방식(Analysis-by-synthesis Scheme)에 의해 오디오 신호를 전처리하여 전송하는 장치와 방법을 제공하는 것을 목적으로 한다.

본 발명의 다른 목적은 오디오 신호를 주파수 필터로 전처리한 후 음성 부호화기에 의해 부화 및 복호화한 신호와, 원래의 오디오 신호 간의 오차 신호를 이용하여 상기 오디오 신호를 최적으로 전처리하여 전송하는 장치와 방법을 제공하는 데 있다.

본 발명의 또 다른 목적은 전송할 오디오 신호의 주파수 성분에 특정 필터 이득 값을 곱하여 전처리한 후 전송하는 장치와 방법을 제공하는 데 있다.

본 발명의 또 다른 목적은 이동 전화망에서 음성 부호화기에 의한 오디오 신호의 음질 저하를 개선한 오디오 신호 전송 장치 및 방법을 제공하는 데 있다.

이를 위하여, 본 발명에 따른 오디오 신호 전송 장치는, 프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기; 상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호 와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 한다.

상기 전처리 필터는, 상기 입력되는 오디오 신호를 주파수 영역으로 변환하는 주파수 변환기; 상기 주파수 변환기에서 주파수 영역으로 변환된 오디오 신호에, 상기 필터 이득 값을 곱하여 출력하는 주파수 필터; 및 상기 주파수 필터에서 출력되는 오디오 신호를 시간 영역으로 변환하는 역주파수 변환기를 포함하는 것을 특징으로 한다.

그리고 상기 필터 이득 및 스위치 제어기는, 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 주파수 대역별 SNR 계산기; 상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 주파수 대역별 필터 이득 계산기; 상기 필터 이득의 편차를 조절하여 상기 전처리 필터로 제공하는 후처리기; 및 상기 계산된 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호 화기로 출력하도록 제어하는 스위치 제어기를 포함하는 것을 특징으로 한다.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대한 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

도 3은 본 발명에 따른 오디오 신호 전송 장치의 구성도이다. 본 발명에 따른 오디오 신호 전송 장치는 크게 전처리부(320)와 신호 전송부(330)로 나누어진다. 전처리부(320)는 전처리 필터(310), 음성 부호화기 및 합성기(312), 차분기(314), 및 필터 이득 및 스위치 제어기(316)로 구성되며, 차분기(314)로부터 출력되는 오차 신호

을 전처리기(310)로 되먹임(Feedback) 하기 위한 폐곡선(Closed-loop) 구조로 되어 있다. 신호 전송부(330)는 음성 부호화기(332)로 구성된다.

전처리부(320)는 오디오 신호를 각 프레임별로 입력 받아 이를 전처리 필터(310)를 이용하여 목표 부호화기인 신호 전송부(330)는 음성 부호화기(332)에 적합한 신호로 전처리 한 뒤 전송을 위해 출력하는 동작을 한다. 이 과정에서 각 프레임 별로 최적의 전처리 신호 생성을 위한 다수의 되먹임 과정을 거치게 되며, 되먹 임 반복횟수가 미리 정해진 횟수에 도달하거나 계산된 오차 신호

이 미리 정해진 기준을 만족하게 될 때 최적의 전처리 신호 생성을 위한 탐색과정을 종료하고 최종적으로 전처리된 신호를 전송을 위해 출력한다. 즉, 본 발명의 전처리 과정에는 탐색모드와 전송모드가 있으며, 탐색모드는 최적의 전처리 신호를 생성하기 위해 전처리 필터(310)에서 사용할 최적의 필터 이득을 탐색하는 과정을 의미하고, 전송모드는 이렇게 탐색된 최적의 필터 이득을 이용하여 전처리된 신호를 신호 전송부(330)는 음성 부호화기(332)에 전송하는 과정을 의미한다.

보다 상세하게, 한 프레임의 입력 오디오 신호

은 탐색모드에서 전처리 필터(310)를 통과하여 음성 부호화기 및 합성기(312)를 거쳐 차분기(314)에 의해 오차 신호

을 생성하게 되고, 이 오차 신호

은 입력 오디오 신호

과 더불어 필터 이득 및 스위치 제어기(316)에서 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 구하기 위한 입력 신호로 사용된다. 이 동작은 되먹임 반복횟수가 미리 정해진 횟수에 도달하거나 계산된 오차 신호

이 미리 정해진 기준을 만족하게 될 때까지 계속 된다. 이하에서 전처리부(320)의 각 구성요소에 대해 상세히 설명한다.

전처리 필터(310)는 입력되는 시간 영역의 오디오 신호

을 주파수 영역으로 변환한 뒤 각 주파수 성분에 특정 필터 이득 값을 곱하고 그 결과를 시간 영역으로 변환함으로써 필터 처리된 신호를 출력하는 일종의 주파수 영역의 필터이다. 도 4는 이러한 전처리 필터(310)의 세부 구성도로서, 전처리 필터(310)는 FFT(Fast Fourier Transform) 변환기(412), 주파수 필터(414), 및 IFFT(Inverse FFT) 변환기(416)로 구성된다.

FFT 변환기(412)는 입력되는 시간 영역의 오디오 신호

을 주파수 영역으로 FFT 변환한다. 주파수 필터(414)는 필터 이득 및 스위치 제어기(316)로부터 제공되는 필터 이득 값에 따른 주파수 응답 특성을 갖는다. 즉, 주파수 필터(414)는 주파수 영역으로 FFT 변환된 오디오 신호에 필터 이득 및 스위치 제어기(316)로부터 제공되는 필터 이득 값을 곱하여 출력하고, IFFT 변환기(416)는 이를 IFFT 변환하여 전처리된 시간 영역의 오디오 신호

을 출력한다. 되먹임 동작이 수행되기 이전의 최초의 필터 이득은 1로 초기화 되어 있다.

한편, 음성 부호화기 및 합성기(312)는 신호 전송에 사용되는 음성 부호화기(332)와 동일한 부호화기 및 그에 대응하는 합성기 한 쌍이다. 이는 신호 전송채널의 부호화 및 복호화 처리과정을 정확히 모델링하기 위해 사용된다. 이에 음성 부호화기 및 합성기(312)의 음성 부호화기는 신호 전송부(330)의 음성 부호화기(332)와 동일한 기능의 음성 부호화기를 사용하고, 합성기도 수신측에서 사용되는 복호기와 동일한 기능을 갖도록 하는 것이 바람직하다. 이러한 음성 부호화기 및 합성기(314)는, 선형예측 분석기 및 합성기, 또는 피치 분석기 및 합성기, 또는 FCB(Fixed-CodeBook) 분석기 및 합성기를 이용하여 구현될 수 있다.

차분기(314)는 입력 오디오 신호

와 음성 부호화기 및 합성기(312)에서 출력된 오디오 신호

사이의 차이, 즉 부호화 오차 신호

을 계산하기 위해 사용된다. 차분기(314)에 의해 계산된 오차 신호

은 입력 오디오 신호

과 더불어 필터 이득 및 스위치 제어기(316)의 입력신호로 사용된다.

필터 이득 및 스위치 제어기(316)는 오차 신호

과　 입력 오디오 신호

에 기반을 둔 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 구하는 장치이다. 필터 이득은 주파수 필터(414)의 주파수 응답 특성을 결정할 주파수 이득 값을 뜻한다. 극단적인 경우 한 프레임 입력 오디오 신호의 주파수 성분 각각에 대해 필터 이득을 계산하는 것을 고려할 수 있다. 가령, 입력 오디오 신호의 한 프레임이 20ms 160샘플로 구성되어 있다고 하면, 이를 256포인트-FFT 변환하여 필터처리 하고자 할 경우 필터 처리할 주파수 성분의 수는 128개가 된다. 이들 각각의 주파수 성분에 서로 다른 필터 이득을 적용하고자 할 경우, 매 프레임마다 128개의 이득 값을 계산하여야 한다. 이와 같이 각각의 주파수 성분에 대한 필터 이득 값을 계산하여 처리하는 것은 인간의 인지 청각적 특성을 고려할 때 비효율적이다. 즉, 인간의 주파수 분별능력은 주파수 축을 따라 균일하지 않으며 주파수 차폐특성(Masking Effect)을 가진다. 이 점을 고려할 경우,　 주파수 영역의 각 성분들을 몇 개의 대역으로 그룹화하고, 각 대역에 대해서는 동일한 이득을 적용하는 것이　계산량은　줄이면서　성능은　그대로 유지하는　좋은 선택이 된다. 대역을 그룹화하는 방법은 입력 오디오 신호의 특성 혹은 응용환경에 따라 다양하게 구성할 수 있으며, 그 예로 도 5는 등 간격 주파수 분할 예를, 도 6은 트리(Tree) 구조 주파수 분할 예를 보여 주고 있다. 그리고 이 밖에도 인지 청각모델에 기반을 둔 Bark-scale 형태의 주파수 분할 방법도 좋은 예가 될 수 있다.

도 7은 필터 이득 및 스위치 제어기(316)의 세부 구성도이다. 필터 이득 및 스위치 제어기(316)는 주파수 대역별 SNR 계산기(712),　주파수 대역별 필터 이득 계산기(714), 후처리기(716), 및 스위치 제어기(718)로 구성된다.

주파수 대역별 SNR 계산기(712)는 입력 오디오 신호

과　차분기(314)에 의해 계산된 오차 신호

을 각각　FFT 변환하여 도 5 혹은 도 6에 주어진 형태의 각 주파수 대역에서 수학식 1과 같이 SNR(Signal-to-Noise Ratio)을 계산한다.

여기서

는 각 대역을 가리키며

는 총 대역수, n은 되먹임 반복횟수이다.

와

는　각각

번째 대역의 입력 오디오 신호

의 에너지,

번째 대역의 n번째 되먹임에서의 차분기(314)에 의해 계산된 오차 신호

의 에너지를 나타낸다.

주파수 대역별 필터 이득 계산기(714)는 주파수 대역별 SNR 계산기(712)에서 계산된　각 주파수 대역별 SNR 값에 기초하여 수학식 2와 같이 각 대역별 필터 이득을 계산한다.

여기서

과

은 각각 n번째, n-1번째 되먹임에서의 필터 이득을 나타내고,

는 회귀계수로 실험적으로 0.55인 것이 바람직하다. 함수

는 [0, 1] 사이의 값을 가지는 수학식 3과 같은 시그모이드(Sigmoid) 함수이다.

이상의 과정을 통하여 주파수 대역별 필터 이득　계산기(714)에 의하여 계산되는 각 대역별 필터 이득의 특징은, 입력 오디오 신호

에 대한 차분기(314)에 의해 계산된 오차 신호

가 작은 주파수 대역은 큰 값 즉, 1에 가까운 값을 가지며 그 반대의 경우는 작은 값 즉, 0에 가까운 값을 가지게 된다. 이 방식은 부호화기에 의해 부호화가 잘되는 대역은 증폭시키고 그렇지 않은 대역은 감소시키는 효과를 가져온다. 그리고 이러한 과정이 되먹임 구조를 통하여 반복됨으로써 점차 현재의 입력 오디오 신호

에 가장 적합한 필터 이득 값으로 수렴하게 된다.

후처리기(716)는 프레임간 즉, 현재 프레임과 전 프레임 사이의 필터 이득의 급격한 편차(Inter-frame Deviation), 그리고 현재 프레임 내에서 각 대역 사이의 필터 이득의 급격한 편차(Intra-frame Deviation)에 의한 신호간섭 효과(Aliasing Effect)를 줄이기 위한 장치이다. 프레임간 필터 이득의 급격한 편차 문제를 해결하기 위해서는 전 프레임에 대해 결정된 최적 필터 이득을 기준으로 탐색 중인 현재 프레임의 필터 이득을 일정 범위 내로 제한하는 것이 바람직하다. 즉, 프레임간 필터 이득의 편차를 전 프레임을 기준으로 0.3 이내로 제한하는 것이 바람직하다. 이를 수학식으로 표현하면 수학식 4와 같다.

여기서

는 전 프레임의

번째 대역의 결정된 최적의 필터 이득을 나타낸다.

한편, 프레임 내 각 대역 간 필터 이득의 급격한 편차 문제를 해결하기 위해 선형 혹은 사인파(Sinusoid) 형태의 Smoothing 함수를 사용하는 것이 바람직하다. 도 8에 선형 Smoothing 함수를 사용한 예가 나타나 있다. 즉, 각 대역별 필터 이득이 결정되면 그 값을 각 대역 중심 주파수에서의 필터 이득 값으로 정하고 나머지 주파수 성분들의 필터 이득은 각 중심 주파수 필터 이득들을 직선으로 연결하였을 때의 함수값으로 결정하는 것이 바람직하다.

스위치 제어기(718)는 되먹임 과정을 계속할 지의 여부를 결정하는 장치로서 되먹임 횟수가 미리 정해진 횟수를 넘어서거나 수렴조건에 도달하면 탐색모드를 중단하고 전송모드로 시스템의 동작을 전환하는 역할을 한다. 최대 되먹임 횟수는 실험적으로 10회인 것이 바람직하다. 수렴조건은 수학식 5와 같이 오차 신호

의 에너지의 변화율이 0.1 이내인 것이 바람직하다.

상술한 바와 같이 전처리부(320)는 오디오 신호를 각 프레임별로 입력 받아 전처리한다. 도 9는 상술한 바와 같은 전처리부(320)에서 한 프리임에 대해 전처리 하는 과정의 동작을 나타내는 흐름도이다.

먼저 전처리부(320)에 한 프레임의 오디오 신호

이 입력되면(S902), 전처리 필터(310)는 오디오 신호

을 필터 이득 및 스위치 제어기(316)에서 제공되는 필터 이득 값을 이용하여 주파수 필터(414)에서 필터 처리함으로써 전처리된 오 디오 신호

을 출력한다(S904).

전처리된 오디오 신호

은 음성 부호화기 및 합성기(312)를 통해 부호화되고 다시 복호화되어

으로서 출력된다(S906).

이렇게 출력된

은 차분기(314)에 입력되고, 차분기(314)는 상술한 S902 과정에서 입력된 오디오 신호

과

의 오차를 계산하여 오차 신호

을 출력한다(S908).

필터 이득 및 스위치 제어기(316)는 오차 신호

과　 입력 오디오 신호

에 기반을 둔 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 계산하고, 정해진 되먹임 횟수를 넘거나 수렴 조건에 도달하여 최적의 필터 이득이 구해지면(S910), 최적의 필터 이득 값을 전처리 필터(310)로 제공한다.

전처리 필터(310)는 최적의 필터 이득으로 전처리된 오디오 신호

을 출력한다(S912).

한편, 최적의 필터 이득이 구해지지 않으면 필터 이득 및 스위치 제어기(316)는 정해진 되먹임 횟수 내에서 또는 수렴 조건을 만족할 때까지 상술한 S904 과정을 돌아가 이후 과정을 반복한다.

상술한 바와 같이 전처리부(320)는 입력되는 오디오 신호의 매 프레임마다 도9와 같은 과정을 거쳐 전처리한 후 신호 전송부(330)의 음성 부호화기(332)로 출력하며, 이렇게 최적이 상태로 전처리된 오디오 신호는 음성 부호화기(332)에서 음 성 부호화되어 전송된다. 이렇게 전송되는 오디오 신호는 이미 전처리 과정에서 인간의 청각 특성을 고려하여 전처리된 후 전송된 오디오 신호이므로 음성 부호화기(332)에 의한 음질 저하가 개선되는 특징이 있다.

이러한 본 발명은 이동 전화망에서 사용되는 통화연결음에 적용될 수 있는데, 보통 통화연결음은 음악을 사용하는 경우가 대부분이다. 이러한 통화연결음이 사용자에게 전송될 경우 음성 부호화기로 인해 실제 음원의 음질보다 좋지 못한 음질로 들리게 된다. 그러므로 이러한 통화연결음을 본 발명에 따른 전처리 과정을 통해 전송하게 되면 사용자에게 보다 나은 음질을 제공할 수 있게 된다. 통화연결음의 전처리는 미리 전처리 과정을 거쳐 별도로 저장해 놓았다가 사용자가 원할 경우 바로 음성 부호화기를 거쳐 전송할 수도 있고, 사용자가 통화연결음을 요청할 때마다 그때그때 전처리 과정을 거쳐 전송할 수도 있다.

상술한 바와 같이, 본 발명은 오디오 신호의 전처리 과정에 요구되는 필터 이득에 대해 최적의 필터 이득을 구하기 위해, 전처리를 한 후 음성 부호화기와 합성기를 거쳐 출력된 오디오 신호에 대한 오차 신호를 이용함으로써 최적의 필터 이득으로 수렴하게 하는 방식으로 오디오 신호를 전처리하기 때문에, 이동 전화망에서 오디오 신호를 전송할 경우 음성 부호화기에 의한 음질 저하를 개선하는 효과가 있다.

Claims

프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득을 곱하고, 상기 필터 이득이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터;

상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기;

상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기;

상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및

상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 1항에 있어서,

상기 전처리 필터는,

상기 입력되는 오디오 신호를 주파수 영역으로 변환하는 주파수 변환기;

상기 주파수 변환기에서 주파수 영역으로 변환된 오디오 신호에, 상기 필터 이득 값을 곱하여 출력하는 주파수 필터; 및

상기 주파수 필터에서 출력되는 오디오 신호를 시간 영역으로 변환하는 역주파수 변환기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 1항 또는 제 2항에 있어서,

상기 필터 이득 및 스위치 제어기는,

상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 주파수 대역별 SNR 계산기;

상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 주파수 대역별 필터 이득 계산기;

상기 필터 이득의 편차를 조절하여 상기 전처리 필터로 제공하는 후처리기; 및

상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 스위치 제어기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 3항에 있어서,

상기 후처리기는, 상기 필터 이득을 이전 프레임에 입력된 오디오 신호에 대한 필터 이득을 기준으로 일정 범위 내로 제한하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 3항에 있어서,

상기 후처리기는, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 직선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 3항에 있어서,

상기 후처리기는, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 곡선으로 연결하여 정하는 것을 특징으로 하는 오디 오 신호 전송 장치.
제 3항에 있어서,

상기 스위치 제어기는, 상기 오차 신호의 에너지 변화율이 0.1 이하일 경우, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 3항에 있어서,

상기 스위치 제어기는, 상기 필터 이득의 계산이 반복된 횟수가, 정해진 값에 도달한 경우, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 1항에 있어서,

상기 제 1음성 부호화기 및 합성기는, 선형예측 분석기 및 합성기를 포함하 는 것을 특징으로 하는 오디오 신호 전송 장치.
제 1항에 있어서,

상기 제 1음성 부호화기 및 합성기는, 피치 분석기 및 합성기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
제 1항에 있어서,

상기 제 1음성 부호화기 및 합성기는, FCB(Fixed-CodeBook) 분석기 및 합성기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
입력되는 오디오 신호를 프레임 별로 전처리하고 부호화하여 전송하는 오디오 신호 전송 방법에 있어서,

프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 과정;

상기 전처리 과정 후 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 과정;

상기 합성되어 출력되는 오디오 신호와 상기 전처리 과정으로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 과정;

상기 오차 신호와 상기 전처리 과정으로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 제공하는 과정; 및

상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 음성 부호화하여 전송하는 과정을 포함하는 것을 특징으로 하는 오디오 신호 전송 방법.
제 12항에 있어서,

상기 필터 이득을 계산하는 과정은,

상기 오차 신호와 상기 전처리 과정으로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 단계;

상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 단계; 및

상기 필터 이득의 편차를 조절하여 상기 전처리 과정으로 제공하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 전송 방법.
제 13항에 있어서,

상기 필터 이득의 편차 조절은, 상기 필터 이득을 이전 프레임에 입력된 오디오 신호에 대한 필터 이득을 기준으로 일정 범위 내로 제한하는 것을 특징으로 하는 오디오 신호 전송 방법.
제 13항에 있어서,

상기 필터 이득의 편차 조절은, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 직선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 방법.
제 13항에 있어서,

상기 필터 이득의 편차 조절은, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 곡선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 방법.
제 12항에 있어서,

상기 오디오 신호를 음성 부호화하여 전송하는 과정은, 상기 오차 신호의 에너지 변화율이 0.1 이하일 경우에 전송함을 특징으로 하는 오디오 신호 전송 방법.
제 12항에 있어서,

상기 오디오 신호를 음성 부호화하여 전송하는 과정은, 상기 필터 이득의 계산이 반복된 횟수가 정해진 값에 도달한 경우에 전송함을 특징으로 하는 오디오 신호 전송 방법.