KR100735246B1 - 오디오 신호 전송 장치 및 방법 - Google Patents

오디오 신호 전송 장치 및 방법 Download PDF

Info

Publication number
KR100735246B1
KR100735246B1 KR1020050084780A KR20050084780A KR100735246B1 KR 100735246 B1 KR100735246 B1 KR 100735246B1 KR 1020050084780 A KR1020050084780 A KR 1020050084780A KR 20050084780 A KR20050084780 A KR 20050084780A KR 100735246 B1 KR100735246 B1 KR 100735246B1
Authority
KR
South Korea
Prior art keywords
audio signal
filter
filter gain
frequency
preprocessing
Prior art date
Application number
KR1020050084780A
Other languages
English (en)
Other versions
KR20070030035A (ko
Inventor
송근배
김재범
안철용
박호종
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050084780A priority Critical patent/KR100735246B1/ko
Priority to US11/519,219 priority patent/US20070088546A1/en
Publication of KR20070030035A publication Critical patent/KR20070030035A/ko
Application granted granted Critical
Publication of KR100735246B1 publication Critical patent/KR100735246B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 이동 전화망에서 송수신되는 오디오 신호의 음질을 개선하기 위하여, 오디오 신호를 음성 부호화기에 입력하기 전에 전처리하는 오디오 신호 전송 장치 및 방법에 관한 것이다.
본 발명에 따른 오디오 신호 전송 장치는, 프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기; 상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 한다.
오디오 신호, 전처리, 필터 이득

Description

오디오 신호 전송 장치 및 방법{Apparatus and method for transmitting audio signal}
도 1과 도 2는 종래기술에 따른 오디오 신호 전송 장치의 구성도.
도 3은 본 발명에 따른 오디오 신호 전송 장치의 구성도.
도 4는 도 3의 전처리 필터(310)의 세부 구성도.
도 5와 도 6은 본 발명에 따른 주파수 분할의 일 실시 예.
도 7은 도 3의 필터 이득 및 스위치 제어기(316)의 세부 구성도.
도 8은 본 발명에 따른 필터 이득의 Smoothing의 일 실시 예.
도 9는 본 발명에 따른 오디오 신호 전송 방법의 흐름도.
본 발명은 오디오 신호 전송 장치 및 방법에 관한 것으로, 보다 상세하게는 이동 전화망에서 송수신되는 오디오 신호를 음성 부호화기에 입력하기 전에 전처리하는 오디오 신호 전송 장치 및 방법에 관한 것이다.
이동 전화망에서 사용되는 가변 전송률(Variable Rate) 음성 부호화기는 복 수의 전송률을 가지는 음성 패킷의 생성을 지원한다. 대표적인 가변 전송률 음성 부호화기는 부호 분할 다중 접속(Code Division Multiple Access : 이하 CDMA라 칭함) 시스템에 사용되는 퀄컴-CELP(QCELP)와 EVRC(Enhanced Variable Rate Codec)가 있다. 가변 전송률 음성 부호화기는 입력 음성 신호의 특성 또는 통신 시스템에서 요구하는 전송률에 따라 음성 패킷의 전송률을 선택하여 음성 신호를 압축하거나 복원할 수 있다. QCELP와 EVRC는 최대 전송률(Full Rate) 및 이를 기준으로 하여 1/2, 1/4 또는 1/8의 전송률을 가지는 음성 패킷을 생성한다. 이들은 모두 인간의 음성생성모델에 기반을 두고 만들어진 부호화기로서 음성신호를 압축하고 복호하는데 있어서는 최적의 성능을 나타내지만 음악과 같이 음성생성모델과 상이한 생성모델을 가지는 신호에 대해서는 성능이 떨어진다. 따라서 기존의 이동 전화망에서 오디오 신호를 송신하고 수신하고자 할 경우에는 음질저하를 완화시키기 위한 처리가 요구되고 있다.
도 1은 음성 부호화기를 사용하는 이동 전화망에서 오디오 신호의 음질저하를 완화시키기 위한 종래기술로서, 음악 검출기(112)를 사용하는 방법이다. 즉, 도 1에 도시된 바와 같이 음성 부호화기(114) 앞 단에 음악 검출기(112)를 구비하여, 입력신호
Figure 112005050893082-pat00001
이 오디오 신호인지를 검출한다. 음악 검출기(112)에서 입력신호
Figure 112005050893082-pat00002
이 오디오 신호라 판단되면 음성 부호화기(114)는 입력신호
Figure 112005050893082-pat00003
을 최대 전송률로 압축하여 전송하고, 그렇지 않고 입력신호
Figure 112005050893082-pat00004
이 음성신호일 경우에는 음성신호의 특성에 맞게 적당한 전송률로 압축하여 전송한다.
도 2는 음성 부호화기를 사용하는 이동 전화망에서 오디오 신호의 음질저하를 완화시키기 위한 다른 종래기술로서, 음성 부호화기(216) 앞 단에 전처리기(220)를 구비하여, 이동 전화망을 통해 전송하고자 하는 오디오 신호에 대해 사전에 음폭 압축(Dynamic Range Compression)(212) 및 피치 강화(Pitch Enhancement)(214) 등의 전처리를 하는 것이다. 이와 같이 처리된 오디오 신호는 전송 중 음성 부호화기(216)에 의해 처리될 경우 전송률이 1/8 전송률이 될 확률이 현저히 줄어들게 되어 음의 끊김 현상이 발생하는 것이 줄어들게 된다. 이러한 도 2의 방법은 전처리 과정을 통해 원래의 오디오 신호를 체감 음질에 영향을 미치지 않는 수준에서 변형하여 음성 부호화기(216)의 전송률 결정에 영향을 미치고자 하는 방법이다.
상술한 도 1과 도 2에 도시된 방법은 모두 음성 부호화기의 전송률을 높이는 것을 목적으로 한 방법으로, 음성 부호화기로 하여금 최대 전송률로 입력 오디오 신호를 처리하게 할 경우 음의 갑작스러운 끊김 현상을 방지하여 준다. 그러나 이러한 종래기술들은 최대 전송률로 오디오 신호를 처리한다 하더라도 현재 이동 전화망에서 사용되는 음성 부호화기의 경우 인간의 음성에 최적화되도록 설계되었다는 근본적인 한계 때문에 원음이 심하게 왜곡된 음질을 출력하게 되는 문제점이 있다. 따라서 이동 전화망에서 송수신 오디오 신호의 음질을 높이고자 할 경우 음성 부호화기 자체의 특성으로 인한 음질 저하를 보상해 주는 보다 근본적인 해결책이 요구되고 있다.
본 발명은 상기와 같은 문제점을 해결하기 위하여, 합성에 의한 분석 방식(Analysis-by-synthesis Scheme)에 의해 오디오 신호를 전처리하여 전송하는 장치와 방법을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적은 오디오 신호를 주파수 필터로 전처리한 후 음성 부호화기에 의해 부화 및 복호화한 신호와, 원래의 오디오 신호 간의 오차 신호를 이용하여 상기 오디오 신호를 최적으로 전처리하여 전송하는 장치와 방법을 제공하는 데 있다.
본 발명의 또 다른 목적은 전송할 오디오 신호의 주파수 성분에 특정 필터 이득 값을 곱하여 전처리한 후 전송하는 장치와 방법을 제공하는 데 있다.
본 발명의 또 다른 목적은 이동 전화망에서 음성 부호화기에 의한 오디오 신호의 음질 저하를 개선한 오디오 신호 전송 장치 및 방법을 제공하는 데 있다.
이를 위하여, 본 발명에 따른 오디오 신호 전송 장치는, 프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기; 상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호 와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기; 상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 한다.
상기 전처리 필터는, 상기 입력되는 오디오 신호를 주파수 영역으로 변환하는 주파수 변환기; 상기 주파수 변환기에서 주파수 영역으로 변환된 오디오 신호에, 상기 필터 이득 값을 곱하여 출력하는 주파수 필터; 및 상기 주파수 필터에서 출력되는 오디오 신호를 시간 영역으로 변환하는 역주파수 변환기를 포함하는 것을 특징으로 한다.
그리고 상기 필터 이득 및 스위치 제어기는, 상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 주파수 대역별 SNR 계산기; 상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 주파수 대역별 필터 이득 계산기; 상기 필터 이득의 편차를 조절하여 상기 전처리 필터로 제공하는 후처리기; 및 상기 계산된 필터 이득이 최적일 경우 상기 전처리 필터로부터 상기 최적의 필터 이득에 의해 처리되어 출력되는 오디오 신호를 상기 제 2음성 부호 화기로 출력하도록 제어하는 스위치 제어기를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대한 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 3은 본 발명에 따른 오디오 신호 전송 장치의 구성도이다. 본 발명에 따른 오디오 신호 전송 장치는 크게 전처리부(320)와 신호 전송부(330)로 나누어진다. 전처리부(320)는 전처리 필터(310), 음성 부호화기 및 합성기(312), 차분기(314), 및 필터 이득 및 스위치 제어기(316)로 구성되며, 차분기(314)로부터 출력되는 오차 신호
Figure 112005050893082-pat00005
을 전처리기(310)로 되먹임(Feedback) 하기 위한 폐곡선(Closed-loop) 구조로 되어 있다. 신호 전송부(330)는 음성 부호화기(332)로 구성된다.
전처리부(320)는 오디오 신호를 각 프레임별로 입력 받아 이를 전처리 필터(310)를 이용하여 목표 부호화기인 신호 전송부(330)는 음성 부호화기(332)에 적합한 신호로 전처리 한 뒤 전송을 위해 출력하는 동작을 한다. 이 과정에서 각 프레임 별로 최적의 전처리 신호 생성을 위한 다수의 되먹임 과정을 거치게 되며, 되먹 임 반복횟수가 미리 정해진 횟수에 도달하거나 계산된 오차 신호
Figure 112005050893082-pat00006
이 미리 정해진 기준을 만족하게 될 때 최적의 전처리 신호 생성을 위한 탐색과정을 종료하고 최종적으로 전처리된 신호를 전송을 위해 출력한다. 즉, 본 발명의 전처리 과정에는 탐색모드와 전송모드가 있으며, 탐색모드는 최적의 전처리 신호를 생성하기 위해 전처리 필터(310)에서 사용할 최적의 필터 이득을 탐색하는 과정을 의미하고, 전송모드는 이렇게 탐색된 최적의 필터 이득을 이용하여 전처리된 신호를 신호 전송부(330)는 음성 부호화기(332)에 전송하는 과정을 의미한다.
보다 상세하게, 한 프레임의 입력 오디오 신호
Figure 112005050893082-pat00007
은 탐색모드에서 전처리 필터(310)를 통과하여 음성 부호화기 및 합성기(312)를 거쳐 차분기(314)에 의해 오차 신호
Figure 112005050893082-pat00008
을 생성하게 되고, 이 오차 신호
Figure 112005050893082-pat00009
은 입력 오디오 신호
Figure 112005050893082-pat00010
과 더불어 필터 이득 및 스위치 제어기(316)에서 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 구하기 위한 입력 신호로 사용된다. 이 동작은 되먹임 반복횟수가 미리 정해진 횟수에 도달하거나 계산된 오차 신호
Figure 112005050893082-pat00011
이 미리 정해진 기준을 만족하게 될 때까지 계속 된다. 이하에서 전처리부(320)의 각 구성요소에 대해 상세히 설명한다.
전처리 필터(310)는 입력되는 시간 영역의 오디오 신호
Figure 112005050893082-pat00012
을 주파수 영역으로 변환한 뒤 각 주파수 성분에 특정 필터 이득 값을 곱하고 그 결과를 시간 영역으로 변환함으로써 필터 처리된 신호를 출력하는 일종의 주파수 영역의 필터이다. 도 4는 이러한 전처리 필터(310)의 세부 구성도로서, 전처리 필터(310)는 FFT(Fast Fourier Transform) 변환기(412), 주파수 필터(414), 및 IFFT(Inverse FFT) 변환기(416)로 구성된다.
FFT 변환기(412)는 입력되는 시간 영역의 오디오 신호
Figure 112005050893082-pat00013
을 주파수 영역으로 FFT 변환한다. 주파수 필터(414)는 필터 이득 및 스위치 제어기(316)로부터 제공되는 필터 이득 값에 따른 주파수 응답 특성을 갖는다. 즉, 주파수 필터(414)는 주파수 영역으로 FFT 변환된 오디오 신호에 필터 이득 및 스위치 제어기(316)로부터 제공되는 필터 이득 값을 곱하여 출력하고, IFFT 변환기(416)는 이를 IFFT 변환하여 전처리된 시간 영역의 오디오 신호
Figure 112005050893082-pat00014
을 출력한다. 되먹임 동작이 수행되기 이전의 최초의 필터 이득은 1로 초기화 되어 있다.
한편, 음성 부호화기 및 합성기(312)는 신호 전송에 사용되는 음성 부호화기(332)와 동일한 부호화기 및 그에 대응하는 합성기 한 쌍이다. 이는 신호 전송채널의 부호화 및 복호화 처리과정을 정확히 모델링하기 위해 사용된다. 이에 음성 부호화기 및 합성기(312)의 음성 부호화기는 신호 전송부(330)의 음성 부호화기(332)와 동일한 기능의 음성 부호화기를 사용하고, 합성기도 수신측에서 사용되는 복호기와 동일한 기능을 갖도록 하는 것이 바람직하다. 이러한 음성 부호화기 및 합성기(314)는, 선형예측 분석기 및 합성기, 또는 피치 분석기 및 합성기, 또는 FCB(Fixed-CodeBook) 분석기 및 합성기를 이용하여 구현될 수 있다.
차분기(314)는 입력 오디오 신호
Figure 112005050893082-pat00015
와 음성 부호화기 및 합성기(312)에서 출력된 오디오 신호
Figure 112005050893082-pat00016
사이의 차이, 즉 부호화 오차 신호
Figure 112005050893082-pat00017
을 계산하기 위해 사용된다. 차분기(314)에 의해 계산된 오차 신호
Figure 112005050893082-pat00018
은 입력 오디오 신호
Figure 112005050893082-pat00019
과 더불어 필터 이득 및 스위치 제어기(316)의 입력신호로 사용된다.
필터 이득 및 스위치 제어기(316)는 오차 신호
Figure 112005050893082-pat00020
과  입력 오디오 신호
Figure 112005050893082-pat00021
에 기반을 둔 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 구하는 장치이다. 필터 이득은 주파수 필터(414)의 주파수 응답 특성을 결정할 주파수 이득 값을 뜻한다. 극단적인 경우 한 프레임 입력 오디오 신호의 주파수 성분 각각에 대해 필터 이득을 계산하는 것을 고려할 수 있다. 가령, 입력 오디오 신호의 한 프레임이 20ms 160샘플로 구성되어 있다고 하면, 이를 256포인트-FFT 변환하여 필터처리 하고자 할 경우 필터 처리할 주파수 성분의 수는 128개가 된다. 이들 각각의 주파수 성분에 서로 다른 필터 이득을 적용하고자 할 경우, 매 프레임마다 128개의 이득 값을 계산하여야 한다. 이와 같이 각각의 주파수 성분에 대한 필터 이득 값을 계산하여 처리하는 것은 인간의 인지 청각적 특성을 고려할 때 비효율적이다. 즉, 인간의 주파수 분별능력은 주파수 축을 따라 균일하지 않으며 주파수 차폐특성(Masking Effect)을 가진다. 이 점을 고려할 경우,  주파수 영역의 각 성분들을 몇 개의 대역으로 그룹화하고, 각 대역에 대해서는 동일한 이득을 적용하는 것이 계산량은 줄이면서 성능은 그대로 유지하는 좋은 선택이 된다. 대역을 그룹화하는 방법은 입력 오디오 신호의 특성 혹은 응용환경에 따라 다양하게 구성할 수 있으며, 그 예로 도 5는 등 간격 주파수 분할 예를, 도 6은 트리(Tree) 구조 주파수 분할 예를 보여 주고 있다. 그리고 이 밖에도 인지 청각모델에 기반을 둔 Bark-scale 형태의 주파수 분할 방법도 좋은 예가 될 수 있다.
도 7은 필터 이득 및 스위치 제어기(316)의 세부 구성도이다. 필터 이득 및 스위치 제어기(316)는 주파수 대역별 SNR 계산기(712), 주파수 대역별 필터 이득 계산기(714), 후처리기(716), 및 스위치 제어기(718)로 구성된다.
주파수 대역별 SNR 계산기(712)는 입력 오디오 신호
Figure 112005050893082-pat00022
과 차분기(314)에 의해 계산된 오차 신호
Figure 112005050893082-pat00023
을 각각 FFT 변환하여 도 5 혹은 도 6에 주어진 형태의 각 주파수 대역에서 수학식 1과 같이 SNR(Signal-to-Noise Ratio)을 계산한다.
Figure 112005050893082-pat00024
여기서
Figure 112005050893082-pat00025
는 각 대역을 가리키며
Figure 112005050893082-pat00026
는 총 대역수, n은 되먹임 반복횟수이다.
Figure 112005050893082-pat00027
Figure 112005050893082-pat00028
는 각각
Figure 112005050893082-pat00029
번째 대역의 입력 오디오 신호
Figure 112005050893082-pat00030
의 에너지,
Figure 112005050893082-pat00031
번째 대역의 n번째 되먹임에서의 차분기(314)에 의해 계산된 오차 신호
Figure 112005050893082-pat00032
의 에너지를 나타낸다.
주파수 대역별 필터 이득 계산기(714)는 주파수 대역별 SNR 계산기(712)에서 계산된 각 주파수 대역별 SNR 값에 기초하여 수학식 2와 같이 각 대역별 필터 이득을 계산한다.
Figure 112005050893082-pat00033
여기서
Figure 112005050893082-pat00034
Figure 112005050893082-pat00035
은 각각 n번째, n-1번째 되먹임에서의 필터 이득을 나타내고,
Figure 112005050893082-pat00036
는 회귀계수로 실험적으로 0.55인 것이 바람직하다. 함수
Figure 112005050893082-pat00037
는 [0, 1] 사이의 값을 가지는 수학식 3과 같은 시그모이드(Sigmoid) 함수이다.
Figure 112005050893082-pat00038
이상의 과정을 통하여 주파수 대역별 필터 이득 계산기(714)에 의하여 계산되는 각 대역별 필터 이득의 특징은, 입력 오디오 신호
Figure 112005050893082-pat00039
에 대한 차분기(314)에 의해 계산된 오차 신호
Figure 112005050893082-pat00040
가 작은 주파수 대역은 큰 값 즉, 1에 가까운 값을 가지며 그 반대의 경우는 작은 값 즉, 0에 가까운 값을 가지게 된다. 이 방식은 부호화기에 의해 부호화가 잘되는 대역은 증폭시키고 그렇지 않은 대역은 감소시키는 효과를 가져온다. 그리고 이러한 과정이 되먹임 구조를 통하여 반복됨으로써 점차 현재의 입력 오디오 신호
Figure 112005050893082-pat00041
에 가장 적합한 필터 이득 값으로 수렴하게 된다.
후처리기(716)는 프레임간 즉, 현재 프레임과 전 프레임 사이의 필터 이득의 급격한 편차(Inter-frame Deviation), 그리고 현재 프레임 내에서 각 대역 사이의 필터 이득의 급격한 편차(Intra-frame Deviation)에 의한 신호간섭 효과(Aliasing Effect)를 줄이기 위한 장치이다. 프레임간 필터 이득의 급격한 편차 문제를 해결하기 위해서는 전 프레임에 대해 결정된 최적 필터 이득을 기준으로 탐색 중인 현재 프레임의 필터 이득을 일정 범위 내로 제한하는 것이 바람직하다. 즉, 프레임간 필터 이득의 편차를 전 프레임을 기준으로 0.3 이내로 제한하는 것이 바람직하다. 이를 수학식으로 표현하면 수학식 4와 같다.
Figure 112005050893082-pat00042
여기서
Figure 112005050893082-pat00043
는 전 프레임의
Figure 112005050893082-pat00044
번째 대역의 결정된 최적의 필터 이득을 나타낸다.
한편, 프레임 내 각 대역 간 필터 이득의 급격한 편차 문제를 해결하기 위해 선형 혹은 사인파(Sinusoid) 형태의 Smoothing 함수를 사용하는 것이 바람직하다. 도 8에 선형 Smoothing 함수를 사용한 예가 나타나 있다. 즉, 각 대역별 필터 이득이 결정되면 그 값을 각 대역 중심 주파수에서의 필터 이득 값으로 정하고 나머지 주파수 성분들의 필터 이득은 각 중심 주파수 필터 이득들을 직선으로 연결하였을 때의 함수값으로 결정하는 것이 바람직하다.
스위치 제어기(718)는 되먹임 과정을 계속할 지의 여부를 결정하는 장치로서 되먹임 횟수가 미리 정해진 횟수를 넘어서거나 수렴조건에 도달하면 탐색모드를 중단하고 전송모드로 시스템의 동작을 전환하는 역할을 한다. 최대 되먹임 횟수는 실험적으로 10회인 것이 바람직하다. 수렴조건은 수학식 5와 같이 오차 신호
Figure 112005050893082-pat00045
의 에너지의 변화율이 0.1 이내인 것이 바람직하다.
Figure 112005050893082-pat00046
상술한 바와 같이 전처리부(320)는 오디오 신호를 각 프레임별로 입력 받아 전처리한다. 도 9는 상술한 바와 같은 전처리부(320)에서 한 프리임에 대해 전처리 하는 과정의 동작을 나타내는 흐름도이다.
먼저 전처리부(320)에 한 프레임의 오디오 신호
Figure 112005050893082-pat00047
이 입력되면(S902), 전처리 필터(310)는 오디오 신호
Figure 112005050893082-pat00048
을 필터 이득 및 스위치 제어기(316)에서 제공되는 필터 이득 값을 이용하여 주파수 필터(414)에서 필터 처리함으로써 전처리된 오 디오 신호
Figure 112005050893082-pat00049
을 출력한다(S904).
전처리된 오디오 신호
Figure 112005050893082-pat00050
은 음성 부호화기 및 합성기(312)를 통해 부호화되고 다시 복호화되어
Figure 112005050893082-pat00051
으로서 출력된다(S906).
이렇게 출력된
Figure 112005050893082-pat00052
은 차분기(314)에 입력되고, 차분기(314)는 상술한 S902 과정에서 입력된 오디오 신호
Figure 112005050893082-pat00053
Figure 112005050893082-pat00054
의 오차를 계산하여 오차 신호
Figure 112005050893082-pat00055
을 출력한다(S908).
필터 이득 및 스위치 제어기(316)는 오차 신호
Figure 112005050893082-pat00056
과  입력 오디오 신호
Figure 112005050893082-pat00057
에 기반을 둔 현재의 입력 프레임에 대한 최적의 전처리 필터 이득을 계산하고, 정해진 되먹임 횟수를 넘거나 수렴 조건에 도달하여 최적의 필터 이득이 구해지면(S910), 최적의 필터 이득 값을 전처리 필터(310)로 제공한다.
전처리 필터(310)는 최적의 필터 이득으로 전처리된 오디오 신호
Figure 112005050893082-pat00058
을 출력한다(S912).
한편, 최적의 필터 이득이 구해지지 않으면 필터 이득 및 스위치 제어기(316)는 정해진 되먹임 횟수 내에서 또는 수렴 조건을 만족할 때까지 상술한 S904 과정을 돌아가 이후 과정을 반복한다.
상술한 바와 같이 전처리부(320)는 입력되는 오디오 신호의 매 프레임마다 도9와 같은 과정을 거쳐 전처리한 후 신호 전송부(330)의 음성 부호화기(332)로 출력하며, 이렇게 최적이 상태로 전처리된 오디오 신호는 음성 부호화기(332)에서 음 성 부호화되어 전송된다. 이렇게 전송되는 오디오 신호는 이미 전처리 과정에서 인간의 청각 특성을 고려하여 전처리된 후 전송된 오디오 신호이므로 음성 부호화기(332)에 의한 음질 저하가 개선되는 특징이 있다.
이러한 본 발명은 이동 전화망에서 사용되는 통화연결음에 적용될 수 있는데, 보통 통화연결음은 음악을 사용하는 경우가 대부분이다. 이러한 통화연결음이 사용자에게 전송될 경우 음성 부호화기로 인해 실제 음원의 음질보다 좋지 못한 음질로 들리게 된다. 그러므로 이러한 통화연결음을 본 발명에 따른 전처리 과정을 통해 전송하게 되면 사용자에게 보다 나은 음질을 제공할 수 있게 된다. 통화연결음의 전처리는 미리 전처리 과정을 거쳐 별도로 저장해 놓았다가 사용자가 원할 경우 바로 음성 부호화기를 거쳐 전송할 수도 있고, 사용자가 통화연결음을 요청할 때마다 그때그때 전처리 과정을 거쳐 전송할 수도 있다.
상술한 바와 같이, 본 발명은 오디오 신호의 전처리 과정에 요구되는 필터 이득에 대해 최적의 필터 이득을 구하기 위해, 전처리를 한 후 음성 부호화기와 합성기를 거쳐 출력된 오디오 신호에 대한 오차 신호를 이용함으로써 최적의 필터 이득으로 수렴하게 하는 방식으로 오디오 신호를 전처리하기 때문에, 이동 전화망에서 오디오 신호를 전송할 경우 음성 부호화기에 의한 음질 저하를 개선하는 효과가 있다.

Claims (18)

  1. 프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득을 곱하고, 상기 필터 이득이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 필터;
    상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 제 1음성 부호화기 및 합성기;
    상기 제 1음성 부호화기 및 합성기로부터 출력되는 오디오 신호와 상기 전처리 필터로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 차분기;
    상기 전처리 필터에서 출력되는 오디오 신호를 음성 부호화하여 전송하는 제 2음성 부호화기; 및
    상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 상기 전처리 필터로 제공하고, 상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 필터 이득 및 스위치 제어기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
  2. 제 1항에 있어서,
    상기 전처리 필터는,
    상기 입력되는 오디오 신호를 주파수 영역으로 변환하는 주파수 변환기;
    상기 주파수 변환기에서 주파수 영역으로 변환된 오디오 신호에, 상기 필터 이득 값을 곱하여 출력하는 주파수 필터; 및
    상기 주파수 필터에서 출력되는 오디오 신호를 시간 영역으로 변환하는 역주파수 변환기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
  3. 제 1항 또는 제 2항에 있어서,
    상기 필터 이득 및 스위치 제어기는,
    상기 차분기에서 출력되는 오차 신호와 상기 전처리 필터로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 주파수 대역별 SNR 계산기;
    상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 주파수 대역별 필터 이득 계산기;
    상기 필터 이득의 편차를 조절하여 상기 전처리 필터로 제공하는 후처리기; 및
    상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 스위치 제어기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
  4. 제 3항에 있어서,
    상기 후처리기는, 상기 필터 이득을 이전 프레임에 입력된 오디오 신호에 대한 필터 이득을 기준으로 일정 범위 내로 제한하는 것을 특징으로 하는 오디오 신호 전송 장치.
  5. 제 3항에 있어서,
    상기 후처리기는, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 직선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 장치.
  6. 제 3항에 있어서,
    상기 후처리기는, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 곡선으로 연결하여 정하는 것을 특징으로 하는 오디 오 신호 전송 장치.
  7. 제 3항에 있어서,
    상기 스위치 제어기는, 상기 오차 신호의 에너지 변화율이 0.1 이하일 경우, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 것을 특징으로 하는 오디오 신호 전송 장치.
  8. 제 3항에 있어서,
    상기 스위치 제어기는, 상기 필터 이득의 계산이 반복된 횟수가, 정해진 값에 도달한 경우, 상기 오디오 신호를 상기 제 2 음성 부호화기로 출력하도록 제어하는 것을 특징으로 하는 오디오 신호 전송 장치.
  9. 제 1항에 있어서,
    상기 제 1음성 부호화기 및 합성기는, 선형예측 분석기 및 합성기를 포함하 는 것을 특징으로 하는 오디오 신호 전송 장치.
  10. 제 1항에 있어서,
    상기 제 1음성 부호화기 및 합성기는, 피치 분석기 및 합성기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
  11. 제 1항에 있어서,
    상기 제 1음성 부호화기 및 합성기는, FCB(Fixed-CodeBook) 분석기 및 합성기를 포함하는 것을 특징으로 하는 오디오 신호 전송 장치.
  12. 입력되는 오디오 신호를 프레임 별로 전처리하고 부호화하여 전송하는 오디오 신호 전송 방법에 있어서,
    프레임 단위로 입력되는 오디오 신호를 주파수 영역으로 변환한 뒤 각 주파수 성분에 필터 이득 값을 곱하고, 상기 필터 이득 값이 곱해진 주파수 영역의 오디오 신호를 시간 영역으로 변환하여 출력하는 전처리 과정;
    상기 전처리 과정 후 출력되는 오디오 신호를 음성 부호화하고, 상기 부호화된 오디오 신호를 다시 복호하여 합성하는 과정;
    상기 합성되어 출력되는 오디오 신호와 상기 전처리 과정으로 입력되는 오디오 신호의 오차를 계산하여 오차 신호를 출력하는 과정;
    상기 오차 신호와 상기 전처리 과정으로 입력되는 오디오 신호를 이용하여 상기 필터 이득을 계산하여 제공하는 과정; 및
    상기 오차 신호의 에너지 변화율이 설정된 기준값보다 작은 경우에, 상기 오디오 신호를 음성 부호화하여 전송하는 과정을 포함하는 것을 특징으로 하는 오디오 신호 전송 방법.
  13. 제 12항에 있어서,
    상기 필터 이득을 계산하는 과정은,
    상기 오차 신호와 상기 전처리 과정으로 입력되는 오디오 신호를 각각 주파수 영역으로 변환하여 각 주파수 대역에 대해 SNR을 계산하는 단계;
    상기 계산된 SNR을 이용하여 각 주파수 대역에 대해 상기 필터 이득을 계산하는 단계; 및
    상기 필터 이득의 편차를 조절하여 상기 전처리 과정으로 제공하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 전송 방법.
  14. 제 13항에 있어서,
    상기 필터 이득의 편차 조절은, 상기 필터 이득을 이전 프레임에 입력된 오디오 신호에 대한 필터 이득을 기준으로 일정 범위 내로 제한하는 것을 특징으로 하는 오디오 신호 전송 방법.
  15. 제 13항에 있어서,
    상기 필터 이득의 편차 조절은, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 직선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 방법.
  16. 제 13항에 있어서,
    상기 필터 이득의 편차 조절은, 상기 각 주파수 대역별 필터 이득을, 각 주파수 대역의 중심 주파수에서의 필터 이득으로 정하고, 나머지 주파수 성분들의 필터 이득은 상기 각 중심 주파수의 필터 이득을 곡선으로 연결하여 정하는 것을 특징으로 하는 오디오 신호 전송 방법.
  17. 제 12항에 있어서,
    상기 오디오 신호를 음성 부호화하여 전송하는 과정은, 상기 오차 신호의 에너지 변화율이 0.1 이하일 경우에 전송함을 특징으로 하는 오디오 신호 전송 방법.
  18. 제 12항에 있어서,
    상기 오디오 신호를 음성 부호화하여 전송하는 과정은, 상기 필터 이득의 계산이 반복된 횟수가 정해진 값에 도달한 경우에 전송함을 특징으로 하는 오디오 신호 전송 방법.
KR1020050084780A 2005-09-12 2005-09-12 오디오 신호 전송 장치 및 방법 KR100735246B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050084780A KR100735246B1 (ko) 2005-09-12 2005-09-12 오디오 신호 전송 장치 및 방법
US11/519,219 US20070088546A1 (en) 2005-09-12 2006-09-12 Apparatus and method for transmitting audio signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050084780A KR100735246B1 (ko) 2005-09-12 2005-09-12 오디오 신호 전송 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20070030035A KR20070030035A (ko) 2007-03-15
KR100735246B1 true KR100735246B1 (ko) 2007-07-03

Family

ID=37949206

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050084780A KR100735246B1 (ko) 2005-09-12 2005-09-12 오디오 신호 전송 장치 및 방법

Country Status (2)

Country Link
US (1) US20070088546A1 (ko)
KR (1) KR100735246B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US10215736B2 (en) * 2015-10-23 2019-02-26 International Business Machines Corporation Acoustic monitor for power transmission lines

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040033425A (ko) * 2002-10-14 2004-04-28 와이더덴닷컴 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
KR20040064064A (ko) * 2003-01-09 2004-07-16 와이더덴닷컴 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
WO1999062056A1 (fr) * 1998-05-27 1999-12-02 Ntt Mobile Communications Network Inc. Decodeur vocal et procede de decodage vocal
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6754630B2 (en) * 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
WO2000065872A1 (en) * 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
KR100304666B1 (ko) * 1999-08-28 2001-11-01 윤종용 음성 향상 방법
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1339040B1 (en) * 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US6694293B2 (en) * 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040033425A (ko) * 2002-10-14 2004-04-28 와이더덴닷컴 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
KR20040064064A (ko) * 2003-01-09 2004-07-16 와이더덴닷컴 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법

Also Published As

Publication number Publication date
KR20070030035A (ko) 2007-03-15
US20070088546A1 (en) 2007-04-19

Similar Documents

Publication Publication Date Title
KR102636396B1 (ko) 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
US5933803A (en) Speech encoding at variable bit rate
US7729905B2 (en) Speech coding apparatus and speech decoding apparatus each having a scalable configuration
JP7085640B2 (ja) 快適雑音の生成のサポート
TW580691B (en) Method and apparatus for interoperability between voice transmission systems during speech inactivity
US7263480B2 (en) Multi-channel signal encoding and decoding
JP5192630B2 (ja) 符号化音響信号の知覚的に改善した増強
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2004509366A (ja) 複数チャネル信号の符号化及び復号化
US7016832B2 (en) Voiced/unvoiced information estimation system and method therefor
KR20190057052A (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
CN102985968A (zh) 处理音频信号的方法和装置
EP1301018A1 (en) Apparatus and method for modifying a digital signal in the coded domain
EP1726006A2 (en) Method of comfort noise generation for speech communication
CA2956019C (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
CA2378035A1 (en) Coded domain noise control
KR100735246B1 (ko) 오디오 신호 전송 장치 및 방법
US20080059154A1 (en) Encoding an audio signal
RU2237296C2 (ru) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
JPH05158495A (ja) 音声符号化伝送装置
JP2762938B2 (ja) 音声符号化装置
WO2008076534A2 (en) Code excited linear prediction speech coding
CN116110424A (zh) 一种语音带宽扩展方法及相关装置
WO2000057400A1 (en) Method, devices and system for generating background noise in a telecommunications system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee