KR100785471B1 - 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 - Google Patents

통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 Download PDF

Info

Publication number
KR100785471B1
KR100785471B1 KR1020060001901A KR20060001901A KR100785471B1 KR 100785471 B1 KR100785471 B1 KR 100785471B1 KR 1020060001901 A KR1020060001901 A KR 1020060001901A KR 20060001901 A KR20060001901 A KR 20060001901A KR 100785471 B1 KR100785471 B1 KR 100785471B1
Authority
KR
South Korea
Prior art keywords
audio signal
channel energy
channel
channels
energy
Prior art date
Application number
KR1020060001901A
Other languages
English (en)
Other versions
KR20070074132A (ko
Inventor
정재웅
박섭형
유종규
Original Assignee
와이더댄 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 와이더댄 주식회사 filed Critical 와이더댄 주식회사
Priority claimed from KR1020060001902A external-priority patent/KR100760905B1/ko
Priority to KR1020060001901A priority Critical patent/KR100785471B1/ko
Priority to PCT/KR2007/000115 priority patent/WO2007078186A1/en
Priority to JP2008549428A priority patent/JP5277368B2/ja
Priority to US12/160,090 priority patent/US8145479B2/en
Priority to EP07700892A priority patent/EP1977419A4/en
Publication of KR20070074132A publication Critical patent/KR20070074132A/ko
Publication of KR100785471B1 publication Critical patent/KR100785471B1/ko
Application granted granted Critical
Priority to US13/426,411 priority patent/US8359198B2/en
Priority to JP2012135078A priority patent/JP5539446B2/ja
Priority to US13/736,754 priority patent/US8719013B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42017Customized ring-back tones

Abstract

본 발명은 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호의 처리 장치에 관한 것으로서, 더욱 상세하게는 통신망을 통해 가입자 단말기로 전송되는 오디오 신호를 처리하여 상기 오디오 신호를 부호화하는 코덱 모듈에서 상기 오디오 신호를 음성 신호로 판단할 수 있도록 함으로써, 가입자 단말기로 전송되는 오디오 신호의 음질 저하를 방지하는 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호 처리 장치에 관한 것이다. 본 발명에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호를 하나 이상의 채널로 분리하고, 상기 분리된 채널 각각에 대한 채널 에너지를 측정하며, 상기 채널 에너지 중에 특정 채널 에너지를 선택하여 증폭함으로써, 코덱 모듈에서 상기 특정 채널 에너지가 증폭된 상기 오디오 신호를 음성 신호로 판단하여 부호화할 수 있다.
오디오 신호 처리 장치, 통신망, 음성 코덱, 오디오 신호, 음성 신호

Description

통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호 처리 장치{METHOD OF PROCESSING AUDIO SIGNALS FOR IMPROVING THE QUALITY OF OUTPUT AUDIO SIGNAL WHICH IS TRANSFERRED TO SUBSCRIBER’S TERMINAL OVER NETWORKS AND AUDIO SIGNAL PROCESSING APPARATUS OF ENABLING THE METHOD}
도 1은 본 발명의 일실시예에 따른 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법을 도시한 흐름도이다.
도 2는 본 발명의 다른 실시예에 따른 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법을 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 따른 오디오 신호 처리 장치의 내부 구성을 도시한 블록도이다.
도 4는 본 발명의 다른 실시예에 따른 오디오 신호 처리 장치의 내부 구성을 도시한 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
300: 오디오 신호 처리 장치
301: 채널 분리부
302: 채널 측정부
303: 채널 에너지 증폭부
본 발명은 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호 처리 장치에 관한 것으로서, 더욱 상세하게는 통신망을 통해 가입자 단말기로 전송되는 오디오 신호를 처리하여 상기 오디오 신호를 부호화하는 코덱 모듈에서 상기 오디오 신호를 음성 신호로 판단할 수 있도록 함으로써, 가입자 단말기로 전송되는 오디오 신호의 음질 저하를 방지하는 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호 처리 장치에 관한 것이다.
통신 단말기에서 제공하는 멀티미디어 서비스 중의 하나인 링백톤(RBT: ring back tone) 대체음 제공 서비스는 발신 단말기에서 가입자 단말기로 호 연결을 요청하거나 가입자 단말기에서 호 연결을 요청하는 경우, 가입자 단말기의 사용자로부터 선정된(predetermined) 오디오 신호를 통신망을 통해 발신 단말기 또는 가입자 단말기로 전송하는 서비스이다. 일례로, 상술한 링백톤 대체음 제공 서비스는 가입자 단말기에서 착신 단말기로 호 연결을 요청한 경우, 착신 단말기의 상기 제2 사용자가 훅 오프(hook off) 등의 착신 응답을 하기 전까지 상기 가입자 단말기로 상기 오디오 신호 "사랑합니다"를 상기 가입자 단말기로 전송하고, 발신 단말기에서 가입자 단말기로 호 연결을 요청한 경우, 가입자 단말기의 사용자가 훅 오프 (hook off) 등의 착신 응답을 하기 전까지 상기 발신 단말기로 상기 오디오 신호 "사랑합니다"를 전송하는 방식으로 동작한다.
일반적으로 통신망에서는 발신자 단말기 또는 착신자 단말기(가입자 단말기)로 전송되는 오디오 신호를 오디오 신호 전용 코덱을 이용하여 부호화하지 않고, 선형 예측 부호화(LPC: Linear Predictive Coding) 계열의 음성 코덱을 이용하여 부호화한다. 그러나, 오디오 신호를 LPC 계열의 음성 코덱으로 부호화하는 경우, 발신 단말기 또는 가입자 단말기에서 재생되는 오디오 신호는 아래의 이유로 인해 원본 오디오 신호에 비하여 왜곡되거나, 오디오 신호의 재생 중에 편안한 잡음(comfort noise)이 재생되는 경우가 발생한다.
이동 전화망에 사용되는 음성 채널의 대역폭은 64kbps인 유선 전화에 비해서 매우 좁기 때문에 음성 신호를 저 전송률(low-bitrate) 음성 코덱으로 압축하여 전송한다. 이동 전화망에 사용되는 대부분의 음성 코덱은 LPC 기반의 압축 방식들이다. LPC 계열의 음성 압축 방법은 사용자의 발성 구조에 최적화된 모델을 사용하고 있어서, 사용자의 음성 신호를 중, 저 전송률로 압축하는데 매우 효율적일 수 있으나, 이러한 LPC 계열의 음성 코덱으로 오디오 신호를 압축할 경우 음질 저하 문제가 발생할 수 있다. 그 이유는,
(1) LPC 계열의 음성 코덱이 음성 압축을 위해 추출하는 가장 중요한 파라미터인 포먼트(formant) 주파수와 피치(pitch) 주기가 오디오 신호에서는 제대로 추출되지 않을 수 있다는 것이다. 피치는 음성 기본 주파수(fundamental frequency: 기본 주기의 역수)에 해당하는 파라미터로 성대의 주기적인 떨림에 의해 생성되고, 음성 신호에 존재하는 피치의 경우 대략 50~500Hz에 존재하지만 오디오 신호의 경우 이보다 훨씬 넓은 주파수 영역에서 피치가 존재할 수도 있다. 또한, 음성 신호는 피치가 하나만 존재하지만 오디오 신호의 경우 피치가 여러 개 존재할 수 있다.
(2) 오디오 신호의 스펙트럼이 음성 신호의 스펙트럼에 비해 매우 복잡하기 때문이다. 스펙트럼이 단순한 음성 신호의 경우 파라미터 추출 후 남은 잔여 신호를 코드북(codebook)으로 상대적으로 충실하게 모델링 할 수 있지만 오디오 신호의 경우 그렇지 않다.
(3) LPC 계열의 음성 코덱에서 VAD(Voice Activity Detection) 및 DTX(Discontinuous Transmission)의 사용이 그 이유가 될 수 있다. 사용자가 단말기를 통해 대화하는 경우, 실제 음성 신호가 오고 가는 시간은 통계적으로 전체 통화 시간의 50%를 넘지 아니하므로, 음성 신호가 포함되지 않은 구간에서는 음성 신호를 전송하지 않기 위해 DTX를 사용한다. 이로 인해 가입자 단말기에서는 전력 소모를 줄일 수 있으며, 에어 인터페이스(air interface)에서 전체 간섭(interference) 레벨을 줄일 수 있어 주파수 효율을 향상시킬 수 있다. DTX는 VAD에 의해 동작 여부가 결정된다. VAD와 DTX의 동작을 설명하면, VAD는 상기 음성 코덱으로부터 추출된 상기 오디오 신호에 대한 하나 이상의 파라미터를 분석하고, 상기 하나 이상의 파라미터에 대한 음성 구간 또는 묵음 구간 여부를 판단하며, 1) 상기 판단 결과, 상기 음성 구간인 경우, DTX(Discontinuous Transmission)에서 상기 추출된 하나 이상의 파라미터를 수신측 복호화기로 전송하고, 상기 가입자 단말기에서는 상기 파라미터에 기초하여 상기 오디오 신호를 재생한다. 또한, 2) 판단 결과, 오디오 신호가 묵음 구간인 경우, DTX에서 최소한의 파라미터를 생성하여 수신측 복호화기로 전송하고, 상기 가입자 단말기에서는 상기 파라미터에 따른 편안한 잡음(comfort noise)을 재생한다. 이와 같이, 상기 음성 코덱에서 정상적인 오디오 신호를 묵음 구간으로 판단하는 경우, 가입자 단말기에서는 링백톤 구간에 전송되는 상기 오디오 신호를 편안한 잡음으로 재생하는 경우가 발생할 수 있다. 실제, 다수의 이동통신 사업자가 상술한 링백톤 대체음 제공 서비스를 하고 있지만, 이러한 링백톤 대체음 재생 구간에서 음질의 열화로 해당 오디오 신호가 들리지 않거나 크게 왜곡되어 가입자 단말기로 전송되는 경우가 많다.
VAD가 오디오 신호를 음성 신호가 아닌 것으로 판단하여 수신측에서 끊김 현상이 발생하거나 오디오 신호를 대신하여 편안한 잡음으로 재생하는 경우를 방지하기 위해 1) 기지국과 단말기의 코덱을 변경하는 방법, 2) 오디오 신호를 데이터망을 통해 전송하는 방법이 있을 수 있다. 그러나, 위 두 가지 경우는 현재 구축되어 있는 많은 시스템에 변경을 가져오게 되고, 그에 따른 비용의 문제가 발생한다.
따라서, 상술한 일례와 같이 통신망을 통하여 가입자 단말기로 링백톤 대체음을 전송하는 경우는 물론, 통신망을 통하여 소정의 오디오 신호를 전송하는 모든 응용례에 있어서, 통신망의 음성 코덱에서 특정 오디오 신호에 대한 부호화 수행 시 묵음 구간으로 판단하는 구간을 음성 구간으로 판단할 수 있게 하는 방법이 요구되고 있다.
본 발명은 상술한 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 통 신망을 통하여 가입자 단말기로 링백톤 대체음 등의 오디오 신호를 전송하는 경우, 통신망의 음성 코덱에서 상기 오디오 신호의 프레임을 음성 구간으로 판단할 확률을 높임으로써, 가입자 단말기로 전송되는 오디오 신호의 음질을 높이는 것을 그 목적으로 한다.
또한, 본 발명은 통신망을 통하여 가입자 단말기로 링백톤 대체음 등의 오디오 신호를 전송하는 경우, 통신망의 음성 코덱에서 묵음 구간으로 판단하지 않도록 오디오 신호를 전처리(pre-processing)함으로써, 보다 좋은 음질의 링백톤 대체음을 제공하는 것을 그 목적으로 한다.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 처리 방법은, 상기 오디오 신호를 하나 이상의 채널로 분리하는 단계; 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 에너지 중 특정 채널 에너지를 선택하는 단계; 상기 특정 채널 에너지를 증폭하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 실시예에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 처리 방법은, 상기 오디오 신호를 하나 이상의 채널로 분리하는 단계; 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 에너지 중 특정 채널 에너지를 선택하는 단계; 및 상기 특정 채널 에너지를 갖는 채널 이외의 채널 에너지를 감소시키는 단계를 포함하는 것을 특징으로 한다.
참고로 본 명세서에서 사용되는 단말기는 컴퓨터 단말기, PSTN(Public Switched Telephone Network) 단말기, VoIP, SIP(Session Initiation Protocol), Megaco, PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, 핸드 헬드 PC(Hand-Held PC), CDMA-2000(1X, 3X)폰, WCDMA(Wideband CDMA)폰, 듀얼 밴드/듀얼 모드(Dual Band/Dual Mode)폰, GSM(Global Standard for Mobile)폰, MBS(Mobile Broadband System)폰, 또는 위성/지상파 DMB(Digital Multimedia Broadcasting)폰 중 어느 하나일 수 있다.
이하 첨부된 도면을 참조하여 본 발명에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법 및 상기 방법을 채용한 오디오 신호 처리 장치에 대하여 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법을 도시한 흐름도이다.
도 1에 도시되어 있는 것과 같이, 본 발명에 따른 오디오 신호의 처리 방법은 크게 (1) 오디오 신호에 대한 전처리(pre-processing) 과정 및 (2) 전처리된 오디오 신호에 대한 부호화 과정으로 구성될 수 있다. 이러한 전처리 과정은 후술하는 단계(101) 내지 단계(104)로 구성될 수 있고, 전처리가 완료된 오디오 신호에 대한 부호화 과정은 후술하는 단계(105) 내지 단계(108)로 구성될 수 있다.
먼저, 단계(101)에서 오디오 신호 처리 장치는 상기 오디오 신호에 대한 주파수 분석을 통해 상기 오디오 신호를 하나 이상의 채널로 분리한다.
본 발명의 일실시예에 따르면, 오디오 신호 처리 장치는 FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호를 주파수 별로 하나 이상의 채널로 분리할 수 있다. 일례로, 상기 오디오 신호 처리 장치는 상기 오디오 신호를 상기 FFT 알고리즘을 이용하여 "16개"의 채널로 분리할 수 있다.
단계(102)에서 상기 오디오 신호 처리 장치는 상기 채널 각각에 대한 제1 채널 에너지를 측정한다.
단계(103)에서 상기 오디오 신호 처리 장치는 상기 측정된 하나 이상의 제1 채널 에너지 중 특정 채널 에너지를 선택한다. 일례로 에너지가 최대인 채널을 특정 채널로 선택 할 수 있다.
단계(104)에서 상기 오디오 신호 처리 장치는 선택된 특정 채널 에너지에 소정의 증폭 계수를 승산하여 상기 특정 채널 에너지를 증폭한다.
본 발명에 따르면, 상기 오디오 신호 처리 장치에서 상기 특정 채널 에너지를 증폭하는 경우, 후술하는 바와 같은 상기 채널에 대한 신호대잡음비를 증가시킴으로써, 코덱(CODEC) 모듈에서 상기 오디오 신호를 음성 신호로 판단할 확률을 높일 수 있다.
본 발명의 일실시예에 따르면, 상기 오디오 신호 처리 장치는 상기 채널 각각에 대한 제1 배경 잡음을 추정하고, 상기 추정된 제1 배경 잡음에 따라 선택적으로 상기 특정 채널 에너지에 소정의 증폭 계수를 승산하여 상기 특정 채널 에너지를 증폭할 수 있다. 일례로, 상기 추정된 제1 배경 잡음이 소정의 기준치 이하인 경우는 상기 특정 채널 에너지를 증폭하지 않고, 상기 제1 배경 잡음이 상기 기준치를 초과하는 경우에 상기 특정 채널 에너지를 증폭할 수 있다.
상술한 단계(101) 내지 단계(104)를 거친 오디오 신호는 본 발명에 따른 코덱모듈로 입력되어 통신망을 통해 전송되기 위해 부호화될 수 있다. 이러한 부호화 과정은 아래 단계(105) 내지 단계(108)로 구성될 수 있다.
단계(105)에서 상기 오디오 신호를 부호화하는 상기 코덱(CODEC) 모듈은 상기 제1 특정 채널 에너지가 증폭된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 제2 채널 에너지를 측정하고, 상기 채널 각각에 대한 제2 배경 잡음을 추정(estimation)한다. 즉, 상기 제1 채널 에너지는 상기 오디오 신호에 대한 전처리 과정에서 측정된 채널 에너지이고, 상기 제2 채널 에너지는 상기 오디오 신호에 대한 전처리 이후의 각각의 채널에 대한 채널 에너지이다.
또한, 상기 제2 배경 잡음은 수학식 1과 같이 추정할 수 있다.
Figure 112006001121959-pat00001
상기
Figure 112006001121959-pat00002
는 프레임
Figure 112006001121959-pat00003
에서
Figure 112006001121959-pat00004
번째 채널의 채널 에너지이고, 상기
Figure 112006001121959-pat00005
는 프레임
Figure 112006001121959-pat00006
에서
Figure 112006001121959-pat00007
번째 채널의 배경 잡음이며, 상기
Figure 112006001121959-pat00008
는 채널의 개수이다.
본 발명의 일실시예에 따르면, 상기 코덱(CODEC) 모듈은 AMR VAD OPTION 2를 이용할 수 있다.
본 발명의 다른 실시예에 따르면, 상기 코덱(CODEC) 모듈은 상기 측정된 하나 이상의 제2 채널 에너지 중 제2 특정 채널 에너지와 상기 하나 이상의 제2 채널 에너지의 평균값을 비교하여 상기 제2 특정 채널 에너지가 상기 평균값보다 큰 경 우 상기 오디오 신호를 정현파로 판단할 수 있다. 당업자라면 주지하는 것과 같이, 소정의 신호가 정현파로 판단된다는 것은, 해당 신호가 특정 주파수 성분이 강한 신호로 해석될 수 있고, 이러한 신호는 음성 신호로 판단될 가능성이 높은 신호임을 의미한다.
상기 제2 특정 채널 에너지를 산출하기 위해서 아래의 수학식 2가 이용될 수 있다.
Figure 112006001121959-pat00009
상기
Figure 112006001121959-pat00010
는 프레임
Figure 112006001121959-pat00011
에서
Figure 112006001121959-pat00012
번째 채널의 채널 에너지이고, 상기
Figure 112006001121959-pat00013
는 채널의 개수이며, 상기
Figure 112006001121959-pat00014
는 상기 제2 채널 에너지의 평균값이다.
수학식 1을 참조하면, 상기 오디오 신호 처리 장치에서 상기 제1 특정 채널 에너지를 증폭하는 경우, 상기 제1 특정 채널 에너지를 갖는 채널의 배경 잡음도 함께 증폭된다. 본 발명에 따르면, 상술한 단계(101) 내지 단계(104)를 거쳐 전처리된 오디오 신호의 경우, 이미 특정 채널 에너지를 갖는 채널의 에너지가 증폭된 상태이므로, 상기 코덱(CODEC) 모듈에서는 수학식 2를 참조하여 산출한 상기 제2 특정 채널 에너지 및 다른 채널의 채널 에너지 평균값을 비교하여 상기 전처리된 오디오 신호를 정현파로 판단할 확률이 높아지게 된다.
상기 수학식 1을 참조하면, 채널 전체에 대한 평균 채널 에너지에 비해 특정 채널의 채널 에너지가 상당히 큰 경우, φ(m)은 커지게 되고, 평균 채널 에너지에 비해 특정 채널의 채널 에너지가 그리 크지 아니한 경우 φ(m)은 작아진다. 일례로, AMR VAD OPTION 2에서는 φ(m)이 10보다 클 경우 해당 오디오 신호를 정현파라고 가정하고, 정현파가 검출된 경우 AMR VAD OPTION 2는 배경 잡음을 증폭시키지 아니한다. 즉, 특정 채널의 채널 에너지를 증폭시킴으로써 전체 채널의 신호대잡음비를 크게 만들어 주고 배경 잡음은 갱신되지 않도록 할 수 있다. 또한, 상대적으로 특정 채널 에너지를 갖는 채널 에너지에 대해서만 증폭이 수행되므로, 상기 전처리된 오디오 신호에 대한 제2 채널 에너지 및 상기 제2 배경 잡음을 이용하여 측정되는 전체 채널의 신호대잡음비를 개선시킬 수 있다.
단계(106)에서 상기 코덱(CODEC) 모듈은 상기 채널 각각에 대한 제2 채널 에너지 및 상기 제2 배경 잡음을 이용하여 상기 채널 각각에 대한 신호대잡음비(SNR: signal-to-noise ratio)를 측정한다. 상기 신호대잡음비는 수학식 3과 같이 측정할 수 있다.
Figure 112006001121959-pat00015
상기
Figure 112006001121959-pat00016
는 프레임
Figure 112006001121959-pat00017
에서
Figure 112006001121959-pat00018
번째 채널의 채널 에너지이고, 상기
Figure 112006001121959-pat00019
는 프레임
Figure 112006001121959-pat00020
에서
Figure 112006001121959-pat00021
번째 채널의 배경 잡음이며, 상기
Figure 112006001121959-pat00022
는 채널의 개수이다.
단계(107)에서 상기 코덱(CODEC) 모듈은 상기 측정된 채널 각각에 대한 신호대잡음비에 기초하여 음성 거리를 산출한다. 본 발명의 일실시예에 따르면, 상기 음성 거리는 상기 채널 각각에 대한 상기 신호대잡음비를 합산하여 산출될 수 있다.
단계(108)에서 상기 코덱(CODEC) 모듈은 상기 음성 거리가 선정된(predetermined) 문턱값 이상인 경우, 상기 오디오 신호를 음성 신호로 판단하고 상기 오디오 신호를 부호화한다.
본 발명에 따르면, 상기 채널 각각에 대하여 합산된 신호대잡음비, 즉 음성 거리는 전처리 과정에서 증폭된 제1 특정 채널 에너지로 인해 전처리 이전의 오디오 신호에 대한 음성 거리 보다 증가된 음성 거리를 갖게 됨으로써, 상기 코덱(CODEC) 모듈에서 상기 오디오 신호를 음성 신호로 판단할 확률을 높일 수 있다.
본 발명의 일실시예에 따르면, 상기 문턱값은 상기 채널 각각에 대한 상기 신호대잡음비에 기초하여 장기 첨두 신호대잡음비(long term Peak Signal to Noise Ratio)를 측정하고, 상기 측정된 장기 첨두 신호대잡음비에 따라 상기 문턱값을 결정할 수 있다. 즉, 상기 문턱값은 상기 측정된 장기 첨두 신호대잡음비와 반비례 관계를 유지하고, 상기 장기 첨두 신호대잡음비가 소정의 기준치보다 큰 경우 선정된 제1 문턱값으로 결정하고, 상기 장기 첨두 신호대잡음비가 소정의 기준치보다 작은 경우 선정된 제2 문턱값으로 결정할 수 있다. 상기 제1 문턱값은 상기 제2 문턱값 보다 작다.
도 2는 본 발명의 다른 실시예에 따른 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법을 도시한 흐름도이다.
단계(201 내지 203) 및 단계(205 내지 208)은 도 1에서 도시한 단계(101 내지 103) 및 단계(106 내지 108)와 동일하므로 그 도시를 생략하고, 단계(204) 및 단계(205)만을 도시한다.
단계(204)에서 상기 오디오 신호 처리 장치는 상기 선택된 특정 채널 에너지를 갖는 채널 이외의 채널 에너지에 소정의 증폭 계수를 승산하여 상기 채널 에너지를 감소시킨다. 즉, 상기 오디오 신호 처리 장치에서 상기 선택된 특정 채널 에너지를 갖는 채널 이외의 채널 에너지에 상기 증폭 계수를 승산하여 상기 채널 에너지를 감소시키는 경우, 상기 특정 채널 에너지를 제외한 채널 에너지가 감소하기 때문에 상대적으로 상기 특정 채널 에너지가 증가하게 된다.
단계(205)에서 상기 오디오 신호를 부호화하는 코덱(CODEC) 모듈은 상기 특정 채널 에너지를 갖는 채널 이외의 채널의 상기 채널 에너지가 감소된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 제2 채널 에너지를 측정하고, 상기 채널 각각에 대한 제2 배경 잡음을 추정(estimation)한다. 또한, 상기 제2 배경 잡음은 상기 수학식 1과 같이 추정할 수 있다.
도 3은 본 발명의 일실시예에 따른 오디오 신호 처리 장치의 내부 구성을 도시한 블록도이다.
도 3에서 도시된 바와 같이, 오디오 신호 처리 장치(300)는 채널 분리부(301), 채널 측정부(302), 채널 에너지 증폭부(303)를 포함한다.
채널 분리부(301)는 상기 오디오 신호에 대한 주파수 분석을 통해 상기 오디오 신호를 하나 이상의 채널로 분리한다. 본 발명에 일실시예에 따르면, 채널 분리부(301)는 FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호에 대한 주파수를 분석하고, 상기 분석을 통해 상기 오디오 신호를 하나 이상의 채 널로 분리할 수 있다.
채널 측정부(302)는 상기 채널 각각에 대한 제1 채널 에너지를 측정한다.
채널 에너지 증폭부(303)는 상기 측정된 하나 이상의 제1 채널 에너지 중 특정 채널 에너지를 선택하고, 상기 특정 채널 에너지에 소정의 증폭 계수를 승산하여 상기 특정 채널 에너지를 증폭한다.
상기 오디오 신호를 부호화하는 코덱(CODEC) 모듈(350)은 배경 잡음 추정부(351), 신호대잡음비 측정부(352), 정현파 판단부(353), 오디오 신호 부호화부(354)를 포함한다.
배경 잡음 추정부(351)는 상기 특정 채널 에너지가 증폭된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 제2 채널 에너지를 측정하고, 상기 채널 각각에 대한 제2 배경 잡음을 추정(estimation)한다. 본 발명의 일실시예에 따르면, 상기 코덱(CODEC) 모듈(400)은 AMR VAD OPTION 2를 이용할 수 있다.
신호대잡음비 측정부(352)는 상기 채널 각각에 대한 제2 채널 에너지 및 상기 제2 배경 잡음을 이용하여 상기 채널 각각에 대한 신호대잡음비(SNR: signal-to-noise ratio)를 측정한다. 본 발명의 일실시예에 따르면, 신호대잡음비 측정부(352)는 정현파 판단부(353)를 포함하고, 정현파 판단부(353)는 상기 측정된 하나 이상의 제2 채널 에너지 중 제2 특정 채널 에너지와 상기 하나 이상의 제2 채널 에너지의 평균값을 비교하여 상기 제2 특정 채널 에너지가 상기 평균값보다 큰 경우 상기 오디오 신호를 정현파로 판단한다.
오디오 신호 부호화부(354)는 상기 측정된 채널 각각에 대한 신호대잡음비에 기초하여 음성 거리를 산출하고, 상기 음성 거리가 선정된(predetermined) 문턱값 이상인 경우, 상기 오디오 신호를 음성 신호로 판단하고 상기 오디오 신호를 부호화한다.
또한, 본 발명의 일실시예에 따르면, 오디오 신호 부호화부(354)는 상기 채널 각각에 대한 상기 신호대잡음비를 합산하여 상기 음성 거리를 산출할 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 상기 문턱값은 상기 채널 각각에 대한 상기 신호대잡음비에 기초하여 장기 첨두 신호대잡음비를 측정하고, 상기 측정된 장기 첨두 신호대잡음비에 따라 상기 문턱값을 결정할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 오디오 신호 처리 장치의 내부 구성을 도시한 블록도이다.
도 4에서 도시된 바와 같이, 오디오 신호 처리 장치(400), 채널 분리부(401), 채널 측정부(402), 채널 에너지 감소부(403)를 포함한다.
채널 분리부(401)는 상기 오디오 신호에 대한 주파수 분석을 통해 상기 오디오 신호를 하나 이상의 채널로 분리한다. 본 발명에 일실시예에 따르면, 채널 분리부(401)는 FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호에 대한 주파수 분석하고, 상기 분석을 통해 상기 오디오 신호를 하나 이상의 채널로 분리할 수 있다.
채널 측정부(402)는 상기 채널 각각에 대한 제1 채널 에너지를 측정한다.
채널 에너지 감소부(403)는 상기 측정된 하나 이상의 제1 채널 에너지 중 특정 채널 에너지를 선택하고, 상기 선택된 특정 채널 에너지를 갖는 채널 이외의 채 널 에너지에 소정의 증폭 계수를 승산하여 상기 채널 에너지를 감소시킨다.
상기 오디오 신호를 부호화하는 코덱(CODEC) 모듈(450)은 배경 잡음 추정부(451), 신호대잡음비 측정부(452), 정현파 판단부(453), 오디오 신호 부호화부(454)를 포함한다.
배경 잡음 추정부(451)는 상기 특정 채널 에너지를 갖는 채널 이외의 채널의 상기 채널 에너지가 감소된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 제2 채널 에너지를 측정하고, 상기 채널 각각에 대한 제2 배경 잡음을 추정(estimation)한다. 본 발명의 일실시예에 따르면, 상기 코덱(CODEC) 모듈은 AMR VAD OPTION 2를 이용할 수 있다.
신호대잡음비 측정부(452)는 상기 채널 각각에 대한 제2 채널 에너지 및 상기 제2 배경 잡음을 이용하여 상기 채널 각각에 대한 신호대잡음비(SNR: signal-to-noise ratio)를 측정한다. 본 발명의 일실시예에 따르면, 신호대잡음비 측정부(452)는 정현파 판단부(453)를 포함하고, 정현파 판단부(453)는 상기 측정된 하나 이상의 제2 채널 에너지 중 제2 특정 채널 에너지와 상기 하나 이상의 제2 채널 에너지의 평균값을 비교하여 상기 제2 특정 채널 에너지가 상기 평균값보다 큰 경우 상기 오디오 신호를 정현파로 판단한다.
오디오 신호 부호화부(454)는 상기 측정된 채널 각각에 대한 신호대잡음비에 기초하여 음성 거리를 산출하고, 상기 음성 거리가 선정된(predetermined) 문턱값 이상인 경우, 상기 오디오 신호를 음성 신호로 판단하고 상기 오디오 신호를 부호화한다.
또한, 본 발명의 일실시예에 따르면, 오디오 신호 부호화부(454)는, 상기 채널 각각에 대한 상기 신호대잡음비를 합산하여 상기 음성 거리를 산출할 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 상기 문턱값은 상기 채널 각각에 대한 상기 신호대잡음비에 기초하여 장기 첨두 신호대잡음비를 측정하고, 상기 측정된 장기 첨두 신호대잡음비에 따라 상기 문턱값을 결정할 수 있다.
본 발명에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 출력 개선을 위한 오디오 신호의 처리 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명에 따른 통신망을 통해 가입자 단말기로 전송되는 오디오 신호를 하나 이상의 채널로 분리하고, 상기 분리된 채널 각각에 대한 채널 에너지를 측정하며, 상기 채널 에너지 중에 특정 채널 에너지를 선택하여 증폭함으로써, 코덱 모듈에서 상기 특정 채널 에너지가 증폭된 상기 오디오 신호를 음성 신호로 판단하여 부호화할 수 있다.
또한, 본 발명에 따르면, 통신망을 통해 가입자 단말기로 전송되는 오디오 신호를 하나 이상의 채널로 분리하고, 상기 분리된 채널 각각에 대한 채널 에너지를 측정하며, 상기 채널 에너지 중에 특정 채널 에너지를 선택하고, 상기 선택된 특정 채널 에너지를 갖는 채널 이외의 채널 에너지를 감소시킴으로써, 상기 채널 에너지가 감소된 상기 오디오 신호를 음성 신호로 판단하여 부호화할 수 있다.

Claims (23)

  1. 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 처리 방법에 있어서,
    상기 오디오 신호를 일정한 알고리즘에 따라 분석하여, 하나 이상의 채널로 분리하는 단계;
    상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 에너지 중 특정 채널 에너지를 선택하는 단계;
    상기 특정 채널 에너지를 증폭하는 단계
    를 포함하고,
    상기 오디오 신호를 일정한 알고리즘에 따라 분석하여, 하나 이상의 채널로 분리하는 상기 단계는,
    FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호를 하나 이상의 채널로 분리하는 단계이며,
    상기 특정 채널 에너지가 증폭된 상기 오디오 신호는 소정의 코덱 모듈에서 부호화(encoding) 되어 상기 가입자 단말기로 전송되고, 상기 코덱(CODEC) 모듈에서는,
    상기 오디오 신호에 대해 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 각각에 대한 배경 잡음을 추정(estimation)하는 단계;
    상기 채널 에너지 및 상기 배경 잡음을 이용하여 상기 채널 별 신호대잡음비(SNR: signal-to-noise ratio)를 측정하는 단계; 및
    상기 채널 별 신호대잡음비에 기초하여 음성 거리를 산출하고, 상기 산출된 음성 거리에 따라 상기 오디오 신호를 부호화하는 단계
    가 수행되며,
    상기 코덱(CODEC) 모듈은,
    AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  2. 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 처리 방법에 있어서,
    상기 오디오 신호를 일정한 알고리즘에 따라 분석하여, 하나 이상의 채널로 분리하는 단계;
    상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 에너지 중 특정 채널 에너지를 선택하는 단계; 및
    상기 특정 채널 에너지를 갖는 채널 이외의 채널 에너지를 감소시키는 단계
    를 포함하고,
    상기 오디오 신호를 일정한 알고리즘에 따라 분석하여, 하나 이상의 채널로 분리하는 상기 단계는,
    FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호를 하나 이상의 채널로 분리하는 단계이며,
    상기 특정 채널 에너지가 감소된 상기 오디오 신호는 소정의 코덱 모듈에서 부호화(encoding) 되어 상기 가입자 단말기로 전송되고, 상기 코덱(CODEC) 모듈에서는,
    상기 오디오 신호에 대해 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 각각에 대한 배경 잡음을 추정(estimation)하는 단계;
    상기 채널 에너지 및 상기 배경 잡음을 이용하여 상기 채널 별 신호대잡음비(SNR: signal-to-noise ratio)를 측정하는 단계; 및
    상기 채널 별 신호대잡음비에 기초하여 음성 거리를 산출하고, 상기 산출된 음성 거리에 따라 상기 오디오 신호를 부호화하는 단계
    가 수행되며,
    상기 코덱(CODEC) 모듈은,
    AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 특정 채널 에너지는 상기 채널 각각의 채널 에너지 중 최대값을 갖는 채널 에너지인 것을 특징으로 하는 오디오 신호의 처리 방법.
  4. 삭제
  5. 제1항 또는 제2항에 있어서,
    상기 코덱 모듈은,
    상기 신호대잡음비를 기초로 음성 거리를 산출하는 단계; 및
    상기 음성 거리가 선정된(predetermined) 문턱값(threshold) 이상인 경우, 상기 오디오 신호를 음성 신호로 판단하고, 상기 오디오 신호를 부호화 하는 단계
    를 더 수행하는 것을 특징으로 하는 오디오 신호의 처리 방법
  6. 제1항 또는 제2항에 있어서,
    상기 오디오 신호에 대해 상기 채널 각각에 대한 상기 채널 에너지를 측정하고, 상기 채널 각각에 대한 상기 배경 잡음을 추정(estimation)하는 상기 단계는,
    상기 측정된 채널 에너지 중 특정 채널 에너지와 상기 채널 에너지의 평균값을 비교하여 상기 특정 채널 에너지가 상기 평균값보다 큰 경우 상기 오디오 신호를 정현파로 판단하는 단계
    를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  7. 제5항에 있어서,
    상기 음성 거리를 산출하는 상기 단계는,
    상기 채널 각각에 대한 상기 신호대잡음비를 합산하여 상기 음성 거리를 산출하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  8. 제5항에 있어서,
    상기 문턱값은 상기 채널 각각에 대한 상기 신호대잡음비에 기초하여 장기 첨두 신호대잡음비(long term Peak Signal to Noise Ratio)를 측정하고, 상기 측정된 장기 첨두 신호대잡음비에 따라 상기 문턱값이 결정되는 것을 특징으로 하는 오디오 신호의 처리 방법.
  9. 삭제
  10. 삭제
  11. 제1항 또는 제2항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  12. 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의 처리 장치에 있어서,
    상기 오디오 신호를 일정한 알고리즘에 따라 분석하여, 하나 이상의 채널로 분리하는 채널 분리부;
    상기 채널 각각에 채널 에너지를 측정하는 채널 측정부; 및
    상기 측정된 채널 에너지 중 특정 채널 에너지를 선택하고, 상기 특정 채널 에너지를 증폭하는 채널 에너지 증폭부
    를 포함하고,
    상기 채널 분리부는,
    상기 일정한 알고리즘으로 FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호를 하나 이상의 채널로 분리하며,
    상기 특정 채널 에너지가 증폭된 상기 오디오 신호는 소정의 코덱 모듈에서 부호화(encoding) 되어 상기 가입자 단말기로 전송되고, 상기 코덱(CODEC) 모듈에서는,
    상기 오디오 신호에 대해 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 각각에 대한 배경 잡음을 추정(estimation)하는 단계;
    상기 채널 에너지 및 상기 배경 잡음을 이용하여 상기 채널 별 신호대잡음비(SNR: signal-to-noise ratio)를 측정하는 단계; 및
    상기 채널 별 신호대잡음비에 기초하여 음성 거리를 산출하고, 상기 산출된 음성 거리에 따라 상기 오디오 신호를 부호화하는 단계
    가 수행되며,
    상기 코덱(CODEC) 모듈은,
    AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하는 것을 특징으로 하는 오디오 신호의 처리 장치.
  13. 제12항에 있어서,
    상기 특정 채널 에너지는 상기 채널 각각의 채널 에너지 중 최대값을 갖는 채널 에너지인 것을 특징으로 하는 오디오 신호 처리 장치.
  14. 제12항에 있어서,
    상기 특정 채널 에너지는 상기 채널 각각의 채널 에너지 중 최대값을 갖는 채널 에너지이고,
    상기 채널 에너지 증폭부는,
    상기 특정 채널 에너지를 갖는 채널 이외의 채널 에너지를 감소시켜서 상기 특정 채널 에너지를 상대적으로 증폭하는 것을 특징으로 하는 오디오 신호 처리 장치.
  15. 제12항에 있어서,
    상기 분리부는,
    FFT(Fast Fourier Transform) 알고리즘을 이용하여 상기 오디오 신호를 하나 이상의 채널로 분리하는 것을 특징으로 하는 오디오 신호 처리 장치.
  16. 제8항에 있어서,
    상기 장기 첨두 신호대잡음비(long term Peak Signal to Noise Ratio)는,
    2회 이상 측정된 PSNR값의 데이터 베이스를 의미하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  17. 제1항 또는 제2항에 있어서,
    상기 AMR(Adaptive Multi Rate) 코덱은,
    ETSI(European Telecommunications Standards Institute)에서 GSM(Global System for Mobile communication)용으로 정의한 음성 코덱을 의미하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  18. 제1항 또는 제2항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하여, 상기 특정 채널 에너지가 증폭된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 각각에 대한 상기 배경 잡음을 추정하며,
    상기 배경 잡음은 하기 수학식 4을 이용하여 추정되는 것을 특징으로 하는 오디오 신호의 처리 방법.
    Figure 112007063363787-pat00027
    (상기
    Figure 112007063363787-pat00028
    는 프레임
    Figure 112007063363787-pat00029
    에서
    Figure 112007063363787-pat00030
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00031
    는 프레임
    Figure 112007063363787-pat00032
    에서
    Figure 112007063363787-pat00033
    번째 채널의 배경 잡음이며, 상기
    Figure 112007063363787-pat00034
    는 채널의 개수.)
  19. 제1항 또는 제2항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하여, 상기 측정된 채널 에니지와 상기 특정 채널 에너지의 평균값을 비교하여 상기 특정 채널 에너지가 상기 평균값보다 큰 경우 상기 오디오 신호를 정현파로 판단하며,
    상기 특정 채널 에너지는 하기 수학식 5를 이용하여 추정되는 것을 특징으로 하는 오디오 신호의 처리 방법.
    Figure 112007063363787-pat00035
    (상기
    Figure 112007063363787-pat00036
    는 프레임
    Figure 112007063363787-pat00037
    에서
    Figure 112007063363787-pat00038
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00039
    는 채널의 개수이며, 상기
    Figure 112007063363787-pat00040
    는 상기 제2 채널 에너지의 평균값.)
  20. 제1항 또는 제2항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용함으로써, 상기 채널 각각에 대한 채널 에너지 및 상기 배경 잡음을 이용하여 상기 채널 각각에 대한 신호대잡음비를 측정하며,
    상기 신호대잡음비는 하기 수학식 6을 이용하여 측정되는 것을 특징으로 하는 오디오 신호의 처리 방법.
    Figure 112007063363787-pat00041
    (상기
    Figure 112007063363787-pat00042
    는 프레임
    Figure 112007063363787-pat00043
    에서
    Figure 112007063363787-pat00044
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00045
    는 프레임
    Figure 112007063363787-pat00046
    에서
    Figure 112007063363787-pat00047
    번째 채널의 배경 잡음이며, 상기
    Figure 112007063363787-pat00048
    는 채널의 개수.)
  21. 제12항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하여, 상기 특정 채널 에너지가 증폭된 상기 오디오 신호에 대해, 상기 채널 각각에 대한 채널 에너지를 측정하고, 상기 채널 각각에 대한 상기 배경 잡음을 추정하며,
    상기 배경 잡음은 하기 수학식 7을 이용하여 추정되는 것을 특징으로 하는 오디오 신호의 처리 장치.
    Figure 112007063363787-pat00049
    (상기
    Figure 112007063363787-pat00050
    는 프레임
    Figure 112007063363787-pat00051
    에서
    Figure 112007063363787-pat00052
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00053
    는 프레임
    Figure 112007063363787-pat00054
    에서
    Figure 112007063363787-pat00055
    번째 채널의 배경 잡음이며, 상기
    Figure 112007063363787-pat00056
    는 채널의 개수.)
  22. 제12항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용하여, 상기 측정된 채널 에니지와 상기 특정 채널 에너지의 평균값을 비교하여 상기 특정 채널 에너지가 상기 평균값보다 큰 경우 상기 오디오 신호를 정현파로 판단하며,
    상기 특정 채널 에너지는 하기 수학식 8를 이용하여 추정되는 것을 특징으로 하는 오디오 신호의 처리 장치.
    Figure 112007063363787-pat00057
    (상기
    Figure 112007063363787-pat00058
    는 프레임
    Figure 112007063363787-pat00059
    에서
    Figure 112007063363787-pat00060
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00061
    는 채널의 개수이며, 상기
    Figure 112007063363787-pat00062
    는 상기 제2 채널 에너지의 평균값.)
  23. 제12항에 있어서,
    상기 코덱 모듈은, AMR(Adaptive Multi Rate) 코덱의 VAD(Voice Activity Detection)의 옵션 중에서, 제2 옵션(OPTION 2)을 이용함으로써, 상기 채널 각각에 대한 채널 에너지 및 상기 배경 잡음을 이용하여 상기 채널 각각에 대한 신호대잡음비를 측정하며,
    상기 신호대잡음비는 하기 수학식 9을 이용하여 측정되는 것을 특징으로 하는 오디오 신호의 처리 장치.
    Figure 112007063363787-pat00063
    (상기
    Figure 112007063363787-pat00064
    는 프레임
    Figure 112007063363787-pat00065
    에서
    Figure 112007063363787-pat00066
    번째 채널의 채널 에너지이고, 상기
    Figure 112007063363787-pat00067
    는 프레임
    Figure 112007063363787-pat00068
    에서
    Figure 112007063363787-pat00069
    번째 채널의 배경 잡음이며, 상기
    Figure 112007063363787-pat00070
    는 채널의 개수.)
KR1020060001901A 2006-01-06 2006-01-06 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 KR100785471B1 (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR1020060001901A KR100785471B1 (ko) 2006-01-06 2006-01-06 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
EP07700892A EP1977419A4 (en) 2006-01-06 2007-01-08 METHOD FOR PROCESSING AUDIO SIGNALS TO IMPROVE THE QUALITY OF AN AUDIO OUTPUT TRANSFERRED THROUGH A NETWORK TO SUBSCRIBER DEVICES, AND AUDIO SIGNAL PRE-PROCESSING DEVICE FOR ENABLING THE PROCESS
JP2008549428A JP5277368B2 (ja) 2006-01-06 2007-01-08 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
US12/160,090 US8145479B2 (en) 2006-01-06 2007-01-08 Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing
PCT/KR2007/000115 WO2007078186A1 (en) 2006-01-06 2007-01-08 Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method
US13/426,411 US8359198B2 (en) 2006-01-06 2012-03-21 Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal
JP2012135078A JP5539446B2 (ja) 2006-01-06 2012-06-14 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
US13/736,754 US8719013B2 (en) 2006-01-06 2013-01-08 Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060001901A KR100785471B1 (ko) 2006-01-06 2006-01-06 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
KR1020060001902A KR100760905B1 (ko) 2006-01-06 2006-01-06 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치

Publications (2)

Publication Number Publication Date
KR20070074132A KR20070074132A (ko) 2007-07-12
KR100785471B1 true KR100785471B1 (ko) 2007-12-13

Family

ID=38228470

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060001901A KR100785471B1 (ko) 2006-01-06 2006-01-06 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치

Country Status (5)

Country Link
US (3) US8145479B2 (ko)
EP (1) EP1977419A4 (ko)
JP (2) JP5277368B2 (ko)
KR (1) KR100785471B1 (ko)
WO (1) WO2007078186A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7962340B2 (en) * 2005-08-22 2011-06-14 Nuance Communications, Inc. Methods and apparatus for buffering data for use in accordance with a speech recognition system
KR100785471B1 (ko) 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
CN101159891B (zh) * 2007-08-17 2010-09-08 华为技术有限公司 语音激活检测控制的方法及其控制设备
US8762150B2 (en) * 2010-09-16 2014-06-24 Nuance Communications, Inc. Using codec parameters for endpoint detection in speech recognition
US9646626B2 (en) 2013-11-22 2017-05-09 At&T Intellectual Property I, L.P. System and method for network bandwidth management for adjusting audio quality
US9930114B2 (en) * 2014-10-28 2018-03-27 Empire Technology Development Llc Code-division-multiple-access (CDMA)-based network coding for massive memory servers

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050078524A (ko) * 2004-02-02 2005-08-05 (주)위트콤 오디오 정보 제공 시스템 및 그 방법

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6115453A (ja) * 1984-06-29 1986-01-23 Fujitsu Denso Ltd 被呼者応答検出回路方式
JP2989219B2 (ja) * 1990-05-18 1999-12-13 株式会社リコー 音声区間検出方式
JPH05323996A (ja) 1992-05-27 1993-12-07 Nippon Telegr & Teleph Corp <Ntt> 有音無音判定法
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
JPH09181815A (ja) * 1995-12-26 1997-07-11 Saitama Nippon Denki Kk 携帯電話機
JPH10116097A (ja) 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
JPH114481A (ja) 1997-06-11 1999-01-06 Kokusai Electric Co Ltd 携帯端末装置
JP2000047697A (ja) 1998-07-30 2000-02-18 Nec Eng Ltd ノイズキャンセラ
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP2001021600A (ja) 1999-07-07 2001-01-26 Nisshin Kiko Kk 電波検出装置
FR1094446T (fr) * 1999-10-18 2007-01-05 Lucent Technologies Inc Enregistrement de la parole avec compression du silence et génération de bruit de confort pour appareil de communication digitale
JP2001216000A (ja) * 1999-12-06 2001-08-10 Denso Corp 雑音抑制方法、音声信号処理方法、および信号処理回路
US7159233B2 (en) * 2000-01-28 2007-01-02 Sedna Patent Services, Llc Method and apparatus for preprocessing and postprocessing content in an interactive information distribution system
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
JP3670217B2 (ja) * 2000-09-06 2005-07-13 国立大学法人名古屋大学 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
US7505594B2 (en) * 2000-12-19 2009-03-17 Qualcomm Incorporated Discontinuous transmission (DTX) controller system and method
JP2002258899A (ja) * 2001-03-02 2002-09-11 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 雑音抑圧方法および雑音抑圧装置
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
US7765302B2 (en) * 2003-06-30 2010-07-27 Nortel Networks Limited Distributed call server supporting communication sessions in a communication system and method
KR100546758B1 (ko) 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
JP4700607B2 (ja) * 2003-07-12 2011-06-15 ケイティーフリーテル カンパニー リミテッド 電話発信中リングバックトーン代替音を利用して付加サービスの音源を変更およびプッシュする方法および装置
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
RU2368950C2 (ru) * 2004-06-01 2009-09-27 Нек Корпорейшн Система, способ и процессор для воспроизведения звука
JP2005316499A (ja) * 2005-05-20 2005-11-10 Oki Electric Ind Co Ltd 音声符号化装置
KR100785471B1 (ko) 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US20080051068A1 (en) * 2006-08-23 2008-02-28 Sbc Knowledge Ventures, L.P. Method and apparatus for presenting ring back tones

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050078524A (ko) * 2004-02-02 2005-08-05 (주)위트콤 오디오 정보 제공 시스템 및 그 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ETSI TS 126 094 version 4.0, 3GPP TS 26.094 version 4.0 Release 4, (2001.03) 1부.

Also Published As

Publication number Publication date
WO2007078186A1 (en) 2007-07-12
KR20070074132A (ko) 2007-07-12
US8145479B2 (en) 2012-03-27
US8359198B2 (en) 2013-01-22
EP1977419A1 (en) 2008-10-08
JP2009522914A (ja) 2009-06-11
US8719013B2 (en) 2014-05-06
US20120179459A1 (en) 2012-07-12
US20130124198A1 (en) 2013-05-16
JP5277368B2 (ja) 2013-08-28
US20090299740A1 (en) 2009-12-03
JP2012234184A (ja) 2012-11-29
JP5539446B2 (ja) 2014-07-02
EP1977419A4 (en) 2010-04-14

Similar Documents

Publication Publication Date Title
KR100974110B1 (ko) 배경 잡음 정보의 불연속 전송 및 정확한 재생을 위한 방법
JP5539446B2 (ja) 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
US7430506B2 (en) Preprocessing of digital audio data for improving perceptual sound quality on a mobile phone
JP3842821B2 (ja) 通信システムにおいて雑音を抑圧する方法および装置
US9420370B2 (en) Audio processing device and audio processing method
US6366880B1 (en) Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
RU2427077C2 (ru) Обнаружение эхосигнала
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
JP2008543194A (ja) オーディオ信号ゲイン制御装置及び方法
KR102417047B1 (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
US20040128126A1 (en) Preprocessing of digital audio data for mobile audio codecs
US20190080703A1 (en) Temporal offset estimation
US20070207817A1 (en) Sound Source Providing System Method And Program
US6711259B1 (en) Method and apparatus for noise suppression and side-tone generation
US20100158137A1 (en) Apparatus and method for suppressing noise in receiver
KR100760905B1 (ko) 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
KR100740373B1 (ko) 음악 제공 시스템, 멜로디 재생 제어 서버, 음악 제공 방법및 음악 제공용 프로그램
Nam et al. A preprocessing approach to improving the quality of the music decoded by an EVRC codec
CN101692685B (zh) 一种彩铃音质改善的方法和系统
KR100547898B1 (ko) 오디오 정보 제공 시스템 및 그 방법
KR100624694B1 (ko) 통화 연결음 음질개선장치 및 그 방법
US20120189108A1 (en) Voice communication apparatus
JP3917101B2 (ja) 携帯電話端末及び音声レベル制御プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120904

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131202

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141128

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20151201

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20161129

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee