KR20140111480A - 보코더 잡음 억제 방법 및 장치 - Google Patents

보코더 잡음 억제 방법 및 장치 Download PDF

Info

Publication number
KR20140111480A
KR20140111480A KR1020130025679A KR20130025679A KR20140111480A KR 20140111480 A KR20140111480 A KR 20140111480A KR 1020130025679 A KR1020130025679 A KR 1020130025679A KR 20130025679 A KR20130025679 A KR 20130025679A KR 20140111480 A KR20140111480 A KR 20140111480A
Authority
KR
South Korea
Prior art keywords
voice data
frame
vocoder
voice
data
Prior art date
Application number
KR1020130025679A
Other languages
English (en)
Inventor
김원철
류준상
정태균
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020130025679A priority Critical patent/KR20140111480A/ko
Priority to US13/963,342 priority patent/US9299351B2/en
Publication of KR20140111480A publication Critical patent/KR20140111480A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

보코더 잡음 억제 방법 및 장치를 제공한다. 상기 방법은, 채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받는 과정과, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성하는 과정과, 상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 상기 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 과정과, 상기 음성 데이터에서 톤 잡음이 검출되었으면 상기 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 과정을 포함한다. 이로써 본 발명은 채널 오류의 오판으로 인한 이상음을 신속하게 감쇠시킬 수 있다.

Description

보코더 잡음 억제 방법 및 장치{METHOD AND APPARATUS FOR SUPPRESSING VOCODER NOISE}
본 발명은 음성 디코딩에 관한 것으로서, 특히 음성 디코더(Voice Decoder)에서 음성 잡음을 억제하기 위한 방법 및 장치에 관한 것이다.
음성 코더(Voice Coder)와 음성 디코더(Voice Decoder)를 포함하는 보코더(Vocoder)는 음성 신호의 특성을 분석하여 생성한 파라미터들을 포함하는 데이터를 송신하고, 수신된 데이터의 파라미터들을 기반으로 음성을 합성하도록 구성되어 있다.
통신 네트워크, 특히 무선 채널을 통한 신호 송수신을 기반으로 하는 무선 통신 네트워크나 인터넷 프로토콜(Internet Protocol: IP) 환경에서 전송되는 데이터는 무선 전파 환경에 따라 전송 오류(Error)를 포함한 채로 수신될 수 있다. 따라서 이동 통신에 사용되는 보코더는 송/수신 오류가 발생하는 상황을 사용자가 인지하지 못하도록 음성을 합성하는 기술을 일반적으로 포함하고 있다.
무선 환경이 열악한 경우 채널 디코더의 디코딩 동작 도중에 오경보(false alarm)이 발생할 확률이 비교적 증가할 수 있다. 오경보는 채널 디코딩 오류로 인해 불량 프레임(bad frame)이 정상 프레임(good frame)으로 오판되거나, 정상 프레임이 불량 프레임으로 오판되는 경우에 발생할 수 있다. 특히 불량 프레임이 정상 프레임으로 오판되는 경우, 보코더는 비정상적인 프레임의 데이터를 이용하여 음성을 합성하거나, 정상적인 프레임에 대해 불필요한 오류 정정 동작을 수행하게 될 수 있다. 따라서 채널 디코더의 디코딩 성능이 충분히 우수하지 못하는 경우에는 불량 프레임으로 인하여 톤 잡음(Tonal Noise)가 발생할 수 있었다는 문제점이 존재하였다.
본 발명은 열악한 무선 환경 하에서 보코더 잡음을 억제하는 방법 및 장치를 제공한다.
본 발명은 채널 디코더의 디코딩 오동작시 합성 음성의 음질을 보완하기 위한 방법 및 장치를 제공한다.
본 발명은 채널 디코더의 오경보 발생을 복구하기 위한 방법 및 장치를 제공한다.
본 발명은 보코더에서 톤 잡음의 발생을 빠르게 확인하여 음량을 제어하기 위한 방법 및 장치를 제공한다.
본 발명의 바람직한 실시예에 따른 방법은; 보코더 잡음 억제 방법에 있어서, 채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받는 과정과, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성하는 과정과, 상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 상기 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 과정과, 상기 음성 데이터에서 톤 잡음이 검출되었으면 상기 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 과정을 포함한다.
본 발명의 일 실시예에 따른 장치는; 보코더 잡음 억제 장치에 있어서, 채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받고, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성하는 음성 디코더와, 상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 상기 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 톤 잡음 검출기와, 상기 음성 데이터에서 톤 잡음이 검출되었으면 상기 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 음량 조절부를 포함한다.
본 발명의 다른 실시예에 따른 방법은; 보코더 잡음 억제 방법에 있어서, 채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받는 과정과, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 제1 음성 데이터를 생성하는 과정과, 상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 다음 프레임을 불량 프레임으로 가정하고 다음 프레임에 대한 음성 디코딩 절차를 수행하여 제2 음성 데이터를 생성하는 과정과, 상기 제1 및 제2 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 과정과, 상기 제1 및 제2 음성 데이터에서 톤 잡음이 검출되었으면 상기 제1 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 과정을 포함한다.
본 발명의 다른 실시예에 따른 장치는; 보코더 잡음 억제 장치에 있어서, 채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받고, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 제1 음성 데이터를 생성하는 제1 음성 디코더와, 상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 다음 프레임을 불량 프레임으로 가정하고 다음 프레임에 대한 음성 디코딩 절차를 수행하여 제2 음성 데이터를 생성하는 제2 음성 디코더와, 상기 제1 및 제2 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 톤 잡음 검출기와, 상기 제1 및 제2 음성 데이터에서 톤 잡음이 검출되었으면 상기 제1 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 음량 조절부를 포함한다.
도 1은 본 발명의 일 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 2는 본 발명의 일 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 3은 본 발명의 다른 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 4는 본 발명의 일 실시예에 따른 보코더 잡음 억제 동작을 나타낸 흐름도이다.
도 5는 본 발명의 다른 실시예에 따라 보코더 잡음을 억제하기 위한 동작의 흐름도이다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면을 참조하여 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 1을 참조하면, 채널 디코더(110)는 채널을 통해 수신된 데이터를 입력받는다. 채널 디코더(110)로 입력되는 수신 데이터의 포맷은 적용되는 통신 기술 및 시스템 구성에 따라 정해질 수 있다. 무선 통신의 경우 수신 데이터는 송신측으로부터 데이터를 수신하는 무선 주파수(Radio Frequency: RF)부 및 상기 수신 데이터를 복조하는 복조부(Demodulator)를 거쳐 채널 디코더(110)로 입력된다.
채널 디코더(110)는 상기 수신 데이터를 채널 디코딩한다. 구체적으로 채널 디코더(110)는 송신측에 의해 적용된 인코딩 알고리즘에 대응하는 디코딩 알고리즘을 사용하여 상기 수신 데이터를 디코딩함으로써 음성 패킷 데이터를 포함하는 보코더 프레임을 생성하고, 상기 보코더 프레임에 대해 CRC(Cyclic Redundancy Check code) 검사를 수행하여 상기 보코더 프레임이 오류를 가지는지 여부를 나타내는 CRC 결과, 즉 불량 프레임 지시자(Bad Frame Indicator: BFI)를 출력한다. 보코더 프레임은 통상적인 보코더에서 사용되기 위해 20ms의 길이를 가질 수 있다.
BFI와 보코더 프레임은 음성 디코더(130)로 전달된다. BFI가 Good('0')을 지시하는 경우, 음성 디코더(130)는 통상적인 음성 디코딩 동작(Normal Voice Decoding)에 의해 보코더 프레임을 디코딩하여 PCM(Pulse Code Modulation) 데이터를 포함하는 음성 데이터(speech data)를 생성한다. 한편 음성 디코더(130)는 수신 데이터의 오류 발생 시 동작하는 ECU(Error Concealment Unit) 블록(도시하지 않음)을 포함하고 있다. 음성 디코더(130)는 BFI를 기반으로 ECU 블록의 동작 여부를 결정한다. BFI가 Bad('1')를 지시하는 경우, 음성 디코더(130)는 불량 프레임에 대한 음성 디코딩 동작을 수행하도록 ECU 블록을 동작시킨다. ECU 블록은 이전 프레임의 음성 데이터를 반복하거나 현재 프레임과 이전 프레임 사이를 상호 보간함으로써, 인지적 음질 수준을 향상시킨다. 즉, 보코더는 좋은 품질로 전송된 이전 프레임의 음성 데이터를 재사용하거나, 좋은 품질의 음성 데이터와 좋지 않은 품질의 음성 데이터를 상호 보간하여 새로운 음성 데이터를 생성하여 출력할 수 있다.
음성 디코더(120)에서 생성된 음성 데이터는 디지털 아날로그 변환기(Digital Analog Converter: D/A)(도시하지 않음)에 의해 아날로그 신호로 변환된 후 스피커(130)를 통해 출력된다.
열악한 무선 환경에서 채널 디코더(110)의 디코딩 오동작으로 인해 정상적인 ECU 동작이 불가능한 경우, 합성 음성의 음질을 보완하기 위한 기술을 제공한다. 채널 디코더(110)에서 비정상적인 수신 데이터를 정상 데이터로 잘못 판단하는 경우 음성 디코더(120)는 정상 데이터에 대한 음성 합성 방식으로 음성 데이터를 생성한다. 일반적으로 약전계 환경에서 발생하는 패킷 오류는 버스트한(bursty) 양상을 가지므로 채널 디코딩 오동작은 합성 음질 저하의 큰 원인이 된다. 이러한 연속 오류 발생 시 초기 오류 데이터를 정상으로 판단하게 되면, 이후 ECU 동작에 따라 잡음 오디오 신호가 연속된 여러 프레임 구간 동안 연속하여 발생될 수 있다.
단말이 통화 중 유성음을 발성하는 도중에 연속적으로 불량 프레임이 발생하는 경우 톤 잡음(Tonal Noise)이 발생한다. 구체적으로 설명하면, 채널 디코딩의 오류로 인해 불량 프레임이 정상 프레임으로 오판되었을 때, 잘못된 정상 프레임을 음성 디코더에서 디코딩함에 따라 비정상적인 파형으로 인한 이상음이 생성된다. 이후 불량 프레임들이 연속으로 발생하는 경우 ECU 동작에 의해 상기 이상음이 일정 시간 지속되게 되어, 사용자의 불편함을 야기시킨다.
상기와 같은 톤 잡음은 음성 스펙트럼에서 나타나는 피크 형태의 소음을 말한다. 특히 이전에 발생한 음성의 소리가 클 경우 약전계에서 발생하는 이러한 톤 잡음은 상당히 귀에 거슬려 제거가 필요하다.
후술되는 본 발명의 실시예에서는 톤 잡음의 발생을 신속하게 확인하고, 톤 잡음의 발생시 음성 디코더에서 출력되는 음성 데이터의 음량을 급격하게 감쇠시켜, 이상음이 사용자의 귀에 거슬리지 않도록 한다.
도 2는 본 발명의 일 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 2를 참조하면, 음성 디코더(210)는 채널 디코더(도시하지 않음)로부터 보코더 프레임과, 상기 보코더 프레임이 오류를 가지는지 여부를 나타내는 BFI를 입력받는다. 음성 디코더(210)는 채널 디코더로부터의 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성한다. 일 실시예로서 음성 디코더(210)는 BFI가 Good('0')를 지시하는 경우, 정상적인 디코딩 절차에 의해 보코더 프레임을 처리한다. 반면 BFI가 Bad('1')을 지시하는 경우, 음성 디코더(210)는 알려진 ECU 기능에 따라 보코더 프레임을 처리한다. 구체적으로 ECU 기능에 따르면, 음성 디코더(210)는 현재의 불량 보코더 프레임을 폐기하고 이전 프레임의 음성 데이터를 현재 프레임에서 다시 출력하거나, 혹은 현재 프레임의 음성 데이터와 이전 프레임의 음성 데이터를 상호 보간한 새로운 음성 데이터를 생성하여 출력한다.
음성 디코더(210)의 출력은 스위치(220)를 거쳐 스피커 출력부(230)로 전달된다. 스위치(220)는 BFI를 입력받아 동작하며, BFI가 '0'인 경우, 즉 정상 프레임을 지시하는 경우, 음성 디코더(210)에서 출력되는 음성 데이터를 스피커 출력부(230)로 전달한다. 음성 디코더(210)에서 생성된 음성 데이터는 스피커 출력부(230)로 전달되고, 스피커 출력부(230)에 포함된 디지털 아날로그 변환기에 의해 아날로그 변환된 후 사용자의 가청 가능한 소리로서 출력된다.
반면 BFI가 '1'인 경우, 즉 불량 프레임을 지시하는 경우, 스위치(220)는 음성 디코더(210)에서 출력되는 불량 음성 데이터를 음량 제어를 위한 신호 경로로 전달한다. 상기 신호 경로는 톤 잡음 검출기(Tonal Noise Detector)(240)와 음량 조절부(Volume Control Unit)(250)를 포함하여 구성된다.
톤 잡음 검출기(240)는 스위치(220)를 통해 입력된 음성 데이터의 음성 스펙트럼을 분석하여 피크 형태의 톤이 존재하는지를 판단한다. 상기 톤은 스피커 출력시 톤 잡음으로서 작용한다. 만일 음성 데이터에서 톤 잡음이 검출된 경우, 톤 잡음 검출기(240)는 톤 잡음이 검출되었음을 나타내는 톤 검출 플래그를 음량 조절부(250)로 전달한다. 음량 조절부(250)는 톤 검출 플래그의 수신에 응답하여, 스위치(220)를 통해 입력된 음성 데이터의 음량을 조절, 특히 감쇠시킨 후, 음량 조절된 음성 데이터를 스피커 출력부(230)로 전달한다. 만일 톤 검출 플래그가 톤 잡음이 검출되지 않았음을 나타낼 시, 음량 조절부(250)는 입력된 음성 데이터의 음량을 조절하지 않은 채 그대로 스피커 출력부(230)로 전달한다.
음량 조절부(250)에 의한 음량 조절량, 특히 음량 감쇠 정도는, 일 실시예로서 미리 정해지는 값으로 설정될 수 있다. 다른 실시예로서, 음량 감쇠 정도는 톤 잡음이 검출된 횟수에 따라 증가될 수 있다. 구체적으로 톤 잡음이 처음으로 검출되는 프레임에서 음량 감쇠 정도는 V1로 설정되며, 톤 잡음이 연속으로 혹은 불연속적으로 검출된 프레임들의 개수 N에 따라 음량 감쇠 정도는 V1 * N이 될 수 있다.
상기한 구조를 통해, 불량 프레임이 발생하고 불량 프레임이 톤 잡음을 포함하는 경우, 스피커로 출력되는 소리의 음량을 신속하게 감쇠시켜 이상음이 사용자에게 불편함을 야기하지 않도록 할 수 있다.
도 3은 본 발명의 다른 실시예에 따라 보코더 잡음을 억제하기 위한 장치의 블록 구성도를 나타낸 것이다.
도 3을 참조하면, 음성 디코더(310)는 채널 디코더(도시하지 않음)로부터 보코더 프레임과, 상기 보코더 프레임이 오류를 가지는지 여부를 나타내는 BFI를 입력받는다. 음성 디코더(310)는 채널 디코더로부터의 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성한다. 일 실시예로서 음성 디코더(310)는 BFI가 Good('0')를 지시하는 경우, 정상적인 디코딩 절차에 의해 보코더 프레임을 처리한다. 반면 BFI가 Bad('1')을 지시하는 경우, 음성 디코더(310)는 알려진 ECU 기능에 따라 보코더 프레임을 처리한다. 구체적으로 ECU 기능에 따르면, 음성 디코더(310)는 현재의 불량 보코더 프레임을 폐기하고 이전 프레임의 음성 데이터를 현재 프레임에서 다시 출력하거나, 혹은 현재 프레임의 음성 데이터와 이전 프레임의 음성 데이터를 상호 보간한 새로운 음성 데이터를 생성하여 출력한다.
음성 디코더(310)의 출력은 스위치(320)를 거쳐 스피커 출력부(330)로 전달된다. 스위치(320)는 BFI를 입력받아 동작하며, BFI가 '0'인 경우, 즉 정상 프레임을 지시하는 경우, 음성 디코더(310)에서 출력되는 음성 데이터를 스피커 출력부(330)로 전달한다. 음성 디코더(310)에서 생성된 음성 데이터는 스피커 출력부(330)로 전달되고, 스피커 출력부(330)에 포함된 디지털 아날로그 변환기에 의해 아날로그 변환된 후 사용자의 가청 가능한 소리로서 출력된다.
반면 BFI가 '1'인 경우, 즉 불량 프레임을 지시하는 경우, 스위치(320)는 음성 디코더(310)에서 출력되는 불량 음성 데이터를 음량 제어를 위한 신호 경로로 전달한다. 상기 신호 경로는 톤 잡음 검출기(Tonal Noise Detector)(340)와 음량 조절부(350)를 포함하여 구성된다.
톤 잡음 검출기(340)는 스위치9(320)를 통해 입력된 음성 데이터와, 또한 다음 프레임의 예측된 음성 데이터에 대해 톤 검출을 수행한다. 다음 프레임의 예측된 음성 데이터는 사전연산 음성 디코더(Look-ahead Voice Decoding Unit) (360)에 의해 생성된다. 사전연산 음성 디코더(360)는 음성 디코더(310)와 동일한 디코딩 알고리즘으로 구성되어 있으며, 하기와 같이 동작한다.
사전연산 음성 디코더(360)는 음성 디코더(310)와 마찬가지로 음성 패킷 데이터를 포함하는 보코더 프레임을 입력받으며, BFI에 의해 제어된다. 구체적으로 사전연산 음성 디코더(360)는 BFI가 '0'인 경우, 즉 현재 프레임이 정상 프레임임을 지시하는 경우, 입력된 현재 보코더 프레임의 음성 관련 파라미터들을 저장한다. BFI가 '1'인 경우, 즉 현재 프레임이 불량 프레임임을 지시하는 경우, 사전연산 음성 디코더(360)는 다음 프레임을 불량 프레임으로 가정하고, 기 저장된 정상 프레임의 음성 관련 파라미터들과 현재 프레임의 음성 데이터를 기반으로 다음 프레임에 대한 음성 디코딩 절차를 수행한다. 상기 다음 프레임에 대해 생성된 예측된 음성 데이터는 톤 잡음 검출기(340)으로 입력된다.
톤 잡음 검출기(340)는 스위치(320)를 통해 입력된 현재 불량 프레임의 음성 데이터와 사전연산 음성 디코더(360)로부터 입력된 다음 프레임의 예측된 음성 데이터의 음성 스펙트럼을 분석하여 피크 형태의 톤이 존재하는지를 판단한다. 상기 톤은 스피커 출력시 톤 잡음으로서 작용한다. 만일 상기 두 개의 음성 데이터에서 톤 잡음이 검출된 경우, 톤 잡음 검출기(340)는 톤 잡음이 검출되었음을 나타내는 톤 검출 플래그를 음량 조절부(350)로 전달한다. 음량 조절부(350)는 톤 검출 플래그의 수신에 응답하여, 스위치(320)를 통해 입력된 음성 데이터의 음량을 조절, 특히 감쇠시킨 후, 음량 조절된 음성 데이터를 스피커 출력부(330)로 전달한다.
음량 조절부(350)에 의한 음량 조절량, 특히 음량 감쇠 정도는, 일 실시예로서 미리 정해지는 값으로 설정될 수 있다. 다른 실시예로서, 음량 감쇠 정도는 톤 잡음이 검출된 횟수에 따라 증가될 수 있다. 구체적으로 톤 잡음이 처음으로 검출되는 프레임에서 음량 감쇠 정도는 V1로 설정되며, 톤 잡음이 연속으로 혹은 불연속적으로 검출된 프레임들의 개수 N에 따라 음량 감쇠 정도는 V1 * N이 될 수 있다.
만일 톤 검출 플래그가 톤 잡음이 검출되지 않았음을 나타낼 시, 음량 조절부(350)는 입력된 음성 데이터의 음량을 조절하지 않은 채 그대로 스피커 출력부(330)로 전달한다.
상기와 같은 구조는 BFI가 설정된 경우 다음의 연속된 불량 프레임을 미리 처리하여 톤 잡음의 존재 여부를 미리 확인함으로써, 톤 잡음에 대한 볼륨 제어를 빠르게 수행할 수 있다.
도 4는 본 발명의 일 실시예에 따른 보코더 잡음 억제 동작을 나타낸 흐름도이다.
도 4를 참조하면, 과정 405에서 채널 디코더로부터 BFI 및 보코더 프레임이 음성 디코더로 입력된다. 과정 410에서 음성 디코더는 상기 보코더 프레임에 대한 음성 디코딩을 수행하여 음성 데이터를 생성한다. 과정 415에서 장치는 상기 BFI가 Good('0')을 지시하는지 확인한다. 만일 Good을 지시하는 경우, 과정 430으로 진행하여 음성 디코더에서 생성된 음성 데이터가 스피커로 출력된다. 과정 430에서 장치 자체의 음량 제어 이외에 보코더 프레임의 품질에 의한 추가적인 음량 제어는 수행되지 않는다.
반면 상기 BFI가 Bad('1')를 지시하는 경우, 과정 420에서 장치는 음성 디코더에 의해 생성된 음성 데이터에 대해 피크 형태의 톤 잡음이 검출되는지를 판단한다. 만일 톤 잡음이 검출되지 않으면 과정 430으로 진행하여 음성 디코더에 의해 생성된 음성 데이터가 스피커로 출력된다. 반면 톤 잡음이 검출되었으면, 과정 425에서 장치는 음성 데이터의 음량을 감쇠시킨 후, 과정 430에서 음량 감쇠된 음성 데이터를 출력한다.
도 5는 본 발명의 다른 실시예에 따라 보코더 잡음을 억제하기 위한 동작의 흐름도이다.
도 5를 참조하면, 과정 505에서 채널 디코더로부터 BFI 및 보코더 프레임이 음성 디코더로 입력된다. 과정 510에서 음성 디코더는 상기 보코더 프레임에 대한 음성 디코딩을 수행하여 음성 데이터를 생성한다. 과정 515에서 장치는 상기 BFI가 Good('0')을 지시하는지 확인한다. 만일 Good을 지시하는 경우, 과정 535로 진행하여 음성 디코더에서 생성된 음성 데이터가 스피커로 출력된다. 과정 535에서 장치 자체의 음량 제어 이외에 보코더 프레임의 품질에 의한 추가적인 음량 제어는 수행되지 않는다.
반면 상기 BFI가 Bad('1')를 지시하는 경우, 과정 520에서 사전연산 음성 디코더는 다음 프레임을 불량 프레임으로 가정하고, 기 저장된 정상 프레임과 현재 프레임을 기반으로 다음 프레임에 대한 음성 디코딩 절차를 수행하여, 다음 프레임에 대한 예측된 음성 데이터를 생성한다.
과정 525에서 장치는 음성 디코더에 의해 생성된 현재 프레임의 음성 데이터와 사전연산 음성 디코더에 의해 생성된 다음 프레임의 예측된 음성 데이터에 대해 피크 형태의 톤 잡음이 검출되는지를 판단한다. 만일 톤 잡음이 검출되지 않으면 과정 535로 진행하여 음성 디코더에 의해 생성된 음성 데이터가 스피커로 출력된다. 반면 톤 잡음이 검출되었으면, 과정 530에서 장치는 현재 프레임의 음성 데이터의 음량을 감쇠시킨 후, 과정 535에서 음량 감쇠된 음성 데이터를 출력한다.
이상과 같이 동작하는 본 발명은 불량 프레임이 연속적으로 발생하는 경우에 잡음의 발생을 빠르게 확인하여 음량을 조절함으로써 사용자가 잡음을 인지하지 못하도록 할 수 있다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능하다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

Claims (12)

  1. 보코더 잡음 억제 방법에 있어서,
    채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받는 과정과,
    상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성하는 과정과,
    상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 상기 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 과정과,
    상기 음성 데이터에서 톤 잡음이 검출되었으면 상기 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 과정을 포함하는 것을 특징으로 하는 잡음 억제 방법.
  2. 제 1 항에 있어서, 상기 제1 정보는,
    채널을 통해 수신된 데이터에 대한 채널 디코딩 결과에 대한 CRC(Cyclic Redundancy Check) 검사를 통해 생성되는 불량 프레임 지시자(Bad Frame Indicator: BFI)임을 특징으로 하는 잡음 억제 방법.
  3. 제 1 항에 있어서, 상기 판단하는 과정은,
    상기 음성 데이터의 음성 스펙트럼 내에 피크 형태의 톤이 존재하는지를 판단하는 것을 특징으로 하는 잡음 억제 방법.
  4. 보코더 잡음 억제 장치에 있어서,
    채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받고, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 음성 데이터를 생성하는 음성 디코더와,
    상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 상기 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 톤 잡음 검출기와,
    상기 음성 데이터에서 톤 잡음이 검출되었으면 상기 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 음량 조절부를 포함하는 것을 특징으로 하는 잡음 억제 장치.
  5. 제 4 항에 있어서, 상기 제1 정보는,
    채널을 통해 수신된 데이터의 채널 디코딩 결과에 대한 CRC 검사를 통해 생성되는 불량 프레임 지시자(BFI)임을 특징으로 하는 잡음 억제 장치.
  6. 제 4 항에 있어서, 상기 톤 잡음 검출기는,
    상기 음성 데이터의 음성 스펙트럼 내에 피크 형태의 톤이 존재하는지를 판단하는 것을 특징으로 하는 잡음 억제 장치.
  7. 보코더 잡음 억제 방법에 있어서,
    채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받는 과정과,
    상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 제1 음성 데이터를 생성하는 과정과,
    상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 다음 프레임을 불량 프레임으로 가정하고 다음 프레임에 대한 음성 디코딩 절차를 수행하여 제2 음성 데이터를 생성하는 과정과,
    상기 제1 및 제2 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 과정과,
    상기 제1 및 제2 음성 데이터에서 톤 잡음이 검출되었으면 상기 제1 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 과정을 포함하는 것을 특징으로 하는 잡음 억제 방법.
  8. 제 7 항에 있어서, 상기 제1 정보는,
    채널을 통해 수신된 데이터의 채널 디코딩 결과에 대한 CRC 검사를 통해 생성되는 불량 프레임 지시자(BFI)임을 특징으로 하는 잡음 억제 방법.
  9. 제 7 항에 있어서, 상기 판단하는 과정은,
    상기 음성 데이터의 음성 스펙트럼 내에 피크 형태의 톤이 존재하는지를 판단하는 것을 특징으로 하는 잡음 억제 방법.
  10. 보코더 잡음 억제 장치에 있어서,
    채널 디코더로부터 보코더 프레임과 상기 보코더 프레임의 오류 여부를 나타내는 제1 정보를 입력받고, 상기 보코더 프레임에 대한 음성 디코딩 절차를 수행하여 제1 음성 데이터를 생성하는 제1 음성 디코더와,
    상기 제1 정보가 채널 디코딩 오류가 발생하였음을 지시하는 경우, 다음 프레임을 불량 프레임으로 가정하고 다음 프레임에 대한 음성 디코딩 절차를 수행하여 제2 음성 데이터를 생성하는 제2 음성 디코더와,
    상기 제1 및 제2 음성 데이터에 대해 톤 잡음이 검출되는지를 판단하는 톤 잡음 검출기와,
    상기 제1 및 제2 음성 데이터에서 톤 잡음이 검출되었으면 상기 제1 음성 데이터의 음량을 감쇠하여 스피커로 출력하는 음량 조절부를 포함하는 것을 특징으로 하는 잡음 억제 장치.
  11. 제 10 항에 있어서, 상기 제1 정보는,
    채널을 통해 수신된 데이터에 대한 채널 디코딩 결과에 대한 CRC 검사를 통해 생성되는 불량 프레임 지시자(BFI)임을 특징으로 하는 잡음 억제 장치.
  12. 제 10 항에 있어서, 상기 톤 잡음 검출기는,
    상기 제1 및 제2 음성 데이터의 음성 스펙트럼 내에 피크 형태의 톤이 존재하는지를 판단하는 것을 특징으로 하는 잡음 억제 장치.
KR1020130025679A 2013-03-11 2013-03-11 보코더 잡음 억제 방법 및 장치 KR20140111480A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020130025679A KR20140111480A (ko) 2013-03-11 2013-03-11 보코더 잡음 억제 방법 및 장치
US13/963,342 US9299351B2 (en) 2013-03-11 2013-08-09 Method and apparatus of suppressing vocoder noise

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130025679A KR20140111480A (ko) 2013-03-11 2013-03-11 보코더 잡음 억제 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20140111480A true KR20140111480A (ko) 2014-09-19

Family

ID=51488926

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130025679A KR20140111480A (ko) 2013-03-11 2013-03-11 보코더 잡음 억제 방법 및 장치

Country Status (2)

Country Link
US (1) US9299351B2 (ko)
KR (1) KR20140111480A (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634497B (zh) * 2019-10-28 2022-02-18 普联技术有限公司 降噪方法、装置、终端设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2930101B2 (ja) * 1997-01-29 1999-08-03 日本電気株式会社 雑音消去装置
US20040066940A1 (en) * 2002-10-03 2004-04-08 Silentium Ltd. Method and system for inhibiting noise produced by one or more sources of undesired sound from pickup by a speech recognition unit
US6578162B1 (en) * 1999-01-20 2003-06-10 Skyworks Solutions, Inc. Error recovery method and apparatus for ADPCM encoded speech
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7155654B2 (en) 2003-04-04 2006-12-26 Sst Communications, Corp. Low complexity error concealment for wireless transmission
US20050288923A1 (en) * 2004-06-25 2005-12-29 The Hong Kong University Of Science And Technology Speech enhancement by noise masking
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
JP4356670B2 (ja) * 2005-09-12 2009-11-04 ソニー株式会社 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
US8301440B2 (en) 2008-05-09 2012-10-30 Broadcom Corporation Bit error concealment for audio coding systems

Also Published As

Publication number Publication date
US20140257801A1 (en) 2014-09-11
US9299351B2 (en) 2016-03-29

Similar Documents

Publication Publication Date Title
JP4313570B2 (ja) 音声復号における音声フレームのエラー隠蔽のためのシステム
EP2673772B1 (en) Method, computer-program and apparatus for detecting a watermarked signal and decoding a speech or audio signal
JP5268952B2 (ja) データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
US11683103B2 (en) Method and system for acoustic communication of data
EP0819302A1 (en) Arrangement and method relating to speech transmission and a telecommunications system comprising such arrangement
JPH11122120A (ja) 符号化方法及び装置、並びに復号化方法及び装置
US20070064681A1 (en) Method and system for monitoring a data channel for discontinuous transmission activity
JPH10327089A (ja) 携帯電話装置
EP0693861A2 (en) Mobile communication system
JP3578461B2 (ja) 音声通信システムにおけるブロック符号化音声信号の処理方法及び装置
JP2007517441A (ja) デジタルマイクロフォン
KR20140111480A (ko) 보코더 잡음 억제 방법 및 장치
JPH0685767A (ja) ディジタル通信のデコード装置
JP2003526261A (ja) 誤った信号パラメータを検出するエラー隠蔽方法
JP5584157B2 (ja) 無線受信機
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
KR101987894B1 (ko) 보코더 잡음 억제 방법 및 장치
Heide et al. Universal Vocoder using Variable Data Rate Vocoding
JPH0697846A (ja) 無線通信装置
JP2008026700A (ja) デジタル通信システム
KR102132326B1 (ko) 통신 시스템에서 오류 은닉 방법 및 장치
JP2003522981A (ja) ピッチ変化検出を伴なう誤り訂正方法
US20050229046A1 (en) Evaluation of received useful information by the detection of error concealment
JP2640598B2 (ja) 音声復号装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application