KR20030079515A - 오디오 디코더의 노이즈 제거 방법 - Google Patents

오디오 디코더의 노이즈 제거 방법 Download PDF

Info

Publication number
KR20030079515A
KR20030079515A KR1020020018582A KR20020018582A KR20030079515A KR 20030079515 A KR20030079515 A KR 20030079515A KR 1020020018582 A KR1020020018582 A KR 1020020018582A KR 20020018582 A KR20020018582 A KR 20020018582A KR 20030079515 A KR20030079515 A KR 20030079515A
Authority
KR
South Korea
Prior art keywords
frame
output
decoded
audio
noise
Prior art date
Application number
KR1020020018582A
Other languages
English (en)
Inventor
김효진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020020018582A priority Critical patent/KR20030079515A/ko
Publication of KR20030079515A publication Critical patent/KR20030079515A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/09Error detection only, e.g. using cyclic redundancy check [CRC] codes or single parity bit
    • H03M13/091Parallel or block-wise CRC computation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 오디오 디코더의 노이즈 제거 방법을 제공하기 위한 것으로서, 수신된 오디오 비트 스트림을 CRC(cyclic redundancy check)를 수행하여 CRC 에러 유무를 검출하는 단계; CRC 에러가 검출되지 않는 경우 해당 프레임을 디코드하는 단계; CRC 에러가 검출되는 경우, 이전 프레임을 디코드하여 현재 프레임으로 반복 출력할지 또는 해당 프레임을 스킵하여 뮤트 출력할지를 판정하는 단계; 반복 출력하는 경우, 해당 프레임을 디코드하지 않고 상기 이전 프레임을 디코드하고, 상기 이전 프레임과, 반복 출력할 프레임 간의 경계부분에 스무딩(smoothing) 함수를 곱하여 상기 경계부분의 출력을 감쇄시켜 반복 출력하는 단계; 뮤트 출력하는 경우, 해당 프레임을 디코드하지 않고 뮤트 출력하는 단계로 이루어지며, 비정상적인 디코딩을 수행하는 경우, 디코드된 프레임을 반복 또는 뮤트 재생시에 출력측에 들리는 팝 노이즈성 잡음을 제거하고 높은 품질의 오디오 신호를 제공한다.

Description

오디오 디코더의 노이즈 제거 방법{Method for Removing Noise in Audio Decoder}
본 발명은 오디오 디코더(Audio Decoder)의 디코딩된 PCM(Pulse Code Modulation)에 들어 있는 노이즈를 제거하는 방법에 관한 것이다.
디지털 수신기는 압축규격에 맞추어 오디오, 비디오 신호를 압축하여 패킷으로 만든 스트림을 받도록 되어 있다.
오디오 패킷(audio packet)을 풀면 순수한 ES(Elementary Stream)를 얻는데, 그 내용은 Dolby AC-3, MPEG layer2, AAC 등이다.
ES를 디코딩하는 과정에서 스트림의 문제여부 및 비디오 화면과의 동기 신호에 따라 현재 프레임(AC3 : 32ms, MPEG layer2 : 24ms)을 스킵(skip) 또는 반복(repeat)한다.
한 프레임의 CRC 수행후의 ES의 헤더(header) 영역에 포함되어 있는 결과 값과 비교하여 에러가 발생할 경우, 해당 프레임을 디코드하지 않고 이전 프레임을 다시 디코드하여 반복하거나 스킵하고 출력에 아무 것도 나가지 않도록 뮤트한다.
이전 프레임을 다시 디코드하거나 스킵할 때 프레임 기본 단위는 32ms 이며, 도1a는 정상적인 경우를 도시한 것이고, 도1b는 비정상적인 경우를 도시한 것으로서, 비정상적인 경우 프레임 디코딩을 않고 스킵하여 출력엔 PCM 버퍼에 있던 N 프레임의 디코딩된 데이터가 다시 반복된다.
이와 같이 똑같은 프레임을 반복하는 경우 발생할 수 있는 문제는 다음과 같다. 2번째 프레임의 경우, 시작되는 부분에서 신호의 불연속(discontinuity)이 발생한다. 이때 불연속 신호차에 의한 임펄스 노이즈가 발생하여 귀에 거슬리는 팝 노이즈(pop noise)로 나타나게 된다.
따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 오디오 비트 스트림의 문제여부 및 비디오 화면과의 동기 신호 등에 따라 비정상적인 디코딩을 수행하는 경우, 디코드된 프레임을 반복 또는 뮤트 재생시에 출력측에 들리는 팝 노이즈성 잡음을 제거하고 높은 품질의 오디오 신호를 제공할 수 있는 오디오 디코더의 노이즈 제거 방법을 제공하는 그 목적이 있다.
도1a는 일반적인 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호를 도시한 것이다.
도1b는 종래기술에 따른 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호 및 노이즈를 도시한 것이다.
도2는 본 발명에 따른 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호의 노이즈 제거 방법의 개념적인 모식도이다.
도3은 본 발명에 따른 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호의 노이즈 제거 방법을 단계별로 도식한 플로챠트(flow chart)이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 오디오 디코더의 노이즈 제거 방법의 특징은 수신된 오디오 비트 스트림을 프레임 단위로 CRC(cyclic redundancy check)를 수행하여 해당 프레임의 CRC 에러 유무를 검출하는 단계; 상기 검출결과, CRC 에러가 검출되지 않는 경우, 상기 해당 프레임을 디코드하는 단계; 상기 검출결과, CRC 에러가 검출되는 경우, 이전 프레임을 디코드하여 현재 프레임으로 반복 출력할지 또는 상기 해당 프레임을 스킵하여 뮤트 출력할지의 여부를 판정하는 단계; 상기 판정결과 반복 출력하는 경우, 해당 프레임을 디코드하지 않고 상기 이전 프레임을 디코드하고, 상기 이전 프레임과, 반복 출력할 프레임 간의 경계부분에 스무딩(smoothing) 함수를 곱하여 상기 경계부분의 출력을 감쇄시켜 반복 출력하는 단계; 상기 판정결과 뮤트 출력하는 경우, 상기 해당 프레임을 스킵하여 뮤트 출력하는 단계를 포함하여 이루어지는데 있다.
그리고 본 발명은 상기 이전 프레임의 끝부분에는 1에서 0으로 감소하는 스무딩 함수를 곱하고, 상기 반복 출력할 프레임의 시작부분에는 0에서 1로 증가하는 스무딩 함수를 곱하는 것을 특징으로 한다.
그리고 상기 스무딩 함수는 선형 혹은 지수함수적 특성을 갖는 임의의 경로를 형성하는 함수임을 특징으로 한다.
상기와 같은 본 발명의 특징에 따른 작용은 프레임의 경계에서 이전 프레임의 끝부분에는 1에서 0으로 감소하는 함수를 곱하고, 반복 시작하는 부분에서는 0에서 1로 증가하는 함수를 곱하여 에지 스무딩(edge smoothing)을 함으로써, 오디오 비트 스트림의 문제여부 및 비디오 화면과의 동기 신호에 따라 디코드된 프레임을 반복 또는 뮤트 재생시에 AC-3, MPEG와 같은 디지털 오디오의 프레임 연결 부분에서 발생할 수 있는 노이즈를 선택적으로 감쇄시켜, 사람이 경계부분을 알아채지 못하도록 하여 디지털 사운드의 음질을 높일 수 있다.
그런데, 상기 ES를 디코딩하는 과정에서 오디오 비트 스트림의 문제여부 및 비디오 화면과의 동기 신호에 따라, 오디오 신호의 재생 시에 현재 프레임(AC3 : 32ms, MPEG layer2 : 24ms)을 스킵(skip) 또는 반복(repeat)해야 하는 경우가 발생하므로, 이 과정에 의해 PCM 신호에 노이즈가 발생하게 된다.
그리고 상기 스트림의 문제여부는 수신된 오디오 패킷을 프레임 단위로 CRC(cyclic redundancy check)를 수행하여, ES의 헤더(header) 영역에 포함되어 있는 결과값과 비교함으로써 해당 프레임의 CRC 에러 유무를 검출하여 알아낸다.
본 발명의 다른 목적, 특성 및 잇점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
본 발명에 따른 오디오 디코더의 노이즈 제거 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다.
도2는 본 발명에 따른 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호의 노이즈 제거 방법의 개념적인 모식도이다.
먼저, 압축규격에 맞추어 오디오, 비디오 신호를 압축하여 패킷 형태로 전송되는 스트림을 디지털 수신기에 의해 수신하고, 상기 디지털 수신기 내의 오디오 디코더에 의해 프레임 단위로 디코딩하여 PCM(Pulse Code Modulation) 신호를 얻는다.
이렇게 디코딩된 PCM 신호는 노이즈를 포함하고 있는데, 본 발명에서는 이러한 노이즈가 제거된 PCM 신호를 제공한다.
다시 말해, 디지털 수신기 내의 오디오 디코더에 의해 오디오 패킷(audio packet)을 풀면 순수한 ES(Elementary Stream)를 얻는다.
그런데, 상기 ES를 디코딩하는 과정에서 오디오 비트 스트림의 문제여부 및 비디오 화면과의 동기 신호에 따라, 오디오 신호의 재생 시에 현재 프레임(AC3 : 32ms, MPEG layer2 : 24ms)을 스킵(skip) 또는 반복(repeat)해야 하는 경우가 발생하므로, 이 과정에 의해 PCM 신호에 노이즈가 발생하게 된다.
그리고 상기 스트림의 문제여부는 수신된 오디오 패킷을 프레임 단위로 CRC(cyclic redundancy check)를 수행하여, ES의 헤더(header) 영역에 포함되어 있는 결과값과 비교함으로써 해당 프레임의 CRC 에러 유무를 검출하여 알아낸다.
이리하여 CRC 에러가 발생할 경우, 해당 프레임을 디코드하지 않고 스킵하고, 스킵된 프레임 대신 이전 프레임을 다시 디코드하여 이전 프레임을 반복 재생하거나, 스킵하고 뮤트 출력한다.
예를 들어, 도2와 같이 N+1 번째 프레임에서 CRC 에러가 검출되는 경우, 상기 N+1 번째 프레임의 디코딩을 스킵한다.
이렇게 압축된 오디오 패킷의 오디오 압축을 풀어낸 뒤에 상기와 같이 해당프레임을 스킵하고, 이전 프레임을 반복 재생할 때, PCM 신호의 반복되는 프레임의 전후 프레임 간에 발생할 수 있는 노이즈를 줄여야 한다.
따라서 본 발명은 반복 출력하는 경우, PCM 신호의 해당 프레임을 디코드하지 않고 상기 이전 프레임을 디코드하고, 상기 이전 프레임과, 반복 출력할 프레임 간의 경계부분에 스무딩 함수를 곱하여 상기 경계부분의 출력을 감쇄시켜 반복 출력한다.
예를 들어, 본 발명은 도2에 도시한 바와 같이, 이전 프레임인 N 번째 프레임의 끝부분에는 1에서 0으로 감소하는 스무딩 함수(①)를 곱하고, 상기 반복 출력할 프레임의 시작부분에는 0에서 1로 증가하는 스무딩 함수(②)를 곱한다.
상기와 같은 방법으로 디코딩된 PCM(Pulse Code Modulation) 신호에 들어 있는 노이즈를 제거하여 한다.
상기 스무딩 함수는 선형 혹은 지수함수적 특성을 갖는 임의의 경로를 형성하는 함수이다.
도3은 본 발명에 따른 디지털 수신기 내의 오디오 디코딩에 의한 PCM 신호의 노이즈 제거 방법을 단계별로 도식한 플로챠트(flow chart)이다.
먼저, 오디오 디코딩 과정에서 수신된 오디오 비트 스트림을 정상적으로 디코딩하지 못할 경우를 판단하는 CRC(cyclic redundancy check) 에러를 검출하기 위한 검사를 수행하고, 그 결과를 판정한다(S10).
이어, 상기 판정 결과에 따라 상기 오디오 출력을 뮤트 또는 반복할지 판단하여 재생 모드를 세팅한다(S20).
즉, CRC 에러가 검출되는 경우, 이전 프레임을 디코드하여 현재 프레임으로 반복 출력하는 리피트 모드로 세팅하거나(S40), 또는 상기 해당 프레임을 스킵하여 뮤트 출력하는 뮤트 모드로 세팅한다(S30).
상기 리피트 모드 세팅시(S40)에는 현재 출력 부분에 메모리에 저장된 이전 프레임의 PCM 신호를 공급한다.
이어 리피트 모드로 세팅이 되면, 해당 프레임(N-th)을 디코드하지 않고 상기 이전 프레임(N-1th)을 디코드하고, 상기 이전 프레임과, 반복 출력할 프레임 간의 경계부분에 스무딩 함수를 곱하여 상기 경계부분의 출력을 감쇄시켜 반복 출력한다(S80).
예를 들어, 프레임이 연결되는 부분에 1에서 0으로, 또는 0에서 1까지의 상수와 PCM을 곱하여 스무딩한다.
그리고 뮤트 모드로 세팅이 되면, 해당 프레임을 스킵하여 뮤트 출력한다(S70).
마지막으로 상기 판정 결과, CRC 에러가 검출되지 않는 경우에는 상기 해당 프레임(N-th)을 디코드하여(S50) 해당 프레임을 출력한다(S90).
결국, 오디오 디코딩을 하기 전에 비트 스트림이 깨져있는지를 판단하여 프레임을 스킵할 필요가 있을 경우 CRC 체크를 하여 반복 및 뮤트를 출력하게 된다. 이전 프레임 데이터는 메모리에 저장이 되며, 리피트 모드인 경우 이미 저장되었던 이전 프레임의 데이터를 다시 출력하게 된다.
이때 프레임 간의 불연속 부분에서 발생하는 노이즈를 제거하기 위해 연결부분의 일정 구간에 걸쳐 출력 데이터가 감쇄되도록 하여 노이즈가 발생할 수 있는 가능성을 완전히 제거한다.
이상에서 설명한 바와 같은 본 발명에 따른 오디오 디코더의 노이즈 제거 방법은 다음과 같은 효과가 있다.
AC-3, MPEG와 같은 디지털 오디오의 프레임 연결 부분에서 발생할 수 있는 노이즈를 선택적으로 감쇄하여 디지털 사운드의 음질을 높일 수 있다.
이상 설명한 내용을 통해 당업자라면 본 발명의 기술 사상을 이탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다.
따라서, 본 발명의 기술적 범위는 실시예에 기재된 내용으로 한정되는 것이 아니라 특허 청구의 범위에 의하여 정해져야 한다.

Claims (3)

  1. 수신된 오디오 비트 스트림을 프레임 단위로 CRC(cyclic redundancy check)를 수행하여 해당 프레임의 CRC 에러 유무를 검출하는 단계;
    상기 검출결과, CRC 에러가 검출되지 않는 경우, 상기 해당 프레임을 디코드하는 단계;
    상기 검출결과, CRC 에러가 검출되는 경우, 이전 프레임을 디코드하여 현재 프레임으로 반복 출력할지 또는 상기 해당 프레임을 스킵하여 뮤트 출력할지의 여부를 판정하는 단계;
    상기 판정결과 반복 출력하는 경우, 해당 프레임을 디코드하지 않고 상기 이전 프레임을 디코드하고, 상기 이전 프레임과, 반복 출력할 프레임 간의 경계부분에 스무딩 함수를 곱하여 상기 경계부분의 출력을 감쇄시켜 반복 출력하는 단계;
    상기 판정결과 뮤트 출력하는 경우, 상기 해당 프레임을 스킵하여 뮤트 출력하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 디코더의 노이즈 제거 방법.
  2. 제1항에 있어서, 상기 이전 프레임의 끝부분에는 1에서 0으로 감소하는 스무딩 함수를 곱하고, 상기 반복 출력할 프레임의 시작부분에는 0에서 1로 증가하는 스무딩 함수를 곱하는 것을 특징으로 하는 오디오 디코더의 노이즈 제거 방법.
  3. 제2항에 있어서, 상기 스무딩 함수는 선형 혹은 지수함수적 특성을 갖는 임의의 경로를 형성하는 함수임을 특징으로 하는 오디오 디코더의 노이즈 제거 방법.
KR1020020018582A 2002-04-04 2002-04-04 오디오 디코더의 노이즈 제거 방법 KR20030079515A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020018582A KR20030079515A (ko) 2002-04-04 2002-04-04 오디오 디코더의 노이즈 제거 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020018582A KR20030079515A (ko) 2002-04-04 2002-04-04 오디오 디코더의 노이즈 제거 방법

Publications (1)

Publication Number Publication Date
KR20030079515A true KR20030079515A (ko) 2003-10-10

Family

ID=32377873

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020018582A KR20030079515A (ko) 2002-04-04 2002-04-04 오디오 디코더의 노이즈 제거 방법

Country Status (1)

Country Link
KR (1) KR20030079515A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130123713A (ko) * 2012-05-03 2013-11-13 현대모비스 주식회사 팝 노이즈 제거 방법
CN106710606A (zh) * 2016-12-29 2017-05-24 百度在线网络技术(北京)有限公司 基于人工智能的语音处理方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130123713A (ko) * 2012-05-03 2013-11-13 현대모비스 주식회사 팝 노이즈 제거 방법
CN106710606A (zh) * 2016-12-29 2017-05-24 百度在线网络技术(北京)有限公司 基于人工智能的语音处理方法及装置
CN106710606B (zh) * 2016-12-29 2019-11-08 百度在线网络技术(北京)有限公司 基于人工智能的语音处理方法及装置
US10580436B2 (en) 2016-12-29 2020-03-03 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for processing speech based on artificial intelligence

Similar Documents

Publication Publication Date Title
JPH10209977A (ja) 受信データ伸長装置
JP4675884B2 (ja) 特定番組検出装置及び方法並びにプログラム
CN101809999A (zh) 声音信号控制装置
US9153241B2 (en) Signal processing apparatus
KR20030079515A (ko) 오디오 디코더의 노이즈 제거 방법
KR100708123B1 (ko) 자동으로 오디오 볼륨을 조절하는 방법 및 장치
JP2904083B2 (ja) 音声符号化切替えシステム
US20070255556A1 (en) Audio level control for compressed audio
JP3187953B2 (ja) 無線通信装置
JP3436940B2 (ja) 無線通信装置
KR100672541B1 (ko) 외부 앰프 및 잡음 제거 방법
JP4572755B2 (ja) 復号化装置,復号化方法及びデジタル音声通信システム
JP3603470B2 (ja) 音声品質改善装置
US20050117758A1 (en) Audio outputting apparatus and audio outputting method
WO2010100895A1 (ja) 音声再生装置及び映像音声再生装置
JP4680122B2 (ja) 話速変換装置及びテレビジョン受像機並びに話速変換方法
US20060156159A1 (en) Audio data interpolation apparatus
JP2004165771A (ja) 音声再生装置
JP2008176110A (ja) オーディオ信号処理装置及びオーディオ信号処理方法
KR20060101889A (ko) 디지털 오디오의 신호 처리 방법 및 장치
JP2003162299A (ja) 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JP2005348226A (ja) 無線通信方法及び装置
JP2007271916A (ja) 音声データ圧縮装置および伸張装置
CA3228059A1 (en) Method and device for limiting of output synthesis distortion in a sound codec
JPH07236101A (ja) 音声信号処理手段

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application