KR20080072451A - 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 - Google Patents

오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 Download PDF

Info

Publication number
KR20080072451A
KR20080072451A KR1020070011256A KR20070011256A KR20080072451A KR 20080072451 A KR20080072451 A KR 20080072451A KR 1020070011256 A KR1020070011256 A KR 1020070011256A KR 20070011256 A KR20070011256 A KR 20070011256A KR 20080072451 A KR20080072451 A KR 20080072451A
Authority
KR
South Korea
Prior art keywords
signal
audio signal
error data
data
error
Prior art date
Application number
KR1020070011256A
Other languages
English (en)
Other versions
KR101471978B1 (ko
Inventor
마니쉬 아로라
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070011256A priority Critical patent/KR101471978B1/ko
Publication of KR20080072451A publication Critical patent/KR20080072451A/ko
Application granted granted Critical
Publication of KR101471978B1 publication Critical patent/KR101471978B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 발명은 오디오 신호의 음질 향상을 위한 데이터 삽입 방법에 관한 것으로, 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하고, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하며, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한 후,제1 신호로부터 제3 신호를 차분하여 오차를 계산하고, 계산된 오차를 인코딩하여 제2 신호에 삽입함으로써, 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시킬 수 있다.
비트롭, 음질, 향상, 보강, 삽입

Description

오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그 장치{Method for inserting data for enhancing quality of audio signal and apparatus therefor}
도 1은 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 2는 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 도시한 도면이다.
도 3은 본 발명에 따른 오차 데이터의 일실시예를 도시한 도면이다.
도 4는 본 발명에 따른 오디오 신호에 삽입될 오차 데이터 패킷의 일실시예를 도시한 도면이다.
도 5(a)(b)는 본 발명에 따라 오차 데이터의 삽입을 위하여 이용되는 비트 수의 패턴을 설명하기 위하여 도시한 도면이다.
도 6은 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법을 설명하기 위하여 도시한 흐름도이다.
도 7은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치의 일실시예를 도시한 도면이다.
도 8은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법을 설명하기 위하여 도시한 흐름도이다.
본 발명은 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그 장치, 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법 및 그 장치에 관한 것이다.
PCM (pulse code modulation) 방식은 아날로그 데이터를 소정의 주기로 표본화하고, 양자화하여 8, 16, 32, 또는 64 비트로 이진 부호화하는 방식이다.
비트 롭(bit robbing) 방식이란 PCM 부호화된 샘플 신호, 즉 원래 PCM 샘플이 갖고 있는 정보와 상관 없는 정보를 PCM 샘플에 삽입하기 위해 PCM 샘플의 소정 비트를 사용하는 방법이다. 예를 들어, 소정의 내용을 운반하기 위하여, PCM 데이터에 독립적인 데이터 채널을 형성하기 위해, PCM 샘플링된 데이터 중 소정의 비트를 규칙적으로 사용하는 것이다.
이러한 비트 롭 방식은 공중 회선 망(public switched telephone network: PSTN) 및 사설 네트워크에서 음성 및 데이터를 전송하기 위해 폭넓게 사용되고 있는 T-캐리어(T-carrier) 시스템에 사용되고 있다. 이러한, 시스템에서는 PCM 샘플 중 어떤 비트들이 사용될 지에 대한 정보는 미리 알려져 있어야 한다. 이러한 방식은 미국 특허 제5,864,600호에 개시되어 있다.
도 1은 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 1을 참조하면, 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장 치는 AD 컨버터(110), 정규화부(120), 다운 샘플링부(130), 양자화부(140) 및 데이터 삽입부(150)를 포함한다.
AD 컨버터(110)는 아날로그 오디오 신호를 디지털 오디오 신호로 변환하고, 정규화부(120)는 이와 같은 오디오 신호를 정규화(normalization) 한다. 정규화는 디지털 마스터링(digital mastering)이라고 불리기도 하며 오디오 시디 등에 저장되는 오디오 신호들의 볼륨을 일정하게 맞추는 것을 말한다.
다운 샘플링부(130)는 정규화된 오디오 신호의 샘플링 레이트를 낮춘다.
양자화부(140)는 샘플링 레이트가 낮춰진 오디오 신호의 비트수를 낮춰서 재양자화한다.
일반적으로 아날로그 신호는 샘플링 레이트 및 비트 수가 매우 높기 때문에, CD 등에 기록하기 위해서는 샘플링 레이트 및 비트수를 낮추어야 하는데, 다운 샘플링부(130) 및 양자화부(140)에서 이와 같이 샘플링 레이트 및 비트수를 낮추는 기능을 수행하는 것이다. 일반적으로 오디오 CD에는 44.1KHz의 샘플링 레이트와 16비트로 오디오 신호가 기록된다.
데이터 삽입부(150)는 오디오 신호의 음질을 향상시킬 수 있는 데이터를 오디오 신호에 삽입하게 된다. 이때, 오디오 신호의 음질을 향상시킬 수 있는 데이터로는 이득(gain), 피크 제한(peak limiting) 및 데시메이션 필터(decimation filter) 선택을 위한 정보가 있다. 여기서 데시메이션은 표본화 데이터 양을 줄이기 위해 사용하는 기술로서 데시메이션 필터 선택을 위한 정보는 이와 같은 필터를 선택하기 위한 정보를 말한다.
이와 같은 데이터를 삽입함으로써, 예컨대 16 비트/44.1KHz 샘플링 레이트를 가지는 오디오 신호를 20 비트/192KHz 샘플링 레이트를 가지는 오디오 신호로 변환할 수 있다.
다만, 종래의 오디오 신호의 음질 향상 방법은 음질을 효과적으로 향상시키지 못하였고, 또한 이와 같은 데이터를 삽입함에 따라 오디오 신호의 음질의 저하를 발생시키는 문제점이 있었다.
본 발명의 목적은 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시키기 위한 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그 장치, 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법 및 그 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법은, 상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 단계; 상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 단계; 상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 단계; 상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 단계; 및 상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 단계를 포함한다.
바람직하게는 상기 삽입하는 단계는 상기 오디오 신호의 에너지 레벨에 기초 하여, 상기 오디오 신호 샘플의 소정의 비트에 상기 오차 데이터를 삽입하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법은, 상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 단계; 상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 단계;상기 오차가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 단계; 및 상기 제1 신호와 제2 신호를 결합하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치는 상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 제1신호생성부; 상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 제2신호생성부; 상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 제3신호생성부; 상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 오차산출부; 및 상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 오차삽입부를 포함하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치는 상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 오차추출부; 상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 제1신호생성부; 상기 오차 데이터가 삽입된 소정의 비트 외의 비 트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 제2신호생성부; 및 상기 제1 신호와 제2 신호를 결합하는 신호결합부를 포함한다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.
도 2는 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 도시한 도면이다.
도 2를 참조하면, 본 발명에 따른 데이터 삽입 장치는 제1 신호 생성부(210), 제2신호생성부(220), 제3신호생성부(230), 오차산출부(240) 및 오차삽입부(250)를 포함한다.
제1 신호 생성부(210)는 오디오 신호를 정규화한다.
이하에서는 이와 같이 오디오 신호를 정규화한 신호를 제1 신호라고 명명한다.
제2신호생성부(220)는 다운샘플링부(222) 및 양자화부(224)를 포함한다.
다운샘플링부(222)는 제1 신호의 샘플링 레이트를 낮춘다.
양자화부(224)는 다운 샘플링된 제1 신호의 비트수를 낮춘다.
이하에서는 제1 신호의 샘플링 레이트 및 비트수를 낮춘 신호를 제2 신호라고 명명한다.
이와 같이 제2신호생성부(220)에 의한 처리를 거치는 이유는, 제1신호생성부(210)에 입력된 오디오 신호는 샘플링 레이트 및 비트 수가 매우 높은데, 이를 CD 등에 기록될 수 있는 샘플링 레이트 및 비트수로 낮추기 위함이다.
제3신호생성부(230)는 업샘플링부(232) 및 비트쉬프팅부(234)를 포함한다.
업샘플링부(232)는 제2 신호의 샘플링 레이트를 높인다.
비트쉬프팅부(234)는 샘플링 레이트가 높아진 제2 신호의 비트 수를 높인다.
이와 같이 제3신호생성부(230)에 의한 처리를 거치는 이유는, 후술할 오차 산출부(240)에서 제1 신호에서 제3신호를 차분하게 되는데, 이때, 제1 신호와 제3신호의 샘플링 레이트와 비트 수가 동일해야지만 차분이 가능하기 때문이다.
즉, 제3신호생성부(230)에서는 제2 신호의 샘플링 레이트 및 비트 수를 높여, 제1 신호와 샘플링 레이트 및 비트 수가 동일하도록 맞춰진 신호를 생성하게 된다.
오차산출부(240)는 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산한다.
이를 상세히 설명하면, 오차 산출부(240)는 입력된 오디오 신호를 정규화한 신호(제1 신호)로부터, 그 신호에 대하여 다운 샘플링 및 양자화, 그리고 업 샘플링 및 비트 쉬프팅을 수행한 신호를 차분하여 오차 데이터를 계산하는 것이다.
도 3은 본 발명에 따른 오차 데이터의 일실시예를 도시한 도면이다.
도 3은 44.1kHz의 샘플링 레이트를 가지는 오디오 신호에서의 오차를 도시한 도면이다. 먼저, 22.05KHz 이하에는 양자화 오차가 도시되어 있는데, 이는 제2신호 생성부(220)에서 오디오 신호를 오디오 CD 등에 기록하기 위하여 16비트와 같이 낮은 비트 수로 낮춰서 양자화하는 과정에서 발생하는 오차들을 나타낸다.
또한, 22.05KHz 이상에는 입력되는 오디오 신호의 그래프 파형이 그대로 오 차로서 도시되어 있다. 이는, 오디오 신호가 손상 없이 재생되기 위해서는 샘플링을 할 때 그 오디오 신호가 가지고 있는 최대 주파수의 2배 이상이 되는 주파수로 샘플링을 해야 한다는 제약점 때문에 발생하는 오차이다.
즉, 오디오 신호를 44.1KHz의 샘플링 레이트를 가지도록 샘플링을 하려면 상기의 제약점 때문에 22.05KHz 이상의 신호는 강제로 제거하게 된다. 따라서 제2 신호에서는 22.05KHz 이상의 오디오 신호는 존재하지 않게 된다. 따라서, 제1 신호에서 제2신호의 샘플링 레이트 및 비트 레이트를 높인 신호인 제3 신호를 빼주게 되면, 22.05KHz 이상에서는 제1 신호에서의 22.05KHz의 오디오 신호가 오차로서 얻어지는 것이다.
오차삽입부(250)는 오차 산출부(240)에서 계산된 오차 데이터를 인코딩하여 제2 신호에 삽입한다. 이때, 오차삽입부(250)는 오디오 신호의 에너지 레벨에 기초하여, 오디오 신호 샘플의 소정의 비트에 계산된 오차 데이터를 삽입한다.
이때, 인코딩은 MP3, MPEG, SBR(Spectral Band Replication)과 같은 방법을 이용할 수 있다.
이와 같이 에너지 레벨이 기초하여 소정의 비트에 계산된 오차 데이터를 삽입하는 이유는, 이와 같은 오차 데이터를 삽입하면서도 오디오 신호에 잡음이 발생하지 않게 하기 위함이다.
즉, 입력되는 오디오 신호의 에너지 레벨이 소정의 크기 이상인 경우에는 오디오 샘플의 복수개의 최하위 비트(least significant bit:LSB)에 데이터를 삽입하더라도, 이로 인한 잡음은 원래의 오디오 신호에 의하여 들리지 않게 되는데, 이와 같은 특성을 이용하는 것이다.
또한, 바람직하게는 오차삽입부(250)는 오차 데이터를 랜덤화하여 삽입할 수도 있다.
도 3은 본 발명에 따른 에너지 레벨에 따른 데이터 삽입 방법을 설명하기 위하여 도시한 도면이다.
도 3은 마스킹하는 음에 의해 마스킹이 이루어지는 동시-마스킹(simultaneous-masking), 마스킹하는 음의 전 후의 후방성 마스킹(pre-masking) 및 전향성 마스킹(post masking)을 도시한다. 도 3에 도시된 바와 같이, 마스킹하는 음의 전 후에도 마스킹 효과, 즉 후방성 및 전향성 마스킹 효과가 나타나는데 이를 순시 마스킹 효과(temporal masking effect)라고 한다.
여기에서, 동시-마스킹의 경우, 마스킹하는 음의 음압에 비례해서 마스킹 효과는 크게 나타난다. 또한, 순시 마스킹 효과는 마스킹하는 음과의 시간차가 짧을수록 크게 나타난다. 이하에서는 청취자가 음질 저하를 지각하지 못하는 범위내에서 오차 데이터를 오디오 신호에 삽입하기 위해 이와 같은 마스킹 효과를 이용한다.
본 발명에서는 에너지 레벨 계산을 위하여 오디오 신호를 소정의 블록으로 구분하며, 각각의 구분된 블록을 오디오 블록이라고 명명한다. 본 발명에서 상기와 같은 마스킹 효과를 이용하는 결과, 후술하는 바와 같이 현재 오디오 블록의 에너지가 낮은 레벨인 경우에도, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우에 오차 데이터를 삽입할 수 있게 된다.
도 4는 본 발명에 따른 오디오 신호에 삽입될 오차 데이터 패킷의 일실시예를 도시한 도면이다.
본 발명에서 오차 데이터는 오차 데이터 패킷의 형태로 삽입되는데, 도 4를 참조하면, 본 발명에 따른 오차 데이터 패킷은 동기 워드(sync word), 기간 정보(duration information), 비트 롭 패턴 정보(bit robbing pattern information) 및 오차 데이터를 포함한다.
시작 동기 워드(start synchronization word)는 오차 데이터 패킷의 시작을 나타낸다. 본 실시예에서 시작 동기 워드는 16 비트를 사용한다. 16 비트는 시작 코드(start code)로서 충분한 길이이며, 오검출(false detection)의 확률은 매우 낮다. 본 실시예에서는 동기 워드는 에너지 레벨을 고려하지 않고, PCM 샘플의 최하위 비트를 사용하여 삽입된다.
기간 정보는 오차 데이터를 삽입하기 위해 사용되는 PCM 샘플의 수를 나타낸다. 이때, 기간 정보는 동기 워드 다음의 16 비트를 사용하며, PCM 샘플의 최하위 비트를 사용하여 삽입된다. 기간 정보에 오차 데이터가 삽입되는 PCM 샘플의 수에 대한 정보를 포함하는 것은 에너지 레벨이 중간 레벨 또는 높은 레벨인 경우에도, 삽입하고자 하는 오차 데이터가 이미 삽입된 경우, 그 이후의 PCM 샘플들에 대해서는 비트-롭을 수행하지 않았다는 것을 나타내기 위해서이다.
오차 데이터는 현재 오디오 블록, 이전 오디오 블록 및 이후 오디오 블록의 에너지 레벨에 기초하여 PCM 샘플들에 적응적으로 삽입된다.
예를 들어, i) 현재 오디오 블록의 에너지 레벨이 중간 레벨인 경우, 오차 데이터는 매 PCM 샘플의 하나의 최하위 비트를 사용하여 삽입된다.
ii) 또한, 현재 오디오 블록의 에너지 레벨이 높은 레벨인 경우, 오차 데이터는 매 PCM 샘플의 복수개의 최하위 비트(multiple bit)를 사용하여 삽입된다.
iii) 또한, 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우, 오차 데이터는 소정의 PCM 샘플의 간격으로 PCM 샘플의 최하위 비트를 사용하여 삽입된다. 예컨대, 5개의 PCM 샘플 간격으로 PCM 샘플의 최하위 비트를 사용하여 오차 데이터가 삽입될 수 있다.
본 실시예에서, 현재 오디오 블록, 이전 오디오 블록, 및 이후 오디오 블록의 에너지 레벨에 따라 비트-롭 되는 비트의 수는 하나 또는 복수개의 비트로 구분되지만, 에너지 레벨에 따라 비트-롭 되는 비트의 수는 다른 패턴으로 결정될 수 있다.
도 5(a)(b)는 본 발명에 따라 오차 데이터의 삽입을 위하여 이용되는 비트 수의 패턴을 설명하기 위하여 도시한 도면이다.
도 5(a)는 매 PCM 샘플 마다 하나 이상의 비트를 사용하여 오차 데이터를 삽입하는 것을 나타내며 현재 오디오 블록의 에너지 레벨이 중간 레벨 또는 높은 레벨인 경우에는 이와 같은 패턴으로 오차 데이터가 삽입된다.
도 5(b)는 소정 수의 PCM 샘플 마다 하나의 최하위 비트를 사용하여 삽입하는 것을 나타내며 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우에 이와 같은 패턴으로 오차 데이터가 삽입된다.
비트 롭 패턴 정보는 PCM 샘플 중 오차 데이터 삽입을 위해 사용되는 비트의 수에 대한 정보를 포함한다. 선택적으로, 비트 롭 패턴 정보는 오차 데이터 삽입을 위해 사용되는 비트의 위치 정보, 예를 들어 오차 데이터가 5 개의 PCM 샘플 간격으로 삽입되는 것을 나타내기 위해 사용될 수 있다.
종료 동기 워드는 오차 데이터 패킷이 모두 삽입되었음을 나타낸다. 본 실시예에서는 종료 동기 워드의 길이는 16비트를 사용한다.
도 6은 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법을 설명하기 위하여 도시한 흐름도이다.
610 단계에서는, 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성한다.
620 단계에서는, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성한다.
630 단계에서는, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한다.
640 단계에서는, 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산한다.
650 단계에서는, 계산된 오차 데이터를 인코딩하여 제2 신호에 삽입한다.
전술한 바와 같이, 이때 오차삽입부(250)는 오디오 신호의 에너지 레벨에 기초하여, 오디오 신호 샘플의 소정의 비트에 계산된 오차 데이터를 삽입하여 오디오 신호에 발생하는 잡음을 최소화하면서 오차 데이터를 삽입할 수 있다.
도 7은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치의 일실시예를 도시한 도면이다.
도 7을 참조하면, 본 발명에 따른 음질 향상 장치는 오차추출부(710), 제1신호생성부(720), 제2신호생성부(730) 및 신호결합부(740)를 포함한다.
오차추출부(710)는 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출한다.
오차추출부(710)의 동작을 보다 구체적으로 설명하면, 먼저, 오차 추출부(710)는 오차 데이터가 랜덤화되어 삽입되어 있는 경우에는, 랜덤화되어 삽입된 데이터에 대하여 디스크램블링(descrambling)을 수행한 후에 시작 동기 워드를 추출한다. 다만, 오차 데이터가 랜덤화되어 삽입된 경우가 아니면 디스크램블링 과정은 생략될 수 있다.
시작 동기 워드가 유효한 경우에는 오차 추출부(710)는 도 4에서 도시한 기간 정보, 비트 롭 패턴 정보를 추출한 후에, 그 추출된 기간 정보, 비트 롭 패턴 정보 및 오디오 신호의 에너지 레벨에 기초하여 오차 데이터를 추출한다.
예를 들어, i) 현재 오디오 블록의 에너지 레벨이 중간 레벨인 경우, 오차 데이터는 매 PCM 샘플의 하나의 최하위 비트로부터 추출된다.
ii) 또한, 현재 오디오 블록의 에너지 레벨이 높은 레벨인 경우, 오차 데이터는 매 PCM 샘플의 복수개의 최하위 비트(multiple bit)로부터 추출된다.
iii) 마지막으로, 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우, 오차 데이터는 소정의 PCM 샘플의 간격으로 PCM 샘플의 최하위 비트로부터 추출된다. 예컨대, 5개의 PCM 샘플 간격으로 PCM 샘플의 최하위 비트로부터 오차 데이터가 추출될 수 있다.
제1신호생성부(720)는 오차 추출부(710)로부터 추출된 오차 데이터를 디코딩한다. 이하에서는 추출된 오차 데이터를 디코딩한 신호를 제1 신호라고 명명한다. 이때, 제1 신호 생성부(720)는 오차 데이터가 인코딩된 방식에 대응되는 방식으로 디코딩을 수행하게 된다. 즉, 인코딩이 MP3, MPEG, SBR(Spectral Band Replication)과 같은 방법으로 이루어진 경우에는, 그에 대응되는 방식으로 디코딩을 수행하게 된다.
제2신호생성부(730)는 오디오 신호에서 오차가 삽입된 비트 외의 비트에 기록되어 있는 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행한다.
이와 같이 업샘플링 및 비트 쉬프팅이 수행된 오디오 신호에 대하여 이하에서는 제2 신호로 명명한다.
업샘플링부(732)는 오디오 신호에서 오차가 삽입된 비트 외의 비트에 기록되어 있는 오디오 신호의 샘플링 레이트를 높인다.
비트 쉬프팅(734)는 샘플링 레이트가 높아진 오디오 신호의 비트 수를 높여준다.
이와 같이, 샘플링 레이트와 비트 수를 높이는 이유는, 후술할 신호 결합부(740)에서 제1 신호와 제2 신호를 결합하게 되는데, 이때 결합을 위해서는 제1 신호와 제2 신호의 샘플링 레이트와 비트 수가 동일해야 하기 때문이다.
예컨대, 제1 신호의 샘플링 레이트 및 비트 수가 각각 192KHz와 20비트이고, 제2 신호의 샘플링 레이트 및 비트 수가 44.1KHz와 16비트라면, 제2 신호의 샘플링 레이트 및 비트 수가 192KHz와 20비트가 되도록 맞춰주는 것이다.
신호 결합부(740)는 제1 신호와 제2 신호를 결합한다.
보다 구체적으로는 신호 결합부(740)는 오디오 신호로부터 오차 데이터를 추출하여 디코딩한 신호(제1 신호)와 오차 데이터 이외의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행한 신호(제2 신호)를 결합함으로써, 오디오 신호의 음질을 향상하게 된다.
도 8은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법을 설명하기 위하여 도시한 흐름도이다.
810 단계에서는, 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출한다.
820 단계에서는, 추출한 오차 데이터를 디코딩하여 제1 신호를 생성한다.
830 단계에서는, 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성한다.
840 단계에서는, 제1 신호와 제2 신호를 결합한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명은 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하고, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하며, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한 후,제1 신호로부터 제3 신호를 차분하여 오차를 계산하고, 계산된 오차를 인코딩하여 제2 신호에 삽입함으로써, 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시키는 효과가 있다.

Claims (5)

  1. 오디오 신호의 음질 향상을 위한 데이터 삽입 방법에 있어서,
    상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 단계;
    상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 단계;
    상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 단계;
    상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 단계; 및
    상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 단계를 포함하는 것을 특징으로 하는 데이터 삽입 방법.
  2. 제1항에 있어서,
    상기 삽입하는 단계는
    상기 오디오 신호의 에너지 레벨에 기초하여, 상기 오디오 신호 샘플의 소정의 비트에 상기 오차 데이터를 삽입하는 것을 특징으로 하는 데이터 삽입 방법..
  3. 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법에 있어서,
    상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 단계;
    상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 단계;
    상기 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 단계; 및
    상기 제1 신호와 제2 신호를 결합하는 단계를 포함하는 것을 특징으로 하는 음질 향상 방법.
  4. 오디오 신호의 음질 향상을 위한 데이터 삽입 장치에 있어서,
    상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 제1신호 생성부;
    상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 제2신호생성부;
    상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 제3신호생성부;
    상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 오차산출부; 및
    상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 오차삽입부를 포함하는 것을 특징으로 하는 데이터 삽입 장치.
  5. 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치에 있어서,
    상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 오 차추출부;
    상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 제1신호생성부;
    상기 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 제2신호생성부; 및
    상기 제1 신호와 제2 신호를 결합하는 신호결합부를 포함하는 것을 특징으로 하는 음질 향상 장치.
KR1020070011256A 2007-02-02 2007-02-02 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 KR101471978B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070011256A KR101471978B1 (ko) 2007-02-02 2007-02-02 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070011256A KR101471978B1 (ko) 2007-02-02 2007-02-02 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치

Publications (2)

Publication Number Publication Date
KR20080072451A true KR20080072451A (ko) 2008-08-06
KR101471978B1 KR101471978B1 (ko) 2014-12-12

Family

ID=39882775

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070011256A KR101471978B1 (ko) 2007-02-02 2007-02-02 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치

Country Status (1)

Country Link
KR (1) KR101471978B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101482946B1 (ko) * 2013-03-21 2015-01-16 인텔렉추얼디스커버리 주식회사 오디오 신호 크기 제어 방법 및 장치
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统
CN117854514B (zh) * 2024-03-06 2024-05-31 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2658676B1 (fr) * 1990-02-16 1992-06-12 France Etat Dispositif de quantification a debit de codage numerique variable.
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
KR100611412B1 (ko) * 2002-10-18 2006-08-09 명지대학교 산학협력단 마스킹 효과를 이용한 오디오 워터마크 삽입 및 검출방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
US11024319B2 (en) 2011-04-05 2021-06-01 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
US11074919B2 (en) 2011-04-05 2021-07-27 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
KR101482946B1 (ko) * 2013-03-21 2015-01-16 인텔렉추얼디스커버리 주식회사 오디오 신호 크기 제어 방법 및 장치
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统
CN117854514B (zh) * 2024-03-06 2024-05-31 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Also Published As

Publication number Publication date
KR101471978B1 (ko) 2014-12-12

Similar Documents

Publication Publication Date Title
US8306811B2 (en) Embedding data in audio and detecting embedded data in audio
Lie et al. Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification
US6061793A (en) Method and apparatus for embedding data, including watermarks, in human perceptible sounds
KR100898879B1 (ko) 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템
Dong et al. Data hiding via phase manipulation of audio signals
CA2527011C (en) Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
US20060227968A1 (en) Speech watermark system
Gopalan et al. Audio steganography for covert data transmission by imperceptible tone insertion
Lie et al. Robust and high-quality time-domain audio watermarking subject to psychoacoustic masking
US20030215013A1 (en) Audio encoder with adaptive short window grouping
JP5027256B2 (ja) ノイズ信号の符号化及び復号化の装置及び方法
KR20040034698A (ko) Dsd 신호에 대한 견고한 워터마크
Bibhu et al. Secret key watermarking in WAV audio file in perceptual domain
KR101471978B1 (ko) 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치
US20060198557A1 (en) Fragile audio watermark related to a buried data channel
Wu et al. Robust and blind audio watermarking algorithm in dual domain for overcoming synchronization attacks
Cao et al. Bit replacement audio watermarking using stereo signals
Wei et al. Audio watermarking using time-frequency compression expansion
KR20080072223A (ko) 파라메트릭 부/복호화 방법 및 이를 위한 장치
Xu et al. A robust digital audio watermarking technique
Xu et al. Content-based digital watermarking for compressed audio
Wei et al. Audio watermarking of stereo signals based on echo-hiding method
Foo et al. Audio watermarking based on compression-expansion technique
Liang et al. Robust blind extracting audio watermarking based on quadrature phase shift keying and improved spread spectrum
Hu et al. A perceptually adaptive and retrievable QIM scheme for efficient blind audio watermarking

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180313

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181204

Year of fee payment: 5