KR20080072451A - 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 - Google Patents
오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 Download PDFInfo
- Publication number
- KR20080072451A KR20080072451A KR1020070011256A KR20070011256A KR20080072451A KR 20080072451 A KR20080072451 A KR 20080072451A KR 1020070011256 A KR1020070011256 A KR 1020070011256A KR 20070011256 A KR20070011256 A KR 20070011256A KR 20080072451 A KR20080072451 A KR 20080072451A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- audio signal
- error data
- data
- error
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims description 19
- 230000002708 enhancing effect Effects 0.000 title 1
- 238000005070 sampling Methods 0.000 claims abstract description 52
- 238000013139 quantization Methods 0.000 claims abstract description 14
- 238000012966 insertion method Methods 0.000 claims abstract description 9
- 238000003780 insertion Methods 0.000 claims description 18
- 230000037431 insertion Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 29
- 230000000873 masking effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- OEXHQOGQTVQTAT-SSZRJXQFSA-N [(1r,5s)-8-methyl-8-propan-2-yl-8-azoniabicyclo[3.2.1]octan-3-yl] (2r)-3-hydroxy-2-phenylpropanoate Chemical class C1([C@H](CO)C(=O)OC2C[C@H]3CC[C@@H](C2)[N+]3(C)C(C)C)=CC=CC=C1 OEXHQOGQTVQTAT-SSZRJXQFSA-N 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
본 발명은 오디오 신호의 음질 향상을 위한 데이터 삽입 방법에 관한 것으로, 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하고, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하며, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한 후,제1 신호로부터 제3 신호를 차분하여 오차를 계산하고, 계산된 오차를 인코딩하여 제2 신호에 삽입함으로써, 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시킬 수 있다.
비트롭, 음질, 향상, 보강, 삽입
Description
도 1은 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 2는 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 도시한 도면이다.
도 3은 본 발명에 따른 오차 데이터의 일실시예를 도시한 도면이다.
도 4는 본 발명에 따른 오디오 신호에 삽입될 오차 데이터 패킷의 일실시예를 도시한 도면이다.
도 5(a)(b)는 본 발명에 따라 오차 데이터의 삽입을 위하여 이용되는 비트 수의 패턴을 설명하기 위하여 도시한 도면이다.
도 6은 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법을 설명하기 위하여 도시한 흐름도이다.
도 7은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치의 일실시예를 도시한 도면이다.
도 8은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법을 설명하기 위하여 도시한 흐름도이다.
본 발명은 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그 장치, 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법 및 그 장치에 관한 것이다.
PCM (pulse code modulation) 방식은 아날로그 데이터를 소정의 주기로 표본화하고, 양자화하여 8, 16, 32, 또는 64 비트로 이진 부호화하는 방식이다.
비트 롭(bit robbing) 방식이란 PCM 부호화된 샘플 신호, 즉 원래 PCM 샘플이 갖고 있는 정보와 상관 없는 정보를 PCM 샘플에 삽입하기 위해 PCM 샘플의 소정 비트를 사용하는 방법이다. 예를 들어, 소정의 내용을 운반하기 위하여, PCM 데이터에 독립적인 데이터 채널을 형성하기 위해, PCM 샘플링된 데이터 중 소정의 비트를 규칙적으로 사용하는 것이다.
이러한 비트 롭 방식은 공중 회선 망(public switched telephone network: PSTN) 및 사설 네트워크에서 음성 및 데이터를 전송하기 위해 폭넓게 사용되고 있는 T-캐리어(T-carrier) 시스템에 사용되고 있다. 이러한, 시스템에서는 PCM 샘플 중 어떤 비트들이 사용될 지에 대한 정보는 미리 알려져 있어야 한다. 이러한 방식은 미국 특허 제5,864,600호에 개시되어 있다.
도 1은 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 설명하기 위하여 도시한 도면이다.
도 1을 참조하면, 종래의 오디오 신호의 음질 향상을 위한 데이터 삽입 장 치는 AD 컨버터(110), 정규화부(120), 다운 샘플링부(130), 양자화부(140) 및 데이터 삽입부(150)를 포함한다.
AD 컨버터(110)는 아날로그 오디오 신호를 디지털 오디오 신호로 변환하고, 정규화부(120)는 이와 같은 오디오 신호를 정규화(normalization) 한다. 정규화는 디지털 마스터링(digital mastering)이라고 불리기도 하며 오디오 시디 등에 저장되는 오디오 신호들의 볼륨을 일정하게 맞추는 것을 말한다.
다운 샘플링부(130)는 정규화된 오디오 신호의 샘플링 레이트를 낮춘다.
양자화부(140)는 샘플링 레이트가 낮춰진 오디오 신호의 비트수를 낮춰서 재양자화한다.
일반적으로 아날로그 신호는 샘플링 레이트 및 비트 수가 매우 높기 때문에, CD 등에 기록하기 위해서는 샘플링 레이트 및 비트수를 낮추어야 하는데, 다운 샘플링부(130) 및 양자화부(140)에서 이와 같이 샘플링 레이트 및 비트수를 낮추는 기능을 수행하는 것이다. 일반적으로 오디오 CD에는 44.1KHz의 샘플링 레이트와 16비트로 오디오 신호가 기록된다.
데이터 삽입부(150)는 오디오 신호의 음질을 향상시킬 수 있는 데이터를 오디오 신호에 삽입하게 된다. 이때, 오디오 신호의 음질을 향상시킬 수 있는 데이터로는 이득(gain), 피크 제한(peak limiting) 및 데시메이션 필터(decimation filter) 선택을 위한 정보가 있다. 여기서 데시메이션은 표본화 데이터 양을 줄이기 위해 사용하는 기술로서 데시메이션 필터 선택을 위한 정보는 이와 같은 필터를 선택하기 위한 정보를 말한다.
이와 같은 데이터를 삽입함으로써, 예컨대 16 비트/44.1KHz 샘플링 레이트를 가지는 오디오 신호를 20 비트/192KHz 샘플링 레이트를 가지는 오디오 신호로 변환할 수 있다.
다만, 종래의 오디오 신호의 음질 향상 방법은 음질을 효과적으로 향상시키지 못하였고, 또한 이와 같은 데이터를 삽입함에 따라 오디오 신호의 음질의 저하를 발생시키는 문제점이 있었다.
본 발명의 목적은 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시키기 위한 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그 장치, 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법 및 그 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법은, 상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 단계; 상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 단계; 상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 단계; 상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 단계; 및 상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 단계를 포함한다.
바람직하게는 상기 삽입하는 단계는 상기 오디오 신호의 에너지 레벨에 기초 하여, 상기 오디오 신호 샘플의 소정의 비트에 상기 오차 데이터를 삽입하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법은, 상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 단계; 상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 단계;상기 오차가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 단계; 및 상기 제1 신호와 제2 신호를 결합하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치는 상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 제1신호생성부; 상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 제2신호생성부; 상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 제3신호생성부; 상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 오차산출부; 및 상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 오차삽입부를 포함하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치는 상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 오차추출부; 상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 제1신호생성부; 상기 오차 데이터가 삽입된 소정의 비트 외의 비 트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 제2신호생성부; 및 상기 제1 신호와 제2 신호를 결합하는 신호결합부를 포함한다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.
도 2는 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 장치의 일실시예를 도시한 도면이다.
도 2를 참조하면, 본 발명에 따른 데이터 삽입 장치는 제1 신호 생성부(210), 제2신호생성부(220), 제3신호생성부(230), 오차산출부(240) 및 오차삽입부(250)를 포함한다.
제1 신호 생성부(210)는 오디오 신호를 정규화한다.
이하에서는 이와 같이 오디오 신호를 정규화한 신호를 제1 신호라고 명명한다.
제2신호생성부(220)는 다운샘플링부(222) 및 양자화부(224)를 포함한다.
다운샘플링부(222)는 제1 신호의 샘플링 레이트를 낮춘다.
양자화부(224)는 다운 샘플링된 제1 신호의 비트수를 낮춘다.
이하에서는 제1 신호의 샘플링 레이트 및 비트수를 낮춘 신호를 제2 신호라고 명명한다.
이와 같이 제2신호생성부(220)에 의한 처리를 거치는 이유는, 제1신호생성부(210)에 입력된 오디오 신호는 샘플링 레이트 및 비트 수가 매우 높은데, 이를 CD 등에 기록될 수 있는 샘플링 레이트 및 비트수로 낮추기 위함이다.
제3신호생성부(230)는 업샘플링부(232) 및 비트쉬프팅부(234)를 포함한다.
업샘플링부(232)는 제2 신호의 샘플링 레이트를 높인다.
비트쉬프팅부(234)는 샘플링 레이트가 높아진 제2 신호의 비트 수를 높인다.
이와 같이 제3신호생성부(230)에 의한 처리를 거치는 이유는, 후술할 오차 산출부(240)에서 제1 신호에서 제3신호를 차분하게 되는데, 이때, 제1 신호와 제3신호의 샘플링 레이트와 비트 수가 동일해야지만 차분이 가능하기 때문이다.
즉, 제3신호생성부(230)에서는 제2 신호의 샘플링 레이트 및 비트 수를 높여, 제1 신호와 샘플링 레이트 및 비트 수가 동일하도록 맞춰진 신호를 생성하게 된다.
오차산출부(240)는 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산한다.
이를 상세히 설명하면, 오차 산출부(240)는 입력된 오디오 신호를 정규화한 신호(제1 신호)로부터, 그 신호에 대하여 다운 샘플링 및 양자화, 그리고 업 샘플링 및 비트 쉬프팅을 수행한 신호를 차분하여 오차 데이터를 계산하는 것이다.
도 3은 본 발명에 따른 오차 데이터의 일실시예를 도시한 도면이다.
도 3은 44.1kHz의 샘플링 레이트를 가지는 오디오 신호에서의 오차를 도시한 도면이다. 먼저, 22.05KHz 이하에는 양자화 오차가 도시되어 있는데, 이는 제2신호 생성부(220)에서 오디오 신호를 오디오 CD 등에 기록하기 위하여 16비트와 같이 낮은 비트 수로 낮춰서 양자화하는 과정에서 발생하는 오차들을 나타낸다.
또한, 22.05KHz 이상에는 입력되는 오디오 신호의 그래프 파형이 그대로 오 차로서 도시되어 있다. 이는, 오디오 신호가 손상 없이 재생되기 위해서는 샘플링을 할 때 그 오디오 신호가 가지고 있는 최대 주파수의 2배 이상이 되는 주파수로 샘플링을 해야 한다는 제약점 때문에 발생하는 오차이다.
즉, 오디오 신호를 44.1KHz의 샘플링 레이트를 가지도록 샘플링을 하려면 상기의 제약점 때문에 22.05KHz 이상의 신호는 강제로 제거하게 된다. 따라서 제2 신호에서는 22.05KHz 이상의 오디오 신호는 존재하지 않게 된다. 따라서, 제1 신호에서 제2신호의 샘플링 레이트 및 비트 레이트를 높인 신호인 제3 신호를 빼주게 되면, 22.05KHz 이상에서는 제1 신호에서의 22.05KHz의 오디오 신호가 오차로서 얻어지는 것이다.
오차삽입부(250)는 오차 산출부(240)에서 계산된 오차 데이터를 인코딩하여 제2 신호에 삽입한다. 이때, 오차삽입부(250)는 오디오 신호의 에너지 레벨에 기초하여, 오디오 신호 샘플의 소정의 비트에 계산된 오차 데이터를 삽입한다.
이때, 인코딩은 MP3, MPEG, SBR(Spectral Band Replication)과 같은 방법을 이용할 수 있다.
이와 같이 에너지 레벨이 기초하여 소정의 비트에 계산된 오차 데이터를 삽입하는 이유는, 이와 같은 오차 데이터를 삽입하면서도 오디오 신호에 잡음이 발생하지 않게 하기 위함이다.
즉, 입력되는 오디오 신호의 에너지 레벨이 소정의 크기 이상인 경우에는 오디오 샘플의 복수개의 최하위 비트(least significant bit:LSB)에 데이터를 삽입하더라도, 이로 인한 잡음은 원래의 오디오 신호에 의하여 들리지 않게 되는데, 이와 같은 특성을 이용하는 것이다.
또한, 바람직하게는 오차삽입부(250)는 오차 데이터를 랜덤화하여 삽입할 수도 있다.
도 3은 본 발명에 따른 에너지 레벨에 따른 데이터 삽입 방법을 설명하기 위하여 도시한 도면이다.
도 3은 마스킹하는 음에 의해 마스킹이 이루어지는 동시-마스킹(simultaneous-masking), 마스킹하는 음의 전 후의 후방성 마스킹(pre-masking) 및 전향성 마스킹(post masking)을 도시한다. 도 3에 도시된 바와 같이, 마스킹하는 음의 전 후에도 마스킹 효과, 즉 후방성 및 전향성 마스킹 효과가 나타나는데 이를 순시 마스킹 효과(temporal masking effect)라고 한다.
여기에서, 동시-마스킹의 경우, 마스킹하는 음의 음압에 비례해서 마스킹 효과는 크게 나타난다. 또한, 순시 마스킹 효과는 마스킹하는 음과의 시간차가 짧을수록 크게 나타난다. 이하에서는 청취자가 음질 저하를 지각하지 못하는 범위내에서 오차 데이터를 오디오 신호에 삽입하기 위해 이와 같은 마스킹 효과를 이용한다.
본 발명에서는 에너지 레벨 계산을 위하여 오디오 신호를 소정의 블록으로 구분하며, 각각의 구분된 블록을 오디오 블록이라고 명명한다. 본 발명에서 상기와 같은 마스킹 효과를 이용하는 결과, 후술하는 바와 같이 현재 오디오 블록의 에너지가 낮은 레벨인 경우에도, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우에 오차 데이터를 삽입할 수 있게 된다.
도 4는 본 발명에 따른 오디오 신호에 삽입될 오차 데이터 패킷의 일실시예를 도시한 도면이다.
본 발명에서 오차 데이터는 오차 데이터 패킷의 형태로 삽입되는데, 도 4를 참조하면, 본 발명에 따른 오차 데이터 패킷은 동기 워드(sync word), 기간 정보(duration information), 비트 롭 패턴 정보(bit robbing pattern information) 및 오차 데이터를 포함한다.
시작 동기 워드(start synchronization word)는 오차 데이터 패킷의 시작을 나타낸다. 본 실시예에서 시작 동기 워드는 16 비트를 사용한다. 16 비트는 시작 코드(start code)로서 충분한 길이이며, 오검출(false detection)의 확률은 매우 낮다. 본 실시예에서는 동기 워드는 에너지 레벨을 고려하지 않고, PCM 샘플의 최하위 비트를 사용하여 삽입된다.
기간 정보는 오차 데이터를 삽입하기 위해 사용되는 PCM 샘플의 수를 나타낸다. 이때, 기간 정보는 동기 워드 다음의 16 비트를 사용하며, PCM 샘플의 최하위 비트를 사용하여 삽입된다. 기간 정보에 오차 데이터가 삽입되는 PCM 샘플의 수에 대한 정보를 포함하는 것은 에너지 레벨이 중간 레벨 또는 높은 레벨인 경우에도, 삽입하고자 하는 오차 데이터가 이미 삽입된 경우, 그 이후의 PCM 샘플들에 대해서는 비트-롭을 수행하지 않았다는 것을 나타내기 위해서이다.
오차 데이터는 현재 오디오 블록, 이전 오디오 블록 및 이후 오디오 블록의 에너지 레벨에 기초하여 PCM 샘플들에 적응적으로 삽입된다.
예를 들어, i) 현재 오디오 블록의 에너지 레벨이 중간 레벨인 경우, 오차 데이터는 매 PCM 샘플의 하나의 최하위 비트를 사용하여 삽입된다.
ii) 또한, 현재 오디오 블록의 에너지 레벨이 높은 레벨인 경우, 오차 데이터는 매 PCM 샘플의 복수개의 최하위 비트(multiple bit)를 사용하여 삽입된다.
iii) 또한, 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우, 오차 데이터는 소정의 PCM 샘플의 간격으로 PCM 샘플의 최하위 비트를 사용하여 삽입된다. 예컨대, 5개의 PCM 샘플 간격으로 PCM 샘플의 최하위 비트를 사용하여 오차 데이터가 삽입될 수 있다.
본 실시예에서, 현재 오디오 블록, 이전 오디오 블록, 및 이후 오디오 블록의 에너지 레벨에 따라 비트-롭 되는 비트의 수는 하나 또는 복수개의 비트로 구분되지만, 에너지 레벨에 따라 비트-롭 되는 비트의 수는 다른 패턴으로 결정될 수 있다.
도 5(a)(b)는 본 발명에 따라 오차 데이터의 삽입을 위하여 이용되는 비트 수의 패턴을 설명하기 위하여 도시한 도면이다.
도 5(a)는 매 PCM 샘플 마다 하나 이상의 비트를 사용하여 오차 데이터를 삽입하는 것을 나타내며 현재 오디오 블록의 에너지 레벨이 중간 레벨 또는 높은 레벨인 경우에는 이와 같은 패턴으로 오차 데이터가 삽입된다.
도 5(b)는 소정 수의 PCM 샘플 마다 하나의 최하위 비트를 사용하여 삽입하는 것을 나타내며 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우에 이와 같은 패턴으로 오차 데이터가 삽입된다.
비트 롭 패턴 정보는 PCM 샘플 중 오차 데이터 삽입을 위해 사용되는 비트의 수에 대한 정보를 포함한다. 선택적으로, 비트 롭 패턴 정보는 오차 데이터 삽입을 위해 사용되는 비트의 위치 정보, 예를 들어 오차 데이터가 5 개의 PCM 샘플 간격으로 삽입되는 것을 나타내기 위해 사용될 수 있다.
종료 동기 워드는 오차 데이터 패킷이 모두 삽입되었음을 나타낸다. 본 실시예에서는 종료 동기 워드의 길이는 16비트를 사용한다.
도 6은 본 발명에 따른 오디오 신호의 음질 향상을 위한 데이터 삽입 방법을 설명하기 위하여 도시한 흐름도이다.
610 단계에서는, 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성한다.
620 단계에서는, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성한다.
630 단계에서는, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한다.
640 단계에서는, 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산한다.
650 단계에서는, 계산된 오차 데이터를 인코딩하여 제2 신호에 삽입한다.
전술한 바와 같이, 이때 오차삽입부(250)는 오디오 신호의 에너지 레벨에 기초하여, 오디오 신호 샘플의 소정의 비트에 계산된 오차 데이터를 삽입하여 오디오 신호에 발생하는 잡음을 최소화하면서 오차 데이터를 삽입할 수 있다.
도 7은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치의 일실시예를 도시한 도면이다.
도 7을 참조하면, 본 발명에 따른 음질 향상 장치는 오차추출부(710), 제1신호생성부(720), 제2신호생성부(730) 및 신호결합부(740)를 포함한다.
오차추출부(710)는 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출한다.
오차추출부(710)의 동작을 보다 구체적으로 설명하면, 먼저, 오차 추출부(710)는 오차 데이터가 랜덤화되어 삽입되어 있는 경우에는, 랜덤화되어 삽입된 데이터에 대하여 디스크램블링(descrambling)을 수행한 후에 시작 동기 워드를 추출한다. 다만, 오차 데이터가 랜덤화되어 삽입된 경우가 아니면 디스크램블링 과정은 생략될 수 있다.
시작 동기 워드가 유효한 경우에는 오차 추출부(710)는 도 4에서 도시한 기간 정보, 비트 롭 패턴 정보를 추출한 후에, 그 추출된 기간 정보, 비트 롭 패턴 정보 및 오디오 신호의 에너지 레벨에 기초하여 오차 데이터를 추출한다.
예를 들어, i) 현재 오디오 블록의 에너지 레벨이 중간 레벨인 경우, 오차 데이터는 매 PCM 샘플의 하나의 최하위 비트로부터 추출된다.
ii) 또한, 현재 오디오 블록의 에너지 레벨이 높은 레벨인 경우, 오차 데이터는 매 PCM 샘플의 복수개의 최하위 비트(multiple bit)로부터 추출된다.
iii) 마지막으로, 현재 오디오 블록의 에너지 레벨이 낮은 레벨이고, 이전 오디오 블록 또는 이후 오디오 블록의 에너지 레벨이 중간 또는 높은 레벨인 경우, 오차 데이터는 소정의 PCM 샘플의 간격으로 PCM 샘플의 최하위 비트로부터 추출된다. 예컨대, 5개의 PCM 샘플 간격으로 PCM 샘플의 최하위 비트로부터 오차 데이터가 추출될 수 있다.
제1신호생성부(720)는 오차 추출부(710)로부터 추출된 오차 데이터를 디코딩한다. 이하에서는 추출된 오차 데이터를 디코딩한 신호를 제1 신호라고 명명한다. 이때, 제1 신호 생성부(720)는 오차 데이터가 인코딩된 방식에 대응되는 방식으로 디코딩을 수행하게 된다. 즉, 인코딩이 MP3, MPEG, SBR(Spectral Band Replication)과 같은 방법으로 이루어진 경우에는, 그에 대응되는 방식으로 디코딩을 수행하게 된다.
제2신호생성부(730)는 오디오 신호에서 오차가 삽입된 비트 외의 비트에 기록되어 있는 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행한다.
이와 같이 업샘플링 및 비트 쉬프팅이 수행된 오디오 신호에 대하여 이하에서는 제2 신호로 명명한다.
업샘플링부(732)는 오디오 신호에서 오차가 삽입된 비트 외의 비트에 기록되어 있는 오디오 신호의 샘플링 레이트를 높인다.
비트 쉬프팅(734)는 샘플링 레이트가 높아진 오디오 신호의 비트 수를 높여준다.
이와 같이, 샘플링 레이트와 비트 수를 높이는 이유는, 후술할 신호 결합부(740)에서 제1 신호와 제2 신호를 결합하게 되는데, 이때 결합을 위해서는 제1 신호와 제2 신호의 샘플링 레이트와 비트 수가 동일해야 하기 때문이다.
예컨대, 제1 신호의 샘플링 레이트 및 비트 수가 각각 192KHz와 20비트이고, 제2 신호의 샘플링 레이트 및 비트 수가 44.1KHz와 16비트라면, 제2 신호의 샘플링 레이트 및 비트 수가 192KHz와 20비트가 되도록 맞춰주는 것이다.
신호 결합부(740)는 제1 신호와 제2 신호를 결합한다.
보다 구체적으로는 신호 결합부(740)는 오디오 신호로부터 오차 데이터를 추출하여 디코딩한 신호(제1 신호)와 오차 데이터 이외의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행한 신호(제2 신호)를 결합함으로써, 오디오 신호의 음질을 향상하게 된다.
도 8은 본 발명에 따른 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법을 설명하기 위하여 도시한 흐름도이다.
810 단계에서는, 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출한다.
820 단계에서는, 추출한 오차 데이터를 디코딩하여 제1 신호를 생성한다.
830 단계에서는, 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성한다.
840 단계에서는, 제1 신호와 제2 신호를 결합한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명은 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하고, 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하며, 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성한 후,제1 신호로부터 제3 신호를 차분하여 오차를 계산하고, 계산된 오차를 인코딩하여 제2 신호에 삽입함으로써, 오디오 신호에 발생하는 잡음을 최소화하면서 오디오 신호의 음질을 효과적으로 향상시키는 효과가 있다.
Claims (5)
- 오디오 신호의 음질 향상을 위한 데이터 삽입 방법에 있어서,상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 단계;상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 단계;상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 단계;상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 단계; 및상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 단계를 포함하는 것을 특징으로 하는 데이터 삽입 방법.
- 제1항에 있어서,상기 삽입하는 단계는상기 오디오 신호의 에너지 레벨에 기초하여, 상기 오디오 신호 샘플의 소정의 비트에 상기 오차 데이터를 삽입하는 것을 특징으로 하는 데이터 삽입 방법..
- 삽입된 데이터를 이용한 오디오 신호의 음질 향상 방법에 있어서,상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 단계;상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 단계;상기 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 단계; 및상기 제1 신호와 제2 신호를 결합하는 단계를 포함하는 것을 특징으로 하는 음질 향상 방법.
- 오디오 신호의 음질 향상을 위한 데이터 삽입 장치에 있어서,상기 오디오 신호를 정규화(nomalization)하여 제1 신호를 생성하는 제1신호 생성부;상기 제1 신호에 대하여 다운 샘플링 및 양자화를 수행하여 제2 신호를 생성하는 제2신호생성부;상기 양자화된 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제3 신호를 생성하는 제3신호생성부;상기 제1 신호로부터 제3 신호를 차분하여 오차 데이터를 계산하는 오차산출부; 및상기 계산된 오차 데이터를 인코딩하여 상기 제2 신호에 삽입하는 오차삽입부를 포함하는 것을 특징으로 하는 데이터 삽입 장치.
- 삽입된 데이터를 이용한 오디오 신호의 음질 향상 장치에 있어서,상기 오디오 신호 샘플의 소정의 비트에 삽입된 오차 데이터를 추출하는 오 차추출부;상기 추출한 오차 데이터를 디코딩하여 제1 신호를 생성하는 제1신호생성부;상기 오차 데이터가 삽입된 소정의 비트 외의 비트의 오디오 신호에 대하여 업 샘플링 및 비트 쉬프팅을 수행하여 제2 신호를 생성하는 제2신호생성부; 및상기 제1 신호와 제2 신호를 결합하는 신호결합부를 포함하는 것을 특징으로 하는 음질 향상 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070011256A KR101471978B1 (ko) | 2007-02-02 | 2007-02-02 | 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070011256A KR101471978B1 (ko) | 2007-02-02 | 2007-02-02 | 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080072451A true KR20080072451A (ko) | 2008-08-06 |
KR101471978B1 KR101471978B1 (ko) | 2014-12-12 |
Family
ID=39882775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070011256A KR101471978B1 (ko) | 2007-02-02 | 2007-02-02 | 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101471978B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101482946B1 (ko) * | 2013-03-21 | 2015-01-16 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 크기 제어 방법 및 장치 |
US10515643B2 (en) | 2011-04-05 | 2019-12-24 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
CN117854514A (zh) * | 2024-03-06 | 2024-04-09 | 深圳市增长点科技有限公司 | 一种音质保真的无线耳机通信解码优化方法及系统 |
CN117854514B (zh) * | 2024-03-06 | 2024-05-31 | 深圳市增长点科技有限公司 | 一种音质保真的无线耳机通信解码优化方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2658676B1 (fr) * | 1990-02-16 | 1992-06-12 | France Etat | Dispositif de quantification a debit de codage numerique variable. |
JP3960932B2 (ja) * | 2002-03-08 | 2007-08-15 | 日本電信電話株式会社 | ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
KR100611412B1 (ko) * | 2002-10-18 | 2006-08-09 | 명지대학교 산학협력단 | 마스킹 효과를 이용한 오디오 워터마크 삽입 및 검출방법 |
-
2007
- 2007-02-02 KR KR1020070011256A patent/KR101471978B1/ko active IP Right Grant
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10515643B2 (en) | 2011-04-05 | 2019-12-24 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
US11024319B2 (en) | 2011-04-05 | 2021-06-01 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
US11074919B2 (en) | 2011-04-05 | 2021-07-27 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
KR101482946B1 (ko) * | 2013-03-21 | 2015-01-16 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 크기 제어 방법 및 장치 |
CN117854514A (zh) * | 2024-03-06 | 2024-04-09 | 深圳市增长点科技有限公司 | 一种音质保真的无线耳机通信解码优化方法及系统 |
CN117854514B (zh) * | 2024-03-06 | 2024-05-31 | 深圳市增长点科技有限公司 | 一种音质保真的无线耳机通信解码优化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR101471978B1 (ko) | 2014-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8306811B2 (en) | Embedding data in audio and detecting embedded data in audio | |
Lie et al. | Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification | |
US6061793A (en) | Method and apparatus for embedding data, including watermarks, in human perceptible sounds | |
KR100898879B1 (ko) | 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템 | |
Dong et al. | Data hiding via phase manipulation of audio signals | |
CA2527011C (en) | Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same | |
US20060227968A1 (en) | Speech watermark system | |
Gopalan et al. | Audio steganography for covert data transmission by imperceptible tone insertion | |
Lie et al. | Robust and high-quality time-domain audio watermarking subject to psychoacoustic masking | |
US20030215013A1 (en) | Audio encoder with adaptive short window grouping | |
JP5027256B2 (ja) | ノイズ信号の符号化及び復号化の装置及び方法 | |
KR20040034698A (ko) | Dsd 신호에 대한 견고한 워터마크 | |
Bibhu et al. | Secret key watermarking in WAV audio file in perceptual domain | |
KR101471978B1 (ko) | 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치 | |
US20060198557A1 (en) | Fragile audio watermark related to a buried data channel | |
Wu et al. | Robust and blind audio watermarking algorithm in dual domain for overcoming synchronization attacks | |
Cao et al. | Bit replacement audio watermarking using stereo signals | |
Wei et al. | Audio watermarking using time-frequency compression expansion | |
KR20080072223A (ko) | 파라메트릭 부/복호화 방법 및 이를 위한 장치 | |
Xu et al. | A robust digital audio watermarking technique | |
Xu et al. | Content-based digital watermarking for compressed audio | |
Wei et al. | Audio watermarking of stereo signals based on echo-hiding method | |
Foo et al. | Audio watermarking based on compression-expansion technique | |
Liang et al. | Robust blind extracting audio watermarking based on quadrature phase shift keying and improved spread spectrum | |
Hu et al. | A perceptually adaptive and retrievable QIM scheme for efficient blind audio watermarking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180313 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181204 Year of fee payment: 5 |