KR102467628B1 - 투명 무손실 오디오 워터마킹 - Google Patents

투명 무손실 오디오 워터마킹 Download PDF

Info

Publication number
KR102467628B1
KR102467628B1 KR1020167030726A KR20167030726A KR102467628B1 KR 102467628 B1 KR102467628 B1 KR 102467628B1 KR 1020167030726 A KR1020167030726 A KR 1020167030726A KR 20167030726 A KR20167030726 A KR 20167030726A KR 102467628 B1 KR102467628 B1 KR 102467628B1
Authority
KR
South Korea
Prior art keywords
signal
audio signal
quantization
data
audio
Prior art date
Application number
KR1020167030726A
Other languages
English (en)
Other versions
KR20160147794A (ko
Inventor
피터 그라함 크레이븐
말콤 로
Original Assignee
엠큐에이 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠큐에이 리미티드 filed Critical 엠큐에이 리미티드
Publication of KR20160147794A publication Critical patent/KR20160147794A/ko
Application granted granted Critical
Publication of KR102467628B1 publication Critical patent/KR102467628B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

인코딩 방법 및 인코더는 오리지날 PCM 오디오 신호를 두 번 양자화하여 투명 무손실 오디오 워터마킹에 제공되며, 각각의 양자화는 양자화 그리드로 양자화된다. PCM 신호는 본질적으로 이미 양자화되어 있으므로, 고려해야 할 세 가지 양자화 그리드가 있으며, 첫번째는 오리지날 PCM 신호의 양자화 그리드이고, 두번째는 워터마킹된 신호의 양자화 그리드이며, 세번째는 중간 신호의 양자화 그리드이다. 이러한 기법은 제공된 양자화 에러의 양을 줄이고, 에러를 스펙트럼적으로 형성시키며, 오리지널 오디오로부터 신호 변경을 무상관화하여 에러를 추가 노이즈와 더욱 유사하게 한다. 또한, 인코딩된 신호를 완전히 디코딩하지 않고 워터마크를 변경하는 방법으로서 디코딩 방법 및 디코더가 제공된다.

Description

투명한 무손실 오디오 워터마킹{TRANSPARENT LOSSLESS AUDIO WATERMARKING}
본 발명은 들을 수 있고 투명한 가역 워터마크 (watermark)를 PCM 오디오 신호로 삽입하는 것에 관한 것으로, 특히 스트림 (stream)된 전송에 관한 것이다.
현재 밀레니엄 시대에서 오디오용 복수의 가역 워터마킹 기법이 제안되었고, 검사를 통해 가역성이 종종 수치 해석일지라도 오리지날 PCM (펄스 코드 조정; Pulse Code Modulation) 신호의 재구성은 예를 들어, 비트-폴-비트 (bit-for-bit) 정확도와 같이 알고리즘 내 불가피한 양자화의 제공에서 손실없는 것이 아니다. 실질적으로 손실 없음으로 간주되는 두개의 알고리즘은 WO 2004066272로 공개된 M. Van Der Veen, A. Bruekers, A. Van Leest 및 S.Cavin이 발명자인 “Reversible Watermarking of Digital Signals” 및 WO 2013061062로 공개된 P.Craven 및 M.Law가 발명자인 “Lossless Buried Data”이다.
WO 2004066272는 오디오의 히스토그램을 조작하여 디지털 신호를 가역 워터마킹하는 방법을 개시하고 있다. 일 방법에 따르며, 시그모이드 (sigmoid) 게인 함수 C는 최소 유효 비트 (least significant bit; 이하, lsb) 위치에서 1 비트 홀을 남기면서 15 비트로 재양자화되는 오리지날 16 비트 PCM 오디오 신호에 적용된다. 바람직한 워터마크 데이터, 오버헤드 및 재구성 (reconstruction) 데이터를 포함하는 데이터를 lsb 홀로 삽입되면, 대응하는 디코더가 워터마킹 프로세서를 변환하고 오리지날 오디오의 정확한 모형으로 회복되게 한다.
시그모이드 게인 함수는 1을 초과하면서 0에 가까운 게인을 가지고, 그 자체로 오디오 신호의 범위를 맵핑한다. 결국, 전체 넓이에 가까운 1 보다 작은 게인을 가져야 한다. C의 게인이 2보다 작은 신호 값의 임의의 범위에서, C가 구별되는 15 비트 값보다 작은 범위에 있는 16 비트 값을 맵핑하기 때문에 재구성 데이터가 필요하다. C의 게인이 1보다 큰 경우에는 요구되는 재구성 데이터의 샘플 당 1 비트보다 작고, 1보다 작은 경우에는 요구되는 재구성 데이터의 1 비트보다 크다. 신호값 오디오의 확률 밀도 함수(Probability Density Function, PDF)가 평편 (flat)하지 않기 때문에 기법은 작용하고, 작은 신호 값 (C의 시그모이드 형태가 1보다 큰 게인을 가지는 경우)은 큰 값 (C는 1 보다 작은 게인을 가짐)이 되는 것이 더욱 일반적이다. 따라서, 평균적으로, 오버헤드 및 워터마크를 위한 lsb 홀 내에서 유효 공간을 남기면서 재구성 데이터 (대게 크게 작음)의 샘플 당 1 비트보다 작은 값이 된다.
이러한 방법은 워터마크 데이터를 대량으로 삽입하는 경우에 효과적인 반면, 투명도 (transparency)는 원하는 경우보다 작은 다수의 상황이 있다. 워터마크 데이터는 신호로 추가되기 때문에, 이것에서의 패턴은 들을 수 있고, 신호의 변경은 귀가 가장 예민한 곳에서 주파수 영역이 크고, 덜 예민한 곳에서 작다. 또한, 이러한 방법은 감소된 워터마크 성능을 위해 교환에서 감소된 노이즈를 제공할 수 있는 가요성을 제공하지 못한다.
WO 2013061062는 신호 강도가 클립되는 경우 복원 데이터를 발생시키는 클립핑 유닛과 선형 게인의 결합으로 시그모이드 게인 함수가 수행되는 방법을 개시하고 있다. 또한, 클립핑 유닛에서 발생되는 복구 데이터의 양을 감소시키기 위해 기법과 결합하여 PDF 신호를 변경하는데 유리하게 사용될 수 있는 무손실 필터링을 분리하는 방법에 대해서도 개시하고 있다. 그럼에도 불구하고, 오디오 신호와 관계없고 바람직하게 스펙트럼 형상인 낮고 일정한 노이즈 플로어의 오디오애호가들의 바램이 WO 2004066272 또는 WO 2013061062의 방법을 이용하여 어떻게 수행될 수 있는 알기 어렵다.
투명하고 유손실의 워커마킹 기법은 94회 AES 베를린 컨벤션 1993 (이후 "Gerzon")에서 발표된 프리프린트 3551, "A High Rate Buried Data Channel for Audio CD"에서의 M.Gerzon과 P.Craven에 의해 설명되었다. 샘플 당 n 이진 비트를 포함하는 워터마크 데이터는 램덤화된 후 노이즈-셰이핑(16-n) 비트 양자기로 차감되는 디서로 사용된다. 이는 오디오의 n lsb를 폐기하는 실용적인 효과를 가지고, 비트의 플레인 교체보다 오디오에 휠씬 적은 악영향으로 워터마크를 램덤화하여 이들을 교체하는 효과를 가진다. 두개의 스테레오 채널의 상호 양자화는 n이 1/2의 홀수배가 되게 하고 더욱 복잡한 양자화 기법으로 설명된다.
오디오 물질의 스트리밍은 현재 매우 인기 있고, 인코딩된 아이템 또는 '트랙 (track)'의 시작을 이해하는 것 없이 디코더가 디코딩을 개시할 수 있어야 하는 기술적 필수 조건을 향상시킨다. 경제적으로 인코딩되는 스트림을 손실 없이 재구성하는 관점에서 이러한 필수 조건은 분명하게 중요한 기술적 장벽을 제공할 것이다.
본 발명의 목적은 WO 2004066272와 비교하여 향상된 투명도 (transparency)를 갖는 무손실 워터마킹 방법을 제공하는 것이고, 상기 공개공보에는 본 발명의 특징이 포함되지 않은 표준 “레거시 (legacy)” PCM 디코딩 장치를 설명하며, 암호화된 스트림의 중간부터 해독하기 시작하는 종래 시스템의 성능을 유지하고 있다. 이는 제공되는 양자화 에러의 양을 감소하고, 에러를 스펙트럼화하여 형성하고, 오리지날 (original) 오디오로부터 신호 변경을 완전히 무상관화 (decorrelating)하여, 따라서 에러를 추가되는 노이즈와 더욱 유사하게 만든다. 또한 주목할 것은 워터마크의 변경이 쉬워진다는 것이다.
더욱 구체적으로, 본 발명에 따른 인코더 (encoder)는 오리지날 PCM 신호를 두번 양자화하고, 각각의 양자화는 양자화 그리드로 양자화한다. PCM 신호가 본래 이미 양자화되어 있기 때문에, 고려해야할 세개의 양자화 그리드가 있으며, 첫번째는 오리지날 PCM 신호의 양자화 그리드이며, 두번째는 워터마킹된 신호의 양자화 그리드이고, 세번째는 중간 신호의 양자화 그리드이다.
일반적으로, 워터마킹된 신호는 오리지날 신호와 동일한 비트-뎁스 (bit-depth)를 갖는 PCM 신호로 전달되지만, 이는 제1 및 제2 양자화 그리드가 동일한 것을 의미하는 것은 아니다. 일반적으로, 신호의 양자화 그리드는 이진수로서 PCM 표현 내에서 가능한 모든 비트의 조합을 해석하여 얻어지는 값의 집합일 수 없다. 본 발명에서는 상기 값의 집합보다 넓은 부분 집합만을 실행하는 것으로 제한된 일부 신호를 고려한다. 반대로, 본 발명은 양자화 단계 크기의 정수 배수가 아닌 양으로 설정함으로써 상기 값으로부터 오프셋 (offset)된 값을 갖는 신호도 고려한다. 오프셋은 신호의 발신기와 수신기가 오프셋의 정보를 동기화 (synchronise)하도록 제공하는 한 샘플마다 변할 수 있고, 예를 들어 오프셋이 모두에 공통의 데이터 또는 모두에 알려진 의사랜덤 시퀀스 발생기 (pseudorandom sequence generator)로부터 발생되는 경우이다.
이러한 고려는 단일 채널 신호 및 다중 채널 신호에 모두 적용되고, 이러한 샘플 값은 다차원 그리드의 그리드 포인트 상에 놓여있는 다차원 벡터이다. 백터 경우에서 추가로 흥미로운 점은 n-차원의 그리드가 간단한 직사각형, 입방형 또는 하이퍼큐브의 그리드일 수 있고, 다시 말해 n 차원 그리드의 데카르트 곱이거나, 예를 들어 n 채널의 최소 유효 비트의 배타적 논리합이 0인 제한으로 나타나는 더욱 일반적인 것일 수 있다. PCM 채널은 고유의 양자화 그리드를 갖는 컨테이너로서 여겨질 수 있고, 채널을 통해 전달된 PCM 신호의 양자화 그리드가 넓어질 수 있다. 따라서, PCM 신호의 양자화 그리드는 이의 비트-뎁스의 정보로부터 간단히 추론될 수 없다.
양자화는 일반적으로 정보를 폐기하는 과정으로 생각될 수 있으나, 이미 양자화된 신호가 오리지날 양자화된 그리드보다 넓지 않은 양자화 그리드로 재-양자화 (re-quantise)되는 경우에는 양자화가 필요하지 않다. 본 발명에서 '양자화 (quantisation)'는 정보가 소실되거나 소실되지 않은 둘 중 하나의 경우에서, 신호 값을 양자화 그리드 상의 근처 값으로 맵핑 (mapping)하는 것을 나타낸다.
'노이즈 (noise)'또는 '신호 대 잡음비 (signal-to-noise ratio)'를 나타낼 때, 워터마킹된 신호가 표준 PCM 장치에서 재생되는 경우에서 들리는 노이즈를 고려한다. 물론, 본 발명에 따르면 워터마킹된 신호가 손실없이 해독되면, 워터마킹으로부터 추가적인 노이즈는 없다.
제1 양태에서의 본 발명은 오리지날 또는 '제1' 오디오 신호를 무손실 워터마킹하여 워터마킹된 '제2' 오디오 신호를 발생하는 방법을 제공하고, 신호 모두는 펄스 코드 조정된 (modulated) 'PCM' 신호이고, 각각은 개개의 '제1' 또는 '제2' 양자화 그리드로 양자화된다. 이러한 방법은 하기 단계를 포함한다:
제1 양자화 그리드 상에서 양자화된 샘플로서 제1 오디오 신호를 수신하는 단계;
제1 양자화 그리드보다 넓은 제3 양자화 그리드를 결정하는 단계;
제1 오디오 신호에 양자화된 맵핑 (mapping)을 적용하여 제3 양자화 그리드 상에 있는 샘플 값을 갖는 제3 오디오 신호를 제공하는 단계;
제1 양자화 그리드의 다중 값이 양자화된 맵핑에 의해 제3 오디오 신호의 값으로 맵핑되는 경우 제1 데이터를 발생시키고, 여기서 제1 데이터는 다중 값 중 임의의 것이 상기 제1 오디오 신호의 값을 나타내는 재구성 데이터이고,
제1 데이터를 워터마크 데이터와 결합시켜 제2 데이터를 제공하는 단계;
제2 데이터에 따라 제1 및 제3 양자화 그리드와 다른 제2 양자화 그리드를 결정하는 단계; 및
제2 오디오 신호의 이전 샘플에 따라 제2 양자화 그리드로 상기 제3 오디오 신호를 양자화하여 상기 제2 오디오 신호의 샘플을 발생시키는 단계.
이들의 가장 기초적인 형태에서, '수신 (receiving)', '결정 (determining)', '적용 (applying)' 및 '발생 (generating)'의 첫번째 4 단계는 WO 2004166272에 기재된 종래 과정의 연산과 유사하다. 상기 '양자화된 맵핑 (quantised mapping)'은 제1 보다 일반적으로 넓은 제3 양자화 그리드에 오리지날 신호를 '제3' 신호로 양자화하고, 결과적으로 신호 해상도(resolution)의 손실을 가져오며, 제1 신호의 다음의 무손실 회복 (recovery)은 추가적인 재구성 (reconstruction) 데이터가 필요하다. 이러한 재구성 데이터는 양자화된 맵핑을 적용하는 과정에서 발생되는 '제1' 데이터이다.
제2 오디오 신호는 PCM 신호로 나타나지만, 전술한 바와 같이 PCM 신호는 이것을 포함하는 PCM 채널의 양자화 그리드보다 넓은 양자화 그리드를 가질 수 있다. 제2 양자화 그리드가 고정되는 경우 이는 채널과 관련된 양자화 그리드의 일부 포이트는 실행되지 않는다. 이는 제3 신호를 변하는 제2 양자화 그리드로 양자화하는 기회를 제공하고, 본 발명에 따르면 제2 양자화 그리드는 '제2' 데이터에 따라 결정되며, 이는 전술한 워터마크와 '제1' 재구성 데이터 모두를 포함한다. 이러한 방법에서, 제2 데이터는 워터마킹된 신호 내에서 '매립 (buried)'되고, 다음의 디코더는 채널 양자화 그리드의 어느 포인트가 실행되는지를 검사하여 매립된 데이터를 복구할 수 있다.
양자화된 맵핑은 유닛 (unit)의 대-신호 게인 (large-signal gain)을 가지는 경우, 매립될 수 있는 '제2' 데이터의 최대량을 가지며, 따라서 '제1' 재구성 데이터의 양과 동일한 양이 복구되고, 워터마크를 전달할 기회를 없어진다. 그러나, 일반적인 연산에서 양자화된 맵핑은 가장 일반적으로 발생되는 신호 값을 포함하는 신호 범위 이상의 구성 (unity)보다 큰 게인을 공급하는 것으로 이해된다. 이는 필요한 재구성 데이터의 양이 감소하며, 따라서 제2 데이터를 원하는 워터마크 데이터와 임의의 필요한 시스템 오버헤드로 이동하게 한다.
따라서, 양자화된 맵핑은 일반적으로 선형이 아니다. WO 2004066272에서 기술한 바와 같이, 시그모이드 형상을 가질 수 있다. 또는 WO 2013061062에서 기술한 바와 같이, 신호 범위의 중간 부분 이상의 구성보다 큰 게인을 선형일 수 있으나, 신호 범위의 말단 (extremes) 근처에서의 오버헤드를 회피하기 위한 특별한 공급을 갖는다.
제1 오디오 신호가 제1 맵핑의 게인이 구성보다 적은 값을 가지는 경우 재구성 데이터는 매장될 수 있는 제2 데이터의 최대보다 일시적으로 클 수 있다. 초과 데이터는 재구성 데이터를 버퍼링 (buffering)하여 수용될 수 있다. 버퍼링은 지연을 발생시키기 때문에, 간단한 버퍼링을 가지면서 디코더가 스트림을 판독하고 디코딩을 나중에 시작하는 것이 필요할 수 있으며; 또는 인코더는 제3 신호에서 지연을 삽입할 수 있어 디코더는 버퍼된 재구성 데이터를 정확한 시간에 수신할 수 있다.
제3 그리드에서 제2 그리드까지의 양자화는 스펙트럼 형성을 제공하고 나타나는 양자화 노이즈의 지각적 중요성 (perceptual significance)을 감소시키기 위해 제2 및 제3 오디오 신호의 적어도 하나의 이전 샘플에 따라 수행된다. 이러한 기술은 다른 상황에서 널리 사용되지만, 무손실 재구성이 스트림된 오디오의 상황에서 요구될 수 있는 경우 이전 샘플의 의존성 (dependency)이 스트림을 통과한 중간에서 재구성을 시작하는 것이 불가능하거나 어렵기 때문에 이것을 사용하는 것은 불명확할 수 있다.
일부 시스템의 실시예에서, 상기 의존성은 제3 오디오 신호 및 제2 오디오 신호의 이전 샘플의 한정수 n 상에 있다. 디코더는 제2 오디오 신호를 직접적으로 수신하고, 따라서 제2 오디오 신호의 이전 샘플에 대한 의존성이 n 샘플 주기 동안 대기하는 것만으로 해결된다. 이는 제3 오디오 신호에 대한 경우는 아니며, 따라서 바람직한 실시예에서 인코더는 n 연속된 샘플을 포함하는 제3 오디오 신호의 일부와 관련된 초기화 (initialisation) 데이터를 제2 데이터 내에서 포함하는 것에 의해 '재시작 포인트 (restart point)'로부터 디코딩을 지원한다.
재시작 보조 데이터는 제3 오디오 신호의 n 이전 샘플의 이진 표현 (binary representation)을 포함할 수 있으나, 16 비트의 오디오 해상도를 제공하는 시스템에서는 디코딩이 시작되는 경우 스트림에서의 각각의 장소에서 각각의 오디오 채널에 대한 적어도 n×16 비트 '재시작 보조 데이터 (restart assistance data)'를 필요로 한다. 이러한 필요 조건은 적절한 노이즈 셰이핑 (noise shaping) 필터를 가정하면서 엄격한 접합 (strict bound)이 제3 오디오 신호와 제2 오디오 신호의 사이의 차이에 위치하게 하여 매우 크게 감소시킬 수 있다. 따라서, 제2 오디오 신호의 샘플의 정도가 주어지면 제3 오디오 신호의 해당하는 샘플은 이의 비트의 선택을 한정하면서 정보로부터 완전히 재구성될 수 있다.
그러므로, 더욱 바람직한 실시에서 인코더는 제3 오디오 신호의 비트 선택에만 관련된 초기화 데이터를 제공하고, 상기 선택은 예를 들어 8비트보다 낮은 것을 갖는다. 특별한 재시작 포인트와 관련된 제3 오디오 신호의 총 비트 수는 8×채널 수×부분에서의 n 수의 연속적인 샘플×채널수를 초과하지 않는다.
제1 및 제3 양자화 그리드 중 적어도 하나는 샘플에 따라 변하는 것이 바람직하다. 이러한 경우가 아닌 경우에는, 이들 두개의 그리드는 고정된 관계이고, 제3으로 양자화된 맵핑은 양자화 아티펙트 (artefact)를 회피하기 위해 디서 (dither)를 결합하는 것이 필요하지만, 디서는 노이즈 페널티 (penalty)를 발생시킨다.
바람직한 실시예에서, 양자화된 맵핑에 의해 제공되는 양자화 에러가 제1 오디오 신호로부터 무상관화되는 것을 보증하기 위해 제3 양자화 그리드는 의사랜덤 시퀀스 발생기의 출력 (output)에 따라 변화된다.
바람직한 실시예에서, 제1 오디오 신호는 멀티채널이고, 제2 및 제3 양자화 그리드 중 적어도 하나는 각각의 채널 상의 독립된 양자화 그리드의 데카르트 곱으로 형성되는 것은 아니다. 알려진 양자화 방법을 사용하면, 신호 재양자화에서 추가 노이즈는 채널의 독립된 양자화와 비교하여 감소될 수 있다.
본 발명은 대-신호 거동 (large-signal behavior)이 오리지날과 근접하게 일치하는 워터마킹된 신호를 제공할 뿐 아니라, 신호 변경 (modification)을 허용하고, 특히 주파수 응답 (frequency response)을 조절하기 위한 필터링이 허용된다. 무손실 필터는 예를 들어 WO 96/37048의 종래 기술에 알려져 있지만, 처리된 신호와 동일한 비트 뎁스로 양자화하는 것이 필요하고, '레거시' 장치에서 재생되는 경우 노이즈 증가는 불가피하다. 본 발명은 노이즈 증가를 최소화하기 위해, 사용되는 미세 양자화를 이용한 필터를 허용한다.
따라서, 일부 실시예에서, 양자화된 맵핑은 출력이 제1 양자화 그리드보다 더욱 미세 (finer)하게 양자화되는 필터에 의해 선행된다. 바람직한 실시예에서, 필터는 조절값 (adjustment value)을 순방향 신호 (forward signal) 경로에 부가하는 사이드-체인 (side-chain)으로 설정되고, 여기서 조절값은 필터의 입력과 출력의 이전 샘플의 선형 또는 비선형 결정 함수 (deterministic function)이다. 이러한 추가는 조절값이 순방향 신호 경로보다 더욱 미세할지라도 손실없이 변환될 수 있다. 미세 양자화는 필터링으로부터의 추가적인 노이즈를 줄인다.
제2 양태에서 본 발명은 제2 오디오 신호의 일부로부터 제1 오디오 신호 및 워터마크 데이터를 복구 (retrieve)하는 방법을 제공하고, 여기서 제1 및 제2 오디오 신호는 펄스 코드 (pulse code) 조정된 'PCM'신호이며, 제2 오디오 신호는 무손실 워터마킹된 PCM 신호이고, 제1 오디오 신호는 제1 양자화 그리드 상에 놓여있는 샘플을 가지며, 이러한 방법은 하기를 포함한다:
제3 양자화 그리드를 결정하는 단계;
양자화된 샘플로서 제2 오디오 신호를 수신하는 단계;
제2 오디오 신호로부터 제1 데이터 및 워터마크 데이터를 복구하고, 제1 데이터는 제1 오디오 신호를 복구하는데 사용되는 재구성 데이터이고;
제3 양자화 그리드로 양자화시켜 제3 오디오 신호의 샘플을 발생시키고, 이는 상제2 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 제2 오디오 신호의 샘플을 양자화시켜 수행되는 단계;
제1 데이터에 따라 제3 오디오 신호로 양자화된 맵핑을 적용하여 맵핑된 신호를 제공하는 단계; 및
맵핑된 신호에 따라 제1 오디오 신호를 제공하는 단계.
일반적으로, 제1 오디오 신호는 인코더로 제공되는 오리지날 PCM 오디오 신호의 일부를 손실없이 복제 (replicate)하고, 제2 오디오 신호는 오리지날 PCM 오디오 신호의 워터마킹된 버전이다. 신호는 양자화된 샘플이고, 제1 오디오 신호는 제1 양자화 그리드 상에 놓여있는 샘플을 갖는다. 제3 양자화 그리드는 일반적으로 제1 보다 넓게 선택되고, 제3 신호가 워터마크와 무관하게 하는 것이 일반적으로 필요한 특징이며, 따라서 제3 신호는 오직 제1 신호로부터 오디오 정보를 이송한다. 넓은 해상도는 오리지날 오디오 정보의 일부가 손실된 것을 나타내지만, 이러한 정보는 제1 데이터 내에서 이동하고, 이는 '재구성 데이터'로 알려져 있다. 양자화된 맵핑을 작용하는 단계에서, 제1 데이터 내의 재구성 정보는 더욱 넓게 양자화된 제3 신호와 결합되고, 따라서 맵핑된 신호는 전체 해상도를 갖는다.
분명하게, 맵핑된 신호는 제1 신호와 동일하고, '제공' 단계는 중요하지 않은 연산이다. 그러나, 일부 실시예에서, 제공은 하기에서 설명하는 바와 같이 조절 샘플의 추가와 같은 추가 기능을 포함할 수 있다.
제1 및 제3 양자화 그리드 중 적어도 하나는 샘플에 따라 변하는 것이 바람직하다. 이러한 경우가 아니면, 두개의 그리드는 고정된 관계에 있을 수 있고, 해당하는 인코더에서의 해당하는 두개의 그리드는 디코딩 방법이 무손실인 경우 고정된 관계인 것이 필요하다. 결과적으로, 해당하는 인코더에서의 양자화된 맵핑은 양자화 아티펙트를 회피하기 위해 디서를 포함하는 것이 필요하지만, 디서는 워터마킹된 신호가 표준 PCM 장치에서 재생 (reproduce)되는 경우 노이즈 퍼널티를 발생시킨다.
바람직한 실시예에서, 제3 양자화 그리드는 의사램던 시퀀스 발생기의 출력에 따라 결정된다. 전술한 바와 유사하게, 이러한 필요 조건은 해당하는 인코더에서 양자화된 맵핑에 의해 제공되는 양자화 에러가 제1 오디오 신호로부터 무상관화 되는 것을 보증하기 위해 필요하다.
바람직한 실시예에서, 제1, 제2 및 제3 오디오 신호는 다중채널이고, 제2 및 제3 양자화 그리드 중 적어도 하나는 각각의 채널 상의 독립된 양자화 그리드의 데카르트 곱으로 형성되지 않는다. 또한, 전술한 바와 유사한 이유로, 알려진 양자화방법을 사용하면, 해당하는 인코더에서의 신호 재양자화로부터 추가 노이즈가 채널의 독립된 양자화와 비교하여 감소될 수 있다.
일부 실시예에서, 제1 신호는 양자화된 맵핑으로 직접적으로 제공되고, 따라서 제1 신호는 맵핑된 신호와 동일하다. 그러나, 변경된 제1 신호로부터 얻어지는 워터마킹된 신호로부터 무손실 재구성을 제공하기 위해, 방법은 하기의 단계를 추가로 포함할 수 있다:
제1 양자화 그리드보다 미세한 제4 양자화 그리드를 결정하는 단계;
제1 오디오 신호 및 상기 맵핑된 신호 중 적어도 하나의 이전 샘플에 따라 조절 샘플 (adjustment sample)을 계산하고, 조절 샘플은 상기 제4 양자화 그리드 상에 놓여있는 값을 가지며; 및
맵핑된 신호에 조절을 추가하는 단계.
이러한 실시예는 제1 신호에서의 해당하는 조절을 차감하는 인코더를 사용하여 워터마킹된 신호가 인코팅되게 사용할 수 있고, 이에 의해 필터의 기능을 제공한다. 전술한 바와 같이, 이는 플레인 PCM 신호로 해석되는 경우 워터마킹된 신호가 오리지날 '제1' 신호에서의 서로 다른 주파수 응답을 가지게 하고, 주파수 응답 변경이 분리된 무손실 필터를 사용하여 수행되는 경우보다 적은 노이즈를 가지게 한다. 무손실 디코딩 방법을 위해, 조절값은 양자화된 맵핑으로 전달되는 것이 필요하고, 이를 하기에서 설명한다.
바람직한 실시예에서, 제2 양태의 디코딩 방법은 추가적인 단계를 포함한다:
제2 오디오 신호로부터 초기화 데이터를 복구하는 단계; 및
초기화 데이터를 이용하여 제3 오디오 신호의 연속적인 샘플로부터 비트의 선택을 결정하는 단계.
이러한 특징은 시작에서보다 '재시작 포인트'에서의 스트림 디코딩과 관련된다. 전술한 바와 같이, 각각의 연속적인 샘플 내에서의 비트의 선택이 결정되면, 제3 오디오 신호의 연속적인 샘플은 완전하게 재구성될 수 있다. 제2 오디오 신호의 샘플은 직접적으로 수신되기 때문에, 이는 충분한 초기화 데이터를 제공하여 노이즈-셰이핑 또는 디코더에서의 다른 필터가 인코더에서의 해당하는 필터의 연산을 간단하게 모방하게 하고, 설명한 바와 같이 이는 디코더가 그 시간 이후부터 제3 오디오 신호를 결정하는데 충분한 것이다.
바람직하게, 시스템은 제3 오디오 신호를 결정하기 위한 목적으로 수신되는 초기화 데이터가 8 비트×채널수×제3 오디오 신호 값의 수보다 크지 않도록 설정된다. 이는 스트림 오버헤드를 최소화하고, 전술한 바와 같이 적절한 노이즈 셰이핑 필터를 이용하고, 제3 오디오 신호와 제2 오디오 신호 사이의 차이에서 엄격한 접합을 결정하는 것에 의해 촉진된다.
제3 양태에서의 본 발명은 제1 양태의 방법에 따라 발생되는 무손실 워터마킹된 PCM 신호인 제2 오디오 신호에서의 워터마크를 변경하는 방법을 제공한다. 변경은 오리지날 신호를 완전히 회복하고 재-인코딩 없이 이루어지며, 이는 계산적으로 비용이 많이 든다.
제3 양태에서 상기 방법은 하기 단계를 포함한다:
양자화된 샘플로서 제2 오디오 신호를 수신하는 단계;
제2 오디오 신호로부터 삽입된 워터마크 데이터를 포함하는 제2 신호를 복구하는 단계;
제2 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 제2 오디오 신호를 양자화하여 제3 양자화 그리드로 양자화된 제3 오디오 신호의 샘플을 발생시키는 단계;
제2 데이터에서의 삽입된 워터마크 데이터를 변경하여 제4 데이터를 생산하는 단계;
제4 데이터에 따라 제4 양자화 그리드를 결정하는 단계; 및
제4 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 제4 양자화 그리드에 제4 오디오 신호로 상기 제3 오디오 신호를 양자화하는 단계.
이러한 제3 양태의 방법은 실질적으로 제2 양태의 첫번째 단계와 제1 양태의 마지막 몇 단계에 해당하는 것으로 여겨질 수 있다.
제1 및 제2 양태의 바람직한 실시예와 호환되기 위해, 제3 양자화 그리드는 하나의 샘플링 시점에서 또 다른 샘플링 시점까지 변화는 것이 바람직하다. 유사하게, 제3 양자화 그리드는 의사-램던 시퀀스 발생기의 출력에 따라 결정되게 선택된다.
적용에서, 제2, 제3 및 제4 오디오 신호가 다중채널인 경우 제2, 제3 또는 제4 양자화 그리드 중 적어도 하나가 각각의 채널에서의 독립된 양자화 그리드의 데카르트 곱으로 형성되지 않는 것이 바람직하다. 이는 유사한 바람직한 특성을 갖는 인코더 및 디코더와 호환되기 위함이다.
제4 양태에서, 본 발명은 제1 양태의 방법을 이용하여 무손실 워터마크 PCM 오디오 신호에 적용된 인코더를 제공한다. 또한, 제3 양태의 방법을 이용하여 워터마크를 변경하도록 적용된 워터마크 변경자 (modifier)를 제공한다.
제5 양태에서, 본 발명은 제2 양태의 방법을 이용하여 무손실 워터마킹된 PCM 신호의 일부로부터 PCM 오디오 신호 및 워터마크 데이터를 복구하도록 적용된 디코더를 제공한다.
제6 양태에서, 본 발명은 제5 양태에 따른 디코더와 결합하여 제4 양태에 따른 인코더를 포함하는 코덱을 제공한다.
제7 양태에서, 본 발명은 제1 양태의 방법을 이용하여 무손실 워터마킹된 PCM 오디오 신호를 포함하는 데이터 캐리어 (carrier)를 제공한다.
제8 양태에서, 컴퓨터 프로그램 제품은 신호 프로세서 (processor)에 의해 실행되는 경우 제1 내지 제3 양태 중 어느 하나의 방법으로 수행되게 상기 신호 프로세서를 야기하는 명령 (instructions)을 포함한다.
제3 양태에 따른 방법은 제1 양태의 방법에 따라 발생되는 무손실 워터마킹된 PCM 오디오를 변경하는데 사용되기에 유리할 수 있고, 임의의 적절한 무손실-워터마킹된 PCM 오디오를 변경하기 위해 독립된 유틸리티 (utility)를 사용할 수도 있다. 또한, 변경은 오리지날 신호의 완전한 회복 및 재-인코딩 없이 수행될 수 있고, 이는 계산적으로 비용이 많이 들 수 있다.
따라서, 제9 양태에서 본 발명은 무손실 워터마킹된 PCM 신호인 입력 오디오 신호에서 워터마크를 변경하는 방법을 제공하고, 상기 방법은 하기의 단계를 포함한다:
양자화된 샘플로서 입력 오디오 신호를 수신하는 단계;
입력 오디오 신호로부터 삽입된 워터마크 데이터를 포함하는 입력 데이터를 복구하는 단계;
입력 오디오 및 중간 오디오 신호 중 적어도 하나의 이전 샘플에 따라 입력 오디오 신호를 양자화하여 중간 양자화 그리드로 양자화된 중간 오디오 신호의 샘플을 발생시키는 단계;
입력 데이터에서 삽입된 워터마크 데이터를 변경하여 출력 데이터를 생산하는 단계;
출력 데이터에 따라 출력 양자화 그리드를 결정하는 단계; 및
출력 및 중간 오디오 신호 중 적어도 하나의 이전 샘플에 따라 출력 양자화 그리드에서 출력 오디오 신호로 중간 오디오 신호를 양자화하는 단계.
일부 실시예에서, 중간 양자화 그리드는 하나의 샘플링 시점에서 다른 샘플링 시점까지 변한다.
일부 실시예에서, 중간 양자화 그리드는 의사랜덤 시퀀스 발생기의 출력에 따라 결정된다.
추가적인 양태에서, 본 발명은 제9 양태의 방법을 이용하여 워터마크를 변경하는데 적용되는 워터마크 변경자를 제공하고, 신호 프로세서에 의해 실행되는 경우 제9 양태의 방법으로 상기 신호 프로세서가 수행되도록 야기하는 명령을 포함하는 컴퓨터 프로그램 제품을 제공한다.
이해된 바와 같이, 본 발명은 워터마크로 PCM 오디오 신호를 손실없이 인코딩 및 디코딩하고, 무손실 워터마킹된 PCM 신호에서 워터마크를 변경하는 다양한 방법 및 장치를 제공한다. 추가적인 변경과 조작은 본 명세서의 관점에서 당업자에게 자명하다.
본 발명의 실시예는 첨부되는 도면을 참고하여 더욱 상세히 설명될 수 있다.
도 1a는 본 발명의 일 실시예에 따른 인코더의 신호-흐름 다이어그램이다.
도 1a는 도 1a의 인코더에 해당하는 디코더의 신호-흐름 다이어그램이다.
도 2는 두개의 채널 신호를 가지면서 사용하는데 있어서 도 1b에서의 양자기 (112)의 연산을 상세히 나타낸 것이다.
도 3은 두개의 채널 신호를 가지면서 사용하는데 있어서 도 1a에서의 양자기 (112)의 연산을 상세히 나타낸 것이다.
도 4는 두개의 채널 신호를 가지면서 사용하는데 있어서 도 1b에서의 양자기 (212)의 연산을 상세히 나타낸 것이다.
도 5a는 두개의 채널 신호를 가지면서 사용하는데 적용되는 경우에 있어서 도 1a에서의 양자기 (111)의 베로니 영역의 그래프를 나타낸 것이고, 도 5b는 베로니 영역의 확대된 그래프를 나타낸 것이다.
도 6은 각각의 두개의 재시작 포인터 전에 인코딩된 두개의 시작 포인트 및 재시작 보조 데이터를 나타내는, 본 발명에 따라 워터마킹된 PCM 오디오의 스트림을 나타낸 것이다.
도 7은 재시작 포인트 후 즉시 사용하기 위한 도 1B에서 나타낸 디코더의 일부에 대한 대체 형태를 나타낸 것이다.
도 8a는 PCM 오디오 신호를 이전 샘플 값의 더욱 미세하게 양자화된 함수를 신호에 변경하는 방법을 나타낸 것이다.
도 8b는 도 1b에 나타낸 디코더의 마지막 단계가 도 8a의 신호 변경이 무손실로 변환되게 하기 위해 변경될 수 있는 방법을 나타낸 것이다.
도 9는 도 8a에서 나타낸 무손실 복원을 초기화하는데 필요한 재시작 정보의 오리지날 신호 보류 인수(signal pending receipt)의 무손실 복구를 제공하기 위해 도 8b에 나타낸 디코더 부분이 일시적으로 변경되는 방법을 나타낸 것이다.
도 10은 본 발명에 따른 워터마킹된 스트림으로부터 워터마크 데이트가 추출될 수 있는 방법 및 오디오 신호의 완전한 디코딩 및 리코딩 없이 스트림이 대체 워터마킹 데이터로 워터마크되는 방법을 나타낸 것이다.
"차감되는 디서 (substractive dither)"로 알려진 공정에서, 랜덤 편차 (random deviate)는 신호에 추가되고, 결과값은 양자화된 후 동일 편차 (same deviate)가 다시 차감된다. 94회 AES 베를린 컨벤션 1993 (이후 "Gerzon")에서 발표된 프리프린트 3551, "A High Rate Buried Data Channel for Audio CD"에서의 M.Gerzon과 P.Craven에 의해 논의된 바와 같이, 차감되는 디서는 양자화된 신호를 노이즈와 같고 신호 양자화와 무관하게 함으로써 양자화의 투명도 (transparency)를 증가시키는 것으로 알려져 있다.
Gerzon이 지적한 바와 같이, 실질적인 차감되는 디서는 랜덤 편차가 연속적 분포로부터 도출되게 하는 것이 필요하다. 본 발명의 실시예에서, 승수로 입력하는데 사용되는 차감되는 디서된 신호의 단어 길이 (word width)를 조절하기 위해 편차가 한정된 수의 비트를 가지게 하는 것이 필요하다. 8비트의 랜덤 편차는 본 발명의 목적에 적합하고, 32 비트 워드에서의 16 비트 오디오에 대한 많은 공간을 허용하는 동안, 임의의 양자화 아티펙트는 16 비트 레벨 주위에서 24 비트 레벨 주위까지 아래로 움직인다.
일반적으로, 래티스 양자기 (lattice quantiser)는 차감 전에 양자화된 값이 양자화 래티스 상에 존재하도록 하기 위해 사용된다. 양자화 전에 차감하고 이후에 추가하는 것도 가능하다. 이러한 경우 결과값은 양자화 래티스와 랜덤 편차에 의해 주어진 오프셋 (offset)의 합계 상에 존재한다. 전체 연산이 랜덤화된 그리드로 양자화되는 것 중 하나인 것은 차감되는 디서에 대한 대체 관점 (alternative perspective)을 제공한다.
"양자화 오프셋 (quantisation offset)"은 양자화를 한정하는 래티스로부터 그리드의 오프셋을 나타내는데 사용될 수 있다. 오디오 신호의 모든 샘플로부터 변하는 양자화 오프셋을 고려하고, 양자화 오프셋은 일반적으로 의사랜덤 시퀀스 발생기에 의해 발생되지만, 일부 변경을 가지며, 다른 수단에 의해 발생된다.
또한, "양자화 그리드 (quantisation grid)"는 양자기가 출력할 수 있는 포인트의 집합을 의미하는 것으로 사용될 수 있고, 이는 양자화 래티스와 오프셋의 조합이다. 양자화 오프셋은 샘플에 따라 변하는 경우 양자화 그리드일 것이다.
의사랜덤 수 발생기를 사용하는 경우 인코더와 디코더 사이에서 일치 (match)하는 출력이 필요하다. 이는 워터마크와 함께 이동되게 하는 오버헤드에서의 샘플 수 데이터를 포함하여 행해질 수 있다. 디코더가 트랙을 통과하는 도중에 연산이 시작되는 경우 이러한 샘플 수 데이터는 의사랜덤 시퀀스에서의 정확한 위치를 탐색하게 하는데 사용할 수 있고, 따라서 의사랜덤 수 발생기의 다음 출력은 인코더에서 사용되는 것과 일치한다.
본 발명은 16 비트 PCM 오디오의 2 채널을 처리하는 실시예를 참고하여 설명할 것이다. 수 16에 대한 특별한 것은 없으며, 당업자는 다른 비트 뎁스 또는 양자화 기법을 본 명세서에 적용하는데 어떤 어려움은 없을 것이다. Gerzo에 익숙한 사람은 하나 또는 복수의 채널로 발생시키는데 어려움이 없을 것이다.
워터마컬 (watermarker)로의 입력은 CD와 같은 소스로부터 유래할 수 있고, 각각의 채널에서의 CD 샘플은 2-16의 모든 정수 배수로 이루어진 래티스 {2-16k}, k∈Z에서 양자화된다. 그러나, 차감되는 디서 공정에 의해 발생될 수도 있고, 워터마컬로 알려지고 워터마크 복원기 (restorer) 또는 디코더로 프로그램되는 의사랜덤 양자화 오프셋을 가질 가능성은 있다. 따라서 워터마컬로의 입력과 "제1 양자화 오프셋" 갖는 다음의 복원기로부터의 출력에 대해 설명한다. CD 경우 이는 모든 샘플에 대해 0일 수 있고, 오디오가 차감되는 디서 공정에 의해 제공되는 경우 동의된 의사랜덤 시퀀스에 의해 제공될 수 있다.
본 발명의 워터마컬은 g-1 (여기서 g<1)의 게인을 오디오에 적용하는 WO 2013061062에 따르고, 최종 오디오를 소프트 클립핑 (clipping)하여 임의의 그에 따른 오버로드 (overload)로 처리한다(클립 유닛(133)과 역연산 (inverse operation), 언클립 유닛 (233)을 사용). 게인과 클립핑의 조합은 WO 2004066272의 시그모이드 게인 함수에 해당한다.
본 발명을 도 1a 및 1b를 참고하여 설명한다. 이채널 16 비트 PCM 오디오 신호는 샘플을 포함하고, 샘플 각각은 2차원 벡터이고 2차원 백터의 컴포넌트는 16 비트로 양자화되는 것으로 간주한다. 도 1a에서, 양자화 오프셋 (O1)을 갖는 래티스로 양자화되는 신호 (101)는 인코더로 제공된다. PCM 신호의 샘플 값은 게인 g (여기서 g<1)에 의해 나눠지고(131), 그 후 넓은 양자화 래티스로 양자화되어(111) 중간 신호 (103)를 발생시킨다. 이러한 넓은 그리드는 모든 채널에서 15.5 비트 레벨로 양자화되고, 여기서 양자화 래티스는 {[2-16,2-16],[2-16,-2-16]}으로 정의되고, 의사랜덤 오프셋 (O3)을 갖는다. 따라서, 양자화 그리드는 [2-16(j+k),2-16(j-k)]+O3, 여기서 j, k∈Z이다.
여기서는 클립 유닛 (133)이 신호를 변경하지 않는 것으로 가정하면 (많은 범위에서 사실임), 신호 (104)는 신호 (103)의 복제이다. 신호 (104)는 동일한 15.5 비트 래티스로 다시 양자화 (102)된 후 데이터 (143, 워터마커를 포함)에 따라 선택되는 오프셋을 가지면서, 출력 신호 (102)로 데이터 (143) 삽입의 효과를 갖는 출력 신호 (102)를 발생시킨다. 오프셋은 0을 삽입하여 [0,0]이고, 1을 삽입하여 [0,2-16]이고, 따라서 데이터 (143)는 Gerzo에서 설명한 유사한 방법으로 두개 채널의 lsb의 패리티 (parity)를 포함한다.
도 1b에 나타낸 바와 같이, 대응되는 디코더는 인코더에서의 오디오 출력 (102)의 복제 (202)를 수신한다. 143의 복제인 데이터 (243)는 양자화 오프셋 (O2) 중 샘플값 검사에 사용되는 것을 결정하여 복구 (recover)된다. 신호 (202)는 15.5 비트 래티스로 양자화 (212)된 다음 양자화 오프셋 (O3)를 가지며 이는 양자기 (212)에 의해 제공되는 양자화 에러가 양자기 (112)에 의해 제공되는 것과 반대이고, 따라서 신호 (204)는 신호 (104)를 복제한다. 언클립 유닛 (233)은 클립 유닛(133)으로 바뀌고, 신호 (203)은 신호 (103)을 복제한다. 이러한 신호는 g (231)로 곱해진 후 양자화 오프셋 (O1)을 갖는 16 비트 래티스로 양자화 (211)된다. 양자기 (211)는 입력과 가장 근접한 양자화된 값을 항상 출력하지는 않으며, 도 2를 참고하여 하기에서 설명한다. 각각의 채널에서 출력이 ±2-16로 조절될 수 있는 재구성(reconstruction) 데이터를 가지며, 무손실 연산을 설정하는 신호 (101)에서 값을 복제하도록 배열된다.
또한 필터 (121, 221, 122, 222)는 배열되어 디코더 버전은 인코더에서 그것들을 복제하는 입력 신호들을 수신하고, 결과적으로 스타트업 (startup)에서 적절하게 초기화되며, 이들의 출력은 일치된다. 이러한 효과는 양자기에 의해 제공되는 양자화 에러를 셰이핑하게 하고, 따라서 워터마킹된 신호 (102)에서 전체 양자화 에러는 감소된 가청도 (audibility)를 위해 스펙트럼 형상이 되고, 워터마크의 투명도는 증가된다. 이들은 Gerzon의 도 7에 나타난 바와 같이 모든 폴 전달 함수 (all-pole transfer function)를 갖는 화이트 양자기 노이즈 (white quantiser noise)를 셰이핑한다. 44.1 kHz에서의 연산을 위한 타당한 필터 (G(z))는 하기와 같다:
G(z) = 1 + 1.2097z-1 + 0.2578z-2 + 0.1742z-3 + 0.0192z-4 - 0.2392z-5
이후의 참고를 위해, 1/G(z)의 임펄스 응답의 절대값의 총합은 27보다 작다.
15.5 비트 양자화는 인코더 입력 신호의 16 비트 양자화보다 넓다 (coarser). 결과적으로 g<1이지만, 103과 동일한 값으로 양자화되는 111로 다중 입력 값이 존재한다. 이러한 경우가 발생되면 모호성 리졸버 (ambiguity resolver, 113) (신호 (105)를 참조하고, 111로 제공되는 양자기 에러의 스케일 버전)는 가능한 입력 값 중 실제로 제공되는 값을 나타내는 데이터 (141)를 출력한다. 오버헤드를 포맷 (format)함에 따라, 이러한 재구성 데이터 (141)는 바람직한 워터마크와 곱해져 데이터 (143)가 된다.
상대적으로, 디코더는 243으로부터 재구성 데이터 (241)을 추출하고, 111로의 다중 입력 값이 103과 동일 값을 제공하는 경우 이렇나 경우들에 대해 211로부터 출력을 조절하도록 사용한다. 양자기 (211)는 도 2에서 확대된다. 도 2는 입력 신호가 가장 근접한 값으로 제1 양자화 (213)되고 양자화 에러 (205)가 어저스터 (adjuster, 215)로 공급되는 방법을 나타낸다. 임의의 주어진 값 (g)에 대해, 양자화 에러 (205)는 얼마나 많은 입력 값이 111에서 103을 제공할 수 있는지를 나타내는데 충분하다. 회신이 하나 이상인 경우 어저스터 (215)은 241로부터 데이터를 소비하여 어저스트먼트 (adjustment, 207)를 결정하고 213의 출력과 더해진다. 결과적으로, 이러한 보조 데이터 (214)는 일부 다른 양자화된 값이 양자기 (211)의 입력과 약간 근접할 수 있는 경우에도 201이 101을 복제하는 것을 보증한다.
전술한 15.5 비트 양자기의 사용은 WO 2004066272에서 기술된 15 비트 양자기와 비교하여 복잡한 연산이 수행된다. 그럼에도 불구하고 15 비트 양자기가 워터마컬을 더욱 투명하게 하는데 사용되는 경우와 같이 워터마킹은 많은 노이즈의 절반을 더하는 것을 의미하기 때문에 유용하다. 이러한 과정은 추가로 적용될 수 있는데, 예를 들어 4개의 샘플이 상호 양자화되는 15.75 비트 양자기를 사용하여 4개 샘플의 각각에 대해 1 또는 2개의 채널의 각각에 대해 2개의 연속적인 샘플이 다시 추가되는 노이즈를 반으로 줄인다. 그러나, 본 발명의 실시예는 이채널로 처리되어, 상호 양자화되는 연속적인 샘플에서의 복잡도 (complexity)는 클 것이다.
도 3은 15.5 비트 양자기 (112)의 실시예를 나타낸다. 박스 (301)는 이채널 입력을 가지고 총합의 반과 요소 (304-307)에 의한 채널 차이를 형성하는 15.5 비트 래티스 양자기를 나타낸다. 16 비트 양자기 (308, 309)는 채널을 양자화한 후 출력은 추가적인 합계와 차이로 형성된다. 301의 가능한 출력은 정수의 쌍이고, 정수의 lsb는 모두 0 또는 모두 1 중 하나이다.
박스 (301) 전에 하나의 채널에서 302를 비트 데이터 (143)로 차감하고, 이후에 뒤의 303를 추가하여 박스 (301)는 박스 (112)로 확장된다. 비트가 0인 경우, 112는 오프셋 [0,0]을 갖는래티스 양자화 그리드로 양자화된다. 1일 경우, 112는 오프셋 [0,2-16]을 갖는 래티스 그리도로 양자화되고, 여기서 하나의 채널의 lsb는 0이고 다른 하나는 1이다.
도 1b로 돌아가서, 데이터 (243)는 15.5 비트 양자화에서 사용되는 오프셋을 결정하기 위해 두개의 채널에서의 샘플에 해당하는 lsb 쌍들의 패리티를 조사하여 제공된다. 채널이 동일한 lsb를 가지는 경우 0은 243으로 제공되고, 서로 다른 lsb를 가지면 1이 제공된다.
양자기 (212)는 112와 동일한 해상도로 양자화된다. 도 4에 나타난 바와 같이, 오프셋 (O3)이 두개의 오프셋 사이에서 선택이 유도된 데이터보다 의사랜덤하게 선택되는 것을 제외하고, 양자기 (112)와 매우 유사하다. 따라서, 0과 2-15 사이의 값이 발생되는 의사랜덤 수 발생기 (PRNG)로부터의 두개의 샘플은 일정한 그리드 (301)로부터 양자화 그리드 (G3)를 양자화하기 위한 2D 오프셋을 생성하는데 사용된다.
동일한 효과를 이루기 위한 다른 방법이 있으며, 예를 들어 312와 313의 출력은 양자기 (308 및 309) 이전에 즉시 차감되고 이후에 즉시 다시 추가될 수 있다. 이러한 기법은 312 및 313에서의 값 사이에서의 맵핑 (mapping)과 오프셋 (O3)의 선택에서 차이가 있고, 호환 가능한 선택은 디코더 양자기 (212)와 인코더 양자기 (111)의 사이에서 만들어지는 게 필요하다.
112 및 212에서 사용되는 래디스 양자기 308과 309가 서로 호환 가능하면, 디코더 양자기 (212)는 112에 의해 제공되는 양자화 에러를 제거할 것이고, 복원 신호 (203)는 신호 (103)를 복제한다. 그러나, 호환 가능한 것이 동일한 것을 의미하지는 않는다. 이러한 실시예에서 Q112(x) = △(상승한도 (ceiling)(△-1x-0.5)) 및 Q212(x) = △(하한 (floor)(△-1x+0.5)), 여기서 △는 스텝 사이즈 2-16이다. 호환 가능을 위한 충분한 조건은 모든 x에 대해 Q112(x) = -Q212(-x)=Q112(x-△)+△이다.
양자기 (111) 또한 오프셋 (O3)를 갖는 15.5 비트로 양자화되고, 아키텍쳐 (architecture)는 212와 일치하여야 하며, 따라서 의사랜덤 수로부터 O3까지 동일한 맵핑을 갖는다. 오프셋 (O3)의 선택은 인코더 및 디코더 모두에서 일치하는 것이 필요하고, 따라서 212에서의 의사랜덤 수 발생기는 111에서와 일치하도록 동기화되어야 한다. 이는 데이터 (143)에 동기화 정보 (예를 들어, 샘플 수)를 주기적으로 삽입 (embed)하여 수행될 수 있다.
도 5a 및 5b는 데이터 (141)가 스케일 (scale)된 에러 양자기 에러 신호 (105)로부터 제공되는 방법을 나타낸다 (다이어그램의 혼돈을 방지하기 위해 노이즈 셰이핑 필터 (121)로부터의 출력을 0으로 가정한다).
도 5a에 나타낸 그래프에서, 축은 신호 (101)의 왼쪽 및 오른쪽 채널이고, 입력 (16 비트 래티스와 오프셋 (O1)으로 주어짐)에 제공될 수 있는 허용 가능한 양자화된 값에 해당하는 수평 및 수직 라인의 그리드를 갖는다.
이러한 교차 중 하나는 이러한 예시된 경우에 제공되는 실제 값을 나타내는 것으로 라벨 (label)된다. g로 나눠진 후 111에 의해 양자화되고 g로 곱해진, 신호 (106)에 대한 실례 값을 나타낸다. 전술된 양자기 (111)에 대한 베로니 영역 (Veroni region)은 다이아몬드 모양이다. 도 5a의 그래프 상에서 g에 의해 스케일되는 것을 보여준다. 물론, 101의 실제 값은 이러한 영역 내에 있으며, 이는 g로 나누어진 신호 (101)는 신호 (106)로 양자화되기 때문이다. 유일한 값인 경우 해당하는 디코더는 106의 값으로부터 101의 실제 값을 유일하게 확인할 수 있다. 나타낸 경우에서, 106의 주어진 값을 제공하는 것으로 나타낸 또 다른 가능한 값이 있고, 따라서 디코더는 베로니 영역에 놓여있는 양자화된 값 중 출력되는 것이 어느 것인지 분석하기 위해 소량의 추가적인 정보 (141)가 필요하다.
도 5b에 나타낸 그래프는 베로니 영역을 확대한 것이고, 신호 (105)=0이 중앙이다. 신호 (105)가 점선 다이아몬드 내에 있으면, 반대쪽 점선 다이아몬드 (이는 ±g에 의해 일차원으로 바뀜)에 놓여 있는 신호 (101)에 대한 또 다른 가능한 값이 있으며, 디코더에 의해 제공되는 두개의 반대쪽 중 어느 것인지를 분석하기 위해 모호성 리졸버 (113)는 데이터 (141)에서의 비트 정보를 보내는 것이 필요하다. 예를 들어, 신호 (105)가 왼쪽 다이아몬드에 놓여 있는 경우 0이 보내지고, 반면에 오른쪽 다이아몬드에 있는 경우 1이 보내진다. 유사하게 0은 하부 다이아몬드에 보내지고, 1은 상부 다이아몬드에 보내진다. 대신에, 신호 (105)에 대한 값이 점선 다이아몬드에 놓여 있지 않으면, 중앙 교체 영역에 놓여야 한다. 여기서 신호 (101)에 대한 대체 가능성이 없으면 데이터는 보내질 필요가 없다. 양자기의 이러한 선택에 대해, 베로니 영역에 놓여있는 2 값 이상의 가능성은 없으며, 따라서 데이터 (141)는 샘플 당 최대 1 비트를 갖는다.
각각의 점선 다이아몬드의 폭은 2g-1이고, 따라서 g<0.5이면 점선 다이아몬드는 없어지고 분석하기 위한 어떠한 모호성도 없다. 또한 g=1에 대해 교차는 없어지고 141에 대한 데이터 속도는 항상 샘플 당 1 비트이며, 이는 오버헤드 또는 워터마크에 대한 여분의 캐패시티 (capacity)를 남기지 않으면서 양자기 (112)의 데이터 캐패시티를 포화상태로 만든다. 여기서 필요조건은 g<1이다.
특정한 경우에서, 점선 영역의 계산에서 부정확함은 용인될 수 있다. 인코더 계산은 디코더에서 수행되는 계산과 정확하게 일치하여야 한다는 것은 중요하다 (인코더 및 디코더 연산은 나누어진다). 점선 영역은 너무 작아서 계산되지 않으며, 그렇지 않으면 디코더가 제공할 수 없는 신호 (201)의 값일 수 있다는 것은 중요하다. 그러나, 점선 영역이 요구되는 것보다 약간 큰 것은 큰 문제가 아니다. 이러한 부정확성의 결과는 데이터 (141)가 필요하지 않은 소량의 데이터를 옮기고, 데이터 캐패시티를 약간 낭비하는 것이다.
신호 (105) 계산에서의 작은 에러 (예를 들어 g로 곱해진 디코더 (231)는 불편하게 큰 워드 폭을 제공하는 경우의 미세 양자화)는 디코더가 매칭 근사값 (231에서)을 만드는 경우 동반될 수 있고, 이들 모두는 점선의 다이아몬드의 크기를 덧붙여 가장 나쁜 경우인 부정확 (inaccuracy)을 동반할 수 있다.
디코더에서, 양자기 (213)의 출력은 인코더로 제공될 수 있는 하나의 가능한 값이다. 어저스터 (215)는 재구성 비트가 데이터 (241)로부터 가져오는게 필요한지에 따라 모호성 리졸버 (113)에 대응되게 결정할 수 있다. 필요한 경우와 비트가 하나 (205)와 반대편의 점선 다이아몬드가 존재하는 것을 나타내는 경우, 어저스터 (215)는 어저스트먼트 신호 (207)를 출력하여 양자기 (211)의 출력을 신호 (101)를 복제하는 정확한 값으로 조절한다. 임의의 조정 (adjustment)은 왼쪽 또는 오른쪽 채널 중 하나에서 ±1 lsb이다.
클립 (Clip)
게인 요소 (131) 때문에, 신호 (103)는 16 비트 오디오가 나타낼 수 있는 범위를 초과하고, 클립 (133)은 나타낼 수 있는 범위로 신호를 다시 가져오게 하여 워터마킹된 출력 (102)이 과부하 (overload)되지 않는다.
많은 신호 범위에 대해, 클립 유닛 (133)은 신호를 변경하지 않는다. ± 전체 스케일 근처에서, <1의 작은 신호 게인을 가지고, 입력의 다중 값을 특정 값의 출력으로 연결 (map)한다. 이러한 경우가 발생하면, 다중 값 중 실제로 제공되는 값을 특정하는 클립 재구성 데이터 (142)를 발생시킨다. 클립 재구성 데이터 (142)는 재구성 데이터 (141) 및 워터마크와 결합하여 데이터 (143)를 형성한다.
언클립 유닛 (233)은 클립 유닛의 반대이다. 많은 신호 범위에 대해 신호를 변경하지 않는다. ± 전체 스케일 근처에서 <1의 작은 신호 게인을 가지고, 특정 값의 입력을 다중 값의 출력으로 연결한다. 이러한 경우가 발생하면, 클립 재구성 데이터 (242)를 소모하여 다중 값 중 실제로 출력되는 값을 선택한다. 클립 재구성 데이터 (242)는 재구성 데이터 (141) 및 데이터 (243)에서의 워터마크에 따라 추출된다. 본 발명에서의 연산은 WO 2013061062의 도 11에 나타난 바와 같이 설명될 수 있다.
이러한 실시예에서 명료함을 위해, 본 발명에서는 15.5 비트 래티스의 부분 집합인 15 비트 래티스 (오프셋 없음)로 양자화되는 신호 (103) 및 (104)를 가지고, 신호 (104)의 양자화 오프셋을 변경하지 않는다. 채널이 클립핑 (clipping)되지 않는 경우 완전하게 변경되지 않게 클립을 통과하고, 채널이 클립되는 경우 다른 채널을 변경하는 것 없이 동일한 양자화 오프셋에서 유지되도록 2-15의 승수로 신호가 변경되도록 선택한다.
클립핑 때문에 이러한 15 비트의 조정은 다른 노이즈 소스가 서로 합쳐질 정도로 크고, 노이즈는 셰이핑되지 않는다. 높은 투명도를 위한 본 발명의 목적은 가능한 것으로 여겨지는데, 이는 신호가 큰 경우 클립핑 동안에서만 발생하고, 소프트 클립에서 왜곡된다. 또한, 다음의 실시예에서 본 발명은 신호 클립핑의 발생이 크게 감소되는 필터링의 사용에 대해 설명한다. 게인과 클립의 조합은 WO 2004066272의 시그모이드 전달 함수 C를 제공한다. 일 단계에서 이를 모두 수행하는, 특히 모든 것이 일 단계에서 수행되어 추가적인 15 비트 노이즈 소스가 제공되지 않는 경우보다 선형 게인을 시그모이드 클립핑 함수와 조합하는 것을 선택하는 것에 대해 의문일 수 있다.
이는 모든 샘플에서 게인 (g)을 변경하는 것이 요구되고, 모호성 리졸버 (113) 및 어저스터 (215)를 구성하는 복잡성, 특히 본 발명에서 주어지는 임의의 15.5 비트 상호 양자화 그리드 (G3)는 이러한 방법에 의해 제공되는 노이즈의 불리함을 보충하기 때문이다.
초기화 (Initiallisation)
전술한 바와 같이, 신호 (201)의 무손실 재구성은 인코더에서의 필터 (121, 122)의 출력을 일치시키기 위해 필터 (221, 222)에서의 출력을 필요로 한다. 이러한 필수 조건은 디코더가 이전 샘플에서 무손실로 연산되면 만족되고, 인코더 및 디코더 모두가 0과 같은 공통 값 (common value)으로 초기화되는 이들 각각의 필터 상태를 가질 수 있는 경우 인코더된 트랙의 시작에서 만족한다. 그러나, 디코더의 유용한 연산은 인코더된 스트림을 통과하는 도중에 개시 (start up)하는 것이 필요하고, 이는 처음에 가정된 것보다 어려운 스펙트럼 형상의 양자화 노이즈를 만든다.
본 발명의 실시예에서, 도 6에 나타낸 바와 같이 스트림에서의 특정 포인트를 재시작 포인트가 되게 제공한다. 워터마킹된 오디오 (102)는 lsb의 XOR로서 데이터 채널 (143)을 가지면서 나타난다. 400, 401 및 402는 오리지날 오디오의 무손실 디코딩이 시작될 수 있는 재시작 포인트이다. 재시작 포인트 (400)는 트랙의 시작이고, 여기서 필터 (221, 222)는 0으로 초기화될 수 있고, 인코더에서 유사한 리셋 (reset)과 일치한다. 그러나 재시작 포인트 (401, 402)는 중간-트랙에 있고, 따라서 매립된 데이터 (buried data, 143)는 401 또는 402에서 무손실 디코더하기 위한 디코더의 개시를 위한 필터 상태를 초기화하는데 사용되는 재시작 보조 정보 (restart assistance information, 411, 412)를 포함해야 한다.
본 발명에서 재시작 보조 정보 (411)는 해당하는 재시작 포인트 (401) 전에 매립되고, 따라서 디코더는 401에서 필터 상태를 초기화하는데 필요한 경우 데이터를 가질 수 있다. 포인트에서의 매립된 데이터 (413)를 변경하는 것은 112의 양자화에 영향을 미치고, 필터 (122)는 이러한 변경된 데이터가 다음의 양자화에 영향을 미치는 것을 의미한다. 재시작 보조 데이터 (411)가 재시작 포인트 (401)에서의 필터 (122) 상태에 의존하는 경우 이러한 상태는 조기 매립된 데이터에 의존하기 때문에 분석하는 인코더에 대해 어색한 원형 (awkward circularity)을 갖는다.
다행스럽게도, (G-1)이 유한 임펄스 응답 (FIR) 필터인 모든 폴 노이즈 셰이핑 알키덱쳐는 이러한 원형을 방지하도록 한다. 필터 (122)의 상태는 중간 신호 (104)의 최신 값과 워터마킹된 신호 (102) 사이에서의 차이이다. 디코더가 재시작 포인트 (401)에 가까워지면 102의 복제인 재시작 포인트 전의 신호 (202)에 접근한다. 따라서, 재시작 정보가 401 전에 직접적으로 n 샘플에 대한 중간 신호(104)의 재구성이 가능할 정도로 충분하고, 여기서 필터 (122)의 출력은 이의 입력의 이전 n 값의 함수이다. 신호 (104)는 매립된 데이터 (143)에 의존하지 않기 때문에 원형을 방지한다.
재시작 정보는 신호 (104)의 이러한 n 샘플의 완전한 복사 (copy)를 포함할 수 있으나, 재시작 포인트가 빈번한 경우 이는 불편하게 다량의 데이터일 수 있다. 본 발명에서는 충분한 재시작 정보가 적게 할 수 있는 방법을 제공한다.
신호 (104, 102)는 노이즈 셰이핑 양자화에 의해서만 달라지고, 이들 차이는 제한된다. 이러한 제한은 노이즈 셰이핑 전달 함수의 임펄스 응답 및 양자화 에러의 크기로부터 계산될 수 있다. 본 발명의 실시예에서 양자기 (211)는 2-16 g<2-16의 채널 상에서 최대 절대 에러를 제공한다. 노이즈 셰이핑 필터 (1/G(z))의 임펄스 응답 절대값의 총합은 27 보다 작다. 따라서, 신호 (104)와 신호 (102) 사이에서의 차이는 (-27×2-16, 27×2-16) 범위에 놓인다. 또한, 임의의 샘플에서의 신호 (104)의 lsb는 한정된 양자화 그리드 (G3)에서의 디코더로 알려져 있다. 따라서, 샘플 당 재시작 보조 데이터의 6 비트만이 필요하다 (이는 상단히 보수적인 제한이고 적은 것만으로도 충분할 것이다).
필터 (222)를 위한 개시 연산 (startup operation)은 도 7에 나타낸다. 보통의 연산과 달리 필터 (222)에서의 출력은 무시된다. 양자기 (431)는 하기에서 기술되는 바와 같이 오프셋 (O3)를 갖는 15.5 비트 양자화의 작은 부분 집합으로 202를 양자화시켜 204를 발생시킨다. 계산된 신호 (204)에 대한 정확한 값을 가지면서 본 발명은 필터 (222)를 위한 정확한 입력을 가지고, n 샘플 후 나중 필터 (222)는 정확한 상태를 가지며, 본 발명은 정상 연산 (normal operation)으로 변환할 수 있다.
실시예에서, 양자기 (431)는 10 비트 래티스 양자기이고, 오프셋은 2-16로 스케일된 6 비트의 재시작 보조 데이터의 총합 및 PRNG 312 (또는 다른 채널에 대한 313)의 출력에 의해 주어진다. PRNG 312는 신호 (204)가 15.5 비트 양자화와 비교하여 정확한 오프셋 (O3)을 가지는 것을 보증하고, 재시작 보조는 입력 신호 (202)에 근접한 정확한 값을 선택하는 것을 보증한다.
이러한 인코더 측면은 이상적으로 신호 (104)의 11 내지 16 비트가 재시작 보조로 되게 하는 것을 요구한다. 그러나, PRNG 값은 2-15까지의 범위를 가지고, 따라서 PRNG 및 보조 사이에서 1 비트 오버랩 (overlap)이 존재한다. 디코더는 값을 추가하기 때문에 인코더는 재시작 보조를 발생시키기 위해 신호 (104)의 11 내지 16 비트의 lsb 말단으로부터 PRNG 출력의 탑 비트를 차감해야 한다. 필터 (221)는 유사한 방법으로 초기화될 수 있다.
필터링 (Filtering)
WO 2013061062에 기술된 바와 같이, 프리-엠퍼시스 (pre-emphasis) 필터로 무손실 워터마컬을 변경하는 히스토그램을 선행하는 것이 효과적일 수 있다. 완전히 분리된 선공정 (preprocess)으로 수행되었고, 이의 필요성은 16 비트 레벨로의 재양자화 (requantisation)를 포함한다.
본 발명의 추가적인 실시예에 따르면, 인코더는 단일의 제1 임펄스 응답을 갖는 필터에 의해 선행되고, 이의 출력은 16 비트보다 미세하게 정밀한 즉, 24 비트로 양자화된다.
이러한 필터의 양자화된 형태는 도 8a에 나타낸다. 함수 (520)는 필터 입력 (501) 및 출력 (503)의 n 지연된 값으로 계산되고, 그 결과 530은 양자화되어 신호 (502)를 제공하며, 이러한 값은 임의의 순간에 A로 명명된다 (조절을 위해). 필터 출력 (503)은 신호 (502)를 신호 (501)와 더하여 형성된다. 양자기 (530)는 인코더가 연산한 16 비트 정밀로 양자화되는 경우 WO 2013061062에서의 무손실 프리엠퍼시스 필터와 물질적으로 상이한 것이 아니다. 그러나, 양자기 (530)는 셰이핑되지 않는 16 비트 노이즈의 추가 소스이고, 이는 바람직하지 않다.
그러나, 놀랍게도 필터-인코더 조합은 양자기 (530)가 예를 들어 24 비트의 미세 정밀로 양자화되는 경우이더라도 변환된다. 양자기 (530)에 의해 제공되는 노이즈는 휠씬 낮고 본 발명에서 제공되는 전체 노이즈에 물질적 기여는 없다.
신호 (501)는 오프셋 (O1)을 갖는 16 비트 래티스로 양자화되고, A는 이전 샘플의 함수이다. A는 높은 정밀에도, 신호 (503)는 16 비트 양자화 그리드 (O1 + A)로 양자화될 수 있다. 이는 다음의 인코더 연산에 영향을 미치지 않으나 (모호성 리졸버 (113)의 연산이 양자화 오프셋이 아니라 16 비트 래티스를 이용한 입력에 의존하기 때문), 디코더 연산에 영향을 미친다.
디코더 연산은 도 8b에 나타내고, 이는 도 1b에서 나타낸 디코더의 왼쪽 방향으로의 변경을 나타낸다. 이전 연산이 손실이 없는 것으로 가정하고, 디코더는 인코더로서 복제된 이전 샘플의 동일 함수 (521)를 계산할 수 있고, 신호 (502)를 복제하는, 값이 A인 신호 (512)를 제공하기 위해 동일한 양자화 (531)가 수행될 수 있다.
그러나, 양자기 (211)의 출력으로부터 A를 차감하지는 않으며, 이는 양자화 오프셋을 변경하기 때문이다. 대신 양자기 (211) 전에 A를 차감한다. 양자기 (211)의 출력은 따라서 오프셋 (01)으로 양자화된 여과된 신호이고, 이는 신호 (501)를 복제하고 디코더 출력 및 함수 (521)로의 입력 중 하나의 역할을 하도록 신호 (511)에 요구되는 바와 같다.
A가 더해진 후 신호 (503)를 복제하는 양자화 오프셋 (O1+A)를 갖는 신호가 제공되고, 이는 함수 (501)로 입력되는 다른 신호 및 차감 노드 공급 노이즈 셰이핑 필터 (221)에 요구되는 것이다. 본 발명에서 점선 박스 (214)는 양자화 오프셋 (O1+A)를 갖는 16 비트 양자기를 형성한다.
노이즈 셰이핑을 가짐에도, 전술한 논리는 트랙의 중간에서 디코더 연산을 시작하는 경우 작동이 안 되고, 재시작 보조 데이터는 부트스트랩 (bootstrap) 무손실 연산을 필요로 한다. 가장 간단하게, 재시작 보조는 정확한 필터 상태의 스냅샷 (snapshot)을 포함할 수 있으나, 재시작 포인트가 빈번한 경우 이는 불편하게 다량의 데이터가 될 수 있다.
본 발명에서 재시작 보조 데이터의 양이 실질적으로 감소될 수 있는 방법을 설명한다. 본 발명은 하기를 예비로 관찰한다.
· 양자기 (214)로의 신호 (512) 피드백은 양자기와 필터가 조합된 유닛으로서 부트스트랩핑 (bootstrapping)이 필요한 것을 나타낸다. 필터를 부트스트랩하지 않는 경우 214의 노이즈 셰이핑을 초기화하는 포인트가 없으며, 이는 신호 (512)의 잘못된 값이 양자기 (214)를 잘못된 그리드로 양자화하기 때문이고, 따라서 무손실 방법으로 연산되지 않는다. 이는 양자기로 통합되지 않는 WO 2013061062에서의 프리앰퍼시스와 가장 큰 차이이다.
· 노이즈 셰이핑하면서, 신호 (513, 511)가 n 샘플에 대해 정확한 경우 신호 (512)는 정확하고, 양자기 (214)의 노이즈 셰이핑 또한 정확하면, 무손실 연산이 수행된다.
· 신호 (513)는 또한 노이즈 셰이핑을 부트스트랩하기 위해 정확해야 한다.
신호 (513)는 신호 (206)에 근접하고, 양자기 (214)에 의해 제공되는 노이즈 셰이핑된 변경에 의해 달라진다. 그러나, 신호 (511)는 513의 여과된 버전이고, 실질적으로 서로 상이하다.
디코더가 스트림 내 임의의 포인트에서 시작되면 일반적으로 재시작 보조 데이터가 제공되는 "재시작 포인트"를 즉시 참조하지 않으며, 도 9에 나타난 바와 같이 초기에는 손실있는 모드로 작동된다. 도 9는 노이즈 셰이핑된 양자기 (214)를 제거하고 조정 A를 차감하며 마지막으로 결과를 양자화하는 것에 의해 도 8B로부터 얻어지며, 따라서 인코더로 제공되는 신호 (501)를 복제하지 않아도 출력은 오프셋 (O1)을 갖는 16 비트가 된다.
본 발명에서 신호 (511)가 무손실 연산을 갖는 정확한 값으로 수렴되도록 하는 충분한 시간 동안 유손실 모드로 연산한다. 필요한 시간은 필터의 임펄스 응답의 길이와 관련되고, 이는 함수 (521)와 양자기 (531) 주위의 피드백 경로 때문에 일반적으로 IIR이다. 얼마나 가깝게 신호 (511)가 수렴될 것인지에 대한 제한이 있고, 부정확한 입력으로 셋팅되는데, 이는 양자기 (214)가 손실있는 모드로 연산되지 않기 때문이다. 재시작 보조는 511과 513의 지연된 값이 정확한 값으로 근접하게 하기 위해 재시작 포인트에서 필요하다.
앞에서 기술한 노이즈 셰이핑을 초기화하는 경우에, 재시작 정보는 말 그대로 무손실 신호의 비트일 수 있다. 신호 (511)에 대해, 16 아래의 비트는 양자화 오프셋 (O1)에 의해 한정되고, 따라서 각각의 지연된 데이터는 신호 (511)에 근접한 얼마나 많은 에러가 있는지에 의존하는 수를 가지면서 이상에서 명시된 16 번째 비트에서의 lsb의 수 일부가 필요하다. 함수 (521) 및 양자기 (531)를 포함하는 IIR 필터가 정착하는데 충분한 시간을 가지고 너무 지나친 반응을 가지지 않으면, 8 비트는 충분할 것이다. 신호 (513)에 대해, 본 발명은 노이즈-셰이핑 경우에서 보다 더 많은 비트가 필요하며, 이는 신호가 그리드 (O1+A)에서 양자화되고 A를 정확하게 모르기 때문이다. 따라서, 6 비트는 노이즈 셰이퍼 (shaper)에 충분하다면, A는 24 비트로 양자화되고, 데이터 당 14 비트가 필요하며, 무손실 신호의 11 내지 24번째 비트를 전달한다.
스프링클러 (Sprinkler)
도 10은 본 발명의 또 다른 실시예를 나타내고, 여기서 무손실 워터마킹된 오디오 파일 (202)은 서로 다른 무손실 워터마킹된 오디오 파일 (102)을 제공하기 위해 변경된 워터마크를 갖는다.
이는 도 1B에서의 디코더의 초기 부분을 이용하여 수행되어 그리드 (G3)로 양자화된 내부 신호 (204)를 재생 (regenerate)하고, 그 후 변경된 데이터 (143)를 삽입하기 위해 도 1a에서의 인코더의 후단을 통과한다. 데이터 (143)의 워터마크 부분만이 변경되고, 재구성 데이터 및 재시작 보조는 변하지 않고 통과한다.

Claims (34)

  1. 제2 오디오 신호를 발생시키기 위해 제1 오디오 신호를 무손실 워터마킹하는 방법에 있어서, 상기 제1 및 제2 오디오 신호는 펄스 코드 조정된 'PCM' 신호이고,
    제1 양자화 그리드에서 양자화된 샘플로서 상기 제1 오디오 신호를 수신하는 단계;
    상기 제1 양자화 그리드보다 넓은 제3 양자화 그리드를 결정하는 단계, 여기서 상기 제3 양자화 그리드는 의사-램덤 시퀀스 발생기의 출력에 따라 결정됨;
    상기 제1 오디오 신호에 양자화된 맵핑을 적용하여 제3 양자화 그리드 상에 있는 샘플 값을 갖는 제3 오디오 신호를 제공하는 단계;
    상기 제1 양자화 그리드의 다중 값이 상기 양자화된 맵핑에 의해 제3 오디오 신호의 값으로 맵핑되는 경우 제1 데이터를 발생시키는 단계, 여기서 상기 제1 데이터는 다중 값 중 임의의 것이 상기 제1 오디오 신호의 값을 나타내는 재구성 데이터임;
    상기 제1 데이터를 워터마크 데이터와 결합시켜 제2 데이터를 제공하는 단계;
    상기 제2 데이터에 따라 상기 제1 및 제3 양자화 그리드와 다른 제2 양자화 그리드를 결정하는 단계; 및
    상기 제2 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 제2 양자화 그리드로 상기 제3 오디오 신호를 양자화하여 상기 제2 오디오 신호의 샘플을 발생시키고, 따라서 양자화에 의해 제공되는 양자화 에러가 가청도를 위해 스펙트럼 형상되는 단계를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 제1 및 제3 양자화 그리드 중 적어도 하나는 샘플에 따라 변하는, 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 제1, 제2 및 제3 오디오 신호는 다중채널이고, 상기 제2 및 제3 양자화 그리드 중 적어도 하나는 각각의 채널에서 독립된 양자화 그리드의 데카르트 곱으로 형성되지 않는, 방법.
  5. 제1항에 있어서,
    상기 양자화된 맵핑은 상기 제1 양자화 그리드보다 더욱 미세하게 양자화되는 출력을 갖는 필터에 의해 선행되는, 방법.
  6. 제1항에 있어서,
    상기 제2 데이터는 상기 제3 오디오 신호의 연속된 샘플과 관련된 초기화 데이터를 포함하는, 방법.
  7. 제6항에 있어서,
    상기 초기화 데이터 내의 총 비트 수는 8×채널수×연속된 샘플 수를 초과하지 않는, 방법.
  8. 제2 오디오 신호의 일부로부터 제1 오디오 신호 및 워터마크 데이터를 수신하는 방법에 있어서, 상기 제1 및 제2 오디오 신호는 펄스 코드 조정된 'PCM' 신호이고, 상기 제2 오디오 신호는 무손실 워터마킹된 PCM 신호이며, 상기 제1 오디오 신호는 제1 양자화 그리드 상에 있는 샘플을 가지고,
    제1 양자화 그리도보다 넓은 제3 양자화 그리드를 결정하는 단계, 여기서 상기 제3 양자화 그리드는 의사-램덤 시퀀스 발생기의 출력에 따라 결정됨;
    양자화된 샘플로서 상기 제2 오디오 신호를 수신하는 단계;
    상기 제2 오디오 신호로부터 제1 데이터 및 워터마크 데이터를 복구하고, 상기 제1 데이터는 상기 제1 오디오 신호를 복구하는데 사용하기 위한 재구성 데이터인 단계;
    상기 제3 양자화 그리드로 양자화하여 제3 오디오 신호의 샘플을 발생시키고, 이는 상기 제2 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 제2 오디오 신호의 샘플을 양자화하여 수행되는 단계;
    상기 제1 데이터에 따라 상기 제3 오디오 신호에 양자화된 맵핑을 적용하여 맵핑된 신호를 제공하는 단계; 및
    상기 맵핑된 신호에 따라 상기 제1 오디오 신호를 제공하는 단계, 여기서 양자화에 의해 제공되는 양자화 에러가 가청도를 위해 스펙트럼 형상이 되는 것을 포함하는, 방법.
  9. 제8항에 있어서,
    상기 제1 오디오 신호는 상기 제1 양자화 그리드 상에 있는 샘플을 갖는 오리지날 PCM 오디오 신호의 일부를 복제하고, 상기 제2 오디오 신호는 오리지날 PCM 오디오 신호의 워터마킹된 버전인, 방법.
  10. 삭제
  11. 제8항에 있어서,
    상기 제1 및 제3 양자화 그리드 중 적어도 하나는 하나의 샘플링 시점부터 다른 샘플링 시점까지 변하는, 방법.
  12. 삭제
  13. 제8항에 있어서,
    상기 제1, 제2 및 제3 오디오 신호는 다중채널이고, 상기 제2 및 제3 양자화 그리드 중 적어도 하나는 각각의 채널에서 독립된 양자화 그리드의 데카르트 곱으로 형성되지 않는, 방법.
  14. 제8항에 있어서,
    상기 맵핑된 신호는 제1 신호인, 방법.
  15. 제8항에 있어서,
    상기 제1 양자화 그리드보다 미세한 제4 양자화 그리드를 결정하는 단계;
    상기 제1 오디오 신호 및 상기 맵핑된 신호 중 적어도 하나의 이전 샘플에 따라 조절 샘플을 계산하고, 상기 조절 샘플은 상기 제4 양자화 그리드 상에 있는 값을 가지는 단계; 및
    상기 조절 샘플을 상기 맵핑된 신호에 추가하는 단계;를 더 포함하는, 방법.
  16. 제8항에 있어서,
    상기 제2 오디오 신호는 제1항 내지 제2항 및 제4항 내지 제7항 중 어느 한 항의 방법을 이용하여 발생되고, 상기 제2 오디오 신호로부터 제1 데이터 및 워터마크 데이터를 복구하는 단계는
    상기 제2 오디오 신호로부터 상기 제2 데이터의 복제를 복구하는 단계;
    상기 제2 데이터의 복제로부터 상기 제1 데이터 및 상기 워터마크 데이터를 추출하는 단계를 포함하는, 방법.
  17. 제8항에 있어서,
    상기 제2 오디오 신호로부터 초기화 데이터를 복구하는 단계; 및
    상기 초기화 데이터를 이용하여 상기 제3 오디오 신호의 연속된 샘플로부터 비트의 선택을 결정하는 단계를 포함하는, 방법.
  18. 제17항에 있어서,
    상기 초기화 데이터는 8비트×채널수×상기 제3 오디오 신호의 값의 수보다 크지 않은, 방법.
  19. 양자화된 샘플로서 제2 오디오 신호를 수신하는 단계;
    상기 제2 오디오 신호로부터 삽입된 워터마크 데이터를 포함하는 제2 데이터를 복구하는 단계;
    제3 양자화 그리드로 양자화하여 제3 오디오 신호의 샘플을 발생시키고, 이는 상기 제2 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 제2 오디오 신호를 양자화하여 수행되는 단계;
    상기 제2 데이터에서 삽입된 워터마크 데이터를 변경하여 제4 데이터를 제공하는 단계;
    상기 제4 데이터에 따라 제4 양자화 그리드를 결정하는 단계; 및
    상기 제4 및 제3 오디오 신호 중 적어도 하나의 이전 샘플에 따라 제4 양자화 그리드에서 상기 제4 오디오 신호로 상기 제3 오디오 신호를 양자화시키는 단계;를 포함하는, 제1항 내지 제2항 및 제4항 내지 제7항 중 어느 한 항의 방법에 따라 발생된 무손실 워터마킹된 PCM 신호인 제2 오디오 신호에서 워터마크를 변경하는 방법.
  20. 제19항에 있어서,
    상기 제3 양자화 그리드는 하나의 샘플링 시점부터 다른 샘플링 시점까지 변하는, 방법.
  21. 제19항에 있어서,
    상기 제3 양자화 그리드는 의사-램덤 시퀀스 발생기의 출력에 따라 결정되는, 방법.
  22. 제19항에 있어서,
    상기 제2, 제3 및 제4 오디오 신호는 다중채널이고, 제2, 제3 또는 제4 양자화 그리드 중 적어도 하나는 각각의 채널에서 독립된 양자화 그리드의 데카르트 곱으로 형성되지 않는, 방법.
  23. 제1항의 방법을 이용하여 PCM 오디오를 무손실 워터마크하도록 적용된 인코더.
  24. 제8항의 방법을 이용하여 무손실 워터마킹된 PCM 신호의 일부로부터 PCM 오디오 신호 및 워터마크 데이터를 복구하도록 적용된 디코더.
  25. 제24항에 따른 디코더와 결합된 제23항에 따른 인코더를 포함하는 코덱.
  26. 제1항 내지 제2항 및 제4항 내지 제7항 중 어느 한 항의 방법을 이용하여 무손실 워터마킹된 PCM 오디오 신호를 포함하는 데이터 캐리어 장치.
  27. 신호 프로세서에 의해 실행되는 경우 상기 신호 프로세서가 제1항, 제2항 및 제4항 내지 제7항 중 어느 하나의 방법을 수행하도록 하는 명령을 포함하는 컴퓨터 프로그램 제품을 포함하는 컴퓨터 저장 매체.
  28. 양자화된 샘플로서 입력 오디오 신호를 수신하는 단계;
    상기 입력 오디오 신호로부터 삽입된 워터마크 데이터를 포함하는 입력 데이터를 복구하는 단계;
    중간 양자화 그리드로 양자화하여 중간 오디오 신호의 샘플을 발생시키고, 이는 상기 입력 오디오 및 중간 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 입력 오디오 신호를 양자화하여 수행되는 단계, 여기서 상기 중간 양자화 그리드는 의사-램덤 시퀀스 발생기의 출력에 따라 결정됨;
    상기 입력 데이터에 삽입된 워터마크 데이터를 변경하여 출력 데이터를 제공하는 단계;
    상기 출력 데이터에 따라 출력 양자화 그리드를 결정하는 단계; 및
    상기 출력 및 중간 오디오 신호 중 적어도 하나의 이전 샘플에 따라 상기 출력 양자화 그리드 상에서 출력 오디오 신호로 상기 중간 오디오 신호를 양자화시키고, 따라서 양자화에 의해 제공되는 양자화 에러가 가청도를 위해 스펙트럼 형상이 되는 단계;를 포함하는, 무손실 워터마킹된 PCM 신호인 입력 오디오 신호에서 워터마크를 변경하는 방법.
  29. 제28항에 있어서,
    상기 중간 양자화 그리드는 하나의 샘플링 시점부터 다른 샘플링 시점까지 변하는, 방법.
  30. 삭제
  31. 제28항 또는 제29항의 방법을 이용하여 무손실 워터마킹된 PCM 신호인 입력 오디오 신호에서 워터마크를 변경하도록 적용된 워터마크 변경자 장치.
  32. 신호 프로세서에 의해 실행되는 경우 상기 신호 프로세서가 제8항, 제9항, 제11항, 제13항 내지 제15항, 제17항 및 제18항 중 어느 하나의 방법을 수행하도록 하는 명령을 포함하는 컴퓨터 프로그램 제품을 포함하는 컴퓨터 저장 매체.
  33. 신호 프로세서에 의해 실행되는 경우 상기 신호 프로세서가 제19항의 방법을 수행하도록 하는 명령을 포함하는 컴퓨터 프로그램 제품을 포함하는 컴퓨터 저장 매체.
  34. 신호 프로세서에 의해 실행되는 경우 상기 신호 프로세서가 제28항 또는 제29항의 방법을 수행하도록 하는 명령을 포함하는 컴퓨터 프로그램 제품을 포함하는 컴퓨터 저장 매체.

KR1020167030726A 2014-04-02 2015-03-26 투명 무손실 오디오 워터마킹 KR102467628B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1405958.8 2014-04-02
GB1405958.8A GB2524784B (en) 2014-04-02 2014-04-02 Transparent lossless audio watermarking
PCT/GB2015/050910 WO2015150746A1 (en) 2014-04-02 2015-03-26 Transparent lossless audio watermarking

Publications (2)

Publication Number Publication Date
KR20160147794A KR20160147794A (ko) 2016-12-23
KR102467628B1 true KR102467628B1 (ko) 2022-11-15

Family

ID=50737900

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167030726A KR102467628B1 (ko) 2014-04-02 2015-03-26 투명 무손실 오디오 워터마킹

Country Status (9)

Country Link
US (1) US9940940B2 (ko)
EP (1) EP3127111B1 (ko)
JP (1) JP6700506B6 (ko)
KR (1) KR102467628B1 (ko)
CN (1) CN106415713B (ko)
CA (1) CA2944625C (ko)
GB (1) GB2524784B (ko)
PL (1) PL3127111T3 (ko)
WO (1) WO2015150746A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2524784B (en) 2014-04-02 2018-01-03 Law Malcolm Transparent lossless audio watermarking
US9818414B2 (en) * 2015-06-04 2017-11-14 Intel Corporation Dialogue system with audio watermark
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
GB2546963B (en) * 2015-12-23 2020-10-21 Law Malcolm Transparent lossless audio watermarking enhancement
US10395664B2 (en) 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
KR102150639B1 (ko) * 2018-05-21 2020-09-03 대한민국 디지털 데이터의 무결성을 검증할 수 있는 장치 및 디지털 데이터의 무결성을 검증할 수 있는 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066272A1 (en) * 2003-01-17 2004-08-05 Koninklijke Philips Electronics N.V. Reversible watermarking of digital signals
WO2013061062A2 (en) 2011-10-24 2013-05-02 Peter Graham Craven Lossless buried data

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9302982D0 (en) * 1993-02-15 1993-03-31 Gerzon Michael A Data transmission method in digital waveform signal words
WO1995018523A1 (en) * 1993-12-23 1995-07-06 Philips Electronics N.V. Method and apparatus for encoding multibit coded digital sound through subtracting adaptive dither, inserting buried channel bits and filtering, and encoding and decoding apparatus for use with this method
US6233347B1 (en) * 1998-05-21 2001-05-15 Massachusetts Institute Of Technology System method, and product for information embedding using an ensemble of non-intersecting embedding generators
US6219634B1 (en) * 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
JP2003208187A (ja) * 2001-09-17 2003-07-25 Matsushita Electric Ind Co Ltd 情報更新装置、再生装置、情報付加装置、情報検出装置、情報除去装置
WO2004102464A2 (en) * 2003-05-08 2004-11-25 Digimarc Corporation Reversible watermarking and related applications
JP4556395B2 (ja) * 2003-08-28 2010-10-06 ソニー株式会社 コンテンツ識別方法及びコンテンツ識別システム
EP1756805B1 (en) * 2004-06-02 2008-07-30 Koninklijke Philips Electronics N.V. Method and apparatus for embedding auxiliary information in a media signal
KR100617165B1 (ko) * 2004-11-19 2006-08-31 엘지전자 주식회사 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법
CN101211562B (zh) * 2007-12-25 2011-01-05 宁波大学 一种数字音乐作品的无损数字水印嵌入与提取方法
CN101271690B (zh) * 2008-05-09 2010-12-22 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法
CN101894555A (zh) * 2010-04-09 2010-11-24 中山大学 一种mp3文件的水印保护方法
EP2544179A1 (en) * 2011-07-08 2013-01-09 Thomson Licensing Method and apparatus for quantisation index modulation for watermarking an input signal
CN102314881B (zh) * 2011-09-09 2013-01-02 北京航空航天大学 一种用于提高mp3文件中水印嵌入容量的mp3水印方法
GB2524784B (en) 2014-04-02 2018-01-03 Law Malcolm Transparent lossless audio watermarking

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066272A1 (en) * 2003-01-17 2004-08-05 Koninklijke Philips Electronics N.V. Reversible watermarking of digital signals
WO2013061062A2 (en) 2011-10-24 2013-05-02 Peter Graham Craven Lossless buried data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MICHAEL A. GERZON, et al. A high-rate buried-data channel for audio CD. Journal of the Audio Engineering Society, 1995.*

Also Published As

Publication number Publication date
CA2944625A1 (en) 2015-10-08
CN106415713A (zh) 2017-02-15
PL3127111T3 (pl) 2022-02-07
EP3127111A1 (en) 2017-02-08
EP3127111B1 (en) 2021-09-22
JP2017509927A (ja) 2017-04-06
WO2015150746A1 (en) 2015-10-08
GB2524784A (en) 2015-10-07
US9940940B2 (en) 2018-04-10
CN106415713B (zh) 2021-08-17
US20170116996A1 (en) 2017-04-27
GB201405958D0 (en) 2014-05-14
CA2944625C (en) 2022-10-18
JP6700506B2 (ja) 2020-05-27
GB2524784B (en) 2018-01-03
JP6700506B6 (ja) 2020-07-22
KR20160147794A (ko) 2016-12-23

Similar Documents

Publication Publication Date Title
KR102467628B1 (ko) 투명 무손실 오디오 워터마킹
JP6510541B2 (ja) 環境高次アンビソニックス係数の遷移
EP0900500B1 (en) Embedding supplemental data in an encoded signal
JP4673834B2 (ja) エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換
RU2745832C2 (ru) Эффективное кодирование звуковых сцен, содержащих звуковые объекты
TWI557724B (zh) 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
KR20030043622A (ko) 좌표 인터폴레이터의 키 및 키 값 데이터의 부호화/복호화장치, 및 좌표 인터폴레이터를 부호화한 비트스트림을기록한 기록 매체
JPH11511299A (ja) 波形データ用無損失符号化法
TW201543470A (zh) 具有動態範圍控制中有效增益編碼之音訊編碼器裝置及音訊解碼器裝置
US9870777B2 (en) Lossless embedded additional data
US20140214431A1 (en) Sample rate scalable lossless audio coding
KR20200007734A (ko) 3d 포인트 클라우드 데이터의 부호화/복호화 방법 및 장치
EP1692874A2 (en) Method and apparatus for encoding or decoding a bitstream
JP3948752B2 (ja) 複数情報信号符号化用符号化装置
CN108475510B (zh) 用于对音频信号进行无损水印处理的方法
CZ20011291A3 (cs) Vysílání digitálního informačního signálu s M bitovými PCM vzorky
CN100334640C (zh) 复制压缩数字数据的方法和设备
JP4629014B2 (ja) 位置インタポレータの符号化/複合化方法、及び装置
KR20000064612A (ko) 복수의 디지탈 정보신호를 데이터 압축 및 복원하는 장치 및 방법
JP2004180058A (ja) デジタルデータの符号化装置および符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant