KR101548846B1 - 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스 - Google Patents

워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스 Download PDF

Info

Publication number
KR101548846B1
KR101548846B1 KR1020137023578A KR20137023578A KR101548846B1 KR 101548846 B1 KR101548846 B1 KR 101548846B1 KR 1020137023578 A KR1020137023578 A KR 1020137023578A KR 20137023578 A KR20137023578 A KR 20137023578A KR 101548846 B1 KR101548846 B1 KR 101548846B1
Authority
KR
South Korea
Prior art keywords
signal
watermarked
tracks
determining
priority codebook
Prior art date
Application number
KR1020137023578A
Other languages
English (en)
Other versions
KR20130126700A (ko
Inventor
스테빤 피에르 빌레뜨
다니엘 제이 신더
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20130126700A publication Critical patent/KR20130126700A/ko
Application granted granted Critical
Publication of KR101548846B1 publication Critical patent/KR101548846B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

인코딩된 ACELP 오디오 신호 내에 적응적 워터마크 신호 삽입. 대수 코드북 트랙들, 장기 예측 기여에 따른 높은 우선 순위의 트랙들, 및 낮은 우선순위의 트랙들 중에서의 선택에 의해, 워터마크를 임베딩하기 위해 인코딩된 신호의 낮은 우선순위 부분이 결정된다. 워터마킹된 비트스트림의 디코딩.

Description

워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스{DEVICES FOR ADAPTIVELY ENCODING AND DECODING A WATERMARKED SIGNAL}
관련 출원들
본 출원은 2011 년 2 월 7 일에 출원된 미국 가출원 출원 번호 제 61/440,313 호 "ADAPTIVE WATERMARKING" 에 관한 것이고, 그 우선권을 주장한다.
기술분야
본 개시물은 일반적으로 전자 디바이스들에 관한 것이다. 좀더 구체적으로, 본 개시물은 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하기 위한 디바이스들에 관한 것이다.
지난 수십 년간, 전자 디바이스들의 이용이 흔해졌다. 특히, 전자 기술의 진보들은 점점 더 복잡하고 유용한 전자 디바이스들의 비용을 줄였다. 비용 감소 및 소비자 요구로 전자 디바이스들의 이용을 급증시켜, 전자 디바이스들은 현대 사회에서 사실상 어디에나 있다. 전자 디바이스들의 이용이 확대됨에 따라, 전자 디바이스들의 새롭고 개선된 특징들에 대한 요구도 확대되었다. 좀더 구체적으로, 보다 빠르거나, 보다 효율적이거나, 보다 높은 품질로 기능들을 수행하는 전자 디바이스들이 종종 수요가 많다.
일부 전자 디바이스들 (예를 들어, 셀룰러 폰들, 스마트 폰들, 컴퓨터들 등) 은 오디오 또는 음성 신호들을 이용한다. 이러한 전자 디바이스들은 저장 또는 송신을 위해 음성 신호들을 인코딩할 수도 있다. 예를 들어, 셀룰러 폰은 마이크를 이용하여 사용자의 목소리 또는 음성을 캡쳐한다. 예를 들어, 셀룰러 폰은 마이크를 이용하여 음향 신호를 전자 신호로 변환시킨다. 이러한 전자 신호는 그 다음에 다른 디바이스 (예를 들어, 셀룰러 폰, 스마트 폰, 컴퓨터 등) 로의 송신을 위해 또는 저장을 위해 포맷될 수도 있다.
통신된 신호에서의 개선된 품질 또는 추가적인 용량이 종종 강구된다. 예를 들어, 셀룰러 폰 사용자들은 통신된 음성 신호에서의 보다 좋은 품질을 원할 수도 있다. 그러나, 개선된 품질 또는 추가적인 용량은 보다 큰 대역폭 자원들 및/또는 새로운 네트워크 기반구조를 종종 요구한다. 이 논의로부터 알 수 있는 바와 같이, 효율적인 신호 통신을 허용하는 시스템들 및 방법들이 이로울 수도 있다.
워터마킹된 신호를 적응적으로 인코딩하도록 구성된 전자 디바이스가 개시된다. 전자 디바이스는 제 1 신호에 기초하여 워터마크 데이터를 결정하는 모델러 회로를 포함한다. 전자 디바이스는 또한 모델러 회로에 커플링된 코더 회로를 포함한다. 코더 회로는 제 2 신호의 낮은 우선순위 부분을 결정하고 제 2 신호의 낮은 우선순위 부분 내에 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성한다. 제 2 신호의 낮은 우선순위 부분은 제 2 신호의 다른 부분보다 지각적으로 덜 중요할 수도 있다. 제 1 신호는 상위 주파수 컴포넌트 신호일 수도 있고, 제 2 신호는 하위 주파수 컴포넌트 신호일 수도 있다. 모델러 회로 및 코더 회로는 오디오 코덱 내에 포함될 수도 있다.
제 2 신호의 낮은 우선순위 부분을 결정하는 것은 현재 프레임 및 과거 프레임에 기초할 수도 있다. 제 2 신호의 낮은 우선순위 부분을 결정하는 것은 제 2 신호에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것을 포함할 수도 있다. 제 2 신호의 낮은 우선순위 부분을 결정하는 것은 높은 우선순위 코드북 트랙들이 아니 하나 이상의 낮은 우선순위 코드북 트랙들을 지정하는 것을 더 포함할 수도 있다. 제 2 신호의 낮은 우선순위 부분 내에 워마크 데이터를 임베딩하는 것은 하나 이상의 낮은 우선순위 코드북 트랙들에 워터마크 데이터를 임베딩하는 것을 더 포함할 수도 있다.
하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 장기 예측 (long term prediction; LTP) 기여에 기초할 수도 있다. 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 메모리 제한된 장기 예측 (LTP) 기여에 기초할 수도 있다. 하나 이상의 높은 우선순위 코드북 트랙들은 피치를 표현하는데 이용될 수도 있다.
적응적으로 인코딩되고 워터마킹된 신호를 디코딩하기 위한 전자 디바이스가 또한 개시된다. 전자 디바이스는 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하는 부분 결정 회로를 포함한다. 전자 디바이스는 또한 부분 결정 회로에 커플링된 모델러 회로를 포함한다. 모델러 회로는 워터마킹된 비트스트림의 낮은 우선순위 부분으로부터 워터마크 데이터를 추출하고, 워터마크 데이터에 기초하여 제 1 신호를 획득한다. 전자 디바이스는 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하는 디코더 회로를 더 포함한다. 전자 디바이스는 또한 제 1 신호와 제 2 신호를 결합하는 결합 회로를 포함할 수도 있다. 부분 결정 회로, 모델러 회로, 및 디코더 회로는 오디오 코덱 내에 포함될 수도 있다. 워터마킹된 비트스트림의 낮은 우선순위 부분은 지각적으로 덜 중요한 정보를 포함할 수도 있다.
워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하는 것은 현재 프레임 및 과거 프레임에 기초할 수도 있다. 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하는 것은 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것에 기초할 수도 있다. 낮은 우선순위 부분은 하나 이상의 낮은 우선순위 코드북 트랙들을 포함할 수도 있다.
하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 장기 예측 (LTP) 기여에 기초할 수도 있다. 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 메모리 제한된 장기 예측 (LTP) 기여에 기초할 수도 있다.
전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법이 또한 개시된다. 방법은 제 1 신호 및 제 2 신호를 획득하는 단계를 포함한다. 방법은 또한 제 2 신호의 낮은 우선순위 부분을 결정하는 단계를 포함한다. 방법은 제 1 신호에 기초하여 워터마크 데이터를 결정하는 단계를 더 포함한다. 방법은 추가적으로 제 2 신호의 낮은 우선순위 부분 내에 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하는 단계를 포함한다.
전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법이 또한 개시된다. 방법은 신호를 수신하는 단계를 포함한다. 방법은 또한 신호에 기초하여 워터마킹된 비트스트림을 추출하는 단계를 포함한다. 방법은 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하는 단계를 더 포함한다. 방법은 추가적으로 워터마킹된 비트스트림의 낮은 우선순위 부분으로부터 워터마크 데이터를 추출하는 단계를 포함한다. 방법은 또한 워터마크 데이터에 기초하여 제 1 신호를 획득하는 단계를 포함한다. 또한, 방법은 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하는 단계를 포함한다.
워터마킹된 신호를 적응적으로 인코딩하기 위한 컴퓨터 프로그램 제품이 또한 개시된다. 컴퓨터 프로그램 제품은 명령들을 갖는 비일시적 유형의 컴퓨터 판독가능 매체를 포함한다. 명령들은 전자 디바이스로 하여금 제 1 신호 및 제 2 신호를 획득하도록 하기 위한 코드를 포함한다. 명령들은 또한 전자 디바이스로 하여금 제 2 신호의 낮은 우선순위 부분을 결정하도록 하기 위한 코드를 포함한다. 명령들은 전자 디바이스로 하여금 제 1 신호에 기초하여 워터마크 데이터를 결정하도록 하기 위한 코드를 더 포함한다. 명령들은 추가적으로 전자 디바이스로 하여금 제 2 신호의 낮은 우선순위 부분 내에 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하도록 하기 위한 코드를 포함한다.
적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하기 위한 컴퓨터 프로그램 제품이 또한 개시된다. 컴퓨터 프로그램 제품은 명령들을 갖는 비일시적 유형의 컴퓨터 판독가능 매체를 포함한다. 명령들은 전자 디바이스로 하여금 신호를 수신하도록 하기 위한 코드를 포함한다. 명령들은 또한 전자 디바이스로 하여금 신호에 기초하여 워터마킹된 비트스트림을 추출하도록 하기 위한 코드를 포함한다. 명령들은 전자 디바이스로 하여금 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하도록 하기 위한 코드를 더 포함한다. 명령들은 추가적으로 전자 디바이스로 하여금 워터마킹된 비트스트림의 낮은 우선순위 부분으로부터 워터마크 데이터를 추출하도록 하기 위한 코드를 포함한다. 명령들은 또한 전자 디바이스로 하여금 워터마크 데이터에 기초하여 제 1 신호를 획득하도록 하기 위한 코드를 포함한다. 또한, 명령들은 전자 디바이스로 하여금 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하도록 하기 위한 코드를 포함한다.
워터마킹된 신호를 적응적으로 인코딩하기 위한 장치가 또한 개시된다. 장치는 제 1 신호 및 제 2 신호를 획득하기 위한 수단을 포함한다. 장치는 또한 제 2 신호의 낮은 우선순위 부분을 결정하기 위한 수단을 포함한다. 장치는 제 1 신호에 기초하여 워터마크 데이터를 결정하기 위한 수단을 더 포함한다. 장치는 추가적으로 제 2 신호의 낮은 우선순위 부분에 워터마크 데이터를 임베딩하는 하여 워터마킹된 제 2 신호를 생성하기 위한 수단을 포함한다.
적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하기 위한 장치가 또한 개시된다. 장치는 신호를 수신하기 위한 수단을 포함한다. 장치는 또한 신호에 기초하여 워터마킹된 비트스트림을 추출하기 위한 수단을 포함한다. 장치는 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하기 위한 수단을 더 포함한다. 장치는 추가적으로 워터마킹된 비트스트림의 낮은 우선순위 부분으로부터 워터마크 데이터를 추출하기 위한 수단을 포함한다. 장치는 또한 워터마크 데이터에 기초하여 제 1 신호를 획득하기 위한 수단을 포함한다. 또한, 장치는 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하기 위한 수단을 포함한다.
도 1 은, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 방법들이 구현될 수도 있는, 전자 디바이스들의 일 구성을 도시하는 블록 다이어그램이며;
도 2 는 워터마킹된 신호를 적응적으로 인코딩하는 방법의 일 구성을 도시하는 플로우 다이어그램이며;
도 3 은 적응적으로 인코딩되고 워터마킹된 신호를 디코딩하는 방법의 일 구성을 도시하는 플로우 다이어그램이며;
도 4 는, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 방법들이 구현될 수도 있는, 무선 통신 디바이스들의 일 구성을 도시하는 블록 다이어그램이며;
도 5 는 본원에 개시된 시스템들 및 방법들에 따른 워터마킹 인코더의 일 예를 도시하는 블록 다이어그램이며;
도 6 은 본원에 개시된 시스템들 및 방법들에 따른 워터마킹 디코더의 일 예를 도시하는 블록 다이어그램이며;
도 7 은 본원에 개시된 시스템들 및 방법들에 따라 구현될 수도 있는 인코더 및 디코더의 예들을 도시하는 블록 다이어그램이며;
도 8 은, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 방법들이 구현될 수도 있는, 무선 통신 디바이스의 일 구성을 도시하는 블록 다이어그램이며;
도 9 는 전자 디바이스에서 이용될 수도 있는 다양한 컴포넌트들을 도시하고;
도 10 은 무선 통신 디바이스 내에 포함될 수도 있는 소정의 컴포넌트들을 도시한다.
본원에 개시된 시스템들 및 방법들은 다양한 전자 디바이스들에 적용될 수도 있다. 전자 디바이스들의 예들은 보이스 리코더들, 비디오 카메라들, 오디오 플레이어들 (예를 들어, MPEG-1 (Moving Picture Experts Group-1) 또는 MP3 (MPEG-2 Audio Layer 3) 플레이어들), 비디오 플레이어들, 오디오 리코더들, 데스크탑 컴퓨터들, 랩탑 컴퓨터들, 개인 휴대 정보 단말기 (personal digital assistant; PDA) 들, 게임 시스템들 등을 포함한다. 전자 디바이스의 한 종류는 다른 디바이스와 통신할 수도 있는 통신 디바이스이다. 통신 디바이스들의 예들은 전화들, 랩탑 컴퓨터들, 데스크탑 컴퓨터들, 셀룰러 폰들, 스마트폰들, 무선 또는 유선 모뎀들, e-리더들, 태블릿 디바이스들, 게임 시스템들, 셀룰러 폰 기지국들이나 노드들, 액세스 포인트들, 무선 게이트웨이들, 및 무선 라우터들을 포함한다.
전자 디바이스 또는 통신 디바이스는 ITU (International Telecommunication Union) 표준 및/또는 IEEE (Institute of Electrical and Electronics Engineers) 표준들 (예를 들어, 802.11a, 802.11b, 802.1lg, 802.11n 및/또는 802.1lac 와 같은 Wireless Fidelity 또는 "Wi-Fi" 표준들) 과 같은 소정의 산업 표준들에 따라 동작할 수도 있다. 통신 디바이스가 준수할 수도 있는 표준들의 다른 예들은 IEEE 802.16 (예를 들어, Worldwide Interoperability for Microwave Access 또는 "WiMAX"), 3GPP (Third Generation Partnership Project), 3GPP LTE (Long Term Evolution), GSM (Global System for Mobile Telecommunications) 및 다른 것들을 포함한다 (통신 디바이스는, 예를 들어, 사용자 장비 (User Equipment; UE), 노드 B, eNB (evolved Node B), 모바일 디바이스, 이동국, 가입자국, 원격국, 액세스 단말, 이동 단말, 단말, 사용자 단말, 가입자 유닛 등으로 지칭될 수도 있다). 본원에 개시된 시스템들 및 방법들 중 일부가 하나 이상의 표준들의 면에서 설명될 수도 있으나, 이는 본 개시물의 범위를 제한해서는 안되는데, 시스템 및 방법들이 많은 시스템 및/또는 표준들에 적용가능할 수도 있기 때문이다.
일부 통신 디바이스들은 무선으로 통신할 수도 있고/있거나 유선 접속 또는 링크를 이용하여 통신할 수도 있음에 유의해야 한다. 예를 들어, 일부 통신 디바이스들은 이더넷 (Ethernet) 프로토콜을 이용하여 다른 디바이스들과 통신할 수도 있다. 본원에 개시된 시스템들 및 방법들은 무선으로 통신하고/하거나 유선 접속이나 링크를 이용하여 통신하는 통신 디바이스들에 적용될 수도 있다. 일 구성에서, 본원에 개시된 시스템들 및 방법들은 위성을 이용하여 다른 디바이스와 통신하는 통신 디바이스에 적용될 수도 있다.
본원에서 사용되는 바와 같은, 용어 "커플" 은 직접적 접속 또는 간접적 접속을 뜻할 수도 있다. 예를 들어, 제 1 컴포넌트가 제 2 컴포넌트에 커플링되는 경우, 제 1 컴포넌트는 제 2 컴포넌트에 직접적으로 접속될 수도 있거나, (예를 들어, 제 3 컴포넌트를 통해) 제 2 컴포넌트에 간접적으로 접속될 수도 있다.
본원에 개시된 시스템들 및 방법들은 적응형 워터마킹 (watermarking) 을 설명한다. 예를 들어, 본원에 개시된 시스템들 및 방법들은 대수 코드 여기 선형 예측 (algebraic code excited linear prediction; ACELP) 코덱들에 대한 적응적 워터마킹에 이용될 수도 있다.
음성 코덱 비트스트림들에서의 워터마킹 또는 데이터 숨김은 네트워크 기반구조 (infrastructure) 에 대한 변화들이 없이 대역 내 (in-band) 추가 데이터의 송신을 허용한다. 이는 새로운 코덱을 위한 새로운 기반구조를 배치하는 높은 비용들을 초래하지 않으면서 다양한 응용들 (예를 들어, 인증, 데이터 숨김 등) 에 이용될 수 있다. 본원에 개시된 시스템들 및 방법들의 일 가능한 응용은 대역폭 확장으로, 고품질 대역폭 확장을 위한 정보를 포함하는 숨겨진 비트들에 대한 반송파로서 하나의 코덱의 스트림 (예를 들어, 배포된 코덱) 이 이용된다. 반송파 비트스트림 및 숨겨진 비트들을 디코딩하는 것은 반송파 코덱의 대역폭보다 큰 대역폭의 합성을 허용한다 (예를 들어, 네트워크 기반구조를 변경하지 않으면서 보다 넓은 대역폭이 달성될 수도 있다).
예를 들어, 음성의 0 킬로헤르츠 (kilohertz; kHz) - 4 킬로헤르츠 저대역 부분을 인코딩하는데 표준 협대역 코덱이 이용될 수 있으며, 반면 4 kHz - 7 kHz 고대역 부분은 별도로 인코딩된다. 고대역에 대한 비트들은 협대역 음성 비스트림 내에 숨겨질 수도 있다. 이러한 경우에, 레거시 (legacy) 협대역 비트스트림을 이용함에도 불구하고 수신기에서 광대역이 디코딩될 수도 있다. 다른 예에서, 음성의 0 kHz - 7 kHz 저대역 부분을 인코딩하는데 표준 광대역 코덱이 이용될 수도 있으며, 반면 7 kHz - 14 kHz 고대역 부분은 별도로 인코딩되어 광대역 비트스트림 내에 숨겨진다. 이러한 경우에, 레거시 광대역 비트스트림을 이용함에도 불구하고 수신기에서 초광대역 (super-wideband) 이 디코딩될 수도 있다.
현재 공지의 워터마킹 기법들은 고정 코드북 (fixed codebook; FCB) 트랙당 고정된 개수의 비트들을 숨김으로써 대수 코드 여기 선형 예측 (ACELP) 코더의 고정 코드북 (FCB) (예를 들어, 적응형 다중 레이트 협대역 (adaptive multi-rate narrowband) 또는 AMR-NB) 에 비트들을 숨길 수도 있다. 허용된 펄스 조합들의 개수를 한정함으로써 비트들이 숨겨진다. AMR-NB 의 경우에, 트랙당 2 개의 펄스들이 있으며, 일 접근법은 펄스 포지션들을 제약하여 주어진 트랙에서의 2 개의 펄스 포지션들의 배타적 논리합 (exclusive OR; XOR) 이 송신할 워터마크와 동일하게 되도록 하는 것을 포함한다. 트랙당 1 또는 2 비트가 이러한 방식으로 송신될 수도 있다.
실제로, 이는 메인 피치 펄스 (main pitch pulse) 들을 상당히 변경할 수도 있기 때문에 상당한 왜곡을 추가할 수도 있다. 이는 특히 대역폭 확장 응용들에 대해 해로울 수도 있으며, 여기서, 저대역 저하가 또한 고대역에서의 저하를 야기할 수도 있기 때문에, 고대역 여기를 생성하는데 저대역 여기가 이용된다.
이는, AMR-NB 또는 적응형 다중 레이트 광대역 (AMR-WB) 과 같은 반송파 코덱의 상부의, 강화된 가변 레이트 광대역 코덱 (enhanced variable rate wideband codec; EVRC-WB) 비선형 확장 고대역 모델과 같은 저대역 잔여분을 확장하는 고대역 모델들을 이용하는 경우이다.
본원에 개시된 시스템들 및 방법들에서, 워터마크가 적응적으로 이루어진다. 펄스 트랙당 고정된 개수의 비트들 (예를 들어, 1 또는 2) 을 임베딩하는 (embedding) 대신에, 어느 트랙들이 지각적으로 가장 중요한지를 결정하는 것이 시도될 수도 있다. 이는, 예를 들어, 인코더 및 디코더 양자 모두에 이미 존재하는 정보를 이용하여 행해질 수도 있어, 어느 트랙들이 지각적으로 가장 중요한지를 나타내는 정보가 추가적으로 또는 별도로 송신될 필요가 없다. 일 구성에서, 워터마크로부터 가장 중요한 트랙들을 보호하는데 장기 예측 (long term prediction; LTP) 기여가 이용될 수도 있다. 예를 들어, LTP 기여는 보통 메인 피치 펄스에서 명확한 피크들을 보이고, 인코더 및 디코더 양자 모두에서 이미 이용가능할 수도 있다.
본원에 개시된 시스템들 및 방법들의 일부 구성들에서, AMR-NB 12.2 가 이용될 수도 있다. 다른 레이트들의 AMR-NB 는 유사하거나 유사하지 않은 구성을 가질 수도 있다. AMR-NB 12.2 에서, 40 샘플 서브프레임당 8 개의 포지션들의 5 개의 트랙들이 있다. 일 예에서, LTP 기여의 가장 높은 절대 값들에 대응하는 2 개의 트랙들이 중요하게 여겨질 수도 있고 (또는 "높은 우선순위" 트랙들로 지정될 수도 있고) 워터마킹되지 않는다. 다른 3 개의 트랙들은 덜 중요할 가능성이 있고 (그리고, 예를 들어, "낮은 우선순위" 트랙들로 지정되거나 지칭될 가능성이 있고), 워터마크를 수신할 수도 있다. 따라서, 3 개의 잔여 트랙들이 각각 2 비트로 워터마킹되는 경우, 이는 메인 피치 펄스에 대해 감소된 (예를 들어, 최소) 영향을 갖는 워터마크로 반송되는 전체 1.2 초당 킬로비트 (kilobits per second; kbps) 에 있어서, 5 밀리초 (millisecond; ms) 서브프레임당 6 비트 워터마크를 초래한다.
본원에 개시된 시스템들 및 방법들에 의해 제공된 일 개선안은 LTP 기여를 메모리 제한된 (memory-limited) LTP 기여로 대체하는 단계를 포함할 수도 있는데, LTP 신호가 에러들 및 패킷 손실들에 민감하고 에러들이 무한정 전파될 수도 있기 때문이다. 이는 인코더 및 디코더가 삭제 또는 비트 에러들 이후에 긴 기간들 동안 동기가 맞지 않게 (out of sync) 되는 것을 초래할 수도 있다. 대신에, LTP 의 메모리 제한된 버전은 오직 양자화된 피치 값들 및 마지막 N 프레임들과 현재 프레임의 펄스의 코드북 기여들에만 기초하여 구성될 수도 있다. 이득들은 일치하도록 설정될 수도 있다. 예를 들어, N = 2 이면, 성능이 원래의 LTP 기여로 획득된 것과 동일하며, 반면 에러들 하에서의 성능이 크게 개선되었음을 알게 됐다. 원래의 LTP 가 저대역 코딩에 이용될 수도 있음에 유의해야 한다. 일부 구성들에서, 오직 워터마킹을 위해 트랙들의 우선순위를 결정하는데 메모리 제한된 LTP 가 단독으로 이용될 수도 있다.
음성 특성들에 워너마크를 적응시키는 것은 지각적으로 덜 중요한 곳에 워터마크를 숨김으로써 보다 나은 음성 품질을 허용할 수도 있다. 특히, 피치 펄스를 보존하는 것은 음성 품질에 긍정적인 영향을 줄 수도 있다. ACELP 에 대한 다른 문서화된 워터마킹 기법들은 이러한 사안을 다루지 않는다. 본원에서 설명된 시스템들 및 방법들이 이용되지 않는 경우, 예를 들어, 동일한 비트 레이트에서 워터마크의 품질 영향은 더욱 심각할 수도 있다.
일부 구성들에서, 본원에 개시된 시스템들 및 방법들은 협대역 AMR 12.2 (여기서 12.2 는 12.2 초당 킬로비트 (kbps) 의 비트 레이트를 지칭할 수도 있다) 의 역방향 상호동작가능 버전인 코덱을 제공하는데 이용될 수도 있다. 편의를 위해, 이러한 코덱은 본원에서 "eAMR" 이라고 지칭될 수도 있으나, 코덱은 상이한 용어를 이용하여 지칭될 수도 있다. eAMR 은 협대역 비트 스트림 내에 숨겨진 광대역 정보의 "얇은" 층을 전송하는 능력을 가질 수도 있다. 이는 블라인드 대역폭 확장이 아니라 진정한 (ture) 광대역 인코딩을 제공할 수도 있다. eAMR 은 워터마킹 (예를 들어, 스테가노그래피 (steganography)) 기술을 이용할 수도 있고, 대역 외 시그널링을 요구하지 않을 수도 있다. 이용된 워터마크는 (레거시 상호동작에 있어서) 협대역 품질에 무시해도 될 정도의 영향을 줄 수도 있다. 워터마크로 인해, 예를 들어, AMR 12.2 와 비교하여 협대역 품질이 약간 저하될 수도 있다. 일부 구성들에서, 인코더는 (예를 들어, 리턴 채널에서 워터마크를 검출하지 않는 것을 통해) 원격의 레거시를 검출하고, 워터마크를 추가하는 것을 중지하여, 레거시 AMR 12.2 동작으로 돌아간다.
eAMR 과 적응형 다중 레이트 광대역 (AMR-WB) 간의 비교가 이후에서 주어진다. eAMR 은 블라인드 대역폭 확장이 아니라 진정한 광대역 품질을 제공할 수도 있다. eAMR 은 12.2 초당 킬로비트 (kbps) 의 비트 레이트를 이용할 수도 있다. 일부 구성들에서, eAMR 은 (예를 들어, 광대역 음향들을 갖는) 새로운 휴대용전화기 (handset) 들을 요구할 수도 있다. eAMR 은 기존의 GSM 무선 액세스 네트워크 (GSM Radio Access Network; GRAN) 및/또는 범용 지상 무선 액세스 네트워크 (Universal Terrestrial Radio Access Network; UTRAN) 기반구조에 투명할 수도 있다 (따라서, 예를 들어, 네트워크 비용에 영향을 주지 않는다. 코어 네트워크에서 임의의 소프트웨어 업그레이드 없이 eAMR 이 2G 및 3G 네트워크들 상에 배치될 수도 있다. eAMR 은 광대역 품질을 위해 네트워크의 탠덤 프리/트랜스코더 프리 동작 (tandem-free/transcoder-free operation; TFO/TrFO) 을 요구할 수도 있다. eAMR 은 TFO/TrFO 에서의 변화들에 자동적으로 적응할 수도 있다. 일부 경우들에서, 일부 TrFO 네트워크들은 고정 코드북 (FCB) 이득 비트들을 조작할 수도 있음에 유의해야 한다. 그러나, 이는 eAMR 동작에 영향을 미칠 수도 있거나 미치지 않을 수도 있다.
eAMR 은 다음과 같이 AMR-WB 와 비교될 수도 있다. AMR-WB 는 진정한 광대역 품질을 제공할 수도 있다. AMR-WB 는 12.65 kbps 의 비트 레이트를 이용할 수도 있다. AMR-WB 는 (예를 들어, 광대역 음향들을 갖는) 새로운 휴대용핸드폰들 및 기반구조 수정들을 요구할 수도 있다. AMR-WB 는 새로운 무선 액세스 베어러 (Radio Access Bearer; RAB) 및 연관된 배치 비용들을 요구할 수도 있다. AMR-WB 를 구현하는 것은 레거시 2G 네트워크에서는 상당한 사안일 수도 있고 전반적인 이동전화 교환국 (mobile switching center; MSC) 재구축을 요구할 수도 있다. AMR-WB 는 광대역 품질을 위해 TFO/TrFO 을 요구할 수도 있다. TFO/TrFO 에서의 변화들이 AMR-WB 에 있어 잠재적인 문제일 수도 있음에 유의해야 한다.
AMR 12.2 ACELP 고정 코드북의 일 예에 대한 보다 세부사항이 이후에서 주어진다. 코드북 여기는 펄스들로 이루어지고, 효율적인 계산들을 허용한다. 강화된 풀 레이트 (Enhanced Full Rate; EFR) 에서, (예를 들어, 160 샘플들의) 각각의 20 밀리초 (ms) 프레임은 40 샘플들의 4×5 ms 프레임들로 분할된다. 40 샘플들의 각각의 서브프레임은 트랙당 8 개의 포지션들을 갖는 5 개의 인터리브된 (interleaved) 트랙들로 분할된다. 2 개의 펄스들 및 하나의 부호 비트가 트랙당 이용될 수도 있으며, 여기서 펄스들의 순서가 제 2 부호를 결정한다. 스태킹 (stacking) 이 허용될 수도 있다. 서브프레임당 (2*3+l)*5 = 35 비트가 이용될 수도 있다. ACELP 고정 코드북에 따라 이용될 수도 있는 트랙들, 펄스들, 진폭들, 및 포지션들의 일 예가 표 1 에서 주어진다.
트랙 펄스들 진폭들 포지션들
1 0, 5 ± 1, ± 1 0, 5, 10, 15, 20, 25, 30, 35
2 1, 6 ± 1, ± 1 1, 6, 11, 16, 21, 26, 31, 36
3 2, 7 ± 1, ± 1 2, 7, 12, 17, 22, 27, 32, 37
4 3, 8 ± 1, ± 1 3, 8, 14, 18, 23, 28, 33, 38
5 4, 9 ± 1, ± 1 4, 9, 15, 19, 24, 29, 34, 39
워터마킹 기법의 일 예가 다음과 같이 주어진다. 허용된 펄스 조합들을 제한함으로써 고정 코드북 (FCB) 에 워터마크가 추가될 수도 있다. AMR 12.2 FCB 내의 워터마킹은 다음과 같이 일 구성에서 성취될 수도 있다. 각각의 트랙에서, (pos0^posl) & 001 = 1 워터마킹된 비트에서, 여기서 연산자 "^" 는 배타적 논리합 (XOR) 연산을 지칭하며, "&" 은 논리적 AND 연산을 지칭하고, posO 및 posl 은 인덱스들을 지칭한다. 기본적으로, 2 개의 인덱스들 (posO 및 posl) 의 마지막 비트의 XOR 은 송신될 정보의 선택된 비트 (예를 들어, 워터마크) 와 동일하도록 제약될 수도 있다. 이는 트랙당 1 비트 (예를 들어, 서브프레임당 5 비트) 를 초래하여 20 비트/프레임 = 1 kbps 를 제공한다. 대안으로, (pos0^posl) & 011 = 2 워터마킹된 비트에서는, 2 kbps 를 야기한다. 예를 들어, 인덱스들의 2 개의 최하위 비트 (least significant bit; LSB) 의 XOR 은 송신될 2 비트 정보가 되도록 제약될 수도 있다. AMR FCB 검색에서의 검색들을 제한함으로써 워터마킹이 추가될 수도 있다. 예를 들어, 정확한 워터마크로 디코딩할 펄스 포지션들에 걸쳐 검색이 수행될 수도 있다. 이러한 접근법은 낮은 복잡도를 제공할 수도 있다. 이러한 접근법에서, 그러나, 메인 피치 펄스는 상당히 영향을 받을 수도 있다 (예를 들어, 워터마킹이 펄스 스태킹을 방지할 수도 있다).
본원에 개시된 시스템들 및 방법들에 따라, 가장 영향을 가진 트랙들이 식별되어 워터마킹되지 않을 수도 있다. 일 접근법에서, 2 개의 중요한 (예를 들어, "높은 우선순위") 트랙들 및 3 개의 덜 중요한 (예를 들어, "낮은 우선순위") 트랙들을 식별하는데 장기 예측 (LTP) 기여가 이용될 수도 있다. 이러한 접근법을 이용하는 것은 2*0 비트 + 3*2 비트 = 6 비트/(5 ms 서브프레임) = 1.2 kbps 를 허용할 수도 있다. 그러나, 이러한 접근법은 인코더 및 디코더에서의 동일한 LTP 기여를 요구할 수도 있다. 비트 에러율 (Bit Error Rate; BER) 또는 프레임 에러율 (Frame Error Rate; FER) 및 불연속 송신 (Discontinuous Transmission; DTX) 은 다수의 프레임들에 걸쳐 미스매치를 야기할 수도 있다. 좀더 구체적으로, BER 및 FER 은 미스매치를 야기할 수도 있다. 이론상, DTX 는 그렇지 않을 것인데, 인코더 및 디코더 양자 모두가 동시에 DTX 를 알아차릴 것이기 때문이다. 그러나, DTX 가 매우 때때로 그러한 미스매치들을 야기할 수도 있다는 것은 AMR-NB/강화된 풀 레이트 (EFR) 코덱들의 하나의 특이한 점이다.
다른 접근법에서, 제한된 메모리 LTP 가 이용될 수도 있다. 이러한 접근법에서, LTP 기여는 여기 및 피치 지연들의 오직 M 개의 과거 프레임들만을 이용하여 재계산될 수도 있다. 이는 M 개의 프레임들 이후로의 에러 전파를 없앨 수 있다. 일 구성에서, M = 2 는 훌륭한 펄스 식별을 제공할 수도 있고, DTX 및 FER 로 적절히 수행한다. 저대역으로부터의 좋지 않은 프레임 표시 (bad frame indication; BFI) 가 고대역에 제공되는 경우 단일 프레임 손실은 고대역에 있어서 잠재적으로 3 개의 프레임들이 손실되었음을 암시할 수도 있음에 유의해야 한다. 좀더 구체적으로, 좋지 않은 프레임 표시 (BFI) 는 채널 디코더가 음성 디코더에 제공하는 플래그로서, 프레임을 제대로 디코딩하는데 실패한 경우를 나타낸다. 디코더는 그러면 수신된 데이터를 무시하고 에러 은닉을 수행할 수도 있다. 예를 들어, 단일 프레임 손실은 M+1 프레임들로 하여금 부정확한 제한되 메모리 LTP 를 갖도록 할 수도 있다. 따라서, BFI 가 코덱에 대해 수신될 때마다, 데이터의 다음 M+1 프레임들이 무효하고 이용되어서는 안된다고 고대역 디코더에 나타내어질 수도 있다. 에러 은닉이 그러면 고대역 상에서 수행될 수도 있다 (예를 들어, 디코딩된 값들을 이용하기 보다는, 과거로부터 적합한 파라미터들이 결정될 수도 있다).
비록 본원에서 예로서 12.2 kbps 비트 레이트가 주어졌으나, 개시된 시스템들 및 방법들에는 eAMR 의 다른 레이트가 적용될 수도 있음에 유의해야 한다. 예를 들어, eAMR 의 일 동작점은 12.2 kbps 이다. 본원에 개시된 시스템들 및 방법들의 일 구성에서, 좋지 않은 채널 및/또는 좋지 않은 네트워크 조건들에 보다 낮은 레이트들이 이용될 (예를 들어, 보다 낮은 레이트들로 스위칭될) 수도 있다. 따라서, (예를 들어, 협대역과 광대역 사이의) 대역폭 스위칭이 난제일 수도 있다. 광대역 음성은, 예를 들어, eAMR 의 보다 낮은 레이트들로 유지될 수도 있다. 각각의 레이트는 워터마킹 기법을 이용할 수도 있다. 예를 들어, 10.2 kbps 레이트에 이용되는 워터마킹 기법은 12.2 kbps 레이트에 이용되는 기법과 유사할 수도 있다. 제한된 메모리 LTP 기법이 다른 레이트들에 이용될 수 있다. 표 2 는 상이한 레이트들에 대한 프레임당 비트 할당들의 예들을 도시한다. 좀더 구체적으로, 표 2 는 선 스펙트럼 주파수 (Line Spectral Frequency; LSF) 들, 이득 형상, 이득 프레임, 및 순환 중복 검사 (Cyclic Redundancy Check; CRC) 와 같은 상이한 유형의 정보를 통신하기 위해 할당될 수도 있는 프레임당 비트들의 수를 도시한다.
Figure 112013081478422-pct00001
본원에 개시된 시스템들 및 방법들의 일 구성은 데이터를 임베딩하기 위해 워터마킹 기법들을 이용하여 코드 여기 선형 예측 (CELP) 음성 코더들의 확장에 이용될 수도 있다. 음성의 광대역 (예를 들어, 0 킬로헤르츠 (kHz) - 7 킬로헤르츠 (kHz)) 코딩은 음성의 협대역 (예를 들어, 0 kHz - 4 kHz) 코딩보다 우수한 품질을 제공한다. 그러나, 기존의 모바일 통신 네트워크들의 대부분은 오직 협대역 코딩 (예를 들어, 적응형 다중 레이트 협대역 (AMR-NB)) 만을 지원한다. 광대역 코더들 (예를 들어, 적응형 다중 레이트 광대역 (AMR-WB)) 을 배치하는 것은 기반구조 및 서비스 배치에 상당히 비용이 많이 드는 변화들을 요구할 수도 있다.
또한, 서비스들의 다음 세대가 광대역 코더들 (예를 들어, AMR-WB) 을 지원할 수도 있으며, 반면 초광대역 (예를 들어, 0 kHz -14 kHz) 코더들이 개발되어 표준화된다. 다시, 오퍼레이터들은 소비자들을 초광대역으로 이동시키기 위해 또 다른 코덱을 배포하는 비용들에 결국 직면할 수도 있다.
본원에 개시된 시스템들 및 방법들의 일 구성은 추가적인 대역폭을 매우 효율적으로 인코딩하여 기존의 네트워크 기반구조에 의해 이미 지원되는 비트스트림 내에 이러한 정보를 숨길 수 있는 고급 모델을 이용할 수도 있다. 정보 숨김은 비트스트림을 워터마킹함으로써 수행될 수도 있다. 이러한 기법의 일 예는 CELP 코더의 고정 코드북을 워터마킹한다. 예를 들어, 입력된 광대역 상위 대역 (예를 들어, 4 kHz - 7 kHz) 이 인코딩되어 협대역 코더의 비트스트림 내의 워터마크로서 반송될 수도 있다. 다른 예에서, 초광대역의 입력된 상위 대역 (예를 들어, 7 kHz - 14 kHz) 이 인코딩되어 광대역 코더의 비트스트림 내의 워터마크로서 반송될 수도 있다. 아마도 대역폭 확장과 관련이 없는 다른 부차적인 비트스트림들이 또한 반송될 수도 있다. 이러한 기법은 인코더가 기존의 기반구조들과 호환가능한 비트스트림을 생성하는 것을 허용한다. 레거시 디코더는 (예를 들어, 워터마크가 없는) 표준 인코딩된 음성과 유사한 품질을 갖는 협대역 출력을 생성할 수도 있으며, 반면 워터마크를 알아차린 디코더는 광대역 음성을 생성할 수도 있다.
이제, 도면들을 참조하여 다양한 구성들이 설명되는데, 여기서 유사한 요소 명칭들은 기능적으로 유사한 요소들을 나타낼 수도 있다. 본원의 도면들에서 일반적으로 설명되고 도시된 바와 같은 시스템들 및 방법들은 매우 다양한 상이한 구성들로 배열되고 설계될 수 있다. 따라서, 도면들에서 표현된 바와 같은, 여러 구성들에 대한 다음의 좀더 상세한 설명은 청구된 바와 같은 범위를 제한하려는 의도가 아니라, 단지 그 시스템들 및 방법들을 대표하는 것이다.
도 1 은 전자 디바이스들 (102, 134) 의 일 구성을 도시하는 블록 다이어그램으로서, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 방법들이 구현될 수도 있다. 전다 디바이스 A (102) 및 전자 디바이스 B (134) 의 예들은 무선 통신 디바이스들 (예를 들어, 셀룰러 폰들, 스마트 폰들, 개인 휴대 정보 단말기 (PDA) 들, 랩탑 컴퓨터들, e-리더들 등) 및 다른 디바이스들을 포함할 수도 있다.
전자 디바이스 A (102) 는 인코더 블록/모듈 (110) 및/또는 통신 인터페이스 (124) 를 포함할 수도 있다. 인코더 블록/모듈 (110) 은 신호를 인코딩하고 워터마킹하는데 이용될 수도 있다. 통신 인터페이스 (124) 는 다른 디바이스 (예를 들어, 전자 디바이스 B (134)) 에 하나 이상의 신호들을 송신할 수도 있다.
전자 디바이스 A (102) 는 오디오 또는 음성 신호들과 같은 하나 이상의 신호들 A (104) 를 획득할 수도 있다. 예를 들어, 전자 디바이스 A (102) 는 마이크를 이용하여 신호 A (104) 를 캡쳐할 수도 있거나, 다른 디바이스 (예를 들어, 블루투스 (Bluetooth) 헤드셋) 로부터 신호 A (104) 를 수신할 수도 있다. 일부 구성들에서, 신호 A (104) 는 상이한 컴포넌트 신호들 (예를 들어, 상위 주파수 컴포넌트 신호와 하위 주파수 컴포넌트 신호, 모노포닉 (monophonic) 신호와 스테레오 신호 등) 로 나누어질 수도 있다. 다른 구성들에서, 관련 없는 신호들 A (104) 가 획득될 수도 있다. 신호(들) A (104) 는 인코더 (110) 내의 모델러 회로 (112) 및 코더 회로 (118) 에 제공될 수도 있다. 예를 들어, 제 1 신호 (106) (예를 들어, 신호 컴포넌트) 는 모델러 회로 (112) 에 제공될 수도 있으며, 반면 제 2 신호 (108) (예를 들어, 다른 신호 컴포넌트) 는 코더 회로 (118) 에 제공된다.
전자 디바이스 A (102) 에 포함된 요소들 중 하나 이상은 하드웨어, 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음에 유의해야 한다. 예를 들어, 본원에서 사용된 바와 같은 용어 "회로" 는 요소들이, 프로세싱 블록들 및/또는 메모리 셀들을 포함하여, 하나 이상의 회로 컴포넌트들 (예를 들어, 트랜지스터들, 저항기들, 레지스터들, 인덕터들, 커패시터들 등) 을 이용해 구현될 수도 있음을 나타낼 수도 있다. 따라서, 전자 디바이스 A (102) 에 포함된 요소들 중 하나 이상은 하나 이상의 집적 회로들, 주문형 집적 회로 (application specific integrated circuit; ASIC) 들 등으로, 그리고/또는 프로세서 및 명령들을 이용하여 구현될 수도 있다. 용어 "블록/모듈" 은 요소가 하드웨어, 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음을 나타내는데 이용될 수도 있음에 또한 유의해야 한다.
코더 회로 (118) 는 제 2 신호 (108) 에 대한 코딩을 수행할 수도 있다. 예를 들어, 코더 회로 (118) 는 제 2 신호 (108) 에 대해 적응형 다중 레이트 (AMR) 코딩을 수행할 수도 있다. 예를 들어, 코더 회로 (118) 는 워터마크 데이터 (116) 가 임베딩될 수도 있는 코딩된 비트스트림을 생성할 수도 있다. 모델러 회로 (112) 는 제 2 신호 (108) (예를 들어, "반송파" 신호) 에 임베딩될 수도 있는 제 1 신호 (106) 에 기초하여 워터마크 데이터 (116) (예를 들어, 파라미터들, 비트들 등) 를 결정할 수도 있다. 예를 들어, 모델러 회로 (112) 는 제 1 신호 (106) 를 코딩된 비트스트림 내에 임베딩될 수 있는 워터마크 데이터 (116) 내에 별도로 인코딩할 수도 있다. 또 다른 예에서, 모델러 회로 (112) 는 (수정 없이) 제 1 신호 (106) 로부터의 비트들을 워터마크 데이터 (116) 로서 코더 회로 (118) 에 제공할 수도 있다. 다른 예에서, 모델러 회로 (112) 는 파라미터들 (예를 들어, 고대역 비트들) 을 워터마크 데이터 (116) 로서 코더 회로 (118) 에 제공할 수도 있다. 임베딩된 워터마크 신호를 갖는 코딩된 제 2 신호 (108) 는 워터마킹된 제 2 신호 (122) 로 지칭될 수도 있다.
코더 회로 (118) 는 제 2 신호 (108) 를 코딩 (예를 들어, 인코딩) 할 수도 있다. 일부 구성들에서, 이러한 코딩은 데이터 (114) 를 생성할 수도 있으며, 데이터 (114) 는 모델러 회로 (112) 에 제공될 수도 있다. 일 구성에서, 모델러 회로 (112) 는 EVRC-WB 모델을 이용하여 코더 회로 (118) 에 의해 인코딩될 수도 있는 (제 2 신호 (108) 로부터의) 하위 주파수 컴포넌트들에 의존하는, (제 1 신호 (106) 로부터의) 상위 주파수 컴포넌트들을 모델링할 수도 있다. 따라서, 상위 주파수 컴포넌트들을 모델링할 시에 이용하기 위해 모델러 회로 (112) 에 데이터 (114) 가 제공될 수도 있다. 결과로 초래된 상위 주파수 컴포넌트 워터마크 데이터 (116) 가 그 다음에 코더 회로 (118) 에 의해 제 2 신호 (108) 내에 임베딩됨으로써, 워터마킹된 제 2 신호 (122) 를 생성할 수도 있다.
코더 회로 (118) 는 적응형 워터마킹 블록/모듈 (120) 을 포함할 수도 있다. 적응형 워터마킹 블록/모듈 (120) 은 제 2 신호 (108) 의 낮은 우선순위 부분을 결정하여 제 2 신호 (108) 의 낮은 우선순위 부분 내에 워터마크 데이터 (116) 를 임베딩할 수도 있다. 코더 회로 (118) 의 일 예는 대수 코드 여기 선형 예측 (ACELP) 코더이다. 이러한 예에서, 코더 회로 (118) 는 코드북 (예를 들어, 고정 코드북 (FCB)) 를 이용하여 제 2 신호 (108) 를 인코딩할 수도 있다. 코드북은 인코딩 프로세스에서 다수의 트랙들을 이용할 수도 있다. 예를 들어, AMR-NB 코딩은 40 샘플 서브프레임에 대해 8 개의 포지션들의 5 개의 트랙들을 이용한다. 적응형 워터마킹 블록/모듈 (120) 은 제 2 신호 (108) 를 이용하여 하나 이상의 높은 우선순위 트랙들을 결정할 수도 있다. 예를 들어, 높은 우선순위 트랙들은 피치 펄스가 표현되는 트랙들일 수도 있다. 일 구성에서, 적응형 워터마킹 블록/모듈 (120) 은 장기 예측 (LTP) 필터 (또는 피치 필터) 기여에 기초하여 이러한 결정을 할 수도 있다. 예를 들어, 적응형 워터마킹 블록/모듈 (120) 은 LTP 필터 출력을 조사하여 지정된 개수의 트랙들에 대한 가장 큰 LTP 기여를 결정할 수도 있다. 예를 들어, 각각의 트랙에 대해 가장 큰 최대치를 취하는, LTP 필터 출력에서 가장 큰 에너지가 발견될 수도 있다. 일 구성에서, 가장 큰 LTP 기여를 갖는 2 개의 블록들이 "높은 우선순위 트랙들" 또는 중요한 트랙들로 지정될 수도 있다. 하나 이상의 잔여 트랙들은 "낮은 우선순위 트랙들" 또는 덜 중요한 트랙들로 지정될 수도 있다.
모든 트랙들이 음성 품질에 동일한 영향을 주는 것이 아니기 때문에 이러한 접근법이 이용될 수도 있다. 예를 들어, 메인 피치 펄스를 제대로 표현하는 것이 음성 코딩에서 중요할 수도 있다. 이에 따라, 서브프레임에 피치 펄스가 있는 경우, 본원에 개시된 시스템들 및 방법들은 그것이 잘 표현되는 것을 보장할 수도 있다. 워터마킹이 노이즈를 추가하는 것과 유사하게, 시스템에 추가 제약을 가할 수도 있기 때문에 이러한 결과가 나온다. 다시 말해, 피치 펄스가 표현되는 포지션들 (예를 들어, 트랙들) 에 노이즈가 추가되는 경우, 품질이 저하될 수도 있다. 따라서, 본원에 개시된 시스템들 및 방법들은 피치 파라미터들의 과거 히스토리에 기초하여 피치 펄스 위치들이 있을 곳을 결정하려고 시도할 수도 있다. 이는 피치 포지션들이 있을 곳을 추정함으로써 행해진다. 그러면, 그에 대응하는 트랙들에는 워터마크 데이터 (116) 가 임베딩되지 않을 수도 있다. 그러나, 보다 많은 워터마킹 데이터 (116) 가 다른 "낮은 우선순위" 트랙들에 놓일 수도 있다.
일단 높은 우선순위 및 낮은 우선순위 트랙들이 결정되거나 추정되면, 코더 회로 (118) 는 모델러 회로 (112) 로부터의 워터마크 데이터 (116) 를 낮은 우선순위 트랙(들) 에 임베딩할 수도 있다. 따라서, 예를 들어, 코더 회로 (118) 는 피치를 표현하는데 이용되는 트랙 내에 워터마크 데이터를 임베딩하는 것을 피할 수도 있다. 결과로 초래된 신호 (예를 들어, 임베딩된 워터마크 데이터를 갖는 "반송파" 신호) 는 워터마킹된 제 2 신호 (122) (예를 들어, 비트스트림) 로 지칭될 수도 있다.
워터마킹 프로세스가 인코딩된 제 2 신호 (108) 의 비트들 중 일부를 변경할 수도 있음에 유의해야 한다. 예를 들어, 제 2 신호 (108) 는 "반송파" 신호 또는 비트스트림으로 지칭될 수도 있다. 워터마킹 프로세스에서, 인코딩된 제 2 신호 (108) 를 이루는 비트들 중 일부는 제 1 신호 (106) 로부터 도출된 워터마크 데이터 (116) 를 제 2 신호 (108) 내에 임베딩하거나 삽입하도록 변경되어 워터마킹된 제 2 신호 (122) 를 생성할 수도 있다. 일부 경우들에서, 이는 인코딩된 제 2 신호 (108) 에서의 열화의 원인일 수도 있다. 그러나, 워터마킹된 정보를 추출하도록 설계되지 않은 디코더들이, 제 1 신호 (106) 에 의해 제공된 추가 정보 없이, 제 2 신호 (108) 의 일 버전을 여전히 복원할 수도 있기 때문에, 이러한 접근법은 이로울 수도 있다. 따라서, "레거시" 디바이스들 및 기반구조들은 워터마킹과 상관없이 여전히 기능할 수도 있다. 이러한 접근법은 또한 (워터마킹된 정보를 추출하도록 지정된) 다른 디코더들이 제 1 신호 (106) 에 의해 제공된 추가적인 워터마크 정보를 추출하는데 이용되는 것을 허용한다.
워터마킹된 제 2 신호 (122) (예를 들어, 비트스트림) 는 통신 인터페이스 (124) 에 제공될 수도 있다. 통신 인터페이스 (124) 의 예들은 트랜시버 (transceiver) 들, 네트워크 카드들, 무선 모뎀들 등을 포함할 수도 있다. 통신 인터페이스 (124) 는 네트워크 (128) 를 통해 전자 디바이스 B (134) 와 같은 다른 디바이스에 워터마킹된 제 2 신호 (122) 를 통신하는데 (예를 들어, 송신하는데) 이용될 수도 있다. 예를 들어, 통신 인터페이스 (124) 는 유선 및/또는 무선 기술에 기초할 수도 있다. 통신 인터페이스 (124) 에 의해 수행되는 일부 동작들은 변조, 포맷팅 (예를 들어, 패키징, 인터리빙, 스크램블링 등), 상향변환 (upconversion), 증폭 등을 포함할 수도 있다. 따라서, 전자 디바이스 A (102) 는 워터마킹된 제 2 신호 (122) 를 포함하는 신호 (126) 를 송신할 수도 있다.
(워터마킹된 제 2 신호 (122) 를 포함하는) 신호 (126) 는 하나 이상의 네트워크 디바이스들 (130) 에 전송될 수도 있다. 예를 들어, 네트워크 (128) 는 디바이스들 사이에 (예를 들어, 전자 디바이스 A (102) 와 전자 디바이스 B (134) 사이에) 신호들을 통신하기 위한 하나 이상의 네트워크 디바이스들 (130), 및/또는 송신 매체들을 포함할 수도 있다. 도 1 에 도시된 구성에서, 네트워크 (128) 는 하나 이상의 네트워크 디바이스들 (130) 을 포함한다. 네트워크 디바이스들 (130) 의 예들은 기지국들, 라우터들, 서버들, 브리지들, 게이트웨이들 등을 포함한다.
일부 경우들에서, 하나 이상의 네트워크 디바이스들 (130) 은 (워터마킹된 제 2 신호 (122) 를 포함하는) 신호 (126) 를 트랜스코딩할 수도 있다. 트랜스코딩은 송신된 신호 (126) 를 디코딩하고 그것을 (예를 들어, 다른 포맷으로) 재인코딩하는 것을 포함할 수도 있다. 일부 경우들에서, 신호 (126) 를 트랜스코딩하는 것은 신호 (126) 내에 임베딩된 워터마크 정보를 훼손할 수도 있다. 그러한 경우에, 전자 디바이스 B (134) 는 워터마크 정보를 더 이상 포함하지 않는 신호를 수신할 수도 있다. 다른 네트워크 디바이스들 (130) 은 임의의 트랜스코딩을 이용하지 않을 수도 있다. 예를 들어, 네트워크 (128) 가 신호들을 트랜스코딩하지 않는 디바이스들을 이용하는 경우, 네트워크 (128) 는 탠덤 프리/트랜스코더 프리 동작 (TFO/TrFO) 을 제공할 수도 있다. 이러한 경우에, 워터마킹된 제 2 신호 (122) 내에 임베딩된 워터마크 정보는 다른 디바이스 (예를 들어, 전자 디바이스 B (134)) 에 전송되기 때문에 보존될 수도 있다.
전자 디바이스 B (134) 는 보존된 워터마크 정보를 갖는 신호 (132) 또는 워터마크 정보가 없는 신호 (132) 와 같은 신호 (132) 를 (네트워크 (128) 를 통해) 수신할 수도 있다. 예를 들어, 전자 디바이스 B (134) 는 통신 인터페이스 (136) 를 이용하여 신호 (132) 를 수신할 수도 있다. 통신 인터페이스 (136) 의 예들은 트랜시버들, 네트워크 카드들, 무선 모뎀들 등을 포함할 수도 있다. 통신 인터페이스 (136) 는 신호 (132) 에 대해 하향변환, 동기화, 디포맷팅 (예를 들어, 디패키징, 언스크램블링, 디인터리빙 등), 및/또는 채널 디코딩과 같은 동작들을 수행하여 수신된 비트스트림 (138) 을 추출할 수도 있다. (워터마킹된 비트스트림일 수도 있고 그렇지 않을 수도 있는) 수신된 비트스트림 (138) 은 디코더 블록/모듈 (140) 에 제공될 수도 있다. 예를 들어, 수신된 비트스트림 (138) 은 모델러 회로 (142) 및 디코더 회로 (150) 에 제공될 수도 있다.
디코더 블록/모듈 (140) 은 모델러 회로 (142), 부분 결정 회로 (152), 및/또는 디코더 회로 (150) 를 포함할 수도 있다. 디코더 블록/모듈 (140) 은 결합 회로 (146) 를 선택적으로 포함할 수도 있다. 부분 결정 회로 (152) 는 워터마크 데이터가 임베딩될 수도 있는 수신된 비트스트림 (138) 의 (낮은 우선순위) 부분을 나타내는 부분 정보 (144) 를 결정할 수도 있다. 예를 들어, 디코더 회로 (150) 는 부분 결정 회로 (152) 가 수신된 비트스트림 (138) 내에서의 워터마크 데이터의 위치를 결정하는데 이용할 수도 있는 정보 (148) 를 제공할 수도 있다. 일 구성에서, 디코더 회로 (150) 는, 부분 결정 회로 (152) 가 워터마크 데이터가 임베딩될 수도 있는 하나 이상의 트랙들을 결정하거나 추정하는 것을 허용할 수도 있는, 장기 예측 (LTP) 필터 또는 피치 필터로부터의 정보 (148) 를 제공한다. 이러한 결정은 인코더 (110) 에 의해 수행되는 낮은 우선순위 트랙 결정과 유사하게 이루어질 수도 있다. 예를 들어, 부분 결정 회로 (152) 는 가장 큰 LTP 기여를 갖는 트랙들을 결정할 수도 있다. 다수의 트랙들 (예를 들어, 2 개) 이 높은 우선순위 트랙들로 결정될 (예를 들어, 지정될) 수도 있으며, 반면 다른 트랙들은 낮은 우선순위 트랙들로 결정될 (예를 들어, 지정될) 수도 있다. 일 구성에서, 낮은 우선순위 트랙들의 표시가 부분 정보 (144) 로서 모델러 회로 (142) 에 제공될 수도 있다.
부분 정보 (144) 는 모델러 회로 (142) 에 제공될 수도 있다. 워터마킹된 정보가 수신된 비트스트림 (138) 내에 임베딩되어 있는 경우, 모델러 회로 (142) 는 부분 정보 (144) (예를 들어, 낮은 우선순위 트랙 표시) 를 이용하여 수신된 비트스트림 (138) 으로부터 워터마크 데이터를 추출, 모델링, 및/또는 디코딩할 수도 있다. 예를 들어, 모델러 회로 (142) 는 수신된 비트스트림 (138) 으로부터 워터마크 데이터를 추출, 모델링, 및/또는 디코딩하여 디코딩된 제 1 신호 (154) 를 생성할 수도 있다.
디코더 회로 (150) 는 수신된 비트스트림 (138) 을 디코딩할 수도 있다. 일부 구성들에서, 디코더 회로 (150) 는 "레거시" 디코더 (예를 들어, 표준 협대역 디코더), 또는 수신된 비트스트림 (138) 내에 포함될 수도 있는 임의의 워터마크 정보와 상관없이 수신된 비트스트림 (138) 을 디코딩하는 디코딩 절차를 이용할 수도 있다. 디코더 회로 (150) 는 디코딩된 제 2 신호 (158) 를 생성할 수도 있다. 따라서, 예를 들어, 수신된 비트스트림 (138) 내에 워터마크 정보가 포함되어 있지 않은 경우, 디코더 회로 (150) 는 디코딩된 제 2 신호 (158) 인, 제 2 신호 (108) 의 일 버전을 여전히 복원할 수도 있다.
일부 구성들에서, 모델러 회로 (142) 에 의해 수행되는 동작들은 디코더 회로 (150) 에 의해 수행되는 동작들에 의존할 수도 있다. 예를 들어, 상위 주파수 대역에 대해 이용되는 모델 (예를 들어, EVRC-WB) 은 디코딩된 협대역 신호 (예를 들어, AMR-NB 를 이용하여 디코딩된, 디코딩된 제 2 신호 (158)) 에 의존할 수도 있다. 이러한 경우에, 디코딩된 제 2 신호 (158) 가 모델러 회로 (142) 에 제공될 수도 있다.
일부 구성들에서, 디코딩된 제 2 신호 (158) 는 결합 회로 (146) 에 의해 디코딩된 제 1 신호 (154) 와 결합함으로써 결합된 신호 (156) 를 생성할 수도 있다. 다른 구성들에서, 수신된 비트스트림 (138) 으로부터의 워터마크 데이터 및 수신된 비트스트림 (138) 이 별도로 디코딩되어 디코딩된 제 1 신호 (154) 및 디코딩된 제 2 신호 (158) 를 생성할 수도 있다. 따라서, 하나 이상의 신호들 B (160) 는 디코딩된 제 1 신호 (154) 및 별도의 디코딩된 제 2 신호 (158) 를 포함할 수도 있고/있거나 결합된 신호 (156) 를 포함할 수도 있다. 디코딩된 제 1 신호 (154) 는 전자 디바이스 A (102) 에 의해 인코딩된 제 1 신호 (106) 의 디코딩된 버전일 수도 있음에 유의해야 한다. 추가적으로 또는 대안으로, 디코딩된 제 2 신호 (158) 는 전자 디바이스 A (102) 에 의해 인코딩된 제 2 신호 (108) 의 디코딩된 버전일 수도 있다.
워터마킹된 정보가 수신된 신호 (132) 내에 임베딩되어 있지 않은 경우, 디코더 회로 (150) 는 (예를 들어, 레거시 모드에서) 수신된 비트스트림 (138) 을 디코딩하여 디코딩된 제 2 신호 (158) 를 생성할 수도 있다. 이는 제 1 신호 (106) 에 의해 제공되는 추가적인 정보 없이 디코딩된 제 2 신호 (158) 를 제공할 수도 있다. 이는, 예를 들어, (예를 들어, 제 1 신호 (106) 로부터의) 워터마크 정보가 네트워크 (128) 에서의 트랜스코딩 동작에서 훼손되는 경우 일어날 수도 있다.
일부 구성들에서, 전자 디바이스 B (134) 는 수신된 비트스트림 (138) 내에 임베딩된 워터마크 데이터를 디코딩할 수 없을 수도 있다. 예를 들어, 전자 디바이스 B (134) 는 일부 구성들에서 임베딩된 워터마크 데이터를 추출하기 위한 모델러 회로 (142) 를 포함하지 않을 수도 있다. 이러한 경우에, 전자 디바이스 B (134) 는 단순히 수신된 비트스트림 (138) 을 디코딩하여 디코딩된 제 2 신호 (158) 를 생성할 수도 있다.
전자 디바이스 B (134) 에 포함된 요소들 중 하나 이상은 하드웨어 (예를 들어, 회로), 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음에 유의해야 한다. 예를 들어, 전자 디바이스 B (134) 에 포함된 요소들 중 하나 이상은 하나 이상의 집적 회로들, 주문형 집적 회로 (ASIC) 들 등으로, 그리고/또는 프로세서 및 명령들을 이용하여 구현될 수도 있다.
일부 구성들에서, 전자 디바이스 (예를 들어, 전자 디바이스 A (102), 전자 디바이스 B (134) 등) 는 적응적으로 인코딩되고 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하기 위한 인코더 및 디코더 양자 모두를 포함할 수도 있다. 예를 들어, 전자 디바이스 A (102) 는 인코더 (110), 및 전자 디바이스 B (134) 내에 포함된 디코더 (140) 와 유사한 디코더 양자 모두를 포함할 수도 있다. 일부 구성들에서, 인코더 (110) 및 전자 디바이스 B (134) 내에 포함된 디코더 (140) 와 유사한 디코더 양자 모두는 코덱 내에 포함될 수도 있다. 따라서, 단일 전자 디바이스는 적응적으로 인코딩되고 워터마킹된 신호들을 생성하는 것, 및 적응적으로 인코딩되고 워터마킹된 신호들을 디코딩하는 것 양자 모두를 하도록 구성될 수도 있다.
일부 구성들 및/또는 예시들에서, 워터마킹된 제 2 신호 (122) 가 반드시 다른 전자 디바이스에 송신될 필요가 없을 수도 있음에 유의해야 한다. 예를 들어, 전자 디바이스 A (102) 는 대신에 추후 액세스 (예를 들어, 디코딩, 재생 등) 를 위해 워터마킹된 신호 (122) 를 저장할 수도 있다.
도 2 는 워터마킹된 신호를 적응적으로 인코딩하는 방법 (200) 의 일 구성을 도시하는 플로우 다이어그램이다. 전자 디바이스 (102) (예를 들어, 무선 통신 디바이스) 는 제 1 신호 (106) 및 제 2 신호 (108) 를 획득할 수도 있다 (202). 예를 들어, 전자 디바이스 (102) 는 하나 이상의 신호들 (104) 을 캡쳐하거나 수신할 수도 있다. 일 구성에서, 전자 디바이스 (102) 는 신호 (104) 를 제 1 신호 (106) 및 제 2 신호 (108) 로 선택적으로 나눌 수도 있다. 이는, 예를 들어, 높은 음성 신호의 높은 주파수 컴포넌트 및 낮은 주파수 컴포넌트가 워터마킹된 신호로서 인코딩될 경우, 이는 분석 필터 뱅크를 이용하여 이루어질 수도 있다. 이러한 경우에, 하위 컴포넌트들 (예를 들어, 제 2 신호 (108)) 은 종래대로 인코딩되고, 상위 컴포넌트들 (예를 들어, 제 1 신호 (106)) 은 종래대로 인코딩된 신호에 워터마크로서 임베딩될 수도 있다. 다른 구성들에서, 전자 디바이스 (102) 는 단순히 "반송파" 신호 (예를 들어, 제 2 신호 (108)) 내에 임베딩될 별도의 신호 또는 임베딩될 정보의 부분을 가질 수도 있다. 예를 들어, 전자 디바이스 (102) 는 제 1 신호 (106) 및 제 2 신호 (108) 를 획득할 수도 있는데 (202), 여기서 제 1 신호 (106) 는 워터마크 데이터 (116) 로서 제 2 신호 (108) 내에 임베딩될 것이다.
전자 디바이스 (102) 는 제 2 신호 (108) 의 낮은 우선순위 부분을 결정할 수도 있다 (204). 예를 들어, 전자 디바이스 (102) 는 제 2 신호 (108) 의 다른 부분보다 지각적으로 덜 중요한, 제 2 신호 (108) 의 낮은 우선순위 부분을 결정할 수도 있다. 제 2 신호 (108) 의 낮은 우선순위 부분 또는 지각적으로 덜 중요한 부분은 예를 들어, 피치 정보를 표현하는데 이용되지 않는 부분일 수도 있다.
일 구성에서, 전자 디바이스 (102) 는 제 2 신호 (108) 의 높은 우선순위 부분을 결정할 수도 있다. 이는 제 2 신호 (108) 의 낮은 우선순위 부분을 결정하기 위해 (204) 행해질 수도 있다. 제 2 신호 (108) 의 높은 우선순위 부분은 피치 정보를 표현하는데 이용되는 부분일 수도 있다.
일 접근법에서, 제 2 신호 (108) 의 높은 우선순위 부분은 다른 코드북 트랙들보다 큰 장기 예측 (LTP) 기여를 갖는 하나 이상의 코드북 트랙들에 의해 나타내어질 수도 있다. 전자 디바이스 (102) 는 제 2 신호 (108) 에 대해 선형 예측 코딩 (linear predictive coding; LPC) 및 장기 예측 (LTP) 동작들 (예를 들어, 피치 필터링) 을 수행하여, 코드북 트랙들의 각각에 대한 LTP 기여를 획득할 수도 있다. 전자 디바이스 (102) 는 보다 큰 또는 가장 큰 LTP 기여를 갖는 하나 이상의 트랙들을 결정할 수도 있다. 예를 들어, 전자 디바이스 (102) 는 다수의 트랙들 (예를 들어, 5 개) 중에서 하나 이상 (예를 들어, 2 개) 의 트랙들을 잔여 (예를 들어, 3 개) 트랙들보다 큰 LTP 기여들을 갖는 높은 우선순위 트랙들로 지정할 수도 있다. 잔여 트랙들 (예를 들어, 3 개의 트랙들) 중 하나 이상은 낮은 우선순위 (예를 들어, 덜 중요한) 트랙들로 지정될 수도 있다. 보다 큰 LTP 기여는 피치 펄스가 높은 우선순위 트랙들에 표현됨을 나타낼 수도 있다.
일 구성에서, 제 2 신호 (108) 의 낮은 우선순위 부분을 결정하는 것 (204) 은 현재 신호 및/또는 과거 신호 (예를 들어, 현재 프레임 및/또는 과거 프레임) 에 기초할 수도 있다. 예를 들어, 전자 디바이스 (102) 는 제 2 신호 (108) 의 현재 프레임 및 제 2 신호 (108) 의 하나 이상의 과거 프레임들에 기초하여 제 2 신호 (108) 의 낮은 우선순위 부분을 결정할 수도 있다 (204). 예를 들어, LTP 동작은 현재 프레임 및 하나 이상의 과거 프레임들을 이용하여 수행될 수도 있다.
일부 구성들에서, 메모리 제한된 LTP 구성이 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는데 이용될 수도 있다. 다시 말해, LTP 기여는 메모리 제한된 LTP 기여에 의해 대체될 수도 있다. LTP 의 제한된 메모리 버전은 오직 마지막 N 프레임들과 현재 프레임의 양자화된 피치 값들 및 코드북 기여들에만 기초하여 구성될 수도 있다. 이득들은 일치하도록 설정될 수도 있다. 예를 들어, N = 2 이면, 에러들 하에서의 인코더 성능이 크게 개선될 수도 있다. (에러들의 무한한 전파 시간을 가지기 때문에) 실제 또는 보통의 LTP 신호는 채널 에러들에 매우 민감할 수도 있으므로 메모리 제한된 LTP 기여가 이용될 수도 있다. 따라서, 소정의 개수의 프레임들 후에 메모리를 비움으로써 (zeroing out) 수정된 또는 메모리 제한된 LPC 가 이용될 수도 있다.
전자 디바이스 (102) 는 제 1 신호 (106) 에 기초하여 워터마크 데이터 (116) 를 결정할 수도 있다 (206). 일 예에서, 제 1 신호 (106) 로부터의 하나 이상의 수정되지 않은 비트들이 워터마크 데이터 (116) 로 지정될 (예를 들어, 결정될 (206)) 수도 있다. 다른 예에서, 전자 디바이스 (102) 는 제 1 신호 (106) 를 인코딩하거나 모델링하여 워터마크 데이터 (116) (예를 들어, 비트들) 를 생성할 수도 있다. 예를 들어, 제 1 신호 (106) 가 인코딩되어 워터마크 데이터 (116) 를 생성할 수도 있다. 일반적으로, 워터마크 데이터 (116) 는 제 2 신호 (108) (예를 들어, 인코딩된 제 2 신호 (108)) 에 임베딩될 정보 또는 신호일 수도 있다. 일부 구성들에서, 워터마크 데이터 (116) 는 코더 회로 (118) 로부터의 데이터 (114) 에 기초하여 결정될 수도 있다. 이는, 예를 들어, 코딩된 하위 주파수 컴포넌트에 기초하여 모델링될 상위 주파수 컴포넌트 (예를 들어, 제 2 신호 (108) 에 기초하여 결정된 데이터 (114)) 를 제 1 신호 (106) 가 포함하는 경우일 수도 있다.
전자 디바이스 (102) 는 워터마크 데이터 (116) 를 제 2 신호 (108) 의 낮은 우선순위 부분 내에 임베딩하여 워터마킹된 제 2 신호 (122) 를 생성할 수도 있다 (208). 예를 들어, 전자 디바이스 (102) 는 낮은 우선순위 코드북 트랙들인 (제 2 신호 (108) 를 인코딩하는데 이용되는) 하나 이상의 코드북 트랙들에 워터마크 데이터 (116) 를 임베딩할 수도 있다 (208). 예를 들어, 낮은 우선순위 트랙들에 허용된 펄스 조합들의 개수를 한정함으로써 워터마크 비트들이 임베딩될 수도 있다. 트랙당 2 개의 펄스들이 있는 AMR-NB 의 경우에, 예를 들어, 낮은 우선순위 트랙에서의 2 개의 펄스 포지션들의 배타적 논리합 (XOR) 이 송신될 워터마크와 같도록 펄스 포지션들이 제약될 수도 있다.
일부 구성들에서, 워터마크의 사이즈는 또한 높은 우선순위 및/또는 낮은 우선순위 트랙들의 결정에 기초하여 달라질 수도 있다. 예를 들어, 워터마크는 높은 우선순위 트랙들의 개수 및 워터마킹을 위한 트랙 용량에 따라 낮은 우선순위 트랙들에서 보다 클 수도 있다. 예를 들어, 트랙이 2 비트의 워터마킹 용량을 가지고 3 개의 낮은 우선순위 트랙들이 이용가능한 경우, 6 워터마크 비트가 낮은 우선순위 트랙들에 걸쳐 공평하게 분배될 수도 있다. 그러나, 4 개의 낮은 우선순위 트랙들이 이용가능한 경우, 보다 큰 수의 워터마크 비트가 가장 낮은 우선순위 트랙들 내에 임베딩될 수도 있다. 예를 들어, 2 개의 가장 낮은 LTP 기여 낮은 우선순위 트랙들의 각각에 2 워터마킹 비트가 임베딩될 수도 있으며, 반면 1 비트 각각이 다른 2 개의 낮은 우선순위 트랙들에 임베딩될 수도 있다. 추가적으로 또는 대안으로, 워터마킹되도록 허용된 비트들의 개수는 이용가능한 낮은 우선순위 트랙들의 개수 및 이들의 워터마킹 용량에 의존할 수도 있다. 유사한 기법들이 디코더에서 이용되어 다양한 워터마킹 사이즈들을 추출할 수도 있다.
전자 디바이스 (102) 는 워터마킹된 제 2 신호 (122) 에 기초하여 신호를 전송할 수도 있다 (210). 예를 들어, 전자 디바이스 (102) 는 네트워크 (128) 를 통해 다른 디바이스 (134) 에 워터마킹된 제 2 신호 (122) 를 포함하는 신호를 송신할 수도 있다.
도 3 은 적응적으로 인코딩되고 워터마킹된 신호를 디코딩하는 방법 (300) 의 일 구성을 도시하는 플로우 다이어그램이다. 전자 디바이스 (134) 는 신호 (132) 를 수신할 수도 있다 (302). 신호 (132) 는, 예를 들어, 워터마킹된된 제 2 신호 (122) 를 포함할 수도 있다. 일부 구성들에서, 전자 디바이스 (134) 는 무선 및/또는 유선 접속을 이용하여 전자기 신호를 수신할 수도 있다 (302).
전자 디바이스 (134) 는 신호 (132) 에 기초하여 워터마킹된 비트스트림 (예를 들어, 수신된 비트스트림 (138)) 을 추출할 수도 있다 (304). 예를 들어, 전자 디바이스 (134) 는 신호 (132) 를 햐항변환, 복조, 증폭, 동기화, 디포맷팅, 및/또는 채널 디코딩하여 워터마킹된 비트스트림 (예를 들어, 수신된 비트스트림 (138)) 을 획득할 수도 있다.
전자 디바이스 (134) 는 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정할 수도 있다 (306). 예를 들어, 낮은 우선순위 부분은 워터마킹된 비트스트림의 다른 부분보다 지각적으로 덜 중요한 정보를 포함하는 워터마킹된 비트스트림의 부분일 수도 있다. 예를 들어, 낮은 우선순위 부분은 피치를 표현하는 정보를 포함하지 않을 수도 있다. 이러한 결정 (306) 은 현재 프레임 및/또는 과거 프레임에 기초할 수도 있다. 일 구성에서, 이러한 낮은 우선순위 부분은 높은 우선순위 코드북 트랙들을 포함하지 않는다. 예를 들어, 전자 디바이스 (134) 는 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정할 수도 있다. 낮은 우선순위 부분을 결정하는 것 (306) 은 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것에 기초할 수도 있다. 예를 들어, 낮은 우선순위 부분은 높은 우선순위 코드북 트랙들이 아닌 하나 이상의 코드북 트랙들로 결정되거나 (306) 지정될 수도 있다. 일 구성에서, 전자 디바이스 (134) 는 LTP 또는 피치 필터 출력을 획득할 수도 있다. 전자 디바이스 (134) 는 LTP 또는 피치 필터 출력을 조사하여 보다 큰 또는 가장 큰 LTP 기여를 갖는 하나 이상의 코드북 트랙들을 결정할 수도 있다. 일 구성에서, 전자 디바이스 (134) 는 높은 우선순위 코드북 트랙들이 될 가장 큰 LTP 기여를 갖는 2 개의 트랙들을 결정할 수도 있으며, 반면 잔여 (예를 들어, 3 개) 코드북 트랙들은 낮은 우선순위 코드북 트랙들로 여겨질 수도 있다.
일부 구성들에서, 메모리 제한된 LTP 구성이 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는데 이용될 수도 있다. 다시 말해, 메모리 제한된 LTP 구성이 LTP 기여 대신에 대안으로 이용될 수도 있다. LTP 의 제한된 메모리 버전은 오직 마지막 N 프레임들과 현재 프레임의 양자화된 피치 값들 및 코드북 기여들에만 기초하여 구성될 수도 있다. 이득들은 일치하도록 설정될 수도 있다. 예를 들어, N = 2 이면, 에러들 하에서의 성능이 크게 개선될 수도 있다. (에러들의 무한한 전파 시간을 가지기 때문에) 실제 또는 보통의 LTP 신호는 채널 에러들에 매우 민감할 수도 있으므로 메모리 제한된 LTP 기여가 대안으로 이용될 수도 있다. 따라서, 소정의 개수의 프레임들 후에 메모리를 비움으로써 수정된 또는 메모리 제한된 LPC 가 이용될 수도 있다. 워터마킹된 비트스트림의 낮은 우선순위 부분을 결정하는 것 (306) 은 일부 구성들에서 도 2 와 관련하여 설명된 바와 같은 제 2 신호의 낮은 우선순위 부분을 결정하는 것 (204) 과 유사하게 달성될 수도 있음에 유의해야 한다.
전자 디바이스 (134) 는 워터마킹된 비트스트림 (예를 들어, 수신된 비트스트림 (138)) 의 낮은 우선순위 부분으로부터 워터마크 데이터를 추출할 수도 있다 (308). 일 구성에서, 전자 디바이스 (134) 는 하나 이상의 높은 우선순위 코드북 트랙들에 기초하여 워터마킹된 비트스트림으로부터 워터마크 데이터를 추출할 수도 있다 (308). 예를 들어, 전자 디바이스 (134) 는 오직 높은 우선순위 코드북 트랙들이 아닌 (그러나, 예를 들어, 낮은 우선순위 코드북 트랙들인) 코드북 트랙들로부터만 워터마크 데이터를 추출할 수도 있다.
전자 디바이스 (134) 는 워터마크 데이터에 기초하여 제 1 신호 (예를 들어, 디코딩된 제 1 신호 (154)) 를 획득할 수도 있다 (310). 일 구성에서, 예를 들어, 전자 디바이스 (134) 는 EVRC-WB 모델을 이용하여 워터마크 데이터를 모델링하여 제 1 신호 (예를 들어, 고대역 데이터) 를 획득할 수도 있다. 추가적으로 또는 대안으로, 전자 디바이스 (134) 는 워터마크 데이터를 디코딩함으로써 제 1 신호를 획득할 수도 있다 (310). 대안으로, 제 1 신호는 워터마크 데이터를 포함할 수도 있다. 일부 구성들에서, 전자 디바이스 (134) 는 제 2 신호 (예를 들에, 디코딩된 제 2 신호 (158)) 에 기초하여 제 1 신호를 획득할 수도 있다 (310). 예를 들어, 상위 주파수 대역에 이용되는 모델 (예를 들어, EVRC-WB) 은 (예를 들어, AMR-NB 를 이용하여 디코딩된) 디코딩된 제 2 신호 (158) 에 의존할 수도 있다. 이러한 경우에, 전자 디바이스 (134) 는 디코딩된 제 2 신호 (158) 를 이용하여 워터마크 데이터를 모델링하거나 디코딩해 제 1 신호 (예를 들어, 디코딩된 제 1 신호 (154)) 를 획득할 수도 있다 (310).
전자 디바이스 (134) 는 워터마킹된 비트스트림을 디코딩하여 제 2 신호 (예를 들어, 디코딩된 제 2 신호 (158)) 를 획득할 수도 있다 (312). 예를 들어, 전자 디바이스 (134) 는 디코더 (예를 들어, 디코더 회로 (150)) 를 이용해 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득할 수도 있다 (312). 일 구성에서, 전자 디바이스 (134) 는 종래의 (예를 들어, "레거시") AMR-NB 디코더를 이용해 제 2 신호 (예를 들어, 협대역 데이터) 를 획득할 수도 있다. 상술된 바와 같이, 제 2 신호 (예를 들어, 디코딩된 제 2 신호 (158)) 는 일부 구성들에서 제 1 신호 (예를 들어, 디코딩된 제 1 신호 (154)) 를 획득하는데 (310) 이용될 수도 있다.
일부 구성들에서, 전자 디바이스 (134) 는 선택적으로 제 1 신호 (예를 들어, 디코딩된 제 1 신호 (154)) 와 제 2 신호 (예를 들어, 디코딩된 제 2 신호 (158)) 를 결합하여 결합된 신호 (156) 를 획득할 수도 있다 (314). 예를 들어, 전자 디바이스 (134) 는 합성 필터 뱅크를 이용하여 고대역 데이터를 포함하는 제 1 신호와, 저대역 또는 협대역 데이터를 포함하는 제 2 신호를 결합할 수도 있다. 다른 구성들에서, 전자 디바이스 (134) 는 제 1 신호와 제 2 신호를 결합하지 않을 수도 있다.
도 4 는 무선 통신 디바이스들 (402, 434) 의 일 구성을 도시하는 블록 다이어그램으로서, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 들이 구현될 수도 있다. 무선 통신 디바이스 A (402) 및 무선 통신 디바이스 B (434) 의 예들은 셀룰러 폰들, 스마트 폰들, 개인 휴대 정보 단말기 (PDA) 들, 랩탑 컴퓨터들, e-리더들 등을 포함할 수도 있다.
무선 통신 디바이스 A (402) 는 마이크 (462), 오디오 인코더 (410), 채널 인코더 (466), 변조기 (468), 송신기 (472), 및 하나 이상의 안테나들 (474a-474n) 을 포함할 수도 있다. 오디오 인코더 (410) 는 오디오를 인코딩하고 워터마킹하는데 이용될 수도 있다. 채널 인코더 (466), 변조기 (468), 송신기 (472), 및 하나 이상의 안테나들 (474a-474n) 은 하나 이상의 신호들을 준비하여 다른 디바이스 (예를 들어, 무선 통신 디바이스 B (434)) 에 송신하는데 이용될 수도 있다.
무선 통신 디바이스 A (402) 는 오디오 신호 (404) 를 획득할 수도 있다. 예를 들어, 무선 통신 디바이스 A (402) 는 마이크 (462) 를 이용해 오디오 신호 (404) (예를 들어, 음성) 를 캡쳐할 수도 있다. 마이크 (462) 는 음향 신호 (예를 들어, 사운드들, 음성 등) 를 전기 또는 전자 오디오 신호 (404) 로 변환시킬 수도 있다. 오디오 신호 (404) 는 오디오 인코더 (410) 에 제공될 수도 있으며, 오디오 인코더 (410) 는 분석 필터 뱅크 (464), 고대역 모델링 블록/모듈 (412), 및 워터마킹을 갖는 코딩 블록/모듈 (418) 을 포함할 수도 있다.
오디오 신호 (404) 가 분석 필터 뱅크 (464) 에 제공될 수도 있다. 분석 필터 뱅크 (464) 는 오디오 신호 (404) 를 제 1 신호 (406) 및 제 2 신호 (408) 로 나눌 수도 있다. 예를 들어, 제 1 신호 (406) 는 상위 주파수 컴포넌트 신호일 수도 있고, 제 2 신호 (408) 는 하위 주파수 컴포넌트 신호일 수도 있다. 제 1 신호 (406) 는 고대역 모델링 블록/모듈 (412) 에 제공될 수도 있다. 제 2 신호 (408) 는 워터마킹을 갖는 코딩 블록/모듈 (418) 에 제공될 수도 있다.
무선 통신 디바이스 A (402) 에 포함된 요소들 (예를 들어, 마이크 (462), 오디오 인코더 (410), 채널 인코더 (466), 변조기 (468), 송신기 (472) 등) 중 하나 이상은 하드웨어, 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음에 유의해야 한다. 예를 들어, 무선 통신 디바이스 A (402) 에 포함된 요소들 중 하나 이상은 하나 이상의 집적 회로들, 주문형 집적 회로 (ASIC) 들 등으로, 그리고/또는 프로세서 및 명령들을 이용하여 구현될 수도 있다. 용어 "블록/모듈" 은 또한 요소가 하드웨어, 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음을 나타내는데 이용될 수도 있음에 또한 유의해야 한다.
워터마킹을 갖는 코딩 블록/모듈 (418) 은 제 2 신호 (408) 에 대해 코딩을 수행할 수도 있다. 예를 들어, 워터마킹을 갖는 코딩 블록/모듈 (418) 은 제 2 신호 (408) 에 대해 적응형 다중 레이트 (AMR) 코딩을 수행할 수도 있다. 고대역 모델링 블록/모듈 (412) 은 제 2 신호 (예를 들어, "반송파" 신호) (408) 내에 임베딩될 수도 있는 워터마크 데이터 (416) 를 결정할 수도 있다. 예를 들어, 워터마킹을 갖는 코딩 블록/모듈 (418) 은 워터마크 비트들이 임베딩될 수도 있는 코딩된 비트스트림을 생성할 수도 있다. 임베딩된 워터마크 데이터 (416) 를 갖는 코딩된 제 2 신호 (408) 는 워터마킹된 제 2 신호 (422) 로 지칭될 수도 있다.
워터마킹을 갖는 코딩 블록/모듈 (418) 은 제 2 신호 (408) 를 코딩 (예를 들어, 인코딩) 할 수도 있다. 일부 구성들에서, 이러한 코딩은 데이터 (414) 를 생성할 수도 있으며, 데이터 (414) 는 고대역 모델링 블록/모듈 (412) 에 제공될 수도 있다. 일 구성에서, 고대역 모델링 블록/모듈 (412) 은 EVRC-WB 모델을 이용하여 워터마킹을 갖는 코딩 블록/모듈 (418) 에 의해 인코딩될 수도 있는 (제 2 신호 (408) 로부터의) 하위 주파수 컴포넌트들에 의존하는, (제 1 신호 (406) 로부터의) 상위 주파수 컴포넌트들을 모델링할 수도 있다. 따라서, 상위 주파수 컴포넌트들을 모델링할 시에 이용하기 위해 고대역 모델링 블록/모듈 (412) 에 데이터 (414) 가 제공될 수도 있다. 결과로 초래된 상위 주파수 컴포넌트 워터마크 데이터 (416) 는 그 다음에 워터마킹을 갖는 코딩 블록/모듈 (418) 에 의해 제 2 신호 (408) 내에 임베딩될 수도 있으며, 그렇게 함으로써 워터마킹된 제 2 신호 (422) 를 생성한다. 워터마크 데이터 (416) (예를 들어, 고대역 비트들) 를 임베딩하는 것은 제 2 신호 (408) 내에 워터마크 데이터 (416) 를 임베딩하여 워터마킹된 제 2 신호 (422) (예를 들어, 워터마킹된 비트스트림) 를 생성하기 위해 워터마킹 코드북 (예를 들어, 고정 코드북 또는 FCB) 의 이용을 수반할 수도 있다.
워터마킹을 갖는 코딩 블록/모듈 (418) 은 적응형 워터마킹 블록/모듈 (420) 을 포함할 수도 있다. 적응형 워터마킹 블록/모듈 (420) 은 제 2 신호 (408) 의 낮은 우선순위 부분을 결정하여 제 2 신호의 낮은 우선순위 부분 내에 워터마크 데이터 (416) (예를 들어, 고대역 비트들) 를 임베딩할 수도 있다. 워터마킹을 갖는 코딩 블록/모듈 (418) 의 일 예는 대수 코드 여기 선형 예측 (ACELP) 코더이다. 이러한 예에서, 워터마킹을 갖는 코딩 블록/모듈 (418) 은 코드북 (예를 들어, 고정 코드북 (FCB)) 을 이용하여 제 2 신호 (408) 를 인코딩할 수도 있다. 코드북은 인코딩 프로세스에서 다수의 트랙들을 이용할 수도 있다. 예를 들어, AMR-NB 코딩은 40 샘플 서브프레임에 대해 8 개의 포지션들의 5 개의 트랙들을 이용한다. 적응형 워터마킹 블록/모듈 (420) 은 제 2 신호 (408) 를 이용하여 하나 이상의 높은 우선순위 트랙들을 결정할 수도 있다. 예를 들어, 높은 우선순위 트랙들은 피치 펄스가 표현되는 트랙들일 수도 있다. 일 구성에서, 적응형 워터마킹 블록/모듈 (420) 은 장기 예측 (LTP) 필터 (또는 피치 필터) 기여에 기초하여 이러한 결정을 할 수도 있다. 예를 들어, 적응형 워터마킹 블록/모듈 (420) 은 LTP 필터 출력을 조사하여 지정된 개수의 트랙들에 대한 가장 큰 LTP 기여를 결정할 수도 있다. 예를 들어, 각각의 트랙들에 대해 가장 큰 최대치를 취하는, LTP 필터 출력에서의 가장 큰 에너지가 발견될 수도 있다. 일 구성에서, 가장 큰 LTP 기여들을 갖는 2 개의 블록들은 "높은 우선순위 트랙들" 또는 중요한 트랙들로 지정될 수도 있다. 하나 이상의 잔여 트랙들은 "낮은 우선순위 트랙들" 또는 덜 중요한 트랙들로 지정될 수도 있다.
모든 트랙들이 음성 품질에 동일한 영향을 주는 것이 아니기 때문에 이러한 접근법이 이용될 수도 있다. 예를 들어, 메인 피치 펄스를 제대로 표현하는 것이 음성 코딩에서 중요할 수도 있다. 이에 따라, 서브프레임에 피치 펄스가 있는 경우, 본원에 개시된 시스템들 및 방법들은 그것이 잘 표현되는 것을 보장할 수도 있다. 워터마킹이 노이즈를 추가하는 것과 유사하게, 시스템에 추가 제약을 가할 수도 있기 때문에 이러한 결과가 나온다. 다시 말해, 피치 펄스가 표현되는 포지션들 (예를 들어, 트랙들) 에 노이즈가 추가되는 경우, 품질이 저하될 수도 있다. 따라서, 본원에 개시된 시스템들 및 방법들은 피치 파라미터들의 과거 히스토리에 기초하여 피치 펄스 위치들이 있을 곳을 결정하려고 시도할 수도 있다. 이는 피치 포지션들이 있을 곳을 추정함으로써 행해진다. 그 다음에, 그에 대응하는 트랙들에는 워터마크 데이터 (416) 가 임베딩되지 않을 수도 있다. 그러나, 보다 많은 워터마킹 데이터 (416) 가 다른 "낮은 우선순위" 트랙들에 놓일 수도 있다.
일단 높은 우선순위 및 낮은 우선순위 트랙들이 결정되거나 추정되면, 워터마킹을 갖는 코딩 블록/모듈 (418) 은 고대역 모델링 블록/모듈 (412) 로부터의 워터마크 데이터 (416) (예를 들어, 고대역 비트들) 를 낮은 우선순위 트랙(들)에 임베딩할 수도 있다. 따라서, 예를 들어, 워터마킹을 갖는 코딩 블록/모듈 (418) 은 피치를 표현하는데 이용되는 트랙 내에 워터마크 데이터를 임베딩하는 것을 피할 수도 있다. 결과로 초래된 신호 (예를 들어, 임베딩된 워터마크 데이터 (416) 를 갖는 "반송파" 신호) 는 워터마킹된 제 2 신호 (422) (예를 들어, 비트스트림) 로 지칭될 수도 있다.
워터마킹 프로세스가 인코딩된 제 2 신호 (408) 의 비트들의 일부를 변경할 수도 있음에 유의해야 한다. 예를 들어, 제 2 신호 (408) 는 "반송파" 신호 또는 비트스트림으로 지칭될 수도 있다. 워터마킹 프로세스에서, 인코딩된 제 2 신호 (408) 를 이루는 비트들 중 일부는 제 1 신호 (406) 로부터 도출된 워터마크 데이터 (416) 를 제 2 신호 (408) 내에 임베딩하거나 삽입하도록 변경되어 워터마킹된 제 2 신호 (422) 를 생성할 수도 있다. 일부 경우들에서, 이는 인코딩된 제 2 신호 (408) 에서의 저하의 원인일 수도 있다. 그러나, 워터마킹된 정보를 추출하도록 지정되지 않은 디코더들이, 제 1 신호 (406) 에 의해 제공된 추가 정보 없이, 제 2 신호 (408) 의 일 버전을 여전히 복원할 수도 있기 때문에, 이러한 접근법은 이로울 수도 있다. 따라서, "레거시" 디바이스들 및 기반구조들은 워터마킹과 상관없이 여전히 기능할 수도 있다. 이러한 접근법은 또한 (워터마킹된 정보를 추출하도록 지정된) 다른 디코더들이 제 1 신호 (406) 에 의해 제공된 추가적인 워터마크 정보를 추출하는데 이용되는 것을 허용한다.
워터마킹된 제 2 신호 (422) (예를 들어, 비트스트림) 는 채널 인코더 (466) 에 제공될 수도 있다. 채널 인코더 (466) 는 워터마킹된 제 2 신호 (422) 를 인코딩하여 채널 인코딩된 신호 (467) 를 생성할 수도 있다. 예를 들어, 채널 인코더 (466) 는 워터마킹된 제 2 신호 (422) 에 에러 검출 코딩 (예를 들어, 순환 중복 검사 (CRC) 및/또는 에러 정정 코딩 (예를 들어, 순방향 에러 정정 (forward error correction; FEC) 코딩) 을 추가할 수도 있다.
채널 인코딩된 신호 (467) 는 변조기 (468) 에 제공될 수도 있다. 변조기 (468) 는 채널 인코딩된 신호 (467) 를 변조하여 변조된 신호 (470) 를 생성할 수도 있다. 예를 들어, 변조기 (468) 는 채널 인코딩된 신호 (467) 내의 비트들을 성상점 (constellation point) 들에 맵핑할 수도 있다. 예를 들어, 변조기 (468) 는 이진 위상 편이 변조 (binary phase-shift keying; BPSK), 직교 진폭 변조 (quadrature amplitude modulation; QAM), 주파수 편이 변조 (frequency- shift keying; FSK) 등과 같은 변조 기법을 채널 인코딩된 신호 (467) 에 적용하여 변조된 신호 (470) 를 생성할 수도 있다.
변조된 신호 (470) 는 송신기 (472) 에 제공될 수도 있다. 송신기 (472) 는 하나 이상의 안테나들 (474a-474n) 을 이용하여 변조된 신호 (470) 를 송신할 수도 있다. 예를 들어, 송신기 (472) 는 변조된 신호 (470) 를 상향변환하며, 증폭하고, 하나 이상의 안테나들 (474a-474n) 을 이용하여 송신할 수도 있다.
워터마킹된 제 2 신호 (422) (예를 들어, "송신된 신호") 를 포함하는 변조된 신호 (470) 는 네트워크 (428) 를 통해 무선 통신 디바이스 A (402) 로부터 다른 디바이스 (예를 들어, 무선 통신 디바이스 B (434)) 로 송신될 수도 있다. 네트워크 (428) 는 하나 이상의 네트워크 (428) 디바이스들, 및/또는 디바이스들 사이에 (예를 들어, 무선 통신 디바이스 A (402) 와 무선 통신 디바이스 B (434)) 신호들을 통신하기 위한 송신 매체들을 포함할 수도 있다. 예를 들어, 네트워크 (428) 는 하나 이상의 기지국들, 라우터들, 서버들, 브리지들, 게이트웨이들 등을 포함할 수도 있다.
일부 경우들에서, 하나 이상의 네트워크 (428) 디바이스들은 (워터마킹된 제 2 신호 (422) 를 포함하는) 송신된 신호를 트랜스코딩할 수도 있다. 트랜스코딩은 송신된 신호를 디코딩하고 그것을 (예를 들어, 다른 포맷으로) 재인코딩하는 것을 포함할 수도 있다. 일부 경우들에서, 트랜스코딩하는 것은 송신된 신호 내에 임베딩된 워터마크 정보를 훼손할 수도 있다. 그러한 경우에, 무선 통신 디바이스 B (434) 는 워터마크 정보를 더 이상 포함하지 않는 신호를 수신할 수도 있다. 다른 네트워크 (428) 디바이스들은 임의의 트랜스코딩을 이용하지 않을 수도 있다. 예를 들어, 네트워크 (428) 가 신호들을 트랜스코딩하지 않는 디바이스들을 이용하는 경우, 네트워크는 탠덤 프리/트랜스코더 프리 동작 (TFO/TrFO) 을 제공할 수도 있다. 이러한 경우에, 워터마킹된 제 2 신호 (422) 내에 임베딩된 워터마크 정보는 다른 디바이스 (예를 들어, 무선 통신 디바이스 B (434)) 에 전송되기 때문에 보존될 수도 있다.
무선 통신 디바이스 B (434) 는 보존된 워터마크 정보를 갖는 신호 또는 워터마크 정보가 없는 신호와 같은 신호를 (네트워크 (428) 를 통해) 수신할 수도 있다. 예를 들어, 무선 통신 디바이스 B (434) 는 하나 이상의 안테나들 (476a-476n) 및 수신기 (478) 를 이용하여 신호를 수신할 수도 있다. 일 구성에서, 수신기 (478) 는 신호를 하향변환하고 디지털화하여 수신된 신호 (480) 를 생성할 수도 있다.
수신된 신호 (480) 는 복조기 (482) 에 제공될 수도 있다. 복조기 (482) 는 수신된 신호 (480) 를 복조하여 복조된 신호 (484) 를 생성할 수도 있으며, 복조된 신호 (484) 는 채널 디코더 (486) 에 제공될 수도 있다. 채널 디코더 (486) 는 신호를 디코딩하여 (예를 들어, 에러 검출 및/또는 정정 코드들을 이용하여 에러들을 검출하고/하거나 정정하여) (디코딩된) 수신된 비트스트림 (438) 을 생성할 수도 있다.
수신된 비트스트림 (438) 은 오디오 디코더 (440) 에 제공될 수도 있다. 예를 들어, 수신된 비트스트림 (438) 은 고대역 모델링 블록/모듈 (442) 및 디코딩 블록/모듈 (450) 에 제공될 수도 있다.
오디오 디코더 (440) 는 고대역 모델링 블록/모듈 (442), 트랙 결정 블록/모듈 (452), 및/또는 디코딩 블록/모듈 (450) 을 포함할 수도 있다. 오디오 디코더 (440) 는 합성 필터 뱅크 (446) 를 선택적으로 포함할 수도 있다. 트랙 결정 블록/모듈 (452) 은 워터마크 데이터가 임베딩될 수도 있는 수신된 비트스트림 (438) 의 하나 이상의 트랙들을 나타내는 트랙 정보 (444) 를 결정할 수도 있다. 예를 들어, 디코딩 블록/모듈 (450) 은 트랙 결정 블록/모듈 (452) 이 수신된 비트스트림 (438) 내의 워터마크 데이터의 위치를 결정하는데 이용할 수도 있는 정보 (448) 를 제공할 수도 있다. 일 구성에서, 디코딩 블록/모듈 (450) 은, 트랙 결정 블록/모듈 (452) 이 워터마크 데이터가 임베딩될 수도 있는 하나 이상의 트랙들을 결정하거나 추정하는 것을 허용할 수도 있는, 장기 예측 (LTP) 필터 또는 피치 필터로부터의 정보 (448) 를 제공한다. 이러한 결정은 오디오 인코더 (410) 에 의해 수행되는 낮은 우선순위 트랙 결정과 유사하게 이루어질 수도 있다. 예를 들어, 트랙 결정 블록/모듈 (452) 은 가장 큰 LTP 기여(들)를 갖는 하나 이상의 트랙들을 결정할 수도 있다. 다수의 트랙들 (예를 들어, 2 개) 이 높은 우선순위 트랙들로 결정될 (예를 들어, 지정될) 수도 있으며, 반면 다른 트랙들은 낮은 우선순위 트랙들로 결정될 (예를 들어, 지정될) 수도 있다. 일 구성에서, 낮은 우선순위 트랙들의 표시는 트랙 정보 (444) 로서 고대역 모델링 블록/모듈 (442) 에 제공될 수도 있다.
트랙 정보 (444) 는 고대역 모델링 블록/모듈 (442) 에 제공될 수도 있다. 워터마킹된 정보가 수신된 비트스트림 (438) 내에 임베딩되어 있는 경우, 고대역 모델링 블록/모듈 (442) 은 트랙 정보 (444) (예를 들어, 낮은 우선순위 트랙 표시) 를 이용하여 수신된 비트스트림 (438) 으로부터 워터마크 데이터를 모델링하고/하거나 디코딩할 수도 있다. 예를 들어, 모델링/디코딩 블록/모듈은 수신된 비트스트림 (438) 으로부터 워터마크 데이터를 추출, 모델링, 및/또는 디코딩하여 디코딩된 제 1 신호 (454) 를 생성할 수도 있다.
디코딩 블록/모듈 (450) 은 수신된 비트스트림 (438) 을 디코딩할 수도 있다. 일부 구성들에서, 디코딩 블록/모듈 (450) 은 "레거시" 디코더 (예를 들어, 표준 협대역 디코더), 또는 수신된 비트스트림 (438) 내에 포함될 수도 있는 임의의 워터마크 정보와 상관없이 수신된 비트스트림 (438) 을 디코딩하는 디코딩 절차를 이용할 수도 있다. 디코딩 블록/모듈 (450) 은 디코딩된 제 2 신호 (458) 를 생성할 수도 있다. 따라서, 예를 들어, 수신된 비트스트림 (438) 내에 워터마크 정보가 포함되어 있지 않은 경우, 디코딩 블록/모듈 (450) 은 디코딩된 제 2 신호 (458) 인 제 2 신호 (408) 의 일 버전을 여전히 복원할 수도 있다.
일부 구성들에서, 고대역 모델링 블록/모듈 (442) 에 의해 수행되는 동작들은 디코딩 블록/모듈 (450) 에 의해 수행되는 동작들에 의존할 수도 있다. 예를 들어, 상위 주파수 대역에 이용되는 모델 (예를 들어, EVRC-WB) 은 디코딩된 협대역 신호 (예를 들어, AMR-NB 를 이용하여 디코딩되는, 디코딩된 제 2 신호 (458)) 에 의존할 수도 있다. 이러한 경우에, 디코딩된 제 2 신호 (458) 는 고대역 모델링 블록/모듈 (442) 에 제공될 수도 있다.
일부 구성들에서, 디코딩된 제 2 신호 (458) 는 합성 필터 뱅크 (446) 에 의해 디코딩된 제 1 신호 (454) 와 결합되어 결합된 신호 (456) 를 생성할 수도 있다. 예를 들어, 디코딩된 제 1 신호 (454) 는 상위 주파수 오디오 정보를 포함할 수도 있으며, 반면 디코딩된 제 2 신호 (458) 는 하위 주파수 오디오 정보를 포함할 수도 있다. 디코딩된 제 1 신호 (454) 는 무선 통신 디바이스 A (402) 에 의해 인코딩된 제 1 신호 (406) 의 디코딩된 버전일 수도 있음에 유의해야 한다. 추가적으로 또는 대안으로, 디코딩된 제 2 신호 (458) 는 무선 통신 디바이스 A (402) 에 의해 인코딩된 제 2 신호 (408) 의 디코딩된 버전일 수도 있다. 합성 필터 뱅크 (446) 는 디코딩된 제 1 신호 (454) 와 디코딩된 제 2 신호 (458) 를 결합하여 결합된 신호 (456) 를 생성할 수도 있으며, 결합된 신호 (456) 는 광대역 오디오 신호일 수도 있다.
결합된 신호 (456) 는 스피커 (488) 에 제공될 수도 있다. 스피커 (488) 는 전기 또는 전자 신호들을 음향 신호들로 변환시키는 트랜스듀서일 수도 있다. 예를 들어, 스피커 (488) 는 전자 광대역 오디오 신호 (예를 들어, 결합된 신호 (456)) 를 음향 광대역 오디오 신호로 변환시킬 수도 있다.
워터마킹된 정보가 수신된 비트스트림 (438) 내에 임베딩되어 있지 않은 경우, 오디오 디코딩 블록/모듈 (450) 은 (예를 들어, 레거시 모드에서) 수신된 비트스트림 (438) 을 디코딩하여 디코딩된 제 2 신호 (458) 를 생성할 수도 있다. 이러한 경우에, 합성 필터 뱅크 (446) 가 바이패싱되어, 제 1 신호 (406) 에 의해 제공된 추가적인 정보 없이, 디코딩된 제 2 신호 (458) 를 제공할 수도 있다. 이는, 예를 들어, (예를 들어, 제 1 신호 (406) 로부터의) 워터마크 정보가 네트워크 (428) 에서의 트랜스코딩 동작에서 훼손되는 경우에 일어날 수도 있다.
무선 통신 디바이스 B (434) 에 포함된 요소들 (예를 들어, 스피커 (488), 오디오 디코더 (440), 채널 디코더 (486), 복조기 (482), 수신기 (478) 등) 중 하나 이상은 하드웨어, 소프트웨어, 또는 양자 모두의 조합으로 구현될 수도 있음에 유의해야 한다. 예를 들어, 무선 통신 디바이스 B (434) 에 포함된 요소들 중 하나 이상은 하나 이상의 집적 회로들, 주문형 집적 회로 (ASIC) 들 등으로, 그리고/또는 프로세서 및 명령들을 이용하여 구현될 수도 있다.
도 5 는 본원에 개시된 시스템들 및 방법들에 따른 워터마킹 인코더 (510) 의 일 예를 도시하는 블록 다이어그램이다. 이러한 예에서, 인코더 (510) 는 0 킬로헤르츠 (kHz) 내지 8 킬로헤르츠 (kHz) 범위의 광대역 (WB) 음성 신호 (504) 를 획득할 수도 있다. 광대역 음성 신호 (504) 는 신호 (504) 를 제 1 신호 (506) 또는 상위 주파수 컴포넌트 (예를 들어, 4 kHz - 8 kHz), 및 제 2 신호 (508) 또는 하위 주파수 컴포넌트 (예를 들어, 0 kHz - 4 kHz) 로 나누는 분석 필터 뱅크 (564) 에 제공될 수도 있다.
제 2 신호 (508) 또는 하위 주파수 컴포넌트 (예를 들어, 0 kHz - 4 kHz) 는 수정된 협대역 코더 (518) 에 제공될 수도 있다. 일 예에서, 수정된 협대역 코더 (518) 는 FCB 워터마크를 갖는 AMR-NB 12.2 를 이용하여 제 2 신호 (508) 를 코딩할 수도 있다. 수정된 협대역 코더 (518) 는 일 구성에서 고대역 모델링 블록/모듈 (512) 에 데이터 (514) (예를 들어, 코딩된 여기) 를 제공할 수도 있다.
제 1 신호 (506) 또는 상위 주파수 컴포넌트는 (예를 들어, EVRC-WB 모델을 이용하는) 고대역 모델링 블록/모듈 (512) 에 제공될 수도 있다. 고대역 모델링 블록/모듈 (512) 은 제 1 신호 (506) (예를 들어, 상위 주파수 컴포넌트) 를 인코딩하거나 모델링할 수도 있다. 일부 구성들에서, 고대역 모델링 블록/모듈 (512) 은 수정된 협대역 코더 (518) 에 의해 제공된 데이터 (514) (예를 들어, 코딩된 여기) 에 기초하여 제 1 신호 (506) 를 인코딩하거나 모델링할 수도 있다. 고대역 모델링 블록/모듈 (512) 에 수행된 인코딩 또는 모델링은 워터마크 데이터 (516) (예를 들어, 고대역 비트들) 를 생성할 수도 있으며, 워터마크 데이터 (516) 는 수정된 협대역 코더 (518) 에 제공된다.
수정된 협대역 코더 (518) 는 워터마크 데이터 (516) (예를 들어, 고대역 비트들) 를 워터마크로서 제 2 신호 (508) 에 임베딩할 수도 있다. 수정된 협대역 코더 (518) 는 워터마킹된 제 2 신호 (522) 를 적응적으로 인코딩할 수도 있다. 예를 들어, 수정된 협대역 코더 (518) 는 상술된 바와 같이 워터마크 데이터 (516) 를 제 2 신호 (508) 의 낮은 우선수위 부분 (예를 들어, 낮은 우선순위 트랙들) 내에 임베딩할 수도 있다. 워터마킹된 제 2 신호 (522) (예를 들어, 비트스트림) 는 표준 AMR 과 같은 표준 (예를 들어, 종래의) 디코더에 의해 디코딩가능할 수도 있음에 유의해야 한다. 그러나, 디코더가 워터마크 디코딩 기능성을 포함하지 않는 경우, 오직 제 2 신호 (508) 의 일 버전 (예를 들어, 낮은 주파수 컴포넌트) 만을 디코딩할 수도 있다.
도 6 은 본원에 개시된 시스템들 및 방법들에 따른 워터마킹 디코더 (640) 의 일 예를 도시하는 블록 다이어그램이다. 워터마킹 디코더 (640) 는 수신된 비트스트림 (638) (예를 들어, 워터마킹된 제 2 신호) 를 획득할 수도 있다. 수신된 비트스트림 (638) 은 표준 협대역 디코딩 블록/모듈 (650) 에 의해 디코딩되어 디코딩된 제 2 신호 (658) (예를 들어, 하위 주파수 (예를 들어, 0 kHz - 4 kHz) 컴포넌트 신호) 를 획득할 수도 있다. 디코딩된 하위 주파수 컴포넌트 신호 (658) 는 일부 구성들에서 고대역 모델링 블록/모듈 (642) (예를 들어, 모델러/디코더) 에 제공될 수도 있다.
표준 협대역 디코딩 블록/모듈 (650) 은 트랙 결정 블록/모듈 (652) 에 정보 (648) 를 제공할 수도 있다. 일 구성에서, 정보 (648) 는 정보 (148) 또는 정보 (448) 와 관련하여 상술된 바와 같은 LTP 필터 또는 피치 필터로부터 제공될 수도 있다. 트랙 결정 블록/모듈 (652) 은 상술된 바와 같이 하나 이상의 낮은 우선순위 트랙들을 결정하여 고대역 모델링 블록/모듈 (642) 에 부분 또는 트랙 정보 (644) 를 제공할 수도 있다.
고대역 모델링 블록/모듈 (642) 은 (트랙 정보 (644) 및/또는 디코딩된 제 2 신호 (658) 를 이용하여) 수신된 비트스트림 (638) 내에 임베딩된 워터마크 정보를 추출하고/하거나 모델링하여 디코딩된 제 1 신호 (654) (예를 들어, 4 kHz - 8 kHz 범위의 상위 주파수 컴포넌트 신호) 를 획득할 수도 있다. 트랙 정보 (644) 는 수신된 비트스트림 (638) 의 어느 트랙들이 워터마크 데이터를 포함하는지를 나타낼 수도 있다. 디코딩된 제 1 신호 (654) 및 디코딩된 제 2 신호 (658) 는 합성 필터 뱅크 (646) 에 의해 결합되어 광대역 (예를 들어, 0 kHz - 8 KHz, 16 kHz 로 샘플링된) 출력 음성 신호 (656) 를 획득할 수도 있다. 그러나, "레거시" 경우, 또는 수신된 비트스트림 (638) 이 워터마크 데이터를 포함하지 않는 경우, 워터마킹 디코더 (640) 는 협대역 (예를 들어, 0 kHz - 4 kHz) 음성 출력 신호 (예를 들어, 디코딩된 제 2 신호 (658)) 를 생성할 수도 있다.
도 7 은 본원에 개시된 시스템들 및 방법들에 따라 구현될 수도 있는 인코더 (710) 및 디코더 (740) 의 예들을 도시하는 블록 다이어그램이다. 인코더 (710) 는 제 1 신호 (706) 및 제 2 신호 (708) 를 획득할 수도 있다. 제 1 신호 (706) 및 제 2 신호 (708) 의 예들은 2 개의 컴포넌트들의 광대역 음성 신호,모노포닉 음성 신호와 스테레오 컴포넌트 신호, 및 관련되지 않은 신호들을 포함한다. 제 1 신호 (706) 는 인코더 (710) 상의 모델러 회로 (712) 에 제공될 수도 있으며, 인코더 (710) 는 제 1 신호 (706) 를 워터마크 데이터 (716) 로 모델링하고/하거나 인코딩한다.
제 2 신호 (708) 는 코더 회로 (718) 에 제공된다. 코더 회로 (718) 는 선형 예측 코딩 (LPC) 블록/모듈 (790), 장기 예측 (LTP) 블록/모듈 (792), 트랙 결정 블록/모듈 (796), 및 고정 코드북 (FCB) 블록/모듈 (798) 을 포함할 수도 있다. 일 구성들에서, 선형 예측 코딩 (LPC) 블록/모듈 (790) 및 장기 예측 블록/모듈 (792) 은 종래의 코드 여기 선형 예측 (CELP) 또는 대수 코드 여기 선형 예측 (ACELP) 코더에서의 동작과 유사한 동작들을 수행할 수도 있다. LPC 블록/모듈 (790) 은 제 2 신호 (708) 에 대해 LPC 동작을 수행할 수도 있다.
LPC 블록/모듈 (790) 출력 (705) 이 LTP 블록/모듈 (792) (예를 들어, 피치 필터) 에 제공되며, LTP 블록/모듈 (792) 은 LPC 블록/모듈 (790) 출력 (705) 에 대해 LTP 동작을 수행한다. LTP 블록/모듈 (792) 출력 (707) 은 트랙 결정 블록/모듈 (796) 및 FCB 블록/모듈 (798) 에 제공된다. 원래의 LTP 가 저대역 코딩에 이용될 수도 있음에 유의해야 한다. 일부 구성들에서, 오직 워터마킹을 위한 트랙들의 우선순위를 결정하기 위해 메모리 제한된 LTP 가 단독으로 이용될 수도 있다. 트랙 결정 블록/모듈은 (예를 들어, LTP 출력 (707) 으로 나타내어진) LTP 기여를 이용하여 높은 우선순위 트랙들을 결정해 FCB 블록/모듈 (798) 을 위해 낮은 우선순위 트랙들을 결정할 수도 있다. 예를 들어, 트랙 결정 블록/모듈 (796) 은 제 2 신호 (708) 내의 피치를 표현하는데 이용되는 높은 우선순위 트랙들을 결정하려고 추정하거나 시도할 수도 있다. 트랙 결정 블록/모듈 (796) 출력 (709) 이 FCB 블록/모듈 (798) 에 제공되며, FCB 블록/모듈 (798) 은 제 2 신호 (708) 를 인코딩하고 모델러 회로 (712) 로부터의 워터마크 데이터 (716) 를 트랙 결정 블록/모듈 (796) 출력 (709) 에 의해 나타내어진 낮은 우선순위 트랙들 내에 임베딩한다. 이러한 구성 또는 접근법은 LTP 신호가 에러들 및 패킷 손실에 민감하고 에러들이 무한정 전파된다는 점에서 결점을 가질 수도 있다. 이는 인코더 (710) 및 디코더 (740) 가 삭제 또는 비트 에러들 이후에 긴 기간들 동안 동기가 맞지 않는 것을 초래할 수 있다.
다른 구성에서, LTP 블록/모듈 (792) 은 메모리 제한 (794) 을 이용할 수도 있다. 다시 말해, 메모리 제한된 LTP 기여가 LTP 기여 대신에 이용될 수도 있다. LTP 의 제한된 메모리 버전은 오직 마지막 N 프레임들과 현재 프레임의 양자화된 피치 값들 및 코드북 기여들에만 기초하여 구성될 수도 있다. 이득들은 일치하도록 설정될 수도 있다. 예를 들어, N = 2 이면, 에러들 하에서의 인코더 (710) 성능이 크게 개선될 수도 있다. 좀더 구체적으로, 트랙 결정 블록/모듈 (796) 은 대신 LTP 블록/모듈 (792) 로부터의 메모리 제한된 LTP 기여를 이용하여 높은 우선순위 및/또는 낮은 우선순위 트랙들을 결정할 수도 있다.
FCB 블록/모듈 (798) 은 제 2 신호 (708) 를 인코딩하고 제 2 신호 (708) 내에 워터마크 데이터 (716) 를 임베딩하여 워터마킹된 제 2 신호 (722) 를 생성할 수도 있다. 워터마킹된 제 2 신호 (722) 는 디코더 (740) 에 전송, 송신, 및/또는 제공될 수도 있다. 워터마킹된 비트스트림을 전송하는 것은 채널 코딩, 포맷팅, 무선 채널을 통한 송신, 디포맷팅, 채널 디코딩 등을 수반할 수도 있거나 그렇지 않을 수도 있다.
디코더 (740) 는 워터마킹된 제 2 신호 (722) 를 수신할 수도 있으며, 워터마킹된 제 2 신호 (722) 는 모델러 회로 (742) 및/또는 디코더 회로 (750) 에 제공될 수도 있다. 디코더 회로 (750) 는 장기 예측 (LTP) 블록/모듈 (701) 을 포함할 수도 있다. LTP 블록/모듈 (701) 은 워터마킹된 제 2 신호 (722) 에 기초하여 트랙 결정 회로 (752) 에 정보 (748) (예를 들어, LTP 기여(들)) 를 제공할 수도 있다. 일부 구성들에서, LTP 블록/모듈 (701) 은 메모리 제한 (703) 을 포함할 수도 있다. 예를 들어, 트랙 결정 회로 (752) 에 제공된 정보 (748) 는 LTP 기여 또는 메모리 제한된 LTP 기여를 포함할 수도 있다. 보통의 LTP 기여 표시자는 상술된 단점 (예를 들어, 에러들이 무한정 전파된다) 을 가질 수도 있다. 그러나, 메모리 제한된 LTP 기여는, 특히 삭제들 또는 비트 에러들이 일어난 경우에, 보다 나은 성능을 위해 이용될 수도 있다.
디코더 (740) 상의 트랙 결정 회로 (752) 는 정보 (748) (예를 들어, LTP 기여(들)) 를 이용하여 높은 우선순위 및/또는 낮은 우선순위 트랙들을 결정할 수도 있다. 예를 들어, 트랙 결정 회로 (752) 는 상술된 바와 같이 하나 이상의 LTP 기여들 또는 하나 이상의 메모리 제한된 LTP 기여들을 이용하여 하나 이상의 높은 우선순위 및/또는 낮은 우선순위 트랙들을 결정할 수도 있다. 트랙 결정 회로 (752) 는 워터마크 데이터를 포함할 수도 있는 워터마킹된 제 2 신호 (722) 의 하나 이상의 트랙들을 나타내는 트랙 정보 (744) 를 모델러 회로 (742) 에 제공할 수도 있다. 모델러 회로 (742) 는 트랙 정보 (744) 를 이용하여 임베딩된 워터마크 데이터를 추출, 디코딩, 및/또는 모델링할 수도 있다. 예를 들어, 모델러 회로 (742) 는 낮은 우선순위 (코드북) 트랙들로부터 워터마크 데이터를 획득할 수도 있다.
디코더 회로 (750) 는 디코딩된 제 2 신호 (758) 를 생성할 수도 있으며, 반면 모델러 회로 (742) 는 디코딩된 제 1 신호 (754) 를 생성할 수도 있다. 일부 구성들에서, 디코딩된 제 1 신호 (754) 및 디코딩된 제 2 신호 (758) 는 결합 회로 (746) 에 의해 결합되어 결합된 신호 (756) 를 생성할 수도 있다. 예를 들어, 디코딩된 제 1 신호 (754) 는 상위 주파수 컴포넌트 신호일 수도 있고, 디코딩된 제 2 신호 (758) 는 결합된 신호 (756) (예를 들어, 디코딩된 광대역 음성 신호) 를 생성하기 위해 합성 필터 뱅크에 의해 결합되는 하위 주파수 컴포넌트 신호일 수도 있다.
도 8 은 무선 통신 디바이스 (821) 의 일 구성을 도시하는 블록 다이어그램으로서, 워터마킹된 신호를 적응적으로 인코딩하고 디코딩하는 시스템들 및 방법들이 구현될 수도 있다. 무선 통신 디바이스 (821) 는 상술된 전자 디바이스 A (102), 전자 디바이스 B (134), 무선 통신 디바이스 A (402), 또는 무선 통신 디바이스 B (434) 의 일 예일 수도 있다. 무선 통신 디바이스 (821) 는 애플리케이션 프로세서 (825) 를 포함할 수도 있다. 애플리케이션 프로세서 (825) 는 일반적으로 무선 통신 디바이스 (821) 에 대한 기능들을 수행하기 위한 명령들을 프로세싱한다 (예를 들어, 프로그램들을 구동한다). 애플리케이션 프로세서 (825) 는 오디오 코더/디코더 (코덱) (819) 에 커플링될 수도 있다.
오디오 코덱 (819) 은 오디오 신호들을 코딩 및/또는 디코딩하는데 이용되는 전자 디바이스 (예를 들어, 집적 회로) 일 수도 있다. 오디오 코덱 (819) 은 하나 이상의 스피커들 (811), 이어폰 (813), 출력 잭 (815), 및/또는 하나 이상의 마이크들 (817) 에 커플링될 수도 있다. 스피커들 (811) 은 전기 또는 전자 신호들을 음향 신호들로 변환시키는 하나 이상의 전기 음향 트랜스듀서들을 포함할 수도 있다. 예를 들어, 스피커들 (811) 은 음악을 재생하거나, 스피커폰 대화를 출력하는 등에 이용될 수도 있다. 이어폰 (813) 은 음향 신호들 (예를 들어, 음성 신호들) 을 사용자에게 출력하는데 이용될 수 있는 다른 스피커 또는 전자 음향 트랜스듀서일 수도 있다. 예를 들어, 이어폰 (813) 은 오직 사용자만이 음향 신호를 확실히 들을 수 있도록 이용될 수도 있다. 출력 잭 (815) 은 오디오를 출력하기 위해 무선 통신 디바이스 (821) 에 헤드폰들과 같은 다른 디바이스들을 커플링하는데 이용될 수도 있다. 스피커들 (811), 이어폰 (813), 및/또는 출력 잭 (815) 은 일반적으로 오디오 코덱 (819) 으로부터 오디오 신호를 출력하는데 이용될 수도 있다. 하나 이상의 마이크들 (817) 은 (사용자의 목소리와 같은) 음향 신호를 오디오 코덱 (819) 에 제공되는 전기 또는 전자 신호들로 변환시키는 하나 이상의 음향 전기 트랜스듀서들일 수도 있다.
오디오 코덱 (819) 은 인코더 (810a) 를 포함할 수도 있다. 상술된 인코더들 (110, 410, 510, 710) 은 인코더 (810a) (및/또는 인코더 (810b)) 의 예들일 수도 있다. 대안적인 구성에서, 인코더 (810b) 는 애플리케이션 프로세서 (825) 내에 포함될 수도 있다. 인코더들 (810a-810b) 중 하나 이상 (예를 들어, 오디오 코덱 (819)) 은 워터마킹된 신호를 적응적으로 인코딩하기 위해 도 2 와 관련하여 상술된 방법 (200) 을 수행하는데 이용될 수도 있다.
오디오 코덱 (819) 은 추가적으로 또는 대안으로 디코더 (840a) 를 포함할 수도 있다. 상술된 디코더들 (140, 440, 640, 740) 은 디코더 (840a) (및/또는 디코더 (840b)) 의 예들일 수도 있다. 대안적인 구성에서, 디코더 (840b) 는 애플리케이션 프로세서 (825) 내에 포함될 수도 있다. 디코더들 (840a-840b) 중 하나 이상 (예를 들어, 오디오 코덱 (819)) 이 적응적으로 인코딩되고 워터마킹된 신호를 디코딩하기 위해 도 3 과 관련하여 상술된 방법 (300) 을 수행할 수도 있다.
애플리케이션 프로세서 (825) 는 또한 전력 관리 회로 (835) 에 커플링될 수도 있다. 전력 관리 회로 (835) 의 일 예는 전력 관리 집적 회로 (power management integrated circuit; PMIC) 이며, 전력 관리 집적 회로는 무선 통신 디바이스 (821) 의 전기 전력 소비를 관리하는데 이용될 수도 있다. 전력 관리 회로 (835) 는 배터리 (837) 에 커플링될 수도 있다. 배터리 (837) 는 일반적으로 무선 통신 디바이스 (821) 에 전기 전력을 제공할 수도 있다.
애플리케이션 프로세서 (825) 는 입력을 수신하기 위해 하나 이상의 입력 디바이스들 (839) 에 커플링될 수도 있다. 입력 디바이스들 (839) 의 예들은 적외선 센서들, 이미지 센서들, 가속도계들, 터치 센서들, 키패드들 등을 포함한다. 입력 디바이스들 (839) 은 무선 통신 디바이스 (821) 와의 사용자 상호작용을 허용할 수도 있다. 애플리케이션 프로세서 (825) 는 또한 하나 이상의 디바이스들 (841) 에 커플링될 수도 있다. 출력 디바이스들 (841) 의 예들은 프린터들, 프로젝터들, 스크린들, 촉각 디바이스들 등을 포함한다. 출력 디바이스들 (841) 은 무선 통신 디바이스 (821) 가 사용자에 의해 경험될 수도 있는 출력을 생성하는 것을 허용할 수도 있다.
애플리케이션 프로세서 (825) 는 애플리케이션 메모리 (843) 에 커플링될 수도 있다. 애플리케이션 메모리 (843) 는 전자 정보를 저장할 수 있는 임의의 전자 디바이스일 수도 있다. 애플리케이션 메모리 (843) 의 예들은 더블 데이터 레이트 동기식 동적 랜덤 액세스 메모리 (double data rate synchronous dynamic random access memory; DDRAM), 동기식 동적 랜덤 액세스 메모리 (synchronous dynamic random access memory; SDRAM), 플래시 메모리 등을 포함한다. 애플리케이션 메모리 (843) 는 애플리케이션 프로세서 (825) 를 위한 저장부를 제공할 수도 있다. 예를 들어, 애플리케이션 메모리 (843) 는 애플리케이션 프로세서 (825) 상에서 구동되는 프로그램들의 기능에 대한 데이터 및/또는 명령들을 저장할 수도 있다.
애플리케이션 프로세서 (825) 는 디스플레이 제어기 (845) 에 커플링될 수도 있으며, 디스플레이 제어기 (845) 는 차례로 디스플레이 (847) 에 커플링될 수도 있다. 디스플레이 제어기 (845) 는 디스플레이 (847) 상에 이미지들을 생성하는데 이용되는 하드웨어 블록일 수도 있다. 예를 들어, 디스플레이 제어기 (845) 는 애플리케이션 프로세서 (825) 로부터의 명령들 및/또는 데이터를 디스플레이 (847) 상에 보여질 수 있는 이미지들로 바꿀 수도 있다. 디스플레이 (847) 의 예들은 액정 디스플레이 (liquid crystal display; LCD) 패널들, 발광 다이오드 (light emitting diode; LED) 패널들, 음극선관 (cathode ray tube; CRT) 디스플레이들, 플라즈마 디스플레이들 등을 포함한다.
애플리케이션 프로세서 (825) 는 기저대역 프로세서 (827) 에 커플링될 수도 있다. 기저대역 프로세서 (827) 는 일반적으로 통신 신호들을 프로세싱한다. 예를 들어, 기저대역 프로세서 (827) 는 수신된 신호들을 복조하고/하거나 디코딩할 수도 있다. 추가적으로 또는 대안으로, 기저대역 프로세서 (827) 는 송신을 위한 준비 시에 신호들을 인코딩하고/하거나 변조할 수도 있다.
기저대역 프로세서 (827) 는 기저대역 메모리 (849) 에 커플링될 수도 있다. 기저대역 메모리 (849) 는, SDRAM, DDRAM, 플래시 메모리 등과 같은, 전자 정보를 저장할 수 있는 임의의 전자 디바이스일 수도 있다. 기저대역 프로세서 (827) 는 기저대역 메모리 (849) 로부터 정보 (예를 들어, 명령들 및/또는 데이터) 를 판독하고/하거나 기저대역 메모리 (849) 에 정보를 기록할 수도 있다. 추가적으로 또는 대안으로, 기저대역 프로세서 (827) 는 기저대역 메모리 (849) 내에 저장된 명령들 및/또는 데이터를 이용하여 통신 동작들을 수행할 수도 있다.
기저대역 프로세서 (827) 는 무선 주파수 (radio frequency; RF) 트랜시버 (829) 에 커플링될 수도 있다. RF 트랜시버 (829) 는 전력 증폭기 (831) 및 하나 이상의 안테나들 (833) 에 커플링될 수도 있다. RF 트랜시버 (829) 는 무선 주파수 신호들을 송신하고/하거나 수신할 수도 있다. 예를 들어, RF 트랜시버 (829) 는 전력 증폭기 (831) 및 하나 이상의 안테나들 (833) 을 이용하여 RF 신호를 송신할 수도 있다. RF 트랜시버 (829) 는 또한 하나 이상의 안테나들 (833) 을 이용하여 RF 신호들을 수신할 수도 있다.
도 9 는 전자 디바이스 (951) 에서 이용될 수도 있는 다양한 컴포넌트들을 도시한다. 도시된 컴포넌트들은 동일한 물리적 구조 내에, 또는 별도의 하우징들이나 구조들 내에 위치될 수도 있다. 이전에 설명된 전자 디바이스들 (102, 134) 중 하나 이상은 전자 디바이스 (951) 와 유사하게 구성될 수도 있다. 전자 디바이스 (951) 는 프로세서 (959) 를 포함한다. 프로세서 (959) 는 범용 단일 또는 다중칩 마이크로프로세서 (예를 들어, ARM), 특수 목적용 마이크로프로세서 (예를 들어, 디지털 신호 처리기 (digital signal processor; DSP)), 마이크로컨트롤러, 프로그램가능 게이트 어레이 등일 수도 있다. 프로세서 (959) 는 중앙 처리 장치 (central processing unit; CPU) 로 지칭될 수도 있다. 도 9 의 전자 디바이스 (951) 에 단지 단일 프로세서 (959) 만이 도시되었지만, 대안적인 구성에서, 프로세서들의 조합 (예를 들면, ARM 및 DSP) 이 사용될 수 있다.
전자 디바이스 (951) 는 또한 프로세서 (959) 와 전자 통신을 하는 메모리 (953) 를 포함한다. 즉, 프로세서 (959) 는 메모리 (953) 로부터 정보를 판독하고/하거나 메모리 (953) 에 정보를 기록할 수 있다. 메모리 (953) 는 전자 정보를 저장할 수 있는 임의의 전자 컴포넌트일 수도 있다. 메모리 (953) 는, 그 조합을 포함하여, 랜덤 액세스 메모리 (RAM), 판독 전용 메모리 (ROM), 자기 디스크 저장 매체들, 광학 저장 매체들, RAM 내의 플래시 메모리 디바이스들, 프로세서에 포함된 온 보드 메모리, 프로그램가능 판독 전용 메모리 (programmable read-only memory; PROM), 소거가능한 프로그램가능 판독 전용 메모리 (erasable programmable read-only memory; EPROM), 전기적으로 소거가능한 PROM (electrically erasable PROM; EEPROM), 레지스터들 등일 수도 있다.
데이터 (957a) 및 명령들 (955a) 은 메모리 (953) 내에 저장될 수도 있다. 명령들 (955a) 은 하나 이상의 프로그램들, 루틴들, 서브 루틴들, 기능들, 절차들 등을 포함할 수도 있다. 명령들 (955a) 은 단일 컴퓨터 판독가능 스테이트먼트 (statement), 또는 많은 컴퓨터 판독가능 스테이트먼트들을 포함할 수도 있다. 명령들 (955a) 은 상술된 방법들 (200, 300) 중 하나 이상을 구현하기 위해 프로세서 (959) 에 의해 실행가능할 수도 있다. 명령들 (955a) 을 실행하는 것은 메모리 (953) 내에 저장된 데이터 (957a) 의 이용을 수반할 수도 있다. 도 9 는 프로세서 (959) 내로 로딩되는 일부 명령들 (955b) 및 데이터 (957b) 를 도시한다 (명령들 (955b) 및 데이터 (957b) 는 명령들 (955a) 및 데이터 (957a) 에서 비롯될 수도 있다).
전자 디바이스 (951) 는 또한 다른 전자 디바이스들과 통신하기 위한 하나 이상의 통신 인터페이스들 (963) 을 포함할 수도 있다. 통신 인터페이스 (963) 는 유선 통신 기술, 무선 통신 기술, 또는 양자 모두에 기초할 수도 있다. 상이한 유형의 통신 인터페이스들 (963) 의 예들은 직렬 포트, 병렬 포트, 범용 직렬 버스 (Universal Serial Bus; USB), 이더넷 어댑터, IEEE 1394 버스 인터페이스, 소형 컴퓨터 시스템 인터페이스 (small computer system interface; SCSI) 버스 인터페이스, 적외선 (infrared; IR) 통신 포트, 블루투스 무선 통신 어댑터 등을 포함한다.
전자 디바이스 (951) 는 또한 하나 이상의 입력 디바이스들 (965) 및 하나 이상의 출력 디바이스들 (969) 을 포함할 수도 있다. 상이한 종류의 입력 디바이스들 (965) 의 예들은 키보드, 마우스, 마이크, 원격 제어 디바이스, 버튼, 조이스틱, 트랙볼, 터치패드, 광펜 등을 포함한다. 예를 들어, 전자 디바이스 (951) 는 음향 신호들을 캡쳐하기 위한 하나 이상의 마이크들 (967) 을 포함할 수도 있다. 일 구성에서, 마이크 (967) 는 음향 신호들 (예를 들어, 목소리, 음성) 을 전기 또는 전자 신호들로 변환시키는 트랜스듀서일 수도 있다. 상이한 종류의 출력 디바이스들 (969) 의 예들은 스피커, 프린터 등을 포함한다. 예를 들어, 전자 디바이스 (951) 는 하나 이상의 스피커들 (971) 을 포함할 수도 있다. 일 구성에서, 스피커 (971) 는 전기 또는 전자 신호들을 음향 신호들로 변환시키는 트랜스듀서일 수도 있다. 일반적으로 전자 디바이스 (951) 내에 포함될 수도 있는 일 특정 유형의 출력 디바이스는 디스플레이 디바이스 (973) 이다. 본원에 개시된 구성들과 함께 이용되는 디스플레이 디바이스들 (973) 은 음극선관 (CRT), 액정 디스플레이 (LCD), 발광 다이오드 (LED), 가스 플라즈마, 전기발광 (electroluminescence) 등과 같은 임의의 적합한 이미지 프로젝션 기술을 이용할 수도 있다. 메모리 (953) 내에 저장된 데이터를 디스플레이 디바이스 (973) 상에 보여지는 (적절한) 텍스트, 그래픽들, 및/또는 동영상들로 변환시키기 위해 디스플레이 제어기 (975) 가 또한 제공될 수도 있다.
전자 디바이스 (951) 의 다양한 컴포넌트들은 하나 이상의 버스들에 의해 함께 커플링될 수도 있는데, 하나 이상의 버스들은 전력 버스, 제어 신호 버스, 상태 신호 버스, 데이터 버스 등을 포함할 수도 있다. 단순함을 위해, 다양한 버스들은 도 9 에서 버스 시스템 (961) 으로 도시된다. 도 9 는 오직 전자 디바이스 (951) 의 하나의 가능한 구성만을 도시하는 것임에 유의해야 한다. 다양한 다른 아키텍쳐들 및 컴포넌트들이 이용될 수도 있다.
도 10 은 무선 통신 디바이스 (1077) 내에 포함될 수도 있는 소정의 컴포넌트들을 도시한다. 상술된 전자 디바이스들 (102, 134, 951) 중 하나 이상 및/또는 무선 통신 디바이스들 (402, 434, 821) 중 하나 이상은 도 10 에 도시된 무선 통신 디바이스 (1077) 와 유사하게 구성될 수도 있다.
무선 통신 디바이스 (1077) 는 프로세서 (1097) 를 포함한다. 프로세서 (1097) 는 범용 단일 또는 다중칩 마이크로프로세서 (예를 들어, ARM), 특수 목적용 마이크로프로세서 (예를 들어, 디지털 신호 처리기 (DSP)), 마이크로컨트롤러, 프로그램가능 게이트 어레이 등일 수도 있다. 프로세서 (1097) 는 중앙 처리 장치 (CPU) 로 지칭될 수도 있다. 도 10 의 무선 통신 디바이스 (1077) 에 단지 단일 프로세서 (1097) 만이 도시되지만, 대안적인 구성에서, 프로세서들의 조합 (예를 들면, ARM 및 DSP) 이 이용될 수도 있다.
무선 통신 디바이스 (1077) 는 또한 프로세서 (1097) 와 전자 통신을 하는 메모리 (1079) 을 포함한다 (즉, 프로세서 (1097) 는 메모리 (1079) 로부터의 정보를 판독하고/하거나 메모리 (1079) 에 정보를 기록할 수 있다). 메모리 (1079) 는 전자 정보를 저장할 수 있는 임의의 전자 컴포넌트일 수도 있다. 메모리 (1079) 는, 그 조합들을 포함하여, 랜덤 액세스 메모리 (RAM), 판독 전용 메모리 (ROM), 자기 디스크 저장 매체들, 광학 저장 매체들, RAM 내의 플래시 메모리 디바이스들, 프로세서에 포함된 온보드 메모리, 프로그램가능 판독 전용 메모리 (PROM), 소거가능한 프로그램가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 PROM (EEPROM), 레지스터들 등일 수도 있다.
데이터 (1081a) 및 명령들 (1083a) 은 메모리 (1079) 내에 저장될 수도 있다. 명령들 (1083a) 은 하나 이상의 프로그램들, 루틴들, 서브 루틴들, 기능들, 절차들, 코드 등을 포함할 수도 있다. 명령들 (1083a) 은 단일 컴퓨터 판독가능 스테이트먼트, 또는 많은 컴퓨터 판독가능 스테이트먼트들을 포함할 수도 있다. 명령들 (1083a) 은 상술된 방법들 (200, 300) 중 하나 이상을 구현하기 위해 프로세서 (1097) 에 의해 실행가능할 수도 있다. 명령들 (1083a) 을 실행하는 것은 메모리 (1079) 내에 저장되는 데이터 (1081a) 의 이용을 수반할 수도 있다. 도 10 은 일부 명령들 (1083b) 및 데이터 (1081b) 가 프로세서 (1097) 내로 로딩되는 것을 도시한다 (명령들 (1083b) 및 데이터 (1081b) 는 명령들 (1083a) 및 데이터 (1081a) 에서 기인할 수도 있다).
무선 통신 디바이스 (1077) 는 또한 송신기 (1093) 및 수신기 (1095) 를 포함하여 무선 통신 디바이스 (1077) 와 원격지 (예를 들어, 다른 전자 디바이스, 무선 통신 디바이스 등) 사이에서 신호들의 송신 및 수신을 허용할 수도 있다. 송신기 (1093) 및 수신기 (1095) 는 집합적으로 트랜시버 (1091) 라고 지칭될 수도 있다. 안테나 (1099) 가 트랜시버 (1091) 에 전기적으로 커플링될 수도 있다. 무선 통신 디바이스 (1077) 는 또한 다중 송신기들, 다중 수신기들, 다중 트랜시버들, 및/또는 다중 안테나 (미도시) 를 포함할 수도 있다.
일부 구성들에서, 무선 통신 디바이스 (1077) 는 음향 신호들을 캡쳐하기 위한 하나 이상의 마이크들 (1085) 을 포함할 수도 있다. 일 구성에서, 마이크 (1085) 는 음향 신호들 (예를 들어, 목소리, 음성) 을 전기 또는 전자 신호들로 변환시키는 트랜스듀서일 수도 있다. 추가적으로 또는 대안으로, 무선 통신 디바이스 (1077) 는 하나 이상의 스피커들 (1087) 을 포함할 수도 있다. 일 구성에서, 스피커 (1087) 는 전기 또는 전자 신호들을 음향 신호들로 변환시키는 트랜스듀서일 수도 있다.
무선 통신 디바이스 (1077) 의 다양한 컴포넌트들이 하나 이상의 버스들에 의해 함께 커플링될 수도 있으며, 하나 이상의 버스들은 전력 버스, 제어 신호 버스, 상태 신호 버스, 데이터 버스 등을 포함할 수도 있다. 단순함을 위해, 다양한 버스들은 도 10 에서 버스 시스템 (1089) 으로 도시된다.
위의 설명에서, 다양한 용어들과 관련하여 도면 부호들이 종종 이용되었다. 도면 부호와 관련하여 용어가 이용되는 경우, 이는 도면들 중 하나 이상에 도시된 특정 요소를 지칭하려는 의도일 수도 있다. 도면 부호 없이 용어가 이용되는 경우, 이는 임의의 특정 도면으로 제한하지 않으면서 일반적으로 용어를 지칭하려는 의도일 수도 있다.
용어 "결정하는 것" 은 매우 다양한 행위들을 망라하고, 따라서, "결정하기" 은 계산하기, 컴퓨팅하기, 프로세싱하기, 도출하기, 조사하기, 검색하기 (예를 들어, 테이블, 데이터베이스, 또는 다른 데이터 구조 내에서 검색하기), 확인하기 등을 포함할 수 있다. 또한, "결정하기" 는 수신하기 (예를 들어, 정보 수신하기), 액세스하기 (예를 들어, 메모리 내의 데이터에 액세스하기) 등을 포함할 수 있다. 또한, "결정하기" 는 해결하기, 선택하기, 고르기, 설정하기 등을 포함할 수 있다.
구절 "에 기초하는" 은 달리 명백히 명시되지 않는 한 "오직 ~에만 기초하는" 을 의미하지 않는다. 다시 말해, 구절 "에 기초하는" 은 "오직 ~에만 기초하는" 및 "적어도 ~에 기초하는" 양자 모두를 말한다.
본원에 설명된 기능들은 하나 이상의 명령들로서 프로세서 판독가능 또는 컴퓨터 판독가능 매체에 저장될 수도 있다. 용어 "컴퓨터 판독가능 매체" 는 컴퓨터 또는 프로세서에 의해 액세스될 수 있는 임의의 이용가능한 매체를 지칭한다. 제한하지 않는 예로서, 그러한 매체는, RAM, ROM, EEPROM, 플래시 메모리, CD-ROM 이나 다른 광학적 디스크 저장부, 자기적 디스크 저장부나 다른 자기적 저장 디바이스들, 또는 명령들이나 데이터 구조들의 형태로 원하는 프로그램 코드를 저장하는에 이용될 수 있고 컴퓨터나 프로세서에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수도 있다. 본원에서 사용된 디스크 (disk) 및 디스크 (disc) 는 컴팩트 디스크 (CD), 레이저 디스크, 광학 디스크, 디지털 다기능 디스크 (digital versatile disc; DVD), 플로피 디스크, 및 블루 레이 디스크를 포함하며, 여기서 디스크 (disk) 들은 보통 데이터를 자기적으로 재생하며, 반면 디스크 (disc) 들은 레이저들을 이용하여 데이터를 광학적으로 재생한다. 컴퓨터 판독가능 매체는 유형이고 비일시적일 수도 있음에 유의해야 한다. 용어 "컴퓨터 판독가능 제품" 은 컴퓨팅 디바이스 또는 프로세서에 의해 실행, 처리, 또는 컴퓨팅될 수도 있는 코드 또는 명령들 (예를 들어, "프로그램") 과 조합하는 컴퓨팅 디바이스 또는 프로세서를 지칭한다. 본원에서 사용된 바와 같은 용어 "코드" 는 컴퓨팅 디바이스나 프로세서에 의해 실행가능한 소프트웨어, 명령들, 코드, 또는 데이터를 지칭할 수도 있다.
소프트웨어 또는 명령들은 또한 송신 매체를 통해 송신될 수도 있다. 예를 들어, 소프트웨어가 동축 케이블, 광 섬유 케이블, 연선, 디지털 가입자 회선 (digital subscriber line; DSL), 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들을 이용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 송신되는 경우, 동축 케이블, 광 섬유 케이블, 연선, DSL, 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들은 송신 매체의 정의 내에 포함된다.
본원에 개시된 방법들은 설명된 방법을 달성하기 위한 하나 이상의 단계들 또는 행위들을 포함한다. 방법 단계들 및/또는 행위들은 청구항들의 범위를 벗어나지 않으면서 서로 상호교환될 수도 있다. 다시 말해, 설명되는 방법의 적절한 동작을 위해 단계들 또는 행위들의 특정한 순서가 요구되지 않는 한, 특정 단계들 및/또는 행위들의 순서 및/또는 이용은 청구항들의 범위를 벗어나지 않으면서 수정될 수도 있다.
청구항들은 위에서 예시된 정확한 구성 및 컴포넌트들로 제한되지 않는 것으로 이해되어야 한다. 청구항들의 범위를 벗어나지 않으면서 본원에 설명된 시스템들, 방법들, 및 장치들의 배열, 동작, 및 세부사항들에 다양한 수정들, 변경들, 및 변형들이 이루어질 수도 있다.

Claims (46)

  1. 워터마킹된 신호를 적응적으로 인코딩하도록 구성된 전자 디바이스로서,
    제 1 신호에 기초하여 워터마크 데이터를 결정하는 모델러 회로; 및
    상기 모델러 회로에 커플링된 코더 회로로서, 상기 코더 회로는 제 2 신호의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하고 상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙 내에 상기 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하는, 상기 코더 회로를 포함하는, 전자 디바이스.
  2. 제 1 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙은 상기 제 2 신호의 다른 트랙보다 지각적으로 덜 중요한, 전자 디바이스.
  3. 제 1 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은,
    상기 제 2 신호에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것; 및
    상기 하나 이상의 높은 우선순위 코드북 트랙들이 아닌 임의의 트랙들을 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로 지정하는 것을 포함하는, 전자 디바이스.
  4. 제 3 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스.
  5. 제 3 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 메모리 제한된 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스.
  6. 제 3 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들은 피치를 표현하는데 이용되는, 전자 디바이스.
  7. 제 1 항에 있어서,
    상기 제 1 신호는 상위 주파수 컴포넌트 신호이고, 상기 제 2 신호는 하위 주파수 컴포넌트 신호인, 전자 디바이스.
  8. 제 1 항에 있어서,
    상기 모델러 회로 및 상기 코더 회로는 오디오 코덱 내에 포함되는, 전자 디바이스.
  9. 적응적으로 인코딩되고 워터마킹된 신호를 디코딩하기 위한 전자 디바이스로서,
    워터마킹된 비트스트림의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 부분 결정 회로;
    상기 부분 결정 회로에 커플링된 모델러 회로로서, 상기 모델러 회로는 상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로부터 워터마크 데이터를 추출하고 상기 워터마크 데이터에 기초하여 제 1 신호를 획득하는, 상기 모델러 회로; 및
    상기 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하는 디코더 회로를 포함하는, 전자 디바이스.
  10. 제 9 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은 상기 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙을 결정하는 것에 기초하는, 전자 디바이스.
  11. 제 10 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스.
  12. 제 10 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것은 메모리 제한된 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스.
  13. 제 9 항에 있어서,
    상기 제 1 신호와 상기 제 2 신호를 결합하는 결합 회로를 더 포함하는, 전자 디바이스.
  14. 제 9 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙은 지각적으로 덜 중요한 정보를 포함하는, 전자 디바이스.
  15. 제 9 항에 있어서,
    상기 부분 결정 회로, 상기 모델러 회로, 및 상기 디코더 회로는 오디오 코덱 내에 포함되는, 전자 디바이스.
  16. 제 1 신호 및 제 2 신호를 획득하는 단계;
    상기 제 2 신호의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 단계;
    상기 제 1 신호에 기초하여 워터마크 데이터를 결정하는 단계; 및
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙 내에 상기 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하는 단계를 포함하는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  17. 제 16 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙은 상기 제 2 신호의 다른 트랙보다 지각적으로 덜 중요한, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  18. 제 16 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 단계는,
    상기 제 2 신호에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 단계; 및
    상기 하나 이상의 높은 우선순위 코드북 트랙들이 아닌 임의의 트랙들을 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로 지정하는 단계를 포함하는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  19. 제 18 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 단계는 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  20. 제 18 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 단계는 메모리 제한된 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  21. 제 18 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들은 피치를 표현하는데 이용되는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  22. 제 16 항에 있어서,
    상기 제 1 신호는 상위 주파수 컴포넌트 신호이고, 상기 제 2 신호는 하위 주파수 컴포넌트 신호인, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  23. 제 16 항에 있어서,
    상기 방법은 오디오 코덱에 의해 수행되는, 전자 디바이스 상에서 워터마킹된 신호를 적응적으로 인코딩하는 방법.
  24. 신호를 수신하는 단계;
    상기 신호에 기초하여 워터마킹된 비트스트림을 추출하는 단계;
    상기 워터마킹된 비트스트림의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 단계;
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로부터 워터마크 데이터를 추출하는 단계;
    상기 워터마크 데이터에 기초하여 제 1 신호를 획득하는 단계; 및
    상기 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하는 단계를 포함하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  25. 제 24 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 단계는 상기 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것에 기초하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  26. 제 25 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 단계는 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  27. 제 25 항에 있어서,
    상기 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 단계는 메모리 제한된 장기 예측 (LTP) 기여에 기초하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  28. 제 24 항에 있어서,
    상기 제 1 신호와 상기 제 2 신호를 결합하는 단계를 더 포함하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  29. 제 24 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙은 지각적으로 덜 중요한 정보를 포함하는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  30. 제 24 항에 있어서,
    상기 방법은 오디오 코덱에 의해 수행되는, 전자 디바이스 상에서 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하는 방법.
  31. 워터마킹된 신호를 적응적으로 인코딩하기 위한 명령들을 갖는 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은,
    전자 디바이스로 하여금 제 1 신호 및 제 2 신호를 획득하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 제 2 신호의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 제 1 신호에 기초하여 워터마크 데이터를 결정하도록 하는 코드; 및
    상기 전자 디바이스로 하여금 상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙 내에 상기 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하도록 하는 코드를 포함하는, 컴퓨터 판독가능 저장 매체.
  32. 제 31 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은,
    상기 제 2 신호에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것; 및
    상기 하나 이상의 높은 우선순위 코드북 트랙들이 아닌 임의의 트랙들을 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로 지정하는 것을 포함하는, 컴퓨터 판독가능 저장 매체.
  33. 인코딩되고 워터마킹된 비트스트림을 디코딩하기 위한 명령들을 갖는 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은,
    전자 디바이스로 하여금 신호를 수신하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 신호에 기초하여 워터마킹된 비트스트림을 추출하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 워터마킹된 비트스트림의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로부터 워터마크 데이터를 추출하도록 하는 코드;
    상기 전자 디바이스로 하여금 상기 워터마크 데이터에 기초하여 제 1 신호를 획득하도록 하는 코드; 및
    상기 전자 디바이스로 하여금 상기 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하도록 하는 코드를 포함하는, 컴퓨터 판독가능 저장 매체.
  34. 제 33 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은 상기 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것에 기초하는, 컴퓨터 판독가능 저장 매체.
  35. 제 1 신호 및 제 2 신호를 획득하기 위한 수단;
    상기 제 2 신호의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하기 위한 수단;
    상기 제 1 신호에 기초하여 워터마크 데이터를 결정하기 위한 수단; 및
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙 내에 상기 워터마크 데이터를 임베딩하여 워터마킹된 제 2 신호를 생성하기 위한 수단을 포함하는, 워터마킹된 신호를 적응적으로 인코딩하기 위한 장치.
  36. 제 35 항에 있어서,
    상기 제 2 신호의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은,
    상기 제 2 신호에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것; 및
    상기 하나 이상의 높은 우선순위 코드북 트랙들이 아닌 임의의 트랙들을 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로 지정하는 것을 포함하는, 워터마킹된 신호를 적응적으로 인코딩하기 위한 장치.
  37. 신호를 수신하기 위한 수단;
    상기 신호에 기초하여 워터마킹된 비트스트림을 추출하기 위한 수단;
    상기 워터마킹된 비트스트림의 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하기 위한 수단;
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙으로부터 워터마크 데이터를 추출하기 위한 수단;
    상기 워터마크 데이터에 기초하여 제 1 신호를 획득하기 위한 수단; 및
    상기 워터마킹된 비트스트림을 디코딩하여 제 2 신호를 획득하기 위한 수단을 포함하는, 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하기 위한 장치.
  38. 제 37 항에 있어서,
    상기 워터마킹된 비트스트림의 상기 적어도 하나의 낮은 우선순위 코드북 트랙을 결정하는 것은 상기 워터마킹된 비트스트림에 기초하여 하나 이상의 높은 우선순위 코드북 트랙들을 결정하는 것에 기초하는, 적응적으로 인코딩되고 워터마킹된 비트스트림을 디코딩하기 위한 장치.
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
KR1020137023578A 2011-02-07 2011-12-27 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스 KR101548846B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161440313P 2011-02-07 2011-02-07
US61/440,313 2011-02-07
US13/275,997 US8880404B2 (en) 2011-02-07 2011-10-18 Devices for adaptively encoding and decoding a watermarked signal
US13/275,997 2011-10-18
PCT/US2011/067405 WO2012108943A1 (en) 2011-02-07 2011-12-27 Devices for adaptively encoding and decoding a watermarked signal

Publications (2)

Publication Number Publication Date
KR20130126700A KR20130126700A (ko) 2013-11-20
KR101548846B1 true KR101548846B1 (ko) 2015-08-31

Family

ID=46601279

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137023578A KR101548846B1 (ko) 2011-02-07 2011-12-27 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스

Country Status (9)

Country Link
US (1) US8880404B2 (ko)
EP (1) EP2673769B1 (ko)
JP (1) JP5797780B2 (ko)
KR (1) KR101548846B1 (ko)
CN (1) CN103299365B (ko)
BR (1) BR112013020010A2 (ko)
ES (1) ES2573113T3 (ko)
HU (1) HUE027046T2 (ko)
WO (1) WO2012108943A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110153337A1 (en) * 2009-12-17 2011-06-23 Electronics And Telecommunications Research Institute Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
RU2505868C2 (ru) * 2011-12-07 2014-01-27 Ооо "Цифрасофт" Способ встраивания цифровой информации в аудиосигнал
US8806558B1 (en) * 2013-09-20 2014-08-12 Limelight Networks, Inc. Unique watermarking of content objects according to end user identity
US9191516B2 (en) 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
US9818415B2 (en) * 2013-09-12 2017-11-14 Dolby Laboratories Licensing Corporation Selective watermarking of channels of multichannel audio
US9293143B2 (en) 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
US9426525B2 (en) * 2013-12-31 2016-08-23 The Nielsen Company (Us), Llc. Methods and apparatus to count people in an audience
US10410643B2 (en) 2014-07-15 2019-09-10 The Nielson Company (Us), Llc Audio watermarking for people monitoring
CN109841216B (zh) * 2018-12-26 2020-12-15 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US6418424B1 (en) * 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6266419B1 (en) * 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6332030B1 (en) * 1998-01-15 2001-12-18 The Regents Of The University Of California Method for embedding and extracting digital data in images and video
KR20040048978A (ko) * 2001-10-25 2004-06-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법
US20030101049A1 (en) * 2001-11-26 2003-05-29 Nokia Corporation Method for stealing speech data frames for signalling purposes
JP4330346B2 (ja) * 2002-02-04 2009-09-16 富士通株式会社 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム
JP4578145B2 (ja) * 2003-04-30 2010-11-10 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP4527369B2 (ja) * 2003-07-31 2010-08-18 富士通株式会社 データ埋め込み装置及びデータ抽出装置
WO2005124681A1 (en) * 2004-06-14 2005-12-29 The University Of North Carolina At Greensboro Systems and methods for digital content security
US7644281B2 (en) * 2004-09-27 2010-01-05 Universite De Geneve Character and vector graphics watermark for structured electronic documents security
JP4531653B2 (ja) * 2005-08-05 2010-08-25 大日本印刷株式会社 音響信号からの情報の抽出装置
US20070217626A1 (en) * 2006-03-17 2007-09-20 University Of Rochester Watermark Synchronization System and Method for Embedding in Features Tolerant to Errors in Feature Estimates at Receiver
WO2008045950A2 (en) * 2006-10-11 2008-04-17 Nielsen Media Research, Inc. Methods and apparatus for embedding codes in compressed audio data streams
US8054969B2 (en) * 2007-02-15 2011-11-08 Avaya Inc. Transmission of a digital message interspersed throughout a compressed information signal

Also Published As

Publication number Publication date
CN103299365A (zh) 2013-09-11
EP2673769A1 (en) 2013-12-18
US20120203561A1 (en) 2012-08-09
HUE027046T2 (en) 2016-08-29
JP2014509409A (ja) 2014-04-17
JP5797780B2 (ja) 2015-10-21
WO2012108943A1 (en) 2012-08-16
CN103299365B (zh) 2015-05-20
EP2673769B1 (en) 2016-02-24
WO2012108943A8 (en) 2013-02-07
US8880404B2 (en) 2014-11-04
ES2573113T3 (es) 2016-06-06
BR112013020010A2 (pt) 2017-03-21
KR20130126700A (ko) 2013-11-20

Similar Documents

Publication Publication Date Title
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
JP6199334B2 (ja) 透かし入り信号を符号化し検出するための機器
KR101590239B1 (ko) 워터마킹된 신호를 인코딩 및 디코딩하는 디바이스들
KR101699138B1 (ko) 리던던트 프레임 코딩 및 디코딩을 위한 디바이스들
JP2016539536A (ja) 冗長フレーム情報を通信するシステムおよび方法
JP5639273B2 (ja) ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること
TWI394398B (zh) 用於傳輸資料分組序列的設備和方法以及用於對資料分組序列進行解碼的解碼器和設備

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 4