BRPI0113271B1 - método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar - Google Patents

método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar Download PDF

Info

Publication number
BRPI0113271B1
BRPI0113271B1 BRPI0113271A BR0113271A BRPI0113271B1 BR PI0113271 B1 BRPI0113271 B1 BR PI0113271B1 BR PI0113271 A BRPI0113271 A BR PI0113271A BR 0113271 A BR0113271 A BR 0113271A BR PI0113271 B1 BRPI0113271 B1 BR PI0113271B1
Authority
BR
Brazil
Prior art keywords
parameters
signal
function
perceptual
parameter
Prior art date
Application number
BRPI0113271A
Other languages
English (en)
Other versions
BR0113271A (pt
Inventor
Brett Graham Crockett
Matthew Aubrey Watson
Michael Mead Truman
Stephen Decker Vernon
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of BR0113271A publication Critical patent/BR0113271A/pt
Publication of BRPI0113271B1 publication Critical patent/BRPI0113271B1/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0064Image watermarking for copy protection or copy management, e.g. CGMS, copy only once, one-time copy

Abstract

"modulação de um ou mais parâmetros de um sistema de codificação de percepção de áudio ou de vídeo em resposta à informação suplementar". a presente invenção refere-se a método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação de percepção de acordo com informação suplementar, tal como uma marca d'água, de modo que a informação suplementar possa ser detectável na saída da função decodificadora. um ou mais parâmetros são modulados na função codificadora e/ou na função decodificadora em resposta à informação suplementar.

Description

Relatório Descritivo da Patente de Invenção para "MÉTODO PARA MODIFICAR A OPERAÇÃO DA FUNÇÃO CODIFICADORA E/OU DA FUNÇÃO DECODIFICADORA DE UM SISTEMA DE CODIFICAÇÃO PERCEPTUAL DE ACORDO COM INFORMAÇÃO SUPLEMENTAR".
CAMPO TÉCNICO [001] A presente invenção refere-se à esteganografia no contexto de sinais de áudio ou de vídeo. Mais particularmente, a invenção refe-re-se a modificar a operação do codificador e/ou do decodificador de um sistema de codificação perceptual de áudio ou de vídeo de acordo com informação suplementar de modo que a informação suplementar possa ser detectável na saída do decodificador. Tal informação suplementar freqüentemente é referida como uma "marca d’água". A colocação de marca d’água é um aspecto da esteganografia.
FUNDAMENTO DA TÉCNICA
Esteganografia e Colocação de Marca D’áqua [002] A esteganografia é a ciência de ocultar um sinal dentro de outro sinal. Os algoritmos ou processos da esteganografia podem ser robustos ou "frágeis" - ou seja, pode ser muito difícil ou muito fácil corromper o sinal oculto. Considerando as aplicações de áudio, uma técnica esteganográfica precária é utilizar o bit menos significativo de um canal PCM para transportar um fluxo de dados independente do conteúdo de programa de áudio, o qual seria transportado nos bits superiores. O canal de dados oculto carregado no bit menos significativo não destorce de forma significativa o programa de áudio, mas ao invés disso atua como um sinal de excitação de baixo nível. Esta técnica é frágil no sentido de que o processamento de áudio simples pode destruir o sinal de dado, tal como alterações de ganho, conversão de digital para analógico, etc. [003] A colocação de marca d’água é uma forma de esteganogra- fia na qual, tipicamente, a técnica de ocultação do sinal é pretendia para ser robusta em relação à corrupção pelo processamento normal ou pelo ataque deliberado. Como tal, as marcas d’água são valiosas nas aplicações relacionadas com a segurança, tal como proteção de cópia ou identificação de propriedade de conteúdo. Em tais aplicações, a marca d’água pode carregar, por exemplo, a condição de controle da cópia, a informação de direito autoral e informação relacionada com como o material do programa principal foi entregue. Mesmo se o programa principal for subseqüentemente roubado ou ilegalmente copiado, de forma ideal, a marca d’água permanece embutida dentro do material do programa e proporciona um meio para estabelecer a prova de propriedade. [004] Uma ou mais marcas d’água podem ser inseridas em vários pontos ao longo de um caminho de distribuição do "conteúdo" (por exemplo, performance de áudio ou de vídeo). A informação adicionada para o sinal no começo deste caminho pode conter informação de direito autoral ou de localização de direção enquanto informação adicionada no fim da cadeia do sinal pode conter informação de execução, tal como selos de data/hora e/ou número de série da máquina. Para o conteúdo ser rastreado na sua origem, marcas d’água podem ser embutidas em várias localizações ao longo do caminho de distribuição. [005] Uma consideração importante para a colocação de marca d’água nos sinais de áudio e de vídeo é que o sinal oculto não deve desnecessariamente degradar a qualidade do sinal no qual ele está oculto. De forma ideal, a marca d’água deve ser totalmente transparente, ou seja, a diferença entre o sinal com a marca d’água e o sinal original deve ser imperceptível (para um observador humano não-auxiliado). Obviamente, a diferença deve ser detectável por alguns dispositivos, a medida que de outra forma o sinal de marca d’água é irrecuperável. Entretanto, as marcas d’água podem ser intencionalmen- te perceptíveis para algumas aplicações. Por exemplo, imagens podem ser visivelmente colocadas com marca d’água de modo a impedir uso comercial. Em adição, o papel pode ter uma marca d’água de modo a transportar um selo de autenticidade perceptível. [006] Portanto, as metas da colocação de marca d’água podem ser resumidas como se segue: oomodificação de um sinal primário de modo a adicionar um sinal secundário ou informação suplementar, resultando em um sinal primário modificado, ooa diferença entre o sinal primário original e modificado deve ser detectável mas imperceptível, e ooa modificação deve ser difícil de remover ou de obscurecer. Codificação Perceotual [007] A codificação perceptual é a ciência de remover as irrelevâncias perceptuais dos sinais de modo a reduzir os mesmos a uma forma mais eficiente de expressão. Por exemplo, em algumas aplicações, a codificação perceptual é utilizada para reduzir a taxa de transmissão de dados dos sinais de áudio ou de vídeo digitais de modo a ir de encontro a uma exigência predeterminada de capacidade do canal. A codificação perceptual de sinais de áudio e de vídeo é uma disciplina bem estabelecida, permitindo que os sinais de áudio e de vídeo sejam reduzidos para taxas de dados relativamente baixas para armazenamento e transmissão eficientes. [008] Vários codificadores perceptuais operam por analisar o conteúdo do sinal original e por identificar a relevância perceptual de cada componente do sinal. Uma versão modificada do sinal original é então criada, de modo que a versão modificada possa ser expressa utilizando uma taxa de dados inferior do que a do sinal original. De forma ideal, a diferença entre os sinais original e modificado é imperceptível. O ruído, normalmente o ruído de quantização, ou outra distorção é de forma controlável introduzido de modo a reduzir a taxa de dados do sinal. As propriedades da percepção humana são levadas em consideração para manipular o ruído ou outra distorção de modo que ela permaneça imperceptível ou de forma mínima perceptível. [009] Os codificadores perceptuais empregam um modelo de mascaramento pretendido para refletir a percepção humana até algum grau de precisão. O modelo de mascaramento proporciona um limite de mascaramento perceptual que estabelece um limite para a percep-tibilidade. A linha contínua na Figura 1 apresenta o nível de pressão do som no qual o som, tal como uma onda seno ou uma banda estreita de ruído, é apenas audível, ou seja, o limite de audição. Os sons nos níveis acima da curva são audíveis; os abaixo não são. Este limite é claramente muito dependente da freqüência. Pode-se estar apto a escutar um som mais suave por exemplo e 4 kHz do que em 50 Hz ou 15 kHz. Em 25 kHz, o limite está fora de escala - não importa o quanto alto ele seja, não pode-se escutar o mesmo. [0010] Considere o limite, como apresentado pela linha tracejada na Figura 1, na presença de um sinal relativamente alto em uma freqüência, diga-se, de uma onda seno de 500 Hz, apresentada como a linha vertical na figura. O limite sobe dramaticamente nas vizinhanças imediatas de 500 Hz, modestamente alguma coisa adicionalmente longe na freqüência e nada em todas as partes remotas da faixa audível. [0011] Esta elevação no limite é chamada de mascaramento. Na presença do sinal de onda seno alto de 500 Hz (o "sinal de mascaramento" ou "mascarador"), os sinais sob este limite, os quais podem ser referidos como o "limite de mascaramento", são ocultos, ou mascarados, pelo sinal alto. Adicionalmente longe, outros sinais podem subir alguma coisa no nível acima do limite que não é sinal, ainda estando abaixo do novo limite mascarado e portanto sendo inaudível. Entretanto, nas partes remotas do espectro no qual o limite que não é sinal fica inalterado, qualquer ruído que fosse audível sem o mascarador de 500 Hz permanece igualmente audível com o mesmo. Portanto, o masca-ramento não é dependente da mera presença de um ou mais sinais de mascaramento; ele depende de onde eles estão espectral mente. Algumas passagens musicais, por exemplo, contém vários componentes espectrais distribuídos através da faixa de freqüência audível e portanto, fornecem uma curva de limite mascarada que é elevada em todos os lugares em relação à curva de limite que não é de sinal. Outras passagens musicais, por exemplo, consistem em som relativamente altos a partir de um instrumento de solo possuindo componentes espectrais confinados em uma pequena parte do espectro, assim fornecendo uma curva mascarada mais parecida com o exemplo do mascarador de onda seno da Figura 1. [0012] O mascaramento também possui um aspecto temporal que depende da relação de tempo entre os mascaradores e os sinais mascarados. Alguns sinais de mascaramento proporcionam mascarar essencialmente somente enquanto o sinal de mascarar está presente ("mascaramento simultâneo"). Outros sinais de mascaramento proporcionam mascaramento não somente enquanto o mascarador ocorre mas também antes no tempo ("mascaramento retrógrado" ou "pré-mascaramento") e depois no tempo ("mascaramento à frente" ou "pós-mascaramento"). Um aumento "transitório", repentino, breve e significativo no nível do sinal pode exibir todos os três "tipos" de mascaramento: o mascaramento retrógrado, o mascaramento simultâneo e o mascaramento à frente, ao passo que um sinal de estado constante ou de estado quase constante pode exibir somente o mascaramento simultâneo. [0013] Todo ruído e distorção que é adicionado pelo processo de codificação perceptual deve permanecer abaixo do limite de mascaramento de modo a evitar deteriorações perceptíveis. Se o ruído ou a distorção adicionado pelo processo de codificação alcançar, mas não exceder, o limite de mascaramento, o sinal é dito como sendo codificado no nível de "diferença apenas perceptível". A "margem de codificação" de um sistema pode ser definida como a quantidade pela qual o ruído ou distorção adicionado situa-se abaixo do limite de mascaramento - uma margem de codificação de zero significa que o sinal está codificado no nível de diferença apenas perceptível, enquanto uma margem de codificação positiva significa que o ruído ou distorção adicionado é imperceptível com algum espaço para ceder e uma margem de codificação negativa significa que deteriorações perceptíveis estão presentes. [0014] Observe que aspectos diferentes do sinal (por exemplo, largura de banda, resolução de tempo, precisão espacial, etc.) podem ser codificados em graus diferentes de precisão, resultando em margem de codificação diferentes para diferentes características do sinal. Se um sinal fonte for codificado de modo que a margem de codificação seja não-negativa para todas as características do sinal, ele pode ser dito como sendo perceptivelmente equivalente à fonte. [0015] Um sistema de codificação perceptual consiste em um codificador que pode comunicar a informação de alocação de bit ou a informação do modelo perceptual junto com os dados codificados para um decodificador. Existem três tipos principais de sistemas de codificação perceptual: adiante adaptável, retrógrado adaptável e um híbrido dos dois. Em um sistema a frente adaptável, o codificador explicitamente envia a informação de alocação de bit para o decodificador. Um sistema retrógrado adaptável não envia qualquer informação de alocação de bit ou de modelo perceptual para o decodificador. O decodificador recebe a alocação de bit a partir dos dados codificados. Um sistema híbrido permite que alguma informação de alocação, tal como uma forma de resolução menor do que a total do modelo perceptual, seja incluída nos dados codificados, mas muito menos do que em um sistema adiante adaptável. Uma discussão mais detalhada destes três tipos de sistemas de codificação perceptual é exposta em "AC-3: Fle-xible Perceptual Coding for Audio Transmission and Storage", de Craig C. Todd et al., Preprint 3796, 96th Convention of the Audio Engineering Society, de 26 de fevereiro a 1 de março de 1994. Os sistemas de codificação perceptual desenvolvidos pelo Dolby Laboratories, tais como os sistemas de codificação Dolby Digital e Dolby E, identificados adicionalmente abaixo, são exemplos de sistemas para frente/para trás híbridos adaptáveis, enquanto o sistema de codificação MPEG-2 AAC, também identificado adicionalmente abaixo, é um exemplo de um sistema adiante adaptável. [0016] As metas dos codificadores perceptuais podem ser resumidas como se segue: oomodificação de um sinal primário resultando em um sinal modificado, ooa diferença entre o sinal original e modificado deve ser imperceptível, e ooa representação do sinal modificado deve ser mais eficiente do que a representação do sinal original.
Segurança [0017] A colocação de marca d’água como uma medida de segurança é somente tão forte quando a habilidade da marca d’água sobreviver a um ataque direto. Várias técnicas de colocação de marca d’água atualmente em uso tentam proteger elas próprias de um ataque com sucesso por manter os detalhes da marca d’água um segredo, sob a suposição de que se a marca d’água não for publicamente conhecida, os atacantes não saberão como modificar o sinal com a marca d’água para obscurecer os dados da marca d’água. Isto é um princípio conhecido como "segurança através da obscuridade". No campo da criptografia, a segurança através da obscuridade geralmente é rejeitada como um princípio ilógico. Se um algoritmo ou processo deriva sua segurança através do segredo, ele somente pega uma pessoa para revelar os detalhes da técnica para a segurança de todo o sistema ser comprometida. [0018] As metas da segurança podem ser resumidas como se segue: ooproteger o conteúdo de modo que o furto do conteúdo seja inutilizável ou permita a subsequente prova de pirataria e a capacidade de rastreamento da fonte da pirataria. ooseja robusta contra ataques, e oo mantenha alta segurança igualmente no elo mais fraco no sistema.
DESCRIÇÃO DA INVENÇÃO [0019] A presente invenção é direcionada para um método para modificar a operação do codificador e/ou do decodificador de um sistema de codificação perceptual em resposta à informação suplementar de modo que a informação suplementar possa ser detectável na saída do decodificador. Um ou mais parâmetros no codificador e/ou no decodificador são modulados em resposta à informação suplementar. [0020] De acordo com a presente invenção, a informação suplementar, tal como a informação de marca d’água, é transportada pela modulação de um ou mais parâmetros no codificador e/ou no decodificador de um sistema de codificação perceptual de modo a causar uma alteração detectável, mas de preferência imperceptível, na saída do decodificador. Esta informação é "suplementar" pelo fato de que ela é em adição à informação primária, tal como a informação de áudio ou de vídeo, transportada pelo sistema de codificação. Tipicamente, tal informação suplementar é na natureza de uma "marca d’água", apesar de ela não precisar ser. A modulação de um ou mais parâmetros pode ser dita como "embutida" na informação suplementar ou de marca d’água no sinal codificado (no caso de parâmetros de modulação no codificador perceptual) e no sinal decodificado (no caso de parâmetros de modulação no codificador perceptual e/ou no decodificador perceptual). [0021] Apesar de certas implementações da invenção, quando implementada pelo menos parcialmente em um codificador, poderem indiretamente modificar os dados de fluxo de bits representando a informação primária, a invenção não contempla a modificação direta dos dados do fluxo de bits representando a informação primária (nem a modificação da informação primária que torna-se os dados do fluxo de bits após a quantização no codificador perceptual). A invenção contempla a detecção da informação suplementar na saída do decodificador perceptual (quer tal informação seja transportada como o resultado das ações no codificador e/ou no decodificador) ao invés do que no fluxo de bits decodificado. [0022] Por "modulação" deseja-se dizer variar o valor de um parâmetro entre ou no meio de um ou mais valores (estados), onde os ditos valores podem incluir um "valor preestabelecido", valor este que o parâmetro de outro modo teria sido onde ele não fosse para a ação da presente invenção. Por exemplo, o valor do parâmetro pode ser variado entre ou no meio de seu valor e um ou mais outros valores (no caso de um parâmetro possuindo somente dois valores possíveis, tal como um parâmetro algumas vezes referido como um "sinalizador", o parâmetro pode ser variado entre estes dois valores), ou ele pode ser variado entre ou no meio de um ou mais outros valores, valores estes que não incluem o valor preestabelecido. [0023] Por "modulação em resposta" à informação suplementar ou a um sinal ou seqüência de marca d’água deseja-se dizer que a modulação de um parâmetro é controlada pela informação suplementar ou sinal ou seqüência de marca d’água diretamente ou indiretamente, tal como quando o controle é modificado por uma função de um ou mais outros sinais, os sinais incluindo, por exemplo, um conjunto de instruções, tal como uma seqüência determinística ou sinal de entrada aplicado junto ao sistema de codificação. [0024] Por "parâmetro" deseja-se dizer uma variável dentro de um sistema de codificação perceptual que não são os dados do fluxo de bits representando a informação primária. Exemplos de Dolby Digital (AC-3), de áudio MPEG e de parâmetros de vídeo MPEG que são adequados para a modulação de acordo com os aspectos da presente invenção são apresentados abaixo nas tabelas das Figuras 6, 7 e 8, respectivamente. A invenção também contempla a modulação de um ou mais parâmetros que não são reconhecidos nos padrões publicados de codificador perceptual, incluindo parâmetros ainda a serem definidos. [0025] Por "dados do fluxo de bits representando a informação primária" deseja-se dizer os bits de dados no fluxo de bits codificado, gerado pelo codificador perceptual mas ainda não-decodificados, os quais transportam a informação primária, tal como a informação de áudio ou de vídeo. Os dados do fluxo de bits representando informação primária incluem, por exemplo, no caso do sistema Dolby Digital (AC-3), expoentes e mantissas e no caso de um sistema MPEG-2 AAC, fatores de escala e coeficientes codificados Huffman. [0026] Em sistemas de codificação perceptuais complexos (por exemplo, áudio Dolby Digital e Dolby E, áudio MPEG, vídeo MPEG, etc.), um grande número de parâmetros de codificação independentes proporcionam um grau significativo de flexibilidade de codificação. "Dolby", "Dolby Digital" e "Dolby E" são marcas registradas da Dolby Laboratories Licensing Corporation. [0027] Os detalhes da codificação Dolby Digital são expostos no "Digital Audio Compression Standard (AC-3)", Advanced Television Systems Committee (ATSC), Documento A/52, de 20 de dezembro de 1995 (disponível na World Wide Web da Internet no www.atsc.orq/Standards/A52/a 52.doc). Veja também a Folha de Errata de 22 de Julho de 1999 (disponível na World Wide Web da Internet no www.dolbv.com/tech/ATSC err.pdf). [0028] Os detalhes da codificação Dolby E são expostos na "Effici-ent Bit Allocation, Quantization, and Coding in an Audio Distribution System", AES Preprint 5068, 107th AES Conference, de agosto de 1999 e "Professional Audio Coder Optimized for Use with Video", AES Preprint 5033, 107th AES Conference de agosto de 1999. [0029] Os detalhes da codificação MPEG-2 AAC são expostos na ISO/IEC 13818-7:1997(E) "Information technology - Generic coding of moving pictures and associated audio Information --, part 7: Advanced Audio Coding (AAC)", International Standards Organization (Abril de 1997); "MP3 and AAC Explained" de Karlheinz Brandenburg, AES 17th International Conference on High Quality Audio Coding, agosto de 1999; e "ISO/IEC MPEG-2 Advanced Audio Coding" de Bosi et al., AES preprint 4382, 101 st AES Convention, Outubro de 1996. [0030] Uma vista geral dos vários codificadores perceptuais, incluindo os codificadores Dolby, codificadores MPEG e outros é exposta em "OverView of MPEG Audio: Current and Future Standards for Low-Bit-Rate Audio Coding" de Karlheinz Brandenburg e Marina Bosi, J. Audio Soc., Vol. 45, Ns 1/2, de Janeiro/Fevereiro de 1997. [0031] Valores preestabelecidos específicos para os parâmetros de codificação perceptual são geralmente escolhidos pelo sistema de codificação baseado nas características do sinal de entrada. Entretanto, existe normalmente mais do que um modo de selecionar os valores do parâmetro de codificação que produzem os sinais decodificados não possuindo diferenças perceptíveis e tais variações nos valores do parâmetro de codificação podem resultar nos sinais decodificados com diferenças detectáveis, ainda que imperceptíveis. Observe que a im-perceptibilidade refere-se à percepção humana ao passo que a capacidade de detecção é baseada nas capacidades de um detector não-humano. [0032] Um detector de sinal suplementar ou marca d’água recupera a informação embutida contida dentro do sinal reproduzido (decodificado). No caso de sinais de áudio, por exemplo, a detecção pode ser realizada acusticamente em alguns casos, enquanto a detecção eletrônica pode ser requerida em outros casos. A detecção eletrônica pode ser nos domínios digital ou analógico. A detecção eletrônica no domínio digital pode ser no domínio de tempo ou de freqüência da saída decodificada ou pode ser no domínio de freqüência dentro do decodifi-cador antes da conversão de freqüência para tempo. A extração da marca d’água após o processamento acústico é considerado um desafio mais difícil por causa da adição do ruído do ambiente, das características do alto-falante ou do microfone e do volume de execução geral. [0033] Vários sistemas de codificação perceptual práticos não vão de encontro ao requerimento de manter o ruído adicionado abaixo do nível da diferença recém perceptível. Os requerimentos de perceptibili-dade nos sistemas de codificação perceptual são freqüentemente relaxados para ir de encontro às metas de taxa de bits ou aos limites de complexidade. Nestes casos, apesar do ruído adicionado durante a codificação perceptual poder ser perceptível, provavelmente existirão valores diferentes dos valores preestabelecidos para os quais os parâmetros da codificação podem ser modulados, os quais não irão produzir quaisquer mais ruídos perceptíveis do que os já perceptíveis. Apesar da modulação de um parâmetro poder resultar em alteração substancialmente não-perceptível no ruído percebido, entretanto, pode resultar em uma alteração detectável no sinal decodificado. [0034] De preferência, de acordo com aspectos da presente invenção, um ou mais parâmetros são modulados de modo que os efeitos da modulação causem que o ruído e a distorção adicionados pela codificação perceptual fiquem próximos, mas abaixo do nível da diferença recém perceptível em todo ou em parte do espectro da freqüência ("distorção", neste sentido, é a diferença entre os sinais codificado e original e pode ou não resultar em artefatos audíveis). Portanto, seria difícil remover ou obscurecer os efeitos resultantes da modulação de um ou mais parâmetros sem exceder o limite de mascaramento e criar uma deterioração perceptível. Por outro lado, se um ataque fosse abaixo do limite de mascaramento, então parte dos efeitos da modulação do parâmetro provavelmente irá permanecer. [0035] Como sugerido acima, os aspectos da presente invenção podem também ser empregados quando o codificador não codifica o sinal fonte primário de modo que o ruído e a distorção estão abaixo do nível da diferença recém perceptível. Neste caso, o sinal fonte é codificado de modo que ele seja deteriorado em relação à fonte e a modulação de parâmetro introduz as deteriorações no sinal decodificado que são diferentes de um ponto de vista de detecção, mas, de preferência, são substancialmente a mesma capacidade de percepção. Como no caso anterior, seria difícil remover ou obscurecer os efeitos resultantes da modulação de parâmetro no sinal decodificado sem exagerar a deterioração ou introdução de deterioração adicional com um grau maior de capacidade de percepção. [0036] A maneira de se abordar da presente invenção é fundamentalmente diferente das técnicas que aplicam uma marca d’água antes da codificação perceptual. Nesta técnicas, mesmo que no entanto o sistema de codificação possa conter margem de codificação suficiente para transportar uma marca d’água, não existe garantia de que o método particular escolhido para transportar a marca d‘água anterior coin- cida com a localização da margem de codificação do sistema de codificação perceptual. Pelo fato de tais sistemas anteriores operarem de forma independente, eles podem ocasionalmente interagir de forma ruim, introduzindo deteriorações perceptíveis ou causando que a marca d’água seja obscurecida. [0037] Como mencionado acima, os codificadores perceptuais reduzem a taxa de dados de um sinal ou entrada por remover a informação perceptivelmente redundante. Por exemplo, um codificador com taxa de dados constante reduz uma taxa fixa de informação de entrada para uma taxa de informação fixa inferior. Parte desta redução de dados requer uma função algumas vezes caracterizada como um "controle de taxa" que garante que a saída do codificado não exceda ao tamanho final fixo da informação. O controle da taxa reduz a informação até que ela tenha alcançado o tamanho final codificado. [0038] Em alguns codificadores perceptuais, uma medida de distorção é emparelhada com o controle de taxa para garantir que a informação correta seja descartada. Uma medida de distorção compara o sinal de entrada original com o sinal codificado (saída do controle de taxa). A medida de distorção pode ser utilizada para controlar os parâmetros de codificação para alterar o resultado do processo de controle de taxa. [0039] O aspecto de controle de taxa de distorção da presente invenção busca resolver o problema de como embutir uma marca d’água em um codificador perceptual ao mesmo tempo que maximizando a potência e minimizando a capacidade de percepção do sinal embutido. Em uma modalidade, a presente invenção também permite a um usuário escolher a potência, ou energia, do sinal embutido por ajustar um parâmetro no processo de embutimento da marca d’água. [0040] Em adição à modulação de parâmetro, os aspectos da presente invenção empregam um conjunto de instruções dal como uma seqüência determinística para variar certos aspectos da modulação de parâmetro e por conseqüência, características da marca d’água resultante. As seqüências determinísticas são geradas por processos matemáticos que produzem seqüências de uns e zeros binários calculados dada uma equação de definição (a equação geradora) e um estado inicial (a chave). Uma série de aspectos alternativos da invenção empregando as seqüências determinísticas são descritas. Estas técnicas podem aperfeiçoar a imperceptibilidade da marca d’água e também podem aperfeiçoar a robustez da marca d’água, o que é um resultado interessante e útil visto que várias outras técnicas que aperfeiçoam a imperceptibilidade tendem a degradar a robustez. Finalmente, estas técnicas podem aperfeiçoar a segurança, no sentido de que elas tornam possível revelar todos os aspetos do sistema de colocação de marca d’água (exceto para a chave da seqüência determinística) sem sacrificar a robustez do sistema. [0041] Os aspectos da seqüência determinística da presente invenção podem incluir um ou mais dos seguintes atos: oo Utilizar uma seqüência determinística para modificar a taxa de transição de modulação do parâmetro e por conseqüência, a taxa de transição do símbolo da marca d’água (veja a Tabela 1, abaixo), oo Utilizar uma seqüência determinística para selecionar os parâmetros para modulação (veja tabela 2, abaixo), e oo Utilizar uma seqüência determinística para modificar a taxa na qual a escolha dos parâmetros para modulação se altera (veja Tabela 3, abaixo). [0042] Em adição, aspectos alternativos da presente invenção incluem atos de utilizar características do sinal fonte para controlar a modulação de parâmetro e/ou a escolha dos parâmetros para modulação. Os aspectos em resposta ao sinal fonte da presente invenção podem incluir um ou mais dentre os seguintec atos: ooUtilizar as características do sinal fonte para variavelmente modificar a taxa de modulação do parâmetro e por conseqüência, a taxa de transição do símbolo da marca d’água (veja parte a da tabela 4, abaixo), oo Utilizar características do sinal fonte para variavelmente modificar a taxa na qual a escolha dos parâmetros para a modulação altera-se (veja parte b da Tabela 4, abaixo), e oo Utilizar características do sinal fonte para variavelmente modificar o número de parâmetros no conjunto de parâmetros disponível para modulação (veja Tabela 5, abaixo). [0043] Como adicionalmente explicado abaixo, tanto uma seqüên-cia determinística como as características do sinal fonte podem ser utilizadas em conexão com os parâmetros de modulação de acordo com aspectos alternativos da presente invenção. Veja as Tabelas 6, 7 e 8, abaixo. [0044] Para algumas implementações da invenção, a detecção da marca d’água na saída do decodificador perceptual é provável de requerer acesso à informação primária aplicada para o codificador. Para algumas outras implementações da invenção, a detecção da marca d’água pode ser executada sem ter acesso à informação primária original com o custo de maior complexidade na detecção. [0045] É freqüentemente desejável aplicar uma marca d’água única ou "serializada" (por exemplo, um número de série) no ponto onde os sinais são entregues para uma audiência. De acordo com aspectos da presente invenção, a informação suplementar ou uma marca d’água é embutida durante o processo de decodificação perceptual. Um ou mais parâmetros são modulados no decodificador antes da quantiza-ção inversa. [0046] A imperceptibilidade pode ser mantida se o ruído ou distorção adicionado pelo processo de modulação do parâmetro do decodifi- cador não exceder a um limite perceptual. De modo a embutir uma marca d’água de forma imperceptível como parte do processo de de-codificação, um limite perceptual é utilizado. Vários codificadores per-ceptuais transmitem modelos perceptuais a partir do processo de codificação para o processo de decodificação de alguma forma ou outra; entretanto, outros codificadores proporcionam somente aproximações ou representações grosseiras do limite perceptual. O limite perceptual mais preciso é derivado a partir dos coeficientes espectrais fonte não-quantizados, mas o aumento da taxa de dados é significativo se tais dados forem transmitidos para o decodificador. Alternativamente, o limite perceptual proporcionado para o decodificador em um sistema de codificação perceptual pode ser um expoente de uma mantissa na qual o expoente representa a amostra de informação possuindo a energia máxima dentro de uma banda crítica (como no sistema Dolby Digital). De modo a aperfeiçoar a precisão do limite perceptual no decodificador, os expoentes podem ser transmitidos a partir do codificador, os quais são baseados em uma média da energia de amostra em uma banda ao invés da energia máxima na banda. [0047] Apesar dos parâmetros de modulação no decodificador serem similares aos parâmetros de modulação no codificador em várias relações, existe menos flexibilidade. Por exemplo, modular um ou mais parâmetros em um sistema de decodificação pode requerer seja tomado cuidado quando reformulando a informação de alocação de bit baseada nos parâmetros da codificação. Adicionalmente, é mais difícil produzir imperceptíveis os efeitos da modulação de parâmetro no decodificador. Uma razão para isto é que, pelo menos no caso de um codificador ideal, o processo de codificação já adicionou erro de quanti-zação até o limite de perceptibilidade. Entretanto, este não é sempre o caso, a medida que a margem de codificação pode existir, por exemplo, devido às imperfeições no modelo perceptual, a um deslocamento da proporção de sinal para ruído positiva, ou às condições do sinal. BREVE DESCRIÇÃO DOS DESENHOS [0048] A Figura 1 é uma plotagem idealizada apresentando (linhas contínuas) o nível de pressão do som no qual o som é apenas audível (o limite de audição) quando nenhum sinal de mascaramento está presente e apresentando (linhas tracejadas) o limite de audição na presença de uma onda seno de 500 Hz. [0049] A Figura 2 é um diagrama de blocos funcional ilustrando os princípios básicos da presente invenção na qual a informação suplementar modula um ou mais parâmetros de uma função codificadora perceptual e/ou uma função decodificadora perceptual em um sistema de codificação perceptual. [0050] A Figura 3A é um diagrama de blocos funcional ilustrando um aspecto da presente invenção que inclui uma função detectora de informação suplementar recebendo a saída do sistema de codificação. [0051] A Figura 3B é um diagrama de blocos funcional ilustrando com mais detalhes da função detectora, o aspecto da presente invenção que inclui uma função detectora de informação suplementar recebendo a saída do sistema de codificação. [0052] A Figura 4 é um diagrama de blocos funcional ilustrando um aspecto da presente invenção que inclui uma função detectora de informação suplementar recebendo tanto a saída do sistema de codificação como a entrada para o sistema de codificação. [0053] A Figura 5 é um diagrama de blocos funcional ilustrando um aspecto da presente invenção no qual a função detectora de informação suplementar inclui não somente uma função comparadora, mas também uma função codificadora perceptual e uma função decodificadora perceptual, nenhuma das quais têm seus parâmetros modulados. [0054] A Figura 6 é uma tabela apresentando parâmetros adequados para modulação em certos codificadores perceptuais de áudio do tipo para frente/para trás adaptável. [0055] A Figura 7 é uma tabela apresentando parâmetros adequados para modulação em certos codificadores de áudio do tipo adiante adaptável. [0056] A Figura 8 é uma tabela apresentando parâmetros adequados para modulação em certos codificadores perceptuais de vídeo. [0057] A Figura 9 é uma representação esquemática de certos parâmetros que espectral mente modelam a curva de mascaramento do ouvido humano (parâmetros do modelo de mascaramento espectral) em certos codificadores perceptuais de áudio. [0058] A Figura 10 é uma representação esquemática dos parâmetros do modelo de mascaramento espectral capazes de serem modulados em uma classe de codificadores perceptuais de áudio. [0059] A Figura 11A é uma representação idealizada apresentando a modulação do parâmetro de deslocamento SNR (um parâmetro de limite de mascaramento) na presença de um sinal de onda seno em certos codificadores perceptuais de áudio. [0060] A Figura 11B é uma representação idealizada apresentando o efeito na saída do decodificador perceptual quando o parâmetro de deslocamento SNR é modulado de uma maneira apresentada na Figura 11A para o caso de um sistema de codificação constrangido por bit. [0061] A Figura 11C é uma representação idealizada apresentando o efeito na saída do decodificador perceptual quando o parâmetro de deslocamento SNR é modulado da maneira apresentada na Figura 11A para o caso de um sistema de codificação que não seja constrangido por bit. [0062] A Figura 11D apresenta as legendas empregadas nas Figuras 11A até 11C e 12A até 12C. [0063] A Figura 12A é uma representação idealizada apresentando a modulação do parâmetro de código de ganho rápido (um parâmetro de limite de mascaramento) na presença de um sinal de onda seno em certos codificadores perceptuais de áudio. [0064] A Figura 12B é uma representação idealizada apresentando o feito na saída do decodificador perceptual quando o parâmetro de ganho rápido é modulado da maneira apresentada na Figura 12A para o caso de um sistema de codificação constrangido por bit. [0065] A Figura 12C é uma representação idealizada apresentando o efeito na saída do decodificador perceptual quando o parâmetro de ganho rápido é modulado da maneira apresentada na Figura 12A para o caso de um sistema de codificação que não é constrangido por bit. [0066] A Figura 13 é uma representação idealizada apresentando os efeitos, em certos codificadores perceptuais de áudio, de modular os parâmetros diferentes dos parâmetros de mascaramento em certos codificadores perceptuais de áudio, a saber, o indicador de "acoplamento em uso", o indicador de nova formação de matriz em uso e o código de freqüência de começo de acoplamento. [0067] A Fig. 14 é uma representação idealizada apresentado os efeitos, em certos codificadores perceptuais de áudio, de modular um parâmetro diferente de um parâmetro de mascaramento, a saber, o indicador de fase. [0068] A Figura 15 é uma série de formas de onda idealizadas apresentando os formatos de janela com efeito descontinuado no domínio de tempo para embutir informação suplementar durante a codificação. [0069] A Figura 16 é uma série de formas de onda idealizadas apresentando formatos de janela com efeito descontinuado no domínio de tempo para embutir informação suplementar durante a decodifica-ção. [0070] A Figura 17 é uma resposta de envelope temporal idealizada, plotando o nível de pressão do som (SPL) versus o tempo ilustran- do os efeitos do mascaramento temporal de um sinal de mascaramen-to. [0071] A Figura 18 é uma representação idealizada apresentando o tipo de modulação que pode ser aplicada junto a um sinal de modo que os efeitos sejam constrangidos dentro de um envelope de mascaramento temporal. [0072] A Figura 19 é uma série de plotagens de amplitude versus freqüência idealizadas ilustrando como um símbolo de 2 bits pode ser representado por quatro larguras de banda diferentes. [0073] A Figura 20 é uma plotagem de freqüência versus tempo idealizada apresentando um exemplo de um sinal de áudio que contém um sinal embutido utilizando a largura de banda do sinal para representar símbolos diferentes. [0074] A Figura 21 é uma plotagem de amplitude versus freqüência idealizada ilustrando a adição de ruído modelado para o nível aproximado do limite de audição humana na presença de um sinal de onda seno. [0075] A Figura 22 é uma plotagem de energia versus freqüência idealizada apresentando três níveis de energia diferentes requeridos para detectar quatro larguras de banda diferentes que criam um símbolo de 2 bits. [0076] A Figura 23 é uma plotagem de amplitude versus energia idealizada apresentando vários histogramas ilustrativos da distribuição de estados "alto" e "baixo". [0077] As Figuras 24 até 26 são fluxogramas lógicos apresentando um processo para embutir uma marca d’água utilizando um limite de perceptibilidade. [0078] A Figura 24 é um fluxograma lógico apresentando a parte do loop de repetição interno do processo para embutir uma marca d’água utilizando um limite de perceptibilidade. [0079] A Figura 25 é um fluxograma lógico apresentando a parte do loop de repetição externo do processo para embutir uma marca d’água utilizando um limite de perceptibilidade, no qual os coeficientes espectrais do loop externo são amplificados. [0080] A Figura 26 é um fluxograma lógico apresentando a modificação do processo da Figura 25 para preencher o modelo psicoacústi-co, ou o limite perceptual, o máximo possível enquanto também embutindo a informação suplementar ou o sinal de marca d’água. [0081] A Figura 27 apresenta uma série de formas de onda idealizadas representando, através de um espectro de freqüência, o limite perceptual, o erro do quantizador e o erro do quantizador modificado, ilustrando como uma marca d’água pode ser embutida utilizando um processo de medida de distorção para o caso de modular um parâmetro que afeta o erro do quantizador dentro de uma banda crítica. [0082] A Figura 28 apresenta uma série de formas de onda idealizadas representando, através de um espectro de freqüência, o limite perceptual, o erro do quantizador e o erro do quantizador modificado, ilustrando como uma marca d’água pode ser embutida utilizando um processo de medida de distorção para o caso de modular um parâmetro que afeta o deslocamento da proporção de sinal para ruído por todo o espectro de freqüência. [0083] A Figura 29 é um fluxograma lógico ilustrando as etapas de um processo para embutir uma marca d’água durante a decodificação, de acordo com aspectos da presente invenção. [0084] A Figura 30 é um diagrama de blocos funcional apresentando outros aspectos da invenção nos quais o controle da modulação pela informação suplementar da marca d’água é modificado por uma função de um ou mais outros sinais ou seqüências de dados incluindo, por exemplo, uma seqüência determinística e/ou o sinal de entrada aplicado junto ao sistema de codificação.
MELHOR MODO DE REALIZAR A INVENÇÃO [0085] A Figura 2 é um diagrama de blocos funcional ilustrando os princípios básicos da presente invenção. Uma função codificadora per-ceptual 2 e uma função decodificadora perceptual 4 compreendem um sistema de codificação. A informação primária, tal como informação de áudio ou de vídeo, é aplicada junto à função codificadora perceptual 2. A função codificadora 2 gera um fluxo de bits digital que é recebido pela função decodificadora perceptual 4. Um ou mais parâmetros na função codificadora e/ou na função decodificadora são modulados em resposta à informação suplementar (por exemplo, um sinal ou seqüên-cia de marca d’água). Pelo fato da informação suplementar poder ser aplicada junto à função codificadora ou junto à função decodificadora ou junto a ambas, linhas tracejadas são apresentadas a partir da informação suplementar até a função codificadora e até a função decodificadora, respectivamente. A saída da função decodificadora de recepção é a informação primária com a informação suplementar embutida. A informação suplementar pode ser detectável na saída da função decodificadora. [0086] Se a informação suplementar for aplicada junto tanto à função codificadora 2 como junto à função decodificadora 4, tipicamente, a informação aplicada junto a uma será diferente desta aplicada junto à outra. Por exemplo, a informação suplementar controlando os um ou mais parâmetros da função codificadora pode ser uma marca d’água identificando o proprietário do conteúdo de áudio ou de vídeo e a informação suplementar controlando o um ou mais parâmetros da função decodificadora pode ser um número de série identificando o equipamento que apresenta o conteúdo de áudio ou de vídeo para um ou mais consumidores. Tipicamente, a informação suplementar seria aplicada junto à função codificadora e junto à função decodificadora em momentos diferentes. [0087] As Figuras 3 até 5 são diagramas de blocos funcionais ilustrando os princípios básicos de um aspecto da presente invenção que inclui uma função detectora para detectar a informação suplementar na saída da função decodificadora. A detecção pode ser realizada no domínio digital ou no domínio analógico (elétrico ou acústico) da saída da função decodificadora. A detecção também pode ser realizada no domínio digital da função decodificadora após a decodificação mas antes da conversão do domínio de freqüência para o domínio de tempo. [0088] A Figura 3A é a mesma que a Figura 2 exceto que ela inclui uma função detectora 6 recebendo a saída da função decodificadora 4 que detecta a informação suplementar na saída da função decodificadora. A saída da função detectora 6 é a informação suplementar. A Figura 4 é a mesma que a Figura 3A exceto que ela inclui uma função detectora 8 recebendo não somente a saída da função decodificadora 4 mas também a mesma informação primária aplicada junto à função codificadora. A função essencial da função detectora 8 é comparar a informação de entrada original aplicada junto à função codificadora com a saída da função decodificadora de modo a proporcionar como sua saída a informação suplementar. A Figura 5 é uma variação da disposição da Figura 4. Na Figura 5, como na Figura 4, uma função detectora 10 recebe a saída da função decodificadora 4 e a informação primária aplicada junto à função codificadora 2. Entretanto, a função detectora 10 difere da função detectora 8 e inclui não somente uma função comparadora 12, mas também uma função codificadora percep-tual 14 e uma função decodificadora perceptual 16. A função codificadora 14 é a mesma que a função codificadora 2, exceto que seus parâmetros não estão modulados. A função decodificadora 16 é a mesma que a função decodificadora 4, exceto que seus parâmetros não estão modulados. Portanto, o ato de detectar a informação suplementar na saída do decodificador é realizado por um dos seguintes atos: [0089] observar o sinal decodificado, [0090] comparar o sinal decodificado com o sinal aplicado junto à função codificadora, e [0091] comparar o sinal decodificado com o sinal decodificado a partir de um sistema de codificação perceptual substancialmente idêntico no qual nenhum parâmetro na função codificadora ou na função decodificadora são modulados em resposta à informação suplementar. [0092] A disposição de detecção da Figura 3A é mais adequada para detectar os efeitos de certos tipos de modulação de parâmetro, tal como quando um parâmetro de largura de banda é modulado (os parâmetros de modulação de largura de banda são descritos em detalhes abaixo). De modo a detectar os efeitos de modular a maioria dos parâmetros, é necessário comparar a informação primária aplicada junto ao codificador com a informação primária transportando a informação suplementar proporcionada pelo decodificador como nas disposições das Figuras 4 e 5. A disposição da Figura 5 torna possível fazer uma comparação mais rigorosa porque as únicas diferenças entre a informação comparada serão aquelas causadas pelos parâmetros de modulação. Na disposição da Figura 4, as diferenças incluem outros efeitos que podem ser introduzidos pelos processo de codificação e de codificação perceptual. [0093] Pelo fato da disposição de detecção da Figura 3A não requerer acesso à informação primária aplicada junto ao codificador perceptual, ela pode ser realizada em tempo real ou próxima de tempo real, dependendo de quais parâmetros do codificador e/ou do decodificador são modulados. Por exemplo, modular um parâmetro de largura de banda pode permitir a detecção pela análise somente da saída do decodificador em tempo real ou próximo de tempo real. Particularmente, a função detectora 6 da disposição da Figura 3A pode incluir uma ou mais funções de retardo de modo que a saída da função decodifica- dora 4 possa ser comparada com ela mesma. Por exemplo, como apresentado na Figura 3B, a função detectora 6 pode incluir uma função comparadora 12’ e uma ou mais funções de retardo 7, 7’, etc., de modo que ato de observar o sinal decodificado compreende comparar o sinal decodificado com uma versão retardada no tempo do mesmo. Os estados de energia de um ou mais blocos anteriores são sujeitos a uma função comparadora que utiliza um limite para determinar o símbolo, por exemplo, da maneira da detecção de modulação de largura de banda descrita abaixo. Os comprimentos de bloco são conhecidos pelo detector e alguma forma de sincronização deve ocorrer de modo a alinhar a taxa de símbolo esperada com a taxa de símbolo real. A modulação de outros parâmetros pode não permitir a detecção em tempo real ou próximo de tempo real ou pode requerer comparar a saída do decodificador com o sinal de entrada do codificador como nas disposições das Figuras 4 e 5. [0094] Nas disposições tais como estas das Figuras 4 e 5 nas quais a saída do decodificador é comparada com a entrada do codificador, é importante sincronizar os sinais de entrada e de saída. Dependendo de qual parâmetro ou parâmetros são escolhidos para modulação e da taxa de dados da informação suplementar, pode ser necessário proporcionar um alto grau de sincronização entre estes sinais. Um modo de fazer isto é embutir uma seqüência determinística, tal como uma seqüência PRN no sinal primário de modo que a seqüência também seja embutida na saída do decodificador. Por comparar a seqüência nos sinais de entrada e de saída, é possível uma sincronização granulada de forma fina. [0095] A detecção pode ser realizada manualmente ou, em alguns casos, automaticamente. O uso de uma seqüência PRN no sinal primário pode facilitar a detecção automática. Se feita manualmente, auxílios visuais tal como uma análise espectral dos sinais comparados pode ser empregada. [0096] Alguns exemplos dos parâmetros de codificação que podem ser modulados para embutir uma marca d’água são expostos em várias tabelas: uma primeira tabela apresentada na Figura 6 (parâmetros do codificador de áudio Dolby), uma segunda tabela, apresentada na Figura 7 (parâmetros do codificador de áudio MPEG) e uma terceira tabela, apresentada na Figura 8 (parâmetros do codificador de vídeo MPEG). Para cada categoria de parâmetro (por exemplo, "modelo de mascaramento e alocação de bit"), a respectiva tabela indica o tipo de parâmetro (por exemplo, "deslocamento SNR", os parâmetros específicos (por exemplo, csnroffst", "fsnroffst", etc.), se o parâmetro(s) é (são) suscetível(is) à modulação no codificador e/ou no decodificador e a alteração resultante nas características do sinal da marca d’água no sinal decodificado quando o parâmetro(s) é(são) modulado(s). Na primeira coluna da tabela apresentada na Figura 6, existem seis categorias de parâmetros endereçadas: modelo de mascaramento e alocação de bit, acoplamento entre ou no meio dos canais, largura de banda da freqüência, controle de agitação, relação de fase e janela de transformação de tempo/freqüência. Observe que na primeira tabela, a nova formação de matriz somente pode ser executada durante a decodifica-ção se rematflg for "0" (nenhuma nova formação de matriz no codificador) e na segunda tabela, a codificação M/S somente pode ser executada durante a decodificação se ms_used for "0" (nenhuma codificação M/S no codificador). [0097] Onde um tipo de parâmetro possui um ou mais parâmetros em um sistema de codificação, abreviações reconhecidas para os respectivos parâmetros são apresentadas entre parênteses. Portanto, por exemplo, o tipo de parâmetro "deslocamento SNR" inclui quatro parâmetros Dolby Digital: "csnroffst" (deslocamento SNR grosseiro), "fsnroffst" (deslocamento de canal SNR fino), "cplfsnroffst" (acoplando des- locamento SNR fino) e "Ifesfsnroffst" (deslocamento de canal SNR fino com efeitos de baixa freqüência). Estes e outros parâmetros de codificação de Dolby Digital são explicados adicionalmente no Documento A/52 citado acima. Enquanto a maioria dos parâmetros do codificador de áudio Dolby listados são comuns aos sistemas de codificação Dolby Digital e Dolby E e portanto, são explicados no Documento A/52, uns poucos são únicos para o sistema de codificação Dolby E (por exemplo, Código de ganho para trás (ganho para trás) e código de queda para trás (Vazamento para trás). Informações adicionais a cerca do ganho para trás e do vazamento para trás são proporcionadas abaixo. [0098] Na primeira coluna da tabela apresentada na Figura 7, existem quatro categorias de parâmetros endereçados: modelo de masca-ramento e alocação de bit, acoplamento entre ou no meio de canais, coeficientes de filtro de modelagem temporal e janela de transformação de tempo/freqüência. Da mesma forma, na primeira coluna da tabela apresentada na Figura 8, existem duas categorias de parâmetros endereçados: tipo de quadro e controle de movimento. Informação adicional a cerca dos parâmetros do codificador de áudio e do codificador de vídeo MPEG listados é exposta no documento ISO/IEC, nos documentos MPEG-2 AAC e em outros documentos MPEG publicados citados acima. Os aspectos da presente invenção são aplicáveis não somente junto aos sistemas de codificação perceptual Dolby e MPEG, mas também junto a outros sistemas de codificação perceptual nos quais parâmetros no codificador e/ou no decodificador possam ser modulados. Exemplos de outros codificadores perceptuais são discutidos no artigo de jornal referenciado acima por Brandenburg e Bosi (J. Audio Eng. Soc., 1997).
Modulando Parâmetros do Modelo Perceptual de Audição [0099] Nos sistemas de codificação perceptual de áudio, tal como o Dolby Digital e Dolby E, existem parâmetros que representam o mo- delo perceptual de audição ou o modelo de mascaramento e são utilizados no processo de alocação de bit. Em particular, certos parâmetros espectral mente modelam a curva de mascaramento do ouvido humano: uma curva de mascaramento para baixo gradualmente caindo com respeito à freqüência, uma curva de mascaramento para cima gradualmente decaindo com respeito à freqüência e uma curva de mascaramento para cima gradualmente decaindo com respeito à freqüência. Estas são esquematicamente apresentadas na Figura 9. Apesar do mascaramento espectral ser um conceito no domínio de freqüência, a nomenclatura padrão relacionando-se com estes parâmetros de mascaramento empregam a terminologia do domínio de tempo ("lento" e "rápido", por exemplo). [00100] Referindo-se à Figura 9, os elementos do parâmetro de codificação que correspondem ao modelo de mascaramento espectral são definidos por seu nível e curva (ganho e vazamento, respectivamente) com respeito a um sinal de mascaramento como se segue: [00101] Curva de mascaramento para baixo: ganho para trás/vazamento para trás. [00102] Curva de mascaramento para cima (rápida): ganho rápi-do/vazamento rápido. [00103] Curva de mascaramento para cima (lenta): ganho len-to/vazamento lento. [00104] Observe que o ganho para trás e o vazamento para trás são parâmetros especificados na codificação Dolby E, mas não são parâmetros especificados na codificação Dolby Digital. Na Dolby Digital, como descrito no documento A/52 citado acima, os parâmetros de ganho rápido são os códigos de ganho rápido (fgaincod, cplfgaincod e Ifegaincod); os parâmetros de vazamento rápido são os códigos de queda rápida (fdcycod e cplfleak); o parâmetro de ganho lento é o código de ganho lento (sgaincod); e os parâmetros de vazamento lento são os códigos de queda lenta (sdycod e clpsleak). [00105] Cada um dos parâmetros definidos acima é adequado para modulação de modo a transportar uma marca d’água durante a codificação perceptual. A modulação de qualquer um dos mesmos ligeiramente altera o modelo de mascaramento espectral e portanto influencia o processo de alocação de bit. Portanto, os parâmetros do modelo de mascaramento estão fortemente acoplados com o sinal de entrada primário de modo a tornar a marca d’água robusta. A Figura 10 proporciona uma ilustração dos parâmetros do modelo de mascaramento espectral capaz de ser modulado. [00106] Certos outros parâmetros nos sistemas de codificação Dolby Digital e Dolby E controlam a proporção geral de sinal para ruído (SNR). No Dolby Digital, este parâmetros são os parâmetros de deslocamento SNR: csnroffst, fsnroffst, cplfsnroffst e Ifesfsnroffst. Os parâmetros SNR existem para manter um nível mínimo desejado de espaço de cabeça de sinal para ruído entre o sinal e o ruído de quantização. Estes parâmetros afetam todo o espectro de forma uniforme, diferente dos parâmetros de mascaramento espetral que primariamente afetam somente uma parte do espectro relativa a um sinal de mascaramento. [00107] Ainda outros parâmetros atuam como um ajuste SNR fino em uma base de banda crítica, denominada "SNR com banda", ou alocação de bit delta: a saber, deltba e cpldeltba na codificação Dolby Digital. [00108] As Figuras 11A até 11C e 12A até 12C proporcionam ilustrações de modular um limite de mascaramento do sistema de codificação perceptual (modulação do deslocamento SNR na Figura 11A e modulação do código de ganho rápido na Figura 12A), o efeito resultante da modulação quando o sistema de codificação é constrangido por bit (Figura 11B e Figura 12B, respectivamente) e o efeito resultante da modulação quando o sistema de codificação não é constrangido por bit (Figura 11C e Figura 12C, respectivamente). A Figura 11D identifica as legendas empregadas nas Figuras 11A até 11C e 12A até 12C. Os constrangimentos de bit ocorrem quando o codificador é restrito a produzir blocos codificados possuindo o mesmo comprimento, o que é um requerimento de vários canais de transmissão. Quando o codificador está apto a variar o número de bits de bloco para bloco, não existe constrangimento eficaz sobre o número de bits utilizados para representar o sinal. Como apresentado (Figuras 11B e 12B), em um codificador constrangido por bit, o erro do quantizador do sinal decodificado não exatamente corresponde ao limite de mascaramento em todas as freqüências: o exemplo ilustra que mais do que os bits necessários existem (o intervalo entre o limite e o sinal decodificado), resultando em margem positiva entre o limite de mascaramento e o erro original do quantizador em algumas freqüências. Sem os constrangimentos de bit, o codificador está apto a exatamente associar o erro do quantizador com o limite de mascaramento por toda a banda de freqüência. Para o valor de parâmetro preestabelecido, o símbolo de marca d’água pretendido pode ser um valor de bit de "0". Para o valor de parâmetro modulado, o símbolo pretendido pode ser um valor de bit de "1" como neste exemplo. As Figuras 11A e 12A apresentam o limite de mascaramento antes e depois da modulação. As Figuras 11B, 11C, 12B e 12C apresentam o sinal decodificado resultante. O limite de mascaramento modulado é sobreposto nas Figuras 11/12B e 11C/12C para proporcionar uma comparação com o espectro do sinal decodificado modulado. A Figura 11D apresenta as legendas empregadas nas Figuras 11A até 11C e 12A até 12C.
Modulando Parâmetros que Não São de Mascaramento [00109] As Figuras 13 e 14 proporcionam ilustrações das características do sinal que resultam a partir dos parâmetros de modulação diferentes dos parâmetros de mascaramento nos codificadores Dolby. Em cada uma das figuras, a característica do sinal é ilustrada utilizando um valor de parâmetro preestabelecido e um valor de parâmetro modulado. Na Figura 13, os efeitos de modular os parâmetros de acoplamento são apresentados. Para cada bloco no tempo, o qual é denotado no eixo horizontal, são ilustrados dois canais rotulados esquerdo e direito. Quando o acoplamento no indicador de uso é "0", cada canal é tratado de forma independente. Quando o acoplamento no indicador de uso é "1", os dois canais são combinados em um único canal de acoplamento acima de uma certa freqüência, denotada pelo parâmetro cplbegf. Em adição ao acoplamento no indicador de uso, a freqüência de começo de acoplamento pode também ser modulada, o que também é apresentado na Figura 13. [00110] Na Figura 14. os efeitos de modular o indicador de fase são ilustrados. Quando o indicador de fase é igual a "0", a fase não é modificada, mas se o indicador for igual a "1", a fase do sinal é deslocada em 180 graus.
Modulando Parâmetros da Janela TDAC [00111] Como explicado acima, os codificadores perceptuais reduzem a taxa de dados de um sinal de entrada por remover a informação perceptivelmente redundante. Estes sistemas começam por decompor o sinal de entrada em um ou mais componentes e então utilizam a análise perceptual para determinar quanto de precisão cada um destes componentes requer de modo que a diferença entre o material fonte e codificado seja imperceptível (ou para alcançar um nível aceitável de perceptibilidade) após os componentes quantizados serem decodificados. Um exemplo de tal sistema é um codificador de transformação que converte amostras temporais para uma representação baseada em freqüência utilizando uma transformação de cancelamento com efeito descontinuado no domínio do tempo (TDAC). De modo a garantir a reconstrução perfeita, as amostras no domínio do tempo são processa- das utilizando-se janelas de sobreposição antes da transformação. Após a transformação, as amostras de freqüência são então quantiza-das e codificadas de um modo que reduza a taxa de dados e sejam perceptivelmente insignificantes quando da decodificação. Para manter a reconstrução perfeita após o processo de transformação inversa no decodificador, as amostras no domínio do tempo são colocadas em janelas, sobrepostas e adicionadas utilizando-se os parâmetros associados com estes que foram utilizados no codificador. Geralmente, os parâmetros em janela para as janelas de codificação e de decodificação são escolhidos de modo que quando eles são aplicados durante as transformações TDAC para frente e reversa, o efeito descontinuado é minimizado ou removido. Os detalhes com respeito à codificação de transformação utilizando as transformações TDAC são expostos em "Analysis/Synthesis Filter Bank Design Basead on Time Domain Alia-sing Cancellation", de Princen e Bradley, IEEE Trans. on Acoustics, Speech , and Signal Processing, Vol. ASSP-34, N- 5, de outubro de 1986, páginas 1153 até 1161 e em "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation", de Princen et ai., Proceedings: ICASSP 87, 1987, Intl. Conf. on Acoustics, Speech, and Signal Processing, Abril, 1987, Dallas, Texas, páginas 2161 até 2164. [00112] Uma marca d’água pode ser aplicada pela modulação dos parâmetros de uma janela no domínio de tempo utilizada na construção ou na reconstrução do sinal transformado. Por exemplo, uma incompatibilidade entre a inclinação, ou alfa (a), das janelas no domínio de tempo utilizadas durante a codificação e a decodificação resulta na criação de efeito descontinuado no domínio de tempo quando utilizando transformações criticamente amostradas. Este efeito descontinuado alternativo resulta em um ruído ou distorção única em ambos domínios de tempo e de freqüência. Portanto, o parâmetro da janela, no codifi- cador ou no decodificador, pode ser modulado para transportar uma marca d’água que seja detectável na saída do decodificador. Distorção, neste sentido, é definida como a diferença entre os sinais codificado e original e pode ou não resultar em artefatos audíveis. Em uma modalidade preferida, os valores de alfa (inclinação) da janela no domínio de tempo são modulados. Por introduzir um sinal de ruído ou de distorção que é imperceptível, mas relacionado e oculto pelo sinal fonte, é extremamente difícil remover ou obscurecer a marca d’água resultante sem criar uma deterioração perceptível. [00113] Outro parâmetro da janela no domínio de tempo que pode ser alterado de modo a transportar uma marca d’água é o tipo da própria janela. Por exemplo, uma janela definida por Kaiser-Bessel pode ser utilizada para embutir um bit de marca d’água de "0", enquanto uma janela Hanning pode ser utilizada para embutir um bit de marca d’água de 1. A alteração da janela modulada pode ser feita no codificador ou no decodificador. [00114] Adicionalmente, de modo a aperfeiçoar a capacidade de detecção e minimizar a capacidade de percepção, o parâmetro de janela pode ser modulado de forma adaptável no tempo dependendo das características do sinal. Por exemplo, os sinais transitórios podem obscurecer o sinal de marca d’água, portanto é vantajoso estar apto a detectar estes sinais e modular a janela de modo a realocar a posição do sinal de marca d’água para tirar vantagem dos efeitos de mascara-mento temporais psicoacústicos. Adicionalmente, a potência da modulação e por conseqüência, a potência do sinal de marca d’água no sinal decodificado pode ser modificada de forma adaptável dependendo das características do sinal fonte. A quantidade em que os parâmetros de janela são incompatíveis diretamente afeta a potência da distorção adicionada. Portanto, as características de mascaramento psicoacústi-co do sinal de entrada podem ser analisadas e utilizadas para sinalizar o processo de embutimento de marca d’água para variar a quantidade de incompatibilidade para um símbolo de marca d’água de modo que ele seja de forma máxima mascarado pelo conteúdo do sinal. [00115] A equação de transformação TDAC para frente de forma direta é dada por: onde [00116] n = número da amostra [00117] k = número binário da freqüência [00118] x(n) = sequência PCM de entrada [00119] w(n) = seqüência de janela [00120] X(k) = seqüência de saída de coeficientes da transformação [00121] N = número total de amostras na transformação [00122] nO = metade do número total de amostras na transformação [00123] As seqüências de janela de transformação TDAC utilizando janelas definidas por Kaiser-Bessel (KDB) podem ser definidas pelas seguintes equações: [00124] onde WKB é a função de janela de núcleo Kaiser Bessel, definida como: [00125] e I0 é a função Bessel de 0a ordem, definida como: [00126] A Figura 15 ilustra cinco janelas de sobreposição do codificador de comprimento 256. A marca d’água é inserida na fase de codificação utilizando um valor α = 4 para a janela número 5. Deve ser observado que as janelas 4 e 6 são janelas híbridas que utilizam uma combinação dea = 3ea = 4 para proporcionar uma transição suave entre as séries de janela α = 3 e a janela única α = 4. Na figura, as janelas do decodificador implementam janelas α = 3 para todas as transformações. Esta incompatibilidade nos tipos de janela introduz artefatos com o efeito descontinuado no domínio de tempo no sinal de saída resultante. A quantidade de efeito descontinuado no domínio de tempo introduzido no áudio decodificado aumenta à medida que a diferença entre o valor α do codificador (a = 4) e o valor α do decodificador (a = 3) aumenta e existe somente na seção do áudio que foi processada pela janela número 5 do codificador. Este método de alteração α não requer que os decodificadores sejam modificados de modo a transportar os sinais de marca d’água e é útil para a colocação de marca d’água na fonte de distribuição do sinal. [00127] A Figura 16 novamente ilustra cinco janelas de sobreposição de comprimento 256, entretanto, neste exemplo, o valor α da janela é alterado durante o processo de decodificação com as janelas de transformação TDAC inversas. Novamente ocorre o efeito descontinuado no domínio de tempo, injetando um sinal de marca d’água no sinal decodificado. Entretanto, neste exemplo, o sinal embutido é injetado no decodificador, permitindo que a informação de marca d’água seja introduzida para um usuário ou dispositivo final específico. Esta modificação de α permite ao decodificador embutir informação serializada nos dados do sinal. [00128] Pode ser benéfico utilizar janelas de transformação mais curtas quando aplicando-se a marca d’água desde que elas reduzem a duração da distorção do efeito descontinuado e elas são geralmente utilizadas durante condições transitórias (na codificação de áudio). As características de mascaramento temporal para os sinais transitórios podem ser exploradas para utilizar valores de alfa que sejam mais diferentes do valor "correto" e desse modo produzam uma marca d’água mais robusta.
Detector de Modulação de Janela TDAC [00129] Por modificar o valor de alfa das janelas TDAC, um sinal com efeito descontinuado no domínio de tempo é introduzido, o qual está relacionado com o sinal codificado. Este efeito descontinuado pode ser medido como a introdução de ruído ou distorção espectral dos componentes espectrais do sinal codificado. [00130] Um método de detecção possível pode comparar a diferença entre o material fonte e os dados com a marca d’água como na maneira das disposições da Figura 4 e da Figura 5. Este método pesquisaria o sinal de diferença para a distorção espectral onde a janela modificada com a marca d’água foi utilizada. Se a distorção espectral exceder um limite, isto seria indicado como um símbolo "1" para a seção de dados com a marca d’água. A distorção espectral abaixo de um limite seria detectada como um símbolo "0". [00131] Este método é sensível ao ruído de banda larga que pode ser introduzido para mascarar o sinal de marca d’água. Outro método de detecção é rastrear os picos espectrais do sinal com a marca d’água e procurar a modulação de amplitude dos binários de frequência tanto antes como depois do pico espectral que são introduzidos pelo efeito descontinuado no domínio de tempo na aplicação de colocação de marca d’água. Similar ao método de distorção espectral geral descrito abaixo, este método de detecção iria comparar os binários de freqüência cercando os componentes espectrais predominantes com um limite. Entretanto, este limite estaria relacionado com a potência do componente espectral do sinal fonte. Lóbos espectrais laterais abaixo do limite seriam interpretados como um símbolo "0" e lóbos espectrais laterais acima seriam interpretados como um símbolo "1".
Modulando Coeficientes de Filtro TNS [00132] A modelagem de ruído temporal é uma tecnologia de codificação que pode ajudar a impedir artefatos de pré-eco na codificação perceptual de áudio; ela é descrita em "Enhancing the Performance of Perceptual Audio Coders by Temporal Noise Shaping (TNS)" de Jurgen Herre e James Johnston, 101 st AES (Audio Engineering Society) Con-vention Preprint 4384, 8 a 11 de novembro de 1996. A codificação por prognóstico no domínio de freqüência é utilizada para formatar o ruído de quantização no domínio de tempo. O prognóstico pode ajudar a controlar onde o ruído de quantização é colocado no domínio de tempo. No caso de codificação de áudio, o ruído é constrangido dentro do envelope de amplitude do sinal de mascaramento no domínio de tempo para impedir o pré-eco. O pré-eco é um artefato que ocorre durante condições transitórias quando a transformação de freqüência aplicada não tem resolução de tempo suficiente para impedir o ruído de quantização de ocorrer antes do transitório no sinal de saída. [00133] Apesar da modelagem do ruído temporal (TNS) ser um aspecto do sistema de codificação perceptual MPEG-2 AAC, ela pode ser aplicada junto a outros sistemas, tal como o Dolby Digital, desse modo proporcionando um modo adicional para modular parâmetros em tais outros sistemas. [00134] De acordo com este aspecto da presente invenção, um ou mais parâmetros de filtro TNS são modulados. Em particular, a ordem do filtro de modelagem de ruído TNS e o formato do filtro de modelagem de ruído TNS podem ser modulados, como adicionalmente explicado abaixo. [00135] O processo TNS envolve as etapas de: 1. Decompor o sinal em coeficientes espectrais pela utilização de uma transformação de tempo para freqüência , 2. Aplicar um prognosticador linear padrão por formar uma matriz de autocorrelação com janelas e utilizar recursão, e 3. Se o ganho de prognóstico exceder um certo limite, um filtro de modelagem de ruído é aplicado junto aos coeficientes espectrais. [00136] A invenção conta com as propriedades do filtro de modelagem de ruído que é aplicado durante o processamento TNS. O filtro no domínio espectral pode ser modificado de modo a formatar o ruído em qualquer número de diferentes respostas temporais. Por variar certos parâmetros deste envelope temporal via a filtragem no domínio espe-tral, uma marca d’água pode ser embutida no sinal. Em outras palavras, modula-se o filtro de modelagem de ruído no domínio espectral ou de freqüência, o que desse modo altera o ruído de quantização no domínio de tempo. [00137] Uma resposta de envelope temporal ilustrativa, plotando o nível de pressão do som (SPL) versus tempo, é ilustrada na Figura 17. [00138] O modelo de mascaramento temporal é muito similar ao modelo de mascaramento espectral utilizado em certos codificadores perceptuais. Em particular, os envelopes para cima e para baixo para o mascaramento espectral são análogos aos envelopes de mascaramento temporal para trás e para frente. De modo a identificar mais especificamente os parâmetros TNS que podem ser modulados de acordo com um aspecto da presente invenção, é útil considerar em mais detalhes uma parte da operação do processo de modelagem de ruído temporal. Após decompor o sinal em coeficientes espectrais por utilizar uma transformação de tempo para freqüência, um cálculo de codificação por prognóstico linear (LPC) é executado nos dados espectrais para determinar se o ganho de prognóstico excede a um certo limite e para derivar um envelope do sinal. Os coeficientes de prognóstico são então calculados para cada filtro TNS para cada bloco como: h = Rxx-1 rxx onde rxx T = {Rxx (i,j)}; Rxx(i.j) = AutoCorr(i - j)); i,j=1 rxx’ = rxx * win onde Rxx é a matriz quadrada de autocorrelação N por N, N é a ordem de prognóstico TNS e h são os coeficientes de prognóstico otimizados por vetor. Estas equações são baseadas no bem-conhecido princípio de ortogonalidade que declara que o erro mínimo de prognóstico é or-togonal em todos os dados utilizados no prognóstico. [00139] Na hora da inicialização, uma janela da matriz de autocorrelação é calculada de acordo com a equação: onde onde [00140] FSAMP = taxa de amostra do sinal [00141] A variável timeResolution é dependente da taxa de bits e do número de canais. Da mesma forma, o comprimento do bloco de transformação define a variável transformResolution. [00142] A ordem ótima do filtro de modelagem de ruído é determinada por remover os coeficientes de reflexão abaixo de um certo limite no fim da série de coeficientes. Um parâmetro que pode ser modulado de modo a transportar uma marca d’água é a ordem do filtro de modelagem de ruído. Por exemplo, um bit de marca d’água de um sentido pode ser representado pela ordem ótima do filtro e um bit de marca d’água de outro sentido pode ser representado por uma ordem do filtro que não seja ótima (ou inferior ou superior). Outro parâmetro que pode ser alterado de modo a transportar uma marca d’água é o formato do próprio filtro de modelagem de ruído. Por exemplo, um bit de marca d’água de um sentido pode ser indicado por utilizar os coeficientes ótimos determinados pelo cálculo LPC, enquanto um bit de marca d’água de outro sentido pode ser indicado por modificar os coeficientes e portanto o formato do filtro de modelagem de ruído. [00143] Por modular os parâmetros TNS (ordem do filtro ou coeficientes do filtro), o ruído é modulado no envelope temporal do sinal de entrada de modo que ele possa ser detectado no sinal de saída do de-codificador. A Figura 18 apresenta um exemplo de um envelope de mascaramento temporal e a variabilidade com a qual o erro do quanti-zador pode ser modulado dentro deste envelope. Com cada bloco no tempo, os parâmetros TNS podem ser modulados para transportar uma marca d’água. [00144] Modalidades práticas da presente invenção podem proporcionar uma solução de colocação de marca d’água muito robusta. Desde que o ruído que é adicionado pelo processo TNS está fortemente acoplado com o envelope do sinal fonte, é muito difícil remover ou obscurecer a marca d’água sem degradar o sinal original. [00145] A transparência da marca d’água descrita nesta invenção pode ser controlada por se utilizar um processo de distorção adaptável do tipo descrito abaixo. Neste caso, uma vez que o envelope temporal do sinal tenha sido modificado utilizando a TNS, os resultados são repetitivamente comparados com uma representação temporal ou espectral do limite de mascaramento temporal. Se o limite for excedido, são feitos ajustes junto aos parâmetros de mascaramento temporal e o processo é repetido para garantir o equilíbrio desejado entre a robustez e a perceptibilidade do sinal com a marca d’água. [00146] As características de mascaramento temporal apresentadas na Figura 18 podem ser aplicadas junto às sub-bandas do sinal. Isto permite a colocação em camadas das marcas d’água junto com potencialmente mais localizações para embutir a marca d’água.
Modulando Largura de Banda [00147] É conhecido que reduzir a largura de banda de um sinal de áudio causa degradação mínima junto à qualidade subjetiva contanto que ele permaneça acima de um nível mínimo de aproximadamente 16 kHz. Experimentos também têm apresentado degradação mínima quando a largura de banda é alterada dinamicamente contanto que ela permaneça acima do nível mínimo. Se a largura de banda for modulada de acordo com um sinal suplementar ou de marca d’água no codificador ou no decodificador, este sinal pode ser derivado a partir do áudio decodificado. Por exemplo, um código de um bit pode ser embutido em um sinal de áudio onde uma largura de banda de 16 kHz representa um símbolo "0" e uma largura de banda de 20 kHz representa um símbolo "1". Isto pode ser expandido para várias larguras de banda representando símbolos com múltiplos bits criando uma taxa de dados do sinal embutido. A Figura 19 ilustra um símbolo de 2 bits utilizando quatro larguras de banda diferentes. Esta estratégia pode ser aplicada onde marcas d’água inaudíveis, não robustas, são requeridas. Os critérios inaudíveis podem ser alcançados como descrito acima. Esta estratégia não é robusta porque a marca d’água pode facilmente ser removida por filtragem de banda baixa do sinal de áudio decodificado. [00148] A Figura 20 apresenta um exemplo de um sinal de áudio que contém um sinal embutido utilizando a largura de banda do sinal para representar os símbolos diferentes. [00149] Um problema com a técnica de colocação de marca d’água na largura de banda descrita acima é que ela depende da existência de conteúdo de sinal acima da largura de banda mínima. Para a maior parte do tempo, o conteúdo de sinal acima da largura de banda mínima não existe. Uma taxa de dados de sinal embutido constante não pode ser obtida sem conteúdo de sinal de alta freqüência. Por exemplo, se o conteúdo do sinal de áudio consistir em uma única onda seno em 1 kHz, o único modo possível para transmitir os dados embutidos neste sinal seria reduzir a largura de banda para abaixo de 1 kHz. Isto seria claramente audível e destruiria o sinal original. [00150] Um método que pode proporcionar uma taxa de embutimen-to de marca d’água constante é para garantir que o sinal de áudio contenha energia de alta freqüência. Um modo para alcançar isto é adicionar ruído para as freqüências superiores do sinal de áudio de modo tal que um ouvinte não perceba o mesmo. Se o ruído adicionado for menor ou igual ao limite humano de audição, ele não é perceptível. Com a adição deste ruído, o sinal embutido pode utilizar a largura de banda do áudio como um mecanismo de sinalização que proporciona uma taxa de dados constante. Observe que este ruído somente precisa ser adicionado com a banda de sinalização. Esta banda de sinalização é definida como a banda entre a freqüência mais baixa e a freqüência mais alta utilizada para colocar a marca d’água. A banda de sinalização pode ser dividida em seções menores onde mais do que duas larguras de banda são empregadas para criar a marca d’água. [00151] A Figura 21 ilustra a adição do ruído modelado para o nível aproximado do limite de audição. Ele é adicionado para um sinal que consiste em somente uma única onda seno e ele é adicionado somente na banda de sinalização. A adição do ruído na banda de sinalização não tem que ser limitada pelo limite de audição mas ela provavelmente será audível se a energia estivesse acima dele. Outra dimensão de sinalização pode ser adicionado por ajustar a amplitude do ruído abaixo do limite de audição. Por exemplo, dados adicionais podem ser ocultos ou inseridos se a energia em uma região da banda de sinalização continha mais do que apenas um estado de energia e nenhum es- tado de energia por adicionar um estado de meia energia. Esta sinalização de amplitude aumentaria a taxa de dados do sinal embutido. [00152] O sinal é detectável contanto que algum conteúdo do sinal seja garantido apenas abaixo da largura de banda superior. É importante que o sinal adicionado dentro da banda de sinalização seja similar em cada canal. Em vários casos, estes sinais são misturados eletricamente ou acusticamente e é importante que eles não cancelem um ao outro. Se ondas seno na fase forem adicionadas para vários canais e utilizada para sinalização, elas cancelariam quando adicionadas acusticamente dependendo da localização. Isto reduz a confiabilidade da marca d’água. Utilizar ruído randômico independente é uma solução melhor porque ele não se cancela quando misturado. [00153] Desde que o conteúdo do sinal possa ocorrer na banda de sinalização e o ruído modelado é adicionado na banda de sinalização para garantir uma taxa de embutimento constante, os dois sinais são adicionados e ocasionalmente aumentam a energia na banda de sinalização. Esta variabilidade de energia torna o processo de detecção mais difícil. Em uma modalidade preferida deste aspecto da invenção, um filtro de banda baixa é aplicado junto ao sinal fonte antes da adição do ruído modelado para eliminar qualquer interação do sinal fonte na banda de sinalização. [00154] No algoritmo Dolby Digital ou no processo de codificação, mesmo se o conteúdo nas bandas de freqüência superior for determinado como sendo significativo, um espectro de força grosseiro é transmitido no fluxo de bits, o qual pode ser utilizado no decodificador para adicionar ruído randômico modelado para o espectro de força. Este é um aspecto do decodificador que é ativado quando o indicador de sinal de exitação no fluxo de bits está habilitado. O ruído adicionado no decodificador recria a marca d’água no áudio decodificado mesmo se o codificador tiver julgado o mesmo perceptivelmente insignificante. A marca d’água pode ser inserida durante o processo de codificação ou de decodificação. [00155] Um codificador de áudio Dolby Digital é capaz de gerar alterações na largura de banda de acordo com um dentre dois parâmetros de largura de banda (os códigos chbwcod e cplendf listados acima na tabela da Figura 21). Isto cria um modo eficiente para implementar a marca d’água. Entretanto, modular estes códigos para gerar alterações detectáveis no sinal decodificado coloca algumas limitações na taxa de dados do sinal embutido: 1. Todos os canais devem conter a mesma largura de banda de modo que misturar o sinal para baixo não destrói os dados embutidos. Isto limita a taxa dos dados embutidos ao equivalente de um mono canal. 2. Para qualidade de som ótima, o código da largura de banda deve somente ser estabelecido uma vez por quadro, o que limita a taxa de dados embutida à profundidade do símbolo e à taxa da amostra codificada. Se o código da largura de banda fosse alterado mais do que uma vez por quadro, a qualidade como um todo do som do áudio codificado seria reduzida. 3. O número de símbolos disponíveis é limitado ao número de códigos de largura de banda disponíveis acima da largura de banda mínima. [00156] Por exemplo, se o codificador estiver utilizando dois estados de largura de banda diferentes para dados embutidos em 48 kHz, a taxa de dados embutidos é aproximadamente 31,25 bps. (31,25 quadros por segundo, cada um contendo um bit de informação). Se ele estiver utilizando quatro estados de largura de banda em 48 kHz, a taxa de dados é 62,5 bps. Estes números são derivados do fato de que cada quadro Dolby Digital contém 1536 amostras de áudio únicas. Se outro codificador fosse utilizado, o qual contivesse 2048 amostras de áudio únicas por quadro, a taxa de dados seria aproximadamente 23,5 bps para um código de um bit. [00157] O codificador Dolby Digital envia uma aproximação da densidade espectral de força no fluxo de bits do codificador com cada quadro de áudio. Ela é atualizada cada vez que existe um alteração significativa no espectro de áudio. A informação sobre a densidade espectral de força é enviada como expoentes que são linearmente espaçados na freqüência. No decodificador Dolby Digital, o sinal de excitação é adicionado junto a qualquer parte do espectro que não recebeu informação quantizada porque a informação do sinal não foi considerada importante. O sinal de excitação que é essencialmente ruído ran-dômico, é dimensionado até o nível do expoente. Isto adiciona energia do sinal para esta parte do espectro. Se os expoentes na banda de sinalização forem modelados para menor ou igual ao limite de audição, o sinal de excitação garante a energia do sinal. [00158] As etapas seguintes esboçam o método corrente para garantir que exista energia na banda de sinalização dentro de um sinal codificado Dolby Digital. 1. O ruído randômico é adicionado acima da largura de banda de sinalização mínima que é formatada para estar abaixo ou no limite de audição. Isto causa a energia mínima para seguir o formato do limite de audição. 2. Os expoentes que são calculados após a adição do ruído capturam este nível mínimo de energia. 3. O decodificador recria a energia espectral a partir dos expoentes transmitidos mesmo se nenhum bit tiver sido alocado acima da largura de banda de sinalização mínima porque o sinal de excitação normalmente é adicionado. Isto garante conteúdo de sinal para a sinalização embutida. [00159] As duas técnicas descritas acima (sinal de excitação e vari- ação da largura de banda) podem ser utilizadas para integrar uma marca d’água com taxa de bits fixa, de baixa complexidade, em um codificador ou decodificador Dolby Digital. Este sistema é robusto em relação ao "uso normal" da cadeia de codificação/decodificação que inclui misturar para baixo, controle dinâmico de faixa, normalização de volume, decodificação de matriz circundante, etc. [00160] Portanto, uma modalidade deste aspecto da presente invenção pode incluir as seguintes etapas: 1. Ajustar a largura de banda para embutir um sinal de dados oculto. 2. Utilizar um código de largura de banda do sistema de codificação/decodificação Dolby Digital para ajustar a largura de banda para embutir um sinal de dados oculto. 3. Adicionar ruído na banda de sinalização para garantir que o conteúdo do sinal possa ser utilizado para embutir dados em uma taxa constante. 4. Formatar este ruído adicionado para menor ou igual ao limite humano de audição para impedir a percepção audível do ruído adicionado. 5. Ajustar a amplitude deste ruído adicionado para adicionar outra dimensão de sinalização para aumentar a taxa de dados do sinal embutido. 6. A integração do ruído modelado com um codificador Dolby Digital para garantir o conteúdo do sinal dentro da banda de sinalização. [00161] O detector de marca d’água interpreta a informação embutida contida dentro do sinal de áudio reproduzido. Ele de preferência é capaz de extrair a informação tanto eletricamente como acusticamente, mas esta capacidade pode não ser necessária para todas as aplicações. A extração da marca d’água após o processamento acústico é considerada um desafio mais difícil por causa da adição do ruído do ambiente, do alto-falante e das características do microfone, e do volume de execução geral. [00162] A meta do detector é determinar se existe energia dentro de uma dada banda de sinalização para encontrar a largura de banda do áudio. Isto requer uma decomposição de freqüência do áudio que pode ser calculada por uma transformação Fourier, um grupo de filtros de banda baixa de passagem que analisam a banda de sinalização, etc. A energia em cada banda de sinalização pode ser obtida a partir desta decomposição de sinal. Um detector pode utilizar esta informação de energia para determinar o símbolo embutido. [00163] Um método de detecção possível aplica uma comparação de limite fixo em cada banda de sinalização para determinar o símbolo codificado. Este limite pode ser estabelecido no nível de energia logo acima do piso do ruído. Qualquer coisa acima deste nível seria considerada como contendo o nível do sinal. A Figura 22 apresenta três níveis de energia diferentes requeridos para detectar quatro larguras de banda diferentes que criam um símbolo de 2 bits. Qualquer energia acima do limite de detecção é considerada "alta" e qualquer coisa abaixo é considerada "baixa". [00164] Este limite fixo somente trabalha bem em um ambiente fechado onde o piso de ruído do sistema é sempre conhecido e os níveis de pico do sinal nunca são atenuados. Por exemplo, se qualquer outro ruído fosse adicionado para o piso do ruído no diagrama acima, o terceiro nível de energia seria considerado "alto" e um símbolo incorreto seria interpretado. [00165] É possível utilizar um limite fixo se os níveis de energia forem igualados ou normalizados antes do cálculo do limite. Um técnica que realizaria isto aplica um algoritmo ou processo AGC junto à banda de sinalização antes dos níveis de energia serem determinados. Estes níveis são normalizados pelo AGC de modo que os níveis "baixo" e "alto" tornam-se mais consistentes. Um limite fixo pode ser aplicado neste caso por causa da normalização dos níveis. [00166] Um limite adaptável é pensado como sendo melhor para qualquer ambiente onde os níveis de ruído e a energia do sinal estão constantemente se alterando. Um método de detecção possível que emprega um limite adaptável utiliza os estados de energia anteriores para calcular um limite para o estado corrente. Este detector trabalha com a premissa de que em um número finito de estados anteriores para uma dada banda de energia, devem existir alguns níveis de energia que estejam em um estado "alto" e alguns que estejam em um estado "baixo". As maiores energias podem ser consideradas "alta" enquanto as menores podem ser consideradas "baixa". Estes estados "alto" e "baixo" podem ser considerados como sendo dois grupos diferentes. A Figura 23 contém vários histogramas ilustrativos da distribuição de estados "alto" e de "baixo". Pode ser determinado um limite que situe-se em algum lugar entre estes dois "grupamentos". [00167] Se o número de estados "alto" for assumido como sendo igual ao número de estados "baixo" no conjunto finito anterior, a maior metade pertence ao grupo "alto" enquanto a menor metade pertence ao grupo "baixo". Se o nível médio de energia ou meio for encontrado para cada grupo, um limite simples pode ser calculado como a média destes dois meios. Isto pode facilmente tornar-se mais complicado por se assumir distribuições diferentes para os dois grupos e os limites que levam em consideração mais estatísticas de cada grupo como meio-termo e variação. [00168] Outra consideração pode ser incluída, a qual aperfeiçoa a separação em grupos "alto" e "baixo". Quando mais do que duas larguras de banda estão incluídas no processo de embutimento, os níveis de energia nas bandas de sinalização são dependentes. Quando a lar- gura de banda mais alta está "ativada", todos os níveis de energia em cada banda de sinalização devem ser detectados como "alto". Quando a segunda largura de banda mais alta estiver "ativa", todos os níveis de sinalização abaixo desta largura de banda devem ser detectados como "alto". Isto altera a distribuição dos níveis de energia para cada banda de sinalização. [00169] Por exemplo, assume-se que o codificador de marca d’água está gerando um símbolo de 2 bits utilizando quatro larguras de banda diferentes. Deixa-se A, B, C e D representarem as larguras de banda, onde A é a largura de banda mais baixa e D é a mais alta. Três bandas de energia diferentes são requeridas para determinar estas larguras de banda. Deixa-se estas três bandas de energia serem representadas por 1, 2 e 3, que são a energia entre as larguras de banda A-B, B-C e C-D, respectivamente. A tabela seguinte lista a probabilidade para cada uma das bandas de energia estar em um estado "alto" se os símbolos forem distribuídos de forma uniforme. [00170] As probabilidades não são iguais por causa da dependência de cada banda de energia em relação à largura de banda. Por exemplo, a probabilidade do conteúdo do sinal na banda de energia 1 é a soma das probabilidades de ocorrência dos símbolos B, C e D. Cada símbolo tem uma probabilidade de % de ocorrência; por conseqüência, a probabilidade do conteúdo do sinal na banda de energia 1 é %. [00171] Se os quatro estados anteriores forem utilizados para calcular o limite corrente para cada banda de energia, os três estados mais altos seriam assumidos para representar o conteúdo de sinal dentro da banda de energia 1. As dez amostras restantes não representariam conteúdo de sinal. O limite corrente para este caso é determinado por se encontrar a média do meio termo entre estes dois grupos. [00172] A adição da codificação de canal para garantir que a distribuição de símbolo seja substancialmente uniforme é essencial para este detector. Se o codificador entrou com um símbolo que era apenas a largura de banda mais alta para um período estendido, este detector teria dificuldade decodificando os dados embutidos. Quanto mais próxima da distribuição de símbolo for a probabilidade assumida, mais é precisa a detecção dos dados embutidos. [00173] Um método de codificação de canal possível é para garantir que cada símbolo ocorra somente uma vez através de um período finito. Por exemplo, se existirem quatro códigos de largura de banda diferentes, cada símbolo pode ser requerido de ocorrer uma vez em um grupo de quatro símbolos. Isto gera 24 símbolos únicos que são grupos de quatro códigos de largura de banda. 24 (fatorial quatro) é o número máximo de permutações dos quatro códigos de largura de banda. Se A, B, C e D representarem os quatro códigos de largura de banda, os símbolos iriam parecer ABCD, BACD, ABDC, BADC, BCAD, etc. Observe que isto reduz a taxa de dados embutidos. [00174] Portanto, um detector de marca d’água de acordo com este aspecto da presente invenção pode incluir 1. Um detector de sinal embutido que utiliza um limite adaptável que é calculado por examinar os estados anteriores. Os estados anteriores são separados em grupos baseados no nível de energia. O limite é baseado nas estatísticas de cada grupo que tentam separar os grupos o máximo possível. 2. Quando vários grupos estão envolvidos, o número de elementos nos grupos é ajustado baseado nas dependências do ajuste de largura de banda. 3. Um codificador de canal que garante que a distribuição dos símbolos seja próxima de uniforme através de um tempo finito. Isto garante que o detector de marca d’água descrito acima funcione de forma apropriada.
Controlando a Potência da Modulação de Parâmetro Controle de Distorção Adaptável [00175] Uma meta da presente invenção é embutir uma marca d’água possuindo detectabilidade maximizada e perceptividade minimizada. Codificadores perceptuais utilizam um limite de perceptividade para determinar como reduzir a redundância de um sinal de entrada. Este mesmo limite pode ser utilizado para ajustar o sinal de marca d’água de modo que seja detectável enquanto permanecendo substancialmente imperceptível. [00176] Como mencionado acima, em alguns codificadores perceptuais, uma medida de distorção é emparelhada com o controle de taxa para garantir que a informação correta seja descartada. Uma medida de distorção compara o sinal de entrada original com o sinal codificado (saída do controle de taxa). A medida de distorção pode ser útil para controlar alguns dos parâmetros de codificação para alterar o resultado do processo de controle de taxa. Isto pode criar uma estrutura de loop aninhada, descrita abaixo, na qual o loop externo contém uma medida de distorção e o loop interno é o controle da taxa. São feitas modificações de forma repetida junto aos parâmetros de codificação pelo exame da medida de distorção até que alguns critérios sejam atendidos. A mesma maneira de se abordar pode ser aplicada junto aos codificadores com taxa de dados variável, pela remoção do loop de taxa. [00177] O processo para embutir uma marca d’água utilizando um limite de perceptividade de acordo com um aspecto da presente invenção é apresentado nas Figuras 24 até 26. Este processo é similar àquele definido no codificador perceptual MPEG-2 AAC no qual dois loops aninhados são utilizados para determinar a quantização ótima. O loop de repetição interno, apresentado na Figura 24, modifica o tamanho da etapa do quantizador até que os dados espectrais possam ser codificados com o número de bits disponíveis (controle de taxa). O loop de repetição exterior, apresentado na Figura 25, amplifica os coeficientes espectrais em todas as bandas espectrais de um modo que as demandas do modelo psicoacústico são atendidas o máximo possível (controle de distorção). O processo da Figura 25 é modificado pela modulação de um parâmetro ou parâmetros de codificação perceptual (apresentados na Figura 26) para atender ao modelo psicoacústico, ou ao limite perceptual, o máximo possível enquanto também embutindo um sinal de marca d’água. Todos os parâmetros listados nas tabelas das Figuras 6, 7 e 8 podem ser modulados deste modo, apesar de alguns parâmetros serem mais difíceis do que outros de alterarem-se durante o processo de alocação de bit. [00178] O processo de controle de taxa na Figura 24 tenta representar o sinal por uma quantidade fixa menor de informação. O sinal de entrada é quantizado de acordo com o limite perceptual (etapa 20) e os bits utilizados como um resultado da quantização são contados (etapa 22). Se o número de bits utilizados não exceder aos bits disponíveis, então, o processo é terminado (etapa 24). Alternativamente, o processo repetitivo continua até que o número de bits utilizados combine o máximo possível com o número de bits disponíveis. Isto normalmente é realizado pelo ajuste do limite perceptual, via as modificações de tamanho da etapa do quantizador, até que informação suficiente tenha sido descartada (etapa 26). [00179] Um processo de medida de distorção, apresentado na Figura 25, pode ser adicionado para o processo de tamanho da etapa do quantizador para garantir que algumas das simplificações do processo de codificação de controle de taxa não tenham causado erros que seja facilmente percebidos. A medida de distorção permite a sintonização fina dos parâmetros de codificação para minimizar tais erros. Na primeira etapa do processo, o loop de taxa, ou loop interno, é executado para quantizar o sinal de entrada de acordo com um constrangimento de taxa (etapa 28). Então, uma avaliação de distorção calcula quanta distorção existe (etapa 30) e determina se a distorção é aceitável em relação a um limite perceptual (etapa 32). Se a distorção não for aceitável, os coeficientes espectrais são amplificados (etapa 34) e o processo é repetido. Se a distorção for aceitável, o resultado da quantiza-ção é aplicado para o sinal de entrada (etapa 36) e o processo está completo. "Distorção", neste sentido, é a diferença entre os sinais codificado e original e pode ou não resultar em artefatos audíveis. [00180] Em aspectos da presente invenção, o processo de medida de distorção, apresentado na Figura 26, é utilizado para determinar a quantidade que um valor do parâmetro de codificação pode ser variado a partir de seu valor preestabelecido quando modulado e ainda ficar dentro dos limites do limite perceptual. Isto maximiza a detecção possível da marca d’água porque isto, de preferência, causa o máximo de distorção possível, constrangida pelo limite perceptual, sem a distorção ser perceptível. As etapas de controle de taxa (etapa 28), de controle de distorção (etapa 32) e de ajuste do parâmetro de codificação (etapa 38) são repetidas até que um compromisso aceitável seja feito. [00181] Certos sistemas de codificação, tais como o Dolby Digital, utilizam um processo de controle de taxa durante a codificação mas não aplicam o controle de distorção. Portanto, de modo que tais sistemas de codificação empreguem este aspecto da invenção, uma medida de distorção é adicionada. Outros codificadores, tais como MPEG-2 AAC, já possuem o processo de controle de distorção integrado para os propósitos de codificação e com menores modificações podem também ser utilizados para aplicar uma marca d’água de acordo com este aspecto da presente invenção. Deve ser observado que nos sistemas de codificação de taxa variável, o loop de taxa não é requerido, assim proporcionando uma solução ótima para o processo de modulação de parâmetro enquanto também reduzindo a complexidade. [00182] A Figura 27 ilustra como uma marca d’água pode ser embutida de acordo com a presente invenção utilizando um processo de medida de distorção do tipo recém-descrito. De preferência, a meta é maximizar a robustez forçando o efeito do parâmetro modulado, o qual é ilustrado como a alteração no erro do quantizador na passagem 2, o mais próximo do limite perceptual quanto possível. Na primeira passagem, o limite perceptual é calculado. Na segunda passagem, o erro do quantizador é apresentado. Observe que existe alguma margem disponível com a qual modifica-se o erro do quantizador de forma imperceptível. Na passagem 3, o parâmetro de codificação de marca d’água escolhido, neste exemplo o tipo de alocação do bit delta do parâmetro (isto é, os parâmetros deltba ou cpldeltba, os quais afetam o erro do quantizador dentro de uma banda crítica), foi ajustado e resulta em um erro do quantizador modificado. O erro do quantizador pode ser modificado ainda adicionalmente e ainda permanecer imperceptível. Observe que a modulação do parâmetro de codificação resulta em um erro de quantização ligeiramente diferente através do todo o espectro porque o número de bits disponíveis é afetado. Isto ilustra que a modulação dos parâmetros de codificação e a resolução resultante do quantizador em certas bandas, causam erro em todo o espectro, não somente na banda na qual o parâmetro é modulado. Na passagem 4, o grau de modulação do parâmetro de codificação foi ajustado novamente utilizando informação da passagem 3 e o erro do quantizador resultante está o mais próximo possível do limite perceptual. Apesar de ser preferido levar o erro do quantizador o mais próximo possível, mas abaixo do limite perceptual, quando modulando um ou mais parâmetros que afe- tam o erro do quantizador, a invenção também contempla a modulação de um ou mais parâmetros de modo que o erro do quantizador fique abaixo, mas não próximo do limite perceptual, como para o exemplo na passagem 3 da Figura 27. [00183] A Figura 28 ilustra o processo de embutimento da marca d’água em que o parâmetro de codificação de marca d’água escolhido é o tipo de deslocamento SNR geral do parâmetro (isto é, os parâmetros csnroffst, fsnroffst, cplfsnroffst ou Ifesfsnroffst). Observe que neste exemplo, a modulação do parâmetro de deslocamento SNR geral resulta em uma combinação exata com o limite perceptual. Isto é porque o tipo de deslocamento SNR do parâmetro é um deslocamento uniforme do limite perceptual por todo o espectro de freqüência. Por conse-qüência, o processo de adaptar o erro do quantizador para o limite perceptual utilizando o tipo de deslocamento SNR do parâmetro somente requer uma etapa. [00184] Uma faceta adicional deste aspecto da presente invenção permite a um usuário controlar o deslocamento do limite perceptual que controla o "ganho" ou energia possível da marca d’água. Isto pode ser um deslocamento linear para o limite perceptual ou uma função mais complicada que permita mais distorção nas bandas específicas. Isto permite a um usuário controlar a facilidade de detecção e a capacidade de audição do sinal embutido final. Isto pode ser realizado elevando a curva do limite perceptual por uma quantidade fixa. Adicionalmente, modificando o limite perceptual, o usuário pode embutir uma marca d’água onde a margem de codificação da marca d’água é negativa. [00185] Nos codificadores perceptuais, tais como os codificadores Dolby Digital, Dolby E e MPEG-2 AAC, o processo de quantização, ou de alocação de bit, é calculado baseado no número de bits disponível para o codificador e na proporção de sinal para ruído geral. A seguir, o limite perceptual é comparado com o erro do quantizador. Se a distorção (diferença entre o limite perceptual e o erro do quantizador) não for de encontro aos requerimentos de conclusão, a modulação de parâmetro de codificação escolhida é modificada com base na distorção e o processo é repetido até que a distorção seja aceitável. [00186] Em uma modalidade preferida deste aspecto da invenção, a distorção é calculada a partir de grupos de coeficientes com bandas (isto é, agrupados pelas bandas críticas) que formam a base do limite perceptual. Deve ser observado que o limite perceptual também pode ser baseado no erro de quantização dos coeficientes espectrais individuais com o sacrifício da complexidade aumentada. [00187] Uma vez que o limite seja estabelecido, a parte de controle de distorção deste aspecto da invenção começa. O parâmetro de codificação sob teste é modulado de acordo com repetições subseqüentes do processo de distorção. A modulação do parâmetro de codificação afeta o resultado da alocação de bit das bandas espectrais executado no processo de controle de taxa. O limite resultante da alocação de bit é comparado com o limite perceptual original e o parâmetro de codificação é modulado repetitivamente até que os requerimentos de conclusão sejam atendidos. Se os requerimentos para a conclusão não forem atendidos, o limite de mascaramento é reformulado utilizando o parâmetro modulado. [00188] Em uma modalidade preferida deste aspecto da invenção, a terminação do processo de distorção adaptável pode ocorrer quando o limite perceptual e o limite de mascaramento são equivalentes para qualquer dada banda de interesse e nenhuma das bandas do limite de mascaramento excede o limite perceptual. Se os limites perceptual e de mascaramento nunca convergirem, uma lógica de término adicional pode ser empregada contanto que o limite de mascaramento não exceda ao limite perceptual. Os requerimentos de término existem de modo a constranger a complexidade.
Modulação do Parâmetro do Decodificador [00189] A Figura 29 apresenta um aspecto da presente invenção no qual os parâmetros de um decodificador perceptual de áudio são modulados. Neste exemplo, o decodificado emprega uma alocação de bit híbrida (isto é, o modelo perceptual é transportado do codificador para o decodificador). O fluxo de bits codificado perceptivelmente recebido 40 é separado no decodificador em parâmetros de codificação 42 (representando o modelo de alocação de bit) e os dados reformatados 44 (isto é, os dados quantizados). A alocação de bit 46 e a quantização inversa 48 são executadas. Na próxima etapa 50, é tomada uma decisão (Limite Perceptual Calculado ?). Se não já calculado (isto é, a primeira vez através do loop), um limite perceptual é calculado (etapa 52) baseado no sinal a partir do fluxo de bits codificado. Se o limite perceptual existir (isto é, após a primeira vez através do loop), é feita uma comparação (etapa 54) entre o sinal quantizado inverso e o limite. A seguir, é tomada uma decisão (Distorção Aceitável ?) na etapa 56. Se a distorção resultante for aceitável (isto é, for de encontro aos requerimentos de término predefinidos), então, o processo está completo e os coeficientes espectrais são emitidos para outras funções no decodificador. Se a distorção não for aceitável, o parâmetro de codificação sendo modulado é ajustado (etapa 58) e o processo de alocação de bit, a quantização inversa e a comparação do limite perceptual são repetidos. O parâmetro de codificação é inicialmente modulado baseado no símbolo de marca d’água (isto é, informação suplementar) 60 e é subseqüentemente ajustado baseado na comparação do limite perceptual. [00190] Um processo similar pode ser empregado em um sistema decodificador perceptual de áudio empregando um alocação de bit adaptável para frente (isto é, um modelo perceptual é criado no codifi- cador e explicitamente enviado para o decodificador). Os dados do sinal são reformatados utilizando o modelo perceptual transmitido. Este modelo perceptual pode, então, ser modificado por um parâmetro para embutir uma marca d’água. A versão com a marca d’água do áudio é comparada com o sinal não marcado. Se a medida de distorção não for de encontro aos requerimentos de conclusão predefinidos especificados, o sinal é reformulado utilizando um valor de modulação de parâmetro modificado.
Controlando a Modulação de Parâmetro em Resposta a uma Seaüên-cia de Marca D’áqua e/ou a uma Seqüência Determinística [00191] Em outros aspectos da invenção, a modulação de um ou mais parâmetros é controlada indiretamente pela informação suplementar ou pelo sinal ou seqüência de marca d’água. Por exemplo, o controle da modulação pela marca d’água é modificado por uma função de um ou mais outros sinais ou seqüências de dados incluindo, por exemplo, um conjunto de instruções, tal como uma seqüência determinística e/ou o sinal de entrada aplicado junto ao sistema de codificação. A Figura 30 é um diagrama de blocos funcional apresentando este aspecto da invenção. Como na disposição básica da Figura 2, a informação primária é aplicada para uma função codificadora perceptual 2 que gera um fluxo de bits digital que é recebido por uma função deco-dificadora perceptual 4. Neste aspecto da invenção, a informação suplementar é aplicada para uma função controladora de parâmetro 62. A função controladora de parâmetro 62 também recebe a informação primária ou uma ou mais seqüências determinísticas ou tanto a informação primária como uma ou mais seqüências determinísticas. O controlador de parâmetro 62 modifica o modo no qual a informação secundária modula a função codificadora ou os parâmetros da função deco-dificadora. Ele faz isto por modificar um ou mais conjuntos de informação secundária, cada um com uma função da informação primária e/ou com uma função de uma ou mais seqüências determinísticas como descrito a seguir. Pelo fato da informação suplementar modificada a partir da função controladora de parâmetro poder ser aplicada para a função codificadora ou para a função decodificadora ou para ambas, as linhas tracejadas são apresentadas a partir da informação suplementar até a função codificadora e até a função decodificadora, respectivamente. Como no caso da disposição da Figura 2, a saída da função decodificadora perceptual é informação primária com informação suplementar embutida. A informação suplementar pode ser detec-tável na saída da função decodificadora. [00192] Se a informação suplementar modificada controlar a modulação de parâmetro tanto na função codificadora 2 como na função decodificadora 4, tipicamente, a informação aplicada para uma irá ser diferente desta aplicada para a outra. Por exemplo, a informação suplementar controlando o um ou mais parâmetros da função codificadora pode representar uma marca d’água identificando o proprietário do conteúdo de áudio ou de vídeo e a informação suplementar controlando o um ou mais parâmetros da função decodificadora pode ser um número de série identificando o equipamento que apresenta o conteúdo de áudio ou de vídeo para um ou mais consumidores. [00193] Quando o controlador de parâmetro 62 emprega uma se-qüência determinística para modificar a maneira na qual a informação suplementar modula um ou mais parâmetros, a detecção da informação suplementar ou da marca d’água na saída da função decodificadora requer que a equação do gerador e a chave da seqüência determinística sejam conhecidas pela função detectora. A equação do gerador pode ser conhecida publicamente, pode ser conhecida anteriormente pelo detector (mas não publicamente), ou pode ser comunicada para o detector via um canal seguro. De forma similar, a chave pode ser conhecida publicamente, pode ser conhecida anteriormente pelo detector (mas não publicamente), ou pode ser comunicada para o detector via um canal seguro. Para o sistema ser seguro, a única exigência é que a chave não seja publicamente revelada. [00194] Quando o controlador de parâmetro 62 emprega o sinal de entrada para modificar a maneira na qual a informação suplementar modula um ou mais parâmetros, a detecção da informação suplementar ou da marca d’água na saída da função decodificadora requer que o sinal fonte ou pelo menos certa informação a cerca do sinal fonte (por exemplo, as características do sinal fonte para as quais o controlador de parâmetro está programado para responder) seja conhecida pela função detectora. Isto pode ser feito comunicando o sinal fonte ou, de preferência, as características do sinal fonte para as quais o controlador de parâmetro está programado para responder, para a função detectora. Se o sinal fonte, ao invés das características relevantes do sinal fonte for comunicado, pode ser possível para a função detectora derivar as características relevantes de forma independente baseado em uma análise do sinal fonte e na saída da função decodificadora. Entretanto, podem ocorrer erros porque as características são originalmente determinadas com base no sinal fonte sem erro do quantiza-dor.
Controlando a Modulação de Parâmetro em Resposta a uma Seaüên-cia Determinística Modificando a taxa de transições do símbolo de marca d’áqua [00195] Uma variação deste aspecto da presente invenção envolve controlar, com uma seqüência determinística, a taxa de transições de estado de modulação de parâmetro e, por consequência, a taxa de transições do símbolo de marca d’água. Em particular, isto envolve variar, em resposta à seqüência determinística, a duração dos estados de modulação de parâmetro e, por conseqüência, a duração das taxas de símbolo de marca d’água. Se as transições de símbolos de marca cTágua forem embutidas em uma taxa constante, seqüências repetitivas no padrão do símbolo da marca d’água podem ser perceptíveis. Modificando a duração dos estados de modulação de parâmetro e, por conseqüência, a duração do símbolo, efeitos repetitivos podem ser minimizados. A Tabela 1 apresenta um exemplo no qual a duração do estado de modulação de parâmetro e, por conseqüência, a duração do símbolo de marca d’água, é dependente de uma seqüência determinís-tica, assim resultando no padrão apresentado como a seqüência modificada. Neste exemplo particular, a seqüência de marca d’água é repetida se o valor da seqüência determinística for igual a "1". Se o DS tiver um valor de "0", o símbolo de marca d’água não é repetido. Deve ser observado que o período do padrão do símbolo de marca d’água aumenta com base nas ocorrências do valor de "Γ na seqüência determinística. Por conseqüência, uma seqüência finita deve ser utilizada, a qual reinicializa-se de forma apropriada de modo que a sincronização é possível durante a detecção.
Tabela 1 Selecionando os parâmetros para embutir a marca d’áaua [00196] De acordo com uma variação adicional deste aspecto da invenção, uma seqüência determinística seleciona o parâmetro ou parâmetros utilizados para embutir a marca d’água. Geralmente, é possível empregar qualquer um de vários parâmetros para embutir uma marca d’água. Por exemplo, a modulação de um parâmetro pode resultar em uma modificação da energia espectral em uma faixa de fre-qüência particular e a modulação de outro parâmetro resultar em uma redução na largura de banda do sinal decodificado. Se somente um parâmetro for modulado, a marca d’água resultante pode ser mais perceptível para uma pessoa com sensibilidade aguçada para a modulação de energia espectral. Por outro lado, se a técnica de embutimento que é utilizada trocar entre modular um parâmetro e modular outro, a marca d’água resultante pode ser menos perceptível. À medida que o número de parâmetros de embutimento de marca d’água aumenta, este efeito torna-se mais pronunciado (a deterioração introduzida pela marca d’água é mais tipo ruído). [00197] A Tabela 2 ilustra dois modos nos quais os parâmetros de codificação podem ser selecionados para modulação. No primeiro exemplo, apresentado na parte "a" da tabela 2, os parâmetros 1 e 2 tomam o valor da seqüência de marca d’água (WS) dependendo da seqüência determinística (DS). Por exemplo, o parâmetro 1 é modulado para um estado refletindo o valor WS se o valor DS for "0", caso contrário ele é modulado para o estado refletindo um valor "0" (qualquer estado pode ser, mas não precisa ser, o valor prees-tabelecido do parâmetro). Por conseqüência, o parâmetro 2 é modulado para um estado refletindo o valor WS se o valor DS for 1, caso contrário ele é modulado para um estado refletindo um valor "0" (qualquer estado pode ser, mas não precisa ser, o valor preestabe-lecido do parâmetro). As seqüências de ambos parâmetros e da DS são requeridos para detectar a WS neste exemplo. No segundo exemplo, apresentado na parte "b" da Tabela 2, os parâmetros 1 e 2 são modulados para um estado refletindo o valor da WS dependendo somente da própria WS. Por exemplo, o parâmetro 1 é modulado de seu estado preestabelecido para um estado refletindo um valor WS de "0" e o parâmetro 2 é modulado de seu estado preestabelecido para um estado refletindo um valor WS de "1". Deste modo, qualquer parâmetro pode ser detectado de forma independente, à medida que ambos transportam a WS.
Tabela 2 Modificando a taxa na qual a escolha de parâmetros para modulação altera-se [00198] De acordo com uma variação adicional deste aspecto da invenção, a escolha dos parâmetros para modulação pode alterar dependendo de uma sequência determinística. Isto pode adicionalmente reduzir a percepti-vidade da marca d’água, à medida que efeitos periódicos introduzidos pela alteração na técnica de embutimento em uma taxa constante são eliminados. Esta modalidade é ilustrada na Tabela 3. Neste exemplo, o parâmetro 1 é modulado para um estado refletindo o inverso da WS (qualquer estado pode ser, mas não precisa ser, o valor preestabelecido do parâmetro) e o símbolo repete-se quando o valor DS é "1" e caso contrário não é repetido. O parâmetro 2 é modulado para um estado refletindo o valor preestabelecido da WS (qualquer estado pode ser, mas não precisa ser, o valor preestabelecido do parâmetro) e o símbolo repete-se quando o valor DS é "1" e, caso contrário, não é repetido. Como no exemplo da parte b da Tabela 2, ambos parâmetros transportam a marca d’água.
Tabela 3 Controlando a Modulação de Parâmetro em resposta às Características do Sinal Fonte [00199] Modificando a taxa de transições de símbolo de marca d’água utilizando a análise de sinal fonte [00200] Outra variação deste aspecto da invenção envolve analisar as características do sinal fonte e, então, de forma adaptável controlar a taxa de transições de modulação de parâmetro e, por conseqüência, a taxa de transições de símbolo de marca d’água baseado nos resultados desta análise. Em particular, isto envolve variar, em resposta às características do sinal fonte, a duração dos estados de modulação de parâmetro e, por conseqüência, a duração dos estados de símbolo de marca d’água. Por exemplo, rapidamente alterar a condição de sinal pode proporcionar um grau útil de mascaramento temporal que pode ser utilizado para diminuir a perceptibilidade de uma transição de símbolo de marca d’água. Se a amplitude do sinal fonte no domínio do tempo variar além de um limite predeterminado do quadro 1 para o quadro 2 (assumindo que o sinal fonte foi formado em um fluxo de sinal digital possuindo quadros), o símbolo de marca d’água pode ser permitido de alterar de um valor no quadro 1 para outro valor no quadro 2. No quadro 3, se as características do sinal fonte não variarem além do limite dos quadros anteriores, o símbolo pode não ser permitido de alterar os valores. Correlacionando as transições de símbolo de marca d’água com eventos de mascaramento ou com outras condições de "alteração amigável" no sinal fonte subjacente, a imperceptibilidade da marca d’água pode ser aperfeiçoada. [00201] Na Tabela 4, uma seqüência definida pela fonte (SDS) representa a saída de um processo de estabelecimento de limite, tal como a detecção transitória. Para este exemplo, o valor SDS de "0" indica que nenhuma condição transitória ocorreu e um valor de "1" indica que um transitório estava presente no bloco. Na parte "a" da Tabela 4, o valor WS é repetido (repetindo o mesmo estado de modulação do parâmetro) se a SDS tiver um valor de "1". Se a SDS tiver um valor de "0", o símbolo de marca d’água não é repetido. Neste exemplo, é assumido que um único parâmetro de codificação transporta a marca d’água. [00202] Modificando a taxa na qual a escolha de parâmetros para modulação altera-se utilizando a análise de sinal fonte [00203] Em outro aspecto da invenção, o aspecto recém-explicado é modificado de modo a utilizar as características do sinal fonte para modificar a taxa na qual a escolha de parâmetros para modulação alte-ra-se, oposto à taxa de modulação de parâmetro. Como no aspecto recém-explicado, o benefício é que as transições são menos perceptíveis se elas ocorrerem quando o sinal fonte proporcionar mascaramen-to temporal ou outras condições de "alteração amigável". Um exemplo desta modalidade é ilustrada na parte b da tabela 4. Neste exemplo, o parâmetro 1 é modulado para um estado refletindo o inverso da WS (qualquer estado pode ser, mas não precisa ser, o valor preestabeleci-do do parâmetro) e o símbolo repete quando o valor SDS é "1" e, caso contrário, ele não é repetido. O parâmetro 2 é modulado para um estado refletindo o valor preestabelecido da WS (qualquer estado pode ser, mas não precisa ser, o valor preestabelecido do parâmetro) e o símbolo repete-se quando o valor SDS é "1" e, caso contrário, ele não é repetido. Como no exemplo da parte b da Tabela 2, ambos parâmetros transportam a marca d’água. Esta maneira de se abordar é similar a esta apresentada na Tabela 3, mas difere somente pelo fato de que a taxa de transição aqui é definida pela SDS.
Tabela 4 Selecionando o parâmetro para embutir a marca cTáqua utilizando a análise de sinal fonte [00204] Em outro aspecto da presente invenção, o número de parâmetros no conjunto disponível de parâmetros disponíveis para modulação é modificado baseado nas características do sinal fonte. Suponha que um sistema de colocação de marca d’água particular esteja apto a embutir uma marca d’água modulando qualquer um dentre vários parâmetros diferentes (por exemplo, parâmetros resultando em elevação de energia espetral, inserção de ruído temporal, redução de largura de banda, etc.). Dependendo das características correntes do sinal fonte, nem todos estes parâmetros podem causar alterações imperceptíveis no sinal decodificado. Por exemplo, se o sinal fonte for estacionário, a inserção de ruído temporal pode ser mais perceptível do que uma elevação de energia espectral em uma faixa de freqüência que seja perceptivelmente mascarada. Como resultado, pode ser benéfico reduzir o conjunto de parâmetros disponíveis para desabilitar os que são prováveis de causar resultados que sejam mais perceptíveis para a característica do sinal corrente. [00205] Na Tabela 5, um exemplo apresenta uma seqüência defini- da por sinal (SDS) baseada no mesmo processo de estabelecimento de limite (detecção transitória) como descrito anteriormente. Um valor SDS de "1" indica que uma condição transitória existe no bloco e um valor SDS de "0" indica que nenhuma condição transitória existe. Na Tabela 5, os parâmetros 1 e 2 nominalmente transportam a marca d’água quando não existe condição transitória (SDS = 0), com o parâmetro 1 possuindo um estado de modulação refletindo um valor de "1" para valores WM de "0" e possuindo um estado de modulação refletindo um valor de "0" no caso contrário e o parâmetro 2 possuindo um estado de modulação refletindo um valor de "1" para valores WM de "1" e possuindo um estado de modulação refletindo um valor de "0" no caso contrário. Se existir uma condição transitória (SDS = 1), então os parâmetros 3 e 4 são modulados, parâmetros estes que de forma ótima causam distorção temporal, ao invés dos parâmetros 1 e 2, os quais causam distorção espectral. Tendo reduzido o número de parâmetros, uma seqüência determinística pode, então, ser utilizada para selecionar parâmetros do conjunto menor, desse modo preservando o benefício da troca entre ou no meio dos parâmetros, enquanto ao mesmo tempo de forma adaptável escolhendo entre os parâmetros que são preferíveis em vista das características do sinal fonte corrente.
Tabela 5 Controlando Modulação de Parâmetro em Resposta a uma Seqüência Determinística e às Características do Sinal Fonte [00206] Em adição a controlar a modulação de parâmetro utilizando somente uma seqüência determinística ou somente as características do sinal de entrada, a invenção também contempla controlar a modulação de parâmetro em resposta tanto a uma seqüência determinísticas como às características do sinal de entrada. [00207] Existem vários modos para combinar o uso de uma seqüência determinística com as características do sinal fonte de modo a controlar a modulação de parâmetro. Fazer isto pode adicionalmente aperfeiçoar a imperceptibilidade e/ou a robustez. Em um tal método, uma seqüência determinística seleciona qual subconjunto de parâmetros de codificação é utilizado para diferentes estados das características do sinal. Mais particularmente, utilizando o exemplo da Tabela 5 acima, os primeiros dois parâmetros são escolhidos para modulação quando um transitório não existe (SDS = 0) e estes parâmetros são escolhidos baseado em uma seqüência determinística, DS. A Tabela 6 ilustra este método.
Tabela 6 [00208] Em outro exemplo, a seqüência determinística modifica a taxa de transições das seqüências de marca d’água que são modifica- das por uma seqüência definida pelo sinal. A Tabela 7 ilustra este método. A segunda coluna ilustra a primeira etapa de alterar a técnica de embutimento baseado na SDS e a terceira coluna ilustra a segunda etapa de adicionalmente alterar a taxa das sequências baseado na DS. Como nos exemplos anteriores, o valor da seqüência é repetido se a SDS tiver um valor de "1". Se a SDS tiver um valor de "0", o valor da seqüência não é repetido.
Tabela 7 [00209] Com cada um dos exemplos nos quais vários parâmetros de codificação transportam a seqüência embutida, também existe a possibilidade de adicionar redundância por aplicar a mesma seqüência de colocação de marca d’água junto a vários parâmetros de codificação para aumentar a elasticidade do erro ao ataque ou processamento. Para facilitar a detecção com complexidade inferior, tais parâmetros de codificação podem ter relações constrangidas, ou uma hierarquia predeterminada, de modo que se um parâmetro tiver erros o detector pode estar apto a recuperar a mensagem a partir de outro parâmetro de codificação. [00210] Adicionalmente, a seqüência determinística pode ser utilizada para modular simultaneamente um ou mais outros parâmetros de codificação para tornar difícil para um atacante deduzir qual parâmetro está transportando a marca d’água. Em um exemplo apresentado na Tabela 8, o parâmetro 1 transporta a seqüência de marca d’água e a seqüência determinística especifica qual dentre o parâmetro 2 ou o parâmetro 3 irá variar baseado na seqüência de marca d’água. Os parâmetros 2 e 3 neste caso não transportam a marca d’água, mas atuam como chamariz. Neste exemplo, os parâmetros chamariz irão igualar a WS para o estado apropriado da DS e caso contrário serão "0".
Tabela 8 Conclusão [00211] Deve ser entendido que a implementação de outras variações e modificações da invenção e seus vários aspectos serão aparentes para os versados na técnica e que a invenção não está limitada por estas modalidades específicas descritas. Portanto, é contemplado cobrir pela presente invenção quaisquer e todas as modificações, variações ou equivalentes que caiam dentro do verdadeiro espírito e escopo dos princípios subjacentes básicos revelados e reivindicados aqui dentro. [00212] A presente invenção e seus vários aspectos podem ser implementados como funções de software executadas em processadores de sinal digital, em computadores digitais programados de propósito geral e/ou em computadores digitais de propósito especial. As interfaces entre os fluxos de sinal analógico e digital podem ser executadas em hardware apropriado e/ou como funções em software e/ou em fir-mware.

Claims (23)

1. Método para modificar uma operação de uma função co-dificadora de um sistema de codificação perceptual de acordo com informação suplementar de modo que a informação suplementar possa ser detectável em uma saída de uma função decodificadora, caracterizado pelo fato de que compreende a etapa de: modular um ou mais parâmetros na função codificadora (2) em resposta ao conteúdo da informação da informação suplementar.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador perceptual é um codificador de áudio do tipo que emprega uma alocação de bit para frente / para trás híbrida.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que um ou mais parâmetros incluem um ou mais parâmetros que se encontram dentro de uma ou mais das seguintes categorias: modelo de mascaramento e alocação de bit, acoplamento entre ou no meio de canais, largura de banda de freqüência, controle de sinal de excitação, relação de fase, e janela de transformação de tempo/freqüência.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador perceptual é um codificador de áudio do tipo que emprega uma alocação de bit para frente.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que um ou mais parâmetros incluem um ou mais parâmetros que se encontram dentro de uma ou mais das seguinte categorias: modelo de mascaramento e alocação de bit, acoplamento entre ou no meio de canais, coeficientes de filtro de modelagem de ruído temporal, e janela de transformação de tempo/freqüência.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador perceptual é um codificador de vídeo e em que um ou mais parâmetros incluem um ou mais parâmetros que se encontram dentro de uma ou mais das seguintes categorias: tipo de quadro, e controle de movimento.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros são selecionados a partir dos parâmetros que afetam no sinal de saída decodificado um ou mais dentre: taxa de sinal para ruído, ruído do quantizador, relação de tempo entre ou no meio dos canais, largura de banda da freqüência, ruído modelado, relação de fase entre ou no meio dos canais, e ruído com efeito descontinuado no tempo, de espectro amplo.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros são modulados pela execução de um dentre os seguintes atos: variar um parâmetro com dois valores entre seus dois valores, variar o parâmetro entre ou no meio de seu valor preestabe-lecido e um ou mais outros valores, e variar o parâmetro entre ou no meio de valores diferentes de seu valor preestabelecido.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o grau de modulação de um ou mais parâmetros é controlado.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o grau de modulação de um ou mais parâmetros é controlado para limitar a perceptibilidade de artefatos no sinal de saída decodificado resultante da modulação de um ou mais parâmetros.
11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modulação de um parâmetro é indiretamente controlada de acordo com informação suplementar de modo que uma ou mais dentre as seguintes características de modulação: a seleção de um ou mais parâmetros para modulação, a taxa de seleção de parâmetro, e a taxa de transições de estado de parâmetro são determinadas em resposta à informação suplementar e como uma função de um ou mais outros sinais ou seqüências.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que um ou mais outros sinais ou seqüências incluem qualquer um ou ambos dentre o seguinte: um conjunto de instruções, e características do sinal de entrada para o codificador do sistema de codificação.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o conjunto de instruções inclui uma seqüência determinística.
14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que a seqüência determinística é uma seqüência de número pseudo-randômica.
15. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros são modulados na função codificadora.
16. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros são modulados em uma função decodificadora.
17. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros são modulados na função codificadora e em uma função decodificadora.
18. Método para modificar a operação do codifica-dor/decodificar de um sistema de codificação perceptual de acordo com a informação suplementar e para detectar a informação suplementar na saída do decodificador conforme definido na reivindicação 1, caracterizado pelo fato de que ainda compreende: detectar a informação suplementar na saída da função decodificadora.
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que o ato de detectar a informação suplementar na saída da função decodificadora é realizado por um dentre os seguintes atos: observar o sinal decodificado, comparar o sinal decodificado com o sinal aplicado à função codificadora, e comparar o sinal decodificado com o sinal decodificado a partir de um sistema de codificação perceptual idêntico no qual nenhum parâmetro na função codificadora ou na função decodificadora é modulado em resposta à informação suplementar.
20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que o ato de observar o sinal decodificado compreende comparar o sinal decodificado com uma versão retardada no tempo dele próprio.
21. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais parâmetros de codificação perceptual são modulados em resposta à informação suplementar.
22. Método para modificar uma operação de uma função decodificadora (4) de um sistema de codificação perceptual de acordo com informação suplementar de modo que a informação suplementar possa ser detectável em uma saída de uma função decodificadora caracterizado pelo fato de que compreende a etapa de: modular um ou mais parâmetros na função decodificadora em resposta à informação suplementar.
23. Método para modificar uma operação de uma função codificadora (2) e uma função decodificadora (4) de um sistema de codificação perceptual de acordo com informação suplementar de modo que a informação suplementar possa ser detectável em uma saída de uma função decodificadora caracterizado pelo fato de que compreende a etapa de: modular um ou mais parâmetros na função codificadora e na função decodificadora em resposta à informação suplementar.
BRPI0113271A 2000-08-16 2001-08-15 método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar BRPI0113271B1 (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US22604400P 2000-08-16 2000-08-16
US22615100P 2000-08-16 2000-08-16
US25596700P 2000-12-15 2000-12-15
US25596400P 2000-12-15 2000-12-15
US25596500P 2000-12-15 2000-12-15
US25600000P 2000-12-15 2000-12-15
US25607800P 2000-12-15 2000-12-15
US25615700P 2000-12-15 2000-12-15
PCT/US2001/025473 WO2002015587A2 (en) 2000-08-16 2001-08-15 Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information

Publications (2)

Publication Number Publication Date
BR0113271A BR0113271A (pt) 2003-09-23
BRPI0113271B1 true BRPI0113271B1 (pt) 2016-01-26

Family

ID=27575224

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0113271A BRPI0113271B1 (pt) 2000-08-16 2001-08-15 método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar

Country Status (12)

Country Link
US (1) US7395211B2 (pt)
EP (1) EP1310099B1 (pt)
JP (1) JP2004506947A (pt)
KR (1) KR100898879B1 (pt)
CN (1) CN100431355C (pt)
AT (1) ATE308858T1 (pt)
AU (2) AU2001284910B2 (pt)
BR (1) BRPI0113271B1 (pt)
CA (1) CA2418722C (pt)
DE (1) DE60114638T2 (pt)
HK (1) HK1080243B (pt)
WO (1) WO2002015587A2 (pt)

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
DE10046575B4 (de) * 2000-09-20 2005-03-10 Siemens Ag Verfahren zur Frequenzakquisition, insbesondere zur Initialfrequenzakquisition, einer mobilen Kommunikationseinrichtung
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
EP1433175A1 (en) * 2001-09-05 2004-06-30 Koninklijke Philips Electronics N.V. A robust watermark for dsd signals
US20030131350A1 (en) 2002-01-08 2003-07-10 Peiffer John C. Method and apparatus for identifying a digital audio signal
KR20040095325A (ko) * 2002-03-28 2004-11-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 다매체 신호들의 워터마킹을 위한 윈도우 셰이핑 함수들
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
FR2840147B1 (fr) * 2002-05-24 2004-08-27 France Telecom Procedes de brouillage et de debrouillage de signal video, systeme, decodeur, serveur de diffusion, support de donnees pour la mise en oeuvre de ces procedes
GB2390502A (en) 2002-07-04 2004-01-07 Sony Uk Ltd Watermarking material using a bandwidth adapted codeword
US7239981B2 (en) * 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2004073168A2 (en) * 2003-02-07 2004-08-26 Warner Bros. Entertainment Inc. Methods for encoding data in an analog video signal such that it survives resolution conversion
US20060140406A1 (en) * 2003-02-07 2006-06-29 Koninklijke Philips Electronics N.V. Signal processing
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
DE602004017993D1 (de) * 2003-06-19 2009-01-08 Koninkl Philips Electronics Nv Erhöhung der detektierungswahrscheinlichkeit von zusätzlichen daten in einem mediasignal mit wenigen frequenzkomponenten
KR20050026641A (ko) * 2003-09-09 2005-03-15 삼성전자주식회사 오디오 신호에 가라오케 정보를 삽입하기 위한 방법,삽입된 가라오케 정보의 재생 방법, 및 그 장치와 이를구현하기 위한 프로그램이 기록된 기록 매체
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
JP4230953B2 (ja) * 2004-03-31 2009-02-25 株式会社ケンウッド ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム
CA2562137C (en) 2004-04-07 2012-11-27 Nielsen Media Research, Inc. Data insertion apparatus and methods for use with compressed audio/video data
US7451093B2 (en) * 2004-04-29 2008-11-11 Srs Labs, Inc. Systems and methods of remotely enabling sound enhancement techniques
DE102004021403A1 (de) 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
DE102004021404B4 (de) * 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
US8412363B2 (en) 2004-07-02 2013-04-02 The Nielson Company (Us), Llc Methods and apparatus for mixing compressed digital bit streams
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
JP5154934B2 (ja) * 2004-09-17 2013-02-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚的歪みを最小化する結合オーディオ符号化
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
WO2006132857A2 (en) 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
JP2006337851A (ja) * 2005-06-03 2006-12-14 Sony Corp 音声信号分離装置及び方法
JP4896455B2 (ja) * 2005-07-11 2012-03-14 株式会社エヌ・ティ・ティ・ドコモ データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
KR100695158B1 (ko) * 2005-08-03 2007-03-14 삼성전자주식회사 영상 부호화장치 및 방법과 그 복호화장치 및 방법
KR101277041B1 (ko) 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
GB2431839B (en) * 2005-10-28 2010-05-19 Sony Uk Ltd Audio processing
US7949131B2 (en) * 2005-12-19 2011-05-24 Sigmatel, Inc. Digital security system
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
FR2898458B1 (fr) * 2006-03-10 2008-05-16 Medialive Procede pour la distribution securisee de sequences audiovisuelles, decodeur et systeme pour la mise en oeuvre de ce procede
MY141426A (en) 2006-04-27 2010-04-30 Dolby Lab Licensing Corp Audio gain control using specific-loudness-based auditory event detection
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US7940833B2 (en) * 2006-06-21 2011-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Transmitter with intelligent preconditioning of amplifier signal
JP5011849B2 (ja) * 2006-06-29 2012-08-29 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
EP2958106B1 (en) 2006-10-11 2018-07-18 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
EP2082527B1 (en) 2006-10-18 2014-09-24 Destiny Software Productions Inc. Methods for watermarking media data
WO2009045636A2 (en) 2007-09-28 2009-04-09 Dolby Laboratories Licensing Corporation Multimedia coding and decoding with additional information capability
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
US20090285402A1 (en) * 2008-05-16 2009-11-19 Stuart Owen Goldman Service induced privacy with synchronized noise insertion
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
US8515239B2 (en) * 2008-12-03 2013-08-20 D-Box Technologies Inc. Method and device for encoding vibro-kinetic data onto an LPCM audio stream over an HDMI link
CA2750795C (en) * 2009-01-28 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
US8626516B2 (en) * 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
US8666528B2 (en) 2009-05-01 2014-03-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
WO2010148516A1 (en) * 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
WO2011013980A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
CN101651837B (zh) * 2009-09-10 2011-03-02 北京航空航天大学 一种基于帧间预测误差直方图修改的可逆视频水印方法
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
EP3693964B1 (en) * 2009-10-15 2021-07-28 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
US8638851B2 (en) * 2009-12-23 2014-01-28 Apple Inc. Joint bandwidth detection algorithm for real-time communication
WO2011085483A1 (en) 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
WO2012026039A1 (ja) * 2010-08-27 2012-03-01 富士通株式会社 電子透かし埋め込み装置、電子透かし埋め込み方法及び電子透かし埋め込み用コンピュータプログラムならびに電子透かし検出装置
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
PL2485488T3 (pl) 2011-02-02 2017-09-29 Nagravision S.A. Dekoder multimediów i sposób dekodowania pozwalający na śledzenie dekodera multimediów
US20120208858A1 (en) 2011-02-15 2012-08-16 Allergan, Inc. Pharmaceutical Cream Compositions of Oxymetazoline and Methods of Use
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
EP2549400A1 (en) * 2011-07-22 2013-01-23 Thomson Licensing Method for protecting an unprotected sound effect program
CN103548079B (zh) * 2011-08-03 2015-09-30 Nds有限公司 音频水印
US9164724B2 (en) 2011-08-26 2015-10-20 Dts Llc Audio adjustment system
US8527264B2 (en) * 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US8909517B2 (en) * 2012-08-03 2014-12-09 Palo Alto Research Center Incorporated Voice-coded in-band data for interactive calls
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9269363B2 (en) * 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
CN104781878B (zh) 2012-11-07 2018-03-02 杜比国际公司 音频编码器和方法、音频转码器和方法、以及转换方法
US9099080B2 (en) 2013-02-06 2015-08-04 Muzak Llc System for targeting location-based communications
EP2959481B1 (en) 2013-02-20 2017-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an encoded audio or image signal or for decoding an encoded audio or image signal in the presence of transients using a multi overlap portion
US9679053B2 (en) 2013-05-20 2017-06-13 The Nielsen Company (Us), Llc Detecting media watermarks in magnetic field data
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
JP5761318B2 (ja) * 2013-11-29 2015-08-12 ヤマハ株式会社 識別情報重畳装置
US8768005B1 (en) * 2013-12-05 2014-07-01 The Telos Alliance Extracting a watermark signal from an output signal of a watermarking encoder
US8768710B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Enhancing a watermark signal extracted from an output signal of a watermarking encoder
US8768714B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Monitoring detectability of a watermark message
US9824694B2 (en) 2013-12-05 2017-11-21 Tls Corp. Data carriage in encoded and pre-encoded audio bitstreams
US8918326B1 (en) 2013-12-05 2014-12-23 The Telos Alliance Feedback and simulation regarding detectability of a watermark message
EP2930717A1 (en) * 2014-04-07 2015-10-14 Thomson Licensing Method and apparatus for determining in a 2nd screen device whether the presentation of watermarked audio content received via an acoustic path from a 1st screen device has been stopped
US9875756B2 (en) * 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
US9130685B1 (en) 2015-04-14 2015-09-08 Tls Corp. Optimizing parameters in deployed systems operating in delayed feedback real world environments
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
EP3491824B1 (en) * 2016-08-04 2023-04-26 Huawei Technologies Co., Ltd. Method and apparatus for data hiding in prediction parameters
JP6557886B1 (ja) * 2018-02-23 2019-08-14 エヴィクサー株式会社 コンテンツ再生プログラム、コンテンツ再生方法及びコンテンツ再生システム
US11763832B2 (en) * 2019-05-01 2023-09-19 Synaptics Incorporated Audio enhancement through supervised latent variable representation of target speech and noise
US11978461B1 (en) * 2021-08-26 2024-05-07 Alex Radzishevsky Transient audio watermarks resistant to reverberation effects
WO2023212753A1 (en) * 2022-05-02 2023-11-09 Mediatest Research Gmbh A method for embedding or decoding audio payload in audio content
CN115546652B (zh) * 2022-11-29 2023-04-07 城云科技(中国)有限公司 一种多时态目标检测模型及其构建方法、装置及应用

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4636088A (en) 1984-05-21 1987-01-13 Therma-Wave, Inc. Method and apparatus for evaluating surface conditions of a sample
EP0200301A1 (en) 1985-03-01 1986-11-05 Therma-Wave Inc. Method and apparatus for evaluating surface and subsurface features in a semiconductor
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
FR2660131B1 (fr) 1990-03-23 1992-06-19 France Etat Dispositif de transmissions de donnees numeriques a au moins deux niveaux de protection, et dispositif de reception correspondant.
US5121204A (en) * 1990-10-29 1992-06-09 General Electric Company Apparatus for scrambling side panel information of a wide aspect ratio image signal
US5254843A (en) 1991-08-07 1993-10-19 Hynes John E Securing magnetically encoded data using timing variations in encoded data
US5539812A (en) * 1992-07-29 1996-07-23 Kitchin; Dwight W. Method and apparatus for detecting an attempted three-way conference call on a remote telephone
DE4241068C2 (de) 1992-12-05 2003-11-13 Thomson Brandt Gmbh Verfahren zum Übertragen, Speichern oder Decodieren eines digitalen Zusatzsignals in einem digitalen Tonsignal
US6122403A (en) 1995-07-27 2000-09-19 Digimarc Corporation Computer system linked by using information in data objects
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US5748783A (en) 1995-05-08 1998-05-05 Digimarc Corporation Method and apparatus for robust information coding
US5404377A (en) 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
US5774452A (en) 1995-03-14 1998-06-30 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in audio signals
EP0820624A1 (en) 1995-04-10 1998-01-28 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US5680462A (en) * 1995-08-07 1997-10-21 Sandia Corporation Information encoder/decoder using chaotic systems
EP0766468B1 (en) 1995-09-28 2006-05-03 Nec Corporation Method and system for inserting a spread spectrum watermark into multimedia data
EP0795174B1 (en) * 1995-10-04 2002-08-07 Koninklijke Philips Electronics N.V. Marking a digitally encoded video and/or audio signal
DE69609163T2 (de) 1995-12-11 2001-03-08 Koninkl Philips Electronics Nv Video- und/oder audiosignalmarkierung
US5956430A (en) 1996-02-19 1999-09-21 Fuji Xerox Co., Ltd. Image information coding apparatus and method using code amount of a selected pixel block for changing coding parameter
US6035177A (en) 1996-02-26 2000-03-07 Donald W. Moses Simultaneous transmission of ancillary and audio signals by means of perceptual coding
EP0875107B1 (de) 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US5828416A (en) 1996-03-29 1998-10-27 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a elementary stream video decorder
US5812976A (en) 1996-03-29 1998-09-22 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a bitrate-constrained audio recorder
US6229924B1 (en) * 1996-05-16 2001-05-08 Digimarc Corporation Method and apparatus for watermarking video images
US5889868A (en) 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US6078664A (en) 1996-12-20 2000-06-20 Moskowitz; Scott A. Z-transform implementation of digital watermarks
KR100449354B1 (ko) 1996-07-16 2005-08-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 정보신호내에삽입된워터마크검출방법및장치
US6061793A (en) 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6031914A (en) 1996-08-30 2000-02-29 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible images
US6069914A (en) 1996-09-19 2000-05-30 Nec Research Institute, Inc. Watermarking of image data using MPEG/JPEG coefficients
US5809139A (en) 1996-09-13 1998-09-15 Vivo Software, Inc. Watermarking method and apparatus for compressed digital video
US5825892A (en) * 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
US5915027A (en) 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
US5845251A (en) 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
WO1998031152A2 (en) 1997-01-13 1998-07-16 Koninklijke Philips Electronics N.V. Embedding supplemental data in a digital video signal
JP3412117B2 (ja) 1997-04-25 2003-06-03 日本電信電話株式会社 量子化の符号化パラメータを用いる電子すかし作成方法およびその読出し方法
US5940135A (en) 1997-05-19 1999-08-17 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in analog signals
US5960081A (en) 1997-06-05 1999-09-28 Cray Research, Inc. Embedding a digital signature in a video sequence
JP3662398B2 (ja) * 1997-09-17 2005-06-22 パイオニア株式会社 電子透かし重畳装置及び電子透かし検出装置
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6037984A (en) 1997-12-24 2000-03-14 Sarnoff Corporation Method and apparatus for embedding a watermark into a digital image or image sequence
US6064748A (en) * 1998-01-16 2000-05-16 Hewlett-Packard Company Method and apparatus for embedding and retrieving additional data in an encoded data stream
US6145081A (en) * 1998-02-02 2000-11-07 Verance Corporation Method and apparatus for preventing removal of embedded information in cover signals
US6064764A (en) 1998-03-30 2000-05-16 Seiko Epson Corporation Fragile watermarks for detecting tampering in images
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
JP3354880B2 (ja) * 1998-09-04 2002-12-09 日本電信電話株式会社 情報多重化方法、情報抽出方法および装置
US6219634B1 (en) 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6128736A (en) 1998-12-18 2000-10-03 Signafy, Inc. Method for inserting a watermark signal into data

Also Published As

Publication number Publication date
DE60114638D1 (de) 2005-12-08
HK1080243A1 (en) 2006-04-21
BR0113271A (pt) 2003-09-23
KR20030064381A (ko) 2003-07-31
DE60114638T2 (de) 2006-07-20
WO2002015587A3 (en) 2003-03-13
CA2418722C (en) 2012-02-07
EP1310099B1 (en) 2005-11-02
CN100431355C (zh) 2008-11-05
ATE308858T1 (de) 2005-11-15
AU2001284910B2 (en) 2007-03-22
JP2004506947A (ja) 2004-03-04
WO2002015587A2 (en) 2002-02-21
EP1310099A2 (en) 2003-05-14
US7395211B2 (en) 2008-07-01
US20040024588A1 (en) 2004-02-05
KR100898879B1 (ko) 2009-05-25
CN1672418A (zh) 2005-09-21
CA2418722A1 (en) 2002-02-21
HK1080243B (zh) 2009-05-15
AU8491001A (en) 2002-02-25

Similar Documents

Publication Publication Date Title
BRPI0113271B1 (pt) método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar
AU2001284910A1 (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
CA2527011C (en) Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
KR100595202B1 (ko) 디지털 오디오 워터마크 삽입/검출 장치 및 방법
Hu et al. Variable-dimensional vector modulation for perceptual-based DWT blind audio watermarking with adjustable payload capacity
US7035700B2 (en) Method and apparatus for embedding data in audio signals
US20040059918A1 (en) Method and system of digital watermarking for compressed audio
Qiao et al. Noninvertible watermarking methods for mpeg-encoded audio
Arnold et al. A phase-based audio watermarking system robust to acoustic path propagation
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
Xiang et al. Digital audio watermarking: fundamentals, techniques and challenges
EP1875470B1 (en) Modified DCT transform to phase modulate an MP3 data bitstream in baseband, and watermarking.
Alsalami et al. Digital audio watermarking: survey
Bibhu et al. Secret key watermarking in WAV audio file in perceptual domain
He Watermarking in audio: key techniques and technologies
Horvatic et al. Robust audio watermarking: based on secure spread spectrum and auditory perception model
Gurijala et al. Digital Watermarking Techniques for Audio and Speech Signals
Xu et al. Digital Audio Watermarking
Battisti et al. Perceptual audio watermarking driven by Human Auditory System
Ortiz Reversible watermarking scheme with wa-termark and signal robustness for audio
Adya Audio watermark resistant to mp3 compression
Wang et al. A robust watermarking system based on the properties of low frequency in perceptual audio coding
de CT Gomes et al. Presented at the 109th Convention 2000 September 22-25 Los Angeles, California, USA
Hu et al. Exploiting Psychoacoustic Properties to Achieve Transparent and Robust Audio Watermarking
Xu et al. Audio watermarking

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: H04N 7/26

Ipc: G10L 19/018 (2013.01), H04N 19/467 (2014.01)

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 26/01/2016, OBSERVADAS AS CONDICOES LEGAIS.