BR112013013353B1 - método, aparelho e meio de armazenamento legível em computador para processamento adaptativo com diversos nós de processamento de mídia - Google Patents

método, aparelho e meio de armazenamento legível em computador para processamento adaptativo com diversos nós de processamento de mídia Download PDF

Info

Publication number
BR112013013353B1
BR112013013353B1 BR112013013353-8A BR112013013353A BR112013013353B1 BR 112013013353 B1 BR112013013353 B1 BR 112013013353B1 BR 112013013353 A BR112013013353 A BR 112013013353A BR 112013013353 B1 BR112013013353 B1 BR 112013013353B1
Authority
BR
Brazil
Prior art keywords
media
processing
data
media data
state
Prior art date
Application number
BR112013013353-8A
Other languages
English (en)
Other versions
BR112013013353A2 (pt
Inventor
Jefrey Riedmiller
Regunathan Radhakrishnan
Marvin Pribadi
Farhad Farahani
Michael Smithers
Original Assignee
Dolby Labora Tories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Labora Tories Licensing Corporation filed Critical Dolby Labora Tories Licensing Corporation
Publication of BR112013013353A2 publication Critical patent/BR112013013353A2/pt
Publication of BR112013013353B1 publication Critical patent/BR112013013353B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

PROCESSAMENTO ADAPTATIVO COM DIVERSOS NÓS DE PROCESSAMENTO DE MÍDIA. A presente invenção refere-se a técnicas para processamento adaptativo de dados de mídia com base em dados separados especificando um estado dos dados de mídia são fornecidas. Um dispositivo em uma cadeia de processamento de mídia pode determinar se um tipo de processamento de mídia já foi executado em uma versão de entrada de dados de mídia. Neste caso, o dispositivo pode adaptar seu processamento de dados de mídia para desativar executar o tipo de processamento de mídia. Caso contrário, o dispositivo executa o tipo de processamento de mídia. O dispositivo pode criar um estado dos dados de mídia, especificando o tipo de processamento de mídia. O dispositivo pode comunicar o estado dos dados de mídia e uma versão de saída de dados de mídia para um dispositivo receptor nos meios de comunicação, processamento de cadeia, com a finalidade de processamento adaptativo do dispositivo destinatário os dados de mídia de apoio.

Description

Referência Cruzada a Pedido Relacionado e Reivindicação de Prioridade
[0001] Este Pedido reivindica prioridade para o Pedido Provisório US número 61/419.747, depositado em 3 de dezembro de 2010 e o Pedido Provisório US número 61/558.286, depositado em 10 de novembro de 2011, ambos estando aqui incorporados para referência em sua totalidade, para todas as finalidades.
Tecnologia
[0002] A presente invenção refere-se, de modo geral, a sistemas de processamento de mídia e, em particular, a processamento adaptativo de dados de mídia com base em estados de processamento de mídia dos dados de mídia.
Antecedentes
[0003] Unidades de processamento de mídia operam tipicamente em uma maneira cega, e não levam em consideração o histórico de processamento de dados de mídia que ocorre antes que os dados de mídia sejam recebidos. Isto pode trabalhar em uma estrutura de processamento de mídia na qual uma única entidade faz todo o processamento e codificação de mídia para uma variedade de dispositivos de transformação de mídia alvo enquanto um dispositivo de transformação de mídia alvo faz toda a decodificação e transformação dos dados de mídia codificados. Contudo, este processamento cego não funciona bem (ou de todo) em situações onde pluralidade de unidades de processamento de mídia é dispersada através de uma rede diversa ou é colocada em tandem (isto é, cadeia) e é esperada realizar de maneira otimizada seus respectivos tipos de processamento de mídia. Por exemplo, alguns dados de mídia podem ser codificados para sistemas mídia de alto desempenho e podem precisar ser convertidos para uma forma reduzida adequada para um dispositivo móvel ao longo de uma cadeia de processamento de mídia. Consequentemente, uma unidade de processamento de mídia pode realizar de forma desnecessária um tipo de processamento sobre os dados de mídia que já foi realizado. Por exemplo, uma unidade de nivelamento de volume realiza processamento sobre um clipe de áudio de entrada, independentemente de se ou não o nivelamento de volume tenha sido realizado previamente sobre o clipe de áudio de entrada. Como resultado, a unidade de nivelamento de volume realiza nivelamento mesmo quando não é necessário. Este processamento desnecessário pode também provocar degradação e/ou a remoção de características específicas enquanto transformando o conteúdo de mídia nos dados de mídia.
[0004] As abordagens descritas nesta seção são abordagens que poderiam ser perseguidas, porém não necessariamente abordagens que foram concebidas e perseguidas previamente. Portanto, a menos que indicado de outra maneira, não deveria ser admitido que qualquer das abordagens descritas nesta seção se qualifica como a técnica precedente, meramente em virtude de sua inclusão nesta seção. De maneira similar, questões identificadas com relação a uma ou mais abordagens não deveriam admitir terem sido reconhecidas em qualquer técnica precedente com base nesta seção, a menos que indicado de outra maneira.
Breve Descrição de Desenhos
[0005] A presente invenção está ilustrada à guisa de exemplo e não à guisa de limitação, e nas figuras dos desenhos que acompanham, e nos quais, numerais de referência iguais se referem a elementos similares, e nos quais:
[0006] A figura 1 ilustra um exemplo de cadeia de processamento de mídia, de acordo com algumas modalidades possíveis da presente invenção;
[0007] A figura 2 ilustra um exemplo de cadeia de processamento de mídia aprimorada, de acordo com algumas modalidades possíveis da presente invenção;
[0008] A figura 3 ilustra um exemplo de codificador/transcodificador de acordo com algumas modalidades possíveis da presente invenção;
[0009] A figura 4 ilustra um exemplo de decodificador, de acordo com algumas modalidades possíveis da presente invenção;
[00010] A figura 5 ilustra um exemplo de unidade de pós- processamento, de acordo com algumas modalidades possíveis da presente invenção;
[00011] A figura 6 ilustra um exemplo de implementação de um codificador/transcodificador, de acordo com algumas modalidades possíveis da presente invenção;
[00012] A figura 7 ilustra um exemplo de evolução de modos de controle de operação de decodificador de uma unidade de nivelamento de volume com base na qualidade dos metadados de volume de som em e/ou associados metadados de estado de processamento, de acordo com algumas modalidades possíveis da presente invenção;
[00013] A figura 8 ilustra um exemplo de configuração de utilizar ocultação de dados para passar a informação de processamento de mídia, de acordo com algumas modalidades possíveis da presente invenção;
[00014] A figura 9A e a figura 9B ilustram exemplos de fluxos de processo, de acordo com algumas modalidades possíveis da presente invenção;
[00015] A figura 10 ilustra um exemplo de plataforma de hardware sobre a qual um computador ou outro dispositivo de computação como descrito aqui, pode ser implementada de acordo com uma modalidade possível da presente invenção;
[00016] A figura 11 ilustra quadros de mídia com os quais metadados de estado de processamento associados com a dados de mídia nos quadros de mídia podem ser transmitidos de acordo com um exemplo de modalidade;
[00017] As figuras 12A até a figura 12L ilustram diagramas de blocos de alguns exemplos de nós de processamento de mídia/dispositivos de acordo com algumas modalidades da presente invenção.
Descrição de Exemplos de Modalidades Possíveis
[00018] Exemplos de modalidades possíveis que se relacionam a processamento adaptativo de dados de mídia com base em estados de processamento de mídia dos dados de mídia estão descritos aqui. Na descrição que segue, para finalidades de explicação, inúmeros detalhes específicos estão descritos para fornecer um entendimento completo da presente invenção. Será evidente, contudo, que a presente invenção pode ser tornada prática sem estes detalhes específicos. Em outros casos, estruturas e dispositivos bem conhecidos não estão descritas em detalhe exaustivo para evitar esconder, obscurecer ou ofuscar, de maneira desnecessária, a presente invenção.
[00019] Exemplos de modalidades estão descritos aqui de acordo com o seguinte delineamento: 1. Visão geral 2. Cadeias de processamento de mídia 3. Dispositivos ou unidades de processamento de mídia 4. Exemplo de processamento adaptativo de dados de mídia 5. Ocultação de dados 6. Exemplo de fluxo de processo 7. Mecanismos de implementação - visão geral de hardware 8. Exemplos de modalidades numeradas 9. Extensões, equivalentes, alternativas e miscelânea
Visão Geral
[00020] Esta visão geral apresenta uma descrição básica de alguns aspectos de uma modalidade possível da presente invenção. Deve ser observado que esta visão geral não é um resumo extensivo ou exaustivo de aspectos da modalidade possível. Além disto, deveria ser observado que esta visão geral não é projetada para ser entendida como identificando quaisquer aspectos significativos de maneira particular ou elementos da modalidade possível, nem como delineando qualquer escopo da modalidade possível em particular, nem a invenção em geral. Esta visão geral meramente apresenta alguns conceitos que se relacionam ao exemplo de modalidade possível em um formato condensado e simplificado, e deveria ser entendida como meramente um prelúdio conceitual para uma descrição mais detalhada de exemplos de modalidades possíveis que seguem abaixo.
[00021] Técnicas para processamento adaptativo para dados de mídia com base em estados de processamento de mídia dos dados de mídia estão descritas. Em algumas modalidades, possíveis unidades de processamento de mídia em uma cadeia de processamento de mídia aprimorada são habilitadas de maneira automática para recuperar e validar sinalização de processamento de mídia e/ou metadados de estado de processamento, determinar o de estado de dados de mídia com base na sinalização de processamento de mídia e/ou metadados de estado de processamento, adaptar seu respectivo processamento com base no estado dos dados de mídia. As unidades de processamento de mídia na cadeia de processamento de mídia aprimorada podem incluir, porém não estão limitadas a codificadores, transcodificadores, decodificadores, unidades de pré-processamento, unidades de pós-processamento, ferramentas de processamento de corrente de bits, codecs (ATSC) Advanced Television Systems Committee. Codecs (MPEG) Moving Picture Experts Group, etc. Uma unidade de processamento de mídia pode ser um sistema de processamento de mídia ou uma parte de um sistema de processamento de mídia.
[00022] Como aqui utilizado, o termo "metadados de estado de processamento" se refere a dados separados e diferentes de dados de mídia, enquanto os dados de mídia (por exemplo, quadros de vídeo, quadros de áudio codificados de maneira perceptiva, ou amostras de áudio PCM que contém conteúdo de mídia) ser referem a dados de amostra de mídia que representam conteúdo de mídia e é utilizado para transformar o conteúdo de mídia como saída de áudio ou vídeo. Os metadados de estado de processamento são associados com os dados de mídia e especifica que tipos de processamento já foram realizados sobre os dados de mídia. Esta associação dos metadados de estado de processamento com os dados de mídia é síncrona em tempo. Assim, os presentes metadados de estado de processamento indicam que os presentes dados de mídia de maneira contemporânea compreendem os resultados dos tipos indicados de processamento de mídia e/ou uma descrição de características de mídia nos dados de mídia. Em algumas modalidades possíveis, metadados de estado de processamento podem incluir histórico de processamento e/ou alguns ou todos os parâmetros que são utilizados em e/ou derivados dos tipos indicados de processamento de mídia. Adicionalmente e/ou opcionalmente os metadados de estado de processamento podem incluir características de mídia de um ou mais tipos diferentes computados/extraídos dos dados de mídia. Características de mídia, como descrito aqui, fornecem uma descrição semântica dos dados de mídia e podem compreender um ou mais de propriedades estruturais, tonalidade que inclui harmonia e melodia, timbre, ritmo, volume de som de referência, mistura estéreo, ou uma quantidade de fontes de som dos dados de mídia, ausência ou presença de voz, características de repetição, melodia, harmonia, letras, timbre, características perceptíveis, características de mídia digital, parâmetros estéreo, reconhecimento de voz (por exemplo, o que um locutor está dizendo, etc. Os metadados de estado de processamento também podem incluir outros metadados que não estão relacionados a ou derivados de qualquer processamento dos dados de mídia. Por exemplo, dados de terceiros parceiros, informação de rastreamento, identificadores, informação proprietária ou padrão, dados de anotação de usuário, dados de preferência de usuário, etc., podem ser adicionados por uma unidade particular de processamento de mídia para passar para outras unidades de processamento de mídia. Estes tipos independentes de metadados podem ser distribuídos para ou a partir de, validados e utilizados por um componente de processamento de mídia na cadeia de processamento de mídia. O termo "sinalização de processamento de mídia"se refere a controle relativamente leve ou dados de estado (que podem ser de um pequeno volume de dados em relação àquele dos metadados de estado de processamento) que são comunicados entre unidades de processamento de mídia e em uma corrente de bits de mídia. A sinalização de processamento de mídia pode compreender um subconjunto ou um sumário de metadados de estado de processamento.
[00023] Sinalização de processamento de mídia e/ou metadados de estado de processamento podem ser embutidos em um ou mais campos reservados (por exemplo, que podem ser, porém não estão limitados a, não utilizados de maneira corrente) carregados em uma subcorrente em uma corrente de bits de mídia, ocultos com dados de mídia, ou fornecidos com um banco de dados de processamento de mídia separado. Em algumas modalidades possíveis o voluma de dados de sinalização de processamento de mídia e/ou metadados de estado de processamento, pode ser pequeno o suficiente para ser carregado (por exemplo, em campos reservados ou ocultos em amostras de mídia que utilizam técnicas de ocultação de dados reversível, ou armazenar informação de estado de processamento detalhada em um banco de dados externo enquanto computando digitais de mídia a partir de dados de mídia ou recuperando digitais de mídia a partir dos dados de mídia, etc.), sem afetar a velocidade de bit alocada para carregar os dados de mídia. Comunicar sinalização de processamento de mídia e/ou metadados de estado de processamento em uma cadeia de processamento de mídia aprimorada, é particularmente útil quando duas ou mais unidades de processamento de mídia precisam trabalhar em tandem com uma e outra através de toda a cadeia de processamento de mídia (ou ciclo de vida de conteúdo). Sem sinalização de processamento de mídia e/ou metadados de estado de processamento, severos problemas de processamento de mídia, tais como qualidade, nível e degradações espaciais podem provavelmente ocorrer, por exemplo, quando dois ou mais codecs de áudio são utilizados na cadeia é nivelamento de volume terminal único é aplicado mais do que uma vez durante a jornada de conteúdo de mídia para um dispositivo de consumo de mídia (ou um ponto de transformação do conteúdo de mídia nos dados de mídia).
[00024] Em contraste, técnicas aqui elevam a inteligência de qualquer ou de todas as unidades de processamento de mídia em uma cadeia de processamento de mídia aprimorada (ciclo de vida de conteúdo). Sob as técnicas aqui, qualquer uma destas unidades de processamento de mídia podem ao mesmo tempo "ouvir e adaptar", bem como "anunciar" o estado dos dados de mídia para unidades de processamento de mídia a jusante. Assim, sob as técnicas aqui, uma unidade de processamento de mídia a jusante pode otimizar seu processamento dos dados de mídia com base no conhecimento de processamento passado dos dados de mídia como realizado por uma ou mais unidades de processamento de mídia a montante. Sob as técnicas aqui, o processamento de mídia por meio da cadeia de processamento de mídia como um todo sobre os dados de mídia, se torna mais eficiente, mais adaptativo e mais previsível do que de outra maneira. Como resultado, transformação global e manipulação do conteúdo de mídia dos dados de mídia são muito melhoradas.
[00025] De maneira importante, sob a técnica aqui, a presença do estado dos dados de mídia como indicado por sinalização de processamento de mídia e/ou metadados de estado de processamento não impactam de maneira negativa unidades de processamento de mídia herdadas que podem estar presentes na cadeia de processamento de mídia aprimorada e podem, elas mesmas, não utilizar de maneira pró-ativa o estado dos dados de mídia para processar de maneira adaptativo os dados de mídia. Além disto, mesmo se uma unidade de processamento de mídia herdada na cadeia de processamento de mídia pode ter uma tendência de falsificar os resultados de processamento de outros dispositivos de processamento de mídia a montante, os metadados de estado de processamento aqui podem ser passados de maneira segura e em segurança para dispositivos de processamento de mídia a jusante através de métodos de comunicação segura que fazem uso de valores criptográficos, criptografia, autenticação e ocultação de dados. Exemplo de ocultação de dados inclui ao mesmo tempo ocultação de dados reversível e irreversível.
[00026] Em algumas modalidades possíveis, para transportar um estado de dados de mídia para unidades de processamento de mídia a jusante, técnicas aqui envolvem e/ou embutem uma ou mais subunidades de processamento nas formas de software, hardware, ou ambos, em uma unidade de processamento de mídia, para possibilitar à unidade de processamento de mídia ler e escrever e/ou validar metadados de estado de processamento distribuídos com os dados de mídia.
[00027] Em algumas modalidades possíveis, uma unidade de processamento de mídia (por exemplo, codificador, decodificador, nivelador, etc.) pode receber dados de mídia nos quais o um ou mais tipos de processamento de mídia já foi realizado previamente: 1) não existem quaisquer metadados de estado de processamento para indicar estes tipos de processamento de mídia realizados previamente, e/ou 2) metadados de estado de processamento podem ser incorretos ou incompletos. Os tipos de processamento de mídia que foram realizados previamente incluem operações (por exemplo, nivelamento de volume) que podem alterar amostras de mídia, bem como operações (por exemplo, extração de digital e/ou extrações de característica com base em amostras de mídia) que podem não alterar amostras de mídia. A unidade de processamento de mídia pode ser configurada para criar automaticamente metadados de estado de processamento "correto" que refletem o estado "verdadeiro" dos dados de mídia e associar este estado dos dados de mídia com os dados de mídia comunicando os metadados de estado de processamento criados para uma ou mais unidades de processamento de mídia a jusante. Além disto, a associação dos dados de mídia e metadados de estado de processamento pode ser realizada de tal maneira que uma corrente de bits de mídia resultante é compatível para trás com unidades de processamento de mídia herdadas, tais como decodificadores herdados. Como resultado, decodificadores herdados que não implementam as técnicas aqui podem ainda ser capazes de decodificar os dados de mídia de forma correta como os decodificadores herdados são projetados para fazer enquanto ignorando os metadados de estado de processamento associados que indicam o estado dos dados de mídia. Em algumas modalidades possíveis, a unidade de processamento de mídia aqui pode ser configurada ao mesmo tempo com uma capacidade para validar os metadados de estado de processamento com os dados de mídia (fonte) através de análise discutível e/ou de validação de um ou mais valores aleatórios embutidos (por exemplo, assinaturas).
[00028] Sob técnicas como descrito aqui, processamento adaptativo dos dados de mídia com base em um estado contemporâneo dos dados de mídia como indicado pelos metadados de estado de processamento recebidos, pode ser realizado em diversos pontos em uma cadeia de processamento de mídia. Por exemplo, se metadados de volume de som nos metadados de estado de processamento são válidos, então uma unidade de nivelamento de volume subsequente a um decodificador pode ser notificada pelo decodificador com sinalização de processamento de mídia e/ou metadados de estado de processamento, de modo que a unidade de nivelamento de volume pode passar os dados de mídia tal como áudio não mudado.
[00029] Em algumas modalidades metadados de estado de processamento incluem características de mídia extraídas de amostras de mídia subjacentes. As características de mídia podem fornecer uma descrição semântica das amostras de mídia e podem ser fornecidas como uma parte dos metadados de estado de processamento para indicar, por exemplo, se as amostras de mídia compreendem fala, música, se alguém está cantando em condições de silêncio ou com ruídos, se o canto está acima de uma multidão que fala, se um diálogo está ocorrendo, se uma fala sobre um fundo ruidoso, uma combinação de dois ou mais do que precede, etc. Processamento adaptativo dos dados de mídia pode ser realizado em diversos pontos em uma cadeia de processamento de mídia com base na descrição de características de mídia contidas nos metadados de estado de processamento.
[00030] Sob técnicas como descritas aqui, metadados de estado de processamento embutidos em uma corrente de bits de mídia com dados de mídia podem ser autenticados e validados. Por exemplo, as técnicas aqui podem úteis para entidades reguladoras de volume de som e para verificar se o volume de som de um programa particular já está dentro de uma faixa especificada e que os próprios dados de mídia não foram modificados (com isto assegurando a concordância com regulamentos). Um valor de volume de som incluído em um bloco de dados que compreende metadados de estado de processamento pode ser lido para verificar isto, ao invés de computar novamente o volume de som.
[00031] Sob técnicas como descrito aqui, um bloco de dados que compreende metadados de estado de processamento podem incluir bits reservados adicionais para carregar de maneira segura metadados de terceiros parceiros. Esta característica pode ser utilizada para possibilitar uma variedade de aplicações. Por exemplo, uma agência de classificação (por exemplo, Nielsen Media Research) pode escolher incluir uma etiqueta de identificação de conteúdo que pode então ser utilizada para identificar um programa particular que está sendo observado ou escutado, para a finalidade de computar classificações estatísticas de observação ou de escutar.
[00032] De maneira significativa, técnicas descritas aqui e variações das técnicas descritas aqui podem assegurar que metadados de estado de processamento associados com os dados de mídia são preservados através de toda a cadeia de processamento de mídia desde a criação de conteúdo até consumo de conteúdo.
[00033] Em algumas modalidades possíveis, mecanismos como descritos aqui fazem parte de um sistema de processamento de mídia, que inclui, porém não limitado, a dispositivo manual, máquina de jogo, televisão, computador laptop, computador netbook, rádio-telefone celular, leitor eletrônico de livro, terminal de pontos de venda, computador de mesa, estação de trabalho de computador, quiosque computador, e diversos outros tipos de terminais e unidades de processamento de mídia.
[00034] Diversas modificações para as modalidades preferidas e para os princípios genéricos de características descritas aqui serão facilmente evidentes para aqueles versados na técnica. Assim, a descrição não tem intenção de estar limitada às modalidades mostradas, porém deve estar de acordo com escopo mais amplo consistente com os princípios e características descritas aqui.
2. Cadeias de Processamento de Mídia.
[00035] A figura 1 ilustra um exemplo de cadeia de processamento de mídia de acordo com algumas modalidades possíveis da presente invenção. A cadeia de processamento de mídia pode, porém não está limitada a, compreender codificadores, decodificadores, unidades de pré/pós-processamento, transcodificadores e unidades de análise de sinal e de correção de metadados. Estas unidades na cadeia de processamento de mídia podem estar compreendidas em um mesmo sistema ou em diferentes sistemas. Em modalidades nas quais a cadeia de processamento de mídia se desenvolve através de diversos sistemas diferentes, estes sistemas podem ser localizados juntos ou distribuídos geograficamente.
[00036] Em algumas modalidades possíveis, uma unidade de pré- processamento da figura 1 pode aceitar amostras PCM (domínio de tempo) que compreendem conteúdo de mídia como entrada e dar saída a amostras PCM processadas. Um codificador pode aceitar amostras PCM como entrada e dar saída a uma corrente de bits de mídia codificada (por exemplo, comprimida) do conteúdo de mídia.
[00037] Como aqui utilizado, os dados (por exemplo, carregados em uma corrente principal da corrente de bits) que compreendem o conteúdo de mídia são referidos como dados de mídia, enquanto dados separados dos dados de mídia que indicam tipos de processamento realizados sobre os dados de mídia em qualquer ponto dado na cadeia de processamento de mídia são referidos como metadados de estado de processamento.
[00038] Uma unidade de correção de Análise de Sinal e Metadados pode aceitar uma ou mais correntes de bits de mídia codificadas como entrada e validar se os metadados de estado de processamento incluídos nas correntes de bits de mídia codificadas estão corretos realizando a análise de sinal. Se a unidade de correção de Análise de Sinal e Metadados encontra que os metadados incluídos são inválidos, a unidade de correção de Análise de Sinal e Metadados substitui o valor incorreto pelo valor correto obtido da análise de sinal.
[00039] Um transcodificador pode aceitar correntes de bits de mídia como entrada e dar saída a uma corrente de bits de mídia modificada. Um decodificador pode aceitar correntes de bits de mídia comprimida como a entrada e dar saída a uma corrente de amostras PCM decodificada. Uma unidade de pós-processamento pode aceitar uma corrente de amostras PCM decodificada, realizar nela qualquer pós- processamento tal como nivelamento de volume do conteúdo de mídia e transformar o conteúdo de mídia nas amostras PCM decodificadas em um ou mais alto-falantes e/ou painéis mostradores. Todas as unidades de processamento de mídia podem não ser capazes de adaptar seu processamento para ser aplicado aos dados de mídia que utilizam metadados de estado de processamento.
[00040] Técnicas como fornecidas aqui, proporcionam uma cadeia de processamento de mídia aprimorada na qual unidades de processamento de mídia tais como codificadores, decodificadores, transcodificadores, unidades de pré- e pós-processamento, etc., adaptam seu respectivo processamento para ser aplicado sobre os dados de mídia de acordo com um estado contemporâneo dos dados de mídia como indicado por sinalização de processamento de mídia e/ou metadados de estado de processamento respectivamente recebidos por estas unidades de processamento de mídia.
[00041] A figura 2 ilustra um exemplo de cadeia de processamento de mídia aprimorada que compreende codificadores, decodificadores, unidades de pré- e pós-processamento, transcodificadores, unidades de correção de análise de sinal e metadados, de acordo com algumas modalidades possíveis da presente invenção. Para adaptar processamento dos dados de mídia com base no estado dos dados de mídia algumas ou todas as unidades da figura 2 podem ser modificadas. Em algumas modalidades possíveis, cada uma das unidades de processamento de mídia do exemplo de cadeia de processamento de mídia aprimorada é configurada para trabalhar de forma cooperativa na realização de processamento de mídia não redundante e evitar repetição desnecessária e errônea de processamento que foi realizado por unidades a montante. Em algumas modalidades possíveis o estado dos dados de mídia em qualquer ponto na cadeia de processamento de mídia aprimorada a partir de criação de conteúdo até consumo de conteúdo é entendida por uma unidade de processamento de mídia corrente naquele ponto da cadeia de processamento de mídia aprimorada.
3. Dispositivos ou Unidades de Processamento de Mídia
[00042] A figura 3 ilustra o um exemplo (modificado) de codificador/transcodificador de acordo com algumas modalidades possíveis da presente invenção. Diferentemente de codificadores da figura 1, o codificador/transcodificador da figura 3 pode ser configurado para receber metadados de estado de processamento associados com dados de mídia de entrada é determinar processamento precedente (pré/pós) realizado por uma ou mais unidades a montante em relação ao codificador/transcodificador sobre dados de mídia de entrada (por exemplo, áudio de entrada) que o codificador/transcodificador modificado recebeu de maneira lógica a partir de uma unidade a montante (por exemplo, a última unidade a montante que realizou seu processamento sobre o áudio de entrada).
[00043] Como aqui utilizado, o termo "recebe de maneira lógica" pode significar que uma unidade intermediária pode ou não estar envolvida na comunicação dos dados de mídia de entrada a partir de uma unidade a montante (por exemplo, a última unidade a montante) para uma unidade receptora, tal como a unidade codificador/transcodificador do presente exemplo.
[00044] Em um exemplo, a unidade a montante que realizou o pré- /pós- processamento sobre os dados de mídia de entrada pode estar em um diferente sistema do que o sistema no qual a unidade receptora é uma parte. Os dados de mídia de entrada podem ser uma corrente de bits de mídia saídos pela unidade a montante e comunicados através de uma unidade de transmissão intermediária tal como uma conexão de rede, um USB, uma conexão de rede de área ampla, uma conexão sem fio, uma conexão ótica, etc.
[00045] Em outro exemplo, a unidade a montante que realizou o pré-pós-processamento sobre os dados de mídia de entrada pode estar no mesmo sistema no qual a unidade receptora é uma parte. Os dados de mídia de entrada podem ser saídos por meio da unidade a montante é comunicados através de uma conexão interna e através de uma ou mais unidades internas do sistema. Por exemplo, os dados podem ser entregues fisicamente através de o um barramento interno, uma conexão de barra transversal, uma conexão em série, etc. Em qualquer caso, sob técnicas aqui, a unidade receptora pode receber de maneira lógica os dados de mídia de entrada a partir da unidade a montante.
[00046] Em algumas modalidades possíveis, o codificador/ transcodificador é configurado para criar ou modificar metadados de estado de processamento associados com os dados de mídia os quais podem ser uma revisão dos dados de mídia de entrada. Os novos metadados de estado de processamento modificados criados ou modificados pelo codificador/transcodificador podem capturar de maneira automática e precisa o estado dos dados de mídia que devem ser saídos por meio do codificador/transcodificador, e ainda mais ao longo da cadeia de processamento de mídia. Por exemplo, os metadados de estado de processamento podem incluir se ou não certo processamento (por exemplo, Volume Dolby, Upmixing, disponível comercialmente de Dolby Laboratories) foi realizado sobre os dados de mídia. Adicionalmente e/ou opcionalmente, os metadados de estado de processamento podem incluir os parâmetros utilizados em e/ou derivados do certo processamento ou quaisquer operações constituintes no processamento. Adicionalmente e/ou opcionalmente, os metadados de estado de processamento podem incluir uma ou mais digitais computadas/extraídas dos dados de mídia. Adicionalmente e/ou opcionalmente, os metadados de estado de processamento podem incluir características de mídia do um ou mais diferentes tipos computados/extraídos dos dados de mídia. Características de mídia como descrito aqui fornecem uma descrição semântica dos dados de mídia e podem compreender uma ou mais propriedades estruturais, tonalidade que inclui harmonia e melodia, timbre, ritmo, volume de som de referência, mix estéreo ou uma quantidade de fontes de som dos dados de mídia, ausência ou presença de voz, características de repetição, melodia, harmonias, letras, timbre, características perceptivas, características de mídia digital, parâmetros estéreo, reconhecimento de voz (por exemplo, o que um locutor (alto-falante) está dizendo), etc. Em algumas modalidades as características de mídia extraídas são utilizadas para classificar dados de mídia subjacentes para uma ou mais de uma pluralidade de classes de dados de mídia. Uma ou mais classes de dados de mídia pode incluir, porém não estão limitadas a, qualquer uma de uma única "classe" global/dominante (por exemplo, um tipo de classe) para todo o pedaço de mídia e/ou uma única classe que representa um período de tempo menor (por exemplo, um subtítulo de classe para um subconjunto/subintervalo de todo o pedaço) tal como um único quadro de mídia ou um bloco de dados de mídia, diversos quadros de mídia, blocos de dados de diversas mídias, uma fração de segundo, um segundo, diversos segundos, etc. Por exemplo, um rótulo de classe pode ser computado e inserido na corrente de bits e/ou ocultada através de técnicas de ocultação de dados reversível ou irreversível a cada 32 milissegundos para a corrente de dados. Um rótulo de classe pode ser utilizado para indicar um ou mais tipos de classe e/ou um ou mais subtipos de classe. Em um quadro de dados de mídia o rótulo de classe pode ser inserido em uma estrutura de metadados que precede, ou alternativamente segue um bloco de dados de mídia com o qual o rótulo de classe é associado, como ilustrado na figura 11. Classes de mídia podem incluir, porém não estão limitadas a, qualquer um dentre tipos de classe única tal como música, fala, ruído, silêncio, aplauso. O dispositivo de processamento de mídia como aqui descrito pode também ser configurado para classificar dados de mídia que compreendem misturas de tipos de classe de mídia tal como fala sobre música, etc. Adicionalmente, alternativamente e/ou opcionalmente, o dispositivo de processamento de mídia como aqui descrito pode ser configurado para carregar um valor independente de possibilidade/probabilidade para um tipo ou subtipo de classe de mídia indicado por um rótulo de classe de mídia computada. Um ou mais tais valores de possibilidade/probabilidade pode ser transmitido com o rótulo de classe de mídia na mesma estrutura de metadados. Um valor de possibilidade/probabilidade indica o nível de "confiança"que o rótulo de classe de mídia computada tem em relação ao segmento/bloco de mídia para o qual um tipo ou subtipo de classe de mídia está indicado pelo rótulo de classe de mídia computada. O um ou mais valores de possibilidade/probabilidade em combinação com o rótulo de classe de mídia associada pode ser utilizado por um dispositivo de processamento de mídia receptor para adaptar processamento de mídia em uma maneira para melhorar qualquer uma em uma ampla variedade de operações através de toda uma cadeia de processamento de mídia tal como upmixing, codificação, decodificação, transcodificação, virtualização de fone de ouvido, etc. Metadados de estado de processamento podem incluir, porém não estão limitados a, qualquer um dentre tipos e subtítulos de classe de mídia ou valores de possibilidade/probabilidade. Adicionalmente, opcionalmente ou alternativamente, ao invés de passar tipos/subtipos de classe de mídia e valores de possibilidade/probabilidade em uma estrutura de metadados inserida entre blocos de dados de mídia (áudio), alguns ou todos os tipos/subtipos de classe de mídia e valores de possibilidade/probabilidade podem ser embutidos e passados para um nó/dispositivo de processamento de mídia receptor em dados de mídia (ou amostras) como metadados ocultos. Em algumas modalidades os resultados de análise de conteúdo dos dados de mídia incluídos nos metadados de estado de processamento podem compreender uma ou mais indicações como se certa palavra-chave definida por usuário ou definida por sistema são faladas em qualquer segmento de tempo dos dados de mídia. Uma ou mais aplicações pode utilizar tais indicações para disparar desempenho de operações relacionadas (por exemplo, apresentar anúncios contextuais de produtos e serviços relacionados às palavras-chave).
[00047] Em algumas modalidades, embora processando os dados de mídia com um primeiro processador, um dispositivo como descrito aqui pode operar um segundo processador em paralelo para classificar/ extrair características de mídia dos dados de mídia. Característica de mídia pode ser extraída de um segmento que dura por um período de tempo (um quadro, diversos quadros, um segundo, diversos segundos, um minuto, diversos minutos, um período de tempo definido por usuário, etc.), ou alternativamente por uma cena (com base em mudanças características de sinal detectáveis). Características de mídia como descritas pelos metadados de estado de processamento podem ser utilizadas através de toda a cadeia de processamento de mídia. Um dispositivo a jusante pode adaptar seu próprio processamento de mídia dos dados de mídia com base em uma ou mais das características de mídia. Alternativamente, um dispositivo a jusante pode escolher ignorar a presença de qualquer ou de todas as características de mídia como descrito nos metadados de estado de processamento.
[00048] Uma aplicação sobre um dispositivo na cadeia de processamento de mídia pode alavancar as características de mídia em uma ou mais de uma variedade de maneiras. Por exemplo, tal aplicação pode indexar os dados de mídia subjacentes utilizando as características de mídia. Para um usuário que pode querer ir para as seções nas quais juízes estão falando a respeito de desempenhos, a aplicação pode saltar outras seções precedentes. Características de mídia como descrito nos metadados de estado de processamento a fornecem informação contextual de dispositivos a jusante dos dados de mídia como uma parte intrínseca dos dados de mídia.
[00049] Mais do que um dispositivo na cadeia de processamento de mídia pode realizar análise para extrair características de mídia a partir do conteúdo dos dados de mídia. Isto permite que dispositivos a jusante não tenham que analisar o conteúdo dos dados de mídia.
[00050] Em alguma modalidade possível, os metadados de estado de processamento gerados ou modificados podem ser transmitidos como uma parte de uma corrente de bits de mídia (por exemplo, corrente de bits de áudio com metadados sobre o estado do áudio) e chegar a uma velocidade de transmissão da ordem de 3 - 10 kbps. Em algumas modalidades os metadados de estado de processamento podem ser transmitidos dentro dos dados de mídia (por exemplo, amostras de mídia PCM) com base em ocultação de dados. Uma ampla variedade de técnicas de ocultação de dados, que pode alterar a reversibilidade ou irreversibilidade de dados de mídia, pode ser utilizada para ocultar uma parte, ou tudo, dos metadados de estado de processamento (que inclui, porém não limitado apenas de dados relacionados à autenticação) das amostras de mídia. Ocultação de dados pode ser implementada com canal de comunicação seguro perceptível ou imperceptível. Ocultação de dados pode ser realizada alterando/ manipulando/modulando características de sinal (fase e/ou amplitude em uma frequência ou domínio de tempo) de um sinal nas amostras de mídia subjacentes. Ocultação de dados pode ser implementada com base em FSK, espectro disperso, ou outros métodos disponíveis.
[00051] Em algumas modalidades possíveis, uma unidade de pré- /pós- processamento pode realizar processamento dos dados de mídia em uma maneira cooperativa com o codificador/transcodificador. O processamento realizado pela unidade de pré-/pós-processamento cooperativa é também especificado nos metadados de estado de processamento que são comunicados, por exemplo, através da corrente de bits de áudio para uma unidade de processamento de mídia a jusante.
[00052] Em algumas modalidades possíveis, uma vez que uma peça de metadados de estado de processamento (que pode incluir digitais de mídia e quaisquer parâmetros utilizados em ou derivados de um ou mais tipos de processamento de mídia) é derivada, esta peça de metadados de estado de processamento pode ser preservada por meio das unidades de processamento de mídia na cadeia de processamento de mídia e comunicada para todas as unidades a jusante. Assim, em algumas modalidades possíveis, uma peça de metadados de estado de processamento pode ser criada por meio da primeira unidade de processamento de mídia e passada para a última unidade de processamento de mídia como dados embutidos dentro de uma e corrente/subcorrente de bits de mídia ou como dados deriváveis de uma fonte de dados externa ou banco de dados de processamento de mídia na cadeia de processamento de mídia (todo o ciclo de vida).
[00053] A figura 4 ilustra um exemplo de decodificador (por exemplo, um decodificador de evolução que implementa técnicas aqui de acordo com algumas modalidades possíveis da presente invenção. Um decodificador em modalidades possíveis da presente invenção pode ser configurado (1) para fatiar e validar os metadados de estado de processamento (por exemplo, um histórico de processamento, uma descrição de características de mídia, etc.) associados com os dados de mídia de entrada e outros metadados (por exemplo, independentes de qualquer processamento dos dados de mídia tal como dados de terceiro parceiro, informação de rastreamento, identificadores, informação proprietária ou padrão, dados de anotação de usuário, dados de preferência de usuário etc.) que tenham sido passados para dentro, e (2) para determinar com base nos metadados de estado de processamento validados, o estado de processamento de mídia dos dados de mídia. Por exemplo, fatiando e validando os metadados de estado de processamento em uma corrente de bits de mídia (por exemplo, corrente de bits do áudio com metadados sobre o estado do áudio) que carrega os dados de mídia de entrada e os metadados de estado de processamento, decodificador pode determinar que os metadados de volume de som (ou metadados de característica de mídia) são válidos e confiáveis e foram criados por meio de uma de subunidades provedoras de conteúdo aprimorado que implementa as técnicas descritas aqui (por exemplo, gerador de mídia Dolby (DGM) disponível comercialmente de Dolby Laboratories). Em algumas modalidades possíveis, em resposta a determinar que os metadados de estado de processamento recebidos são válidos e confiáveis, o decodificador pode ser configurado para então gerar com base, no mínimo em parte, sobre os metadados de estado de processamento recebidos, sinalização de processamento de mídia a respeito do estado dos dados de mídia utilizando uma técnica de ocultação de dados reversível ou irreversível. O decodificador pode ser configurado para fornecer a sinalização de processamento de mídia para a uma unidade de processamento de mídia a jusante (por exemplo, uma unidade de pós-processamento) na cadeia de processamento de mídia. Este tipo de sinalização pode ser utilizado, por exemplo, quando não existe trajeto de metadados dedicado (e síncrono) entre o decodificador e a unidade de processamento de mídia a jusante. Esta situação pode surgir em algumas modalidades possíveis, nas quais o decodificador e a unidade de processamento de mídia a jusante existem como entidades separadas em um dispositivo eletrônico de consumidor (por exemplo, PCs, fones móveis, set-tops, gravadores de áudio e vídeo, etc.) ou em diferentes subsistemas ou diferentes sistemas, nos quais controle síncrono ou trajeto de dados entre o decodificador e a unidade de processamento subsequente não está disponível. Em algumas modalidades possíveis a sinalização de processamento de mídia sob a técnica de ocultação de dados aqui, pode ser transmitida com uma parte de uma corrente de bits de mídia e monta a uma velocidade de transmissão da ordem de 16 bps. Uma ampla variedade de técnicas de ocultação de dados que podem alterar a reversibilidade ou irreversibilidade de dados de mídia, pode ser utilizada para ocupar uma parte, ou tudo, dos metadados de estado de processamento nas amostras de mídia, incluindo, porém não limitada a, qualquer de canais de comunicação seguros perceptíveis ou imperceptíveis, alterações/manipulações/modulações de banda estreita ou características de sinal de espectro disperso (fase e/ou amplitude em uma frequência ou domínio de tempo) de um ou mais sinais nas amostras de mídia subjacentes, ou outros métodos disponíveis.
[00054] Em algumas modalidades possíveis o decodificador pode não tentar passar sobre todos os metadados de estado de processamento recebidos; ao invés disto, o decodificador pode somente embutir informação suficiente (por exemplo, dentro dos limites da capacidade de ocultação de dados) para trocar o modo de operação da unidade de processamento de mídia a jusante com base no estado dos dados de mídia.
[00055] Em algumas modalidades possíveis, redundância em sinal de áudio ou vídeo nos dados de mídia pode ser explorada para carregar o estado de dados de mídia. Em algumas modalidades possíveis, sem provocar quaisquer artefatos audíveis ou visíveis, algo, ou tudo, da sinalização de processamento de mídia e/ou metadados de estado de processamento podem ser ocultos nos mínimos bits significativos (LSBs) de uma pluralidade de bytes nos dados de mídia ou ocultos em um canal de comunicação seguro carregados dentro dos dados de mídia. A pluralidade de bytes pode ser selecionada com base em um ou mais fatores ou critérios que incluem se os LSBs podem provocar artefatos perceptíveis ou audíveis quando as amostras de mídia com dados ocultos são transformadas por uma unidade de processamento de mídia herdada. Outras técnicas de ocultação de dados (por exemplo, canais de comunicação seguros perceptíveis ou imperceptíveis, técnicas de ocultação de dados baseadas em FSK, etc.) que podem alterar a reversibilidade ou irreversibilidade dos dados de mídia, podem ser utilizadas para ocultar uma parte ou tudo dos metadados de estado de processamento nas amostras de mídia.
[00056] Em algumas modalidades possíveis, a tecnologia de ocultação de dados pode ser opcional e pode não ser necessária, por exemplo, se a unidade de processamento de mídia a jusante é implementada como uma parte do decodificador. Por exemplo, duas ou mais unidades de processamento de mídia podem compartilhar um barramento e outros mecanismos de comunicação que permitem a metadados ser passados como sinais fora da banda sem ocultar dados em amostras de mídia de uma para outra unidade de processamento de mídia.
[00057] A figura 5 ilustra um exemplo de unidade de pós- processamento (por exemplo, uma unidade de pós-processamento de evolução Dolby) de acordo com algumas modalidades possíveis da presente invenção. Uma unidade de pós-processamento pode ser configurada para primeiro extrair a sinalização de processamento de mídia oculta nos dados de mídia (por exemplo, amostras de áudio PCM com informação embutida) para determinar o estado dos dados de mídia como indicado pela sinalização de processamento de mídia. Isto pode ser feito, por exemplo, com uma unidade de processamento adjunta (por exemplo, uma subunidade de extração de informação e restauração de áudio em algumas modalidades possíveis nas quais os dados de mídia compreendem áudio). Em modalidades onde a sinalização de processamento de mídia é oculta utilizando uma técnica de ocultação de dados reversível, modificações precedentes realizadas sobre os dados de mídia por meio da técnica de ocultação de dados (por exemplo, o decodificador) para embutir a sinalização de processamento de mídia, pode ser desfeita. Em modalidades onde a sinalização de processamento de mídia é oculta utilizando uma técnica de ocultação de dados irreversível, modificações precedentes realizadas sobre os dados de mídia por meio da técnica de ocultação de dados (por exemplo, o decodificador) para embutir a sinalização de processamento de mídia pode não ser completamente desfeita, mas, ao invés disto, efeitos colaterais sobre a qualidade de mídia de transformação pode ser minimizada (por exemplo, artefatos mínimos de áudio e visuais). Em seguida, com base no estado dos dados de mídia como indicado pela sinalização de processamento de mídia, a unidade de pós-processamento pode ser configurada para adaptar seu processamento para ser aplicado sobre os dados de mídia. Em um exemplo, processamento de volume pode ser desligado em resposta a uma determinação (a partir da sinalização de processamento de mídia) que os metadados de volume de som eram válidos e que o processamento de volume foi realizado por meio de uma unidade a montante. Em outro exemplo, um anúncio ou mensagem contextual pode ser apresentado ou disparado por uma palavra-chave reconhecida por voz.
[00058] Em algumas modalidades possíveis, uma unidade de análise de sinal e correção de metadados em um sistema de processamento de mídia descrito aqui, pode ser configurada para aceitar correntes de bits de mídia codificada como a entrada e validar se os metadados embutidos em uma corrente de bits de mídia são corretos para realizar análise de sinal. Depois de validar que os metadados embutidos são ou não são válidos dentro da corrente de bits de mídia, correção pode ser aplicada sobre uma base como necessário. Em algumas modalidades possíveis a unidade de análise de sinal e correção de metadados pode ser configurada para realizar análises sobre dados de mídia ou amostras codificadas das correntes de bits de mídia de entrada em domínio de tempo e/ou de frequência para determinar características de mídia dos dados de mídia. Depois de determinar as características de mídia para dados de estado de processamento correspondentes, por exemplo, uma descrição de uma ou mais características de mídia pode ser gerada e fornecida para dispositivos a jusante em relação à unidade de análise de sinal e correção de metadados. Em algumas modalidades possíveis, a unidade de análise de sinal e correção de metadados pode ser integrada com uma ou mais outras unidades de processamento de mídia em um ou mais sistemas de processamento de mídia. Adicionalmente e/ou opcionalmente, a unidade de análise de sinal e correção de metadados pode ser configurada para ocultar sinalização de processamento de mídia nos dados de mídia e sinalizar para uma unidade a jusante (codificador/transcodificador/decodificador) que os metadados embutidos dos dados de mídia são válidos e foram verificados com sucesso. Em algumas modalidades possíveis os dados de sinalização e/ou metadados de estado de processamento associados com os dados de mídia podem ser gerados e inseridos em uma corrente de bits de mídia comprimida que carrega os dados de mídia.
[00059] Portanto, técnicas como descritas aqui asseguram que diferentes blocos de processamento ou unidades de processamento de mídia em uma cadeia de processamento de mídia aprimorada (por exemplo, codificadores, transcodificadores, decodificadores, unidades de pré-pós-processamento, etc.), são capazes de determinar o estado dos dados de mídia. Daí, cada uma das unidades de processamento de mídia pode adaptar seu processamento de acordo com o estado dos dados de mídia, como indicado pelas unidades a montante. Além disto, uma ou mais técnicas de ocultação de dados, reversível ou irreversível, pode ser utilizada para assegurar que informação de sinal a respeito do estado dos dados de mídia pode ser fornecida para unidades de processamento de mídia a jusante em uma maneira eficiente e com a quantidade mínima de velocidade de bits requerida para transmitir a informação de sinal para as unidades de processamento de mídia a jusante. Isto é especialmente útil onde não existe trajeto de metadados entre uma unidade a montante tal como um decodificador e uma unidade a jusante tal como uma unidade de pós-processamento, por exemplo, onde a unidade de pós- processamento não é parte do decodificador.
[00060] Em algumas modalidades possíveis um codificador pode ser aprimorado ou pode compreender uma subunidade de pré- processamento e validação de metadados. Em algumas modalidades possíveis a subunidade de pré-processamento e validação de metadados pode ser configurada para assegurar que o codificador realiza processamento adaptativo dos dados de mídia com base no estado dos dados de mídia como indicados pela sinalização de processamento de mídia e/ou metadados de estado de processamento. Em algumas modalidades possíveis, através da subunidade de pré- processamento e validação de metadados o codificador pode ser configurado para validar os metadados de estado de processamento associados com (por exemplo, incluídos em uma corrente de bits de mídia com) os dados de mídia. Por exemplo, se os metadados são validados para serem confiáveis, então resultados de um tipo de processamento de mídia realizado pode ser reutilizado e novo desempenho do tipo de processamento de mídia pode ser evitado. Por outro lado, se metadados são encontrados serem falsos, então o tipo de processamento de mídia realizado previamente de propósito pode ser repetido pelo codificador. Em algumas modalidades possíveis, tipos adicionais de processamento de mídia podem ser realizados pelo codificador sobre os metadados, uma vez que os metadados de estado de processamento (incluindo sinalização de processamento de mídia e recuperação de metadados baseados em digitais) são encontrados não serem confiáveis.
[00061] Se os metadados de estado de processamento são determinados por ser válidos (por exemplo, com base em uma correspondência de com um valor criptográfico extraído e um valor criptográfico de referência) o codificador pode também ser configurado para sinalizar para outras unidades de processamento de mídia a jusante em uma cadeia de processamento de mídia aprimorada que os metadados de estado de processamento, por exemplo, presentes na corrente de bits de mídia são válidos. Qualquer, alguma ou todas de uma variedade de abordagens pode ser implementada pelo codificador.
[00062] Sob uma primeira abordagem, o codificador pode inserir uma bandeira em uma corrente de bits de mídia codificada (por exemplo, uma "bandeira evolução") para indicar que a validação dos metadados de estado de processamento já foi realizada sobre esta corrente de bits de mídia codificada. A bandeira pode ser inserida de tal maneira que a presença da bandeira não afeta uma unidade de processamento de mídia herdada, tal como um decodificador que não está configurado para processar e fazer uso de metadados de estado de processamento como descrito aqui. Em um exemplo de modalidade, um codificador de Áudio Compression-3 (AC-3) pode ser aprimorado com uma subunidade de pré-processamento e validação de metadados para ajustar uma "bandeira evolução"nos campos xbsi2 de uma corrente de bits de mídia AC-3, como especificado em especificações ATSC (por exemplo, ATSC A/52b). Este bit pode estar presente em cada quadro codificado carregado na corrente de bits de mídia AC-3 e pode não ser utilizado. Em algumas modalidades possíveis a presença desta bandeira no campo xbsi2 dois não afeta decodificadores herdados já desenvolvidos que não estão configurados para processar e fazer uso de metadados de estado de processamento como descrito aqui.
[00063] Sob a primeira abordagem, pode haver uma questão com autenticar a informação em campos xbsi2. Por exemplo, uma unidade a montante (por exemplo, maliciosa) a pode ser capaz de ligar LIGADO o campo xbsi2 sem realmente validar os metadados de estado de processamento e pode sinalizar de maneira incorreta para outras unidades a jusante que os metadados de estado de processamento são válidos.
[00064] Para solucionar esta questão, algumas modalidades da presente invenção podem utilizar uma segunda abordagem. Um método de ocultação de dados segura, que inclui, porém não limitado a qualquer um de um número de métodos de ocultação de dados para criar um canal de comunicação seguro dentro dos próprios dados de mídia, tal como métodos baseados em espectro disperso, métodos baseados em FSK, e outros métodos baseados em um canal de comunicação seguro etc., podem ser utilizados para embutir a "bandeira evolução". Este método seguro é configurado para impedir que a bandeira evolução seja passada em texto pleno e assim facilmente atacada por uma unidade ou um intruso de maneira intencional ou não intencional. Ao invés disso, sob esta segunda abordagem, uma unidade a jusante pode recuperar os dados ocultos em uma forma criptografada, Por meio de um subprocesso de decriptografia e autenticação, a unidade a jusante pode verificar a correção dos dados ocultos e confiar a "bandeira evolução’ na área oculta. Como resultado, a unidade a jusante pode determinar que os metadados de estado de processamento da corrente de bits de mídia foi validada previamente com sucesso. Em diversas modalidades qualquer porção de metadados de estado de processamento tal como "bandeira evolução"pode ser distribuída por dispositivo a montante para dispositivos a jusante em qualquer um de um ou mais métodos criptográficos (baseado em HMAC e não baseado em HMAC).
[00065] Em algumas modalidades possíveis, dados de mídia inicialmente podem simplesmente ser correntes de bits de mídia herdadAs, por exemplo, compreendendo amostras PCM. Contudo, uma vez que os dados de mídia são processados por uma das unidades de processamento de mídia como descrito aqui, os metadados de estado de processamento gerados pela uma ou mais unidades de processamento de mídia compreendem o estado de dados de mídia bem como informação relativamente detalhada (que inclui, porém não limitada a qualquer de uma ou mais características de mídia determinadas a partir dos dados de mídia) que pode ser utilizada para decodificar os dados de mídia. Em algumas modalidades possíveis, os metadados de estado de processamento gerados podem incluir digitais de mídia tal como digitais de vídeo, metadados de volume de som, metadados de faixa dinâmica, um ou mais códigos de autenticação de mensagem baseados em valores aleatórios (HMACs), um ou mais canais de diálogo, digitais de áudio, histórico de processamento numerado, volume de som de áudio, volume de som de diálogo, valores de pico verdadeiro, valores de pico de amostra, e/ou quaisquer metadados especificados de usuário (terceiro parceiro). Os metadados de estado de processamento podem compreender um "bloco de dados de evolução".
[00066] Como aqui utilizado, o termo "aprimorada" se refere a uma capacidade para, uma unidade de processamento de mídia sob técnicas descritas aqui, trabalhar de tal maneira com outras unidades de processamento de mídia ou outros sistemas de processamento de mídia sob as técnicas descritas aqui que podem realizar processamento adaptativo com base no estado de dados de mídia como estabelecido por unidades a montante. O termo "evolução"se refere a uma capacidade para unidades de processamento de mídia sob técnicas descritas aqui de trabalharem em uma maneira compatível com unidades de processamento de mídia herdadas ou sistemas de processamento de mídia herdados, bem como a uma capacidade para as unidades de processamento de mídia sob as técnicas aqui, trabalharem em uma tal maneira com outras unidades de processamento de mídia ou outros sistemas de processamento de mídia sob as técnicas descritas aqui, que possam realizar processamento adaptativo com base no estado de dados de mídia como descrito pelas unidades a montante.
[00067] Em algumas modalidades possíveis, uma unidade de processamento de mídia descrita aqui pode receber dados de mídia sobre os quais um ou mais tipos de processamento de mídia foi realizado, porém pode haver nenhum metadado ou metadados insuficientes associados com os dados de mídia para indicar o um ou mais tipos de processamento de mídia. Em algumas modalidades possíveis, tal unidade de processamento de mídia pode ser configurada para criar metadados de estado de processamento para indicar o um ou mais tipos de processamento de mídia que foram realizados por outras unidades a montante em relação à unidade de processamento de mídia. Extração de característica que não foi feita por dispositivos a montante pode também ser realizada e carregada para diante dos metadados de estado de processamento para dispositivos a jusante. Em algumas modalidades possíveis da unidade de processamento de mídia, por exemplo, um codificador/transcodificador de evolução pode compreender uma subunidade de análise forense de mídia. A subunidade forense de mídia tal como uma subunidade forense de áudio pode ser configurada para determinar (sem quaisquer metadados recebidos) se um certo tipo de processamento foi realizado em um pedaço de conteúdo de mídia ou sobre os dados de mídia. A subunidade de análise pode ser configurada a para procurar artefatos/ traços específicos de processamento de sinal introduzidos e deixados pelo certo tipo de processamento. A subunidade forense de mídia pode também ser configurada para determinar se um certo tipo de extração de característica foi realizado sobre um pedaço de conteúdo de mídia ou sobre os dados de mídia. A subunidade de análise pode ser configurada para procurar presença especifica de metadados com base em característica. Para a finalidade da presente invenção, a subunidade de análise forense de mídia como descrito aqui, pode ser implementada por meio de qualquer unidade de processamento de mídia em uma cadeia de processamento de mídia. Além disto, metadados de estado de processamento criados por uma unidade de processamento de mídia através da subunidade de análise forense de mídia pode ser entregue para uma unidade a jusante da cadeia de processamento de mídia aqui.
[00068] Em algumas modalidades possíveis, metadados de estado de processamento como descrito aqui podem incluir bytes reservados adicionais para suportar aplicações de terceiros parceiros. Os bytes reservados adicionais podem ser assegurados serem seguros alocando uma chave de criptografia separada para misturar qualquer texto pleno a ser carregado em um ou mais campos nos bytes reservados. Modalidades da presente invenção suportam aplicações inovadoras que incluem identificação e rastreamento de conteúdo. Em um exemplo, mídia com classificações Nielsen pode carregar um identificador exclusivo para o programa em uma (mídia) corrente de bits de mídia. Classificações Nielsen podem então utilizar este identificador exclusivo para computar estatísticas de observação ou escuta para o programa. Em outro exemplo, os bytes reservados aqui podem carregar palavras-chave para máquinas de pesquisa tal como Google. O Google pode então associar anúncios com base nas palavras-chave incluídas em um ou mais campos nos bytes reservados que carregam palavras-chave. Para a finalidade da presente invenção, em aplicações tal como discutido aqui, técnicas aqui podem ser utilizadas para assegurar que os bytes herdados sejam seguros e não sejam decifrados por ninguém diferente do terceiro parceiro que é designado para utilizar um ou mais campos nos bytes reservados.
[00069] Metadados de estado de processamento como descrito aqui, podem ser associados com dados de mídia em qualquer de um número de diferentes maneiras. Em algumas modalidades possíveis os metadados de estado de processamento podem ser inseridos na corrente de bits de mídia comprimida de saída, que carrega os dados de mídia. Em algumas modalidades os metadados são inseridos de tal maneira a manter compatibilidade de retorno com decodificadores herdados que não são configurados para realizar processamento adaptativo com base nos metadados de estado de processamento aqui.
4. Exemplo de Processamento Adaptativo de Dados de Mídia.
[00070] A figura 6 ilustra um exemplo de implementação de um codificador/transcodificador de acordo com algumas modalidades possíveis da presente invenção. Qualquer dos componentes delineados pode ser implementado como um ou mais processos e/ou um ou mais circuitos IC (que incluem ASICs, FPGAs, etc.), em hardware, software ou uma combinação de hardware e software. O codificador/transcodificador pode compreender um número de subunidades herdadas tal como um decodificador de interface inicial (FED), um decodificador de programa de tarefas secundárias (modo completo) que não escolhe realizar processamento normal de controle de faixa dinâmica/diálogo (DRC/dialnorm) com base em se tal processamento já foi feito, um gerador DRC (Gen DRC), um codificador de programa de tarefas secundárias (BEE) um compressor (stuffer), uma unidade de regeneração CRC, etc. Com estas subunidades herdadas o codificador/transcodificador poderia ser capaz de converter uma corrente de bits (que, por exemplo, pode ser, porém não está limitada a AC-3) para outra corrente de bits que compreende resultados de um ou mais tipos de processamento de mídia (que, por exemplo, pode ser, porém não está limitada a E AC-3 com processamento de volume de som adaptativo e automatizado) Contudo, o processamento de mídia (por exemplo, o processamento de volume de som) pode ser realizado a despeito de se o processamento de volume de som foi realizado previamente e/ou se dados de mídia da corrente de bits de entrada compreende o resultado de tal processamento de volume de som precedente e/ou se metadados de estado de processamento estão na corrente de bits de entrada. Assim, um codificador/transcodificador com as subunidades herdadas somente poderia realizar processamento de mídia errôneo ou desnecessário.
[00071] Sob as técnicas descritas aqui, em algumas modalidades possíveis como mostrado na figura 6, o codificador/transcodificador pode compreender qualquer de uma pluralidade de novas subunidades tal como fatiador/validador de dados de mídia (que, por exemplo, pode ser, porém não está limitado a uma bandeira fatiador e validador AC-3), processamento de mídia adjunto (por exemplo, controlador de faixa dinâmica e volume de som em tempo real em domínio de transformada adaptativo, análise de sinal, extração de característica, etc.), geração de digital de mídia (por exemplo, geração de digital de áudio), gerador de metadados (por exemplo, gerador de dados de evolução e/ou outro gerador de metadados) inserção de sinalização de processamento de mídia (por exemplo, inserção "add_bsi" ou inserção para campos de dados auxiliares), gerador HMAC (que pode assinar de maneira digital um ou mais, até todos os quadros para impedir falsificação por entidades maliciosas ou herdadas), um ou mais de outros tipos de unidades de processamento criptográfico, um ou mais comutadores que operam com base em sinalização de estado de processamento e/ou metadados de estado de processamento (por exemplo, bandeira de volume de som "estado" recebida de um fatiador de bandeira e validador, ou bandeiras para características de mídia, etc. Em adição, entrada de usuário (por exemplo, volume de som alvo/dianorm de usuário) e/ou outra entrada (por exemplo, a partir de um processo de digital de vídeo) e/ou outra entrada de metadados (por exemplo, um ou mais tipos de dados de terceiro parceiro, informação de rastreamento, identificadores, informação proprietária e/ou padrão, dados de anotação de usuário, dados de preferência de usuário, etc.), podem ser recebidos pelo codificador/transcodificador. Como ilustrado diálogo medido, a volume de som com bloqueio e sem bloqueio e valores de faixa dinâmica podem também ser inseridos no gerador de dados de evolução. Outra informação relacionada à característica de mídia pode também ser injetada para uma unidade de processamento como descrito aqui para gerar uma porção de metadados de estado de processamento.
[00072] Em uma ou mais de algumas modalidades possíveis, metadados de estado de processamento como descrito aqui, são carregados nos campos "add_bsi" especificados na sintaxe (aprimorada) Enhanced AC-3 (EAC-3) como por ATSC A/52b, ou em um ou mais campos de dados auxiliares em uma corrente de bits de mídia como descrito aqui. Em algumas modalidades possíveis o carregamento de metadados de estado de processamento nestes campos não produz um impacto adverso à dimensão de quadro de corrente de bits de mídia comprimida e/ou velocidade de bit.
[00073] Em algumas modalidades possíveis, metadados de estado de processamento podem ser incluídos em uma subcorrente dependente ou independente associada com uma corrente de bits de mídia de programa principal. A vantagem desta abordagem é que a velocidade de bit alocada para codificar dados de mídia carregados pela corrente de bits de mídia de programa principal não é afetada. Se os metadados de estado de processamento são carregados como uma parte de quadros codificados, então os bits alocados para codificar informação de áudio a ordem ser reduzidos de modo que a dimensão de quadro da corrente de bits de mídia comprimida e/ou velocidade de bit podem ser não mudadas. Por exemplo, os metadados de estado de processamento podem compreender uma representação de velocidade de dados reduzida e assumir uma velocidade de dados baixa da ordem de 10 kbps para transmitir entre as unidades de processamento de mídia. Daí os dados de mídia tal como amostras de áudio podem ser codificados a uma velocidade mais baixa por 10 kbps para acomodar os metadados de estado de processamento.
[00074] Em algumas modalidades possíveis, no mínimo uma porção de metadados de estado de processamento pode ser embutida com dados de mídia (ou amostras) através de técnicas de ocultação de dados reversíveis ou irreversíveis. A vantagem desta abordagem é que as amostras de mídia e os metadados podem ser recebidos por dispositivos a jusante na mesma corrente de bits.
[00075] Em algumas modalidades possíveis, metadados de estado de processamento podem ser armazenados em um banco de dados de processamento de mídia articulados e digitais. Uma unidade de processamento de mídia a jusante de uma unidade a montante tal como um codificador/decodificador que cria os metadados de estado de processamento pode criar uma digital a partir de dados de mídia recebidos e então utilizar a digital como uma chave para questionar o banco de dados de processamento de mídia. Depois que os metadados de estado de processamento no banco de dados são localizados, um bloco de dados, que compreende os metadados de estado de processamento associados, (ou para) os dados de mídia recebidos pode ser recuperado do banco de dados de processamento de mídia e tornado disponível para a unidade de processamento de mídia a jusante. Como aqui utilizado "digitais" pode incluir, porém não está limitado, a qualquer de uma ou mais digitais de mídia geradas para indicar características de mídia.
[00076] Em algumas modalidades possíveis, um bloco de dados que compreende metadados de estado de processamento compreende um valor aleatório criptográfico (HMAC) para os metadados de estado de processamento e/ou os dados de mídia subjacentes. Uma vez que o bloco de dados é suposto ser assinado de maneira digital nestas modalidades, uma unidade de processamento de mídia a jusante pode de maneira relativamente fácil autenticar e validar os metadados de estado de processamento. Outros métodos criptográficos que incluem, porém não limitados a qualquer do um ou mais dos métodos criptográficos não HMAC pode ser utilizado para transmissão e recepção seguras dos metadados de estado de processamento e/ou dos dados de mídia subjacentes.
[00077] Como descrito previamente, uma unidade de processamento de mídia tal como um codificador/transcodificador como descrito aqui, pode ser configurada para aceitar correntes de bits de mídia herdadas e amostras PCM. Se a corrente de bits de mídia de entrada é uma corrente de bits de mídia herdada, a unidade de processamento de mídia pode verificar por uma bandeira evolução que pode estar na corrente de bits de mídia ou que pode estar oculta nos dados de mídia por meio de um de decodificadores herdados aprimorados que compreende pré-processamento e lógica de validação de metadados como descrito previamente. Na ausência de uma bandeira evolução, o codificador é configurado para realizar processamento adaptativo e para gerar metadados de estado de processamento como apropriado em uma corrente de bits de mídia de saída, ou em um bloco de dados que compreende os metadados de estado de processamento. Por exemplo, como mostrado na figura 6, um exemplo de unidade tal como o controlador de transformação de faixa dinâmica e volume de som em domínio de tempo real pode processar de maneira adaptativo conteúdo de áudio dos dados de mídia de entrada da unidade recebida e ajustar de maneira automática volume de som e faixa dinâmica se uma "bandeira evolução" está ausente nos dados de mídia de entrada ou correntes de bits de mídia fonte. Adicionalmente, opcionalmente ou alternativamente, outra unidade pode fazer uso de metadados com base em características para realizar processamento adaptativo.
[00078] Em exemplo de modalidades como ilustrado na figura 6, o codificador pode estar ciente que a unidade de pós/pré-processamento que realizou um processamento de mídia tipo (por exemplo, processamento no domínio de volume de som) e daí pode criar metadados de estado de processamento em um bloco de dados que inclui os parâmetros específicos utilizados em e/ou derivados do processamento em domínio de volume de som. Em algumas modalidades possíveis, o codificador pode criar metadados de estado de processamento que refletem histórico de processamento sobre o conteúdo nos dados de mídia desde que o codificador esteja ciente dos tipos de processamento que foram realizados (por exemplo, processamento no domínio de volume de som sobre o conteúdo dos dados de mídia). Adicionalmente, opcionalmente ou alternativamente, o codificador pode realizar processamento adaptativo com base em uma ou mais características de mídia descritas por meio dos metadados de estado de processamento. Adicionalmente, opcionalmente ou alternativamente, o codificador pode realizar análise dos dados de mídia e gerar uma descrição de características de mídia como o uma parte dos metadados de estado de processamento a ser fornecida para qualquer uma das outras unidades de processamento.
[00079] Em algumas modalidades possíveis, um decodificador que utiliza técnicas aqui, é capaz de entender o estado dos dados de mídia nos cenários a seguir.
[00080] Sob um primeiro cenário, se o decodificador recebe uma corrente de bits de mídia com a "bandeira evolução"ajustada para indicar a validade dos metadados de estado de processamento na corrente de bits de mídia, o decodificador pode fatiar e/ou recuperar os metadados de estado de processamento e sinalizar uma unidade de processamento de mídia a jusante tal como uma unidade de pós- processamento apropriada. Por outro lado, se uma "bandeira evolução" está ausente, então o decodificador pode sinalizar para a unidade de processamento de mídia a jusante que o processamento de nivelamento de volume deveria ainda ser realizado como metadados de volume de som - por exemplo, que deveriam ter sido incluídos nos metadados de estado de processamento em algumas modalidades possíveis tinham o processamento de nivelamento de volume já realizado - seja ausente ou não pode ser confiado como válido.
[00081] Sob um segundo cenário, se o decodificador recebe uma corrente de bits de mídia gerada e codificada por uma unidade de processamento de mídia a montante tal como um codificador de evolução para valor aleatório criptográfico, então o decodificador pode fatiar e recuperar o valor aleatório criptográfico a partir de um bloco de dados que compreende metadados de estado de processamento e utilizar o valor aleatório criptográfico para validar a corrente de bits de mídia recebida e metadados associados. Por exemplo, se o decodificador descobre os metadados associados (por exemplo, metadados de volume de som dos metadados de estado de processamento) serem válidos com base em uma correspondência entre um valor aleatório criptográfico de referência e o valor aleatório criptográfico recuperado a partir do bloco de dados, e então o decodificador pode sinalizar para a unidade de processamento de mídia a jusante tal como uma unidade de nivelamento de volume para passar os dados de mídia tal como áudio não mudados. Adicionalmente, opcionalmente ou alternativamente, outros tipos de técnicas criptográficas podem ser utilizados em lugar de um método baseado em um valor aleatório criptográfico. Adicionalmente, opcionalmente, ou alternativamente, operações diferentes de nivelamento de volume também podem ser realizadas com base em uma ou mais características de mídia dos dados de mídia como descrito nos metadados de estado de processamento.
[00082] Sob um terceiro cenário se o decodificador recebe uma corrente de bits de mídia gerada por uma unidade de processamento de mídia a montante tal como o codificador de evolução, porém um bloco de dados que compreende metadados de estado de processamento está incluído na corrente de bits de mídia; ao invés o bloco de dados é armazenado em um banco de dados de processamento de mídia. O decodificador é configurado para criar uma digital dos dados de mídia na corrente de bits de mídia tal como áudio, e então utilizar a digital para questionar o banco de dados de processamento de mídia. O banco de dados de processamento de mídia pode retornar o bloco de dados apropriado associado com os dados de mídia recebidos com base na digital correspondente. Em algumas modalidades possíveis, a corrente de bits de mídia codificada contém um simples localizador de recursos universal (URL) para direcionar o decodificador para enviar a consulta baseada em digital como discutido previamente para o banco de dados de processamento de mídia.
[00083] Em todos estes cenários o decodificador é configurado para entender o estado da mídia e sinalizar uma unidade de processamento de mídia a jusante para adaptada o processamento deste último dos dados de mídia de acordo. Em algumas modalidades possíveis, os dados de mídia aqui podem ser recodificados depois de serem decodificados. Em algumas modalidades possíveis, um bloco de dados que compreendem informação de estado de processamento contemporânea que corresponde à recodificação pode ser passado sobre uma unidade de processamento de mídia a jusante tal como um codificador/conversor subsequente ao decodificador. Por exemplo, o bloco de dados pode ser incluído como metadados associados na corrente de bits de mídia de saída a partir do decodificador.
[00084] A figura 7 ilustra um exemplo de decodificador de evolução que controla modos de operação de uma unidade de nivelamento de volume com base na validade de metadados de volume de som em e/ou associados com metadados de estado de processamento de acordo com algumas modalidades possíveis da presente invenção. Outras operações tais como processamento baseado em característica também podem ser manipuladas. Qualquer dos componentes delineados pode ser implementado como um ou mais processos e/ou um ou mais circuitos IC (incluindo ASICs e FPGAs), em hardware, software ou uma combinação de hardware e software. O decodificador pode compreender um número de subunidades herdadas tais como um módulo de informação de quadro (por exemplo, um módulo de informação de quadro em AC-3, MPEG AAC, MPEG HE AAC, E AC-3, etc.), um decodificador de front-end (por exemplo, um FED em AC-3, MPEG AAC, MPEG HE AAC, E AC-3, etc.), sincronização e conversão (por exemplo, um módulo de sincronização e conversão em AC-3, MPEG AAC, MPEG HE AAC, E AC-3, etc.), acumulador de ajuste de quadro, decodificador de back end (por exemplo, um BEE em AC-3, MPEG AAC, MPEG HE AAC, E AC-3, etc.), regeneração CRC, transformação de mídia (por exemplo, Volume Dolby) etc. Com estas subunidades herdadas o decodificador deveria ser capaz de transportar conteúdo de mídia em dados de mídia para uma unidade de processamento de mídia a jusante e/ou transformar o conteúdo de mídia. Contudo, o decodificador não deveria ser capaz de transportar o estado de dados de mídia ou fornecer sinalização de processamento de mídia e/ou metadados de estado de processamento na corrente de bits de saída a.
[00085] Sob as técnicas aqui, em algumas modalidades possíveis como ilustrado na figura 7, o decodificador pode compreender qualquer uma de uma pluralidade de novas subunidades tais como manipulação de metadados (dados de evolução e/ou outras entradas de metadados que incluem um ou mais tipos de dados de terceiros parceiros, informação de rastreamento, identificadores, informação proprietária ou padrão, dados de anotação de usuário, dado de preferência de usuário, extração de característica, manipulação de característica, etc), comunicação segura (por exemplo, à prova de falsificação), comunicação para informação de estado de processamento (gerador HMAC e validador de assinatura, outras técnicas criptográficas) extração de digital de mídia (por exemplo, extração de digital de áudio e de vídeo), processamento de mídia adjunta (por exemplo, canais de fala/ informação de volume de som, outros tipos de características de mídia), ocultação de dados (por exemplo, ocultação de dados PCM que podem ser destrutiva/irreversível ou reversível), inserção de sinalização de processamento de mídia, gerador HMAC (que pode, por exemplo, incluir inserção "add_bsi", ou inserções para um ou mais campos de dados auxiliares), outras técnicas criptográficas, recuperação e validação de dados ocultos (por exemplo, recuperação e validador de dados PCM ocultos), "desfazer"ocultação de dados, um ou mais comutadores que operam com base em sinalização de estado de processamento e/ou metadados de estado de processamento (por exemplo, dados de evolução "válidos e controle de inserção de ocultação de dados a partir de um gerador e validador de assinatura HMAC), etc. Como ilustrado, informação extraída pelo validador de gerador HMAC e validador de assinatura e a extração de digital de áudio e vídeo podem ser saídas para, ou utilizadas para correção síncrona de áudio e vídeo, classificações, direitos de mídia, controle de qualidade, processos de localização de mídia, processamento baseado em característica, etc.
[00086] Em algumas modalidades possíveis, uma unidade de pós- pré- processamento em uma cadeia de processamento de mídia não opera de maneira independente. Ao invés disto, a unidade de pós-pré- processamento pode interagir com um codificador ou um decodificador na cadeia de processamento de mídia. No caso de interagir com um codificador, a unidade de pós-pré-processamento pode ajudar a criar no mínimo uma parte de metadados de estado de processamento a respeito do estado dos dados de mídia em um bloco de dados. No caso de interagir com um decodificador a unidade de pós-pré- processamento é configurada para determinar o estado dos dados de mídia e para adaptar seu processamento dos dados de mídia de acordo. Em um exemplo na figura 7, um exemplo de unidade de pós- pré-processamento tal como uma unidade de nivelamento de volume pode recuperar os dados ocultos nas amostras PCM enviadas por um decodificador a montante e determinar com base nos dados ocultos se ou não metadados de volume de som são válidos. Se os metadados de volume de som são válidos, os dados de mídia de entrada tal como áudio podem ser passados sem mudança através da unidade de nivelamento de volume. Em outro exemplo, um exemplo de unidade de pós-pré-processamento pode recuperar os dados ocultos nas amostras PCM enviadas por um decodificador a montante e determinar com base nos dados ocultos um ou mais tipos de características de mídia determinadas previamente a partir do conteúdo das amostras de mídia. Se uma palavra-chave reconhecida por voz está indicada, a unidade de pós-pré-processamento pode realizar uma ou mais operações de especificas relacionadas à palavra chave reconhecida por voz.
5. Ocultação de Dados
[00087] A figura 8 ilustra exemplo de configuração de utilizar ocultação de dados para passar informação de processamento de mídia de acordo com algumas modalidades possíveis da presente invenção. Em algumas modalidades possíveis, ocultação de dados pode ser utilizada para possibilitar sinalização entre uma unidade de processamento de mídia a montante, tal como um codificador ou decodificador de evolução (por exemplo, processamento de áudio #1) e uma unidade de processamento de mídia a jusante, tal como uma unidade de pós-pré-processamento (por exemplo, processamento de áudio #2) onde não existe trajeto de metadados entre as unidades de processamento de mídia a montante e a jusante.
[00088] Em algumas modalidades possíveis, ocultação de dados de mídia reversível (por exemplo, ocultação de dados de áudio reversível) pode ser utilizada para modificar amostras de dados de mídia (por exemplo, X) nos dados de mídia para amostras de dados de mídia modificadas (por exemplo, X') que carregam sinalização de processamento de mídia e/ou processamento de metadados de estado entre as duas unidades de processamento de mídia. Em algumas modalidades possíveis, a modificação para as amostras de dados de mídia descrita aqui, é feita de tal maneira que não existe degradação perceptível como resultado da modificação. Assim, mesmo que não possa haver outra unidade de processamento de mídia subsequente à unidade de processamento de mídia 1, nenhum artefato audível ou visível pode ser percebido com as amostras de dados de mídia modificadas. Em outras palavras, ocultando a sinalização de processamento de mídia e/ou os metadados de estado de processamento em uma maneira perceptivelmente transparente não causaria quaisquer artefatos audíveis ou visíveis quando áudio e vídeo nas amostras de dados de mídia modificadas são transformados.
[00089] Em algumas modalidades possíveis, uma unidade de processamento de mídia (por exemplo, unidade de processamento de áudio #2 da figura 8) recupera a sinalização de processamento de mídia embutida e/ou metadados de estado de processamento a partir das amostras de dados de mídia modificadas, e restaura as amostras de dados de mídia modificadas para as amostras de dados de mídia originais, desfazendo as modificações. Isto pode ser feito, por exemplo, através de uma subunidade (por exemplo, extração de informação e restauração de áudio). A informação embutida recuperada pode então servir como um mecanismo de sinalização entre as duas unidades de processamento de mídia (por exemplo, unidades de processamento de áudio #1 e #2 da figura 8). A robustez da técnica de ocultação de dados aqui pode ser dependente de que tipos de processamento podem ser realizados pelas unidades de processamento de mídia. Um exemplo de unidade de processamento de mídia #1 pode ser um decodificador digital em uma caixa set-top, enquanto um exemplo de unidade de processamento de mídia #2 pode ser uma unidade de nivelamento de volume na mesma caixa settop. Se o decodificador determina que os metadados de volume de som são válidos, o decodificador pode utilizar uma técnica de ocultação de dados reversível para sinalizar a unidade de nivelamento de volume subsequente para não aplicar nivelamento.
[00090] Em algumas modalidades possíveis, ocultação de dados de mídia irreversível (por exemplo, um canal de comunicação seguro irreversível com base em técnica de ocultação de dados) pode ser utilizada para modificar amostras de dados de mídia (por exemplo, X) nos dados de mídia para amostras de dados de mídia modificadas (por exemplo, X') que carregam sinalização de processamento de mídia e/ou metadados de estado de processamento entre as duas unidades de processamento de mídia. Em algumas modalidades possíveis, a modificação para as amostras de dados de mídia descrita aqui é feita de tal maneira que existe uma degradação perceptível mínima como resultado da modificação. Assim, artefatos mínimos audíveis ou visíveis podem ser percebidos com as amostras de dados de mídia modificadas. Em outras palavras, ocultar a sinalização de processamento de mídia e/ou os metadados de estado de processamento em uma maneira perceptivelmente transparente poderia provocar artefatos mínimos audíveis ou visíveis quando áudio e vídeo nas amostras de dados de mídia modificadas são transformados.
[00091] Em algumas modalidades possíveis, modificações das amostras de dados de mídia modificadas através de ocultação de dados irreversível pode não ser desfeita para recuperar as amostras de dados de mídia originais.
6. Exemplo de fluxo de processo
[00092] A figura 9A e a figura 9B ilustram exemplo de fluxos de processo de acordo com uma modalidade possível da presente invenção. Em algumas modalidades possíveis, um ou mais dispositivos ou unidades de computação em um sistema de processamento de mídia podem realizar este fluxo de processo.
[00093] No bloco 910 da figura 9A um primeiro dispositivo em uma cadeia de processamento de mídia (por exemplo, uma cadeia de processamento de mídia aprimorada como descrita aqui) determina se um tipo de processamento de mídia foi realizado em uma versão de saída de dados de mídia. O primeiro dispositivo pode ser uma parte ou o todo de uma unidade de processamento de mídia. No bloco 920 em resposta a determinar que o tipo de processamento de mídia foi realizado sobre a versão de saída dos dados de mídia, o primeiro dispositivo pode criar um estado dos dados de mídia. Em algumas modalidades possíveis, o estado dos dados de mídia pode especificar o tipo de processamento de mídia, o resultado do qual é incluído na versão de saída dos dados de mídia. O primeiro dispositivo pode comunicar para um segundo dispositivo a jusante na cadeia de processamento de mídia a versão de saída dos dados de mídia e o estado dos dados de mídia, por exemplo, em uma corrente de bits de mídia de saída ou em uma corrente de bits de metadados auxiliares associada com uma corrente de bits de mídia separada que carrega a versão de saída dos dados de mídia.
[00094] Em algumas modalidades possíveis, os dados de mídia compreendem conteúdo de mídia um ou mais de apenas conteúdo de áudio, apenas conteúdo de vídeo, ou ambos, conteúdo de áudio e conteúdo de vídeo.
[00095] Em algumas modalidades possíveis, o primeiro dispositivo pode fornecer para o segundo dispositivo o estado dos dados de mídia como ou um ou mais de: (a) digitais de mídia e, (b) metadados de estado de processamento, ou (c) sinalização de processamento de mídia.
[00096] Em algumas modalidades possíveis, o primeiro dispositivo pode armazenar um bloco de dados de processamento de mídia em um banco de dados de processamento de mídia. O bloco de dados de processamento de mídia pode compreender metadados de processamento de mídia e no qual o bloco de dados de processamento de mídia é recuperável com base em uma ou mais digitais de mídia que são associadas com o bloco de dados de processamento de mídia.
[00097] Em algumas modalidades possíveis, o estado de dados de mídia compreende um valor aleatório criptográfico criptografado com informação credencial. O valor aleatório criptográfico pode ser autenticado por um dispositivo receptor.
[00098] Em algumas modalidades, no mínimo uma porção do estado de dados de mídia compreende um ou mais canais de comunicação seguros ocultado nos dados de mídia, e no qual o um ou mais canais de comunicação seguros devem ser autenticados por dispositivo receptor. Em um exemplo de modalidade o um ou mais canais de comunicação seguros pode compreender no mínimo um canal de comunicação seguro de espectro disperso. Em um exemplo de modalidade o um ou mais canais de comunicação seguros compreende no mínimo um canal de comunicação seguro de chaveamento de deslocamento de frequência.
[00099] Em algumas modalidades possíveis, o estado dos dados de mídia compreende um ou mais conjuntos de parâmetros que são utilizados em e/ou derivados do tipo de processamento de mídia.
[000100] Em algumas modalidades possíveis, no mínimo um do primeiro dispositivo e do segundo dispositivo, compreende uma ou mais unidades de pré-processamento, codificadores, subunidades de processamento de mídia, transcodificadores, decodificadores, unidades de pós-processamento, ou subunidades de transformação de conteúdo de mídia. Em um exemplo de modalidade, o primeiro dispositivo é um codificador (por exemplo, um codificador AVC) enquanto o segundo dispositivo é um decodificador (por exemplo, um decodificador AVC).
[000101] Em algumas modalidades possíveis, o tipo de processamento é realizado pelo primeiro dispositivo, enquanto em algumas outras modalidades possíveis o tipo de processamento é, ao invés disto, realizado por um dispositivo a montante em relação ao primeiro dispositivo na cadeia de processamento de mídia.
[000102] Em algumas modalidades possíveis, o primeiro dispositivo pode receber uma versão de entrada dos dados de mídia. A versão de entrada dos dados de mídia não compreende qualquer estado dos dados de mídia que indica o tipo de processamento de mídia. Nestas modalidades o primeiro dispositivo pode analisar a versão de entrada dos dados de mídia para determinar o tipo de processamento de mídia que já foi realizado sobre a versão de entrada dos dados de mídia.
[000103] Em algumas modalidades possíveis, o primeiro dispositivo codifica volume de som e faixa dinâmica do estado dos dados de mídia.
[000104] Em algumas modalidades possíveis, o primeiro dispositivo pode, de maneira adaptativo, evitar realizar o tipo de processamento de mídia que foi realizado por um dispositivo a montante. Contudo, mesmo quando o tipo de processamento de mídia foi realizado, o primeiro dispositivo pode receber um comando para passar por cima do tipo de processamento de mídia realizado pelo dispositivo a montante. Ao invés disto, o primeiro dispositivo pode ser comandado para ainda realizar o tipo de processamento de mídia, por exemplo, com qualquer dos mesmos ou diferentes parâmetros. O estado de dados de mídia que comunicou a partir do primeiro dispositivo para um segundo dispositivo a jusante na cadeia de processamento de mídia pode compreender uma versão de saída dos dados de mídia que incluem o resultado do tipo de processamento de mídia realizado pelo primeiro dispositivo sob o comando e um estado dos dados de mídia que indica que o tipo de processamento de mídia já foi realizado na versão de saída dos dados de mídia. Em diversas modalidades possíveis, o primeiro dispositivo pode receber o comando a partir de um de: (a) entrada de usuário, (b) uma configuração de sistema do primeiro dispositivo, (c) sinalização a partir de um dispositivo externo ao primeiro dispositivo ou (d) sinalização a partir de uma subunidade dentro do primeiro dispositivo.
[000105] Em algumas modalidades o estado dos dados de mídia compreende no mínimo uma porção de metadados de estado ocultos em um ou mais canais de comunicação seguros.
[000106] Em algumas modalidades, o primeiro dispositivo altera uma pluralidade de bytes nos dados de mídia para armazenar no mínimo uma porção do estado dos dados de mídia.
[000107] Em algumas modalidades, no mínimo um do primeiro dispositivo e do segundo dispositivo compreende um ou mais de codecs (ATSC) Advanced Television Systems Committee, codecs (MPEG) Moving Picture Experts Group, codecs (AC-3) Áudio Codec 3, e codecs Enhanced AC-3.
[000108] Em algumas modalidades, a cadeia de processamento de mídia compreende uma unidade de pré-processamento configurada para aceitar amostras no domínio de tempo que compreendem conteúdo de mídia como entrada e para dar saída a amostras processadas em domínio de tempo; um codificador configurado para dar saída para a corrente de bits de mídia comprimida do conteúdo de mídia com base nas amostras em domínio de tempo processadas, uma unidade de análise de sinal e correção de metadados configurada para validar metadados de estado de processamento na corrente de bits de mídia comprimida; um transcodificador configurado para modificar a corrente de bits de mídia comprimida, um decodificador configurado para dar saída a amostras decodificadas no domínio de tempo com base na corrente de bits de mídia comprimida; uma unidade de pós- processamento configurada para realizar pós- processamento do conteúdo de mídia nas amostras decodificadas em domínio de tempo. Em algumas modalidades no mínimo um do primeiro dispositivo e do segundo dispositivo compreender um ou mais da unidade de pré- processamento, unidade de análise de sinal e correção de metadados, o transcodificador, o decodificador, e a unidade de pós-processamento. Em algumas modalidades, no mínimo um da unidade de pré- processamento, da unidade de análise de sinal e correção de metadados, transcodificador, decodificador e a unidade de pós- processamento, realiza processamento adaptativo do conteúdo de mídia com base em metadados de processamento recebidos a partir de um dispositivo a montante.
[000109] Em algumas modalidades, o primeiro dispositivo determina uma ou mais características de mídia a partir dos dados de mídia, e inclui uma descrição da uma ou mais características de mídia no estado de dados de mídia. Uma ou mais características de mídia pode compreender no mínimo uma característica de mídia determinada a partir de um ou mais quadros, segundos, minutos, intervalos de tempo definíveis por usuário, cenas, canções, pedaços de música, e gravações. Uma ou mais características de mídia compreende uma descrição semântica dos dados de mídia. Em diversas modalidades uma ou mais características de mídia compreende uma ou mais propriedades estruturais, tonalidade que inclui harmonia e melodia, timbre, ritmo, volume de som, mix estéreo, uma quantidade de fontes de som dos dados de mídia, ausência ou presença de voz, características de repetição e melodia, harmonias, letras, timbre e características perceptíveis, características de mídia digital, parâmetros estéreo, uma ou mais porções de conteúdo de fala.
[000110] No bloco 950 da figura 9b um primeiro dispositivo em uma cadeia de processamento de mídia (por exemplo, uma cadeia de processamento de mídia aprimorada como descrito aqui), determina se um tipo de processamento de mídia já foi realizado sobre uma versão de entrada de dados de mídia.
[000111] No bloco 960, em resposta a determinar que o tipo de processamento de mídia já foi realizado sobre a aversão de entrada dos dados de mídia, o primeiro dispositivo adapta processamento dos dados de mídia para desabilitar realização do tipo de processamento de mídia no primeiro dispositivo. Em algumas modalidades possíveis, o primeiro dispositivo pode desligar um ou mais tipos de processamento de mídia com base em um estado de entrada dos dados de mídia.
[000112] Em algumas modalidades possíveis, o primeiro dispositivo comunica para um segundo dispositivo a jusante na cadeia de processamento de mídia uma versão de saída dos dados de mídia e um estado dos dados de mídia que indica que o tipo de processamento de mídia já foi realizado na versão de saída dos dados de mídia.
[000113] Em algumas modalidades possíveis, o primeiro dispositivo pode codificar volume de som e faixa dinâmica do estado de dados de mídia. Em algumas modalidades possíveis, o primeiro dispositivo pode realizar automaticamente um ou mais de volume de som corretivo adaptativo ou processamento de áudio dinâmico com base no mínimo em parte se o tipo de processamento já foi realizado sobre a versão de entrada dos dados de mídia.
[000114] Em algumas modalidades possíveis, o primeiro dispositivo pode realizar um segundo tipo diferente de processamento de mídia dos dados de mídia. O primeiro dispositivo pode comunicar para um segundo dispositivo a jusante na cadeia de processamento de mídia uma versão de saída dos dados de mídia e um estado dos dados de mídia que indica que o tipo de processamento de mídia e o segundo tipo diferente de processamento de mídia já foram realizados na versão de saída dos dados de mídia.
[000115] Em algumas modalidades possíveis, o primeiro dispositivo pode recuperar um estado de entrada dos dados de mídia que é associado com a versão de entrada dos dados de mídia. Em algumas modalidades possíveis, o estado de entrada dos dados de mídia é carregado com a versão de entrada dos dados de mídia em uma corrente de bits de mídia de entrada. Em algumas modalidades possíveis, o primeiro dispositivo pode extrair o estado de entrada e os dados de mídia a partir de unidades de dados nos dados de mídia que codificam conteúdo de mídia. O estado de entrada dos dados de mídia pode ser oculto em uma ou mais das unidades de dados.
[000116] Em algumas modalidades possíveis, o primeiro dispositivo pode recuperar uma versão das unidades de dados que não compreende o estado de entrada dos dados de mídia e transformar o conteúdo de mídia com base na versão da unidade de dados que foi recuperada.
[000117] Em algumas modalidades possíveis, o primeiro dispositivo pode autenticar o estado de entrada dos dados de mídia e validar um valor aleatório criptográfico associado com o estado de entrada dos dados de mídia.
[000118] Em algumas modalidades, o primeiro dispositivo autentica o estado de entrada de dados de mídia validando uma ou mais digitais associadas com o estado de entrada dos dados de mídia, no qual no mínimo uma ou mais que impressões são geradas com base em no mínimo uma porção dos dados de mídia.
[000119] Em algumas modalidades, o primeiro dispositivo valida os dados de mídia validando uma ou mais digitais associadas com o estado de entrada dos dados de mídia, no qual no mínimo uma ou mais digitais é gerada com base em no mínimo uma porção dos dados de mídia.
[000120] Em algumas modalidades possíveis, o primeiro dispositivo pode receber o estado de entrada dos dados de mídia como descrito pelos metadados de estado de processamento. O primeiro dispositivo pode criar sinalização de processamento de mídia com base no mínimo em parte dos metadados de estado de processamento. A sinalização de processamento de mídia pode indicar o estado de entrada dos dados de mídia mesmo embora a sinalização de processamento de mídia possa ser de um volume de dados menor e/ou requerer uma baixa velocidade de bits do que àquela dos metadados de estado de processamento. O primeiro dispositivo pode transmitir a sinalização de processamento de mídia para um dispositivo de processamento de mídia a jusante para o primeiro dispositivo na cadeia de processamento de mídia. Em algumas modalidades possíveis, a sinalização de processamento de mídia e está oculta em uma ou mais unidades de dados em uma versão de saída dos dados de mídia utilizando uma técnica de ocultação de dados reversível, de tal modo que uma ou mais modificações nos dados de mídia são removíveis por um dispositivo receptor. Em algumas modalidades a sinalização de processamento de mídia é ocultada em uma ou mais unidades de dados em uma versão de saída dos dados de mídia utilizando uma técnica de ocultação de dados irreversível de tal modo que no mínimo uma de uma ou mais modificações para os dados de mídia não é removível por um dispositivo receptor.
[000121] Em algumas modalidades, o primeiro dispositivo determina uma ou mais características de mídia com base em uma descrição de uma ou mais características de mídia no estado dos dados de mídia. Uma ou mais características de mídia podem compreender no mínimo uma característica de mídia determinada a partir de um ou mais de quadros, segundos, minutos, intervalos de tempo definíveis por usuário, cenas, canções, pedaços de música, e gravações. Uma ou mais características de mídia compreendem uma descrição semântica dos dados de mídia. Em algumas modalidades o primeiro dispositivo realiza uma ou mais operações especificas em resposta a determinar uma ou mais características de mídia.
[000122] Em algumas modalidades possíveis, um método é fornecido que compreende: computar com um primeiro dispositivo em uma cadeia de processamento de mídia uma ou mais representações reduzidas de velocidade de dados de uma estrutura fonte de dados de mídia e carregar uma ou mais representações reduzidas de velocidade de dados simultaneamente e de maneira segura, dentro de um estado dos próprios dados de mídia para um segundo dispositivo na cadeia de processamento de mídia, no qual o método é realizado por um ou mais dispositivos de computação.
[000123] Em algumas modalidades possíveis, uma ou mais representações reduzidas velocidade de dados são carregadas em no mínimo uma de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um mais coeficientes de transformação.
[000124] Em algumas modalidades possíveis uma ou mais representações reduzidas de velocidade de dados compreendem dados de sincronização utilizados para sincronizar áudio e vídeo entregues dentro dos dados de mídia.
[000125] Em algumas modalidades possíveis, uma ou mais representações reduzidas de velocidade de dados compreendem digitais de mídia (a) geradas por uma unidade de processamento de mídia e (b) embutidas com os dados de mídia para um ou mais de monitoramento de qualidade, classificações de mídia, rastreamento de mídia, ou pesquisa de conteúdo.
[000126] Em algumas modalidades possíveis, o método ainda compreende computar e transmitir por meio de pelo menos um do um ou mais dispositivos de computação na cadeia de processamento de mídia, um valor aleatório criptográfico com base nos dados de mídia e/ou do estado dos dados de mídia dentro de uma ou mais correntes de bits codificadas que carregam os dados de mídia.
[000127] Em algumas modalidades possíveis, o método ainda compreende: autenticar por meio de um dispositivo receptor o valor aleatório criptográfico; sinalizar por meio do dispositivo receptor para uma ou mais unidades de processamento de mídia a jusante uma determinação se estado dos dados de mídia é válido; e sinalizar por meio do dispositivo de recepção para uma ou mais unidades de processamento de mídia a jusante o estado dos dados de mídia em resposta a determinar que o estado de dados de mídia é válido.
[000128] Em algumas modalidades possíveis, o valor aleatório criptográfico que representa o estado de mídia e/ou dos dados de mídia é carregado em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000129] Em algumas modalidades possíveis, um método é fornecido compreendendo: processar de maneira adaptativo o um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende uma ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores ou processadores de corrente, uma versão de entrada de dados de mídia com base em um histórico passado de processamento de volume de som dos dados de mídia por meio de uma ou mais unidades de processamento de mídia a montante como indicado por um estado dos dados de mídia; normalização de volume de som e/ou faixa dinâmica de uma versão de saída de dos dados de mídia em uma extremidade da cadeia de processamento de guia de mídia para volume de som consistente e/ou valores de faixa dinâmica.
[000130] Em algumas modalidades possíveis, o valor de volume de som consistente compreende um valor de volume de som (1) controlado ou selecionado por um usuário, ou (2) sinalizado de maneira adaptativo por meio de um estado na versão de entrada dos dados de mídia.
[000131] Em algumas modalidades possíveis, o valor de volume de som é computado sobre as porções de diálogo (fala) dos dados de mídia.
[000132] Em algumas modalidades possíveis, o valor de volume de som é computado sobre porções absolutas, relativas e/ou sem bloqueio dos dados de mídia.
[000133] Em algumas modalidades possíveis, o valor de faixa dinâmica consistente compreende um valor de faixa dinâmica de (1) controlada ou selecionada por um usuário, ou (2) sinalizada de maneira adaptativo por um estado na versão de entrada dos dados de mídia.
[000134] Em algumas modalidades possíveis, o valor de faixa dinâmica é computado sobre as porções de diálogo (fala) dos dados de mídia.
[000135] Em algumas modalidades possíveis, o valor de faixa dinâmica é computado sobre porções absolutas, relativas, e/ou sem bloqueio dos dados de mídia.
[000136] Em algumas modalidades possíveis, o método ainda compreende computar um ou mais valores de controle de ganho de volume de som e/ou de faixa dinâmica para normalizar a versão de saída dos dados de mídia e o valor de volume de som consistente e faixa dinâmica consistente; carregar de maneira simultânea o um ou mais valores de controle de ganho de volume de som e/ou de faixa dinâmica dentro de um estado da versão de saída dos dados de mídia no final da cadeia de processamento de mídia a no qual o um ou mais valores de controle de ganho de volume de som e/ou de faixa dinâmica são utilizáveis por outro dispositivo para aplicar de maneira reversa o um ou mais valores de controle de ganho de volume de som e/ou de faixa dinâmica para recuperar um valor de volume de som original e uma faixa dinâmica original na versão de entrada dos dados de mídia.
[000137] Em algumas modalidades possíveis, o um ou mais valores de controle de ganho de volume de som e/ou de faixa dinâmica que representa o estado da versão de saída dos dados de mídia são carregados em no mínimo um de uma subcorrente, um ou mais campos reservados, m campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000138] Em algumas modalidades possíveis, um método é fornecido que compreende realizar um de inserir, extrair ou editar localizações de dados de mídia relacionada e não relacionada e/ou um estado de localizações de dados de mídia relacionadas e não relacionadas dentro de uma ou mais correntes de bits codificadas para um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores ou processadores de corrente,
[000139] Em algumas modalidades possíveis, uma ou mais localizações de dados de mídia relacionadas e não relacionadas e/ou o estado de localizações de dados de mídia relacionada e não relacionada dentro de correntes de bits codificadas são carregadas em no mínimo uma de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000140] Em algumas modalidades possíveis, um método é fornecido que compreendem realizar um ou mais de inserir, extrair ou editar dados de mídia relacionada e não relacionada e/ou um estado de dados de mídia relacionada e não relacionada dentro de uma ou mais correntes de bits codificadas por meio de um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores ou processadores de corrente,
[000141] Em algumas modalidades possíveis, o um ou mais dados de mídia relacionada e não relacionada e/ou o estado de dados de mídia relacionada e não relacionada dentro de correntes de bits codificadas são carregados em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000142] Em algumas modalidades possíveis, um sistema de processamento de mídia é configurado para computar e carregar valores aleatórios com base em dados de mídia e/ou um estado dos dados de mídia dentro de uma ou mais correntes de bits codificadas por meio de um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores ou processadores de corrente.
[000143] Como aqui utilizado, o termo "localizações de dados de mídia relacionada e não relacionada" pode se referir a informação que pode incluir um localizador de recurso de mídia tal como um trajeto absoluto, trajeto relativo e/ou URL que indica localização de mídia relacionada (por exemplo, uma cópia de mídia em um formato de corrente de bits diferente), ou um trajeto absoluto, trajeto relativo é/ou URL que indica a localização de mídia não relacionada ou outro tipo de informação que não está diretamente relacionada à essência ou a corrente de bits onde se encontra a localização de dados mídia (por exemplo, a localização de um novo pedaço de mídia tal como um comercial, página web, etc.).
[000144] Como aqui utilizado, o termo "estado de localizações de dados de mídia relacionada e não relacionada" pode se referir à validade das localizações de mídia relacionada e não relacionada (uma vez que elas podem ser editadas/atualizada através de todo o ciclo de vida das correntes de bits onde elas são carregadas).
[000145] Como aqui utilizado, "dados de mídia relacionada" pode se referir ao carregamento de dados de mídia relacionada na forma de correntes de bits de dados de mídia secundária altamente correlacionada com a mídia primária que a corrente de bits representa, (por exemplo, carregamento de uma cópia dos dados de mídia em um segundo formato de corrente de bits independente). No contexto de dados de mídia não relacionada esta informação poderia se referir ao carregamento de correntes de bits de dados de mídia secundária que são independentes dos dados de mídia primária.
[000146] Como aqui utilizado, "estado" para dados de mídia relacionada pode se referir a qualquer informação de sinalização (histórico de processamento, volume de som alvo atualizado, etc.) e/ou metadados bem como a validade dos dados de mídia relacionados. "Estado" para dados de mídia não relacionados pode se referir à informação de sinalização independente e/ou a metadados, que inclui informação de validade que poderia ser carregada separadamente (de maneira independente) do estado dos dados de mídia "relacionada". O estado dos dados de mídia não relacionada representa dados de mídia que são não relacionados à corrente de bits de dados de mídia na qual esta informação é encontrada, uma vez que esta informação poderia ser de maneira independente editada/atualizada através de todo o ciclo de vida das correntes de bits nas quais elas são carregadas.
[000147] Como aqui utilizado os termos "porções dos dados de mídia absoluta, relativa e/ou sem bloqueio" se relacionam ao bloqueio de volume de som e/ou medições de nível realizadas sobre os dados de mídia. Bloqueio se refere a um nível específico de limiar de volume de som onde valor computado que excede o limiar é incluído na medição final (por exemplo, ignorando valor de volume de curto prazo abaixo de -60dBFS no valor medido final). Bloqueio sobre um valor absoluto está se referindo a um nível fixo de volume de som, onde bloqueio sobre um valor está se referindo a um valor que é dependente do valor de medição não bloqueado corrente.
[000148] As figuras 12A até a figura 12L ainda ilustram diagramas de blocos de alguns exemplos de nós/dispositivos de processamento de mídia de acordo com algumas modalidades da presente invenção.
[000149] Como ilustrado na figura 12A, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender amostras de áudio PCM. As amostras de áudio PCM podem ou não conter metadados de estado de processamento (ou metadados de estado de mídia) ocultos entre as amostras de áudio PCM. O processador de sinal da figura 12A pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar extrair e/ou interpretar os metadados de estado de processamento a partir das amostras de áudio PCM, como fornecidas por uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12A. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para um codificador de áudio no processador de sinal da figura 12A para adaptar parâmetros de processamento para o codificador de áudio. Em paralelo, uma unidade de análise de áudio no processador de sinal da figura 12A pode analisar o conteúdo de mídia passado no sinal de entrada. Extração de característica, classificação de mídia, avaliação de volume de som, geração de digital, etc., podem ser implementadas como parte da análise realizada pela unidade de análise de áudio. No mínimo uma parte dos resultados desta análise pode ser fornecida para o codificador de áudio no processador de sinal da figura 12A para adaptar parâmetros de processamento para o codificador de áudio. O codificador de áudio codifica as amostras de áudio PCM do sinal de entrada para uma corrente de bits codificada em um sinal de saída com base nos parâmetros de processamento. Uma unidade de análise de corrente de bits codificada do processador de sinal da figura 12A pode ser configurada para determinar se dados de mídia ou amostras da corrente de bits codificada a ser transmitida no sinal de saída do processador de sinal da figura 12A tem espaço para armazenar no mínimo uma porção dos metadados de estado de processamento. Os novos metadados de estado de processamento a serem transmitidos por meio do processador de sinal da figura 12A compreendem alguns ou todos os metadados de estado de processamento que foram extraídos pelo extrator de metadados de estado de mídia, os metadados de estado de processamento que foram gerados pela unidade de análise de áudio e um gerador de metadados de estado de mídia do processador de sinal da figura 12A e/ou quaisquer dados de terceiro parceiro. Se é determinado que os dados de mídia ou amostras da corrente de bits codificada têm espaço para armazenar no mínimo uma porção dos metadados de estado de processamento, uma parte ou tudo dos novos metadados de estado de processamento pode ser armazenada como dados ocultos nos dos dados de mídia ou amostras no sinal de saída. Adicionalmente, opcionalmente ou alternativamente, uma parte ou tudo dos metadados de estado de processamento novos pode ser armazenada na estrutura separada de metadados afastada dos dados de mídia e amostras no sinal de saída. Assim, o sinal de saída pode compreender uma corrente de bits codificada que contém os novos metadados de estado de processamento (ou "estado de mídia") carregados dentro e/ou entre as amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000150] Como ilustrado na figura 12B, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender amostras de áudio PCM. As amostras de áudio PCM podem ou não conter metadados de estado de processamento (ou metadados de estado de mídia) ocultos entre as amostras de áudio PCM. O processador de sinal da figura 12B pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar, extrair e/ou interpretar os metadados de estado de processamento a partir das amostras de áudio PCM como fornecidas por uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12B. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para um processador de amostras de áudio PCM no processador de sinal da figura 12B para adaptar parâmetros de processamento para o processador de amostras de áudio PCM. Em paralelo, uma unidade de análise de áudio no processador de sinal da figura 12B pode analisar o conteúdo de mídia passado no sinal de entrada. Extração de característica, classificação de mídia, avaliação de volume de som, e geração de digital etc., podem ser implementadas como uma parte da análise realizada pela unidade de análise de áudio. No mínimo uma parte dos resultados desta análise pode ser fornecida para o codificador de áudio no processador de sinal da figura 12B para adaptar parâmetros de processamento para o processador de amostras de áudio PCM. O processador de amostra PCM de áudio processa as amostras de áudio PCM no sinal de entrada para uma corrente de bits (amostras) de áudio PCM em um sinal de saída com base nos parâmetros de processamento. Uma unidade de análise de áudio PCM no processador de sinal da figura 12B pode ser configurada para determinar se dados de mídia ou amostras na corrente de bits de áudio PCM a ser transmitida no sinal de saída do processador de sinal da figura 12B tem espaço para armazenar no mínimo uma porção dos metadados de estado de processamento. Os novos metadados de estado de processamento a serem transmitidos pelo processador de sinal da figura 12B compreendem alguns ou todos os metadados de estado de processamento que foram extraídos por meio do extrator de metadados de estado de mídia, os metadados de estado de processamento que foram gerados pela unidade de análise de áudio e um gerador de metadados de estado de mídia do processador de sinal da figura 12B, e/ou quaisquer dados de terceiro parceiro. Se é determinado que os dados de mídia ou as amostras da corrente de bits de áudio PCM tem espaço para armazenar no mínimo uma porção de metadados de estado de processamento, uma parte ou todos os novos metadados de estado de processamento podem ser armazenados como dados ocultos nos dados de mídia ou amostras do sinal de saída. Adicionalmente, opcionalmente ou alternativamente, uma parte ou todos dos metadados de estado de processamento podem ser armazenados em estrutura de metadados separada afastada dos dados de mídia e amostras no sinal de saída.
[000151] Assim, o sinal de saída pode compreender uma corrente de bits de áudio PCM que contém os novos metadados de estado de processamento (ou "estado de mídia") carregados dentro ou entre as amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000152] Como ilustrado na figura 12C, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender uma corrente de bits (amostras) de áudio PCM. A corrente de bits de áudio PCM pode conter metadados de estado de processamento (ou metadados de estado de mídia) carregados dentro e/ou entre amostras de mídia (essência) na corrente de bits de áudio PCM através de um canal seguro de comunicação oculto ou não oculto. O processador de sinal da figura 12C pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar, extrair e/ou interpretar os metadados de estado de processamento a partir da corrente de bits de áudio PCM. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para um processador de amostra de áudio PCM no processador de sinal da figura 12C para adaptar parâmetros de processamento para o processador de amostra de áudio PCM. Os metadados de estado de processamento podem incluir uma descrição de características de mídia, tipos ou subtipos de classe de mídia, ou valores de possibilidade/probabilidade como determinado por uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12C cujo processador de sinal da figura 12C pode ser configurado para utilizar sem realizar sua própria análise de conteúdo de mídia. Adicionalmente, opcionalmente ou alternativamente, o extrator de metadados de estado de mídia pode ser configurado para extrair dados de terceiro parceiro a partir do sinal de entrada e transmitir os dados de terceiro parceiro para um nó/entidade/dispositivo de processamento a jusante. Em uma modalidade o processador de amostra de áudio PCM processa a corrente de bits de áudio para amostras PCM de áudio em sinal de saída com base nos parâmetros de processamento ajustados com base nos metadados de estado de processamento fornecidos pela uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12 C.
[000153] Como ilustrado na figura 12D, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender uma corrente de bits de áudio codificada que contém metadados de estado de processamento (ou metadados de estado de áudio) carregados dentro e/ou ocultos entre as amostras de mídia através de um canal de comunicação seguro oculto ou não oculto. O processador de sinal da figura 12D pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar, extrair e/ou interpretar os metadados de estado de processamento a partir da corrente de bits codificada como fornecida pela uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12D. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para um decodificador de áudio no processador de sinal da figura 12D para adaptar parâmetros de processamento para o decodificador de áudio. Em paralelo, uma unidade de análise de áudio no processador de sinal da figura 12D pode analisar o conteúdo de mídia passado no sinal de entrada. Extração de característica, classificação de mídia, avaliação de volume de som, geração de digital, etc. podem ser implementadas como uma parte da análise realizada pela unidade de análise de áudio. No mínimo uma parte dos resultados desta análise pode ser fornecida para o decodificador de áudio no processador de sinal da figura 12D para adaptar parâmetros de processamento para o decodificador de áudio. O decodificador de áudio transforma a corrente de bits de áudio codificada do sinal de entrada para uma corrente de bits de áudio PCM em um sinal de saída com base nos parâmetros de processamento. Uma unidade de análise de áudio PCM no processador de sinal da figura 12D pode ser configurada para determinar se os dados de mídia ou amostras na corrente de bits de áudio PCM tem espaço para armazenar no mínimo uma porção de metadados de estado de processamento. Os novos metadados de estado de processamento a serem transmitidos por meio do processador de sinal da figura 12D compreendem alguns ou todos os metadados de estado de processamento que foram extraídos por meio do extrator de metadados de estado de mídia, os metadados de estado de processamento que foram gerados pela unidade de análise de áudio e um gerador de metadados de estado de mídia do processador de sinal da figura 12D, e/ou quaisquer dados de terceiro parceiro. Se é determinado que os dados de mídia ou amostras na corrente de bits de áudio PCM têm espaço para armazenar no mínimo uma porção de metadados de estado de processamento, uma parte ou todos os novos metadados de estado de processamento podem ser armazenados como dados ocultos nos dados de mídia ou amostras do sinal de saída. Adicionalmente, opcionalmente ou alternativamente, uma parte ou todos os novos metadados de estado de processamento podem ser armazenados em estrutura de metadados separada afastada dos dados de mídia e amostras no sinal de saída. Assim o sinal de saída pode compreender uma corrente de bits (amostras) de áudio PCM que contém metadados de estado de processamento (ou estado de mídia) carregados dentro e/ou entre os dados/amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000154] Como ilustrado na figura 12E, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender uma corrente de bits de áudio codificada. A corrente de bits de áudio codificada pode conter metadados de estado de processamento (ou metadados de estado de mídia) carregados dentro e/ou entre as amostras de mídia (essência) na corrente de bits de áudio codificado através de um canal de comunicação seguro oculto ou não oculto. O processador de sinal da figura 12E pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar, extrair e/ou interpretar os metadados de estado de processamento a partir da corrente de bits de áudio codificada. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para o decodificador de áudio no processador de sinal da figura 12E para adaptar parâmetros de processamento para o decodificador de áudio. Os metadados de estado de processamento podem incluir uma descrição de características de mídia, tipos ou subtipos de classe de mídia, ou valores de possibilidade/probabilidade como determinado por uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12E, que o processador de sinal da figura 12E pode ser configurado para utilizar sem realizar sua própria análise de conteúdo de mídia. Adicionalmente, opcionalmente ou alternativamente, o extrator de metadados de estado de mídia pode ser configurado para extrair dados de terceiro parceiro a partir do sinal de entrada e transmitir os dados de terceiro parceiro para um nó/entidade/dispositivo de processamento a jusante. Em uma modalidade o decodificador de áudio processa a corrente de bits de áudio codificada para amostras de áudio PCM um sinal de saída com base nos parâmetros de processamento ajustados com base nos metadados de estado de processamento fornecidos pela uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12E.
[000155] Como ilustrado na figura 12F, um processador de sinal (que pode ser Nó 1 de N nós) é configurado para receber um sinal de entrada que pode compreender uma corrente de áudio codificada que contém metadados de estado de processamento (ou metadados de estado de mídia) carregados dentro e/ou ocultos entre as amostras de mídia através de um canal de comunicação seguro oculto ou não oculto. O processador de sinal da figura 12F pode compreender um extrator de metadados de estado de mídia que é configurado para decodificar, extrair e/ou interpretar os metadados de estado de processamento a partir da corrente de bits codificada como fornecida por uma ou mais unidades de processamento de mídia antes do processador de sinal da figura 12F|. No mínimo uma parte dos metadados de estado de processamento pode ser fornecida para um transcodificador de corrente de bits (ou processador de corrente de bits de áudio codificada) no processador de sinal da figura 12F para adaptar parâmetros de processamento para o transcodificador de corrente de bits. Em paralelo, uma unidade de análise de áudio no processador de sinal da figura 12F pode analisar o conteúdo de mídia passado no sinal de entrada. Extração de característica, classificação de mídia, avaliação de volume de som, geração de digital, etc., podem ser implementadas como uma parte da análise realizada pela unidade de análise de áudio. No mínimo uma parte dos resultados desta análise pode ser fornecida para o transcodificador de corrente de bits no processador de sinal da figura 12F para adaptar parâmetros de processamento para o transcodificador de corrente de bits. O transcodificador de corrente de bits transforma a corrente de bits de áudio codificada no sinal de entrada para uma corrente de bits de áudio codificada em um sinal de saída com base nos parâmetros de processamento. Uma unidade de análise de corrente de bits codificada no processador de sinal da figura 12F pode ser configurada para determinar se os dados de mídia ou amostras na corrente de bits de áudio codificada têm espaço para armazenar no mínimo uma porção de metadados de estado de processamento. Os novos metadados de estado de processamento a serem transmitidos pelo processador de sinal da figura 12F compreendem algo ou todos os metadados de estado de processamento que foram extraídos pelo extrator de metadados de estado de mídia e, os metadados de estado de processamento que foram gerados pela unidade de análise de áudio e um gerador de metadados de estado de mídia do processador de sinal da figura 12F, e/ou quaisquer dados de terceiro parceiro. Se é determinado que os dados de mídia ou amostras na corrente de bits de áudio codificada têm espaço para armazenar no mínimo uma porção de metadados de estado de processamento, uma parte ou todos os novos metadados de estado de processamento pode ser armazenada como dados ocultos nos dados de mídia ou amostras no sinal de saída. Adicionalmente, opcionalmente, ou alternativamente, uma parte ou todos os novos metadados de estado de processamento podem ser armazenado em estrutura de metadados separada afastada dos dados de mídia do sinal de saída. Assim, o sinal de saída pode compreender uma corrente de bits de áudio codificada que contém metadados de estado de processamento (ou "estado de mídia") carregada dentro e/ou entre os dados de mídia/amostras (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000156] A figura 12G ilustra um exemplo de configuração similar àquele da figura 12A em parte. Adicionalmente, opcionalmente ou alternativamente, o processador de sinal da figura 12G pode compreender um extrator de metadados de estado de mídia que é configurado para questionar um banco de dados de metadados de estado de mídia local e/ou externo, que pode ser articulado operacionalmente ao processador de sinal da figura 12G através de intranet e/ou a Internet. Uma consulta enviada pelo processador de sinal da figura 12G para o banco de dados pode incluir uma ou mais digitais associadas com os dados de mídia, um ou mais nomes associados com os dados de mídia (por exemplo, um título de canção, um título de filme) ou quaisquer outros tipos de informação de identificação associada com dados de mídia. Com base na informação da consulta, metadados de estado de mídia correspondidos armazenados no banco de dados podem ser localizados e fornecidos para o processador de sinal da figura 12G. Os metadados de estado de mídia podem ser incluídos em metadados de estado de processamento fornecidos pelo extrator de metadados de estado de mídia para nós/entidades de processamento a jusante tal como um codificador de áudio. Adicionalmente, opcionalmente ou alternativamente, o processador de sinal da figura 12G pode compreender um gerador de metadados de estado de mídia que é configurado para fornecer quaisquer metadados de estado de mídia gerados e/ou informação de identificação associada tal como digitais, nomes e/ou outros tipos de informação de identificação para um banco de dados de metadados de estado de mídia local e/ou externo, como ilustrado na figura 12 G. Adicionalmente, opcionalmente ou alternativamente uma ou mais porções de metadados de estado de mídia armazenados no banco de dados pode ser fornecida para o processo de sinal da figura 12G para ser comunicada para um nó/dispositivo de processamento de mídia a jusante e dentro e/ou entre amostras de mídia (essência) através de com um canal de comunicação seguro oculto ou não oculto.
[000157] A figura do 12H ilustra um exemplo de configuração similar àquele da figura 12B em parte. Adicionalmente, opcionalmente ou alternativamente, um processador de sinal da figura 12H pode compreender um extrator de metadados de estado de mídia que é configurado para questionar se o banco de dados de metadados de estado de mídia local e/ou externo, que pode ser articulado operacionalmente ao processador de sinal da figura 12H através de intranet e/ou da Internet. Uma consulta enviada pelo processador de sinal da figura 12H para o banco de dados pode incluir uma ou mais digitais associadas com os dados de mídia, um ou mais nomes associados com os dados de mídia (por exemplo, um título de canção ou um título de filme), ou quaisquer outros tipos de informação de identificação associada com dados de mídia. Com base na informação da consulta, metadados de estado de mídia correspondidos armazenados no banco de dados podem ser localizados e fornecidos para o processo de sinal da figura 12H. Os metadados de estado de mídia podem ser incluídos em metadados de estado de processamento fornecidos pelo extrator de metadados de estado de mídia para os nós/entidades de processamento a jusante tal como um processador de amostra de áudio PCM. Adicionalmente, opcionalmente ou alternativamente, o processador de sinal da figura 12H pode compreender um gerador de metadados de estado de mídia que é configurado para fornecer quaisquer metadados de estado de mídia gerados e/ou informação de identificação associada tal como digitais, nomes e/ou outros tipos de informação de identificação para um banco de dados de metadados de estado de mídia local e/ou externo, como ilustrado na figura 12H. Adicionalmente, opcionalmente ou alternativamente, uma ou mais porções dos metadados de estado de mídia armazenados no banco de dados pode ser fornecida para o processo de sinal da figura 12H para ser comunicada para um nó/dispositivo de processamento de mídia a jusante dentro e/ou entre amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000158] A figura 12I ilustra um exemplo de configuração similar àquele da figura 12C em parte. Adicionalmente, opcionalmente ou alternativamente, o processador de sinal da figura 12I pode compreender um extrator de metadados de estado de mídia que é configurado para questionar um banco de dados de metadados de estado de mídia local e/ou externo que pode ser articulado operacionalmente ao processador de sinal da figura 12I através de intranet e/ou a Internet. Uma consulta enviada pelo processador de sinal da figura 12I para o banco de dados pode incluir uma ou mais digitais associadas com os dados de mídia, um ou mais nomes associados com os dados de mídia (por exemplo, um título de canção ou um título de filme), ou quaisquer outros tipos de informação de identificação associada com dados de mídia. Com base na informação da consulta, metadados de estado de mídia correspondidos e armazenados no banco de dados podem ser localizados e fornecidos para o processo de sinal da figura 12I. Os metadados de estado de mídia podem ser fornecidos para nós/ entidades de processamento a jusante, tal como um processador de amostra de áudio PCM.
[000159] A figura 12J ilustra um exemplo de configuração similar àquele da figura 12D em parte. Adicionalmente, opcionalmente ou alternativamente, um processador de sinal da figura 12J pode compreender um extrator de metadados de estado de mídia que é configurado para questionar o banco de dados de metadados de estado de mídia local e/ou externo, que pode ser articulado operacionalmente ao processador de sinal da figura 12J através de intranet e/ou da Internet. Uma consulta enviada pelo processador de sinal da figura 12J para o banco de dados pode incluir uma ou mais digitais associadas com os dados de mídia, um ou mais nomes associados com os dados de mídia (por exemplo, um título de canção, um título de filme) ou quaisquer outros tipos de informação de identificação associada com os dados de mídia. Com base na informação na consulta, metadados de estado de mídia correspondidos armazenados no banco de dados podem ser localizados e fornecidos para o processo de sinal da figura 12J Os metadados de estado de mídia a partir do banco de dados podem ser incluídos em metadados de estado de processamento fornecidos para nós/entidades de processamento a jusante, tal como um decodificador de áudio. Adicionalmente, opcionalmente ou alternativamente, o processador de sinal da figura 12J pode compreender uma unidade de análise de áudio que é configurada para fornecer quaisquer metadados de estado de mídia gerados e/ou informação de identificação associada, tal como digitais, nomes, e/ou outros tipos de informação de identificação para um banco de dados de metadados de estado de mídia local e/ou externo, como ilustrado na figura 12J. Adicionalmente, opcionalmente ou alternativamente, uma ou mais porções de metadados de estado de mídia armazenados no banco de dados pode ser fornecida para o processo de sinal da figura 12J para ser comunicada para um nó/dispositivo de processamento de mídia a jusante dentro e/ou entre amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000160] A figura 12K ilustra um exemplo de configuração similar àquele da figura 12F em parte. Adicionalmente, opcionalmente ou alternativamente, um processador de sinal da figura 12K pode compreender um extrator de metadados de estado de mídia que é configurado para questionar um banco de dados de metadados de estado de mídia local e/ou externo, e pode ser articulado operacionalmente ao processador de sinal da figura 12K através de intranet e/ou a Internet. Uma consulta enviada pelo processador de sinal da figura 12K para o banco de dados pode incluir uma ou mais digitais associadas com os dados de mídia, um ou mais nomes associados com os dados de mídia (por exemplo, um título de canção, um título de filme), ou quaisquer outros tipos de informação de identificação associada com dados de mídia. Com base na informação na consulta, metadados de estado de mídia correspondidos armazenados no banco de dados podem ser localizados e fornecidos para o processo de sinal da figura 12K. Os metadados de estado de mídia a partir do banco de dados podem ser incluídos em metadados de estado de processamento fornecidos para nós/entidades de processamento a jusante, tal com um transcodificador de corrente de bits ou processador de corrente de bits de áudio codificada. Adicionalmente, opcionalmente ou alternativamente, uma ou mais porções de metadados de estado de bits armazenadas no banco de dados pode ser fornecida para o processo de sinal da figura 12K para serem comunicados para um nó/dispositivo de processamento de mídia a jusante dentro e/ou entre amostras de mídia (essência) através de um canal de comunicação seguro oculto ou não oculto.
[000161] A figura 12L ilustra um processador de sinal nó 1 e um processador de sinal nó 2 de acordo com um exemplo de modalidade. O processador de sinal nó 1 e o processador de sinal nó 2 podem ser uma parte de uma cadeia de processamento de mídia global. Em algumas modalidades o processador de sinal nó 1 adapta processamento de mídia com base em metadados de estado de processamento que são recebidos pelo processador de sinal nó 2, enquanto o processador de sinal nó 2 adapta processamento de mídia com base nos metadados de estado de processamento que são recebidos pelo processador de sinal nó 2. Os metadados de estado de processamento recebidos pelo processador de sinal nó 2 podem compreender metadados de estado de processamento e/ou metadados de estado de mídia adicionados pelo processador de sinal nó 1 depois que o processador de sinal nó 1 analisa o conteúdo dos dados de mídia; como resultado, o processador de sinal nó 2 pode fazer uso diretamente dos metadados fornecidos pelo processador de sinal nó 1 em processamento de mídia sem o repetir algo ou todas as análises realizadas previamente pelo processador de sinal nó 1.
7. Mecanismos de implementação - visão geral de hardware
[000162] De acordo com uma modalidade, as técnicas descritas aqui são implementadas por meio de um ou mais dispositivos de computação de finalidade especial. Os dispositivos de computação de finalidade especial podem ser ligados por fio para realizar as técnicas, ou podem incluir dispositivos eletrônicos digitais tais como um ou mais circuitos integrados de aplicação específica (ASICs), ou sistemas de bloqueio programáveis no campo (FPGAs) que são programados de maneira persistente para realizar as técnicas, ou podem incluir um ou mais processadores de hardware de finalidade genérica programados para realizar as técnicas seguindo instruções de firmware, memória, outra armazenamento, ou uma combinação. Tais dispositivos de computação de finalidade especial podem também combinar lógica com fio, ASICs, ou FPGAs com programação de cliente para realizar as técnicas. Os dispositivos de computação de finalidade especial podem ser sistemas de computador de mesa, sistemas de computadores portáteis, dispositivos manuais, dispositivos em rede ou qualquer outro dispositivo que incorpora o lógica com fio e/ou programa, para implementar as técnicas.
[000163] Por exemplo, a figura 10 é um diagrama de blocos que ilustra um sistema de computador 1000 sobre o qual uma modalidade da invenção pode ser implementada. O sistema de computador 1000 inclui um barramento 1002 ou outro mecanismo de comunicação para comunicar informação e um processador de hardware 1004 acoplado ao barramento 1002 para processar informação. O processador de hardware 1004 pode ser, por exemplo, um microprocessador de finalidade genérica.
[000164] O sistema de computador 1000 também inclui uma memória principal 1006 tal como uma memória de acesso randômico (RAM) ou outro dispositivo de armazenamento dinâmica a acoplado ao barramento 1002 para armazenar informação e instruções a serem executadas pelo processador 1004. A memória principal 1006 também pode ser utilizada para armazenar variáveis temporárias ou outra informação intermediária durante a execução de instruções a serem executadas pelo processador 1004. Tais instruções quando armazenadas em meio de armazenamento não transitório acessível ao processador 1004, transforma o sistema de computador 1000 em uma máquina de finalidade especial que é feita sob medida para realizar as operações especificadas nas instruções.
[000165] O sistema de computador 1000 ainda inclui uma memória apenas de leitura (ROM) 1008 ou outro dispositivo de armazenamento estática acoplado ao barramento 1002 para armazenar informação estática e instruções para o processador 1004. Um dispositivo de armazenamento 1010 tal como um disco magnético ou disco ótico é fornecido e acoplado ao barramento 1002 para armazenar informação e instruções.
[000166] O sistema de computador 1000 pode ser acoplado através do barramento 1002 a um mostrador 1012 tal como um tubo de raios catódicos (CRT) para apresentar informação para um usuário de computador. Um dispositivo de entrada 1014 que inclui teclas alfanuméricas e outras é acoplado ao barramento 1002 para comunicar informação e as seleções de comando para o processador 1004. Outro tipo de dispositivo de entrada de usuário é controle de cursor 1016 tal como um mouse, uma TrackBall, ou teclas de direção de cursor para comunicar informação de direção seleções de comando para o processador 1004 e para controlar movimento do cursor sobre o mostrador 1012. Este dispositivo de entrada tipicamente tem dois graus de liberdade em dois eixos, um primeiro eixo (por exemplo, x) e um segundo eixo (por exemplo, y), que permite ao dispositivo especificar posições em um plano.
[000167] O sistema de computador 1000 pode implementar as técnicas descritas aqui utilizando lógica com fio sob medida ou um ou mais ASICs ou FPGAs, firmware e/ou lógica de programa que em combinação com o sistema de computador faz com que o sistema de computador ou o sistema de programa de computador 1000 seja uma máquina de finalidade especial. De acordo com uma modalidade, as técnicas aqui são realizadas pelo sistema de computador 1000 em resposta ao processador 1004 executar uma ou mais sequências de uma ou mais instruções contidas na memória principal 1006. Tais instruções podem ser lidas para a memória principal 1006 a partir de outro meio de armazenamento tal como o dispositivo de armazenamento 1010. A execução das sequências de instruções contidas na memória principal 1006 faz com que o processador 1004 realize as etapas do processo descritas aqui. Em modalidades alternativas, circuitos com fio podem ser utilizados em lugar de, ou em combinação com instruções de software.
[000168] O termo "mídia de armazenamento" como aqui utilizado, se refere a qualquer meio não transitório que armazena dados e/ou instruções que fazem com que uma máquina opere em uma maneira específica. Tal mídia de armazenamento pode compreender uma mídia não volátil e/ou uma mídia volátil. Mídia não volátil inclui, por exemplo, discos óticos ou magnéticos, tal como dispositivo de armazenamento 1010. Mídia volátil inclui memória dinâmica tal como a memória principal 1006. Formas comuns de mídia de armazenamento incluem, por exemplo, um disco floppy, um disco flexível, disco rígido, disco rígido de estado sólido, fita magnética, ou qualquer outra mídia magnética de armazenamento de dados, um CD-ROM, qualquer outra mídia de armazenamento de dados óticos, qualquer meio físico com padrões de furos, uma RAM, uma EPROM, e EEPROM, uma FLASH- EPROM, NVRAM, ou qualquer outro chip de memória ou cartucho.
[000169] Mídia de armazenamento é distinta de, porém pode ser utilizada em conjunto com mídia de transmissão. Mídia de transmissão participa na transferência de informação entre mídia de armazenamento. Por exemplo, mídia de transmissão inclui cabos coaxiais, fio de cobre e fibra ótica, inclusive os fios que compreendem o barramento 1002. A mídia de transmissão pode também assumir a forma de ondas acústicas ou de luz, tal como aquelas geradas durante a comunicação por onda de rádio e dados infravermelhos.
[000170] Diversas formas de mídia podem ser envolvidas no carregamento de uma ou mais sequências de uma ou mais instruções para o processador 1004 para execução. Por exemplo, as instruções podem ser carregadas inicialmente sobre o disco magnético ou acionamento de estado sólido de um computador remoto. O computador remoto pode carregar as instruções em sua memória dinâmica e enviar as instruções sobre uma linha de telefone utilizando um modem. Um modem local para sistema de computador 1000 pode receber os dados sobre a linha de telefone e utilizar um transmissor infravermelho para converter os dados para um sinal infravermelho. Um detector de infravermelho pode receber os dados carregados no sinal infravermelho e circuitos apropriados podem colocar os dados no barramento 1002. O barramento 1002 carrega os dados para a memória principal 1006 a partir da qual o processador 1004 recupera e executa as instruções. As instruções recebidas por meio da memória principal 1006 podem opcionalmente ser armazenadas no dispositivo de armazenamento 1010 seja antes ou depois da execução pelo processador 1004.
[000171] O sistema de computador 1000 também inclui uma interface de comunicação 1018 acoplada ao barramento 1002. A interface de comunicação 1018 fornece um acoplamento de comunicação de dados de duas vias para um enlace de rede 1020 que é conectado a uma rede local 1022. Por exemplo, a interface de comunicação 1018 pode ser um cartão de rede digital de serviços integrada (ISDN), modem de cabo, modem de satélite, ou um modem para fornecer uma conexão de comunicação de dados a um tipo correspondente de linha de telefone. Como outro exemplo, a interface de comunicação 1018 pode ser um cartão de rede de área local (LAN) para fornecer uma conexão de comunicação de dados para uma LAN compatível. Enlaces sem fio podem também ser implementados. Em qualquer tal implementação, a interface de comunicação 1018 envia e recebe sinais elétricos, eletromagnéticos, ou óticos, que carregam correntes de dados digitais que representam diversos tipos de informação.
[000172] Enlace de rede 1020 fornece, tipicamente, comunicação de dados através de uma ou mais redes para outros dispositivos de dados. Por exemplo, o enlace de rede 1020 pode fornecer uma conexão através de rede local 1022 para um computador hospedeiro 1024 ou para equipamento de dados operado por um Internet Service Provider (Provedor de serviços Internet) (ISP) 1026. O ISP 1026, por sua vez fornece serviços de comunicação de dados através da rede mundial de comunicação de pacote dados agora comumente referida como a "Internet" 1028. A rede local 1022 e a Internet 1028 ambas utilizam sinais elétricos, eletromagnéticos, ou óticos que carregam correntes de dados digitais. Os sinais através das diversas redes e os sinais sobre o enlace de rede 1020 e através da interface de comunicação 1018, que carrega os dados digitais para e a partir do sistema de computador 1000, são formas de exemplo de meios de transmissão.
[000173] O sistema de computador 1000 pode enviar mensagens e receber dados, que incluem código de programa, através das redes, enlace de rede 1020 e interface de comunicação 1018. No exemplo Internet, um servidor 1030 pode transmitir um código a requisitado para um programa de aplicação através da Internet 1028, ISP 1026, rede local 1022 e interface de comunicação 1018.
[000174] O código recebido pode ser executado pelo processador 1004 quando ele é recebido, e/ou armazenado no dispositivo de armazenamento 1010, ou outra armazenamento não volátil, para execução mais tarde.
8. Exemplos de modalidades numerados
[000175] Assim, modalidades da presente invenção podem se relacionar a um ou mais dos exemplos de modalidades numerados abaixo, cada um dos quais são exemplos, e, como qualquer outra discussão relacionada fornecida acima, não deveria ser imaginado como limitando qualquer concretização ou concretizações fornecidas ainda mais abaixo, quando elas permanecem agora, ou como com emendas mais tarde, substituídas, ou adicionadas. Da mesma maneira, estes exemplos não deveriam ser considerados como limitativos com relação a qualquer concretização ou concretizações de quaisquer patentes e/ou pedidos de patente relacionadas (inclusive quaisquer pedidos de contrapartida estrangeiros ou internacionais e/ou patentes, divisões continuações, re-emissões, etc.).
[000176] Exemplo de modalidade numerado 1 é um método que compreende: determinar, por meio de um primeiro dispositivo em uma cadeia de processamento, se um tipo de processamento de mídia foi realizado sobre uma versão de saída de dados de mídia; em resposta a determinar, por meio do primeiro dispositivo, que o tipo de processamento de mídia foi realizado sobre uma versão de saída dos dados de mídia, realizar: (a) criar, por meio do primeiro dispositivo, um estado dos dados de mídia, o estado especificando o tipo de processamento de mídia realizado sobre a versão de saída dos dados de mídia, e (b) comunicar a partir do primeiro dispositivo para o segundo dispositivo a jusante na cadeia de processamento de mídia, a versão de saída dos dados de mídia e o estado dos dados de mídia.
[000177] Exemplo de modalidade numerado 2 é um método como descrito no exemplo de modalidade numerado 1, no qual os dados de mídia compreendem conteúdo de mídia como um ou mais de: conteúdo de áudio apenas, conteúdo do vídeo apenas ou ambos, conteúdo de áudio e conteúdo de vídeo.
[000178] Exemplo de modalidade numerado 3 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo fornecer para o segundo dispositivo o estado dos dados de mídia como um ou mais de (a) digitais de mídia; (b) metadados de estado de processamento; (c) valores de características de mídia extraída; (d) descrições e/ou valores de tipos ou subtipos de classes de mídia; (e) valores de probabilidade de classe e/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000179] Exemplo de modalidade numerado 4 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo: armazenar um bloco de dados de processamento de mídia em um banco de dados de processamento de mídia, no qual o bloco de dados de processamento de mídia compreende metadados de processamento de mídia e no qual o bloco de dados de processamento de mídia é recuperável com base em uma ou mais digitais de mídia que são associadas com o bloco de dados de processamento de mídia.
[000180] Exemplo de modalidade numerado 5 é um método como descrito no exemplo de modalidade numerado 1, no qual o estado de dados de mídia compreende um valor aleatório criptográfico criptografado com informação credencial, e no qual o valor aleatório criptográfico deve ser autenticado por um dispositivo receptor.
[000181] Exemplo de modalidade numerado 6 é um método como descrito no exemplo de modalidade numerado 1, no qual no mínimo uma porção do estado de dados de mídia compreende um ou mais canais de comunicação seguros oculto nos dados de mídia e no qual o um ou mais canais de comunicação seguros devem ser autenticados por dispositivo receptor.
[000182] Exemplo de modalidade numerado 7 é um método como descrito no exemplo de modalidade numerado 6, no qual o um ou mais canais de comunicação seguros compreendem no mínimo um canal de comunicação seguro de espectro disperso.
[000183] Exemplo de modalidade numerado 8 é um método como descrito no exemplo de modalidade numerado 6, no qual o um ou mais canais de comunicação seguros compreendem no mínimo um canal de comunicação seguro de chaveamento de deslocamento de frequência.
[000184] Exemplo de modalidade numerado 9 é um método como descrito no exemplo de modalidade numerado 1, no qual o estado dos dados de mídia é carregado com a versão de saída dos dados de mídia em uma corrente de bits de mídia de saída.
[000185] Exemplo de modalidade numerado 10 é um método como descrito no exemplo de modalidade numerado 1, no qual o estado dos dados de mídia é carregado em uma corrente de bits de metadados auxiliar associada com uma corrente de bits de mídia separada que carrega a versão de saída dos dados de mídia.
[000186] Exemplo de modalidade numerado 11 é um método como descrito no exemplo de modalidade numerado 1, no qual o estado dos dados de mídia compreende um ou mais conjuntos de parâmetros que se relacionam ao tipo de processamento de mídia.
[000187] Exemplo de modalidade numerado 12 é um método como descrito no exemplo de modalidade numerado 1, no qual no mínimo um dos primeiro dispositivo ou do segundo dispositivo compreende um ou mais de: unidades de pré-processamento, codificadores, subunidades de processamento de mídia, transcodificadores, decodificadores, unidades de pós-processamento ou subunidades de transformação de conteúdo de mídia.
[000188] Exemplo de modalidade numerado 13 é um método como descrito no exemplo de modalidade numerado 1, no qual o primeiro dispositivo é um codificador e no qual o segundo dispositivo é um decodificador.
[000189] Exemplo de modalidade numerado 14 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo: realizar por meio do primeiro dispositivo, o tipo de processamento de mídia.
[000190] Exemplo de modalidade numerado 15 é um método como descrito no exemplo de modalidade numerado 1, no qual o tipo de processamento de mídia foi realizado por dispositivo a montante em relação ao primeiro dispositivo na cadeia de processamento de mídia; e ainda compreendendo receber por meio do primeiro dispositivo uma versão de entrada dos dados de mídia, no qual a versão de entrada dos dados de mídia compreende qualquer estado dos dados de mídia que indica o tipo de processamento de mídia: analisar a versão de entrada dos dados de mídia para determinar o tipo de processamento de mídia que já foi realizado sobre a versão de entrada dos dados de mídia.
[000191] Exemplo de modalidade numerado 16 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo codificar volume de som e valores de faixa dinâmica do estado de dados de mídia.
[000192] Exemplo de modalidade numerado 17 é um método como descrito no exemplo de modalidade numerado 1, no qual o tipo de processamento de mídia foi previamente realizado por um dispositivo a montante relativo ao primeiro dispositivo na cadeia de processamento de mídia; e ainda compreendendo receber por meio do primeiro dispositivo um comando para apagar o tipo de processamento de mídia previamente realizado; realizar por meio do primeiro dispositivo o tipo de processamento de mídia; comunicar a partir do primeiro dispositivo para o segundo dispositivo a jusante na cadeia de processamento de mídia uma versão de saída dos dados de mídia e um estado dos dados de mídia que indica que o tipo de processamento de mídia já foi realizado na versão de saída dos dados de mídia.
[000193] Exemplo de modalidade numerado 18 é um método como descrito no exemplo de modalidade numerado 17, ainda compreendendo receber o comando a partir de um de: (a) uma entrada de usuário, (b) uma configuração de sistema do primeiro dispositivo, (c) sinalização a partir de um dispositivo externo ao primeiro dispositivo, ou (d) sinalização a partir de uma subunidade dentro do primeiro dispositivo.
[000194] Exemplo de modalidade numerado 19 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo comunicar a partir do primeiro dispositivo para o segundo dispositivo a jusante na cadeia de processamento de mídia um ou mais tipos de metadados independente do estado dos dados de mídia.
[000195] Exemplo de modalidade numerado 20 é um método como descrito no exemplo de modalidade numerado 1, no qual o estado dos dados de mídia compreende no mínimo uma porção de metadados de estado ocultos em um ou mais canais de comunicação seguros.
[000196] Exemplo de modalidade numerado 21 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo alterar uma pluralidade de bytes nos dados de mídia para armazenar no mínimo uma porção do estado dos dados de mídia.
[000197] Exemplo de modalidade numerado 22 é um método como descrito no exemplo de modalidade numerado 1, no qual no mínimo um do primeiro dispositivo w do segundo dispositivo compreende um ou mais de codecs (ATSC) Advanced Television Systems Committee, codecs (MPEG) Moving Picture Experts Group, codecs (AC-3) Audio Codec 3, e codecs Enhanced AC-3.
[000198] Exemplo de modalidade numerado 23 é um método como descrito no exemplo de modalidade numerado 1, no qual a cadeia de processamento de mídia compreende: uma unidade de pré- processamento configurada para aceitar amostras no domínio de tempo que compreendem conteúdo de mídia como entrada e para dar saída a amostras processadas em domínio de tempo; um codificador configurado para dar saída a corrente de bits de mídia comprimida do conteúdo de mídia com base nas amostras processadas em domínio de tempo; uma unidade de análise de sinal e de correção de metadados configurada para validar metadados de estado de processamento na corrente de bits de mídia comprimida; um transcodificador configurado para modificar a corrente de bits de mídia comprimida; um decodificador configurado para dar saída a amostras decodificadas em domínio de tempo com base na corrente de bits de mídia comprimida e uma unidade de pós-processamento configurada para realizar pós-processamento do conteúdo de mídia nas amostras decodificadas em domínio de tempo.
[000199] Exemplo de modalidade numerado 24 é um método como descrito no exemplo de modalidade numerado 23, no qual no mínimo um do primeiro dispositivo e do segundo dispositivo compreende um ou mais da unidade de pré-processamento, da unidade de análise de sinal e correção de metadados, o transcodificador, o decodificador e a unidade de pós-processamento.
[000200] Exemplo de modalidade numerado 25 é um método como descrito no exemplo de modalidade numerado 23, no qual no mínimo um da unidade de pré-processamento, a unidade de análise de sinal e correção de metadados, o transcodificador, o decodificador e a unidade de pós-processamento realiza processamento adaptativo do conteúdo de mídia com base em metadados de processamento recebidos a partir de um dispositivo a montante.
[000201] Exemplo de modalidade numerado 26 é um método como descrito no exemplo de modalidade numerado 1, ainda compreendendo determinar uma ou mais características de mídia a partir dos dados de mídia; incluir uma descrição da uma com mais características de mídia no estado de dados de mídia.
[000202] Exemplo de modalidade numerado 27 é um método como descrito no exemplo de modalidade numerado 26, no qual uma ou mais características de mídia compreende no mínimo uma característica de mídia determinada a partir de um ou mais de quadros, segundos, minutos, intervalos de tempo definíveis por usuário, cenas, canções, pedaços de música e gravações.
[000203] Exemplo de modalidade numerado 28 é um método como descrito no exemplo de modalidade numerado 26, no qual uma ou mais características de mídia compreende uma descrição semântica dos dados de mídia.
[000204] Exemplo de modalidade numerado 29 é um método como descrito no exemplo de modalidade numerado 26, no qual uma ou mais características de mídia compreende uma ou mais de propriedades estruturais, tonalidade incluindo harmonia e melodia, timbre, ritmo, volume de som, mix estéreo, uma quantidade de fontes de som dos dados de mídia, ausência ou presença de voz, características de repetição e melodia, harmonias, letras, timbre e características perceptíveis características de mídia digital, parâmetros estéreo, uma ou mais porções de conteúdo de fala.
[000205] Exemplo de modalidade numerado 30 é um método como descrito no exemplo de modalidade numerado 26, ainda compreendendo utilizar uma ou mais características de mídia para classificar os dados de mídia em uma ou mais classes de dados de mídia em uma pluralidade de classes de dados de mídia.
[000206] Exemplo de modalidade numerado 31 é um método como descrito no exemplo de modalidade numerado 30, no qual uma ou mais classes de dados de mídia compreende um ou mais de uma única classe de dados de mídia global/dominante para todo o pedaço de mídia ou uma única classe que representa um período de tempo menor do que todo o pedaço de mídia. Exemplo de modalidade numerado 32 é um método como descrito no exemplo de modalidade numerado 31, no qual o período de tempo menor representa o um ou mais de um único quadro de mídia, um único bloco de dados de mídia, diversos quadros de mídia, diversos blocos de dados de mídia, uma fração de segundo, um segundo ou diversos segundos.
[000207] Exemplo de modalidade numerado 33 é um método como descrito no exemplo de modalidade numerado 30, no qual um ou mais rótulos de classe de dados de mídia que representam uma ou mais classes de dados de mídia são computados e inseridos em uma corrente de bits.
[000208] Exemplo de modalidade numerado 34 é um método como descrito no exemplo de modalidade numerado 30, no qual o um ou mais rótulos de classe de dados de mídia que representam uma ou mais classes de dados de mídia são computados e sinalizados para um nó de processamento de mídia receptor como dados ocultos embutidos com os dados de mídia.
[000209] Exemplo de modalidade numerado 35 é um método como descrito no exemplo de modalidade numerado 30, no qual o um ou mais rótulos de classe de dados de mídia que representam uma ou mais classes de dados de mídia são computados e sinalizados para um nó de processamento de mídia receptor em uma estrutura de metadados separada entre blocos dos dados de mídia.
[000210] Exemplo de modalidade numerado 36 é um método como descrito no exemplo de modalidade numerado 31, no qual a única classe de dados de mídia global/dominante representa um ou mais de um único tipo de classe tal como música, fala, ruído, silêncio, aplauso, ou uma mistura de tipo de classe, tal como fala sobre música, conversação sobre ruído, ou outras misturas de tipos de dados de mídia.
[000211] Exemplo de modalidade numerado 37 é um método como descrito no exemplo de modalidade numerado 30, ainda compreendendo associar um ou mais valores de possibilidade ou probabilidade com um ou mais rótulos de classe de dados de mídia, no qual um valor de possibilidade ou probabilidade representa o nível de confiança que o rótulo de classe de mídia computada tem em relação a um segmento/bloco de mídia ao qual o rótulo de classe de mídia computada é associado.
[000212] Exemplo de modalidade numerado 38 é um método como descrito no exemplo de modalidade numerado 37, no qual o valor de possibilidade ou probabilidade é utilizado por um nó de processamento de mídia receptor na cadeia de processamento de mídia, para adaptar processamento em uma maneira para melhorar uma ou mais operações tais como upmixing, codificação, decodificação, transcodificação ou virtualização de fone de ouvido.
[000213] Exemplo de modalidade numerado 39 é um método como descrito no exemplo de modalidade numerado 38, no qual no mínimo uma das uma ou mais operações elimina uma necessidade por pré- ajustar parâmetros de processamento, reduz complexidade de unidades de processamento através da cadeia de mídia, ou aumenta a vida da bateria, quando operações de análise complexas para classificar os dados de mídia por meio do nó de processamento de mídia receptor são evitadas.
[000214] Exemplo de modalidade numerado 40 é um método que compreende: determinar por meio de um primeiro dispositivo em uma cadeia de processamento de mídia se um tipo de processamento de mídia já foi realizado sobre uma versão de saída de dados de mídia; e em resposta a determinar, por meio do primeiro dispositivo que o tipo de processamento de mídia já foi realizado sobre a versão de entrada dos dados de mídia, realizar processo de adaptação dos dados de mídia para desabilitar realização do tipo de processamento de mídia no primeiro dispositivo; e no qual o método é realizado por meio de um ou mais processadores de computação.
[000215] Exemplo de modalidade numerado 41 é um método como descrito no exemplo de modalidade numerado 40, ainda compreendendo comunicar a partir do primeiro dispositivo para um segundo dispositivo a jusante na cadeia de processamento de mídia, uma versão de saída dos dados de mídia e um estado de dados de mídia que indica que o tipo de processamento de mídia foi realizado na versão de saída dos dados de mídia.
[000216] Exemplo de modalidade numerado 42 é um método como descrito no exemplo de modalidade numerado 41, ainda compreendendo codificar volume de som e valores de faixa dinâmica do estado de dados de mídia.
[000217] Exemplo de modalidade numerado 43 é um método como descrito no exemplo de modalidade numerado 40, ainda compreendendo realizar por meio do primeiro dispositivo, um segundo tipo de processamento de mídia sobre os dados de mídia, o segundo tipo de processamento de mídia diferente do tipo de processamento de mídia; comunicar, a partir do primeiro dispositivo para um segundo dispositivo a jusante na cadeia de processamento de mídia, uma versão de saída dos dados de mídia e um estado dos dados de mídia que indica que o tipo de processamento de mídia e o segundo tipo de processamento de mídia já foram realizados na versão de saída dos dados de mídia.
[000218] Exemplo de modalidade numerado 44 é um método como descrito no exemplo de modalidade numerado 40, ainda compreendendo: realizar de maneira automática um ou mais de adaptar volume de som corretivo ou processamento de áudio dinâmico com base no mínimo em parte se o tipo de processamento foi realizado previamente sobre a versão de saída dos dados de mídia.
[000219] Exemplo de modalidade numerado 45 é um método como descrito no exemplo de modalidade numerado 40, ainda compreendendo extrair um estado de entrada dos dados de mídia a partir de unidades de dados nos dados de mídia que codificam conteúdo de mídia, no qual o estado de entrada dos dados de mídia é oculto em uma ou mais das unidades de dados.
[000220] Exemplo de modalidade numerado 46 é um método como descrito no exemplo de modalidade numerado 45, ainda compreendendo recuperar uma versão das unidades de dados que não compreendem o estado de entrada dos dados de mídia e transformar o conteúdo de mídia com base na versão das unidades de dados que foram recuperadas.
[000221] Exemplo de modalidade numerado 47 é um método como descrito no exemplo de modalidade numerado 46, ainda compreendendo recuperar um estado de entrada dos dados de mídia que está associado com a versão de saída dos dados de mídia.
[000222] Exemplo de modalidade numerado 48 é um método como descrito no exemplo de modalidade numerado 47, ainda compreendendo autenticar o estado de entrada dos dados de mídia validando um valor aleatório criptográfico associado com o estado de entrada dos dados de mídia.
[000223] Exemplo de modalidade numerado 49 é um método como descrito no exemplo de modalidade numerado 47, ainda compreendendo autenticar o estado de entrada dos dados de mídia validando uma ou mais digitais associadas com o estado de entrada dos dados de mídia, no qual no mínimo uma das uma ou mais digitais é gerada com base em no mínimo uma porção dos dados de mídia.
[000224] Exemplo de modalidade numerado 50 é um método como descrito no exemplo de modalidade numerado 47, ainda compreendendo validar os dados de mídia validando uma ou mais digitais associadas com o estado de entrada dos dados de mídia, no qual no mínimo uma das uma ou mais digitais é gerada com base em no mínimo uma porção dos dados de mídia.
[000225] Exemplo de modalidade numerado 51 é um método como descrito no exemplo de modalidade numerado 47, no qual o estado de entrada dos dados de mídia é carregado com a versão de entrada dos dados de mídia em uma corrente de bits de mídia de entrada.
[000226] Exemplo de modalidade numerado 52 é um método como descrito no exemplo de modalidade numerado 47, ainda compreendendo desligar um ou mais tipos de processamento de mídia com base no estado de entrada dos dados de mídia.
[000227] Exemplo de modalidade numerado 53 é um método como descrito no exemplo de modalidade numerado 47, no qual o estado de entrada dos dados de mídia é descrito com metadados de estado de processamento; e ainda compreendendo: criar sinalização de processamento de mídia com base no mínimo em parte nos metadados de estado de processamento, no qual a sinalização de processamento de mídia indica o estado de entrada dos dados de mídia; transmitir a sinalização de processamento de mídia para um dispositivo de processamento de mídia a jusante para o primeiro dispositivo na cadeia de processamento de mídia.
[000228] Exemplo de modalidade numerado 54 é um método como descrito no exemplo de modalidade numerado 53, no qual a sinalização de processamento de mídia é oculta em uma ou mais unidades de dados em uma versão de saída dos dados de mídia.
[000229] Exemplo de modalidade numerado 55 é um método como descrito no exemplo de modalidade numerado 54, no qual a sinalização de processamento de mídia é realizada utilizando uma técnica de ocultação de dados reversível, de tal modo que uma ou mais modificações nos dados de mídia são removíveis por meio de um dispositivo receptor.
[000230] Exemplo de modalidade numerado 56 é um método como descrito no exemplo de modalidade numerado 54, no qual a sinalização de processamento de mídia é realizada utilizando uma técnica de ocultação de dados irreversível de tal modo que no mínimo uma das uma ou mais modificações nos dados de mídia não é removível por um dispositivo receptor.
[000231] Exemplo de modalidade numerado 57 é um método como descrito no exemplo de modalidade numerado 46, ainda compreendendo receber a partir de um dispositivo a montante na cadeia de processamento de mídia um ou mais tipos de metadados independente de qualquer processamento de mídia passado realizado nos dados de mídia.
[000232] Exemplo de modalidade numerado 58 é um método como descrito no exemplo de modalidade numerado 47, no qual o estado dos dados de mídia compreende no mínimo uma porção de metadados de estado oculta em um ou mais canais de comunicação seguros.
[000233] Exemplo de modalidade numerado 59 é um método como descrito no exemplo de modalidade numerado 46, ainda compreendendo alterar uma pluralidade bytes nos dados de mídia para armazenar no mínimo uma porção de um estado dos dados de mídia.
[000234] Exemplo de modalidade numerado 60 é um método como descrito no exemplo de modalidade numerado 46, no qual o primeiro dispositivo compreende um ou mais de codecs (ATSC) Advanced Television Systems Committee, codecs (MPEG) Moving Picture Experts Group, codecs (AC-3) Audio Codec 3, e codecs Enhanced AC- 3.
[000235] Exemplo de modalidade numerado 61 é um método como descrito no exemplo de modalidade numerado 46, a cadeia de processamento de mídia compreende: uma unidade de pré- processamento configurada para aceitar amostras no domínio de tempo que compreendem conteúdo de mídia como entrada e para dar saída a amostras processadas em domínio de tempo; um codificador configurado para dar saída a corrente de bits de mídia comprimida do conteúdo de mídia com base nas amostras processadas em domínio de tempo; uma unidade de análise de sinal e de correção de metadados configurada para validar metadados de estado de processamento na corrente de bits de mídia comprimida; um transcodificador configurado para modificar a corrente de bits de mídia comprimida; um decodificador configurado para dar saída a amostras decodificadas em domínio de tempo com base na corrente de bits de mídia comprimida e uma unidade de pós-processamento configurada para realizar pós- processamento do conteúdo de mídia nas amostras decodificadas em domínio de tempo.
[000236] Exemplo de modalidade numerado 62 é um método como descrito no exemplo de modalidade numerado 61, no qual o primeiro dispositivo compreende uma ou mais da unidade de pré- processamento, a unidade de análise de sinal e correção de metadados, o transcodificador, o decodificador, e a unidade de pós- processamento.
[000237] Exemplo de modalidade numerado 63 é um método como descrito no exemplo de modalidade numerado 61 no qual no mínimo um da unidade de pré-processamento, a unidade de análise de sinal e correção de metadados, o transcodificador, o decodificador e a unidade de pós-processamento realiza processamento adaptativo do conteúdo de mídia com base em metadados de processamento recebidos a partir de um dispositivo a montante.
[000238] Exemplo de modalidade numerado 64 é um método como descrito no exemplo de modalidade numerado 47, ainda compreendendo determinar uma ou mais características de mídia com base em uma descrição da uma ou mais características de mídia no estado de dados de mídia.
[000239] Exemplo de modalidade numerado 65 é um método como descrito no exemplo de modalidade numerado 64, no qual uma ou mais características de mídia compreende no mínimo uma característica de mídia determinada a partir de um ou mais de quadros, segundos, minutos, intervalos de tempo definíveis por usuário, cenas, canções, pedaços de música e gravações.
[000240] Exemplo de modalidade numerado 66 é um método como descrito no exemplo de modalidade numerado 64, no qual uma ou mais características de mídia compreende uma descrição semântica dos dados de mídia.
[000241] Exemplo de modalidade numerado 67 é um método como descrito no exemplo de modalidade numerado 64 ainda compreendendo realizar uma ou mais operações específicas em resposta a determinar uma ou mais características de mídia.
[000242] Exemplo de modalidade numerado 68 é um método como descrito no exemplo de modalidade numerado 64, ainda compreendendo fornecer, para o segundo dispositivo na cadeia de processamento de mídia o estado dos dados de mídia como um ou mais de: (a) digitais de mídia; (b) metadados de estado de processamento, (c) valores de características de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia, (e) valores de probabilidade de classe e/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000243] Exemplo de modalidade numerado 69 é um método que compreender: computar com um primeiro dispositivo em uma cadeia de processamento de mídia, uma ou mais que representações reduzidas de velocidade de dados de uma quadro fonte de dados de mídia; e carregar uma ou mais representações reduzidas de velocidade de dados simultaneamente e de maneira segura dentro de um estado dos próprios dados de mídia para um segundo dispositivo na cadeia de processamento de mídia; no qual o método é realizado por um ou mais dispositivos de computação.
[000244] Exemplo de modalidade numerado 70 é um método como descrito no exemplo de modalidade numerado 69, no qual uma ou mais representações reduzidas de velocidade de dados são carregadas em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000245] Exemplo de modalidade numerado 71 é um método como descrito no exemplo de modalidade numerado 69, no qual uma ou mais representações reduzidas de velocidade de dados compreende dados de sincronização utilizados para sincronizar áudio e vídeo distribuídos dentro de um dos dados de mídia.
[000246] Exemplo de modalidade numerado 72 é um método como descrito no exemplo de modalidade numerado 69, no qual uma ou mais representações reduzidas de velocidade de dados compreende digitais de mídia (a) geradas por uma unidade de processamento de mídia e (b) embutidas com os dados de mídia para um ou mais de monitoramento de qualidade, classificações de mídia, rastreamento de mídia, ou pesquisa de conteúdo.
[000247] Exemplo de modalidade numerado 73 é um método como descrito no exemplo de modalidade numerado 69, no qual no mínimo uma da uma ou mais representações reduzidas de velocidade de dados compreende no mínimo uma porção de metadados de estado oculta em um ou mais canais de comunicação seguros.
[000248] Exemplo de modalidade numerado 74 é um método como descrito no exemplo de modalidade numerado 69, ainda compreendendo alterar uma pluralidade de bytes nos dados de mídia para armazenar no mínimo uma porção de uma das uma ou mais representações reduzidas de velocidade de dados.
[000249] Exemplo de modalidade numerado 75 é um método como descrito no exemplo de modalidade numerado 69, no qual no mínimo um do primeiro dispositivo e do segundo dispositivo compreende um ou mais de codecs (ATSC) Advanced Television Systems Committee, codecs (MPEG) Moving Picture Experts Group, codecs (AC-3) Audio Codec 3, e codecs Enhanced AC-3.
[000250] Exemplo de modalidade numerado 76 é um método como descrito no exemplo de modalidade numerado 69, no qual a cadeia de processamento de mídia compreende uma unidade de pré- processamento configurada para aceitar amostras no domínio de tempo que compreendem o conteúdo de mídia como entrada e dar saída a amostras processadas em domínio de tempo; um codificador configurado para dar saída à corrente de bits de mídia comprimida do conteúdo de mídia com base nas amostras processadas em domínio de tempo; uma unidade de análise de sinal e correção de metadados configurada para configurada para validar metadados de estado de processamento na corrente de bits de mídia comprimida; um transcodificador configurado para modificar a corrente de bits de mídia comprimida; um decodificador configurado para dar saída a amostras decodificadas em domínio de tempo com base na corrente de bits de mídia comprimida; e uma unidade de pós-processamento configurada para realizar pós-processamento do conteúdo de mídia nas amostras de codificadas em domínio de tempo.
[000251] Exemplo de modalidade numerado 77 é um método como descrito no exemplo de modalidade numerado 76, no qual no mínimo um do primeiro dispositivo e do segundo dispositivo compreende uma ou mais da unidade de pré- processamento, da unidade de análise de sinal e correção de metadados, do transcodificador, do decodificador, e da unidade de pós-processamento.
[000252] Exemplo de modalidade numerado 78 é um método como descrito no exemplo de modalidade numerado 76, no qual no mínimo um da unidade de pré-processamento, da unidade de análise de sinal e correção de metadados, do transcodificador, do decodificador e da unidade de pós-processamento, realiza processamento adaptativo do conteúdo de mídia com base nos metadados de processamento recebidos a partir de um dispositivo a montante.
[000253] Exemplo de modalidade numerado 79 é um método como descrito no exemplo de modalidade numerado 69, ainda compreendendo fornecer para o segundo dispositivo, o estado dos dados de mídia como um ou mais de: (a) digitais de mídia, (b) metadados de estado de processamento, (c) valores de característica de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia (e) valores de probabilidade de classe e/ou/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000254] Exemplo de modalidade numerado 80 é um método que compreende: processar de maneira adaptativo com um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores, processadores de corrente, uma versão da entrada de dados de mídia com base em um histórico passado de processamento de volume de som dos dados de mídia, por meio de uma ou mais unidades de processamento de mídia a montante como indicado por um estado dos dados de mídia; normalizar volume de som e/ou faixa dinâmica de uma versão de saída dos dados de mídia em uma extremidade da cadeia de processamento de mídia para valores consistentes de volume de som e/ou faixa dinâmica.
[000255] Exemplo de modalidade numerado 81 é um método como descrito no exemplo de modalidade numerado 80, no qual o valor de volume de som consistente compreende um valor de volume de som de (1) controlado ou selecionado por um usuário, ou (2) sinalizado de maneira adaptativo por meio de um estado na versão de entrada dos dados de mídia.
[000256] Exemplo de modalidade numerado 82 é um método como descrito no exemplo de modalidade numerado 80, no qual o valor de volume de som é computado sobre as porções de diálogo (fala) dos dados de mídia.
[000257] Exemplo de modalidade numerado 83 é um método como descrito no exemplo de modalidade numerado 80, no qual o valor de volume de som é computado sobre as porções absoluta, relativa e/ou sem bloqueio dos dados de mídia.
[000258] Exemplo de modalidade numerado 84 é um método como descrito no exemplo de modalidade numerado 90, no qual o valor de faixa dinâmica consistente compreende um valor de faixa dinâmica de (1) controlado ou selecionado por um usuário, ou (2) sinalizado de maneira adaptativo por meio de um estado na versão de entrada dos dados de mídia.
[000259] Exemplo de modalidade numerado 85 é um método como descrito no exemplo de modalidade numerado 84, no qual o valor de faixa dinâmica é computado nas porções de diálogo (fala) dos dados de mídia.
[000260] Exemplo de modalidade numerado 86 é um método como descrito no exemplo de modalidade numerado 84, no qual o valor de faixa dinâmica é computado sobre porções absoluta, relativa, e/ou sem bloqueio dos dados de mídia.
[000261] Exemplo de modalidade numerado 87 é um método como descrito no exemplo de modalidade numerado 80, ainda compreendendo: computar um ou mais valores de controle de ganho de volume de som e/ou faixa dinâmica para normalizar a versão de saída dos dados de mídia para um valor de volume de som consistente e faixa dinâmica consistente e, de maneira simultânea, carregar o um ou mais valores de controle de ganho de volume de som e/ou faixa dinâmica dentro de um estado da versão de saída dos dados de mídia em uma extremidade da cadeia de processamento de mídia, no qual o um ou mais valores de controle de ganho de volume de som e/ou faixa dinâmica são utilizáveis por outro dispositivo para aplicar de maneira reversa o um ou mais valores de controle de ganho de volume de som e/ou faixa dinâmica para recuperar o valor de volume de som e uma faixa dinâmica original na versão de entrada dos dados de mídia.
[000262] Exemplo de modalidade numerado 88 é um método como descrito no exemplo de modalidade numerado 87, no qual o um ou mais de valores de controle de volume de som e/ou faixa dinâmica que representam o estado da versão de saída dos dados de mídia são carregados em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000263] Exemplo de modalidade numerado 89 é um método como descrito no exemplo de modalidade numerado 80, ainda compreendendo computar e transmitir, por meio de no mínimo um ou mais dispositivos de computação na cadeia de processamento de mídia, um valor aleatório criptográfico com base nos dados de mídia e/ou estado dos dados de mídia dentro de uma ou mais correntes de bits codificadas que carregam os dados de mídia.
[000264] Exemplo de modalidade numerado 90 é um método como descrito no exemplo de modalidade numerado 89, ainda compreendendo autenticar por meio de um dispositivo receptor o valor aleatório criptográfico; sinalizar por meio do dispositivo receptor para uma ou mais unidades de processamento de mídia uma determinação de se o estado de dados de mídia é válido; sinalizar por meio do dispositivo receptor para uma ou mais unidades de processamento de mídia a jusante o estado dos dados de mídia em resposta a determinar que o estado dos dados de mídia é válido.
[000265] Exemplo de modalidade numerado 91 é um método como descrito no exemplo de modalidade numerado 89, no qual o valor aleatório criptográfico que representa o estado da mídia e/ou dos dados de mídia é carregado em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000266] Exemplo de modalidade numerado 92 é um método como descrito no exemplo de modalidade numerado 80, no qual o estado de dado de mídia compreender um ou mais de: (a) digitais de mídia, (b) metadados de estado de processamento, (c) valores de característica de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia (e) valores de probabilidade de classe e/ou/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000267] Exemplo de modalidade numerado 93 é um método que compreende realizar um de inserir, extrair ou editar localizações de dados de mídia relacionados e não relacionado e/ou um estado de localizações de dados de mídia relacionados e não relacionados dentro de uma ou mais correntes de bits codificadas por meio de um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de formas de onda/áudio espacial, codificadores, decodificadores, transcodificadores, ou processadores de corrente.
[000268] Exemplo de modalidade numerado 94 é um método como descrito no exemplo de modalidade numerado 930, no qual uma ou mais localizações de dados de mídia relacionados ou não relacionados e/ou o estado de localizações de dados de mídia relacionados e não relacionados dentro de correntes de bits codificadas, são carregadas em no mínimo um de uma subcorrente, um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000269] Exemplo de modalidade numerado 95 é um método que compreende realizar um ou mais de inserir, extrair ou editar dados de mídia relacionados e não relacionados e/ou um estado de dados de mídia relacionados e não relacionados dentro de uma ou mais correntes de bits codificada, por meio de um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores, ou processadores de corrente.
[000270] Exemplo de modalidade numerado 96 é um método como descrito no exemplo de modalidade numerado 95, no qual o um ou mais dados de mídia relacionados e não relacionados e/ou o estado de dados de mídia relacionados e não relacionados dentro de correntes de bits codificadas são carregadas em no mínimo um de uma subcorrente um ou mais campos reservados, um campo add_bsi, um ou mais campos de dados auxiliares, ou um ou mais coeficientes de transformação.
[000271] Exemplo de modalidade numerado 97 é um método como descrito no exemplo de modalidade numerado 93, ainda compreendendo fornecer a partir de um dispositivo de processamento de mídia a montante para um dispositivo de processamento de mídia a jusante um estado dos dados de mídia como um ou mais de: (a) digitais de mídia, (b) metadados de estado de processamento, (c) valores de característica de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia (e) valores de probabilidade de classe e/ou/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000272] Exemplo de modalidade numerado 98 é um sistema de processamento de mídia configurado para computar e carregar valores aleatórios criptográficos com base em dados de mídia e/ou um estado dos dados de mídia dentro de uma ou mais correntes de bits decodificadas por meio de um ou mais dispositivos de computação em uma cadeia de processamento de mídia que compreende um ou mais de unidades psico-acústicas, transformadores, unidades de codificação de forma de onda/áudio espacial, codificadores, decodificadores, transcodificadores, ou processadores de corrente.
[000273] Exemplo de modalidade numerado 99 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 98, no qual o estado dos dados de mídia compreende um ou mais de (a) digitais de mídia, (b) metadados de estado de processamento, (c) valores de característica de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia (e) valores de probabilidade de classe e/ou/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000274] Exemplo de modalidade numerado 100 é um sistema de processamento de mídia configurado para processar de maneira adaptativo dados de mídia com base em um estado dos dados de mídia recebido a partir de um ou mais canais de comunicação seguros.
[000275] Exemplo de modalidade numerado 99 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 100, no qual o sistema de processamento de mídia compreende um ou mais nós de processamento e no qual os nós de processamento compreendem e sistemas de entrega de mídia, sistemas de distribuição de mídia e sistemas de transformação de mídia.
[000276] Exemplo de modalidade numerado 102 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 101, no qual o um ou mais canais de comunicação seguros compreendem no mínimo um canal de comunicação seguro através de dois ou mais de correntes de bits comprimida codificada e nós de processamento PCM.
[000277] Exemplo de modalidade numerado 103 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 101, no qual o um ou mais canais de comunicação seguros compreendem no mínimo um canal de comunicação seguro através de dois dispositivos de processamento de mídia separados.
[000278] Exemplo de modalidade numerado 104 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 101, no qual o um ou mais canais de comunicação seguros compreendem no mínimo um canal de comunicação seguro através de dois nós de processamento de mídia em um único dispositivo de processamento de mídia.
[000279] Exemplo de modalidade numerado 105 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 100, no qual o sistema de processamento de mídia é configurado para realizar operações de processamento de mídia autônomas independente de como os sistemas de processamento de mídia são ordenados em uma cadeia de processamento de mídia da qual o sistema de processamento de mídia é uma parte.
[000280] Exemplo de modalidade numerado 106 é um sistema de processamento de mídia como descrito no exemplo de modalidade numerado 100, no qual o estado dos dados de mídia compreende um ou mais de (a) digitais de mídia, (b) metadados de estado de processamento, (c) valores de característica de mídia extraída, (d) descrições e/ou valores de tipos ou subtipos de classe de mídia (e) valores de probabilidade de classe e/ou/ou subclasse de característica de mídia, (f) valor aleatório criptográfico ou (f) sinalização de processamento de mídia.
[000281] Exemplo de modalidade numerado 107 é um sistema de processamento de mídia configurado para realizar qualquer um dos métodos como descrito nos exemplos de modalidade numerados1-99;
[000282] Exemplo de modalidade numerado 108 é um aparelho que compreende um processador e configurado para realizar qualquer um dos métodos como descrito nos exemplos de modalidades numerados 1-99.
[000283] Exemplo de modalidade numerado 109 é um meio de armazenamento legível por computador que compreende instruções de software que quando executadas por um ou mais processadores provocam a realização de qualquer um dos métodos como descrito nos exemplos de modalidades numeradas 1- 99.
9. Equivalentes, extensões, alternativas e miscelânea
[000284] Na especificação que precede, modalidades possíveis da invenção foram descritas com referência a i números detalhes específicos que podem variar de implementação para implementação. Assim, o único e exclusivo indicador do que é a invenção, e é projetado pelos requerentes ser a invenção, é o conjunto de concretizações que surgem deste pedido, na forma específica na qual tais concretizações surgem, incluindo qualquer correção subsequente. Quaisquer definições expressamente descritas aqui para termos contidos em tais concretizações devem governar o significado de tais termos como utilizado nas concretizações. Daí, nenhuma limitação, elemento, propriedade, característica, vantagem ou atributo que não esteja descrito de maneira expressa em uma concretização, deveria limitar o escopo de tal concretização de qualquer maneira. A especificação e desenhos são, consequentemente, para ser observados em um sentido ilustrativo ao invés de um sentido restritivo.

Claims (14)

1. Método caracterizado pelo fato de que compreende as etapas de: determinar (910), por meio de um primeiro dispositivo em uma cadeia de processamento de mídia, se um tipo de processamento de mídia foi realizado em uma versão de saída de dados de mídia; em resposta a determinar (910), por meio do primeiro dispositivo, que o tipo de processamento de mídia foi realizado sobre uma versão de saída dos dados de mídia, realizar: criar, ou modificar, por meio do primeiro dispositivo, um estado dos dados de mídia, o estado especificando o tipo de processamento de mídia realizado na versão de saída dos dados de mídia, sinalizar digitalmente, pelo primeiro dispositivo, o estado dos dados de mídia com um valor de hash criptográfico; comunicar, a partir do primeiro dispositivo para um segundo dispositivo a jusante na cadeia de processamento de mídia, a versão de saída dos dados de mídia e o estado dos dados de mídia; validar, pelo segundo dispositivo, o estado dos dados de mídia com base no valor de hash criptográfico; desabilitar, pelo segundo dispositivo, a execução do tipo de processamento de mídia indicado pelo estado dos dados da mídia se o estado dos dados da mídia for considerado válido; e executar, pelo segundo dispositivo, o tipo de processamento de mídia indicado pelo estado dos dados de mídia se o estado dos dados de mídia for considerado inválido.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda fornecer, para o segundo dispositivo, o estado dos dados de mídia como um ou mais de: (a) impressões digitais de mídia; (b) metadados de estado de processamento; (c) valores de características de mídia extraída; (d) valores e/ou descrição(ões) de tipos ou subtipos de mídia; (e) valores de probabilidade de classe e/ou subclasse de característica de mídia, ou (f) sinalização de processamento de mídia.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que pelo menos uma parte do estado de dados de mídia compreende um ou mais canais de comunicação seguros ocultos nos dados de mídia, e em que os um ou mais canais de comunicação seguros devem ser autenticados por um dispositivo destinatário.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o estado dos dados de mídia é carregado: com a versão de saída dos dados de mídia em uma corrente de bits de mídia de saída; ou em uma corrente de bits de metadados auxiliar associada com uma corrente de bits de mídia separada que carrega a versão de saída dos dados de mídia.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o estado dos dados de mídia compreende um ou mais conjuntos de parâmetros que se relacionam ao tipo de processamento de mídia.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda realizar, por meio do primeiro dispositivo, o tipo de processamento de mídia.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o tipo de processamento de mídia foi realizado por um dispositivo a montante, relativo ao primeiro dispositivo, na cadeia de processamento de mídia; e que compreende ainda: receber, por meio do primeiro dispositivo, uma versão de entrada dos dados de mídia, em que a versão de entrada dos dados de mídia compreende qualquer estado dos dados de mídia que indica o tipo de processamento de mídia; e analisar a versão de entrada dos dados de mídia para determinar o tipo de processamento de mídia já realizado na versão de entrada dos dados de mídia.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: codificar intensidade e valores de faixa dinâmica no estado dos dados da mídia.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o tipo de processamento de mídia foi realizado anteriormente por um dispositivo a montante, em relação ao primeiro dispositivo, na cadeia de processamento de mídia; e que compreende ainda: receber, pelo primeiro dispositivo, um comando para substituir o tipo de processamento de mídia realizado anteriormente; realizar, pelo primeiro dispositivo, o tipo de processamento de mídia; e comunicar, a partir do primeiro dispositivo para um segundo dispositivo a jusante na cadeia de processamento de mídia, uma versão de saída dos dados de mídia e um estado dos dados de mídia que indica que o tipo de processamento de mídia já foi executado na versão de saída dos dados de mídia.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o estado dos dados de mídia compreende pelo menos uma parte de metadados de estado ocultos em um ou mais canais de comunicação seguros, ou compreende ainda alterar uma pluralidade de bytes nos dados de mídia para armazenar pelo menos uma parte do estado dos dados de mídia.
11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a cadeia de processamento de mídia compreende: uma unidade de pré-processamento configurada para aceitar amostras no domínio de tempo que compreendem conteúdo de mídia como entrada e para produzir amostras processadas no domínio de tempo; um codificador configurado para produzir corrente de bits de mídia compactada do conteúdo de mídia com base nas amostras processadas no domínio de tempo; uma unidade de análise de sinal e correção de metadados configurada para validar metadados de estado de processamento na corrente de bits da mídia compactada; um transcodificador configurado para modificar a corrente de bits da mídia compactada; um decodificador configurado para produzir amostras decodificadas no domínio de tempo com base na corrente de bits da mídia compactada; e uma unidade de pós-processamento configurada para executar pós-processamento do conteúdo da mídia nas amostras decodificadas no domínio de tempo.
12. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: determinar uma ou mais características de mídia a partir dos dados de mídia; e incluir uma descrição das uma ou mais características de mídia no estado dos dados de mídia.
13. Aparelho caracterizado pelo fato de que compreende um processador e configurado para executar o método conforme definido em qualquer uma das reivindicações 1 a 12.
14. Meio de armazenamento legível em computador caracterizado pelo fato de que compreende o método conforme definido em qualquer uma das reivindicações 1 a 12.
BR112013013353-8A 2010-12-03 2011-12-01 método, aparelho e meio de armazenamento legível em computador para processamento adaptativo com diversos nós de processamento de mídia BR112013013353B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US41974710P 2010-12-03 2010-12-03
US61/419,747 2010-12-03
US201161558286P 2011-11-10 2011-11-10
US61/558,286 2011-11-10
PCT/US2011/062828 WO2012075246A2 (en) 2010-12-03 2011-12-01 Adaptive processing with multiple media processing nodes

Publications (2)

Publication Number Publication Date
BR112013013353A2 BR112013013353A2 (pt) 2016-09-13
BR112013013353B1 true BR112013013353B1 (pt) 2021-05-04

Family

ID=45422359

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112013013353-8A BR112013013353B1 (pt) 2010-12-03 2011-12-01 método, aparelho e meio de armazenamento legível em computador para processamento adaptativo com diversos nós de processamento de mídia

Country Status (17)

Country Link
US (3) US9842596B2 (pt)
EP (2) EP2647006B1 (pt)
JP (8) JP5879362B2 (pt)
KR (10) KR20230023828A (pt)
CN (6) CN112002336A (pt)
AR (1) AR084086A1 (pt)
AU (1) AU2011336566A1 (pt)
BR (1) BR112013013353B1 (pt)
CA (3) CA2816889C (pt)
CL (1) CL2013001571A1 (pt)
IL (8) IL292856B2 (pt)
MX (4) MX359652B (pt)
MY (2) MY175099A (pt)
RU (3) RU2015132824A (pt)
SG (1) SG190164A1 (pt)
TW (8) TWI665659B (pt)
WO (1) WO2012075246A2 (pt)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI665659B (zh) * 2010-12-03 2019-07-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
WO2014124377A2 (en) 2013-02-11 2014-08-14 Dolby Laboratories Licensing Corporation Audio bitstreams with supplementary data and encoding and decoding of such bitstreams
US9311923B2 (en) 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
JP5416253B2 (ja) * 2012-06-27 2014-02-12 株式会社Nttドコモ 関連コンテンツ検索装置及び関連コンテンツ検索方法
MY176406A (en) 2012-08-10 2020-08-06 Fraunhofer Ges Forschung Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2717510B1 (en) * 2012-10-08 2015-05-13 Université de Genève Method for active content fingerprinting
US9411881B2 (en) * 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
ES2843744T3 (es) 2013-01-21 2021-07-20 Dolby Laboratories Licensing Corp Decodificación de trenes de bits de audio codificados con un contenedor de metadatos situado en un espacio de datos reservado
CN109036443B (zh) 2013-01-21 2023-08-18 杜比实验室特许公司 用于在不同回放设备之间优化响度和动态范围的系统和方法
CN107257234B (zh) * 2013-01-21 2020-09-15 杜比实验室特许公司 解码具有保留数据空间中的元数据容器的编码音频比特流
JP6242916B2 (ja) 2013-01-21 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータのトランスコード
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
CN109785851B (zh) 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9349378B2 (en) 2013-11-19 2016-05-24 Dolby Laboratories Licensing Corporation Haptic signal synthesis and transport in a bit stream
US9621963B2 (en) 2014-01-28 2017-04-11 Dolby Laboratories Licensing Corporation Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier
JP6676047B2 (ja) * 2014-10-10 2020-04-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 伝送に関知しない呈示ベースのプログラム・ラウドネス
US10021436B2 (en) * 2014-10-14 2018-07-10 Disney Enterprises, Inc. Storage of tags in video for carriage in real-time
US9414076B2 (en) * 2014-11-03 2016-08-09 Broadcom Corporation System architecture for distributed coding
US20160239508A1 (en) * 2015-02-12 2016-08-18 Harman International Industries, Incorporated Media content playback system and method
CN106454384B (zh) * 2015-08-04 2019-06-25 中国科学院深圳先进技术研究院 视频帧插入和帧删除检测方法
KR20180132032A (ko) * 2015-10-28 2018-12-11 디티에스, 인코포레이티드 객체 기반 오디오 신호 균형화
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset
WO2017152173A1 (en) * 2016-03-04 2017-09-08 Leidos, Inc. System and method for implementing adaptive pulse position modulation (appm) for improved optical communications performance
CN105828272A (zh) * 2016-04-28 2016-08-03 乐视控股(北京)有限公司 音频信号处理方法和装置
US10015612B2 (en) * 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
JP7086587B2 (ja) * 2017-02-24 2022-06-20 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 復号された画像データから画像データを再構成する方法および装置
US10354660B2 (en) * 2017-04-28 2019-07-16 Cisco Technology, Inc. Audio frame labeling to achieve unequal error protection for audio frames of unequal importance
US10877735B1 (en) * 2017-09-25 2020-12-29 Amazon Technologies, Inc. Automated generation of software applications using analysis of submitted content items
TWI639997B (zh) * 2017-09-28 2018-11-01 大仁科技大學 基於機率規則之對話理解方法
US10705805B1 (en) 2017-12-12 2020-07-07 Amazon Technologies, Inc. Application authoring using web-of-sheets data model
US11586603B1 (en) 2018-05-23 2023-02-21 Amazon Technologies, Inc. Index sheets for robust spreadsheet-based applications
US10348505B1 (en) * 2018-05-24 2019-07-09 DeepTruth, LLC Systems and techniques for validation of media data
JP7171772B2 (ja) 2018-06-28 2022-11-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的なストリーミング整列のためのフレーム変換
US10826606B1 (en) 2018-08-14 2020-11-03 Leidos, Inc. Quantum detection and tracking of pulsed optical signals
US20220059102A1 (en) * 2018-12-13 2022-02-24 Dolby Laboratories Licensing Corporation Methods, Apparatus and Systems for Dual-Ended Media Intelligence
US10733374B1 (en) * 2019-02-14 2020-08-04 Gideon Samid Live documentation (LiDo)
US11632598B2 (en) 2019-05-10 2023-04-18 Roku, Inc. Content-modification system with responsive transmission of reference fingerprint data feature
WO2020231827A1 (en) 2019-05-10 2020-11-19 The Nielsen Company (Us), Llc Content-modification system with responsive transmission of reference fingerprint data feature
TW202331547A (zh) 2019-05-10 2023-08-01 美商六科股份有限公司 用於檢測和回應於在先前檢測到的指紋匹配之後檢測到的指紋不匹配的方法、非暫時性電腦可讀儲存媒體及計算系統
JP7314398B2 (ja) * 2019-08-15 2023-07-25 ドルビー・インターナショナル・アーベー 変更オーディオビットストリームの生成及び処理のための方法及び装置
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
US20230162743A1 (en) * 2020-05-06 2023-05-25 Dolby Laboratories Licensing Corporation Audio watermark to indicate post-processing
CN112995425B (zh) * 2021-05-13 2021-09-07 北京百瑞互联技术有限公司 一种等响度混音方法及装置
WO2023196219A1 (en) * 2022-04-08 2023-10-12 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for user generated content capture and adaptive rendering

Family Cites Families (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2947685B2 (ja) * 1992-12-17 1999-09-13 シャープ株式会社 音声コーデック装置
US6611607B1 (en) * 1993-11-18 2003-08-26 Digimarc Corporation Integrating digital watermarks in multimedia content
US5949891A (en) * 1993-11-24 1999-09-07 Intel Corporation Filtering audio signals from a combined microphone/speaker earpiece
FI96650C (fi) * 1994-07-11 1996-07-25 Nokia Telecommunications Oy Menetelmä ja laitteisto puheen välittämiseksi tietoliikennejärjestelmässä
TW271524B (pt) * 1994-08-05 1996-03-01 Qualcomm Inc
US5903862A (en) * 1995-01-25 1999-05-11 Weaver, Jr.; Lindsay A. Method and apparatus for detection of tandem vocoding to modify vocoder filtering
US7224819B2 (en) * 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
US5625608A (en) * 1995-05-22 1997-04-29 Lucent Technologies Inc. Remote control device capable of downloading content information from an audio system
US7006661B2 (en) * 1995-07-27 2006-02-28 Digimarc Corp Digital watermarking systems and methods
US7711564B2 (en) * 1995-07-27 2010-05-04 Digimarc Corporation Connected audio and other media objects
JP3338042B2 (ja) * 1995-09-29 2002-10-28 松下電器産業株式会社 再生方法、再生装置、記録方法、記録装置、光ディスク
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
PT1603244E (pt) * 1996-11-07 2007-11-23 Koninkl Philips Electronics Nv Transmissão de um sinal em modo binário
US6959220B1 (en) * 1997-11-07 2005-10-25 Microsoft Corporation Digital audio signal filtering mechanism and method
US6807632B1 (en) 1999-01-21 2004-10-19 Emc Corporation Content addressable information encapsulation, representation, and transfer
CA2265089C (en) 1998-03-10 2007-07-10 Sony Corporation Transcoding system using encoding history information
CN1065400C (zh) * 1998-09-01 2001-05-02 国家科学技术委员会高技术研究发展中心 兼容ac-3和mpeg-2的音频编解码器
US7055034B1 (en) * 1998-09-25 2006-05-30 Digimarc Corporation Method and apparatus for robust embedded data
WO2000054453A1 (en) * 1999-03-10 2000-09-14 Digimarc Corporation Signal processing methods, devices, and applications for digital rights management
JP4785168B2 (ja) * 2000-01-13 2011-10-05 ディジマーク コーポレイション メタデータの認証および媒体信号の透かしへのメタデータの埋込
US20020032502A1 (en) * 2000-05-05 2002-03-14 Russell J. Chris Integrated media production security method and system
US7206775B2 (en) * 2000-07-06 2007-04-17 Microsoft Corporation System and methods for the automatic transmission of new, high affinity media
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US7853664B1 (en) * 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
US6983466B2 (en) * 2000-12-06 2006-01-03 Microsoft Corporation Multimedia project processing systems and multimedia project processing matrix systems
KR100587517B1 (ko) * 2001-11-14 2006-06-08 마쯔시다덴기산교 가부시키가이샤 오디오 부호화 및 복호화
EP1318611A1 (en) * 2001-12-06 2003-06-11 Deutsche Thomson-Brandt Gmbh Method for retrieving a sensitive criterion for quantized spectra detection
KR20040067849A (ko) * 2001-12-07 2004-07-30 마쯔시다덴기산교 가부시키가이샤 매체 콘텐츠 분배 시스템과 방법
AUPR960601A0 (en) 2001-12-18 2002-01-24 Canon Kabushiki Kaisha Image protection
US8150937B2 (en) * 2004-10-25 2012-04-03 Apple Inc. Wireless synchronization between media player and host device
WO2003091870A1 (en) 2002-04-26 2003-11-06 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal
US7072477B1 (en) * 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
RU2005120236A (ru) * 2002-11-28 2006-01-20 Конинклейке Филипс Электроникс Н.В. (Nl) Кодирование аудиосигнала
US7444336B2 (en) 2002-12-11 2008-10-28 Broadcom Corporation Portable media processing unit in a media exchange network
WO2004090886A1 (en) * 2003-04-08 2004-10-21 Koninklijke Philips Electronics N.V. Fragile audio watermark related to a buried data channel
US20040267778A1 (en) * 2003-06-27 2004-12-30 Microsoft Corporation Media foundation topology application programming interface
US7509255B2 (en) * 2003-10-03 2009-03-24 Victor Company Of Japan, Limited Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof
US7516232B2 (en) 2003-10-10 2009-04-07 Microsoft Corporation Media organization for distributed sending of media data
US7315822B2 (en) * 2003-10-20 2008-01-01 Microsoft Corp. System and method for a media codec employing a reversible transform obtained via matrix lifting
US7412380B1 (en) 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
US7653265B2 (en) 2004-01-16 2010-01-26 Nvidia Corporation Video image processing with utility processing stage
US20060013077A1 (en) * 2004-02-11 2006-01-19 Mesarovic Vladimir Z Audio-video systems with application specific modules and common processing software architecture
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US8131134B2 (en) * 2004-04-14 2012-03-06 Microsoft Corporation Digital media universal elementary stream
US8688248B2 (en) * 2004-04-19 2014-04-01 Shazam Investments Limited Method and system for content sampling and identification
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US8135136B2 (en) 2004-09-06 2012-03-13 Koninklijke Philips Electronics N.V. Audio signal enhancement
BRPI0518278B1 (pt) 2004-10-26 2018-04-24 Dolby Laboratories Licensing Corporation Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio
JP2008527583A (ja) * 2005-01-04 2008-07-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 再生可能データの処理装置及び方法
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
MX2007011286A (es) * 2005-03-14 2007-11-15 Nielsen Media Res Inc Aparatos y metodos de codificacion de dominios comprimidos para su utilizacion con senales de medios.
TWI397903B (zh) * 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
WO2006110975A1 (en) * 2005-04-22 2006-10-26 Logovision Wireless Inc. Multimedia system for mobile client platforms
US7634727B2 (en) * 2005-04-26 2009-12-15 Microsoft Corporation System for abstracting audio-video codecs
US20060259781A1 (en) 2005-04-29 2006-11-16 Sony Corporation/Sony Electronics Inc. Method and apparatus for detecting the falsification of metadata
CN101171636B (zh) * 2005-05-02 2014-05-14 松下电器产业株式会社 编创装置
JP2009504026A (ja) * 2005-07-27 2009-01-29 ダグ カーソン アンド アソシエーツ,インク. デジタルコンテンツに関連付けられた検証用来歴データ
US8280944B2 (en) * 2005-10-20 2012-10-02 The Trustees Of Columbia University In The City Of New York Methods, media and systems for managing a distributed application running in a plurality of digital processing devices
KR100803206B1 (ko) 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US7877752B2 (en) * 2005-12-14 2011-01-25 Broadcom Corp. Method and system for efficient audio scheduling for dual-decode digital signal processor (DSP)
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
FR2899408B1 (fr) * 2006-03-29 2008-07-18 Airbus France Sas Procedes d'emission et de reception de donnees, en particulier pour des echanges securises entre un aeronef et une base au sol, dispositifs associes et aeronef equipe de tels dispositifs
CN101484936B (zh) * 2006-03-29 2012-02-15 皇家飞利浦电子股份有限公司 音频解码
JP4981123B2 (ja) 2006-04-04 2012-07-18 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US20070299657A1 (en) 2006-06-21 2007-12-27 Kang George S Method and apparatus for monitoring multichannel voice transmissions
US20080007649A1 (en) 2006-06-23 2008-01-10 Broadcom Corporation, A California Corporation Adaptive video processing using sub-frame metadata
KR100781528B1 (ko) * 2006-06-29 2007-12-03 삼성전자주식회사 무결성을 보장하는 비디오 스트림을 제공하는 장치 및 그방법
JP5205373B2 (ja) * 2006-06-30 2013-06-05 フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ
US7940989B2 (en) * 2006-06-30 2011-05-10 New Jersey Institute Of Technology Apparatus and method for a generalized benford's law analysis of DCT and JPEG coefficients
CN101502089B (zh) * 2006-07-28 2013-07-03 西门子企业通讯有限责任两合公司 进行音频会议的方法、音频会议装置和编码器之间的切换方法
CN100489964C (zh) * 2006-08-18 2009-05-20 广州广晟数码技术有限公司 音频解码
BRPI0716854B1 (pt) * 2006-09-18 2020-09-15 Koninklijke Philips N.V. Codificador para codificar objetos de áudio, decodificador para decodificar objetos de áudio, centro distribuidor de teleconferência, e método para decodificar sinais de áudio
US7725311B2 (en) * 2006-09-28 2010-05-25 Ericsson Ab Method and apparatus for rate reduction of coded voice traffic
US20080080722A1 (en) * 2006-09-29 2008-04-03 Carroll Tim J Loudness controller with remote and local control
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
JP2008197199A (ja) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd オーディオ符号化装置及びオーディオ復号化装置
JP2009032070A (ja) * 2007-07-27 2009-02-12 Hitachi Software Eng Co Ltd 認証システム及び認証方法
US9866785B2 (en) * 2007-08-15 2018-01-09 Advanced Micro Devices, Inc. Automatic reduction of video display device power consumption
US8532306B2 (en) 2007-09-06 2013-09-10 Lg Electronics Inc. Method and an apparatus of decoding an audio signal
US20090079842A1 (en) * 2007-09-26 2009-03-26 Honeywell International, Inc. System and method for image processing
EP2235932A4 (en) 2007-12-20 2013-01-23 Ati Technologies Ulc METHOD, DEVICE AND MACHINE-READABLE MEDIUM FOR DESCRIPTING VIDEO PROCESSING
CN101527829B (zh) * 2008-03-07 2011-07-20 华为技术有限公司 视频数据处理方法及装置
JP4596044B2 (ja) * 2008-06-03 2010-12-08 ソニー株式会社 情報処理システム、情報処理方法
US8793498B2 (en) * 2008-08-11 2014-07-29 Nbcuniversal Media, Llc System and method for forensic analysis of media works
JP5603339B2 (ja) * 2008-10-29 2014-10-08 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
US8429287B2 (en) * 2009-04-29 2013-04-23 Rangecast Technologies, Llc Network audio distribution system and method
US8489774B2 (en) * 2009-05-27 2013-07-16 Spot411 Technologies, Inc. Synchronized delivery of interactive content
US8914137B2 (en) 2009-06-19 2014-12-16 Dolby Laboratories Licensing Corporation Upgradeable engine framework for audio and video
JP4894896B2 (ja) * 2009-07-29 2012-03-14 株式会社Jvcケンウッド 音声信号処理装置及び音声信号処理方法
US8594392B2 (en) * 2009-11-18 2013-11-26 Yahoo! Inc. Media identification system for efficient matching of media items having common content
CN102131023A (zh) * 2010-01-12 2011-07-20 株式会社东芝 图像形成装置以及图像形成处理方法
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
JP2011186187A (ja) * 2010-03-09 2011-09-22 Jvc Kenwood Holdings Inc 音声処理装置、音声処理方法および音声処理プログラム
US8812498B2 (en) * 2010-09-28 2014-08-19 Apple Inc. Methods and systems for providing podcast content
US8661170B2 (en) * 2010-11-23 2014-02-25 Olympus Corporation Nondestructive testing system
TWI665659B (zh) * 2010-12-03 2019-07-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法

Also Published As

Publication number Publication date
JP2016136256A (ja) 2016-07-28
TWI759223B (zh) 2022-03-21
CN112002336A (zh) 2020-11-27
BR112013013353A2 (pt) 2016-09-13
TWI665659B (zh) 2019-07-11
KR102383651B1 (ko) 2022-04-08
KR101895199B1 (ko) 2018-09-07
JP5879362B2 (ja) 2016-03-08
TWI716169B (zh) 2021-01-11
EP2647006A1 (en) 2013-10-09
IL282781B (en) 2022-06-01
IL298975A (en) 2023-02-01
AU2011336566A1 (en) 2013-05-30
TW202236263A (zh) 2022-09-16
SG190164A1 (en) 2013-07-31
IL304770A (en) 2023-09-01
KR20170113678A (ko) 2017-10-12
JP2023162414A (ja) 2023-11-08
CA3216692A1 (en) 2012-06-07
RU2015132824A (ru) 2018-12-24
RU2013130293A (ru) 2015-01-10
MX2019014282A (es) 2020-01-27
TW201735010A (zh) 2017-10-01
MY175099A (en) 2020-06-05
TW201928944A (zh) 2019-07-16
KR20220047394A (ko) 2022-04-15
KR20140106760A (ko) 2014-09-03
IL292856B1 (en) 2023-01-01
KR20190009850A (ko) 2019-01-29
JP6728456B2 (ja) 2020-07-22
JP2020013143A (ja) 2020-01-23
MY188206A (en) 2021-11-24
IL276179B (en) 2021-05-31
KR20130111601A (ko) 2013-10-10
IL282781A (en) 2021-06-30
IL226100A0 (en) 2013-06-27
CN105845145A (zh) 2016-08-10
MX370087B (es) 2019-11-29
KR102043609B1 (ko) 2019-11-12
CA2816889C (en) 2018-05-01
US20210280200A1 (en) 2021-09-09
KR20190127990A (ko) 2019-11-13
CN103392204B (zh) 2016-05-11
CA2816889A1 (en) 2012-06-07
KR101787363B1 (ko) 2017-11-15
IL298975B2 (en) 2024-01-01
IL253183A0 (en) 2017-08-31
JP7346617B2 (ja) 2023-09-19
KR20200106991A (ko) 2020-09-15
KR102497818B1 (ko) 2023-02-08
TW201236446A (en) 2012-09-01
US9842596B2 (en) 2017-12-12
CN111613233A (zh) 2020-09-01
KR20180100257A (ko) 2018-09-07
RU2568372C9 (ru) 2016-06-10
IL298975B1 (en) 2023-09-01
IL271502A (en) 2020-02-27
JP2014505898A (ja) 2014-03-06
JP7012786B2 (ja) 2022-01-28
TWI496461B (zh) 2015-08-11
JP2019152874A (ja) 2019-09-12
AR084086A1 (es) 2013-04-17
JP6530542B2 (ja) 2019-06-12
CN112002334A (zh) 2020-11-27
RU2019118805A (ru) 2020-12-18
IL271502B (en) 2020-08-31
JP2020170189A (ja) 2020-10-15
EP3627508A1 (en) 2020-03-25
KR101943295B1 (ko) 2019-04-17
RU2568372C2 (ru) 2015-11-20
IL276179A (en) 2020-09-30
US20180068666A1 (en) 2018-03-08
MX2013005898A (es) 2013-06-18
TWI733583B (zh) 2021-07-11
US20130246077A1 (en) 2013-09-19
KR102269529B1 (ko) 2021-06-29
TW202139181A (zh) 2021-10-16
TW202103145A (zh) 2021-01-16
CN105845145B (zh) 2020-08-25
CN103392204A (zh) 2013-11-13
JP2018163379A (ja) 2018-10-18
JP6581324B2 (ja) 2019-09-25
TWI581250B (zh) 2017-05-01
KR102155491B1 (ko) 2020-09-15
IL292856B2 (en) 2023-05-01
KR20230023828A (ko) 2023-02-17
JP6378703B2 (ja) 2018-08-22
CL2013001571A1 (es) 2013-10-11
WO2012075246A2 (en) 2012-06-07
TW202032537A (zh) 2020-09-01
KR20210081443A (ko) 2021-07-01
IL253183B (en) 2020-01-30
RU2695504C1 (ru) 2019-07-23
MX359652B (es) 2018-10-05
CA2998405C (en) 2023-12-05
CA2998405A1 (en) 2012-06-07
JP2022050646A (ja) 2022-03-30
TWI687918B (zh) 2020-03-11
KR101438386B1 (ko) 2014-09-05
IL226100A (en) 2017-07-31
MX338238B (es) 2016-04-08
CN112002335A (zh) 2020-11-27
IL292856A (en) 2022-07-01
EP2647006B1 (en) 2019-09-18
TW201543469A (zh) 2015-11-16
TWI800092B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
US20210280200A1 (en) Adaptive processing with multiple media processing nodes
AU2020200861B2 (en) Adaptive Processing with Multiple Media Processing Nodes
BR122020007952B1 (pt) Método de decodificação de áudio e dispositivo de decodificação de áudio
BR122020007965B1 (pt) Método de decodificação de áudio e sistema de decodificação de áudio

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 01/12/2011, OBSERVADAS AS CONDICOES LEGAIS.