BR102020025848A2 - Equipamento decodificador com dois links de áudio - Google Patents

Equipamento decodificador com dois links de áudio Download PDF

Info

Publication number
BR102020025848A2
BR102020025848A2 BR102020025848-6A BR102020025848A BR102020025848A2 BR 102020025848 A2 BR102020025848 A2 BR 102020025848A2 BR 102020025848 A BR102020025848 A BR 102020025848A BR 102020025848 A2 BR102020025848 A2 BR 102020025848A2
Authority
BR
Brazil
Prior art keywords
audio
equipment
video
link
latency
Prior art date
Application number
BR102020025848-6A
Other languages
English (en)
Inventor
Gabriel Bouvigne
Original Assignee
Sagemcom Broadband Sas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sagemcom Broadband Sas filed Critical Sagemcom Broadband Sas
Publication of BR102020025848A2 publication Critical patent/BR102020025848A2/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23611Insertion of stuffing data into a multiplex stream, e.g. to obtain a constant bitrate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video or multiplex stream to a specific local network, e.g. a IEEE 1394 or Bluetooth® network
    • H04N21/43637Adapting the video or multiplex stream to a specific local network, e.g. a IEEE 1394 or Bluetooth® network involving a wireless protocol, e.g. Bluetooth, RF or wireless LAN [IEEE 802.11]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4392Processing of audio elementary streams involving audio buffer management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

A presente invenção refere-se ao equipamento decodificador (11) que compreende:
  • - uma primeira saída adequada para conexão ao equipamento de reprodução de áudio (15);
  • - uma segunda saída adequada para conexão ao equipamento de reprodução de vídeo (13);
  • - meios de processamento configurados para usar um primeiro link de áudio (17) da primeira saída para entregar um primeiro sinal de áudio proveniente de um fluxo de áudio/vídeo recebido pelo equipamento decodificador, e para usar um segundo link de áudio (16) para entregar um segundo sinal de áudio associado a pelo menos um som gerado pelo equipamento decodificador da primeira saída ou da segunda saída, o som gerado pelo equipamento decodificador sendo distinto de um som proveniente do fluxo de áudio/vídeo de entrada, o primeiro link apresentando primeiras características que conferem uma primeira latência ao primeiro sinal de áudio, e o segundo link apresentando segundas características que conferem uma segunda latência, inferior à primeira latência, ao segundo sinal de áudio.

Description

EQUIPAMENTO DECODIFICADOR COM DOIS LINKS DE ÁUDIO Campo da Invenção
[0001] A invenção refere-se ao campo da reprodução de áudio/vídeo por meio de uma ou mais unidades de equipamento de reprodução.
Fundamentos da Invenção
[0002] Hoje em dia, nas modernas instalações multimídia domésticas, é muito frequente que equipamentos decodificadores, do tipo conexão à internet via TV (STB), sejam ligados tanto a aparelhos de reprodução de áudio/vídeo quanto a uma ou mais unidades de equipamento de reprodução de áudio que sejam distintos do equipamento de reprodução de áudio/vídeo, com a finalidade de melhorar a experiência de escuta do usuário durante a reprodução de conteúdo de áudio/vídeo.
[0003] Convencionalmente, o equipamento decodificador tenta minimizar a latência entre o instante no qual um fluxo de áudio/vídeo de entrada é recebido e o instante no qual um sinal de vídeo proveniente do dito fluxo de entrada é entregue ao equipamento de reprodução de áudio/vídeo.
[0004] Além disso, o equipamento decodificador também tenta minimizar a latência entre o instante no qual um usuário solicita uma ação em uma interface de navegação (tal como ir do canal N para o canal N + 1) e:
  • • o instante no qual a ação ocorre (por exemplo, mudança de canal), a fim de responder o mais rápido possível às solicitações do usuário;
  • • o instante no qual o retorno de som é emitido para que o usuário entenda que a solicitação de ação foi realmente levada em consideração (por exemplo, um bipe marcando a mudança de um canal para outro).
[0005] Esta função de retorno de som também é conhecida como “retorno auditivo” e, para ser útil, precisa ser executada rapidamente (ou seja, precisa estar associada à baixa latência). Especificamente, ela deve, por exemplo, permitir que um usuário com deficiência visual obtenha a confirmação de que uma solicitação de ação foi levada em consideração. Se a latência for muito alta, o usuário pensará, erroneamente, que a solicitação de ação (por exemplo, pressionar um botão de um controle remoto) não foi levada em consideração, e então corre o risco de repetir a solicitação (por exemplo, pressionando novamente um botão), tendo assim o efeito de levar à execução de uma ação adicional que é indesejada.
[0006] Além disso, presentes equipamentos adicionais de reprodução de áudio, tal como alto-falantes inteligentes, hoje em dia operam em grande parte por meio de um protocolo sem fio (Wi-Fi, Bluetooth, etc.), por isso é preferencial associar tais equipamentos a uma memória de armazenamento temporário de grande porte para ser o mais robusta possível contra potenciais distúrbios da conexão sem fio, distúrbios que podem ter uma variedade de origens (um distúrbio associado à ativação de um aparelho que interfere no sinal - por exemplo, um iniciador de neon -, transmissão de um sinal sem fio por meio de um rede diferente usando um canal próximo ao canal de transmissão do equipamento decodificador em consideração, etc.). Quanto maior for o tamanho da memória de armazenamento temporário, melhor será a sua robustez, mas também maior será a latência entre o instante no qual um fluxo de entrada de áudio/vídeo é recebido e o instante no qual o som é emitido pelo alto-falante.
[0007] Consequentemente, o uso de um alto-falante conectado a um equipamento decodificador por meio de um protocolo sem fio (Wi-Fi, Bluetooth, etc.), que também serve para fornecer retorno de som, leva a restrições de latência conflitantes entre ter uma memória de armazenamento temporário de grande tamanho e emitir retorno de som rapidamente.
[0008] De modo a atenuar esse problema, propostas foram feitas para ter latência para sinais de áudio que não seja muito alta (de modo a evitar retorno de som perturbador), embora ainda não seja muito baixa (de modo a conferir um grau de robustez à transmissão sem fio). O presente equipamento decodificador opera assim com uma latência média de cerca de 300 milissegundos (ms) que não é ideal para retorno de som ou para transmissão sem fio entre o equipamento decodificador e o alto-falante inteligente.
Objetivo da Invenção
[0009] Um objetivo da invenção é propor um equipamento decodificador que forneça a um alto-falante inteligente sem fio um melhor compromisso em termos de latência para retorno de som e para reprodução de som associado a um vídeo.
Sumário da Invenção
[0010] A fim de atingir este objetivo, a invenção fornece equipamento decodificador que compreende:
  • • uma primeira saída adequada para conectar a um equipamento de reprodução de áudio;
  • • uma segunda saída adequada para conectar a um equipamento de reprodução de vídeo;
  • • meios de processamento configurados para usar um primeiro link de áudio da primeira saída para entregar um primeiro sinal de áudio proveniente de um fluxo de áudio/vídeo recebido pelo equipamento decodificador, e para usar um segundo link de áudio para entregar um segundo sinal de áudio associado a pelo menos um som gerado pelo equipamento decodificador, o primeiro link apresentando primeiras características conferindo uma primeira latência ao primeiro sinal de áudio e o segundo link apresentando segundas características conferindo uma segunda latência, inferior à primeira latência, ao segundo sinal de áudio.
[0011] Assim, a invenção permite que a renderização de áudio seja dividida em duas partes: a primeira parte gerando som associado ao vídeo reproduzido pelo equipamento de reprodução de vídeo e a segunda parte criando retorno de som associado a pelo menos um som gerado pelo equipamento decodificador, cada parte sendo processada pelo equipamento decodificador, a fim de ser associado a sinais de áudio com latências diferentes. Como um resultado, a segunda parte pode estar associada a uma latência inferior à da primeira parte, permitindo assim que a função de “retorno de som” (também conhecida como “retorno auditivo”) seja melhor aplicada.
[0012] Pelo menos um som gerado pelo equipamento decodificador pode ser de várias origens diferentes e, por exemplo, pode ser gerado em resposta a um usuário solicitando uma ação por meio de uma interface de navegação (uma solicitação para mudar de canal, para executar um vídeo, …), ou em resposta à execução de um aplicativo do tipo de televisão interativa, ou mesmo para fornecer uma notificação (por exemplo, volume de som muito alto, tempo de exibição muito longo, etc.). De maneira geral, o retorno de som pode ser qualquer som gerado pelo equipamento decodificador.
[0013] Deve ser entendido que o som gerado pelo equipamento decodificador é gerado com a finalidade de fornecer retorno de som de forma a interagir com o usuário. O som gerado pelo equipamento decodificador deve assim ser distinguido do som proveniente do fluxo de áudio/vídeo de entrada, que pode potencialmente ser processado pelo equipamento decodificador, mas que não é criado pelo dito equipamento decodificador. O primeiro sinal de áudio e o segundo sinal de áudio transmitem, assim, informação de som de diferentes tipos.
[0014] Os meios de processamento permitem que a renderização de áudio que deve ser ouvida por um usuário seja dividida em duas partes: uma primeira parte gerando som associado ao vídeo sendo reproduzido pelo equipamento de reprodução de vídeo, e uma segunda parte criando retorno de som associado ao som gerado pelo equipamento decodificador, cada parte sendo processada pelo equipamento decodificador a fim de ser associada aos respectivos sinais de áudio tendo diferentes latências.
[0015] A primeira latência é definida por um intervalo de tempo entre o instante no qual os meios de processamento recebem o fluxo de áudio/vídeo de entrada e o instante no qual um som multimídia associado ao dito fluxo de áudio/vídeo de entrada é reproduzido pelo equipamento de reprodução de áudio, e a segunda latência é definida por um intervalo de tempo entre o instante no qual os meios de processamento recebem uma ordem para o equipamento decodificador gerar um som e o instante no qual o dito som é reproduzido pelo equipamento de reprodução de áudio ou pelo equipamento de reprodução de áudio/vídeo.
[0016] A ordem para gerar um som pode ser externa ao equipamento decodificador, por exemplo, pode ser uma solicitação de ação feita por um usuário por meio de uma interface de navegação (uma solicitação para mudar de canal, para executar um vídeo, etc.) e/ou pode ser interna ao equipamento decodificador, por exemplo, sendo gerada pelos próprios meios de processamento (por exemplo, ao executar um aplicativo do tipo de televisão interativa ou mesmo com o propósito de fornecer uma notificação (por exemplo, volume de som muito alto, tempo de visualização muito longo, etc.)).
[0017] Opcionalmente, o primeiro link de áudio e o segundo link de áudio são entregues através da mesma primeira saída.
[0018] Opcionalmente, o primeiro link de áudio é entregue por meio da primeira saída e o segundo link de áudio é entregue por meio da segunda saída.
[0019] Opcionalmente, ambos os links de áudio são configurados usando o mesmo protocolo.
[0020] Opcionalmente, ambos os links de áudio são configurados com os mesmos formatos de codificação/decodificação para os sinais transmitidos por eles.
[0021] Opcionalmente, a segunda latência é inferior a 50 ms.
[0022] Opcionalmente, a segunda latência é inferior a 30 ms.
[0023] Opcionalmente, o equipamento é configurado de modo que o primeiro sinal de vídeo é dessincronizado em parte ou totalmente em relação ao segundo sinal de áudio.
[0024] Opcionalmente, o equipamento é configurado para exibir uma tela de transição durante um tempo para carregar um sinal de vídeo.
[0025] Opcionalmente, a tela de transição é uma imagem estática proveniente do sinal de vídeo.
[0026] A invenção também fornece equipamento de reprodução de áudio configurado para ser conectado por meio de um único canal de comunicação ao equipamento decodificador, conforme especificado acima, e para processar os sinais provenientes dos dois links de áudio transportados no dito canal de comunicação.
[0027] A invenção também fornece equipamento decodificador e equipamento de reprodução de áudio conforme especificado acima.
[0028] A invenção também fornece um método de gerenciamento de dois links de som, o método sendo executado por equipamento decodificador conforme especificado acima.
[0029] A invenção também fornece um programa de computador incluindo instruções para fazer com que o equipamento decodificador, conforme especificado acima, execute o método conforme especificado acima.
[0030] A invenção também fornece um meio de armazenamento legível por computador no qual o programa de computador especificado acima é armazenado.
[0031] Outras características e vantagens da invenção aparecem mediante a leitura da seguinte descrição de modalidades particulares não limitantes da invenção.
[0032] Breve Descrição dos Desenhos
[0033] A invenção pode ser melhor compreendida face à seguinte descrição dada com referência às figuras em anexo, nas quais:
[0034] A Figura 1 é um diagrama que mostra uma instalação compreendendo equipamento decodificador em uma primeira modalidade da invenção.
[0035] A Figura 2 é um fluxograma que mostra como a renderização de áudio é gerenciada na instalação mostrada na Figura 1.
[0036] A Figura 3 é um diagrama que mostra como a renderização de vídeo é separada pelo equipamento decodificador mostrado na Figura 1.
[0037] A Figura 4 mostra telas sucessivas no equipamento de reprodução de vídeo da instalação mostrada na Figura 1 enquanto um usuário está pulando de canal, e sem intervenção do equipamento decodificador.
[0038] A Figura 5 é uma imagem similar à da Figura 4, mas com intervenção do equipamento decodificador em uma primeira variante.
[0039] A Figura 6 é uma imagem similar à da Figura 5, mas com intervenção do equipamento decodificador em uma segunda variante.
[0040] A Figura 7 é uma imagem similar à da Figura 5, mas com intervenção do equipamento decodificador em uma terceira variante.
[0041] A Figura 8 é um diagrama de tempo que mostra as etapas principais realizadas na terceira variante para a qual as telas correspondentes são mostradas na Figura 7.
[0042] A Figura 9 é um diagrama que mostra uma instalação que compreende equipamento decodificador em uma segunda modalidade da invenção.
Descrição Detalhada da Invenção
[0043] Com referência à Figura 1, a instalação em uma primeira modalidade é uma instalação multimídia compreendendo equipamento decodificador 11 que está conectado, neste exemplo, tanto ao equipamento de reprodução de vídeo, especificamente tanto a uma unidade de equipamento de reprodução de áudio/vídeo 13, quanto a uma unidade de equipamento de reprodução de áudio 15. A unidade de equipamento de reprodução de áudio 15 não está incluída no equipamento decodificador 11: elas formam duas entidades distintas que estão em comunicação sem fio.
[0044] Neste exemplo, o equipamento decodificador 11 é um dispositivo de conexão à internet via TV, a unidade de equipamento de reprodução de áudio/vídeo 13 é um aparelho de televisão, e a unidade de equipamento de reprodução de áudio 15 é um alto-falante externo.
[0045] Em serviço, o equipamento decodificador 11 adquire um fluxo de multimídia de entrada a partir de uma interface de comunicação do equipamento decodificador 11, fluxo que pode ser proveniente de uma ou mais redes de transmissão. As redes de transmissão podem ser de qualquer tipo. Por exemplo, a rede de transmissão pode ser uma rede de televisão por satélite, com o equipamento decodificador 11 recebendo o fluxo de multimídia de entrada através de uma antena parabólica. Em uma variante, a rede de transmissão pode ser uma conexão de Internet, com o equipamento decodificador 11 recebendo o fluxo de multimídia de entrada através da dita conexão de Internet. Em outra variante, a rede de transmissão pode ser uma rede de televisão digital terrestre (DTT) ou uma rede de televisão a cabo. No geral, a rede de transmissão pode ser uma variedade de fontes: satélite, cabo, protocolo de Internet (IP), DTT, um fluxo de vídeo armazenado localmente ou em uma rede local (LAN), etc.
[0046] Em particular, o fluxo de multimídia de entrada recebido pelo equipamento decodificador 11 compreende tanto metadados quanto também um fluxo de áudio/vídeo de entrada tendo uma parte de áudio e uma parte de vídeo que são sincronizadas entre si.
[0047] O equipamento decodificador 11 inclui os meios de processamento que servem, entre outras coisas, para processar o fluxo de áudio/vídeo de entrada.
[0048] O equipamento de reprodução de áudio/vídeo 13 está conectado a uma saída de áudio/vídeo do equipamento decodificador 11. O equipamento de reprodução de áudio 15 é conectado a uma saída de áudio do equipamento decodificador 11. O termo “saída de áudio/vídeo” é usado para significar uma saída na qual o equipamento decodificador 11 aplica pelo menos um sinal de áudio/vídeo a fim de realizar a reprodução de áudio e vídeo através de (pelo menos) uma unidade de equipamento de reprodução de áudio/vídeo 13 (especificamente o aparelho de televisão). O termo “saída de áudio” é usado para significar uma saída na qual o equipamento decodificador 11 aplica pelo menos um sinal de áudio a fim de realizar a reprodução de áudio através de (pelo menos) uma unidade de equipamento de reprodução de áudio 15 (especificamente o alto-falante externo).
[0049] Nesta primeira modalidade, o equipamento decodificador 11 atua sobre uma única saída de áudio para fornecer um primeiro sinal de áudio por meio de um primeiro link de áudio 16 e também um segundo sinal de áudio por meio de um segundo link de áudio 17.
[0050] Consequentemente, de maneira correspondente, o equipamento de reprodução de áudio 15 inclui os meios de processamento específicos para o processamento do primeiro sinal de áudio e o segundo sinal de áudio entregues pelo equipamento decodificador 11, sinais que são ambos recebidos através de uma interface de comunicação do equipamento de reprodução de áudio 15.
[0051] Além disso, o equipamento decodificador 11 atua por meio de um único link de áudio/vídeo 14 para fornecer um sinal de áudio/vídeo para o equipamento de reprodução de áudio/vídeo 13.
[0052] O canal de comunicação 10 através do qual o link de áudio/vídeo passa entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13 pode ser com fio ou sem fio. Qualquer tipo de tecnologia pode ser usado para fazer este canal 10: óptica, rádio, etc. O canal 10 pode, portanto, ser de vários tipos “físicos” diferentes (por exemplo, interface multimídia de alta definição (HDMI), Toslink, RCA, etc.) e/ou pode usar vários protocolos de “computador” diferentes (por exemplo, Bluetooth, UPnP, Airplay, Chromecast, Wi-Fi, etc.).
[0053] O canal de comunicação 12 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15, através do qual o primeiro e o segundo link de áudio 16 e 17 passam, é sem fio. Qualquer tipo de tecnologia pode ser usado para fazer este canal 12: óptica, rádio, etc. O canal 12 pode, portanto, usar vários protocolos de “computador” diferentes (por exemplo, Bluetooth, UPnP, Airplay, Chromecast, Wi-Fi, etc.).
[0054] Assim, e de acordo com uma opção não limitante, o equipamento de reprodução de áudio/vídeo 13 é uma conexão HDMI (ou seja, o canal de comunicação 10 é um cabo HDMI) com o equipamento decodificador 11, e o equipamento de reprodução de áudio 15 é conectado ao equipamento decodificador 11 por uma rede local. A título de exemplo, a rede local pode ser uma rede sem fio do tipo Wi-Fi (ou seja, o canal de comunicação 12 é um link Wi-Fi). Em outra variante, a rede local inclui um roteador Wi-Fi, o equipamento decodificador 11 é conectado ao dito roteador WiFi por meio de uma conexão por fio do tipo Ethernet, e o roteador Wi-Fi é conectado ao equipamento de reprodução de áudio 15 por meio de uma conexão sem fio do tipo Wi-Fi.
[0055] Deve ser entendido, portanto, que na instalação, dois links de áudio diferentes 16 e 17 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15 passam ambos através do mesmo canal de comunicação 12. Assim, uma única unidade transceptora fornece dois links de áudio diferentes 16 e 17 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15. Assim, uma única unidade de equipamento de reprodução de áudio 15 serve para emitir som proveniente de dois links de áudio 16 e 17.
[0056] Com referência às Figuras 1 e 2, segue-se uma descrição de como o equipamento decodificador 11 opera.
[0057] Em termos de renderização de áudio, o equipamento decodificador 11 distingue entre duas partes:
  • • retorno de som associado a sons gerados pelo equipamento decodificador (por exemplo, seguindo uma solicitação de ação emitida pelo usuário através da interface de navegação 1);
  • • som multimídia para reproduzir o fluxo de áudio de entrada.
[0058] No presente exemplo, a interface de navegação 1 é um controle remoto, mas também poderia ser um ponteiro, um controle de jogos, etc. A título de exemplo, o retorno de som pode compreender emitir um bipe cada vez que o usuário pressiona um dos botões do controle remoto.
[0059] Em serviço, o equipamento decodificador 11 recebe 20 o fluxo de entrada de áudio/vídeo, que é então dividido 21 em um sinal de áudio e um sinal de vídeo. O sinal de vídeo é decodificado 22 e, em seguida, o sinal de “vídeo multimídia” correspondente é colocado na memória de armazenamento temporário 23 no equipamento decodificador 11. Em contraste, o sinal de áudio é decodificado 24 para fornecer um sinal de “som multimídia” e é então recodificado 25 e entregue 26 ao equipamento de reprodução de áudio 15 através do link sem fio antes de ser decodificado 27 novamente pelo dito equipamento de reprodução de áudio 15 e, em seguida, colocado na memória de armazenamento temporário 28 no equipamento de reprodução de áudio 15. A fim de garantir que o sinal de “vídeo multimídia” e o sinal de “som multimídia” estejam sincronizados, os dados de vídeo e áudio na memória de armazenamento temporário são emitidos simultaneamente em um determinado tempo de apresentação: o sinal de “vídeo multimídia” é entregue 29 ao equipamento de reprodução de áudio/vídeo 13 para ser exibido 30, e o sinal de “som multimídia” é reproduzido 31 pelo equipamento de reprodução de áudio 15.
[0060] Pode acontecer que o usuário pressione um botão da interface de navegação 1 para solicitar uma ação (por exemplo, mudar de canal). Um sinal de controle é então entregue 32 aos meios de processamento, que processam o dito sinal de modo a gerar 33 e codificar 34 um sinal de “retorno de som”. Este sinal é então entregue 35 ao equipamento de reprodução de áudio 15 através do link sem fio e é então decodificado 36 pelo dito equipamento de reprodução de áudio 15. O sinal de “retorno de som” é então misturado 37 com o sinal de “som multimídia” para que ambos sejam reproduzidos juntos pelo equipamento de reprodução de áudio 15.
[0061] O equipamento decodificador 11 é também configurado de modo que o sinal de “retorno de som” seja reproduzido com uma latência de “retorno de som” inferior à latência de “som multimídia” do sinal de “som multimídia”. Neste exemplo, a latência de retorno de som é definida pelo intervalo de tempo entre o instante no qual os meios de processamento recebem o sinal de controle a partir da interface de navegação e o instante no qual o retorno de som é reproduzido pelo equipamento de reprodução de áudio 15; enquanto a latência de som multimídia é definida pelo intervalo de tempo entre o instante no qual os meios de processamento recebem o fluxo de entrada e o instante no qual um som multimídia associado ao dito fluxo de entrada é reproduzido pelo equipamento de reprodução de áudio 15.
[0062] Os meios de processamento gerenciam o retorno de som de forma a ter um primeiro link de áudio 16 de baixa latência e, portanto, de qualidade limitada, sem qualquer potencial para retransmissão ou com pouco potencial para retransmissão. A título de exemplo, a latência de retorno de som pode ser inferior a 50 ms e é, de preferência, inferior a 30 ms.
[0063] Em contraste, os meios de processamento gerenciam a reprodução de som multimídia de forma a ter um segundo link de áudio 17 de qualidade que seja melhor (em termos de frequência de amostragem, dimensões do link, etc.) e para garantir uma melhor retransmissão fazendo uso de latência mais alta para o som multimídia. A título de exemplo, a latência para o som multimídia está na faixa de 100 ms a 2 segundos e, tipicamente, está na faixa de 500 ms a 1 s.
[0064] No entanto, deve ser entendido que a latência para retorno de som não pode ser menor do que as latências incompressíveis associadas à entrega de sinais entre as várias unidades de equipamento e com sinais de processamento dentro do equipamento de reprodução de áudio 15 e do equipamento de reprodução de áudio/vídeo 13.
[0065] Assim, a latência mínima de retorno de som “Low_audio_latency” é definida por:
Low_audio_latency = min [(video_signal_transmission_delay + video_display_delay), (audio_transmission_delay + audio_decoding_delay + low_latency_audio_buffer)] com:
  • • video_signal_transmission_delay: o atraso para enviar e receber um sinal de vídeo através do canal de comunicação 10 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13;
  • • video_display_delay: o atraso interno de exibição do equipamento de reprodução de áudio/vídeo 13;
  • • audio_transmission_delay: o atraso para enviar e receber um sinal de retorno de som através do primeiro link de áudio 16 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15;
  • • audio_decoding_delay: o atraso para decodificar o sinal de áudio pelo equipamento de reprodução de áudio 15;
  • • low_latency_audio_buffer: memória de armazenamento temporário de valor de latência predeterminado para o primeiro link de áudio 16;
(sendo entendido que em certas circunstâncias, alguns dos valores mencionados acima podem ser muito pequenos, ou mesmo quase zero, ou de fato zero).
[0066] A título de exemplo, “low_latency_audio_buffer” pode ter latência inferior a 30 ms, tipicamente inferior a 5 ms.
[0067] Da mesma maneira, a latência de som multimídia não pode ser inferior às latências incompressíveis associadas à entrega de sinais entre as várias unidades de equipamento e com sinais de processamento dentro do equipamento de reprodução de áudio 15 e do equipamento de reprodução de áudio/vídeo 13.
[0068] Assim, a latência de som multimídia mínima “High_audio_latency” é definida por:
High_audio_latency = min [(video_signal_transmission_delay + video_display_delay), (audio_transmission_delay + audio_decoding_delay + high_latency_audio_buffer)]
com
high_latency_audio_buffer: memória de armazenamento temporário de valor predeterminado para o segundo link de áudio 17;
(sendo entendido que em certas circunstâncias, alguns dos valores mencionados acima podem ser muito pequenos, ou mesmo quase zero, ou de fato zero).
[0069] A título de exemplo, o “high_latency_audio_buffer” pode ter latência na faixa de 0,5 s a vários segundos, de preferência na faixa de 0,5 s a 1,5 s, e por exemplo na faixa de 0,5 s a 1 s.
[0070] Sabendo-se que a latência “high_latency_audio_buffer” é maior que a latência “low_latency_audio_buffer”, Low_audio_latency é necessariamente estritamente menor do que High_audio_latency.
[0071] Dois links de áudio 16 e 17 que são, portanto, de fato obtidos têm latências diferentes ao passar pelo mesmo canal de comunicação 12.
[0072] Os sinais de áudio podem ser entregues através deste canal de comunicação comum 12 usando qualquer protocolo conhecido (protocolo de transferência de hipertexto (http); protocolo de transporte em tempo real/protocolo de streaming em tempo real (RTP/RTSP); protocolo de datagrama de usuário (UDP), etc.). No presente exemplo, o mesmo protocolo é usado para os links de áudio 16 e 17.
[0073] Naturalmente, é necessário distinguir entre as memórias de armazenamento temporário que permitem que os sinais de som multimídia sejam sincronizados com os sinais de vídeo multimídia (com base em um tempo de apresentação alvo), e as memórias de armazenamento temporário “low_latency_audio_buffer” e “high_latency_audio_buffer” (não mostradas em Figura 2, mas dispostas nos meios de processamento) que tornam possível que os sinais de retorno de som e os sinais de som multimídia tenham latências diferentes. Assim, o uso de memória de armazenamento temporário para sincronização de áudio/vídeo ocorre no equipamento de reprodução de áudio, ao passo que o uso de memória de armazenamento temporário associada à separação do retorno de som da renderização de multimídia ocorre nos meios de processamento.
[0074] Com referência à Figura 9, segue-se uma descrição de uma segunda modalidade. Esta segunda modalidade é idêntica à primeira modalidade, exceto que o equipamento de reprodução de áudio 15 reproduz apenas som multimídia. A título de exemplo, o retorno de som é assim reproduzido ou diretamente pelo equipamento de reprodução de áudio/vídeo 13 ou então por uma segunda unidade de equipamento de reprodução de áudio que é distinta da primeira unidade de equipamento de reprodução de áudio (por exemplo, um segundo alto-falante, diretamente pela interface de navegação, etc.). O primeiro link de áudio 16 pode ser de vários tipos “físicos” (por exemplo, HDMI, Toslink, RCA, Interface Digital Sony/Philips (S/PIDF), saída de áudio analógica, etc.) e/ou pode usar vários protocolos de “computador” diferentes (por exemplo, Bluetooth, UPnP, Airplay, Chromecast, Wi-Fi, etc.).
[0075] Esta segunda modalidade é descrita em mais detalhes abaixo.
[0076] A instalação na segunda modalidade é uma instalação multimídia compreendendo equipamento decodificador 11 que está conectado neste exemplo a um equipamento de reprodução de vídeo, especificamente tanto a uma unidade de equipamento de reprodução de áudio/vídeo 13, quanto também a uma unidade de equipamento de reprodução de áudio 15. A unidade de equipamento de reprodução de áudio 15 não está incluída no equipamento decodificador 11: eles formam duas entidades distintas que estão em comunicação sem fio.
[0077] Neste exemplo, o equipamento decodificador 11 é um dispositivo de conexão à internet via TV, a unidade de equipamento de reprodução de áudio/vídeo 13 é um aparelho de televisão, e a unidade de equipamento de reprodução de áudio 15 é um alto-falante externo.
[0078] Em serviço, o equipamento decodificador 11 adquire um fluxo de multimídia de entrada a partir de uma interface de comunicação do equipamento decodificador 11, fluxo que pode ser proveniente de uma ou mais redes de transmissão. As redes de transmissão podem ser de qualquer tipo. Por exemplo, a rede de transmissão pode ser uma rede de televisão por satélite, com o equipamento decodificador 11 recebendo o fluxo de multimídia de entrada através de uma antena parabólica. Em uma variante, a rede de transmissão pode ser uma conexão de Internet, com o equipamento decodificador 11 recebendo o fluxo de multimídia de entrada através da dita conexão de Internet. Em outra variante, a rede de transmissão pode ser uma rede DTT ou uma rede de televisão a cabo. No geral, a rede de transmissão pode ser uma variedade de fontes: satélite, cabo, IP, DTT, um fluxo de vídeo armazenado localmente, etc.
[0079] Em particular, o fluxo de multimídia de entrada recebido pelo equipamento decodificador 11 compreende tanto metadados quanto também um fluxo de áudio/vídeo de entrada tendo uma parte de áudio e uma parte de vídeo que são sincronizadas entre si.
[0080] O equipamento decodificador 11 inclui os meios de processamento que servem, entre outras coisas, para processar o fluxo de áudio/vídeo de entrada.
[0081] O equipamento de reprodução de áudio/vídeo 13 está conectado a uma saída de áudio/vídeo do equipamento decodificador 11. O equipamento de reprodução de áudio 15 é conectado a uma saída de áudio do equipamento decodificador 11. O termo “saída de áudio/vídeo” é usado para significar uma saída na qual o equipamento decodificador 11 aplica pelo menos um sinal de áudio/vídeo a fim de realizar a reprodução de áudio e vídeo através de (pelo menos) uma unidade de equipamento de reprodução de áudio/vídeo 13 (especificamente o aparelho de televisão). O termo “saída de áudio” é usado para significar uma saída na qual o equipamento decodificador 11 aplica pelo menos um sinal de áudio a fim de realizar a reprodução de áudio através de (pelo menos) uma unidade de equipamento de reprodução de áudio 15 (especificamente o alto-falante externo).
[0082] Nesta segunda modalidade, o equipamento decodificador 11 entrega um primeiro sinal de áudio sobre a saída de áudio por meio de um segundo link de áudio 17.
[0083] Consequentemente, de maneira correspondente, o equipamento de reprodução de áudio 15 inclui os meios de processamento específicos para processar o segundo sinal de áudio 17 que é recebido por meio de uma interface de comunicação do equipamento de reprodução de áudio 15.
[0084] Além disso, o equipamento decodificador 11 atua tanto através de um único link de áudio/vídeo 14 para fornecer um sinal de áudio/vídeo ao equipamento de reprodução de áudio/vídeo 13 quanto também através de um primeiro link de áudio 16 para fornecer um primeiro sinal de áudio ao mesmo.
[0085] O canal de comunicação 10 através do qual o link de áudio/vídeo 14 e também o primeiro link de áudio 16 passam entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13 pode ser com fio ou sem fio. Qualquer tipo de tecnologia pode ser usado para fornecer este canal: óptica, rádio, etc. O canal pode, portanto, ser de vários tipos “físicos” diferentes (por exemplo, HDMI, Toslink, RCA, etc.) e/ou pode usar vários protocolos de “computador” (por exemplo, Bluetooth, UPnP, Airplay, Chromecast, Wi-Fi, etc.).
[0086] O canal de comunicação 12 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15, através do qual o segundo link de áudio 17 passa, é sem fio. Qualquer tipo de tecnologia pode ser usado para fazer este canal 12: óptica, rádio, etc. O canal 12 pode, portanto, usar vários protocolos de “computador” diferentes (por exemplo, Bluetooth, UPnP, Airplay, Chromecast, Wi-Fi, etc.).
[0087] Assim, e de acordo com uma opção não limitante, o equipamento de reprodução de áudio/vídeo 13 é uma conexão HDMI (ou seja, o canal de comunicação 10 é um cabo HDMI) com o equipamento decodificador 11, e o equipamento de reprodução de áudio 15 é conectado ao equipamento decodificador 11 por uma rede local. A título de exemplo, a rede local pode ser uma rede sem fio do tipo Wi-Fi (ou seja, o canal de comunicação 12 é um link Wi-Fi). Em outra variante, a rede local inclui um roteador Wi-Fi, o equipamento decodificador 11 é conectado ao dito roteador WiFi por meio de uma conexão por fio do tipo Ethernet, e o roteador Wi-Fi é conectado ao equipamento de reprodução de áudio 15 por meio de uma conexão sem fio do tipo Wi-Fi.
[0088] Deve ser entendido, portanto, que na instalação, existem dois links de áudio 16 e 17 que são diferentes, um entre o equipamento decodificador 11 e o equipamento de reprodução de áudio 15 e o outro entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13. Além disso, existem dois links diferentes 14 e 16 (um de áudio e o outro de áudio/vídeo), ambos passando pelo mesmo canal de comunicação 10.
[0089] Existe assim uma instalação com apenas dois canais de comunicação 10 e 12, com dois links de áudio 16 e 17 com latências diferentes.
[0090] Segue-se uma descrição de como o equipamento decodificador 11 opera.
[0091] Em termos de renderização de áudio, o equipamento decodificador 11 distingue entre duas partes:
  • • o retorno de som associado a solicitações de ações feitas pelo usuário por meio de uma interface de navegação 1;
  • • som multimídia para reproduzir o fluxo de áudio de entrada.
[0092] No presente exemplo, a interface de navegação 1 é um controle remoto, mas também poderia ser um ponteiro, um comando de jogos, etc. A título de exemplo, o retorno de som pode compreender emitir um bipe cada vez que o usuário pressiona um dos botões do controle remoto.
[0093] Em serviço, o equipamento decodificador 11 recebe o fluxo de entrada de áudio/vídeo, que é então dividido em um sinal de áudio e um sinal de vídeo. O sinal de vídeo é decodificado e, em seguida, o sinal de “vídeo multimídia” correspondente é colocado na memória de armazenamento temporário no equipamento decodificador 11. Em contraste, o sinal de áudio é decodificado para fornecer um sinal de “som multimídia” e é então recodificado e entregue para o equipamento de reprodução de áudio 15 através do link sem fio antes de ser decodificado novamente pelo dito equipamento de reprodução de áudio 15 e, em seguida, colocado na memória de armazenamento temporário no equipamento de reprodução de áudio 15. A fim de garantir que o sinal de “vídeo multimídia” e o sinal de “som multimídia” estejam sincronizados, os dados de vídeo e áudio na memória de armazenamento temporário são emitidos simultaneamente em um determinado tempo de apresentação: o sinal de “vídeo multimídia” é entregue ao equipamento de reprodução de áudio/vídeo 13 para ser exibido, e o sinal de “som multimídia” é reproduzido pelo equipamento de reprodução de áudio 15.
[0094] Pode acontecer que o usuário pressiona um botão do controle remoto para solicitar uma ação (por exemplo, mudar de canal). Um sinal de controle é então entregue aos meios de processamento, que processam o dito sinal de modo a gerar um sinal de “retorno de som”. Este sinal é então entregue ao equipamento de reprodução de áudio 15 para ser reproduzido pelo equipamento de reprodução de áudio 15.
[0095] O equipamento decodificador 11 está também configurado de forma que o sinal de “retorno de som” é reproduzido com uma latência de “retorno de som” inferior à latência de “som multimídia” do sinal de “som multimídia”. Neste exemplo, a latência de retorno de som é definida pelo intervalo de tempo entre o instante no qual os meios de processamento recebem o sinal de controle a partir da interface de navegação 1 e o instante no qual o retorno de som é reproduzido pelo equipamento de reprodução de áudio/vídeo 13; enquanto a latência de som multimídia é definida pelo intervalo de tempo entre o instante no qual os meios de processamento recebem o fluxo de entrada e o instante no qual um som multimídia associado ao dito fluxo de entrada é reproduzido pelo equipamento de reprodução de áudio 15.
[0096] Os meios de processamento geram o retorno de som de maneira a ter um primeiro link de áudio 16 de baixa latência e, portanto, de qualidade limitada, sem qualquer potencial para retransmissão ou com pouco potencial para retransmissão. A título de exemplo, a latência de retorno de som pode ser inferior a 50 ms e é, de preferência, inferior a 30 ms.
[0097] Em contraste, os meios de processamento gerenciam a reprodução de som multimídia de modo a ter um segundo link de áudio 17 de qualidade que seja melhor (em termos de frequência de amostragem, dimensões do link, etc.) e para garantir uma melhor retransmissão fazendo uso de latência mais alta para som multimídia. A título de exemplo, a latência para som multimídia está na faixa de 100 ms a 2 s, e tipicamente está na faixa de 500 ms a 1 s.
[0098] No entanto, deve ser entendido que a latência para retorno de som não pode ser menor do que as latências incompressíveis associadas à entrega de sinais entre as várias unidades de equipamento e com sinais de processamento dentro do equipamento de reprodução de áudio 15 e do equipamento de reprodução de áudio/vídeo 13.
[0099] Assim, a latência de retorno de som mínima “Low_audio_latency” é definida por:
Low_audio_latency = min [(video_signal_transmission_delay + video_display_delay), (audio_transmission_delay + audio_decoding_delay + low_latency_audio_buffer)]
com:
  • • video_signal_transmission_delay: o atraso para enviar e receber um sinal de vídeo através do canal de comunicação 10 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13;
  • • video_display_delay: o atraso interno de exibição do equipamento de reprodução de áudio/vídeo 13;
  • • audio_transmission_delay: o atraso para enviar e receber um sinal de retorno de som através do primeiro link de áudio 16 entre o equipamento decodificador 11 e o equipamento de reprodução de áudio/vídeo 13;
  • • audio_decoding_delay: o atraso para decodificar o sinal de áudio pelo equipamento de reprodução de áudio/vídeo 13;
  • • low_latency_audio_buffer: memória de armazenamento temporário de valor de latência predeterminado para o primeiro link de áudio 16;
(sendo entendido que em certas circunstâncias, alguns dos valores mencionados acima podem ser muito pequenos, ou mesmo quase zero, ou de fato zero).
[0100] A título de exemplo, “low_latency_audio_buffer” pode ter latência inferior a 30 ms, tipicamente inferior a 5 ms.
[0101] Da mesma maneira, a latência de som multimídia não pode ser inferior às latências incompressíveis associadas à entrega de sinais entre as várias unidades de equipamento e com sinais de processamento dentro do equipamento de reprodução de áudio 15 e do equipamento de reprodução de áudio/vídeo 13.
[0102] Assim, a latência de som multimídia mínima “High_audio_latency” é definida por:
High_audio_latency = min [(video_signal_transmission_delay + video_display_delay), (audio_transmission_delay + audio_decoding_delay + high_latency_audio_buffer)]
  • • com high_latency_audio_buffer: memória de armazenamento temporário de valor de latência predeterminado para o segundo link de áudio 17;
(sendo entendido que em certas circunstâncias, alguns dos valores mencionados acima podem ser muito pequenos, ou mesmo quase zero, ou de fato zero).
[0103] A título de exemplo, “high_latency_audio_buffer” pode ter latência na faixa de 0,5 s a vários segundos, de preferência na faixa de 0,5 s a 1,5 s, e, por exemplo, na faixa de 0,5 s a 1 s.
[0104] Sabendo que a latência “high_latency_audio_buffer” é maior que a latência “low_latency_audio_buffer”, Low_audio_latency é necessariamente estritamente menor do que High_audio_latency.
[0105] Dois links de áudio 16 e 17 que são, portanto, de fato obtidos têm diferentes latências ao passar por diferentes canais de comunicação 10 e 12.
[0106] Naturalmente, é necessário distinguir entre as memórias de armazenamento temporário que permitem que os sinais de som multimídia sejam sincronizados com os sinais de vídeo multimídia (com base em um tempo de apresentação alvo), e as memórias de armazenamento temporário “low_latency_audio_buffer” e “high_latency_audio_buffer” que tornam isso possível para que os sinais de retorno de som e os sinais de som multimídia tenham latências diferentes. Assim, o uso de memória de armazenamento temporário para sincronização de áudio/vídeo ocorre no equipamento de reprodução de áudio 15, enquanto que o uso de memória de armazenamento temporário associada à separação de retorno de som da renderização de multimídia ocorre nos meios de processamento.
[0107] Duas modalidades distintas de uma instalação e em particular do equipamento decodificador 11 são assim descritas acima, mas ambas tornam possível fornecer uma primeira latência relativamente baixa para a função de “retorno auditivo” e também uma segunda latência mais alta garantindo melhor robustez para reproduzir o som multimídia, com isso sendo feito dividindo a renderização de som em duas partes.
[0108] Cada uma das modalidades descritas acima apresenta características específicas.
Primeira Modalidade
[0109] O equipamento de reprodução de áudio 15 precisa ser configurado para ser capaz de gerenciar o fato de que está associado ao equipamento decodificador 11 por meio de um único canal de comunicação 12 que transmite dois links de áudio distintos 16 e 17.
[0110] Em contraste, o usuário não se surpreende com a forma como o som é reproduzido.
Segunda Modalidade
[0111] O equipamento de reprodução de áudio 15 não tem necessidade de apresentar uma configuração particular. É assim possível usar qualquer equipamento de reprodução de áudio disponível comercialmente para executar a invenção.
[0112] Em contraste, o usuário pode se surpreender com a forma como o som é reproduzido, porque ele é reproduzido por outro equipamento que não o equipamento de reprodução de áudio 15 que está sendo usado para reproduzir o som multimídia.
[0113] Qualquer que seja a modalidade pretendida, o retorno de som também pode ser associado ao retorno visual. Assim, dependendo da ação solicitada pelo usuário através da interface de navegação 1, a informação correspondente será exibida pelo equipamento de reprodução de áudio/vídeo 13. Por exemplo, se o usuário solicitar uma mudança de canal, a informação que é exibida pode ser do seguinte tipo: nome do novo canal alvo, programa atualmente sendo transmitido no dito canal, etc.
[0114] Com referência à Figura 3, os meios de processamento são configurados para usar o canal de comunicação de áudio/vídeo 10 para entregar um único sinal de vídeo composto tanto de sinais de vídeo multimídia (provenientes do fluxo de áudio/vídeo de entrada) quanto também de sinais de retorno visual.
[0115] Através da instalação passam assim sinais de retorno visual sincronizados com os sinais de retorno de som e também sinais de vídeo multimídia sincronizados com os sinais de som multimídia. Consequentemente, por causa das diferentes latências para os sinais de som multimídia e para os sinais de retorno de som e por causa da sincronização de áudio/vídeo tanto para navegação quanto para o fluxo multimídia, os sinais de vídeo multimídia são reproduzidos com latência maior do que aqueles do retorno visual.
[0116] Assim, sem processamento adicional pelo equipamento decodificador 11, o retorno visual e o vídeo não serão sincronizados, e isso pode ser perturbador para o usuário.
[0117] Por exemplo, ao pular de canal, conforme mostrado na Figura 4, o vídeo levará mais tempo para passar de um canal para outro do que a informação apresentada pelo retorno visual (nome do canal, nome do programa que agora pode ser visualizado no dito canal, lista de canais destacando o número do canal solicitado, etc.).
[0118] Consequentemente, haverá um deslocamento entre o retorno visual e o vídeo, de modo que a informação que é apresentada não corresponde ao canal que está sendo exibido simultaneamente.
[0119] A fim de evitar um deslocamento entre o retorno visual e o vídeo multimídia, o equipamento decodificador 11 é configurado em uma primeira variante para atuar como mostrado na Figura 5.
[0120] Nesta primeira variante, os meios de processamento dessincronizam o sinal de vídeo de retorno visual do sinal de retorno de som a fim de sincronizá-lo com o sinal de vídeo multimídia.
[0121] Portanto, a latência para exibir elementos de retorno visual é a mesma que a latência para exibir o vídeo multimídia.
[0122] O equipamento espera assim até que o vídeo do canal solicitado esteja de fato sendo reproduzido pelo equipamento de reprodução de áudio/vídeo para exibir a informação correspondente simultaneamente. O canal que está sendo exibido é, portanto, correlacionado com a informação do canal que estão sendo exibido, limitando assim qualquer risco de confusão do usuário.
[0123] Também é possível dessincronizar o sinal de vídeo de retorno visual totalmente do sinal de retorno de som para sincronizá-lo com o sinal de vídeo multimídia, ou então dessincronizá-lo apenas em parte: sob tais circunstâncias, uma parte da informação será exibida simultaneamente com a renderização de som e uma parte será exibida apenas quando o vídeo correspondente também estiver sendo exibido.
[0124] Por exemplo, uma lista de canais destacando o número do canal solicitado 40 pode ser exibida em um lado da tela em sincronia com o sinal de retorno de som de modo que o usuário possa ver claramente que a ação solicitada foi de fato levada em consideração. Em contraste, outra informação 41, tal como o nome do canal, informação sobre o programa que está sendo transmitido pelo canal, etc. será exibida apenas quando o vídeo correspondente também estiver sendo exibido.
[0125] Em uma segunda variante mostrada na Figura 6, a fim de evitar o deslocamento entre o retorno visual e o vídeo multimídia, os meios de processamento conservam a sincronização entre o retorno de som e o retorno visual, enquanto exibem uma tela de transição 42 em vez do sinal de vídeo multimídia até que o usuário cesse para atuar na interface de navegação. Por exemplo, enquanto pulando de canal, a tela de transição 42 é exibida até que o usuário se estabeleça em um canal. É considerado que um canal foi estabelecido quando o intervalo de tempo ∆t que decorreu desde o sinal de controle mais recente não é menor do que “video_signal_transmission_delay + video_display_delay”.
[0126] Então, os meios de processamento iniciam o vídeo do canal correspondente.
[0127] A tela de transição 42 pode ser uma tela colorida, uma tela preta, uma tela com um logotipo (tal como o logotipo do canal), uma tela animada, etc. e em geral qualquer fundo de tela temporário.
[0128] Consequentemente, o usuário, portanto, tem acesso apenas à informação 43 fornecida pelo retorno visual, informação essa que não está mais em conflito com uma exibição de vídeo multimídia. Isso também limita qualquer risco de confusão do usuário.
[0129] As Figuras 7 e 8 mostram uma terceira variante para limitar o deslocamento entre o retorno visual e o vídeo multimídia.
[0130] Nesta terceira variante, os meios de processamento conservam a sincronização entre o retorno de som e o retorno visual, mas exibem uma imagem estática 44 a partir do sinal de vídeo multimídia até que o usuário pare de atuar na interface de navegação. Especificamente, o equipamento decodificador 11 já tem, de fato, acesso ao vídeo solicitado pelo usuário, mas é a alta latência desejada para renderização de som e vídeo multimídia que leva ao deslocamento entre o retorno visual e o vídeo multimídia. A fim de limitar a confusão do usuário, os meios de processamento podem, assim, exibir uma imagem estática 44 muito rapidamente se desejado (embora, no entanto, após a latência incompressível associada à decodificação de vídeo, ou seja, video_signal_transmission_delay + video_display_delay).
[0131] Por exemplo, enquanto pulando de canais, uma imagem estática 44 é exibida até que um canal seja estabelecido. Considera-se que um canal foi estabelecido quando o intervalo de tempo ∆t decorrido desde o sinal de controle mais recente não é menor do que “video_signal_transmission_delay + video_display_delay”.
[0132] Consequentemente, o utilizador tem assim acesso à informação 43 fornecida pelo retorno visual, informação essa que corresponde à imagem estática 44 exibida pelo equipamento de reprodução de áudio/vídeo 13. Isto também limita qualquer risco de confusão do usuário.
[0133] Naturalmente, a invenção não está limitada às modalidades descritas acima, e modalidades variantes podem ser fornecidas sem ir além do escopo da invenção.
[0134] Assim, embora descrito acima, o equipamento decodificador seja um dispositivo de conexão à internet via TV, o equipamento decodificador pode ser qualquer outro equipamento capaz de realizar decodificação de áudio/vídeo, tal como um decodificador de vídeo digital e, por exemplo, pode ser um console de jogos, um computador, uma TV inteligente, um tablet digital, um telefone celular, um decodificador de televisão digital, um dispositivo de conexão à internet via TV, ou um dongle HDMI, etc.
[0135] Embora o equipamento de reprodução de vídeo acima seja um equipamento de reprodução de áudio/vídeo, ele pode ser qualquer outro tipo de equipamento de reprodução de áudio/vídeo ou equipamento apenas para reprodução de vídeo. O equipamento pode, portanto, ser um aparelho de televisão, um projetor de vídeo, um tablet, um telefone celular, etc. O equipamento de reprodução de vídeo e o equipamento decodificador podem, assim, juntos formar uma única entidade.
[0136] Da mesma forma, embora descrito acima, o equipamento de reprodução de áudio esteja um alto-falante inteligente externo, ele pode ser qualquer outro equipamento que tenha um alto-falante, por exemplo, um aparelho de som, um sistema de áudio conectado a uma ponte de áudio/Wi-Fi, etc.
[0137] O número de unidades de equipamento de reprodução de vídeo e/ou de equipamento de reprodução de áudio (mais particularmente alto-falantes) e/ou de equipamento decodificador pode ser maior do que o mencionado acima.
[0138] O canal de comunicação entre o equipamento decodificador e o equipamento de reprodução de áudio pode ser diferente do descrito e, por exemplo, pode ser do tipo Bluetooth. Com um link Wi-Fi, o link pode ser do tipo dedicado ou do tipo infraestrutura.
[0139] Embora acima sejam usados protocolos idênticos para ambos os links de áudio, seria possível usar protocolos diferentes para cada um dos dois links de áudio. Por exemplo, seria possível usar um protocolo UDP para o link de retorno de som e um protocolo HTTP para o link de áudio/vídeo multimídia. Da mesma forma, seria possível usar formatos de codificação/decodificação de sinal idênticos ou diferentes para os dois links de áudio. Se o protocolo de transmissão e/ou o formato de codificação de áudio diferem entre os dois links de áudio, é possível que os valores audio_transmission_delay e audio_decoding_delay sejam diferentes de um link de áudio para outro. Por exemplo, um protocolo UDP/RTP pode ter menor latência do que um protocolo HTTP, a codificação de som PCM ou ADPCM pode ter menor latência de decodificação do que a codificação MPEG 4, AAC ou Opus, etc.
[0140] Embora como descrito acima haja sempre dois canais de comunicação para passar os três links (os dois links de áudio e o link de áudio/vídeo), com a segunda modalidade, é possível prever dois canais de comunicação entre o equipamento de reprodução de vídeo e o equipamento decodificador, respectivamente, para passar o primeiro link de áudio e o link de vídeo (link de áudio/vídeo) juntamente com apenas um canal de comunicação entre o equipamento de reprodução de áudio e o equipamento decodificador.
[0141] Além disso, embora as variantes acima para limitar o deslocamento entre o retorno visual e o vídeo multimídia sejam descritas com referência à mudança de canal, as variantes descritas acima podem naturalmente ser usadas para outros tipos de ação solicitada pelo usuário, por exemplo, quando solicitando a reprodução de vídeo (reprodução de vídeo sob demanda (VOD), reprodução de um fluxo de vídeo em rede, reprodução de uma gravação em um gravador de vídeo pessoal (PVR), etc.). Por exemplo, uma imagem estática obtida a partir da decodificação do vídeo pode ser apresentada rapidamente, antes de passar para o vídeo animado, uma vez que o atraso de latência do vídeo multimídia tenha sido atingido, ou então uma tela de transição poderia ser apresentada.
[0142] Além disso, embora como descrito acima, o retorno de som esteja associado a uma ação solicitada pelo usuário, o retorno de som gerado pelo equipamento decodificador pode ter alguma outra origem. Por exemplo, o retorno de som pode ser gerado no contexto de um aplicativo de televisão interativa ou com a finalidade de fornecer uma notificação (por exemplo, volume de som muito alto, tempo de visualização muito longo, etc.). De maneira geral, o retorno de som pode ser qualquer som gerado pelo equipamento decodificador.
[0143] Além disso, embora como descrito acima, o fluxo de áudio/vídeo de entrada seja proveniente do exterior e seja recebido pela interface de comunicação para ser processado diretamente pelo equipamento decodificador, o fluxo de áudio/vídeo de entrada poderia ter sido recebido anteriormente pela interface de comunicação e gravado localmente no equipamento decodificador. O equipamento decodificador, então, processaria subsequentemente o fluxo de áudio/vídeo de entrada que foi gravado localmente.
[0144] Embora como descrito acima, os meios de processamento sejam configurados para usar um único canal de comunicação de áudio/vídeo para entregar um único sinal de vídeo composto tanto de sinais de vídeo multimídia (provenientes do fluxo de áudio/vídeo de entrada) quanto também de sinais de retorno visual, os meios de processamento podem entregar dois tipos de sinal de vídeo através de um único canal de comunicação (os sinais de vídeo multimídia e os sinais de retorno visual): e seria então o equipamento de reprodução de áudio/vídeo que processaria ambos os tipos de sinal para gerar um único sinal de vídeo para exibição.

Claims (16)

  1. Equipamento decodificador (11), caracterizado pelo fato de que compreende:
    • - uma primeira saída adequada para conexão ao equipamento de reprodução de áudio (15);
    • - uma segunda saída adequada para conexão ao equipamento de reprodução de vídeo (13);
    • - meios de processamento configurados para usar um primeiro link de áudio (17) da primeira saída para entregar um primeiro sinal de áudio proveniente de um fluxo de áudio/vídeo recebido pelo equipamento decodificador, e para usar um segundo link de áudio (16) para entregar um segundo sinal de áudio associado a pelo menos um som gerado pelo equipamento decodificador da primeira saída ou da segunda saída, o som gerado pelo equipamento decodificador sendo distinto de um som proveniente do fluxo de áudio/vídeo de entrada, o primeiro link apresentando primeiras características que conferem uma primeira latência ao primeiro sinal de áudio, e o segundo link apresentando segundas características que conferem uma segunda latência, inferior à primeira latência, ao segundo sinal de áudio.
  2. Equipamento decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro link de áudio (17) e o segundo link de áudio (16) são transportados através da mesma primeira saída.
  3. Equipamento decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que a o segundo link de áudio (16) é transportado através da segunda saída.
  4. Equipamento decodificador, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que os dois links de áudio (16, 17) são configurados com protocolos diferentes.
  5. Equipamento decodificador, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que os dois links de áudio (16, 17) são configurados com diferentes formatos de codificação/decodificação para os sinais por eles transportados.
  6. Equipamento, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a segunda latência é inferior a 50 ms.
  7. Equipamento, de acordo com a reivindicação 6, caracterizado pelo fato de que a segunda latência é inferior a 30 ms.
  8. Equipamento, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que é configurado para gerar um sinal de vídeo associado a uma ação de solicitação do usuário.
  9. Equipamento, de acordo com a reivindicação 8, caracterizado pelo fato de que é configurado de modo que o primeiro sinal de vídeo é dessincronizado parcial ou totalmente em relação ao segundo sinal de áudio.
  10. Equipamento, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que é configurado para exibir uma tela de transição durante um tempo de carregamento de um sinal de vídeo.
  11. Equipamento, de acordo com a reivindicação 10, caracterizado pelo fato de que a tela de transição é uma imagem estática (44) proveniente do sinal de vídeo.
  12. Equipamento de reprodução de áudio, caracterizado pelo fato de que é configurado para ser conectado através de um único canal de comunicação ao equipamento decodificador como definido na reivindicação 2 e para processar os sinais provenientes dos dois links de áudio transportados no dito canal de comunicação.
  13. Instalação, caracterizada pelo fato de que compreende pelo menos equipamento decodificador como definido na reivindicação 2 e equipamento de reprodução de áudio como definido na reivindicação 12.
  14. Método de gerenciamento de dois links de som, caracterizado pelo fato de que é realizado pelo equipamento decodificador como definido em qualquer uma das reivindicações 1 a 11.
  15. Programa de computador, caracterizado pelo fato de que inclui instruções para fazer com que o equipamento decodificador como definido em qualquer uma das reivindicações 1 a 11 execute o método como definido na reivindicação 14.
  16. Meio de armazenamento legível por computador, caracterizado pelo fato de que o programa de computador como definido na reivindicação 15 é armazenado no mesmo.
BR102020025848-6A 2019-12-18 2020-12-17 Equipamento decodificador com dois links de áudio BR102020025848A2 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1914786 2019-12-18
FR1914786A FR3105686A1 (fr) 2019-12-18 2019-12-18 Equipement décodeur à double liaison audio

Publications (1)

Publication Number Publication Date
BR102020025848A2 true BR102020025848A2 (pt) 2021-06-29

Family

ID=71111469

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102020025848-6A BR102020025848A2 (pt) 2019-12-18 2020-12-17 Equipamento decodificador com dois links de áudio

Country Status (5)

Country Link
US (1) US20210195256A1 (pt)
EP (1) EP3840388B1 (pt)
CN (1) CN113077799A (pt)
BR (1) BR102020025848A2 (pt)
FR (1) FR3105686A1 (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3131161A1 (fr) * 2021-12-20 2023-06-23 Sagemcom Broadband Sas Dispositif et procédé pour la restitution audio-vidéo synchronisée.

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030106056A1 (en) * 2001-11-30 2003-06-05 Naimpally Saiprasad V. System and method for carriage of program-related information in vertical blanking interval (VBI) of video output signal of program guide-Equipped video equipment
JP2004328513A (ja) * 2003-04-25 2004-11-18 Pioneer Electronic Corp 音声データ処理装置、音声データ処理方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP4182437B2 (ja) * 2004-10-04 2008-11-19 ソニー株式会社 オーディオビデオ同期システム及びモニター装置
JP2008524904A (ja) * 2004-12-15 2008-07-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 遅延されたビデオとオーディオの同期
KR100789548B1 (ko) * 2005-04-15 2007-12-28 엘지전자 주식회사 티브이의 오디오 출력 동기화 장치 및 방법
WO2006118106A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. リップシンク補正装置及びリップシンク補正方法
US8094830B2 (en) * 2005-09-29 2012-01-10 Panasonic Corporation Video/sound output device and external speaker control device
JP4575324B2 (ja) * 2006-03-29 2010-11-04 株式会社東芝 Av装置及びその制御方法
EP2107825A1 (en) * 2008-03-31 2009-10-07 Phonic Ear A/S System for transmitting amplified audio signals to a user
US8443409B2 (en) * 2008-04-30 2013-05-14 Zeevee, Inc. System and method for channel selection for local broadcasting
JP5316189B2 (ja) * 2008-05-23 2013-10-16 ヤマハ株式会社 Avシステム
WO2010019140A1 (en) * 2008-08-13 2010-02-18 Hewlett-Packard Development Company, L.P. Audio/video system
JP2010282136A (ja) * 2009-06-08 2010-12-16 Toshiba Corp 映像表示制御装置、映像表示制御方法およびこの制御方法を用いる映像機器
JP5782705B2 (ja) * 2009-11-26 2015-09-24 三菱電機株式会社 デジタル放送受信装置及びその受信方法
US20120038827A1 (en) * 2010-08-11 2012-02-16 Charles Davis System and methods for dual view viewing with targeted sound projection
US8832743B2 (en) * 2012-03-15 2014-09-09 Echostar Technologies, Llc Managing remote distribution of content recorded at a television receiver
US9507500B2 (en) * 2012-10-05 2016-11-29 Tactual Labs Co. Hybrid systems and methods for low-latency user input processing and feedback
US9886980B2 (en) * 2014-05-05 2018-02-06 Lattice Semiconductor Corporation Method for synchronizing A/V streams
US9928844B2 (en) * 2015-10-30 2018-03-27 Intel Corporation Method and system of audio quality and latency adjustment for audio processing by using audio feedback
US10057648B1 (en) * 2017-05-08 2018-08-21 Sling Media Pvt Ltd. Modified channel surfing based on monitored viewing habits
US10123058B1 (en) * 2017-05-08 2018-11-06 DISH Technologies L.L.C. Systems and methods for facilitating seamless flow content splicing
US10262696B1 (en) * 2017-10-13 2019-04-16 ANI Technologies Private Limited Clock synchronization for playback of multimedia files
CN108012177A (zh) * 2017-12-01 2018-05-08 晨星半导体股份有限公司 音视频播放系统及应用于其上的音频数据的播放方法
US10681463B1 (en) * 2019-05-17 2020-06-09 Sonos, Inc. Wireless transmission to satellites for multichannel audio system
US11871069B2 (en) * 2019-07-26 2024-01-09 Lg Electronics Inc. Multimedia service providing device and multimedia service providing method
US11122321B1 (en) * 2020-04-06 2021-09-14 International Business Machines Corporation Stream synchronization using an automated digital clapperboard

Also Published As

Publication number Publication date
EP3840388B1 (fr) 2023-06-14
US20210195256A1 (en) 2021-06-24
EP3840388A1 (fr) 2021-06-23
CN113077799A (zh) 2021-07-06
FR3105686A1 (fr) 2021-06-25

Similar Documents

Publication Publication Date Title
JP6509116B2 (ja) オーディオ転送デバイス及び対応する方法
KR101326739B1 (ko) 정보처리 시스템 및 정보처리 장치
US11606596B2 (en) Methods, systems, and media for synchronizing audio and video content on multiple media devices
EP3188180B1 (en) Enhancing an audio recording
US20140118468A1 (en) Method and system for adapting a television for multimedia conferencing
JP2019135828A (ja) ビデオストリームからのビデオフレームをディスプレイ及び対応する機器に伝送する方法
JP2016535351A (ja) 動画情報共有方法、装置、プログラム、及び記録媒体
WO2015139547A1 (zh) 一种设置应用场景的方法、设备和系统
JP2012119924A (ja) 映像表示装置及び映像表示方法、音声再生装置及び音声再生方法、映像音声同期制御システム
JP2009200788A (ja) 受信装置
US11632642B2 (en) Immersive media with media device
JP2009027601A (ja) 表示システム
JP2007312140A (ja) 表示装置、録音再生装置、コンテンツ転送システム及び転送方法
BR102020025848A2 (pt) Equipamento decodificador com dois links de áudio
JP2017147594A (ja) オーディオ機器
JP2015188204A (ja) 情報処理装置、情報処理方法、およびそのプログラム
JP2013211767A (ja) 映像記録装置、映像再生装置、及び映像記録再生システム
US10999644B2 (en) Methods, systems, and media for presenting media content
JP2010028232A (ja) 通信制御装置および通信制御方法
WO2017140161A1 (zh) 音视频资源共享的方法、装置、系统及网络网关
WO2021049048A1 (ja) 映像提供システムおよびプログラム
JP2011160037A (ja) 音量調整方法及び音量調整装置
JP2018148294A (ja) 制御装置
US20220382535A1 (en) Consumer device firmware updating via hdmi
JP5127992B2 (ja) 映像処理装置及び映像処理方法、音声再生装置及び音声再生方法

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]