BR112023004363A2 - Processamento de áudio parametricamente codificado - Google Patents

Processamento de áudio parametricamente codificado

Info

Publication number
BR112023004363A2
BR112023004363A2 BR112023004363A BR112023004363A BR112023004363A2 BR 112023004363 A2 BR112023004363 A2 BR 112023004363A2 BR 112023004363 A BR112023004363 A BR 112023004363A BR 112023004363 A BR112023004363 A BR 112023004363A BR 112023004363 A2 BR112023004363 A2 BR 112023004363A2
Authority
BR
Brazil
Prior art keywords
audio signal
input
output
parametricly
parametrically encoded
Prior art date
Application number
BR112023004363A
Other languages
English (en)
Inventor
Jeroen Breebaart Dirk
Eckert Michael
Purnhagen Heiko
Original Assignee
Dolby Laboratories Licensing Corp
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp, Dolby Int Ab filed Critical Dolby Laboratories Licensing Corp
Publication of BR112023004363A2 publication Critical patent/BR112023004363A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

PROCESSAMENTO DE ÁUDIO PARAMETRICAMENTE CODIFICADO. Trata-se de um método que compreende receber um primeiro fluxo de bits de entrada para um primeiro sinal de áudio de entrada parametricamente codificado, em que o primeiro fluxo de bits de entrada inclui dados que representam um primeiro sinal de áudio de núcleo de entrada e um primeiro conjunto incluindo pelo menos um parâmetro espacial relacionado ao primeiro sinal de áudio de entrada parametricamente codificado. Uma primeira matriz de covariância do primeiro sinal de áudio parametricamente codificado é determinada com base no parâmetro (ou parâmetros) espacial do primeiro conjunto. Um conjunto modificado incluindo pelo menos um parâmetro espacial é determinado com base na primeira matriz de covariância determinada, em que o conjunto modificado é diferente do primeiro conjunto. É determinado um sinal de áudio de núcleo de saída que tem como base ou é constituído pelo primeiro sinal de áudio de núcleo de entrada. Um fluxo de bits de saída para um sinal de áudio de saída parametricamente codificado é gerado, em que o fluxo de bits de saída inclui dados que representam o sinal de áudio de núcleo de saída e o conjunto modificado.
BR112023004363A 2020-09-09 2021-09-07 Processamento de áudio parametricamente codificado BR112023004363A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063075889P 2020-09-09 2020-09-09
EP20195258 2020-09-09
PCT/US2021/049285 WO2022055883A1 (en) 2020-09-09 2021-09-07 Processing parametrically coded audio

Publications (1)

Publication Number Publication Date
BR112023004363A2 true BR112023004363A2 (pt) 2023-04-04

Family

ID=77924537

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112023004363A BR112023004363A2 (pt) 2020-09-09 2021-09-07 Processamento de áudio parametricamente codificado

Country Status (11)

Country Link
US (1) US20230335142A1 (pt)
EP (1) EP4211682A1 (pt)
JP (1) JP2023541250A (pt)
KR (1) KR20230062836A (pt)
CN (1) CN116171474A (pt)
AU (1) AU2021341939A1 (pt)
BR (1) BR112023004363A2 (pt)
CA (1) CA3192886A1 (pt)
IL (1) IL300820A (pt)
MX (1) MX2023002593A (pt)
WO (1) WO2022055883A1 (pt)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9979829B2 (en) 2013-03-15 2018-05-22 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis

Also Published As

Publication number Publication date
WO2022055883A1 (en) 2022-03-17
KR20230062836A (ko) 2023-05-09
US20230335142A1 (en) 2023-10-19
EP4211682A1 (en) 2023-07-19
AU2021341939A1 (en) 2023-03-23
CA3192886A1 (en) 2022-03-17
IL300820A (en) 2023-04-01
MX2023002593A (es) 2023-03-16
CN116171474A (zh) 2023-05-26
JP2023541250A (ja) 2023-09-29

Similar Documents

Publication Publication Date Title
BR112022019083A2 (pt) Sintaxe de informações gerais de restrição em codificação de vídeo
CN102687198B (zh) 使用自适应混合变换的多声道音频编码比特流的解码
WO2005111850A3 (en) End-user application customization using rules
WO2001057653A3 (en) Apparatus for automatically generating source code
BR9914549A (pt) Aparelho e método para a construção de ferramentas de modelagem
BR112021025871A2 (pt) Método de processamento de dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador
BRPI0722425A2 (pt) Método para sintetizar um sinal de áudio binaural; decodificador de áudio paramétrico; produto para programa de computador, armazenado em meio legível por computador e operável em um dispositivo de processamento de dados, destinado a processar um sinal de áudio parametricamente codificado, compreendendo pelo menos um sinal combinado de diversoso canais de áudio, e um ou mais conjuntos correspondentes de informações auxiliares descrevendo uma imagem sonora de canal múltiplo; aparelho para sintetizar um sinal de áudio binaural
DE69814181D1 (de) Verfahren und vorrichtung zur konfiguration eines spracherkennungssystems
BR112023018522A2 (pt) Aprimoramento de fala baseado em contexto
BR112018070839A2 (pt) codificador de áudio e método para codificar um sinal de áudio
US20190129695A1 (en) Programming by voice
BR112022004668A2 (pt) Método de processamento de dados de vídeo, aparelho para processar dados de vídeo e meios de armazenamento e de gravação não transitórios legíveis por computador
CN103440236A (zh) 藏语句法和语义角色联合标注方法
BR112023004363A2 (pt) Processamento de áudio parametricamente codificado
Geuvers et al. Proof terms for generalized natural deduction
BRPI0413453A (pt) métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo
CN110879710B (zh) 一种rpg程序自动转成java程序的方法
CN117348854A (zh) 基于自然语言对话生成物联网控制流程的方法及装置
BRPI0406952A (pt) Quantificação de classe para o reconhecimento de fala distribuìda
Floccia et al. III: ANALYSES AND RESULTS FOR STUDY 1: ESTIMATING THE EFFECT OF LINGUISTIC DISTANCE ON VOCABULARY DEVELOPMENT.
Favrichon et al. Modelling the dynamics of a lowland mixed dipterocarp forest stand: application of a density-dependent matrix model
BR0204315A (pt) Processo para analisar sintaticamente uma corrente de bits, programa de computador, processo para gerar uma corrente de bits, esquema definindo um ou mais tipos de dados que podem possuir uma ou mais facetas, unidade de processamento, e, sistema de transmissão
Søgaard Using hyperlinks to improve multilingual partial parsers
Hedeland et al. The TEI-based ISO Standard ‘Transcription of spoken language’as an Exchange Format within CLARIN and beyond
Indig Less is more, more or less... Finding the optimal threshold for lexicalization in chunking