BR112021003158A2 - aparelho e método de processamento de áudio - Google Patents

aparelho e método de processamento de áudio Download PDF

Info

Publication number
BR112021003158A2
BR112021003158A2 BR112021003158-8A BR112021003158A BR112021003158A2 BR 112021003158 A2 BR112021003158 A2 BR 112021003158A2 BR 112021003158 A BR112021003158 A BR 112021003158A BR 112021003158 A2 BR112021003158 A2 BR 112021003158A2
Authority
BR
Brazil
Prior art keywords
hrtfs
target
hrtf
modification factor
sum
Prior art date
Application number
BR112021003158-8A
Other languages
English (en)
Inventor
Gavin KEARNEY
Cal Armstrong
Bin Wang
Zexin LIU
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of BR112021003158A2 publication Critical patent/BR112021003158A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

APARELHO E MÉTODO DE PROCESSAMENTO DE ÁUDIO. As modalidades deste pedido fornecem um método e aparelho de processamento de áudio. O método inclui: obter (101) M sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais; obter (102) M primeiras HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M sinais de áudio correspondem dos M alto-falantes virtuais para uma posição de ouvido esquerdo, e as M segundas HRTFs são HRTFs às quais os M sinais de áudio correspondem dos M alto-falantes virtuais para uma posição de ouvido direito; modificar (103) respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo; e obter (104), com base nas a primeiras HRTFs alvo, c primeiras HRTFs e os sinais de áudio M, um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo, e obter, com base nas d segundas HRTFs, as b segundas HRTFs alvo, e os M sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito. a + c = M e b + d = M. Nas modalidades deste pedido, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo é reduzida.

Description

APARELHO E MÉTODO DE PROCESSAMENTO DE ÁUDIO
[0001] Este pedido reivindica prioridade do Pedido de Patente Chinês nº 2018109500909, depositado no Escritório de Patentes Chinês em 20 de agosto de 2018 e intitulado "APARELHO E MÉTODO DE PROCESSAMENTO DE ÁUDIO", que é incorporado neste documento por referência em sua totalidade.
CAMPO TÉCNICO
[0002] Este pedido se refere a tecnologias de processamento de som e, em particular, a um método e aparelho de processamento de áudio.
ANTECEDENTES
[0003] Com o rápido desenvolvimento de computadores de alto desempenho e tecnologias de processamento de sinal, uma tecnologia de realidade virtual tem atraído atenção crescente. Um sistema de realidade virtual imersivo requer não apenas um efeito visual impressionante, mas também um efeito auditivo realista. A fusão audiovisual pode melhorar muito a experiência de realidade virtual. Um núcleo de áudio de realidade virtual é uma tecnologia de áudio tridimensional. Atualmente, há uma pluralidade de métodos de reprodução (por exemplo, um método baseado em vários canais e um método baseado em objeto) para implementar áudio tridimensional. No entanto, em um dispositivo de realidade virtual existente, a reprodução bineural com base em um fone de ouvido multicanal é mais comumente usada.
[0004] Um sinal estéreo renderizado no estado da técnica inclui um sinal de canal esquerdo (um sinal de áudio em relação à posição de ouvido esquerdo) e um sinal de canal direito (um sinal de áudio em relação à posição de ouvido direito). Tanto o sinal de canal esquerdo quanto o sinal de canal direito são obtidos pela sobreposição de uma pluralidade de sinais de áudio convolvidos que são obtidos por meio de convolução de sinais de áudio com HRTFs correspondendo a todas as posições, onde os sinais de áudio são processados por alto-falantes virtuais nas posições correspondentes. Existe diafonia entre o sinal de canal esquerdo e o sinal de canal direito obtido por meio deste método.
SUMÁRIO
[0005] As modalidades deste pedido fornecem um método e aparelho de processamento de áudio para reduzir a diafonia entre um sinal de canal esquerdo e um sinal de canal direito que são emitidos por uma extremidade de recepção de sinal de áudio.
[0006] De acordo com um primeiro aspecto, uma modalidade deste pedido fornece um método de processamento de áudio, incluindo: obter M primeiros sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais, onde M é um número inteiro positivo, e os M alto- falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio; obter M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto-
falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais; modificar respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar as respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo, onde 1 ≤ a ≤ M, 1 ≤ b ≤ M, e ambos a e b são inteiros; e obter, com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo atual, e obter, com base nas d segundas HRTFs, as b segundas HRTFs alvo, e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito atual, em que as c primeiras HRTFs são outras do que as a primeiras HRTFs nas M primeiras HRTFs, as d segundas HRTFs são outras do que as b segundas HRTFs HRTFs nas M segundas HRTFs, a + c = M, e b + d = M.
[0007] Nesta solução, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo é causada principalmente por bandas altas do primeiro sinal de áudio alvo e do segundo sinal de áudio alvo. Portanto, a modificação das respostas de impulso de banda alta das a primeiras HRTFs pode reduzir a interferência causada pelo primeiro sinal de áudio alvo obtido para o segundo sinal de áudio alvo. Da mesma forma, a modificação das respostas de impulso de banda alta das b segundas HRTFs pode reduzir a interferência causada pelo segundo sinal de áudio alvo para o primeiro sinal de áudio alvo. Isso reduz a diafonia entre o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo e o segundo sinal de áudio alvo correspondente à posição de ouvido direito.
[0008] Em um projeto possível, as correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs são pré-armazenadas, e a obtenção de M primeiras HRTFs inclui: obter M primeiras posições dos M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e nas correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs.
[0009] De acordo com este projeto, as M primeiras HRTFs são obtidas.
[0010] Em um projeto possível, as correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs são pré-armazenadas, e a obtenção de M segundas HRTFs inclui: obter M segundas posições dos M alto- falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e nas correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs.
[0011] De acordo com este projeto, as M segundas HRTFs são obtidas.
[0012] Em um projeto possível, a obtenção, com base em a primeiras HRTFs alvo, c primeiras HRTFs, e nos M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo atual inclui: convoluir cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs de a primeiras HRTFs alvo e as c primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos.
[0013] De acordo com este projeto, o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo atual, ou seja, um sinal de canal esquerdo, é obtido.
[0014] Em um projeto possível, a obtenção, com base em de segundas HRTFs, b segundas HRTFs alvo, e nos M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito atual inclui: convoluir cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs de d segundas HRTFs alvo e as b segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos M segundos sinais de áudio convolvidos.
[0015] De acordo com este projeto, o segundo sinal de áudio alvo correspondente à posição de ouvido direito atual, ou seja, um sinal de canal direito, é obtido.
[0016] Em um projeto possível, as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0017] Neste projeto possível, as respostas de impulso de banda alta de modificação de a primeiras HRTFs, para obter a primeiras HRTFs alvo, podem incluir as seguintes implementações possíveis.
[0018] Em uma primeira implementação, um primeiro fator de modificação e as respostas de impulso de banda alta incluídos nas a primeiras HRTFs são multiplicados, para obter as a primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1.
[0019] Nesta implementação, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto- falante virtual que está longe da posição de ouvido esquerdo atual é modificada usando o primeiro fator de modificação, onde o primeiro fator de modificação é menor que 1. Isto é equivalente que, o impacto no segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido esquerdo atual (em outras palavras, que está perto da posição de ouvido direito atual) é reduzido. Isso pode reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0020] Em uma segunda implementação, um primeiro fator de modificação e as respostas de impulso de banda alta incluídos nas a primeiras HRTFs são multiplicados, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1. Em seguida, um terceiro fator de modificação e cada resposta de impulso incluídos nas a terceiras HRTFs alvo são multiplicados, para obter as a primeiras HRTFs alvo, em que o terceiro fator de modificação é um valor maior do que 1.
[0021] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida. Além disso, pode ser assegurado ao máximo que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0022] Em uma terceira implementação, um primeiro fator de modificação e as respostas de impulso de banda alta incluídos nas a primeiras HRTFs são multiplicados, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1. Para uma terceira HRTF alvo, um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo são multiplicados, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo. O primeiro valor é a razão de uma primeira soma de quadrados para uma segunda soma de quadrados. A primeira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na terceira HRTF alvo.
[0023] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida. Além disso, pode ser assegurado que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0024] Em um projeto possível, as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0025] Neste projeto possível, as respostas de impulso de banda alta de modificação de b segundas HRTFs, para obter b segundas HRTFs alvo, podem incluir as seguintes diversas implementações possíveis.
[0026] Em uma primeira implementação, um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs são multiplicados, para obter as b segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0027] Nesta implementação, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto- falante virtual que está longe da posição de ouvido direito atual é modificada usando o segundo fator de modificação, onde o segundo fator de modificação é menor que 1. Isto é equivalente que, o impacto no primeiro sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido direito atual (em outras palavras, que está perto da posição de ouvido esquerdo atual) é reduzido. Isso pode reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0028] Em uma segunda implementação, um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs são multiplicados, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0029] Em seguida, um quarto fator de modificação e cada resposta de impulso incluídos nas b quartas HRTFs alvo são multiplicados, para obter as b segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior do que 1.
[0030] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida. Além disso, pode ser assegurado ao máximo que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0031] Em uma terceira implementação, um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs são multiplicados, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0032] Para uma quarta HRTF alvo, um segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo são multiplicados, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados. A terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na quarta HRTF alvo.
[0033] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida. Além disso, pode ser assegurado que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0034] Em um projeto possível, a = a1 + a2. As a1 primeiras HRTFs são as a1 primeiras HRTFs às quais correspondem a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo, e as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0035] Neste projeto possível, as respostas de impulso de banda alta de modificação de a primeiras HRTFs, para obter a primeiras HRTFs alvo, podem incluir as seguintes implementações possíveis.
[0036] Em uma primeira implementação possível, um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs são multiplicados, para obter a1 terceiras HRTFs alvo, e um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs são multiplicados, para obter a2 quintas HRTFs alvo. As a1 primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo.
[0037] Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0038] Nesta implementação, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto- falante virtual que está longe da posição de ouvido esquerdo atual é modificada usando o primeiro fator de modificação. Além disso, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto-falante virtual que está próximo à posição de ouvido esquerdo atual é modificada usando o quinto fator de modificação. O primeiro fator de modificação é inversamente proporcional ao quinto fator de modificação. Isto é equivalente que, o impacto no segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido esquerdo atual (em outras palavras, que está perto da posição de ouvido direito atual) é reduzido; e impacto no primeiro sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está perto da posição de ouvido esquerdo atual (em outras palavras, que está longe da posição de ouvido direito atual) é aprimorado. Isso pode ainda reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0039] Em uma segunda implementação possível, um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs são multiplicados, para obter a1 terceiras HRTFs alvo, e um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs são multiplicados, para obter a2 quintas HRTFs alvo. Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0040] Em seguida, um terceiro fator de modificação e cada resposta de impulso incluída nas a1 terceiras HRTFs alvo são multiplicados, para obter a1 sextas HRTFs alvo, e um sexto fator de modificação e cada resposta de impulso incluída nas a2 quintas HRTFs alvo são multiplicados, para obter a2 sétimas HRTFs alvo. As a primeiras HRTFs alvo incluem a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo. O terceiro fator de modificação é um valor maior que 1, e o sexto fator de modificação é um valor maior que 0 e menor que 1.
[0041] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser ainda reduzida. Além disso, pode ser assegurado ao máximo que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0042] Em uma terceira implementação possível, um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs são multiplicados, para obter a1 terceiras HRTFs alvo, e um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs são multiplicados, para obter a2 quintas HRTFs alvo. Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0043] Para uma terceira HRTF alvo, um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo são multiplicados, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo. O primeiro valor é a razão de uma primeira soma de quadrados para uma segunda soma de quadrados. A primeira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na terceira HRTF alvo. Para uma quinta HRTF alvo, um terceiro valor e todas as respostas de impulso incluídas na quinta HRTF alvo são multiplicados, para obter uma sétima HRTF alvo correspondente à uma quinta HRTF alvo. O terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados. A quinta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na quinta HRTF alvo. As a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0044] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser ainda reduzida. Além disso, pode ser assegurado que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0045] Em um projeto possível, b = b1 + b2. As b1 segundas HRTFs são b1 segundas HRTFs às quais b1 alto- falantes virtuais localizados no segundo lado do centro de alvo correspondem, e as b2 segundas HRTFs de são b2 segundas HRTFs às quais b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo corresponde. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0046] Neste projeto possível, as respostas de impulso de banda alta de modificação de b segundas HRTFs, para obter b segundas HRTFs alvo, incluem as seguintes diversas implementações possíveis.
[0047] Em uma primeira implementação, um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs são multiplicados, para obter b1 quartas HRTFs alvo, e um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs são multiplicado, para obter b2 oitavas HRTFs alvo. As b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo.
[0048] Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0049] Nesta implementação, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto- falante virtual que está longe do ouvido direito é modificada usando o segundo fator de modificação. Além disso, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto-falante virtual que está próximo ao ouvido direito é modificada usando o sétimo fator de modificação. O segundo fator de modificação é inversamente proporcional ao sétimo fator de modificação. Isto é equivalente que, o impacto no segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido direito atual (em outras palavras, que está perto da posição de ouvido esquerdo atual) é reduzido; e impacto no segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está perto da posição de ouvido direito atual (em outras palavras, que está longe da posição de ouvido esquerdo atual) é aprimorado. Isso pode ainda reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0050] Em uma segunda implementação, um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs são multiplicados, para obter b1 quartas HRTFs alvo, e um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs são multiplicado, para obter b2 oitavas HRTFs alvo. Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0051] Em seguida, um quarto fator de modificação e cada resposta de impulso incluída nas b1 quartas HRTFs alvo são multiplicados, para obter b1 nonas HRTFs alvo, e um oitavo fator de modificação e cada resposta de impulso incluída nas b2 oitavas HRTFs alvo são multiplicados, para obter b2 décimas HRTFs alvo. As b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo. O quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1.
[0052] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser ainda reduzida. Além disso, pode ser assegurado ao máximo que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0053] Em uma terceira implementação, um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs são multiplicados, para obter b1 quartas HRTFs alvo, e um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs são multiplicado, para obter b2 oitavas HRTFs alvo. Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0054] Para uma quarta HRTF alvo, um segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo são multiplicados, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo. O segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados. A terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na quarta HRTF alvo. Para uma oitava HRTF alvo, um quarto valor e todas as respostas de impulso incluídas na oitava HRTF alvo são multiplicados, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo. O quarto valor é uma razão de uma sétima soma de quadrados para uma oitava soma de quadrados. A sétima soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na oitava HRTF alvo. As b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo.
[0055] Nesta implementação, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser ainda reduzida. Além disso, pode ser assegurado que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0056] Em um projeto possível, o método inclui ainda: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, onde a primeira ordem de magnitude é uma ordem de magnitude de energia do terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, onde a segunda ordem de magnitude é uma ordem de magnitude de energia do quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0057] Neste projeto, a ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo, e a ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que a ordem de magnitude de energia do quarto sinal de áudio alvo.
[0058] De acordo com um segundo aspecto, uma modalidade deste pedido fornece um aparelho de processamento de áudio, incluindo: um módulo de processamento, configurado para obter M primeiros sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais, onde M é um número inteiro positivo, e os M alto-falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio; um módulo de obtenção, configurado para obter M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais; e um módulo de modificação, configurado para modificar respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar as respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo, onde 1 ≤ a ≤ M, 1 ≤ b ≤ M, e ambos a e b são inteiros; onde o módulo de obtenção é ainda configurado para: obter, com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e nos M primeiros sinais de áudio, um primeiro sinal de áudio alvo, correspondente à posição de ouvido esquerdo atual; e obter, com base em d segundas HRTFs, as b segundas HRTFs alvo e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondendo à posição de ouvido direito atual. As c primeiras HRTFs são HRTFs diferentes das a primeiras HRTFs nas M primeiras HRTFs, e as d segundas HRTFs são HRTFs diferentes das b segundas HRTFs nas M segundas HRTFs. a + c = M, e b + d = M.
[0059] Em um projeto possível, o módulo de obtenção é configurado especificamente para: obter M primeiras posições dos M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs, onde as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs.
[0060] Em um projeto possível, o módulo de obtenção é configurado especificamente para: obter M segundas posições dos M alto-falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e as correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs, onde as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs.
[0061] Em um projeto possível, o módulo de obtenção é configurado especificamente para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs das a primeiras HRTFs alvo e das c primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos.
[0062] Em um projeto possível, o módulo de obtenção é configurado especificamente para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as d segundas HRTFs e as b segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
[0063] Em um projeto possível, as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0064] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um primeiro fator de modificação e as respostas de impulso banda alta incluídas nas a primeiras HRTFs, para obter as a primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1.
[0065] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a terceiras HRTFs alvo, para obter a primeiras HRTFs alvo, onde o terceiro fator de modificação é um valor maior que 1; ou multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo.
[0066] Em um projeto possível, as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0067] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs, para obter as b segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0068] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluídos nas b quartas HRTFs alvo, para obter as b segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior do que 1; ou multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na uma quarta HRTF alvo, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo.
[0069] Em um projeto possível, a = a1 + a2. As a1 primeiras HRTFs são as a1 primeiras HRTFs às quais correspondem a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo, e as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0070] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um primeiro fator de modificação e resposta de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 HRTFs alvo, onde as a primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo.
[0071] Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0072] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a1 terceiras HRTFs alvo, para obter a1 sextas HRTFs alvo, e multiplicar um sexto fator de modificação e cada resposta de impulso incluída nas a2 quintas HRTFs alvo, para obter a2 sétimas HRTFs alvo, onde as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo, o terceiro fator de modificação é um valor maior do que 1, e o sexto fator de modificação é um valor maior do que 0 e menor do que 1; ou multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo; e para uma quinta HRTF alvo, multiplicar um terceiro valor e todas as respostas de impulso incluídas na uma quinta HRTF alvo, para obter uma sétima HRTF alvo correspondendo a uma quinta HRTF alvo, onde o terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma quinta HRTF alvo; e as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0073] Em um projeto possível, b = b1 + b2. As b1 segundas HRTFs são b1 segundas HRTFs às quais b1 alto- falantes virtuais localizados no segundo lado do centro de alvo correspondem, e as b2 segundas HRTFs de são b2 segundas HRTFs às quais b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo corresponde. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0074] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo.
[0075] Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0076] Em um projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluída nas b1 quartas HRTFs alvo, para obter b1 nonas HRTFs alvo, e multiplicar um oitavo fator de modificação e cada resposta de impulso incluída em b2 oitavas HRTFs alvo, para obter b2 décimas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo, o quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1;
ou multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma dos quadrados, a terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo à quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo; e para uma oitava HRTF alvo, multiplicar um quarto valor e todas as respostas de impulso incluídas na oitava HRTF alvo, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo, onde o quarto valor é uma razão de uma sétima soma dos quadrados para uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas no oitava HRTF alvo; e as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e b2 décimas HRTFs alvo.
[0077] Em um projeto possível, o aparelho inclui ainda um módulo de ajuste, configurado para: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, onde a primeira ordem de magnitude é uma ordem de magnitude de energia do terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, onde a segunda ordem de magnitude é uma ordem de magnitude de energia do quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0078] De acordo com um terceiro aspecto, uma modalidade deste pedido fornece um aparelho de processamento de áudio, incluindo um processador, onde o processador é configurado para: ser acoplado a uma memória, e ler e executar uma instrução na memória, para implementar o método de acordo com qualquer um dos projetos possíveis do primeiro aspecto.
[0079] Em um projeto possível, a memória é ainda incluída.
[0080] De acordo com um quarto aspecto, uma modalidade deste pedido fornece um meio de armazenamento legível. O meio de armazenamento legível armazena um programa de computador e, quando o programa de computador é executado, o método de acordo com qualquer um dos projetos possíveis do primeiro aspecto é implementado.
[0081] De acordo com um quinto aspecto, uma modalidade deste pedido fornece um produto de programa de computador. Quando o programa de computador é executado, o método de acordo com qualquer um dos projetos possíveis do primeiro aspecto é implementado.
[0082] Neste pedido, as respostas de impulso de banda alta das a primeiras HRTFs são modificadas, de modo que a interferência causada pelo primeiro sinal de áudio alvo obtido para o segundo sinal de áudio alvo pode ser reduzida. Além disso, as respostas de impulso de banda alta das b segundas HRTFs são modificadas, de modo que a interferência causada pelo segundo sinal de áudio alvo para o primeiro sinal de áudio alvo possa ser reduzida. Isso reduz a diafonia entre o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo e o segundo sinal de áudio alvo correspondente à posição de ouvido direito.
BREVE DESCRIÇÃO DOS DESENHOS
[0083] A Figura 1 é um diagrama estrutural esquemático de um sistema de sinal de áudio de acordo com uma modalidade deste pedido; A Figura 2 é um diagrama de uma arquitetura de sistema de acordo com uma modalidade deste pedido; A Figura 3 é um diagrama de blocos estrutural de um aparelho de recepção de sinal de áudio de acordo com uma modalidade deste pedido; A Figura 4 é um fluxograma 1 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 5 é um diagrama de um cenário de medição no qual uma HRTF é medida usando um centro de cabeça como um centro de acordo com uma modalidade deste pedido;
A Figura 6 é um diagrama esquemático da distribuição de M alto-falantes virtuais de acordo com uma modalidade deste pedido; A Figura 7 é um fluxograma 2 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 8 é um fluxograma 3 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 9 é um fluxograma 4 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 10 é um fluxograma 5 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 11 é um fluxograma 6 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 12 é um fluxograma 7 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 13 é um fluxograma 8 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 14 é um fluxograma 9 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 15 é um fluxograma 10 de um método de processamento de áudio de acordo com uma modalidade deste pedido;
A Figura 16 é um fluxograma 11 de um método de processamento de áudio de acordo com uma modalidade deste pedido; A Figura 17 é um diagrama estrutural esquemático 1 de um aparelho de processamento de áudio de acordo com uma modalidade deste pedido; e A Figura 18 é um diagrama estrutural esquemático 2 de um aparelho de processamento de áudio de acordo com uma modalidade deste pedido.
DESCRIÇÃO DAS MODALIDADES
[0100] Os termos técnicos relacionados neste pedido são explicados primeiro: Função de transferência relacionada à cabeça (Head Related Transfer Function, HRTF para abreviar): uma onda sonora enviada por uma fonte de som atinge dois ouvidos após ser espalhada pela cabeça, uma orelha, o tronco e semelhantes. Um processo físico de transmissão da onda sonora da fonte sonora para os dois ouvidos pode ser considerado como um sistema de filtragem acústica invariante no tempo linear, e as características do processo podem ser descritas usando a HRTF. Em outras palavras, a HRTF descreve o processo de transmissão da onda sonora da fonte sonora para os dois ouvidos. Uma explicação mais vívida é a seguinte: Se um sinal de áudio enviado pela fonte de som é X, e um sinal de áudio correspondente após o sinal de áudio X ser transmitido para uma posição predefinida é Y, X * Z = Y (convolução de X e Z é igual a Y), onde Z é a HRTF.
[0101] Nas modalidades, uma posição predefinida em correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs pode ser uma posição em relação a uma posição de ouvido esquerdo. Neste caso, a pluralidade de HRTFs é uma pluralidade de HRTFs centradas na posição de ouvido esquerdo. Alternativamente, nas modalidades, uma posição predefinida em correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs pode ser uma posição em relação a uma posição de ouvido direito. Neste caso, a pluralidade de HRTFs é uma pluralidade de HRTFs centradas na posição de ouvido direito. Alternativamente, nas modalidades, uma posição predefinida em correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs pode ser uma posição em relação a uma posição de centro de cabeça. Neste caso, a pluralidade de HRTFs é uma pluralidade de HRTFs centradas no centro de cabeça.
[0102] A Figura 1 é um diagrama estrutural esquemático de um sistema de sinal de áudio de acordo com uma modalidade deste pedido. O sistema de sinal de áudio inclui uma extremidade de transmissão de sinal de áudio 11 e uma extremidade de recepção de sinal de áudio 12.
[0103] A extremidade de transmissão de sinal de áudio 11 é configurada para coletar e codificar um sinal enviado por uma fonte de som, para obter um fluxo de bits codificado de sinal de áudio. Depois de obter o fluxo de bits codificado de sinal de áudio, a extremidade de recepção de sinal de áudio 12 decodifica o fluxo de bits codificado de sinal de áudio para obter um sinal de áudio decodificado; e então renderiza o sinal de áudio decodificado para obter um sinal de áudio renderizado.
[0104] Opcionalmente, a extremidade de transmissão de sinal de áudio 11 pode ser conectada à extremidade de recepção de sinal de áudio 12 de uma maneira com fio ou sem fio.
[0105] A Figura 2 é um diagrama de uma arquitetura de sistema de acordo com uma modalidade deste pedido. Como mostrado na Figura 2, a arquitetura do sistema inclui um terminal móvel 130 e um terminal móvel 140. O terminal móvel 130 pode ser uma extremidade de transmissão de sinal de áudio, e o terminal móvel 140 pode ser uma extremidade de recepção de sinal de áudio.
[0106] O terminal móvel 130 e o terminal móvel 140 podem ser dispositivos eletrônicos que são independentes um do outro e que têm uma capacidade de processamento de sinal de áudio. Por exemplo, o terminal móvel 130 e o terminal móvel 140 podem ser telefones móveis, dispositivos vestíveis, dispositivos de realidade virtual (virtual reality, VR), dispositivos de realidade aumentada (augmented reality, AR) ou semelhantes. O terminal móvel 130 está conectado ao terminal móvel 140 por meio de uma rede sem fio ou com fio.
[0107] Opcionalmente, o terminal móvel 130 pode incluir um componente de coleta 131, um componente de codificação 110, e um componente de codificação de canal 132. O componente de coleta 131 é conectado ao componente de codificação 110, e o componente de codificação 110 é conectado ao componente de codificação de canal 132.
[0108] Opcionalmente, o terminal móvel 140 pode incluir um componente de reprodução de áudio 141, um componente de decodificação e renderização 120, e um componente de decodificação de canal 142. O componente de reprodução de áudio 141 está conectado ao componente de decodificação e renderização 120, e o componente de decodificação e renderização 120 está conectado ao componente de decodificação de canal 142.
[0109] Depois de coletar um sinal de áudio através do componente de coleta 131, o terminal móvel 130 codifica o sinal de áudio através do componente de codificação 110, para obter um fluxo de bits codificado de sinal de áudio; e, em seguida, codifica o fluxo de bits codificado de sinal de áudio através do componente de codificação de canal 132, para obter um sinal de transmissão.
[0110] O terminal móvel 130 envia o sinal de transmissão para o terminal móvel 140 através da rede sem fio ou com fio.
[0111] Depois de receber o sinal de transmissão, o terminal móvel 140 decodifica o sinal de transmissão através do componente de decodificação de canal 142, para obter o fluxo de bits codificado de sinal de áudio; decodifica o fluxo de bits codificado de sinal de áudio por meio do componente de decodificação e renderização 120, para obter um sinal de áudio a ser processado, e renderiza o sinal de áudio a ser processado por meio do componente de decodificação e renderização 120, para obter um sinal de áudio renderizado; e reproduz o sinal de áudio renderizado por meio do componente de reprodução de áudio. Pode ser entendido que o terminal móvel 130 pode, alternativamente, incluir os componentes incluídos no terminal móvel 140, e o terminal móvel 140 pode, alternativamente, incluir os componentes incluídos no terminal móvel 130.
[0112] Além disso, o terminal móvel 140 pode incluir ainda um componente de reprodução de áudio, um componente de decodificação, um componente de renderização, e um componente de decodificação de canal. O componente de decodificação de canal é conectado ao componente de decodificação, o componente de decodificação é conectado ao componente de renderização, e o componente de renderização é conectado ao componente de reprodução de áudio. Neste caso, depois de receber o sinal de transmissão, o terminal móvel 140 decodifica o sinal de transmissão através do componente de decodificação de canal, para obter o fluxo de bits codificado de sinal de áudio; decodifica o fluxo de bits codificado de sinal de áudio por meio do componente de decodificação, para obter um sinal de áudio a ser processado, e renderiza o sinal de áudio a ser processado por meio do componente de renderização, para obter um sinal de áudio renderizado; e reproduz o sinal de áudio renderizado por meio do componente de reprodução de áudio.
[0113] A Figura 3 é um diagrama de blocos estrutural de um aparelho de recepção de sinal de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 3, um aparelho de recepção de sinal de áudio 20 nesta modalidade deste pedido pode incluir pelo menos um processador 21, uma memória 22, pelo menos um barramento de comunicações 23, um receptor 24, e um transmissor 25. O barramento de comunicação 203 é usado para conexão e comunicação entre o processador 21, a memória 22, o receptor 24 e o transmissor 25. O processador 21 pode incluir um componente de decodificação de sinal, um componente de decodificação, e um componente de renderização.
[0114] Especificamente, a memória 22 pode ser qualquer uma ou qualquer combinação das seguintes mídias de armazenamento: uma unidade de estado sólido (Solid State
Drives, SSD), um disco rígido mecânico, um disco magnético, um arranjo de disco magnético ou semelhante, e pode fornecer uma instrução e dados para o processador 21.
[0115] A memória 22 é configurada para armazenar pelo menos uma das seguintes correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs: (1) uma pluralidade de posições em relação a uma posição de ouvido esquerdo e HRTFs que estão centradas na posição de ouvido esquerdo e que correspondem às posições relativas à posição de ouvido esquerdo; (2) uma pluralidade de posições em relação a uma posição de ouvido direito e HRTFs que estão centralizadas na posição de ouvido direito e que correspondem às posições relativas à posição de ouvido direito; (3) uma pluralidade de posições em relação a um centro de cabeça e HRTFs que estão centradas no centro de cabeça e que correspondem às posições em relação ao centro de cabeça.
[0116] Opcionalmente, a memória 22 é ainda configurada para armazenar os seguintes elementos: um sistema operacional e um módulo de programa de aplicativo.
[0117] O sistema operacional pode incluir vários programas de sistema, e é configurado para implementar vários serviços básicos e processar uma tarefa baseada em hardware. O módulo de programa de aplicativo pode incluir vários programas de aplicativo, e é configurado para implementar vários serviços de aplicativo.
[0118] O processador 21 pode ser uma unidade central de processamento (CPU), um processador de uso geral, um processador de sinal digital (DSP), um circuito integrado específico de aplicação(ASIC), uma matriz de portas programáveis em campo (FPGA) ou outro dispositivo lógico programável, um dispositivo lógico de transistor, um componente de hardware ou qualquer combinação dos mesmos. O processador pode implementar ou executar vários exemplos de blocos lógicos, módulos e circuitos descritos com referência ao conteúdo divulgado neste pedido. Alternativamente, o processador pode ser uma combinação de processadores implementando uma função de computação, por exemplo, uma combinação de um ou mais microprocessadores, ou uma combinação de um DSP e um microprocessador. O processador de uso geral pode ser um microprocessador ou o processador pode ser qualquer processador convencional ou semelhante.
[0119] O receptor 24 é configurado para receber um sinal de áudio de um aparelho de envio de sinal de áudio.
[0120] O processador pode invocar um programa ou a instrução e os dados armazenados na memória 22, para realizar as seguintes etapas: realizar a decodificação de canal no sinal de áudio recebido para obter um fluxo de bits codificado de sinal de áudio (esta etapa pode ser implementada por um componente de decodificação de canal do processador); e decodificar ainda mais o fluxo de bits codificado de sinal de áudio (esta etapa pode ser implementada por um componente de decodificação do processador), para obter um sinal de áudio a ser processado.
[0121] Depois de obter o sinal a ser processado, o processador 21 é configurado para obter M primeiros sinais de áudio processando o sinal de áudio a ser processado por M alto-falantes virtuais, onde os M alto-falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio, e M é um número inteiro positivo;
obter M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais para a posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto- falantes virtuais para a posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais; modificar respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar as respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo, onde 1 ≤ a ≤ M, 1 ≤ b ≤ M, e ambos a e b são inteiros; e obter, com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo atual, e obter, com base nas d segundas HRTFs, as b segundas HRTFs alvo, e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito atual, em que as c primeiras HRTFs são outras do que as a primeiras HRTFs nas M primeiras HRTFs, as d segundas HRTFs são outras do que as b segundas HRTFs nas M segundas HRTFs, a + c = M, e b + d = M.
[0122] O processador 21 é especificamente configurado para: obter M primeiras posições dos M alto- falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e nas correspondências armazenadas na memória 22, que as M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs.
[0123] O processador 21 é especificamente configurado para: obter M segundas posições dos M alto- falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e nas correspondências armazenadas na memória 22, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs.
[0124] O processador 21 está ainda especificamente configurado para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs das a primeiras HRTFs alvo e das c primeiras HRTFs, para obter M primeiros sinais de áudio sujeitos a convolução; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos.
[0125] O processador 21 é ainda especificamente configurado para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as d segundas HRTFs e as b segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
[0126] Supõe-se que as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0127] Neste caso, o processador 21 é ainda configurada especificamente para multiplicar um primeiro fator de modificação e as respostas de impulso banda alta incluídas nas a primeiras HRTFs, para obter as a primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1.
[0128] O processador 21 está ainda especificamente configurado para: multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a terceiras HRTFs alvo, para obter a primeiras HRTFs alvo, onde o terceiro fator de modificação é um valor maior que 1.
[0129] O processador 21 está ainda especificamente configurado para: multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo.
[0130] Supõe-se que as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0131] Neste caso, o processador 21 é ainda configurada especificamente para multiplicar um segundo fator de modificação e as respostas de impulso banda alta incluídas nas b segundas HRTFs, para obter as b segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0132] O processador 21 está ainda especificamente configurado para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídas nas b segundas HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluídos nas b quartas HRTFs alvo, para obter as b segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior do que 1.
[0133] O processador 21 está ainda especificamente configurado para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídas nas b segundas HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na uma quarta HRTF alvo, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo.
[0134] Supõe-se que a = a1 + a2, as a1 primeiras HRTFs são a1 primeiras HRTFs às quais a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondem, as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0135] Neste caso, o processador 21 é ainda especificamente configurado para: multiplicar um primeiro fator de modificação e resposta de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2
HRTFs alvo, onde as a primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo.
[0136] Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0137] O processador 21 é ainda especificamente configurado para: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a1 terceiras HRTFs alvo, para obter a1 sextas HRTFs alvo, e multiplicar um sexto fator de modificação e cada resposta de impulso incluída nas a2 quintas HRTFs alvo, para obter a2 sétimas HRTFs alvo. As a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo, o terceiro fator de modificação é um valor maior do que 1, e o sexto fator de modificação é um valor maior do que 0 e menor do que 1.
[0138] O processador 21 é ainda especificamente configurado para: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo; e para uma quinta HRTF alvo, multiplicar um terceiro valor e todas as respostas de impulso incluídas na uma quinta HRTF alvo, para obter uma sétima HRTF alvo correspondendo a uma quinta HRTF alvo, onde o terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma quinta HRTF alvo; e as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0139] Supõe-se que b = b1 + b2, as b1 segundas HRTFs são b1 segundas HRTFs às quais correspondem b1 alto-falantes virtuais localizados no segundo lado do centro de alvo, as b2 segundas HRTFs são b2 segundas HRTFs às quais b2 alto-
falantes virtuais localizados no primeiro lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0140] Neste caso, o processador 21 é ainda especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo.
[0141] Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0142] O processador 21 é ainda especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluída nas b1 quartas HRTFs alvo, para obter b1 nonas HRTFs alvo, e multiplicar um oitavo fator de modificação e cada resposta de impulso incluída em b2 oitavas HRTFs alvo, para obter b2 décimas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo, o quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1.
[0143] O processador 21 é ainda especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma dos quadrados, a terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo à quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo; e para uma oitava HRTF alvo, multiplicar um quarto valor e todas as respostas de impulso incluídas na oitava HRTF alvo, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo, onde o quarto valor é uma razão de uma sétima soma dos quadrados para uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas no oitava HRTF alvo; e as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e b2 décimas HRTFs alvo.
[0144] O processador 21 é ainda configurado para: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, onde a primeira ordem de magnitude é uma ordem de magnitude de energia do terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, onde a segunda ordem de magnitude é uma ordem de magnitude de energia do quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0145] Pode ser entendido que cada método após o processador 21 obter o sinal a ser processado pode ser realizado pelo componente de renderização no processador.
[0146] O sinal de áudio que recebe aparelho nesta modalidade modifica as respostas de impulso de banda alta das a primeiras HRTFs, de modo que a interferência causada pelo primeiro sinal de áudio alvo obtido para o segundo sinal de áudio alvo pode ser reduzida. Além disso, o aparelho de recepção de sinal de áudio modifica as respostas de impulso de banda alta das b segundas HRTFs, de modo que a interferência causada pelo segundo sinal de áudio alvo para o primeiro sinal de áudio alvo possa ser reduzida. Isso reduz a diafonia entre o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo e o segundo sinal de áudio alvo correspondente à posição de ouvido direito.
[0147] O seguinte usa modalidades específicas para descrever um método de processamento de áudio neste pedido. As seguintes modalidades são todas executadas por uma extremidade de recepção de sinal de áudio, por exemplo, o terminal móvel 140 mostrado na Figura 2.
[0148] A Figura 4 é um fluxograma 1 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 3, o método nesta modalidade inclui as seguintes etapas.
[0149] Etapa S101: Obter M primeiros sinais de áudio processando um sinal de áudio a ser processado por M alto- falantes virtuais, onde os M alto-falantes virtuais estão em uma correspondência um a um com os M primeiros sinais de áudio, e M é um número inteiro positivo.
[0150] Etapa S102: Obter M primeiras HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto- falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais.
[0151] Etapa S103: Modificar respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar as respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo, onde 1 ≤ a ≤ M, 1 ≤ b ≤ M, e ambos a e b são inteiros.
[0152] Etapa S104: Obter, com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo atual, e obter, com base nas d segundas HRTFs, as b segundas HRTFs alvo, e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito atual, em que as c primeiras HRTFs são outras do que as a primeiras HRTFs nas M primeiras HRTFs, as d segundas HRTFs são outras do que as b segundas HRTFs nas M segundas HRTFs, a + c = M, e b + d = M.
[0153] Especificamente, o método nesta modalidade deste pedido é um método realizado por uma extremidade de recepção de sinal de áudio. Uma extremidade de transmissão de sinal de áudio coleta um sinal estéreo enviado por uma fonte de som, e um componente de codificação da extremidade de transmissão de sinal de áudio codifica o sinal estéreo enviado pela fonte de som para obter um sinal codificado. Em seguida, o sinal codificado é transmitido para a extremidade de recepção de sinal de áudio por meio de uma rede sem fio ou com fio, e a extremidade de recepção de sinal de áudio decodifica o sinal codificado. Um sinal obtido por meio da decodificação é o sinal de áudio a ser processado nesta modalidade. Em outras palavras, o sinal de áudio a ser processado nesta modalidade pode ser um sinal obtido através da decodificação por um componente de decodificação em um processador, ou um sinal obtido através da decodificação pelo componente de decodificação e renderização 120 ou o componente de decodificação no dispositivo móvel terminal 140 na Figura 2.
[0154] Pode ser entendido que, se um padrão usado para processar o sinal de áudio for Ambisonic, o sinal codificado obtido pela extremidade de transmissão de sinal de áudio é um sinal Ambisonic padrão. Correspondentemente, um sinal obtido por meio da decodificação pela extremidade de recepção de sinal de áudio também é um sinal Ambisonic, por exemplo, um sinal Ambisonic de formato B. O sinal Ambisonic inclui um sinal Ambisonic de primeira ordem (First- Order Ambisonics, FOA para abreviar) e um sinal Ambisonic de alta ordem (High-Order Ambisonics).
[0155] A posição de ouvido esquerdo atual nesta modalidade é uma posição de ouvido esquerdo de um ouvinte atual, e a posição de ouvido direito atual nesta modalidade é uma posição de ouvido direito do ouvinte atual. Nesta modalidade, o primeiro sinal de áudio alvo é um sinal de canal esquerdo, e o segundo sinal de áudio alvo é um sinal de canal direito.
[0156] O seguinte descreve esta modalidade usando um exemplo em que o sinal de áudio a ser processado obtido pela extremidade de recepção de sinal de áudio através da decodificação é o sinal Ambisonic de formato B.
[0157] Na etapa S101, os M primeiros sinais de áudio são obtidos pelo processamento do sinal de áudio a ser processado pelos M alto-falantes virtuais, onde M ≥ 1 e M é um número inteiro.
[0158] Opcionalmente, M pode ser qualquer um de 4, 8, 16 e semelhantes.
[0159] O alto-falante virtual pode processar o sinal de áudio a ser processado no primeiro sinal de áudio de acordo com a seguinte Fórmula 1: 1 1  P1m =  W + X ( cos(φ1m ) cos(θ1m ) ) + Y ( sin(φ1m ) cos(θ1m ) ) + Z ( sin(φ1m ) )  L 2  Fórmula 1, em que 1 ≤ m ≤ M; P1m representa um mésimo primeiro sinal de áudio obtido pelo processamento do sinal de áudio a ser processado por um mésimo alto-falante virtual; W representa um componente correspondente a todos os sons incluídos em um ambiente da fonte sonora, e é referido como um componente de ambiente; X representa um componente, em um eixo geométrico X, de todos os sons incluídos no ambiente da fonte de som, e é referido como um componente de coordenada X; Y representa um componente, em um eixo geométrico Y, de todos os sons incluídos no ambiente da fonte de som, e é referido como um componente de coordenada Y; e Z representa um componente, em um eixo geométrico Z, de todos os sons incluídos no ambiente da fonte de som, e é referido como um componente de coordenada Z. O eixo geométrico X, o eixo geométrico Y e o eixo geométrico Z aqui são, respectivamente, um eixo geométrico X, um eixo geométrico Y e um eixo geométrico Z de um sistema de coordenadas tridimensional correspondente à fonte de som (ou seja, um sistema de coordenadas tridimensional correspondente a extremidade de transmissão de sinal de áudio), e L representa um coeficiente de ajuste de energia. φ1m representa uma elevação do mésimo alto-falante virtual em relação a uma origem de coordenada do sistema de coordenadas tridimensional correspondente à extremidade de recepção de sinal de áudio, e θ1m representa um azimute do mésimo alto-falante virtual em relação à origem das coordenadas.
[0160] Antes da etapa S102, as correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs precisam ser obtidas com antecedência, e as M primeiras HRTFs e as M segundas HRTFs correspondentes aos M alto-falantes virtuais são determinadas com base nas correspondências.
[0161] O seguinte descreve uma maneira de obter as correspondências entre a pluralidade de posições predefinidas e a pluralidade de HRTFs. A maneira de obter as correspondências entre a pluralidade de posições predefinidas e a pluralidade de HRTFs não se limita à seguinte maneira.
[0162] A Figura 5 é um diagrama de um cenário de medição no qual uma HRTF é medida usando um centro de cabeça como um centro de acordo com uma modalidade deste pedido. A Figura 5 mostra várias posições 61 em relação a um centro de cabeça 62. Pode ser entendido que há uma pluralidade de HRTFs centradas no centro de cabeça, e os sinais de áudio que são enviados pelas primeiras fontes de som em diferentes posições 61 correspondem a diferentes HRTFs que estão centralizados no centro de cabeça quando os sinais de áudio são transmitidos para o centro de cabeça. Quando a HRTF centrada no centro de cabeça é medida, o centro de cabeça pode ser o centro de cabeça de um ouvinte atual, ou pode ser o centro de cabeça de outro ouvinte, ou pode ser o centro de cabeça de um ouvinte virtual.
[0163] Desta forma, HRTFs correspondentes a uma pluralidade de posições predefinidas podem ser obtidas definindo as primeiras fontes de som em diferentes posições predefinidas em relação ao centro de cabeça 62. Para ser específico, se uma posição de uma primeira fonte de som 1 em relação ao centro de cabeça 62 é uma posição c, uma HRTF 1 que é usada para transmitir, para o centro de cabeça 62, um sinal enviado pela primeira fonte de som 1 e que é obtido através da medição é uma HRTF 1 que está centrada no centro de cabeça 62 e que corresponde à posição c; se uma posição de uma primeira fonte de som 2 em relação ao centro de cabeça 62 for uma posição d, uma HRTF 2 que é usada para transmitir, para o centro de cabeça 62, um sinal enviado pela primeira fonte de som 2 e que é obtido através da medição é uma HRTF 2 que está centrado no centro de cabeça 62 e que corresponde à posição d; e assim por diante. A posição c inclui um azimute 1, uma elevação 1 e uma distância 1. O azimute 1 é um azimute da primeira fonte de som 1 em relação ao centro de cabeça 62. A elevação 1 é uma elevação da primeira fonte de som 1 em relação ao centro de cabeça 62. A distância 1 é uma distância entre a primeira fonte de som 1 e o centro de cabeça 62. Da mesma forma, a posição d inclui um azimute 2, uma elevação 2 e uma distância 2. O azimute 2 é um azimute da primeira fonte de som 2 em relação ao centro de cabeça
62. A elevação 2 é uma elevação da primeira fonte de som 2 em relação ao centro de cabeça 62. A distância 2 é uma distância entre a primeira fonte de som 2 e o centro de cabeça 62.
[0164] Durante o ajuste das posições das primeiras fontes de som em relação ao centro de cabeça 62, quando as distâncias e elevações não mudam, os azimutes das primeiras fontes de som adjacentes podem ser espaçados por um primeiro ângulo predefinido; quando as distâncias e os azimutes não mudam, as elevações das primeiras fontes de som adjacentes podem ser espaçadas por um segundo ângulo predefinido; e quando as elevações e os azimutes não mudam, as distâncias entre as primeiras fontes de som adjacentes podem ser espaçadas por uma primeira distância predefinida. O primeiro ângulo predefinido pode ser qualquer um de 3º a 10º, por exemplo, 5º. O segundo ângulo predefinido pode ser qualquer um de 3º a 10º, por exemplo, 5º. A primeira distância pode ser qualquer uma de 0,05 m a 0,2 m, por exemplo, 0,1 m.
[0165] Por exemplo, um processo de obtenção da HRTF 1 que está centrada no centro de cabeça e que corresponde à posição c (100º, 50º, 1 m) é o seguinte: A primeira fonte de som 1 é colocada em uma posição na qual um azimute em relação ao centro de cabeça é 100º, uma elevação em relação ao centro de cabeça é 50º, e uma distância do centro de cabeça é 1 m; e uma HRTF correspondente que é usada para transmitir, para o centro de cabeça 62, um sinal de áudio enviado pela primeira fonte de som 1 é medido, de modo a obter a HRTF 1 centrada no centro de cabeça. O método de medição é um método existente e os detalhes não são descritos aqui.
[0166] Para outro exemplo, um processo de obtenção da HRTF 2 que está centrada no centro de cabeça e que corresponde à posição d (100º, 45º, 1 m) é o seguinte: A primeira fonte de som 2 é colocada em uma posição na qual um azimute em relação ao centro de cabeça é 100º, uma elevação em relação ao centro de cabeça é 45º, e uma distância do centro de cabeça é 1 m; e uma HRTF correspondente que é usada para transmitir, para o centro de cabeça 62, um sinal de áudio enviado pela primeira fonte de som 2 é medido, de modo a obter a HRTF 2 centrada no centro de cabeça.
[0167] Para outro exemplo, um processo de obtenção da HRTF que está centrada no centro de cabeça e que corresponde a uma posição e (95º, 45º, 1 m) é o seguinte: Uma primeira fonte de som 3 é colocada em uma posição na qual um azimute em relação ao centro de cabeça é 95º, uma elevação em relação ao centro de cabeça é 45º, e uma distância do centro de cabeça é 1 m; e uma HRTF correspondente que é usada para transmitir, para o centro de cabeça 62, um sinal de áudio enviado pela primeira fonte de som 3 é medido, de modo a obter a HRTF 3 centrada no centro de cabeça.
[0168] Para outro exemplo, um processo de obtenção da HRTF 4 que está centrada no centro de cabeça e que corresponde a uma posição f (95º, 50º, 1 m) é o seguinte: Uma primeira fonte de som 4 é colocada em uma posição na qual um azimute em relação ao centro de cabeça é 95º, uma elevação em relação ao centro de cabeça é 50º, e uma distância do centro de cabeça é 1 m; e uma HRTF correspondente que é usada para transmitir, para o centro de cabeça 62, um sinal de áudio enviado pela primeira fonte de som 4 é medido, de modo a obter a HRTF 4 centrada no centro de cabeça.
[0169] Para outro exemplo, um processo de obtenção da HRTF 5 que está centrada no centro de cabeça e que corresponde a uma posição g (100º, 50º, 1,1 m) é o seguinte: Uma primeira fonte de som 5 é colocada em uma posição na qual um azimute em relação ao centro de cabeça é 100º, uma elevação em relação ao centro de cabeça é 50º, e uma distância do centro de cabeça é 1,1 m; e uma HRTF correspondente que é usada para transmitir, para o centro de cabeça 62, um sinal de áudio enviado pela primeira fonte de som 5 é medido, de modo a obter a HRTF 5 centrada no centro de cabeça.
[0170] Deve-se notar que em uma posição subsequente (x, x, x), o primeiro x representa um azimute, o segundo x representa uma elevação e o terceiro x representa uma distância.
[0171] De acordo com o método anterior, as correspondências entre uma pluralidade de posições e uma pluralidade de HRTFs centradas no centro de cabeça podem ser obtidas por meio de medição. Pode ser entendido que, durante a medição da HRTF centrada no centro de cabeça, a pluralidade de posições nas quais as primeiras fontes de som são colocadas podem ser referidas como posições predefinidas. Portanto, de acordo com o método anterior, as correspondências entre a pluralidade de posições predefinidas e a pluralidade de HRTFs centradas no centro de cabeça podem ser obtidas por meio de medição. Nesta modalidade, as correspondências são referidas como primeiras correspondências e as posições predefinidas são posições em relação ao centro de cabeça.
[0172] Além disso, um método semelhante ao método anterior pode ser usado para medir uma HRTF centrada na posição de ouvido esquerdo, para obter correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs centradas na posição de ouvido esquerdo. Nesta modalidade, as correspondências são referidas como segundas correspondências, e as posições predefinidas são posições em relação à posição de ouvido esquerdo. Durante a medição da HRTF centrada na posição de ouvido esquerdo, a posição de ouvido esquerdo pode ser uma posição de ouvido esquerdo atual de um ouvinte atual, ou pode ser o centro de cabeça de outro ouvinte, ou pode ser uma posição de ouvido esquerdo de um ouvinte virtual.
[0173] Além disso, um método semelhante ao método anterior pode ser usado para medir uma HRTF centrada na posição de ouvido direito, para obter correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs centradas na posição de ouvido direito. Nesta modalidade, as correspondências são referidas como terceiras correspondências, e as posições predefinidas são posições em relação à posição de ouvido direito. Durante a medição da HRTF centrada na posição de ouvido direito, a posição de ouvido direito pode ser uma posição de ouvido direito atual de um ouvinte atual, ou pode ser o centro de cabeça de outro ouvinte, ou pode ser uma posição de ouvido direito de um ouvinte virtual.
[0174] Pode ser entendido que M primeiras HRTFs e M segundas HRTFs podem ser obtidas com base em quaisquer correspondências das correspondências anteriores. A memória da Figura 3 pode armazenar pelo menos um de: as primeiras correspondências, as segundas correspondências e as terceiras correspondências.
[0175] A obtenção de M primeiras HRTFs inclui: obter M primeiras posições de M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e nas correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs. As correspondências são correspondências pré- armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs, e as correspondências são: as primeiras correspondências e as segundas correspondências.
[0176] Especificamente, o seguinte descreve um processo de obtenção das M primeiras HRTFs usando um exemplo no qual as correspondências são as primeiras correspondências.
[0177] Uma primeira posição de cada alto-falante virtual em relação à posição de ouvido esquerdo atual é obtida e, se houver M alto-falantes virtuais, as M primeiras posições são obtidas. Cada primeira posição inclui um primeiro azimute e uma primeira elevação do alto-falante virtual correspondente em relação à posição de ouvido esquerdo atual, e uma primeira distância entre a posição de ouvido esquerdo atual e o alto-falante virtual.
[0178] A determinação, com base nas M primeiras posições e nas primeiras correspondências, de que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs inclui: determinar M primeiras posições predefinidas associadas às M primeiras posições. As M primeiras posições predefinidas são posições predefinidas incluídas nas primeiras correspondências. Que M HRTFs correspondentes às M primeiras posições predefinidas são as M primeiras HRTFs é determinado com base nas primeiras correspondências.
[0179] Especificamente, a primeira posição predefinida associada à primeira posição pode ser a primeira posição; ou uma elevação incluída na primeira posição predefinida é uma elevação alvo que está mais próxima da primeira elevação incluída na primeira posição, um azimute incluído na primeira posição predefinida é um azimute alvo que está mais próximo do primeiro azimute incluído na primeira posição, e uma distância incluída na primeira posição predefinida é uma distância alvo que está mais próxima da primeira distância incluída na primeira posição. O azimute alvo é um azimute incluído em uma posição predefinida correspondente durante a medição da HRTF centrada no centro de cabeça, a saber, um azimute da primeira fonte de som colocada em relação ao centro de cabeça durante a medição da HRTF centrada no centro de cabeça. A elevação alvo é uma elevação em uma posição predefinida correspondente durante a medição da HRTF centrada no centro de cabeça, ou seja, uma elevação da primeira fonte de som colocada em relação ao centro de cabeça durante a medição da HRTF centrada no centro de cabeça. A distância alvo é uma distância em uma posição predefinida correspondente durante a medição da HRTF centrada no centro de cabeça, ou seja, uma distância entre a primeira fonte de som colocada e o centro de cabeça durante a medição da HRTF centrada no centro de cabeça. Em outras palavras, todas as primeiras posições predefinidas são posições nas quais as primeiras fontes de som são colocadas durante a medição da pluralidade de HRTFs centradas no centro de cabeça. Em outras palavras, uma HRTF que está centrada no centro de cabeça e que corresponde a cada primeira posição predefinida é medida antecipadamente.
[0180] Pode ser entendido que, se o primeiro azimute incluído na primeira posição estiver entre dois azimutes alvo, um dos dois azimutes alvo pode ser determinado, de acordo com uma regra predefinida, como o azimute incluído na primeira posição predefinida. Por exemplo, a regra predefinida é a seguinte: Se o primeiro azimute incluído na primeira posição estiver entre os dois azimutes alvo, um azimute alvo nos dois azimutes alvo que está mais próximo do primeiro azimute é determinado como o azimute incluído na primeira posição predefinida. Se a primeira elevação incluída na primeira posição estiver entre duas elevações alvo, uma das duas elevações alvo pode ser determinada, de acordo com uma regra predefinida, como a elevação incluída na primeira posição predefinida. Por exemplo, a regra predefinida é a seguinte: Se a primeira elevação incluída na primeira posição estiver entre as duas elevações alvo, uma elevação alvo nas duas elevações alvo que está mais próxima da primeira elevação é determinada como a elevação incluída na primeira posição predefinida. Se a primeira distância incluída na primeira posição estiver entre duas distâncias de alvo, uma das duas distâncias de alvo pode ser determinada, de acordo com uma regra predefinida, como a distância incluída na primeira posição predefinida. Por exemplo, a regra predefinida é a seguinte: Se a primeira distância incluída na primeira posição estiver entre as duas distâncias do alvo, uma distância alvo nas duas distâncias do alvo que está mais próxima da primeira distância é determinada como a distância incluída na primeira posição predefinida.
[0181] Por exemplo, se na primeira posição, obtida através da medição na etapa S102, do mésimo alto-falante virtual em relação à posição de ouvido esquerdo atual, um primeiro azimute é 88º, uma primeira elevação é 46º e uma primeira distância é 1,02 m, as primeiras correspondências incluem uma HRTF correspondendo à posição (90º, 45º, 1 m), uma HRTF correspondendo a uma posição (85º, 45º, 1 m), uma HRTF correspondendo a uma posição (90º, 50º, 1 m), uma HRTF correspondendo a uma posição (85º, 50º, 1 m), uma HRTF correspondendo a uma posição (90º, 45º, 1,1 m), uma HRTF correspondendo a uma posição (85º, 45º, 1,1 m), uma HRTF correspondendo a uma posição (90º, 50º, 1,1 m) e uma HRTF correspondendo a uma posição (85º, 50º, 1,1 m). 88º está entre 85º e 90º, mas está mais próximo de 90º, 46º está entre 45º e 50º, mas está mais perto de 45º, e 1,02 m está entre 1 me 1,1 m, mas está mais perto de 1 m. Portanto, é determinado que a posição (90º, 45º, 1 m) é uma primeira posição predefinida m associada à primeira posição do mésimo alto-falante virtual em relação à posição de ouvido esquerdo atual. Neste caso, a HRTF, incluído nas primeiras correspondências, correspondente à posição ((90º, 45º, 1 m) é uma primeira HRTF correspondente ao mésimo alto-falante virtual, ou seja, um das M primeiras HRTFs.
[0182] Em outras palavras, após as M primeiras posições predefinidas associadas às M primeiras posições serem determinadas, nas primeiras correspondências, as M HRTFs correspondentes às M primeiras posições predefinidas são as M primeiras HRTFs.
[0183] Então, a obtenção de M segundas HRTFs inclui: obter M segundas posições de M alto-falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e nas correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs. As correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs, e as correspondências podem ser: as primeiras correspondências e as terceiras correspondências.
[0184] O seguinte descreve um processo de obtenção das M segundas HRTFs usando um exemplo no qual as correspondências são as primeiras correspondências.
[0185] Uma segunda posição de cada alto-falante virtual em relação à posição de ouvido direito atual é obtida e, se houver M alto-falantes virtuais, as M segundas posições são obtidas. Cada segundas posição inclui um segundo azimute e uma segunda elevação do alto-falante virtual correspondente em relação à posição de ouvido direito atual, e uma segunda distância entre a posição de ouvido direito atual e o alto-falante virtual.
[0186] A determinação, com base nas M segundas posições e nas primeiras correspondências, de que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs inclui: determinar M segundas posições predefinidas associadas às M segundas posições. As M segundas posições predefinidas são posições predefinidas incluídas nas primeiras correspondências. Que M HRTFs correspondentes às M segundas posições predefinidas são as M segundas HRTFs é determinado com base nas primeiras correspondências.
[0187] Especificamente, para a segunda posição predefinida associada à segunda posição, consulte as descrições da primeira posição predefinida associada à primeira posição. Detalhes não são descritos novamente. Após as M segundas posições predefinidas associadas com as M segundas posições serem determinadas, nas primeiras correspondências, as M HRTFs correspondentes às M segundas posições predefinidas são as M segundas HRTFs.
[0188] Na etapa S103, as respostas de impulso de banda alta das a primeiras HRTFs são modificadas, para obter as a primeiras HRTFs alvo, e as respostas de impulso de banda alta das b segundas HRTFs são modificadas, para obter as b segundas HRTFs alvo, onde 1 ≤ a ≤ M, e 1 ≤ b ≤ M.
[0189] Especificamente, que as respostas de impulso de banda alta das a primeiras HRTFs são modificadas, e 1 ≤ a ≤ M significa que uma resposta de impulso de banda alta de, pelo menos, uma primeira HRTF é modificada. Em outras palavras, uma resposta de impulso de banda alta de uma primeira HRTF pode ser modificada, ou as respostas de impulso de banda alta das M primeiras HRTFs podem ser modificadas.
[0190] Da mesma forma, que as respostas de impulso de banda alta das b segundas HRTFs são modificadas, e 1 ≤ b ≤ M significa que uma resposta de impulso de banda alta de pelo menos uma segunda HRTF é modificada. Em outras palavras, uma resposta de impulso de banda alta de uma segunda HRTF pode ser modificada, ou as respostas de impulso de banda alta das M segundas HRTFs podem ser modificadas.
[0191] Pode ser entendido que a e b podem ser iguais ou podem ser diferentes.
[0192] Para as a primeiras HRTFs a serem modificadas, em uma maneira, as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0193] De outra maneira, as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem, e o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual.
[0194] De outra maneira, a = a1 + a2, ou seja, as a primeiras HRTFs incluem a1 primeiras HRTFs e a2 primeiras HRTFs. As a1 primeiras HRTFs são as a1 primeiras HRTFs às quais os a1 alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem, e as a2 primeiras HRTFs são as a2 primeiras HRTFs às quais os a2 alto-falantes virtuais localizados no segundo lado do centro de alvo correspondem.
[0195] Para as b segundas HRTFs a serem modificados, de certa forma, as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais no segundo lado do centro de alvo correspondem.
[0196] De outra maneira, as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais no primeiro lado do centro de alvo correspondem.
[0197] De outra maneira, b = b1 + b2, as b1 segundas HRTFs são b1 segundas HRTFs às quais os b1 alto-falantes virtuais localizados no segundo lado do centro de alvo correspondem, e as b2 segundas HRTFs são b2 segundas HRTFs às quais os b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem.
[0198] O que se segue descreve, com referência a exemplos específicos, as a primeiras HRTFs a serem modificadas e as modificado segundas HRTFs a serem modificadas.
[0199] O espaço tridimensional correspondente aos M alto-falantes virtuais pode ser um poliedro regular. Se o espaço for um cubo, um alto-falante virtual pode ser colocado em cada um dos oito cantos do cubo. Nesse caso, M = 8. Correspondentemente, um centro do cubo é o centro de alvo.
[0200] A Figura 6 é um diagrama esquemático da distribuição de M alto-falantes virtuais de acordo com uma modalidade deste pedido. Com referência à Figura 6, 511 a 518 na figura representam alto-falantes virtuais, e há oito alto-falantes virtuais no total. 53 representa o espaço tridimensional correspondente aos oito alto-falantes virtuais, e 52 representa um centro-alvo do espaço tridimensional correspondente aos oito alto-falantes virtuais. Um primeiro lado do centro de alvo é um lado que está no centro de alvo e que está longe de uma posição de ouvido esquerdo atual, e um segundo lado do centro de alvo é um lado que está longe do centro de alvo e que está longe de uma posição de ouvido direito atual.
[0201] Com referência à Figura 6, na forma em que "a primeiras HRTFs são a primeiras HRTFs às quais a alto- falantes virtuais localizados em um primeiro lado de um centro de alvo correspondem, e b segunda HRTFs são b segunda HRTFs às quais que b alto-falantes virtuais em um segundo lado do centro de alvo corresponde".
[0202] Se um ouvinte atual geralmente enfrenta uma primeira superfície (a superfície frontal da fig. 5) 54 do espaço de cubo, as a primeiras HRTFs correspondem a a alto- falantes virtuais nos alto-falantes virtuais 511 a 514, e as b segunda HRTFs correspondem a b virtuais alto-falantes nos alto-falantes virtuais 515 a 518; Se o ouvinte geralmente enfrenta um segundo lado (a superfície traseira na Figura 5) 55 do espaço de cubo, as a primeiras HRTFs correspondem a a alto-falantes virtuais nos alto-falantes virtuais 515 a 518, e as b segunda HRTFs correspondem a b alto-falantes virtuais nos alto-falantes virtuais 511 a 514. Se o ouvinte geralmente enfrenta um terceiro lado 56 do espaço de cubo, as a primeiras HRTFs correspondem a a alto-falantes virtuais nos alto-falantes virtuais 512, 514, 516, e 518, e as b segunda HRTFs correspondem a b alto-falantes virtuais nos alto- falantes virtuais 511, 513, 515 e 517. Se o ouvinte geralmente enfrenta um quarto lado 57 do espaço de cubo, as a primeiras HRTFs correspondem a a alto-falantes virtuais nos alto-falantes virtuais 511, 513, 515, e 517, e as b segunda HRTFs correspondem a b alto-falantes virtuais nos alto-falantes virtuais 512, 514, 516 e 518.
[0203] Opcionalmente, nesta modalidade, as frequências incluídas em uma banda alta são cada uma maiores do que uma frequência predefinida, e a frequência predefinida pode ser 10 K.
[0204] Na etapa S104, especificamente, tanto o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo quanto o segundo sinal de áudio alvo correspondente à posição de ouvido direito são sinais de áudio renderizados.
[0205] A diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo é causada principalmente por bandas altas do primeiro sinal de áudio alvo e do segundo sinal de áudio alvo. Portanto, a modificação das respostas de impulso de banda alta das a primeiras HRTFs na etapa S103 pode reduzir a interferência causada pelo primeiro sinal de áudio alvo obtido para o segundo sinal de áudio alvo. Da mesma forma, a modificação das respostas de impulso de banda alta das b segundas HRTFs na etapa S103 pode reduzir a interferência causada pelo segundo sinal de áudio alvo para o primeiro sinal de áudio alvo. Desta forma, a diafonia entre o primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo e o segundo sinal de áudio alvo correspondente à posição de ouvido direito é reduzida.
[0206] Especificamente, que um primeiro sinal de áudio alvo correspondente à posição de ouvido esquerdo é obtido com base em a primeiras HRTFs alvo, c primeiras HRTFs e M primeiros sinais de áudio inclui: convoluir cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs das a primeiras HRTFs alvo e das c primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos.
[0207] Para ser mais específico, um mésimo um primeiro sinal de áudio emitido por um mésimo alto-falante virtual é convolvido com uma primeira HRTF ou uma primeira HRTF alvo que corresponde ao mésimo alto-falante virtual, para obter um mésimo primeiro sinal de áudio convolvido. Quando há M alto- falantes virtuais, M primeiros sinais de áudio convolvidos são obtidos. Um sinal obtido pela sobreposição dos M primeiros sinais de áudio convolvidos é o primeiro sinal de áudio alvo.
[0208] Pode ser compreendido que, se a primeira HRTF correspondente ao mésimo alto-falante virtual é modificada para se tornar a primeira HRTF alvo, o mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a primeira HRTF alvo, para obter o mésimo primeiro sinal de áudio convolvido. Se a primeira HRTF correspondente ao mésimo alto-falante virtual não for modificada, o mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a primeira HRTF, para obter o mésimo primeiro sinal de áudio convolvido.
[0209] Pode ser entendido que, se todas as M primeiras HRTFs forem modificadas, c = 0.
[0210] Especificamente, que um segundo sinal de áudio alvo correspondente à posição de ouvido direito é obtido com base em d segundas HRTFs, b segundas HRTFs alvo, e M primeiros sinais de áudio inclui: convoluir cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs das d segundas HRTFs e das b segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
[0211] Para ser mais específico, o mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com uma segunda HRTF alvo ou uma segunda HRTF que corresponde ao mésimo auto-falante virtual, para obter um mésimo segundo sinal de áudio convolvido. Quando há M alto-falantes virtuais, M segundos sinais de áudio convolvidos são obtidos. Um sinal obtido pela sobreposição dos sinais de áudio convolvidos de segundo M é o segundo sinal de áudio alvo.
[0212] Pode ser compreendido que, se a segunda HRTF correspondente ao mésimo alto-falante virtual é modificada para se tornar a segunda HRTF alvo, o mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a segunda HRTF alvo, para obter o mésimo segundo sinal de áudio convolvido. Se a segunda HRTF correspondente ao mésimo alto-falante virtual não for modificada, o mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a segunda HRTF, para obter o mésimo segundo sinal de áudio convolvido.
[0213] Pode ser entendido que, se todos as M segundas HRTFs forem modificadas, d = 0.
[0214] Nesta modalidade, as respostas de impulso de banda alta das a primeiras HRTFs e a respostas de impulso de banda alta das b segundas HRTFs são modificadas, de modo que a interferência entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo é reduzida.
[0215] O seguinte descreve em detalhes a etapa S103 na modalidade mostrada na Figura 4 usando uma modalidade específica.
[0216] Em primeiro lugar, um método para a modificação, quando as a primeiras HRTFs são a primeiras HRTFs às quais os a alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem, a respostas de impulso de banda alta das a primeiras HRTFs para obter as a primeiras HRTFs alvo é descrita.
[0217] A Figura 7 é um fluxograma 2 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 7, o método nesta modalidade inclui a seguinte etapa.
[0218] Etapa S201: Multiplicar um primeiro fator de modificação e respostas de impulso de banda alta incluídas em a primeiras HRTFs, para obter a primeiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1.
[0219] Especificamente, na etapa S201, para cada primeira HRTF nas a primeiras HRTFs, o primeiro fator de modificação e uma resposta de impulso que corresponde a cada uma frequência maior do que uma frequência pré-definida e que está incluída na primeira HRTF são multiplicados, para obter uma primeira HRTF modificada, a saber, uma primeira HRTF alvo correspondente à primeira HRTF. Desta forma, as a primeiras HRTFs alvo são obtidas.
[0220] O primeiro fator de modificação pode ser 0,94, 0,95, 0,96, 0,97, ou 0,98 ou pode ser outro valor. Um valor do primeiro fator de modificação está relacionado a uma distância entre um alto-falante virtual e um ouvinte. Uma distância menor entre o locutor virtual e o ouvinte indica que o primeiro fator de modificação está mais próximo de 1.
[0221] Nesta modalidade, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto- falante virtual que está longe de uma posição de ouvido esquerdo atual é modificada usando o primeiro fator de modificação, onde o primeiro fator de modificação é menor que 1. Isto é equivalente que, o impacto em um segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido esquerdo atual (em outras palavras, que está perto de uma posição de ouvido direito atual) é reduzido. Isso pode reduzir a diafonia entre um primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0222] Para garantir ao máximo que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base em M primeiras HRTFs e
M primeiros sinais de áudio, esta modalidade é ainda melhorada com base na modalidade anterior. A Figura 8 é um fluxograma 3 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 8, o método nesta modalidade inclui as seguintes etapas.
[0223] Etapa S301: Multiplicar um primeiro fator de modificação e respostas de impulso de banda alta incluídas em a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1.
[0224] Etapa S302: Obter a primeiras HRTFs alvo com base em a terceiras HRTFs alvo.
[0225] Especificamente, para a etapa S301, consulte as descrições na etapa S201 na modalidade anterior.
[0226] A obtenção das a primeiras HRTFs alvo com base nas a terceiras HRTFs alvo na etapa S302 pode incluir as seguintes várias implementações viáveis.
[0227] Em uma primeira implementação, um terceiro fator de modificação e cada resposta de impulso incluídos nas a terceiras HRTFs alvo são multiplicados para obter as a primeiras HRTFs alvo.
[0228] Especificamente, para cada terceira HRTF alvo em a terceiras HRTF alvos, o terceiro fator de modificação e cada resposta de impulso incluída na terceira HRTF alvo são multiplicados para obter uma primeira HRTFs alvo correspondente à terceira HRTF alvo. Desta forma, as a primeiras HRTFs alvo são obtidas.
[0229] A HRTF pode incluir uma resposta de impulso no domínio de frequência, e pode ainda incluir uma resposta de impulso no domínio de tempo, e a resposta de impulso no domínio de frequência e a resposta de impulso no domínio de tempo podem ser trocadas. Portanto, nesta modalidade, multiplicar o terceiro fator de modificação e as respostas de impulso incluídas na terceira HRTF alvo pode ser multiplicar o terceiro fator de modificação e uma resposta de impulso em cada domínio de tempo que está incluído na terceira HRTF alvo, e multiplicar o terceiro fator de modificação e uma resposta de impulso em cada domínio de frequência que está incluído na terceira HRTF alvo. Isso também é aplicável a modalidades subsequentes.
[0230] Opcionalmente, o terceiro fator de modificação pode ser um valor predefinido maior que 1, por exemplo, 1,2.
[0231] A finalidade de multiplicar o terceiro fator de modificação e cada resposta de impulso incluída nas a terceiras HRTFs alvo, para obter as a primeiras HRTFs alvo é assegurar ao máximo que a ordem de magnitude da energia do primeiro sinal de áudio alvo obtida com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e nos M primeiros sinais de áudio é a mesmo que a ordem de magnitude de energia do terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0232] Em uma segunda implementação, para uma terceira HRTF alvo, um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo são multiplicados para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, em que o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo.
[0233] Especificamente, para uma terceira HRTF alvo, uma soma dos quadrados de todas as respostas de impulso incluídas na terceira HRTF alvo é obtida, ou seja, uma segunda soma dos quadrados Q2 é obtida, e uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo à terceira HRTF alvo é obtida, isto é, uma primeira soma dos quadrados Q1 é obtida. Então, um primeiro valor é obtido usando Q1/Q2. Cada resposta de impulso incluída em uma terceira HRTF alvo é multiplicada pelo primeiro valor para obter uma primeira HRTF alvo correspondente a uma terceira HRTF alvo. Desta forma, as a primeiras HRTFs alvo são obtidas.
[0234] A primeira HRTF correspondente à terceira HRTF alvo refere-se a uma terceira HRTF alvo obtida após a primeira HRTF ser modificada. Por exemplo, assume-se que uma primeira HRTF correspondente a um mésimo alto-falante virtual é uma primeira HRTF 1, e após uma resposta de impulso de banda alta da primeira HRTF 1 ser modificada, uma terceira HRTF 1 alvo é obtida. Neste caso, a primeira HRTF 1 é uma primeira HRTF correspondente à terceira HRTF 1 alvo.
[0235] Para cada terceira HRTF alvo, o primeiro valor e todas as respostas de impulso incluídas na terceira HRTF alvo são multiplicados, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo. Isso pode garantir que a ordem de magnitude da energia do primeiro sinal de áudio alvo seja a mesma que a ordem de magnitude da energia do terceiro sinal de áudio alvo.
[0236] De acordo com o método nesta modalidade, com base em que a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida, pode ser assegurado ao máximo que a ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo.
[0237] Para um método para a modificação, quando as a primeiras HRTFs são a primeiras HRTFs às quais a alto- falantes virtuais localizados no primeiro lado do correspondem centro de alvo, as respostas de impulso de banda alta das a primeiras HRTFs para obter as a primeiras HRTFs alvo, consulte as modalidades mostradas na Figura 7 e Figura
8.
[0238] Além disso, um possível método para modificar, quando b segundas HRTFs são b segundas HRTFs às quais b alto- falantes virtuais localizados no segundo lado do centro de alvo correspondem, as respostas de impulso de banda alta das b segundas HRTFs para obter b segundas HRTFs alvo é descrito em detalhe.
[0239] A Figura 9 é um fluxograma 4 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 9, o método nesta modalidade inclui a seguinte etapa.
[0240] Etapa S401: Multiplicar um segundo fator de modificação e s respostas de impulso de banda alta incluídos em b segundas HRTFs, para obter b segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0241] Especificamente, na etapa S401, para cada segunda HRTF nas b segundas HRTFs, o segundo fator de modificação e uma resposta de impulso que corresponde a cada frequência maior do que uma frequência predefinida e que está incluída no segundo HRTF são multiplicados, para obter uma HRTF segunda modificada, a saber, uma segunda HRTF alvo correspondente ao segunda HRTF.
[0242] O segundo fator de modificação pode ser 0,94, 0,95, 0,96, 0,97, ou 0,98 ou pode ser outro valor. Um valor do segundo fator de modificação está relacionado a uma distância entre um alto-falante virtual e um ouvinte. Por exemplo, uma distância menor entre o locutor virtual e o ouvinte indica que o segundo fator de modificação está mais próximo de 1.
[0243] Opcionalmente, o primeiro fator de modificação é o mesmo que o segundo fator de modificação.
[0244] Opcionalmente, o primeiro fator de modificação é diferente do segundo fator de modificação.
[0245] Pode ser compreendido que os significados de bandas altas das b segundas HRTFs são os mesmos que os significados de bandas altas das a primeiras HRTFs.
[0246] Nesta modalidade, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto- falante virtual que está longe do ouvido direito é modificada usando o segundo fator de modificação, onde o segundo fator de modificação é menor que 1. Isto é equivalente que, o impacto em um primeiro sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe de uma posição de ouvido direito atual (em outras palavras, que está perto de uma posição de ouvido esquerdo atual) é reduzido. Isso pode reduzir a diafonia entre o primeiro sinal de áudio alvo e um segundo sinal de áudio alvo.
[0247] Para garantir ao máximo que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base em M segundas HRTFs e M primeiros sinais de áudio, esta modalidade é melhorada com base na modalidade anterior. A Figura 10 é um fluxograma 5 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 10, o método nesta modalidade inclui as seguintes etapas.
[0248] Etapa S501: Multiplicar um segundo fator de modificação e s respostas de impulso de banda alta incluídos em b segundas HRTFs, para obter b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1.
[0249] Etapa S502: Obter b segundas HRTFs alvo com base nas b quartas HRTFs alvo.
[0250] Especificamente, para a etapa S501, consulte a etapa S401 na modalidade anterior.
[0251] A obtenção de b segundas HRTFs alvo com base nas b quartas HRTFs alvo na etapa S502 pode incluir as seguintes várias implementações viáveis.
[0252] Em uma primeira implementação, um quarto fator de modificação e cada resposta de impulso incluída nas b quartas HRTFs alvo são multiplicados para obter as b segundas HRTFs alvo.
[0253] Para cada quarta HRTF alvo nas b quartas HRTFs alvo, o quarto fator de modificação e cada resposta de impulso incluída na quarta HRTF alvo são multiplicados para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo. Desta forma, as b segundas HRTFs alvo são obtidas.
[0254] Opcionalmente, o quarto fator de modificação pode ser um valor predefinido maior que 1. O terceiro fator de modificação e o quarto fator de modificação podem ser iguais ou diferentes.
[0255] A finalidade de multiplicar o quarto fator de modificação e cada resposta de impulso incluída nas b quartas HRTFs alvo, para obter as b segundas HRTFs alvo é garantir ao máximo que a ordem de magnitude da energia do segundo sinal de áudio alvo obtido com base nas b segundas HRTFs alvo, d segundas HRTFs, e os M primeiros sinais de áudio é o mesmo que a ordem de magnitude de energia do quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0256] Em uma segunda implementação, para uma quarta HRTF alvo, um segundo valor e todas as respostas de impulso incluídas na uma quarta HRTF alvo são multiplicados para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo.
[0257] Especificamente, para uma quarta HRTF alvo, uma soma dos quadrados de todas as respostas de impulso incluídas na quarta HRTF alvo é obtida, isto é, uma quarta soma dos quadrados Q4 é obtida, e uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondente à quarta HRTF alvo é obtida, isto é, uma terceira soma dos quadrados Q3 é obtida. Então, um segundo valor é obtido usando Q3/Q4. Cada resposta de impulso incluída na quarta HRTF alvo é multiplicada pelo segundo valor para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo. Desta forma, as b segundas HRTFs alvo são obtidas.
[0258] A segundo HRTF correspondente à quarta HRTF alvo refere-se a uma quarta HRTF alvo obtida após a segunda HRTF ser modificada. Por exemplo, assume-se que uma segunda HRTF correspondente a um mésimo alto-falante virtual é uma segunda HRTF 1, e após uma resposta de impulso de banda alta da segunda HRTF 1 ser modificada, uma quarta HRTF 1 alvo é obtida. Neste caso, a segunda HRTF 1 é uma segunda HRTF correspondendo à quarta HRTF 1 alvo.
[0259] Para cada quarta HRTF alvo, o segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo são multiplicados para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo. Isso pode garantir que a ordem de magnitude da energia do segundo sinal de áudio alvo seja a mesma que a ordem de magnitude da energia do quarto sinal de áudio alvo.
[0260] De acordo com o método nesta modalidade, com base em que a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser reduzida, pode ser assegurado ao máximo que a ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que a ordem de magnitude de energia do quarto sinal de áudio alvo.
[0261] Para um método de modificação, quando as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem, as respostas de impulso de banda alta das b segundas HRTFs referem-se às modalidades mostradas nas Figura 9 e Figura 10. Uma diferença entre esta modalidade e as modalidades mostradas nas Figura 9 e Figura 10 reside em que um fator de modificação multiplicado pode ser menor que 1 durante a modificação das respostas de impulso de banda alta das b segundas HRTFs.
[0262] Além disso, um método para modificar, em um cenário no qual "a = a1 + a2, isto é, a primeiras HRTFs incluem a1 primeiras HRTFs e a2 primeiras HRTFs, onde as a1 primeiras HRTFs são a1 primeiras HRTFs para as quais a1 alto- falante virtual localizado no primeiro lado do centro de alvo correspondem, e as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais no segundo lado do centro de alvo correspondem", respostas de impulso de banda alta das a primeiras HRTFs para obter a primeiras HRTFs alvo é descrito.
[0263] A Figura 11 é um fluxograma 6 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 11, o método nesta modalidade inclui a seguinte etapa.
[0264] Etapa S601: Multiplicar um primeiro fator de modificação e respostas de impulso de banda alta de a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta de a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que a primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo, um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0265] Especificamente, na etapa S601, para cada primeira HRTF nas a1 primeiras HRTFs, o primeiro fator de modificação e uma resposta de impulso que corresponde a cada uma frequência maior do que uma frequência pré-definida e que está incluída na primeira HRTF são multiplicados, para obter uma primeira HRTF modificada, a saber, uma terceira HRTF alvo correspondente à primeira HRTF. Desta forma, as a1 terceiras HRTFs alvo são obtidas.
[0266] Para cada primeira HRTF nas a2 primeiras HRTFs, o quinto fator de modificação e uma resposta de impulso que corresponde a cada uma frequência maior do que uma frequência pré-definida e que está incluída na primeira HRTF são multiplicados, para obter uma primeira HRTF modificada, a saber, uma quinta HRTF alvo correspondente à primeira HRTF. Desta forma, são obtidas as a2 quintas HRTFs alvo.
[0267] Um significado do primeiro fator de modificação é o mesmo que na modalidade mostrada na Figura 7, e os detalhes não são descritos aqui novamente. Um produto do quinto fator de modificação e do primeiro fator de modificação é 1. Em outras palavras, o quinto fator de modificação é inversamente proporcional ao primeiro fator de modificação.
[0268] Pode ser entendido que, se uma primeira HRTF correspondendo a um mésimo alto-falante virtual for modificado para se tornar uma terceira HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a terceira HRTF alvo, para obter um mésimo primeiro sinal de áudio convolvido. Se uma primeira HRTF correspondente a um mésimo alto-falante virtual é modificada para se tornar uma quinta HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a quinta HRTF alvo, para obter um mésimo primeiro sinal de áudio convolvido. Se uma primeira HRTF correspondente a um mésimo alto-falante virtual não for modificado, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a primeira HRTF, para obter o mésimo primeiro sinal de áudio convolvido.
[0269] Nesta modalidade, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto- falante virtual que está longe de uma posição de ouvido esquerdo atual é modificada usando o primeiro fator de modificação. Além disso, uma resposta de impulso de banda alta de uma primeira HRTF correspondente a um alto-falante virtual que está próximo à posição de ouvido esquerdo atual é modificada usando o quinto fator de modificação. O primeiro fator de modificação é inversamente proporcional ao quinto fator de modificação. Isto é equivalente que, o impacto em um segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe da posição de ouvido esquerdo atual (em outras palavras, que está perto de uma posição de ouvido direito atual) é reduzido; e impacto em um primeiro sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está perto da posição de ouvido esquerdo atual (em outras palavras, que está longe da posição de ouvido direito atual) é aprimorado. Isso pode ainda reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0270] Para garantir ao máximo que uma ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um terceiro sinal de áudio alvo obtido com base em M primeiras HRTFs e M primeiros sinais de áudio, esta modalidade é ainda melhorada com base na modalidade anterior. A Figura 12 é um fluxograma 7 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 12, o método nesta modalidade inclui as seguintes etapas.
[0271] Etapa S701: Multiplicar um primeiro fator de modificação e respostas de impulso de banda alta de a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta de a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que a primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo, um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0272] Etapa S702: Obter as a primeiras HRTFs alvo com base nas a1 terceiras HRTFs alvo e as a2 quinta HRTFs alvo.
[0273] Especificamente, para a etapa S701, consulte as descrições na etapa S601 na modalidade anterior.
[0274] A obtenção das a primeira HRTFs alvo com base nas a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo na etapa S702 pode incluir as duas implementações seguintes.
[0275] Em uma primeira implementação, um terceiro fator de modificação e cada resposta de impulso incluída nas a1 terceiras HRTFs alvo são multiplicados para obter a1 sextas HRTFs alvo e um sexto fator de modificação e cada resposta de impulso incluída nas a2 quintas HRTFs alvo são multiplicados, para obter a2 sétimas HRTFs alvo, em que asa primeiras HRTFs alvo inclui a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0276] Especificamente, para cada terceira HRTF alvo em a1 terceiras HRTF alvos, o terceiro fator de modificação e cada resposta de impulso incluída na terceira HRTF alvo são multiplicados para obter uma sexta HRTFs alvo correspondente à terceira HRTF alvo. Desta forma, as a1 sextas HRTFs alvo são obtidos.
[0277] Opcionalmente, o terceiro fator de modificação pode ser um valor predefinido maior que 1.
[0278] Para cada quinta HRTF alvo nas a2 quintas HRTFs alvo, o sexto fator de modificação e cada resposta de impulso incluída na quinta HRTF alvo são multiplicados para obter uma sétima HRTF alvo correspondente à quinta HRTF alvo. Desta forma, as a2 sétimas HRTFs alvo são obtidas.
[0279] Opcionalmente, o sexto fator de modificação pode ser um valor predefinido menor que 1.
[0280] Neste caso, as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo.
[0281] Pode ser entendido que, se uma primeira HRTF correspondendo a um mésimo alto-falante virtual for modificado para se tornar uma sexta HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a sexta HRTF alvo, para obter um mésimo primeiro sinal de áudio convolvido. Se uma primeira HRTF correspondente a um mésimo alto-falante virtual é modificada para se tornar uma sétima HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a sétima HRTF alvo, para obter um mésimo primeiro sinal de áudio convolvido. Se uma primeira HRTF correspondente a um mésimo alto-falante virtual não for modificado, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a primeira HRTF, para obter o mésimo primeiro sinal de áudio convolvido.
[0282] O objetivo desta implementação é assegurar ao máximo que a ordem de magnitude da energia do primeiro sinal de áudio alvo obtida com base nas a primeiras HRTFs alvo, c primeiras HRTFs, e nos M primeiros sinais de áudio é a mesmo que a ordem de magnitude de energia do terceiro sinal de áudio alvo obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio.
[0283] Em uma segunda implementação, para uma terceira HRTF alvo, um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo são multiplicados para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo. Para uma quinta HRTF alvo, um terceiro valor e todas as respostas de impulso incluídas na uma quinta HRTF alvo são multiplicados, para obter uma sétima HRTF alvo correspondente à uma quinta HRTF alvo, onde o terceiro valor é uma razão de uma quinta soma de quadrados a uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quinta HRTF alvo. As a primeiras HRTFs alvo incluem a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0284] Especificamente, para uma terceira HRTF alvo, uma soma dos quadrados de todas as respostas de impulso incluídas na terceira HRTF alvo é obtida, ou seja, uma segunda soma dos quadrados Q2 é obtida; e uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo à terceira HRTF alvo é obtida, isto é, uma primeira soma dos quadrados Q1 é obtida. Então, um primeiro valor é obtido usando Q1/Q2. Cada resposta de impulso incluída em uma terceira HRTF alvo é multiplicada pelo primeiro valor para obter uma sexta HRTF alvo correspondente a uma terceira HRTF alvo. Desta forma, as a1 sextas HRTFs alvo são obtidos.
[0285] A primeira HRTF correspondente à terceira HRTF alvo é a mesma que o descrito na modalidade mostrada na Figura 8, e os detalhes não são descritos aqui novamente.
[0286] Para uma quinta HRTF alvo, é obtida uma soma dos quadrados de todas as respostas de impulso incluídas na quinta HRTF alvo, isto é, uma quinta soma dos quadrados Q5 é obtida; e uma soma dos quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondente à quinta HRTF alvo é obtida, isto é, é obtida uma sexta soma dos quadrados Q6. Então, um terceiro valor é obtido usando
Q5/Q6. Cada resposta de impulso incluída em uma quinta HRTF alvo é multiplicada pelo terceiro valor para obter uma sétima HRTF alvo correspondente a uma quinta HRTF alvo. Desta forma, as a2 sétimas HRTFs alvo são obtidas.
[0287] Neste caso, as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo.
[0288] Para a primeira HRTF correspondente ao quinto HRTF alvo, consulte as descrições da primeira HRTF correspondente à terceira HRTF alvo. Detalhes não são descritos novamente.
[0289] Nesta implementação, pode ser assegurado que a ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo.
[0290] De acordo com o método nesta modalidade, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser adicionalmente reduzida, a pode ser assegurado ao máximo que a ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo.
[0291] Além disso, um método para modificar, em um cenário em que "b = b1 + b2, as b1 segundas HRTFs são b1 segundas HRTFs às quais b1 alto-falantes virtuais localizados no segundo lado do centro de alvo correspondem, e as b2 segundas HRTFs são b2 segundas HRTFs às quais b2 alto- falantes virtuais no primeiro lado do centro de alvo correspondem", são descritas respostas de impulso de banda alta das b segundas HRTFs para obter b segundas HRTFs alvo.
[0292] A Figura 13 é um fluxograma 8 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 13, o método nesta modalidade inclui a seguinte etapa.
[0293] Etapa S801: Multiplicar um segundo fator de modificação e respostas de impulso de banda alta de b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta de b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo, um produto do segundo fator de modificação e o sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0294] Especificamente, na etapa S801, para cada segunda HRTF nas b1 segundas HRTFs, o segundo fator de modificação e uma resposta de impulso que corresponde a cada frequência maior do que uma frequência predefinida e que está incluída no segundo HRTF são multiplicados, para obter uma HRTF segunda modificada, a saber, uma quarta HRTF alvo correspondente ao segunda HRTF. Desta forma, as b1 quartas HRTFs alvo são obtidos.
[0295] Para cada segundo HRTF nas b2 segundas HRTFs, o sétimo fator de modificação e uma resposta de impulso que corresponde a cada frequência maior do que uma frequência predefinida e que está incluída no segundo HRTF são multiplicados, para obter uma segunda HRTF modificada, ou seja, uma oitava HRTF alvo correspondente à segunda HRTF. Desta forma, as b2 oitavas HRTFs alvo são obtidas.
[0296] Um significado do segundo fator de modificação é o mesmo que na modalidade mostrada na Figura 9, e os detalhes não são descritos aqui novamente. Um produto do sétimo fator de modificação e do segundo fator de modificação é 1. Em outras palavras, o sétimo fator de modificação é inversamente proporcional ao segundo fator de modificação.
[0297] Pode ser entendido que, se uma segunda HRTF correspondente a um mésimo alto-falante virtual for modificado para se tornar uma quarta HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a quarta HRTF alvo, para obter mésimo segundo sinal de áudio convolvido. Se uma segunda HRTF correspondente a um mésimo alto-falante virtual é modificada para se tornar uma oitava HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a oitava HRTF alvo, para obter um mésimo segundo sinal de áudio convolvido. Se uma segunda HRTF correspondente a um mésimo alto-falante virtual não for modificado, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a segunda HRTF, para obter o mésimo segundo sinal de áudio convolvido.
[0298] Nesta modalidade, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto- falante virtual que está longe do ouvido direito é modificada usando o segundo fator de modificação. Além disso, uma resposta de impulso de banda alta de uma segunda HRTF correspondente a um alto-falante virtual que está próximo ao ouvido direito é modificada usando o sétimo fator de modificação. O segundo fator de modificação é inversamente proporcional ao sétimo fator de modificação. Isto é equivalente que, o impacto em um primeiro sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido pelo alto-falante virtual que está longe de uma posição de ouvido direito atual (em outras palavras, que está perto de uma posição de ouvido esquerdo atual) é reduzido; e impacto em um segundo sinal de áudio alvo causado por um sinal de banda alta em um primeiro sinal de áudio emitido por um alto-falante virtual que está perto da posição de ouvido direito atual (em outras palavras, que está longe da posição de ouvido esquerdo atual) é aprimorado. Isso pode ainda reduzir a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo.
[0299] Para garantir ao máximo que uma ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo obtido com base em M segundas HRTFs e M primeiros sinais de áudio, esta modalidade é melhorada com base na modalidade anterior. A Figura 14 é um fluxograma 9 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 14, o método nesta modalidade inclui as seguintes etapas.
[0300] Etapa S901: Multiplicar um segundo fator de modificação e respostas de impulso de banda alta de b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta de b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo, um produto do segundo fator de modificação e o sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0301] Etapa S902: Obter as b segundas HRTFs alvo com base nos b1 quartas HRTFs alvo e nas b2 oitavas HRTFs alvo.
[0302] Especificamente, para a etapa S901, consulte as descrições da etapa S801 na modalidade anterior.
[0303] A obtenção das b segundas HRTFs alvo com base nas b1 quartas HRTFs alvo e b2 oitavas HRTFs alvo na etapa S902 pode incluir as seguintes duas implementações.
[0304] Em uma primeira implementação, um quarto fator de modificação e cada resposta de impulso incluída nas b1 quartas HRTFs alvo são multiplicados, para obter b1 nonas HRTFs alvo, e um oitavo fator de modificação e cada resposta de impulso incluída em b2 oitavas HRTFs alvo são multiplicados, para obter b2 décimas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo.
[0305] Especificamente, para cada quarta HRTF alvo nas b1 quartas HRTFs alvo, o quarto fator de modificação e cada resposta de impulso incluída na quarta HRTF alvo são multiplicados para obter uma nona HRTF alvo correspondente à quarta HRTF alvo. Desta forma, as b1 nonas HRTFs alvo são obtidas.
[0306] Opcionalmente, o quarto fator de modificação pode ser um valor predefinido maior que 1.
[0307] Para cada oitava HRTF alvo nas b2 oitavas HRTFs alvo, o oitavo fator de modificação e cada resposta de impulso incluída na oitava HRTF alvo são multiplicados para obter uma décima HRTF alvo correspondente à oitava HRTF alvo. Desta forma, as b2 décimas HRTFs alvo são obtidas.
[0308] Opcionalmente, o oitavo fator de modificação pode ser um valor predefinido maior que 0 e menor que 1.
[0309] Neste caso, as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo.
[0310] Pode ser entendido que, se uma segunda HRTF correspondente a um mésimo alto-falante virtual for modificado para se tornar uma nona HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a nona HRTF alvo, para obter mésimo segundo sinal de áudio convolvido. Se uma segunda HRTF correspondente a um mésimo alto-falante virtual é modificada para se tornar uma décima HRTF alvo, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a décima HRTF alvo, para obter um mésimo segundo sinal de áudio convolvido. Se uma segunda HRTF correspondente a um mésimo alto-falante virtual não for modificado, um mésimo primeiro sinal de áudio emitido pelo mésimo alto-falante virtual é convolvido com a segunda HRTF, para obter o mésimo segundo sinal de áudio convolvido.
[0311] O objetivo desta implementação é assegurar ao máximo que a ordem de magnitude da energia do segundo sinal de áudio alvo obtida com base nas b segundas HRTFs alvo, d segundas HRTFs, e nos M primeiros sinais de áudio é a mesmo que a ordem de magnitude de energia do quarto sinal de áudio alvo obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0312] Em uma segunda implementação, para uma quarta HRTF alvo, um segundo valor e todas as respostas de impulso incluídas na uma quarta HRTF alvo são multiplicados para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo. Para uma oitava HRTF alvo, um quarto valor e todas as respostas de impulso incluídas na oitava HRTF alvo são multiplicados, para obter um décima HRTF alvo correspondente à oitava HRTF alvo, onde o quarto valor é uma razão de uma sétima soma dos quadrados a uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na oitava HRTF alvo. As b segundas HRTFs alvo incluem b1 nonas HRTFs alvos e b2 décimas HRTFs alvo.
[0313] Especificamente, para uma quarta HRTF alvo, uma soma dos quadrados de todas as respostas de impulso incluídas na quarta HRTF alvo é obtida, isto é, uma quarta soma dos quadrados Q4 é obtida; e uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondente à quarta HRTF alvo é obtida, isto é, uma terceira soma dos quadrados Q3 é obtida. Então, um segundo valor é obtido usando Q3/Q4. Cada resposta de impulso incluída na uma quarta HRTF alvo é multiplicada pelo segundo valor para obter uma nona HRTF alvo correspondente à quarta HRTF alvo. Desta forma, as b1 nonas HRTFs alvo são obtidas.
[0314] A segunda HRTF correspondente à quarta HRTF alvo é a mesma que o descrito na modalidade mostrada na Figura 6, e os detalhes não são descritos aqui novamente.
[0315] Para um oitava HRTF alvo, é obtida uma soma dos quadrados de todas as respostas de impulso incluídas na oitava HRTF alvo, ou seja, uma sétima soma dos quadrados Q7 é obtida; e uma soma dos quadrados de todos respostas de impulso incluídas em uma segunda HRTF correspondente a uma oitava HRTF alvo é obtida, isto é, um oitavo soma dos quadrados Q8 é obtida. Então, um quarto valor é obtido usando Q7/Q8. Cada resposta de impulso incluída em uma oitava HRTF alvo é multiplicada pelo quarto valor para obter uma décima HRTF alvo correspondente a uma oitava HRTF alvo. Desta forma, as b2 décimas HRTFs alvo são obtidas.
[0316] Neste caso, as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo.
[0317] Para a segunda HRTF correspondente à oitava HRTF alvo, consulte as descrições da segunda HRTF correspondente à quarta HRTF alvo. Detalhes não são descritos novamente.
[0318] Nesta implementação, pode ser assegurado que a ordem de magnitude da energia do segundo sinal de áudio alvo e a ordem de magnitude da energia do quarto sinal de áudio alvo.
[0319] De acordo com o método nesta modalidade, a diafonia entre o primeiro sinal de áudio alvo e o segundo sinal de áudio alvo pode ser adicionalmente reduzida, a pode ser assegurado ao máximo que a ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que a ordem de magnitude de energia do quarto sinal de áudio alvo.
[0320] Pode ser entendido que a modalidade mostrada em qualquer uma das Figura 7 e Figura 8 pode ser combinado com a modalidade mostrada em qualquer uma das Figura 9, Figura 10, Figura 13 e Figura 14, e a modalidade mostrada em qualquer uma das Figura 11 e Figura 12 pode ser combinado com a modalidade mostrada em qualquer uma das Figura 9, Figura 10, Figura 13 e Figura 14.
[0321] Em uma modalidade nas modalidades anteriores mostradas na Figura 8, Figura 10, Figura 12 e Figura 14, uma HRTF é modificada para garantir ao máximo que uma ordem de magnitude de energia de um segundo sinal de áudio alvo é a mesma que uma ordem de magnitude de energia de um quarto sinal de áudio alvo, e que uma ordem de magnitude de energia de um primeiro sinal de áudio alvo é igual a uma ordem de magnitude de energia de um terceiro sinal de áudio alvo. Alternativamente, o primeiro sinal de áudio alvo pode ser ajustado para garantir que a ordem de magnitude de energia do segundo sinal de áudio alvo seja a mesma que a ordem de magnitude de energia do quarto sinal de áudio alvo, e a ordem de magnitude de energia do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo. A Figura 15 é um fluxograma 10 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 15, o método nesta modalidade inclui as seguintes etapas.
[0322] Etapa S1001: Obter uma nona soma dos quadrados das amplitudes de um primeiro sinal de áudio alvo.
[0323] Etapa S1002: Obter uma décima soma dos quadrados das amplitudes de um terceiro sinal de áudio alvo, onde o terceiro sinal de áudio alvo é um sinal de áudio obtido com base nas M primeiras HRTFs e M primeiros sinais de áudio.
[0324] Etapa S1003: Obter uma primeira razão da décima soma dos quadrados com a nona soma dos quadrados.
[0325] Etapa S1004: Multiplicar cada amplitude do primeiro sinal de áudio alvo pela primeira razão, para obter um primeiro sinal de áudio alvo ajustado.
[0326] Especificamente, as etapas S1001 a S1004 são "ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, onde a primeira ordem de magnitude é uma ordem de magnitude de energia do terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio."
[0327] Além disso, para melhorar a eficiência de renderização, após o primeiro sinal de áudio alvo ser obtido, a ordem de magnitude de energia do primeiro sinal de áudio alvo pode, alternativamente, ser ajustada para uma ordem de magnitude predefinida. Desta forma, o terceiro sinal de áudio alvo não precisa ser obtido.
[0328] Nesta modalidade, é assegurado que a ordem de magnitude de energia ajustada do primeiro sinal de áudio alvo é a mesma que a ordem de magnitude de energia do terceiro sinal de áudio alvo.
[0329] A Figura 16 é um fluxograma 11 de um método de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 16, o método nesta modalidade inclui as seguintes etapas.
[0330] Etapa S1101: Obter uma décima primeira soma dos quadrados das amplitudes de um segundo sinal de áudio alvo.
[0331] Etapa S1102: Obter uma décima segunda soma dos quadrados das amplitudes de um quarto sinal de áudio alvo, onde o quarto sinal de áudio alvo é um sinal de áudio obtido com base em M segundas HRTFs e M primeiros sinais de áudio.
[0332] Etapa S1103: Obter uma segunda razão entre a décima segunda soma dos quadrados e a décima primeira soma dos quadrados.
[0333] Etapa S1104: Multiplicar cada amplitude do segundo sinal de áudio alvo pela segunda razão, para obter um segundo sinal de áudio alvo ajustado.
[0334] Especificamente, as etapas S1101 a S1104 são uma implementação específica de "ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, onde a segunda ordem de magnitude é uma ordem de magnitude de energia do quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio".
[0335] Além disso, para melhorar a eficiência de renderização, após o segundo sinal de áudio alvo ser obtido, a ordem de magnitude de energia do segundo sinal de áudio alvo pode, alternativamente, ser ajustada para uma ordem de magnitude predefinida. Desta forma, o quarto sinal de áudio alvo não precisa ser obtido.
[0336] Nesta modalidade, é assegurado que a ordem de magnitude de energia do segundo sinal de áudio alvo é a mesma que a ordem de magnitude de energia do quarto sinal de áudio alvo.
[0337] Qualquer uma das modalidades mostradas nas Figura 7 e Figura 11 pode ser combinada com a modalidade mostrada na Figura 15, e qualquer uma das modalidades mostradas nas Figura 9 e Figura 13 pode ser combinado com a modalidade mostrada na Figura 16.
[0338] Para funções implementadas por uma extremidade de recepção de sinal de áudio, o anterior descreve as soluções fornecidas nas modalidades deste pedido. Pode ser entendido que, para implementar as funções anteriores, a extremidade de recepção de sinal de áudio inclui estruturas de hardware e/ou módulos de software correspondentes para realizar as funções. Com referência às unidades e etapas do algoritmo nos exemplos descritos nas modalidades divulgadas neste pedido, as modalidades deste pedido podem ser implementadas na forma de hardware ou uma combinação de hardware e software de computador. Se uma função é executada por hardware ou hardware acionado por software de computador depende de aplicações específicas e restrições de projeto das soluções técnicas. Um técnico no assunto pode usar métodos diferentes para implementar as funções descritas para cada aplicação particular, mas não deve ser considerado que a implementação vai além do escopo das soluções técnicas das modalidades deste pedido.
[0339] Nas modalidades deste pedido, a extremidade de recepção de sinal de áudio pode ser dividida em módulos funcionais com base nos exemplos de métodos anteriores. Por exemplo, cada módulo de função pode ser obtido através da divisão com base em cada função correspondente, ou duas ou mais funções podem ser integradas em uma unidade de processamento. A unidade integrada anterior pode ser implementada na forma de hardware, ou pode ser implementada na forma de um módulo funcional de software. Deve-se notar que, nas modalidades deste pedido, a divisão em módulos é um exemplo, e é meramente uma divisão de função lógica. Durante a implementação real, pode haver outra maneira de divisão.
[0340] A Figura 17 é um diagrama estrutural esquemático 1 de um aparelho de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 17, o aparelho nesta modalidade inclui um módulo de processamento 31, um módulo de obtenção 32, e um módulo de modificação 33.
[0341] O módulo de processamento 31 é configurado para obter M primeiros sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais, onde M é um número inteiro positivo, e os M alto- falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio.
[0342] O módulo de obtenção 32 é configurado para obter M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto- falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais.
[0343] O módulo de modificação 33 é configurado para modificar respostas de impulso de banda alta de a primeiras HRTFs, para obter a primeiras HRTFs alvo, e modificar as respostas de impulso de banda alta de b segundas HRTFs, para obter b segundas HRTFs alvo, onde 1 ≤ a ≤ M, 1 ≤ b ≤ M, e ambos a e b são inteiros.
[0344] O módulo de obtenção 32 é ainda configurado para: obter, com base nas a primeiras HRTFs alvo, c primeiras
HRTFs, e nos M primeiros sinais de áudio, um primeiro sinal de áudio alvo, correspondente à posição de ouvido esquerdo atual; e obter, com base em d segundas HRTFs, as b segundas HRTFs alvo e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondendo à posição de ouvido direito atual. As c primeiras HRTFs são HRTFs diferentes das a primeiras HRTFs nas M primeiras HRTFs, as d segundas HRTFs são HRTFs diferentes das b segundas HRTFs nas M segundas HRTFs, a + c = M, e b + d = M.
[0345] O aparelho nesta modalidade pode ser configurado para realizar as soluções técnicas das modalidades de método anteriores. Os princípios de implementação e os efeitos técnicos do aparelho são semelhantes aos das modalidades de método anteriores. Detalhes não são descritos novamente.
[0346] Em um projeto possível, o módulo de obtenção 32 é especificamente configurado para: obter M primeiras posições dos M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs, onde as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs.
[0347] Em um projeto possível, o módulo de obtenção 32 é especificamente configurado para: obter M segundas posições dos M alto-falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e as correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs, onde as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs.
[0348] Em um projeto possível, o módulo de obtenção 32 é especificamente configurado para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs das a primeiras HRTFs alvo e das c primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos.
[0349] Em um projeto possível, o módulo de obtenção 32 é especificamente configurado para: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as d segundas HRTFs e as b segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
[0350] Em um projeto possível, as a primeiras HRTFs são a primeiras HRTFs às quais a alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0351] Neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e as respostas de impulso banda alta incluídas nas a primeiras
HRTFs, para obter as a primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1.
[0352] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a terceiras HRTFs alvo, para obter a primeiras HRTFs alvo, onde o terceiro fator de modificação é um valor maior que 1.
[0353] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta incluídas nas a primeiras HRTFs, para obter a terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo.
[0354] Em um projeto possível, as b segundas HRTFs são b segundas HRTFs às quais b alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0355] Neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs, para obter as b segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1. Alternativamente, neste projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluídos nas b quartas HRTFs alvo, para obter as b segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior do que 1.
[0356] Alternativamente, neste projeto possível, o módulo de modificação é configurado especificamente para: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta incluídos nas b segundas
HRTFs, para obter as b quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na uma quarta HRTF alvo, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo.
[0357] Em um projeto possível, a = a1 + a2. As a1 primeiras HRTFs são as a1 primeiras HRTFs às quais correspondem a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo, e as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0358] Neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e resposta de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 HRTFs alvo, onde as a primeiras HRTFs alvo incluem as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo.
[0359] Um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1.
[0360] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso incluída nas a1 terceiras HRTFs alvo, para obter a1 sextas HRTFs alvo, e multiplicar um sexto fator de modificação e cada resposta de impulso incluída nas a2 quintas HRTFs alvo, para obter a2 sétimas HRTFs alvo, onde as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo, o terceiro fator de modificação é um valor maior do que 1, e o sexto fator de modificação é um valor maior do que 0 e menor do que 1.
[0361] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs,
para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, onde um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso incluídas na uma terceira HRTF alvo, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, onde o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas na uma terceira HRTF alvo; e para uma quinta HRTF alvo, multiplicar um terceiro valor e todas as respostas de impulso incluídas na uma quinta HRTF alvo, para obter uma sétima HRTF alvo correspondendo a uma quinta HRTF alvo, onde o terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma quinta HRTF alvo; e as a primeiras HRTFs alvo incluem as a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
[0362] Em um projeto possível, b = b1 + b2. As b1 segundas HRTFs são b1 segundas HRTFs às quais b1 alto-
falantes virtuais localizados no segundo lado do centro de alvo correspondem, e as b2 segundas HRTFs de são b2 segundas HRTFs às quais b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo corresponde. O primeiro lado é um lado que está no centro de alvo e que está longe da posição de ouvido esquerdo atual, e o segundo lado é um lado que está fora do centro de alvo e que está longe da posição de ouvido direito atual. O centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
[0363] Neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo.
[0364] Um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1.
[0365] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso incluída nas b1 quartas HRTFs alvo, para obter b1 nonas HRTFs alvo, e multiplicar um oitavo fator de modificação e cada resposta de impulso incluída em b2 oitavas HRTFs alvo, para obter b2 décimas HRTFs alvo, onde as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo, o quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1.
[0366] Alternativamente, neste projeto possível, o módulo de modificação 33 é especificamente configurado para: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, onde um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso incluídas na quarta HRTF alvo, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, onde o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma dos quadrados, a terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo à quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso incluídas na uma quarta HRTF alvo; e para uma oitava HRTF alvo, multiplicar um quarto valor e todas as respostas de impulso incluídas na oitava HRTF alvo, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo, onde o quarto valor é uma razão de uma sétima soma dos quadrados para uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso incluídas no oitava HRTF alvo; e as b segundas HRTFs alvo incluem as b1 nonas HRTFs alvo e b2 décimas HRTFs alvo.
[0367] O aparelho nesta modalidade pode ser configurado para realizar as soluções técnicas das modalidades de método anteriores. Os princípios de implementação e os efeitos técnicos do aparelho são semelhantes aos das modalidades de método anteriores. Detalhes não são descritos novamente.
[0368] A Figura 18 é um diagrama estrutural esquemático 2 de um aparelho de processamento de áudio de acordo com uma modalidade deste pedido. Com referência à Figura 18, com base no aparelho mostrado na Figura 17, o aparelho nesta modalidade inclui ainda um módulo de ajuste
34.
[0369] O módulo de ajuste 34 é configurado para: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, onde a primeira ordem de magnitude é uma ordem de magnitude de energia do terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos
M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, onde a segunda ordem de magnitude é uma ordem de magnitude de energia do quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
[0370] O aparelho nesta modalidade pode ser configurado para realizar as soluções técnicas das modalidades de método anteriores. Os princípios de implementação e os efeitos técnicos do aparelho são semelhantes aos das modalidades de método anteriores. Detalhes não são descritos novamente.
[0371] Uma modalidade deste pedido fornece um meio de armazenamento legível por computador. O meio de armazenamento legível por computador armazena uma instrução, e quando a instrução é executada, um computador é habilitado para realizar o método na modalidade de método anterior deste pedido.
[0372] Nas várias modalidades fornecidas neste pedido, deve-se entender que o aparelho e método divulgados podem ser implementados de outras maneiras. Por exemplo, as modalidades de aparelho descritas são meramente exemplos. Por exemplo, a divisão em unidades é apenas uma divisão lógica da função e pode ser outra divisão na implementação real. Por exemplo, uma pluralidade de unidades ou componentes pode ser combinada ou integrada em outro sistema, ou alguns recursos podem ser ignorados ou não realizados. Além disso, os acoplamentos mútuos exibidos ou discutidos, acoplamentos diretos ou conexões de comunicação podem ser implementados usando algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implementados em forma eletrônica, mecânica ou outra.
[0373] As unidades descritas como partes separadas podem ou não estar fisicamente separadas, e as partes exibidas como unidades podem ou não ser unidades físicas, podem estar localizadas em uma posição, ou podem ser distribuídas em uma pluralidade de unidades de rede. Algumas ou todas as unidades podem ser selecionadas com base nos requisitos reais para atingir os objetivos das soluções das modalidades.
[0374] Além disso, as unidades funcionais nas modalidades deste pedido podem ser integradas em uma unidade de processamento, ou cada uma das unidades pode existir sozinha fisicamente, ou duas ou mais unidades são integradas em uma unidade. A unidade integrada pode ser implementada em uma forma de hardware ou pode ser implementada em uma forma de hardware combinado com uma unidade funcional de software.
[0375] As descrições anteriores são apenas implementações específicas da presente invenção, mas não se destinam a limitar o escopo de proteção da presente invenção. Qualquer variação ou substituição prontamente determinada por um técnico no assunto dentro do escopo técnico divulgado na presente invenção cairá dentro do escopo de proteção da presente invenção. Portanto, o escopo de proteção da presente invenção deve estar sujeito ao escopo de proteção das reivindicações.

Claims (26)

REIVINDICAÇÕES
1. Método de processamento de áudio, caracterizado pelo fato de que compreende: obter (101) M primeiros sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais, em que M é um número inteiro positivo, e os M alto-falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio; obter (102) M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto- falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais; modificar (103) respostas de impulso de banda alta de uma primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de primeiras HRTFs alvo, e modificar respostas de impulso de banda alta de uma segunda quantidade de segundas HRTFs, para obter uma segunda quantidade de segundas HRTFs alvo, em que a primeira quantidade não é menor que 1 e não é maior que M, a segunda quantidade não é menor que 1 e não é maior que M; e obter (104), com base na primeira quantidade de primeiras HRTFs alvo, uma terceira quantidade de primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondendo à posição de ouvido esquerdo atual, e obter, com base em uma quarta quantidade de segundas HRTFs, a segunda quantidade de segundas HRTFs alvo, e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição atual da ouvido direito, em que a terceira quantidade de primeiras HRTFs são HRTFs diferentes da primeira quantidade das primeiras HRTFs nas M primeiras HRTFs, a quarta quantidade de segundas HRTFs são HRTFs diferentes da segunda quantidade de segundas HRTFs nas M segundas HRTFs, a soma da primeira quantidade e da terceira quantidade é igual a M, e a soma da segunda quantidade e da quarta quantidade é igual a M.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que as correspondências entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs são pré-armazenadas, e a obtenção de M primeiras HRTFs compreende: obter M primeiras posições dos M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e nas correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs; e a obtenção de M segundas HRTFs compreende: obter M segundas posições dos M alto-falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e nas correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que obter, com base na primeira quantidade de primeiras HRTFs alvo, a terceira quantidade de primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondente à posição de orelha esquerda atual compreende: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs da primeira quantidade de primeiras HRTFs alvo e terceira quantidade de primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos; e em que a obtenção, com base em uma quarta quantidade de segundas HRTFs, da segunda quantidade de segundas HRTFs alvo e dos M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição de ouvido direito atual compreende: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs da quarta quantidade de segundas HRTFs e da terceira quantidade de segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a primeira quantidade de primeiras HRTFs é a primeira quantidade de primeiras HRTFs às quais uma primeira quantidade de alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto- falantes virtuais.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que a modificação das respostas de impulso de banda alta de uma primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de primeiras HRTFs alvo compreende um dos seguintes: multiplicar um primeiro fator de modificação e as respostas de impulso banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter a primeira quantidade de primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1; multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso compreendida na primeira quantidade de terceiras HRTFs alvo, para obter a primeira quantidade de primeiras HRTFs alvo, em que o terceiro fator de modificação é um valor maior que 1; e multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso compreendidas na uma terceira HRTF alvo, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, em que o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma terceira HRTF alvo.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a segunda quantidade de segundas HRTFs é uma segunda quantidade de segundas HRTFs às quais uma segunda quantidade de alto- falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a modificação das respostas de impulso de banda alta de uma segunda quantidade de segundas HRTFs, para obter uma segunda quantidade de segundas HRTFs alvo compreende um dos seguintes: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter a segunda quantidade de segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter uma segunda quantidade de quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso compreendida na segunda quantidade de quartas HRTFs alvo, para obter a segunda quantidade de segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior que 1; e multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter a segunda quantidade de quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso compreendidas na uma quarta HRTF alvo, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, em que o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma quarta HRTF alvo.
8. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que uma primeira quantidade é igual a a1 + a2, as a1 primeiras HRTFs são a1 primeiras HRTFs às quais a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondem, as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que a modificação das respostas de impulso de banda alta de uma primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de primeiras HRTFs alvo compreende um dos seguintes: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que a primeira quantidade de primeiras HRTFs alvo compreende as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo; em que um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso compreendida nas a1 terceiras HRTFs alvo, para obter a1 sextas HRTFs alvo, e multiplicar um sexto fator de modificação e cada resposta de impulso compreendida nas a2 quintas HRTFs alvo, para obter a2 sétimas HRTFs alvo, em que a primeira quantidade de primeiras HRTFs alvo compreendem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo, o terceiro fator de modificação é um valor maior do que 1, e o sexto fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso compreendidas na uma terceira HRTF alvo, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, em que o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma terceira HRTF alvo; e para uma quinta HRTF alvo, multiplicar um terceiro valor e todas as respostas de impulso compreendidas na uma quinta HRTF alvo, para obter uma sétima HRTF alvo correspondendo a uma quinta HRTF alvo, em que o terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma quinta HRTF alvo; e a primeira quantidade de primeiras HRTFs alvo compreendem a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
10. Método, de acordo com qualquer uma das reivindicações 1 a 5, 8 e 9, caracterizado pelo fato de que a segunda quantidade é igual à soma de b1 e b2, as b1 segundas HRTFs são b1 segundas HRTFs às quais correspondem b1 alto- falantes virtuais localizados no segundo lado do centro de alvo, as b2 segundas HRTFs são b2 segundas HRTFs às quais b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a modificação das respostas de impulso de banda alta de uma segunda quantidade de segundas HRTFs, para obter uma segunda quantidade de segundas HRTFs alvo compreende um dos seguintes: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que a segunda quantidade de segundas HRTFs alvo compreende as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo; em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso compreendida nas b1 quartas HRTFs alvo, para obter b1 nonas HRTFs alvo, e multiplicar um oitavo fator de modificação e cada resposta de impulso compreendida em b2 oitavas HRTFs alvo, para obter b2 décimas HRTFs alvo, em que a segunda quantidade de segundas HRTFs alvo compreende as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo, o quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso compreendidas na quarta HRTF alvo, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, em que o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma dos quadrados, a terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso compreendida em uma segunda HRTF correspondendo à quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso compreendidas na uma quarta HRTF alvo; e para uma oitava HRTF alvo, multiplicar um quarto valor e todas as respostas de impulso compreendidas na oitava HRTF alvo, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo, em que o quarto valor é uma razão de uma sétima soma dos quadrados para uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas no oitava HRTF alvo; e a segunda quantidade de segundas HRTFs alvo compreende as b1 nonas HRTFs alvo e b2 décimas HRTFs alvo.
12. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que compreende ainda: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, em que a primeira ordem de magnitude é uma ordem de magnitude de energia de um terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, em que a segunda ordem de magnitude é uma ordem de magnitude de energia de um quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
13. Aparelho de processamento de áudio, caracterizado pelo fato de que compreende: um módulo de processamento (31), configurado para obter M primeiros sinais de áudio pelo processamento de um sinal de áudio a ser processado por M alto-falantes virtuais, em que M é um número inteiro positivo, e os M alto-falantes virtuais estão em uma correspondência um para um com os M primeiros sinais de áudio; um módulo de obtenção (32), configurado para obter M primeiras funções de transferência relacionadas à cabeça HRTFs e M segundas HRTFs, em que as M primeiras HRTFs são HRTFs às quais os M primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido esquerdo, as M segundas HRTFs são HRTFs às quais os primeiros sinais de áudio correspondem dos M alto-falantes virtuais a uma posição de ouvido direito, as M primeiras HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais, e as M segundas HRTFs estão em uma correspondência um para um com os M alto-falantes virtuais; e um módulo de modificação (33), configurado para: modificar respostas de impulso de banda alta de uma primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de primeiras HRTFs alvo, e modificar respostas de impulso de banda alta de uma segunda quantidade de segundas HRTFs, para obter uma segunda quantidade de segundas HRTFs alvo, em que a primeira quantidade não é menor que 1 e não é maior que M, a segunda quantidade não é menor que 1 e não é maior que M; em que o módulo de obtenção (32) é ainda configurado para: obter, com base na primeira quantidade de primeiras HRTFs alvo, a terceira quantidade de primeiras HRTFs, e os M primeiros sinais de áudio, um primeiro sinal de áudio alvo correspondendo à posição de ouvido esquerdo atual, e obter, com base em uma quarta quantidade de segundas HRTFs, a segunda quantidade de segundas HRTFs alvo, e os M primeiros sinais de áudio, um segundo sinal de áudio alvo correspondente à posição atual da ouvido direito, em que a terceira quantidade de primeiras HRTFs são HRTFs diferentes da primeira quantidade das primeiras HRTFs nas M primeiras HRTFs, a quarta quantidade de segundas HRTFs são HRTFs diferentes da segunda quantidade de segundas HRTFs nas M segundas HRTFs, a soma da primeira quantidade e da terceira quantidade é M, e a soma da segunda quantidade e da quarta quantidade é igual a M.
14. Aparelho, de acordo com a reivindicação 13, caracterizado pelo fato de que o módulo de obtenção (32) é ainda configurado para realizar pelo menos um dos seguintes: obter M primeiras posições dos M alto-falantes virtuais em relação à posição de ouvido esquerdo atual; e determinar, com base nas M primeiras posições e correspondências, que M HRTFs correspondentes às M primeiras posições são as M primeiras HRTFs, em que as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs; e obter M segundas posições dos M alto-falantes virtuais em relação à posição de ouvido direito atual; e determinar, com base nas M segundas posições e correspondências, que M HRTFs correspondentes às M segundas posições são as M segundas HRTFs, em que as correspondências são correspondências pré-armazenadas entre uma pluralidade de posições predefinidas e uma pluralidade de HRTFs.
15. Aparelho, de acordo com a reivindicação 13 ou 14, caracterizado pelo fato de que o módulo de obtenção (32) é ainda configurado para realizar pelo menos um dos seguintes: convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs da primeira quantidade de primeiras HRTFs alvo e terceira quantidade de primeiras HRTFs, para obter M primeiros sinais de áudio convolvidos; e obter o primeiro sinal de áudio alvo com base nos M primeiros sinais de áudio convolvidos; e convolver cada um dos M primeiros sinais de áudio com uma HRTF correspondente em todas as HRTFs da quarta quantidade de segundas HRTFs e da terceira quantidade de segundas HRTFs alvo, para obter M segundos sinais de áudio convolvidos; e obter o segundo sinal de áudio alvo com base nos segundos sinais de áudio convolvidos.
16. Aparelho, de acordo com qualquer uma das reivindicações 13 a 15, caracterizado pelo fato de que a primeira quantidade de primeiras HRTFs é a primeira quantidade de primeiras HRTFs às quais uma primeira quantidade de alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondente, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto- falantes virtuais.
17. Aparelho, de acordo com a reivindicação 16, caracterizado pelo fato de que o módulo de modificação (33) é ainda configurado para realizar pelo menos um dos seguintes: multiplicar um primeiro fator de modificação e as respostas de impulso banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter a primeira quantidade de primeiras HRTFs alvo, em que o primeiro fator de modificação é maior do que 0 e menor do que 1; multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso compreendida na primeira quantidade de terceiras HRTFs alvo, para obter a primeira quantidade de primeiras HRTFs alvo, em que o terceiro fator de modificação é um valor maior que 1; e multiplicar um primeiro fator de modificação e as respostas de impulso de banda alta compreendidas na primeira quantidade de primeiras HRTFs, para obter uma primeira quantidade de terceiras HRTFs alvo, em que o primeiro fator de modificação é um valor maior do que 0 e menor do que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso compreendidas na uma terceira HRTF alvo, para obter uma primeira HRTF alvo correspondente à terceira HRTF alvo, em que o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma terceira HRTF alvo.
18. Aparelho, de acordo com qualquer uma das reivindicações 13 a 17, caracterizado pelo fato de que a segunda quantidade de segundas HRTFs é uma segunda quantidade de segundas HRTFs às quais uma segunda quantidade de alto- falantes virtuais localizados em um segundo lado do centro de alvo correspondente, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
19. Aparelho, de acordo com a reivindicação 18, caracterizado pelo fato de que o módulo de modificação (33) é ainda configurado para realizar pelo menos um dos seguintes: multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter a segunda quantidade de segundas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter a segunda quantidade de quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso compreendida na segunda quantidade de quartas HRTFs alvo, para obter a segunda quantidade de segundas HRTFs alvo, em que o quarto fator de modificação é um valor maior que 1; e multiplicar um segundo fator de modificação e as respostas de impulso de banda alta compreendidas na segunda quantidade de segundas HRTFs, para obter a segunda quantidade de quartas HRTFs alvo, em que o segundo fator de modificação é um valor maior do que 0 e menor do que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso compreendidas na uma quarta HRTF alvo, para obter uma segunda HRTF alvo correspondente à quarta HRTF alvo, em que o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma de quadrados, a terceira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma segunda HRTF correspondendo a uma quarta HRTF alvo, e a quarta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma quarta HRTF alvo.
20. Aparelho, de acordo com qualquer uma das reivindicações 13 a 15, caracterizado pelo fato de que a primeira quantidade é igual à soma de a1 e a2, as a1 primeiras
HRTFs são a1 primeiras HRTFs às quais a1 alto-falantes virtuais localizados em um primeiro lado de um centro de alvo correspondem, as a2 primeiras HRTFs são a2 primeiras HRTFs às quais a2 alto-falantes virtuais localizados em um segundo lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é um centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
21. Aparelho, de acordo com a reivindicação 20, caracterizado pelo fato de que o módulo de modificação (33) é ainda configurado para realizar pelo menos um dos seguintes: multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que a primeira quantidade de primeiras HRTFs alvo compreende as a1 terceiras HRTFs alvo e as a2 quintas HRTFs alvo; em que um produto do primeiro fator de modificação e do quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um terceiro fator de modificação e cada resposta de impulso compreendida nas a1 terceiras HRTFs alvo, para obter a1 sextas HRTFs alvo, e multiplicar um sexto fator de modificação e cada resposta de impulso compreendida nas a2 quintas HRTFs alvo, para obter a2 sétimas HRTFs alvo, em que a primeira quantidade de primeiras HRTFs alvo compreendem as a1 sextas HRTFs alvo e as a2 sétimas HRTFs alvo, o terceiro fator de modificação é um valor maior do que 1, e o sexto fator de modificação é um valor maior do que 0 e menor do que 1; e multiplicar um primeiro fator de modificação e respostas de impulso de banda alta das a1 primeiras HRTFs, para obter a1 terceiras HRTFs alvo, e multiplicar um quinto fator de modificação e respostas de impulso de banda alta das a2 primeiras HRTFs, para obter a2 quintas HRTFs alvo, em que um produto do primeiro fator de modificação e o quinto fator de modificação é 1, e o primeiro fator de modificação é um valor maior que 0 e menor que 1; e para uma terceira HRTF alvo, multiplicar um primeiro valor e todas as respostas de impulso compreendidas na uma terceira HRTF alvo, para obter uma sexta HRTF alvo correspondente à terceira HRTF alvo, em que o primeiro valor é uma razão de uma primeira soma de quadrados para uma segunda soma de quadrados, a primeira soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma terceira HRTF alvo, e a segunda soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas na uma terceira HRTF alvo; e para uma quinta HRTF alvo,
multiplicar um terceiro valor e todas as respostas de impulso compreendidas na uma quinta HRTF alvo, para obter uma sétima HRTF alvo correspondendo a uma quinta HRTF alvo, em que o terceiro valor é uma razão de uma quinta soma de quadrados para uma sexta soma de quadrados, a quinta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma primeira HRTF correspondendo a uma quinta HRTF alvo, e a sexta soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma quinta HRTF alvo; e a primeira quantidade de primeiras HRTFs alvo compreendem a1 sextas HRTFs alvo e a2 sétimas HRTFs alvo.
22. Aparelho, de acordo com qualquer uma das reivindicações 13 a 17, 20 e 21, caracterizado pelo fato de que a segunda quantidade é igual à soma de b1 e b2, as b1 segundas HRTFs são b1 segundas HRTFs às quais correspondem b1 alto-falantes virtuais localizados no segundo lado do centro de alvo, as b2 segundas HRTFs são b2 segundas HRTFs às quais b2 alto-falantes virtuais localizados no primeiro lado do centro de alvo correspondem, o primeiro lado é um lado que é do centro de alvo e que está longe da posição de ouvido esquerdo atual, o segundo lado é um lado que é do centro de alvo e que está longe da posição de ouvido direito atual, e o centro de alvo é o centro do espaço tridimensional correspondente aos M alto-falantes virtuais.
23. Aparelho, de acordo com a reivindicação 22, caracterizado pelo fato de que o módulo de modificação (33) é ainda configurado para realizar pelo menos um dos seguintes: multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs,
para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que a segunda quantidade de segundas HRTFs alvo compreende as b1 quartas HRTFs alvo e as b2 oitavas HRTFs alvo; em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um quarto fator de modificação e cada resposta de impulso compreendida nas b1 quartas HRTFs alvo, para obter b1 nonas HRTFs alvo, e multiplicar um oitavo fator de modificação e cada resposta de impulso compreendida em b2 oitavas HRTFs alvo, para obter b2 décimas HRTFs alvo, em que a segunda quantidade de segundas HRTFs alvo compreende as b1 nonas HRTFs alvo e as b2 décimas HRTFs alvo, o quarto fator de modificação é um valor maior que 1, e o oitavo fator de modificação é um valor maior que 0 e menor que 1; e multiplicar um segundo fator de modificação e respostas de impulso de banda alta das b1 segundas HRTFs, para obter b1 quartas HRTFs alvo, e multiplicar um sétimo fator de modificação e respostas de impulso de banda alta das b2 segundas HRTFs, para obter b2 oitavas HRTFs alvo, em que um produto do segundo fator de modificação e do sétimo fator de modificação é 1, e o segundo fator de modificação é um valor maior que 0 e menor que 1; e para uma quarta HRTF alvo, multiplicar um segundo valor e todas as respostas de impulso compreendidas na quarta HRTF alvo, para obter uma nona HRTF alvo correspondente à quarta HRTF alvo, em que o segundo valor é uma razão de uma terceira soma de quadrados para uma quarta soma dos quadrados, a terceira soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso compreendida em uma segunda HRTF correspondendo à quarta HRTF alvo, e a quarta soma dos quadrados é uma soma dos quadrados de todas as respostas de impulso compreendidas na uma quarta HRTF alvo; e para uma oitava HRTF alvo, multiplicar um quarto valor e todas as respostas de impulso compreendidas na oitava HRTF alvo, para obter uma décima HRTF alvo correspondente à oitava HRTF alvo, em que o quarto valor é uma razão de uma sétima soma dos quadrados para uma oitava soma de quadrados, a sétima soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas em uma segunda HRTF correspondendo a uma oitava HRTF alvo, e a oitava soma de quadrados é uma soma de quadrados de todas as respostas de impulso compreendidas no oitava HRTF alvo; e a segunda quantidade de segundas HRTFs alvo compreende as b1 nonas HRTFs alvo e b2 décimas HRTFs alvo.
24. Aparelho, de acordo com qualquer uma das reivindicações 13 a 17, caracterizado pelo fato de que compreende ainda um módulo de ajuste (34), em que o módulo de ajuste (34) é configurado para: ajustar uma ordem de magnitude de energia do primeiro sinal de áudio alvo para uma primeira ordem de magnitude, em que a primeira ordem de magnitude é uma ordem de magnitude de energia de um terceiro sinal de áudio alvo, e o terceiro sinal de áudio alvo é obtido com base nas M primeiras HRTFs e nos M primeiros sinais de áudio; e ajustar uma ordem de magnitude de energia do segundo sinal de áudio alvo para uma segunda ordem de magnitude, em que a segunda ordem de magnitude é uma ordem de magnitude de energia de um quarto sinal de áudio alvo, e o quarto sinal de áudio alvo é obtido com base nas M segundas HRTFs e nos M primeiros sinais de áudio.
25. Aparelho de processamento de áudio, caracterizado pelo fato de que compreende: pelo menos um processador; e uma memória que armazena instruções executáveis de computador para execução por pelo menos um processador, em que as instruções executáveis de computador instruem o pelo menos um processador a realizar o método conforme definido qualquer uma das reivindicações 1 a 12.
26. Meio de armazenamento legível por computador que armazena instruções de computador, caracterizado pelo fato de que, quando executado por pelo menos um processador, faz com que o pelo menos um processador realize o método conforme definido em qualquer uma das reivindicações 1 a 12.
BR112021003158-8A 2018-08-20 2019-03-19 aparelho e método de processamento de áudio BR112021003158A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810950090.9A CN110856095B (zh) 2018-08-20 2018-08-20 音频处理方法和装置
CN201810950090.9 2018-08-20
PCT/CN2019/078780 WO2020037983A1 (zh) 2018-08-20 2019-03-19 音频处理方法和装置

Publications (1)

Publication Number Publication Date
BR112021003158A2 true BR112021003158A2 (pt) 2021-05-11

Family

ID=69592413

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021003158-8A BR112021003158A2 (pt) 2018-08-20 2019-03-19 aparelho e método de processamento de áudio

Country Status (6)

Country Link
US (2) US11451921B2 (pt)
EP (1) EP3833056A4 (pt)
KR (2) KR102502551B1 (pt)
CN (2) CN114205730A (pt)
BR (1) BR112021003158A2 (pt)
WO (1) WO2020037983A1 (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916094B (zh) * 2020-07-10 2024-02-23 瑞声新能源发展(常州)有限公司科教城分公司 音频信号处理方法、装置、设备及可读介质

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243476B1 (en) * 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
KR100677119B1 (ko) * 2004-06-04 2007-02-02 삼성전자주식회사 와이드 스테레오 재생 방법 및 그 장치
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
JP4509686B2 (ja) * 2004-07-29 2010-07-21 新日本無線株式会社 音響信号処理方法および装置
US7634092B2 (en) * 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
CN101529930B (zh) * 2006-10-19 2011-11-30 松下电器产业株式会社 声像定位装置、声像定位系统、声像定位方法、程序及集成电路
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
WO2012068174A2 (en) * 2010-11-15 2012-05-24 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound
WO2012128535A2 (en) * 2011-03-21 2012-09-27 Lg Electronics Inc. Apparatus for controlling depth/distance of sound and method thereof
US9271102B2 (en) * 2012-08-16 2016-02-23 Turtle Beach Corporation Multi-dimensional parametric audio system and method
JP6330251B2 (ja) * 2013-03-12 2018-05-30 ヤマハ株式会社 密閉型ヘッドフォン用信号処理装置および密閉型ヘッドフォン
KR102148217B1 (ko) * 2013-04-27 2020-08-26 인텔렉추얼디스커버리 주식회사 위치기반 오디오 신호처리 방법
CN104581610B (zh) * 2013-10-24 2018-04-27 华为技术有限公司 一种虚拟立体声合成方法及装置
JP2015211418A (ja) * 2014-04-30 2015-11-24 ソニー株式会社 音響信号処理装置、音響信号処理方法、および、プログラム
CN106664499B (zh) * 2014-08-13 2019-04-23 华为技术有限公司 音频信号处理装置
WO2016089133A1 (ko) 2014-12-04 2016-06-09 가우디오디오랩 주식회사 개인 특징을 반영한 바이노럴 오디오 신호 처리 방법 및 장치
KR101964107B1 (ko) * 2015-02-18 2019-04-01 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법
CN107925814B (zh) * 2015-10-14 2020-11-06 华为技术有限公司 生成提升声音印象的方法和设备
CN108370485B (zh) * 2015-12-07 2020-08-25 华为技术有限公司 音频信号处理装置和方法
CN105933835A (zh) * 2016-04-21 2016-09-07 音曼(北京)科技有限公司 基于线性扬声器阵列的自适应3d声场重现方法及系统
KR20170125660A (ko) 2016-05-04 2017-11-15 가우디오디오랩 주식회사 오디오 신호 처리 방법 및 장치
CN107786936A (zh) * 2016-08-25 2018-03-09 中兴通讯股份有限公司 一种声音信号的处理方法及终端
CN107182021A (zh) * 2017-05-11 2017-09-19 广州创声科技有限责任公司 Vr电视中的动态空间虚拟声处理系统及处理方法
CN107105384B (zh) * 2017-05-17 2018-11-02 华南理工大学 一种中垂面上近场虚拟声像的合成方法
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端

Also Published As

Publication number Publication date
US20220386064A1 (en) 2022-12-01
CN110856095B (zh) 2021-11-19
KR20230027335A (ko) 2023-02-27
EP3833056A4 (en) 2021-10-13
US11451921B2 (en) 2022-09-20
CN114205730A (zh) 2022-03-18
KR20210043660A (ko) 2021-04-21
WO2020037983A1 (zh) 2020-02-27
EP3833056A1 (en) 2021-06-09
CN110856095A (zh) 2020-02-28
KR102502551B1 (ko) 2023-02-23
WO2020037983A8 (zh) 2020-10-22
US11863964B2 (en) 2024-01-02
KR102679845B1 (ko) 2024-07-02
US20210176583A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
ES2936834T3 (es) Aparato de procesamiento de señales de audio y método para la reproducción biaural
US10341799B2 (en) Impedance matching filters and equalization for headphone surround rendering
ES2261994T3 (es) Metodo de tratamiento de datos sonoros y dispositivos de adquisicion sonoro que ejecuta este procedimiento.
JP7038725B2 (ja) オーディオ信号処理方法及び装置
US11611841B2 (en) Audio processing method and apparatus
CN104581610B (zh) 一种虚拟立体声合成方法及装置
BRPI0808217A2 (pt) "método e equipamento para conversão entre formatos de áudio multicanal"
EP2096882A3 (en) Head-related transfer function convolution method and head-related transfer function convolution device
BRPI0707969B1 (pt) codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
WO2019066348A1 (ko) 오디오 신호 처리 방법 및 장치
Jiang et al. The role of dynamic cue in auditory vertical localisation
Arteaga Introduction to ambisonics
CN105933818A (zh) 耳机三维声场重建的幻象中置声道的实现方法及系统
CN110892735B (zh) 一种音频处理方法以及音频处理设备
Suzuki et al. 3D spatial sound systems compatible with human's active listening to realize rich high-level kansei information
BR112021003158A2 (pt) aparelho e método de processamento de áudio
Enzner et al. Advanced system options for binaural rendering of ambisonic format
US20240056760A1 (en) Binaural signal post-processing
Yuan et al. Externalization improvement in a real-time binaural sound image rendering system
Oreinos et al. Objective analysis of higher-order Ambisonics sound-field reproduction for hearing aid applications
CN108111962A (zh) 虚拟环绕声处理方法和装置
US11729570B2 (en) Spatial audio monauralization via data exchange
EP4149123A1 (en) Audio rendering method and apparatus
Song 3d audio with headphones-Boey-final