BR122023025915A2 - METHOD FOR ENCODING A MULTICHANNEL SIGNAL, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM - Google Patents

METHOD FOR ENCODING A MULTICHANNEL SIGNAL, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM Download PDF

Info

Publication number
BR122023025915A2
BR122023025915A2 BR122023025915-7A BR122023025915A BR122023025915A2 BR 122023025915 A2 BR122023025915 A2 BR 122023025915A2 BR 122023025915 A BR122023025915 A BR 122023025915A BR 122023025915 A2 BR122023025915 A2 BR 122023025915A2
Authority
BR
Brazil
Prior art keywords
signal
value
peak
cross
current frame
Prior art date
Application number
BR122023025915-7A
Other languages
Portuguese (pt)
Inventor
Haiting Li
Zexin LIU
Xingtao Zhang
Lei Miao
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of BR122023025915A2 publication Critical patent/BR122023025915A2/en

Links

Abstract

A presente invenção refere-se a um método para a codifica- ção de um sinal de múltiplos canais e um codificador, em que o método de codificação compreende: obter um sinal de múltiplos canais de um quadro atual (510); determinar um valor de ITD inicial do quadro atual (520); controlar, com base um número de quadros alvo que podem aparecer sucessivamente de acordo com as informações de características do sinal de múltiplos canais, em que a informação da característica compreende pelo menos um dentre um parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e uma característica de pico de um coeficiente de correlação cruzada do sinal de múltiplos canais, e o valor de ITD de um quadro alvo que multiplexa um valor de ITD de um quadro alvo (530); determinar um valor de ITD do quadro atual de acordo com o valor de ITD inicial do quadro atual e o número de quadros alvo que podem aparecer sucessivamente (540); e codificar o sinal de múltiplos canais de acordo com o valor de ITD do quadro atual (550). O dito mé- todo pode incrementar a qualidade da codificação do sinal de múltiplos canais.The present invention relates to a method for encoding a multi-channel signal and an encoder, wherein the encoding method comprises: obtaining a multi-channel signal from a current frame (510); determine an initial ITD value of the current frame (520); control, based on a number of target frames that may appear successively according to the characteristic information of the multi-channel signal, wherein the characteristic information comprises at least one of a signal-to-noise ratio parameter of the multi-channel signal and a peak characteristic of a multi-channel signal cross-correlation coefficient, and the ITD value of a target frame multiplexing an ITD value of a target frame (530); determining an ITD value of the current frame according to the initial ITD value of the current frame and the number of target frames that can appear successively (540); and encode the multi-channel signal according to the ITD value of the current frame (550). Said method can increase the quality of encoding the multi-channel signal.

Description

[001] Dividido do BR112019002364-0, depositado em 22 de feve reiro de 2017.[001] Divided from BR112019002364-0, deposited on February 22, 2017.

[002] O presente pedido de patente reivindica a prioridade para o Pedido de Patente Chinês N°. 201610652507.4, depositado na Repartição de Patentes Chinesa em 10 de agosto de 2016 e intitulado "MÉTODO PARA A CODIFICAÇÃO DE SINAL DE MÚLTIPLOS CANAIS, E CODIFICADOR", o qual é incorporado no presente documento a título de referência em sua totalidade.[002] The present patent application claims priority to Chinese Patent Application No. 201610652507.4, filed with the Chinese Patent Office on August 10, 2016 and titled "METHOD FOR CODING MULTI-CHANNEL SIGNAL, AND ENCODER", which is incorporated herein by reference in its entirety.

CAMPO TÉCNICOTECHNICAL FIELD

[003] O presente pedido de patente refere-se ao campo de codifi cação de sinais de áudio e, mais especificamente, a um método para a codificação de um sinal de múltiplos canais e um codificador.[003] The present patent application relates to the field of coding audio signals and, more specifically, to a method for coding a multi-channel signal and an encoder.

ANTECEDENTESBACKGROUND

[004] À medida que a qualidade viva melhora, as pessoas impõem requisitos crescentes para o áudio de alta qualidade. Em comparação com um sinal mono, o estéreo tem um sentido de direção e um sentido de distribuição para várias fontes acústicas, pode melhorar a clareza, a inteligibilidade, e a experiência imersiva do som e, portanto, tem uma alta estima das pessoas.[004] As living quality improves, people impose increasing requirements for high-quality audio. Compared with a mono signal, stereo has a sense of direction and a sense of distribution for various acoustic sources, can improve the clarity, intelligibility, and immersive experience of sound, and therefore is held in high esteem by people.

[005] As tecnologias de processamento estereofônico incluem principalmente a codificação de meio/lateral (Mid/Side, MS), a codifica-ção estéreo de intensidade (Intensity Stereo, IS), e a codificação estéreo paramétrica (Parametric Stereo, PS).[005] Stereo processing technologies mainly include mid/side coding (Mid/Side, MS), intensity stereo coding (Intensity Stereo, IS), and parametric stereo coding (Parametric Stereo, PS).

[006] Na codificação MS, a conversão de meio/lateral é executada em dois sinais com base na coerência intercanais, e a energia dos ca-nais é focalizada principalmente em um canal o meio, de modo que a redundância intercanais é eliminada. Na tecnologia de codificação MS, a redução de uma taxa de código depende da coerência entre os sinais de entrada. Quando a coerência entre um sinal do canal esquerdo e um sinal do canal direito é pobre, o sinal do canal esquerdo e o sinal do canal direito precisam ser transmitidos separadamente.[006] In MS coding, half/side conversion is performed on two signals based on interchannel coherence, and the energy of the channels is mainly focused on one channel in the middle, so that interchannel redundancy is eliminated. In MS coding technology, the reduction of a code rate depends on the coherence between the input signals. When the coherence between a left channel signal and a right channel signal is poor, the left channel signal and the right channel signal need to be transmitted separately.

[007] Na codificação IS, os componentes de alta frequência de um sinal do canal esquerdo e um sinal do canal direito são simplificados com base em uma característica que um sistema de audição humano é insensível a uma diferença de fase entre os componentes de alta fre-quência (por exemplo, componentes acima de 2 kHz) dos canais. No entanto, a tecnologia de codificação IS é eficaz apenas para componen-tes de alta frequência. Se a tecnologia de codificação IS for estendida a uma frequência baixa, é causado um ruído causado pelo homem intenso.[007] In IS coding, the high-frequency components of a left-channel signal and a right-channel signal are simplified based on a characteristic that a human hearing system is insensitive to a phase difference between the high-frequency components. -frequency (e.g. components above 2 kHz) of the channels. However, IS coding technology is only effective for high-frequency components. If the IS coding technology is extended to a low frequency, intense man-made noise is caused.

[008] A codificação PS é um esquema de codificação baseado em um modelo auditivo binaural. Tal como mostrado na FIGURA 1 (na FI-GURA 1, xL é um sinal do domínio do tempo do canal esquerdo, e xR é um sinal do domínio do tempo do canal direito), em um processo de codificação PS, um lado do codificador converte um sinal estereofônico em um sinal mono e alguns parâmetros espaciais (ou parâmetros de detecção espacial) que descrevem um campo de som espacial. Tal como mostrado na FIGURA 2, depois de ter obtido o sinal mono e os parâmetros espaciais, um lado do decodificador restaura um sinal este-reofônico com referência aos parâmetros espaciais. Em comparação com a codificação MS, a codificação PS tem uma razão de compressão maior. Portanto, na codificação PS, um ganho de codificação maior pode ser obtido enquanto uma qualidade do som relativamente boa é mantida. Além disso, a codificação PS pode ser executada em toda a largura da faixa de áudio, e pode restaurar bem um efeito de detecção espacial de estéreo.[008] PS coding is a coding scheme based on a binaural auditory model. As shown in FIGURE 1 (in FIGURE 1, xL is a left channel time domain signal, and xR is a right channel time domain signal), in a PS coding process, one side of the encoder converts a stereo signal into a mono signal and some spatial parameters (or spatial detection parameters) that describe a spatial sound field. As shown in FIGURE 2, after having obtained the mono signal and the spatial parameters, one side of the decoder restores a stereophonic signal with reference to the spatial parameters. Compared to MS encoding, PS encoding has a higher compression ratio. Therefore, in PS coding, a larger coding gain can be obtained while relatively good sound quality is maintained. Furthermore, PS coding can be performed over the entire width of the audio track, and can restore a stereo spatial detection effect well.

[009] Na codificação PS, os parâmetros espaciais incluem a coe rência intercanais (Inter-channel Coherent, IC), uma diferença de nível intercanais (Inter-channel Level Difference, ILD), uma diferença de tempo intercanais (Inter-channel Time Difference, ITD), e uma diferença de fase intercanais (Inter-channel Phase Difference, IPD). A IC descreve a correlação cruzada ou coerência intercanais. Este parâmetro determina a detecção de uma faixa de campo do som, e pode melhorar um sentido do espaço e estabilidade do som de um sinal de áudio. A ILD é usada para distinguir um ângulo de azimute horizontal de uma fonte acústica estereofônica, e descreve uma diferença de energia intercanais. Este parâmetro afeta os componentes da frequência de um espectro inteiro. A ITD e a IPD são parâmetros espaciais que representam o azimute horizontal de uma fonte acústica, e descrevem as diferenças de tempo e fase intercanais. A ILD, a ITD e a IPD podem determinar a detecção de uma orelha humana a uma localização de uma fonte acústica, podem ser usadas para determinar eficazmente a localização de um campo de som, e desempenham um papel importante na restauração de um sinal estereofônico.[009] In PS coding, spatial parameters include Inter-channel Coherent, IC, Inter-channel Level Difference, ILD, Inter-channel Time Difference , ITD), and an inter-channel phase difference (IPD). IC describes cross-correlation or inter-channel coherence. This parameter determines the detection of a range of sound field, and can improve a sense of space and sound stability of an audio signal. ILD is used to distinguish a horizontal azimuth angle of a stereo acoustic source, and describes an interchannel energy difference. This parameter affects the frequency components of an entire spectrum. ITD and IPD are spatial parameters that represent the horizontal azimuth of an acoustic source, and describe interchannel time and phase differences. ILD, ITD and IPD can determine the detection of a human ear at a location of an acoustic source, can be used to effectively determine the location of a sound field, and play an important role in restoring a stereophonic signal.

[0010] Em um processo de gravação estereofônica, devido ao im pacto de fatores tais como o ruído de fundo, a reverberação e o vozerio de múltiplas pessoas, um ITD calculado de acordo com um esquema de codificação PS existente é sempre instável (um valor de ITD transita bastante). Um sinal misturado com redução calculado com base em tal ITD é descontínuo. Como resultado, a qualidade do estéreo obtida no lado do decodificador é pobre. Por exemplo, uma imagem acústica do estéreo reproduzido no lado do decodificador treme frequentemente, e ocorre até mesmo um congelamento auditivo.[0010] In a stereophonic recording process, due to the impact of factors such as background noise, reverberation and the voices of multiple people, an ITD calculated according to an existing PS coding scheme is always unstable (a value of ITD carries over a lot). A downmixed signal calculated based on such an ITD is discontinuous. As a result, the stereo quality obtained on the decoder side is poor. For example, an acoustic image of the stereo played on the decoder side often shakes, and even auditory freezing occurs.

SUMÁRIOSUMMARY

[0011] O presente pedido de patente provê um método de codifica ção de um sinal de múltiplos canais e um codificador, para melhorar a estabilidade de um ITD na codificação PS e melhorar a qualidade de codificação de um sinal de múltiplos canais.[0011] The present patent application provides a method of coding a multi-channel signal and an encoder, to improve the stability of an ITD in PS coding and improve the coding quality of a multi-channel signal.

[0012] De acordo com um primeiro aspecto, é provido um método para a codificação de um sinal de múltiplos canais, o qual inclui: a ob-tenção de um sinal de múltiplos canais de um quadro atual; a determi-nação de um valor de ITD inicial do quadro atual; o controle, com base nas informações de características do sinal de múltiplos canais, de uma quantidade de quadros alvo que podem aparecer continuamente, em que as informações de características incluem pelo menos um dentre um parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e uma característica de pico de coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro alvo é reutilizado como um valor de ITD do quadro alvo; a determinação de um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que podem aparecer continuamente; e a codificação do sinal de múltiplos canais com base no valor de ITD do quadro atual.[0012] According to a first aspect, a method for encoding a multi-channel signal is provided, which includes: obtaining a multi-channel signal from a current frame; determining an initial ITD value for the current frame; controlling, based on the characteristic information of the multi-channel signal, a number of target frames that can appear continuously, wherein the characteristic information includes at least one of a signal-to-noise ratio parameter of the multi-channel signal and a peak characteristic of cross-correlation coefficients of the multi-channel signal, and an ITD value of a previous frame of the target frame is reused as an ITD value of the target frame; determining an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that can appear continuously; and encoding the multi-channel signal based on the ITD value of the current frame.

[0013] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, antes do controle, com base nas informa-ções de características do sinal de múltiplos canais, uma quantidade de quadros alvo que podem aparecer continuamente, o método também inclui: a determinação da característica de pico dos coeficientes de cor-relação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[0013] With reference to the first aspect, in some implementations of the first aspect, before controlling, based on multi-channel signal characteristic information, a number of target frames that can appear continuously, the method also includes: determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multi-channel signal and an index of a peak position of the correlation coefficients crossover of the multiple channel signal.

[0014] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, a determinação da característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais inclui: a determinação de um parâmetro de confiança da amplitude de pico com base na amplitude do valor de pico dos coeficientes de corre-lação cruzada do sinal de múltiplos canais, em que o parâmetro de con-fiança da amplitude de pico representa um nível de confiança da ampli-tude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais; a determinação de um parâmetro de flutuação da po-sição de pico com base em um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, e em um valor de ITD de um quadro anterior do quadro atual, em que o parâmetro de flutuação da posição de pico representa uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual; e a determi-nação da característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base no parâmetro de confiança da amplitude de pico e no parâmetro de flutuação da posição de pico.[0014] With reference to the first aspect, in some implementations of the first aspect, determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multi-channel signal multiple channels and an index of a peak position of the cross-correlation coefficients of the multi-channel signal includes: determining a peak amplitude confidence parameter based on the amplitude of the peak value of the cross-correlation coefficients of the multi-channel signal, wherein the peak amplitude confidence parameter represents a confidence level of the peak value amplitude of the cross-correlation coefficients of the multi-channel signal; determining a peak position fluctuation parameter based on an ITD value that corresponds to the peak position index of the multi-channel signal cross-correlation coefficients, and an ITD value from a previous frame of the current frame, wherein the peak position fluctuation parameter represents a difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the multi-channel signal and the ITD value of the previous frame of the current frame ; and determining the peak characteristic of the multi-channel signal cross-correlation coefficients based on the peak amplitude confidence parameter and the peak position fluctuation parameter.

[0015] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, a determinação de um parâmetro de confi-ança da amplitude de pico com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais inclui: a determinação, como parâmetro de confiança da amplitude de pico, uma razão de uma diferença entre um valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e um valor da amplitude de um segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico.[0015] With reference to the first aspect, in some implementations of the first aspect, determining a peak amplitude confidence parameter based on the peak value amplitude of the cross-correlation coefficients of the multi-channel signal includes: determining, as a confidence parameter of the peak amplitude, a ratio of a difference between an amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and an amplitude value of a second largest value of the correlation coefficients crossover of the multi-channel signal and the amplitude value of the peak value.

[0016] Com referência ao primeiro aspecto, em algumas implemen- tações do primeiro aspecto, a determinação de um parâmetro de flutua-ção da posição de pico com base em um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, e em um valor de ITD de um quadro anterior do quadro atual inclui: a determinação, como parâmetro de flutuação da posição de pico, de um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do qua-dro anterior do quadro atual.[0016] With reference to the first aspect, in some implementations of the first aspect, determining a peak position fluctuation parameter based on an ITD value that corresponds to the peak position index of the correlation coefficients crossover of the signal from multiple channels, and in an ITD value of a previous frame of the current frame includes: the determination, as a peak position fluctuation parameter, of an absolute value of a difference between the ITD value corresponding to the index of the peak position of the cross-correlation coefficients of the multi-channel signal and the ITD value of the previous frame of the current frame.

[0017] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, o controle, com base nas informações de características do sinal de múltiplos canais, de uma quantidade de qua-dros alvo que podem aparecer inclui, de maneira contínua: o controle, com base na característica de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais, da quantidade de quadros alvo que podem aparecer continuamente; e, quando a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz uma condição pré-ajustada, a redução, mediante o ajuste de pelo menos um dentre uma contagem de quadros alvo e um limite da contagem de quadros alvo, da quantidade de quadros alvo que podem aparecer continuamente, em que a contagem de quadros alvo é usada para re-presentar uma quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continua-mente.[0017] With reference to the first aspect, in some implementations of the first aspect, the control, based on multi-channel signal characteristic information, of a number of target frames that may appear includes, in a continuous manner: the control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously; and, when the peak characteristic of the cross-correlation coefficients of the multi-channel signal satisfies a preset condition, reducing, by adjusting at least one of a target frame count and a target frame count threshold, the number of target frames that can appear continuously, wherein the target frame count is used to represent a number of target frames that have currently appeared continuously, and the target frame count threshold is used to indicate the amount of target frames that may appear continuously.

[0018] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, a redução, mediante o ajuste de pelo menos um dentre uma contagem de quadros alvo e um limite da contagem de quadros alvo, da quantidade de quadros alvo que podem aparecer inclui, de maneira contínua: a redução, mediante o aumento da contagem de quadros alvo, da quantidade de quadros alvo que podem aparecer continuamente.[0018] With reference to the first aspect, in some implementations of the first aspect, reducing, by adjusting at least one of a target frame count and a target frame count limit, the amount of target frames that can appear includes, on an ongoing basis: reducing, by increasing the target frame count, the number of target frames that can appear continuously.

[0019] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, a redução, mediante o ajuste de pelo menos um dentre uma contagem de quadros alvo e um limite da contagem de quadros alvo, da quantidade de quadros alvo que podem aparecer inclui, de maneira contínua: a redução, mediante a diminuição do limite da contagem de quadros alvo, da quantidade de quadros alvo que podem aparecer continuamente.[0019] With reference to the first aspect, in some implementations of the first aspect, reducing, by adjusting at least one of a target frame count and a target frame count limit, the amount of target frames that can appear includes, on an ongoing basis: reducing, by decreasing the target frame count limit, the number of target frames that can appear continuously.

[0020] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, o controle, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, da quantidade de quadros alvo que podem aparecer inclui, de maneira contínua: somente quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz uma condição da razão entre sinal e ruído pré-ajustada, o controle, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, da quantidade de quadros alvo que podem aparecer continuamente; e o método também inclui: quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, a pa-rada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[0020] With reference to the first aspect, in some implementations of the first aspect, the control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, of the amount of target frames that can appear includes, in a continuous manner : Only when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy a preset signal-to-noise ratio condition, the control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously; and the method also includes: when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stopping reusing the ITD value of the previous frame of the current frame as the ITD value of the frame current.

[0021] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, o controle, com base nas informações de características do sinal de múltiplos canais, de uma quantidade de qua-dros alvo que podem aparecer inclui, de maneira contínua: a determina-ção se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição da razão entre sinal e ruído pré-ajustada; e, quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz a condição da razão entre sinal e ruído, o controle, com base na característica de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais, da quantidade de quadros alvo que podem aparecer continuamente; ou, quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[0021] With reference to the first aspect, in some implementations of the first aspect, controlling, based on multi-channel signal characteristic information, a quantity of target frames that may appear includes, in a continuous manner: determining whether the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset signal-to-noise ratio condition; and, when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy the signal-to-noise ratio condition, the control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, of the number of target frames that can appear continuously; or, when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stopping reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[0022] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual inclui: o aumento da contagem de quadros alvo, de modo que um valor da contagem de quadros alvo seja maior do que ou igual ao limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atual-mente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer conti-nuamente.[0022] With reference to the first aspect, in some implementations of the first aspect, stopping the reuse of the previous frame's ITD value of the current frame as the current frame's ITD value includes: increasing the target frame count, so that a target frame count value is greater than or equal to the target frame count threshold, wherein the target frame count is used to represent the amount of target frames that have currently appeared continuously, and the count threshold of target frames is used to indicate the number of target frames that can appear continuously.

[0023] Com referência ao primeiro aspecto, em algumas implementa ções do primeiro aspecto, a determinação de um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que podem aparecer inclui, de maneira contínua: a determi-nação do valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual, na contagem de quadros alvo e no limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[0023] With reference to the first aspect, in some implementations of the first aspect, determining an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that may appear includes, in a manner continuous: the determination of the current frame's ITD value based on the current frame's starting ITD value, the target frame count, and the target frame count threshold, where the target frame count is used to represent the number of target frames that currently appear continuously, and the target frame count threshold is used to indicate the number of target frames that can appear continuously.

[0024] Com referência ao primeiro aspecto, em algumas implemen tações do primeiro aspecto, o parâmetro da razão entre sinal e ruído é uma razão entre sinal e ruído segmental modificada do sinal de múltiplos canais.[0024] With reference to the first aspect, in some implementations of the first aspect, the signal-to-noise ratio parameter is a modified segmental signal-to-noise ratio of the multi-channel signal.

[0025] De acordo com um segundo aspecto, é provido um codifica dor, o qual inclui unidades configuradas para executar o método no pri-meiro aspecto.[0025] According to a second aspect, an encoder is provided, which includes units configured to perform the method in the first aspect.

[0026] De acordo com um terceiro aspecto, é provido um codifica dor, o qual inclui uma memória e um processador. A memória é confi-gurada para armazenar um programa, e o processador é configurado para executar o programa. Quando o programa é executado, o proces-sador executa o método no primeiro aspecto.[0026] According to a third aspect, an encoder is provided, which includes a memory and a processor. The memory is configured to store a program, and the processor is configured to execute the program. When the program is executed, the processor executes the method in the first aspect.

[0027] De acordo com um quarto aspecto, é provido um meio que pode ser lido por computador. O meio que pode ser lido por computador armazena o código do programa a ser executado por um codificador. O código do programa inclui uma instrução usada para executar o método no primeiro aspecto.[0027] According to a fourth aspect, a computer-readable medium is provided. The computer-readable medium stores program code to be executed by an encoder. The program code includes a statement used to execute the method in the first aspect.

[0028] De acordo com esta aplicação, o impacto de fatores ambien tais, tais como o ruído de fundo, a reverberação e o vozerio de múltiplas pessoas, na exatidão e na estabilidade de um resultado do cálculo de um valor de ITD pode ser reduzido; e quando há ruído de fundo, rever-beração, ou um discurso de múltiplas pessoas, ou uma característica de harmônica de sinal não é aparente, a estabilidade de um valor de ITD na codificação PS é melhorada, e transições desnecessárias do valor de ITD são reduzidas até a maior extensão, desse modo evitando a des- continuidade interquadros de um sinal misturado com redução e a ins-tabilidade de uma imagem acústica de um sinal decodificado. Além disso, de acordo com as modalidades do presente pedido de patente, a informação da fase de um sinal estereofônico pode ser mais bem retida, e a qualidade acústica é melhorada.[0028] According to this application, the impact of environmental factors, such as background noise, reverberation and the noise of multiple people, on the accuracy and stability of a calculation result of an ITD value can be reduced ; and when there is background noise, reverberation, or multiple person speech, or a signal harmonic characteristic is not apparent, the stability of an ITD value in PS encoding is improved, and unnecessary transitions of the ITD value are reduced to the greatest extent, thereby avoiding inter-frame discontinuity of a signal mixed with reduction and the instability of an acoustic image of a decoded signal. Furthermore, according to embodiments of the present patent application, the phase information of a stereophonic signal can be better retained, and the acoustic quality is improved.

BREVE DESCRIÇÃO DOS DESENHOSBRIEF DESCRIPTION OF THE DRAWINGS

[0029] A FIGURA 1 é um fluxograma da codificação PS na técnica anterior;[0029] FIGURE 1 is a flowchart of PS coding in the prior art;

[0030] a FIGURA 2 é um fluxograma da decodificação PS na téc nica anterior;[0030] FIGURE 2 is a flowchart of PS decoding in the prior art;

[0031] a FIGURA 3 é um fluxograma esquemático de um método de extração de parâmetro baseado no domínio do tempo ITD na técnica anterior;[0031] FIGURE 3 is a schematic flowchart of a parameter extraction method based on the ITD time domain in the prior art;

[0032] a FIGURA 4 é um fluxograma esquemático de um método de extração de parâmetro baseado no domínio do tempo ITD na técnica anterior;[0032] FIGURE 4 is a schematic flowchart of a parameter extraction method based on the ITD time domain in the prior art;

[0033] a FIGURA 5 é um fluxograma esquemático de um método para a codificação de um sinal de múltiplos canais de acordo com uma modalidade do presente pedido de patente;[0033] FIGURE 5 is a schematic flowchart of a method for encoding a multi-channel signal in accordance with an embodiment of the present patent application;

[0034] a FIGURA 6 é um fluxograma esquemático de um método para a codificação de um sinal de múltiplos canais de acordo com uma modalidade do presente pedido de patente;[0034] FIGURE 6 is a schematic flowchart of a method for encoding a multi-channel signal in accordance with an embodiment of the present patent application;

[0035] a FIGURA 7 é um diagrama estrutural esquemático de um codificador de acordo com uma modalidade do presente pedido de pa-tente; e[0035] FIGURE 7 is a schematic structural diagram of an encoder according to an embodiment of the present patent application; It is

[0036] a FIGURA 8 é um diagrama estrutural esquemático de um codificador de acordo com uma modalidade do presente pedido de pa-tente.[0036] FIGURE 8 is a schematic structural diagram of an encoder according to an embodiment of the present patent application.

DESCRIÇÃO DAS MODALIDADESDESCRIPTION OF MODALITIES

[0037] Deve ser observado que um sinal estereofônico também pode ser indicado como um sinal de múltiplos canais. O acima exposto descreve resumidamente as funções e os significados de um ILD, um ITD e um IPD do sinal de múltiplos canais. Para fins de facilitar a com-preensão, o que segue descreve o ILD, o ITD e o IPD de uma maneira mais detalhada mediante o uso de um exemplo em que um sinal captado por um primeiro microfone é um sinal do primeiro canal, e um sinal escolhido acima por um segundo microfone é um sinal do segundo canal.[0037] It should be noted that a stereophonic signal can also be indicated as a multi-channel signal. The above briefly describes the functions and meanings of an ILD, an ITD and an IPD of the multi-channel signal. For purposes of facilitating understanding, the following describes ILD, ITD and IPD in more detail using an example in which a signal captured by a first microphone is a first channel signal, and a signal chosen above by a second microphone is a second channel signal.

[0038] O ILD descreve uma diferença da energia entre o sinal do primeiro canal e o sinal do segundo canal. Por exemplo, se o ILD for maior do que 0, a energia do sinal do primeiro canal é mais elevada do que a energia do sinal do segundo canal; se o ILD for igual a 0, a energia do sinal do primeiro canal é igual à energia do sinal do segundo canal; ou se o ILD for menor do que 0, a energia do sinal do primeiro canal é menor do que a energia do sinal do segundo canal. Para um outro e-xemplo, se o ILD for menor do que 0, a energia do sinal do primeiro canal é mais elevada do que a energia do sinal do segundo canal; se o ILD for igual a 0, a energia do sinal do primeiro canal é igual à energia do sinal do segundo canal; ou se o ILD for maior de 0, a energia do sinal do primeiro canal é menor do que a energia do sinal do segundo canal. Deve ser compreendido que os valores acima são meramente exemplos, e uma relação entre um valor de ILD e a diferença da energia entre o sinal do primeiro canal e o sinal do segundo canal pode ser definida com base na experiência ou dependendo de um requisito real.[0038] The ILD describes an energy difference between the first channel signal and the second channel signal. For example, if the ILD is greater than 0, the signal energy of the first channel is higher than the signal energy of the second channel; if the ILD is equal to 0, the signal energy of the first channel is equal to the signal energy of the second channel; or if the ILD is less than 0, the signal energy of the first channel is less than the signal energy of the second channel. For another example, if the ILD is less than 0, the signal energy of the first channel is higher than the signal energy of the second channel; if the ILD is equal to 0, the signal energy of the first channel is equal to the signal energy of the second channel; or if the ILD is greater than 0, the signal energy of the first channel is less than the signal energy of the second channel. It should be understood that the above values are merely examples, and a relationship between an ILD value and the energy difference between the first channel signal and the second channel signal can be defined based on experience or depending on an actual requirement.

[0039] O ITD descreve uma diferença do tempo entre o sinal do pri meiro canal e o sinal do segundo canal, isto é, uma diferença entre um momento no qual que o som gerado por uma fonte acústica chega no primeiro microfone e um momento no qual o som gerado pela fonte a-cústica chega no segundo microfone. Por exemplo, se o ITD for maior do que 0, o momento no qual o som gerado pela fonte acústica chega no primeiro microfone está mais adiantado do que o momento no qual o som gerado pela fonte acústica chega no segundo microfone; se o ITD for igual a 0, o som gerado pela fonte acústica chega simultaneamente no primeiro microfone e no segundo microfone; ou se o ITD for menor do que 0, o momento no qual o som gerado pela fonte acústica chega no primeiro microfone está mais atrasado do que o momento no qual o som gerado pela fonte acústica chega no segundo microfone. Para um outro exemplo, se o ITD for menor do que 0, o momento no qual o som gerado pela fonte acústica chega no primeiro microfone está mais adi-antado do que o momento no qual o som gerado pela fonte acústica chega no segundo microfone; se o ITD for igual a 0, o som gerado pela fonte acústica chega simultaneamente no primeiro microfone e no se-gundo microfone; ou se o ITD for maior do que 0, o momento no qual o som gerado pela fonte acústica chega no primeiro microfone está mais atrasado do que o momento no qual o som gerado pela fonte acústica chega no segundo microfone. Deve ser compreendido que os valores acima são meramente exemplos, e uma relação entre um valor de ITD e a diferença de tempo entre o sinal do primeiro canal e o sinal do segundo canal pode ser definida com base na experiência ou dependendo de um requisito real.[0039] The ITD describes a time difference between the first channel signal and the second channel signal, that is, a difference between a moment at which the sound generated by an acoustic source arrives at the first microphone and a moment at which the which sound generated by the a-acoustic source arrives at the second microphone. For example, if the ITD is greater than 0, the moment at which the sound generated by the acoustic source arrives at the first microphone is earlier than the moment at which the sound generated by the acoustic source arrives at the second microphone; if the ITD is equal to 0, the sound generated by the acoustic source arrives simultaneously at the first microphone and the second microphone; or if the ITD is less than 0, the moment at which the sound generated by the acoustic source arrives at the first microphone is later than the moment at which the sound generated by the acoustic source arrives at the second microphone. For another example, if the ITD is less than 0, the moment at which the sound generated by the acoustic source arrives at the first microphone is earlier than the moment at which the sound generated by the acoustic source arrives at the second microphone; if the ITD is equal to 0, the sound generated by the acoustic source arrives simultaneously at the first microphone and the second microphone; or if the ITD is greater than 0, the moment at which the sound generated by the acoustic source arrives at the first microphone is later than the moment at which the sound generated by the acoustic source arrives at the second microphone. It should be understood that the above values are merely examples, and a relationship between an ITD value and the time difference between the first channel signal and the second channel signal can be defined based on experience or depending on an actual requirement.

[0040] O IPD descreve uma diferença de fase entre o sinal do pri meiro canal e o sinal do segundo canal. Este parâmetro é normalmente usado junto com o ITD, e usado para restaurar a informação de fase de um sinal de múltiplos canais em um lado do decodificador.[0040] The IPD describes a phase difference between the first channel signal and the second channel signal. This parameter is normally used in conjunction with ITD, and used to restore the phase information of a multi-channel signal on one side of the decoder.

[0041] Pode ser aprendido do acima exposto que uma maneira de cálculo do valor de ITD existente causa a descontinuidade de um valor de ITD. Para fins de facilitar a compreensão, com referência à FIGURA 3 e à FIGURA 4, o que segue descreve em detalhes a maneira de cálculo do valor de ITD e as suas desvantagens existentes ao usar um exemplo em que um sinal de múltiplos canais inclui um sinal do canal esquerdo e um sinal do canal direito.[0041] It can be learned from the above that an existing ITD value calculation method causes discontinuity of an ITD value. For the purpose of facilitating understanding, with reference to FIGURE 3 and FIGURE 4, the following describes in detail the manner of calculating the ITD value and its disadvantages that exist when using an example in which a multi-channel signal includes a signal left channel signal and a right channel signal.

[0042] Na técnica anterior, um valor de ITD é calculado com base em um coeficiente de correlação cruzada de um sinal de múltiplos canais na maioria dos casos. Pode haver uma pluralidade de maneiras específicas de cálculo. Por exemplo, o valor de ITD pode ser calculado no domínio do tempo, ou o valor de ITD pode ser calculado no domínio da frequência.[0042] In the prior art, an ITD value is calculated based on a cross-correlation coefficient of a multi-channel signal in most cases. There may be a plurality of specific ways of calculation. For example, the ITD value can be calculated in the time domain, or the ITD value can be calculated in the frequency domain.

[0043] A FIGURA 3 é um fluxograma esquemático de um método de cálculo do valor de ITD com base no domínio do tempo. O método na FIGURA 3 inclui as etapas a seguir.[0043] FIGURE 3 is a schematic flowchart of an ITD value calculation method based on the time domain. The method in FIGURE 3 includes the following steps.

[0044] 310: Calcula um valor de ITD com base em um sinal do do mínio do tempo do canal esquerdo e em um sinal do domínio do tempo do canal direito.[0044] 310: Calculates an ITD value based on a left channel time domain signal and a right channel time domain signal.

[0045] Especificamente, o valor de ITD pode ser calculado com base no sinal do domínio do tempo do canal esquerdo e no sinal do domínio do tempo do canal direito ao usar uma função de correlação cruzada do domínio do tempo. Por exemplo, o cálculo é feito dentro de uma faixa de 0 < i < Tmax: [0045] Specifically, the ITD value can be calculated based on the left channel time domain signal and the right channel time domain signal when using a time domain cross-correlation function. For example, the calculation is done within a range of 0 < i < Tmax:

[0046] Se max (c, (i)) >max (c (i)), Ti é um número oposto de um 0<i<Tmax 0<i<Tmax p valor de índice que corresponde a max(Cn(i)); em caso contrário, T1 é um valor de índice que corresponde a max(Cp(i)), em que i é um valor de índice da função de correlação cruzada, xL é o sinal do domínio do tempo do canal esquerdo, xR é o sinal do domínio do tempo do canal direito, Tmax corresponde a um valor de ITD máximo em um caso de taxas de amostragem diferentes, e Length é o comprimento de um quadro.[0046] If max (c, (i)) >max (c (i)), Ti is a number opposite to a 0<i<Tmax 0<i<Tmax p index value that corresponds to max(Cn(i )); otherwise, T1 is an index value corresponding to max(Cp(i)), where i is an index value of the cross-correlation function, xL is the time domain signal of the left channel, xR is the right channel time domain signal, Tmax corresponds to a maximum ITD value in a case of different sampling rates, and Length is the length of a frame.

[0047] 320: Executa o processamento de quantização no valor de ITD.[0047] 320: Performs quantization processing on the ITD value.

[0048] A FIGURA 4 é um fluxograma esquemático de um método de cálculo do valor de ITD com base no domínio da frequência. O método na FIGURA 4 inclui as etapas a seguir.[0048] FIGURE 4 is a schematic flowchart of a method for calculating the ITD value based on the frequency domain. The method in FIGURE 4 includes the following steps.

[0049] 410: Executa a transformação de tempo-frequência em um sinal do domínio do tempo do canal esquerdo e um sinal do domínio do tempo do canal direito, para obter um sinal do domínio de frequência do canal esquerdo e um sinal do domínio de frequência do canal direito.[0049] 410: Performs time-frequency transformation on a left channel time domain signal and a right channel time domain signal, to obtain a left channel frequency domain signal and a left channel frequency domain signal. right channel frequency.

[0050] Especificamente, na transformação de tempo-frequência, um sinal do domínio do tempo pode ser transformado em um sinal do domínio da frequência ao usar uma tecnologia tal como a transformação distinta de Fourier (DFT) ou a transformação de cosseno distinto modi-ficado (MDCT).[0050] Specifically, in time-frequency transformation, a time-domain signal can be transformed into a frequency-domain signal by using a technology such as distinct Fourier transform (DFT) or modified distinct cosine transform. remained (MDCT).

[0051] Por exemplo, a DFT pode ser executada no sinal do domínio do tempo do canal esquerdo inserido e no sinal do domínio do tempo do canal direito ao usar a fórmula (3) a seguir: [0051] For example, DFT can be performed on the inserted left channel time domain signal and the right channel time domain signal by using the following formula (3):

[0052] onde n é um valor de índice de uma amostra de um sinal do domínio do tempo, k é um valor de índice de um lote da frequência de um sinal do domínio da frequência, L é um comprimento da transformação de tempo-frequência, e x(n) é o sinal do domínio do tempo do canal esquerdo ou o sinal do domínio do tempo do canal direito.[0052] where n is an index value of a sample of a time domain signal, k is an index value of a batch of the frequency of a frequency domain signal, L is a length of the time-frequency transformation , and x(n) is the left channel time domain signal or the right channel time domain signal.

[0053] 420: Extrai um valor de ITD com base no sinal do domínio da frequência do canal esquerdo e no sinal do domínio da frequência do canal direito.[0053] 420: Extracts an ITD value based on the left channel frequency domain signal and the right channel frequency domain signal.

[0054] Especificamente, L lotes de frequência de cada um dentre o sinal do domínio da frequência do canal esquerdo e o sinal do domínio da frequência do canal direito podem ser divididos em N sub-bandas. Uma faixa de valor dos lotes de frequência incluídos em uma bésimasubbanda nas N sub-bandas pode ser definida como Ab-1<k<Ab - 1 . Em uma faixa de busca de - Tmax<j<Tmax, um valor da amplitude pode ser calculado ao usar a fórmula a seguir: [0054] Specifically, L frequency lots of each of the left channel frequency domain signal and the right channel frequency domain signal can be divided into N sub-bands. A value range of the frequency lots included in a 1st subband in the N subbands can be defined as Ab-1<k<Ab - 1 . In a search range of - Tmax<j<Tmax, an amplitude value can be calculated by using the following formula:

[0055] Então, um valor de ITD da bésimasub-banda pode ser T(k) = arg max (mag(j)) , isto é, um valor de índice de uma amostra -T<j<T max max que corresponde a um valor máximo calculado de acordo com a fórmula (4).[0055] Then, an ITD value of the first sub-band can be T(k) = arg max (mag(j)) , that is, a one-sample index value -T<j<T max max that corresponds to a maximum value calculated according to formula (4).

[0056] 430: Executa o processo de quantização no valor de ITD.[0056] 430: Executes the quantization process on the ITD value.

[0057] Na técnica anterior, se um valor de pico de um coeficiente de correlação cruzada de um sinal de múltiplos canais em um quadro atual for relativamente pequeno, um valor de ITD obtido através e cálculo pode ser considerado como inexato. Neste caso, o valor de ITD do quadro atual é zerado.[0057] In the prior art, if a peak value of a cross-correlation coefficient of a multi-channel signal in a current frame is relatively small, an ITD value obtained through calculation may be considered as inaccurate. In this case, the ITD value of the current frame is reset to zero.

[0058] Devido ao impacto de fatores tais como o ruído de fundo, a reverberação e o vozerio de múltiplas pessoas, um valor de ITD calcu-lado de acordo com um esquema de codificação PS existente é frequen-temente zerado e, consequentemente, o valor de ITD transita bastante. Um sinal calculado com redução com base em tal valor de ITD fica su-jeitoà descontinuidade interquadros, e uma imagem acústica de um sinal de múltiplos canais decodificado é instável. Consequentemente, é causada uma pobre qualidade acústica pobre do sinal de múltiplos ca-nais.[0058] Due to the impact of factors such as background noise, reverberation and loud voices from multiple people, an ITD value calculated according to an existing PS coding scheme is often set to zero and, consequently, the ITD value changes a lot. A signal calculated with reduction based on such an ITD value is subject to interframe discontinuity, and an acoustic image of a decoded multi-channel signal is unstable. Consequently, poor acoustic quality of the multi-channel signal is caused.

[0059] Para resolver o problema que o valor de ITD transita bas tante, uma maneira de processamento praticável é tal como segue: Quando o valor de ITD, obtido através de cálculo, do quadro atual é considerado como impreciso, um valor de ITD de um quadro anterior do quadro atual (um quadro anterior de um quadro é especificamente um quadro anterior adjacente ao quadro) pode ser reutilizado para o quadro atual, isto é, o valor de ITD do quadro anterior do quadro atual é usado como valor de ITD do quadro atual. Nessa maneira de processamento, o problema que o valor de ITD transita bastante pode ser bem resolvido. No entanto, esta maneira de processamento pode causar o problema a seguir: Quando a qualidade de sinal do sinal de múltiplos canais é rela-tivamente boa, os valores relativamente exatos de ITD, obtidos através de cálculo, de muitos quadros atuais também podem ser inapropriada- mente descartados, e os valores de ITD de quadros anteriores dos qua-dros atuais são reutilizados. Consequentemente, a informação da fase do sinal de múltiplos canais é perdida.[0059] To solve the problem that the ITD value drifts a lot, a practicable processing way is as follows: When the ITD value, obtained through calculation, of the current frame is considered to be inaccurate, an ITD value of a previous frame of the current frame (a previous frame of a frame is specifically a previous frame adjacent to the frame) can be reused for the current frame, that is, the ITD value of the previous frame of the current frame is used as the ITD value of the current frame. current frame. In this way of processing, the problem that the ITD value changes a lot can be well resolved. However, this processing way may cause the following problem: When the signal quality of the multi-channel signal is relatively good, the relatively accurate ITD values obtained through calculation of many current frames may also be inappropriate. - discarded, and the ITD values from previous frames of the current frames are reused. Consequently, the phase information of the multichannel signal is lost.

[0060] Para evitar o problema que o valor de ITD transita bastante e retém melhor a informação da fase do sinal de múltiplos canais, com referência à FIGURA 5, o que segue descreve em detalhes um método para a codificação de um sinal de múltiplos canais de acordo com uma modalidade do presente pedido de patente. Deve ser observado que, para fins de facilitar a descrição, um quadro cujo valor de ITD reutiliza um valor de ITD de um quadro anterior é indicado como um quadro alvo a seguir.[0060] To avoid the problem that the ITD value transitions a lot and better retains the phase information of the multi-channel signal, with reference to FIGURE 5, the following describes in detail a method for encoding a multi-channel signal according to an embodiment of the present patent application. It should be noted that for ease of description, a frame whose ITD value reuses an ITD value from a previous frame is indicated as a target frame to follow.

[0061] O método na FIGURA 5 inclui as etapas a seguir.[0061] The method in FIGURE 5 includes the following steps.

[0062] 510: Obtém um sinal de múltiplos canais de um quadro atual.[0062] 510: Obtains a multi-channel signal from a current frame.

[0063] 520: Determina um valor de ITD inicial do quadro atual.[0063] 520: Determines an initial ITD value for the current frame.

[0064] Por exemplo, o valor de ITD inicial do quadro atual pode ser calculado na maneira baseada no domínio do tempo mostrada na FI-GURA 3. Para um outro exemplo, o valor de ITD inicial do quadro atual pode ser calculado na maneira baseada no domínio da frequência mos-trada na FIGURA 4.[0064] For example, the initial ITD value of the current frame can be calculated in the time domain-based manner shown in FIGURE 3. For another example, the initial ITD value of the current frame can be calculated in the time-domain based manner. in the frequency domain shown in FIGURE 4.

[0065] 530: Controla (ou ajusta), com base nas informações de ca racterísticas do sinal de múltiplos canais, uma quantidade de quadros alvo que podem aparecer continuamente, em que as informações de características incluem pelo menos um dentre um parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e uma característica de pico de coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro alvo é reutilizado como um valor de ITD do quadro alvo.[0065] 530: Controls (or adjusts), based on the characteristic information of the multi-channel signal, a number of target frames that can appear continuously, wherein the characteristic information includes at least one of a ratio parameter between signal and noise of the multi-channel signal and a peak characteristic of cross-correlation coefficients of the multi-channel signal, and an ITD value of a previous frame of the target frame is reused as an ITD value of the target frame.

[0066] Deve ser compreendido que, nesta modalidade do presente pedido de patente, o valor de ITD inicial do quadro atual é calculado em primeiro lugar, e um valor de ITD do quadro atual (ou indicado como um valor real de ITD do quadro atual, ou indicado como um valor final de ITD do quadro atual) é então determinado com base no valor de ITD inicial do quadro atual. O valor de ITD inicial do quadro atual e o valor de ITD do quadro atual podem ser um mesmo valor de ITD, ou podem ser valores de ITD diferentes. Isto depende de uma regra de cálculo específica. Por exemplo, se o valor de ITD inicial for exato, o valor de ITD inicial pode ser usado como valor de ITD do quadro atual. Para um outro exemplo, se o valor de ITD inicial for inexato, o valor de ITD inicial do quadro atual pode ser descartado, e um valor de ITD de um quadro anterior do quadro atual é usado como valor de ITD do quadro atual.[0066] It should be understood that, in this embodiment of the present patent application, the initial ITD value of the current frame is calculated first, and an ITD value of the current frame (or indicated as an actual ITD value of the current frame , or indicated as an end ITD value of the current frame) is then determined based on the start ITD value of the current frame. The initial ITD value of the current frame and the ITD value of the current frame may be the same ITD value, or they may be different ITD values. This depends on a specific calculation rule. For example, if the initial ITD value is accurate, the initial ITD value can be used as the current frame's ITD value. For another example, if the starting ITD value is inaccurate, the starting ITD value of the current frame can be discarded, and an ITD value from a previous frame of the current frame is used as the ITD value of the current frame.

[0067] Deve ser compreendido que a característica de pico dos co eficientes de correlação cruzada do sinal de múltiplos canais do quadro atual pode ser uma característica diferencial entre um valor da amplitude (ou indicado como magnitude) de um valor de pico (ou indicado como um valor máximo) dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um valor da amplitude de um segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais; ou pode ser uma característica diferencial entre um valor da amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um limite; ou pode ser uma característica diferencial entre um valor de ITD que corresponde a um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um valor de ITD de N quadros anteriores; ou pode ser uma característica diferencial (ou indicada como uma característica de flutuação) entre um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um índice de uma posição de pico de um coeficiente de correlação cruzada de um sinal de múltiplos canais de N quadros anteriores, em que N é um número inteiro positivo maior do que ou igual a 1; ou pode ser uma combinação das características acima. O índice da posição de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais do quadro atual pode representar qual valor dos coeficientes de correlação cruzada do sinal de múltiplos canais no quadro atual é o valor de pico. Do mesmo modo, um índice de uma posição de pico de um coeficiente de correlação cruzada de um sinal de múltiplos canais do quadro anterior pode representar qual valor dos co-eficientes de correlação cruzada do sinal de múltiplos canais no quadro anterior é um valor de pico. Por exemplo, que o índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual é 5 indica que um quinto valor dos coeficientes de cor-relação cruzada do sinal de múltiplos canais no quadro atual é o valor de pico. Para um outro exemplo, que o índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do qua-dro anterior é 4 indica que um quarto valor dos coeficientes de correla-ção cruzada do sinal de múltiplos canais no quadro anterior é o valor de pico.[0067] It should be understood that the peak characteristic of the cross-correlation coefficients of the multichannel signal of the current frame may be a differential characteristic between an amplitude value (or indicated as magnitude) of a peak value (or indicated as a maximum value) of the cross-correlation coefficients of the multi-channel signal of the current frame and an amplitude value of a second largest value of the cross-correlation coefficients of the multi-channel signal; or it may be a differential characteristic between an amplitude value of a peak value of the cross-correlation coefficients of the multi-channel signal of the current frame and a threshold; or it may be a differential characteristic between an ITD value corresponding to an index of a peak position of the multi-channel signal cross-correlation coefficients of the current frame and an ITD value of N previous frames; or it may be a differential characteristic (or indicated as a fluctuation characteristic) between an index of a peak position of the cross-correlation coefficients of the current frame's multi-channel signal and an index of a peak position of a cross-correlation coefficient of a multi-channel signal from N previous frames, where N is a positive integer greater than or equal to 1; or it could be a combination of the above characteristics. The index of the peak position of the cross-correlation coefficients of the multi-channel signal of the current frame can represent which value of the cross-correlation coefficients of the multi-channel signal in the current frame is the peak value. Likewise, an index of a peak position of a cross-correlation coefficient of a multi-channel signal from the previous frame can represent which value of the cross-correlation coefficients of the multi-channel signal in the previous frame is a peak value . For example, that the index of the peak position of the cross-correlation coefficients of the multi-channel signal of the current frame is 5 indicates that a fifth value of the cross-correlation coefficients of the multi-channel signal in the current frame is the peak value . For another example, that the index of the peak position of the cross-correlation coefficients of the multi-channel signal in the previous frame is 4 indicates that a fourth value of the cross-correlation coefficients of the multi-channel signal in the previous frame is the peak value.

[0068] O controle de uma quantidade de quadros alvo que podem aparecer continuamente na etapa 530 pode ser implementado ao ajustar uma contagem de quadros alvo e/ou um limite da contagem de quadros alvo. Por exemplo, o objetivo do controle de uma quantidade de quadros alvo que podem aparecer continuamente pode ser atingido ao alterar de maneira forçada a contagem de quadros alvo; ou o objetivo do controle de uma quantidade de quadros alvo que podem aparecer continuamente pode ser atingido ao alterar de maneira forçada o limite da contagem de quadros alvo; ou, certamente, o objetivo do controle de uma quantidade de quadros alvo que podem aparecer continuamente pode ser atingido ao alterar de maneira forçada ambos a contagem de quadros alvo e o limite da contagem de quadros alvo. A contagem de quadros alvo pode ser usada para indicar uma quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo pode ser usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[0068] Controlling an amount of target frames that can appear continuously in step 530 can be implemented by adjusting a target frame count and/or a target frame count threshold. For example, the objective of controlling a number of target frames that can appear continuously can be achieved by forcibly changing the target frame count; or the objective of controlling a number of target frames that can appear continuously can be achieved by forcibly changing the limit of the target frame count; or, certainly, the objective of controlling the number of target frames that can appear continuously can be achieved by forcibly changing both the target frame count and the target frame count limit. The target frame count may be used to indicate a quantity of target frames that are currently continuously appearing, and the target frame count threshold may be used to indicate the quantity of target frames that may be continuously appearing.

[0069] 540: Determina um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que podem aparecer continuamente.[0069] 540: Determines an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that can appear continuously.

[0070] 550: Codifica o sinal de múltiplos canais com base no valor de ITD do quadro atual.[0070] 550: Encodes the multi-channel signal based on the ITD value of the current frame.

[0071] Por exemplo, operações tais como a codificação de áudio mono, a codificação de parâmetro espacial, e a multiplexação de corrente de bits, mostradas na FIGURA 1, podem ser executadas. Para um esquema de codificação específico, consultar a técnica anterior.[0071] For example, operations such as mono audio coding, spatial parameter coding, and bit stream multiplexing, shown in FIGURE 1, can be performed. For a specific coding scheme, see the prior art.

[0072] De acordo com esta modalidade do presente pedido de pa tente, o impacto de fatores ambientais, tais como o ruído de fundo, a reverberação, e o vozerio de múltiplas pessoas, na precisão e na esta-bilidade de um resultado do cálculo de um valor de ITD pode ser redu-zido; e quando há ruído de fundo, reverberação ou vozerio de múltiplas pessoas, ou uma característica da harmônica do sinal não é aparente, a estabilidade de um valor de ITD na codificação PS é melhorada, e transições desnecessárias do valor de ITD são reduzidas até a maior extensão, desse modo evitando a descontinuidade interquadros de um sinal misturado com redução e a instabilidade de uma imagem acústica de um sinal decodificado. Além disso, de acordo com esta modalidade do presente pedido de patente, a informação da fase de um sinal este-reofônico pode ser mais bem retida, e a qualidade acústica é melhorada.[0072] According to this embodiment of the present patent application, the impact of environmental factors, such as background noise, reverberation, and the noise of multiple people, on the accuracy and stability of a calculation result of an ITD value can be reduced; and when there is background noise, reverberation, or loud voices from multiple people, or a harmonic characteristic of the signal is not apparent, the stability of an ITD value in PS encoding is improved, and unnecessary transitions of the ITD value are reduced to the greatest extent possible. extension, thereby avoiding the interframe discontinuity of a signal mixed with reduction and the instability of an acoustic image of a decoded signal. Furthermore, according to this embodiment of the present patent application, the phase information of a stereophonic signal can be better retained, and the acoustic quality is improved.

[0073] Deve ser observado que o sinal de múltiplos canais que apa rece a seguir é o sinal de múltiplos canais do quadro atual, a menos que esteja especificado de alguma outra maneira que o sinal de múltiplos canais é o sinal de múltiplos canais do quadro anterior ou de N quadros anteriores.[0073] It should be noted that the multi-channel signal that appears next is the multi-channel signal of the current frame, unless it is otherwise specified that the multi-channel signal is the multi-channel signal of the current frame. previous or N previous frames.

[0074] Antes da etapa 530, o método na FIGURA 5 também pode incluir: a determinação da característica de pico dos coeficientes de cor-relação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[0074] Prior to step 530, the method in FIGURE 5 may also include: determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multi-channel signal.

[0075] Especificamente, um parâmetro de confiança da amplitude de pico pode ser determinado com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, em que o parâmetro de confiança da amplitude de pico pode ser usado para representar um nível da confiança da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais. Além disso, a etapa 530 pode incluir: quando o parâmetro de confiança da amplitude de pico satisfaz uma condição pré-ajustada, a redução da quantidade de quadros alvo que podem aparecer continuamente; ou quando o parâmetro de confiança da amplitude de pico não satisfaz uma condição pré-ajustada, a manutenção da quantidade de quadros alvo que podem aparecer continuamente inalterados. Por exemplo, que o parâmetro de confiança da amplitude de pico satisfaz com uma condição pré-ajustada pode ser que um valor do parâmetro de confiança da amplitude de pico é maior do que um limite, ou pode ser que um valor do parâmetro de confiança da amplitude de pico fica dentro de uma faixa pré-ajustada.[0075] Specifically, a peak amplitude confidence parameter can be determined based on the amplitude of the peak value of the cross-correlation coefficients of the multi-channel signal, wherein the peak amplitude confidence parameter can be used to represent a confidence level of the amplitude of the peak value of the cross-correlation coefficients of the multi-channel signal. Furthermore, step 530 may include: when the peak amplitude confidence parameter satisfies a preset condition, reducing the amount of target frames that can appear continuously; or when the peak amplitude confidence parameter does not satisfy a preset condition, maintaining the number of target frames that can appear continuously unchanged. For example, that the peak amplitude confidence parameter satisfies a preset condition, it may be that a peak amplitude confidence parameter value is greater than a threshold, or it may be that a peak amplitude confidence parameter value peak amplitude falls within a preset range.

[0076] Nesta modalidade do presente pedido de patente, o parâme tro de confiança da amplitude de pico pode ser definido em uma plurali-dade de maneiras.[0076] In this embodiment of the present patent application, the peak amplitude confidence parameter can be defined in a plurality of ways.

[0077] Por exemplo, o parâmetro de confiança da amplitude de pico pode ser uma diferença entre o valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cru-zada do sinal de múltiplos canais. Especificamente, uma diferença maior indica um nível de confiança da amplitude do valor de pico mais elevado.[0077] For example, the peak amplitude confidence parameter may be a difference between the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the second largest value of the correlation coefficients crossover of the multiple channel signal. Specifically, a larger difference indicates a higher peak value amplitude confidence level.

[0078] Para um outro exemplo, o parâmetro de confiança da ampli tude de pico pode ser uma razão de uma diferença entre o valor da am-plitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico. Especificamente, uma razão maior indica um nível de confiança da amplitude do valor de pico mais elevado.[0078] For another example, the peak amplitude confidence parameter may be a ratio of a difference between the peak amplitude value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the second largest value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the peak value. Specifically, a higher ratio indicates a higher confidence level of the peak value amplitude.

[0079] Para um outro exemplo, o parâmetro de confiança da ampli tude de pico pode ser uma diferença entre o valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos ca-nais e um valor da amplitude alvo. Especificamente, um valor absoluto maior da diferença indica um nível mais elevado da confiança da ampli-tude do valor de pico. O valor da amplitude alvo pode ser selecionado com base na experiência ou dependendo de um caso real, por exemplo, pode ser um valor fixo, ou pode ser um valor da amplitude de um coefi-ciente de correlação cruzada de uma localização pré-ajustada (a locali-zação pode ser representada ao usar um índice do coeficiente de cor-relação cruzada) no quadro atual.[0079] For another example, the peak amplitude confidence parameter may be a difference between the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and a target amplitude value. Specifically, a greater absolute value of the difference indicates a higher level of confidence of the peak value amplitude. The target amplitude value can be selected based on experience or depending on a real case, for example, it can be a fixed value, or it can be an amplitude value of a cross-correlation coefficient of a preset location ( The location can be represented by using a cross-correlation coefficient index) in the current frame.

[0080] Para um outro exemplo, o parâmetro de confiança da ampli tude de pico pode ser uma razão de uma diferença entre o valor da am-plitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e um valor da amplitude alvo e o valor da amplitude do valor de pico. Especificamente, uma relação maior indica um nível de confiança da amplitude do valor de pico mais elevado. O valor da amplitude alvo pode ser selecionado com base na experiência ou de-pendendo de um caso real, por exemplo, pode ser um valor fixo, ou pode ser um valor da amplitude de um coeficiente de correlação cruzada da localização pré-ajustada no quadro atual.[0080] For another example, the peak amplitude confidence parameter may be a ratio of a difference between the peak amplitude value of the cross-correlation coefficients of the multi-channel signal and an amplitude value target and the amplitude value of the peak value. Specifically, a higher ratio indicates a higher confidence level of the peak value amplitude. The target amplitude value can be selected based on experience or depending on a real case, for example, it can be a fixed value, or it can be an amplitude value of a cross-correlation coefficient of the preset location on the board current.

[0081] Opcionalmente, em algumas modalidades, antes da etapa 530, o método na FIGURA 5 também pode incluir: a determinação da característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual com base em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[0081] Optionally, in some embodiments, prior to step 530, the method in FIGURE 5 may also include: determining the peak characteristic of the multi-channel signal cross-correlation coefficients of the current frame based on an index of a position of peak cross-correlation coefficients of the multi-channel signal.

[0082] Por exemplo, um parâmetro de flutuação da posição de pico pode ser determinado com base em um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e um valor de ITD de N quadros anteriores do quadro atual, em que o parâmetro de flutuação da posição de pico pode ser usado para representar uma diferença entre o valor de ITD que cor-responde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual, e N é um número inteiro positivo maior do que ou igual a 1.[0082] For example, a peak position fluctuation parameter can be determined based on an ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal and an ITD value of N frames of the current frame, where the peak position fluctuation parameter can be used to represent a difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multichannel signal and the value of ITD of the previous frame of the current frame, and N is a positive integer greater than or equal to 1.

[0083] Para um outro exemplo, um parâmetro de flutuação da posi ção de pico pode ser determinado com base no índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico de um coeficiente de correlação cruzada de um sinal de múltiplos canais de N quadros anteriores do quadro atual, em que o parâmetro de flutuação da posição de pico pode ser usado para representar uma diferença entre o índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais dos N quadros anteriores do quadro atual.[0083] For another example, a peak position fluctuation parameter can be determined based on the index of the peak position of the cross-correlation coefficients of the multi-channel signal and an index of a peak position of a coefficient cross-correlation of a multi-channel signal from previous N frames of the current frame, wherein the peak position fluctuation parameter can be used to represent a difference between the peak position index of the cross-correlation coefficients of the multiple signal channels and the index of the peak position of the cross-correlation coefficients of the multi-channel signal of the previous N frames of the current frame.

[0084] Além disso, a etapa 530 pode incluir: quando o parâmetro de flutuação da posição de pico satisfaz uma condição pré-ajustada, a re-dução da quantidade de quadros alvo que podem aparecer continua-mente; ou, quando o parâmetro de flutuação da posição de pico não satisfaz uma condição pré-ajustada, a manutenção da quantidade de quadros alvo que podem aparecer continuamente inalterados. Por e-xemplo, que o parâmetro de flutuação da posição de pico satisfaz uma condição pré-ajustada pode ser que um valor do parâmetro de flutuação da posição de pico seja maior do que um limite, ou pode ser que um valor do parâmetro de flutuação da posição de pico esteja dentro de uma faixa pré-ajustada. Por exemplo, quando o parâmetro de flutuação da posição de pico é determinado com base no valor de ITD que corres-ponde ao índice da posição de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais e no valor de ITD do quadro anterior do quadro atual, que o parâmetro da flutuação da posição de pico satisfaz uma condição pré-ajustada pode ser que um valor do parâmetro de flutuação da posição de pico seja maior do que um limite, em que o limite pode ser ajustado em 4, 5, 6, ou um outro valor empírico; ou pode ser que um valor do parâmetro de flutuação da posição de pico esteja dentro de uma faixa pré-ajustada, em que a faixa pré-ajustada pode ser ajustada em [6, 128] ou um outro valor empírico. Especificamente, o limite ou a faixa do valor podem ser ajustados dependendo de métodos de cálculo de parâmetro diferentes, requisitos diferentes, cenários de aplicações diferentes, e outros ainda.[0084] Additionally, step 530 may include: when the peak position fluctuation parameter satisfies a preset condition, reducing the amount of target frames that can appear continuously; or, when the peak position fluctuation parameter does not satisfy a preset condition, maintaining the number of target frames that can appear continuously unchanged. For example, that the peak position fluctuation parameter satisfies a preset condition, it may be that a value of the peak position fluctuation parameter is greater than a threshold, or it may be that a value of the fluctuation parameter of the peak position is within a preset range. For example, when the peak position fluctuation parameter is determined based on the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal and the ITD value of the previous frame of the current frame, that the peak position fluctuation parameter satisfies a preset condition may be that a value of the peak position fluctuation parameter is greater than a threshold, where the threshold can be set to 4.5 , 6, or another empirical value; or it may be that a value of the peak position fluctuation parameter is within a preset range, where the preset range can be set to [6, 128] or another empirical value. Specifically, the value limit or range can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[0085] Nesta modalidade do presente pedido de patente, o parâme tro de flutuação da posição de pico pode ser definido em uma pluralidade de maneiras.[0085] In this embodiment of the present patent application, the peak position fluctuation parameter can be defined in a plurality of ways.

[0086] Por exemplo, o parâmetro de flutuação da posição de pico pode ser um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de cor-relação cruzada do sinal de múltiplos canais do quadro anterior do qua-dro atual.[0086] For example, the peak position fluctuation parameter may be an absolute value of a difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the current frame's multi-channel signal and a ITD value that corresponds to the index of the peak position of the cross-correlation coefficients of the multi-channel signal of the previous frame of the current frame.

[0087] Para um outro exemplo, o parâmetro de flutuação da posição de pico pode ser um valor absoluto da diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e o valor de ITD do quadro anterior do quadro atual.[0087] For another example, the peak position fluctuation parameter may be an absolute value of the difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the multi-channel signal of the current frame and the ITD value of the previous frame of the current frame.

[0088] Para um outro exemplo, o parâmetro de flutuação da posição de pico pode ser uma variação de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e o valor de ITD dos N quadros anteriores, em que N é um número inteiro maior do que ou igual a 2.[0088] For another example, the peak position fluctuation parameter may be a variation of a difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal of the current frame and the ITD value of the previous N frames, where N is an integer greater than or equal to 2.

[0089] Opcionalmente, em algumas modalidades, antes da etapa 530, o método na FIGURA 5 também pode incluir: a determinação da característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[0089] Optionally, in some embodiments, prior to step 530, the method in FIGURE 5 may also include: determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the coefficients cross-correlation coefficients of the multi-channel signal and an index of a peak position of the cross-correlation coefficients of the multi-channel signal.

[0090] Especificamente, um parâmetro de confiança da amplitude de pico pode ser determinado com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais; um parâmetro de flutuação da posição de pico é determinado com base em um valor de ITD que corresponde ao índice da posição de pico dos co-eficientes de correlação cruzada do sinal de múltiplos canais e em um valor de ITD de um quadro anterior; e a característica de pico dos coe-ficientes de correlação cruzada do sinal de múltiplos canais é determi-nada com base no parâmetro de confiança da amplitude de pico e no parâmetro de flutuação da posição de pico. Quanto a uma maneira de definir o parâmetro de confiança da amplitude de pico e o parâmetro de flutuação da posição de pico, consultar a modalidade acima. Os deta-lhesnão são descritos outra vez no presente documento.[0090] Specifically, a peak amplitude confidence parameter can be determined based on the amplitude of the peak value of the cross-correlation coefficients of the multi-channel signal; a peak position fluctuation parameter is determined based on an ITD value corresponding to the peak position index of the cross-correlation coefficients of the multi-channel signal and an ITD value of a previous frame; and the peak characteristic of the cross-correlation coefficients of the multi-channel signal is determined based on the peak amplitude confidence parameter and the peak position fluctuation parameter. For a way to set the peak amplitude confidence parameter and the peak position fluctuation parameter, see the embodiment above. The details are not described again in this document.

[0091] Além disso, nesta modalidade, a etapa 530 pode incluir: se o parâmetro de confiança da amplitude de pico e o parâmetro de flutua-ção da posição de pico satisfazem uma condição pré-ajustada, o controle da quantidade de quadros alvo que podem aparecer continuamente.[0091] Furthermore, in this embodiment, step 530 may include: if the peak amplitude confidence parameter and the peak position fluctuation parameter satisfy a preset condition, controlling the amount of target frames that may appear continuously.

[0092] Por exemplo, quando o parâmetro de confiança da amplitude de pico é maior do que o limite da confiança da amplitude de pico, e o parâmetro de flutuação da posição de pico é maior do que o limite da flutuação da posição de pico pré-ajustado, a quantidade de quadros alvo que podem aparecer continuamente é reduzida. Especificamente, por exemplo, quando o parâmetro de confiança da amplitude de pico é uma razão de uma diferença entre o valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cru-zada do sinal de múltiplos canais e o valor da amplitude do valor de pico, o limite da confiança da amplitude de pico pode ser ajustado em 0,1, 0,2, 0,3, ou um outro valor empírico. Quando o parâmetro de flutuação da posição de pico é um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e um valor de ITD que corresponde ao índice da posição de pico dos coefici-entes de correlação cruzada do sinal de múltiplos canais do quadro an-terior do quadro atual, o limite da flutuação da posição de pico pode ser ajustado em 4, 5, 6, ou outros valores empíricos. Especificamente, o limite ou uma faixa de valor podem ser ajustados dependendo de méto-dos de cálculo de parâmetro diferentes, requisitos diferentes, cenários de aplicações diferentes, e outros ainda.[0092] For example, when the peak amplitude confidence parameter is greater than the peak amplitude confidence limit, and the peak position fluctuation parameter is greater than the pre-peak position fluctuation limit -adjusted, the amount of target frames that can appear continuously is reduced. Specifically, for example, when the peak amplitude confidence parameter is a ratio of a difference between the amplitude value of the peak value of the cross-correlation coefficients of the multichannel signal and the amplitude value of the second largest value of the coefficients cross-correlation of the multi-channel signal and the amplitude value of the peak value, the confidence limit of the peak amplitude can be set to 0.1, 0.2, 0.3, or another empirical value. When the peak position fluctuation parameter is an absolute value of a difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the current frame's multichannel signal and an ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal of the previous frame of the current frame, the peak position fluctuation limit can be set to 4, 5, 6, or other empirical values. Specifically, the limit or a value range can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[0093] Para um outro exemplo, quando um valor do parâmetro de confiança da amplitude de pico fica entre dois limites, e o parâmetro de flutuação da posição de pico é maior do que o limite da flutuação da posição de pico pré-ajustado, a quantidade de quadros alvo que podem aparecer continuamente é reduzida.[0093] For another example, when a peak amplitude confidence parameter value falls between two thresholds, and the peak position fluctuation parameter is greater than the preset peak position fluctuation threshold, the The number of target frames that can appear continuously is reduced.

[0094] Para um outro exemplo, quando um valor do parâmetro de confiança da amplitude de pico é maior do que o limite da confiança da amplitude de pico pré-ajustado, e o parâmetro de flutuação da posição de pico fica entre dois limites, a quantidade de quadros alvo que podem aparecer continuamente é reduzida.[0094] For another example, when a value of the peak amplitude confidence parameter is greater than the preset peak amplitude confidence limit, and the peak position fluctuation parameter falls between two limits, the The number of target frames that can appear continuously is reduced.

[0095] Deve ser observado que, em algumas modalidades, o parâ metro de confiança da amplitude de pico e/ou o parâmetro da flutuação da posição do pico descritos acima podem ser indicados como parâme- tros/um parâmetro que representa(m) um grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais. Neste caso, a etapa 530 pode incluir: se o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz uma condição pré-ajustada, a redução da quantidade de quadros alvo que podem aparecer continuamente.[0095] It should be noted that, in some embodiments, the peak amplitude confidence parameter and/or the peak position fluctuation parameter described above may be indicated as parameters/a parameter that represents a degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal. In this case, step 530 may include: if the degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal satisfies a preset condition, reducing the amount of target frames that can appear continuously.

[0096] Deve ser observado que uma maneira de definição para que o parâmetro que representa o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais sa-tisfaça a condição pré-ajustada não é limitada especificamente nesta modalidade do presente pedido de patente.[0096] It should be noted that a way of defining so that the parameter representing the degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal satisfies the preset condition is not specifically limited in this embodiment of the present patent application.

[0097] Opcionalmente, que o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz a condição pré-ajustada pode ser: um valor de um ou mais dos parâmetros que representam o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais está dentro da faixa de valor pré-ajustada, ou um valor de um ou mais dos parâmetros que representam o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais está além de uma faixa de valor pré-ajustada. Por exemplo, quando o grau de estabilidade da posição de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais é representado pelo parâmetro de flu-tuação da posição de pico, e um método para calcular o parâmetro de flutuação da posição de pico é baseado no valor absoluto da diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do qua-dro atual e o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro anterior do quadro atual, a faixa de valor pré-ajustada pode ser ajustada tal como segue: O parâmetro de flutuação da posição de pico é maior do que 5 ou outros valores empíricos. Para um outro exemplo, quando o grau de estabilidade da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais é representado pelo pa-râmetro de flutuação da posição de pico e pelo parâmetro de confiança da amplitude de pico, um método para calcular o parâmetro de flutuação da posição de pico é baseado no valor absoluto da diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro anterior do quadro atual, e o parâmetro da amplitude de confiança de pico é a razão da diferença entre o valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico, a faixa de valor pré-ajustada pode ser ajustada tal como segue: O parâmetro de flutuação da posição de pico é maior do que 5, e o parâmetro de confiança da amplitude de pico é maior do que 0,2; ou pode ser ajustado a uma outra faixa de valor empírico. Especificamente, a faixa de valor pode ser ajustada dependendo de métodos de cálculo de parâmetro diferentes, requisitos diferentes, cenários de aplicações dife-rentes, e outros ainda.[0097] Optionally, that the degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal satisfies the preset condition may be: a value of one or more of the parameters representing the degree of stability of the peak position peak of the cross-correlation coefficients of the multi-channel signal is within the preset value range, or a value of one or more of the parameters representing the degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal is beyond a preset value range. For example, when the degree of stability of the peak position of the cross-correlation coefficients of the multi-channel signal is represented by the peak position fluctuation parameter, and a method for calculating the peak position fluctuation parameter is based on the absolute value of the difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the current frame's multichannel signal and the ITD value that corresponds to the peak position index of the coefficients cross-correlation of the multi-channel signal from the previous frame to the current frame, the preset value range can be adjusted as follows: The peak position fluctuation parameter is greater than 5 or other empirical values. For another example, when the degree of stability of the peak position of the multichannel signal cross-correlation coefficients is represented by the peak position fluctuation parameter and the peak amplitude confidence parameter, a method for calculating the peak position fluctuation parameter is based on the absolute value of the difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficients of the current frame's multi-channel signal and the ITD value that corresponds to the index of the peak position of the cross-correlation coefficients of the multi-channel signal of the previous frame from the current frame, and the peak confidence amplitude parameter is the ratio of the difference between the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the second largest value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the peak value, the preset value range can be adjusted as follows: fluctuation of peak position is greater than 5, and the confidence parameter of peak amplitude is greater than 0.2; or it can be adjusted to another empirical value range. Specifically, the value range can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[0098] O que segue descreve em detalhes como controlar, com base no parâmetro da razão entre sinal e ruído do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continua-mente.[0098] The following describes in detail how to control, based on the signal-to-noise ratio parameter of the multi-channel signal, the number of target frames that can appear continuously.

[0099] O parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser usado para representar uma razão entre sinal e ruído do sinal de múltiplos canais.[0099] The multi-channel signal signal-to-noise ratio parameter can be used to represent a multi-channel signal signal-to-noise ratio.

[00100] Deve ser compreendido que o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser representado por um ou mais parâmetros. Uma maneira específica de selecionar um parâmetro não é limitada nesta modalidade do presente pedido de patente. Por exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser representado por pelo menos um dentre uma razão entre sinal e ruído de sub-banda, uma razão entre sinal e ruído de subbanda modificada, uma razão entre sinal e ruído segmental, uma razão entre sinal e ruído segmental modificada, uma razão entre sinal e ruído de faixa integral, uma razão entre sinal e ruído modificada de faixa integral, e um outro parâmetro que pode representar uma característica da razão entre sinal e ruído do sinal de múltiplos canais.[00100] It should be understood that the signal-to-noise ratio parameter of the multi-channel signal can be represented by one or more parameters. A specific way of selecting a parameter is not limited in this embodiment of the present patent application. For example, the multichannel signal signal-to-noise ratio parameter may be represented by at least one of a subband signal-to-noise ratio, a modified subband signal-to-noise ratio, a signal-to-noise ratio, and a subband signal-to-noise ratio. segmental noise, a modified segmental signal-to-noise ratio, a full-range signal-to-noise ratio, a modified full-range signal-to-noise ratio, and another parameter that may represent a characteristic of the signal-to-noise ratio of the signal of multiple channels.

[00101] Também deve ser compreendido que uma maneira de determinar o parâmetro da razão entre sinal e ruído do sinal de múltiplos canaisnão é limitada especificamente nesta modalidade do presente pedido de patente. Por exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser calculado ao usar o sinal de múltiplos canais inteiro. Para um outro exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser calculado ao usar alguns sinais do sinal de múltiplos canais, isto é, a razão entre sinal e ruído do sinal de múltiplos canais é representada ao usar razões entre sinal e ruído de alguns sinais. Para um outro exemplo, um sinal de qual-quer canal pode ser selecionado de maneira adaptável do sinal de múl-tiplos canais para executar o cálculo, isto é, a razão entre sinal e ruído do sinal de múltiplos canais é representada ao usar uma razão entre sinal e ruído do sinal do canal. Para um outro exemplo, o cálculo da média ponderada pode ser primeiramente executado nos dados que re-presentam o sinal de múltiplos canais, para formar um novo sinal, e a razão entre sinal e ruído do sinal de múltiplos canais é representada então ao usar uma razão entre sinal e ruído do novo sinal.[00101] It should also be understood that a way of determining the signal-to-noise ratio parameter of the multi-channel signal is not specifically limited in this embodiment of the present patent application. For example, the signal-to-noise ratio parameter of the multi-channel signal can be calculated by using the entire multi-channel signal. For another example, the signal-to-noise ratio parameter of the multi-channel signal can be calculated by using some signals of the multi-channel signal, that is, the signal-to-noise ratio of the multi-channel signal is represented by using ratios between signal and noise of some signals. For another example, a signal from any channel can be adaptively selected from the multi-channel signal to perform the calculation, that is, the signal-to-noise ratio of the multi-channel signal is represented by using a ratio between signal and noise of the channel signal. For another example, the weighted average calculation may first be performed on data representing the multi-channel signal to form a new signal, and the signal-to-noise ratio of the multi-channel signal is then represented by using a ratio between signal and noise of the new signal.

[00102] O que segue descreve, ao usar um exemplo em que o sinal de múltiplos canais inclui um sinal do canal esquerdo e um sinal do canal direito, uma maneira de calcular a razão entre sinal e ruído do sinal de múltiplos canais.[00102] The following describes, when using an example in which the multi-channel signal includes a left-channel signal and a right-channel signal, a way to calculate the signal-to-noise ratio of the multi-channel signal.

[00103] Por exemplo, a transformação de tempo-frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal esquerdo e um sinal do domínio do tempo do canal direito, para obter um sinal do domínio da frequência do canal esquerdo e um sinal do domínio da frequência do canal direito; o cálculo da média ponderada é executado em um espectro da amplitude do sinal do domínio da frequência do canal esquerdo e um espectro da amplitude do sinal do domínio da frequência do canal direito, para obter um espectro de amplitude médio do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito; e uma razão entre sinal e ruído segmental modificada é calculada então com base no espectro de amplitude médio, e é usada como um parâmetro que representa a característica da razão entre sinal e ruído do sinal de múltiplos canais.[00103] For example, time-frequency transformation can be first performed on a left channel time domain signal and a right channel time domain signal, to obtain a left channel frequency domain signal and a right channel frequency domain signal; weighted averaging is performed on an amplitude spectrum of the left channel frequency domain signal and an amplitude spectrum of the right channel frequency domain signal, to obtain an average amplitude spectrum of the frequency domain signal of the left channel. left channel and right channel frequency domain signal; and a modified segmental signal-to-noise ratio is then calculated based on the average amplitude spectrum, and is used as a parameter representing the signal-to-noise ratio characteristic of the multi-channel signal.

[00104] Para um outro exemplo, a transformação de tempo-frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal esquerdo, para obter um sinal do domínio da frequência do canal esquerdo, e uma razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal esquerdo é calculada então com base em um espectro da amplitude do sinal do domínio da frequên-cia do canal esquerdo. Do mesmo modo, a transformação de tempo- frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal direito, para obter um sinal do domínio da frequência do canal direito, e uma razão entre sinal e ruído segmental modificada do sinal domínio da frequência do canal direito é calculada então com base em um espectro da amplitude do sinal do domínio da frequência do canal direito. A seguir, um valor médio das razões entre sinal e ruído segmentais modificadas do sinal do domínio da frequência do canal es-querdo e do sinal do domínio da frequência do canal direito é calculado com base na razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal esquerdo e na razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal direito, e é usado como um parâmetro que representa a característica da razão entre sinal e ruído do sinal de múltiplos canais.[00104] For another example, the time-frequency transformation may first be performed on a left-channel time-domain signal, to obtain a left-channel frequency-domain signal, and a modified segmental signal-to-noise ratio. of the left channel frequency domain signal is then calculated based on an amplitude spectrum of the left channel frequency domain signal. Likewise, the time-frequency transformation can first be performed on a right-channel time-domain signal to obtain a right-channel frequency-domain signal, and a modified segmental signal-to-noise ratio of the right-channel time-domain signal. The right channel frequency is then calculated based on an amplitude spectrum of the right channel frequency domain signal. Next, an average value of the modified segmental signal-to-noise ratios of the left channel frequency domain signal and the right channel frequency domain signal is calculated based on the modified segmental signal-to-noise ratio of the left channel signal. left channel frequency domain and the modified segmental signal-to-noise ratio of the right-channel frequency domain signal, and is used as a parameter representing the signal-to-noise ratio characteristic of the multi-channel signal.

[00105] O controle, com base no parâmetro da razão entre sinal e ruído do sinal de múltiplos canais, da quantidade de quadros alvo que podem aparecer continuamente pode incluir: quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição pré-ajustada, a redução da quantidade de quadros alvo que podem aparecer continuamente; ou, quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz uma condição pré-ajus- tada, a manutenção da quantidade de quadros alvo que podem aparecer continuamente inalterados. Por exemplo, quando um valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é maior do que um limite pré-ajustado, a quantidade de quadros alvo que podem aparecer continuamente é reduzida. Para um outro exemplo, quando um valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais está dentro da faixa de valor pré-ajustada, a quantidade de qua-dros alvo que podem aparecer continuamente é reduzida. Para um outro exemplo, quando um valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais está além da faixa de valor pré-ajustada, a quantidade de quadros alvo que podem aparecer continuamente é re-duzida. Por exemplo, quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é a razão entre sinal e ruído segmental, o limite pré-ajustado pode ser de 6.000 ou outros valores empíricos, e a faixa de valor pré-ajustada pode ser maior do que 6.000 e menor do que 3.000.000, ou uma outra faixa de valor empírico. Especificamente, o li-mite ou a faixa de valor podem ser ajustados dependendo de métodos de cálculo de parâmetro diferentes, requisitos diferentes, cenários de aplicações diferentes, e outros ainda.[00105] Control, based on the signal-to-noise ratio parameter of the multi-channel signal, of the number of target frames that can appear continuously may include: when the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset condition, reducing the amount of target frames that can appear continuously; or, when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy a preset condition, maintaining the number of target frames that can appear continuously unchanged. For example, when a multi-channel signal signal-to-noise ratio parameter value is greater than a preset threshold, the number of target frames that can appear continuously is reduced. For another example, when a value of the signal-to-noise ratio parameter of the multi-channel signal is within the preset value range, the number of target frames that can appear continuously is reduced. For another example, when a value of the signal-to-noise ratio parameter of the multi-channel signal is beyond the preset value range, the number of target frames that can appear continuously is reduced. For example, when the signal-to-noise ratio parameter of the multi-channel signal is the segmental signal-to-noise ratio, the preset limit may be 6000 or other empirical values, and the preset value range may be greater than 6,000 and less than 3,000,000, or another empirical value range. Specifically, the limit or value range can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[00106] O acima exposto descreve principalmente como controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais ou no parâmetro da razão entre sinal e ruído do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente. O que segue descreve em detalhes como controlar, com base no parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente.[00106] The above mainly describes how to control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal or the signal-to-noise ratio parameter of the multi-channel signal, the amount of target frames that can appear continuously. The following describes in detail how to control, based on the signal-to-noise ratio parameter of the multi-channel signal and the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously.

[00107] Especificamente, quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição pré-ajustada, e o parâmetro de confiança da amplitude de pico e/ou o parâmetro de flutuação da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz/satisfazem a condição pré-ajustada, a quantidade de quadros alvo que podem aparecer continuamente pode ser reduzida.[00107] Specifically, when the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset condition, and the peak amplitude confidence parameter and/or the peak position fluctuation parameter of the correlation coefficients cross-channel signal meets the preset condition, the number of target frames that can appear continuously can be reduced.

[00108] Por exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é maior do que um primeiro limite e menor do que ou igual a um segundo limite, o parâmetro de confiança da amplitude de pico é maior do que um terceiro limite, e o parâmetro de flutuação da posição de pico é maior do que um quarto limite, a quantidade de quadros alvo que podem aparecer continua-menteé reduzida. Por exemplo, quando o parâmetro da relação entre sinal e ruído do sinal de múltiplos canais é a razão entre sinal e ruído segmental, o primeiro limite pode ser de 5.000, 6.000, 7.000, ou outros valores empíricos; e o segundo limite pode ser de 2.900.000, 3.000.000, 3.100.000, ou outros valores empíricos. Quando o parâmetro de confi-ança da amplitude de pico é a razão da diferença entre o valor da am-plitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico, o terceiro limite pode ser ajustado em 0,1, 0,2, 0,3, ou outro valor empírico. Quando o parâmetro de flutuação da posição de pico é o valor absoluto da diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro atual e o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais do quadro anterior do quadro atual, o quarto limite pode ser ajustado em 4, 5, 6, ou outros valores empíricos. Especificamente, os limites podem ser ajustados dependendo de métodos de cálculo de parâmetro diferentes, requisitos dife-rentes,cenários de aplicações diferentes, e outros ainda.[00108] For example, when the value of the signal-to-noise ratio parameter of the multi-channel signal is greater than a first threshold and less than or equal to a second threshold, the peak amplitude confidence parameter is greater than a third threshold, and the peak position fluctuation parameter is greater than a fourth threshold, the amount of target frames that can appear continuously is reduced. For example, when the signal-to-noise ratio parameter of the multi-channel signal is the segmental signal-to-noise ratio, the first limit may be 5000, 6000, 7000, or other empirical values; and the second limit can be 2,900,000, 3,000,000, 3,100,000, or other empirical values. When the peak amplitude confidence parameter is the ratio of the difference between the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the second largest value of the correlation coefficients crossover of the multi-channel signal and the amplitude value of the peak value, the third limit can be set to 0.1, 0.2, 0.3, or other empirical value. When the peak position fluctuation parameter is the absolute value of the difference between the ITD value corresponding to the peak position index of the multi-channel signal cross-correlation coefficients of the current frame and the ITD value corresponding to the index from the peak position of the cross-correlation coefficients of the multi-channel signal of the previous frame to the current frame, the fourth threshold can be set to 4, 5, 6, or other empirical values. Specifically, the limits can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[00109] Para um outro exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é maior do que ou igual a um primeiro limite e menor do que ou igual a um segundo limite, e o parâmetro de confiança da amplitude de pico é menor do que um quinto limite, a quantidade de quadros alvo que podem aparecer conti-nuamenteé reduzida. Por exemplo, quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é a razão entre sinal e ruído segmental, o primeiro limite pode ser de 5.000, 6.000, 7.000, ou outros valores empíricos; e o segundo limite pode ser de 2.900.000, 3.000.000, 3.100.000, ou outros valores empíricos. Quando o parâmetro de confi-ança da amplitude de pico é a razão da diferença entre o valor da am-plitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico, o quinto limite pode ser ajustado em 0,3, 0,4, 0,5, ou outro valor empírico. Especificamente, os limites podem ser ajustados dependendo de métodos de cálculo de parâmetro diferentes, requisitos diferentes, cenários de aplicações diferentes, e outros ainda.[00109] For another example, when the value of the signal-to-noise ratio parameter of the multi-channel signal is greater than or equal to a first threshold and less than or equal to a second threshold, and the confidence parameter of the peak amplitude is less than one-fifth threshold, the number of target frames that can appear continuously is reduced. For example, when the signal-to-noise ratio parameter of the multi-channel signal is the segmental signal-to-noise ratio, the first limit may be 5000, 6000, 7000, or other empirical values; and the second limit can be 2,900,000, 3,000,000, 3,100,000, or other empirical values. When the peak amplitude confidence parameter is the ratio of the difference between the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the second largest value of the correlation coefficients crossover of the multi-channel signal and the amplitude value of the peak value, the fifth limit can be set to 0.3, 0.4, 0.5, or other empirical value. Specifically, the limits can be adjusted depending on different parameter calculation methods, different requirements, different application scenarios, and so on.

[00110] Deve ser compreendido que há muitas maneiras de reduzir a quantidade de quadros alvo que podem aparecer continuamente. Em algumas modalidades, um valor usado para indicar que a quantidade de quadros alvo que podem aparecer continuamente pode ser previamente configurada, e o objetivo de reduzir a quantidade de quadros alvo que podem aparecer continuamente pode ser atingido ao diminuir o valor.[00110] It should be understood that there are many ways to reduce the amount of target frames that may appear continuously. In some embodiments, a value used to indicate that the number of target frames that can appear continuously can be preconfigured, and the objective of reducing the amount of target frames that can appear continuously can be achieved by decreasing the value.

[00111] Em algumas outras modalidades, a contagem de quadros alvo e o limite da contagem de quadros alvo podem ser previamente configurados. A contagem de quadros alvo pode ser usada para indicar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo pode ser usado para indicar a quantidade de quadros alvo que podem aparecer continuamente. Especificamente, a quantidade de quadros alvo que podem aparecer continuamente é reduzida mediante o ajuste de pelo menos um dentre a contagem de quadros alvo e o limite da contagem de quadros alvo. Por exemplo, a quantidade de quadros alvo que podem aparecer continuamente pode ser reduzida ao aumentar (ou indicado como ao aumentar de maneira forçada) a contagem de quadros alvo. Para um outro exemplo, a quantidade de quadros alvo que podem aparecer con-tinuamente pode ser reduzida mediante a diminuição do limite da con-tagem de quadros alvo. Para um outro exemplo, a quantidade de quadros alvo que podem aparecer continuamente pode ser reduzida mediante o aumento da contagem de quadros alvo e mediante a diminuição do limite da contagem de quadros alvo.[00111] In some other embodiments, the target frame count and target frame count threshold may be preconfigured. The target frame count can be used to indicate the amount of target frames that are currently continuously appearing, and the target frame count threshold can be used to indicate the amount of target frames that are currently allowed to appear continuously. Specifically, the number of target frames that can appear continuously is reduced by adjusting at least one of the target frame count and the target frame count threshold. For example, the number of target frames that can appear continuously can be reduced by increasing (or indicated by forcefully increasing) the target frame count. For another example, the number of target frames that can appear continuously can be reduced by decreasing the target frame count limit. For another example, the number of target frames that can appear continuously can be reduced by increasing the target frame count and decreasing the target frame count limit.

[00112] O acima exposto descreve uma maneira de controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente. Em algumas modalidades, antes que a quantidade de quadros alvo que podem aparecer continuamente seja controlada com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, pode ser determinado primeiramente se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição da razão entre sinal e ruído pré-ajustada.[00112] The foregoing describes a way to control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the amount of target frames that can appear continuously. In some embodiments, before the number of target frames that can appear continuously is controlled based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, it may first be determined whether the signal-to-noise ratio parameter of the signal multiple channels satisfies a preset signal-to-noise ratio condition.

[00113] Se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz uma condição pré-ajustada sinal e ruído da relação, a quantidade de quadros alvo que podem aparecer continuamenteé controlada com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais; ou se a razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, o valor de ITD do quadro anterior do quadro atual pode parar diretamente de ser reutilizado como valor de ITD do quadro atual.[00113] If the signal-to-noise ratio parameter of the multi-channel signal does not satisfy a preset signal-to-noise ratio condition, the amount of target frames that can appear continuously is controlled based on the peak characteristic of the correlation coefficients. multiple channel signal crossover; or if the signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, the ITD value of the previous frame of the current frame may directly stop being reused as the ITD value of the current frame.

[00114] Alternativamente, se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição da razão entre sinal e ruído pré-ajustada, a quantidade de quadros alvo que podem aparecer continuamente é controlada com base na característica de pico dos co-eficientes de correlação cruzada do sinal de múltiplos canais; ou se a razão entre sinal e ruído do sinal de múltiplos canais não satisfaz a con-dição da razão entre sinal e ruído, o valor de ITD do quadro anterior do quadro atual pode parar diretamente de ser reutilizado como valor de ITD do quadro atual.[00114] Alternatively, if the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset signal-to-noise ratio condition, the number of target frames that can appear continuously is controlled based on the peak characteristic of the multi-channel signal cross-correlation coefficients; or if the signal-to-noise ratio of the multi-channel signal does not satisfy the signal-to-noise ratio condition, the ITD value of the previous frame of the current frame may directly stop being reused as the ITD value of the current frame.

[00115] O que segue descreve em detalhes uma maneira de determinar se a razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, e como parar de reutilizar o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00115] The following describes in detail a way to determine whether the signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, and how to stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[00116] Em primeiro lugar, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser representado por um ou mais pa-râmetros. Uma maneira específica de selecionar um parâmetro não é limitada nesta modalidade do presente pedido de patente. Por exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser representado por pelo menos uma dentre uma razão entre sinal e ruído de sub-banda, uma razão entre sinal e ruído de sub-banda modificada, uma razão entre sinal e ruído segmental, uma razão entre sinal e ruído segmental modificada, uma razão entre sinal e ruído de faixa integral, uma razão entre sinal e ruído de faixa integral modificada, e um outro parâmetro que pode representar uma característica da razão entre sinal e ruído do sinal de múltiplos canais.[00116] Firstly, the signal-to-noise ratio parameter of the multi-channel signal can be represented by one or more parameters. A specific way of selecting a parameter is not limited in this embodiment of the present patent application. For example, the multichannel signal signal-to-noise ratio parameter may be represented by at least one of a subband signal-to-noise ratio, a modified subband signal-to-noise ratio, a segmental signal-to-noise ratio, a modified segmental signal-to-noise ratio, a full-range signal-to-noise ratio, a modified full-range signal-to-noise ratio, and another parameter that may represent a characteristic of the signal-to-noise ratio of the multi-channel signal.

[00117] Em segundo lugar, uma maneira de determinar o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não é limitada especificamente nesta modalidade do presente pedido de patente. Por exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser calculado ao usar o sinal de múltiplos canais inteiro. Para um outro exemplo, o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais pode ser calculado ao usar alguns sinais do sinal de múltiplos canais, isto é, a razão entre sinal e ruído do sinal de múltiplos canais é representada ao usar razões entre sinal e ruído de alguns sinais. Para um outro exemplo, um sinal de qualquer canal pode ser selecionado de maneira adaptável do sinal de múltiplos canais para executar o cálculo, isto é, a razão entre sinal e ruído do sinal de múltiplos canais é representada ao usar uma razão entre sinal e ruído do sinal do canal. Para um outro exemplo, o cálculo da média ponderada pode ser primeiramente executado nos dados que representam o sinal de múltiplos canais, para formar um novo sinal, e a razão entre sinal e ruído do sinal de múltiplos canais é representada então ao usar uma razão entre sinal e ruído do novo sinal.[00117] Secondly, a way of determining the signal-to-noise ratio parameter of the multi-channel signal is not specifically limited in this embodiment of the present patent application. For example, the signal-to-noise ratio parameter of the multi-channel signal can be calculated by using the entire multi-channel signal. For another example, the signal-to-noise ratio parameter of the multi-channel signal can be calculated by using some signals of the multi-channel signal, that is, the signal-to-noise ratio of the multi-channel signal is represented by using ratios between signal and noise of some signals. For another example, a signal of any channel can be adaptively selected from the multi-channel signal to perform the calculation, that is, the signal-to-noise ratio of the multi-channel signal is represented by using a signal-to-noise ratio of the channel signal. For another example, the weighted average calculation can be first performed on the data representing the multi-channel signal, to form a new signal, and the signal-to-noise ratio of the multi-channel signal is then represented by using a ratio between signal and noise of the new signal.

[00118] O que segue descreve, ao usar um exemplo em que o sinal de múltiplos canais inclui um sinal do canal esquerdo e um sinal do canal direito, uma maneira de calcular a razão entre sinal e ruído do sinal de múltiplos canais.[00118] The following describes, when using an example in which the multi-channel signal includes a left-channel signal and a right-channel signal, a way to calculate the signal-to-noise ratio of the multi-channel signal.

[00119] Por exemplo, a transformação de tempo-frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal esquerdo e em um sinal do domínio do tempo do canal direito, para obter um sinal do domínio da frequência do canal esquerdo e um sinal do domínio da frequência do canal direito; o cálculo da média ponderada é executado em um espectro da amplitude do sinal do domínio da fre-quência do canal esquerdo e em um espectro da amplitude do sinal do domínio da frequência do canal direito, para obter um espectro de am-plitude médio do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito; e uma razão entre sinal e ruído segmental modificada é calculada então com base no espectro de amplitude médio, e é usada como um parâmetro que representa a característica da razão entre sinal e ruído do sinal de múltiplos canais.[00119] For example, time-frequency transformation can be first performed on a left channel time domain signal and a right channel time domain signal, to obtain a left channel frequency domain signal and a right channel frequency domain signal; weighted averaging is performed on a left channel frequency domain signal amplitude spectrum and a right channel frequency domain signal amplitude spectrum to obtain an average signal amplitude spectrum of the left channel frequency domain and the right channel frequency domain signal; and a modified segmental signal-to-noise ratio is then calculated based on the average amplitude spectrum, and is used as a parameter representing the signal-to-noise ratio characteristic of the multi-channel signal.

[00120] Para um outro exemplo, a transformação de tempo-frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal esquerdo, para obter um sinal do domínio da frequência do canal esquerdo, e uma razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal esquerdo é calculada então com base em um espectro da amplitude do sinal do domínio da frequência do canal esquerdo. Do mesmo modo, a transformação de tempo- frequência pode ser primeiramente executada em um sinal do domínio do tempo do canal direito, para obter um sinal do domínio da frequência do canal direito, e uma razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal direito é calculada então com base em um espectro da amplitude do sinal do domínio da frequência do canal direito. Em seguida, um valor médio das razões entre sinal e ruído segmentais modificadas do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito é calculado com base na razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal esquerdo e na razão entre sinal e ruído segmental modificada do sinal do domínio da frequência do canal direito, e é usado como um parâmetro que representa a característica da razão entre sinal e ruído do sinal de múltiplos canais.[00120] For another example, the time-frequency transformation may first be performed on a left-channel time-domain signal, to obtain a left-channel frequency-domain signal, and a modified segmental signal-to-noise ratio. of the left channel frequency domain signal is then calculated based on an amplitude spectrum of the left channel frequency domain signal. Likewise, the time-frequency transformation can first be performed on a right-channel time-domain signal to obtain a right-channel frequency-domain signal, and a modified segmental signal-to-noise ratio of the right-channel time-domain signal. of the right channel frequency is then calculated based on an amplitude spectrum of the right channel frequency domain signal. Then, an average value of the modified segmental signal-to-noise ratios of the left-channel frequency domain signal and the right-channel frequency-domain signal is calculated based on the modified segmental signal-to-noise ratio of the left-channel frequency-domain signal. frequency of the left channel and the modified segmental signal-to-noise ratio of the right-channel frequency domain signal, and is used as a parameter representing the signal-to-noise ratio characteristic of the multi-channel signal.

[00121] Quando a razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição sinal e ruído da relação, o valor de ITD do quadro anterior das paradas do quadro atual que é reutilizado como valor de ITD do quadro atual pode incluir: quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é maior do que o limite pré-ajustado, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual; para um outro exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais está dentro da faixa de valor pré-ajustada, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual; para um outro exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais está além da faixa de valor pré-ajustada, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00121] When the signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, the ITD value of the previous frame of the stops of the current frame that is reused as the ITD value of the current frame may include: when the signal-to-noise ratio parameter value of the multi-channel signal is greater than the preset threshold, the stop of reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame; For another example, when the signal-to-noise ratio parameter value of the multi-channel signal is within the preset value range, stopping reusing the ITD value of the previous frame of the current frame as the ITD value of the current framework; For another example, when the signal-to-noise ratio parameter value of the multi-channel signal is beyond the preset value range, the stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[00122] Além disso, em algumas modalidades, a parada da reutilização do valor de ITD do quadro anterior do quadro atual pode incluir: o aumento (ou indicado como aumento de maneira forçada) da contagem de quadros alvo, de modo que um valor da contagem de quadros alvo seja maior do que ou igual ao limite da contagem de quadros alvo. Em algumas outras modalidades, a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual pode incluir: o ajuste de um bit de sinalizador de parada, de modo que alguns valores do bit de sinalizador de parada representem a parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual. Por exemplo, se o bit de sinalizador de parada for ajustado em 1, o valor de ITD do quadro anterior dos bits de parada do quadro é reutilizado como valor de ITD do quadro atual; ou se o bit de sinalizador de parada for ajustado em 0, o valor de ITD do quadro anterior do quadro atual pode ser reutilizado como valor de ITD do quadro atual.[00122] Additionally, in some embodiments, stopping the reuse of the previous frame's ITD value from the current frame may include: increasing (or indicated as forcefully increasing) the target frame count, such that a value of target frame count is greater than or equal to the target frame count threshold. In some other embodiments, stopping reusing the previous frame's ITD value of the current frame as the current frame's ITD value may include: setting a stop flag bit so that some values of the stop flag bit represent the stop of reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame. For example, if the stop flag bit is set to 1, the previous frame's ITD value of the frame's stop bits is reused as the current frame's ITD value; or if the stop flag bit is set to 0, the ITD value of the previous frame of the current frame can be reused as the ITD value of the current frame.

[00123] Com referência aos exemplos específicos, o que segue descreve em detalhes uma maneira da parada da reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00123] With reference to specific examples, the following describes in detail a way to stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[00124] Por exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é menor do que um limite, o valor da contagem de quadros alvo é modificado de maneira forçada, de modo que um valor modificado é maior do que ou igual ao limite da contagem de quadros alvo.[00124] For example, when the signal-to-noise ratio parameter value of the multi-channel signal is less than a threshold, the target frame count value is forcibly modified, so that a modified value is greater than or equal to the target frame count threshold.

[00125] Para um outro exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é maior do que um limite, o valor da contagem de quadros alvo é modificado de maneira forçada, de modo que um valor modificado é maior do que ou igual ao limite da contagem de quadros alvo.[00125] For another example, when the value of the signal-to-noise ratio parameter of the multi-channel signal is greater than a threshold, the value of the target frame count is forcibly modified, so that a modified value is greater than or equal to the target frame count threshold.

[00126] Para um outro exemplo, independente do fato se o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é menor do que um limite ou é maior do que um outro limite, o valor da contagem de quadros alvo é modificado de maneira forçada, de modo que um valor modificado é maior do que ou igual ao limite da contagem de quadros alvo.[00126] For another example, regardless of whether the value of the signal-to-noise ratio parameter of the multi-channel signal is less than a threshold or is greater than another threshold, the value of the target frame count is forcefully modified such that a modified value is greater than or equal to the target frame count threshold.

[00127] Para um outro exemplo, quando o valor do parâmetro da razão entre sinal e ruído do sinal de múltiplos canais é menor do que um limite ou é maior do que um outro limite, o bit de sinalizador de parada é ajustado em 1.[00127] For another example, when the signal-to-noise ratio parameter value of the multi-channel signal is less than a threshold or is greater than another threshold, the stop flag bit is set to 1.

[00128] Deve ser observado que pode haver uma pluralidade de maneiras de determinar o valor de ITD do quadro atual na etapa 540. Isto não é limitado especificamente nesta modalidade do presente pedido de patente.[00128] It should be noted that there may be a plurality of ways to determine the ITD value of the current frame in step 540. This is not specifically limited in this embodiment of the present patent application.

[00129] Opcionalmente, em algumas modalidades, o valor de ITD do quadro atual pode ser determinado com base em uma consideração ampla de fatores tais como a exatidão do valor de ITD inicial do quadro atual e a quantidade de quadros alvo que podem aparecer continuamente (a quantidade de quadros alvo que podem aparecer continuamente pode ser uma quantidade obtida depois que o controle ou o ajuste são executados com base na etapa 530).[00129] Optionally, in some embodiments, the ITD value of the current frame may be determined based on a broad consideration of factors such as the accuracy of the initial ITD value of the current frame and the number of target frames that can appear continuously ( the amount of target frames that can appear continuously may be an amount obtained after control or adjustment is performed based on step 530).

[00130] Opcionalmente, em algumas outras modalidades, o valor de ITD do quadro atual pode ser determinado com base em uma consideração ampla de fatores tais como a exatidão do valor de ITD inicial do quadro atual, a quantidade de quadros alvo que podem aparecer continuamente (a quantidade de quadros alvo que podem aparecer continu- amente pode ser uma quantidade obtida depois que o ajuste é executado com base na etapa 530), e se o quadro atual é um quadro de voz contínuo. Por exemplo, se um nível da confiança do valor de ITD inicial do quadro atual for alto, o valor de ITD inicial do quadro atual pode ser diretamente usado como valor de ITD do quadro atual. Para um outro exemplo, quando um nível da confiança do valor de ITD inicial do quadro atual é baixo, e o quadro atual satisfaz uma condição para a reutilização do valor de ITD do quadro anterior do quadro atual, o valor de ITD do quadro anterior do quadro atual pode ser reutilizado para o quadro atual.[00130] Optionally, in some other embodiments, the ITD value of the current frame may be determined based on a broad consideration of factors such as the accuracy of the initial ITD value of the current frame, the number of target frames that can appear continuously (the amount of target frames that can appear continuously may be an amount obtained after adjustment is performed based on step 530), and whether the current frame is a continuous voice frame. For example, if a confidence level of the current frame's starting ITD value is high, the current frame's starting ITD value can be directly used as the current frame's ITD value. For another example, when a confidence level of the current frame's initial ITD value is low, and the current frame satisfies a condition for reusing the previous frame's ITD value of the current frame, the ITD value of the previous frame of the current frame is low. current frame can be reused for the current frame.

[00131] Deve ser compreendido que pode haver uma pluralidade de maneiras de calcular o nível da confiança do valor de ITD inicial do qua-dro atual. Isto não é limitado especificamente nesta modalidade do pre-sente pedido de patente.[00131] It should be understood that there may be a plurality of ways to calculate the confidence level of the initial ITD value of the current frame. This is not specifically limited to this embodiment of the present patent application.

[00132] Por exemplo, se um valor, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que fica entre os valores dos coeficientes de correlação cruzada do sinal de múltiplos canais for maior do que um limite pré-ajustado, pode-se considerar que o nível de confiança do valor de ITD inicial é alto.[00132] For example, if a cross-correlation coefficient value that corresponds to the initial ITD value and that falls between the cross-correlation coefficient values of the multi-channel signal is greater than a preset threshold, it may It should be considered that the level of confidence in the initial ITD value is high.

[00133] Para um outro exemplo, se uma diferença entre um valor, do coeficiente de correlação cruzada, que corresponde ao valor de ITD ini-cial e que fica entre os valores dos coeficientes de correlação cruzada do sinal de múltiplos canais, e um segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais for maior do que um limite pré-ajustado, pode-se considerar que o nível de confiança do valor de ITD inicial é alto.[00133] For another example, if a difference between a value of the cross-correlation coefficient, which corresponds to the initial ITD value and which lies between the values of the cross-correlation coefficients of the multi-channel signal, and a second If the value of the cross-correlation coefficients of the multi-channel signal is greater than a preset threshold, the confidence level of the initial ITD value can be considered to be high.

[00134] Para um outro exemplo, se o valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais for maior do que um limite pré-ajustado, pode-se considerar que o nível de confiança do valor de ITD inicial é alto.[00134] For another example, if the amplitude value of the peak value of the cross-correlation coefficients of the multi-channel signal is greater than a preset threshold, it can be considered that the confidence level of the ITD value initial is high.

[00135] Deve ser compreendido que pode haver uma pluralidade de maneiras de determinar se o quadro atual satisfaz a condição para a reutilização do valor de ITD do quadro anterior do quadro atual.[00135] It should be understood that there may be a plurality of ways to determine whether the current frame satisfies the condition for reusing the ITD value of the previous frame from the current frame.

[00136] Opcionalmente, em algumas modalidades, que o quadro atual satisfaz a condição para a reutilização do valor de ITD do quadro anterior do quadro atual pode ser: a contagem de quadros alvo é menor do que o limite da contagem de quadros alvo.[00136] Optionally, in some embodiments, the current frame satisfies the condition for reusing the ITD value of the previous frame of the current frame may be: the target frame count is less than the target frame count threshold.

[00137] Opcionalmente, em algumas modalidades, que o quadro atual satisfaz a condição para a reutilização do valor de ITD do quadro anterior do quadro atual pode ser: um resultado da detecção da ativação de voz do quadro atual indica que o quadro atual e os N quadros anteriores (N é um número inteiro maior do que 1) do quadro atual formam quadros de voz contínuos. Neste caso, se o valor de ITD do quadro anterior do quadro atual não for igual a um primeiro valor pré-ajustado (se um valor de ITD de um quadro for o primeiro valor pré-ajustado, pode- se considerar que o valor de ITD, obtido através de cálculo, do quadro é ajustado de maneira forçada ao primeiro valor pré-ajustado devido á imprecisão, em que o primeiro valor pré-ajustado pode ser, por exemplo, 0), o valor de ITD do quadro atual é igual ao primeiro valor pré-ajustado, e a contagem de quadros alvo é menor do que o limite da contagem de quadros alvo. Por exemplo, quando um resultado da detecção da ativa-ção de voz do quadro atual e os resultados da detecção da ativação de voz dos N quadros anteriores (N é um número inteiro positivo maior do que 1) do quadro atual indicam quadros da voz, se o valor de ITD do quadro anterior do quadro atual não for igual a 0, o valor de ITD do qua-dro atual é ajustado de maneira forçada em 0, e a contagem de quadros alvo é menor do que o limite da contagem de quadros alvo. Então o valor de ITD do quadro anterior do quadro atual pode ser usado como valor de ITD do quadro atual, e o valor da contagem de quadros alvo é au-mentado. Deve ser observado que pode haver uma pluralidade de ma-neiras de ajustar de maneira forçada o valor de ITD do quadro atual em 0. Por exemplo, o valor de ITD do quadro atual pode ser mudado para 0; ou um bit de sinalizador pode ser ajustado, para representar que o valor de ITD do quadro atual foi ajustado de maneira forçada em 0; ou as duas maneiras acima podem ser combinadas.[00137] Optionally, in some embodiments, that the current frame satisfies the condition for reusing the previous frame's ITD value from the current frame may be: a result of detecting the voice activation of the current frame indicates that the current frame and the Previous N frames (N is an integer greater than 1) of the current frame form continuous voice frames. In this case, if the ITD value of the previous frame of the current frame is not equal to a first preset value (if an ITD value of a frame is the first preset value, it can be considered that the ITD value , obtained through calculation, of the frame is forcibly adjusted to the first preset value due to inaccuracy, where the first preset value may be, for example, 0), the ITD value of the current frame is equal to the first preset value, and the target frame count is less than the target frame count threshold. For example, when a voice activation detection result of the current frame and the voice activation detection results of the previous N frames (N is a positive integer greater than 1) of the current frame indicate voice frames, If the ITD value of the previous frame of the current frame is not equal to 0, the ITD value of the current frame is forcibly set to 0, and the target frame count is less than the frame count threshold target. Then the ITD value of the previous frame of the current frame can be used as the ITD value of the current frame, and the target frame count value is increased. It should be noted that there may be a plurality of ways to forcibly set the ITD value of the current frame to 0. For example, the ITD value of the current frame may be changed to 0; or a flag bit may be set, to represent that the ITD value of the current frame has been forcibly set to 0; or the above two ways can be combined.

[00138] O que segue descreve as modalidades do presente pedido de patente de uma maneira mais detalhada com referência aos exem-plosespecíficos. Deve ser observado que um exemplo na FIGURA 6 se presta meramente a ajudar um elemento versado no estado da técnica a compreender as modalidades do presente pedido de patente, mas não a limitar as modalidades do presente pedido de patente a um valor es-pecífico ou a um cenário específico no exemplo. Obviamente, um ver-sado na técnica pode executar várias modificações ou variações equi-valentes com base no exemplo mostrado na FIGURA 6, e tais modifica-ções ou variações também se enquadram dentro do âmbito das moda-lidades do presente pedido de patente.[00138] The following describes the embodiments of the present patent application in more detail with reference to specific examples. It should be noted that an example in FIGURE 6 is intended merely to assist one skilled in the art to understand the embodiments of the present patent application, but not to limit the embodiments of the present patent application to a specific value or to a specific scenario in the example. Obviously, one skilled in the art can perform various equivalent modifications or variations based on the example shown in FIGURE 6, and such modifications or variations also fall within the scope of the embodiments of the present patent application.

[00139] A FIGURA 6 é um fluxograma esquemático de um método para a codificação de um sinal de múltiplos canais de acordo com uma modalidade do presente pedido de patente. Deve ser compreendido que as etapas de processamento ou as operações mostradas na FIGURA 6 são meramente exemplos, e outras operações, ou variações das opera-ções na FIGURA 6, também podem ser executadas nesta modalidade do presente pedido de patente. Além disso, as etapas na FIGURA 6 podem ser executadas em uma sequência diferente daquela mostrada na FIGURA 6, e algumas operações na FIGURA 6 podem não ter que ser executadas. A FIGURA 6 é descrita ao usar um exemplo em que um sinal de múltiplos canais inclui um sinal do canal esquerdo e um sinal do canal direito. Também deve ser compreendido que um parâmetro que representa um grau de estabilidade de uma posição de pico de co-eficientes de correlação cruzada do sinal de múltiplos canais na moda-lidade da FIGURA 6 pode ser o parâmetro de confiança da amplitude de pico e/ou parâmetro da flutuação da posição do pico descritos acima.[00139] FIGURE 6 is a schematic flowchart of a method for encoding a multi-channel signal in accordance with an embodiment of the present patent application. It should be understood that the processing steps or operations shown in FIGURE 6 are merely examples, and other operations, or variations of the operations in FIGURE 6, may also be performed in this embodiment of the present patent application. Furthermore, the steps in FIGURE 6 may be performed in a different sequence than those shown in FIGURE 6, and some operations in FIGURE 6 may not have to be performed. FIGURE 6 is described using an example in which a multi-channel signal includes a left channel signal and a right channel signal. It should also be understood that a parameter representing a degree of stability of a cross-correlation coefficients peak position of the multichannel signal in the embodiment of FIGURE 6 may be the confidence parameter of the peak amplitude and/or peak position fluctuation parameter described above.

[00140] O método na FIGURA 6 inclui as etapas a seguir.[00140] The method in FIGURE 6 includes the following steps.

[00141] 602: Executa a transformação de tempo-frequência em um sinal do domínio do tempo do canal esquerdo e em um sinal do domínio do tempo do canal direito.[00141] 602: Performs time-frequency transformation on a left channel time domain signal and a right channel time domain signal.

[00142] Especificamente, um sinal do domínio do tempo do canal es-querdo de um mésimosubquadro de um quadro atual pode ser represen-tado por x (n) , e um sinal do domínio do tempo do canal direito do mésimosubquadro pode ser representado por x (n), onde m = 0, 1, ..., SUBFR NUM-1, SBFR NUM é uma quantidade de subquadros incluídos em um quadro de áudio, n é um valor de índice de uma amostra, n = 0, 1, ..., N-1, e N é uma quantidade de amostras incluídas no sinal do domínio do tempo do canal esquerdo ou no sinal do domínio do tempo do canal direito do mésimosubquadro. Em um exemplo em que um sinal de múltiplos canais tem uma taxa da amostragem de 16 kHz, e um compri-mento de um quadro de áudio é de 20 ms, cada um dentre um sinal do domínio do tempo do canal esquerdo e um sinal do domínio do tempo do canal direito do quadro de áudio inclui 320 amostras. Se o quadro de áudio for dividido em dois subquadros, e um sinal do domínio do tempo do canal esquerdo e um sinal do domínio do tempo do canal direito de cada subquadro incluir 160 amostras, N é igual a 160.[00142] Specifically, a left channel time domain signal of a month subframe of a current frame can be represented by x (n), and a right channel time domain signal of the month subframe can be represented by x (n), where m = 0, 1, ..., SUBFR NUM-1, SBFR NUM is a number of subframes included in an audio frame, n is an index value of a sample, n = 0, 1 , ..., N-1, and N is a number of samples included in the left channel time domain signal or the right channel time domain signal of the month subframe. In an example where a multi-channel signal has a sampling rate of 16 kHz, and an audio frame length is 20 ms, each of a left channel time domain signal and a left channel signal Time domain of the right channel of the audio frame includes 320 samples. If the audio frame is divided into two subframes, and a left channel time domain signal and a right channel time domain signal of each subframe include 160 samples, N equals 160.

[00143] A transformação rápida de Fourier com base em L amostras é executada separadamente em , para obter um sinal do domínio da frequência do canal esquerdo x (n) do mésimosubqua- dro e um sinal do domínio da frequência do canal direito x (n) do mé- simo subquadro, onde k = 0, 1, ..., L-1, e L é um comprimento da trans-formação rápida de Fourier, por exemplo, L pode ser 400 ou 800.[00143] Fast Fourier transformation based on L samples is performed separately in , to obtain a left channel frequency domain signal x (n) from the month subframe and a right channel frequency domain signal x (n) from the same subframe, where k = 0, 1, ... , L-1, and L is a length of the fast Fourier transform, for example, L can be 400 or 800.

[00144] 604 e 605: Calcula uma razão entre sinal e ruído segmental modificada com base em um sinal do domínio da frequência do canal esquerdo e em um sinal do domínio da frequência do canal direito, e executa a detecção da ativação de voz com base na razão entre sinal e ruído segmental modificada.[00144] 604 and 605: Calculates a modified segmental signal-to-noise ratio based on a left channel frequency domain signal and a right channel frequency domain signal, and performs voice activation detection based on in the modified segmental signal-to-noise ratio.

[00145] Especificamente, há uma pluralidade de maneiras para calcular a razão entre sinal e ruído segmental modificada com base em. O que segue fornece uma maneira específica de cálculo.[00145] Specifically, there are a plurality of ways to calculate the modified segmental signal-to-noise ratio based on . The following provides a specific way of calculation.

[00146] Etapa 1: Calcula um espectro de amplitude médio SPDm(k) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito do mésimosubquadro com base em [00146] Step 1: Calculates an average amplitude spectrum SPDm(k) of the left channel frequency domain signal and the right channel frequency domain signal of the month subframe based on

[00147] Por exemplo, pode ser calculado de acordo com uma fórmula (5): na qual [00147] For example, it can be calculated according to a formula (5): in which

[00148] onde k = 1, ..., L/2-1, A é um fator da razão de mistura do espectro da amplitude do canal esquerdo/direito, e A pode ser normal-mente 0,5, 0,4, 0,3, ou um outro valor empírico.[00148] where k = 1, ..., L/2-1, A is a factor of the left/right channel amplitude spectrum mixing ratio, and A can typically be 0.5, 0.4 , 0.3, or another empirical value.

[00149] Etapa 2: Calcula a energia da sub-banda E_bandm(i) com base no espectro de amplitude médio SPDm(k) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito do mésimosubquadro, onde i = 0, 1, ..., BAND_NUM-1 e BAND_NUMé uma quantidade de sub-bandas.[00149] Step 2: Calculates the subband energy E_bandm(i) based on the average amplitude spectrum SPDm(k) of the left channel frequency domain signal and the right channel frequency domain signal of the month subframe, where i = 0, 1, ..., BAND_NUM-1 and BAND_NUM is a number of sub-bands.

[00150] Por exemplo, pode ser calculado ao usar uma fórmula (6): [00150] For example, it can be calculated when using a formula (6):

[00151] onde band_rbé uma tabela pré-ajustada usada para a divisão de sub-banda, band_tb [i]é um lote da frequência do limite inferior de uma iésimasub-banda, e band_tb [i+1]-1é um lote da frequência do limite superior da iésimasub-banda.[00151] where band_r is a preset table used for subband division, band_tb [i] is a batch of the lower limit frequency of an ith subband, and band_tb [i+1]-1 is a batch of the frequency of the upper limit of the ith sub-band.

[00152] Etapa 3: Calcula a razão entre sinal e ruído segmental modificada mssnr com base na energia de sub-banda e uma estimativa da energia de ruído da sub-banda E_band_n(i).[00152] Step 3: Calculates the modified segmental signal-to-noise ratio mssnr based on the subband energy and an estimate of the subband noise energy E_band_n(i).

[00153] Por exemplo, mssnr pode ser calculado ao usar uma fórmula (7) e uma fórmula (8): [00153] For example, mssnr can be calculated by using a formula (7) and a formula (8):

[00154] onde se msnr (i) <G , msnr (i) = msnr (i)2 / G ; [00154] where if msnr (i) <G , msnr (i) = msnr (i)2 / G ;

[00155] onde msnr(i)é uma razão entre sinal e ruído da sub-banda modificada, G é um limite da modificação da razão entre sinal e ruído da sub-banda pré-ajustado, e G pode ser normalmente 5, 6, 7, ou outros valores empíricos. Deve ser compreendido que há uma pluralidade de métodos para calcular a razão entre sinal e ruído segmental modificada, e isto é meramente um exemplo no presente documento.[00155] where msnr(i) is a signal-to-noise ratio of the modified subband, G is a limit of the modification of the signal-to-noise ratio of the preset subband, and G can normally be 5, 6, 7, or other empirical values. It should be understood that there are a plurality of methods for calculating modified segmental signal-to-noise ratio, and this is merely an example herein.

[00156] Etapa 4: Atualiza a estimativa da energia de ruído de subbanda E_band_n (i) com base na razão entre sinal e ruído segmental modificada e na energia de sub-banda E_band (i).[00156] Step 4: Update the E_band_n (i) subband noise energy estimate based on the modified segmental signal-to-noise ratio and the E_band (i) subband energy.

[00157] Especificamente, a energia de sub-banda média pode ser primeiramente calculada de acordo com uma fórmula (9): [00157] Specifically, the average sub-band energy can first be calculated according to a formula (9):

[00158] Se uma contagem de VAD vad_fm_cnt for menor do que o comprimento de quadro inicial pré-ajustado do ruído, a contagem de VAD pode ser aumentada. O comprimento de quadro inicial pré-ajus- tado do ruído é normalmente um valor pré-ajustado empírico, por exemplo, pode ser 29, 30, 31, ou outros valores empíricos.[00158] If a VAD count vad_fm_cnt is less than the preset initial frame length of the noise, the VAD count may be increased. The preset initial frame length of the noise is normally an empirical preset value, for example, it may be 29, 30, 31, or other empirical values.

[00159] Se uma contagem de VAD vad_fm_cnt for menor do que o de quadro ajustado inicial pré-ajustado do ruído, e a energia de subbanda média for menor do que um limite de energia de ruído ener_th, a estimativa da energia de ruído de sub-banda E_band_n (i) pode ser atualizada, e um sinalizador de atualização da energia de ruído é ajustado em 1. O limite da energia de ruído é normalmente um valor pré- ajustado empírico, por exemplo, pode ser 35.000.000, 40.000.000, 45.000.000, ou outros valores empíricos.[00159] If a VAD count vad_fm_cnt is less than the noise preset initial adjusted frame, and the average subband energy is less than an ener_th noise energy threshold, the subband noise energy estimate -band E_band_n (i) can be updated, and a noise energy update flag is set to 1. The noise energy threshold is normally an empirical preset value, for example, it can be 35,000,000, 40,000. 000, 45,000,000, or other empirical values.

[00160] Especificamente, a estimativa da energia do ruído de subbanda pode ser atualizada ao usar uma fórmula (10): [00160] Specifically, the subband noise energy estimate can be updated by using a formula (10):

[00161] onde E_band_nn-1(i)é a energia do ruído de sub-banda histórica, por exemplo, pode ser a energia do ruído de sub-banda antes da atualização.[00161] where E_band_nn-1(i) is the historical sub-band noise energy, for example, it may be the sub-band noise energy before the update.

[00162] Em caso contrário, se a razão entre sinal e ruído segmental modificada for menor do que um limite de atualização de ruído thUPDATE, a estimativa da energia do ruído de sub-banda E_band_n (i)também pode ser atualizada, e um sinalizador de atualização da energia de ruído é ajustada em 1. O limite de atualização do ruído thUPDATE pode ser 4, 5, 6, ou outros valores empíricos.[00162] Otherwise, if the modified segmental signal-to-noise ratio is less than a noise update threshold thUPDATE, the sub-band noise energy estimate E_band_n (i) may also be updated, and a flag noise energy update threshold is set to 1. The thUPDATE noise update threshold can be 4, 5, 6, or other empirical values.

[00163] Especificamente, a estimativa da energia do ruído de subbanda pode ser atualizada ao usar uma fórmula (11): [00163] Specifically, the subband noise energy estimate can be updated by using a formula (11):

[00164] onde update_facé uma taxa de atualização de ruído específica, e pode ser um valor constante entre 0 e 1, por exemplo, pode ser 0,03, 0,04, 0,05, ou um outro valor empírico; e E_band_nn-1(i)é a energia do ruído de sub-banda histórica, por exemplo, pode ser a energia do ruído de sub-banda antes da atualização.[00164] where update_face is a specific noise update rate, and may be a constant value between 0 and 1, for example, it may be 0.03, 0.04, 0.05, or another empirical value; and E_band_nn-1(i) is the historical sub-band noise energy, for example, it can be the sub-band noise energy before the update.

[00165] Além disso, para assegurar a eficácia do cálculo da razão entre sinal e ruído de sub-banda, um valor da estimativa da energia do ruído de sub-banda atualizado pode ser limitado, por exemplo, um valor mínimo de E_band_n (i) pode ser limitado a 1.[00165] Furthermore, to ensure the effectiveness of calculating the subband signal to noise ratio, a value of the updated subband noise energy estimate can be limited, for example, a minimum value of E_band_n (i ) can be limited to 1.

[00166] Deve ser observado que há muitos métodos para atualizar E_band_n (i) com base na razão entre sinal e ruído segmental modificada e E_band (i). Isto não é limitado especificamente nesta modalidade do presente pedido de patente, e este é meramente um exemplo no presente documento.[00166] It should be noted that there are many methods for updating E_band_n (i) based on the modified segmental signal-to-noise ratio and E_band (i). This is not specifically limited to this embodiment of the present patent application, and this is merely an example in the present document.

[00167] Em seguida, a detecção da ativação de voz pode ser executada para o mésimosubquadro com base na razão entre sinal e ruído segmental modificada. Especificamente, se a razão entre sinal e ruído segmental modificada for maior do que um limite da detecção da ativação de voz thVAD, o mésimosubquadro é um quadro de voz, e neste caso um sinalizador de detecção da ativação de voz vad_flag [m] do mésimo subquadro é ajustado em 1; em caso contrário, o mésimosubquadro é um quadro de ruído de fundo, e neste caso um sinalizador de detecção da ativação de voz vad_flag [m] do mésimosubquadro pode ser ajustado em 0. O limite da detecção da ativação de voz thVAD pode ser 3.500, 4.000, 4.500, ou outros valores empíricos.[00167] Then, voice activation detection can be performed for the month subframe based on the modified segmental signal-to-noise ratio. Specifically, if the modified segmental signal-to-noise ratio is greater than a voice activation detection threshold thVAD, the mth subframe is a voice frame, in which case a voice activation detection flag vad_flag [m] of the mth subframe is set to 1; otherwise, the mthsubframe is a background noise frame, in which case a voice activation detection flag vad_flag [m] of the mthsubframe can be set to 0. The voice activation detection threshold thVAD can be 3500, 4,000, 4,500, or other empirical values.

[00168] 606 a 608: Calcula um coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito com base no sinal do domínio da frequência do canal esquerdo e no sinal do domínio da frequência do canal direito, e calcula um valor de ITD inicial de um quadro atual com base no coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito.[00168] 606 to 608: Calculates a cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal based on the left channel frequency domain signal and the frequency domain signal of the right channel, and calculates an initial ITD value of a current frame based on the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal.

[00169] Pode haver uma pluralidade de maneiras de calcular o coeficiente de correlação cruzada Xcorr(t) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito com base em. O que segue fornece uma implemen- tação específica.[00169] There may be a plurality of ways to calculate the cross-correlation coefficient Xcorr(t) of the left channel frequency domain signal and the right channel frequency domain signal based on . What follows provides a specific implementation.

[00170] Em primeiro lugar, um espectro de poder de correlação cruzadaXcorrm (k) do sinal do domínio da frequência do canal esquerdo e o sinal do domínio da frequência do canal direito do mésimosubquadro é calculado de acordo com uma fórmula (12): [00170] Firstly, a cross-correlation power spectrumXcorrm (k) of the left channel frequency domain signal and the right channel frequency domain signal of the month subframe is calculated according to a formula (12):

[00171] Em seguida, o processamento de atenuação é executado no espectro de poder da correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito de acordo com uma fórmula (13), para obter um espectro de poder da correlação cruzada atenuado Xcorr_smooth(k): [00171] Then, attenuation processing is performed on the power spectrum of the cross-correlation of the left channel frequency domain signal and the right channel frequency domain signal according to a formula (13), to obtain a power spectrum of the smoothed cross-correlation Xcorr_smooth(k):

[00172] onde smooth_facé um fator de atenuação, e o fator de atenuação pode ser qualquer número positivo entre 0 e 1, por exemplo, pode ser 0,4, 0,5, 0,6, ou um outro valor empírico.[00172] where smooth_face is an attenuation factor, and the attenuation factor can be any positive number between 0 and 1, for example, it can be 0.4, 0.5, 0.6, or another empirical value.

[00173] Em seguida, Xcorr(t) pode ser calculado com base em Xcorr_smooth(k) ao usar uma fórmula (14): [00173] Then, Xcorr(t) can be calculated based on Xcorr_smooth(k) when using a formula (14):

[00174] onde IDFT(*) indica a transformação inversa de Fourier; uma faixa de valor de um valor de ITD incluído no cálculo pode ser [- ITD_MAX, ITD_MAX]; e a interceptação e o reordenamento são executados em Xcorr(t) com base na faixa de valor do valor de ITD, para obter um coeficiente de correlação cruzada Xcorr_idt(t), usado para determi- nar o valor de ITD inicial do quadro atual, do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, e neste caso t = 0, ... 2*ITD_MAX.[00174] where IDFT(*) indicates the inverse Fourier transformation; a value range of an ITD value included in the calculation may be [- ITD_MAX, ITD_MAX]; and interception and reordering are performed in Xcorr(t) based on the value range of the ITD value, to obtain a cross-correlation coefficient Xcorr_idt(t), used to determine the starting ITD value of the current frame, of the left channel frequency domain signal and the right channel frequency domain signal, and in this case t = 0, ... 2*ITD_MAX.

[00175] Então o valor de ITD inicial do quadro atual pode ser estimado com base em Xcorr_itd(t) e ao usar uma fórmula (15): [00175] Then the initial ITD value of the current frame can be estimated based on Xcorr_itd(t) and using a formula (15):

[00176] 610 a 612: Determina um nível de confiança do valor de ITD inicial do quadro atual. Se o nível da confiança do valor de ITD inicial for alto, uma contagem de quadros alvo pode ser ajustada ao valor pré- ajustado inicial.[00176] 610 to 612: Determines a confidence level of the initial ITD value of the current frame. If the confidence level of the initial ITD value is high, a target frame count can be adjusted to the initial preset value.

[00177] Especificamente, o nível da confiança do valor de ITD inicial do quadro atual pode ser primeiramente determinado. Pode haver uma pluralidade de maneiras de determinação específicas. O que segue fornecedescrições mediante o uso de exemplos.[00177] Specifically, the confidence level of the initial ITD value of the current frame can first be determined. There may be a plurality of specific determination ways. The following provides descriptions through the use of examples.

[00178] Por exemplo, um valor da amplitude, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que fica entre os valores da amplitude do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito pode ser comparado com um limite pré-ajus- tado. Se o valor da amplitude for maior do que o limite pré-ajustado, pode-se considerar que o nível da confiança do valor de ITD inicial do quadro atual é alto.[00178] For example, an amplitude value of the cross-correlation coefficient that corresponds to the initial ITD value and that lies between the amplitude values of the cross-correlation coefficient of the left channel frequency domain signal and the left channel signal. frequency domain of the right channel can be compared with a preset threshold. If the amplitude value is greater than the preset threshold, the confidence level of the initial ITD value of the current frame can be considered to be high.

[00179] Para um outro exemplo, os valores do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito podem ser primeiramente classificados em ordem descendente de valores da amplitude. Então um coeficiente de correlação cruzada alvo em uma localização pré-ajustada (a posição pode ser representada ao usar um valor de índice do coeficiente de correlação cruzada) pode ser selecionado de valores classificados do coeficiente de correlação cruzada. Em seguida, um valor da amplitude, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que fica entre os valores da amplitude do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, é comparado com um valor da amplitude do coeficiente de correlação cruzada alvo. Se uma diferença entre os valores da amplitude for maior do que um limite pré-ajustado, pode-se considerar que o nível de confiança do valor de ITD inicial do quadro atual é alto; se uma razão entre os valores da amplitude for maior do que o limite pré-ajustado, pode-se considerar que o nível de confiança do valor de ITD inicial do quadro atual é alto; ou se o valor da amplitude, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que fica entre os valores da amplitude do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, for maior do que o valor da amplitude do coeficiente de correlação cruzada alvo, pode-se considerar que o nível de confiança do valor de ITD inicial do quadro atual é alto.[00179] For another example, the cross-correlation coefficient values of the left channel frequency domain signal and the right channel frequency domain signal can first be sorted in descending order of amplitude values. Then a target cross-correlation coefficient at a preset location (the position can be represented by using an index value of the cross-correlation coefficient) can be selected from ranked values of the cross-correlation coefficient. Then an amplitude value of the cross-correlation coefficient, which corresponds to the initial ITD value and which lies between the amplitude values of the cross-correlation coefficient of the left channel frequency domain signal and the frequency domain signal of the right channel, is compared with a target cross-correlation coefficient amplitude value. If a difference between the amplitude values is greater than a preset threshold, the confidence level of the initial ITD value of the current frame can be considered to be high; if a ratio between the amplitude values is greater than the preset threshold, the confidence level of the initial ITD value of the current frame can be considered to be high; or if the amplitude value of the cross-correlation coefficient, which corresponds to the initial ITD value and which lies between the amplitude values of the cross-correlation coefficient of the left channel frequency domain signal and the left channel frequency domain signal right channel, is greater than the target cross-correlation coefficient amplitude value, the confidence level of the initial ITD value of the current frame can be considered to be high.

[00180] Além disso, depois que o coeficiente de correlação cruzada alvo é obtido, primeiramente, o coeficiente de correlação cruzada alvo ainda pode ser modificado. Em seguida, o valor da amplitude, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que fica entre os valores da amplitude do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, é comparado com um valor da amplitude de um coeficiente de correlação cruzada modificado alvo. Se o valor da amplitude, do coeficiente de correlação cruzada, que corresponde ao valor de ITD inicial e que é entre valores da amplitude do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, for maior do que o valor da amplitude do coeficiente de correlação cruzada modificado alvo, pode-se considerar que o nível de confiança do valor de ITD inicial do quadro atual é alto.[00180] Furthermore, after the target cross-correlation coefficient is first obtained, the target cross-correlation coefficient can still be modified. Then the amplitude value of the cross-correlation coefficient, which corresponds to the initial ITD value and which lies between the amplitude values of the cross-correlation coefficient of the left channel frequency domain signal and the frequency domain signal of the right channel, is compared with an amplitude value of a target modified cross-correlation coefficient. If the amplitude value of the cross-correlation coefficient, which corresponds to the initial ITD value and which is between the amplitude values of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal , is greater than the amplitude value of the target modified cross-correlation coefficient, the confidence level of the initial ITD value of the current frame can be considered to be high.

[00181] Se o nível da confiança do valor de ITD inicial do quadro atual for alto, o valor de ITD inicial pode ser usado como um valor de ITD do quadro atual. Além disso, um bit de sinalizador itd_cal_flag que indica o cálculo exato do valor de ITD pode ser pré-ajustado. Se o nível de confiança do valor de ITD inicial do quadro atual for alto, itd_cal_flag pode ser ajustado em 1; ou, se o nível de confiança do valor de ITD inicial do quadro atual for baixo, itd_cal_flag pode ser ajustado em 0.[00181] If the confidence level of the initial ITD value of the current frame is high, the initial ITD value can be used as an ITD value of the current frame. Additionally, an itd_cal_flag flag bit that indicates the exact calculation of the ITD value can be preset. If the confidence level of the current frame's initial ITD value is high, itd_cal_flag can be set to 1; or, if the confidence level of the current frame's starting ITD value is low, itd_cal_flag can be set to 0.

[00182] Além disso, se o nível de confiança do valor de ITD inicial do quadro atual for alto, a contagem de quadros alvo pode ser ajustada ao valor pré-ajustado inicial, por exemplo, a contagem de quadros alvo pode ser ajustada em 0 ou 1.[00182] Furthermore, if the confidence level of the initial ITD value of the current frame is high, the target frame count can be set to the initial preset value, for example, the target frame count can be set to 0 or 1.

[00183] 614: Se o nível da confiança do valor de ITD inicial for baixo, a modificação do valor de ITD pode ser executada no valor de ITD inicial. Pode haver muitas maneiras de modificar um valor de ITD. Por exemplo, o processamento de desconexão pode ser executado no valor de ITD, ou o valor de ITD pode ser modificado com base em uma correlação de dois quadros adjacentes. Isto não é limitado especificamente nesta modalidade do presente pedido de patente.[00183] 614: If the confidence level of the initial ITD value is low, modification of the ITD value can be performed on the initial ITD value. There can be many ways to modify an ITD value. For example, disconnection processing may be performed on the ITD value, or the ITD value may be modified based on a correlation of two adjacent frames. This is not specifically limited to this embodiment of the present patent application.

[00184] 616 a 618: Determina se um valor de ITD de um quadro an terior é reutilizado para o quadro atual; e se o valor de ITD do quadro anterior for reutilizado para o quadro atual, aumenta um valor de uma contagem de quadros alvo.[00184] 616 to 618: Determines whether an ITD value from a previous frame is reused for the current frame; and if the ITD value of the previous frame is reused for the current frame, it increases by a value of a target frame count.

[00185] 620 a 622: Determina se a razão entre sinal e ruído segmen tal modificada satisfaz uma condição de razão entre sinal e ruído pré- ajustada; e se a razão entre sinal e ruído segmental modificada satisfaz uma condição de razão entre sinal e ruído pré-ajustada, para a reutilização de um valor de ITD de um quadro anterior como um valor de ITD de um quadro atual. Por exemplo, um valor de uma contagem de quadros alvo pode ser modificado, de modo que uma contagem modificada do quadro alvo seja maior do que ou igual a um limite da contagem de quadros alvo (o limite pode indicar uma quantidade de quadros alvo que podem aparecer continuamente), de modo a parar a reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00185] 620 to 622: Determines whether the modified segment signal-to-noise ratio satisfies a pre-adjusted signal-to-noise ratio condition; and whether the modified segmental signal-to-noise ratio satisfies a preset signal-to-noise ratio condition, for reusing an ITD value from a previous frame as an ITD value from a current frame. For example, a value of a target frame count may be modified such that a modified target frame count is greater than or equal to a threshold of the target frame count (the threshold may indicate a number of target frames that can be appears continuously), so as to stop reusing the previous frame's ITD value of the current frame as the current frame's ITD value.

[00186] Pode haver uma pluralidade de maneiras de determinar se a razão entre sinal e ruído segmental modificada satisfaz a condição de razão entre sinal e ruído pré-ajustada. Opcionalmente, em algumas modalidades, quando a razão entre sinal e ruído segmental modificada é menor do que um primeiro limite ou é maior do que um segundo limite, pode-se considerar que a razão entre sinal e ruído segmental modificada satisfaz uma condição de razão entre sinal e ruído pré-ajustada. Neste caso, o valor da contagem de quadros alvo pode ser modificado, de modo que uma contagem modificada do quadro alvo fica maior do que ou igual ao limite da contagem de quadros alvo.[00186] There may be a plurality of ways to determine whether the modified segmental signal-to-noise ratio satisfies the preset signal-to-noise ratio condition. Optionally, in some embodiments, when the modified segmental signal-to-noise ratio is less than a first threshold or is greater than a second threshold, the modified segmental signal-to-noise ratio may be considered to satisfy a ratio condition. pre-adjusted signal and noise. In this case, the target frame count value may be modified such that a modified target frame count is greater than or equal to the target frame count threshold.

[00187] Por exemplo, supondo que um limite de voz da razão entre sinal e ruído elevado HIGH_SNR_VOICE_TH seja pré-ajustado em 10.000, o primeiro limite pode ser ajustado em A1*HIGH_ SNR_VOICE_TH, e o segundo limite é ajustado em A2*HIGH_SNR_VOICE_TH, em que A1 e A2 são números reais positivos, e A1 < A2. No presente documento, A1 pode ser 0,5, 0,6, 0,7, ou um outro valor empírico, e A2 pode ser 290, 300, 310, ou outros valores empíricos. O limite da contagem de quadros alvo pode ser igual a 9, 10, 11, ou outros valores empíricos.[00187] For example, assuming that a high signal-to-noise ratio voice threshold HIGH_SNR_VOICE_TH is preset to 10,000, the first threshold can be set to A1*HIGH_ SNR_VOICE_TH, and the second threshold is set to A2*HIGH_SNR_VOICE_TH, where A1 and A2 are positive real numbers, and A1 < A2. In this document, A1 may be 0.5, 0.6, 0.7, or another empirical value, and A2 may be 290, 300, 310, or other empirical values. The target frame count threshold can be equal to 9, 10, 11, or other empirical values.

[00188] 624: Se a razão entre sinal e ruído segmental modificada não satisfaz a condição de razão entre sinal e ruído pré-ajustada, calcula um parâmetro que representa um grau de estabilidade de uma posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito.[00188] 624: If the modified segmental signal-to-noise ratio does not satisfy the preset signal-to-noise ratio condition, calculate a parameter that represents a degree of stability of a peak position of the signal cross-correlation coefficient of the left channel frequency domain and right channel frequency domain signal.

[00189] Especificamente, se a razão entre sinal e ruído segmental modificada for maior do que ou igual a um primeiro limite e menor do que ou igual a um segundo limite, pode-se considerar que a razão entre sinal e ruído segmental modificada não satisfaz a condição de razão entre sinal e ruído pré-ajustada. Neste caso, o parâmetro que representa o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito é calculado.[00189] Specifically, if the modified segmental signal-to-noise ratio is greater than or equal to a first threshold and less than or equal to a second threshold, the modified segmental signal-to-noise ratio may be considered to not satisfy the preset signal-to-noise ratio condition. In this case, the parameter representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal is calculated.

[00190] Nesta modalidade, o parâmetro que representa o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito pode ser um grupo de parâmetros. O grupo dos parâmetros pode incluir um parâmetro de confiança da amplitude de pico peak_mag_prob e um parâmetro de flutuação da posição de pico peak_pos_fluc do coeficiente de correlação cruzada.[00190] In this embodiment, the parameter representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal can be a group of parameters. The parameter group may include a peak_mag_prob peak amplitude confidence parameter and a cross-correlation coefficient peak_pos_fluc peak position fluctuation parameter.

[00191] Especificamente, peak_mag_prob pode ser calculado da seguinte maneira:[00191] Specifically, peak_mag_prob can be calculated as follows:

[00192] Em primeiro lugar, os valores do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e o sinal do domínio da frequência do canal direito são classificados em ordem descendente ou ascendente de valores da amplitude, e peak_mag_prob é calculado com base em valores classificados do coeficiente de correlação cruzada Xcorr_itd(t) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito ao usar uma fórmula (16): [00192] Firstly, the cross-correlation coefficient values of the left channel frequency domain signal and the right channel frequency domain signal are sorted in descending or ascending order of amplitude values, and peak_mag_prob is calculated with based on sorted values of the cross-correlation coefficient Xcorr_itd(t) of the left channel frequency domain signal and the right channel frequency domain signal when using a formula (16):

[00193] onde X representa um índice de uma posição de pico dos valores classificados do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, e Y representa um índice de uma localização pré-ajustada dos valores classificados do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito. Por exemplo, os valores do coeficiente de correlação cruzada Xcorr_itd(t) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito são classificados em ordem ascendente dos valores da amplitude, uma localização de X é 2*ITD_MAX, e uma localização de Y pode ser 2*ITD_MAX-1. Neste caso, nesta modalidade do presente pedido de patente, uma razão de uma diferença entre um valor da amplitude de um valor de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, e um valor da amplitude de um segundo maior valor do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito e o valor da amplitude do valor de pico é usado como parâmetro de confiança da amplitude de pico, ou seja, prob do peak_mag_, do coeficiente de correlação cruzada. Certamente, esta é meramente uma maneira de selecionar peak_mag_prob.[00193] where -adjusted of the classified values of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal. For example, the cross-correlation coefficient values Xcorr_itd(t) of the left channel frequency domain signal and the right channel frequency domain signal are sorted in ascending order of the amplitude values, a location of ITD_MAX, and a location of Y can be 2*ITD_MAX-1. In this case, in this embodiment of the present patent application, a ratio of a difference between an amplitude value of a peak value of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal , and an amplitude value of a second largest value of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal and the amplitude value of the peak value is used as the confidence parameter of the peak amplitude, i.e. prob of the peak_mag_, of the cross-correlation coefficient. Of course, this is merely a way to select peak_mag_prob.

[00194] Além disso, também pode haver uma pluralidade de maneiras de calcular peak_pos_fluc. Opcionalmente, em algumas modalidades, peak_pos_fluc pode ser obtido através de cálculo com base em um valor de ITD que corresponde a um índice da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito e em um valor de ITD de N quadros anteriores do quadro atual, em que N é um número inteiro maior do que ou igual a 1. Opcionalmente, em algumas modalidades, peak_pos_fluc pode ser obtido através de cálculo com base em um índice da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito e um índice de uma posição de pico de um coeficiente de correlação cruzada de um sinal do domínio da frequência do canal esquerdo e de um sinal do domínio da frequência do canal direito de N quadros anteriores do quadro atual, em que N é um número inteiro maior do que ou igual a 1.[00194] Furthermore, there may also be a plurality of ways to calculate peak_pos_fluc. Optionally, in some embodiments, peak_pos_fluc may be obtained through calculation based on an ITD value that corresponds to an index of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the frequency domain signal. of the right channel and an ITD value of N previous frames of the current frame, where N is an integer greater than or equal to 1. Optionally, in some embodiments, peak_pos_fluc may be obtained through calculation based on an index of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal and an index of a peak position of a cross-correlation coefficient of a frequency domain signal of the left channel and a right channel frequency domain signal from N previous frames of the current frame, where N is an integer greater than or equal to 1.

[00195] Por exemplo, com relação a uma fórmula (17), peak_pos_fluc pode ser um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito e o valor de ITD do quadro anterior do quadro atual: [00195] For example, with respect to a formula (17), peak_pos_fluc may be an absolute value of a difference between the ITD value that corresponds to the peak position index of the cross-correlation coefficient of the channel frequency domain signal left and right channel frequency domain signal and the ITD value of the previous frame of the current frame:

[00196] onde prev_itd representa o valor de ITD do quadro anterior do quadro atual, abs(*) representa uma operação de obtenção do valor absoluto, e argmax representa uma operação de busca de uma localização de um valor máximo.[00196] where prev_itd represents the ITD value of the previous frame of the current frame, abs(*) represents an operation to obtain the absolute value, and argmax represents an operation to search for a location of a maximum value.

[00197] 626 a 628: Determina se o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito satisfaz uma condição pré-ajustada; e se o grau de estabilidade satisfaz a condição pré-ajustada, aumenta uma contagem de quadros alvo.[00197] 626 to 628: Determines whether the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal satisfies a preset condition; and if the degree of stability satisfies the preset condition, a target frame count increases.

[00198] Em outras palavras, quando o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito satisfaz a condição pré-ajustada, uma quantidade de quadros alvo que podem aparecer continuamente é reduzida.[00198] In other words, when the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal satisfies the preset condition, an amount of target frames that may appear continuously is reduced.

[00199] Por exemplo, se peak_mag_prob for maior do que um limite da confiança da amplitude de pico thprob, e se peak_pos_fluc for maior do que um limite da flutuação da posição de pico, a contagem de qua- dros alvo é aumentado. Nesta modalidade do presente pedido de patente, o limite da confiança da amplitude de pico pode ser ajustado em 0,1, 0,2, 0,3, ou um outro valor empírico, e o limite da flutuação da posição de pico pode ser ajustado em 4, 5, 6, ou outros valores empíricos.[00199] For example, if peak_mag_prob is greater than a thprob peak amplitude confidence threshold, and if peak_pos_fluc is greater than a peak position fluctuation threshold, the target frame count is increased. In this embodiment of the present patent application, the peak amplitude confidence limit can be set to 0.1, 0.2, 0.3, or another empirical value, and the peak position fluctuation limit can be adjusted in 4, 5, 6, or other empirical values.

[00200] Deve ser compreendido que pode haver uma pluralidade de umas maneiras de aumentar a contagem de quadros alvo.[00200] It should be understood that there may be a plurality of ways to increase the target frame count.

[00201] Opcionalmente, em algumas modalidades, a contagem de quadros alvo pode ser diretamente aumentada por 1.[00201] Optionally, in some embodiments, the target frame count may be directly increased by 1.

[00202] Opcionalmente, em algumas modalidades, uma quantidade de aumento da contagem de quadros alvo pode ser controlada com base na razão entre sinal e ruído segmental modificada e/ou em um ou mais de um grupo de parâmetros que representam um grau de estabilidade de uma posição de pico de um coeficiente de correlação cruzada entre canais diferentes.[00202] Optionally, in some embodiments, an amount of increase in the target frame count may be controlled based on the modified segmental signal-to-noise ratio and/or one or more of a group of parameters that represent a degree of frame stability. a peak position of a cross-correlation coefficient between different channels.

[00203] Por exemplo, se Ri < mssnr < R2, a contagem de quadros alvo é aumentada por 1; se R2 < mssnr < R3, a contagem de quadros alvo é aumentada por 2; ou se R3 < mssnr < R4, a contagem de quadros alvo é aumentada por 3, onde R1 < R2 < R3 < R4.[00203] For example, if Ri < mssnr < R2, the target frame count is increased by 1; if R2 < mssnr < R3, the target frame count is increased by 2; or if R3 < mssnr < R4, the target frame count is increased by 3, where R1 < R2 < R3 < R4.

[00204] Para um outro exemplo, se U1 < peak_mag_prob < U2 e peak_pos_fluc > thfluc, a contagem de quadros alvo é aumentada por 1; se U2 < peak_mag _ prob < U3 e peak_pos_fluc > thfluc, a contagem de quadros alvo é aumentada por 2; ou se U3 < peak_mag_prob e peak_pos_fluc>thfluc, a contagem de quadros alvo é aumentada por 3. No presente documento, U1 pode ser o limite da confiança da amplitude de pico thprob, e U1 < U2 < U3.[00204] For another example, if U1 < peak_mag_prob < U2 and peak_pos_fluc > thfluc, the target frame count is increased by 1; if U2 < peak_mag _ prob < U3 and peak_pos_fluc > thfluc, the target frame count is increased by 2; or if U3 < peak_mag_prob and peak_pos_fluc>thfluc, the target frame count is increased by 3. In the present document, U1 may be the confidence limit of the thprob peak amplitude, and U1 < U2 < U3.

[00205] 630 a 634: Determina se o quadro atual satisfaz uma condi ção para a reutilização do valor de ITD do quadro anterior do quadro atual, e se o quadro atual satisfaz a condição, usa o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual, e aumenta a contagem de quadros alvo; ou então pula a reutilização do valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual, e executa o processamento em um quadro seguinte.[00205] 630 to 634: Determines whether the current frame satisfies a condition for reusing the previous frame's ITD value from the current frame, and if the current frame satisfies the condition, uses the previous frame's ITD value from the current frame as the ITD value of the current frame, and increases the target frame count; or it skips reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame, and performs the processing on a following frame.

[00206] Deve ser observado nesta modalidade do presente pedido de patente que não é limitado especificamente se o quadro atual satisfaz a condição para a reutilização do valor de ITD do quadro anterior do quadro atual. A condição pode ser ajustada com base em um ou mais de fatores tais como a exatidão do valor de ITD inicial, se a contagem de quadros alvo alcança o limite, e se o quadro atual é um quadro de voz contínuo.[00206] It should be noted in this embodiment of the present patent application that it is not specifically limited to whether the current frame satisfies the condition for reusing the ITD value of the previous frame of the current frame. The condition can be adjusted based on one or more factors such as the accuracy of the initial ITD value, whether the target frame count reaches the threshold, and whether the current frame is a continuous voice frame.

[00207] Por exemplo, se um resultado da detecção da ativação de voz do mésimosubquadro do quadro atual e um resultado da detecção da ativação de voz do quadro anterior indicarem quadros de voz, contanto que o valor de ITD do quadro anterior não seja igual a 0, quando o valor de ITD inicial do quadro atual for igual a 0, o nível de confiança do valor de ITD inicial do quadro atual é baixo (o nível de confiança do valor de ITD inicial pode ser identificado ao usar um valor de itd_cal_flag, por exemplo, se itd_cal_flag não for igual a 1, o nível de confiança do valor de ITD inicial é baixo, e para mais detalhes, consultar as descrições da etapa 612), e a contagem de quadros alvo é menor do que o limite da contagem de quadros alvo, o valor de ITD do quadro anterior do quadro atual pode ser usado como valor de ITD do quadro atual, e a contagem de quadros alvo é aumentada.[00207] For example, if a voice activation detection result of the month subframe of the current frame and a voice activation detection result of the previous frame indicate voice frames, as long as the ITD value of the previous frame is not equal to 0, when the initial ITD value of the current frame is equal to 0, the confidence level of the initial ITD value of the current frame is low (the confidence level of the initial ITD value can be identified by using a value of itd_cal_flag, for example, if itd_cal_flag is not equal to 1, the confidence level of the initial ITD value is low, and for more details, see the descriptions in step 612), and the target frame count is less than the count threshold of target frames, the ITD value of the previous frame of the current frame can be used as the ITD value of the current frame, and the target frame count is increased.

[00208] Além disso, se um resultado da detecção da ativação de voz do quadro atual e um resultado da detecção da ativação de voz de um mésimosubquadro do quadro anterior do quadro atual indicarem quadros de voz, um bit de sinalizador do resultado da detecção da ativação de voz dpre_vad do quadro anterior pode ser atualizado para um sinalizador do quadro de voz, isto é, pre_vad é igual a 1; em caso contrário, um resultado da detecção da ativação de voz pre_vad do quadro anterior é atualizado para um sinalizador do quadro de ruído de fundo, isto é, pre_vad é igual a 0.[00208] Furthermore, if a voice activation detection result of the current frame and a voice activation detection result of a month subframe of the previous frame of the current frame indicate voice frames, a flag bit of the voice activation detection result voice activation dpre_vad from the previous frame can be updated to a flag from the voice frame, that is, pre_vad equals 1; otherwise, a pre_vad voice activation detection result from the previous frame is updated to a flag from the background noise frame, i.e., pre_vad equals 0.

[00209] O acima exposto descreve em detalhes uma maneira de calcular a razão entre sinal e ruído segmental modificada com referência à etapa 604. No entanto, esta modalidade do presente pedido de patente não é limitada a isso. O que segue fornece uma outra implementação da razão entre sinal e ruído segmental modificada.[00209] The foregoing describes in detail a way of calculating the modified segmental signal-to-noise ratio with reference to step 604. However, this embodiment of the present patent application is not limited to this. The following provides another implementation of the modified segmental signal-to-noise ratio.

[00210] Opcionalmente, em algumas modalidades, a razão entre sinal e ruído segmental modificada pode ser calculada da seguinte maneira.[00210] Optionally, in some embodiments, the modified segmental signal-to-noise ratio can be calculated as follows.

[00211] Etapa 1: Calcula um espectro de amplitude médio SPDm-left(k) do sinal do domínio da frequência do canal esquerdo do mésimosubqua- dro e um espectro de amplitude médio SPDmright(k) do sinal do domínio da frequência do canal direito do mésimosubquadro com base no sinal do domínio da frequência do canal esquerdo do mésimosubquadro e no sinal do domínio da frequência do canal direito do mésimosubquadro ao usar as fórmulas (18) e (19): [00211] Step 1: Calculates an SPDm-left(k) average amplitude spectrum of the left channel frequency domain signal of the month subframe and an SPDmright(k) average amplitude spectrum of the right channel frequency domain signal of the month subframe based on the left channel frequency domain signal of the month subframe and the right channel frequency domain signal of the month subframe when using formulas (18) and (19):

[00212] onde k = 1, ... L/2-1, e L é um comprimento da transformação rápida de Fourier, por exemplo, L pode ser 400 ou 800.[00212] where k = 1, ... L/2-1, and L is a length of the fast Fourier transform, for example, L can be 400 or 800.

[00213] Etapa 2: Calcula os espectros médios da amplitude SPDleft(k) e SPDright(k) de um sinal do domínio da frequência do canal esquerdo e de um sinal do domínio da frequência do canal direito do quadro atual com base em SPDleft(k) e SPDright(k) ao usar as fórmulas (20) e (21): Alternativamente, as fórmulas podem ser: [00213] Step 2: Calculates the average amplitude spectra SPDleft(k) and SPDright(k) of a left channel frequency domain signal and a right channel frequency domain signal of the current frame based on SPDleft( k) and SPDright(k) when using formulas (20) and (21): Alternatively, the formulas could be:

[00214] onde SUBFR_NUM representa uma quantidade de subqua- dros incluídos em um quadro de áudio.[00214] where SUBFR_NUM represents a number of subframes included in an audio frame.

[00215] Etapa 3: Calcula um espectro de amplitude médio do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito do quadro atual com base em SPDleft(k) e SPDright(k) ao usar uma fórmula (22): [00215] Step 3: Calculates an average amplitude spectrum of the left channel frequency domain signal and the right channel frequency domain signal of the current frame based on SPDleft(k) and SPDright(k) when using a formula (22):

[00216] onde A é um fator da razão de mistura do espectro da amplitude do canal esquerdo/direito pré-ajustado, e A pode ser 0,4, 0,5, 0,6, ou um outro valor empírico.[00216] where A is a mixing ratio factor of the preset left/right channel amplitude spectrum, and A may be 0.4, 0.5, 0.6, or another empirical value.

[00217] Etapa 4: Calcula a energia de sub-banda E_band (i) com base em SPD(k) ao usar uma fórmula (23), onde i = 0, 1, ..., BAND_NUM-1, e BAND_NUM representa uma quantidade de sub-bandas: [00217] Step 4: Calculate the subband energy E_band (i) based on SPD(k) when using a formula (23), where i = 0, 1, ..., BAND_NUM-1, and BAND_NUM represents a number of sub-bands:

[00218] onde band_rb representa uma tabela pré-ajustada usada para a divisão de sub-banda, band_tb [i] representa um lote de frequência de limite inferior de uma iésimasub-banda, e band_tb [i + 1]-1representa um lote de frequência de limite superior da iésimasub-banda.[00218] where band_rb represents a preset table used for sub-band division, band_tb [i] represents a lower limit frequency batch of an ith sub-band, and band_tb [i + 1]-1 represents a batch of upper limit frequency of the ith sub-band.

[00219] Etapa 5: Calcula a razão entre sinal e ruído segmental modificada mssnr com base em E_band(i) e uma estimativa da energia de ruído de sub-banda E_band_n (i). Especificamente, mssnr pode ser calculada ao usar a implementação descrita na fórmula (7) e na fórmula (8). Os detalhes não são descritos no presente documento outra vez.[00219] Step 5: Calculate the modified segmental signal-to-noise ratio mssnr based on E_band(i) and an estimate of the sub-band noise energy E_band_n (i). Specifically, mssnr can be calculated using the implementation described in formula (7) and formula (8). Details are not described in this document again.

[00220] Etapa 6: Atualiza E_band_n (i) com base em E_band (i). Es- pecificamente, E_band_n (i) pode ser atualizado ao usar a implementação descrita na fórmula (9) à fórmula (11). Os detalhes não são descritos no presente documento outra vez.[00220] Step 6: Update E_band_n (i) based on E_band (i). Specifically, E_band_n (i) can be updated when using the implementation described in formula (9) to formula (11). Details are not described in this document again.

[00221] Opcionalmente, em algumas outras modalidades, a razão entre sinal e ruído segmental modificada pode ser calculada da maneira abaixo.[00221] Optionally, in some other embodiments, the modified segmental signal-to-noise ratio can be calculated in the manner below.

[00222] Etapa 1: Calcula um espectro de amplitude médio SPDleft(k) do sinal do domínio da frequência do canal esquerdo do mésimosubqua- dro e um espectro de amplitude médio SPD (k) do sinal do domínio da frequência do canal direito do mésimosubquadro com base no sinal do domínio da frequência do canal esquerdo X (k) do mésimosubqua- dro e no sinal do domínio da frequência do canal direito X (k) do mésimosubquadro ao usar as fórmulas (24) e (25): [00222] Step 1: Calculate an average amplitude spectrum SPDleft(k) of the left channel frequency domain signal of the month subframe and an average amplitude spectrum SPD (k) of the right channel frequency domain signal of the month subframe based on the left channel frequency domain signal X (k) of the month subframe and the right channel frequency domain signal

[00223] onde k = 1, ..., L/2-1, e L é um comprimento da transformação rápida de Fourier, por exemplo, L pode ser 400 ou 800.[00223] where k = 1, ..., L/2-1, and L is a length of the fast Fourier transform, for example, L can be 400 or 800.

[00224] Etapa 2: Calcula um espectro de amplitude médio SPDm(k) do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito do mésimosubquadro com base em SPDm-left(k) e SPDm,right(k) ao usar uma fórmula (26): [00224] Step 2: Calculate an average amplitude spectrum SPDm(k) of the left channel frequency domain signal and the right channel frequency domain signal of the month subframe based on SPDm-left(k) and SPDm,right (k) when using a formula (26):

[00225] onde A é um fator da razão de mistura do espectro da amplitude de canal esquerdo/direito, e A pode ser 0,4, 0,5, 0,6, ou um outro valor empírico.[00225] where A is a factor of the mixing ratio of the left/right channel amplitude spectrum, and A may be 0.4, 0.5, 0.6, or another empirical value.

[00226] Etapa 3: Calcula um espectro de amplitude médio SPD(k) de um sinal do domínio da frequência do canal esquerdo e de um sinal do domínio da frequência do canal direito do quadro atual com base em SPDm(k) ao usar uma fórmula (27).[00226] Step 3: Calculates an average amplitude spectrum SPD(k) of a left channel frequency domain signal and a right channel frequency domain signal of the current frame based on SPDm(k) when using a formula (27).

[00227] Uma maneira opcional de cálculo é tal como segue: [00227] An optional way of calculation is as follows:

[00228] Uma outra maneira opcional de cálculo é tal como segue: [00228] Another optional way of calculation is as follows:

[00229] Etapa 4: Calcula a energia de sub-banda E_band (i) com base em SPD(k) ao usar uma fórmula (28), onde i = 0, 1, .., BAND_NUM- 1, e BAND_NUMé uma quantidade de sub-bandas: [00229] Step 4: Calculate the subband energy E_band (i) based on SPD(k) when using a formula (28), where i = 0, 1, .., BAND_NUM- 1, and BAND_NUM is a quantity of sub-bands:

[00230] onde band_rb representa uma tabela pré-ajustada usada para a divisão de sub-banda, band_tb [i] representa um lote de frequência de limite inferior de uma iésimasub-banda, e band_tb [i + 1]-1representa um lote de frequência de limite superior da iésimasub-banda.[00230] where band_rb represents a preset table used for sub-band division, band_tb [i] represents a lower limit frequency batch of an ith sub-band, and band_tb [i + 1]-1 represents a batch of upper limit frequency of the ith sub-band.

[00231] Etapa 5: Calcula a razão entre sinal e ruído segmental modificada mssnr com base em E_bandm(i) e uma estimativa da energia de ruído de sub-banda E_band(i). Especificamente, mssnr pode ser calculada ao usar a implementação descrita na fórmula (7) e na fórmula (8). Os detalhes não são descritos no presente documento outra vez.[00231] Step 5: Calculate the modified segmental signal-to-noise ratio mssnr based on E_bandm(i) and an estimate of the sub-band noise energy E_band(i). Specifically, mssnr can be calculated using the implementation described in formula (7) and formula (8). Details are not described in this document again.

[00232] Etapa 6: Atualiza E_band_n (i) com base em E_band (i). Es-pecificamente, pode ser atualizado ao usar a implementação descrita na fórmula (9) à fórmula (11). Os detalhes não são descritos no presente documento outra vez.[00232] Step 6: Update E_band_n (i) based on E_band (i). Specifically, it can be updated by using the implementation described in formula (9) to formula (11). Details are not described in this document again.

[00233] Opcionalmente, em algumas outras modalidades, a razão entre sinal e ruído segmental modificada pode ser calculada da maneira abaixo.[00233] Optionally, in some other embodiments, the modified segmental signal-to-noise ratio can be calculated in the manner below.

[00234] Etapa 1: Calcula um espectro de amplitude médio SPDm(k) do sinal de domínio da frequência do canal esquerdo e do sinal de domínio da frequência do canal direito do mésimosubquadro com base no sinal de domínio da frequência do canal esquerdo Xm,left(k) do mésimo subquadro e no sinal de domínio da frequência do canal direito Xm,right(k) do mésimosubquadro ao usar uma fórmula (29): Onde [00234] Step 1: Calculates an average amplitude spectrum SPDm(k) of the left channel frequency domain signal and the right channel frequency domain signal of the month subframe based on the left channel frequency domain signal Xm, left(k) of the mth subframe and in the right channel frequency domain signal Xm,right(k) of the mth subframe when using a formula (29): Where

[00235] onde k = 1, ..., L/2-1; L é um comprimento da transformação rápida de Fourier, por exemplo, L pode ser 400 ou 800; e A é um fator da razão de mistura do espectro da amplitude do canal esquerdo/direito, e A pode ser 0,4, 0,5, 0,6, ou um outro valor empírico.[00235] where k = 1, ..., L/2-1; L is a length of the fast Fourier transform, for example, L can be 400 or 800; and A is a factor of the left/right channel amplitude spectrum mixing ratio, and A may be 0.4, 0.5, 0.6, or another empirical value.

[00236] Etapa 2: Calcula a energia da sub-banda E_bandm(i) do mé- simo subquadro com base em SPDm(k) ao usar uma fórmula (30), onde i = 0, 1, ..., BAND_NUM-1 e BAND_NUMé uma quantidade de sub-ban- das: [00236] Step 2: Calculates the energy of the sub-band E_bandm(i) of the th sub-frame based on SPDm(k) when using a formula (30), where i = 0, 1, ..., BAND_NUM- 1 and BAND_NUM is a number of sub-bands:

[00237] onde band_rb representa uma tabela pré-ajustada usada para a divisão de sub-banda, band_tb [1] representa um lote de frequência de limite inferior de uma iésimasub-banda, e band_tb [i + 1]-1representa um lote de frequência de limite superior da iésimasub-banda.[00237] where band_rb represents a preset table used for subband division, band_tb [1] represents a lower limit frequency batch of an ith subband, and band_tb [i + 1]-1 represents a batch of upper limit frequency of the ith sub-band.

[00238] Etapa 3: Calcula a energia de sub-banda E_band(i) do quadro atual com base na energia de sub-banda E_bandm(i) do mésimo subquadro ao usar uma fórmula (31): [00238] Step 3: Calculates the subband energy E_band(i) of the current frame based on the subband energy E_bandm(i) of the mth subframe when using a formula (31):

[00239] Alternativamente, a fórmula pode ser: [00239] Alternatively, the formula may be:

[00240] Etapa 4: Calcula a razão entre sinal e ruído segmental modificada mssnr com base em E_band(i) e uma estimativa da energia de ruído de sub-banda E_band_n(i). Especificamente, mssnr pode ser calculada ao usar a implementação descrita na fórmula (7) e na fórmula (8). Os detalhes não são descritos no presente documento outra vez.[00240] Step 4: Calculate the modified segmental signal-to-noise ratio mssnr based on E_band(i) and an estimate of the sub-band noise energy E_band_n(i). Specifically, mssnr can be calculated using the implementation described in formula (7) and formula (8). Details are not described in this document again.

[00241] Etapa 5: Atualiza E_band_n (i) com base em E_band (i). Es-pecificamente,E_band_n(i) pode ser atualizado ao usar a implementação descrita na fórmula (9) à fórmula (11). Os detalhes não são descritos no presente documento outra vez.[00241] Step 5: Update E_band_n (i) based on E_band (i). Specifically, E_band_n(i) can be updated when using the implementation described in formula (9) to formula (11). Details are not described in this document again.

[00242] O acima exposto descreve em detalhes uma implementação da detecção da ativação de voz com referência à etapa 605. No entanto, esta modalidade do presente pedido de patente não é limitada a isso. O que segue fornece uma outra implementação da detecção da ativação de voz.[00242] The foregoing describes in detail an implementation of voice activation detection with reference to step 605. However, this embodiment of the present patent application is not limited to this. The following provides another implementation of voice activation detection.

[00243] Especificamente, se a razão entre sinal e ruído segmental modificada for maior do que um limite da detecção da ativação de voz thVAD, o subquadro atual é um quadro de voz, e um sinalizador da detecção da ativação de voz vad_flag do quadro atual é ajustado em 1; em caso contrário, o quadro atual é um quadro de ruído de fundo, e um sinalizador da detecção da ativação de voz vad_flag do quadro atual é ajustado em 0. O limite de detecção da ativação de voz é geralmente um valor empírico, e no presente documento pode ser 3.500, 4.000, 4.500, ou um outro ainda.[00243] Specifically, if the modified segmental signal-to-noise ratio is greater than a voice activation detection threshold thVAD, the current subframe is a voice frame, and a voice activation detection flag vad_flag of the current frame is set to 1; otherwise, the current frame is a background noise frame, and a voice activation detection flag vad_flag of the current frame is set to 0. The voice activation detection threshold is generally an empirical value, and at present document can be 3,500, 4,000, 4,500, or something else.

[00244] De maneira correspondente, a implementação das etapas 630 a 634 pode ser modificada para a implementação a seguir:[00244] Correspondingly, the implementation of steps 630 to 634 can be modified to the following implementation:

[00245] Quando um resultado da detecção da ativação de voz do quadro atual e um resultado da detecção da ativação de voz pre_vad do quadro anterior indicam quadros de voz, se o valor de ITD do quadro anterior não for igual a 0, o valor de ITD inicial do quadro atual é igual a 0, o nível de confiança do valor de ITD inicial do quadro atual é baixo (o nível de confiança do valor de ITD inicial pode ser identificado ao usar um valor de itd_cal_flag, por exemplo, se itd_cal_flag não for igual a 1, o nível de confiança do valor de ITD inicial é baixo e, para mais detalhes, consultar as descrições da etapa 612), e a contagem de quadros alvo é menor do que o limite da contagem de quadros alvo, o valor de ITD do quadro anterior é usado como valor de ITD do quadro atual, e a contagem de quadros alvo é aumentada.[00245] When a voice activation detection result of the current frame and a pre_vad voice activation detection result of the previous frame indicate voice frames, if the ITD value of the previous frame is not equal to 0, the value of starting ITD of the current frame is equal to 0, the confidence level of the starting ITD value of the current frame is low (the confidence level of the starting ITD value can be identified by using a value of itd_cal_flag, for example, if itd_cal_flag is not is equal to 1, the confidence level of the initial ITD value is low, and for more details, see the descriptions of step 612), and the target frame count is less than the target frame count threshold, the value of the previous frame is used as the ITD value of the current frame, and the target frame count is increased.

[00246] Se um resultado da detecção da ativação de voz do quadro atual indicar um quadro da voz, um resultado da detecção da ativação de voz pre_vad do quadro anterior é atualizado para um sinalizador do quadro de voz, isto é, pre_vad é igual a 1; e caso contrário, um resultado da detecção da ativação de voz pre_vad do quadro anterior é atualizado em um sinalizador do quadro do ruído de fundo, isto é, pre_vad é igual a 0.[00246] If a voice activation detection result of the current frame indicates a voice frame, a pre_vad voice activation detection result of the previous frame is updated to a voice frame flag, that is, pre_vad equals 1; and otherwise, a pre_vad voice activation detection result from the previous frame is updated into a flag from the background noise frame, i.e., pre_vad equals 0.

[00247] Com referência às etapas 626 a 628, o acima exposto descreve em detalhes uma maneira de ajustar ou controlar a quantidade de quadros alvo que podem aparecer continuamente. No entanto, esta modalidade do presente pedido de patente não é limitada a isso. O que segue fornece uma outra maneira de ajustar ou controlar a quantidade de quadros alvo que podem aparecer continuamente.[00247] With reference to steps 626 to 628, the above describes in detail a way to adjust or control the amount of target frames that can appear continuously. However, this embodiment of the present patent application is not limited to this. The following provides another way to adjust or control the number of target frames that can appear continuously.

[00248] Opcionalmente, em algumas modalidades, em primeiro lugar, é determinado se o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito satisfaz uma condição pré-ajustada; e se o grau de estabilidade satisfaz uma condição pré-ajustada, o limite de contagem de quadros alvo é diminuído. Em outras palavras, nesta modalidade do presente pedido de patente, a quantidade de quadros alvo que podem aparecer continuamenteé reduzida mediante a diminuição do limite da contagem de quadros alvo.[00248] Optionally, in some embodiments, first, it is determined whether the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal satisfies a preset condition; and if the degree of stability satisfies a preset condition, the target frame count threshold is decreased. In other words, in this embodiment of the present patent application, the number of target frames that can appear continuously is reduced by decreasing the target frame count limit.

[00249] Deve ser observado que pode haver uma pluralidade de maneiras de determinar se o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito satisfaz uma condição pré-ajustada. Isto não é limitado especificamente nesta modalidade do presente pedido de patente. Por exemplo, uma condição pré-ajustada pode ser: O parâmetro de confiança da amplitude de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito é maior do que um limite de confiança da amplitude de pico pré-ajustado, e o parâmetro de flutuação da posição de pico é maior do que limite de flutuação da posição de pico pré-ajustado, em que o limite de confiança da amplitude de pico pode ser 0,1, 0,2, 0,3, ou um outro valor empírico, e o limite da flutuação da posição de pico pode ser 4, 5, 6, ou outros valores empíricos.[00249] It should be noted that there may be a plurality of ways to determine whether the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal satisfies a preset condition. This is not specifically limited to this embodiment of the present patent application. For example, a preset condition might be: The confidence parameter of the peak amplitude of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal is greater than a threshold of confidence of the preset peak amplitude, and the peak position fluctuation parameter is greater than the preset peak position fluctuation limit, in which the confidence limit of the peak amplitude can be 0.1, 0 ,2, 0.3, or another empirical value, and the peak position fluctuation limit can be 4, 5, 6, or other empirical values.

[00250] Deve ser observado que pode haver uma pluralidade de maneiras de diminuir o limite da contagem de quadros alvo. Isto não é limitado especificamente nesta modalidade do presente pedido de patente.[00250] It should be noted that there may be a plurality of ways to lower the target frame count limit. This is not specifically limited to this embodiment of the present patent application.

[00251] Opcionalmente, em algumas modalidades, o limite da contagem de quadros alvo pode ser diretamente diminuído por 1.[00251] Optionally, in some embodiments, the target frame count limit can be directly decreased by 1.

[00252] Opcionalmente, em algumas outras modalidades, uma quantidade da diminuição do limite da contagem de quadros alvo pode ser controlada com base na razão entre sinal e ruído segmental modificada e em um ou em mais do grupo de parâmetros que representam o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito.[00252] Optionally, in some other embodiments, an amount of decrease in the target frame count threshold may be controlled based on the modified segmental signal-to-noise ratio and one or more of the group of parameters representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal.

[00253] Por exemplo, se Ri < mssnr < R2, o limite da contagem de quadros alvo puder ser diminuído por 1; se R2 < mssnr < R3, o limite da contagem de quadros alvo puder ser diminuído por 2; ou se R3 < mssnr < R4, o limite da contagem de quadros alvo pode ser diminuído por 3, onde R1, R2, R3 e R4 satisfazem R1 < R2 < R3 < R4.[00253] For example, if Ri < mssnr < R2, the target frame count limit can be decreased by 1; if R2 < mssnr < R3, the target frame count limit can be decreased by 2; or if R3 < mssnr < R4, the target frame count threshold can be decreased by 3, where R1, R2, R3, and R4 satisfy R1 < R2 < R3 < R4.

[00254] Para um outro exemplo, se U1 < peak_ mag_prob < U2 e peak_pos_fluc > thfluc, o limite da contagem de quadros alvo pode ser diminuído por 1; se U2 < peak_mag_prob < U3 e peak_pos_fluc > thfluc, o limite da contagem de quadros alvo pode ser diminuídos por 2; ou se U3 = peak_mag_prob e peak_pos_fluc > thfluc, o limite da contagem de quadros alvo pode ser diminuído por 3, em que U1, U2 e U3 podem satisfazer U1 < U2 < U3, e U1 pode ser o limite de confiança da amplitude de pico thprob descrito acima.[00254] For another example, if U1 < peak_ mag_prob < U2 and peak_pos_fluc > thfluc, the target frame count limit can be decreased by 1; if U2 < peak_mag_prob < U3 and peak_pos_fluc > thfluc, the target frame count limit can be decreased by 2; or if U3 = peak_mag_prob and peak_pos_fluc > thfluc, the target frame count limit can be decreased by 3, where U1, U2 and U3 can satisfy U1 < U2 < U3, and U1 can be the confidence limit of the peak amplitude thprob described above.

[00255] Com referência à etapa 624, o acima exposto descreve em detalhes uma maneira de calcular o parâmetro que representa o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito. Na etapa 624, o parâmetro que representa o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito inclui principalmente dois parâmetros: o parâmetro de confiança da amplitude de pico peak_mag_prob e o parâmetro de flutuação da posição de pico peak_pos_fluc. No entanto, esta modalidade do presente pedido de patentenão é limitada a isso.[00255] With reference to step 624, the above describes in detail a way of calculating the parameter representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the left channel frequency domain signal. of the right channel frequency. In step 624, the parameter representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal mainly includes two parameters: the confidence parameter of the peak amplitude peak_mag_prob and the peak position fluctuation parameter peak_pos_fluc. However, this embodiment of the present patent application is not limited to this.

[00256] Opcionalmente, em algumas modalidades, o parâmetro que representa o grau de estabilidade da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito pode incluir somente peak_pos_fluc. De modo correspondente, a etapa 626 pode ser modificada: Se peak_pos_fluc for maior do que o limite da flutuação da posição de pico thfluc, aumenta a contagem de quadros alvo.[00256] Optionally, in some embodiments, the parameter representing the degree of stability of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal may include only peak_pos_fluc. Correspondingly, step 626 may be modified: If peak_pos_fluc is greater than the peak position fluctuation threshold thfluc, increase the target frame count.

[00257] Opcionalmente, em algumas outras modalidades, um parâmetro que representa um grau de estabilidade de uma posição de pico de um coeficiente de correlação cruzada entre canais diferentes pode ser um parâmetro da estabilidade da posição de pico peak_stable obtido depois que uma operação linear e/ou não linear é executada em peak_mag_prob e peak_pos_fluc.[00257] Optionally, in some other embodiments, a parameter representing a degree of stability of a peak position of a cross-correlation coefficient between different channels may be a parameter of the stability of the peak_stable peak position obtained after a linear operation and /or non-linear is performed in peak_mag_prob and peak_pos_fluc.

[00258] Por exemplo, uma razão entre peak_stable, peak_mag_prob e peak_pos_fluc pode ser representada ao usar a fórmula (32): peak_stable = peak_mag_prob/(peak_pos_fluc)p (32)[00258] For example, a ratio between peak_stable, peak_mag_prob and peak_pos_fluc can be represented using formula (32): peak_stable = peak_mag_prob/(peak_pos_fluc)p (32)

[00259] Para um outro exemplo, uma relação entre peak_stable, peak_mag_prob e peak_pos_fluc pode ser representada ao usar uma fórmula (33): peak_stable=diff_factor [peak_pos_fluc]*peak_mag_prob (33)[00259] For another example, a relationship between peak_stable, peak_mag_prob and peak_pos_fluc can be represented by using a formula (33): peak_stable=diff_factor [peak_pos_fluc]*peak_mag_prob (33)

[00260] onde diff_factor representa uma sequência de fator da diferença pré-ajustada de valores de ITD de quadros adjacentes; diff_factor pode incluir fatores da diferença que são de valores de ITD de quadros adjacentes e que correspondem a todos os valores possíveis de peak_pos_fluc; diff_factor pode ser ajustado com base na experiência, ou pode ser obtido através de treinamento com base em dados de massa; e P pode representar um exponente de impacto da flutuação da posição de pico do coeficiente de correlação cruzada do sinal do domínio da frequência do canal esquerdo e do sinal do domínio da frequência do canal direito, e P pode ser um número inteiro positivo maior do que ou igual a 1, por exemplo, P pode ser 1, 2, 3, ou outros valores empíricos.[00260] where diff_factor represents a factor sequence of the preset difference of ITD values of adjacent frames; diff_factor may include difference factors that are from ITD values of adjacent frames and that correspond to all possible values of peak_pos_fluc; diff_factor can be adjusted based on experience, or can be obtained through training based on mass data; and P may represent an impact exponent of the fluctuation of the peak position of the cross-correlation coefficient of the left channel frequency domain signal and the right channel frequency domain signal, and P may be a positive integer greater than or equal to 1, for example, P can be 1, 2, 3, or other empirical values.

[00261] De maneira correspondente, a etapa 626 pode ser modificada: Se peak_stable for maior do que um limite da estabilidade da posição de pico pré-ajustado, aumenta a contagem de quadros alvo. No presente documento, o limite da estabilidade da posição de pico pré- ajustado pode ser um número real positivo maior do que ou igual a 0, ou pode ser um outro valor empírico.[00261] Correspondingly, step 626 can be modified: If peak_stable is greater than a preset peak position stability threshold, increase the target frame count. In this document, the preset peak position stability limit may be a positive real number greater than or equal to 0, or may be another empirical value.

[00262] Além disso, em algumas modalidades, o processamento de atenuação pode ser executado em peak_stable, para obter um parâmetro da estabilidade da posição de pico atenuado lt_peak_stable, e a determinação subsequente é executada com base em lt_peak_stable.[00262] Additionally, in some embodiments, attenuation processing may be performed in peak_stable, to obtain a stability parameter of the attenuated peak position lt_peak_stable, and subsequent determination is performed based on lt_peak_stable.

[00263] Especificamente, lt_peak_stable pode ser calculado ao usar a fórmula (34): lt_peak_stable = (1-alpha)*lt_peak_stable+alpha*peak_stable (34)[00263] Specifically, lt_peak_stable can be calculated by using formula (34): lt_peak_stable = (1-alpha)*lt_peak_stable+alpha*peak_stable (34)

[00264] onde alfa representa um fator de atenuação de longa duração, e pode ser geralmente um número real positivo maior do que ou igual a 0 e menor do que ou igual a 1, por exemplo, alfa pode ser 0,4, 0,5, 0,6, ou um outro valor empírico.[00264] where alpha represents a long-term attenuation factor, and may generally be a positive real number greater than or equal to 0 and less than or equal to 1, for example, alpha may be 0.4, 0, 5, 0.6, or another empirical value.

[00265] De maneira correspondente, a etapa 626 pode ser modificada: Se lt_peak_stable for maior do que um limite da estabilidade da posição de pico pré-ajustado, aumenta a contagem de quadros alvo. No presente documento, o limite da estabilidade da posição de pico pré- ajustado pode ser um número real positivo maior do que ou igual a 0, ou pode ser um outro valor empírico.[00265] Correspondingly, step 626 can be modified: If lt_peak_stable is greater than a preset peak position stability threshold, increase the target frame count. In this document, the preset peak position stability limit may be a positive real number greater than or equal to 0, or may be another empirical value.

[00266] O que segue descreve modalidades do aparelho do presente pedido de patente. As modalidades do aparelho podem ser usadas para executar os métodos acima. Portanto, para uma parte não descrita em detalhes, consultar as modalidades do método acima.[00266] The following describes embodiments of the apparatus of the present patent application. Embodiments of the apparatus may be used to perform the above methods. Therefore, for a part not described in detail, see the method embodiments above.

[00267] A FIGURA 7 é um diagrama de blocos esquemático de um codificador de acordo com uma modalidade do presente pedido de patente. O codificador 700 na FIGURA 7 inclui:[00267] FIGURE 7 is a schematic block diagram of an encoder in accordance with an embodiment of the present patent application. Encoder 700 in FIGURE 7 includes:

[00268] uma unidade de obtenção 710, configurada para obter um sinal de múltiplos canais de um quadro atual;[00268] an acquisition unit 710 configured to obtain a multi-channel signal from a current frame;

[00269] uma primeira unidade de determinação 720, configurada para determinar um valor de ITD inicial do quadro atual;[00269] a first determination unit 720, configured to determine an initial ITD value of the current frame;

[00270] uma unidade de controle 730, configurada para controlar, com base nas informações de características do sinal de múltiplos ca- nais, uma quantidade de quadros alvo que podem aparecer continuamente, em que as informações de características incluem pelo menos um dentre um parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e uma característica de pico de coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro alvo reutilizado como um valor de ITD do quadro alvo;[00270] a control unit 730, configured to control, based on the characteristic information of the multi-channel signal, a number of target frames that can appear continuously, wherein the characteristic information includes at least one of a parameter of the signal-to-noise ratio of the multi-channel signal and a peak characteristic of cross-correlation coefficients of the multi-channel signal, and an ITD value of a previous frame of the target frame reused as an ITD value of the target frame;

[00271] uma segunda unidade de determinação 740, configurada para determinar um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que podem aparecer continuamente; e[00271] a second determination unit 740, configured to determine an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that can appear continuously; It is

[00272] uma unidade de codificação 750, configurada para codificar o sinal de múltiplos canais com base no valor de ITD do quadro atual.[00272] an encoding unit 750, configured to encode the multi-channel signal based on the ITD value of the current frame.

[00273] De acordo com esta modalidade do presente pedido de patente, o impacto de fatores ambientais, tais como o ruído de fundo, a reverberação e o vozerio de múltiplas pessoas, na exatidão e na estabilidade de um resultado do cálculo de um valor de ITD pode ser reduzido; e quando houver um ruído de fundo, uma reverberação, ou um vozerio de múltiplas pessoas, ou uma característica de harmônica do sinal não for aparente, a estabilidade de um valor de ITD na codificação PS é melhorada, e as transições desnecessárias do valor de ITD são reduzidas até a maior extensão, desse modo evitando a descontinui- dade inter-quadros de um sinal misturado com redução e a instabilidade de uma imagem acústica de um sinal decodificado. Além disso, de acordo com esta modalidade do presente pedido de patente, a informação da fase de um sinal estereofônico pode ser mais bem retida, e a qualidade acústica é melhorada.[00273] According to this embodiment of the present patent application, the impact of environmental factors, such as background noise, reverberation and the noise of multiple people, on the accuracy and stability of a result of calculating a value of ITD can be reduced; and when there is background noise, reverberation, or loud noise from multiple people, or a harmonic characteristic of the signal is not apparent, the stability of an ITD value in PS encoding is improved, and unnecessary transitions of the ITD value are reduced to the greatest extent, thereby avoiding the inter-frame discontinuity of a signal mixed with reduction and the instability of an acoustic image of a decoded signal. Furthermore, according to this embodiment of the present patent application, the phase information of a stereophonic signal can be better retained, and the acoustic quality is improved.

[00274] Opcionalmente, em algumas modalidades, o codificador 700 também inclui: uma terceira unidade de determinação, configurada para determinar a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[00274] Optionally, in some embodiments, the encoder 700 also includes: a third determination unit, configured to determine the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the cross-correlation coefficients. cross-correlation of the multi-channel signal and in an index of a peak position of the cross-correlation coefficients of the multi-channel signal.

[00275] Opcionalmente, em algumas modalidades, a terceira unidade de determinação é configurada especificamente para: determinar um parâmetro de confiança da amplitude de pico com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, em que o parâmetro de confiança da amplitude de pico representa um nível de confiança da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais; determinar um parâmetro de flutuação da posição de pico com base em um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro atual, em que o parâmetro de flutuação da posição de pico representa uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual; e determinar a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base no parâmetro de confiança da amplitude de pico e no parâmetro de flutuação da posição de pico.[00275] Optionally, in some embodiments, the third determination unit is specifically configured to: determine a peak amplitude confidence parameter based on the peak value amplitude of the cross-correlation coefficients of the multi-channel signal, wherein the peak amplitude confidence parameter represents a confidence level of the amplitude of the peak value of the cross-correlation coefficients of the multi-channel signal; determine a peak position fluctuation parameter based on an ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal, and an ITD value from a previous frame of the current frame, where the peak position fluctuation parameter represents a difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the multi-channel signal and the ITD value of the previous frame of the current frame; and determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the peak amplitude confidence parameter and the peak position fluctuation parameter.

[00276] Opcionalmente, em algumas modalidades, a terceira unidade de determinação é configurada especificamente para determinar, como parâmetro de confiança da amplitude de pico, uma razão de uma diferença entre um valor da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e um valor da amplitude de um segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico.[00276] Optionally, in some embodiments, the third determination unit is specifically configured to determine, as a peak amplitude confidence parameter, a ratio of a difference between an amplitude value of the peak value of the signal cross-correlation coefficients of multiple channels and an amplitude value of a second largest value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the peak value.

[00277] Opcionalmente, em algumas modalidades, a terceira unidade de determinação é configurada especificamente para determinar, como parâmetro de flutuação da posição de pico, um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual.[00277] Optionally, in some embodiments, the third determination unit is specifically configured to determine, as a peak position fluctuation parameter, an absolute value of a difference between the ITD value that corresponds to the peak position index of the coefficients cross-correlation of the multi-channel signal and the ITD value of the previous frame of the current frame.

[00278] Opcionalmente, em algumas modalidades, a unidade de controle 730 é configurada especificamente para: controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; e quando a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz uma condição pré-ajustada, reduzir, mediante o ajuste de pelo menos um de uma contagem de quadros alvo e um limite da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente, em que a contagem de quadros alvo é usada para representar uma quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00278] Optionally, in some embodiments, the control unit 730 is specifically configured to: control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously; and when the peak characteristic of the cross-correlation coefficients of the multi-channel signal satisfies a preset condition, reducing, by adjusting at least one of a target frame count and a threshold of the target frame count, the amount of target frames that can appear continuously, wherein the target frame count is used to represent a quantity of target frames that currently appear continuously, and the target frame count threshold is used to indicate the quantity of target frames that can appear continuously.

[00279] Opcionalmente, em algumas modalidades, a unidade de controle 730 é configurada especificamente para reduzir, mediante o aumento da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente.[00279] Optionally, in some embodiments, the control unit 730 is specifically configured to reduce, by increasing the target frame count, the number of target frames that can appear continuously.

[00280] Opcionalmente, em algumas modalidades, a unidade de controle 730 é configurada especificamente para reduzir, mediante a diminuição do limite da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente.[00280] Optionally, in some embodiments, the control unit 730 is specifically configured to reduce, by decreasing the target frame count limit, the number of target frames that can appear continuously.

[00281] Opcionalmente, em algumas modalidades, a unidade de controle 730 é configurada especificamente para: quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz uma condição da razão entre sinal e ruído pré-ajustada, controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; e o codificador 700 também inclui: uma unidade de parada, configurada para: quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição sinal e ruído da relação, parar de reutilizar o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00281] Optionally, in some embodiments, the control unit 730 is specifically configured to: When the signal-to-noise ratio parameter of the multi-channel signal does not satisfy a preset signal-to-noise ratio condition, control, with based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously; and the encoder 700 also includes: a stop unit, configured to: when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stop reusing the ITD value of the previous frame of the current frame as ITD value of the current frame.

[00282] Opcionalmente, em algumas modalidades, a unidade de controle 730 é configurada especificamente para: determinar se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição da razão entre sinal e ruído pré-ajustada; e quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz a condição da razão entre sinal e ruído, controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; ou quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, parar de reutilizar o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00282] Optionally, in some embodiments, the control unit 730 is specifically configured to: determine whether the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset signal-to-noise ratio condition; and when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy the signal-to-noise ratio condition, controlling, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames which may appear continuously; or when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[00283] Opcionalmente, em algumas modalidades, a unidade de parada é configurada especificamente para aumentar a contagem de quadros alvo, de modo que um valor da contagem de quadros alvo seja maior do que ou igual ao limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00283] Optionally, in some embodiments, the stop unit is configured specifically to increase the target frame count such that a target frame count value is greater than or equal to the target frame count threshold, wherein the target frame count is used to represent the amount of target frames that currently appear continuously, and the target frame count threshold is used to indicate the amount of target frames that can appear continuously.

[00284] Opcionalmente, em algumas modalidades, a segunda unidade de determinação 740 é configurada especificamente para determinar o valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual, a contagem de quadros alvo, e o limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00284] Optionally, in some embodiments, the second determination unit 740 is configured specifically to determine the ITD value of the current frame based on the starting ITD value of the current frame, the target frame count, and the frame count threshold. target frames, where the target frame count is used to represent the amount of target frames that currently appear continuously, and the target frame count threshold is used to indicate the amount of target frames that can appear continuously.

[00285] Opcionalmente, em algumas modalidades, o parâmetro da razão entre sinal e ruído é uma razão entre sinal e ruído segmental modificada do sinal de múltiplos canais.[00285] Optionally, in some embodiments, the signal-to-noise ratio parameter is a modified segmental signal-to-noise ratio of the multi-channel signal.

[00286] A FIGURA 8 é um diagrama de blocos esquemático de um codificador de acordo com uma modalidade do presente pedido de patente. O codificador 800 na FIGURA 8 inclui:[00286] FIGURE 8 is a schematic block diagram of an encoder according to an embodiment of the present patent application. Encoder 800 in FIGURE 8 includes:

[00287] uma memória 810, configurada para armazenar um programa; e[00287] a memory 810, configured to store a program; It is

[00288] um processador 820, configurado para executar o programa, em que, quando o programa é executado, o processador 820 é configurado para: obter um sinal de múltiplos canais de um quadro atual; determinar um valor de ITD inicial do quadro atual; controlar, com base nas informações de características do sinal de múltiplos canais, uma quantidade de quadros alvo que podem aparecer continuamente, em que as informações de características incluem pelo menos um dentre um parâmetro da razão entre sinal e ruído do sinal de múltiplos canais e uma característica de pico de coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro alvo reutilizado como um valor de ITD do quadro alvo; determinar um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que podem aparecer continuamente; e codificar o sinal de múltiplos canais com base no valor de ITD do quadro atual.[00288] a processor 820, configured to execute the program, wherein, when the program is executed, the processor 820 is configured to: obtain a multi-channel signal from a current frame; determine an initial ITD value of the current frame; control, based on the characteristic information of the multi-channel signal, a number of target frames that can appear continuously, wherein the characteristic information includes at least one of a signal-to-noise ratio parameter of the multi-channel signal and a peak characteristic of cross-correlation coefficients of the multi-channel signal, and an ITD value of a previous frame of the target frame reused as an ITD value of the target frame; determining an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that can appear continuously; and encode the multi-channel signal based on the ITD value of the current frame.

[00289] De acordo com esta modalidade do presente pedido de patente, o impacto de fatores ambientais, tais como o ruído de fundo, a reverberação e o vozerio do múltiplas pessoas, na exatidão e na estabilidade de um resultado do cálculo de um valor de ITD pode ser reduzido; e quando há um ruído de fundo, uma reverberação, ou um vozerio de múltiplas pessoas, ou uma característica de harmônica do sinal não é aparente, a estabilidade de um valor de ITD no codificação PS é melhorada, e as transições desnecessárias do valor de ITD são reduzidas até a maior extensão, desse modo evitando a descontinuidade inter- quadros de um sinal misturado com redução e a instabilidade de uma imagem acústica de um sinal decodificado. Além disso, de acordo com esta modalidade do presente pedido de patente, a informação da fase de um sinal estereofônico pode ser bem mais retida, e a qualidade acústica é melhorada.[00289] According to this embodiment of the present patent application, the impact of environmental factors, such as background noise, reverberation and the noise of multiple people, on the accuracy and stability of a result of calculating a value of ITD can be reduced; and when there is background noise, reverberation, or loud noise from multiple people, or a harmonic characteristic of the signal is not apparent, the stability of an ITD value in PS encoding is improved, and unnecessary transitions of the ITD value are reduced to the greatest extent, thereby avoiding inter-frame discontinuity of a downmixed signal and instability of an acoustic image of a decoded signal. Furthermore, according to this embodiment of the present patent application, the phase information of a stereophonic signal can be retained much better, and the acoustic quality is improved.

[00290] Opcionalmente, em algumas modalidades, o codificador 800 também é configurado para determinar a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base na amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e em um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais.[00290] Optionally, in some embodiments, the encoder 800 is also configured to determine the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multi-channel signal and in an index of a peak position of the cross-correlation coefficients of the multi-channel signal.

[00291] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para: determinar um parâmetro de confiança da amplitude de pico com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, em que o parâmetro de confiança da amplitude de pico representa um nível da confiança da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais; determinar um parâmetro de flutuação da posição de pico com base em um valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, e um valor de ITD de um quadro anterior do quadro atual, em que o parâmetro de flutuação da posição de pico representa uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual; e determinar a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais com base no parâmetro de confiança da amplitude de pico e no parâmetro de flutuação da posição de pico.[00291] Optionally, in some embodiments, the encoder 800 is specifically configured to: determine a peak amplitude confidence parameter based on the peak value amplitude of the cross-correlation coefficients of the multi-channel signal, wherein the peak amplitude confidence represents a confidence level of the peak value amplitude of the cross-correlation coefficients of the multi-channel signal; determine a peak position fluctuation parameter based on an ITD value that corresponds to the peak position index of the cross-correlation coefficients of the multi-channel signal, and an ITD value from a previous frame of the current frame, where the peak position fluctuation parameter represents a difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the multi-channel signal and the ITD value of the previous frame of the current frame; and determining the peak characteristic of the cross-correlation coefficients of the multi-channel signal based on the peak amplitude confidence parameter and the peak position fluctuation parameter.

[00292] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para determinar, como parâmetro de confiança da amplitude de pico, uma razão de uma diferença entre um valor da amplitude do valor de pico dos coeficientes de correlação cru-zada do sinal de múltiplos canais e um valor da amplitude de um segundo maior valor dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor da amplitude do valor de pico.[00292] Optionally, in some embodiments, the encoder 800 is specifically configured to determine, as a peak amplitude confidence parameter, a ratio of a difference between an amplitude value of the peak value of the signal's cross-correlation coefficients. of multiple channels and an amplitude value of a second largest value of the cross-correlation coefficients of the multi-channel signal and the amplitude value of the peak value.

[00293] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para determinar, como parâmetro de flutuação da posição de pico, um valor absoluto de uma diferença entre o valor de ITD que corresponde ao índice da posição de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais e o valor de ITD do quadro anterior do quadro atual.[00293] Optionally, in some embodiments, the encoder 800 is specifically configured to determine, as a peak position fluctuation parameter, an absolute value of a difference between the ITD value that corresponds to the peak position index of the correlation coefficients crossover of the multi-channel signal and the ITD value of the previous frame of the current frame.

[00294] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para: controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; e quando a característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais satisfaz uma condição pré-ajus- tada, reduzir, mediante o ajuste de pelo menos uma de uma contagem de quadros alvo e um limite da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente, em que a contagem de quadros alvo é usada para representar uma quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00294] Optionally, in some embodiments, the encoder 800 is specifically configured to: control, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames that can appear continuously; and when the peak characteristic of the cross-correlation coefficients of the multi-channel signal satisfies a preset condition, reducing, by adjusting at least one of a target frame count and a threshold of the target frame count, the number of target frames that can appear continuously, wherein the target frame count is used to represent a number of target frames that currently appear continuously, and the target frame count threshold is used to indicate the number of target frames that can appear continuously.

[00295] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para reduzir, mediante o aumento da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente.[00295] Optionally, in some embodiments, encoder 800 is specifically configured to reduce, by increasing the target frame count, the number of target frames that can appear continuously.

[00296] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para reduzir, mediante a diminuição do limite da contagem de quadros alvo, a quantidade de quadros alvo que podem aparecer continuamente.[00296] Optionally, in some embodiments, the encoder 800 is specifically configured to reduce, by decreasing the target frame count limit, the number of target frames that can appear continuously.

[00297] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para: somente quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz uma condição da razão entre sinal e ruído pré-ajustada, controlar, com base nas informações de características do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; e o codificador 800 também é configurado para: quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição sinal e ruído da relação, parar de reutilizar o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00297] Optionally, in some embodiments, the encoder 800 is specifically configured to: only when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy a preset signal-to-noise ratio condition, control, based on in multi-channel signal characteristic information, the number of target frames that can appear continuously; and the encoder 800 is also configured to: when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame .

[00298] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para: determinar se o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais satisfaz uma condição pré- ajustada sinal e ruído da relação; e quando o parâmetro da razão entre sinal e ruído do sinal de múltiplos canais não satisfaz a condição da razão entre sinal e ruído, controlar, com base na característica de pico dos coeficientes de correlação cruzada do sinal de múltiplos canais, a quantidade de quadros alvo que podem aparecer continuamente; ou quando uma razão entre sinal e ruído do sinal de múltiplos canais satisfaz a condição da razão entre sinal e ruído, parar de reutilizar o valor de ITD do quadro anterior do quadro atual como valor de ITD do quadro atual.[00298] Optionally, in some embodiments, the encoder 800 is specifically configured to: determine whether the signal-to-noise ratio parameter of the multi-channel signal satisfies a preset signal-to-noise ratio condition; and when the signal-to-noise ratio parameter of the multi-channel signal does not satisfy the signal-to-noise ratio condition, controlling, based on the peak characteristic of the cross-correlation coefficients of the multi-channel signal, the number of target frames which may appear continuously; or when a signal-to-noise ratio of the multi-channel signal satisfies the signal-to-noise ratio condition, stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame.

[00299] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para aumentar a contagem de quadros alvo, de modo que um valor da contagem de quadros alvo seja maior do que ou igual ao limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00299] Optionally, in some embodiments, encoder 800 is specifically configured to increase the target frame count such that a target frame count value is greater than or equal to the target frame count threshold, wherein the target frame count is used to represent the amount of target frames that currently appear continuously, and the target frame count threshold is used to indicate the amount of target frames that can appear continuously.

[00300] Opcionalmente, em algumas modalidades, o codificador 800 é configurado especificamente para determinar o valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual, a contagem de quadros alvo e o limite da contagem de quadros alvo, em que a contagem de quadros alvo é usada para representar a quantidade de quadros alvo que apareceram atualmente continuamente, e o limite da contagem de quadros alvo é usado para indicar a quantidade de quadros alvo que podem aparecer continuamente.[00300] Optionally, in some embodiments, the encoder 800 is specifically configured to determine the ITD value of the current frame based on the starting ITD value of the current frame, the target frame count, and the target frame count threshold, in that the target frame count is used to represent the amount of target frames that currently appear continuously, and the target frame count threshold is used to indicate the amount of target frames that can appear continuously.

[00301] Opcionalmente, em algumas modalidades, o parâmetro da razão entre sinal e ruído é uma razão entre sinal e ruído segmental modificada do sinal de múltiplos canais.[00301] Optionally, in some embodiments, the signal-to-noise ratio parameter is a modified segmental signal-to-noise ratio of the multi-channel signal.

[00302] Um elemento normalmente versado no estado da técnica pode estar ciente que, com referência aos exemplos descritos nas modalidades divulgadas neste relatório descritivo, as unidades e as etapas de algoritmos podem ser implementadas por hardware eletrônico ou uma combinação de software de computador e hardware eletrônico. Se as funções estão executadas por hardware ou por software vai depender das aplicações e das condições de restrição de desenho particulares das soluções técnicas. Um elemento versado no estado da técnica pode usar métodos diferentes para implementar as funções descritas para cada aplicação particular, mas não deve ser considerado que a implementação vai além do âmbito do presente pedido de patente.[00302] One of ordinary skill in the art may be aware that, with reference to the examples described in the embodiments disclosed in this specification, the algorithm units and steps may be implemented by electronic hardware or a combination of computer software and hardware. electronic. Whether the functions are performed by hardware or software will depend on the applications and the particular design constraints of the technical solutions. One skilled in the art may use different methods to implement the functions described for each particular application, but it should not be considered that the implementation goes beyond the scope of the present patent application.

[00303] Pode ser claramente compreendido por um elemento versado no estado da técnica que, para fins de conveniência e brevidade da descrição, para um processo de trabalho detalhado do sistema acima, o aparelho e a unidade, se referem a um processo correspondente nas modalidades do método acima, e os detalhes não são descritos no presente documento outra vez.[00303] It can be clearly understood by one skilled in the art that, for the purposes of convenience and brevity of description, for a detailed working process of the above system, the apparatus and the unit, refer to a corresponding process in embodiments of the above method, and the details are not described herein again.

[00304] Nas diversas modalidades fornecidas neste pedido de patente, deve ser compreendido que o sistema, o aparelho e o método divulgados podem ser implementados de outras maneiras. Por exemplo, as modalidades descritas do aparelho são meramente exemplos. Por exemplo, a divisão da unidade é meramente a divisão da função lógica e pode ser outra divisão na implementação real. Por exemplo, os elementos de uma pluralidade de unidades ou componentes podem ser combinados ou integrados em um outro sistema, ou algumas características podem ser ignoradas ou não executadas. Além disso, os acoplamentosmútuos ou os acoplamentos diretos ou as conexões de co-municação mostrados ou discutidos podem ser implementados ao usar algumas interfaces. Os acoplamentos indiretos ou as conexões de comunicação entre os aparelhos ou as unidades podem ser implementados em formas elétricas, mecânicas, ou outras ainda.[00304] In the various embodiments provided in this patent application, it should be understood that the disclosed system, apparatus and method can be implemented in other ways. For example, the described embodiments of the apparatus are merely examples. For example, unit division is merely logic function division and may be another division in the actual implementation. For example, elements of a plurality of units or components may be combined or integrated into another system, or some features may be ignored or not implemented. Furthermore, the mutual couplings or direct couplings or communication connections shown or discussed may be implemented when using some interfaces. Indirect couplings or communication connections between devices or units can be implemented in electrical, mechanical, or other forms.

[00305] As unidades descritas como partes separadas podem ou não ser fisicamente separadas, e as partes indicadas como unidades podem ou não ser unidades físicas, podem ficar situadas em uma posição, ou podem ser distribuídas em uma pluralidade de unidades de rede. Algumas ou todas as unidades podem ser selecionadas dependendo dos requisitos reais para atingir os objetivos das soluções das modalidades.[00305] The units described as separate parts may or may not be physically separated, and the parts indicated as units may or may not be physical units, may be located in one position, or may be distributed across a plurality of network units. Some or all of the units may be selected depending on the actual requirements to achieve the embodiments' solution objectives.

[00306] Além disso, as unidades funcionais nas modalidades do presente pedido de patente podem ser integradas em uma unidade de processamento, ou cada uma das unidades pode existir fisicamente sozinha, ou duas ou mais unidades podem ser integradas em uma unidade.[00306] Furthermore, the functional units in embodiments of the present patent application may be integrated into a processing unit, or each of the units may physically exist alone, or two or more units may be integrated into one unit.

[00307] Quando as funções são implementadas em uma forma de uma unidade funcional de software e vendidas ou usadas como um produto independente, as funções podem ser armazenadas em um meio de armazenamento que pode ser lido por computador. Com base em tal compreensão, as soluções técnicas do presente pedido de patente, essencialmente, ou a parte que contribui para a técnica anterior, ou algumas das soluções técnicas, podem ser implementadas em uma forma de um produto de software. O produto de software de computador é armazenado em um meio de armazenamento, e inclui várias instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor, um dispositivo de rede, ou um outro ainda) para executar todas ou algumas etapas dos métodos descritos nas modalidades do presente pedido de patente. O meio de armazenamento inclui qualquer meio que pode armazenar um código de programa, tal como um drive rápido de USB, um disco rígido removível, uma memória só de leitura (ROM, Read-Only Memoory), uma memória de acesso aleatório (RAM, Random Access Memory), um disco magnético, ou um disco óptico.[00307] When functions are implemented in a form of a software functional unit and sold or used as an independent product, the functions may be stored on a computer-readable storage medium. Based on such an understanding, the technical solutions of the present patent application, essentially, or the part contributing to the prior art, or some of the technical solutions, can be implemented in a form of a software product. The computer software product is stored on a storage medium, and includes various instructions for instructing a computer device (which may be a personal computer, a server, a network device, or the like) to execute all or some steps of the methods described in the embodiments of the present patent application. Storage medium includes any medium that can store program code, such as a fast USB drive, a removable hard disk, a read-only memory (ROM), a random access memory (RAM, Random Access Memory), a magnetic disk, or an optical disk.

[00308] As descrições acima são meramente implementações específicas do presente pedido de patente, mas não se prestam a limitar o âmbito de proteção do presente pedido de patente. Qualquer variação ou substituição figurada de imediato por um elemento versado no estado da técnica dentro do âmbito técnico divulgado neste pedido de patente irá se enquadrar dentro do âmbito de proteção do presente pedido de patente. Portanto, o âmbito de proteção do presente pedido de patente irá ficar sujeito ao âmbito de proteção das concretizações.[00308] The above descriptions are merely specific implementations of the present patent application, but do not serve to limit the scope of protection of the present patent application. Any variation or substitution immediately represented by an element skilled in the prior art within the technical scope disclosed in this patent application will fall within the scope of protection of this patent application. Therefore, the scope of protection of this patent application will be subject to the scope of protection of the embodiments.

Claims (11)

1. Método para codificar um sinal multicanal, caracterizado pelo fato de que compreende: obter (500) um sinal multicanal de um quadro atual; determinar (520) um valor de diferença de tempo intercanal (ITD) inicial do quadro atual; controlar (530), com base em informações de característica do sinal multicanal, uma quantidade de quadros alvo que são permitidos a aparecer continuamente, em que as informações de característica compreendem pelo menos um dentre uma razão de sinal para ruído do sinal multicanal e uma particularidade de pico de coeficientes de correlação cruzada do sinal multicanal, e um valor de ITD de um quadro anterior do quadro alvo é reutilizado como um valor de ITD do quadro alvo; determinar (540) um valor de ITD do quadro atual com base no valor de ITD inicial do quadro atual e na quantidade de quadros alvo que são permitidos a aparecer continuamente; e codificar (550) o sinal multicanal com base no valor de ITD do quadro atual.1. Method for encoding a multichannel signal, characterized in that it comprises: obtaining (500) a multichannel signal from a current frame; determining (520) an initial interchannel time difference (ITD) value of the current frame; controlling (530), based on characteristic information of the multichannel signal, a number of target frames that are allowed to appear continuously, wherein the characteristic information comprises at least one of a signal-to-noise ratio of the multichannel signal and a particularity of peak cross-correlation coefficients of the multichannel signal, and an ITD value from a previous frame of the target frame is reused as an ITD value of the target frame; determining (540) an ITD value of the current frame based on the initial ITD value of the current frame and the number of target frames that are allowed to appear continuously; and encoding (550) the multichannel signal based on the ITD value of the current frame. 2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que antes do controle (530), com base em informações de característica do sinal multicanal, de uma quantidade de quadros alvo que são permitidos a aparecer continuamente, o método ainda compreende: determinar a particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal com base em amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal multicanal e um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal multicanal.2. Method according to claim 1, characterized by the fact that before controlling (530), based on characteristic information of the multichannel signal, a number of target frames that are allowed to appear continuously, the method further comprises: determine the peak particularity of the cross-correlation coefficients of the multichannel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multichannel signal and an index of a peak position of the cross-correlation coefficients of the multichannel signal. 3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que a determinação da particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal com base em amplitude de um valor de pico dos coeficientes de correlação cruzada do sinal multicanal e um índice de uma posição de pico dos coeficientes de correlação cruzada do sinal multicanal compreende: determinar um parâmetro de confiança de amplitude de pico com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal multicanal, em que o parâmetro de confiança de amplitude de pico representa um nível de confiança da amplitude do valor de pico dos coeficientes de correlação cruzada do sinal multicanal; determinar um parâmetro de flutuação de posição de pico com base em um valor de ITD correspondendo ao índice da posição de pico dos coeficientes de correlação cruzada do sinal multicanal, e um valor de ITD de um quadro anterior do quadro atual, em que o parâmetro de flutuação de posição de pico representa uma diferença entre o valor de ITD correspondendo ao índice da posição de pico dos coeficientes de correlação cruzada do sinal multicanal e o valor de ITD do quadro anterior do quadro atual; e determinar a particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal com base no parâmetro de confiança de amplitude de pico e no parâmetro de flutuação de posição de pico.3. Method according to claim 2, characterized by the fact that determining the peak particularity of the cross-correlation coefficients of the multichannel signal based on the amplitude of a peak value of the cross-correlation coefficients of the multichannel signal and an index of a peak position of the cross-correlation coefficients of the multichannel signal comprises: determining a peak amplitude confidence parameter based on the amplitude of the peak value of the cross-correlation coefficients of the multichannel signal, wherein the peak amplitude confidence parameter represents a confidence level of the amplitude of the peak value of the cross-correlation coefficients of the multichannel signal; determine a peak position fluctuation parameter based on an ITD value corresponding to the peak position index of the cross-correlation coefficients of the multichannel signal, and an ITD value from a previous frame of the current frame, wherein the peak position fluctuation parameter peak position fluctuation represents a difference between the ITD value corresponding to the peak position index of the cross-correlation coefficients of the multichannel signal and the ITD value of the previous frame of the current frame; and determining the peak particularity of the cross-correlation coefficients of the multichannel signal based on the peak amplitude confidence parameter and the peak position fluctuation parameter. 4. Método de acordo com a reivindicação 3, caracterizado pelo fato de que a determinação de um parâmetro de confiança de amplitude de pico com base na amplitude do valor de pico dos coeficientes de correlação cruzada do sinal multicanal compreende: determinar, como o parâmetro de confiança de amplitude de pico, uma razão de uma diferença entre um valor de amplitude do valor de pico dos coeficientes de correlação cruzada do sinal multicanal e um valor de amplitude de um segundo maior valor dos coeficientes de correlação cruzada do sinal multicanal para o valor de amplitude do valor de pico.4. Method according to claim 3, characterized by the fact that determining a peak amplitude confidence parameter based on the amplitude of the peak value of the cross-correlation coefficients of the multichannel signal comprises: determining, as the peak amplitude confidence, a ratio of a difference between an amplitude value of the peak value of the cross-correlation coefficients of the multichannel signal and an amplitude value of a second largest value of the cross-correlation coefficients of the multichannel signal to the value of peak value amplitude. 5. Método de acordo com a reivindicação 3, caracterizado pelo fato de que a determinação de um parâmetro de flutuação de posição de pico com base em um valor de ITD correspondendo ao índice da posição de pico dos coeficientes de correlação cruzada do sinal multicanal, e um valor de ITD de um quadro anterior do quadro atual compreende: determinar, como o parâmetro de flutuação de posição de pico, um valor absoluto de uma diferença entre o valor de ITD correspondendo ao índice da posição de pico dos coeficientes de correlação cruzada do sinal multicanal e o valor de ITD do quadro anterior do quadro atual.5. Method according to claim 3, characterized by the fact that determining a peak position fluctuation parameter based on an ITD value corresponding to the peak position index of the cross-correlation coefficients of the multichannel signal, and an ITD value of a previous frame of the current frame comprises: determining, as the peak position fluctuation parameter, an absolute value of a difference between the ITD value corresponding to the peak position index of the signal cross-correlation coefficients multichannel and the ITD value of the previous frame of the current frame. 6. Método de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que o controle (530), com base em informações de característica do sinal multicanal, de uma quantidade de quadros alvo que são permitidos a aparecer continuamente compreende: controlar, com base na particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal, a quantidade de quadros alvo que são permitidos a aparecer continuamente; e quando a particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal satisfizer uma condição pré-ajustada, reduzir, ao reduzir um limiar de uma contagem de quadro alvo, a quantidade dos quadros alvo que são permitidos a aparecer continuamente, em que o limiar da contagem de quadro alvo é usado para indicar a quantidade de quadros alvo que atualmente apareceram continuamente.6. Method according to any one of claims 1 to 5, characterized in that controlling (530), based on multichannel signal characteristic information, a quantity of target frames that are allowed to appear continuously comprises: controlling , based on the peak particularity of the cross-correlation coefficients of the multichannel signal, the amount of target frames that are allowed to appear continuously; and when the peak feature of the cross-correlation coefficients of the multichannel signal satisfies a preset condition, reducing, by reducing a threshold of a target frame count, the quantity of the target frames that are allowed to appear continuously, at which the threshold of target frame count is used to indicate the number of target frames that have currently appeared continuously. 7. Método de acordo com a reivindicação 6, caracterizado pelo fato de que o controle, com base na particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal, da quantidade de quadros alvo que são permitidos a aparecer continuamente compreende: somente quando a razão de sinal para ruído do sinal multicanal não satisfizer uma condição de razão de sinal para ruído pré-ajus- tada, controlar, com base na particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal, a quantidade de quadros alvo que são permitidos a aparecer continuamente; e o método ainda compreende: quando a razão de sinal para ruído do sinal multicanal satisfizer a condição de razão de sinal para ruído pré-ajustada, interromper reutilização do valor de ITD do quadro anterior do quadro atual como o valor de ITD do quadro atual.7. Method according to claim 6, characterized by the fact that controlling, based on the peak particularity of the cross-correlation coefficients of the multichannel signal, the quantity of target frames that are allowed to appear continuously comprises: only when the ratio signal-to-noise ratio of the multichannel signal does not satisfy a preset signal-to-noise ratio condition, control, based on the peak particularity of the cross-correlation coefficients of the multichannel signal, the amount of target frames that are allowed to appear continuously; and the method further comprises: when the signal-to-noise ratio of the multichannel signal satisfies the preset signal-to-noise ratio condition, stopping reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame. 8. Método de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que o controle (530), com base em informações de característica do sinal multicanal, de uma quantidade de quadros alvo que são permitidos a aparecer continuamente compreende: determinar se a razão de sinal para ruído do sinal multicanal satisfaz uma condição de razão de sinal para ruído pré-ajustada; e quando a razão de sinal para ruído do sinal multicanal não satisfizer a condição de razão de sinal para ruído, controlar, com base na particularidade de pico dos coeficientes de correlação cruzada do sinal multicanal, a quantidade de quadros alvo que são permitidos a aparecer continuamente; ou quando uma razão de sinal para ruído do sinal multicanal satisfizer a condição de razão de sinal para ruído, interromper reutilização do valor de ITD do quadro anterior do quadro atual como o valor de ITD do quadro atual.8. Method according to any one of claims 1 to 5, characterized in that controlling (530), based on multichannel signal characteristic information, a number of target frames that are allowed to appear continuously comprises: determining whether the signal-to-noise ratio of the multichannel signal satisfies a preset signal-to-noise ratio condition; and when the signal-to-noise ratio of the multichannel signal does not satisfy the signal-to-noise ratio condition, controlling, based on the peak particularity of the cross-correlation coefficients of the multichannel signal, the amount of target frames that are allowed to appear continuously ; or when a signal-to-noise ratio of the multichannel signal satisfies the signal-to-noise ratio condition, stop reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame. 9. Método de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que a interrupção de reutilização do valor de ITD do quadro anterior do quadro atual como o valor de ITD do quadro atual compreende: aumentar a contagem de quadro alvo, de modo que um valor da contagem de quadro alvo seja maior do que ou igual ao limiar da contagem de quadro alvo, em que a contagem de quadro alvo é usada para representar uma quantidade de quadros alvo que atualmente apareceram continuamente, e o limiar da contagem de quadro alvo é usado para indicar a quantidade de quadros alvo que são permitidos a aparecer continuamente.9. The method of claim 7 or 8, wherein interrupting reusing the ITD value of the previous frame of the current frame as the ITD value of the current frame comprises: increasing the target frame count, so that a target frame count value is greater than or equal to the target frame count threshold, wherein the target frame count is used to represent a number of target frames that have currently appeared continuously, and the frame count threshold target is used to indicate the number of target frames that are allowed to appear continuously. 10. Codificador, caracterizado pelo fato de que compreende: uma memória para armazenar instruções executáveis por computador; e um processador operacionalmente acoplado à memória, o processador sendo configurado para executar as instruções executáveis por computador para realizar o método como definido em qualquer uma das reivindicações 1 a 9.10. Encoder, characterized by the fact that it comprises: a memory for storing computer-executable instructions; and a processor operatively coupled to memory, the processor being configured to execute computer executable instructions for carrying out the method as defined in any one of claims 1 to 9. 11. Meio de armazenamento legível por computador tendo um programa gravado no mesmo, caracterizado pelo fato de que onde o programa faz com que o computador execute método como definido em qualquer uma das reivindicações 1 a 9.11. Computer readable storage medium having a program recorded thereon, wherein the program causes the computer to execute method as defined in any one of claims 1 to 9.
BR122023025915-7A 2016-08-10 2017-02-22 METHOD FOR ENCODING A MULTICHANNEL SIGNAL, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM BR122023025915A2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610652507.4 2016-08-10

Publications (1)

Publication Number Publication Date
BR122023025915A2 true BR122023025915A2 (en) 2024-04-24

Family

ID=

Similar Documents

Publication Publication Date Title
US11217257B2 (en) Method for encoding multi-channel signal and encoder
US11133014B2 (en) Multi-channel signal encoding method and encoder
JP7419425B2 (en) Delay estimation method and delay estimation device
JP2017187790A (en) Audio signal encoding method and device
BR122023025915A2 (en) METHOD FOR ENCODING A MULTICHANNEL SIGNAL, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM
BR112019002364B1 (en) METHOD FOR ENCODING A MULTI-CHANNEL SIGNAL, ENCODER AND STORAGE MEDIUM THAT CAN BE READ BY A COMPUTER
BR122023026024A2 (en) MULTI-CHANNEL SIGNAL ENCODING METHOD, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM
BR112019002656B1 (en) MULTI-CHANNEL SIGNAL ENCODING METHOD, ENCODER, AND COMPUTER READABLE STORAGE MEDIUM