JP2023085339A - Stereo signal processing method and device - Google Patents

Stereo signal processing method and device Download PDF

Info

Publication number
JP2023085339A
JP2023085339A JP2023041599A JP2023041599A JP2023085339A JP 2023085339 A JP2023085339 A JP 2023085339A JP 2023041599 A JP2023041599 A JP 2023041599A JP 2023041599 A JP2023041599 A JP 2023041599A JP 2023085339 A JP2023085339 A JP 2023085339A
Authority
JP
Japan
Prior art keywords
signal
length
current frame
channel
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023041599A
Other languages
Japanese (ja)
Inventor
シュロモット,エール
Shlomot Eyal
リー,ハイティーン
Haiting Li
ミヤオ,レイ
Miao Lei
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2023085339A publication Critical patent/JP2023085339A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

To provide a stereo signal processing method and device.SOLUTION: A method includes the steps of: acquiring a PCM signal including a first channel signal and a second channel signal of a multi-channel signal of a current frame including a stereo signal; acquiring first ITD representing a time difference between the first channel signal and the second channel signal; determining whether the sign of the first ITD is the same as the sign of second ITD representing a time difference between two channel signals of the last frame; executing first delay alignment processing on the first channel signal based upon the first ITD when the sign of the first ITD is different from the sign of the second ITD, and executing second delay alignment processing on the second channel signal based upon the second ITD.SELECTED DRAWING: Figure 1

Description

[関連出願への相互参照]
この出願は、2017年5月16日に中国特許庁に出願された「STEREO SIGNAL PROCESSING METHOD AND APPARATUS」という名称の中国特許出願第201710344704.4号への優先権を主張し、その全内容を参照により援用する。
[Cross reference to related application]
This application claims priority to Chinese Patent Application No. 201710344704.4 entitled "STEREO SIGNAL PROCESSING METHOD AND APPARATUS" filed with the Chinese Patent Office on May 16, 2017, the entire contents of which are incorporated by reference. do.

[技術分野]
この出願は、情報技術の分野に関し、特に、ステレオ信号処理方法及び装置に関する。
[Technical field]
This application relates to the field of information technology, and more particularly to a stereo signal processing method and apparatus.

生活の質が改善するにつれて、人々は高品質オーディオに対する需要を増加させている。モノラルオーディオに比べて、ステレオオーディオは、音源毎に方向の感覚及び分布の感覚を提供し、情報の改善した鮮明さ、分かりやすさ、現場感覚を提供する。したがって、ステレオオーディオは非常に評判が良い。既存の時間領域ステレオ符号化技術では、通常では、左チャンネル信号及び右チャンネル信号は、時間領域でミッドチャンネル(Mid channel)信号及びサイドチャンネル(Side channel)信号にダウンミックスされる。ダウンミックスされたミッドチャンネル信号は、0.5×(L+R)と記されることがあり、これは、左チャンネル信号と右チャンネル信号との間の関連情報を表す。ダウンミックスされたサイドチャンネル信号は、0.5×(L-R)と記されることがあり、これは、左チャンネル信号と右チャンネル信号との間の差分情報を表す。Lは左チャンネル信号を示し、Rは右チャンネル信号を示す。次いで、ミッドチャンネル信号及びサイドチャンネル信号は、モノラルチャンネル符号化方法を使用することにより別々に符号化される。ミッドチャンネル信号は、通常では、比較的大量のビットを使用することにより符号化され、サイドチャンネル信号は、通常では、比較的少量のビットを使用することにより符号化される。 As the quality of life improves, people are increasing their demand for high quality audio. Compared to monophonic audio, stereo audio provides a sense of direction and distribution for each sound source, providing improved clarity, intelligibility, and immersiveness of information. Stereo audio is therefore very popular. In existing time domain stereo coding techniques, left and right channel signals are usually downmixed into Mid channel and Side channel signals in the time domain. A downmixed mid-channel signal may be denoted as 0.5×(L+R), which represents the relevant information between the left and right channel signals. A downmixed side channel signal may be denoted as 0.5×(L−R), which represents the differential information between the left and right channel signals. L indicates the left channel signal and R indicates the right channel signal. The mid-channel and side-channel signals are then encoded separately by using a mono-channel encoding method. Mid-channel signals are typically encoded using a relatively large amount of bits, and side-channel signals are typically encoded using a relatively small amount of bits.

符号化効率を改善するために、ミッドチャンネル信号はより大きくする必要があり、サイドチャンネル信号はより小さくする必要がある。現在、時間領域ステレオ符号化では、ミッドチャンネル信号及びサイドチャンネル信号が取得される前に、マッチングアルゴリズムが、左チャンネル信号及び右チャンネル信号に対して遅延推定を実行してチャンネル間時間差を取得するために使用され、遅延アライメント処理が、チャンネル間時間差に基づいて左チャンネル信号及び右チャンネル信号に対して実行され、それにより、ダウンミックスされたミッドチャンネル信号がより大きくなり、ダウンミックスされたサイドチャンネル信号がより小さくなる。チャンネル間の時間差に基づいて遅延アライメントを実行するためのアルゴリズムでは、通常では、一方のチャンネルが左チャンネル及び右チャンネルから選択され、遅延アライメント処理がチャンネルの信号に対して実行される。このチャンネルはターゲットチャンネルと呼ばれる。遅延調整は、他方のチャンネルの信号に対して実行されず、他方のチャンネルは、ターゲットチャンネルに対する遅延調整のための基準として使用される。このチャンネルは、基準チャンネルと呼ばれる。 To improve coding efficiency, the mid-channel signal should be larger and the side-channel signal should be smaller. Currently, in time-domain stereo coding, the matching algorithm performs delay estimation on the left and right channel signals to obtain the inter-channel time difference before the mid-channel and side-channel signals are obtained. , a delay alignment process is performed on the left and right channel signals based on the inter-channel time difference, resulting in a larger downmixed mid-channel signal and a downmixed side channel signal becomes smaller. In algorithms for performing delay alignment based on the time difference between channels, typically one channel is selected from the left and right channels and the delay alignment process is performed on the channel's signal. This channel is called the target channel. No delay adjustment is performed on the other channel's signal, and the other channel is used as a reference for delay adjustment to the target channel. This channel is called the reference channel.

既存の方法では、遅延推定を通じて取得された現在のフレームのチャンネル間時間差の符号は、前のフレームのチャンネル間時間差の符号と異なることが判明した場合、現在のフレームのターゲットチャンネルの選択は、前のフレームのターゲットチャンネルの選択と同じに保持される。さらに、現在のフレームのチャンネル間時間差の推定値にかかわらず、現在のフレームのチャンネル間時間差は、強制的にゼロに設定される。次いで、遅延アライメント処理は、遅延アライメント処理の後の現在のフレームのターゲットチャンネルと基準チャンネルとの間の遅延がゼロであることを確保するために、ゼロに設定されたチャンネル間時間差に基づいて、現在のフレームのターゲットチャンネルに対して実行される。 In the existing method, if the sign of the inter-channel time difference of the current frame obtained through delay estimation is found to be different from the sign of the inter-channel time difference of the previous frame, the selection of the target channel of the current frame is the previous frame target channel selection remains the same. In addition, regardless of the current frame's inter-channel time difference estimate, the current frame's inter-channel time difference is forced to zero. Then, the delay alignment process is based on the inter-channel time difference set to zero to ensure that the delay between the target channel and the reference channel of the current frame after the delay alignment process is zero: Executed on the target channel of the current frame.

上記の方法では、ステレオ信号の2つのフレームのチャンネル間時間差の符号が変化するとき、これは、左及び右チャンネル信号の到着順序が変化することを示し、元々は最初に到着した左チャンネル信号の代わりに、右チャンネル信号が最初に到着することがあり、或いは、元々は最初に到着した右チャンネル信号の代わりに左チャンネル信号が最初に到着することがある。現在のフレームのチャンネル間時間差が強制的にゼロに設定された場合、左及び右チャンネルは、左及び右チャンネルの間の実際の時間差ではなく、ゼロの時間差に基づいて調整され、時間領域ダウンミックス処理は、このように取得され且つ遅延調整後に取得された左及び右チャンネル信号に対して実行される。しかし、実際には、実際の遅延アライメントは、2つのチャンネル信号に対して実現されない。したがって、2つのチャンネルの間の相関成分をオフセットするための効果的な方法が存在せず、その結果、時間領域ダウンミックスの後の現在のフレームのサイドチャンネル信号のエネルギーが増加し、全体的なステレオ符号化品質が低減する。 In the above method, when the sign of the inter-channel time difference of two frames of a stereo signal changes, this indicates that the order of arrival of the left and right channel signals changes, with the left channel signal originally arriving first. Alternatively, the right channel signal may arrive first, or the left channel signal may arrive first instead of the right channel signal originally arriving first. If the inter-channel time difference for the current frame is forced to zero, the left and right channels are adjusted based on the zero time difference rather than the actual time difference between the left and right channels, resulting in a time domain downmix. Processing is performed on the left and right channel signals thus obtained and obtained after delay adjustment. However, in practice, actual delay alignment is not achieved for two channel signals. Therefore, there is no effective method to offset the correlation component between the two channels, resulting in increased energy of the side-channel signal in the current frame after time-domain downmixing, resulting in an overall Stereo encoding quality is reduced.

この出願は、ステレオ信号の2つのフレームの間のチャンネル間時間差の符号が変化したときにチャンネル間遅延が整列されないために引き起こされるステレオ符号化の低い符号化品質の問題を解決するためのステレオ信号処理方法及び装置を提供する。 This application aims to solve the problem of low encoding quality in stereo encoding caused by inter-channel delays not being aligned when the sign of the inter-channel time difference between two frames of a stereo signal changes. A processing method and apparatus are provided.

この出願の実施形態は、ステレオコーデックのエンコーダ側に適用されるステレオ信号処理方法を提供し、当該方法は、
現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に対して遅延推定を実行するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を含む。
An embodiment of this application provides a stereo signal processing method applied on the encoder side of a stereo codec, the method comprising:
The step of performing delay estimation on the current frame stereo signal to determine the current frame inter-channel time difference, wherein the current frame inter-channel time difference is between the current frame first channel signal and a step, which is the time difference between the current frame and the second channel signal;
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay alignment processing and performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, the second channel signal being on the same channel as the target channel signal of the previous frame.

この出願において提供される方法によれば、現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延アライメント処理は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して実行され、遅延アライメント処理は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して実行される。したがって、現在のフレームの遅延アライメント処理は、実際のチャンネル間時間差に基づいて実行でき、それにより、より良好なアライメント効果を確保し、現在のフレームのチャンネル間時間差が強制的にゼロに設定されるので、遅延アライメント処理の後の現在のフレームの2つのチャンネルの間の相関成分がオフセットできず、その結果、時間領域ダウンミックスの後の現在のフレームの二次チャンネル信号のエネルギーが増加し、全体の符号化品質に影響を与えるという従来技術の問題を回避する。 According to the method provided in this application, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame of the current frame, the delay alignment process The delay alignment process is performed on the first channel signal of the current frame based on the inter-channel time difference of the frame, and the delay alignment process is performed on the second channel signal of the current frame based on the inter-channel time difference of the previous frame. executed. Therefore, the delay alignment processing of the current frame can be performed based on the actual inter-channel time difference, thereby ensuring a better alignment effect, and the inter-channel time difference of the current frame is forced to zero. , the correlation component between the two channels of the current frame after the delay alignment process cannot be offset, and as a result the energy of the secondary channel signal of the current frame after the time domain downmix increases, resulting in an overall avoiding the prior art problem of affecting the coding quality of

任意選択で、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行することは、
遅延アライメント処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮し、
第1の処理長は、現在のフレームのチャンネル間時間差及び第1のアライメント処理長に基づいて決定され、第1の処理長は、第1のアライメント処理長よりも大きいことを含む。
Optionally, performing delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame comprises:
The signal of the first processing length in the first channel signal of the current frame is changed to the signal of the first alignment processing length to obtain the first channel signal of the current frame after the delay alignment processing. compress,
The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, wherein the first process length is greater than the first alignment process length.

任意選択で、第1の処理長は、現在のフレームのチャンネル間時間差の絶対値と第1のアライメント処理長との和である。 Optionally, the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length.

任意選択で、第1の処理長の信号の開始点は、第1のアライメント処理長の信号の開始点の前に位置し、第1の処理長の信号の開始点と第1のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the first treatment length is located before the starting point of the signal of the first alignment treatment length, such that the starting point of the signal of the first treatment length and the first alignment treatment length is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長以上である。 Optionally, the starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the first channel signal of the current frame is greater than or equal to the first alignment process length.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移長との和以上であり、遷移長は、現在のフレームのチャンネル間時間差の絶対値の最大値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition length, and between the start point of the signal of the first alignment process length and the end point of the first channel signal of the current frame is greater than or equal to the sum of the length of the first alignment process and the transition length, and the transition length is less than or equal to the maximum absolute value of the inter-channel time difference of the current frame.

任意選択で、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行することは、
遅延アライメント処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張し、
第2の処理長は、前のフレームのチャンネル間時間差及び第2のアライメント処理長に基づいて決定され、第2の処理長は、第2のアライメント処理長未満であることを含む。
Optionally, performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame comprises:
To obtain the second channel signal of the current frame after the delay alignment process, the signal of the second process length in the second channel signal of the current frame is changed to the signal of the second alignment process length. stretch,
The second process length is determined based on the inter-channel time difference of the previous frame and the second alignment process length, wherein the second process length is less than the second alignment process length.

任意選択で、第2の処理長は、第2のアライメント処理長と前のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2の処理長の信号の開始点は、第2のアライメント処理長の信号の開始点の後に位置し、第2の処理長の信号の開始点と第2のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the starting point of the second alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第2のアライメント処理長以上である。 Optionally, the starting point of the signal of the second alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame and The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the second alignment process length.

任意選択で、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第2のプリセット長に等しく、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第2のプリセット長と第2のアライメント処理長との和に等しい。 Optionally, a length between the start of the signal of the second alignment process length and the start of the second channel signal of the current frame is equal to the second preset length and the first alignment process length is equal to the sum of the second preset length and the second alignment process length.

任意選択で、第1のアライメント処理長は、現在のフレームのフレーム長以下であり、第1のアライメント処理長は、プリセット長であるか、或いは、第1のアライメント処理長は、以下の式を満たし、

Figure 2023085339000002
L_next_targetは第1のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length is a preset length; fill,
Figure 2023085339000002
L_next_target is the first alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第2のアライメント処理長は、現在のフレームのフレーム長以下であり、第2のアライメント処理長は、プリセット長であるか、或いは、第2のアライメント処理長は、以下の式を満たし、

Figure 2023085339000003
L_pre_targetは第2のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the second alignment process length is less than or equal to the frame length of the current frame, and the second alignment process length is a preset length; fill,
Figure 2023085339000003
L_pre_target is the length of the second alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000004
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is less than or equal to the frame length of the current frame, and the process length of the delayed alignment process is a preset length; fill,
Figure 2023085339000004
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

この出願の実施形態は、上記の方法において提供されるいずれかのステレオ信号処理方法を実行及び実現し得るステレオ信号処理装置を提供する。 Embodiments of this application provide a stereo signal processing apparatus capable of executing and realizing any stereo signal processing method provided in the above methods.

可能な設計では、ステレオ信号処理装置は、複数の機能モジュールを含み、例えば、上記において提供されるいずれかのステレオ信号処理方法を実現するように構成された処理ユニット及びトランシーバユニットを含む。したがって、現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延アライメント処理は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して実行され、遅延アライメント処理は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して実行される。したがって、現在のフレームの遅延アライメント処理は、実際のチャンネル間時間差に基づいて実行でき、それにより、より良好なアライメント効果を確保し、現在のフレームのチャンネル間時間差が強制的にゼロに設定されるので、遅延アライメント処理の後の現在のフレームの2つのチャンネルの間の相関成分がオフセットできず、その結果、時間領域ダウンミックスの後の現在のフレームの二次チャンネル信号のエネルギーが増加し、全体の符号化品質に影響を与えるという従来技術の問題を回避する。 In a possible design, the stereo signal processing apparatus comprises a plurality of functional modules, eg processing units and transceiver units configured to implement any of the stereo signal processing methods provided above. Therefore, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame, the delay alignment process is based on the inter-channel time difference of the current frame. A delay alignment process is performed on the second channel signal of the current frame based on the inter-channel time difference of the previous frame. Therefore, the delay alignment processing of the current frame can be performed based on the actual inter-channel time difference, thereby ensuring a better alignment effect, and the inter-channel time difference of the current frame is forced to zero. , the correlation component between the two channels of the current frame after the delay alignment process cannot be offset, and as a result the energy of the secondary channel signal of the current frame after the time domain downmix increases, resulting in an overall avoiding the prior art problem of affecting the coding quality of

この出願の実施形態は、ステレオ信号処理装置を提供し、当該装置は、プロセッサ及びメモリを含み、メモリは実行可能命令を記憶し、実行可能命令は、プロセッサに対して、以下のステップ、すなわち、
現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に対して遅延推定を実行するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される。
An embodiment of this application provides a stereo signal processing apparatus, the apparatus including a processor and a memory, the memory storing executable instructions, the executable instructions instructing the processor to perform the following steps:
The step of performing delay estimation on the current frame stereo signal to determine the current frame inter-channel time difference, wherein the current frame inter-channel time difference is between the current frame first channel signal and a step, which is the time difference between the current frame and the second channel signal;
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay alignment processing and performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, a second channel signal, on the same channel as the target channel signal of the previous frame, is used to command the steps to be performed.

任意選択で、実行可能命令は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行するとき、プロセッサに対して、以下のステップ、すなわち、
遅延アライメント処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮するステップであり、
第1の処理長は、現在のフレームのチャンネル間時間差及び第1のアライメント処理長に基づいて決定され、第1の処理長は、第1のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame, instruct the processor to perform the following steps:
The signal of the first processing length in the first channel signal of the current frame is changed to the signal of the first alignment processing length to obtain the first channel signal of the current frame after the delay alignment processing. a step of compressing;
The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, wherein the first process length is greater than the first alignment process length, so as to perform the step used to command.

任意選択で、第1の処理長は、現在のフレームのチャンネル間時間差の絶対値と第1のアライメント処理長との和である。 Optionally, the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length.

任意選択で、第1の処理長の信号の開始点は、第1のアライメント処理長の信号の開始点の前に位置し、第1の処理長の信号の開始点と第1のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the first treatment length is located before the starting point of the signal of the first alignment treatment length, such that the starting point of the signal of the first treatment length and the first alignment treatment length is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長以上である。 Optionally, the starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the first channel signal of the current frame is greater than or equal to the first alignment process length.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移長との和以上であり、遷移長は、現在のフレームのチャンネル間時間差の絶対値の最大値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition length, and between the start point of the signal of the first alignment process length and the end point of the first channel signal of the current frame is greater than or equal to the sum of the length of the first alignment process and the transition length, and the transition length is less than or equal to the maximum absolute value of the inter-channel time difference of the current frame.

任意選択で、実行可能命令は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するとき、プロセッサに対して、以下のステップ、すなわち、
遅延アライメント処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張するステップであり、
第2の処理長は、前のフレームのチャンネル間時間差及び第2のアライメント処理長に基づいて決定され、第2の処理長は、第2のアライメント処理長未満である、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor to perform the following steps:
To obtain the second channel signal of the current frame after the delay alignment process, the signal of the second process length in the second channel signal of the current frame is changed to the signal of the second alignment process length. a step of stretching,
A second process length is determined based on the inter-channel time difference of the previous frame and a second alignment process length, wherein the second process length is less than the second alignment process length, to perform the step used to command.

任意選択で、第2の処理長は、第2のアライメント処理長と前のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2の処理長の信号の開始点は、第2のアライメント処理長の信号の開始点の後に位置し、第2の処理長の信号の開始点と第2のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the starting point of the second alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第2のアライメント処理長以上である。 Optionally, the starting point of the signal of the second alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame and The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the second alignment process length.

任意選択で、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第2のプリセット長に等しく、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第2のプリセット長と第2のアライメント処理長との和に等しい。 Optionally, a length between the start of the signal of the second alignment process length and the start of the second channel signal of the current frame is equal to the second preset length and the first alignment process length is equal to the sum of the second preset length and the second alignment process length.

任意選択で、第1のアライメント処理長は、現在のフレームのフレーム長以下であり、第1のアライメント処理長は、プリセット長であるか、或いは、第1のアライメント処理長は、以下の式を満たし、

Figure 2023085339000005
L_next_targetは第1のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length is a preset length; fill,
Figure 2023085339000005
L_next_target is the first alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第2のアライメント処理長は、現在のフレームのフレーム長以下であり、第2のアライメント処理長は、プリセット長であるか、或いは、第2のアライメント処理長は、以下の式を満たし、

Figure 2023085339000006
L_pre_targetは第2のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the second alignment process length is less than or equal to the frame length of the current frame, and the second alignment process length is a preset length; fill,
Figure 2023085339000006
L_pre_target is the length of the second alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000007
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is less than or equal to the frame length of the current frame, and the process length of the delayed alignment process is a preset length; fill,
Figure 2023085339000007
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

この出願の実施形態は、ステレオコーデックのデコーダ側に適用されるステレオ信号処理方法を提供し、当該方法は、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を含む。
An embodiment of this application provides a stereo signal processing method applied at the decoder side of a stereo codec, the method comprising:
determining the inter-channel time difference of the current frame based on the received codestream, wherein the inter-channel time difference of the current frame is the difference between the first channel signal of the current frame and the second channel signal of the current frame; a step, which is the time difference between
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay recovery processing, performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, the second channel signal being on the same channel as the target channel signal of the previous frame.

この出願において提供される方法によれば、現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延回復処理は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して実行され、遅延回復処理は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して実行される。したがって、現在のフレームの遅延回復処理は、実際のチャンネル間時間差に基づいて実行でき、それにより、より良好なアライメント効果を確保し、現在のフレームのチャンネル間時間差が強制的にゼロに設定されるので、遅延回復処理の後の現在のフレームの2つのチャンネルの間の相関成分がオフセットできず、その結果、時間領域ダウンミックスの後の現在のフレームの二次チャンネル信号のエネルギーが増加し、復号化信号品質に影響を与えるという従来技術の問題を回避する。 According to the method provided in this application, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame, the delay recovery process is The delay recovery process is performed on the first channel signal of the current frame based on the inter-channel time difference of the frame, and the delay recovery process is performed on the second channel signal of the current frame based on the inter-channel time difference of the previous frame. executed. Therefore, the current frame's delay recovery process can be performed based on the actual inter-channel time difference, thereby ensuring a better alignment effect, and the current frame's inter-channel time difference is forced to zero. So the correlation component between the two channels of the current frame after delay recovery processing cannot be offset, and as a result, the energy of the secondary channel signal of the current frame after time domain downmixing increases and the decoding avoiding the prior art problem of affecting signal quality.

任意選択で、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行することは、
遅延回復処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張し、
第3の処理長は、現在のフレームのチャンネル間時間差及び第3のアライメント処理長に基づいて決定され、第3の処理長は、第3のアライメント処理長未満であることを含む。
Optionally, performing delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame comprises:
The signal of the third processing length in the first channel signal of the current frame is combined with the signal of the third alignment processing length to obtain the first channel signal of the current frame after delay recovery processing. stretch,
A third process length is determined based on the inter-channel time difference of the current frame and a third alignment process length, wherein the third process length includes being less than the third alignment process length.

任意選択で、第3の処理長は、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、第3のアライメント処理長の信号の開始点の後に位置し、第3の処理長の信号の開始点と第3のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the starting point of the third alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上である。 Optionally, the starting point of the signal of the third processing length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame and The length between the start point of the signal of the process length and the end point of the first channel signal of the current frame is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame That's it.

任意選択で、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行することは、
遅延回復処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮し、
第4の処理長は、前のフレームのチャンネル間時間差及び第4のアライメント処理長に基づいて決定され、第4の処理長は、第4のアライメント処理長よりも大きいことを含む。
Optionally, performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame comprises:
The signal of the fourth processing length in the second channel signal of the current frame is combined with the signal of the fourth alignment processing length to obtain the second channel signal of the current frame after delay recovery processing. compress,
A fourth process length is determined based on the inter-channel time difference of the previous frame and a fourth alignment process length, wherein the fourth process length is greater than the fourth alignment process length.

任意選択で、第4の処理長は、前のフレームのチャンネル間時間差の絶対値と第4のアライメント処理長との和である。 Optionally, the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length.

任意選択で、第4の処理長の信号の開始点は、第4のアライメント処理長の信号の開始点の前に位置し、第4の処理長の信号の開始点と第4のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the fourth process length is located before the starting point of the signal of the fourth alignment process length, such that the starting point of the signal of the fourth process length and the fourth alignment process length is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第4のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第4のアライメント処理長以上である。 Optionally, the starting point of the signal of the fourth alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the fourth alignment process length.

任意選択で、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第4のプリセット長に等しく、第3のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第4のプリセット長と第4のアライメント処理長との和に等しい。 Optionally, the length between the starting point of the signal of the fourth alignment process length and the starting point of the second channel signal of the current frame is equal to the fourth preset length and the third alignment process length is equal to the sum of the fourth preset length and the fourth alignment process length.

任意選択で、第3のアライメント処理長は、プリセット長であるか、或いは、第3のアライメント処理長は、以下の式を満たし、

Figure 2023085339000008
L2_next_targetは第3のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the third alignment process length is a preset length, or the third alignment process length satisfies the formula:
Figure 2023085339000008
L2_next_target is the length of the third alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第4のアライメント処理長は、プリセット長であるか、或いは、第4のアライメント処理長は、以下の式を満たし、

Figure 2023085339000009
L2_pre_targetは第4のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the fourth alignment process length is a preset length, or the fourth alignment process length satisfies the formula:
Figure 2023085339000009
L2_pre_target is the length of the fourth alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delay alignment process.

任意選択で、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000010
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is a preset length, or the process length of the delayed alignment process satisfies the formula:
Figure 2023085339000010
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

この出願の実施形態は、上記の方法において提供されるいずれかのステレオ信号処理方法を実行及び実現し得るステレオ信号処理装置を提供する。 Embodiments of this application provide a stereo signal processing apparatus capable of executing and realizing any stereo signal processing method provided in the above methods.

可能な設計では、ステレオ信号処理装置は、複数の機能モジュールを含み、例えば、上記において提供されるいずれかのステレオ信号処理方法を実現するように構成された処理ユニット及びトランシーバユニットを含む。したがって、現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延回復処理は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して実行され、遅延回復処理は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して実行される。したがって、現在のフレームの遅延回復処理は、実際のチャンネル間時間差に基づいて実行でき、それにより、より良好なアライメント効果を確保し、現在のフレームのチャンネル間時間差が強制的にゼロに設定されるので、遅延回復処理の後の現在のフレームの2つのチャンネルの間の相関成分がオフセットできず、その結果、時間領域ダウンミックスの後の現在のフレームの二次チャンネル信号のエネルギーが増加し、復号化信号品質に影響を与えるという従来技術の問題を回避する。 In a possible design, the stereo signal processing apparatus comprises a plurality of functional modules, eg processing units and transceiver units configured to implement any of the stereo signal processing methods provided above. Therefore, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame previous to the current frame, the delay recovery process determines the current frame time difference based on the inter-channel time difference of the current frame. A delay recovery process is performed on the second channel signal of the current frame based on the inter-channel time difference of the previous frame. Therefore, the current frame's delay recovery process can be performed based on the actual inter-channel time difference, thereby ensuring a better alignment effect, and the current frame's inter-channel time difference is forced to zero. So the correlation component between the two channels of the current frame after delay recovery processing cannot be offset, and as a result, the energy of the secondary channel signal of the current frame after time domain downmixing increases and the decoding avoiding the prior art problem of affecting signal quality.

この出願の実施形態は、ステレオ信号処理装置を提供し、当該装置は、プロセッサ及びメモリを含み、メモリは実行可能命令を記憶し、実行可能命令は、プロセッサに対して、以下のステップ、すなわち、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される。
An embodiment of this application provides a stereo signal processing apparatus, the apparatus including a processor and a memory, the memory storing executable instructions, the executable instructions instructing the processor to perform the following steps:
determining the inter-channel time difference of the current frame based on the received codestream, wherein the inter-channel time difference of the current frame is the difference between the first channel signal of the current frame and the second channel signal of the current frame; a step, which is the time difference between
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay recovery processing, performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, a second channel signal, on the same channel as the target channel signal of the previous frame, is used to command the steps to be performed.

任意選択で、実行可能命令は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行するとき、プロセッサに対して、以下のステップ、すなわち、
遅延回復処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張するステップであり、
第3の処理長は、現在のフレームのチャンネル間時間差及び第3のアライメント処理長に基づいて決定され、第3の処理長は、第3のアライメント処理長未満である、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame, instruct the processor to perform the following steps:
The signal of the third processing length in the first channel signal of the current frame is combined with the signal of the third alignment processing length to obtain the first channel signal of the current frame after delay recovery processing. a step of stretching,
A third process length is determined based on the inter-channel time difference of the current frame and a third alignment process length, wherein the third process length is less than the third alignment process length, to perform step used to command.

任意選択で、第3の処理長は、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、第3のアライメント処理長の信号の開始点の後に位置し、第3の処理長の信号の開始点と第3のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the starting point of the third alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上である。 Optionally, the starting point of the signal of the third processing length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame and The length between the start point of the signal of the process length and the end point of the first channel signal of the current frame is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame That's it.

任意選択で、実行可能命令は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するとき、プロセッサに対して、以下のステップ、すなわち、
遅延回復処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮するステップであり、
第4の処理長は、前のフレームのチャンネル間時間差及び第4のアライメント処理長に基づいて決定され、第4の処理長は、第4のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor to perform the following steps:
The signal of the fourth processing length in the second channel signal of the current frame is combined with the signal of the fourth alignment processing length to obtain the second channel signal of the current frame after delay recovery processing. a step of compressing;
A fourth process length is determined based on the inter-channel time difference of the previous frame and a fourth alignment process length, wherein the fourth process length is greater than the fourth alignment process length, so as to perform step used to command.

任意選択で、第4の処理長は、前のフレームのチャンネル間時間差の絶対値と第4のアライメント処理長との和である。 Optionally, the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length.

この出願の実施形態は、コンピュータ記憶媒体を更に提供し、当該記憶媒体は、ソフトウェアプログラムを記憶し、ソフトウェアプログラムが1つ以上のプロセッサにより読み取られて実行されたとき、上記の設計のうちいずれか1つにおいて提供されるステレオ信号処理方法が実現され得る。 Embodiments of the present application further provide a computer storage medium that stores a software program and any of the above designs when the software program is read and executed by one or more processors. A stereo signal processing method provided in one may be implemented.

この出願の実施形態は、システムを更に提供する。当該システムは、上記の設計のうちいずれか1つにおいて提供されるステレオ信号処理装置を含む。任意選択で、当該システムは、この出願の実施形態において提供される解決策におけるステレオ信号処理装置と相互作用する他のデバイスを更に含んでもよい。 Embodiments of this application further provide a system. The system includes a stereo signal processor provided in any one of the above designs. Optionally, the system may further include other devices interacting with the stereo signal processor in the solutions provided in the embodiments of this application.

この出願の実施形態は、命令を含むコンピュータプログラムプロダクトを更に提供する。コンピュータプログラムプロダクトがコンピュータ上で動作するとき、コンピュータは、上記の態様における方法を実行する。 An embodiment of this application further provides a computer program product comprising instructions. When the computer program product runs on a computer, the computer performs the methods in the above aspects.

この出願の実施形態によるステレオ信号処理方法の概略フローチャートである。1 is a schematic flowchart of a stereo signal processing method according to an embodiment of this application; この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理方法の概略図である。1 is a schematic diagram of a stereo signal processing method according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理装置の概略構造図である。1 is a schematic structural diagram of a stereo signal processing device according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理装置の概略構造図である。1 is a schematic structural diagram of a stereo signal processing device according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理装置の概略構造図である。1 is a schematic structural diagram of a stereo signal processing device according to an embodiment of this application; FIG. この出願の実施形態によるステレオ信号処理装置の概略構造図である。1 is a schematic structural diagram of a stereo signal processing device according to an embodiment of this application; FIG.

以下に、添付図面を参照して、この出願について詳細に更に説明する。 Below, this application is further described in detail with reference to the accompanying drawings.

この出願の実施形態は、オーディオ信号、特にステレオ信号の符号化及び復号化に適用可能である。現在、ステレオ信号符号化は、主に、以下のプロセス、すなわち、時間領域前処理、遅延推定及び符号化、遅延アライメント、時間領域分析、ダウンミックスパラメータ抽出及び符号化、時間領域ダウンミックス処理、ダウンミックス信号符号化等を含む。オーディオ信号の復号化プロセスは、オーディオ信号の符号化プロセスと反対でもよく、詳細はここでは説明しない。 Embodiments of this application are applicable to the encoding and decoding of audio signals, in particular stereo signals. Currently, stereo signal coding mainly consists of the following processes: time domain preprocessing, delay estimation and encoding, delay alignment, time domain analysis, downmix parameter extraction and encoding, time domain downmix processing, down Including mixed signal coding. The audio signal decoding process may be the opposite of the audio signal encoding process, and the details are not described here.

符号化プロセスは単なる例に過ぎず、実際の符号化プロセスは変化してもよい。これは、この出願の実施形態では限定されない。この出願の実施形態では、遅延アライメントが主に処理される。以下に、遅延アライメントについて詳細に説明する。さらに、符号化プロセスの他のステップについては、従来技術における説明を参照する。詳細はここでは一つずつ説明しない。 The encoding process is only an example and the actual encoding process may vary. This is not a limitation in the embodiments of this application. In the embodiments of this application, delay alignment is primarily dealt with. Delay alignment is described in detail below. In addition, reference is made to the description in the prior art for other steps of the encoding process. The details will not be described here one by one.

この出願の実施形態では、ステレオ信号の各フレームは、左チャンネル信号及び右チャンネル信号を含み、フレーム長はNであり、Nは0より大きい正整数である。 In the embodiments of this application, each frame of the stereo signal includes a left channel signal and a right channel signal, and has a frame length of N, where N is a positive integer greater than zero.

図1は、この出願の実施形態によるステレオ信号処理方法の概略フローチャートである。 FIG. 1 is a schematic flowchart of a stereo signal processing method according to an embodiment of this application.

図1を参照すると、当該方法は、以下のステップを含む。 Referring to FIG. 1, the method includes the following steps.

ステップ101:現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に対して遅延推定を実行し、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である。 Step 101: Perform delay estimation on the stereo signal of the current frame to determine the inter-channel time difference of the current frame, and the inter-channel time difference of the current frame is the first channel signal of the current frame. is the time difference between the second channel signal of the current frame.

ステップ102:現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行し、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある。 Step 102: If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame of the current frame, the first channel signal of the current frame is based on the inter-channel time difference of the current frame. perform delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, and perform delay alignment processing on the first channel signal of the current frame A target channel signal, the second channel signal is on the same channel as the target channel signal of the previous frame.

現在のフレームの前のフレーム及び現在のフレームは、2つの隣接するフレームであり、時系列において連続する。 The frame before the current frame and the current frame are two adjacent frames and are consecutive in time sequence.

ステップ101において、現在のフレームに対して遅延推定を実行するプロセスは以下の通りでもよい。 In step 101, the process of performing delay estimation for the current frame may be as follows.

ステップ1:現在のフレームの左チャンネル信号及び右チャンネル信号に対して時間領域前処理を実行する。 Step 1: Perform time-domain preprocessing on the left and right channel signals of the current frame.

ステレオ信号のサンプリングレートが16KHzである場合、ステレオ信号の1つのフレームの持続時間は20msであり、フレーム長はNとして記され、N=320であり、すなわち、フレーム長は320個のサンプリング点である。現在のフレームのステレオ信号は、現在のフレームの左チャンネル信号と、現在のフレームの右チャンネル信号とを含み、現在のフレームの左チャンネル信号はxL(n)として記され、現在のフレームの右チャンネル信号はxR(n)として記され、nはサンプリング点シーケンス番号であり、n=0,1,...,N-1である。 If the sampling rate of the stereo signal is 16KHz, the duration of one frame of the stereo signal is 20ms, the frame length is noted as N, N=320, that is, the frame length is 320 sampling points. be. The current frame stereo signal includes the current frame left channel signal and the current frame right channel signal, where the current frame left channel signal is denoted as x L (n) and the current frame right channel signal is denoted as x L (n). The channel signal is denoted as x R (n), where n is the sampling point sequence number and n=0,1,...,N-1.

現在のフレームの左チャンネル信号及び右チャンネル信号に対して時間領域前処理を実行することは、現在のフレームの前処理された左チャンネル信号及び前処理された右チャンネル信号を取得するために、現在のフレームの左チャンネル信号及び右チャンネル信号に対して高域フィルタリング処理を実行し、現在のフレームの前処理された左チャンネル信号はxL_HP(n)として記され、現在のフレームの処理された右チャンネル信号はxR_HP(n)として記され、nはサンプリング点シーケンス番号であり、n=0,1,...,N-1であることを具体的に含む。高域フィルタリング処理は、カットオフ周波数20Hzを有する無限インパルス応答(Infinite Impulse Response, IIR)フィルタでもよく、或いは、他のタイプのフィルタにより実行されてもよい。例えば、サンプリングレート16KHz及び対応するカットオフ周波数20Hzを有する高域フィルタの伝達関数は以下の通りであり、

Figure 2023085339000011
b0=0.994461788958195であり、b1=-1.988923577916390であり、b2=0.994461788958195であり、a1=1.988892905899653であり、a2=-0.988954249933127であり、zはZ変換の変換ファクタである。対応して、時間領域フィルタリングの後に取得される信号は、
Figure 2023085339000012
である。 Performing time-domain preprocessing on the left channel signal and the right channel signal of the current frame is to obtain a preprocessed left channel signal and a preprocessed right channel signal of the current frame. , the preprocessed left channel signal of the current frame is denoted as x L_HP (n), and the processed right channel signal of the current frame is denoted as x L_HP (n). The channel signal is denoted as x R_HP (n), where n is the sampling point sequence number, specifically including n=0,1,...,N-1. The high-pass filtering process may be an Infinite Impulse Response (IIR) filter with a cutoff frequency of 20 Hz, or may be performed by other types of filters. For example, the transfer function of a high-pass filter with a sampling rate of 16KHz and a corresponding cutoff frequency of 20Hz is:
Figure 2023085339000011
b 0 =0.994461788958195, b 1 =-1.988923577916390, b 2 =0.994461788958195, a 1 =1.988892905899653, a 2 =-0.988954249933127, z is the transform factor for the Z transform. Correspondingly, the signal obtained after time domain filtering is
Figure 2023085339000012
is.

現在のフレームの左チャンネル信号及び右チャンネル信号に対する時間領域前処理は必須ではない点に留意すべきである。時間領域前処理ステップが存在しない場合、遅延推定及び遅延アライメント処理に使用される左チャンネル信号及び右チャンネル信号が、元のステレオ信号における左チャンネル信号及び右チャンネル信号である。ここで、元のステレオ信号における左チャンネル信号及び右チャンネル信号は、アナログ・デジタル(Analog to Digital, A/D)変換の後に取得される、収集されたパルス符号変調(Pulse Code Modulation, PCM)信号である。さらに、この出願のこの実施形態では、信号のサンプリングレートは、さらに、8KHz、16KHz、32KHz、44.1KHz、48KHz等でもよい。これは、この出願のこの実施形態では限定されない。 It should be noted that time domain pre-processing for the left and right channel signals of the current frame is not mandatory. If there is no time-domain preprocessing step, the left and right channel signals used for delay estimation and delay alignment processing are the left and right channel signals in the original stereo signal. Here, the left and right channel signals in the original stereo signal are the collected Pulse Code Modulation (PCM) signals obtained after Analog to Digital (A/D) conversion. is. Further, in this embodiment of this application, the sampling rate of the signal may also be 8 KHz, 16 KHz, 32 KHz, 44.1 KHz, 48 KHz, and so on. This is not a limitation in this embodiment of this application.

現在のフレームの前処理された左チャンネル信号は、

Figure 2023085339000013
として記され、現在のフレームの前処理された右チャンネル信号は、
Figure 2023085339000014
として記され、nはサンプリング点シーケンス番号であり、n=0,1,...,N-1である。 The preprocessed left channel signal of the current frame is
Figure 2023085339000013
, and the preprocessed right channel signal of the current frame is
Figure 2023085339000014
where n is the sampling point sequence number, n=0,1,...,N-1.

さらに、前処理は、この出願のこの実施形態に記載の高域フィルタリング処理に加えて、プリエンファシス処理のような他の処理方式でもよい。これは、この出願のこの実施形態では限定されない。 Further, the pre-processing may be other processing schemes such as pre-emphasis processing in addition to the high-pass filtering processing described in this embodiment of this application. This is not a limitation in this embodiment of this application.

ステップ2:現在のフレームのチャンネル間時間差を取得するために、現在のフレームの前処理された左チャンネル信号及び前処理された右チャンネル信号に基づいて遅延推定を実行する。 Step 2: Perform delay estimation based on the preprocessed left channel signal and the preprocessed right channel signal of the current frame to obtain the inter-channel time difference of the current frame.

例えば、左チャンネルと右チャンネルとの間の相互相関係数は、現在のフレームの前処理された左チャンネル信号及び前処理された右チャンネル信号に基づいて計算されてもよい。次いで、交差相関係数の最大値が決定され、現在のフレームのチャンネル間時間差は、交差相関係数の最大値に基づいて決定される。 For example, the cross-correlation coefficient between left and right channels may be calculated based on the preprocessed left channel signal and the preprocessed right channel signal of the current frame. A maximum value of the cross-correlation coefficient is then determined, and an inter-channel time difference for the current frame is determined based on the maximum value of the cross-correlation coefficient.

具体的には、Tmaxは現在のサンプリングレートにおけるチャンネル間時間差の最大値に対応し、Tminは現在のサンプリングレートにおけるチャンネル間時間差の最小値に対応する。Tmax及びTminはプリセット実数であり、TmaxはTminよりも大きい。この出願のこの実施形態では、サンプリングレートが16KHzであるとき、Tmax=40であり、Tmin=-40である。サンプリングレートが32KHzであるとき、Tmax=80であり、Tmin=-80である。他のサンプリングレートの場合、Tmax及びTminの値は更に記載されない。 Specifically, T max corresponds to the maximum inter-channel time difference at the current sampling rate, and T min corresponds to the minimum inter-channel time difference at the current sampling rate. Tmax and Tmin are preset real numbers and Tmax is greater than Tmin . In this embodiment of this application, T max =40 and T min =−40 when the sampling rate is 16 KHz. When the sampling rate is 32 KHz, T max =80 and T min =-80. For other sampling rates the values of Tmax and Tmin are not further stated.

左チャンネルと右チャンネルとの間の相互相関係数は、以下の方式で計算されてもよい。 A cross-correlation coefficient between the left and right channels may be calculated in the following manner.

Tminが0以下であり、Tmaxが0よりも大きい場合、Tmin≦i≦0の範囲内で、左チャンネルと右チャンネルとの間の相互相関係数は以下の式を満たす。

Figure 2023085339000015
When T min is less than or equal to 0 and T max is greater than 0, the cross-correlation coefficient between the left and right channels satisfies the following formula within T min ≤ i ≤ 0.
Figure 2023085339000015

0<i≦Tmaxの範囲内で、左チャンネルと右チャンネルとの間の相互相関係数は以下の式を満たし、

Figure 2023085339000016
Nはフレーム長であり、
Figure 2023085339000017
は現在のフレームの前処理された左チャンネル信号であり、
Figure 2023085339000018
は現在のフレームの前処理された右チャンネル信号であり、c(i)は左チャンネルと右チャンネルとの間の相互相関係数であり、iは相互相関係数のインデックス値である。 Within 0 < i ≤ T max , the cross-correlation coefficient between the left and right channels satisfies the following equation,
Figure 2023085339000016
N is the frame length,
Figure 2023085339000017
is the preprocessed left channel signal of the current frame, and
Figure 2023085339000018
is the preprocessed right channel signal of the current frame, c(i) is the cross-correlation coefficient between left and right channels, and i is the index value of the cross-correlation coefficient.

Tminが0以下であり、Tmaxが0以下である場合、Tmin≦i≦Tmaxの範囲内で、左チャンネルと右チャンネルとの間の相互相関係数は以下の式を満たし、

Figure 2023085339000019
Nはフレーム長であり、
Figure 2023085339000020
は現在のフレームの前処理された左チャンネル信号であり、
Figure 2023085339000021
は現在のフレームの前処理された右チャンネル信号であり、c(i)は左チャンネルと右チャンネルとの間の相互相関係数であり、iは相互相関係数のインデックス値である。 When Tmin is less than or equal to 0 and Tmax is less than or equal to 0 , within the range of Tmin≤i≤Tmax , the cross-correlation coefficient between the left channel and the right channel satisfies the following formula,
Figure 2023085339000019
N is the frame length,
Figure 2023085339000020
is the preprocessed left channel signal of the current frame, and
Figure 2023085339000021
is the preprocessed right channel signal of the current frame, c(i) is the cross-correlation coefficient between left and right channels, and i is the index value of the cross-correlation coefficient.

設定されたTminが0よりも大きく、設定されたTmaxが0よりも大きい場合、Tmin<i≦Tmaxの範囲内で、左チャンネルと右チャンネルとの間の相互相関係数は以下の式を満たし、

Figure 2023085339000022
Nはフレーム長であり、
Figure 2023085339000023
は現在のフレームの前処理された左チャンネル信号であり、
Figure 2023085339000024
は現在のフレームの前処理された右チャンネル信号であり、c(i)は左チャンネルと右チャンネルとの間の相互相関係数であり、iは相互相関係数のインデックス値である。 When the set T min is greater than 0 and the set T max is greater than 0, within the range T min < i ≤ T max , the cross-correlation coefficient between the left and right channels is satisfies the formula of
Figure 2023085339000022
N is the frame length,
Figure 2023085339000023
is the preprocessed left channel signal of the current frame, and
Figure 2023085339000024
is the preprocessed right channel signal of the current frame, c(i) is the cross-correlation coefficient between left and right channels, and i is the index value of the cross-correlation coefficient.

最後に、相互相関係数の取得された最大値に対応するインデックス値が、現在のフレームのチャンネル間時間差として使用される。 Finally, the index value corresponding to the maximum obtained value of the cross-correlation coefficient is used as the inter-channel time difference of the current frame.

上記の説明を参照して、この出願のこの実施形態では、Tmaxが40に等しく、Tminが-40に等しいとき、左チャンネルと右チャンネルとの間の相互相関係数c(i)の最大値がTmin≦i≦Tmaxの範囲内で検索され、相互相関係数の取得された最大値に対応するインデックス値が、現在のフレームのチャンネル間時間差として使用され、これはcur_itdとして記される。 With reference to the discussion above, in this embodiment of this application, when T max equals 40 and T min equals −40, the cross-correlation coefficient c(i) between the left and right channels is The maximum value is searched within T min ≤ i ≤ T max and the index value corresponding to the obtained maximum value of the cross-correlation coefficient is used as the inter-channel time difference for the current frame, which is noted as cur_itd. be done.

現在のフレームのチャンネル間時間差が推定された後に、量子化及び符号化が、現在のフレームの推定されたチャンネル間時間差に対して実行され、量子化されたコードインデックスがコードストリームに書き込まれ、コードストリームがデコーダ側に送信される。任意選択で、量子化されて符号化された値が、現在のフレームのチャンネル間時間差として使用される。 After the current frame's inter-channel time difference is estimated, quantization and encoding are performed on the current frame's estimated inter-channel time difference, the quantized code indices are written to the code stream, and the code A stream is sent to the decoder side. Optionally, the quantized and encoded value is used as the inter-channel time difference for the current frame.

上記の遅延推定方法に加えて、現在のフレームのチャンネル間時間差は、代替として、他の遅延推定方法に従って決定されてもよい。例えば、左チャンネルと右チャンネルとの間の相互相関係数は、現在のフレームの前処理された左チャンネル信号及び前処理された右チャンネル信号又は現在のフレームの左チャンネル信号及び右チャンネル信号に基づいて計算される。次いで、左チャンネルと右チャンネルとの間の平滑化された相互相関係数を取得するために、長期の平滑化処理が、第1のM1個のオーディオフレーム(M1は1以上の整数である)の左チャンネルと右チャンネルとの間の相互相関係数と、現在のフレームの左チャンネルと右チャンネルとの間の計算された相互相関係数とに基づいて実行される。次いで、左チャンネルと右チャンネルとの間の平滑化された相互相関係数の最大値が、Tmin≦i≦Tmaxの範囲内で検索され、最大値に対応するインデックス値が取得され、現在のフレームのチャンネル間時間差として使用される。他の例では、フレーム間平滑化処理は、代替として、第1のM2個のオーディオフレーム(M2は1以上の整数である)のチャンネル間時間差と、現在のフレームの推定されたチャンネル間時間差とに基づいて実行されてもよく、平滑化されたチャンネル間時間差が、現在のフレームのチャンネル間時間差として使用される。 In addition to the delay estimation methods described above, the inter-channel time difference of the current frame may alternatively be determined according to other delay estimation methods. For example, the cross-correlation coefficient between the left channel and the right channel is based on the preprocessed left channel signal and the preprocessed right channel signal of the current frame or the left channel signal and the right channel signal of the current frame. calculated by Then, a long-term smoothing process is performed on the first M1 audio frames (M1 is an integer greater than or equal to 1) to obtain a smoothed cross-correlation coefficient between the left and right channels. and the calculated cross-correlation coefficient between the left and right channels of the current frame. Then, the maximum value of the smoothed cross-correlation coefficient between the left channel and the right channel is searched within the range of T min ≤ i ≤ T max , the index value corresponding to the maximum value is obtained, and now is used as the channel-to-channel time difference between frames. In another example, the inter-frame smoothing process alternatively combines the inter-channel time difference of the first M2 audio frames (where M2 is an integer greater than or equal to 1) and the estimated inter-channel time difference of the current frame. and the smoothed inter-channel time difference is used as the inter-channel time difference of the current frame.

この出願のこの実施形態では、現在のフレームの推定されたチャンネル間時間差は、現在のフレームの最終的に決定されたチャンネル間時間差として使用されるが、現在のフレームのチャンネル間時間差を推定するための方法は、上記の方法を含むが、これに限定されない点に留意すべきである。 In this embodiment of this application, the estimated inter-channel time difference of the current frame is used as the final determined inter-channel time difference of the current frame, whereas in order to estimate the inter-channel time difference of the current frame It should be noted that the methods of include, but are not limited to, the methods described above.

ステップ102において、符号は、正符号(+)又は負符号(-)を示してもよい。この出願のこの実施形態では、前のフレームは、現在のフレームの前に位置し、現在のフレームに隣接する。 In step 102, the sign may indicate a plus sign (+) or a minus sign (-). In this embodiment of this application, the previous frame is located before and adjacent to the current frame.

現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延アライメント処理は、現在のフレームの第1のチャンネル信号及び第2のチャンネル信号に対して別々に実行されてもよい。説明を容易にするために、以下では、現在のフレームの第1のチャンネル信号に対応するチャンネルは第1のチャンネルと呼ばれ、現在のフレームの第2のチャンネル信号に対応するチャンネルは第2のチャンネルと呼ばれる。第1のチャンネルは、現在のフレームのターゲットチャンネルであり、さらに、次のフレームのターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの指示ターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの前のフレームのターゲットチャンネル以外の他のチャンネルと呼ばれてもよい点に留意すべきである。対応して、第2のチャンネルは、現在のフレームの基準チャンネルであり、第2のチャンネルは、ステレオ信号の2つのチャンネル内にあり且つ前のフレームのターゲットチャンネルと同じであるチャンネルであり、さらに、前のフレームのターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの指示基準チャンネルと呼ばれてもよく、或いは、現在のフレームのターゲットチャンネル以外のチャンネルと呼ばれてもよい。例えば、前のフレームのターゲットチャンネルが左チャンネルである場合、第1のチャンネル信号は現在のフレーム内の右チャンネル信号であり、第2のチャンネル信号は現在のフレーム内の左チャンネル信号である。前のフレームのターゲットチャンネルが右チャンネルである場合、第1のチャンネル信号は現在のフレーム内の左チャンネル信号であり、第2のチャンネル信号は現在のフレーム内の右チャンネル信号である。 When it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame, the delay alignment process is applied to the first channel signal and the second channel signal of the current frame. may be run separately. For ease of explanation, hereinafter the channel corresponding to the first channel signal of the current frame will be referred to as the first channel, and the channel corresponding to the second channel signal of the current frame will be referred to as the second channel. called a channel. The first channel is the target channel of the current frame, and may also be called the target channel of the next frame, or the designated target channel of the current frame, or the target channel of the current frame. It should be noted that other channels than the target channel of the frame before the frame may be called. Correspondingly, the second channel is the reference channel of the current frame, the second channel is the channel within the two channels of the stereo signal and the same as the target channel of the previous frame, and , may be called the target channel of the previous frame, or may be called the designated reference channel of the current frame, or may be called a channel other than the target channel of the current frame. For example, if the target channel in the previous frame is the left channel, the first channel signal is the right channel signal in the current frame and the second channel signal is the left channel signal in the current frame. If the target channel in the previous frame is the right channel, the first channel signal is the left channel signal in the current frame and the second channel signal is the right channel signal in the current frame.

この出願のこの実施形態では、ターゲットチャンネル及び基準チャンネルは専門用語である。具体的には、チャンネル間時間差に基づいて遅延アライメントを実行するための既存のアルゴリズムでは、一方のチャンネルが左チャンネル及び右チャンネルから選択される必要があり、遅延アライメント処理は、選択されたチャンネルの信号に対して実行される。このチャンネルはターゲットチャンネルと呼ばれる。他方のチャンネルは、ターゲットチャンネルに対して遅延アライメント処理を実行するための基準として使用され、基準チャンネルと呼ばれる。この出願のこの実施形態で提案される方法では、現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なると決定されたとき、遅延アライメント処理が双方のチャンネルに対して実行される必要がある。したがって、現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なると決定されたとき、第1のチャンネルは、広義の現在のフレームのターゲットチャンネルであり、遅延アライメント処理が、現在のフレームのターゲットチャンネルに対して実行される必要があり、第2のチャンネルは、広義の現在のフレームの基準チャンネルであり、遅延アライメント処理がまた、現在のフレームの基準チャンネルに対して実行される必要がある。 In this embodiment of this application, target channel and reference channel are terms of art. Specifically, existing algorithms for performing delay alignment based on inter-channel time difference require that one channel be selected from the left and right channels, and the delay alignment process Executed on the signal. This channel is called the target channel. The other channel is used as a reference for performing delay alignment processing on the target channel and is called the reference channel. In the method proposed in this embodiment of this application, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame, the delay alignment process is applied to both channels. must be executed. Therefore, when it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame, the first channel is the target channel of the current frame in the broad sense, and the delay alignment process but needs to be performed against the target channel of the current frame, the second channel is the reference channel of the current frame in the broad sense, and the delay alignment process is also performed against the reference channel of the current frame need to be executed.

任意選択で、この出願のこの実施形態では、前のフレームのターゲットチャンネル及び基準チャンネルは、第1のチャンネル及び第2のチャンネルを決定するために、以下の方式で決定されてもよい。前のフレームのチャンネル間時間差が0未満である場合、前のフレームのターゲットチャンネルが左チャンネルであると考えられてもよい。第2のチャンネルは、ステレオ信号の2つのチャンネル内の、前のフレームのターゲットチャンネルと同じチャンネルであるので、第2のチャンネルは左チャンネルであり、第1のチャンネルは右チャンネルである。前のフレームのチャンネル間時間差が0以上である場合、前のフレームのターゲットチャンネルが右チャンネルであると考えられてもよい。第2のチャンネルは、ステレオ信号の2つのチャンネル内の、前のフレームのターゲットチャンネルと同じチャンネルであるので、第2のチャンネルは右チャンネルであり、第1のチャンネルは左チャンネルである。 Optionally, in this embodiment of this application, the target and reference channels of the previous frame may be determined in the following manner to determine the first and second channels. If the inter-channel time difference of the previous frame is less than 0, it may be considered that the target channel of the previous frame is the left channel. The second channel is the same channel as the target channel of the previous frame in the two channels of the stereo signal, so the second channel is the left channel and the first channel is the right channel. If the inter-channel time difference of the previous frame is greater than or equal to 0, it may be considered that the target channel of the previous frame is the right channel. The second channel is the same channel as the target channel of the previous frame in the two channels of the stereo signal, so the second channel is the right channel and the first channel is the left channel.

任意選択で、この出願のこの実施形態では、現在のフレームのターゲットチャンネル及び基準チャンネルは、代替として、第1のチャンネル及び第2のチャンネルを決定するために、以下の方式で決定されてもよい。現在のフレームのチャンネル間時間差が0以上であると決定されたとき、現在のフレームのターゲットチャンネルが右チャンネルであり、すなわち、第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであると考えられてもよい。現在のフレームのチャンネル間時間差が0未満であると決定されたとき、現在のフレームのターゲットチャンネルが左チャンネルであり、すなわち、第1のチャンネルが左チャンネルであり、第2のチャンネルが右チャンネルであると考えられてもよい。 Optionally, in this embodiment of this application, the target channel and reference channel of the current frame may alternatively be determined in the following manner to determine the first and second channels . When the inter-channel time difference of the current frame is determined to be greater than or equal to 0, the target channel of the current frame is the right channel, i.e. the first channel is the right channel and the second channel is the left channel. It may be considered that there is. When the inter-channel time difference of the current frame is determined to be less than 0, the target channel of the current frame is the left channel, i.e. the first channel is the left channel and the second channel is the right channel. It may be considered that there is.

任意選択で、この出願のこの実施形態では、前のフレームのターゲットチャンネル及び基準チャンネルは、第1のチャンネル及び第2のチャンネルを決定するために、前のフレームの取得されたターゲットチャンネルインデックス又は基準チャンネルインデックスに基づいて直接決定されてもよい。 Optionally, in this embodiment of this application, the target channel and reference channel of the previous frame are the obtained target channel index or reference of the previous frame to determine the first channel and the second channel. It may be determined directly based on the channel index.

この出願のこの実施形態では、第1のチャンネル信号及び第2のチャンネル信号に対して遅延アライメント処理を実行するための複数の方法が存在し、これらは以下に別々に記載される。 In this embodiment of this application, there are multiple methods for performing delay alignment processing on the first channel signal and the second channel signal, which are described separately below.

1.現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行する。 1. Perform delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame.

具体的には、現在のフレームの第1のチャンネル信号内の第1の処理長の信号は、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号を取得するために、第1のアライメント処理長の信号に圧縮される。第1の処理長は、現在のフレームのチャンネル間時間差及び第1のアライメント処理長に基づいて決定され、第1の処理長は、第1のアライメント処理長よりも大きい。 Specifically, the signal of the first processing length in the first channel signal of the current frame is subjected to the first alignment to obtain the first channel signal of the current frame after delay alignment processing. Compressed to process length signal. The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, where the first process length is greater than the first alignment process length.

この出願のこの実施形態では、第1の処理長は、現在のフレームのチャンネル間時間差の絶対値と第1のアライメント処理長との和でもよい。 In this embodiment of this application, the first process length may be the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length.

この出願のこの実施形態では、第1のアライメント処理長は、L_next_targetにより表されてもよい。第1のアライメント処理長は、現在のフレームのフレーム長以下であり、第1のアライメント処理長は、プリセット長でもよく、或いは、他の方式で決定されてもよい。第1のアライメント処理長がプリセット長であるとき、第1のアライメント処理長は、L、L/2、L/3、又はL以下のいずれかの長さでもよく、Lは遅延アライメント処理の処理長である。遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、すなわち、Lは、現在のサンプリングレートにおいて対応するフレーム長N以下であり且つチャンネル間時間差の絶対値の最大値よりも大きいいずれかのプリセット正整数である。例えば、L=290又はL=200である。この出願のこの実施形態では、Lは、異なるサンプリングレートについて異なる値に設定されてもよく、或いは、一様な値でもよい。一般的に、値は、当業者の経験に基づいて予め設定されてもよい。例えば、サンプリングレートが16KHzであるとき、Lは290に設定される。この場合、この出願のこの実施形態では、L_next_target=L/2=145である。 In this embodiment of this application, the first alignment length may be represented by L_next_target. The first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length may be a preset length or determined in some other manner. When the first alignment process length is the preset length, the first alignment process length may be L, L/2, L/3, or any length less than or equal to L, where L is the length of the delayed alignment process is long. The processing length of the delay alignment process is less than or equal to the frame length of the current frame, i.e., L is any value less than or equal to the corresponding frame length N at the current sampling rate and greater than the maximum absolute value of the inter-channel time difference. is some preset positive integer. For example, L=290 or L=200. In this embodiment of this application, L may be set to different values for different sampling rates, or may be a uniform value. In general, the values may be preset based on the experience of those skilled in the art. For example, L is set to 290 when the sampling rate is 16KHz. In this case, L_next_target=L/2=145 in this embodiment of this application.

さらに、この出願のこの実施形態では、第1の処理長の信号の開始点は、第1のアライメント処理長の信号の開始点の前に位置し、第1の処理長の信号の開始点と第1のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Further, in this embodiment of this application, the starting point of the signal of the first treatment length is located before the starting point of the signal of the first alignment treatment length and is aligned with the starting point of the signal of the first treatment length. The length between the starting point of the signal of the first alignment process length is the absolute value of the inter-channel time difference of the current frame.

この出願のこの実施形態では、現在のフレームのチャンネル間時間差はcur_itdであり、abs(cur_itd)は現在のフレームのチャンネル間時間差の絶対値を表す。説明を容易にするために、abs(cur_itd)は、以下の説明では第1の遅延長と呼ばれる。前のフレームのチャンネル間時間差はprev_itdであり、abs(prev_itd)は前のフレームのチャンネル間時間差の絶対値を表す。説明を容易にするために、abs(prev_itd)は、以下の説明では第2の遅延長と呼ばれる。 In this embodiment of this application, the inter-channel time difference of the current frame is cur_itd, and abs(cur_itd) represents the absolute value of the inter-channel time difference of the current frame. For ease of explanation, abs(cur_itd) will be referred to as the first delay length in the following discussion. The inter-channel time difference of the previous frame is prev_itd, and abs(prev_itd) represents the absolute value of the inter-channel time difference of the previous frame. For ease of explanation, abs(prev_itd) is referred to as the second delay length in the following discussion.

第1の処理長の信号の具体的な位置は、異なる実際の条件に基づいて決定されてもよく、これらは、以下に別々に記載される。 The specific position of the signal of the first processing length may be determined based on different actual conditions, which are described separately below.

第1の可能な場合: First possible case:

図2は、この出願の実施形態による遅延アライメント処理の概略図である。図2において、説明を容易にするために、遅延アライメント処理の前の第1のチャンネル信号内の点と、同じ位置にある圧縮処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。例えば、現在のフレームの第1のチャンネル信号の開始点の双方の座標は、遅延アライメント処理の前及び圧縮処理の後にB1として記される。 FIG. 2 is a schematic diagram of a delay alignment process according to embodiments of this application. In FIG. 2, for ease of explanation, the point in the first channel signal before the delay alignment process and the point in the first channel signal after the compression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same. For example, both coordinates of the starting point of the first channel signal of the current frame are marked as B1 before the delay alignment process and after the compression process.

図2を参照すると、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点B1に位置する。第1のアライメント処理長の信号の終了点はC1であり、開始点B1から終了点C1までの長さは、第1のアライメント処理長に等しく、B1=0であり、C1=B1+L_next_target-1である。 Referring to FIG. 2, the starting point of the signal of the first alignment process length is located at the starting point B1 of the first channel signal of the current frame. The end point of the signal of the first alignment process length is C1, the length from the start point B1 to the end point C1 is equal to the first alignment process length, B1=0, C1=B1+L_next_target- 1.

第1の処理長の信号の開始点A1は、第1のアライメント処理長の信号の開始点B1の前に位置し、第1の処理長の信号の開始点A1と第1のアライメント処理長の信号の開始点B1との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。すなわち、A1=B1-abs(cur_itd)である。第1の処理長の信号の終了点はC1であり、これは、第1のアライメント処理長の信号の終了点の座標と同じである。 The starting point A1 of the signal of the first processing length is positioned before the starting point B1 of the signal of the first alignment processing length, and the starting point A1 of the signal of the first processing length and the starting point A1 of the signal of the first alignment processing length The length between the start point B1 of the signal is the absolute value of the inter-channel time difference of the current frame. That is, A1=B1-abs(cur_itd). The end point of the signal of the first process length is C1, which is the same coordinate as the end point of the signal of the first alignment process length.

遅延アライメント処理のプロセスにおいて、第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の開始点B1から始まる第1のアライメント処理長の信号として使用される。さらに、現在のフレームの第1のチャンネル信号内の非圧縮信号は不変のままであり、すなわち、遅延アライメント処理の前の第1のチャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1までの信号として直接使用される。E1は現在のフレームの第1のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E1=N-1である。 In the process of delay alignment processing, signals from point A1 to point C1 in the first channel signal are compressed into signals of the first alignment processing length, and the compressed signals of the first alignment processing length are compressed into It is used as the signal of the first alignment process length starting from the starting point B1 in the later first channel signal. Furthermore, the uncompressed signal in the first channel signal of the current frame remains unchanged, i.e. the signal from point C1+1 to point E1 in the first channel signal before the delay alignment process is It is used directly as the signal from point C1+1 to point E1 in the first channel signal after compression processing. E1 is the end point of the first channel signal of the current frame, the frame length of the current frame is N, and E1=N-1.

この出願のこの実施形態では、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成されてもよく、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、E2は現在のフレームの第2のチャンネル信号の終了点であり、E2=E1であり、G1=E1+abs(cur_itd)である。 In this embodiment of this application, the first delay length signal is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the second channel signal of the current frame. and the reconstructed signal of the first delay length is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, and E2 is the current frame's The end point of the second channel signal, E2=E1 and G1=E1+abs(cur_itd).

どのように第1の遅延長の信号を具体的に再構成するかは、この出願のこの実施形態では限定されない点に留意すべきである。例えば、現在のフレームの第2のチャンネル信号内の点E1-abs(cur_itd)+1から点E1までの信号が、第1の遅延長の再構成された信号として直接使用されてもよい。 It should be noted that how the signal of the first delay length is specifically reconstructed is not limited in this embodiment of this application. For example, the signal from point E1-abs(cur_itd)+1 to point E1 in the second channel signal of the current frame may be directly used as the reconstructed signal of the first delay length.

最後に、圧縮処理の後の第1のチャンネル信号内で、点F1から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号の開始点は点F1であり、終了点G1である。点F1は、現在のフレームの第1のチャンネル信号の開始点の後に位置し、点F1と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第1の遅延長である。点G1は、現在のフレームの第1のチャンネル信号の終了点の後に位置し、点G1と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1の遅延長である。すなわち、F1=B1+abs(cur_itd)である。 Finally, in the first channel signal after compression processing, N sampling points starting from point F1 are used as the first channel signal of the current frame after delay alignment processing. That is, the starting point of the first channel signal of the current frame after delay alignment processing is point F1 and the ending point is G1. The point F1 is located after the starting point of the first channel signal of the current frame, and the length between the point F1 and the starting point of the first channel signal of the current frame is the first delay length be. The point G1 is located after the end point of the first channel signal of the current frame, and the length between the point G1 and the end point of the first channel signal of the current frame is the first delay length be. That is, F1=B1+abs(cur_itd).

例えば、図2を参照すると、現在のフレームの第1のチャンネルが左チャンネルであり、第2のチャンネルが右チャンネルである場合、左チャンネル上の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の左チャンネル信号内の第1のアライメント処理長の信号(すなわち、圧縮処理の後の左チャンネル信号内の点B1から点C1までの信号)として使用される。次いで、圧縮処理の前の左チャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の現在のフレームの左チャンネル信号内の点C1+1から点E1までの信号として直接使用される。次いで、第1の遅延長の信号は、現在のフレームの右チャンネル信号内の終了点の前の第1の遅延長の信号(すなわち、現在のフレームの右チャンネル信号内の点E1-abs(cur_itd)+1から点E1までの信号)に基づいて再構成され、第1の遅延長の再構成された信号は、圧縮処理の後の左チャンネル信号内の終了点の後の第1の遅延長の信号(すなわち、圧縮処理の後の左チャンネル信号内の点E1+1から点G1までの信号)として使用される。最後に、圧縮処理の後に取得された信号内の点F1から点G1までの信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号として使用される。 For example, referring to FIG. 2, if the first channel of the current frame is the left channel and the second channel is the right channel, then the signal from point A1 to point C1 on the left channel is the first The compressed signal of the first alignment length is compressed to the signal of the alignment length, and the compressed signal of the first alignment length is the signal of the first alignment length within the left channel signal after compression (i.e., the left channel signal after compression). signal from point B1 to point C1). The signal from point C1+1 to point E1 in the left channel signal before compression is then directly used as the signal from point C1+1 to point E1 in the left channel signal of the current frame after compression. used. Then, the signal of the first delay length is the signal of the first delay length before the end point in the right channel signal of the current frame (i.e., the point E1-abs(cur_itd )+1 to point E1), the reconstructed signal of the first delay length is the first delay length after the end point in the left channel signal after compression processing. (ie, signals from point E1+1 to point G1 in the left channel signal after compression processing). Finally, the signal from point F1 to point G1 in the signal obtained after compression processing is used as the left channel signal of the current frame after delay alignment processing.

現在のフレームの第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであるときは、上記の説明を参照する。詳細はここでは説明しない。 If the first channel of the current frame is the right channel and the second channel is the left channel, refer to the above description. Details are not described here.

第2の可能な場合: Second possible case:

図3は、この出願の実施形態によるステレオ信号処理の概略図である。図3において、説明を容易にするために、遅延アライメント処理の前の第1のチャンネル信号内の点と、同じ位置にある圧縮処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。例えば、現在のフレームの第1のチャンネル信号の開始点の双方の座標は、遅延アライメント処理の前及び圧縮処理の後にB1として記される。 FIG. 3 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 3, for ease of explanation, a point in the first channel signal before the delay alignment process and a point in the first channel signal after the compression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same. For example, both coordinates of the starting point of the first channel signal of the current frame are marked as B1 before the delay alignment process and after the compression process.

図3を参照すると、第1のアライメント処理長の信号の開始点D1は、現在のフレームの第1のチャンネル信号の開始点B1の後に位置し、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の終了点E1との間の長さは、第1のアライメント処理長以上である。第1のアライメント処理長の信号の終了点はC1であり、開始点D1から終了点C1までの長さは、第1のアライメント処理長に等しく、C1=D1+L_next_target-1である。 Referring to FIG. 3, the starting point D1 of the first alignment length signal is located after the starting point B1 of the first channel signal of the current frame, and the starting point D1 of the first alignment length signal is located after the starting point B1 of the first channel signal in the current frame. and the end point E1 of the first channel signal of the current frame is greater than or equal to the first alignment processing length. The end point of the signal of the first alignment process length is C1, and the length from the start point D1 to the end point C1 is equal to the first alignment process length, C1=D1+L_next_target-1.

図3において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB1=0であり、現在のフレームの第1のチャンネル信号の終了点はE1=N-1である。第1のアライメント処理長の開始点D1は、現在のフレームの第1のチャンネル信号の開始点B1の後に位置し、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の終了点E1との間の長さは、第1のアライメント処理長以上である。説明を容易にするために、第1のアライメント処理長の信号の開始点D1と第1のチャンネル信号の開始点B1との間の長さは、以下では第1のプリセット長と呼ばれる。第1のプリセット長は、0よりも大きく、現在のフレームのフレーム長と第1のアライメント処理長との間の差分値以下であり、実際の状況に基づいて具体的に設定されてもよい。詳細はここでは説明しない。 In FIG. 3, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B1=0, and the ending point of the first channel signal of the current frame is E1=N. -1. The starting point D1 of the first alignment process length is located after the starting point B1 of the first channel signal of the current frame, and the starting point D1 of the signal of the first alignment process length and the first channel signal of the current frame The length between the end point E1 of the channel signal is longer than or equal to the first alignment processing length. For ease of explanation, the length between the starting point D1 of the signal of the first alignment process length and the starting point B1 of the first channel signal is hereinafter referred to as the first preset length. The first preset length is greater than 0 and less than or equal to the difference value between the frame length of the current frame and the first alignment processing length, and may be specifically set according to the actual situation. Details are not described here.

第1の処理長の信号の開始点A1は、第1のアライメント処理長の信号の開始点D1の前に位置し、第1の処理長の信号の開始点A1と第1のアライメント処理長の信号の開始点D1との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。すなわち、第1の処理長の信号の開始点はA1=D1-abs(cur_itd)であり、第1の処理長の信号の終了点はC1であり、これは、第1のアライメント処理長の信号の終了点の座標と同じである。 The starting point A1 of the signal of the first processing length is located before the starting point D1 of the signal of the first alignment processing length, and the starting point A1 of the signal of the first processing length and the starting point A1 of the signal of the first alignment processing length are located before the starting point D1 of the signal of the first alignment processing length. The length between the start point D1 of the signal is the absolute value of the inter-channel time difference of the current frame. That is, the starting point of the signal of the first treatment length is A1=D1-abs(cur_itd), the ending point of the signal of the first treatment length is C1, which is the signal of the first alignment treatment length is the same as the coordinates of the end point of

この出願のこの実施形態では、遅延アライメント処理のプロセスにおいて、信号圧縮中に、第1のチャンネル信号内にあり且つ第1の処理長の信号の開始点の前に位置する第1のプリセット長の信号は、圧縮処理の後の第1のチャンネル信号の開始点から始まる第1のプリセット長の信号として直接使用されてもよい。すなわち、第1のチャンネル信号内の点H1から点A1-1までの信号は、圧縮された第1のチャンネル信号内の点B1から点D1-1までの信号として使用され、H1=B1-abs(cur_itd)である。 In this embodiment of this application, in the process of delay alignment processing, during signal compression, a first preset length of a first preset length that is within the first channel signal and is located before the start of the signal of the first processing length. The signal may be used directly as a first preset length signal starting from the starting point of the first channel signal after compression processing. That is, the signal from point H1 to point A1-1 in the first channel signal is used as the signal from point B1 to point D1-1 in the compressed first channel signal, H1=B1-abs (cur_itd).

信号圧縮プロセスにおいて、第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から始まる第1のアライメント処理長の信号として使用される。すなわち、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から点C1までの信号として直接使用される。 In the signal compression process, the signal from point A1 to point C1 in the first channel signal is compressed into a signal of the first alignment process length, and the compressed signal of the first alignment process length is the signal after the compression process. It is used as the first alignment length signal starting from point D1 in the first channel signal. That is, the compressed signal of the first alignment processing length is directly used as the signal from point D1 to point C1 in the first channel signal after compression processing.

さらに、現在のフレームの第1のチャンネル信号内の非圧縮信号は不変のままであり、すなわち、遅延アライメント処理の前の現在のフレームの第1のチャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1までの信号として直接使用される。E1は現在のフレームの第1のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E1=N-1である。 Furthermore, the uncompressed signal in the first channel signal of the current frame remains unchanged, i.e. from point C1+1 to point E1 in the first channel signal of the current frame before delay alignment processing. is directly used as the signal from point C1+1 to point E1 in the first channel signal after compression processing. E1 is the end point of the first channel signal of the current frame, the frame length of the current frame is N, and E1=N-1.

この出願のこの実施形態では、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成されてもよく、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、E2は現在のフレームの第2のチャンネル信号の終了点であり、E2=E1であり、G1=E1+abs(cur_itd)である。 In this embodiment of this application, the first delay length signal is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the second channel signal of the current frame. and the reconstructed signal of the first delay length is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, and E2 is the current frame's The end point of the second channel signal, E2=E1 and G1=E1+abs(cur_itd).

どのように第1の遅延長の信号を具体的に再構成するかは、この出願のこの実施形態では限定されない点に留意すべきである。例えば、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号が、第1の遅延長の再構成された信号として直接使用されてもよい。 It should be noted that how the signal of the first delay length is specifically reconstructed is not limited in this embodiment of this application. For example, the signal from point E2-abs(cur_itd)+1 to point E2 in the second channel signal of the current frame may be directly used as the reconstructed signal of the first delay length.

最後に、圧縮処理の後の第1のチャンネル信号内で、点F1から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号の開始点は点F1であり、終了点G1であり、F1=B1+abs(cur_itd)であり、G1=E1+abs(cur_itd)である。 Finally, in the first channel signal after compression processing, N sampling points starting from point F1 are used as the first channel signal of the current frame after delay alignment processing. That is, the starting point of the first channel signal of the current frame after delay alignment processing is point F1, the ending point is G1, F1=B1+abs(cur_itd), G1=E1+abs(cur_itd ).

例えば、図3を参照すると、現在のフレームの第1のチャンネルは左チャンネルであり、第2のチャンネルは右チャンネルである。左チャンネル信号内の点H1から点A1-1までの信号は、圧縮処理の後の左チャンネル信号内の点B1から点D1-1までの信号として直接使用される。左チャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の左チャンネル信号内の点D1から点C1までの信号として使用される。次いで、現在のフレームの左チャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の左チャンネル信号内の点C1+1から点E1までの信号として直接使用される。次いで、第1の遅延長の信号は、現在のフレームの右チャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成され、第1の遅延長の再構成された信号は、圧縮処理の後の左チャンネル信号内の点E1+1から点G1までの信号として使用される。最後に、圧縮処理の後に取得された信号内の点F1から点G1までの信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号として使用される。 For example, referring to FIG. 3, the first channel of the current frame is the left channel and the second channel is the right channel. The signals from point H1 to point A1-1 in the left channel signal are directly used as the signals from point B1 to point D1-1 in the left channel signal after compression processing. The signal from point A1 to point C1 in the left channel signal is compressed to the signal of the first alignment process length, and the compressed signal of the first alignment process length is the signal from point D1 in the left channel signal after the compression process. to point C1. Then the signal from point C1+1 to point E1 in the left channel signal of the current frame is directly used as the signal from point C1+1 to point E1 in the left channel signal after compression processing. Then the signal of the first delay length is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the right channel signal of the current frame, and the signal of the first delay length is The reconstructed signal is used as the signal from point E1+1 to point G1 in the left channel signal after compression processing. Finally, the signal from point F1 to point G1 in the signal obtained after compression processing is used as the left channel signal of the current frame after delay alignment processing.

現在のフレームの第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであるときは、上記の説明を参照する。詳細はここでは説明しない。 If the first channel of the current frame is the right channel and the second channel is the left channel, refer to the above description. Details are not described here.

第3の可能な場合: Third possible case:

図4は、この出願の実施形態によるステレオ信号処理の概略図である。図4において、説明を容易にするために、遅延アライメント処理の前の第1のチャンネル信号内の点と、同じ位置にある圧縮処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。例えば、現在のフレームの第1のチャンネル信号の終了点の双方の座標は、遅延アライメント処理の前及び圧縮処理の後にE1として記される。 FIG. 4 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 4, for ease of explanation, a point in the first channel signal before the delay alignment process and a point in the first channel signal after the compression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same. For example, both coordinates of the end point of the first channel signal of the current frame are marked as E1 before the delay alignment process and after the compression process.

図4において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB1=0であり、現在のフレームの第1のチャンネル信号の終了点はE1=N-1である。第1のアライメント処理長の開始点D1は、現在のフレームの第1のチャンネル信号の開始点B1の前に位置し、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の開始点B1との間の長さは、遷移長以下であり、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の終了点E1との間の長さは、第1のアライメント処理長と遷移長との和以上である。説明を容易にするために、この出願のこの実施形態及び図4において、遷移区間長は、tsにより表される。この場合、D1=B1-tsである。第1のアライメント処理長の信号の終了点はC1であり、開始点D1から終了点C1までの長さは、第1のアライメント処理長に等しく、C1=D1+L_next_target-1である。 In FIG. 4, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B1=0, and the ending point of the first channel signal of the current frame is E1=N. -1. The starting point D1 of the first alignment process length is located before the starting point B1 of the first channel signal of the current frame, and the starting point D1 of the signal of the first alignment process length and the first channel signal of the current frame The length between the starting point B1 of the channel signal of the current frame is less than or equal to the transition length, and the length between the starting point D1 of the signal of the first alignment process length and the ending point E1 of the first channel signal of the current frame The length of is greater than or equal to the sum of the first alignment process length and the transition length. For ease of explanation, in this embodiment of this application and in FIG. 4, the transition interval length is denoted by ts. In this case D1=B1-ts. The end point of the signal of the first alignment process length is C1, and the length from the start point D1 to the end point C1 is equal to the first alignment process length, C1=D1+L_next_target-1.

この出願のこの実施形態では、遷移区間長は、プリセット正整数でもよく、プリセット正整数は、当業者による経験に基づいて設定されてもよい。遷移区間長は、通常では、現在のフレームのチャンネル間時間差の絶対値の最大値以下である。遷移区間長は、代替として、現在のフレームのチャンネル間時間差に基づいて計算されてもよい。例えば、遷移区間長はabs(cur_itd)/2である。 In this embodiment of this application, the transition interval length may be a preset positive integer, and the preset positive integer may be set based on experience by those skilled in the art. The transition interval length is typically less than or equal to the maximum absolute value of the inter-channel time difference of the current frame. The transition interval length may alternatively be calculated based on the inter-channel time difference of the current frame. For example, the transition interval length is abs(cur_itd)/2.

第1の処理長の信号の開始点A1は、第1のアライメント処理長の信号の開始点D1の前に位置し、第1の処理長の信号の開始点A1と第1のアライメント処理長の信号の開始点D1との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。すなわち、第1の処理長の信号の開始点はA1=D1-abs(cur_itd)であり、第1の処理長の信号の終了点はC1であり、これは、第1のアライメント処理長の信号の終了点の座標と同じである。 The starting point A1 of the signal of the first processing length is located before the starting point D1 of the signal of the first alignment processing length, and the starting point A1 of the signal of the first processing length and the starting point A1 of the signal of the first alignment processing length are located before the starting point D1 of the signal of the first alignment processing length. The length between the start point D1 of the signal is the absolute value of the inter-channel time difference of the current frame. That is, the starting point of the signal of the first treatment length is A1=D1-abs(cur_itd), the ending point of the signal of the first treatment length is C1, which is the signal of the first alignment treatment length is the same as the coordinates of the end point of

図4において、第1のアライメント処理長の信号の開始点D1と、現在のフレームの第1のチャンネル信号の開始点B1との間の長さが遷移長に等しいことが、説明のための例として使用される点に留意すべきである。第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の開始点B1との間の長さは、代替として、遷移長未満でもよく、D1<B1であり、D1>B1である。遷移長未満である場合については、ここでの説明を参照する。詳細は更に説明しない。 In FIG. 4, it is an illustrative example that the length between the starting point D1 of the signal of the first alignment process length and the starting point B1 of the first channel signal of the current frame is equal to the transition length. Note that it is used as The length between the starting point D1 of the signal of the first alignment process length and the starting point B1 of the first channel signal of the current frame may alternatively be less than the transition length, D1<B1, and D1 >B1. For the case of less than the transition length, see the description here. No further details are given.

遅延アライメント処理のプロセスにおいて、第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から始まる第1のアライメント処理長の信号として使用される。すなわち、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から点C1までの信号として使用される。 In the process of delay alignment processing, signals from point A1 to point C1 in the first channel signal are compressed into signals of the first alignment processing length, and the compressed signals of the first alignment processing length are compressed into It is used as the signal of the first alignment process length starting from point D1 in the later first channel signal. That is, the compressed signal of the first alignment processing length is used as the signal from point D1 to point C1 in the first channel signal after compression processing.

さらに、現在のフレームの第1のチャンネル信号内の非圧縮信号は不変のままであり、すなわち、遅延アライメント処理の前の現在のフレームの第1のチャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1までの信号として直接使用される。E1は現在のフレームの第1のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E1=N-1である。 Furthermore, the uncompressed signal in the first channel signal of the current frame remains unchanged, i.e. from point C1+1 to point E1 in the first channel signal of the current frame before delay alignment processing. is directly used as the signal from point C1+1 to point E1 in the first channel signal after compression processing. E1 is the end point of the first channel signal of the current frame, the frame length of the current frame is N, and E1=N-1.

この出願のこの実施形態では、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成されてもよく、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、E2は現在のフレームの第2のチャンネル信号の終了点であり、E2=E1であり、G1=E1+abs(cur_itd)である。 In this embodiment of this application, the first delay length signal is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the second channel signal of the current frame. and the reconstructed signal of the first delay length is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, and E2 is the current frame's The end point of the second channel signal, E2=E1 and G1=E1+abs(cur_itd).

どのように第1の遅延長の信号を具体的に再構成するかは、この出願のこの実施形態では限定されない点に留意すべきである。 It should be noted that how the signal of the first delay length is specifically reconstructed is not limited in this embodiment of this application.

最後に、圧縮処理の後の第1のチャンネル信号内で、点F1から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号の開始点は点F1であり、終了点G1であり、F1=B1+abs(cur_itd)である。 Finally, in the first channel signal after compression processing, N sampling points starting from point F1 are used as the first channel signal of the current frame after delay alignment processing. That is, the starting point of the first channel signal of the current frame after delay alignment processing is point F1, the ending point is G1, and F1=B1+abs(cur_itd).

例えば、図4を参照すると、現在のフレームの第1のチャンネルは左チャンネルであり、第2のチャンネルは右チャンネルである。左チャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の左チャンネル信号内の点D1から点C1までの信号として使用される。次いで、現在のフレームの左チャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の左チャンネル信号内の点C1+1から点E1までの信号として直接使用される。次いで、第1の遅延長の信号は、現在のフレームの右チャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成され、第1の遅延長の再構成された信号は、圧縮処理の後の左チャンネル信号内の点E1+1から点G1までの信号として使用される。E2は現在のフレームの右チャンネル信号の終了点である。最後に、圧縮処理の後に取得された信号内の点F1から点G1までの信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号として使用される。 For example, referring to FIG. 4, the first channel of the current frame is the left channel and the second channel is the right channel. The signal from point A1 to point C1 in the left channel signal is compressed to the signal of the first alignment process length, and the compressed signal of the first alignment process length is the signal from point D1 in the left channel signal after the compression process. to point C1. Then the signal from point C1+1 to point E1 in the left channel signal of the current frame is directly used as the signal from point C1+1 to point E1 in the left channel signal after compression processing. Then the signal of the first delay length is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the right channel signal of the current frame, and the signal of the first delay length is The reconstructed signal is used as the signal from point E1+1 to point G1 in the left channel signal after compression processing. E2 is the end point of the right channel signal of the current frame. Finally, the signal from point F1 to point G1 in the signal obtained after compression processing is used as the left channel signal of the current frame after delay alignment processing.

現在のフレームの第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであるときは、上記の説明を参照する。詳細はここでは説明しない。 If the first channel of the current frame is the right channel and the second channel is the left channel, refer to the above description. Details are not described here.

任意選択で、実際の信号と手動で再構成された信号との間に平滑化を追加するために、平滑化遷移区間が更に設定されてもよく、平滑化遷移区間の長さはTs2である。平滑化遷移区間の長さは、プリセット正整数に設定されてもよく、平滑化遷移区間の長さと遷移区間長との間の差は、フレーム長と第1のアライメント処理長との間の差以下である。例えば、Ts2は10に設定される。 Optionally, a smoothed transition interval may also be set to add smoothing between the actual signal and the manually reconstructed signal, the length of the smoothed transition interval being Ts2. . The length of the smoothed transition interval may be set to a preset positive integer, and the difference between the length of the smoothed transition interval and the transition interval length is the difference between the frame length and the first alignment process length It is below. For example, Ts2 is set to 10.

この場合、遅延アライメント処理のプロセスにおいて、第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から始まる第1のアライメント処理長の信号として使用される。すなわち、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から点C1までの信号として使用される。 In this case, in the process of delay alignment processing, the signal from point A1 to point C1 in the first channel signal is compressed into a signal of the first alignment processing length, and the compressed signal of the first alignment processing length is It is used as the signal of the first alignment process length starting from the point D1 in the first channel signal after the compression process. That is, the compressed signal of the first alignment processing length is used as the signal from point D1 to point C1 in the first channel signal after compression processing.

さらに、遅延アライメント処理の前の現在のフレームの第1のチャンネル信号内の点C1+1から点E1-Ts2までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1-Ts2までの信号として直接使用される。E1は現在のフレームの第1のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E1=N-1である。平滑化遷移区間の長さの信号は、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)-Ts2+1から点E2-abs(cur_itd)までの信号に基づいて手動で再構成され、平滑化遷移区間の長さの再構成された信号は、圧縮処理の後の第1のチャンネル信号の点E1-Ts2+1から点E1までの信号として使用される。 Furthermore, the signal from point C1+1 to point E1-Ts2 in the first channel signal of the current frame before delay alignment processing is equal to point C1+1 in the first channel signal after compression processing. Used directly as a signal up to points E1-Ts2. E1 is the end point of the first channel signal of the current frame, the frame length of the current frame is N, and E1=N-1. The smoothed transition interval length signal is manually reproduced based on the signal from point E2-abs(cur_itd)-Ts2+1 to point E2-abs(cur_itd) in the second channel signal of the current frame. The reconstructed signal of the length of the smoothed transition interval is used as the signal from point E1-Ts2+1 to point E1 of the first channel signal after compression processing.

この出願のこの実施形態では、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の点E2-abs(cur_itd)+1から点E2までの信号に基づいて手動で再構成されてもよく、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、E2は現在のフレームの第2のチャンネル信号の終了点であり、E2=E1であり、G1=E1+abs(cur_itd)である。 In this embodiment of this application, the first delay length signal is manually reconstructed based on the signal from point E2-abs(cur_itd)+1 to point E2 in the second channel signal of the current frame. and the reconstructed signal of the first delay length is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, and E2 is the current frame's The end point of the second channel signal, E2=E1 and G1=E1+abs(cur_itd).

どのように第1の遅延長の信号及び平滑化遷移区間の長さの信号を具体的に再構成するかは、この出願のこの実施形態では限定されない点に留意すべきである。 It should be noted that how the first delay length signal and the smoothed transition interval length signal are specifically reconstructed is not limited in this embodiment of the application.

第2の可能な場合では、遷移区間長はまた、設定されてもよい点に留意すべきである。遷移区間長を設定するための具体的な方法及びステップ、並びに遷移区間長が設定された後の現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行するプロセスについては、上記の説明を参照する。詳細はここでは説明しない。第2の可能な場合では、遷移区間長及び平滑化遷移区間の長さが更に設定されてもよい。遷移区間長及び平滑化遷移区間の長さを設定するための具体的な方法及びステップ、並びに遷移区間長及び平滑化遷移区間の長さが設定された後の現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行するプロセスについては、上記の説明を参照する。 Note that in the second possible case the transition interval length may also be set. The specific method and steps for setting the transition interval length and the process of performing delay alignment processing on the first channel signal of the current frame after the transition interval length is set are described above. See Details are not described here. In a second possible case, the transition interval length and the smoothed transition interval length may also be set. A specific method and steps for setting the transition interval length and the smoothed transition interval length, and the first channel signal of the current frame after the transition interval length and the smoothed transition interval length are set See the discussion above for the process of performing delayed alignment operations on .

上記の方法では、フレームの間の平滑化は、遷移区間長を加算するか、或いは遷移区間長と平滑化遷移区間の長さとを加算することにより追加され、遅延アライメント処理の後の現在のフレーム内の2つのチャンネル信号の間のアライメントの精度が改善され、符号化品質が改善される。 In the above methods, the smoothing between frames is added by adding the transition interval length, or by adding the transition interval length and the smoothed transition interval length, and the current frame after the delay alignment process. The accuracy of alignment between the two channel signals within is improved and the coding quality is improved.

この出願のこの実施形態では、第1の処理長の信号を圧縮するための方法は、キュービック(cubic)スプライン補間方法を使用することにより信号を圧縮することでもよく、二次(quadratic)スプライン補間方法を使用することにより信号を圧縮することでもよく、リニア補間方法を使用することにより信号を圧縮することでもよく、或いは、二次Bスプライン補間方法又はキュービックBスプライン補間方法のようなBスプライン補間方法を使用することにより信号を圧縮することでもよい点に留意すべきである。具体的な圧縮方法は、この出願のこの実施形態では限定されず、圧縮は、いずれかの技術を使用することにより処理されてもよい。 In this embodiment of this application, the method for compressing the signal of the first processing length may be compressing the signal by using a cubic spline interpolation method, quadratic spline interpolation The signal may be compressed by using a method, the signal may be compressed by using a linear interpolation method, or a B-spline interpolation such as a quadratic B-spline interpolation method or a cubic B-spline interpolation method. It should be noted that the signal may also be compressed by using the method. The specific compression method is not limited in this embodiment of this application and compression may be handled using either technique.

2.前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行する。 2. Perform delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame.

具体的には、第2のチャンネル信号内の第2の処理長の信号は、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号を取得するために、第2のアライメント処理長の信号に伸張される。第2の処理長は、前のフレームのチャンネル間時間差及び第2のアライメント処理長に基づいて決定され、第2の処理長は、第2のアライメント処理長未満である。 Specifically, the signal of the second processing length in the second channel signal is the signal of the second alignment processing length to obtain the second channel signal of the current frame after the delay alignment processing. is stretched to A second process length is determined based on the inter-channel time difference of the previous frame and a second alignment process length, where the second process length is less than the second alignment process length.

この出願のこの実施形態では、第2の処理長は、第2のアライメント処理長と前のフレームのチャンネル間時間差の絶対値との間の差である。この出願の実施形態では、第2のアライメント処理長は、L_pre_targetにより表されてもよい。 In this embodiment of this application, the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame. In embodiments of this application, the second alignment process length may be represented by L_pre_target.

第2のアライメント処理長は、プリセット長でもよく、或いは、他の方式で決定されてもよい。第2のアライメント処理長は、現在のフレームのフレーム長以下である。第2のアライメント処理長がプリセット長であるとき、第2のアライメント処理長は、L、L/2、L/3、又はL以下のいずれかの長さでもよい。Lは、現在のサンプリングレートにおいて対応するフレーム長N以下であり且つチャンネル間時間差の絶対値の最大値よりも大きいいずれかのプリセット正整数である。例えば、L=290又はL=200である。この出願のこの実施形態では、Lは、異なるサンプリングレートについて異なる値に設定されてもよく、或いは、一様な値でもよい。一般的に、値は、当業者の経験に基づいて予め設定されてもよい。例えば、サンプリングレートが16KHzであるとき、Lは290に設定される。この出願のこの実施形態では、L_pre_target=L/2=145である。 The second alignment process length may be a preset length or determined in some other manner. The second alignment process length is less than or equal to the frame length of the current frame. When the second alignment process length is the preset length, the second alignment process length may be L, L/2, L/3, or any length less than or equal to L. L is any preset positive integer less than or equal to the corresponding frame length N at the current sampling rate and greater than the maximum absolute value of the inter-channel time difference. For example, L=290 or L=200. In this embodiment of this application, L may be set to different values for different sampling rates, or may be a uniform value. In general, the values may be preset based on the experience of those skilled in the art. For example, L is set to 290 when the sampling rate is 16KHz. In this embodiment of this application, L_pre_target=L/2=145.

さらに、第2の処理長の信号の開始点は、第2のアライメント処理長の信号の開始点の後に位置し、第2の処理長の信号の開始点と第2のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Further, the starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the signal of the second alignment process length The length to the start point is the absolute value of the inter-channel time difference of the previous frame.

第2の処理長の信号の具体的な位置は、異なる実際の条件に基づいて決定されてもよく、これらは、以下に別々に記載される。 The specific position of the signal of the second processing length may be determined based on different actual conditions, which are described separately below.

第1の可能な場合: First possible case:

図5は、この出願の実施形態によるステレオ信号処理の概略図である。図5において、説明を容易にするために、遅延アライメント処理の前の第2のチャンネル信号内の点と、同じ位置にある伸張処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。例えば、現在のフレームの第2のチャンネル信号の開始点の双方の座標は、遅延アライメント処理の前及び圧縮処理の後にB2として記される。 FIG. 5 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 5, for ease of explanation, a point in the second channel signal before the delay alignment process and a point in the second channel signal after the decompression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same. For example, both coordinates of the starting point of the second channel signal of the current frame are marked as B2 before the delay alignment process and after the compression process.

図5を参照すると、現在のフレームのフレーム長はNであり、現在のフレームの第2のチャンネル信号の開始点はB2=0であり、現在のフレームの第2のチャンネル信号の終了点はE2=N-1である。第2のアライメント処理長の開始点は、現在のフレームの第2のチャンネル信号の開始点B2に位置する。第2のアライメント処理長の信号の終了点はC2であり、開始点B2から終了点C2までの長さは、第2のアライメント処理長に等しく、C2=B2+L_pre_target-1である。 Referring to FIG. 5, the frame length of the current frame is N, the start point of the second channel signal of the current frame is B2=0, and the end point of the second channel signal of the current frame is E2 =N-1. The starting point of the second alignment process length is located at the starting point B2 of the second channel signal of the current frame. The end point of the signal of the second alignment process length is C2, and the length from the start point B2 to the end point C2 is equal to the second alignment process length, C2=B2+L_pre_target-1.

第2の処理長の信号の開始点A2は、第2のアライメント処理長の開始点B2の後に位置し、第2の処理長の信号の開始点A2と第2のアライメント処理長の開始点B2との間の長さは、前のフレームのチャンネル間時間差の絶対値である。第2の処理長の信号の開始点は、A2=B2+abs(prev_itd)であり、第2の処理長の信号の終了点はC2であり、これは、第2のアライメント処理長の信号の終了点の座標と同じである。 The starting point A2 of the signal of the second process length is located after the starting point B2 of the second alignment process length, and the starting point A2 of the signal of the second process length and the starting point B2 of the second alignment process length is the absolute value of the inter-channel time difference of the previous frame. The start point of the signal of the second treatment length is A2=B2+abs(prev_itd) and the end point of the signal of the second treatment length is C2, which is the same as the signal of the second alignment treatment length. Same as the coordinates of the end point.

遅延アライメント処理のプロセスにおいて、第2のチャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の点B2から始まる第2のアライメント処理長の信号として使用される。すなわち、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の開始点B2から点C2までの信号として使用される。 In the process of delayed alignment processing, the signal from point A2 to point C2 in the second channel signal is stretched to the signal of the second alignment length, and the stretched signal of the second alignment length is subjected to the stretch processing. It is used as the signal of the second alignment process length starting from point B2 in the later second channel signal. That is, the decompressed signal of the second alignment processing length is used as the signal from the starting point B2 to the point C2 in the second channel signal after decompression processing.

この出願のこの実施形態では、信号伸張中に、現在のフレームの第2のチャンネル信号の非伸張信号は不変のままでもよく、すなわち、現在のフレームの第2のチャンネル信号内の点C2+1から点E2までの信号は、伸張処理の後の第2のチャンネル信号内の点C2+1から点E2までの信号として直接使用される。E2は現在のフレームの第2のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E2=N-1である。 In this embodiment of this application, the unexpanded signal of the second channel signal of the current frame may remain unchanged during signal expansion, i.e. the point C2+1 in the second channel signal of the current frame to point E2 is directly used as the signal from point C2+1 to point E2 in the second channel signal after decompression. E2 is the end point of the second channel signal of the current frame, the frame length of the current frame is N, and E2=N-1.

最後に、伸張処理の後の第2のチャンネル信号内で、開始点B2から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号の開始点は点B2であり、終了点はE2である。 Finally, in the second channel signal after decompression process, the N sampling points starting from the starting point B2 are used as the second channel signal of the current frame after delay alignment process. That is, the starting point of the second channel signal of the current frame after delay alignment processing is point B2, and the ending point is E2.

例えば、図5を参照すると、現在のフレームの第1のチャンネルは左チャンネルであり、第2のチャンネルは右チャンネルである。現在のフレームの右チャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、伸張処理の後の右チャンネル信号内の点B2から点C2までの信号として使用される。次いで、現在のフレームの右チャンネル信号内の点C2+1から点E2までの信号は、伸張処理の後の右チャンネル信号内の点C2+1から点E2までの信号として直接使用される。最後に、延長処理の後に取得された信号内の点B2から点E2までの信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号として使用される。 For example, referring to FIG. 5, the first channel of the current frame is the left channel and the second channel is the right channel. The signal from point A2 to point C2 in the right channel signal of the current frame is stretched to the signal of the second alignment process length, and the stretched signal of the second alignment process length is the right channel signal after the stretch process. is used as the signal from point B2 to point C2 in Then the signal from point C2+1 to point E2 in the right channel signal of the current frame is directly used as the signal from point C2+1 to point E2 in the right channel signal after the decompression process. Finally, the signal from point B2 to point E2 in the signal obtained after extension processing is used as the right channel signal of the current frame after delay alignment processing.

現在のフレームの第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであるときは、上記の説明を参照する。詳細はここでは説明しない。 If the first channel of the current frame is the right channel and the second channel is the left channel, refer to the above description. Details are not described here.

第2の可能な場合: Second possible case:

図6は、この出願の実施形態によるステレオ信号処理の概略図である。図6において、説明を容易にするために、遅延アライメント処理の前の第2のチャンネル信号内の点と、同じ位置にある伸張処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。 FIG. 6 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 6, for ease of explanation, the point in the second channel signal before the delay alignment process and the point in the second channel signal after the decompression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same.

図6を参照すると、現在のフレームのフレーム長はNであり、現在のフレームの第2のチャンネル信号の開始点はB2=0であり、現在のフレームの第2のチャンネル信号の終了点はE2=N-1である。第2のアライメント処理長の開始点は、現在のフレームの第2のチャンネル信号の開始点B2の後に位置し、第2のアライメント処理長の信号の開始点D2と現在のフレームの第2のチャンネル信号の終了点E2との間の長さは、第2のアライメント処理長以上である。第2のアライメント処理長の信号の終了点は、C2=D2+L_pre_target-1である。説明を容易にするために、第2のアライメント処理長の信号の開始点D2と第2のチャンネル信号の開始点B2との間の長さは、以下では第2のプリセット長と呼ばれる。第2のプリセット長は、0よりも大きく、現在のフレームのフレーム長と第2のアライメント処理長との間の差分値以下でもよく、実際の状況に基づいて具体的に設定されてもよい。詳細はここでは説明しない。 Referring to FIG. 6, the frame length of the current frame is N, the start point of the second channel signal of the current frame is B2=0, and the end point of the second channel signal of the current frame is E2 =N-1. The start point of the second alignment process length is located after the start point B2 of the second channel signal of the current frame, and the start point D2 of the signal of the second alignment process length and the second channel of the current frame The length between the end point E2 of the signal is longer than or equal to the second alignment processing length. The end point of the signal of the second alignment process length is C2=D2+L_pre_target-1. For ease of explanation, the length between the starting point D2 of the signal of the second alignment process length and the starting point B2 of the second channel signal is hereinafter referred to as the second preset length. The second preset length may be greater than 0 and less than or equal to the difference value between the frame length of the current frame and the second alignment processing length, and may be specifically set according to the actual situation. Details are not described here.

第2の処理長の信号の開始点A2は、第2のアライメント処理長の開始点B2の前に位置し、第2の処理長の信号の開始点A2と第2のアライメント処理長の開始点B2との間の長さは、前のフレームのチャンネル間時間差の絶対値である。第2の処理長の信号の開始点はA2=D2+abs(prev_itd)であり、第2の処理長の信号の終了点の座標は、第2のアライメント処理長の信号の終了点の座標と同じであり、すなわち、C2=D2+L_pre_target-1である。 The starting point A2 of the signal of the second process length is positioned before the starting point B2 of the second alignment process length, and the starting point A2 of the signal of the second process length and the starting point of the second alignment process length The length between B2 is the absolute value of the inter-channel time difference of the previous frame. The starting point of the signal of the second processing length is A2=D2+abs(prev_itd), and the coordinates of the ending point of the signal of the second processing length are the coordinates of the ending point of the signal of the second alignment processing length. are the same, ie C2=D2+L_pre_target-1.

遅延アライメント処理のプロセスにおいて、第2のチャンネル信号内のH2=B2+abs(prev_itd)から始まる第2のプリセット長の信号は、伸張処理の後の第2のチャンネル信号内の開始点B2から始まる第2のプリセット長の信号として直接使用される。すなわち、図6を参照すると、現在のフレームの第2のチャンネル信号内の点H2から点A2-1までの信号は、伸張処理の後の第2のチャンネル信号内の点B2から点D2-1までの信号として直接使用される。 In the process of delay alignment processing, the second preset length signal starting from H2=B2+abs(prev_itd) in the second channel signal starts from the starting point B2 in the second channel signal after decompression processing. Used directly as a second preset length signal. That is, referring to FIG. 6, the signal from point H2 to point A2-1 in the second channel signal of the current frame is the signal from point B2 to point D2-1 in the second channel signal after decompression processing. used directly as a signal to

さらに、第2のチャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の点D2から始まる第2のアライメント処理長の信号として使用される。すなわち、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の点D2から点C2までの信号として使用される。 Further, the signal from point A2 to point C2 in the second channel signal is stretched to the signal of the second alignment process length, and the stretched signal of the second alignment process length is the second signal after the stretching process. It is used as the second alignment length signal starting from point D2 in the channel signal. That is, the expanded signal of the second alignment processing length is used as the signal from point D2 to point C2 in the second channel signal after expansion processing.

この出願のこの実施形態では、信号伸張中に、現在のフレームの第2のチャンネル信号内の非伸張信号は不変のままでもよく、すなわち、現在のフレームの第2のチャンネル信号内の点C2+1から点E2までの信号は、伸張処理の後の第2のチャンネル信号内の点C2+1から点E2までの信号として直接使用される。E2は現在のフレームの第2のチャンネル信号の終了点であり、現在のフレームのフレーム長はNであり、E2=N-1である。 In this embodiment of this application, during signal expansion, the unexpanded signal in the second channel signal of the current frame may remain unchanged, i.e. point C2+ The signal from 1 to point E2 is used directly as the signal from point C2+1 to point E2 in the second channel signal after decompression. E2 is the end point of the second channel signal of the current frame, the frame length of the current frame is N, and E2=N-1.

最後に、伸張処理の後の第2のチャンネル信号内で、開始点B2から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号の開始点は点B2であり、終了点はE2である。 Finally, in the second channel signal after decompression process, the N sampling points starting from the starting point B2 are used as the second channel signal of the current frame after delay alignment process. That is, the starting point of the first channel signal of the current frame after delay alignment processing is point B2, and the ending point is E2.

例えば、図6を参照すると、現在のフレームの第1のチャンネルは左チャンネルであり、第2のチャンネルは右チャンネルである。遅延アライメント処理のプロセスにおいて、現在のフレームの右チャンネル信号内の点H2から点A2-1までの信号は、伸張処理の後の右チャンネル信号内の点B2から点D2-1までの信号として直接使用される。現在のフレームの右チャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、新行処理の後の右チャンネル信号内の点D2から点C2までの信号として使用される。次いで、現在のフレームの右チャンネル信号内の点C2+1から点E2までの信号は、伸張処理の後の右チャンネル信号内の点C2+1から点E2までの信号として直接使用される。最後に、伸張処理の後に取得された信号内の点B2から点E2までの信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号として使用される。 For example, referring to FIG. 6, the first channel of the current frame is the left channel and the second channel is the right channel. In the process of delay alignment processing, the signal from point H2 to point A2-1 in the right channel signal of the current frame is directly converted into the signal from point B2 to point D2-1 in the right channel signal after decompression processing. used. The signal from point A2 to point C2 in the right channel signal of the current frame is stretched to the signal of the second alignment process length, and the stretched signal of the second alignment process length is the right channel signal after the newline process. Used as the signal from point D2 to point C2 in the signal. Then the signal from point C2+1 to point E2 in the right channel signal of the current frame is directly used as the signal from point C2+1 to point E2 in the right channel signal after the decompression process. Finally, the signal from point B2 to point E2 in the signal obtained after decompression process is used as the right channel signal of the current frame after delay alignment process.

現在のフレームの第1のチャンネルが右チャンネルであり、第2のチャンネルが左チャンネルであるときは、上記の説明を参照する。詳細はここでは説明しない。 If the first channel of the current frame is the right channel and the second channel is the left channel, refer to the above description. Details are not described here.

この出願のこの実施形態では、第2の処理長の信号を伸張するための方法は、キュービック(cubic)スプライン補間方法を使用することにより信号を伸張することでもよく、二次(quadratic)スプライン補間方法を使用することにより信号を伸張することでもよく、リニア補間方法を使用することにより信号を伸張することでもよく、或いは、二次Bスプライン補間方法又はキュービックBスプライン補間方法のようなBスプライン補間方法を使用することにより信号を伸張することでもよい点に留意すべきである。具体的な伸張方法は、この出願のこの実施形態では限定されず、伸張は、いずれかの技術を使用することにより処理されてもよい。 In this embodiment of this application, the method for stretching the signal of the second processing length may be stretching the signal by using a cubic spline interpolation method, quadratic spline interpolation The signal may be stretched by using a method, the signal may be stretched by using a linear interpolation method, or a B-spline interpolation such as a quadratic B-spline interpolation method or a cubic B-spline interpolation method. It should be noted that the signal may also be stretched by using a method. The specific decompression method is not limited in this embodiment of this application, and decompression may be handled using either technique.

この出願のこの実施形態では、遅延アライメント処理が実行された後に、現在のフレームのチャンネル間時間差のコードインデックスを取得するために、現在のフレームのチャンネル間時間差は更に量子化及び符号化されてもよく、コードインデックスはコードストリームに書き込まれる。現在のフレームのチャンネル間時間差は、代替として、ステップ101において量子化及び符号化されてもよく、或いは、ここで量子化及び符号化されてもよい点に留意すべきである。これは、この出願のこの実施形態では限定されない。 In this embodiment of this application, after the delay alignment process is performed, the inter-channel time difference of the current frame may be further quantized and encoded to obtain the code index of the inter-channel time difference of the current frame. Code indices are often written into the codestream. Note that the inter-channel time difference of the current frame may alternatively be quantized and coded in step 101 or quantized and coded here. This is not a limitation in this embodiment of this application.

具体的には、コードインデックスをコードストリームに書き込むための多くの方法が存在し得る。これは、この出願のこの実施形態では限定されない。例えば、現在のフレームのチャンネル間時間差の絶対値が量子化及び符号化された後に、現在のフレームのチャンネル間時間差の絶対値のコードインデックスがコードストリームに書き込まれ、コードストリームがデコーダ側に送信される。さらに、現在のフレームのターゲットチャンネルのインデックスがターゲットチャンネルインデックスとしてコードストリームに書き込まれるか、或いは、現在のフレームの基準チャンネルのインデックスが基準チャンネルインデックスとしてコードストリームに書き込まれ、コードストリームがデコーダ側に送信される。 Specifically, there may be many ways to write the code indices into the codestream. This is not a limitation in this embodiment of this application. For example, after the absolute value of the inter-channel time difference of the current frame is quantized and encoded, the code index of the absolute value of the inter-channel time difference of the current frame is written into the codestream, and the codestream is sent to the decoder side. be. Further, the index of the target channel of the current frame is written into the codestream as the target channel index, or the index of the reference channel of the current frame is written into the codestream as the reference channel index, and the codestream is sent to the decoder side. be done.

遅延アライメント処理の後の現在のフレームの左チャンネル信号はx’L(n)として記され、遅延アライメント処理の後の現在のフレームの右チャンネル信号はx’R(n)として記され、nはサンプリング点シーケンス番号であり、n=0,1,...,N-1である。現在のフレームのチャンネル間時間差の符号及び前のフレームのチャンネル間時間差の符号に基づいて、遅延アライメント処理の後の第1のチャンネル信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号でもよく、x’L(n)として記され、或いは、遅延アライメント処理の後の第2のチャンネル信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号でもよく、x’L(n)として記される。同様に、遅延アライメント処理の後の第1のチャンネル信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号でもよく、x’R(n)として記され、或いは、遅延アライメント処理の後の第2のチャンネル信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号でもよく、x’R(n)として記される。 The left channel signal of the current frame after delay alignment processing is denoted as x'L (n) and the right channel signal of the current frame after delay alignment processing is denoted as x'R (n), where n is Sampling point sequence number, n=0,1,...,N-1. Based on the sign of the inter-channel time difference of the current frame and the sign of the inter-channel time difference of the previous frame, the first channel signal after delay alignment processing may be the left channel signal of the current frame after delay alignment processing. Often denoted as x'L (n), or the second channel signal after delay alignment processing may be the left channel signal of the current frame after delay alignment processing, denoted as x'L (n) written down. Similarly, the first channel signal after delay alignment processing may be the right channel signal of the current frame after delay alignment processing, denoted as x′ R (n), or The second channel signal may be the right channel signal of the current frame after delay alignment processing and is denoted as x' R (n).

最後に、遅延アライメント処理の後の第1のチャンネル信号及び遅延アライメント処理の後の第2のチャンネル信号が符号化される。 Finally, the first channel signal after delay alignment processing and the second channel signal after delay alignment processing are encoded.

具体的には、遅延アライメント処理の後の第1のチャンネル信号及び遅延アライメント処理の後の第2のチャンネル信号は、既存のステレオ符号化方法を使用することにより符号化されてもよく、符号化されたコードストリームは、デコーダ側に送信される。具体的な符号化方法は、この出願のこの実施形態では限定されない。 Specifically, the first channel signal after delay alignment processing and the second channel signal after delay alignment processing may be encoded by using an existing stereo encoding method, and the encoding The resulting codestream is sent to the decoder side. The specific encoding method is not limited in this embodiment of this application.

任意選択で、この出願のこの実施形態では、第1のアライメント処理長がプリセット長でないとき、以下の式が満たされてもよく、

Figure 2023085339000025
L_next_targetは第1のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長であり、|・|は絶対値をとることを意味する。 Optionally, in this embodiment of this application, when the first alignment process length is not a preset length, the following formula may be satisfied,
Figure 2023085339000025
L_next_target is the length of the first alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, L is the process length of the delayed alignment process, |·| means to take the absolute value.

第2のアライメント処理長がプリセット長でないとき、以下の式が満たされてもよく、

Figure 2023085339000026
L_pre_targetは第2のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。Lは、現在のサンプリングレートにおいて対応するフレーム長N以下であり且つチャンネル間時間差の絶対値の最大値よりも大きいいずれかのプリセット正整数である。例えば、L=290又はL=200である。|・|は絶対値をとることを意味する。 When the second alignment process length is not a preset length, the following equation may be satisfied,
Figure 2023085339000026
L_pre_target is the length of the second alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process. L is any preset positive integer less than or equal to the corresponding frame length N at the current sampling rate and greater than the maximum absolute value of the inter-channel time difference. For example, L=290 or L=200. |·| means taking an absolute value.

任意選択で、この出願のこの実施形態では、遅延アライメント処理の処理長がプリセット長でないとき、以下の式が満たされてもよく、

Figure 2023085339000027
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。例えば、L_initは、隣接するフレームのチャンネル間時間差の間の最大差分値以上であり、現在のフレームのフレーム長以下でもよく、例えば、290又は200である。|・|は絶対値をとることを意味する。 Optionally, in this embodiment of this application, when the process length of the delayed alignment process is not a preset length, the following formula may be satisfied:
Figure 2023085339000027
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process. For example, L_init is greater than or equal to the maximum difference value between the inter-channel time differences of adjacent frames and may be less than or equal to the frame length of the current frame, eg 290 or 200. |·| means taking an absolute value.

MAX_DELAY_CHANGEは、0よりも大きい正整数であり、|Tmax-Tmin|以下でもよい。Tmaxは現在のサンプリングレートにおけるチャンネル間時間差の最大値に対応し、Tminは現在のサンプリングレートにおけるチャンネル間時間差の最小値に対応する。例えば、MAX_DELAY_CHANGEは80、40又は20に等しい。この出願の例では、MAX_DELAY_CHANGEは20でもよい。 MAX_DELAY_CHANGE is a positive integer greater than 0 and may be less than or equal to |T max -T min |. T max corresponds to the maximum inter-channel time difference at the current sampling rate, and T min corresponds to the minimum inter-channel time difference at the current sampling rate. For example, MAX_DELAY_CHANGE equals 80, 40 or 20. In the example of this application, MAX_DELAY_CHANGE may be 20.

以下に、具体的な実施形態を使用することにより説明を提供する。 In the following, explanation is provided by using specific embodiments.

ステップ1:現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に基づいて遅延推定を実行する。 Step 1: Perform delay estimation based on the stereo signal of the current frame to determine the inter-channel time difference of the current frame.

このステップの具体的な内容については、ステップ101を参照する。詳細はここでは再び説明しない。 See step 101 for the specific content of this step. Details are not described here again.

ステップ2:現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行する。 Step 2: Delay with respect to the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame Perform alignment processing.

ステップ3:現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行する。 Step 3: Delay with respect to the second channel signal of the current frame based on the inter-channel time difference of the previous frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame. Perform alignment processing.

ステップ2及びステップ3を参照して、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第2のプリセット長に等しく、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第2のプリセット長と第2のアライメント処理長との和に等しい。さらに、第1のアライメント処理長は式(8)を満たし、第2のアライメント処理長は式(9)を満たす。 Referring to steps 2 and 3, the length between the starting point of the signal of the second alignment process length and the starting point of the second channel signal of the current frame is equal to the second preset length, The length between the starting point of the signal of the first alignment process length and the starting point of the first channel signal of the current frame is equal to the sum of the second preset length and the second alignment process length. Furthermore, the first alignment process length satisfies equation (8), and the second alignment process length satisfies equation (9).

図7(a)は、この出願の実施形態によるステレオ信号処理の概略図である。図7(a)において、説明を容易にするために、遅延アライメント処理の前の第1のチャンネル信号内の点と、同じ位置にある遅延アライメント処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記され、遅延アライメント処理の前の第2のチャンネル信号内の点と、同じ位置にある遅延アライメント処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記される。 FIG. 7(a) is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 7(a), for ease of explanation, a point in the first channel signal before delay alignment processing and a point in the first channel signal after delay alignment processing at the same position. is noted by using the same coordinates, a point in the second channel signal before delay alignment and a point in the second channel signal after delay alignment at the same position are the same It is marked by using coordinates.

現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB1=0であり、現在のフレームの第1のチャンネル信号の終了点はE1=N-1であり、現在のフレームの第2のチャンネル信号の開始点はB2=0であり、現在のフレームの第2のチャンネル信号の終了点はE2=N-1である。第1のアライメント処理長の信号の開始点はD1=D2+L_pre_targetであり、第1のアライメント処理長の信号の終了点はC1=D1+L_next_target-1であり、第1の処理長の信号の開始点はA1=D1-abs(cur_itd)であり、第1の処理長の信号の終了点の座標は、第1のアライメント処理長の信号の終了点の座標と同じであり、すなわち、C1=D1+L_next_target-1である。第2のアライメント処理長の開始点はD2であり、第2のアライメント処理長の終了点はC2=D2+L_pre_target-1である。第2の処理長の信号の開始点はA2=D2+abs(prev_itd)であり、第2の処理長の信号の終了点はC2=D2+L_pre_target-1である。説明を容易にするために、以下では、第2のアライメント処理長の信号の開始点D2と第2のチャンネル信号の開始点B2との間の長さは、第2のプリセット長と呼ばれる。第2のプリセット長は、0よりも大きく、現在のフレームのフレーム長と第2のアライメント処理長との間の差分値以下でもよく、実際の状況に基づいて具体的に設定されてもよい。詳細はここでは説明しない。この場合、図7(a)に示すように、第1の処理長の信号は圧縮され、第2の処理長の信号は伸張される。 The frame length of the current frame is N, the start point of the first channel signal of the current frame is B1=0, and the end point of the first channel signal of the current frame is E1=N-1. , the starting point of the second channel signal of the current frame is B2=0, and the ending point of the second channel signal of the current frame is E2=N-1. The start point of the signal of the first alignment process length is D1=D2+L_pre_target, the end point of the signal of the first alignment process length is C1=D1+L_next_target-1, and the signal of the first alignment process length is The start point is A1=D1-abs(cur_itd) and the coordinates of the end point of the signal of the first treatment length are the same as the coordinates of the end point of the signal of the first alignment treatment length, i.e. C1= D1+L_next_target-1. The start point of the second alignment run length is D2, and the end point of the second alignment run length is C2=D2+L_pre_target-1. The start point of the second process length signal is A2=D2+abs(prev_itd) and the end point of the second process length signal is C2=D2+L_pre_target-1. For ease of explanation, in the following the length between the starting point D2 of the signal of the second alignment process length and the starting point B2 of the second channel signal is called the second preset length. The second preset length may be greater than 0 and less than or equal to the difference value between the frame length of the current frame and the second alignment processing length, and may be specifically set according to the actual situation. Details are not described here. In this case, as shown in FIG. 7A, the signal of the first processing length is compressed and the signal of the second processing length is expanded.

図7(a)を参照すると、第1のチャンネル信号に対して遅延アライメント処理を実行するプロセスにおいて、第1のチャンネル信号内の点H1から点A1-1までの信号は、圧縮処理の後の第1のチャンネル信号内の点B1から点D1-1までの信号として直接使用され、H1=B1-abs(cur_itd)である。現在のフレームの第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から点C1までの信号として使用される。次いで、現在のフレームの第1のチャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1までの信号として直接使用される。次いで、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の終了点E2の前の第1の遅延長の信号に基づいて手動で再構成され、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、G1=E1+abs(cur_itd)-1である。最後に、遅延アライメント処理の後に取得された信号内の点F1から点G1までの信号は、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号として使用され、F1=B1+abs(cur_itd)である。 Referring to FIG. 7(a), in the process of performing delay alignment processing on the first channel signal, the signals from point H1 to point A1-1 in the first channel signal are converted to Directly used as the signal from point B1 to point D1-1 in the first channel signal, H1=B1-abs(cur_itd). The signal from point A1 to point C1 in the first channel signal of the current frame is compressed into a signal of the first alignment process length, and the compressed signal of the first alignment process length is the first channel signal after the compression process. It is used as the signal from point D1 to point C1 in the 1 channel signal. Then the signal from point C1+1 to point E1 in the first channel signal of the current frame is directly used as the signal from point C1+1 to point E1 in the first channel signal after compression processing. be done. Then, the first delay length signal is manually reconstructed based on the first delay length signal before the end point E2 in the second channel signal of the current frame, and the first delay length signal is The reconstructed signal is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, G1=E1+abs(cur_itd)-1. Finally, the signal from point F1 to point G1 in the signal obtained after delay alignment processing is used as the first channel signal of the current frame after delay alignment processing, F1=B1+abs(cur_itd ).

第2のチャンネル信号に対して遅延アライメント処理を実行するプロセスにおいて、第2のチャンネル信号内のH2=B2+abs(prev_itd)から始まる第2のプリセット長の信号は、伸張処理の後の第2のチャンネル信号内の開始点B2から始まる第2のプリセット長の信号として直接使用される。すなわち、図7(a)を参照すると、現在のフレームの第2のチャンネル信号内の点H2から点A2-1までの信号は、伸張処理の後の第2のチャンネル信号内の点B2から点D2-1までの信号として直接使用される。現在のフレームの第2のチャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の点D2から点C2までの信号として使用される。次いで、現在のフレームの第2のチャンネル内の点C2+1から点E2までの信号は、伸張処理の後の第2のチャンネル信号内の点C2+1から点E2までの信号として直接使用される。最後に、遅延アライメント処理の後に取得された信号内の点B2から点E2までの信号は、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号として使用される。 In the process of performing delay alignment processing on the second channel signal, the second preset length signal starting from H2=B2+abs(prev_itd) in the second channel signal is the second is used directly as a signal of the second preset length starting from the starting point B2 in the channel signal of . That is, referring to FIG. 7(a), the signal from point H2 to point A2-1 in the second channel signal of the current frame corresponds to point B2 to point B2 in the second channel signal after decompression processing. Used directly as signals up to D2-1. The signal from point A2 to point C2 in the second channel signal of the current frame is expanded to the signal of the second alignment process length, and the expanded signal of the second alignment process length is the second channel signal after the expansion process. 2 as the signal from point D2 to point C2 in channel signal 2. Then the signal from point C2+1 to point E2 in the second channel of the current frame is directly used as the signal from point C2+1 to point E2 in the second channel signal after decompression processing. be. Finally, the signal from point B2 to point E2 in the signal obtained after delay alignment processing is used as the second channel signal of the current frame after delay alignment processing.

図7(a)を参照すると、この出願のこの実施形態では、第2のアライメント処理長の開始点はまた、第2のチャンネル信号の開始点でもよく、すなわち、D2=B2且つD1=B1+L_pre_targetでもよい。この場合、図7(b)に示すように、第1の処理長の信号は圧縮され、第2の処理長の信号は伸張される。 Referring to FIG. 7(a), in this embodiment of this application, the starting point of the second alignment process length may also be the starting point of the second channel signal, i.e. D2=B2 and D1=B1+ It can be L_pre_target. In this case, as shown in FIG. 7B, the signal of the first processing length is compressed and the signal of the second processing length is expanded.

図7(b)は、この出願の実施形態によるステレオ信号処理の概略図である。図7(b)において、説明を容易にするために、遅延アライメント処理の前の第1のチャンネル信号内の点と、同じ位置にある遅延アライメント処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記され、遅延アライメント処理の前の第2のチャンネル信号内の点と、同じ位置にある遅延アライメント処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記される。 FIG. 7(b) is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 7(b), for ease of explanation, a point in the first channel signal before delay alignment processing and a point in the first channel signal after delay alignment processing at the same position. is noted by using the same coordinates, a point in the second channel signal before delay alignment and a point in the second channel signal after delay alignment at the same position are the same It is marked by using coordinates.

図7(b)において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB1=0であり、現在のフレームの第1のチャンネル信号の終了点はE1=N-1である。第1のアライメント処理長の信号の開始点はD1=B1+L_pre_targetであり、第1のアライメント処理長の信号の終了点はC1=B1+L_pre_target+L_next_target-1であり、第1の処理長の信号の開始点はA1=B1+L_pre_target-abs(cur_itd)であり、第1の処理長の信号の終了点の座標は、第1のアライメント処理長の信号の終了点の座標と同じであり、すなわち、C1=B1+L_pre_target+L_next_target-1である。 In FIG. 7(b), the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B1=0, and the ending point of the first channel signal of the current frame is E1=N-1. The start point of the signal for the first alignment length is D1=B1+L_pre_target, the end point of the signal for the first alignment length is C1=B1+L_pre_target+L_next_target-1, and the the starting point of the signal is A1=B1+L_pre_target-abs(cur_itd), the coordinates of the ending point of the signal of the first process length are the same as the coordinates of the ending point of the signal of the first alignment process length, That is, C1=B1+L_pre_target+L_next_target-1.

現在のフレームの第2のチャンネル信号の開始点はB2=0であり、現在のフレームの第2のチャンネル信号の終了点はE2=N-1である。第2のアライメント処理長の開始点は第2のチャンネル信号の開始点B2であり、第2のアライメント処理長の終了点はC2=B2+L_pre_target-1である。第2の処理長の信号の開始点はA2=B2+abs(prev_itd)であり、第2の処理長の信号の終了点はC2=B2+L_pre_target-1である。 The starting point of the second channel signal of the current frame is B2=0, and the ending point of the second channel signal of the current frame is E2=N-1. The start point of the second alignment length is the start point B2 of the second channel signal, and the end point of the second alignment length is C2=B2+L_pre_target-1. The start point of the second process length signal is A2=B2+abs(prev_itd) and the end point of the second process length signal is C2=B2+L_pre_target-1.

図7(b)を参照すると、第1のチャンネル信号に対して遅延アライメント処理を実行するプロセスにおいて、第1のチャンネル信号内の点H1から点A1-1までの信号は、圧縮処理の後の第1のチャンネル信号内の点B1から点D1-1までの信号として直接使用され、H1=B1-abs(cur_itd)である。現在のフレームの第1のチャンネル信号内の点A1から点C1までの信号は、第1のアライメント処理長の信号に圧縮され、第1のアライメント処理長の圧縮信号は、圧縮処理の後の第1のチャンネル信号内の点D1から点C1までの信号として使用される。次いで、現在のフレームの第1のチャンネル信号内の点C1+1から点E1までの信号は、圧縮処理の後の第1のチャンネル信号内の点C1+1から点E1までの信号として直接使用される。次いで、第1の遅延長の信号は、現在のフレームの第2のチャンネル信号内の終了点E2の前の第1の遅延長の信号に基づいて手動で再構成され、第1の遅延長の再構成された信号は、圧縮処理の後の第1のチャンネル信号内の点E1+1から点G1までの信号として使用され、G1=E1+abs(cur_itd)-1である。最後に、遅延アライメント処理の後に取得された信号内の点F1から点G1までの信号は、遅延アライメント処理の後の現在のフレームの第1のチャンネル信号として使用され、F1=B1+abs(cur_itd)である。 Referring to FIG. 7(b), in the process of performing delay alignment processing on the first channel signal, the signals from point H1 to point A1-1 in the first channel signal are converted to Directly used as the signal from point B1 to point D1-1 in the first channel signal, H1=B1-abs(cur_itd). The signal from point A1 to point C1 in the first channel signal of the current frame is compressed into a signal of the first alignment process length, and the compressed signal of the first alignment process length is the first channel signal after the compression process. It is used as the signal from point D1 to point C1 in the 1 channel signal. Then the signal from point C1+1 to point E1 in the first channel signal of the current frame is directly used as the signal from point C1+1 to point E1 in the first channel signal after compression processing. be done. Then, the first delay length signal is manually reconstructed based on the first delay length signal before the end point E2 in the second channel signal of the current frame, and the first delay length signal is The reconstructed signal is used as the signal from point E1+1 to point G1 in the first channel signal after compression processing, G1=E1+abs(cur_itd)-1. Finally, the signal from point F1 to point G1 in the signal obtained after delay alignment processing is used as the first channel signal of the current frame after delay alignment processing, F1=B1+abs(cur_itd ).

第2のチャンネル信号に対して遅延アライメント処理を実行するプロセスにおいて、現在のフレームの第2のチャンネル信号内の点A2から点C2までの信号は、第2のアライメント処理長の信号に伸張され、第2のアライメント処理長の伸張信号は、伸張処理の後の第2のチャンネル信号内の点B2から点C2までの信号として使用される。次いで、現在のフレームの第2のチャンネル内の点C2+1から点E2までの信号は、伸張処理の後の第2のチャンネル信号内の点C2+1から点E2までの信号として直接使用される。最後に、遅延アライメント処理の後に取得された信号内の点B2から点E2までの信号は、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号として使用される。 In the process of performing a delay alignment process on the second channel signal, the signal from point A2 to point C2 in the second channel signal of the current frame is decompressed into a signal of the second alignment process length; The decompressed signal of the second alignment processing length is used as the signal from point B2 to point C2 in the second channel signal after decompression processing. Then the signal from point C2+1 to point E2 in the second channel of the current frame is directly used as the signal from point C2+1 to point E2 in the second channel signal after decompression processing. be. Finally, the signal from point B2 to point E2 in the signal obtained after delay alignment processing is used as the second channel signal of the current frame after delay alignment processing.

フレームの間の平滑化を追加するために、遷移区間がまた設定されてもよく、遷移区間長はtsである。任意選択で、平滑化遷移区間の長さが更に設定されてもよく、平滑化遷移区間の長さはTs2である。具体的な方法については、上記の説明を参照する。詳細はここでは説明しない。 To add smoothing between frames, a transition interval may also be set, the transition interval length being ts. Optionally, the length of the smoothed transition interval may be further set, the length of the smoothed transition interval being Ts2. For the specific method, refer to the above description. Details are not described here.

この出願のこの実施形態では、現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と同じであると決定された場合、遅延アライメント処理は、現在のフレームのチャンネル間時間差及び前のフレームのチャンネル間時間差に基づいて、現在のフレームのターゲットチャンネルの信号に対して実行されてもよい。この場合、現在のフレームのターゲットチャンネル及び前のフレームのターゲットチャンネルは同じチャンネルである。具体的な遅延アライメント処理方法は、この出願のこの実施形態では限定されない。 In this embodiment of this application, if it is determined that the sign of the current frame's inter-channel time difference is the same as the sign of the previous frame's inter-channel time difference, then the delay alignment process is applied to the current frame's inter-channel time difference. and the signal of the target channel of the current frame based on the inter-channel time difference of the previous frame. In this case, the target channel of the current frame and the target channel of the previous frame are the same channel. The specific delay alignment processing method is not limited in this embodiment of this application.

例えば、可能な処理方法は以下の通りである。 For example, possible processing methods are as follows.

ステップ1:現在のフレームの推定されたチャンネル間時間差を、現在のフレームのチャンネル間時間差として使用する。 Step 1: Use the estimated inter-channel time difference of the current frame as the inter-channel time difference of the current frame.

ステップ2:現在のフレームのチャンネル間時間差及び前のフレームのチャンネル間時間差に基づいて、現在のフレームのターゲットチャンネル及び基準チャンネルを選択する。現在のフレームのチャンネル間時間差はcur_itdとして記され、前のフレームのチャンネル間時間差はprev_itdとして記される。具体的には、cur_itd=0である場合、現在のフレームのターゲットチャンネルは、前のフレームのターゲットチャンネルと一致する。例えば、現在のフレームのターゲットチャンネルインデックスはtarget_idxとして記され、前のフレームのターゲットチャンネルインデックスはprev_target_idxとして記され、target_idx=prev_target_idxである。cur_itd<0である場合、現在のフレームのターゲットチャンネルは左チャンネルである。例えば、現在のフレームのターゲットチャンネルインデックスはtarget_idxとして記され、target_idx=0である。cur_itd>0である場合、現在のフレームのターゲットチャンネルは右チャンネルである。例えば、現在のフレームのターゲットチャンネルインデックスはtarget_idxとして記され、target_idx=1である。 Step 2: Select the target channel and reference channel of the current frame based on the inter-channel time difference of the current frame and the inter-channel time difference of the previous frame. The inter-channel time difference of the current frame is noted as cur_itd and the inter-channel time difference of the previous frame is noted as prev_itd. Specifically, if cur_itd=0, the target channel of the current frame matches the target channel of the previous frame. For example, the target channel index of the current frame is noted as target_idx, the target channel index of the previous frame is noted as prev_target_idx, target_idx=prev_target_idx. If cur_itd<0, the target channel for the current frame is the left channel. For example, the target channel index of the current frame is noted as target_idx and target_idx=0. If cur_itd>0, the target channel for the current frame is the right channel. For example, the target channel index of the current frame is noted as target_idx and target_idx=1.

さらに、現在のフレームのターゲットチャンネルインデックスは更に符号化され、コードストリームに書き込まれてもよく、コードストリームは、デコーダ側に送信される。 Moreover, the target channel index of the current frame may be further encoded and written into the codestream, and the codestream is sent to the decoder side.

ステップ3:現在のフレームのチャンネル間時間差及び前のフレームのチャンネル間時間差に基づいて、選択されたターゲットチャンネルの信号に対して遅延アライメント処理を実行する。具体的には、このステップは以下の通りでもよい。 Step 3: Perform delay alignment processing on the signal of the selected target channel based on the inter-channel time difference of the current frame and the inter-channel time difference of the previous frame. Specifically, this step may be as follows.

ターゲットチャンネルに対応するチャンネルの前処理された時間領域信号は、ターゲットチャンネルの信号として使用され、基準チャンネルに対応するチャンネルの前処理された時間領域信号は、基準チャンネルの信号として使用される。例えば、ターゲットチャンネルが左チャンネルである場合、左チャンネルの前処理された時間領域信号は、ターゲットチャンネルの信号として使用され、基準チャンネルが右チャンネルである場合、右チャンネルの前処理された時間領域信号は、基準チャンネルの信号として使用される。ターゲットチャンネルが右チャンネルである場合、右チャンネルの前処理された時間領域信号は、ターゲットチャンネルの信号として使用され、基準チャンネルが左チャンネルである場合、左チャンネルの前処理された時間領域信号は、基準チャンネルの信号として使用される。 The preprocessed time-domain signal of the channel corresponding to the target channel is used as the signal of the target channel, and the preprocessed time-domain signal of the channel corresponding to the reference channel is used as the signal of the reference channel. For example, if the target channel is the left channel, the preprocessed time-domain signal of the left channel is used as the signal of the target channel, and if the reference channel is the right channel, the preprocessed time-domain signal of the right channel is is used as the reference channel signal. If the target channel is the right channel, the preprocessed time-domain signal of the right channel is used as the signal of the target channel, and if the reference channel is the left channel, the preprocessed time-domain signal of the left channel is Used as reference channel signal.

abs(cur_itd)がabs(prev_itd)に等しい場合、ターゲットチャンネルの信号は、圧縮又は伸張されない。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、現在のフレームのターゲットチャンネル信号の点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。現在のフレームのターゲットチャンネル信号は、abs(cur_itd)個のサンプリング点により直接遅延され、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、abs()は絶対値をとる演算を表す。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。 If abs(cur_itd) is equal to abs(prev_itd), the target channel's signal is not compressed or expanded. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel signal in the current frame be done. The target channel signal of the current frame is directly delayed by abs(cur_itd) sampling points and used as the target channel signal of the current frame after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and abs() represents an absolute value operation. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing.

abs(cur_itd)がabs(prev_itd)未満である場合、バッファリングされたターゲットチャンネル信号の点B+abs(prev_itd)-abs(cur_itd)から点B+L-1までの信号は、L個の点の長さの信号に伸張され、これは、伸張処理の後のターゲットチャンネルの最初のL個の点の信号として使用される。ターゲットチャンネル信号内の点B+Lから点B+N-1までの信号は、伸張処理の後のターゲットチャンネル信号内の点B+Lから点B+N-1までの信号として直接使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、伸張処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。伸張処理の後のターゲットチャンネル信号内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is less than abs(prev_itd), the signal from point B+abs(prev_itd)-abs(cur_itd) to point B+L-1 of the buffered target channel signal is L points , which is used as the signals of the first L points of the target channel after the decompression process. The signal from point B+L to point B+N-1 in the target channel signal is directly used as the signal from point B+L to point B+N-1 in the target channel signal after expansion processing . The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after stretching be done. The N-point signal starting from point B+abs(cur_itd) in the target channel signal after decompression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

abs(cur_itd)がabs(prev_itd)よりも大きい場合、バッファリングされたターゲットチャンネル信号の点B+abs(prev_itd)-abs(cur_itd)から点B+L-1までの信号は、L個の点の長さの信号に圧縮され、これは、圧縮処理の後のターゲットチャンネルの最初のL個の点の信号として使用される。ターゲットチャンネル信号内の点B+Lから点B+N-1までの信号は、圧縮処理の後のターゲットチャンネル信号内の点B+Lから点B+N-1までの信号として直接使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、圧縮処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。圧縮処理の後のターゲットチャンネル内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is greater than abs(prev_itd), the signal from point B+abs(prev_itd)-abs(cur_itd) of the buffered target channel signal to point B+L-1 is L points is compressed into a signal of length , which is used as the signal of the first L points of the target channel after the compression process. The signal from point B+L to point B+N-1 in the target channel signal is directly used as the signal from point B+L to point B+N-1 in the target channel signal after compression processing . The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after compression processing be done. The N-point signal starting from point B+abs(cur_itd) in the target channel after compression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

フレームの間の平滑化を追加するために、遷移区間がここで設定されてもよく、遷移区間長はtsである。第1の遷移区間長は、プリセット正整数に設定されてもよく、プリセット正整数は、当業者による経験に基づいて設定されてもよい。例えば、第1の遷移区間長は、代替として、現在のフレームのチャンネル間時間差に基づいて計算されてもよい。例えば、ts=abs(cur_itd)/2である。同様に、実際の信号と再構成された信号との間に平滑化を追加するために、平滑化遷移区間が更に設定されてもよく、平滑化遷移区間の長さはTs2である。平滑化遷移区間の長さは、プリセット正整数に設定されてもよい。例えば、Ts2は10に設定される。次いで、現在のフレームのチャンネル間時間差及び前のフレームのチャンネル間時間差に基づいて、選択されたターゲットチャンネルの信号に対して遅延アライメント処理を実行するステップ3は、以下のように変更されてもよい。 To add smoothing between frames, a transition interval may be set here, the transition interval length being ts. The first transition interval length may be set to a preset positive integer, and the preset positive integer may be set based on experience by those skilled in the art. For example, the first transition interval length may alternatively be calculated based on the inter-channel time difference of the current frame. For example, ts=abs(cur_itd)/2. Similarly, a smoothed transition interval may also be set to add smoothing between the actual signal and the reconstructed signal, the length of the smoothed transition interval being Ts2. The length of the smoothed transition interval may be set to a preset positive integer. For example, Ts2 is set to 10. Step 3 of then performing delay alignment processing on the signal of the selected target channel based on the inter-channel time difference of the current frame and the inter-channel time difference of the previous frame may be modified as follows. .

abs(cur_itd)がabs(prev_itd)未満である場合、バッファリングされたターゲットチャンネル信号の点B-ts+abs(prev_itd)-abs(cur_itd)から点B+L-ts-1までの信号は、Lの長さの信号に伸張され、これは、伸張処理の後のターゲットチャンネルの点B-tsから点B+L-ts-1までの信号として使用される。ターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号は、伸張処理の後のターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号として直接使用される。Ts2点の信号は、基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、伸張処理の後のターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、伸張処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。伸張処理の後のターゲットチャンネル内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is less than abs(prev_itd), the signal from point B-ts+abs(prev_itd)-abs(cur_itd) to point B+L-ts-1 of the buffered target channel signal is It is expanded to a signal of length L, which is used as the signal from point B-ts to point B+L-ts-1 of the target channel after the expansion process. The signal from the point B+L-ts to the point B+N-Ts2-1 in the target channel signal is the point B+L-ts to the point B+N-Ts2-1 in the target channel signal after decompression. used directly as a signal to The signal at point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel after decompression processing. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after stretching be done. The N-point signal starting from point B+abs(cur_itd) in the target channel after decompression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

abs(cur_itd)がabs(prev_itd)よりも大きい場合、バッファリングされたターゲットチャンネル信号の点B-ts+abs(prev_itd)-abs(cur_itd)から点B+L-ts-1までの信号は、L個の点の長さの信号に圧縮され、これは、圧縮処理の後のターゲットチャンネルの点B-tsから点B+L-ts-1までの信号として使用される。ターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号は、圧縮処理の後のターゲットチャンネル内の点B+L-tsから点B+N-Ts2-1までの信号として直接使用される。Ts2点の信号は、基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、圧縮処理の後のターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、圧縮処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。圧縮処理の後のターゲットチャンネル内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is greater than abs(prev_itd), the signal from point B-ts+abs(prev_itd)-abs(cur_itd) to point B+L-ts-1 of the buffered target channel signal is Compressed to a signal of length L points, which is used as the signal from point B-ts to point B+L-ts-1 of the target channel after the compression process. The signal from point B+L-ts to point B+N-Ts2-1 in the target channel signal is from point B+L-ts to point B+N-Ts2-1 in the target channel after compression processing used directly as a signal for The signal at point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel after compression processing. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after compression processing be done. The N-point signal starting from point B+abs(cur_itd) in the target channel after compression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

Ts2点の信号が基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号として使用されることは、具体的には以下の通りでもよい。Ts2点の信号は、ターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号と、基準チャンネルの点B+N-abs(cur_itd)-Ts2から点B+N-abs(cur_itd)-1までの信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号が、基準チャンネル信号に基づいて手動で再構成され、圧縮又は伸張処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用されることは、具体的には以下の通りでもよい。abs(cur_itd)点の信号は、基準チャンネルの点B+N-abs(cur_itd)から点B+N-1までの信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。 The signal at point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel after compression or decompression processing. , specifically as follows. The signal at point Ts2 is the signal from point B+N-Ts2 to point B+N-1 on the target channel and the signal from point B+N-abs(cur_itd)-Ts2 to point B+N-abs(cur_itd) on the reference channel. )-1 and used as the signals from point B+N-Ts2 to point B+N-1 of the target channel after compression or decompression. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal, and the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after compression or decompression processing may be specifically as follows. The signal at point abs(cur_itd) is generated based on the signals from point B+N-abs(cur_itd) of the reference channel to point B+N-1, and point B+ of the target channel after compression or decompression processing. Used as signal from N to point B+N+abs(cur_itd)-1.

遅延アライメント処理の後の現在のフレームの左チャンネル信号はx’L(n)として記され、遅延アライメント処理の後の現在のフレームの右チャンネル信号はx’R(n)として記され、nはサンプリング点シーケンス番号であり、n=0,1,...,N-1である。現在のフレームのチャンネル間時間差の符号に従って、遅延アライメント処理の後のターゲットチャンネル信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号でもよく、x’L(n)として記され、或いは、遅延アライメント処理の後のターゲットチャンネル信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号でもよく、x’R(n)として記される。同様に、遅延アライメント処理の後の基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの左チャンネル信号でもよく、x’L(n)として記され、或いは、遅延アライメント処理の後の基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの右チャンネル信号でもよく、x’R(n)として記される。 The left channel signal of the current frame after delay alignment processing is denoted as x'L (n) and the right channel signal of the current frame after delay alignment processing is denoted as x'R (n), where n is Sampling point sequence number, n=0,1,...,N-1. According to the sign of the inter-channel time difference of the current frame, the target channel signal after delay alignment processing may be the left channel signal of the current frame after delay alignment processing, denoted as x′ L (n), or The target channel signal after delay alignment processing may be the right channel signal of the current frame after delay alignment processing, denoted as x' R (n). Similarly, the reference channel signal after delay alignment processing may be the left channel signal of the current frame after delay alignment processing, denoted as x′ L (n), or the reference channel signal after delay alignment processing The signal may be the right channel signal of the current frame after delay alignment processing, denoted as x' R (n).

遅延アライメント処理の後の最終的に取得された信号は、時間領域ダウンミックス処理の後の一次チャンネル信号及び二次チャンネル信号を取得するために、時間領域ダウンミックス処理に使用される。一次チャンネル信号及び二次チャンネル信号は、入力ステレオ信号を符号化するために、別々に符号化される。 The final obtained signals after delay alignment processing are used for time domain downmix processing to obtain primary channel signals and secondary channel signals after time domain downmix processing. The primary channel signal and the secondary channel signal are encoded separately to encode the input stereo signal.

この出願の実施形態は、復号化プロセスに更に適用可能でもよく、復号化プロセスは、符号化プロセスの逆プロセスと考えられてもよく、以下に詳細に説明する。 Embodiments of this application may also be applicable to the decoding process, which may be considered the inverse process of the encoding process, and is described in detail below.

図8は、この出願の実施形態によるステレオ信号処理方法を示し、以下を含む。 FIG. 8 shows a stereo signal processing method according to an embodiment of this application, including:

ステップ801:受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定し、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である。 Step 801: Determine the inter-channel time difference of the current frame based on the received codestream, the inter-channel time difference of the current frame being the difference between the first channel signal of the current frame and the second channel signal of the current frame. is the time difference between

ステップ801において、現在のフレームの第1のチャンネル信号及び現在のフレームの第2のチャンネル信号は、受信したコードストリームに基づく復号化を通じて更に取得されてもよい。 In step 801, the first channel signal of the current frame and the second channel signal of the current frame may be further obtained through decoding based on the received codestream.

この出願のこの実施形態は、当該方法がエンコーダ側による遅延アライメント処理の後の第1のチャンネル信号及び遅延アライメント処理の後の第2のチャンネル信号を符号化するための符号化方法に対応するという条件で、現在のフレームの第1のチャンネル信号及び現在のフレームの第2のチャンネル信号を復号化するための方法に対して限定を設定しない。現在のフレームの復号化された第1のチャンネル信号、すなわち、遅延回復処理の前の第1のチャンネル信号は、エンコーダ側の遅延アライメント処理の後の符号化された第1のチャンネル信号に対応する。現在のフレームの復号化された第2のチャンネル信号、すなわち、遅延回復処理の前の第2のチャンネル信号は、エンコーダ側の遅延アライメント処理の後の符号化された第2のチャンネル信号に対応する。 This embodiment of this application states that the method corresponds to an encoding method for encoding a first channel signal after delay alignment processing and a second channel signal after delay alignment processing by the encoder side. The terms do not set limitations on the method for decoding the first channel signal of the current frame and the second channel signal of the current frame. The decoded first channel signal of the current frame, i.e., the first channel signal before delay recovery processing, corresponds to the encoded first channel signal after encoder-side delay alignment processing. . The decoded second channel signal of the current frame, i.e. the second channel signal before delay recovery processing, corresponds to the encoded second channel signal after delay alignment processing on the encoder side. .

ステップ801において、現在のフレームのチャンネル間時間差を復号化するための方法は、エンコーダ側の符号化方法に対応する必要がある。例えば、エンコーダ側が、現在のフレームのチャンネル間時間差の絶対値のコードインデックスと、基準チャンネルインデックスとをコードストリームに書き込み、コードストリームをデコーダ側に送信する場合、デコーダ側は、受信した符号ストリームに基づいて、現在のフレームのチャンネル間時間差の絶対値と、基準チャンネルインデックスとを復号化する。 In step 801, the method for decoding the inter-channel time difference of the current frame should correspond to the encoding method on the encoder side. For example, if the encoder side writes the code index of the absolute value of the inter-channel time difference of the current frame and the reference channel index into the codestream, and sends the codestream to the decoder side, the decoder side will write the codestream based on the received codestream. to decode the absolute value of the inter-channel time difference of the current frame and the reference channel index.

代替として、エンコーダ側が、現在のフレームのチャンネル間時間差の絶対値のコードインデックスと、ターゲットチャンネルインデックスとをコードストリームに書き込み、コードストリームをデコーダ側に送信する場合、デコーダ側は、受信した符号ストリームに基づいて、現在のフレームのチャンネル間時間差の絶対値と、ターゲットチャンネルインデックスとを復号化する。 Alternatively, if the encoder side writes the code index of the absolute value of the inter-channel time difference of the current frame and the target channel index into the codestream and sends the codestream to the decoder side, the decoder side writes Based on this, decode the absolute value of the inter-channel time difference of the current frame and the target channel index.

代替として、エンコーダ側が、現在のフレームのチャンネル間時間差のコードインデックスをコードストリームに書き込み、コードストリームをデコーダ側に送信する場合、デコーダ側は、受信した符号ストリームに基づいて、現在のフレームのチャンネル間時間差を復号化する。 Alternatively, if the encoder side writes the code index of the inter-channel time difference of the current frame into the codestream and sends the codestream to the decoder side, the decoder side can calculate the inter-channel time difference of the current frame based on the received codestream. Decode the time difference.

前のフレームのチャンネル間時間差を決定するための方式については、ここでの説明を参照する。詳細は更に説明しない。 Refer to the description herein for the scheme for determining the inter-channel time difference of the previous frame. No further details are given.

ステップ802:現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行し、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある。 Step 802: A first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame. and perform delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, and perform delay recovery processing on the first channel signal of the current frame. A target channel signal, the second channel signal is on the same channel as the target channel signal of the previous frame.

ステップ802において、符号は、正符号(+)又は負符号(-)を示してもよい。この出願のこの実施形態では、前のフレームは、現在のフレームの前に位置し、現在のフレームに隣接する。説明を容易にするために、以下では、現在のフレームの第1のチャンネル信号に対応するチャンネルは第1のチャンネルと呼ばれ、現在のフレームの第2のチャンネル信号に対応するチャンネルは第2のチャンネルと呼ばれる。第1のチャンネルは、現在のフレームのターゲットチャンネルであり、さらに、次のフレームのターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの指示ターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの前のフレームのターゲットチャンネル以外の他のチャンネルと呼ばれてもよい点に留意すべきである。対応して、第2のチャンネルは、現在のフレームの基準チャンネルであり、第2のチャンネルは、ステレオ信号の2つのチャンネル内にあり且つ前のフレームのターゲットチャンネルと同じであるチャンネルであり、さらに、前のフレームのターゲットチャンネルと呼ばれてもよく、或いは、現在のフレームの指示基準チャンネルと呼ばれてもよく、或いは、現在のフレームのターゲットチャンネル以外のチャンネルと呼ばれてもよい。例えば、前のフレームのターゲットチャンネルが左チャンネルである場合、第1のチャンネル信号は現在のフレーム内の右チャンネル信号であり、第2のチャンネル信号は現在のフレーム内の左チャンネル信号である。前のフレームのターゲットチャンネルが右チャンネルである場合、第1のチャンネル信号は現在のフレーム内の左チャンネル信号であり、第2のチャンネル信号は現在のフレーム内の右チャンネル信号である。 In step 802, the sign may indicate a plus sign (+) or a minus sign (-). In this embodiment of this application, the previous frame is located before and adjacent to the current frame. For ease of explanation, hereinafter the channel corresponding to the first channel signal of the current frame will be referred to as the first channel, and the channel corresponding to the second channel signal of the current frame will be referred to as the second channel. called a channel. The first channel is the target channel of the current frame, and may also be called the target channel of the next frame, or the designated target channel of the current frame, or the target channel of the current frame. It should be noted that other channels than the target channel of the frame before the frame may be called. Correspondingly, the second channel is the reference channel of the current frame, the second channel is the channel within the two channels of the stereo signal and the same as the target channel of the previous frame, and , may be called the target channel of the previous frame, or may be called the designated reference channel of the current frame, or may be called a channel other than the target channel of the current frame. For example, if the target channel in the previous frame is the left channel, the first channel signal is the right channel signal in the current frame and the second channel signal is the left channel signal in the current frame. If the target channel in the previous frame is the right channel, the first channel signal is the left channel signal in the current frame and the second channel signal is the right channel signal in the current frame.

ステップ802において、デコーダ側が、受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を復号化する場合、デコーダ側は、現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と同じであるか否かを直接決定してもよい。 In step 802, when the decoder side decodes the inter-channel time difference of the current frame based on the received codestream, the decoder side determines that the sign of the inter-channel time difference of the current frame is equal to the inter-channel time difference of the previous frame. It may be determined directly whether it is the same as the sign.

デコーダ側が、受信したコードストリームに基づいて、現在のフレームのチャンネル間時間差の絶対値及び現在のフレームの基準チャンネル、又は現在のフレームのチャンネル間時間差の絶対値及び現在のフレームのターゲットチャンネルインデックスを復号化する場合、デコーダ側は、現在のフレームの基準チャンネル及び前のフレームの基準チャンネルインデックスに基づいて、或いは現在のフレームのターゲットチャンネル及び前のフレームの基準チャンネルインデックスに基づいて、現在のフレームのチャンネル間時間差の符号が前のフレームのチャンネル間時間差の符号と同じであるか否かを決定する必要がある。 A decoder side decodes the absolute value of the inter-channel time difference of the current frame and the reference channel of the current frame or the absolute value of the inter-channel time difference of the current frame and the target channel index of the current frame according to the received codestream. , the decoder side selects the channel of the current frame based on the reference channel of the current frame and the reference channel index of the previous frame, or based on the target channel of the current frame and the reference channel index of the previous frame. It is necessary to determine whether the sign of the inter-channel time difference is the same as the sign of the inter-channel time difference of the previous frame.

ここでは、現在のフレームのチャンネル間時間差の絶対値及び基準チャンネルインデックスが復号化されることが、例として使用される。具体的には、現在のフレームの基準チャンネルインデックスが前のフレームの基準チャンネルインデックスと等しくない場合、現在のフレームのチャンネル間時間差の符号が前のフレームのチャンネル間時間差の符号と異なると決定される。現在のフレームの基準チャンネルインデックスが前のフレームの基準チャンネルインデックスと等しい場合、現在のフレームのチャンネル間時間差の符号が前のフレームのチャンネル間時間差の符号と同じであると決定される。他の場合については、ここでの説明を参照する。詳細は更に説明しない。 It is used here as an example that the absolute value of the inter-channel time difference of the current frame and the reference channel index are decoded. Specifically, it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame if the reference channel index of the current frame is not equal to the reference channel index of the previous frame. . If the reference channel index of the current frame is equal to the reference channel index of the previous frame, it is determined that the sign of the inter-channel time difference of the current frame is the same as the sign of the inter-channel time difference of the previous frame. For other cases, see the discussion here. No further details are given.

デコーダ側の遅延回復処理は、エンコーダ側の遅延アライメント処理に対応する。エンコーダ側が圧縮を実行する場合、デコーダ側は圧縮信号を伸張する必要がある。同様に、エンコーダ側が伸張を実行する場合、デコーダ側は伸張信号を圧縮する必要がある。 The decoder-side delay recovery process corresponds to the encoder-side delay alignment process. If the encoder side performs compression, the decoder side needs to decompress the compressed signal. Similarly, if the encoder side performs decompression, the decoder side needs to compress the decompressed signal.

この出願のこの実施形態では、復号化プロセスにおいて、第1のチャンネル信号及び第2のチャンネル信号に対して遅延回復処理を実行するための複数の方法が存在し、これらは、以下に別々に記載される。 In this embodiment of this application, there are multiple methods for performing delay recovery processing on the first channel signal and the second channel signal in the decoding process, which are described separately below. be done.

1.現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行する。 1. Perform delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame.

具体的には、現在のフレームの第1のチャンネル信号内の第3の処理長の信号は、遅延回復処理の後の現在のフレームの第1のチャンネル信号を取得するために、第3のアライメント処理長の信号に伸張される。第3の処理長は、現在のフレームのチャンネル間時間差及び第3のアライメント処理長に基づいて決定され、第3の処理長は、第3のアライメント処理長未満である。 Specifically, the signal of the third processing length within the first channel signal of the current frame is subjected to a third alignment to obtain the first channel signal of the current frame after delay recovery processing. Decompressed to process length signal. A third process length is determined based on the inter-channel time difference of the current frame and a third alignment process length, where the third process length is less than the third alignment process length.

復号化プロセスにおいて、第3の処理長は、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差でもよく、第3のアライメント処理長は、プリセット長でもよく、或いは、他の方式で決定されてもよく、例えば、式(8)に従って決定されてもよい。この出願のこの実施形態では、第3のアライメント処理長は、現在のフレームのフレーム長以下である。第3のアライメント処理長が予め設定されるとき、第3のアライメント処理長は、L、L/2、L/3又はL以下のいずれかの長さでもよい。Lは、現在のサンプリングレートにおいて対応するフレーム長N以下であり且つチャンネル間時間差の絶対値の最大値よりも大きいいずれかのプリセット正整数である。例えば、L=290又はL=200である。この出願のこの実施形態では、Lは、異なるサンプリングレートについて異なる値に設定されてもよく、或いは、一様な値でもよい。一般的に、値は、当業者の経験に基づいて予め設定されてもよい。例えば、サンプリングレートが16KHzであるとき、Lは290に設定される。この場合、第3のアライメント処理長はL/2=145である。 In the decoding process, the third process length may be the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame, the third alignment process length may be the preset length, Alternatively, it may be determined by another method, for example, it may be determined according to equation (8). In this embodiment of this application, the third alignment length is less than or equal to the frame length of the current frame. When the third alignment process length is set in advance, the third alignment process length may be L, L/2, L/3, or any length of L or less. L is any preset positive integer less than or equal to the corresponding frame length N at the current sampling rate and greater than the maximum absolute value of the inter-channel time difference. For example, L=290 or L=200. In this embodiment of this application, L may be set to different values for different sampling rates, or may be a uniform value. In general, the values may be preset based on the experience of those skilled in the art. For example, L is set to 290 when the sampling rate is 16KHz. In this case, the third alignment processing length is L/2=145.

この出願のこの実施形態では、第3の処理長の信号の開始点は、第3のアライメント処理長の信号の開始点の後に位置し、第3の処理長の信号の開始点と第3のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 In this embodiment of this application, the starting point of the signal of the third treatment length is located after the starting point of the signal of the third alignment treatment length, and the starting point of the signal of the third treatment length and the third The length between the start point of the alignment process length signal is the absolute value of the inter-channel time difference of the current frame.

この出願のこの実施形態では、第3のアライメント処理長はL2_next_targetにより表されてもよく、第4のアライメント処理長はL2_pre_targetにより表されてもよい。エンコーダ側の第1のアライメント処理長は、実際には、エンコーダ側に対応するデコーダ側の第3のアライメント処理長と等しい点に留意すべきである。対応して、エンコーダ側の第2のアライメント処理長は、実際には、エンコーダ側に対応するデコーダ側の第4のアライメント処理長と等しい。説明を容易にするために、ここでは、長さを表すために異なる表記が使用される。現在のフレームのチャンネル間時間差はcur_itdであり、abs(cur_itd)は現在のフレームのチャンネル間時間差の絶対値を表す。説明を容易にするために、abs(cur_itd)は、以下の説明では第1の遅延長と呼ばれる。前のフレームのチャンネル間時間差はprev_itdであり、abs(prev_itd)は前のフレームのチャンネル間時間差の絶対値を表す。説明を容易にするために、abs(prev_itd)は、以下の説明では第2の遅延長と呼ばれる。 In this embodiment of this application, the third alignment process length may be represented by L2_next_target and the fourth alignment process length may be represented by L2_pre_target. It should be noted that the first alignment process length on the encoder side is actually equal to the third alignment process length on the decoder side corresponding to the encoder side. Correspondingly, the second alignment process length on the encoder side is actually equal to the fourth alignment process length on the decoder side corresponding to the encoder side. For ease of explanation, different notations are used here to represent length. The inter-channel time difference of the current frame is cur_itd, and abs(cur_itd) represents the absolute value of the inter-channel time difference of the current frame. For ease of explanation, abs(cur_itd) will be referred to as the first delay length in the following discussion. The inter-channel time difference of the previous frame is prev_itd, and abs(prev_itd) represents the absolute value of the inter-channel time difference of the previous frame. For ease of explanation, abs(prev_itd) is referred to as the second delay length in the following discussion.

復号化プロセスにおいて、第3の処理長の信号の具体的な位置は、異なる実際の条件に基づいて決定されてもよく、これらは、以下に別々に記載される。 In the decoding process, the specific position of the third processing length signal may be determined based on different actual conditions, which are described separately below.

第1の可能な場合: First possible case:

図9は、この出願の実施形態によるステレオ信号処理の概略図である。図9において、説明を容易にするために、遅延回復処理の前の第1のチャンネル信号内の点と、同じ位置にある伸張処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。 FIG. 9 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 9, for ease of explanation, a point in the first channel signal before delay recovery processing and a point in the first channel signal after decompression processing at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same.

図9において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB3=0であり、現在のフレームの第1のチャンネル信号の終了点はE3=N-1である。第3の処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点B3に位置し、第3の処理長の信号の終了点はC3=B3-abs(cur_itd)+L2_next_target-1である。 In FIG. 9, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B3=0, and the ending point of the first channel signal of the current frame is E3=N. -1. The starting point of the signal of the third processing length is located at the starting point B3 of the first channel signal of the current frame, and the ending point of the signal of the third processing length is C3=B3-abs(cur_itd)+L2_next_target -1.

図9において、第3のアライメント処理長の開始点はA3=B3-abs(cur_itd)であり、第3のアライメント処理長の信号の終了点はC3であり、これは、第3の処理長の信号の終了点の座標と同じである。 In FIG. 9, the starting point of the third alignment length is A3=B3-abs(cur_itd), and the end point of the signal of the third alignment length is C3, which is the It is the same as the coordinates of the end point of the signal.

遅延回復処理のプロセスにおいて、図9を参照すると、現在のフレームの第1のチャンネル信号内の点B3から点C3までの信号は、第3のアライメント処理長の信号に伸張され、第3のアライメント処理長の伸張信号は、伸張処理の後の第1のチャンネル信号内の第3のアライメント処理長の開始点A3から始まる第3のアライメント処理長の信号として使用され、すなわち、伸張処理の後の第1のチャンネル信号内の第3のアライメント処理長の開始点A3から点C3までの信号として使用される。 In the process of delay recovery processing, referring to FIG. 9, the signal from point B3 to point C3 in the first channel signal of the current frame is decompressed into a signal of third alignment processing length, and the third alignment The process length stretch signal is used as a signal of the third alignment process length starting from the starting point A3 of the third alignment process length in the first channel signal after the stretch process, i.e. It is used as the signal from the starting point A3 to the point C3 of the third alignment process length in the first channel signal.

この出願のこの実施形態では、信号伸張中に、現在のフレームの第1のチャンネル信号内の点C3+1から点E3までの信号は、伸張処理の後の第1のチャンネル信号内の点C3+1から点E3までの信号として直接使用されてもよい。 In this embodiment of this application, during signal decompression, the signal from point C3+1 to point E3 in the first channel signal of the current frame is the signal from point C3 in the first channel signal after decompression processing. It may be used directly as a signal from +1 to point E3.

最後に、伸張処理の後の第1のチャンネル信号内で、開始点A3から始まるN個のサンプリング点が、遅延回復処理の後の現在のフレームの第1のチャンネル信号として使用される。すなわち、遅延回復処理の後の現在のフレームの第1のチャンネル信号の開始点は点G3であり、G3=E3-abs(cur_itd)である。 Finally, in the first channel signal after decompression, the N sampling points starting from the starting point A3 are used as the first channel signal of the current frame after delay recovery. That is, the starting point of the first channel signal of the current frame after delay recovery processing is point G3, where G3=E3-abs(cur_itd).

一般的に、第3の処理長の信号の開始点は、第1のチャンネル信号の開始点の後に位置してもよい。しかし、第3の処理長の信号の開始点が第1のチャンネル信号の開始点の後に位置するとき、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さが、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上であることが確保される必要があり、これについて以下に詳細に説明する。 In general, the starting point of the signal of the third processing length may be located after the starting point of the first channel signal. However, when the starting point of the signal of the third processing length is located after the starting point of the first channel signal, the starting point of the signal of the third processing length and the ending point of the first channel signal of the current frame is greater than or equal to the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame, which will be explained in detail below. .

第2の可能な場合: Second possible case:

図10は、この出願の実施形態によるステレオ信号処理の概略図である。図10において、説明を容易にするために、遅延回復処理の前の第1のチャンネル信号内の点と、同じ位置にある伸張処理の後の第1のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。 FIG. 10 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 10, for ease of explanation, a point in the first channel signal before delay recovery processing and a point in the first channel signal after decompression processing at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same.

図10において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB3=0であり、現在のフレームの第1のチャンネル信号の終了点はE3=N-1である。 In FIG. 10, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B3=0, and the ending point of the first channel signal of the current frame is E3=N. -1.

図10において、第3の処理長の開始点はD3であり、第3の処理長の信号の終了点はC3=D3-abs(cur_itd)+L2_next_target-1である。A3は第3のアライメント処理長の信号の開始点であり、A3=D3-abs(cur_itd)である。第3のアライメント処理長の信号の終了点の座標は、第3の処理長の信号の終了点C3の座標と同じであり、すなわち、C3=A3+L2_next_target-1=D3-abs(cur_itd)+L2_next_target-1である。第3の処理長の信号の開始点D3は、現在のフレームの第1のチャンネル信号の開始点B3の後に位置し、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上である。第3の処理長の信号の開始点D3と現在のフレームの第1のチャンネル信号の開始点B3との間の長さは、第3のプリセット長である。第3のプリセット長は、実際の状況に基づいて決定されてもよく、第3のプリセット長は、0よりも大きく、現在のフレームのフレーム長と第3の処理長との間の差以下である。図10において、第3のプリセット長が、現在のフレームのチャンネル間時間差の絶対値よりも大きいことが、説明のための例として使用される。第3のプリセット長の他の場合については、ここでの説明を参照する。 In FIG. 10, the starting point of the third processing length is D3 and the ending point of the signal of the third processing length is C3=D3-abs(cur_itd)+L2_next_target-1. A3 is the starting point of the signal of the third alignment process length, A3=D3-abs(cur_itd). The coordinates of the end point of the signal of the third alignment process length are the same as the coordinates of the end point C3 of the signal of the third process length, i.e. C3=A3+L2_next_target-1=D3-abs(cur_itd)+ It is L2_next_target-1. The starting point D3 of the signal of the third processing length is located after the starting point B3 of the signal of the first channel of the current frame, and the starting point of the signal of the third processing length and the first channel of the current frame The length between the end points of the signal is greater than or equal to the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame. The length between the starting point D3 of the signal of the third processing length and the starting point B3 of the first channel signal of the current frame is the third preset length. The third preset length may be determined based on the actual situation, the third preset length is greater than 0 and less than or equal to the difference between the frame length of the current frame and the third processing length be. In FIG. 10, the fact that the third preset length is greater than the absolute value of the inter-channel time difference of the current frame is used as an illustrative example. For other cases of the third preset length, see the description here.

図10において、第3の処理長の信号の開始点D3と現在のフレームの第1のチャンネル信号の開始点B3との間の長さは、第3のプリセット長であり、第3のアライメント処理長の信号の開始点はA3であり、A3=A3=D3-abs(cur_itd)である。H3は、現在のフレームの第1のチャンネル信号の開始点B3の前に位置し、H3とA3との間の長さは、第3のプリセット長であり、H3とB3との間の長さは、現在のフレームのチャンネル間時間差の絶対値であり、すなわち、H3=B3-abs(cur_itd)である。 In FIG. 10, the length between the starting point D3 of the signal of the third processing length and the starting point B3 of the first channel signal of the current frame is the third preset length, and the third alignment processing The starting point of the long signal is A3, where A3=A3=D3-abs(cur_itd). H3 is located before the starting point B3 of the first channel signal of the current frame, the length between H3 and A3 is the third preset length, the length between H3 and B3 is the absolute value of the inter-channel time difference of the current frame, ie H3=B3-abs(cur_itd).

点A3は、現在のフレームの第1のチャンネル信号の開始点B3の前に位置してもよく、点A3と現在のフレームの第1のチャンネル信号の開始点B3との間の長さは、現在のフレームのチャンネル間時間差の絶対値以下である点に留意すべきである。点A3は、現在のフレームの第1のチャンネル信号の開始点B3に位置してもよい。点A3は、代替として、現在のフレームの第1のチャンネル信号の開始点B3の後に位置してもよく、点A3と現在のフレームの第1のチャンネル信号の開始点B3との間の長さは、現在のフレームのフレーム長と第3のアライメント処理長との間の差以下である。点A3が上記の位置にある場合については、ここでの説明を参照する。詳細は更に説明しない。 The point A3 may be located before the starting point B3 of the first channel signal of the current frame, and the length between the point A3 and the starting point B3 of the first channel signal of the current frame is Note that it is less than or equal to the absolute value of the inter-channel time difference of the current frame. Point A3 may be located at the starting point B3 of the first channel signal of the current frame. The point A3 may alternatively be located after the starting point B3 of the first channel signal of the current frame and the length between the point A3 and the starting point B3 of the first channel signal of the current frame is less than or equal to the difference between the frame length of the current frame and the third alignment process length. For the case where the point A3 is at the above position, refer to the description here. No further details are given.

遅延回復処理のプロセスにおいて、現在のフレームの第1のチャンネル信号の開始点B3から始まる第3のプリセット長の信号は、第3のアライメント処理長の開始点A3の前の第3のプリセット長の信号として使用されてもよい。図10を参照すると、現在のフレームの第1のチャンネル信号内の点B3から点D3-1までの信号は、遅延回復処理の後の第1のチャンネル信号内の点H3から点A3-1までの信号として使用される。 In the process of delay recovery processing, the signal of the third preset length starting from the starting point B3 of the first channel signal of the current frame is the third preset length before the starting point A3 of the third alignment processing length. May be used as a signal. Referring to FIG. 10, the signal from point B3 to point D3-1 in the first channel signal of the current frame corresponds to point H3 to point A3-1 in the first channel signal after delay recovery processing. used as a signal for

次いで、現在のフレームの第1のチャンネル信号内の開始点から始まる第3の処理長の信号は、第3のアライメント処理長の信号に伸張されてもよく、第3のアライメント処理長の伸張信号は、伸張処理の後の第1のチャンネル信号内の第3のアライメント処理長の開始点から始まる第3のアライメント処理長の信号として使用される。図10を参照すると、現在のフレームの第1のチャンネル信号内の開始点D3から点C3までの信号は、第3のアライメント処理長の信号に伸張され、伸張処理の後の第1のチャンネル信号内の点A3から点C3までの信号として使用される。 Then, the signal of the third process length starting from the starting point within the first channel signal of the current frame may be stretched to the signal of the third alignment process length, the stretched signal of the third alignment process length is used as the signal of the third alignment process length starting from the starting point of the third alignment process length in the first channel signal after decompression. Referring to FIG. 10, the signal from the starting point D3 to the point C3 in the first channel signal of the current frame is expanded to the signal of the third alignment processing length, and the first channel signal after the expansion processing is is used as the signal from point A3 to point C3 in

次いで、現在のフレームの第1のチャンネル信号内の点C3+1から点E3までの信号は、伸張処理の後の第1のチャンネル信号内の点C3+1から点E3までの信号として使用される。 Then the signal from point C3+1 to point E3 in the first channel signal of the current frame is used as the signal from point C3+1 to point E3 in the first channel signal after decompression. be.

最後に、伸張処理の後の第1のチャンネル信号内の開始点H3から始まるN点の信号は、遅延回復処理の後の現在のフレームの第1のチャンネル信号として使用される。遅延回復処理の後の現在のフレームの第1のチャンネル信号の開始点は点G3であり、G3=E3-abs(cur_itd)である。 Finally, the N-point signal starting from the starting point H3 in the first channel signal after decompression process is used as the first channel signal of the current frame after delay recovery process. The starting point of the first channel signal of the current frame after delay recovery processing is point G3, where G3=E3-abs(cur_itd).

2.前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行する。 2. Perform delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame.

具体的には、現在のフレームの第2のチャンネル信号内の第4の処理長の信号は、遅延回復処理の後の現在のフレームの第2のチャンネル信号を取得するために、第4のアライメント処理長の信号に圧縮される。第4の処理長は、前のフレームのチャンネル間時間差及び第4のアライメント処理長に基づいて決定され、第4の処理長は、第4のアライメント処理長よりも大きい。 Specifically, the signal of the fourth processing length in the second channel signal of the current frame is subjected to the fourth alignment to obtain the second channel signal of the current frame after delay recovery processing. Compressed to process length signal. A fourth process length is determined based on the inter-channel time difference of the previous frame and a fourth alignment process length, where the fourth process length is greater than the fourth alignment process length.

この出願のこの実施形態では、第4の処理長は、前のフレームのチャンネル間時間差の絶対値と第4のアライメント処理長との和でもよい。さらに、第4の処理長の信号の開始点は、第4のアライメント処理長の信号の開始点の前に位置し、第4の処理長の信号の開始点と第4のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 In this embodiment of this application, the fourth process length may be the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length. Further, the starting point of the signal of the fourth process length is positioned before the starting point of the signal of the fourth alignment process length, and the starting point of the signal of the fourth process length and the signal of the fourth alignment process length is the absolute value of the inter-channel time difference of the previous frame.

第4のアライメント処理長は、プリセット長でもよく、或いは、他の方式で決定されてもよく、例えば、式(9)に従って決定されてもよい点に留意すべきである。この出願のこの実施形態では、第4のアライメント処理長が現在のフレームのフレーム長以下であり、第4のアライメント処理長が予め設定されるとき、第4のアライメント処理長は、L、L/2、L/3又はL以下のいずれかの長さでもよい。 It should be noted that the fourth alignment process length may be a preset length, or may be determined in some other manner, for example, according to equation (9). In this embodiment of this application, when the fourth alignment process length is less than or equal to the frame length of the current frame and the fourth alignment process length is preset, the fourth alignment process length is L, L/ Any length less than 2, L/3 or L is acceptable.

この出願のこの実施形態では、第4のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に位置してもよく、或いは、現在のフレームの第2のチャンネル信号の開始点の後に位置してもよい。しかし、いずれの場合でも、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第4のアライメント処理長以上であり、これらは以下に別々に記載される。 In this embodiment of this application, the starting point of the signal of the fourth alignment process length may be located at the starting point of the second channel signal of the current frame, or the second channel signal of the current frame. It may be located after the start of the signal. However, in any case, the length between the start point of the signal of the fourth alignment process length and the end point of the second channel signal of the current frame is greater than or equal to the fourth alignment process length, and these are described separately below.

第1の可能な場合: First possible case:

図11は、この出願の実施形態によるステレオ信号処理の概略図である。図11において、説明を容易にするために、遅延回復処理の前の第2のチャンネル信号内の点と、同じ位置にある圧縮処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。 FIG. 11 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 11, for ease of explanation, a point in the second channel signal before delay recovery processing and a point in the second channel signal after compression processing at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same.

図11において、現在のフレームのフレーム長はNであり、現在のフレームの第2のチャンネル信号の開始点はB4=0であり、現在のフレームの第2のチャンネル信号の終了点はE4=N-1である。 In FIG. 11, the frame length of the current frame is N, the start point of the second channel signal of the current frame is B4=0, and the end point of the second channel signal of the current frame is E4=N. -1.

第4のアライメント処理長の開始点は、現在のフレームの第2のチャンネル信号の開始点B4に位置し、第4のアライメント処理長の信号の終了点はC4=B4+L2_pre_target-1である。第4の処理長の信号の開始点はA4=B4-abs(prev_itd)であり、第4の処理長の信号の終了点はC4であり、これは、第4のアライメント処理長の信号の開始点の座標と同じである。 The start point of the fourth alignment length is located at the start point B4 of the second channel signal of the current frame, and the end point of the signal of the fourth alignment length is C4=B4+L2_pre_target-1. The starting point of the signal of the fourth treatment length is A4=B4-abs(prev_itd), the ending point of the signal of the fourth treatment length is C4, which is the start of the signal of the fourth alignment treatment length Same as point coordinates.

遅延回復処理のプロセスにおいて、第4の処理長の信号の開始点から始まる第4の処理長の信号は、第4のアライメント処理長の信号に圧縮されてもよく、第4のアライメント処理長の圧縮信号は、圧縮処理の後の第2のチャンネル信号内の点B4から始まる第4のアライメント処理長の信号として使用される。図11を参照すると、点A4から点C4までの信号は、第4のアライメント処理長の信号に圧縮され、第4のアライメント処理長の圧縮信号は、圧縮処理の後の第2のチャンネル信号内の点B4から点C4までの信号として使用される。 In the process of the delay recovery process, the signal of the fourth process length starting from the starting point of the signal of the fourth process length may be compressed into the signal of the fourth alignment process length, The compressed signal is used as a fourth alignment length signal starting from point B4 in the second channel signal after compression. Referring to FIG. 11, the signal from point A4 to point C4 is compressed into a signal of the fourth alignment length, and the compressed signal of the fourth alignment length is within the second channel signal after compression processing. is used as the signal from point B4 to point C4 of .

次いで、現在のフレームの第2のチャンネル信号内の点C4+1から点E4までの信号は、圧縮処理の後の第2のチャンネル信号内の点C4+1から点E4までの信号として使用される。 Then the signal from point C4+1 to point E4 in the second channel signal of the current frame is used as the signal from point C4+1 to point E4 in the second channel signal after compression processing. be.

最後に、圧縮処理の後の第2のチャンネル信号内の開始点B4から始まるN点の信号が、遅延回復処理の後の現在のフレームの第2のチャンネル信号として使用され、すなわち、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号の開始点は点B4であり、終了点はE4である。 Finally, the N-point signal starting from the starting point B4 in the second channel signal after compression processing is used as the second channel signal of the current frame after delay recovery processing, i.e. delay alignment processing The starting point of the second channel signal of the current frame after is point B4 and the ending point is E4.

第2の可能な場合: Second possible case:

図12は、この出願の実施形態によるステレオ信号処理の概略図である。図12において、説明を容易にするために、遅延回復処理の前の現在のフレームの第2のチャンネル信号内の点と、同じ位置にある圧縮処理の後の現在のフレームの第2のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。 FIG. 12 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 12, for ease of explanation, the point in the second channel signal of the current frame before the delay recovery process and the second channel signal of the current frame after the compression process are at the same position. Points within are marked by using the same coordinates, but this does not mean that the signals of points with the same coordinates are the same.

図12において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB4=0であり、現在のフレームの第1のチャンネル信号の終了点はE4=N-1である。 In FIG. 12, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B4=0, and the ending point of the first channel signal of the current frame is E4=N. -1.

第4のアライメント処理長の開始点はD4であり、第4のアライメント処理長の信号の終了点はC4=D4+L2_pre_target-1である。第4のアライメント処理長の信号の開始点D4は、現在のフレームの第2のチャンネル信号の開始点B4の後に位置し、第4のアライメント処理長の信号の開始点D4と現在のフレームの第2のチャンネル信号の終了点E4との間の長さは、第4のアライメント処理長以上である。 The start point of the fourth alignment length is D4, and the end point of the signal of the fourth alignment length is C4=D4+L2_pre_target-1. The starting point D4 of the signal of the fourth alignment process length is located after the starting point B4 of the second channel signal of the current frame, and the starting point D4 of the signal of the fourth alignment process length and the second channel signal of the current frame The length between the second channel signal and the end point E4 is longer than or equal to the fourth alignment processing length.

説明を容易にするために、第4のアライメント処理長の信号の開始点D4と現在のフレームの第2のチャンネル信号の開始点B4との間の長さは、第4のプリセット長であり、第4のプリセット長は、0よりも大きく、現在のフレームのフレーム長と第4のアライメント処理長との間の差以下である。 For ease of explanation, the length between the starting point D4 of the signal of the fourth alignment process length and the starting point B4 of the second channel signal of the current frame is the fourth preset length, The fourth preset length is greater than 0 and less than or equal to the difference between the frame length of the current frame and the fourth alignment process length.

第4の処理長の信号の開始点はA4=D4-abs(prev_itd)であり、第4の処理長の信号の終了点はC4であり、これは、第4のアライメント処理長信号の開始点の座標と同じである。 The starting point of the signal of the fourth treatment length is A4=D4-abs(prev_itd), the ending point of the signal of the fourth treatment length is C4, which is the starting point of the fourth alignment treatment length signal are the same as the coordinates of

図12において、点H4と点A4との間の長さは、第4のプリセット長であり、点H4と点B4との間の長さは、前のフレームのチャンネル間時間差の絶対値であり、すなわち、H4=B4-abs(prev_itd)である。 In FIG. 12, the length between point H4 and point A4 is the fourth preset length, and the length between point H4 and point B4 is the absolute value of the inter-channel time difference of the previous frame. , that is, H4=B4-abs(prev_itd).

遅延回復処理のプロセスにおいて、現在のフレームの第2のチャンネル信号内の第4の処理長の信号の開始点の前の第4のプリセット長の信号は、圧縮処理の後の第2のチャンネル信号内の点B4から始まる第4のプリセット長の信号として使用されてもよい。図12を参照すると、点H4から点A4-1までの信号は、圧縮処理の後の第2のチャンネル信号内の点B4から点D4-1までの信号として使用される。 In the process of delay recovery processing, the fourth preset length signal before the starting point of the fourth processing length signal in the second channel signal of the current frame is the second channel signal after compression processing may be used as a signal of a fourth preset length starting from point B4 in. Referring to FIG. 12, the signals from point H4 to point A4-1 are used as the signals from point B4 to point D4-1 in the second channel signal after compression processing.

次いで、現在のフレームの第2のチャンネル信号内の第4の処理長の信号の開始点から始まる第4の処理長の信号は、第4のアライメント処理長の信号に圧縮されてもよく、第4のアライメント処理長の圧縮信号は、圧縮処理の後の第2のチャンネル信号内の第4のアライメント処理長の信号の開始点から始まる第4のアライメント処理長の信号として使用される。図12を参照すると、現在のフレームの第2のチャンネル信号内の点A4から点C4までの信号は、第4のアライメント処理長の信号に圧縮され、第4のアライメント処理長の圧縮信号は、圧縮処理の後の第2のチャンネル信号内の点D4から点C4までの信号として使用される。 Then, the fourth process length signal starting from the starting point of the fourth process length signal in the second channel signal of the current frame may be compressed into a fourth alignment process length signal, The 4 alignment length compressed signal is used as the fourth alignment length signal starting from the starting point of the fourth alignment length signal in the second channel signal after compression processing. Referring to FIG. 12, the signal from point A4 to point C4 in the second channel signal of the current frame is compressed into a signal of the fourth alignment length, and the compressed signal of the fourth alignment length is It is used as the signal from point D4 to point C4 in the second channel signal after compression processing.

次いで、現在のフレームの第2のチャンネル信号内の非圧縮信号は不変のままであり、すなわち、現在のフレームの第2のチャンネル信号内の点C4+1から点E4までの信号は、圧縮処理の後の第2のチャンネル信号内の点C4+1から点E4までの信号として使用される。 Then the uncompressed signal in the second channel signal of the current frame remains unchanged, i.e. the signal from point C4+1 to point E4 in the second channel signal of the current frame is subjected to the compression process. is used as the signal from point C4+1 to point E4 in the second channel signal after .

最後に、圧縮処理の後の第2のチャンネル信号内の開始点B4から始まるN点の信号が、遅延回復処理の後の現在のフレームの第2のチャンネル信号として使用される。 Finally, the N-point signal starting from the starting point B4 in the second channel signal after compression processing is used as the second channel signal of the current frame after delay recovery processing.

以下に、具体的な実施形態を使用することにより説明を提供する。 In the following, explanation is provided by using specific embodiments.

ステップ1:受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定する。 Step 1: Determine the inter-channel time difference of the current frame based on the received codestream.

このステップの具体的な内容については、ステップ801を参照する。詳細はここでは再び説明しない。 See step 801 for the specific content of this step. Details are not described here again.

ステップ2:現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行する。 Step 2: Delay with respect to the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame Carry out the recovery process.

ステップ3:現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行する。 Step 3: Delay with respect to the second channel signal of the current frame based on the inter-channel time difference of the previous frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame. Carry out the recovery process.

ステップ2及びステップ3において、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第4のプリセット長に等しく、第3のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第4のプリセット長と第4のアライメント処理長との和に等しい。さらに、第3のアライメント処理長は式(8)を満たし、第4のアライメント処理長は式(9)を満たす。この場合、図13に示すように、第3の処理長の信号は伸張され、第4の処理長の信号は圧縮される。図13において、第4アライメント処理長の開始点が現在のフレームの第1のチャンネル信号の開始点に位置する例が説明に使用される。第4のアライメント処理長の開始点が他の位置に位置するとき、第4のアライメント処理長の開始点が現在のフレームの第2のチャンネル信号の開始点B4の後に位置するときに遅延回復処理が第2のチャンネル信号に対して実行される説明と、この場合に遅延回復処理が第1のチャンネル信号に対して実行される説明とを参照する。詳細はここでは説明しない。 In steps 2 and 3, the length between the starting point of the signal of the fourth alignment process length and the starting point of the second channel signal of the current frame is equal to the fourth preset length, and the third The length between the start of the alignment process length signal and the start of the first channel signal of the current frame is equal to the sum of the fourth preset length and the fourth alignment process length. Furthermore, the third alignment process length satisfies equation (8), and the fourth alignment process length satisfies equation (9). In this case, as shown in FIG. 13, the signal of the third processing length is expanded and the signal of the fourth processing length is compressed. In FIG. 13, the example where the starting point of the fourth alignment process length is located at the starting point of the first channel signal of the current frame is used for illustration. Delay recovery processing when the starting point of the fourth alignment length is located after the starting point B4 of the second channel signal of the current frame when the starting point of the fourth alignment length is located at another position is performed on the second channel signal and in this case the delay recovery process is performed on the first channel signal. Details are not described here.

図13において、現在のフレームのフレーム長はNであり、現在のフレームの第2のチャンネル信号の開始点はB4=0であり、現在のフレームの第2のチャンネル信号の終了点はE4=N-1である。第4のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点B4に位置し、第4のアライメント処理長の信号の終了点はC4=B4+L2_pre_target-1である。第4の処理長の信号の開始点はA4=B4-abs(prev_itd)であり、第4の処理長の信号の終了点はC4=B4+L2_pre_target-1である。 In FIG. 13, the frame length of the current frame is N, the start point of the second channel signal of the current frame is B4=0, and the end point of the second channel signal of the current frame is E4=N. -1. The starting point of the signal of the fourth alignment process length is located at the starting point B4 of the signal of the second channel of the current frame, and the ending point of the signal of the fourth alignment process length is C4=B4+L2_pre_target-1. be. The starting point of the signal of the fourth processing length is A4=B4-abs(prev_itd) and the ending point of the signal of the fourth processing length is C4=B4+L2_pre_target-1.

現在のフレームの第1のチャンネル信号の開始点はB3=0であり、現在のフレームの第1のチャンネル信号の終了点はE3=N-1である。第3の処理長の信号の開始点はD3=B4+L2_pre_targetであり、D3=C4+1である。第3の処理長の信号の終了点はC3=A3+L2_next_target-1であり、第3の処理長の信号の開始点はA3=D3-abs(cur_itd)であり、第3の処理長の信号の終了点はC3=A3+L_next_target-1である。 The starting point of the first channel signal of the current frame is B3=0, and the ending point of the first channel signal of the current frame is E3=N-1. The starting point of the third processing length signal is D3=B4+L2_pre_target and D3=C4+1. The end point of the signal of the third treatment length is C3=A3+L2_next_target-1, the start point of the signal of the third treatment length is A3=D3-abs(cur_itd), the signal of the third treatment length end point is C3=A3+L_next_target-1.

遅延回復処理のプロセスにおいて、第1のチャンネル信号について、現在のフレームの第1のチャンネル信号内の点B3から点D3-1までの信号は、伸張処理の後の第1のチャンネル信号内の点H3から点A3-1までの信号として直接使用され、H3=A3-L2_pre_targetである。 In the process of delay recovery processing, for the first channel signal, the signal from point B3 to point D3-1 in the first channel signal of the current frame is the point in the first channel signal after decompression processing Directly used as signal from H3 to point A3-1, H3=A3-L2_pre_target.

次いで、現在のフレームの第1のチャンネル信号内の点D3から点C3までの信号は、第3のアライメント処理長の信号に伸張され、第3のアライメント処理長の伸張信号は、伸張処理の後の第1のチャンネル信号内の点A3から点C3までの信号として使用される。 Then, the signal from point D3 to point C3 in the first channel signal of the current frame is stretched to the signal of the third alignment process length, and the stretched signal of the third alignment process length is is used as the signal from point A3 to point C3 in the first channel signal of .

次いで、現在のフレームの第1のチャンネル信号内の点C3+1から点E3までの信号は、伸張処理の後の第1のチャンネル信号内の点C3+1から点E3までの信号として使用される。 Then the signal from point C3+1 to point E3 in the first channel signal of the current frame is used as the signal from point C3+1 to point E3 in the first channel signal after decompression. be.

最後に、延長処理の後の第1のチャンネル信号内の開始点A3から始まるN点の信号は、遅延回復処理の後の現在のフレームの第1のチャンネル信号として使用される。遅延回復処理の後の現在のフレームの第1のチャンネル信号の開始点は点A3であり、終了点は点G3であり、G3=E3-abs(cur_itd)である。 Finally, the N-point signal starting from the starting point A3 in the first channel signal after the extension process is used as the first channel signal of the current frame after the delay recovery process. The starting point of the first channel signal of the current frame after delay recovery processing is point A3, the ending point is point G3, and G3=E3-abs(cur_itd).

遅延回復処理のプロセスにおいて、第2のチャンネル信号について、点A4から点C4までの信号は、第4のアライメント処理長の信号に圧縮され、第4アライメント処理長の圧縮信号は、圧縮処理の後の第2のチャンネル信号内の点B4から点C4までの信号として使用される。 In the process of delay recovery processing, for the second channel signal, the signal from point A4 to point C4 is compressed into a signal of the fourth alignment length, and the compressed signal of the fourth alignment length is compressed after the compression processing. is used as the signal from point B4 to point C4 in the second channel signal of .

次いで、現在のフレームの第2のチャンネル信号内の点C4+1から点E4までの信号は、圧縮処理の後の第2のチャンネル信号内の点C4+1から点E4までの信号として使用される。 Then the signal from point C4+1 to point E4 in the second channel signal of the current frame is used as the signal from point C4+1 to point E4 in the second channel signal after compression processing. be.

最後に、圧縮処理の後の第2のチャンネル信号内の開始点B4から始まるN点の信号は、遅延回復処理の後の現在のフレームの第2のチャンネル信号として使用され、すなわち、遅延回復処理の後の現在のフレームの第2のチャンネル信号の開始点は点B4であり、終了点は点E4である。 Finally, the N-point signal starting from the starting point B4 in the second channel signal after compression processing is used as the second channel signal of the current frame after delay recovery processing, i.e. delay recovery processing The starting point of the second channel signal of the current frame after is point B4 and the ending point is point E4.

この出願のこの実施形態では、信号の伸張又は圧縮方法は限定されない点に留意すべきである。詳細については、ステップ101及びステップ102における説明を参照する。詳細はここでは再び説明しない。 It should be noted that in this embodiment of this application the method of signal expansion or compression is not limited. For details, refer to the explanations in steps 101 and 102 . Details are not described here again.

この出願のこの実施形態では、フレーム間に遷移区間長が存在するとき、上記の説明を参照する。詳細はここでは説明しない。 In this embodiment of this application, reference is made to the above description when there is a transition interval length between frames. Details are not described here.

同じ技術的概念に基づいて、この出願の実施形態は、ステレオ信号処理装置を更に提供し、ステレオ信号処理装置は、図1における方法の手順を実行してもよい。 Based on the same technical concept, the embodiments of this application further provide a stereo signal processing device, and the stereo signal processing device may perform the steps of the method in FIG.

図14に示すように、この出願の実施形態は、ステレオ信号処理装置の概略構造図を提供する。 As shown in FIG. 14, the embodiment of this application provides a schematic structural diagram of a stereo signal processing device.

図14を参照すると、ステレオ信号処理装置1400は、
現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に基づいて遅延推定を実行するように構成された遅延推定ユニット1401と、
現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なると決定された場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するように構成された処理ユニット1402であり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、現在のフレームのステレオ信号内にあり且つ前のフレームのターゲットチャンネルと同じチャンネル上にある信号である、処理ユニット1042と
を含む。
Referring to FIG. 14, the stereo signal processing device 1400 includes:
a delay estimation unit 1401 configured to perform delay estimation based on the stereo signal of the current frame to determine the inter-channel time difference of the current frame;
for the first channel signal of the current frame based on the inter-channel time difference of the current frame, if it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame. a processing unit 1402 configured to perform delay alignment processing and to perform delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; a processing unit 1042, wherein the signal is the target channel signal of the current frame and the second channel signal is the signal within the stereo signal of the current frame and on the same channel as the target channel of the previous frame; including.

任意選択で、処理ユニット1402は、
遅延アライメント処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮するように具体的に構成され、
第1の処理長は、現在のフレームのチャンネル間時間差及び第1のアライメント処理長に基づいて決定され、第1の処理長は、第1のアライメント処理長よりも大きい。
Optionally, processing unit 1402
The signal of the first processing length in the first channel signal of the current frame is changed to the signal of the first alignment processing length to obtain the first channel signal of the current frame after the delay alignment processing. specifically configured to compress,
The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, where the first process length is greater than the first alignment process length.

任意選択で、第1の処理長は、現在のフレームのチャンネル間時間差の絶対値と第1のアライメント処理長との和である。 Optionally, the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length.

任意選択で、第1の処理長の信号の開始点は、第1のアライメント処理長の信号の開始点の前に位置し、第1の処理長の信号の開始点と第1のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the first treatment length is located before the starting point of the signal of the first alignment treatment length, such that the starting point of the signal of the first treatment length and the first alignment treatment length is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長以上である。 Optionally, the starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the first channel signal of the current frame is greater than or equal to the first alignment process length.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移長との和以上であり、遷移長は、現在のフレームのチャンネル間時間差の絶対値の最大値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition length, and between the start point of the signal of the first alignment process length and the end point of the first channel signal of the current frame is greater than or equal to the sum of the length of the first alignment process and the transition length, and the transition length is less than or equal to the maximum absolute value of the inter-channel time difference of the current frame.

任意選択で、処理ユニット1402は、
遅延アライメント処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張するように具体的に構成され、
第2の処理長は、前のフレームのチャンネル間時間差及び第2のアライメント処理長に基づいて決定され、第2の処理長は、第2のアライメント処理長未満である。
Optionally, processing unit 1402
To obtain the second channel signal of the current frame after the delay alignment process, the signal of the second process length in the second channel signal of the current frame is changed to the signal of the second alignment process length. specifically configured to stretch,
A second process length is determined based on the inter-channel time difference of the previous frame and a second alignment process length, where the second process length is less than the second alignment process length.

任意選択で、第2の処理長は、第2のアライメント処理長と前のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2の処理長の信号の開始点は、第2のアライメント処理長の信号の開始点の後に位置し、第2の処理長の信号の開始点と第2のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the starting point of the second alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第2のアライメント処理長以上である。 Optionally, the starting point of the signal of the second alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame and The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the second alignment process length.

任意選択で、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第2のプリセット長に等しく、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第2のプリセット長と第2のアライメント処理長との和に等しい。 Optionally, a length between the start of the signal of the second alignment process length and the start of the second channel signal of the current frame is equal to the second preset length and the first alignment process length is equal to the sum of the second preset length and the second alignment process length.

任意選択で、第1のアライメント処理長は、現在のフレームのフレーム長以下であり、第1のアライメント処理長は、プリセット長であるか、或いは、第1のアライメント処理長は、以下の式を満たし、

Figure 2023085339000028
L_next_targetは第1のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length is a preset length; fill,
Figure 2023085339000028
L_next_target is the first alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第2のアライメント処理長は、現在のフレームのフレーム長以下であり、第2のアライメント処理長は、プリセット長であるか、或いは、第2のアライメント処理長は、以下の式を満たし、

Figure 2023085339000029
L_pre_targetは第2のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the second alignment process length is less than or equal to the frame length of the current frame, and the second alignment process length is a preset length; fill,
Figure 2023085339000029
L_pre_target is the length of the second alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000030
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is less than or equal to the frame length of the current frame, and the process length of the delayed alignment process is a preset length; fill,
Figure 2023085339000030
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

同じ技術的概念に基づいて、この出願の実施形態は、ステレオ信号処理装置を更に提供し、ステレオ信号処理装置は、図1における方法の手順を実行してもよい。 Based on the same technical concept, the embodiments of this application further provide a stereo signal processing device, and the stereo signal processing device may perform the steps of the method in FIG.

図15に示すように、この出願の実施形態は、ステレオ信号処理装置の概略構造図を提供する。 As shown in FIG. 15, the embodiment of this application provides a schematic structural diagram of a stereo signal processing device.

図15を参照すると、ステレオ信号処理装置1500は、プロセッサ1501及びメモリ1502を含む。 Referring to FIG. 15, stereo signal processing apparatus 1500 includes processor 1501 and memory 1502 .

メモリ1052は実行可能命令を記憶し、実行可能命令は、プロセッサ1501に対して、以下のステップ、すなわち、
現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に対して遅延推定を実行するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される。
Memory 1052 stores executable instructions, which are sent to processor 1501 to perform the following steps:
The step of performing delay estimation on the current frame stereo signal to determine the current frame inter-channel time difference, wherein the current frame inter-channel time difference is between the current frame first channel signal and a step, which is the time difference between the current frame and the second channel signal;
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay alignment processing and performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, a second channel signal, on the same channel as the target channel signal of the previous frame, is used to command the steps to be performed.

任意選択で、実行可能命令は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行するとき、プロセッサ1501に対して、以下のステップ、すなわち、
遅延アライメント処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮するステップであり、
第1の処理長は、現在のフレームのチャンネル間時間差及び第1のアライメント処理長に基づいて決定され、第1の処理長は、第1のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions direct the processor 1501 to perform the following steps when performing delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame: ,
The signal of the first processing length in the first channel signal of the current frame is changed to the signal of the first alignment processing length to obtain the first channel signal of the current frame after the delay alignment processing. a step of compressing;
The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, wherein the first process length is greater than the first alignment process length, so as to perform the step used to command.

任意選択で、第1の処理長は、現在のフレームのチャンネル間時間差の絶対値と第1のアライメント処理長との和である。 Optionally, the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length.

任意選択で、第1の処理長の信号の開始点は、第1のアライメント処理長の信号の開始点の前に位置し、第1の処理長の信号の開始点と第1のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the first treatment length is located before the starting point of the signal of the first alignment treatment length, such that the starting point of the signal of the first treatment length and the first alignment treatment length is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長以上である。 Optionally, the starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the first channel signal of the current frame is greater than or equal to the first alignment process length.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移長との和以上であり、遷移長は、現在のフレームのチャンネル間時間差の絶対値の最大値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition length, and between the start point of the signal of the first alignment process length and the end point of the first channel signal of the current frame is greater than or equal to the sum of the length of the first alignment process and the transition length, and the transition length is less than or equal to the maximum absolute value of the inter-channel time difference of the current frame.

任意選択で、実行可能命令は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するとき、プロセッサ1501に対して、以下のステップ、すなわち、
遅延アライメント処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張するステップであり、
第2の処理長は、前のフレームのチャンネル間時間差及び第2のアライメント処理長に基づいて決定され、第2の処理長は、第2のアライメント処理長未満である、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor 1501 to perform the following steps: ,
To obtain the second channel signal of the current frame after the delay alignment process, the signal of the second process length in the second channel signal of the current frame is changed to the signal of the second alignment process length. a step of stretching,
A second process length is determined based on the inter-channel time difference of the previous frame and a second alignment process length, wherein the second process length is less than the second alignment process length, to perform the step used to command.

任意選択で、第2の処理長は、第2のアライメント処理長と前のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2の処理長の信号の開始点は、第2のアライメント処理長の信号の開始点の後に位置し、第2の処理長の信号の開始点と第2のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the starting point of the second alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第2のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第2のアライメント処理長以上である。 Optionally, the starting point of the signal of the second alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame and The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the second alignment process length.

任意選択で、第2のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第2のプリセット長に等しく、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第2のプリセット長と第2のアライメント処理長との和に等しい。 Optionally, a length between the start of the signal of the second alignment process length and the start of the second channel signal of the current frame is equal to the second preset length and the first alignment process length is equal to the sum of the second preset length and the second alignment process length.

任意選択で、第1のアライメント処理長は、現在のフレームのフレーム長以下であり、第1のアライメント処理長は、プリセット長であるか、或いは、第1のアライメント処理長は、以下の式を満たし、

Figure 2023085339000031
L_next_targetは第1のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length is a preset length; fill,
Figure 2023085339000031
L_next_target is the first alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第2のアライメント処理長は、現在のフレームのフレーム長以下であり、第2のアライメント処理長は、プリセット長であるか、或いは、第2のアライメント処理長は、以下の式を満たし、

Figure 2023085339000032
L_pre_targetは第2のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the second alignment process length is less than or equal to the frame length of the current frame, and the second alignment process length is a preset length; fill,
Figure 2023085339000032
L_pre_target is the length of the second alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000033
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is less than or equal to the frame length of the current frame, and the process length of the delayed alignment process is a preset length; fill,
Figure 2023085339000033
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

同じ技術的概念に基づいて、この出願の実施形態は、ステレオ信号処理装置を更に提供し、ステレオ信号処理装置は、図8における方法の手順を実行してもよい。 Based on the same technical concept, the embodiments of this application further provide a stereo signal processing device, and the stereo signal processing device may perform the steps of the method in FIG.

図16に示すように、この出願の実施形態は、ステレオ信号処理装置の概略構造図を提供する。 As shown in FIG. 16, the embodiment of this application provides a schematic structural diagram of a stereo signal processing device.

図16を参照すると、ステレオ信号処理装置1600は、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するように構成されたトランシーバユニット1601と、
現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するように構成された処理ユニット1602であり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、現在のフレームのステレオ信号内にあり且つ前のフレームのターゲットチャンネルと同じチャンネル上にある信号である、処理ユニット1602と
を含む。
Referring to FIG. 16, the stereo signal processing device 1600 includes:
a transceiver unit 1601 configured to determine an inter-channel time difference for the current frame based on the received codestream;
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame, perform delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame. and perform delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current and a processing unit 1602, wherein the second channel signal is the target channel signal of the first frame and the second channel signal is the signal that is within the stereo signal of the current frame and on the same channel as the target channel of the previous frame.

任意選択で、処理ユニット1602は、
遅延回復処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張するように具体的に構成され、
第3の処理長は、現在のフレームのチャンネル間時間差及び第3のアライメント処理長に基づいて決定され、第3の処理長は、第3のアライメント処理長未満である。
Optionally, processing unit 1602
The signal of the third processing length in the first channel signal of the current frame is combined with the signal of the third alignment processing length to obtain the first channel signal of the current frame after delay recovery processing. specifically configured to stretch,
A third process length is determined based on the inter-channel time difference of the current frame and a third alignment process length, where the third process length is less than the third alignment process length.

任意選択で、第3の処理長は、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、第3のアライメント処理長の信号の開始点の後に位置し、第3の処理長の信号の開始点と第3のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the starting point of the third alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上である。 Optionally, the starting point of the signal of the third processing length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame and The length between the start point of the signal of the process length and the end point of the first channel signal of the current frame is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame That's it.

任意選択で、処理ユニット1602は、
遅延回復処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮するように具体的に構成され、
第4の処理長は、前のフレームのチャンネル間時間差及び第4のアライメント処理長に基づいて決定され、第4の処理長は、第4のアライメント処理長よりも大きい。
Optionally, processing unit 1602
The signal of the fourth processing length in the second channel signal of the current frame is combined with the signal of the fourth alignment processing length to obtain the second channel signal of the current frame after delay recovery processing. specifically configured to compress,
A fourth process length is determined based on the inter-channel time difference of the previous frame and a fourth alignment process length, where the fourth process length is greater than the fourth alignment process length.

任意選択で、第4の処理長は、前のフレームのチャンネル間時間差の絶対値と第4のアライメント処理長との和である。 Optionally, the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length.

任意選択で、第4の処理長の信号の開始点は、第4のアライメント処理長の信号の開始点の前に位置し、第4の処理長の信号の開始点と第4のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the fourth process length is located before the starting point of the signal of the fourth alignment process length, such that the starting point of the signal of the fourth process length and the fourth alignment process length is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第4のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第4のアライメント処理長以上である。 Optionally, the starting point of the signal of the fourth alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the fourth alignment process length.

任意選択で、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第4のプリセット長に等しく、第3のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第4のプリセット長と第4のアライメント処理長との和に等しい。 Optionally, the length between the starting point of the signal of the fourth alignment process length and the starting point of the second channel signal of the current frame is equal to the fourth preset length and the third alignment process length is equal to the sum of the fourth preset length and the fourth alignment process length.

任意選択で、第3のアライメント処理長は、現在のフレームのフレーム長以下であり、第3のアライメント処理長は、プリセット長であるか、或いは、第3のアライメント処理長は、以下の式を満たし、

Figure 2023085339000034
L2_next_targetは第3のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the third alignment process length is less than or equal to the frame length of the current frame, and the third alignment process length is a preset length; fill,
Figure 2023085339000034
L2_next_target is the length of the third alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process.

任意選択で、第4のアライメント処理長は、現在のフレームのフレーム長以下であり、第4のアライメント処理長は、プリセット長であるか、或いは、第4のアライメント処理長は、以下の式を満たし、

Figure 2023085339000035
L2_pre_targetは第4のアライメント処理長であり、cur_itdは現在のフレームのチャンネル間時間差であり、prev_itdは前のフレームのチャンネル間時間差であり、Lは遅延アライメント処理の処理長である。 Optionally, the fourth alignment process length is less than or equal to the frame length of the current frame, and the fourth alignment process length is a preset length; fill,
Figure 2023085339000035
L2_pre_target is the length of the fourth alignment process, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delay alignment process.

任意選択で、遅延アライメント処理の処理長は、現在のフレームのフレーム長以下であり、遅延アライメント処理の処理長は、プリセット長であるか、或いは、遅延アライメント処理の処理長は、以下の式を満たし、

Figure 2023085339000036
Lは遅延アライメント処理の処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である。 Optionally, the process length of the delayed alignment process is less than or equal to the frame length of the current frame, and the process length of the delayed alignment process is a preset length; fill,
Figure 2023085339000036
L is the processing length of the delay alignment process, MAX_DELAY_CHANGE is the maximum difference value between the inter-channel time differences of adjacent frames, and L_init is the preset process length of the delay alignment process.

同じ技術的概念に基づいて、この出願の実施形態は、ステレオ信号処理装置を更に提供し、ステレオ信号処理装置は、図8における方法の手順を実行してもよい。 Based on the same technical concept, the embodiments of this application further provide a stereo signal processing device, and the stereo signal processing device may perform the steps of the method in FIG.

図17に示すように、この出願の実施形態は、ステレオ信号処理装置の概略構造図を提供する。 As shown in FIG. 17, the embodiment of this application provides a schematic structural diagram of a stereo signal processing device.

図17を参照すると、ステレオ信号処理装置1700は、プロセッサ1701及びメモリ1702を含む。 Referring to FIG. 17, stereo signal processing device 1700 includes processor 1701 and memory 1702 .

メモリ1702は実行可能命令を記憶し、実行可能命令は、プロセッサ1701に対して、以下のステップ、すなわち、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するステップであり、現在のフレームのチャンネル間時間差は、現在のフレームの第1のチャンネル信号と現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
現在のフレームのチャンネル間時間差の符号が、現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するステップであり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される。
Memory 1702 stores executable instructions, which are sent to processor 1701 to perform the following steps:
determining the inter-channel time difference of the current frame based on the received codestream, wherein the inter-channel time difference of the current frame is the difference between the first channel signal of the current frame and the second channel signal of the current frame; a step, which is the time difference between
For the first channel signal of the current frame based on the inter-channel time difference of the current frame, if the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame before the current frame performing delay recovery processing, performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current frame's A target channel signal, a second channel signal, on the same channel as the target channel signal of the previous frame, is used to command the steps to be performed.

任意選択で、実行可能命令は、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行するとき、プロセッサ1701に対して、以下のステップ、すなわち、
遅延回復処理の後の現在のフレームの第1のチャンネル信号を取得するために、現在のフレームの第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張するステップであり、
第3の処理長は、現在のフレームのチャンネル間時間差及び第3のアライメント処理長に基づいて決定され、第3の処理長は、第3のアライメント処理長未満である、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame, instruct the processor 1701 to perform the following steps: ,
The signal of the third processing length in the first channel signal of the current frame is combined with the signal of the third alignment processing length to obtain the first channel signal of the current frame after delay recovery processing. a step of stretching,
A third process length is determined based on the inter-channel time difference of the current frame and a third alignment process length, wherein the third process length is less than the third alignment process length, to perform step used to command.

任意選択で、第3の処理長は、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差である。 Optionally, the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、第3のアライメント処理長の信号の開始点の後に位置し、第3の処理長の信号の開始点と第3のアライメント処理長の信号の開始点との間の長さは、現在のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the starting point of the third alignment process length The length to the start of the signal is the absolute value of the inter-channel time difference of the current frame.

任意選択で、第3の処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点に或いは現在のフレームの第1のチャンネル信号の開始点の後に位置し、第3の処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第3のアライメント処理長と現在のフレームのチャンネル間時間差の絶対値との間の差以上である。 Optionally, the starting point of the signal of the third processing length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame and The length between the start point of the signal of the process length and the end point of the first channel signal of the current frame is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame That's it.

任意選択で、実行可能命令は、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するとき、プロセッサ1701に対して、以下のステップ、すなわち、
遅延回復処理の後の現在のフレームの第2のチャンネル信号を取得するために、現在のフレームの第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮するステップであり、
第4の処理長は、前のフレームのチャンネル間時間差及び第4のアライメント処理長に基づいて決定され、第4の処理長は、第4のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される。
Optionally, the executable instructions, when performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor 1701 to perform the following steps: ,
The signal of the fourth processing length in the second channel signal of the current frame is combined with the signal of the fourth alignment processing length to obtain the second channel signal of the current frame after delay recovery processing. a step of compressing;
A fourth process length is determined based on the inter-channel time difference of the previous frame and a fourth alignment process length, wherein the fourth process length is greater than the fourth alignment process length, so as to perform step used to command.

任意選択で、第4の処理長は、前のフレームのチャンネル間時間差の絶対値と第4のアライメント処理長との和である。 Optionally, the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length.

任意選択で、第4の処理長の信号の開始点は、第4のアライメント処理長の信号の開始点の前に位置し、第4の処理長の信号の開始点と第4のアライメント処理長の信号の開始点との間の長さは、前のフレームのチャンネル間時間差の絶対値である。 Optionally, the starting point of the signal of the fourth process length is located before the starting point of the signal of the fourth alignment process length, such that the starting point of the signal of the fourth process length and the fourth alignment process length is the absolute value of the inter-channel time difference of the previous frame.

任意選択で、第4のアライメント処理長の信号の開始点は、現在のフレームの第2のチャンネル信号の開始点に或いは現在のフレームの第2のチャンネル信号の開始点の後に位置し、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の終了点との間の長さは、第4のアライメント処理長以上である。 Optionally, the starting point of the signal of the fourth alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame, The length between the start point of the alignment process length signal and the end point of the second channel signal of the current frame is greater than or equal to the fourth alignment process length.

任意選択で、第4のアライメント処理長の信号の開始点と現在のフレームの第2のチャンネル信号の開始点との間の長さは、第4のプリセット長に等しく、第3のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、第4のプリセット長と第4のアライメント処理長との和に等しい。 Optionally, the length between the starting point of the signal of the fourth alignment process length and the starting point of the second channel signal of the current frame is equal to the fourth preset length and the third alignment process length is equal to the sum of the fourth preset length and the fourth alignment process length.

この出願の実施形態は、上記のプロセッサにより実行される必要があるコンピュータソフトウェア命令を記憶するように構成されたコンピュータ読み取り可能記憶媒体を更に提供する。コンピュータソフトウェア命令は、上記のプロセッサにより実行される必要があるプログラムを含む。 Embodiments of this application further provide a computer-readable storage medium configured to store computer software instructions that need to be executed by the processor described above. Computer software instructions include programs that need to be executed by the processors described above.

当業者は、この出願の実施形態が、方法、システム又はコンピュータプログラムプロダクトとして提供されてもよいことを理解するべきである。したがって、この出願は、ハードウェアのみの実施形態、ソフトウェアのみの実施形態、又はソフトウェアとハードウェアとの組み合わせを有する実施形態の形式を使用してもよい。さらに、この出願は、コンピュータ使用可能プログラムコードを含む1つ以上のコンピュータ使用可能記憶媒体(ディスクメモリ、光メモリ等を含むが、これらに限定されない)上に実現されるコンピュータプログラムプロダクトの形式を使用してもよい。 Those skilled in the art should understand that the embodiments of this application may be provided as a method, system or computer program product. Accordingly, this application may use the form of hardware-only embodiments, software-only embodiments, or embodiments having a combination of software and hardware. Further, this application uses the form of a computer program product embodied on one or more computer-usable storage media (including, but not limited to, disk memory, optical memory, etc.) containing computer-usable program code. may

この出願は、この出願による方法、デバイス(システム)及びコンピュータプログラムプロダクトのフローチャート及び/又はブロック図を参照して記載されている。コンピュータプログラム命令は、フローチャート及び/又はブロック図内の各プロセス及び/又は各ブロックと、フローチャート及び/又はブロック図内のプロセス及び/又はブロックの組み合わせとを実現するために使用されてもよいことが理解されるべきである。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、埋め込みプロセッサ、又はマシンを生成するためのいずれかの他のプログラム可能データ処理デバイスのプロセッサに提供されてもよく、それにより、コンピュータ又はいずれかの他のプログラム可能データ処理デバイスのプロセッサにより実行される命令は、フローチャート内の1つ以上のプロセス及び/又はブロック図内の1つ以上のブロックにおいて特定の機能を実現するための装置を生成する。 This application has been described with reference to flowchart illustrations and/or block diagrams of methods, devices (systems) and computer program products according to this application. Computer program instructions may be used to implement each process and/or each block in the flowchart and/or block diagrams, and combinations of processes and/or blocks in the flowchart and/or block diagrams. should be understood. These computer program instructions may be provided to a processor of a general purpose computer, special purpose computer, embedded processor, or any other programmable data processing device for producing a machine, thereby rendering the computer or any Instructions executed by processors of other programmable data processing devices produce apparatus for performing specified functions in one or more processes in the flowcharts and/or one or more blocks in the block diagrams.

これらのコンピュータプログラム命令は、コンピュータ又はいずれかの他のプログラム可能データ処理デバイスに対して特定の方式で動作するように命令できるコンピュータ読み取り可能メモリに記憶されてもよく、それにより、コンピュータ読み取り可能メモリに記憶された命令は、命令装置を含むアーチファクトを生成する。命令装置は、フローチャート内の1つ以上のプロセス及び/又はブロック図内の1つ以上のブロックにおける特定の機能を実現する。 These computer program instructions may be stored in a computer readable memory capable of instructing a computer, or any other programmable data processing device, to operate in a particular manner, thereby rendering the computer readable memory The instructions stored in generate artifacts containing instruction units. An instruction unit implements the specified functionality in one or more processes in the flowcharts and/or one or more blocks in the block diagrams.

明らかに、当業者は、この出願の範囲から逸脱することなく、この出願に対して様々な修正及び変更を行うことができる。この出願は、特許請求の範囲により規定される保護の範囲内にあることを条件として、これらの修正及び変更をカバーすることを意図する。 Obviously, those skilled in the art can make various modifications and changes to this application without departing from the scope of this application. This application intends to cover these modifications and variations provided they fall within the scope of protection defined by the claims.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移区間長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移区間長との和以上であり、遷移区間長は、現在のフレームのチャンネル間時間差の絶対値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition section length, and the length between the start point of the signal of the first alignment processing length and the end point of the first channel signal of the current frame is The interval length is greater than or equal to the sum of the first alignment process length and the transition interval length, and the transition interval length is less than or equal to the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移区間長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移区間長との和以上であり、遷移区間長は、現在のフレームのチャンネル間時間差の絶対値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition section length, and the length between the start point of the signal of the first alignment processing length and the end point of the first channel signal of the current frame is The interval length is greater than or equal to the sum of the first alignment process length and the transition interval length, and the transition interval length is less than or equal to the absolute value of the inter-channel time difference of the current frame.

図4において、現在のフレームのフレーム長はNであり、現在のフレームの第1のチャンネル信号の開始点はB1=0であり、現在のフレームの第1のチャンネル信号の終了点はE1=N-1である。第1のアライメント処理長の開始点D1は、現在のフレームの第1のチャンネル信号の開始点B1の前に位置し、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の開始点B1との間の長さは、遷移区間長以下であり、第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の終了点E1との間の長さは、第1のアライメント処理長と遷移区間長との和以上である。説明を容易にするために、この出願のこの実施形態及び図4において、遷移区間長は、tsにより表される。この場合、D1=B1-tsである。第1のアライメント処理長の信号の終了点はC1であり、開始点D1から終了点C1までの長さは、第1のアライメント処理長に等しく、C1=D1+L_next_target-1である。 In FIG. 4, the frame length of the current frame is N, the starting point of the first channel signal of the current frame is B1=0, and the ending point of the first channel signal of the current frame is E1=N. -1. The starting point D1 of the first alignment process length is located before the starting point B1 of the first channel signal of the current frame, and the starting point D1 of the signal of the first alignment process length and the first channel signal of the current frame The length between the start point B1 of the channel signal of the current frame and the start point B1 of the channel signal of the current frame is equal to or less than the transition interval length, and the length between the start point D1 of the signal of the first alignment processing length and the end point E1 of the first channel signal of the current frame The length of the interval is greater than or equal to the sum of the length of the first alignment process and the length of the transition section . For ease of explanation, in this embodiment of this application and in FIG. 4, the transition interval length is denoted by ts. In this case D1=B1-ts. The end point of the signal of the first alignment process length is C1, and the length from the start point D1 to the end point C1 is equal to the first alignment process length, C1=D1+L_next_target-1.

図4において、第1のアライメント処理長の信号の開始点D1と、現在のフレームの第1のチャンネル信号の開始点B1との間の長さが遷移区間長に等しいことが、説明のための例として使用される点に留意すべきである。第1のアライメント処理長の信号の開始点D1と現在のフレームの第1のチャンネル信号の開始点B1との間の長さは、代替として、遷移区間長未満でもよく、D1<B1であり、D1>B1である。遷移区間長未満である場合については、ここでの説明を参照する。詳細は更に説明しない。 In FIG. 4, for the sake of explanation, the length between the starting point D1 of the signal of the first alignment processing length and the starting point B1 of the first channel signal of the current frame is equal to the transition section length. Note that it is used as an example. the length between the starting point D1 of the signal of the first alignment process length and the starting point B1 of the first channel signal of the current frame may alternatively be less than the transition interval length, D1<B1, and D1>B1. For the case of less than the transition section length, refer to the description here. No further details are given.

図5は、この出願の実施形態によるステレオ信号処理の概略図である。図5において、説明を容易にするために、遅延アライメント処理の前の第2のチャンネル信号内の点と、同じ位置にある伸張処理の後の第2のチャンネル信号内の点とは、同じ座標を使用することにより記されるが、これは、同じ座標を有する点の信号が同じであることを意味するのではない。例えば、現在のフレームの第2のチャンネル信号の開始点の双方の座標は、遅延アライメント処理の前及び伸張処理の後にB2として記される。 FIG. 5 is a schematic diagram of stereo signal processing according to an embodiment of this application. In FIG. 5, for ease of explanation, a point in the second channel signal before the delay alignment process and a point in the second channel signal after the decompression process at the same position have the same coordinates. This does not mean that the signals of points with the same coordinates are the same. For example, both coordinates of the starting point of the second channel signal of the current frame are marked as B2 before the delay alignment process and after the decompression process.

最後に、伸張処理の後の第2のチャンネル信号内で、開始点B2から始まるN個のサンプリング点が、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号として使用される。すなわち、遅延アライメント処理の後の現在のフレームの第2のチャンネル信号の開始点は点B2であり、終了点はE2である。 Finally, in the second channel signal after decompression process, the N sampling points starting from the starting point B2 are used as the second channel signal of the current frame after delay alignment process. That is, the starting point of the second channel signal of the current frame after delay alignment processing is point B2, and the ending point is E2.

MAX_DELAY_CHANGEは、0よりも大きい正整数であり、|Tmax-Tmin|以下でもよい。Tmaxは現在のサンプリングレートにおけるチャンネル間時間差の最大値に対応し、Tminは現在のサンプリングレートにおけるチャンネル間時間差の最小値に対応する。例えば、MAX_DELAY_CHANGEは80、40又は20に等しい。この出願の実施形態では、MAX_DELAY_CHANGEは20でもよい。 MAX_DELAY_CHANGE is a positive integer greater than 0 and may be less than or equal to |T max -T min |. T max corresponds to the maximum inter-channel time difference at the current sampling rate, and T min corresponds to the minimum inter-channel time difference at the current sampling rate. For example, MAX_DELAY_CHANGE equals 80, 40 or 20. MAX_DELAY_CHANGE may be 20 in the embodiment of this application.

abs(cur_itd)がabs(prev_itd)未満である場合、バッファリングされたターゲットチャンネル信号の点B+abs(prev_itd)-abs(cur_itd)から点B+L-1までの信号は、L個の点の長さの信号に伸張され、これは、伸張処理の後のターゲットチャンネル信号の最初のL個の点の信号として使用される。ターゲットチャンネル信号内の点B+Lから点B+N-1までの信号は、伸張処理の後のターゲットチャンネル信号内の点B+Lから点B+N-1までの信号として直接使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、伸張処理の後のターゲットチャンネル信号の点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。伸張処理の後のターゲットチャンネル信号内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is less than abs(prev_itd), the signal from point B+abs(prev_itd)-abs(cur_itd) to point B+L-1 of the buffered target channel signal is L points , which are used as the signals of the first L points of the target channel signal after the decompression process. The signal from point B+L to point B+N-1 in the target channel signal is directly used as the signal from point B+L to point B+N-1 in the target channel signal after expansion processing . The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel signal after stretching used. The N-point signal starting from point B+abs(cur_itd) in the target channel signal after decompression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

abs(cur_itd)がabs(prev_itd)よりも大きい場合、バッファリングされたターゲットチャンネル信号の点B+abs(prev_itd)-abs(cur_itd)から点B+L-1までの信号は、L個の点の長さの信号に圧縮され、これは、圧縮処理の後のターゲットチャンネル信号の最初のL個の点の信号として使用される。ターゲットチャンネル信号内の点B+Lから点B+N-1までの信号は、圧縮処理の後のターゲットチャンネル信号内の点B+Lから点B+N-1までの信号として直接使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、圧縮処理の後のターゲットチャンネル信号の点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。圧縮処理の後のターゲットチャンネル信号内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is greater than abs(prev_itd), the signal from point B+abs(prev_itd)-abs(cur_itd) of the buffered target channel signal to point B+L-1 is L points is compressed into a signal of length , which is used as the signal of the first L points of the target channel signal after the compression process. The signal from point B+L to point B+N-1 in the target channel signal is directly used as the signal from point B+L to point B+N-1 in the target channel signal after compression processing . The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel signal after compression processing. used. The N-point signal starting from point B+abs(cur_itd) in the target channel signal after compression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

abs(cur_itd)がabs(prev_itd)未満である場合、バッファリングされたターゲットチャンネル信号の点B-ts+abs(prev_itd)-abs(cur_itd)から点B+L-ts-1までの信号は、Lの長さの信号に伸張され、これは、伸張処理の後のターゲットチャンネル信号の点B-tsから点B+L-ts-1までの信号として使用される。ターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号は、伸張処理の後のターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号として直接使用される。Ts2点の信号は、基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、伸張処理の後のターゲットチャンネル信号の点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、伸張処理の後のターゲットチャンネル信号の点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。伸張処理の後のターゲットチャンネル信号内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is less than abs(prev_itd), the signal from point B-ts+abs(prev_itd)-abs(cur_itd) to point B+L-ts-1 of the buffered target channel signal is L-length signal, which is used as the signal from point B-ts to point B+L-ts-1 of the target channel signal after the stretching process. The signal from the point B+L-ts to the point B+N-Ts2-1 in the target channel signal is the point B+L-ts to the point B+N-Ts2-1 in the target channel signal after decompression. used directly as a signal to The signal at point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel signal after decompression processing. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel signal after stretching used. The N-point signal starting from point B+abs(cur_itd) in the target channel signal after decompression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

abs(cur_itd)がabs(prev_itd)よりも大きい場合、バッファリングされたターゲットチャンネル信号の点B-ts+abs(prev_itd)-abs(cur_itd)から点B+L-ts-1までの信号は、L個の点の長さの信号に圧縮され、これは、圧縮処理の後のターゲットチャンネル信号の点B-tsから点B+L-ts-1までの信号として使用される。ターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号は、圧縮処理の後のターゲットチャンネル信号内の点B+L-tsから点B+N-Ts2-1までの信号として直接使用される。Ts2点の信号は、基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、圧縮処理の後のターゲットチャンネル信号の点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号は、基準チャンネル信号に基づいて手動で再構成され、圧縮処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。圧縮処理の後のターゲットチャンネル信号内の点B+abs(cur_itd)から始まるN点の信号は、遅延アライメント処理の後の現在のフレームのターゲットチャンネル信号として使用される。現在のフレームの基準チャンネル信号は、遅延アライメント処理の後の現在のフレームの基準チャンネル信号として直接使用される。Bは現在のフレームのターゲットチャンネル信号内の開始点の座標を表し、Nは現在のフレームのフレーム長を表し、Lは遅延アライメント処理の処理長を表す。 If abs(cur_itd) is greater than abs(prev_itd), the signal from point B-ts+abs(prev_itd)-abs(cur_itd) to point B+L-ts-1 of the buffered target channel signal is Compressed into a signal of length L points, which is used as the signal from point B-ts to point B+L-ts-1 of the target channel signal after the compression process. The signal from point B+L-ts to point B+N-Ts2-1 in the target channel signal is the signal from point B+L-ts to point B+N-Ts2-1 in the target channel signal after compression processing. used directly as a signal to The signal at point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel signal after compression processing. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal and used as the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after compression processing be done. The N-point signal starting from point B+abs(cur_itd) in the target channel signal after compression process is used as the target channel signal of the current frame after delay alignment process. The current frame reference channel signal is used directly as the current frame reference channel signal after delay alignment processing. B represents the coordinates of the starting point in the target channel signal of the current frame, N represents the frame length of the current frame, and L represents the process length of the delay alignment process.

Ts2点の信号が基準チャンネル信号及びターゲットチャンネル信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネル信号の点B+N-Ts2から点B+N-1までの信号として使用されることは、具体的には以下の通りでもよい。Ts2点の信号は、ターゲットチャンネルの点B+N-Ts2から点B+N-1までの信号と、基準チャンネルの点B+N-abs(cur_itd)-Ts2から点B+N-abs(cur_itd)-1までの信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネル信号の点B+N-Ts2から点B+N-1までの信号として使用される。abs(cur_itd)点の信号が、基準チャンネル信号に基づいて手動で再構成され、圧縮又は伸張処理の後のターゲットチャンネルの点B+Nから点B+N+abs(cur_itd)-1までの信号として使用されることは、具体的には以下の通りでもよい。abs(cur_itd)点の信号は、基準チャンネルの点B+N-abs(cur_itd)から点B+N-1までの信号に基づいて生成され、圧縮又は伸張処理の後のターゲットチャンネル信号の点B+Nから点B+N+abs(cur_itd)-1までの信号として使用される。 The signal of point Ts2 is generated based on the reference channel signal and the target channel signal, and is used as the signal from point B+N-Ts2 to point B+N-1 of the target channel signal after compression or decompression processing. may be specifically as follows. The signal at point Ts2 is the signal from point B+N-Ts2 to point B+N-1 on the target channel and the signal from point B+N-abs(cur_itd)-Ts2 to point B+N-abs(cur_itd) on the reference channel. )-1 and used as the signals from point B+N-Ts2 to point B+N-1 of the target channel signal after compression or decompression. The signal at point abs(cur_itd) is manually reconstructed based on the reference channel signal, and the signal from point B+N to point B+N+abs(cur_itd)-1 of the target channel after compression or decompression processing may be specifically as follows. The signal at point abs(cur_itd) is generated based on the signals from point B+N-abs(cur_itd) of the reference channel to point B+N-1, and point B of the target channel signal after compression or decompression processing. Used as signal from +N to point B+N+abs(cur_itd)-1.

図10において、第3の処理長の信号の開始点D3と現在のフレームの第1のチャンネル信号の開始点B3との間の長さは、第3のプリセット長であり、第3のアライメント処理長の信号の開始点はA3であり、A3=D3-abs(cur_itd)である。H3は、現在のフレームの第1のチャンネル信号の開始点B3の前に位置し、H3とA3との間の長さは、第3のプリセット長であり、H3とB3との間の長さは、現在のフレームのチャンネル間時間差の絶対値であり、すなわち、H3=B3-abs(cur_itd)である。 In FIG. 10, the length between the starting point D3 of the signal of the third processing length and the starting point B3 of the first channel signal of the current frame is the third preset length, and the third alignment processing The starting point of the long signal is A3 , where A3 =D3-abs(cur_itd). H3 is located before the starting point B3 of the first channel signal of the current frame, the length between H3 and A3 is the third preset length, the length between H3 and B3 is the absolute value of the inter-channel time difference of the current frame, ie H3=B3-abs(cur_itd).

図14を参照すると、ステレオ信号処理装置1400は、
現在のフレームのチャンネル間時間差を決定するために、現在のフレームのステレオ信号に基づいて遅延推定を実行するように構成された遅延推定ユニット1401と、
現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なると決定された場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延アライメント処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延アライメント処理を実行するように構成された処理ユニット1402であり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、現在のフレームのステレオ信号内にあり且つ前のフレームのターゲットチャンネル信号と同じチャンネル上にある信号である、処理ユニット1042と
を含む。
Referring to FIG. 14, the stereo signal processing device 1400 includes:
a delay estimation unit 1401 configured to perform delay estimation based on the stereo signal of the current frame to determine the inter-channel time difference of the current frame;
for the first channel signal of the current frame based on the inter-channel time difference of the current frame, if it is determined that the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame. a processing unit 1402 configured to perform delay alignment processing and to perform delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; The signal is the target channel signal of the current frame and the second channel signal is the signal within the stereo signal of the current frame and on the same channel as the target channel signal of the previous frame, processing unit 1042 Including and .

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移区間長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移区間長との和以上であり、遷移区間長は、現在のフレームのチャンネル間時間差の絶対値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition section length, and the length between the start point of the signal of the first alignment processing length and the end point of the first channel signal of the current frame is The interval length is greater than or equal to the sum of the first alignment process length and the transition interval length, and the transition interval length is less than or equal to the absolute value of the inter-channel time difference of the current frame.

任意選択で、第1のアライメント処理長の信号の開始点は、現在のフレームの第1のチャンネル信号の開始点の前に位置し、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の開始点との間の長さは、遷移区間長以下であり、第1のアライメント処理長の信号の開始点と現在のフレームの第1のチャンネル信号の終了点との間の長さは、第1のアライメント処理長と遷移区間長との和以上であり、遷移区間長は、現在のフレームのチャンネル間時間差の絶対値以下である。 Optionally, the starting point of the signal of the first alignment process length is located before the starting point of the first channel signal of the current frame, and the starting point of the signal of the first alignment process length and the current frame is less than or equal to the transition section length, and the length between the start point of the signal of the first alignment processing length and the end point of the first channel signal of the current frame is The interval length is greater than or equal to the sum of the first alignment process length and the transition interval length, and the transition interval length is less than or equal to the absolute value of the inter-channel time difference of the current frame.

図16を参照すると、ステレオ信号処理装置1600は、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するように構成されたトランシーバユニット1601と、
現在のフレームのチャンネル間時間差の符号が、前のフレームのチャンネル間時間差の符号と異なる場合、現在のフレームのチャンネル間時間差に基づいて現在のフレームの第1のチャンネル信号に対して遅延回復処理を実行し、前のフレームのチャンネル間時間差に基づいて現在のフレームの第2のチャンネル信号に対して遅延回復処理を実行するように構成された処理ユニット1602であり、第1のチャンネル信号は、現在のフレームのターゲットチャンネル信号であり、第2のチャンネル信号は、現在のフレームのステレオ信号内にあり且つ前のフレームのターゲットチャンネル信号と同じチャンネル上にある信号である、処理ユニット1602と
を含む。
Referring to FIG. 16, the stereo signal processing device 1600 includes:
a transceiver unit 1601 configured to determine an inter-channel time difference for the current frame based on the received codestream;
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the previous frame, perform delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame. and perform delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, wherein the first channel signal is the current and a processing unit 1602, wherein the second channel signal is the target channel signal of the first frame and the second channel signal is the signal that is within the stereo signal of the current frame and on the same channel as the target channel signal of the previous frame.

Claims (40)

ステレオ信号処理方法であって、
現在のフレームのチャンネル間時間差を決定するために、前記現在のフレームのステレオ信号に対して遅延推定を実行するステップであり、前記現在のフレームの前記チャンネル間時間差は、前記現在のフレームの第1のチャンネル信号と前記現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
前記現在のフレームの前記チャンネル間時間差の符号が、前記現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延アライメント処理を実行し、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延アライメント処理を実行するステップであり、前記第1のチャンネル信号は、前記現在のフレームのターゲットチャンネル信号であり、前記第2のチャンネル信号は、前記前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を含む方法。
A stereo signal processing method comprising:
performing delay estimation on a stereo signal of said current frame to determine an inter-channel time difference of said current frame, said inter-channel time difference of said current frame being the first is the time difference between the channel signal of the current frame and the second channel signal of the current frame;
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame previous to the current frame, then the second channel time difference of the current frame is based on the inter-channel time difference of the current frame. performing delay alignment processing on one channel signal and performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; wherein the first channel signal is the target channel signal of the current frame and the second channel signal is on the same channel as the target channel signal of the previous frame.
前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延アライメント処理を実行することは、
遅延アライメント処理の後の前記現在のフレームの前記第1のチャンネル信号を取得するために、前記現在のフレームの前記第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮し、
前記第1の処理長は、前記現在のフレームの前記チャンネル間時間差及び前記第1のアライメント処理長に基づいて決定され、前記第1の処理長は、前記第1のアライメント処理長よりも大きいことを含む、請求項1に記載の方法。
performing delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame;
performing a first alignment process on a signal of a first process length within the first channel signal of the current frame to obtain the first channel signal of the current frame after delay alignment process; compressed to a longer signal,
The first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, wherein the first process length is greater than the first alignment process length. 2. The method of claim 1, comprising:
前記第1の処理長は、前記現在のフレームの前記チャンネル間時間差の絶対値と前記第1のアライメント処理長との和である、請求項2に記載の方法。 3. The method of claim 2, wherein the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length. 前記第1の処理長の前記信号の開始点は、前記第1のアライメント処理長の前記信号の開始点の前に位置し、前記第1の処理長の前記信号の前記開始点と前記第1のアライメント処理長の前記信号の前記開始点との間の長さは、前記現在のフレームの前記チャンネル間時間差の前記絶対値である、請求項3に記載の方法。 The starting point of the signal of the first process length is located before the starting point of the signal of the first alignment process length, and the starting point of the signal of the first process length and the first alignment process length are located before the starting point of the signal of the first alignment process length. 4. The method of claim 3, wherein the length between the starting point of the signal for an alignment process length of is the absolute value of the inter-channel time difference of the current frame. 前記第1のアライメント処理長の前記信号の開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点に或いは前記現在のフレームの前記第1のチャンネル信号の前記開始点の後に位置し、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第1のアライメント処理長以上である、請求項3に記載の方法。 The starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame. , a length between the starting point of the signal of the first alignment length and the ending point of the first channel signal of the current frame is greater than or equal to the first alignment length. Item 3. The method according to item 3. 前記第1のアライメント処理長の前記信号の開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点の前に位置し、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の前記開始点との間の長さは、遷移長以下であり、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第1のアライメント処理長と前記遷移長との和以上であり、前記遷移長は、前記現在のフレームの前記チャンネル間時間差の前記絶対値の最大値以下である、請求項3に記載の方法。 The starting point of the signal of the first alignment length is located before the starting point of the first channel signal of the current frame and is the starting point of the signal of the first alignment length. A length between the starting point of the first channel signal of the current frame is less than or equal to a transition length, and the starting point of the signal of the first alignment process length and the starting point of the current frame. The length between the end point of the first channel signal is equal to or greater than the sum of the first alignment process length and the transition length, and the transition length is the inter-channel time difference of the current frame. 4. The method of claim 3, which is less than or equal to the maximum absolute value. 前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延アライメント処理を実行することは、
遅延アライメント処理の後の前記現在のフレームの前記第2のチャンネル信号を取得するために、前記現在のフレームの前記第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張し、
前記第2の処理長は、前記前のフレームの前記チャンネル間時間差及び前記第2のアライメント処理長に基づいて決定され、前記第2の処理長は、前記第2のアライメント処理長未満であることを含む、請求項1乃至6のうちいずれか1項に記載の方法。
performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame;
performing a second alignment process on a signal of a second processing length within the second channel signal of the current frame to obtain the second channel signal of the current frame after delay alignment process; to a longer signal,
The second processing length is determined based on the inter-channel time difference of the previous frame and the second alignment processing length, and the second processing length is less than the second alignment processing length. 7. The method of any one of claims 1-6, comprising:
前記第2の処理長は、前記第2のアライメント処理長と前記前のフレームの前記チャンネル間時間差の絶対値との間の差である、請求項7に記載の方法。 8. The method of claim 7, wherein the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame. 前記第2の処理長の前記信号の開始点は、前記第2のアライメント処理長の前記信号の開始点の後に位置し、前記第2の処理長の前記信号の前記開始点と前記第2のアライメント処理長の前記信号の前記開始点との間の長さは、前記前のフレームの前記チャンネル間時間差の前記絶対値である、請求項8に記載の方法。 The starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the second alignment process length are positioned after the starting point of the signal of the second alignment process length. 9. The method of claim 8, wherein the length of the alignment process length between the starting point of the signal is the absolute value of the inter-channel time difference of the previous frame. 前記第2のアライメント処理長の前記信号の開始点は、前記現在のフレームの前記第2のチャンネル信号の開始点に或いは前記現在のフレームの前記第2のチャンネル信号の前記開始点の後に位置し、前記第2のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第2のチャンネル信号の終了点との間の長さは、前記第2のアライメント処理長以上である、請求項8に記載の方法。 The starting point of the signal of the second alignment process length is located at the starting point of the second channel signal of the current frame or after the starting point of the second channel signal of the current frame. , a length between the start point of the signal of the second alignment length and the end point of the second channel signal of the current frame is greater than or equal to the second alignment length. Item 8. The method according to item 8. 前記第2のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第2のチャンネル信号の前記開始点との間の長さは、第2のプリセット長に等しく、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の前記開始点との間の長さは、前記第2のプリセット長と前記第2のアライメント処理長との和に等しい、請求項7乃至10のうちいずれか1項に記載の方法。 A length between the starting point of the signal of the second alignment process length and the starting point of the second channel signal of the current frame is equal to a second preset length, and the first The length between the starting point of the signal of the alignment process length and the starting point of the first channel signal of the current frame is equal to the length between the second preset length and the second alignment process length. 11. A method according to any one of claims 7-10, equal to the sum. 前記第1のアライメント処理長は、前記現在のフレームのフレーム長以下であり、前記第1のアライメント処理長は、プリセット長であるか、或いは、前記第1のアライメント処理長は、以下の式を満たし、
Figure 2023085339000037
L_next_targetは前記第1のアライメント処理長であり、cur_itdは前記現在のフレームの前記チャンネル間時間差であり、prev_itdは前記前のフレームの前記チャンネル間時間差であり、Lは遅延アライメント処理の処理長である、請求項2乃至11のうちいずれか1項に記載の方法。
The first alignment process length is less than or equal to the frame length of the current frame, and the first alignment process length is a preset length, or the first alignment process length is: fill,
Figure 2023085339000037
L_next_target is the first alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of the delayed alignment process. A method according to any one of claims 2 to 11.
前記第2のアライメント処理長は、前記現在のフレームの前記フレーム長以下であり、前記第2のアライメント処理長は、プリセット長であるか、或いは、前記第2のアライメント処理長は、以下の式を満たし、
Figure 2023085339000038
L_pre_targetは前記第2のアライメント処理長であり、cur_itdは前記現在のフレームの前記チャンネル間時間差であり、prev_itdは前記前のフレームの前記チャンネル間時間差であり、Lは遅延アライメント処理の前記処理長である、請求項7乃至12のうちいずれか1項に記載の方法。
The second alignment process length is less than or equal to the frame length of the current frame, and the second alignment process length is a preset length; The filling,
Figure 2023085339000038
L_pre_target is the second alignment process length, cur_itd is the inter-channel time difference of the current frame, prev_itd is the inter-channel time difference of the previous frame, and L is the process length of a delayed alignment process. 13. The method of any one of claims 7-12, wherein
遅延アライメント処理の前記処理長は、前記現在のフレームの前記フレーム長以下であり、遅延アライメント処理の前記処理長は、プリセット長であるか、或いは、遅延アライメント処理の前記処理長は、以下の式を満たし、
Figure 2023085339000039
Lは遅延アライメント処理の前記処理長であり、MAX_DELAY_CHANGEは隣接するフレームのチャンネル間時間差の間の最大差分値であり、L_initは遅延アライメント処理のプリセット処理長である、請求項12又は13に記載の方法。
The process length of a delayed alignment process is less than or equal to the frame length of the current frame, and the process length of a delayed alignment process is a preset length, or the process length of a delayed alignment process is determined by the following formula: The filling,
Figure 2023085339000039
14. The method of claim 12 or 13, wherein L is the processing length of delay alignment processing, MAX_DELAY_CHANGE is the maximum difference value between inter-channel time differences of adjacent frames, and L_init is a preset processing length of delay alignment processing. Method.
ステレオ信号処理方法であって、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するステップであり、前記現在のフレームの前記チャンネル間時間差は、前記現在のフレームの第1のチャンネル信号と前記現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
前記現在のフレームの前記チャンネル間時間差の符号が、前記現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延回復処理を実行し、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延回復処理を実行するステップであり、前記第1のチャンネル信号は、前記現在のフレームのターゲットチャンネル信号であり、前記第2のチャンネル信号は、前記前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を含む方法。
A stereo signal processing method comprising:
determining an inter-channel time difference of a current frame based on a received codestream, wherein the inter-channel time difference of the current frame is a first channel signal of the current frame and a second channel signal of the current frame; a step, which is the time difference between the channel signals of
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame previous to the current frame, then the second channel time difference of the current frame is based on the inter-channel time difference of the current frame. performing delay recovery processing on one channel signal and performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; wherein the first channel signal is the target channel signal of the current frame and the second channel signal is on the same channel as the target channel signal of the previous frame.
前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延回復処理を実行することは、
遅延回復処理の後の前記現在のフレームの前記第1のチャンネル信号を取得するために、前記現在のフレームの前記第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張し、
前記第3の処理長は、前記現在のフレームの前記チャンネル間時間差及び前記第3のアライメント処理長に基づいて決定され、前記第3の処理長は、前記第3のアライメント処理長未満であることを含む、請求項15に記載の方法。
performing delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame;
performing a third alignment process on a signal of a third process length within the first channel signal of the current frame to obtain the first channel signal of the current frame after delay recovery process; to a longer signal,
The third process length is determined based on the inter-channel time difference of the current frame and the third alignment process length, wherein the third process length is less than the third alignment process length. 16. The method of claim 15, comprising:
前記第3の処理長は、前記第3のアライメント処理長と前記現在のフレームの前記チャンネル間時間差の絶対値との間の差である、請求項16に記載の方法。 17. The method of claim 16, wherein the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame. 前記第3の処理長の前記信号の開始点は、前記第3のアライメント処理長の前記信号の開始点の後に位置し、前記第3の処理長の前記信号の前記開始点と前記第3のアライメント処理長の前記信号の前記開始点との間の長さは、前記現在のフレームの前記チャンネル間時間差の前記絶対値である、請求項17に記載の方法。 The starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the third alignment process length are positioned after the starting point of the signal of the third alignment process length. 18. The method of claim 17, wherein the length of the alignment process length between the starting point of the signal is the absolute value of the inter-channel time difference of the current frame. 前記第3の処理長の前記信号の前記開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点に或いは前記現在のフレームの前記第1のチャンネル信号の前記開始点の後に位置し、前記第3の処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第3のアライメント処理長と前記現在のフレームの前記チャンネル間時間差の前記絶対値との間の前記差以上である、請求項18に記載の方法。 The starting point of the signal of the third processing length is located at or after the starting point of the first channel signal of the current frame. , the length between the starting point of the signal of the third process length and the ending point of the first channel signal of the current frame is equal to the length of the third alignment process length and the current frame; 19. The method of claim 18, wherein said difference between said absolute value of said inter-channel time difference is greater than or equal to said difference. 前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延回復処理を実行することは、
遅延回復処理の後の前記現在のフレームの前記第2のチャンネル信号を取得するために、前記現在のフレームの前記第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮し、
前記第4の処理長は、前記前のフレームの前記チャンネル間時間差及び前記第4のアライメント処理長に基づいて決定され、前記第4の処理長は、前記第4のアライメント処理長よりも大きいことを含む、請求項15又は16に記載の方法。
performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame;
performing a fourth alignment process on a signal of a fourth process length within the second channel signal of the current frame to obtain the second channel signal of the current frame after delay recovery process; compressed to a longer signal,
The fourth processing length is determined based on the inter-channel time difference of the previous frame and the fourth alignment processing length, and the fourth processing length is greater than the fourth alignment processing length. 17. A method according to claim 15 or 16, comprising
前記第4の処理長は、前記前のフレームの前記チャンネル間時間差の絶対値と前記第4のアライメント処理長との和である、請求項20に記載の方法。 21. The method of claim 20, wherein the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length. 前記第4の処理長の前記信号の開始点は、前記第4のアライメント処理長の前記信号の開始点の前に位置し、前記第4の処理長の前記信号の前記開始点と前記第4のアライメント処理長の前記信号の前記開始点との間の長さは、前記前のフレームの前記チャンネル間時間差の前記絶対値である、請求項21に記載の方法。 The starting point of the signal of the fourth process length is located before the starting point of the signal of the fourth alignment process length, and the starting point of the signal of the fourth process length and the fourth alignment process length are positioned before the starting point of the signal of the fourth alignment process length. 22. The method of claim 21, wherein the length between the starting point of the signal for an alignment process length of is the absolute value of the inter-channel time difference of the previous frame. 前記第4のアライメント処理長の前記信号の前記開始点は、前記現在のフレームの前記第2のチャンネル信号の開始点に或いは前記現在のフレームの前記第2のチャンネル信号の前記開始点の後に位置し、前記第4のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第2のチャンネル信号の終了点との間の長さは、前記第4のアライメント処理長以上である、請求項22に記載の方法。 The starting point of the signal of the fourth alignment length is located at or after the starting point of the second channel signal of the current frame. and a length between the start point of the signal of the fourth alignment length and the end point of the second channel signal of the current frame is greater than or equal to the fourth alignment length. 23. The method of claim 22. 前記第4のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第2のチャンネル信号の前記開始点との間の長さは、第4のプリセット長に等しく、前記第3のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の前記開始点との間の長さは、前記第4のプリセット長と前記第4のアライメント処理長との和に等しい、請求項20乃至23のうちいずれか1項に記載の方法。 a length between the starting point of the signal of the fourth alignment process length and the starting point of the second channel signal of the current frame is equal to a fourth preset length; The length between the starting point of the signal of the alignment process length and the starting point of the first channel signal of the current frame is equal to the length between the fourth preset length and the fourth alignment process length. 24. A method according to any one of claims 20-23, equal to the sum. プロセッサ及びメモリを含むステレオ信号処理装置であって、
前記メモリは実行可能命令を記憶し、前記実行可能命令は、前記プロセッサに対して、以下のステップ、すなわち、
現在のフレームのチャンネル間時間差を決定するために、前記現在のフレームのステレオ信号に対して遅延推定を実行するステップであり、前記現在のフレームの前記チャンネル間時間差は、前記現在のフレームの第1のチャンネル信号と前記現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
前記現在のフレームの前記チャンネル間時間差の符号が、前記現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延アライメント処理を実行し、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延アライメント処理を実行するステップであり、前記第1のチャンネル信号は、前記現在のフレームのターゲットチャンネル信号であり、前記第2のチャンネル信号は、前記前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される、装置。
A stereo signal processing device comprising a processor and memory,
The memory stores executable instructions, which are sent to the processor to perform the following steps:
performing delay estimation on a stereo signal of said current frame to determine an inter-channel time difference of said current frame, said inter-channel time difference of said current frame being the first is the time difference between the channel signal of the current frame and the second channel signal of the current frame;
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame previous to the current frame, then the second channel time difference of the current frame is based on the inter-channel time difference of the current frame. performing delay alignment processing on one channel signal and performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; wherein the first channel signal is the target channel signal of the current frame and the second channel signal is on the same channel as the target channel signal of the previous frame. A device used to
前記実行可能命令は、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延アライメント処理を実行するとき、前記プロセッサに対して、以下のステップ、すなわち、
遅延アライメント処理の後の前記現在のフレームの前記第1のチャンネル信号を取得するために、前記現在のフレームの前記第1のチャンネル信号内の第1の処理長の信号を、第1のアライメント処理長の信号に圧縮するステップであり、
前記第1の処理長は、前記現在のフレームの前記チャンネル間時間差及び前記第1のアライメント処理長に基づいて決定され、前記第1の処理長は、前記第1のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される、請求項25に記載の装置。
The executable instructions, when performing delay alignment processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame, instruct the processor to perform the following steps: i.e.
performing a first alignment process on a signal of a first process length within the first channel signal of the current frame to obtain the first channel signal of the current frame after delay alignment process; a step of compressing to a long signal,
the first process length is determined based on the inter-channel time difference of the current frame and the first alignment process length, wherein the first process length is greater than the first alignment process length; 26. Apparatus according to claim 25, used for instructing to perform the steps.
前記第1の処理長は、前記現在のフレームの前記チャンネル間時間差の絶対値と前記第1のアライメント処理長との和である、請求項26に記載の装置。 27. The apparatus of claim 26, wherein the first process length is the sum of the absolute value of the inter-channel time difference of the current frame and the first alignment process length. 前記第1の処理長の前記信号の開始点は、前記第1のアライメント処理長の前記信号の開始点の前に位置し、前記第1の処理長の前記信号の前記開始点と前記第1のアライメント処理長の前記信号の前記開始点との間の長さは、前記現在のフレームの前記チャンネル間時間差の前記絶対値である、請求項27に記載の装置。 The starting point of the signal of the first process length is located before the starting point of the signal of the first alignment process length, and the starting point of the signal of the first process length and the first alignment process length are located before the starting point of the signal of the first alignment process length. 28. The apparatus of claim 27, wherein the length between the starting point of the signal for an alignment process length of is the absolute value of the inter-channel time difference of the current frame. 前記第1のアライメント処理長の前記信号の開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点に或いは前記現在のフレームの前記第1のチャンネル信号の前記開始点の後に位置し、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第1のアライメント処理長以上である、請求項27に記載の装置。 The starting point of the signal of the first alignment process length is located at the starting point of the first channel signal of the current frame or after the starting point of the first channel signal of the current frame. , a length between the starting point of the signal of the first alignment length and the ending point of the first channel signal of the current frame is greater than or equal to the first alignment length. Item 28. Apparatus according to Item 27. 前記第1のアライメント処理長の前記信号の開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点の前に位置し、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の前記開始点との間の長さは、遷移長以下であり、前記第1のアライメント処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第1のアライメント処理長と前記遷移長との和以上であり、前記遷移長は、前記現在のフレームの前記チャンネル間時間差の前記絶対値の最大値以下である、請求項27に記載の装置。 The starting point of the signal of the first alignment length is located before the starting point of the first channel signal of the current frame and is the starting point of the signal of the first alignment length. A length between the starting point of the first channel signal of the current frame is less than or equal to a transition length, and the starting point of the signal of the first alignment process length and the starting point of the current frame. The length between the end point of the first channel signal is equal to or greater than the sum of the first alignment process length and the transition length, and the transition length is the inter-channel time difference of the current frame. 28. The apparatus of claim 27, which is less than or equal to the maximum absolute value. 前記実行可能命令は、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延アライメント処理を実行するとき、前記プロセッサに対して、以下のステップ、すなわち、
遅延アライメント処理の後の前記現在のフレームの前記第2のチャンネル信号を取得するために、前記現在のフレームの前記第2のチャンネル信号内の第2の処理長の信号を、第2のアライメント処理長の信号に伸張するステップであり、
前記第2の処理長は、前記前のフレームの前記チャンネル間時間差及び前記第2のアライメント処理長に基づいて決定され、前記第2の処理長は、前記第2のアライメント処理長未満である、ステップ
を実行するように命令するために使用される、請求項26乃至30のうちいずれか1項に記載の装置。
The executable instructions, when performing delay alignment processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor to perform the following steps: i.e.
performing a second alignment process on a signal of a second processing length within the second channel signal of the current frame to obtain the second channel signal of the current frame after delay alignment process; is the step of decompressing to a signal of length,
The second processing length is determined based on the inter-channel time difference of the previous frame and the second alignment processing length, and the second processing length is less than the second alignment processing length. 31. Apparatus according to any one of claims 26 to 30, used for instructing to perform the steps.
前記第2の処理長は、前記第2のアライメント処理長と前記前のフレームの前記チャンネル間時間差の絶対値との間の差である、請求項31に記載の装置。 32. The apparatus of claim 31, wherein the second process length is the difference between the second alignment process length and the absolute value of the inter-channel time difference of the previous frame. 前記第2の処理長の前記信号の開始点は、前記第2のアライメント処理長の前記信号の開始点の後に位置し、前記第2の処理長の前記信号の前記開始点と前記第2のアライメント処理長の前記信号の前記開始点との間の長さは、前記前のフレームの前記チャンネル間時間差の前記絶対値である、請求項32に記載の装置。 The starting point of the signal of the second process length is located after the starting point of the signal of the second alignment process length, and the starting point of the signal of the second process length and the second alignment process length are positioned after the starting point of the signal of the second alignment process length. 33. The apparatus of claim 32, wherein the length of alignment process length between said starting point of said signal is said absolute value of said inter-channel time difference of said previous frame. プロセッサ及びメモリを含むステレオ信号処理装置であって、
前記メモリは実行可能命令を記憶し、前記実行可能命令は、前記プロセッサに対して、以下のステップ、すなわち、
受信したコードストリームに基づいて現在のフレームのチャンネル間時間差を決定するステップであり、前記現在のフレームの前記チャンネル間時間差は、前記現在のフレームの第1のチャンネル信号と前記現在のフレームの第2のチャンネル信号との間の時間差である、ステップと、
前記現在のフレームの前記チャンネル間時間差の符号が、前記現在のフレームの前のフレームのチャンネル間時間差の符号と異なる場合、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延回復処理を実行し、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延回復処理を実行するステップであり、前記第1のチャンネル信号は、前記現在のフレームのターゲットチャンネル信号であり、前記第2のチャンネル信号は、前記前のフレームのターゲットチャンネル信号と同じチャンネル上にある、ステップと
を実行するように命令するために使用される、装置。
A stereo signal processing device comprising a processor and memory,
The memory stores executable instructions, which are sent to the processor to perform the following steps:
determining an inter-channel time difference of a current frame based on a received codestream, wherein the inter-channel time difference of the current frame is a first channel signal of the current frame and a second channel signal of the current frame; a step, which is the time difference between the channel signals of
If the sign of the inter-channel time difference of the current frame is different from the sign of the inter-channel time difference of the frame previous to the current frame, then the second channel time difference of the current frame is based on the inter-channel time difference of the current frame. performing delay recovery processing on one channel signal and performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame; wherein the first channel signal is the target channel signal of the current frame and the second channel signal is on the same channel as the target channel signal of the previous frame. A device used to
前記実行可能命令は、前記現在のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第1のチャンネル信号に対して遅延回復処理を実行するとき、前記プロセッサに対して、以下のステップ、すなわち、
遅延回復処理の後の前記現在のフレームの前記第1のチャンネル信号を取得するために、前記現在のフレームの前記第1のチャンネル信号内の第3の処理長の信号を、第3のアライメント処理長の信号に伸張するステップであり、
前記第3の処理長は、前記現在のフレームの前記チャンネル間時間差及び前記第3のアライメント処理長に基づいて決定され、前記第3の処理長は、前記第3のアライメント処理長未満である、ステップ
を実行するように命令するために使用される、請求項34に記載の装置。
The executable instructions, when performing delay recovery processing on the first channel signal of the current frame based on the inter-channel time difference of the current frame, instruct the processor to perform the following steps: i.e.
performing a third alignment process on a signal of a third process length within the first channel signal of the current frame to obtain the first channel signal of the current frame after delay recovery process; is the step of decompressing to a signal of length,
the third process length is determined based on the inter-channel time difference of the current frame and the third alignment process length, wherein the third process length is less than the third alignment process length; 35. Apparatus according to claim 34, used for instructing to perform the steps.
前記第3の処理長は、前記第3のアライメント処理長と前記現在のフレームの前記チャンネル間時間差の絶対値との間の差である、請求項35に記載の装置。 36. The apparatus of claim 35, wherein the third process length is the difference between the third alignment process length and the absolute value of the inter-channel time difference of the current frame. 前記第3の処理長の前記信号の開始点は、前記第3のアライメント処理長の前記信号の開始点の後に位置し、前記第3の処理長の前記信号の前記開始点と前記第3のアライメント処理長の前記信号の前記開始点との間の長さは、前記現在のフレームの前記チャンネル間時間差の前記絶対値である、請求項36に記載の装置。 The starting point of the signal of the third process length is located after the starting point of the signal of the third alignment process length, and the starting point of the signal of the third process length and the third alignment process length are positioned after the starting point of the signal of the third alignment process length. 37. The apparatus of claim 36, wherein the length of alignment process length between said starting point of said signal is said absolute value of said inter-channel time difference of said current frame. 前記第3の処理長の前記信号の前記開始点は、前記現在のフレームの前記第1のチャンネル信号の開始点に或いは前記現在のフレームの前記第1のチャンネル信号の前記開始点の後に位置し、前記第3の処理長の前記信号の前記開始点と前記現在のフレームの前記第1のチャンネル信号の終了点との間の長さは、前記第3のアライメント処理長と前記現在のフレームの前記チャンネル間時間差の前記絶対値との間の前記差以上である、請求項37に記載の装置。 The starting point of the signal of the third processing length is located at or after the starting point of the first channel signal of the current frame. , the length between the starting point of the signal of the third process length and the ending point of the first channel signal of the current frame is equal to the length of the third alignment process length and the current frame; 38. The apparatus of claim 37, which is greater than or equal to said difference between said absolute value of said inter-channel time difference. 前記実行可能命令は、前記前のフレームの前記チャンネル間時間差に基づいて前記現在のフレームの前記第2のチャンネル信号に対して遅延回復処理を実行するとき、前記プロセッサに対して、以下のステップ、すなわち、
遅延回復処理の後の前記現在のフレームの前記第2のチャンネル信号を取得するために、前記現在のフレームの前記第2のチャンネル信号内の第4の処理長の信号を、第4のアライメント処理長の信号に圧縮するステップであり、
前記第4の処理長は、前記前のフレームの前記チャンネル間時間差及び前記第4のアライメント処理長に基づいて決定され、前記第4の処理長は、前記第4のアライメント処理長よりも大きい、ステップ
を実行するように命令するために使用される、請求項34乃至38のうちいずれか1項に記載の装置。
The executable instructions, when performing delay recovery processing on the second channel signal of the current frame based on the inter-channel time difference of the previous frame, instruct the processor to perform the following steps: i.e.
performing a fourth alignment process on a signal of a fourth process length within the second channel signal of the current frame to obtain the second channel signal of the current frame after delay recovery process; a step of compressing to a long signal,
The fourth processing length is determined based on the inter-channel time difference of the previous frame and the fourth alignment processing length, wherein the fourth processing length is greater than the fourth alignment processing length. 39. Apparatus according to any one of claims 34 to 38, wherein the apparatus is used for instructing to perform the steps.
前記第4の処理長は、前記前のフレームの前記チャンネル間時間差の絶対値と前記第4のアライメント処理長との和である、請求項39に記載の装置。 40. The apparatus of claim 39, wherein the fourth process length is the sum of the absolute value of the inter-channel time difference of the previous frame and the fourth alignment process length.
JP2023041599A 2017-05-16 2023-03-16 Stereo signal processing method and device Pending JP2023085339A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201710344704.4 2017-05-16
CN201710344704.4A CN108877815B (en) 2017-05-16 2017-05-16 Stereo signal processing method and device
JP2019563430A JP6907341B2 (en) 2017-05-16 2017-12-14 Stereo signal processing method and equipment
JP2021108943A JP7248745B2 (en) 2017-05-16 2021-06-30 Stereo signal processing method and apparatus

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021108943A Division JP7248745B2 (en) 2017-05-16 2021-06-30 Stereo signal processing method and apparatus

Publications (1)

Publication Number Publication Date
JP2023085339A true JP2023085339A (en) 2023-06-20

Family

ID=64273305

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019563430A Active JP6907341B2 (en) 2017-05-16 2017-12-14 Stereo signal processing method and equipment
JP2021108943A Active JP7248745B2 (en) 2017-05-16 2021-06-30 Stereo signal processing method and apparatus
JP2023041599A Pending JP2023085339A (en) 2017-05-16 2023-03-16 Stereo signal processing method and device

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2019563430A Active JP6907341B2 (en) 2017-05-16 2017-12-14 Stereo signal processing method and equipment
JP2021108943A Active JP7248745B2 (en) 2017-05-16 2021-06-30 Stereo signal processing method and apparatus

Country Status (9)

Country Link
US (3) US11200907B2 (en)
EP (3) EP3916725B1 (en)
JP (3) JP6907341B2 (en)
KR (4) KR102281614B1 (en)
CN (3) CN108877815B (en)
BR (1) BR112019024128A2 (en)
DK (1) DK3916725T3 (en)
ES (2) ES2939311T3 (en)
WO (1) WO2018209942A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108877815B (en) 2017-05-16 2021-02-23 华为技术有限公司 Stereo signal processing method and device

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
AU2002309146A1 (en) * 2002-06-14 2003-12-31 Nokia Corporation Enhanced error concealment for spatial audio
ES2273216T3 (en) 2003-02-11 2007-05-01 Koninklijke Philips Electronics N.V. AUDIO CODING
JP2005223887A (en) * 2004-01-06 2005-08-18 Pioneer Electronic Corp Acoustic characteristic adjusting apparatus
JP3694311B2 (en) 2004-12-20 2005-09-14 ホシザキ電機株式会社 Electrolyzed water production equipment
CN1937854A (en) * 2005-09-22 2007-03-28 三星电子株式会社 Apparatus and method of reproduction virtual sound of two channels
CN101427307B (en) * 2005-09-27 2012-03-07 Lg电子株式会社 Method and apparatus for encoding/decoding multi-channel audio signal
JP4285469B2 (en) * 2005-10-18 2009-06-24 ソニー株式会社 Measuring device, measuring method, audio signal processing device
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
JPWO2009081567A1 (en) * 2007-12-21 2011-05-06 パナソニック株式会社 Stereo signal conversion apparatus, stereo signal inverse conversion apparatus, and methods thereof
JP5153791B2 (en) * 2007-12-28 2013-02-27 パナソニック株式会社 Stereo speech decoding apparatus, stereo speech encoding apparatus, and lost frame compensation method
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
CN101673545B (en) * 2008-09-12 2011-11-16 华为技术有限公司 Method and device for coding and decoding
EP2345026A1 (en) * 2008-10-03 2011-07-20 Nokia Corporation Apparatus for binaural audio coding
US8504378B2 (en) 2009-01-22 2013-08-06 Panasonic Corporation Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
WO2010091555A1 (en) 2009-02-13 2010-08-19 华为技术有限公司 Stereo encoding method and device
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
CN102307323B (en) * 2009-04-20 2013-12-18 华为技术有限公司 Method for modifying sound channel delay parameter of multi-channel signal
CN101615996B (en) * 2009-08-10 2012-08-08 华为终端有限公司 Downsapling method and downsampling device
US8848925B2 (en) * 2009-09-11 2014-09-30 Nokia Corporation Method, apparatus and computer program product for audio coding
CN101695150B (en) * 2009-10-12 2011-11-30 清华大学 Coding method, coder, decoding method and decoder for multi-channel audio
CN102157150B (en) * 2010-02-12 2012-08-08 华为技术有限公司 Stereo decoding method and device
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
AU2011357816B2 (en) * 2011-02-03 2016-06-16 Telefonaktiebolaget L M Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
EP2834813B1 (en) * 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
EP2834814B1 (en) * 2012-04-05 2016-03-02 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
WO2014112793A1 (en) * 2013-01-15 2014-07-24 한국전자통신연구원 Encoding/decoding apparatus for processing channel signal and method therefor
US9407999B2 (en) * 2013-02-04 2016-08-02 University of Pittsburgh—of the Commonwealth System of Higher Education System and method for enhancing the binaural representation for hearing-impaired subjects
TWI557727B (en) * 2013-04-05 2016-11-11 杜比國際公司 An audio processing system, a multimedia processing system, a method of processing an audio bitstream and a computer program product
US9373320B1 (en) * 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
CN104681029B (en) * 2013-11-29 2018-06-05 华为技术有限公司 The coding method of stereo phase parameter and device
EP2899997A1 (en) * 2014-01-22 2015-07-29 Thomson Licensing Sound system calibration
CN106033671B (en) 2015-03-09 2020-11-06 华为技术有限公司 Method and apparatus for determining inter-channel time difference parameters
US9768948B2 (en) * 2015-09-23 2017-09-19 Ibiquity Digital Corporation Method and apparatus for time alignment of analog and digital pathways in a digital radio receiver
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
CN105405445B (en) * 2015-12-10 2019-03-22 北京大学 A kind of parameter stereo coding, coding/decoding method based on transmission function between sound channel
CN105682000B (en) * 2016-01-11 2017-11-07 北京时代拓灵科技有限公司 A kind of audio-frequency processing method and system
CN106210368B (en) * 2016-06-20 2019-12-10 百度在线网络技术(北京)有限公司 method and apparatus for eliminating multi-channel acoustic echoes
CN107731238B (en) * 2016-08-10 2021-07-16 华为技术有限公司 Coding method and coder for multi-channel signal
CN108877815B (en) * 2017-05-16 2021-02-23 华为技术有限公司 Stereo signal processing method and device

Also Published As

Publication number Publication date
US20220051680A1 (en) 2022-02-17
KR102524957B1 (en) 2023-04-25
BR112019024128A2 (en) 2020-06-02
EP3611726A1 (en) 2020-02-19
EP3611726B1 (en) 2021-06-02
KR20220061250A (en) 2022-05-12
KR102281614B1 (en) 2021-07-29
US11200907B2 (en) 2021-12-14
JP6907341B2 (en) 2021-07-21
CN111133509B (en) 2022-11-08
JP2020520478A (en) 2020-07-09
DK3916725T3 (en) 2023-02-20
CN108877815B (en) 2021-02-23
KR20190141750A (en) 2019-12-24
EP3611726A4 (en) 2020-03-25
US20200082834A1 (en) 2020-03-12
JP2021167965A (en) 2021-10-21
KR102391266B1 (en) 2022-04-28
WO2018209942A1 (en) 2018-11-22
JP7248745B2 (en) 2023-03-29
US20230395083A1 (en) 2023-12-07
EP4198972A1 (en) 2023-06-21
EP3916725A1 (en) 2021-12-01
KR20230059178A (en) 2023-05-03
US11763825B2 (en) 2023-09-19
CN108877815A (en) 2018-11-23
ES2939311T3 (en) 2023-04-20
ES2886505T3 (en) 2021-12-20
EP3916725B1 (en) 2022-11-30
CN111133509A (en) 2020-05-08
KR20210095220A (en) 2021-07-30
CN115641855A (en) 2023-01-24

Similar Documents

Publication Publication Date Title
RU2449387C2 (en) Signal processing method and apparatus
EP2124224A1 (en) A method and an apparatus for processing an audio signal
JP2021529354A (en) Related methods using multi-signal encoders, multi-signal decoders, and signal whitening or signal post-processing
JP7311573B2 (en) Time domain stereo encoding and decoding method and related products
JP2016513287A (en) Audio encoder and decoder
US20230419974A1 (en) Stereo Encoding Method and Stereo Encoder
EP2671323A1 (en) Method and apparatus for providing signal processing coefficients
KR102426965B1 (en) Decoding method and decoder for dialog enhancement
JP2023085339A (en) Stereo signal processing method and device
JP4213708B2 (en) Audio decoding device
KR102486258B1 (en) Encoding method and encoding apparatus for stereo signal
JP6977147B2 (en) Time domain stereo parameter coding method and related products
RU2798759C2 (en) Parametric encoding and decoding of multi-channel audio signals

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230412

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240422