JP2022188262A - ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 - Google Patents

ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 Download PDF

Info

Publication number
JP2022188262A
JP2022188262A JP2022164615A JP2022164615A JP2022188262A JP 2022188262 A JP2022188262 A JP 2022188262A JP 2022164615 A JP2022164615 A JP 2022164615A JP 2022164615 A JP2022164615 A JP 2022164615A JP 2022188262 A JP2022188262 A JP 2022188262A
Authority
JP
Japan
Prior art keywords
channel signal
lsf
parameters
lsf parameters
primary channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022164615A
Other languages
English (en)
Other versions
JP7477247B2 (ja
Inventor
シュロモット、エヤル
Shlomot Eyal
アラステア ギブス、ジョナサン
Alastair Gibbs Jonathan
リ、ハイティン
Haiting Li
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2022188262A publication Critical patent/JP2022188262A/ja
Priority to JP2024066011A priority Critical patent/JP2024102106A/ja
Application granted granted Critical
Publication of JP7477247B2 publication Critical patent/JP7477247B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】符号化に必要なビットの数を低減するステレオ信号符号化方法および装置ならびに、ステレオ信号復号方法および装置を提供する。【解決手段】符号化方法は、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階(S510)と、セカンダリチャネル信号の元のLSFパラメータおよびプライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階(S520)と、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化を実行する段階(S530)と、プライマリチャネル信号の量子化されたLSFパラメータを符号化する段階(S540)と、を備える。【選択図】図5

Description

本願は、2018年6月29日に中国特許庁に出願された、参照によって全体として本明細書に組み込まれる「ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置」という名称の中国特許出願第201810701919.1号の優先権を主張するものである。
本願は音声分野に関し、より具体的には、ステレオ信号符号化方法および装置、ならびに、ステレオ信号復号方法および装置に関する。
時間領域ステレオ符号化/復号方法において、エンコーダ側は最初にステレオ信号に対してチャネル間時間差推定を実行し、推定結果に基づいてタイムアライメントを実行してから、タイムアライメントされた信号に対して時間領域ダウンミックスを実行し、最後に、ダウンミックス後に取得されるプライマリチャネル信号およびセカンダリチャネル信号を別々に符号化して符号化ビットストリームを取得する。
プライマリチャネル信号およびセカンダリチャネル信号の符号化は、プライマリチャネル信号の線形予測係数(linear prediction coefficient、LPC)およびセカンダリチャネル信号のLPCを決定し、それぞれ、プライマリチャネル信号のLPCおよびセカンダリチャネル信号のLPCをプライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに変換してから、プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対する量子化を実行することを含み得る。
プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対して量子化を実行するプロセスは、プライマリチャネル信号の元のLSFパラメータを量子化してプライマリチャネル信号の量子化されたLSFパラメータを取得すること、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離に基づいて再使用判定を実行し、プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離が閾値以上である場合、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさず、セカンダリチャネル信号の量子化されたLSFパラメータを取得するためにセカンダリチャネル信号の元のLSFパラメータを量子化する必要があると判定すること、および、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータをビットストリームに書き込むことを含み得る。プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離が閾値より小さい場合、プライマリチャネル信号の量子化されたLSFパラメータのみがビットストリームに書き込まれる。この場合、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして使用され得る。
この符号化プロセスにおいて、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさない場合、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータの両方がビットストリームに書き込まれる必要がある。したがって、比較的大きい数のビットが符号化のために必要となる。
本願は、ステレオ信号符号化方法および装置、ならびに、ステレオ信号復号方法および装置を提供し、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさない場合に符号化に必要なビットの数を低減することを助ける。
第1の態様によれば、本願はステレオ信号符号化方法を提供する。符号化方法は、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化を実行する段階とを備える。
符号化方法において、スペクトラム拡散が最初にプライマリチャネル信号の量子化されたLSFパラメータに対して実行され、次に、スペクトラム拡散LSFパラメータ、および、セカンダリチャネル信号の元のLSFパラメータに基づいてセカンダリチャネル信号の予測残差が判定され、予測残差に対して量子化が実行される。予測残差の値はセカンダリチャネル信号のLSFパラメータの値より小さく、予測残差の値の桁は、セカンダリチャネル信号のLSFパラメータの値の桁より小さい。したがって、セカンダリチャネル信号のLSFパラメータに対して量子化を別々に実行することと比較して、予測残差に対して量子化を実行することは、符号化に必要なビットの数の低減に役立つ。
第1の態様に関連して、第1の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得する段階を含み、平均伸長処理は以下の式に従って実行される。
Figure 2022188262000002
ここで、
Figure 2022188262000003
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000004
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000005
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
第1の態様に関連して、第2の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
第1の態様、または、第1もしくは第2の可能な実装に関連して、第3の可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差は、セカンダリチャネル信号の元のLSFパラメータと、プライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差である。
第1の態様、または、第1もしくは第2の可能な実装に関連して、第4の可能な実装において、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する、段階とを含む。
第1の態様、または、上述の可能な実装のいずれか1つに関連して、第5の可能な実装において、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階の前に、符号化方法は更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定する段階を備える。
セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないかどうかは、従来技術、例えば、背景技術において説明される方式に従って判定され得る。
第2の態様によれば、本願はステレオ信号復号方法を提供する。復号方法は、ビットストリームから現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、ビットストリームから、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を取得する段階と、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階とを備える。
復号方法において、セカンダリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の予測残差、および、プライマリチャネル信号の量子化されたLSFパラメータに基づいて決定され得る。したがって、セカンダリチャネル信号の量子化されたLSFパラメータは、ビットストリームにおいて記録される必要がないことがあり得るが、セカンダリチャネル信号の予測残差は記録される。このことは、符号化に必要なビットの数を低減することに役立つ。
第2の態様に関連して、第1の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階を含み、平均伸長処理は以下の式に従って実行される。
Figure 2022188262000006
ここで、
Figure 2022188262000007
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000008
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000009
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
第2の態様に関連して、第2の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
第2の態様、または、第1もしくは第2の可能な実装に関連して、第3の可能な実装において、セカンダリチャネル信号の量子化されたLSFパラメータは、スペクトラム拡散LSFパラメータと予測残差との和である。
第2の態様、または、第1もしくは第2の可能な実装に関連して、第4の可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、予測されたLSFパラメータと予測残差との和をセカンダリチャネル信号の量子化されたLSFパラメータとして使用する段階とを含む。
第3の態様によれば、ステレオ信号符号化装置が提供される。符号化装置は、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実行するよう構成されるモジュールを含む。
第4の態様によれば、ステレオ信号復号装置が提供される。復号装置は、第2の態様、または、第2の態様の可能な実装のいずれか1つによる方法を実行するよう構成されるモジュールを含む。
第5の態様によれば、ステレオ信号符号化装置が提供される。符号化装置はメモリおよびプロセッサを含む。メモリはプログラムを格納するよう構成される。プロセッサはプログラムを実行するよう構成される。プログラムをメモリにおいて実行する場合、プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装する。
第6の態様によれば、ステレオ信号復号装置が提供される。復号装置はメモリおよびプロセッサを含む。メモリはプログラムを格納するよう構成される。プロセッサはプログラムを実行するよう構成される。プログラムをメモリにおいて実行する場合、プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装する。
第7の態様によれば、コンピュータ可読記憶媒体が提供される。コンピュータ可読記憶媒体は、装置またはデバイスによって実行されるプログラムコードを格納し、プログラムコードは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するために使用される命令を含む。
第8の態様によれば、コンピュータ可読記憶媒体が提供される。コンピュータ可読記憶媒体は、装置またはデバイスによって実行されるプログラムコードを格納し、プログラムコードは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するために使用される命令を含む。
第9の態様によれば、チップが提供される。チップはプロセッサおよび通信インタフェースを含む。通信インタフェースは、外部デバイスと通信するよう構成される。プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するよう構成される。
任意選択で、チップはメモリを更に含み得る。メモリは命令を格納する。プロセッサは、メモリに格納される命令を実行するよう構成される。命令が実行されるとき、プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するよう構成される。
任意選択で、チップは端末デバイスまたはネットワークデバイスに統合され得る。
第10の態様によれば、チップが提供される。チップはプロセッサおよび通信インタフェースを含む。通信インタフェースは外部デバイスと通信するよう構成される。プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するよう構成される。
任意選択で、チップはメモリを更に含み得る。メモリは命令を格納する。プロセッサは、メモリに格納された命令を実行するよう構成される。命令が実行されるとき、プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するよう構成される。
任意選択で、チップは端末デバイスまたはネットワークデバイスに統合され得る。
第11の態様によれば、本願の実施形態は、命令を含むコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトがコンピュータ上で動作するとき、コンピュータは、第1の態様による符号化方法を実行することが可能となる。
第12の態様によれば、本願の実施形態は、命令を含むコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトがコンピュータ上で動作するとき、コンピュータは、第2の態様による復号方法を実行することが可能となる。
本願の一実施形態による、時間領域におけるステレオ符号化および復号システムの概略構造図である。
本願の一実施形態による、移動端末の概略図である。
本願の一実施形態による、ネットワーク要素の概略図である。
プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対する量子化を実行する方法の概略フローチャートである。
本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
本願の一実施形態による、ステレオ信号符号化方法の概略フローチャートである。
本願の一実施形態による、ステレオ信号符号化方法の概略フローチャートである。
本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
本願の一実施形態によるステレオ信号復号方法の概略フローチャートである。
本願の一実施形態によるステレオ信号符号化装置の概略構造図である。
本願の一実施形態によるステレオ信号復号装置の概略構造図である。
本願の別の実施形態によるステレオ信号符号化装置の概略構造図である。
本願の別の実施形態によるステレオ信号復号装置の概略構造図である。
プライマリチャネル信号およびセカンダリチャネル信号の線形予測スペクトル包絡線の概略図である。
図1は、本願の例示的な実施形態による、時間領域におけるステレオ符号化および復号システムの概略構造図である。ステレオ符号化および復号システムは、符号化コンポーネント110および復号コンポーネント120を含む。
本願におけるステレオ信号は元のステレオ信号であり得、複数のチャネル上の信号に含まれる2つの信号を含むステレオ信号であり得、または、複数のチャネル上の信号に含まれる複数の信号から共同生成された2つの信号を含むステレオ信号であり得ることが理解されるべきである。
符号化コンポーネント110は、時間領域においてステレオ信号を符号化するよう構成される。任意選択で、符号化コンポーネント110は、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせの形式で実装され得る。これについては、本願の実施形態において限定されるものではない。
符号化コンポーネント110が時間領域においてステレオ信号を符号化することは、以下の段階を含み得る。
(1)取得されたステレオ信号に対して時間領域前処理を実行して、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号を取得する。
ステレオ信号は収集コンポーネントによって収集され、符号化コンポーネント110へ送信され得る。任意選択で、収集コンポーネントおよび符号化コンポーネント110は同一のデバイスに配置され得る。代替的に、収集コンポーネントおよび符号化コンポーネント110は異なるデバイスに配置され得る。
時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号は、前処理されたステレオ信号における2つのチャネル上の信号である。
任意選択で、時間領域前処理は、ハイパスフィルタリング処理、プリエンファシス処理、サンプリングレート変換、およびチャネル切り替えのうち少なくとも1つを含み得る。これについては、本願の実施形態において限定されるものではない。
(2)時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて時間推定を実行し、時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間のチャネル間時間差を取得する。
例えば、左チャネル信号と右チャネル信号との間の相互相関関数は、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて計算され得る。次に、相互相関関数の最大値が検索され、最大値は時間領域前処理左チャネル信号と時間領域前処理右チャネル信号との間のチャネル間時間差として使用される。
別の例として、左チャネル信号と右チャネル信号との間の相互相関関数は、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて計算され得る。次に、現在のフレームの前のLフレーム(Lは1以上の整数)の各々における左チャネル信号と右チャネル信号との間の相互相関関数に基づいて、現在のフレームにおける左チャネル信号と右チャネル信号との間の相互相関関数に対して長時間平滑化を実行し、平滑化された相互相関関数を取得する。その後、平滑化された相互相関関数の最大値が検索され、最大値に対応するインデックス値が、現在のフレームにおける時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間のチャネル間時間差として使用される。
別の例として、現在のフレームの前のMフレーム(Mは1以上の整数)におけるチャネル間時間差に基づいて、現在のフレームにおける推定されたチャネル間時間差に対してフレーム間平滑化が実行され得、平滑化されたチャネル間時間差が、現在のフレームにおける時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間の最終的なチャネル間時間差として使用される。
上述のチャネル間時間差推定方法は単に例であり、本願の実施形態は上述のチャネル間時間差推定方法に限定されないことを理解すべきである。
(3)チャネル間時間差に基づいて、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号のタイムアライメントを実行し、タイムアライメントされた左チャネル信号およびタイムアライメントされた右チャネル信号を取得する。
例えば、現在のフレームにおける推定チャネル間時間差、および、前のフレームにおけるチャネル間時間差に基づいて、現在のフレームにおける左チャネル信号および右チャネル信号における1または2つの信号を圧縮または伸長して、タイムアライメントされた左チャネル信号とタイムアライメントされた右チャネル信号との間にチャネル間時間差が存在しないようにし得る。
(4)チャネル間時間差を符号化して、チャネル間時間差の符号化インデックスを取得する。
(5)時間領域ダウンミックスについてのステレオパラメータを計算し、時間領域ダウンミックスについてのステレオパラメータを符号化して、時間領域ダウンミックスについてのステレオパラメータの符号化インデックスを取得する。
時間領域ダウンミックスについてのステレオパラメータは、タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号に対して時間領域ダウンミックスを実行するために使用される。
(6)時間領域ダウンミックスについてのステレオパラメータに基づいて、タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号に対して時間領域ダウンミックスを実行し、プライマリチャネル信号およびセカンダリチャネル信号を取得する。
プライマリチャネル信号は、チャネル間の関連情報を表すために使用され、ダウンミックスされた信号または中央チャネル信号とも称され得る。セカンダリチャネル信号は、チャネル間の差分情報を表すために使用され、残差信号またはサイドチャネル信号とも称され得る。
タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号が時間領域において整合される場合、セカンダリチャネル信号が最も弱い。この場合、ステレオ信号は最高の効果を有する。
(7)プライマリチャネル信号およびセカンダリチャネル信号を別々に符号化して、プライマリチャネル信号に対応する第1モノラル符号化ビットストリーム、および、セカンダリチャネル信号に対応する第2モノラル符号化ビットストリームを取得する。
(8)チャネル間時間差の符号化インデックス、ステレオパラメータの符号化インデックス、第1モノラル符号化ビットストリーム、および第2モノラル符号化ビットストリームをステレオ符号化ビットストリームに書き込む。
上述の段階すべてが必須とは限らないことに留意すべきである。例えば、段階(1)は必須ではない。段階(1)が無い場合、時間推定に使用される左チャネル信号および右チャネル信号は、元のステレオ信号における左チャネル信号および右チャネル信号であり得る。本明細書において、元のステレオ信号における左チャネル信号および右チャネル信号は、収集、および、アナログ-デジタル(A/D)変換の後に取得される信号である。
復号コンポーネント120は、符号化コンポーネント110によって生成されたステレオ符号化ビットストリームを復号してステレオ信号を取得するよう構成される。
任意選択で、符号化コンポーネント110は、有線または無線方式で復号コンポーネント120に接続され得、復号コンポーネント120は、復号コンポーネント120と符号化コンポーネント110との間の接続を通じて、符号化コンポーネント110によって生成されたステレオ符号化ビットストリームを取得し得る。代替的に、符号化コンポーネント110は、生成されたステレオ符号化ビットストリームをメモリに格納し得、復号コンポーネント120はメモリ内のステレオ符号化ビットストリームを読み込む。
任意選択で、復号コンポーネント120は、ソフトウェア、ハードウェア、または、ソフトウェアおよびハードウェアの組み合わせの形式で実装され得る。これについては、本願の実施形態において限定されるものではない。
復号コンポーネント120がステレオ符号化ビットストリームを復号してステレオ信号を取得するプロセスは以下の段階を含み得る。
(1)ステレオ符号化ビットストリームにおける第1モノラル符号化ビットストリームおよび第2モノラル符号化ビットストリームを復号し、プライマリチャネル信号およびセカンダリチャネル信号を取得する。
(2)ステレオ符号化ビットストリームに基づいて、時間領域アップミックスについてのステレオパラメータの符号化インデックスを取得し、プライマリチャネル信号およびセカンダリチャネル信号に対して時間領域アップミックスを実行して、時間領域アップミックスされた左チャネル信号、および、時間領域アップミックスされた右チャネル信号を取得する。
(3)ステレオ符号化ビットストリームに基づいて、チャネル間時間差の符号化インデックスを取得し、時間領域アップミックスされた左チャネル信号、および、時間領域アップミックスされた右チャネル信号に対して実行時間調整を実行してステレオ信号を取得する。
任意選択で、符号化コンポーネント110および復号コンポーネント120は、同一のデバイスに配置され得る、または、異なるデバイスに配置され得る。デバイスは、携帯電話、タブレットコンピュータ、ラップトップポータブルコンピュータ、デスクトップコンピュータ、Bluetooth(登録商標)サウンドボックス、録音ペン、またはウェアラブルデバイスなどの音声信号処理機能を有する移動端末であり得る、または、コアネットワークもしくは無線ネットワークにおける、音声信号処理能力を有するネットワーク要素であり得る。これについては、本願の実施形態において限定されるものではない。
例えば、図2に示されるように、以下の例を使用して説明が提供される。符号化コンポーネント110は移動端末130に配置される。復号コンポーネント120は移動端末140に配置される。移動端末130および移動端末140は、互いに独立した、音声信号処理能力を有する電子デバイスである。例えば、移動端末130および移動端末140の各々は、携帯電話、ウェアラブルデバイス、仮想現実(virtual reality、VR)デバイス、拡張現実(augmented reality、AR)デバイスなどであり得る。加えて、移動端末130は、無線または有線ネットワークを通じて移動端末140に接続される。
任意選択で、移動端末130は、収集コンポーネント131、符号化コンポーネント110、およびチャネル符号化コンポーネント132を含み得る。収集コンポーネント131は符号化コンポーネント110に接続され、符号化コンポーネント110は符号化コンポーネント132に接続される。
任意選択で、移動端末140は、音声再生コンポーネント141、復号コンポーネント120、およびチャネル復号コンポーネント142を含み得る。音声再生コンポーネント141は、復号コンポーネント120に接続され、復号コンポーネント120は、チャネル復号コンポーネント142に接続される。
収集コンポーネント131を使用してステレオ信号を収集した後に、移動端末130は、符号化コンポーネント110を使用してステレオ信号を符号化し、ステレオ符号化ビットストリームを取得する。次に、移動端末130は、チャネル符号化コンポーネント132を使用してステレオ符号化ビットストリームを符号化し、伝送信号を取得する。
移動端末130は、無線または有線ネットワークを通じて伝送信号を移動端末140へ送信する。
伝送信号を受信後、移動端末140は、チャネル復号コンポーネント142を使用することにより伝送信号を復号してステレオ符号化ビットストリームを取得し、復号コンポーネント120を使用することによりステレオ符号化ビットストリームを復号してステレオ信号を取得し、音声再生コンポーネント141を使用することによりステレオ信号を再生する。
例えば、本願の本実施形態の説明では、図3に示されるように、符号化コンポーネント110および復号コンポーネント120が、コアネットワークまたは無線ネットワークにおける、音声信号処理能力を有する同一のネットワーク要素150に配置される例を使用する。
任意選択で、ネットワーク要素150は、チャネル復号コンポーネント151、復号コンポーネント120、符号化コンポーネント110、およびチャネル符号化コンポーネント152を含む。チャネル復号コンポーネント151は復号コンポーネント120に接続され、復号コンポーネント120は符号化コンポーネント110に接続され、符号化コンポーネント110はチャネル符号化コンポーネント152に接続される。
チャネル復号コンポーネント151は、別のデバイスによって送信された伝送信号を受信した後に、伝送信号を復号し、第1ステレオ符号化ビットストリームを取得する。復号コンポーネント120はステレオ符号化ビットストリームを復号し、ステレオ信号を取得する。符号化コンポーネント110はステレオ信号を符号化し、第2ステレオ符号化ビットストリームを取得する。チャネル符号化コンポーネント152は、第2ステレオ符号化ビットストリームを符号化し、伝送信号を取得する。
別のデバイスは、音声信号処理能力を有する移動端末であり得る、または、音声信号処理能力を有する別のネットワーク要素であり得る。これについては、本願の実施形態において限定されるものではない。
任意選択で、ネットワーク要素における符号化コンポーネント110および復号コンポーネント120は、移動端末によって送信されたステレオ符号化ビットストリームをトランスコードし得る。
任意選択で、本願の実施形態において、符号化コンポーネント110が配置されるデバイスは、音声符号化デバイスと称され得る。実際の実装において、音声符号化デバイスは音声復号機能も有し得る。これについては、本願の実施形態において限定されるものではない。
任意選択で、本願の実施形態において、ステレオ信号のみが説明のための例として使用される。本願において、音声符号化デバイスは更に、マルチチャネル信号を処理し得、マルチチャネル信号は少なくとも2つのチャネル信号を含む。
符号化コンポーネント110は、代数符号励振線形予測(algebraic code excited linear prediction, ACELP)符号化方法を使用することによりプライマリチャネル信号およびセカンダリチャネル信号を符号化し得る。
ACELP符号化方法は通常、プライマリチャネル信号のLPC係数、および、セカンダリチャネル信号のLPC係数を決定し、プライマリチャネル信号のLPC係数、および、セカンダリチャネル信号のLPC係数の各々をLSFパラメータに変換し、プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対して量子化を実行すること、適応符号励振を検索してピッチ周期および適応的コードブックゲインを決定し、ピッチ周期および適応的コードブックゲインに対して量子化を別々に実行すること、ならびに、代数符号励振を検索して代数符号励振のパルスインデックスおよび利得を決定し、代数符号励振のパルスインデックスおよび利得に対して量子化を別々に実行することを含む。
図4は、符号化コンポーネント110が、プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対して量子化を実行する例示的な方法を示す。
S410:プライマリチャネル信号に基づいてプライマリチャネル信号の元のLSFパラメータを決定する。
S420:セカンダリチャネル信号に基づいてセカンダリチャネル信号の元のLSFパラメータを決定する。
段階S410と段階S420との間には実行の順序が無い。
S430:プライマリチャネル信号の元のLSFパラメータ、および、セカンダリチャネル信号の元のLSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすかどうかを判定する。再使用判定条件は、簡潔に再使用条件とも称され得る。
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たさない場合、段階S440が実行される。セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、段階S450が実行される。
再使用とは、セカンダリチャネル信号の量子化されたLSFパラメータが、プライマリチャネル信号の量子化されたLSFパラメータに基づいて取得され得ることを意味する。例えば、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして使用される。換言すれば、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして再使用される。
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすかどうかを判定することは、セカンダリチャネル信号のLSFパラメータに対して再使用判定を実行すると称され得る。
例えば、再使用判定条件が、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が予め設定された閾値以下であるとき、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が予め設定された閾値より大きい場合、セカンダリチャネル信号のLSFパラメータは再使用判定条件を満たさないと判定される。または、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が、予め設定された閾値以下である場合、セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすと判定され得る。
上述の再使用判定において使用される判定条件は単に例であり、これについては本願に限定されるものではないことが理解されるべきである。
プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離は、プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の差を表すために使用され得る。
プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離は複数の方式で計算され得る。
例えば、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離
Figure 2022188262000010
は、以下の式に従って計算され得る。
Figure 2022188262000011
ここで、
Figure 2022188262000012
はプライマリチャネル信号のLSFパラメータベクトルであり、
Figure 2022188262000013
はセカンダリチャネル信号のLSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数であり、Wは第i加重係数である。
Figure 2022188262000014
は加重距離とも称され得る。上述の式は単に、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離を計算するための例示的な方法であり、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離は代替的に、別の方法を使用することにより計算され得る。例えば、上述の式における加重係数は除去され得る、または、プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対して減算が実行され得る。
セカンダリチャネル信号の元のLSFパラメータに対して再使用判定を実行することは、セカンダリチャネル信号のLSFパラメータに対して量子化判定を実行するとも称され得る。判定結果がセカンダリチャネル信号のLSFパラメータを量子化することである場合、セカンダリチャネル信号の元のLSFパラメータを量子化してビットストリームに書き込み、セカンダリチャネル信号の量子化されたLSFパラメータを取得し得る。
この段階における判定結果をビットストリームに書き込み、判定結果をデコーダ側へ送信し得る。
S440:セカンダリチャネル信号の元のLSFパラメータを量子化してセカンダリチャネル信号の量子化されたLSFパラメータを取得し、プライマリチャネル信号のLSFパラメータを量子化してプライマリチャネル信号の量子化されたLSFパラメータを取得する。
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、プライマリチャネル信号の量子化されたLSFパラメータをセカンダリチャネル信号の量子化されたLSFパラメータとして直接使用することは単に例であることを理解すべきである。当然、別の方法を使用することによりプライマリチャネル信号の量子化されたLSFパラメータを再使用して、セカンダリチャネル信号の量子化されたLSFパラメータを取得し得る。これについては、本願の本実施形態において限定されるものではない。
S450:セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、プライマリチャネル信号の量子化されたLSFパラメータをセカンダリチャネル信号の量子化されたLSFパラメータとして直接使用する。
プライマリチャネル信号の元のLSFパラメータおよびセカンダリチャネル信号の元のLSFパラメータを別々に量子化してビットストリームに書き込み、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータを取得する。この場合、比較的大きい数のビットが占有される。
図5は、本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。再使用判定結果において、再使用判定条件が満たされないことが分かった場合、符号化コンポーネント110は図5に示される方法を実行し得る。
S510:ステレオ信号における現在のフレーム内のプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行し、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
S520:セカンダリチャネル信号の元のLSFパラメータおよびプライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する。
図15に示されるように、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間には類似性がある。線形予測スペクトル包絡線はLPC係数によって表され、LPC係数はLSFパラメータに変換され得る。したがって、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間には類似性がある。したがって、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータの予測残差を決定することは、予測残差の精度の改善に役立つ。
セカンダリチャネル信号の元のLSFパラメータは、従来技術における方法を使用することによってセカンダリチャネル信号に基づいて取得されるLSFパラメータ、例えば、S420において取得される元のLSFパラメータとして理解され得る。
セカンダリチャネル信号の元のLSFパラメータ、および、セカンダリチャネル信号の予測されたLSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータの予測残差を決定することは、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用することを含み得る。
S530:セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化を実行する。
S540:プライマリチャネル信号の量子化されたLSFパラメータに対して量子化を実行する。
本願の本実施形態における符号化方法において、セカンダリチャネル信号のLSFパラメータが符号化される必要がある場合、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化が実行される。セカンダリチャネル信号のLSFパラメータが別々に符号化される方法と比較して、この方法は、符号化に必要なビットの数の低減に役立つ。
加えて、予測残差を決定するために使用される、セカンダリチャネル信号のLSFパラメータは、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散が実行された後に取得されるLSFパラメータに基づく予測を通じて取得されるので、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間の類似の特徴を使用できる。このことは、プライマリチャネル信号の量子化されたLSFパラメータと比較して予測残差の精度を改善することに役立ち、デコーダ側が予測残差およびプライマリチャネル信号の量子化されたLSFパラメータに基づいてセカンダリチャネル信号の量子化されたLSFパラメータを決定する精度の改善に役立つ。
S510、S520、S530は、複数の方式で実装され得る。以下では、図6から図9を参照して説明を提供する。
図6に示されるように、S510はS610を含み得、S520はS620を含み得る。
S610:プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長(pull-to-average)スペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
上述の平均伸長処理は、以下の式に従って実行され得る。
Figure 2022188262000015
ここで、
Figure 2022188262000016
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、βは拡散率(broadening factor)であり、
Figure 2022188262000017
はプライマリチャネル信号の量子化されたLSFパラメータベクトルであり、
Figure 2022188262000018
はセカンダリチャネル信号のLSFパラメータの平均ベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。
通常、異なる符号化帯域幅には異なる線形予測階数が使用され得る。例えば、符号化帯域幅が16KHzである場合、20次線形予測が実行され得る。すなわちM=20である。符号化帯域幅が12.8KHzである場合、16次線形予測が実行され得る。すなわちM=16である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
拡散率βは予め設定された定数であり得る。例えば、βは0より大きく1より小さい予め設定された実定数であり得る。例えば、β=0.82、またはβ=0.91である。
代替的に、拡散率βは適応的に取得され得る。例えば、異なる符号化モード、符号化帯域幅、または符号化レートなどの符号化パラメータに基づいて、異なる拡散率βが予め設定され得、次に、1または複数の現在の符号化パラメータに基づいて、対応する拡散率βが選択される。本明細書において説明される符号化モードは、音声起動検出結果、無声音および有声音の区別などを含み得る。
例えば、以下の対応する拡散率βは、異なる符号化レートに設定され得る。
Figure 2022188262000019
ここで、brateとは符号化レートを表す。
次に、現在のフレームにおける符号化レートに対応する拡散率は、現在のフレームにおける符号化レート、および、符号化レートと拡散率との間の上述の対応関係に基づいて決定され得る。
セカンダリチャネル信号のLSFパラメータの平均ベクトルは、大量のデータに基づく訓練を通じて取得され得るか、予め設定された定数ベクトルであり得るか、または、適応的に取得され得る。
例えば、セカンダリチャネル信号のLSFパラメータの異なる平均ベクトルは、符号化モード、符号化帯域幅、または符号化レートなどの符号化パラメータに基づいて予め設定され得る。次に、セカンダリチャネル信号のLSFパラメータに対応する平均ベクトルは、現在のフレームにおける符号化パラメータに基づいて選択される。
S620:セカンダリチャネル信号の元のLSFパラメータとプライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用する。
具体的には、セカンダリチャネル信号のLSFパラメータの予測残差は以下の式を満たす。
Figure 2022188262000020
ここで、
Figure 2022188262000021
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
Figure 2022188262000022
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
Figure 2022188262000023
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
換言すれば、プライマリチャネル信号のスペクトラム拡散LSFパラメータは、セカンダリチャネル信号の予測されたLSFパラメータとして直接使用され(この実装は、セカンダリチャネル信号のLSFパラメータに対してシングルステージ予測を実行すると称される)、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差は、セカンダリチャネル信号のLSFパラメータの予測残差として使用され得る。
図7に示されるように、S510はS710を含み得、S520はS720を含み得る。
S710:プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長スペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
この段階についてはS610を参照されたい。詳細はここでは再び説明しない。
S720:プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対してマルチステージ予測を実行してセカンダリチャネル信号の予測されたLSFパラメータを取得し、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する。
セカンダリチャネル信号のLSFパラメータに対して実行された予測の回数の特定の数は、セカンダリチャネル信号のLSFパラメータに対して実行された予測のステージの特定の数と称され得る。
マルチステージ予測は、プライマリチャネル信号のスペクトラム拡散LSFパラメータをセカンダリチャネル信号の予測されたLSFパラメータとして予測することを含み得る。予測はイントラ予測と称され得る。
イントラ予測はマルチステージ予測の任意の位置で実行され得る。例えば、イントラ予測(すなわちステージ1予測)が最初に実行され得、次に、イントラ予測以外の予測(例えばステージ2予測およびステージ3予測)が実行される。代替的に、イントラ予測以外の予測(すなわちステージ1予測)が最初に実行され得、次に、イントラ予測(すなわちステージ2予測)が実行される。当然、イントラ予測以外の予測(すなわちステージ3予測)が更に実行され得る。
セカンダリチャネル信号のLSFパラメータに対して2ステージ予測が実行され、ステージ1予測がイントラ予測である場合、ステージ2予測は、セカンダリチャネル信号のLSFパラメータのイントラ予測結果に基づいて(すなわち、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて)実行され得る、または、セカンダリチャネル信号の元のLSFパラメータに基づいて実行され得る。例えば、ステージ2予測は、前のフレームにおけるセカンダリチャネル信号の量子化されたLSFパラメータ、および、現在のフレームのセカンダリチャネル信号の元のLSFパラメータに基づいて、インター予測方法を使用することによって、セカンダリチャネル信号のLSFパラメータに対して実行され得る。
2ステージ予測がセカンダリチャネル信号のLSFパラメータに対して実行され、ステージ1予測がイントラ予測であり、ステージ2予測がプライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて実行される場合、セカンダリチャネルのLSFパラメータの予測残差は以下の式を満たす。
Figure 2022188262000024
Figure 2022188262000025
ここで、
Figure 2022188262000026
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
Figure 2022188262000027
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
Figure 2022188262000028
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、
Figure 2022188262000029
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
Figure 2022188262000030
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルに基づいてセカンダリチャネルのLSFパラメータに対してステージ2予測が実行された後に取得される、セカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
2ステージ予測がセカンダリチャネル信号のLSFパラメータに対して実行され、ステージ1予測がイントラ予測であり、ステージ2予測がセカンダリチャネル信号の元のLSFパラメータベクトルに基づいて実行される場合、セカンダリチャネル信号のLSFパラメータの予測残差は以下の式を満たす。
Figure 2022188262000031
Figure 2022188262000032
ここで、
Figure 2022188262000033
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
Figure 2022188262000034
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
Figure 2022188262000035
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
Figure 2022188262000036
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、
Figure 2022188262000037
は、セカンダリチャネルのLSFパラメータのステージ2予測されたベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔に、LSFパラメータとも称され得る。
図8に示されるように、S510はS810、S820、およびS830を含み得、S520はS840を含み得る。
S810:プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する。
LSFパラメータを線形予測係数に変換する詳細については従来技術を参照されたい。詳細はここでは説明しない。プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数がαとして示され、変換に使用される伝達関数がA(z)として示される場合、以下の式が満たされる。
Figure 2022188262000038
ここで、a=1である。
ここで、αは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、Mは線形予測階数である。
S820:線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する。
修正された線形予測子の伝達関数は以下の式を満たす。
Figure 2022188262000039
ここで、a=1である。
ここで、αは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、βは拡散率であり、Mは線形予測階数である。
プライマリチャネル信号のスペクトラム拡散線形予測係数は以下の式を満たす。
Figure 2022188262000040
ここで、i=1,...,またはMであり、
Figure 2022188262000041
である。
ここで、aは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、
Figure 2022188262000042
はスペクトラム拡散線形予測係数であり、βは拡散率であり、Mは線形予測階数である。
この実装で拡散率βを取得する方式については、S610における拡散率βを取得する方式を参照されたい。詳細はここでは再び説明しない。
S830:プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する。ここで、変換を通じて取得されるLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである。
線形予測係数をLSFパラメータに変換する方法については、従来技術を参照されたい。詳細はここでは説明しない。プライマリチャネル信号のスペクトラム拡散LSFパラメータは
Figure 2022188262000043
として示され得る。
S840:セカンダリチャネル信号の元のLSFパラメータとプライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用する。
この段階については、S620を参照されたい。詳細はここでは再び説明しない。
図9に示されるように、S510はS910、S920、S930を含み得、S520はS940を含み得る。
S910:プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する。
この段階についてはS810を参照されたい。詳細はここでは再び説明しない。
S920:線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する。
この段階についてはS820を参照されたい。詳細はここでは再び説明しない。
S930:プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する。ここで、変換を通じて取得されるLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである。
この段階についてはS830を参照されたい。詳細はここでは再び説明しない。
S940:プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対してマルチステージ予測を実行してセカンダリチャネル信号の予測されたLSFパラメータを取得し、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する。
この段階についてはS720を参照されたい。詳細はここでは再び説明しない。
本願の本実施形態におけるS530において、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化が実行される場合、従来技術における任意のLSFパラメータベクトル量子化方法、例えば、分割ベクトル量子化、マルチステージベクトル量子化、またはセーフネットベクトル量子化が参照され得る。
セカンダリチャネル信号のLSFパラメータの予測残差を量子化した後に取得されるベクトルが
Figure 2022188262000044
として示される場合、セカンダリチャネル信号の量子化されたLSFパラメータは以下の式を満たす。
Figure 2022188262000045
ここで、
Figure 2022188262000046
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
Figure 2022188262000047
は、セカンダリチャネル信号のLSFパラメータの予測残差を量子化した後に取得されるベクトルであり、
Figure 2022188262000048
は、セカンダリチャネル信号の量子化されたLSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
図10は、本願の一実施形態によるステレオ信号復号方法の概略フローチャートである。再使用判定結果において、再使用条件が満たされていないことが分かった場合、復号コンポーネント120は図10に示される方法を実行し得る。
S1010:現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得する。
この段階については従来技術を参照されたい。詳細はここでは説明しない。
S1020:プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
この段階についてはS510を参照されたい。詳細はここでは再び説明しない。
S1030:ビットストリームからステレオ信号における現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を取得する。
この段階については、従来技術におけるビットストリームからステレオ信号の任意のパラメータを取得するための実装方法を参照されたい。詳細はここでは説明しない。
S1040:セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する。
本願の実施形態における復号方法において、セカンダリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号のLSFパラメータの予測残差に基づいて決定できる。これは、ビットストリームにおけるセカンダリチャネル信号のLSFパラメータによって占有されるビットの数を低減することに役立つ。
加えて、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散が実行された後に取得されたLSFパラメータに基づいて決定されるので、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間の類似の特徴を使用できる。これは、セカンダリチャネル信号の量子化されたLSFパラメータの精度の改善に役立つ。
いくつかの可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得することは、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行してスペクトラム拡散LSFパラメータを取得することを含み、ここで、平均伸長処理は、以下の式に従って実行され得る。
Figure 2022188262000049
ここで、
Figure 2022188262000050
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000051
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000052
は、セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
いくつかの可能な実装において、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータと、セカンダリチャネル信号のLSFパラメータの予測残差との和である。
いくつかの可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号の量子化されたLSFパラメータを決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、予測されたLSFパラメータと、セカンダリチャネル信号のLSFパラメータの予測残差との和をセカンダリチャネル信号の量子化されたLSFパラメータとして使用する段階とを含み得る。
本実装において、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する実装については、S720を参照されたい。詳細はここでは再び説明しない。
図11は、本願の一実施形態によるステレオ信号符号化装置1100の概略ブロック図である。符号化装置1100は単に例であることを理解すべきである。
いくつかの実装において、スペクトラム拡散モジュール1110、決定モジュール1120、および量子化モジュール1130はすべて、移動端末130の符号化コンポーネント110、またはネットワーク要素150に含まれ得る。
スペクトラム拡散モジュール1110は、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行し、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成される。
決定モジュール1120は、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を判定するよう構成される。
量子化モジュール1130は、予測残差に対して量子化を実行するよう構成される。
任意選択で、スペクトラム拡散モジュールは、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行し、スペクトラム拡散LSFパラメータを取得するよう構成され、平均伸長処理は以下の式に従って実行され得る。
Figure 2022188262000053
ここで、
Figure 2022188262000054
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000055
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000056
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
任意選択で、スペクトラム拡散モジュールは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
任意選択で、セカンダリチャネル信号の予測残差は、セカンダリチャネル信号の元のLSFパラメータと、スペクトラム拡散LSFパラメータとの間の差である。
任意選択で、決定モジュールは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得すること、および、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用することを行うよう構成され得る。
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前に、決定モジュールは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
符号化装置1100は、図5に説明される符号化方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
図12は、本願の一実施形態によるステレオ信号復号装置1200の概略ブロック図である。復号装置1200は単に例であることを理解すべきである。
いくつかの実装において、取得モジュール1220、スペクトラム拡散モジュール1230、および決定モジュール1240はすべて、移動端末140またはネットワーク要素150の復号コンポーネント120に含まれ得る。
取得モジュール1220は、現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得するよう構成される。
スペクトラム拡散モジュール1230は、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成される。
取得モジュール1220は更に、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得するよう構成される。
決定モジュール1240は、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定するよう構成される。
任意選択で、スペクトラム拡散モジュールは具体的には、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
Figure 2022188262000057
ここで、
Figure 2022188262000058
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000059
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000060
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
任意選択で、スペクトラム拡散モジュールは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
任意選択で、セカンダリチャネル信号の量子化されたLSFパラメータは、スペクトラム拡散LSFパラメータと予測残差との和である。
任意選択で、決定モジュールは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得すること、および、予測されたLSFパラメータと予測残差との和を、セカンダリチャネル信号の量子化されたLSFパラメータとして使用することを行うよう構成され得る。
ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得する前に、取得モジュールは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
復号装置1200は、図10に説明される復号方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
図13は、本願の一実施形態によるステレオ信号符号化装置1300の概略ブロック図である。符号化装置1300は単に例であることを理解すべきである。
メモリ1310はプログラムを格納するよう構成される。
プロセッサ1320は、メモリに格納されたプログラムを実行するよう構成される。メモリ内のプログラムが実行されるとき、プロセッサは、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を判定すること、ならびに、予測残差に対して量子化を実行することを行うよう構成される。
任意選択で、プロセッサ1320は具体的には、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
Figure 2022188262000061
ここで、
Figure 2022188262000062
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000063
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000064
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
任意選択で、プロセッサは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
任意選択で、セカンダリチャネル信号の予測残差は、セカンダリチャネル信号の元のLSFパラメータと、スペクトラム拡散LSFパラメータとの間の差である。
任意選択で、プロセッサは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得すること、および、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用することを行うよう構成され得る。
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前に、プロセッサは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
符号化装置1300は、図5に説明される符号化方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
図14は、本願の一実施形態によるステレオ信号復号装置1400の概略ブロック図である。復号装置1400は単に例であることを理解すべきである。
メモリ1410はプログラムを格納するよう構成される。
プロセッサ1420は、メモリに格納されたプログラムを実行するよう構成される。メモリ内のプログラムが実行されるとき、プロセッサは、現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得すること、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得すること、および、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定することを行うよう構成される。
任意選択で、プロセッサは具体的には、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
Figure 2022188262000065
ここで、
Figure 2022188262000066
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000067
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000068
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
任意選択で、プロセッサは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
任意選択で、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータと予測残差との和である。
任意選択で、プロセッサは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得すること、および、予測されたLSFパラメータと予測残差との和を、セカンダリチャネル信号の量子化されたLSFパラメータとして使用することを行うよう構成され得る。
ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得する前に、プロセッサは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
復号装置1400は、図10に説明される復号方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
当業者であれば、本明細書に開示された実施形態で説明された複数の例を組み合わせて、複数のユニット及び複数のアルゴリズム段階が、電子的ハードウェア又はコンピュータソフトウェアと電子的ハードウェアとの組み合わせによって実装され得ることを認識するであろう。これらの機能がハードウェアで実行されるのか、又はソフトウェアで実行されるのかは、特定の用途及び技術的解決手段の設計制約条件で決まる。当業者であれば、異なる方法を用いて、説明された機能を特定の用途ごとに実装するであろうが、この実装例が本願の範囲を超えるものとみなされるべきではない。
当業者は明確に理解し得るように、説明を簡便かつ簡潔にする目的で、前述のシステム、装置、およびユニットの詳細な動作プロセスについては、前述の方法の実施形態における対応するプロセスを参照されたい。詳細はここでは再び説明しない。
本願において提供されたいくつかの実施形態において、開示されたシステム、装置、および方法は、別の方式で実装され得ることが理解されるべきである。例えば、説明される装置の実施形態は単に例である。例えば、ユニットへの区分は単に、論理的な機能の区分である。実際の実装においては別の区分方式があってよい。例えば、複数のユニット又はコンポーネントが組み合わされても、別のシステムに統合されてもよく、一部の機能が無視されても、実行されなくてもよい。さらに、示された又は説明された相互結合又は直接結合又は通信接続は、いくつかのインタフェースを用いて実装されてよい。複数の装置間又は複数のユニット間の間接的な結合又は通信接続は、電子的形態、機械的形態、又は他の形態で実装されてよい。
別個の部分として説明されているユニットは、物理的に別個のものであってもなくてもよい、かつ、ユニットとして表示されている部分は、物理的なユニットであってもなくてもよいし、1つの位置に配置されてもよいし、複数のネットワークユニットに分散されてもよい。これらのユニットの一部又は全部が、これらの実施形態の解決手段の目的を実現するために、実際の要件に基づいて選択されてよい。
加えて、本願の実施形態における機能ユニットが1つの処理ユニットに統合されてもよく、当該ユニットの各々が物理的に単独で存在してもよく、2つまたはそれより多くのユニットが1つのユニットに統合されてもよい。
本願の実施形態におけるプロセッサは、中央演算処理装置(central processing unit, CPU)であり得ることを理解すべきである。プロセッサは代替的に、別の汎用プロセッサ、デジタル信号プロセッサ(digital signal processor, DSP)、特定用途向け集積回路(application-specific integrated circuit, ASIC)、フィールドプログラマブルゲートアレイ(field programmable gate array, FPGA)、または、別のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理デバイス、ディスクリートハードウェアコンポーネントなどであり得る。汎用プロセッサはマイクロプロセッサであり得るか、または、プロセッサは任意の従来のプロセッサなどであり得る。
機能がソフトウェア機能ユニットの形態で実装され、独立製品として販売または使用される場合、機能はコンピュータ可読記憶媒体に記憶されてよい。そのような理解に基づいて、基本的には本願の技術的解決手段、又は先行技術に寄与する部分、又は技術的解決手段の一部が、ソフトウェア製品の形態で実装されてよい。コンピュータソフトウェア製品は、記憶媒体に記憶されており、コンピュータ装置(パーソナルコンピュータ、サーバ、またはネットワーク装置であってもよい)に、本願の実施形態に記載された方法の全てまたはある段階を実行するように命令するためのいくつかの命令を含む。上述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、リードオンリメモリ(read-only memory、ROM)、ランダムアクセスメモリ(random access memory、RAM)、磁気ディスク、またはコンパクトディスクなどのプログラムコードを記憶できる任意の媒体を含む。
前述の説明は、本願の単なる特定の実装例にすぎず、本願の保護範囲を限定することを意図してはいない。本願に開示された技術的範囲内で当業者により容易に考え出される、あらゆる変形又は置換は、本願の保護範囲に含まれることになる。したがって、本願の保護範囲は特許請求の範囲の保護範囲に従うことになる。
他の可能な請求項
(項目1)
ステレオ信号の符号化方法であって、
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、
上記予測残差に対して量子化を実行する段階と
を備える方法。
(項目2)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は以下の式、すなわち
Figure 2022188262000069
に従って実行され、
Figure 2022188262000070
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000071
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000072
は上記セカンダリチャネル信号の上記元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目1に記載の符号化方法。
(項目3)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得される上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目1に記載の符号化方法。
(項目4)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目1から3のいずれか一項に記載の符号化方法。
(項目5)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を上記セカンダリチャネル信号の上記予測残差として使用する、段階と
を含む、項目1から3のいずれか一項に記載の符号化方法。
(項目6)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階の前に、上記符号化方法は更に、
上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定する段階
を備える、項目1から5のいずれか一項に記載の符号化方法。
(項目7)
ステレオ信号の復号方法であって、
ビットストリームから上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
上記ビットストリームから、上記ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を取得する段階と、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階と
を備える復号方法。
(項目8)
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は、以下の式、すなわち、
Figure 2022188262000073
に従って実行され、
Figure 2022188262000074
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000075
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000076
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目7に記載の復号方法。
(項目9)
上記ステレオ信号における上記現在のフレームにおける上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目7に記載の復号方法。
(項目10)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、項目7から9のいずれか一項に記載の復号方法。
(項目11)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する段階と
を含む、項目7から9のいずれか一項に記載の復号方法。
(項目12)
ステレオ信号符号化装置であって、メモリおよびプロセッサを備え、
上記メモリはプログラムを格納するよう構成され、
上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され。上記メモリ内の上記プログラムが実行されるとき、上記プロセッサは、
上記ステレオ信号における上記現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定すること、ならびに、
上記予測残差に対して量子化を実行すること
を行うよう構成される、ステレオ信号符号化装置。
(項目13)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
Figure 2022188262000077
に従って実行され、
Figure 2022188262000078
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000079
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000080
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目12に記載の符号化装置。
(項目14)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目12に記載の符号化装置。
(項目15)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目12から14のいずれか一項に記載の符号化装置。
(項目16)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得し、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を、上記セカンダリチャネル信号の上記予測残差として使用するよう構成される、
項目12から14のいずれか一項に記載の符号化装置。
(項目17)
上記セカンダリチャネル信号の上記元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差を決定する前に、上記プロセッサは更に、上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定するよう構成される、項目12から16のいずれか一項に記載の符号化装置。
(項目18)
メモリおよびプロセッサを備えるステレオ信号復号装置であって、上記メモリはプログラムを格納するよう構成され、上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され、上記メモリにおける上記プログラムが実行される場合、上記プロセッサは、
上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得すること、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
上記ステレオ信号における上記現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を上記ビットストリームから取得すること、ならびに、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定すること
を行うよう構成される、ステレオ信号復号装置。
(項目19)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
Figure 2022188262000081
に従って実行され、
Figure 2022188262000082
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
Figure 2022188262000083
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
Figure 2022188262000084
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目18に記載の復号装置。
(項目20)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目18に記載の復号装置。
(項目21)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、
項目18から20のいずれか一項に記載の復号装置。
(項目22)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得し、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する
よう構成される、項目18から20のいずれか一項に記載の復号装置。

Claims (8)

  1. 第1チャネルおよび第2チャネルの信号を有する音声信号のフレームを取得する段階と、
    前記第1チャネルの信号の複数の第1イニシャル線スペクトル周波数(LSF)パラメータを取得する段階と、
    前記第2チャネルの信号の複数の第2イニシャルLSFパラメータを取得する段階と、
    前記複数の第1イニシャルLSFパラメータのそれぞれにスペクトラム拡散を実行して、複数の第1拡散LSFパラメータを取得する段階と、
    少なくとも前記複数の第1拡散LSFパラメータと、前記複数の第2イニシャルLSFパラメータとに応じて前記第2チャネルの信号の複数のLSF残渣を取得する段階と、
    前記複数のLSF残渣を符号化して、前記フレームに対応する符号化されたビットストリームを取得する段階と、
    前記符号化されたビットストリームを送信する段階と、
    を備える方法。
  2. 前記複数の第1イニシャルLSFパラメータおよび前記複数の第1拡散LSFパラメータは、
    Figure 2022188262000085
    を満たし、
    LSFSB(i)は、前記複数の第1拡散LSFパラメータのうち、i番目の第1拡散LSFパラメータを表し、
    Figure 2022188262000086
    は、前記複数の第1イニシャルLSFパラメータのうち、i番目の第1イニシャルLSFパラメータを表し、
    βは、0<β<1の拡散率を表し、
    Figure 2022188262000087
    は、前記複数の第2イニシャルLSFパラメータに対応する平均ベクトルを表す、
    請求項1に記載の方法。
  3. 前記複数の第1拡散LSFパラメータと、前記複数の第2イニシャルLSFパラメータとの間の複数の第1の差を取得する段階をさらに備え、
    前記複数の第1の差は、前記複数のLSF残渣である、請求項1または2に記載の方法。
  4. 前記複数の第1拡散LSFパラメータに対して2ステージ予測を実行して複数の予測されたLSFパラメータを取得する段階と、
    前記複数の予測されたLSFパラメータと前記複数の第2イニシャルLSFパラメータとの間の複数の第2の差を取得する段階と、
    をさらに備え、
    前記複数の第2の差は、前記複数のLSF残渣である、
    請求項1または2に記載の方法。
  5. 前記複数の第1イニシャルLSFパラメータと、前記複数の第2イニシャルLSFパラメータとの間の差を取得する段階と、
    前記差が予め設定された閾値以上である場合に前記スペクトラム拡散を実行する段階と、
    をさらに備える請求項1から4の何れか一項に記載の方法。
  6. 請求項1から5の何れか一項に記載の方法をコンピュータに実行させるプログラムを記録したコンピュータ可読記憶媒体。
  7. 請求項1から5の何れか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
  8. メモリと、
    前記メモリに接続されて請求項1から5の何れか一項に記載の方法を実行するよう構成された少なくとも1つのプロセッサと、
    を備えるステレオ信号符号化装置。
JP2022164615A 2018-06-29 2022-10-13 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 Active JP7477247B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024066011A JP2024102106A (ja) 2018-06-29 2024-04-16 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201810701919.1A CN110728986B (zh) 2018-06-29 2018-06-29 立体声信号的编码方法、解码方法、编码装置和解码装置
CN201810701919.1 2018-06-29
PCT/CN2019/093404 WO2020001570A1 (zh) 2018-06-29 2019-06-27 立体声信号的编码方法、解码方法、编码装置和解码装置
JP2020570100A JP7160953B2 (ja) 2018-06-29 2019-06-27 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020570100A Division JP7160953B2 (ja) 2018-06-29 2019-06-27 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024066011A Division JP2024102106A (ja) 2018-06-29 2024-04-16 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Publications (2)

Publication Number Publication Date
JP2022188262A true JP2022188262A (ja) 2022-12-20
JP7477247B2 JP7477247B2 (ja) 2024-05-01

Family

ID=68986259

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020570100A Active JP7160953B2 (ja) 2018-06-29 2019-06-27 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
JP2022164615A Active JP7477247B2 (ja) 2018-06-29 2022-10-13 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
JP2024066011A Pending JP2024102106A (ja) 2018-06-29 2024-04-16 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020570100A Active JP7160953B2 (ja) 2018-06-29 2019-06-27 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024066011A Pending JP2024102106A (ja) 2018-06-29 2024-04-16 ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置

Country Status (7)

Country Link
US (3) US11462223B2 (ja)
EP (2) EP3806093B1 (ja)
JP (3) JP7160953B2 (ja)
CN (2) CN115831130A (ja)
BR (1) BR112020026932A2 (ja)
ES (1) ES2963219T3 (ja)
WO (1) WO2020001570A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115472170A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 一种三维音频信号的处理方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012066727A1 (ja) * 2010-11-17 2012-05-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
CN101695150B (zh) * 2009-10-12 2011-11-30 清华大学 多声道音频编码方法、编码器、解码方法和解码器
CN102044250B (zh) * 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
ES2904275T3 (es) 2015-09-25 2022-04-04 Voiceage Corp Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012066727A1 (ja) * 2010-11-17 2012-05-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法

Also Published As

Publication number Publication date
EP3806093B1 (en) 2023-10-04
ES2963219T3 (es) 2024-03-25
WO2020001570A1 (zh) 2020-01-02
EP4297029A3 (en) 2024-02-28
JP2024102106A (ja) 2024-07-30
US20220406316A1 (en) 2022-12-22
EP3806093A1 (en) 2021-04-14
JP7477247B2 (ja) 2024-05-01
EP4297029A2 (en) 2023-12-27
WO2020001570A8 (zh) 2020-10-22
US11790923B2 (en) 2023-10-17
CN110728986B (zh) 2022-10-18
JP2021529340A (ja) 2021-10-28
US20240021209A1 (en) 2024-01-18
BR112020026932A2 (pt) 2021-03-30
JP7160953B2 (ja) 2022-10-25
CN115831130A (zh) 2023-03-21
CN110728986A (zh) 2020-01-24
EP3806093A4 (en) 2021-07-21
US20210125620A1 (en) 2021-04-29
US11462223B2 (en) 2022-10-04

Similar Documents

Publication Publication Date Title
TWI672691B (zh) 解碼方法
TWI762008B (zh) 編碼及解碼浸入式語音及音訊服務位元流之方法、系統及非暫時性電腦可讀媒體
US11935547B2 (en) Method for determining audio coding/decoding mode and related product
JP2024102106A (ja) ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
JP2022543083A (ja) Ivasビットストリームの符号化および復号化
US20240153511A1 (en) Time-domain stereo encoding and decoding method and related product
US20240274136A1 (en) Method and apparatus for determining weighting factor during stereo signal encoding
KR102592670B1 (ko) 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240416

R150 Certificate of patent or registration of utility model

Ref document number: 7477247

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150