JP2024023484A - 音信号ダウンミックス方法、音信号ダウンミックス装置及びプログラム - Google Patents

音信号ダウンミックス方法、音信号ダウンミックス装置及びプログラム Download PDF

Info

Publication number
JP2024023484A
JP2024023484A JP2023203361A JP2023203361A JP2024023484A JP 2024023484 A JP2024023484 A JP 2024023484A JP 2023203361 A JP2023203361 A JP 2023203361A JP 2023203361 A JP2023203361 A JP 2023203361A JP 2024023484 A JP2024023484 A JP 2024023484A
Authority
JP
Japan
Prior art keywords
channel
signal
sound signal
subtraction gain
left channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023203361A
Other languages
English (en)
Inventor
亮介 杉浦
Ryosuke Sugiura
健弘 守谷
Takehiro Moriya
優 鎌本
Masaru Kamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/JP2020/010080 external-priority patent/WO2021181472A1/ja
Priority claimed from PCT/JP2020/010081 external-priority patent/WO2021181473A1/ja
Priority claimed from PCT/JP2020/041216 external-priority patent/WO2021181746A1/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JP2024023484A publication Critical patent/JP2024023484A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】2チャネルの音信号から符号化処理などの信号処理に有用なモノラル信号を得る技術を提供する。【解決手段】音信号ダウンミックス装置は、左チャネル入力音信号と右チャネル入力音信号を混合した信号であるダウンミックス信号を得る音信号ダウンミックス装置であって、左チャネル入力音信号と右チャネル入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、左チャネル入力音信号と右チャネル入力音信号の相関係数である左右相関係数と、を得る左右関係情報取得部185と、先行チャネル情報と左右相関係数とに基づき、左チャネル入力音信号と右チャネル入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数が大きいほど大きく含まれるように、左チャネル入力音信号と右チャネル入力音信号を重み付け平均してダウンミックス信号を得るダウンミックス部112と、を備える。【選択図】図22

Description

本発明は、音信号をモノラルで符号化したり、モノラル符号化とステレオ符号化を併用して音信号を符号化したり、音信号をモノラルで信号処理したり、ステレオの音信号にモノラルの音信号を用いた信号処理をしたりするために、2チャネルの音信号からモノラルの音信号を得る技術に関する。
2チャネルの音信号からモノラルの音信号を得て、2チャネルの音信号とモノラルの音信号をエンベデッド符号化/復号する技術として、特許文献1の技術がある。特許文献1には、入力された左チャネルの音信号と入力された右チャネルの音信号を対応するサンプルごとに平均することでモノラル信号を得て、モノラル信号を符号化(モノラル符号化)してモノラル符号を得て、モノラル符号を復号(モノラル復号)してモノラル局部復号信号を得て、左チャネルと右チャネルのそれぞれについて、入力された音信号と、モノラル局部復号信号から得た予測信号と、の差分(予測残差信号)を符号化する技術が開示されている。特許文献1の技術では、それぞれのチャネルについて、モノラル局部復号信号に遅延を与えて振幅比を与えた信号を予測信号として、入力された音信号と予測信号の誤差が最小となる遅延と振幅比を有する予測信号を選択するか、または、入力された音信号とモノラル局部復号信号との間の相互相関を最大にする遅延差と振幅比を有する予測信号を用いて、入力された音信号から予測信号を減算して予測残差信号を得て、予測残差信号を符号化/復号の対象とすることで、各チャネルの復号音信号の音質劣化を抑えている。
WO2006-070751号公報
特許文献1の技術では、予測信号を得る際にモノラル局部復号信号に与える遅延と振幅比を最適化することで、各チャネルの符号化効率を高めることができる。しかし、特許文献1の技術では、モノラル局部復号信号は左チャネルの音信号と右チャネルの音信号を平均して得たモノラル信号を符号化・復号して得たものである。すなわち、特許文献1の技術には、2チャネルの音信号から符号化処理などの信号処理に有用なモノラル信号を得る工夫がされていないという課題がある。
本発明では、2チャネルの音信号から符号化処理などの信号処理に有用なモノラル信号を得る技術を提供することを目的とする。
本発明の一態様は、左チャネル入力音信号と右チャネル入力音信号を混合した信号であるダウンミックス信号を得る音信号ダウンミックス方法であって、左チャネル入力音信号と右チャネル入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、左チャネル入力音信号と右チャネル入力音信号の相関係数である左右相関係数と、を得る左右関係情報取得ステップと、先行チャネル情報と左右相関係数とに基づき、左チャネル入力音信号と右チャネル入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数が大きいほど大きく含まれるように、左チャネル入力音信号と右チャネル入力音信号を重み付け平均してダウンミックス信号を得るダウンミックスステップと、を有することを特徴とする。
本発明の一態様は、前記の音信号ダウンミックス方法であって、サンプル番号をtとし、左チャネル入力音信号をxL(t)とし、右チャネル入力音信号をxR(t)とし、ダウンミックス信号をxM(t)とし、左右相関係数をγとして、ダウンミックスステップは、先行チャネル情報が左チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1+γ)/2)×xL(t)+((1-γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が右チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1-γ)/2)×xL(t)+((1+γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が何れのチャネルも先行していないことを表す場合には、各サンプル番号tについて、xM(t)=(xL(t)+xR(t))/2によりダウンミックス信号を得ることを特徴とする。
本発明の一態様は、前記の音信号ダウンミックス方法を音信号ダウンミックスステップとして有し、ダウンミックスステップが得たダウンミックス信号を符号化してモノラル符号を得るモノラル符号化ステップと、左チャネル入力音信号と右チャネル入力音信号を符号化してステレオ符号を得るステレオ符号化ステップと、を更に有することを特徴とする。
本発明によれば、2チャネルの音信号から符号化処理などの信号処理に有用なモノラル信号を得ることができる。
第1参考形態と第2実施形態の符号化装置の例を示すブロック図である。 第1参考形態の符号化装置の処理の例を示す流れ図である。 第1参考形態の復号装置の例を示すブロック図である。 第1参考形態の復号装置の処理の例を示す流れ図である。 第1参考形態の左チャネル減算利得推定部と右チャネル減算利得推定部の処理の例を示す流れ図である。 第1参考形態の左チャネル減算利得推定部と右チャネル減算利得推定部の処理の例を示す流れ図である。 第1参考形態の左チャネル減算利得復号部と右チャネル減算利得復号部の処理の例を示す流れ図である。 第1参考形態の左チャネル減算利得推定部と右チャネル減算利得推定部の処理の例を示す流れ図である。 第1参考形態の左チャネル減算利得推定部と右チャネル減算利得推定部の処理の例を示す流れ図である。 第2参考形態と第1実施形態の符号化装置の例を示すブロック図である。 第2参考形態の符号化装置の処理の例を示す流れ図である。 第2参考形態の復号装置の例を示すブロック図である。 第2参考形態の復号装置の処理の例を示す流れ図である。 第1実施形態の符号化装置の処理の例を示す流れ図である。 第2実施形態の符号化装置の処理の例を示す流れ図である。 第3実施形態の符号化装置の例を示すブロック図である。 第3実施形態の符号化装置の処理の例を示す流れ図である。 第4実施形態の音信号符号化装置の例を示すブロック図である。 第4実施形態の音信号符号化装置の処理の例を示す流れ図である。 第4実施形態の音信号処理装置の例を示すブロック図である。 第4実施形態の音信号処理装置の処理の例を示す流れ図である。 第4実施形態の音信号ダウンミックス装置の例を示すブロック図である。 第4実施形態の音信号ダウンミックス装置の処理の例を示す流れ図である。 本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。
まず、明細書における表記方法について説明する。ある文字xに対する^xのような上付き添え字の”^”は、本来”x”の真上に記載されるべきである。しかし、明細書の記載表記の制約上、^xと記載することもある。
<第1参考形態>
発明の実施形態を説明する前に、第1参考形態と第2参考形態として、第2実施形態の発明と第1実施形態の発明を実施するための元となる形態の符号化装置と復号装置について説明する。なお、明細書及び特許請求の範囲において、符号化装置のことを音信号符号化装置、符号化方法のことを音信号符号化方法、復号装置のことを音信号復号装置、復号方法のことを音信号復号方法と呼ぶこともある。
≪符号化装置100≫
第1参考形態の符号化装置100は、図1に示す通り、ダウンミックス部110と左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150とモノラル符号化部160とステレオ符号化部170を含む。符号化装置100は、例えば20msの所定の時間長のフレーム単位で、入力された2チャネルステレオの時間領域の音信号を符号化して、後述するモノラル符号CMと左チャネル減算利得符号Cαと右チャネル減算利得符号Cβとステレオ符号CSとを得て出力する。符号化装置に入力される2チャネルステレオの時間領域の音信号は、例えば、音声や音楽などの音を2個のマイクロホンそれぞれで収音してAD変換して得られたディジタルの音声信号又は音響信号であり、左チャネルの入力音信号と右チャネルの入力音信号から成る。符号化装置が出力する符号、すなわち、モノラル符号CMと左チャネル減算利得符号Cαと右チャネル減算利得符号Cβとステレオ符号CS、は復号装置へ入力される。符号化装置100は、各フレームについて、図2に例示するステップS110からステップS170の処理を行う。
[ダウンミックス部110]
ダウンミックス部110には、符号化装置100に入力された左チャネルの入力音信号と、符号化装置100に入力された右チャネルの入力音信号と、が入力される。ダウンミックス部110は、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左チャネルの入力音信号と右チャネルの入力音信号を混合した信号であるダウンミックス信号を得て出力する(ステップS110)。
例えば、フレーム当たりのサンプル数をTとすると、ダウンミックス部110には、符号化装置100にフレーム単位で入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と右チャネルの入力音信号xR(1), xR(2), ..., xR(T)が入力される。ここで、Tは正の整数であり、例えば、フレーム長が20msであり、サンプリング周波数が32kHzであれば、Tは640である。ダウンミックス部110は、入力された左チャネルの入力音信号と右チャネルの入力音信号の対応するサンプルごとのサンプル値の平均値による系列をダウンミックス信号xM(1), xM(2), ..., xM(T)として得て出力する。すなわち、各サンプル番号をtとすると、xM(t)=(xL(t)+xR(t))/2である。
[左チャネル減算利得推定部120]
左チャネル減算利得推定部120には、符号化装置100に入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)と、が入力される。左チャネル減算利得推定部120は、入力された左チャネルの入力音信号とダウンミックス信号から、左チャネル減算利得αと、左チャネル減算利得αを表す符号である左チャネル減算利得符号Cαと、を得て出力する(ステップS120)。左チャネル減算利得推定部120は、左チャネル減算利得αと左チャネル減算利得符号Cαを、特許文献1で振幅比gを求めている方法やその振幅比gを符号化する方法に例示されるような周知の方法、または、新たに発案した量子化誤差を最小化する原理に基づく方法で求める。量子化誤差を最小化する原理とこの原理に基づく方法については後述する。
[左チャネル信号減算部130]
左チャネル信号減算部130には、符号化装置100に入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)と、左チャネル減算利得推定部120が出力した左チャネル減算利得αと、が入力される。左チャネル信号減算部130は、対応するサンプルtごとに、ダウンミックス信号のサンプル値xM(t)と左チャネル減算利得αとを乗算した値α×xM(t)を左チャネルの入力音信号のサンプル値xL(t)から減算した値xL(t)-α×xM(t)による系列を左チャネル差分信号yL(1), yL(2), ..., yL(T)として得て出力する(ステップS130)。すなわち、yL(t)=xL(t)-α×xM(t)である。符号化装置100においては、局部復号信号を得るための遅延や演算処理量を要さないようにするために、左チャネル信号減算部130では、モノラル符号化の局部復号信号である量子化済みのダウンミックス信号ではなく、ダウンミックス部110が得た量子化されていないダウンミックス信号xM(t)を用いるとよい。ただし、左チャネル減算利得推定部120が量子化誤差を最小化する原理に基づく方法ではなく特許文献1に例示されているような周知の方法で左チャネル減算利得αを得る場合には、符号化装置100のモノラル符号化部160の後段またはモノラル符号化部160内にモノラル符号CMに対応する局部復号信号を得る手段を備えて、左チャネル信号減算部130では、ダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて、特許文献1などの従来の符号化装置と同様に、モノラル符号化の局部復号信号である量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)を用いて左チャネル差分信号を得てもよい。
[右チャネル減算利得推定部140]
右チャネル減算利得推定部140には、符号化装置100に入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)と、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)と、が入力される。右チャネル減算利得推定部140は、入力された右チャネルの入力音信号とダウンミックス信号から、右チャネル減算利得βと、右チャネル減算利得βを表す符号である右チャネル減算利得符号Cβと、を得て出力する(ステップS140)。右チャネル減算利得推定部140は、右チャネル減算利得βと右チャネル減算利得符号Cβを、特許文献1で振幅比gを求めている方法やその振幅比gを符号化する方法に例示されるような周知の方法、または、新たに発案した量子化誤差を最小化する原理に基づく方法で求める。量子化誤差を最小化する原理とこの原理に基づく方法については後述する。
[右チャネル信号減算部150]
右チャネル信号減算部150には、符号化装置100に入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)と、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)と、右チャネル減算利得推定部140が出力した右チャネル減算利得βと、が入力される。右チャネル信号減算部150は、対応するサンプルtごとに、ダウンミックス信号のサンプル値xM(t)と右チャネル減算利得βとを乗算した値β×xM(t)を右チャネルの入力音信号のサンプル値xR(t)から減算した値xR(t)-β×xM(t)による系列を右チャネル差分信号yR(1), yR(2), ..., yR(T)として得て出力する(ステップS150)。すなわち、yR(t)=xR(t)-β×xM(t)である。右チャネル信号減算部150では、左チャネル信号減算部130と同様に、符号化装置100において局部復号信号を得るための遅延や演算処理量を要さないようにするために、モノラル符号化の局部復号信号である量子化済みのダウンミックス信号ではなく、ダウンミックス部110が得た量子化されていないダウンミックス信号xM(t)を用いるとよい。ただし、右チャネル減算利得推定部140が量子化誤差を最小化する原理に基づく方法ではなく特許文献1に例示されているような周知の方法で右チャネル減算利得βを得る場合には、符号化装置100のモノラル符号化部160の後段またはモノラル符号化部160内にモノラル符号CMに対応する局部復号信号を得る手段を備えて、左チャネル信号減算部130と同様に、右チャネル信号減算部150では、ダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて、特許文献1などの従来の符号化装置と同様に、モノラル符号化の局部復号信号である量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)を用いて右チャネル差分信号を得てもよい。
[モノラル符号化部160]
モノラル符号化部160には、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)が入力される。モノラル符号化部160は、入力されたダウンミックス信号を所定の符号化方式でbMビットで符号化してモノラル符号CMを得て出力する(ステップS160)。すなわち、入力されたTサンプルのダウンミックス信号xM(1), xM(2), ..., xM(T)からbMビットのモノラル符号CMを得て出力する。符号化方式としては、どのようなものを用いてもよく、例えば3GPP EVS規格のような符号化方式を用いればよい。
[ステレオ符号化部170]
ステレオ符号化部170には、左チャネル信号減算部130が出力した左チャネル差分信号yL(1), yL(2), ..., yL(T)と、右チャネル信号減算部150が出力した右チャネル差分信号yR(1), yR(2), ..., yR(T)と、が入力される。ステレオ符号化部170は、入力された左チャネル差分信号と右チャネル差分信号を所定の符号化方式で合計bsビットで符号化してステレオ符号CSを得て出力する(ステップS170)。すなわち、入力されたTサンプルの左チャネル差分信号yL(1), yL(2), ..., yL(T)と、入力されたTサンプルの右チャネル差分信号yR(1), yR(2), ..., yR(T)と、から合計bSビットのステレオ符号CSを得て出力する。符号化方式としては、どのようなものを用いてもよく、例えばMPEG-4 AAC規格のステレオ復号方式に対応するステレオ符号化方式を用いてもよいし、入力された左チャネル差分信号と右チャネル差分信号それぞれを独立して符号化するものを用いてもよく、符号化により得られた符号全てを合わせたものをステレオ符号CSとすればよい。
入力された左チャネル差分信号と右チャネル差分信号それぞれを独立して符号化する場合には、ステレオ符号化部170は、左チャネル差分信号をbLビットで符号化し、右チャネル差分信号をbRビットで符号化する。すなわち、ステレオ符号化部170は、入力されたTサンプルの左チャネル差分信号yL(1), yL(2), ..., yL(T)からbLビットの左チャネル差分符号CLを得て、入力されたTサンプルの右チャネル差分信号yR(1), yR(2), ..., yR(T)からbRビットの右チャネル差分符号CRを得て、左チャネル差分符号CLと右チャネル差分符号CRを合わせたものをステレオ符号CSとして出力する。ここで、bLビットとbRビットの合計がbSビットである。
入力された左チャネル差分信号と右チャネル差分信号を1つの符号化方式の中で合わせて符号化する場合には、ステレオ符号化部170は、左チャネル差分信号と右チャネル差分信号を合計bSビットで符号化する。すなわち、ステレオ符号化部170は、入力されたTサンプルの左チャネル差分信号yL(1), yL(2), ..., yL(T)と、入力されたTサンプルの右チャネル差分信号yR(1), yR(2), ..., yR(T)と、からbSビットのステレオ符号CSを得て出力する。
≪復号装置200≫
第1参考形態の復号装置200は、図3に示す通り、モノラル復号部210とステレオ復号部220と左チャネル減算利得復号部230と左チャネル信号加算部240と右チャネル減算利得復号部250と右チャネル信号加算部260とを含む。復号装置200は、対応する符号化装置100と同じ時間長のフレーム単位で、入力されたモノラル符号CMと左チャネル減算利得符号Cαと右チャネル減算利得符号Cβとステレオ符号CSを復号して、フレーム単位の2チャネルステレオの時間領域の復号音信号(後述する左チャネル復号音信号と右チャネル復号音信号)を得て出力する。復号装置200は、図3に破線で示すように、モノラルの時間領域の復号音信号(後述するモノラル復号音信号)も出力してもよい。復号装置200が出力した復号音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。復号装置200は、各フレームについて、図4に例示するステップS210からステップS260の処理を行う。
[モノラル復号部210]
モノラル復号部210には、復号装置200に入力されたモノラル符号CMが入力される。モノラル復号部210は、入力されたモノラル符号CMを所定の復号方式で復号してモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)を得て出力する(ステップS210)。所定の復号方式としては、対応する符号化装置100のモノラル符号化部160で用いた符号化方式に対応する復号方式を用いる。モノラル符号CMのビット数はbMである。
[ステレオ復号部220]
ステレオ復号部220には、復号装置200に入力されたステレオ符号CSが入力される。ステレオ復号部220は、入力されたステレオ符号CSを所定の復号方式で復号して、左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)と、右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)と、を得て出力する(ステップS220)。所定の復号方式としては、対応する符号化装置100のステレオ符号化部170で用いた符号化方式に対応する復号方式を用いる。ステレオ符号CSの合計ビット数はbSである。
[左チャネル減算利得復号部230]
左チャネル減算利得復号部230には、復号装置200に入力された左チャネル減算利得符号Cαが入力される。左チャネル減算利得復号部230は、左チャネル減算利得符号Cαを復号して左チャネル減算利得αを得て出力する(ステップS230)。左チャネル減算利得復号部230は、対応する符号化装置100の左チャネル減算利得推定部120で用いた方法に対応する復号方法で左チャネル減算利得符号Cαを復号して、左チャネル減算利得αを得る。対応する符号化装置100の左チャネル減算利得推定部120が量子化誤差を最小化する原理に基づく方法で左チャネル減算利得αと左チャネル減算利得符号Cαを得た場合の、左チャネル減算利得復号部230が左チャネル減算利得符号Cαを復号して左チャネル減算利得αを得る方法については後述する。
[左チャネル信号加算部240]
左チャネル信号加算部240には、モノラル復号部210が出力したモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)と、ステレオ復号部220が出力した左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)と、左チャネル減算利得復号部230が出力した左チャネル減算利得αと、が入力される。左チャネル信号加算部240は、対応するサンプルtごとに、左チャネル復号差分信号のサンプル値^yL(t)と、モノラル復号音信号のサンプル値^xM(t)と左チャネル減算利得αとを乗算した値α×^xM(t)と、を加算した値^yL(t)+α×^xM(t)による系列を左チャネル復号音信号^xL(1), ^xL(2), ..., ^xL(T)として得て出力する(ステップS240)。すなわち、^xL(t)=^yL(t)+α×^xM(t)である。
[右チャネル減算利得復号部250]
右チャネル減算利得復号部250には、復号装置200に入力された右チャネル減算利得符号Cβが入力される。右チャネル減算利得復号部250は、右チャネル減算利得符号Cβを復号して右チャネル減算利得βを得て出力する(ステップS250)。右チャネル減算利得復号部250は、対応する符号化装置100の右チャネル減算利得推定部140で用いた方法に対応する復号方法で右チャネル減算利得符号Cβを復号して、右チャネル減算利得βを得る。対応する符号化装置100の右チャネル減算利得推定部140が量子化誤差を最小化する原理に基づく方法で右チャネル減算利得βと右チャネル減算利得符号Cβを得た場合の、右チャネル減算利得復号部250が右チャネル減算利得符号Cβを復号して右チャネル減算利得βを得る方法については後述する。
[右チャネル信号加算部260]
右チャネル信号加算部260には、モノラル復号部210が出力したモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)と、ステレオ復号部220が出力した右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)と、右チャネル減算利得復号部250が出力した右チャネル減算利得βと、が入力される。右チャネル信号加算部260は、対応するサンプルtごとに、右チャネル復号差分信号のサンプル値^yR(t)と、モノラル復号音信号のサンプル値^xM(t)と右チャネル減算利得βとを乗算した値β×^xM(t)と、を加算した値^yR(t)+β×^xM(t)による系列を右チャネル復号音信号^xR(1), ^xR(2), ..., ^xR(T)として得て出力する(ステップS260)。すなわち、^xR(t)=^yR(t)+β×^xM(t)である。
〔量子化誤差を最小化する原理〕
以下、量子化誤差を最小化する原理について説明する。ステレオ符号化部170において入力された左チャネル差分信号と右チャネル差分信号を1つの符号化方式の中で合わせて符号化する場合には、左チャネル差分信号の符号化に用いるビット数bLと右チャネル差分信号の符号化に用いるビット数bRは陽に定まっていないこともあり得るが、以下では、左チャネル差分信号の符号化に用いるビット数がbLであり、右チャネル差分信号の符号化に用いるビット数がbRであるとして説明する。また、以下では主に左チャネルについて説明するが、右チャネルについても同様である。
上述した符号化装置100は、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)の各サンプル値から、ダウンミックス信号xM(1), xM(2), ..., xM(T)の各サンプル値に左チャネル減算利得αを乗算して得た値を減算して得た値からなる左チャネル差分信号yL(1), yL(2), ..., yL(T)をbLビットで符号化して、ダウンミックス信号xM(1), xM(2), ..., xM(T)をbMビットで符号化する。また、上述した復号装置200は、bLビットの符号から左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)(以下では、「量子化済み左チャネル差分信号」ともいう)を復号し、bMビットの符号からモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)(以下では、「量子化済みダウンミックス信号」ともいう)を復号した後、復号により得た量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)の各サンプル値に左チャネル減算利得αを乗算して得た値を復号により得た量子化済み左チャネル差分信号^yL(1), ^yL(2), ..., ^yL(T)の各サンプル値に加算することで左チャネルの復号音信号である左チャネル復号音信号^xL(1), ^xL(2), ..., ^xL(T)を得る。符号化装置100及び復号装置200は、上記の処理で得られる左チャネルの復号音信号が有する量子化誤差のエネルギーが小さくなるように設計されるべきである。
入力信号を符号化・復号して得られる復号信号が有する量子化誤差(以下、便宜的に「符号化により生じる量子化誤差」という)のエネルギーは、多くの場合、入力信号のエネルギーにおおよそ比例し、符号化に用いるサンプルごとのビット数の値に対して指数的に小さくなる傾向にある。したがって、左チャネル差分信号の符号化により生じる量子化誤差のサンプルあたりの平均エネルギーは正の数σL 2を用いて下記の式(1-0-1)のように推定でき、ダウンミックス信号の符号化により生じる量子化誤差のサンプルあたりの平均エネルギーは正の数σM 2を用いて下記の式(1-0-2)のように推定できる。
Figure 2024023484000002

Figure 2024023484000003
ここで仮に、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせるほど各サンプル値が近い値となっているとする。例えば、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と右チャネルの入力信号xR(1), xR(2), ..., xR(T)が、背景雑音や反響が多くない環境下で、2個のマイクロホンから等距離にある音源が発した音を収音して得たものであるケースなどが、この条件に相当する。この条件の下では左チャネル差分信号yL(1), yL(2), ..., yL(T)の各サンプル値は、ダウンミックス信号xM(1), xM(2), ..., xM(T)の各サンプル値に(1-α)を乗算して得た値と等価となる。したがって、左チャネル差分信号のエネルギーはダウンミックス信号のエネルギーの(1-α)2倍で表せることから、上記のσL 2は上記のσM 2を用いて(1-α)2×σM 2と置き換えることができるため、左チャネル差分信号の符号化により生じる量子化誤差のサンプルあたりの平均エネルギーは下記の式(1-1)のように推定できる。
Figure 2024023484000004

また、復号装置において量子化済み左チャネル差分信号に加算する信号が有する量子化誤差のサンプルあたりの平均エネルギー、すなわち、復号により得た量子化済みダウンミックス信号の各サンプル値と左チャネル減算利得αとを乗算して得た値の系列が有する量子化誤差のサンプルあたりの平均エネルギーは、下記の式(1-2)のように推定できる。
Figure 2024023484000005
左チャネル差分信号の符号化により生じる量子化誤差と、復号により得た量子化済みダウンミックス信号の各サンプル値に左チャネル減算利得αで乗算して得た値の系列が有する量子化誤差と、が互いに相関を持たないと仮定すると、左チャネルの復号音信号が有する量子化誤差のサンプルあたりの平均エネルギーは、式(1-1)と式(1-2)の和で推定される。左チャネルの復号音信号が有する量子化誤差のエネルギーを最小化する左チャネル減算利得αは、下記の式(1-3)のように求められる。
Figure 2024023484000006
つまり、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせるほど各サンプル値が近い値となっている条件において左チャネルの復号音信号が有する量子化誤差を最小化するためには、左チャネル減算利得推定部120は左チャネル減算利得αを式(1-3)で求めればよい。式(1-3)で得られる左チャネル減算利得αは、0より大きく1未満の値であり、2つの符号化に用いるビット数であるbLとbMが等しいときには0.5であり、左チャネル差分信号を符号化するためのビット数bLがダウンミックス信号を符号化するためのビット数bMよりも多いほど0.5より0に近い値であり、ダウンミックス信号を符号化するためのビット数bMが左チャネル差分信号を符号化するためのビット数bLよりも多いほど0.5より1に近い値である。
右チャネルについても同様であり、右チャネルの入力音信号xR(1), xR(2), ..., xR(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせるほど各サンプル値が近い値となっている条件において右チャネルの復号音信号が有する量子化誤差を最小化するためには、右チャネル減算利得推定部140は右チャネル減算利得βを下記の式(1-3-2)で求めればよい。
Figure 2024023484000007

式(1-3-2)で得られる右チャネル減算利得βは、0より大きく1未満の値であり、2つの符号化に用いるビット数であるbRとbMが等しいときには0.5であり、右チャネル差分信号を符号化するためのビット数bRがダウンミックス信号を符号化するためのビット数bMよりも多いほど0.5より0に近い値であり、ダウンミックス信号を符号化するためのビット数bMが右チャネル差分信号を符号化するためのビット数bRよりも多いほど0.5より1に近い値である。
次に、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせない場合も含む、左チャネルの復号音信号が有する量子化誤差のエネルギーを最小化する原理について説明する。
左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)の正規化された内積値rLは、下記の式(1-4)で表される。
Figure 2024023484000008

式(1-4)によって得られる正規化された内積値rLは、実数値であって、ダウンミックス信号xM(1), xM(2), ..., xM(T)の各サンプル値に実数値rL'を乗算してサンプル値の系列rL'×xM(1), rL'×xM(2), ..., rL'×xM(T)を得たときに、得られたサンプル値の系列と左チャネルの入力音信号の各サンプル値との差分により得られる系列xL(1)-rL'×xM(1), xL(2)-rL'×xM(2), ..., xL(T)-rL'×xM(T)のエネルギーが最小となる実数値rL'と同じ値である。
左チャネルの入力音信号xL(1), xL(2), ..., xL(T)は、各サンプル番号tについて、xL(t)=rL×xM(t)+(xL(t)- rL×xM(t))と分解できる。ここで、xL(t)- rL×xM(t)の各値によって構成される系列を直交信号xL’(1), xL’(2), ..., xL’(T)とすると、当該分解によれば、左チャネル差分信号の各サンプル値yL(t)=xL(t)-αxM(t)は、ダウンミックス信号xM(1), xM(2), ..., xM(T)の各サンプル値xM(t)に、正規化された内積値rL及び左チャネル減算利得αを用いた(rL-α)を乗算して得た値(rL-α)×xM(t)と、直交信号の各サンプル値xL’(t)との和(rL-α)×xM(t)+xL’(t)と等価となる。直交信号xL’(1), xL’(2), ..., xL’(T)はダウンミックス信号xM(1), xM(2), ..., xM(T)に対して直交性、つまり内積が0となる性質を示すため、左チャネル差分信号のエネルギーはダウンミックス信号のエネルギーを(rL-α)2倍したものと、直交信号のエネルギーとの和で表される。したがって、左チャネル差分信号をbLビットで符号化することにより生じる量子化誤差のサンプルあたりの平均エネルギーは正の数σ2を用いて下記の式(1-5)のように推定できる。
Figure 2024023484000009
左チャネル差分信号の符号化により生じる量子化誤差と、復号により得られた量子化済みダウンミックス信号の各サンプル値に左チャネル減算利得αを乗算して得た値の系列が有する量子化誤差と、が互いに相関を持たないと仮定すると、左チャネルの復号音信号が有する量子化誤差のサンプルあたりの平均エネルギーは、式(1-5)と式(1-2)の和で推定される。左チャネルの復号音信号が有する量子化誤差のエネルギーを最小化する左チャネル減算利得αは、下記の式(1-6)のように求められる。
Figure 2024023484000010
つまり、左チャネルの復号音信号が有する量子化誤差を最小化するためには、左チャネル減算利得推定部120は左チャネル減算利得αを式(1-6)で求めればよい。すなわち、この量子化誤差のエネルギーを最小化する原理を考慮すると、左チャネル減算利得αには、正規化された内積値rLと、符号化に用いるビット数であるbLとbMによって決まる値である補正係数と、を乗算したものを使用するべきである。当該補正係数は、0より大きく1未満の値であり、左チャネル差分信号を符号化するためのビット数bLとダウンミックス信号を符号化するためのビット数bMが同じであるときには0.5であり、左チャネル差分信号を符号化するためのビット数bLがダウンミックス信号を符号化するためのビット数bMよりも多いほど0.5より0に近く、左チャネル差分信号を符号化するためのビット数bLがダウンミックス信号を符号化するためのビット数bMよりも少ないほど0.5より1に近い値である。
右チャネルについても同様であり、右チャネルの復号音信号が有する量子化誤差を最小化するためには、右チャネル減算利得推定部140は右チャネル減算利得βを下記の式(1-6-2)で求めればよい。
Figure 2024023484000011

ここで、rRは、右チャネルの入力音信号xR(1), xR(2), ..., xR(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)の正規化された内積値であり、下記の式(1-4-2)で表される。
Figure 2024023484000012

すなわち、この量子化誤差のエネルギーを最小化する原理を考慮すると、右チャネル減算利得βには、正規化された内積値rRと、符号化に用いるビット数であるbRとbMによって決まる値である補正係数と、を乗算したものを使用するべきである。当該補正係数は、0より大きく1未満の値であり、右チャネル差分信号を符号化するためのビット数bRがダウンミックス信号を符号化するためのビット数bMよりも多いほど0.5よりも0に近く、右チャネル差分信号を符号化するためのビット数がダウンミックス信号を符号化するためのビット数よりも少ないほど0.5よりも1に近い値である。
〔量子化誤差を最小化する原理に基づく減算利得の推定と復号〕
上述した量子化誤差を最小化する原理に基づく減算利得の推定と復号の具体例を説明する。各例では、符号化装置100において減算利得の推定を行う左チャネル減算利得推定部120と右チャネル減算利得推定部140、復号装置200において減算利得の復号を行う左チャネル減算利得復号部230と右チャネル減算利得復号部250、について説明する。
〔〔例1〕〕
例1は、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせない場合も含む、左チャネルの復号音信号が有する量子化誤差のエネルギーを最小化する原理と、右チャネルの入力音信号xR(1), xR(2), ..., xR(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)が同一の系列とみなせない場合も含む、右チャネルの復号音信号が有する量子化誤差のエネルギーを最小化する原理と、に基づくものである。
〔〔〔左チャネル減算利得推定部120〕〕〕
左チャネル減算利得推定部120には、左チャネル減算利得の候補αcand(a)と当該候補に対応する符号Cαcand(a)との組が複数組(A組、a=1, ..., A)予め記憶されている。左チャネル減算利得推定部120は、図5に示す以下のステップS120-11からステップS120-14を行う。
左チャネル減算利得推定部120は、まず、入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)から、式(1-4)によりダウンミックス信号の左チャネルの入力音信号に対する正規化された内積値rLを得る(ステップS120-11)。また、左チャネル減算利得推定部120は、ステレオ符号化部170において左チャネル差分信号yL(1), yL(2), ..., yL(T)の符号化に用いるビット数bLと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて下記の式(1-7)により左チャネル補正係数cLを得る(ステップS120-12)。
Figure 2024023484000013

左チャネル減算利得推定部120は、次に、ステップS120-11で得た正規化された内積値rLとステップS120-12で得た左チャネル補正係数cLとを乗算した値を得る(ステップS120-13)。左チャネル減算利得推定部120は、次に、記憶されている左チャネル減算利得の候補αcand(1), ..., αcand(A)のうちのステップS120-13で得た乗算値cL×rLに最も近い候補(乗算値cL×rLの量子化値)を左チャネル減算利得αとして得て、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの左チャネル減算利得αに対応する符号を左チャネル減算利得符号Cαとして得る(ステップS120-14)。
なお、ステレオ符号化部170において左チャネル差分信号yL(1), yL(2), ..., yL(T)の符号化に用いるビット数bLが陽に定まっていない場合には、ステレオ符号化部170が出力するステレオ符号CSのビット数bsの2分の1(すなわち、bs/2)をビット数bLとして用いればよい。また、左チャネル補正係数cLは、式(1-7)そのもので得られる値ではなく、0より大きく1未満の値であり、左チャネル差分信号yL(1), yL(2), ..., yL(T)の符号化に用いるビット数bLとダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMが同じであるときには0.5であり、ビット数bLがビット数bMよりも多いほど0.5より0に近く、ビット数bLがビット数bMよりも少ないほど0.5より1に近い値としてもよい。これらは、後述する各例でも同様である。
〔〔〔右チャネル減算利得推定部140〕〕〕
右チャネル減算利得推定部140には、右チャネル減算利得の候補βcand(b)と当該候補に対応する符号Cβcand(b)との組が複数組(B組、b=1, ..., B)予め記憶されている。右チャネル減算利得推定部140は、図5に示す以下のステップS140-11からステップS140-14を行う。
右チャネル減算利得推定部140は、まず、入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)から、式(1-4-2)によりダウンミックス信号の右チャネルの入力音信号に対する正規化された内積値rRを得る(ステップS140-11)。また、右チャネル減算利得推定部140は、ステレオ符号化部170において右チャネル差分信号yR(1), yR(2), ..., yR(T)の符号化に用いるビット数bRと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて下記の式(1-7-2)により右チャネル補正係数cRを得る(ステップS140-12)。
Figure 2024023484000014

右チャネル減算利得推定部140は、次に、ステップS140-11で得た正規化された内積値rRとステップS140-12で得た右チャネル補正係数cRとを乗算した値を得る(ステップS140-13)。右チャネル減算利得推定部140は、次に、記憶されている右チャネル減算利得の候補βcand(1), ..., βcand(B)のうちのステップS140-13で得た乗算値cR×rRに最も近い候補(乗算値cR×rRの量子化値)を右チャネル減算利得βとして得て、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの右チャネル減算利得βに対応する符号を右チャネル減算利得符号Cβとして得る(ステップS140-14)。
なお、ステレオ符号化部170において右チャネル差分信号yR(1), yR(2), ..., yR(T)の符号化に用いるビット数bRが陽に定まっていない場合には、ステレオ符号化部170が出力するステレオ符号CSのビット数bsの2分の1(すなわち、bs/2)をビット数bRとして用いればよい。また、右チャネル補正係数cRは、式(1-7-2)そのもので得られる値ではなく、0より大きく1未満の値であり、右チャネル差分信号yR(1), yR(2), ..., yR(T)の符号化に用いるビット数bRとダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMが同じであるときには0.5であり、ビット数bRがビット数bMよりも多いほど0.5より0に近く、ビット数bRがビット数bMよりも少ないほど0.5より1に近い値としてもよい。これらは、後述する各例でも同様である。
〔〔〔左チャネル減算利得復号部230〕〕〕
左チャネル減算利得復号部230には、対応する符号化装置100の左チャネル減算利得推定部120に記憶されているものと同じ、左チャネル減算利得の候補αcand(a)と当該候補に対応する符号Cαcand(a)との組が複数組(A組、a=1, ..., A)予め記憶されている。左チャネル減算利得復号部230は、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの入力された左チャネル減算利得符号Cαに対応する左チャネル減算利得の候補を左チャネル減算利得αとして得る(ステップS230-11)。
〔〔〔右チャネル減算利得復号部250〕〕〕
右チャネル減算利得復号部250には、対応する符号化装置100の右チャネル減算利得推定部140に記憶されているものと同じ、右チャネル減算利得の候補βcand(b)と当該候補に対応する符号Cβcand(b)との組が複数組(B組、b=1, ..., B)予め記憶されている。右チャネル減算利得復号部250は、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの入力された右チャネル減算利得符号Cβに対応する右チャネル減算利得の候補を右チャネル減算利得βとして得る(ステップS250-11)。
なお、左チャネルと右チャネルでは同じ減算利得の候補や符号を用いればよく、上述したAとBを同じ値として、左チャネル減算利得推定部120と左チャネル減算利得復号部230に記憶されている左チャネル減算利得の候補αcand(a)と当該候補に対応する符号Cαcand(a)との組と、右チャネル減算利得推定部140と右チャネル減算利得復号部250に記憶されている右チャネル減算利得の候補βcand(b)と当該候補に対応する符号Cβcand(b)との組と、を同じにしてもよい。
〔〔例1の変形例〕〕
符号化装置100で左チャネル差分信号の符号化に用いるビット数bLは復号装置200で左チャネル差分信号の復号に用いるビット数であり、符号化装置100でダウンミックス信号の符号化に用いるビット数bMの値は復号装置200でダウンミックス信号の復号に用いるビット数であるので、補正係数cLは符号化装置100でも復号装置200でも同じ値を計算することができる。したがって、正規化された内積値rLを符号化と復号の対象として、符号化装置100と復号装置200で正規化された内積値の量子化値^rLに補正係数cLを乗算して左チャネル減算利得αを得てもよい。右チャネルについても同様である。この形態を例1の変形例として説明する。
〔〔〔左チャネル減算利得推定部120〕〕〕
左チャネル減算利得推定部120には、左チャネルの正規化された内積値の候補rLcand(a)と当該候補に対応する符号Cαcand(a)との組が複数組(A組、a=1, ..., A)予め記憶されている。左チャネル減算利得推定部120は、図6に示す通り、例1でも説明したステップS120-11とステップS120-12と、下記のステップS120-15とステップS120-16と、を行う。
左チャネル減算利得推定部120は、まず、例1の左チャネル減算利得推定部120のステップS120-11と同様に、入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)から、式(1-4)によりダウンミックス信号の左チャネルの入力音信号に対する正規化された内積値rLを得る(ステップS120-11)。左チャネル減算利得推定部120は、次に、記憶されている左チャネルの正規化された内積値の候補rLcand(1), ..., rLcand(A)のうちのステップS120-11で得た正規化された内積値rLに最も近い候補(正規化された内積値rLの量子化値)^rLを得て、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの当該最も近い候補^rLに対応する符号を左チャネル減算利得符号Cαとして得る(ステップS120-15)。また、左チャネル減算利得推定部120は、例1の左チャネル減算利得推定部120のステップS120-12と同様に、ステレオ符号化部170において左チャネル差分信号yL(1), yL(2), ..., yL(T)の符号化に用いるビット数bLと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて式(1-7)により左チャネル補正係数cLを得る(ステップS120-12)。左チャネル減算利得推定部120は、次に、ステップS120-15で得た正規化された内積値の量子化値^rLとステップS120-12で得た左チャネル補正係数cLとを乗算した値を左チャネル減算利得αとして得る(ステップS120-16)。
〔〔〔右チャネル減算利得推定部140〕〕〕
右チャネル減算利得推定部140には、右チャネルの正規化された内積値の候補rRcand(b)と当該候補に対応する符号Cβcand(b)との組が複数組(B組、b=1, ..., B)予め記憶されている。右チャネル減算利得推定部140は、図6に示す通り、例1でも説明したステップS140-11とステップS140-12と、下記のステップS140-15とステップS140-16と、を行う。
右チャネル減算利得推定部140は、まず、例1の右チャネル減算利得推定部140のステップS140-11と同様に、入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)とダウンミックス信号xM(1), xM(2), ..., xM(T)から、式(1-4-2)によりダウンミックス信号の右チャネルの入力音信号に対する正規化された内積値rRを得る(ステップS140-11)。右チャネル減算利得推定部140は、次に、記憶されている右チャネルの正規化された内積値の候補rRcand(1), ..., rRcand(B)のうちのステップS140-11で得た正規化された内積値rRに最も近い候補(正規化された内積値rRの量子化値)^rRを得て、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの当該最も近い候補^rRに対応する符号を右チャネル減算利得符号Cβとして得る(ステップS140-15)。また、右チャネル減算利得推定部140は、例1の右チャネル減算利得推定部140のステップS140-12と同様に、ステレオ符号化部170において右チャネル差分信号yR(1), yR(2), ..., yR(T)の符号化に用いるビット数bRと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて式(1-7-2)により右チャネル補正係数cRを得る(ステップS140-12)。右チャネル減算利得推定部140は、次に、ステップS140-15で得た正規化された内積値の量子化値^rRとステップS140-12で得た右チャネル補正係数cRとを乗算した値を右チャネル減算利得βとして得る(ステップS140-16)。
〔〔〔左チャネル減算利得復号部230〕〕〕
左チャネル減算利得復号部230には、対応する符号化装置100の左チャネル減算利得推定部120に記憶されているものと同じ、左チャネルの正規化された内積値の候補rLcand(a)と当該候補に対応する符号Cαcand(a)との組が複数組(A組、a=1, ..., A)予め記憶されている。左チャネル減算利得復号部230は、図7に示す以下のステップS230-12からステップS230-14を行う。
左チャネル減算利得復号部230は、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの入力された左チャネル減算利得符号Cαに対応する左チャネルの正規化された内積値の候補を左チャネルの正規化された内積値の復号値^rLとして得る(ステップS230-12)。また、左チャネル減算利得復号部230は、ステレオ復号部220において左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)の復号に用いるビット数bLと、モノラル復号部210においてモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて式(1-7)により左チャネル補正係数cLを得る(ステップS230-13)。左チャネル減算利得復号部230は、次に、ステップS230-12で得た正規化された内積値の復号値^rLとステップS230-13で得た左チャネル補正係数cLとを乗算した値を左チャネル減算利得αとして得る(ステップS230-14)。
なお、ステレオ符号CSが左チャネル差分符号CLと右チャネル差分符号CRを合わせたものである場合には、ステレオ復号部220において左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)の復号に用いるビット数bLとは左チャネル差分符号CLのビット数である。ステレオ復号部220において左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)の復号に用いるビット数bLが陽に定まっていない場合には、ステレオ復号部220に入力されるステレオ符号CSのビット数bsの2分の1(すなわち、bs/2)をビット数bLとして用いればよい。モノラル復号部210においてモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMとは、モノラル符号CMのビット数である。左チャネル補正係数cLは、式(1-7)そのもので得られる値ではなく、0より大きく1未満の値であり、左チャネル復号差分信号^yL(1), ^yL(2), ..., ^yL(T)の復号に用いるビット数bLとモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMが同じであるときには0.5であり、ビット数bLがビット数bMよりも多いほど0.5より0に近く、ビット数bLがビット数bMよりも少ないほど0.5より1に近い値としてもよい。
〔〔〔右チャネル減算利得復号部250〕〕〕
右チャネル減算利得復号部250には、対応する符号化装置100の右チャネル減算利得推定部140に記憶されているものと同じ、右チャネルの正規化された内積値の候補rRcand(b)と当該候補に対応する符号Cβcand(b)との組が複数組(B組、b=1, ..., B)予め記憶されている。右チャネル減算利得復号部250は、図7に示す以下のステップS250-12からステップS250-14を行う。
右チャネル減算利得復号部250は、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの入力された右チャネル減算利得符号Cβに対応する右チャネルの正規化された内積値の候補を右チャネルの正規化された内積値の復号値^rRとして得る(ステップS250-12)。また、右チャネル減算利得復号部250は、ステレオ復号部220において右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)の復号に用いるビット数bRと、モノラル復号部210においてモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて式(1-7-2)により右チャネル補正係数cRを得る(ステップS250-13)。右チャネル減算利得復号部250は、次に、ステップS250-12で得た正規化された内積値の復号値^rRとステップS250-13で得た右チャネル補正係数cRとを乗算した値を右チャネル減算利得βとして得る(ステップS250-14)。
なお、ステレオ符号CSが左チャネル差分符号CLと右チャネル差分符号CRを合わせたものである場合には、ステレオ復号部220において右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)の復号に用いるビット数bRとは右チャネル差分符号CRのビット数である。ステレオ復号部220において右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)の復号に用いるビット数bRが陽に定まっていない場合には、ステレオ復号部220に入力されるステレオ符号CSのビット数bsの2分の1(すなわち、bs/2)をビット数bRとして用いればよい。モノラル復号部210においてモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMとは、モノラル符号CMのビット数である。右チャネル補正係数cRは、式(1-7-2)そのもので得られる値ではなく、0より大きく1未満の値であり、右チャネル復号差分信号^yR(1), ^yR(2), ..., ^yR(T)の復号に用いるビット数bRとモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)の復号に用いるビット数bMが同じであるときには0.5であり、ビット数bRがビット数bMよりも多いほど0.5より0に近く、ビット数bRがビット数bMよりも少ないほど0.5より1に近い値としてもよい。
なお、左チャネルと右チャネルでは同じ正規化された内積値の候補や符号を用いればよく、上述したAとBを同じ値として、左チャネル減算利得推定部120と左チャネル減算利得復号部230に記憶されている左チャネルの正規化された内積値の候補rLcand(a)と当該候補に対応する符号Cαcand(a)との組と、右チャネル減算利得推定部140と右チャネル減算利得復号部250に記憶されている右チャネルの正規化された内積値の候補rRcand(b)と当該候補に対応する符号Cβcand(b)との組と、を同じにしてもよい。
なお、符号Cαは、実質的には左チャネル減算利得αに対応する符号であること、符号化装置100と復号装置200の説明中で文言を整合させる目的、などから左チャネル減算利得符号と呼んでいるが、正規化された内積値を表すものであることからすると左チャネル内積符号などと呼んでもよいものである。符号Cβについても同様であり、右チャネル内積符号などと呼んでもよい。
〔〔例2〕〕
正規化された内積値として過去のフレームの入力の値も考慮した値を用いる例を例2として説明する。例2は、フレーム内での最適性、すなわち、左チャネルの復号音信号が有する量子化誤差のエネルギーの最小化と右チャネルの復号音信号が有する量子化誤差のエネルギーの最小化は厳密には保証されないが、左チャネル減算利得αのフレーム間の急激な変動と右チャネル減算利得βのフレーム間の急激な変動を少なくして、当該変動に由来して復号音信号に生じるノイズを低減するものである。すなわち、例2は、復号音信号が有する量子化誤差のエネルギーを小さくすることに加えて復号音信号の聴覚品質も考慮したものである。
例2は、符号化側、すなわち、左チャネル減算利得推定部120と右チャネル減算利得推定部140は例1と異なるが、復号側、すなわち、左チャネル減算利得復号部230と右チャネル減算利得復号部250は例1と同じである。以下、例2が例1と異なる点を中心に説明する。
〔〔〔左チャネル減算利得推定部120〕〕〕
左チャネル減算利得推定部120は、図8に示す通り、下記のステップS120-111からステップS120-113と、例1で説明したステップS120-12からステップS120-14と、を行う。
左チャネル減算利得推定部120は、まず、入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いた内積値EL(-1)と、を用いて、下記の式(1-8)により、現在のフレームで用いる内積値EL(0)を得る(ステップS120-111)。
Figure 2024023484000015

ここで、εLは、0より大きく1未満の予め定めた値であり、左チャネル減算利得推定部120に予め記憶されている。なお、左チャネル減算利得推定部120は、得た内積値EL(0)を、「前のフレームで用いた内積値EL(-1)」として次のフレームで用いるために、左チャネル減算利得推定部120内に記憶する。
左チャネル減算利得推定部120は、また、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いたダウンミックス信号のエネルギーEM(-1)と、を用いて、下記の式(1-9)により、現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を得る(ステップS120-112)。
Figure 2024023484000016

ここで、εMは、0より大きく1未満で予め定めた値であり、左チャネル減算利得推定部120に予め記憶されている。なお、左チャネル減算利得推定部120は、得たダウンミックス信号のエネルギーEM(0)を、「前のフレームで用いたダウンミックス信号のエネルギーEM(-1)」として次のフレームで用いるために、左チャネル減算利得推定部120内に記憶する。
左チャネル減算利得推定部120は、次に、ステップS120-111で得た現在のフレームで用いる内積値EL(0)と、ステップS120-112で得た現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を用いて、正規化された内積値rLを下記の式(1-10)で得る(ステップS120-113)。
Figure 2024023484000017
左チャネル減算利得推定部120は、また、ステップS120-12を行い、次に、ステップS120-11で得た正規化された内積値rLに代えて上述したステップS120-113で得た正規化された内積値rLを用いてステップS120-13を行い、さらに、ステップS120-14を行う。
なお、上記のεL及びεMは、1に近いほど正規化された内積値rLには過去のフレームの左チャネルの入力音信号とダウンミックス信号の影響が含まれやすくなり、正規化された内積値rLや、正規化された内積値rLにより得られる左チャネル減算利得αのフレーム間の変動は小さくなる。
〔〔〔右チャネル減算利得推定部140〕〕〕
右チャネル減算利得推定部140は、図8に示す通り、以下のステップS140-111からステップS140-113と、例1で説明したステップS140-12からステップS140-14と、を行う。
右チャネル減算利得推定部140は、まず、入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)と、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いた内積値ER(-1)と、を用いて、下記の式(1-8-2)により、現在のフレームで用いる内積値ER(0)を得る(ステップS140-111)。
Figure 2024023484000018

ここで、εRは、0より大きく1未満の予め定めた値であり、右チャネル減算利得推定部140に予め記憶されている。なお、右チャネル減算利得推定部140は、得た内積値ER(0)を、「前のフレームで用いた内積値ER(-1)」として次のフレームで用いるために、右チャネル減算利得推定部140内に記憶する。
右チャネル減算利得推定部140は、また、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いたダウンミックス信号のエネルギーEM(-1)と、を用いて、式(1-9)により、現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を得る(ステップS140-112)。右チャネル減算利得推定部140は、得たダウンミックス信号のエネルギーEM(0)を、「前のフレームで用いたダウンミックス信号のエネルギーEM(-1)」として次のフレームで用いるために、右チャネル減算利得推定部140内に記憶する。なお、左チャネル減算利得推定部120でも式(1-9)により現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を得るので、左チャネル減算利得推定部120が行うステップS120-112と右チャネル減算利得推定部140が行うステップS140-112は何れか一方のみを行うようにしてもよい。
右チャネル減算利得推定部140は、次に、ステップS140-111で得た現在のフレームで用いる内積値ER(0)と、ステップS140-112で得た現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を用いて、正規化された内積値rRを下記の式(1-10-2)で得る(ステップS140-113)。
Figure 2024023484000019
右チャネル減算利得推定部140は、また、ステップS140-12を行い、次に、ステップS140-11で得た正規化された内積値rRに代えて上述したステップS140-113で得た正規化された内積値rRを用いてステップS140-13を行い、さらに、ステップS140-14を行う。
なお、上記のεR及びεMは、1に近いほど正規化された内積値rRには過去のフレームの右チャネルの入力音信号とダウンミックス信号の影響が含まれやすくなり、正規化された内積値rRや、正規化された内積値rRにより得られる右チャネル減算利得βのフレーム間の変動は小さくなる。
〔〔例2の変形例〕〕
例2についても、例1に対する例1の変形例と同様の変形ができる。この形態を例2の変形例として説明する。例2の変形例は、符号化側、すなわち、左チャネル減算利得推定部120と右チャネル減算利得推定部140は例1の変形例と異なるが、復号側、すなわち、左チャネル減算利得復号部230と右チャネル減算利得復号部250は例1の変形例と同じである。例2の変形例の例1の変形例と異なる点は例2と同様であるので、以下では、例2の変形例について、例1の変形例と例2を適宜参照して説明する。
〔〔〔左チャネル減算利得推定部120〕〕〕
左チャネル減算利得推定部120には、例1の変形例の左チャネル減算利得推定部120と同様に、左チャネルの正規化された内積値の候補rLcand(a)と当該候補に対応する符号Cαcand(a)との組が複数組(A組、a=1, ..., A)予め記憶されている。左チャネル減算利得推定部120は、図9に示す通り、例2と同じステップS120-111からステップS120-113と、例1の変形例と同じステップS120-12とステップS120-15とステップS120-16と、を行う。具体的には以下の通りである。
左チャネル減算利得推定部120は、まず、入力された左チャネルの入力音信号xL(1), xL(2), ..., xL(T)と、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いた内積値EL(-1)と、を用いて、式(1-8)により、現在のフレームで用いる内積値EL(0)を得る(ステップS120-111)。左チャネル減算利得推定部120は、また、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いたダウンミックス信号のエネルギーEM(-1)と、を用いて、式(1-9)により、現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を得る(ステップS120-112)。左チャネル減算利得推定部120は、次に、ステップS120-111で得た現在のフレームで用いる内積値EL(0)と、ステップS120-112で得た現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を用いて、式(1-10)により、正規化された内積値rLを得る(ステップS120-113)。左チャネル減算利得推定部120は、次に、記憶されている左チャネルの正規化された内積値の候補rLcand(1), ..., rLcand(A)のうちのステップS120-113で得た正規化された内積値rLに最も近い候補(正規化された内積値rLの量子化値)^rLを得て、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの当該最も近い候補^rLに対応する符号を左チャネル減算利得符号Cαとして得る(ステップS120-15)。また、左チャネル減算利得推定部120は、ステレオ符号化部170において左チャネル差分信号yL(1), yL(2), ..., yL(T)の符号化に用いるビット数bLと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて、式(1-7)により、左チャネル補正係数cLを得る(ステップS120-12)。左チャネル減算利得推定部120は、次に、ステップS120-15で得た正規化された内積値の量子化値^rLとステップS120-12で得た左チャネル補正係数cLとを乗算した値を左チャネル減算利得αとして得る(ステップS120-16)。
〔〔〔右チャネル減算利得推定部140〕〕〕
右チャネル減算利得推定部140には、例1の変形例の右チャネル減算利得推定部140と同様に、右チャネルの正規化された内積値の候補rRcand(b)と当該候補に対応する符号Cβcand(b)との組が複数組(B組、b=1, ..., B)予め記憶されている。右チャネル減算利得推定部140は、図9に示す通り、例2と同じステップS140-111からステップS140-113と、例1の変形例と同じステップS140-12とステップS140-15とステップS140-16と、を行う。具体的には以下の通りである。
右チャネル減算利得推定部140は、まず、入力された右チャネルの入力音信号xR(1), xR(2), ..., xR(T)と、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いた内積値ER(-1)と、を用いて、式(1-8-2)により、現在のフレームで用いる内積値ER(0)を得る(ステップS140-111)。右チャネル減算利得推定部140は、また、入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)と、前のフレームで用いたダウンミックス信号のエネルギーEM(-1)と、を用いて、式(1-9)により、現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を得る(ステップS140-112)。右チャネル減算利得推定部140は、次に、ステップS140-111で得た現在のフレームで用いる内積値ER(0)と、ステップS140-112で得た現在のフレームで用いるダウンミックス信号のエネルギーEM(0)を用いて、式(1-10-2)により、正規化された内積値rRを得る(ステップS140-113)。右チャネル減算利得推定部140は、次に、記憶されている右チャネルの正規化された内積値の候補rRcand(1), ..., rRcand(B)のうちのステップS140-113で得た正規化された内積値rRに最も近い候補(正規化された内積値rRの量子化値)^rRを得て、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの当該最も近い候補^rRに対応する符号を右チャネル減算利得符号Cβとして得る(ステップS140-15)。また、右チャネル減算利得推定部140は、ステレオ符号化部170において右チャネル差分信号yR(1), yR(2), ..., yR(T)の符号化に用いるビット数bRと、モノラル符号化部160においてダウンミックス信号xM(1), xM(2), ..., xM(T)の符号化に用いるビット数bMと、フレーム当たりのサンプル数Tと、を用いて、式(1-7-2)により右チャネル補正係数cRを得る(ステップS140-12)。右チャネル減算利得推定部140は、次に、ステップS140-15で得た正規化された内積値の量子化値^rRとステップS140-12で得た右チャネル補正係数cRとを乗算した値を右チャネル減算利得βとして得る(ステップS140-16)。
〔〔例3〕〕
例えば、左チャネルの入力音信号に含まれている音声や音楽などの音と、右チャネルの入力音信号に含まれている音声や音楽などの音と、が異なる場合には、ダウンミックス信号には左チャネルの入力音信号の成分も右チャネルの入力音信号の成分も含まれ得るため、左チャネル減算利得αとして大きな値を用いるほど、左チャネル復号音信号の中に本来聴こえるはずのない右チャネルの入力音信号に由来する音が含まれているように聞こえてしまい、右チャネル減算利得βとして大きな値を用いるほど、右チャネル復号音信号の中に本来聴こえるはずのない左チャネルの入力音信号に由来する音が含まれているように聞こえてしまうという課題がある。そこで、復号音信号が有する量子化誤差のエネルギーの最小化は厳密には保証されないものの、聴覚品質を考慮して、左チャネル減算利得αと右チャネル減算利得βを例1により求まる値より小さい値としてもよい。また同様に、左チャネル減算利得αと右チャネル減算利得βを例2により求まる値より小さい値としてもよい。
具体的には、左チャネルについては、例1および例2において、正規化された内積値rLと左チャネル補正係数cLの乗算値cL×rLの量子化値を左チャネル減算利得αとしていたのを、例3では、正規化された内積値rLと左チャネル補正係数cLと0より大きく1より小さい予め定めた値であるλLの乗算値λL×cL×rLの量子化値を左チャネル減算利得αとする。従って、例1や例2と同様に乗算値cL×rLを左チャネル減算利得推定部120での符号化と左チャネル減算利得復号部230での復号の対象として左チャネル減算利得符号Cαが乗算値cL×rLの量子化値を表すようにして、左チャネル減算利得推定部120と左チャネル減算利得復号部230が乗算値cL×rLの量子化値とλLを乗算して左チャネル減算利得αを得るようにしてもよい。または、正規化された内積値rLと左チャネル補正係数cLと予め定めた値λLの乗算値λL×cL×rLを左チャネル減算利得推定部120での符号化と左チャネル減算利得復号部230での復号の対象として、左チャネル減算利得符号Cαが乗算値λL×cL×rLの量子化値を表すようにしてもよい。
同様に、右チャネルについては、例1および例2において、正規化された内積値rRと右チャネル補正係数cRの乗算値cR×rRの量子化値を右チャネル減算利得βとしていたのを、例3では、正規化された内積値rRと右チャネル補正係数cRと0より大きく1より小さい予め定めた値であるλRの乗算値λR×cR×rRの量子化値を右チャネル減算利得βとする。従って、例1や例2と同様に乗算値cR×rRを右チャネル減算利得推定部140での符号化と右チャネル減算利得復号部250での復号の対象として右チャネル減算利得符号Cβが乗算値cR×rRの量子化値を表すようにして、右チャネル減算利得推定部140と右チャネル減算利得復号部250が乗算値cR×rRの量子化値とλRとを乗算して右チャネル減算利得βを得るようにしてもよい。または、正規化された内積値rRと左チャネル補正係数cRと予め定めた値λRの乗算値λR×cR×rRを右チャネル減算利得推定部140での符号化と右チャネル減算利得復号部250での復号の対象として、右チャネル減算利得符号Cβが乗算値λR×cR×rRの量子化値を表すようにしてもよい。なお、λRはλLと同じ値とするとよい。
〔〔例3の変形例〕〕
上述したように補正係数cLは符号化装置100でも復号装置200でも同じ値を計算することができる。従って、例1の変形例や例2の変形例と同様に正規化された内積値rLを左チャネル減算利得推定部120での符号化と左チャネル減算利得復号部230での復号の対象として左チャネル減算利得符号Cαが正規化された内積値rLの量子化値を表すようにして、左チャネル減算利得推定部120と左チャネル減算利得復号部230が正規化された内積値rLの量子化値と左チャネル補正係数cLと0より大きく1より小さい予め定めた値であるλLを乗算して左チャネル減算利得αを得るようにしてもよい。または、正規化された内積値rLと0より大きく1より小さい予め定めた値であるλLの乗算値λL×rLを左チャネル減算利得推定部120での符号化と左チャネル減算利得復号部230での復号の対象として、左チャネル減算利得符号Cαが乗算値λL×rLの量子化値を表すようにして、左チャネル減算利得推定部120と左チャネル減算利得復号部230が乗算値λL×rLの量子化値と左チャネル補正係数cLを乗算して左チャネル減算利得αを得るようにしてもよい。
右チャネルについても同様であり、補正係数cRは符号化装置100でも復号装置200でも同じ値を計算することができる。従って、例1の変形例や例2の変形例と同様に正規化された内積値rRを右チャネル減算利得推定部140での符号化と右チャネル減算利得復号部250での復号の対象として右チャネル減算利得符号Cβが正規化された内積値rRの量子化値を表すようにして、右チャネル減算利得推定部140と右チャネル減算利得復号部250が正規化された内積値rRの量子化値と右チャネル補正係数cRと0より大きく1より小さい予め定めた値であるλRを乗算して右チャネル減算利得βを得るようにしてもよい。または、正規化された内積値rRと0より大きく1より小さい予め定めた値であるλRの乗算値λR×rRを右チャネル減算利得推定部140での符号化と右チャネル減算利得復号部250での復号の対象として、右チャネル減算利得符号Cβが乗算値λR×rRの量子化値を表すようにして、右チャネル減算利得推定部140と右チャネル減算利得復号部250が乗算値λR×rRの量子化値と右チャネル補正係数cRを乗算して右チャネル減算利得βを得るようにしてもよい。
〔〔例4〕〕
例3の冒頭で説明した聴覚品質の課題が生じるのは左チャネルの入力音信号と右チャネルの入力音信号の相関が小さいときであって、この課題は左チャネルの入力音信号と右チャネルの入力音信号の相関が大きいときにはあまり生じない。そこで、例4では、例3の予め定めた値に代えて、左チャネルの入力音信号と右チャネルの入力音信号の相関係数である左右相関係数γを用いることで、左チャネルの入力音信号と右チャネルの入力音信号の相関が大きいほど、復号音信号が有する量子化誤差のエネルギーを小さくすることを優先し、左チャネルの入力音信号と右チャネルの入力音信号の相関が小さいほど、聴覚品質の劣化を抑えることを優先する。
例4は、符号化側は例1および例2と異なるが、復号側、すなわち、左チャネル減算利得復号部230と右チャネル減算利得復号部250は例1および例2と同じである。以下、例4が例1および例2と異なる点について説明する。
〔〔〔左右関係情報推定部180〕〕〕
例4の符号化装置100は、図1に破線で示すように左右関係情報推定部180も含む。左右関係情報推定部180には、符号化装置100に入力された左チャネルの入力音信号と、符号化装置100に入力された右チャネルの入力音信号と、が入力される。左右関係情報推定部180は、入力された左チャネルの入力音信号と右チャネルの入力音信号から左右相関係数γを得て出力する(ステップS180)。
左右相関係数γは、左チャネルの入力音信号と右チャネルの入力音信号の相関係数であり、左チャネルの入力音信号のサンプル列xL(1), xL(2), ..., xL(T)と右チャネルの入力音信号のサンプル列x(1), xR(2), ..., xR(T)の相関係数γ0であってもよいし、時間差を考慮した相関係数、例えば、左チャネルの入力音信号のサンプル列と、τサンプルだけ当該サンプル列より後にずれた位置にある右チャネルの入力音信号のサンプル列と、の相関係数γτであってもよい。
このτは、ある空間に配置した左チャネル用のマイクロホンで収音した音をAD変換して得られた音信号が左チャネルの入力音信号であり、当該空間に配置した右チャネル用のマイクロホンで収音した音をAD変換して得られた音信号が右チャネルの入力音信号である、と仮定したときの、当該空間で主に音を発している音源から左チャネル用のマイクロホンへの到達時間と、当該音源から右チャネル用のマイクロホンへの到達時間と、の差(いわゆる到来時間差)に相当する情報であり、以降では左右時間差と呼ぶ。左右時間差τは、周知の何れの方法で求めてもよく、第2参考形態の左右関係情報推定部181で説明する方法などで求めればよい。すなわち、上述した相関係数γτは、音源から左チャネル用のマイクロホンに到達して収音された音信号と、当該音源から右チャネル用のマイクロホンに到達して収音された音信号と、の相関係数に相当する情報である。
〔〔〔左チャネル減算利得推定部120〕〕〕
左チャネル減算利得推定部120は、ステップS120-13に代えて、ステップS120-11またはステップS120-113で得た正規化された内積値rLと、ステップS120-12で得た左チャネル補正係数cLと、ステップS180で得た左右相関係数γと、を乗算した値を得る(ステップS120-13”)。左チャネル減算利得推定部120は、次に、ステップS120-14に代えて、記憶されている左チャネル減算利得の候補αcand(1), ..., αcand(A)のうちのステップS120-13”で得た乗算値γ×cL×rLに最も近い候補(乗算値γ×cL×rLの量子化値)を左チャネル減算利得αとして得て、記憶されている符号Cαcand(1), ..., Cαcand(A)のうちの左チャネル減算利得αに対応する符号を左チャネル減算利得符号Cαとして得る(ステップS120-14”)。
〔〔〔右チャネル減算利得推定部140〕〕〕
右チャネル減算利得推定部140は、ステップS140-13に代えて、ステップS140-11またはステップS140-113で得た正規化された内積値rRと、ステップS140-12で得た右チャネル補正係数cRと、ステップS180で得た左右相関係数γと、を乗算した値を得る(ステップS140-13”)。右チャネル減算利得推定部140は、次に、ステップS140-14に代えて、記憶されている右チャネル減算利得の候補βcand(1), ..., βcand(B)のうちのステップS140-13”で得た乗算値γ×cR×rRに最も近い候補(乗算値γ×cR×rRの量子化値)を右チャネル減算利得βとして得て、記憶されている符号Cβcand(1), ..., Cβcand(B)のうちの右チャネル減算利得βに対応する符号を右チャネル減算利得符号Cβとして得る(ステップS140-14”)。
〔〔例4の変形例〕〕
上述したように補正係数cLは符号化装置100でも復号装置200でも同じ値を計算することができる。従って、正規化された内積値rLと左右相関係数γの乗算値γ×rLを左チャネル減算利得推定部120での符号化と左チャネル減算利得復号部230での復号の対象として、左チャネル減算利得符号Cαが乗算値γ×rLの量子化値を表すようにして、左チャネル減算利得推定部120と左チャネル減算利得復号部230が乗算値γ×rLの量子化値と左チャネル補正係数cLを乗算して左チャネル減算利得αを得るようにしてもよい。
右チャネルについても同様であり、補正係数cRは符号化装置100でも復号装置200でも同じ値を計算することができる。従って、正規化された内積値rRと左右相関係数γの乗算値γ×rRを右チャネル減算利得推定部140での符号化と右チャネル減算利得復号部250での復号の対象として、右チャネル減算利得符号Cβが乗算値γ×rRの量子化値を表すようにして、右チャネル減算利得推定部140と右チャネル減算利得復号部250が乗算値γ×rRの量子化値と右チャネル補正係数cRを乗算して右チャネル減算利得βを得るようにしてもよい。
<第2参考形態>
第2参考形態の符号化装置と復号装置について説明する。
≪符号化装置101≫
第2参考形態の符号化装置101は、図10に示す通り、ダウンミックス部110と左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150とモノラル符号化部160とステレオ符号化部170と左右関係情報推定部181と時間シフト部191を含む。第2参考形態の符号化装置101が第1参考形態の符号化装置100と異なるのは、左右関係情報推定部181と時間シフト部191を含むことと、ダウンミックス部110が出力した信号に代えて時間シフト部191が出力した信号を左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150が用いることと、上述した各符号に加えて後述する左右時間差符号Cτも出力すること、である。第2参考形態の符号化装置101のその他の構成及び動作は第1参考形態の符号化装置100と同じである。第2参考形態の符号化装置101は、各フレームについて、図11に例示するステップS110からステップS191の処理を行う。以下、第2参考形態の符号化装置101が第1参考形態の符号化装置100と異なる点について説明する。
[左右関係情報推定部181]
左右関係情報推定部181には、符号化装置101に入力された左チャネルの入力音信号と、符号化装置101に入力された右チャネルの入力音信号と、が入力される。左右関係情報推定部181は、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左右時間差τと、左右時間差τを表す符号である左右時間差符号Cτと、を得て出力する(ステップS181)。
左右時間差τは、ある空間に配置した左チャネル用のマイクロホンで収音した音をAD変換して得られた音信号が左チャネルの入力音信号であり、当該空間に配置した右チャネル用のマイクロホンで収音した音をAD変換して得られた音信号が右チャネルの入力音信号である、と仮定したときの、当該空間で主に音を発している音源から左チャネル用のマイクロホンへの到達時間と、当該音源から右チャネル用のマイクロホンへの到達時間と、の差(いわゆる到来時間差)に相当する情報である。なお、到来時間差だけではなく、どちらのマイクロホンに早く到達しているかの情報も左右時間差τに含めるために、左右時間差τは、何れか一方の入力音信号を基準として正の値も負の値も取り得るものとする。すなわち、左右時間差τは、同じ音信号が左チャネルの入力音信号と右チャネルの入力音信号のどちらにどれくらい先に含まれているかを表す情報である。以下では、同じ音信号が右チャネルの入力音信号よりも左チャネルの入力音信号に先に含まれている場合には、左チャネルが先行しているともいい、同じ音信号が左チャネルの入力音信号よりも右チャネルの入力音信号に先に含まれている場合には、右チャネルが先行しているともいう。
左右時間差τは周知の何れの方法で求めてもよい。例えば、左右関係情報推定部181は、予め定めたτmaxからτminまで(例えば、τmaxは正の数、τminは負の数)の各候補サンプル数τcandについて、左チャネルの入力音信号のサンプル列と、候補サンプル数τcand分だけ当該サンプル列より後にずれた位置にある右チャネルの入力音信号のサンプル列と、の相関の大きさを表す値(以下、相関値という)γcandを計算して、相関値γcandが最大となる候補サンプル数τcandを左右時間差τとして得る。すなわち、この例では、左チャネルが先行している場合には左右時間差τは正の値であり、右チャネルが先行している場合には左右時間差τは負の値であり、左右時間差τの絶対値が、先行しているチャネルがもう一方のチャネルに対してどれくらい先行しているかを表す値(先行しているサンプル数)である。例えば、フレーム内のサンプルのみを用いて相関値γcandを計算する場合には、τcandが正の値の場合には、右チャネルの入力音信号の部分サンプル列xR(1+τcand), xR(2+τcand), ..., xR(T)と、候補サンプル数τcand分だけ当該部分サンプル列より前にずれた位置にある左チャネルの入力音信号の部分サンプル列xL(1), xL(2), ..., xL(T-τcand)と、の相関係数の絶対値を相関値γcandとして計算し、τcandが負の値の場合には、左チャネルの入力音信号の部分サンプル列xL(1-τcand), xL(2-τcand), ..., xL(T)と、候補サンプル数-τcand分だけ当該部分サンプル列より前にずれた位置にある右チャネルの入力音信号の部分サンプル列xR(1), xR(2), ..., xR(T+τcand)と、の相関係数の絶対値を相関値γcandとして計算すればよい。もちろん、相関値γcandを計算するために現在のフレームの入力音信号のサンプル列に連続する過去の入力音信号の1個以上のサンプルも用いてもよく、この場合には過去のフレームの入力音信号のサンプル列を予め定めたフレーム数分だけ左右関係情報推定部181内の図示しない記憶部に記憶しておくようにすればよい。
また例えば、相関係数の絶対値に代えて、以下のように信号の位相の情報を用いて相関値γcandを計算してもよい。この例においては、左右関係情報推定部181は、まず左チャネルの入力音信号xL(1), xL(2), ..., xL(T)及び右チャネルの入力音信号xR(1), xR(2), ..., xR(T)のそれぞれを、下記の式(3-1)及び式(3-2)のようにフーリエ変換することにより、0からT-1の各周波数kにおける周波数スペクトルXL(k)及びXR(k)を得る。
Figure 2024023484000020

Figure 2024023484000021

左右関係情報推定部181は、得られた周波数スペクトルXL(k)及びXR(k)を用いて、下記の式(3-3)により、各周波数kにおける位相差のスペクトルφ(k)を得る。
Figure 2024023484000022

得られた位相差のスペクトルを逆フーリエ変換することにより、下記の式(3-4)のようにτmaxからτminまでの各候補サンプル数τcandについて位相差信号ψ(τcand)を得る。
Figure 2024023484000023

得られた位相差信号ψ(τcand)の絶対値は、左チャネルの入力音信号xL(1), xL(2), ..., xL(T)及び右チャネルの入力音信号xR(1), xR(2), ..., xR(T)の時間差の尤もらしさに対応したある種の相関を表すものであるので、各候補サンプル数τcandに対するこの位相差信号ψ(τcand)の絶対値を相関値γcandとして用いる。左右関係情報推定部181は、この位相差信号ψ(τcand)の絶対値である相関値γcandが最大となる候補サンプル数τcandを左右時間差τとして得る。なお、相関値γcandとして位相差信号ψ(τcand)の絶対値をそのまま用いることに代えて、例えば各τcandについて位相差信号ψ(τcand)の絶対値に対するτcand前後にある複数個の候補サンプル数それぞれについて得られた位相差信号の絶対値の平均との相対差のような、正規化された値を用いてもよい。つまり、各τcandについて、予め定めた正の数τrangeを用いて、下記の式(3-5)により平均値を得て、得られた平均値ψccand)と位相差信号ψ(τcand)を用いて下記の式(3-6)により得られる正規化された相関値をγcandとして用いてもよい。
Figure 2024023484000024

Figure 2024023484000025

なお、式(3-6)により得られる正規化された相関値は、0以上1以下の値であり、τcandが左右時間差として尤もらしいほど1に近く、τcandが左右時間差として尤もらしくないほど0に近い性質を示す値である。
また、左右関係情報推定部181は、左右時間差τを所定の符号化方式で符号化して、左右時間差τを一意に特定可能な符号である左右時間差符号Cτを得るようにすればよい。所定の符号化方式としては、スカラ量子化などの周知の符号化方式を用いればよい。なお、予め定めた各候補サンプル数は、τmaxからτminまでの各整数値であってもよいし、τmaxからτminまでの間にある分数値や小数値を含んでいてもよいし、τmaxからτminまでの間にある何れかの整数値を含まないでもよい。また、τmax=-τminであってもよいし、そうでなくてもよい。また、何れかのチャネルが必ず先行しているような特殊な入力音信号を対象とする場合には、τmaxもτminも正の数としたり、τmaxもτminも負の数としたりしてもよい。
なお、符号化装置101が第1参考形態で説明した例4または例4の変形例の量子化誤差を最小化する原理に基づく減算利得の推定を行う場合には、左右関係情報推定部181は、さらに、左チャネルの入力音信号のサンプル列と、左右時間差τ分だけ当該サンプル列より後にずれた位置にある右チャネルの入力音信号のサンプル列と、の相関値、すなわち、τmaxからτminまでの各候補サンプル数τcandについて計算した相関値γcandのうちの最大値、を左右相関係数γとして出力する(ステップS180)。
[時間シフト部191]
時間シフト部191には、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)と、左右関係情報推定部181が出力した左右時間差τと、が入力される。時間シフト部191は、左右時間差τが正の値である場合(すなわち、左右時間差τが左チャネルが先行していることを表す場合)には、ダウンミックス信号xM(1), xM(2), ..., xM(T)をそのまま左チャネル減算利得推定部120と左チャネル信号減算部130に出力し(すなわち、左チャネル減算利得推定部120と左チャネル信号減算部130で用いることを決定し)、ダウンミックス信号を|τ|サンプル(左右時間差τの絶対値分のサンプル数、左右時間差τが表す大きさ分のサンプル数)遅らせた信号xM(1-|τ|), xM(2-|τ|), ..., xM(T-|τ|)である遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)を右チャネル減算利得推定部140と右チャネル信号減算部150に出力し(すなわち、右チャネル減算利得推定部140と右チャネル信号減算部150で用いることを決定し)、左右時間差τが負の値である場合(すなわち、左右時間差τが右チャネルが先行していることを表す場合)には、ダウンミックス信号を|τ|サンプル遅らせた信号xM(1-|τ|), xM(2-|τ|), ..., xM(T-|τ|)である遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)を左チャネル減算利得推定部120と左チャネル信号減算部130に出力し(すなわち、左チャネル減算利得推定部120と左チャネル信号減算部130で用いることを決定し)、ダウンミックス信号xM(1), xM(2), ..., xM(T)をそのまま右チャネル減算利得推定部140と右チャネル信号減算部150に出力し(すなわち、右チャネル減算利得推定部140と右チャネル信号減算部150で用いることを決定し)、左右時間差τが0である場合(すなわち、左右時間差τが何れのチャネルも先行していないことを表す場合)には、ダウンミックス信号xM(1), xM(2), ..., xM(T)をそのまま左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150に出力する(すなわち、左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150で用いることを決定する)(ステップS191)。すなわち、左チャネルと右チャネルのうちの上述した到達時間が短いほうのチャネルについては、入力されたダウンミックス信号をそのまま当該チャネルの減算利得推定部と当該チャネルの信号減算部に出力し、左チャネルと右チャネルのうちの上述した到達時間が長いほうのチャネルについては、入力されたダウンミックス信号を左右時間差τの絶対値|τ|だけ遅らせた信号を当該チャネルの減算利得推定部と当該チャネルの信号減算部に出力する。なお、時間シフト部191では遅延ダウンミックス信号を得るために過去のフレームのダウンミックス信号を用いることから、時間シフト部191内の図示しない記憶部には、過去のフレームで入力されたダウンミックス信号を予め定めたフレーム数分だけ記憶しておく。また、左チャネル減算利得推定部120と右チャネル減算利得推定部140が量子化誤差を最小化する原理に基づく方法ではなく特許文献1に例示されているような周知の方法で左チャネル減算利得αと右チャネル減算利得βを得る場合には、符号化装置101のモノラル符号化部160の後段またはモノラル符号化部160内にモノラル符号CMに対応する局部復号信号を得る手段を備えて、時間シフト部191では、ダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて、モノラル符号化の局部復号信号である量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)を用いて上述した処理を行ってもよい。この場合には、時間シフト部191は、ダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)を出力し、遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)に代えて遅延量子化済みダウンミックス信号^xM'(1), ^xM'(2), ..., ^xM'(T)を出力する。
[左チャネル減算利得推定部120、左チャネル信号減算部130、右チャネル減算利得推定部140、右チャネル信号減算部150]
左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150は、第1参考形態で説明したのと同じ動作を、ダウンミックス部110が出力したダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて、時間シフト部191から入力されたダウンミックス信号xM(1), xM(2), ..., xM(T)または遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)を用いて行う(ステップS120、S130、S140、S150)。すなわち、左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150は、時間シフト部191で決定されたダウンミックス信号xM(1), xM(2), ..., xM(T)または遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)を用いて、第1参考形態で説明したのと同じ動作を行う。なお、時間シフト部191がダウンミックス信号xM(1), xM(2), ..., xM(T)に代えて量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)を出力し、遅延ダウンミックス信号xM'(1), xM'(2), ..., xM'(T)に代えて遅延量子化済みダウンミックス信号^xM'(1), ^xM'(2), ..., ^xM'(T)を出力した場合には、左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150は、時間シフト部191から入力された量子化済みダウンミックス信号^xM(1), ^xM(2), ..., ^xM(T)または遅延量子化済みダウンミックス信号^xM'(1), ^xM'(2), ..., ^xM'(T)を用いて上述した処理を行う。
≪復号装置201≫
第2参考形態の復号装置201は、図12に示す通り、モノラル復号部210とステレオ復号部220と左チャネル減算利得復号部230と左チャネル信号加算部240と右チャネル減算利得復号部250と右チャネル信号加算部260と左右時間差復号部271と時間シフト部281を含む。第2参考形態の復号装置201が第1参考形態の復号装置200と異なるのは、上述した各符号に加えて後述する左右時間差符号Cτも入力されることと、左右時間差復号部271と時間シフト部281を含むことと、モノラル復号部210が出力した信号に代えて時間シフト部281が出力した信号を左チャネル信号加算部240と右チャネル信号加算部260が用いること、である。第2参考形態の復号装置201のその他の構成及び動作は第1参考形態の復号装置200と同じである。第2参考形態の復号装置201は、各フレームについて、図13に例示するステップS210からステップS281の処理を行う。以下、第2参考形態の復号装置201が第1参考形態の復号装置200と異なる点について説明する。
[左右時間差復号部271]
左右時間差復号部271には、復号装置201に入力された左右時間差符号Cτが入力される。左右時間差復号部271は、左右時間差符号Cτを所定の復号方式で復号して左右時間差τを得て出力する(ステップS271)。所定の復号方式としては、対応する符号化装置101の左右関係情報推定部181で用いた符号化方式に対応する復号方式を用いる。左右時間差復号部271が得る左右時間差τは、対応する符号化装置101の左右関係情報推定部181が得た左右時間差τと同じ値であり、τmaxからτminまでの範囲内の何れかの値である。
[時間シフト部281]
時間シフト部281には、モノラル復号部210が出力したモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)と、左右時間差復号部271が出力した左右時間差τと、が入力される。時間シフト部281は、左右時間差τが正の値である場合(すなわち、左右時間差τが左チャネルが先行していることを表す場合)には、モノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)をそのまま左チャネル信号加算部240に出力し(すなわち、左チャネル信号加算部240で用いることを決定し)、モノラル復号音信号を|τ|サンプル遅らせた信号^xM(1-|τ|), ^xM(2-|τ|), ..., ^xM(T-|τ|)である遅延モノラル復号音信号^xM'(1), ^xM'(2), ..., ^xM'(T)を右チャネル信号加算部260に出力し(すなわち、右チャネル信号加算部260で用いることを決定し)、左右時間差τが負の値である場合(すなわち、左右時間差τが右チャネルが先行していることを表す場合)には、モノラル復号音信号を|τ|サンプル遅らせた信号^xM(1-|τ|), ^xM(2-|τ|), ..., ^xM(T-|τ|)である遅延モノラル復号音信号^xM'(1), ^xM'(2), ..., ^xM'(T)を左チャネル信号加算部240に出力し(すなわち、左チャネル信号加算部240で用いることを決定し)、モノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)をそのまま右チャネル信号加算部260に出力し(すなわち、右チャネル信号加算部260で用いることを決定し)、左右時間差τが0である場合(すなわち、左右時間差τが何れのチャネルも先行していないことを表す場合)には、モノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)をそのまま左チャネル信号加算部240と右チャネル信号加算部260に出力する(すなわち、左チャネル信号加算部240と右チャネル信号加算部260で用いることを決定する)(ステップS281)。なお、時間シフト部281では遅延モノラル復号音信号を得るために過去のフレームのモノラル復号音信号を用いることから、時間シフト部281内の図示しない記憶部には、過去のフレームで入力されたモノラル復号音信号を予め定めたフレーム数分だけ記憶しておく。
[左チャネル信号加算部240、右チャネル信号加算部260]
左チャネル信号加算部240と右チャネル信号加算部260は、第1参考形態で説明したのと同じ動作を、モノラル復号部210が出力したモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)に代えて、時間シフト部281から入力されたモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)または遅延モノラル復号音信号^xM'(1), ^xM'(2), ..., ^xM'(T)を用いて行う(ステップS240、S260)。すなわち、左チャネル信号加算部240と右チャネル信号加算部260は、時間シフト部281で決定されたモノラル復号音信号^xM(1), ^xM(2), ..., ^xM(T)または遅延モノラル復号音信号^xM'(1), ^xM'(2), ..., ^xM'(T)を用いて、第1参考形態で説明したのと同じ動作を行う。
<第1実施形態>
第2参考形態の符号化装置101に対して、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を生成する変形をしたのが、第1実施形態である。以下、第1実施形態の符号化装置について説明する。なお、第1実施形態の符号化装置が得た符号は、第2参考形態の復号装置201で復号することができるので、復号装置の説明は省略する。
≪符号化装置102≫
第1実施形態の符号化装置102は、図10に示す通り、ダウンミックス部112と左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150とモノラル符号化部160とステレオ符号化部170と左右関係情報推定部182と時間シフト部191を含む。第1実施形態の符号化装置102が第2参考形態の符号化装置101と異なるのは、左右関係情報推定部181に代えて左右関係情報推定部182を含み、ダウンミックス部110に代えてダウンミックス部112を含み、図10に破線で示す通り、左右関係情報推定部182が左右相関係数γと先行チャネル情報を得て出力し、出力した左右相関係数γと先行チャネル情報がダウンミックス部112に入力されて用いられることである。第1実施形態の符号化装置102のその他の構成及び動作は第2参考形態の符号化装置101と同じである。第1実施形態の符号化装置102は、各フレームについて、図14に例示するステップS112からステップS191の処理を行う。以下、第1実施形態の符号化装置102が第2参考形態の符号化装置101と異なる点について説明する。
[左右関係情報推定部182]
左右関係情報推定部182には、符号化装置102に入力された左チャネルの入力音信号と、符号化装置102に入力された右チャネルの入力音信号と、が入力される。左右関係情報推定部182は、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左右時間差τと、左右時間差τを表す符号である左右時間差符号Cτと、左右相関係数γと、先行チャネル情報と、を得て出力する(ステップS182)。左右関係情報推定部182が左右時間差τと左右時間差符号Cτを得る処理は、第2参考形態の左右関係情報推定部181と同様である。
左右相関係数γは、第2参考形態の左右関係情報推定部181の説明箇所で上述した仮定における、音源から左チャネル用のマイクロホンに到達して収音された音信号と、当該音源から右チャネル用のマイクロホンに到達して収音された音信号と、の相関係数に相当する情報である。先行チャネル情報は、音源が発した音がどちらのマイクロホンに早く到達しているかに相当する情報であり、同じ音信号が左チャネルの入力音信号と右チャネルの入力音信号のどちらに先に含まれているかを表す情報であり、左チャネルと右チャネルのどちらのチャネルが先行しているかを表す情報である。
第2参考形態の左右関係情報推定部181の説明箇所で上述した例であれば、左右関係情報推定部182は、左チャネルの入力音信号のサンプル列と、左右時間差τ分だけ当該サンプル列より後にずれた位置にある右チャネルの入力音信号のサンプル列と、の相関値、すなわち、τmaxからτminまでの各候補サンプル数τcandについて計算した相関値γcandのうちの最大値、を左右相関係数γとして得て出力する。また、左右関係情報推定部182は、左右時間差τが正の値である場合には、左チャネルが先行していることを表す情報を先行チャネル情報として得て出力し、左右時間差τが負の値である場合には、右チャネルが先行していることを表す情報を先行チャネル情報として得て出力する。左右関係情報推定部182は、左右時間差τが0である場合には、左チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいし、右チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいが、何れのチャネルも先行していないことを表す情報を先行チャネル情報として得て出力するとよい。
[ダウンミックス部112]
ダウンミックス部112には、符号化装置102に入力された左チャネルの入力音信号と、符号化装置102に入力された右チャネルの入力音信号と、左右関係情報推定部182が出力した左右相関係数γと、左右関係情報推定部182が出力した先行チャネル情報と、が入力される。ダウンミックス部112は、ダウンミックス信号に、左チャネルの入力音信号と右チャネルの入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数γが大きいほど大きく含まれるように、左チャネルの入力音信号と右チャネルの入力音信号を重み付け平均してダウンミックス信号を得て出力する(ステップS112)。
例えば、第2参考形態の左右関係情報推定部181の説明箇所で上述した例のように相関値に相関係数の絶対値や正規化された値を用いているならば、得られる左右相関係数γは0以上1以下の値であるため、ダウンミックス部112は、対応する各サンプル番号tに対して、左右相関係数γで定まる重みを用いて左チャネルの入力音信号xL(t)と右チャネルの入力音信号xR(t)を重み付け加算したものをダウンミックス信号xM(t)とすればよい。具体的には、ダウンミックス部112は、先行チャネル情報が左チャネルが先行していることを表す情報である場合、すなわち、左チャネルが先行している場合には、xM(t)= ((1+γ)/2)×xL(t)+((1-γ)/2)×xR(t)、先行チャネル情報が右チャネルが先行していることを表す情報である場合、すなわち、右チャネルが先行している場合には、xM(t)= ((1-γ)/2)×xL(t)+((1+γ)/2)×xR(t)、としてダウンミックス信号xM(t)を得ればよい。ダウンミックス部112がこのようにダウンミックス信号を得ることで、当該ダウンミックス信号は、左右相関係数γが小さいほど、つまり左チャネルの入力音信号と右チャネルの入力音信号の相関が小さいほど、左チャネルの入力音信号と右チャネルの入力音信号の平均により得られる信号に近く、左右相関係数γが大きいほど、つまり左チャネルの入力音信号と右チャネルの入力音信号の相関が大きいほど、左チャネルの入力音信号と右チャネルの入力音信号のうちの先行しているチャネルの入力音信号に近い。
なお、ダウンミックス部112は、何れのチャネルも先行していない場合には、左チャネルの入力音信号と右チャネルの入力音信号が同じ重みでダウンミックス信号に含まれるように、左チャネルの入力音信号と右チャネルの入力音信号を平均してダウンミックス信号を得て出力するのがよい。そこで、ダウンミックス部112は、先行チャネル情報が何れのチャネルも先行していないことを表す場合には、各サンプル番号tについて、左チャネルの入力音信号xL(t)と右チャネルの入力音信号xR(t)を平均したxM(t)=(xL(t)+xR(t))/2をダウンミックス信号xM(t)とする。
<第2実施形態>
第1参考形態の符号化装置100に対しても、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を生成する変形をしてもよく、この形態を第2実施形態として説明する。なお、第2実施形態の符号化装置が得た符号は、第1参考形態の復号装置200で復号することができるので、復号装置の説明は省略する。
≪符号化装置103≫
第2実施形態の符号化装置103は、図1に示す通り、ダウンミックス部112と左チャネル減算利得推定部120と左チャネル信号減算部130と右チャネル減算利得推定部140と右チャネル信号減算部150とモノラル符号化部160とステレオ符号化部170と左右関係情報推定部183を含む。第2実施形態の符号化装置103が第1参考形態の符号化装置100と異なるのは、ダウンミックス部110に代えてダウンミックス部112を含み、図1に破線で示す通り、左右関係情報推定部183を含み、左右関係情報推定部183が左右相関係数γと先行チャネル情報を得て出力し、出力した左右相関係数γと先行チャネル情報がダウンミックス部112に入力されて用いられることである。第2実施形態の符号化装置103のその他の構成及び動作は第1参考形態の符号化装置100と同じである。また、第2実施形態の符号化装置103のダウンミックス部112の動作は、第1実施形態の符号化装置102のダウンミックス部112の動作と同じである。第2実施形態の符号化装置103は、各フレームについて、図15に例示するステップS112からステップS183の処理を行う。以下、第2実施形態の符号化装置103が第1参考形態の符号化装置100とも第1実施形態の符号化装置102とも異なる点について説明する。
[左右関係情報推定部183]
左右関係情報推定部183には、符号化装置103に入力された左チャネルの入力音信号と、符号化装置103に入力された右チャネルの入力音信号と、が入力される。左右関係情報推定部183は、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左右相関係数γと、先行チャネル情報と、を得て出力する(ステップS183)。
左右関係情報推定部183が得て出力する左右相関係数γと先行チャネル情報は、第1実施形態で説明したものと同じである。すなわち、左右関係情報推定部183は、左右時間差τと左右時間差符号Cτを得ずに出力しないでよいこと以外は左右関係情報推定部182と同じでよい。
例えば、左右関係情報推定部183は、τmaxからτminまでの各候補サンプル数τcandについて、左チャネルの入力音信号のサンプル列と、各候補サンプル数τcand分だけ当該サンプル列より後にずれた位置にある右チャネルの入力音信号のサンプル列と、の相関値γcandのうちの最大値を左右相関係数γとして得て出力し、相関値が最大値のときのτcandが正の値である場合には、左チャネルが先行していることを表す情報を先行チャネル情報として得て出力し、相関値が最大値のときのτcandが負の値である場合には、右チャネルが先行していることを表す情報を先行チャネル情報として得て出力する。左右関係情報推定部183は、相関値が最大値のときのτcandが0である場合には、左チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいし、右チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいが、何れのチャネルも先行していないことを表す情報を先行チャネル情報として得て出力するとよい。
<第3実施形態>
各チャネルの差分信号ではなく各チャネルの入力音信号をステレオ符号化する符号化装置に対しても、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を得る構成を採用してもよく、この形態を第3実施形態として説明する。
≪符号化装置104≫
第3実施形態の符号化装置104は、図16に示す通り、左右関係情報推定部183とダウンミックス部112とモノラル符号化部160とステレオ符号化部174を含む。第3実施形態の符号化装置104は、各フレームについて、図17に例示するステップS183とステップS112とステップS160とステップS174の処理を行う。以下、第3実施形態の符号化装置104について、第2実施形態の説明を適宜参照して説明する。
[左右関係情報推定部183]
左右関係情報推定部183は、第2実施形態の左右関係情報推定部183と同じである。左右関係情報推定部183には、符号化装置104に入力された左チャネルの入力音信号と、符号化装置104に入力された右チャネルの入力音信号と、が入力される。左右関係情報推定部183は、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左チャネルの入力音信号と右チャネルの入力音信号の相関係数である左右相関係数γと、左チャネルの入力音信号と右チャネルの入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、を得て出力する(ステップS183)。
[ダウンミックス部112]
ダウンミックス部112は、第2実施形態のダウンミックス部112と同じである。ダウンミックス部112には、符号化装置104に入力された左チャネルの入力音信号と、符号化装置104に入力された右チャネルの入力音信号と、左右関係情報推定部183が出力した左右相関係数γと、左右関係情報推定部183が出力した先行チャネル情報と、が入力される。ダウンミックス部112は、ダウンミックス信号に、左チャネルの入力音信号と右チャネルの入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数γが大きいほど大きく含まれるように、左チャネルの入力音信号と右チャネルの入力音信号を重み付け平均してダウンミックス信号を得て出力する(ステップS112)。
例えば、サンプル番号をtとし、左チャネルの入力音信号をxL(t)とし、右チャネルの入力音信号をxR(t)とし、ダウンミックス信号をxM(t)とすると、ダウンミックス部112は、先行チャネル情報が左チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1+γ)/2)×xL(t)+((1-γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が右チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1-γ)/2)×xL(t)+((1+γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が何れのチャネルも先行していないことを表す場合には、各サンプル番号tについて、xM(t)=(xL(t)+xR(t))/2によりダウンミックス信号を得る。
[モノラル符号化部160]
モノラル符号化部160は、第2実施形態のモノラル符号化部160と同じである。モノラル符号化部160には、ダウンミックス部112が出力したダウンミックス信号が入力される。モノラル符号化部160は、入力されたダウンミックス信号を符号化してモノラル符号CMを得て出力する(ステップS160)。モノラル符号化部160は、どのような符号化方式を用いてもよく、例えば3GPP EVS規格のような符号化方式を用いればよい。符号化方式は、後述するステレオ符号化部174と独立して符号化処理を行う符号化方式、すなわち、ステレオ符号化部174で得られるステレオ符号CS’やステレオ符号化部174が行う符号化処理において得られる情報を用いずに符号化処理を行う符号化方式であってもよいし、ステレオ符号化部174で得られるステレオ符号CS’やステレオ符号化部174が行う符号化処理において得られる情報を用いて符号化処理を行う符号化方式であってもよい。
[ステレオ符号化部174]
ステレオ符号化部174には、符号化装置104に入力された左チャネルの入力音信号と、符号化装置104に入力された右チャネルの入力音信号と、が入力される。ステレオ符号化部174は、入力された左チャネルの入力音信号と右チャネルの入力音信号を符号化してステレオ符号CS’を得て出力する(ステップS174)。ステレオ符号化部174は、どのような符号化方式を用いてもよく、例えばMPEG-4 AAC規格のステレオ復号方式に対応するステレオ符号化方式を用いてもよいし、入力された左チャネルの入力音信号と右チャネルの入力音信号それぞれを独立して符号化する符号化方式を用いてもよく、符号化により得られた符号全てを合わせたものをステレオ符号CS’とすればよい。符号化方式は、モノラル符号化部160と独立して符号化処理を行う符号化方式、すなわち、モノラル符号化部160で得られるモノラル符号CMやモノラル符号化部160が行う符号化処理において得られる情報を用いずに符号化処理を行う符号化方式であってもよいし、モノラル符号化部160で得られるモノラル符号CMやモノラル符号化部160が行う符号化処理において得られる情報を用いて符号化処理を行う符号化方式であってもよい。
<第4実施形態>
以上の実施形態での説明からも分かる通り、符号化装置が、左チャネルの入力音信号と右チャネルの入力音信号から得たダウンミックス信号を少なくとも符号化して符号を得るのであれば、それがどのような符号化装置であっても、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を得る構成を採用してもよい。また、符号化装置に限らず、信号処理装置が、左チャネルの入力音信号と右チャネルの入力音信号から得たダウンミックス信号を少なくとも信号処理して信号処理結果を得るのであれば、それがどのような信号処理装置であっても、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を得る構成を採用してもよい。さらに、これらの符号化装置や信号処理装置の前段で用いるダウンミックス装置として、左チャネルの入力音信号と右チャネルの入力音信号の関係を考慮してダウンミックス信号を得る構成を採用してもよい。これらの形態を第4実施形態として説明する。
≪音信号符号化装置105≫
第4実施形態の音信号符号化装置105は、図18に示す通り、左右関係情報推定部183とダウンミックス部112と符号化部195を含む。第4実施形態の音信号符号化装置105は、各フレームについて、図19に例示するステップS183とステップS112とステップS195の処理を行う。以下、第4実施形態の音信号符号化装置105について、第2実施形態の説明を適宜参照して説明する。
[左右関係情報推定部183]
左右関係情報推定部183は、第2実施形態の左右関係情報推定部183と同じであり、入力された左チャネルの入力音信号と右チャネルの入力音信号から、左チャネルの入力音信号と右チャネルの入力音信号の相関係数である左右相関係数γと、左チャネルの入力音信号と右チャネルの入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、を得て出力する(ステップS183)。
[ダウンミックス部112]
ダウンミックス部112は、第2実施形態のダウンミックス部112と同じであり、ダウンミックス信号に、左チャネルの入力音信号と右チャネルの入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数γが大きいほど大きく含まれるように、左チャネルの入力音信号と右チャネルの入力音信号を重み付け平均してダウンミックス信号を得て出力する(ステップS112)。
[符号化部195]
符号化部195には、ダウンミックス部112が出力したダウンミックス信号が少なくとも入力される。符号化部195は、入力されたダウンミックス信号を少なくとも符号化して音信号符号を得て出力する(ステップS195)。符号化部195は、左チャネルの入力音信号と右チャネルの入力音信号も符号化してもよく、この符号化で得た符号も音信号符号に含めて出力してもよい。この場合には、図18に破線で示すように、符号化部195には左チャネルの入力音信号と右チャネルの入力音信号も入力される。
≪音信号処理装置305≫
第4実施形態の音信号処理装置305は、図20に示す通り、左右関係情報推定部183とダウンミックス部112と信号処理部315を含む。第4実施形態の音信号処理装置305は、各フレームについて、図21に例示するステップS183とステップS112とステップS315の処理を行う。以下、第4実施形態の音信号処理装置305について、第4実施形態の音信号符号化装置105と異なる点を説明する。
[信号処理部315]
信号処理部315には、ダウンミックス部112が出力したダウンミックス信号が少なくとも入力される。信号処理部315は、入力されたダウンミックス信号を少なくとも信号処理して信号処理結果を得て出力する(ステップS315)。信号処理部315は、左チャネルの入力音信号と右チャネルの入力音信号も信号処理して信号処理結果を得てもよく、この場合には、図20に破線で示すように、信号処理部315には左チャネルの入力音信号と右チャネルの入力音信号も入力される。信号処理部315は、例えば、各チャネルの入力音信号に対してダウンミックス信号を用いた信号処理を行って各チャネルの出力音信号を信号処理結果として得てもよいし、第3実施形態のステレオ符号化部174で得た符号CS’をステレオ符号化部174に対応する復号部を備える復号装置で復号して得た左チャネルの復号音信号と右チャネルの復号音信号に対してこの信号処理を行ってもよい。すなわち、音信号処理装置305に入力される左チャネルの入力音信号と右チャネルの入力音信号が2個のマイクロホンそれぞれで収音してAD変換して得られたディジタルの音声信号又は音響信号であるのは必須ではなく、音信号処理装置305に入力される左チャネルの入力音信号と右チャネルの入力音信号は、符号を復号して得た左チャネルの復号音信号と右チャネルの復号音信号であってもよいし、ステレオの2チャネルの音信号であればどのようにして得られた音信号であってもよい。
音信号処理装置305に入力される左チャネルの入力音信号と右チャネルの入力音信号が別装置で符号を復号して得た左チャネルの復号音信号と右チャネルの復号音信号である場合などには、左右関係情報推定部183が得るのと同じ左右相関係数γと先行チャネル情報の何れか一方または両方が別装置で得られている場合がある。左右相関係数γと先行チャネル情報の何れか一方または両方が別装置で得られている場合は、図20に一点鎖線で示す通り、音信号処理装置305には、別装置で得た左右相関係数γと先行チャネル情報の何れか一方または両方が入力されるようにすればよい。この場合には、左右関係情報推定部183は、音信号処理装置305に入力されなかった左右相関係数γまたは先行チャネル情報を得るようにすればよく、左右相関係数γと先行チャネル情報の両方が音信号処理装置305に入力される場合には、音信号処理装置305は、左右関係情報推定部183を備えずステップS183を行わないでよい。すなわち、音信号処理装置305は、図20に二点鎖線で示す通り、左右関係情報取得部185を備えて、左右関係情報取得部185が、左チャネルの入力音信号と右チャネルの入力音信号の相関係数である左右相関係数γと、左チャネルの入力音信号と右チャネルの入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、を得て出力するようにすればよい(ステップS185)。なお、上述した各装置の左右関係情報推定部183とステップS183も、左右関係情報取得部185とステップS185の範疇であるといえる。
≪音信号ダウンミックス装置405≫
第4実施形態の音信号ダウンミックス装置405は、図22に示す通り、左右関係情報取得部185とダウンミックス部112を含む。音信号ダウンミックス装置405は、各フレームについて、図23に例示するステップS185とステップS112の処理を行う。以下、音信号ダウンミックス装置405について、第2実施形態の説明を適宜参照して説明する。なお、音信号処理装置305と同様に、音信号ダウンミックス装置405に入力される左チャネルの入力音信号と右チャネルの入力音信号は、2個のマイクロホンそれぞれで収音してAD変換して得られたディジタルの音声信号又は音響信号であってもよいし、符号を復号して得た左チャネルの復号音信号と右チャネルの復号音信号であってもよいし、ステレオの2チャネルの音信号であればどのようにして得られた音信号であってもよい。
[左右関係情報取得部185]
左右関係情報取得部185は、左チャネルの入力音信号と右チャネルの入力音信号の相関係数である左右相関係数γと、左チャネルの入力音信号と右チャネルの入力音信号のどちらが先行しているかを表す情報である先行チャネル情報と、を得て出力する(ステップS185)。
左右相関係数γと先行チャネル情報の両方が別装置で得られている場合には、図22に一点鎖線で示すように、左右関係情報取得部185は別装置から音信号ダウンミックス装置405に入力された左右相関係数γと先行チャネル情報を得てダウンミックス部112に対して出力する。
左右相関係数γと先行チャネル情報の両方が別装置で得られていない場合には、図22に破線で示すように、左右関係情報取得部185は左右関係情報推定部183を備える。左右関係情報推定部183は、左右相関係数γと先行チャネル情報を、第2実施形態の左右関係情報推定部183と同様に左チャネルの入力音信号と右チャネルの入力音信号から得て、ダウンミックス部112に対して出力する。
左右相関係数γと先行チャネル情報の何れか一方が別装置で得られていない場合には、図22に破線で示すように、左右関係情報取得部185は、左右関係情報推定部183を備える。左右関係情報取得部185の左右関係情報推定部183は、別装置で得られていない左右相関係数γまたは別装置で得られていない先行チャネル情報を、第2実施形態の左右関係情報推定部183と同様に左チャネルの入力音信号と右チャネルの入力音信号から得て、ダウンミックス部112に対して出力する。別装置で得られている左右相関係数γまたは別装置で得られている先行チャネル情報については、左右関係情報取得部185は、図22に一点鎖線で示すように、別装置から音信号ダウンミックス装置405に入力された左右相関係数γまたは先行チャネル情報をダウンミックス部112に対して出力する。
[ダウンミックス部112]
ダウンミックス部112は、第2実施形態のダウンミックス部112と同じであり、左右関係情報取得部185が取得した先行チャネル情報と左右相関係数と基づいて、ダウンミックス信号に、左チャネルの入力音信号と右チャネルの入力音信号のうちの先行しているチャネルの入力音信号のほうが、左右相関係数γが大きいほど大きく含まれるように、左チャネルの入力音信号と右チャネルの入力音信号を重み付け平均してダウンミックス信号を得て出力する(ステップS112)。
例えば、サンプル番号をtとし、左チャネルの入力音信号をxL(t)とし、右チャネルの入力音信号をxR(t)とし、ダウンミックス信号をxM(t)とすると、ダウンミックス部112は、先行チャネル情報が左チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1+γ)/2)×xL(t)+((1-γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が右チャネルが先行していることを表す場合には、各サンプル番号tについて、xM(t)=((1-γ)/2)×xL(t)+((1+γ)/2)×xR(t)によりダウンミックス信号を得て、先行チャネル情報が何れのチャネルも先行していないことを表す場合には、各サンプル番号tについて、xM(t)=(xL(t)+xR(t))/2によりダウンミックス信号を得る。
<プログラム及び記録媒体>
上述した各符号化装置と各復号装置と音信号符号化装置と音信号処理装置と音信号ダウンミックス装置の各部の処理をコンピュータにより実現してもよく、この場合は各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図24に示すコンピュータ1000の記憶部1020に読み込ませ、演算処理部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体は、例えば、非一時的な記録媒体であり、具体的には、磁気記録装置、光ディスク、等である。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の非一時的な記憶装置である補助記録部1050に格納する。そして、処理の実行時、このコンピュータは、自己の非一時的な記憶装置である補助記録部1050に格納されたプログラムを記憶部1020に読み込み、読み込んだプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを記憶部1020に読み込み、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
本発明の一態様は、第一チャネル入力音信号と第二チャネル入力音信号を混合した信号であるダウンミックス信号を得る音信号ダウンミックス方法であって、第一チャネル入力音信号と第二チャネル入力音信号のどちらが先行しているかを表す情報である先行チャネル情報を取得するステップと、先行チャネル情報と第一チャネル入力音信号と第二チャネル入力音信号の関係を示す係数である関係係数とに基づき決定される度合いに基づき、先行しているチャネルと、もう一方のチャネルと、からダウンミックス信号を得るダウンミックスステップと、を有する

Claims (1)

  1. 左チャネル入力音信号と右チャネル入力音信号を混合した信号であるダウンミックス信号を得る音信号ダウンミックス方法であって、
    前記左チャネル入力音信号と、前記右チャネル入力音信号と、の関係を示す係数である関係係数と、から前記ダウンミックス信号を得るダウンミックスステップであって、前記先行しているチャネルと、前記もう一方のチャネルと、は量子化誤差が小さくなるようダウンミックス信号に用いられる信号を得る、
    音信号ダウンミックス方法。
JP2023203361A 2020-03-09 2023-11-30 音信号ダウンミックス方法、音信号ダウンミックス装置及びプログラム Pending JP2024023484A (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
PCT/JP2020/010080 WO2021181472A1 (ja) 2020-03-09 2020-03-09 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
JPPCT/JP2020/010080 2020-03-09
JPPCT/JP2020/010081 2020-03-09
PCT/JP2020/010081 WO2021181473A1 (ja) 2020-03-09 2020-03-09 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
JP2022505754A JP7396459B2 (ja) 2020-03-09 2020-11-04 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
PCT/JP2020/041216 WO2021181746A1 (ja) 2020-03-09 2020-11-04 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022505754A Division JP7396459B2 (ja) 2020-03-09 2020-11-04 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
JP2024023484A true JP2024023484A (ja) 2024-02-21

Family

ID=77671479

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2022505754A Active JP7396459B2 (ja) 2020-03-09 2020-11-04 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505845A Active JP7380836B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505843A Active JP7380834B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505842A Active JP7380833B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505844A Active JP7380835B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2023203361A Pending JP2024023484A (ja) 2020-03-09 2023-11-30 音信号ダウンミックス方法、音信号ダウンミックス装置及びプログラム

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP2022505754A Active JP7396459B2 (ja) 2020-03-09 2020-11-04 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505845A Active JP7380836B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505843A Active JP7380834B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505842A Active JP7380833B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP2022505844A Active JP7380835B2 (ja) 2020-03-09 2021-02-08 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体

Country Status (5)

Country Link
US (5) US20230319498A1 (ja)
EP (1) EP4120250A4 (ja)
JP (6) JP7396459B2 (ja)
CN (1) CN115280411A (ja)
WO (1) WO2021181974A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023157159A1 (ja) * 2022-02-17 2023-08-24 日本電信電話株式会社 位相差スペクトル推定方法、チャネル間関係情報推定方法、信号符号化方法、信号処理方法、これらの装置、プログラム
CN115188394A (zh) * 2022-06-20 2022-10-14 安徽听见科技有限公司 混音方法、装置、电子设备和存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE532350T1 (de) * 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
PL2137725T3 (pl) 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
EP2283483B1 (en) 2008-05-23 2013-03-13 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
CN102428512A (zh) 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
WO2012040898A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
EP2830043A3 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for Processing an Audio Signal in accordance with a Room Impulse Response, Signal Processing Unit, Audio Encoder, Audio Decoder, and Binaural Renderer
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
EP2830050A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
CA3127805C (en) 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain

Also Published As

Publication number Publication date
WO2021181974A1 (ja) 2021-09-16
US20230106832A1 (en) 2023-04-06
EP4120250A1 (en) 2023-01-18
CN115280411A (zh) 2022-11-01
JP7396459B2 (ja) 2023-12-12
JP7380834B2 (ja) 2023-11-15
US20230107976A1 (en) 2023-04-06
JPWO2021181746A1 (ja) 2021-09-16
JP7380836B2 (ja) 2023-11-15
JPWO2021181975A1 (ja) 2021-09-16
US20230106764A1 (en) 2023-04-06
EP4120250A4 (en) 2024-03-27
JPWO2021181977A1 (ja) 2021-09-16
JPWO2021181974A1 (ja) 2021-09-16
JP7380833B2 (ja) 2023-11-15
US20230108927A1 (en) 2023-04-06
US20230319498A1 (en) 2023-10-05
JPWO2021181976A1 (ja) 2021-09-16
JP7380835B2 (ja) 2023-11-15

Similar Documents

Publication Publication Date Title
JP2024023484A (ja) 音信号ダウンミックス方法、音信号ダウンミックス装置及びプログラム
JP6789365B2 (ja) 音声符号化装置および方法
JP5643834B2 (ja) パラメトリックエンコード及びデコード
JP2018533057A (ja) セカンダリチャンネルを符号化するためにプライマリチャンネルのコーディングパラメータを使用するステレオ音声信号を符号化するための方法およびシステム
WO2021181746A1 (ja) 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JPWO2015186535A1 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
JP7380838B2 (ja) 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
JP7380837B2 (ja) 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
JP4714075B2 (ja) 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体
WO2023032065A1 (ja) 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム
JP4348322B2 (ja) 多チャネル信号符号化方法、多チャネル信号復号化方法、それらの方法を用いた装置、プログラム、および記録媒体
US20230402044A1 (en) Sound signal refining method, sound signal decoding method, apparatus thereof, program, and storage medium
US20230386482A1 (en) Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
JP7420829B2 (ja) 予測コーディングにおける低コスト誤り回復のための方法および装置
US20230402051A1 (en) Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium
US20230395080A1 (en) Sound signal refining method, sound signal decoding method, apparatus thereof, program, and storage medium
US20230377585A1 (en) Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
US20230386480A1 (en) Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
US20230410832A1 (en) Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium
US20230395081A1 (en) Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium
US20240119947A1 (en) Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
US20230395092A1 (en) Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240117