JP2021535426A - コンパンディングによる密過渡イベントの符号化 - Google Patents
コンパンディングによる密過渡イベントの符号化 Download PDFInfo
- Publication number
- JP2021535426A JP2021535426A JP2021509742A JP2021509742A JP2021535426A JP 2021535426 A JP2021535426 A JP 2021535426A JP 2021509742 A JP2021509742 A JP 2021509742A JP 2021509742 A JP2021509742 A JP 2021509742A JP 2021535426 A JP2021535426 A JP 2021535426A
- Authority
- JP
- Japan
- Prior art keywords
- companding
- audio signal
- index
- signal
- transient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001052 transient effect Effects 0.000 title claims abstract description 163
- 230000005236 sound signal Effects 0.000 claims abstract description 223
- 238000000034 method Methods 0.000 claims abstract description 116
- 238000007906 compression Methods 0.000 claims abstract description 87
- 230000006835 compression Effects 0.000 claims abstract description 87
- 230000006837 decompression Effects 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims description 38
- 238000003860 storage Methods 0.000 claims description 16
- 230000009471 action Effects 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 18
- 238000013139 quantization Methods 0.000 description 18
- 238000007493 shaping process Methods 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000003321 amplification Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000009527 percussion Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 208000037656 Respiratory Sounds Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 238000003775 Density Functional Theory Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/50—Conversion to or from non-linear codes, e.g. companding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Nonlinear Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は、以下の基礎出願の優先権を主張する。米国仮特許出願番号第62/720,447号(参照番号:D18075USP1)、2018年8月21日出願、参照によりここに組み込まれる。
1つ以上の実施形態は、概して、オーディオシング脳処理に関し、より詳細には、デジタルオーディオ符号化の最中に信号に依存する方法で圧縮/伸長(compression/expansion)(コンパンディング、companding)技術を最適に使用することに関する。
本特許文書の開示の一部は、著作権保護を受ける内容を含む。著作権者は、特許商標庁の特許ファイル又は記録に記載されているように、本特許文書又は特許開示のいずれによる複製にも異議を唱えることがないが、それ以外の場合は全ての著作権を保留する。
広帯域利得値により直交変調フィルタ(QMF)タイムスロットを変更するために圧縮を適用するエンコーダであって、利得値が大きいことは、比較的低い強度のスロットの増幅をもたらし、又は小さいことは、比較的高い強度のスロットの減衰をもたらす、エンコーダと、
エンコーダからデコーダへオーディオ出力を送信するインタフェースであって、デコーダは、コンパンディング操作における圧縮の逆である伸長を適用するよう構成される、インタフェースと、
コンパンディング制御部であって、入力オーディオ信号を受信して信号特性に基づき入力オーディオ信号を分類するよう構成される検出器、及び分類された入力オーディオ信号に基づき複数のコンパンディングモードの間で切り替えるよう構成されるスイッチ、を有するコンパンディング制御部と、を含む。
広帯域利得値により直交変調フィルタ(QMF)タイムスロットを変更するために圧縮を適用するエンコーダから、符号化圧縮オーディオ信号を受信する第1インタフェースであって、利得値が大きいことは、比較的低い強度のスロットの増幅をもたらし、又は小さいことは、比較的高い強度のスロットの減衰をもたらす、第1インタフェースと、
コンパンディング操作における圧縮を逆処理するために伸長を適用する伸長コンポーネントと、
信号特性に基づき入力オーディオ信号を分類し及び分類した入力オーディオ信号に基づき複数のコンパンディングモードの間で切り替える制御部から、コンパンディング制御モードを符号化するビットストリームを受信する第2インタフェースと、を含む。
本願明細書で言及される各技術的仕様、出版物、特許、及び/又は特許出願は、それぞれの個々の出版物及び/マスaa特許出願が具体的に及び個々に参照により組み込まれると示されるのと同程度に、参照によりその全体がここに組み込まれる。
システム100のコンパンダを含む圧縮及び伸長コンポーネントは、オーディオ信号処理の最中の特定の時間にのみ、又はオーディオコンテンツの特定のタイプについてのみ、前及び後処理ステップを適用するよう構成されてよい。例えば、コンパンディングは会話(これは、インパルスのようなイベントの疑似定常シリーズで構成される)及び音楽過渡信号について利点を示し得る。しかしながら、定常的信号のような他の信号について、コンパンディングは、信号品質を劣化させ得る。従って、図3Aに示すように、コンパンディング制御メカニズムがブロック310として提供され、制御データは、コンパンディング操作を調整するために、圧縮コンポーネント104から伸長コンポーネント114へ送信される。このような死魚メカニズムの最も単純な形式は、コンパンディングの適用がオーディオ品質を劣化させるオーディオサンプルのブロックについては、コンパンディング機能をオフに切り替えることである。実施形態では、コンパンディングのオン/オフの決定は、エンコーダにおいて検出され、ビットストリーム要素としてデコーダへ送信される。その結果、圧縮器及び伸長器は、同じQMFタイムススロットでオン/オフを切り替えることができる。
図4は、実施形態における、コーデックのエンコーダ段と関連して、オーディオ信号を圧縮するシステムを示すブロック図である。図4は、図3Aに示したコーデックに基づくシステムにおいて使用される圧縮方法の少なくとも一部を実施するハードウェア回路又はシステムを示す。システム400に示すように、時間ドメインにおける入力オーディオ信号401は、QMFフィルタバンク402へ入力される。このフィルタバンクは、入力信号を複数の成分に分ける分析動作を実行する。ここで、各帯域通過フィルタは、元の信号の周波数サブバンドを伝達する。信号の精鉱製は、QMFフィルタバンク410により実行される合成動作の中で実行される。図4の例示的な実施形態では、分析及び合成フィルタバンクの両方が、64個の帯域を扱う。コアエンコーダ412は、合成フィルタバンク410からオーディオ信号を受信し、適切なデジタル形式(例えば、MP3、AAC、AC−4、等)でオーディオ信号を符号化することにより、周波数ドメインのビットストリーム414を生成する。
実施形態では、コンパンディング制御メカニズムは、QMFドメインにおいてコンパンディングの制御を提供するために、コンパンディングコンポーネント104の部分として含まれる。コンパンディング制御は、多数の因子、例えばオーディオ信号タイプに基づき構成できる。例えば、多くの適用では、コンパンディングは、時間的ピークのある信号(例えば拍手)のクラスの範囲内の会話信号及び過渡的信号又は任意の他の信号についてオンにされるべきである。システムは、コンパンダ機能のために適切な制御信号を生成するのを助けるために、信号のピークを検出するために、検出メカニズム405を含む。検出メカニズム405は、例えば、信号が粗過渡信号(sparse transient signal)か又は密過渡信号(dense transient signal)かを決定するために、信号を分析すると言うことができる。この場合、信号の時間的ピークは、信号の中の過渡(過渡的イベント)の密度の指標を導出するために使用できる。
実施形態では、上述のシステムは、コアエンコーダの前の入力信号のダイナミックレンジを縮小させる。この意味でコアエンコーディングの前のコンパンディングは、入力信号のダイナミックレンジの圧縮に対応し得る。システムは、(コア符号化における又は非A−SPX周波数範囲内において等価な)QMFタイムススロットを、広帯域利得値により変更することにより、これを行う。利得値は、相対的に低い強度のスロットに対しては大きく(つまり、増幅)、高い強度のスロットに対しては小さい(つまり減衰)。
オーディオ信号を受信するステップと、
前記オーディオ信号の第1フレームが粗過渡信号を含むと決定するステップと、
前記オーディオ信号の第2フレームが密過渡信号を含むと決定するステップと、
前記オーディオ信号をコンパンディングするステップであって、第1コンパンディング指数を前記オーディオ信号の前記第1フレームに適用し第2コンパンディング指数を前記オーディオ信号の前記第2フレームに適用するコンパンディングルールを用いて、前記オーディオ信号に圧縮/伸長(コンパンディング)動作を適用することを含み、各コンパンディング指数は、対応するフレームのダイナミックレンジ圧縮及び伸長のそれぞれの程度を導出するために使用される、ステップと、
前記コンパンディングされたオーディオ信号を下流装置に提供するステップと、を含む方法。
オーディオ信号の前記過渡タイプは、拍手、雨、又はパチパチする火のうちの少なくとも1つを含む、EEE1に記載の方法。
圧縮/伸長(コンパンディング)符号化装置により、オーディオ信号を受信するステップと、
前記コンパンディング装置により、対応するフレームの中の前記オーディオ信号のコンテンツに基づき、前記オーディオ信号のフレーム毎にそれぞれのコンパンディング指数を決定するステップであって、各コンパンディング指数は、前記対応するフレームのダイナミックレンジ圧縮及び伸長のそれぞれの程度を導出するために使用される、ステップと、
粗過渡信号を含むと決定された前記オーディオ信号の第1フレームのために第1コンパンディング指数を指定するステップと、
密過渡信号を含むと決定された前記オーディオ信号の第2フレームのために第2コンパンディング指数を指定するステップであって、前記第1コンパンディング指数は前記第2コンパンディング指数より値が高い、ステップと、
前記コンパンディングの圧縮部分を実行するステップであって、前記第1コンパンディング指数に従い前記第1フレームを圧縮することと、前記第2コンパンディング指数に従い前記第2フレームを圧縮することとを含む、ステップと、
前記圧縮されたオーディオ信号をコアエンコーダに提供するステップと、
前記第1コンパンディング指数及び前記第2コンパンディング指数のそれぞれの指示子を、前記圧縮されたオーディオ信号に関連付けられたビットストリームに提供するステップと、を含む方法。
前記過渡タイプのオーディオ信号は、拍手、雨、又はパチパチする火のうちの少なくとも1つを含む、EEE4に記載の方法。
デコーダ装置により、複数の指示子に関連付けられた圧縮されたオーディオ信号を受信するステップであって、各指示子は、前記圧縮されたオーディオ信号の対応するフレームに適用されたダイナミックレンジ圧縮の程度を導出するために使用されたそれぞれの圧縮/伸長(コンパンディング指数を示す、ステップと、
前記圧縮されたオーディオ信号の中のコンテンツの第1フレームが第1指示子と関連付けられること、及び前記圧縮されたオーディオ信号の中の前記コンテンツの第2フレームが第2指示子と関連付けられること、を決定するステップと、
前記デコーダ装置により、前記第1指示子及び前記第2指示子に基づき、第1コンパンディング指数が前記コンテンツの前記第1フレームを伸長するために使用されるべきであること、及び第2コンパンディング指数が前記コンテンツの前記第2フレームを伸長するために使用されるべきであること、を決定するステップと、
前記圧縮されたオーディオ信号に対して前記コンパンディングの伸長動作を実行するステップであって、前記第1コンパンディング指数から導出された第1の程度のダイナミックレンジ伸長に従い、前記圧縮されたオーディオ信号の前記コンテンツの前記第1フレームを伸長することと、前記第2コンパンディング指数から導出された第2の程度のダイナミックレンジ伸長に従い前記圧縮されたオーディオ信号の前記コンテンツの前記第2フレームを伸長することと、を含むステップと、
前記伸長したオーディオ信号を出力装置に提供するステップと、を含む方法。
1つ以上のプロセッサと、
命令を格納する非一時的コンピュータ可読記憶媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、EEE1〜14のいずれか一項に記載の動作を実行させる、非一時的コンピュータ可読記憶媒体と、
を含む機器。
Claims (23)
- オーディオ信号を処理する方法であって、
オーディオ信号を受信するステップと、
前記オーディオ信号の時間セグメントについて、前記オーディオ信号の前記時間セグメントが粗過渡信号又は密過渡信号を含むかどうかを決定するために、前記オーディオ信号の前記時間セグメントを分析するステップと、
前記決定の結果に基づき、前記オーディオ信号の前記時間セグメントをコンパンディングするステップと、
前記オーディオ信号の前記コンパンディングした時間セグメントを出力するステップと、
を含み、
前記オーディオ信号の前記時間セグメントをコンパンディングする前記ステップは、コンパンディング指数に基づき、前記オーディオ信号の前記時間セグメントのダイナミックレンジを圧縮又は伸長するステップを含み、
前記オーディオ信号の前記時間セグメントが前記粗過渡信号を含むと決定された場合、第1コンパンディング指数が前記コンパンディングするステップで使用され、
前記オーディオ信号の前記時間セグメントが前記密過渡信号を含むと決定された場合、前記第1コンパンディング指数と異なる第2コンパンディング指数が前記コンパンディングするステップで使用される、方法。 - 前記粗過渡信号は、第1過渡イベント密度を有する過渡イベントを含み、前記密過渡信号は、前記第1過渡イベント密度より高い第2過渡イベント密度を有する過渡イベントを含む、請求項1に記載の方法。
- 前記粗過渡信号は、所定の閾値より低い第1過渡イベント密度を有する過渡イベントを含み、前記密過渡信号は、前記所定の閾値より高い第2過渡イベント密度を有する過渡イベントを含む、請求項1に記載の方法。
- 前記粗過渡信号は、拍手、雨、又はパチパチという火、のうちの少なくとも1つに関連する、請求項1〜3のいずれか一項に記載の方法。
- 前記第2コンパンディング指数は、前記第1コンパンディング指数より高い程度のダイナミックレンジ圧縮又は伸長に対応する、請求項1〜4のいずれか一項に記載の方法。
- 前記第2コンパンディング指数は、前記第1コンパンディング指数より値が低い、請求項1〜5のいずれか一項に記載の方法。
- 前記オーディオ信号の前記時間セグメントをコンパンディングする際に使用された前記コンパンディング指数の指示を生成し出力するステップ、を更に含む請求項1〜6のいずれか一項に記載の方法。
- オーディオ信号を処理する方法であって、前記方法は、
オーディオ信号を受信するステップと、
前記オーディオ信号の時間セグメント毎に、それぞれの前記時間セグメントの中の前記オーディオ信号のコンテンツに基づき、それぞれのコンパンディング指数を決定するステップであって、各コンパンディング指数は、それぞれの前記時間セグメントのダイナミックレンジの圧縮又は伸長のそれぞれの程度に対応し、前記決定するステップは、
粗過渡信号を含むと決定された前記オーディオ信号の全部の時間セグメントで構成される第1時間セグメントセットに、第1コンパンディング指数を割り当てるステップと、
密過渡信号を含むと決定された前記オーディオ信号の全部の時間セグメントで構成される第2時間セグメントセットに、前記第1コンパンディング指数と異なる第2コンパンディング指数を割り当てるステップと、を含む、ステップと、
前記オーディオ信号にコンパンディング操作を適用するステップであって、前記第1コンパンディング指数に従い前記第1時間セグメントセットを圧縮するステップと、前記第2コンパンディング指数に従い前記第2時間セグメントセットを圧縮するステップと、を含むステップと、
前記圧縮されたオーディオ信号をコアエンコーダに提供するステップと、
前記圧縮されたオーディオ信号に関連付けられたビットストリームに、前記第1コンパンディング指数および前記第2コンパンディング指数のそれぞれの指示を提供するステップと、
を含む方法。 - 前記第1コンパンディング指数は、前記第2コンパンディング指数より値が高い、請求項8のいずれか一項に記載の方法。
- 前記コンパンディング指数は、前記コンパンディングするステップで使用されるダイナミックレンジの圧縮の程度を制御し、低い値の前記コンパンディング指数ほど、高い程度のダイナミックレンジの圧縮に対応する、請求項8又は9に記載の方法。
- 前記粗過渡信号は、第1過渡イベント密度を有する過渡イベントを含み、前記密過渡信号は、前記第1過渡イベント密度より高い第2過渡イベント密度を有する過渡イベントを含む、請求項8〜10のいずれか一項に記載の方法。
- 前記粗過渡信号は、所定の閾値より低い第1過渡イベント密度を有する過渡イベントを含み、前記密過渡信号は、前記所定の閾値より高い第2過渡イベント密度を有する過渡イベントを含む、請求項8〜10のいずれか一項に記載の方法。
- 前記粗過渡信号は、拍手、雨、又はパチパチという火、のうちの少なくとも1つに関連する、請求項8〜12のいずれか一項に記載の方法。
- 各指示子は、前記オーディオ信号の時間セグメント毎にそれぞれの指示子ビットを含む、請求項8〜13のいずれか一項に記載の方法。
- 各指示子は、コンパンディングがオンかオフかを示す、時間セグメント毎のそれぞれの第2指示子ビットを含む、請求項14に記載の方法。
- 各指示子は、少なくとも2つの指示子ビットを含み、前記少なくとも2つの指示子ビットは、コンパンディングの少なくとも4個の状態を示し、前記4個の状態の各々は、前記オーディオ信号のそれぞれの前記時間セグメントのそれぞれのコンテンツのタイプに対応する、請求項14又は15に記載の方法。
- オーディオ信号を復号する方法であって、
オーディオ信号の時間セグメント毎に、少なくとも1つの関連付けられた指示子と一緒に前記オーディオ信号を受信するステップであって、各々の少なくとも1つの関連付けられた指示子は、符号化の前のコンパンディング操作の間に前記オーディオ信号のそれぞれの前記時間セグメントに適用された圧縮又は伸長の程度に対応するそれぞれのコンパンディング指数を示す、ステップと、
第1指示子に関連付けられた前記オーディオ信号の全部の時間セグメントで構成される第1時間セグメントセットを決定し、及び第2指示子に関連付けられた前記オーディオ信号の全部の時間セグメントで構成される第2時間セグメントセットを決定するステップと、
前記オーディオ信号の時間セグメント毎に、それぞれの前記時間セグメントについて伸長操作で使用するためのそれぞれのコンパンディング指数を決定するステップであって、第1コンパンディング指数が前記第1時間セグメントセットのために使用されるべきであり、第2コンパンディング指数が前記第2時間セグメントセットのために使用されるべきであると決定され、前記第1コンパンディング指数は前記第2コンパンディング指数と異なる、ステップと、
前記オーディオ信号に伸長操作を適用するステップであって、前記第1コンパンディング指数から導出したダイナミックレンジ伸長の第1の程度に従い前記第1時間セグメントセットを伸長するステップと、前記第2コンパンディング指数から導出したダイナミックレンジ伸長の第2の程度に従い前記第2時間セグメントセットを伸長するステップと、を含むステップと、
前記伸長したオーディオ信号を出力するステップと、
を含む方法。 - 各指示子は、前記受信したオーディオ信号の中のそれぞれのチャネル又はオブジェクトに対応する、請求項17に記載の方法。
- 各指示子は、前記受信したオーディオ信号に関連付けられたメタデータの中のコンパンディング制御データ構造の中に1ビット値を含む、請求項17又は18に記載の方法。
- 各指示子は、種々のコンパンディング指数を示すよう構成されるコンパンディング状態データの少なくとも2つのビットを含み、前記少なくとも2つのビットはコンパンディングの少なくとも4個の状態に対応し、該状態の各々は前記オーディオ信号のコンテンツのそれぞれの過渡タイプに対応する、請求項19に記載の方法。
- 前記伸長されたオーディオ信号は、記憶装置、ストリーミングサーバ、オーディオプロセッサ、又は増幅器、のうちの少なくとも1つに出力される、請求項17〜20のいずれか一項に記載の方法。
- 機器であって、
1つ以上のプロセッサと、
命令を格納する非一時的コンピュータ可読記憶媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、請求項1〜21のいずれか一項に記載の動作を実行させる、非一時的コンピュータ可読記憶媒体と、
を含む機器。 - 命令を格納する非一時的コンピュータ可読記憶媒体であって、前記命令は、1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、請求項1〜21のいずれか一項に記載の動作を実行させる、非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862720447P | 2018-08-21 | 2018-08-21 | |
US62/720,447 | 2018-08-21 | ||
PCT/EP2019/072377 WO2020039000A1 (en) | 2018-08-21 | 2019-08-21 | Coding dense transient events with companding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021535426A true JP2021535426A (ja) | 2021-12-16 |
JP7447085B2 JP7447085B2 (ja) | 2024-03-11 |
Family
ID=67902492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021509742A Active JP7447085B2 (ja) | 2018-08-21 | 2019-08-21 | コンパンディングによる密過渡イベントの符号化 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11830507B2 (ja) |
EP (1) | EP3841572A1 (ja) |
JP (1) | JP7447085B2 (ja) |
CN (1) | CN112771610B (ja) |
WO (1) | WO2020039000A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY197063A (en) * | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016510439A (ja) * | 2013-04-05 | 2016-04-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
WO2017080835A1 (en) * | 2015-11-10 | 2017-05-18 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
WO2017140600A1 (en) * | 2016-02-17 | 2017-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0394976B1 (en) * | 1989-04-27 | 1995-11-29 | Matsushita Electric Industrial Co., Ltd. | Data companding method and data compressor/expander |
JP3508146B2 (ja) * | 1992-09-11 | 2004-03-22 | ソニー株式会社 | ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置 |
US6675125B2 (en) | 1999-11-29 | 2004-01-06 | Syfx | Statistics generator system and method |
EP1289158A1 (en) * | 2001-08-24 | 2003-03-05 | Sony International (Europe) GmbH | Method for noise reduction of a FM signal |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
WO2005096273A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Ameliorations apportees a un procede et un dispositif de codage/decodage audio |
US7587254B2 (en) | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
DE102004052296A1 (de) * | 2004-10-27 | 2006-05-04 | Sennheiser Electronic Gmbh & Co. Kg | Sender und Empfänger für ein drahtloses Audio-Übertragungssystem |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
CN101105940A (zh) * | 2007-06-27 | 2008-01-16 | 北京中星微电子有限公司 | 音频编解码的量化方法、反变换方法及音频编解码装置 |
US9276602B1 (en) | 2009-12-16 | 2016-03-01 | Syntropy Systems, Llc | Conversion of a discrete-time quantized signal into a continuous-time, continuously variable signal |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
US8392201B2 (en) | 2010-07-30 | 2013-03-05 | Deutsche Telekom Ag | Method and system for distributed audio transcoding in peer-to-peer systems |
JP6441796B2 (ja) | 2012-08-06 | 2018-12-19 | ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル | マルチバンドの音声圧縮システムと方法 |
US10134403B2 (en) * | 2014-05-16 | 2018-11-20 | Qualcomm Incorporated | Crossfading between higher order ambisonic signals |
CA3179080A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
-
2019
- 2019-08-21 US US17/270,035 patent/US11830507B2/en active Active
- 2019-08-21 WO PCT/EP2019/072377 patent/WO2020039000A1/en active Search and Examination
- 2019-08-21 CN CN201980062591.6A patent/CN112771610B/zh active Active
- 2019-08-21 EP EP19765664.8A patent/EP3841572A1/en active Pending
- 2019-08-21 JP JP2021509742A patent/JP7447085B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016510439A (ja) * | 2013-04-05 | 2016-04-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
WO2017080835A1 (en) * | 2015-11-10 | 2017-05-18 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
WO2017140600A1 (en) * | 2016-02-17 | 2017-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
Also Published As
Publication number | Publication date |
---|---|
CN112771610A (zh) | 2021-05-07 |
CN112771610B (zh) | 2024-08-30 |
US20220270624A1 (en) | 2022-08-25 |
US11830507B2 (en) | 2023-11-28 |
EP3841572A1 (en) | 2021-06-30 |
JP7447085B2 (ja) | 2024-03-11 |
WO2020039000A1 (en) | 2020-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11423923B2 (en) | Companding system and method to reduce quantization noise using advanced spectral extension | |
US10861475B2 (en) | Signal-dependent companding system and method to reduce quantization noise | |
JP7447085B2 (ja) | コンパンディングによる密過渡イベントの符号化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20210415 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7447085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |