JP7273218B2 - 信号生成システム及び信号生成方法 - Google Patents
信号生成システム及び信号生成方法 Download PDFInfo
- Publication number
- JP7273218B2 JP7273218B2 JP2022058101A JP2022058101A JP7273218B2 JP 7273218 B2 JP7273218 B2 JP 7273218B2 JP 2022058101 A JP2022058101 A JP 2022058101A JP 2022058101 A JP2022058101 A JP 2022058101A JP 7273218 B2 JP7273218 B2 JP 7273218B2
- Authority
- JP
- Japan
- Prior art keywords
- samples
- subband
- input
- signal
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 78
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 title description 58
- 238000004458 analytical method Methods 0.000 claims description 185
- 238000012545 processing Methods 0.000 claims description 148
- 230000017105 transposition Effects 0.000 claims description 105
- 239000000523 sample Substances 0.000 claims description 71
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 24
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 claims description 24
- 239000002131 composite material Substances 0.000 claims description 18
- 239000000538 analytical sample Substances 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 description 88
- 238000003786 synthesis reaction Methods 0.000 description 88
- 238000012937 correction Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000000605 extraction Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 11
- 239000011295 pitch Substances 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- DNTFEAHNXKUSKQ-RFZPGFLSSA-N (1r,2r)-2-aminocyclopentane-1-sulfonic acid Chemical compound N[C@@H]1CCC[C@H]1S(O)(=O)=O DNTFEAHNXKUSKQ-RFZPGFLSSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004886 process control Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Superconductors And Manufacturing Methods Therefor (AREA)
- Golf Clubs (AREA)
- Vibration Dampers (AREA)
- Complex Calculations (AREA)
- Selective Calling Equipment (AREA)
Description
本発明はディジタル効果プロセッサにおける高周波再構成(high-frequency reconstruction:HFR)のための高調波トランスポジション方法を用いるオーディオソース符号化システムに関連し、ディジタル効果プロセッサは、例えば、生じた高調波歪を処理される信号の輝度に導入してしまうエキサイタや、維持されるスペクトルコンテンツと共に信号継続時間を延ばす時間伸縮器又は時間伸張器等である。
特許文献1では、オーディオ信号の低周波バンドから高周波バンドを構築するための方法として、トランスポジション(transposition)の概念が説明されている。オーディオ符号化にこの概念を使用することで、かなりのビットレートを節約できる。HFRに基づくオーディオ符号化システムの場合、狭い帯域幅の信号がコア波形符号器に与えられ、非常に低いビットレートの付加的なサイド情報(復号器側のターゲットスペクトル波形を記述する情報)及びトランスポジションを用いて、より高い周波数が再構築される。ビットレートが低い場合、コアの符号化信号の帯域幅が狭く、知覚的に心地よいハイバンド(high band)を再構築することが益々重要になりつつある。特許文献1に開示されているハーモニックトランスポジション(harmonic transposition)は、クロスオーバ周波数(cross over frequency)が低い状況における複雑な音楽信号に対して非常に良好に機能する。ハーモニックトランスポジション又は高調波トランスポジションの原理は、周波数がωの正弦波を周波数がQφωの正弦波に対応付ける又はマッピングすることであり、Qφ>1はトランスポジションの次数を決める整数である。これに対して、単一側波帯変調(single sideband modulation:SSB)に基づくHFRは、周波数がωの正弦波を周波数がω+Δωの正弦波に対応付け、Δωは一定の周波数偏移又は周波数シフトである。低帯域幅のコア信号の場合、SSBトランスポジションに起因して不快な共鳴アーチファクト(ringing artifact)が生じてしまう。
可能な最良のオーディオ品質を達成するために、最新の高品質HFR法は、必要なオーディオ品質を得るための大きなオーバーサンプリング度と非常に細かい周波数分解能と共に、複素変調周波数バンクを使用している。細かい分解能は、正弦波の合成に伴う非線形性から生じる不要な相互変調歪を回避するために必要である。十分に狭いサブバンドの場合、高品質な方法は、サブバンド各々においてせいぜい1つの正弦波を有することを意図している。時間的なオーバーサンプリングの度合いが大きいことは、エイリアス的な歪みを回避するのに必要であり、過渡的な信号のプリエコー(pre-echoes)を回避するには周波数方向にもある程度のオーバーサンプリング度が必要である。明らかにこの場合の欠点は演算負担が非常に重くなってしまうことである。
ハーモニックトランスポジションに関連する別の一般的な欠点は、顕著な周期構造を有する信号の場合に明らかになる。そのような信号は周波数Ω、2Ω、3Ω、...のような高調波の重ね合わせであり、Ωは基本周波数(fundamental frequency)である。次数がQφであるハーモニックトランスポジションの場合、出力の正弦波群はQφΩ、2QφΩ、3QφΩ、...の周波数を有し、Qφ>1の場合、それらは所望の完全な高調波群のうちの一部分となる。結果的なオーディオ品質の観点からは、トランスポーズの基本周波数QφΩに対応する「ゴースト(ghost)」ピッチが知覚されるのが一般的である。しばしばハーモニックトランスポジションは符号化され復号されるオーディオ信号に「金属的な」音質(“metallic”sounding character)を導入してしまう。
本願のリファレンスに組み入れられる特許文献2においては、高品質トランスポジションの場合に生じるゴーストピッチの問題に対処するために、相互積(cross products)の方法が改善されている。高い忠実度と共にトランスポーズされる信号の支配的な高調波部分の基本周波数値に関する全部又は一部の情報を送信することで、少なくとも2つの異なる分析サブバンドの非線形結合と共に、非線形サブバンドの修正が補足される。その結果、トランスポーズされた出力において欠落した部分が再構築されるが、相当な演算コストを招いてしまう。
既存の利用可能なHFR方式についての上記の欠点に鑑みて、本発明の課題は、改善されたよりいっそう効果的な相互積HFR方式を提供することである。特に、本発明の課題は、既存の方式と比較して少ない演算負担で優れたオーディオ再生を可能にする方法を提供することである。
本発明は特許請求の範囲に記載された発明により上記の課題の少なくとも1つを軽減又は解消する。
開示される発明による信号処理システムは、
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システムである。
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システムである。
<発明の概要>
開示される発明の第1の実施形態による信号生成システムは、
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システムである。
開示される発明の第1の実施形態による信号生成システムは、
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システムである。
開示される発明の第2の実施形態による信号生成方法は、
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成方法であって、
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、前記分析サブバンド信号の各々は、位相及び振幅を有する複素分析サンプルを複数個有する、ステップと、
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは分析サブバンド信号の前記複数の複素分析サンプルから抽出され、前記フレームの長さはLである、ステップと、
L個の入力サンプルの後続のフレームを導出する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームのシーケンスを生成するステップと、
入力サンプルのY個の対応するフレームに基づいて、前記フレームの処理サンプル各々について位相及び振幅を判定することで、処理サンプルのフレームを生成し、少なくとも1つの処理されるフレームについて、i)前記処理サンプルの位相が、入力サンプルのY個のフレーム各々における対応する入力サンプルの位相各々に基づいており、ii)前記処理サンプルの振幅が、入力サンプルのY個のフレーム各々における対応する入力サンプルの振幅各々に基づいている、ステップと、
処理サンプルのフレームのシーケンスの中のサンプルをオーバーラップさせながら加算することで、合成サブバンド信号を決定するステップと、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成するステップと
を有する信号生成方法である。
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成方法であって、
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、前記分析サブバンド信号の各々は、位相及び振幅を有する複素分析サンプルを複数個有する、ステップと、
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは分析サブバンド信号の前記複数の複素分析サンプルから抽出され、前記フレームの長さはLである、ステップと、
L個の入力サンプルの後続のフレームを導出する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームのシーケンスを生成するステップと、
入力サンプルのY個の対応するフレームに基づいて、前記フレームの処理サンプル各々について位相及び振幅を判定することで、処理サンプルのフレームを生成し、少なくとも1つの処理されるフレームについて、i)前記処理サンプルの位相が、入力サンプルのY個のフレーム各々における対応する入力サンプルの位相各々に基づいており、ii)前記処理サンプルの振幅が、入力サンプルのY個のフレーム各々における対応する入力サンプルの振幅各々に基づいている、ステップと、
処理サンプルのフレームのシーケンスの中のサンプルをオーバーラップさせながら加算することで、合成サブバンド信号を決定するステップと、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成するステップと
を有する信号生成方法である。
この場合において、Yは1より大きな任意の整数である。第1の実施形態による信号生成システムは少なくともY=2の場合に上記方法を実行する。
開示される発明の第3の実施形態は、第2の実施形態による信号生成方法をプログラム可能なコンピュータに実行させるソフトウェア命令を有するコンピュータプログラム又はソフトウェアである。
開示される発明の第4の実施形態は、第2の実施形態による信号生成方法をプログラム可能なコンピュータに実行させるソフトウェア命令を記憶する記憶媒体(又はデータキャリア)である。
本発明は、データが複素サブバンドサンプルのブロックで配置され処理される場合に、改善された相互積HFRの一般概念が優れた結果をもたらすという認識に基づいている。とりわけ、フレーム毎の位相オフセットをサンプルに適用することを可能にする。振幅又は大きさ(magnitude)の調整も可能にし、これも同様な恩恵をもたらす。本発明による改善された相互積HFR(cross-product enhanced HFR)の実施形態はサブバンドブロック方式のハーモニックトランスポジション(harmonic transposition)を行い、相互変調(inter-modulation)を顕著に削減できる。従って、優れた出力品質を維持しつつ、周波数分解能が粗い及び/又はオーバーサンプリングの度合いが少ないフィルタバンク(例えば、QMFフィルタバンク)を使用できる。サブバンドブロック方式の処理の場合、複素サブバンドサンプルの時間ブロックが共通の位相修正値と共に処理され、出力サブバンドサンプルを形成する複数の修正されたサンプルの重ね合わせにより、相互変調積を削減する効果が得られ、入力サブバンド信号が複数の正弦波から成る場合において、本発明が使用されなかったならば相互変調積が生じてしまう。ブロックに基づくトランスポジションは、高い分解能のトランスポーザの場合よりも非常に軽い演算負担で済み、多くの信号についてほとんど同じ高品質を達成できる。
本説明の便宜上、実施形態において、Y≧2であり、非線形処理部が入力サンプルのうち「対応する」Y個のフレームを入力として使用し、これはフレーム同士が同期している又はほぼ同期していることを意味する点に留意を要する。例えば、個々のフレーム内のサンプルは、フレーム間で多くの時間的なオーバーラップ(又は重複又は重なり)を有する時間間隔に関連している。「対応する(corresponding)」という言葉はそれらが同期している又は近似的にそうであることを示すように使用されている。更に、「フレーム」という言葉は「ブロック」と可換に使用されてよい。従って、「ブロックホップサイズ(block hop size)」は、フレーム長(ダウンサンプリングが行われる場合はダウンサンプリングに合わせてある)に等しい或いはそのフレーム長より短くてもよく(ダウンサンプリングが行われる場合はダウンサンプリングに合わせてある)、それは入力サンプルが1つより多い数のフレームに所属していてよいことを意味する。入力サンプルのY個全ての対応するフレームの位相及び振幅に基づいて位相及び振幅を決定することで、本システムはフレームにおいて処理されたサンプル(処理サンプル)を全て生成する必要はなく;本発明から逸脱することなく、本システムは、より少ない数の対応する入力サンプルに基づいて又は唯1つのサンプルのみに基づいて、幾つかの処理サンプルの位相及び/又は振幅を生成してもよい。
一実施形態において、分析フィルタバンクは、任意の数のタップ及びポイントを備えた直交ミラーフィルタ(quadrature mirror filter:QMF)バンク又は疑似QMFバンクである。それは例えば64ポイントのQMFバンクであってもよい。分析フィルタバンクは、窓関数をかけた離散フーリエ変換(windowed discrete Fourier transform)又はウェーブレット変換等のクラスから選択されてもよい。有利なことに、合成フィルタバンクは逆QMFバンク、逆疑似QMFバンク等による分析フィルタバンクに一致する。そのようなフィルタは、比較的粗い周波数分解能及び/又は比較的低いオーバーサンプリング度を有してよいことが知られている。従来技術とは異なり、本発明は、出力の劣化の影響を被ることなく、そのような比較的簡易な構成要素を用いて実現でき、そのような本発明の実施形態は従来技術よりも優れた経済性を示す。
一実施形態では、分析フィルタバンクについて以下の内の1つ以上が成り立つ:
●分析時間進行幅がΔtAである;
●分析周波数間隔がΔfAである;
●分析フィルタバンクはN>1個の分析サブバンドを有し、分析サブバンドはn=0,...,N-1という分析サブバンドインデックスにより指定される;
●分析サブバンドは入力信号の周波数帯域に関連付けられている。
●分析時間進行幅がΔtAである;
●分析周波数間隔がΔfAである;
●分析フィルタバンクはN>1個の分析サブバンドを有し、分析サブバンドはn=0,...,N-1という分析サブバンドインデックスにより指定される;
●分析サブバンドは入力信号の周波数帯域に関連付けられている。
一実施形態では、合成フィルタバンクについて以下の内の1つ以上が成り立つ:
●合成時間進行幅がΔtsである;
●合成周波数間隔がΔfsである;
●合成フィルタバンクはM>1個の合成サブバンドを有し、合成サブバンドはm=0,...,M-1という合成サブバンドインデックスにより指定される;
●合成サブバンドは時間伸張信号(time stretched signal)及び/又は周波数トランスポーズド信号(frequency transposed signal)に関連付けられている。
●合成時間進行幅がΔtsである;
●合成周波数間隔がΔfsである;
●合成フィルタバンクはM>1個の合成サブバンドを有し、合成サブバンドはm=0,...,M-1という合成サブバンドインデックスにより指定される;
●合成サブバンドは時間伸張信号(time stretched signal)及び/又は周波数トランスポーズド信号(frequency transposed signal)に関連付けられている。
一実施形態において、非線形処理部が入力された2つのフレーム(Y=2)に適用され、処理されるフレームをなす1フレームを生成し、サブバンド処理部はクロス処理制御データ(cross processing control data)を生成するクロス処理制御部を含む。サブバンド処理の質的及び/又は量的な性質を明確にすることで、本発明は柔軟性及び適用可能性を大きくできる。制御データは、周波数軸上で入力信号の基本周波数だけ異なるサブバンドを指定する(例えば、インデックスで指定される)。言い換えれば、サブバンドを指定するインデックスは、そのような基本周波数を分析周波数間隔で除算した比率を近似する整数の分だけ異なっていてもよい。ハーモニックトランスポジションにより生成される新たなスペクトル成分が自然に生じる高調波に匹敵するようになるので、これは心理的に心地の良い音響出力をもたらす。
上記の実施形態に対する更なる改善例によれば、(入力)分析及び(出力)合成サブバンドインデックスが、後述の数式(16)を満足するように選択される。その数式に登場するパラメータσは奇数番毎及び偶数番毎に蓄積されたフィルタバンク双方に適用可能にする。サブバンドインデックスが数式(16)に対する近似的な解(例えば、最小二乗誤差)として指定されている場合、ハーモニックトランスポジションにより得られた新たなスペクトル成分は、自然の倍音系列(series of natural harmonics)に匹敵するようになる。従って、HFRは、除去された高周波成分を持たせた、元々の信号の忠実な再構築信号をもたらす。
上記の実施形態に対する更なる改善例によれば、数式(16)に登場しかつ相互積トランスポジション(cross-product transposition)の次数を表すパラメータrを選択する方法が提供される。所与の出力サブバンドインデックスmに関し、トランスポジション次数rの値各々は2つの分析サブバンドインデックスn1、n2を決定する。更に改善されたこの実施形態は、多数のrの選択肢について2つのサブバンドの大きさ又は振幅を評価し、2つの分析サブバンドの振幅のうち小さい方を最大化する値を選択する。インデックスを選択するこの方法は、入力信号のうち微弱な成分(貧弱な出力品質を招く)を増幅することで、多数の振幅を復元する必要性を排除できる。この点に関し、サブバンドの大きさ又は振幅は、いわば既知の方法で計算され、例えばフレーム(ブロック)又はフレームの一部を形成する入力サンプルの二乗平方根により計算されてもよい。サブバンドの大きさ又は振幅は、フレーム内の中央のサンプル又は中央付近のサンプルの振幅として算出されてもよい。そのような計算は簡易に適切な振幅の測定値をもたらす。
上記の実施形態に対する更なる改善例によれば、分析サブバンドは、ダイレクト処理及び相互積に基づく処理の双方に従ってハーモニックトランスポジションインスタンス(harmonic transposition instance)からの寄与を受ける。この点に関し、相互積に基づく処理により欠落した部分を再生する特定の可能性が使用されるか否かを判定する判断基準が適用される。例えば、本改善例は、以下の条件(a)-(c)のうちの何れかが満たされた場合に、1つ以上のクロスサブバンド処理部を用いることを控えるように形成されてもよい。
(a)の条件は、合成サブバンドをもたらすダイレクトソース項の分析サブバンド(direct source term analysis subband)の振幅MSと合成サブバンドをもたらすクロスソース項(cross source term)の最適ペアにおける最小振幅値MCとの比率が、所定値qより大きいことであり、
(b)の条件は、合成サブバンドがダイレクト処理部から大きな寄与を受けることであり、
(c)の条件は、基本周波数Ω0が分析フィルタバンクの間隔ΔfAより小さいことである。
(b)の条件は、合成サブバンドがダイレクト処理部から大きな寄与を受けることであり、
(c)の条件は、基本周波数Ω0が分析フィルタバンクの間隔ΔfAより小さいことである。
一実施形態では、本発明は入力信号のダウンサンプリング又はデシメーション(decimation)を行ってもよい。実際、ブロック抽出部によって行われるように、入力サンプルのフレームの1つ以上が、サブバンド内の複素分析サンプルをダウンサンプリングすることで決定されてもよい。
上記の実施形態に対する更なる改善例によれば、適用されるダウンサンプリング因子が、後述する数式(15)を満足する。ダウンサンプリング因子の全てがゼロであることは許容されず、全てがゼロである場合は自明な又は有意義でない場合に対応する。数式(15)は、ダウンサンプリング因子D1及びD2、サブバンド伸縮因子S、及びサブバンドトランスポジション因子Qの関係を規定しているだけでなく、更には処理されるサンプル(処理サンプル)の位相を決定する数式(13)に登場する位相係数T1及びT2との間の関係も規定している。これは、処理されるサンプルの位相と、処理されるサンプルが付加される入力信号の他の成分とが合うことを保証する。
一実施形態では、処理されるフレーム群が重ねられ加算される(オーバーラップ加算される)前に、処理されるサンプルのフレーム群に窓関数が適用される(ウィンドウ処理される)。ウィンドウ処理部は、処理されるサンプルのフレーム群について有限長の窓関数を適用する。適切な窓関数は出願時の特許請求の範囲に規定されている。
発明者等は、特許文献2に記載されているタイプの相互積法が、サブバンドブロックに基づく処理方式に当初から完全には合わないことを認識した。そのような方法は或るブロックの何れかのサブバンドサンプルには申し分なく適用されるかもしれないが、ブロック内の他のサンプルにまで直接的に拡張するとエイリアシングアーチファクトを招いてしまう。このため、一実施形態では、(複素ウェイトで重み付けされ、ホップサイズの分だけシフトされる場合に)実質的に一定のシーケンスに合うウィンドウサンプルを含む窓関数が適用される。ホップサイズは、ブロックホップサイズh及びサブバンド伸張因子Sの積であってもよい。そのような窓関数を使用すると、エイリアシングアーチファクトを顕著に減らすことができる。代替的又は追加的に、そのような窓関数は、処理されるサンプルの位相回転のような他の量に関するアーチファクトも削減する。
好ましくは、ウィンドウサンプルに関する状態を評価するために適用される一連の複素ウェイト又は複素重み係数群は、一定の位相回転角だけ異なっている。更に好ましくは、その一定の位相回転角が、入力信号の基本周波数に比例している。位相回転角は、(適用される相互積トランスポジションの次数)及び/又は(ダウンサンプリング因子の相違)及び/又は(分析時間進行幅)に比例してもよい。位相回転角は、少なくとも近似的な意味において、方程式(21)により与えられてもよい。
一実施形態による本発明は基本周波数パラメータに応じて合成ウィンドウ処理を変更することで改善された相互積ハーモニックトランスポジション(cross-product enhanced harmonic transposition)を可能にする。
一実施形態では、処理されるサンプルの一連のフレームが、或る程度のオーバーラップ度又は重なり度で加えられる。適切なオーバーラップを行うため、処理されるフレームに属するフレームは、サブバンド伸縮因子Sによりアップスケール又は伸張されたブロックサイズhであるホップサイズの分だけ適切にシフトされる(ずらされる)。入力サンプルに属する一連のフレームのオーバーラップがL-hであった場合、処理されるサンプルに属する連続的なフレームのオーバーラップはS(L-h)になる。
一実施形態による本発明によるシステムは、Y=2の入力サンプルに基づいて処理サンプルを生成するだけでなく、Y=1サンプルのみに基づいてもよい。すなわち、システムは、相互積方式(例えば、数式(13)等)によるだけでなく、ダイレクトサブバンド方式(例えば、数式(5)や(11)等)によっても、欠落した部分を復元又は再生できる。好ましくは、制御部がシステムの動作を制御し、その制御は、特定の欠落した部分を復元するために何れの方式を使用すべきかを指定することも含む。
上記の実施形態に対する更なる改善例によるシステムは、3つより多いサンプルに基づいて処理サンプルを生成する(すなわち、Y≧3)。例えば、処理されるサンプルは、処理サンプルに寄与する相互積に基づく複数のハーモニックトランスポジション、複数のダイレクトサブバンド処理、或いは相互積トランスポジション及びダイレクトトランスポジションの組み合わせにより取得されてもよい。トランスポジション法を適用するこの方法は協力で融通の利くHFRをもたらす。すなわち実施の形態はY=3,4,5等に関する第2の実施形態による方法を実行するように動作可能である。
一実施形態では、処理されるサンプルを振幅を有する複素数として判定し、その振幅は対応する入力サンプル各々の振幅値の平均値である。平均値は、2つ以上のサンプルに関する、(重み付けされた)算術平均でもよいし、(重み付けされた)幾何平均値でもよいし、或いは(重み付けされた)調和平均値でもよい。Y=2の場合、平均値は2つの複素入力サンプルに基づく。好ましくは、処理サンプルの振幅が重み付けされた幾何平均値である。より好ましくは、幾何平均値が、数式(13)に示されているようなパラメータρ及び1-ρにより重み付けされている。この場合において、幾何平均の重み付けパラメータρは、サブバンドトランスポジション因子Qに逆比例又は反比例する実数である。パラメータρは伸縮因子Sに逆比例又は反比例してもよい。
一実施形態におけるシステムは位相を有する複素数として処理サンプルを決定し、その位相は入力サンプルのフレームにおける対応する入力サンプル各自の位相の線形結合である。特に、その線形結合は2つの入力サンプル(Y=2)に関連する位相であってもよい。2つの位相の線形結合はゼロでない整数係数を使用してもよく、それらの合計は伸縮因子Sにサブバンドトランスポジション因子Qを乗じたものに等しい。或いは、そのような線形結合で得られた位相は、一定の位相補正パラメータにより更に調整されてもよい。処理サンプルの位相は数式(13)によって与えられてもよい。
一実施形態では、ブロック抽出部(又は本発明による方法における対応するステップ)は、分析サブバンド信号中の2つ以上の分析サンプルを補間し、フレーム(ブロック)に含まれることになる1つの入力サンプルを取得してもよい。そのような補間は非整数因子による入力信号のダウンミキシング(downmixing)を可能にする。補間された分析サンプルは連続的であってもなくてもよい。
一実施形態では、サブバンド処理の構成は、処理を制御する外部の手段から提供される制御データにより制御されてもよい。制御データは入力信号のその時点での音響特性に関連する。例えば、信号のその時点での音響特性(例えば、信号における(支配的な)基本周波数)を決定する手段を、システム自体が有していてもよい。基本周波数の情報は、処理サンプルを取得する元になる分析サブバンドを選択する際の基準又はガイド(guidance)となる。好ましくは、分析サブバンドの間隔は入力信号のそのような基本周波数に比例する。代替例として、制御データがシステム外部から提供され、好ましくはビットストリームとしてディジタル通信ネットワークを介して通信するのに相応しい符号化フォーマットに制御データが含まれている。制御データに加えて、そのような符号化フォーマットは信号の低周波成分(例えば、図7の701の部分にある周波数成分)に関する情報も含んでいてよい。なお、帯域幅を経済的に使用する観点からは、その符号化フォーマットは高周波成分(図7の702の部分)に関する完全な情報を含んでいないことが好ましい(本発明では低周波成分から高周波成分が再生される)。特に本発明はそのような制御データを受信するのに適した制御データ受信部を備えたデコードシステムを提供し、制御データは、入力信号をエンコードした受信ビットストリームに含まれていてもよいし或いは別個の信号やビットストリームとして受信されてもよい。
一実施形態は本発明による方法で行われる演算を効率的に実行する技法を提供する。その目的のため、ハードウェア実現手段は、処理されるサンプルのフレームが基づいているYフレームの一部にある対応する入力ストリームの振幅を調整し直す(スケーリングし直す)プレノーマライザ又は事前正規化部を有する。そのような再調整の後、処理サンプルは、再調整された入力サンプル又は場合によっては再調整されてない入力サンプルの(重み付けされた)複素積として算出できる。積の中で再調整された因子として登場する入力サンプルは、通常、再調整されてない因子として登場する必要はない。位相補正パラメータθに関する可能性のある例外では、(おそらくはスケーリングし直された)複素入力サンプルの積として数式(13)を計算することが可能である。これは、処理サンプルの振幅及び位相を別々に取り扱うことと比較して演算負担の観点から有利である。
一実施形態においてY=2に設定されたシステムは、入力サンプルの1フレームを形成することを並列的に行う2つのブロック抽出部を有する。
Y≧3の場合の別の実施形態では、システムは複数のサブバンド処理部を有し、複数のサブバンド処理部の各々は、様々なサブバンドトランスポジション因子及び/又は様々なサブバンド伸縮因子及び/又は相互積に基づく或いはダイレクトのものとは異なるトランジション方法を利用して、中間的な合成サブバンド信号を決定する。複数のサブバンド処理部は並列的に設けられて並列的に動作してもよい。この実施形態の場合、システムはサブバンド処理部の下流側であって合成フィルタバンクの上流側に設けられた合成部を更に有する。合成部は、関連する中間的な合成サブバンド信号を(例えば、一緒に合成することで)合成し、合成サブバンド信号を生成する。上述したように、合成される中間的な合成サブバンドは、ダイレクト及び相互積に基づくハーモニックトランスポジション双方により取得されてもよい。一実施形態によるシステムはビットストリームを入力信号に復号するコアデコーダを更に有していてもよい。これは、特にスペクトル整形を実行することで、スペクトルバンド情報を適用するように形成されたHFR処理部を形成する。HFR処理部の動作はビットストリームに符号化されている情報により制御されてもよい。
一実施形態は、例えばレフト(左)、ライト(右)、センター(中央)、サラウンド等のようなZチャネルを形成するステレオフォーマットでオーディオ信号を再生するシステムにおいて、多次元信号のHFRを提供する。複数のチャネルと共に入力信号を処理する一実施形態では、バンド各々についての伸縮因子S及びトランスポジション因子Qはチャネル間で異なるかもしれないが、各チャネルの処理サンプル同じ数の入力サンプルに基づいている。この目的のため、実施形態は、チャネル各々からY個のアナログサブバンド信号を生成する分析フィルタバンクと、Z個のサブバンド信号を生成するサブバンド処理部と、Z個の時間伸縮及び周波数トランスポーズド信号(出力信号を形成する)とを有する。
上記の実施形態に対する変形例では、出力信号が、異なる数の分析サブバンド信号に基づく出力チャネルを有してもよい。例えば、音響的に目立つチャネルのHFRに多くの演算リソースを割り当てることが望ましく、例えば、視聴者の前にあるオーディオソースから再生される複数のチャネルがサラウンド又はそれに近いチャネルとなることが望ましい。
特許請求の範囲で異なる請求項に記載されていたとしても、本発明は上記の特徴の全ての組み合わせに関連することに特に留意を要する。
<図面についての概説>
以下、添付図面を参照しながら、本発明の範囲も精神も限定しない実施の形態を説明する。
以下、添付図面を参照しながら、本発明の範囲も精神も限定しない実施の形態を説明する。
図1はサブバンドブロックに基づくハーモニックトランスポジションの原理を示す。
図2は1つのサブバンド入力に対する非線形サブバンドブロック処理の様子を示す。
図3は2つのサブバンド入力に対する非線形サブバンドブロック処理の様子を示す。
図4は改善された相互積サブバンドブロック(cross product enhanced subband block)に基づくハーモニックトランスポジションの動作を示す。
図5は改善されたHFRオーディオコーダにおいて幾つかの次数のトランスポジションを用いてサブバンドブロックに基づいてトランスポジションを行う応用例を示す。
図6は64バンドQMF分析フィルタバンクを使用する複数次のサブバンドブロックに基づくトランスポジションを行う応用例を示す。
図7は開示されるサブバンドブロックに基づくトランスポジション法の使用結果を説明するための図である。
図8は開示されるサブバンドブロックに基づくトランスポジション法の使用結果を説明するための図である。
図9は図2に示す非線形処理部(前置正規化部及び乗算部を含む)を詳細に示す。
<好適な実施形態についての説明>
以下に説明される実施の形態は、改善された相互積サブバンドブロックに基づくハーモニックトランスポジションに関する本発明の原理を例示しているに過ぎない。本明細書で説明される装置、方法及び具体的な詳細に関する変形例及び修正例は、当業者に明らかであることが、理解されるであろう。従って、本発明は添付の特許請求の範囲によってのみ規定され、明細書及び図面の説明により示される具体的な詳細によっては規定されないことが意図されている。
以下に説明される実施の形態は、改善された相互積サブバンドブロックに基づくハーモニックトランスポジションに関する本発明の原理を例示しているに過ぎない。本明細書で説明される装置、方法及び具体的な詳細に関する変形例及び修正例は、当業者に明らかであることが、理解されるであろう。従って、本発明は添付の特許請求の範囲によってのみ規定され、明細書及び図面の説明により示される具体的な詳細によっては規定されないことが意図されている。
図1はサブバンドブロックに基づくトランスポジション、時間伸縮又は時間伸縮(time stretch)又はトランスポジションと時間伸縮の組み合わせの動作原理を説明するための図である。入力される時間領域信号は分析フィルタバンク101に与えられ、分析フィルタバンク101は複数の複素数値サブバンド信号(複素サブバンド信号)を提供する。それらはサブバンド処理部102に与えられ、サブバンド処理部102の動作は制御データ104により制御される。出力サブバンドの各々は、1つの入力サブバンド又は2つの入力サブバンドを処理することで取得されてもよいし、或いはそのように処理される幾つかのサブバンドの重ね合わせとして取得されてもよい。複数の複素数値出力サブバンド(複素サブバンド信号)は合成フィルタバンク103に与えられ、合成フィルタバンク103は修正された時間領域信号を出力する。選択的な制御データ104は、トランスポーズされる信号に対して行われるサブバンド処理の仕方及びパラメータを示す。改善された相互積トランスポジションの場合、そのデータは支配的な基本周波数に関する情報を含む。
図2はサブバンド入力が1つである場合の非線形サブバンドブロック処理の動作を説明するための図である。物理的な時間伸縮及びトランスポジションのターゲット値(目標値)、及び分析フィルタバンク101や合成フィルタバンク103の物理パラメータを用いて、サブバンド時間伸縮及びトランスポジションのパラメータだけでなく、ソースサブバンドインデックスもターゲットサブバンドインデックス各々について導出する。サブバンドブロック処理の目的は、複素数値のソースサブバンド信号に対応する、トランスポジション、時間伸縮又はトランスポジション及び時間伸縮の組み合わせを実行し、ターゲットのサブバンド信号を生成することである。
ブロック抽出部201は、入力された複素信号から有限数のフレームをサンプリングする。フレームは、入力ポインタ位置及びサブバンドトランスポジション因子によって規定される。このフレームは、処理部202による非線形処理を受け、次にウィンドウ処理部213により有限の可能な可変長のウィンドウ処理が行われる。結果のサンプルはオーバーラップ加算部204において出力サンプルに事前に加えられ、出力フレーム位置は出力ポインタ位置によって規定される。入力ポインタは固定値だけインクリメントされ、出力ポインタはその固定値にサブバンド伸縮因子を乗じた分だけインクリメントされる。この一連の処理の反復により、サブバンドトランスポジション位置によってトランスポーズされた複素周波数と共に、サブバンド伸縮因子に入力サブバンド信号期間を乗算した長さである持続時間の出力信号が生成され、その持続時間は合成ウィンドウの長さ以内である。制御信号104は3つの処理部201、202、203の各々に影響を及ぼす(制御する)。
図3はサブバンド入力が2つである場合の非線形サブバンドブロック処理の動作を説明するための図である。物理的な時間伸縮及びトランスポジションのターゲット値(目標値)、及び分析フィルタバンク101や合成フィルタバンク103の物理パラメータを用いて、サブバンド時間伸縮及びトランスポジションのパラメータだけでなく、ソースサブバンドインデックスもターゲットサブバンドインデックス各々について導出する。非線形サブバンドブロック処理が相互積加算(cross product addition)による欠落した部分を生成するためであった場合、処理部301-1、301-2、302、303の設定だけでなく、2つのソースバンドインデックスの値もクロス処理制御部(cross processing control unit)404の出力403に依存する。サブバンドブロック処理の目的は、2つの複素ソースサブバンド信号についての、対応するトランスポジション、時間伸縮又はトランスポジション及び時間伸縮の組み合わせを実行し、ターゲットのサブバンド信号を生成することである。第1のブロック抽出部301-1は第1の複素ソースバンドから有限の時間フレームのサンプルをサンプリングし、第2のブロック抽出部301-2は第2の複素ソースバンドから有限のフレームのサンプルをサンプリングする。フレームは、共通の入力ポインタ位置及びサブバンドトランスポジション因子によって規定される。この2つのフレームは、302の非線形処理部に進み、その後にウィンドウ処理部303により有限長のウィンドウによるウィンドウ処理が行われる。オーバーラップ加算部204は図2に示されているものと同一又は類似である。この一連の処理の反復により、2つのサブバンド信号のうち長い方(ただし、合成ウィンドウの長さ以内)にサブバンド伸張因子が乗算された長さの持続時間を有する出力信号が制される。2つの入力サブバンド信号が同じ周波数を有していた場合、出力信号はサブバンドトランジション因子によってトランスポーズされた複素周波数を有することになる。2つのサブバンド信号が異なる周波数を有していた場合、トランスポーズド信号において欠落した部分を生成するのに相応しいターゲット周波数を有する出力信号を生成するためにウィンドウ処理部303を使用できる。
図4は、改善された相互積サブバンドブロックに基づく、トランスポジション、時間伸縮、又はトランスポジション及び時間伸縮の組み合わせの原理を説明するための図である。ダイレクトサブバンド処理部(direct sub-band processing unit)401は図2(処理部202)又は図3を参照しながら既に説明されたものであってよい。クロスサブバンド処理部(cross sub-band processing unit)402は図3に示す2つのサブバンド入力に関する非線形サブバンドブロック処理を実行し、出力のターゲットサブバンドが加算部においてダイレクトサブバンド処理部401からのものと加算される。クロス処理制御データ403は、入力ポインタの位置各々について異なり、かつ
・ターゲットサブバンドインデックスの選択されたリスト、
・選択されたターゲットサブバンドインデックス各々のソースサブバンドインデックスのペア、及び
・有限長の合成ウィンドウ
を示す情報を少なくとも含む。
・ターゲットサブバンドインデックスの選択されたリスト、
・選択されたターゲットサブバンドインデックス各々のソースサブバンドインデックスのペア、及び
・有限長の合成ウィンドウ
を示す情報を少なくとも含む。
クロス処理制御部404は、分析フィルタバンク101から出力された複数の複素サブバンド信号と基本周波数とを示す制御データ104の一部に基づいてクロス処理制御データ403を提供する。制御データ104は、相互積処理に影響を及ぼす他の信号依存設定パラメータも含む。
以下、改善された相互積サブバンドブロックに基づく時間伸縮及びトランスポジションの原理について、図1-4を参照しながら適切な数学的手法と共に説明する。
ハーモニックトランスポーザ及び/又は時間伸縮全体について主要な2つの設定パラメータは、
・Sφ:所望の物理的な時間伸縮因子、及び
・Qφ:所望の物理的なトランスポジション因子
である。
・Sφ:所望の物理的な時間伸縮因子、及び
・Qφ:所望の物理的なトランスポジション因子
である。
フィルタバンク101、103はQMF、ウィンドウ化されたDFT又はウェーブレット変換等のような任意の複素指数変調形式(complex exponential modulated type)のものであってよい。分析フィルタバンク101及び合成フィルタバンク103は、変調の際に偶数番毎に又は奇数バンド毎にスタックし、より広い範囲のプロトタイプフィルタ及び/又はウィンドウから規定される。これら全ての2次の選択は、位相補正やサブバンドマッピング管理等のような以後の設計の詳細に影響を及ぼすが、サブバンド処理の主なシステム設計パラメータは、一般的には、以下の4つのフィルタバンクパラメータ(すべて物理単位で測定される)Δts/ΔtA及びΔfs/ΔfAという2つの商から導出される。上記の商において、
・ΔtAは、分析フィルタバンク101のサブバンドサンプル時間ステップ又は時間的なストライド(stride)、進行幅、刻み幅又は歩幅であり(例えば、秒で測定される)、
・ΔfAは、分析フィルタバンク101のサブバンド周波数間隔であり(例えば、ヘルツ[1/s]で測定される)、
・Δtsは、合成フィルタバンク103のサブバンドサンプル時間ステップ又は時間的なストライド(stride)、進行幅、刻み幅又は歩幅であり(例えば、秒で測定される)、
・Δfsは、合成フィルタバンク103のサブバンド周波数間隔である(例えば、ヘルツ[1/s]で測定される)。
・ΔtAは、分析フィルタバンク101のサブバンドサンプル時間ステップ又は時間的なストライド(stride)、進行幅、刻み幅又は歩幅であり(例えば、秒で測定される)、
・ΔfAは、分析フィルタバンク101のサブバンド周波数間隔であり(例えば、ヘルツ[1/s]で測定される)、
・Δtsは、合成フィルタバンク103のサブバンドサンプル時間ステップ又は時間的なストライド(stride)、進行幅、刻み幅又は歩幅であり(例えば、秒で測定される)、
・Δfsは、合成フィルタバンク103のサブバンド周波数間隔である(例えば、ヘルツ[1/s]で測定される)。
サブバンド処理部102の構成により、以下のパラメータが算出されるべきである:
・S:サブバンド伸縮因子。サブバンド伸縮因子は、入力及び時間サンプルの比率として、サブバンド処理部102に適用され、Sφにより時間領域信号の全体的な物理的な時間伸縮を行うためのものである。
・S:サブバンド伸縮因子。サブバンド伸縮因子は、入力及び時間サンプルの比率として、サブバンド処理部102に適用され、Sφにより時間領域信号の全体的な物理的な時間伸縮を行うためのものである。
・Q:サブバンドトランスポジション因子。サブバンドトランスポジション因子は、サブバンド処理部102に適用され、因子Qφにより時間領域信号の全体的な物理的な周波数トランスポジションを行うためのものである。
・ソース及びターゲットサブバンドインデックス間の対応関係。nはサブバンド処理部102に入る分析サブバンドのインデックスを示し、mはサブバンド処理部102の出力における対応する合成サブバンドのインデックスを示す。
サブバンド伸縮因子Sを決定するために、物理期間Dの分析サブバンドへの入力信号が、サブバンド処理部102への入力における分析サブバンドサンプルの個数D/ΔtAに対応することを確認する。これらD/ΔtA個のサンプルは、サブバンド伸縮因子Sを適用するサブバンド処理部102により、S・D/ΔtAに伸張される。合成フィルタバンク103の出力において、これらS・D/ΔtA個のサンプルが、Δts・S・D/ΔtAの長さの物理期間を有する出力信号となる。後者の期間はSφ・Dという特定の値に合致すべきなので、すなわち時間領域出力信号の期間は物理的時間伸張因子Sφにより時間領域入力信号に対して伸張されるべきであるので、以下の設計規則が得られる。
以下、1つのソースサブバンドに関する図2のサブバンド処理を、サブバンド処理パラメータS及びQの関数として説明する。x(k)をブロック抽出部201に対する入力信号とし、hを入力ブロックのストライド(stride)、進行幅、歩幅又は刻み幅とする。すなわち、x(k)はインデックスがnである分析サブバンドの複素分析サブバンド信号である。ブロック抽出部201により抽出されたブロックは、一般に、L=R1+R2サンプルにより規定されると考えられるのでロスはない。
数式(4)の興味深い特殊な場合は、R1=0及びR2=1の場合であり、抽出されるブロックが1つのサンプルから成る、すなわちブロック長LがL=1である。
複素数の極座標表現z=|z|exp(j∠z)の場合、|z|は複素数の振幅を示し、∠zは複素数の位相又は位相角を示し、入力フレームxlから出力フレームylを生成する非線形処理部202は、有利なことに、以下の数式による位相修正因子T=SQにより規定される。
上記の数式(5)は、出力フレームサンプルの位相が、対応する入力サンプルの位相を一定のオフセット値だけずらす又はシフトすることで決定されることを示す。その一定のオフセット値は修正因子Tに依存し、修正因子T自体はサブバンド伸縮因子及び/又はサブバンドトランスポジション因子に依存する。更に、一定のオフセット値は入力フレームのうちの特定の入力フレームのサンプルの位相に依存する。この特定の入力フレームサンプルは、所与のブロックの出力フレームサンプル全ての位相を決定する際に固定的に維持される。数式(5)の場合、入力フレームの中心サンプルの位相が、特定の入力フレームのサンプルの位相として使用されている。
数式(5)の第2行は、出力フレームのサンプルの振幅が、入力フレームの対応するサンプルの振幅に依存することを示す。更に、出力フレームのサンプルの振幅は、特定の入力フレームサンプルの振幅に依存してもよい。その特定の入力フレームサンプルは、全ての出力フレームサンプルの振幅を決定する際に使用されてよい。数式(5)の場合、入力フレームの中心サンプルが、特定の入力フレームサンプルとして使用される。一実施形態において、出力フレームのサンプルの振幅は、入力フレームの対応するサンプル及び特定の入力フレームサンプルの振幅の幾何平均に対応してもよい。
ウィンドウ化処理部203において、長さLのウィンドウwが出力フレームに適用され、ウィンドウ処理が施された以下の出力フレームが得られる。
複素正弦波がサブバンド処理部102の入力として使用される場合、分析サブバンド信号は複素正弦波に対応する。
以下、サブバンド処理部の説明を、サブバンド入力が2つである図3の場合にも適用できるように拡張する。x(1)(k)が第1のブロック抽出部301-1に対する入力サブバンド信号であり、x(2)(k)が第2のブロック抽出部301-2に対する入力サブバンド信号であるとする。各々の抽出部は異なるダウンサンプリング因子を使用することができるので、抽出されたブロックは次のとおりになる。
非負の実数パラメータD1、D2、ρ、非負の整数パラメータT1、T2及び合成ウィンドウwの定義は、所望の動作モードに依存する。同じサブバンドが双方の入力に与えられた場合、x(1)(k)=x(2)(k)、D1=Q、D2=0、T1=1、T2=T-1である場合、数式(12)及び(13)に関する処理は1入力の場合の数式(4)及び(5)に帰着することに留意を要する。
一実施形態において、合成フィルタバンク103の周波数間隔Δfs及び分析フィルタバンク101の周波数間隔ΔfAの比率は、所望の物理トランスポジション因子Qとは異なる場合、インデックスがそれぞれn、n+1である2つの分析サブバンドからインデックスがmである合成サブバンドのサンプルを決定することが有用である。所与のインデックスmに関し、対応するインデックスnは、数式(3)により与えられる分析インデックス値nを打ち切ることで得られる整数値により与えられる。例えば、インデックスnに対応する分析サブバンド信号のような一方の分析サブバンド信号は第1のブロック抽出部301-1に与えられ、インデックスn+1に対応する分析サブバンド信号のような他方の分析サブバンド信号は第2のブロック抽出部301-2に与えられる。これら2つの分析サブバンド信号に基づいて、インデックスmに対応する合成サブバンド信号が、上記の処理に従って決定される。2つのブロック抽出部301-1及び301-2に隣接する分析サブバンド信号を指定する仕方は、数式(3)のインデックス値を打ち切る際に得られた残り(remainder)に基づいてもよく、すなわち数式(3)によって与えられる抽出インデックス値及び数式(3)から得られる打ち切られた整数値nの差分に基づいてもよい。残りが0.5より大きかった場合、インデックスnに対応する分析サブバンド信号は第2のブロック抽出部301-2に指定され、そうでなかった場合、分析サブバンド信号は第1のブロック抽出部301-1に指定されてもよい。この動作モードの場合、パラメータは、入力サブバンド信号が同じ複素周波数を共有するように設計される。
以下、クロス処理制御(cross processing control)404に関する方法を説明する。所与の出力サブバンドインデックスm、パラメータr=1,...,Qφ-1及び基本周波数Ω0に関し、以下の数式を近似的に解くことで近似的なソースサブバンドインデックスn1及びn2を近似することができる。
これらの定義の場合、次式が成立する。
・ p=Ω0/ΔfA:分析フィルタバンクの周波数間隔を単位として測定された基本周波数、
・ F=Δfs/ΔfA:分析フィルタバンクの周波数間隔に対する合成フィルタバンクの周波数間隔の商、
・ nf=[(m+σ)F-rp]/Qφ-σ:整数値の低いソースインデックスに対する実数値ターゲット。
・ F=Δfs/ΔfA:分析フィルタバンクの周波数間隔に対する合成フィルタバンクの周波数間隔の商、
・ nf=[(m+σ)F-rp]/Qφ-σ:整数値の低いソースインデックスに対する実数値ターゲット。
数式(16)に対する有利な近似解の具体例は、n1をnfに最も近い整数とし、n2をnf+pに最も近い整数とすることで得られる。
基本周波数が分析フィルタバンク間隔よりも小さかった場合、すなわちp<1であった場合、相互積の加算を相殺又はキャンセルすることが有利である。
特許文献2に教示されているように、相互積(cross product)のないトランスポジションから既に顕著に大きな寄与が得られている出力サブバンドには、相互積は加算されるべきでない。更に、せいぜい1つの場合に、r=1,...,Qφ-1が相互積出力に寄与すべきである。ここで、これらの規則又はルールは、ターゲットの出力サブバンドインデックスmの各々について以下の3つのステップを実行することでなされてもよい:
1.中心タイムスロットk=hkにおいて計算された候補のソースサブバンドの振幅|x(1)|及び|x(2)|の最小値の全てのr=1,...,Qφ-1のうち最大値MCを算出する。ソースサブバンドx(1)及びx(2)は数式(16)におけるインデックスn1及びn2のように与えられる。
1.中心タイムスロットk=hkにおいて計算された候補のソースサブバンドの振幅|x(1)|及び|x(2)|の最小値の全てのr=1,...,Qφ-1のうち最大値MCを算出する。ソースサブバンドx(1)及びx(2)は数式(16)におけるインデックスn1及びn2のように与えられる。
2.インデックスn≒(F/Qφ)m(数式3参照)と共にソースサブバンドから取得されたダイレクトソース項|x|について対応する大きさ又は振幅Msを算出する。
3.上記のMc>qMsの場合にのみ上記のポイント1(ステップ1)でMCについて勝ち残った候補からクロスターム(cross term)を選択する。ここで、qは所定の閾値である。
上記の手順の変形例は特定のシステムコンフィギュレーションパラメータに依存することが望ましい。そのような変形例の1つは、ポイント3(ステップ3)の固定的な閾値を、MC/MSの商に依存する緩和された規則で置換することである。別の変形例は、ポイント1(ステップ1)における最大化をQφ-1よりも大きく拡張することであり、例えば分析周波数間隔単位pで測定された基本周波数についての候補値の有限リストに拡張することである。更に別の変形例は、サブバンドの振幅についての別の量を使用することであり、例えば固定されたサンプルの振幅、振幅の最大値、振幅の平均値、lpノルムによる振幅等が使用されてもよい。
n1及びn2という値と共に相互積に追加するために選択されたターゲットサブバンドmのリストは、クロス処理制御データ403の主要な部分を形成する。残りの議論は、設定パラメータ又はコンフィギュレーションパラメータD1、D2、ρ、位相回転(13)に登場する非負の整数パラメータT1、T2、クロスサブバンド処理部402で使用される合成ウィンドウwに関する。相互積の状況に対して正弦波モデルを使用すると、以下のソースバンド信号が得られる。
ターゲット出力サブバンドインデックスm及び基本周波数Ω0のような入力パラメータに基づいてクロス処理制御データ403を計算するための上記のアルゴリズムは、本発明の性質を単に例示しているに過ぎず、本発明の範囲を限定するものではないことに留意を要する。当業者の技術常識及び日常経験により本開示内容の変形例-例えば、入力信号(17)に応答して出力のような信号(18)を提供する別のサブバンドブロック処理方法等-も本発明の範囲内に収まる。
図5は改善されたHFRオーディオコーデックにおいて何らかの次数のトランスポジションを使用してサブバンドブロックに基づくトランスポジションを適用する場合の具体例を示す。送信されたビットストリームはコアデコーダ501で受信され、コアデコーダはfsというサンプリング周波数で低帯域幅復号コア信号を提供する。低帯域幅復号コア信号は、複素変調32バンドQMF分析バンク502により出力サンプリング周波数2fsにサンプリングし直され(再サンプリングされ)、複素変調32バンドQMF分析バンク502の後には(HFR処理部を介して)64バンドQMF合成バンク(逆QMF、IQMF)505が続く。2つのフィルタバンク502及び505は、同じ物理パラメータΔts=ΔtA及びΔfs=ΔfAを共有し、HFR処理部504は低帯域幅コア信号に対応する未修正の低サブバンドを通過させる。HFR処理部504により実行されるスペクトル整形及び修正により、多重トランスポーザ処理部503からの出力バンドと共に64QMF合成バンク505の高周波サブバンドを提供することで、出力信号の高周波成分が取得される。多重トランスポーザ処理部503は、復号されたコア信号を入力として取得し、複数のサブバンド信号を出力し、複数のサブバンド信号はいくつものトランスポーズされた信号成分の重ね合わせ又は合計による64QAMバンド分析を表現する。目的又は方針は、HFR処理が迂回又はバイパスされた場合に、信号成分の各々が、コア信号の時間伸縮なしに整数の物理トランスポジション(Qφ=2,3,...及びSφ=1)に対応するようにすることである。本発明の実施形態では、トランスポーザ制御信号404は基本周波数を示すデータを含んでいる。このデータは、対応するオーディオ符号器からのビットストリームにより送信されてもよいし(デコーダはピッチ検出を行う)、或いは送信され検出された情報の組み合わせから取得されてもよい。
図6は単独の64バンドQMF分析フィルタバンクを適用する多重次サブバンドブロックベースのトランスポジションの動作を説明するための図である。3つのトランスポジション又はオーダ(orders)Qφ=2,3,4が生成され、出力サンプリングレートが2fsで動作している64バンドQMFの領域で与えられる。
多重部、合成部又は併合部603は、HFR処理部に与えられる複数のQMFサブバンドの内の1つのトランスポジション因子ブランチから関連するサブバンドを選択及び合成する。具体的な目的又は方針は、64バンドQMF分析部601、サブバンド処理部602-Qφ、64バンドQMF合成部505の一連の処理が、Sφ=1(すなわち、伸縮なし)と共にQφの物理トランスポジションをもたらすことである。図1の101、102、103と共にこれら3つのブロックを特定することで、Δts/ΔtA=1/2及びF=Δfs/ΔfA=2であるように、ΔtA=64fs及びΔfA=fs/128であることが分かる。602-Qφに関する具体的な設定パラメータの設計は、Qφ=2,3,4の各々について別々に説明される。全ての場合について、分析ストライドはh=1に選択され、正規化された基本周波数パラメータp=Ω0/ΔfA=128Ω0/fsは既知であることが仮定されている。
先ず、Qφ=2の場合を考察する。この場合、602-2はS=2のサブバンド伸張、Q=1(すなわち、伸縮なし)のサブバンドトランスポジションを実行しなければならず、ソースn及びターゲットサブバンドmの間の対応関係はダイレクトな(direct)サブバンド処理についてn=mにより与えられる。相互積加算の処理の途中において、唯1つの考察すべき相互積が存在し(すなわち、r=1)(上記の数式(15)以降参照)、数式(20)はT1=T2=1及びD1+D2=1のように簡略化される。解の一例は、D1=0及びD2=1を選択することである。直接的な処理合成ウィンドウの場合、R1=R2=5と共に長さL=10の四角形ウィンドウが、条件(10)を満たすものとして使用されてもよい。クロス処理合成ウィンドウの場合、R1=R2=1と共に短いL=2のタップウィンドウが使用され、相互積加算の追加的な複雑さを最小化する。そして、サブバンド処理に長いブロックを使用した場合の有利な効果は、複素オーディオ信号のばあいに最も顕著になり、その場合、望まれない相互変調の項が抑圧されており、支配的なピッチの場合、そのようなアーチファクトが生じる確率は低い。L=2のタップウィンドウは、h=1及びS=2なので、数式(10)を満たすことが可能な最も小さなものである。しかしながら本発明は数式(21)を満足することもできる。その場合、パラメータは次のように規定される。
Qφ=3の場合、数式(1)-(3)による602-3の仕様又は行うことは、S=2のサブバンド伸張、及びQ=3/2のサブバンドトランスポジションを実行しなければならないことであり、直接的な項の処理に関するターゲットmサブバンド及びソースnサブバンド間の関係は、n≒2m/3により与えられる。2種類の相互積項r=1,2が存在し、数式(20)は次のように簡略化される。
・ D1=0及びD2=3/2 (r=1の場合)
・ D1=3/2及びD2=0 (r=2の場合)
直接的な処理合成ウィンドウの場合、R1=R2=4と共に長さL=8の四角形ウィンドウが使用されてもよい。クロス処理合成ウィンドウの場合、R1=R2=1と共にL=2タップの短いウィンドウが使用され、次式を満たしてもよい。
・ D1=3/2及びD2=0 (r=2の場合)
直接的な処理合成ウィンドウの場合、R1=R2=4と共に長さL=8の四角形ウィンドウが使用されてもよい。クロス処理合成ウィンドウの場合、R1=R2=1と共にL=2タップの短いウィンドウが使用され、次式を満たしてもよい。
Qφ=4の場合、数式(1)-(3)による602-4の仕様又は行うことは、S=2のサブバンド伸張、及びQ=2のサブバンドトランスポジションを実行しなければならないことであり、直接的な項の処理に関するターゲットmサブバンド及びソースnサブバンド間の関係は、n≒2mにより与えられる。3種類の相互積項r=1,2,3が存在し、数式(20)は次のように簡略化される。
・ D1=0及びD2=2 (r=1の場合)
・ D1=0及びD2=1 (r=2の場合)
・ D1=2及びD2=0 (r=3の場合)
ダイレクト処理合成ウィンドウの場合、R1=R2=3と共に長さL=6の四角形ウィンドウが使用されてもよい。クロス処理合成ウィンドウの場合、R1=R2=1と共にL=2タップの短いウィンドウが使用され、次式を満たしてもよい。
・ D1=0及びD2=1 (r=2の場合)
・ D1=2及びD2=0 (r=3の場合)
ダイレクト処理合成ウィンドウの場合、R1=R2=3と共に長さL=6の四角形ウィンドウが使用されてもよい。クロス処理合成ウィンドウの場合、R1=R2=1と共にL=2タップの短いウィンドウが使用され、次式を満たしてもよい。
1より大きなrの値が適用可能な上記の例の各々において、例えば数式(17)より前に説明した3ステップ手順と同様な選択肢が存在する。
図7は基本周波数Ω0=564.7Hzのハーモニック信号の振幅スペクトルを示す。この信号の低周波数部分701が複数のトランスポーザの入力として使用される。トランスポーザの目的は入力信号の高周波数部分702に可能な限り近い信号を生成し、高周波数部分702の送信が必須でないようにしかつ利用可能なビットレートを経済的に使用できるようにすることである。
図8は図7の信号の低い周波数分701を入力として有するトランスポーザからの出力の振幅スペクトルを示す。図5に関する説明に従って、入力サンプリング周波数fs=14400Hzで64バンドQMFフィルタバンクを使用することで複数のトランスポーザが構築されている。
しかしながら、簡明化のため、2つのトランスポジション次数Qφ=2,3のみを考察する。
3つの異なるスペクトル801-803は、異なる設定のクロス処理制御データを用いて取得された最終的な出力を表す。
しかしながら、簡明化のため、2つのトランスポジション次数Qφ=2,3のみを考察する。
3つの異なるスペクトル801-803は、異なる設定のクロス処理制御データを用いて取得された最終的な出力を表す。
上段にあるスペクトル801では、全てのクロス処理がキャンセルされ、ダイレクトな(直接的な)サブバンド処理401のみが行われたばあいに取得された出力スペクトルを示す。これは、クロス処理制御データ404がp=0(ピッチなしの指示)を受けた場合である。Qφ=2のトランスポジションは4ないし8kHzの範囲内の出力を生成し、Qφ=3のトランスポジションは8ないし12kHzの範囲内の出力を生成する。図示されているように、生成された部分は大きく離れており、出力は(本来の)高周波数部分702から大幅に逸脱している。聴き取れてしまう2倍及び3倍の「ゴーストピッチ」アーチファクトが、結果のオーディオ出力中に生じてしまう。
中段にあるスペクトル802では、クロス処理が行われ、ピッチパラメータp=5が使用されているが(近似的に128Ω0/fs=5.0196に等しい)、数式(10)を満たしてはいるもののw(0)=w(-1)=1である簡易な2タップの合成ウィンドウが、クロスサブバンド処理に使用されている。これは、サブバンドブロックに基づく処理と改善された相互積ハーモニックトランスポジションとの直接的な組み合わせによるものである。図示されているように、801にはない追加的な出力信号成分が、所望のハーモニック系列に整合していない。これは、上記の手順を使用して、相互積の処理による直接的なサブバンド処理の設計による影響を相殺するには不十分なオーディオ品質を招いてしまうことを示す。
下段にあるスペクトル803では、中段のスペクトル802と同様な出力スペクトルを示すが、図5のQφ=2,3に関する数式により与えられるクロスサブバンド処理合成ウィンドウが使用されている点が異なる。すなわち、w(0)=1及びw(-1)=exp(iα)による2タップウィンドウが数式(21)を満たし、pの値に依存する本発明による特徴を使用している。図示されているように、合成された出力信号は所望の高調波部分702に良く整合している。
図9は非線形処理フレーム処理部202の部分を示し、非線形処理フレーム処理部202は、2つの入力サンプルu1、u2を受信しかつそれらに基づいて処理サンプル(処理サンプル)wを生成し、処理サンプルの振幅は入力サンプルの振幅の幾何平均により与えられ、処理サンプルの位相は入力サンプルの位相の線形結合である。すなわち、次式のように表現できる。
本発明に関する更なる実施の形態は上記の説明を理解すれば当業者にとって自明であろう。本説明及び図面は実施の形態や具体例を示しているが、本発明はそれらの特定の例に限定されない。添付の特許請求の範囲によって規定される本発明の範囲から逸脱することなく、多数の修正例及び変形例が可能である。
本願により開示されたシステム及び方法等はソフトウェア、ファームウェア、ハードウェア又はそれらの組み合わせとして実現されてもよい。全部又は一部の要素が、ディジタル信号プロセッサ又はマイクロプロセッサにより実行されるソフトウェアとして実現されてもよいし、或いはハードウェアとして若しくは特定用途向け集積回路として実現されてもよい。そのようなソフトウェアはコンピュータで読み取ることが可能な記憶媒体に保存されてもよく、記憶媒体はコンピュータ読み取り可能な媒体(又は一時的ではない媒体)を含むが、媒体自体は通信媒体(一時的な媒体)を含む概念である。当業者に知られているように、コンピュータ記憶媒体は、揮発性媒体、不揮発性媒体、着脱可能な媒体、着脱可能でない媒体等を含み、コンピュータで読み取ることが可能な命令、データ構造、プログラムモジュール又はその他のデータ等のような情報を保存する何らかの方法又は技法で実現されている。コンピュータ記憶媒体は、限定ではないが、RAM、ROM、EEPROM、フラッシュメモリその他の方式のメモリ、CD-ROM、ディジタル多用途ディスク(DVD)又はその他の光ディスク媒体、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気記憶装置等でもよく、或いは所望の情報を保存するために使用可能でありかつコンピュータがアクセスできるその他の任意の媒体であってもよい。更に、通信媒体は、典型的には、コンピュータで読み取ることが可能な命令、データ構造、プログラムモジュールにより実現されてもよく、或いは搬送波又は伝送手段のような変調されたデータ信号におけるその他のデータにより実現されてもよく、任意の情報搬送手段を含んでよいことを、当業者は理解しているであろう。
(付記1)
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システム。
(付記2)
前記分析フィルタバンクは、直交ミラーフィルタバンク、ウィンドウ処理された離散フーリエ変換又はウェーブレット変換の内の何れかであり、
前記合成フィルタバンクは、対応する逆フィルタバンク又は変換である、付記1に記載の信号生成システム。
(付記3)
前記分析フィルタバンクは64ポイント直交ミラーフィルタバンクであり、前記合成フィルタバンクは逆64ポイント直交ミラーフィルタバンクである、付記2に記載の信号生成システム。
(付記4)
前記分析フィルタバンクが分析時間進行幅ΔtAを前記入力信号に適用し、
前記分析フィルタバンクが分析周波数間隔ΔfAを使用し、
n=0,...,N-1が分析サブバンドインデックスであり、前記分析フィルタバンクがN個の分析サブバンドを有し、
前記N個の分析サブバンドに属する或る分析サブバンドが前記入力信号の周波数バンドに関連付けられ、
前記合成フィルタバンクが合成時間進行幅Δtsを前記合成サブバンド信号に適用し、
前記合成フィルタバンクが合成周波数間隔Δfsを使用し、
m=0,...,M-1が合成サブバンドインデックスであり、前記合成フィルタバンクがM個の合成サブバンドを有し、
前記M個の合成サブバンドに属する或る合成サブバンドが前記時間伸縮信号及び/又は前記周波数トランスポーズド信号の周波数バンドに関連付けられる、付記1-3の何れか1項に記載の信号生成システム。
(付記5)
前記サブバンド処理部がY=2について形成されかつクロス処理制御部を更に有し、前記クロス処理制御部は、前記入力信号の基本周波数Ω0及び分析周波数間隔ΔfAの比率の近似である整数pの分だけサブバンドインデックスが異なることになるように、前記分析サブバンド信号に関連するサブバンドインデックスn1、n2を規定するクロス処理制御データを生成する、付記4に記載の信号生成システム。
(付記6)
前記サブバンド処理部がY=2について形成されかつクロス処理制御部を更に有し、前記クロス処理制御部は、前記分析サブバンド信号及び分析サブバンドインデックスmに関連するサブバンドインデックスn1、n2を規定するクロス処理制御データを生成し、前記サブバンドインデックスは以下の方程式の近似的な解に関連し、
Ω0は前記入力信号の基本周波数であり、
σ=0又は1/2であり、
Q=(Δts/ΔtA)Qφであり、
rは、1≦r≦Qφ-1を満たす整数である、付記4に記載の信号生成システム。
(付記7)
分析サブバンド信号から分析サンプルを抽出することで形成された2つのサンプルのサブバンドの振幅の最小値を最大化するrの値に、前記サブバンドインデックスn1、n2が基づくように、前記クロス処理制御部がクロス処理制御データを生成する、付記6に記載の信号生成ステム。
(付記8)
L個の入力サンプルのフレーム各々の前記サブバンドの振幅が、中心の又は中心に近いサンプルの振幅である、付記7に記載の信号生成システム。
(付記9)
前記ブロック抽出部が、分析サブバンド信号の前記複素分析サンプルをダウンサンプリングすることで、入力サンプルの少なくとも1つのフレームを導出する、付記1-8の何れか1項に記載の信号生成システム。
(付記10)
Y=2であり、前記ブロック抽出部が、第1及び第2の分析サブバンド信号の前記複素分析サンプルをダウンサンプリング因子D1及びD2によりダウンサンプリングすることで、入力サンプルの第1及び第2のフレームを導出し、前記ダウンサンプリング因子D1及びD2は、
を満たし、D1≧0、D2>0又はD1>0、D2≧0であり、
前記非線形フレーム処理部は、入力サンプルの第1及び第2のフレームにおける対応する入力サンプルの位相各々についての非負の整数係数を用いた線形結合に基づいて、処理サンプルの位相を決定する、付記9に記載の信号生成システム。
(付記11)
前記サブバンド処理部が、前記オーバーラップ加算部の上流側にウィンドウ処理部を更に有し、前記ウィンドウ処理部は、処理サンプルの前記フレームに有限長ウィンドウ関数を適用する、付記1-10の何れか1項に記載の信号生成システム。
(付記12)
前記ウィンドウ関数はフレーム長Lに対応する長さを有し、前記ウィンドウ関数は、
ガウシアンウィンドウ、
コサインウィンドウ、
レイズドコサインウィンドウ、
ハミングウィンドウ、
ハン(Hann)ウィンドウ、
方形ウィンドウ、
バートレットウィンドウ、及び
ブラックマンウィンドウ
のうちの何れかである、付記11に記載の信号生成システム。
(付記13)
前記ウィンドウ関数が複数のウィンドウサンプルを有し、Shのホップサイズと共にシフトされかつ複素ウェイトで重み付けされる場合に、複数のウィンドウ関数に属するオーバーラップ加算されたウィンドウサンプルが、実質的に一定のシーケンスを形成する、
複数のウィンドウサンプルをオーバーラップさせて加算したウィンドウサンプルが、実質的に一定のシーケンスを形成する、付記11に記載の信号生成システム。
(付記14)
一連の複素ウェイトが一定の位相回転の分だけそれぞれ異なっている、付記13に記載の信号生成システム。
(付記15)
前記位相回転が前記入力信号の基本周波数に比例している、付記14に記載の信号生成システム。
(付記16)
前記オーバーラップ加算部が或るホップサイズを一連の処理サンプルに適用し、前記ホップサイズはブロックホップサイズhに前記サブバンド伸縮因子Sを乗じたものに等しい、付記1-15の何れか1項に記載の信号生成システム。
(付記17)
少なくともY=1及びY=2について動作する付記1-16の何れか1項に記載の信号生成システム。
(付記18)
更に、少なくともY≧3について動作する付記1-17の何れか1項に記載の信号生成システム。
(付記19)
Y=2であり、前記フレーム処理部が、入力サンプルの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの第2フレームにおける対応する入力サンプルの振幅との平均値として、前記処理サンプルの振幅を決定する、付記1-18の何れか1項に記載の信号生成システム。
(付記20)
前記非線形フレーム処理部が、前記処理サンプルの振幅を重み付けされた幾何平均値として決定する、付記19に記載の信号生成システム。
(付記21)
幾何平均の重み付けパラメータがρ及び1-ρであり、ρはサブバンドトランスポジション因子Qに逆比例する実数である、付記20に記載の信号生成システム。
(付記22)
Y=2であり、前記非線形フレーム処理部が、入力サンプルの第1及び第2フレームにおける対応する入力サンプルの個々の位相についての、非負の整数係数(T1,T2)を用いた線形結合に基づいて、前記処理サンプルの位相を決定するように構成される、付記1-21の何れか1項に記載の信号生成システム。
(付記23)
前記整数係数の合計がサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sの積(Q×S)である、付記22に記載の信号生成システム。
(付記24)
前記処理サンプルの位相が、前記位相の線形結合に位相補正パラメータθを加えたものに対応する、付記22に記載の信号生成システム。
(付記25)
前記ブロック抽出部が入力サンプルを導出するために2つ以上の分析サンプルを補間する、付記1-24の何れか1項に記載の信号生成システム。
(付記26)
当該信号生成システムが制御データを受信する制御データ受信部を更に有し、前記サブバンド処理部が前記制御データを考慮に入れて前記合成サブバンド信号を決定する、付記1-25の何れか1項に記載の信号生成システム。
(付記27)
Y=2であり、前記制御データが前記入力信号の基本周波数Ω0を示し、周波数間隔が前記基本周波数に比例するように、前記処理サンプルを導出する前記分析サブバンドを前記サブバンド処理部が決定する、付記26に記載の信号生成システム。
(付記28)
前記非線形処理部が、
入力サンプルのY個のフレームの少なくとも1つにおいて対応する入力サンプルの振幅を調整し直す事前正規化部と(νm=um/|um|βm)と、
入力サンプルのYフレームのうち少なくとも2つにおける対応する入力サンプルに等しい因子についての重み付け複素積である
を計算することで、前記処理サンプルを決定する複素乗算部と
を有し、前記因子の少なくとも1つは(νm,m∈M≠φ)前記事前正規化部により調整された振幅のサンプルから導出される、付記1-27の何れか1項に記載の信号生成システム。
(付記29)
Y=2であり、当該信号生成システムが、
前記入力信号から第1及び第2の分析サブバンド信号を導出する分析フィルタバンクと、
前記第1及び第2の分析サブバンド信号から合成サブバンド信号を決定するサブバンド処理部と、
前記合成サブバンド信号から前記時間伸縮信号及び/又は周波数トランスポーズド信号を生成する合成フィルタバンクと
を有し、前記サブバンド処理部は、第1のブロック抽出部と、第2のブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記第1のブロック抽出部は、i)第1の分析サブバンド信号における複数の複素分析3ブルから、フレーム長がLであるようにL個の入力サンプルの第1のフレームを形成し、ii) L個の入力サンプルの後続のフレームを形成する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームの第1のシーケンスを生成し、
前記第2のブロック抽出部は、i)前記第2の分析サブバンド信号における前記複数の複素分析3ブルからL個の入力サンプルの第2のフレームを形成し、ii) L個の入力サンプルの後続のフレームを形成する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームの第2のシーケンスを生成し、
前記非線形フレーム処理部は、入力サンプルの前記第1及び第2のフレームに基づいて、処理サンプルのフレームを生成し、
前記オーバーラップ加算部は、前記合成サブバンド信号を生成する、付記1-28の何れか1項に記載の信号生成システム。
(付記30)
当該信号生成システムが、複数のサブバンド処理部と前記複数のサブバンド処理部の下流側であって前記合成フィルタバンクの上流側に設けられた合成部とを更に有し、
前記複数のサブバンド処理部の各々は、前記サブバンドトランスポジション因子Q及び/又は前記サブバンド伸縮因子Sの異なる値を使用して、中間的な合成サブバンド信号を生成し、
前記合成部は前記合成サブバンド信号を決定するために対応する中間的な合成サブバンド信号を合成する、付記1-29の何れか1項に記載の信号生成システム。
(付記31)
当該信号生成システムが、
前記分析フィルタバンクの上流側に設けられ、ビットストリームを前記入力信号に復号するコアデコーダと、
前記合成部の下流側であって前記合成フィルタバンクの上流側に設けられた高周波再構成(HFR)処理部とを更に有し、
前記HFR処理部は、前記合成サブバンド信号のスペクトル整形を実行すること等により、前記ビットストリームから導出されたスペクトルバンド情報を前記合成サブバンド信号に適用する、付記30に記載の信号生成システム。
(付記32)
前記サブバンド処理部の少なくとも1つが、ダイレクトサブバンド処理部であり、サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて1つの分析サブバンド信号から1つの合成サブバンド信号を決定し、
少なくとも1つがクロスサブバンド処理部であり、前記のS及びQとは異なるサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて2つの分析サブバンド信号から1つの合成サブバンド信号を決定する、付記30に記載の信号生成システム。
(付記33)
Y=2であり、
前記分析フィルタバンクは分析時間進行幅ΔtAを前記入力信号に適用し、
前記分析フィルタバンクは分析周波数間隔ΔfAを使用し、
前記分析フィルタバンクはN個の分析サブバンドを有し、N>1であり、n=0,...,N-1は分析サブバンドインデックスであり、N個の分析サブバンドに属する分析サブバンドは前記入力信号の周波数バンドに関連し、
前記合成フィルタバンクは合成時間進行幅Δtsを前記合成サブバンド信号に適用し、
前記合成フィルタバンクは合成周波数間隔Δfsを使用し、
前記合成フィルタバンクはM個の合成サブバンドを有し、M>1であり、m=0,...,M-1は合成サブバンドインデックスであり、M個の合成サブバンドに属する合成サブバンドは前記時間伸張信号及び/又は周波数トランスポーズド信号に関連し、
当該信号生成システムは、所与の合成サブバンドについて、以下の(a)-(c)の条件の何れかが満たされる場合に、少なくとも1つのクロスサブバンド処理部を不活性化し、
(a)の条件は、合成サブバンドをもたらすダイレクトソース項の分析サブバンドの振幅MSと合成サブバンドをもたらすクロスソース項の最適ペアにおける最小値MCとの比率が所定値qより大きいことであり、
(b)の条件は、前記合成サブバンドがダイレクト処理部において大きな寄与をもたらすことであり、
(c)の条件は、基本周波数Ω0が前記分析フィルタバンクの間隔ΔfAより小さいことである、付記32に記載の信号生成システム。
(付記34)
前記分析フィルタバンクが前記入力信号からY×Z個の分析サブバンド信号を形成し、
前記サブバンド処理部が、前記Y×Z個の分析サブバンド信号からZ個の合成サブバンド信号を生成し、或る合成サブバンド信号の基礎となっているY個の分析サブバンド信号のグループ各々についてS及びQの値のペアを適用し、
前記合成フィルタバンクが、前記Z個の合成サブバンド信号からZ個の時間伸縮信号及び/又は周波数トランスポーズド信号を生成する、付記1-33の何れか1項に記載の信号生成システム。
(付記35)
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成方法であって、
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、前記分析サブバンド信号の各々は、位相及び振幅を有する複素分析サンプルを複数個有する、ステップと、
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは分析サブバンド信号の前記複数の複素分析サンプルから抽出され、前記フレームの長さはLである、ステップと、
L個の入力サンプルの後続のフレームを導出する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームのシーケンスを生成するステップと、
入力サンプルのY個の対応するフレームに基づいて、前記フレームの処理されるサンプル(処理サンプル)各々について位相及び振幅を判定することで、処理サンプルのフレームを生成し、少なくとも1つの処理されるフレームについて、i)前記処理サンプルの位相が、入力サンプルのY個のフレーム各々における対応する入力サンプルの位相各々に基づいており、ii)前記処理サンプルの振幅が、入力サンプルのY個のフレーム各々における対応する入力サンプルの振幅各々に基づいている、ステップと、
処理サンプルのフレームのシーケンスの中のサンプルをオーバーラップさせながら加算することで、合成サブバンド信号を決定するステップと、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成するステップと
を有する信号生成方法。
(付記36)
処理サンプルのフレームが、入力サンプルのY=2の対応するフレームに基づいており、前記入力信号の基本周波数Ω0だけ近似的に相違する周波数を表す2つの分析サブバンド信号からサンプルを抽出することで形成される、付記35に記載の信号生成方法。
(付記37)
処理サンプルのフレームが、入力サンプルのY=2の対応するフレームに基づいており、周波数Ω及びΩ+Ω0を近似的に表現する2つの分析サブバンド信号からサンプルを抽出することで形成され、
前記合成サブバンド信号は、Qφ+rΩ0である周波数を近似的に表現し、rは1≦r≦Qφ-1を満たす整数であり、Q=(Δts/ΔtA)Qφであり、ΔtA及びΔtsはそれぞれ分析時間進行幅及び合成時間進行幅である、付記35又は36に記載の信号生成方法。
(付記38)
周波数Ω及びΩ+Ω0を表現する分析サブバンド信号から抽出された入力サンプルの2つのフレームのサブバンドの振幅のうち小さい方を最大化するように、前記基本周波数Ωが選択される、付記37に記載の信号生成方法。
(付記39)
入力サンプルのフレームの前記サブバンドの振幅が中央又は中央付近のサンプルの振幅である、付記38に記載の信号生成方法。
(付記40)
入力サンプルのフレームを生成する際に、分析サブバンド信号の前記複素分析サンプルをダウンサンプリングする、付記35-39の何れか1項に記載の信号生成方法。
(付記41)
処理サンプルのフレームが、入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1のフレームはダウンサンプリング因子D1を適用しながら第1の分析サブバンド信号のサンプルから抽出され、
入力サンプルの第2のフレームはダウンサンプリング因子D2を適用しながら第2の分析サブバンド信号のサンプルから抽出され、
前記第1及び第2のダウンサンプリング因子は、
を満たし、D1≧0、D2>0又はD1>0、D2≧0であり、
入力サンプルの第1及び第2のフレームにおける対応する入力サンプルの位相各々についての非負の整数係数T1、T2を用いた線形結合に基づいて、処理サンプルの位相が決定される、付記40に記載の信号生成方法。
(付記42)
前記サブバンド信号を判定する際に、オーバーラップ加算の前に、処理サンプルのシーケンスのフレーム各々に有限長ウィンドウ関数を適用する、付記35-41の何れか1項に記載の信号生成方法。
(付記43)
前記ウィンドウ関数はフレーム長Lに対応する長さを有し、前記ウィンドウ関数は、
ガウシアンウィンドウ、
コサインウィンドウ、
レイズドコサインウィンドウ、
ハミングウィンドウ、
ハン(Hann)ウィンドウ、
方形ウィンドウ、
バートレットウィンドウ、及び
ブラックマンウィンドウ
のうちの何れかである、付記42に記載の信号生成方法。
(付記44)
前記ウィンドウ関数が複数のウィンドウサンプルを有し、Shのホップサイズと共にシフトされかつ複素ウェイトで重み付けされる場合に、複数のウィンドウ関数に属するオーバーラップ加算されたウィンドウサンプルが、実質的に一定のシーケンスを形成する、付記42に記載の信号生成方法。
(付記45)
一連の複素ウェイトが一定の位相回転の分だけそれぞれ異なっている、付記44に記載の信号生成方法。
(付記46)
前記位相回転が前記入力信号の基本周波数に比例している、付記45に記載の信号生成方法。
(付記47)
前記合成サブバンド信号を判定する際に、ブロックホップサイズhに前記サブバンド伸縮因子Sを乗じたものに等しいホップサイズを適用することで、処理サンプルの一連のシーケンスをオーバーラップさせる、付記35-46の何れか1項に記載の信号生成方法。
(付記48)
処理されるフレームが入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの第2フレームにおける対応する入力サンプルの振幅との平均値として、前記処理サンプルの振幅が決定される、付記35-47の何れか1項に記載の信号生成方法。
(付記49)
前記振幅の平均値が、重み付けされた幾何平均値である、付記48に記載の信号生成方法。
(付記50)
幾何平均の重み付けパラメータがρ及び1-ρであり、ρはサブバンドトランスポジション因子Qに逆比例する実数である、付記49に記載の信号生成方法。
(付記51)
処理されるフレームが入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1及び第2フレームにおける対応する入力サンプルの位相に関する非負の整数係数(T1,T2)を用いた線形結合として、前記処理サンプルの位相が決定される、付記35-50の何れか1項に記載の信号生成方法。
(付記52)
前記非負の整数係数の合計がサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sの積(Q×S)である、付記51に記載の信号生成方法。
(付記53)
前記処理サンプルの位相が、前記線形結合に位相補正パラメータθを加えたものに対応する、付記51に記載の信号生成方法。
(付記54)
少なくとも1つの入力サンプルが、2つ以上の分析サンプルを補間することで導出される、付記35-53の何れか1項に記載の信号生成方法。
(付記55)
処理サンプルのフレームを生成する際に考慮に入れる制御データを受信するステップを更に有する付記35-54の何れか1項に記載の信号生成方法。
(付記56)
処理サンプルのフレームが入力サンプルのY=2個の対応するサンプルであり、
前記制御データが前記入力信号の基本周波数Ω0を示し、
各フレームの前記入力サンプルが抽出された2つの分析サブバンドが、前記基本種は数の分だけ異なる周波数を表現する、付記55に記載の信号生成方法。
(付記57)
前記処理サンプルのフレームを生成する際に、
少なくとも1つの入力サンプルの振幅を調整し直し、
入力サンプルのYフレームのうち少なくとも2つにおける対応する入力サンプルに等しい因子についての重み付け複素積である
を処理サンプルとして計算し、
前記因子の少なくとも1つは(νm=um/|um|βm,m∈M≠φ)再調整された振幅の入力サンプルである、付記35-56の何れか1項に記載の信号生成方法。
(付記58)
当該信号生成方法が、複数の中間的な合成サブバンド信号を生成するステップを更に有し、前記複数の中間的な合成サブバンド信号の各々は、入力サンプルの複数の対応するフレームに基づいて、前記サブバンドトランスポジション因子Q及び/又は前記サブバンド伸縮因子Sの異なる値を使用して生成され、
前記合成サブバンド信号を決定する際に、対応する中間的な合成サブバンド信号を合成する、付記35-37の何れか1項に記載の信号生成方法。
(付記59)
分析サブバンド信号が導出されることになる前記入力信号を取得するためにビットストリームを復号するステップと、
前記合成サブバンド信号のスペクトル整形を実行すること等により、前記ビットストリームから導出されたスペクトルバンド情報を前記合成サブバンド信号に適用するステップと、
を更に有する付記58に記載の信号生成方法。
(付記60)
前記中間的な合成サブバンド信号の少なくとも1つが、サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて1つの分析サブバンド信号に基づいてダイレクトサブバンド処理を行うことにより生成され、
前記中間的な合成サブバンド信号の少なくとも1つが、前記のS及びQとは異なるサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて2つの分析サブバンド信号に基づいて相互積処理を行うことにより生成される、付記58に記載の信号生成方法。
(付記61)
相互積処理を行うことで中間的な合成サブバンド信号を生成することが、以下の(a)-(c)の条件の何れかが満たされた場合に中止され、
(a)の条件は、合成サブバンドをもたらすダイレクトソース項の分析サブバンドの振幅MSと合成サブバンドをもたらすクロスソース項の最適ペアにおける最小値MCとの比率が所定値qより大きいことであり、
(b)の条件は、前記合成サブバンドがダイレクト処理部において大きな寄与をもたらすことであり、
(c)の条件は、基本周波数Ω0が前記分析フィルタバンクの間隔ΔfAより小さいことである、付記60に記載の信号生成方法。
(付記62)
Y×Z個の分析サブバンド信号が導出され、
入力サンプルのY×Z個のフレームが形成され、
入力サンプルのY×Z個の対応するフレームが、処理サンプルのZ個のフレームを生成するために使用され、
Z個の合成サブバンド信号が決定され、
Z個の時間伸張信号及び/又は周波数トランスポーズド信号が生成される、付記35-61の何れか1項に記載の信号生成方法。
(付記63)
付記35-62の何れか1項に記載の信号生成方法を信号生成装置に実行させるコンピュータプログラム。
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成システムであって、
Y(Y≧1)個の分析サブバンド信号の各々が、位相及び振幅を有する複素分析サンプルを複数個有するY個の分析サブバンド信号を、前記入力信号から導出する分析フィルタバンクと、
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するサブバンド処理部と、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成する合成フィルタバンクと
を有し、前記Q及びSの少なくとも一方は1より大きく、前記サブバンド処理部は、ブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記ブロック抽出部は、
i)L個の入力サンプルからY個のフレームを生成し、前記フレームの各々は分析サブバンド信号の複数の複素分析サンプルから抽出され、前記フレームの長さはL(L>1)であり、
ii)L個の入力サンプルの以後のフレームを生成する前に、複数の複素分析サンプルにhサンプルのブロックホップサイズを適用することで、一連の入力サンプルのフレームを生成し、
前記非線形フレーム処理部は、前記フレームの処理されるサンプル(処理サンプル)各々の位相及び振幅を判定することで、前記ブロック抽出部により生成された入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成し、少なくとも1つの処理サンプルについて、
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレーム各々において対応する入力サンプル各自の位相に基づいており、
前記オーバーラップ加算部は、処理サンプルの一連のフレームのサンプルをオーバーラップさせながら加算することで前記合成サブバンド信号を生成し、
当該信号生成システムは少なくともY=2の場合に動作する、信号生成システム。
(付記2)
前記分析フィルタバンクは、直交ミラーフィルタバンク、ウィンドウ処理された離散フーリエ変換又はウェーブレット変換の内の何れかであり、
前記合成フィルタバンクは、対応する逆フィルタバンク又は変換である、付記1に記載の信号生成システム。
(付記3)
前記分析フィルタバンクは64ポイント直交ミラーフィルタバンクであり、前記合成フィルタバンクは逆64ポイント直交ミラーフィルタバンクである、付記2に記載の信号生成システム。
(付記4)
前記分析フィルタバンクが分析時間進行幅ΔtAを前記入力信号に適用し、
前記分析フィルタバンクが分析周波数間隔ΔfAを使用し、
n=0,...,N-1が分析サブバンドインデックスであり、前記分析フィルタバンクがN個の分析サブバンドを有し、
前記N個の分析サブバンドに属する或る分析サブバンドが前記入力信号の周波数バンドに関連付けられ、
前記合成フィルタバンクが合成時間進行幅Δtsを前記合成サブバンド信号に適用し、
前記合成フィルタバンクが合成周波数間隔Δfsを使用し、
m=0,...,M-1が合成サブバンドインデックスであり、前記合成フィルタバンクがM個の合成サブバンドを有し、
前記M個の合成サブバンドに属する或る合成サブバンドが前記時間伸縮信号及び/又は前記周波数トランスポーズド信号の周波数バンドに関連付けられる、付記1-3の何れか1項に記載の信号生成システム。
(付記5)
前記サブバンド処理部がY=2について形成されかつクロス処理制御部を更に有し、前記クロス処理制御部は、前記入力信号の基本周波数Ω0及び分析周波数間隔ΔfAの比率の近似である整数pの分だけサブバンドインデックスが異なることになるように、前記分析サブバンド信号に関連するサブバンドインデックスn1、n2を規定するクロス処理制御データを生成する、付記4に記載の信号生成システム。
(付記6)
前記サブバンド処理部がY=2について形成されかつクロス処理制御部を更に有し、前記クロス処理制御部は、前記分析サブバンド信号及び分析サブバンドインデックスmに関連するサブバンドインデックスn1、n2を規定するクロス処理制御データを生成し、前記サブバンドインデックスは以下の方程式の近似的な解に関連し、
σ=0又は1/2であり、
Q=(Δts/ΔtA)Qφであり、
rは、1≦r≦Qφ-1を満たす整数である、付記4に記載の信号生成システム。
(付記7)
分析サブバンド信号から分析サンプルを抽出することで形成された2つのサンプルのサブバンドの振幅の最小値を最大化するrの値に、前記サブバンドインデックスn1、n2が基づくように、前記クロス処理制御部がクロス処理制御データを生成する、付記6に記載の信号生成ステム。
(付記8)
L個の入力サンプルのフレーム各々の前記サブバンドの振幅が、中心の又は中心に近いサンプルの振幅である、付記7に記載の信号生成システム。
(付記9)
前記ブロック抽出部が、分析サブバンド信号の前記複素分析サンプルをダウンサンプリングすることで、入力サンプルの少なくとも1つのフレームを導出する、付記1-8の何れか1項に記載の信号生成システム。
(付記10)
Y=2であり、前記ブロック抽出部が、第1及び第2の分析サブバンド信号の前記複素分析サンプルをダウンサンプリング因子D1及びD2によりダウンサンプリングすることで、入力サンプルの第1及び第2のフレームを導出し、前記ダウンサンプリング因子D1及びD2は、
前記非線形フレーム処理部は、入力サンプルの第1及び第2のフレームにおける対応する入力サンプルの位相各々についての非負の整数係数を用いた線形結合に基づいて、処理サンプルの位相を決定する、付記9に記載の信号生成システム。
(付記11)
前記サブバンド処理部が、前記オーバーラップ加算部の上流側にウィンドウ処理部を更に有し、前記ウィンドウ処理部は、処理サンプルの前記フレームに有限長ウィンドウ関数を適用する、付記1-10の何れか1項に記載の信号生成システム。
(付記12)
前記ウィンドウ関数はフレーム長Lに対応する長さを有し、前記ウィンドウ関数は、
ガウシアンウィンドウ、
コサインウィンドウ、
レイズドコサインウィンドウ、
ハミングウィンドウ、
ハン(Hann)ウィンドウ、
方形ウィンドウ、
バートレットウィンドウ、及び
ブラックマンウィンドウ
のうちの何れかである、付記11に記載の信号生成システム。
(付記13)
前記ウィンドウ関数が複数のウィンドウサンプルを有し、Shのホップサイズと共にシフトされかつ複素ウェイトで重み付けされる場合に、複数のウィンドウ関数に属するオーバーラップ加算されたウィンドウサンプルが、実質的に一定のシーケンスを形成する、
複数のウィンドウサンプルをオーバーラップさせて加算したウィンドウサンプルが、実質的に一定のシーケンスを形成する、付記11に記載の信号生成システム。
(付記14)
一連の複素ウェイトが一定の位相回転の分だけそれぞれ異なっている、付記13に記載の信号生成システム。
(付記15)
前記位相回転が前記入力信号の基本周波数に比例している、付記14に記載の信号生成システム。
(付記16)
前記オーバーラップ加算部が或るホップサイズを一連の処理サンプルに適用し、前記ホップサイズはブロックホップサイズhに前記サブバンド伸縮因子Sを乗じたものに等しい、付記1-15の何れか1項に記載の信号生成システム。
(付記17)
少なくともY=1及びY=2について動作する付記1-16の何れか1項に記載の信号生成システム。
(付記18)
更に、少なくともY≧3について動作する付記1-17の何れか1項に記載の信号生成システム。
(付記19)
Y=2であり、前記フレーム処理部が、入力サンプルの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの第2フレームにおける対応する入力サンプルの振幅との平均値として、前記処理サンプルの振幅を決定する、付記1-18の何れか1項に記載の信号生成システム。
(付記20)
前記非線形フレーム処理部が、前記処理サンプルの振幅を重み付けされた幾何平均値として決定する、付記19に記載の信号生成システム。
(付記21)
幾何平均の重み付けパラメータがρ及び1-ρであり、ρはサブバンドトランスポジション因子Qに逆比例する実数である、付記20に記載の信号生成システム。
(付記22)
Y=2であり、前記非線形フレーム処理部が、入力サンプルの第1及び第2フレームにおける対応する入力サンプルの個々の位相についての、非負の整数係数(T1,T2)を用いた線形結合に基づいて、前記処理サンプルの位相を決定するように構成される、付記1-21の何れか1項に記載の信号生成システム。
(付記23)
前記整数係数の合計がサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sの積(Q×S)である、付記22に記載の信号生成システム。
(付記24)
前記処理サンプルの位相が、前記位相の線形結合に位相補正パラメータθを加えたものに対応する、付記22に記載の信号生成システム。
(付記25)
前記ブロック抽出部が入力サンプルを導出するために2つ以上の分析サンプルを補間する、付記1-24の何れか1項に記載の信号生成システム。
(付記26)
当該信号生成システムが制御データを受信する制御データ受信部を更に有し、前記サブバンド処理部が前記制御データを考慮に入れて前記合成サブバンド信号を決定する、付記1-25の何れか1項に記載の信号生成システム。
(付記27)
Y=2であり、前記制御データが前記入力信号の基本周波数Ω0を示し、周波数間隔が前記基本周波数に比例するように、前記処理サンプルを導出する前記分析サブバンドを前記サブバンド処理部が決定する、付記26に記載の信号生成システム。
(付記28)
前記非線形処理部が、
入力サンプルのY個のフレームの少なくとも1つにおいて対応する入力サンプルの振幅を調整し直す事前正規化部と(νm=um/|um|βm)と、
入力サンプルのYフレームのうち少なくとも2つにおける対応する入力サンプルに等しい因子についての重み付け複素積である
を有し、前記因子の少なくとも1つは(νm,m∈M≠φ)前記事前正規化部により調整された振幅のサンプルから導出される、付記1-27の何れか1項に記載の信号生成システム。
(付記29)
Y=2であり、当該信号生成システムが、
前記入力信号から第1及び第2の分析サブバンド信号を導出する分析フィルタバンクと、
前記第1及び第2の分析サブバンド信号から合成サブバンド信号を決定するサブバンド処理部と、
前記合成サブバンド信号から前記時間伸縮信号及び/又は周波数トランスポーズド信号を生成する合成フィルタバンクと
を有し、前記サブバンド処理部は、第1のブロック抽出部と、第2のブロック抽出部と、非線形フレーム処理部と、オーバーラップ加算部とを有し、
前記第1のブロック抽出部は、i)第1の分析サブバンド信号における複数の複素分析3ブルから、フレーム長がLであるようにL個の入力サンプルの第1のフレームを形成し、ii) L個の入力サンプルの後続のフレームを形成する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームの第1のシーケンスを生成し、
前記第2のブロック抽出部は、i)前記第2の分析サブバンド信号における前記複数の複素分析3ブルからL個の入力サンプルの第2のフレームを形成し、ii) L個の入力サンプルの後続のフレームを形成する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームの第2のシーケンスを生成し、
前記非線形フレーム処理部は、入力サンプルの前記第1及び第2のフレームに基づいて、処理サンプルのフレームを生成し、
前記オーバーラップ加算部は、前記合成サブバンド信号を生成する、付記1-28の何れか1項に記載の信号生成システム。
(付記30)
当該信号生成システムが、複数のサブバンド処理部と前記複数のサブバンド処理部の下流側であって前記合成フィルタバンクの上流側に設けられた合成部とを更に有し、
前記複数のサブバンド処理部の各々は、前記サブバンドトランスポジション因子Q及び/又は前記サブバンド伸縮因子Sの異なる値を使用して、中間的な合成サブバンド信号を生成し、
前記合成部は前記合成サブバンド信号を決定するために対応する中間的な合成サブバンド信号を合成する、付記1-29の何れか1項に記載の信号生成システム。
(付記31)
当該信号生成システムが、
前記分析フィルタバンクの上流側に設けられ、ビットストリームを前記入力信号に復号するコアデコーダと、
前記合成部の下流側であって前記合成フィルタバンクの上流側に設けられた高周波再構成(HFR)処理部とを更に有し、
前記HFR処理部は、前記合成サブバンド信号のスペクトル整形を実行すること等により、前記ビットストリームから導出されたスペクトルバンド情報を前記合成サブバンド信号に適用する、付記30に記載の信号生成システム。
(付記32)
前記サブバンド処理部の少なくとも1つが、ダイレクトサブバンド処理部であり、サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて1つの分析サブバンド信号から1つの合成サブバンド信号を決定し、
少なくとも1つがクロスサブバンド処理部であり、前記のS及びQとは異なるサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて2つの分析サブバンド信号から1つの合成サブバンド信号を決定する、付記30に記載の信号生成システム。
(付記33)
Y=2であり、
前記分析フィルタバンクは分析時間進行幅ΔtAを前記入力信号に適用し、
前記分析フィルタバンクは分析周波数間隔ΔfAを使用し、
前記分析フィルタバンクはN個の分析サブバンドを有し、N>1であり、n=0,...,N-1は分析サブバンドインデックスであり、N個の分析サブバンドに属する分析サブバンドは前記入力信号の周波数バンドに関連し、
前記合成フィルタバンクは合成時間進行幅Δtsを前記合成サブバンド信号に適用し、
前記合成フィルタバンクは合成周波数間隔Δfsを使用し、
前記合成フィルタバンクはM個の合成サブバンドを有し、M>1であり、m=0,...,M-1は合成サブバンドインデックスであり、M個の合成サブバンドに属する合成サブバンドは前記時間伸張信号及び/又は周波数トランスポーズド信号に関連し、
当該信号生成システムは、所与の合成サブバンドについて、以下の(a)-(c)の条件の何れかが満たされる場合に、少なくとも1つのクロスサブバンド処理部を不活性化し、
(a)の条件は、合成サブバンドをもたらすダイレクトソース項の分析サブバンドの振幅MSと合成サブバンドをもたらすクロスソース項の最適ペアにおける最小値MCとの比率が所定値qより大きいことであり、
(b)の条件は、前記合成サブバンドがダイレクト処理部において大きな寄与をもたらすことであり、
(c)の条件は、基本周波数Ω0が前記分析フィルタバンクの間隔ΔfAより小さいことである、付記32に記載の信号生成システム。
(付記34)
前記分析フィルタバンクが前記入力信号からY×Z個の分析サブバンド信号を形成し、
前記サブバンド処理部が、前記Y×Z個の分析サブバンド信号からZ個の合成サブバンド信号を生成し、或る合成サブバンド信号の基礎となっているY個の分析サブバンド信号のグループ各々についてS及びQの値のペアを適用し、
前記合成フィルタバンクが、前記Z個の合成サブバンド信号からZ個の時間伸縮信号及び/又は周波数トランスポーズド信号を生成する、付記1-33の何れか1項に記載の信号生成システム。
(付記35)
入力信号から時間伸縮信号及び/又は周波数トランスポーズド信号を生成する信号生成方法であって、
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、前記分析サブバンド信号の各々は、位相及び振幅を有する複素分析サンプルを複数個有する、ステップと、
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは分析サブバンド信号の前記複数の複素分析サンプルから抽出され、前記フレームの長さはLである、ステップと、
L個の入力サンプルの後続のフレームを導出する前に、hサンプルのブロックホップサイズを前記複数の分析サンプルに適用することで、入力サンプルのフレームのシーケンスを生成するステップと、
入力サンプルのY個の対応するフレームに基づいて、前記フレームの処理されるサンプル(処理サンプル)各々について位相及び振幅を判定することで、処理サンプルのフレームを生成し、少なくとも1つの処理されるフレームについて、i)前記処理サンプルの位相が、入力サンプルのY個のフレーム各々における対応する入力サンプルの位相各々に基づいており、ii)前記処理サンプルの振幅が、入力サンプルのY個のフレーム各々における対応する入力サンプルの振幅各々に基づいている、ステップと、
処理サンプルのフレームのシーケンスの中のサンプルをオーバーラップさせながら加算することで、合成サブバンド信号を決定するステップと、
前記時間伸縮信号及び/又は周波数トランスポーズド信号を前記合成サブバンド信号から生成するステップと
を有する信号生成方法。
(付記36)
処理サンプルのフレームが、入力サンプルのY=2の対応するフレームに基づいており、前記入力信号の基本周波数Ω0だけ近似的に相違する周波数を表す2つの分析サブバンド信号からサンプルを抽出することで形成される、付記35に記載の信号生成方法。
(付記37)
処理サンプルのフレームが、入力サンプルのY=2の対応するフレームに基づいており、周波数Ω及びΩ+Ω0を近似的に表現する2つの分析サブバンド信号からサンプルを抽出することで形成され、
前記合成サブバンド信号は、Qφ+rΩ0である周波数を近似的に表現し、rは1≦r≦Qφ-1を満たす整数であり、Q=(Δts/ΔtA)Qφであり、ΔtA及びΔtsはそれぞれ分析時間進行幅及び合成時間進行幅である、付記35又は36に記載の信号生成方法。
(付記38)
周波数Ω及びΩ+Ω0を表現する分析サブバンド信号から抽出された入力サンプルの2つのフレームのサブバンドの振幅のうち小さい方を最大化するように、前記基本周波数Ωが選択される、付記37に記載の信号生成方法。
(付記39)
入力サンプルのフレームの前記サブバンドの振幅が中央又は中央付近のサンプルの振幅である、付記38に記載の信号生成方法。
(付記40)
入力サンプルのフレームを生成する際に、分析サブバンド信号の前記複素分析サンプルをダウンサンプリングする、付記35-39の何れか1項に記載の信号生成方法。
(付記41)
処理サンプルのフレームが、入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1のフレームはダウンサンプリング因子D1を適用しながら第1の分析サブバンド信号のサンプルから抽出され、
入力サンプルの第2のフレームはダウンサンプリング因子D2を適用しながら第2の分析サブバンド信号のサンプルから抽出され、
前記第1及び第2のダウンサンプリング因子は、
入力サンプルの第1及び第2のフレームにおける対応する入力サンプルの位相各々についての非負の整数係数T1、T2を用いた線形結合に基づいて、処理サンプルの位相が決定される、付記40に記載の信号生成方法。
(付記42)
前記サブバンド信号を判定する際に、オーバーラップ加算の前に、処理サンプルのシーケンスのフレーム各々に有限長ウィンドウ関数を適用する、付記35-41の何れか1項に記載の信号生成方法。
(付記43)
前記ウィンドウ関数はフレーム長Lに対応する長さを有し、前記ウィンドウ関数は、
ガウシアンウィンドウ、
コサインウィンドウ、
レイズドコサインウィンドウ、
ハミングウィンドウ、
ハン(Hann)ウィンドウ、
方形ウィンドウ、
バートレットウィンドウ、及び
ブラックマンウィンドウ
のうちの何れかである、付記42に記載の信号生成方法。
(付記44)
前記ウィンドウ関数が複数のウィンドウサンプルを有し、Shのホップサイズと共にシフトされかつ複素ウェイトで重み付けされる場合に、複数のウィンドウ関数に属するオーバーラップ加算されたウィンドウサンプルが、実質的に一定のシーケンスを形成する、付記42に記載の信号生成方法。
(付記45)
一連の複素ウェイトが一定の位相回転の分だけそれぞれ異なっている、付記44に記載の信号生成方法。
(付記46)
前記位相回転が前記入力信号の基本周波数に比例している、付記45に記載の信号生成方法。
(付記47)
前記合成サブバンド信号を判定する際に、ブロックホップサイズhに前記サブバンド伸縮因子Sを乗じたものに等しいホップサイズを適用することで、処理サンプルの一連のシーケンスをオーバーラップさせる、付記35-46の何れか1項に記載の信号生成方法。
(付記48)
処理されるフレームが入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの第2フレームにおける対応する入力サンプルの振幅との平均値として、前記処理サンプルの振幅が決定される、付記35-47の何れか1項に記載の信号生成方法。
(付記49)
前記振幅の平均値が、重み付けされた幾何平均値である、付記48に記載の信号生成方法。
(付記50)
幾何平均の重み付けパラメータがρ及び1-ρであり、ρはサブバンドトランスポジション因子Qに逆比例する実数である、付記49に記載の信号生成方法。
(付記51)
処理されるフレームが入力サンプルのY=2個の対応するフレームに基づいており、
入力サンプルの第1及び第2フレームにおける対応する入力サンプルの位相に関する非負の整数係数(T1,T2)を用いた線形結合として、前記処理サンプルの位相が決定される、付記35-50の何れか1項に記載の信号生成方法。
(付記52)
前記非負の整数係数の合計がサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sの積(Q×S)である、付記51に記載の信号生成方法。
(付記53)
前記処理サンプルの位相が、前記線形結合に位相補正パラメータθを加えたものに対応する、付記51に記載の信号生成方法。
(付記54)
少なくとも1つの入力サンプルが、2つ以上の分析サンプルを補間することで導出される、付記35-53の何れか1項に記載の信号生成方法。
(付記55)
処理サンプルのフレームを生成する際に考慮に入れる制御データを受信するステップを更に有する付記35-54の何れか1項に記載の信号生成方法。
(付記56)
処理サンプルのフレームが入力サンプルのY=2個の対応するサンプルであり、
前記制御データが前記入力信号の基本周波数Ω0を示し、
各フレームの前記入力サンプルが抽出された2つの分析サブバンドが、前記基本種は数の分だけ異なる周波数を表現する、付記55に記載の信号生成方法。
(付記57)
前記処理サンプルのフレームを生成する際に、
少なくとも1つの入力サンプルの振幅を調整し直し、
入力サンプルのYフレームのうち少なくとも2つにおける対応する入力サンプルに等しい因子についての重み付け複素積である
前記因子の少なくとも1つは(νm=um/|um|βm,m∈M≠φ)再調整された振幅の入力サンプルである、付記35-56の何れか1項に記載の信号生成方法。
(付記58)
当該信号生成方法が、複数の中間的な合成サブバンド信号を生成するステップを更に有し、前記複数の中間的な合成サブバンド信号の各々は、入力サンプルの複数の対応するフレームに基づいて、前記サブバンドトランスポジション因子Q及び/又は前記サブバンド伸縮因子Sの異なる値を使用して生成され、
前記合成サブバンド信号を決定する際に、対応する中間的な合成サブバンド信号を合成する、付記35-37の何れか1項に記載の信号生成方法。
(付記59)
分析サブバンド信号が導出されることになる前記入力信号を取得するためにビットストリームを復号するステップと、
前記合成サブバンド信号のスペクトル整形を実行すること等により、前記ビットストリームから導出されたスペクトルバンド情報を前記合成サブバンド信号に適用するステップと、
を更に有する付記58に記載の信号生成方法。
(付記60)
前記中間的な合成サブバンド信号の少なくとも1つが、サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて1つの分析サブバンド信号に基づいてダイレクトサブバンド処理を行うことにより生成され、
前記中間的な合成サブバンド信号の少なくとも1つが、前記のS及びQとは異なるサブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて2つの分析サブバンド信号に基づいて相互積処理を行うことにより生成される、付記58に記載の信号生成方法。
(付記61)
相互積処理を行うことで中間的な合成サブバンド信号を生成することが、以下の(a)-(c)の条件の何れかが満たされた場合に中止され、
(a)の条件は、合成サブバンドをもたらすダイレクトソース項の分析サブバンドの振幅MSと合成サブバンドをもたらすクロスソース項の最適ペアにおける最小値MCとの比率が所定値qより大きいことであり、
(b)の条件は、前記合成サブバンドがダイレクト処理部において大きな寄与をもたらすことであり、
(c)の条件は、基本周波数Ω0が前記分析フィルタバンクの間隔ΔfAより小さいことである、付記60に記載の信号生成方法。
(付記62)
Y×Z個の分析サブバンド信号が導出され、
入力サンプルのY×Z個のフレームが形成され、
入力サンプルのY×Z個の対応するフレームが、処理サンプルのZ個のフレームを生成するために使用され、
Z個の合成サブバンド信号が決定され、
Z個の時間伸張信号及び/又は周波数トランスポーズド信号が生成される、付記35-61の何れか1項に記載の信号生成方法。
(付記63)
付記35-62の何れか1項に記載の信号生成方法を信号生成装置に実行させるコンピュータプログラム。
Claims (3)
- 入力信号から時間伸縮及び/又は周波数トランスポーズド信号を生成するように構成されたシステムであって、1つ以上の処理要素を有し、前記1つ以上の処理要素は:
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、分析サブバンド信号の各々は位相及び振幅をそれぞれが有する複数の複素分析サンプルを有する、ステップ;
サブバンドトランスポジション因子Q及びサブバンド伸縮因子Sを用いて、前記Y個の分析サブバンド信号から合成サブバンド信号を生成するステップであって、前記Q及びSのうちの少なくとも1つは1より大きい、ステップ;及び
前記合成サブバンド信号から前記時間伸縮及び/又は周波数トランスポーズド信号を生成するステップ;
を行い、前記合成サブバンド信号を生成するステップは:
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは、分析サブバンド信号の前記複数の複素分析サンプルから抽出され、Lは1より大きなフレーム長であり、前記L個の入力サンプルのうちの少なくとも1つは、前記複数の複素分析サンプルのうちの2つ以上を補間することによって導出される、ステップ;
L個の入力サンプルの以後のフレームを形成する前に、前記複数の複素分析サンプルにhサンプルのブロックホップサイズを適用し、入力サンプルのフレームのシーケンスを生成するステップ;
前記フレームの処理サンプル各々の位相及び振幅を決定することで、入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成するステップであって、少なくとも1つの処理サンプルに関し:
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレームの各々における対応する入力サンプル各自の位相に基づいており;及び
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレームのうちの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの前記Y個のフレームのうちの第2フレームにおける対応する入力サンプルの振幅との平均値として決定される、ステップ;
前記処理サンプルのフレームにウィンドウ関数を適用するステップであって、前記ウィンドウ関数は前記フレーム長Lに対応する長さを有する四角形ウィンドウである、ステップ;
処理サンプルのウィンドウ処理されたフレームのシーケンスのサンプルをオーバーラップさせて加算することにより前記合成サブバンド信号を決定するステップ;
を行う、システム。 - 入力信号から時間伸縮及び/又は周波数トランスポーズド信号を生成する方法であって、
前記入力信号からY(Y≧2)個の分析サブバンド信号を導出するステップであって、分析サブバンド信号の各々は位相及び振幅をそれぞれが有する複数の複素分析サンプルを有する、ステップ;
L個の入力サンプルのY個のフレームを形成するステップであって、各フレームは、分析サブバンド信号の前記複数の複素分析サンプルから抽出され、Lは1より大きなフレーム長であり、前記L個の入力サンプルのうちの少なくとも1つは、前記複数の複素分析サンプルのうちの2つ以上を補間することによって導出される、ステップ;
L個の入力サンプルの以後のフレームを導出する前に、前記複数の複素分析サンプルにhサンプルのブロックホップサイズを適用し、入力サンプルのフレームのシーケンスを生成するステップ;
前記フレームの処理サンプル各々の位相及び振幅を決定することで、入力サンプルのY個の対応するフレームに基づいて、処理サンプルのフレームを生成するステップであって、少なくとも1つの処理サンプルに関し:
i)前記処理サンプルの前記位相は、入力サンプルの前記Y個のフレームの各々における対応する入力サンプル各自の位相に基づいており;及び
ii)前記処理サンプルの前記振幅は、入力サンプルの前記Y個のフレームのうちの第1フレームにおける対応する入力サンプルの振幅と、入力サンプルの前記Y個のフレームのうちの第2フレームにおける対応する入力サンプルの振幅との平均値として決定される、ステップ;
前記処理サンプルのフレームにウィンドウ関数を適用し、処理サンプルのウィンドウ処理されたフレームのシーケンスのサンプルをオーバーラップさせて加算することにより、合成サブバンド信号を決定するステップであって、前記ウィンドウ関数は前記フレーム長Lに対応する長さを有する四角形ウィンドウである、ステップ;及び
前記合成サブバンド信号から前記時間伸縮及び/又は周波数トランスポーズド信号を生成するステップ;
を有する方法。 - 請求項2に記載の方法を実行するためのコンピュータ読み取り可能な命令を保存する非一時的なデータキャリア。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023072979A JP7537723B2 (ja) | 2010-09-16 | 2023-04-27 | 信号生成システム及び信号生成方法 |
JP2024124149A JP2024138185A (ja) | 2010-09-16 | 2024-07-31 | 信号生成システム及び信号生成方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38344110P | 2010-09-16 | 2010-09-16 | |
US61/383,441 | 2010-09-16 | ||
US41916410P | 2010-12-02 | 2010-12-02 | |
US61/419,164 | 2010-12-02 | ||
JP2021034191A JP7053912B6 (ja) | 2010-09-16 | 2021-03-04 | 信号生成システム及び信号生成方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021034191A Division JP7053912B6 (ja) | 2010-09-16 | 2021-03-04 | 信号生成システム及び信号生成方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023072979A Division JP7537723B2 (ja) | 2010-09-16 | 2023-04-27 | 信号生成システム及び信号生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022088591A JP2022088591A (ja) | 2022-06-14 |
JP7273218B2 true JP7273218B2 (ja) | 2023-05-12 |
Family
ID=44720852
Family Applications (10)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013528595A Active JP5951614B2 (ja) | 2010-09-16 | 2011-09-05 | 信号生成システム及び信号生成方法 |
JP2016114659A Active JP6218889B2 (ja) | 2010-09-16 | 2016-06-08 | 信号生成システム及び信号生成方法 |
JP2017184543A Active JP6429966B2 (ja) | 2010-09-16 | 2017-09-26 | 信号生成システム及び信号生成方法 |
JP2018203461A Active JP6736634B2 (ja) | 2010-09-16 | 2018-10-30 | 信号生成システム及び信号生成方法 |
JP2020065607A Active JP6755426B2 (ja) | 2010-09-16 | 2020-04-01 | 信号生成システム及び信号生成方法 |
JP2020141616A Active JP6849847B2 (ja) | 2010-09-16 | 2020-08-25 | 信号生成システム及び信号生成方法 |
JP2021034191A Active JP7053912B6 (ja) | 2010-09-16 | 2021-03-04 | 信号生成システム及び信号生成方法 |
JP2022058101A Active JP7273218B2 (ja) | 2010-09-16 | 2022-03-31 | 信号生成システム及び信号生成方法 |
JP2023072979A Active JP7537723B2 (ja) | 2010-09-16 | 2023-04-27 | 信号生成システム及び信号生成方法 |
JP2024124149A Pending JP2024138185A (ja) | 2010-09-16 | 2024-07-31 | 信号生成システム及び信号生成方法 |
Family Applications Before (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013528595A Active JP5951614B2 (ja) | 2010-09-16 | 2011-09-05 | 信号生成システム及び信号生成方法 |
JP2016114659A Active JP6218889B2 (ja) | 2010-09-16 | 2016-06-08 | 信号生成システム及び信号生成方法 |
JP2017184543A Active JP6429966B2 (ja) | 2010-09-16 | 2017-09-26 | 信号生成システム及び信号生成方法 |
JP2018203461A Active JP6736634B2 (ja) | 2010-09-16 | 2018-10-30 | 信号生成システム及び信号生成方法 |
JP2020065607A Active JP6755426B2 (ja) | 2010-09-16 | 2020-04-01 | 信号生成システム及び信号生成方法 |
JP2020141616A Active JP6849847B2 (ja) | 2010-09-16 | 2020-08-25 | 信号生成システム及び信号生成方法 |
JP2021034191A Active JP7053912B6 (ja) | 2010-09-16 | 2021-03-04 | 信号生成システム及び信号生成方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023072979A Active JP7537723B2 (ja) | 2010-09-16 | 2023-04-27 | 信号生成システム及び信号生成方法 |
JP2024124149A Pending JP2024138185A (ja) | 2010-09-16 | 2024-07-31 | 信号生成システム及び信号生成方法 |
Country Status (18)
Country | Link |
---|---|
US (10) | US9172342B2 (ja) |
EP (6) | EP3975178B1 (ja) |
JP (10) | JP5951614B2 (ja) |
KR (12) | KR102014696B1 (ja) |
CN (2) | CN104851429B (ja) |
AU (1) | AU2011304113C1 (ja) |
BR (4) | BR112013005676B1 (ja) |
CA (10) | CA3191597C (ja) |
CL (1) | CL2013000717A1 (ja) |
DK (3) | DK3975178T3 (ja) |
ES (3) | ES2938725T3 (ja) |
IL (12) | IL296448A (ja) |
MX (1) | MX2013002876A (ja) |
MY (2) | MY155990A (ja) |
PL (4) | PL2617035T3 (ja) |
RU (6) | RU2671619C2 (ja) |
SG (3) | SG188229A1 (ja) |
WO (1) | WO2012034890A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
EP2682941A1 (de) | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
KR101782916B1 (ko) | 2013-09-17 | 2017-09-28 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
WO2015060654A1 (ko) | 2013-10-22 | 2015-04-30 | 한국전자통신연구원 | 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
WO2015099429A1 (ko) | 2013-12-23 | 2015-07-02 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
CN108600935B (zh) | 2014-03-19 | 2020-11-03 | 韦勒斯标准与技术协会公司 | 音频信号处理方法和设备 |
KR101856127B1 (ko) | 2014-04-02 | 2018-05-09 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
CN110266287B (zh) * | 2019-05-05 | 2023-06-23 | 深圳信息职业技术学院 | 电子耳蜗分数延迟滤波器构造方法、存储介质及电子耳蜗 |
US10938444B2 (en) * | 2019-07-12 | 2021-03-02 | Avago Technologies International Sales Pte. Limited | Apparatus and method for noise reduction in a full duplex repeater |
US11344298B2 (en) | 2019-12-06 | 2022-05-31 | Covidien Lp | Surgical stapling device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010081892A2 (en) | 2009-01-16 | 2010-07-22 | Dolby Sweden Ab | Cross product enhanced harmonic transposition |
WO2010086194A3 (en) | 2009-01-30 | 2011-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
WO2010086461A8 (en) | 2009-01-28 | 2011-11-24 | Dolby International Ab | Improved harmonic transposition |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774837A (en) | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6266003B1 (en) * | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
JP3518737B2 (ja) * | 1999-10-25 | 2004-04-12 | 日本ビクター株式会社 | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3537807B2 (ja) * | 2002-02-28 | 2004-06-14 | 株式会社神戸製鋼所 | デジタルデータ処理装置,およびその方法 |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
RU2374703C2 (ru) | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
EP4178110B1 (en) | 2006-01-27 | 2024-04-24 | Dolby International AB | Efficient filtering with a complex modulated filterbank |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
EP2054876B1 (en) | 2006-08-15 | 2011-10-26 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
KR101239812B1 (ko) * | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
KR102020334B1 (ko) * | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
ES2522171T3 (es) * | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
-
2011
- 2011-09-05 CA CA3191597A patent/CA3191597C/en active Active
- 2011-09-05 SG SG2013011804A patent/SG188229A1/en unknown
- 2011-09-05 AU AU2011304113A patent/AU2011304113C1/en active Active
- 2011-09-05 BR BR112013005676-2A patent/BR112013005676B1/pt active IP Right Grant
- 2011-09-05 EP EP21204206.3A patent/EP3975178B1/en active Active
- 2011-09-05 CA CA3137515A patent/CA3137515C/en active Active
- 2011-09-05 EP EP22202639.5A patent/EP4145445B1/en active Active
- 2011-09-05 PL PL11763872T patent/PL2617035T3/pl unknown
- 2011-09-05 CA CA3067155A patent/CA3067155C/en active Active
- 2011-09-05 CA CA3043428A patent/CA3043428C/en active Active
- 2011-09-05 CA CA3239279A patent/CA3239279A1/en active Pending
- 2011-09-05 KR KR1020197013601A patent/KR102014696B1/ko active IP Right Grant
- 2011-09-05 CN CN201510245547.2A patent/CN104851429B/zh active Active
- 2011-09-05 CA CA3220202A patent/CA3220202A1/en active Pending
- 2011-09-05 PL PL21204205.5T patent/PL3975177T3/pl unknown
- 2011-09-05 KR KR1020197023879A patent/KR102073544B1/ko active IP Right Grant
- 2011-09-05 KR KR1020187014134A patent/KR101924326B1/ko active IP Right Grant
- 2011-09-05 KR KR1020207002646A patent/KR102312475B1/ko active IP Right Grant
- 2011-09-05 KR KR1020137009361A patent/KR101610626B1/ko active IP Right Grant
- 2011-09-05 ES ES21204205T patent/ES2938725T3/es active Active
- 2011-09-05 CA CA3102325A patent/CA3102325C/en active Active
- 2011-09-05 KR KR1020227029790A patent/KR102564590B1/ko active IP Right Grant
- 2011-09-05 DK DK21204206.3T patent/DK3975178T3/da active
- 2011-09-05 IL IL296448A patent/IL296448A/en unknown
- 2011-09-05 RU RU2015105671A patent/RU2671619C2/ru active
- 2011-09-05 BR BR122019025142-8A patent/BR122019025142B1/pt active IP Right Grant
- 2011-09-05 EP EP21204205.5A patent/EP3975177B1/en active Active
- 2011-09-05 KR KR1020217032100A patent/KR102439053B1/ko active IP Right Grant
- 2011-09-05 BR BR122019025115-0A patent/BR122019025115B1/pt active IP Right Grant
- 2011-09-05 MY MYPI2013000542A patent/MY155990A/en unknown
- 2011-09-05 IL IL313284A patent/IL313284A/en unknown
- 2011-09-05 PL PL21204206.3T patent/PL3975178T3/pl unknown
- 2011-09-05 CA CA2808353A patent/CA2808353C/en active Active
- 2011-09-05 KR KR1020237026369A patent/KR102694615B1/ko active IP Right Grant
- 2011-09-05 ES ES11763872T patent/ES2699750T3/es active Active
- 2011-09-05 SG SG10202103492XA patent/SG10202103492XA/en unknown
- 2011-09-05 MY MYPI2014003119A patent/MY176574A/en unknown
- 2011-09-05 IL IL303921A patent/IL303921B1/en unknown
- 2011-09-05 DK DK21204205.5T patent/DK3975177T3/da active
- 2011-09-05 CA CA2961088A patent/CA2961088C/en active Active
- 2011-09-05 BR BR122019025121-5A patent/BR122019025121B1/pt active IP Right Grant
- 2011-09-05 PL PL22202637.9T patent/PL4148732T3/pl unknown
- 2011-09-05 DK DK11763872.6T patent/DK2617035T3/da active
- 2011-09-05 US US13/822,601 patent/US9172342B2/en active Active
- 2011-09-05 EP EP18198247.1A patent/EP3503100A1/en active Pending
- 2011-09-05 KR KR1020247026002A patent/KR20240122593A/ko active Search and Examination
- 2011-09-05 SG SG10201506914PA patent/SG10201506914PA/en unknown
- 2011-09-05 CA CA3168514A patent/CA3168514C/en active Active
- 2011-09-05 CN CN201180044307.6A patent/CN103262164B/zh active Active
- 2011-09-05 ES ES21204206T patent/ES2933477T3/es active Active
- 2011-09-05 KR KR1020147026155A patent/KR101744621B1/ko active IP Right Grant
- 2011-09-05 IL IL291501A patent/IL291501B2/en unknown
- 2011-09-05 MX MX2013002876A patent/MX2013002876A/es active IP Right Grant
- 2011-09-05 JP JP2013528595A patent/JP5951614B2/ja active Active
- 2011-09-05 RU RU2013117038/08A patent/RU2551817C2/ru active
- 2011-09-05 KR KR1020187033935A patent/KR101980070B1/ko active IP Right Grant
- 2011-09-05 IL IL298230A patent/IL298230B2/en unknown
- 2011-09-05 WO PCT/EP2011/065318 patent/WO2012034890A1/en active Application Filing
- 2011-09-05 KR KR1020177014269A patent/KR101863035B1/ko active IP Right Grant
- 2011-09-05 EP EP22202637.9A patent/EP4148732B1/en active Active
- 2011-09-05 EP EP11763872.6A patent/EP2617035B1/en active Active
-
2013
- 2013-02-18 IL IL224785A patent/IL224785A/en active IP Right Grant
- 2013-03-15 CL CL2013000717A patent/CL2013000717A1/es unknown
-
2015
- 2015-07-21 IL IL240068A patent/IL240068A/en active IP Right Grant
- 2015-09-15 US US14/854,498 patent/US9735750B2/en active Active
-
2016
- 2016-06-08 JP JP2016114659A patent/JP6218889B2/ja active Active
-
2017
- 2017-04-06 US US15/480,859 patent/US9940941B2/en active Active
- 2017-07-10 IL IL253387A patent/IL253387B/en active IP Right Grant
- 2017-09-26 JP JP2017184543A patent/JP6429966B2/ja active Active
-
2018
- 2018-02-26 US US15/904,702 patent/US10192562B2/en active Active
- 2018-05-01 IL IL259070A patent/IL259070A/en active IP Right Grant
- 2018-10-10 RU RU2018135675A patent/RU2682340C1/ru active
- 2018-10-30 JP JP2018203461A patent/JP6736634B2/ja active Active
- 2018-12-06 US US16/211,563 patent/US10446161B2/en active Active
-
2019
- 2019-01-16 RU RU2019101031A patent/RU2685993C1/ru active
- 2019-03-25 RU RU2019108565A patent/RU2694587C1/ru active
- 2019-03-31 IL IL265722A patent/IL265722B/en active IP Right Grant
- 2019-06-10 RU RU2019117896A patent/RU2720495C1/ru active
- 2019-08-20 US US16/545,359 patent/US10706863B2/en active Active
-
2020
- 2020-04-01 JP JP2020065607A patent/JP6755426B2/ja active Active
- 2020-06-30 US US16/917,171 patent/US11355133B2/en active Active
- 2020-08-25 JP JP2020141616A patent/JP6849847B2/ja active Active
- 2020-11-04 IL IL278478A patent/IL278478B/en unknown
-
2021
- 2021-03-04 JP JP2021034191A patent/JP7053912B6/ja active Active
- 2021-08-02 IL IL285298A patent/IL285298B/en unknown
-
2022
- 2022-03-31 JP JP2022058101A patent/JP7273218B2/ja active Active
- 2022-06-01 US US17/829,733 patent/US11817110B2/en active Active
-
2023
- 2023-04-27 JP JP2023072979A patent/JP7537723B2/ja active Active
- 2023-10-05 US US18/376,913 patent/US12033645B2/en active Active
-
2024
- 2024-05-28 US US18/675,865 patent/US20240312470A1/en active Pending
- 2024-07-31 JP JP2024124149A patent/JP2024138185A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010081892A2 (en) | 2009-01-16 | 2010-07-22 | Dolby Sweden Ab | Cross product enhanced harmonic transposition |
WO2010086461A8 (en) | 2009-01-28 | 2011-11-24 | Dolby International Ab | Improved harmonic transposition |
WO2010086194A3 (en) | 2009-01-30 | 2011-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
Non-Patent Citations (1)
Title |
---|
HUAN ZHOU,FINALIZATION OF CE ON QMF BASED HARMONIC TRANSPOSER,93. MPEG MEETING,2010年07月22日,NO.M17807,p.1-19 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7273218B2 (ja) | 信号生成システム及び信号生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7273218 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |