JPWO2019142513A1 - 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム - Google Patents
符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム Download PDFInfo
- Publication number
- JPWO2019142513A1 JPWO2019142513A1 JP2019565743A JP2019565743A JPWO2019142513A1 JP WO2019142513 A1 JPWO2019142513 A1 JP WO2019142513A1 JP 2019565743 A JP2019565743 A JP 2019565743A JP 2019565743 A JP2019565743 A JP 2019565743A JP WO2019142513 A1 JPWO2019142513 A1 JP WO2019142513A1
- Authority
- JP
- Japan
- Prior art keywords
- sound
- frequency spectrum
- frequency
- decoding
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000001228 spectrum Methods 0.000 claims abstract description 671
- 230000005236 sound signal Effects 0.000 claims abstract description 113
- 230000008569 process Effects 0.000 claims abstract description 53
- 230000003595 spectral effect Effects 0.000 claims 2
- 239000013598 vector Substances 0.000 description 106
- 238000012545 processing Methods 0.000 description 57
- 238000006243 chemical reaction Methods 0.000 description 46
- 238000000926 separation method Methods 0.000 description 16
- 230000006866 deterioration Effects 0.000 description 10
- 230000001174 ascending effect Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000010076 replication Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012856 packing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、所定の時間長のフレーム単位で入力された時間領域の音信号を符号化して符号を得て出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の音信号を出力する。符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた音声信号又は音響信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
図1を参照して、第一実施形態の符号化装置の処理手続きを説明する。図1に例示するように、第一実施形態の符号化装置は、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14、多重化部15を含む。符号化装置に入力された時間領域の音信号は周波数領域変換部11へ入力される。符号化装置は、各部で所定の時間長のフレーム単位での処理を行う。第一実施形態の符号化方法は、符号化装置の各部が、以下及び図2に例示するステップS11からステップS15の処理を行うことにより実現される。
周波数領域変換部11には、符号化装置に入力された時間領域の音信号が入力される。周波数領域変換部11は、所定の時間長のフレーム単位で、入力された時間領域の音信号を例えば修正離散コサイン変換(MDCT)などで周波数領域のN点の周波数スペクトル系列X0,…,XN-1に変換して出力する(ステップS11)。Nは正の整数であり、例えばN=32などである。また、Xに下付きで付してある添え字は周波数の低いスペクトルから順に振られている番号である。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。
摩擦音判定部12には、例えば、周波数領域変換部11が出力した周波数スペクトル系列X0,…,XN-1が入力される。摩擦音判定部12は、フレーム単位で、入力された周波数スペクトル系列X0,…,XN-1を用いて、音信号が摩擦音的な音であるか否かを判定し、その判定結果を摩擦音判定情報として摩擦音調整部13及び多重化部15へ出力する(ステップS12)。摩擦音判定情報としては、例えば、1ビットの情報を用いればよい。すなわち、摩擦音判定部12は、フレーム単位で、音信号が摩擦音的な音である場合には、摩擦音的な音であることを示す情報としてビット"1"を、当該フレームの音信号が摩擦音的な音でない場合には、摩擦音的な音でないことを示す情報としてビット"0"を、摩擦音判定情報として出力すればよい。
摩擦音調整部13には、周波数領域変換部11が出力した周波数スペクトル系列X0,…,XN-1と、摩擦音判定部12が出力した摩擦音判定情報が入力される。摩擦音調整部13は、フレーム単位で、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された周波数スペクトル系列X0,…,XN-1に対して以下の周波数スペクトルの調整処理を行って調整済周波数スペクトル系列Y0,…,YN-1を得て、得られた調整済周波数スペクトル系列Y0,…,YN-1を符号化部14へ出力し、摩擦音判定情報が摩擦音的な音でないことを示す場合には、周波数スペクトル系列X0,…,XN-1をそのまま調整済周波数スペクトル系列Y0,…,YN-1として符号化部14へ出力する(ステップS13)。
摩擦音調整部13は、摩擦音判定情報が摩擦音的な音であることを示す場合には、例えば、下記のStep 1-1からStep 1-6までを行うことにより調整済周波数スペクトル系列Y0,…,YN-1を得る。なお、下記のStep 1-1からStep 1-6までは摩擦音調整部13の動作を分かり易く示すために6個のステップに分けてあるが、下記のStep 1-1からStep 1-6までを分けて行うのはあくまでも一例であり、摩擦音調整部13は、配列の要素の入れ替えやインデックスの付け替えを行う等によりStep 1-1からStep 1-6までと等価な処理を1回のステップで行ってもよい。
また、摩擦音調整部13は、上記のStep 1-4に代えて下記のStep 1-4'を行ってもよい。
〔摩擦音調整部13が行う調整処理の例3〕
同様に、摩擦音調整部13は、上記のStep 1-5に代えて下記のStep 1-5'を行ってもよい。
また、摩擦音調整部13は、上記のStep 1-2における低域側周波数スペクトル系列からの高域側への調整対象サンプルには、周波数が最も低いものから1個または複数個のサンプルを含めないようにするのが望ましい。これは、周波数が低いサンプルはフレーム間の信号波形の連続性に寄与するサンプルであり、符号化部14でより多くのビットを割り当てた符号化をするべきだからである。すなわち、γを正の整数としたとき、低域側周波数スペクトル系列のうちのXγ,…,XM-1からC個の調整対象サンプルを選ぶようにするのがよく、例えばXγ,…,Xγ+C-1を調整対象サンプルとすればよい。なお、γの値を大きくすればフレーム間の信号波形の連続性は高まるが、その他のサンプルに符号化部14で割り当てられるビット数は相対的に少なくなることから、フレーム内の復号音の聴覚品質が低くなる。従って、γの値は、これらのことを考慮して、事前の実験等により定めるとよい。
後述する符号化部14での符号化処理においては、符号化処理で得るビット数の最大値の制約から、調整済周波数スペクトル系列のうちの周波数が最も高いものから何個かのサンプルにはビットが全く割り当てられないことがある。この場合は、高域側周波数スペクトル系列XM,…,XN-1のうちの周波数が最も高いものから1個または複数個のサンプルについては符号化対象とせずに、高域側周波数スペクトル系列XM,…,XN-1のうちの低域側にある残りのサンプルを符号化対象とするのがよい。従って、この場合には、摩擦音調整部13は、上記のStep 1-3における高域側周波数スペクトル系列からの低域側への調整対象サンプルには、高域側周波数スペクトル系列のうちの周波数が最も高いものから1個または複数個のサンプルは含めないようにする。
符号化部14には、摩擦音調整部13が出力した調整済周波数スペクトル系列Y0,…,YN-1が入力される。符号化部14は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1を、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法で、例えば非特許文献1と同じ方法で、符号化してスペクトル符号を得て、得たスペクトル符号を多重化部15へ出力する(ステップS14)。
多重化部15には、摩擦音判定部12が出力した摩擦音判定情報と符号化部14が出力したスペクトル符号が入力される。多重化部15は、フレーム単位で、入力された摩擦音判定情報に対応する符号とスペクトル符号とを繋ぎ合わせて得た符号を出力する(ステップS15)。摩擦音判定部12が出力した摩擦音判定情報が1ビットの情報である場合には、摩擦音判定部12が出力して多重化部15に入力された摩擦音判定情報そのものを摩擦音判定情報に対応する符号とすればよい。
図3を参照して、第一実施形態の復号装置の処理手続きを説明する。図3に例示するように、第一実施形態の復号装置は、多重分離部21、復号部22、摩擦音調整解除部23、時間領域変換部24を含む。復号装置には符号化装置が出力した符号が入力される。復号装置に入力された符号は多重分離部21へ入力される。復号装置は、各部で所定の時間長のフレーム単位での処理を行う。第一実施形態の復号方法は、復号装置の各部が、以下及び図4に例示するステップS21からステップS24の処理を行うことにより実現される。
多重分離部21には、符号化装置が出力した符号が入力される。多重分離部21は、フレーム単位で、入力された符号を摩擦音判定情報に対応する符号とスペクトル符号に分離して、摩擦音判定情報に対応する符号から得た摩擦音判定情報を摩擦音調整解除部23へ、スペクトル符号を復号部22へそれぞれ出力する(ステップS21)。
復号部22には、多重分離部21の出力したスペクトル符号が入力される。復号部22は、フレーム単位で、符号化装置の符号化部14が行った符号化方法に対応する復号方法により、入力されたスペクトル符号を復号して復号調整済周波数スペクトル系列^Y0,…,^YN-1を得て、得た復号調整済周波数スペクトル系列^Y0,…,^YN-1を摩擦音調整解除部23へ出力する(ステップS22)。
摩擦音調整解除部23には、多重分離部21が出力した摩擦音判定情報と復号部22が出力した復号調整済周波数スペクトル系列^Y0,…,^YN-1が入力される。摩擦音調整解除部23は、フレーム単位で、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された復号調整済周波数スペクトル系列^Y0,…,^YN-1に対して以下の調整解除処理を行って復号周波数スペクトル系列^X0,…,^XN-1を得て、得られた復号周波数スペクトル系列^X0,^X1,…,^XN-1を時間領域変換部24へ出力し、摩擦音判定情報が摩擦音的な音でないと示す場合には、復号調整済周波数スペクトル系列^Y0,…,^YN-1をそのまま復号周波数スペクトル系列^X0,…,^XN-1として時間領域変換部24へ出力する(ステップS23)。
摩擦音調整解除部23は、摩擦音判定情報が摩擦音的な音であることを示す場合には、例えば、下記のStep 2-1からStep 2-6までを行うことにより復号周波数スペクトル系列^X0,…,^XN-1を得る。なお、下記のStep 2-1からStep 2-6までは摩擦音調整解除部23の動作を分かり易く示すために6個のステップに分けてあるが、摩擦音調整解除部23は、下記のStep 2-1からStep 2-6までを分けて行うのはあくまでも一例であり、配列の要素の入れ替えやインデックスの付け替えを行う等によりStep 2-1からStep 2-6までと等価な処理を1回のステップで行ってもよい。
摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-4に代えてStep 1-4'を行った場合には、上記のStep 2-4に代えて下記のStep 2-4'を行う。
摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-5に代えてStep 1-5'を行った場合には、上記のStep 2-5に代えて下記のStep 2-5'を行う。
摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-2において低域側周波数スペクトル系列からの高域側への調整対象サンプルに周波数が最も低いものから1個または複数個のサンプルを含めないようにした場合には、Step 2-2において、低域側復号調整済周波数スペクトル系列からの高域側への調整対象サンプルに周波数が最も低いものから1個または複数個のサンプルを含めないようにする。
摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-3において高域側周波数スペクトル系列からの低域側への調整対象サンプルに周波数が最も高いものから1個または複数個のサンプルを含めないようにした場合には、Step 2-3において、高域側復号調整済周波数スペクトル系列からの低域側への調整対象サンプルに周波数が最も高いものから1個または複数個のサンプルを含めないようにする。
時間領域変換部24には、摩擦音調整解除部23が出力した復号周波数スペクトル系列^X0,…,^XN-1が入力される。時間領域変換部24は、フレーム毎に、復号周波数スペクトル系列^X0,…,^XN-1を、符号化装置の周波数領域変換部11が行った周波数領域への変換方法に対応する時間領域への変換方法、例えば逆MDCT、を用いて時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得て出力する(ステップS24)。
第一実施形態の符号化装置と復号装置によれば、従来のような低周波数のスペクトルに対してよりビット数を割くように設計がされた符号化処理やこれらに対応する復号処理が行われる構成に、摩擦音調整処理やこれに対応する摩擦音調整解除処理を付加した構成とすることで、摩擦音などを含む音信号であっても聴感的な劣化が少なくなるように圧縮符号化することが可能となる。
第一実施形態の変形例は、符号化装置に含まれる摩擦音判定部12のみが第一実施形態と異なる。符号化装置のその他の構成や復号装置の構成は第一実施形態と同じである。以下では、第一実施形態と異なる摩擦音判定部12の動作と、それによる符号化装置と復号装置での作用効果について説明する。
第一実施形態の変形例の摩擦音判定部12は、図示しない比較結果記憶部を備える。
第一実施形態の符号化装置と復号装置での処理を行うと、調整処理と調整解除処理が行われるフレームについては高域成分の符号化歪が少なく低域成分の符号化歪が多い復号音が得られ、調整処理と調整解除処理が行われないフレームについては高域成分の符号化歪が多く低域成分の符号化歪が少ない復号音が得られることから、調整処理と調整解除処理が行われるフレームと調整処理と調整解除処理が行われないフレームとの境界では復号音の波形の不連続が発生する可能性がある。すなわち、摩擦音判定部12の判定結果が頻繁に切り替わると、復号音の波形の不連続が頻繁に発生することになり、この不連続が知覚されることにより聴覚品質が劣化してしまう可能性がある。第一実施形態の変形例の符号化装置は、第一実施形態の符号化装置よりも、摩擦音判定部12の判定結果が頻繁に切り替わることを抑制することができ、復号音の波形の不連続の発生頻度を抑制することができ、この不連続が知覚されることによる聴覚品質の劣化を抑えることができる。
この発明の第二実施形態のシステムは、第一実施形態のシステムと同様に、符号化装置と復号装置を含む。
図9を参照して、第二実施形態の符号化装置の処理手続きを説明する。図9に例示するように、第二実施形態の符号化装置は、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14、帯域拡張利得符号化部16、多重化部15を含む。図9の第二実施形態の符号化装置が図1の符号化装置と異なるのは、帯域拡張利得符号化部16を備え、多重化部15が、帯域拡張利得符号化部16が出力した帯域拡張利得符号も出力する符号に含めることである。第二実施形態の符号化装置のその他の構成、すなわち、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14の動作は第一実施形態の符号化装置のものと同じであるので、以下では動作の要部のみを説明する。
周波数領域変換部11は、フレーム単位で、符号化装置に入力された時間領域の音信号を周波数領域のN点の周波数スペクトル系列X0,…,XN-1に変換して出力する(ステップS11)。
摩擦音判定部12は、フレーム単位で、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1または符号化装置に入力された時間領域の音信号を用いて、音信号が摩擦音的な音であるか否かを判定し、その判定結果を摩擦音判定情報として出力する(ステップS12)。第一実施形態の符号化装置の摩擦音判定部12は摩擦音判定情報を摩擦音調整部13と多重化部15に出力したが、第二実施形態の符号化装置の摩擦音判定部12は、摩擦音判定情報を摩擦音調整部13と多重化部15に加えて帯域拡張利得符号化部16へも出力する。なお、第二実施形態の符号化装置の摩擦音判定部12は、第一実施形態の変形例の符号化装置の摩擦音判定部12と同じ動作をしてもよい。
摩擦音調整部13は、フレーム単位で、摩擦音判定部12が得た摩擦音判定情報が摩擦音的な音であることを示す場合には、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1に対して周波数スペクトルの調整処理を行って調整済周波数スペクトル系列Y0,…,YN-1を得て、得られた調整済周波数スペクトル系列Y0,…,YN-1を符号化部14へ出力し、摩擦音判定部12が得た摩擦音判定情報が摩擦音的な音でないことを示す場合には、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1をそのまま調整済周波数スペクトル系列Y0,…,YN-1として符号化部14へ出力する(ステップS13)。
符号化部14は、フレーム単位で、摩擦音調整部13が得た調整済周波数スペクトル系列Y0,…,YN-1を、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法で、符号化してスペクトル符号を得て、得たスペクトル符号を多重化部15へ出力する(ステップS14)。
帯域拡張利得符号化部16には、摩擦音調整部13が出力した調整済周波数スペクトル系列Y0,…,YN-1が少なくとも入力される。帯域拡張利得符号化部16は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1に少なくとも基づいて下記のように帯域拡張利得符号を得て、得た帯域拡張利得符号を多重化部15へ出力する(ステップS16)。
この例では、記憶部161には利得候補ベクトルと符号の組がJ組格納されていて、各利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の利得候補ベクトルそれぞれをGj (j=0,…,J-1)とし、利得候補ベクトルGj(j=0,…,J-1)のそれぞれに対応する符号をCGj(j=0,…,J-1)とし、それぞれの利得候補ベクトルGjはK個の利得候補値gj,k (k=0,…,K-1)により構成されているとして説明する。
この例では、記憶部161には例1と同様に利得候補ベクトルと符号の組がJ組格納されているが、例1とは異なり、利得候補ベクトルとして摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルの2種類が格納されているとする。すなわち、記憶部161には摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルと符号の組がJ組格納されていて、各摩擦音用利得候補ベクトルと各非摩擦音用利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の摩擦音用利得候補ベクトルそれぞれをG1j (j=0,…,J-1)とし、J個の非摩擦音用利得候補ベクトルそれぞれをG2j (j=0,…,J-1)とし、摩擦音用利得候補ベクトルG1j (j=0,…,J-1)のそれぞれに対応しかつ非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)のそれぞれに対応する符号をCGj (j=0,…,J-1)として説明する。また、それぞれの摩擦音用利得候補ベクトルG1jはKサンプル分すなわちK個の利得候補値g1j,k (k=0,…,K-1)により構成されていて、それぞれの非摩擦音用利得候補ベクトルG2jはKサンプル分すなわちK個の利得候補値g2j,k(k=0,…,K-1)により構成されているとして説明する。
上述した例1と例2では、利得候補値の乗算の対象とする調整済周波数スペクトルは、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-2K,…,YN-K-1とした。しかし、利得候補値の乗算の対象とする調整済周波数スペクトルは、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちの予め定めたK個のサンプル番号に対応するK個の調整済周波数スペクトルであればよい。
上述した例1と例2では、式(1)ではkの値が小さい順のYN-2K+k、gj,k、YN-K+kを対応付けているが、予め定めた対応付けであればどのような対応付けでもよい。
N=32, K=12の場合の帯域拡張利得符号化部16の具体例を説明する。この具体例は帯域拡張利得符号化部16の例2の変形例2に対応する。図13と図14は、N=32, K=12の場合の後述する復号装置の帯域拡張部25と摩擦音調整解除部23の例である。
多重化部15には、摩擦音判定部12が出力した摩擦音判定情報と、符号化部14が出力したスペクトル符号と、帯域拡張利得符号化部16が出力した帯域拡張利得符号が入力される。多重化部15は、入力された摩擦音判定情報に対応する符号とスペクトル符号と帯域利得符号とを繋ぎ合わせて得た符号を出力する(ステップS15)。
図11を参照して、第二実施形態の復号装置の処理手続きを説明する。図11に例示するように、第二実施形態の復号装置は、多重分離部21、復号部22、帯域拡張部25、摩擦音調整解除部23、時間領域変換部24を含む。図11の第二実施形態の復号装置が図3の第一実施形態の復号装置と異なるのは、帯域拡張部25を備え、多重分離部21が、入力された符号から帯域拡張利得符号も得ることである。第二実施形態の復号装置のその他の構成、すなわち、復号部22、摩擦音調整解除部23、時間領域変換部24の動作は第一実施形態の復号装置のものと同じであるので、以下では動作の要部のみを説明する。
多重分離部21は、入力された符号を摩擦音判定情報に対応する符号と帯域拡張利得符号とスペクトル符号に分離して、摩擦音判定情報に対応する符号から得た摩擦音判定情報を摩擦音調整解除部23と帯域拡張部25へ、帯域拡張利得符号を帯域拡張部25へ、スペクトル符号を復号部22へそれぞれ出力する(ステップS21)。
復号部22は、フレーム単位で、符号化装置の符号化部14が行った符号化処理に対応する復号処理により、入力されたスペクトル符号を復号して復号調整済周波数スペクトル系列を得て出力する(ステップS22)。
帯域拡張部25には、多重分離部21が出力した帯域拡張利得符号と復号部22が出力した復号調整済周波数スペクトル系列が少なくとも入力される。帯域拡張部25は、フレーム単位で、入力された帯域拡張利得符号と復号調整済周波数スペクトル系列に少なくとも基づいて下記のように復号拡張周波数スペクトル系列~Y0,…,~YN-1を得て、得た復号拡張周波数スペクトル系列~Y0,…,~YN-1を摩擦音調整解除部23へ出力する(ステップS25)。
この例では、記憶部251には利得候補ベクトルと符号の組がJ組格納されていて、各利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の利得候補ベクトルそれぞれをGj (j=0,…,J-1)とし、利得候補ベクトルGj(j=0,…,J-1)それぞれに対応する符号をCGj(j=0,…,J-1)とし、それぞれの利得候補ベクトルGjはKサンプル分すなわちK個の利得候補値gj,k(k=0,…,K-1)により構成されているとして説明する。
この例では、記憶部251には例1と同様に利得候補ベクトルと符号の組がJ組格納されているが、例1とは異なり、利得候補ベクトルとして摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルの2種類が格納されているとする。すなわち、記憶部251には摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルと符号の組がJ組格納されていて、各摩擦音用利得候補ベクトルと各非摩擦音用利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の摩擦音用利得候補ベクトルそれぞれをG1j (j=0,…,J-1)とし、J個の非摩擦音用利得候補ベクトルそれぞれをG2j (j=0,…,J-1)とし、摩擦音用利得候補ベクトルG1j (j=0,…,J-1)のそれぞれに対応しかつ非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)のそれぞれに対応する符号をCGj (j=0,…,J-1)として説明する。また、それぞれの摩擦音用利得候補ベクトルG1jはKサンプル分すなわちK個の利得候補値g1j,k (k=0,…,K-1)により構成されていて、それぞれの非摩擦音用利得候補ベクトルG2jはKサンプル分すなわちK個の利得候補値g2j,k(k=0,…,K-1)により構成されているとして説明する。
上述した例1と例2では、帯域拡張利得の乗算の対象とする復号調整済周波数スペクトルは、スペクトル符号を復号して得られた復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトル^YN-2K,…,^YN-K-1とした。しかし、帯域拡張利得の乗算の対象とする復号調整済周波数スペクトルは、スペクトル符号を復号して得られた復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちの予め定めたK個のサンプル番号に対応するK個の復号調整済周波数スペクトルであればよい。
上述した例1と例2では、kの値が小さい順の復号調整済周波数スペクトル^YN-2K+kと、kの値が小さい順の帯域拡張利得gkと、を乗算して、kの値が小さい順の復号拡張周波数スペクトル~YN-K+kを得ているが、すなわち、kの値が小さい順での対応付けをしているが、予め定めた対応付けであればどのような対応付けでもよい。
N=32, K=12の場合の帯域拡張部25の具体例を説明する。この具体例は帯域拡張部25の例2の変形例2に対応する。図13と図14は、N=32, K=12の場合の帯域拡張部25と摩擦音調整解除部23の処理の例である。
摩擦音調整解除部23には、多重分離部21が出力した摩擦音判定情報と帯域拡張部25が出力した復号拡張周波数スペクトル系列~Y0,…,~YN-1が入力される。摩擦音調整解除部23は、フレーム単位で入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された復号拡張周波数スペクトル系列~Y0,…,~YN-1に対して調整解除処理を行って復号周波数スペクトル系列^X0,…,^XN-1を得て、得られた復号周波数スペクトル系列^X0,…,^XN-1を時間領域変換部24へ出力し、摩擦音判定情報が摩擦音的な音でないと示す場合には、復号拡張周波数スペクトル系列~Y0,…,~YN-1をそのまま復号周波数スペクトル系列^X0,…,^XN-1として時間領域変換部24へ出力する(ステップS23)。
時間領域変換部24は、フレーム毎に、復号周波数スペクトル系列^X0,…,^XN-1を、符号化装置の周波数領域変換部11が行った周波数領域への変換方法に対応する時間領域への変換方法を用いて時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得て出力する(ステップS24)。
第二実施形態の符号化装置と復号装置によれば、第一実施形態の符号化装置と復号装置と同様に、摩擦音調整処理と摩擦音調整解除処理を行うことで、摩擦音的な音の時間区間では高域に優先してビットが割り当て、そうでない時間区間では低域に優先してビットを割り当てられるようにすることで、摩擦音などを含む音信号であっても聴感的な劣化を少なくすることができる。
符号化装置、復号装置及び摩擦音判定装置のそれぞれを、コンピュータによって実現してもよい。この場合、符号化装置、復号装置及び摩擦音判定装置のそれぞれが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、符号化装置、復号装置及び摩擦音判定装置のそれぞれがコンピュータ上で実現される。
多重化部15には、摩擦音判定部12が出力した摩擦音判定情報と、符号化部14が出力したスペクトル符号と、帯域拡張利得符号化部16が出力した帯域拡張利得符号が入力される。多重化部15は、入力された摩擦音判定情報に対応する符号とスペクトル符号と帯域拡張利得符号とを繋ぎ合わせて得た符号を出力する(ステップS15)。
Claims (19)
- 所定の時間区間のフレーム単位の音信号に対応する周波数領域のサンプル列を低域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得る符号化部を含む符号化装置であって、
前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定部と、
前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、前記周波数スペクトル系列のうちの前記所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、前記音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る摩擦音調整部と、を更に含み、
前記符号化部は、前記摩擦音調整部が得た調整済周波数スペクトル系列を前記音信号に対応する前記周波数領域のサンプル列として符号化してスペクトル符号を得る、
符号化装置。 - 請求項1に記載の符号化装置であって、
前記摩擦音調整部は、前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記調整済周波数スペクトル系列が低域側調整済周波数スペクトル系列と高域側調整済周波数スペクトル系列により構成されるとして、前記低域側周波数スペクトル系列中の一部のサンプルを前記高域側調整済周波数スペクトル系列中に含め、前記低域側周波数スペクトル系列中の残りのサンプルを前記低域側調整済周波数スペクトル系列中の低域側に配置し、前記高域側周波数スペクトル系列中の一部のサンプルを前記低域側調整済周波数スペクトル系列中の高域側に配置し、前記高域側周波数スペクトル系列中の残りのサンプルを前記高域側調整済周波数スペクトル系列中に含めることにより前記調整済周波数スペクトル系列を得る、
符号化装置。 - 請求項1に記載の符号化装置であって、
前記摩擦音調整部は、前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記低域側周波数スペクトル系列中の高域側にある一部と、これと同数の、前記高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得る、
符号化装置。 - 請求項1から3の何れかに記載の符号化装置であって、
前記摩擦音調整部は、前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記調整済周波数スペクトル系列が低域側調整済周波数スペクトル系列と高域側調整済周波数スペクトル系列により構成されるとして、前記低域側周波数スペクトル系列中の一部のサンプルを前記高域側調整済周波数スペクトル系列中の高域側に配置し、前記低域側周波数スペクトル系列中の残りのサンプルを前記低域側調整済周波数スペクトル系列中に含め、前記高域側周波数スペクトル系列中の一部のサンプルを前記低域側調整済周波数スペクトル系列中に含め、前記高域側周波数スペクトル系列中の残りのサンプルを前記高域側調整済周波数スペクトル系列中の低域側に配置することにより前記調整済周波数スペクトル系列を得る、
符号化装置。 - 請求項1から4の何れかに記載の符号化装置であって、
前記摩擦音調整部は、前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記低域側周波数スペクトル系列の全部または一部と、これと同数の、前記高域側周波数スペクトル系列中の低域側にある一部と、を入れ替えたものを調整済周波数スペクトル系列として得る、
符号化装置。 - 所定の時間区間のフレーム単位の音信号の周波数スペクトル系列を符号化してスペクトル符号を得る符号化装置であって、
前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定部と、
前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記周波数スペクトル系列を高域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得て、前記以外の場合には、前記周波数スペクトル系列を低域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得る摩擦音対応符号化部と、含む、
符号化装置。 - 請求項1から6の何れかに記載の符号化装置であって、
前記摩擦音判定部は、当該フレームの前記周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が、予め定めた閾値より大きいか閾値以上である場合に、前記音信号が摩擦音的な音であると判定する、
符号化装置。 - 請求項1から6の何れかに記載の符号化装置であって、
前記摩擦音判定部は、当該フレームを含む複数のフレームにおいて、前記周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、前記音信号が摩擦音的な音であると判定する、
符号化装置。 - 所定の時間区間のフレーム単位のスペクトル符号であって、低域側に優先してビットが割り当てられているスペクトル符号、を復号して、復号音信号に対応する周波数領域のサンプル列を得る復号部を含む復号装置であって、
入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記復号部が得た周波数領域のサンプル列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、前記復号部が得た周波数領域のサンプル列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、前記復号部が得た周波数領域のサンプル列をそのまま復号音信号の周波数スペクトル系列として得る摩擦音調整解除部を更に含む、
復号装置。 - 所定の時間区間のフレーム単位のスペクトル符号を復号して復号音信号の周波数スペクトル系列を得る復号装置であって、
入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記スペクトル符号には高域側に優先してビットが割り当てられているとして、前記スペクトル符号を復号して前記周波数スペクトル系列を得て、前記以外の場合には、前記スペクトル符号には低域側に優先してビットが割り当てられているとして、前記スペクトル符号を復号して前記周波数スペクトル系列を得る摩擦音対応復号部を含む、
復号装置。 - 所定の時間区間のフレーム単位で音信号が摩擦音的な音であるか否かを判定する摩擦音判定装置であって、
当該フレームを含む複数のフレームにおいて、前記音信号の周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、当該フレームについて音信号が摩擦音的な音であると判定する摩擦音判定部を含む、
摩擦音判定装置。 - 所定の時間区間のフレーム単位の音信号に対応する周波数領域のサンプル列を低域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得る符号化ステップを含む符号化方法であって、
前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定ステップと、
前記摩擦音判定ステップが摩擦音的な音であると判定した場合には、前記音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、前記周波数スペクトル系列のうちの前記所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、前記音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る摩擦音調整ステップと、を更に含み、
前記符号化ステップは、前記摩擦音調整ステップが得た調整済周波数スペクトル系列を前記音信号に対応する前記周波数領域のサンプル列として符号化してスペクトル符号を得る、
符号化方法。 - 所定の時間区間のフレーム単位の音信号の周波数スペクトル系列を符号化してスペクトル符号を得る符号化方法であって、
前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定ステップと、前記摩擦音判定ステップが摩擦音的な音であると判定した場合には、前記周波数スペクトル系列を高域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得て、前記以外の場合には、前記周波数スペクトル系列を低域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得る摩擦音対応符号化ステップと、含む、
符号化方法。 - 所定の時間区間のフレーム単位のスペクトル符号であって、低域側に優先してビットが割り当てられているスペクトル符号、を復号して、復号音信号に対応する周波数領域のサンプル列を得る復号ステップを含む復号方法であって、
入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記復号ステップが得た周波数領域のサンプル列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、前記復号ステップが得た周波数領域のサンプル列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、前記復号ステップが得た周波数領域のサンプル列をそのまま復号音信号の周波数スペクトル系列として得る摩擦音調整解除ステップを更に含む、
復号方法。 - 所定の時間区間のフレーム単位のスペクトル符号を復号して復号音信号の周波数スペクトル系列を得る復号方法であって、
入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記スペクトル符号には高域側に優先してビットが割り当てられているとして、前記スペクトル符号を復号して前記周波数スペクトル系列を得て、前記以外の場合には、前記スペクトル符号には低域側に優先してビットが割り当てられているとして、前記スペクトル符号を復号して前記周波数スペクトル系列を得る摩擦音対応復号ステップと、含む、
復号方法。 - 所定の時間区間のフレーム単位で音信号が摩擦音的な音であるか否かを判定する摩擦音判定方法であって、
当該フレームを含む複数のフレームにおいて、前記音信号の周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、当該フレームについて音信号が摩擦音的な音であると判定する摩擦音判定ステップを含む、
摩擦音判定方法。 - 請求項1から8の何れかの符号化装置の各部としてコンピュータを機能させるためのプログラム。
- 請求項9または10の復号装置の各部としてコンピュータを機能させるためのプログラム。
- 請求項11の摩擦音判定装置の各部としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018005769 | 2018-01-17 | ||
JP2018005769 | 2018-01-17 | ||
PCT/JP2018/044334 WO2019142513A1 (ja) | 2018-01-17 | 2018-12-03 | 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019142513A1 true JPWO2019142513A1 (ja) | 2021-01-07 |
JP6962385B2 JP6962385B2 (ja) | 2021-11-05 |
Family
ID=67301731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019565743A Active JP6962385B2 (ja) | 2018-01-17 | 2018-12-03 | 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11417345B2 (ja) |
EP (1) | EP3742441B1 (ja) |
JP (1) | JP6962385B2 (ja) |
CN (1) | CN111602196B (ja) |
WO (1) | WO2019142513A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4095855B1 (en) * | 2018-01-17 | 2023-10-04 | Nippon Telegraph And Telephone Corporation | Decoding apparatus, encoding apparatus, and methods and programs therefor |
WO2020250369A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
WO2020250371A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号符号化送信方法、音信号符号化方法、音信号送信側装置、符号化装置、プログラム及び記録媒体 |
CN113518227B (zh) * | 2020-04-09 | 2023-02-10 | 于江鸿 | 数据处理的方法和系统 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
JP3566220B2 (ja) * | 2001-03-09 | 2004-09-15 | 三菱電機株式会社 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
JP3976169B2 (ja) * | 2001-09-27 | 2007-09-12 | 株式会社ケンウッド | 音声信号加工装置、音声信号加工方法及びプログラム |
JP3875890B2 (ja) * | 2002-01-21 | 2007-01-31 | 株式会社ケンウッド | 音声信号加工装置、音声信号加工方法及びプログラム |
DE602004008214D1 (de) * | 2004-03-18 | 2007-09-27 | St Microelectronics Srl | Verfahren und Vorrichtungen zur Kodierung/Dekodierung von Signalen, sowie Computerprogrammprodukt dafür |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
CA2961336C (en) * | 2013-01-29 | 2021-09-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
CN104637486B (zh) * | 2013-11-07 | 2017-12-29 | 华为技术有限公司 | 一种数据帧的内插方法及装置 |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
JP6398607B2 (ja) | 2014-10-24 | 2018-10-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
EP4095855B1 (en) * | 2018-01-17 | 2023-10-04 | Nippon Telegraph And Telephone Corporation | Decoding apparatus, encoding apparatus, and methods and programs therefor |
-
2018
- 2018-12-03 JP JP2019565743A patent/JP6962385B2/ja active Active
- 2018-12-03 EP EP18901772.6A patent/EP3742441B1/en active Active
- 2018-12-03 US US16/962,047 patent/US11417345B2/en active Active
- 2018-12-03 WO PCT/JP2018/044334 patent/WO2019142513A1/ja unknown
- 2018-12-03 CN CN201880086656.6A patent/CN111602196B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP6962385B2 (ja) | 2021-11-05 |
WO2019142513A1 (ja) | 2019-07-25 |
EP3742441B1 (en) | 2023-04-12 |
US20200411016A1 (en) | 2020-12-31 |
EP3742441A4 (en) | 2022-03-09 |
CN111602196A (zh) | 2020-08-28 |
US11417345B2 (en) | 2022-08-16 |
CN111602196B (zh) | 2023-08-04 |
EP3742441A1 (en) | 2020-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6962385B2 (ja) | 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム | |
JP6962386B2 (ja) | 復号装置、符号化装置、これらの方法及びプログラム | |
AU2018204110B2 (en) | Signal processing apparatus and method, and program | |
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
JP4876574B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP5942358B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
KR101913241B1 (ko) | 인코딩 방법 및 장치 | |
JP5730303B2 (ja) | 復号装置、符号化装置およびこれらの方法 | |
JP4628861B2 (ja) | 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法 | |
JP2005338850A (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
KR100750115B1 (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
JP2009288560A (ja) | 音声符号化装置、音声復号装置、及びプログラム | |
JPH0591062A (ja) | オーデイオ信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6962385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |