JPWO2014077254A1 - 音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム - Google Patents
音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム Download PDFInfo
- Publication number
- JPWO2014077254A1 JPWO2014077254A1 JP2014546993A JP2014546993A JPWO2014077254A1 JP WO2014077254 A1 JPWO2014077254 A1 JP WO2014077254A1 JP 2014546993 A JP2014546993 A JP 2014546993A JP 2014546993 A JP2014546993 A JP 2014546993A JP WO2014077254 A1 JPWO2014077254 A1 JP WO2014077254A1
- Authority
- JP
- Japan
- Prior art keywords
- auxiliary information
- speech
- voice
- signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 173
- 238000012545 processing Methods 0.000 claims abstract description 134
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 45
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 45
- 230000003044 adaptive effect Effects 0.000 claims description 158
- 230000006870 function Effects 0.000 claims description 21
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 73
- 230000005284 excitation Effects 0.000 description 56
- 230000008569 process Effects 0.000 description 33
- 230000007774 longterm Effects 0.000 description 13
- 238000001914 filtration Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000013139 quantization Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000008054 signal transmission Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical class C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- 101000775670 Lycodes polaris Ice-structuring protein LP Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
音声パラメータ復号部122は、音声符号を復号して音声パラメータを出力する(図7ステップS142)。
音声パラメータ紛失処理部123は、補助情報蓄積部126から補助情報を読み出し、補助情報に含まれないパラメータについては予測を行うことで、音声パラメータを出力する(図7ステップS146)。
本実施例では、補助情報としてピッチラグを伝送し、復号側ではパケットロス隠蔽信号の生成に用いる例について記載する。
音声信号送信装置において、入力音声信号は、音声符号化部111に送られる。
また、
Tp=argmaxTk
u(n)=u(n+L) (0≦n<N−L)
u(n+N−L)=e(n) (0≦n<L)
1.ピッチラグ
2.直前サブフレームのピッチラグとの差分
3.ピッチラグ
4.ピッチラグ
図5に示す通り、音声信号受信装置は、音声符号バッファ121、音声パラメータ復号部122、音声パラメータ紛失処理部123、音声合成部124、補助情報復号部125、補助情報蓄積部126からなる。音声信号受信装置の処理手順は図7に示す通りである。
音声パラメータ復号部122は、受信した音声符号を復号し、符号化対象フレームに関する音声を合成するのに必要な音声パラメータ(ISPパラメータおよび対応するISFパラメータ、ピッチラグ、長期予測パラメータ、適応符号帳、適応符号帳ゲイン、固定符号帳ゲイン、固定符号帳ベクトル等)を算出する(図7ステップ142)。
v’(n)=0.18v’(n−1)+0.64v’(n)+0.18v’(n+1)
e(n)=gp・v’(n)+gc・c(n)
u(n)=u(n+L) (0≦n<N−L)
u(n+N−L)=e(n) (0≦n<L)
音声パラメータ紛失処理部123は、補助情報蓄積部126からピッチラグ
実施例1の変形例として、ピッチゲインを補助情報に追加する例を示す。変形例1−1と実施例1との差分は、励振ベクトル合成部155の動作のみであるので、その他の部分について説明を省略する。
励振ベクトル合成部155の処理手順を図14に示す。
励振ベクトル合成部155は、適応符号帳ベクトルv’(n)に補助情報符号を復号することにより得られる適応符号帳ゲイン
実施例1の変形例として、補助情報の利用判断のためのフラグを補助情報に追加する例を示す。
補助情報符号化部の機能構成例を図17に、補助情報符号化部の処理手順を図18に示す。実施例1との差分は、補助情報出力判定部1128(図18ステップ1131)のみであるので、その他の部分について説明を省略する。
補助情報復号部は、補助情報符号に含まれるフラグを復号する。音声パラメータ紛失処理部は、フラグの値がオンの場合は、実施例1と同様の処理手順により復号信号を算出する。一方、フラグの値がオフの場合は、補助情報を用いないパケットロス隠蔽手法により復号信号を算出する(図19ステップ1151)。
本実施例では、先読み信号部分の復号音声を正常受信時にも利用する例について述べる。説明を容易にするため、1フレームに含まれるサブフレームの数をMサブフレーム、先読み信号の長さをM’サブフレームとする。
音声信号送信装置は、図20に示す通り、主要符号化部211、補助情報符号化部212、隠蔽信号蓄積部213、誤差信号符号化部214からなる。音声信号送信装置の処理手順を図22に示す。
図23に示す通り、音声信号受信装置は、音声符号バッファ231、音声パラメータ復号部232、音声パラメータ紛失処理部233、音声合成部234、補助情報復号部235、補助情報蓄積部236、誤差信号復号部237、隠蔽信号蓄積部238からなる。音声信号受信装置の処理手順を図24に示す。音声合成部234の機能構成を図25に示す。
誤差信号復号部237は誤差信号符合を復号して復号誤差信号を得る。具体的な処理手順として非特許文献4の7.1.2.1.2節に記載のAVQ等、符号化側で用いた方法に対応した復号方法を用いる(図24ステップ242)。
ISF予測部191は、直前フレームのISFパラメータを用いてISFパラメータを予測し、LP係数に変換する。処理手順は実施例1の図10のステップ172、173、174と同様である(図24ステップ2412)。
隠蔽信号蓄積部から1サブフレーム分の隠蔽信号を読み出し、復号信号とする(図24ステップ2419)。
適応符号帳ベクトルの算出に当たって、声門パルス同期を用いる場合について述べる。
音声信号送信装置の機能構成は実施例1と同じである。機能構成および処理手順が異なるのは補助情報符号化部のみであるので、ここでは補助情報符号化部の動作についてのみ述べる。
音声信号受信装置の機能構成は実施例1と同様である。実施例1との差分は音声パラメータ紛失処理部123、補助情報復号部125、補助情報蓄積部126の機能構成と処理手順であるので、これらについてのみ述べる。
音声合成部の機能構成も実施例1と同様であるが(図15と同様)、実施例1と動作が異なる適応符号帳算出部1123についてのみ以下に述べる。
補助情報を復号側でのピッチラグ予測に用いる例について述べる。
音声信号送信装置の機能構成は実施例1と同様である。機能構成および処理手順が異なるのは補助情報符号化部112のみであるので、ここでは補助情報符号化部112の動作についてのみ述べる。
Tp=argkmaxTk
v’(n)=u(n+Nadapt−Tp)
u(n)=u(n+L’) (0≦n<N−L’)
u(n+N−L’)=v’(n) (0≦n<L)
音声信号受信装置は、実施例1と同様に、音声符号バッファ121、音声パラメータ復号部122、音声パラメータ紛失処理部123、音声合成部124、補助情報復号部125、補助情報蓄積部126からなる。音声信号受信装置の処理手順は図7に示す通りである。
音声パラメータ復号部122の動作は実施例1と同様である。
音声パラメータ紛失処理部123(図12参照)のISF予測部191は、実施例1と同様にしてISFパラメータを算出する。
v(n)=f−1v’(n−1)+f0v’(n)+f1v’(n+1)
フィルタリングを指示しない値をとる場合は、v(n)=v’(n)とする(適応符号帳算出ステップA)。
v(n)=f−1v’(n−1)+f0v’(n)+f1v’(n+1)
設計方針によって、v(n)=v’(n)としてもよい。
本実施例では、特定のフレームクラスにおいてのみ補助情報としてピッチラグを伝送し、それ以外では、ピッチラグを伝送しない構成について述べる。
音声信号送信装置において、入力音声信号は、音声符号化部111に送られる。
音声信号受信装置は、実施例1と同様に、音声符号バッファ121、音声パラメータ復号部122、音声パラメータ紛失処理部123、音声合成部124、補助情報復号部125、補助情報蓄積部126からなる。音声信号受信装置の処理手順は図7に示す通りである。
音声パラメータ復号部122の動作は実施例1と同様である。
音声パラメータ紛失処理部123(図12参照)のISF予測部191は、実施例1と同様にしてISFパラメータを算出する。
実施例1と同様にして、補助情報蓄積部126から補助情報符号を読み出してピッチラグ
ピッチラグ予測部192は、ピッチラグ
v(n)=f−1v’(n−1)+f0v’(n)+f1v’(n+1)
なお設計方針により、v(n)=v’(n)としてもよい。
v(n)=f−1v’(n−1)+f0v’(n)+f1v’(n+1)
設計方針によって、v(n)=v’(n)としてもよい。
Claims (21)
- 音声信号を符号化する音声符号化装置であって、
音声信号を符号化する音声符号化部と、
先読み信号から補助情報を算出して符号化する補助情報符号化部と、
を備える音声符号化装置。 - 前記補助情報は、先読み信号におけるピッチラグに関する、請求項1に記載の音声符号化装置。
- 前記補助情報は、先読み信号におけるピッチゲインに関する、請求項1に記載の音声符号化装置。
- 前記補助情報は、先読み信号におけるピッチラグおよびピッチゲインに関する、請求項1に記載の音声符号化装置。
- 前記補助情報は、補助情報の利用可否に関する情報を含む、請求項1〜4の何れか一項に記載の音声符号化装置。
- 前記補助情報符号化部は、先読み信号部分について補助情報を算出して符号化し、さらに隠蔽信号を生成し、
入力音声信号と前記補助情報符号化部が出力する隠蔽信号の誤差信号を符号化する誤差信号符号化部と、
入力音声信号そのものを符号化する主要符号化部と、
をさらに備える、請求項1〜5の何れか一項に記載の音声符号化装置。 - 音声符号を復号して音声信号を出力する音声復号装置であって、
音声パケットの受信状態からパケットロスを検出する音声符号バッファと、
音声パケット正常受信時に音声符号を復号する音声パラメータ復号部と、
音声パケット正常受信時に補助情報符号を復号する補助情報復号部と、
補助情報符号を復号して得られる補助情報を蓄積する補助情報蓄積部と、
音声パケットロス検出時に音声パラメータを出力する音声パラメータ紛失処理部と、
音声パラメータから復号音声を合成する音声合成部と、
を備える音声復号装置。 - 前記補助情報は、先読み信号におけるピッチラグに関する、請求項7に記載の音声復号装置。
- 前記補助情報は、先読み信号におけるピッチゲインに関する、請求項7に記載の音声復号装置。
- 前記補助情報は、先読み信号におけるピッチラグおよびピッチゲインに関する、請求項7に記載の音声復号装置。
- 前記補助情報は、補助情報の利用可否に関する情報を含む、請求項7〜10の何れか一項に記載の音声復号装置。
- 前記補助情報復号部は、補助情報符号を復号して補助情報を出力し、かつ補助情報を利用して先読み部分に関する隠蔽信号を出力し、
音声信号と隠蔽信号との誤差信号に関する符号を復号する誤差復号部と、
音声信号に関する符号を復号する主要復号部と、
前記補助情報復号部が出力した隠蔽信号を蓄積する隠蔽信号蓄積部と、
をさらに備える、請求項7〜11の何れか一項に記載の音声復号装置。 - 音声パケット正常受信時には、前記隠蔽信号蓄積部から読み出した隠蔽信号と、前記誤差復号部が出力した復号誤差信号を加算することにより復号信号の一部を生成し、前記補助情報復号部が出力した隠蔽信号により前記隠蔽信号蓄積部を更新する、請求項12に記載の音声復号装置。
- 音声パケットロス検出時には、前記隠蔽信号蓄積部から読み出した隠蔽信号を、復号信号の一部あるいは全部とする、請求項12又は13に記載の音声復号装置。
- 音声パケットロス検出時には、前記音声パラメータ紛失処理部により予測した音声パラメータを用いて復号信号を生成し、その一部を用いて前記隠蔽信号蓄積部を更新する、請求項12〜14の何れか一項に記載の音声復号装置。
- 前記音声パラメータ紛失処理部は、音声パケットロス検出時に、前記補助情報蓄積部から読み出した補助情報を、音声パラメータの予測値の一部として利用する、請求項7〜11の何れか一項に記載の音声復号装置。
- 前記音声合成部は、音声パケットロス検出時に、前記補助情報蓄積部から読み出した補助情報を用いて、音声パラメータの1つである適応符号帳ベクトルを修正する、請求項7〜16の何れか一項に記載の音声復号装置。
- 音声信号を符号化する音声符号化装置による音声符号化方法であって、
音声信号を符号化する音声符号化ステップと、
先読み信号から補助情報を算出して符号化する補助情報符号化ステップと、
を含む音声符号化方法。 - 音声符号を復号して音声信号を出力する音声復号装置による音声復号方法であって、
音声パケットの受信状態からパケットロスを検出する音声符号バッファステップと、
音声パケット正常受信時に音声符号を復号する音声パラメータ復号ステップと、
音声パケット正常受信時に補助情報符号を復号する補助情報復号ステップと、
補助情報符号を復号して得られる補助情報を蓄積する補助情報蓄積ステップと、
音声パケットロス検出時に音声パラメータを出力する音声パラメータ紛失処理ステップと、
音声パラメータから復号音声を合成する音声合成ステップと、
を含む音声復号方法。 - コンピュータを、
音声信号を符号化する音声符号化部と、
先読み信号から補助情報を算出して符号化する補助情報符号化部、
として機能させる音声符号化プログラム。 - コンピュータを、
音声パケットの受信状態からパケットロスを検出する音声符号バッファと、
音声パケット正常受信時に音声符号を復号する音声パラメータ復号部と、
音声パケット正常受信時に補助情報符号を復号する補助情報復号部と、
補助情報符号を復号して得られる補助情報を蓄積する補助情報蓄積部と、
音声パケットロス検出時に音声パラメータを出力する音声パラメータ紛失処理部と、
音声パラメータから復号音声を合成する音声合成部、
として機能させる音声復号プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012251646 | 2012-11-15 | ||
JP2012251646 | 2012-11-15 | ||
PCT/JP2013/080589 WO2014077254A1 (ja) | 2012-11-15 | 2013-11-12 | 音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016135137A Division JP2016197254A (ja) | 2012-11-15 | 2016-07-07 | 音声符号化装置 |
JP2017041456A Division JP6626026B2 (ja) | 2012-11-15 | 2017-03-06 | 音声復号装置および音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014077254A1 true JPWO2014077254A1 (ja) | 2017-01-05 |
JP6158214B2 JP6158214B2 (ja) | 2017-07-05 |
Family
ID=50731166
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014546993A Active JP6158214B2 (ja) | 2012-11-15 | 2013-11-12 | 音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム |
JP2016135137A Pending JP2016197254A (ja) | 2012-11-15 | 2016-07-07 | 音声符号化装置 |
JP2017041456A Active JP6626026B2 (ja) | 2012-11-15 | 2017-03-06 | 音声復号装置および音声復号方法 |
JP2018044180A Active JP6793675B2 (ja) | 2012-11-15 | 2018-03-12 | 音声符号化装置 |
JP2019027042A Active JP6659882B2 (ja) | 2012-11-15 | 2019-02-19 | 音声符号化装置および音声符号化方法 |
JP2019215587A Active JP6846500B2 (ja) | 2012-11-15 | 2019-11-28 | 音声符号化装置 |
JP2019220205A Active JP6872597B2 (ja) | 2012-11-15 | 2019-12-05 | 音声符号化装置および音声符号化方法 |
JP2021031899A Active JP7209032B2 (ja) | 2012-11-15 | 2021-03-01 | 音声符号化装置および音声符号化方法 |
Family Applications After (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016135137A Pending JP2016197254A (ja) | 2012-11-15 | 2016-07-07 | 音声符号化装置 |
JP2017041456A Active JP6626026B2 (ja) | 2012-11-15 | 2017-03-06 | 音声復号装置および音声復号方法 |
JP2018044180A Active JP6793675B2 (ja) | 2012-11-15 | 2018-03-12 | 音声符号化装置 |
JP2019027042A Active JP6659882B2 (ja) | 2012-11-15 | 2019-02-19 | 音声符号化装置および音声符号化方法 |
JP2019215587A Active JP6846500B2 (ja) | 2012-11-15 | 2019-11-28 | 音声符号化装置 |
JP2019220205A Active JP6872597B2 (ja) | 2012-11-15 | 2019-12-05 | 音声符号化装置および音声符号化方法 |
JP2021031899A Active JP7209032B2 (ja) | 2012-11-15 | 2021-03-01 | 音声符号化装置および音声符号化方法 |
Country Status (18)
Country | Link |
---|---|
US (7) | US9564143B2 (ja) |
EP (2) | EP2922053B1 (ja) |
JP (8) | JP6158214B2 (ja) |
KR (10) | KR102302012B1 (ja) |
CN (2) | CN104781876B (ja) |
AU (6) | AU2013345949B2 (ja) |
BR (1) | BR112015008505B1 (ja) |
CA (4) | CA3127953C (ja) |
DK (1) | DK2922053T3 (ja) |
ES (1) | ES2747353T3 (ja) |
HK (1) | HK1209229A1 (ja) |
IN (1) | IN2015DN02595A (ja) |
MX (3) | MX345692B (ja) |
PL (1) | PL2922053T3 (ja) |
PT (1) | PT2922053T (ja) |
RU (8) | RU2640743C1 (ja) |
TW (2) | TWI587284B (ja) |
WO (1) | WO2014077254A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013049256A1 (en) * | 2011-09-26 | 2013-04-04 | Sirius Xm Radio Inc. | System and method for increasing transmission bandwidth efficiency ( " ebt2" ) |
CN104781876B (zh) | 2012-11-15 | 2017-07-21 | 株式会社Ntt都科摩 | 音频编码装置、音频编码方法以及音频解码装置、音频解码方法 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922055A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
CN105897666A (zh) * | 2015-10-08 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 实时语音通话中的实时语音接收设备及降低延迟的方法 |
US10650837B2 (en) | 2017-08-29 | 2020-05-12 | Microsoft Technology Licensing, Llc | Early transmission in packetized speech |
US11710492B2 (en) * | 2019-10-02 | 2023-07-25 | Qualcomm Incorporated | Speech encoding using a pre-encoded database |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271391A (ja) * | 1994-04-01 | 1995-10-20 | Toshiba Corp | 音声復号装置 |
JP2004138756A (ja) * | 2002-10-17 | 2004-05-13 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム |
JP2008111991A (ja) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法及び符号化方法 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
JPH08160993A (ja) * | 1994-12-08 | 1996-06-21 | Nec Corp | 音声分析合成器 |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
CA2636552C (en) * | 1997-12-24 | 2011-03-01 | Mitsubishi Denki Kabushiki Kaisha | A method for speech coding, method for speech decoding and their apparatuses |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US6862567B1 (en) | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
US6968309B1 (en) | 2000-10-31 | 2005-11-22 | Nokia Mobile Phones Ltd. | Method and system for speech frame error concealment in speech decoding |
KR100674423B1 (ko) * | 2001-01-19 | 2007-01-29 | 엘지전자 주식회사 | 송/수신 시스템 및 데이터 처리 방법 |
JP3628268B2 (ja) * | 2001-03-13 | 2005-03-09 | 日本電信電話株式会社 | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 |
US7308406B2 (en) | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
SE521600C2 (sv) * | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
JP3722366B2 (ja) * | 2002-02-22 | 2005-11-30 | 日本電信電話株式会社 | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム |
EP1484841B1 (en) * | 2002-03-08 | 2018-12-26 | Nippon Telegraph And Telephone Corporation | DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM |
JP2004077688A (ja) * | 2002-08-14 | 2004-03-11 | Nec Corp | 音声通信装置 |
US7584107B2 (en) * | 2002-09-09 | 2009-09-01 | Accenture Global Services Gmbh | Defined contribution benefits tool |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
JP4365653B2 (ja) * | 2003-09-17 | 2009-11-18 | パナソニック株式会社 | 音声信号送信装置、音声信号伝送システム及び音声信号送信方法 |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US8320391B2 (en) * | 2004-05-10 | 2012-11-27 | Nippon Telegraph And Telephone Corporation | Acoustic signal packet communication method, transmission method, reception method, and device and program thereof |
ATE403216T1 (de) * | 2004-06-02 | 2008-08-15 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zum einbetten von hilfsinformationen in einem media-signal |
US20060088093A1 (en) * | 2004-10-26 | 2006-04-27 | Nokia Corporation | Packet loss compensation |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
WO2006079349A1 (en) | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for weighted overlap-add |
WO2006126857A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method of encoding and decoding an audio signal |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US9058812B2 (en) * | 2005-07-27 | 2015-06-16 | Google Technology Holdings LLC | Method and system for coding an information signal using pitch delay contour adjustment |
US7712008B2 (en) * | 2006-01-26 | 2010-05-04 | Agere Systems Inc. | Systems and methods for error reduction associated with information transfer |
US8438018B2 (en) * | 2006-02-06 | 2013-05-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for speech coding in wireless communication systems |
US7457746B2 (en) * | 2006-03-20 | 2008-11-25 | Mindspeed Technologies, Inc. | Pitch prediction for packet loss concealment |
CN101000768B (zh) * | 2006-06-21 | 2010-12-08 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
WO2008007700A1 (fr) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
JPWO2008007698A1 (ja) * | 2006-07-12 | 2009-12-10 | パナソニック株式会社 | 消失フレーム補償方法、音声符号化装置、および音声復号装置 |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DK2102619T3 (en) | 2006-10-24 | 2017-05-15 | Voiceage Corp | METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS |
BRPI0711094A2 (pt) * | 2006-11-24 | 2011-08-23 | Lg Eletronics Inc | método para codificação e decodificação de sinal de áudio baseado em objeto e aparelho deste |
KR100862662B1 (ko) * | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
CN101226744B (zh) * | 2007-01-19 | 2011-04-13 | 华为技术有限公司 | 语音解码器中实现语音解码的方法及装置 |
CN101256771A (zh) * | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
US8644970B2 (en) * | 2007-06-08 | 2014-02-04 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
CN101207665B (zh) | 2007-11-05 | 2010-12-08 | 华为技术有限公司 | 一种衰减因子的获取方法 |
CN100550712C (zh) | 2007-11-05 | 2009-10-14 | 华为技术有限公司 | 一种信号处理方法和处理装置 |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
US8706479B2 (en) * | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN101894558A (zh) * | 2010-08-04 | 2010-11-24 | 华为技术有限公司 | 丢帧恢复方法、设备以及语音增强方法、设备和系统 |
JP5612698B2 (ja) | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
EP2975610B1 (en) * | 2010-11-22 | 2019-04-24 | Ntt Docomo, Inc. | Audio encoding device and method |
WO2012110482A2 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
US9026434B2 (en) | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN104781876B (zh) | 2012-11-15 | 2017-07-21 | 株式会社Ntt都科摩 | 音频编码装置、音频编码方法以及音频解码装置、音频解码方法 |
KR102452593B1 (ko) | 2015-04-15 | 2022-10-11 | 삼성전자주식회사 | 반도체 장치의 제조 방법 |
-
2013
- 2013-11-12 CN CN201380058010.4A patent/CN104781876B/zh active Active
- 2013-11-12 EP EP13854879.7A patent/EP2922053B1/en active Active
- 2013-11-12 IN IN2595DEN2015 patent/IN2015DN02595A/en unknown
- 2013-11-12 ES ES13854879T patent/ES2747353T3/es active Active
- 2013-11-12 KR KR1020207030913A patent/KR102302012B1/ko active IP Right Grant
- 2013-11-12 CA CA3127953A patent/CA3127953C/en active Active
- 2013-11-12 JP JP2014546993A patent/JP6158214B2/ja active Active
- 2013-11-12 MX MX2015005885A patent/MX345692B/es active IP Right Grant
- 2013-11-12 KR KR1020207013109A patent/KR102173422B1/ko active IP Right Grant
- 2013-11-12 MX MX2017001865A patent/MX362139B/es unknown
- 2013-11-12 KR KR1020167025606A patent/KR101780667B1/ko active IP Right Grant
- 2013-11-12 BR BR112015008505-9A patent/BR112015008505B1/pt active IP Right Grant
- 2013-11-12 AU AU2013345949A patent/AU2013345949B2/en active Active
- 2013-11-12 CA CA2886140A patent/CA2886140C/en active Active
- 2013-11-12 KR KR1020177036234A patent/KR102110853B1/ko active Application Filing
- 2013-11-12 PL PL13854879T patent/PL2922053T3/pl unknown
- 2013-11-12 RU RU2017105082A patent/RU2640743C1/ru active
- 2013-11-12 CA CA3210225A patent/CA3210225A1/en active Pending
- 2013-11-12 KR KR1020207030410A patent/KR102307492B1/ko active IP Right Grant
- 2013-11-12 WO PCT/JP2013/080589 patent/WO2014077254A1/ja active Application Filing
- 2013-11-12 DK DK13854879.7T patent/DK2922053T3/da active
- 2013-11-12 RU RU2015122777A patent/RU2612581C2/ru active
- 2013-11-12 EP EP19185490.0A patent/EP3579228A1/en active Pending
- 2013-11-12 KR KR1020187029586A patent/KR102259112B1/ko active IP Right Grant
- 2013-11-12 MX MX2018016263A patent/MX2018016263A/es unknown
- 2013-11-12 CN CN201710532316.9A patent/CN107256709B/zh active Active
- 2013-11-12 KR KR1020157009567A patent/KR101689766B1/ko active IP Right Grant
- 2013-11-12 KR KR1020217030770A patent/KR102459376B1/ko active IP Right Grant
- 2013-11-12 KR KR1020177025971A patent/KR101812123B1/ko active IP Right Grant
- 2013-11-12 PT PT138548797T patent/PT2922053T/pt unknown
- 2013-11-12 CA CA3044983A patent/CA3044983C/en active Active
- 2013-11-12 KR KR1020197034894A patent/KR102171293B1/ko active IP Right Grant
- 2013-11-15 TW TW105117610A patent/TWI587284B/zh active
- 2013-11-15 TW TW102141676A patent/TWI547940B/zh active
-
2015
- 2015-05-14 US US14/712,535 patent/US9564143B2/en active Active
- 2015-09-30 HK HK15109631.9A patent/HK1209229A1/xx unknown
-
2016
- 2016-07-07 JP JP2016135137A patent/JP2016197254A/ja active Pending
- 2016-12-20 US US15/385,458 patent/US9881627B2/en active Active
-
2017
- 2017-03-06 JP JP2017041456A patent/JP6626026B2/ja active Active
- 2017-07-28 AU AU2017208369A patent/AU2017208369B2/en active Active
- 2017-12-14 RU RU2017143786A patent/RU2665301C1/ru active
- 2017-12-26 US US15/854,416 patent/US10553231B2/en active Active
-
2018
- 2018-03-12 JP JP2018044180A patent/JP6793675B2/ja active Active
- 2018-08-21 RU RU2018130271A patent/RU2690775C1/ru active
-
2019
- 2019-02-19 JP JP2019027042A patent/JP6659882B2/ja active Active
- 2019-03-29 AU AU2019202186A patent/AU2019202186B2/en active Active
- 2019-05-28 RU RU2019116380A patent/RU2713605C1/ru active
- 2019-11-28 JP JP2019215587A patent/JP6846500B2/ja active Active
- 2019-12-05 JP JP2019220205A patent/JP6872597B2/ja active Active
- 2019-12-17 US US16/717,806 patent/US11211077B2/en active Active
- 2019-12-17 US US16/717,822 patent/US11176955B2/en active Active
- 2019-12-17 US US16/717,837 patent/US11195538B2/en active Active
-
2020
- 2020-01-17 RU RU2020101916A patent/RU2722510C1/ru active
- 2020-05-14 RU RU2020115805A patent/RU2737465C1/ru active
- 2020-11-17 RU RU2020137611A patent/RU2760485C1/ru active
- 2020-12-24 AU AU2020294317A patent/AU2020294317B2/en active Active
-
2021
- 2021-03-01 JP JP2021031899A patent/JP7209032B2/ja active Active
- 2021-11-01 US US17/515,929 patent/US11749292B2/en active Active
-
2022
- 2022-04-29 AU AU2022202856A patent/AU2022202856B2/en active Active
-
2023
- 2023-07-27 AU AU2023208191A patent/AU2023208191A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271391A (ja) * | 1994-04-01 | 1995-10-20 | Toshiba Corp | 音声復号装置 |
JP2004138756A (ja) * | 2002-10-17 | 2004-05-13 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム |
JP2008111991A (ja) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法及び符号化方法 |
Non-Patent Citations (1)
Title |
---|
ITU-T G.718 (06/2008), vol. Ed.1.3, JPN6016018264, January 2011 (2011-01-01), pages 209 - 211, ISSN: 0003319195 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6659882B2 (ja) | 音声符号化装置および音声符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170306 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6158214 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |