JP6258835B2 - 符号化方式の決定方法及び装置 - Google Patents

符号化方式の決定方法及び装置 Download PDF

Info

Publication number
JP6258835B2
JP6258835B2 JP2014205254A JP2014205254A JP6258835B2 JP 6258835 B2 JP6258835 B2 JP 6258835B2 JP 2014205254 A JP2014205254 A JP 2014205254A JP 2014205254 A JP2014205254 A JP 2014205254A JP 6258835 B2 JP6258835 B2 JP 6258835B2
Authority
JP
Japan
Prior art keywords
encoding
current frame
determined
signal provided
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014205254A
Other languages
English (en)
Other versions
JP2015026083A (ja
Inventor
ソン,ホ−サン
ジャン,ジエ
ジュー,キ−ヒョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2015026083A publication Critical patent/JP2015026083A/ja
Application granted granted Critical
Publication of JP6258835B2 publication Critical patent/JP6258835B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/81Detection of presence or absence of voice signals for discriminating voice from music
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Description

本発明の一つ以上の実施形態は、音楽及び音声特性を持つオーディオ信号を符号化するか、または復号化する方法及び装置に係り、さらに詳細には、少ないビットを用いてかかるオーディオ信号に対して効率的に符号化及び復号化できる方法及び装置に関する。
オーディオ符号化時に、いろいろな符号化方式(coding modes)のうち、入力信号の特性を分析することで一つの方式を選択する。例えば、AAC(Advanced Audio Codec)方式のような、周波数ドメインで符号化する方式と、CELP(Code Excited Linear prediction)方式のような時間ドメインで符号化する方式のうち、いずれか一つを選択して入力信号を該当方式で符号化する。通常、入力信号が音楽特性にさらに近いと判断されれば、周波数ドメインで符号化する方式を選択して符号化し、もし、入力信号が音声特性にさらに近いと判断されれば、時間ドメインで符号化する方式を選択して符号化する。
このような動作において、入力信号の符号化方式を選択する時、過去フレームに設けられた信号の特性を保存し、現在フレームに設けられた信号の特性だけでなく、過去フレームに設けられた信号の特性に基づいて現在フレームに設けられた信号の符号化方式を決定できる。しかし、この場合、信号の符号化方式を変更する回数と、信号の符号化方式を変更するのにかかる時間を低減させる必要がある。
本発明の一つ以上の実施形態は、複数の符号化方式のうち、信号を効率的に符号化するための方式を決定する方法及び装置を提供することである。
本発明の一つ以上の実施形態による信号の符号化方式の決定方法は、一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階と、を含む。
本発明の一つ以上の実施形態による信号の符号化方式の決定方法は、現在フレームに設けられた信号の符号化方式を決定する段階と、前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性に基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含む。
本発明の一つ以上の実施形態による信号の符号化方式の決定装置は、一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存する保存部と、前記保存された情報またはパラメータを用いて現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、現在フレームに設けられた信号が黙音に該当するかどうかを判断する黙音判断部と、前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットするリセット部と、を備える。
本発明の一つ以上の実施形態による信号の符号化方式の決定装置は、現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する信号分析部と、一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する変更判断部と、前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する方式変更部と、を備える。
本発明の一つ以上の実施形態による記録媒体は、一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階とを含む方法をコンピュータで行わせるためのプログラムを記録し、この記録媒体はコンピュータで読み取り可能である。
本発明の一つ以上の実施形態による記録媒体は、現在フレームに設けられた信号の符号化方式を決定する段階と、前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含む方法をコンピュータで行わせるためのプログラムを記録し、この記録媒体はコンピュータで読み取り可能である。
一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。 一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。 一つ以上の一実施形態によって、音声が存在する可能性の履歴値を計算する実施形態を図示した図である。 一つ以上の一実施形態によって、図2の符号化方式の決定方法のような符号化方式の決定方法で符号化方式変更段階を図示した図である。 一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。 一つ以上の一実施形態によって、黙音区間と非黙音区間とで形成された例を図示した図である。 一つ以上の一実施形態によって、符号化方式の決定装置を図示した図である。 一つ以上の一実施形態によって、符号化方式の決定装置を図示した図である。 一つ以上の一実施形態によって、符号化方式の決定装置を図示した図である。
以下、添付した図面を参照して一つ以上の実施形態による符号化方式の決定方法及び装置について詳細に説明する。
図1は、一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。
まず、現在フレームに設けられた信号が黙音(silence)に該当するかどうかを判断する(第100段階)。第100段階で黙音に該当するかどうかは、現在フレームに設けられた信号のエネルギーまたは特性を基準に判断する。一例として、第100段階では、現在フレームに設けられた信号のエネルギーが既に設定された臨界値より小さければ、黙音に該当すると判断できる。ここで、追加的及び/または代案的黙音検出技術も同一に適用されうる。
第100段階で、現在フレームに設けられた信号が黙音に該当すると判断されれば、多様な符号化方式のうち、現在フレームに設けられた信号の適切な符号化方式を決定するのに連続的に利用するために、保存していた一つ以上の過去フレームに設けられた信号に関する情報またはパラメータをリセットする(第110段階)。
過去フレームに設けられた信号に関する情報またはパラメータは、例えば、長区間特性に関する情報でありうる。第110段階では、長区間特性のうち既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、または現在フレームに設けられた信号に音声または音楽が存在する可能性の履歴をリセットできる。
ここで、長区間特性は、過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。例えば、長区間特性には既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性及び音声または音楽が存在する可能性の履歴値などがある。そして、短区間特性は各フレームが持つ固有の特性であって、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度などの情報及びパラメータで形成された群から選択される一つ以上で構成できる。
第110段階後に、以前の最後のフレームに設けられた信号の符号化方式で、現在フレームに設けられた信号を符号化すると決定する(第120段階)。
第100段階で、現在フレームに設けられた信号が黙音に該当しないと判断されれば、現在フレームに設けられた信号の特性を分析して現在フレームに設けられた信号に関する情報またはパラメータを抽出し、過去フレームに設けられた信号に関する情報またはパラメータと、現在フレームに設けられた信号に関する情報またはパラメータとに基づいて、信号の符号化方式のうち現在フレームの符号化方式を決定する(第130段階)。第130段階で抽出する現在フレームに設けられた信号に関する情報またはパラメータの例として、前述した短区間特性と長区間特性とがある。
ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と、周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例としてCELP(Code Excited Linear prediction)があり、周波数ドメインで符号化する方式の例としてTCX(Transform Coded Excitation)及びAAC(Advanced Audio Codec)がある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的な符号化方式も同一に適用され、したがって、前記の符号化方式に制限されない。
第120段階または第130段階後に、現在フレームが最後のフレームであるかどうかを判断する(第140段階)。
第140段階で、現在フレームが最後のフレームでないと判断されれば、次のフレームを入力され(第150段階)、次のフレームに対して第100段階ないし第150段階を繰り返して行う。
図2は、一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。
まず、現在フレームに設けられた信号の特性を分析して、現在フレームに設けられた信号に関する情報またはパラメータを抽出する(第200段階)。第200段階で抽出する情報またはパラメータの例としては、短区間特性と長区間特性とがある。短区間特性は、例えば、各フレームが持つ固有の特性であって、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度などの情報あるいはパラメータで形成された群から選択される一つ以上で構成されうる。また、これら情報あるいはパラメータから一つ以上を選択してもよい。長区間特性は、過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。例えば、長区間特性には、既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性及び音声または音楽が存在する可能性の履歴値などがある。
このうち、音声が存在する可能性であるSPP(Speech Presence Possibility)は、例えば、下記の式(1)を用いて求めることができる。以下では、SPPを中心として説明するが、SPPに限定して実施すべきものではない。
SPP=SNR_W・SNR_SP+TILT_W・TILT_SP+ZC_W・ZC_SP (1)
ここで、SNR_Wは、SNR_SPに対する加重値であり、TILT_Wは、TILT_SPに対する加重値であり、ZC_Wは、ZC_SPに対する加重値であり、SNR_SPは、LP−LTP利得に対する長区間特性であって、例えば、下記の式(2)を用いて求めることができ、TILT_SPは、スペクトルチルトに対する長区間特性であって、例えば、下記の式(3)を用いて求めることができ、ZC_SPは、零点交差率に対する長区間特性であって、例えば、下記の式(4)4を用いて求めることができる。
if(SNR_VAR>SNR_THR)
SNR_SP=a*SNR_SP+(1−a)*SNR_VAR
else
SNR_SP−=D1 (2)
ここで、SNR_VARは、現在フレームに先行する所定数のフレームによるLT−LTP利得に対する平均値と現在フレームのLP−LTP利得との差分値あるいはその差分値の絶対値であり、SNR_THRは、既に設定された臨界値であり、SNR_SPの初期値は、0であり、‘a’は、0〜1の実数であって、SNR_SPとSNR_VARとに対する加重値であり、‘D1’は、β1×(SNR_THR/LT−LTP利得)であり、‘β1’は、減少程度を表す定数である。
if(TILT_VAR>TILT_THR)
TILT_SP=a2*TILT_SP+(1−a2)*TILT_VAR
else
TILT_SP−=D2 (3)
ここで、TILT_VARは、現在フレームに先行する所定数のフレームによるスペクトルチルトに対する平均値と現在フレームのスペクトルチルトとの差分値あるいはその差分値の絶対値であり、TILT_THRは、既に設定された臨界値であり、TILT_SPの初期値は、0であり、‘a2’は、0〜1の実数であって、TILT_SPとTILT_VARとに対する加重値であり、D2は、β2×(TILT_THR/SPECTRUM TILT)であり、‘β2’は、減少程度を表す定数である。
if(ZC_VAR>ZC_THR)
ZC_SP=a3*ZC_SP+(1−a3)*ZC_VAR
else
ZC_SP−=D3 (4)
ここで、ZC_VARは、現在フレームに先行する所定数のフレームによる零点交差率に対する平均値と現在フレームの零点交差率との差分値、あるいはその差分値の絶対値であり、ZC_THRは、既に設定された臨界値であり、ZC_SPの初期値は、0であり、‘a3’は、0〜1の実数であって、ZC_SPとZC_VARとに対する加重値であり、D3は、β3×(ZC_THR/zero−crossing rate)であり、‘β3’は、減少程度を表す定数である。
また、音声または音楽が存在する可能性の履歴値は、所定数のフレームに設けられた信号に音声または音楽が存在する可能性に既に設定された加重値を適用して累積した値をいう。図3でSPPを例として、音声または音楽が存在する可能性の履歴値を計算する実施形態を後述する。
第200段階で抽出された現在フレームに設けられた信号に関する情報またはパラメータに基づいて、信号の符号化方式のうち現在フレームに設けられた信号の符号化方式を選択する(第210段階)。ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例として、CELPがあり、周波数ドメインで符号化する方式の例として、TCX(Transform Coded Excitation)及びAAC(Advanced Audio Codec)がある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的符号化方式も同一に適用され、したがって、前記の符号化方式に制限されるものではない。
第210段階後に、以前フレームに設けられた信号の符号化方式、所定数の過去フレームに設けられた信号及び現在フレームに設けられた信号に音声または音楽が存在する可能性のうち少なくとも一つ以上に基づいて、第210段階で選択された符号化方式を変更すべきかどうかを判断する(第220段階)。所定数の過去フレームに設けられた信号または現在フレームに設けられた信号に音声または音楽が存在する可能性に基づいて判断する例として、前述した音声または音楽が存在する可能性の履歴値がある。
第210段階で選択された符号化方式を第220段階で変更すべきと判断されれば、第210段階で選択された符号化方式を変更する(第230段階)。
第220段階で変更しないと判断されるか、または第230段階後に、現在フレームが最後のフレームであるかどうかを判断する(第240段階)。
第240段階で、現在フレームが最後のフレームでないと判断されれば、次のフレームを入力され(第250段階)、次のフレームに対して第200段階ないし第240段階を繰り返して行う。現在フレームに対して使われる符号化方式は、対応する情報あるいはパラメータと共に保存され、次のフレーム等の符号化方式を決定するのに使われうる。
図3は、一つ以上の一実施形態によって、音声が存在する可能性の履歴値を計算する実施形態を図示した図である。
例えば、第210段階で、現在フレームに設けられた信号の符号化方式と決定された符号化方式が第0モードであるか、または第1モードであるかを判断する(第300段階)。ここで、第0モードは、周波数ドメインで符号化する方式または音楽を符号化する方式であり、第1モードは、時間ドメインで符号化する方式または音声を符号化する方式である。
もし、第210段階で選択された符号化方式が第1モードであると第300段階で判断されれば、第0モードの履歴値を例として、下記の式(5)で計算する(第310段階)。
Mode0_Hysteresis+=(y−(100−SPP)/100.*z) (5)
ここで、例えば、Mode0_Hysteresisは第0モードの履歴値であり、‘y’及び‘z’は、既に設定された値である。
第310段階後に、第1モードの履歴値を例として、下記の式(6)で計算する(第320段階)。
Mode1_Hysteresis+=(x*(SPP/100)) (6)
ここで、例えば、Mode1_Hysteresisは、第1モードの履歴値であり、‘x’は、既に設定された値である。
もし、第210段階で選択されたモードが第0モードであると第300段階で判断されれば、第0モードの履歴値を例として、下記の式(7)で計算する(第330段階)。
Mode0_Hysteresis+=(w*((100−SPP)/100)) (7)
ここで、例えば、Mode0_Hysteresisは、第0モードの履歴値であり、‘w’は、既に設定された値である。
第330段階後に、第1モードの履歴値を例として、下記の式(8)で計算する(第340段階)。
Mode1_Hysteresis+=(u+((SPP/100)*v)) (8)
ここで、例えば、Mode1_Hysteresisは、第1モードの履歴値であり、‘u’及び‘v’は、既に設定された値である。
しかし、音声または音楽が存在する可能性の履歴値に対する最小値と最大値とを既に設定できる。例えば、履歴値の最小値を‘0’と設定し、履歴値の最大値を‘1’と設定できる。もし、最小値と最大値との差を狭く設定することで履歴値の変動範囲を狭めれば、信号の符号化方式が変更される回数を増加させ、かつ信号の符号化方式を変更するための遅延をさらに減少させることができ、もし、最小値と最大値との差を広く設定することで履歴値の変動範囲を広げれば、信号の符号化方式が変更される回数が減少し、信号の符号化方式を変更するための遅延をさらに延長させることができる。したがって、信号を符号化する環境または信号の特性によって、履歴値に対する最大値と最小値とを調節して既に設定できる。
図4は、一つ以上の一実施形態によって、図2の符号化方式の決定方法のような符号化方式の決定方法で、符号化方式変更段階を図示した図である。
まず、例えば、第210段階で、現在フレームに設けられた信号の符号化方式と決定された符号化方式が第0モードであるか、または第1モードであるかを判断する(第400段階)。ここで、第0モードは、周波数ドメインで符号化する方式または音楽を符号化する方式であり、第1モードは、時間ドメインで符号化する方式または音声を符号化する方式である。
もし、第210段階で、選択された符号化方式が第1モードであると第400段階で判断されれば、例えば、以前の最後のフレームに設けられた信号を符号化した方式が第0モードであるか、または第1モードであるかを判断する(第410段階)。
もし、第410段階で、以前の最後のフレームに設けられた信号を符号化した方式が第0モードであると判断されれば、第0モードの履歴値が、例えば、‘0’より大きいかどうかを追加的に判断する(第420段階)。
もし、第420段階で、第0モードの履歴値が例として‘0’より大きいと判断されれば、現在フレームに設けられた信号の符号化方式を、第210段階で選択された第1モードから第0モードに変更する(第230段階)。
もし、第410段階で、以前の最後のフレームに設けられた信号を符号化した方式が第1モードである判断されるか、第420段階で、例えば、第0モードの履歴値が例とした‘0’であると判断されれば、第210段階で選択された現在フレームに設けられた信号の符号化方式を変更しない。ここで、第0モードの履歴値が例とした‘0’である場合は、第0モードの履歴値が既に設定された最小値に該当する場合または以前の最後のフレームに設けられた信号が黙音であってリセットされた場合でありうる。
もし、第210段階で選択された符号化方式が第0モードであると第400段階で判断されれば、以前の最後のフレームに設けられた信号を符号化した方式が、例えば、第0モードであるか、または第1モードであるかを判断する(第430段階)。
もし、第430段階で、例えば、以前の最後のフレームに設けられた信号を符号化した方式が、例えば、第1モードであると判断されれば、第1モードの履歴値が、例えば、‘0’より大きいかどうかを判断する(第440段階)。
もし、第440段階で、第1モードの履歴値が例とした‘0’より大きいと判断されれば、現在フレームに設けられた信号の符号化方式を、第210段階で選択された第0モードから第1モードに変更できる(第230段階)。
もし、第430段階で、例えば、以前の最後のフレームに設けられた信号を符号化した方式が第0モードであると判断されるか、第440段階で、第1モードの履歴値が、例えば、‘0’であると判断されれば、第210段階で選択された現在フレームに設けられた信号の符号化方式を変更しない。ここで、第1モードの履歴値が例とした‘0’である場合は、第1モードの履歴値が既に設定された最小値に該当する場合、または例として以前の最後のフレームに設けられた信号が黙音であってリセットされた場合でありうる。
図5は、一つ以上の一実施形態によって、符号化方式の決定方法を図示した図である。
まず、現在フレームに設けられた信号が黙音に該当するかどうかを判断する(第500段階)。第500段階で黙音に該当するかどうかは、所定のフレームに設けられた信号のエネルギーまたは特性を基準に判断する。例えば、第500段階では、現在フレームに設けられた信号のエネルギーが既に設定された臨界値より小さければ、黙音に該当すると判断できる。
第500段階で、現在フレームに設けられた信号が黙音に該当すると判断されれば、信号の符号化方式のうち、現在フレームに設けられた信号の符号化方式の設定に利用するために、保存している一つ以上の過去フレームに設けられた信号に関する情報またはパラメータをリセットできる(第505段階)。
第505段階で、リセットする過去フレームに設けられた信号に関する情報は、長区間特性に関する情報でありうる。第505段階では、長区間特性のうち既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、及び現在フレームに設けられた信号に音声または音楽が存在する可能性の履歴をリセットできる。
また、長区間特性は、過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。ここで、短区間特性は、各フレームが持つ固有の特性であって、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度を含むことができる。一つ以上の実施形態において、これら特性が具現時に選択されうる。
例えば、長区間特性には、所定数の過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性及び音声または音楽が存在する可能性の履歴値などがある。このうち、音声が存在する可能性であるSPPは、例えば、前述した式(1)を用いて求めることができる。また、音声または音楽が存在する可能性の履歴値は、所定数のフレームに設けられた信号に音声または音楽が存在する可能性に既に設定された加重値を適用して累積した値であって、図3でSPPを例として、音声が存在する可能性の履歴値を計算する実施形態を前述した。
もし、図6に図示されたように、黙音と判断される第1区間(600)後に非黙音と判断される第2区間(610)が設けられれば、黙音に該当するフレームから非黙音に該当するフレームに変更される時に瞬間的に発生しうる誤差を低減させるために、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次にSPPを履歴値に反映する比重を高めることができる。例えば、正確度の一番低い黙音から非黙音に変更される最初のフレームに最も低い比重をおき、その後のフレームから比重を益々高めてから、現在フレームからSPPを履歴値にいずれも反映させることができる。
再び図5に戻って、第505段階後に、以前の最後のフレームに設けられた信号を符号化した方式で現在フレームに設けられた信号を符号化すると決定する(第510段階)。
第510段階後に、現在フレームに該当する信号に対応する音声または音楽が存在する可能性の履歴値として、既に設定された値を割り当てる(第515段階)。例えば、図3の実施形態を用いて説明すれば、以前の最後のフレームに設けられた信号を符号化した方式が第1モードであれば、第1モードの履歴値に‘x’を割り当て、第0モードの履歴値に‘y’を割り当て、以前の最後のフレームに設けられた信号を符号化した方式が第0モードであれば、第1モードの履歴値に‘v’を割り当て、第0モードの履歴値に‘w’を割り当てることができる。ここで、‘x’、‘y’、‘v’及び‘w’は、既に設定された値でありうる。
第500段階で、現在フレームに設けられた信号が黙音に該当しないと判断されれば、現在フレームに設けられた信号の特性を分析して現在フレームに設けられた信号に関する情報またはパラメータを抽出できる(第520段階)。第520段階で抽出する情報またはパラメータの例としては、短区間特性と長区間特性とがある。
第520段階で抽出された現在フレームに設けられた信号に関する情報またはパラメータに基づいて、信号の符号化方式のうち現在フレームに設けられた信号の符号化方式を選択できる(第525段階)。ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例としてCELPがあり、周波数ドメインで符号化する方式の例として、TCX及びAACがある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的符号化方式も同一に適用され、したがって、前記の符号化方式に制限されない。
第525段階後に、以前フレームに設けられた信号の符号化方式、所定数の過去フレームに設けられた信号及び現在フレームに設けられた信号に音声または音楽が存在する可能性のうち少なくとも一つ以上に基づいて、第525段階で選択された符号化方式を変更すべきかどうかを判断する(第530段階)。所定数の過去フレームに設けられた信号または現在フレームに設けられた信号に音声または音楽が存在する可能性の例として、前述した音声または音楽が存在する可能性の履歴値がある。第530段階を詳述する実施形態は、図3の実施形態を説明しつつ前述したことがある。
第525段階で選択された符号化方式を第530段階で変更すべきと判断されれば、第525段階で選択された符号化方式を変更する(第535段階)。
第515段階または第535段階後に、現在フレームが最後のフレームであるかどうかを判断する(第540段階)。
第540段階で、現在フレームが最後のフレームでないと判断されれば、次のフレームを入力されることができ(第545段階)、次のフレームに対して第500段階ないし第540段階を繰り返して行える。
図7は、一つ以上の一実施形態によって、符号化方式の決定装置を図示した図である。ここで、‘装置’という用語は、物理的システムのエレメントと同義語と考慮されねばならない。これは、単一エンクロージャーあるいは単一の各エンクロージャーに内蔵されたあらゆる開示されたエレメントに限定されるものではなく、かえって、実施形態によって相異なるエンクロージャー及び/または相異なるエレメントを通じる位置で、共にあるいは個別的に内蔵されるように開放される。他の例としては、各装置/システムあるいは方法が一つ以上のプロセッシングエレメント/デバイスを通じて制御されるか、または分散ネットワークで具現されうる。この時、追加的及び代案的な実施形態も同一に適用されうる。
図7を参照するに、符号化方式の決定装置は、例えば、黙音判断部700、保存部710、リセット部720及び符号化方式決定部730を備えることができる。黙音判断部700、保存部710、リセット部720及び符号化方式決定部730は、少なくとも一つのプロセッサーあるいはプロセッシングデバイスで具現できる。
黙音判断部700は、入力端子INを通じて入力された現在フレームに設けられた信号が黙音に該当するかどうかを判断できる。黙音判断部700で黙音に該当するかどうかは、現在フレームに設けられた信号のエネルギーまたは特性を基準に判断できる。例えば、黙音判断部700では、現在フレームに設けられた信号のエネルギーが既に設定された臨界値より小さければ、黙音に該当すると判断できる。同様に、他の黙音検出技術が同等に適用されうる。
保存部710は、信号の符号化方式のうち現在フレームに設けられた信号の符号化方式を選択するのに利用するために、一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存することができる。また、保存部710は、所定数の過去フレームに設けられた信号の複数個の符号化方式を保存することができる。
リセット部720は、黙音判断部700で現在フレームに設けられた信号が黙音に該当すると判断されれば、保存部710に保存された過去フレームに設けられた信号に関する情報またはパラメータをリセットできる。
リセット部720でリセットされうる過去フレームに設けられた信号に関する情報またはパラメータは、例えば、長区間特性に関する情報でありうる。リセット部720では、長区間特性のうち既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、または所定フレームに設けられた信号に音声または音楽が存在する可能性の履歴をリセットできる。
ここで、長区間特性は、一つ以上の過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。例えば、長区間特性には既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性及び音声または音楽が存在する可能性の履歴値などがある。そして、短区間特性は、各フレームが持つ固有の特性であって、例えば、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度などの情報あるいはパラメータのうちいずれか一つを含むことができる。
符号化方式決定部730は、黙音判断部700で現在フレームに設けられた信号が黙音に該当すると判断されれば、以前の最後のフレームに設けられた信号の符号化方式で現在フレームに設けられた信号を符号化すると決定し、符号化方式決定部730で決定された符号化方式を出力端子OUTを通じて出力できる。
一方、符号化方式決定部730は、黙音判断部700で現在フレームに設けられた信号が黙音に該当しないと判断されれば、現在フレームに設けられた信号の特性を分析して現在フレームに設けられた信号に関する情報またはパラメータを抽出し、過去フレームに設けられた信号に関する情報またはパラメータと、現在フレームに設けられた信号に関する情報またはパラメータとに基づいて、信号の符号化方式のうち現在フレームの符号化方式を選択し、符号化方式決定部730で決定された符号化方式を出力端子OUTを通じて出力できる。符号化方式決定部730で抽出する現在フレームに設けられた信号に関する情報またはパラメータの例として、前述した短区間特性と長区間特性とがありうる。そして、符号化方式決定部730は、このような現在フレームに設けられた信号に関する情報またはパラメータを保存部710に保存できる。
ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例として、CELPがあり、周波数ドメインで符号化する方式の例として、TCX及びAACがある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的符号化方式も同一に適用され、したがって、前記の符号化方式に制限されない。
図8は、一つ以上の実施形態によって符号化方式の決定装置を図示したものであって、符号化方式の決定装置は、例えば、信号分析部800、保存部805、符号化方式決定部810、変更判断部820及び方式変更部830を備えることができる。信号分析部800、保存部805、符号化方式決定部810、変更判断部820及び方式変更部830は、少なくとも一つ以上のプロセッサーあるいはプロセッシングデバイスで具現できる。
信号分析部800は、例えば、入力端子INを通じて入力された現在フレームに設けられた信号の特性を分析して、現在フレームに設けられた信号に関する情報またはパラメータを抽出できる。信号分析部800で抽出する情報またはパラメータの例として、例えば、短区間特性と長区間特性とがある。短区間特性は、各フレームが持つ固有の特性であって、例えば、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度などの情報を含むことができる。長区間特性は、一つ以上の過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。例えば、長区間特性には、既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性及び音声または音楽が存在する可能性の履歴値などが含まれうる。
このうち、音声が存在する可能性であるSPPは、例えば、前述した式(1)を用いて求めることができる。さらに言及するが、SPPに限定して実施すべきものではない。
また、音声または音楽が存在する可能性の履歴値は、所定数のフレームに設けられた信号に音声または音楽が存在する可能性に、既に設定された加重値を適用して累積した値をいう。図3でSPPを例として、音声または音楽が存在する可能性の履歴値を計算する実施形態を前述したことがある。
保存部805は、信号の符号化方式のうち、現在フレームに設けられた信号の符号化方式を選択するのに使われうる、一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存することができる。また、保存部805は、所定数の過去フレームに設けられた信号の符号化方式を保存することができる。
符号化方式決定部810は、信号分析部800から抽出された現在フレームに設けられた信号に関する情報またはパラメータに基づいて、信号の符号化方式のうち、現在フレームに設けられた信号の符号化方式を選択できる。ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例として、CELPがあり、周波数ドメインで符号化する方式の例として、TCX及びAACがある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的符号化方式も同一に適用され、したがって、前記の符号化方式に制限されない。
変更判断部820は、以前フレームに設けられた信号の符号化方式、所定数の過去フレームに設けられた信号及び現在フレームに設けられた信号に音声または音楽が存在する可能性のうち少なくとも一つ以上を用いて、符号化方式決定部810で選択された符号化方式を変更すべきかどうかを判断する。所定数の過去フレームに設けられた信号または現在フレームに設けられた信号に音声または音楽が存在する可能性に基づいて判断する例として、前述した音声または音楽が存在する可能性の履歴値がある。変更判断部820の動作例は、図3の実施形態を説明しながら前述したことがある。
方式変更部830は、符号化方式決定部810で選択された符号化方式を変更判断部820で変更すべきと判断されれば、符号化方式決定部810で選択された符号化方式を変更し、方式変更部830で変更された方式を出力端子OUTを通じて出力できる。
一方、符号化方式決定部810は、符号化方式決定部810で選択された符号化方式を変更判断部820で変更しなくてもよいと判断されれば、符号化方式決定部810で選択された符号化方式を、出力端子OUTを通じて出力できる。
図9は、一つ以上の実施形態によって符号化方式の決定装置を図示したものであって、符号化方式の決定装置は、例えば、黙音判断部900、保存部905、リセット部910、信号分析部915、符号化方式決定部920、変更判断部925、方式変更部930及びスムージング部935を備えることができる。黙音判断部900、保存部905、リセット部910、信号分析部915、符号化方式決定部920、変更判断部925、方式変更部930及びスムージング部935は、少なくとも一つ以上のプロセッサーあるいはプロセッシングデバイスで具現できる。
黙音判断部900は、例えば、入力端子INを通じて入力された現在フレームに設けられた信号が黙音に該当するかどうかを判断する。黙音判断部900で黙音に該当するかどうかは、所定のフレームに設けられた信号のエネルギーまたは特性を基準に判断する。例えば、黙音判断部900では、現在フレームに設けられた信号のエネルギーが既に設定された臨界値より小さければ、黙音に該当すると判断できる。ここで、他の黙音検出技術が同等に適用されうる。
保存部905は、信号の符号化方式のうち、現在フレームに設けられた信号の符号化方式の選択に利用できる、一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存する。また、保存部905は、所定数の過去フレームに設けられた信号の符号化方式を保存することができる。
リセット部910は、黙音判断部900で現在フレームに設けられた信号が黙音に該当すると判断されれば、例えば保存部905に保存された過去フレームに設けられた信号に関する情報またはパラメータをリセットできる。
リセット部910でリセットされうる過去フレームに設けられた信号に関する情報あるいはパラメータは、例えば、長区間特性に関する情報あるいはパラメータでありうる。リセット部910では、長区間特性のうち、例えば、既に設定された数に該当する過去フレームに設けられた信号の短区間特性に対する平均値及び現在フレームに設けられた信号に、音声または音楽が存在する可能性の履歴をリセットできる。
また、長区間特性は、過去フレームに設けられた信号の短区間特性の推移を分析した情報をいう。ここで、短区間特性は、各フレームが持つ固有の特性であって、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度などの情報を含むことができる。
例えば、長区間特性には、所定数の過去フレームに設けられた信号の短区間特性に対する平均値、現在フレームに設けられた信号に音声または音楽が存在する可能性、及び音声または音楽が存在する可能性の履歴値などがある。このうち、音声が存在する可能性であるSPPは、例えば、前述した式(1)を用いて求めることができる。また、音声または音楽が存在する可能性の履歴値は、所定数のフレームに設けられた信号に音声または音楽が存在する可能性に既に設定された加重値を適用して累積した値であって、図3でSPPを例として、音声が存在する可能性の履歴値を計算する実施形態を前述した。
信号分析部915は、黙音判断部900で現在フレームに設けられた信号が黙音に該当しないと判断されれば、現在フレームに設けられた信号の特性を分析して現在フレームに設けられた信号に関する情報またはパラメータを抽出する。信号分析部915から抽出する情報またはパラメータの例として、例えば、短区間特性と長区間特性とがある。
ただし、信号分析部915は、黙音判断部900で現在フレームに設けられた信号が黙音に該当すると判断されれば、現在フレームに該当する信号に対応する音声または音楽が存在する可能性の履歴値として、既に設定された値を割り当てる。図3の実施形態を用いて説明すれば、以前の最後のフレームに設けられた信号を符号化した方式が第1モードであれば、第1モードの履歴値に‘x’を割り当て、第0モードの履歴値に‘y’を割り当て、以前の最後のフレームに設けられた信号を符号化した方式が第0モードであれば、第1モードの履歴値に‘v’を割り当て、第0モードの履歴値に‘w’を割り当てることができる。ここで、‘x’、‘y’、‘v’及び‘w’は、既に設定された値でありうる。
符号化方式決定部920は、黙音判断部900で現在フレームに設けられた信号が黙音に該当しないと判断されれば、信号分析部915から抽出された現在フレームに設けられた信号に関する情報またはパラメータに基づいて信号の符号化方式のうち、現在フレームに設けられた信号の符号化方式を選択できる。ここで、信号の符号化方式の実施形態として、時間ドメインで符号化する方式と、周波数ドメインで符号化する方式とがある。時間ドメインで符号化する方式の例として、CELPがあり、周波数ドメインで符号化する方式の例として、TCX及びAACがある。また、信号の符号化方式の実施形態として、音声を符号化する方式と音楽を符号化する方式とがありうる。ここで、追加的及び/または代案的符号化方式も同一に適用できて、したがって、前記の符号化方式に制限されない。
ただし、符号化方式決定部920は、黙音判断部900で現在フレームに設けられた信号が黙音に該当すると判断されれば、以前の最後のフレームに設けられた信号を符号化した方式で現在フレームに設けられた信号を符号化すると決定できる。
変更判断部925は、以前フレームに設けられた信号の符号化方式、所定数の過去フレームに設けられた信号及び現在フレームに設けられた信号に音声または音楽が存在する可能性のうち少なくとも一つ以上を用いて、符号化方式決定部920で選択された符号化方式を変更すべきかどうかを判断する。所定数の過去フレームに設けられた信号または現在フレームに設けられた信号に音声または音楽が存在する可能性の例として、前述した音声または音楽が存在する可能性の履歴値がある。変更判断部925の動作例は、図3の実施形態を説明しながら前述したことがある。
方式変更部930は、符号化方式決定部920で選択された符号化方式を変更判断部925で変更すべきと判断されれば、符号化方式決定部920で選択された符号化方式を変更し、方式変更部930で変更された方式を出力端子OUTを通じて出力できる。
しかし、符号化方式決定部920は、符号化方式決定部920で選択された符号化方式を変更判断部925で変更しないと判断されれば、符号化方式決定部920で選択された符号化方式を、出力端子OUTを通じて出力する。
スムージング部935は、もし、図6に図示されたように、黙音と判断される第1区間(600)後に非黙音と判断される第2区間(610)が設けられれば、黙音に該当するフレームから非黙音に該当するフレームに変更される時に瞬間的に発生しうる誤差を低減させるために、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次にSPPを履歴値に反映する比重を高めることができる。例えば、正確度の一番低い黙音から非黙音に変更される最初のフレームに最も低い比重をおき、その次のフレームから比重を益々高めてから、現在フレームからSPPを履歴値にいずれも反映させることができる。
前述した実施形態に付加して、一つ以上の実施形態は、前記の実施形態を具現するために、少なくとも一つのプロセッシングデバイスを制御するために、媒体、例えば、コンピュータで読み取り可能な媒体に存在するコンピュータで読み取り可能なコード/命令語で具現できる。前記媒体は、コンピュータで読み取り可能なコードの保存及び/または伝送可能と定義され、測定可能かつ実体的な(tangible)構造に該当する。
また、前記媒体は、例えば、コンピュータで読み取り可能なコードと結合してデータファイル、データ構造などを含むことができる。コンピュータで読み取り可能な媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープなどの磁気媒体、CD−ROMディスク及びDVDなどの光学媒体、光学ディスクなどの磁気光学媒体、特別にROM、RAM、フラッシュメモリなどのプログラム命令語を保存して行うように構成されたハードウェアデバイスなどを含む。コンピュータで読み取り可能なコードの例としては、コンパイラーにより生成されたマシンコードと、例えば、インタープリターを使用してコンピュータで実行できるハイレベルコードを含む。また前記媒体は分散ネットワークであり、この場合、コンピュータで読み取り可能なコードは、分散方式で保存されて行われる。また、単に例として、プロセッシングエレメントはプロセッサーあるいはコンピュータプロセッサーを含むことができ、プロセッシングエレメントは単一デバイスに分散及び/または含まれうる。
理解を助けるために図面に図示された実施形態を参考として説明されたが、これは例示的なものに過ぎず、当業者ならばこれより多様な変形及び均等な他の実施形態が可能であるという点を理解できるであろう。したがって、本発明の実施形態の真の技術的保護範囲は特許請求の範囲により定められねばならない。
上記の実施形態に関し次の付記を記す。
(付記1) 一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階と、を含むことを特徴とする符号化方式の決定方法。
(付記2) 前記判断する段階は、前記現在フレームに設けられた信号のエネルギーまたは特性を用いて黙音に該当するかどうかを判断することを特徴とする付記1に記載の符号化方式の決定方法。
(付記3) 前記保存された情報またはパラメータは、長区間特性に関する情報またはパラメータであることを特徴とする付記1に記載の符号化方式の決定方法。
(付記4) 前記保存された情報またはパラメータは、前記過去フレームに設けられた各信号に音声または音楽が存在する可能性の履歴であることを特徴とする付記1に記載の符号化方式の決定方法。
(付記5) 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号の短区間特性の推移を分析した情報またはパラメータであることを特徴とする付記1に記載の符号化方式の決定方法。
(付記6) 前記短区間特性は、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度のうち少なくとも一つであることを特徴とする付記5に記載の符号化方式の決定方法。
(付記7) 前記現在フレームに設けられた信号が黙音に該当すれば、以前の最後のフレームに設けられた信号の符号化方式で現在フレームに設けられた信号を符号化すると決定する段階をさらに含むことを特徴とする付記1に記載の符号化方式の決定方法。
(付記8) 前記符号化方式は、周波数ドメイン及び時間ドメインのうちいずれか一つのドメインで符号化することを特徴とする付記1に記載の符号化方式の決定方法。
(付記9) 前記符号化方式は、音声を符号化する方式及び音楽を符号化する方式のうちいずれか一つであることを特徴とする付記1に記載の符号化方式の決定方法。
(付記10) 現在フレームに設けられた信号の符号化方式を決定する段階と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性に基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含むことを特徴とする符号化方式の決定方法。
(付記11) 前記決定された符号化方式を変更すべきかどうかを決定する段階は、
前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴に前記計算された可能性を適用して累積する段階と、
前記計算された可能性の累積された履歴を用いて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、を含むことを特徴とする付記10に記載の符号化方式の決定方法。
(付記12) 前記音声または音楽が存在する可能性の履歴は、各符号化方式に対応して別途に用意することを特徴とする付記11に記載の符号化方式の決定方法。
(付記13) 前記音声または音楽が存在する可能性の履歴は、最小値と最大値とが既に設定されていることを特徴とする付記11または12に記載の符号化方式の決定方法。
(付記14) 前記音声または音楽が存在する可能性の履歴は、前記最小値と前記最大値との差が調節されることによって符号化方式を変更する回数、または符号化方式の変更に対する遅延を調節することを特徴とする付記13に記載の符号化方式の決定方法。
(付記15) 前記累積された履歴を用いて前記決定された符号化方式を変更すべきかどうかを決定する段階は、前記累積された履歴と既に設定された値とを比較して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする付記11または12に記載の符号化方式の決定方法。
(付記16) 前記決定された符号化方式を変更すべきかどうかを決定する段階は、前記過去フレームに設けられた信号の符号化方式も考慮して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする付記10に記載の符号化方式の決定方法。
(付記17) 前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記現在フレームに設けられた信号の符号化方式の決定に利用するために、保存していた一つ以上の過去フレームに設けられた信号に関する情報またはパラメータをリセットする段階と、をさらに含むことを特徴とする付記10に記載の符号化方式の決定方法。
(付記18) 前記リセットする段階は、前記音声または音楽が存在する可能性の履歴をリセットすることを特徴とする付記17に記載の符号化方式の決定方法。
(付記19) 黙音を含む信号が設けられたフレームから非黙音に該当するフレームに変更される時、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次に音声または音楽が存在する可能性を音声または音楽が存在する可能性の履歴に反映する段階をさらに含むことを特徴とする付記17に記載の符号化方式の決定方法。
(付記20) 一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存する保存部と、
前記保存された情報またはパラメータを用いて現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、
現在フレームに設けられた信号が黙音に該当するかどうかを判断する黙音判断部と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットするリセット部と、を備えることを特徴とする符号化方式の決定装置。
(付記21) 前記黙音判断部は、前記現在フレームに設けられた信号のエネルギーまたは特性を用いて黙音に該当するかどうかを判断することを特徴とする付記20に記載の符号化方式の決定装置。
(付記22) 前記保存された情報またはパラメータは、長区間特性に関する情報またはパラメータであることを特徴とする付記20に記載の符号化方式の決定装置。
(付記23) 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴であることを特徴とする付記20に記載の符号化方式の決定装置。
(付記24) 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号の短区間特性の推移を分析した情報またはパラメータであることを特徴とする付記20に記載の符号化方式の決定装置。
(付記25) 前記短区間特性は、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度のうち少なくとも一つであることを特徴とする付記24に記載の符号化方式の決定装置。
(付記26) 前記符号化方式決定部は、前記現在フレームに設けられた信号が黙音に該当すれば、以前の最後のフレームに設けられた信号の符号化方式で現在フレームに設けられた信号を符号化すると決定することを特徴とする付記20に記載の符号化方式の決定装置。
(付記27) 前記符号化方式は、周波数ドメイン及び時間ドメインのうちいずれか一つのドメインで符号化することを特徴とする付記20に記載の符号化方式の決定装置。
(付記28) 前記符号化方式は、音声を符号化する方式及び音楽を符号化する方式のうちいずれか一つであることを特徴とする付記20に記載の符号化方式の決定装置。
(付記29) 現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する信号分析部と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する変更判断部と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する方式変更部と、を備えることを特徴とする符号化方式の決定装置。
(付記30) 前記変更判断部は、前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴に、前記計算された可能性を適用して累積し、前記計算された可能性の累積された履歴を用いて、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする付記29に記載の符号化方式の決定装置。
(付記31) 前記音声または音楽が存在する可能性の履歴は、各符号化方式に対応して別途に用意することを特徴とする付記30に記載の符号化方式の決定装置。
(付記32) 前記音声または音楽が存在する可能性の履歴は、最小値と最大値とが既に設定されていることを特徴とする付記30または付記31に記載の符号化方式の決定装置。
(付記33) 前記音声または音楽が存在する可能性の履歴は、前記最小値と前記最大値との差が調節されることによって、符号化方式を変更する回数または符号化方式の変更に対する遅延を調節することを特徴とする付記32に記載の符号化方式の決定装置。
(付記34) 前記変更決定部は、前記累積された履歴と既に設定された値とを比較して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする付記30または31に記載の符号化方式の決定装置。
(付記35) 前記変更決定部は、前記過去フレームに設けられた信号の符号化方式を考慮して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする付記29に記載の符号化方式の決定装置。
(付記36) 前記過去フレームに設けられた信号に関する情報またはパラメータを保存する保存部と、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する黙音判断部と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットするリセット部と、をさらに備えることを特徴とする付記29に記載の符号化方式の決定装置。
(付記37) 前記リセット部は、前記音声または音楽が存在する可能性の履歴をリセットすることを特徴とする付記36に記載の符号化方式の決定装置。
(付記38) 黙音を含む信号が設けられたフレームから非黙音に該当するフレームに変更される時、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次に、音声または音楽が存在する可能性を音声または音楽が存在する可能性の履歴に反映するスムージング部をさらに備えることを特徴とする付記36に記載の符号化方式の決定装置。
(付記39) 一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階と、を含む方法をコンピュータで行わせるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
(付記40) 現在フレームに設けられた信号の符号化方式を決定する段階と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含む方法をコンピュータで行わせるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。

Claims (4)

  1. 音楽符号化モードと音声符号化モードのうち一つを現在フレームの符号化モードと決定する段階と、
    複数のフレームから得られる信号特性と転換防止パラメータとに基づき、前記現在フレームについて決定された符号化モードを変更すべきであるか否かを判断する段階と、
    前記現在フレームについて決定された符号化モードを変更すべきであると判断された場合、前記現在フレームについて決定された符号化モードが前記音楽符号化モードであれば前記現在フレームについて前記音楽符号化モードを前記音声符号化モードに変更し、前記現在フレームについて決定された符号化モードが前記音声符号化モードであれば前記現在フレームについて前記音声符号化モードを前記音楽符号化モードに変更する段階とを含み、
    前記転換防止パラメータは前記音楽符号化モードと前記音声符号化モードとの間の転換頻度と関連づけられることを特徴とする符号化モードの決定方法。
  2. 前記現在フレームが黙音区間に該当するかどうかを判断する段階と、
    前記現在フレームが黙音区間に該当すれば、以前フレームの符号化モードを前記現在フレームの符号化モードと決定する段階と
    をさらに含むことを特徴とする請求項1に記載の符号化モードの決定方法。
  3. 前記現在フレームが黙音区間に該当すれば、
    複数の以前フレームと係わるパラメータをリセットする段階をさらに含むことを特徴とする請求項1に記載の符号化モードの決定方法。
  4. 音楽符号化モードと音声符号化モードのうち一つを現在フレームの符号化モードと決定する段階と、
    複数のフレームから得られる信号特性と転換防止パラメータとに基づき、前記現在フレームについて決定された符号化モードを変更すべきであるか否かを判断する段階と、
    前記現在フレームについて決定された符号化モードを変更すべきであると判断された場合、前記現在フレームについて決定された符号化モードが前記音楽符号化モードであれば前記現在フレームについて前記音楽符号化モードを前記音声符号化モードに変更し、前記現在フレームについて決定された符号化モードが前記音声符号化モードであれば前記現在フレームについて前記音声符号化モードを前記音楽符号化モードに変更する段階とを含み、
    前記転換防止パラメータは前記音楽符号化モードと前記音声符号化モードとの間の転換頻度と関連づけられることを特徴とする符号化モード決定方法をコンピュータで行わせるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2014205254A 2008-07-09 2014-10-03 符号化方式の決定方法及び装置 Active JP6258835B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2008-0066737 2008-07-09
KR1020080066737A KR20100006492A (ko) 2008-07-09 2008-07-09 부호화 방식 결정 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011517354A Division JP5844639B2 (ja) 2008-07-09 2009-07-09 符号化方式の決定方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017152050A Division JP6587659B2 (ja) 2008-07-09 2017-08-04 符号化方式の決定方法及び装置

Publications (2)

Publication Number Publication Date
JP2015026083A JP2015026083A (ja) 2015-02-05
JP6258835B2 true JP6258835B2 (ja) 2018-01-10

Family

ID=41507590

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2011517354A Active JP5844639B2 (ja) 2008-07-09 2009-07-09 符号化方式の決定方法及び装置
JP2014205254A Active JP6258835B2 (ja) 2008-07-09 2014-10-03 符号化方式の決定方法及び装置
JP2017152050A Active JP6587659B2 (ja) 2008-07-09 2017-08-04 符号化方式の決定方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011517354A Active JP5844639B2 (ja) 2008-07-09 2009-07-09 符号化方式の決定方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017152050A Active JP6587659B2 (ja) 2008-07-09 2017-08-04 符号化方式の決定方法及び装置

Country Status (6)

Country Link
US (3) US20100017202A1 (ja)
EP (2) EP3352457A1 (ja)
JP (3) JP5844639B2 (ja)
KR (1) KR20100006492A (ja)
CN (2) CN105355208B (ja)
WO (1) WO2010005254A2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2198426A4 (en) * 2007-10-15 2012-01-18 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A SIGNAL
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
JP6342828B2 (ja) * 2015-02-25 2018-06-13 富士フイルム株式会社 投写用光学系および投写型表示装置
CN106571150B (zh) * 2015-10-12 2021-04-16 阿里巴巴集团控股有限公司 一种识别音乐中的人声的方法和系统
US10504539B2 (en) * 2017-12-05 2019-12-10 Synaptics Incorporated Voice activity detection systems and methods
CN109273017B (zh) * 2018-08-14 2022-06-21 Oppo广东移动通信有限公司 编码控制方法、装置以及电子设备
JP7407580B2 (ja) 2018-12-06 2024-01-04 シナプティクス インコーポレイテッド システム、及び、方法
US11317098B2 (en) * 2018-12-07 2022-04-26 Intel Corporation System and method for rendered scene change detection with remotely hosted graphics applications
JP2020115206A (ja) 2019-01-07 2020-07-30 シナプティクス インコーポレイテッド システム及び方法
US11064294B1 (en) 2020-01-10 2021-07-13 Synaptics Incorporated Multiple-source tracking and voice activity detections for planar microphone arrays
US11823707B2 (en) 2022-01-10 2023-11-21 Synaptics Incorporated Sensitivity mode for an audio spotting system

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4375083A (en) * 1980-01-31 1983-02-22 Bell Telephone Laboratories, Incorporated Signal sequence editing method and apparatus with automatic time fitting of edited segments
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer
US4441200A (en) * 1981-10-08 1984-04-03 Motorola Inc. Digital voice processing system
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
JPS61184599A (ja) * 1985-02-12 1986-08-18 日本電信電話株式会社 コ−デツク制御方式
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US5007093A (en) * 1987-04-03 1991-04-09 At&T Bell Laboratories Adaptive threshold voiced detector
US4805219A (en) * 1987-04-03 1989-02-14 Dragon Systems, Inc. Method for speech recognition
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
JPH0398318A (ja) * 1989-09-11 1991-04-23 Fujitsu Ltd 音声符号化方式
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5546395A (en) * 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
SE503547C2 (sv) * 1993-06-11 1996-07-01 Ericsson Telefon Ab L M Anordning och förfarande för döljande av förlorade ramar
EP0681730A4 (en) * 1993-11-30 1997-12-17 At & T Corp REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS.
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
EP0944037B1 (en) * 1995-01-17 2001-10-10 Nec Corporation Speech encoder with features extracted from current and previous frames
SE504010C2 (sv) * 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5774849A (en) * 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US5890109A (en) * 1996-03-28 1999-03-30 Intel Corporation Re-initializing adaptive parameters for encoding audio signals
US5937374A (en) * 1996-05-15 1999-08-10 Advanced Micro Devices, Inc. System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
JP2856185B2 (ja) * 1997-01-21 1999-02-10 日本電気株式会社 音声符号化復号化システム
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
JP3211762B2 (ja) * 1997-12-12 2001-09-25 日本電気株式会社 音声及び音楽符号化方式
US6337947B1 (en) * 1998-03-24 2002-01-08 Ati Technologies, Inc. Method and apparatus for customized editing of video and/or audio signals
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
MY138849A (en) * 1998-11-24 2009-07-31 Ericsson Telefon Ab L M Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6631352B1 (en) * 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
AU4201100A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
JP4464488B2 (ja) * 1999-06-30 2010-05-19 パナソニック株式会社 音声復号化装置及び符号誤り補償方法、音声復号化方法
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
AU7486200A (en) * 1999-09-22 2001-04-24 Conexant Systems, Inc. Multimode speech encoder
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
JP3734696B2 (ja) * 2000-09-25 2006-01-11 松下電器産業株式会社 無音圧縮音声符号化復号化装置
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6614370B2 (en) * 2001-01-26 2003-09-02 Oded Gottesman Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation
US7356464B2 (en) 2001-05-11 2008-04-08 Koninklijke Philips Electronics, N.V. Method and device for estimating signal power in compressed audio using scale factors
US6782467B1 (en) * 2001-06-29 2004-08-24 Cypress Semiconductor Corp. Method and apparatus for fast limited core area access and cross-port word size multiplication in synchronous multiport memories
US6836514B2 (en) * 2001-07-10 2004-12-28 Motorola, Inc. Method for the detection and recovery of errors in the frame overhead of digital video decoding systems
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
DE10148351B4 (de) * 2001-09-29 2007-06-21 Grundig Multimedia B.V. Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
GB0321093D0 (en) * 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
US7412376B2 (en) * 2003-09-10 2008-08-12 Microsoft Corporation System and method for real-time detection and preservation of speech onset in a signal
GB0326262D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
US8315865B2 (en) * 2004-05-04 2012-11-20 Hewlett-Packard Development Company, L.P. Method and apparatus for adaptive conversation detection employing minimal computation
US7596486B2 (en) 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
KR100800873B1 (ko) * 2005-10-28 2008-02-04 삼성전자주식회사 음성 신호 검출 시스템 및 방법
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US20080077410A1 (en) * 2006-09-26 2008-03-27 Nokia Corporation System and method for providing redundancy management
RU2426179C2 (ru) * 2006-10-10 2011-08-10 Квэлкомм Инкорпорейтед Способ и устройство для кодирования и декодирования аудиосигналов
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
KR101279857B1 (ko) * 2006-12-12 2013-06-28 삼성전자주식회사 적응적 멀티 레이트 코덱 모드 디코딩 방법 및 장치
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) * 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
EP2198426A4 (en) * 2007-10-15 2012-01-18 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A SIGNAL
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
KR101797033B1 (ko) * 2008-12-05 2017-11-14 삼성전자주식회사 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US9886963B2 (en) * 2015-04-05 2018-02-06 Qualcomm Incorporated Encoder selection

Also Published As

Publication number Publication date
CN105355208A (zh) 2016-02-24
US20180075857A1 (en) 2018-03-15
JP6587659B2 (ja) 2019-10-09
US20100017202A1 (en) 2010-01-21
EP2326090A2 (en) 2011-05-25
KR20100006492A (ko) 2010-01-19
JP2015026083A (ja) 2015-02-05
JP2017211666A (ja) 2017-11-30
CN105355208B (zh) 2021-01-15
JP2011527762A (ja) 2011-11-04
EP2326090A4 (en) 2011-11-23
WO2010005254A3 (ko) 2010-03-11
EP3352457A1 (en) 2018-07-25
CN102150200A (zh) 2011-08-10
US20170287497A1 (en) 2017-10-05
US10360921B2 (en) 2019-07-23
JP5844639B2 (ja) 2016-01-20
WO2010005254A2 (ko) 2010-01-14
US9847090B2 (en) 2017-12-19

Similar Documents

Publication Publication Date Title
JP6587659B2 (ja) 符号化方式の決定方法及び装置
US9418666B2 (en) Method and apparatus for encoding and decoding audio/speech signal
US10535358B2 (en) Method and apparatus for encoding/decoding speech signal using coding mode
JP5265553B2 (ja) フレーム消去回復のシステム、方法、および装置
KR101060533B1 (ko) 신호 변화 검출을 위한 시스템, 방법 및 장치
US20080147414A1 (en) Method and apparatus to determine encoding mode of audio signal and method and apparatus to encode and/or decode audio signal using the encoding mode determination method and apparatus
US20080162121A1 (en) Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same
KR102626320B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
KR102007972B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
US8977542B2 (en) Audio encoder and decoder and methods for encoding and decoding an audio signal
PH12014502232B1 (en) Generation of comfort noise
KR102593442B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
TW200818802A (en) Systems, methods, and apparatus for signal change detection
US10224049B2 (en) Apparatuses and methods for encoding and decoding a time-series sound signal by obtaining a plurality of codes and encoding and decoding distortions corresponding to the codes
KR101728047B1 (ko) 부호화 방식 결정 방법 및 장치
KR20170044623A (ko) 부호화 방식 결정 방법 및 장치
KR20150053891A (ko) 부호화 방식 결정 방법 및 장치
KR20110086919A (ko) 에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치
KR20100006490A (ko) 부호화 방식 결정 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170804

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171207

R150 Certificate of patent or registration of utility model

Ref document number: 6258835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250