JP2011527762A - 符号化方式の決定方法及び装置 - Google Patents
符号化方式の決定方法及び装置 Download PDFInfo
- Publication number
- JP2011527762A JP2011527762A JP2011517354A JP2011517354A JP2011527762A JP 2011527762 A JP2011527762 A JP 2011527762A JP 2011517354 A JP2011517354 A JP 2011517354A JP 2011517354 A JP2011517354 A JP 2011517354A JP 2011527762 A JP2011527762 A JP 2011527762A
- Authority
- JP
- Japan
- Prior art keywords
- signal provided
- encoding
- current frame
- encoding method
- possibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 313
- 238000001228 spectrum Methods 0.000 claims description 13
- 230000007774 longterm Effects 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 7
- 230000005484 gravity Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Abstract
Description
ここで、SNR_Wは、SNR_SPに対する加重値であり、TILT_Wは、TILT_SPに対する加重値であり、ZC_Wは、ZC_SPに対する加重値であり、SNR_SPは、LP−LTP利得に対する長区間特性であって、例えば、下記の式(2)を用いて求めることができ、TILT_SPは、スペクトルチルトに対する長区間特性であって、例えば、下記の式(3)を用いて求めることができ、ZC_SPは、零点交差率に対する長区間特性であって、例えば、下記の式(4)4を用いて求めることができる。
SNR_SP=a*SNR_SP+(1−a)*SNR_VAR
else
SNR_SP−=D1 (2)
ここで、SNR_VARは、現在フレームに先行する所定数のフレームによるLT−LTP利得に対する平均値と現在フレームのLP−LTP利得との差分値あるいはその差分値の絶対値であり、SNR_THRは、既に設定された臨界値であり、SNR_SPの初期値は、0であり、‘a’は、0〜1の実数であって、SNR_SPとSNR_VARとに対する加重値であり、‘D1’は、β1×(SNR_THR/LT−LTP利得)であり、‘β1’は、減少程度を表す定数である。
TILT_SP=a2*TILT_SP+(1−a2)*TILT_VAR
else
TILT_SP−=D2 (3)
ここで、TILT_VARは、現在フレームに先行する所定数のフレームによるスペクトルチルトに対する平均値と現在フレームのスペクトルチルトとの差分値あるいはその差分値の絶対値であり、TILT_THRは、既に設定された臨界値であり、TILT_SPの初期値は、0であり、‘a2’は、0〜1の実数であって、TILT_SPとTILT_VARとに対する加重値であり、D2は、β2×(TILT_THR/SPECTRUM TILT)であり、‘β2’は、減少程度を表す定数である。
ZC_SP=a3*ZC_SP+(1−a3)*ZC_VAR
else
ZC_SP−=D3 (4)
ここで、ZC_VARは、現在フレームに先行する所定数のフレームによる零点交差率に対する平均値と現在フレームの零点交差率との差分値、あるいはその差分値の絶対値であり、ZC_THRは、既に設定された臨界値であり、ZC_SPの初期値は、0であり、‘a3’は、0〜1の実数であって、ZC_SPとZC_VARとに対する加重値であり、D3は、β3×(ZC_THR/zero−crossing rate)であり、‘β3’は、減少程度を表す定数である。
ここで、例えば、Mode0_Hysteresisは第0モードの履歴値であり、‘y’及び‘z’は、既に設定された値である。
ここで、例えば、Mode1_Hysteresisは、第1モードの履歴値であり、‘x’は、既に設定された値である。
ここで、例えば、Mode0_Hysteresisは、第0モードの履歴値であり、‘w’は、既に設定された値である。
ここで、例えば、Mode1_Hysteresisは、第1モードの履歴値であり、‘u’及び‘v’は、既に設定された値である。
Claims (40)
- 一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階と、を含むことを特徴とする符号化方式の決定方法。 - 前記判断する段階は、前記現在フレームに設けられた信号のエネルギーまたは特性を用いて黙音に該当するかどうかを判断することを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記保存された情報またはパラメータは、長区間特性に関する情報またはパラメータであることを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記保存された情報またはパラメータは、前記過去フレームに設けられた各信号に音声または音楽が存在する可能性の履歴であることを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号の短区間特性の推移を分析した情報またはパラメータであることを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記短区間特性は、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度のうち少なくとも一つであることを特徴とする請求項5に記載の符号化方式の決定方法。
- 前記現在フレームに設けられた信号が黙音に該当すれば、以前の最後のフレームに設けられた信号の符号化方式で現在フレームに設けられた信号を符号化すると決定する段階をさらに含むことを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記符号化方式は、周波数ドメイン及び時間ドメインのうちいずれか一つのドメインで符号化することを特徴とする請求項1に記載の符号化方式の決定方法。
- 前記符号化方式は、音声を符号化する方式及び音楽を符号化する方式のうちいずれか一つであることを特徴とする請求項1に記載の符号化方式の決定方法。
- 現在フレームに設けられた信号の符号化方式を決定する段階と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性に基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含むことを特徴とする符号化方式の決定方法。 - 前記決定された符号化方式を変更すべきかどうかを決定する段階は、
前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴に前記計算された可能性を適用して累積する段階と、
前記計算された可能性の累積された履歴を用いて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、を含むことを特徴とする請求項10に記載の符号化方式の決定方法。 - 前記音声または音楽が存在する可能性の履歴は、各符号化方式に対応して別途に用意することを特徴とする請求項11に記載の符号化方式の決定方法。
- 前記音声または音楽が存在する可能性の履歴は、最小値と最大値とが既に設定されていることを特徴とする請求項11または12に記載の符号化方式の決定方法。
- 前記音声または音楽が存在する可能性の履歴は、前記最小値と前記最大値との差が調節されることによって符号化方式を変更する回数、または符号化方式の変更に対する遅延を調節することを特徴とする請求項13に記載の符号化方式の決定方法。
- 前記累積された履歴を用いて前記決定された符号化方式を変更すべきかどうかを決定する段階は、前記累積された履歴と既に設定された値とを比較して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする請求項11または12に記載の符号化方式の決定方法。
- 前記決定された符号化方式を変更すべきかどうかを決定する段階は、前記過去フレームに設けられた信号の符号化方式も考慮して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする請求項10に記載の符号化方式の決定方法。
- 前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記現在フレームに設けられた信号の符号化方式の決定に利用するために、保存していた一つ以上の過去フレームに設けられた信号に関する情報またはパラメータをリセットする段階と、をさらに含むことを特徴とする請求項10に記載の符号化方式の決定方法。 - 前記リセットする段階は、前記音声または音楽が存在する可能性の履歴をリセットすることを特徴とする請求項17に記載の符号化方式の決定方法。
- 黙音を含む信号が設けられたフレームから非黙音に該当するフレームに変更される時、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次に音声または音楽が存在する可能性を音声または音楽が存在する可能性の履歴に反映する段階をさらに含むことを特徴とする請求項17に記載の符号化方式の決定方法。
- 一つ以上の過去フレームに設けられた信号に関する情報またはパラメータを保存する保存部と、
前記保存された情報またはパラメータを用いて現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、
現在フレームに設けられた信号が黙音に該当するかどうかを判断する黙音判断部と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットするリセット部と、を備えることを特徴とする符号化方式の決定装置。 - 前記黙音判断部は、前記現在フレームに設けられた信号のエネルギーまたは特性を用いて黙音に該当するかどうかを判断することを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記保存された情報またはパラメータは、長区間特性に関する情報またはパラメータであることを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴であることを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記保存された情報またはパラメータは、前記過去フレームに設けられた信号の短区間特性の推移を分析した情報またはパラメータであることを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記短区間特性は、線形/長期予測利得、スペクトルチルト及び零点交差率及びスペクトル自己相関度のうち少なくとも一つであることを特徴とする請求項24に記載の符号化方式の決定装置。
- 前記符号化方式決定部は、前記現在フレームに設けられた信号が黙音に該当すれば、以前の最後のフレームに設けられた信号の符号化方式で現在フレームに設けられた信号を符号化すると決定することを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記符号化方式は、周波数ドメイン及び時間ドメインのうちいずれか一つのドメインで符号化することを特徴とする請求項20に記載の符号化方式の決定装置。
- 前記符号化方式は、音声を符号化する方式及び音楽を符号化する方式のうちいずれか一つであることを特徴とする請求項20に記載の符号化方式の決定装置。
- 現在フレームに設けられた信号の符号化方式を決定する符号化方式決定部と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する信号分析部と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する変更判断部と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する方式変更部と、を備えることを特徴とする符号化方式の決定装置。 - 前記変更判断部は、前記過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴に、前記計算された可能性を適用して累積し、前記計算された可能性の累積された履歴を用いて、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする請求項29に記載の符号化方式の決定装置。
- 前記音声または音楽が存在する可能性の履歴は、各符号化方式に対応して別途に用意することを特徴とする請求項30に記載の符号化方式の決定装置。
- 前記音声または音楽が存在する可能性の履歴は、最小値と最大値とが既に設定されていることを特徴とする請求項30または請求項31に記載の符号化方式の決定装置。
- 前記音声または音楽が存在する可能性の履歴は、前記最小値と前記最大値との差が調節されることによって、符号化方式を変更する回数または符号化方式の変更に対する遅延を調節することを特徴とする請求項32に記載の符号化方式の決定装置。
- 前記変更決定部は、前記累積された履歴と既に設定された値とを比較して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする請求項30または31に記載の符号化方式の決定装置。
- 前記変更決定部は、前記過去フレームに設けられた信号の符号化方式を考慮して、前記決定された符号化方式を変更すべきかどうかを決定することを特徴とする請求項29に記載の符号化方式の決定装置。
- 前記過去フレームに設けられた信号に関する情報またはパラメータを保存する保存部と、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する黙音判断部と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットするリセット部と、をさらに備えることを特徴とする請求項29に記載の符号化方式の決定装置。 - 前記リセット部は、前記音声または音楽が存在する可能性の履歴をリセットすることを特徴とする請求項36に記載の符号化方式の決定装置。
- 黙音を含む信号が設けられたフレームから非黙音に該当するフレームに変更される時、黙音から非黙音に変更される最初のフレームから所定のフレームまで順次に、音声または音楽が存在する可能性を音声または音楽が存在する可能性の履歴に反映するスムージング部をさらに備えることを特徴とする請求項36に記載の符号化方式の決定装置。
- 一つ以上の過去フレームに設けられた信号に対して保存された情報またはパラメータに基づいて、現在フレームに設けられた信号に対して決定された符号化方式を持つ符号化方式の決定方法において、
前記現在フレームに設けられた信号が黙音に該当するかどうかを判断する段階と、
前記現在フレームに設けられた信号が黙音に該当すれば、前記保存された情報またはパラメータをリセットする段階と、を含む方法をコンピュータで行わせるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 - 現在フレームに設けられた信号の符号化方式を決定する段階と、
前記現在フレームに設けられた信号に音声または音楽が存在する可能性を計算する段階と、
一つ以上の過去フレームに設けられた信号に音声または音楽が存在する可能性の履歴と前記計算された可能性とに基づいて、前記決定された符号化方式を変更すべきかどうかを決定する段階と、
前記決定された符号化方式を変更すべきと決定されれば、前記決定された符号化方式を変更する段階と、を含む方法をコンピュータで行わせるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2008-0066737 | 2008-07-09 | ||
KR1020080066737A KR20100006492A (ko) | 2008-07-09 | 2008-07-09 | 부호화 방식 결정 방법 및 장치 |
PCT/KR2009/003777 WO2010005254A2 (ko) | 2008-07-09 | 2009-07-09 | 부호화 방식 결정 방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014205254A Division JP6258835B2 (ja) | 2008-07-09 | 2014-10-03 | 符号化方式の決定方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011527762A true JP2011527762A (ja) | 2011-11-04 |
JP5844639B2 JP5844639B2 (ja) | 2016-01-20 |
Family
ID=41507590
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011517354A Active JP5844639B2 (ja) | 2008-07-09 | 2009-07-09 | 符号化方式の決定方法及び装置 |
JP2014205254A Active JP6258835B2 (ja) | 2008-07-09 | 2014-10-03 | 符号化方式の決定方法及び装置 |
JP2017152050A Active JP6587659B2 (ja) | 2008-07-09 | 2017-08-04 | 符号化方式の決定方法及び装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014205254A Active JP6258835B2 (ja) | 2008-07-09 | 2014-10-03 | 符号化方式の決定方法及び装置 |
JP2017152050A Active JP6587659B2 (ja) | 2008-07-09 | 2017-08-04 | 符号化方式の決定方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (3) | US20100017202A1 (ja) |
EP (2) | EP3352457A1 (ja) |
JP (3) | JP5844639B2 (ja) |
KR (1) | KR20100006492A (ja) |
CN (2) | CN105355208B (ja) |
WO (1) | WO2010005254A2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2198426A4 (en) * | 2007-10-15 | 2012-01-18 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
CN103035248B (zh) | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
JP6342828B2 (ja) * | 2015-02-25 | 2018-06-13 | 富士フイルム株式会社 | 投写用光学系および投写型表示装置 |
CN106571150B (zh) * | 2015-10-12 | 2021-04-16 | 阿里巴巴集团控股有限公司 | 一种识别音乐中的人声的方法和系统 |
US10504539B2 (en) * | 2017-12-05 | 2019-12-10 | Synaptics Incorporated | Voice activity detection systems and methods |
CN109273017B (zh) * | 2018-08-14 | 2022-06-21 | Oppo广东移动通信有限公司 | 编码控制方法、装置以及电子设备 |
JP7407580B2 (ja) | 2018-12-06 | 2024-01-04 | シナプティクス インコーポレイテッド | システム、及び、方法 |
US11317098B2 (en) * | 2018-12-07 | 2022-04-26 | Intel Corporation | System and method for rendered scene change detection with remotely hosted graphics applications |
JP2020115206A (ja) | 2019-01-07 | 2020-07-30 | シナプティクス インコーポレイテッド | システム及び方法 |
US11064294B1 (en) | 2020-01-10 | 2021-07-13 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184599A (ja) * | 1985-02-12 | 1986-08-18 | 日本電信電話株式会社 | コ−デツク制御方式 |
JPH11175098A (ja) * | 1997-12-12 | 1999-07-02 | Nec Corp | 音声及び音楽符号化方式 |
JP2002099299A (ja) * | 2000-09-25 | 2002-04-05 | Matsushita Electric Ind Co Ltd | 無音圧縮音声符号化復号化装置 |
JP2003509707A (ja) * | 1999-07-29 | 2003-03-11 | コネクサント システムズ,インコーポレーテッド | 音楽信号に適応するための音声アクティビティ検出を用いた音声符号化 |
JP2007523388A (ja) * | 2004-02-23 | 2007-08-16 | ノキア コーポレイション | エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、オーディオ信号を符号化する方法、モジュール、およびコンピュータプログラム製品 |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
Family Cites Families (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4375083A (en) * | 1980-01-31 | 1983-02-22 | Bell Telephone Laboratories, Incorporated | Signal sequence editing method and apparatus with automatic time fitting of edited segments |
US4388495A (en) * | 1981-05-01 | 1983-06-14 | Interstate Electronics Corporation | Speech recognition microcomputer |
US4441200A (en) * | 1981-10-08 | 1984-04-03 | Motorola Inc. | Digital voice processing system |
JPS58140798A (ja) * | 1982-02-15 | 1983-08-20 | 株式会社日立製作所 | 音声ピツチ抽出方法 |
US4561102A (en) * | 1982-09-20 | 1985-12-24 | At&T Bell Laboratories | Pitch detector for speech analysis |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US5007093A (en) * | 1987-04-03 | 1991-04-09 | At&T Bell Laboratories | Adaptive threshold voiced detector |
US4805219A (en) * | 1987-04-03 | 1989-02-14 | Dragon Systems, Inc. | Method for speech recognition |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
JPH0398318A (ja) * | 1989-09-11 | 1991-04-23 | Fujitsu Ltd | 音声符号化方式 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US5546395A (en) * | 1993-01-08 | 1996-08-13 | Multi-Tech Systems, Inc. | Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
SE503547C2 (sv) * | 1993-06-11 | 1996-07-01 | Ericsson Telefon Ab L M | Anordning och förfarande för döljande av förlorade ramar |
EP0681730A4 (en) * | 1993-11-30 | 1997-12-17 | At & T Corp | REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS. |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
EP0944037B1 (en) * | 1995-01-17 | 2001-10-10 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
SE504010C2 (sv) * | 1995-02-08 | 1996-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för prediktiv kodning av tal- och datasignaler |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5774849A (en) * | 1996-01-22 | 1998-06-30 | Rockwell International Corporation | Method and apparatus for generating frame voicing decisions of an incoming speech signal |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
US5890109A (en) * | 1996-03-28 | 1999-03-30 | Intel Corporation | Re-initializing adaptive parameters for encoding audio signals |
US5937374A (en) * | 1996-05-15 | 1999-08-10 | Advanced Micro Devices, Inc. | System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP2856185B2 (ja) * | 1997-01-21 | 1999-02-10 | 日本電気株式会社 | 音声符号化復号化システム |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
US6337947B1 (en) * | 1998-03-24 | 2002-01-08 | Ati Technologies, Inc. | Method and apparatus for customized editing of video and/or audio signals |
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
MY138849A (en) * | 1998-11-24 | 2009-07-31 | Ericsson Telefon Ab L M | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6631352B1 (en) * | 1999-01-08 | 2003-10-07 | Matushita Electric Industrial Co. Ltd. | Decoding circuit and reproduction apparatus which mutes audio after header parameter changes |
AU4201100A (en) * | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
JP4464488B2 (ja) * | 1999-06-30 | 2010-05-19 | パナソニック株式会社 | 音声復号化装置及び符号誤り補償方法、音声復号化方法 |
AU7486200A (en) * | 1999-09-22 | 2001-04-24 | Conexant Systems, Inc. | Multimode speech encoder |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US6614370B2 (en) * | 2001-01-26 | 2003-09-02 | Oded Gottesman | Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation |
US7356464B2 (en) | 2001-05-11 | 2008-04-08 | Koninklijke Philips Electronics, N.V. | Method and device for estimating signal power in compressed audio using scale factors |
US6782467B1 (en) * | 2001-06-29 | 2004-08-24 | Cypress Semiconductor Corp. | Method and apparatus for fast limited core area access and cross-port word size multiplication in synchronous multiport memories |
US6836514B2 (en) * | 2001-07-10 | 2004-12-28 | Motorola, Inc. | Method for the detection and recovery of errors in the frame overhead of digital video decoding systems |
US6959276B2 (en) * | 2001-09-27 | 2005-10-25 | Microsoft Corporation | Including the category of environmental noise when processing speech signals |
DE10148351B4 (de) * | 2001-09-29 | 2007-06-21 | Grundig Multimedia B.V. | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
US7158572B2 (en) * | 2002-02-14 | 2007-01-02 | Tellabs Operations, Inc. | Audio enhancement communication techniques |
GB0321093D0 (en) * | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
US7412376B2 (en) * | 2003-09-10 | 2008-08-12 | Microsoft Corporation | System and method for real-time detection and preservation of speech onset in a signal |
GB0326262D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
KR20070009644A (ko) * | 2004-04-27 | 2007-01-18 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 |
US8315865B2 (en) * | 2004-05-04 | 2012-11-20 | Hewlett-Packard Development Company, L.P. | Method and apparatus for adaptive conversation detection employing minimal computation |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
KR100800873B1 (ko) * | 2005-10-28 | 2008-02-04 | 삼성전자주식회사 | 음성 신호 검출 시스템 및 방법 |
WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
US20080077410A1 (en) * | 2006-09-26 | 2008-03-27 | Nokia Corporation | System and method for providing redundancy management |
US8209187B2 (en) * | 2006-12-05 | 2012-06-26 | Nokia Corporation | Speech coding arrangement for communication networks |
KR101279857B1 (ko) * | 2006-12-12 | 2013-06-28 | 삼성전자주식회사 | 적응적 멀티 레이트 코덱 모드 디코딩 방법 및 장치 |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) * | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
EP2198426A4 (en) * | 2007-10-15 | 2012-01-18 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
KR101797033B1 (ko) * | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
-
2008
- 2008-07-09 KR KR1020080066737A patent/KR20100006492A/ko active IP Right Grant
-
2009
- 2009-07-09 EP EP18161810.9A patent/EP3352457A1/en active Pending
- 2009-07-09 CN CN201510902784.1A patent/CN105355208B/zh active Active
- 2009-07-09 JP JP2011517354A patent/JP5844639B2/ja active Active
- 2009-07-09 EP EP09794660A patent/EP2326090A4/en not_active Ceased
- 2009-07-09 CN CN2009801351407A patent/CN102150200A/zh active Pending
- 2009-07-09 WO PCT/KR2009/003777 patent/WO2010005254A2/ko active Application Filing
- 2009-07-09 US US12/458,385 patent/US20100017202A1/en not_active Abandoned
-
2014
- 2014-10-03 JP JP2014205254A patent/JP6258835B2/ja active Active
-
2017
- 2017-06-21 US US15/629,375 patent/US9847090B2/en active Active
- 2017-08-04 JP JP2017152050A patent/JP6587659B2/ja active Active
- 2017-11-27 US US15/822,392 patent/US10360921B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184599A (ja) * | 1985-02-12 | 1986-08-18 | 日本電信電話株式会社 | コ−デツク制御方式 |
JPH11175098A (ja) * | 1997-12-12 | 1999-07-02 | Nec Corp | 音声及び音楽符号化方式 |
JP2003509707A (ja) * | 1999-07-29 | 2003-03-11 | コネクサント システムズ,インコーポレーテッド | 音楽信号に適応するための音声アクティビティ検出を用いた音声符号化 |
JP2002099299A (ja) * | 2000-09-25 | 2002-04-05 | Matsushita Electric Ind Co Ltd | 無音圧縮音声符号化復号化装置 |
JP2007523388A (ja) * | 2004-02-23 | 2007-08-16 | ノキア コーポレイション | エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、オーディオ信号を符号化する方法、モジュール、およびコンピュータプログラム製品 |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
Also Published As
Publication number | Publication date |
---|---|
JP6258835B2 (ja) | 2018-01-10 |
CN105355208A (zh) | 2016-02-24 |
US20180075857A1 (en) | 2018-03-15 |
JP6587659B2 (ja) | 2019-10-09 |
US20100017202A1 (en) | 2010-01-21 |
EP2326090A2 (en) | 2011-05-25 |
KR20100006492A (ko) | 2010-01-19 |
JP2015026083A (ja) | 2015-02-05 |
JP2017211666A (ja) | 2017-11-30 |
CN105355208B (zh) | 2021-01-15 |
EP2326090A4 (en) | 2011-11-23 |
WO2010005254A3 (ko) | 2010-03-11 |
EP3352457A1 (en) | 2018-07-25 |
CN102150200A (zh) | 2011-08-10 |
US20170287497A1 (en) | 2017-10-05 |
US10360921B2 (en) | 2019-07-23 |
JP5844639B2 (ja) | 2016-01-20 |
WO2010005254A2 (ko) | 2010-01-14 |
US9847090B2 (en) | 2017-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6587659B2 (ja) | 符号化方式の決定方法及び装置 | |
US10535358B2 (en) | Method and apparatus for encoding/decoding speech signal using coding mode | |
US9418666B2 (en) | Method and apparatus for encoding and decoding audio/speech signal | |
US10056088B2 (en) | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals | |
KR100464369B1 (ko) | 음성 부호화 시스템의 여기 코드북 탐색 방법 | |
KR102626320B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
EP2927905A1 (en) | Generation of comfort noise | |
BR112013026333B1 (pt) | método de classificação de sinal de áudio baseada em quadro, classificador de áudio, dispositivo de comunicação de áudio, e, disposição de codec de áudio | |
EP2593937A1 (en) | Audio encoder and decoder and methods for encoding and decoding an audio signal | |
KR102593442B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
JP2009069309A (ja) | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 | |
TW200818802A (en) | Systems, methods, and apparatus for signal change detection | |
US10224049B2 (en) | Apparatuses and methods for encoding and decoding a time-series sound signal by obtaining a plurality of codes and encoding and decoding distortions corresponding to the codes | |
JP2011164126A (ja) | 雑音抑圧フィルタ算出方法と、その装置と、プログラム | |
KR101728047B1 (ko) | 부호화 방식 결정 방법 및 장치 | |
KR20170044623A (ko) | 부호화 방식 결정 방법 및 장치 | |
KR20150053891A (ko) | 부호화 방식 결정 방법 및 장치 | |
KR20110086919A (ko) | 에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치 | |
KR20100006490A (ko) | 부호화 방식 결정 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130130 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130806 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131106 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141003 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20141014 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20141226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5844639 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |