JP2013502619A - 周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定 - Google Patents
周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定 Download PDFInfo
- Publication number
- JP2013502619A JP2013502619A JP2012526186A JP2012526186A JP2013502619A JP 2013502619 A JP2013502619 A JP 2013502619A JP 2012526186 A JP2012526186 A JP 2012526186A JP 2012526186 A JP2012526186 A JP 2012526186A JP 2013502619 A JP2013502619 A JP 2013502619A
- Authority
- JP
- Japan
- Prior art keywords
- frequency band
- scale factor
- energy
- frequency
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005259 measurement Methods 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000013500 data storage Methods 0.000 claims description 8
- 238000013139 quantization Methods 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 9
- 230000000873 masking effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図1
Description
Claims (20)
- 時間ドメイン音声信号を符号化する方法であって、
前記時間ドメイン音声信号を電子デバイスにおいて受け取るステップと、
前記時間ドメイン音声信号を、複数の周波数のそれぞれについて係数を有する周波数ドメイン信号に変換するステップと、
前記係数を複数の周波数帯に分類するステップであって、前記周波数帯のそれぞれが、前記係数のうち少なくとも1つの係数を含む、ステップと、
前記周波数帯のエネルギーを周波数帯毎に求めるステップと、
前記周波数帯の前記エネルギーに基づいて、周波数帯毎にスケール・ファクタを求めるステップと、
前記周波数帯の前記係数を、関連する前記スケール・ファクタに基づいて周波数帯毎に量子化するステップと、
前記量子化された係数および前記スケール・ファクタに基づいて、符号化済音声信号を生成するステップと
を含む方法。 - 前記符号化済信号を生成するステップが、量子化された前記係数を符号化するステップを含み、
前記符号化済音声信号が、前記符号化された係数および前記スケール・ファクタに基づく、
請求項1に記載の方法。 - 前記周波数帯の前記エネルギーを求めるステップが、前記周波数帯の前記係数の絶対和を算出するステップを含む、
請求項1に記載の方法。 - 前記スケール・ファクタを求めるステップが、
前記周波数帯の前記エネルギーの10を底とする対数を算出するステップと、
初項を求めるために、前記周波数帯の前記エネルギーの前記10を底とする対数に定数を加算するステップと、
前記スケール・ファクタを求めるために、前記初項をある乗数で乗算するステップと
を含む、請求項3に記載の方法。 - 前記定数が約1.75で、
前記乗数が10である、
請求項4に記載の方法。 - 前記周波数帯の前記エネルギーを求めるステップおよび前記周波数帯の前記エネルギーに基づいて前記スケール・ファクタを求めるステップが、前記符号化済音声信号の目標とするビットレートが所定のレベルを超えていない場合に実行され、
前記方法が、
前記符号化済音声信号の前記目標とするビットレートが所定のレベルを超えている場合、
前記複数の周波数帯それぞれについて、その周波数帯の前記係数のうち最大の係数を求めるステップと、
前記複数の周波数帯それぞれについて、前記最大の係数に関連する前記量子化された係数が0にならないようなスケール・ファクタを選択するステップと
を更に含む請求項1に記載の方法。 - 前記符号化済音声信号に対する所定のビットレートに基づいて、前記スケール・ファクタを周波数帯毎に調整するステップであって、前記スケール・ファクタが、前記所定のビットレートに反比例する、ステップ
を更に含む請求項1に記載の方法。 - 前記符号化済音声信号に対する所定のビットレートを維持するためのビット・リザーバ・モデルに基づいて、前記スケール・ファクタを周波数帯毎に調整するステップ
を更に含む請求項1に記載の方法。 - 前記ビット・リザーバ・モデルが、前記所定のビットレートにおける5秒間の前記符号化済音声信号に対応する、
請求項8に記載の方法。 - 量子化された出力信号を生成するための周波数ドメイン音声信号の周波数帯の周波数係数についてのスケール・ファクタを作る方法であって、
所定のレベルを超えない、前記量子化された出力信号に対するビットレートの場合、
前記周波数帯のエネルギーを求めるステップと、
前記周波数帯の前記エネルギーに基づいて、スケール・ファクタを求めるステップと
を含み、
前記所定のレベルを超える、前記量子化された出力信号に対するビットレートの場合、
前記周波数帯の最大の周波数係数を求めるステップと、
量子化後の対応する前記係数が0にならないようなスケール・ファクタを選択するステップと
を含み、
前記周波数係数の量子化が、前記スケール・ファクタに基づく、
方法。 - 前記周波数帯の前記エネルギーを求めるステップが、前記周波数帯の前記係数の絶対和を算出するステップを含む、
請求項10に記載の方法。 - 前記周波数帯の前記エネルギーに基づいて前記スケール・ファクタを求めるステップが、
前記周波数帯の前記エネルギーの対数を算出するステップと、
初項を求めるために、前記周波数帯の前記エネルギーの前記対数に定数を加算するステップと、
前記スケール・ファクタを求めるために、前記初項をある乗数で乗算するステップと
を含む、
請求項10に記載の方法。 - 前記定数が約1.75で、
前記乗数が10である、
請求項12に記載の方法。 - 前記量子化された出力信号に対する前記ビットレートに基づいて、前記スケール・ファクタを周波数帯毎に調整するステップであって、前記スケール・ファクタが、前記量子化された出力信号に対する前記ビットレートに反比例する、ステップ
を更に含む請求項10に記載の方法。 - 時間ドメイン音声信号、および前記時間ドメイン音声信号を表す符号化済音声信号を格納するように構成されたデータ・ストレージと、
制御回路と
を備える電子デバイスであって、
前記制御回路が、
前記データ・ストレージから前記時間ドメイン音声信号を取り出し、
前記時間ドメイン音声信号を、複数の周波数それぞれについて係数を有する周波数ドメイン信号に変換し、
前記係数を、複数の周波数帯に分類する
ように構成され、
前記周波数帯のそれぞれが、前記係数のうち少なくとも1つの係数を含み、
前記制御回路が更に、
前記周波数帯のエネルギーを周波数帯毎に求め、
前記周波数帯の前記エネルギーに基づいて、周波数帯毎にスケール・ファクタを求め、
前記周波数帯の前記係数を、関連する前記スケール・ファクタに基づいて周波数帯毎に量子化し、
前記量子化された係数および前記スケール・ファクタに基づいて、前記符号化済音声信号を生成する
ように構成された、電子デバイス。 - 前記制御回路が、前記符号化済音声信号を前記データ・ストレージ中に格納するように構成された、
請求項15に記載の電子デバイス。 - 前記周波数帯の前記エネルギーを求めるために、前記制御回路が、前記周波数帯の前記係数の絶対値を合計するように構成された、
請求項15に記載の電子デバイス。 - 前記周波数帯に対する前記スケール・ファクタを求めるために、前記制御回路が、
前記周波数帯の前記エネルギーの対数を求め、
前記周波数帯の前記エネルギーの前記対数に定数を加算して、初項を求め、
前記初項をある乗数で乗算して、前記スケール・ファクタを作るように構成された、
請求項17に記載の電子デバイス。 - 前記定数が約1.75で、
前記乗数が10である、
請求項18に記載の電子デバイス。 - 前記制御回路が、前記符号化済音声信号の目標とするビットレートが所定のレベルを超えていない場合に、前記周波数帯の前記エネルギーを求めるとともに、前記周波数帯の前記エネルギーに基づいて前記スケール・ファクタを求めるように構成され、
前記制御回路が、前記符号化済音声信号の前記目標とするビットレートが前記所定のレベルを超えている場合に、前記周波数帯の最大の周波数係数を求めるとともに、量子化後の対応する前記係数が0にならないようなスケール・ファクタを選択するように構成された、
請求項15に記載の電子デバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/546,428 | 2009-08-24 | ||
US12/546,428 US8311843B2 (en) | 2009-08-24 | 2009-08-24 | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
PCT/IN2010/000557 WO2011024198A2 (en) | 2009-08-24 | 2010-08-24 | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013502619A true JP2013502619A (ja) | 2013-01-24 |
Family
ID=43302938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012526186A Pending JP2013502619A (ja) | 2009-08-24 | 2010-08-24 | 周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定 |
Country Status (13)
Country | Link |
---|---|
US (1) | US8311843B2 (ja) |
EP (1) | EP2471062B1 (ja) |
JP (1) | JP2013502619A (ja) |
KR (1) | KR101361933B1 (ja) |
CN (1) | CN102483923B (ja) |
AU (1) | AU2010288103B8 (ja) |
BR (1) | BR112012003364A2 (ja) |
CA (1) | CA2770622C (ja) |
IL (1) | IL217958A (ja) |
MX (1) | MX2012002182A (ja) |
SG (1) | SG178364A1 (ja) |
TW (1) | TWI450267B (ja) |
WO (1) | WO2011024198A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013167852A (ja) * | 2012-02-17 | 2013-08-29 | Fujitsu Semiconductor Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN106409305B (zh) * | 2010-12-29 | 2019-12-10 | 三星电子株式会社 | 用于针对高频带宽扩展进行编码/解码的设备和方法 |
US9225310B1 (en) * | 2012-11-08 | 2015-12-29 | iZotope, Inc. | Audio limiter system and method |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US10573324B2 (en) * | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
DE102016206327A1 (de) * | 2016-04-14 | 2017-10-19 | Sivantos Pte. Ltd. | Verfahren zum Übertragen eines Audiosignals von einem Sender zu einem Empfänger |
DE102016206985A1 (de) | 2016-04-25 | 2017-10-26 | Sivantos Pte. Ltd. | Verfahren zum Übertragen eines Audiosignals |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001148632A (ja) * | 1999-09-07 | 2001-05-29 | Matsushita Electric Ind Co Ltd | 符号化装置、符号化方法、及びその記録媒体 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995013660A1 (fr) * | 1993-11-09 | 1995-05-18 | Sony Corporation | Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite |
US6678653B1 (en) * | 1999-09-07 | 2004-01-13 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for coding audio data at high speed using precision information |
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
DE60204039T2 (de) * | 2001-11-02 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur kodierung und dekodierung von audiosignalen |
JP4317355B2 (ja) * | 2001-11-30 | 2009-08-19 | パナソニック株式会社 | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
DE102004059979B4 (de) * | 2004-12-13 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
-
2009
- 2009-08-24 US US12/546,428 patent/US8311843B2/en active Active
-
2010
- 2010-08-09 TW TW099126515A patent/TWI450267B/zh active
- 2010-08-24 CN CN201080037711.6A patent/CN102483923B/zh active Active
- 2010-08-24 MX MX2012002182A patent/MX2012002182A/es active IP Right Grant
- 2010-08-24 BR BR112012003364A patent/BR112012003364A2/pt not_active Application Discontinuation
- 2010-08-24 JP JP2012526186A patent/JP2013502619A/ja active Pending
- 2010-08-24 KR KR1020127007643A patent/KR101361933B1/ko active IP Right Grant
- 2010-08-24 SG SG2012009486A patent/SG178364A1/en unknown
- 2010-08-24 EP EP10781751.2A patent/EP2471062B1/en active Active
- 2010-08-24 AU AU2010288103A patent/AU2010288103B8/en active Active
- 2010-08-24 WO PCT/IN2010/000557 patent/WO2011024198A2/en active Application Filing
- 2010-08-24 CA CA2770622A patent/CA2770622C/en active Active
-
2012
- 2012-02-06 IL IL217958A patent/IL217958A/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001148632A (ja) * | 1999-09-07 | 2001-05-29 | Matsushita Electric Ind Co Ltd | 符号化装置、符号化方法、及びその記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013167852A (ja) * | 2012-02-17 | 2013-08-29 | Fujitsu Semiconductor Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
SG178364A1 (en) | 2012-04-27 |
AU2010288103A1 (en) | 2012-03-01 |
CN102483923A (zh) | 2012-05-30 |
EP2471062A2 (en) | 2012-07-04 |
BR112012003364A2 (pt) | 2016-02-16 |
CA2770622C (en) | 2015-06-23 |
CN102483923B (zh) | 2014-10-08 |
KR101361933B1 (ko) | 2014-02-12 |
IL217958A0 (en) | 2012-03-29 |
EP2471062B1 (en) | 2018-06-27 |
MX2012002182A (es) | 2012-09-07 |
IL217958A (en) | 2014-12-31 |
AU2010288103B8 (en) | 2014-02-20 |
WO2011024198A3 (en) | 2011-07-28 |
AU2010288103A8 (en) | 2014-02-20 |
US20110046966A1 (en) | 2011-02-24 |
WO2011024198A2 (en) | 2011-03-03 |
TWI450267B (zh) | 2014-08-21 |
CA2770622A1 (en) | 2011-03-03 |
KR20120048694A (ko) | 2012-05-15 |
TW201123173A (en) | 2011-07-01 |
US8311843B2 (en) | 2012-11-13 |
AU2010288103B2 (en) | 2014-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013502619A (ja) | 周波数帯信号エネルギーに基づいた、音声符号化における周波数帯スケール・ファクタ測定 | |
CN105723454B (zh) | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 | |
JP2010538316A (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
US9646615B2 (en) | Audio signal encoding employing interchannel and temporal redundancy reduction | |
KR102401002B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
KR20210089184A (ko) | 공간적 오디오 파라미터 인코딩 및 연관된 디코딩의 결정 | |
CN115472171A (zh) | 编解码方法、装置、设备、存储介质及计算机程序 | |
JP2009103974A (ja) | マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130613 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130613 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131011 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20131011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131024 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131024 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20131101 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20131129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140627 |