JP5775227B2 - オーディオ符号化のための方法および装置 - Google Patents
オーディオ符号化のための方法および装置 Download PDFInfo
- Publication number
- JP5775227B2 JP5775227B2 JP2014547268A JP2014547268A JP5775227B2 JP 5775227 B2 JP5775227 B2 JP 5775227B2 JP 2014547268 A JP2014547268 A JP 2014547268A JP 2014547268 A JP2014547268 A JP 2014547268A JP 5775227 B2 JP5775227 B2 JP 5775227B2
- Authority
- JP
- Japan
- Prior art keywords
- bandwidth
- energy
- audio signal
- encoding
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 25
- 230000005236 sound signal Effects 0.000 claims description 36
- 238000004891 communication Methods 0.000 claims description 31
- 230000006854 communication Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 10
- 230000008901 benefit Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 71
- 238000010183 spectrum analysis Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 230000000737 periodic effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000009499 grossing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
ここで再び図2を参照すると、サブバンド・スペクトル分析関数210からの出力信号211が閾値論理関数215に結合する。閾値論理関数215は信号211を分析し、第1の状態にあるN個のサブバンドの最高周波数を示す出力信号211の値に基づいた符号化プロトコルを選択する。この周波数未満のサブバンドも信号検出のためのこの第1の状態にあると仮定される。選択された符号化プロトコルは、信号126、206の帯域幅を符号化する。この信号126、206の帯域幅は、最高周波数サブバンドまでのオーディオ信号(デジタル化された信号126または変換された信号206)のそれらの周波数を含んでおり、この最高周波数サブバンドは、対応する閾値を上回るエネルギーとオーディオ信号のより低い周波数成分とを有し、またこのような周波数成分は、オーディオ符号化関数220に対して選択された符号化プロトコルの高域カットオフ周波数よりも高い。いくつかの実施形態では、高域カットオフ周波数よりも高い、オーディオ信号のより低い周波数成分はすべて、選択された符号化プロトコルの帯域幅に含まれている。いくつかの実施形態では、サブバンド・スペクトル分析210および/またはオーディオ符号化220に先立って、受信信号126に対して高領域(high pass)またはバンド・パス・フィルタリングが施される必要性または要求があってもよいが、このことによって処理ステップまたは処理ロジックが著しくは影響されないと考えられる。本明細書中で説明される例では、選択された符号化プロトコルは、名目上、7KHzの帯域幅、8KHzの帯域幅、12KHzの帯域幅、および20KHzの帯域幅のうちの1つである選択帯域幅を有するプロトコルである。しかし、このことは、実際には、10Hzから500Hzまでの間で開始され最大7KHzまで拡大するバンド、10Hzから500Hzまでの間で開始され最大8KHzまで拡大するバンド、および10Hzから500Hzまでの間で開始され最大12KHzまで拡大するバンド、または10Hzから500Hzまでの間で開始され最大20KHzまで拡大するバンドにそれぞれ対応してもよい。言うまでも無く、選択された符号化プロトコルを識別する他の方法を用いることができよう。まさしくその2つの例として、符号化ビット・レート、または指標付きのプロトコル値(例えば、1ないし4)がある。
Claims (12)
- 通信装置においてオーディオ信号を符号化する方法であって、
前記通信装置においてビット・レート値を受信すること、
通信装置の処理システムによって前記ビット・レート値に基づいて一組のエネルギー閾値を選択することであって、前記一組のエネルギー閾値は、複数の組のエネルギー閾値のうちの一組のエネルギー閾値であり、各組のエネルギー閾値の前記エネルギー閾値は、1対1で前記オーディオ信号の一組のサブバンドに対応する、前記一組のエネルギー閾値を選択すること、
前記通信装置において前記オーディオ信号を受信すること、
前記処理システムによって一組のサブバンドを構成する各サブバンドのエネルギーを決定すること、
前記処理システムによって前記対応する閾値を上回るエネルギーを有する最高周波数サブバンドを決定すること、
前記対応する閾値を上回るエネルギーを有する前記最高周波数サブバンドにある前記オーディオ信号の周波数、および高域カットオフ周波数よりも高いオーディオ信号の前記最高周波数サブバンドの最高周波数よりも低い周波数の全てを含む前記オーディオ信号の選択された帯域幅を、前記処理システムによって決定すること、
前記通信装置のオーディオ符号化関数によって、選択帯域幅を符号化することを備える、方法。 - 前記処理システムによって、前記選択帯域幅を、最大許容送信データ・レートを上回る送信データ・レートをもたらさない帯域幅に限定することをさらに備える、請求項1に記載の方法。
- 前記処理システムによって、前記オーディオ信号の前記一組のサブバンドに対応するビット・レート値に基づいて一組のヒステリシス値を選択することをさらに備え、
前記ヒステリシス値が、より低い選択帯域幅からより高い選択帯域幅に変わるためのヒステリシス遅延と、より高い選択帯域幅からより低い選択帯域幅に変わるためのヒステリシス遅延との少なくとも1つを含む、請求項1に記載の方法。 - 前記処理システムによって、前記オーディオ信号の符号化中に各周期基準で、前記エネルギーを決定すること、前記最高周波数サブバンドを決定すること、および符号化することの工程を実施することを備える、請求項1に記載の方法。
- 2組以上のエネルギー閾値の閾値には2つ以上の条件が存在し、該条件が、より低いオーディオ帯域幅符号化プロトコルが有利であること、選択される符号化プロトコルのオーディオ帯域幅が入力信号の変動帯域幅を追跡すること、およびより高いオーディオ帯域幅符号化プロトコルが有利であることを含む、請求項1に記載の方法。
- 前記オーディオ信号中のビット・レート値の変化が、前記複数の組から前記一組の閾値の選択を変更する、請求項1に記載の方法。
- オーディオ信号を符号化するための装置であって、
ビット・レート値を受信する通信装置の受信機と、
前記通信装置の処理システムであって、
前記ビット・レート値に基づいて一組のエネルギー閾値を選択することであって、前記一組のエネルギー閾値は、複数の組のエネルギー閾値のうちの一組のエネルギー閾値であり、各組のエネルギー閾値の前記エネルギー閾値は、1対1で前記オーディオ信号の一組のサブバンドに対応する、前記一組のエネルギー閾値を選択すること、
前記オーディオ信号を受信すること、
前記一組のサブバンドを構成する各サブバンドのエネルギーを決定すること、
前記対応する閾値を上回るエネルギーを有する最高周波数サブバンドを決定すること、
前記対応する閾値を上回るエネルギーを有する前記最高周波数サブバンドにある前記オーディオ信号の周波数、および高域カットオフ周波数よりも高いオーディオ信号の前記最高周波数サブバンドの最高周波数よりも低い周波数の全てを含む前記オーディオ信号の選択された帯域幅を決定すること、
選択帯域幅を符号化することを実行する前記処理システムとを備える、装置。 - 前記通信装置の処理システムは、前記選択帯域幅を、最大許容送信データ・レートを上回る送信データ・レートをもたらさない帯域幅に限定するようにさらに構成されている、請求項7に記載の装置。
- 前記通信装置の処理システムは、前記オーディオ信号の前記一組のサブバンドに対応するビット・レート値に基づいて一組のヒステリシス値を選択するようにさらに構成され、
ヒステリシス値は、より低い選択帯域幅からより高い選択帯域幅に変わるためのヒステリシス遅延と、より高い選択帯域幅からより低い選択帯域幅に変わるためのヒステリシス遅延との少なくとも1つを有している、請求項7に記載の装置。 - 前記通信装置の処理システムは、前記オーディオ信号の符号化中に各周期基準で、前記エネルギーを決定すること、前記最高周波数サブバンドを決定すること、および前記符号化することを実行するように構成されている、請求項7に記載の装置。
- 2組以上のエネルギー閾値の閾値には2つ以上の条件が存在し、該条件が、より低いオーディオ帯域幅符号化プロトコルが有利であること、選択される符号化プロトコルのオーディオ帯域幅が入力信号の変動帯域幅を追跡すること、およびより高いオーディオ帯域幅符号化プロトコルが有利であることを含む、請求項7に記載の装置。
- 前記オーディオ信号中のビット・レート値の変化が、前記複数の組から前記一組の閾値のセットの選択を変更する、請求項7に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/316,895 US8666753B2 (en) | 2011-12-12 | 2011-12-12 | Apparatus and method for audio encoding |
US13/316,895 | 2011-12-12 | ||
PCT/US2012/067532 WO2013090039A1 (en) | 2011-12-12 | 2012-12-03 | Apparatus and method for audio encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015505991A JP2015505991A (ja) | 2015-02-26 |
JP5775227B2 true JP5775227B2 (ja) | 2015-09-09 |
Family
ID=47358302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014547268A Expired - Fee Related JP5775227B2 (ja) | 2011-12-12 | 2012-12-03 | オーディオ符号化のための方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8666753B2 (ja) |
EP (1) | EP2791936A1 (ja) |
JP (1) | JP5775227B2 (ja) |
KR (1) | KR101454581B1 (ja) |
CN (1) | CN103999154B (ja) |
CA (1) | CA2859013C (ja) |
WO (1) | WO2013090039A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
JP6556473B2 (ja) * | 2015-03-12 | 2019-08-07 | 株式会社東芝 | 送信装置、音声認識システム、送信方法、およびプログラム |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
KR20180040716A (ko) | 2015-09-04 | 2018-04-20 | 삼성전자주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
EP3457402B1 (en) | 2016-06-24 | 2021-09-15 | Samsung Electronics Co., Ltd. | Noise-adaptive voice signal processing method and terminal device employing said method |
US11452004B2 (en) | 2016-11-08 | 2022-09-20 | Koninklijke Philips N.V. | Method for wireless data transmission range extension |
GB201620317D0 (en) * | 2016-11-30 | 2017-01-11 | Microsoft Technology Licensing Llc | Audio signal processing |
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
CN112599140B (zh) * | 2020-12-23 | 2024-06-18 | 北京百瑞互联技术股份有限公司 | 一种优化语音编码速率和运算量的方法、装置及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5115240A (en) | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6091723A (en) * | 1997-10-22 | 2000-07-18 | Lucent Technologies, Inc. | Sorting networks having improved layouts |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
EP2665294A2 (en) * | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
KR20060090984A (ko) * | 2003-09-29 | 2006-08-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호들을 엔코딩하는 방법 및 장치 |
JP2006018023A (ja) | 2004-07-01 | 2006-01-19 | Fujitsu Ltd | オーディオ信号符号化装置、および符号化プログラム |
ES2343862T3 (es) | 2006-09-13 | 2010-08-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Metodos y disposiciones para un emisor y receptor de conversacion/audio. |
WO2009068084A1 (en) * | 2007-11-27 | 2009-06-04 | Nokia Corporation | An encoder |
-
2011
- 2011-12-12 US US13/316,895 patent/US8666753B2/en active Active
-
2012
- 2012-12-03 KR KR1020147015911A patent/KR101454581B1/ko active IP Right Grant
- 2012-12-03 CA CA2859013A patent/CA2859013C/en active Active
- 2012-12-03 EP EP12801691.2A patent/EP2791936A1/en not_active Withdrawn
- 2012-12-03 WO PCT/US2012/067532 patent/WO2013090039A1/en active Application Filing
- 2012-12-03 CN CN201280061303.3A patent/CN103999154B/zh active Active
- 2012-12-03 JP JP2014547268A patent/JP5775227B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2791936A1 (en) | 2014-10-22 |
CA2859013C (en) | 2016-01-26 |
CA2859013A1 (en) | 2013-06-20 |
KR20140085596A (ko) | 2014-07-07 |
WO2013090039A1 (en) | 2013-06-20 |
US20130151260A1 (en) | 2013-06-13 |
CN103999154B (zh) | 2015-07-15 |
JP2015505991A (ja) | 2015-02-26 |
KR101454581B1 (ko) | 2014-10-28 |
US8666753B2 (en) | 2014-03-04 |
CN103999154A (zh) | 2014-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5775227B2 (ja) | オーディオ符号化のための方法および装置 | |
JP6545815B2 (ja) | 音声デコーダ、およびその動作方法およびその方法を記憶したコンピュータ可読記憶デバイス | |
CN112334980B (zh) | 自适应舒适噪声参数确定 | |
US11102600B2 (en) | Parametric audio decoding | |
US11568882B2 (en) | Inter-channel phase difference parameter encoding method and apparatus | |
JP7159351B2 (ja) | ダウンミックスされた信号の計算方法及び装置 | |
CN111681664A (zh) | 一种降低音频编码码率的方法、系统、存储介质及设备 | |
US11107486B2 (en) | Speech/audio signal processing method and coding apparatus | |
KR20190056104A (ko) | 전자 장치, 외부 전자 장치 및 이를 포함하는 음향 시스템 | |
US20160140839A1 (en) | Data/commands through audio channel | |
KR20200051620A (ko) | 프레임간 시간 시프트 편차들에 대한 채널 조정 방법의 선택 | |
EP3903309B1 (en) | High resolution audio coding | |
JP2017520011A (ja) | 情報損失を減少させた電子通信のためのシステム、方法、および装置 | |
US10748548B2 (en) | Voice processing method, voice communication device and computer program product thereof | |
WO2020146870A1 (en) | High resolution audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150113 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150702 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5775227 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |