JP2021006898A - 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス - Google Patents
方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス Download PDFInfo
- Publication number
- JP2021006898A JP2021006898A JP2020095195A JP2020095195A JP2021006898A JP 2021006898 A JP2021006898 A JP 2021006898A JP 2020095195 A JP2020095195 A JP 2020095195A JP 2020095195 A JP2020095195 A JP 2020095195A JP 2021006898 A JP2021006898 A JP 2021006898A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio frame
- audio
- frequency subband
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012806 monitoring device Methods 0.000 title claims description 14
- 238000004590 computer program Methods 0.000 title claims description 4
- 230000005236 sound signal Effects 0.000 claims abstract description 81
- 238000009826 distribution Methods 0.000 claims description 69
- 230000003595 spectral effect Effects 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 4
- 230000008901 benefit Effects 0.000 description 16
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000001149 cognitive effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/752—Media network packet handling adapting media to network capabilities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
エンコードされるオーディオ信号であって、複数の連続するオーディオフレームを含むオーディオ信号を受信することと、
オーディオ信号の連続するオーディオフレームのそれぞれに対して、
オーディオフレームを、複数の周波数サブバンドに関する周波数ドメインにて表すことと、
オーディオフレームを、周波数サブバンドのそれぞれにて、周波数サブバンドに特有の背景モデルを使用して、背景又は前景のいずれかとして分類することと、
オーディオ信号の連続するオーディオフレームのそれぞれをエンコーディングすることと、を含み、オーディオフレームの周波数サブバンドのそれぞれに対してビット数が割り当てられ、周波数サブバンドに対して割り当てられたビット数は、オーディオフレームが、周波数サブバンドにて前景として分類された場合の方が、オーディオフレームが、周波数サブバンドにて背景として分類された場合よりも多い。
オーディオ信号のオーディオフレームに対して、
オーディオフレームの周波数サブバンドに対して、
オーディオフレームの周波数サブバンドに対応する、周波数サブバンドに特有の背景モデルを、オーディオフレームの周波数サブバンドの周波数コンテンツに基づいて更新することも含んでよい。
オーディオ信号のエンコードされたオーディオフレームを、メタデータであって、オーディオフレームの周波数サブバンドの分類を表すメタデータと共に送信することをさらに含んでよい。
レシーバは、エンコードされるオーディオ信号を受信するよう構成されている。オーディオ信号は、複数の連続するオーディオフレームを含む。
1つ又はそれ以上のプロセッサは、
オーディオ信号の連続するオーディオフレームのそれぞれに対して、
オーディオフレームを、複数の周波数サブバンドに関する周波数ドメインにて表し、
オーディオフレームを、周波数サブバンドのそれぞれにて、周波数サブバンドに特有の背景モデルを使用して、背景又は前景のいずれかとして分類し、
オーディオ信号の連続するオーディオフレームのそれぞれをエンコードするよう構成されている。オーディオフレームの周波数サブバンドのそれぞれに対して、ビット数が割り当てられる。周波数サブバンドに対して割り当てられたビット数は、オーディオフレームが、周波数サブバンドにて前景として分類された場合の方が、オーディオフレームが、周波数サブバンドにて背景として分類された場合よりも多い。
オーディオ信号を記録するよう構成されているマイクロフォンと、
オーディオ信号を、マイクロフォンから受信し、可変ビットレートを用いてオーディオ信号をエンコードするよう構成されている、第3の態様に係るエンコーダと、を含む。
Claims (14)
- 可変ビットレートを用いてオーディオ信号(30)をエンコーディングする方法(100)であって、
エンコードされる前記オーディオ信号(30)であって、複数の連続するオーディオフレーム(32)を含む前記オーディオ信号(30)を受信すること(S102)と、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれに対して、
前記オーディオフレーム(32)を、複数の周波数サブバンド(34)に関する周波数ドメインにて表すこと(S104)と、
前記オーディオフレーム(32)を、前記周波数サブバンド(34)のそれぞれにて、前記周波数サブバンド(34)に特有の背景モデルを使用して、背景又は前景のいずれかとして分類すること(S106)と、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれをエンコーディングすること(S108)と、を含み、
前記オーディオフレーム(32)の前記周波数サブバンド(34)のそれぞれに対してビット数が割り当てられ、
前記周波数サブバンド(34)に対して割り当てられた前記ビット数は、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて前景として分類された場合の方が、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて背景として分類された場合よりも多い、方法(100)。 - 前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)をエンコーディングするために割り当てられるビット数は、前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)の周波数レンジに依存する、及び/又は、
前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)をエンコーディングするために割り当てられるビット数は、前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)の前記周波数レンジに依存する、請求項1に記載の方法(100)。 - 前記オーディオ信号(30)がエンコードされ、第1のオーディオフレームの、背景に分類された第1の周波数サブバンドに割り当てられるビット数は、前記第1のオーディオフレームに先ずる前記オーディオフレームにおける同じ第1の周波数サブバンドが前景として分類された場合の方が、前記第1のオーディオフレームに先ずる前記オーディオフレームにおける前記同じ第1の周波数サブバンドが背景として分類された場合と比較して、より多くなる、請求項1から請求項2のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、さらに、心理音響的モデルに依存する、請求項1から請求項3のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、前記心理音響的モデルにしたがう前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記周波数レンジに依存する、請求項2に記載の方法(100)。
- 前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)が表す前記周波数レンジには依存せず、
前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)が属する前記周波数レンジには依存しない、請求項1に記載の方法(100)。 - 請求項1から請求項6のいずれか一項に記載の方法(100)であって、
前記オーディオ信号(30)の前記オーディオフレーム(32)に対して、
前記オーディオフレーム(32)の前記周波数サブバンド(34)に対して、
前記オーディオフレーム(32)の前記周波数サブバンド(34)に対応する、前記周波数サブバンド(34)に特有の背景モデルを、前記オーディオフレーム(32)の前記周波数サブバンド(34)の周波数コンテンツに基づいて更新すること(S110)をさらに含む、方法(100)。 - 前記周波数サブバンド(34)に特有の前記背景モデルは、ガウス混合モデル(50)(Gaussian Mixture Model又はGMM)を含み、前記GMM(50)は、複数のガウス分布(52)を含み、前記複数のガウス分布(52)のそれぞれは、前記周波数サブバンド(34)におけるエナジーレベルに対する確率分布を表す、請求項1から請求項7のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)は、前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記エナジーレベルが、前記周波数サブバンド(34)に特有の前記背景モデルの前記GMM(50)の前記ガウス分布(52)の内の1つの平均値前後の所定の標準偏差数(54)内にある場合、及び、前記ガウス分布(52)の重みであって、前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記エナジーレベルが、前記ガウス分布(52)の前記平均値前後の前記所定の標準偏差数(54)内となる確率を表す前記重みが、閾値を超えている場合に、背景として分類される、請求項8に記載の方法(100)。
- 前記エナジーレベルは、パワースペクトル密度(power spectral density又はPSD)の測定値である、請求項8から請求項9のいずれか一項に記載の方法(100)。
- 請求項1から請求項10のいずれか一項に記載の方法(100)であって、
前記オーディオ信号(30)のエンコードされた前記オーディオフレーム(32)を、メタデータであって、前記オーディオフレーム(32)の前記周波数サブバンド(34)の分類(36)を示す前記メタデータと共に送信すること(S112)をさらに含む、方法。 - プロセッサ(14)上にて実行されると、前記プロセッサ(14)に、請求項1から請求項11のいずれか一項に記載の方法(100)を実行させるコンピュータ可読命令を保存するコンピュータ可読媒体を含む、コンピュータプログラム製品。
- 可変ビットレートを用いてオーディオ信号(30)をエンコーディングするためのエンコーダ(10)であって、
レシーバ(12)と、
1つ又はそれ以上のプロセッサ(14)と、を含むエンコーダ(10)であって、
前記レシーバ(12)は、エンコードされる前記オーディオ信号(30)であって、複数の連続するオーディオフレーム(32)を含む前記オーディオ信号(30)を受信するよう構成されており、
前記1つ又はそれ以上のプロセッサ(14)は、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれに対して、
前記オーディオフレーム(32)を、複数の周波数サブバンド(34)に関する周波数ドメインにて表し、
前記オーディオフレーム(32)を、前記周波数サブバンド(34)のそれぞれにて、前記周波数サブバンド(34)に特有の背景モデルを使用して、背景又は前景のいずれかとして分類し、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれをエンコードするよう構成されており、前記オーディオフレーム(32)の前記周波数サブバンド(34)のそれぞれに対してビット数が割り当てられ、前記周波数サブバンド(34)に対して割り当てられた前記ビット数は、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて前景として分類された場合の方が、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて背景として分類された場合よりも多い、エンコーダ(10)。 - オーディオ信号(30)を記録するよう構成されているマイクロフォン(2)と、
前記オーディオ信号(30)を、前記マイクロフォン(2)から受信し、可変ビットレートを用いて前記オーディオ信号(30)をエンコードするよう構成されている、請求項13に記載のエンコーダ(10)と、を含む、モニタリングデバイス(1)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19179214.2A EP3751567B1 (en) | 2019-06-10 | 2019-06-10 | A method, a computer program, an encoder and a monitoring device |
EP19179214.2 | 2019-06-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021006898A true JP2021006898A (ja) | 2021-01-21 |
JP7125447B2 JP7125447B2 (ja) | 2022-08-24 |
Family
ID=66810707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020095195A Active JP7125447B2 (ja) | 2019-06-10 | 2020-06-01 | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス |
Country Status (6)
Country | Link |
---|---|
US (1) | US11545160B2 (ja) |
EP (1) | EP3751567B1 (ja) |
JP (1) | JP7125447B2 (ja) |
KR (1) | KR102433582B1 (ja) |
CN (1) | CN112151043B (ja) |
TW (1) | TWI820333B (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524099A (ja) * | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2011209733A (ja) * | 1994-08-10 | 2011-10-20 | Qualcomm Inc | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2018106208A (ja) * | 2011-07-13 | 2018-07-05 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 音声信号の符号化と復号化の方法および装置 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
ES2164640T3 (es) * | 1991-08-02 | 2002-03-01 | Sony Corp | Codificador digital con asignacion dinamica de bits de cuantificacion. |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
DE60017825T2 (de) | 1999-03-23 | 2006-01-12 | Nippon Telegraph And Telephone Corp. | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür |
US20040083094A1 (en) * | 2002-10-29 | 2004-04-29 | Texas Instruments Incorporated | Wavelet-based compression and decompression of audio sample sets |
CN101247129B (zh) * | 2004-09-17 | 2012-05-23 | 广州广晟数码技术有限公司 | 用于音频信号编码的码书分配方法 |
CN101393741A (zh) | 2007-09-19 | 2009-03-25 | 中兴通讯股份有限公司 | 一种宽带音频编解码器中的音频信号分类装置及分类方法 |
WO2009059632A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
US8386266B2 (en) | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
JP5648123B2 (ja) * | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
TWI591620B (zh) * | 2012-03-21 | 2017-07-11 | 三星電子股份有限公司 | 產生高頻雜訊的方法 |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
US9378748B2 (en) * | 2012-11-07 | 2016-06-28 | Dolby Laboratories Licensing Corp. | Reduced complexity converter SNR calculation |
US9263054B2 (en) | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
EP3671738B1 (en) | 2013-04-05 | 2024-06-05 | Dolby International AB | Audio encoder and decoder |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9881619B2 (en) * | 2016-03-25 | 2018-01-30 | Qualcomm Incorporated | Audio processing for an acoustical environment |
US10699721B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using difference data |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
-
2019
- 2019-06-10 EP EP19179214.2A patent/EP3751567B1/en active Active
-
2020
- 2020-04-28 KR KR1020200051611A patent/KR102433582B1/ko active IP Right Grant
- 2020-04-30 US US16/863,439 patent/US11545160B2/en active Active
- 2020-05-27 TW TW109117613A patent/TWI820333B/zh active
- 2020-06-01 JP JP2020095195A patent/JP7125447B2/ja active Active
- 2020-06-05 CN CN202010506983.1A patent/CN112151043B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209733A (ja) * | 1994-08-10 | 2011-10-20 | Qualcomm Inc | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2009524099A (ja) * | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2018106208A (ja) * | 2011-07-13 | 2018-07-05 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 音声信号の符号化と復号化の方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7125447B2 (ja) | 2022-08-24 |
US20200388290A1 (en) | 2020-12-10 |
TW202105363A (zh) | 2021-02-01 |
KR20200141379A (ko) | 2020-12-18 |
KR102433582B1 (ko) | 2022-08-17 |
US11545160B2 (en) | 2023-01-03 |
CN112151043A (zh) | 2020-12-29 |
EP3751567A1 (en) | 2020-12-16 |
TWI820333B (zh) | 2023-11-01 |
CN112151043B (zh) | 2023-06-16 |
EP3751567B1 (en) | 2022-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100868763B1 (ko) | 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치 | |
EP2490215A2 (en) | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same | |
JP4005128B2 (ja) | 信号品質の評価 | |
US9117458B2 (en) | Apparatus for processing an audio signal and method thereof | |
KR20180025921A (ko) | 데이터베이스를 생성하기 위한 방법 및 장치 | |
MX2013013261A (es) | Asignacion de bits, codificacion y decodificacion de audio. | |
US11037581B2 (en) | Signal processing method and device adaptive to noise environment and terminal device employing same | |
EP1684266A1 (en) | Method and apparatus for encoding and decoding digital signals | |
EP1596366A1 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
WO2024051412A1 (zh) | 语音编码、解码方法、装置、计算机设备和存储介质 | |
KR101907808B1 (ko) | 오디오 신호에서 노이즈를 추산하는 방법, 노이즈 추산기, 오디오 인코더, 오디오 디코더 및 오디오 신호를 전송하는 시스템 | |
KR100750115B1 (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
EP1517300A2 (en) | Device and process for encoding audio data | |
US20200344303A1 (en) | Transmission of sensor data from sensor devices | |
JP7125447B2 (ja) | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス | |
CN115223584B (zh) | 音频数据处理方法、装置、设备及存储介质 | |
JP2013537325A (ja) | ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること | |
CN116018642A (zh) | 在音频编解码器中维持感觉不和谐和声音定位提示的不变性 | |
JPH08204575A (ja) | 適応的符号化システム及びビット割当方法 | |
KR20070050035A (ko) | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 | |
CN115641857A (zh) | 音频处理方法、装置、电子设备、存储介质及程序产品 | |
KR19980072457A (ko) | 오디오 신호의 압축시 심리음향에서의 신호처리방법 및 그 장치 | |
KR19990056431A (ko) | 디지탈 오디오 부호화장치에 있어서 비트할당방법 | |
JPH06291670A (ja) | ディジタルオーディオ信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7125447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |