JP7125447B2 - 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス - Google Patents
方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス Download PDFInfo
- Publication number
- JP7125447B2 JP7125447B2 JP2020095195A JP2020095195A JP7125447B2 JP 7125447 B2 JP7125447 B2 JP 7125447B2 JP 2020095195 A JP2020095195 A JP 2020095195A JP 2020095195 A JP2020095195 A JP 2020095195A JP 7125447 B2 JP7125447 B2 JP 7125447B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio
- audio frame
- frequency sub
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000012806 monitoring device Methods 0.000 title claims description 14
- 238000004590 computer program Methods 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims description 79
- 238000009826 distribution Methods 0.000 claims description 65
- 230000003595 spectral effect Effects 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 230000008901 benefit Effects 0.000 description 19
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000001149 cognitive effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000269400 Sirenidae Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/752—Media network packet handling adapting media to network capabilities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Debugging And Monitoring (AREA)
Description
エンコードされるオーディオ信号であって、複数の連続するオーディオフレームを含むオーディオ信号を受信することと、
オーディオ信号の連続するオーディオフレームのそれぞれに対して、
オーディオフレームを、複数の周波数サブバンドに関する周波数ドメインにて表すことと、
オーディオフレームを、周波数サブバンドのそれぞれにて、周波数サブバンドに特有の背景モデルを使用して、背景又は前景のいずれかとして分類することと、
オーディオ信号の連続するオーディオフレームのそれぞれをエンコーディングすることと、を含み、オーディオフレームの周波数サブバンドのそれぞれに対してビット数が割り当てられ、周波数サブバンドに対して割り当てられたビット数は、オーディオフレームが、周波数サブバンドにて前景として分類された場合の方が、オーディオフレームが、周波数サブバンドにて背景として分類された場合よりも多い。
オーディオ信号のオーディオフレームに対して、
オーディオフレームの周波数サブバンドに対して、
オーディオフレームの周波数サブバンドに対応する、周波数サブバンドに特有の背景モデルを、オーディオフレームの周波数サブバンドの周波数コンテンツに基づいて更新することも含んでよい。
オーディオ信号のエンコードされたオーディオフレームを、メタデータであって、オーディオフレームの周波数サブバンドの分類を表すメタデータと共に送信することをさらに含んでよい。
レシーバは、エンコードされるオーディオ信号を受信するよう構成されている。オーディオ信号は、複数の連続するオーディオフレームを含む。
1つ又はそれ以上のプロセッサは、
オーディオ信号の連続するオーディオフレームのそれぞれに対して、
オーディオフレームを、複数の周波数サブバンドに関する周波数ドメインにて表し、
オーディオフレームを、周波数サブバンドのそれぞれにて、周波数サブバンドに特有の背景モデルを使用して、背景又は前景のいずれかとして分類し、
オーディオ信号の連続するオーディオフレームのそれぞれをエンコードするよう構成されている。オーディオフレームの周波数サブバンドのそれぞれに対して、ビット数が割り当てられる。周波数サブバンドに対して割り当てられたビット数は、オーディオフレームが、周波数サブバンドにて前景として分類された場合の方が、オーディオフレームが、周波数サブバンドにて背景として分類された場合よりも多い。
オーディオ信号を記録するよう構成されているマイクロフォンと、
オーディオ信号を、マイクロフォンから受信し、可変ビットレートを用いてオーディオ信号をエンコードするよう構成されている、第3の態様に係るエンコーダと、を含む。
Claims (14)
- 可変ビットレートを用いてオーディオ信号(30)をエンコーディングする方法(100)であって、
エンコードされる前記オーディオ信号(30)であって、複数の連続するオーディオフレーム(32)を含む前記オーディオ信号(30)を受信すること(S102)と、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれに対して、
前記オーディオフレーム(32)を、複数の周波数サブバンド(34)に関する周波数ドメインにて表すこと(S104)と、
前記オーディオフレーム(32)を、前記周波数サブバンド(34)のそれぞれにて、前記周波数サブバンド(34)に特有の背景モデルを使用して、背景又は前景のいずれかとして分類すること(S106)と、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれをエンコーディングすること(S108)と、を含み、
前記オーディオフレーム(32)の前記周波数サブバンド(34)のそれぞれに対してビット数が割り当てられ、
前記周波数サブバンド(34)に対して割り当てられた前記ビット数は、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて前景として分類された場合の方が、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて背景として分類された場合よりも多い、方法(100)。 - 前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)をエンコーディングするために割り当てられるビット数は、前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)の周波数レンジに依存する、及び/又は、
前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)をエンコーディングするために割り当てられるビット数は、前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)の前記周波数レンジに依存する、請求項1に記載の方法(100)。 - 前記オーディオ信号(30)がエンコードされ、第1のオーディオフレームの、背景に分類された第1の周波数サブバンドに割り当てられるビット数は、前記第1のオーディオフレームに先ずる前記オーディオフレームにおける同じ第1の周波数サブバンドが前景として分類された場合の方が、前記第1のオーディオフレームに先ずる前記オーディオフレームにおける前記同じ第1の周波数サブバンドが背景として分類された場合と比較して、より多くなる、請求項1から請求項2のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、さらに、心理音響的モデルに依存する、請求項1から請求項3のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、心理音響的モデルにしたがう前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記周波数レンジに依存する、請求項2に記載の方法(100)。
- 前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、前記オーディオフレーム(32)の、背景に分類された前記周波数サブバンド(34)が表す周波数レンジには依存せず、
前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)をエンコーディングする(S108)ために割り当てられるビット数は、前記オーディオフレーム(32)の、前景に分類された前記周波数サブバンド(34)が属する周波数レンジには依存しない、請求項1に記載の方法(100)。 - 請求項1から請求項6のいずれか一項に記載の方法(100)であって、
前記オーディオ信号(30)の前記オーディオフレーム(32)に対して、
前記オーディオフレーム(32)の前記周波数サブバンド(34)に対して、
前記オーディオフレーム(32)の前記周波数サブバンド(34)に対応する、前記周波数サブバンド(34)に特有の背景モデルを、前記オーディオフレーム(32)の前記周波数サブバンド(34)の周波数コンテンツに基づいて更新すること(S110)をさらに含む、方法(100)。 - 前記周波数サブバンド(34)に特有の前記背景モデルは、ガウス混合モデル(50)(Gaussian Mixture Model又はGMM)を含み、前記GMM(50)は、複数のガウス分布(52)を含み、前記複数のガウス分布(52)のそれぞれは、前記周波数サブバンド(34)におけるエナジーレベルに対する確率分布を表す、請求項1から請求項7のいずれか一項に記載の方法(100)。
- 前記オーディオフレーム(32)の前記周波数サブバンド(34)は、前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記エナジーレベルが、前記周波数サブバンド(34)に特有の前記背景モデルの前記GMM(50)の前記ガウス分布(52)の内の1つの平均値前後の所定の標準偏差数(54)内にある場合、及び、前記ガウス分布(52)の重みであって、前記オーディオフレーム(32)の前記周波数サブバンド(34)の前記エナジーレベルが、前記ガウス分布(52)の前記平均値前後の前記所定の標準偏差数(54)内となる確率を表す前記重みが、閾値を超えている場合に、背景として分類される、請求項8に記載の方法(100)。
- 前記エナジーレベルは、パワースペクトル密度(power spectral density又はPSD)の測定値である、請求項8から請求項9のいずれか一項に記載の方法(100)。
- 請求項1から請求項10のいずれか一項に記載の方法(100)であって、
前記オーディオ信号(30)のエンコードされた前記オーディオフレーム(32)を、メタデータであって、前記オーディオフレーム(32)の前記周波数サブバンド(34)の分類(36)を示す前記メタデータと共に送信すること(S112)をさらに含む、方法。 - プロセッサ(14)上にて実行されると、前記プロセッサ(14)に、請求項1から請求項11のいずれか一項に記載の方法(100)を実行させるコンピュータ可読命令を保存するコンピュータ可読媒体。
- 可変ビットレートを用いてオーディオ信号(30)をエンコーディングするためのエンコーダ(10)であって、
レシーバ(12)と、
1つ又はそれ以上のプロセッサ(14)と、を含むエンコーダ(10)であって、
前記レシーバ(12)は、エンコードされる前記オーディオ信号(30)であって、複数の連続するオーディオフレーム(32)を含む前記オーディオ信号(30)を受信するよう構成されており、
前記1つ又はそれ以上のプロセッサ(14)は、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれに対して、
前記オーディオフレーム(32)を、複数の周波数サブバンド(34)に関する周波数ドメインにて表し、
前記オーディオフレーム(32)を、前記周波数サブバンド(34)のそれぞれにて、前記周波数サブバンド(34)に特有の背景モデルを使用して、背景又は前景のいずれかとして分類し、
前記オーディオ信号(30)の連続する前記オーディオフレーム(32)のそれぞれをエンコードするよう構成されており、前記オーディオフレーム(32)の前記周波数サブバンド(34)のそれぞれに対してビット数が割り当てられ、前記周波数サブバンド(34)に対して割り当てられた前記ビット数は、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて前景として分類された場合の方が、前記オーディオフレーム(32)が、前記周波数サブバンド(34)にて背景として分類された場合よりも多い、エンコーダ(10)。 - オーディオ信号(30)を記録するよう構成されているマイクロフォン(2)と、
前記オーディオ信号(30)を、前記マイクロフォン(2)から受信し、可変ビットレートを用いて前記オーディオ信号(30)をエンコードするよう構成されている、請求項13に記載のエンコーダ(10)と、を含む、モニタリングデバイス(1)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19179214.2A EP3751567B1 (en) | 2019-06-10 | 2019-06-10 | A method, a computer program, an encoder and a monitoring device |
EP19179214.2 | 2019-06-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021006898A JP2021006898A (ja) | 2021-01-21 |
JP7125447B2 true JP7125447B2 (ja) | 2022-08-24 |
Family
ID=66810707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020095195A Active JP7125447B2 (ja) | 2019-06-10 | 2020-06-01 | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス |
Country Status (6)
Country | Link |
---|---|
US (1) | US11545160B2 (ja) |
EP (1) | EP3751567B1 (ja) |
JP (1) | JP7125447B2 (ja) |
KR (1) | KR102433582B1 (ja) |
CN (1) | CN112151043B (ja) |
TW (1) | TWI820333B (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524099A (ja) | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2011209733A (ja) | 1994-08-10 | 2011-10-20 | Qualcomm Inc | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2018106208A (ja) | 2011-07-13 | 2018-07-05 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 音声信号の符号化と復号化の方法および装置 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
CA2075156A1 (en) * | 1991-08-02 | 1993-02-03 | Kenzo Akagiri | Digital encoder with dynamic quantization bit allocation |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
DE69926821T2 (de) | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6658382B1 (en) | 1999-03-23 | 2003-12-02 | Nippon Telegraph And Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
US20040083094A1 (en) * | 2002-10-29 | 2004-04-29 | Texas Instruments Incorporated | Wavelet-based compression and decompression of audio sample sets |
CN101246689B (zh) * | 2004-09-17 | 2011-09-14 | 广州广晟数码技术有限公司 | 音频编码系统 |
CN101393741A (zh) | 2007-09-19 | 2009-03-25 | 中兴通讯股份有限公司 | 一种宽带音频编解码器中的音频信号分类装置及分类方法 |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
US8386266B2 (en) | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
WO2012144128A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
TWI591620B (zh) * | 2012-03-21 | 2017-07-11 | 三星電子股份有限公司 | 產生高頻雜訊的方法 |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
KR101726205B1 (ko) * | 2012-11-07 | 2017-04-12 | 돌비 인터네셔널 에이비 | 감소된 복잡성 변환기 snr 계산 |
US9263054B2 (en) | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
IL294836A (en) | 2013-04-05 | 2022-09-01 | Dolby Int Ab | Audio encoder and decoder |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9881619B2 (en) * | 2016-03-25 | 2018-01-30 | Qualcomm Incorporated | Audio processing for an acoustical environment |
US10699721B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using difference data |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
-
2019
- 2019-06-10 EP EP19179214.2A patent/EP3751567B1/en active Active
-
2020
- 2020-04-28 KR KR1020200051611A patent/KR102433582B1/ko active IP Right Grant
- 2020-04-30 US US16/863,439 patent/US11545160B2/en active Active
- 2020-05-27 TW TW109117613A patent/TWI820333B/zh active
- 2020-06-01 JP JP2020095195A patent/JP7125447B2/ja active Active
- 2020-06-05 CN CN202010506983.1A patent/CN112151043B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209733A (ja) | 1994-08-10 | 2011-10-20 | Qualcomm Inc | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2009524099A (ja) | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2018106208A (ja) | 2011-07-13 | 2018-07-05 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | 音声信号の符号化と復号化の方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20200141379A (ko) | 2020-12-18 |
US20200388290A1 (en) | 2020-12-10 |
EP3751567A1 (en) | 2020-12-16 |
KR102433582B1 (ko) | 2022-08-17 |
US11545160B2 (en) | 2023-01-03 |
TW202105363A (zh) | 2021-02-01 |
JP2021006898A (ja) | 2021-01-21 |
EP3751567B1 (en) | 2022-01-26 |
CN112151043B (zh) | 2023-06-16 |
TWI820333B (zh) | 2023-11-01 |
CN112151043A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100851970B1 (ko) | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 | |
KR100868763B1 (ko) | 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치 | |
JP4478183B2 (ja) | 音声信号を安定して分類する装置および方法、音声信号データベースを構築して動作させる方法、およびコンピュータプログラム | |
KR101143724B1 (ko) | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 | |
JP5219800B2 (ja) | コード化されたオーディオの経済的な音量計測 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
JP3762579B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
KR20120098755A (ko) | 오디오 신호 처리 방법 및 장치 | |
EP1998321A1 (en) | Method and apparatus for encoding/decoding a digital signal | |
KR20090110244A (ko) | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 | |
CN102576535B (zh) | 用于确定音频系统的感知质量的方法和系统 | |
EP1596366B1 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
KR101907808B1 (ko) | 오디오 신호에서 노이즈를 추산하는 방법, 노이즈 추산기, 오디오 인코더, 오디오 디코더 및 오디오 신호를 전송하는 시스템 | |
JP7125447B2 (ja) | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス | |
WO2019214825A1 (en) | Transmission of sensor data from sensor devices | |
US20030220800A1 (en) | Coding multichannel audio signals | |
WO2007034375A2 (en) | Determination of a distortion measure for audio encoding | |
JPH08204575A (ja) | 適応的符号化システム及びビット割当方法 | |
CN110998722B (zh) | 低复杂性密集瞬态事件检测和译码 | |
KR20070050035A (ko) | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 | |
KR100590340B1 (ko) | 디지털 오디오 부호화 방법 및 장치 | |
CN115641857A (zh) | 音频处理方法、装置、电子设备、存储介质及程序产品 | |
KR19980072457A (ko) | 오디오 신호의 압축시 심리음향에서의 신호처리방법 및 그 장치 | |
JPH06291670A (ja) | ディジタルオーディオ信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7125447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |