JP7387879B2 - オーディオ符号化方法および装置 - Google Patents
オーディオ符号化方法および装置 Download PDFInfo
- Publication number
- JP7387879B2 JP7387879B2 JP2022517444A JP2022517444A JP7387879B2 JP 7387879 B2 JP7387879 B2 JP 7387879B2 JP 2022517444 A JP2022517444 A JP 2022517444A JP 2022517444 A JP2022517444 A JP 2022517444A JP 7387879 B2 JP7387879 B2 JP 7387879B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter set
- encoding
- audio data
- combination
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 60
- 230000003595 spectral effect Effects 0.000 claims description 54
- 238000012549 training Methods 0.000 claims description 48
- 238000013528 artificial neural network Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims 6
- 230000015556 catabolic process Effects 0.000 claims 1
- 238000006731 degradation reaction Methods 0.000 claims 1
- 230000006866 deterioration Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 208000003028 Stuttering Diseases 0.000 description 1
- 101150036464 aptx gene Proteins 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Otolaryngology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
Description
第1のオーディオデータを取得するステップと、ターゲットビットレートおよびブルートゥース(登録商標)パケットタイプを取得するステップであって、ターゲットビットレートおよびブルートゥース(登録商標)パケットタイプはブルートゥース(登録商標)チャネルの現在の状態に対応する、ステップと、第1のオーディオデータ、ターゲットビットレート、およびブルートゥース(登録商標)パケットタイプに基づいて、事前訓練によって取得されたニューラルネットワークを使用してビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上を取得するステップであって、ビットプールパラメータセット内のパラメータは、符号化に使用され得るビットストリーム内の残りのビット数を示すために使用され、心理音響パラメータセット内のパラメータは、異なる周波数での符号化に必要なビット数の割り当てを示すために使用され、スペクトル帯域幅パラメータセット内のパラメータは、符号化後に取得されるオーディオスペクトルの最高カットオフ周波数を示すために使用される、ステップと、送信されるべきビットストリームを取得するために、ビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上に基づいて第1のオーディオデータを符号化するステップとを含むオーディオ符号化方法を提供する。
第1のオーディオデータを取得し、ターゲットビットレートおよびブルートゥース(登録商標)パケットタイプを取得し、ターゲットビットレートおよびブルートゥース(登録商標)パケットタイプはブルートゥース(登録商標)チャネルの現在の状態に対応する、ように構成された入力モジュールと、第1のオーディオデータ、ターゲットビットレート、およびブルートゥース(登録商標)パケットタイプに基づいて、事前訓練によって取得されたニューラルネットワークを使用してビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上を取得し、ビットプールパラメータセット内のパラメータは、符号化に使用され得るビットストリーム内の残りのビット数を示すために使用され、心理音響パラメータセット内のパラメータは、異なる周波数での符号化に必要なビット数の割り当てを示すために使用され、スペクトル帯域幅パラメータセット内のパラメータは、符号化後に取得されるオーディオスペクトルの最高カットオフ周波数を示すために使用される、ように構成されたパラメータ取得モジュールと、送信されるべきビットストリームを取得するために、ビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上に基づいて第1のオーディオデータを符号化するように構成された符号化モジュールとを含むオーディオ符号化装置を提供する。
1つ以上のプロセッサと、
1つ以上のプログラムを記憶するように構成されたメモリと
を含む端末デバイスを提供する。
701 入力モジュール
702 パラメータ取得モジュール
703 符号化モジュール
800 端末デバイス
801 プロセッサ
802 トランシーバ
803 メモリ
804 アンテナ
805 電源
806 入力ユニット
807 表示ユニット
808 オーディオ回路
809 カメラ
810 センサ
8081 スピーカ
8082 マイクロフォン
Claims (15)
- 情報処理装置によって第1のオーディオデータを取得するステップと、
前記情報処理装置によってターゲットビットレートおよびブルートゥースパケットタイプを取得するステップであって、前記ターゲットビットレートおよび前記ブルートゥースパケットタイプはブルートゥースチャネルの現在の状態に対応する、ステップと、
前記情報処理装置によって前記第1のオーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプに基づいて、事前訓練によって取得されたニューラルネットワークを使用してビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上を取得するステップであって、前記ビットプールパラメータセット内のパラメータは、符号化に使用され得るビットストリーム内の残りのビット数を示すために使用され、前記心理音響パラメータセット内のパラメータは、異なる周波数での符号化に必要なビット数の割り当てを示すために使用され、前記スペクトル帯域幅パラメータセット内のパラメータは、符号化オーディオスペクトルの最高カットオフ周波数を示すために使用される、ステップと、
前記情報処理装置によって送信されるべきビットストリームを取得するために、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットのうちの1つ以上に基づいて前記第1のオーディオデータを符号化するステップと
を含むオーディオ符号化方法。 - 前記第1のオーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプに基づいて、事前訓練によって取得されたニューラルネットワークを使用してビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上を取得する前記ステップは、
前記第1のオーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプに対して特徴抽出を実行して第1の特徴ベクトルを取得するステップと、
前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットのうちの1つ以上を取得するために前記第1の特徴ベクトルを前記ニューラルネットワークに入力するステップと
を含む、請求項1に記載の方法。 - 前記ブルートゥースパケットタイプは、2DH1、2DH3、2DH5、3DH1、3DH3、および3DH5のうちのいずれか1つを含む、請求項1または2に記載の方法。
- 前記ターゲットビットレートは、指定された期間に符号化によって生成されるデータパケットの平均バイト数を示すために使用される、請求項1から3のいずれか一項に記載の方法。
- 第1のオーディオデータを取得する前記ステップの前に、前記方法は、
前記情報処理装置によって前記ニューラルネットワークの訓練データセットを構築するステップであって、前記訓練データセットは、第1の値の組み合わせと第2の値の組み合わせとの対応関係を含み、前記第1の値の組み合わせは、前記オーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプの複数の値の組み合わせのうちのいずれか1つであり、前記第2の値の組み合わせは、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの複数の値の組み合わせのうちの1つであり、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの前記複数の値の組み合わせは、複数の客観品質劣化度合(ODG)に対応し、前記第2の値の組み合わせは、最も高いODGに対応する、ステップと、
前記情報処理装置によって前記訓練データセットに基づく訓練によって前記ニューラルネットワークを取得するステップと
をさらに含む、請求項1から4のいずれか一項に記載の方法。 - 前記ニューラルネットワークの訓練データセットを構築する前記ステップは、
複数のオーディオデータを取得するステップと、
前記第1の値の組み合わせにおける前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの前記複数の値の組み合わせを使用して第2のオーディオデータを別々に符号化するステップであって、前記第2のオーディオデータは、前記複数のオーディオデータのうちのいずれか1つである、ステップと、
符号化結果に基づいて前記複数のODGを取得するステップと、
前記複数のODGの中で最も高いODGに対応する値の組み合わせを前記第2の値の組み合わせとして決定するステップと、
前記第1の値の組み合わせおよび前記第2の値の組み合わせを前記訓練データセットに追加するステップと
を含む、請求項5に記載の方法。 - 第1のオーディオデータを取得し、ターゲットビットレートおよびブルートゥースパケットタイプを取得し、前記ターゲットビットレートおよび前記ブルートゥースパケットタイプはブルートゥースチャネルの現在の状態に対応する、ように構成された入力モジュールと、
前記第1のオーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプに基づいて、事前訓練によって取得されたニューラルネットワークを使用してビットプールパラメータセット、心理音響パラメータセット、およびスペクトル帯域幅パラメータセットのうちの1つ以上を取得し、前記ビットプールパラメータセット内のパラメータは、符号化に使用され得るビットストリーム内の残りのビット数を示すために使用され、前記心理音響パラメータセット内のパラメータは、異なる周波数での符号化に必要なビット数の割り当てを示すために使用され、前記スペクトル帯域幅パラメータセット内のパラメータは、符号化オーディオスペクトルの最高カットオフ周波数を示すために使用される、ように構成されたパラメータ取得モジュールと、
送信されるべきビットストリームを取得するために、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットのうちの1つ以上に基づいて前記第1のオーディオデータを符号化するように構成された符号化モジュールと
を備えるオーディオ符号化装置。 - 前記パラメータ取得モジュールは、前記第1のオーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプに対して特徴抽出を実行して第1の特徴ベクトルを取得し、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットのうちの1つ以上を取得するために前記第1の特徴ベクトルを前記ニューラルネットワークに入力するように特に構成されている、請求項7に記載の装置。
- 前記ブルートゥースパケットタイプは、2DH1、2DH3、2DH5、3DH1、3DH3、および3DH5のうちのいずれか1つを含む、請求項7または8に記載の装置。
- 前記ターゲットビットレートは、指定された期間に符号化によって生成されるデータパケットの平均バイト数を示すために使用される、請求項7から9のいずれか一項に記載の装置。
- 前記パラメータ取得モジュールは、前記ニューラルネットワークの訓練データセットを構築し、前記訓練データセットは、第1の値の組み合わせと第2の値の組み合わせとの対応関係を含み、前記第1の値の組み合わせは、前記オーディオデータ、前記ターゲットビットレート、および前記ブルートゥースパケットタイプの複数の値の組み合わせのうちのいずれか1つであり、前記第2の値の組み合わせは、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの複数の値の組み合わせのうちの1つであり、前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの前記複数の値の組み合わせは、複数の客観品質劣化度合(ODG)に対応し、前記第2の値の組み合わせは、最も高いODGに対応し、前記訓練データセットに基づく訓練によって前記ニューラルネットワークを取得するようにさらに構成されている、請求項7から10のいずれか一項に記載の装置。
- 前記パラメータ取得モジュールは、複数のオーディオデータを取得し、前記第1の値の組み合わせにおける前記ビットプールパラメータセット、前記心理音響パラメータセット、および前記スペクトル帯域幅パラメータセットの前記複数の値の組み合わせを使用して第2のオーディオデータを別々に符号化し、前記第2のオーディオデータは、前記複数のオーディオデータのうちのいずれか1つであり、符号化結果に基づいて前記複数のODGを取得し、前記複数のODGの中で最も高いODGに対応する値の組み合わせを前記第2の値の組み合わせとして決定し、前記第1の値の組み合わせおよび前記第2の値の組み合わせを前記訓練データセットに追加するように特に構成されている、請求項11に記載の装置。
- 1つ以上のプロセッサと、
1つ以上のプログラムを記憶するように構成されたメモリと
を備え、前記1つ以上のプログラムが前記1つ以上のプロセッサによって実行されるとき、前記1つ以上のプロセッサは、請求項1から6のいずれか一項に記載のオーディオ符号化方法を実施することが可能である、
端末デバイス。 - コンピュータプログラムを含むコンピュータ可読記憶媒体であって、前記コンピュータプログラムがコンピュータ上で実行されるとき、前記コンピュータは、請求項1から6のいずれか一項に記載のオーディオ符号化方法を実行することが可能である、コンピュータ可読記憶媒体。
- コンピュータプログラム製品であって、前記コンピュータプログラム製品はコンピュータプログラムコードを含み、前記コンピュータプログラムコードがコンピュータ上で実行されるとき、前記コンピュータは、請求項1から6のいずれか一項に記載のオーディオ符号化方法を実行することが可能である、コンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910883038.0 | 2019-09-18 | ||
CN201910883038.0A CN112530444B (zh) | 2019-09-18 | 2019-09-18 | 音频编码方法和装置 |
PCT/CN2020/115123 WO2021052293A1 (zh) | 2019-09-18 | 2020-09-14 | 音频编码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022548299A JP2022548299A (ja) | 2022-11-17 |
JP7387879B2 true JP7387879B2 (ja) | 2023-11-28 |
Family
ID=74883171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022517444A Active JP7387879B2 (ja) | 2019-09-18 | 2020-09-14 | オーディオ符号化方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220208200A1 (ja) |
EP (1) | EP4024394A4 (ja) |
JP (1) | JP7387879B2 (ja) |
KR (1) | KR20220066316A (ja) |
CN (1) | CN112530444B (ja) |
WO (1) | WO2021052293A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
CN114550732B (zh) * | 2022-04-15 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 一种高频音频信号的编解码方法和相关装置 |
CN114783452B (zh) * | 2022-06-17 | 2022-12-13 | 荣耀终端有限公司 | 音频播放方法、装置及存储介质 |
CN114863940B (zh) * | 2022-07-05 | 2022-09-30 | 北京百瑞互联技术有限公司 | 音质转换的模型训练方法、提升音质的方法、装置及介质 |
CN117440440B (zh) * | 2023-12-21 | 2024-03-15 | 艾康恩(深圳)电子科技有限公司 | 一种蓝牙耳机低延迟传输方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130304458A1 (en) | 2012-05-14 | 2013-11-14 | Yonathan Shavit | Bandwidth dependent audio quality adjustment |
JP2015505991A (ja) | 2011-12-12 | 2015-02-26 | モトローラ モビリティ エルエルシーMotorola Mobility Llc | オーディオ符号化のための方法および装置 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
BR0213596A (pt) * | 2001-09-26 | 2004-10-26 | Interact Devices Inc | Sistema e metodo para transmitir sinais de midia |
EP1873753A1 (en) * | 2004-04-01 | 2008-01-02 | Beijing Media Works Co., Ltd | Enhanced audio encoding/decoding device and method |
CN1677492A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN101136202B (zh) * | 2006-08-29 | 2011-05-11 | 华为技术有限公司 | 音频信号处理系统、方法以及音频信号收发装置 |
WO2008132850A1 (ja) * | 2007-04-25 | 2008-11-06 | Panasonic Corporation | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
CN101308659B (zh) * | 2007-05-16 | 2011-11-30 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的心理声学模型的处理方法 |
US20090099851A1 (en) * | 2007-10-11 | 2009-04-16 | Broadcom Corporation | Adaptive bit pool allocation in sub-band coding |
CN100562117C (zh) * | 2007-11-19 | 2009-11-18 | 华为技术有限公司 | 一种码流调度方法、装置和系统 |
CN101350199A (zh) * | 2008-07-29 | 2009-01-21 | 北京中星微电子有限公司 | 音频编码器及音频编码方法 |
CN101853663B (zh) * | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
CN101847413B (zh) * | 2010-04-09 | 2011-11-16 | 北京航空航天大学 | 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法 |
CN102479514B (zh) * | 2010-11-29 | 2014-02-19 | 华为终端有限公司 | 一种编码方法、解码方法、装置和系统 |
US8793557B2 (en) * | 2011-05-19 | 2014-07-29 | Cambrige Silicon Radio Limited | Method and apparatus for real-time multidimensional adaptation of an audio coding system |
CN102436819B (zh) * | 2011-10-25 | 2013-02-13 | 杭州微纳科技有限公司 | 无线音频压缩、解压缩方法及音频编码器和音频解码器 |
CN103532936A (zh) * | 2013-09-28 | 2014-01-22 | 福州瑞芯微电子有限公司 | 一种蓝牙音频自适应传输方法 |
US10127914B2 (en) * | 2014-03-21 | 2018-11-13 | Dolby Laboratories Licensing Corporation | Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
US10721471B2 (en) * | 2017-10-26 | 2020-07-21 | Intel Corporation | Deep learning based quantization parameter estimation for video encoding |
EP3483882A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11416742B2 (en) * | 2017-11-24 | 2022-08-16 | Electronics And Telecommunications Research Institute | Audio signal encoding method and apparatus and audio signal decoding method and apparatus using psychoacoustic-based weighted error function |
CN109981545A (zh) * | 2017-12-28 | 2019-07-05 | 北京松果电子有限公司 | 编码码率调整装置、方法及电子设备 |
CN109785847B (zh) * | 2019-01-25 | 2021-04-30 | 东华大学 | 基于动态残差网络的音频压缩算法 |
EP4114052B1 (en) * | 2019-07-26 | 2023-12-20 | Google LLC | Method for managing a plurality of multimedia communication links in a point-to-multipoint bluetooth network |
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
WO2022018483A1 (en) * | 2020-07-20 | 2022-01-27 | Telefonaktiebolaget Lm Ericsson (Publ) | 5g optimized game rendering |
WO2022079545A1 (en) * | 2020-10-13 | 2022-04-21 | Nokia Technologies Oy | Carriage and signaling of neural network representations |
-
2019
- 2019-09-18 CN CN201910883038.0A patent/CN112530444B/zh active Active
-
2020
- 2020-09-14 WO PCT/CN2020/115123 patent/WO2021052293A1/zh unknown
- 2020-09-14 JP JP2022517444A patent/JP7387879B2/ja active Active
- 2020-09-14 KR KR1020227012578A patent/KR20220066316A/ko unknown
- 2020-09-14 EP EP20865475.6A patent/EP4024394A4/en active Pending
-
2022
- 2022-03-17 US US17/697,455 patent/US20220208200A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015505991A (ja) | 2011-12-12 | 2015-02-26 | モトローラ モビリティ エルエルシーMotorola Mobility Llc | オーディオ符号化のための方法および装置 |
US20130304458A1 (en) | 2012-05-14 | 2013-11-14 | Yonathan Shavit | Bandwidth dependent audio quality adjustment |
Also Published As
Publication number | Publication date |
---|---|
EP4024394A1 (en) | 2022-07-06 |
KR20220066316A (ko) | 2022-05-24 |
CN112530444B (zh) | 2023-10-03 |
WO2021052293A1 (zh) | 2021-03-25 |
US20220208200A1 (en) | 2022-06-30 |
EP4024394A4 (en) | 2022-10-26 |
JP2022548299A (ja) | 2022-11-17 |
CN112530444A (zh) | 2021-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7387879B2 (ja) | オーディオ符号化方法および装置 | |
US10218856B2 (en) | Voice signal processing method, related apparatus, and system | |
US11568882B2 (en) | Inter-channel phase difference parameter encoding method and apparatus | |
WO2013156814A1 (en) | Stereo audio signal encoder | |
WO2021208792A1 (zh) | 音频信号编码方法、解码方法、编码设备以及解码设备 | |
WO2021244418A1 (zh) | 一种音频编码方法和音频编码装置 | |
WO2021213128A1 (zh) | 音频信号编码方法和装置 | |
EP3903309B1 (en) | High resolution audio coding | |
KR102628755B1 (ko) | 다운믹스된 신호 계산 방법 및 장치 | |
US20230105508A1 (en) | Audio Coding Method and Apparatus | |
JP5006975B2 (ja) | 背景雑音情報の復号化方法および背景雑音情報の復号化手段 | |
JP2005114814A (ja) | 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体 | |
CN105761724B (zh) | 一种语音频信号处理方法和装置 | |
EP4375999A1 (en) | Audio device with signal parameter-based processing, related methods and systems | |
US11715478B2 (en) | High resolution audio coding | |
CN111261175A (zh) | 一种蓝牙音频信号传输方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220428 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7387879 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |