JP2024503032A - オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置 - Google Patents
オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置 Download PDFInfo
- Publication number
- JP2024503032A JP2024503032A JP2023541765A JP2023541765A JP2024503032A JP 2024503032 A JP2024503032 A JP 2024503032A JP 2023541765 A JP2023541765 A JP 2023541765A JP 2023541765 A JP2023541765 A JP 2023541765A JP 2024503032 A JP2024503032 A JP 2024503032A
- Authority
- JP
- Japan
- Prior art keywords
- coding
- bitstream
- coded
- sequence
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 238000013507 mapping Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003491 array Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 7
- 230000008707 rearrangement Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 7
- 238000009826 distribution Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000007599 discharging Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置であって、オーディオコーディング方法は、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定する(S101)ことと、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定する(S102)ことと、コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、コーディングすべきシーケンスをコーディングして第二のビットストリームを得る(S103)ことと、第一のビットストリーム、第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得る(S104)ことと、を含む。【選択図】 図2
Description
(関連出願の相互参照)
本出願は、2021年01月21日に中国で提出された中国特許出願番号No.202110080645.0の優先権を主張しており、同出願の内容のすべては、ここに参照として取り込まれる。
本出願は、2021年01月21日に中国で提出された中国特許出願番号No.202110080645.0の優先権を主張しており、同出願の内容のすべては、ここに参照として取り込まれる。
本出願は、オーディオ処理技術分野に属し、具体的には、オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置に関する。
オーディオコーディング技術の核心は、オーディオ信号を圧縮すると同時に、オーディオ信号が完全且つ損なわれず、圧縮中でオーディオ信号に雑音とオーディオ歪みが発生しないことを確保することである。
オーディオ信号をコーディングするコーディング方式として、オーディオ信号における各オーディオパラメータの確率分布を決定し、オーディオパラメータの確率分布に基づいてオーディオ信号をコーディングする。しかしながら、異なるオーディオパラメータに対応する確率分布は、異なり、オーディオパラメータの数が比較的に多い場合、まず、大量の計算プロセスによってすべてのオーディオパラメータの確率分布を決定してから、オーディオ信号をコーディングする必要があり、このように、コーディング効率が比較的に低いことになる。
本出願の実施例の目的は、コーディング効率が比較的に低いという技術問題を解決できるオーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置を提供することである。
上記技術問題を解決するために、本出願は、以下のように実現される。
第一の態様によれば、本出願の実施例は、オーディオコーディング方法を提供し、前記オーディオコーディング方法は、
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定することと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得ることと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定することと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得ることと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。
第二の態様によれば、本出願の実施例は、オーディオデコーディング方法を提供し、前記オーディオデコーディング方法は、
オーディオ信号に対応するオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得ることであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られることと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定することと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得ることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定することと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得ることと、を含む。
オーディオ信号に対応するオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得ることであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られることと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定することと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得ることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定することと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得ることと、を含む。
第三の態様によれば、本出願の実施例は、オーディオコーディング装置を提供し、前記オーディオコーディング装置は、
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定するための第一の決定モジュールであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第一の決定モジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定するための第二の決定モジュールと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得るためのコーディングモジュールと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得るためのパケット化モジュールと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定するための第一の決定モジュールであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第一の決定モジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定するための第二の決定モジュールと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得るためのコーディングモジュールと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得るためのパケット化モジュールと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。
第四の態様によれば、本出願の実施例は、オーディオデコーディング装置を提供し、前記オーディオデコーディング装置は、
オーディオ信号のオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得るための第一のデコーディングモジュールであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られる第一のデコーディングモジュールと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定するための第三の決定モジュールと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得るための第二のデコーディングモジュールであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第二のデコーディングモジュールと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得るための第三のデコーディングモジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定するための第四の決定モジュールと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得るための第四のデコーディングモジュールと、を含む。
オーディオ信号のオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得るための第一のデコーディングモジュールであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られる第一のデコーディングモジュールと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定するための第三の決定モジュールと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得るための第二のデコーディングモジュールであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第二のデコーディングモジュールと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得るための第三のデコーディングモジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定するための第四の決定モジュールと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得るための第四のデコーディングモジュールと、を含む。
第五の態様によれば、本出願の実施例は、電子機器を提供し、この電子機器は、プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるプログラム又は命令と、を含み、前記プログラム又は命令が前記プロセッサにより実行される時、第一の態様に記載の方法のステップを実現し、又は、第二の態様に記載の方法のステップを実現する。
第六の態様によれば、本出願の実施例は、可読記憶媒体を提供し、前記可読記憶媒体には、プログラム又は命令が記憶されており、前記プログラム又は命令がプロセッサにより実行される時、第一の態様に記載の方法のステップを実現し、又は、第二の態様に記載の方法のステップを実現する。
第七の態様によれば、本出願の実施例は、チップを提供し、前記チップは、プロセッサと通信インターフェースとを含み、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、第一の態様に記載の方法を実現し、又は、第二の態様に記載の方法を実現するために用いられる。
第八の態様によれば、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品は、非一時的記憶媒体に記憶されており、前記コンピュータプログラム製品は、少なくとも一つのプロセッサにより実行されて、第一の態様に記載の方法を実現し、又は第二の態様に記載の方法を実現する。
本出願の実施例では、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定し、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定し、コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、コーディングすべきシーケンスをコーディングして第二のビットストリームを得、第一のビットストリーム、第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得、第三のビットストリームは、コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。本出願の実施例によるオーディオコーディング方法は、オーディオパラメータの確率分布に対する計算に関するものではなく、オーディオパラメータの確率分布に基づいてオーディオ信号をコーディングする必要がなく、それによって大量の計算ステップを減少させ、さらにコーディング効率を向上させた。
本出願の実施例の技術案をより明瞭に説明するために、以上は、本出願の実施例の記述において使用される必要のある図面を簡単に紹介し、自明なことに、以上の記述における図面は、ただ本出願のいくつかの実施例に過ぎず、当業者にとって、創造的な労力を払わない前提で、これらの図面に基づいて他の図面を得ることもできる。
以下は、本出願の実施例における図面を結び付けながら、本出願の実施例における技術案を明瞭且つ完全に記述し、明らかに、記述された実施例は、本出願の一部の実施例であり、すべての実施例ではない。本出願における実施例に基づき、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本出願の保護範囲に属する。
以下は、本出願の実施例における図面を結び付けながら、本出願の実施例における技術案を明瞭且つ完全に記述し、明らかに、記述された実施例は、本出願の一部の実施例であり、すべての実施例ではない。本出願における実施例に基づき、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本出願の保護範囲に属する。
本出願の明細書と特許請求の範囲における用語である「第一」、「第二」などは、類似している対象を区別するものであり、特定の順序又は前後手順を記述するためのものではない。理解すべきこととして、このように使用されるデータは、適切な場合に交換可能であり、それにより本出願の実施例は、ここで図示又は記述されたもの以外の順序で実施されることが可能である。なお、明細書及び請求項における「及び/又は」は、接続される対象のうちの少なくとも一つを表し、文字である「/」は、一般的には前後関連対象が「又は」の関係であることを表す。
オーディオ処理技術分野では、一般的には、オーディオコーディングを感知する方式を採用してオーディオ信号をコーディングし、オーディオ信号の圧縮を実現する。図1を参照すると、図1は、本出願の実施例におけるオーディオコーディング方法の一つの応用シナリオ概略図である。図1に示すように、オーディオ信号をコーディングする一つの応用シナリオにおいて、コーディングすべきオーディオ信号をフィルタ群とコーディングモデルに入力し、オーディオ信号の修正離散コサイン変換(Modified Discrete Cosine Transform、MDCT)スペクトルと複数のマスキング閾値を得る。
ここで、このフィルタは、1組のフィルタであってもよく、このフィルタ群は、オーディオ信号を周波数領域信号に変換することができ、このように、オーディオ信号の大部分のエネルギーは、いくつかの周波数バンドに集中され、オーディオ信号のMDCTスペクトルを得る。
ここで、コーディングモデルは、心理音響モデルであってもよい。理解すべきこととして、心理音響モデルは、オーディオ信号のうちの人間の耳が認識できない信号をフィルタリングするために用いられ、具体的な作動原理として、入力されるオーディオ信号を人間の耳の聴覚感知特性に応じて複数の帯域に分け、各帯域に対応するマスキング閾値を計算する。
オーディオ信号のMDCTスペクトルと複数のマスキング閾値を量子化モジュールに入力し、オーディオ信号を量子化し、オーディオ信号に対応するグローバルゲイン(Global Gain、GG)パラメータと各帯域に対応するスケーリング係数(Scalefactor、scf)パラメータを得る。
ここで、一つの選択的な実施の形態として、オーディオ信号における最も長い帯域に対応する値は、グローバルゲインパラメータとして決定される。量子化モジュールの作動原理は、以下のように簡単に概説されることができる。グローバルゲインパラメータと各帯域に対応するマスキング閾値に基づいてスケーリング係数パラメータを調整し、最適なスケーリング係数パラメータをこの帯域に対応するスケーリング係数パラメータとする。
オーディオ信号のグローバルゲインパラメータと各帯域に対応するスケーリング係数パラメータをコーディングモジュールに入力してコーディングし、モジュールをフォーマット化することによってコーディング結果ビットストリームをフォーマット化し、オーディオコーディングビットストリームを得、オーディオ信号の圧縮を実現する。
このステップでは、一つの選択的な実施の形態として、各スケーリング係数パラメータの確率分布に基づいてオーディオ信号をコーディングするが、各スケーリング係数パラメータに対応する確率分布は、異なり、複数のスケーリング係数パラメータが存在する場合、各スケーリング係数パラメータに対応する確率分布を計算する必要があり、コーディング効率が比較的に低いことになる。
上記存在する技術問題に基づき、本出願の実施例は、オーディオコーディング方法を提供する。以下、図面を結び付けながら、具体的な実施例及びその応用シナリオによって本出願の実施例によるオーディオコーディング方法を詳細に説明する。
図2を参照すると、図2は、本出願の実施例によるオーディオコーディング方法のフローチャートである。本出願の実施例によるオーディオコーディング方法は、以下のステップを含む。
S101、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定する。
本ステップでは、オーディオパラメータは、第一のパラメータと、オーディオ信号各帯域に対応する第二のパラメータとを含み、オーディオ信号にN個の帯域が存在する場合、第二のパラメータの数は、Nであり、Nは、正整数である。選択的に、上記第一のパラメータは、グローバルゲインパラメータであってもよく、上記第二のパラメータは、スケーリング係数パラメータであってもよい。技術案を明瞭に記述するために、後続の実施例で現れる第一のパラメータと第二のパラメータは、いずれも第一のパラメータのパラメータ値と第二のパラメータのパラメータ値を指す。
ここで、上記コーディングすべきシーケンスは、第一のパラメータとN個の第二のパラメータに基づいてコーディングされて得られ、具体的な技術案は、後続の実施例を参照し、上記第一のビットストリームは、第一のパラメータに基づいてコーディングされて得られ、具体的な技術案は、後続の実施例を参照する。
S102、前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定する。
本ステップでは、コーディングすべきシーケンスにおける各エレメントに対応する数値の絶対値を、このエレメントに対応するコード番号として決定してもよい。
例示的には、コーディングすべきシーケンスが{0,1,5,-8}である場合、一番目のエレメント0に対応する絶対値は、0であり、0をこのエレメントのコード番号として決定することができる。このように、コーディングすべきシーケンス{0,1,5,-8}における各エレメントに対応するコード番号は、{0,1,5,8}である。
S103、前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得る。
本ステップでは、コーディング次数が予め設けられており、このコーディング次数は、カスタマイズに設定されてもよく、ここで、各コーディング次数は、一つのコーディングテーブルに対応し、このコーディングテーブルは、コード番号とコーディング値とのマッピング関係を反映する。
一つの存在し得る場合として、一つのコーディング次数が存在し、このような場合、このコーディング次数に対応する一つのコーディングテーブルが存在する。存在し得る別の場合として、複数のコーディング次数が存在し、このような場合、このコーディング次数に対応する複数のコーディングテーブルが存在し、例えば5つのコーディング次数が存在し、このような場合、コーディングテーブルの数は、5である。
表1を参照し、表1は、コーディング次数0に対応する一部のコーディングテーブル、とコーディング次数1に対応する一部のコーディングテーブルを示した。
例えば、コーディング次数が0である場合、コード番号1に対応するコーディング値は、010であり、コード番号2に対応するコーディング値は、011である。
コード番号とコーディングテーブルに基づき、コーディングすべきシーケンスをコーディングして、第二のビットストリームを得る。具体的な技術案は、後続の実施例を参照する。
S104、前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得る。
本ステップでは、説明すべきこととして、第三のビットストリームは、コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。ここで、第一の予め設定される値は、0であってもよく、第三のビットストリームは、シンボルシーケンスとして理解されてもよく、第三のビットストリームに基づいてコーディングすべきシーケンスにおける各エレメントの正負値を決定することができる。
一つの選択的な実施の形態として、コーディングすべきシーケンスにおける0よりも大きいエレメントを0に決定し、0よりも小さいエレメントを1に決定し、一コーディングすべきシーケンスが{-1,5,-8,9}である場合、各エレメントの正負値に基づいて第三のビットストリーム{1,0,1,0}を決定してもよい。
別の選択的な実施の形態として、コーディングすべきシーケンスにおける0よりも大きいエレメントを0に決定し、0よりも小さいエレメントを1に決定し、一コーディングすべきシーケンスが{-1,5,-8,9}である場合、各エレメントの正負値に基づいて第三のビットストリーム{1,0,1,0}を決定してもよい。
本ステップでは、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得た後に、並び替えに応じて上記ビットストリームをパケット化し、オーディオコーディングビットストリームを得る。選択的に、このオーディオコーディングビットストリームにおける各ビットストリームの左から右へのコーディング順序は、第一のビットストリーム、第三のビットストリーム、第二のビットストリームであってもよい。
本出願の実施例では、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定し、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定し、コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、コーディングすべきシーケンスをコーディングして第二のビットストリームを得、第一のビットストリーム、第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得、第三のビットストリームは、コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである。本出願の実施例によるオーディオコーディング方法は、オーディオパラメータの確率分布に対する計算に関するものではなく、オーディオパラメータの確率分布に基づいてオーディオ信号をコーディングする必要がなく、それによって大量の計算ステップを減少させ、さらにコーディング効率を向上させた。
以下、どのようにコーディングすべきシーケンスをコーディングして第二のビットストリームを得るかを具体的に説明する。
存在する第一の場合として、コーディング次数の数は、1であり、即ち一つのコーディング次数のみが存在する。
選択的に、前記の、前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることは、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定し、いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、を含む。
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定し、いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、を含む。
本実施例では、1つのコーディング次数のみが存在する場合、このコーディング次数に対応する1つのコーディングテーブルを決定する。コーディングすべきシーケンスにおけるいずれか一つのエレメントに対応するコード番号に対して、上記コーディングテーブルには、コード番号とコーディング値のマッピングが反映されるため、コーディングテーブルで検索してこのコード番号に対応するコーディング値を得ることができる。
さらに、コーディングテーブルでは、このコーディングすべきシーケンスのすべてのエレメントに対応するコーディング値を検索し、すべてのコーディング値を並び替えてパケット化し、第二のビットストリームを得る。理解すべきこととして、第二のビットストリームにおける各コーディング値の第二のビットストリームにおける並び替えは、このコーディング値に対応するエレメントのコーディングすべきシーケンスにおける並び替えと同じである。
例えば、1つのコーディング次数が存在し、且つこのコーディング次数が0であり、コーディングすべきシーケンスに対応するコード番号が{2,0,1,0,2}であり、上記表1によって検索して、コード番号0に対応するコーディング値が1であり、コード番号1に対応するコーディング値が010であり、コード番号2に対応するコーディング値が011であることを得ることができ、さらに第二のビットストリーム{011,1,010,1,011}を得ることができる。
存在する第二の場合として、複数のコーディング次数が存在する。
説明すべきこととして、複数のコーディング次数が存在する場合、第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、ここで、第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームである。例えば、Kは、2であり、コーディング次数は、1と2である。このような場合、K個のコーディング次数の二進数をパケット化し、第二のサブビットストリームを得ることができる。
1に対応する二進数が1であり、2に対応する二進数が10である場合、第二のサブビットストリームは、{1,110}である。
選択的に、前記の、前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることは、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることと、すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、を含む。
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることと、すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、を含む。
本実施例では、K個のコーディング次数が存在し、且つKが1よりも大きい場合、各コーディング次数に対応するコーディングテーブルを決定し、即ちK個のコーディングテーブルを決定する。
コーディングすべきシーケンスにおけるいずれか一つのエレメントに対応するコード番号に対して、すべてのコーディングテーブルをトラバースし、検索してこのコード番号に対応するK個のコーディング値を得、K個のコーディング値のうちのコード長が最も小さいコーディング値をターゲットコーディング値として決定する。さらに、すべてのターゲットコーディング値を並び替えてパケット化し、第二のビットストリームを得る。
例示的には、それぞれ0と1である2つのコーディング次数が存在し、コーディングすべきシーケンスに対応するコード番号は、{2,0,1,0,2}であり、上記表1によって、コーディング次数が0である場合、コード番号0に対応するコーディング値が1であり、コード番号1に対応するコーディング値が010であり、コード番号2に対応するコーディング値が011であることを得ることができる。コーディング次数が1である場合、コード番号0に対応するコーディング値は、10であり、コード番号1に対応するコーディング値は、11であり、コード番号2に対応するコーディング値は、0100である。
コード番号0に対して、コーディング値1のコード長は、1であり、コーディング値10のコード長は、2であり、1が2よりも小さいため、コード番号0に対応するターゲットコーディング値は、1である。同様な原理に基づき、コード番号1に対応するターゲットコーディング値は、11であり、コード番号2に対応するターゲットコーディング値は、011であり、さらに第二のビットストリーム{011,1,11,1,011}を得ることができる。
以下、どのようにコーディングすべきシーケンスと第一のビットストリームを決定するかを具体的に説明する。選択的に、前記の、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することは、
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することと、前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることと、を含む。
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することと、前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることと、を含む。
本実施例では、第一のパラメータに対応する二進数を第一のビットストリームとして決定することができる。ここで、二進数コーディング、ハフマンコーディング又は他のコーディング方式を使用して第一のパラメータの二進数を決定することができる。
本実施例では、以下の2種類の方式を使用し、コーディングすべきシーケンスを得ることができる。
第一の方式として、第一のパラメータとN個の第二のパラメータを後退差分し、第一のターゲット数値とN-1個の第二のターゲット数値を得、第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、コーディングすべきシーケンスを得る。
具体的な実施の形態として、N個の第二のパラメータの並び替えに応じて、最も順位の高い第二のパラメータから第一のパラメータを引いて、第一のターゲットパラメータを得る。N個の第二のパラメータのうちの隣接する2つの第二のパラメータを配列として、N個の第二のパラメータに基づいてN-1個の配列を得ることができ、上記各配列において順位がより後の第二のパラメータから順位がより前の第二のパラメータを引いて、N-1個の第二のターゲット数値を得る。
例えば、第一のパラメータは、66であり、3つの第二のパラメータが存在し、それぞれ67、68、66である。上記実施の形態において、第一のターゲット数値は、67から66を引いた数値1である。68から67を引いた数値1、及び66から68を引いた値-2として分布する2つの第二のターゲット数値を得ることができる。すると、コーディングすべきシーケンスは、{1,1,-2}である。
第二の実施の形態として、第一のパラメータとN個の第二のパラメータを前進差分し、第一のターゲット数値とN-1個の第二のターゲット数値を得、第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、コーディングすべきシーケンスを得る。
具体的な実施の形態として、N個の第二のパラメータの並び替えに応じて、第一のパラメータから最も順位の高い第二のパラメータを引いて、第一のターゲットパラメータを得る。N個の第二のパラメータのうちの隣接する2つの第二のパラメータを配列として、N個の第二のパラメータに基づいてN-1個の配列を得ることができ、上記各配列において順位がより前の第二のパラメータから順位がより後の第二のパラメータを引いて、N-1個の第二のターゲット数値を得る。
例えば、第一のパラメータは、66であり、3つの第二のパラメータが存在し、それぞれ67、68、66である。上記実施の形態において、第一のターゲット数値は、66から67を引いた値-1である。67から68を引いた数値-1、及び68から66を引いた値2として分布する2つの第二のターゲット数値を得ることができる。すると、コーディングすべきシーケンスは、{-1,-1,2}である。
本出願によるオーディオコーディング方法を詳細に記述することを容易にするために、第一のパラメータが68であり、24個の第二のパラメータが存在し、数値が0である一つのコーディング次数が存在する例にして記述する。
第二のパラメータが、
{66,66,66,66,66,66,65,65,66,64,64,65,66,66,66,65,66,66,66,68,66,66,66,65}であるとする。
{66,66,66,66,66,66,65,65,66,64,64,65,66,66,66,65,66,66,66,68,66,66,66,65}であるとする。
第一のビットストリームは、第一のパラメータに対応する二進数が{01000100}である。
最も順位の高い第二のパラメータ66から第一のパラメータ68を引いて、第一のターゲット数値-2を得る。上記実施例に記述される方法を使用し、第一のパラメータとN個の第二のパラメータを後退差分し、コーディングすべきシーケンス:{-2,0,0,0,0,0,-1,0,1,-2,0,1,1,0,0,-1,1,0,0,2,-2,0,0,-1}を得る。
コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、第三のビットストリーム:{1,0,0,0,0,0,1,0,0,1,0,0,0,0,0,1,0,0,0,0,1,0,0,1}を得る。
コーディングすべきシーケンスにおける各エレメントに対応するコード番号を
{2,0,0,0,0,0,1,0,1,2,0,1,1,0,0,1,1,0,0,2,2,0,0,1}として決定する。
{2,0,0,0,0,0,1,0,1,2,0,1,1,0,0,1,1,0,0,2,2,0,0,1}として決定する。
コーディング次数が0である場合、表1に示されるコーディングテーブルを参照し、各コード番号に対応するコーディング値を決定し、さらに第二のビットストリームを
{011,1,1,1,1,1,010,1,010,011,1,010,010,1,1,010,010,1,1,011,011,1,1,010}として決定する。
{011,1,1,1,1,1,010,1,010,011,1,010,010,1,1,010,010,1,1,011,011,1,1,010}として決定する。
第一のビットストリーム、第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを
{01000100,100000100100000100001001,0111111101010100111010010110100101101101111010}として得る。
{01000100,100000100100000100001001,0111111101010100111010010110100101101101111010}として得る。
図3を参照すると、図3は、本出願の実施例によるオーディオデコーディング方法のフローチャートである。本出願の実施例によるオーディオデコーディング方法は、以下のステップを含む。
S201、オーディオ信号に対応するオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得る。
本ステップでは、説明すべきこととして、オーディオコーディングビットストリームに対して、第一のビットストリーム、第二のビットストリームと第三のビットストリームのためにそれぞれコーディング位置を予め設定したため、オーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得ることができる。
S202、前記第一のビットストリームに対応する数値を第一のパラメータとして決定する。
本ステップでは、一つの選択的な実施の形態として、第一のビットストリームに対応する10進数を第一のパラメータとして決定する。
S203、予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得る。
本ステップでは、コーディング次数が予め設けられており、このコーディング次数は、カスタマイズに設定されてもよく、ここで、各コーディング次数は、一つのコーディングテーブルに対応し、このコーディングテーブルは、コード番号とコーディング値とのマッピング関係を反映する。
1つのコーディング次数が存在する場合、ユニックな一つのコーディングテーブルで検索して第二のビットストリームにおける各コーディング値に対応するコード番号を得る。複数のコーディング次数が存在する場合、複数のコーディングテーブルで検索して第二のビットストリームにおける各コーディング値に対応するコード番号を得、コード番号によって構成される1組のコード番号シーケンスを得、具体的な技術案は、後続の実施例を参照する。
S204、前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得る。
本ステップでは、第三のビットストリームにおける各エレメントが対応するコード番号と第一の予め設定される値との大きさ関係を反映するため、第三のビットストリームをデコーディングすることができる。一つの実施の形態において、第三のビットストリームにおける二進数1を正の符号にデコーディングし、第三のビットストリームにおける二進数0を負の符号にデコーディングし、1組のシンボルシーケンスを得ることができる。
S205、前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定する。
本ステップでは、コーディングすべきシーケンスにおけるいずれか一つのエレメントに対して、このエレメントは、対応するコード番号とこのエレメントと第一の予め設定される値との大きさ関係によって生成される。上記シンボルシーケンスとコード番号シーケンスを乗算し、コーディングすべきシーケンスを得ることができる。
S206、前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得る。
本ステップでは、コーディングすべきシーケンスにおける各エレメントの並び替えに基づき、N個の第二のパラメータを決定することによって、第一のパラメータとN個の第二のパラメータを得、オーディオコーディングビットストリームに対するデコーディングを実現する。
一つの選択的な実施の形態として、コーディングすべきシーケンスにおいて最も順位の高いエレメントと第一のパラメータとの和を、最も順位の高い第二のパラメータとして決定し、最も順位の高い第二のパラメータとコーディングすべきシーケンスにおいて順位が二番目であるエレメントの和を、順位が二番目である第二のパラメータとして決定する。上記原理に基づき、N個の第二のパラメータを得る。
別の選択的な実施の形態として、第一のパラメータからコーディングすべきシーケンスにおいて最も順位の高いエレメントを引いた値を最も順位の高い第二のパラメータとして、最も順位の高い第二のパラメータとコーディングすべきシーケンスにおいて順位が二番目であるエレメントとの差を、順位が二番目である第二のパラメータとして決定する。上記原理に基づき、N個の第二のパラメータを得る。
選択的に、前記の、予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることは、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む。
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む。
本実施例では、1つのコーディング次数のみが存在する場合、このコーディング次数に対応する1つのコーディングテーブルを決定する。第二のビットストリームにおけるいずれか一つのコーディング値に対して、上記コーディングテーブルには、コード番号とコーディング値のマッピングが反映されるため、コーディングテーブルで検索してこのコーディング値に対応するコード番号を得ることができる。
選択的に、前記の、予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることは、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む。
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む。
本実施例では、K個のコーディング次数が存在し、Kが1よりも大きい場合、第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、ここで、第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームである。
理解すべきこととして、各コーディングテーブルで反映されるコーディング値は、異なり、複数のコーディング次数が存在する場合、第二のビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索してこのコーディング値に対応するコード番号を得ることができる。
図4に示すように、オーディオコーディング装置300は、
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定するための第一の決定モジュール301と、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定するための第二の決定モジュール302と、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得るためのコーディングモジュール303と、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得るためのパケット化モジュール304と、を含む。
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定するための第一の決定モジュール301と、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定するための第二の決定モジュール302と、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得るためのコーディングモジュール303と、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得るためのパケット化モジュール304と、を含む。
選択的に、前記コーディングモジュール303はさらに、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、
いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、
すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、に用いられる。
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、
いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、
すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、に用いられる。
選択的に、前記コーディングモジュール303はさらに、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、
いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることと、
すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、に用いられる。
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、
いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることと、
すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、に用いられる。
選択的に、前記第一の決定モジュール301はさらに、
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、
前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することと、
前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることと、に用いられる。
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、
前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することと、
前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることと、に用いられる。
本出願の実施例におけるオーディオコーディング装置は、移動端末であってもよく、端末における部材、集積回路、又はチップであってもよい。この装置は、移動電子機器であってもよく、非移動電子機器であってもよい。例示的には、移動電子機器は、携帯電話、タブレットパソコン、ノートパソコン、パームトップコンピュータ、車載電子機器、ウェアラブルデバイス、ウルトラモバイルパーソナルコンピュータ(Ultra-Mobile Personal Computer、UMPC)、ネットブック又はパーソナルデジタルアシスタント(Personal Digital Assistant、PDA)などであってもよく、非移動電子機器は、サーバ、ネットワーク接続型ストレージ(Network Attached Storage、NAS)、パーソナルコンピュータ(Personal Computer、PC)、テレビ(Television、TV)、預入支払機又はセルフサービス機などであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例におけるオーディオコーディング装置は、オペレーティングシステムを有する装置であってもよい。このオペレーティングシステムは、アンドロイド(登録商標)(Android)オペレーティングシステムであってもよく、iosオペレーティングシステムであってもよく、他の可能なオペレーティングシステムであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例によるオーディオコーディング装置は、図2の方法の実施例においてオーディオコーディング方法により実現される各プロセスを実現することができ、説明の繰り返しを回避するために、ここでこれ以上説明しない。
本出願の実施例は、オーディオパラメータの確率分布に対する計算に関するものではなく、オーディオパラメータの確率分布に基づいてオーディオ信号をコーディングする必要がなく、それによって大量の計算ステップを減少させ、さらにコーディング効率を向上させた。
選択的に、本出願の実施例は、オーディオデコーディング装置400をさらに提供し、図5に示すように、オーディオデコーディング装置400は、
オーディオ信号のオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得るための第一のデコーディングモジュール401と、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定するための第三の決定モジュール402と、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得るための第二のデコーディングモジュール403と、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得るための第三のデコーディングモジュール404と、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定するための第四の決定モジュール405と、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得るための第四のデコーディングモジュール406と、を含む。
オーディオ信号のオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得るための第一のデコーディングモジュール401と、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定するための第三の決定モジュール402と、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得るための第二のデコーディングモジュール403と、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得るための第三のデコーディングモジュール404と、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定するための第四の決定モジュール405と、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得るための第四のデコーディングモジュール406と、を含む。
選択的に、前記第二のデコーディングモジュール403はさらに、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、
前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる。
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することと、
前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる。
選択的に、前記第二のデコーディングモジュール403はさらに、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、
前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる。
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することと、
前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる。
本出願の実施例におけるオーディオデコーディング装置は、移動端末であってもよく、端末における部材、集積回路、又はチップであってもよい。この装置は、移動電子機器であってもよく、非移動電子機器であってもよい。例示的には、移動電子機器は、携帯電話、タブレットパソコン、ノートパソコン、パームトップコンピュータ、車載電子機器、ウェアラブルデバイス、ウルトラモバイルパーソナルコンピュータ(Ultra-Mobile Personal Computer、UMPC)、ネットブック又はパーソナルデジタルアシスタント(Personal Digital Assistant、PDA)などであってもよく、非移動電子機器は、サーバ、ネットワーク接続型ストレージ(Network Attached Storage、NAS)、パーソナルコンピュータ(Personal Computer、PC)、テレビ(Television、TV)、預入支払機又はセルフサービス機などであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例におけるオーディオデコーディング装置は、オペレーティングシステムを有する装置であってもよい。このオペレーティングシステムは、アンドロイド(登録商標)(Android)オペレーティングシステムであってもよく、iosオペレーティングシステムであってもよく、他の可能なオペレーティングシステムであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例によるオーディオデコーディング装置は、図3の方法の実施例においてオーディオデコーディング方法により実現される各プロセスを実現することができ、説明の繰り返しを回避するために、ここでこれ以上説明しない。
選択的に、本出願の実施例は、電子機器をさらに提供し、プロセッサ510と、メモリ509と、メモリ509に記憶されており、且つ前記プロセッサ510上で運行できるプログラム又は命令とを含み、このプログラム又は命令がプロセッサ510により実行される時、上記オーディオコーディング方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
このプログラム又は命令がプロセッサ510により実行される時、さらに上記オーディオデコーディング方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
注意すべきこととして、本出願の実施例における電子機器は、以上に記載の移動電子機器と非移動電子機器を含む。
図6は、本出願の実施例を実現する電子機器のハードウェア構造概略図である。
この電子機器500は、無線周波数ユニット501、ネットワークモジュール502、オーディオ出力ユニット505、入力ユニット504、センサ505、表示ユニット506、ユーザ入力ユニット507、インターフェースユニット508、メモリ509、及びプロセッサ510などの部材を含むが、それらに限らない。
当業者であれば理解できるように、電子機器500は、各部材に給電する電源(例えば、電池)をさらに含んでもよく、電源は、電源管理システムによってプロセッサ510にロジック的に接続されてもよく、それにより電源管理システムによって充放電管理及び消費電力管理などの機能を実現することができる。図6に示す電子機器構造は、電子機器に対する限定を構成せず、電子機器は、図示された部材の数よりも多く又は少ない部材、又はいくつかの部材の組み合わせ、又は異なる部材の配置を含んでもよく、ここでこれ以上説明しない。
ここで、プロセッサ510は、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定することと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得ることと、に用いられる。
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定することと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得ることと、に用いられる。
本出願の実施例では、オーディオパラメータの確率分布に対する計算に関するものではなく、オーディオパラメータの確率分布に基づいてオーディオ信号をコーディングする必要がなく、それによって大量の計算ステップを減少させ、さらにコーディング効率を向上させた。
前記プロセッサ510はさらに、オーディオ信号に対応するオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得ることと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定することと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得ることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定することと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得ることと、に用いられる。
前記第一のビットストリームに対応する数値を第一のパラメータとして決定することと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得ることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定することと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得ることと、に用いられる。
本出願の実施例は、可読記憶媒体をさらに提供し、前記可読記憶媒体は、非揮発性であってもよく、揮発性であってもよく、前記可読記憶媒体上にはプログラム又は命令が記憶されており、このプログラム又は命令がプロセッサにより実行される時、上記オーディオコーディング方法の実施例の各プロセスを実現し、又は、上記オーディオデコーディング方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
ここで、前記プロセッサは、上記実施例に記載の電子機器におけるプロセッサである。前記可読記憶媒体は、コンピュータ可読記憶媒体、例えばコンピュータリードオンリーメモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク又は光ディスクなどを含む。
本出願の実施例は、チップをさらに提供し、前記チップは、プロセッサと通信インターフェースとを含み、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、上記オーディオコーディング方法の実施例の各プロセスを実現し、又は、上記オーディオデコーディング方法の実施例の各プロセスを実現するために用いられ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
理解すべきこととして、本出願の実施例に言及されたチップは、システムレベルチップ、システムチップ、チップシステム又はシステムオンチップなどと呼ばれてもよい。
本出願の実施例は、コンピュータプログラム製品をさらに提供し、ここで、前記コンピュータプログラム製品は、非一時的可読記憶媒体に記憶されており、前記コンピュータプログラム製品は、少なくとも一つのプロセッサにより実行されて、上記オーディオデコーディング方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
説明すべきこととして、本明細書では、用語である「含む」、「包含」又はその他の任意の変形は、非排他的な「含む」を意図的にカバーするものであり、それによって一連の要素を含むプロセス、方法、物品又は装置は、それらの要素を含むだけではなく、明確にリストアップされていない他の要素も含み、又はこのようなプロセス、方法、物品又は装置に固有の要素も含む。それ以上の制限がない場合に、「……を1つ含む」という文章で限定された要素について、この要素を含むプロセス、方法、物品又は装置には他の同じ要素も存在することが排除されるものではない。なお、指摘すべきこととして、本出願の実施の形態における方法と装置の範囲は、図示又は討論された順序で機能を実行することに限らず、関わる機能に基づいて基本的に同時である方式又は逆の順序で機能を実行することを含んでもよく、例えば記述されたものとは異なる手順で記述された方法を実行することができるとともに、様々なステップを追加、省略又は組み合わせることができる。また、いくつかの例を参照して記述された特徴は、他の例で組み合わせられることができる。
以上の実施の形態の記述によって、当業者であればはっきりと分かるように上記実施例の方法は、ソフトウェアと必要な汎用ハードウェアプラットフォームの形態によって実現されることができる。無論、ハードウェアによって実現されてもよいが、多くの場合、前者は、より好適な実施の形態である。このような理解を踏まえて、本出願の技術案は、実質には又は従来の技術に寄与した部分がソフトウェア製品の形式によって具現化されてもよい。このコンピュータソフトウェア製品は、一つの記憶媒体(例えばROM/RAM、磁気ディスク、光ディスク)に記憶され、一台の端末(携帯電話、コンピュータ、サーバ、エアコン、又はネットワーク機器などであってもよい)に本出願の各実施例に記載の方法を実行させるための若干の命令を含む。
以上は、図面を結び付けながら、本出願の実施例を記述したが、本出願は、上記の具体的な実施の形態に限らない。上記の具体的な実施の形態は、例示的なものに過ぎず、制限性のあるものではない。当業者は、本出願の示唆で、本出願の趣旨と特許請求の範囲から逸脱しない限り、多くの形式を行うこともでき、いずれも本出願の保護範囲に属する。
Claims (19)
- オーディオコーディング方法であって、
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定することと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得ることと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである、オーディオコーディング方法。 - 前記コーディング次数の数は、Kであり、Kが1に等しい場合、前記の、前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることは、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、
すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、を含む、請求項1に記載の方法。 - 前記コーディング次数の数は、Kであり、Kが1よりも大きい場合、前記第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、前記第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームであり、前記の、前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得ることは、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルが前記コーディング次数と1対1で対応し、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることであって、前記ターゲットコーディング値が、前記K個のコーディングテーブルに基づいて検索して得られたK個のコーディング値のうちのコード長が最も小さいコーディング値であることと、
すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、を含む、請求項1に記載の方法。 - 前記の、コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定することは、
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、
前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することであって、前記第一のターゲット数値が、最も順位の高い第二のパラメータと前記第一のパラメータに基づいて生成されており、各前記配列が、隣接する2つの第二のパラメータを含むことと、
前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることであって、各前記第二のターゲット数値が、対応する配列における隣接する2つの第二のパラメータに基づいて生成され、前記第一のターゲット数値が、前記コーディングすべきシーケンスにおいて最も順位が高いことと、を含む、請求項1から3のいずれか1項に記載の方法。 - オーディオデコーディング方法であって、
オーディオ信号に対応するオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得ることであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られることと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定することと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られることと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得ることと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定することと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得ることと、を含む、オーディオデコーディング方法。 - 前記コーディング次数の数は、Kであり、Kが1に等しい場合、前記の、予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることは、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む、請求項5に記載の方法。 - 前記コーディング次数の数は、Kであり、Kが1よりも大きい場合、前記第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、前記第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームであり、前記の、予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得ることは、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルが前記コーディング次数と1対1で対応し、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、を含む、請求項5に記載の方法。 - オーディオコーディング装置であって、
コーディングすべきオーディオ信号のオーディオパラメータに基づいてコーディングすべきシーケンスと第一のビットストリームを決定するための第一の決定モジュールであって、前記オーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られており、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第一の決定モジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号を決定するための第二の決定モジュールと、
前記コード番号と予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づき、前記コーディングすべきシーケンスをコーディングして第二のビットストリームを得るためのコーディングモジュールと、
前記第一のビットストリーム、前記第二のビットストリームと第三のビットストリームを並び替えてパケット化し、オーディオコーディングビットストリームを得るためのパケット化モジュールと、を含み、
ここで、前記第三のビットストリームは、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づいて得られたコーディングビットストリームである、オーディオコーディング装置。 - 前記コーディング次数の数は、Kであり、Kが1に等しい場合、前記コーディングモジュールはさらに、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
いずれか一つのコード番号に対して、前記コーディングテーブルで検索して前記コード番号に対応するコーディング値を得ることと、
すべてのコーディング値を並び替えてパケット化し、前記第二のビットストリームを得ることと、に用いられる、請求項8に記載の装置。 - 前記コーディング次数の数は、Kであり、Kが1よりも大きい場合、前記第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、前記第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームであり、前記コーディングモジュールはさらに、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルが前記コーディング次数と1対1で対応し、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
いずれか一つのコード番号に対して、K個のコーディングテーブルで検索して前記コード番号に対応するターゲットコーディング値を得ることであって、前記ターゲットコーディング値が、前記K個のコーディングテーブルに基づいて検索して得られたK個のコーディング値のうちのコード長が最も小さいコーディング値であることと、
すべてのターゲットコーディング値を並び替えてパケット化し、前記第一のサブビットストリームを得ることと、に用いられる、請求項8に記載の装置。 - 前記コーディング次数の数は、Kであり、Kが1よりも大きい場合、前記第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、前記第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームであり、前記第一の決定モジュールはさらに、
前記第一のパラメータに対応する二進数を並び替えてパケット化し、前記第一のビットストリームを得ることと、
前記N個の第二のパラメータの並び替えと前記第一のパラメータに基づき、第一のターゲット数値とN-1個の配列を決定することであって、前記第一のターゲット数値が、最も順位の高い第二のパラメータと前記第一のパラメータに基づいて生成されており、各前記配列が、隣接する2つの第二のパラメータを含むことと、
前記第一のターゲット数値とN-1個の第二のターゲット数値を並び替えてパケット化し、前記コーディングすべきシーケンスを得ることであって、各前記第二のターゲット数値が、対応する配列における隣接する2つの第二のパラメータに基づいて生成され、前記第一のターゲット数値が、前記コーディングすべきシーケンスにおいて最も順位が高いことと、に用いられる、請求項8から10のいずれか1項に記載の装置。 - オーディオデコーディング装置であって、
オーディオ信号のオーディオコーディングビットストリームをデコーディングし、第一のビットストリーム、第二のビットストリームと第三のビットストリームを得るための第一のデコーディングモジュールであって、前記オーディオ信号のオーディオパラメータが、第一のパラメータと、N個の第二のパラメータとを含み、Nが、正整数であり、前記第一のビットストリームが、前記第一のパラメータに基づいてコーディングされて得られる第一のデコーディングモジュールと、
前記第一のビットストリームに対応する数値を第一のパラメータとして決定するための第三の決定モジュールと、
予め設定されるコーディング次数に対応する予め設定されるコーディングテーブルに基づいて前記第二のビットストリームにおける各コーディング値をデコーディングし、コーディングすべきシーケンスにおける各エレメントに対応するコード番号を得るための第二のデコーディングモジュールであって、前記コーディングすべきシーケンスが、前記第一のパラメータと前記N個の第二のパラメータに基づいてコーディングされて得られる第二のデコーディングモジュールと、
前記第三のビットストリームをデコーディングし、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係を得るための第三のデコーディングモジュールと、
前記コーディングすべきシーケンスにおける各エレメントに対応するコード番号と、前記コーディングすべきシーケンスにおける各エレメントと第一の予め設定される値との大きさ関係に基づき、コーディングすべきシーケンスを決定するための第四の決定モジュールと、
前記第一のパラメータに基づいて前記コーディングすべきシーケンスをデコーディングし、N個の第二のパラメータを得るための第四のデコーディングモジュールと、を含む、オーディオデコーディング装置。 - 前記コーディング次数の数は、Kであり、Kが1に等しい場合、前記第二のデコーディングモジュールはさらに、
前記コーディング次数に対応する予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
前記第二のビットストリームにおけるいずれか一つのコーディング値に対して、前記コーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる、請求項12に記載の装置。 - 前記コーディング次数の数は、Kであり、Kが1よりも大きい場合、前記第二のビットストリームは、第一のサブビットストリームと、第二のサブビットストリームとを含み、前記第二のサブビットストリームは、K個のコーディング次数に対応するコーディングビットストリームであり、前記第二のデコーディングモジュールはさらに、
K個のコーディング次数に対応するK個の予め設定されるコーディングテーブルを決定することであって、前記コーディングテーブルが前記コーディング次数と1対1で対応し、前記コーディングテーブルがコード番号とコーディング値とのマッピング関係を含むことと、
前記第一のサブビットストリームにおけるいずれか一つのコーディング値に対して、K個のコーディングテーブルで検索して得られた前記コーディング値に対応するコード番号を前記コーディングすべきシーケンスにおいて前記コーディング値に対応するエレメントのコード番号として決定することと、に用いられる、請求項12に記載の装置。 - プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるプログラム又は命令と、を含む電子機器であって、前記プログラム又は命令が前記プロセッサにより実行される時、請求項1から4のいずれか1項に記載の方法のステップを実現し、又は、請求項5から7のいずれか1項に記載の方法のステップを実現する、電子機器。
- プログラム又は命令が記憶されている可読記憶媒体であって、前記プログラム又は命令がプロセッサにより実行される時、請求項1から4のいずれか1項に記載の方法のステップを実現し、又は、請求項5から7のいずれか1項に記載の方法のステップを実現する、可読記憶媒体。
- プロセッサと通信インターフェースとを含むチップであって、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、請求項1から4のいずれか1項に記載の方法のステップを実現し、又は請求項5から7のいずれか1項に記載の方法のステップを実現するために用いられる、チップ。
- コンピュータプログラム製品であって、前記コンピュータプログラム製品は、非一時的可読記憶媒体に記憶されており、前記コンピュータプログラム製品は、少なくとも一つのプロセッサにより実行されて、請求項1から4のいずれか1項に記載の方法のステップを実現し、又は請求項5から7のいずれか1項に記載の方法のステップを実現する、コンピュータプログラム製品。
- 請求項1から4のいずれか1項に記載の方法のステップを実行し、又は、請求項5から7のいずれか1項に記載の方法のステップを実行するように構成される、通信機器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080645.0 | 2021-01-21 | ||
CN202110080645.0A CN112885364B (zh) | 2021-01-21 | 2021-01-21 | 音频编码方法和解码方法、音频编码装置和解码装置 |
PCT/CN2022/071961 WO2022156601A1 (zh) | 2021-01-21 | 2022-01-14 | 音频编码方法和解码方法、音频编码装置和解码装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024503032A true JP2024503032A (ja) | 2024-01-24 |
Family
ID=76051419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023541765A Pending JP2024503032A (ja) | 2021-01-21 | 2022-01-14 | オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230368800A1 (ja) |
EP (1) | EP4261824A4 (ja) |
JP (1) | JP2024503032A (ja) |
KR (1) | KR20230128349A (ja) |
CN (1) | CN112885364B (ja) |
WO (1) | WO2022156601A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112885364B (zh) * | 2021-01-21 | 2023-10-13 | 维沃移动通信有限公司 | 音频编码方法和解码方法、音频编码装置和解码装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
US20100292986A1 (en) * | 2007-03-16 | 2010-11-18 | Nokia Corporation | encoder |
CN101685637B (zh) * | 2008-09-27 | 2012-07-25 | 华为技术有限公司 | 音频编码方法及装置和音频解码方法及装置 |
CN104103276B (zh) * | 2013-04-12 | 2017-04-12 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN105225671B (zh) * | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
CN110739000B (zh) * | 2019-10-14 | 2022-02-01 | 武汉大学 | 一种适应于个性化交互系统的音频对象编码方法 |
CN112885364B (zh) * | 2021-01-21 | 2023-10-13 | 维沃移动通信有限公司 | 音频编码方法和解码方法、音频编码装置和解码装置 |
-
2021
- 2021-01-21 CN CN202110080645.0A patent/CN112885364B/zh active Active
-
2022
- 2022-01-14 JP JP2023541765A patent/JP2024503032A/ja active Pending
- 2022-01-14 EP EP22742080.9A patent/EP4261824A4/en active Pending
- 2022-01-14 KR KR1020237026340A patent/KR20230128349A/ko active Search and Examination
- 2022-01-14 WO PCT/CN2022/071961 patent/WO2022156601A1/zh active Application Filing
-
2023
- 2023-07-13 US US18/351,634 patent/US20230368800A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4261824A1 (en) | 2023-10-18 |
CN112885364B (zh) | 2023-10-13 |
WO2022156601A1 (zh) | 2022-07-28 |
CN112885364A (zh) | 2021-06-01 |
EP4261824A4 (en) | 2024-05-29 |
US20230368800A1 (en) | 2023-11-16 |
KR20230128349A (ko) | 2023-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8908978B2 (en) | Signature representation of data having high dimensionality | |
EP1734511A2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
US20110181448A1 (en) | Lossless compression | |
US20200279572A1 (en) | Method for processing speech/audio signal and apparatus | |
EP4082119A1 (en) | Systems and methods of data compression | |
JP2024503032A (ja) | オーディオコーディング方法とデコーディング方法、オーディオコーディング装置とデコーディング装置 | |
CN113852379A (zh) | 一种数据编码方法、系统、设备及计算机可读存储介质 | |
CN108880559B (zh) | 数据压缩方法、数据解压缩方法、压缩设备及解压缩设备 | |
CN109981108A (zh) | 数据压缩方法、解压缩方法、装置及设备 | |
Chaudhary et al. | Two‐stage logarithmic converter with reduced memory requirements | |
US8601039B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
Malach et al. | Hardware-based real-time deep neural network lossless weights compression | |
CN116566397A (zh) | 编码、解码方法、编码器、解码器、电子设备及存储介质 | |
CN116418348A (zh) | 一种数据压缩方法、装置、设备及存储介质 | |
US10613797B2 (en) | Storage infrastructure that employs a low complexity encoder | |
CN113282456A (zh) | 一种数据处理方法和装置 | |
CN107026652B (zh) | 基于分区的正整数序列压缩方法 | |
CN113141508A (zh) | 算术编码器及实现算术编码的方法和图像编码方法 | |
Kozhemiakina et al. | Means and results of efficiency analysis for data compression methods applied to typical multimedia data | |
Perić et al. | Design of forward adaptive hybrid quantiser with Golomb–Rice code for compression of Gaussian source | |
CN113450807B (zh) | 一种语音数字信号的压缩方法及装置 | |
CN117651081A (zh) | 一种数据传输方法、装置、设备及存储介质 | |
WO2015102432A1 (en) | Method and apparatus for performing an arithmetic coding for data symbols | |
CN116567239A (zh) | 编解码方法、装置、编解码器、设备及介质 | |
CN115510010A (zh) | 压缩雪花id集合的数据结构、数据压缩方法和查找方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230710 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230710 |