JP6856644B2 - ビデオ情報を用いたオーディオエンコーディング - Google Patents
ビデオ情報を用いたオーディオエンコーディング Download PDFInfo
- Publication number
- JP6856644B2 JP6856644B2 JP2018527786A JP2018527786A JP6856644B2 JP 6856644 B2 JP6856644 B2 JP 6856644B2 JP 2018527786 A JP2018527786 A JP 2018527786A JP 2018527786 A JP2018527786 A JP 2018527786A JP 6856644 B2 JP6856644 B2 JP 6856644B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- audio encoder
- video data
- data
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 33
- 238000013139 quantization Methods 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 9
- 238000013144 data compression Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 5
- 239000004065 semiconductor Substances 0.000 claims description 5
- 239000013598 vector Substances 0.000 description 12
- 238000005070 sampling Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 241000282374 Puma concolor Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/802—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8211—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a sound signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は、2015年12月1日に出願された米国特許出願第14/955,549号の優先権を主張するものであり、この全ての内容は参照することにより本明細書に援用される。
ここで、sgn(x)は符号(sign)関数(符号(signum)関数としても知られる)であり、Δは量子化ステップサイズである。ステップサイズΔは、例えば、線形量子化ステージ130に割り当てられるビット数を減少又は増加させることによって、制御信号160に応じて変更することができる。また、出力110は、ベクトル量子化ステージ135に送られる。ベクトル量子化は、プロトタイプベクトルの分布によって確率密度関数のモデル化を可能にする信号処理からの量子化技術である。これは、例えばサンプリングされたオーディオ信号等のポイント(ベクトル)の大きなセットを、これらに最も近いほぼ同数のポイントを有するグループに分けることによって行われる。各グループは、k平均法及び他のクラスタリングアルゴリズムと同様に、その重心点(centroid point)によって表される。ベクトル量子化ステージ135の出力140は、出力115に関連付けられる。最後に、ハフマン符号ステージ145を用いて、線形スケール量子化ステージ130の出力を選択的にエンコードし、さらに、オーディオデータを所望の出力115に圧縮することができる。
例えばシーン1からシーン2へのビデオシーンの変化の間、オーディオフレーム75は同時に変化する可能性があり、その結果、以前のオーディオフレーム75を参照として使用することは非効率的である。上記の背景技術の欄で述べたように、既存のオーディオエンコーダのモード選択は、ビデオシーンの変化の影響を受けない。しかしながら、開示された実施形態では、ビデオエンコーダ40は、任意のシーンの変化をオーディオエンコーダモードセレクタ60に通知するために、ビデオ情報55を供給する。オーディオエンコーダモードセレクタ60は、他のパラメータと比較した後に、制御信号160,165を介して、フレーム間(インターフレーム)予測技術(例えば、差分パルス符号変調又は線スペクトル対予測)を実行するために例えば適応予測ステージ120を使用しない等のより効率的なモードでオーディオフレーム75をエンコードするように、オーディオエンコーダ80に命令することができる。オーディオエンコーダモードセレクタ60によって変更され得る他のパラメータは、オーディオエンコーダのグローバルビットレート、及び/又は、線形スケール量子化ステージ130及びベクトル量子化ステージ135によって使用される量子化パラメータを含み、エンコーディングのより優れた効率及び/又は品質を実現する。
上記の背景技術の欄で述べたように、既存のオーディオエンコーダは、オーディオエンコーディングモードを調整するために、例えば人間の対話の存在等のビデオシーンの内容を使用しない。しかしながら、開示された実施形態では、ビデオエンコーダ40は、シーン2等の対話シーンが検出されたときに、オーディオエンコーダモードセレクタ60に通知するためにビデオ情報55を供給する。オーディオエンコーダモードセレクタ60は、イベントを他の決定バラメータと比較した後に、制御信号160,165を介して、より高いビットレート及び/又はフィルタ設定(例えば、QMFバンク105の設定)の変更を使用してエンコードし、オーディオ信号の周波数を増減させるのではなくオーディオ信号の範囲を広げるように、オーディオエンコーダ80に命令することができる。これにより、品質及び/又は効率がより優れたオーディオ信号の再構成が可能となる。
Claims (24)
- オーディオデータをエンコードするように構成されたオーディオエンコーダ(80)と、
前記オーディオデータに関連するビデオデータを繰り返し分析して、特定のオーディオエンコードモードを示唆する特性を探し、分析されたビデオデータに基づいて、前記オーディオエンコーダのエンコーディングモードを前記特定のオーディオエンコードモードに調整するように動作可能なオーディオエンコーダモードセレクタ(60)と、を備え、
前記オーディオエンコーダモードセレクタは、シーン変化に関して前記ビデオデータを分析するように動作可能である、
装置。 - 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、コンピュータ可読命令を有するコンピュータ可読記憶媒体を備える、請求項1の装置。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタを含む半導体チップ(200)を備える、請求項1の装置。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタを含む記録デバイス(15)を備える、請求項1の装置。
- 前記オーディオエンコーダモードセレクタは、人間の対話における変化に関して前記ビデオデータを分析するように動作可能である、請求項1の装置。
- 前記オーディオエンコーダは、前記オーディオエンコーダモードセレクタの前記エンコーディングモードの調整に対応するデータ圧縮パイプラインを備える、請求項1の装置。
- 前記データ圧縮パイプラインは、量子化ステージ、予測ステージ又はハフマン符号化ステージを含む、請求項6の装置。
- ビデオ及びオーディオを記録するための記録デバイスを備え、前記オーディオエンコーダ及び前記オーディオエンコーダモードセレクタは、前記記録デバイスの一部である、請求項1の装置。
- オーディオデータをエンコードする方法であって、
オーディオエンコーダ(80)を用いて前記オーディオデータをエンコードするステップと、
前記オーディオデータに関連するビデオデータを繰り返し分析して、特定のオーディオエンコードモードを示唆する特性を探すステップと、
前記オーディオデータに関連するビデオデータの分析に基づいて、前記オーディオエンコーダのオーディオエンコーディングモードを前記特定のオーディオエンコードモードに調整するステップであって、前記ビデオデータの分析は、シーン変化を認識するステップを含む、ステップと、を含む、
方法。 - ビデオデータを分析し、分析されたビデオデータに基づいて、前記オーディオエンコーダのエンコーディングモードを前記特定のオーディオエンコードモードに調整するように動作可能なオーディオエンコーダモードセレクタ(60)を用いて、前記ビデオデータを繰り返し分析するステップを含む、請求項9の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、コンピュータ可読命令を有するコンピュータ可読記憶媒体を備える、請求項9の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、半導体チップ(200)の一部を備える、請求項9の方法。
- 前記ビデオデータを分析するステップは、人間の対話における変化を認識するステップを含む、請求項9の方法。
- 前記オーディオエンコーダは、前記オーディオエンコーダモードセレクタの前記エンコーディングモードの調整に対応するデータ圧縮パイプラインを備える、請求項9の方法。
- 前記データ圧縮パイプラインは、量子化ステージ、予測ステージ又はハフマン符号化ステージを含む、請求項14の方法。
- オーディオデータをエンコードする方法であって、
記録デバイス(15)を用いて、ビデオ及びオーディオを記録し、ビデオデータ及びオーディオデータを生成するステップと、
オーディオエンコーダ(80)を用いて、前記オーディオデータをエンコードするステップと、
前記オーディオデータに関連するビデオデータを繰り返し分析して、特定のオーディオエンコードモードを示唆する特性を探すステップと、
前記ビデオデータの分析に基づいて、前記オーディオエンコーダのオーディオエンコーディングモードを前記特定のオーディオエンコードモードに調整するステップであって、前記ビデオデータの分析は、人間の対話における変化を認識するステップを含む、ステップと、を含む、
方法。 - ビデオデータを分析し、分析されたビデオデータに基づいて、前記オーディオエンコーダのエンコーディングモードを前記特定のオーディオエンコードモードに調整するように動作可能なオーディオエンコーダモードセレクタ(60)を用いて、前記ビデオデータを繰り返し分析するステップを含む、請求項16の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、コンピュータ可読命令を有するコンピュータ可読記憶媒体を備える、請求項16の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、半導体チップ(200)の一部を備える、請求項16の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、前記記録デバイス(15)の一部を備える、請求項16の方法。
- 前記ビデオデータを分析するステップは、シーン変化を認識するステップを含む、請求項16の方法。
- 方法を実行するためのコンピュータ可読命令を含むコンピュータ可読記憶媒体であって、
前記方法は、
オーディオエンコーダ(80)を用いてオーディオデータをエンコードするステップと、
前記オーディオデータに関連するビデオデータを繰り返し分析して、特定のオーディオエンコードモードを示唆する特性を探すステップと、
ビデオデータの分析に基づいて、前記オーディオエンコーダのオーディオエンコーディングモードを前記特定のオーディオエンコードモードに調整するステップであって、前記ビデオデータの分析は、人間の対話における変化を認識するステップを含む、ステップと、を含む、
コンピュータ可読記憶媒体。 - 記録デバイス(15)を用いて、ビデオ及びオーディオを記録し、前記ビデオデータ及び前記オーディオデータを生成するステップを含む、請求項9の方法。
- 前記オーディオエンコーダ及び/又は前記オーディオエンコーダモードセレクタは、記録デバイス(15)の一部を備える、請求項23の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/955,549 | 2015-12-01 | ||
US14/955,549 US10762911B2 (en) | 2015-12-01 | 2015-12-01 | Audio encoding using video information |
PCT/CA2016/051220 WO2017091887A1 (en) | 2015-12-01 | 2016-10-21 | Audio encoding using video information |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019504340A JP2019504340A (ja) | 2019-02-14 |
JP2019504340A5 JP2019504340A5 (ja) | 2019-11-28 |
JP6856644B2 true JP6856644B2 (ja) | 2021-04-07 |
Family
ID=58777722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018527786A Active JP6856644B2 (ja) | 2015-12-01 | 2016-10-21 | ビデオ情報を用いたオーディオエンコーディング |
Country Status (6)
Country | Link |
---|---|
US (1) | US10762911B2 (ja) |
EP (1) | EP3384491B1 (ja) |
JP (1) | JP6856644B2 (ja) |
KR (1) | KR102419514B1 (ja) |
CN (1) | CN108292506B (ja) |
WO (1) | WO2017091887A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165358A1 (en) * | 2014-06-30 | 2018-06-14 | Sony Corporation | Information processing apparatus and information processing method |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07202820A (ja) | 1993-12-28 | 1995-08-04 | Matsushita Electric Ind Co Ltd | ビットレート制御システム |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
KR20040103158A (ko) * | 2003-05-31 | 2004-12-08 | 주식회사 대우일렉트로닉스 | 돌비 프로로직 오디오 신호 출력 장치 |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP2008154132A (ja) * | 2006-12-20 | 2008-07-03 | Matsushita Electric Ind Co Ltd | 音声映像ストリーム圧縮装置及び音声映像記録装置 |
US8311120B2 (en) | 2006-12-22 | 2012-11-13 | Qualcomm Incorporated | Coding mode selection using information of other coding modes |
TWI344308B (en) * | 2007-08-09 | 2011-06-21 | Inventec Appliances Corp | Dynamic multimedia coding method for of cell phone |
JP5230164B2 (ja) * | 2007-10-18 | 2013-07-10 | 三洋電機株式会社 | 音声記録装置 |
US8780978B2 (en) | 2009-11-04 | 2014-07-15 | Qualcomm Incorporated | Controlling video encoding using audio information |
FR2999373B1 (fr) * | 2012-12-12 | 2018-04-06 | Harmonic Inc. | Procede d'adaptation dynamique du codage d'un flux audio et/ou video transmis a un dispositif |
US9338420B2 (en) * | 2013-02-15 | 2016-05-10 | Qualcomm Incorporated | Video analysis assisted generation of multi-channel audio data |
US9800905B2 (en) * | 2015-09-14 | 2017-10-24 | Comcast Cable Communications, Llc | Device based audio-format selection |
-
2015
- 2015-12-01 US US14/955,549 patent/US10762911B2/en active Active
-
2016
- 2016-10-21 JP JP2018527786A patent/JP6856644B2/ja active Active
- 2016-10-21 CN CN201680070050.4A patent/CN108292506B/zh active Active
- 2016-10-21 WO PCT/CA2016/051220 patent/WO2017091887A1/en active Application Filing
- 2016-10-21 EP EP16869432.1A patent/EP3384491B1/en active Active
- 2016-10-21 KR KR1020187013807A patent/KR102419514B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP3384491A4 (en) | 2019-04-10 |
EP3384491B1 (en) | 2023-06-21 |
CN108292506B (zh) | 2023-10-31 |
US20170154634A1 (en) | 2017-06-01 |
WO2017091887A1 (en) | 2017-06-08 |
KR20180088807A (ko) | 2018-08-07 |
CN108292506A (zh) | 2018-07-17 |
US10762911B2 (en) | 2020-09-01 |
EP3384491A1 (en) | 2018-10-10 |
KR102419514B1 (ko) | 2022-07-11 |
JP2019504340A (ja) | 2019-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7774205B2 (en) | Coding of sparse digital media spectral data | |
JP7260509B2 (ja) | スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP6438056B2 (ja) | 無損失符号化装置 | |
US7761290B2 (en) | Flexible frequency and time partitioning in perceptual transform coding of audio | |
EP2282310B1 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
KR100814673B1 (ko) | 오디오 부호화 | |
EP1960999B1 (en) | Method and apparatus encoding an audio signal | |
KR100840439B1 (ko) | 음성부호화장치 및 음성복호장치 | |
USRE46082E1 (en) | Method and apparatus for low bit rate encoding and decoding | |
US20060004566A1 (en) | Low-bitrate encoding/decoding method and system | |
US8457958B2 (en) | Audio transcoder using encoder-generated side information to transcode to target bit-rate | |
KR100813193B1 (ko) | 정보 신호의 양자화 방법 및 장치 | |
JP6856644B2 (ja) | ビデオ情報を用いたオーディオエンコーディング | |
KR101381602B1 (ko) | 계층적 부호화 및 복호화 방법 및 장치 | |
CN110709925B (zh) | 用于音频编码或解码的方法及装置 | |
JP2008046405A (ja) | 適応差分パルス符号変調方式の符号化方法及び復号化方法 | |
WO2008072524A1 (ja) | オーディオ信号符号化方法及び復号化方法 | |
Auristin et al. | New Ieee Standard For Advanced Audio Coding In Lossless Audio Compression: A Literature Review | |
JP6552986B2 (ja) | 音声符号化装置、方法及びプログラム | |
JP2005196029A (ja) | 符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200915 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6856644 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |