JP4257862B2 - 音声復号化装置 - Google Patents
音声復号化装置 Download PDFInfo
- Publication number
- JP4257862B2 JP4257862B2 JP2006275276A JP2006275276A JP4257862B2 JP 4257862 B2 JP4257862 B2 JP 4257862B2 JP 2006275276 A JP2006275276 A JP 2006275276A JP 2006275276 A JP2006275276 A JP 2006275276A JP 4257862 B2 JP4257862 B2 JP 4257862B2
- Authority
- JP
- Japan
- Prior art keywords
- data processing
- unit
- data
- audio
- decoding apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000011084 recovery Methods 0.000 claims description 40
- 230000004807 localization Effects 0.000 claims description 20
- 230000007704 transition Effects 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 17
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
Digital TV Group, "Digital Terrestrial Television Requirements for Interoperability Issue 4.0"(4.5節 Audio description), 11 January 2005
第1の音声データを符号化した符号データを含んだ第1のストリームデータと、第2の音声データを符号化した符号データとともに前記第1の音声データ及び前記第2の音声データの2つの音声データに対してデータ加工をするためのデータ加工パラメータを含んだ第2のストリームデータとを復号化する音声復号化装置であって、
前記第1のストリームデータ及び前記第2のストリームデータを復号化して、前記2つの音声データ及び前記データ加工パラメータを生成する音声デコード部と、
前記データ加工パラメータに相当するパラメータが設定される外部設定部と、
前記2つの音声データに対してデータ加工をする音声データ加工部とを備え、
前記音声データ加工部は、前記第2のストリームデータに含まれたデータ加工パラメータが不正な場合に、前記2つの音声データのうちの少なくとも一方に対しては、前記外部設定部に設定されているパラメータを用いてデータ加工を行い、前記第2のストリームデータに含まれたデータ加工パラメータが適正な場合に、前記音声デコード部が生成したデータ加工パラメータを用いてデータ加工を行なうように構成されていることを特徴とする。
図1は、本発明の実施形態1に係る音声復号化装置100の構成を示すブロック図である。音声復号化装置100は、図1に示すように、音声デコード部101、外部設定部102、音声データ加工部103、及び合成部104を備えている。
音声復号化装置100では、エラー検出部が、第2のストリームデータS102内のフェード値及びパン値の何れかが不正であることを検出すると、不正なパラメータに対応する外部設定部102内のフラグの値を、パラメータが不正であることを示す値にセットする。
図3は、本発明の実施形態1の変形例1に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、音像定位の制御の際に、常に第2の復号化データS104内のパン値を参照するように、パン制御部103bを構成したものである。例えば、モノラル放送が中心の地域などで使用する場合などには、音像定位の制御が不要な場合が多い。そのため、モノラル放送が中心の地域向けの装置では、本変形例のように、パン制御部103bを構成してもよい。なお、本変形例においても、第2のストリームデータS102内のフェード値が不正の場合には、外部設定部102内に設定されている値が用いられて、フェード制御が行なわれる。
図4は、本発明の実施形態1の変形例2に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、音量の制御の際に、常に第2の復号化データS104内のフェード値を参照するように、フェード制御部103aを構成したものである。なお、 本変形例においても、第2のストリームデータS102内のパン値が不正の場合には、外部設定部102内に設定されている値が用いられて、パン制御が行なわれる。
図5は、本発明の実施形態2に係る音声復号化装置200の構成を示すブロック図である。音声復号化装置200は、同図に示すように、音声復号化装置100にパラメータ制御部201を追加して構成したものである。
図6は、本発明の実施形態3に係る音声復号化装置300の構成を示すブロック図である。音声復号化装置300は、同図に示すように、音声復号化装置100の合成部104を合成部301に置き換え、さらに合成選択部302を追加して構成したものである。
図7は、本発明の実施形態4に係る音声復号化装置400の構成を示すブロック図である。音声復号化装置400は、同図に示すように、音声復号化装置100において、音声データ加工部103の代わりに音声データ加工部403を設け、さらに、エラー復帰開始時間制御部401とエラー復帰移行時間制御部402とを追加して構成したものである。
音声復号化装置400では、第2の復号化データS104内のフェード値及びパン値の少なくとも一方のエラー状態が所定時間以上継続すると、エラー復帰開始時間制御部401は、フェード制御部403a及びパン制御部403bのうちのエラー復帰開始が必要である方に、エラー復帰開始を指示する。一方、エラー復帰移行時間制御部402は、フェード制御部403aとパン制御部403bとにエラー復帰移行時間を指示する。
図8は、本発明の実施形態4の変形例1に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、フェード制御についてのみ、エラー復帰のタイミングと、エラー復帰移行時間とが制御されている。パン制御のエラー復帰開始タイミングは、音声復号化装置100等と同様に、外部設定部102にセットされているフラグに基づいて制御され、エラー復帰にかける時間(エラー復帰移行時間)はデフォルト値である。
図9は、本発明の実施形態4の変形例2に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、パン制御についてのみ、エラー復帰のタイミングと、エラー復帰移行時間とが制御されている。フェード制御のエラー復帰開始タイミングは、音声復号化装置100等と同様に、外部設定部102にセットされているフラグに基づいて制御され、エラー復帰にかける時間(エラー復帰移行時間)はデフォルト値である。
101 音声デコード部
102 外部設定部
103 音声データ加工部
103a フェード制御部
103b パン制御部
104 合成部
200 音声復号化装置
201 パラメータ制御部
300 音声復号化装置
301 合成部
302 合成選択部
400 音声復号化装置
401 エラー復帰開始時間制御部
402 エラー復帰移行時間制御部
403 音声データ加工部
403a フェード制御部
403b パン制御部
S101 第1のストリームデータ
S102 第2のストリームデータ
S103 第1の復号化データ
S104 第2の復号化データ
Claims (9)
- 第1の音声データを符号化した符号データを含んだ第1のストリームデータと、第2の音声データを符号化した符号データとともに前記第1の音声データ及び前記第2の音声データの2つの音声データに対してデータ加工をするためのデータ加工パラメータを含んだ第2のストリームデータとを復号化する音声復号化装置であって、
前記第1のストリームデータ及び前記第2のストリームデータを復号化して、前記2つの音声データ及び前記データ加工パラメータを生成する音声デコード部と、
前記データ加工パラメータに相当するパラメータが設定される外部設定部と、
前記2つの音声データに対してデータ加工をする音声データ加工部とを備え、
前記音声データ加工部は、前記第2のストリームデータに含まれたデータ加工パラメータが不正な場合に、前記2つの音声データのうちの少なくとも一方に対しては、前記外部設定部に設定されているパラメータを用いてデータ加工を行い、前記第2のストリームデータに含まれたデータ加工パラメータが適正な場合に、前記音声デコード部が生成したデータ加工パラメータを用いてデータ加工を行なうように構成されていることを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
前記データ加工パラメータは、前記第1の音声データの音量を低下させる量を示すパラメータであることを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
前記データ加工パラメータは、前記第2の音声データの音像定位を制御するパラメータであることを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、さらに、
前記音声データ加工部が加工した2つの音声データを合成する合成部と、
前記合成部が出力した音声データの音量が、所定範囲に収まるように、前記外部設定部にパラメータを設定するパラメータ制御部と、
をさらに備えたことを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
前記音声データ加工部が加工した第1の音声データを出力するか、前記音声データ加工部が加工した2つの音声データを合成した音声データを出力するかが、与えられた制御信号に応じて切り替わる合成部をさらに備えたことを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
さらに、前記音声デコード部が生成したデータ加工パラメータが不正である時間が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
さらに、前記音声デコード部が生成したデータ加工パラメータが不正であった回数が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。 - 請求項1の音声復号化装置であって、
前記音声デコード部が生成したデータ加工パラメータが不正である時間が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示する第1のエラー復帰指示方法、及び前記音声デコード部が生成したデータ加工パラメータが不正であった回数が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示する第2のエラー復帰指示方法のうちの何れかのエラー復帰指示方法を選択し、選択したエラー復帰指示方法によって、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。 - 請求項6、請求項7、及び請求項8のうちの何れか1項の音声復号化装置であって、
さらに、データ加工を開始してから完了するまでの時間を前記音声データ加工部に指示するエラー復帰移行時間制御部を備え、
前記音声データ加工部は、前記エラー復帰移行時間制御部の指示に応じた時間で、データ加工を完了するように構成されていることを特徴とする音声復号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006275276A JP4257862B2 (ja) | 2006-10-06 | 2006-10-06 | 音声復号化装置 |
EP07111021.7A EP1909538B1 (en) | 2006-10-06 | 2007-06-26 | Audio decoding device |
US11/822,907 US8090585B2 (en) | 2006-10-06 | 2007-07-11 | Audio decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006275276A JP4257862B2 (ja) | 2006-10-06 | 2006-10-06 | 音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008096508A JP2008096508A (ja) | 2008-04-24 |
JP4257862B2 true JP4257862B2 (ja) | 2009-04-22 |
Family
ID=38542036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006275276A Expired - Fee Related JP4257862B2 (ja) | 2006-10-06 | 2006-10-06 | 音声復号化装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8090585B2 (ja) |
EP (1) | EP1909538B1 (ja) |
JP (1) | JP4257862B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009157213A1 (ja) * | 2008-06-27 | 2009-12-30 | パナソニック株式会社 | 音響信号復号装置および音響信号復号装置におけるバランス調整方法 |
JP5468020B2 (ja) * | 2009-01-13 | 2014-04-09 | パナソニック株式会社 | 音響信号復号装置及びバランス調整方法 |
US9043444B2 (en) * | 2011-05-25 | 2015-05-26 | Google Inc. | Using an audio stream to identify metadata associated with a currently playing television program |
ES2909532T3 (es) * | 2011-07-01 | 2022-05-06 | Dolby Laboratories Licensing Corp | Aparato y método para renderizar objetos de audio |
US10091581B2 (en) * | 2015-07-30 | 2018-10-02 | Roku, Inc. | Audio preferences for media content players |
WO2024004651A1 (ja) * | 2022-06-29 | 2024-01-04 | ソニーグループ株式会社 | 音声再生装置、音声再生方法及び音声再生プログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05110528A (ja) | 1991-10-18 | 1993-04-30 | Nec Ic Microcomput Syst Ltd | 車載オーデイオ装置およびその音場制御方法 |
US5852800A (en) * | 1995-10-20 | 1998-12-22 | Liquid Audio, Inc. | Method and apparatus for user controlled modulation and mixing of digitally stored compressed data |
JP3596841B2 (ja) * | 1997-01-24 | 2004-12-02 | 株式会社ルネサステクノロジ | 受信データ伸長装置 |
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US6804565B2 (en) * | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
JP4398323B2 (ja) * | 2004-08-09 | 2010-01-13 | ユニデン株式会社 | デジタル無線通信装置 |
WO2006088145A1 (ja) | 2005-02-18 | 2006-08-24 | Matsushita Electric Industrial Co., Ltd. | ストリーム再生装置、ストリーム供給装置 |
-
2006
- 2006-10-06 JP JP2006275276A patent/JP4257862B2/ja not_active Expired - Fee Related
-
2007
- 2007-06-26 EP EP07111021.7A patent/EP1909538B1/en not_active Expired - Fee Related
- 2007-07-11 US US11/822,907 patent/US8090585B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008096508A (ja) | 2008-04-24 |
EP1909538B1 (en) | 2013-08-07 |
EP1909538A3 (en) | 2010-04-07 |
US20080086312A1 (en) | 2008-04-10 |
US8090585B2 (en) | 2012-01-03 |
EP1909538A2 (en) | 2008-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4257862B2 (ja) | 音声復号化装置 | |
KR101538623B1 (ko) | 두 개의 입력 오디오 신호 믹싱 방법, 및 이를 실행하기 위한 디코더 및 컴퓨터 판독가능한 매체, 및 입력 오디오 신호 믹싱 디바이스 | |
US8160277B2 (en) | Method for outputting audio signals and audio decoder | |
JP5328637B2 (ja) | マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路 | |
JP2006019903A (ja) | 音響装置および再生モード設定方法 | |
JP2009094796A (ja) | テレビジョン受信機 | |
JP2014072678A (ja) | 受信装置、及び、受信制御方法 | |
JP4507360B2 (ja) | デジタル放送受信装置 | |
JP2001245237A (ja) | 放送受信装置 | |
JP2008005255A (ja) | デジタル放送受信機 | |
JP2010152281A (ja) | 音声再生装置 | |
JP2008141463A (ja) | オンスクリーン表示装置及びテレビジョン受像機 | |
JP2010258776A (ja) | 音声信号処理装置 | |
JP6099250B2 (ja) | 放送送出装置、及び受信機 | |
KR101516968B1 (ko) | 오디오 신호 처리 방법 및 이를 이용한 방송 출력 장치 | |
JP2011050079A (ja) | 放送受信装置およびプログラム | |
JP4385710B2 (ja) | 音声信号処理装置及び音声信号処理方法 | |
JP6440314B2 (ja) | 受信装置、受信方法、及びプログラム | |
JP2007096802A (ja) | デジタル放送受信装置および制御方法 | |
JP2008294497A (ja) | テレビジョン受信装置 | |
JP2021019308A (ja) | ラジオ受信装置及びラジオ受信プログラム | |
JP2005217958A (ja) | 放送受信装置 | |
JP2011055411A (ja) | サラウンド放送番組視聴システム、端末、サラウンド放送番組の音声出力方法、及びプログラム | |
JP2005151308A (ja) | 受信装置 | |
JP2007234146A (ja) | オーディオ機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080321 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4257862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120213 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130213 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130213 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140213 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |