JP4257862B2 - 音声復号化装置 - Google Patents

音声復号化装置 Download PDF

Info

Publication number
JP4257862B2
JP4257862B2 JP2006275276A JP2006275276A JP4257862B2 JP 4257862 B2 JP4257862 B2 JP 4257862B2 JP 2006275276 A JP2006275276 A JP 2006275276A JP 2006275276 A JP2006275276 A JP 2006275276A JP 4257862 B2 JP4257862 B2 JP 4257862B2
Authority
JP
Japan
Prior art keywords
data processing
unit
data
audio
decoding apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006275276A
Other languages
English (en)
Other versions
JP2008096508A (ja
Inventor
英之 角野
直樹 進藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006275276A priority Critical patent/JP4257862B2/ja
Priority to EP07111021.7A priority patent/EP1909538B1/en
Priority to US11/822,907 priority patent/US8090585B2/en
Publication of JP2008096508A publication Critical patent/JP2008096508A/ja
Application granted granted Critical
Publication of JP4257862B2 publication Critical patent/JP4257862B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、符号化された音声データを含んだストリームデータを復号化する音声復号化装置に関するものである。
例えば、ヨーロッパなどのディジタルテレビ放送のなかには、主音声(ステレオ形式)が符号化されたストリームデータとともに、放送内容を解説する目的などに使用される副音声が符号化されたストリームデータを使用するものがある。
上記のディジタルテレビ放送を受信する装置は、これらのストリームデータを復号化して得た主音声データ(ステレオ形式)と副音声データとを合成してから出力する。その際、単に主音声データと副音声データとを合成すると、音量が必要以上に大きくなってしまい、聴取には不便である。そのため、合成後の音量が適切になるように、主音声データの音量を合成前にある程度落しておく必要がある。また、副音声データの音像定位を制御できると、聴取者の利便性がよい。
そのため、上記の副音声データのストリームデータは、主音声データや副音声データを加工して、主音声データと副音声データとの音量の大小関係を調整したり、副音声の音像定位を制御したりするためのパラメータを含んでおり、これらのストリームデータを復号化する音声復号化装置では、上記のパラメータを用いて、音量調整や音像定位を制御するようになっている(例えば非特許文献1を参照)。
Digital TV Group, "Digital Terrestrial Television Requirements for Interoperability Issue 4.0"(4.5節 Audio description), 11 January 2005
しかしながら、上記のパラメータは、受信条件によっては、不正な値に変わってしまう場合があり、このような場合には、正しく音量調整等ができない。
本発明は、上記の問題に着目してなされたものであり、ストリームデータが含んでいるデータ加工用のパラメータが不正な値であっても、適正に音量調整等のデータ加工ができるようにすることを目的としている。
前記の課題を解決するため、本発明の一態様は、
第1の音声データを符号化した符号データを含んだ第1のストリームデータと、第2の音声データを符号化した符号データとともに前記第1の音声データ及び前記第2の音声データの2つの音声データに対してデータ加工をするためのデータ加工パラメータを含んだ第2のストリームデータとを復号化する音声復号化装置であって、
前記第1のストリームデータ及び前記第2のストリームデータを復号化して、前記2つの音声データ及び前記データ加工パラメータを生成する音声デコード部と、
前記データ加工パラメータに相当するパラメータが設定される外部設定部と、
前記2つの音声データに対してデータ加工をする音声データ加工部とを備え、
前記音声データ加工部は、前記第2のストリームデータに含まれたデータ加工パラメータが不正な場合に、前記2つの音声データのうちの少なくとも一方に対しては、前記外部設定部に設定されているパラメータを用いてデータ加工を行い、前記第2のストリームデータに含まれたデータ加工パラメータが適正な場合に、前記音声デコード部が生成したデータ加工パラメータを用いてデータ加工を行なうように構成されていることを特徴とする。
本発明によれば、ストリームデータが含んでいるデータ加工用のパラメータが不正な値であっても、適正に音量調整等のデータ加工を行なうことが可能になる。
以下に説明する各実施形態や各変形例は、ディジタルテレビ放送の音声情報をデコードして出力する音声復号化装置の例である。各音声復号化装置には、2種類のオーディオストリームデータ(以降、単にストリームデータと略記する)が入力されており、各ストリームデータをデコードし、デコードして得た各音声データを合成して出力する。
2種類のストリームデータの1つは、ディジタルテレビ放送の主音声データを含んだストリームデータ(第1のストリームデータS101と呼ぶ)である。以下の各実施形態では、主音声データは、2チャンネル(左チャンネル及び右チャンネル)のステレオ形式で入力されている。
また、もう1つのストリームデータは、ディジタルテレビ放送の副音声データを含んだストリームデータ(第2のストリームデータS102と呼ぶ)であり、例えば放送内容を解説する目的などに使用される。
第1のストリームデータS101をデコードして得た主音声データと、第2のストリームデータS102をデコードして得た副音声データとを単に合成すると、音量が必要以上に大きくなってしまう。これに対しては、合成した音声の音量が適切になるように、主音声データの音量を予め落しておくとよい。また、副音声データの音像定位を制御できると、聴取者の利便性がよい。
そこで、上記の第2のストリームデータS102には、主音声データと副音声データとを加工するためのストリーム情報が含められている。そして、このストリーム情報は、2種類のパラメータ(データ加工パラメータと呼ぶ)を含んでいる。
データ加工パラメータの1つは、フェード(Fade)と呼ばれるパラメータである。フェード値は、主音声データと副音声データとを合成する前に、主音声データの音量をどの程度落すかを示すパラメータである。また、もう1つのデータ加工パラメータは、パン(Pan)と呼ばれるパラメータである。パン値は、副音声の音像定位を制御するパラメータである。
上記の第1のストリームデータS101及び第2のストリームデータS102の一例としては、イギリスの企業連合からなる「Digital TV Group」が、“Digital Terrestrial Television Requirements for Interoperability Issue 4.0”において定めるディジタル放送規格で用いられる“main program data”及び“Audio description data”が挙げられる。
以下、本発明の各実施形態及び各変形例について図面を参照しながら説明する。なお、以下の各実施形態や各変形例の説明において、一度説明した構成要素と同様の機能を有する構成要素については、同一の符号を付して説明を省略する。
《発明の実施形態1》
図1は、本発明の実施形態1に係る音声復号化装置100の構成を示すブロック図である。音声復号化装置100は、図1に示すように、音声デコード部101、外部設定部102、音声データ加工部103、及び合成部104を備えている。
音声デコード部101は、第1のストリームデータS101をデコード(復号化)した第1の復号化データS103と、第2のストリームデータS102を復号化した第2の復号化データS104とを出力するようになっている。第1のストリームデータS101は、主音声データを2チャンネル(左チャンネル及び右チャンネル)のステレオ形式で含んでいるので、第1の復号化データS103も2チャンネルのステレオ形式である。一方、第2のストリームデータS102をデコードして得た第2の復号化データS104は、1チャンネルの副音声データに加え、フェード値とパン値とを含んでいる。
外部設定部102は、フェード値に相当する値と、パン値に相当する値とを設定できるようになっている(これらの値を外部設定情報と呼ぶ)。外部設定情報は、ユーザ(例えば、本装置を用いてテレビ放送受信機等を設計する者や、本装置が組み込まれたテレビ放送受信機等を用いて放送を視聴する者)によって外部設定部102に設定される。
また、外部設定部102には、第2の復号化データS104に含まれたフェード値、及び外部設定部102内に設定されたフェード値のうちの何れを音量調整に使用するかを示すフェード値選択フラグが設定され、さらに、第2の復号化データS104に含まれたパン値、及び外部設定部102内に設定されたパン値のうちの何れを音像定位の制御に使用するかを示すパン値選択フラグが設定されるようになっている。これらのフラグは、例えば、エラー検出部(図示せず)が、第2のストリームデータS102内のフェード値等が不正な状態(エラー状態)か否かを検出し、検出結果に応じ、所定の値(例えば適正な場合に0x1、不正な場合に0x0)に書き換えるようにすればよい。図2に外部設定部102の記述内容の一例を示す。
音声データ加工部103は、フェード制御部103aとパン制御部103bとを備え、主音声データと副音声データとを加工するようになっている。具体的に、本実施形態で音声データ加工部103が行なう加工は、主音声データと副音声データとの音量の大小関係、及び副音声データの音像定位を制御である。
フェード制御部103aは、フェード値選択フラグの値に応じ、第2の復号化データS104に含まれたフェード値、及び外部設定部102内のフェード値のうちの何れかを選択し、選択した値を用いて、主音声データの音量調整(具体的には音量を所定量低下させる。以下フェード制御と呼ぶ)を行なうようになっている。詳しくは、入力された第2のストリームデータS102内のフェード値等が不正である場合には、外部設定部102内のフェード値を使用してフェード制御を行い、そうでない場合には、第2の復号化データS104に含まれたフェード値を使用してフェード制御を行なう。
パン制御部103bは、パン値選択フラグの値に応じ、第2の復号化データS104に含まれたパン値、及び外部設定部102内のパン値のうちの何れかを選択し、選択した値を用いて、副音声データの音像定位を制御するようになっている(以下パン制御と呼ぶ)。詳しくは、入力された第2のストリームデータS102内のパン値等が不正である場合には、外部設定部102内のパン値を使用してパン制御を行い、そうでない場合には、第2の復号化データS104に含まれたパン値を使用してパン制御を行なう。なお、パン制御部103bの出力は、2チャンネルのステレオ形式である。また、外部設定部102内のフェード値やパン値を使用して、音量調整や音像定位を制御することをエラー復帰と呼ぶことにする。
合成部104は、フェード制御部103aの出力とパン制御部103bの出力とを合成して出力するようになっている。
(音声復号化装置100の動作)
音声復号化装置100では、エラー検出部が、第2のストリームデータS102内のフェード値及びパン値の何れかが不正であることを検出すると、不正なパラメータに対応する外部設定部102内のフラグの値を、パラメータが不正であることを示す値にセットする。
一方、音声デコード部101は、入力された第1のストリームデータS101及び第2のストリームデータS102をそれぞれでコードして、第1の復号化データS103及び第2の復号化データS104を出力する。
フェード制御部103aは、第2のストリームデータS102内のフェード値が不正であることをフェード値選択フラグが示している場合には、外部設定部102からフェード値を読み出して、読み出したフェード値に基づいて、主音声データの音量を調整し、第2のストリームデータS102内のフェード値が適正であることをフェード値選択フラグが示している場合には、第2の復号化データS104内のフェード値に基づいて、第1の復号化データS103の音量を調整する。
同様に、パン制御部103bは、第2のストリームデータS102内のパン値が不正であることをパン値選択フラグが示している場合には、外部設定部102からパン値を読み出して、読み出したパン値に基づいて、副音声データの音像定位を制御し、そうでない場合には、第2の復号化データS104内のパン値に基づいて、副音声データの音像定位を制御する。
以上のように、本実施形態によれば、第2のストリームデータS102内のフェード値やパン値が不正であっても、外部設定部102内に設定されている値が用いられて、音量の調整や音像定位の制御が行なわれるので、適正な音声出力が保証される。
《発明の実施形態1の変形例1》
図3は、本発明の実施形態1の変形例1に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、音像定位の制御の際に、常に第2の復号化データS104内のパン値を参照するように、パン制御部103bを構成したものである。例えば、モノラル放送が中心の地域などで使用する場合などには、音像定位の制御が不要な場合が多い。そのため、モノラル放送が中心の地域向けの装置では、本変形例のように、パン制御部103bを構成してもよい。なお、本変形例においても、第2のストリームデータS102内のフェード値が不正の場合には、外部設定部102内に設定されている値が用いられて、フェード制御が行なわれる。
《発明の実施形態1の変形例2》
図4は、本発明の実施形態1の変形例2に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、音量の制御の際に、常に第2の復号化データS104内のフェード値を参照するように、フェード制御部103aを構成したものである。なお、 本変形例においても、第2のストリームデータS102内のパン値が不正の場合には、外部設定部102内に設定されている値が用いられて、パン制御が行なわれる。
《発明の実施形態2》
図5は、本発明の実施形態2に係る音声復号化装置200の構成を示すブロック図である。音声復号化装置200は、同図に示すように、音声復号化装置100にパラメータ制御部201を追加して構成したものである。
パラメータ制御部201は、フェード制御部103aの出力、及びパン制御部103bの出力に応じて、フェード値とパン値とを外部設定部102に設定するようになっている。例えば、パラメータ制御部201は、第2の復号化データS104内の適正なフェード値を用いて音量調整した場合におけるフェード制御部103aの出力の振幅に比べて、外部設定部102内のフェード値を用いて音量調整した場合におけるフェード制御部103aの出力の振幅が大きく異ならないように、フェード値を決定して外部設定部102に設定する。
さらに、パラメータ制御部201は、第2の復号化データS104内の適正なパン値を用いて音像定位を制御した場合に比べて、外部設定部102内のパン値を用いて音像定位を制御した場合の音像の位置が大きく異ならないように、パン値を決定して外部設定部102に設定する。
したがって、本実施形態によれば、外部設定部102に設定するパラメータを、ユーザが一々求める必要がない。
なお、パラメータ制御部201は、合成部104の出力の振幅に応じ、フェード値、及びパン値の値を外部設定部102に設定するように構成してもよい。
また、パラメータ制御部201は、フェード制御部103aの出力に応じて、フェード値のみを設定するように構成して、パン値はユーザが設定するようにしてもよいし、パン制御部103bの出力に応じて、パン値のみを設定するように構成して、フェード値はユーザが設定するようにしてもよい。
《発明の実施形態3》
図6は、本発明の実施形態3に係る音声復号化装置300の構成を示すブロック図である。音声復号化装置300は、同図に示すように、音声復号化装置100の合成部104を合成部301に置き換え、さらに合成選択部302を追加して構成したものである。
合成部301は、入力された制御信号(合成制御信号と呼ぶ)に応じ、フェード制御部103aの出力とパン制御部103bの出力とを合成した信号、及びフェード制御部103aの出力信号の何れか一方を選択的に出力するようになっている。
合成選択部302は、外部からの指示(例えば聴取者からの指示)を受けて、その指示に応じて、合成制御信号を合成部301に出力するようになっている。
上記の音声復号化装置300によれば、副音声を聴取するか否かを切り替えることが可能になる。
《発明の実施形態4》
図7は、本発明の実施形態4に係る音声復号化装置400の構成を示すブロック図である。音声復号化装置400は、同図に示すように、音声復号化装置100において、音声データ加工部103の代わりに音声データ加工部403を設け、さらに、エラー復帰開始時間制御部401とエラー復帰移行時間制御部402とを追加して構成したものである。
音声データ加工部403は、フェード制御部403aとパン制御部403bとを備え、主音声データと副音声データとを加工するようになっている。
フェード制御部403aは、与えられた所定の制御信号に応じ、エラー復帰を開始するタイミングと、現時点の音量から新たに選択されたフェード値に対応した音量に移行するまでの時間(エラー復帰移行時間と呼ぶ)とを変更できるように、フェード制御部103aを構成したものである。
パン制御部403bは、与えられた所定の制御信号に応じ、エラー復帰を開始するタイミングと、現時点の音像定位から、新たに選択されたパン値に対応した音像位置に移行するまでの時間(これもエラー復帰移行時間と呼ぶ)とを変更できるように、パン制御部103bを構成したものである。
エラー復帰開始時間制御部401は、第2の復号化データS104内のフェード値及びパン値の少なくとも一方のエラー状態が、所定時間以上継続した場合に、エラー復帰開始が必要であると判定し、フェード制御部403a及びパン制御部403bのうちのエラー復帰開始が必要である方に、エラー復帰開始を指示するようになっている。
エラー復帰移行時間制御部402は、フェード制御部403a及びパン制御部403bに、エラー復帰移行時間を指示するようになっている。
(音声復号化装置400の動作)
音声復号化装置400では、第2の復号化データS104内のフェード値及びパン値の少なくとも一方のエラー状態が所定時間以上継続すると、エラー復帰開始時間制御部401は、フェード制御部403a及びパン制御部403bのうちのエラー復帰開始が必要である方に、エラー復帰開始を指示する。一方、エラー復帰移行時間制御部402は、フェード制御部403aとパン制御部403bとにエラー復帰移行時間を指示する。
それにより、フェード制御部403aとパン制御部403bとは、与えられたエラー復帰移行時間をかけて、段階的に、現時点の状態から、新たなパラメータに対応した状態まで、音量レベルや、音像定位を制御する。
上記のように、本実施形態によれば、エラー状態が所定時間以上継続した場合に、音量や、音像定位の制御が段階的に行なわれる。したがって、例えば突発的なエラーによって、音量等が急変することがない。
なお、エラー復帰開始時間制御部401は、単位時あたりに発生したエラー回数をカウントして、その結果が所定回数を越えた場合に、エラー復帰開始を指示するようにしてもよいし、用途によっては、エラーが検知されたら直ちにエラー復帰開始を指示するようにしてもよい。
また、エラー復帰開始時間制御部401は、これらのエラー復帰指示方法(エラー継続時間によるエラー復帰指示、単位時間あたりのエラー発生回数によるエラー復帰指示等)のそれぞれを実行できるように構成し、例えば音声復号化装置400の使用環境などに応じて、何れのエラー復帰指示方法を使用するかを切り替えるように構成してもよい。それにより、最も聴取者に違和感なくエラー復帰することが可能になる。
《発明の実施形態4の変形例その1》
図8は、本発明の実施形態4の変形例1に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、フェード制御についてのみ、エラー復帰のタイミングと、エラー復帰移行時間とが制御されている。パン制御のエラー復帰開始タイミングは、音声復号化装置100等と同様に、外部設定部102にセットされているフラグに基づいて制御され、エラー復帰にかける時間(エラー復帰移行時間)はデフォルト値である。
《発明の実施形態4の変形例その2》
図9は、本発明の実施形態4の変形例2に係る音声復号化装置の構成を示すブロック図である。この音声復号化装置は、パン制御についてのみ、エラー復帰のタイミングと、エラー復帰移行時間とが制御されている。フェード制御のエラー復帰開始タイミングは、音声復号化装置100等と同様に、外部設定部102にセットされているフラグに基づいて制御され、エラー復帰にかける時間(エラー復帰移行時間)はデフォルト値である。
本発明に係る音声復号化装置は、ストリームデータが含んでいるデータ加工用のパラメータが不正な値であっても、適正に音量調整等のデータ加工を行なうことが可能になるという効果を有し、符号化された音声データを含んだストリームデータを復号化する音声復号化装置等として有用である。
実施形態1に係る音声復号化装置100の構成を示すブロック図である。 外部設定部102の記述内容の一例を示す図である。 実施形態1の変形例1に係る音声復号化装置の構成を示すブロック図である。 実施形態1の変形例2に係る音声復号化装置の構成を示すブロック図である。 実施形態2に係る音声復号化装置200の構成を示すブロック図である。 実施形態3に係る音声復号化装置300の構成を示すブロック図である。 実施形態4に係る音声復号化装置400の構成を示すブロック図である。 実施形態4の変形例1に係る音声復号化装置の構成を示すブロック図である。 実施形態4の変形例2に係る音声復号化装置の構成を示すブロック図である。
符号の説明
100 音声復号化装置
101 音声デコード部
102 外部設定部
103 音声データ加工部
103a フェード制御部
103b パン制御部
104 合成部
200 音声復号化装置
201 パラメータ制御部
300 音声復号化装置
301 合成部
302 合成選択部
400 音声復号化装置
401 エラー復帰開始時間制御部
402 エラー復帰移行時間制御部
403 音声データ加工部
403a フェード制御部
403b パン制御部
S101 第1のストリームデータ
S102 第2のストリームデータ
S103 第1の復号化データ
S104 第2の復号化データ

Claims (9)

  1. 第1の音声データを符号化した符号データを含んだ第1のストリームデータと、第2の音声データを符号化した符号データとともに前記第1の音声データ及び前記第2の音声データの2つの音声データに対してデータ加工をするためのデータ加工パラメータを含んだ第2のストリームデータとを復号化する音声復号化装置であって、
    前記第1のストリームデータ及び前記第2のストリームデータを復号化して、前記2つの音声データ及び前記データ加工パラメータを生成する音声デコード部と、
    前記データ加工パラメータに相当するパラメータが設定される外部設定部と、
    前記2つの音声データに対してデータ加工をする音声データ加工部とを備え、
    前記音声データ加工部は、前記第2のストリームデータに含まれたデータ加工パラメータが不正な場合に、前記2つの音声データのうちの少なくとも一方に対しては、前記外部設定部に設定されているパラメータを用いてデータ加工を行い、前記第2のストリームデータに含まれたデータ加工パラメータが適正な場合に、前記音声デコード部が生成したデータ加工パラメータを用いてデータ加工を行なうように構成されていることを特徴とする音声復号化装置。
  2. 請求項1の音声復号化装置であって、
    前記データ加工パラメータは、前記第1の音声データの音量を低下させる量を示すパラメータであることを特徴とする音声復号化装置。
  3. 請求項1の音声復号化装置であって、
    前記データ加工パラメータは、前記第2の音声データの音像定位を制御するパラメータであることを特徴とする音声復号化装置。
  4. 請求項1の音声復号化装置であって、さらに、
    前記音声データ加工部が加工した2つの音声データを合成する合成部と、
    前記合成部が出力した音声データの音量が、所定範囲に収まるように、前記外部設定部にパラメータを設定するパラメータ制御部と、
    をさらに備えたことを特徴とする音声復号化装置。
  5. 請求項1の音声復号化装置であって、
    前記音声データ加工部が加工した第1の音声データを出力するか、前記音声データ加工部が加工した2つの音声データを合成した音声データを出力するかが、与えられた制御信号に応じて切り替わる合成部をさらに備えたことを特徴とする音声復号化装置。
  6. 請求項1の音声復号化装置であって、
    さらに、前記音声デコード部が生成したデータ加工パラメータが不正である時間が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
    前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。
  7. 請求項1の音声復号化装置であって、
    さらに、前記音声デコード部が生成したデータ加工パラメータが不正であった回数が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
    前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。
  8. 請求項1の音声復号化装置であって、
    前記音声デコード部が生成したデータ加工パラメータが不正である時間が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示する第1のエラー復帰指示方法、及び前記音声デコード部が生成したデータ加工パラメータが不正であった回数が所定以上連続した場合に、前記音声データ加工部にデータ加工の開始を指示する第2のエラー復帰指示方法のうちの何れかのエラー復帰指示方法を選択し、選択したエラー復帰指示方法によって、前記音声データ加工部にデータ加工の開始を指示するエラー復帰開始時間制御部を備え、
    前記音声データ加工部は、前記エラー復帰開始時間制御部の指示を受けて、データ加工を開始するように構成されていることを特徴とする音声復号化装置。
  9. 請求項6、請求項7、及び請求項8のうちの何れか1項の音声復号化装置であって、
    さらに、データ加工を開始してから完了するまでの時間を前記音声データ加工部に指示するエラー復帰移行時間制御部を備え、
    前記音声データ加工部は、前記エラー復帰移行時間制御部の指示に応じた時間で、データ加工を完了するように構成されていることを特徴とする音声復号化装置。
JP2006275276A 2006-10-06 2006-10-06 音声復号化装置 Expired - Fee Related JP4257862B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006275276A JP4257862B2 (ja) 2006-10-06 2006-10-06 音声復号化装置
EP07111021.7A EP1909538B1 (en) 2006-10-06 2007-06-26 Audio decoding device
US11/822,907 US8090585B2 (en) 2006-10-06 2007-07-11 Audio decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006275276A JP4257862B2 (ja) 2006-10-06 2006-10-06 音声復号化装置

Publications (2)

Publication Number Publication Date
JP2008096508A JP2008096508A (ja) 2008-04-24
JP4257862B2 true JP4257862B2 (ja) 2009-04-22

Family

ID=38542036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006275276A Expired - Fee Related JP4257862B2 (ja) 2006-10-06 2006-10-06 音声復号化装置

Country Status (3)

Country Link
US (1) US8090585B2 (ja)
EP (1) EP1909538B1 (ja)
JP (1) JP4257862B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009157213A1 (ja) * 2008-06-27 2009-12-30 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JP5468020B2 (ja) * 2009-01-13 2014-04-09 パナソニック株式会社 音響信号復号装置及びバランス調整方法
US9043444B2 (en) * 2011-05-25 2015-05-26 Google Inc. Using an audio stream to identify metadata associated with a currently playing television program
ES2909532T3 (es) * 2011-07-01 2022-05-06 Dolby Laboratories Licensing Corp Aparato y método para renderizar objetos de audio
US10091581B2 (en) * 2015-07-30 2018-10-02 Roku, Inc. Audio preferences for media content players
WO2024004651A1 (ja) * 2022-06-29 2024-01-04 ソニーグループ株式会社 音声再生装置、音声再生方法及び音声再生プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05110528A (ja) 1991-10-18 1993-04-30 Nec Ic Microcomput Syst Ltd 車載オーデイオ装置およびその音場制御方法
US5852800A (en) * 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
JP3596841B2 (ja) * 1997-01-24 2004-12-02 株式会社ルネサステクノロジ 受信データ伸長装置
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
JP4398323B2 (ja) * 2004-08-09 2010-01-13 ユニデン株式会社 デジタル無線通信装置
WO2006088145A1 (ja) 2005-02-18 2006-08-24 Matsushita Electric Industrial Co., Ltd. ストリーム再生装置、ストリーム供給装置

Also Published As

Publication number Publication date
JP2008096508A (ja) 2008-04-24
EP1909538B1 (en) 2013-08-07
EP1909538A3 (en) 2010-04-07
US20080086312A1 (en) 2008-04-10
US8090585B2 (en) 2012-01-03
EP1909538A2 (en) 2008-04-09

Similar Documents

Publication Publication Date Title
JP4257862B2 (ja) 音声復号化装置
KR101538623B1 (ko) 두 개의 입력 오디오 신호 믹싱 방법, 및 이를 실행하기 위한 디코더 및 컴퓨터 판독가능한 매체, 및 입력 오디오 신호 믹싱 디바이스
US8160277B2 (en) Method for outputting audio signals and audio decoder
JP5328637B2 (ja) マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
JP2006019903A (ja) 音響装置および再生モード設定方法
JP2009094796A (ja) テレビジョン受信機
JP2014072678A (ja) 受信装置、及び、受信制御方法
JP4507360B2 (ja) デジタル放送受信装置
JP2001245237A (ja) 放送受信装置
JP2008005255A (ja) デジタル放送受信機
JP2010152281A (ja) 音声再生装置
JP2008141463A (ja) オンスクリーン表示装置及びテレビジョン受像機
JP2010258776A (ja) 音声信号処理装置
JP6099250B2 (ja) 放送送出装置、及び受信機
KR101516968B1 (ko) 오디오 신호 처리 방법 및 이를 이용한 방송 출력 장치
JP2011050079A (ja) 放送受信装置およびプログラム
JP4385710B2 (ja) 音声信号処理装置及び音声信号処理方法
JP6440314B2 (ja) 受信装置、受信方法、及びプログラム
JP2007096802A (ja) デジタル放送受信装置および制御方法
JP2008294497A (ja) テレビジョン受信装置
JP2021019308A (ja) ラジオ受信装置及びラジオ受信プログラム
JP2005217958A (ja) 放送受信装置
JP2011055411A (ja) サラウンド放送番組視聴システム、端末、サラウンド放送番組の音声出力方法、及びプログラム
JP2005151308A (ja) 受信装置
JP2007234146A (ja) オーディオ機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090130

R150 Certificate of patent or registration of utility model

Ref document number: 4257862

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140213

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees