JP2012027101A - 音声再生装置、音声再生方法、プログラム、及び、記録媒体 - Google Patents
音声再生装置、音声再生方法、プログラム、及び、記録媒体 Download PDFInfo
- Publication number
- JP2012027101A JP2012027101A JP2010163363A JP2010163363A JP2012027101A JP 2012027101 A JP2012027101 A JP 2012027101A JP 2010163363 A JP2010163363 A JP 2010163363A JP 2010163363 A JP2010163363 A JP 2010163363A JP 2012027101 A JP2012027101 A JP 2012027101A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- music
- sound
- signal
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
【課題】複数チャンネルの入力信号に音声部分が含まれているか否かを精度良く判定することによってシーン判定し、シーン毎に適切な音場制御を行う音声再生装置を提供する。
【解決手段】センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置1であって、前記複数の音声信号に共通して含まれる共通成分を抽出する共通成分抽出部13と、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する音声区間検出部15と、を備えている。
【選択図】図1
【解決手段】センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置1であって、前記複数の音声信号に共通して含まれる共通成分を抽出する共通成分抽出部13と、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する音声区間検出部15と、を備えている。
【選択図】図1
Description
本発明は、音声信号を処理する音声再生装置、及び、音声再生方法に関する。
通常、テレビ放送などのコンテンツを視聴する場合、視聴者はリビングや台所などにおいて、小さい音量で視聴することが多い。そして、このような小さな音量でテレビを視聴する場合などにおいても、臨場感や音声(人の声)の聞き取り易さなどが要求されるようになってきている。
そのため、放送中あるいは再生中のコンテンツについて、台詞の聞き取り易さを向上させるために音声を強調して音楽、効果音などを抑制したり、反対に、臨場感を向上させるために音楽、効果音などを強調したりする音場制御を行う必要がある。
そこで、近年普及してきているデジタル放送の場合には、放送波と共に伝送されるSI(Service Information)情報、あるいは、SI情報を基に生成されるEPG(Electronic Program Guide;電子番組表)情報などを用いて、番組のジャンルに応じた音場制御を行うことが考えられる。
しかし、1つの番組には、音声のみのシーン、音楽のみのシーン、音声と音楽との両方を含むシーンなど複数のシーンが存在する。このため、SI情報、EPG情報を基に音場制御を行った場合、一部のシーンにおいては適切な音場制御がなされるものの、他のシーンにおいては適切な音場制御がされない。
このような問題に対しては、例えば、特許文献1及び2に示すような技術が開示されている。
特許文献1には、音響信号の所定時間を表すフレームごとに周波数スペクトルを算出して自己相関値を算出し、算出した自己相関値の最大値のばらつきが閾値よりも小さい場合に、音響信号を音楽区間と判定する技術が開示されている。また、特許文献1では、音響信号に対し、判定した結果に応じた音場制御を行っている。
特許文献2には、右チャンネルに対応する右側音声信号及び左チャンネルに対応する左側音声信号から共通成分を抽出して、抽出した共通成分から中央チャンネルに対応する中央音声出力信号を生成し、右側音声信号及び左側音声信号から共通成分を減算することによって右側音声出力信号及び左側音声出力信号を生成する技術が開示されている。また、特許文献2では、生成した音声出力信号に乗数を乗することによって音声を強調したり、臨場感を高めたりしている。
しかしながら、特許文献1に記載の技術は、入力チャンネルが1チャンネルの場合に限られており、チャンネルが複数ある場合には、複数のチャンネル全てに検出装置を設けなければならず、音響信号に効果音、雑音などが重畳されている場合には、音楽区間、音声区間を判定する判定精度が低下してしまうという問題があった。
また、特許文献2に記載の技術は、2チャンネルの入力信号を3チャンネルの出力信号にアップミックスしていることから、3チャンネル以上の入力に対して対応していない。
本発明は上記問題に鑑みてなされたものであり、その目的は、複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、精度良く算出することができる音声再生装置を提供することにある。
また、本発明の他の目的は、複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、精度良く算出することができる音声再生装置を提供することにある。
また、本発明のさらに他の目的は、音楽区間と非音楽区間とを算出するための音声信号を少なくして算出する工程を削減し、音楽区間と非音楽区間とを、効率良く算出することができる音声再生装置を提供することにある。
本発明に係る音声再生装置は、上記課題を解決するために、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する算出手段と、を備えていることを特徴としている。
上記の構成によれば、まず、前記抽出手段が、前記複数の音声信号に共通して含まれる共通成分を抽出する。次に、前記算出手段が、前記複数の音声信号における音声区間と非音声区間とを、前記共通成分に基づき算出する。
なお、音声は、前記複数のチャンネルの何れかに個別に対応する複数の音声信号のそれぞれに等しく含まれていることが一般的である。従って、抽出した前記複数の音声信号に共通して含まれる共通成分に基づいて前記音声区間と前記非音声区間とを算出することができる。これによって、前記センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音声区間と、前記非音声区間とを、精度良く算出することができる。
本発明に係る音声再生装置は、前記複数の音声信号に共通して含まれる共通成分のうち、特定の帯域を濾波または選択する帯域抽出手段を更に備え、前記算出手段は、前記複数の音声信号における、前記音声区間と前記非音声区間とを、前記帯域抽出手段によって濾波または選択された前記特定の帯域の共通成分に基づき算出することが好ましい。
上記の構成によれば、まず、前記帯域抽出手段は、前記複数の音声信号に共通して含まれる共通成分のうち、特定の帯域の成分を濾波または選択する。次に、前記算出手段は、帯域抽出手段によって濾波または選択された特定の帯域の成分に基づいて、前記音声区間と前記非音声区間とを算出する。
なお、前記複数の音声信号から抽出した共通成分には、定常的に空間に存在する音である定在波が混在していることがほとんどである。このため、上記の構成によれば、前記複数の音声信号に共通して含まれる共通成分に含まれる定在波を取り除くことができる。これによって、前記センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音声区間と、前記非音声区間とを、さらに精度良く算出することができる。
本発明に係る音声再生装置は、前記帯域抽出手段によって濾波または選択される前記特定の帯域は略100Hzから略8kHzである、ことが好ましい。
前記定在波のうち、最も大きい1次定在波の帯域は一般的に略60Hz以下であり、人の声が有するフォルマントの最高周波数は略8kHzである。フォルマントとは、声道の伝達関数の極と零とによって発生する共振の山、及び、反共振の谷のことをいう。このため、上記の構成によれば、前記センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音声区間と、前記非音声区間とを、さらに精度良く算出することができる。
本発明に係る音声再生装置は、上記課題を解決するために、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する算出手段を備えていることを特徴としている。
上記の構成によれば、前記算出手段が、前記複数の音声信号における前記音声区間と前記非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する。これによって、前記センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音声区間と、前記非音声区間とを、精度良く算出することができる。
本発明に係る音声再生装置は、前記算出手段によって算出された前記音声区間と前記非音声区間とに基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する重み係数変更手段を更に備えていることが好ましい。
上記の構成によれば、前記重み係数変更手段は、前記算出手段によって算出された算出結果に基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する。ここで、前記重み係数を変更することによって、前記複数のチャンネルの何れかに個別に対応する複数の音声信号それぞれの音量を調整することができる。これによって、音声区間であるシーン、非音声区間であるシーンなど、シーン毎に適切な音場制御を行うことができる。
本発明に係る音声再生装置において、前記重み係数変更手段は、前記算出手段によって算出された前記音声区間において、前記共通成分又は前記センターチャンネルの何れかに個別に対応する前記重み係数を大きい値に変更することが好ましい。
上記の構成によれば、前記重み係数変更手段は、前記複数の音声信号が前記音声区間である場合に、前記共通成分又は前記センターチャンネルの何れかに個別に対応する前記重み係数を大きい値に変更する。これによって、音声区間であるシーンにおいて、音声のみの音量を大きくすることによって、音声を強調することができる。従って、音声が、音楽、効果音などによって聴き取りにくくなることを防ぐことができるため、ユーザは音声をよりはっきりと聞き取ることができる。
本発明に係る音声再生装置は、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する音楽区間算出手段と、を備えていることを特徴としている。
上記の構成によれば、まず、前記抽出手段が、前記複数の音声信号に共通して含まれる共通成分を抽出する。次に、前記音楽区間算出手段が、前記複数の音声信号における音楽区間と非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する。
なお、音声は、複数のチャンネルの何れかに個別に対応する複数の音声信号のそれぞれに等しく含まれていることが一般的である。このため、前記複数の音声信号から前記共通成分を減算することによって、前記複数の音声信号から音声を取り除くことができる。これによって、前記センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音楽区間と、前記非音楽区間とを、精度良く算出することができる。
本発明に係る音声再生装置は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号の少なくとも何れかに基づき算出する音楽区間算出手段を備えていることを特徴としている。
上記の構成によれば、前記音楽区間算出手段が、前記複数の音声信号における前記音楽区間と前記非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号の少なくとも何れかに基づき算出する。これによって、前記センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号における、前記音楽区間と、前記非音楽区間とを、精度良く算出することができる。
本発明に係る音声再生装置は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する縮退手段と、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記縮退信号に基づき算出する音楽区間算出手段と、を備えていることを特徴としている。
上記の構成によれば、まず、前記縮退手段は、前記センターチャンネル及び前記LFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する。次に、前記音楽区間算出手段は、前記縮退手段において生成された縮退信号に基づいて、前記音楽区間と前記非音楽区間とを算出する。これによって、前記複数の音声信号が前記縮退手段において縮退されない場合と比較して、少ない音声信号に基づいて前記音楽区間と前記非音楽区間とを算出することができる。このため、前記音楽区間と前記非音楽区間とを算出する工程を削減し、前記音楽区間と前記非音楽区間とを効率よく算出することができる。
本発明に係る音声再生装置は、前記音楽区間算出手段によって算出された前記音楽区間と前記非音楽区間とに基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する重み係数変更手段を更に備えていることが好ましい。
上記の構成によれば、前記重み係数変更手段は、前記音楽区間算出手段によって算出された算出結果に基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する。ここで、前記重み係数を変更することによって、前記複数のチャンネルの何れかに個別に対応する複数の音声信号それぞれの音量を調整することができる。これによって、前記音楽区間であるシーン、前記非音楽区間であるシーンなど、シーン毎に適切な音場制御を行うことができる。
本発明に係る音声再生装置は、前記重み係数変更手段は、前記音楽区間算出手段によって算出された前記音楽区間において、前記共通成分、又は、前記センターチャンネル及び前記LFEチャンネル以外チャンネルの何れかに個別に対応する前記重み係数を大きい値に変更することが好ましい。
上記の構成によれば、前記重み係数変更手段は、前記複数の音声信号が前記音楽区間である場合に、前記共通成分、又は、前記センターチャンネル及び前記LFEチャンネル以外チャンネルの何れかに個別に対応する前記重み係数を大きい値に変更する。これによって、音楽区間であるシーンにおいて、音楽のみの音量を大きくすることによって、音楽を強調することができる。従って、音楽の音量が小さい場合にも、臨場感を向上させることができる。
本発明に係る音声再生装置の音声再生方法は、上記課題を解決するために、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出ステップと、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する算出ステップと、を含んでいることを特徴としている。
上記の構成によれば、まず、前記複数の音声信号に共通して含まれる共通成分を抽出する。次に、前記複数の音声信号における前記音声区間と前記非音声区間とを、前記共通成分に基づき算出する。これにより、音声再生装置について既に説明した効果と同様の効果を得ることができる。
本発明に係る音声再生装置の音声再生方法は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する算出ステップを含んでいることを特徴としている。
上記の構成によれば、前記複数の音声信号における前記音声区間と前記非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する。音声再生装置について既に説明した効果と同様の効果を得ることができる。
本発明に係る音声再生装置の音声再生方法は、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出ステップと、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する音楽区間算出ステップと、を含んでいることを特徴としている。
上記の構成によれば、まず、前記複数の音声信号に共通して含まれる共通成分を抽出する。次に、前記複数の音声信号における前記音楽区間と前記非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する。これにより、音声再生装置の音声再生方法について既に説明した効果と同様の効果を得ることができる。
本発明に係る音声再生装置の音声再生方法は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号に基づき算出する音楽区間算出ステップを含んでいることを特徴としている。
上記の構成によれば、前記複数の音声信号における前記音楽区間と前記非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号の少なくとも何れかに基づき算出する。これにより、音声再生装置の音声再生方法について既に説明した効果と同様の効果を得ることができる。
本発明に係る音声再生装置の音声再生方法は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する縮退ステップと、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記縮退信号に基づき算出する音楽区間算出ステップと、を含んでいることを特徴としている。
上記の構成によれば、まず、前記センターチャンネル及び前記LFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する。次に、前記縮退手段において生成された縮退信号に基づいて、前記音楽区間と前記非音楽区間とを算出する。これにより、音声再生装置の音声再生方法について既に説明した効果と同様の効果を得ることができる。
なお、本発明に係る音声再生装置は、コンピュータによって実現してもよい。この場合、コンピュータを前記音声再生装置として動作させることにより、前記音声再生装置をコンピュータにおいて実現するプログラム、および、そのプログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明に係る音声信号表示装置は、以上のように、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する算出手段とを備えている。
これによって、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、音声区間と、非音声区間とを、精度良く算出することができる。
また、本発明に係る音声信号表示装置は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する算出手段を備えている。
これによって、前記センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号における、音声区間と、非音声区間とを、精度良く算出することができる。
また、本発明に係る音声再生装置は、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する音楽区間算出手段とを備えている。
これによって、センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号における、音楽区間と、非音楽区間とを、精度良く算出することができる。
また、本発明に係る音声再生装置は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号の少なくとも何れかに基づき算出する音楽区間算出手段を備えている。
これによって、前記センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号における、音楽区間と、非音楽区間とを、精度良く算出することができる。
また、本発明に係る音声再生装置は、センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号を縮退して縮退信号を生成する縮退手段と、前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記縮退信号に基づき算出する音楽区間算出手段とを備えている。
これによって、前記音楽区間と前記非音楽区間とを算出する工程を削減し、前記音楽区間と前記非音楽区間とを効率よく算出することができる。
〔実施形態1〕
本実施形態に係る音声再生装置の構成について、図1及び図2を参照して説明する。図1は、本実施形態に係る音声再生装置1の構成を示すブロック図である。
本実施形態に係る音声再生装置の構成について、図1及び図2を参照して説明する。図1は、本実施形態に係る音声再生装置1の構成を示すブロック図である。
(音声再生装置の構成)
音声再生装置1は、例えばテレビジョン受像機などに実装され、放送信号に含まれる音声信号を出力するために、図1に示すように、入力端子11、スペクトル変換部12、共通成分抽出部13(抽出手段)、中域選択部14(帯域抽出手段)、音声区間検出部15(算出手段)、減算部16、音楽区間検出部17(音楽区間算出手段)、乗算部18(重み係数変更手段)、逆変換部19、加算部20、及び、出力端子21を備えている。
音声再生装置1は、例えばテレビジョン受像機などに実装され、放送信号に含まれる音声信号を出力するために、図1に示すように、入力端子11、スペクトル変換部12、共通成分抽出部13(抽出手段)、中域選択部14(帯域抽出手段)、音声区間検出部15(算出手段)、減算部16、音楽区間検出部17(音楽区間算出手段)、乗算部18(重み係数変更手段)、逆変換部19、加算部20、及び、出力端子21を備えている。
入力端子11は、複数のチャンネルの何れかに対応する複数の音声信号の入力を受け付ける。入力端子11は、左チャンネル(Lch)に対応する左側音声信号であるLch入力信号が入力される入力端子11a、右チャンネル(Rch)に対応する右側音声信号であるRch入力信号が入力される入力端子11b、及び、超低音域(LFE:Low Frequency Effect)専用チャンネル(LFEch)に対応する超低音域音声信号であるLFEch入力信号が入力される入力端子11cを含んで構成されている。すなわち、入力端子11は、Lch入力信号、Rch入力信号、及び、LFEch入力信号からなる2.1チャンネルの音声信号の入力を受け付ける。
スペクトル変換部12は、各チャンネルに個別に対応するそれぞれの音声信号のスペクトルを算出するための処理を行う手段である。スペクトル変換部12は、入力端子11aから入力されたLch入力信号スペクトルを算出するスペクトル変換部12a、入力端子11bから入力されたRch入力信号スペクトルを算出するスペクトル変換部12bを含んで構成されている。具体的には、スペクトル変換部12は、入力されたそれぞれの音声信号を1フレームあたり1024サンプルにフレーム分割し、ハミング窓などの窓関数を掛けた後に、高速フーリエ変換(FFT:Fast Fourier Transform)を行うことによって、時間領域の音声信号を周波数領域のデータ、すなわち、スペクトルに変換する。スペクトルに変換された音声信号は、共通成分抽出部13、減算部16、及び、乗算部18に供給される。なお、本実施形態では、窓関数としてハミング窓を用いたが、ハミング窓以外の窓関数でもよく、特に限定されるものではない。また、1フレームあたり1024サンプルにフレーム分割する構成を示したが、1024サンプル以外のサンプル数にフレーム分割してもよく、特に限定されるものではない。
共通成分抽出部13は、複数の音声信号に共通して含まれる共通成分を抽出する抽出手段として機能する。具体的には、Lch入力信号スペクトルとRch入力信号スペクトルとに共通して含まれる成分のうち、最小の成分をそのスペクトルの共通成分として抽出する。抽出されたスペクトルの共通成分は、中域選択部14、減算部16、及び、乗算部18に供給される。
中域選択部14は、複数の音声信号に共通して含まれる成分のうち、特定の帯域の成分を濾波または選択する帯域抽出手段として機能する。具体的には、中域選択部14は、低域、高域の成分を減衰させ、特定の帯域のみを通過させる。中域選択部14は、例えば、バンドパスフィルタ(BPF:Band-pass Filter)によって構成することができる。
また、中域選択部14の通過帯域は、例えば、略100Hzから略8kHzとすることが好ましい。これは、音声の基本帯域が略100Hzから略400Hzであり、人の声が有するフォルマントの最高周波数が略8kHzであるためである。また、空間に存在する定在波のうち、最も大きい1次定在波の帯域が一般的に60Hz以下であるため、中域選択部14において、共通成分抽出部13によって抽出されたスペクトルの共通成分の中から効率よく人の声が含まれる帯域のスペクトルのみを抽出することができる。なお、本発明に係る中域選択部14の通過帯域はこれに限定されるものではない。抽出された特定帯域のスペクトルは、音声区間検出部15に供給される。
音声区間検出部15は、複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、共通成分に基づき算出する算出手段として機能する。具体的には、音声区間検出部15はまず、中域選択部14から供給されたフレーム毎の特定周波数帯域のスペクトルから基底10の対数スペクトルを算出し、算出した対数スペクトルに対して1024ポイントのIFFT(Inverse Fast Fourier Transform)を施し、時間領域のデータであるケプストラムに変換する。次に、ケプストラムの高次側の最大ケプストラムを抽出して、最大ケプストラムとなるケフレンシーの逆数を基本周波数として算出し、算出した基本周波数を低域濾過する。最後に、フレームにおける基本周波数の単調変化を検出することによって、音声信号にフレーズ成分又はアクセント成分の少なくとも何れかが含まれているか否かを判定し、含まれていると判定した場合に、音声区間として検出する。音声区間を検出すると、音声区間検出部15は、音声区間検出結果を乗算部18に供給する。
減算部16は、スペクトル変換部12から供給されたスペクトルから、共通成分抽出部13から供給されたスペクトルの共通成分を減算する手段である。減算部16は、スペクトル変換部12aから供給されたLch入力信号スペクトルからスペクトルの共通成分を減算してLchスペクトルを算出する減算部16aと、スペクトル変換部12bから供給されたRch入力信号スペクトルからスペクトルの共通成分を減算してRchスペクトルを算出する減算部16bとを含んで構成されている。算出されたLchスペクトル及びRchスペクトルは、音楽区間検出部17、及び、乗算部18に供給される。
音楽区間検出部17は、複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、複数の音声信号のそれぞれから共通部分を減算した音声信号に基づき算出する算出する音楽区間算出手段として機能する。具体的には、音楽区間検出部17はまず、減算部16a、16bから供給されたLchスペクトル及びRchスペクトルに基づいて、平均律音階の各周波数に対応する音階スペクトルを算出する。次に、算出した音階スペクトルの2乗の値を音階スペクトルパワーとし、音階スペクトルパワーの最大値を検出する。最後に、音階スペクトルパワーの最大値が予め設定された閾値よりも大きいとき、複数フレームの音階スペクトルパワーの最大値に対応する音階番号から分散を算出し、算出された分散が予め定められた閾値よりも大きい場合に音楽区間として検出する。音楽区間を検出すると、音楽区間検出部17は、音楽区間検出結果を乗算部18に供給する。
乗算部18は、音声区間検出結果及び音楽区間検出結果に基づいて、Lch、Rch及び抽出した共通成分の音声信号の音量を調整(音場制御)する乗数の値を設定する手段である。すなわち、Lch、Rch及び共通成分の何れかに個別に対応する重み係数(乗数)を変更する重み係数変更手段として機能する。乗算部18は、減算部16aから供給されたLchスペクトルに乗数を乗する乗算部18aと、減算部16bから供給されたRchスペクトルに乗数を乗する乗算部18cと、共通成分抽出部13から供給されたスペクトルの共通成分に乗数を乗する乗算部18bとを含んで構成されている。乗数を乗されたスペクトルは、逆変換部19に供給される。
乗算部18は、音声区間検出結果が、音声区間を検出した旨を表している場合、乗算部18bにて乗する乗数の値を、乗算部18a、18cにて乗する乗数の値よりも大きい値とすることで、人の声を聞こえ易くすることができる。乗数の値としては、例えば、乗算部18bにて乗する乗数の値を1、乗算部18a、18cにて乗する乗数の値を0.5としてもよく、乗算部18bにて乗する乗数の値を2、乗算部18a、18cにて乗する乗数の値を1としてもよいが、これに限定されるものではない。また、音楽区間検出結果が、音楽区間を検出した旨を表している場合、乗算部18a、18cにて乗する乗数の値を、乗算部18bにて乗する乗数の値よりも大きい値とすることで、臨場感を高めることができる。乗数の値としては、例えば、乗算部18bにて乗する乗数の値を0.5、乗算部18a、18cにて乗する乗数の値を1としてもよく、乗算部18bにて乗する乗数の値を1、乗算部18a、18cにて乗する乗数の値を2としてもよいが、これに限定されるものではない。
逆変換部19は、乗算部18から供給されたスペクトルに対して逆FFTを行うことによって時間領域の信号波形に変換し、音声信号を生成する手段である。逆変換部19は、乗算部18aから供給されたLchスペクトルに対して逆FFTを行う逆変換部19aと、乗算部18bから供給されたスペクトルの共通成分に対して逆FFTを行う逆変換部19bと、乗算部18cから供給されたRchスペクトルに対して逆FFTを行う逆変換部19cとを含んで構成されている。時間領域の信号波形に変換することによって生成された音声信号、加算部20に供給される。
加算部20は、逆変換部19から供給されたLchの音声信号及びRchの音声信号のそれぞれに、共通成分の音声信号を加算して出力信号を生成する手段である。加算部20は、逆変換部19aから供給されたLchの音声信号に逆変換部19bから供給された共通成分の音声信号を加算してLch出力信号を生成する加算部20aと、逆変換部19cから供給されたRchの音声信号に逆変換部19bから供給された共通成分の音声信号を加算してRch出力信号を生成する加算部20aとを含んで構成されている。生成された出力信号は、出力端子21に供給される。
出力端子21は、音声再生装置1において処理された音声信号を出力する。出力端子21は、加算部20aから供給されたLch出力信号を出力する出力端子21aと、加算部20bから供給されたRch出力信号を出力する出力端子21bと、入力端子11cに入力されるLFEch入力信号をLFEch出力信号として出力する出力端子21cとを含んで構成されている。すなわち、出力端子21は、Lch出力信号、Rch出力信号、及び、LFEch出力信号からなる2.1チャンネルの音声信号の出力を行う。
(音声再生装置の動作)
次に、音声再生装置1の動作について、図2を参照して説明する。図2は、音声再生装置1の動作の流れを示すフローチャートである。
次に、音声再生装置1の動作について、図2を参照して説明する。図2は、音声再生装置1の動作の流れを示すフローチャートである。
音声再生装置1に音声信号が入力されると、スペクトル変換部12は、入力端子11a、11bから入力される音声信号に対するLchスペクトル及びRchスペクトルをそれぞれ算出し、算出したLchスペクトル及びRchスペクトルを共通成分抽出部13及び減算部16に供給する(ステップS1)。
共通成分抽出部13は、供給されたLchスペクトルとRchスペクトルとの共通成分を抽出し、抽出したスペクトルの共通成分を中域選択部14及び乗算部18に供給する(ステップS2)。
中域選択部14は、供給されたスペクトルの共通成分のうち、音声が含まれる帯域である特定の帯域のスペクトルのみを抽出し、抽出した特定帯域のスペクトルを音声区間検出部15に供給する(ステップS3)。
音声区間検出部15は、中域選択部14から供給された特定帯域のスペクトルに基づいて、音声区間を検出し、音声区間検出結果を乗算部18に供給する(ステップS4)。
減算部16は、スペクトル変換部12において算出されたLchスペクトル及びRchスペクトルのそれぞれから、共通成分抽出部13において抽出されたスペクトルの共通成分を減算し、音楽区間検出部17に供給する。音楽区間検出部17は、減算部16から供給されたスペクトルに基づいて、音楽区間を検出し、音楽区間検出結果を乗算部18に供給する(ステップS5)。
乗算部18は、供給された音声区間検出結果及び音楽区間検出結果に基づいて、乗数の値を設定し、設定した乗数に応じて音場制御を行う(ステップS6)。
乗算部18において音場制御された音声信号のスペクトルはそれぞれ、逆変換部19において信号波形に変換される。加算部20においてLchの音声信号及びRchの音声信号のそれぞれに共通成分の音声信号が加算され、出力端子21から出力される(ステップS7)。
なお、入力端子11cに入力されたLFEch入力信号は、そのままLFEch出力信号として出力端子21cから出力される。
(音場制御について)
ここで、ステップS5において行われる音場制御について説明する。
ここで、ステップS5において行われる音場制御について説明する。
乗算部18は、供給された複数の音声区間検出結果及び音楽区間検出結果に基づいて、音場制御の内容を決定する。音場制御の種類としては、「音楽シーン用の音場制御」と「音声シーン用の音場制御」と「音楽と音声との両方が含まれるシーン用の音場制御」とがある。音場制御の状態としては、上記の(A)「音楽シーン用の音場制御」がなされている状態と(B)「音声シーン用の音場制御」がなされている状態と(C)「音楽と音声との両方が含まれるシーン用の音場制御」がなされている状態のほか、(D)音場制御されていない状態(以下ではニュートラルの状態と呼ぶ)の4種類の状態がある。
本実施形態では、複数のチャンネルに対応する音声信号はそれぞれデジタル符号化され、1フレームあたり1024サンプルに分割される。例えば、音声信号のサンプリング周波数が44.1kHzの場合、1フレームあたりの時間は、23ms(=(1÷44100)×1024)となる。音声区間検出部15及び音楽区間検出部17では、連続する複数のフレーム(概ね5フレーム程度)を用いて音声検出処理、あるいは、音楽検出処理が行われるため、乗算部18には、上述の音声区間検出結果及び音楽区間検出結果が約0.105秒(=23ms×5フレーム)ごとに蓄えられる。そして、乗算部18は、供給された最新の連続する10回分(約1.05秒)の音声区間検出結果及び音楽区間検出結果を分析し、音場制御の内容を決定する。
すなわち、乗算部18は、10回分の音楽検出情報と音声検出情報とから、音声が検出された回数と、音楽が検出された回数とをカウントし、音声検出回数、および、音楽検出回数に応じて、上記(A)〜(D)の音場制御の状態を切り替える。
〔実施形態2〕
本発明の他の実施形態について図3に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
本発明の他の実施形態について図3に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
(音声再生装置の構成)
図3に示すように、音声再生装置2は、共通成分抽出部13の代わりに共通成分抽出部33、中域選択部14の代わりに中域選択部34、音声区間検出部15の代わりに音声区間検出部35、音楽区間検出部17の代わりに音楽区間検出部37を備え、音声区間検出部35及び音楽区間検出部37がスペクトル変換部12の機能を有していること以外は、図1に示す音声再生装置1と同じ構成である。
図3に示すように、音声再生装置2は、共通成分抽出部13の代わりに共通成分抽出部33、中域選択部14の代わりに中域選択部34、音声区間検出部15の代わりに音声区間検出部35、音楽区間検出部17の代わりに音楽区間検出部37を備え、音声区間検出部35及び音楽区間検出部37がスペクトル変換部12の機能を有していること以外は、図1に示す音声再生装置1と同じ構成である。
共通成分抽出部33は、複数の音声信号に共通して含まれる、時間軸の信号波形の共通成分を抽出する抽出手段として機能する。具体的には、Lch入力信号とRch入力信号とに共通して含まれる、時間軸の信号波形のうち、最小の成分をその音声信号の共通成分として抽出する。抽出された共通成分は、中域選択部34、減算部16、及び、乗算部18に供給される。
中域選択部34は、複数の音声信号に共通して含まれる、時間軸の信号波形のうち、特定の帯域の成分を濾波する帯域抽出手段として機能する。具体的には、中域選択部34は、低域及び高域の成分を減衰させ、特定の帯域のみを通過させる。中域選択部34は、例えば、バンドパスフィルタによって構成することができる。濾波された特定帯域の時間軸の信号波形は、音声区間検出部15に供給される。
音声区間検出部35は、複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、共通成分に基づき算出する算出手段として機能する。具体的には、音声区間検出部35はまず、中域選択部34から供給された特定帯域の時間軸の信号波形をフレームに分割し、フレーム毎に窓掛けを行った後、1024ポイントのFFTを施してスペクトルに変換する。次に、変換されたスペクトルから基底10の対数スペクトルを算出し、算出した対数スペクトルに対して1024ポイントのIFFTを施し、時間領域のデータであるケプストラムに変換する。次に、ケプストラムの高次側の最大ケプストラムを抽出して、最大ケプストラムとなるケフレンシーの逆数を基本周波数として算出し、算出した基本周波数を低域濾過する。最後に、フレームにおける基本周波数の単調変化を検出することによって、音声信号にフレーズ成分又はアクセント成分の少なくとも何れかが含まれているか否かを判定し、含まれていると判定した場合に、音声区間として検出する。音声区間を検出すると、音声区間検出部35は、音声区間検出結果を乗算部18に供給する。
音楽区間検出部37は、複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、複数の音声信号のそれぞれから共通部分を減算した音声信号に基づき算出する算出する音楽区間算出手段として機能する。具体的には、音楽区間検出部37はまず、減算部16a、16bから供給されたLch音声信号及びRch音声信号に基づいて、音声信号をフレームに分割し、フレーム毎に窓掛けを行った後、1024ポイントのFFTを施してスペクトルに変換する。次に、変換されたスペクトルから基底10の対数スペクトルを算出し、算出した対数スペクトルに対して1024ポイントのIFFTを施し、時間領域のデータであるケプストラムに変換する。次に、ケプストラムの高次側の最大ケプストラムを抽出して、最大ケプストラムとなるケフレンシーの逆数を基本周波数として算出し、算出した基本周波数を低域濾過する。最後に、フレームにおける基本周波数の単調変化を検出することによって、音声信号にフレーズ成分又はアクセント成分の少なくとも何れかが含まれているか否かを判定し、含まれていると判定した場合に、音楽区間として検出する。音楽区間を検出すると、音楽区間検出部37は、音楽区間検出結果を乗算部18に供給する。
(音声再生装置の動作)
次に、音声再生装置2の動作について説明する。
次に、音声再生装置2の動作について説明する。
音声再生装置2に音声信号が入力されると、共通成分抽出部33は、供給されたLch入力信号とRch入力信号との時間軸の信号波形の共通成分を抽出し、抽出した共通成分を中域選択部34及び乗算部18に供給する。
中域選択部34は、供給された共通成分のうち、音声が含まれる帯域である特定の帯域のみを抽出し、抽出した特定帯域の音声信号を音声区間検出部35に供給する。
音声区間検出部35は、中域選択部34から供給された特定帯域の音声信号をスペクトル変換し、変換したスペクトルに基づいて、音声区間を検出し、音声区間検出結果を乗算部18に供給する。
減算部16は、Lch入力信号及びRch入力信号のそれぞれから、共通成分抽出部13において抽出された音声信号の共通成分を減算し、音楽区間検出部37に供給する。音楽区間検出部37は、減算部16から供給された音声信号をスペクトル変換し、変換したスペクトルに基づいて、音楽区間を検出し、音楽区間検出結果を乗算部18に供給する。
乗算部18に音声区間検出結果及び音楽区間検出結果が供給された後の音声再生装置2の動作は、図2に示したステップS6以降の動作と同じであるため、説明を省略する。
〔実施形態3〕
本発明の他の実施形態について図4及び図5に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
本発明の他の実施形態について図4及び図5に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
(音声再生装置の構成)
図4は、本実施形態に係る音声再生装置3の構成を示すブロック図である。図4に示すように、音声再生装置3は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’、乗算部18の代わりに乗算部18’、逆変換部19の代わりに逆変換部19’とし、減算部16及び加算部20の代わりに出力信号縮退部22を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
図4は、本実施形態に係る音声再生装置3の構成を示すブロック図である。図4に示すように、音声再生装置3は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’、乗算部18の代わりに乗算部18’、逆変換部19の代わりに逆変換部19’とし、減算部16及び加算部20の代わりに出力信号縮退部22を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
入力端子11’は、入力端子11a、11b、11cに加え、左サラウンドチャンネル(LSch)に対応する左側サラウンド音声信号であるLSch入力信号が入力される入力端子11d、センターチャンネル(Cch)に対応するセンターチャンネル音声信号であるCch入力信号が入力される入力端子11e、及び、右サラウンドチャンネル(RSch)に対応する右側サラウンド音声信号であるRSch入力信号が入力される入力端子11fを含んでいること以外は、実施形態1の入力端子11と同じ構成である。すなわち、入力端子11は、LSch入力信号、Lch入力信号、Cch入力信号、Rch入力信号、RSch入力信号、及び、LFEch入力信号からなる5.1チャンネルの音声信号の入力を受け付ける。
スペクトル変換部12’は、スペクトル変換部12a、12bに加え、入力端子11eから入力されたCch入力信号のスペクトルを算出するスペクトル変換部12cを含んでいること以外は実施形態1のスペクトル変換部12と同じ構成である。
乗算部18’は、乗算部18a、18cに加え、LSch入力信号に乗数を乗する乗算部18d、RSch音声信号に乗数を乗する乗算部18e、及び、Cchスペクトルに乗数を乗する乗算部18fを含んでいること以外は、実施形態1の乗算部18と同じ構成である。
逆変換部19’は、逆変換部19a、19cに加え、乗算部18fから供給されたCchスペクトルに対して逆FFTを行う逆変換部19dを含んでいること以外は、実施形態1の逆変換部19と同じ構成である。
出力信号縮退部22は、乗算部18d、18e、逆変換部19a〜19cの5つのチャンネルから供給された音声信号にそれぞれ所定のダウンミックス係数を乗することによって重み付けを行い、Lch出力信号、及び、Rch出力信号の2つのチャンネルの音声信号に縮退させる手段である。なお、本実施形態では、複数チャンネルの入力をダウンミックスによって縮退する構成を示したが、本発明はこれに限定されるものではなく、例えば、複数チャンネルを2チャンネルのバーチャルサラウンドに変換することによって縮退する構成を採用してもよい。
(音声再生装置の動作)
次に、音声再生装置3の動作について、図5を参照して説明する。図5は、音声再生装置3の動作の流れを示すフローチャートである。
次に、音声再生装置3の動作について、図5を参照して説明する。図5は、音声再生装置3の動作の流れを示すフローチャートである。
音声再生装置3に音声信号が入力されると、スペクトル変換部12’は入力端子11a、11b及び11eから入力される音声信号に対するLchスペクトル、Rchスペクトル、及び、Cchスペクトルをそれぞれ算出する(ステップS11)。スペクトル変換部12’は算出したスペクトルのうちCchスペクトルを中域選択部14及び乗算部18’に供給し、算出したスペクトルのうちLchスペクトル及びRchスペクトルを音楽区間検出部17及び乗算部18’に供給する。
中域選択部14は、供給されたCchスペクトルのうち、音声が含まれる帯域である特定の帯域のスペクトルのみを抽出し、抽出した特定帯域のスペクトルを音声区間検出部15に供給する(ステップS12)。
音声区間検出部15は、中域選択部14から供給された特定帯域のスペクトルに基づいて、音声区間を検出し、音声区間検出結果を乗算部18’に供給する(ステップS13)。
音楽区間検出部17は、スペクトル変換部12’から供給されたLchスペクトル及びRchスペクトルに基づいて、音楽区間を検出し、音楽区間検出結果を乗算部18’に供給する(ステップS14)。
乗算部18’は、供給された音声区間検出結果及び音楽区間検出結果に基づいて、乗数の値を設定し、設定した乗数に応じて音場制御を行う(ステップS15)。
乗算部18’において音場制御された音声信号のスペクトルは、逆変換部19において信号波形に変換される(ステップS16)。
乗算部18’において音場制御された音声信号、及び、逆変換部19において信号波形に変換された音声信号は、出力信号縮退部22においてLch出力信号及びRch出力信号の2チャンネルの出力信号に縮退され、出力端子21から出力される(ステップS17)。
なお、入力端子11cに入力されたLFEch入力信号は、そのままLFEch出力信号として出力端子21cから出力される。
〔実施形態4〕
本発明の他の実施形態について図6及び図7に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
本発明の他の実施形態について図6及び図7に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
(音声再生装置の構成)
図6、本実施形態に係る音声再生装置4の構成を示すブロック図である。図6に示すように、音声再生装置4は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’’、乗算部18の代わりに乗算部18’、逆変換部19の代わりに逆変換部19dとし、減算部16及び加算部20の代わりに出力信号縮退部22、及び、入力信号縮退部23(縮退手段)を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
図6、本実施形態に係る音声再生装置4の構成を示すブロック図である。図6に示すように、音声再生装置4は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’’、乗算部18の代わりに乗算部18’、逆変換部19の代わりに逆変換部19dとし、減算部16及び加算部20の代わりに出力信号縮退部22、及び、入力信号縮退部23(縮退手段)を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
入力端子11’は、入力端子11a、11b、11cに加え、LSch入力信号が入力される入力端子11d、Cch入力信号が入力される入力端子11e、及び、RSch入力信号が入力される入力端子11fを含んでいること以外は、実施形態1の入力端子11と同じ構成である。すなわち、入力端子11は、LSch入力信号、Lch入力信号、Cch入力信号、Rch入力信号、RSch入力信号、及び、LFEch入力信号からなる5.1チャンネルの音声信号の入力を受け付ける。
入力信号縮退部23は、センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号を縮退して縮退信号を生成する縮退手段として機能する。具体的には、入力端子11a、11b、11d及び11fから入力される音声信号にそれぞれ所定のダウンミックス係数を乗することによって重み付けを行い、1チャンネルの縮退音声信号に変換する手段である。なお、本実施形態では、複数チャンネルの入力をダウンミックスによって縮退する構成を示したが、本発明はこれに限定されるものではなく、例えば、複数チャンネルをバーチャルサラウンドに変換することによって縮退する構成を採用してもよい。
スペクトル変換部12’’は、入力端子11eから入力されたCch入力信号のスペクトルを算出するスペクトル変換部12c、及び、入力信号縮退部23から供給された縮退音声信号のスペクトルを算出するスペクトル変換部12dを含んでいること以外は実施形態1のスペクトル変換部12と同じ構成である。
乗算部18’は、乗算部18a、18cに加え、LSch入力信号に乗数を乗する乗算部18d、RSch音声信号に乗数を乗する乗算部18e、及び、Cchスペクトルに乗数を乗する乗算部18fを含んでいること以外は、実施形態1の乗算部18と同じ構成である。
逆変換部19d、乗算部18fから供給されたCchスペクトルに対して逆FFTを行うこと以外は、実施形態1の逆変換部19と同じ構成である。
出力信号縮退部22は、乗算部18a、18c、18d、18e、及び、逆変換部19dの5つのチャンネルから供給された音声信号にそれぞれ所定のダウンミックス係数を乗することによって重み付けを行い、Lch出力信号、及び、Rch出力信号の2つのチャンネルの音声信号に縮退させる手段である。なお、本実施形態では、複数チャンネルの入力をダウンミックスによって縮退する構成を示したが、本発明はこれに限定されるものではなく、例えば、複数チャンネルをバーチャルサラウンドに変換することによって縮退する構成を採用してもよい。
(音声再生装置の動作)
次に、音声再生装置4の動作について、図7を参照して説明する。図7は、音声再生装置4の動作の流れを示すフローチャートである。
次に、音声再生装置4の動作について、図7を参照して説明する。図7は、音声再生装置4の動作の流れを示すフローチャートである。
音声再生装置4に音声信号が入力されると、入力端子11a、11b、11d及び11fに入力された音声信号は乗算部18’及び入力信号縮退部23に供給される。入力信号縮退部23は、供給された音声信号を1チャンネルの縮退音声信号に変換し、スペクトル変換部12dに供給する(ステップS21)。
スペクトル変換部12c、12dは、入力端子11eに入力されたCch入力信号、入力信号縮退部23から供給された縮退音声信号に対するスペクトルをそれぞれ算出し、算出したCchスペクトルを中域選択部14及び乗算部18fに供給し、縮退音声信号に対するスペクトルを音楽区間検出部17に供給する(ステップS22)。
中域選択部14は、供給されたCchスペクトルのうち、音声が含まれる帯域である特定の帯域のスペクトルのみを抽出し、抽出した特定帯域のスペクトルを音声区間検出部15に供給する(ステップS23)。
音声区間検出部15は、中域選択部14から供給された特定帯域のスペクトルに基づいて、音声区間を検出し、音声区間検出結果を乗算部18’に供給する(ステップS24)。
音楽区間検出部17は、スペクトル変換部12dから供給された縮退音声信号に対するスペクトルに基づいて音楽区間を検出し、音楽区間検出結果を乗算部18’に供給する(ステップS25)。
乗算部18’は、供給された音声区間検出結果及び音楽区間検出結果に基づいて、乗数の値を設定し、設定した乗数に応じて音場制御を行う(ステップS26)。
乗算部18’において音場制御されたCchスペクトルは、逆変換部19dにおいて信号波形に変換される(ステップS27)。
乗算部18’において音場制御された音声信号、及び、逆変換部19dにおいて信号波形に変換されたCchの音声信号は、出力信号縮退部22においてLch出力信号及びRch出力信号の2チャンネルの出力信号に縮退され、出力端子21から出力される(ステップS28)。
なお、入力端子11cに入力されたLFEch入力信号は、そのままLFEch出力信号として出力端子21cから出力される。
〔実施形態5〕
本発明の他の実施形態について図8及び図9に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
本発明の他の実施形態について図8及び図9に基づいて説明する。なお、説明の便宜上、実施形態1の構成要素と同様の機能を有する構成要素には同一の番号を付し、その説明を省略する。本実施形態では、主に、実施形態1との相違点について説明するものとする。
(音声再生装置の構成)
図8、本実施形態に係る音声再生装置4の構成を示すブロック図である。図8に示すように、音声再生装置5は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’’’、乗算部18の代わりに乗算部18’’、逆変換部19の代わりに逆変換部19’’とし、減算部16及び加算部20の代わりに出力信号縮退部22’、及び、入力信号縮退部23’を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
図8、本実施形態に係る音声再生装置4の構成を示すブロック図である。図8に示すように、音声再生装置5は、入力端子11の代わりに入力端子11’、スペクトル変換部12の代わりにスペクトル変換部12’’’、乗算部18の代わりに乗算部18’’、逆変換部19の代わりに逆変換部19’’とし、減算部16及び加算部20の代わりに出力信号縮退部22’、及び、入力信号縮退部23’を備えていること以外は実施形態1の音声再生装置1と同じ構成である。
入力端子11’は、入力端子11a、11b、11cに加え、LSch入力信号が入力される入力端子11d、Cch入力信号が入力される入力端子11e、及び、RSch入力信号が入力される入力端子11fを含んでいること以外は、実施形態1の入力端子11と同じ構成である。すなわち、入力端子11は、LSch入力信号、Lch入力信号、Cch入力信号、Rch入力信号、RSch入力信号、及び、LFEch入力信号からなる5.1チャンネルの音声信号の入力を受け付ける。
入力信号縮退部23’は、センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号を縮退して縮退信号を生成する縮退手段として機能する。具体的には、入力端子11a及び11d、入力端子11b及び11fのそれぞれから入力される音声信号に所定のダウンミックス係数を乗することによって重み付けを行い、縮退音声信号に変換する手段である。入力信号縮退部23’は、入力端子11a及び11dから入力されるLch入力信号及びLSch入力信号を1チャンネルのLch縮退入力信号に変換する入力信号縮退部23a、入力端子11b及び11fから入力されるRch入力信号及びRSch入力信号を1チャンネルのRch縮退入力信号に変換する入力信号縮退部23bを含んで構成される。なお、本実施形態では、複数チャンネルの入力をダウンミックスによって縮退する構成を示したが、本発明はこれに限定されるものではなく、例えば、複数チャンネルを2チャンネルのバーチャルサラウンドに変換することによって縮退する構成を採用してもよい。
スペクトル変換部12’’’は、入力端子11eから入力されたCch入力信号のスペクトルを算出するスペクトル変換部12c、入力信号縮退部23aから供給されたLch縮退入力信号のスペクトルを算出するスペクトル変換部12e、及び、入力信号縮退部23bから供給されたRch縮退入力信号のスペクトルを算出するスペクトル変換部12fを含んでいること以外は実施形態1のスペクトル変換部12と同じ構成である。
乗算部18’’は、Lch縮退入力信号のスペクトルに乗数を乗する乗算部18g、Rch縮退入力信号のスペクトルに乗数を乗する乗算部18h、及び、Cchスペクトルに乗数を乗する乗算部18fを含んでいること以外は、実施形態1の乗算部18と同じ構成である。
逆変換部19’’は、乗算部18gから供給されたLch縮退入力信号のスペクトルに対して逆FFTを行う逆変換部19eと、乗算部18fから供給されたCchスペクトルに対して逆FFTを行う逆変換部19dと、乗算部18hから供給されたRch縮退入力信号のスペクトルに対して逆FFTを行う逆変換部19fとを含んでいること以外は、実施形態1の逆変換部19と同じ構成である。
出力信号縮退部22’は、逆変換部19’’から供給された3チャンネルの音声信号にそれぞれ所定のダウンミックス係数を乗することによって重み付けを行い、Lch出力信号、及び、Rch出力信号の2つのチャンネルの音声信号に縮退させる手段である。なお、本実施形態では、複数チャンネルの入力をダウンミックスによって縮退する構成を示したが、本発明はこれに限定されるものではなく、例えば、複数チャンネルを2チャンネルのバーチャルサラウンドに変換することによって縮退する構成を採用してもよい。
(音声再生装置の動作)
次に、音声再生装置5の動作について、図9を参照して説明する。図9は、音声再生装置5の動作の流れを示すフローチャートである。
次に、音声再生装置5の動作について、図9を参照して説明する。図9は、音声再生装置5の動作の流れを示すフローチャートである。
音声再生装置5に音声信号が入力されると、入力端子11a及び11dに入力された音声信号、及び、入力端子11b及び11fに入力された音声信号は入力信号縮退部23’に供給される。入力信号縮退部23aは、入力端子11a及び11dから入力された音声信号を1チャンネルの縮退音声信号に変換し、Lch縮退信号を生成する(ステップS31a)。入力信号縮退部23bは、入力端子11b及び11fから入力された音声信号を1チャンネルの縮退音声信号に変換し、Rch縮退信号を生成する(ステップS31b)。生成されたLch縮退信号及びRch縮退信号は、スペクトル変換部12’’’に供給される。
スペクトル変換部12’’’は、入力端子11eに入力されたCch入力信号、入力信号縮退部23’から供給されたLch縮退信号、及び、Rch縮退信号に対するスペクトルをそれぞれ算出し、算出したCchスペクトルを中域選択部14及び乗算部18’’に供給し、Lch縮退信号及びRch縮退信号に対するスペクトルを音楽区間検出部17及び乗算部18’’に供給する(ステップS32)。
中域選択部14は、供給されたCchスペクトルのうち、音声が含まれる帯域である特定の帯域のスペクトルのみを抽出し、抽出した特定帯域のスペクトルを音声区間検出部15に供給する(ステップS33)。
音声区間検出部15は、中域選択部14から供給された特定帯域のスペクトルに基づいて、音声区間を検出し、音声区間検出結果を乗算部18’’に供給する(ステップS34)。
音楽区間検出部17は、スペクトル変換部12dから供給されたLch縮退信号及びRch縮退信号に対するスペクトルに基づいて音楽区間を検出し、音楽区間検出結果を乗算部18’’に供給する(ステップS35)。
乗算部18’’は、供給された音声区間検出結果及び音楽区間検出結果に基づいて、乗数の値を設定し、設定した乗数に応じて音場制御を行う(ステップS36)。
乗算部18’’において音場制御されたスペクトルは、逆変換部19’’において信号波形に変換される(ステップS37)。
逆変換部19’’において信号波形に変換された音声信号は、出力信号縮退部22’においてLch出力信号及びRch出力信号の2チャンネルの出力信号に縮退され、出力端子21から出力される(ステップS38)。
なお、入力端子11cに入力されたLFEch入力信号は、そのままLFEch出力信号として出力端子21cから出力される。
(プログラムおよび記録媒体)
音声再生装置1、2、3、4、5に含まれている各ブロックは、ハードウェアロジックによって構成してもよいし、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
音声再生装置1、2、3、4、5に含まれている各ブロックは、ハードウェアロジックによって構成してもよいし、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
すなわち、音声再生装置1、2、3、4、5は、各機能を実現するプログラムの命令を実行するMPUなどのCPU、このプログラムを格納したROM(Read Only Memory)、上記プログラムを実行可能な形式に展開するRAM(Random Access Memory)、および、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)を備えている。
そして、本発明の目的は、音声再生装置1、2、3、4、5のプログラムメモリに固定的に担持されている場合に限らず、上記プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、又は、ソースプログラム)を記録した記録媒体を音声再生装置1、2、3、4、5に供給し、音声再生装置1、2、3、4、5が上記記録媒体に記録されている上記プログラムコードを読み出して実行することによっても、達成可能である。
上記記録媒体は、特定の構造又は種類のものに限定されない。すなわちこの記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。
また、音声再生装置1、2、3、4、5を通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して音声再生装置1、2、3、4、5に供給する。この通信ネットワークは音声再生装置1、2、3、4、5にプログラムコードを供給できるものであればよく、特定の種類又は形態に限定されない。たとえばインターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等であればよい。
この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成又は種類のものに限定されない。たとえばIEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。
本発明に係る音声信号処理装置は、テレビに好適に適用することができる。
1、2、3、4、5 音声再生装置
11、11’ 入力端子
12、12’、12’’、12’’’ スペクトル変換部
13 共通成分抽出部(抽出手段)
14 中域選択部(帯域抽出手段)
15 音声区間検出部(算出手段)
16 減算部
17 音楽区間検出部(音楽区間算出手段)
18、18’、18’’ 乗算部(重み係数変更手段)
19、19’、19’’ 逆変換部
20 加算部
21 出力端子
22、22’ 出力信号縮退部
23、23’ 入力信号縮退部(縮退手段)
33 共通成分抽出部(抽出手段)
34 中域選択部(帯域抽出手段)
35 音声区間検出部(算出手段)
37 音楽区間検出部(音楽区間算出手段)
11、11’ 入力端子
12、12’、12’’、12’’’ スペクトル変換部
13 共通成分抽出部(抽出手段)
14 中域選択部(帯域抽出手段)
15 音声区間検出部(算出手段)
16 減算部
17 音楽区間検出部(音楽区間算出手段)
18、18’、18’’ 乗算部(重み係数変更手段)
19、19’、19’’ 逆変換部
20 加算部
21 出力端子
22、22’ 出力信号縮退部
23、23’ 入力信号縮退部(縮退手段)
33 共通成分抽出部(抽出手段)
34 中域選択部(帯域抽出手段)
35 音声区間検出部(算出手段)
37 音楽区間検出部(音楽区間算出手段)
Claims (18)
- センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、
前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、
前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する算出手段と、を備えている
ことを特徴とする音声再生装置。 - 前記複数の音声信号に共通して含まれる共通成分のうち、特定の帯域を濾波または選択する帯域抽出手段を更に備え、
前記算出手段は、前記複数の音声信号における、前記音声区間と前記非音声区間とを、前記帯域抽出手段によって濾波または選択された前記特定の帯域の共通成分に基づき算出する
ことを特徴とする請求項1に記載の音声再生装置。 - 前記帯域抽出手段によって濾波または選択される前記特定の帯域は略100Hzから略8kHzである、
ことを特徴とする請求項2に記載の音声再生装置。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、
前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する算出手段を備えている
ことを特徴とする音声再生装置。 - 前記算出手段によって算出された前記音声区間と前記非音声区間とに基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する重み係数変更手段を更に備えている
ことを特徴とする請求項1から4の何れか1項に記載の音声再生装置。 - 前記重み係数変更手段は、前記算出手段によって算出された前記音声区間において、前記共通成分又は前記センターチャンネルの何れかに個別に対応する前記重み係数を大きい値に変更する
ことを特徴とする請求項5に記載の音声再生装置。 - センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、
前記複数の音声信号に共通して含まれる共通成分を抽出する抽出手段と、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する音楽区間算出手段と、を備えている
ことを特徴とする音声再生装置。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号の少なくとも何れかに基づき算出する音楽区間算出手段を備えている
ことを特徴とする音声再生装置。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置であって、
前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する縮退手段と、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記縮退信号に基づき算出する音楽区間算出手段と、を備えている
ことを特徴とする音声再生装置。 - 前記音楽区間算出手段によって算出された前記音楽区間と前記非音楽区間とに基づいて、前記複数の音声信号、前記共通成分及び前記共通成分を減算して生成した音声信号の何れかに個別に対応する重み係数を変更する重み係数変更手段を更に備えている
ことを特徴とする請求項7から9の何れか1項に記載の音声再生装置。 - 前記重み係数変更手段は、前記音楽区間算出手段によって算出された前記音楽区間において、前記共通成分、又は、前記センターチャンネル及び前記LFEチャンネル以外チャンネルの何れかに個別に対応する前記重み係数を大きい値に変更する
ことを特徴とする請求項10に記載の音声再生装置。 - センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、
前記複数の音声信号に共通して含まれる共通成分を抽出する抽出ステップと、
前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記共通成分に基づき算出する算出ステップと、を含んでいる
ことを特徴とする音声再生方法。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、
前記複数の音声信号における、音声を含む音声区間と、音声を含まない非音声区間とを、前記センターチャンネルに対応する音声信号に基づき算出する算出ステップを含んでいる
ことを特徴とする音声再生方法。 - センターチャンネル以外の複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、
前記複数の音声信号に共通して含まれる共通成分を抽出する抽出ステップと、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記複数の音声信号のそれぞれから前記共通成分を減算した音声信号に基づき算出する音楽区間算出ステップと、を含んでいる
ことを特徴とする音声再生方法。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号に基づき算出する音楽区間算出ステップを含んでいる
ことを特徴とする音声再生方法。 - センターチャンネルを含む複数のチャンネルの何れかに個別に対応する複数の音声信号が入力される音声再生装置の音声再生方法であって、
前記センターチャンネル及びLFEチャンネル以外のチャンネルの何れかに個別に対応する音声信号にダウンミックスを行い、チャンネル数を縮退して縮退信号を生成する縮退ステップと、
前記複数の音声信号における、音楽を含む音楽区間と、音楽を含まない非音楽区間とを、前記縮退信号に基づき算出する音楽区間算出ステップと、を含んでいる
ことを特徴とする音声再生方法。 - コンピュータを請求項1から11までの何れか1項に記載の音声再生装置として動作させるためのプログラムであって、前記コンピュータを前記音声再生装置として機能させるためのプログラム。
- 請求項17に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010163363A JP2012027101A (ja) | 2010-07-20 | 2010-07-20 | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010163363A JP2012027101A (ja) | 2010-07-20 | 2010-07-20 | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012027101A true JP2012027101A (ja) | 2012-02-09 |
Family
ID=45780128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010163363A Pending JP2012027101A (ja) | 2010-07-20 | 2010-07-20 | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012027101A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017503395A (ja) * | 2013-12-13 | 2017-01-26 | アンビディオ,インコーポレイテッド | サウンドステージ拡張用の装置及び方法 |
JP7435948B2 (ja) | 2019-11-18 | 2024-02-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 収音装置、収音方法及び収音プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
WO2009035615A1 (en) * | 2007-09-12 | 2009-03-19 | Dolby Laboratories Licensing Corporation | Speech enhancement |
JP2009194877A (ja) * | 2008-02-18 | 2009-08-27 | Sharp Corp | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 |
JP2009193031A (ja) * | 2008-02-18 | 2009-08-27 | Sharp Corp | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 |
JP2011141540A (ja) * | 2009-12-09 | 2011-07-21 | Sharp Corp | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 |
-
2010
- 2010-07-20 JP JP2010163363A patent/JP2012027101A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
WO2009035615A1 (en) * | 2007-09-12 | 2009-03-19 | Dolby Laboratories Licensing Corporation | Speech enhancement |
JP2009194877A (ja) * | 2008-02-18 | 2009-08-27 | Sharp Corp | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 |
JP2009193031A (ja) * | 2008-02-18 | 2009-08-27 | Sharp Corp | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 |
JP2011141540A (ja) * | 2009-12-09 | 2011-07-21 | Sharp Corp | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017503395A (ja) * | 2013-12-13 | 2017-01-26 | アンビディオ,インコーポレイテッド | サウンドステージ拡張用の装置及び方法 |
JP7435948B2 (ja) | 2019-11-18 | 2024-02-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 収音装置、収音方法及び収音プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101935183B1 (ko) | 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치 | |
US8731209B2 (en) | Device and method for generating a multi-channel signal including speech signal processing | |
US9282419B2 (en) | Audio processing method and audio processing apparatus | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
US9326085B2 (en) | Device and method for generating an ambience signal | |
EP2194733B1 (en) | Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus. | |
JP5012995B2 (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
TW201030736A (en) | An apparatus for processing an audio signal and method thereof | |
JP2002078100A (ja) | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 | |
JP2013190470A (ja) | 音響信号処理装置および音響信号処理方法 | |
JP2010136080A (ja) | 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器 | |
JP5577787B2 (ja) | 信号処理装置 | |
JP2003274492A (ja) | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム | |
JP5307770B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP2012027101A (ja) | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP5316560B2 (ja) | 音量補正装置、音量補正方法および音量補正プログラム | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 | |
JP2012100117A (ja) | 音響処理装置及び方法 | |
JP6314803B2 (ja) | 信号処理装置、信号処理方法及びプログラム | |
JP6519507B2 (ja) | 音響信号の転送方法及び再生装置 | |
US9653065B2 (en) | Audio processing device, method, and program | |
JP2015065551A (ja) | 音声再生システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131224 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140422 |