JP2009025500A - ナレーション音声制御装置並びに制御方法 - Google Patents

ナレーション音声制御装置並びに制御方法 Download PDF

Info

Publication number
JP2009025500A
JP2009025500A JP2007187698A JP2007187698A JP2009025500A JP 2009025500 A JP2009025500 A JP 2009025500A JP 2007187698 A JP2007187698 A JP 2007187698A JP 2007187698 A JP2007187698 A JP 2007187698A JP 2009025500 A JP2009025500 A JP 2009025500A
Authority
JP
Japan
Prior art keywords
signal
input signal
band
phase
phase component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007187698A
Other languages
English (en)
Other versions
JP2009025500A5 (ja
JP4970174B2 (ja
Inventor
Haruo Hamada
晴夫 浜田
Yoshitaka Murayama
好孝 村山
Setsu Komiyama
摂 小宮山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIMAGIC KK
Japan Broadcasting Corp
Original Assignee
DIMAGIC KK
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DIMAGIC KK, Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical DIMAGIC KK
Priority to JP2007187698A priority Critical patent/JP4970174B2/ja
Publication of JP2009025500A publication Critical patent/JP2009025500A/ja
Publication of JP2009025500A5 publication Critical patent/JP2009025500A5/ja
Application granted granted Critical
Publication of JP4970174B2 publication Critical patent/JP4970174B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】複数の音源がミキシングされて配信されたオーディオ信号に対し、受聴者により各音源の音量バランスの調整を可能とし、受聴者個人にあった音量バランスで再生を行う。
【解決手段】
複数の音源がミキシングされたマルチチャネル信号に対し、音源定位する位置、必要となる音源の帯域を任意に指定し、相関と周波数選択フィルタにより必要成分の抽出・分離を行い、出力された信号の音量バランスを制御し、再度ミキシングした上で、再生装置を用いて再生を行う。
【選択図】図1

Description

本発明は、ステレオ2チャンネルで配信される音声信号に含まれるナレーション音声の聴き取りやすさを制御するための装置並びにその制御方法に関するものである。
近年、高齢者の増加に伴い、聴き取りやすさに配慮した各種コンテンツの配信が求められている。しかしながら、聴き取りやすさに対する認識についての個人差は大きく、すべての受聴者を満足するような最適な音量バランスというものを実現することは極めて困難である。
ナレーションと背景音や効果音との関係についても、テレビ受像機をはじめ各種受信端末の側で、ナレーション音声を聞き取りやすくするための対策が打たれるようになってきた。しかし、ナレーション音声の聴き取りやすさは、背景音や効果音との音量差、ナレーション音声の速度、声質等に依存するため、何人にも適した対策を行うことは容易ではない。
従来、特許文献1〜3に示すように、ナレーション音声の聴き取りやすさを向上させる仕組みとして、人間の音声の帯域を強調するような特性補正、高齢者の耳にあわせた比較的高い周波数帯の音を強調するような方法がとられてきた。しかしながら、ナレーション音声の背景音や効果音が、人間の声の帯域と同じ成分を多く持つときに、ナレーション音声とともに強調されてしまい、かえってバランスの崩れた聴き取りづらい音となってしまうという問題が生じていた。
特開2001-333035号公報 特開2003-131686号公報 特開2003-244081号公報
本発明は、上記のような従来技術の問題点を解決するために提案されたものであり、その目的は、背景音や効果音などの音声とナレーションナレーションの音量差を受聴者側で制御するための手段を提供することにある。
上記の目的を達成するために、本発明のナレーション音声制御装置並びに制御方法は、2チャンネルの音声信号中から、同相成分であるナレーション音声信号のみを抽出し、このナレーション音声信号に対して増幅・減衰・フィルタ処理などの処理を施した後、同相成分値を抽出した2チャンネルの音声信号に対して、処理済みのナレーション信号を加算することで、音声信号中のナレーション音声信号のみに対して、種々の処理を施すことを特徴とする。
すなわち、ステレオ2チャンネルで配信される音声信号に含まれるナレーション音声の多くは、2チャンネルステレオスピーカで再生した場合、ヘッドホンで再生した場合に、最適な受聴位置において、中央にから聞こえるように設定されている。すなわち2チャンネルそれぞれに等しくナレーション音声の信号が含まれていることを意味している。
そのため、ナレーション音声を構成するどの周波数対をとっても、ステレオ2チャンネルL,R間でのナレーション音声の成分の関係は、同振幅、同位相である。従って、あらかじめ定位位置が一定であることがある程度保障されているナレーション音声は同相同振幅な信号に含まれているということになる。
そこで、本件発明は、2チャンネルの音声信号中から、同相成分であるナレーション音声信号のみを抽出し、このナレーション音声信号に対して増幅・減衰・フィルタ処理などの処理を施した後、同相成分値を抽出した2チャンネルの音声信号に対して、処理済みのナレーション信号を加算することで、音声信号中のナレーション音声信号のみに対して、種々の処理を施すことを可能としたものである。
以上のような構成を有する本発明においては、従来の音声の特性のみを考慮したフィルタリング処理だけではなく、ナレーション音声がステレオ2チャンネル再生の時に一般的に中央に定位するように作られるということから、同相同振幅である信号を抽出する手段を組み入れることで、ナレーション音声とそれ以外の音の分離性能を従来手法よりも高めることが可能となる。特に、テレビ受像器、ラジオなどの放送受信端末内部に実装することで、任意の音源を受聴者自身に調整する手段を提供することができる。
次に、本発明の一実施形態を図面に従って具体的に説明する。
(1)実施形態の全体構成
図1において、INLはステレオ2チャンネル信号における左側入力信号、INRはステレオ2チャンネル信号における右側入力信号、OUTLは左側出力信号、OUTRは右側出力信号、Mは同相成分抽出処理により発生する遅延数、Z-MはMサンプル分の遅延器、Nは帯域の分割数、αは抽出された信号に対する利得であって、この利得α=1.0の時、左側入力信号INLと左側出力信号OUTL,右側入力信号INRと右側出力信号OUTRは等しくなる。
2チャンネルステレオ信号LとRを、ナレーション音声信号CNA、Lに含まれる背景音及び効果音LBとRに含まれる背景音及び効果音RBの和により表現すると式(1)のようになる。
Figure 2009025500
次に、各チャンネル間で同相な信号をC、無相関な信号をL0,R0とすると、2チャンネルステレオ信号L,Rは式(2)とも表すことができる。
Figure 2009025500
式(1)、式(2)の定義より、背景音及び効果音LB,RBに含まれる同相信号成分CBとしたとき、ナレーション音声信号CNAは(3)式のように表される。
Figure 2009025500
同様にして、背景音および効果音LB,RBは、式(4)のようにあらわすこともできる。
Figure 2009025500
ただし、各式は、ある時刻kにおけるN個の要素からなる以下のようなベクトルとする。
Figure 2009025500
本実施形態の装置は、前記のようにして表現された各信号を処理するために、次のような手段を備えている。まず、ステレオ2チャンネル信号における左側入力信号INLの入力部20Lと、右側入力信号INRの入力部20Rとを備えている。
これらの入力部20L,20Rの出力は、周波数分割フィルタ21に入力され、複数の帯域1〜N(本実施形態では5つの帯域)に分割されると共に、この周波数分割フィルタ21に設けられたダウンサンプリング器22により低い周波数により再サンプリングがなされる。
すなわち、本実施形態では、周波数分割フィルタ21及びダウンサンプリング器22により、元々サンプリング周波数が48000[Hz]の2チャンネルのステレオ音源に対し、帯域を5つに分割し、一番下の帯域をサンプリング周波数1500[Hz]、2番目の帯域に対するサンプリング周波数を3000[Hz]、同様に3番目について6000[Hz]、4番目について12000[Hz]、5番目について24000[Hz]とし、それぞれ帯域幅を120〜400[Hz]、400〜1000[Hz]、1000〜2000[Hz]、2000〜4000[Hz]、4000〜8000[Hz]となるように帯域分割した。
ダウンサンプリング器22から出力される各帯域の右側入力信号と左側入力信号は、それぞれの帯域ごとに設けられた同相成分抽出器23〜23に入力される。この同相成分抽出器23〜23の構成並びに作用効果については、後述する(2)同相成分抽出器の項で説明する。
各帯域の同相成分抽出器23〜23の出力である同相信号C〜Cはアップサンプリング器24に入力され、このアップサンプリング器24において、2チャンネルのステレオ音源と同じ高いサンプリング周波数で再サンプリングされる。
この再サンプリングされた同相信号C〜Cは、帯域ごとに設けられた増幅器25〜25によって、必要に応じて各帯域別に増幅・減衰された後、加算器26に出力され、この加算器26において加算されることにより、前記周波数分割フィルタ21において分割された帯域分の同相成分が合算されて、左側入力信号INLと右側入力信号INR中のすべての同相成分Cが抽出される。
この抽出され、合算された全体域の同相成分Cは、左側入力信号INLと右側入力信号INRとの減算用演算器27L,27Rに出力される。この減算用演算器27L,27Rには、前記左側入力信号INLと右側入力信号INRが、遅延処理器28L,28Rを介して入力される。この遅延処理器28L,28Rは、前記同相成分抽出器23〜23及び加算器26を通過した同相成分Cと、左側入力信号INLと右側入力信号INRとを同期させるものである。
減算用演算器27L,27Rにおいては、左側入力信号INLと右側入力信号INRのそれぞれから同相成分Cが減算され、左側入力信号INLと右側入力信号INRの無相関信号部分L0,R0のみが取り出される。ここで、同相成分Cは、本実施形態におけるナレーション音声信号であり、無相関信号部分L0,R0は背景音や効果音など、左右のチャンネル間で相関のない音声信号である。
一方、前記加算器26から出力された同相成分Cは、その後段に設けられた音声帯域強調用などの処理を行うフィルタ29に出力される。このフィルタ29は、例えば、加算器26から出力された同相成分C中のナレーション音声信号CNAを強調するもの、すなわち同相成分C中の背景音及び効果音LB,RBに含まれる同相信号成分CBを除去するものである。
なお、このフィルタ29としては、単に音声帯域強調用に限らず、ユーザの希望に合わせてその他の処理(帯域強調・減衰、ピークカットなど)を与えるものを使用することもできる。
このフィルタ29からの出力であるナレーション音声信号CNAは、フィルタ29の後段に設けられた利得αを与える増幅器30に出力される。この増幅器30は、ユーザが適宜その利得αを調整可能なものである。
フィルタ29からの出力信号であるナレーション音声信号CNAは、同相成分合算用の演算器31L,31Rに出力される。この同相成分合算用の演算器31L,31Rには、前記減算用演算器27L,27Rから出力された無相関信号部分のみが取り出された左側入力信号INLと右側入力信号INRと、フィルタ処理済みのナレーション音声信号CNAとが入力され、両者が合算されることで、フィルタ処理済みのナレーション音声信号CNAが加えられた左側出力信号OUTLまたは右側出力信号OUTRが生成される。
この場合、同相成分合算用の演算器31L,31Rの前段には、ユーザが調整可能な利得βを有する増幅器32L,32Rが設けられ、前記ナレーション音声信号CNAとの加算割合を調整する。この同相成分合算用の演算器31L,31Rからの出力は、左側出力信号OUTLまたは右側出力信号OUTRの出力部33L,33Rから出力される。
以上述べたように、本実施形態によれば、2チャンネルの信号中から、同相成分であるナレーション音声信号CNAのみを抽出して、このナレーション音声信号に対する左側入力信号INLと右側入力信号INRの無相関信号部分L0,R0の加算割合を制御することで、ナレーション音声信号CNAのみを適正に制御することが可能になる。
本実施形態の作用を明らかにするため、前記のような帯域分割とダウンサンプリングに従って、シミュレーションを行った。この場合、各帯域の同相抽出処理内の適応フィルタ長は32点に設定し、適応アルゴリズムには式(5)、式(6)で示されるNLSM(学習同定法:Normalized Least Mean Square Algorithm)を用い、ステップサイズパラメータμ=0.02、γ=0.000001である。
Figure 2009025500
なお、シミュレーションに用いたステレオ2チャンネル音源は、相撲の実況中継の音声である。同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=0.0とした場合(同相信号のみの出力状態)を図2に、同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=0.5とした場合(同相信号が強調されている状態)を図3に、同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=1.0とした場合(入力信号と同じ状態)を図4に示す。
2乃至図3のグラフからも明らかなように、本実施形態によれば、左側及び右側の出力信号中における同相成分信号であるナレーション音声信号の割合を自由に制御することが可能になる。
また、本発明で用いる適応フィルタを組み合わせた同相成分抽出法は、高い周波数分解能を得るのに一般的なFIRフィルタ同様に長いフィルタ長を必要とし、特に周波数が下がれば下がるほどフィルタ長は長大となる。そこで、本実施形態では、入力信号にL,Rに対し周波数分割を行い、分割された各帯域ごとにその上限である周波数がサンプリング定理を満たすようにダウンサンプリングを施すことで、演算量をおさえつつ効率的な処理が可能となる。
具体的には、サンプリング周波数が48[kHz]の信号に対し、200[Hz]と300[Hz]の複合正弦波がある場合、300[Hz]を残し200[Hz]の成分を60[dB]減衰させるのに必要な直線位相フィルタの長さはカットオフ周波数を250Hzにしたときに約2048点必要であるが、サンプリング周波数が1500Hzの場合には、64点の演算で同等のフィルタリング効果を得ることができる。さらに1秒間の処理量もこの場合1/32となる。このように大幅な演算量削減の効果を得ることが可能である。
なお、同相信号として抽出するナレーション音声信号は、音声帯域に存在するから、その帯域のみについて同相成分抽出器を設ければ良いので、本実施形態における周波数分割フィルタは、音声帯域のみを3〜5帯域に分割するものであっても良い。その他の帯域については、同相成分抽出を行わずに、そのまま処理後のナレーション音声信号に加算しても良い。
また、本実施形態は、同相成分抽出器23〜23として、以下述べる構成のものを使用したが、必ずしも、このような同相成分抽出器に限定されるものではない。ただし、本実施形態の同相成分抽出器は、2チャンネルの信号中から同相成分を忠実に抽出することができる利点がある。
(2)同相成分抽出器23〜23
図5は、本発明における同相成分抽出処理を実現する同相成分抽出器23〜23の一実施形態を示すブロック図であって、それぞれの同相成分抽出器の構成並びに作用効果は、入力される右側信号と左側信号の周波数帯域が異なるだけで、各帯域ごとに共通のものである。なお、図5においては、帯域分割された2チャンネルの信号を、入力信号X,Yと記述することで、本発明において処理対象となる2チャンネルの入力信号INL,INRと区別する。
図5において、1X,1Yは、該当する帯域の同相成分抽出器に入力される入力信号X及びYの入力部である。各信号入力部1X,1Yの出力側は、それぞれ適応フィルタ2X,2Y、フィルタ係数生成器3X,3Y及びサンプル遅延器4X,4Yに接続されている。
すなわち、任意の2チャンネルの離散信号ベクトルX,Yがあるとき、時刻kにおける入力信号をX(k),Y(k)とし、一方の入力信号X(k)を適応フィルタ2X、フィルタ係数生成器3X及びサンプル遅延器4Xに、他方の入力信号Y(k)を適応フィルタ2Y、フィルタ係数生成器3Y及びサンプル遅延器4Yに入力する。
適応フィルタ2X,2Yには、フィルタ係数生成器3X,3Yが接続され、これら適応フィルタ2X,2Y及びフィルタ係数生成器3X,3Yによって、刻々と変化するフィルタ係数WX,WYが得られるようになっている。
この適応フィルタ2X,2Yにおいて、時刻kにおける入力信号X(k)に適応フィルタ係数WXを畳み込み、得られる信号をZX(k)とし、入力信号Y(k)に適応フィルタ係数WYを畳み込み、得られる信号をZY(k)とする。
また、前記サンプル遅延器4X,4Yは、入力信号Y(k)を適応フィルタ長Mの半分であるM/2の遅延が施された信号X’(k),Y’(k)を生成するものである。
なお、前記適応フィルタ2X,2Yにおける適応信号処理には、FIR(Finite Impulse Response)フィルタやIIR(Infinite ImpulseResponse)フィルタ等のフィルタ構成に依らず多くのものがある。すなわち、本実施形態においては、ハードウェアやソフトウェアの制限や条件等を考慮し、それら適応信号処理のフィルタ構成や更新アルゴリズムを適宜選択することが可能であり、後述するFIRフィルタによる適応信号処理や更新アルゴリズムに限定されるものではない。
前記適応フィルタ2X,2Yの出力ZX(k),ZY(k)は誤差信号算出用の演算器5X,5Yに、前記サンプル遅延器4X,4Yの出力は同じく誤差信号算出用の演算器5X,5Yに入力される。この演算器5Xにおいて、サンプル遅延器4Yからの出力Y’(k)から適応フィルタ2Xの出力ZX(k)を差し引いた誤差信号errX(k)が、演算器5Yにおいて、サンプル遅延器4Xからの出力X’(k)から適応フィルタ2Yの出力ZY(k)を差し引いた誤差信号errY(k)が生成される。
これらの誤差信号errX(k),errY(k)は、それぞれフィルタ係数生成器3X,3Yにフィードバックされ、この誤差信号errX(k),errY(k)を利用して適応アルゴリズムにより逐次適応フィルタ2X,2Yが更新され、フィルタ出力ZX(k),ZY(k)が得られる。
前記適応フィルタ2X,2Yの出力は、前記誤差信号算出用の演算器5X,5Yとは別に、同相信号加算用演算器6にも出力される。この同相信号加算用の演算器6は、各適応フィルタ2X,2Yからの出力ZX(k)とZY(k)とを加算するものである。この同相信号加算用の演算器6の出力は、乗算器8において0.5倍され、その結果、同相信号出力部10からは、同相信号としてZ’(k)=(ZX(k)+ZY(k))/2が出力される。
(3)適応フィルタ2X,2Yの構成
次に、前記適用フィルタ2X,2Yとそのフィルタ係数生成器3X,3Yについて、図6に従って具体的に説明する。
すなわち、適応フィルタ2X,2Yは、入力信号in(k)に対して直列に接続されたM−1個の遅延処理器Z-1と、前記入力信号in(k)及びこれら遅延処理器Z-1からの出力信号を入力する係数処理器W0,W1,・・・,WM-1(以下、係数処理器Wと総称する)と、これら各係数処理器Wからの信号を加算する加算器11を備えている。
そして、この加算器の11からの出力ZY(k),ZY(k)が前記誤差信号算出用演算器5X,5Yに出力される。なお、ここで、Mが本件発明における適応フィルタ長に相当する。
すなわち、前記係数処理器Wは、適応アルゴリズムを備えたフィルタ係数生成器3X,3Yによって、入力信号Xの成分のうち入力信号Yの成分と相関が高い成分を抽出するように更新される。すなわち、このフィルタ係数生成器3Xには、入力信号X(k)および演算器5Xからの誤差信号errX(k)が刻々と入力され、これら入力信号X(k)および誤差信号errX(k)が更新アルゴリズムによって処理されることにより、フィルタ係数生成器3Xから各段の係数処理器Wに係数の更新指令が出力され、これに基づいて格段の遅延処理器Z-1からの出力信号に重畳される係数の値が変化する。
同様に、このフィルタ係数生成器3Yには、入力信号Y(k)および演算器5Yからの誤差信号errY(k)が刻々と入力され、これら入力信号Y(k)および誤差信号errY(k)が更新アルゴリズムによって処理されることにより、フィルタ係数生成器3Yから各段の係数処理器Wに係数の更新指令が出力され、これに基づいて格段の遅延処理器Z-1からの出力信号に重畳される係数の値が変化する。
すなわち、入力信号Xは、Xに含まれるYとは無相関な成分XOと、X,Yの間で同相な信号Zの和として表すことができ、同様に入力信号Yは、Yに含まれるXと無相関な成分をYOと、X,Yの間で同相な信号Zの和として次式のようにあらわすことができる。
Figure 2009025500
本実施形態では式(7)のようにあらわされるZを抽出をまず目的としている。ここで、入力信号Xにかかる適応フィルタ係数をWXとし、入力信号Yにかかる適応フィルタ係数をWYとする。適応フィルタはそれぞれ、式(8)、(9)に示す誤差であるerrX(k)とerrY(k)を最小とするよう更新される。
Figure 2009025500
無相関信号YOとXOは互いに無相関であることから、同定モデルと同様に誤差算出段での入力信号とは無関係な外乱としてみることができる。その結果、適応フィルタ出力ZX(k)=WX TXと適応フィルタ出力ZY(k)=WY TYは、おおむね同相信号Zに収束するように働く。
しかしながら、誤差を最小にするように適応フィルタは成長するため、適応フィルタ係数WXは無相関成分YO成分を増幅し、無相関成分XOを抑圧するように働き、また適応フィルタ係数WYは無相関成分XO成分を増幅し、無相関成分YO成分を抑圧するように働く。
ここで、適応フィルタ係数WXと適応フィルタ係数WYに含まれる無相関成分XOおよびYOを抑圧、増幅する特性は互いに逆相な関係となることから、ZXとZYを加算することで同相信号Z以外の成分を相殺することが可能である。最終的に同相信号Z’は式(10)により抽出することができる。
Figure 2009025500
次に、無相関成分XOとYOは、適応フィルタ長Mの半分M/2の遅延を与えられた信号との差分で与えられ、式(11),式(12)により求められる。
Figure 2009025500
下記の式は、入力信号と上記のようにして得られた出力信号の関係をまとめたものである。
Figure 2009025500
前記のようなフィルタ係数生成器3X,3Yにおいて採用される更新式には、種々のものがあるが説明のため代表的なものとしてLMS(Least Mean Square)アルゴリズムおよびNLMS(Normalized Least Mean Square)アルゴリズムを取り上げる。
[LMSアルゴリズム]
LMSアルゴリズムは瞬時自乗誤差を評価量としたアルゴリズムであり、下記の(13)式にて係数処理器Wは更新される。ここで、μはステップサイズパラメータであり実現される適応フィルタの性能に大きく影響する量である。
Figure 2009025500
(4)本実施形態における同相信号抽出処理の効果
本実施形態の効果を確認するため、具体的な信号を用意しシミュレーションを行った。
図7に入力信号X=(XO+Z)、図8に入力信号Y=(YO+Z)、図9に所望応答である入力信号Xと入力信号Yの同相成分Zを示す。すなわち、図7及び図8に示すような2チャンネルの入力信号中から、同相成分である図9のような信号を抽出するのが本実施形態の目的である。
そこで、シミュレーションに当たっては、サンプリング周波数を3000[Hz]とし、入力信号中X中の無相関成分XOとして図10に示す600[Hz]の正弦波、入力信号中Y中の無相関成分YOとして図11に示す100[Hz]の正弦波、同相成分Zとして前記図9に示す300[Hz]の正弦波を使用し、これらによって入力信号X,Yを作成した。
またフィルタの更新に用いるアルゴリズムを前記式(5)、式(6)で示されるNLMSとし、適応フィルタ長M=256、ステップサイズパラメータμ=0.002、γ=0.000001とした。なお、本実施形態では、適応フィルタの更新アルゴリズムについて、用途に応じた適切なアルゴリズムの選択が可能であり、NLMS以外のアルゴリズムの採用について特に制限はない。
まず、図12に同相成分の強調法として最も広く使われている(X+Y)/2の結果を示す。この図12から明らかなように、従来技術では、単に入力信号X,Yを加算して1/2としているだけであるため、得られた波形は、図9に示す正弦波の同相信号Zとは異なり、入力信号X,Yから同相成分を適切に抽出したものとは言えない。
一方、本実施形態により得られた結果を、図13に同相信号Z’として示す。この図13に示すように、所望応答である図9の同相信号Zと比較すると、本実施形態により抽出された同相信号Z’が、従来法の結果である図12の波形と比べるまでもなく、所望応答の同相信号Zに酷似していることが確認できる。
本発明のナレーション音声制御装置の一実施形態を示すブロック図。 図1の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=0.0とした場合(同相信号のみの出力状態)を示す。 図1の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=0.5とした場合(同相信号が強調されている状態)を示す。 図1の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器30の利得α=1.0、出力信号の増幅器32Lまたは32Rの利得β=1.0とした場合(入力信号と同じ状態)を示す。 本実施形態の同相成分抽出器の一実施の形態を示すブロック図。 図5の回路に使用されている適用フィルタの詳細を示すブロック図。 本実施形態の同相成分抽出器における一方の入力信号X=(XO+Z)の時間波形の一例を示すグラフ。 本実施形態の同相成分抽出器における他方の入力信号Y=(YO+Z)の時間波形の一例を示すグラフ。 本実施形態の同相成分抽出器における入力信号X,Yに共通に含まれる同相成分Zの時間波形の一例を示すグラフ。 本実施形態の同相成分抽出器におけるXに含まれるXOの時間波形の一例を示すグラフ。 本実施形態の同相成分抽出器におけるYに含まれるYOの時間波形の一例を示すグラフ。 同相強調に用いられる従来の演算結果(X+Y)/2の時間波形の一例を示すグラフ。 本実施形態により入力信号X,Yから抽出された同相信号Z’の時間波形の一例を示すグラフ。
符号の説明
20L,20R…信号入力部
21…周波数分割フィルタ
22…ダウンサンプリング器
23〜23…同相成分抽出器
24…アップサンプリング器
25〜25…増幅器
26…加算器
27L,27R…減算用演算器
28L,28R…遅延処理器
29…フィルタ
30…増幅器
31L,31R…同相成分合算用の演算器
32L,32R…増幅器
33L,33R…信号出力部
1X,1Y…信号入力部
2X,2Y…適応フィルタ
3X,3Y…フィルタ係数生成器
4X,4Y…サンプル遅延器
5X,5Y…誤差信号算出用演算器
6…同相信号加算用演算器
7X,7Y…無相関信号算出用演算器
8…乗算器
9X,9Y…無相関信号出力部
10…同相信号出力部
11…加算器
−1…遅延処理器
,W,・・・W…係数処理器

Claims (3)

  1. ミキシングされた任意の音源を必要となる信号の含まれる帯域に制限する機構と、各チャンネル間の相関に基づいて分離抽出する機構を有し、その結果得られる複数の出力それぞれに対し利得を制御し、再度ミキシングすることを特徴とするナレーション音声制御方法。
  2. あらかじめ帯域分割された信号それぞれについて行われることを特徴とする請求項1に記載のナレーション音声制御方法。
  3. ステレオ2チャンネル信号における左側入力信号INLの入力部20Lと、右側入力信号INRの入力部20Rと、
    前記入力部20L,20Rの出力を複数の帯域1〜Nに分割する周波数分割フィルタ21と、この周波数分割フィルタ21に設けられて分割された各帯域の信号を低周波数により再サンプリングするダウンサンプリング器22と、
    ダウンサンプリング器22から出力される各帯域の右側入力信号と左側入力信号を入力し、各帯域の信号中から同相信号C〜Cするために、それぞれの帯域ごとに設けられた同相成分抽出器23〜23と、
    各帯域の同相成分抽出器23〜23からの出力を加算する加算器26と、
    左側入力信号INLと右側入力信号INRのそれぞれから同相成分Cを減算して、左側入力信号INLと右側入力信号INRの無相関信号部分L0,R0のみを取り出す減算用演算器27L,27Rと、
    前記加算器26からの同相成分の利得を制御する増幅器と、
    この増幅器からの出力を減算用演算器27L,27Rから出力された無相関信号部分のみが取り出された左側入力信号INLと右側入力信号INRとを加算する同相成分合算用の演算器31L,31Rとを備えていることを特徴とするナレーション音声制御装置。
JP2007187698A 2007-07-18 2007-07-18 ナレーション音声制御装置 Active JP4970174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007187698A JP4970174B2 (ja) 2007-07-18 2007-07-18 ナレーション音声制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007187698A JP4970174B2 (ja) 2007-07-18 2007-07-18 ナレーション音声制御装置

Publications (3)

Publication Number Publication Date
JP2009025500A true JP2009025500A (ja) 2009-02-05
JP2009025500A5 JP2009025500A5 (ja) 2010-09-02
JP4970174B2 JP4970174B2 (ja) 2012-07-04

Family

ID=40397365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007187698A Active JP4970174B2 (ja) 2007-07-18 2007-07-18 ナレーション音声制御装置

Country Status (1)

Country Link
JP (1) JP4970174B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム
JP2011244197A (ja) * 2010-05-18 2011-12-01 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体
JP2012019454A (ja) * 2010-07-09 2012-01-26 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体
US8548173B2 (en) 2008-12-04 2013-10-01 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222295A (ja) * 1994-02-03 1995-08-18 Kenwood Corp オーディオ信号の中央定位成分強調装置
JPH07319488A (ja) * 1994-05-19 1995-12-08 Sanyo Electric Co Ltd ステレオ信号処理回路
JP2000148161A (ja) * 1998-11-13 2000-05-26 Matsushita Electric Ind Co Ltd 自動音質音量制御方法と装置
JP2001245237A (ja) * 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
JP2002078100A (ja) * 2000-09-05 2002-03-15 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
JP2005006317A (ja) * 2003-06-09 2005-01-06 Samsung Electronics Co Ltd 最小二乗アルゴリズムを利用する信号分離装置及びその方法
JP2005086462A (ja) * 2003-09-09 2005-03-31 Victor Co Of Japan Ltd オーディオ信号再生装置のボーカル音帯域強調回路
JP2007129383A (ja) * 2005-11-02 2007-05-24 Sony Corp 信号処理装置および信号処理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222295A (ja) * 1994-02-03 1995-08-18 Kenwood Corp オーディオ信号の中央定位成分強調装置
JPH07319488A (ja) * 1994-05-19 1995-12-08 Sanyo Electric Co Ltd ステレオ信号処理回路
JP2000148161A (ja) * 1998-11-13 2000-05-26 Matsushita Electric Ind Co Ltd 自動音質音量制御方法と装置
JP2001245237A (ja) * 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
JP2002078100A (ja) * 2000-09-05 2002-03-15 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
JP2005006317A (ja) * 2003-06-09 2005-01-06 Samsung Electronics Co Ltd 最小二乗アルゴリズムを利用する信号分離装置及びその方法
JP2005086462A (ja) * 2003-09-09 2005-03-31 Victor Co Of Japan Ltd オーディオ信号再生装置のボーカル音帯域強調回路
JP2007129383A (ja) * 2005-11-02 2007-05-24 Sony Corp 信号処理装置および信号処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548173B2 (en) 2008-12-04 2013-10-01 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment
JP2011244197A (ja) * 2010-05-18 2011-12-01 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体
JP2012019454A (ja) * 2010-07-09 2012-01-26 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体
US9071215B2 (en) 2010-07-09 2015-06-30 Sharp Kabushiki Kaisha Audio signal processing device, method, program, and recording medium for processing audio signal to be reproduced by plurality of speakers
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム

Also Published As

Publication number Publication date
JP4970174B2 (ja) 2012-07-04

Similar Documents

Publication Publication Date Title
EP1722598B1 (en) Audio device and method for generating surround sound
US6449368B1 (en) Multidirectional audio decoding
US7894611B2 (en) Spatial disassembly processor
EP2614659B1 (en) Upmixing method and system for multichannel audio reproduction
US20180279062A1 (en) Audio surround processing system
US20110038485A1 (en) Nonlinear filter for separation of center sounds in stereophonic audio
JP3682032B2 (ja) オーディオ装置並びにその再生用プログラム
EP1860917A1 (en) Sound image localization apparatus
JP4970174B2 (ja) ナレーション音声制御装置
KR102660704B1 (ko) 스펙트럼적 직교 오디오 성분 처리
WO1999035885A1 (fr) Dispositif de localisation d&#39;images sonores
EP2708041B1 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
JP2009027388A (ja) 同相成分抽出方法及び装置
JP4402636B2 (ja) オーディオ装置
WO1999035886A1 (fr) Dispositif pseudo-stereophonique
JP2010068080A (ja) 音量制御装置
JP6124143B2 (ja) サラウンド成分生成装置
JP4804376B2 (ja) オーディオ装置
JPH1188994A (ja) 音像定位装置及び音像制御方法
CN104081794B (zh) 环绕分量生成装置
KR20240060678A (ko) 스펙트럼적 직교 오디오 성분 처리
JPH07222295A (ja) オーディオ信号の中央定位成分強調装置
JP2007082125A (ja) 信号処理装置および音像定位装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4970174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250