JP2009025500A

JP2009025500A - ナレーション音声制御装置並びに制御方法

Info

Publication number: JP2009025500A
Application number: JP2007187698A
Authority: JP
Inventors: Haruo Hamada; 晴夫浜田; Yoshitaka Murayama; 好孝村山; Setsu Komiyama; 摂小宮山
Original assignee: DIMAGIC KK; Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: DIMAGIC KK; Japan Broadcasting Corp
Priority date: 2007-07-18
Filing date: 2007-07-18
Publication date: 2009-02-05
Anticipated expiration: 2027-07-18
Also published as: JP4970174B2

Abstract

【課題】複数の音源がミキシングされて配信されたオーディオ信号に対し、受聴者により各音源の音量バランスの調整を可能とし、受聴者個人にあった音量バランスで再生を行う。
【解決手段】
複数の音源がミキシングされたマルチチャネル信号に対し、音源定位する位置、必要となる音源の帯域を任意に指定し、相関と周波数選択フィルタにより必要成分の抽出・分離を行い、出力された信号の音量バランスを制御し、再度ミキシングした上で、再生装置を用いて再生を行う。
【選択図】図１

Description

本発明は、ステレオ２チャンネルで配信される音声信号に含まれるナレーション音声の聴き取りやすさを制御するための装置並びにその制御方法に関するものである。

近年、高齢者の増加に伴い、聴き取りやすさに配慮した各種コンテンツの配信が求められている。しかしながら、聴き取りやすさに対する認識についての個人差は大きく、すべての受聴者を満足するような最適な音量バランスというものを実現することは極めて困難である。

ナレーションと背景音や効果音との関係についても、テレビ受像機をはじめ各種受信端末の側で、ナレーション音声を聞き取りやすくするための対策が打たれるようになってきた。しかし、ナレーション音声の聴き取りやすさは、背景音や効果音との音量差、ナレーション音声の速度、声質等に依存するため、何人にも適した対策を行うことは容易ではない。

従来、特許文献１〜３に示すように、ナレーション音声の聴き取りやすさを向上させる仕組みとして、人間の音声の帯域を強調するような特性補正、高齢者の耳にあわせた比較的高い周波数帯の音を強調するような方法がとられてきた。しかしながら、ナレーション音声の背景音や効果音が、人間の声の帯域と同じ成分を多く持つときに、ナレーション音声とともに強調されてしまい、かえってバランスの崩れた聴き取りづらい音となってしまうという問題が生じていた。

特開２００１-３３３０３５号公報特開２００３-１３１６８６号公報特開２００３-２４４０８１号公報

本発明は、上記のような従来技術の問題点を解決するために提案されたものであり、その目的は、背景音や効果音などの音声とナレーションナレーションの音量差を受聴者側で制御するための手段を提供することにある。

上記の目的を達成するために、本発明のナレーション音声制御装置並びに制御方法は、２チャンネルの音声信号中から、同相成分であるナレーション音声信号のみを抽出し、このナレーション音声信号に対して増幅・減衰・フィルタ処理などの処理を施した後、同相成分値を抽出した２チャンネルの音声信号に対して、処理済みのナレーション信号を加算することで、音声信号中のナレーション音声信号のみに対して、種々の処理を施すことを特徴とする。

すなわち、ステレオ２チャンネルで配信される音声信号に含まれるナレーション音声の多くは、２チャンネルステレオスピーカで再生した場合、ヘッドホンで再生した場合に、最適な受聴位置において、中央にから聞こえるように設定されている。すなわち２チャンネルそれぞれに等しくナレーション音声の信号が含まれていることを意味している。

そのため、ナレーション音声を構成するどの周波数対をとっても、ステレオ２チャンネルＬ，Ｒ間でのナレーション音声の成分の関係は、同振幅、同位相である。従って、あらかじめ定位位置が一定であることがある程度保障されているナレーション音声は同相同振幅な信号に含まれているということになる。

そこで、本件発明は、２チャンネルの音声信号中から、同相成分であるナレーション音声信号のみを抽出し、このナレーション音声信号に対して増幅・減衰・フィルタ処理などの処理を施した後、同相成分値を抽出した２チャンネルの音声信号に対して、処理済みのナレーション信号を加算することで、音声信号中のナレーション音声信号のみに対して、種々の処理を施すことを可能としたものである。

以上のような構成を有する本発明においては、従来の音声の特性のみを考慮したフィルタリング処理だけではなく、ナレーション音声がステレオ２チャンネル再生の時に一般的に中央に定位するように作られるということから、同相同振幅である信号を抽出する手段を組み入れることで、ナレーション音声とそれ以外の音の分離性能を従来手法よりも高めることが可能となる。特に、テレビ受像器、ラジオなどの放送受信端末内部に実装することで、任意の音源を受聴者自身に調整する手段を提供することができる。

次に、本発明の一実施形態を図面に従って具体的に説明する。

（１）実施形態の全体構成
図１において、INLはステレオ２チャンネル信号における左側入力信号、INRはステレオ２チャンネル信号における右側入力信号、OUTLは左側出力信号、OUTRは右側出力信号、Mは同相成分抽出処理により発生する遅延数、Z-MはMサンプル分の遅延器、Nは帯域の分割数、αは抽出された信号に対する利得であって、この利得α＝1.0の時、左側入力信号INLと左側出力信号OUTL,右側入力信号INRと右側出力信号OUTRは等しくなる。

２チャンネルステレオ信号ＬとＲを、ナレーション音声信号Ｃ_NA、Ｌに含まれる背景音及び効果音Ｌ_BとＲに含まれる背景音及び効果音Ｒ_Bの和により表現すると式(1)のようになる。

次に、各チャンネル間で同相な信号をＣ、無相関な信号をＬ₀，Ｒ₀とすると、２チャンネルステレオ信号Ｌ，Ｒは式(2)とも表すことができる。

式(1)、式(2)の定義より、背景音及び効果音Ｌ_B，Ｒ_Bに含まれる同相信号成分Ｃ_Bとしたとき、ナレーション音声信号Ｃ_NAは(3)式のように表される。

同様にして、背景音および効果音Ｌ_B，Ｒ_Bは、式(4)のようにあらわすこともできる。

ただし、各式は、ある時刻ｋにおけるＮ個の要素からなる以下のようなベクトルとする。

本実施形態の装置は、前記のようにして表現された各信号を処理するために、次のような手段を備えている。まず、ステレオ２チャンネル信号における左側入力信号INLの入力部２０Ｌと、右側入力信号INRの入力部２０Ｒとを備えている。

これらの入力部２０Ｌ，２０Ｒの出力は、周波数分割フィルタ２１に入力され、複数の帯域１〜Ｎ（本実施形態では５つの帯域）に分割されると共に、この周波数分割フィルタ２１に設けられたダウンサンプリング器２２により低い周波数により再サンプリングがなされる。

すなわち、本実施形態では、周波数分割フィルタ２１及びダウンサンプリング器２２により、元々サンプリング周波数が48000[Hz]の２チャンネルのステレオ音源に対し、帯域を５つに分割し、一番下の帯域をサンプリング周波数1500[Hz]、２番目の帯域に対するサンプリング周波数を3000[Hz]、同様に３番目について6000[Hz]、４番目について12000[Hz]、５番目について24000[Hz]とし、それぞれ帯域幅を120〜400[Hz]、400〜1000[Hz]、1000〜2000[Hz]、2000〜4000[Hz]、4000〜8000[Hz]となるように帯域分割した。

ダウンサンプリング器２２から出力される各帯域の右側入力信号と左側入力信号は、それぞれの帯域ごとに設けられた同相成分抽出器２３_１〜２３_Ｎに入力される。この同相成分抽出器２３_１〜２３_Ｎの構成並びに作用効果については、後述する（２）同相成分抽出器の項で説明する。

各帯域の同相成分抽出器２３_１〜２３_Ｎの出力である同相信号Ｃ_１〜Ｃ_Ｎはアップサンプリング器２４に入力され、このアップサンプリング器２４において、２チャンネルのステレオ音源と同じ高いサンプリング周波数で再サンプリングされる。

この再サンプリングされた同相信号Ｃ_１〜Ｃ_Ｎは、帯域ごとに設けられた増幅器２５_１〜２５_Ｎによって、必要に応じて各帯域別に増幅・減衰された後、加算器２６に出力され、この加算器２６において加算されることにより、前記周波数分割フィルタ２１において分割された帯域分の同相成分が合算されて、左側入力信号INLと右側入力信号INR中のすべての同相成分Ｃが抽出される。

この抽出され、合算された全体域の同相成分Ｃは、左側入力信号INLと右側入力信号INRとの減算用演算器２７Ｌ，２７Ｒに出力される。この減算用演算器２７Ｌ，２７Ｒには、前記左側入力信号INLと右側入力信号INRが、遅延処理器２８Ｌ，２８Ｒを介して入力される。この遅延処理器２８Ｌ，２８Ｒは、前記同相成分抽出器２３_１〜２３_Ｎ及び加算器２６を通過した同相成分Ｃと、左側入力信号INLと右側入力信号INRとを同期させるものである。

減算用演算器２７Ｌ，２７Ｒにおいては、左側入力信号INLと右側入力信号INRのそれぞれから同相成分Ｃが減算され、左側入力信号INLと右側入力信号INRの無相関信号部分Ｌ₀，Ｒ₀のみが取り出される。ここで、同相成分Ｃは、本実施形態におけるナレーション音声信号であり、無相関信号部分Ｌ₀，Ｒ₀は背景音や効果音など、左右のチャンネル間で相関のない音声信号である。

一方、前記加算器２６から出力された同相成分Ｃは、その後段に設けられた音声帯域強調用などの処理を行うフィルタ２９に出力される。このフィルタ２９は、例えば、加算器２６から出力された同相成分Ｃ中のナレーション音声信号Ｃ_NAを強調するもの、すなわち同相成分Ｃ中の背景音及び効果音Ｌ_B，Ｒ_Bに含まれる同相信号成分Ｃ_Bを除去するものである。

なお、このフィルタ２９としては、単に音声帯域強調用に限らず、ユーザの希望に合わせてその他の処理（帯域強調・減衰、ピークカットなど）を与えるものを使用することもできる。

このフィルタ２９からの出力であるナレーション音声信号Ｃ_NAは、フィルタ２９の後段に設けられた利得αを与える増幅器３０に出力される。この増幅器３０は、ユーザが適宜その利得αを調整可能なものである。

フィルタ２９からの出力信号であるナレーション音声信号Ｃ_NAは、同相成分合算用の演算器３１Ｌ，３１Ｒに出力される。この同相成分合算用の演算器３１Ｌ，３１Ｒには、前記減算用演算器２７Ｌ，２７Ｒから出力された無相関信号部分のみが取り出された左側入力信号INLと右側入力信号INRと、フィルタ処理済みのナレーション音声信号Ｃ_NAとが入力され、両者が合算されることで、フィルタ処理済みのナレーション音声信号Ｃ_NAが加えられた左側出力信号OUTLまたは右側出力信号OUTRが生成される。

この場合、同相成分合算用の演算器３１Ｌ，３１Ｒの前段には、ユーザが調整可能な利得βを有する増幅器３２Ｌ，３２Ｒが設けられ、前記ナレーション音声信号Ｃ_NAとの加算割合を調整する。この同相成分合算用の演算器３１Ｌ，３１Ｒからの出力は、左側出力信号OUTLまたは右側出力信号OUTRの出力部３３Ｌ，３３Ｒから出力される。

以上述べたように、本実施形態によれば、２チャンネルの信号中から、同相成分であるナレーション音声信号Ｃ_NAのみを抽出して、このナレーション音声信号に対する左側入力信号INLと右側入力信号INRの無相関信号部分Ｌ₀，Ｒ₀の加算割合を制御することで、ナレーション音声信号Ｃ_NAのみを適正に制御することが可能になる。

本実施形態の作用を明らかにするため、前記のような帯域分割とダウンサンプリングに従って、シミュレーションを行った。この場合、各帯域の同相抽出処理内の適応フィルタ長は３２点に設定し、適応アルゴリズムには式(5)、式(6)で示されるＮＬＳＭ（学習同定法：Normalized Least Mean Square Algorithm）を用い、ステップサイズパラメータμ=0.02、γ=0.000001である。

なお、シミュレーションに用いたステレオ２チャンネル音源は、相撲の実況中継の音声である。同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝０．０とした場合（同相信号のみの出力状態）を図２に、同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝０．５とした場合（同相信号が強調されている状態）を図３に、同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝１．０とした場合（入力信号と同じ状態）を図４に示す。

２乃至図３のグラフからも明らかなように、本実施形態によれば、左側及び右側の出力信号中における同相成分信号であるナレーション音声信号の割合を自由に制御することが可能になる。

また、本発明で用いる適応フィルタを組み合わせた同相成分抽出法は、高い周波数分解能を得るのに一般的なＦＩＲフィルタ同様に長いフィルタ長を必要とし、特に周波数が下がれば下がるほどフィルタ長は長大となる。そこで、本実施形態では、入力信号にＬ，Ｒに対し周波数分割を行い、分割された各帯域ごとにその上限である周波数がサンプリング定理を満たすようにダウンサンプリングを施すことで、演算量をおさえつつ効率的な処理が可能となる。

具体的には、サンプリング周波数が48[kHz]の信号に対し、200[Hz]と300[Hz]の複合正弦波がある場合、300[Hz]を残し200[Hz]の成分を60[dB]減衰させるのに必要な直線位相フィルタの長さはカットオフ周波数を250Hzにしたときに約2048点必要であるが、サンプリング周波数が1500Hzの場合には、64点の演算で同等のフィルタリング効果を得ることができる。さらに1秒間の処理量もこの場合1/32となる。このように大幅な演算量削減の効果を得ることが可能である。

なお、同相信号として抽出するナレーション音声信号は、音声帯域に存在するから、その帯域のみについて同相成分抽出器を設ければ良いので、本実施形態における周波数分割フィルタは、音声帯域のみを３〜５帯域に分割するものであっても良い。その他の帯域については、同相成分抽出を行わずに、そのまま処理後のナレーション音声信号に加算しても良い。

また、本実施形態は、同相成分抽出器２３_１〜２３_Ｎとして、以下述べる構成のものを使用したが、必ずしも、このような同相成分抽出器に限定されるものではない。ただし、本実施形態の同相成分抽出器は、２チャンネルの信号中から同相成分を忠実に抽出することができる利点がある。

（２）同相成分抽出器２３_１〜２３_Ｎ
図５は、本発明における同相成分抽出処理を実現する同相成分抽出器２３_１〜２３_Ｎの一実施形態を示すブロック図であって、それぞれの同相成分抽出器の構成並びに作用効果は、入力される右側信号と左側信号の周波数帯域が異なるだけで、各帯域ごとに共通のものである。なお、図５においては、帯域分割された２チャンネルの信号を、入力信号Ｘ，Ｙと記述することで、本発明において処理対象となる２チャンネルの入力信号INL，INRと区別する。

図５において、１Ｘ，１Ｙは、該当する帯域の同相成分抽出器に入力される入力信号Ｘ及びＹの入力部である。各信号入力部１Ｘ，１Ｙの出力側は、それぞれ適応フィルタ２Ｘ，２Ｙ、フィルタ係数生成器３Ｘ，３Ｙ及びサンプル遅延器４Ｘ，４Ｙに接続されている。

すなわち、任意の２チャンネルの離散信号ベクトルＸ，Ｙがあるとき、時刻ｋにおける入力信号をＸ(k)，Ｙ(k)とし、一方の入力信号Ｘ(k)を適応フィルタ２Ｘ、フィルタ係数生成器３Ｘ及びサンプル遅延器４Ｘに、他方の入力信号Ｙ(k)を適応フィルタ２Ｙ、フィルタ係数生成器３Ｙ及びサンプル遅延器４Ｙに入力する。

適応フィルタ２Ｘ，２Ｙには、フィルタ係数生成器３Ｘ，３Ｙが接続され、これら適応フィルタ２Ｘ，２Ｙ及びフィルタ係数生成器３Ｘ，３Ｙによって、刻々と変化するフィルタ係数Ｗ_X，Ｗ_Yが得られるようになっている。

この適応フィルタ２Ｘ，２Ｙにおいて、時刻ｋにおける入力信号Ｘ(k)に適応フィルタ係数Ｗ_Xを畳み込み、得られる信号をＺ_X(k)とし、入力信号Ｙ(k)に適応フィルタ係数Ｗ_Yを畳み込み、得られる信号をＺ_Y(k)とする。

また、前記サンプル遅延器４Ｘ，４Ｙは、入力信号Ｙ(k)を適応フィルタ長Ｍの半分であるＭ／２の遅延が施された信号Ｘ’(k)，Ｙ’(k)を生成するものである。

なお、前記適応フィルタ２Ｘ，２Ｙにおける適応信号処理には、ＦＩＲ(Finite Impulse Response)フィルタやＩＩＲ(Infinite ImpulseResponse)フィルタ等のフィルタ構成に依らず多くのものがある。すなわち、本実施形態においては、ハードウェアやソフトウェアの制限や条件等を考慮し、それら適応信号処理のフィルタ構成や更新アルゴリズムを適宜選択することが可能であり、後述するＦＩＲフィルタによる適応信号処理や更新アルゴリズムに限定されるものではない。

前記適応フィルタ２Ｘ，２Ｙの出力Ｚ_X(k)，Ｚ_Y(k)は誤差信号算出用の演算器５Ｘ，５Ｙに、前記サンプル遅延器４Ｘ，４Ｙの出力は同じく誤差信号算出用の演算器５Ｘ，５Ｙに入力される。この演算器５Ｘにおいて、サンプル遅延器４Ｙからの出力Ｙ’(k)から適応フィルタ２Ｘの出力Ｚ_X(k)を差し引いた誤差信号errＸ(k)が、演算器５Ｙにおいて、サンプル遅延器４Ｘからの出力Ｘ’(k)から適応フィルタ２Ｙの出力Ｚ_Y(k)を差し引いた誤差信号errＹ(k)が生成される。

これらの誤差信号errＸ(k)，errＹ(k)は、それぞれフィルタ係数生成器３Ｘ，３Ｙにフィードバックされ、この誤差信号errＸ(k)，errＹ(k)を利用して適応アルゴリズムにより逐次適応フィルタ２Ｘ，２Ｙが更新され、フィルタ出力Ｚ_X(k)，Ｚ_Y(k)が得られる。

前記適応フィルタ２Ｘ，２Ｙの出力は、前記誤差信号算出用の演算器５Ｘ，５Ｙとは別に、同相信号加算用演算器６にも出力される。この同相信号加算用の演算器６は、各適応フィルタ２Ｘ，２Ｙからの出力Ｚ_X(k)とＺ_Y(k)とを加算するものである。この同相信号加算用の演算器６の出力は、乗算器８において０．５倍され、その結果、同相信号出力部１０からは、同相信号としてＺ’(k)＝（Ｚ_X(k)＋Ｚ_Y(k)）／２が出力される。

（３）適応フィルタ２Ｘ，２Ｙの構成
次に、前記適用フィルタ２Ｘ，２Ｙとそのフィルタ係数生成器３Ｘ，３Ｙについて、図６に従って具体的に説明する。

すなわち、適応フィルタ２Ｘ，２Ｙは、入力信号ｉｎ(k)に対して直列に接続されたＭ−１個の遅延処理器Ｚ^-1と、前記入力信号ｉｎ(k)及びこれら遅延処理器Ｚ^-1からの出力信号を入力する係数処理器Ｗ₀，Ｗ₁，・・・，Ｗ_M-1（以下、係数処理器Ｗと総称する）と、これら各係数処理器Ｗからの信号を加算する加算器１１を備えている。

そして、この加算器の１１からの出力Ｚ_Y(k)，Ｚ_Y(k)が前記誤差信号算出用演算器５Ｘ，５Ｙに出力される。なお、ここで、Ｍが本件発明における適応フィルタ長に相当する。

すなわち、前記係数処理器Ｗは、適応アルゴリズムを備えたフィルタ係数生成器３Ｘ，３Ｙによって、入力信号Ｘの成分のうち入力信号Ｙの成分と相関が高い成分を抽出するように更新される。すなわち、このフィルタ係数生成器３Ｘには、入力信号Ｘ(k)および演算器５Ｘからの誤差信号errＸ(k)が刻々と入力され、これら入力信号Ｘ(k)および誤差信号errＸ(k)が更新アルゴリズムによって処理されることにより、フィルタ係数生成器３Ｘから各段の係数処理器Ｗに係数の更新指令が出力され、これに基づいて格段の遅延処理器Ｚ^-1からの出力信号に重畳される係数の値が変化する。

同様に、このフィルタ係数生成器３Ｙには、入力信号Ｙ(k)および演算器５Ｙからの誤差信号errＹ(k)が刻々と入力され、これら入力信号Ｙ(k)および誤差信号errＹ(k)が更新アルゴリズムによって処理されることにより、フィルタ係数生成器３Ｙから各段の係数処理器Ｗに係数の更新指令が出力され、これに基づいて格段の遅延処理器Ｚ^-1からの出力信号に重畳される係数の値が変化する。

すなわち、入力信号Ｘは、Ｘに含まれるＹとは無相関な成分Ｘ_Oと、Ｘ，Ｙの間で同相な信号Ｚの和として表すことができ、同様に入力信号Ｙは、Ｙに含まれるＸと無相関な成分をＹ_Oと、Ｘ，Ｙの間で同相な信号Ｚの和として次式のようにあらわすことができる。

本実施形態では式(7)のようにあらわされるＺを抽出をまず目的としている。ここで、入力信号Ｘにかかる適応フィルタ係数をＷ_Xとし、入力信号Ｙにかかる適応フィルタ係数をＷ_Yとする。適応フィルタはそれぞれ、式(8)、(9)に示す誤差であるerrＸ(k)とerrＹ(k)を最小とするよう更新される。

無相関信号Ｙ_OとＸ_Oは互いに無相関であることから、同定モデルと同様に誤差算出段での入力信号とは無関係な外乱としてみることができる。その結果、適応フィルタ出力Ｚ_X(k)=Ｗ_X ^TＸと適応フィルタ出力Ｚ_Y(k)=Ｗ_Y ^TＹは、おおむね同相信号Ｚに収束するように働く。

しかしながら、誤差を最小にするように適応フィルタは成長するため、適応フィルタ係数Ｗ_Xは無相関成分Ｙ_O成分を増幅し、無相関成分Ｘ_Oを抑圧するように働き、また適応フィルタ係数Ｗ_Yは無相関成分Ｘ_O成分を増幅し、無相関成分Ｙ_O成分を抑圧するように働く。

ここで、適応フィルタ係数Ｗ_Xと適応フィルタ係数Ｗ_Yに含まれる無相関成分Ｘ_OおよびＹ_Oを抑圧、増幅する特性は互いに逆相な関係となることから、Ｚ_XとＺ_Yを加算することで同相信号Ｚ以外の成分を相殺することが可能である。最終的に同相信号Ｚ’は式(10)により抽出することができる。

次に、無相関成分Ｘ_OとＹ_Oは、適応フィルタ長Ｍの半分Ｍ／２の遅延を与えられた信号との差分で与えられ、式(11),式(12)により求められる。

下記の式は、入力信号と上記のようにして得られた出力信号の関係をまとめたものである。

前記のようなフィルタ係数生成器３Ｘ，３Ｙにおいて採用される更新式には、種々のものがあるが説明のため代表的なものとしてＬＭＳ(Least Mean Square)アルゴリズムおよびＮＬＭＳ(Normalized Least Mean Square)アルゴリズムを取り上げる。

［ＬＭＳアルゴリズム］
ＬＭＳアルゴリズムは瞬時自乗誤差を評価量としたアルゴリズムであり、下記の(13)式にて係数処理器Ｗは更新される。ここで、μはステップサイズパラメータであり実現される適応フィルタの性能に大きく影響する量である。

（４）本実施形態における同相信号抽出処理の効果
本実施形態の効果を確認するため、具体的な信号を用意しシミュレーションを行った。

図７に入力信号Ｘ＝（Ｘ_O＋Ｚ）、図８に入力信号Ｙ＝（Ｙ_O＋Ｚ）、図９に所望応答である入力信号Ｘと入力信号Ｙの同相成分Ｚを示す。すなわち、図７及び図８に示すような２チャンネルの入力信号中から、同相成分である図９のような信号を抽出するのが本実施形態の目的である。

そこで、シミュレーションに当たっては、サンプリング周波数を3000[Hz]とし、入力信号中Ｘ中の無相関成分Ｘ_Oとして図１０に示す600[Hz]の正弦波、入力信号中Ｙ中の無相関成分Ｙ_Oとして図１１に示す100[Hz]の正弦波、同相成分Ｚとして前記図９に示す300[Hz]の正弦波を使用し、これらによって入力信号Ｘ，Ｙを作成した。

またフィルタの更新に用いるアルゴリズムを前記式(5)、式(6)で示されるＮＬＭＳとし、適応フィルタ長Ｍ＝256、ステップサイズパラメータμ=0.002、γ=0.000001とした。なお、本実施形態では、適応フィルタの更新アルゴリズムについて、用途に応じた適切なアルゴリズムの選択が可能であり、NLMS以外のアルゴリズムの採用について特に制限はない。

まず、図１２に同相成分の強調法として最も広く使われている（Ｘ＋Ｙ）／２の結果を示す。この図１２から明らかなように、従来技術では、単に入力信号Ｘ，Ｙを加算して１／２としているだけであるため、得られた波形は、図９に示す正弦波の同相信号Ｚとは異なり、入力信号Ｘ，Ｙから同相成分を適切に抽出したものとは言えない。

一方、本実施形態により得られた結果を、図１３に同相信号Ｚ’として示す。この図１３に示すように、所望応答である図９の同相信号Ｚと比較すると、本実施形態により抽出された同相信号Ｚ’が、従来法の結果である図１２の波形と比べるまでもなく、所望応答の同相信号Ｚに酷似していることが確認できる。

本発明のナレーション音声制御装置の一実施形態を示すブロック図。図１の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝０．０とした場合（同相信号のみの出力状態）を示す。図１の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝０．５とした場合（同相信号が強調されている状態）を示す。図１の実施形態における出力信号波形を示すグラフで、同相成分信号の増幅器３０の利得α＝１．０、出力信号の増幅器３２Ｌまたは３２Ｒの利得β＝１．０とした場合（入力信号と同じ状態）を示す。本実施形態の同相成分抽出器の一実施の形態を示すブロック図。図５の回路に使用されている適用フィルタの詳細を示すブロック図。本実施形態の同相成分抽出器における一方の入力信号Ｘ＝（Ｘ_O＋Ｚ）の時間波形の一例を示すグラフ。本実施形態の同相成分抽出器における他方の入力信号Ｙ＝（Ｙ_O＋Ｚ）の時間波形の一例を示すグラフ。本実施形態の同相成分抽出器における入力信号Ｘ，Ｙに共通に含まれる同相成分Ｚの時間波形の一例を示すグラフ。本実施形態の同相成分抽出器におけるＸに含まれるＸ_Oの時間波形の一例を示すグラフ。本実施形態の同相成分抽出器におけるＹに含まれるＹ_Oの時間波形の一例を示すグラフ。同相強調に用いられる従来の演算結果（Ｘ＋Ｙ）／２の時間波形の一例を示すグラフ。本実施形態により入力信号Ｘ，Ｙから抽出された同相信号Ｚ’の時間波形の一例を示すグラフ。

符号の説明

２０Ｌ，２０Ｒ…信号入力部
２１…周波数分割フィルタ
２２…ダウンサンプリング器
２３_１〜２３_Ｎ…同相成分抽出器
２４…アップサンプリング器
２５_１〜２５_Ｎ…増幅器
２６…加算器
２７Ｌ，２７Ｒ…減算用演算器
２８Ｌ，２８Ｒ…遅延処理器
２９…フィルタ
３０…増幅器
３１Ｌ，３１Ｒ…同相成分合算用の演算器
３２Ｌ，３２Ｒ…増幅器
３３Ｌ，３３Ｒ…信号出力部
１Ｘ，１Ｙ…信号入力部
２Ｘ，２Ｙ…適応フィルタ
３Ｘ，３Ｙ…フィルタ係数生成器
４Ｘ，４Ｙ…サンプル遅延器
５Ｘ，５Ｙ…誤差信号算出用演算器
６…同相信号加算用演算器
７Ｘ，７Ｙ…無相関信号算出用演算器
８…乗算器
９Ｘ，９Ｙ…無相関信号出力部
１０…同相信号出力部
１１…加算器
Ｚ^−１…遅延処理器
Ｗ_０，Ｗ_１，・・・Ｗ_Ｍ…係数処理器

Claims

ミキシングされた任意の音源を必要となる信号の含まれる帯域に制限する機構と、各チャンネル間の相関に基づいて分離抽出する機構を有し、その結果得られる複数の出力それぞれに対し利得を制御し、再度ミキシングすることを特徴とするナレーション音声制御方法。
あらかじめ帯域分割された信号それぞれについて行われることを特徴とする請求項１に記載のナレーション音声制御方法。
ステレオ２チャンネル信号における左側入力信号INLの入力部２０Ｌと、右側入力信号INRの入力部２０Ｒと、
前記入力部２０Ｌ，２０Ｒの出力を複数の帯域１〜Ｎに分割する周波数分割フィルタ２１と、この周波数分割フィルタ２１に設けられて分割された各帯域の信号を低周波数により再サンプリングするダウンサンプリング器２２と、
ダウンサンプリング器２２から出力される各帯域の右側入力信号と左側入力信号を入力し、各帯域の信号中から同相信号Ｃ_１〜Ｃ_Ｎするために、それぞれの帯域ごとに設けられた同相成分抽出器２３_１〜２３_Ｎと、
各帯域の同相成分抽出器２３_１〜２３_Ｎからの出力を加算する加算器２６と、
左側入力信号INLと右側入力信号INRのそれぞれから同相成分Ｃを減算して、左側入力信号INLと右側入力信号INRの無相関信号部分Ｌ₀，Ｒ₀のみを取り出す減算用演算器２７Ｌ，２７Ｒと、
前記加算器２６からの同相成分の利得を制御する増幅器と、
この増幅器からの出力を減算用演算器２７Ｌ，２７Ｒから出力された無相関信号部分のみが取り出された左側入力信号INLと右側入力信号INRとを加算する同相成分合算用の演算器３１Ｌ，３１Ｒとを備えていることを特徴とするナレーション音声制御装置。