JP6039108B2

JP6039108B2 - 電子機器、制御方法およびプログラム

Info

Publication number: JP6039108B2
Application number: JP2015554413A
Authority: JP
Inventors: 智剛井田
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2013-12-26
Filing date: 2013-12-26
Publication date: 2016-12-07
Anticipated expiration: 2033-12-26
Also published as: WO2015097826A1; JPWO2015097826A1; US20160163330A1; US9905245B2

Description

本発明の実施形態は、電子機器、制御方法およびプログラムに関する。

近年、映像音声に対して、異なる属性をもつ音源別に音声信号を分離して、各音源別の音声信号に適切な音声補正を行った後、各音源別の音声信号を合成して出力する音源分離技術が提案されている。

このような音源分離技術では、一般的には、音声信号を、人間の声である声成分と、人間の声以外の背景成分に分離する。そして、声成分と背景音成分と個別に音量等の強調制御を行い、人間の声を聞きやすくしたり、あるいは人間の声を抑制する等の効果を得ることができる。

特開２００２−１５９０９９号公報

このような音源分離の機能を、音声信号に種々の音響効果の処理を行って出力することが可能な音声テレビジョン装置やＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、タブレット端末等の電子機器に搭載する場合がある。このような場合でも、最適な調整状態で音響効果が得られることが望まれている。

実施形態の電子機器は、音源分離処理部と、音響効果処理部と、音声制御部とを備える。音源分離処理部は、入力される音声信号を、声信号と背景音信号とに分離して、声信号または背景音信号を強調または抑制する音源分離機能を実行可能である。音響効果処理部は、音声信号に対して音響効果を付与する音響効果機能を実行可能である。音声制御部は、ユーザにより、音源分離機能を実行する旨の指示があった場合に、音源分離機能を実行するように音源分離処理部を制御し、かつ音響効果機能を実行しないように音響効果処理部を制御する。

図１は、実施形態１にかかるテレビジョン装置の構成の一例を示すブロック図である。図２は、実施形態１の制御部の機能的構成の一例を示すブロック図である。図３は、実施形態１の音声処理部の構成の一例を示す図である。図４は、実施形態１にかかる音声制御処理の手順の一例を示すフローチャートである。図５は、実施形態１にかかる音響設定画面の一例を示す図である。図６は、実施形態１にかかるフィルタ効果設定画面の一例を示す図である。図７は、実施形態１における音響効果と音源分離機能の表示の一例を示す図である。図８は、実施形態２にかかる音声制御処理の手順の一例を示すフローチャートである。図９は、実施形態３にかかる音声制御処理の手順の一例を示すフローチャートである。図１０は、実施形態３にかかる音声制御処理の手順の一例を示すフローチャートである。図１１は、実施形態４の音響効果の復元設定画面の一例を示す図である。図１２は、実施形態４にかかる音声制御処理の手順の一例を示すフローチャートである。図１３は、実施形態４の変形例にかかる音響効果の復元設定画面の一例を示す図である。

以下に示す実施形態は、電子機器を適用したテレビジョン装置の例について説明する。しかしながら、本実施形態は、電子機器をテレビジョン装置に制限するものではなく、例えば、ＰＣやタブレット端末等の音声を出力可能な装置であれば任意の装置に適用することができる。

（実施形態１）
本実施形態のテレビジョン装置１００は、図１に示すように、デジタル放送の放送波を受信し、受信した放送波から取り出した映像信号を用いて番組の映像を表示する据置型の映像表示装置であり、録画再生機能も備えている。

テレビジョン装置１００は、図１に示すように、アンテナ１１２、入力端子１１３、チューナ１１４および復調器１１５を有している。アンテナ１１２は、デジタル放送の放送波を捕らえ、その放送波の放送信号を、入力端子１１３を介してチューナ１１４に供給する。

チューナ１１４は、入力されたデジタル放送の放送信号から所望のチャンネルの放送信号を選局する。そして、チューナ１１４から出力された放送信号は復調器１１５に供給される。復調器１１５は、放送信号に復調処理を施し、デジタル映像信号および音声信号を復調して、後述するセレクタ１１６に供給する。

また、テレビジョン装置１００は入力端子１２１，１２３、Ａ／Ｄ変換部１２２、信号処理部１２４、スピーカ１２５および映像表示パネル１０２を有している。

入力端子１２１は外部からアナログの映像信号および音声信号が入力され、入力端子１２３は外部からデジタルの映像信号および音声信号が入力される。Ａ／Ｄ変換部１２２は入力端子１２１から供給されるアナログの映像信号および音声信号をデジタル信号に変換し、セレクタ１１６に供給する。

セレクタ１１６は、復調器１１５、Ａ／Ｄ変換部１２２および入力端子１２３から供給されるデジタルの映像信号及び音声信号から１つを選択して、信号処理部１２４に供給する。

また、テレビジョン装置１００は、少なくともＴＳデマルチプレクサおよびＭＰＥＧデコーダを有している。信号処理部１２４は、ＭＰＥＧデコーダによってデコードされた後の信号を入力する。さらに、信号処理部１２４は、ＨＤＤ１３０や、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）、Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ等の外部記憶媒体に記録されている番組録画データや動画データがデコードされた後の信号も入力する。

信号処理部１２４は、音声処理部１２４１と映像処理部１２４２とを備えている。映像処理部１２４２は、入力される映像信号について、所定の信号処理やスケーリング処理等を施し、処理後の映像信号を映像表示パネル１０２に供給する。さらに、映像処理部１２４２は、映像表示パネル１０２に表示させるためのＯＳＤ（ＯｎＳｃｒｅｅｎｄｉｓｐｌａｙ）信号も生成している。ここで、映像処理部１２４２と映像表示パネル１０２は、表示部の一例である。

音声処理部１２４１は、セレクタ１１６から入力されたデジタル音声信号に所定の信号処理を施し、アナログ音声信号に変換してスピーカ１２５に出力する。音声処理部１２４１の詳細については、後述する。スピーカ１２５は、信号処理部１２４から供給される音声信号を入力し、その音声信号を用いて音声を出力する。本実施形態の音声処理部１２４１は、音源分離機能を有している。音声処理部１２４１の詳細については後述する。

映像表示パネル１０２は、液晶ディスプレイやプラズマディスプレイ等のフラットパネルディスプレイから構成される。映像表示パネル１０２は、信号処理部１２４から供給される映像信号を用いて映像を表示する。

さらに、テレビジョン装置１００は制御部１２７、操作部１２８、受光部１２９、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３０、メモリ１３１、及び通信Ｉ／Ｆ１３２を有している。

制御部１２７は、テレビジョン装置１００における種々の動作を統括的に制御する。制御部１２７は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等を内蔵したマイクロプロセッサであり、操作部１２８からの操作情報を入力する一方、リモートコントローラ１５０から送信された操作情報を、受光部１２９を介して入力し、それらの操作情報にしたがい各部をそれぞれ制御する。本実施形態の受光部１２９は、リモートコントローラ１５０からの赤外線を受光する。

この場合、制御部１２７は、メモリ１３１を使用している。メモリ１３１は、主として、制御部１２７に内蔵されているＣＰＵが実行する制御プログラムを格納したＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、ＣＰＵに作業エリアを提供するためのＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。

ＨＤＤ１３０は、セレクタ１１６で選択されたデジタルの映像信号及び音声信号を記録する記憶部としての機能を有している。テレビジョン装置１００はＨＤＤ１３０を有するため、セレクタ１１６で選択されたデジタルの映像信号及び音声信号を録画データとしてＨＤＤ１３０により記録することができる。さらに、テレビジョン装置１００は、ＨＤＤ１３０に記録されたデジタルの映像信号及び音声信号を用いて映像および音声を再生することもできる。

通信Ｉ／Ｆ１３２は、公衆ネットワーク１６０を介して様々な通信装置（例えばサーバ）と接続されており、テレビジョン装置１００で利用可能なプログラムやサービスを受信するほか、様々な情報を送信することができる。

次に、制御部１２７により実行される機能的構成について説明する。本実施形態の制御部１２７は、図２に示すように、入力制御部２０１と、設定部２０３として機能する。

入力制御部２０１は、ユーザからのリモートコントローラ１５０による操作入力を受光部１２９を介して受け付けるとともに、操作部１２８による操作入力を受け付ける。本実施形態では、ユーザから、音源分離機能を使用するか否かなどの設定入力および音源分離機能を使用する場合における声と背景音の音量（強調の強度）の設定入力を受け付ける。また、入力制御部２０１は、ユーザから音響効果の設定を受け付ける。

ここで、音声信号は、人間の声の成分の信号と音楽等の声以外の背景音の成分の信号とから構成される。なお、これ以降、声成分の信号を声信号と称し、背景音成分の信号を背景音信号と称する。音源分離機能は、音声信号を、声信号と背景音信号とに分離して、声信号または背景音信号のいずれかを強調する機能であり、音声処理部１２４１で実行される。

設定部２０３は、ユーザからの各種設定を行い、設定内容をメモリ１３１等に保存する。本実施形態では、入力制御部２０１が受け付けた音源分離機能を使用するか否かなどの設定、声と背景音の音量（強調の度合い）の設定、および音響効果の設定をメモリ１３１等に保存する。

次に、信号処理部１２４の音声処理部１２４１の詳細について説明する。本実施形態の音声処理部１２４１は、図３に示すように、音声制御部３０１と、音源分離処理部３０２と、音響効果処理部３０３と、を備えている。

音声制御部３０１は、ユーザにより、音源分離機能を使用（実行）する旨の設定があった場合に、音源分離機能を実行するように音源分離処理部３０２を制御し、かつ音声信号に対して音響効果を付与する音響効果機能を実行しないように音響効果処理部３０３を制御する。

音声制御部３０１は、入力される音声信号を、音源分離処理部３０２に出力することにより、音源分離機能の有効化を行って、これにより音声信号の強調を行うように音源分離処理部３０２を制御する。音声制御部３０１は、音源分離機能の有効化を行う場合、音声信号とともにパラメータ指令を音源分離処理部３０２に出力する。このパラメータ指令は、声の強調や抑制を行ったり、背景音の強調や抑制を行う場合のパラメータである。

音源分離処理部３０２は、音声信号Ｘを、声信号と背景音信号とに分離して、声信号または背景音信号を強調または抑制する音源分離機能を実行する。音源分離処理部３０２は、図３に示すように、音源分離部４０１と、声補正フィルタ４０３と、背景音補正フィルタ４０４と、ゲインＧｖ４０５と、ゲインＧｂ４０６と、加算部４０７とを備えている。

音源分離部４０１は、入力される音声信号を声成分Ｖ（声信号Ｖ）と背景音成分Ｂ（背景音信号Ｂ）に分離する。音源分離部４０１による音声信号の分離手法は、任意の手法を用いることができる。音源分離部４０１は、音声信号の分離手法として、例えば、特開２０１３−３７１５２号公報に開示されている手法を用いることができるが、これに限定されるものではない。

声補正フィルタ４０３は、声信号Ｖの特性をパラメータ指令に基づいて補正して、補正後の声信号Ｖ’を出力する。背景音補正フィルタ４０４は、背景音信号Ｂの特性をパラメータ指令に基づいて補正して、補正後の背景音信号Ｂ’を出力する。

このような補正フィルタ４０３、４０４としては、定数値（利得調整のみ）からサラウンド等のチャネル間の相関を利用するもの等種々のものがある。例えば、声補正フィルタ４０３に、声信号Ｖに補聴器などで用いられている声の周波数特性を強調するフィルタを用いることで背景成分に影響を与えず声だけを聞こえやすくすることができる。また、背景音補正フィルタ４０４に、音源分離処理によって過剰に抑圧された周波数帯域を強めるフィルタや、音楽プレーヤ等に附属しているイコライザと同様な手法で聴覚的な効果を加えるフィルタなどを用いたり、背景音信号がステレオ信号である場合にはいわゆる疑似サラウンドの技術を用いたフィルタを適用することもできる。

声補正フィルタ４０３による補正後の声信号Ｖ’にはゲインＧｖ４０５が乗算され、背景音補正フィルタ４０４による補正後の背景音信号Ｂ’にはゲインＧｂ４０６が乗算される。

ここで、本実施形態の音声処理部１２４１は、音声制御部３０１からパラメータ指令を入力し、声補正フィルタ４０３、背景音補正フィルタ４０４の補正の強度をパラメータ指令に応じて変化させるとともに、ゲインＧｖ４０５とＧｂ４０６をパラメータ指令により変化させている。これにより、声補正フィルタ４０３およびゲインＧｖ４０５によるパラメータ指令による声の強調または抑制が行われ、背景音補正フィルタ４０４およびゲインＧｂ４０６によるパラメータ指令による背景音の強調または抑制が行われる。

加算部４０７はゲインＧｖ４０５が乗算された声信号とゲインＧｂ４０６が乗算された背景音信号とを加算することにより合成して、合成信号Ｙを出力する。

音響効果処理部３０３は、合成信号Ｙに対して、ユーザの設定による種々の音響効果を施して、音声信号を出力する。また、音響効果処理部３０３は、音声制御部３０１により音響効果が無効とされ、音響効果を停止する場合に、音響効果の実行中の設定内容をメモリ１３１等に保存する。ここで、音響効果としては、例えば、サラウンド効果、ダイナミックベースブースト、グラフィックイコライザ等があげられるがこれらに限定されるものではない。

次に、以上のように構成された本実施形態のテレビジョン装置１００による音声制御処理について図４を用いて説明する。まず、信号処理部１２４の映像処理部１２４２は、映像表示パネル１０２に、ＯＳＤとして音響設定画面を表示する（ステップＳ１１）。音響設定画面は、音源分離機能の使用を行うか否か、音源分離機能の使用を行う場合の声と背景音の強調の強度の設定、種々の音響効果の設定をユーザに行わせるための画面である。

図５は、実施形態１にかかる音響設定画面の一例を示す図である。図５に示すように、音響設定画面で「サウンドモード」が選択されると、画面右側に、サウンドモードの種類をユーザに選択させるサウンドモード画面が表示される。このサウンドモード画面において、ユーザが「音源分離」を選択した場合に音源分離機能がオンとなり、音源分離機能が使用される。一方、サウンドモード画面で、ユーザが、「標準」、「ミュージック」、「映画」のように音源分離以外を選択した場合には音源分離機能はオフとなり、音源分離機能が使用されない。

図４に戻り、音源分離機能がオンの指示があった場合には（ステップＳ１２：Ｙｅｓ）、音声制御部３０１は、フィルタリング効果の設定を有効にする（ステップＳ１３）。

すなわち、図５に示す音響設定画面において、サウンドモードで「音源分離」が選択され、音源分離機能がオンとなった場合に、音声制御部３０１は、「フィルタリング効果」の設定を有効とする。

ユーザがこの「フィルタリング効果」を選択すると、映像処理部１２４２は、フィルタリング効果設定画面を映像表示パネル１０２に表示する。フィルタリング効果設定画面は、音源分離機能をオンとした場合の声と背景音の強調の強度の設定をユーザに指定させるための画面である。図６は、実施形態１にかかるフィルタ効果設定画面の一例を示す図である。

図６に示す例では、バー６０２上の目盛りで「−５」から「＋５」までの１１段階で、声および背景音の強調のバランスを、フィルタリング効果として指定可能となっている。図６において、−方向が背景音成分を強調する方向であり、＋方向が声成分を強調する方向である。

フィルタリング効果「−５」は、声成分が殆ど出力されず、背景音成分のみが出力される値である。フィルタリング効果「０」は、声成分と背景音成分とが均等な強さ（音量）で出力される標準の値であり、フィルタリング効果「０」がデフォルト値となっている。フィルタリング効果「＋５」は、声成分のみが出力され、背景音成分が殆ど出力されない値である。

ユーザはこの声のフィルタリング効果設定画面において、バー６０２上で指示ボタン６０１を動かして、所望のフィルタリング効果を設定する。入力制御部２０１は、フィルタリング効果設定画面から指定されたフィルタリング効果の値の設定入力を受け付ける。なお、フィルタリング効果設定画面、フィルタリング効果の段階は、図６に示したものに限定されるものではなく、任意に定めることができる。

そして、音声制御部３０１は、フィルタリング効果で設定された値で、パラメータ指令を、音源分離処理部３０２に送出する。これにより、音源分離処理部３０２の声補正フィルタ４０３および背景音補正フィルタ４０４はパラメータ指令に従ってそれぞれ声信号、背景音信号に対しフィルタリング処理を行うことにより、声信号および背景音信号はフィルタリング効果設定で指定されたバランスの強調となる。

次に、音響効果処理部３０３は、現時点で設定されている音響効果の設定内容を、メモリ１３１等に保存する（ステップＳ１４）。そして、音声制御部３０１は、音響効果の無効化を行う（ステップＳ１５）。具体的には、音声制御部３０１は以下の処理を行う。

図５の音響設定画面における「サラウンド」、「ダイナミックベースブースト」、「グラフィックイコライザ」の各設定は、音響効果の設定である。ユーザにより、「サウンドモード」で「音源分離」が選択されて音源分離機能がオンになった場合には、音声制御部３０１は、音響効果の無効化の処理として、これらの音響効果の設定を無効とし設定できないようにする。なお、かかる音響効果の項目は、ユーザにより、「サウンドモード」で「音源分離」以外の項目が選択されて音源分離機能がオフになった場合に有効となり設定可能となる。

なお、図５に示す音響設定画面の音源分離機能の設定、フィルタリング効果の設定、各種音響効果の設定はいずれも一例であり、図５に示す例に限定されるものではない。

また、音声制御部３０１は、音響効果の無効化の処理として、音響効果処理部３０３の音響効果に関するパラメータの指定をすべて無効とし、合成された音声信号に対して何も音響効果が付与されないように音響効果処理部３０３を制御する。

これにより、音源分離機能がオンとなった場合、ユーザは音響設定画面において音響効果の設定ができなくなる他、音声処理部１２４１に入力された音声信号は音源分離処理部３０２を通過した後、音響効果処理部３０３に入力されるが、音声信号に対して音響効果の付与が行われずに出力されることになる。

ステップＳ１２において、ユーザにより音源分離機能がオフの指示があった場合には（ステップＳ１２：Ｎｏ）、音声制御部３０１は、フィルタリング効果の設定を無効とする（ステップＳ１６）。具体的には、音声制御部３０１は、図５に示す音響設定画面で、「フィルタリング効果」の設定を無効とし、設定できないようにする。さらに、音声制御部３０１は、入力される音声信号を、音源分離処理部３０２に出力する際に、パラメータ指令を、声信号と背景音信号の強調および抑制を行わない設定値として、音源分離処理部３０２に出力する。これにより、音源分離処理部３０２の各フィルタや各ゲインは、声信号と背景音信号の双方に対して強調や抑制の処理を行わない。

そして、音声制御部３０１は、メモリ１３１等に保存されている音響効果の設定を取得し（ステップＳ１７）、取得した設定内容で音響効果の有効化を行う（ステップＳ１８）。具体的には、音声制御部３０１は、音響効果の有効化の処理として、図５の音響設定画面において、「サラウンド」、「ダイナミックベースブースト」、「グラフィックイコライザ」の音響効果の各設定を有効にする。さらに、音声制御部３０１は、音響効果の有効化の処理として、音響効果処理部３０３の音響効果に関するパラメータを、ステップＳ１７で取得した設定内容とし、音声信号に対し音響効果が付与されるように音響効果処理部３０３を制御する。

そして、映像処理部１２４２は、映像を映像表示パネル１０２に表示する際に、映像の画面に、ＯＳＤとして、音響効果と音源分離機能の状態表示を行う（ステップＳ１９）。具体的には、映像処理部１２４２は、現在に音響効果の設定内容および音源分離機能で強調している成分の表示を行う。図７は、実施形態１における音響効果と音源分離機能の状態表示の一例を示す図である。

図７に示すように、映像の上方の領域に、音響効果の現在の設定（符号７０１、７０２）と音源分離機能で強調している成分の表示（符号７０４）が行われる。図７の例では、音源分離機能がオンとなっており、符号７０３により声は強調されておらず、符号７０４により背景音が強調されていることが示されている。また、音響効果に関しては、符号７０１によりサラウンド機能は無効化され、グラフィックイコライザ機能も無効化されていることが示されている。なお、図７に示した音響効果と音源分離機能の状態表示の画面は一例であり、これに限定されるものではなく、種々の方法で表示することができる。

音源分離機能をテレビジョン装置１００等の電子機器に搭載した場合、音源分離機能と一般的な音響効果の設定が両立しない場合がある。あるいは、音源分離機能による声または背景音の強調または抑制等のフィルタリング処理後の音声信号に対して音響効果の処理を施しても、音響効果が最適な調整状態にならない場合がある。

本実施形態では、上述のように、ユーザにより、音源分離機能をオンとする旨の設定があった場合に、音源分離機能を実行するように音源分離処理部３０２を制御し、かつ音声信号に対して音響効果を付与する音響効果機能を実行しないように音響効果処理部３０３を制御する。このため、音源分離機能による声または背景音の強調または抑制の効果が音響効果によって減少されずに、最適に発揮することができる。このため、本実施形態によれば、音源分離機能を電子機器に搭載した場合でも、最適な調整状態で音響効果を得ることができる。

（実施形態２）
実施形態１では、テレビジョン装置１００は、音源分離機能のオンの指示があった場合、常に音響効果を無効としていたが、声の強調の強度が背景音の強調の強度以下である場合には、声は強調されていないため音響効果を音声信号に付与しても影響は少ないと考えられる。このため、この実施形態２では、テレビジョン装置１００は、音源分離機能のオンの指示があった場合でも、背景音の強調の強度は声の強調の強度より大きいフィルタリング効果設定の場合には、音響効果を無効としない。

本実施形態のテレビジョン装置１００の構成、制御部１２７の機能的構成、音声処理部１２４１の構成については実施形態１と同様である。

図８は、実施形態２にかかる音声制御処理の手順の一例を示すフローチャートである。実施形態１と同様に、映像処理部１２４２が音響設定画面を表示し（ステップＳ１１）、音声制御部３０１が音響設定画面でユーザから音源分離機能のオンの指示があったか否かを判断する（ステップＳ１２）。そして、音源分離機能のオフの指示があった場合には（ステップＳ１２：Ｎｏ）、制御はステップＳ１６へ移行し、実施形態１と同様の処理が行われる。

一方、ステップＳ１２で、音響設定画面でユーザから音源分離機能のオンの指示があった場合には（ステップＳ１２：Ｙｅｓ）、音声制御部３０１は、実施形態１と同様に、フィルタリング効果設定を有効にする（ステップＳ１３）。

次に、音声制御部３０１は、ユーザによるフィルタリング効果の設定で、声信号の強調の強度が背景音信号の強調の強度以上か否かを判断する（ステップＳ３１）。そして、声信号の強調の強度が背景音信号の強調の強度以上である場合には（ステップＳ３１：Ｙｅｓ）、実施形態１と同様に、音響効果処理部３０３は、現在の音響効果の設定をメモリ１３１等に保存する（ステップＳ１４）。音声制御部３０１は、音響効果機能の無効化を行って、音響効果機能を実行しないように音響効果処理部３０３を制御する（ステップＳ１５）。

一方、ステップＳ３１で、フィルタリング効果設定で、声信号の強調の強度が背景音信号の強調の強度未満である場合には（ステップＳ３１：Ｎｏ）、音声制御部３０１は、音響効果機能の無効化を行わずに、設定内容で音響効果機能の有効化を行って、音響効果機能を実行するように音響効果処理部３０３を制御する（ステップＳ３２）。

その後、実施形態と同様に、映像処理部１２４２は、音響効果と音源分離機能の表示を行う（ステップＳ１９）。

このように本実施形態では、テレビジョン装置１００は、音源分離機能のオンの指示があった場合でも、背景音の強調の強度は声の強調の強度より大きいフィルタリング効果設定の場合には、音響効果を無効としないので、音源分離機能を使用する場合でも声の強調に音響効果が影響しない場合には音響効果を最適に発揮させることができる。このため、本実施形態によれば、音源分離機能を電子機器に搭載した場合でも、最適な調整状態で音響効果を得ることができる。

（実施形態３）
実施形態３では、実施形態１または２の機能に加えて、テレビジョン装置１００は、音源分離機能の実行中に、所定のタイミングを検出した場合、音源分離機能の無効化を行って、音響効果機能を復元している。

本実施形態のテレビジョン装置１００の構成、制御部１２７の機能的構成、音声処理部１２４１の構成については実施形態１と同様である。図９は、実施形態３にかかる音声制御処理の手順の一例を示すフローチャートである。

音源分離処理部３０２による音源分離機能の動作中において（ステップＳ５１）、本実施形態の音声制御部３０１は、所定のタイミングの検出待ちとなっている（ステップＳ５２：Ｎｏ）。そして、音声制御部３０１は、所定のタイミングを検出した場合に（ステップＳ５２：Ｙｅｓ）、音源分離機能の無効化、すなわち音源分離機能の実行を停止するように音源分離処理部３０２を制御する（ステップＳ５３）。

具体的には、音声制御部３０１は、音声信号を音源分離処理部３０２に出力するとともに、声補正フィルタ４０３の強度を変更せず、ゲインＧｖ４０５を１とするパラメータ指令、および背景音補正フィルタ４０４の強度を変更せず、ゲインＧｂ４０６を１とするパラメータ指令を、音源分離処理部３０２に出力し、声と背景音の強調および抑制を行わないようにすることにより、音源分離機能の無効化を行う。

なお、音源分離機能の無効化の手法は、これに限定されるものではなく、音声信号を、音源分離処理部３０２を介さずに、音響効果処理部３０３に出力することにより、音源分離機能の無効化を行うように音声制御部３０１を構成してもよい。

そして、音声制御部３０１は、メモリ１３１等に保存されている音響効果の設定内容を取得することにより、音源分離機能の実行前の音響効果の設定内容を復元する（ステップＳ５４）。そして、音声制御部３０１は、復元した設定内容で音響効果機能の有効化、すなわち音響効果の付与を行うように音響効果処理部３０３を制御する（ステップＳ５５）。

ここで、所定のタイミングは、放送チャンネルの切替え、放送番組の切替え、入力デバイスの切替え、電源切断後の電源投入、ＣＭシーンと本編シーンの切替え、楽曲の開始または終了等がある。

具体的には、音声制御部３０１は、ユーザによる操作部１２８やリモートコントローラ１５０からのチャンネルの切替えを受け付けた場合に、所定のタイミングとして検出し、音源分離機能を無効にし音響効果機能を復元するように、音源分離処理部３０２と音響効果処理部３０３とを制御する。

また、テレビジョン装置１００は、電子番組表（ＥＰＧ：ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）をデジタル放送の放送波で一定時間ごとに受信している。音声制御部３０１は、この電子番組表を参照して、現在、ユーザが視聴中の番組が次の番組に切り替わる時点を、所定のタイミングとして検出し、音源分離機能を無効にし音響効果機能を復元するように、音源分離処理部３０２と音響効果処理部３０３とを制御する。

また、ユーザが入力端子にゲーム機器やＨＤＭＩ（登録商標）（Ｈｉｇｈ−ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）機器等を接続することにより、入力デバイスの切替えが検知された場合、音声制御部３０１は、その入力切替えの時点を、所定のタイミングとして検知し、音源分離機能を無効にし音響効果機能を復元するように、音源分離処理部３０２と音響効果処理部３０３とを制御する。

また、制御部１２７は、放映番組や録画番組のシーン検出を実行し、その結果シーン情報を出力する。シーン情報は、シーン検出されたシーンのシーン種別と開始時刻および終了時刻とを記録したデータである。シーン種別とは、本編シーン、ＣＭシーン、歌シーン、歌以外のシーン等を示すものである。

音声制御部３０１は、このシーン情報を制御部１２７から取得し、放映中の番組あるいは再生中の録画番組のシーンが本編シーンからＣＭシーンに切り替わった時点を、所定のタイミングとして検出し、音源分離機能を無効にし音響効果機能を復元するように、音源分離処理部３０２と音響効果処理部３０３とを制御する。

また、制御部１２７は、放映番組や録画番組の楽曲検出を実行することができる。この楽曲検出により楽曲の開始または終了が検出された場合、音声制御部３０１はその検出時点を所定のタイミングとして検出し、音源分離機能を無効にし音響効果機能を復元するように、音源分離処理部３０２と音響効果処理部３０３とを制御する。

また、図１０に示すように、音源分離機能の動作中に（ステップＳ７１）、ユーザによる電源切断（電源オフ）が行われ（ステップＳ７２：Ｙｅｓ）、その後、電源投入（電源オン）が行われた場合（ステップＳ７３：Ｙｅｓ）、音声制御部３０１は、この電源オフ後の電源オンの時点を所定のタイミングとして検出する。そして、音声制御部３０１は、音源分離機能を無効にし（ステップＳ７４）、音響効果機能を復元して実行するように、音源分離処理部３０２と音響効果処理部３０３とを制御する（ステップＳ７５，Ｓ７６）。

このように本実施形態では、テレビジョン装置１００は、音源分離機能の実行中に、所定のタイミングを検出した場合、音源分離機能の無効化を行って、音響効果機能を復元している。すなわち、本実施形態では、特定の操作等の所定のタイミングで音源分離機能を無効にする際に、音源分離機能の実行前の音響効果の設定を復元することで、ユーザが元の音響効果に戻す作業を省略し、さらに限られた音が聞こえなくなるという音源分離機能の誤認識を防止することができる。従って、本実施形態によれば、音源分離機能を電子機器に搭載した場合でも、最適な調整状態で音響効果を得ることができる。

（実施形態４）
実施形態３では、テレビジョン装置１００は、音源分離機能の実行中に所定のタイミングを検出した場合に、常に音源分離機能を無効化、および音響効果機能の復元を行っていたが、この実施形態４では、テレビジョン装置１００は、ユーザによる音響効果機能の復元の指示がある場合に、音源分離機能を無効化および音響効果機能の復元を行う。

本実施形態では、音響効果の復元設定画面において、所定のタイミングが検出された場合、音響効果の復元を行うか否かをユーザが予め指定可能となっている。図１１は、実施形態４の音響効果の復元設定画面の一例を示す図である。

図１１に示すように、音響効果の復元設定画面では、所定のタイミングが検出された場合、音響効果の復元を行うか否かの指定が可能となっている。図１１の例では、「ＯＮ」（オン）が設定されている場合に、所定のタイミングの検出時点で音響効果が復元される。一方、「ＯＦＦ」（オフ）が設定されている場合は、所定のタイミングが検出されても復元されず、音源分離機能も無効とされない。

音響効果の復元設定画面による復元の設定は、初期設定等の事前に行われる。また、音響効果の復元設定画面による復元の設定内容は、設定部２０３により、メモリ１３１等に保存される。

図１２は、実施形態４にかかる音声制御処理の手順の一例を示すフローチャートである。実施形態３と同様に、音源分離処理部３０２による音源分離機能の動作中において（ステップＳ５１）、所定のタイミングが検出された場合に（ステップＳ５２：Ｙｅｓ）、音声制御部３０１は、メモリ１３１等を参照して、音響効果の復元の設定がオンになっているか否かを判断する（ステップＳ９１）。

そして、復元の設定がオフとなっている場合には（ステップＳ９１：Ｎｏ）、制御はステップＳ５１へ戻る。すなわち、音声制御部３０１は、音源分離機能の実行を継続するように音源分離処理部３０２を制御し、音響効果機能を実行しないように音響効果処理部３０３を制御する。

一方、復元の設定がオンとなっている場合には（ステップＳ９１：Ｙｅｓ）、実施形態３と同様に、音声制御部３０１は、音源分離機能の無効化（ステップＳ５３）、音響効果の設定内容の取得による復元を行い（ステップＳ５４）、復元した設定内容で音響効果機能の有効化、すなわち音響効果の付与を行うように音響効果処理部３０３を制御する（ステップＳ５５）。

このように本実施形態では、テレビジョン装置１００は、ユーザによる音響効果機能の復元の指示がある場合に、音源分離機能を無効化および音響効果機能の復元を行うので、所定のタイミングでも、復元の必要がない場合には、音源分離機能を無効化および音響効果機能の復元を行わない。このため、本実施形態によれば、音源分離機能を電子機器に搭載した場合でも、より最適な調整状態で音響効果を得ることができる。

なお、図１１の音響効果の復元設定画面の例では、音響効果全体で復元するか否かの設定が可能となっているが、音響効果の項目ごとに復元するか否かを設定するように音響効果の復元設定画面、音声制御部３０１および音響効果処理部３０３を構成してもよい。

例えば、図１３に示す音響効果の復元設定画面では、各音響効果ごとに、所定のタイミングが検出された場合、音響効果の復元を行うか否かの指定が可能となっている。この場合、音声制御部３０１は、音響効果の項目ごとに復元の設定を判断する。

図１３の例では、「ＯＮ」（オン）が設定されている項目の音響効果が、所定のタイミングの検出時点で復元される。一方、「ＯＦＦ」（オフ）が設定されている項目の音響効果は、所定のタイミングが検出されても復元されず、音源分離機能も無効とされない。

また、本実施形態では、テレビジョン装置１００は、事前に初期設定等で音響効果の復元設定を行っているが、所定のタイミングが検出された時点で、図１１に示す音響効果の復元設定画面を映像表示パネル１０２に表示し、ユーザに音源分離機能の無効化および音響効果の復元の可否を問い合わせるように、音声制御部３０１、映像処理部１２４２を構成してもよい。

なお、上記実施形態のテレビジョン装置１００で実行される音声制御プログラムは、メモリ１３１のＲＯＭ等に予め組み込まれてコンピュータプログラムプロダクトとして提供される。

上記実施形態のテレビジョン装置１００で実行される音声制御プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供するように構成してもよい。

さらに、上記実施形態のテレビジョン装置１００で実行される音声制御プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることによりコンピュータプログラムプロダクトとして提供するように構成しても良い。また、上記実施形態のテレビジョン装置１００で実行される音声制御プログラムをコンピュータプログラムプロダクトとしてインターネット等のネットワーク経由で提供または配布するように構成しても良い。

上記実施形態のテレビジョン装置１００で実行される音声制御プログラムは、上述した各部（入力制御部２０１、設定部２０３、音声制御部３０１、音源分離処理部３０２、音響効果処理部３０３）を含むモジュール構成となっており、ＣＰＵが上記ＲＯＭから音声制御プログラムを読み出して実行することにより上記各部がメモリ１３１のＲＡＭ上にロードされ、各部がＲＡＭ上に生成されるようになっている。

さらに、ここに記述されたシステムの種々のモジュールは、ソフトウェア・アプリケーション、ハードウェアおよび／またはソフトウェア・モジュール、あるいはサーバのような一台以上のコンピュータ上のコンポーネントとしてインプリメントすることができる。種々のモジュールは、別々に説明されているが、それらは同じ根本的なロジックかコードのうちのいくつかあるいはすべてを共有してもよい。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims

入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号を強調または抑制する音源分離機能を実行可能な音源分離処理部と、
前記音声信号に対して音響効果を付与する音響効果機能を実行可能な音響効果処理部と、
ユーザにより、前記音源分離機能を実行する旨の指示があった場合に、前記音源分離機能を実行するように前記音源分離処理部を制御し、かつ前記音響効果機能を実行しないように前記音響効果処理部を制御する音声制御部と、
を備えた電子機器。
前記音声制御部は、前記音源分離機能を実行する場合に、前記ユーザによる強調の強度の設定指示において、前記声信号の強調の強度が前記背景音信号の強調の強度未満である場合に、前記音響効果機能を実行するように前記音響効果処理部を制御する、
請求項１に記載の電子機器。
前記音声制御部は、前記音源分離機能を実行する場合に、前記ユーザによる強調の強度の設定指示において、前記声信号の強調の強度が前記背景音信号の強調の強度以上である場合に、前記音響効果機能を実行しないように前記音響効果処理部を制御する、
請求項２に記載の電子機器。
前記音声制御部は、前記音源分離機能の実行中に、所定のタイミングを検知した場合に、前記音源分離機能の実行を停止するように前記音源分離処理部を制御し、前記音源分離機能の実行前の設定内容で前記音響効果機能を実行するように前記音響効果処理部を制御する、
請求項１に記載の電子機器。
前記所定のタイミングは、放送チャンネルの切替え、放送番組の切替え、入力デバイスの切替え、電源切断後の電源投入、ＣＭシーンと本編シーンの切替え、楽曲の開始または終了の少なくともいずれかを含む、
請求項４に記載の電子機器。
前記音声制御部は、前記音源分離機能の実行中に、所定のタイミングを検知した場合に、ユーザから前記音響効果を復元する旨の設定が行われている場合に、前記音源分離機能の実行を停止するように前記音源分離処理部を制御し、かつ前記音源分離機能の実行前の設定内容で前記音響効果機能を実行するように前記音響効果処理部を制御する、
請求項４に記載の電子機器。
前記音声制御部は、ユーザから前記音響効果を復元する旨の設定が行われていない場合には、前記音源分離機能の実行を継続するように前記音源分離処理部を制御し、前記音響効果機能を実行しないように前記音響効果処理部を制御する、
請求項６に記載の電子機器。
前記音源分離機能による声信号または背景音信号の強調の状態、および前記音響効果の状態を、映像とともに表示する表示部、
をさらに備えた請求項１に記載の電子機器。
入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号を強調または抑制する音源分離機能を実行する旨のユーザからの指示があった場合に、前記音源分離機能を実行し、かつ前記音声信号に対して音響効果を付与する音響効果機能を実行しないように制御する、
ことを含む制御方法。
入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号を強調または抑制する音源分離機能を実行する旨のユーザからの指示があった場合に、前記音源分離機能を実行し、かつ前記音声信号に対して音響効果を付与する音響効果機能を実行しないように制御する、
ことをコンピュータに実行させるためのプログラム。