JP2013121096A - 音声調整装置およびデジタル放送受信装置 - Google Patents

音声調整装置およびデジタル放送受信装置 Download PDF

Info

Publication number
JP2013121096A
JP2013121096A JP2011268564A JP2011268564A JP2013121096A JP 2013121096 A JP2013121096 A JP 2013121096A JP 2011268564 A JP2011268564 A JP 2011268564A JP 2011268564 A JP2011268564 A JP 2011268564A JP 2013121096 A JP2013121096 A JP 2013121096A
Authority
JP
Japan
Prior art keywords
voice
audio
unit
adjustment
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011268564A
Other languages
English (en)
Inventor
Hidehito Kondo
秀仁 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2011268564A priority Critical patent/JP2013121096A/ja
Publication of JP2013121096A publication Critical patent/JP2013121096A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)

Abstract

【課題】字幕情報を用いることなく、放送番組の所望の出演者の音声に対してだけ音声調整を行う。
【解決手段】音声調整装置1は、放送信号に含まれる音声信号の中から番組の全出演者の声紋データを検出する声紋検出部2と、特定の出演者の名前が関連付けられた声紋データを登録する声紋登録部3と、特定の出演者の音声信号にのみ音声調整を行うように指示する音声調整指示部4と、音声調整指示部4による指示に応じて、声紋検出部2で検出される全出演者の声紋データと声紋登録部3で登録された特定の出演者の声紋データとを比較し、声紋データが一致する音声信号を出力する声紋比較部5と、声紋比較部5から出力された音声信号に対してのみ音声調整を行う第1の音声調整部6とを備える。
【選択図】図1

Description

本発明は、音声調整装置およびデジタル放送受信装置に関し、より詳細には、放送番組における特定の出演者の音声を抽出し、抽出した音声のみを調整する音声調整装置および該装置を備えたデジタル放送受信装置に関する。
近年、デジタルテレビジョン放送を視聴する環境として、5.1チャンネルスピーカなどを用いた音声の高音質化、サラウンド化が普及している。しかしながら、音声再生技術の発達と共に、アナウンサの声や出演者の台詞などといった実際の登場人物が発している声が聞き取りにくくなる状況が発生している。例えば、番組の背景に流れる周囲の歓声などに遮られ、アナウンサの声が聞こえにくくなる場合があった。
これに対して、例えば、特許文献1には、現在の場面に登場する話者が発する音声を聞き取り易くしたデジタル放送受信装置が記載されている。このデジタル放送受信装置は、音声信号と字幕情報とを抽出し、抽出した字幕情報に基づいて、受信した音声信号のうち、現在の場面で登場する登場人物が発していると推定される音声信号部分を抽出し、抽出した音声信号部分の音量および/または音質を調整するように構成されている。
特開2006−93918号公報
しかしながら、上記特許文献1に記載された技術では、放送信号に字幕情報が含まれていない場合に、現在の場面で登場する登場人物が発している音声信号を抽出することはできない。近年では字幕放送に対応している番組は増えているがまだ十分ではないため、そのような字幕未対応番組については現在の場面で登場する登場人物が発する音声を抽出することはできない。
本発明は、上述のような実情に鑑みてなされたもので、字幕情報を用いることなく、放送番組の所望の出演者の音声に対してだけ音声調整を行うことができる音声調整装置および該装置を備えたデジタル放送受信装置を提供すること、を目的とする。
上記課題を解決するために、本発明の第1の技術手段は、番組の放送信号に含まれる音声信号の調整を行う音声調整装置であって、前記放送信号に含まれる音声信号の中から番組の全出演者の音声特徴量を検出する音声特徴量検出部と、特定の出演者の名前が関連付けられた音声特徴量を登録する音声特徴量登録部と、前記音声特徴量検出部で検出された全出演者の音声特徴量と前記音声特徴量登録部で登録された前記特定の出演者の音声特徴量とを比較し、音声特徴量が一致する音声信号を出力する音声特徴量比較部と、該音声特徴量比較部から出力された音声信号に対してのみ音声調整を行う音声調整部とを備えたことを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記特定の出演者の音声信号にのみ音声調整を行うように指示する音声調整指示部を備え、前記音声特徴量比較部は、前記音声調整指示部による指示に応じて、前記比較を行うことを特徴としたものである。
第3の技術手段は、第1または第2の技術手段において、前記音声特徴量検出部で検出された全出演者の音声特徴量の中から前記特定の出演者の音声特徴量を選択させるための選択画面を表示させ、該選択画面により選択された音声特徴量を前記特定の出演者の名前に関連付ける関連付け設定部を備え、前記音声特徴量登録部は、前記関連付け設定部により前記特定の出演者の名前が関連付けられた音声特徴量を登録することを特徴としたものである。
第4の技術手段は、第1〜第3のいずれか1の技術手段において、前記音声特徴量は、声紋データであることを特徴としたものである。
第5の技術手段は、第1〜第4のいずれか1の技術手段において、前記音声調整部は、前記音声特徴量比較部から出力された音声信号に対して音量および/または音質を調整することを特徴としたものである。
第6の技術手段は、第1〜第5のいずれか1の技術手段において、前記音声調整部で音声調整された前記特定の出演者の音声信号に応じた音声のみを出力する音声出力部を備えたことを特徴としたものである。
第7の技術手段は、第1〜第5のいずれか1の技術手段において、前記音声調整部に入力される前の前記特定の出演者の音声信号と前記音声調整部で音声調整された後の前記特定の出演者の音声信号との差分信号を算出する差分信号算出部と、該差分信号算出部で算出された差分信号と前記放送信号に含まれる音声信号とを合成する音声合成部と、該音声合成部で合成された音声信号に応じた音声を出力する音声出力部とを備えたことを特徴としたものである。
第8の技術手段は、第1〜第7のいずれか1の技術手段における音声調整装置を備えたデジタル放送受信装置である。
本発明によれば、所望の出演者の名前が関連付けられた音声特徴量(声紋など)を登録しておき、放送番組の音声信号から検出される全出演者の音声特徴量と所望の出演者の音声特徴量とを比較し、音声特徴量が一致する音声信号だけを抽出することができるため、字幕情報を用いることなく、放送番組の所望の出演者の音声に対してだけ音声調整を行うことができる。
本発明の一実施形態に係る音声調整装置の要部構成例を示すブロック図である。 関連付け設定部により特定の出演者名と声紋データとを関連付ける方法の一例を説明するための図である。 音声調整対象リストの一例を示す図である。 音声調整用メニューの一例を示す図である。 本発明の音声調整装置による声紋データと特定出演者名との関連付け方法の一例を説明するためのフロー図である。 本発明の音声調整装置による特定出演者の音声調整方法の一例を説明するためのフロー図である。
以下、添付図面を参照しながら、本発明の音声調整装置および該装置を備えたデジタル放送受信装置に係る好適な実施の形態について説明する。
図1は、本発明の一実施形態に係る音声調整装置の要部構成例を示すブロック図で、図中、1は音声調整装置を示す。音声調整装置1は、声紋検出部2、声紋登録部3、音声調整指示部4、声紋比較部5、第1の音声調整部6、音声出力部7、関連付け設定部8、差分信号算出部9、音声合成部10、第2の音声調整部11、およびリモコン信号受信部12を備える。リモコン信号受信部12は、ユーザがリモコンRを操作することによりリモコンRから送信される各種のリモコン(操作)信号を受信する。
本発明の主たる目的は、字幕情報を用いることなく、放送番組の所望の出演者の音声に対してだけ音声調整を行うことができるようにすることにある。このための構成として、音声調整装置1は、放送信号に含まれる音声信号の中から番組の全出演者の音声特徴量を検出する音声特徴量検出部と、特定の出演者の名前が関連付けられた音声特徴量を登録する音声特徴量登録部と、音声特徴量検出部で検出された全出演者の音声特徴量と音声特徴量登録部で登録された特定の出演者の音声特徴量とを比較し、音声特徴量が一致する音声信号を出力する音声特徴量比較部と、音声特徴量比較部から出力された音声信号に対してのみ音声調整を行う音声調整部とを備える。
上記構成により、リモコン操作等によって直感的に、所望の出演者の音声だけを好みの音質に調整したり、聴き取り易くしたりすることを可能とし、ユーザの趣味嗜好に合った音声調整を行うことができる。また、例えば、難聴者のために、特定の出演者の音声の音量のみを大きくして聴き取り易くするといった使い方もすることができる。
本実施形態では、音声特徴量の一例として声紋データを例示して説明するが、これに限定されるものではない。また、この音声調整装置1を備えたデジタル放送受信装置の形態としてもよい。デジタル放送受信装置は、デジタル放送信号を受信するデジタルチューナと、液晶ディスプレイ等の表示部とを備えており、具体的には液晶テレビとして例示することができる。この場合、図示しないデジタルチューナで受信した放送信号をデコードすることにより映像信号、音声信号、およびメタデータなどが抽出され、音声データおよびメタデータが音声調整装置1に入力される。なお、図1の例では、第1の音声調整部6と第2の音声調整部11とを区別して記載しているが、1つの音声調整部として構成するようにしてもよい。
図1において、声紋検出部2は、本発明の音声特徴量検出部に相当し、放送信号に含まれる音声信号の中から番組の全出演者の声紋を検出する。この声紋検出を行なうタイミングとしては、例えば、ユーザがリモコンRの所定の操作ボタンを押下したとき、あるいは、予め定められた時間間隔で自動的に行うようにしてもよい。なお、声紋とは、人間の声を分析し、特徴を抽出したパターンのことで、個人の識別に一般的に利用されている。人間の声は様々な周波数の音波の集まりで構成されており、時間、周波数、強度をグラフ化することができる。このグラフは指紋のように人それぞれ異なった特徴的なパターンを描くために「声紋」と呼ばれている。そして、この声紋検出技術は公知の技術であるため、ここでの具体的な説明は省略するが、FFT(高速フーリエ変換)等により得られる周波数分析結果を利用すればよい。
また、声紋登録部3は、本発明の音声特徴量登録部に相当し、特定の出演者の名前が関連付けられた声紋データを登録する。ここでは、関連付け設定部8を用いて、特定の出演者の名前と声紋データとを関連付ける場合について説明する。すなわち、関連付け設定部8は、声紋検出部2で検出された全出演者の声紋データの中から特定の出演者の声紋データを選択させるための選択画面を表示させ、選択画面により選択された声紋データを特定の出演者の名前に関連付ける。そして、声紋登録部3は、関連付け設定部8により特定の出演者の名前が関連付けられた声紋データを登録する。なお、例えば、外部サーバ等から、特定の出演者の名前が関連付けられた声紋データを取得できる場合には、外部サーバ等から取得するようにしてもよい。この場合、音声調整装置1は、ネットワークを介して外部サーバに接続するためのネットワークインタフェース(図示せず)を備え、上記の関連付け設定部8を不要とすることができる。
図2は、関連付け設定部8により特定の出演者名と声紋データとを関連付ける方法の一例を説明するための図である。まず、ユーザがある放送番組を視聴しているときに、リモコンR(図1)を操作して、特定の出演者名と声紋データとの関連付けを指示すると、関連付け設定部8は、この関連付け指示に応じて、声紋検出部2で検出された全出演者の声紋データ(ここでは、声紋データ1a〜4a)を取得する。そして、取得した全出演者の声紋データ1a〜4aのリストを図2(A)に示すような声紋リスト20として表示部(図示せず)にOSD(On Screen Display)により表示させる。この声紋リスト20のOSD画面は本発明の選択画面に相当する。
図2(A)に示す声紋リスト20は、ユーザが現在視聴している番組に出演している不特定多数の出演者の声紋データ1a〜4aのリストである。この不特定多数の出演者の声紋データ1a〜4aは視聴中の放送番組の音声データから声紋検出部2により検出される。そして、声紋リスト20には、選択欄21、再生ボタン22、および出演者名入力ボタン23が表示される。ユーザは、声紋リスト20を見ただけでは、どの声紋データがどの出演者のものであるか特定することはできない。そこで、声紋リスト20にリストアップされた声紋データ1a〜4aの音声を順番にあるいはランダムに再生し、ユーザがこの再生音声を聞くことで所望の出演者の声紋データを特定する。
具体的には、ユーザはリモコンRを操作して、例えば、声紋データ1aの選択欄21にチェックを入れて、再生ボタン22を押下する。すると、声紋データ1aに対応する音声が再生され、ユーザはこの再生音声を聴いて所望の出演者の音声であるか否かを判断する。このとき、放送番組を視聴中である場合には、視聴中の放送番組の音声を一時的にミュートすることで、再生音声が聴き取り易くなるため望ましい。そして、再生音声が所望の出演者の音声であれば、出演者名入力ボタン23を押下し、図2(B)に示す出演者リスト30を表示部にOSDにより表示させる。ここでは、声紋データ1aの再生音声が所望の出演者の音声として選択されている。
図2(B)に示す出演者リスト30は、図2(A)の声紋リスト20で選択された声紋データ1aに関連付け可能な出演者名のリスト(ここでは、出演者A〜D)である。この出演者リスト30には、選択欄31、確定ボタン32、および戻るボタン33が表示される。ここで、放送番組に出演している出演者名は、その放送番組に関する番組情報等のメタデータから取得することができる。本例の場合、放送番組の出演者名として、出演者A〜Dが取得される。ユーザは、出演者リスト30にリストアップされた出演者A〜Dを見て、所望の出演者名(ここでは出演者C、以下、特定出演者Cという)の選択欄31にリモコンRを用いてチェックを入れる。
それぞれ選択欄にチェックの入った特定出演者Cと声紋データ1aとはペアリングされ、ユーザがリモコンRを操作して、出演者リスト30の確定ボタン32を押下すると、図2(C)に示すように、特定出演者Cと声紋データ1aとの関連付け情報が生成される。この生成された関連付け情報は声紋データ1aと共に声紋登録部3に登録される。このようにして、特定出演者の名前と声紋データとを関連付けて登録することができる。なお、所望の出演者の声紋データを複数登録する場合には、以上の操作を繰り返すことで行うことができる。
ここで、ユーザが図2(B)の出演者リスト30を表示させているときに、声紋データ1aの再生音声が特定出演者Cであったか否かを再度確認したい場合がある。そのような場合には、ユーザはリモコンRを操作して、戻るボタン33を押下する。これにより図2(A)の声紋リスト20が再度表示される。そして、ユーザは再度声紋データ1aの再生音声を聴いて、間違いなければ、出演者名入力ボタン23を押下して、図2(B)の出演者リスト30を表示させ、声紋データ1aに特定出演者Cを関連付けすることができる。また、ユーザは声紋データ1aの再生音声が特定出演者Cでないと判断した場合、他の声紋データ2a〜4aの再生音声を聴いて特定出演者Cの音声を判断すればよい。
また、放送番組の出演者名をメタデータから取得できない場合には、手動入力により所望の出演者名を入力するようにしてもよい。この場合、図2(A)の声紋リスト20から声紋データ1aの選択欄21がチェックされ、出演者名入力ボタン23が押下されると、図2(B)の出演者リスト30の代わりに文字入力画面(図示せず)が表示される。そして、ユーザはリモコンRを操作して、文字入力画面に特定出演者Cの名前を入力し、入力を確定すると、図2(B)の出演者リスト30の場合と同様に、声紋データ1aと特定出演者Cとが関連付けされて登録される。
次に、上記のようにして声紋データを登録した所望の出演者の音声のみを選択的に音声調整する場合について説明する。図1において、例えば、ユーザがリモコンRを操作して、登録出演者リストの表示を指示すると、音声調整指示部4は、この指示に応じて、図3に示すような登録出演者リスト40を表示させる。この登録出演者リスト40は、上述の関連付け処理により声紋データが関連付けられた出演者名を一覧表示したものである。つまり、声紋登録部3に登録された登録出演者名の一覧である。登録出演者リスト40には、選択欄41、実行ボタン42、およびキャンセルボタン43が表示される。
そして、ユーザは、リモコンRを操作して、登録出演者リスト40から特定出演者Cの選択欄41にチェックを入れ、実行ボタン42を押下すると、音声調整指示部4に対して、特定出演者Cについて音声調整が指示される。音声調整指示部4は、この音声調整指示に応じて、特定出演者Cの音声信号にのみ音声調整するように声紋比較部5および第1の音声調整部6に指示する。
声紋比較部5は、本発明の音声特徴量比較部に相当し、音声調整指示部4からの指示に応じて、声紋検出部2で検出される全出演者の声紋データと声紋登録部3で登録された特定出演者の声紋データとを比較し、声紋データが一致する音声信号を出力する。本例では、声紋データが一致する音声信号、つまり、声紋データ1aに対応する特定出演者Cの音声信号が出力される。なお、声紋検出部2による声紋検出は、現在視聴している放送番組全体の不特定多数の全出演者について行われる。そして、声紋検出を行なう時間帯としては、例えば、リモコンRの操作に基づく開始指示から終了指示までの間、あるいは、電子番組表(EPG)による番組予約の開始時刻から終了時刻までの時間帯、あるいは、予め決められた開始時刻から終了時刻までの時間帯などが想定され、声紋検出は、これらの時間帯の放送信号をデコードする毎にリアルタイムで実行される。
上記において、声紋検出部2による全出演者の声紋検出の開始をリモコンRにより指示する場合、音声調整指示部4は、リモコンRからの音声調整指示に応じて、特定出演者Cの音声信号にのみ音声調整するように声紋比較部5および第1の音声調整部6に指示するが、この際、声紋検出部2に対して声紋検出の開始を指示する。そして、声紋検出部2は、音声調整指示部4からの指示に応じて、放送番組の音声信号から番組の全出演者の声紋検出を開始する。
そして、第1の音声調整部6は、本発明の音声調整部に相当し、声紋比較部5から出力された音声信号、つまり、特定出演者Cの音声信号に対してのみ音声調整を行う。ここで音声調整とは、音量および/または音質を調整することをいい、具体的には、音声信号の信号レベルを増幅、減衰させる、あるいは、周波数特性(高音/低音)や、左右のスピーカのバランス、サラウンドのオン/オフなどの調整が考えられる。なお、音声調整のための調整値は、予め決められた設定値を用いてもよいし、あるいは、図4に示すような音声調整用メニュー50を表示させユーザがその都度設定できるようにしてもよい。
図4に示す音声調整用メニュー50により音声調整値を設定する場合について説明する。前述したように、ユーザがリモコンRを操作して、特定出演者の音声調整を指示すると、音声調整指示部4は、このリモコンRによる指示に応じて、図3の登録出演者リスト40を表示させる。そしてさらに、ユーザは、リモコンRを操作して、登録出演者リスト40から特定出演者Cの選択欄41にチェックを入れ、実行ボタン42を押下する。この際、音声調整指示部4は、実行ボタン42の押下に応じて、図4の音声調整用メニュー50を表示させ、特定出演者Cの音声信号に対する音声調整値をユーザに設定させる。
図4の例では、特定出演者Cの音声信号に対する音声調整値として、音量、高音(min−max)、低音(min−max)、左右のスピーカのバランス、サラウンドのオン/オフ等をユーザが設定できるようになっている。そして、音声調整指示部4は、音声調整用メニュー50により設定された音声調整値を、特定出演者Cの音声信号に対する音声調整の指示と共に第1の音声調整部6に出力する。
第1の音声調整部6では、音声調整指示部4からの音声調整値に基づいて、声紋比較部5から出力された音声信号(特定出演者Cの音声信号)に対してのみ音声調整を行う。そして、音声出力部7は、例えば、ステレオスピーカ、あるいは、5.1ch等のサラウンドスピーカとして例示され、第1の音声調整部6で音声調整された特定出演者Cの音声信号に応じた音声のみを出力する。すなわち、この場合、特定出演者C以外の音声は出力されないため、ユーザは特定出演者Cの音声だけを聴くことができる。
また、図1において、差分信号算出部9は、第1の音声調整部6に入力される前の特定出演者Cの音声信号と第1の音声調整部6で音声調整された後の特定出演者Cの音声信号との差分信号を算出する。そして、音声合成部10は、差分信号算出部9で算出された差分信号と放送信号に含まれる音声信号とを合成する。音声合成部10で合成された合成音声信号は、第2の音声調整部11に入力される。第2の音声調整部11は、第1の音声調整部6と例えば同等の機能を有しており、音声合成部10で合成された合成音声信号に対して所定の音声調整を行い、音声出力部7は、第2の音声調整部11で音声調整された合成音声信号に応じた音声を出力する。なお、第1の音声調整部6と第2の音声調整部11とを1つの音声調整部として実現してもよい。
本実施形態の音声調整装置1は、特定出演者の音声のみを出力する特定音声モードと、特定出演者の音声を含む全体音声を出力する全体音声モードとを切り替えることができる。すなわち、特定音声モードが設定された場合には、音声出力部7は、音声入力経路を第1の音声調整部6に切り替え、特定出演者の音声のみを出力する。また、全体音声モードが設定された場合には、音声出力部7は、音声入力経路を第2の音声調整部11に切り替え、特定出演者の音声を含む全体音声を出力する。
このように本発明によれば、所望の出演者の名前が関連付けられた音声特徴量(声紋など)を登録しておき、放送番組の音声信号から検出される全出演者の音声特徴量と所望の出演者の音声特徴量とを比較し、音声特徴量が一致する音声信号のみを抽出することができる。このため、字幕情報を用いることなく、放送番組の所望の出演者の音声に対してだけ音声調整を行うことができる。
図5は、本発明の音声調整装置1による声紋データと特定出演者名との関連付け方法の一例を説明するためのフロー図である。本例では、図1の装置構成に基づいて説明する。まず、ユーザがリモコンRを操作して、特定出演者の声紋登録を指示すると、声紋検出部2は、この声紋登録指示に応じて、現在視聴中の番組の音声全体から全出演者の声紋データを検出する(ステップS1)。そして、関連付け設定部8は、声紋検出部2で検出された全出演者の声紋データを取得し、図2(A)に示したような声紋リスト20を表示する(ステップS2)。そして、関連付け設定部8は、図2(A)の声紋リスト20から特定出演者の声紋データが選択されたか否かを判定する(ステップS3)。なお、声紋リスト20から特定出演者の声紋データを選択する方法は前述した通りである。
そして、関連付け設定部8は、ステップS3において、図2(A)の声紋リスト20から特定出演者の声紋データが選択されたと判定した場合(YESの場合)、図2(B)の出演者リスト30を表示させ、ユーザによる操作に従って、特定出演者の名前を入力する(ステップS4)。また、ステップS3において、図2(A)の声紋リスト20から特定出演者の声紋データが選択されないと判定した場合(NOの場合)、ステップS1に戻り処理を繰り返す。
次に、関連付け設定部8は、ステップS3で選択された声紋データと、ステップS4で入力された特定出演者の名前とを関連付けて声紋登録部3に登録する(ステップS5)。このようにして、特定出演者の名前と声紋データとを関連付けて事前に登録することができる。
図6は、本発明の音声調整装置1による特定出演者の音声調整方法の一例を説明するためのフロー図である。まず、音声調整指示部4は、リモコンRから特定出演者について音声調整の指示があったか否かを判定し(ステップS11)、特定出演者について音声調整指示があったと判定した場合(YESの場合)、音声調整指示部4は、声紋比較部5および第1の音声調整部6に特定出演者について音声調整の開始を指示すると共に、声紋検出部2に全出演者について声紋検出の開始を指示する。声紋検出部2は、この声紋検出の開始指示に応じて、放送番組の音声全体から全出演者の声紋データを検出する(ステップS12)。また、ステップS11において、リモコンRから特定出演者について音声調整指示がないと判定した場合(NOの場合)、ステップS11で待機状態に移行する。
次に、声紋比較部5は、声紋検出部2により音声全体から検出された全出演者の声紋データと、声紋登録部3に登録された特定出演者の声紋データとを比較する(ステップS13)。なお、本例では、声紋検出部2は、ステップS12での声紋検出の開始指示に応じて、放送番組の音声全体から全出演者の声紋データをデコード毎にリアルタイムで検出しているものとする。
そして、声紋比較部5は、声紋検出部2で検出された全出演者の声紋データのいずれかと、声紋登録部3に登録された特定出演者の声紋データとが一致するか否かを判定し(ステップS14)、一致する声紋データがあると判定した場合(YESの場合)、声紋データの一致した音声信号を第1の音声調整部6に出力し、第1の音声調整部6は、声紋データの一致した音声信号に対してのみ音声調整を行う(ステップS15)。ここで、音声調整としては、例えば、音声信号の音量、高音/低音、左右のスピーカのバランス、サラウンドのオン/オフ等が含まれる。また、ステップS14において、一致する声紋データがないと判定した場合(NOの場合)、ステップS12に戻り処理を繰り返す。
そして、音声調整装置1は、前述したように、特定出演者の音声のみを出力する特定音声モードと、特定出演者の音声を含む全体音声を出力する全体音声モードとを切り替えることができる。すなわち、特定音声モードが設定されている場合には、音声出力部7は、音声入力経路を第1の音声調整部6に切り替え、特定出演者の音声のみを出力する。また、全体音声モードが設定されている場合には、音声出力部7は、音声入力経路を第2の音声調整部11に切り替え、特定出演者の音声を含む全体音声を出力する。
1…音声調整装置、2…声紋検出部、3…声紋登録部、4…音声調整指示部、5…声紋比較部、6…第1の音声調整部、7…音声出力部、8…関連付け設定部、9…差分信号算出部、10…音声合成部、11…第2の音声調整部、12…リモコン信号受信部、20…声紋リスト、21,31,41…選択欄、22…再生ボタン、23…出演者名入力ボタン、30…出演者リスト、32…確定ボタン、33…戻るボタン、40…登録出演者リスト、42…実行ボタン、43…キャンセルボタン、50…音声調整用メニュー。

Claims (8)

  1. 番組の放送信号に含まれる音声信号の調整を行う音声調整装置であって、
    前記放送信号に含まれる音声信号の中から番組の全出演者の音声特徴量を検出する音声特徴量検出部と、特定の出演者の名前が関連付けられた音声特徴量を登録する音声特徴量登録部と、前記音声特徴量検出部で検出された全出演者の音声特徴量と前記音声特徴量登録部で登録された前記特定の出演者の音声特徴量とを比較し、音声特徴量が一致する音声信号を出力する音声特徴量比較部と、該音声特徴量比較部から出力された音声信号に対してのみ音声調整を行う音声調整部とを備えたことを特徴とする音声調整装置。
  2. 請求項1に記載の音声調整装置において、前記特定の出演者の音声信号にのみ音声調整を行うように指示する音声調整指示部を備え、前記音声特徴量比較部は、前記音声調整指示部による指示に応じて、前記比較を行うことを特徴とする音声調整装置。
  3. 請求項1または2に記載の音声調整装置において、前記音声特徴量検出部で検出された全出演者の音声特徴量の中から前記特定の出演者の音声特徴量を選択させるための選択画面を表示させ、該選択画面により選択された音声特徴量を前記特定の出演者の名前に関連付ける関連付け設定部を備え、前記音声特徴量登録部は、前記関連付け設定部により前記特定の出演者の名前が関連付けられた音声特徴量を登録することを特徴とする音声調整装置。
  4. 請求項1〜3のいずれか1項に記載の音声調整装置において、前記音声特徴量は、声紋データであることを特徴とする音声調整装置。
  5. 請求項1〜4のいずれか1項に記載の音声調整装置において、前記音声調整部は、前記音声特徴量比較部から出力された音声信号に対して音量および/または音質を調整することを特徴とする音声調整装置。
  6. 請求項1〜5のいずれか1項に記載の音声調整装置において、前記音声調整部で音声調整された前記特定の出演者の音声信号に応じた音声のみを出力する音声出力部を備えたことを特徴とする音声調整装置。
  7. 請求項1〜5のいずれか1項に記載の音声調整装置において、前記音声調整部に入力される前の前記特定の出演者の音声信号と前記音声調整部で音声調整された後の前記特定の出演者の音声信号との差分信号を算出する差分信号算出部と、該差分信号算出部で算出された差分信号と前記放送信号に含まれる音声信号とを合成する音声合成部と、該音声合成部で合成された音声信号に応じた音声を出力する音声出力部とを備えたことを特徴とする音声調整装置。
  8. 請求項1〜7のいずれか1項に記載の音声調整装置を備えたデジタル放送受信装置。
JP2011268564A 2011-12-08 2011-12-08 音声調整装置およびデジタル放送受信装置 Pending JP2013121096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011268564A JP2013121096A (ja) 2011-12-08 2011-12-08 音声調整装置およびデジタル放送受信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011268564A JP2013121096A (ja) 2011-12-08 2011-12-08 音声調整装置およびデジタル放送受信装置

Publications (1)

Publication Number Publication Date
JP2013121096A true JP2013121096A (ja) 2013-06-17

Family

ID=48773539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011268564A Pending JP2013121096A (ja) 2011-12-08 2011-12-08 音声調整装置およびデジタル放送受信装置

Country Status (1)

Country Link
JP (1) JP2013121096A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015097831A1 (ja) * 2013-12-26 2015-07-02 株式会社東芝 電子機器、制御方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015097831A1 (ja) * 2013-12-26 2015-07-02 株式会社東芝 電子機器、制御方法およびプログラム
JPWO2015097831A1 (ja) * 2013-12-26 2017-03-23 株式会社東芝 電子機器、制御方法およびプログラム
US10176825B2 (en) 2013-12-26 2019-01-08 Kabushiki Kaisha Toshiba Electronic apparatus, control method, and computer program

Similar Documents

Publication Publication Date Title
US8600077B2 (en) Audio level control
EP2737692B1 (en) Control device, control method and program
US7136817B2 (en) Method and apparatus for the voice control of a device appertaining to consumer electronics
JP6721510B2 (ja) 2つの電子デバイスにおいて再生を同期させるための方法及び装置
US8139165B2 (en) Television receiver
JPWO2015097831A1 (ja) 電子機器、制御方法およびプログラム
KR100604016B1 (ko) 소리레벨 제어 기능을 갖는 영상표시기기 및 그 제어방법
CN110999318B (zh) 终端、声音协作再现系统和内容显示装置
US10885893B2 (en) Textual display of aural information broadcast via frequency modulated signals
JP6560503B2 (ja) 盛り上がり通知システム
JP2013121096A (ja) 音声調整装置およびデジタル放送受信装置
JP2015018079A (ja) 字幕音声生成装置
JP5551186B2 (ja) 放送受信装置及び放送受信装置における番組情報音声出力方法
KR20160093404A (ko) 캐릭터 선택적 오디오 줌인을 제공하는 멀티미디어 콘텐츠 서비스 방법 및 장치
JP2008141463A (ja) オンスクリーン表示装置及びテレビジョン受像機
KR101559170B1 (ko) 영상표시장치 및 그 제어방법
JP2006093918A (ja) デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体
JP6440314B2 (ja) 受信装置、受信方法、及びプログラム
JP6436573B2 (ja) 受信装置、受信方法、及びプログラム
WO2006059539A1 (ja) 放送番組受信装置、放送番組受信用信号処理装置および方法並びにプログラム
KR19980038619A (ko) 텔레비전에서의 시간알림방법
KR20060134492A (ko) 영상표시기기의 사운드 제어장치 및 방법
KR20100043581A (ko) 텔레비전의 주화면 및 부화면 출력 제어 장치 및 방법
KR20090074629A (ko) 음향 모드 제어 방법