JP2014206559A - 受信装置及びプログラム - Google Patents

受信装置及びプログラム Download PDF

Info

Publication number
JP2014206559A
JP2014206559A JP2013082330A JP2013082330A JP2014206559A JP 2014206559 A JP2014206559 A JP 2014206559A JP 2013082330 A JP2013082330 A JP 2013082330A JP 2013082330 A JP2013082330 A JP 2013082330A JP 2014206559 A JP2014206559 A JP 2014206559A
Authority
JP
Japan
Prior art keywords
sound
dialog
program
unit
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013082330A
Other languages
English (en)
Other versions
JP6231762B2 (ja
Inventor
靖茂 中山
Yasushige Nakayama
靖茂 中山
岳大 杉本
Takehiro Sugimoto
岳大 杉本
今井 篤
Atsushi Imai
篤 今井
大竹 剛
Takeshi Otake
剛 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
NHK Engineering System Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp, NHK Engineering System Inc filed Critical Nippon Hoso Kyokai NHK
Priority to JP2013082330A priority Critical patent/JP6231762B2/ja
Publication of JP2014206559A publication Critical patent/JP2014206559A/ja
Application granted granted Critical
Publication of JP6231762B2 publication Critical patent/JP6231762B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】受信した放送信号に含まれるダイアログ音声のみのレベルを調整できる受信装置及びプログラムを提供する。
【解決手段】本発明にかかる受信装置1は、放送された番組音声を受信する第1受信部3と、インターネット通信により番組音声のダイアログ音声を受信する第2受信部5と、番組音声及びダイアログ音声に基づいて、各フレームの有効性を判断する判断部7と、判断部7で有効と判断されたフレームの番組音声及びダイアログ音声に基づいて、番組音声に含まれるダイアログ音声のゲイン量Gを推定する推定部9と、ゲイン量Gに基づいてダイアログ音声を調整する調整部11と、調整部11で調整されたダイアログ音声と番組音声との合成を行う合成部13と、を備える。
【選択図】図1

Description

本発明は、受信装置及びプログラムに関するものであり、特に、放送された情報及びインターネット通信において送信された情報の双方を受信できる受信装置及びプログラムに関するものである。
放送番組の音声に対する要望は、多言語放送や解説放送の充実化、さらに聞き取りやすいダイアログ音声レベルの設定など様々である。中でも、聞き取りやすい音声を求める要望は大きく、放送局は、例えば、番組制作にラウドネスメータを導入することにより、聞き取りやすい番組音声実現に向けた取り組みを始めている。しかし、音声が聞きとりやすいように番組制作が行われても、音声の聞き取りやすさは、放送信号の受信側の環境や聴取者(聴取者の聴覚能力)によっても変化してしまうものである。
そのため、既に放送局側で制作された番組音声から所望の音声のみを抽出することは困難であるものの、聞き取りやすさを追求するためには、ダイアログ音声のレベルを受信装置側で調整できることが望まれる。従来、受信装置が、チャンネル間の相関を利用して、ダイアログ音声(例えば、ナレーション音声)とそれ以外の音声(例えば、背景音や効果音)との音量差を制御する手法が提案されている(例えば、特許文献1参照)。特許文献1に記載の手法では、受信装置が、まず、放送信号に含まれる2チャンネルの音声信号中から、相関が高い同相成分であるダイアログ音声信号を抽出し、このダイアログ音声信号に対して増幅・減衰・フィルタ処理などの処理を施す。そして、受信装置が、同相成分値を抽出した2チャンネルの音声信号に対して、処理済みのダイアログ音声信号を加算する。これにより、音声信号中のダイアログ音声信号に対して、種々の処理が施されることになる。
特許第4970174号公報
しかし、ダイアログ音声信号の相関のみが高いとは限らず、特許文献1に記載の従来手法では、例えば、背景音などのモノ信号は、相関が高いとみなされ、ダイアログ音声信号と共に抽出されてしまう。この場合、受信装置は、ダイアログ音声信号のみを増幅したり、減衰したりできなくなる。
また、従来手法は、単に、ダイアログ音声を強調したり、弱めたりすることを目的にするものであり、受信装置側でダイアログ音声の差し替えを可能にするものではない。つまり、従来の受信装置は、放送信号以外を受信するものではないため、ダイアログ音声に対して処理が施された放送信号に、放送信号以外の別の信号を合成することはできない。そのため、従来手法では、放送信号中の元のダイアログ音声(例えば、日本語)を別のダイアログ音声(例えば、英語)に置き換えるために、元のダイアログ音声を削除する、つまり元のダイアログ音声のレベルをゼロにすることについては何ら想定されていない。仮に、従来手法によってダイアログ音声の削除が試されても、上記理由により、相関値の利用ではダイアログ音声のみの削除は困難であり、効果が不十分である。
従って、上記のような問題点に鑑みてなされた本発明の目的は、受信した放送信号に含まれるダイアログ音声のみのレベルを調整できる受信装置及びプログラムを提供することにある。
上記課題を解決するために、本発明に係る受信装置は、
放送された番組音声を受信する第1受信部と、
インターネット通信により前記番組音声のダイアログ音声を受信する第2受信部と、
前記番組音声及び前記ダイアログ音声に基づいて、各フレームの有効性を判断する判断部と、
前記判断部で有効と判断されたフレームの前記番組音声及び前記ダイアログ音声に基づいて、前記番組音声に含まれるダイアログ音声のゲイン量を推定する推定部と、
前記ゲイン量に基づいて前記ダイアログ音声を調整する調整部と、
前記調整部で調整された前記ダイアログ音声と前記番組音声との合成を行う合成部と、
を備える。
また、本発明に係る受信装置は、
前記判断部が、前記ダイアログ音声のフレームエネルギー、及び前記番組音声と前記ダイアログ音声との類似性に基づいて、前記各フレームの有効性を判断する。
また、本発明に係る受信装置は、
前記判断部が、前記番組音声及び前記ダイアログ音声の帯域を複数に分割して、少なくとも1つの帯域で類似性を有するフレームを有効と判断する。
また、本発明に係る受信装置は、
前記推定部が、有効と判断されなかったフレームの前記ゲイン量を、1つ前のフレームのゲイン量と同一とする。
また、本発明に係る受信装置は、
前記調整部が、前記ダイアログ音声を逆位相化して前記ゲイン量を乗算することにより、前記ダイアログ音声を調整する。
また本発明に係る受信装置は、
前記合成部で合成した結果と、前記ダイアログ音声とを更に合成する第2合成部を備える。
また、本発明に係るプログラムは、
受信装置のコンピュータに、
放送された番組音声を取得するステップと、
インターネット通信により前記番組音声のダイアログ音声を取得するステップと、
前記番組音声と前記ダイアログ音声に基づいて、フレームの有効性を判断するステップと、
有効と判断されたフレームの前記番組音声及び前記ダイアログ音声に基づいて、前記番組音声に含まれるダイアログ音声のゲイン量を推定するステップと、
前記ゲイン量に基づいて前記ダイアログ音声を調整するステップと、
前記調整部で調整された前記ダイアログ音声及び前記番組音声の合成を行うステップと、を実行させる。
本発明によれば、受信した放送信号に含まれるダイアログ音声のみのレベルを調整できる受信装置及びプログラムを提供することができる。
図1は、本発明の第1実施形態に係る受信装置の概略構成を示す機能ブロック図である。 図2は、本発明の第1実施形態に係る受信装置の処理を示すフローチャートである。 図3は、本発明の第2実施形態に係る受信装置の概略構成を示す機能ブロック図である。 図4は、本発明の第2実施形態に係る受信装置の処理を示すフローチャートである。
以下、本発明の実施形態に係る受信装置について、図面を参照して説明する。受信装置は、放送信号を受信できるものであり、例えば、テレビ受像機等の放送受信端末である。受信装置は、以下に説明される計算処理を行うコンピュータを含むものである。なお、受信装置は、放送信号を受信できればよく、受信された放送信号の情報を表示する表示部(ディスプレイ)の有無に限定されるものではない。そのため、受信装置には、チューナ搭載のレコーダ、単体チューナなどが含まれる。
放送とは、放送局から公衆(不特定多数)に向けた放送信号の送信であり、例えば、テレビジョン放送である。放送信号は、放送局が提供する番組の映像(番組映像)と音声(番組音声)の2つの信号が合成されたものである。番組音声には、人声に関するナレーション、アナウンサーコメント、ヴォーカルなどのダイアログ音声と、それ以外の音声(背景音や効果音など)とが含まれる。また、番組音声に含まれるダイアログ音声は、番組の制作の過程でレベル変化処理されることにより、時刻とともにそのレベルが変化するものとなっている。
そして、本受信装置は、放送信号だけでなく、インターネットを介した通信信号を放送局から受信するものである。そのため、受信装置と放送局とは、有線接続又は無線接続されている。このような放送信号と通信信号の双方を受信する受信装置は、例えば、放送通信連携サービスの基盤システムであるHybridcast(ハイブリッドキャスト)(登録商標)における受信装置である。
(第1実施形態)
図1は、本発明の第1実施形態に係る受信装置1の概略構成を示す機能ブロック図である。本実施形態の受信装置1は、第1受信部3と、第2受信部5と、判断部7と、推定部9と、調整部11と、合成部13とを備える。第1受信部3は、判断部7と合成部13とに接続され、第2受信部5は判断部7と調整部11に接続されている。なお、図示は省略するが、受信装置1は、各機能を実現する処理内容を記述したプログラムを実行する制御部、例えば、CPU(中央処理装置)やDSP(デジタルシグナルプロセッサ)等を備えることができる。また、受信装置1は、各機能を実現する処理内容を記述したプログラムや各種情報を記憶し、また、バッファとしても機能可能な記憶部、例えば、RAM(Random Access Memory)等の揮発性の記憶媒体やROM(Read Only Memory)等の不揮発性の記憶媒体等を備えることができる。
第1受信部3は、放送局によって放送された放送信号を受信し、放送信号を構成する番組映像と番組音声とを分離する。そして、第1受信部3は、番組音声をフレームごとに判断部7及び合成部13に送る。
第2受信部5は、放送局からインターネットを介して通信信号を受信するものである。本実施形態において通信信号は、レベル変化処理される前のダイアログ音声である。すなわち、上記の第1受信部3を介した番組音声に含まれるダイアログ音声と、第2受信部5を介したダイアログ音声とは、レベルが異なるものであり、また、レベルの差が時刻とともに変化する。なお、上記の第1受信部3から取得した番組音声に含まれるダイアログ音声と、第2受信部5から取得したダイアログ音声とは、レベルを除いては、時間軸上で同期する。第2受信部5は、受信したダイアログ音声をフレームごとに判断部7及び調整部11に送る。
判断部7は、番組音声及びダイアログ音声用の2つの入力を有し、それぞれ第1受信部3と第2受信部5とに接続されている。また、判断部7は番組音声及びダイアログ音声用の2つの出力を有し、それぞれ推定部9に接続されている。
判断部7が、第1受信部3から取得した番組音声及び第2受信部5から取得したダイアログ音声に基づいて、各フレームの有効性を判断するための処理について、以下に説明する。なお、本実施形態において、番組音声及びダイアログ音声はデジタル信号として扱い、それらの信号は時間軸において適切なサンプリング周波数で標本化(サンプリング)されているものとする。また、以下の処理は、すべて所定の単位時間における、所定の周波数サンプル数を塊としたフレーム処理を前提とする。また、本実施形態において、番組音声を1chのモノ信号として説明するが、これに限られず、番組音声が2ch以上の場合にも、本発明は適用可能である。
判断部7は、第2受信部5から取得したダイアログ音声のフレームエネルギーEdを算出する。ダイアログ音声のフレームエネルギーEd[dB]は、例えば以下の式により与えられる。
Figure 2014206559
ここで、d(n)はダイアログ音声の時間表現であり、abs()は絶対値、maxは最大値をとる関数である。またmは、log(0)を防ぐための、d(n)に比べて非常に小さな値である。フレームエネルギーEdは、フレーム内のダイアログ音声のエネルギーの最大値を表し、判断部7は、Edの値が所定の値よりも大きいフレームを、有意なエネルギーを有するフレームと判断する。本実施形態では、Ed>−20[dB]を満たしたフレームを、有意なエネルギーを有すると判断する。これにより、ダイアログ音声に含まれ得る、無音の時間(“ま”)からなるフレーム又は十分なエネルギーを有しないフレームを用いてゲイン量が推定されることを防ぐことができる。
さらに判断部7は、同一フレームの番組音声とダイアログ音声との類似性を求める。本実施形態において、判断部7は、フィルターバンクとして、離散フーリエ変換(FFT)を用いて番組音声及びダイアログ音声それぞれの振幅周波数特性を求める。ダイアログ音声の振幅周波数特性D(k)及び番組音声の振幅周波数特性B(k)は、以下の式により与えられる。
Figure 2014206559
ここで、d(n)はダイアログ音声の時間表現、b(n)は番組音声の時間表現であり、kは周波数上のサンプリングインデックスを表す。またFFT()は離散フーリエ変換を表し、abs()は絶対値をとる関数である。
さらに、本実施形態において、判断部7は、番組音声の振幅周波数特性B(k)及びダイアログ音声の振幅周波数特性D(k)をそれぞれ複数の帯域に分割して、それぞれ同じ帯域成分同士の相関係数を計算する。なお、ダイアログ音声は、一般の音声信号と比較して、低い帯域にエネルギーが集中しているため、本実施形態においては、伝送された番組音声における一部の帯域のみを計算する。ここで、各フレームのサンプル数を2048とすると、離散フーリエ変換により周波数表現されたものは1024サンプルで表現することが可能である。本実施形態においては、時間サンプリング周波数を48kHzとし、簡易化のために計算の上限を5kHzと設定することにより、各フレームの1024周波数サンプルのうち、およそ200周波数サンプルについて計算する。また、本実施形態においては、200周波数サンプル以下の帯域を4分割する例を示すが、これに限られず、4分割よりも多い分割数又は少ない分割数で分割してもよく、また、帯域を分割せずに計算することも可能である。ダイアログ音声の振幅周波数特性D(k)及び番組音声の振幅周波数特性B(k)は、以下の式により帯域ごとに4分割される。
Figure 2014206559
さらに判断部7は、D(k)及びB(k)の帯域成分ごとの相関関数の最大値MCを以下の式により求める。
Figure 2014206559
上式(5)のMCが1に近いほど、番組音声の帯域成分はダイアログ音声の同じ帯域成分と類似していることを示す。本実施形態においては、MC>0.9を満たしたフレームを類似度が高いと判断する。
判断部7は、ダイアログ音声のフレームエネルギーEd、ならびに番組音声とダイアログ音声との類似性に基づいて、各フレームの有効性を判断する。すなわち、判断部7は、上述したフレームエネルギーEd[dB]が、Ed>−20を満たし、且つ、帯域成分ごとの相関関数の最大値MCが、MC>0.9を満たすフレームを有効と判断する。そして、判断部7は、有効と判断されたフレームの番組音声及びダイアログ音声を推定部9に送る。
なお、本実施形態においては、判断部7での処理を、番組音声及びダイアログ音声の時間表現b(n)、d(n)を用いて行っているが、第1受信部3及び第2受信部5でデコードされる前の番組音声及びダイアログ音声が、周波数領域で表現されている場合には、そのまま周波数領域で表現された番組音声及びダイアログ音声を用いて判断部7での処理を行うことも可能である。
推定部9は、判断部7で有効と判断されたフレームの番組音声及びダイアログ音声に基づいて、番組音声に含まれるダイアログ音声のゲイン量Gを推定する。ここで、ゲイン量Gとは、あるフレームのダイアログ音声にゲイン量Gを乗算することで、当該フレームの番組音声に含まれるダイアログ音声と同一のレベルが得られる値である。番組音声に含まれるダイアログ音声のゲイン量Gは、以下の式により与えられる。
Figure 2014206559
また、推定部9は、判断部7で有効と判断されなかったフレームのゲイン量Gを、1つ前のフレームのゲイン量Gと同一とする。なお、本実施形態において推定部9は、判断部7で最初のフレームが有効と判断されなかった場合には、当該フレームのゲイン量Gを1とする。推定部9は、各フレームのゲイン量Gを、調整部11に送る。
調整部11は、推定部9から取得したゲイン量Gに基づいて、第2受信部5から取得したダイアログ音声を調整する。すなわち、本実施形態において調整部11は、第2受信部5から取得したダイアログ音声を逆位相化するとともにゲイン量Gを乗算することにより、ダイアログ音声のレベルを調整する。したがって、本実施形態において、調整部11で調整されたダイアログ音声は、番組音声に含まれるダイアログ音声の逆位相信号となる。調整部11は、調整されたダイアログ音声を、合成部13に送る。
合成部13は、調整部11から取得した調整されたダイアログ音声と、第1受信部3から取得した番組音声とを合成する。本実施形態では、調整部11で調整されたダイアログ音声が、番組音声に含まれるダイアログ音声の逆位相信号であるため、合成部13の処理により、調整されたダイアログ音声と、番組音声に含まれるダイアログ音声とは打ち消しあうことになる。よって、合成部13は、番組音声からダイアログ音声が除去されたダイアログ音声除去番組音声(つまり、ダイアログ音声以外の音声)を、例えば音出力部(図示せず)に出力することができる。なお、番組音声が2ch以上の場合には、それぞれのチャンネルで上記手法を適用することによりダイアログ音声を取り去ることが可能である。
続いて、図2を用いて、受信装置1の処理について説明する。図2は、本発明の第1実施形態に係る受信装置1の処理を示すフローチャートである。
まず、第1受信部3は、放送局により放送された放送信号を受信し、放送信号から番組音声を取り出し、フレームごとに判断部7及び合成部13に送る(ステップS101)。そして、第2受信部5は、インターネット通信により、番組音声に含まれるダイアログ音声(通信信号)を放送局から受信し、フレームごとに判断部7及び調整部11に送る(ステップS102)。
そして、判断部7は、番組音声及びダイアログ音声の各フレームの有効性を、ダイアログ音声のフレームエネルギー、ならびに番組音声とダイアログ音声との類似性に基づいて判断し、有効と判断されたフレームの番組音声及びダイアログ音声を推定部9に送る(ステップS103)。
そして、推定部9は、有効と判断されたフレームの番組音声及びダイアログ音声に基づいて、番組音声に含まれるダイアログ音声のゲイン量Gを推定し、有効と判断されなかったフレームのゲイン量Gは、1つ前のフレームのゲイン量Gと同一として、各フレームのゲイン量Gを調整部11に送る(ステップS104)。
そして、調整部11は、第2受信部5から取得したダイアログ音声を逆位相化するとともにゲイン量Gを乗算して、ダイアログ音声を調整し、合成部13に送る(ステップS105)。
そして、合成部13は、第1受信部3から取得した番組音声と、調整部11から取得した調整されたダイアログ音声とを合成する(ステップS106)。合成部13は、ダイアログ音声除去番組音声を出力することになる。
このように本実施形態では、判断部7は、番組音声及びダイアログ音声に基づいて、各フレームの有効性を判断し、推定部9は、有効と判断されたフレームの番組音声及びダイアログ音声に基づいて、番組音声に含まれるダイアログ音声のゲイン量Gを推定する。つまり、本実施形態における受信装置1は、有効なフレームに限定してゲイン量Gの推定を行うため、信頼性の高いゲイン量Gを得ることができる。その結果、受信した放送信号に含まれるダイアログ音声のみのレベルを調整することが可能となる。
また、本実施形態における受信装置1は、判断部7が、ダイアログ音声のフレームエネルギー、及び番組音声とダイアログ音声との類似性に基づいて、各フレームの有効性を判断する。つまり、レベル調整の対象であるダイアログ音声のうち、無音又は微小レベルの音声のフレームに対してはゲイン量Gの推定を行わず、ダイアログ音声が十分なエネルギーを有し、番組音声とダイアログ音声とが十分に類似したフレームに限定して、ゲイン量Gの推定を行うため、より信頼性の高いゲイン量Gを得ることができ、放送信号の番組音声に含まれるダイアログ音声のレベルを、より厳密に調整することが可能となる。また、本実施形態における受信装置1は、番組音声及びダイアログ音声の帯域を複数に分割して、少なくとも1つの帯域で類似性を有するフレームを有効と判断することにより、より信頼性の高いゲイン量Gを得ることができ、放送信号の番組音声に含まれるダイアログ音声のレベルを、より厳密に調整することが可能となる。また、本実施形態における受信装置1は、推定部109が、有効と判断されなかったフレームのゲイン量Gを、1つ前のフレームのゲイン量Gと同一とすることで、より信頼性の高いゲイン量Gを用いてダイアログ音声のレベルを調整することが可能となる。さらに、本実施形態における受信装置1は、調整部11がダイアログ音声を逆位相化してゲイン量Gを乗算することによりダイアログ音声を調整し、合成部13が調整したダイアログ音声と番組音声とを合成することにより、時刻とともにレベルが変化する番組音声に含まれるダイアログ音声のみを適切に消去することが可能となる。
(第2実施形態)
第1実施形態では、受信装置1の出力信号の1つとしてダイアログ音声除去番組音声を出力する場合について説明したが、第2実施形態では、ダイアログ音声除去番組音声に更なる信号を付加する場合について説明する。
図3は、本発明の第2実施形態に係る受信装置101の概略構成を示す機能ブロック図である。本実施形態の受信装置101は、第1受信部103と、第2受信部105と、判断部107と、推定部109と、第1調整部111と、第1合成部113と、第2調整部112と、第2合成部114とを備える。第1受信部103、判断部107、推定部109、第1調整部111、及び第1合成部113の機能は、それぞれ対応する第1実施形態の第1受信部3、判断部7、推定部9、調整部11、及び合成部13の機能と同一であるため、説明は省略する。
本実施形態における第2受信部105は、放送局からインターネットを介して通信信号を受信し、受信したダイアログ音声を判断部107、第1調整部111、及び第2調整部112に送る。
第2調整部112は、第2受信部105から取得したダイアログ音声に所定の値を乗算して調整し、調整されたダイアログ音声を第2合成部114に送る。
第2合成部114は、第2調整部112から取得した調整されたダイアログ音声と、第1合成部113から取得したダイアログ音声除去番組音声とを合成する。これにより、番組音声に含まれるレベル変化処理されたダイアログ音声を、第2調整部112で適切に調整されたダイアログ音声に置き換えた番組音声を出力することができる。なお、第2調整部112においてダイアログ音声に乗算する所定の値は、予め受信装置101で設定された値としてもよいし、あるいは、例えば受信装置101がボリューム用つまみ等の入力部を備え、当該入力部の操作によりユーザが適宜入力した値とすることもできる。
続いて、図4を用いて、受信装置101の処理について説明する。図4は、本発明の第2実施形態に係る受信装置101の処理を示すフローチャートである。
まず、第1実施形態におけるステップS101と同様、第1受信部103は、放送局により放送された放送信号を受信し、放送信号から番組音声を取り出し、フレームごとに判断部107及び第1合成部113に送る(ステップS201)。そして、第2受信部105は、インターネット通信により、番組音声に含まれるダイアログ音声(通信信号)を放送局から受信し、フレームごとに判断部107、第1調整部111、及び第2調整部102に送る(ステップS202)。
そして、判断部107は、第1実施形態におけるステップS103と同様、番組音声及びダイアログ音声の各フレームの有効性を、ダイアログ音声のフレームエネルギーEd、ならびに番組音声とダイアログ音声との類似性に基づいてから判断し、番組音声及びダイアログ音声の有効と判断されたフレームを推定部109に送る(ステップS203)。
そして、推定部109は、第1実施形態におけるステップS104と同様、有効と判断されたフレームの番組音声及びダイアログ音声に基づいて、番組音声に含まれるダイアログ音声のゲイン量Gを推定し、有効と判断されなかったフレームのゲイン量Gは、1つ前のフレームのゲイン量Gと同一として、各フレームのゲイン量Gを第1調整部111に送る(ステップS204)。
そして、第1調整部111は、第1実施形態におけるステップS105と同様、ダイアログ音声を逆位相化するとともにゲイン量Gを乗算することによりダイアログ音声を調整し、第1合成部113に送る(ステップS205)。
そして、第1合成部113は、第1実施形態におけるステップS106と同様、第1受信部103から取得した番組音声と、第1調整部111から取得した調整されたダイアログ音声とを合成する(ステップS206)。
そして、第2調整部112は、ダイアログ音声に所定の値を乗算して、ダイアログ音声を調整し、第2合成部114に送る(ステップS207)。
そして、第2合成部114は、第1合成部113で合成された、ダイアログ音声除去番組音声と、第2調整部112から取得した調整されたダイアログ音声とを合成する(ステップS208)。第2合成部114は、番組音声に含まれたレベル変化処理されたダイアログ音声を、第2調整部112で適切に調整されたダイアログ音声に置き換えた番組音声を出力することになる。
このように本実施形態における受信装置101は、受信した放送信号に含まれるダイアログ音声を消去し、さらに第2調整部112で適切に調整されたダイアログ音声を合成することにより、所望のレベルのダイアログ音声を含む番組音声を出力することが可能となる。
かくして本発明によって、受信した放送信号に含まれるダイアログ音声のみのレベルを調整できる受信装置及びプログラムを提供することが可能となった。
1、101 受信装置
3、103 第1受信部
5、105 第2受信部
7、107 判断部
9、109 推定部
11、111 調整部(第1調整部)
13、113 合成部(第1合成部)
112 第2調整部
114 第2合成部

Claims (7)

  1. 放送された番組音声を受信する第1受信部と、
    インターネット通信により前記番組音声のダイアログ音声を受信する第2受信部と、
    前記番組音声及び前記ダイアログ音声に基づいて、各フレームの有効性を判断する判断部と、
    前記判断部で有効と判断されたフレームの前記番組音声及び前記ダイアログ音声に基づいて、前記番組音声に含まれるダイアログ音声のゲイン量を推定する推定部と、
    前記ゲイン量に基づいて前記ダイアログ音声を調整する調整部と、
    前記調整部で調整された前記ダイアログ音声と前記番組音声との合成を行う合成部と、
    を備える受信装置。
  2. 前記判断部が、前記ダイアログ音声のフレームエネルギー、及び前記番組音声と前記ダイアログ音声との類似性に基づいて、前記各フレームの有効性を判断する、請求項1に記載の受信装置。
  3. 前記判断部が、前記番組音声及び前記ダイアログ音声の帯域を複数に分割して、少なくとも1つの帯域で類似性を有するフレームを有効と判断する、請求項2に記載の受信装置。
  4. 前記推定部が、有効と判断されなかったフレームの前記ゲイン量を、1つ前のフレームのゲイン量と同一とする、請求項1〜3の何れか一項に記載の受信装置。
  5. 前記調整部が、前記ダイアログ音声を逆位相化して前記ゲイン量を乗算することにより、前記ダイアログ音声を調整する、請求項1〜4の何れか一項に記載の受信装置。
  6. 前記合成部で合成した結果と、前記ダイアログ音声とを更に合成する第2合成部を備える、請求項1〜5の何れか一項に記載の受信装置。
  7. 受信装置のコンピュータに、
    放送された番組音声を取得するステップと、
    インターネット通信により前記番組音声のダイアログ音声を取得するステップと、
    前記番組音声と前記ダイアログ音声に基づいて、各フレームの有効性を判断するステップと、
    有効と判断されたフレームの前記番組音声及び前記ダイアログ音声に基づいて、前記番組音声に含まれるダイアログ音声のゲイン量を推定するステップと、
    前記ゲイン量に基づいて前記ダイアログ音声を調整するステップと、
    前記調整部で調整された前記ダイアログ音声及び前記番組音声の合成を行うステップと、を実行させるためのプログラム。
JP2013082330A 2013-04-10 2013-04-10 受信装置及びプログラム Active JP6231762B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013082330A JP6231762B2 (ja) 2013-04-10 2013-04-10 受信装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013082330A JP6231762B2 (ja) 2013-04-10 2013-04-10 受信装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014206559A true JP2014206559A (ja) 2014-10-30
JP6231762B2 JP6231762B2 (ja) 2017-11-15

Family

ID=52120172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013082330A Active JP6231762B2 (ja) 2013-04-10 2013-04-10 受信装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6231762B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017069705A (ja) * 2015-09-29 2017-04-06 シャープ株式会社 受信装置、受信方法、放送システムおよびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010521867A (ja) * 2007-03-16 2010-06-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2012205075A (ja) * 2011-03-25 2012-10-22 Nippon Hoso Kyokai <Nhk> 同期制御装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010521867A (ja) * 2007-03-16 2010-06-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2012205075A (ja) * 2011-03-25 2012-10-22 Nippon Hoso Kyokai <Nhk> 同期制御装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017069705A (ja) * 2015-09-29 2017-04-06 シャープ株式会社 受信装置、受信方法、放送システムおよびプログラム

Also Published As

Publication number Publication date
JP6231762B2 (ja) 2017-11-15

Similar Documents

Publication Publication Date Title
US10311880B2 (en) System for perceived enhancement and restoration of compressed audio signals
US8891778B2 (en) Speech enhancement
US9282419B2 (en) Audio processing method and audio processing apparatus
JP5461437B2 (ja) マルチチャネル拡張データのオーディオ信号との同期及びオーディオ信号の処理のための装置並びに方法
EP2291002B1 (en) Acoustic processing apparatus
EP2790419A1 (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
KR20190085988A (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
US9913036B2 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
CN110996238B (zh) 双耳同步信号处理助听系统及方法
WO2018066383A1 (ja) 情報処理装置および方法、並びにプログラム
CN109561372A (zh) 音频处理装置及方法
KR20120132342A (ko) 보컬 신호 제거 장치 및 방법
JP6231762B2 (ja) 受信装置及びプログラム
JP4922427B2 (ja) 信号補正装置
CN109791773B (zh) 音频输出产生系统、音频通道输出方法和计算机可读介质
JP6078358B2 (ja) ノイズ低減装置、放送受信装置及びノイズ低減方法
EP3573058A1 (en) Dry sound and ambient sound separation
JP6126390B2 (ja) ノイズ低減装置、放送受信装置及びノイズ低減方法
CN106328159B (zh) 一种音频流的处理方法及装置
JP6196437B2 (ja) 受信機、及びプログラム
JP6832095B2 (ja) チャンネル数変換装置およびそのプログラム
JP6531418B2 (ja) 信号処理装置
JP2016208189A (ja) 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム
Ritcher et al. Automated Method of Noise Removal from Multichannel Audio
JP2014219470A (ja) 音声処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171020

R150 Certificate of patent or registration of utility model

Ref document number: 6231762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250