JP6196437B2 - 受信機、及びプログラム - Google Patents

受信機、及びプログラム Download PDF

Info

Publication number
JP6196437B2
JP6196437B2 JP2012245605A JP2012245605A JP6196437B2 JP 6196437 B2 JP6196437 B2 JP 6196437B2 JP 2012245605 A JP2012245605 A JP 2012245605A JP 2012245605 A JP2012245605 A JP 2012245605A JP 6196437 B2 JP6196437 B2 JP 6196437B2
Authority
JP
Japan
Prior art keywords
dialog
sound
program
unit
receiver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012245605A
Other languages
English (en)
Other versions
JP2014095751A (ja
Inventor
岳大 杉本
岳大 杉本
今井 篤
篤 今井
大竹 剛
剛 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2012245605A priority Critical patent/JP6196437B2/ja
Publication of JP2014095751A publication Critical patent/JP2014095751A/ja
Application granted granted Critical
Publication of JP6196437B2 publication Critical patent/JP6196437B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、受信機、受信方法及びプログラムに関するものであり、特に放送された情報及びインターネット通信において送信された情報の双方を受信できる受信機、受信方法及びプログラムに関するものである。
放送番組の音声に対する要望は、多言語放送や解説放送の充実化、さらに聞き取りやすいダイアログ音声レベルの設定など様々である。中でも、聞き取りやすい音声を求める要望は大きく、放送局は、例えば、番組制作にラウドネスメータを導入することにより、聞き取りやすい番組音声実現に向けた取り組みを始めている。しかし、音声が聞きとりやすいように番組制作が行われても、音声の聞き取りやすさは、放送信号の受信側の環境や聴取者(聴取者の聴覚能力)によっても変化してしまうものである。
そのため、既に放送局側で制作された番組音声から所望の音声のみを抽出することは困難であるものの、聞き取りやすさを追求するためには、ダイアログ音声のレベルを受信機側で調整できることが望まれる。従来、受信機が、チャンネル間の相関を利用して、ダイアログ音声(例えば、ナレーション音声)とそれ以外の音声(例えば、背景音や効果音)との音量差を制御する手法が提案されている(例えば、特許文献1参照)。特許文献1に記載の手法では、受信機が、まず、放送信号に含まれる2チャンネルの音声信号中から、相関が高い同相成分であるナレーション音声信号を抽出し、このナレーション音声信号に対して増幅・減衰・フィルタ処理などの処理を施す。そして、受信機が、同相成分値を抽出した2チャンネルの音声信号に対して、処理済みのナレーション信号を加算する。これにより、音声信号中のナレーション音声信号に対して、種々の処理が施されることになる。
特許第4970174号公報
しかし、ナレーション音声信号の相関のみが高いとは限らず、特許文献1に記載の従来手法では、例えば、背景音などのモノ信号は、相関が高いとみなされ、ナレーション音声信号と共に抽出されてしまう。この場合、受信機は、ナレーション音声信号のみを増幅したり、減衰したりできなくなる。
また、従来手法は、単に、ナレーション音声を強調したり、弱めたりすることを目的にするものであり、受信機側でナレーション音声の差し替えを可能にするものではない。つまり、従来の受信機は、放送信号以外を受信するものではないため、ナレーション音声に対して処理が施された放送信号に、放送信号以外の別の信号を合成することはできない。そのため、従来手法では、放送信号中の元のナレーション音声(例えば、日本語)を別のナレーション音声(例えば、英語)に置き換えるために、元のナレーション音声を削除する、つまり元のナレーション音声のレベルをゼロにすることについては何ら想定されていない。仮に、従来手法によってナレーション音声の削除が試されても、上記理由により、相関値の利用ではナレーション音声のみの削除は困難であり、効果が不十分である。
従って、上記のような問題点に鑑みてなされた本発明の目的は、受信した放送信号のダイアログ音声のレベルを効果的に調整できる受信機、受信方法及びプログラムを提供することにある。
上述した諸課題を解決すべく、本発明の第1の観点に係る受信機は、
放送された番組音声を受信する第1受信部と、
インターネット通信により前記番組音声の第1ダイアログ音声を受信する第2受信部と、
前記第1受信部及び前記第2受信部それぞれにより受信された前記番組音声と前記第1ダイアログ音声とを同期させた後、当該第1ダイアログ音声を所定数倍し、所定数倍された当該第1ダイアログ音声と、前記番組音声との合成を行う制御部と
を備え
前記所定数は、当該所定数倍された前記第1ダイアログ音声が、前記第1受信部により受信された前記番組音声中の第1ダイアログ音声の逆相信号になるような値、または正の値である
受信機である。
また、第の観点に係る受信機は、第の観点に係る受信機において、
前記第2受信部は、前記インターネット通信により、前記第1ダイアログ音声とは異なる第2ダイアログ音声を受信し、
前記制御部は、前記番組音声と前記第2ダイアログ音声とを同期させ、当該第2ダイアログ音声と、前記合成の結果とを更に合成する
ことを特徴とするものである。
また、第の観点に係る受信機は、第の観点に係る受信機において、
前記制御部は、前記番組音声と同期した前記第1ダイアログ音声に対して話速変換処理を行い、当該第1ダイアログ音声と、前記合成の結果とを更に合成する
ことを特徴とするものである。
また、第4の観点に係る受信機は、第1の観点に係る受信機において、
前記第2受信部は、前記インターネット通信により、前記第1ダイアログ音声とは異なる第2ダイアログ音声を受信し、
前記制御部は、
前記番組音声と前記第2ダイアログ音声とを同期させ、
当該第2ダイアログ音声に対して話速変換処理を行い、
話速変換処理が行われ第2ダイアログ音声と、前記合成の結果とを更に合成する
ことを特徴とするものである。
また、第の観点に係る受信機は、第の観点に係る受信機において、
前記第2受信部は、前記インターネット通信により前記第1ダイアログ音声とは異なる第3ダイアログ音声を受信し、
前記制御部は、前記番組音声と前記第3ダイアログ音声とを同期させ、
前記合成の結果を所定時間遅延させ、
遅延した前記合成の前記結果と、前記第3ダイアログ音声とを更に合成する
ことを特徴とするものである。
上述したように本発明の解決手段を装置として説明してきたが、本発明はこれらに実質的に相当するプログラム、プログラムを記録した記憶媒体としても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
また、本発明をプログラムとして実現させた第6の観点に係るプログラムは、
受信機のコンピュータに、
放送された番組音声を取得する第1取得ステップと、
インターネット通信により前記番組音声の第1ダイアログ音声を取得する第2取得ステップと、
取得された前記番組音声と前記第1ダイアログ音声とを同期させるステップと、
前記第1ダイアログ音声を所定数倍するステップと、
所定数倍された前記第1ダイアログ音声と、前記番組音声との合成を行うステップとを実行させ、
前記所定数は、当該所定数倍された前記第1ダイアログ音声が前記第1取得ステップにより取得された前記番組音声中の第1ダイアログ音声の逆相信号になるような値、または正の値である
プログラムである。
上記のように構成された本発明に係る受信機、受信方法及びプログラムによれば、受信した放送信号のダイアログ音声のレベルを効果的に調整できる。
図1は、本発明の第1実施形態に係る受信機の概略構成を示す機能ブロック図である。 図2は、本発明の第1実施形態に係る受信機の処理を示すフローチャートである。 図3は、本発明の第2実施形態に係る受信機の概略構成を示す機能ブロック図である。 図4は、本発明の第2実施形態に係る受信機の処理を示すフローチャートである。 図5は、本発明の第3実施形態に係る受信機の概略構成を示す機能ブロック図である。 図6は、本発明の第3実施形態に係る受信機の処理を示すフローチャートである。
以下、本発明の実施形態に係る受信機について、図面を参照して説明する。受信機は、放送信号を受信できるものであり、例えば、テレビ受像機等の放送受信端末である。受信機は、以下に説明される計算処理を行うコンピュータを含むものである。なお、受信機は、放送信号を受信できればよく、受信された放送信号の情報を表示する表示部(ディスプレイ)の有無に限定されるものではない。そのため、受信機には、チューナ搭載のレコーダ、単体チューナなどが含まれる。
放送とは、放送局から公衆(不特定多数)に向けた放送信号の送信であり、例えば、テレビジョン放送である。放送信号は、放送局が提供する番組の映像(番組映像)と音声(番組音声)の2つの信号が合成されたものである。番組音声には、人声に関するナレーション、アナウンサーコメント、ヴォーカルなどのダイアログ音声と、それ以外の音声(背景音や効果音など)とが含まれる。
そして、本受信機は、放送信号だけでなく、インターネットを介した通信信号を放送局から受信するものである。そのため、受信機と放送局とは、有線接続又は無線接続されている。このような放送信号と通信信号の双方を受信する受信機は、例えば、放送通信連携サービスの基盤システムであるHybridcast(ハイブリッドキャスト)(登録商標)における受信機である。
(第1実施形態)
図1は、本発明の第1実施形態に係る受信機101の概略構成を示す機能ブロック図である。本実施形態の受信機101は、第1受信部111と、第2受信部113と、記憶部115と、制御部117とを備える。第1受信部111と、第2受信部113と、記憶部115とは、制御部117に接続されている。
第1受信部111は、放送局によって放送された放送信号を受信し、放送信号を構成する番組映像と番組音声とを分離する。そして、第1受信部111は、番組音声を制御部117の後述する同期処理部121に送る。
第2受信部113は、放送局からインターネットを介して通信信号を受信するものである。本実施形態では、通信信号は、第1受信部111によって受信された番組音声のダイアログ音声(第1ダイアログ音声)であるとする。そして、第2受信部113は、第1ダイアログ音声を制御部117の同期処理部121に送る。
記憶部115は、受信機101の各機能を実現する処理内容を記述したプログラムや各種情報を記憶するものであり、例えば、RAM(Random Access Memory)等の揮発性の記憶媒体やROM(Read Only Memory)等の不揮発性の記憶媒体等である。また、記憶部115は、バッファとしても機能できる。
制御部117は、受信機101の各機能ブロックを実現する処理内容を記述したプログラムを実行するものであり、例えば、CPU(中央処理装置)やDSP(デジタルシグナルプロセッサ)等である。制御部117は、同期処理部121と、調整部123と、合成部125とを含んでいる。同期処理部121は、番組音声及び第1ダイアログ音声用の2つの入力を有し、それぞれ第1受信部111と第2受信部113とに接続されている。また、同期処理部121は2つの出力を有し、番組音声用の出力は、合成部125に直接接続され、第1ダイアログ音声用の出力は、調整部123を介して合成部125に接続されている。
同期処理部121は、第1受信部111及び第2受信部113それぞれから、番組音声及び第1ダイアログ音声を取得し、番組音声と第1ダイアログ音声とを同期させる。例えば、放送局によって番組音声及び第1ダイアログ音声にタイムスタンプが付されている場合は、同期処理部121は、このタイムスタンプを利用して、番組音声と第1ダイアログ音声とを同期させることができる。このタイムスタンプは、例えば、受信側での再生出力の時刻管理情報であるPTS(Presentation Time Stamp)である。同期処理部121は、タイムスタンプの示す時刻に基づいて、番組音声と第1ダイアログ音声との受信時間差を求め、この受信時間差が解消されるように、記憶部115を利用してバッファリング処理を行う。このようにして、同期処理部121は、番組音声と第1ダイアログ音声との同期を実現させる。そして、同期処理部121は、第1ダイアログ音声と同期された番組音声を合成部125に送り、番組音声と同期された第1ダイアログ音声を調整部123に送る。
調整部123は、同期処理部121から受け取った第1ダイアログ音声を所定数倍し、合成部125に送る。所定数は、任意に設定されるものであり、記憶部115に記憶されている。所定数は、例えば、−2以上2以下の範囲内の実数である。所定数の絶対値の大きさに応じて第1ダイアログ音声のレベル(振幅)が変化し、所定数の符号に応じて第1ダイアログ音声の位相が変化する。例えば、所定数の符号が、マイナスである場合、調整部123の処理により、ダイアログ音声の位相が逆になることになる。
ここで、第1受信部111により受信された番組音声中の第1ダイアログ音声と、第2受信部113により受信された第1ダイアログ音声との信号レベルが同一であるとする。この場合、調整部123は、第1ダイアログ音声を−1倍することにより、番組音声中の第1ダイアログ音声を逆相にした波形を出力することになる。つまり、−1という所定数は、所定数倍された第1ダイアログ音声が、放送を介した第1ダイアログ音声の逆相信号になるような値である。なお、放送を介した第1ダイアログ音声の逆相信号とは、第1ダイアログ音声と絶対値のレベルが完全に一致することに限定されるものではない。本発明は、所定数倍された第1ダイアログ音声と、放送を介した第1ダイアログ音声との和が予め定めた誤差範囲であれば、所定数倍された第1ダイアログ音声と、放送を介した第1ダイアログ音声とは逆相関係であるとみなすことができる。
また、第1受信部111により受信された番組音声中の第1ダイアログ音声と、第2受信部113により受信された第1ダイアログ音声とのレベルが同一でない場合もある。例えば、放送局は、第1ダイアログ音声とそれ以外の音声を合成した後、合成音声の全体レベルを調整し、合成信号を放送することがある。放送局によってインターネットを介して送信される第1ダイアログ音声は、合成処理前の信号であるため、放送を介した第1ダイアログ音声と、通信を介した第1ダイアログ音声とのレベルは、異なることになる。
この場合、通信を介した第1ダイアログ音声に対する、放送を介した第1ダイアログ音声の比率にマイナスを乗算した値(−(放送を介した第1ダイアログ音声)/(通信を介した第1ダイアログ音声))が所定数に設定されることにより、調整部123は、放送を介した第1ダイアログ音声を完全に逆相にした波形を出力することになる。つまり、このときの所定数は、所定数倍された第1ダイアログ音声が、放送を介した第1ダイアログ音声の逆相信号になるような値である。
なお、本発明は、所定数が記憶部115に予め記憶されていることに限定されるものではなく、例えば、受信機101がボリューム用つまみ等の入力部を備えている場合は、所定数は、ユーザにより適宜入力された値とすることもできる。
合成部125は、同期処理部121からの番組音声と、調整部123からの所定数倍された第1ダイアログ音声との合成を行う。所定数倍された第1ダイアログ音声が、番組音声中の第1ダイアログ音声の逆相信号である場合、合成部125の処理により、所定数倍された第1ダイアログ音声と、番組音声中の第1ダイアログ音声とは打ち消しあうことになる。よって、合成部125は、番組音声から第1ダイアログ音声が除去されたダイアログ音声除去番組音声(つまり、ダイアログ音声以外の音声)を、例えば音出力部(図示せず)に出力する。
また、調整部123における所定数が正の値である場合、合成部125の処理により、番組音声中の第1ダイアログ音声に所定数倍された第1ダイアログ音声が加算されることになるので、第1ダイアログ音声のレベルが大きくなる。よって、合成部125は、第1ダイアログ音声が強調されたダイアログ音声強調番組音声を出力する。
更に、調整部123における所定数が負の値である場合、合成部125の処理により、番組音声中の第1ダイアログ音声から、所定数の絶対値が乗算された第1ダイアログ音声が減算されることになるので、第1ダイアログ音声のレベルが小さくなる。よって、合成部125は、第1ダイアログ音声が抑制されたダイアログ音声抑制番組音声を出力することもできる。
続いて、図2を用いて、受信機101の処理について説明する。図2は、本発明の第1実施形態に係る受信機101の処理を示すフローチャートである。
まず、第1受信部111は、放送局により放送された放送信号を受信し、放送信号から番組音声を取り出し、同期処理部121に送る(ステップS101)。そして、第2受信部113は、インターネット通信により、番組音声に含まれる第1ダイアログ音声(通信信号)を放送局から受信し、同期処理部121に送る(ステップS102)。
そして、同期処理部121は、番組音声と第1ダイアログ音声とを同期させ、番組音声を合成部125に送り、第1ダイアログ音声を調整部123に送る(ステップS103)。調整部123は、第1ダイアログ音声を所定数倍し、合成部125に送る(ステップS104)。
合成部125は、同期処理部121からの番組音声と、調整部123からの第1ダイアログ音声とを合成する(ステップS105)。調整部123での処理における所定数により、合成部125は、ダイアログ音声除去番組音声、ダイアログ音声強調番組音声又はダイアログ音声抑制番組音声を出力することになる。
このように本実施形態では、受信機101の第1受信部111は、放送された番組音声を受信し、第2受信部113は、インターネット通信により番組音声の第1ダイアログ音声を受信する。そして、制御部117は、第1受信部111及び第2受信部113それぞれにより受信された番組音声と第1ダイアログ音声とを同期させた後、当該第1ダイアログ音声を所定数倍し、所定数倍された当該第1ダイアログ音声と、番組音声との合成を行う。つまり、本実施形態における受信機101は、レベル調整の対象である第1ダイアログ音声のみを、放送信号(番組音声)から抽出せずに、インターネット通信により受信する。制御部117は、番組音声と同期した第1ダイアログ音声を、そのレベルと位相を所定数の乗算により変化させて番組音声に加えることにより、番組音声中の第1ダイアログ音声のレベルのみを変化させることができる。番組音声に加えられるものは、第1ダイアログ音声のみであるため、第1ダイアログ音声以外のレベルを変えることなく、番組音声中の第1ダイアログ音声のみを効果的に調整できる。
また、相関を求めたりせず、簡単な四則演算により、第1ダイアログ音声のレベルの調整が可能であるため、従来手法に比べ、計算負荷を抑えることができる。そのため、受信機101は、高い計算処理能力を有する大きな処理装置(制御部117)を備える必要がないため、受信機101の小型化が図れる。更に、本実施形態では、番組音声と第1ダイアログ音声との同期が、予め放送局側で付されたタイムスタンプの利用により実現されている。このようなタイムスタンプを利用せずに同期を図る場合、第1ダイアログ音声の中心的な帯域が1[kHz]弱であることから同期にはサブミリ秒オーダー以上の精度が要求されてしまう。よって、タイムスタンプの利用により、受信機101が高い同期精度を確保することなく、容易に同期を実現することができる。
また、本実施形態では、制御部117の調整部123は、第1ダイアログ音声を所定数倍するわけだが、この所定数は、当該所定数倍された第1ダイアログ音声が、第1受信部111により受信された番組音声中の第1ダイアログ音声の逆相信号になるような値とすることができる。これにより、所定数倍された第1ダイアログ音声と、番組音声中の第1ダイアログ音声とは、合成部125の処理により打ち消されることになる。これにより、制御部117は、番組音声から第1ダイアログ音声を除去することができる。
更に、本実施形態では、制御部117の調整部123は、第1ダイアログ音声を所定数倍するわけだが、この所定数は、正の値とすることができる。これにより、合成部125の処理により、番組音声中の第1ダイアログ音声のレベルは、所定数倍された第1ダイアログ音声分大きくなることになる。これにより、制御部117は、番組音声において第1ダイアログ音声を強調させることができる。
(第2実施形態)
第1実施形態では、受信機101の出力信号の1つとしてダイアログ音声除去番組音声を出力する場合について説明したが、第2実施形態では、ダイアログ音声除去番組音声に更なる信号を付加する場合について説明する。
図3は、本発明の第2実施形態に係る受信機201の概略構成を示す機能ブロック図である。本実施形態の受信機201は、第1受信部211と、第2受信部213と、記憶部215と、制御部217とを備える。第1受信部211と、第2受信部213と、記憶部215とは、制御部217に接続されている。第1受信部211及び記憶部215の機能は、それぞれ対応する第1実施形態の機能部111及び115の機能と同一であるため、説明は省略する。
第2受信部213は、放送局からインターネットを介して通信信号を受信するものである。本実施形態では、通信信号には、第1実施形態における第1ダイアログ音声だけでなく、第1ダイアログ音声とは異なる第2ダイアログ音声が含まれているとする。第2受信部213は、通信信号から第1ダイアログ音声と第2ダイアログ音声とを分離して、それぞれ制御部217の後述する同期処理部221に送る。第1ダイアログ音声は、第1受信部211により受信される番組音声に含まれるものであり、第2ダイアログ音声は、この番組音声には含まれないものである。なお、本発明は、番組音声に含まれないダイアログ音声は、1つに限定されるものではなく、第2受信部213は、インターネットを介して、第1ダイアログ音声以外のダイアログ音声を複数受信し、複数のダイアログ音声を同期処理部221に送ることもできる。
第1及び第2ダイアログ音声は、例えば、一方が日本語の音声であり、他方がこの日本語の音声に対応する英語の音声である。以下、第1ダイアログ音声は日本語であり、第2ダイアログ音声は英語であるとする。なお、第2ダイアログ音声は、リアルタイムで同時通訳されたものではなく、予め録音されたものであるとする。そのため、第1ダイアログ音声と第2ダイアログ音声とは、話の開始タイミング等が揃っているものとする。また、本発明は、インターネットを介した複数のダイアログ音声を1つの第2受信部213により受信することに限定されるものではない。例えば、ダイアログ音声毎に、異なる受信部を設けることもできる。
制御部217は、同期処理部221と、調整部223と、合成部225と、選択部227と、話速変換部229とを含んでいる。同期処理部221は、3つの入力を有し、番組音声用の1つの入力は第1受信部211に、第1及び第2ダイアログ音声用の2つの入力は第2受信部213に接続されている。また、同期処理部221は3つの出力を有し、1つ目の出力は、合成部225に接続され、2つ目の出力は、調整部223及び選択部227に接続され、3つ目の出力は、選択部227に接続されている。調整部223は、合成部225に接続されている。選択部227は、話速変換部229及び調整部223を介して合成部225に接続されている。
同期処理部221は、第1受信部211からの番組音声と、第2受信部213からの第1及び第2ダイアログ音声とを取得し、これら3つの信号を同期させる。そして、同期処理部221は、同期処理された番組音声を合成部225に、同期処理された第1ダイアログ音声を調整部223及び選択部227の双方に、同期処理された第2ダイアログ音声を選択部227に、それぞれ送る。なお、同期処理部221は、第1ダイアログ音声以外に複数のダイアログ音声を受け取っている場合、それぞれ番組音声と同期させて、選択部227に送る。
調整部223は、通信を介した第1ダイアログ音声を所定数倍することにより、放送を介した第1ダイアログ音声を逆相にした波形を合成部225に出力する。また、調整部223は、話速変換部229からの出力信号(後述の話速変換されたダイアログ音声)を所定数倍することにより、振幅や位相を調整し、調整した信号を合成部225に出力する。
選択部227は、同期処理部221から受け取った第1ダイアログ音声と第2ダイアログ音声とのうちの1つを話速変換部229に出力する。いずれのダイアログ音声を選択すべきかの選択情報については、記憶部215に記憶され、選択部227は、この選択情報を記憶部215から読み出すことにより、1つのダイアログ音声を選択する。受信機201が、例えば、選択用ボタン等の入力部を備えている場合は、選択情報は、ユーザにより適宜入力された情報とすることができる。なお、選択部227は、第1ダイアログ音声以外に複数のダイアログ音声を受け取っている場合、第1ダイアログ音声と、それ以外の複数のダイアログ音声からいずれか1つを選択する。
話速変換部229は、選択部227から受け取ったダイアログ音声の全体の時間長さを変えずに、ダイアログ音声に対して話速変換処理を行い、話速変換されたダイアログ音声を調整部223に送る。例えば、話速変換部229は、ダイアログ音声中の音声区間と無声区間(“ま”)とを特定し、音声区間を伸長し、その分無線区間を短縮する。これにより、話速変換部229は、ダイアログ音声の話速が遅くなった低速ダイアログ音声(低速第1ダイアログ音声又は低速第2ダイアログ音声)を出力することになる。話速変換の度合いは、受信機201の入力部等を介してユーザにより適宜設定される事項である。ユーザが、話速変換処理を望まない、つまり原速度を望む場合は、話速変換部229は、受け取ったダイアログ音声に対して処理を行わず、そのまま調整部223に出力することもできる。
合成部225は、同期処理部221からの番組音声と、調整部223からの第1ダイアログ音声とを合成し、第1ダイアログ音声が除去されたダイアログ音声除去番組音声(合成の結果)を生成する。そして、合成部225は、ダイアログ音声除去番組音声に話速変換部229からの調整部223を介したダイアログ音声を合成する。例えば、話速変換部229からのダイアログ音声が低速第1ダイアログ音声である場合、合成部225は、放送局が送信した元の番組音声の第1ダイアログ音声(日本語音声)がゆっくりになった番組音声を、例えば音出力部(図示せず)に出力する。また、話速変換部229からのダイアログ音声が第2ダイアログ音声(英語音声)である場合、合成部225は、元の番組音声に比べダイアログ音声が日本語から英語に変わった番組音声を出力する。更に、話速変換部229からのダイアログ音声が低速第2ダイアログ音声である場合、合成部225は、元の番組音声に比べ日本語音声が低速英語音声に変わった番組音声を出力する。
続いて、図4を用いて、受信機201の処理について説明する。図4は、本発明の第2実施形態に係る受信機201の処理を示すフローチャートである。以下、第1実施形態と異なる部分を特に重点的に記載する。
まず、第1実施形態におけるステップS101と同様、第1受信部211は、放送信号(番組音声)を受信する(ステップS201)。そして、第2受信部213は、第1及び第2ダイアログ音声を含む通信信号を受信し、第1及び第2ダイアログ音声を同期処理部221に送る(ステップS202)。
そして、同期処理部221は、番組音声と、第1及び第2ダイアログ音声とを同期させ、番組音声を合成部225に、第1ダイアログ音声を調整部223及び選択部227に、第2ダイアログ音声を選択部227にそれぞれ送る(ステップS203)。調整部223は、第1ダイアログ音声を調整し、放送を介した第1ダイアログ音声を逆相にした波形を合成部225に送る(ステップS204)。
同期処理部221が第1及び第2ダイアログ音声を選択部227に送ると、選択部227は、いずれか1つのダイアログ音声を選択し、話速変換部229に送る(ステップS205)。話速変換部229は、選択されたダイアログ音声の話速を変換し、調整部223に送る(ステップS206)。調整部223は、話速変換されたダイアログ音声を調整したのち、合成部225に送る(ステップS207)。
そして、合成部225は、受け取った番組音声と、調整された第1ダイアログ音声と、話速変換及び調整されたダイアログ音声とを合成し、元の番組音声に比べ、ダイアログ音声の話速が変換された番組音声や、ダイアログ音声自体が差し替えられた番組音声を出力する(ステップS208)。
このように本実施形態では、第2受信部213は、インターネットを介して番組音声中には含まれない第2ダイアログ音声を受信し、制御部217は、第2ダイアログ音声を番組音声と同期させた後、この第2ダイアログ音声とダイアログ音声除去番組音声とを合成する。番組音声中の第1ダイアログ音声以外に聴取を望むダイアログ音声を受信しておくことにより、容易にダイアログ音声の切り替えが可能である。また、ダイアログ音声除去番組音声には、ダイアログ音声以外の音声(背景音や効果音など)が含まれているため、ダイアログ音声除去番組音声と第2ダイアログ音声との合成により、聴取者は、背景音や効果音と第2ダイアログ音声とを同時に聴くことができる。
また、本実施形態では、制御部217は、話速変換処理された第1ダイアログ音声又は第2ダイアログ音声と、ダイアログ音声除去番組音声とを合成することができる。これにより、聴取者にとって望ましい音声の言語及び音声の速度を、受信機側で調整できる。受信機側において言語や速度の選択が可能であるため、放送局が聴取者毎にカスタマイズされた放送信号を送信する必要はない。
(第3実施形態)
第2実施形態では、第2ダイアログ音声が予め録音されたものである場合について説明したが、第3実施形態では、通信信号に含まれるダイアログ音声が、第1ダイアログ音声が同時通訳された音声である場合について説明する。以下、同時通訳による音声を第3ダイアログ音声とする。第3ダイアログ音声は、同時通訳による音声であるため、第1ダイアログ音声に比べ、話の開始タイミングが遅れることになる。
図5は、本発明の第3実施形態に係る受信機301の概略構成を示す機能ブロック図である。本実施形態の受信機301は、第1受信部311と、第2受信部313と、記憶部315と、制御部317とを備える。第1受信部311と、第2受信部313と、記憶部315とは、制御部317に接続されている。記憶部315の機能は、対応する第1実施形態の機能部115の機能と同一であるため、説明は省略する。
第1受信部311は、放送局によって放送された放送信号を受信し、放送信号を構成する番組映像と番組音声とを分離する。そして、第1受信部311は、番組映像及び番組音声を制御部317の後述する同期処理部321に送る。
第2受信部313は、放送局からインターネットを介して通信信号を受信するものである。本実施形態では、通信信号には、第1実施形態における第1ダイアログ音声だけでなく、第1ダイアログ音声とは異なる第3ダイアログ音声が含まれているとする。第2受信部313は、通信信号から第1ダイアログ音声と第3ダイアログ音声とを分離して、それぞれ制御部317の同期処理部321に送る。第1ダイアログ音声は、第1受信部311により受信される放送信号(番組音声)に含まれるものであり、第3ダイアログ音声は、この番組音声には含まれないものである。上述したように、第3ダイアログ音声は、第1ダイアログ音声と話の開始タイミングが異なるものであり、例えば、第1ダイアログ音声の同時通訳音声である。なお、本発明は、インターネットを介した複数のダイアログ音声を1つの第2受信部313により受信することに限定されるものではない。例えば、ダイアログ音声毎に、異なる受信部を設けることもできる。また、第2実施形態の第2ダイアログ音声と同様、同時通訳による音声は1つに限定されるものではない。
制御部317は、同期処理部321と、調整部323と、第1合成部325と、遅延部331と、第2合成部333とを含んでいる。同期処理部321は、4つの入力を有し、番組映像及び番組音声用の2つの入力は第1受信部311に、第1及び第3ダイアログ音声用の2つの入力は第2受信部313に接続されている。また、同期処理部321は4つの出力を有し、1つ目の出力は遅延部331に、2つ目の出力は第1合成部325に、3つ目の出力は調整部323に、4つ目の出力は調整部323を介して第2合成部333に、それぞれ接続されている。調整部323は、第1合成部325に接続されている。第1合成部325の出力は、遅延部331を介して第2合成部333に接続されている。
制御部317の同期処理部321は、第1受信部311からの番組映像及び番組音声と、第2受信部313からの第1及び第3ダイアログ音声とを取得し、これら4つの信号を同期させる。そして、同期処理部321は、同期処理された番組映像を遅延部331に、同期処理された番組音声を第1合成部325に、同期処理された第1ダイアログ音声を調整部323に、同期処理された第3ダイアログ音声を調整部323に、それぞれ送る。調整部323により調整された第3ダイアログ音声は、第2合成部333に送られる。なお、番組映像と番組音声とは、予め同期して、送信局によって放送されることがある。この場合、同期処理部321は、番組映像と番組音声とのいずれか一方を第1受信部311から受け取り、この一方の信号と、第1及び第3ダイアログ音声とを同期させることもできる。
調整部323は、通信を介した第1ダイアログ音声を所定数倍することにより、放送を介した第1ダイアログ音声を逆相にした波形を第1合成部325に出力する。また、調整部323は、通信を介した第3ダイアログ音声を所定数倍することにより、振幅や位相を調整し、調整した第3ダイアログ音声を第2合成部333に出力する。
第1合成部325は、同期処理部321からの番組音声と、調整部323からの第1ダイアログ音声とを合成し、第1ダイアログ音声が除去されたダイアログ音声除去番組音声を生成する。そして、第1合成部325は、ダイアログ音声除去番組音声を遅延部331に送る。
遅延部331は、同期処理部321からの番組映像と第1合成部325からのダイアログ音声除去番組音声とを同一の所定時間遅延させる。遅延量(所定時間)は、例えば、第1ダイアログ音声と第3ダイアログ音声との話開始タイミングの差分(例えば、3秒)である。そして、遅延部331は、遅延した番組映像を、例えば、表示部(図示せず)に出力する。また、遅延部331は、遅延したダイアログ音声除去番組音声を第2合成部333に送る。なお、本発明は、番組映像とダイアログ音声除去番組音声とを1つの遅延部331により遅延させることに限定されるものではない。例えば、映像用と音声用との2つの遅延部を設けることもできる。この場合、音声用の遅延部と映像用の遅延部との遅延量は同一にしておく。
第2合成部333は、遅延したダイアログ音声除去番組音声と、調整部323からの第3ダイアログ音声とを合成する。遅延したダイアログ音声除去番組音声は、第1ダイアログ音声を除く元の番組音声が、第1ダイアログ音声を基準としたときの第3ダイアログ音声の遅延分、遅延したものである。そのため、第2合成部333は、第3ダイアログ音声と第1ダイアログ音声を除く番組音声との間にずれのない信号を、例えば音出力部(図示せず)に出力することになる。
続いて、図6を用いて、受信機301の処理について説明する。図6は、本発明の第3実施形態に係る受信機301の処理を示すフローチャートである。以下、第2実施形態と異なる部分を特に重点的に記載する。
まず、第1受信部311は、放送信号を受信し、放送信号から番組映像及び番組音声を分離し、双方の信号を同期処理部321に送る(ステップS301)。そして、第2受信部313は、第1及び第3ダイアログ音声を含む通信信号を受信し、第1及び第3ダイアログ音声を同期処理部321に送る(ステップS302)。
そして、同期処理部321は、番組映像及び番組音声と、第1及び第3ダイアログ音声とを同期させ、番組映像を遅延部331に、番組音声を第1合成部325に、第1ダイアログ音声及び第3ダイアログ音声を調整部323に、それぞれ送る(ステップS303)。調整部323は、第1ダイアログ音声を調整し、放送を介した第1ダイアログ音声を逆相にした波形を第1合成部325に送る(ステップS304)。
続いて、第1合成部325は、受け取った番組音声と、調整された第1ダイアログ音声とを合成し、ダイアログ音声除去番組音声(合成の結果)を遅延部331に送る(ステップS305)。遅延部331は、同期処理部321からの番組映像と第1合成部325からの合成の結果とを、所定時間遅延させ、遅延した合成の結果を第2合成部333に送る(ステップS306)。
第3ダイアログ音声を受け取った調整部323は、第3ダイアログ音声を調整し、第2合成部333に送る(ステップS307)
そして、第2合成部333は、遅延した合成の結果と、調整部323からの調整された第3ダイアログ音声とを合成し、第3ダイアログ音声と、ダイアログ音声以外の番組音声との間にずれのない音声を出力する(ステップS308)。
このように本実施形態では、第2受信部313は、インターネットを介して、第1ダイアログ音声が同時通訳された第3ダイアログ音声を受信し、制御部317は、ダイアログ音声除去番組音声を遅延させた後、当該遅延したダイアログ音声除去番組音声と、第3ダイアログ音声とを合成する。第3ダイアログ音声は、同時通訳されたものであるため、第1ダイアログ音声と比べると遅延を伴うが、その遅延分、ダイアログ音声除去番組音声を遅延させることにより、ダイアログ音声除去番組音声と第3ダイアログ音声との間のずれを解消できる。これにより、聴取者は、第3ダイアログ音声と、ダイアログ音声以外の音声とが調和した(対応した)自然な音声を聴くこととができる。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。
例えば、各部材、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
上述の本発明の実施形態の説明においては、調整部123の処理で用いられる所定数は、記憶部115に予め記憶されているとしたが、本発明はこの態様に限定されるものではない。例えば、調整部は、合成部(第1合成部)からの出力をフィードバックにより取得し、所望の波形を出力できるように所定数を自動制御することができる。所望の波形が、放送を介した番組音声中の第1ダイアログ音声を逆相にした波形である場合、合成部からの出力では、放送を介した番組音声から第1ダイアログ音声が完全に除去されていることが望ましい。よって、調整部は、所定数を変更する毎に、合成部からの出力を取得し、合成部からの出力が最小値になる所定数を求めることができる。このようにして、調整部は、第1ダイアログ音声を逆相にした波形を出力するための所定数をフィードバック制御により求めることができる。
本発明によれば、受信した放送信号のダイアログ音声のレベルを効果的に調整できるという有用性がある。
101、201、301 受信機
111、211、311 第1受信部
113、213、313 第2受信部
115、215、315 記憶部
117、217、317 制御部
121、221、321 同期処理部
123、223、323 調整部
125、225 合成部
227 選択部
229 話速変換部
325 第1合成部
331 遅延部
333 第2合成部

Claims (6)

  1. 放送された番組音声を受信する第1受信部と、
    インターネット通信により前記番組音声の第1ダイアログ音声を受信する第2受信部と、
    前記第1受信部及び前記第2受信部それぞれにより受信された前記番組音声と前記第1ダイアログ音声とを同期させた後、当該第1ダイアログ音声を所定数倍し、所定数倍された当該第1ダイアログ音声と、前記番組音声との合成を行う制御部と
    を備え、
    前記所定数は、当該所定数倍された前記第1ダイアログ音声が前記第1受信部により受信された前記番組音声中の第1ダイアログ音声の逆相信号になるような値、または正の値である
    ことを特徴とする受信機。
  2. 請求項1に記載の受信機において、
    前記第2受信部は、前記インターネット通信により、前記第1ダイアログ音声とは異なる第2ダイアログ音声を受信し、
    前記制御部は、前記番組音声と前記第2ダイアログ音声とを同期させ、当該第2ダイアログ音声と、前記合成の結果とを更に合成する
    ことを特徴とする受信機。
  3. 請求項1に記載の受信機において、
    前記制御部は、前記番組音声と同期した前記第1ダイアログ音声に対して話速変換処理を行い、当該第1ダイアログ音声と、前記合成の結果とを更に合成する
    ことを特徴とする受信機。
  4. 請求項1に記載の受信機において、
    前記第2受信部は、前記インターネット通信により、前記第1ダイアログ音声とは異なる第2ダイアログ音声を受信し、
    前記制御部は、
    前記番組音声と前記第2ダイアログ音声とを同期させ、
    当該第2ダイアログ音声に対して話速変換処理を行い、
    話速変換処理が行われ第2ダイアログ音声と、前記合成の結果とを更に合成する
    ことを特徴とする受信機。
  5. 請求項1に記載の受信機において、
    前記第2受信部は、前記インターネット通信により前記第1ダイアログ音声とは異なる第3ダイアログ音声を受信し、
    前記制御部は、前記番組音声と前記第3ダイアログ音声とを同期させ、
    前記合成の結果を所定時間遅延させ、
    遅延した前記合成の前記結果と、前記第3ダイアログ音声とを更に合成する
    ことを特徴とする受信機。
  6. 受信機のコンピュータに、
    放送された番組音声を取得する第1取得ステップと、
    インターネット通信により前記番組音声の第1ダイアログ音声を取得する第2取得ステップと、
    取得された前記番組音声と前記第1ダイアログ音声とを同期させるステップと、
    前記第1ダイアログ音声を所定数倍するステップと、
    所定数倍された前記第1ダイアログ音声と、前記番組音声との合成を行うステップと
    を実行させ、
    前記所定数は、当該所定数倍された前記第1ダイアログ音声が前記第1取得ステップにより取得された前記番組音声中の第1ダイアログ音声の逆相信号になるような値、または正の値である
    ことを特徴とするプログラム。
JP2012245605A 2012-11-07 2012-11-07 受信機、及びプログラム Expired - Fee Related JP6196437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012245605A JP6196437B2 (ja) 2012-11-07 2012-11-07 受信機、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012245605A JP6196437B2 (ja) 2012-11-07 2012-11-07 受信機、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014095751A JP2014095751A (ja) 2014-05-22
JP6196437B2 true JP6196437B2 (ja) 2017-09-13

Family

ID=50938873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012245605A Expired - Fee Related JP6196437B2 (ja) 2012-11-07 2012-11-07 受信機、及びプログラム

Country Status (1)

Country Link
JP (1) JP6196437B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208173A (ja) * 2004-01-20 2005-08-04 Victor Co Of Japan Ltd 話速変換装置及び音声信号伝送システム
KR101100213B1 (ko) * 2007-03-16 2011-12-28 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP2009032335A (ja) * 2007-07-27 2009-02-12 D & M Holdings Inc 音声データの記録再生装置
JP5586511B2 (ja) * 2011-03-25 2014-09-10 日本放送協会 同期制御装置及びプログラム

Also Published As

Publication number Publication date
JP2014095751A (ja) 2014-05-22

Similar Documents

Publication Publication Date Title
US10104470B2 (en) Audio processing device, audio processing method, recording medium, and program
JP2015053672A (ja) 2チャネルオーディオシステムにおけるステレオフィールド強化のための方法およびシステム
CA2699004A1 (en) A method and an apparatus of decoding an audio signal
JP2011193164A (ja) マルチチャンネル音響信号のダウンミックス装置及びプログラム
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
US7920708B2 (en) Low computation mono to stereo conversion using intra-aural differences
JP2011023961A (ja) オーディオ装置
JP6196437B2 (ja) 受信機、及びプログラム
CN109791773B (zh) 音频输出产生系统、音频通道输出方法和计算机可读介质
JP5202021B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP7004627B2 (ja) 映像音声再生システム、映像表示装置及び映像表示方法
JP6231762B2 (ja) 受信装置及びプログラム
JP5556673B2 (ja) 音声信号補正装置、音声信号補正方法及びプログラム
US8737645B2 (en) Increasing perceived signal strength using persistence of hearing characteristics
JP6920144B2 (ja) バイノーラル再生用の係数行列算出装置及びプログラム
JP6049190B2 (ja) 放送装置、及び受信機
JP6343171B2 (ja) 受信装置
JP5213733B2 (ja) 送信装置、受信装置、送信方法、受信方法
JP2014146942A (ja) ノイズ低減装置、放送受信装置及びノイズ低減方法
US10917108B2 (en) Signal processing apparatus and signal processing method
JP6506424B2 (ja) 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置
WO2015145660A1 (ja) 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置
JP2008301205A (ja) 音声出力装置及び音声出力方法
JP2019113866A (ja) 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置
JP6575407B2 (ja) オーディオ機器及び音響信号の転送方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170818

R150 Certificate of patent or registration of utility model

Ref document number: 6196437

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees