JP4675884B2 - 特定番組検出装置及び方法並びにプログラム - Google Patents

特定番組検出装置及び方法並びにプログラム Download PDF

Info

Publication number
JP4675884B2
JP4675884B2 JP2006512041A JP2006512041A JP4675884B2 JP 4675884 B2 JP4675884 B2 JP 4675884B2 JP 2006512041 A JP2006512041 A JP 2006512041A JP 2006512041 A JP2006512041 A JP 2006512041A JP 4675884 B2 JP4675884 B2 JP 4675884B2
Authority
JP
Japan
Prior art keywords
program
noise level
detection
unit
specific program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006512041A
Other languages
English (en)
Other versions
JPWO2005098818A1 (ja
Inventor
岳 河村
晴代 大久保
和宏 黒山
正之 三崎
芽衣子 正木
俊彦 伊達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2005098818A1 publication Critical patent/JPWO2005098818A1/ja
Application granted granted Critical
Publication of JP4675884B2 publication Critical patent/JP4675884B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、特定番組検出装置及び方法並びにプログラムに関し、より特定的には、テレビやラジオ等の番組信号内にある特定番組区間を検出する特定番組検出装置、及び特定番組検出方法、並びに当該方法を実行するためのプログラムに関する。
従来、音声と動画像とで構成されるテレビ番組等や音声だけで構成されるラジオ番組等の中にあるCM等の特定番組の区間を検出する手法として、例えば音声や動画像の切り替わり点(シーンチェンジ点)を検出し、そのシーンチェンジ点の時間間隔を判断して特定番組区間を検出する方法が、一般的に知られている。以下、このような特定番組検出方式を、図10を用いて説明する。
図10は、従来の特定番組検出装置100の構成例を示すブロック図である。この特定番組検出装置100は、映像データ読出し部101と、検出感度決定部103と、シーンチェンジ点検出部104と、特定番組判定部105とを備え、任意の検出感度のしきい値を設定し、その値に基づいて番組中の音声や動画像のシーンチェンジ点を検出して特定番組を検出することを行う。

映像データ読み出し部101は、ストレージデバイスやメモリ等から番組の映像データを読み出す。具体的な映像データ読み出し部101は、HDDレコーダに内蔵されているHDDや、DVDレコーダ等に挿入されているDVDメディアから、映像データを読み出す装置が挙げられる。検出感度決定部103は、シーンチェンジ点検出部104で音声や動画像のシーンチェンジ点を検出する際の検出感度を設定する。この検出感度は、音声や動画像の切り替わりの目安となる特徴量に対するしきい値に相当する。検出感度は、ユーザによって任意に設定を切り替えられるようにしてもよいし、装置出荷前に固定的に設定されてもよい。
シーンチェンジ点検出部104は、検出感度決定部103で設定された検出感度に従って、音声や動画像のシーンチェンジ点を検出する。シーンチェンジ点は、動画像データ又は音声データのいずれか又は両方を用いて検出することができる。画像データの場合、シーンチェンジ点として輝度変化点やブラックアウト挿入点等が挙げられる。音声データの場合、シーンチェンジ点として音声データのレベルが一定値以下となる点が挙げられる。
特定番組判定部105は、シーンチェンジ点検出部104で検出された各々のシーンチェンジ点の時間間隔を利用して、特定番組区間を判定する。例えば、CMの場合、15秒、30秒、60秒又は90秒という時間をとることが多いので、CM区間を検出する場合には、これらの時間間隔を取るかどうかを判定する。このようにして、従来の特定番組検出装置100では、番組信号中のCM区間を検出する。
特許第2858758号明細書
しかしながら、上述した構成の従来の特定番組検出装置100では、放送される番組信号の受信環境が劣悪でノイズが混入される場合や、パーソナルコンピュータ上での録画のように、一旦信号を符号化した後復号化される処理手順中に生じる符号化/復号化ノイズ(特に符号化性能が劣悪な場合が多い)が混入される場合、シーンチェンジ点の検出が上手く行えず、特定番組区間の検出性能が劣化してしまう。
特にアナログ放送の場合、地域によって放送局毎の受信状況が異なるため、上手く検出できる放送局とそうでない放送局とが発生して性能にばらつきが生じる原因にもなる。また、デジタル放送の場合でも、受信エラーに対する対策が必要であるが、従来の構成ではこれも考慮されていない。
一方、符号化器については、自由にインストールが可能なソフトウェアエンコーダと、LSI化された処理が高速なハードウェアエンコーダとがあり、ソフトウェアエンコーダの中には性能面での割り切りによる符号化性能の劣悪なものが存在する。
それ故に、本発明の目的は、アナログ/デジタルの違いや、番組信号の放送電波強度や受信状況の違いや、符号化器の違い等に対応させて、シーンチェンジ点の検出感度を適応的に変化させることで、ノイズが混入した番組信号でも特定番組区間の検出を可能とする特定番組検出装置及び方法並びにプログラムを提供することである。
本発明は、少なくとも番組の音声データを含む番組信号内にある特定番組の区間を検出する特定番組検出装置に向けられている。そして、上記目的を達成させるために、本発明の特定番組検出装置は、ノイズレベル検出部、検出感度決定部、無音部分検出部、及び特定番組判定部を備えている。
ノイズレベル検出部は、番組信号に含まれる音声データのノイズレベルを検出する。検出感度決定部は、ノイズレベル検出部で検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定する。無音部分検出部は、検出感度決定部で決定された検出感度に従って、番組信号に含まれる音声データの無音部分を検出する。特定番組判定部は、無音部分検出部で検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定する。
ここで、ノイズレベル検出部で検出されたノイズレベルについて、過去に検出されたノイズレベルを学習するノイズレベル学習部と、ノイズレベル学習部で学習されたノイズレベルを記憶するノイズレベル記憶部とをさらに備えることもできる。この構成により、検出感度決定部は、ノイズレベル記憶部に記憶された学習ノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定することが可能となる。
また、番組信号から番組情報を取得する番組情報取得部をさらに備えてもよい。この構成により、ノイズレベル記憶部は、ノイズレベル学習部で学習されたノイズレベルを、番組情報取得部で取得された番組情報と対応付けて記憶することが可能となり、検出感度決定部は、番組情報取得部で取得された番組情報に従って、当該番組情報に対応付けられた学習ノイズレベルをノイズレベル記憶部から取得し、特定番組を検出する際に用いる検出感度として決定することが可能となる。
典型的には、番組信号が重畳された放送波を受信し、受信した番組信号をノイズレベル検出部及び無音部分検出部へ出力する放送受信部、又は番組信号が記録されたストレージデバイスから番組信号を読み出し、読み出した番組信号をノイズレベル検出部及び無音部分検出部へ出力するデータ読み出し部のいずれかをさらに備える。
好ましくは、無音部分検出部は、番組信号に含まれる音声データの極小値をミニマムホールドで処理する。また、特定番組がCMである場合には、CMが取り得る最小時間である15秒で、ミニマムホールド値が所定の値にクリップされるように、ミニマムホールド値を漸増させる時定数が決定されていることが好ましい。
上述した特定番組検出装置の各構成が行うそれぞれの処理は、一連の処理手順を与える特定番組検出方法として捉えることができる。すなわち、番組信号に含まれる音声データのノイズレベルを検出し、この検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定し、この決定された検出感度に従って、番組信号に含まれる音声データの無音部分を検出し、この検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定する特定番組検出方法である。
好ましくは、この特定番組検出方法は、一連の処理手順を特定番組検出装置に実行させるためのプログラムの形式で提供される。このプログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。
なお、上述した特定番組検出装置を構成する一部の機能ブロックは、集積回路であるLSIとして実現されてもよい。
この本発明によれば、番組本編からCMへ切り替わる点及びCMから番組本編へ切り替わる点(シーンチェンジ点)を、確実に検出することができる。また、番組信号のノイズレベルに応じて検出感度を変化させるので、ノイズが混入した信号でも検出性能を維持することができる。また、過去のノイズレベルを学習して記憶しておくことで、ノイズが混入した信号に対する検出性能を維持することができる。さらに、過去のノイズレベルを番組情報と対応付けて学習して記憶しておくことで、過去のノイズ情報から現在のノイズ状況を推定し、ノイズレベルに応じた無音部分の検出を行うことができる。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る特定番組検出装置1の構成を示すブロック図である。図1において、特定番組検出装置1は、信号入力部11と、ノイズレベル検出部12と、検出感度決定部13と、無音部分検出部14と、特定番組判定部15とを備える。図2は、本発明の第1の実施形態に係る特定番組検出方法の処理手順を示すフローチャートである。
信号入力部11は、音声と動画像とで構成される番組(テレビ番組等)の信号、又は音声だけで構成される番組(ラジオ番組等)の信号を入力する部分である。これらの番組には、CMに代表されるような番組本編以外の特定番組が含まれている。この信号入力部11は、例えば、番組信号が放送局から放送される場合には、番組信号が重畳された放送波を受信する放送受信部(チューナ等)で構成され、番組信号がHDD、DVD、フラッシュメモリ等のストレージデバイスに記録されている場合には、番組信号の読み出しが可能なデータ読み出し部で構成される。このデータ読み出し装置の処理には、例えば音声と動画像とが多重化されたデータをデマルチプレックスする処理や、符号化された音声データ及び動画像データをデコードする処理も含まれる。なお、番組信号は、デジタルであってもアナログであってもよい。
ノイズレベル検出部12は、信号入力部11から出力された番組信号のノイズレベルを検出する(ステップS201)。この検出は、ノイズが多い番組信号は無音部分である最小値レベルが高くなることに着目したもので(図3A及び図3B)、例えば次の方法によって行われる。
第1の方法は、番組信号のパワー包絡線の極小値に追随する評価値であるミニマムホールド(Minimum Hold)値を検出する方法である(図4A)。このミニマムホールド値とは、直前のホールドレベルより小さな信号レベルを検出する度にそのレベルに追随し、小さな信号レベルを検出しない間は所定の時定数で漸増する値である。この第1の方法を用いると、番組信号のノイズの多さに比例してミニマムホールド値が高くなるという検出結果を得られる。
第2の方法は、番組信号のパワー包絡線について、極大値に追随する評価値であるマキシマムホールド(Maximum Hold)値とミニマムホールド値との差、すなわちダイナミックレンジ値を検出する方法である(図4B)。このマキシマムホールド値とは、直前のホールドレベルより大きな信号レベルを検出する度にそのレベルに追随し、大きな信号レベルを検出しない間は所定の時定数で漸減する値である。この第2の方法を用いると、番組信号のノイズの多さに比例してダイナミックレンジ値が低くなるという検出結果を得られる。
検出感度決定部13は、ノイズレベル検出部12で検出されたノイズレベル(ミニマムホールド値又はダイナミックレンジ値)に基づいて、無音部分検出部14において番組信号の無音部分を検出する際の検出感度を決定する(ステップS202〜S204)。この検出感度は、無音部分であるか否かを判断する音声レベルのしきい値である。典型的には、検出感度として高感度及び低感度の2通りが予め用意されており、所定のしきい値に対するノイズレベル(レベルミニマムホールド値又はダイナミックレンジ値)に応じて、いずれかの検出感度に決定される。例えば、ノイズレベルが小さい場合には低感度に決定され、ノイズレベルが大きい場合には高感度に決定される。なお、ノイズレベルに応じて決定する検出感度は、上述した高感度及び低感度の2通りに限られるものではなく、しきい値を複数設けて3通り以上にすることも勿論可能である。
このように、ノイズレベルが高い場合に検出感度を上げることで、後述する無音部分検出部14での番組本編における誤検出は増加するものの、ノイズにより埋もれてしまう番組本編区間とCM区間との間の無音部分、及びCM区間とCM区間との間の無音部を、確実に検出することができる。
無音部分検出部14は、信号入力部11から番組信号を入力し、検出感度決定部13で決定された検出感度に従って、番組信号の音声レベルが小さい部分を無音部分として検出する(ステップS205)。一般に、シーンチェンジする場面では、音声がフェードアウト/フェードインされたり、無音が挿入されたりすることが多い。例えば、図5は、ある番組から無音部分が検出される一例を示した図である。図5で分かるように、番組本編区間とCM区間との間及びCM区間とCM区間との間には、明らかに音声レベルの低い部分が存在することがわかる。そこで、無音部分検出部14では、この音声レベルを観測し、その音声レベルが検出感度で与えられる一定値以下となる箇所をシーンチェンジ点として検出することで(図5中の丸で囲まれた箇所)、番組本編区間とCM区間とを区別することを行う。図6は、図5よりも検出感度が高い場合に、番組から無音部分が検出される一例を示した図である。
ここで、音声信号そのものにノイズが重畳されていると、レベルの低い部分がすべてノイズに埋もれてしまい、検出が上手くいかなくなる場合がある。そこで、本発明の無音部分検出部14では、CMの無音部分を適切に検出するために、検出した音声レベルについてミニマムホールド処理を行う(図5及び図6を参照)。また、本発明の無音部分検出部14では、後述する特定番組判定部15でCMの判定を確かなものとするため、CMの最小時間が15秒であることに着目し、極小値から15秒以上経過すれば検出感度で決定される音声レベルにクリップされるように、ミニマムホールド処理の漸増量を調整する(図5及び図6を参照)。例えば、マキシマムホールド値−40dBのレベルがミニマムホールド値のクリップライン、すなわち検出感度となるように設定すれば、番組本編内で無音部分が多発する音声(Speech)中心の個所での誤検出をある程度防止することができる。
特定番組判定部15は、無音部分検出部14で検出された各々の無音部分について、後に続く無音部分との時間差を求め、求めた時間差から無音部分がCM区間の始まり又は終わりか、番組本編区間途中かを判断する(ステップS206)。この判断は、例えば図7のようにして行われる。周知のように、CMは、15秒、30秒、60秒又は90秒というように、15秒の倍数の長さで製作される。このことを利用して、特定番組判定部15は、無音部分間の時間間隔を求めて、15秒の倍数か否かを確認する。そして、特定番組判定部15は、15秒の倍数であると判定した無音部分間をCM等の特定番組として決定する。なお、検出感度を上げた時の無音部分の誤検出による影響をなくすために、1つの無音部分について、後に続く複数の無音部分との時間差をそれぞれ求め、求めた複数の時間差の評価から無音部分がCM区間の始まり又は終わりか、番組本編区間途中かを判断してもよい。
以上のように、本発明の第1の実施形態に係る特定番組検出装置及び方法によれば、番組本編からCMへ切り替わる点及びCMから番組本編へ切り替わる点(シーンチェンジ点)を、確実に検出することができる。また、番組信号のノイズレベルに応じて検出感度を変化させるので、ノイズが混入した信号でも検出性能を維持することができる。
(第2の実施形態)
図8は、本発明の第2の実施形態に係る特定番組検出装置2の構成を示すブロック図である。図8において、特定番組検出装置2は、信号入力部11と、ノイズレベル検出部12と、検出感度決定部23と、無音部分検出部14と、特定番組判定部15と、ノイズレベル学習部21と、ノイズレベル記憶部22とを備える。
図8に示すように、第2の実施形態に係る特定番組検出装置2は、上記第1の実施形態に係る特定番組検出装置1に対して、ノイズレベル学習部21、ノイズレベル記憶部22及び検出感度決定部23の構成が異なる。以下、同一構成部分はその説明を省略し、異なる構成について特定番組検出装置2を説明する。
ノイズレベル学習部21は、ノイズレベル検出部12で検出された番組信号のノイズレベルについて、過去に検出されたノイズレベルとの関連を学習する。この学習は、検出感度決定部23で決定する検出感度が、番組信号の時間変化によるノイズレベルの変動に過敏連動して、頻繁に切り替わらないようにするために行われる。例えば、ノイズレベル学習部21としては、ローパスフィルタ等の構成が考えられる。また、この学習は、特定番組検出及び判定が実際に行われているか否かには関係なく、入力されている番組信号について常に実行してもよい。特に、予約録画した場合には、番組信号ストリームの始端付近や終端付近はCM区間であると仮定して、この始端付近及び終端付の区間だけを学習してもよい。さらには、録画開始直前のストリームから学習してもよい。
ノイズレベル記憶部22は、ノイズレベル学習部21によって学習されたノイズレベルを記憶する。このノイズレベル記憶部22には、フラッシュメモリやDRAM、HDD一時記憶スペース等の、あらゆるストレージデバイスが該当する。
検出感度決定部23は、ノイズレベル記憶部22に記憶された学習ノイズレベルに基づいて、無音部分検出部14において番組信号の無音部分を検出する際の検出感度を決定する。
以上のように、本発明の第2の実施形態に係る特定番組検出装置及び方法によれば、第1の実施形態で述べた効果に加え、過去のノイズレベルを学習して記憶しておくことで、ノイズが混入した信号に対する検出性能を維持することができる。
(第3の実施形態)
図9は、本発明の第3の実施形態に係る特定番組検出装置3の構成を示すブロック図である。図9において、特定番組検出装置3は、信号入力部11と、ノイズレベル検出部12と、検出感度決定部33と、無音部分検出部14と、特定番組判定部15と、ノイズレベル学習部31と、ノイズレベル記憶部32と、番組情報取得部34とを備える。
図9に示すように、第3の実施形態に係る特定番組検出装置3は、上記第2の実施形態に係る特定番組検出装置2に対して、ノイズレベル学習部31、ノイズレベル記憶部32、検出感度決定部33及び番組情報取得部34の構成が異なる。以下、同一構成部分はその説明を省略し、異なる構成について特定番組検出装置3を説明する。
番組情報取得部34は、信号入力部11に入力される番組信号の番組情報を取得する。番組情報とは、番組が放送されたチャンネル情報や、ドラマ、スポーツ、ニュース、バラエティ等の番組の種類を指すジャンル情報等が挙げられる。この番組情報は、信号入力部11が放送波を受信するチューナである場合、チューナの選局状態や放送波に重畳される電子番組表等から取得される。また、番組情報は、インターネット接続によって、外部ポータルサイトから取得されてもよい。一方、信号入力部11がストレージデバイスからデータを読み出す装置である場合、ストレージデバイスに記録されている番組情報をデータと共に読み出すことで取得される。
この番組情報取得部34によって取得された番組情報は、ノイズレベル学習部31及び検出感度決定部33に出力される。ノイズレベル学習部31は、ノイズレベル検出部12で検出された番組信号のノイズレベルについて学習を行い、その学習の結果を番組情報取得部34によって取得された番組情報と対応付ける。この学習の意義は、ノイズレベル学習部21で説明したとおりである。
ノイズレベル記憶部32は、ノイズレベル学習部31によって番組情報と対応付けたれた学習ノイズレベルを記憶する。このノイズレベル記憶部32には、フラッシュメモリやDRAM、HDD一時記憶スペース等の、あらゆるストレージデバイスが該当する。
検出感度決定部33は、番組情報取得部34から与えられる番組情報に従って、この番組情報に対応付けられた学習ノイズレベルをノイズレベル記憶部32から取得し、無音部分検出部14において番組信号の無音部分を検出する際の検出感度として決定する。
このように番組のチャンネル情報を用いることで、ノイズレベル学習部31では、チャンネル毎に予めノイズレベルを学習することが可能となり、無音部分検出部14では、チャンネル別の受信状況の良/不良に適応した無音部分検出を実行することができる。例えばアナログ放送の場合、各チャンネル別にノイズレベルを学習し、デジタル放送の場合は地上・BS・CSの3つ放送形態別にノイズレベルを学習するという手法が考えられる。ただし、デジタル放送の場合、通常受信時にはノイズレベルはきわめて低いので任意の固定値とし、天候等の要因で伝送エラーにより番組信号にノイズが間欠的に重畳する場合には、伝送エラーを検知してノイズが重畳する頻度を記憶することを行う。そして、この学習により、ノイズ重畳時にはシーンチェンジの誤検出を起こさないよう検出感度を変更させ、正常な受信状況に戻った際にはすみやかに検出感度を戻す制御が考えられる。
また、番組のジャンル情報を用いることで、検出感度決定部33では、ジャンルに適した検出感度を設定することが可能となり、無音部分検出部14における無音部分の検出精度を向上させることができる。ジャンルによっては音声レベルの低い番組が頻繁に挿入されている場合がある。このため、音声レベルによるシーンチェンジ検出を行うときに、ジャンル情報を取得することで予め検出数を予測することができる。例えば、デジタル放送におけるクラシック演奏中継等の場合、番組中に音声レベルの低いシーンが頻繁に出現する。
以上のように、本発明の第3の実施形態に係る特定番組検出装置及び方法によれば、第1及び第2の実施形態で述べた効果に加え、過去のノイズレベルを番組情報と対応付けて学習して記憶しておくことで、過去のノイズ情報から現在のノイズ状況を推定し、ノイズレベルに応じた無音部分の検出を行うことができる。
なお、上記各実施形態では、番組信号に含まれる音声データの無音部分を検出してシーンチェンジ点を判定している例を説明した。しかし、シーンチェンジ点は、映像データでは輝度が大きく変化したり、ブラックアウト映像が挿入されたりしている場合が多い。よって、映像データの輝度変化点やブラックアウト挿入点を検出してもシーンチェンジ点の判定は可能である。例えば、第3の実施形態に係る特定番組検出装置3のようにジャンル情報を用いる場合においては、スポーツ番組では画面アングルの切り替わり頻度が多く、ニュース番組ではその頻度が少ないことを利用して、検出数を予測することが可能である。
典型的には、上記第1〜第3の実施形態で説明した特定番組検出装置1〜3が行う方法は、記憶装置(ROM、RAM、ハードディスク等)に格納された上述した処理手順を実行可能な所定のプログラムデータが、CPUによって解釈実行されることで実現される。この場合、プログラムデータは、CD−ROMやフレキシブルディスク等の記録媒体を介して記憶装置内に導入されてもよいし、記録媒体上から直接実行されてもよい。
なお、本発明の特定番組検出装置1〜3を構成するノイズレベル検出部12、検出感度決定部13、23及び33、無音部分検出部14、特定番組判定部15、ノイズレベル学習部21及び31、ノイズレベル記憶部22及び32、及び番組情報取得部34の各機能ブロックは、典型的には集積回路であるLSI(集積度の違いにより、IC、システムLSI、スーパーLSI、又はウルトラLSI等と称される)として実現される(図1、図8及び図9の破線を参照)。これらは、個別に1チップ化されてもよいし、一部又は全部を含むように1チップ化されてもよい。
また、集積回路化の手法は、LSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。また、LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別の技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてあり得る。
本発明にかかる特定番組検出装置は、テレビやラジオ等の番組信号内にある特定番組区間を検出したい蓄積型ビデオレコーダや編集用パソコンソフト等に利用可能であり、特にノイズが混入した番組信号でも確実に特定番組区間の検出したい場合等に有用である。
本発明の第1の実施形態に係る特定番組検出装置1の構成を示すブロック図 本発明の第1の実施形態に係る特定番組検出方法の処理手順を示すフローチャート ノイズが少ない番組信号の一例を示す図 ノイズが多い番組信号の一例を示す図 ノイズレベル検出部12が行うノイズレベル検出処理の一例を示す図(ミニマムホールド値) ノイズレベル検出部12が行うノイズレベル検出処理の一例を示す図(ダイナミックレンジ値) 番組信号から無音部分が検出された一例を示す図(低感度) 番組信号から無音部分が検出された一例を示す図(高感度) 特定番組判定部15が行う特定番組判定処理の一例を示す図 本発明の第2の実施形態に係る特定番組検出装置2の構成を示すブロック図 本発明の第3の実施形態に係る特定番組検出装置3の構成を示すブロック図 従来の特定番組検出装置100の構成例を示すブロック図
符号の説明
1〜3 特定番組検出装置
11 信号入力部
12 ノイズレベル検出部
13、23、33、103 検出感度決定部
14 無音部分検出部
15、105 特定番組判定部
21、31 ノイズレベル学習部
22、32 ノイズレベル記憶部
34 番組情報取得部
101 映像データ読み出し部
104 シーンチェンジ点検出部

Claims (9)

  1. 少なくとも番組の音声データを含む番組信号内にある特定番組の区間を検出する特定番組検出装置であって、
    前記番組信号に含まれる音声データのノイズレベルを検出するノイズレベル検出部と、
    前記ノイズレベル検出部で検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定する検出感度決定部と、
    前記番組信号に含まれる音声データの極小値を保持し、前記音声データのパワーが前記極小値をとらない間は、時間経過とともに前記極小値から所定量漸増するミニマムホールドを閾値とし、前記音声データのパワーが前記極小値となる時点から、特定番組が検出され得る最小時間経過後に、前記検出感度決定部で決定された検出感度で決定される音声レベルにクリップされるように、前記ミニマムホールドの前記漸増させる所定量を変化させ、前記閾値を用いて前記番組信号に含まれる音声データの無音部分を検出する無音部分検出部と、
    前記無音部分検出部で検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定する特定番組判定部とを備える、特定番組検出装置。
  2. 前記ノイズレベル検出部で検出されたノイズレベルについて、過去に検出されたノイズレベルを学習するノイズレベル学習部と、
    前記ノイズレベル学習部で学習されたノイズレベルを記憶するノイズレベル記憶部とをさらに備え、
    前記検出感度決定部は、前記ノイズレベル記憶部に記憶された学習ノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定することを特徴とする、請求項1に記載の特定番組検出装置。
  3. 前記番組信号から番組情報を取得する番組情報取得部をさらに備え、
    前記ノイズレベル記憶部は、前記ノイズレベル学習部で学習されたノイズレベルを、前記番組情報取得部で取得された番組情報と対応付けて記憶し、
    前記検出感度決定部は、前記番組情報取得部で取得された番組情報に従って、当該番組情報に対応付けられた学習ノイズレベルを前記ノイズレベル記憶部から取得し、特定番組を検出する際に用いる検出感度として決定することを特徴とする、請求項2に記載の特定番組検出装置。
  4. 前記番組信号が重畳された放送波を受信し、受信した番組信号を前記ノイズレベル検出部及び前記無音部分検出部へ出力する放送受信部をさらに備える、請求項1に記載の特定番組検出装置。
  5. 前記番組信号が記録されたストレージデバイスから番組信号を読み出し、読み出した番組信号を前記ノイズレベル検出部及び前記無音部分検出部へ出力するデータ読み出し部をさらに備える、請求項1に記載の特定番組検出装置。
  6. 特定番組がCMである場合、CMが取り得る最小時間である15秒で、ミニマムホールド値が所定の値にクリップされるように、ミニマムホールド値を漸増させる時定数が決定されていることを特徴とする、請求項1に記載の特定番組検出装置。
  7. 少なくとも番組の音声データを含む番組信号内にある特定番組の区間を検出する装置が実行する特定番組検出方法であって、
    前記番組信号に含まれる音声データのノイズレベルを検出するステップと、
    前記検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定するステップと、
    前記番組信号に含まれる音声データの極小値を保持し、前記音声データのパワーが前記極小値をとらない間は、時間経過とともに前記極小値から所定量漸増するミニマムホールドを閾値とし、前記音声データのパワーが前記極小値となる時点から、特定番組が検出され得る最小時間経過後に、前記検出感度で決定される音声レベルにクリップされるように、前記ミニマムホールドの前記漸増させる所定量を変化させ、前記閾値を用いて前記番組信号に含まれる音声データの無音部分を検出するステップと、
    前記検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定するステップとを備える、特定番組検出方法。
  8. 少なくとも番組の音声データを含む番組信号内にある特定番組の区間を検出する方法を特定番組検出装置に実行させるためのコンピュータ読み取り可能なプログラムであって、
    前記番組信号に含まれる音声データのノイズレベルを検出するステップと、
    前記検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定するステップと、
    前記番組信号に含まれる音声データの極小値を保持し、前記音声データのパワーが前記極小値をとらない間は、時間経過とともに前記極小値から所定量漸増するミニマムホールドを閾値とし、前記音声データのパワーが前記極小値となる時点から、特定番組が検出され得る最小時間経過後に、前記検出感度で決定される音声レベルにクリップされるように、前記ミニマムホールドの前記漸増させる所定量を変化させ、前記閾値を用いて前記番組信号に含まれる音声データの無音部分を検出するステップと、
    前記検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定するステップとを、前記特定番組検出装置に実行させるための、プログラム。
  9. 少なくとも番組の音声データを含む番組信号内にある特定番組の区間を検出する特定番組検出装置に用いられる集積回路であって、
    前記番組信号に含まれる音声データのノイズレベルを検出するノイズレベル検出部、
    前記ノイズレベル検出部で検出されたノイズレベルに基づいて、特定番組を検出する際に用いる検出感度を決定する検出感度決定部、
    前記番組信号に含まれる音声データの極小値を保持し、前記音声データのパワーが前記極小値をとらない間は、時間経過とともに前記極小値から所定量漸増するミニマムホールドを閾値とし、前記音声データのパワーが前記極小値となる時点から、特定番組が検出され得る最小時間経過後に、前記検出感度決定部で決定された検出感度で決定される音声レベルにクリップされるように、前記ミニマムホールドの前記漸増させる所定量を変化させ、前記閾値を用いて前記番組信号に含まれる音声データの無音部分を検出する無音部分検出部、及び
    前記無音部分検出部で検出された各々の無音部分の時間間隔を判断して、特定番組の区間を判定する特定番組判定部として機能する回路を集積している、集積回路。
JP2006512041A 2004-04-06 2005-03-28 特定番組検出装置及び方法並びにプログラム Active JP4675884B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004111801 2004-04-06
JP2004111801 2004-04-06
PCT/JP2005/005676 WO2005098818A1 (ja) 2004-04-06 2005-03-28 特定番組検出装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JPWO2005098818A1 JPWO2005098818A1 (ja) 2008-02-28
JP4675884B2 true JP4675884B2 (ja) 2011-04-27

Family

ID=35125308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006512041A Active JP4675884B2 (ja) 2004-04-06 2005-03-28 特定番組検出装置及び方法並びにプログラム

Country Status (3)

Country Link
US (1) US8014882B2 (ja)
JP (1) JP4675884B2 (ja)
WO (1) WO2005098818A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4547678B2 (ja) * 2006-03-29 2010-09-22 日本ビクター株式会社 Cm検出装置
JP2008252262A (ja) * 2007-03-29 2008-10-16 Nec Electronics Corp 符号化装置及び動画像の変化点検出方法
JP5029112B2 (ja) * 2007-04-13 2012-09-19 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
US8275153B2 (en) 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
WO2009025155A1 (ja) * 2007-08-21 2009-02-26 Voxmol Llc 音声再生方法、音声再生装置およびコンピュータ・プログラム
JP5028651B2 (ja) * 2008-05-19 2012-09-19 富士通モバイルコミュニケーションズ株式会社 情報処理装置およびコンテンツ解析プログラム
JP5250827B2 (ja) * 2008-09-19 2013-07-31 株式会社日立製作所 行動履歴の生成方法及び行動履歴の生成システム
JP2011205567A (ja) * 2010-03-26 2011-10-13 Nec Personal Products Co Ltd 動画出力装置、動画出力方法及びプログラム
WO2014158193A1 (en) * 2013-03-29 2014-10-02 Hewlett-Packard Development Company, L.P. Silence signatures of audio signals
US11785300B2 (en) * 2022-02-17 2023-10-10 Roku, Inc. HDMI customized ad insertion

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58173911A (ja) * 1982-04-06 1983-10-12 Nissan Motor Co Ltd 車両用ラジオ受信機
JP2000165807A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2000165798A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2001228893A (ja) * 2000-02-18 2001-08-24 Matsushita Electric Ind Co Ltd 音声認識装置
JP2003101939A (ja) * 2001-07-17 2003-04-04 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP2003284011A (ja) * 2002-03-27 2003-10-03 Sanyo Electric Co Ltd 放送システム及びav信号再生装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4081836A (en) * 1976-11-30 1978-03-28 The Magnavox Company Luminance signal processor for providing signal enhancement
US4390904A (en) 1979-09-20 1983-06-28 Shelton Video Editors, Inc. Automatic circuit and method for editing commercial messages from television signals
JPS62287297A (ja) * 1986-06-05 1987-12-14 松下電器産業株式会社 音声検出装置
JP2643933B2 (ja) 1986-12-11 1997-08-25 日本電気株式会社 識別情報重畳方式
JP2858758B2 (ja) 1988-09-19 1999-02-17 株式会社日立製作所 記録再生装置
US5333091B2 (en) 1993-01-08 1996-12-17 Arthur D Little Enterprises Method and apparatus for controlling a videotape player to automatically scan past recorded commercial messages
US5987210A (en) 1993-01-08 1999-11-16 Srt, Inc. Method and apparatus for eliminating television commercial messages
JPH08185196A (ja) 1994-12-28 1996-07-16 Sony Corp 音声区間検出装置
JP3407840B2 (ja) 1996-02-13 2003-05-19 日本電信電話株式会社 映像要約方法
JP3332756B2 (ja) * 1996-03-14 2002-10-07 三洋電機株式会社 テレビジョン放送信号の記録再生装置
US5841385A (en) * 1996-09-12 1998-11-24 Advanced Micro Devices, Inc. System and method for performing combined digital/analog automatic gain control for improved clipping suppression
US6049607A (en) * 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus
JP2000165806A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2002268683A (ja) * 2001-03-09 2002-09-20 Canon Inc 情報処理方法及び装置
DE60217484T2 (de) * 2001-05-11 2007-10-25 Koninklijke Philips Electronics N.V. Schätzung der signalleistung in einem komprimierten audiosignal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58173911A (ja) * 1982-04-06 1983-10-12 Nissan Motor Co Ltd 車両用ラジオ受信機
JP2000165807A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2000165798A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2001228893A (ja) * 2000-02-18 2001-08-24 Matsushita Electric Ind Co Ltd 音声認識装置
JP2003101939A (ja) * 2001-07-17 2003-04-04 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP2003284011A (ja) * 2002-03-27 2003-10-03 Sanyo Electric Co Ltd 放送システム及びav信号再生装置

Also Published As

Publication number Publication date
US8014882B2 (en) 2011-09-06
US20070154032A1 (en) 2007-07-05
WO2005098818A1 (ja) 2005-10-20
JPWO2005098818A1 (ja) 2008-02-28

Similar Documents

Publication Publication Date Title
JP4675884B2 (ja) 特定番組検出装置及び方法並びにプログラム
US20060013414A1 (en) Methods and related circuit for automatic audio volume level control
JPH10224722A (ja) コマーシャル検出装置及び検出方法
US20080266457A1 (en) Scene change detection device, coding device, and scene change detection method
JP4698453B2 (ja) コマーシャル検出装置、映像再生装置
US8457954B2 (en) Sound quality control apparatus and sound quality control method
JP4611952B2 (ja) 番組録画装置及びコマーシャル検出方法
US8538565B2 (en) Music playing apparatus, music playing method, recording medium storing music playing program, and integrated circuit that implement gapless play
CN101809999B (zh) 声音信号控制装置
KR100806155B1 (ko) 오디오 속도 변환을 가능하게 하는 방법 및 시스템
US8422859B2 (en) Audio-based chapter detection in multimedia stream
US9153241B2 (en) Signal processing apparatus
JP4712812B2 (ja) 記録再生装置
KR100763685B1 (ko) 방송 신호 기록 재생 장치 및 방법과 기록 매체
US8234278B2 (en) Information processing device, information processing method, and program therefor
CN108600813A (zh) 一种媒体文件播放方法、装置以及媒体播放系统
US8917886B2 (en) Method of distortion-free signal compression
JP2005012641A (ja) ブロックノイズ検出装置及びそれを用いたブロックノイズ除去装置
JP2007109328A (ja) 再生装置
JP2007267121A (ja) Cm検出装置
US7974518B2 (en) Record reproducing device, simultaneous record reproduction control method and simultaneous record reproduction control program
US20080130760A1 (en) Decoder device, receiver device, and medium reproduction device
JP2024004728A (ja) 放送受信装置および放送再生方法
JP2010027115A (ja) 音楽記録再生装置
KR20030079515A (ko) 오디오 디코더의 노이즈 제거 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140204

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4675884

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350