JP4253934B2 - 信号処理装置及び方法 - Google Patents
信号処理装置及び方法 Download PDFInfo
- Publication number
- JP4253934B2 JP4253934B2 JP19069399A JP19069399A JP4253934B2 JP 4253934 B2 JP4253934 B2 JP 4253934B2 JP 19069399 A JP19069399 A JP 19069399A JP 19069399 A JP19069399 A JP 19069399A JP 4253934 B2 JP4253934 B2 JP 4253934B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- category
- recording
- unit
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/59—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/37—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/454—Content or additional data filtering, e.g. blocking advertisements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/458—Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
- H04N21/4583—Automatically resolving scheduling conflicts, e.g. when a recording by reservation has been programmed for two programs in the same time slot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47214—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for content reservation or setting reminders; for requesting event notification, e.g. of sport results or stock market
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/50—Tuning indicators; Automatic tuning control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/775—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
Description
【発明の属する技術分野】
本発明は、信号処理装置及び方法に関し、例えば放送或いは記録された放送番組等の信号のカテゴリを自動的に判定可能とした信号処理装置及び方法に関する。
【0002】
【従来の技術】
従来より、例えば一般的なテレビジョン放送やケーブルテレビジョン放送、衛星放送、通信衛星放送、ラジオ放送などによる各種の放送番組を、記録装置(録画装置や録音装置)にて予約記録(予約録画や予約録音)する場合には、当該記録機器に対して予め記録チャンネル(放送チャネル、周波数)と記録開始時刻および記録終了時刻を指定する記録予約がなされる。しかし、実際の放送は、例えば生中継番組の延長などによって放送時間の変更が頻繁に起こり、そのため記録機器による予約記録の失敗が多発している。
【0003】
このような放送時間の変更に起因する予約記録の失敗を無くすために、例えば特開平9−322105号公報には、放送番組の映像信号や音声信号以外に、番組放送時間情報を別途送信するようにし、受信側ではその番組放送時間情報を利用して予約記録時間の変更を行う技術が開示されている。しかし、この技術の場合、送信側は、実際の放送番組の他に上記番組放送時間情報のような特殊なコードを送出する必要があり、また、受信側では、その特殊なコードを解読する必要があるため、一般の放送には適用されていない。
【0004】
【発明が解決しようとする課題】
したがって、上述のような特殊なコードを送受信するようなことを行わずに、予約記録の失敗を無くすためには、例えば、放送されている映像信号や音声信号から自動的に放送内容や放送番組のカテゴリを識別し、当該識別した放送内容や放送番組のカテゴリに基づいて記録を制御するような機能を、受信側の装置に備えさせることが望ましい。
【0005】
例えば放送内容を自動的に識別する技術としては、従来より、放送番組中のCM(コマーシャル)を検出して自動的にスキップする技術が存在している。すなわち、例えば特開平3−158086号公報や特開平3−262287号公報には、テレビジョン放送におけるCMと放送番組の放送モード(例えばステレオ/二か国語/モノラルなど)が異なることを利用し、その放送モードの変化を検出することにより現在の放送内容がCMであるのか放送番組であるのかを判定し、その判定結果に基づいてCMのみを自動的スキップさせる技術が開示されている。また、例えば特開平8−317342号公報には、テレビジョン放送におけるCMと放送番組との間には映像信号の黒レベル(ブラックレベル)と音声信号の無音区間が存在することを利用し、映像信号の黒レベルと白レベルの変化や音声信号の無音区間を検出することにより現在の放送内容がCMであるのか放送番組であるのかを判定し、その判定結果に基づいてCMのみを自動的スキップさせる技術が開示されている。しかしながら、これら技術は、何れもCMをスキップすることに特化しており、放送番組のカテゴリを判別することまではできない。
【0006】
また、放送番組のカテゴリを自動的に識別する技術として、従来より、特開平10−187182号公報には、音声信号を音声と音楽及び音響区間に分類し、全ての音声信号が入力された後に、それら音声と音楽及び音響区間の発生パターンを求め、当該発生パターンに基づいて放送番組の映像情報をカテゴリ分類するような技術が開示されている。しかしながら、この技術では、全ての音声信号が入力された後に上記発生パターンを求めるようにしているため、時系列として到来する信号を実時間で因果的にカテゴリ分類することはできず、したがって、この技術を放送番組についての録画や録音の制御に用いることはできない。また、この技術では、音声信号を音楽、音声、音響の3種に確定的に分類するため、例えば音響音である自動車のエンジン音などを音楽であると誤検出した場合、後段の処理ではもはやその誤りを訂正することができず、放送番組のように多くのカテゴリ含むものをそれぞれのカテゴリ毎に分類することは極めて難しい。さらに、この技術では、音声信号のみを用いており、例えばテレビジョン放送における映像信号のもつ有用な情報が利用されていない。
【0007】
そこで、本発明はこのような状況に鑑みてなされたものであり、各種の放送番組の内容やカテゴリを、正確且つ確実に分類して識別することにより、例えば、記録装置における予約記録を制御可能とし、予約記録の失敗を無くすことを可能にするだけでなく、さらに、記録する番組の自動フィルタリングや、CMの自動スキップ、番組の自動編集をも可能とする、信号処理装置及び方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の信号処理装置は、入力信号中の映像信号及び/又は音声信号から短時間フレーム毎に複数の少なくとも上記音声信号の調波構造度を含む特徴ベクトルを生成する特徴ベクトル生成部と、上記複数の特徴ベクトルから中時間フレーム毎に複数の少なくとも音源カテゴリ確率を含む分類ベクトルを生成する分類ベクトル生成部と、上記複数の分類ベクトルから長時間フレーム毎に、一つまたは複数のカテゴリ分類ベクトルを生成するカテゴリ分類生成部と、カテゴリ分類ベクトルに基づいて、カテゴリを判別するカテゴリ判別部とを有する。
【0009】
本発明の信号処理方法は、入力信号中の映像信号及び/又は音声信号から短時間フレーム毎に複数の少なくとも上記音声信号の調波構造度を含む特徴ベクトルを生成する特徴ベクトル生成工程と、上記複数の特徴ベクトルから中時間フレーム毎に複数の少なくとも音源カテゴリ確率を含む分類ベクトルを生成する分類ベクトル生成工程と、上記複数の分類ベクトルから長時間フレーム毎に一つまたは複数のカテゴリ分類ベクトルを生成するカテゴリ分類生成工程と、カテゴリ分類ベクトルに基づいて、カテゴリを判別するカテゴリ判別工程とを有する。
【0010】
【発明の実施の形態】
本発明の好ましい実施の形態について、図面を参照しながら説明する。
【0011】
図1には、本発明の信号処理装置及び方法が適用される一実施の形態としての番組カテゴリ自動分類装置の概略構成例を示す。
【0012】
この図1に示す本発明実施の形態の番組カテゴリ自動分類装置は、大きく4つの処理部3〜6に分かれており、各処理部3〜6はそれぞれ異なる時間スケールに対して階層的に処理を行う。また、図2には、図1の各処理部3〜6での時間関係を示す。
【0013】
すなわち、本実施の形態の番組カテゴリ自動分類装置の各処理部3〜6での処理の概要は次の通りである。
【0014】
先ず、短時間信号処理部3では、音声入力端子1から供給された音声信号と映像入力端子2から供給された映像信号を、例えば数十ミリ秒の短時間の信号素片(以下、短時間フレームと呼ぶ)に分割し、それら短時間フレーム毎の信号から特徴量抽出を行う。当該短時間信号処理部3にて短時間フレーム毎に抽出された特徴量についての情報は、中時間信号処理部4に送られる。
【0015】
中時間信号処理部4では、上記短時間フレーム毎に抽出された特徴量についての情報を例えば数秒単位の中時間(以下、中時間フレームと呼ぶ)毎にまとめ、この中時間フレーム毎の特徴量から音源(音声、音楽等)の識別やシーンチェンジ(映像がある場合)の判別などを行う。当該中時間信号処理部4での処理により得られた中時間フレーム毎の音源識別情報やシーンチェンジ判別情報は、長時間信号処理部5に送られる。
【0016】
長時間信号処理部5では、上記中時間信号処理部4で得られた音源識別情報やシーンチェンジ判別情報を、例えば数十秒単位の長時間(以下、長時間フレームと呼ぶ)毎にまとめ、この長時間フレーム毎の情報から番組カテゴリの識別を行う。当該長時間信号処理部5により得られた番組カテゴリ識別情報は、ストリーム処理部6に送られる。
【0017】
ここで、上記長時間信号処理部5における当該数十秒単位の長時間フレームの信号処理では、例えばニュース中のスポーツシーンなど、番組全体に対して必ずしも整合しない結果を出力することが起こる可能性がある。そのため、ストリーム処理部6では、長時間信号処理部5により得られた長時間フレーム毎の番組カテゴリ情報を逐次的に過去の履歴と統合し、挿入部分や誤識別に対する全体の番組の整合性を確保する。
【0018】
以下、テレビジョン放送による映像信号と音声信号が映像入力端子2と音声入力端子1に供給されている場合を一例に挙げて、図1に示した本実施の形態の番組カテゴリ自動分類装置の各処理部3〜6における信号処理の詳細について説明する。なお、ここではテレビジョン放送を例に挙げたが、ラジオ放送の場合は音声信号のみを用いて番組カテゴリの分類を行うことになる。
【0019】
短時間信号処理部3では、音声信号と映像信号を例えば数十ミリ秒程度の短時間フレーム毎に区分し、当該短時間フレーム毎の音声信号と映像信号からそれぞれ特徴抽出を行う。この短時間フレームの時間長は、一般的な音声認識や圧縮などに用いられるフレーム時間と同等であり、本実施の形態では、当該短時間フレーム長Wsを例えば33ms程度とし、また、短時間フレーム化を行う短時間フレーム周期TsをWs/2(≒17ms)とする。なお、一般的な音声認識や圧縮などに用いられるフレーム時間については、例えば、文献「L.R.Rabiner and R.W.Schafer : "Digital Signal Processing of Speech Signals,"Prentice-Hall,NJ,(1978)(鈴木訳:音声のディジタル信号処理、コロナ社)」に記載されている。
【0020】
先ず、短時間信号処理部3では、音声信号と映像信号が例えばアナログ信号として入力された場合、それらアナログ信号を図示しないA/D(アナログ/ディジタル)変換部によりディジタル信号化する。
【0021】
次に、短時間信号処理部3では、そのディジタル音声信号及びディジタル映像信号を、上記短時間フレーム長Wsの時間毎に区切り、その短時間フレーム毎に後述するようにして特徴量を求め、さらにその特徴量からNs次元の特徴ベクトルupを生成して出力する。なお、p(p=1,2,3,・・・,P)は、短時間フレームを表すインデックスであり、短時間フレーム周期Tsを単位とした時間に対応する。
【0022】
より具体的に説明すると、短時間信号処理部3は、音声信号から音源の性質を表すのに有効な特徴量を求めるための構成として、波形統計分析部11とスペクトル分析部12とLPC分析(線形予測分析)部13を備えており、波形統計分析部11による波形統計分析と、スペクトル分析部12によるスペクトル分析と、LPC分析部13によるLPC分析とを用いて、音源の性質を表す特徴量を求める。
【0023】
上記波形統計分析部11では、短時間フレーム内の音声信号の平均パワーを、上記音源の性質を表す特徴量の一つとして求める。すなわち、音楽や一部の環境音(例えば自動車音や機械音など)では平均パワーが比較的一定であり、また、一部の楽音(例えば打楽器音など)は減衰性があり、また、音声や一部の環境音(例えば拍手や歓声など)ではばらつきが大きくなるなどの性質を有するため、当該短時間フレーム内の音声信号の平均パワーは音源識別に有効な特徴量となる。
【0024】
上記スペクトル分析部12では、短時間フレーム内の音声信号をスペクトル分析し、当該短時間フレーム毎のスペクトル包絡の重心と2次モーメント及び調波構造度を、上記音源の性質を表す特徴量の一つとして求める。すなわち、当該短時間フレーム内のスペクトル包絡の重心と2次モーメントは、スペクトルの概形を表す統計量であり、例えば音声と音楽では一般に音楽の方が帯城幅が広いことが多いなど、音源によってスペクトルの形状と広がりに特徴がある場合が多く、したがって当該重心と2次モーメントは音源識別に有効な特徴量となる。また、調波構造度はスペクトルの極大位置の整数倍関係を評価する量であり、スペクトル分析部12では、例えばヒストグラム法を用いて以下の処理手順により調波構造度を求める。
【0025】
先ず、第1の処理として、短時間フレーム内のスペクトルの有意な成分の極大周波数を微分法などで求める。次に、第2の処理として、極大周波数およびその整数分の1の周波数に関するヒストグラムを作成する。次に、第3の処理として、ヒストグラムの最大値を極大値の数で除算規格化し、第一調波構造度とする。また、第4の処理として、ヒストグラムの最大周波数を、第一ピッチ周波数とする。次に、第5の処理として、第一ピッチ周波数の整数倍の成分をすべて取り除き、再び第2の処理によりヒストグラムを作成する。その後、第6の処理として、ヒストグラムの最大値を第3の処理による極大値の数で規格化し、第二調波構造度とする。また、第7の処理として、ヒストグラム最大の周波数を、第二ピッチ周波数とする。以上の処理により、単独音声や単一楽音のように構成成分の多くが調波構造を成すものは、第一調波構造度のみが有意となる。一方で、複数音声や和音のように、調波構造を持つ音が複数重なっている場合には、第一、第二調波構造度が共に有意な値を持つ。また、雑音など調波構造を持たないものの場合、調波構造度は何れも小さくなる。このことから、この特徴量は、音源の識別および混合音の識別に有効な特徴量となる。なお、ヒストグラム法については、文献「T.W.Parson:"Separation of Speech from Interfering Speech by means of Harmonic Selection," J.Acoust.Soc.Am.,60,4,911/918(1976)」に記載されている。
【0026】
上記LPC分析部13では、LPC係数、LPC残差エネルギ、及びLPC残差に対する短時間相関を用いて得たピッチ周波数を、上記音源の性質を表す特徴量の一つとして求める。なお、これについては、上記文献「L.R.Rabiner and R.W.Schafer : "Digital Signal Processing of Speech Signals,"Prentice-Hall,NJ,(1978)(鈴木訳:音声のディジタル信号処理、コロナ社)」に記載されている。これらLPC分析によるLPC係数、LPC残差エネルギ、及びLPC残差に対する短時間相関は、音声や楽音をよく記述する特徴量であり、音源の識別に有効である。このことについては、文献「河地、梶田、武田、板倉:”VQ歪みに基づく放送音の自動分類”,信学技法、DSP97-95/SP97-50,43/48(1997)」や「前田祐児:”音声と楽音の自動識別方法”,信学技法、CQ98-61,9/13(1998)」に記載されている。
【0027】
なお、この図1の例では、波形統計分析部11とスペクトル分析部12とLPC分析部13のそれぞれにおいて音声信号を短時間フレーム化してそれぞれ上記分析を行う例を挙げているが、これら各分析部11〜13の前段に音声信号を短時間フレーム化するフレーム化手段を設け、当該フレーム化手段にて短時間フレーム化された音声信号を各分析部11〜13に送るようにしてもよい。
【0028】
また、短時間信号処理部3は、短時間フレーム毎の映像信号の特徴量を求めるための構成として、画像統計分析部14と動画像処理部15を備えており、画像統計分析部14による画像統計分析と、動画像処理部15によおる動画像処理とを用いて、映像の性質を表す特徴量を求める。
【0029】
上記画像統計分析部14では、1フレーム画像の輝度の平均と分散を、上記映像の特徴量の一つとして求める。これら輝度の平均と分散は、番組切り替わりに現れることの多いブラックレベル(黒レベル)画像の検出や、アニメーションのように同一色部分(べた部分)の多い画像を特徴付けるのに有効である。なお、ここでの1フレーム画像とは、1/30秒の1フレーム時間の画像のことである。言い換えると、短時間信号処理部3における前記短時間フレーム長Wsは、当該映像信号の1フレームの時間(1/30s≒33ms)に合わせて設定されている。
【0030】
上記動画像処理部15では、フレーム間の画像差分エネルギを、上記映像の特徴量の一つとして求める。当該フレーム間の画像差分エネルギは、シーン切り替えなどを特徴付けるのに有効な特徴量となる。
【0031】
上述した波形統計分析部11、スペクトル分析部12、LPC分析部13から得られた音声信号についての各特徴量と、上記画像統計分析部14、動画像処理部14から得られた映像信号についての各特徴量とは、特徴ベクトル生成部16に送られる。当該特徴ベクトル生成部16では、短時間フレーム毎の各特徴量から、その短時間フレーム毎にNs次元の特徴ベクトルupを求めて出力する。当該特徴ベクトルupは中時間信号処理部4に送られる。
【0032】
図3には、上記短時間信号処理部3における各分析部11〜14及び処理部15での処理と、それら分析及び処理により得られる各特徴量(特徴ベクトルupのそれぞれの成分)と、次元との対応表を示す。すなわち、この図3に示す対応表によれば、波形統計分析処理では、特徴量として短時間フレームの平均パワー(1次)が得られ、スペクトル分析処理では、特徴量としてスペクトル包絡の重心(1次)と分散(1次)、調波構造度(2次)が得られ、線形予測分析(LPC分析)では、特徴量としてLPC係数(12次)、LPC残差エネルギ(1次)、ピッチ周波数(1次)が得られ、画像統計分析では、特徴量として輝度平均(1次)と輝度分散(1次)が得られ、動画像処理では、特徴量としてフレーム間差分エネルギ(1次)が得られることが表されている。
【0033】
次に、中時間信号処理部4では、上記短時間信号処理部3から供給された短時間フレーム毎の特徴ベクトルupを前記数秒単位の中時間フレーム毎にまとめ、この中時間フレーム毎の特徴ベクトルupから音源の識別やシーンチェンジの判別などを行う。ここで、当該中時間フレームの長さは、フレーム化された音声信号の音声/音楽/複数音声など、特に音源に対応するカテゴリに分類するために必要かつ十分な時間長となされる。本実施の形態では、当該中時間フレーム長Wmを例えば1s(秒)程度とし、中時間フレーム化を行うための中時間フレーム周期TmをWm/2としている。なお、音源分類のために同等の時間長が有効であることについては、前記文献「河地、梶田、武田、板倉:”VQ歪みに基づく放送音の自動分類”,信学技法、DSP97-95/SP97-50,43/48(1997)」や文献「前田祐児:”音声と楽音の自動識別方法”,信学技法、CQ98-61,9/13(1998)」、文献「河地、梶田、武田、板倉:”VQによる放送音の分類”,音講論集、平成9年秋期、173/174(1997)」などに記載されている。また、上記音源を分類するカテゴリとしては、無音、音声、音楽、音楽と音声、複数話者音声、環境音(例えば自動車音、機械動作音、歓声など)や合成音(時報など)、その他(明示的にカテゴリ名を与えることのできない音)などのカテゴリが考えられる。
【0034】
当該中時間信号処理部4への入力は、前記短時間信号処理部3から前記短時間フレーム周期Ts(≒17ms)毎に供給される特徴ベクトルup(p=1,2,・・・,P)であり、この特徴ベクトルupは中時間フレーム長Wm(≒1s)の範囲にわたってP(=Wm/Ts)個与えられる。また、当該中時間信号処理部4からの出力は、後述するように、音声信号の音源カテゴリを確率で表したベクトルxq(q=1,2,・・・,Q)と、短時間フレームのパワーの平均と分散、ピッチ周波数の平均と分散、スペクトル包絡の平均と分散、ブラックフレームの有無とブラックフレームの時刻、シーンチェンジの有無とシーンチェンジの時刻となる。
【0035】
前記短時間信号処理部3からの上記P個の特徴ベクトルupは、中時間信号処理部4の特徴抽出部17に入力される。当該特徴抽出部17では、上記P個の特徴ベクトルupのうち、特に音声信号についての平均的な性質と変化の性質を得るため、ベクトル要素毎の平均と分散を求め、それを新たにベクトルuaとする。このベクトルuaの要素は、それぞれ音源の性質をよく反映する特徴量である。本実施の形態では、例えばベクトル量子化法(VQ)を用いて上記パターン分類を行う。なお、ベクトル量子化法については、前記文献「河地、梶田、武田、板倉:”VQ歪みに基づく放送音の自動分類”,信学技法、DSP97-95/SP97-50,43/48(1997)」や、文献「A.Gersho and V.Cuperman:"Vector Quantization:A pattern-matching technique for speech coding,"IEEE Communication Magazine, December, 15/21(1983).」に記載されている。また、当該ベクトル量子化法と同等なことは、例えばニューラルネットワークや他の統計判別法でも実現可能である。当該抽出時間信号処理部4では、上記ベクトル量子化を行うための構成として、VQ演算部18とVQ符号帳19を備えている。
【0036】
上記VQ符号帳19は、予め既知のサンプルを多数用意して作成されたものであり、例えばいわゆる学習法によって各カテゴリi(i=1,2,・・・,I)を代表するJ個づつのベクトルrijが決定されている。このとき、明示的に音源名を与えられる音(例えば音声や自動車など)にはいわゆる教師つき学習を用いるが、明示的にカテゴリを与えることの難しい雑音や環境音などには、教師なし学習を用いてカテゴリ分けしてから、結果としてできあがるカテゴリに、例えばその他1、その他2、・・・などの名称を与えておく。ベクトル量子化は、VQ演算部18にて前記特徴ベクトルuaと上述のVQ符号帳19の代表ベクトルとを比較し、全てのカテゴリについてJ個の代表ベクトルから最小距離となるベクトルを選択することにより行われる。その距離の逆数ρiを各カテゴリに対する適合度とすると、当該適合度ρiは、以下の式(1)にて表すことができる。
【0037】
ρi=1/minj(|rij−ua|2) (1)
VQ演算部18では、次式(2)の演算により、これをρiの総和で規格化し、出力ベクトルviを得る。当該ベクトルviは、与えられた音が各音源カテゴリに対して、どの程度適合しているかを表す確率ベクトルとなる。
【0038】
【数1】
【0039】
当該VQ演算部18により得られた音源カテゴリ確率ベクトルviは、分類ベクトル生成部20に送られる。
【0040】
また、上記ベクトル量子化で得られる音源カテゴリの確率ベクトルとは別に、特徴抽出部17では、後段で必要となる特徴量として、短時間フレームのパワーの平均と分散、ピッチ周波数の平均と分散、スペクトル包絡の平均と分散、ブラックフレームの有無とブラックフレームが有る場合の当該ブラックフレームの時刻、シーンチェンジの有無とシーンチェンジが有る場合の当該シーンチェンジの時刻を求める。なお、上記ブラックフレームの有無は、例えば画像輝度平均と所定の閾値とを比較することにより求めることができ、また、上記シーンチェンジの有無は、例えば画像差分エネルギと所定の閾値とを比較することにより求めることができる。これら後段で必要となる特徴量は、分類ベクトル生成部20に送られる。
【0041】
分類ベクトル生成部20では、上記VQ演算部18からの確率ベクトルと、上記特徴抽出部17からの上記後段で必要となる特徴量とを合わせて、ベクトルxq(分類ベクトル)を生成して出力する。この分類ベクトルxqは、中間信号処理部4から長時間信号処理部5に送られる。
【0042】
図4には、上記中時間信号処理部5から出力される分類ベクトルxqの要素の種類とベクトル要素との対応表を示す。すなわち、この図4に示す対応表によれば、音源カテゴリ確率に対するベクトル要素には、無音、音声、音楽、音楽と音声、複数話者音声、歓声、自動車音、機械動作音、時報、その他があり、音響特徴量に対するベクトル要素には、短時間パワーの平均と分散、ピッチ周波数の平均と分散があり、画像特徴量に対するベクトル要素には、ブラックフレーム時刻、シーンチェンジ時刻がある。
【0043】
次に、長時間信号処理部5では、上記中時間信号処理部4から供給された中時間毎の分類ベクトルxqを前記数十秒単位の長時間フレーム毎にまとめ、この長時間フレーム毎の分類ベクトルxqから番組カテゴリの分類を行う。本実施の形態では、長時間フレームの時間長Wlを例えば30s程度とし、また、長時間フレーム化を行う短時間フレーム周期TmをWl/2(≒15s)とする。
【0044】
当該長時間信号処理部5への入力は、前記中時間信号処理部4から前記中時間フレーム毎に供給される分類ベクトルxq(q=1,2,・・・,Q)であり、この分類ベクトルxqは長時間フレーム長Wl(≒30s)の範囲にわたってQ(=Wl/Tm)個与えられる。また、当該長時間信号処理部5からの出力は、後述するように、現在のフレームrに関する番組カテゴリを確率で表した確率ベクトル(カテゴリ分類ベクトル)yrである。なお、番組のカテゴリは、例えば、ニュース番組、音楽番組、スポーツ番組、バラエティ番組、ドラマ番組、その他の番組、CM、番組の変化点(境目)などが考えられる。
【0045】
当該長時間信号処理部5での番組カテゴリの分類処理では、統計的なカテゴリ判別法とルールテーブル参照法を併用する。これは、人間が通常意識しない信号の統計的な傾向は統計判別法で分類するのが適しているのに対して、番組の性質上明らかな傾向(例えばニュース番組には単独話者の音声が多い、例えば番組の境界には必ず大きく映像信号レベルが変化する、例えばCMは15秒の整数倍に境界が有り大きく音声信号レベルや映像信号レベルが変化する等の傾向)は、規則として記述する方が適していることによる。両者の統合は、番組カテゴリを確率で表現することで実現できる。
【0046】
上記中時間信号処理部4からの分類ベクトルxqは、上記長時間信号処理部5の特徴抽出部21に送られる。当該特徴抽出部21では、上記分類ベクトルxqから、音源カテゴリを表す確率ベクトルの部分(前記図4の対応表に示した音源カテゴリ確率の部分)のみを取り出して新たなベクトルxaとし、当該ベクトルxaをVQ演算部22に入力する。すなわち、長時間信号処理部5では、上記統計的な判別法に再びベクトル量子化を利用し、したがって、当該抽出時間信号処理部4には、ベクトル量子化を行うための構成として、VQ演算部22とVQ符号帳23を備えている。
【0047】
上記VQ符号帳23は、予め既知のサンプルを多数用意して作成されたものであり、例えばいわゆる学習法によって各番組カテゴリziを代表するベクトルcijが決定されている。ここで、i(i=1,2,・・・,I、Iはカテゴリ数)は分類カテゴリを表すインデックスであり、j(j=1,2,・・・,J)は同一カテゴリを表す複数の代表ベクトルを区別するためのインデックスである。
【0048】
また、上記VQ演算部22では、ベクトルxaと代表ベクトルcijとの距離を計算し、各カテゴリを表す複数のベクトルから最小距離のものを選ぶ。さらに、当該VQ演算部22では、式(3)を用いてその距離の逆数ηqiを求め、当該逆数ηqiを中時間フレームqにおける各カテゴリに対する適合度とする。
【0049】
ηqi=1/minj(|cij−xa|2) (3)
また、VQ演算部22では、次式(4)の演算により、これを1フレーム内の全てのベクトルxa(a=1,2,・・・,Q)について計算し、それぞれのカテゴリ別に加算する。
【0050】
【数2】
【0051】
さらに、VQ演算部22では、次式(5)の演算により、これをDiの総和で規格化し、出力ベクトルyiを得る。当該ベクトルyiは、長時間フレーム内で信号が各番組カテゴリにどの程度適合しているかを表す確率ベクトルとなる。
【0052】
【数3】
【0053】
当該VQ演算部22により得られた番組カテゴリ確率ベクトルyiは、ルール処理部24に送られる。
【0054】
また、当該長時間信号処理部5の特徴抽出部21は、上記分類ベクトルxqの特徴量から、図5に示すような特徴量と処理法の対応表のように、性質の有無を閾値処理で判別し、ルール処理部24に入力する。すなわち、この図5に示す対応表によれば、音楽性の特徴量に対する処理法としては、音楽の確率が高い区間が継続するか否かを判別し、単独話者性の特徴量に対する処理法としては、音声の確率が高い区間が継続してピッチ周波数平均が一定の範囲に収まるか否かを判別し、会話性の特徴量に対する処理法としては、音声の確率が高い区間が継続してピッチ周波数平均に跳躍があるか否かを判別し、時報性の特徴量に対する処理法としては、時報の確率が高い区間があるか否かを判別し、無音規則性の特徴量に対する処理法としては、無音区間が規則的(例えば15秒毎)にあるか否かを判別し、ブラックレベル規則性の特徴量に対する処理法としては、ブラックレベル区間が規則的(例えば15秒毎)にあるか否かを判別し、CM有無の特徴量に対する処理法としては、CM放送のあり得ないチャンネルであるか否か(チャンネル番号、チャンネル地域コードを利用)を判別する。
【0055】
長時間信号処理部5のルール処理部24では、上記特徴抽出部21にて図5の対応表に示す判別処理により得られた性質の有無の情報を得て、ルールテーブル部25に格納されているルールテーブルの規則に従い、上記VQ演算部22から供給された番組カテゴリ確率ベクトルyiを操作する。
【0056】
すなわち、上記ルールテーブル部25には、予め図6に示すような性質の有無と確率の操作規則との対応を示すルールテーブルが用意されており、ルール処理部24では、当該図6のルールテーブルを用いて上記番組カテゴリ確率ベクトルyiを増加或いは減少させるように操作する。具体的に説明すると、ルール処理部24は、図6に示すルールテーブルに基づいて、単独話者性があるときにはニュース番組の確率を増加させ、会話性があるときにはドラマやバラエティ番組の確率を増加させ、無音規則性があるときにはCMの確率を増加させ、ブラックレベル規則性があるときはCMの確率を増加させ、音楽性があるときには音楽番組の確率を増加させ、CM無しチャンネルであるときにはCMの確率を0にし、時報性があるときには番組の境目の確率を増加、音楽番組の確率を減少(通常、音楽番組中には時報が鳴ることはないため)させ、また、時報性があるときには後述する履歴更新係数ξを0.9程度に、シーンチェンジがないときには履歴更新係数ξを0.1程度にする。このように、ルール処理部24における番組カテゴリ確率ベクトルyiの操作は、確率の増加或いは減少により行うため、その大きさをパラメータとして恣意的に決めることで、確定的なルールだけでなく漠然とした傾向も記述することができる。
【0057】
上述のようにしてルール処理部23にて全ての規則を参照した後、カテゴリ分類ベクトル生成部26では、カテゴリ数の次元を持つ確率ベクトル(番組カテゴリ分類ベクトル)yr=(y1,y2,・・・,yI)(r=1,2,・・・)と、後述する履歴更新係数ξを出力する。なお、rは長時間フレームを表すインデックスであり、長時間フレーム周期Tl(〜15s)を単位とした時間に対応する。
【0058】
以下、図7及び図8を用いて、上記長時間信号処理部5での具体的な動作例を説明する。なお、これら図7及び図8の例では、CMの無いチャンネルのニュース番組のエンディングから、次の番組の開始までの間の長時間信号処理部5の動作例を示している。図7と図8は紙面の都合上、2つの図に分けられているが、これら図7と図8は連続する2フレーム(一部オーバーラップしている)分を表している。図7と図8の各(a)には実際の放送内容を、(b)には中時間信号処理部4での処理結果(音源の確率)を、(c)には長時間信号処理部5での処理動作(番組カテゴリの分類)を示している。また、各図の中時間信号処理部4での処理結果を表している(b)中のSにて示されるグラフの高さは音声である確率の高さを、Mにて示されるグラフの高さは音楽である確率の高さを、Tにて示されるグラフの高さは時報である確率の高さを、Oにて示されるグラフの高さはその他である確率の高さを示している。さらに、各図の長時間信号処理部5での処理結果を表している(c)中のNにて示されるグラフの高さはニュース番組である確率の高さを、Mにて示されるグラフの高さは音楽番組である確率の高さを、Cにて示されるグラフの高さはCMである確率の高さを、Pにて示されるグラフの高さは境目である確率の高さを、Oにて示されるグラフの高さはその他である確率の高さを表している。
【0059】
先ず、図7から説明する。この図7において、図中(a)の実際の放送内容は、アナウンサが喋っている状態から、徐々にエンディング音楽がフェードインしてくるような内容を有している。このような放送内容の場合、図中(b)の中時間信号処理部4での音源の確率は、アナウンサが喋っている間は音声(S)の確率が最も高く、エンディング音楽がフェードインしてくるにつれて、音楽(M)の確率が高くなってくる。また、上記放送内容の場合、長時間信号処理部5では、上述のような中時間信号処理部4による音源の確率を入力とし、ベクトル量子化を行うことによって、番組カテゴリを分類することになる。このときの長時間信号処理部5による番組カテゴリの確率は、図中(c)の左側に示す確率グラフのようにニュース番組(N)である確率が最も高くなる。さらに、このときの長時間信号処理部5の特徴抽出部21の出力は、ルール処理部24により、図中(c)の中央部の表のように、ニュース番組(N)及び音楽番組(M)(エンディング音楽のため)の確率を上げ、CM(C)の確率を下げるように操作される。ここで、確率の総和は1であるから、上記操作後に規格化することで、操作を受けなかったものの確率も変化する。その結果、この長時間フレームの番組カテゴリ分類結果は、図中(c)の右側に示す確率グラフのようになり、ニュース番組の確率が先鋭化されることになる。
【0060】
次に、図8を説明する。この図8において、図中(a)の実際の放送内容は、アナウンサが喋っている状態から、徐々にエンディング音楽がフェードインし、その後、時報が入り、次の番組のオープニング音楽か開始するような内容を有している。このような放送内容の場合、図中(b)の中時間信号処理部4での音源の確率は、アナウンサが喋っている間は音声(S)の確率が最も高く、エンディング音楽がフェードインしてくるにつれて音楽(M)の確率が高くなり、その後、時報が鳴っている間は時報(T)の確率が最も高くなり、次にオープニング音楽が開始されると音楽(M)の確率が高くなる。上記放送内容の場合、長時間信号処理部5でのベクトル量子化による番組カテゴリの確率は、図中(c)の左側に示す確率グラフのように、音楽番組(M)である確率が最も高くなると思われるが、このフレーム中には時報が存在するため、図中(c)の中央部の表のように、前記ルール処理部24でのルール処理により、音楽性は有るにもかかわらず音楽番組(M)の確率は下げられ、番組境界(P)に確率が上げられることになる。その結果、音楽番組(M)の確率と、番組境目(P)の確率は逆転し、図中(c)の右側に示す確率グラフのように、番組境目(P)の確率が最大となる。
【0061】
以上のように、長時間信号処理部5では、統計分類処理とルール処理を併用することで、事前知識を導入でき、番組カテゴリの分類結果をより正しくすることができる。
【0062】
上述したように動作する長時間信号処理部5から出力された番組カテゴリ分類ベクトルyrと後述する履歴更新係数ξは、ストリーム処理部6に送られる。
【0063】
ストリーム処理部6では、前記長時間信号処理部5から供給された番組カテゴリ分類ベクトルに対して、過去の履歴と統合することにより、最終的なカテゴリ識別を行う。ここでの処理は、連続的なストリーム処理であり、したがって当該ストリーム処理部6は逐次的に現在時刻前後の番組カテゴリを出力する。
【0064】
具体的には、履歴記憶部28に番組カテゴリ分類ベクトルyrと同次元の内部状態ベクトルを用意し、初期状態としてz0=[一定値]を与える。
【0065】
履歴統合部27では、長時間信号処理部5が第rフレームで求めた番組カテゴリ分類ベクトルyrと、履歴記憶部28に保存されている一つ前の第r−1フレームにおける内部状態ベクトルzr-1とを用いて、次式(6)に従って内部状態を更新する。
【0066】
zr=(1−ξ)zr-1+ξyr (6)
ここで、式中のξ(0≦ξ≦1)は履歴更新係数であり、ξ=1のときは現在の情報(長時間信号処理の結果)を重視して過去の履歴を殆ど参照しない重みとなり、一方、ξ=0のときは過去の履歴を重視するような重みとなる。なお、重みの決定には、時報情報やシーンチェンジなどを利用することができる。例えば、毎時丁度の時刻には番組カテゴリが変わることが多いため、過去の履歴を殆ど参照しないよう設定(ξ≒1)し、また例えば、番組カテゴリの変化は必ずシーンチェンジを伴うため、シーンチェンジが無い区間では、過去の履歴を重視(ξ≒0)する。これらの情報は、時報やシーンチェンジといった長時間信号処理の特徴量から得る。なお、更新後は、第rフレームで求めたベクトルを内部状態ベクトルzrとして履歴記憶部28に格納する。
【0067】
ストリーム処理では、以上のような操作により、数十秒程度の長時間信号処理ではカバーしきれない、異なるカテゴリの挿入やカテゴリ誤検出が頻発する問題にロバスト性をもたせることができる。
【0068】
最後に、ストリーム処理部6では、番組カテゴリ判別部29にて、いわゆる最大事後確率法(MAP法)に準じて、ベクトルzrの各要素の中で最大値を与えるものを選択し、現在時刻におけるカテゴリ分類結果として出力する。このストリーム処理部6からの出力が、本実施の形態の番組カテゴリ自動分類装置の出力端子7から出力されることになる。
【0069】
次に、上述した本発明実施の形態の番組カテゴリ自動分類装置は、例えば一般的なテレビジョン放送やケーブルテレビジョン放送、衛星放送、通信衛星放送、ラジオ放送などによる各種の放送番組の予約記録機能を備えた記録装置に適用可能である。
【0070】
図9には、例えばテレビジョン放送やラジオ放送の放送番組の予約記録機能を備えた記録装置の概略的な構成を示す。
【0071】
すなわち、この図9に示す記録装置は、上述した本発明実施の形態の番組カテゴリ自動分類装置の機能を追加することにより、実際に放送されている放送番組のカテゴリを自動的に分類し、その分類結果に基づいて、予約記録の予約記録開始時刻や予約記録終了時刻を自動的に延長等することにより、記録予約がなされている番組の放送開始時刻が予約した時刻よりも遅れたような場合に予約記録開始時刻を遅らせたり、記録予約がなされている番組の放送終了時刻が予約した時刻よりも遅れたような場合に予約記録終了時刻を延長させたりすることを可能とするものである。
【0072】
この図9において、チューナ部32は、アンテナ部31を介して受信したテレビ放送やラジオ放送から映像信号や音声信号を取り出し、それら映像信号や音声信号を録画・記録部34に送る。
【0073】
予約情報記憶部36には、予め使用者が設定した予約記録開始時刻、予約記録終了時刻、予約記録したい番組のチャンネルや周波数、例えば長時間記録モードや標準記録モードなどの記録モードなどの予約情報を記憶している。当該予約情報記憶部36に記憶されている予約情報は、例えば予約記録開始時刻になった時に録画・録音コントローラ35に送られる。
【0074】
録画・録音コントローラ35は、上記予約情報記憶部36から供給された予約情報に基づいて、チューナ部32による受信チャンネルや周波数を制御すると共に、録画・録音部34での録画・録音のオン/オフを制御する。これにより、当該記録装置による予約記録が成される。
【0075】
ここまでの構成及び動作は一般的な記録装置における予約記録のための構成及び動作と同じである。すなわち、一般的な記録装置での予約記録は、予約情報記憶部36に格納されている予約時間にのみ従って、録画・録音部34での録画・録音のオン/オフが制御される。
【0076】
これに対して、図9に示す本発明実施の形態の記録装置は、上述した番組カテゴリ自動分類装置としての機能を有する番組カテゴリ分類部33を備えている。当該番組カテゴリ分類部33には、上記チューナ部32から映像信号や音声信号が供給され、これら信号を用いて前述したように番組カテゴリの自動分類を行う。この番組カテゴリ分類部33にて例えば数十秒毎に識別された番組カテゴリの情報は録画・録音コントローラ35に送られる。
【0077】
このときの録画・録音コントローラ35は、番組カテゴリ分類部33からの番組カテゴリの情報と予約情報記憶部36からの予約情報とを比較し、予約情報として設定されている予約記録開始時刻や予約記録終了時刻を延長する必要があると判定した場合、録画・録音部34を制御して、予約記録開始時刻や予約記録終了時刻を延長させて録画・録音を行わせる。
【0078】
図10及び図11には、上記録画・録音コントローラ35が上記番組カテゴリ分類部33からの情報に応じて録画・録音部34を制御する動作のフローチャートを示す。
【0079】
図10には、現時点で未記録動作状態となっている時の録画・録音コントローラ35の動作フローチャートを示す。
【0080】
この図10において、未記録動作状態となっている時の録画・録音コントローラ35は、ステップS1の処理として、予約情報記憶部36に記憶されている予約情報と図示しない内蔵時計の時刻情報とに基づいて、予約記録の開始時刻になったか否かの判定を行っている。
【0081】
当該ステップS1において予約記録の開始時刻になっていないと判定した場合(No)は、このステップS1の判定処理を繰り返す。一方、ステップS1において予約記録の開始時刻になったと判定した場合(Yes)、録画・録音コントローラ35は、ステップS2の処理として、チューナ部32及び録画・録音部34を制御し、記録を開始させる。
【0082】
ステップS2での記録スタート後、録画・録音コントローラ35は、ステップS3の処理として、上記番組カテゴリ分類部33からの番組カテゴリの情報を用いて、例えば記録スタート前の数分以内に番組カテゴリの変化があったか否かの判定を行う。
【0083】
このステップS3での判定にて番組カテゴリに変化がないと判定した場合(No)、録画・録音コントローラ35は、ステップS5の処理に進み、記録予約されている番組の前の番組の放送時間が変更された可能性が有るとして、異常フラグを立てる。すなわちこの場合、記録予約されている前の番組の放送時間が延長されたことにより、予約記録開始時刻になっても前の番組が続いている可能性が高いため、録画・録音コントローラ35では、放送時間が変更された可能性が高いことを示す異常フラグを立てる。
【0084】
一方、ステップS3の判断にて番組カテゴリに変化があったと判定した場合(Yes)、録画・録音コントローラ35は、ステップS4の処理に進み、その予約記録は正常にスタートしたと判断する。すなわちこの場合、記録予約されている前の番組の放送時間が定時に終了したことによって番組カテゴリが変化し、記録予約されている番組が予約記録開始時刻に正常にスタートしたと考えられるため、録画・録音コントローラ35は、特に上記異常フラグを立てることはしない。
【0085】
これらステップS4とステップS5の処理後、録画・録音コントローラ35の処理は、図11に示す記録動作状態となっている時の動作フローチャートに移行する。
【0086】
この図11において、記録動作状態となっている時の録画・録音コントローラ35は、ステップS10の処理として、予約情報記憶部36に記憶されている予約情報と図示しない内蔵時計の時刻情報とに基づいて、予約記録の終了時刻になったか否かの判定を行っている。
【0087】
当該ステップS10の判定で予約記録の終了時刻になっていないと判定した場合(No)は、このステップS10の判定処理を繰り返す。一方、当該ステップS10の判定で予約記録の終了時刻になったと判定した場合(Yes)、録画・録音コントローラ35は、ステップS11の処理として、異常フラグが立っているか否かの判定を行う。
【0088】
このステップS11の判定で異常フラグが立っていないと判定した場合(No)、録画・録音コントローラ35は、ステップS12の処理として、上記番組カテゴリ分類部33からの番組カテゴリの情報を用いて、例えば予約記録終了前の数分以内に番組カテゴリの変化があったか否かの判定を行う。
【0089】
このステップS12の判断にて番組カテゴリに変化があったと判断した場合(Yes)、録画・録音コントローラ35は、ステップS13の処理に進み、その記録予約されている番組は正常に終了したと判断し、録画・録音部34を制御して記録を停止させる。すなわちこの場合、記録予約されている番組の放送時間が定時に終了したことによって番組カテゴリが変化し、当該記録予約されている番組を記録できたと考えられるため、録画・録音コントローラ35は、録画・録音部34を制御して記録を停止させた後、図10の未記録動作状態に戻る。
【0090】
一方、ステップS11の判定にて異常フラグが立っていると判定した場合(Yes)、録画・録音コントローラ35は、ステップS14の処理に進み、録画・録音部34を制御して、記録を継続させる(延長記録モードに移行させる)。すなわち、異常フラグが立っているということは、予約記録の開始時に前の番組の放送時間が延長されたことによって、予約している番組の放送開始時刻が遅れた可能性が高く、それに伴って予約記録している番組の放送終了時刻も遅れている可能性が高いため、録画・録音コントローラ35は、当該ステップS14にて記録を継続させるように録画・録音部34を制御する。
【0091】
また、ステップS12の判定にて予約記録終了前の数分以内に番組カテゴリの変化がないと判定した場合(No)にも、録画・録音コントローラ35は、ステップS14の処理に進み、録画・録音部34を制御して、記録を継続させる(延長記録モードに移行させる)。すなわち、予約記録終了前の数分以内に番組カテゴリの変化がないということは、予約記録している番組の放送終了時刻が遅れている可能性が高いため、録画・録音コントローラ35は、当該ステップS14にて記録を継続させるように録画・録音部34を制御する。
【0092】
上記ステップS14にて記録を継続することにした後、録画・録音コントローラ35は、ステップS15の処理として、上記番組カテゴリ分類部33からの番組カテゴリの情報を用いて、番組カテゴリに変化があったか否かの判定を行う。すなわち、例えば記録継続中の番組の放送が終了すると、番組カテゴリが変化することになるため、録画・録音コントローラ35は、当該ステップS15にて番組カテゴリの変化の有無を判定する。
【0093】
上記ステップS15にて番組カテゴリの変化がないと判定した場合(No)には当該ステップS15の判定処理を繰り返す。一方、上記ステップS15にて番組カテゴリの変化があったと判定した場合(Yes)、録画・録音コントローラ35は、ステップS16として、上記番組カテゴリ分類部33からの番組カテゴリの情報を用いて、その変化した後の番組カテゴリはCMを示しているか否かの判定を行う。すなわち、上記ステップS15にて記録継続中の番組のカテゴリが変化したと判定された場合であっても、そのカテゴリ変化はCMによるものである可能性があるため、録画・録音コントローラ35は、上記番組カテゴリの変化がCMによるものであるか否かを判定する。当該ステップS16にて番組カテゴリの変化がCMによるものであると判定された場合、すなわち番組カテゴリがCMであると判定した場合(Yes)、記録継続中の番組はさらに続く可能性があるため、録画・録音コントローラ35は、ステップS15の処理の戻る。
【0094】
一方、ステップS16にて番組カテゴリがCMでないと判定された場合(No)、録画・録音コントローラ35は、ステップS17の処理として、変化後の番組カテゴリと変化前の番組カテゴリとを比較し、番組カテゴリが異なっていれば、上記録画・録音部34を制御して上記記録継続中の番組の記録を停止する。すなわち、ステップS15にて番組カテゴリの変化があったと判定され、さらにステップS16にて当該変化後の番組カテゴリがCMでないと判定されたということは、上記記録継続中の番組の放送が終了したと考えられるため、録画・録音コントローラ35は、録画・録音部34の記録動作を停止させる。
【0095】
これにより、放送時間が延長されていた番組を最後まで記録できたことになる。録画・録音コントローラ35は、当該ステップS17にて録画・録音部34を制御して記録を停止させた後、図10の未記録動作状態に戻る。
【0096】
図12を用いて、実際の放送に対して図9の記録装置がどのように動作するかを説明する。
【0097】
この図12中の(a)は、放送予定の番組内容を時系列で示しており、この例では、21時00分以前には野球放送がなされ、野球放送が終了した後、CMを挟んで21時00分からドラマが始まり、さらにCMを挟んで22時00分からバラエティ番組が放送される。また、図12中の(b)は、記録予約する番組(予約記録開始から終了まで)を示しており、この例は、21時00分から予約記録を開始し、22時00分に予約記録を終了する例、すなわち、放送予定の番組のうち、ドラマを予約記録する例を挙げている。図12中の(c)は、実際の実際に放送された番組内容を示しており、この例では、放送予定の番組のうち、野球放送が例えば30分延長され、その延長に伴って後の各放送予定の番組の放送時刻が順次繰り下がった例を挙げている。
【0098】
図12中の(d)は、図9の記録装置の動作の内容を示している。この例の場合、記録装置は、図12中(b)の予約記録開始時刻から記録を始めるが、このとき、前の番組(野球)から番組カテゴリが変化していないため、異常フラグを立てる。また、このときの記録装置は、図12中(b)の予約記録終了時刻(終了予定時刻)になっても、異常フラグが立っているため、記録の継続を行う(延長記録モードとする)。次に、記録装置は、図12中(c)の実際の放送内容のうちドラマ放送後のCMの放送開始時点で番組カテゴリの変化を検出することになるが、この時点では記録を継続しており、その後上記ドラマ放送後のCMの放送終了時点(次のバラエティ放送開始時点)で番組カテゴリの変化を検出すると、記録を終了する。したがって、記録装置における実際の記録は、21時00分に開始し、野球放送の延長によってシフトしたドラマのCM後(バラエティ番組の開始時)に終了することになる。
【0099】
次に、上述した本発明実施の形態の番組カテゴリ自動分類装置は、図9に示した記録装置だけでなく、例えば各種の放送番組の各番組カテゴリ毎にその視聴の許可及び/又は不許可を登録し、その登録内容に応じて番組の視聴を自動的にフィルタリングする自動フィルタリング機能を持った装置(番組自動フィルタリング装置)にも適用可能である。
【0100】
図13には、本実施の形態の番組カテゴリ自動分類装置が適用された番組自動フィルタリング装置の概略的な構成を示す。
【0101】
すなわち、この図13に示す番組自動フィルタリング装置は、上述した本発明実施の形態の番組カテゴリ自動分類装置の機能を備えることにより、実際に放送されている放送番組のカテゴリを自動的に分類し、その分類結果に基づいて、予め登録しておいた番組カテゴリに対応する番組を検出し、その検出結果に基づいて、実際に放送されている番組の視聴の許可及び/又は不許可を判定し、その判定結果に応じて、テレビジョンモニタやスピーカ等の表示・放音装置に対する映像信号や音声信号の供給又は停止を制御する装置である。なお、この図13において、図9の構成と同一の構成要素にはそれぞれ図9と同じ指示符号を付して、それらの説明は省略する。
【0102】
この図9において、チューナ部32から出力された映像信号や音声信号は番組フィルタ部38に送られる。また、例えばテレビジョンモニタやスピーカ等からなる表示・放音装置41は、番組フィルタ部38から出力された映像信号に基づく映像を表示し、音声信号に基づく音声を放音する。
【0103】
登録情報記憶部40は、予め使用者が設定した番組カテゴリ毎の登録情報を記憶している。なお、当該登録情報記録部40に記憶させる登録情報としては、視聴したくない番組や視聴させたくない番組の番組カテゴリ(以下、視聴不許可番組カテゴリと呼ぶ)と、視聴したい番組や視聴させたい番組の番組カテゴリ(以下、視聴許可番組カテゴリと呼ぶ)が考えられる。また、登録情報記憶部40には、これら視聴不許可番組カテゴリと視聴許可番組カテゴリのそれぞれ一方のみ或いは両方を登録情報として記憶することができる。もちろん、登録情報記憶部40には何も登録情報を記憶させないことも可能である。当該登録情報記憶部40に記憶されている登録情報は、番組比較部39に送られる。
【0104】
番組比較部39は、現在受信中の番組の映像信号や音声信号から番組カテゴリ分類部33が分類した番組カテゴリの情報と、上記登録情報記憶部40から供給された登録情報とを比較し、その比較の結果から現在受信中の番組の視聴の許可及び/又は不許可を判定する。
【0105】
ここで、当該番組比較部39における番組視聴の許可/不許可の判定の方法には、以下の3つの方法例が考えられる。
【0106】
第1の判定方法例としては、登録情報記憶部40に視聴許可番組カテゴリのみの登録情報が記憶されている場合において、視聴許可番組カテゴリに合致した番組のみの視聴を許可する(視聴許可番組カテゴリに合致しない番組の視聴を許可しない)ような方法が考えられる。
【0107】
第2の判定方法例としては、登録情報記憶部40に視聴不許可番組カテゴリのみの登録情報が記憶されている場合において、視聴不許可番組カテゴリに合致した番組のみの視聴を許可しない(視聴不許可番組カテゴリに合致しない番組の視聴は許可する)ような方法が考えられる。
【0108】
第3の判定方法例としては、登録情報記憶部40に視聴許可番組カテゴリと視聴不許可番組カテゴリの両方の登録情報が記憶されている場合において、視聴不許可番組カテゴリに合致した番組の視聴を許可せず、視聴許可番組カテゴリに合致した番組の視聴を許可するような方法が考えられる。
【0109】
また、第3の判定方法例の場合、視聴不許可番組カテゴリにも視聴許可番組カテゴリにも属さないその他の番組について、視聴の許可/不許可を何れにするかによって、さらに以下の3つの対処例が考えられる。
【0110】
第1の対処例として上記その他の番組についてはそれ以前の判定結果をそのまま維持するような対処を行う場合と、第2の対処例として上記その他の番組については全て視聴を許可するような対処を行う場合と、第3の対処例として上記その他の番組については全て視聴を許可しないような対処を行う場合とが考えられる。
【0111】
上記番組比較部39は、上述したような各判定方法や対処例により、現在受信中の番組の視聴を許可すると判定した場合、番組フィルタ部38を制御して、後段の表示・放音装置41に対する当該番組の映像信号や音声信号の出力を開始させ、逆に、現在受信している番組の視聴を不許可にすると判定した場合、番組フィルタ部38を制御して、後段の表示・放音装置41に対する当該番組の映像信号や音声信号の出力を停止させる。
【0112】
これにより、この図13に示した番組自動フィルタリング装置によれば、予め登録した番組カテゴリに応じて、現在受信中の番組の視聴の許可/不許可を自動的に行うことが可能となる。
【0113】
図14〜図16には、上記番組比較部39が上記番組カテゴリ分類部33からの情報に応じて視聴の許可/不許可を判断し、番組フィルタ部38でのフィルタリングを制御する動作のフローチャートを示す。
【0114】
図14には、上記第1の判定方法例のように、登録情報記憶部40に視聴許可番組カテゴリのみの登録情報が記憶されている場合において、視聴許可番組カテゴリに合致した番組のみの視聴を許可する(視聴許可番組カテゴリに合致しない番組の視聴を許可しない)ような判定を、上記番組比較部39にて行うようにした場合のフローチャートを示す。
【0115】
この図14において、番組比較部39は、ステップS20の処理として、登録情報記憶部40に記憶されている登録情報と、番組カテゴリ分類部33からの番組カテゴリ情報とを比較し、次に、ステップS20の比較の結果に基づき、ステップS21において現在受信している番組のカテゴリが視聴許可番組カテゴリに合致しているか否かの判定を行う。
【0116】
当該ステップS21の判定において、現在受信中の番組のカテゴリが視聴許可番組カテゴリに合致していると判定した場合(Yes)、番組比較部39は、ステップS22の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されるように(視聴できるように)する。
【0117】
一方、ステップS21の判定において、現在受信中の番組のカテゴリが視聴許可番組カテゴリに合致していないと判定した場合(No)、番組比較部39は、ステップS23の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されないように(視聴できないように)する。
【0118】
これらステップS22、ステップS23の後、番組比較部39は、ステップS20の処理に戻り、番組カテゴリの比較を続ける。すなわち、番組比較部39は、表示・放音装置41に映像信号や音声信号が供給されているか否かにかかわらず、常にステップS20の処理として番組カテゴリの比較を行っている。
【0119】
図15には、上記第2の判定方法例のように、登録情報記憶部40に視聴不許可番組カテゴリのみの登録情報が記憶されている場合において、視聴不許可番組カテゴリに合致した番組のみの視聴を許可しない(視聴不許可番組カテゴリに合致しない番組の視聴は許可する)ような判定を、上記番組比較部39にて行うようにした場合のフローチャートを示す。
【0120】
この図15において、番組比較部39は、ステップS30の処理として、登録情報記憶部40に記憶されている登録情報と、番組カテゴリ分類部33からの番組カテゴリ情報とを比較し、次に、ステップS30の比較の結果に基づき、ステップS31において現在受信している番組のカテゴリが視聴不許可番組カテゴリに合致しているか否かの判定を行う。
【0121】
当該ステップS31の判定において、現在受信中の番組のカテゴリが視聴不許可番組カテゴリに合致していないと判定した場合(No)、番組比較部39は、ステップS32の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されるように(視聴できるように)する。
【0122】
一方、ステップS31の判定において、現在受信中の番組のカテゴリが視聴不許可番組カテゴリに合致していると判定した場合(Yes)、番組比較部39は、ステップS33の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されないように(視聴できないように)する。
【0123】
これらステップS32、ステップS33の後、番組比較部39は、ステップS30の処理に戻り、番組カテゴリの比較を続ける。すなわち、番組比較部39は、表示・放音装置41に映像信号や音声信号が供給されているか否かにかかわらず、常にステップS30の処理として番組カテゴリの比較を行っている。
【0124】
図16には、上記第3の判定方法例のように、登録情報記憶部40に視聴許可番組カテゴリと視聴不許可番組カテゴリの両方の登録情報が記憶されている場合において、視聴不許可番組カテゴリに合致した番組の視聴を許可せず、視聴許可番組カテゴリに合致した番組の視聴を許可するような判定を、上記番組比較部39にて行うようにした場合のフローチャートを示す。
【0125】
この図16において、番組比較部39は、ステップS40の処理として、登録情報記憶部40に記憶されている登録情報と、番組カテゴリ分類部33からの番組カテゴリ情報とを比較し、次に、ステップS40の比較の結果に基づき、ステップS41において現在受信している番組のカテゴリが視聴許可番組カテゴリであるのか、又は視聴不許可番組カテゴリであるのか、又はそれらの何れでもないその他の番組カテゴリであるのかの判定を行う。
【0126】
当該ステップS41の判定において、現在受信中の番組のカテゴリが視聴許可番組カテゴリであると判定した場合(許可)、番組比較部39は、ステップS42の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されるように(視聴できるように)する。
【0127】
一方、ステップS41の判定において、現在受信中の番組のカテゴリが視聴不許可番組カテゴリであると判定した場合(不許可)、番組比較部39は、ステップS43の処理として、番組フィルタ部38を制御してチューナ部32が現在受信して出力している映像信号や音声信号が表示・放音装置41に供給されないように(視聴できないように)する。
【0128】
さらに、ステップS41の判定において、現在受信中の番組のカテゴリが視聴許可番組カテゴリでも視聴不許可番組カテゴリでもないその他の番組カテゴリであると判定した場合(登録なし)、番組比較部39は、ステップS44の処理として、前述の第1の対処例のように当該その他の番組についてそれ以前の判定結果をそのまま維持するような対処、又は、第2の対処例のように当該その他の番組については全て視聴を許可する(現在受信している映像信号や音声信号を表示・放音装置41に供給する)ような対処、又は、第3の対処例のように当該その他の番組については全て視聴を許可しない(現在受信している映像信号や音声信号を表示・放音装置41に供給しない)ような対処の、何れかの対処例を実施する。
【0129】
これらステップS42、ステップS43、ステップS44の後、番組比較部39は、ステップS40の処理に戻り、番組カテゴリの比較を続ける。すなわち、番組比較部39は、表示・放音装置41に映像信号や音声信号が供給されているか否かにかかわらず、常にステップS40の処理として番組カテゴリの比較を行っている。
【0130】
次に、上述した本発明実施の形態の番組カテゴリ自動分類装置は、図9や図13に示した装置だけでなく、例えば各種の放送番組の各番組カテゴリ毎に各放送番組を編集しながら記録する機能を持った装置(自動番組編集装置)にも適用可能である。
【0131】
図17には、本実施の形態の番組カテゴリ自動分類装置が適用された自動番組編集装置の概略的な構成を示す。
【0132】
すなわち、この図17に示す自動番組編集装置は、上述した本発明実施の形態の番組カテゴリ自動分類装置の機能を備えることにより、実際に放送されている放送番組のカテゴリを自動的に分類し、その分類結果に基づいて、予め登録しておいた番組カテゴリに対応する番組を検出し、その検出結果に基づいて、実際に放送されている番組を自動的に編集して記録する装置である。なお、この図17において、図9の構成と同一の構成要素にはそれぞれ図9と同じ指示符号を付して、それらの説明は省略する。
【0133】
この図17において、編集情報記憶部45は、予め使用者が設定した編集に必要な番組カテゴリや不要な番組カテゴリ、編集順序(例えば優先度や重要度)が編集情報として記憶されている。すなわち、編集情報記憶部45には、編集情報として例えば図18に示すような、ニュース、CM、ドラマのような番組カテゴリと、それら番組カテゴリ毎の優先度が記憶されている。なお、図18の例では、ニュースの優先度が最も高く(優先度1)、ドラマの優先度が次に高く(優先度2)設定されている。CMについては優先度は不要であるため設定されていない。当該編集情報記憶部45に記憶されている編集情報は、編集情報判断部44に送られる。
【0134】
ここで、当該自動番組編集装置が受信モードになっているとき、チューナ部32が現在受信して出力している映像信号や音声信号は、例えばハードデイスク、又は磁気テープ、光磁気ディスク、ディジタルビデオディスク等で構成された一時記憶部42に一時的に記録される。
【0135】
また同時に、当該一時記憶部42には、現在受信中の番組の映像信号や音声信号から番組カテゴリ分類部33が分類した番組カテゴリの情報が一時的に記憶される。さらに、上記番組カテゴリ分類部33からの番組カテゴリの情報は、編集情報判断部44にも送られる。
【0136】
また同時に、編集情報判断部44は、上記番組カテゴリ分類部33から供給された番組カテゴリの情報と、上記編集情報記憶部45に記憶されている編集情報とを比較し、上記番組カテゴリ毎に上記編集情報の優先度に応じた編集ラベルを付与する。当該番組カテゴリ毎の編集ラベルは、上記一時記憶部42に一時的に記憶される。
【0137】
このように、一時記憶部42には、現在受信中の映像信号や音声信号と、それら映像信号や音声信号からなる放送番組の番組カテゴリの情報と、各番組カテゴリ毎の編集ラベルとが、時間同期して一時的に保存されることになる。
【0138】
次に、上記放送番組の受信し、一時記憶部42に上記映像信号や音声信号と番組カテゴリと編集ラベルを時間同期させた一時記録を終了した後、当該自動番組編集装置を編集モードに移行させる。
【0139】
編集モードに移行すると、再生制御部43は、一時記憶部42に一時記録された編集ラベルの優先度に従って、当該優先度の高い編集ラベルが付加された番組の映像信号や音声信号から順に再生するように、上記一時記憶部42を制御する。なお、優先度が同一順序(同じ値)のものについては、放送時間順に再生する。
【0140】
上記再生制御部43による編集再生制御に応じて上記一時記憶部42から再生された番組の映像信号や音声信号は、録画・録音部46に記録されることになる。すなわち、図17の自動番組編集装置によれば、上述したように予め設定しておいた編集情報に応じて自動的に編集された番組が、録画・録音部46に記録されることになる。
【0141】
以下、図19を用いて、上記自動番組編集装置での具体的な動作例を説明する。
【0142】
図7の(a)は一時記憶部42に一時記録された各番組を示しており、それら各番組の順番は実際に放送された放送順序となっている。この例では、図の左から順に、CM、ニュースN1、CM、ドラマD1、CM、ドラマD2、CM、ニュースN2、CM、ドラマD3、CM、ドラマD4、CM、ニュースN3、・・・の放送順序の各番組が、一時記憶部42に記録されている。
【0143】
図7の(b)はCMを除く上記各番組に付加された編集ラベルを示しており、この例では、図の左から順にニュースN1には優先度が1番であることを示す編集ラベルL1、ドラマD1には優先度が2番であることを示す編集ラベルL2、以下同様に、ドラマD2には編集レベルL2、ニュースN2には編集ラベルL1、ドラマD3には編集ラベルL2、ドラマD4には編集ラベルL2、ニュースN3には編集ラベルL1、・・・がそれぞれ付加されている。
【0144】
図7の(c)には、上記再生制御部43が、各番組に付加されている編集ラベルに応じた編集順序で、上記一時記憶部42に記録されている各番組を再生させて録画・録音部46に記録させた、編集後の各番組の順序を示している。ここで図7の(c)から判るように、ニュースN1,N2,N3にはそれぞれ優先度が1番であることを示す編集ラベルL1が付加され、ドラマD1,D2,D3,D4にはそれぞれ優先度が2番であることを示す編集ラベルL2が付加されているため、各ニュースN1,N2,N3が各ドラマD1,D2,D3,D4よりも前に配置され、また、それぞれ同じ値の編集ラベルが付加されている各ニュースと各ドラマについては放送時間順に配置される。したがって、この図7の(c)の例の場合、編集後に得られる各番組の順序は、ニュースN1、ニュースN2、ニュースN2、ドラマD1、ドラマD2、ドラマD3、ドラマD4、・・・の順序となる。
【0145】
図20には、上記再生制御部43による編集ラベルに応じた編集処理動作のフローチャートを示す。
【0146】
この図20において、編集開始時、再生制御部43は、先ずステップS50の初期化処理として、編集の優先順位の値nを1とする。
【0147】
次に、再生制御部43は、ステップS51の処理として、一時記憶部42より編集ラベルを取得した後、ステップS52の処理として上記優先順位の値nと比較する。
【0148】
ステップS52において、編集ラベルの値が優先順位の値nと一致していないと判定した場合(No)、再生制御部43は、ステップS58の処理として、同一の編集ラベルが振られている区間(番組)を早送り(スキップ)した後、ステップS51の処理の戻り、再び一時記憶部42より編集ラベルを取得する。
【0149】
一方、ステップS52において、編集ラベルの値が優先順位の値nと一致している場合(Yes)、再生制御部43は、ステップS53の処理として再生を開始する(一時記憶部42からの映像信号や音声信号の読み出しを開始する)。
【0150】
再生制御部43は、当該再生中はステップS54の処理として、常時、番組の編集ラベルの値を確認し、編集レベルの値が優先順位の値nと一致している間(Yes)は再生を継続する。
【0151】
これに対し、ステップS54にて編集レベルの値と優先順位の値nとが異なった場合(No)、再生制御部43は、一時記憶部42に記録されている番組の映像信号や音声信号の再生が全て終了したかどうかを確認する。このステップS54の確認処理において終了していないと判定された場合(No)、再生制御部43は、ステップS58の処理として上記早送り(スキップ)する。
【0152】
ステップS54の確認処理において終了したと判定した場合(Yes)、再生制御部43は、ステップS56の処理として、優先順位の値nを1増やし(1インクリメント)、次の優先順位のものの処理を行う。
【0153】
ここで、再生制御部43は、ステップS57の処理として、優先順位の値nが、指定されている優先度のうち最も低いもの(Nl)を越えているか否かの判定を行い、越えていないと判定した場合(No)、すなわち次の優先度の編集ラベルが付加されたものの編集が指定されている場合、ステップS59の処理として、一時記憶部42の再生位置を記録部分の最初に戻し、ステップS51に戻って上述同様の操作を繰り返す。また、再生制御部43は、ステップS57の判定処理において、優先順位の値nが、上記最も優先度の低い値(Nl)を越えていると判定された場合(Yes)、編集処理を終了する。
【0154】
以上説明したように、本発明実施の形態の番組カテゴリ自動分類装置によれば、異なる時間スケールに対する階層的な処理構造を持ち、僅かな(1分以内程度)の時間内に、例えばテレビジョン放送やラジオ放送の番組カテゴリ、またはその変化を自動的に識別することができ、また、中間レベルでの音源カテゴリや番組カテゴリの表現に確率的な表現を導入することで、多くのカテゴリを取り扱うことが可能となっている。
【0155】
したがって、本実施の形態の番組カテゴリ自動分類装置を、例えば予約記録機能を備えた記録装置に適用すれは、予約記録時間を自動的に修正したり自動的に延長する予約記録時間自動修正・延長装置を実現することが可能となる。
【0156】
また、本実施の形態の番組カテゴリ自動分類装置を、例えば放送番組のフィルタリングを行うフィルタリング装置に適用すれば、番組の視聴を自動的に許可及び/又は不許可にする番組自動フィルタリング装置を実現することが可能となり、例えばCMを自動的にスキップすることも可能となる。
【0157】
さらに、本実施の形態の番組カテゴリ自動分類装置を、例えば番組編集装置に適用すれば、放送番組の重要度に応じた自動編集が可能な自動番組編集装置を実現することが可能となる。
【0158】
なお、本発明実施の形態では、一般的なテレビジョン放送やケーブルテレビジョン放送、衛星放送、通信放送、ラジオ放送などにより放送される各種の放送番組の番組カテゴリを分類する例を挙げたが、本発明は放送番組に限らず、例えば記録メディアに記録されている番組のカテゴリを自動分類するような用途にも適用可能である。
【0159】
【発明の効果】
以上の説明で明らかなように、本発明の信号処理装置及び方法においては、信号を階層的な複数の異なる時間区間にてフレーム化し、各階層のフレーム内の信号をそれぞれ各階層毎に処理し、処理の結果に基づいて信号のカテゴリを判定することにより、例えば、各種の放送番組の内容やカテゴリを正確且つ確実に分類して識別でき、これによって、例えば、記録装置における予約記録を制御可能であり、予約記録の失敗を無くすことを可能にするだけでなく、さらに、記録する番組の自動フィルタリングや、CMの自動スキップ、番組の自動編集等も可能となる。
【図面の簡単な説明】
【図1】本発明の信号処理装置及び方法が適用される一実施の形態としての番組カテゴリ自動分類装置の概略構成例を示すブロック回路図である。
【図2】本実施の形態の番組カテゴリ自動分類装置の各処理部における処理の時間関係の説明に用いる図である。
【図3】本実施の形態の番組カテゴリ自動分類装置の短時間信号処理部における処理と各特徴量と次元との対応表を示す図である。
【図4】本実施の形態の番組カテゴリ自動分類装置の中時間信号処理部から出力される分類ベクトルの要素の種類とベクトル要素との対応表を示す図である。
【図5】本実施の形態の番組カテゴリ自動分類装置の長時間信号処理部の特徴抽出部における特徴量と処理法の対応表を示す図である。
【図6】本実施の形態の番組カテゴリ自動分類装置の長時間信号処理部のルールテーブル部に用意されているルールテーブルの例を示す図である。
【図7】本実施の形態の番組カテゴリ自動分類装置の長時間信号処理部での具体的な動作例(2フレームのうち前のフレーム部分)の説明に用いる図である。
【図8】本実施の形態の番組カテゴリ自動分類装置の長時間信号処理部での具体的な動作例(2フレームのうち後のフレーム部分)の説明に用いる図である。
【図9】本実施の形態の番組カテゴリ自動分類装置が適用された、放送番組の予約記録機能を備えた記録装置の概略的な構成を示すブロック回路図である。
【図10】本実施の形態の番組カテゴリ自動分類装置が適用された記録装置の録画・録音コントローラにおける未記録動作状態時の動作フローチャートである。
【図11】本実施の形態の番組カテゴリ自動分類装置が適用された記録装置の録画・録音コントローラにおける記録動作状態時の動作フローチャートである。
【図12】本実施の形態の番組カテゴリ自動分類装置が適用された記録装置の実際の動作説明に用いる図である。
【図13】本実施の形態の番組カテゴリ自動分類装置が適用された番組自動フィルタリング装置の概略的な構成を示すブロック回路図である。
【図14】本実施の形態の番組カテゴリ自動分類装置が適用された番組自動フィルタリング装置において、視聴許可番組カテゴリの番組の視聴を許可する制御を行う際の動作フローチャートである。
【図15】本実施の形態の番組カテゴリ自動分類装置が適用された番組自動フィルタリング装置において、視聴不許可番組カテゴリの番組の視聴を不許可とする制御を行う際の動作フローチャートである。
【図16】本実施の形態の番組カテゴリ自動分類装置が適用された番組自動フィルタリング装置において、視聴不許可番組カテゴリの番組の視聴を許可せず、視聴許可番組カテゴリの番組の視聴を許可する制御を行う際の動作フローチャートである。
【図17】本実施の形態の番組カテゴリ自動分類装置が適用された自動番組編集装置の概略的な構成を示すブロック回路図である。
【図18】本実施の形態の番組カテゴリ自動分類装置が適用された自動番組編集装置の編集情報記憶部に記憶された編集情報の一例を示す図である。
【図19】本実施の形態の番組カテゴリ自動分類装置が適用された自動番組編集装置の具体的な動作例の説明に用いる図である。
【図20】本実施の形態の番組カテゴリ自動分類装置が適用された自動番組編集装置の再生制御部による再生編集制御の動作フローチャートである。
Claims (8)
- 入力信号中の映像信号及び/又は音声信号から短時間フレーム毎に複数の少なくとも上記音声信号の調波構造度を含む特徴ベクトルを生成する特徴ベクトル生成部と、
上記複数の特徴ベクトルから中時間フレーム毎に複数の少なくとも音源カテゴリ確率を含む分類ベクトルを生成する分類ベクトル生成部と、
上記複数の分類ベクトルから長時間フレーム毎に、一つまたは複数のカテゴリ分類ベクトルを生成するカテゴリ分類生成部と、
カテゴリ分類ベクトルに基づいて、カテゴリを判別するカテゴリ判別部とを有する
信号処理装置。 - 上記カテゴリ判別手段は、上記カテゴリ分類ベクトルの処理の結果に応じた確率を用いて上記カテゴリの判別を行う
請求項1記載の信号処理装置。 - 上記カテゴリの判別結果に基づいて、所望の機器を制御する制御手段を備える
請求項1記載の信号処理装置。 - 上記制御手段は、予約記録機能を備えた機器の予約記録時間を制御する
請求項3記載の信号処理装置。 - 上記制御手段は、上記映像信号及び/又は音声信号をフィルタリングする機能を備えた機器での上記フィルタリング動作を制御する
請求項3記載の信号処理装置。 - 上記制御手段は、上記映像信号及び/又は音声信号の編集機能を備えた機器での上記編集動作を制御する
請求項3記載の信号処理装置。 - 上記映像信号及び/又は音声信号の編集機能を備えた機器は上記上記映像信号及び/又は音声信号を一時記憶する一時記憶手段を有し、
上記制御手段は、上記一時記憶手段に一時記憶された上記映像信号及び/又は音声信号を、編集の重要度に応じて読み出させて上記編集動作を制御する
請求項6記載の信号処理装置。 - 入力信号中の映像信号及び/又は音声信号から短時間フレーム毎に複数の少なくとも上記音声信号の調波構造度を含む特徴ベクトルを生成する特徴ベクトル生成工程と、
上記複数の特徴ベクトルから中時間フレーム毎に複数の少なくとも音源カテゴリ確率を含む分類ベクトルを生成する分類ベクトル生成工程と、
上記複数の分類ベクトルから長時間フレーム毎に一つまたは複数のカテゴリ分類ベクトルを生成するカテゴリ分類生成工程と、
カテゴリ分類ベクトルに基づいて、カテゴリを判別するカテゴリ判別工程とを有する
信号処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19069399A JP4253934B2 (ja) | 1999-07-05 | 1999-07-05 | 信号処理装置及び方法 |
EP00114427A EP1067788A2 (en) | 1999-07-05 | 2000-07-05 | Device and method of signal processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19069399A JP4253934B2 (ja) | 1999-07-05 | 1999-07-05 | 信号処理装置及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001024980A JP2001024980A (ja) | 2001-01-26 |
JP2001024980A5 JP2001024980A5 (ja) | 2006-04-13 |
JP4253934B2 true JP4253934B2 (ja) | 2009-04-15 |
Family
ID=16262300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19069399A Expired - Lifetime JP4253934B2 (ja) | 1999-07-05 | 1999-07-05 | 信号処理装置及び方法 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP1067788A2 (ja) |
JP (1) | JP4253934B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4218185B2 (ja) * | 2000-05-23 | 2009-02-04 | ソニー株式会社 | 番組録画・再生システム及び番組録画・再生方法、並びに番組録画・再生装置 |
JP4003000B2 (ja) * | 2001-07-19 | 2007-11-07 | 日本ビクター株式会社 | 映像信号の記録再生方法、映像信号記録再生装置、及び映像信号記録再生用プログラム |
DE60204827T2 (de) | 2001-08-08 | 2006-04-27 | Nippon Telegraph And Telephone Corp. | Anhebungsdetektion zur automatischen Sprachzusammenfassung |
JP2003110988A (ja) * | 2001-09-27 | 2003-04-11 | Sony Corp | デジタル放送受信機及びバックアップ方法 |
US20030081834A1 (en) * | 2001-10-31 | 2003-05-01 | Vasanth Philomin | Intelligent TV room |
US7600246B2 (en) | 2002-04-17 | 2009-10-06 | Microsoft Corporation | Method and apparatus for analyzing program data |
JP4759281B2 (ja) * | 2005-02-09 | 2011-08-31 | パイオニア株式会社 | 情報処理装置、情報処理方法、情報処理プログラム、および、情報処理プログラムを記録した記録媒体 |
KR20080014872A (ko) * | 2005-05-19 | 2008-02-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 콘텐트 아이템 바운더리들을 검출하기 위한 방법 및 장치 |
KR100744515B1 (ko) * | 2005-07-19 | 2007-08-01 | 엘지전자 주식회사 | 녹화 파일 자동 분류 기능을 구비한 영상기기 및 그제어방법 |
JP2007135058A (ja) * | 2005-11-11 | 2007-05-31 | Nippon Hoso Kyokai <Nhk> | コンテンツ提示制御装置及びそのプログラム、並びに、放送用コンテンツ配信装置 |
JP2008006218A (ja) * | 2006-06-30 | 2008-01-17 | Konami Digital Entertainment:Kk | 音楽ゲーム機 |
JP4849339B2 (ja) | 2007-03-30 | 2012-01-11 | ソニー株式会社 | 情報処理装置および方法 |
JP4895125B2 (ja) * | 2007-07-26 | 2012-03-14 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP4433027B2 (ja) | 2007-09-21 | 2010-03-17 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
-
1999
- 1999-07-05 JP JP19069399A patent/JP4253934B2/ja not_active Expired - Lifetime
-
2000
- 2000-07-05 EP EP00114427A patent/EP1067788A2/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2001024980A (ja) | 2001-01-26 |
EP1067788A2 (en) | 2001-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100903160B1 (ko) | 신호처리장치 및 방법 | |
JP4253934B2 (ja) | 信号処理装置及び方法 | |
US8165306B2 (en) | Information retrieving method, information retrieving device, information storing method and information storage device | |
JP2005173569A (ja) | オーディオ信号の分類装置及び方法 | |
US8086168B2 (en) | Device and method for monitoring, rating and/or tuning to an audio content channel | |
DE60217444T2 (de) | Sprachgesteuertes elektronisches Gerät | |
KR100472904B1 (ko) | 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법 | |
JP4491700B2 (ja) | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 | |
EP1531626B1 (en) | Automatic summarisation for a television programme suggestion engine based on consumer preferences | |
US20030167174A1 (en) | Automatic audio recorder-player and operating method therefor | |
JP4332988B2 (ja) | 信号処理装置及び方法 | |
KR20060027826A (ko) | 비디오 처리장치, 비디오 처리장치용 집적회로, 비디오처리방법, 및 비디오 처리 프로그램 | |
WO2000040011A1 (fr) | Procede et dispositif permettant d'editer des informations video | |
US20070248327A1 (en) | Systems and methods for detecting exciting scenes in sports video | |
WO2007132569A1 (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
US20060224616A1 (en) | Information processing device and method thereof | |
US8234278B2 (en) | Information processing device, information processing method, and program therefor | |
JP2003032631A (ja) | 信号処理装置及び方法、記録媒体、並びにプログラム | |
JP3803302B2 (ja) | 映像要約装置 | |
JP2004363749A (ja) | コンテンツ記録システムおよび方法、記録装置および方法、プログラム、並びに記録媒体 | |
JP2003255981A (ja) | 要約情報提供方法、要約情報提供装置、要約情報提供プログラム | |
CN116866782A (zh) | 一种车载蓝牙智能调节系统 | |
JP2003255983A (ja) | コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム | |
JP2001313960A (ja) | 信号処理装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060223 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080804 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080909 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081110 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4253934 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |